版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
任务七实训:MapReduce编程一、实验目的1.1掌握MapReduce的编程方法二、实验内容2.1在idea中新建一个Maven工程2.2在pom文件中添加依赖添加依赖<dependency><groupId>org.apache.hadoop</groupId><artifactId>hadoop-client</artifactId><version>2.9.2</version></dependency>2.3新建一个class命名为WordCount,importorg.apache.hadoop.conf.Configuration;
importorg.apache.hadoop.fs.Path;
importorg.apache.hadoop.io.IntWritable;
importorg.apache.hadoop.io.Text;
importorg.apache.hadoop.mapreduce.Job;
importorg.apache.hadoop.mapreduce.Mapper;
importorg.apache.hadoop.mapreduce.Reducer;
importorg.apache.hadoop.mapreduce.lib.input.FileInputFormat;
importorg.apache.hadoop.mapreduce.lib.input.TextInputFormat;
importorg.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
importorg.apache.hadoop.mapreduce.lib.output.TextOutputFormat;
importjava.io.IOException;
importjava.util.StringTokenizer;publicclassWordCount{
publicstaticclassMyMapperextendsMapper<Object,Text,Text,IntWritable>{
privateTextword=newText();
privatefinalstaticIntWritableone=newIntWritable(1);
@Override
protectedvoidmap(Objectkey,Textvalue,Contextcontext)throwsIOException,InterruptedException{
StringTokenizeritr=newStringTokenizer(value.toString());
while(itr.hasMoreTokens()){
word.set(itr.nextToken());
context.write(word,one);
}
}
}
publicstaticclassMyReducerextendsReducer<Text,IntWritable,Text,IntWritable>{
privateIntWritableresult=newIntWritable();
@Override
protectedvoidreduce(Textkey,Iterable<IntWritable>values,Contextcontext)throwsIOException,InterruptedException{
intsum=0;
for(IntWritableval:values){
sum+=val.get();
}
result.set(sum);
context.write(key,result);
}
}
publicstaticvoidmain(String[]args)throwsIOException,InterruptedException,ClassNotFoundException{
Configurationconf=newConfiguration();
Jobjob=Job.getInstance(conf);
job.setJarByClass(WordCount.class);
job.setJobName("WordCount");
job.setInputFormatClass(TextInputFormat.class);
job.setOutputFormatClass(TextOutputFormat.class);
FileInputFormat.addInputPath(job,newPath(args[0]));
FileOutputFormat.setOutputPath(job,newPath(args[1]));
job.setMapperClass(MyMapper.class);
job.setReducerClass(MyReducer.class);
job.setMapOutputKeyClass(Text.class);
job.setMapOutputValueClass(IntWritable.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(IntWritable.class);
job.waitForCompletion(true);
}
}2.4.配置hadoop环境变量Windows本地解压Hadoop压缩包,然后像配置JDK环境变量一样在系统环境变量里配置HADOOP_HOME和path:%HADOOP_HOME\bin%环境变量。注意:hadoop安装目录尽量不要包含空格或者中文字符。2.5.下载hadoop对应版本补丁MapReduce程序在Linux、mac系统中可以直接运行,但无法直接在Windows下运行,因为MapReduce代码在Windows下运行存在bug,需要添加hadoop补丁才可以。Hadoop补丁下载地址:/cdarlint/winutilsHadoop补丁文件为hadoop.dll和winutils.exe。2.6补丁添加hadoop安装目录hadoop补丁文件下载之后,解压,然后将相应版本中的hadoop.dll和winutils.exe补丁文件,拷贝到{HADOOP_HOME}/bin目录下(可能需要重启IDEA)2.6补丁添加windowsc盘目录如果1.3步骤操作完之后,还无法运行MapReduce程序,则需要将hadoop.dll和winutils.exe补丁文件,拷贝
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公开招聘九龙湖街道综合行政执法队协管员笔试参考题库及答案解析
- 2026江苏镇江市卫生健康委员会所属镇江市第四人民医院招聘高层次紧缺人才6人考试参考题库及答案解析
- 2026辽宁朝阳市高新技术产业开发区消防救援大队社会招录政府专职消防队员14人考试模拟试题及答案解析
- 2026广西玉林容县消防救援局招聘文员1人笔试参考题库及答案解析
- 2026广州南沙人力资源发展有限公司招聘内勤工作人员1人笔试参考题库及答案详解
- 赣州市财政局2026年面向社会公开招聘数字化项目预算评审人员笔试备考题库及答案解析
- 2026年成都市市场监督管理系统事业单位人员招聘考试备考试题及答案详解
- 2026四川德阳第五医院人才招聘9人笔试备考题库及答案解析
- 2026 增肌期海苔课件
- 2049职业规划展望
- 2026年北京市海淀区高三下学期二模化学试卷和答案
- 2026年中国邮政储蓄银行招聘真题
- 中华民族共同体概论 课件 第7、8讲 华夷一体与中华民族空前繁盛(隋唐五代时期)、共奉中国与中华民族内聚发展(辽宋夏金时期)
- 2026届陕西西工大附中高三下学期第十一次适应性训练英语试题含答案
- 曲面铝单板三维放样及安装施工作业指导书
- 北京市燕山区2026年中考一模英语试题(含答案)
- 2026年执业医师考试综合考试题库试题附答案完整版
- 2025年东莞市网格员笔试试题及答案
- 2026年及未来5年市场数据中国消防火灾报警系统行业市场竞争格局及投资前景展望报告
- 2026年郴州职业技术学院教师招聘考试备考题库及答案解析
- 2026年中考历史全真模拟试卷及答案(共四套)
评论
0/150
提交评论