educoder平台MapReduce基础实战_第1页
educoder平台MapReduce基础实战_第2页
educoder平台MapReduce基础实战_第3页
educoder平台MapReduce基础实战_第4页
全文预览已结束

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

educoder平台MapReduce基础实战educoder平台MapReduce基础实战educoder平台MapReduce基础实战V:1.0精细整理,仅供参考educoder平台MapReduce基础实战日期:20xx年X月MapReduce第1关:成绩统计过关代码:importimportclassWordCount{ /**********Begin**********/ publicstaticclassTokenizerMapperextendsMapper<LongWritable,Text,Text,IntWritable>{privatefinalstaticIntWritableone=newIntWritable(1);privateTextword=newText();privateintmaxValue=0;publicvoidmap(LongWritablekey,Textvalue,Contextcontext)throwsIOException,InterruptedException{StringTokenizeritr=newStringTokenizer(),"\n");while()){String[]str=().split("");Stringname=str[0];(str[1]));(name);(word,one);};importclassMerge{/***@paramargs*对A,B两个文件进行合并,并剔除其中重复的内容,得到一个新的输出文件C*/ontextcontext)throwsIOException,InterruptedException{Stringstr=();String[]data=("");Textt1=newText(data[0]);Textt2=newText(data[1]);(t1,t2);}}/**********End**********/ontextcontext)throwsIOException,InterruptedException{List<String>list=newArrayList<>();for(Texttext:values){Stringstr=();if(!(str)){(str);}}(list);for(Stringtext:list){(key,newText(text));}}/**********End**********/}publicstaticvoidmain(String[]args)throwsException{Configurationconf=newConfiguration();Jobjob=newJob(conf,"wordcount");;;;;;;StringinputPath="/user/tmp/input/";;importclasssimple_data_mining{publicstaticinttime=0;/***@paramargs*输入一个child-parent的表格*输出一个体现grandchild-grandparent关系的表格*/oString();intlen=();inti=2;if(len==0)continue;charrelation_type=(0);Stringchild_name=newString();Stringparent_name=newString();//获取value-list中value的childwhile(i)!='+'){child_name=child_name+(i);i++;}i=i+1;//获取value-list中value的parentwhile(i<len){parent_name=parent_name+(i);i++;}//左表,取出child放入grand_childif(relation_type=='1'){grand_child[grand_child_num]=child_name;grand_child_num++;}else{//右表,取出parent放入grand_parentgrand_parent[grand_parent_num]=parent_name;grand_parent_num++;}}if(grand_parent_num!=0&&grand_child_num!=0){for(intm=0;m<grand_child_num;m++){for(intn=0;n<grand_parent_num;n++){(newText(grand_child[m]),newText(grand_parent[n]));//输出结果}}}/**********End**********/}}publicstaticvoidmain(String[]args)throwsException{//TODOAuto-generatedmethodstubConfigurationconf=newConfiguration();Jobjob=(conf,"Singletablejoin");;;;;;StringinputPath=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论