下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、广州大学华软软件学院South china Institute nf Software tnginEBring.CU实验报告封面课程名称:Hadoop大数据处理课程代码:JY1124任课老师:陈宁穗实验指导老师:陈宁穗实验报告名称:实验9 Pig开发应用学生姓名:学号:教学班:递交日期:签收人:我申明,本报告内的实验已按要求完成,报告完全是由我个人完成,并没有抄袭行为。我已经保存了这份实验报告的副本。申明人(签名):实验报告评语与评分:评阅老师签名:一、实验名称:Pig开发应用二、实验日期:2015年 月 日三、实验目的:熟悉Pig开发应用。四、实验用的仪器和材料:硬件:PC电脑一台;配置:内
2、存,4G及以上 硬盘250G及以上软件环境:操作系统 XP, vmware, ubuntu, jdk, hadoop五、实验的步骤和方法:请用命令完成以下操作一、Pig的安装与配置。1、下载并解压安装pig-0. 12. 1. tar. gz (最好用与安装hadoop的同一用户),且改名为 pigotar -xzvf pig-0. 12. 1. tar. gzmv pig-0. 12. 1 pig2、设置环境变量配置grid目录下的.profile文件(.profile文件为隐藏文件,用Is -a查看),配置如下 图:xport JAVA_HOME=/usrxport PATH=$PATH:
3、/home/grid/hadoop-1.2.1/bin:/home/grid/pig/bin:$H0ME/bin3、重启ubuntu,使配置生效。4、启动hadoop,进入pig目录,输入pig命令,假设进入grunt提示,说明pig安装成功。二、pig操作1、本地输入数据通过 gedit 命令添加 pigtest.txt 文件,/home/grid/input/pigtest.txt 数据如下:James,Network,Tiger, 100James,Database,Tiger,99James,PDE,Yao,95Vincent,Network,Tiger,95Vincent,PDE,Y
4、ao,98NocWeizPDE,Yao,1002、HDFS上创立文件,并且将上述数据文件上传到HDFS上。grunt mkdir ingrunt mkdir outgrunt Ishdfs:/db69:9000/user/grid/in :9000/user/grid/out #拷贝本地的pigtest. txt文件到hdfs的in目录下gruntcopyFromLocal /home/grid/pigtest. txt in gruntIs inhdfs:/db69:9000/user/hadoop/in/pigtest. txt 71186274、从HDFS上导入数据,将,in/pigte
5、st. txt 文件的内容以逗号分隔赋给Agrunt A =LOAD J in/pigtest.txt USING PigStorage ) AS(student:chararray, course:chararray, teacher:chararray, score:int);5、只取学生和老师两个列数据gruntB = FOREACH A GENERATE student,teacher;gruntDESCRIBE B;gruntC = DISTINCT B;6、对分组结果group进行COUNT统计,结果赋给Dgrunt D = FOREACH (GROUP C BY student) GENERATE group AS student, COUNT (C);7 将D写入hdfs为out/st_counter ;grunt STORE D INTO out/st counter;8、查看结果的内容grunt Is out六、数据记录和计算:写语句及截图七、实验结果或结论:即根据实验
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大数据+审计制度
- 如何实行绩效考核制度
- 子公司绩效考核制度
- 学院审计档案管理制度
- 安全检查教育培训制度
- 完善企业绩效考核制度
- 审计业务承接制度
- 审计农行轮岗制度规定
- 审计双公示制度
- 审计局公章管理使用制度
- 2025年高职汽车检测与维修技术(汽车检测)试题及答案
- 2025年11月近期典型事故案例警示教育
- 卵巢肿瘤病例讨论课件
- 2025年时事热点政治题及参考答案(满分必刷)
- 2026年国网内蒙古东部电力校园招聘(工程管理类)复习题及答案
- 2025年大学《老年学-老年学概论》考试备考试题及答案解析
- 2025年江苏安全技术职业学院单招职业技能测试题库完整答案详解
- 基于辛基酚聚氧乙烯醚制绒添加剂设计的制绒液对N型单晶硅表面织构化的研究
- 钢结构防火涂料应用技术规程TCECS 24-2020
- 二年级语文拼音教学活动方案
- GB/T 17456.1-2025球墨铸铁管、管件和附件外表面锌基涂层第1部分:带终饰层的金属锌及锌合金涂层
评论
0/150
提交评论