r语言ppt第13章 rhadoop_第1页
r语言ppt第13章 rhadoop_第2页
r语言ppt第13章 rhadoop_第3页
r语言ppt第13章 rhadoop_第4页
r语言ppt第13章 rhadoop_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 大数据应用人才培养系列教材R 语言张 燕总主编程显毅主编朱倩副主编 大数据应用人才培养系列教材13 . 113 . 213 . 3习题认识RHadoopRhdoop安装综合练习第十三章 RHadoop13.1认识RHadoop第十三章 RHadoop(1) Hadoop的强大之处在于对大数据的处理,让原来的不可能(TB,PB数据量计算),成为了可能。所以,hadoop重点是海量数据分析。(2)R语言的强大之处在于统计分析,在没有Hadoop之前,我们对于大数据的处理。可以看出,两种技术放在一起,刚好是取长补短。大数据应用人才培养系列教材13 . 3习题综合练习第十三章 RHadoop13.2

2、RHadoop安装第十三章 RHadoop(1)下载依赖包/RevolutionAnalytics/RHadoop/wiki/Downloads rmr-2.1.0rhdfs-1.0.5 rhbase-1.1复制到/root/R目录/R# pwd/root/R/R# lsrhbase_1.1.tar.gzrhdfs_1.0.5.tar.gzrmr2_2.1.0.tar.gz13.2RHadoop安装第十三章 RHadoop(2) 安装rJava 库, 在配置好了JDK1.6 的环境后, 运行RCMDjavareconf命令,R的程序从系统变量中会读取Java配

3、置。然后打开R程 序,通过install.packages的方式安装rJava。13.2RHadoop安装第十三章 RHadoop(3)安装依赖库在命令行执行:R CMD javareconf R启动R程序install.packages(rJava) install.packages(reshape2) install.packages(Rcpp) install.packages(iterators) install.packages(itertools) install.packages(digest) install.packages(RJSONIO) install.packages

4、(functional)13.2RHadoop安装第十三章 RHadoop(4) 安 装 rhdfs 库 , 在 环 境 变 量 中 增 加HADOOP_STREAMING 两个变量:HADOOP_CMD和vi /etc/environment HADOOP_CMD=/root/hadoop/hadoop-1.0.3/bin/HadoopHADOOP_STREAMING=/root/hadoop/hadoop-1.0.3/contrib/ streaming/ hadoop-streaming-1.0.3.jar(5)安装rmr库R CMD INSTALL rmr2_2.1.0.tar.gz

5、(6)安装rhbase库安装完成HBase后,还需要安装Thrift,因为rhbase是通过Thrift调用HBase的。Thrift是需要本地编译的,官方没有提供二进制安装包,首先下载thrift-0.8.0。在Thrift解压目录输入./configure,会列Thrift在当前机器所支持的语言环境,如果只是为了rhbase,默认配置就可以了。13.2RHadoop安装第十三章 RHadoop(7)安装rhbase。下载thriftwget/dist/thrift/0.8.0/thrift-0.8.0.tar.gztar xvf thrift

6、-0.8.0.tar.gzcd thrift-0.8.0/下载PHP支持类库(可选) sudo apt-get install php-cli 下载C+支持类库(可选)sudo apt-get install libboost-dev libboost-test-dev libboost - program-options-dev libevent-dev automake libtool flex bison pkg-config g+ libssl-dev13.2RHadoop安装第十三章 RHadoop生成编译的配置参数./configure 编译和安装makemake install

7、查看thrift版本thrift -versionThrift version 0.8.0启动HBase的Thrift Server/hbase-0.94.2/bin/hbase-daemon.sh start thrift jps安装rhbaseR CMD INSTALL rhbase_1.1.1.tar.gz13.2RHadoop安装第十三章 RHadoop(8)查看安装的类库一般R的类库目录是/usr/lib/R/site-library或者/usr/local/lib/R/ site-library,用户也可以使用whereis R的命令查询,自己计算机上R类库的安装位置。ls /di

8、sk1/system/usr/local/lib/R/site-library/digestfunctionaliteratorsitertoolsplyr rhdfsrJavaRJSONIOrmr2stringrRcppreshape2 大数据应用人才培养系列教材13 . 113 . 213 . 3习题认识RHadoopRHadoop安装综合练习第十三章 RHadoop13.3综合练习第十三章 RHadoop(1) 查看hadoop目录hadoop fs -ls /user(2) 查看hadoop数据文件hadoop fs -cat /user/hdfs/o_same_school/part

9、-m-00000(3) 启动R程序(4) 启动MapReduce library(rmr2) s = to.dfs(1:10) mapreduce(input = s, map = function(k, v) cbind(v, v2) from.dfs(/tmp/RtmpWnzxl4/file5deb791fcbd5)13.3综合练习第十三章 RHadoop(5)wordcount执行rmr2任务 input wordcount = function(input, output = NULL, pattern = ) wc.map = function(.

10、, lines) keyval(unlist( strsplit( x = lines,split = pattern),1)wc.reduce =function(word, counts ) keyval(word, sum(counts)mapreduce(input = input ,output = output, input.format = text,map = wc.map, reduce = wc.reduce,combine = T) wordcount(input)from.dfs(/tmp/RtmpfZUFEa/file6cac626aa4a7) 大数据应用人才培养系列

11、教材13 . 113 . 213 . 3习题认识RHadoopRHadoop安装综合练习第十三章 RHadoop 习题: 1下面 程序负责HDFS数据存储。A.NameNodeB.JobtrackerC.DatanodeD.secondaryNameNode2Hadoop作者是 。A.Martion Fowler B.Kent Beck C.Doug cutting3. Rhadoop是将R的强大 能力和hadoop的 相结合。4. 通过R的三个包 、 、 ,实现R对hadoop各个组件的调用。5. Hadoop主要用来 ,R语言完成 算法。6. R语言的强大之处?7. Mahout是基于Ha

12、doop的 和 的算法框架。8Hadoop作者是 。A.Martion Fowler B.Kent Beck C.Doug cutting 9Hadoop的强大之处,在于对 的处理,让原来的不可能(TB,PB数据量计算),成为了可能。10Mahout和R语言的区别? 习题: 11Rhadoop的四个组成功能。12Hadoop 特 点 及 优 势 ? 13R与Hadoop结合一般步骤?14. R的三个包rmr、rhdfs、rhbase分别是对应Hadoop系统架构中的哪个部分?15. 对应MapReduce的R包的名称。16对应 HDFS的R包的名称AIRack人工智能实验平台一站式的人工智能实验平台DeepRack深度学习一体机开箱即用的AI科研平台BDRack大数据实验平台一站式的大数据实训平台云创公众号推荐看未来深度学习世界云计算头条中国大数据云创大数据订阅号云创大数据服务号高校大数据与人工智能微信号:data_AI微信号:cstorfw

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论