




已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
配置分布式Hadoop环境 上一课讲了如何在一台机器上建立Hadoop环境,我们只配置了一个NHName Node, 这个Name Node里面包含了我们所有Hadoop的东西,包括Name Node, Secondary Name Node, Job Tracker, Task Tracker,这一课讲解如何把上述配置放到不同机器上,从而构建一个分布式的hadoop配置。1. hadoop分布式安装概览a) 2-10个nodes:Name Node, Job Tracker, Secondary Name Node都可以放在一台机器上,所有的Data Node和Task Tracker放在其他机器上b) 10-40个nodes: 可以把Secondary Name Node分开来c) 100+ nodes: 所有的Node和Trackers都分开放,并且添加rack awareness支持,同时需要各类优化设置。 本课的流程:配置好ssh到所有的机器上,使其可以免输入密码连接(如同上一课所述)配置好masters和slaves配置好所有的*-site文件学习使用命令来启动,控制和关闭Hadoop(常用脚本说明如下图)。 2. 配置Hadoop到2-10个节点上这个图很帅,我们在HN Client机器上来控制所有的Hadoop机器,每个机器给一个窗口(下图已经通过ssh链接到每台机器了,链接方式见上一课)。第一步:取消所有机器上面的ssh密码访问ssh-copy-id -i $HOME/.ssh/id-rsa.pub nuggetuserHNData1把这个文件拷贝到所有的HNData和Secondary Name Node上面。这样就可以无密码登陆了。 第二步:配置Master和Slaves所有的配置文件都在/usr/local/hadoop/conf文件夹下面配置好masters来指向Secondary Name Node, 然后配置slaves文件指向所有的HNData NodeMaster文件默认的是localhost用任何编辑器打开masters文件,删除localhost, 输入HN2ndName (就是你Secondary Name Node 的名称)同样,编辑slaves文件,把所有的HNData Node名称输入 第三步:配置所有的Data Node,让它们指向Name Node,所有的Task Tracker指向Job Tracker通过core-site.xml配置前者,通过mapred-site.xml配置后者在HNData Node配置core-site.xml如下(因为我们是直接把上次的机器配置拷贝进来的,所以可以发现这个文件已经配置过了,如下:) 配置mapred-site.xml如下: 上面的配置应该已经是这样了,不过最好还是检查好每一个Data Node中的配置是不是这样第四步:重新格式化Name Nodehadoop namenode -format第五步:配置完成了,可以试着看看能否启动start-dfs.sh 这个命令启动所有的Name Nodes和Data Nodes,可以使用jps命令来查看是否成功启动了。 start-mapred.sh 这个命令启动所有的Job Trackers和Task Trackers, 同样使用jps来检测是否启动了,如果没有成功,可以去看看logs文件3. 启动和关闭Hadoop各部分的命令如果要删除一个node,可以建立一个excludes文件,在里面输入你不想要的node名称,比如HNData3.然后配置HN Name Node中core-site.xml如下(在最后添加一个property) 同样可以建立一个includes文件来指定包含哪些节点配置完成后,启用配置:hadoop dfsadmin -refreshNodes我们可以在hnname:50070上面看到被排除的Node 运行rebalancer命令start-balancer.sh关闭Job Tracker, Task Tracker:stop-mapred.sh关闭Name Node, Data N
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025北京一零一中教育集团矿大分校招聘考试参考题库及答案解析
- 2025西安雁塔区光华路社区卫生服务中心招聘(2人)考试参考题库及答案解析
- 2025重庆市大足区国衡商贸有限责任公司招聘派遣制工作人员招聘2人考试参考题库及答案解析
- 2025海南琼中黎族苗族自治县总工会招聘社会化工会工作者5人(第1号)考试参考题库及答案解析
- 2025自考专业(汉语言文学)能力提升B卷题库含完整答案详解(名校卷)
- 2025北京积水潭医院贵州医院简化考试程序招聘考试参考题库及答案解析
- 摄影直播展地创新创业项目商业计划书
- 水生植物与鱼类共生系统创新创业项目商业计划书
- 大豆酱油定制服务创新创业项目商业计划书
- 板栗炒货店创新创业项目商业计划书
- 新转型九年一贯制学校三年发展规划(2025年-2028年)
- 期神丁鹏期货交易课件
- 反走私课件教学课件
- 大货车闯红灯安全培训课件
- 2025秋教科版(2024)科学三年级上册教学设计(附目录)
- 2025年人教版三年级数学上册全册教案
- (2025秋新版)苏教版科学三年级上册全册教案
- 《中国人首次进入自己的空间站》导学案 部编语文八年级上册
- Unit 2 My friends (Period 3) 课件2025-2026学年人教版英语四年级上册
- 烟花爆竹经营安全管理知识培训考核试题及答案
- 四川省土地开发项目预算定额标准
评论
0/150
提交评论