HADOOP集群自动化安装手册.docx_第1页
HADOOP集群自动化安装手册.docx_第2页
HADOOP集群自动化安装手册.docx_第3页
HADOOP集群自动化安装手册.docx_第4页
HADOOP集群自动化安装手册.docx_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Hadoop集群自动化安装手册1 .Ambari简介来自Apache官方文档官网地址:/Apache Ambari项目的目的是通过开发软件来配置、监控和管理hadoop集群,以使hadoop的管理更加简单。Ambari提供了一个基于它自身RESTful的api实现的直观的、简单易用的web界面。Ambari现在支持的组件包括以下几个:HDFS,MapReduce,Hive,HCatalog,HBase,ZooKeeper,Oozie,Pig,Sqoop1. Ambari允许系统管理员进行以下操作: 提供一个hadoop集群Ambari提供了一个循序渐进的导向来安装hadoop服务到任意数量的主机Ambari处理集群的hadoop服务配置。 管理一个hadoop集群Ambari提供了一个中央管理器来管理整个集群的hadoop的服务的开启、停止和重新配置 监控一个hadoop集群Ambari提供了一个面板实时监控hadoop集群的健康和状态Ambari通过Ganglia来收集指标Ambari通过Nagios来进行系统预警,当你需要注意的时候给你发邮件(例如:一个节点宕机了,提醒磁盘空间不足,等等)2. Ambari允许程序开发人员和系统集成商:对他们自己的应用程序通过使用Ambari REST的api 简单的集成hadoop提供、管理和监控的能力2 安装所需条件2.1 操作系统的需求l CentOS版本6.3 (64位)备注: 操作系统安装的时候选择Basic Server就可以了,不要安装Open JDK。不要安装postgresql数据库 最为集群主节点的机器磁盘要做RAID,这样主要是为了保护关键性的数据文件,通常配置是RAID 1+0 或者 RAID 0 +1,其他从节点(数据节点)磁盘配置采用JBOD模式,直接挂载的文件系统的根目录下。 文件系统使用EXT42.2 软件的需求l ambari-1.6.0 (x86_64) for centos 6l HDP-UTILS-7 for centos 6l HDP-UTILS-6 for centos6l HDP- for centos6l CentOS-6.3-x86_64-bin-DVD1.isol CentOS-6.3-x86_64-bin-DVD2.iso(镜像必须和系统相同)2.3 JDK的需求l Oracle JDK 1.7_45 64-bit (默认)l Oracle JDK 1.6.0_31 64-bit3 安装示例说明所选操作系统集群设定Ambari版本Jdk版本Centos6.3 64位2dp22(master)3dp234 dp245dp251.6.0Oracle JDK 1.7_45 64-bit注意此处的主机名不符合完全限定域名(fully qualified domain name,FQDN)的规范,只是为了展示方便。4 安装前的先决条件4.1 系统时间同步必须运行ntpd(时钟同步)服务5 安装Ambari前的操作系统准备5.1 配置主机名# vi /etc/sysconfig/network例如:NETWORKING=yesHOSTNAME=master注意Ambari配置集群信息的时候是通过全限定主机名来确定集群中的机器信息的,所以必须确保主机名无误5.2 配置集群信息注意:将所有的机器IP地址和主机名写到hosts文件中,然后将这个文件复制到所有机器的/etc/目录下。# vi /etc/hosts5.3 配置ssh免密码互通在master节点上用root用户登录,在当前linux root用户下执行一下命令: # ssh-keygen然后一路回车即可,此操作会在/root生成一个.ssh隐藏文件夹,文件夹中有两个文件:id_rsa(私钥)和id_rsa.pub(公钥)。配置主节点到所有从节点的免密码登录,按照提示输入相应的信息。格式:ssh-copy-id -i .ssh/id_rsa.pub root例如:# ssh-copy-id -i .ssh/id_rsa.pub rootdp22# ssh-copy-id -i .ssh/id_rsa.pub rootdp23在master上测试连接:# shh dp22# shh dp23成功即可进行下一步,不成功删除.ssh文件夹及其所含文件即可5.4 关闭selinux查看selinux状态# /usr/sbin/sestatus v临时关闭# setenforce 0永久关闭SELinux# vi /etc/selinux/config将SELINUX=enforcing改为SELINUX=disabled重启生效,重启命令为:# reboot5.5 关闭iptables防火墙# chkconfig -level 35iptables off # service iptables stop查看防火墙状态# chkconfig list|grep iptables提示:Linux下的其它服务都可以用以上命令执行开启和关闭操作重启生效,重启命令为:# reboot5.6 设置linux最大打开文件数首先可以通过ulimit a 命令来查看,可以看到一下信息通过下面命令打开配置文件,修改最大打开文件数:#vi /etc/security/limits.conf在文件最后添加下面两条信息* - nproc 65535* - nofile 65535然后保存退出,重启机器,在执行#ulimit a就可以看到下面信息中最大打开文件数是65535了6 配置yum软件源在其中一台机器上安装apache http服务器,通过ISO方式挂载本地yum源,具体可以在网上查找挂载方式。挂载完成以后,在root用户下执行安装http服务#yum y install httpd启动http服务#service httpd restart将ambari需要的软件包上传到/var/www/html目录下,执行解压命令#tar zxvf Hadoop.tar.gz 可以看到一下目录通过浏览器访问任何目录可以看到文件列表就可以了备注:我这里设置的yum源服务器的地址是47 安装Ambari Server7.1 添加Ambari的yum资源库#wget 4/ambari/centos6/1.x/updates/1.6.0/ambari.repo /etc/yum.repos.d/7.2 编辑yum资源库配置文件#vi ambari.repo将文件中的所有替换成你的yum源http服务器的IP地址,将gpgcheck=1改成gpgcheck=0,保存退出7.3 创建CentOS操作系统yum源配置在/etc/yum.repo.d/目录下创建centos.repo文件,并写入下面内容(将其中的IP地址换成你的yum源http服务器的IP地址),保存退出。centosname=centos6baseurl=4/CentOS/enabled=1gpgcheck=0gpgkey=file:/etc/pki/rpm-gpg/RPM-GPG-KEY-CentOS-67.4 资源库验证# yumrepolist如果出现以下类似信息即为安装正确然后将ambari.repo和centos.repo文件复制到所有服务器的/etc/yum.repo.d目录下。7.5 安装Ambari服务# yuminstallambari-server出现下面的提示信息说明安装成功7.6 设置Ambari服务之前 编辑ambari要安装的软件源配置# vi /var/lib/ambari-server/resources/stacks/HDP/2.1/repos/repoinfo.xml将文件中的所有替换成你的yum源http服务器的IP地址。保存退出# vi /var/lib/ambari-server/resources/stacks/HDP/2.1.GlusterFS/repos/repoinfo.xml将文件中的所有替换成你的yum源http服务器的IP地址。保存退出 编辑ambari要安装的JDK路径# vi /etc/ambari-server/conf/perties将文件中的所有替换成你的yum源http服务器的IP地址。保存退出7.7 设置Ambari服务# ambari-serversetup出现选择选项时按默认处理即可在这里我们选择2,JDK6出现上面的信息说明设置成功7.8 运行Ambari-server#ambari-server start# ps -aux | gerp java 查看是否存在ambari-server进程,如果存在,说明启动成功,通过界面就可以开始安装hadoop集群了#停止命名:ambari-server stop备注:如果整个集群系统关机(无论正常关机还是掉电关机),除了启动ambari-server之外,集群中其他机器都要手动的去启动ambari-agent,启动的命是ambari-agent start.8 安装集群Ambari-server Web服务对应的端口是8080。 在浏览器中打开 http:/:8080,可以看到登陆界面,默认的用户名密码是:admin/admin 输入用户名密码登陆进去开始按照步骤安装,设置集群名称,可以随便输入 选择技术堆栈,这里选择HDP 2.1点击高级库选项在这个界面中设置本机软件镜像库的路径,用下面这个路径替换所所有的就可以了4/HDP/centos6/2.x/updates// (这里的IP换成的yum源IP地址),点击下一步 设置要安装的机器列表、ambari-server服务所在节点的私钥文件id_rsa,从你的ambari-server服务所在的节点上/root/.ssh目录下降id_rsa文件拷贝出来,按照提示输入相关信息,点击注册并确认按钮在弹出的对话框中确认你的机器名称是否正确,如果正确点击OK 注册主机并在每台机器上安装agent,成功点击下一步,如果出错,点击状态信息查看错误信息,并点击重试所有失败机器,进行重新安装。 选择要安装的服务这里我们这次安装下面勾选的这些组件,你需要安装哪些勾选哪些。点击下一步 分配主节点,设置Master 所在的节点,我们这里将NameNode,ResourceManager,HMaster都放到一个节点上(备注:这个节点也是我们安装操作系统的时候磁盘做RAID的机器)其他的服务可以随便设置节点 选择从节点安装的服务,原则上主节点不安装这些服务,然后点击下一步 配置服务,在这里主要是设置我们安装的那些服务的一些配置信息。主要设置的地方: HDFS NameNode Java heap size 8G node.handler.count 设定到100 dfs.datanode.handler.count 设定到50(在自定义hdfs-site.xml部分设置) dfs.datanode.max.xcievers同时处理文件的上限 设定到8192(在自定义hdfs-site.xml部分设置) Yarn默认 Mapreduce默认 HBase HBase Master Maximum Java heap size 4G RegionServers maximum Java heap size 12G Zookeeper默认 Nag

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论