PowerHA完全手册范本.doc_第1页
PowerHA完全手册范本.doc_第2页
PowerHA完全手册范本.doc_第3页
PowerHA完全手册范本.doc_第4页
PowerHA完全手册范本.doc_第5页
已阅读5页,还剩121页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

范文范例参考PowerHA完全手册(一)前言自2008 年 4 月 02 日笔者在IBM DevelopWork网站首次发表HACMP 5.X 完全手册以来, 加上各网站的转载,应该已过了10万的阅读量,在此非常感谢大家的认可和支持。 转眼已经5年过去了,期间非常感谢不少同仁指出了该文的各种不足,并且HACMP已经改名为HACMP了,由于软件版本的更新和本人当时的技术水准有限,同时也存储不少同仁的希望,在原文基础上进行了补充和修订完善,也就有了本文。 正是由于AIX专家俱乐部的兴起,对AIX和HACMP的技术感兴趣的技术人员又更多了。因此选择本杂志作为原创发表,就是希望能对更多的同仁日常工作有所帮助。此外,虽然本文号称“完全手册”,一是为了吸引眼球,二也只是相对于其他只谈安装配置的文档而言。由于HACMP现在已相当复杂,本文范围也主要关注于最常用的双节点,还望大家谅解。 即便如此,本文篇幅可能仍然较长,虽然也建议大家先通读一下,但实际使用使用时可根据具体目的按章节直接查阅操作。这是因为一方面本文所述操作笔者都加以 验证过;一方面也是全中文,省得大家去查一大堆原版资料。希望能帮助大家在集成和运维HACMP的过程中节省精力、降低实施风险,这也是本文编写的初衷。 同时还望那些被部分摘抄文章的同仁也能理解,你们都是笔者的老师,这里也一一谢过。 虽笔者端正态度,尽力认真编写,但由于能力有限,恐仍有错漏之处,还望众多同仁多多指正海涵,在此先行谢过。 1.为什么需要PowerHA/HACMP 随着业务需求日益增加,IT的系统架构中核心应用必须一直可用,系统必须对故障必须有容忍能力,已经是现代IT高可用系统架构的基本要求。 10 年前各厂商现有的UNIX服务器就已拥有很高的可靠性,在这一点上IBM的Power系列服务器表现尤为突出。但所有UNIX服务器均无法达到如原来 IBM大型主机S/390那样的可靠性级别,这是开放平台服务器的体系结构和应用环境所决定的,这一点,即使科技发展到云计算的今天仍然如此。 因此,我们需要通过软件提供这些能力,同时这个软件还应该是经济有效的。它可以有效确保解决方案的任何组件的故障都不会导致用户无法使用应用程序及其数据。实现这一目标的方法是通过消除单一故障点消除或掩盖计划内和计划外停机。另外,保持应用程序高可用性并不需要特殊的硬件。 IBM高可用性集群软件-PowerHA/HACMP也就应运而生,即使到了今天 ,对比x86平台的linux、windows甚至包括其他UNIX操作系统的高可用性集群,至少从笔者20年的IT从业实际经历来看,IBM PowerHA/HACMP高可用性解决方案虽然复杂,需要更高水平工程师的精心维护,但的确相对更成熟更有效。 PowerHA的前身为HACMP ,或者说PowerHA 和 HACMP 这两个词对IBM来说可以互换使用。 基于这一点,也由于实际使用过程中PowerHA软件的名称、菜单名、日志等均仍为HACMP,因此后面论述时我们仍均称为PowerHA为HACMP,以免造成理解的困难。 2.PowerHA的版本由于IBM对软件的整合,目前PowerHA其实不仅仅只包含之前的HACMP软件,我们先来看看下图:大家可以看到,我们通常的HACMP其实现在准确名称是PowerHASystemMirror,它有2个平台4个主 要大版本,forAIX,i系统;企业版和标准版;企业版扩展了异地容灾相关的功能;而其他小版本,则是在其企业版和标准版基础 之外的支持;比如最近比较热的PowerHASystemMirrorHyperSwap的数据中心双活的解决方案,就是利用HyperSwap版本对存储DS8000容错的扩展支持来得以实现。我们说的PowerHA pureScale,则是和类oracle RAC的IBMDB2 pureScale解决方案相配合的高可用性套件,不再是我们通常意义上的HACMP。由于本文的重点为AIX的本地高可用性,因此除非特别声明,我们缺省说PowerHA时都是指PowerHA SystemMirror Standard的版本。 3.HACMP的工作原理 HACMP是High Availability Cluster Multi-Processing的缩写;也就是IBM公司在P系列 AIX操作系统上的高可靠集群软件,配置冗余,消除单点故障,保证整个系统连续可用性和安全可靠性。 HACMP是通过侦测主机及网卡的状况,搭配 AIX所提供的LVM等管理功能,在主机、网卡、硬盘控制卡或网络发生故障时,自动切换到另一套备用元件上重新工作; 若是主机故障还切换至备机上继续应用系统的运行。作为双机系统的两台服务器同时运行HACMP软件;u 两台服务器的备份方式大体有二种: n 一台服务器运行应用,另外一台服务器做为备份 n 两台服务器除正常运行本机的应用外,同时又作为对方的备份主机; u 两台主机系统在整个运行过程中,通过 心跳线相互监测对方的运行情况(包括系统的软硬件运行、网络通讯和应用运行情况等); u 一旦发现对方主机的运行不正常(出故障)时,故障机上的应用就会立即停止运行,本机(故障机的备份机)就会立即在自己的机器上启动故障机上的应用,把故障机的应用及其资源(包括用到的IP地址和磁盘空间等)接管过来,使故障机上的应用在本机继续运行; u 应用和资源的接管过程由HACMP软件自动完成,无需人工干预; u 当两台主机正常工作时,也可以根据需要将其中一台机上的应用人为切换到另一台机(备份机)上运行。 4.HACMP术语: 为方便大家阅读,我们这里简单介绍一下HACMP 主要术语。它们可以分为拓扑组件和资源组件两类。 拓扑组件(Cluster topology)基本上是物理组件。它们包括: 节点(Nodes):运行AIX操作系统的Power服务器上的分区或微分区。实 际目前节点现分为2种,一个是服务器节点(Server 节点),运行核心服务和共享磁盘的应用的机器;一个是客户端节点(Client)节 点,前台使用集群服务的应用的机器。比如中间件软件等无需共享磁盘安装在客户端节点的机器上,数据库软件安装在服务器节点的机器上。 像监控节点的信息收集程序clinfo就是只运行在客户节点上。而对于2个节点的集群,则简化掉这些分别,即节点为二合一。 网络(Networks):IP 网络和非 IP 网络 通信接口(Communication interfaces):以太网或令牌环网适配器 通信设备(Communication devices):RS232 或磁盘的心跳机制拓扑组件示意图资源组件(Cluster resources)是需要保持高可用性的逻辑实体。它们包括: 应用服务器(Application servers):它涉及应用程序的启动/停止脚本。 服务 IP 地址(Service IP labels / addresses):最终用户一般通过 IP 地址连接应用程序。这个 IP 地址映射到实际运行应用程序的节点。因为 IP 地址需要保持高可用性,所以它属于资源组。 文件系统(File systems):许多应用程序需要挂载文件系统。 卷组(Volume groups):许多应用程序需要高可用的卷组。 所有资源一起组成资源组实体。HACMP 把资源组当作单一单元处理。它会保持资源组高可用性。资源组件示意图此外,还存在资源组有与其相关联的策略。这些策略包括:1. 启动策略(Cluster startup):这决定资源组应该激活哪个节点。2. 故障转移策略(Resource /Node failure):当发生故障时,这决定故障转移目标节点。 3. 故障恢复策略(Resource/Node recovery):这决定资源组是否执行故障恢复。当发生故障时,HACMP 寻找这些策略并执行相应的操作。 5.实验环境说明: 以双机互备中相对复杂的多业务网络的情况为例,其他类似设置可适当简化。1)机器一览表 节点机器名操作系统应用软件HA版本host1AIX6.1.7ORACLE 11gHA6.1.10host2AIX6.1.7TUXEDO 11HA6.1.10 2)磁盘和VG规划表节点机器名磁盘VGVG MajorNumberhost1hdisk2host1vg101host2hdisk3host2vg201 3)用户和组规划表用户USERID组组ID使用节点orarunc610dba601host1tuxrun301tux301host1bsx1302tux301host1xcom401dba601host1orarun609dba601host24)逻辑卷和文件系统规划表PP size:128M节点机器名逻辑卷文件系统 大小(pp) 所有者用途host1ora11runclv/ora11runc40oraruncORACLE客户端软件tux11runlv/tux11run30tuxedoTuxedo软件bsx1lv/bsx130bsx1宝信MES应用程序xcomlv/xcom30xcom宝信xcom通信软件host2ora11runlv/ora11run60orarunORACLE数据库软件oradatalv/oradata80orarun数据库 5)路由规划表节点名目的路由host1default5410.2.2005410.3.30054host2default54 6)HACMP结构表集群名: test_cluster适配器名功能网络名网络类型属性节点名IP地址MAC地址host1_tty0heartbeathost1_net_rs232rs232serialhost1host1_l2_boot1boot1host2_net_ether_2etherpublichosthost1_l1_boot1boot1host2_net_ether_1etherpublichost1host1_l2_svcServicehost1_net_ether_2etherpublichosthost1_l1_svc1Servicehost1_net_ether_1etherpublichosthost1_l1_svc2Servicehost1_net_ether_1etherpublichosthost1_l2_boot2boot2host1_net_ether_2etherpublichosthost1_l1_boot2boot2host1_net_ether_1etherpublichosthost2_tty0heartbeathost2_net_rs232rs232serialhost2host2_l2_boot1boot1host2_net_ether_2etherpublichosthost2_l1_boot1boot1host2_net_ether_1etherpublichost2host2_l2_svcservicehost2_net_ether_2etherpublichosthost2_l1_svc1servicehost2_net_ether_1etherpublichosthost2_l1_svc2servicehost2_net_ether_1etherpublichosthost2_l2_boot2boot2host2_net_ether_2etherpublichosthost2_l1_boot2boot2host2_net_ether_1etherpublichost 7)HACMP示意图8)实验环境示意图 9)应用脚本起停设计 start_host1: 添加网关 运行start_host1_app stop_host1: 运行stop_host1_app 清理vg进程 start_host2: 添加网关 运行start_host2_app stop_host2: 运行stop_host1_app 清理vg进程 start_host1_app: 确认host2已启动 整理路由 启动主应用程序 启动通信程序 stop_host1_app: 停通信程序 停应用主程序 清理路由 start_host2_app: 如在host1机器上执行stop_host1_app 起Oracle数据库及listener 如在host1机器上执行start_host1 stop_host2_app: 停数据库及listener第一部分-规划篇 万事开头难,对于一个有经验的HACMP工程师来说,会深知规划的重要性,一个错误或混乱的规划将直接导致实施的失败和不可维护性。 HACMP实施的根本目的不是安装测试通过,而是在今后运行的某个时刻突然故障中,能顺利的发生自动切换或处理,使得服务只是短暂中断即可自动恢复,使高可用性成为现实。2.1. 规划前的需求调研 在做规划之前,或者说一个准备实施HACMP来保证高可用性的系统初步设计之前,至少需要调查了解系统的以下相关情况,这些都可能影响到HACMP的配置。 应用特点1) 对负荷的需求,如CPU、内存、网络等特别是I/O的负载的侧重。2) 对起停的要求,如数据库重起可能需要应用重起等等。3) 对于自动化的限制,如重起需要人工判断或得到命令,需要在控制台执行。 网络状况和规划 包括网段的划分、路由、网络设备的冗余等等在系统上线前的状况和可提供条件,以及实施运行过程中可能出现的变更。 操作系统情况 目前IBM的HACMP除了AIX,还支持Linux。 目前新装机器都是AIX5.3,即使安装HA5.4也没有问题。但如果安装可能是在老机器上进行升级,需要仔细了解操作系统版本及补丁情况。 主机设计1) 可能实施的机器网卡的数量,网卡是否只能是双口或更多。2) 是否有槽位增加异步卡3) 主机之间的距离,这影响到串口线的长度。 预计实施高可用性的情况1) 希望实施HACMP的机器数量2) 希望方式,如一备一,双机互备,一备多,环形互备等等。 2.2. PowerHA/HACMP版本确定 IBM HACMP 自从出了5.2 版本后, 到了5.205后比较稳定,并经过我们自己充分的测试(见测试篇)和实践证明(已有多个系统成功自动切换)。之前个人觉得HACMP5.3后变化较快快,功能增加多,稳定性不够,相当长时间还是一直推荐HA5.209。这也是本文出了第一版完全手册之后一直没有修订的原因之一。 随着Power主机和AIX的更新换代,名称也在变化,虽然目前最新版为PowerHA SystemMirror 7.1, 又增加了不少绚丽夺目的功能,但个人以为作为高可用性软件,其成熟度为第一要素,其稳定性有待进一步验证。而经过我们这2年来的充分实施经验,目前可以放心推荐版本为PowerHA 6.1的6.1.10及以上。2.3. IP地址设计 IP地址切换(IPAT)方式有3种方式:图1a,1b,和1c中描述了三个主要的IPAT配置场景。 u 第一个拓扑模式:IPAT via Replacement在分开的子网中包含boot 和standby网卡。当集群服务启动的时候boot 地址被换成service 地址。尽管这种方式有效性强,但是在需要实现多服务IP地址的环境下这种方式是不可取的。集群的管理员不得不利用pre- 和 post-events 定制其环境建立额外的别名, 并且需要确认这些别名在下一次接管发生前被删除。u 第二个拓扑模式:IPAT via Aliasing HACMP 4.5 开始引入了IPAT via Aliasing 作为缺省的拓扑模式。在这种新的模式中,standby网卡的功能被另外一个boot网卡替换。子网需求的不同点是还需要一个另外的子网,每一个boot 网卡需要它自己的子网,并且任何service 或 persistent 的IP 将在其本身的子网上操作,所以一共三个子网。当集群服务启动并且需要service IP 的时候,boot IP 并不消失。这个设计和第一种是不同的,在同一个HACMP网络中有多个service IP存在并且通过别名来控制。 u 第三种模式:EthernetChannel(EC) 这种模式把底层的以太网卡藏到一个单一的“ent”接口之后。该模式不是对前述任何一种方式的替换,而是可以和前述的任一种模式共同存在。因为在每一个节点EC 都被配置成冗余方式,可以在HACMP中使用IP别名定义它们每一个作为单一网卡网络。因为在每个节点只有一个网卡被定义,所以只有两个子网,一个是用作 boot(每个节点的基本IP地址),另一个是用于提供高可用服务。 本文讨论实际工作中使用最多的为第2种:别名方式(IPAT via Aliasing),即使到今天,其使用仍然最为广泛,对交换机要求也最低。对于新型核心交换机和网络人员可紧密配合的,则推荐第3种,由于第3种更为简单,切换时间更短。但本文这里以第2种为主加以讨论。 这样设计时就需要注意以下事情:1. 网段设计:一个服务地址需要3个网段对应,boot地址网段不能和服务地址一致。避免网络变更造成的系统不可用,boot地址的网段不要和实际其他系统的网段一致。在网段比较紧张的地方,建议设计时询问网络人员。 举例来说,下面的地址将会由于网络变更后打通合一后可能造成冲突:设计人机器名服务地址boot1地址boot2地址张三app1_db张三app1_app李四app2_db李四app2_app王五app3_db王五app3_app2. boot地址的设计:不要和实际其他同网段机器的boot地址冲突,最好不同网段。即这个规划不能只考虑系统本身,还需要从同网段的高度考虑。 举例来说,下面的地址由于2个系统分开设计,同时开启将直接导致2个系统不可用。boot地址的设计表1设计人机器名服务地址boot1地址boot2地址张三app1_db张三app1_app李四app2_db李四app2_app所以在设计时,我们建议boot地址的IP地址最后一段参照服务地址,这样虽然可记忆性不是很好,但即使设计在同一网段,也可以避免上述错误发生。更改设计如下:boot地址的设计表2设计人机器名服务地址boot1地址boot2地址张三app1_db张三app1_app李四app2_db1李四app2_app2 此外,如果是每个网卡多个网口,记得设计时必须注意同一网络的boot地址要分开到2块网卡,以保证真正的冗余。2.4. 心跳设计 配置HACMP的过程中,除了TCP/IP网络之外,您也可以在其它形式的网络上,如串行网络和磁盘总线上配置心跳网络。1. TCP/IP网络 优点:要求低,不需要任何额外硬件或软件,即可实现。 缺点:占用IP地址,不能避免由于TCP/IP的软件问题导致HACMP崩溃,系统不可用。2. 串口网络 优点:真正实现高可用性,不占用IP地址。 缺点:需要硬件支持,需要新增异步卡,而中低端的机器的插槽有限。3. 磁盘心跳 优点:不占用插槽,磁盘总线上的心跳网络能够在TCP/IP网络资源有限的情况下提供额外的HACMP节点间的通信手段,并且能够防止HACMP节点之间由于 TCP/IP软件出现问题而无法相互通信。 缺点:需要操作系统和存储支持,如使用增强型卷组,此外对于I/O读写负荷高的应用,也需要慎用。 正如IBM红皮书所说,条件许可的情况下,强烈推荐使用串口网络,其次是磁盘心跳。不过我们也注意到HACMP7.1将不再支持串口心跳,而改为其他如SAN方式,效果有待进一步观察。2.5. 资源组设计 对于HACMP来讲,服务IP地址和磁盘VG、文件系统、应用服务器都是资源,如何规划需要根据实际情况来,包括以下内容:资源组的数量即资源:一般情况下每台机器只要建立一个资源组即可,包括服务IP地址、应用服务器及VG。 现在不推荐具体确定VG里的文件系统,这是因为确定后,有可能造成有些新增文件系统不在HACMP的控制范围,结果是HACMP切换时由于这些文件系统没有unmount掉而导致切换失败。资源组的策略:分failover(故障切换)和fallback(回切)等。一般选缺省,当然你可以根据具体情况修正,如oracle 10g RAC的并发VG资源组的选择就不一样。2.5.1.磁盘及VG设计 虽然实际上HACMP是靠PVID来认磁盘的,但集群的机器上磁盘顺序不一,磁盘对应不一致会造成某种混乱。以致于安装配置和维护时很容易产生各种人为错误,所以我们强烈建议机器上看到的磁盘和VG名称都一一对应,此外VG 的MajorNumber也需要预先设计规划,以免不一致。同时新的AIX6.1已很好提供了修改hdisk号的rendev 命令,以前这样的烦恼也就迎刃而解了。2.5.2.用户及组设计 HA要求所有切换需要用到的用户必须所有节点对应,ID完全相同,用户运行的环境变量完全相同,即当系统切换时,对使用该用户的程序用户即组设置没有区别的。如某系统的host2上oracle用户为orarun,host1上的orarun必须为切换保留,ID均为209,host1上平时用的oracle用户就设为orarunc。2.5.3.逻辑卷和文件系统设计 HACMP要求切换相关的文件系统和lv不能重名,如host2上oracle软件目录为/ora11run,host1上的/ora11run必须为切换保留,改为/ora11runc。此外,集群下相关的文件系统和lv,在各个节点主机的定义也需要一致,如/etc/filesystems里是一致的,这个通过importvg或HACMP的C-SPOC来保证。2.5.4.路由设计 对于有通信需求的主机,很可能对路由有一定要求,如本次实验环境,就有2个网段走的不是缺省路由,需要设计清楚,最后在起停脚本实现。2.5.5.应用脚本设计 我们这里说的应用,是包括数据库在内除OS和HACMP之外的所有程序,对于应用程序的起停顺序和各种要求,都需要预先和应用人员加以沟通,并预先设计伪码,最终编写脚本实现。第二部分-安装配置篇2.1. 准备2.1.1.安装前提 1) 操作系统版本要求:实验实际为AIX6.1.10,实际HACMP6.1 要求AIX5.3.9和AIX6.1.2,具体安装时可查看以下安装版本的High Availability Cluster Multi-Processing for AIX Installation GuidePrerequisites一节。2) 系统参数要求 作为集群的各个节点机,我们建议各个参数最好完全一致,需要注意的参数有:1. 异步I/O 服务进程配置(Asynchronous I/O servers)2. 用户最大进程数3. 系统时间4. 用户缺省的limits参数5. 其他可能影响应用的参数3) 环境要求 此时,没有建立任何HACMP占用设计ID相关用户和组,同样也没有建立VG和文件系统,包括名称冲突文件系统和lv和Major numver冲突的VG。 用户和组确认目的:确认没有和设计中ID冲突的用户,否则需要调整。host1root/lsuser -a id ALLroot id=0daemon id=1bin id=2sys id=3adm id=4uucp id=5host2root/lsuser -a id ALLroot id=0daemon id=1 文件系统确认 目的:确认没有和设计名称相冲突的文件系统,否则需要调整。host1root/df -kFilesystem 1024-blocks Free %Used Iused %Iused Mounted on/dev/hd4 524288 487820 7% 3276 3% /dev/hd2 7077888 1868516 74% 91290 18% /usr/dev/hd9var 524288 458364 13% 991 1% /var/dev/hd3 917504 826700 10% 120 1% /tmp/dev/hd1 655360 524856 20% 291 1% /home/proc - - - - - /proc/dev/hd10opt 1179648 589072 51% 11370 8% /opthost2root/df -k .4) 安装包要求:RSCT 或更高版本。lslpp -l|grep rsct 以下的包也是必须要安装的:(脚本可直接拷贝运行)lslpp -l rsct.*lslpp -l bos.adt.liblslpp -l bos.adt.libmlslpp -l bos.adt.syscalls lslpp -l .tcp.client lslpp -l .tcp.serverlslpp -l bos.rte.SRClslpp -l bos.rte.libclslpp -l bos.rte.libcfg lslpp -l bos.rte.libcurlslpp -l bos.rte.libpthreads lslpp -l bos.rte.odm显示确认结果:host1root/lslpp -l rsct.* Fileset Level State Description -Path: /usr/lib/objrepos rsct.basic.hacmp COMMITTED RSCT Basic Function (HACMP/ES Support) rsct.basic.rte COMMITTED RSCT Basic Function rsct.basic.sp COMMITTED RSCT Basic Function (PSSP Support) pat.basic.hacmp COMMITTED RSCT Event Management Basic Function (HACMP/ES Support) pat.basic.rte COMMITTED RSCT Event Management Basic Function pat.basic.sp COMMITTED RSCT Event Management Basic Function (PSSP Support) pat.clients.hacmp COMMITTED RSCT Event Management Client Function (HACMP/ES Support)host2root/lslpp -l rsct.*2.2. 安装2.2.1.安装PowerHA6.1(需要在所有节点上安装)如果是光盘,请插入光盘 ,输入smitty install_latest Install SoftwareType or select values in entry fields.Press Enter AFTER making all desired changes. Entry Fields* INPUT device / directory for software /dev/cd0* SOFTWARE to install _all_latest. ACCEPT new license agreements? yes Preview new LICENSE agreements? no 如果是安装盘拷贝,请进入cd installp/ppc目录,smitty install_latest Install SoftwareType or select values in entry fields.Press Enter AFTER making all desired changes. Entry Fields* INPUT device / directory for software .* SOFTWARE to install _all_latest. ACCEPT new license agreements? yes Preview new LICENSE agreements? no安装结束后,会报failed,请检查cluster.doc.en_US.pprc.pdf cluster.es.cgpprc.rte cluster.es.pprc.cmds cluster.es.spprc.*cluster.es.sr.*cluster.es.svcpprc.*cluster.xd.*glvm.rpv.*包以外,所有的HACMP的包都要安装 2.2.2.打补丁 注意,请不要忽略给HACMP打补丁这一步骤。其实对HACMP来说,补丁是十分重要的。很多发现的缺陷都已经在补丁中被解决了。当严格的按照正确步骤安装和配置完HACMP的软件后,发现takeover 有问题,IP接管有问题,机器自动宕机等等千奇百怪的问题,其实大都与补丁有关。所以一定要注意打补丁这个环节。如为HACMP 6110 或 IV42930以上Apar: IV42930 LATEST HACMP FOR AIX R610 FIXES SP11 MAY 2013 。 smitty install_latest,全部安装host1root/soft_ins/ha61/patchls.toc cluster.es.cspoc.dsh.1.bffcluster.adt.es.client.include..bff 安装结束后,仍会报failed,检查glvm.rpv.*cluster.xd.glvm cluster.es.tc.*cluster.es.svcpprc.* cluster.es.sr.rte.* cluster.es.spprc.* cluster.es.pprc.*cluster.es.genxd.* cluster.es.cgpprc.*没装上外,其他都已安装上。补丁可在IBM网站下载:重启机器 注:记住一定要重起机器,否则安装将无法正常继续。2.2.3.安装确认1) 确认inittab:egrep -i hacmp /etc/inittabhacmp:2:once:/usr/es/sbin/cluster/etc/rc.init /dev/console 2&1 在HACMP 6.1版本中,我们可以看到inittab非常简化,将所有HACMP需要开机启动相关进程的工作,全部归入一个脚本/usr/es/sbin/cluster/etc/rc.init来运行。如果你查看/etc文件/inittab文件 就会发现安装完HACMP后,仅添加了一行:hacmp:2:once:/usr/es/sbin/cluster/etc/rc.init /dev/console 2&1 。2) 确认安装和补丁包:(关键为cluster.es.server.rte)lslpp -l cluster.* Fileset Level State Description -Path: /usr/lib/objrepos . cluster.es.server.rte 0 COMMITTED ES Base Server Runtime3) 确认clcomdES已启动lssrc -s clcomdESSubsystem Group PID Status clcomdES clcomdES 4128974 active2.3. 配置准备 总的来说,配置前的准备必不可少,这一步还要仔细小心,准备不充分或有遗漏以及这步的细节疏忽会导致后面的配置出现网卡、磁盘找不到等现象。将会直接导致后面的配置失败。2.3.1.修改.rhosts修改确认每台机器/.rhosts为:host1rootvi /.rhosts host1host1_l2_boot1 host1_l1_boot1 host1_l2_svc host1_l1_svc1 host1_l1_svc2 host1_l2_boot2 host1_l1_boot2 host2host2_l2_boot1 host2_l1_boot1 host2_l2_svc host2_l1_svc1 host2_l1_svc2 host2_l2_boot2 host2_l1_boot2 注意权限修改: chmod 644 /.rhosts 在HACMP 6.1中 为了安全起见,不再使用/.rhosts 文件来控制两台机器之间的命令和数据交换,使用 /usr/es/sbin/cluster/etc/rhosts 文件来代替 /.rhosts 文件的功能。 注意:如果两个节点间的通讯发生了什么问题,可以检查rhosts 文件,或者编辑rhosts文件加入两个节点的网络信息。为方便配置期间检查发现问题,配置期间我们让/.rhosts和HACMP的rhosts一致。 2.3.2.修改/etc/hosts修改确认每台机器/etc/host

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论