




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1, 连接心跳线,注意用8口异步卡 (/dev/tty0),测试通讯。2, 操作系统安装,打好必要的包,;X11.compat;X11.vsm;bos.data。Lslpp I |grep pat3,系统环境设置( 两台机器 )。 # smit system enviroment Change / Show Characteristics of Operating System Maximum number of PROCESSES allowed per user 300 # smit system enviroment Change / Show Number of Licensed Users Maximum number of FIXED licenses 100 4,HACMP 软件安装( 两台机器 )。5,netapp阵列配置NFS。Mount o llock,hard,intr,vers=3,proto=udp nStor-F810-01 /vol/data/datafile1 /data/oradata16,配置网络 # smit tcpip DB_S85_01 DB_S85_02 en0 ( service address) 1 ( boot adderss ) en1 ( standby address) 网关:54# vi /etc/hosts & vi .rhosts DB-S85-01-service DB-S85-01-boot DB-S85-01-standby DB-S85-02-standby1 DB-S85-02-service DB-S85-02-boot7,配置心跳线# smit tty 8, 配置 HACMP# smit hacmp Add a clusterCluster id 1Cluster name cluster1 # smit hacmp Add cluster nodes Node names S85_01 S85_02 # smit hacmp Add an adapter S85_01 S85_02Adapter Label Network Type Network Name Network AttributeAdapter Function Adapter IdentifierAdapter Hard Add Node nameSynchronize同步建文件/cluster/Start_Ora和/cluster/Stop_Orachmod 777 *Ora # smit hacmpAdd Application Server Server Name DB_app Start Script /cluster/Start_Ora Stop Script /cluster/Stop_Ora # smit hacmp Add a Resource Group Resource Group Name DB_resNode Relationship cascadingParticipating Node Name S85_01 S85_02 # smit hacmp Configure Resource for a Resource GroupService IP Label DB_S85_01_service Application Servers DB_app Cascading without Fallback Enabled ture Synchronize 同步9,hacmp自启动/usr/es/sbin/cluster/etc/rc.cluster -R10,HACMP 测试( 两台机器 )启动HACMP # smit clstart 关闭HACMP # smit clstop 监测HACMP # /cluster/hastat用(#tail -f /tmp/hacmp.out)跟踪输出 用(#ifconfig -a)查看 en0、en1的状态,看是否已从 boot 地址切换成service地址 (1)正常启动后,用(#smit clstop)通过 takeover 方式 down掉一个node,查看是否 IP 被另一个node接管,应用是否正常(2)模拟一个node当掉的情况,halt -q查看ip是否被接管,应用是否正常。(3)模拟一个网卡当掉的情况,ifconfig en0 down 查看ip是否被接管,应用是否正常。11, 关于故障检测在HACMP系统的集群中,每个节点通过物理相连的接口(网络接口、心跳线接口、共享磁盘子系统等)定期相互交换KA(Keep Alive)数据包,如在规定时间间隔内没有正常交换KA包,则表明系统可能有故障,需调用相应Script程序进一步确定故障并生成规定的事件。HACMP系统中,KA包的交换频率、故障容忍次数可以在系统配置时设定。12, 主机系统开关hacmp注意事项1 主机开机步骤(1) 首先要求与主机有关的网络设备正常运转;(2) 给与主机相关的外设(如磁带库,光盘库,终端等)加电;(3) 给主机加电;(4) 从主控终端以root身份登录,先用df 命令检查每个文件系统的利用率,对利用率超过90%的文件系统保持警惕,必要时清理不需要保留的文件或扩大文件系统;(5) 检查一下root的mail,看是否有系统的自诊断系统报的错,如有较严重错误,请注意,报告IBM;(6) 上述步骤如执行顺利,请启动hacmp(此步越过,hacmp为自启动);(7) 启动hacmp完成后(出现OK),请等待5分钟,然后检查下列是否正常l service ip 地址是否可用 ifconfig -al 共享卷组和其上的文件系统是否正常激活和安装 df -kl 应用的进程是否全部运行于内存ps ef|grep ora(8) 如以上步骤正常,则开机完成,请退出root登录2主机关机步骤(1)以root身份从主控终端登录(2)以graceful方式停止HACMP,等完成后(出现OK),等待5分钟(3)检查下列是否正常l boot ip 地址是否可用l 共享卷组和其上的文件系统是否卸掉l 应用的进程是否从内存中清除(4)顺利完成上述工作后,执行shutdown -F命令#shudown -F直到屏幕出现halt complete字样,关掉主机和外设的电源至此,关机过程完成hacmp的管理:通常 HACMP 在正常工作情况下很少要求干预 ,但如果出现一些问题 ,应能够通过故障现象 、系统和用户提供的信息 、错误log 以及诊断来确定 ,及时的加以解决 。群集的log 文件含有HACMP在运行中,它的 script 和 daemon 产生的信息 ,一般这些信息是发送到系统控制台和相关的群集log 文件 。对于 HACMP群集的启动/停止 、资源的改变与配置以及群集的监测 ,有多种方法和工具 。(1) 群集的检测 HACMP 提供以下工具去检测群集 : clstat 命令 : HACMP 提供 /usr/sbin/cluster/clstat 命令去监测群集和它的各个部分,可以在字符终端和图形终端上运行,它主要报告cluster 是否 up 、down or unstable , 也报告群集 node 是否 up /down / joining / leaving or reconfiguring 以及 cluster 中 的 number of node . 对于每一个群集 node , clstat 显示 node 中所接的每块网卡的 address 和 IP label , 以及这个接口是否 up or down . Daemon 状态 使用 SMIT Show Cluster Services 去显示 HACMP 的 daemon 的状态 。 Cluster log file HACMP 将它所产生的信息写到 system console 和 若干log 文件 ,因为每一个log文件包含有不同的内容 ,应查看不同的log 文件以确定群集的状态 。 - /var/adm/cluster.log 是一个主要的 HACMP log 文件 ,有关HACMP的错误信息及相关 事件的信息按照它们发生的日期和时间顺序记录在这个 log 文件中 。 - /tmp/hacmp.out 此文件记录 configuration 和 startup scripts 在执行中产生的输出 。这些信息增补和扩展了 /var/adm/cluster.log 文件内的信息 。 - system Error log 包含所有 AIX 子系统及HACMP 的 scripts 和 daemons生成的信息 , Cluster event 是作为 operator messages 记录在 system error log 中 ,此文件也按照它们发生的日期和时间顺序记录的 。 - /usr/sbin/cluster/history/cluster.mmdd 包含由 HACMP scripts 产生的信息 ,每当群集事件发生时,系统产生一个群集 history file ,按照的日期和时间顺序记录的 ,每个文件有一个扩展名- mmdd , mm 表示月 ,dd 表示日 。- /tmp/cm.log 记录由 HACMP clstmgr 活动所产生的信息 。按照它们发生的日期和时间顺序记录的 。这个文件通常是 IBM 支持人员使用的 。- /tmp/cspoc.log 包含由 C-SPOC 命令执行时所产生的信息,这个文件存在于请求 C-SPOC 命令的节点上 。 此文件是按照日期和时间顺序记录的 。 - /tmp/emuhacmp.out 记录由事件模仿文本在执行中产生的输出 。这个文件存在于请求事件模仿的节点上 。可以使用环境变量 EMUL_OUTPUT 为此文件去指定的其它的文件名和位置 ,但所含的内容和格式是相同的 。 - /var/ha/log/grpsvcs. 是一个 ASCII 格式的文件,包含有 grpsvcs daemon执行的过程信息 ,IBM 技术支持人员使用这些信息去排除故障 ,因此请保留此文件 。 - /var/ha/log/topsvcs.是一个 ASCII 格式的文件,包含有 topsvcs daemon执行的过程信息 ,IBM 技术支持人员使用这些信息去排除故障 ,因此请保留此文件 。 - /var/ha/log/grpglsm 包含有 grpglsm daemon执行的过程信息 ,IBM 技术支持人员使用这些信息去排除故障 ,因此请保留此文件 。( 2 ) : HACMP 的 start / stop 启动和停止群集服务涉及到一些 daemons 和 cluster 的初始化文本 。 (一) :HACMP Daemons . clstrmgr - ( Cluster Manager daemon ) 这个 daemon 在 cluster node 之间维护心跳协议 ,监测节点和它们的接口的状态,根据node 或 network 事件请求相应的文本。所有 cluster node 必须运行这个 clstrmgr daemon . . clsmuxpd - ( Cluster SMUX Peer daemon ) 这个 daemon 维护有关 cluster objects 的状态信息 , 这个 daemon与snmpd daemon 一起工作,所有 cluster node 必须运行这个 daemon . clinfo - Cluster Information Program daemon 这个 daemon 提供有关cluster to cluster nodes and client 的状态信息,为了响应群集事件而请求 /usr/sbin/cluster/etc/clinfo.rc文本,在 cluster node and client 上它是可选的 ,但它是运行 clstat utility 的先决条件 。 ( 二 ) 启动 Cluster Services 能够使用 /usr/sbin/cluster/etc/rc.cluster 文本在一节点上去启动 cluster services .,也可以使用 smit screen 去创建和执行这个命令 , rc.cluster文本通过设置变量去初始化HACMP 所要求的环境,同时它还调用 /usr/sbin/cluster/utilities/clstart ( 是一个启动所有 cluster services 的HACMP 文本 ,他通过调用 SRC startsrc 命令去启动指定的子系统 )去启动 HACMP 的 daemon. 也可以在群集中任何节点上执行 C-SPOC 命令 : /usr/sbin/cluster/utilities/cl_rc.cluster 去启动 cluster services ,它调用 rc.cluster 命令顺序地(非并行的)在指定节点上启动cluster services . 它是远程执行的 ,在远程节点上的运行结果返回到源节点 ,因此有一个时间延迟 。 自动启动 cluster services ,能够选择在系统 reboot 时自动启动 cluster services ,在 rc.cluster 命令中加一个 “ -R “ flag ,则 rc.cluster script加一行到 :/etc/inittab 文件中 : 在系统 ROOT 时,引起 AIX 去执行 /usr/sbin/cluster/etc/rc.cluster文本去启动 HACMP 群集服务 。如果群集服务是配置为在boot 时自动启动 ,则在节点故障后重新加入群集时或在维护后节点加入群集之前想测试时将面临一些问题 。如果配置了 IP address 接管 ,则 /usr/sbin/cluster/etc/rc.cluster 调用 /etc/ 文件去配置和启动 TCP / IP 接口并设置被要求的网络选项 ( 三 ):停止 cluster services 可以在群集节点上通过执行 /usr/sbin/cluster/etc/clstop 或 通过 smit screen 去停止 cluster services 及相关的 daemon 。 也可以执行 /usr/sbin/cluster/utilities/cl_clstop 命令去停止cluster services ,它执行一些群集范围内的检查然后调用 clstop 命令顺序地(非并行)在指定节点上停止cluster services , 它是远程执行的 。 cluster stop 的类型 Graceful - 在graceful stop 操作中 ,这个HACMP 软件 Shutdown 它的应用并释放它所占用的资源,群集内其它节点不接管这个被停节点的资源 。 Graceful with Takeover - HACMP 软件 Shutdown 它的应用并释放它所占用的资源 , 群集内的其它节点接管这些资源 。这也被叫做有意识的失效接管 。 Forced - 这种类型中,仅停止 HACMP 的daemon , 不释放任何资源 ,不停止它的应用、umount 它的文件系统和 varyoff 它的共享卷组 。群集内其它节点不接管这个被停节点的资源 。 cluster daemon 的不正常终止 如果系统资源管理器检测到任何 HACMP daemon 不正常终止 ( 没有使用 clstop 命令去 shutdown ) ,它执行 /usr/sbin/cluster/utilities/clexit.rc 文本 去挂起这个系统 。 注意 : 对于 clstrmgr daemon 从来不使用kill -9 命令 ,这将引起 SRC 去运行 /usr/sbin/cluster/utilities/clexit.rc 文本,使 clstrmgr daemon 不正常退出 ,系统马上挂起 。 (3):群集的重新配置 : (一) :群集的拓扑结构浏览群集的拓扑使用 smitty hacmp - cluster configuration - cluster topology show cluster topology 去浏览群集的拓扑结构 。当浏览时,你看到的 ODM 数据是存放在 DCD 中的数据 。改变群集的 ID 或 名字 使用 smitty hacmp cluster configuration cluster topology configure cluster change / show cluster Defintion 去改变群集的 ID 或 名字 。改变群集节点的配置作为 HACMP 的管理员,可以执行 : add / remove 一个节点或改变群集节点的属性 。在操作过程中不需 要为配置资源组成为当前群集的一部分而去停止、重启这个群集服务 。 add 一个节点 : 使用 smit hacmp cluster Configuration cluster topology configure nodes add cluster nodes 去加一个节点 。 remove 一个节点 :使用 smit hacmp cluster Configuration cluster topology configure nodes remove cluster nodes 删去一个节点 。每当在一个节点的 ODM 库中改变了群集的拓扑结构配置后 ,必须在群 集内的所有节点上同步这些配置 。改变网卡的配置add 一块网卡 :使用 smit hacmp cluster configuration cluster topology configure Adapters 去加一块网卡 。remove 一块网卡 :使用 smit hacmp cluster configuration cluster topology configure adapters remove an adapter 删去一块网卡 .改变网卡的特性 :使用 smit hacmp cluster configuration cluster topology configure adapters change / show an adapter 每当在一个节点的 ODM 库中重新配置网卡 ,必须在群集内的所有节点上同步这些配置 。(二) :群集资源的配置 在 HACMP 中 ,可将群集中的每种资源定义为资源组的一部分,这样做可以将有关联的资源聚集在一起,以提供特殊服务,并且也使得资源更容易配置和管理;同时,在资源组中还包括了能够获得这些资源及提供这些资源到客户端的节点列表 。对于已经定义的资源组,可以改变与这个资源组相关的节点及节点的优先级 ,也可以改变或添加资源去重新定义资源组 。重新配置应用服务器 使用 smit hacmp cluster resources define application servers add / remove an application server 附加/删去一个应用服务器 。 使用 smit hacmp cluster resources define application servers change / show an application server 改变一个应用服务器 。添加、改变、移动群集资源组和资源 在一个活动的群集内 ,可以添加、改变、移动群集资源组和资源 ,不需要为配置资源组成为当前群集的一部分而去停止、重启这个群集服务 。 可以使用下面的 SMIT 命令去完成添加、改变、移动等工作 : smit cm_add_grp - 添加一个集资源组 。 smit cm_add_res - 改变一个群集资源组。 Smit cm_add_res - 移动一个群集资源组 。 Smit cm_cfg_res.select - 改变一个群集资源组的资源 。 每当在一个节点的 ODM 库中改变了群集资源的配置后 ,必须在群集内的所有节点上同步这些资源 。(4) :系统参数 (一): I / O pacing 每当系统内有其它应用在做大量的 I /O操作时,用户可能会碰到如交
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 飞机型架装配工安全规范考核试卷及答案
- 信用分析师三级安全教育(班组级)考核试卷及答案
- 会展服务师三级安全教育(班组级)考核试卷及答案
- 船舶泥工上岗考核试卷及答案
- 建筑铝模系统创新创业项目商业计划书
- 手写笔记电子化与同步工具创新创业项目商业计划书
- 海藻制碘工专项考核试卷及答案
- 政务信用评价与监管创新创业项目商业计划书
- 读书会文艺主题集锦
- 固井工专项考核试卷及答案
- 2024八年级数学上册第12章一次函数12.1函数第1课时上课课件新版沪科版
- 义务教育法主题班会课件
- 2024年秋新译林版英语三年级上册 Unit 3第1课时 Cartoon time 教学课件
- 全国计算机等级考试一级历年考试真题试题库(含答案)
- 研学旅行合同
- 《大学生美育》 课件 第七章 艺术美
- 产业组织理论
- 租房转让协议书
- 《智慧农业关键技术与装备》课件-第09章 农业信息传输技术概述
- 艺术设计学专业导论
- 2024年国家电投集团黄河上游水电开发有限责任公司招聘笔试参考题库含答案解析
评论
0/150
提交评论