Skybility HA 双机安装配置指导手册_第1页
Skybility HA 双机安装配置指导手册_第2页
Skybility HA 双机安装配置指导手册_第3页
Skybility HA 双机安装配置指导手册_第4页
Skybility HA 双机安装配置指导手册_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Skybility HA 双机安装配置指导手册双机安装配置指导手册编者:胡硕文审核:谢洪宽中兴通讯固网重庆用服部中兴通讯固网重庆用服部修改记录修改记录文档编号版本号拟制人/修改人审核人拟制/修改日期更改理由主要更改内容(写要点即可)无V1.00胡硕文谢洪宽2009-10-2809 年专题文档初稿生成目目 录录第第 1 章章 概述概述 .- 1 -1.1 编写目的.- 1 -1.2 内容说明.- 1 -1.3 适用范围及对象.- 1 -1.4 术语和缩写.- 1 -1.5 符号及标识约定.- 2 -第第 2 章章 SKYBILITY HA 安装流程安装流程.- 3 -2.1 安装流程图.- 3

2、-2.2 流程说明.- 4 -第第 3 章章 结构与原理结构与原理 .- 5 -3.1 集群软件简介.- 5 - 集群的定义.- 5 -软件中的常用术语.- 6 -3.2 SKYBILITY HA SERVICE简介.- 6 -3.3 SKYBILITY HA SERVICE的工作原理和特点.- 7 -的工作原理.- 7 -的工作特点.- 8 -3.4 SKYBILITY HA SERVICE 的功能模块介绍.- 12 -第第 4 章章 安装前准备安装前准备 .- 13 -4.1 硬件准备.- 13 -4.2 软件准备.- 15 -4.3 配置环境.- 15 - 配置 Bonding(推荐).

3、- 15 - 交叉网线的制作.- 16 -第第 5 章章 安装安装 SKYBILITY HA.- 17 -5.1 安装 SKYBILITY HA SERVICE.- 17 -5.2 SKYBILITY HA SERVICE命令简介.- 19 -第第 6 章章 SKYBILITY HA 系统配置系统配置.- 21 -6.1 SKYBILITY HA SERVICE简要配置步骤.- 21 -6.2 SKYBILITY HA SERVICE配置详解.- 21 - 配置前准备.- 21 - 启动配置客户端.- 23 - 配置流程 .- 23 -第第 7 章章 SKYBILITY HA 服务配置服务配置

4、.- 28 -7.1 配置服务信息.- 28 -7.2 网络资源配置.- 30 - 添加网络资源.- 30 - 删除网络资源.- 31 - 修改网络资源.- 31 -7.3 存储资源的配置.- 31 - 添加存储资源.- 31 - 删除存储资源.- 32 - 修改存储资源.- 32 -7.4 删除服务.- 32 -7.5 修改服务.- 32 -7.6 更改服务状态.- 32 -7.7 查看服务状态.- 32 -7.8 修改 HA 进程参数.- 33 -7.9 锁定配置界面.- 34 -7.10 日志处理.- 34 -第第 8 章章 配置实例配置实例 .- 35 -8.1 系统规划.- 35 -

5、8.2 系统配置.- 35 -附录附录 A 系统配置文件描述和手工配制方法系统配置文件描述和手工配制方法.- 40 -附录附录 B 常见问题的处理常见问题的处理.- 44 -附录附录 C FAQ.- 48 -第第 1 章章 概述概述 摘要摘要本手册编写的主要目的是提供一份 Skybility HA 的安装和使用说明文档,供开局和维护使用。1.1 编写目的编写目的本教材介绍了 Skybility HA 软件的安装配置和使用方法,以及一些常见问题的处理方法。Skybility HA是基于 SuSE Linux 的高可用性集群软件。1.2 内容说明内容说明本手册主要内容:第 1 章 概述 详细介绍了

6、编写目的、使用范围对象、术语、符合约定等;第 2 章 安装流程 介绍了 Skybility HA 软件安装的流程和流程说明;第 3 章 结构与原理 详细介绍了 Skybility HA 系统的结构与原理等基础知识; 第 4 章 安装前主备 介绍了 Skybility HA 系统配置所必要的软硬件要求;第 5 章 安装 Skybility HA 详细介绍了软件的安装步骤、license 申请方法;第 6 章 Skybility HA 系统配置 详细介绍了 Skybility HA 系统配置的步骤和方法;第 7 章 Skybility HA 服务配置 详细介绍了 Skybility HA 服务配置

7、的步骤和方法;第 8 章 配置实例 举例说明了 Skybility HA 系统配置的步骤和方法;附录 A 系统配置文件描述和手工配制方法;附录 B 常见问题的处理;附录 C FAQ。1.3 适用适用范围及对象范围及对象本手册适用范围为 Skybility HA 软件的安装及配置,适合工程技术人员、中兴系统工程师和其他管理人员阅读。1.4 术语和缩写术语和缩写NIC - 网卡Cluster - 双机软件Server 应用程序服务器1.5 符号及标识约定符号及标识约定介绍符号的约定、键盘操作约定、鼠标操作约定以及四类标志。1符号约定带尖括号“ ”表示键名、按钮名以及操作员从终端输入的信息;带方括号

8、“ ”表示人机界面、菜单条、数据表和字段名等,多级菜单用“”隔开。如文件新建文件夹多级菜单表示文件菜单下的新建子菜单下的文件夹菜单项。2 键盘操作约定表 1.5-1 键盘操作约定格式意义加尖括号的字符表示键名、按钮名。如Enter、Tab、Backspace、a等分别表示回车、制表、退格、小写字母 a键 1+键 2表示在键盘上同时按下几个键。如Ctrl+Alt+A表示同时按下“Ctrl”、“Alt”、“A”这三个键键 1,键 2表示先按第一键,释放,再按第二键。如Alt,F表示先按Alt键,释放后,紧接着再按F键3鼠标操作约定表 1.5-2 鼠标操作约定格式意义单击快速按下并释放鼠标的左键双击

9、连续两次快速按下并释放鼠标的左键右击快速按下并释放鼠标的右键拖动按住鼠标的左键不放,移动鼠标4标志本书采用三个醒目标志来表示在操作过程中应该特别注意的地方。注意、说明、提示:提醒操作中应注意的事项。注意: 提醒操作中应注意的事项。第第 2 章章 Skybility HA 安装流程安装流程2.1 安装流程图安装流程图应用配置安装软件介质安装准备准备按照产品清单确认产品齐备根据硬件需求列表确认安装环境确认系统拓扑 和相关参数配置Bonding准备心跳链路准备串口线配置节点名与uname n结果保持一致配置IP网络确认使用的文件系统类型结束申请license光盘介质安装结束开始双机系统配置开始双机应

10、用服务配置集群状态监控结束配置是否正确是否修改配置图 2.1-1 配置流程图2.2 流程说明流程说明Skybility HA 的安装全过程包括了 Skybility HA 的安装准备、软件介质安装、软件配置和状态监控、集群维护方法。相关操作系统的安装配置和磁阵管理配置知识,请参考操作系统的安装维护手册,本手册将不再赘述。第第 3 章章 结构与原理结构与原理3.1 集群软件简介集群软件简介3.1.1 集群的定义集群的定义集群可以定义为:一种由互联的计算机组成的并行或分布式系统,可以作为单独、统一的计算资源来使用。集群中的计算机节点可以是一个单处理器或多处理器系统,拥有内存、I/O 设备和操作系统

11、。下面是典型的集群系统体系结构图:通讯网络普通计算机网络接口普通计算机网络接口普通计算机网络接口集群中间件(单一映象系统和可用性基础)应用程序图-1 集群系统体系结构图集群包括下列重要部件:多个节点计算机(PC、工作站或 SMP)节点计算机操作系统通讯网络(如以太网)网络接口卡集群中间件(单一映象系统(SSI)和系统可用基础)应用程序使用集群技术,用户能够以较低的成本,改进和提高计算机的处理能力。集群系统具备较好的可扩展性,用户可以在保留现有投资、不增加过多投资的情况下,提高计算机系统的计算能力。由于软件的可扩展性支持,能够同时提高应用程序的性能。故障恢复能力,是集群技术的另一个优点,备份计算

12、机能够将属于同一集群系统的任何任务接管过来。一般的,根据应用目的的不同,集群可以分为下列三类。负载均衡集群(Loading Balance Cluster) 。高可用集群(High Availability Cluster) 。高性能计算集群 (High Performance Computing)以上三类集群软件目的都是提供一致和统一的计算机处理能力,但是表现方式和侧重点各有不同。高性能计算机群主要用于科学计算,这里我们不再赘述。负载均衡集群主要侧重于充分利用集群中每个节点计算机的计算能力;而高可用性集群则侧重于集群能提供 7*24 小时的服务运行保障。高可用性集群软件主要是解决下列三个问题

13、:服务器硬件故障应用程序的软件故障或者负载过大管理员做应用备份中的误操作3.1.2 HA 软件中的常用术语软件中的常用术语 集群:一组相互独立的计算机为了提供更好的可用性和性能而组成的并行或分布式系统,可以作为单独、统一的计算资源来使用 节点:能提供处理资源且能运行应用软件的主机 服务:在节点上运行的应用 节点故障:由于系统硬件、软件原因或误操作而导致节点宕机的故障 服务故障:由服务使用的网络资源或存储资源引起的而导致服务不能正常运行的故障 切换:一个故障节点上的应用服务被一个备份节点接管3.2 Skybility HA Service 简介简介Skybility HA Service 属于高

14、可用性集群软件。Skybility HA Service V1.2 是基于 Linux 的高可用性集群解决方案,能够保障企业的关键应用提供 247 的服务。通过 Skybility HA Service,您可以构建一个两节点的集群系统,于是,集群中的任一个节点就成为另一个节点的“热备份” ,同时,每个节点又都能用作正常的Linux 服务器。在一个典型的配置中,Skybility HA Service 集群的硬件由两台连网的服务器。在系统运行过程中,服务器之间通过客户网络或独享网络(可选配) 、RS232 连线(可选配)不断使用心跳机制相互监测,当发现其中一个节点由于某种原因发生故障时,无论软、

15、硬件故障,另一个节点将接替故障节点的工作,从 IP 地址资源,存储资源到应用程序,从而保障了整个系统的高可用性。同时,Skybility HA Service 支持冗余的心跳路径和网络通讯路径,来保证故障检测和消息传递更安全可靠。Skybility HA Service 支持 Linux 下所有常用服务的双机方案,从单纯的网络服务如 LVS,到 Web Server和 Linux 下主流的数据库软件,Skybility HA Service 都能提供灵活的服务保护策略,包括对于故障服务的本地恢复和切换到备份节点。Skybility HA Service 支持 Active-Active 和 A

16、ctive-Standby 等多种服务保护方式,能满足用户的多种要求。同时 Skybility HA Service 支持大多数常用的网络环境和存储环境。他支持多网卡备份和负载均衡,使得服务器能持续,高性能的提供网络服务;另外,Skybility HA Service 支持大多数常用的存储设备,包括基于 SCSI 磁盘阵列柜,SAN, NAS,并内置了一些特殊存储设备(比如 IBM Exp300 系列磁盘阵列柜)的支持,同时支持多种日志文件系统和 RAW 文件系统,能满足所有高端用户和低端用户对存储的需求。Skybility HA Service 提供了多个应用程序代理,如 Oracle、Sy

17、base、IBM DB2 等,提供了对常用应用程序更好的支持。当然,您也可以通过 Skybility HA Service 的 Application Agent API 来定制自己的应用程序代理。Skybility HA Service 提供更丰富的配置模板,方便用户配置,避免因为配置错误带来的问题。另外Skybility HA Service 还提供开放的用户预警平台,用户可以自己定制或采用我们提供的解决方案来使用服务故障时的报警机制。对于系统的安装和配置工作,Skybility HA Service 在设计时就充分考虑到了易用性。从本地应用程序到远程浏览器的 applet 的基于 jav

18、a2 的图形化的配置界面,系统管理员可以根据喜好自由选择。同时,所有的系统监测和控制都可以远程进行,能够适应各种复杂环境。另外 Skybility HA Service 的可以在本地生成配置文件,然后拷贝到远程服务器上,就能实现服务器节点信息的配置,极大的方便了用户大规模的应用部署。3.3 Skybility HA Service 的工作原理和特点的工作原理和特点3.3.1 Skybility HA Service 的工作原理的工作原理不间断的提供有效、准确的服务是高可用性集群软件的设计目标。在保证用户数据完整性的前提下,当系统或服务失效时,及时的将服务切换到正常节点,同时采取必要措施,帮助失

19、败节点能够恢复正常。这都是 Skybility HA Service 所能提供的功能。常见的 Skybility HA Service 的硬件配置如下图所示:图-1 硬件配置在上图中,两台服务器通过内部网络(交叉线)和外部网络相连,共享一个存储设备。在任何一个时刻,被监控的服务只运行在其中一个节点上,采用虚拟的 IP 地址对外提供网络服务,将数据存放在共享磁盘上。当服务或者运行服务的节点出现故障的时候,备份的服务器将在故障服务的资源完全释放掉的情况下启动该服务,并使用相同的虚拟 IP 和存放在共享磁盘上的数据。这样保证用户在使用该虚拟 IP 访问该服务的时,不会因为服务的中断而造成数据的丢失。

20、一个简单的示例:我们使用 Skybility HA Service 提供一个 Apache 的服务,然后使用客户端下载。可以发现在 apache 服务出现故障时(kill apache 服务的进程,拔掉网线,重起服务器等),下载在中断几秒钟后,会继续执行。图-2 Skybility HA Service 运行示例图3.3.2 Skybility HA 的工作特点的工作特点 主机与服务主机与服务Skybility HA Service 设计为双节点集群系统,集群软件同时运行在两台主机上。对于主机上服务的配置,根据用户的需要,可以是一台主机提供服务,另一台主机待命的“主动被动”模式,

21、也可以是两台主机同时提供不同服务,并且互为备份的“主动主动”模式。如果用户有两台同样高配置的服务器,并希望提供两种或两种以上的服务,则可以采用“主动主动”模式以提高系统利用率;如果用户有一台高配置的服务器和一台较低配置的服务器,希望建立高可用性服务,则可以采用“主动被动”模式,并把服务配置成“回切”型。在任意时刻,两台主机可以同时对外提供总和多达十几种的高可用性服务。当一个服务发生故障切换时,不会影响到其他服务的正常运行。Service AService ANode ANode BHeartbeatShared Storage图.1-1 主动被动模式

22、图.1-2 主动主动模式 故障监测故障监测Skybility HA Service 对于主机系统级的故障,两台主机间通讯的故障和所提供服务的故障都能进行准确的实时监测。1)系统和通讯监测任何操作系统,都有出现死机或系统挂起的可能。系统挂起和死机不同,系统挂起时对用户的输入不再有响应,好像被锁住一样,在有些情况下,系统挂起一段时间后,有可能重又继续工作。Skybility HA Service 可以准确的检测到一台主机系统挂起或死机的发生,并把服务切换到正常工作的主机上。Service BService BNode ANode BHear

23、tbeatService AService AShared Storage为了监测对等主机的状态,Skybility HA Service 集群在两台主机之间可以建立两种方式的任意多条连接通路,这也被称为“心跳” (Heartbeat) 。 “心跳”方式有 UDP/IP 连接和串行线连接两种。可以使用多块网卡,在两台主机间建立多条点对点的 UDP/IP 连接。如有多个串行口,则可以建立多条串行连接。同时,Skybility HA Service 还可以设置仲裁节点(Tie breaker),来保证在心跳中断情况下准确判断故障点。使用两种方式的多条连接

24、,也就是利用冗余的硬件,提高主机间通讯的可靠性。只有当所有心跳通路全部失败时,才认为两主机在通讯上失效,此时 Skybility HA Service 会采取及时有效的应对措施。2)服务检测Skybility HA Service 对于服务的状态也会定时进行监测,监测的时间间隔可由用户指定。Skybility HA Service 提供一个“通用应用程序代理” ,可以对各种服务进行一般性的监测。对于常用类型的服务,还有相应的“应用程序代理”可以实现具有针对性的服务监测功能。用户也可以自行编写应用程序代理,以满足特殊的需要。Skybility HA Service 还对服务所使用的资源(包括存储

25、资源和网络资源)进行准确的检测,通过底层的网卡数据流量的检测,Skybility HA Service 可以准确地获得网卡的连接状态,为服务的切换提供准确的参考。 故障的处理和服务的切换故障的处理和服务的切换通过的准确的故障监测手段,Skybility HA Service 能够准确智能的处理各种故障,以保护服务的不间断运行。1)节点故障的处理当 Skybility HA Service 中的节点 A 通过心跳发现节点 B 发生了故障,A 会通过网络或者电子开关的STONITH(Shoot the other node in the head)的机制将 B 重起或者脱离集群。同时

26、节点 B 也通过硬件级或系统级的 watchdog 机制,在系统崩溃时快速重起,从而能更好的释放服务占用的资源,以便节点 A 接管服务,并保障数据的完整性。2)服务故障的处理Skybility HA Service 通过应用程序代理和内置的服务资源监控策略,能准确地检测服务的故障。同时,用户可以自定义服务检测的间隔,避免频繁的服务检测带来的服务性能的损失。而且服务检测有一定的冗余度,避免某次突发的检测故障带来服务的误切换。当节点 A 检测到应用程序自身的故障时,A 会先检测节点 B 的状态,如果 B 上的 HA 没有启动或者 B上服务的启动条件不具备(比如提供网络服务的网络接口断开)时,A 将

27、在本地恢复服务;如果 B 的节点状态正常且服务启动条件具备的时候 A 将服务切换到节点 B 上。当节点 A 检测到应用程序所使用网络出现故障时,A 会先检测节点 B 的状态,如果 B 上的 HA 没有启动或者 B 上服务的启动条件不具备(比如提供网络服务的网络接口 s 断开)时,A 对服务不做处理,并通过 emerge 的日志在控制台报警;如果 B 的节点状态正常且服务启动条件具备的时候 A 将服务切换到节点B 上。3)故障处理的日志和报警机制Skybility HA Service 通过系统的 syslog 接口来提供日志,您可以在/var/log/ha 中查看 HA 在运行中产生的日志。而

28、且可以通过管理控制台修改记录日志的级别,使得用户能查看更进一步的日志信息,方便问题的发现和系统的诊断。同时,利用系统的 logrotate 工具,可以将日志自动的备份和清除,避免造成系统日志过多导致磁盘资源耗尽。另外,Skybility HA Service 还预留用户报警的接口,用户可以自己添加在当有 emergency 日志时的报警事件,比如通过 mail,短信或者警报等手段来通知管理员。 一般故障场景的处理一般故障场景的处理系统软、硬件故障的处理应用场景 1A,B 两台服务器正常运行,服务运行在 A 上,在 A 上执行 reboot 命令预期现象服务在 B 上启动,A 重起

29、后作为备机运行应用场景 2A,B 两台服务器正常运行,服务运行在 A 上,将 A 机掉电重起预期现象服务在 B 上启动,A 重起后作为备机运行应用场景 3A,B 两台服务器正常运行,服务运行在 A 上,手工停掉 A 上的 HA 进程预期现象服务在 B 上启动网络故障应用场景 4A,B 两台服务器正常运行,服务运行在 A 上,手工拔掉服务使用的网线预期现象服务在 B 上启动应用场景 5A,B 两台服务器正常运行,服务运行在 A 上,手工拔掉 A,B 上该服务使用的网线,然后插上 B 的网线。预期现象在 B 的网线插上之前,服务状态不改变,但是控制台有警告信息。当 B 的网线插上之后,服务切换到

30、B 机上。应用场景 6A,B 两台服务器正常运行,服务运行在 A 上,手工拔掉 A 机上所有的心跳线预期现象服务在 B 上启动,同时 A 重起应用场景 7A,B 两台服务器正常运行,服务运行在 A 上,手工拔掉 A B 机上所有的心跳线预期现象这时候 A,B 同时重起,重起后状态都为 NODE_DOWN存储设备故障应用场景 8A,B 两台服务器正常运行,服务运行在 A 上,手工中断 A 机到存储的连接预期现象服务在 B 上启动应用场景 9A,B 两台服务器正常运行,服务运行在 A 上,手工中断 A,B 机到存储的连接预期现象服务状态没有变化,但控制台有报警信息应用系统故障应用场景 10A,B

31、两台服务器正常运行,服务运行在 A 上,手工杀死 A 机上服务的进程预期现象服务在 B 机上启动应用场景 11A,B 两台服务器正常运行,服务运行在 A 上,服务配置的优先节点为 A,并设定 auto failback 的选项。重起 A 服务器预期现象服务在 B 机上启动,当 A 重起完成后,服务回切到 A 上3.4 Skybility HA Service 的功能模块介绍的功能模块介绍Skybility HA Service 包括两个 rpm 格式的软件包。ha-hainterface-第第 4 章章 安装前准备安装前准备 4.1 硬件准备硬件准备为了实现集群系统的最大可用性,在保证我们 S

32、kybility HA Service 能实现快速准确的服务切换的同时,我们还需要尽量保证单个节点运行服务的可靠性。为了使 Skybility HA Service 能实现快速准确的服务切换,我们需要为两个节点的 HA 提供冗余的心跳和通讯路径;为了使单个节点运行服务的可靠性更高,我们需要在以下方面采取措施:服务器电源:应该采用冗余电源和 UPS 系统保证服务器持续不间断供电网络:应该采用冗余网络和冗余交换机才提供对外的网络服务,如下图switch2switch1interlinkNet link 2Net link 1Net link 1Net link2图 4.1-1 物理连接图存储:应该

33、采用 RAID 技术保证存储数据的可靠性,同时使用冗余 HBA 卡和共享存储设备的不同控制器相连来保证服务器到存储之间的连接更可靠。如下图所示(以 IBM FastT600 为例)图 4.1-2 网络连接图以上方案,集群使用者可以根据需要和项目预算来综合选择。综上所述,我们推荐下列两种硬件连接方式(注,以下连接方式着重描述网络连接,存储连接可参照上述讨论):方式一:冗余心跳,带仲裁节点交换机网线网线服务器A服务器B12 U共享存储直连线参考节点图 4.1-3 硬件连接方案一这种方式是 Skybility HA Service 最常用的连接方式,其中直连线也可以使用连接另一个交换机的网络代替。连

34、接在交换机上的网线负责提供对外的网络服务,同时提供 HA 的心跳和通讯路径;而直连线负责做 HA 专门的心跳和通讯路径。同时提供一个参考节点,该参考节点必须保证服务器 A 和服务器 B 通过交换机都能够访问到(能够 ping 通)。这样既兼顾了成本,又能使 HA 具有较高可靠性,能处理绝大多数故障情况。方式二:冗余专用心跳,不带仲裁节点交换机网线网线直连线服务器A服务器B12 U共享存储直连线网线网线图 4.1-4 硬件连接方案二这种方式是具有较高可用性的一种解决方案,他使用专门的两条直连线作为 HA 心跳和通讯链路;同时使用冗余的两条网络通道来对外提供网络服务。这在对网络可靠性要求高的场合里

35、经常使用到。但是不设置仲裁节点会导致如果两条直连线全部中断时,可能会导致集群中节点无法继续控制对方节点上的服务状态。4.2 软件准备软件准备为了保证单个节点的稳定性,选择健壮可靠的操作系统也很重要。我们推荐使用 SuSE Linux Enterprise Server 8/9。另外 Skybility HA Service 运行时依赖两个包:libxml2:xml2 的解析库java2-jre:java 的运行环境库请确保这两个包已经被安装到系统上,可以使用下列方式确认: rpm -q libxml2libxml2-117 rpm -q java2-jrejava2-jre-524注:SLES

36、8/SLES9 带了多个 java 运行环境,安装其中任何一个都可以。4.3 配置环境配置环境 4.3.1 配置配置 Bonding( (推荐推荐) ) Bonding 可通过多种方式将多条网络链路汇集(Aggregate)为单条链路,使其具有相同的 IP 地址, 为 Linux系统在网络链路层提供高可用性(High Availability)和负载均衡(Load Balancing)能力。 下面简单介绍一下在SLES9 上配置 Bonding 的方法,详细过程可以参考固网重庆用服部专题文档服务器双网双平台配置指导手册.doc 。(1)配置 slave 设备。在 SLES9 上,通过运行 ya

37、st2 生成网卡配置文件 ifcfg-eth-id-xx:xx:xx:xx:xx:xx:xx,其中 xx 将被设备的 MAC 地址所代替。修改要绑定的两块网卡的配置文件,修改后该文件的内容大致如下: #vi /etc/sysconfig/network/ifcfg-eth-id-xx:xx:xx:xx:xx:xx BOOTPROTO=none STARTMODE=off USERCTL=no UNIQUE=Xnzu,WeZGOGF+4wE _nm_name=bus-pci-0001:61:01.0 其中 UNIQUE 和_nm_name 项保留原来的值。 (2)创建 bond 配置文件。创建文

38、件名为/etc/sysconfig/network/ifcfg-bond0。ifcfg-bond0 文件内容如下: BOOTPROTO=static BROADCAST=55 IPADDR=0 NETMASK= NETWORK= REMOTE_IPADDR= STARTMODE=onboot BONDING_MASTER=yes BONDING_MODULE_OPTS=mode=active-backup miimon=100 BONDING_SLAVE0=eth0 BONDING_SLAVE1=eth1 其

39、中 BROADCAST,IPADDR,NETMASK,NETWORK,BONDING_SLAVE0 和 BONDING_SLAVE1项根据具体网络修改。(3)重启网络,进行测试。 #/etc/init.d/network restart 4.3.2 交叉网线的制作交叉网线的制作 交叉网线主要作为两节点之间的心跳链路。在线序上一端使用 568B 制作,另外一端使用 568A 制作。 568B 标准:橙白橙绿白蓝蓝白绿棕白棕 568A 标准:绿白绿橙白蓝蓝白橙棕白棕 第第 5 章章 安装安装 Skybility HA5.1 安装安装 Skybility HA Service 插入 Skybilit

40、y HA Service 1.2 安装光盘,以 root 用户登录,然后执行:#cd /media/dvd# ./install.shInstalling SkyBility HA software.# Begin of S K Y B I L I T Y HA Installer #Would you check java package? (C)ontinue/(S)kip/(Q)uit? c cChecking java package doneEnter the full pathname of the local source directory: /media/dvd:Curren

41、t directory is /media/dvdPreparing. # 100% 1:ha #done100%Preparing. # 100% 1:hainterface #done100%Would you install HA Solution? (C)ontinue/(S)kip/(Q)uit? c c./doc/sample/db2 done./doc/sample/informix done./doc/sample/ora.cf done./doc/sample/oracle done./doc/sample/ora.env done./doc/sample/sybase do

42、ne./doc/sample/websphere doneInstallation Completed!# End of S K Y B I L I T Y HA Installer #安装完成后,您可以使用rpm q harpm q hainterface来验证是否安装成功。安装成功后,还需要去下载正式或者测试用 license。如果下载正式的 license,你需要提供软件包装盒中提供的 Register id,和运行软件服务器的网卡 MAC 地址来获得正式的 license。获取服务器网卡地址的方法如下,以 root 登陆,然后运行# ifconfigeth0 Link encap:Et

43、hernet HWaddr 00:02:55:1E:35:3B inet6 addr: fe80:202:55ff:fe1e:353b/64 Scope:Link UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 RX packets:3368524 errors:0 dropped:0 overruns:0 frame:0 TX packets:2878962 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:100 RX bytes:1046514468 (998.

44、0 Mb) TX bytes:3251176638 (3100.5 Mb) Interrupt:11 Base address:0 xe800 Memory:d8020000-d8020038lo Link encap:Local Loopback inet6 addr: :1/128 Scope:Host UP LOOPBACK RUNNING MTU:16436 Metric:1 RX packets:757208 errors:0 dropped:0 overruns:0 frame:0 TX packets:757208 errors:0 dropped:0 overruns:0 ca

45、rrier:0 collisions:0 txqueuelen:0 RX bytes:3111888575 (2967.7 Mb) TX bytes:3111888575 (2967.7 Mb)其中“00:02:55:1E:35:3B”即为网卡 MAC 地址。注意:如果服务器有多块网卡,取任意一块网卡的 MAC 地址即可。将申请到的 license.txt 分别放到两台服务器上的/opt/ha/lic 下。5.2 Skybility HA Service 命令简介命令简介所有 ha 使用的命令位于/opt/ha/bin 下,下面介绍 HA 常用命令的用法:hadaemons作用:启动停止 ha

46、 进程用法:hadaemons start|stop|waitstop|status详细介绍:start: 启动 ha 进程stop:后台停止 ha 进程waitstop:停止 ha 进程,并等待其退出status:显示 ha 进程状态HA 进程包括两个 hacomm, hacenter。其中 hacomm 负责执行两个节点的心跳和通讯,hacenter 负责执行服务的切换策略。hacenter 由 hacomm 负责启动。haservice作用:启动,停止和检测 ha 所配置的服务用法:haservice start|stop|status service_id详细介绍:start: 启动

47、service_id 代表的服务stop:停止 service_id 代表的服务status:检测 service_id 代表的服务haGUIServer作用:启动,停止 ha 配置服务器用法:haGUIServer start|stop|status详细描述:start:启动 ha 配置服务器stop:停止 ha 配置服务器status:显示 ha 配置服务器状态haGUIClient作用:启动 ha 配置客户端用法:haGUIClient详细描述:haGUIClient 用户启动 ha 的基于 java 图形配置客户端hastat作用:显示 ha 进程,心跳和服务状态用法:hastat -

48、n -a -i interval详细描述:hastat 用于显示 ha 服务器,心跳和服务状态。-n 表示显示为 compact string-a 表示也显示所有节点上服务的状态。-i interval: 表示持续显示状态并每隔 interval 妙刷新一次状态haconf作用:HA 配置信息工具用法:haconf -f config -n key详细描述:-f config 指定 ha 配置文件,如果不指定,则缺省为/opt/ha/conf/cluster.xml-n 通知 ha 进程配置文件改变key 读取配置工具中的 value 对应的键值hasvcadmin作用:HA 服务管理工具用法

49、:hasvcadmin -s|-service service_id -n | -node nodeid -start |-stop |-relocate 详细描述:-s|-service: 指定需要操作的服务的 id-n|-node nodeid:指定需要操作的节点的 id,如果不指定,则缺省为服务所运行的节点或者本地节点(服务停止时)-start |-stop |-relocate: 启动、停止、切换服务haadmin作用:HA 进程管理工具用法:haadmin s -wp 详细描述:-s:停止 ha 进程-p:停止 hacomm,如果不指定,则停止 hacenter-w:等待进程退出第第

50、 6 章章 Skybility HA 系统配置系统配置6.1 Skybility HA Service 简要配置步骤简要配置步骤配置网络和域名设置配置服务器认证帐户启动配置服务器/客户端登陆到需要配置的服务器上添加服务器配置服务器心跳启动服务器部署服务编写服务脚本测试启动脚本添加服务启动服务成功6.2 Skybility HA Service 配置详解配置详解6.2.1 配置前准备配置前准备1)配置网络和域名修改/etc/hosts,将 hostname 唯一对应到指定的 IP 上,删除其他对应到 hostname 上的 IP,如下例所示:vi /etc/hosts# hosts This f

51、ile describes a number of hostname-to-address# mappings for the TCP/IP subsystem. It is mostly# used at boot time, when no name servers are running.# On small systems, this file can be used instead of a# named name server.# Syntax:# IP-Address Full-Qualified-Hostname Short-Hostname# special IPv6 add

52、resses:1 localhost ipv6-localhost ipv6-loopbackfe00:0 ipv6-localnetff00:0 ipv6-mcastprefixff02:1 ipv6-allnodesff02:2 ipv6-allroutersff02:3 ipv6-allhosts node1 node02)为配置服务器提供认证信息# /opt/ha/bin/hapasswdPlease input administrator name:rootPlease input the password:3)启动配置服务器#/opt/ha/bin/haGUIServer star

53、t注意,以上步骤在两台服务器上都需要进行,并且两台服务器配置服务器的认证用户名和密码必须一致。/etc/hosts 的内容也必须一致6.2.2 启动配置客户端启动配置客户端客户端可以运行在各种平台上(Windows, Linux, Unix 等) ,支持远程配置。同时您还可以使用浏览器用 applet 的方式来使用该配置工具。运行配置工具之前的准备:(一)请确认在您运行该配置工具的机器和需要配置的服务器上正确的安装和配置了 java 运行环境(jre)或者 java 开发环境(jdk)。版本应该在以上。(二)在要配置服务器上正确的安装了 Skybility HA Service 1.2 的软件

54、包,包括 ha-(三)在要配置的服务器上运行了配置工具的 server 端,如果没有,你可以运行 /opt/ha/bin/haGUIServer start。(四)为了保护您系统的安全性,你需要为配置工具提供用户认证的配置文件,具体的方法请参考配置用户认证文件。(五)该配置工具支持 i18n 标准,您可以修改系统的字符集来选择使用中文界面或者英文界面。具体的修改方法请参考系统手册 (六)如果您使用浏览器来进行配置,请确认您的浏览器支持 java applet。你可以在 windows,linux 或支持 java 的浏览器端来使用配置 HA,操作分别如下:(一) windows 下,双击 ha

55、admin.exe,即可(二) linux 下,输入命令/opt/ha/bin/haGUIClient 即可(三) 在浏览器下, 输入 http:/your_ha_server_ip:8089 ,然后选择接受证书即可。6.2.3 配置流程配置流程您需要遵照以下流程来配置 HA 服务器:登陆服务器,请参照登陆界面一章添加第一台服务器,请参照添加第一台服务器一章添加第二台服务器,请参照添加第二台服务器一章添加服务器之间的心跳路径,请参照添加心跳路径一章添加服务,请参照添加服务一章启动 HA 服务器,请参照启动停止服务器一章1)登陆界面登陆界面输入服务器的名称或者是 IP 地址,用户名和密码后按“确

56、定”按钮。2)服务器配置服务器配置(一)添加第一台服务器登录成功后会显示如图界面.你可以通过依次选择”工具(Tools)”,”服务器(Server)”,”添加服务器(Add Server)”,来添加服务器,也可以单击工具栏上的添加服务器图标来进行添加,添加服务器的界面如图所示:配置界面的每一项的详细说明如下:服务器名(Server Name):你所添加的服务器的名称或者是 IP 地址.参考 IP(Tie Breaker):HA 需要提供一个参考 IP 来判断自己是否处在网络连通状态。这里您需要输入一个一直能够 ping 通的ip 或者主机名;如果您选择空白,HA 在网络故障的时候,将不会切换服

57、务。Watchdog 驱动模块(Watchdog Driver):在不提供 STONITH(Shoot The Other Node In The Head)设备的情况下,HA 在系统宕机的情况下可能不能释放所启动服务使用的资源,导致切换发生错误。这时需要使用 Watchdog 来保证 HA 在系统宕及时能及时重起系统来释放所有共享的资源,从而保证服务正确的切换。请咨询您的服务器提供厂商来获得系统的watchdog 信息和驱动程序。如果您的服务器不提供硬件的 watchdog 或者该 watchdog 在 linux 下没有合适的驱动程序的话,您可以选择 kernel 提供的软件 watchd

58、og:softdog。保存配置输入正确的配置信息后,按”确定”按钮完成配置.系统会尝试按照你所填写的服务器名或 IP 地址连接服务器,连接成功后,系统先对所输入的配置信息进行检测, 检测成功后把配置信息保存到服务器上的指定位置。(二)添加第二台服务器按照添加第一台服务器的方法,您可以添加第二台服务器。在添加完第二台服务器后,配置工具会提示你配置这两台服务器之间的心跳路径。如果您没有正确地配置心跳路径的话,第二台服务器将会添加不成功。如何配置心跳路径,请参照下文添加心跳路径的内容。删除服务器:在删除服务器之前,你应该先停止掉所有服务器上的 HA 进程,然后点击菜单上的“工具(Tools)”-“服

59、务器(Server)”-“删除服务器(Delete Server)”或者工具栏上“删除服务器”的按钮,来删除服务器。修改服务器参数:在修改服务器参数之前,你应该先停止掉所有服务器上的 HA 进程。有三种方法修改服务器参数:点击在要修改的服务器图标,然后点击菜单上的“工具(Tools)”-“服务器(Server)”-“修改服务器(Modify Server)” 点击在要修改的服务器图标,然后点击工具栏上“修改服务器(Modify Server)”的按钮在要修改的服务器上双击。打开服务器参数配置窗口后,请参照添加第一台服务器的操作修改服务器的参数,但是不可以修改服务器的名称,因为那样会使心跳的配置

60、无效。(三)启动和停止服务器在要启动或者停止的服务器的图标上点右键,选择启动或者停止服务器,即可以启动或者停止服务器。注意注意:因为停止服务器的动作在后台进行,可能在点击停止服务器后,过一段时间服务器状态才会变成停止。(四)查看服务器状态:HA 服务器有两种状态,启动(UP)/停止(DOWN) ,分别用下列图标显示:启动:停止:当服务器状态改变后,界面服务器的图标将会作相应的改变。3)心跳配置心跳配置(一)添加心跳路径HA 使用心跳路径来互相探测对方节点是否处于正常运行的状态;并且使用所有的网络心跳路径来作为通讯链路。所以为了保证服务器的高可用性,我们建议 HA 使用的网络心跳路径至少为两条。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论