ibmhacmp培训讲义-v_第1页
ibmhacmp培训讲义-v_第2页
ibmhacmp培训讲义-v_第3页
ibmhacmp培训讲义-v_第4页
ibmhacmp培训讲义-v_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

IBMPowerHA培训,时间:2014-10,目录,PowerHA培训,PowerHA介绍PowerHA概念及术语PowerHA规则和考虑PowerHA示例PowerHA巡检,HACMP(HighAvailabilityClusterMultiProcessing),为什么需要高可用性?什么是HACMP?HighAvailability(高可用性):系统可用性或运行时间最大化系统宕机时间最小化不是容错机(faulttolerance)什么是multi-processing(集群多处理)?一个cluster里的各个节点上可以运行多个应用节点间共享数据或并发访问数据.,HACMP/PowerHA集群介绍,容错与高可用对比,容错系统提供容错功能的系统目标是几乎无中断地操作,而不管可能发生的故障如何(但是由于自然灾害导致的完全站点故障除外)。在此类系统中,至少为所有的软件或硬件组件配置了重复组件。即使在一个子组件发生故障时也可以提供连续的服务。此类系统非常昂贵,并且极其专门化(IBMZseriesServer)。在不能接受任何停机时间的场合,容错设备和解决方案是必需的。高可用性系统确保在发生故障时,能够使用最短的可接受停机时间实现自动化的恢复。消除环境中的所有单点故障(SPOF)是非常重要的。例如,如果计算机只有一个网络连接,则应该在同一个节点中提供第二个网络接口,以便在提供服务的主适配器发生故障时接管工作(Hp的APA,IBM的etherchannel)。另一个重要问题是镜像数据,并将数据放在可从集群中的任何一台主机访问的共享磁盘区域,从而保护数据。高可用性集群多处理(HighAvailabilityClusterMulti-Processing,HACMP)软件提供了用于在高可用的系统中集成应用程序的框架和一组工具。,4,HACMP/PowerHA集群介绍,PowerHA培训,PowerHA介绍PowerHA概念及术语PowerHA规则和考虑PowerHA示例PowerHA巡检,HACMP概念分类,HACMP的基本概念可按如下方式进行分类:集群拓扑包含基本集群成员节点、网络、通信接口、通信设备和通信适配器。集群资源将要使其高度可用的实体(例如,文件系统、原始设备、服务IP标签和应用程序)。资源在资源组(RG,resourcegroup)中分组在一起,HACMP将资源组作为单个实体来保持其高度可用。资源组可从单个节点使用,或在并发应用程序的情况下,可以同时从多个节点使用。故障转移表示资源组响应活动节点上的故障而从该活动节点转移到另一个节点(备份节点)。退回表示资源组在先前的节点变得可用时从备份节点转移到先前的节点。此转移通常是为了响应先前发生故障的节点的重新集成。,6,HACMP/PowerHA概念及术语,HACMP术语,要理解HACMP的正确功能和用途,必须知道一些重要的术语:集群(Cluster)主机或LPAR的集合,组织到一个网络中以便共享资源和彼此通信。HACMP定义了操作系统之间的关系,其中当某个集群节点无法提供服务时,其它的集群节点将提供该节点所提供的服务。在任何集群组件发生故障的情况下,这些节点共同维持一个或多个应用程序的功能。节点(Node)运行AIX和HACMP的IBMeServerpSeries计算机(或LPAR),被定义为集群的一部分。节点可以承载一个或多个资源集合(磁盘、文件系统、IP地址和应用程序),在节点发生故障的情况下,可以将该资源集合转移到集群中的另一个节点。,7,HACMP/PowerHA概念及术语,HACMP术语,资源(Resource)资源是集群配置的逻辑组件(浮动IP地址,文件系统等等),可从一个节点移动到另一个节点。资源组(ResourceGroup)提供高度可用的应用程序或服务所必需的所有逻辑资源在资源组(RG)中分组在一起。资源组是根据提供应用程序运行的资源需求来组成(应用不同,RG组所需要的资源也不同,比如中间件,oracle9rac,oracle10rac)。接管(Takeover)接管是指在集群内的节点之间转移资源(以RG为单位)的操作。如果一个节点由于硬件问题或AIX崩溃而发生故障,其资源应用程序将移动到另一个节点。,8,HACMP/PowerHA概念及术语,HACMP术语-网络术语,IP标签(IPlabel)术语“IP标签”表示与特定IP地址相关联的名称,此名称是在集群节点上使用的名称解析方法(DNS或静态-/etc/hosts)中定义的。此术语取代“主机名称”(hostname),后者可能与hostname命令的输出产生混淆,并且可能没有与任何IP地址相关联。服务IP地址/标签(ServiceIPaddress/label)服务IP地址是用于客户端访问的IP地址。此IP地址(及其关联的标签)由HACMP监视,并且是资源组的一部分。存在两种类型的服务IP地址(标签):共享服务IP地址(标签):可以配置在多个节点上的IP地址,并且是一次只能在一个节点上处于活动状态的资源组的一部分。与节点绑定的服务IP地址(标签):只能配置在一个节点上(不由多个节点共享)的IP地址。通常,此类服务IP地址与并发资源组相关联。服务IP地址在HACMP已启动并且关联的资源组处于在线状态时变得可用。HACMP通信接口(HACMPcommunicationinterface)通信接口指的是基于IP的网络和网络适配器。连接到公共物理网络的网络适配器组合为HACMP所使用的逻辑网络。每个网络适配器能够承载多个TCP/IP地址。HACMP通信设备(HACMPcommunicationdevice)HACMP还提供点对点非IP网络的监视。这些设备是通信设备,并包括串行RS232连接、目标模式SCSI、目标模式SSA和磁盘检测信号连接。,9,HACMP/PowerHA概念及术语,HACMP术语-网络术语,网络接口功能(Networkinterfacefunction)(1)服务接口(ServiceInterface)服务接口是配置了一个或多个服务IP地址(标签)的通信接口。取决于为每个网络定义的IP地址接管(IPAT)方法,将在基本IP地址之外添加服务IP地址(通过别名的IPAT),或者服务IP地址将取代通信接口的基本(启动)IP地址。此接口用于提供对运行在该节点上的应用程序的访问。(2)启动接口(BootInterface)这是由在AIX配置中定义的基本(启动)IP地址表示的通信接口。启动接口不传输任何客户端流量;然而,如果服务接口失败,HACMP将把服务IP地址转移到非服务接口上。如果某个节点发生故障,接管节点上的另一个接口将在执行资源组故障转移时配置服务IP地址。注意:在同一个网络上使用多个非服务接口可以消除通信接口的单点故障。(3)持久节点IP标签(PersistentNodeIPLabel)持久节点IP标签是一个IP别名,分配给集群网络上的某个特定节点。与节点绑定(始终保持在同一个节点上)。能够在已经定义了某个服务或非服务IP标签的网络适配器上共存。具有不需要在该节点上安装附加物理网络适配器的优点。不属于任何资源组。,10,HACMP/PowerHA概念及术语,HACMP术语,应用程序服务器根据HACMP定义,应用程序服务器由一个脚本集合来表示,HACMP使用这些脚本在激活资源组时启动应用程序,或在将资源组置于离线时停止同一个应用程序。应用程序启动脚本/etc/hacmp/ora_start.sh应用程序停止脚本/etc/hacmp/ora_stop.sh1.应用服务器中添加的启停脚本需要在集群中的所有节点中都添加;2.一般每一个资源组对应一组启停脚本。,11,HACMP/PowerHA概念及术语,PowerHA培训,PowerHA介绍PowerHA概念及术语PowerHA规则和考虑PowerHA示例PowerHA巡检,PowerHA规则和考虑,整体考虑网络配置存储配置心跳配置资源组配置,硬件规划节点的配置要求网络的配置要求(IP和Non-IP网络)存储设备的配置要求软件的规划操作系统的版本和补丁要求HACMP的版本和补丁要求应用程序的兼容性HACMP的资源组的规划,HACMP/PowerHA整体考虑,Cluster的节点的配置要求,一个精心设计的cluster应该尽量避免单点故障(SPOF),为了达到这个目的,典型的cluster一般对硬件有如下要求:至少2个pseries服务器作为cluster的节点(安装并运行HACMP,每个节点的AIX版本和HACMP的版本要完全一致)内置硬盘:预留一定的硬盘空间满足HACMP的安装要求I/O插槽:要满足网卡、HBA卡(阵列和带库要分开)、串口卡建议至少一种non-IP网络,通常采用RS232网络,如果某些节点集成串口无法作心跳,要配#29438口异步卡,节点间要配串口线一个共享磁盘阵列(7133/FastT/ESS等),HACMP/PowerHA整体考虑,Cluster的软件配置要求,操作系统的版本和补丁要求操作系统的版本和补丁要求信息查看:,HACMP/PowerHA整体考虑,Cluster的软件配置要求,操作系统上需要打的一些额外的包:bos.adt.libbos.adt.libmbos.adt.syscallsbos.rte.SRCbos.rte.libcbos.rte.libcfgbos.rte.libcurbos.rte.libpthreadsbos.rte.odmbos.datarsct*如果需要安装并行的资源组,需要打下面的包:bos.rte.lvmbos.clvm.enh,HACMP/PowerHA整体考虑,Cluster的网络配置要求,确定用户的IP网络类型确定用户的IP网络资源分配准备以太网交换机的端口在交换机上划分VLAN分配IP地址确定采用的IPAT的方式确定用户的Non-IP网络(心跳)串口方式IP网络方式SSA、SCSI方式硬盘方式,HACMP/PowerHA网络方面,Cluster的网络配置要求:网络连接示意图,HACMP/PowerHA网络方面,Non-servicelabels在AIX启动时分配在HACMP启动后,serviceIPlabel作为一个alias添加到一块带有non-servicelabel的networkinterface上non-servicelabel从来都不会从一个NIC上移走如果节点失败,一个takeover节点会获得失败节点的serviceIPlabel,并作为一个alias添加到它的位于同一个HACMPnetwork里的一块带有non-servicelabel的networkinterface上,Cluster的网络配置要求:IPATviaIPaliases(一),HACMP/PowerHA网络方面,设置IPATviaIPaliases功能#smittyhacmpExtendedConfigurationExtendedTopologyConfigurationConfigureHACMPNetworksChange/ShowaNetworkintheHACMPClusterChange/ShowanIP-BasedNetworkintheHACMPClusterChange/ShowanIP-BasedNetworkintheHACMPClusterTypeorselectvaluesinentryfields.PressEnterAFTERmakingalldesiredchanges.EntryFields*NetworkNamenet_ether_01NewNetworkName*NetworkTypeether+*Netmask255.255.255.0+*EnableIPAddressTakeoverviaIPAliasesYes+IPAddressOffsetforHeartbeatingoverIPAliases*NetworkAttributepublic+,Cluster的网络配置要求:IPATviaIPaliases(二),HACMP/PowerHA网络方面,Non-servicelabels在AIX启动时分配HACMP启动后,serviceIPlabel替换(replaces)non-serviceIPlabel如果节点失败,一个takeover节点使用它的位于同一个HACMPnetwork里的一个non-serviceinterface来获得(acquire)失败节点的serviceIPlabel,Cluster的网络配置要求:IPATviaIPreplacement,HACMP/PowerHA网络方面,PersistentNodeIPlabel是一个IPalias,它可以分配给cluster里的一个特定节点总是位于同一个节点可以位于一块已经拥有service或non-serviceIPlabel的网卡上不需在节点上安装额外的物理网卡不属于任何资源组能被用于对指定的节点进行管理每个节点只能配置一个.在节点启动后即可用,当HACMP服务停止后也始终保持可用如果网卡失败,它只会迁移到相同网络的同一个节点上的其它网卡如果节点失败,该IP标识不会迁移到群集中的其它节点,Cluster的网络配置要求:PersistentNodeIPlabel,HACMP/PowerHA网络方面,Cluster的存储设备配置要求,确定存储设备的连接类型SCSISSAFC了解用户需求划分存储资源划分RAID创建逻辑盘LUN确定VG的类型Non-concurrentConcurrentEnhancedconcurrent,HACMP/PowerHA存储方面,心跳心跳检测用于监视网络接口、通信设备和IP标签(服务、非服务和持久IP)的可用性,从而监视节点的可用性。AIX环境下,心跳检测是由AIX的RSCT子系统完成,方式是让每个通信接口或设备在集群的节点间交换持续有效的数据包。实现手段每个集群节点将以特定的频率向集群的其他节点发送心跳消息,并根据接收到的心跳返回消息以判断节点的有效性。在不能接收消息的情况下,RSCT子系统可能会发出故障信息,并激活HACMP所对应的恢复操作。,25,HACMP/PowerHA心跳,心跳设计配置HACMP的过程中,除了TCP/IP网络之外,您也可以在其它形式的网络上,如串行网络和磁盘总线上配置心跳网络。TCP/IP网络优点:要求低,不需要任何额外硬件或软件,即可实现。缺点:占用IP地址,不能避免由于TCP/IP的软件问题导致HACMP崩溃,系统不可用。串口网络优点:真正实现高可用性,不占用IP地址。缺点:需要硬件支持,对于p5机器,需要新增异步卡,而中低端的机器的插槽有限。磁盘心跳优点:不占用插槽,磁盘总线上的心跳网络能够在TCP/IP网络资源有限的情况下提供额外的HACMP节点间的通信手段,并且能够防止HACMP节点之间由于TCP/IP软件出现问题而无法相互通信。缺点:需要操作系统和存储支持,如使用增强型卷组,此外对于I/O读写负荷高的应用,也需要慎用。条件许可的情况下,强烈推荐使用串口网络,其次是磁盘心跳。,26,HACMP/PowerHA心跳,心跳设计,27,HACMP/PowerHA心跳,心跳设计-网络心跳(1),28,HACMP/PowerHA心跳,心跳设计-网络心跳(2),29,HACMP/PowerHA心跳,心跳设计-网络心跳(3),30,1.当心跳故障发生时,2个节点都会去试图从本机去ping这些仲裁IP地址。2.对于两节点的hacmp,配置仲裁IP地址在/usr/es/sbin/cluster/netmon.cf中。,HACMP/PowerHA心跳,HACMP5.1的新功能能够使用下列任何一种共享磁盘阵列(FibreChannel,SCSI,或SSA)使用的磁盘是一个enhancedconcurrentvolumegroup的一部分,唯一的要求是这个VG必须在两个节点都有定义磁盘的这块特殊区域不能用作任何的LVM操作,而只能用来在两个节点间传递心跳消息,磁盘心跳Heartbeatviadisk,HACMP/PowerHA心跳,资源组(ResourceGroup)定义:,一些可管理的资源集合在一起,和特定的应用相关联,并可一同执行failover等行为的组.包含四种类型:CascadingresourcegroupRotatingresourcegroupConcurrentresourcegroupCustomresourcegroup,HACMP/PowerHA资源组,Cascadingresourcegroup(级联),资源移动按照一个从高到低的优先级顺序当发生失败节点重新加入(reintegration)时,资源会返回到优先级更高的节点缺省,资源会在优先级最高的节点上启动资源(Resources):ServiceIPLabels/AddressesVolumeGroupsFilesystemsApplicationServers,HACMP/PowerHA资源组,Cascadingresourcegroup的接管,HACMP/PowerHA资源组,Rotatingresourcegroup(循环),资源移动按照一定顺序,一个接一个呈rotation当节点失败,第一个备(standby)节点会获得失败节点的资源组一个失败节点重新加入cluster,将会作为备(standby)节点,不会重新获得原来的资源组资源(Resources):ServiceIPLabels/AddressesVolumeGroupsFilesystemsApplicationServers,HACMP/PowerHA资源组,Rotatingresourcegroup的接管,HACMP/PowerHA资源组,Concurrentresourcegroup(并发),所有的节点共享且可并发访问数据应用在所有节点上并行运行有LockManager协调各节点对数据的访问一个节点失败,会降低集群整体处理性能,但不会发生接管。资源(Resources):ConcurrentVolumeGroupsApplicationServers,共享盘阵,HACMP/PowerHA资源组,资源组-自定义,启动首选项OnlineOnHomeNodeOnly:在节点启动时,RG将仅在具有最高优先级的节点上置于在线。此行为等效于级联RG行为。OnlineOnFirstAvailableNode:在节点启动时,RG将第一个激活的节点上置于在线。此行为等效于循环RG或使用非活动接管的级联RG的行为。如果配置了停留(settling)时间,则该时间将影响RG的启动行为。OnlineOnAllAvailableNodes:RG应该在RG中的所有节点上在线。此行为等效于并发RG行为。此启动首选项将覆盖某些故障转移和退回首选项。故障转移首选项:RG将故障转移到节点列表中的下一个可用节点。此行为等效于级联和循环RG的行为。FalloverToNextPriorityNodeInTheListFalloverUsingDynamicNodePriority:RG将基于DNP计算来执行故障转移。资源组必须指定DNP策略。BringOffline(OnErrorNodeOnly):RG将不在发生错误时进行故障转移;而是简单地将其置于离线。此行为最适合于并发式的RG。退回首选项FallbackToHigherPriorityNode:RG将在某个具有较高优先级的节点变得可用时退回该节点。此行为等效于级联RG行为。退回计时器将影响此行为。NeverFallback:即使某个较高优先级的节点变得在线,资源组也将保持在原位置。此行为等效于循环RG的行为。,38,HACMP/PowerHA资源组,ResourceGroup配置界面,添加一个customresourcegroup:#smittyhacmpInitializationandStandardConfigurationConfigureHACMPResourceGroupsAddaResourceGroupCascadingRotatingConcurrentCustomAddaCustomResourceGroupTypeorselectvaluesinentryfields.PressEnterAFTERmakingalldesiredchanges.EntryFields*ResourceGroupName*ParticipatingNodeNames(DefaultNodePriority)+StartupPolicyOnlineOnHomeNodeO+FalloverPolicyFalloverToNextPrio+FallbackPolicyFallbackToHigherPr+,HACMP/PowerHA资源组,PowerHA培训,PowerHA介绍PowerHA概念及术语PowerHA规则和考虑PowerHA示例PowerHA巡检,41,常见的HACMP拓扑结构介绍,HACMP/PowerHA示例,42,常见的HACMP拓扑结构介绍,HACMP/PowerHA示例,43,常见的HACMP拓扑结构介绍,HACMP/PowerHA示例,44,常见的HACMP拓扑结构介绍,HACMP/PowerHA示例,常见的HACMP拓扑结构介绍,45,HACMP/PowerHA示例,常见的HACMP拓扑结构介绍,46,HACMP/PowerHA示例,PowerHA培训,PowerHA介绍PowerHA概念及术语PowerHA规则和考虑PowerHA示例PowerHA巡检,48,HACMP/PowerHA巡检,1.检查双机状态命令:#/usr/es/sbin/cluster/clstat,Note:在启动双机时StartupClusterInformationDaemon?为true才有输出。可以通过lssrca|grepclinfoES是否为Active来判断。,49,HACMP/PowerHA巡检,1.双机配置检查命令:/usr/es/sbin/cluster/utilities/clRGinfo-GroupNameGroupStateNode-apprgONLINEnode1OFFLINEnode2datargONLINEnode2OFFLINEnode12.双机配置收集/usr/es/sbin/cluster/utilities/cldump(双机当前状态)/usr/es/sbin/cluster/utilities/cldisp(双机配置)cat/etc/hostsnetstatrnnetstatin(网络配置),50,HACMP/PowerHA巡检,3.后台服务状态收集#lssrc-lsclstrmgrESCurrentstate:ST_STABLE状态信息sccsid=(#)361.135.1.80src/43haes/usr/sbin/cluster/hacmprd/main.C,hacmp.pe,52haes_r541,0736A_hacmp5417/19/0706:36:20i_local_nodeid1,i_local_siteid-1,my_handle2ml_idx1=0ml_idx2=1Thereare0eventsontheIbcastqueueThereare0eventsontheRMIbcastqueueCLversion:9localnodevrmfis5410clusterfixlevelis0Thefollowingtimer(s)arecurrentlyactive:CurrentDNPvaluesDNPValuesforNodeId-1NodeName-node1PgSpFree=130099PvPc

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论