IBM_RS6000小机设计方案.doc_第1页
IBM_RS6000小机设计方案.doc_第2页
IBM_RS6000小机设计方案.doc_第3页
IBM_RS6000小机设计方案.doc_第4页
IBM_RS6000小机设计方案.doc_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目 录一、主机系统方案21.1方案设计综述21.2系统方案优势21.2.1主机系统方案优势21.3IBMRS/6000产品介绍41.3.1IBMRS/6000产品概述41.3.2性能出众的企业服务器-RS/6000 M8551.3.3AIX操作系统91.3.4高可用性群集解决方案HACMP1414 IBMSSA存储系统介绍151.4.1高性能151.4.2高可用性161.4.3高扩展性171.4.4投资保护171.4.5IBM7133串行磁盘系统D40和T40型一览171.5HACMP方案18HACMP网络18HACMP故障类型19资源接管方式25二、系统设备机房环境要求302.1物理尺寸302.2 RS/6000机房的电气要求:302.3RS/6000机房通讯要求:302.4RS/6000机房工作环境要求:302.5RS/6000机房安全性要求:312.6RS/6000装机前要求:31三、测试与验收323.1IBMRS/6000硬件安装及验收323.1.1装机申请。323.1.2开箱验货。323.1.3系统实施。323.2HACMP测试方案323.2.1主机相互备分(NodeTakeover)333.2.2网卡相互备分(Adaptertakeover)343.2.3HACMP/6000设置服务工作说明书343.2.4HACMP/6000完工报告书36四、维护支持及保修39五、配置清单及报价43六、附件50一、主机系统方案1.1方案设计综述采用2台RS6000M85小型机组成集群作为ePMS服务器系统.附加磁盘系统容量为36.4Gx6= 218.4G当前内存配置为2G,可扩充至64G.IBMM85小型机满配8CPU的单机处理能力为:105,025.02TPMC-C1.2系统方案优势1.2.1主机系统方案优势先进性IBMRS/6000M85服务器是目前UNIX业界具有最先进技术的SMP服务器,集合了IBM先进的技术。a)IBM独有的铜芯片技术带来了速度更快、更为可靠的处理器,不仅使速度大大提高,而且减少了产生的热量。b)M85具有与处理器、内存和I/O相连的高速数据开关。该开关的出众性能可提供高达18GB/秒的总带宽,远于其它厂商的同价位服务器。高系统带宽非常适合于电信业务高要求。高可靠性a)服务处理器IBMRS6000机型的安全核心是一个服务处理器,专为对系统的关键特征进行持续监控而设计。该处理器能够在某个问题发生之前确定和推荐应当采取的措施。如果需要的话,将自动发出服务请求。b)动态CPU存储单元分配技术IBMRS6000机型拥有一种IBM服务器所特有的功能,也即动态CPU存储单元分配技术,该技术能够对处理器进行监控。一旦某一处理器显示出即将发生故障情况时,该特性可以与AIX5L协同工作,专为使出现故障的处理器离线而设计。对于出现故障的处理器而言,其任务将被自动重新分配给其它的处理器,您可以进行时间安排,在适当的时候更换出现故障的处理器。c)热插拔PCI插槽当添加或替换I/O适配器时,热插拔式PCI插槽可以使计费应用持续运行。可以根据需要激活或禁用个别的适配器,而不依赖于该适配器的各种操作则可继续运行。通常您无需断开电源或重启系统即可完成各种操作。而且M85有56个热插拔扩展槽。d)HACMP高可用性方案为了实现几近恒久运行的系统运作,可以使用业界领先的IBM高可用性群集多处理灾难备援解决方案(HACMP),将两台RS/6000群集在一个系统里。当与满足IBM的ClusterProven(tm)标准的应用软件相结合时,这一群集解决方案将提供一个出众的基础平台,以便实现电子商务所必需的高可用性。高可扩展性1.IBMRS6000M85可扩展至8路CPU,单机处理能力居业界8路处理器小型机首位;2.IBMRS6000可组成32台小型机集群系统,发挥系统集群的处理能力.3.IBMRS6000M85可以整合在IBMSP系统中,组成具有1024个节点的强大计算机系统.4.M85的机柜封装提供了非凡的设计灵活性,可以满足计划外的升级需要。它包括一个可进行机柜安装的的处理器抽屉,其中含有处理器和内存。该抽屉与包含PCI插槽的I/O抽屉相连。为了获得额外的可用性,处理器和I/O抽屉标配有热插拔冗余电源和冷却风扇。对于可在机柜中装配的处理器和I/O抽屉数目而言,M85提供了极大的灵活性,从而在每平方英尺的占地面积上提供了更为强大的计算和I/O能力。在最大配置中,M85系统包含一个具有8个500MHz处理器的处理器抽屉和四个I/O抽屉,可提供总数达28个EIA单位(U)的机柜空间(处理器抽屉8U,每个I/O抽屉5U)。可以扩展到64GB内存和56个PCI插槽,足以满足大型的计费应用需要。1.3IBMRS/6000产品介绍1.3.1IBMRS/6000产品概述RS/6000是IBM的战略性产品,是IBM公司从事信息处理技术40多年经验的结晶。RS/6000工作站和服务器自1990年推出以来,已在UNIX开放系统中占有极其重要的地位,成为同行业中的佼佼者。目前RS/6000在全球的装机量已超过80万套,在国内UNIX服务器市场所占份额超过40%,装机量超过6000套。RS/6000采用精减指令集(RISC)芯片技术,基于开放的UNIX平台,产品线覆盖了从单CPU的桌面系统,到多CPUSMP商用服务器,直至具有上千个CPU的大规模并行计算系统SP,是目前业界最丰富最完善的产品线,能够为用户不同档次的应用需求提供相应的解决方案。RS/6000产品,不论从其芯片技术,其产品系列宽度,其通讯能力,其外部设备的支持能力,还是从其操作系统和应用软件的支持皆是目前业界中最好的选择。RS/6000不仅是最佳的开放系统平台,而且,在RS/6000系列所有型号的机器上,都采用同一结构的RISC技术芯片,运行着同一个操作系统AIX/6000,并且实现了二进制兼容,任一应用应用软件能够不作任何修改,就可在所有型号上运行,积大的保护用户的投资。RS/6000不仅具有极好的开放性,同时还有者强大的通讯和联网能力支持从PC到大型主机,不同平台的连接方式,如Ethernet,TokenRing,,FDDI,TCP/IP,NOVELL,SNA,X.25,ATM,ISDN,DDN等。1.3.2性能出众的企业服务器-RS/6000 M85要点:无与伦比的中级RS/6000企业服务器,具有世界级的性能和扩展性。功能强大、具有铜芯片技术的两路至八路64位对称多处理屉式机柜服务器。先进的机柜装配封装不仅可实现配置的灵活性,而且易于扩展,同时减少了占地面积。品质出众,足以胜任电子商务、ERP、BI及其它关键性商务应用。显著的可用性和可靠性等特性。以具有领导地位的商用UNIX(r)操作系统AIX(r)为强大动力。中级价位,功能强大。 M85机型是一种先进的机柜安装式系统,居于IBM中级RS/6000企业服务器产品家族之首。M85型设计新颖,它结合了流行的S80机型技术和通用的19英寸机柜封装,从而为关键性的电子商务环境提供了更为强大的配置灵活性、性能、可靠性和出众价值。M85的目标是满足电子商务、企业资源计划(EPR)、供应链管理(SCM)和商务智能(BI)解决方案的关键性需求。在EPR环境下,该产品是一种优秀的应用服务器,具有强大的处理器和出众的存储能力。对于电子商务,85机型不仅极其可靠,而且运转如飞,是极为出众的企业至企业Web服务器。Web服务及其它企业至企业的电子商务应用。M85机型依照网络设备建设标准(NEBS)第3级标准设计,可以为信息中心室内作业提供特殊功能(包括冗余的-48伏直流电源)。特性和益处基于铜芯片技术的RS64IV对称多处理器*具有比早期的处理器更为出众的性能64位系统体系架构*针对需要快速访问大量数据的应用程序,改进了内存的使用情况每处理器8MBECC二级缓存*提高了性能和可靠性高达64GBECCSDRAM内存*对于大型的数据库应用,允许使用64位寻址*为更大的处理能力提供升级选件内置的服务处理器*自动监控系统运作,并采取预防性措施或纠正措施*可以在远程进行诊断和维护热插拔冗余电源(可选)和冷却风扇*如果某个电源或风扇停止运转,可以保证系统持续运行动态CPU存储单元分配*当系统检测到即将发生CPU故障时,便自动分配资源的存储单元,以便使应用程序继续运行AIX操作系统*64位RS/6000系统具有全面的扩展性,支持32位及64位应用程序并行执行*保持与开放小组的XPG4、UNIX95、UNIX98等规范间的品牌一致性*提供AIX二进制兼容环境,帮助确保在整个AIX版本中持续提供应用程序技术无与伦比的中级服务器M85机型对称多处理器(SMP)服务器具有可进行机柜安装的中级封装结构,不仅经济适用,而且可提供与S801机型中相同的先进技术。其最低配置为两个64位500MHzRS64III铜芯片微处理器,芯片数可成对增加,最多可扩展至八个处理器。IBM独有的铜芯片技术带来了速度更快、更为可靠的处理器,不仅使速度大大提高,而且减少了产生的热量。M85具有与处理器、内存和I/O相连的内置系统开关。该开关的出众性能可提供高达18GB/秒的总带宽。M85标配有2GB内存,并能够扩展到64GB。这些特性能够提供充足的性能和内存,完全满足众多关键性电子商务应用的要求。M85标配有14个热插拔PCI I/O插槽(复合带宽为1GB/秒),封装于单一I/O抽屉内,可以轻松实现机柜装配。最多可安装4个I/O抽屉,插槽总数可达56个。在第一个I/O抽屉中,还为您提供可选的引导托架(必须占用2个插槽,余下12个可供使用)。每个I/O抽屉标配有内置的快速Ethernet、SCSI-2F/W和Ultra2SCSI控制器,从而使客户尽可使用余下的所有插槽。性能强大,体积小巧M85的机柜封装提供了非凡的设计灵活性,可以满足计划外的升级需要。它包括一个可进行机柜安装的的处理器抽屉,其中含有处理器和内存。该抽屉与包含PCI插槽的I/O抽屉相连。为了获得额外的可用性,处理器和I/O抽屉标配有热插拔冗余电源和冷却风扇。对于可在机柜中装配的处理器和I/O抽屉数目而言,M85提供了极大的灵活性,从而在每平方英尺的占地面积上提供了更为强大的计算和I/O能力。在最大配置中,M85系统包含一个具有8个500MHz处理器的处理器抽屉和四个I/O抽屉,可提供总数达28个EIA单位(U)的机柜空间(处理器抽屉8U,每个I/O抽屉5U)。根据附加的I/O抽屉的数目,可以在S00(32U)、T00(36U)或T42(42U)机柜中安装2或3个M85处理器抽屉。机柜中也可以安装磁盘和磁带存储装置。诸如IBM7133串行硬盘系统(SSA)、IBM2104可扩展存储附件(Ultra2SCSI)和IBM2105企业存储服务器等存储产品,都提供了具有高可靠性的TB级热插拔磁盘存储功能。可用性随时满足您的需求M85机型的核心是一个服务处理器,专为对系统的关键特征进行持续监控而设计。该处理器能够在某个问题发生之前确定和推荐应当采取的措施。如果需要的话,将自动发出服务请求。M85机型拥有一种IBM所特有的功能,也即动态CPU存储单元分配技术,该技术能够对处理器进行监控。一旦某一处理器显示出即将发生故障情况时,该特性可以与AIX5L协同工作,专为使出现故障的处理器离线而设计。对于出现故障的处理器而言,其任务将被自动重新分配给其它的处理器,您可以进行时间安排,在适当的时候更换出现故障的处理器。当添加或替换I/O适配器时,热插拔式PCI插槽可以使电子商务应用持续运行。可以根据需要激活或禁用个别的适配器,而不依赖于该适配器的各种操作则可继续运行。通常您无需断开电源或重启系统即可完成各种操作。为了实现几近恒久运行的系统运作,可以使用业界领先的IBM高可用性群集多处理灾难备援解决方案(HACMP),将两台M85群集在一个机柜里。当与满足IBM的ClusterProven(tm)标准的应用软件相结合时,这一HAM85群集解决方案将提供一个出众的基础平台,以便实现电子商务所必需的高可用性。面向电子商务的出众品质M85的性能高于H80但低于P680,对于中级服务器的需求而言起到了极好的衔接作用。低廉的入门级价位能够满足各种应用需求,同时无需采用S80的全部安装。先进的UNIX操作系统本产品中包含有一个无限用户许可的AIX来自IBM的高性能UNIX操作系统。AIX针对电子商务应用性能进行了调整,提供了高可靠性、可用性和安全性,已被广泛地认可为最先进的系统和网络管理软件。AIX提供JavaTM技术,Web性能和增强的扩展性能以管理高级电子商务应用。基于Web的远程管理工具控制系统并监视重要的资源,例如网络可用性,文件系统的状态和处理器的负载。AIX还集成了负载管理器,它有助于确保关键应用即使在尖峰系统需求期间也可以保持响应性能。最新的AIX发行版本,是AIX 5L 5.1版,它增加了新的功能,进一步增强了安全性和性能可用性,增强了负载管理器,提高了Java的扩展性和性能。此外,IBM还提供Linux支持,使得在LINUX上开发的流行的应用以最小的变化就可在AIX上运行。1.3.3 AIX操作系统AIX 5L Version 5.1特色提供满足关键电子商务和Internet 应用的稳定的、具有高可扩展性、高安全性与高可靠性的UNIX操作系统添加了新的系统组件以增强安全性、工作负载管理、系统管理以及Java工具的高可扩展性与Linux 兼容,提供最开放的UNIX 操作系统,并支持基于POWER和Itanium架构的服务器独一无二的操作系统AIX 5L Version 5.1是新一代的AIX操作系统,是由IBM 开发的具有开放性、高可扩展性的UNIX 操作系统。与AIX Version 4.3 相比,提供了更先进的集成性、灵活性和高可靠性是满足现今要求严格的关键电子商务应用程序的基本保证。目前业界内唯一带有高级软件功能,可同时应用于POWER架构和Intel ltanium架构的且对Linux全面支持的UNIX操作系统,就是AIX 5L。具有高稳定性、高可扩展性和高可靠性的UNIX操作系统AIX 5L Version 5.1构造于稳定的AIX操作系统核心之上,提供先进技术并为客户带来竞争优势。系统可运行在所有POWER架构的系统上,包括IBM eServer pSeries 和 IBM RS/6000。此外,性能卓越的AIX 5L提供满足当今电子商务应用所需的高可靠性、高可用性、和高安全性等。延续了其在操作系统上的领先地位以及UNIX 98认证。 AIX 5L支持所有现存的32位和64位硬件系统,以提供全面的高可扩展性,同时还集成了许多其它先进的软件功能。AIX集成了许多Internet的关键技术,例如Java 和IP多路路由技术,并提供完整的开发工具,包括用于系统配置和优化的Porformance Toolbox。 AIX 5L操作系统提供了可满足未来需要的全面的UNIX电子商务解决方案、领先的技术和高度的灵活性,并且与32位应用程序保持完全的兼容性,保证客户基于AIX 4.3的应用程序可以继续运行。新增特性AIX 操作系统继续保持着其传统的创新性和杰出特性,并巩固其在网络安全特性方面的领先地位,AIX 5L操作系统采用Certificate Revocation List,使用Internet Key Exchange (IKE)协议,授权远端用户或设备。该技术特性进一步加强了AIX IP安全功能,强化对虚拟专用网络(VPN) 的支持。AIX 5.1实施MIT的Kerberos V5 Release 1.1网络认证服务,以在Internet的两点之间或系统组件之间进行通讯协调,或进行可选的加密通讯操作。AIX 操作系统即使在系统处理繁重、突发任务时,也能保证满足客户的关键应用程序的正常运行。AIX工作负载管理(WLM) 允许客户定义资源分配策略,可动态地确定应用程序运行的要求,按照任务细分处理器处理周期、实时内存和磁盘I/O,将商务应用转变为系统处理策略,以自动识别任务的优先级,并动态调配系统的处理周期。上述技术特性对关键商务解决方案,如电子商务(e-business)、商业智能(BI)、服务器集中(server consolidation)和企业资源规划(ERP)等领域极具价值。工作负载管理功能的新增特性还包括:提供附加的应用程序编程接口(API),允许连接外部应用程序更改系统操作功能。新的帐户子系统除了根据客户或客户组进行标准帐户管理外,还允许客户根据每个WLM类的资源利用帐户进行管理。通过基于Web 的系统管理(例如直观的、图形化界面)、系统管理接口工具(SMIT)、以及使用AIX命令,都可以轻松访问工作负载管理功能(Workload Manager)。具有高可靠性的扩展群集技术(RSCT)允许由系统或管理员自动监控系统资源。可以昼夜监控系统资源,例如文件系统、程序、处理器、适配器和核心信息等内容,当达到预设定的峰值时执行预定程序响应。上述系统操作提高系统的可管理性以及运作效率。IBM AIX Developer Kit, Java 2 Technology Edition提供AIX内核以及Java技术之间的协作应用接口,用于提高在大量IBM UNIX服务器中运行的应用程序的可扩展性和系统性能。该开发组件同时更好地支持Java运行与应用程序开发。AIX操作系统的另一个增强特性是采用新版本的Journal File System-JFS2。该文件系统可以增强数据连续存储功能,减少磁盘存储空间的浪费程度。JFS2文件系统还通过数据库技术,保持结构的一致性,并具有在系统异常宕机时,可防止文件系统被破坏的特殊功能。兼容Linux 满足解决方案灵活性的需要AIX提供更为广泛的、可满足未来需要的UNIX电子商务关键应用的解决方案,具有领先的技术和具有战略意义的灵活性。AIX与Linux之间的兼容,在AIX中提供了Linux API程序开发接口,使得在Linux环境下开发的流行应用程序,仅通过重新编译就可以在AIX操作系统环境下运行。API程序开发接口与IBM单独开发的Linux开放源代码软件相结合,成为AIX中Linux应用程序的工具包组件,例如,AIX Toolbox,客户可以将现有Linux开放源代码应用程序集成到AIX上,并利用通用Linux开发工具增强应用程序功能,并开发易于移植的应用程序。AIX操作系统综合了兼容Linux的API和头文件,以提供源文件的兼容性。AIX以及应用于Linux应用程序的AIX Toolbox帮助客户可在两种行业内开放性最好的操作系统平台,即AIX和Linux之间,进行平滑技术移植。由于应用程序运行于AIX环境中,因此客户可以同时得到Linux的灵活性和AIX操作系统的先进性能,包括工作负载管理、先进系统管理工具以及高安全性。自由选择:POWER架构或Itanium架构 IBM将UNIX平台带到新阶段:采用64位内核设计,并可同时开发利用IBM POWER或Intel Itanium体系架构的速度和处理能力。AIX操作系统全面支持开放的开发环境:与Linux结合紧密,使之成为行业内最开放的UNIX操作系统。AIX可以使用户在任何需要的硬件平台上运行所需的应用程序。系统无以伦比的灵活性、提供无论是目前还是未来管理电子商务所需的更多选择和开放性。 64位性能AIX 5L具有超乎寻常的64位系统性能,并不仅仅是因为采用了64位处理器,而由于硬件与操作系统的完美结合。在基于POWER处理器的64位系统中,AIX完全支持32位与64位应用程序共用,同时或协同运行应用程序,保证文件、内存和其它系统服务的共享访问。随着行业内64位基于POWER处理器的解决方案越来越广泛的使用,系统可以极大地提高从32位应用到64位应用的平滑移植。客户可以完全信赖的安全性AIX操作系统为象电子交易这样的关键应用提供所需的无懈可击的系统、网络性能和交易安全性。而事实上,AIX是第一个获得International Computer Security Association(ICSA) 的虚拟专用网络认证的操作系统。AIX操作系统集成了完整的VPN功能,是基于IPSec标准的,并经过了ICSA认证。IPSec标准由IETF (Internet Engineering Taskforce)开发,提供满足网络安全应用可靠性与持久运行的标准。IBM服务与技术支持保证客户商业应用持续运行AIX所提供的系统平台,可以保证最大限度地利用商业应用并同时满足未来需要的关键应用。与所有其它IBM服务器产品一样,AIX操作系统也获得IBM全球服务与技术的支持。AIX 5L Version 5.1新增功能 功能优势灵活性多平台操作系统 可自由选择基于POWER架构或Itanium架构的系统,保护客户在应用程序、工作处理流程和技术方面的投资 与Linux兼容通过将易于移植的Linux应用程序与AIX操作系统可扩展性和稳定性的紧密结合,帮助减少成本并提高电子商务解决方案功能系统扩展性新日志文件系统(JFS2)有效存储大文件(4 Petabyte limit,1 Terabyte tested),实施先进电子商务应用程序可选择的逻辑跟踪组(Logical Track Group) (LTG)帮助系统管理员调整磁盘存储,优化性能电子商务和网络功能虚拟IP 地址(VIPA) 在网络连接中断后,保证应用程序仍然可用IP 多路路由技术提供目的地址的多路路由,提高网络可用性多重缺省网关 检测并绕过不通的数据网关,保持数据传输的连贯性扩展内存分配提高应用程序性能,使用大量小内存块保证运行安全性Kerberos V5 Authenication(仅应用于 POWER)当客户连接多台系统时,帮助系统管理员简化口令验证管理Java 软件基于AIX操作系统 为电子商务应用提供普及的跨平台开发语言系统和工作负载管理功能/proc 文件系统 帮助系统管理员更方便地评估系统工作负载及运行状态,并进行修正操作RSCT 自动系统监控,提高系统可用性与系统性能UNIX System V Release 4(SVR4) Printing 使客户容易地使用SVR4 打印功能,使AIX更易使用工作负载的帐户管理 允许客户收集系统资源使用信息,并利用信息记帐或生成报告清单存储可选的Passive LVM Mirror Write Consistency 在系统出现问题时,帮助保证应用程序与数据的完整性可选的Hot spare磁盘支持 提高应用程序或数据的可用性 应用于逻辑卷管理的热点管理命令 使系统管理员在不牺牲可用性的前提下,标识需重分配的热点高可靠性、高可用性和高服务性(RAS)系统挂起自动恢复 无需系统管理员干预,维持系统的高可用性重复错误的连续计数 避免错误处理能力过载使活动的内存调度页面无效 无需系统重新启动,动态分配内存资源调度自动dump分析和电子邮件转发 加速客户技术支持以及问题诊断Dump压缩和容量警告 避免dump超出系统的可处理范围开发和性能调试工具“pax”归档格式 支持64位系统,以应用于超过2GB 以上的文件新的和增强的工具以及编程接口用于访问性 允许系统管理员和用户更方便的收集信息并最佳化系统性能,还可以标识正确的升级能监控数据部件AIX 扩展包和赠送工具包AIX 扩展包(AIX 5L最新提供的)扩展基础操作系统功能,提供加密支持、通过浏览器查看在线HTML文档,并可以作为HTTP服务器,发布在线出版物页面以及支持基于Web的系统管理。AIX 附赠工具包补充AIX 操作系统功能,提供附加技术特性、功能和程序。选择相应系统装载介质后,新订购的AIX 5L Version 5.1 操作系统都包含AIX 扩展包和赠送工具包。也可以单独订购上述扩展工具包以应用于现有AIX 操作系统。1.3.4 高可用性群集解决方案HACMP现代企业计算对高可用性和可靠性的要求非常高。因为企业应用和数据都存储在计算机里,由计算机来处理。一旦系统发生意外故障,造成应用停止重要的数据丢失,必将造成巨大损失。IBMRS/6000通过AIX操作系统的支持,利用包括动态扩展内核技术以及LVM、JFS和HANFS(高可用网络文件系统),实现多种功能的高可用集群多处理方案。为高可用性计算提供了一个完美的经济有效的解决方案。HACMP可根据需要灵活配置,它主要包括以下工作方式:*热备份:定义一个节点为备份机,处于空闲等待状态,等待接替故障节点的磁盘和应用;*阶梯式备份:几个节点各自有自已的应用和任务,它们之间互相作为备份机;*并发存取:几个节点通过同时访问同一共享存储设备,进行同一工作,不但保证了高可靠性,也显著提高了生产率。HACMP/6000有多种配置方式,视具体应用复杂程度和配置不同,其接管时间在30秒到300秒。在配置方式的灵活程度和高可用能力上都明显优于其它厂家产品,广泛应用在银行、商业、电信等重多企业计算环境,实为一种最经济有效的高可用性解决方案。从有效性角度考虑,IBMHACMP可以根据用户的需要进行配置和剪裁,其接管时间为几秒钟到几分钟,完全不须人工干预。在性能上优于其它类似产品。同容错机相比,虽然不能够做到无接管时间,但在价格上便宜很多,在灵活性和扩展能力上更有优势。是目前广为采用的高可用性解决方案。HACMP提供了一种预防意外断电和服务器停机的经济有效途径,它的设计以一个集群管理器为中心,该管理器检查网络中各集群成分的状态,与服务器处理机协商并监视其他系统。一旦确认某台服务器已发生故障,集群管理器便启动一个重新配置过程。14 IBMSSA存储系统介绍SSA存储体系结构可以给用户带来的优越特性正是应用系统对存储系统提出的需求,如高性能、高可用性、易于管理、低成本、可扩展性、开放性连接以及投资保护。1.4.1高性能最适合应用系统对数据操作高要求,高性能的磁盘子系统通常需要非仲裁机构和高传输带宽。高传输带宽:SSA体系结构由于使用了更大的带宽进行多道的,并发的,全双工的I/O操作,7133的每个适配器具有高达每秒3000次I/O处理的超级性能。它提供了每秒160MB数据传输带宽,可以每秒40MB的速度在环上同时进行双向读写操作,性能超群。非仲裁机构:SSA体系结构不需要仲裁机构,保证了极高的性能。从各种结构所能实现的数据传输率来讲,传统的SCSI2的理论值是20MB/s,而实际上,由于仲裁所带来的系统开销,SCSI2的持续数据传输率最大只能达到1012MB/s,也就是说,最起码会有40%以上的性能的下降。FCAL的理论值虽然公布是100MB/s,但由于采用了仲裁结构,所以存在同样的问题,即最少40%以上的性能下降。SSA单个环路目前的数据传输率为160MB/s,由于SSA所需的系统开销非常小,所以实际的环路带宽可以接近160MB/s。并且由于SSA空间复用的技术,即环路不交叉的点对点数据传输可以重复享用环路带宽,使得环路的实际带宽可以超过160MB/s;多环路的设计与实施可以使SSA系统的性能成倍的增长。1.4.2高可用性业务系统需要数据的高可用性,这是非常明确的,而这也正是SSA的优势。SSA的环路设计及其自动配置、热差拔与全冗余的部件设计以及磁盘RAID技术的实施,提供了极高的数据可用性,也使得SSA结构下的产品成为目前唯一没有单点故障的产品。SSA技术所固有的可用性特点增进了IBM7133的容错能力。由于使用了SSA的环状设计,一根电缆发生故障不会引起存取数据失败。如果一条通路或一块磁盘(使用镜像配置)发生故障,SSA可以自动通过其他通路访问设备。当故障通路修复后,适配器会立即自动重新配置,恢复到正常运转状态。如果一个磁盘发生故障,SSA能在线的取掉这个磁盘,而适配器和环中其他磁盘通讯并不间断。类似的,当磁盘修复或更换后,系统会立即自动重新配置以恢复到正常运转状态。7133也配置了冗余的电源和电扇,用户可以自行更换而不影响系统操作。SSA磁盘阵列磁盘的RAID功能可以进一步提高数据可用性。所以,SSA的高可用性与RS/6000主机俩俩备份实现了最佳的整体可用性,最适合银行业务系统。1.4.3高扩展性随着业务的发展,数据量相应增加,所以磁盘子系统的高扩展性能就格外重要。7133具有超级的稳定性和扩充性,7133容量范围从18GB级到几10TB,充分满足系统增长的需要。从硬件的角度看,为安装方便和将来升级加入了一些独立的装置。其中几个是:不用停机的7133环自动配置,可在线拆装的磁盘驱动器,以及SSA节点间25米的距离标准,通过光纤扩展可达10公里。1.4.4投资保护IBM的SSA系统为当今的开放系统提供了投资保护。除了连接IBMSP并行机、RS/6000、PC服务器之外,还可用在HP-UX,SUN Solaris,Compaq NT服务器上。IBMSSA7133自1995年推出以来,从010/500、020/600到最新型D40/T40都可以在同一系统中同时使用,这种兼容性设计进一步保护了用户投资。1.4.5 IBM7133串行磁盘系统D40和T40型一览 型号 机架式D40 桌边式T40 系统容量(每个适配器) 多达96个驱动器 多达96个驱动器 (每个环路48个) (每个环路48个) 物理要求 规格 171mm444mm665mm 610mm210mm820mm 重量(低端配置) 83.0 lb (37.7kg) 135.0 lb (61.2kg) 重量(最大配置) 118.0 lb (53.5kg) 168.0 lb (76.2kg) 操作环境 温度 50-104(10- 40) 50-104(10- 40) 相对湿度 8 - 80 8 - 80 最大湿球温度 80.6 (27.0) 80.6 (27.0) 电源要求 20 - 400瓦 20 - 400瓦 担保 一年有限担保 一年有限担保 所支持的系统1 基于UNIX的系统:所选的IBM、HP、Sun Microsystems和Digital服务器 基于Intel的系统:所选的IBM、HP和Compaq PC服务器 1.5 HACMP方案本方案中,多台主机通过HACMP软件来提供系统的高可用性,即当主生产机node1停机后,node2会自动接管node1上的资源,自动重启应用程序,使整个系统持续运行。如果只是node1的网卡、硬盘或网络发生故障,而且node1有另一套备用元件,那么工作将自动切换到这套备用元件上重新工作。相对于昂贵的传统出错式系统,虽然HACMP不能提供完全不停顿的电脑环境,但它的高可用性及优异的性/价比和弹性,已经吸引了大量的用户,目前全球的装机量超过1万套。HACMP网络HACMP的工作原理是利用LAN来监控主机及网络、网卡的状态。在一个HACMP环境中有TCP/IP网络和非TCP/IP网络。TCP/IP网络即client访问的公共网,如果是一个并行数据库环境,那么还必需一个不允许client访问的私网,用以lockmanager对数据进行协同工作。当然本方案中只需一个普通的公网即可,该网可以是大多数AIX所支持的网络,如Ethernet,T.R.,FDDI,ATM,SOCC,SLIP,等等,在本方案中是1000M以太网。非TCP/IP网络用来为HACMP对cluster中的各节点进行监控而提供的一个替代TCP/IP的通讯路径,它可以是用RS232将各节点连接起来,也可以是将各节点的SCSI卡或SSA卡设置成TargetMode方式。为了简单方便,本方案中我们采用RS232串口连接的方式,这也是绝大多数用户采用的方式。HACMP故障类型HACMP将诊测并响应于三种类型的故障:1网卡故障,2网络故障,3节点故障。下面就这三种故障分别进行介绍。 网卡故障前面讲到,HACMP的群集结构中,除了TCP/IP网络以外,还有一个非TCP/IP网络,方案中为RS232连接,它实际上是一根“心跳”线,专门用来诊测是节点死机还是仅仅是网络发生故障。如下图所示,一旦节点加入了cluster(即该节点上的HACMP已正常运行),该节点上的各个网卡、RS232串口和Target-ModeSSA或SCSI就会不断地接收并发送Keep-Alive信号包,K-A的参数是可调的,针对以太网,当处于normal状态时,将每隔0.5秒发送一个K-A包,如果12个包丢失后HACMP确认对方网卡、或网络、或节点发生故障。如果在slow或fast状态,参数值又有所变化,不过这种变化对于整个的接管时间的影响非常之小,以至通常可以不用去考虑。因此,有了K-A后,HACMP可以很轻易地发现网卡故障,因为一旦某块网卡发生故障,发往该块网卡的K-A就会丢失。此时nodeA上的clustermanager(HACMP的“大脑”)会产生一个swap-adapter的事件,并执行该事件的script(HACMP中提供了大部分通用事件的scripts,它们是用标准的AIX命令和HACMP工具来写的)。其过程如下图所示。每个节点上都有至少两块网卡,一块是service adapter,提供对外服务,另一块是standby adapter,它的存在只有cluster manager知道,应用和client并不知道。一旦发生swap-adapter事件后,cluster manager将原来的service adapter的IP地址转移到standby adapter上,而standby地址转移到故障网卡上,同时网络上其他节点进行ARP的刷新。网卡互换(swap-adapter)通常在几秒内就可完成,以太网为3秒,并且这种转换对应用和client来说是透明的,只发生延迟但连接并不中断。 网络故障如果发往nodeA上的service和standby网卡上的K-A包全都丢失,而RS232上的K-A仍然存在,那么HACMP断定nodeA仍然正常,是网络发生故障。此时HACMP执行一个network-down的事件的script,通常这个script并不做什么事,只提供一个用户自行定义其行为的接口,用户可以根据自己的网络结构,用户数,是否有替代路径,使用的通讯软件,应用软件等来自行设计网络发生故障后应采取的行为。 节点故障如果不仅网络上的K_A全部丢失,而且RS232上的K_A也丢失,那么HACMP断定该节点发生故障,一个node-down事件发生。此时将有资源的接管发生,即放在共享磁盘陈列上的资源将由备份节点接管,接管包括一系列操作:Aquiredisks,VaryonVG,Mountfilesystems,ExportNFSfilesystems,AssumeIPnetworkAddress,Restarthighlyavailableapplications,其中,IP地址接管和应用的重启是由HACMP来实现,而其它是由AIX来完成。当整个节点发生故障时,HACMP将故障节点的serviceIPaddress转移到备份节点上,使网络上的client仍然使用这个IP地址,这个过程称为IP地址接管(IPAT),如上图所示。当一个节点down掉后,如果设置了IP地址接管,网络上的clients会自动连接到接管节点上;同样,如果设置了应用接管,该应用会在接管节点上自动重启,从而使系统能继续对外服务。对于要实现接管的应用,只需在HACMP中把它们设置成applicationserver,并告诉HACMP启动这个应用的startscript的全路径名和停止该应用的stopscript的全路径名。由此可见,应用接管的配置在HACMP中十分简单,重要的是startscript和stopscript的写作,这需要用户对自己应用的了解。 其他故障HACMP只去检测网卡、网络和节点是否发生故障,并作出相应的地址转换、资源接管动作,那么,如果是这三种故障之外的其他故障时,HACMP就不做任何事了吗?答案是,如果你不作任何设置,那么HACMP缺省不作任何动作,但你可以作一定的设置,使HACMP可以发挥它的作用缺。下面我们就来看看HACMP还可以做些什么。硬盘故障一般我们都将硬盘设置成RAID5方式或mirror方式,从而提供硬盘的高可用性。RAID5将奇偶较验位分散在硬盘组中,因此当一组内的一个硬盘坏掉,组内的其他硬盘可以通过奇偶较验位将该硬盘上的数据恢复出来。RAID5方式一般是由硬件实现的,如7135的SCSIcontroller。但如果同一组内的两个硬盘同时坏掉,该组硬盘的数据很可能就会全部丢失。mirror方式是将同一个数据写到至少两个物理位置上,因此它的效率没有RAID-5高,而且需要一倍于实际数据量的容量,但mirror的硬盘的安全性比RAID-5高,而且它易于实现,只需通过AIX中的LVM就可以很方便地设置。以前只有SCSI设备才能做到HACMP环境下的RAID5,但从2000年7月31日开始,7133SSA也支持HACMP下的RAID5。因此,当硬盘发生故障时,AIX和硬盘自己可以提供其可用性,HACMP不需要做任何事情。硬盘控制卡存储设备连接到主机上都必须通过一块控制卡,SCSI设备是SCSIadapter,SSA设备是SSAadapter,如果这块卡坏掉,与之连接的外设就无法被利用。有几种办法可以解决这个问题。一种办法是在主机上用多个adapter。如图所示,每个主机上都有三块adapter,分别连接三份mirror的数据,因此无论是硬盘坏掉,还是adapter坏掉,所有的好的数据还是可以被主机访问,不会出现单点故障。这种方法实现起来并不难,但必须配置多块adapter,而且必须采用数据mirror方式。这种方法也不用HACMP。另一种方法可以只用一块adapter,它是利用HACMP所提供的ErrorNotificationFacility(错误通告机制)来解决。ErrorNotificationFacility是HACMP提供的一个监控工具,任何报告给AIX的错误(error)都能被捕获被采取相应措施。HACMP提供了一个Smit界面,使配置非常简单。举几个例子。上例中,当adapter0发生永久性故障并报告给AIX时,AIX将执行halt-q的命令,这将使adapter故障升级为节点故障,这时HACMP将接手工作。这种将设备故障升级为节点故障的方法有时十分有用。例2中,error-notify-1是一个script,它是这样写的:其中参数为:$1SequenceNumber$2ErrorID$3ErrorClass$4ErrorType$5Alertflagvalue$6Resourcename$7Resourcetype$8Resourceclass它们都是AIX的错误报告中的参数,可以在AIX中用errpt命令来看。因此,一旦有永久性的软件故障报告给AIX,AIX将执行script:error_notify_1,使在屏幕上显示出错提示,并将有关出错信息mail给系统管理员。这个例子中HACMP实际上仍未做任何动作,但它提供了一个错误监控的工具和界面。我们已知道,用LVM可实现硬盘镜像,当一个盘坏掉,仍有一份数据在镜像盘里,数据仍可进行读写,但此时数据不再有可用性,若镜像盘也坏掉则数据会全部丢失。所以在此例中,PV丢失(LVM_PVMISS)的信息会大幅地显示在控制台屏幕上,从而提醒用户去仔细查看errorlog,找出故障并修复它。同样,此例中HACMP提供了对发生的故障的监控界面。应用故障如果用户的应用中有kernalcall的调用,或以root身份来启动等,一旦应用发生故障,很容易导致操作系统down掉,发生死机,这时实际等于节点故障,所以HACMP会采取相应的接管措施。但如果只是应用自身死掉,AIX仍正常运行,这时HACMP最多利用ErrorNotificationFacility来提供监控功能,对应用本身不采取任何动作。但如果应用中调用了AIX的SRC(SystemResourceController)机制所提供的API接口,就可以使应用在down掉后能够自动重新启动。除了SRC提供的API接口外,HACMP中的clinfo也提供这样的API。clinfo是clusterInformationdaemon,它负责维护整个cluster的状态的信息,clinfoAPI允许应用程序利用这些状态信息从而采取相应行动。HACMP故障如果cluster中节点的HACMP进程down掉,HACMP会将其升级为节点故障,从而发生资源的接管。现在我们来小结一下。可以看到,HACMP只全权负责诊断网卡故障、网络故障和节点故障这三大类故障,并负责实现IP地址转换或接管,以及整个系统资源(硬件、文件、系统、应用程序,等等)的接管的工作。对于这三

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论