IBM x365与磁盘柜EXP400在windows下的双机解决方案.doc_第1页
IBM x365与磁盘柜EXP400在windows下的双机解决方案.doc_第2页
IBM x365与磁盘柜EXP400在windows下的双机解决方案.doc_第3页
IBM x365与磁盘柜EXP400在windows下的双机解决方案.doc_第4页
IBM x365与磁盘柜EXP400在windows下的双机解决方案.doc_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

IBM eServer xSeries 365 & EXP400在Windwos 2000/2003下的双机解决方案一:前 言在今天的商务应用系统中,稳定持续的系统运行时间变得越来越重要,而传统意义中的小型机系统使得普通用户望而却步。用户需用的是更高的可用性以及更低的成本。 集群系统是一种提供高可用性、改善性能和增强企业应用软件可管理性的有效途径。随着基于Intel平台的服务器业已成为关键性业务和应用的主流服务器,集群技术的应用也日益广泛。 二:高可用性集群所谓集群,就是共同为客户机提供网络资源的一组计算机系统。而其中的每一台提供服务的计算机,我们称之为节点。当一个节点不可用或者不能处理客户的请求时,该请求将会转到另外的可用节点来处理,而这些对于客户端来说,它根本不必关心这些要使用的资源的具体位置,集群系统会自动完成。(详细介绍请见附录)集群的具体实现如下图:三:IBM eServer xSeries在Windows 2000/2003下的双机解决方案xSeries 在Windows 2000/w2003下的双机解决方案中硬件采用两台相同的xSeries服务器和共享磁盘柜EXP400,双机软件采用微软的MSCS (Microsoft Cluster Server),它捆绑在Windows 2000 Advanced Server和Windows 2003 企业版中。局域网X365服务器x365服务器EXP400磁盘柜 IBM双机解决方案给客户带来的好处是:- 高可用性:x365服务器采用高可靠性部件,同时提供了很多冗余组件,保证了单台服务器的高可用性;MSCS能够自动检测应用或服务器故障,并可将其在备用服务器上快速重新启动;而用户只会体验到瞬间的服务暂停。- 高性能:x365支持四路高速Intel Xeon MP处理器,采用第二代EXA设计,保证整个系统的高性能。- 高可管理性:MSCS使管理员能够快速检查所有集群资源的状态,并轻松地将工作负载分配给集群之中的不同服务器。这对于人工负载平衡十分有用,并且无需将重要数据和应用脱机即可对服务器进行“滚动升级”。IBM Director 帮助管理员更轻松的管理集群服务器,提高工作效率。四:IBM eServer xSeries 365 服务器性能简介 要点 第二代IBM 企业级X-架构硬件,提供出色的性能和可用性 节约空间的3U设计,提供强大的功能以运行资源密集型应用程序,同时有助于降低成本 远程管理功能有助于提升工作效率并保持更高的系统可用性高性能、低密度IBM eServer xSeries 365 是采用灵活的4路处理器,更高的机柜密度和强大管理功能设计的机架优化服务器,提供领先的性能/价格比和投资保护特性。第二代IBM 企业级X-架构(EXA)设计和运行速度高达2.8GHz的Intel Xeon处理器MP提供强大的功能以运行关键任务应用,例如企业资源规划(ERP)、数据库和协作型应用等。每套系统所提供的高达32GB 内存满足资源密集型应用程序的运行需要。 紧凑式的3U结构设计占用更小的数据中心空间,因此有助于降低成本。x365 服务器专门设计提供高达876GB内置数据存储功能,有助于降低外置数据存储的要求。出色的可靠性采用多种组件的冗余设计,x365 服务器有助于避免硬件失效错误并能够创建群集系统以防止出现灾难性结果。新的N+N 电源提供冗余特性并简化机柜环境安装。除了通用热插拔和冗余组件外,x365服务器内存子系统还提供第三级的冗余保护的镜像功能,以强化Memory ProteXion和第三代Chipkill技术。可扩展,按照系统扩展付费EXA技术和可选的IBM RXE-100 远程扩展柜选件支持低成本的PCI 和PCI-X 扩展功能以实现独特的按照系统扩展付费的I/O 可扩展性。x365 服务器超乎寻常的I/O 功能极具成本效益,能够替换过时的终端服务设备或昂贵的路由器设备等。 完备的管理功能系统集成远程管理适配器(RSA)II ,通过连续监控子系统提供真正的系统监控功能有助于保证服务器的可用性。此外,IBM Director 还便于降低培训成本的同时提高工作效率。xSeries 365 服务器技术特性概览结构设计机柜/3U处理器Intel Xeon处理器MP,运行速度高达3.0 GHz处理器数目(标配/最大)1/4或2/4高速缓存(最大)1MB、2MB或4MB内存(标配/最大)1GB/32GB或2GB/32GB PC2100 DDR Chipkill扩展槽6个标准64位PCI-X插槽;RXE 端口使用可选的RXE-100远程扩展封装支持12个额外的64-位插槽磁盘托架(总计/热插拔)6/6最大内置数据存储876GB(支持36GB、73GB和146GB硬盘驱动器)网络集成双10/100/1000以太网电源(标配/最大)950W 1或2/2热插拔热插拔组件电源、风扇、硬盘驱动器和PCI-X 适配器RAID 支持标准配置RAID-1,可选RAID-5系统管理自动服务器重新启动、IBM Director、IBM ServerGuide 、集成远程管理适配器 II、光通路诊断、预测故障分析支持硬盘驱动器、处理器、稳压模块、风扇和内存、局域网络唤醒操作系统支持Microsoft Windows Server 2003 (标准版和企业版)、Linux (Red Hat, SuSE, Caldera)、Microsoft Windows 2000 Server、 Microsoft Windows 2000 Advanced Server、Microsoft Windows 2000 Advanced Server with MSCS、VMware ESX Serve 、 Novell Netware 和 Citrix MetaFrame有限保修1年和3年现场有限保修五:EXP400 磁盘柜性能简介 EXP400存储扩展单元 EXP400采用了Ultra320 SCSI技术,数据传输速度比Ultra160 SCSI快一倍。EXP400拥有14个超薄HDD槽位,可以容纳最大2TB的存储量。为提高可靠性,EXP400支持HDD和自身风扇的PFA。可用性和可管理性 IBM EXP存储扩展单元设计时十分注重其可靠性,它是系统可用性及群集方案的最佳选择。所有xSeries EXP 单元都支持磁盘驱动器的预测故障分析(PFA)使您可以了解何时一个HDD表现异常并可能发生故障。热插拔能力使您在PFA判定的HDD发生故障前方便地进行替换。更妙的是,经PFA判定故障的硬盘在保修期内可以更换。EXP400有内置的LED指示器,能够预先对故障、温度超标和其它异常发出警告。 所有IBM EXP单元都提供了冗余、热插拔风扇和热插拔电源。另外,EXP400的双冗余电源使您可以更加放心。热插拔和SAF-TE(SCSI Accessed Fault-Tolerant Enclosures)能力使您可以在不打断重要计算服务的情况下对部件进行替换和升级。 您可以利用IBM DirectorTM系统管理软件方便地管理EXP400单元和其中的SCSI HDD。IBM Director和相关的生命周期工具拥有极佳的本地或远程控制能力,增强了您的管理能力。例如,容量管理器(Capacity Manager)提醒您注意当前和即将出现的性能瓶颈,帮您在整个系统生命期间跟上变化的数据存储需求。可扩展性和容量 IBM存储扩展单元提供了极大的存储能力,并且扩展性很强,能够满足您企业的存储需求。每个扩展单元都是一个3U的机架式扩展柜;一个标准的42U机架可以放置14个单元。EXP400单元还有可选的机架到塔式转换套件,使配置更加灵活。为获得高性能和高容量,EXP400支持10,000rpm和15000rpm的HDD。这种单元也都采用了xSeries集中支架(Converged Carrier),这一可互换的支架便于HDD的安装以及在大多数xSeries服务器和EXP单元之间的转移。IBM xSeries 存储扩展单元配置一览表型号EXP400 P/N 17331RU 磁盘协议Ultra320 SCSI 托架 14个热插拔,超薄 支持的HDD36.4GB、72.3GB、146.8GB 10,000rpm或15,000rpm 每个单元的最大容量 2TB 每个42U托架的最大容量28TB 最大数据传输速度320MBps 最大电缆长度 20m 形状/高度 机架/3U 塔式转换可选 总线支持 单一/双SCSI 电源 两个500W,热插拔、冗余风扇 电源内的双冗余 预测故障分析(PFA)硬盘和风扇支持数据电缆 标配2m(6.5ft);可选4m(13ft)和20m(65ft) 六:配置实例注意:下面的配置实例仅供参考,并不完全适合应用于任何客户安装环境。有关您特定的安装配置需求,请联系IBM 商业合作伙伴或IBM 市场销售代表获得相应支持服务。 部件号描述数量xSeries365 Node 1 - Clustered x365 4Way 3.0Ghz 4GB RAM88626RXx365, 2xXeon MP 3.0GHz/400MHz, 4MB, 2GB, O/Bay, 2x950W p/s, Rack113N0710 3.0GHz/400MHz-4MB L3 Cache Xeon Processor MP233L5038512MB PC2100 CL2.5 ECC DDR SDRAM RDIMM432P0033IBM ServeRAID-6M SCSI Controller132P073436.4GB 15K-rpm Ultra320 SCSI Hot-Swap SL HDD2xSeries365 Node 2 - Clustered x365 4Way 3.0Ghz 4GB RAM88626RXx365, 2xXeon MP 3.0GHz/400MHz, 4MB, 2GB, O/Bay, 2x950W p/s, Rack113N0710 3.0GHz/400MHz-4MB L3 Cache Xeon Processor MP233L5038512MB PC2100 CL2.5 ECC DDR SDRAM RDIMM432P0033IBM ServeRAID-6M SCSI Controller132P073436.4GB 15K-rpm Ultra320 SCSI Hot-Swap SL HDD2External Storage17331RXIBM EXP400 Storage Expansion Unit, One ESM standard 159P5018SCSI Bus Expander and Enclosure Services Module (ESM)103K93102 M SCSI Cable132P073573.4GB 15Krpm Ultra320 SCSI Hot-swap HDD13附录:计算机集群技术概述 随着计算机技术的发展和越来越广泛的应用,越来越多的依赖于计算机技术的应用系统走进了我们的工作和生活。在给我们带来方便和效率的同时,也使得各行各业对于计算机技术的依赖程度越来越高。尽管随着计算机技术以日新月异的速度发展,单台计算机的性能和可靠性越来越好,但还是有许多现实的要求是单台计算机难以达到的。看看下面的例子: *某银行需要一台服务器来储存财务数据。他要求这台计算机即使是在机房坍塌的情况下也能够被各个业务网点访问。 在这些情况下,往往需要将多台计算机组织起来进行协同工作来模拟一台功能更强大解决问题。这种技术称为集群技术。目前应用最为广泛的集群计算技术可以分为三大类:高可用性集群技术、高性能计算集群技术和高可扩展性集群技术。下面我们将主要介绍高可用性群集系统。高可用性集群 高可用性集群,英文原文为High Availability Cluster, 简称HA Cluster,是指以减少服务中断(宕机)时间为目的的服务器集群技术。 随着全球经济的增长,世界各地各种各样的组织对IT系统的依赖都在不断增加,电子贸易使得商务一周七天24小时不间断的进行成为了可能。新的强大的应用程序使得商业和社会机构对日常操作的计算机化要求达到了空前的程度,趋势非常明显,我们无时无刻不依赖于稳定的计算机系统。 这种需求极速的增长,使得对系统可用性的要求变得非常重要,许多公司和组织的业务在很大程度上都依赖于计算机系统,任何的宕机都会造成严重的损失,关键IT系统的故障可能很快造成整个商业运作的瘫痪,每一分钟的宕机都意味着收入、生产和利润的损失,甚至于市场地位的削弱。IndustryBusiness OperationAverage Cost per Hour of DowntimeFinancialBrokerage operations$6.5 millionFinancialCredit card/sales authorization$2.6 millionMediaPay-per-view television$1.1 millionRetailHome Shopping (TV)$113.0 thousandRetailHome catalog sales$90.0 thousandTransportationAirline reservation$89.5 thousand 根据1998年Garter Group的统计我们可以看出,我们需要可以不间断使用的计算机系统,并且这种对高可用性系统和技术的需求还会不断的增长。 可用性是指一个系统保持在线并且可供访问,有很多因素会造成系统宕机,包括为了维护而有计划的宕机以及意外故障等,高可用性方案的目标就是使宕机时间以及故障恢复时间最小化,可以容忍的宕机时间明确的说明方案的全面性、复杂性和成本。Percent Availabledowntime/YearClassification99. 53.7 daysConventional99. 98.8 hoursAvailable99. 9952.6 minutesHighly Available99. 9995.3 minutesFault Resilient99. 999932 secondsFault Tolerant 为了提高整个系统的可用性,除了提高计算机各个部件的可靠性以外,一般情况下都会采用集群的方案。 所谓集群,就是共同为客户机提供网络资源的一组计算机系统。而其中的每一台提供服务的计算机,我们称之为节点。当一个节点不可用或者不能处理客户的请求时,该请求将会转到另外的可用节点来处理,而这些对于客户端来说,它根本不必关心这些要使用的资源的具体位置,集群系统会自动完成。 集群中节点可以以不同的方式来运行,这要看它们是如何设置的。在一个理想的两个节点的集群中,两个服务器都同时处于活动状态,也就是在两个节点上同时运行应用程序,当一个节点出现故障时,运行在出故障的节点上的应用程序就会转移到另外的没有出现故障的服务器上,这样一来,由于两个节点的工作现在由一个服务器来承担,自然会影响服务器的性能。 针对这种情况的解决方案是,在正常操作时,另一个节点处于备用状态,只有当活动的节点出现故障时该备用节点才会接管工作,但这并不是一个很经济的方案,因为你不得不买两个服务器来做一个服务器的工作。虽然当出现故障时不会对性能产生任何影响,但是在正常运行时的性能价格比并不太好。 从上面的工作方式出发,我们可以把集群分为下面几种(特别是两节点的集群)主/主 (Active/active) 这是最常用的集群模型,它提供了高可用性,并且在只有一个节点在线时提供可以接受的性能,该模型允许最大程度的利用硬件资源。每个节点都通过网络对客户机提供资源,每个节点的容量被定义好,使得性能达到最优,并且每个节点都可以在故障转移时临时接管另一个节点的工作。所有的服务在故障转移后仍保持可用,但是性能通常都会下降。主/从(Active/passive) 为了提供最大的可用性,以及对性能最小的影响,Active/passive模型需要一个在正常工作时处于备用状态,主节点处理客户机的请求,而备用节点处于空闲状态,当主节点出现故障时,备用节点会接管主节点的工作,继续为客户机提供服务,并且不会有任何性能上影响。混合型(Hybrid) 混合是上面两种模型的结合,只针对关键应用进行故障转移,这样可以对这些应用实现可用性的同时让非关键的应用在正常运作时也可以在服务器上运行。当出现故障时,出现故障的服务器上的不太关键的应用就不可用了,但是那些关键应用会转移到另一个可用的节点上,从而达到性能和容错两方面的平衡。下面针对高可用性集群,介绍一下它的工作原理。 在微软的MSCS(Microsoft Cluster Server)术语中,所有的应用程序、数据文件、磁盘、网络IP地址等都被称为资源,一些资源可以组成一个资源组,一个资源组存在于一个节点上,但同时只能在一个节点上,它是MSCS可以进行故障切换(FailOver)的最小单元。 在MSCS中,所有的资源都处于资源监视器的监视之下,资源监视器通过资源动态链接库文件与资源进行通信,这些资源动态链接库会侦测对应资源的状态,并通知资源监视器,之后,监视器再把信息提供给集群服务(Cluster Service),缺省情况下,集群服务会启动一个资源监视器来监视节点中的全部资源。 MSCS用依赖性来定义不同资源彼此之间的关系,MSCS会根据资源间的相互依赖关系来决定把这些资源变为在线或者是离线的顺序。举一个WEB服务器文件共享的例子,文件共享的资源需要硬盘驱动器来存储数据,把这些有关系的资源一起放在MSCS组中,要实现共享,就必须先把硬盘准备好。同时,为了完成文件共享,我们还需要准备好网络名称以及IP地址。 从上图可以看出,文件共享资源依赖于硬盘资源,网络名称资源依赖于IP地址资源,而对应的WEB服务刚依赖于文件共享和网络名称。 资源的存在可以分为五种状态 1、Offline,资源不能被别的资源或者客户机使用 2、Offline Pending,资源正处于Offline的过程中 3、Online,资源处于可用的状态 4、Online Pending,资源正处于Online的过程中 5、Failed,资源出现了MSCS无法解决的问题 前面已经提到,MSCS可以从一个节点故障切换到另一个节点的最小单元是资源组。被定义好的相关的资源放在同一个组中,并建立对应的依赖关系。以下图为例,如果节点A中的资源组1要移到节点B上的话,资源组1中的资源(资源A,资源B,资源C)也必须从节点A移到节点B才行。 在MSCS的资源中,有一个非常重要的资源,Quorum,它是一个可以被两个节点访问的物理硬盘,用来保存集群的信息。这些信息是用来维护集群的完整性以及使节点保持同步,特别是当节点不能与另一个节点通信的时候。Quorum盘在某一时刻只能被一个节点所拥有,并用来决定由哪个节点来拥有集群的所有资源。Quorum必须位于共享的磁盘子系统中,一般都是使用外接的磁盘柜。一般情况下,不建议把应用程序和数据保存到包含Quorum的硬盘上。 故障切换(Failover)是指把出现故障的节点上的资源重新定位到另一个可用的节点上。负责监视资源的资源监视器一旦发现资源出现故障,它就会通知集群服务,集群服务会根据事前定义好的策略触发

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论