已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
双机热备方案目录1项目背景22集群系统介绍23需求分析84解决方案95产品报价116EXPRESSCLUSTER的特点及技术优势126.1故障侦测机制的强化126.2数据库监视选件(Database僵死状态杀手)136.3适用平台范围的扩大146.4提供异地灾备方案156.5简便的维护操作156.6简便易用的集群配置工具161 项目背景随着公司业务规模的不断扩大和数据量的不断攀升,公司现有的系统架构已经不能保证业务系统的安全有效的持续运行。业务的增加就意味着增加对支持业务系统的负载,任意故障对业务系统造成的中断都将造成一定的损失。当业务系统出现故障需要恢复时,依靠原有的人工修复可能需要很长的时间完成。为此,给公司带来了经济损失的同时也将会失去客户的信任。2 集群系统介绍HA (High Availability)集群一般提升系统可用性时,会认为对构成系统的组件进行冗余化,消除Single Point of Failure 是重要的。所谓Single Point of Failure 指的是计算机的构成要素(硬件的组件)因为只有一个,所以该处发生故障时会有使业务停止的弱点。所谓HA 集群是使用多台节点进行冗余化操作、将系统停止时间控制在最小限度,提升业务可用性(availability)的集群系统。某些骨干业务系统等的宕机会给业务带来很大影响,因此此类系统不允许停止,需要导入HA 集群。图 2-1 HA 集群构成图HA 集群可分为共享磁盘型和镜像磁盘型。以下开始逐一进行说明。a) 共享磁盘型集群系统中服务器间必须要交接数据。将这些数据从多个服务器放到象以SAN 连接的FibreChannel 磁盘阵列装置这样可以访问的外置磁盘(共享磁盘)上,通过该磁盘在服务器间交接数据即称为共享磁盘型集群系统。运行业务应用程序的服务器(当前服务器)发生故障时,集群系统查出故障并在交接业务的服务器(待机服务器)中自动运行业务应用程序,交接业务。这称为失效切换。集群系统交接的业务由磁盘、IP 地址、应用程序等资源构成。在没有集群化的系统中使用其它服务器重启应用程序时,客户端必须再次连接不同的IP 地址。但是多数的集群系统里不是以业务为单位给服务器分配IP,而是分配其他网络的IP地址(虚拟IP 地址)。因此客户端没必要去区分正在执行业务的是当前服务器还是待机服务器,如同连接同一个服务器一样,可以持续的运行业务。由于当前服务器宕机发生失效切换时,共享磁盘上的数据没有进行妥当的结束处理就交接给待机服务器。因此待机服务器中有必要对交接的数据进行逻辑检查。这与一般未集群化的系统宕机后重启时进行的处理是一样的。例如,如果是数据库就需要回滚及前滚的处理。由此客户端仅运行未提交的SQL 文就可以继续业务。故障发生后,被查出故障的服务器经过物理隔离修复后、只要连接集群系统就可以作为待机服务器恢复运行。重视业务连续性的实际操作中,也可以不进行组的故障恢复。如果必须要在原来的服务器上运行业务时,请移动组。图 2-2 从发生故障到恢复的流程出于失效切换处的服务器配置不够、双向待机引起超负荷等理由而希望在原来的服务器上运行业务时,原来节点的恢复作业完成后将暂时停止业务,在原来的节点上重启业务。将失效切换的组返回原来的服务器称为故障恢复。如图1-3 所示,只有1 个业务,待机服务器为不运行业务的待机形态称为单向待机。有2个以上业务,各自的节点既为当前服务器又为待机服务器的形态称为双向待机。图 2-3 HA 集群的运行形态b) 镜像磁盘型(纯软方式)上述共享磁盘型适用于大规模系统,但共享磁盘大体价格较高因此构筑系统的成本也会增大。于是,不使用共享磁盘,而是通过将各服务器磁盘在服务器间建立镜像,可以以更低的价格实现相同功能,这类集群系统称为镜像磁盘型集群系统。但是,由于需要在服务器间为数据建立镜像,因此不适用于需要大量数据的大规模系统。应用程序一发出Write 请求,数据镜像引擎就会在本地磁盘上写入数据。写入的数据通过心跳线也会给待机服务器分配Write 要求。所谓心跳线是连接在服务器之间的电缆,在集群系统中用于服务器的死活监视。镜像磁盘型中除死活监视外还用于数据的传送。待机服务器的数据镜像引擎通过将接收的数据写入待机服务器的本地磁盘中,使当前服务器和待机服务器间的数据实现同步。对于应用程序发出的Read 请求,仅从当前服务器的磁盘中读取。图 2-4 数据镜像的结构快照备份就是使用数据镜像的例子。因镜像磁盘型的集群系统在2 个地方持有共享数据,只需将待机服务器从集群分离,即可作为快照备份来保存数据。3 需求分析目前的系统架构中,Web应用系统对外提供业务支撑,将所有客户端的数据通过Web应用系统提交到数据库服务器中,采用的是典型的应用系统架构。针对这种应用系统架构,需要做到对应用系统进行保护,避免因任何应用服务器故障或网络故障导致的业务中断。4 解决方案综合以上需求分析和对应用系统目前状况的了解,以及应用系统未来的发展趋势,我们选择NEC ExpressCluster集群软件来实现应用系统的高可用。由于目前应用系统本身的物理性能远大于应用系统本身的需求,所以只需要考虑购买两台物理服务器,采用一对一的方案可以有效节省资金投入,同时又能实现对应用系统高可用安全性的要求。图 镜像型优点:1. 采用一对一的热备方式,有效的节省了对硬件的投入2. 通过实施的数据同步功能将数据实施复制到备机,使数据得到了冗余3. 此业务系统采用不同的网络连接作为同步数据的媒介,提高了数据同步效率4. 心跳链路的冗余功能使任何一个网络出现故障都不影响真个集群的工作5. 全方位的监测机制不仅可以监测磁盘、网卡、操作系统和服务进程的状态,还可以实现自我监视。无论出现任何故障,系统都可以快速切换到备机6. B/S的管理架构可以方便对集群的统一管理和部署7. 集群支持浮动IP,可以在切换后继续对外提供相同的IP地址,对客户端无需做任何配置,完全不需要人为干涉8. 集群软件本身支持故障通报功能,可以在第一时间将故障信息以短信和邮件等方式通知管理员9. 针对各类主流数据库及应用,可以支持深层次监视,避免因程序僵死导致的业务停顿缺点:1. 数据同步功能需要占用一定的系统资源2. 需要有专门的管理人员进行熟悉产品的配置及故障排除5 产品报价软件名称描述单价数量总价NEC_Expresscluster_for_Windows_BASE30主模块,支持阵列版集群模式(必选)NEC_Expresscluster_for_Windows_REPL30镜像模块(必选)NEC_Expresscluster_for_Windows_DBAG30数据库代理选件,可对数据库实现深层监视(可选)NEC_Expresscluster_for_Windows_Alert30报警选件,可在发生故障时通过邮件或短信通知管理员(可选)6 EXPRESSCLUSTER的特点及技术优势6.1 故障侦测机制的强化EXPRESSCLUSTER提供全方位的实时故障监视,可以监视网络、存储、服务器、操作系统、应用软件、EXPRESSCLUSTER自身服务状态、待机服务器上的软硬件资源的状态。EXPRESSCLUSTER的网络心跳通过系统的内核空间进行,不受系统负荷的影响。除了支持网络心跳外,还可以通过COM口、存储设备上的特定分区、以及Ping第三方的方式确认服务器的状态。除了对应用程序和服务进行常规级别的监视外(所谓常规级别的监视,即进程死活级别的监视),EXPRESSCLUSTER还提供了一系列监视选件产品,如Database Agent、Internet Server Agent、Application Server Agent、File Server Agent等,这些监视选件产品定期对应用程序进行实际的访问处理,探测应用的响应时间,返回结果等状态,从而实现对应用程序和服务的僵死状态(Stall)的监视,为用户的关键业务系统提供了更深层次的保护。EXPRESSCLUSTER的监视选件可以支持4个领域内的大部分主流应用,包括数据库服务器、互联网服务器、文件服务器和应用服务器等。6.2 数据库监视选件(Database僵死状态杀手)除了对应用程序和服务的常规级别的监视外(所谓常规监视即进程死活级别的监视), EXPRESSCLUSTER还提供了一系列监视选项产品,如Database Agent,Internet Server Agent, LAN Agent, File Server Agent等,这些监视选项产品可对EXPRESSCLUSTER上运行的数据库等应用程序和服务的僵死状态(Stall)进行监视,从而为用户的关键业务系统提供了更深层次的保护。 功能简介本选件支持的数据库软件如下所示: Oracle10g/Oracle 9i DB2 Universal Database (V8.1/V8.2)2 Sybase Adaptive Server Enterprise 12.5 PostgreSQL PowerGres Plus MySQL 监视方法概要本选件提供了可设置在脚本中的监控命令,以监视数据库软件的运行。一执行本监视命令,即开始持续以参数所指定的间隔对数据库软件进行监视处理,直到查出数据库软件异常。一旦查出异常,本监视命令马上结束。本监视命令通过在EXPRESSCLUSTER的失效切换组中的EXEC资源中描述脚本来使用。一旦查出数据库软件异常,监视命令就马上结束,根据EXEC资源的设置,使数据库软件发生失效切换或执行本地恢复等操作。6.3 适用平台范围的扩大EXPRESSCLUSTER支持目前国内几乎所有主流的Windows和Linux操作系统平台,如Windows NT/2000/2003、RedHat、TurboLinux、MiracleLinux、Novell SUSE Linux、RedFlag等。其硬件平台兼容性好,支持IA32、X86_64、IA64、PPC64等硬件平台,还可以支持FT服务器、刀片服务器等特殊用途的硬件设备。EXPRESSCLUSTER支持虚拟环境。当虚拟计算机上运行的业务发生故障时,EXPRESSCLUSTER可以将其切换到另外一个虚拟计算机。如果虚拟机软件本身发生故障,或者物理服务器发生故障,EXPRESSCLUSTER还能够将虚拟计算机整个切换到另外一台物理服务器上。除此之外,还可以利用虚拟计算机,对物理服务器进行备份。例如,如果希望利用一台服务器,分别对运行不同操作系统的物理服务器进行备份,利用虚拟技术与EXPRESSCLUSTER相结合,将很容易就可以实现。6.4 提供异地灾备方案EXPRESSCLUSTER在应用方式上的另一个创举就是将镜像型集群应用于异地灾备解决方案中。通常的异地灾备解决方案,对网络环境要求高、实施复杂、实现成本也比较昂贵。而利用镜像型集群软件的异地灾备解决方案,不但能够异地备份业务数据,还可以对软硬件资源进行监视,在主节点发生故障时,能够自动在备份节点上恢复业务,将业务服务的停止控制在最小限度内。并且,EXPRESSCLUSTER还针对单链路低带宽网络环境,对镜像复制功能进行了改造和强化。以前的镜像型集群中,为了保证两台服务器上数据的一致性,需要等待两台服务器上的写操作全部完成,才会进行下一步的处理。这样的处理机制在远程镜像结构中,由于网络的延迟和带宽的影响,会大大影响主服务器上业务的处理效率。而EXPRESSCLUSTER提供一种异步镜像的方式,可以将本地磁盘的写操作和远程镜像复制分开,回避远程复制对业务处理效率的影响。利用远程镜像型集群实现异地灾备,是一个性价比很高的低成本解决方案。特别是对小规模系统的容灾需求,是一个非常好的选择。6.5 简便的维护操作EXPRESSCLUSTER提供基于B/S结构的标准GUI用户界面,采用树状层级显示,集群架构清楚明了。基于Java的开发技术,支持远程管理与操作,可在统一的界面下,用统一的方式同时管理多个不同平台上的集群(Windows与Linux集群均可),在集群各个节点上可以看到同样详细的管理信息和管理功能。可以在日志视图中显示系统的详细信息,便于管理者及时发现集群的各种问题。在发生故障或进行切换时,系统可以自动向管理员发送故障通知邮件。还可以通过外接的网络报警灯设备,进行声光方式的故障报警。这样极大的方便了系统管理员的操作和管理。6.6 简便易用的集群配置工具EXPRESSC
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年印刷设计师招聘面试题库及参考答案
- 2025年商业智能分析师招聘面试题库及参考答案
- 2025年视频营销专员招聘面试参考题库及答案
- 2025年商品经理招聘面试参考题库及答案
- 2025年行为经济学研究员招聘面试题库及参考答案
- 2025年数据输入专员招聘面试参考题库及答案
- 2025年民意调查员招聘面试题库及参考答案
- 2025年版权管理员招聘面试题库及参考答案
- 2025年生产主管招聘面试参考题库及答案
- 2025年拍摄制片人招聘面试题库及参考答案
- 2025-2030全球及中国航空航天风洞试验服务行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- T-CSTM 00455-2021 预涂卷材用粉末涂料
- 电气用电安全知识培训
- 酒店点菜技巧培训
- 2025年心理b证笔试试题及答案
- 2024-2025学年新乡市一中八年级上册期末考试数学试卷(含部分答案)
- 高一上学期统编版(2019)必修中外历史纲要上翻书大赛课件
- 《海南历史文化》课件
- 《初级会计实务》(第五版) 第三章 流动资产
- 主变防火墙脚手架搭设施工安全技术交底
- 三减三健课件
评论
0/150
提交评论