存储、集群双机热备方案_第1页
存储、集群双机热备方案_第2页
存储、集群双机热备方案_第3页
存储、集群双机热备方案_第4页
存储、集群双机热备方案_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、存储集群双机热备方案目 录一、前言 . 31、公司简介 . . 32、企业构想 . . 33、背景资料 . . 4二、需求分析 . 4三、方案设计 . 51双机容错基本架构 . . 52、软件容错原理 . . 63、设计原则 . . 74、拓扑结构图 . . 7四、方案介绍 . 10方案一 1对1数据库服务器应用 . . 10方案二 CLUSTER 数据库服务器应用 . 11五、设备选型 ·················&#

2、183;·················································&#

3、183;······································· 12方案1:双机热备+冷机备份 . . 12方案2: 群集+负载均衡+冷机备份 . 13六、售后服务 ·

4、3;·················································

5、3;·················································

6、3;····· 151、技术支持与服务 . . 152、用户培训 . . 15一、前言1.1、公司简介公司名称 成立于2000年, 专业从事网络安全设备营销。随着业务的迅速发展,经历了从计算机营销到综合系统集成的飞跃发展。从成立至今已完成数百个网络工程,为政府、银行、公安、交通、电信、电力等行业提供了IT 相关系统集成项目项目和硬件安全产品,并取得销售思科、华为、安达通、IBM 、HP 、Microsoft 等产品上海地区市场名列前茅的骄人业绩。公司名称 致力于实现网络商务模式的转型。作为国内领先的联网和安全性解决方案供应商,公司名称 对依赖网

7、络获得战略性收益的客户一直给予密切关注。公司的客户来自全国各行各业,包括主要的网络运营商、企业、政府机构以及研究和教育机构等。公司名称 推出的一系列互联网解决方案,提供所需的安全性和性能来支持国内大型、复杂、要求严格的关键网络,其中包括国内的20余家企事业和政府机关.公司名称 成立的唯一宗旨是-企业以诚信为本 安全以创新为魂。今天,公司名称 通过以下努力,帮助国内客户转变他们的网络经济模式,从而建立强大的竞争优势:(1)提出合理的解决方案,以抵御日益频繁复杂的攻击(2)利用网络应用和服务来取得市场竞争优势。(3)为客户和业务合作伙伴提供安全的定制方式来接入远程资源1.2、企业构想公司名称 的构

8、想是建立一个新型公共安全网络,将互联网广泛的连接性和专用网络有保障的性能和安全性完美地结合起来。公司名称 正与业界顶尖的合作伙伴协作,通过先进的技术和高科产品来实施这个构想。使我们和国内各大企业可通过一个新型公共网络来获得有保障的安全性能来支持高级应用。公司名称 正在帮助客户改进关键网络的经济模式、安全性以及性能。凭借国际上要求最严格的网络所开发安全产品,公司名称 正致力于使联网超越低价商品化连接性的境界。公司名称 正推动国内各行业的网络转型,将今天的" 尽力而为" 网络改造成可靠、安全的高速网络,以满足今天和未来应用的需要。1.3、背景资料随着计算机系统的日益庞大,应用的

9、增多,客户要求计算机网络系统具有高可靠,高可用性,而网络系统是否能够可靠、高速、稳定的运行取决于网络的心脏服务器是否有最佳的容错,备份手段,已经成为一个日渐突出的问题。根据相关机构的调查表明,在服务器的硬件中,最容易发生故障的仍然是可动的机械部分即硬盘(故障发生率为52%),其次是内存(占23%)和电源(占6%),三者之和约占硬件故障的80%以上。但是,在目前的服务器中,对硬盘,内存,电源所实行的基本可靠性措施可以说已经相当完备。中档以上服务器可以利用标准件或可选件来配置磁盘控制器和冗余电源。所用的机器中都配置了高可靠性的ECC 内存,基本上消除了由典型故障所造成的停机事故。在软件故障中,WI

10、NDOWS NT 的事故约占60%,由应用引起的故障约占40%。群集备份技术是解决由软件(或硬件 引起可靠性降低的有效措施。群集技术是用网络将两个以上的服务器连接起来,当一台服务器停机时,集群中的其他服务器在保证自身业务的基础上,将停机服务器的业务接管。二、需求分析贵单位现有1台IBM235(志强3.0/1G内存/73G*3/RAID5/冗余电源/Windows2003标准版),作为全厂的主域控制器,控制局域网内部(不能上Internet )300用户和300台计算机,07年预计增加到400用户和400台计算机;安装有网络版卡巴斯基主控台和杀毒软件;提供网络版绘图软件的解密服务,约50用户;最

11、主要的工作是提供SQL Server 数据服务,装有SQL 2000 OEM版,目前只提供数据服务供50左右使用,即将增加110用户,同时提供数据和图片服务(每日数据量约为条写入;将生产用图纸存入数据库,供用户浏览,日增加量约为200张30K 左右的jpg 图片)估计每用户同时开启最大进程为20条(20*160=320条)。1台IBM236(志强3.2/2G内存/146G*3/RAID5/冗余电源/Windows2003标准版),作为全厂的备份域控制器,最主要的工作是提供SQL Server数据服务,装有SQL 2000 标准版,为全厂考勤系统提供数据服务,约50用户使用。1台IBM235(志

12、强3.0/1G内存/73G*2/ Windows2003标准版)提供Internet 网络的简单代理和域服务。机房目前使用山特C6KW/2H供电系统;核心交换机尚有4个1000M 电口、4个单模光口和4个多模光口可用。总厂约300台计算机没有存储和备份系统。根据现有网络环境中服务器使用现状,将现有服务器之间连接到AbeStore2615磁盘阵列,磁盘阵列系统做为数据库服务器的存储。主机服务器和备机服务器与AbeStore 双机软件配套使用。双机服务器是一组独立的服务器,运行UPM 双机软件服务,并象单个系统一样进做。通过运行着UPM 应用服务的服务器编组,可组成一级服务器双机热备. 从而对资源

13、和应用程序提供高可用的、可扩展的、可管理性的。双机的目的是,在出现故障或断电的情况下,保证客户对资源和应用程序的访问. 如果群集里的服务器由于故障或维护的缘故, 不可用,资源和应用程序将移到其它可用群集节点上. 保证服务的不间断工作三、方案设计3.1、双机容错基本架构双机容错的目的在于保证数据永不丢失和系统永不停机,采用智能型磁盘阵列柜可保证数据永不丢失,采用双机容错软件可保证系统永不停机。它的基本架构共分两种模式:双机互备援(Dual Active)模式和双机热备份(Hot Standby)模式。1)双机互备援(Dual Active)基本简介所谓双机热备援就是两台主机均为工作机,在正常情况

14、下,两台工作机均为信息系统提供支持,并互相监视对方的运行情况。当一台主机出现异常时,不能支持信息系统正常运营,另一主机则主动接管(Take Over )异常机的工作,继续主持信息的运营,从而保证信息系统能够不间断的运行,而达到不停机的功能(Non-Stop ),但正常运行主机的负载(Loading )会有所增加。此时必须尽快将异常机修复以缩短正常机所接管的工作切换回忆备修复的异常机。切换时机(Take Over) 系统软件或应用软件造成服务器宕机 服务器没有宕机,但系统软件或应用软件工作不正常 SCSI 卡损坏,造成服务器与磁盘阵列无法存取数据 服务器内硬件损坏,造成服务器宕机 服务器不正常关

15、机2)双机热备份(Hot Standby)基本简介所谓双机热备份就是一台主机为工作机(Primary Server),另一台主机为备份机(Standy Server ),在系统正常情况下,工作机为信息系统提供支持,备份机监视工作机的运行情况(工作机也同时监视备份机是否正常,有时备份机因某种原因出现异常,工作机科尽早通知系统管理员解决,确保下一次切换的可靠性)。当工作机出现异常,不能支持信息系统运营时,备份机主动接管(Take Over)工作机的工作,继续支持信息的运营,从而保证信息系统能够不间断的运行(Non-Stop )。工作机经过修复正常后,系统管理员通过管理命令或经由以人工或自动的方式将

16、备份机的 工作切换回工作机;也可以激活监视程序,监视备份机的运行情况,此时,原来的备份机就成了工作机,而原来的工作机就成了备份机。切换时机(Take Over) 系统软件或应用软件造成服务器宕机 服务器没有宕机,但系统软件或应用软件工作不正常 SCSI 卡损坏,造成服务器与磁盘阵列无法存取数据 服务器内硬件损坏,造成服务器宕机 服务器不正常关机3.2、软件容错原理UPM容错软件提供了一个完全容错的软件解决方案,并提供数据、应用程序和通信资源的高度可用性。UPM 容错软件不需要任何特别的容错硬件, 并访问特定节点的配置数据。UPM 容错软件会自动地提供错误检测和现场恢复。在出现故障的情况下,UP

17、M 容错软件会将保护资源自动转换到一个根据预先设定好优先权的系统。在实际进行切换用户时, 会经历一个十分短暂的休眠,但是,当系统完成了切换操作后,UPM 容错软件会在所选择的节点上自动地恢复操作。1、心跳故障检测HeartbeatUPM 容错软件在集群节点间保持着间歇的通信信号,也叫做心跳信号,是错误检测的一个机制。即通过每一个通信路径,在两个对等系统之间进行周期性的握手, 如果连续没有收到的心跳信号到了一定的数目,UPM 容错软件就把这条路径标示为失效(红色)。如果你只定义了一条通信路径,当UPM 容错软件把这唯一的一条通信路径标为失效时, UPM容错软件便立即开始恢复过程。然而,如果你有冗

18、余路径, UPM容错软件能够通过第二条路径确定是系统故障还是只是通信路径有问题。如果UPM 容错软件开启优先级第二的通信路径并收到了心跳信号,它就不开始切换动作,而只需要把第一条通信路径标成红色(失效),作为信号告诉你需要修复有故障的路径。一般情况下UPM 容错软件 只在下列事件发生时,启动系统恢复功能:所有的通信路径故障。如果所有节点都没能收到心跳信号, 把所有通信路径都标为失效, UPM 容错软件开始安全检查。安全检查失败。当所有通信路径故障时,UPM 容错软件向整个网络发出安全检查信号。如果信号指出配对系统还“活”着的时候,UPM 容错软件不启动切换机制。如果安全检查没从配对节点返回信号

19、,UPM 容错软件就开始切换动作。因而,为了减少由于潜在的通讯错误所引起的不必要的系统切换,建议您使用多条通信路径。2、通信路径UPM容错软件支持在节点之间和心跳通讯中,使用如下通讯路径:(1 Heartbest,心跳。你可以使用任何的网络硬件接口,只要它能够支持TCP/IP的通讯协议。一般是一组服务器上直联的两块网卡,这样的硬件包括:以太网、快速以网。(2 TCP/IP,既公网。当Heartbeat 心跳出现故障的时候,UPM 容错软件会启动TCP/IP的检测。这样的硬件包括:以太网、快速以网。UPM 容错软件假定当通过心跳信号检测其它服务器失败时,则认为此服务器是关闭的。因此,为了避免不必

20、要的失效切换,最好建立两种以上独立的物理路径,使用至少两种心跳。例如,如果两个服务器被一个心跳连接起来,并且,从属服务器来的心跳信号无法被主服务器所检测到,则下面之一是可能引起这一现象的原因:服务器的全部网卡或端口失败电缆失效主服务器暂时挂起主服务器失败失效切换只可能在最后一种情况下才发生。因此,节点间的多种通信路径可以帮助避免不必要的失效切换。3.3、设计原则针对现有的情况,主机系统是由3台高端服务器组成的服务器群组,功能是对用户数据进行存储,对进入系统的信息进行处理。要求此系统必须具有稳定性、可靠性、安全性、数据处理能力强、响应迅速的特点。系统要保证有强大的处理能力,保证具有联机事务处理(

21、OLTP )及联机分析(OLAP )能力:支持多处理器的SMP 结构,可平滑长级;调整系统总线,为处理器、内存、I/O通道之间提供调整互联,提供调整的数据吞吐率,可以在超负荷负载下获得持续稳定的高性能。服务器系统要求支持足够的内存,满足用户对数据库大量数据、信息调用的需求;大容量的磁盘存储能力和高性能的磁盘I/O性能,可以在海量存储的技术上,快速响应来自其化信息终端、局端的服务请求。目前主流的DDR 、交叉存取技术等可以在系统上面实现平滑升级和过渡,以满足系统工作需求.系统要求易于扩展,具备灵活的升级空间:包括CPU 数、I/O接口卡、内存、硬盘和多个系统扩展槽,为些后的系统扩充下良好的扩展基

22、础。在性能提升和扩展上,一方面系统支持后来更好的计算机技术,可以在单机上进行计算性能的升级,另一方面,系统支持集群计算技术,可以方便、灵活的进行系统性能的横向扩展,实现多台服务器的集群。后台的存储系统, 采用的技术、产品先进,给予目前主流的标准、开放体系基础上,要有海量升级空间,能够满足当时和后来几年内的业务需求。整个系统要求具备高可靠性、可用性、可维护性和良好的兼容性,支持冗余、容错、热插拔等先进的服务器存储技术,在系统方便扩展的基础上,可以有效的避免网卡、电源、硬盘、风扇等的单点故障,更好的保证系统7*24永不停顿的工作.34、拓扑结构图主机服务器和备机服务器及AbeStore 磁盘阵列,

23、构企事业拓扑图 四、方案介绍SERVER1为用户的主域服务器,同时也是双机中的主机。主机上安装SQL 数据库,并将原额外域服务上的SQL 考勤数据库移到主机SERVER1上。当SERVER1出现故障时,SERVER2接管SQL 服务,并提供额外域的功能, 相关应用如下拓朴图:根据贵公司实际情况, 设计如下二套方案:方案1:1对1数据库服务器应用说明:1、在1号Server 系统中安装UPM 数据库保镖,设置成主站。 2、在2号Server 上安装UPM 数据库保镖,设置成从站3、UPM 数据库保镖正常运行后,2号Server 能够实时备份1号Serve 中的数据库数据4、在1号Server 宕

24、机的情况下,2号Serve 能接管对外提供服务,保证客户端的正常运行;5、当1号Server 修复后,能快速将2号Server 上数据恢复到1号Server 中。 方案2:CLUSTER 数据库服务器应用 说明:1、在1、2号server 组成的集群系统中安装UPM 数据库保镖for cluster版设置成主站。 2、在3号服务器上安装UPM 数据库保镖for cluster版设置成从站3、UPM 数据库保镖正常运行后,3号Server 能够实时备份集群磁盘柜中的数据库数据4、在集群中的1、2号机器同时宕机或磁盘柜损坏的情况下,3号Server 能接管集群对外提供服务,保证客户端的正常运行;5

25、、当主机房损坏设备完全修复后,能快速将3号Server 上数据恢复到集群存储中。五、设备选型在此设备选项型,依循保证性能稳定质量可靠可扩展性,并结合实际合理利用现有资源节省企业成本的原则。特选如下集群软件和硬件存储设备硬件:IBM 服务器三台,其中1台IBM235作为全厂的主域控制器,1台IBM236作为全厂的额外域控制器,1台IBM235提供Internet 网络的简单代理和域服务。如果做主域和额外域的双机,SQL 就必须整合在一起,由于用户实际数据量比较大,且以上机型的配置均已经不能满足100用户以上的访问,所以我们给用户建议使用志强3.0以上CPU ,2-4颗,4GB 以上内存,这样可以

26、进行整合改造。磁盘阵列:数据总量估计在1T 所有,日增长量估计在100M 左右。我们采用15盘位320M SCSI主机接口,SCSI 硬盘的阵列,单柜可提供4.5TB 的容量。我们对此有二种选购方案供贵公司参考:方案1:双机热备+冷机备份 说明:支持数据库系统:Orcale 、Sybase 、MS SQL Server等常见数据库;可以提供制造业所有信息系统的数据保护,覆盖大部分WINDOWS 服务器中的数据库。和力记易的数据库保镖可以提供数据库双机热备接管和本异地实时灾难备份等多种备份方式。方案2:群集+负载均衡+冷机备份产品SQL Svr Standard Edtn 2005 Win32

27、ChnSimp OLP NL 1 ProcWindows Svr Ent 2003 R2 ChnSimp OLP NL版本 中文标准 中文企业数量 备注 1 1个CPU 授权许可,连接客户端不受限制 1支持集群,支持负载均衡。AbeStdore2615磁盘阵列柜双主机通道 /15盘位磁盘阵列/自带RAID 控硬盘73/146/300G,80针,热插拔IBM 服务器 SYSTEM X3800处理器 英特尔® 至强® 处理器 MP 最大处理器数目 4最大内存 64GB PC2-3200 DDR II 最大硬盘数目 12RAID 支持 可选的 RAID-0、RAID-1、RAID

28、-5 (ServeRAID-8i )处理器(最大) Intel Xeon 处理器 MP, 高达 3.66 GHz(单核)和 3.30 GHz(双核)/667MHz 的前端总线网络接口 集成双千兆以太网 电源(标配/最大) 775W 2 或 3/3 热插拔 (N+1)融合了 64 位突破性技术、四处理器性能与高达 3.6TB 的高速内部存储量 支持高性能双核 Intel Xeon 处理器 MP,能够同时运行 32 位和 64 位应用程序,从而提供了升级空间和潜在投资保护三级内存保护和可选高级系统管理等高可用性特性有助于提高可靠性 支持新型 PCI-Express I/O 技术,以及旧的 PCI-X 2.0Backup Exec,Windows,System Recovery Server Edition,v6.5,LicenseBESR 备份主模块,可备份到不同系统平台,可备份到不同介质。盒式磁带的容量(原始的压缩的1) Ultrium 3:400/800GB Ultrium 2:200/400GB Ultrium 1:100/

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论