




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
。业务连续性数据中心建设(2)- 网络业务连续性4 网络业务连续性网络业务连续性聚焦于确保网络操作在发生重大故障或灾难后尽可能快地恢复正常功能。其目标是限制一台设备、一个网络甚至整个数据中心发生故障后引起的服务中断。大多数解决办法将涉及设立备份站点以及需要时故障切换到该站点的流程。4.1 连续性规划对许多企业和,网络服务中断几分钟就可能造成损失收入和降低客户的信心。造成故障的原因是多种多样的,范围包括从电力故障到大面积的自然灾害。业务连续性规划目的是建立网络业务连续性流程、通过建立即使在最坏的情景下也能够恢复正常操作的流程来消除所面临的风险。网络业务连续性流程本节将介绍在开发一个网络业务连续性流程应当考虑在内的许多因素。图表示该流程包括的基本步骤:定义业务需求确定技术需求开发和修改业务连续性计划测试故障切换流程定义业务需求开发一个网络业务连续性计划的第一步是确定机构的需求。虽然所有系统是重要的,网络的某些区段也许比其它区段更加重要。确定需求最重要方面是把整个机构考虑在内。IT机构不应当依赖于自己的知识作出有关计算基础设施的最重要领域的重要决策。如果资源是无限的,多次复制网络环境也许是可能的。在现实世界中,最大可能性是预算和劳动力约束将把对故障和灾难的保护限制在合理的水平。一个现实的计划应当包括对宕机损失、数据丢失影响和网络各个方面的重要性的全面评估。最好能够,根据机构整个管理队伍的意见开发出一个关键系统的清单。确定技术需求现代IT网络一般将是复杂的。有许多相互依赖的设备,如交换器、路由器、防火墙和网络缓存设备等。由于这一清单不可能包括设备依赖于机构基础设施的细节。当规划业务连续性时,IT人员应当首先开发一个网络拓扑的高层概貌,也应当列举出关键的设备。目标是确保了解基础设施的基本水平(这将是所有其它系统需要的)。下一步是列举在故障切换流程事件中将需要哪些设备。核心的路由器、交换器和防火墙也许将是该清单上首要项目。下一步是确定支持网络上最重要的应用和服务所需的设备。要考虑的要素应当包括网络如何能够以减少的容量运行(特别是,如果预算不允许作完全的冗余)。准备实施业务连续性计划在网络中断事件中,未来实现业务连续性必须执行故障切换流程。但是,在采取这些步骤前,IT机构应当确保拥有所需的工具和信息,包括: 配置管理:跟踪网络配置文件是建立故障切换流程重要的第一步。在故障切换事件中,恢复这一信息将帮助把一个恢复到可用的状态。当作配置变化时,网络管理员必须确保变化被记录下、复制到任何后备和备用设备; 网络冗余管理:建立冗余是大多数业务连续性计划的主要工作。重要的是首先定义可接受的宕机界限和适当的故障切换时间。大多数企业级解决方案提供实现路由器、交换器、防火墙、内容缓存和其它网络设备自动故障切换的备用设备。重要的是要记住,在大多数故障切换场合下,该流程对用户将是明白易行的(虽然影响将有希望限于只需要重新建立少数几个联接);模拟灾难恢复操作任何恢复流程的一个重要但经常被忽视的方面是演习故障切换和业务连续性计划。演习这一流程有许多好处。首先,通过试运行,业务和技术人员可能将发现计划中可以改进地方。即使最好的计划也可能忽视“实际工作”执行时才能发现的某些细节。在最坏的情况下,一个关键系统也许完全被忽视了。或者,也许有各种节约时间的变化可以改善这一流程。模拟灾难恢复另一个主要好处是能够实践构建专业技术。IT 应当能够精通执行故障切换流程所需的技术。有一个测试恢复流程方面牢不可破的法则是:紧接着一个关键系统故障后没有时间开始学习如何恢复它。4.2 自动实现网络业务连续性当开发和准备一个业务连续性计划时,机构网络的许多方面必须加以考虑。对大多数机构,涉及的任务将需要做大量的工作。幸而,自动的数据中心管理工具能够帮助使得这一流程更加容易。例如,通过使用自动的网络发现工具,网络管理员能够方便地观察整个网络和发现依赖关系。通过使用配置管理工具(最好同时使用配置管理数据库,即CMDB),能够收集网络设备配置细节。保持备用站点的路由器、交换器和防火墙状态最新的流程也可以自动地执行。图4-2提供这一流程如何工作的例子。图 4-2: 使用数据中心自动化工具维护故障切换配置对大多数IT部门,开发一个网络业务连续性计划不是一件小事情。但是,通过使用关键任务流程自动化工具,可以更加有条不紊地完成这一关键任务。5.4.5 服务器业务连续性服务器业务连续实质就是服务器上支持关键任务流程的业务连续性。为此,首先要确定关键任务应用和支持它们的服务器,确定关键任务应用和服务器如果给予无限的资源,实施业务连续性将是很简单的:可以建立多重冗余环境,将可以方便地实现服务器业务连续性。在现实世界中,经济和技术约束使得这一流程要困难得多。因此,在考察建立灾难恢复机制的技术以前,IT管理层应当会见企业领导人确定必须保护的基础设施关键部分。假定并不是所有资源都得到完全的保护,重要的是确定每个重要资产的价值。划分优先度的第一步是建立IT部门最重要的高层功能的详细目录。例如,一个在线金融服务企业重重依赖于股票交易软件。其次,应当确定支持应用的技术细节。现代的应用将有许多不同的要求,包括网络联接和设备、授权和安全性服务以及许多物理计算机系统。为了为整个最终用户服务提供连续性,重要的是确保没有漏掉其中任何部件。IT管理层理论上将能够提供保护每个系统所需的费用。在大多数环境,这一流程可能是富有挑战性的,但对于确保建立一个可靠的业务连续性计划绝对是关键的。开发服务器的业务连续性计划当开发一个在发生灾难情况下管理服务器的计划时,重要的是记住要求实现业务连续的全面目标。系统和网络管理员经常将聚焦于高可用性的低级技术细节。例如,冗余的电源和RAID磁盘配置能够帮助减少宕机和数据丢失的可能性。但是,高可用性的全面途径应当包括与所有运营领域有关的细节。例如,即使保护了数据和硬件,实际的故障切换将如何发生?是否要求用户实施任何变化?什么是IT队伍的流程?在故障后立即发生也许是“重演”这一流程的最坏时间。业务连续性计划一般涉及几个主要步骤(见图),这一流程开始于确定必须保护哪些系统。然后应定义具体的业务和技术要求。最后,根据这些信息,机构将可以着手建立业务连续性计划: 确定关键任务应用和服务确定业务要求确定技术要求开发和实施一个业务连续性计划定义业务和技术要求与执行备份有关的最佳实践是基于要求在恢复中执行的实际流程。当开发业务连续性实施计划时,要考虑如下几个重要因素: 可接受的数据损失:虽然大多数业务经理不愿意考虑它,但是在发生灾难过程中潜在的数据丢失是难以避免的。企业应当提出一个现实的思想,即多大的数据丢失是可以接受的。一个重要的考虑是约计成本。投入1.2百万美元的来保证丢失交易不会超过2分钟是否值得?降低实施成本而把丢失交易时间延长到不超过1小时是否可以接受?其它考虑包括对实际生产系统的影响。例如,两阶段提交复制数据库服务器可能增加一个单一故障点,可能降低整体的生产性能; 自动的故障切换 :一个灾难或系统故障可以发生在任何时间。确保最高水平可用性的一个要求是自动故障切换。但是,就像其它因素一样这会带来很大的开支。为了实现无缝的故障切换,基础设施的许多方面必须作好准备。从服务器一侧开始,机器必须能够协调从实际服务中删除一个服务器、推动另一台服务器来取代它。这一流程通常需要第三台“见证”服务器。此外,网络基础设施和配置必须能够适应。最后,也许还要求在客户机侧作变化。虽然Web应用经常能够不知不觉中故障切换,客户机侧的所有应用也许要求用户改变联接设置或者退出系统再重新登录到系统中。这显然要做大量的工作才能确保自动故障切换,但是,在一些业务场合中,这一工作是不可避免的; 故障切换的时间:当主生产服务器变得不可用时,备份场点一般需要化一定的时间才能代替它。例如,系统应当等待多长时间、才能确定需要进行故障切换?如何定义一个故障?企业应当在考虑成本和支持规定水平可用性的可行性的基础上决定可接受的故障切换时间。进而,应当测试整个流程以确保没有意外的问题。即使投资几百万美元的灾难恢复计划也可能由于似乎很小的配置矛盾而遭受失败;现在我们已经了解了业务和技术考虑的某些很好的想法,让我们考虑你如何能够使用这些信息来构建一个计划。建立和维护备份场点实施业务连续性计划最重要的方面涉及到创建一个在故障事件中可以使用的第二场点。一个备份场点一般将包含足够的硬件和基础设施服务来支持远程的关键备份操作。设置这一新场点一般涉及到购买新的硬件和复制当前生产设备的配置。虽然系统管理员一般知道执行这些流程所需的步骤,但也很难精确地复制配置。一旦建立了备份场点之后,就要考虑维护它的细节。在某些场合中,业务需要也许允许执行周期性的备份和恢复。在这些场合中,某些数据丢失是可接受的。但是,在另一些情况下,备份场点必须不断实时更新,必须为在几秒钟内实现无损故障切换作好准备。对服务器来说,可以采用集群、复制、备份和恢复等解决方案以及其它相关的方法。 但是不管采用哪种计算途径,通常都需要化大量时间和工作量来实施和监控灾难恢复场点的同步性。自动业务连续性实施业务连续性一般不是一件小的任务。IT人员必须完全了解要保护的资源,必须保存最新的技术信息。在生产环境中作变化而不在灾难恢复场点中作相应的变化是完全不能接受的。因此,必须使用流程自动化工具来帮助大大减少维持一个灾难恢复场点所需的时间和工作量、确保以可以接受的代价实现业务连续性(详见5.3 节): 使用配置管理数据库:配置管理数据库的目的 (CMDB) 是集中存储与IT部门支持的整个基础设施有关的信息。对服务器而言,CMDB可以存储有关操作系统(OS)、安全性补丁、安装的应用和网络配置的配置细节。系统管理员使用这些信息可以快速观看和比较灾难恢复场点的配置细节。维持冗余场点的潜在挑战之一是确保一个实际上“离线”的场点作好故障切换的准备。因此,可以集中地运行报告应用、以确保备份场点上没有未探测到的问题; 变更和配置的自动管理:与保持备份场点不断更新有关的操作留下很多出错的可能。如果手工执行,每次改变配置时该流程涉及双倍的工作量。用于服务器变化和配置管理的数据中心自动化工具能够自动把相同的变化送到多个服务器(见图4-2)。这对于必须保持备份场点与生产场
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 劳动教育扬起成长之帆
- 中草药饲料添加剂重点
- 采光井施工协议
- 汕尾凤山中心小学二2班班级愿景
- ××中学数字资源使用规定
- 商业保密协议及保密事项责任划分表
- 2025年电梯安装维修工(中级)考试试卷:电梯安装工程管理
- 2025年初中化学九年级上册期中测试卷化学实验报告撰写指南
- 2025年电工(电力系统可靠性)职业技能鉴定试卷(电力系统可靠性分析)
- 我和我的宠物狗作文(12篇)
- 国开《Windows网络操作系统管理》形考任务四
- 铁道概论(第八版)佟立本主编
- 人体器官有偿捐赠流程
- 《运动生理学》期末考试复习题库(含答案)
- 国开04623- 会计信息系统机考复习资料
- 第七次课第四章证据的学理分类
- 学生人力资源(董克用)复习题汇总
- 水产品加工项目实施方案
- IEEE33节点配电系统
- 儿科质控中心建设方案
- 镀锌钢管壁厚及重量
评论
0/150
提交评论