业务连续性数据中心建设-第二部分-网络和服务器业务连续性_第1页
业务连续性数据中心建设-第二部分-网络和服务器业务连续性_第2页
业务连续性数据中心建设-第二部分-网络和服务器业务连续性_第3页
业务连续性数据中心建设-第二部分-网络和服务器业务连续性_第4页
业务连续性数据中心建设-第二部分-网络和服务器业务连续性_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

业务连续性数据中心建设 业务连续性数据中心建设 2 网络业务连续性网络业务连续性 4 网络业务连续性网络业务连续性 网络业务连续性聚焦于确保网络操作在发生重大故障或灾难后尽可能快地恢复正 常功能 其目标是限制一台设备 一个网络甚至整个数据中心发生故障后引起的服务 中断 大多数解决办法将涉及设立备份站点以及需要时故障切换到该站点的流程 4 1 连续性规划连续性规划 对许多企业和 网络服务中断几分钟就可能造成损失收入和降低客户的信心 造 成故障的原因是多种多样的 范围包括从电力故障到大面积的自然灾害 业务连续性 规划目的是建立网络业务连续性流程 通过建立即使在最坏的情景下也能够恢复正常 操作的流程来消除所面临的风险 网络业务连续性流程网络业务连续性流程 本节将介绍在开发一个网络业务连续性流程应当考虑在内的许多因素 图 表示 该流程包括的基本步骤 定义业务需求定义业务需求 确定技术需求确定技术需求 开发和修改业务连续性计划开发和修改业务连续性计划 测试故障切换流程测试故障切换流程 定义业务需求定义业务需求 开发一个网络业务连续性计划的第一步是确定机构的需求 虽然所有系统是重要 的 网络的某些区段也许比其它区段更加重要 确定需求最重要方面是把整个机构考 虑在内 IT 机构不应当依赖于自己的知识作出有关计算基础设施的最重要领域的重要 决策 如果资源是无限的 多次复制网络环境也许是可能的 在现实世界中 最大可 能性是预算和劳动力约束将把对故障和灾难的保护限制在合理的水平 一个现实的计划应当包括对宕机损失 数据丢失影响和网络各个方面的重要性的 全面评估 最好能够 根据机构整个管理队伍的意见开发出一个关键系统的清单 确定技术需求确定技术需求 现代 IT 网络一般将是复杂的 有许多相互依赖的设备 如交换器 路由器 防火 墙和网络缓存设备等 由于这一清单不可能包括设备依赖于机构基础设施的细节 当 规划业务连续性时 IT 人员应当首先开发一个网络拓扑的高层概貌 也应当列举出关 键的设备 目标是确保了解基础设施的基本水平 这将是所有其它系统需要的 下一步是列举在故障切换流程事件中将需要哪些设备 核心的路由器 交换器和 防火墙也许将是该清单上首要项目 下一步是确定支持网络上最重要的应用和服务所 需的设备 要考虑的要素应当包括网络如何能够以减少的容量运行 特别是 如果预 算不允许作完全的冗余 准备实施业务连续性计划准备实施业务连续性计划 在网络中断事件中 未来实现业务连续性必须执行故障切换流程 但是 在采取 这些步骤前 IT 机构应当确保拥有所需的工具和信息 包括 配置管理 配置管理 跟踪网络配置文件是建立故障切换流程重要的第一步 在故障切换事 件中 恢复这一信息将帮助把一个恢复到可用的状态 当作配置变化时 网络管 理员必须确保变化被记录下 复制到任何后备和备用设备 网络冗余管理 网络冗余管理 建立冗余是大多数业务连续性计划的主要工作 重要的是首先定 义可接受的宕机界限和适当的故障切换时间 大多数企业级解决方案提供实现路 由器 交换器 防火墙 内容缓存和其它网络设备自动故障切换的备用设备 重 要的是要记住 在大多数故障切换场合下 该流程对用户将是明白易行的 虽然 影响将有希望限于只需要重新建立少数几个联接 模拟灾难恢复操作模拟灾难恢复操作 任何恢复流程的一个重要但经常被忽视的方面是演习故障切换和业务连续性计划 演习这一流程有许多好处 首先 通过试运行 业务和技术人员可能将发现计划中可 以改进地方 即使最好的计划也可能忽视 实际工作 执行时才能发现的某些细节 在最坏的情况下 一个关键系统也许完全被忽视了 或者 也许有各种节约时间的变 化可以改善这一流程 模拟灾难恢复另一个主要好处是能够实践构建专业技术 IT 应当能够精通执行故 障切换流程所需的技术 有一个测试恢复流程方面牢不可破的法则是 紧接着一个关 键系统故障后没有时间开始学习如何恢复它 4 2 自动实现网络业务连续性自动实现网络业务连续性 当开发和准备一个业务连续性计划时 机构网络的许多方面必须加以考虑 对大 多数机构 涉及的任务将需要做大量的工作 幸而 自动的数据中心管理工具能够帮 助使得这一流程更加容易 例如 通过使用自动的网络发现工具 网络管理员能够方 便地观察整个网络和发现依赖关系 通过使用配置管理工具 最好同时使用配置管理 数据库 即 CMDB 能够收集网络设备配置细节 保持备用站点的路由器 交换器 和防火墙状态最新的流程也可以自动地执行 图4 2提供这一流程如何工作的例子 图图 4 2 使用数据中心自动化工具维护故障切换配置使用数据中心自动化工具维护故障切换配置 对大多数 IT 部门 开发一个网络业务连续性计划不是一件小事情 但是 通过使 用关键任务流程自动化工具 可以更加有条不紊地完成这一关键任务 5 4 5 服务器业务连续性服务器业务连续性 服务器业务连续实质就是服务器上支持关键任务流程的业务连续性 为此 首先 要确定关键任务应用和支持它们的服务器 确定关键任务应用和服务器确定关键任务应用和服务器 如果给予无限的资源 实施业务连续性将是很简单的 可以建立多重冗余环境 将可以方便地实现服务器业务连续性 在现实世界中 经济和技术约束使得这一流程 要困难得多 因此 在考察建立灾难恢复机制的技术以前 IT 管理层应当会见企业领 导人确定必须保护的基础设施关键部分 假定并不是所有资源都得到完全的保护 重要的是确定每个重要资产的价值 划 分优先度的第一步是建立 IT 部门最重要的高层功能的详细目录 例如 一个在线金融 服务企业重重依赖于股票交易软件 其次 应当确定支持应用的技术细节 现代的应 用将有许多不同的要求 包括网络联接和设备 授权和安全性服务以及许多物理计算 机系统 为了为整个最终用户服务提供连续性 重要的是确保没有漏掉其中任何部件 IT 管理层理论上将能够提供保护每个系统所需的费用 在大多数环境 这一流程可能 是富有挑战性的 但对于确保建立一个可靠的业务连续性计划绝对是关键的 开发服务器的业务连续性计划开发服务器的业务连续性计划 当开发一个在发生灾难情况下管理服务器的计划时 重要的是记住要求实现业务 连续的全面目标 系统和网络管理员经常将聚焦于高可用性的低级技术细节 例如 冗余的电源和 RAID 磁盘配置能够帮助减少宕机和数据丢失的可能性 但是 高可用 性的全面途径应当包括与所有运营领域有关的细节 例如 即使保护了数据和硬件 实际的故障切换将如何发生 是否要求用户实施任何变化 什么是 IT 队伍的流程 在 故障后立即发生也许是 重演 这一流程的最坏时间 业务连续性计划一般涉及几个 主要步骤 见图 这一流程开始于确定必须保护哪些系统 然后应定义具体的业务和 技术要求 最后 根据这些信息 机构将可以着手建立业务连续性计划 确定关键任务应用和服务确定关键任务应用和服务 确定业务要求确定业务要求 确定技术要求确定技术要求 开发和实施一个业务连续性计划开发和实施一个业务连续性计划 定义业务和技术要求定义业务和技术要求 与执行备份有关的最佳实践是基于要求在恢复中执行的实际流程 当开发业务连 续性实施计划时 要考虑如下几个重要因素 可接受的数据损失可接受的数据损失 虽然大多数业务经理不愿意考虑它 但是在发生灾难过程中 潜在的数据丢失是难以避免的 企业应当提出一个现实的思想 即多大的数据丢 失是可以接受的 一个重要的考虑是约计成本 投入 1 2 百万美元的来保证丢失 交易不会超过 2 分钟是否值得 降低实施成本而把丢失交易时间延长到不超过 1 小时是否可以接受 其它考虑包括对实际生产系统的影响 例如 两阶段提交复 制数据库服务器可能增加一个单一故障点 可能降低整体的生产性能 自动的故障切换自动的故障切换 一个灾难或系统故障可以发生在任何时间 确保最高水平可用 性的一个要求是自动故障切换 但是 就像其它因素一样这会带来很大的开支 为了实现无缝的故障切换 基础设施的许多方面必须作好准备 从服务器一侧开 始 机器必须能够协调从实际服务中删除一个服务器 推动另一台服务器来取代 它 这一流程通常需要第三台 见证 服务器 此外 网络基础设施和配置必须 能够适应 最后 也许还要求在客户机侧作变化 虽然 Web 应用经常能够不知不 觉中故障切换 客户机侧的所有应用也许要求用户改变联接设置或者退出系统再 重新登录到系统中 这显然要做大量的工作才能确保自动故障切换 但是 在一 些业务场合中 这一工作是不可避免的 故障切换的时间故障切换的时间 当主生产服务器变得不可用时 备份场点一般需要化一定的时 间才能代替它 例如 系统应当等待多长时间 才能确定需要进行故障切换 如 何定义一个故障 企业应当在考虑成本和支持规定水平可用性的可行性的基础上 决定可接受的故障切换时间 进而 应当测试整个流程以确保没有意外的问题 即使投资几百万美元的灾难恢复计划也可能由于似乎很小的配置矛盾而遭受失败 现在我们已经了解了业务和技术考虑的某些很好的想法 让我们考虑你如何能够 使用这些信息来构建一个计划 建立和维护备份场点建立和维护备份场点 实施业务连续性计划最重要的方面涉及到创建一个在故障事件中可以使用的第二 场点 一个备份场点一般将包含足够的硬件和基础设施服务来支持远程的关键备份操 作 设置这一新场点一般涉及到购买新的硬件和复制当前生产设备的配置 虽然系统管理员一般知道执行这些流程所需的步骤 但也很难精确地复制配置 一旦建立了备份场点之后 就要考虑维护它的细节 在某些场合中 业务需要也许允 许执行周期性的备份和恢复 在这些场合中 某些数据丢失是可接受的 但是 在另 一些情况下 备份场点必须不断实时更新 必须为在几秒钟内实现无损故障切换作好 准备 对服务器来说 可以采用集群 复制 备份和恢复等解决方案以及其它相关的 方法 但是不管采用哪种计算途径 通常都需要化大量时间和工作量来实施和监控灾难 恢复场点的同步性 自动业务连续性自动业务连续性 实施业务连续性一般不是一件小的任务 IT 人员必须完全了解要保护的资源 必 须保存最新的技术信息 在生产环境中作变化而不在灾难恢复场点中作相应的变化是 完全不能接受的 因此 必须使用流程自动化工具来帮助大大减少维持一个灾难恢复 场点所需的时间和工作量 确保以可以接受的代价实现业务连续性 详见 5 3 节 使用配置管理数据库 使用配置管理数据库 配置管理数据库的目的 CMDB 是集中存储与 IT 部门支 持的整个基础设施有关的信息 对服务器而言 CMDB 可以存储有关操作系统 OS 安全性补丁 安装的应用和网络配置的配置细节 系统管理员使用这些 信息可以快速观看和比较灾难恢复场点的配置细节 维持冗余场点的潜在挑战之 一是确保一个实际上 离线 的场点作好故障切换的准备 因此 可以集中地运 行报告应用 以确保备份场点上没有未探测到的问题 变更和配置的自动管理 变更和配置的自动管理 与保持备份场点不断更新有关的操作留下很多出错的可 能 如果手工执行 每次改变配置时该流程涉及双倍的工作量 用于服务器变化 和配置管

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论