用户应用系统容灾解决方案.doc_第1页
用户应用系统容灾解决方案.doc_第2页
用户应用系统容灾解决方案.doc_第3页
用户应用系统容灾解决方案.doc_第4页
用户应用系统容灾解决方案.doc_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

用户应用系统容灾解决方案 用户应用系统容灾解决方案用户应用系统容灾解决方案 第 2 页 目目 录录 第第 1 章章业务持续性和灾难恢复背景业务持续性和灾难恢复背景 3 1 1概述 3 1 2关键业务系统中普遍存在的问题 4 1 3业务连续性 容灾的重要意义 5 第第 2 章章惠普灾难恢复方法论惠普灾难恢复方法论 9 2 1什么是容灾系统 9 2 2灾难及应对分析 10 2 2 1灾难的定义 10 2 2 2容灾可以达到的目标层次 11 2 2 3数据的远程复制 13 第第 3 章章应用系业务连续系统方案应用系业务连续系统方案 15 3 1建设目标和原则 15 3 1 1系统建设的目标 15 3 1 2系统建设的原则 15 3 2业务系统现状 16 3 3应用系统备份系统解决方案 16 3 4方案特性 18 第第 4 章章容灾系统的管理容灾系统的管理 20 4 1 组织机构 20 4 2 管理制度和操作规程 20 4 3 灾难的预防 21 4 4 灾难恢复计划的测试 试运行和维护 21 第第 5 章章培训测试及维护培训测试及维护 22 5 1培训 22 5 2测试灾难恢复计划 22 5 2 1测试方法 23 5 2 2测试的频率 23 5 2 3可能引起变化的因素 23 第 3 页 5 2 4测试流程的制定 23 5 3维护 23 第第 6 章章惠普公司容灾实施服务内容惠普公司容灾实施服务内容 24 附录一附录一 HP STORAGEWORKS 4400 企业虚拟阵列企业虚拟阵列 25 当今存储的新需求 25 业界领先的 EVA4400 拥有多项重要功能 26 什么是虚拟化技术 28 高可用性软件 30 HP OPENVIEW STORAGE VOLUME GROWTH 30 HP STORAGEWORKS COMMAND VIEW EVA 软件套件 30 HP STORAGEWORKS MIRRORING存储镜像软件 32 第 4 页 第第 1 章章业务持续性和灾难恢复业务持续性和灾难恢复背景背景 1 1 概述概述 在今天的科技社会中 IT 技术的运用已经渗透到了我们生活和工作的 各个层面 为我们带来了以往任何一次技术革命都没有的便利和迅捷 可 以说 由于采用了 IT 技术的新的生产方式已经基本上代替了原来的生产方 式 成为现代社会运作和发展的主流 我们对计算机系统的依赖超过了以 往任何一种技术 然而计算机系统在为业务的迅猛发展提供信息技术基础架构的同时 也带来了以往我们不曾发觉的负面因素 例如由于信息和处理的高度集中 使业务运转过度依赖于 IT 系统 并会因为 IT 系统的突发问题而受到很大 影响 严重的甚至可以导致业务系统无法正常进行 这些问题包括了进行 系统检修和升级带来长时间的系统停机 系统自身的或者人为的因素或事 故发生连锁性的扩大 以及不可预见的故障和突发性灾难等等 如何避免业务运转受到影响 或者使业务影响尽可能降到最低 这是 每一个企业管理者必须考虑和重视的问题 本方案的内容涵盖了高可用的 信息技术基础平台建设 日常运作流程设计 突发事件管理和大型灾害的 应对计划和策略 业务持续性管理团队建设和咨询等诸多方面的服务 希 望能够帮助客户从技术 流程 人员三方面提高业务持续能力 保证关键 业务的正常运行和发展 1 2 关键业务系统中普遍存在的问题关键业务系统中普遍存在的问题 提高 IT 系统的高可靠性以及 IT 系统的容灾建设早已不再是新鲜的话 题了 随着许多用户实施业务系统大集中 针对 IT 系统的高可靠性和容灾 能力的需求日渐突出 很多用户都已经实施了有针对性的容灾系统 并且 更多讨论的是如何实现业务数据的有效保护和业务的连续性运行 然而 目前大多数容灾系统的建设还是存在许多问题的 这些问题中 不仅有技术层面的缺陷 更多的是在流程和人员方面的不足 这些问题可 第 5 页 能导致的直接后果就是当发生灾难时 根本无法实现应用系统的快速恢复 甚至可能导致业务运转的长时间灾难性中断 我们可以列举出其中的一些 1 仅从产品功能层面考虑问题 最终建设的容灾环境仅是一个多种 产品的堆积 仅实现了数据的远程复制或者离线存放 没有进行灾难的各 种场景测试和灾难预演 并缺乏灾难恢复机制和危机应对流程 发生灾难 时 不知道到底数据或者系统能否恢复正常 2 进行了一定的测试和预演 但是缺少相应的灾难恢复计划和特殊 情况下的行动指南 更没有全面的业务连续性计划 在真正发生灾难时 百废待兴 千头万绪的情况下 没有依据和参考 可能无法顺利进行有关 操作 3 有了灾难恢复计划等必要文档 但是没有及时的将 IT 系统 业务 流程和管理人员等不断变化的信息更新 导致容灾手册成为一纸空文 4 具备了以上的要素 但是容灾系统的建设局限在 IT 部门 缺少业 务部门的参与和管理高层的介入和全力支持 发生灾害时 IT 系统能够恢 复但是业务流程仍无法恢复运转 除了以上列出的问题之外 还有许多问题如容灾系统的负载能力估计 不足 实施过程中没有严格遵循高可靠标准 实施过程工作界面过多沟通 不足 日常运维管理方面存在不足和漏洞 缺少厂商 系统集成商的后续 支持服务等等都可能导致业务持续性系统建设的失败 除了以上的问题之外 另一类问题是项目小组仅将目光放在了大型灾 难等突发事件的应对之上 而忽略了计划性停机对业务运行的影响 根据 有关统计 非计划性停机只占 13 的停机概率 而在非计划停机中大型自 然灾难占的比例就更低了 所以在项目实施时 未能很好的优化现有系统 和流程 没有充分发掘现有潜力 未能将日常操作流程和业务持续性目标 充分整合 虽然实现了容灾但是仍没有从本质上解决持续性问题 HP 公司提供的业务连续性解决方案是基于 HP 公司长期的实践经验和业 第 6 页 界公认的业务持续方法论 BCP 结合客户的具体实际情况 采用业界先进成 熟的产品和技术 由资深顾问和技术专家构成的实施小组遵循 IT 服务管理 ITSM 理念进行实施 充分考虑了以上普遍性问题 保证了项目目标的成功 实现 同时 HP 公司可以提供整个容灾项目的整体解决方案单点后续支持服务 这一点完全不同于业界其他友商仅能提供单一产品支持的服务模式 1 3 业务连续性业务连续性 容灾的重要意义容灾的重要意义 在突发性灾难面前 目前的信息系统的确是非常脆弱的 当越来越多 的人们已经习惯于工作 生活在基于计算机系统的支持环境中 任何关键 信息系统运转的中断或者数据的丢失都将导致不可估量的损失 一个已经 证实的数据是 网上银行每分钟运转中断成本为 7000 美元 企业资源管理 系统为 13000 美元 而呼叫中心更是高达 27000 美元 据 IDC 的统计数字 表明 美国在 2000 年以前的 10 年间 发生过灾难的公司中 有 55 当时 倒闭 剩下的 45 中 因为数据丢失 有 29 也在两年之内倒闭 生存下 来的仅占 16 3 100 000 200 000 300 000 400 000 500 000 Internet QualixGroup Find SVPStrategicResearchDivision 5 系系统统非非正正常常工工作作对对行行业业的的影影响响 HSD SSDMktg HABSTHAO 0898 PRE lastupdateJuly31 98SK 当然 早在数年前许多企业及政府要害部门就有了危机意识 他们也 第 7 页 正在尽力避免危机的产生 对于例如计算机软硬件故障 人为因素以及资 源不足等引起的计划性停机所导致的系统停止运转 众多的用户采用了各 种解决方案如本地双机热备份 负载均衡 动态切换等 得以实现系统冗 余 增强业务系统的高可用性 但是 无论对硬件和软件采取什么样的监 控和改善措施 一场不可预测的突发性灾难 比如地震 火灾等降临时 业务数据还是会在瞬间消失 如何才能保证尽量减少业务数据的丢失 将 危险与灾难的损失降低到最小程度呢 这就需要建立异地容灾系统 容灾系统的核心就在于使用各种技术和管理手段将灾难的影响化解 在实践中主要表现为两个方面 一是保证业务数据的安全 二是保证业务 的连续性 通过在生产站点和灾难恢复站点运行同样的系统 包括操作系 统 基础数据库和应用软件 并通过数据复制完成在线和实时的数据复制 或者通过光纤通道的远程数据复制 假如工作站点发生突发灾难 不能再 继续工作 这时容灾中心会将业务数据及时恢复到备用服务器上 并迅速 将业务系统加载到备用服务器 然后实现业务的远程切换 Fail over 恢复 应用系统不间断的运行 在容灾中心实现业务的恢复运转 这个过程只需 要几分钟或者几十分钟的时间 在此基础上 在灾难过后 生产系统恢复 正常后 再将业务运行切换回正常的生产系统 实现业务系统的灾难恢复 Fail back 在国内 当前应用级容灾系统的用户还不多 究其原因 首先观念是 重要因素 容灾系统的投入相当大 而它所针对的只是一些诸如火灾 洪 水 地震等小概率事件 因此 对许多用户来说 这种高投入和相对的小 概率产出使他们望而却步 但是对于像财税公安这样的政府要害部门来说 关键数据丢失造成的损失是远远不能用财务数据来衡量的 同时还应当指 出 容灾系统并不仅仅针对突发性灾害等小概率事件 其它一些宕机事件 如人为误操作 机房事故 电源 空调 管道漏水 计划内的系统维护和 扩容等 也可使用异地容灾系统实现关键业务的持续运转 此外 在生产 系统正常运转的情况下 容灾系统还可以被用来开展诸如数据挖掘 经营 分析以及用户查询等其他业务 从而使为防止灾难而采购的软硬件设备在 平时也能得到很好的应用 第 8 页 如上所述 综合考虑业务中断 数据丢失所导致的损失和增值业务所 带来的收益 容灾系统的建设投入还是值得的 针对我们对 用户业务系统的了解 首先对当前业务系统做数据的集 中存储 这样方便了用户的管理 方便系统的扩展和升级 业务数据至关 重要 而且随着数据量的增加 必然考虑建设灾难 备份中心 其目的就是 在于防止一些灾难性的小概率事件可能对集中式信息系统造成的不可恢复 的原始数据的丢失 这些灾难性事件可能包括为火灾 水灾 地震 电源 故障及一些人为的操作失误等等 综上所述 用户建设灾难备份中心有如下的意义 重要业务数据在灾难发生后得以保护 重要业务 在灾难发生后可以在设定的时间内恢复 从而实现业 务的连续运行 业务计算机系统抵御突发性灾难的能力和级别提高 进一步提高企业的工作效率及职能 第 9 页 第第 2 章章惠普惠普灾难恢复方法论灾难恢复方法论 2 1 什么是容灾系统什么是容灾系统 容灾系统是业务永续运行的重要的组成部分 所谓灾难 通常是指引 起关键业务的信息服务中断 且中断的时间及造成的损失超出企业所能承 受的范围之外的意外情况 引起灾难的因素很多 可以是系统环境中的软 件 硬件故障 有意或过失的人为破坏 还可能是因火灾 飓风 地震而 引起的数据处理设备的损坏等等 只要造成了关键业务的中断 都是灾难 而容灾就是通过预先建立的备份中心 备份设备和备份数据等 在可以容 忍的时间内恢复业务系统的正常运行 将企业因业务中断而导致的损失降 低到预定的程度 相对于业务永续运行来说 容灾强调的是企业的关键业务在灾难发生 时的应对能力和恢复能力 即通过尽可能快速的 全面的企业业务恢复运 作 将因灾难造成的损失降低到最小程度 显然 它并不保证业务的零间 断能力 实际上 容灾系统的整个灾难恢复过程必须会造成一段时间的业 务中断 另外 也正是因为可以容忍一段时间的业务间断 所以其实施难 度 周期和规模都要远远小于实现业务持续性系统的建设 从广义上讲 任何提高系统可用性的努力 都可称之为容灾 本地容 灾 例如主机集群 当某台主机出现故障 不能正常工作时 其他的主机 可以替代该主机 继续进行正常工作 而我们平时讲到的容灾 尤其是值 得重视的容灾 一般都是指远程容灾 远程容灾可以这样理解 在各行业 企业用户的 IT 系统中 必然有一部分 尤其是核心部分 是非常重要的 我们叫它生产中心 人们往往给生产中心配备一个备份中心 该备份中心 是远程的 并且在生产中心的内部 已经实施了各种各样的数据保护 不 论采取什么方式进行保护 当火灾 地震这类突发性灾难发生时 一旦生 产中心瘫痪了 备份中心将能接管生产系统 继续提供网络服务 比如 全国铁路调度中心网络系统 当发生火灾 地震等灾难性事件时 该系统 仍要保持正常进行 不能因为调度中心出现灾难性事件 全国的铁路系统 第 10 页 就处于瘫痪状态 让灾难不合理地蔓延 我们认为 一个有效的高可靠性计算环境应该能够做到 数据中心任何计算机系统硬件 软件及应用的单点故障将不会影 响整个数据中心的处理工作 数据中心由于灾难 火灾 地震 断电 等原因无法工作时 应有 一个备份数据中心能够迅速接管关键应用 继续运行 主数据中心恢复后 应用系统 业务数据应能迅速切换回主中心 运行 2 2 灾难及应对分析灾难及应对分析 2 2 1 灾难的灾难的定义定义 一般来说 人们可将灾难分为下面几个类型 自然灾难 洪水 飓风 地震 外在事件 电力或通讯中断 技术失灵 电脑宕机或网络受损 设备受损 火灾 及人为操作 黑客入侵 恶意破坏 员工误操作 等 在本文中 灾难的定义主要是指自然的和人为的灾难 包括系统硬件 网 络故障 机房断电 人为破坏甚至火灾地震等 例如台湾的台北大地震导 致该区域内建筑及大部分机器均遭到严重破坏 而突发性灾难发生从而引 发的 IT 系统崩溃的后果将可能导致生产停顿 失去客户以及减少定单 收 入 甚至威胁到企业的生存 对业务环境中可能发生的突发性灾难归纳如下 比较可能比较可能可能可能基本不可基本不可 能能 人为过失 故意破坏 对公司不满的员工 外部黑客 计算机病 毒等 气候灾难 暴风雪 严寒等 气候灾难 台风 洪水 等 沙尘暴 城市事件 罢工 动乱 等 工作场所的环境紧急事 战争 核战 第 11 页 设备 硬件 系统故障 业务应用软件故障 火灾 基础设施故障 网络 通信 电力 空调 通风等 件 化学污染等 地震 流行疾病 社会性恐慌 恐怖袭击 炸弹威胁 爆炸 挟持人质等 另一方面 从灾难的后果和影响来看 大致可以分为两大类 业务停顿 但一般可以在能忍受的时间内完成本地修复 不需要异地 切换 2 2 2 容灾可以达到的目标层次容灾可以达到的目标层次 根据企业自身的现有环境 客观条件 投资规模 实施阶段的不同 容灾方案可以达到多种目标层次 这些层次可以在企业不同的层面上实现 不同的容灾功能要求 下面的图表展示了各个容灾层次 地地区区 运运营营节节点点 数数据据中中心心 网网络络 系系统统 数数据据 应应急急后后备备中中心心 EOC 指指挥挥中中心心 灾灾难难 危危机机管管理理 后后备备节节点点 本本地地区区 异异地地群群集集 冗冗余余网网络络备备份份 本本地地群群集集 应应用用及及数数据据库库备备份份 数数据据复复制制 异异地地数数据据存存放放 应应用用 数数据据库库 可可能能的的解解决决方方案案容容灾灾保保护护目目标标层层次次示示意意图图 关于这些层次的描述如下 第 12 页 数据保护 数据保护 数据保护的目标是防止企业在意外情况及突发灾难下丢失数据 通常 采用异地数据备份或存储介质镜像的方法保护企业的数据资产 应用保护 应用保护 应用保护的目标是在发生意外时不仅可以实现数据恢复 还要能够将 数据恢复到灾难发生前的存储状态 以重新恢复应用系统 由于应用系统 的数据通常都保存在数据库中 所以应用保护要保护应用数据以及调用这 些数据的数据库 这层保护所采用的方法包括利用数据库事务日志和数据 库 应用的备份 同时应用保护使企业在意外发生时可以使用备用的系统进行业务操作 通常的策略是使用冗余的后备系统 利用高可用方案或群集技术实现系统 切换 系统保护 系统保护 系统保护更提高一个层次 它的目标是使企业在意外发生时可以使用 备用的 IT 系统环境进行业务操作 通常的策略是使用冗余的后备系统 利 用高可用方案或群集技术实现系统切换 网络保护 网络保护 网络保护的目标是保证整个企业内网络环境的高可用性 通常的保护 策略包括冗余网络 自动或手动路由调整 备份网络设备 以及网络环境 数据的备份保护等 数据中心保护 数据中心保护 数据中心保护的目标是保护作为整个业务节点的数据中心的高可用性 即在整个业务节点所依赖的所有 IT 系统崩溃时 使用后备的数据中心支持 业务节点的工作 运营节点保护 运营节点保护 第 13 页 和数据中心保护不同的是 运营节点保护的目标是抵御影响整个运营 节点的物理建筑的灾难 这预示着需要有备份地点来用于业务处理 它和 数据中心通常都使用包含整个业务支撑系统的冗余备份节点来实现 但是 出于运营节点保护的需要 该备份节点距原来的运营节点的物理距离应至 少在 75 公里以上 而且在灾备运营节点不但要有冗余的 IT 系统环境和网 络环境 还应包括能够实现业务运营的相关资源 如业务人员 营业环境 等 地区保护 地区保护 最外层是地域的保护 它应对的对象是影响整个地区的灾难 如飓风 地震 暴风雪等 通常采用的容灾方式为远距离的容灾备份节点 2 2 3 数据的远程复制数据的远程复制 通常说来 对于远程灾难恢复方案建议用户建立两个数据中心 主中 心和备份中心 正常情况下 应用运行在主数据中心的计算机系统上 数 据也存放在主中心的存储系统中 当主数据中心由于断电 火灾甚至地震 等灾难无法工作时 则立即采取一系列相关措施 将网络 电话线路切换 至备份中心 并且利用备份中心计算机系统重新启动应用系统 而这里最关键的问题就是切换过程时间最短 同时尽可能保持主数据 中心和备份中心数据的连续性和完整性 而由于财务数据的重要性 如何 解决主 备中心数据库数据备份 恢复则是灾难恢复方案的重点 传统的磁带备份方式一般采取定点备份 而当系统崩溃时 距最近一 次备份时间之间的数据将全部丢失 无法恢复 而且磁盘备份恢复时间比 较长 由于速度慢 缺乏实时性 无法满足用户大数据量数据恢复及数据 库连续性 实时性的要求 而现在流行的灾难恢复方案主要是采用实时的数据备份的方式 它 的主要原理是通过通信线路 实时地将主中心更新数据拷贝至备份中心存 第 14 页 储系统中 保证主 备中心数据的实时一致性 当主中心无法工作时 备 份中心可以立即接管业务 并且确保数据的最大完整性 根据 用户系统的现状 我们认为采用基于服务器的复制方式来的实现异 地系统的容灾方案才是符合实际需求的 以下对将采取的技术进行介绍 第第 3 章章应用系业务连续系统方案应用系业务连续系统方案 3 1 建设目标和原则建设目标和原则 3 1 1 系统建设的目标系统建设的目标 灾难备份 恢复系统的设计目标主要应从以下四个方面来考虑 具体数据类型与目标的灾难保护 具体数据类型与目标的灾难保护 从所有系统正常运作的角度分析各种业 务数据 作出重要性与可恢复性要求的评估 并由此制定系统的数据灾难 保护策略 灾难发生后的可恢复业务分析 灾难发生后的可恢复业务分析 对应用系统各个业务与管理流程进行分析 评估 并由此制定系统业务的灾难备份政策 建议通过智能存储设备进行 实时远程数据复制 首先实现数据级容灾 同时系统通过备份管理软件将 其数据备份到大容量磁带库 实现对制证数据的本地保护 灾难发生后的可恢复分析 灾难发生后的可恢复分析 对于突发性灾难这样的重大事件 有时受灾地 区并不苟求所有系统的所有应用必须立即恢复运营 故可按比例和实际需 求进行分析 并由此配备相应的设备 灾难发生后的业务可恢复时间指标 灾难发生后的业务可恢复时间指标 我们通常将灾难的发生分为两类 一 第 15 页 类是可以预计具体时间的灾难 如损害性极大的台风 计划内的大面积电 力系统检修等 另一类是不可预计突发性的灾难 如地震 恐怖袭击 主 机系统的非计划性宕机等 针对两种不同灾难 要设定不同的恢复时间指 标 并根据不同业务系统的各自特点 确定不同业务系统的灾难恢复时 间 3 1 2 系统建设的原则系统建设的原则 根据用户当前业务系统的实际情况 充分利用现有软硬件资源 网络资源 建立高性能 低成本的容灾系统 容灾系统的建设原则应包括 1 确保灾难情况下重要数据的安全存储 2 确保灾难发生后系统运行的及时恢复 包括数据的恢复 3 将应用系统因灾害而导致的利益损失降低到最小程度 4 坚持容灾备份系统建设投资经济合理性的原则 5 确保系统的可扩充性 可维护性 可操作性 6 建立健全相应严密的管理制度和操作流程 3 2业务系统现状业务系统现状 当前用户的主要应用系统都运行在本地服务器上 为数据的读写造成了很大 的影响 而且在服务器本地存放也有很大的安全隐患 如果数据发生损坏 丢 失 其后果将极为严重 核心系统的运行当然最好的运行方式是使用高可靠性 高性能及稳定的存 储设备 为用户数据提供可靠的存放空间 针对这些需求 我们为 用户设计一套应用系统容灾解决方案 3 3 应用系统备份系统解决方案应用系统备份系统解决方案 根据我们对用户当前基础架构和应用分布的现状的分析 本着 整体规 第 16 页 划 分步实施 信息生命周期管理的能够为各项应用提供坚实的数据存储平 台 并保证了很好的可扩展性 易用性 安全性和可靠性 利用 HP 存储平 台强大的远程容灾备份存储能力和完善的解决方案 结合应用的具体情况 实现数据的集中存储 以便更高效的利用数据 整个应用的系统的容灾使用 HP Storage Mirroring 该软件是一个基于主机 的连续复制解决方案 它通过 IP LAN WAN 进行远程复制 为客户的 Windows 或 Linux 数据提供强大的保护 后端数据集中存储使用的设备是 HP EVA4400 采用全光纤的 SAN 架构 为 用户提供高可靠性 可用性 稳定及良好扩展性的解决方案 一对一异地容灾 Storage Mirroring 最典型的一种应用场景 源服务器和目标服务器可以同在 一个局域网内 同一个机房 也可以在分属不同的远程物理地点 两幢相隔千里 的大楼 两个不同的城市 客户可以使用 Storage Mirroring 软件的连续异步复 制功能 通过 LAN WAN 把源服务器上的数据实时地复制到目标服务器 一旦 源服务器遇到问题 例如人为误操作 火灾 停电 而停止工作时 一直监测 它运行状态的目标服务器可以立即取代它的工作 使生产 业务系统得以连续地 运行 第 17 页 多对一数据保护 异地容灾加备份 客户可以利用 Storage Mirroring 软件将多台生产服务器 的数据复制到一台目标服务器上 这样目标服务器可以对任意源服务器进行故 障转移 这种多对一的数据复制实现方式和一对一的是一样的 只不过客户可 以把多台生产服务器的数据通过 Storage Mirroring 同时复制到一台目标服务器 而当源服务器中的某一台或者几台服务器出现问题必须停机的时候 目标服务 器可以恢复它们中间任意一台或者几台服务器的工作 远程分支办公室和总公 司的业务服务器同样也适用于此场景 场景二 多对一 Storage Mirroring 复制 故障转移和备份配置 这样做的好处是可以节约成本 一方面是节约服务器的采购成本 如果客 户有多台服务器均需要做远程容灾 那么不必要每一台服务器买一个对应的目 标服务器 使用 Storage Mirroring 的多对一复制可以只需要购买一台目标服务 器 一方面是节约软件的采购成本 Storage Mirroring 是按服务器的个数来收费 的 所以多对一的复制方式可以不仅可以减少客户购买服务器的数量 还可以 减少客户购买软件 License 的数量 还有一个方面是备份 如果客户有多台源服 务器上的数据均需要做备份 惯常的做法是每台服务器连一台磁带设备做备份 而使用这种多对一的复制方式 就可以将多台源服务器的数据集中到一台目标 第 18 页 服务器上来 备份设备 如磁带机 直接对目标服务器做备份 这种集中备份 的方式可以减少备份设备以及备份软件的投入 同时也解决了 备份窗口 的问 题 3 4 方案特性方案特性 低成本 低成本 基于主机和 IP 网络的解决方案 可以满足那些寻求低成本客户的 需要 基于 Fabric 和阵列复制的容灾产品一般价格比较昂贵 且需要专门的网 络进行复制数据的传输 而 Storage Mirroring 通过现有的 IP 网络 LAN WAN 进 行复制 避免额外增加基础设施成本或搭建新的独立网络 全兼容 全兼容 Storage Mirroring 软件独立于存储设备 它支持任何直连存储 DAS 网络连接存储 NAS 或存储局域网络 SAN 的存储设备 并支持多种 Windows Linux 平台 高性能 高性能 基于主机的复制不受地理位置的限制 连续异步字节级复制 实 时捕获数据变化 有助于目标数据和源数据保持相同顺序 有效保持数据的完 整性 低带宽消耗 低带宽消耗 为了减少网络消耗 提供三种级别的数据压缩方式 并对数 据变化进行缓存 加快数据复制过程 减少瓶颈现象 灵活控制对带宽的利用 易于管理使用 易于管理使用 直观 易用的集中管理界面 配置步骤简单 应用程序考虑 应用程序考虑 可复制主机上任何应用程序写入的数据 无需知道是哪一 个应用程序 完整的解决方案拓扑图如下所示 第 19 页 第第 4 章章容灾系统的管理容灾系统的管理 4 1 组织机构组织机构 容灾备份系统需要由专门机构 指定现有相关部门或者设立新机构 负责 日常的管理 维护 以及灾难发生后的系统恢复等工作 该机构的主要职责 职能主要包括 1 备份系统的日常维护工作 确保当前备份系统是正常 有效的 以 及数据备份的完整性 一致性 2 测试及研究工作 测试工作包括对当前备份系统 备份数据有效性 可用性的测试 以及对应用软件的升级测试等 研究与容灾备份相关的技术方 案优化以及相关制度 规程的完善 3 日常管理 协调职能 负责本部门的日常管理工作 并负责与主用 第 20 页 中心 以及相关方面的协调工作 4 灾难发生后的系统恢复以及生产组织职能 4 2 管理制度和操作规程管理制度和操作规程 容灾备份系统的管理 维护 系统恢复 生产组织等需要完善的管理制度 和严密的操作规程予以约束 规范 以确保备份系统的可用性和生产恢复的有 效性 在建设容灾备份系统的同时 应结合自身情况建立并不断完善相关的管理 制度 操作规程 其中包括 1 容灾备份工作的领导与组织分工 2 容灾备份中心机构的职能 职责 人员岗位责任制度 3 日常维护管理制度和操作规程 4 测试管理制度 包括备份系统有效性测试 应用软件升级测试等 5 灾难 故障的监测与分析 报告制度 以及审批流程规定 6 系统恢复 切换的操作流程和规范 7 备份系统恢复运行后的生产组织制度 其中应包含数据的安全与 备份 8 主用系统重新恢复工作的管理与组织制度 4 3 灾难的预防灾难的预防 系统容灾应包含灾难预防的内容 即研究相应对策将灾难带来的损失降低 到最小程度 这包括 1 系统技术设计方案的不断优化 在不断提升系统自身安全可靠性的 同时 使系统和数据备份的实施 管理 操作更简便 运行更可靠 2 容灾备份策略和技术方案的不断完善 不断提高备份数据的一致性 完整性 缩短系统运行中断的时间 第 21 页 3 相关管理制度 操作流程和规程的不断完善 改进 4 努力减少系统的安全隐患 5 可能也包括备份系统机房地点的合理选择等 4 4 灾难恢复计划的测试 试运行和维护灾难恢复计划的测试 试运行和维护 通过测试 试运行可检验灾难恢复系统功能是否达到设计要求 测试和模 拟试运行可以检验灾难恢复计划文档资料的完整性 恢复策略的正确性 可以 提高工作人员的操作熟练程度 应选择适当的灾难恢复计划测试策略 通过测 试可以提高灾难恢复计划的质量 改进灾难恢复过程 可以使相关部门配合有 序 同时由于应用系统环境如系统环境 网络配置 应用系统恢复的优先级不 断变化 灾难恢复计划也应随之进行修改 第 22 页 第第 5 章章培训测试及维护培训测试及维护 经过努力建立起的灾难恢复计划系统 用户必须通过内部培训和周期性的 测试才能为各层次参予人员所了解 掌握 同时随着用户 IT 数据中心业务的不 断完善和发展 各方面的条件和情况亦会变化 因此还需要有稳定可靠的维护 5 1 培训培训 成立专门的灾难恢复计划小组 选定一些对业务或技术非常熟悉的关键人员作为灾难恢复小组参予 人员 以保证在危机处理的正确 高效 制定培训计划 让大家了解项目的背景 以及各人在灾难发生时的相应责任 应掌 握的知识与技能 计划培训进度与日程 协调各相关部门负责人 保证培训时间 管理培训质量 5 2测试灾难恢复计划测试灾难恢复计划 测试灾难恢复计划 不仅可以验证计划的有效性 完整性 亦可以帮助大家 熟悉过程 做好准备工作 归纳如下 验证计划过程与策略 发现疵暇之处 可以获得具体的恢复时间概念 如网络是如何被恢复的 速度如何 可以测试备份主机系统与网络系统的效率 可以向领导 审计 管理 媒体等展示 第 23 页 可以使整个队伍熟练其各自的角色与责任 5 2 1 测试方法测试方法 测试的很重要的一个原则是不停生产机 采用独立或并行的方式进行 如果 是并行则可以与生产环境比较结果 测试的第二个原则是按模块进行 即将庞大的系统分解开来 按模块独立测 试 而非一开始就动员全面测试 由于各模块的相对独立性 测试是可以分解 成一个一个模块进行的 这样的难度较小 也易于组织与管理 5 2 2 测试的频率测试的频率 测试目标是为了保持系统的现时性 即系统能跟上变化的步伐 但同时亦要 考虑费用问题等 5 2 3 可能引起变化的因素可能引起变化的因素 主要操作系统的升级 重要应用软件和改变 主要硬件改变 人员变动 5 2 4 测试流程的制定测试流程的制定 测试流程的制定是在测试中最为重要的一环 只有测试是在可控的前提下 测试才具备检验系统安全性 锻炼应急队伍的意义 因此客户测试流程的制订 需要在最终客户 相关设备的供应商和灾备系统实施方三方共同协商确定 已 确保原有系统的稳定运行 5 3维护维护 为保证灾难恢复计划的稳定可靠运行 需要有明确的维护政策 保证人员及 资金的适当投入 并定期检查报告 管理层可以了解其状态 第 24 页 第第 6 章章惠普公司容灾实施服务惠普公司容灾实施服务内容内容 名门正派名门正派 HP 公司能够提供业界最完善的产品系列 从而满足不同企业级 客户的独特业务需求 并具有业内最先进的业务连续知识方法体 系 有通过 DRII 认证的业务连续专家多名 通过将国际标准的方 法论和 HP 长期的业务连续系统建设经验相结合 HP 提供的业务 连续解决方案是从客户实际出发 符合客户业务需要的 切实可 行的业务连续方案 海纳百川海纳百川 HP 公司具备业界最全面的企业级产品体系 同时 HP 还可以采 用其它经验证是业界领先的第三方产品来共同为客户设计和建设 容灾系统 这样在采用先进技术手段的同时 充分保护了客户的 投资 提高了客户设备的使用效率 有始有终有始有终 HP 公司的业务连续方案不仅仅为客户提供数据级容灾 通过 HP 的主机和集群技术还可以帮助客户建设应用级容灾系统 通过 HP 业务连续专家的咨询服务 客户可以在此基础上进一步实现业 务级的容灾系统 达到业务全天候连续运行的目的 身经百战身经百战 HP 公司在国内具有大量的成功案例和丰富的专家经验 可以帮 助客户实现多种手段的业务连续 容灾系统的建设 在制造 金融 电信 政府等多个行业均有杰出表现 第 25 页 附录一附录一 HP StorageWorks 4400 企业虚拟阵列企业虚拟阵列 当今存储的新需求当今存储的新需求 当今的企业计算对存储提出了一系列新要求 如何提高灵活性 易管理性 密度 切 实的保护投资都是存储领域首先要解决的问题 惠普第二代 StorageWorks 4400 企业 虚拟磁盘阵列 EVA4400 具有创新的灵活性 可以构建 赖以依靠的存储平台 通过这一平台 从容应对广泛的存储挑战 EVA4400 通过一个产品包为 提供了一系列的软硬件和服务组合 它能够像一个 完整的存储平台很快的部署和维护 利用这些组合 客户就可以迅速部署 EVA4400 轻松拥有坚实的存储平台 惠普提供了用于 EVA4400 的全面软硬件产品服务解决方案 范围从基础服务解决方案 每个 EVA4400 均提供的基本服务 到惠普针对关键任务环 境提供的 关键服务 支持 HP StorageWorks EVA4400 是一套完整的解决方案 专为急需提高按需存储供应 容 量利用率和可扩展性而设计 并满足 频繁的高事务 I O 处理 EVA4400 提供了集成的 iSCSI 和 iSCSI NAS 连接 这些强大的解决方案提供了将 iSCSI 连接到一个 EVA 而且扩展了 FC SAN 和 NAS 的先进性 可将它们放置在较小 的部门和较远的位置 在 EVA4400 中免费包含了 HP System Insight Manager SIM HP SIM 使用统一的用户 界面对服务器和存储提供了集成的管理 包括详细的故障管理 资产清单管理 和配 置管理 目前 其他 IT 厂商不能提供这样的管理能力 HP StorageWorks EVA 软件解 决方案提供了简化的存储管理和容量扩展 即时复制 和对本地及远程复制的统一管 理 当与 HP StorageWorks Command View EVA 软件一起使用时 HP StorageWorks EVA4400 提供了一个强大 简单 而又完整的存储管理方案 并通过自动的自身调节来 实现 EVA4400 性能优化的解决方案 为维护 EVA4400 的正常运行时间 用户可以通过使用惠普基于 WEB 的企业服务 WEBES 和包含在 EVA4400 中的 Instant Support Enterprise Edition ISEE 软件工具包 帮 助用户对连接在 HP Integrity 服务器 ProLiant 服务器和 Alpha 服务器 上的 EVA4400 存储硬件进行故障检测 分析并通知用户 第 26 页 EVA4400 带来的益处 用户可以按照业务的需求逐渐增加对 IT 的投入 EVA4400 的简化管理 完整解决方案和所具有的虚拟化特性 使用户可以有效 灵活 快速的 对用户的业务需求作出反应 HP StorageWorks 虚拟化技术虚拟化技术 复制复制 业界领先的业界领先的 EVA4400 拥有多项重要功能拥有多项重要功能 出色的自调优性能出色的自调优性能 虚拟 RAID 集 Vraid 支持将数据条带分布在多块磁盘上 这样磁盘轴数大大超过传统 RAID 集的轴数 这种虚拟方法还可以优化存储 实现配 置和应用的最佳性能 无须阵列停机 即可快速完成 Vraid 驱动器的动态扩展 EVA4400 消除了繁冗的管理功能 使用简单的管理工具即可实现最佳性能 高级控制器软件高级控制器软件 虚拟化技术有助于改善性能 提高容量利用率 同时便于存储 动态扩展 高密度封装 每控制器对支持更多磁盘高密度封装 每控制器对支持更多磁盘 EVA4400 使用 96 块 450 GB FC 磁盘 磁盘存储容量可扩展至高达 43 2 TB 这既可以减小占地面积 也有助于降低总体拥 有成本 用于近线存储设备的用于近线存储设备的 1000 GB 低成本光纤附挂低成本光纤附挂 FATA 磁盘驱动器磁盘驱动器 FATA 磁盘驱动器可用于不频繁读取数据 如数据存档 数据参考和数据复制 的应用程序 第 27 页 可以选择使用高性能磁盘驱动器 较低性能磁盘驱动器 或将高低性能混合的磁盘 驱动器配置在同一个 EVA4400 机箱内 最大容量可扩展至 96TB 在线在线 LUN 扩展扩展 在不损失应用可用性的前提下 可以快速动态的增加 EVA4400 的联机存储能力的供应 LUN 和和 RAID 的生成的生成 消除了 LUN 和 RAID 组配置的复杂性和不确定性 简 化了管理 存储容量的物理扩展存储容量的物理扩展 可以快速联机且容易添加物理磁盘 而不必损失应用的可 用性 Vsnap 几乎无需容量的快照 无须保留等量容量 即可在数秒钟内通过数据 快照 完成数据复制 这可为 节省大量的磁盘空间 提高磁盘利用效率 虚拟即时克隆虚拟即时克隆 在复制完成前即可访问 的完整数据 可将复制的数据作为测 试平台 用于应用程序变更 新增性能基准测试 或磁带备份 Vraid 组间快照功能组间快照功能 在快照或克隆时 允许用户改变 Vraid 类型 同一 Vdisk 组中跨 Vraid 快照和即时克隆可以被生成 以及 Vdisk 组之间跨 Vraid 即时克隆可 以被生成 包括标准 Vdisk 和近线 FATA Vdisk 组 一个统一集成的复制管理解决方案一个统一集成的复制管理解决方案 用户通过使用惠普的复制解决方案管理器 可以生成和管理 HP Business Copy Vsnaps Snapclones 通过使用 HP Continuous Access EVA 只需几次简单的鼠标操作 就可配置远程复制 异构平台支持异构平台支持 支持业界领先平台 包括 HP UX HP OpenVMS HP Tru64 Microsoft Windows Linux Sun Solaris IBM AIX Novell NetWare 和 VMware 高可用性高可用性 EVA4400 的冗余体系架构和增值软件消除了集群或单一服务器多路 径配置中从服务器到存储的单点故障 EVA4400 Vraid 实施可实现对多驱动器故障的 容错 提供主动式维护服务 并简化备份恢复过程 集群服务器和高可用性系统支持集群服务器和高可用性系统支持 提供双节点及多节点集群支持 实现主机级容 错 并使系统具有高可用性 第 28 页 存储整合的多服务器共享支持存储整合的多服务器共享支持 异构和同构主机支持可使多服务器之间共享存储 EVA4400 提供存储访问控制 如 Selective Storage Presentation 或 LUN 屏蔽 确保一个主机无法访问另一个主机的数据 它还支持基于 SAN 的 数据分区 采用端到端光纤通道采用端到端光纤通道 FC 优化的优化的 SAN 能够满足最苛刻的数据密集型应用程 序的需求 可通过选购内置光驱交换机提供 8Gb s 光驱通道支持 易于使用的存储管理工具易于使用的存储管理工具 HP Command View EVA 运行在一个 Windows 管理 服务器上 或一个预先安装了 HP OpenView 存储管理软件的服务器上 通过 WEB 浏览器提供了一个易于使用的 EVA4400 存储系统界面 什么是虚拟化技术 什么是虚拟化技术 EVA 通过虚拟化 利用多厂商环境中的 惠普虚拟化技术 彻底改造了企业存储 使其不但能够进行基于磁盘的备份和恢复 而且性能 可用性和可扩展性也进一步提 高 虚拟化存储可将所有物理容量作为单一存储池进行管理 这样既解决了容量难题 又 可以最大限度地利用现有资源 提高管理员的工作效率 EVA4400 能增强整体性能 因此服务级别的在线响应时间不会有大的起伏 而且 EVA4400 还可以动态扩展容量 并简化配置的变更 不致影响系统性能或应用 第 29 页 HP StorageWorks 虚拟化技术虚拟化技术 强大但异常简单的管理强大但异常简单的管理 通过使用惠普公司提供的内置在 EVA4400 中的虚拟化技术 备份及恢复可以即刻完成 用户已有的 IT 资源即可管理不断增加的关键业务数据 Vsnap 是一种几乎无需增容的 快照 它消除了备份窗口 也无须为复制数据购买额外的存储容量 虚拟即时快照克 隆提供了虚拟磁盘的虚拟即时克隆功能 和即时高效地进行数据仓库镜像 无缝数据 迁移和数据共享 HP StorageWorks 虚拟化技术虚拟化技术 复制复制 第 30 页 高可用性软件高可用性软件 EVA4400 支持业界流行的多路径软件 该软件用于管理主机系统与存储系统之间的多 路径 通过提供路径管理和 I O 负载均衡 提供高可用性 HP StorageWorks Secure Path Secure Path 是一种多路径高可用性软件 管理和维护对惠普存储系 统的连续数据访问 可用于 HP UX HP OpenView Storage Volume Growth HP OpenView Storage Volume Growth 软件可在 EVA4400 Microsoft Windows 2000 或 Microsoft Windows ServerTM 2003 环境中 实现端到端的容 量扩展 因而可以轻松提高 的虚拟化和存储控制能力 使用 HP OpenView Storage Volume Growth 能够快速响应无法预测的容量 需求 而无须中断用户的应用程序或数据访问 这款易于使用的产品进一步增强了 EVA4400 的容量扩展功能 能够灵活地控制用户的存储环境 直观的向导式图形用户界面简化了 终端用户对 OpenView Storage Volume Growth 的操作 终端用户可在基本磁盘容量的基础上多次扩充容量 从而实现最大 的灵活性 OpenView Storage Volume Growth 能够使 的终端用户根据需要而灵活 多次 地扩展卷分区 用户唯一需要考虑的就是可扩展卷上有多少可用的空间 此外 用户还可将 OpenView Storage Volume Growth 安装在任何工业标准的服 务器系统上 而不会直接影响 EVA4400 控制器固件或驱动软件 HP StorageWorks Command View EVA 软件套件软件套件 HP StorageWorks Command View EVA 是用于简化惠普的高性能 HP EVA 存储阵 列产品系列管理的一个综合性软件包 与传统的存储阵列的管理相比较 HP Command View EVA 提供了一个强大而简单的存储管理体验 使用该软件包 管理 员无需更多的时间即可完成管理工作 HP Command View EVA 为用户的系统管理 员和存储管理员提供了简化的管理工具 而又遵循了业界最容易的阵列管理方式 第 31 页 HP Command View EVA 直观的用户界面简化了 LUN 的联机扩展 用户只需用很少 的鼠标操作 便可以联机配置 LUN 和 RAID 组 以满足对存储容量的需求 而上述过 程不必让应用停止运行 也无须一个庞大的存储管理队伍 HP Command View EVA 也可以通过 HP StorageWrok EVA iSCSI 的连接来管理 iSCSI 主机系统 HP Command View EVA 为存储管理员提供了一个可扩展的存储管理软件解决方案 它提供了灵活性 因此可以根据业务和用户的需要 选择适量的存储容量 使用 HP Command View EVA 软件包 用户可以从单一的管理控制台上进行 EVA 的管理和 配置 可以提供即时的存储容量的扩展需求 或可以从一个可用的存储池中很容易的 生成 RAID 组 以满足

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论