




已阅读5页,还剩51页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中国地质调查局计算机系统容灾方案建议书 1 中国地质调查局计算机系统中国地质调查局计算机系统 容灾及业务连续性方案容灾及业务连续性方案 中国地质调查局计算机系统容灾方案建议书 2 中国地质调查局计算机系统容灾方案建议书 3 建议书建议书 2010 年年 4 月月 DataCore 公司公司 Version 1 1 中国地质调查局计算机系统容灾方案建议书 4 目目 录录 第 1 章 DATACORE 公司概况 6 1 1公司简介 6 第 2 章 存储整合 7 2 1整合 7 2 2实施整合项目 8 2 3结论 10 第 3 章 IT 系统容灾及业务连续性综述 11 3 1概述 11 3 1 1目标 1 应对灾难的种类 11 3 1 2目标 2 恢复时间目标 Recovery Time Objective 12 3 1 3目标 3 恢复数据目标 Recovery Point Objective 12 3 1 4目标 4 确定关键业务数据 需灾备保护的数据对象 13 3 2容灾方案的技术要求 14 3 2 1根据业务选择不同的容灾模式 应同时支持异步 异步模式 14 3 2 2对生产系统的影响 14 3 2 3系统网络资源需求 14 3 2 4容灾方向的切换 15 3 2 5容灾端数据与本地复制软件的集成 提高数据利用率 15 3 2 6与数据库的集成 15 3 2 7实施经验 16 第 4 章 容灾系统及业务连续性对存储平台的要求 17 4 1高可靠性保障 17 4 2高性能设计 17 4 3多主机平台的支持能力 17 4 4容灾解决方案 18 中国地质调查局计算机系统容灾方案建议书 5 4 5备份解决方案 18 4 6解决核心数据争用问题 18 4 7强大的扩展能力 19 4 8简易的管理平台 19 4 9优秀的售后服务体系 19 4 10可持续发展的保证及投资保护 19 第 5 章 DATACORE 建议容灾方案 21 5 1项目要求 21 5 2方案概述 22 5 2 1数据集中的实现 24 5 2 2SAN结构的实现 25 5 2 3跨架构的资源管理 27 5 2 4Snapshot支持数据快速恢复 27 5 2 5AIM支持远程数据镜像 30 第 6 章 AIM 故障恢复场景概述 32 6 1关键字 32 6 2简介 32 6 3AIM 高可用性特性 32 6 3 1折断记录 Fracture Log 32 6 3 2异步数据同步 33 6 3 3故障和LUN转移 34 6 4写日志记录 THE WRITE INTENT LOG 34 6 5自动切换 35 6 5 1镜像和映象状态 35 6 6其他 AIM 特性 36 6 6 1LUN转移支持 36 6 6 2交叉镜像 36 6 6 3与Snapshot的集成 36 6 7上的 AIM 的实现 36 中国地质调查局计算机系统容灾方案建议书 6 6 7 1AIM 和主机操作 37 6 7 2镜像透明性 37 6 7 3去除主机开销 37 6 8AIM 故障场景 38 6 8 1主映象失效和恢复 38 6 8 1 1主映象 LUN 失效 39 6 8 1 2控制的主映象的 SDS 失效 39 6 8 1 3主映象存储系统失效 40 6 8 2次映象失效和恢复 40 6 8 2 1次映象 LUN 失效 40 6 8 2 2控制的次映象的 SDS 失效 40 6 8 2 3次映象存储系统失效 41 6 9小结 41 6 10附录 A 存储系统故障场景 42 第 7 章 DATACORE 全面存储服务综述 45 7 1技术解决方案组 46 7 1 1评估和规划 46 7 1 2构建 47 7 1 3全球交付模式 47 7 1 4通过合作伙伴将DataCore解决方案惠及更多用户 47 7 1 5培训 48 7 2客户服务部 48 第 8 章 容灾系统的数据迁移和容灾测试 49 8 1项目详细规划 49 8 2存储系统安装和配置 49 8 3主机系统改造 主要是 HBA 卡的改造 50 8 4数据备份和数据迁移 50 8 5容灾系统测试 51 中国地质调查局计算机系统容灾方案建议书 7 8 5 1功能测试 51 8 5 2故障测试 52 中国地质调查局计算机系统容灾方案建议书 8 第第 1 章 章 DataCore 公司概况公司概况 1 1 公司简介公司简介 DataCore 公司位于美国佛罗里达州 一直是存储虚拟化领域的领导者 自 1998 年成立起一直致力于为用户提供最佳的存储虚拟化解决方案 不同于一般 的存储厂商的封闭式存储管理架构 DataCore 倡导及坚持的以虚拟化为核心的 开放式存储管理平台 能够整合各种品牌与硬件特性的存储设备形成集中管理 与资源共享的存储网络 让存储管理成为简单而轻松的工作 此外 凭借特有 的各种数据保护技术 以较合理的成本大幅度提高数据的可用性和安全性 全球超过数千家数据中心 500 强企业和中小企业都在使用 DataCore 的 软件来管理存储资源 DataCore 与世界领先的科技公司结成了合作伙伴关系 其中包括 1 500 多家硬件 软件 网络和存储咨询设备公司 以及接近数千家 经过认证的转销商 分销商和系统集成商结成的销商网络 核心存储解决方案与网络存储管理 存储基础架构 Fibre Channel ISCSI SANs 存储网络虚拟化 卷管理与精简配置 数据备份与灾难恢复 存储资源集中管理 虚拟存储基础设施 中国地质调查局计算机系统容灾方案建议书 9 第第 2 章 章 存储整合存储整合 存储整合是存储整合是 DataCoreDataCore 公司解决方案的基石 通过整合 公司解决方案的基石 通过整合 用户能得到更好的性能 容量 可扩展性 用户能得到更好的性能 容量 可扩展性 存取控制 存取控制 和可用性 和可用性 整合创造效率 整合节约成本 您可以整合债务 整合收入 整合即将见 底的番茄酱到一个瓶子中 以简化并更有效地使用您的资源 IT组织结构中的 整合并不是新的概念 当计算机房中计算机堆积起来时 IT经理便开始寻找一 个能将所有东西集中到单一机柜的方法 同时将清理出来的空间挪作他用 当初 分布式环境是为一些具有特定负载的应用的服务器所灵活地采用 在九十年代后期 经济的超高速发展和业务平稳运行的挑战 造成人员短缺 增加了外包和服务提供商的使用 在一些情形下 对技术使用的评估松松垮垮 随着环境的增大 这些灵活的基础架构变得不可控制 难以管理 当前的经济 条件和对新的IT投资的审慎 使得人们非常关注IT基础设施整合 以节约资金 和更好的使用基础设施 今天 当人们更多地关注于总体拥有成本 Total Cost of Ownership 和投资回报 Return on Investment 时 很明显 整合可以改善效率 帮助 IT的管理 以少投入多做事 初期采购成本需要考虑TCO和ROI 因为在许多整 合初期 初期采购成本会比仅仅加一个服务器或增加存储容量高 但证据是底 线 成功的IT整合将财务和操作质量上的改善影响到业务 以增加营业额和利润 2 1 整合整合 整合的选择通常最好的方法是多种整合的组合 对您的多种整合的考虑依 赖于您的环境 包括 中国地质调查局计算机系统容灾方案建议书 10 服务器整合 应用 负载整合 存储整合 人员整合 基础架构管理软件整合 服务器整合服务器整合不是新概念 许多组织为用于工作组甚至个人应用的低成本 服务器的大量出现而欢呼 整合大量支持应用的服务器能加强财务能力 包括 更少的软件许可证 减少设施的管理和支持结构 服务器整合同时还可以使组 织平行化 将部门级服务器置于 IT 的后端 或重新将业务单元 IT 员工与公司 IT 平行化 这意味着成本的节约和可扩展性 灵活性和可管理性的改善 一 些厂商和服务提供商提供许多服务器整合的选项 有些服务器厂商会提供大型 的多处理器服务器 取代大量的小服务器 另一些服务器提供商将提供 UNIX 解 决方案解决大量 NT 服务器的问题 应用应用 负载整合负载整合 通常是指整合单一的大型服务器支持多个应用 以取代多 个运行相同应用的专用服务器 这实际上就是服务器整合的另一个形式 存储整合存储整合在最近几年中存在两种方式 最简单的形式是使用存储的支持多 平台服务器的结构直接连接服务器 这使得您能将数量相对较少的服务器整合 到存储阵列中 存储整合通常带来使用较少的存储容量并容易使用和管理 SAN SAN 存储区域网络连接方式包括一组基于广纤通道协议的存储交换机 通常称为光纤通道 fabric 光纤通道网络的特征是高性能 而一个 fabric 能 支持数百台服务器连接到一个或多个存储系统中 这一技术主要用于数据库和 连机交易处理 OLTP 环境的应用 这些应用典型地要求高性能和很好的连接 能力 基础架构管理软件整合基础架构管理软件整合是目前市场上出现的新的整合类型 使用最新的管 理解决方案 如 DataCore 的 AutoIS 战略 企业能简化和整合其基础架构管理 工具 这将对 IT 部门的操作程序带来巨大改善 同时极大地提高效率和资产使 用率 所有这些将导致人员整合人员整合 人员需求减少是需要维护的服务器和软件个 数减少的直接结果 但最大的影响来自操作程序的改善和架构管理软件整合 最新的存储管理软件解决方案极大的简化了更改环境和了解资产使用情况的挑 战 中国地质调查局计算机系统容灾方案建议书 11 2 2 实施整合项目实施整合项目 成功的整合将使机构在营业额和利润上两方面都得到显示本质上的和可以 测算的改善 但是这也伴随着风险 这种风险以通过对细节的关注 通过论证 过的实施过程和通过富有经验的实施队伍来实施得以减轻 例如 即使 即使 一台大的服务器比两台小服务器的成本低 并且存储的利用率较高 但是发生 故障将使两个工作都停下来 因此 冗余 复制 扩充 灵活性和管理方面的 计划就变得十分关键 这种对将两个服务器迁移到一个服务器的小型整合所要 求的铺垫工作同样适用于对整合数以千计的服务器 实施 SAN 和标准软件的大 型整合 无论是大型整合还是小型整合都必须做好前期工作以确保整合成功 为保证整合对业务的影响 决定是否和如何前进 最终的实施必须通过六个关 键阶段 发现和概略 分析当前的支持业务的信息流 设计整合的架构 决定是否需要合作伙伴 部署架构 分析和论证 这些关键步骤贯穿于识别现有环境中大量的设备到最终确认新环境达到设 计目标 有些服务提供商提供咨询服务 帮助整合初期的部署 第一阶段第一阶段 第一个步骤是发现和概略发现和概略计算环境中的信息 包括收集资产 使用 性能 和物理设备情况的信息 这包括整个业务流程的信息流的评估和 信息对业务的价值 这个过程通常会揭示系统间的依赖关系 有助于确保后续 计划符合公司对数据和过程的要求 整合的初始化通常伴随着架构在改善业务 连续性和灾难恢复的部署 决定了信息对业务过程是关键的 也就决定了对业 务连续性和灾难恢复计划的可用性要求 第二阶段第二阶段 基于概略 下一个步骤是对服务器 应用和存储孤岛进行当前当前 环境分析环境分析 那些资产使用率不高 需要整合 哪些服务器可能整合 SAN 架构 能改善环境和使用率 如何管理环境 如何改善 有可能对业务单元就其使用 的资源和服务进行计费 架构的可用性如何改善 TCO 和 ROI 如何影响操作和 业务如何计算和论证 第三阶段第三阶段 分析阶段后 才可设计整合的架构设计整合的架构 包括可用性 恢复 可管 中国地质调查局计算机系统容灾方案建议书 12 理性 灵活性和可扩充性 如何部署服务器 应用 存储和架构管理软件的整 合 第四阶段第四阶段 在正式部署前 您还需决定是否需要合作伙伴合作伙伴 在许多当前的 复杂环境中 合作伙伴和咨询机构可能在最初的阶段就参与进来 在一些案例 中他们甚至开发了新的整合架构的设计 但实施是另一回事 它要求其他的技 巧 您要部署的架构的复杂度 整合初期介入的规模和类型 将决定您是否需 要使用合作伙伴 许多机构在部署 SAN 作为其存储整合时 都利用了合作伙伴 的经验 存储管理和架构管理通常也要求合作伙伴的服务 第五阶段第五阶段 一旦整合设计完成 实施队伍确定后 就可进行架构部署架构部署 整 合架构的部署必须是由一定数量的事件组成 而不能是无休止的过程 实施队 伍的经验和实施记录是非常关键 同经过论证的服务提供商合作是无价的 他 们还可以对机构的人员培训 在整个整合初始阶段的一个关键部分是完成对所 发现的所有方面的项目管理 当部署完成后 许多机构还使用现场管理服务来 运行 将过程用文档记录等 保证知识让用户掌握 第六阶段第六阶段 最后 整合架构完成部署后 对操作上的改变 对财务和业 务的影响的论证论证是必要的 这也是机构建立持续的反馈机制的时候 因为一直 有其他整合项目的机会 2 3 结论结论 尽管服务器整合和存储的整合不是最新的实践 IT 市场对整合给予了新的 关注 人们普遍认识到 IT 的核心是其管理的信息 而不是技术在运行业务 这使得 IT 变成以存储为中心 而存储业界最新的发展方向是标准的存储管理软 件 这是软件整合的新纪元 它将极大地改善操作程序 改善技术和信息资产 的使用 整合将对您的组织的效率和 ROI 产生巨大和积极的影响 由包括服务 器 存储和架构管理软件的软件整合将对业务产生巨大影响 今天 围绕网络 存储而设计的 加上支持服务器整合环境的架构管理软件的价构将是最高效 最可扩充和最可管理的环境 DataCore 拥有市场上最宽的解决方案 提供最适合的存储平台 网络化的 存储解决方案和存储管理软件 以及久经考验的方法论 最佳实例 和经验丰 富的实施队伍 满足整合的挑战 中国地质调查局计算机系统容灾方案建议书 13 中国地质调查局计算机系统容灾方案建议书 14 第第 3 章 章 IT 系统容灾及业务连续性综述系统容灾及业务连续性综述 3 1 概述概述 您的业务受到保护吗 在遭遇与信息相关的灾难的公司中 40 以上 再也无法重新开业 使用来自 DataCore 的业务连续性解决方案保护您的组织 并提高生产效率 现在 您可以保护企业中的每一种信息 以针对每一种信息 的特定业务价值而定制的解决方案 DataCore 提供了 范围广泛的一系列业务 连续性产品 从简单 低成本的磁盘备份解决方案 到一流的本地和远程复制 能力 不管您的目标是保护核心业务不受灾难破坏 还是确保高可用性 我们 都为您准备了解决方案 依靠 DataCore 在数据的整个生命周期中 您都可以让数据的保护级别与 其业务价值相匹配 这样 每一类业务信息都能得到其应得的保护级别 依靠 DataCore 在预算 操作过程和技术限制范围内 您仍旧可以得到世界级的保 护 在规划远程容灾系统方案时 应根据具体要求明确方案所要达到的目标 因为 不同的灾难恢复目标 可以使用不同的灾难恢复技术实现方案 相应得 投资 规模和运行成本也将会不同的 根据中国地质调查局计算机系统的实际状况 DataCore 公司建议选择容灾系统方案时考虑以下几点 3 1 1 目标 目标 1 应对灾难的种类 应对灾难的种类 有许多计算机系统内部以及计算机所处环境中的潜在因素可能会造成数据 丢失情况的发生 据不完全统计 造成数据丢失的事件中 软硬件和网络故障占 11 左右 断电和电源故障占 50 左右 火灾地震爆炸和雷电等灾害占 18 左右 人为因素占 17 左右 其他因素占 4 左右 为了应对不同的灾难 主中心和灾备中心的选址也会不一样 例如为抵御 中国地质调查局计算机系统容灾方案建议书 15 地震灾害 主中心和灾备中心应选择在不同的城市 而不宜选择同城 为抵御 长时间停电故障 主中心和灾备中心就应选在由不同的输变电网络和电厂覆盖 的区域 只有明确灾难恢复方案所要应对的灾难的种类 才能科学地选择主中 心和灾备中心的地理位置 3 1 2 目标 目标 2 恢复时间目标 恢复时间目标 Recovery Time Objective 恢复时间目标 Recovery Time Objective RTO 是灾难发生后业务能够 容忍的停顿时间 或者说灾难发生后 恢复业务运行所需要的时间 一般来说 恢复时间 RTO 越短 那么灾难恢复方案的成本就越高 但是造成的业务损失 就越小 反之 恢复时间 RTO 越长 灾难恢复方案的成本较低 但是造成的 业务损失就较大 最佳的恢复时间目标 RTO 应为业务影响 损失 曲线和方案成本曲线 的交点所对应的时间 比最佳恢复时间更短的目标 将造成投资浪费 而比最 佳恢复时间更长的目标 灾难发生造成的损失会大于方案投资成本 所以灾难 损失的风险较大 3 1 3 目标 目标 3 恢复数据目标 恢复数据目标 Recovery Point Objective 恢复数据目标 Recovery Point Objective RPO 是灾难发生后业务能够容 中国地质调查局计算机系统容灾方案建议书 16 忍的数据丢失量 或者说灾难发生造成的数据丢失量 一般来说 恢复数据目 标 RPO 越高 即丢失的数据越少 方案的成本越高 但是由于灾难造成的 业务损失就越小 反之 恢复数据目标 RPO 越低 即丢失的数据较多 方 案的成本较低 但灾难造成的业务损失也较大 最佳的恢复数据目标 RPO 应为业务影响 损失 曲线和方案成本曲线的交 点所对应的目标 比最佳恢复数据目标更高的目标 将造成投资浪费 而比最 佳恢复数据目标更低的目标 灾难发生造成的损失会大于方案投资成本 所以 灾难损失的风险较大 3 1 4 目标 目标 4 确定关键业务数据 需灾备保护的数据对象 确定关键业务数据 需灾备保护的数据对象 按照数据的重要和关键程度 大致将 IT 系统的所有数据分为三大类 客户服务类数据 指那些支持数据中心核心产品和服务所需数据 该类数据的恢复时间目标 RTO 一般在一小时内 而且不允许数 据丢失 业务支持类数据 指那些业务运行所需数据 该类数据的恢复时间 目标 RTO 一般小于 24 小时 可延缓数据 其他数据如办公室 OA 等 该类数据的恢复时间目标 RTO 一般小于 48 小时 考虑到 上述三类数据之间的互相耦合和关联 一般来说 客户服务相关 中国地质调查局计算机系统容灾方案建议书 17 的数据约占数据总量的 80 业务支持数据约占 15 可延缓数据约占 5 3 2 容灾方案的技术要求容灾方案的技术要求 IT 系统容灾是一项系统工程 具体涉及应用软件 服务器 数据库 存储 网络 服务等多个部分 容灾系统的建设应建成一个可以集成各项技术 业务 的平台 3 2 1 根据业务选择不同的容灾模式 应同时支持异步根据业务选择不同的容灾模式 应同时支持异步 异步模式异步模式 用户可根据数据的重要性划分数据备份等级 如客服 业务数据可采用异 步镜像模式 而核算业务等可采用异步模式 不同的模式可在同一通信链路上 实现 具体可根据用户的需求而定 而且同一生产卷的操作方式可以很方便的 切换成另一种方式 切换后的数据复制是增量复制 不需要生产卷重新全盘复 制 3 2 2 对生产系统的影响对生产系统的影响 在规划系统的时候 必须考虑将来对生产系统的影响 如时延 灾难的切 换等 不能因为容灾系统而降低生产系统的性能 故必须考虑网络 系统切换 等因素 中国地质调查局计算机系统容灾方案建议书 18 3 2 3 系统网络资源需求系统网络资源需求 在选择异步容灾模式时 延迟是必须首先考虑的重要因素 包括 纯粹信号延迟 协议转换 线路距离 往返次数 网络技术延迟 协议负载 带宽因素 队列延迟操作并行性与延迟积累等 而网络是其中的主要因素 纵观可选的网络资源 主要包括 FC Over DWDM or Dark Fiber ESCON Over DWDM or Dark Fiber E1 T1 ATM IP 其中 Fiber Channel 是专用的通道协议 以带宽高 双向 200MBytes S 可 靠性好而成为首选 由于 TCP IP 协议是一个共享型的网络协议 网络传输是非 确定的 非可靠的协议 带宽的利用率比较低 在 ESCON 通过 CNT 转换后 Over SDH 的模式中 ESCON 的带宽为 17MB s 数据的一次传输和确认需经过 4 次信号转换 每次信号转换的时延在 2ms 左右 共需 8ms 而且 CNT 转换后 的信号协议是 ATM Async Transfer Mode 数据包的到达没有时序性 而且 SDH 是为电信语音网络传输设计的 是时分复用系统 ESCON 通过 CNT Over SDH 在时延 带宽上都不适合大数据量的异步复制 故在异步容灾模式中不能 使用 TCP IP 或 SDH 作为数据传输的网络 建议选用 FC 裸光纤直连 或 FC over DWDM 3 2 4 容灾方向的切换容灾方向的切换 在容灾切换时 主中心 容灾中心的角色切换应简洁而高效 特别在数据 回切时 只需作增量异步 3 2 5 容灾端数据与本地复制软件的集成 提高数据利用率容灾端数据与本地复制软件的集成 提高数据利用率 利用本地镜像软件为备份端数据进行本地镜像时 应不影响生产端与备份 端的镜像关系 本地镜像软件应能作全局的数据复制 而不是局限在某些磁盘 内 以增加方案的灵活性和扩展性 中国地质调查局计算机系统容灾方案建议书 19 3 2 6 与数据库的集成与数据库的集成 数据库对数据的一致性 时间戳等最为敏感 故容灾方案与数据库的集成 也是关系到容灾成败的关键因素 如是否支持 ORACLE 的 OPS DataGuard 等 3 2 7 实施经验实施经验 集成商或厂商是否有丰富的容灾实施经验也是必须考虑的因素 中国地质调查局计算机系统容灾方案建议书 20 第第 4 章 章 容灾系统及业务连续性对存储平台的要求容灾系统及业务连续性对存储平台的要求 容灾系统除了对存储容量的基本需求外 对存储平台有着很高的要求 总 结如下 4 1 高可靠性保障高可靠性保障 IT 系统是银行的信息战略资产 整个系统绝对不允许由于中心设备维护 软件升级 更新设备 扩容等 和设备故障等原因而导致系统的中断 甚至 数据丢失的情况的出现 因此选择能够提供有着优秀的高可靠性设计的产品 完善对可预见的停机 情况 操作系统升级 备份 软件升级等 和不可预见的停机情况 软硬件故 障 操作失误 自然灾害等 进行控制的业务持续性解决方案 以及严格的质 量管理和优秀的 7 24 小时的售后服务的设备供应商及其解决方案 是企业选择 存储平台时首要考虑的事项 4 2 高性能设计高性能设计 当系统集中后 集中的系统将面临大量的用户业务请求 和不断新增的业 务内容 用户同样不能忍受任何性能瓶颈 根据摩尔定律 微处理器的处理能 力每 18 个月翻一倍 和吉尔德定律 骨干网的带宽每 6 个月翻一倍 证明 今 天建设 IT 系统有着充足的 CPU 处理能力和网络带宽 真正制约系统整体性能 表现的是系统的存储处理能力 因此选择一种智能存储平台 通过优秀的 CACHE 算法使得数据尽可能的使用 CACHE I O 操作替代硬盘 I O 操作 将对 整个 IT 架构中硬件性能的提高起着决定性的作用 4 3 多主机平台的支持能力多主机平台的支持能力 容灾系统的存储平台是中国地质调查局计算机系统将来的信息中心存储平 台 中国地质调查局计算机系统将根据应用的需要选择多种服务器 比如 Intel 服务器 今后可能会是 IBM HP UNIX 服务器等 所以支持多主机平台的连接能 中国地质调查局计算机系统容灾方案建议书 21 力也应该是此次容灾系统建设的基本要求 4 4 容灾解决方案容灾解决方案 人无远虑 必有近忧 对于整合 IT 系统后的企业而言 如果系统所在地 区发生灾难 造成全部业务中断 而短时间内不能恢复的话 将对银行声誉和 业务的影响造成严重的负面影响 并且为竞争对手提供难得的侵蚀市场份额的 时机 从而使得企业雪上加霜 但投入大量资金建设的容灾系统如果无法为企 业的日常生产创造效益 而只是等待多年不遇的灾难发生后才能显现价值 对 于任何一个企业的决策者而言 也是难以接受的 因此在建设两个信息基础平台的基础上 在提供了容灾解决方案的同时 又成为互为备份的双生产中心 容灾方案必须建设一个能满足用户要求的 保 证作到任何情况下都不丢失数据的容灾方案 4 5 备份解决方案备份解决方案 容灾系统的建设不等于不需要备份系统了 举例来说 如果生产系统意外删 除了核心数据 如用户资料表 等等 则这项操作会同时反映到容灾系统中 从而给企业生产带来困难 而这时就需要从备份的数据中找回丢失的数据 集中后的系统 对备份解决方案在原来可以实现备份和恢复的基础上 还提出 了更高的要求 统一的备份平台 不能一个子系统建设一个备份系统 重复投资 管理复 杂 备份操作不能影响生产系统的正常运行 备份系统需要高速 高效 支持先进的 Server Less LAN Less 备份技术 备份系统的管理应该简洁明了 4 6 解决核心数据争用问题解决核心数据争用问题 随着服务要求的提高 中国地质调查局计算机系统业务系统逐步将成为 7 24 小时不可间断运行的系统 因此如何解决经营分析等业务需求与生产系统 争用同一份数据的问题 成为生产支持系统需要考虑和解决的难题 通过智能存储平台的智能处理能力和数据复制能力 在存储平台上可以高效简 中国地质调查局计算机系统容灾方案建议书 22 洁快速的实施对核心数据的复制和分发的操作 将可以解决对核心数据的争用 对生产系统的性能和稳定性的影响的问题 因此 在存储平台设计时 将解决 核心数据争用问题列入考虑范围是充分利用先进的存储技术来解决原有技术问 题的一个先进的思路 4 7 强大的扩展能力强大的扩展能力 业务量的高速增长 新业务的不断开发和实施 新的营销手段的不断推出 都使得企业信息系统内数据量迅速增长 因此存储平台是否有足够的扩展能力 包括主机连接能力的扩展 Cache 的增加 硬盘容量的增加 以及对异构平台 的支持 都是选择高性能智能存储系统要考核的技术指标 4 8 简易的管理平台简易的管理平台 增加设备不能增加人员是每一个信息中心主管头痛的问题 因此新的厂商 能否提供具有良好的人机界面的管理工具 辅助信息中心管理维护人员完成对 多种设备 异构平台 多厂商产品的统一的日常管理 维护 监控 分析操作 是降低企业运行成本 提高维护效率 使得 IT 系统能够更好为企业创造价值的 一个重要考察指标 4 9 优秀的售后服务体系优秀的售后服务体系 存储平台上存放的是数据 是整个 IT 系统建设围绕的中心 因此存储产 品没有 小故障 只要出现故障 就是大问题 因此存储产品的售后服务要求 要比任何一个其它硬件产品的售后服务要求要高 而高端存储产品的全冗余设 计使得存储平台内任何某一个设备的损坏不会影响生产系统的运行 并被管理 人员发现 因此更是要求存储产品有强大的故障预处理能力和自动告警能力 要求厂商有足够的售后服务人员提供专业的 7 24 小时的现场服务能力 并要求 有 7 24 小时的备品备件库 4 10 可持续发展的保证及投资保护可持续发展的保证及投资保护 存储产品上存放的是信息系统的数据 当数据量大到一定程度后 数据从 一个存储平台向新的存储平台的转移将成为一项痛苦而漫长的操作 因此要求 中国地质调查局计算机系统容灾方案建议书 23 存储厂商承诺其新产品与原有产品的兼容性和有提供数据迁移的专业服务能力 因此要着重考察存储厂商在科技研发上的投入能力和产品线的持续发展能力 从而确保现有投资能够通过平滑的扩展可以支持企业 3 5 年或更长时间的持续 发展的需要 选择稳定可靠的存储平台以保障企业信息系统稳定可靠的服务于 企业的生产和管理 中国地质调查局计算机系统容灾方案建议书 24 第第 5 章 章 DataCore 建议容灾方案建议容灾方案 5 1 项目要求项目要求 该容灾系统的业务目标如下 一 建设有效的数据备份系统 针对应用服务其可能的崩溃的情况 能够 迅速地在数分钟内 指数据恢复 恢复到 1 小时前的状况 即 RPO 为 1 小时 而 RTO 为分钟级别 其中 RTO 指数据的恢复 而业务 的恢复需要考虑 SQL 数据库的启动等过程 二 建设有效的灾难恢复系统 针对计算机系统以外的环境故障 能够迅 速地将的应用切换到远程系统上 环境故障包括电力供应 空调故障 火灾等突发性事件 当然 系统要求足够灵活 如能够支持部分 SQL 数据库切换到远程运行 而同时其余的应用还在生产中心运行 等等 容灾系统初步确立为基于网络存储的同城异步系统 主生产中心放在新大 楼 容灾备份中心放在现有的大楼 两地通信链路将采用租用 IP 链路 该容灾系统实现的业务目标是在主中心发生灾难时 应用能够很快地切换 到灾备系统 为此使用两个存储系统分别用于主中心与灾备中心进行实时交易 的实时异步复制 即 RPO 为 0 主数据中心计划有 12 台服务器与存储相连 服务器都是 Windows 操作系 统 以集群配置 主数据中心使用一台 SANmelody 存储系统和两台 24 口交换 机 冗余配置 所有服务器配备 DataCore 通道管理软件 MPIO 灾备中心各有 6 台服务器与存储相连 用于灾难发生时接管服务 服务器以单机配置 灾备 中心使用一台 SANsymphony 和两台 16 口交换机 中国地质调查局计算机系统容灾方案建议书 25 生产中心与灾备中心拓扑图 左侧为灾备中心 右侧为多个生产中心 5 2 方案概述方案概述 从存储系统的实施方面来考虑 存储系统的物理实施层次可以划分为以下 五个层次 系统层次功能DataCore 解决方 案 存储平台 提供最基本的 大容量的安全可靠的 高性能的数据的存储服务 DataCore SANsymphony 或 SANmelody 本地快速 复制 本地快速数据镜像 最大限度地解放对 生产系统的数据争用 Snapshot业 务 连 续 性 远程容灾在为用户提供容灾解决方案AIM 管理平台 为企业的现有的和将要建设的存储系统 提供一个统一的 集中的管理平台 SANmanager 中国地质调查局计算机系统容灾方案建议书 26 下面 将根据以上思路 提供一个初步的建设方案 DataCore 公司建议用于生产和远程容灾的存储系统采用 DataCore 存储系 统系列产品 生产和灾备的存储系统型号不要求一致 原则上是生产系统使用 的型号高于或等于灾备系统的型号 DataCore 建议在生产中心部署 DataCore SANmelody 容量为 4 个 TB 左 右 在远程的容灾中心使用 DataCore SANsymphony 存储系统来作为容灾存储 系统 容量也为 4TB 左右 生产数据建议全部以 RAID 0 1 方式配置 而 BCV 则可使用 Raid5 方式配置 两个数据中心都建立冗余 SAN 结构 在主生产中心 每台服务器都安装 至少两块光纤 HBA 卡 分别连接到两台 SAN 交换机上 交换机再分别跨接到 SANmelody SANsymphony 上的两个存储控制器上 组成全冗余架构 建议在 灾备系统中主机仍然采用冗余配置 但为节约成本 则也可以不要求使用双 HBA 在主中心的每台服务器上都安装 DataCore MPIO 软件 负责通道的管理 在运行正常时 MPIO 软件能将通道负载均衡 在通道上出现故障时 其 IO 都 会切换到另一条通道上 从而避免应用停机 两地分别配置 2 台 Brocade 公司生产的光纤存储交换机 建议在主中心使 用 24 端口交换机 而灾备中心配置 16 端口交换机 在生产中心和容灾中心的存储系统使用 AIM 容灾软件来实现生产中心和 容灾中心数据的实时异步远程复制 在生产中心建立一套 BCV 系统 将日常进行的磁带备份和数据抽取等工 作放在容灾系统的 BCV 上 这样可以减轻由于这些工作而带来对生产系统的停 机时间冲击和性能冲击 同时在该 BCV 也是时间点数据备份 可以用于在主数 据库崩溃等逻辑错误时 进行恢复 网络设计中 可以采用租用或自己铺设裸光纤 在两中心间隔距离小于 500 米时 只要将光纤直接连接在存储设备上即可 当两中心间隔距离小于 35 公里时 只要将光纤连接在交换机上 同时交换机上安装长波端口 并加载扩 展距离许可证即可 当两中心距离大于 35KM 时 可采用 DWDM CWDM 设 备进行网络资源共享 即租赁裸光纤 自加 DWDM 设备 中国地质调查局计算机系统容灾方案建议书 27 5 2 1 数据集中数据集中的实现的实现 建议采用 DataCore 的 SANmelody 智能存储来实现数据中心的数据整合 SANmelody 是海量数据中心的大规模数据整合的有力工具 DataCore 建议建设 SAN 架构 将上述应用的数据全部存放在 SANmelody 存储系统 目前有 12 台 PC 服务器将接入 在 SANmelody 中 为每台服务器分配专 用逻辑卷 LUN 除非是服务器集群配置 各服务器不能共同连接在同一个 LUN 上 从而保证相互之间没有干扰和影响 建议这些 LUN 建立在 Raid 的磁 盘组上 今后可能会为其他应用再购置一些服务器接入 因此 本期系统设计时 既要满足当前的现实要求 又要兼顾未来扩充的要求 预留空间和接口 DataCore 建议在主中心采用高可用全冗余的方法建设架构 具体的说 就 是主机配置两块 HBA 卡并安装 DataCore MPIO 软件 采用两个 SAN 交换机 从而每台主机都有双通道连接到 SANmelody 上 当前的情况下 大约需要为 12 台 Windows 服务器配备 MPIO 软件 由于主机较多 另外还有远程光纤链路 SANmelody 存储等都要连入 SAN 中 建议使用 2 个 24 端口交换机 对于灾备中心 为灾难恢复的应用切换 必须有主机服务器 主中心的所 有不同的操作系统在灾备中心必须都有备份 在目前的情况下 灾备中心必须 有 Windows 服务器 当然 服务器的数量和规模可以比主中心的小一些 同样 存储系统也可相应的小一些 DataCore 推荐在容灾中心使用 SANsymphony 作数据整合 并假定有 6 台 服务器与 SANsymphony 存储相连 服务器以单机配置 DataCore 建议在灾备中心仍然采用高可用全冗余的方法建设架构 具体的 说 就是主机配置两块 HBA 卡 但还是采用两个 SAN 交换机 这是由于容灾 方面 两个存储系统之间通信线路必须冗余 而每台主机都使用双通道连接到 SANsymphony 上 由于主机较多 另外还有远程光纤链路 SANsymphony 存 储等都要连入 SAN 中 建议使用 2 个 16 端口交换机 中国地质调查局已经有 两台这样的交换机可以使用 根据当前数据量的情况 参看服务器和数据量表 当前数据的总量在 1TB 左右 考虑数据的年增长量如 20 40 我们可以估计在未来两年的将来 中国地质调查局计算机系统容灾方案建议书 28 数据量应当在 1 6TB 左右 在设计规划容量时 还应考虑在这未来可能的新应 用加入和 BCV 等机制所需容量 因此 基于 2 年的设计目标 在此先确定 4TB 的容量设计 对于数据 我们建议使用 RAID1 镜像保护方式 这个 RAID 保护方式能 够很好的平衡性能和投资代价 但对于 BCV 等 LUN 我们建议使用 RAID5 保 护方式 再考虑磁盘在格式化中的损耗 DataCore 的实现中将损耗 10 左右 和动态备盘 我们建议 对于数据中心的 SANmelody 配置裸容量不小于 4TB 因此 如果采用 300GB 磁盘 则数据中心的 SANmelody 需要至少 15 个磁 盘 备份中心需镜像主数据中心的数据 因此 该 SANsymphony 也配备的磁盘 量建议 15 个 300GB 今后在容量上需要扩充的话 只要增加磁盘即可 如果需要增加主机 只 要插入这个架构即可 这是 DataCore 存储系统支持所有主机的多平台同时连接 特性所特有的优点 也是投资保护的根本体现 5 2 2 SAN 结构结构的实现的实现 整个 SAN 架构由后端存储器系统 SANmelody 中间 SAN 交换机 前端主 机服务器组成 因此 架构的高可用性包括这三层所采用的设备的可用性和其 相互连接的可用性 以下分别阐述 SANmelody SANsymphony 交换机 服务 器以及 FC 通道连接方式和可用性管理 来说明架构的可用性能力 DataCore 存储系统 SANmelody SANsymphony 是内建全光纤双控制器冗余 系统 SANmelody SANsymphony 智能存储采用全冗余容错设计 高可用性能 力超过 99 95 SANmelody SANsymphony 的高可用性还包括 DataCore 独有 的数据完整性技术 如 SANmelody SANsymphony 的 Cache 缓存采用包括 ECC 纠错技术 LRC 校验技术和 Memory Interleaving 技术内建的综合保障 保证任 何由于 Cache 故障造成的连续 4 比特数据差错都可以得到纠正并恢复正确缓存 数据 SANmelody SANsymphony 的 RAID 保护机制 保证一个 RAID 组中的任 何一个磁盘的故障都不会造成数据丢失 SANmelody SANsymphony 的动态热 备盘可以顶替任一发生故障的磁盘 在故障磁盘得到替换之前 继续提供 中国地质调查局计算机系统容灾方案建议书 29 RAID 数据保护 所以一个 RAID 组中 2 个磁盘非同时发生故障 数据仍不会 丢失 SANmelody SANsymphony 还提供双电池备份子系统 在损失双 AC 电 源模块的情况下 任一电池备份子系统可保证 SANmelody SANsymphony 存储 设备运行至少 3 分钟 以便存储设备紧急下载任何 Cache 缓存中的数据到磁盘 从而保证写入 SANmelody 存储的数据的一致性和完整性 SANmelody SANsymphony 的风扇系统为 2 1 对风扇冗余 1 对风扇故障 余下 2 对风扇可支持设备的运行 SANmelody SANsymphony 使用双端口磁盘 每个双口 Dual Port 磁盘可由 2 个磁盘控制器同时控制 一个磁盘控制单元 的故障不影响任何 SANmelody 磁盘的访问 SANmelody SANsymphony 的关键 部件 如控制器 风扇 电源模块 电池备份子系统和磁盘等 均可在线更换 其存储设备操作系统和软件可在线升级 SANmelody SANsymphony 的客户可以在同一单元中整合搭配各种性能 容 量 成本和数据保护方案 与来自服务器供应商的存储阵列不同 能够同时支 持多个操作系统并确保不同服务器之间实现完全互操作 这是独一无二的 还 通过其 Snapshot 和 AIM 软件 支持基于存储的本地和远程数据复制以实现备 份和灾难恢复 所有这些性能和灵活性都必须以卓越的可用性为后盾 这方面 确实非常出色 的设计一直没有包括风扇和电线的单点故障 设计的目标就是 实现不间断操作 即可以在线完成软件升级和硬件重新配置 有了这些功能 当然适合于任务关键型的应用程序 它会经常检查硬件和软件的完整性 通过 ClarAlert 呼叫总部功能 提前将潜在问题逐级报告到 DataCore 总之 在本架构中 SANmelody 全冗余系统 SAN 交换机可靠性很高 如果服务器以集群配置 因此这个架构能保证高可用能力 该架构的灵活性表现在两方面 一方面 需要增加应用时 只要将服务器 接入这个 SAN 架构 并为之配置磁盘空间即可 另一方面 当需要增加空间时 只要增加磁盘即可 磁盘阵列的剩余空间可由连接在 SAN 架构中的所有服务器 充分共享 对于本 SAN 架构 使用 DataCore 管理软件 可实现全架构的集中管理 为实现 SAN 高可用性而提供的配置管理和性能监视 能够以端到端的方式查 看 SAN 设备和链路配置以及性能 这在使用独立 非集成式的 元素管理器 中国地质调查局计算机系统容灾方案建议书 30 时是无法做到的 存储资源调配向导 它加快了向新主机分配存储器或为现有 主机重新配置存储器的速度 它还包含一定的保护功能 可以防止管理员可能 执行的危险操作 例如 将某个数据库应用程序已在使用的逻辑单元 LUN 分配给另一个新应用程序 跨架构的资源管理跨架构的资源管理 采用 DataCore SANmanager 的信息存储管理软件来实现综合信息存储管理 SANmanager Manager 是的安全 易用和基于浏览器的管理界面 它 可以为任何规模的存储环境提供全面而简化的管理 可以随时随地通过 Web 浏览器访问以供使用 提供了一个简单直观的界面 可用作 SANmanager 管理的应用程序的管理界面 SANmanager Manager Snapshot AIM SAN Copy 可通过强用户验证提供安全性 以实现保密性和存取控制 包括 LUN 屏蔽技术 以前作为 Access Logix 单独购买 主机到阵列映射和脚本技术 以前作为 SANmanager Agents CLI 单独购买 SANmelody SANsymphony 实时性能监控 实时 配置查询和变更 SANmelody SANsymphony 历史性能数据采集和分析 图形化展示各类服务器上的存储资源 如逻辑卷组 文件系统 和存储 设备底层资源 如阵列 磁盘 磁盘分区等 的对应关系 帮助系统管 理员优化存储使用方式 提供单一的控制点 从而提高运营效能 使得客户能够实现服务级别的 要求 为整个企业中的各种资源提供集中视图 主动制定计划而非被动 反应 做到未雨绸缪 提高业务决策 通过主流 IT 管理架构 如 IBM Tivoli HP OpenView CAUnicenter 等 可以直接启动 DataCore Navispere 管理软件 另外 DataCore Navispere 管 理软件支持通过 SNMP 与主流 IT 管理架构 如 IBM Tivoli HP OpenView CA Unicenter 等 的集成 中国地质调查局计算机系统容灾方案建议书 31 5 2 4 Snapshot 支持数据快速恢复支持数据快速恢复 Snapshot 软件非常重要 该软件功能是数据中心必不可少的 DataCore 的 Snapshot 软件 用于支持生产系统的数据备份 数据抽取和数据恢复 Snapshot 使用少量磁盘 对生产系统的数据生成 Snapshot 既瞬间的数据映像 诸如数据备份和数据抽取 以及软件测试等工作就可以在 Snapshot 上进行 这 样做的好处是非常明显的 因为数据备份和数据抽取 以及软件测试等工作直 接在生产系统的数据上进行的话 对生产系统的冲击非常大 使用 Snapshot 可实现 Split Mirror 不干扰生产系统的 数据备份 数据抽取和软件测试等 磁带数据备份如下图所示 Snapshot 能用于同种 操作系统的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能制造2025研发成果独占权保护及商业秘密协议
- 茶叶加工企业年度技能提升培训服务合同
- 2025年公立医院医护人员职业行为规范及风险预防服务合同
- 2025年草原生态保护与草场租赁综合管理服务合同
- 2025年冷链物流货物中转与全程温控服务合同
- 2025年文化旅游项目合作协议:景区开发与品牌营销
- 2025年度企业知识产权保护合同范本:创新成果权益保障手册
- 2025年度智能家居装修一体化服务合同
- 2025年绿色环保车辆挂靠销售服务合作协议范本
- 2025年度市政道路绿化工程承包安全责任协议书
- 2024年度软件即服务(SaaS)平台租赁合同3篇
- 网络攻防原理与技术 第3版 教案 -第12讲 网络防火墙
- 2024年新课标培训2022年小学英语新课标学习培训课件
- 2024小学语文教学及说课课件:二年级上册《田家四季歌》
- 2024至2030年中国聚脲涂料行业市场发展调研及投资前景分析报告
- 1.1 鸦片战争 课件 2024-2025学年统编版八年级历史上册
- 2024至2030年中国演播室行业市场调查研究及发展战略规划报告
- DB11∕T 420-2019 电梯安装、改造、重大修理和维护保养自检规则
- 国旗台施工合同
- 总代理授权书
- 医疗器械售后服务能力证明资料模板
评论
0/150
提交评论