湖南交警和烟草容灾备份方案.doc_第1页
湖南交警和烟草容灾备份方案.doc_第2页
湖南交警和烟草容灾备份方案.doc_第3页
湖南交警和烟草容灾备份方案.doc_第4页
湖南交警和烟草容灾备份方案.doc_第5页
免费预览已结束,剩余31页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

湖南湖南 XXXX 系统容灾备份方案系统容灾备份方案 赛门铁克软件 北京 有限公司赛门铁克软件 北京 有限公司 20102010 年年 5 5 月月 Your Infrastructure Your Information Your Interactions Only Symantec Protects Them All 目 录 第第 1 1 章章项目背景项目背景 4 4 第第 2 2 章章容灾系统技术规范容灾系统技术规范 6 6 2 1容灾系统建设总体规划 6 2 2数据备份 7 2 3实时数据保护 8 2 3 1数据镜像 Mirroring 8 2 3 2数据复制 Replication 8 2 3 3软件复制 卷复制 10 2 4应用级容灾切换 11 2 5数据恢复测试 12 第第 3 3 章章湖南省湖南省 XXXX 容灾备份系统规划设计容灾备份系统规划设计 1313 3 1容灾系统设计原则 13 3 2第一步 灾难恢复需求分析 14 3 3第二步 确定灾难恢复资源获取方式 14 3 4第三步 深化数据备份系统 14 3 4 1常规备份与恢复 14 3 4 2操作系统数据备份 16 3 4 3备份数据异地保存 16 3 4 4重复删除实现 13 地市州数据上传到省中心 17 3 4 5备份数据异地恢复及验证 20 3 5第二步 实现远程实时数据保护 21 3 5 1远程镜像 21 3 5 2Symantec 远程镜像数据容灾原理 22 3 5 3磁盘阵列同步复制原理及局限性 24 SYMANTEC远程镜像数据容灾系统故障和灾难的响应 26 3 5 4当生产中心数据系统故障 26 3 5 5灾备中心数据系统故障以及生产中心和灾备中心 SAN 链路故障 27 3 5 6故障修复后的恢复 远程镜像快速恢复 27 系统容灾方案结构和实现 28 利旧项目中 生产中心与容灾中心磁盘阵列性能差异问题 28 SYMANTEC远程镜像数据容灾方案的技术优势 29 零停机时间和零数据损失 29 故障修复后的快速重新同步 29 跨磁盘阵列快照 实现逻辑错误快速恢复和容灾中心数据利用 29 数据同步过程高度可控 30 节约硬件采购成本 30 SYMANTEC远程镜像数据容灾方案的工程优势 30 3 5 7远程复制 33 3 6第三步 实现远程集群容灾切换 34 第第 1 1 章章 项目背景项目背景 XX 年以来 湖南省 XX 以市州为中心在全省范围内先后推广应用了各种业务应 用系统 建立了省 市二级数据库 并定期将数据方式上传到省局 建立了省局数 据中心 这些数据为湖南省 XX 日常管理 政务办公 领导决策 公众服务提供了极 大的帮助和便利 无论是各地州市的业务系统 还是省中心的核心业务系统 现在各项工作与信 息系统的依存度越来越高 保证网络安全 设备安全 应用系统安全 数据安全 从而保证信息系统的正常运转十分迫切和必要 其中因数据产生是一个日积月累的 过程 损坏后恢复周期长 成本高 有些数据因资料不全无法完整恢复 因此 数 据安全显得尤为突出 数据损坏原因主要包括 误操作而发生删除 因系统调试或软件升级而发生数据错误覆盖 因数据库迁移而发生数据不一致 数据因服务器病毒造成库文件读写错误 数据因为黑客攻击造成数据错误 自然灾难等原因造成电脑损坏 数据无法读取 数据失效分为两种 一种是失效后的数据彻底无法使用 这种失效称为物理损 坏 Physical Damage 另一种是失效的数据仍可以部分使用 但从整体上看 数 据之间的关系是错误的 这种失效称为逻辑损坏 Logical Damage 逻辑损坏比物 理损坏更为严重 因为逻辑损坏不易被发现 潜伏期长 当发现数据有错误时可能 已经无法挽回 现阶段 全省范围的数据备份是采用相互独立的人工备份方式 这种方式存在 着许多问题 比如 不能进行集中备份 系统数据量大于单盘磁带容量 备份工作 需要人工干预 耗费大量的人力和时间 不能进行及时备份以及不能实现在线备份 等等 另外 数据的逻辑错误靠人工很难做到及时发现 一旦发现就会产生无法挽 回的损失 为了解决这些问题 提高数据备份的能力 自动化程度 可靠性以及管 理水平 需要采用专业的数据备份软件和硬件 构建一个较完整的数据备份系统 数据备份能够为数据存储提供良好补充 数据备份通过定期或定时的对湖南省 市州所有的数据库中的数据进行备份 并能提供在需要的时候进行数据恢复 以确 保业务工作的需要 数据备份采用集中化备份系统 要求集成目前主流的备份功能 它能够减少备 份的窗口 提高备份的效率 减少备份的时间 降低网络的影响 避免备份管理的 干预 能够充分满足 XX 系统 IT 管理人员不足的行业背景 将市州的核心应用 xx 系统 的数据库数据和文件数据统一的 集中的备份到 省局中 可对所有核心应用系统数据进行统一的保护 通过现有的 IP 网络专线 实 现统一 集中式的备份 然后可以借助复制策略 将数据从省局的集中存储复制到某个地市州存储上 形成异地保护 同时 针对省局当地的核心存储 一旦发生故障 就会导致所有基 于此平台之上的业务系统停机 所以 消除核心存储单点故障的问题 也迫在眉睫 第第 2 2 章章容灾系统技术容灾系统技术规范规范 随着数据中心的建立和完善 计算机信息系统需要在数据层面 应用层面集中 后 对数据的安全和关键应用的可用性作为风险控制的焦点 很多系统准备或正在 进行数据备份系统的规划和建设实施 数据备份系统建设的目标是要保证数据安全 可用 使计算机信息系统和数据能够最大限度地防范和解决各种意外和故障所带来 的数据丢失 然而 与大多数工程一样 数据备份 恢复及容灾系统建设本身在总体 规划 方案选择和投产实施后的管理运行 以及真正面对数据恢复时的实际操作等 方面也存在着潜在的风险 可以说 数据备份容灾系统本身也可能存在风险点 需要小心应对 备份 恢复及容灾系统建设中所涉及的潜在风险大致可分为技术风险 管理风险 和投资风险 其中尤以技术选择风险最大 技术方案选择优越 可以规避一定的管 理风险和投资风险 而这三者也存在内在的相互关联 不同规模的数据备份 恢复及 容灾方案对应的建设投资规模 所采用的技术以及实施和管理的复杂度也不同 应 考虑保护计算机系统的原有投资并提高数据备份 恢复及容灾系统建设投资的利用率 2 1 容灾系统建设总体规划容灾系统建设总体规划 数据备份的目的是为了恢复 在数据备份的世界里 是有等级观念的 规模不同 数据备份 恢复和容灾系统 所采用的技术和达到的功能是不同的 在系统建设资金投入方面的差距也很巨大 所以 对于数据中心来说 明确数据备份 恢复及容灾系统建设的总体规划十分必要 国务院信息办 信息系统灾难恢复规范 将关键系统灾难恢复分为七个等级 并对每个等级的灾难恢复目标进行了具体的定义 比如第一级灾难恢复等级只是在 异地保存备份数据 并不需要在灾备中心部署业务主机 当灾难发生需要恢复业务 时 将从其他地方调配资源 进行业务恢复 标准中根据灾难恢复等级划分标准 将支持灾难恢复各个等级所需的资源 以 下简称 灾难恢复资源 分为以下 7 个要素 1 数据备份系统 2 备用数据处理系统 3 备用网络系统 4 备用基础设施 5 技术支持能力 6 运行维护管理能力 7 灾难恢复预案 并按照灾难恢复资源的成本与风险可能造成的损失之间取得平衡的原则 以下 简称 成本风险平衡原则 确定每项业务功能的灾难恢复策略 不同的业务功能 可采用不同的灾难恢复策略 按照灾难恢复等级共分为六个级别 2 2 数据备份数据备份 数据备份是系统 数据保护的基础 也是抵御逻辑故障 恶性操作的唯一方案 目前备份技术主要有快照备份 离线备份 异地存储备份 备份系统通过备份策略 对计算机信息系统的操作系统 文件系统 应用程序 数据库系统等数据集 实现 某一时间点的完整拷贝 拷贝的数据处在非在线状态 不能被立刻访问 必须通过 相应操作 如恢复等方式使用备份数据 这也解决了实时数据保护不能解决的问题 人为误操作 恶意性操作等 这类操作 计算机系统是不能区分的 一旦执行 将 造成数据中心 备份中心数据同时修改 对于数据库系统 在日志完整时 可以通 过回滚方式修改 对于文件系统 操作系统等其他配置信息是不能回滚的 将造成 毁灭性的结果 目前成熟的备份软件如 Symantec NetBackup 2 3 实时数据保护实时数据保护 实时数据保护 就是在多块磁盘上 多个阵列 多台服务器 多个数据中心实 时的保存同一份数据的多份存储 目的是为了避免物理故障 数据不会因为一块磁 盘 一个阵列 一台服务器 一个数据中心的故障 而不能访问 此外因为距离限制 还衍生出了准实时数据保护技术 实时数据保护一般是通 过扩展 SAN 网络实现而准实时数据保护一般通过 TCP IP 网络实现 目前实时数据保护的技术主要有两种 数据镜像和数据复制 2 3 1 数据镜像 数据镜像 Mirroring 数据镜像 Mirroring 是冗余的一种类型 一个磁盘上的数据在另一个磁盘上 存在一个完全相同的副本即为镜像 镜像技术可以保证两份数据完全一样 成熟的镜像技术在主机卷层面 因为这种技术可以在主机层面屏蔽来自不同厂 商阵列带来的技术差异性 同时这种技术可以实现同步的 IO 写镜像在性能上更有优 势 先进的卷镜像技术可以识别来自不同站点的镜像磁盘 可以设置读策略让读操作 指针对生产中心阵列从而减少数据镜像对生产中心环境的 IO 压力 对于由于光纤链 路 磁盘阵列控制卡或阵列本身造成的延迟也可以作出判断和应对 一旦真的发生 故障可以禁用到该站点阵列的写操作 确保在应用在该站点的所有阵列上的数据保 持一致性同时开始在正常的环境启用日志记录故障中的每个写操作 在故障修复以 后可以通过快速同步机制进行增量的快速同步对于远程镜像这种方式不但效率高而 且非常可靠 目前主流的卷镜像技术有 Symantec Storage Foundation 2 3 2 数据复制 数据复制 Replication 数据复制 Replication 是将一个原数据及其改动 通过后续机制拷贝到其他 地方 可以是另一个磁盘 另一个阵列 另一个服务器 另一个数据中心 由于实 现的机制不同 又分为同步复制和异步复制两种方式 同步复制 能够确保两份数 据完全一致 此种方式对网络传输带宽及磁盘活动状态有一定要求 例如网络带宽 限制了数据的实时同步 将造成延时从而对系统的影响较大 异步复制 通过后续 机制 确保将本地改动的数据复制的异地 对系统的影响较小 但数据同步有延迟 是目前实现远程异地数据同步的主要方法 很多硬件厂商都有基于自己阵列的硬件镜像方式 但是硬件厂商的镜像方式通 常不能在阵列之间进行 因此容易形成以阵列为单位的单故障点 有些高端阵列可 以提供阵列之间的复制技术 这种技术也被称为 背靠背复制技术 然而这种技 术通常需要复制的阵列采用同一型号 同一配置甚至同一固件版本 因此很容易造成 锁定某种品牌造成扩展性的限制 所谓的阵列间 镜像 实际上并不是真正的镜像 技术 因为在生产端主机端看到的实际上还只是生产端得阵列 因此 镜像 是在 阵列和阵列之间实现的 因此不但在 IO 性能上之后 在阵列或链路出现故障时不能 做到自动判断 这会直接造成应用停顿 而手工进行接管的时间通常需要 15 分钟到 半个小时 这对核心应用的可靠性是很难得到保障的 上层应用通常可能配置了多 个磁盘阵列作为存储 这往往需要多个阵列提供一致性的复制手段保障应用的一致 性复制 这对于不同品牌的阵列和网络条件是极难做到的 最后多种阵列复制技术 对未来实现跨越站点的切换将造成不确定性和实施的复杂性 从复制层面来说 还有通过应用层面来完成数据复制的方式 这种方式多数只 能应用在某个特定的数据库的日志复制层面 对于非结构化的数据没有解决方案 日志复制方式需要在容灾中心部署主机 并在生产端完成对数据库的每个交易的分 析后进行复制 对于每个生产数据交易的分析将会很大程度上影响生产数据库的性 能 尤其对生产交易型服务器高峰期的性能将造成直接影响 而且这种复制技术往 往没有经过数据库的官方认证 一旦数据库版本升级将有可能造成复制的延续性受 阻 虽然数据库复制技术可以提供数据在线分析 数据挖掘等提供帮助 然而其自 身架构的限制很大程度上决定了这种方式适合做双活中心的交易分析 挖掘等 而 不是一个灾备解决方案 还有一种称为虚拟存储层的复制解决方案 这种方法是部署在存储阵列和主机 之间 但是由于需要维护主机层到存储的写一致性 通常需要在主机端部署软件这 将直接影响主机层面的稳定性 我们都知道在交换层面因为承担了生产存储环境承 上启下的角色 因此对性能和稳定性要求是非常苛刻的 对于部署在中间层次的虚 拟技术属于 带内技术 因为其自身往往是 PC 服务器架构 因此在性能上是很难 得到保障的 其次这种架构为了提高稳定性通常需要部署双机集群架构和双控制卡 提供冗余 而双机集群如果在判断和切换上出现问题 将直接影响整个存储环境进 而影响应用的可靠性 多控制卡的部署需要多链路驱动支持 然而面临生产中心底 层多种阵列和上层多种操作系统 即便是新推出了 带外技术 这种虚拟化技术都 会力不从心 因此这种技术还很不成熟 目前国内鲜有成功案例出现 2 3 3 软件复制 卷复制 软件复制 卷复制 复制方式基于数据卷 Volume 进行 复制的数据可以是数据库中的数据 文件方 式或裸设备方式 数据库日志 复制的数据也可以是各种文件 如应用和数据库 配置文件 应用程序 库文件 等等 复制的示意图见图四 Symantec Volume Replicator 简称 VVR 是一种远程卷数据复制 卷复制技术与磁盘卷管理技术可以完全集成在一起 因此可以通过用存储卷管 理管理界面和命令统一配置管理 由于卷复制技术仅仅将卷上每次 I O 的实际数据 实时复制到远程节点 所以在网络线路上传输的数据量很少 对带宽的需求也很小 因此也与应用无关 只要是在定义的复制卷上的仍和操作 都会被复制到异地 2 4 应用级容灾切换应用级容灾切换 所谓高可用性 用最简单的话说 就是系统在使用过程中有百分之多少的时间 是可用的 一般情况下 群集系统需要达到 99 99 8 的可用性 也就是说 系统 每年有四天零九个小时不可用是可以接受的 如果对系统进行了一些特别的优化管理 减少一些配置上不必要出现的错误 把可用性提升到 99 9 99 98 也是不成问题的 在某个群集中 可以使系统的 可用性达到 4 个 9 或 5 个 9 对于一些容错率特别高的系统 可能达到 5 个 9 甚至 6 个 9 以上 所以 全面的容灾保护方案 意味着除了要实现本地的切换保护外 更要实现 数据的实时异地复制和业务系统 包括数据库和应用软件 的实时远程切换 从高可用设计的角度来说 一些关键业务系统应该已经在本地实现了数据冗余 共享 并且在本地采用了高可用的群集保护可以在应用 进程或硬件出现故障时实 现本地应用切换保护 但是如果本地整个应用系统群集都发生了故障 这种本地高 可用性设计的局限性就凸显出来了 因此按照国家容灾标准的最高级别要求 需要 在前面提到的数据层面复制实现的基础上 建立起一个可以在主生产中心和远程备 份中心切换的容灾大集群架构 其切换行为应该为 1 当应用系统某个资源或系统发生故障时 在本数据中心内切换 2 数据中心发生故障时 切换到备份数据中心 3 当主数据中心发生灾难时 切换到容灾备份中心 集群之间如果发生互备关系 即一个集群环境有问题 其管理的应用切换到另 一个集群中运行 它们之间的监控可以经过跨广域网的心跳协议实现 应用切换 的动作通常需要由人工控制 因为灾难恢复是需要经过严格的审查和判断后做出的 因此在广域网集群环境中通常不推荐采用类似本地集群的自动切换方式 当应用切换到容灾中心时 应该有 DNS 域名解析等相应映射修改机制 保证客 户端可以透明的存取切换到备份中心的应用 甚至可以通过大的虚拟 IP 或 DNS 虚拟 映射等方式实现透明切换 2 5 数据恢复测试数据恢复测试 大部分的数据备份 恢复系统方案 在项目实施后 很难有机会来实现恢复测试 因为对于大部分方案来说 这种预演活动 需要耗费大量的人力财力 但是定期数据恢复测试是必不可少的 它是测试目前的备份数据的有效性唯一 手段 因此建立一个数据恢复测试环境 也是数据备份 恢复及容灾系统规划中必不 可少的内容 这一点在国家容灾标准中从第 1 级到第 6 级都有明确的要求 第第 3 3 章章湖南省湖南省 XXXX 容灾备份系统规划设计容灾备份系统规划设计 3 1 3 1 容灾系统设计原则容灾系统设计原则 我们认为系统设计原则是必须要贯穿数据中心信息生命周期管理的全过程 并 且以数据中心业务为核心 保障数据中心业务的全天候连续 高效 稳定的运行 实现数据中心信息系统的最大价值 项目设计原则 安全性 先进性 创新性 高可用性 可扩展性 可管理性 如上图 对于数据中心 建议建立管理的本地数据备份 同城数据实时备份 异地远程数据备份 城域 广域高可用全局应用容灾切换的长远规划 结合国家标准容灾 6 级标准 我们建议通过数据及业务系统分级梳理 分步实 施 逐渐建立这一整套完善的数据备份 恢复及容灾体系 第一步 灾难恢复需求分析 第二步 确定灾难恢复资源获取方式 第三步 深化数据备份系统 第四步 存储整合 第五步 服务器整合 第六步 实现远程实时数据保护 第七步 实现远程集群容灾切换 第八步 建立数据恢复消防机制 3 2 第一步 灾难恢复需求分析第一步 灾难恢复需求分析 这一步需要和顾问公司一起针对生产中心的不同应用进行相关分析和梳理 3 3 第二步 确定灾难恢复资源获取方式第二步 确定灾难恢复资源获取方式 这一步需要和顾问公司一起针对生产中心的不同应用进行相关分析和梳理 3 4 第三步 深化数据备份系统第三步 深化数据备份系统 3 4 1 常规备份与恢复常规备份与恢复 全面实现国标容灾规范中第一级本地数据备份 恢复方案 常规数据备份 恢复是数据保护最有效 最基本的手段 对于数据中心的所有计 算机服务器我们应该考虑通过现有的专业备份软件 建立本地统一的数据备份系统 实现集中数据的备份 这些数据包括不同服务器上的文件系统数据 如 word 文档 excel 表格 图表等 包括数据库数据文件 配置文件 日志文件 包括邮件信息 等等 定义好相关数据的备份策略和备份数据有效期 扩大本地数据备份的覆盖面 保护好核心数据的备份 关键业务的备份数据可以先存储在磁盘上 之后通过策略设置的生命周期管理 策略转存到磁带库中 建议最终存储到磁带库的磁带中 这样便于数据的离线保护 避免逻辑故障和恶性破坏 更有利于未来到异地场外容灾保护及恢复的前期基础实 现 在所有信息技术当中 数据保护流程和技术是最为成熟的 但是数据保护环境 的规模 重要性和复杂性日益增长 以及这方面的要求不断提高 已经逐渐发展成 为新的挑战 Backup Exec 平台通过对 Windows 平台服务器进行集中式端到端管理 提供了新一代数据保护 从而可以应对这些挑战 赛门铁克的集成解决方案 赛门铁克的集成解决方案 NetbackupNetbackup 平台平台 全新的 Netbackup 平台中体现了赛门铁克的新一代数据保护理念 该平台有助 于应对管理挑战 提供了以下优势 1 利用业界最为成熟可靠的 Lan Free 备份技术 通过存储区域网的光纤交换 式架构 进行对服务器数据的高速备份 2 运用先进的磁带管理技术 保证光纤存储区域网中磁带数据的高度安全性以 及完全自动化的介质调度管理 3 利用数据库在线备份技术 提供灵活的数据库备份策略供用户选择 4 提供完善的备份报告机制帮助用户进行复杂备份环境下的备份历史数据统计 管理 5 结合 BESR BMR 系统快速恢复工具 打造从系统到数据到应用的全面保护解 决方案 6 结合 Puredisk 重复数据删除技术减少备份过程中的冗余数据占据宝贵的磁 盘空间 7 通过对最新虚拟技术的支持 帮助客户管理好 Vmware 环境下的数据备份 3 4 2 操作系统数据备份操作系统数据备份 深化实现国标容灾规范中第一级本地数据备份 恢复方案 备份数据除了是应用级的文件和数据库数据 对于关键服务器 我们还应该考 虑备份服务器操作系统级的数据 包括操作系统 驱动程序 系统配置 应用程序 操作系统及相关应用系统 驱动程序的补丁程序 相关的 TCP IP 主机名 用户管 理信息 域信息等 在系统出现故障 修复硬件时 可以快速恢复操作系统级相关 系统信息和配置 避免单系统故障对数据的破坏 利用裸金属恢复技术手段能够实现对操作系统级数据恢复 在系统级故障时 不需有重新安装操作系统 通过恢复手段实现操作系统的安装和配置 包括操作系 统 驱动程序 应用程序 系统及应用补丁 系统及应用配置 15 60 分钟恢复 3 4 3 备份数据异地保存备份数据异地保存 升级实现国标容灾规范中第二级到第四级异地数据备份 恢复方案 对核心数据实现备份数据的异地保存机制 对于核心数据除了实现本地备份外 还要实现备份数据的异地保存 既备份数据在本地有副本 同时还要定期 定时拷 贝一份 送到异地数据中心实现保存 备份场地是灾难恢复所需的 支持灾难备份系统运行的建筑 设备和组织 包 括介质的场外存放场所 备用的机房及工作辅助设施 以及容许灾难恢复人员连续 停留的生活设施 通过备份软件的裸金属恢复模块 磁带异地容灾出库模块 对所有关键业务系 统的主机 做好完善的数据备份 特别是做好操作系统备份 文件系统备份 数据 库系统文件备份 数据库数据文件备份 相关的核心应用程序备份 建立好完善的 备份 恢复机制和远程磁带保管机制 这也是未来实现远程数据备份的基础 备份中心与生产中心的数据初始化同步 都是通过磁带备份恢复方式 实现一个同步起点 否则很难想象需要将本地和异地 的存储设备运往同一地点进行背靠背复制 或通过网络进行全同步的复杂程度和成 本上浪费 3 4 4 重复删除实现重复删除实现 13 地市州数据上传到省中心地市州数据上传到省中心 考虑到各地链接到省中心的 IP 专线 是业务和数据传输共用 因此 数据抽取 和上传一定需要考虑对于网络带宽的压力 Netbackup 内置的功能强大的重复数据 删除功能 Puredisk 可以完美解决数据上传对于网络带宽的占用 每次只传播唯一性 数据块 大大减少了数据在网络中的流量 增强版本的 NetBackup PureDisk 重复数据删除方案 用以满足目前企业对数 据中心备份架构的关键性需求 为满足备份窗口需求 企业正在努力寻找基于磁盘 的新型备份解决方案 并能够与其现有的备份基础架构进行集成 通过将 PureDisk 重复数据删除纳入整体备份策略 用户可大幅降低基于磁盘的备份所消耗的存储和 带宽 备份过程中 磁盘使用的不断增加使得备份数据可在线进行并随时可用 同时 也对当前数据保护环境的安全性 高可用性以及端对端报告提出了新的要求 扩展 新功能的 NetBackup PureDisk 通过集成 Veritas Backup Reporter 为企业客户和 备份服务供应商提供改进的存储可用性以及扩展的安全性来满足这些新需求 赛门铁克 NetBackup 产品管理部门高级总监 Matt Kixmoeller 表示 从远程 办公室到核心数据中心均可显著受益于 NetBackup PureDisk 重复数据删除所提供的 统一数据保护的方法 NetBackup PureDisk 集成了企业级安全 高可用性以及报告 能力 使得我们能够为用户提供领先的重复数据删除技术 这在日趋苛刻的数据 中心和服务供应商环境中显得更有价值 NetBackup PureDisk 集成 Veritas Backup Reporter 提供企业级管理性 随着基于磁盘的基础架构在备份环境中应用的日益增加 许多用户发现 他们 必须努力在数据中心提供包括磁盘 磁带和高级数据保护方法在内的操作及合规性 报告 NetBackup PureDisk 此次的功能扩展可使企业用户仅凭借单一应用 Veritas Backup Reporter 巩固 PureDisk NetBackup 以及其他主要备份应用的 备份活动报告 凭借集中化的备份报告以及基于所有备份类型的历史数据进行增长 规划的能力 用户可更好地管理 客制化其备份方法 其中包括磁带备份 快照以 及来自 PureDisk 的重复数据删除 开放灵活的高可用性基础架构增强数据可用性 随着基于磁盘备份环境的发展 基于磁盘备份方案的可扩展性和可用性变得极为重 要 赛门铁克 NetBackup PureDisk 将文件元数据和文件内容分别进行管理 从而满 足了可扩展性和性能需求 这一方法使用户更容易配置 部署 维护大量的重复数 据删除 数百 TB 作为 NetBackup 平台的一部分 PureDisk 为用户扩展其备份存 储 维持可用性 确保可靠的灾难恢复等方面提供了更大的灵活性 NetBackup PureDisk 目前支持新的磁盘及传统基于磁带的数据保护和可用性策略 即将面市的 NetBackup PureDisk 可为带有多个服务器的 PureDisk 环境提供在线备 援 在大型备份环境下 如果控制 PureDisk 存储的服务器停机 几分钟内即可将故 障转移到备援服务器上 PureDisk 服务器可在任何兼容硬件上配置使用 为 IT 企 业仅靠少量投资实现备份环境可用性的增加提供了灵活性 为企业和服务供应商提供扩展的安全特性 随着用户将重复数据删除部署于现有备份环境 并更多地进行在线数据传输 对于一致性访问控制及部署多个安全层的需求变得至关重要 除了支持 Active Directory LDAP 认证外 赛门铁克创新的数据锁 data lock 功能可使终端用 户进行数据加密 从而为企业和服务供应商提供了数据安全的新等级 这一特性使 终端用户的所有备份数据获得额外的密码保护 防止 PureDisk 系统管理员访问该数 据 该密码可控制数据访问 但不会干扰备份流程 使用数据锁的备份工作将按计 划进行 而备份管理员必须输入数据锁密码才可浏览或恢复数据 针对湖南 XX 的实际业务情况 对于省中心本地的数据 我们建议采用 SF HA 实施同步镜像保护 消除核心存储单点故障 而对于地市州数据 则在本地备份完 成后 通过 NBU 统一备份平台 借助 PD 的复制能够将 13 地市州数据上传到省中心 然后再选取一个地市州机房作为灾备点 将统一备份数据异地复制到该地市 如下 图所示 如上图所示 每个地市州如果有无法终端的核心业务 可以考虑选用 SF HA 实 现同步镜像保护 同时 每个地市州选用 NBU 实现本地备份 再借由 NBU 内置的 Puredisk 重复数据删除模块的复制功能将数据统一集中上传到省中心备份磁盘中 再选取一个地市作为灾备点 将备份数据复制到该灾备点 作异地保护 省中心的 核心业务选用 Symantec 的 Storage foundation HA 的同步镜像实现业务连续性保 护 3 4 5 备份数据异地恢复及验证备份数据异地恢复及验证 升级实现国标容灾规范中第二级到第四级异地数据备份 恢复方案 在一套完整的本地数据备份和异地数据保存的机制建立的基础上 可以考虑在 备份中心 3 5 第二步 实现远程实时数据保护第二步 实现远程实时数据保护 如果考虑部分核心数据 需要实现实时的数据备份 既 RPO 为 0 的高数据备份 要求 我们建议建立同城 短距离 数据备份中心 在同城数据备份中心 搭建硬 件平台包括相关的服务器和存储 但服务器和存储的级别 档次可以低于原数据中 心 3 5 1 远程镜像远程镜像 在同城数据备份中心与原数据中心之间搭建 SAN 网络 建立数据中心与数据备 份中心相关存储的镜像映射关系 实现数据中心核心数据与数据备份中心数据的实 时同步 在通过 SAN 的支持 DWDM 的拓展 光纤网络可以扩展到 100 公里或更远 镜像 可以在较远的两个数据中心的磁盘上建立 但由于镜像系统是以同步方式实现的 受到距离 光纤协议 和相关协议转换的影响 同步方式会影响本地服务器的性能 所以 一般建议在 80 公里的同城数据备份中心中使用 基于 SAN 的镜像 在数据实时备份实现中 使用范围较广 支持所有的类型数 据同步 包括文件数据 数据库数据 裸设备 应用配置文件 应用程序 库函数 等 可以实现一切数据的实时备份 3 5 2 Symantec 远程镜像数据容灾原理远程镜像数据容灾原理 Symantec 建议利用 VERITAS Storage Foundation 系列软件的镜像技术 来 构建容灾方案 利用 VERITAS Storage Foundation 的镜像技术构建容灾系统是非常 简单的 它只有一个条件 就是将生产中心和灾备中心之间的 SAN 存储区域网络通 过光纤连接起来 建立城域 SAN 存储网络 然后 我们就可以通过 Storage Foundation 提供的非常成熟的跨阵列磁盘镜像技术来实现同城容灾了 容灾方案的 结构如下图所示 从镜像原理上讲 在城域 SAN 存储网络上的两套磁盘系统之间的镜像 和在 一个机房内的 SAN 上的两个磁盘系统之间的镜像并没有任何区别 利用裸光纤将生产中心和灾备中心的 SAN 网络连接起来 构成城域 SAN 网络 以后 利用 VERITAS Storage Foundation 的先进的逻辑卷管理功能 我们就可以 非常方便的实现生产中心磁盘系统和灾备中心磁盘系统之间的镜像了 如下图所示 我们可以看到 利用 VERITAS Storage Foundation 我们可以创建任意一个 逻辑卷 Volume 供业务主机使用 实际上是由两个完全对等的 容量相同的磁盘 片构成的 两个磁盘片上的数据完全一样 业务主机对该 Volume 的任意修改 都将 同时被写到位于生产中心和灾备中心的两个磁盘系统上 采用这种方式 生产中心的磁盘阵列与同城容灾中心的磁盘阵列对于两地的 主机而言是完全同等的 利用城域 SAN 存储网络和 VERITAS Storage Foundation 镜 像功能 我们可以非常轻松的实现数据系统的异地容灾 并且消除了复制技术 无 论是同步还是异步 的切换的动作 从而保证零停机时间 零数据损失的实现 3 5 3 磁盘阵列同步复制磁盘阵列同步复制原理及局限性原理及局限性 在同城的容灾方案中 基于磁盘阵列的同步复制方案 也是较为流行的一种 其具体原理如下 以上的原理图清楚地指出了基于磁盘阵列的同步复制方案的原理 其原理适 用于所有类型的磁盘阵列间的同步复制原理 因此 我们可以看到 当生产中心的 阵列发生问题时 会产生如下一系列的问题 1 主机必须手工的将 I O 路径切换到容灾中心的阵列上 这将导致无法避 免的停机时间和用户的业务停顿 2 阵列的切换操作 是直接在磁盘阵列上进行的 在发生磁盘阵列问题 也就是在用户业务处于停顿状态的时候 找什么人来做这个操作 此操作磁盘阵列 厂商通常建议由厂商或是由资质的代理来做 或是用户自己来做此操作 都是对 操作人员是非常严峻的考验 无形中也就增加了用户的风险 3 当整个过程进行到第 4 或第 5 步时 生产中心磁盘阵列突然发生故障 主机将认为数据没有写入磁盘阵列 而实际上数据已经写入容灾中心磁盘阵列 一 旦启用容灾中心磁盘阵列 将导致数据不一致风险 4 如果用户选择的是在不同品牌的磁盘阵列之间实现镜像 基于磁盘阵列 的同步复制方案更是无能为力了 因此 无论从容灾效果 还是从易操作 易管理的角度 基于磁盘阵列的同 步复制方案 都不是同城容灾 基于 SAN 的最佳选择 不能在同一主机上正常工作的 因此无法真正意义上实现异构磁盘阵列间的 镜像 Symantec 远程镜像数据容灾系统故障和灾难的响应远程镜像数据容灾系统故障和灾难的响应 一个完整的灾备系统 除了在数据灾难发生时 能够完成灾备的使命 需要考 虑灾备系统本身的可维护性和可操作性 以及对系统尽可能快的恢复 下面 我们 来看一下 数据系统故障和灾难情况下 Symantec 的远程镜像容灾系统是怎样响应 的 3 5 4 当生产中心数据系统故障当生产中心数据系统故障 生产中心数据系统故障意味着灾难 磁盘故障 链路故障 或者数据系统的计 划内停机时间 也就一切导致主机无法访问生产中心数据系统的情况 我们来看一 下我们推荐的容灾方案是如何响应的 见下图 当生产中心的磁盘系统发生故障 灾难 时 由于同城容灾中心的磁盘是它 的镜像 所以操作系统会自动隔离生产中心的磁盘 转而对容灾中心的数据进行访 问 从上图我们看到 业务系统可以通过城域 SAN 网络直接访问灾备中心的磁盘系 统的数据 而不需要有任何针对业务系统的动作 也就是说 生产中心磁盘系统的 灾难 对业务系统是透明的 应用和数据库不会因为生产中心磁盘系统的故障而停 止 更重要的是 因为应用和数据库不会因为灾难而异常中止 从而避免了发生数 据库损坏 数据一致性风险 的可能 值得注意的是 整个过程对应用完全透明 不需要也不会中断业务系统的正 常运行 这是基于磁盘系统间复制技术构建的容灾系统无法实现的 3 5 5 灾备中心数据系统故障以及生产中心和灾备中心灾备中心数据系统故障以及生产中心和灾备中心 SAN 链链 路故障路故障 灾备中心数据系统故障 以及生产中心到灾备中心的链路故障 我们都可以 把其看成是容灾部分的故障 其原理和后果与生产中的数据系统故障相同 都是导 致了镜像的破坏 而后 系统将自动的只与状态健康的磁盘阵列继续工作 整个过 程对应用完全透明 3 5 6 故障修复后的恢复 远程镜像快速恢复 故障修复后的恢复 远程镜像快速恢复 磁盘系统故障修复之后 我们需要尽可能快的将远程镜像系统恢复起来 以确 保容灾的功能继续得以实现 同时 在整个镜像恢复的过程中 势必会对应用造成 影响 因为磁盘数据的同步 一定会造成 I O 的极度繁忙而导致应用性能下降 如 果镜像恢复无法快速完成 其后果跟系统应用停机也非常接近了 因此 如何快速 有效的实现镜像的重新同步 同样是一个容灾方案是否成功的关键因素 传统的镜像技术 如 OS 的镜像技术 在镜像链路被中断以后 中断的镜像 会被认为完全作废 在链路恢复以后 我们不得不将数据完整地从生产中心拷贝一 份到容灾中心 这种方式 对于用户的的应用是无法接受的 链路方面的故障如果 经常发生 我们就需要不断的重复将生产中心的数据全部同步到灾备中心的磁盘系 统上 实际上 这种方案不具有可实施性和可维护性 是不现实的 这也是什么主 机厂商虽然也有类似镜像功能 但不会用于容灾的的根本原因 为了解决这个问题 VERITAS Storage Foundation 提供了 DCO FMR 技术 其中 DCO Data Change Object 是一种针对镜像的 Log 技术 该技术允许 Storage Foundation 在镜像链路中断后记录逻辑卷的数据变化情况 以便在镜像链路恢复后 由 FMR 实现数据的增量恢复 所谓 FMR 其全称是 Fast Mirror Resync 意思就是 镜像的快速再同步 FMR 是和 DCO 技术对应的镜像快速恢复技术 利用 VERITAS Storage Foundation 的 DCO 和 FMR 技术 我们现在可以不用再担心容灾系统本身的 可维护性了 利用 DCO 和 FMR 我们的应对步骤如下 1 一切故障 导致镜像被破坏 2 生产中心的 Storage Foundation 利用 DCO 日志记录因业务数据的变化而变 化的数据块 3 一旦故障被修复 Storage Foundation 的 FMR 功能模块 会根据 DCO 日志 记录的情况 将链路中断后更新的业务数据 变化量 同步到灾难端实现 增量更新 4 镜像快速同步的过程中 用户的应用始终可以正常工作 整个过程的发起 只需要执行一条命令即刻完成 整个过程的速度 由于只是 同步增量 时间远远小于整个数据系统的完全同步 从而大大减小对用户应用的影 响 这也是传统镜像技术如 OS 镜像所以不具备的 系统容灾方案结构和实现系统容灾方案结构和实现 根据上面的阐述 我们提出了在 SAN 环境下 基于 Veritas Storage Foundation 远 程镜像的数据容灾方案 1 生产中心与容灾中心通过裸光纤将两边的 SAN 环境联接起来 2 容灾中心增加一台磁盘阵列 利用 Storage Foundation 的镜像技术 建立 基于磁盘系统间镜像的容灾系统 3 每个使用需要容灾的数据的主机 都需要部署一套 Storage Foundation 系 列软件 4 如果距离较远 无法直接部署光纤联接 可以租用运营商光纤将生产中心 和灾备中心的 SAN 网络连接起来 常用的技术有 DWDM 技术 5 根据实际容灾需求 如果希望实现应用级容灾 需要在灾备中心布置和生 产中心处理能力相当的用于灾备的服务器系统 利旧项目中 生产中心与容灾中心磁盘阵列性能差异问题 利旧项目中 生产中心与容灾中心磁盘阵列性能差异问题 生产中心与容灾中的阵列如果有较大的性能差异 在数据同步的技术范畴中 无论是采用软件镜像还是磁盘阵列的同步复制 一定会产生整体性能受到性能差的 磁盘阵列拖累得情况 基于磁盘阵列的复制技术 是无法对这种情况进行改善的 通常的方案就是让 用户退而求其次的进行异步复制 这不但增加了系统的复杂程度 数据一致性风险 还导致了如果灾难发生 一部分数据将会丢失 Storage Foundation 远程镜像中的 Reading Policy set 技术 可以实现将 读 写操作集中在性能高的卷 磁盘阵列上 低性能的阵列只负责些操作 在交易 型 读操作远远大于写操作 的数据库应用中 既能够保证生产中心和容灾中心磁 盘阵列上的数据同步 还能够大大提整体应用的性能 Symantec 远程镜像数据容灾方案的技术优势远程镜像数据容灾方案的技术优势 和其他容灾方案相比 VERITAS 容灾方案具有明显的优势 这些优势不仅仅 表现在技术实现方面 还表现在开放性 可维护性等各个方面 零停机时间和零数据损失零停机时间和零数据损失 由于 Storage Foundation 采用的是跨异构阵列的镜像技术 而镜像技实现 原理 就决定了在这种方式下 无论是哪一边的磁盘阵列由于物理故障停顿 都不 会影响数据的可用性而造成数据的损失 这从根本上实现了在物理故障的情况下 数据的高度可用性 故障修复后的快速重新同步故障修复后的快速重新同步 Storage Foundation 提供的镜像技术 是基于日志的镜像技术 无论由于主 机发生故障 还是由于镜像中的链路或是硬盘发生故障导致的镜像被破坏的情况 都可以通过镜像日至得以快速恢复 这使得镜像恢复过程对系统的性能影响微乎其 微 跨磁盘阵列快照 实现逻辑错误快速恢复跨磁盘阵列快照 实现逻辑错误快速恢复和容灾中心数据利用和容灾中心数据利用 Storage Foundation 提供基于卷 以及文件系统的多种快照技术 其逻 辑辑快照可采用少量磁盘空间 快速 多次的对文件系统 或者是卷作快照 因而 当用户出现数据的逻辑错误时 利用快照就可以迅速恢复文件系统或卷 这在数据 保护的体系 大大的弥补了传统备份恢复保护方式速度慢的缺陷 从而把数据损失 量降到最低限度 同时 数据快照还被广泛的利用在容灾中心数据利用方面 比如可以通过快照 实现数据备份 查询 测试等 数据同步过程高度可控数据同步过程高度可控 Storage Foundation Remoter Mirror 提供完整的容灾命令集 在数据同步的 过程中 可以随时得知同步的进度 并可随时暂停 继续数据同步 节约硬件采购成本节约硬件采购成本 Storage Foundation 支持对不同品牌 不同型号的异构阵列做镜像 这可以 帮助用户方便的选择适应自身业务需求的硬件 从而获得最好的价格性能比 同时 Storage Foundation 的 DMP 动态多路径 既能够管理异构阵列到主 机的多条光纤链路 也帮助用户节省了从阵列厂商处购买同类型软件 阵列到主机 的多路径管理软件 的成本 Symantec 远程镜像数据容灾方案的工程优势远程镜像数据容灾方案的工程优势 结构简单 基于镜像的容灾方案较任何一种容灾方案为简单 比如基于磁盘系统复制技术 的容灾方案 必须在磁盘系统内部专门配置相应的接口卡 使用该磁盘系统专有的 复制软件 才可以构建容灾系统 明显的 该方法增加了一个在非容灾系统中完全 不需要的环节 不仅增加了故障源 同时也增加了维护强度 事实上 基于主机的 复制技术存在同样的问题 在一个使用逻辑卷管理的应用系统中 我们只是利用了其中最常用 最成熟的 镜像功能 就可以实现容灾 而不必像其他容灾系统那样增加很多不必要的环节 技术成熟 镜像技术是比任何数据复制技术更早使用于高可用系统的成熟的功能 这种功能已 经广泛应用于包括 IBM Mainframe AS400 RS6000 HPUX Digital Unix SUN Solaris Linux Windows 等在内的所有服务器系统上 同时也被广泛用于磁盘系 统内部作为企业级解决方案 象 EMC HDS HP IBM SUN Compaq 等众多存储设备 生产厂商 都将镜像技术内置于其磁盘系统内部 用于对数据可用性要求最高的用 户群 存储开放性 利用 VERITAS Storage Foundation 的镜像技术 我们构建容灾方案的同时 还 构建起一个支持异构磁盘阵列存储虚拟化的平台 不再要求生产系统和灾备系统的 存储系统必须是同一个品牌的 对具体型号更没有任何要求 体现了存储平台选择 的开放性 由此 用户可以获得在存储平台选择上的主动权 避免被存储厂商 绑 架 的尴尬 技术的完整性 VERITAS Storage Foundation 拥有一个容灾方案必须的所有技术特性 它不仅 可以提供可靠的镜像技术 实现跨磁盘系统的数据容灾 同时 我们可以利用 Storage Foundation 的 DCO 和 FMR 技术 保证该容灾系统的可维

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论