




免费预览已结束,剩余2页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
容灾的未来 面向灾备资源共享的容灾云技术容灾的未来 面向灾备资源共享的容灾云技术 The Future of Disaster Recovery Disaster Recovery Cloud that Orients DR Resource Sharing 徐亦达 XU Yida 余宏亮 YU Hongliang 清华大学高性能计算研究所 北京 100084 Lab of High Performance Computing Tsinghua University Beijing 100084 China 中图分类号 TN915 1 文献标志码 A 文章编号 1009 6868 2012 04 0000 00 摘要 信息系统的容灾技术已成为当今信息化社会健康 快速发展的重要基石 文章提出建设好 容灾中心所面临的关键挑战就是如何让容灾代价和容灾效率达到统一 而这需要利用灾备 资源共享的基本思路 文章指出容灾未来的发展趋势就是彻底打破原有数据保护模式 发 展面向灾备资源共享的容灾云技术体系 关键词 容灾 结构无关 容灾云 Abstract Disaster recovery DR technology has become more and more important in the information system of our society In this paper we suggest that the key challenge in building a DR center is balancing cost with efficiency and resource sharing A future trend of DR is to use structure irrelevance DR technology to form a hierarchy of DR cloud technologies Keywords disaster recovery structure irrelevance disaster recovery cloud 文章主要观点 容灾建设面临的核心挑战是如何让容灾代价和容灾效率达到统一 容灾云技术是未来容灾技术的重要形态 面向灾备资源共享的基本思想是容灾云技术的核心 随着各行各业信息化建设步伐的加快 人们也越来越依赖各式各样的信息系统提供的数据 和服务 这些数据和相应的服务非常重要 但因为它们本质上依赖的是架设在物理计算机 上层层的逻辑环境 所以也相当脆弱 不但要面临物理层面上的各种威胁 比如火灾 地 震 电力故障等 还要抵御来自逻辑层面的各种侵害 比如人为操作失误 软件出错 黑 客攻击等等 1 3 一旦因此而发生数据丢失或长时间服务中断 则会给信息系统的使用者带 来巨大的损失 2 3 据互联网数据中心 IDC 的统计数字表明 1990 2000 年 在发生过此 类灾难的美国公司中 有 55 当即倒闭 因数据无法恢复 剩下 29 公司也在两年之内倒 闭 最终生存下来的公司仅占 16 因此 容灾已经成为当今信息化社会不可缺少的基础 安全措施 另一方面 容灾市场的需求也在急剧扩张之中 由于容灾备份和恢复的最主要对象是存储 的数据 全球数据存储量从 2008 年的 366 万兆亿字节逐年增长到 2011 年的 855 万兆亿字 节 如保持这样的增长速度 数据量则每 5 年就会扩大 10 倍 这对数据的容灾提出了更高 的要求 从市场情况来看 全球容灾市场早在 2008 年就已经达到 39 亿美元的规模 而根 据互联网数据中心 IDC 的市场预测 2012 2013 年 中国在容灾市场的总投入也将超过 100 亿元 中国政府近年来十分重视信息系统的容灾问题 中共中央和国务院有关部门分别在 2003 年 8 月 2004 年 9 月 2005 年 4 月连续下发了 国家信息化领导小组关于加强信息安全保 障工作的意见 关于做好重要信息系统灾难备份工作的通知 重要信息系统灾难 恢复指南 体现了政府对容灾问题的重视和要求 2007 年 7 月国家又正式出台灾备行业 国家标准 信息系统灾难恢复规范 GB T20988 2007 规定了信息系统灾难恢复应遵循 的基本要求 4 信息系统的容灾对于各行各业的重要性 容灾市场需求的扩大 以及政府高度重视和强有 力的支持 所有已充分表明 信息系统容灾的发展现状 面临的挑战以及发展趋势已成为 十分重要的问题 1 1 容灾的发展现状容灾的发展现状 1 11 1 容灾的基本概念容灾的基本概念 信息系统的容灾 DR 是在某种自然或人为灾难所导致的信息系统损坏后 为了重新获得对 数据 通信 作业空间以及其他业务流程的正常访问 以便重启和恢复关键业务的正常运 行 需要完成的一系列步骤 过程和策略 根据不同的应用需求 人们已经开发出各式各样的容灾机制 针对这些不同的方法 我们 一般用恢复点目标 RPO 和恢复时间目标 RTO 这两个基本指标来衡量容灾机制的特性 RPO 关注的是如何增加生产系统的备份点密度 RTO 则关注缩减生产系统的灾后恢复时间 偏 重 RPO 的系统 生产系统备份间隔更短 可恢复的状态更多 可能丢失的数据更新更少 偏重 RTO 的系统 生产系统灾后重建的速度更快 更有利于保持业务连续性 根据不同的用途特点 容灾系统中使用不同的设备和系统 磁盘阵列是多个磁盘组成的存 储设备 随机读写性能较好 但单位存储成本较高 适合做主存储设备 磁带库由大量磁 带构成 单位存储成本低 适合做次级存储设备 高可用性集群是一组配置相似的服务器 它们的状态紧密同步 如果集群中的某些服务器出现故障时 整个集群就可以及时调整应 对 对外服务则不会中断 远程备份站点通常在地理位置上远离生产系统 与生产系统通 过网络连接 可抵御地域性灾难 1 1 2 2 容灾的多种表现形式容灾的多种表现形式 容灾的整个过程分为灾前备份和灾后恢复两部分 并且这两部分都有着多样的表现形式 灾前为应对不同的故障 不同的应用环境 有不同的容灾备份方式 冗余磁盘阵列 RAID 用于应对磁盘阵列中少数磁盘或数据块失效的故障 磁带库单位成本低 适合顺序读写数 据 因此特别适合备份连续存放的大量数据 高可用性集群成本高 可用性也高 适合在 对服务连续性要求很高的环境下应对服务器失效的故障 远程备份站点的备份介质可以是 磁盘阵列 也可以是磁带库 适合防止地域性灾难对信息系统的破坏 灾后对故障的基本处理策略主要有故障转移与故障恢复两种类型 故障转移可以提前准备 冗余的计算资源 当灾难来临之时将系统切换到冗余计算环境中去 其优点是 在 RTO 方 面可以很快地恢复服务 其缺点是 在 RPO 方面它并不具备选择可恢复状态的能力 另外 系统成本也较高 故障恢复则是提前生成和存放多个备份点 灾难来临之后按情况恢复到 任一备份点状态 其优点是 在 RPO 方面可灵活选择多个备份点 其缺点是 在 RTO 方面 通常没有优势 在通常情况下 故障恢复方式需要串行执行从备份中心恢复数据 寻找和 重建一致性数据卷 配置和重启应用服务等 3 个步骤 其中前两个步骤是十分耗时的 但 前两步不完成第三步则无法实现 根据不同的灾前备份模式和灾难的种类 针对灾后故障恢复 生产系统也可以有多种方式 恢复 如果生产系统的本地备份并未受到影响 则可从本地备份介质备份 比如磁带库或 备份磁盘阵列 否则可考虑从远程备份站点恢复 恢复源同样也可以是远程站点中的磁带 库或备份磁盘阵列 1 1 3 3 主流容灾关键技术与容灾方案主流容灾关键技术与容灾方案 主流容灾关键技术包括 远程镜像技术 连续数据保护技术 1 远程镜像技术是在异地 远程备份站点 保存一份与本地相同的数据拷贝 以保证生 产系统在遭受地域相关灾难后的可用性 远程镜像的实现位置可位于文件系统 磁盘卷管 理器 磁盘驱动 主机适配卡 磁盘控制器等任意一层 但它通常位于卷管理器和磁盘控 制器 由于网络延迟 数据的同步和生产系统写性能是远程镜像技术需要仔细进行权衡的 因此该技术分为同步镜像和异步镜像两类 前者偏重数据的同步 后者则牺牲部分一致性 和实时性换取生产系统写性能的提升 以及对网络带宽要求的降低 远程镜像技术偏重 RTO 指标 因为数据镜像使得数据恢复几乎不需要时间 因此灾后系统服务的恢复速度极 快 磁盘控制器极的同步镜像的解决方案主要有 IBM 公司的点对点远程复制技术 PPRC EMC 公司的对称远程数据设备 SRDF 同步模式以及 Hitachi Data System 公司的 Remote Copy 磁盘控制器极的异步镜像的解决方案主要有 IBM 公司的 PPRC 扩展模式 PPRC XD 扩展远程复制 XRC EMC 公司的 SRDF 异步模式以及 Hitachi Data System 公司的 NanoCopy Veritas 公司的 Volume Replicator 基于磁盘存储卷实现的远程镜像解决方案 NetApp 公司的 SnapMirror 主机文件系统级的远程镜像解决方案 2 连续数据保护技术的原理是记录生产系统磁盘的每一次数据更新 从而能够在灾后恢 复到磁盘的任一状态 理论上 应用该技术不会丢掉任何数据 因为备份的间隔区间被缩 小到最小 RPO 指标达到最优 然而使用它仍然需要注意的是 靠它恢复出来的磁盘状态 并不一定是和数据一致的 事实上 恢复时寻找一致性状态是应用连续数据保护技术的一 大关键技术问题 如这一流程不加优化 则会造成恢复时间较长 这会能极大地影响容灾 系统的 RTO 指标 典型应用连续数据保护技术的容灾方案有美国飞康公司的 CDP 产品 Revivio 公司的时间 寻址存储系统 TAS XOsoft 公司的 XOsoft Engine 等等 这些产品均需要在备份的时对 磁盘一致性状态进行截获 以便灾后恢复时方便地找到可恢复的一致性状态 2 2 容灾中心建设面临的挑战容灾中心建设面临的挑战 目前 容灾系统的建设正在如火如荼地进行 容灾的需求非常广大 因此集中构建容灾中 心可以提升资源利用率 方便各方面管理 并可以提供更为专业的容灾服务 从而实现效 率的最大化 但是在容灾中心建设方面我们仍然面临着很大的挑战 1 信息系统数量越来越多 信息系统数量的急剧增长 不仅导致容灾系统存储容量 计 算能力 传输带宽等资源要求的直接提升 更是体现出容灾系统对不同类型生产系统的较 强适应性 信息系统的应用模式千差万别 有以数据库应用为主的 高性能计算为主的 或以文件存取为主的等 另外 同样应用模式的信息系统也会有不同的容灾需求 如同为 数据库应用型信息系统 采用不同厂商的数据库可能会导致容灾方案的不兼容 除此以外 信息系统的规模 计算资源使用频率和方式也存在不同 这些因素都会对容灾方案的选择 产生影响 究其原因 还在于现有的容灾技术大多是根据某类特定应用而设计 很难保证 应用独立性 针对不同信息系统所采用的容灾技术也很难统一 这样就难以在容灾方案方 面进行共享 2 数据规模越来越大 数据规模增大后 首先对数据容量要求有所提升 另外 由于应 用间在容灾方面的不兼容 资源无法共享 针对各种信息系统建设多个容灾系统则导致整 体成本过高 3 恢复效率要求越来越高 随着互联网等新兴业务模式的涌现 业务连续性要求也越来 越高 用户希望尽快完成灾难恢复 而在以通用化为建设目标之一的容灾中心里 要对不 同的生产系统 不同的应用环境提升灾后恢复速度并不是一件容易的事 容灾效率和容灾代价是需要仔细权衡的因素 对不同的系统 根据其特点采用特殊的容灾 方案 会使容灾效率达到最优 但对大量不同的信息系统而言 总体成本过高 容灾代价 非常巨大 因此 我们应当寻找能够尽量共享容灾设施的容灾技术和解决方案 以资源共 享的思路解决容灾体系建设开销大 容灾设施共享难的问题 并降低容灾建设代价 同时 要在这一过程中保证容灾效率 达到容灾效率与容灾代价的统一 这便是容灾中心建设方 面面临的最核心的挑战 3 3 容灾的未来容灾的未来 3 13 1 当前容灾技术的问题当前容灾技术的问题 当前容灾技术存在一些主要问题 1 容灾设施共享困难 容灾方案的实施和硬件 软件 应用有关 并且一对一的容灾方 案 可兼容的范围都很窄 因此只有做到共享设施才能降低容灾成本 这需要不依赖于具 体设备和应用的新型容灾技术 2 容灾恢复时间长 对于海量数据而言 通过增量备份可以提高数据备份的效率 但容 灾恢复时间过长 出现系统性灾难后服务难以恢复 例如 一般的磁带备份如高速的磁带 系统恢复速度约 50 GB h 恢复 100T 数据需要约 2 000 个小时 而磁盘备份如高端虚拟阵 列 恢复速度可达 500 MB s 恢复 100T 数据需要 56 小时 针对该问题 可以依靠冗余数 据删除技术对数据压缩 减小数据量 但是这样会带来大量的数据处理开销 并且最终效 果也依赖于数据本身的具体特征 3 23 2 容灾技术的未来发展容灾技术的未来发展 从前文可知容灾技术未来要想得到更普遍的应用 必须解决其中灾备资源共享的问题 只 有灾备资源共享 才可以做到对大量信息系统提供高效率 易管理 界面友好的容灾服务 而只有提升兼容性 尽可能降低容灾系统的应用独立性 才能真正实现灾备资源共享的主 张 在此基础之上 面向灾备资源共享的容灾云技术成为未来容灾中心建设的核心技术 为实现构造容灾云的目标 容灾系统需要做到结构无关 而传统容灾方法却无法做到这一 点 这一问题的根源在于应用一致性问题无法解决 因为应用的种类过于丰富 难以在应 用层寻找到通用的办法 一个可能的解决办法是 完整备份整个系统 而非仅备份受保护 服务程序相关的数据 原有容灾方法在架构上无法实现统一的根源在于 备份进程与受保护的进程是兄弟关系 它们同属于同一个操作系统之下 这样的则无法提供一个通用的备份手段 一个可能的解 决办法是 使备份进程与受保护进程成为父子关系 以便有能力完整备份整个系统 原有方法首先恢复所有数据 再恢复服务运行 也就是说服务的运行与数据的恢复是串行 的 然而大量数据的恢复需要耗费大量时间 而且很多数据其实并不一定立即就在应用服 务中用得到 一个可能的解决办法是 整个生产系统数据恢复与服务的运行并行进行 并 且能做到某一个服务线程在进行细粒度数据恢复的时候 不影响其他线程的运行 这样可 以大大提高恢复效率 目前基于类似思路的系统包括 VEEAM 的容灾系统以及中国的 Birds 容灾备份恢复系统等 FTP 文件传输协议 WAN 广域网 图 1 Birds 容灾备份恢复系统结构图 如图 1 所示 Birds 容灾备份恢复系统将 Birds 容灾监听程序植入操作系统层之内 形成新 的 Birds 备份操作系统 在此之上 使用虚拟机技术可将各式各样不同类型的生产系统包裹 进虚拟机 在 Birds 备份操作系统之上运行 在其之外 与其同时运行的还有 Birds 备份和 恢复代理程序 Birds 采用全系统状态备份 不仅备份生产系统的内存状态 还可以备份其磁盘状态 形成 一致性备份点 恢复的时候也能直接通过一致性备份点直接恢复生产系统的运行状态 Birds 在架构上将备份程序独立于生产系统之外 成为生产系统应用程序进程的父进程 从 而能全面完整地备份整个操作系统 Birds 在灾后恢复生产系统的时候 将恢复生产系统的运行和恢复生产系统磁盘的数据同时 进行 以流水线方式将本来巨量的磁盘数据按生产系统运行的需要将数据优先恢复 从而 快速恢复生产系统的服务 大大缩短因灾难产生的应用服务中断时间 以 Birds 为代表的容灾云技术使用了虚拟化技术和位于块设备层的磁盘备份恢复技术 大大 提升对不同类型生产系统的兼容性 另外 在这一技术中 不仅仅是受保护系统的数据得 到了完全的保护 其进程空间与块设备数据空间一起也得到备份 数据一致性得到保障 并且 在恢复的时候以流水线方式完成了恢复过程 大大加速了灾后应用服务恢复的速度 4 4 结束语结束语 文章从容灾领域的发展现状谈起 描述了当今容灾方面的基本概念 表现形式 关键技术 和解决方案 通过了解现状 我们总结出容灾中心建设面临的 3 点挑战 信息系统增多 数据规模增大 恢复效率要求提升 并揭示其核心实质上是利用资源共享的基本思路寻求 容灾效率与容灾代价的统一 针对这些问题 我们提出容灾的未来发展趋势之一即广泛应 用与结构无关的容灾核心技术 并最终形成面向灾备资源共享的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年特岗教师招聘笔试小学英语全真模拟试卷及答案解析
- 2025年职业技能保险高管财险类-寿险类参考题库含答案解析
- 2025年职业技能中式面点师中式面点师(初级)-中式面点师(高级)参考题库含答案解析
- 布病培训知识资料课件
- 智能家居合同模板
- 2025年特种作业类危险化学品安全作业氯碱电解工艺作业-过氧化工艺作业参考题库含答案解析
- 软件合作开发协议书
- 2025年特种作业类危险化学品安全作业加氢工艺作业-加氢工艺作业参考题库含答案解析
- 专题10 生物的生殖、起源和进化(河北专用)5年(2021-2025)中考1年模拟《生物》真题分类汇编
- 那曲中考数学试卷
- 初中英语沪教牛津版单词表(共6册)
- 酒店客房验收工程项目检查表
- 加强教学常规管理提高教学质量
- 吉兰巴雷综合征病人的护理
- 《英语句子成分》课件
- 河北农业大学分子生物学题库(带答案)
- 2025四川建筑安全员-C证考试(专职安全员)题库及答案
- 产品包装设计与印刷流程手册
- 随机动态规划与强化学习-洞察分析
- 肾占位性变病
- 沐足行业严禁黄赌毒承诺书
评论
0/150
提交评论