




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、大中型企业基于存储虚拟化的数据容灾系统建设研究一、刖吕近些年随着大中型企业信息化建设的不断深入, 随之而来的是各种业务运作和管理的日渐繁多与复 杂,各种应用系统生成的数据呈爆炸式增长。应用系 统对业务连续性要求日益严格,各业务部门对信息中 心服务质量的期望不断提高。在此背景下,大中型企 业普遍加强了数据中心建设,以保障业务快速发展和 it系统安全高效运营。许多企业目前没有基本的数据 容灾部署,所有数据存储及备份设备都集中在数据中 心机房内,信息化系统抗拒灾难的能力为零,一旦数 据中心机房发生重大或灾难性事故,不但应用系统无 法继续运行,而且将丢失所有数据,这样的损失是企 业无法承受的。本文就是
2、在这样的背景下对大中型企 业数据容灾系统建设的方式方法进行分析和讨论。二、容灾技术简介容灾是指在同城或较远的异地,建立两套或多套 it运行系统,各系统之间可以进行健康状态监视和业 务切换,当生产系统因严重故障而无法正常工作时, 备用系统可以在另一场所接管其业务或恢复其数据。故障通常可分为系统级、场所级和灾难级三个层 次。其中,系统级主要对应主机系统或存储设备的故 障;场所级对应电力中断、机房火灾水灾、恐怖袭击 等场所故障;灾难级对应地震、战争等地域灾难。容灾系统可分为数据级容灾和应用级容灾1。所 谓数据级容灾是指在容灾中心仅部署存储设备和少量 数据测试服务器,在生产中心发射严重故障时,容灾 中
3、心仅负责恢复生产中心的数据。所谓应用容灾,是 在数据容灾的基础上建立一套完整的与生产中心相当 的备份应用系统,在生产系统发生重大事故或灾难的 情况下,容灾系统可迅速接管生产业务的运行。(一)容灾关键指标在灾难恢复方面,目前业界公认最关键的衡量指 标有两个:一个是rto (恢复时间目标),另一个是 rpo (恢复点目标)。所谓 rt02 (recovery time objective),是指灾难发生后,从it系统宕机导致业 务停顿之时开始,到it系统恢复至可以支持各部门 恢复运营之间的时间段称为rtoo所谓rpo(recovery point objective),是指灾难发生后,容灾 系统能
4、把数据恢复到灾难发生前时间点的数据,它是 衡量企业在灾难发生后会丢失多少生产数据的指标。(二)容灾实现方式目前,容灾系统主要有以下几种技术实现方式:1. 磁带备份异地保存方式;2. 基于应用的容灾方式;3. 基于数据库复制的方式;4. 基于镜像软件的方式;5. 基于智能存储的方式;6. 基于存储虚拟化的方式。在上面列举的几种常用的容灾技术中,磁带备份 方式是最简单,投资最小的方案,但是它在灾难发生 后,数据丢失率大,数据恢复时间长,因此,比较适 用于业务量较小,投入资金不多,且对业务中断时间 要求不高的企业。通过应用软件来实现容灾的方式需 要对现有业务系统软件做大量修改,实现起来比较困 难,并
5、且对业务系统性能的影响较大。基于数据库的 容灾方案实现起来比较容易,但对主机系统的资源消 耗比较大,而且只能保护数据库的数据,备份中心的 维护也较复杂。基于智能存储系统的容灾方式对应用 完全透明,能保证大量数据复制的性能,数据的一致 性程度高,设备利用率高,但要求存储设备必须同构。 基于虚拟存储的容灾是一种较新的技术,能较好地保 证数据的完整性和一致性,但这种方案需要增加专用 虚拟化设备,适合规模较大的数据中心。(三)基于存储虚拟化的容灾技术存储网络工业协会(snia)对存储虚拟化3的定 义为:“通过对存储(子)系统或存储服务的内部功能 进行抽象、隐藏或隔离,使存储或数据的管理与应用、 服务器
6、、网络资源的管理分离,从而实现应用和网络 的独立管理”。这是一个较宽泛的定义,目前,业内人 士普遍认为存储虚拟化是一种可以将多个存储磁盘系 统集成,并作为单一实体管理的硬件或软件产品,这 种管理通常可以在主机、存储网络、存储设备上实现。 例如,它可以将许多san磁盘阵列看作一个整体向外 分配磁盘而不必考虑磁盘驱动器的物理位置。存储虚拟化针对存储硬件资源,是对整个it基础架构进行虚拟化必不可少的一部分。存储虚拟化不但 可以实现整合存储资源、屏蔽异构存储环境复杂度、 提升存储可靠性和可用性等基本功能,还具有存储分 层管理、数据自动迁移、数据透明迁移、快照、同异 步数据镜像等高级存储管理功能。基于专
7、用虚拟化设备实现的存储虚拟化已逐步成 为市场主流,ibm、falconstor> emc、netapp 等厂 商都有较成熟的解决方案。利用专用存储虚拟化设备 的同异步数据镜像功能实现数据中心容灾具有以下优 势:1. 构造时不需更换原有的it基础架构,只需在 原本的存储区域网络中加入存储虚拟化设备;2消除了异构存储设备之间的差异,本地端的主 机和存储设备可以是任何品牌,灾备端的主机和存储 设备也不需和本地端相同,有利于企业实现设备利旧, 减少投资;3. 操作控制在主机与存储之间的虚拟层实现,数 据的复制过程不占用主机资源,对主机性能影响十分 低;4. 在虚拟存储上实施多点快照等增值功能,能
8、使 得各种数据的人为破坏得到瞬间恢复的能力(防止因 为操作员操作失误、黑客入侵、病毒泛滥等逻辑故障 造成的数据丢失。5. 对于异地传输的带宽占用,虚拟化容灾方式具 有各类调优方式,使得这种方式能够最大限度适应企 业现有的网络环境。三、容灾系统模型设计容灾系统建设与企业的业务要求、应用现状密切 相关,涉及众多技术和产品以及繁多的供应商,属于 建设复杂、风险较高的项目。为降低项目风险,选择 有经验的合作伙伴并且有成熟实用的方法论指导对容 灾项目建设的成功非常重要。在考虑建设容灾系统时,需要结合企业实际情况 选择合理的技术,首先,要明确容灾系统可能会遇到 的故障类型及严重性,明确建设目标,对于不同级
9、别 的故障,所采取的保护的方案也不尽相同。其次,要 考虑故障发生后正在运行的业务所受的影响程度。最 后,要考虑数据保护程度,也就是生产中心和灾备中 心之间数据的连续性和一致性,它决定了容灾方案的 规模和复杂程度。(一)设计原则在选择容灾技术时,应考虑一下基本原则:技术 成熟,功能丰富,对现有设备兼容性好,在同行业中 有成功案例。无需对应用系统进行改动,风险小,实 施周期短。符合企业现实情况,在投资适度的前提下, 故障恢复时间及数据损失尽可能小。集中统一管理, 降低系统管理复杂度。(二)容灾系统模型利用存储虚拟化技术实现容灾可以有多种模型, 它们实现的rto、rpo指标不同,投资也不同,不同 企
10、业可以根据自身实际情况进行选择,甚至同一企业 也可以根据不同业务系统的不同需求进行差异部署。 下面以 ibm san volume controller (svc)为例列举 了几种容灾部署模型并进行简要说明。1.本地数据容灾如图1所示,生产中心与灾备中心在同一园区或 城市,由于距离较近,可以直接连通两中心的san网 络。在灾备中心部署容灾阵列及少量数据测试服务器。 利用svc磁盘image模式,对关键业务数据在生产中 心和灾备中心实现同步镜像保存,当生产中心发生阵 列故障时,灾备中心的阵列可以迅速接管生产阵列的 工作,维持正常的业务运行。当生产中心发生场所级 严重故障时,灾备中心的镜像数据也可
11、用于将来的数 据恢复。此外,还可以利用多点快照功能对业务持续 性保护,尽可能减少由于逻辑错误造成的数据丢失。 在容灾中心还可以部署备份系统,用于历史数据的长 期保存及恢复。这种容灾模型的特点是投资较小、自动化程度较 高、rpo小、实施难度较低,缺点是在场所级故障时 rto长,也无法应对灾难级故障,无法实现应用级容 灾。适合容灾投资较小及业务持续性要求较低的企业。 实施成功的关键是两机房间的链路带宽及可靠性要有 保障,容灾阵列的性能要与生产阵列相当。如图2所示,生产中心与灾备中心在距离较远的 不同城市,由于距离较远,可以采用fcip协议转换 设备通过ip网络来连接两中心的sano在灾备中心 部署
12、虚拟化设备、容灾阵列及少量数据测试服务器。 与本地数据容灾不同的是,生产阵列与容灾阵列之间 的数据复制是通过svc的global mirror异步复制功 能实现,因此,必须在容灾中心安装虚拟化设备。当 生产中心发生场所级或灾难级严重故障时,灾备中心 的镜像数据可用于将来的数据恢复。这种容灾模型实施的关键条件是两机房间的链路 带宽及可靠性要有保障,实施的关键技术是数据远距 离异步复制以及数据的一致性保障。这种容灾模型下, 容灾阵列的品牌、型号可以不同与生产阵列,性能可 以低于生产阵列,投资主要集中在通信线路及设备、 虚拟化设备,可以应对灾难级故障,rpo取决于两中 心之间的线路带宽,实施难度适中
13、,rto长,无法实 现应用级容灾。适合数据容灾要求高及业务持续性要 求较低的企业。2. 两地三中心容灾两地三中心即“生产中心+同城灾备中心+异地灾 备中心”的整体应用级容灾解决方案,可以满足不同 故障情况下的业务连续性要求。同城灾备中心主要是 用于防范系统级、场所级的故障,异地灾备中心用于 防范大规模灾难级故障。与同城及异地数据容灾相比, 应用级的“两地三中心”可实现生产与灾备中心之间 应用的切换。同城中心可实现数据的同步复制及应用 的快速切换,异地灾备中心由于与生产中心距离较远, 相互连接的网络线路带宽和质量存在一定的限制,适 合于数据的异步复制,应用的切换也需要相对较长的 时间,因此异地灾
14、备中心可以实现一定时间范围内的 应用切换和可容忍丢失范围内的数据恢复。在容灾领域,“两地三中心”的建设模式已被市场 认可,并在金融、证券等业务系统在地理上分布广泛 的行业中逐渐普及,目前,在实现应用级容灾的基础 上,“两地三中心”模式正在从技术上向“分布式多活” 发展。图3是以ibm svc虚拟化技术为基础的一个“两地三中心”容灾部署示意图:生产中心与同城灾备中心之间的数据复制通过ibm metro mirror同步复制技术实现,同城灾备中心 到异地灾备中心的数据复制通过global mirror异步复 制技术实现,当同城灾备中心发生故障时,生产中心 将通过global mirror向异地灾备中心复制数据。三个 中心间的应用系统切换通过ibm powerha/xd集群 软件实现。实施过程中除了要保证数据复制的可靠性,还要 解决多种系统平台上应用切换的问题,属于投资巨大、 技术复杂、实施难度大的项目,此外,后期的运维管 理也是长期艰巨的任务。因此,“两地三中心”的容灾 模型建设仅适合那些资金充裕、业务部门在地理上分 布广泛、容灾rto要求高的企业。四、结语灾难的发生是“小概率、高风险”事件,随着企 业信息化
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新高考理综试题及答案
- 幼儿园数学考试创造性思维试题及答案
- 材料科学背景下的大学物理考试试题及答案
- 建筑施工安全考试练习题目分析
- 教师教育实施反思与改进试题及答案
- 食品与饮料行业食品安全监管信息化建设报告
- 智能网联与新能源的协同发展路径研究试题及答案
- 茂名邮政笔试试题及答案
- 电大形考试试题及答案
- 江西幼师笔试题目及答案
- 《装备质量问题归零实施指南》
- 人卫版肺部疾病教学课件
- 面肌痉挛的健康宣教
- 超滤反渗透调试方案
- 外籍人员个人所得税讲义课件
- LED制程与工艺介绍
- 《马克思主义中国化思想通史》导读-南京林业大学中国大学mooc课后章节答案期末考试题库2023年
- 北京中考语文词语表
- 水资源利用智慧树知到答案章节测试2023年西安理工大学
- 水质对干豆腐品质的影响机制及调控技术
- LY/T 2676-2016半干旱地区灌木林平茬与复壮技术规范
评论
0/150
提交评论