江苏移动信息技术中心云备份平台实践.doc_第1页
江苏移动信息技术中心云备份平台实践.doc_第2页
江苏移动信息技术中心云备份平台实践.doc_第3页
江苏移动信息技术中心云备份平台实践.doc_第4页
江苏移动信息技术中心云备份平台实践.doc_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国移动江苏公司信息技术中心云备份 平台实践 作者姓名:张晶、王坚、王宏图、孙凯 作者单位:中国移动通信集团江苏有限公司 单位地址:南京市虎踞路 59 号 邮政编码:210029 摘摘 要要 随着运营商用户数的持续增长,业务的飞速发展,3g 业务的推广,企业数 据中心的规模越来越大,数据也越来越重要,需要备份的数据量在持续的增长。 与之对应的却是业务系统要求的越来越苛刻的恢复准确率。 业务支撑部门面对分散的数据中心,持续扩大的系统平台规模,7*24 小时 的服务时间要求,全面严谨的业务指标考核标准,业务数据“零”丢失的严谨要 求现状,紧张的维护人力资源配置状况,迫切需要提高现有备份系统的备份效 能,提高运维管理效率高、降低运维成本。并根据这些经验及公司未来的 ict 业务发展战略,也可以将这些成熟服务产品推向市场。 本文通过介绍中国移动江苏公司统一备份平台在备份虚拟化、备份服务差 异化、备份系统管理自动化、系统架构云备份模型优化的具体实践,能够很好 的解决中国移动江苏公司现网系统运行遇到的种种问题,为读者建立了一种全 新的备份系统架构设计思路。 关键字关键字:备份虚拟化, 云备份,独立备份 san 网络系统,系统设计 目 录 1、 引言-1 2、 系统建设背景-1 3、 系统技术实现方案-3 3.1 虚拟化-3 3.2 soa 备份服务 -4 3.3 自动化管理-7 4、 架构收益-8 5、 结束语-9 1 1 1、引言引言 如今的数据中心越来越复杂,不仅系统规模每年翻番,系统的复杂性及 面临的风险也与日俱增,另一面,业务部门对业务连续运行的要求却是不断提 高的,甚至越来越多的系统要求“零数据丢失”。拿中国移动江苏公司的核心业 务支撑系统来看,包括 boss 系统、经营分析系统、客服系统、企业信息化系 统等子系统,总计近 400 台服务器(tpcc 值超过 10000 万) ,近 100 台高、 中、低端存储设备,超过 1000tb 的重要业务数据,分布于南京和无锡的 5 个 数据中心。为了提高数据的安全性,作为数据保护的最后一道防线-备份的重要 性就不言而喻了。但是根据国际知名调研机构对世界五百强大企业的技术主管 的回访记录和巡检记录来看,大部分企业用户的平均备份成功率在 75%左右。 事实上,我们还注意到很多时候的备份成功率小于 50%,恢复率就更低。一方 面我们面临的实际情况是每天需要备份的数据量在增长,中国移动江苏公司业 务支撑系统每年需要备份数据的增长量在 50%75%之间,但备份系统的预算 的增长却远远小于这个速度。 传统的备份系统都是和项目一起采购,造成数据中心多个独立的备份系统, 备份的效率差和备份资源的浪费很严重,备份系统架构及其不合理,管理也极 其复杂。 相同的问题也给 it 行业的发展带来挑战。因此“虚拟化”、 “云备份”、 “标准化” 和“备份资源整合”等成为目前业界最为热门的技术话题,同样也代表着未来技 术发展的方向。近几年来,在业界也涌现出几家在这个领域运营不错的云备份 服务的厂商-如赛门铁克的 norton online backup, emc 的 mozy.作为 it 技术、it 系统大量应用的中国移动江苏公司该如何解决自己发展中遇到的问题, 如何整合行业先进经验、新技术、解决方案,如何规划 it 系统架构科学发展, 我们在上述领域做出了一些自己的实践。 2、系统建设背景 中国移动江苏公司拥有一套完整的企业备份产品,在架构设计上基于原来 的经验进行了创新,并结合一些云技术的设计理念,为业务支撑系统的数据保 2 驾护航。 虚拟化-以整个数据中心为视角的备份资源部署,而不是基于应用和设 备的备份资源管理; soa-建立跨越整个备份资源的统一兼容的面向业务需求的备份服务, 而不是绑定特定的应用或设备的备份软硬件设备; 自动化-以整个数据中心为视角的基于策略的图形化备份资源管理,实 现备份任务的灵活调度、实时监控和报告,而不仅仅是僵化的为备份而 备份 图图 1 1:中国移动江苏公司业务支撑系统备份云示意:中国移动江苏公司业务支撑系统备份云示意 3 3、系统技术实现方案 系统的技术设计及实现方案分为以下几个层次: 备份虚拟化技术引入及部署-建立一个可扩展的基础架构 soa-建立跨越整个备份资源的统一兼容的面向业务需求的备份服务 自动化管理-提高云备份基础架构管理效率降低复杂度 3.1 虚拟化 首先,在云备份架构中将备份 san 从生产 san 分离出来,这一变革, 使得原有的四个数据中心中,分散在各个应用系统中的备份设备通过备 份 san 虚拟化地呈现给整个数据中心,形成了一个集中的备份资源池。 同时备份的 san 可以根据业务的变化,备份任务的变化灵活的扩展和回 收,实现了备份资源的灵活调度和灵活的缩放,对生产 san 没有任何影 响。 在数据中心备份 san 的基础上,建立了跨数据中心的备份 san 连接, 使得所有数据中心都能物理共享第五个数据中心(浦口高新机房)的备 份设备,这样当任何一个数据中心的备份设备故障时,云备份架构将自 动启用第五数据中心的备份设备,保证核心生产系统备份作业,如数据 库归档日志备份能够持续进行。这里的关键是第五数据中心的备份设备 是共享的而不是其中一个数据中心专享的。 对于 ip 网络的资源虚拟化,则在云备份架构中建立了一个具有负载均衡 功能的介质服务器资源池,接入云备份架构的任何一个网络备份客户端 的备份任务可以自动计算并分配到一个负载最低的备份介质服务器。所 4 以对于通过网络备份的应用系统来说,备份系统是即插即用式的,备份 客户端软件从备份服务器自动下发,同时客户端不需要关心对应哪个介 质服务器,或具体使用哪里的备份设备。 多层次的备份架构,除了传统的磁带库设备,还采用了新型的磁盘备份 技术,如虚拟磁带库技术,数据重复删除技术,这些技术都作为基础架 构的形式提供,为接入云备份系统的不同性质数据提供不同类型的存储 方式。其中使用的数据重复删除技术是云备份体系中核心组成部分即备 份软件自带的功能,在对客服系统中大量的具有冗余性质的 vmware 虚 拟环境的备份有良好的效果。 建立面向地市分公司支撑系统的共享备份架构,对于分公司的备份需求, 统一提供备份资源池,提供用户透明的集中备份服务,用户不需要考虑 备份系统所在的地点和具体结构,同时通过重复数据删除技术,减少本 地写入的数据量,相应的减少网络数据流量。 3.2 soa 备份服务 一个共享的、可伸缩的备份架构是实现一个满足 sla 的备份服务投送平 台的基础。我们所定义的备份服务基于备份云上的各个关键要素数 据、网络、存储资源,分别细化、组合、封装,最后形成备份服务的 sla。对服务的使用者来说,云服务通过封装底层技术屏蔽了复杂的技 术组合,使得一个复杂的备份策略设置操作,变成简单的服务挑选。 我们首先通过区分应用系统数据重要性等级,分别定义金,银,铜三个 服务等级;数据重要性等级指标有三个,一为是否需要快速恢复,二为 5 是否需要长期保存,三为是否需要异地保存。之后我们将应用系统对应 到备份平台的 sla; 从服务等级的角度看,铜牌服务仅提供长期保存 (磁带备份) ,银牌服务则在满足长期保存基础上提供了异地保护(磁带 复制等),金牌服务除包括长期保存和异地保存外还提供了数据的快速恢 复(综合磁盘备份等多种技术) 。这样在备份平台上每个服务器都被赋予 了 sla 的属性,并将贯彻到其对应数据的整个备份生命周期。这其中用 到了 slp(storage lifecycle policy)技术,不同服务标准的备份作业会自 动寻找合适的存储资源,备份数据也可以根据设定的数据生命周期在存 储资源间进行流动。 图图 2 2:备份服务等级管理:备份服务等级管理 对备份系统服务水平的评价标准之一是是否满足集团对数据保护的要求, 其中关键的一点是能否为特定数据提供异地的备份数据冗余,比如跨机 6 房的数据复制。由于备份 san 架构的形成,使得南京各数据中心和无锡 数据中心的备份数据可以互相流动,流动的形式是多样的,可以是在线 多数据流复制,也可以是离线的 vault(保险柜)复制,相比传统的手工 出库和磁带运送方式先进很多。 共享的备份数据验证服务,大多数企业的集中备份环境都缺少可行的数 据恢复验证环节,但事实上数据的恢复是比备份更复杂的过程,即使系 统在初始备份后进行了成功的恢复测试,也不代表在实际生产中需要恢 复的时候一定能成功,实际情况中数据库软件的升级,备份软件的参数 调整,失败的备份作业,操作系统参数的调整都有可能造成恢复失败, 而恢复失败时现场定位错误原因需要的时间将直接影响业务系统恢复的 时间,所以常规例行的数据恢复验证能最大程度保证生产系统的快速恢 复。在我们的云备份架构中提供了共享的数据恢复平台,能够满足多个 核心系统的数据恢复验证需求。并专门立项建立了业务支撑系统数据备 份恢复测试环境,覆盖了支撑系统主机的所有相关机型和版本和存储的 主要型号。 数据安全性,不同的业务系统其数据的敏感程度不同,对备份数据安全 性的要求也不同,当所有系统的备份都归入云备份架构后如何保证数据 的安全性,如何保证敏感信息不泄露?事实上我们可以利用云备份架构 中的数据加密模块,启用数据加密的备份数据只能被数据源系统所恢复, 数据加密所需要的证书管理和认证都作为平台服务提供,对于高负载的 业务系统的加密备份可以由资源池中的介质服务器承担加密运算,减少 对业务系统的性能影响。 7 3.3 自动化管理 集中的报表平台,报表平台作为云备份架构的重要组成部分,可以为遵 从验证和业务规划提供高级备份报告。在云备份作为 soa 存储服务的情 况下,我们需要具有跟踪和分析备份服务水平遵从以及将操作作为一项 业务来进行管理的能力。备份管理平台为我们提供了所需的报告,以验 证各关键系统的数据库等数据受到确实的保护,以及 rto(恢复时间目 标)和 rpo (恢复点目标)要求可以得到满足。同时还可以深入了解 数据保护基础架构,这样就可以为备份操作进行有效的业务计划。例如, 可以按照业务系统、用户和部门分析增长趋势和资源需求。同时,可以 为备份服务使用部门或系统提供在线的报表展示,确保服务水平承诺。 报表平台还可以根据各部门或应用系统统计固定时间段内其备份所产生 的费用成本,这样的报表数据既可以做为部门成本核算的依据,也可以 做为系统扩容的参考。 图图 3 3:集中报表平台:集中报表平台 8 集中的管理平台,我们通过基于 web 的集中管理门户能够实现所有监控、 警报、报告和故障排除功能,并通过图形化的方式显示。管理员能够实 时收集信息,包括恢复的成功率、哪些系统由于备份故障而面临风险、 存储使用的趋势、关于特定警报与错误的详细信息。可提供整个基础设 施范畴的所有数据保护操作的视图。为了简化日常管理工作,还能够通 过统一备份界面,保护和管理数据资源。管理员能够主动诊断故障,识 别可能的问题,并采取正确的纠正措施。 4、架构收益 随着该系统架构投入使用,我们获得了诸多收益,很好的解决了目前系统 采购、建设、运行、维护、使用、应用支撑方面的诸多问题,具体的内容如下: (1) 成本 云架构的采用对备份系统成本的影响是革命性的。备份系统占总体架构 的投资比例显著下降了。原来备份系统占总体投资的 10,云架构使得 这个比例下降到不足 5,节约了 50以上的投资。 备份资源的增加来自云备份架构整体需求,资源复用率和整体利用率提 高,由此带来了成本的相对减少。 维护成本的减少来自两个方面,一个方面,低端磁带库主要面向中小型 业务系统的独立备份需求,由于机械故障率极高,带来的维护成本较高, 云备份使得这方面的维护成本消失。另一方面,由于备份标准不统一、 业务平台各自为阵,一个数据中心就有多个备份管理员,云备份把多个 备份平台整合成一个,一个专业备份管理员就够了。 (2) 构架“云”模型来提高备份服务能力 实现任意业务数据备份可以随时运行在任意“云节点”上, 实现了负载均衡 与随需调度 充分利用云架构的扩展能力,实现了比业务增长速度更高的扩展性。核 心业务系统的数据量在增长,备份/恢复窗口却在缩小。 针对业务系统的架构瓶颈和备份策略, 通过交叉备份方式来提升数据备 9 份和恢复的效率和成功率,成功实现了 it 部门承诺的 99.99的恢复成 功率。 备份系统处理余量由原来的 30%下降到 15%甚至更低 (3) 利用备份“解耦”提升备份系统可靠性 业务应用模块并不关心备份数据在哪里 一套完整备份策略可以灵活在任意的备份中心部署 (4) 利用备份共享提高备份资源利用率,提高备份调度运维效率 通过构建全局备份视图将需要管理的备份空间数量有效降低了 20%,将 预留的冗余备份空间容量有效降低了 25%。 更好的根据业务调整备份策略,充分利用网络的资源, 提高备份的处理 效率 通过细分业务、方式调整备份策略,实现业务服务水平和备份服务水平 的的精细化管理,既提高了整体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论