毕业论文:通信容灾技术探讨_第1页
毕业论文:通信容灾技术探讨_第2页
毕业论文:通信容灾技术探讨_第3页
毕业论文:通信容灾技术探讨_第4页
毕业论文:通信容灾技术探讨_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1络论21. 1.概况21. 1. 1.容灾的定义21.1.2. 容灾的评价指标21. 1.3.容灾的分类31. 1.4.容灾的等级划分31.2. 技术篇41.2.1.数据备份技术51. 2. 2.数据复制技术61.2. 3.灾难检测技术71.2.4.系统迁移技术81.3. 展望篇81.3. 1.业务连续性81.3. 2.持续数据保护92. 1容灾分类92. 1. 1 hlr数据容灾92.1.2 ulr业务容灾技术152. 2. 业务容灾的原则和方式202. 2. 1业务容灾配置原则202.2.2业务容灾数据同步方式212. 3虚拟卷/硬件232.4容灾系统的容量232.5. hlr容灾的实施

2、建议243. 存储网络容灾备份253. 1.概况253.2技术篇263. 2. 1. 磁带备份263. 2. 2. 无需lan的备份273. 2. 3.服务器负担较轻的备份283. 2. 4.备份行业和产品概述283. 3.利用san进行备份的主要优势293. 3.1提高数据可用性293. 3. 2.降低 tc0293.4. 灵活的备份选项303. 4.1远程数据镜像/数据复制313.4. 2思科的灾难恢复产品和解决方案313.4.3.虚拟san (vsan)324. 结束语365. 参考文献371绪论随着信息时代的到来,数拯越来越突出地成为社会正常运作的核心。对于一 个企业来讲,数据更是影响

3、英生存和发展的关键,各行业的用户和企业对网络应 用和数据信息的依赖日益强烈,使得突发性灾难如火灾、洪水、地震或者恐怖事 件等对整个企业的数据和业务生产会造成重大影响。因此,如何保证在灾难发生 吋企业数据不丢失,保证系统服务尽快恢复运行,成为人们关注的话题,容灾技 术日益成为各个行业关注的焦点。本文从技术角度对容灾的概念、相关技术进行 介绍,并对其发展趋势进行探讨。1.1 概况1.1.1. 容灾的定义在给出容灾的概念之前,有必要先给出灾难的定义。从一个计算机系统的角 度讲,一切引起系统非正常停机的事件都可以称为灾难。大致可以分成以卜三个 类型:a.自然灾害:包括地震、火灾、洪水、雷电等,这种灾难

4、破坏性大,影响 面广;氏设备故障:包括主机的cpu、硬盘等损坏,电源屮断以及网络故障等, 这类灾难影响范围比较小,破坏性小;c.人为操作破坏,包括误操作、人为蓄意 破坏等等。容灾(disaster tolerance),就是在上述灾难发生时,在保证生产 系统的数据尽量少丢失的情况下,保持生存系统的业务不间断地运行。1.1.2. 容灾的评价指标现在工业界都以数据丢失量和系统恢复时间作为标准,对某个容灾系统进行 评价,公认的评价标准是rpo和rtoo rpo (recovery point objective):恢复点目标,以时间为单位,即在 灾难发生时,系统和数据必须恢复到的时间点要求。rpo标

5、志系统能够容忍的最 大数据丢失量。系统容忍丢失的数据量越小,rpo的值越小。 rto (recovery time objective):恢复时间口标,以时间为单位,即 在灾难发生后,信息系统或业务功能从停止到必须恢复的时间要求。rto标志系 统能够容忍的服务停止的最长时间。系统服务的紧迫性要求越高,rto的值越小。rpo针对的是数据丢失,rto针对的是服务丢失,两者没有必然的联系,并 且两者的确定必须在进行风险分析和业务影响分析之后根据业务的需求来确定。1.1.3. 容灾的分类由于容灾包含的内容比较广泛,对容灾的分类也可以从多个方面进行。总的 来讲,可以从容灾的范围和容灾的内容来区分。从容灾

6、的范围讲,容灾可以分为本地容灾、近距离容灾和远距离容灾。这三 种容灾能容忍的灾难是不相同的,采用的容灾技术也是不同的。从容灾的层次讲,容灾又可以分成数据容灾和应用容灾,木质上讲,这两种 容灾是密不可分的。数据容灾是应用容灾的基础,没有数据的一致性,就没有应 用的连续性,应用容灾也是无法保证的。数据容灾是指建立一个备用的数据系统, 该备用系统对生产系统的关键数据进行备份。应用容灾则是在数据容灾z上,建 立一套与生产系统相当的备份应用系统。在灾难发生后,将应用迅速切换到备用 系统,备份系统承担生产系统的业务运行。1.1.4. 容灾的等级划分由于容灾系统需要考虑众多的因素,口前,根据容灾系统屮数据的

7、丢失程度、 生产系统和备用系统的距离,以及灾难恢复计划的状态等因索,公认的容灾级别 划分如下:a. 木地容灾:即将系统数据或应用在木地备份,无异地后援。这一级别的容 灾,仅能应付本地的硕件损坏或人为i大i素造成的灾难。b. 异地数据冷备份:即将系统数据备份到物理介质(磁盘、磁带或光盘)上, 然后送到异地进行保存。这种方案成木低、易于实现。但是在灾难发生时,数据 的丢失量大,并且系统需耍很长的恢复时间,无法保持业务的连续性。c. 异地数据热备份:即在异地建立一个热备份屮心,采取同步或者异步方式, 通过网络将生产系统的数据备份到备份系统中。备份系统只备份数拯,不承担生 产系统的业务。当灾难发生时,

8、数据丢失量小,其至零丢失,但是,系统恢复速 度慢,无法保持业务的连续性。d. 异地应用级容灾:即在异地建立一个与生产系统相同的备用系统,备用系 统与生产系统共同工作,承担系统的业务。这种类似于raid1的容灾系统,能够 提供很小的数据丢失量,系统恢复速度是最快的。但是,需要配置复杂的系统管 理软件和专用的硬件,相对成本也是最高的。在上述的级别z上,又有人提出业务级别的容灾级别。对于止常的业务而言, 仅靠it系统的保障是不够的,业务级别的容灾包括众多非it系统的设施,比如 电话,办公环境等。1. 2.技术篇传统的容灾技术通常指针对生产系统的灾难采用的远程备份系统技术。但 是,随着对容灾系统要求的

9、不断提高,现在的容灾技术包括了可能引起生产系统 服务停止的所有防范和保护技术。一般来讲,-个容灾系统中实现数据容灾和应 用容灾采取不同的实现技术。数据容灾的技术包括数据备份技术、数据复制技术 和数据管理技术等,而应用容灾包括灾难检测技术、系统迁移技术和系统恢复技 术等等。木章节对数据容灾和关的数据备份技术和复制技术以及应用容灾和关的 灾难检测技术和系统迁移技术做初步的介绍和分析,其它的技术请参考相关技术 资料。1. 2.1.数据备份技术数据备份就是把数据从生产系统备份到备份系统中的介质中的过程。数据备 份技术最初是备份到本地磁带,随着网络发展,现在的备份技术有了 e速的发展。主机备份:这种备份

10、就是传统意义上的基于主机(host-based)的备份。主机负责将数 据备份到和主机直接相连的存储介质上(一般是磁带)。虽然这种备份的速度快, 管理简单,但是仅能适应丁单台服务器备份,并月.在灾难恢复过程屮,系统恢复 的时间长。网络备份:随着网络的发展,传统的主机备份渐渐地转向了网络备份,即系统中备份数 据的传输以网络为基础。根据备份系统屮备份服务器、介质服务器是否在同一个 lan中,可以将网络备份分为基于局域网的备份和远程网络备份。基于局域网的备份特点是应用服务器、备份服务器和介质服务器共用一个局 域网络,备份服务器统一管理备份的过程,多个应用服务器可以将各自的数据备 份到介质服务器上。这种

11、备份方式可以共享介质资源,实现集屮的备份管理。缺 点是对网络带宽和备份时间的压力比较大,并且不具备远程的容灾能力。当然通 过将介质(磁盘、磁带或光盘)运输到远程保存,可以具备一定的容灾能力。远程网络备份,则是介质服务器与应用服务器不屈于同一个局域网,备份服 务器依然统一管理备份的过程,备份数据则是通过wan、atm或者internet等公 共网络传送到远程的介质服务器上。这种备份方式基木上构成了一个异地的备份 容灾方案。由于备份数据在公共网络上传输,备份的速度、备份数据的完整性和 安全性等方面都需要考虑。专有存储网络备份:当存储系统成为一个独立于备份系统的系统z后,特别是存储局域网(san:

12、storage area storage)的发展,使得备份过程可以在存储局域网中实现,根据 备份过程屮对应用服务器的影响,专有存储网络备份可以分为lan-free备份和 server-free备份。lan-free备份,是在存储网络(storage network)之上建 立的一种备份系统。在该备份系统中,生产系统的存储和介质服务器的存储直接 通过专用存储网络进行连接,在备份过程中,庞大的备份数据不经过主机系统所 在的网络,而是通过专用的存储网络传输到介质上。这种备份方式的优点是共享 介质资源,实现集中管理,不会对主机系统网络有影响。缺点是实现比较复朵, 成木相对较高。server-free备

13、份,则是建立在存储区域网(san: storage area network) 的基础上,备份过程无需应用服务器参与数拯传输的备份系统。这种备份方式可 以保证生产系统及其网络不受影响。目前这种备份技术述不太成熟,对硬件的性 能和兼容性的要求都很高。专用存储网络备份更多关注的是存储系统的扩展性、口j用性以及性能等方面 的因素,可以讲存储局域网的发展将会在更人程度上提高系统的数据容灾能力。1. 2. 2.数据复制技术和数据备份相比,数据复制技术则是通过不断将牛产系统的数据复制到另外 一个不同的备份系统中,以保证在灾难发生时,生产系统的数据丢失量最少。按照备份系统屮数据是否与生产系统同步,数据复制可

14、以分成同步数据复制 和异步数据复制。同步数据复制就是将本地生产系统的数据以完全同步的方式复 制到备份系统中。由于发生在生产系统的每一次i/o操作都需耍等待远程复制完 成才能返冋,这种复制方式虽然可能做得数据的零丢失,但是对系统的性能有很 大的影响。异步数据复制则是将本地生产系统屮的数据在后台异步地复制到备份 系统中。这种复制方式会冇少量的数据丢失,但是对生产系统的性能影响较小。根据数据复制的层次,数据复制技术的实现可以分成以下四种:a. 存储系统数据复制:数据的复制过程通过本地的存储系统和远端的存储 系统z间的通信完成。这种方式的复制对应用来讲是透明的,可以直接实现数据 容灾功能,也可以提供很

15、高的性能,可是,对存储系统的耍求比较高。b. 交换层数据复制:这种方式的复制技术是伴随着存储局域网的出现引入 的,即在存储局域网的交换层上实现数拯复制。实现方式可以通过专有的复制服 务器实现,也可以通过存储局域网(san)交换机,将数据同步地复制到远端存 储系统中。c. 操作系统层数据复制:主要通过操作系统或者数据卷管理器來实现对数 据的远程复制。这种复制技术往往耍求本地系统和远端系统是同构的,并h由于 数据复制由主机系统完成,其效率和管理上也存在不少问题。d. 应用程序层数据复制:例如数据库的异地复制技术,通常采用日志复制 功能,依靠木地和远程主机间的口志归档与传递来实现两端的数据一致。这种

16、复 制技术对系统的依赖性小,冇很好的兼容性。缺点是本地应用程序向远端复制的 是日志文件,这需要远端应用程序重新执行和应用才能生产可用的备份数据。另 外,由于各个应用程序采取的复制技术不同,无法以一种技术实现多种应用的数 据复制。1. 2. 3.灾难检测技术对于一个容灾系统来讲,在灾难发生时,尽早地发现生产系统端的灾难,尽 快地恢复生产系统的正常运行或者尽快地将业务迁移到备用系统上,都可以将灾 难造成的损失降低到最低。除了依靠人力来对灾难进行确定之外,对于系统意外 停机等灾难还需要容灾系统能够口动地检测灾难的发牛,目前容灾系统的检测技 术一般采用心跳技术。心跳技术,英屮一个实现是:生产系统在空闲

17、时每隔一段时间向外广播一下 门身的状态。检测系统在收到这些“心跳信号” z后,便认为生产系统是止常的, 否则,在给定的一段时间内没有收到“心跳信号”,检测系统便认为生产系统出 现了非正常的灾难。心跳技术的另外一个实现是:每隔一段时间,检测系统就对 生产系统进行一次检测,如果在给定的时间内,被检测的系统没有响应,则认为 被检测的系统出现了非正常的灾难。心跳技术中的关键点是心跳检测的时间和时 间间隔周期。如果间隔周期短,会对系统带來很大的开销。如果间隔周期长,则 无法及时地发现故障。1.2. 4系统迁移技术灾难发生后,为了保持生产系统的业务连续性,需要实现系统的透明性迁移, 利用备用系统透明地代替

18、生产系统进行运作。一般对实时性耍求不高的容灾系 统,例如web服务、邮件服务器等,可以通过修改dns或者ip来实现,对实时 性要求高的容灾系统,则需要将生产系统的应用透明地迁移到备用系统上。口前 基于本地机群的进程迁移的算法可以应用在远程容灾系统中,但是需要对迁移算 法进行改进,使之适应复杂的网络环境。1.3.展望篇1.3. 1 业务连续性业务连续性,顾名思义,就是保证服务和业务的顺畅运行,它不仅仅指系统 的不间断运行,更是保证业务的不间断运行。业务连续性是在容灾z上的业务级 容灾系统,其实施过程不仅仅是个技术问题,它更多的是关注业务本身的连续性 要求。即从理解业务木身开始,进行业务的冲击分析

19、和风险佔计,在此基础上, 由企业的高层管理人员指定本企业的业务持续战略计划,然后规划业务持续计 划,进行测试和实施。由于业务连续性计划的讨论超出本文讨论范围,感兴趣的 读者可以参考相关资料。1. 3. 2.持续数据保护另一个值得注意的技术是持续数据保护(cdp)。这个技术首先在一些小公 司中提出来的,主要面对中小企业甚至是普通pc用户,但是随着企业和用户对 cdp的认同,cdp已经吸引ibm、微软,赛门铁克和emc等各大公司注意,这几 家大公司已经宣布或表示已经制订了未来的cdp产品计划。持续数据保护(cdp)的应用范围,目前可以分成三类:a. 为数据中心内的文件服务器/nas提供普通的数据保

20、护。在这种应用中, cdp逐渐取代了以前那种夜间的磁盘或磁帶备份任务。b. 为远程的分支机构进行集屮化的备份。将cdp用于远程分支机构备份应用 的最大好处就是从此避免远距离转移磁带介质的风险。c. 解决笔记本电脑上的数据备份问题。例如ibm tivoli cdp产品,可以对 笔记本电脑进行很好的数据保护,即使笔记本电脑没有连接网络。随着各个国家和人型企业对容灾越來越重视,容灾技术获得飞速发展,容灾 技术涉及的范围也越来越广泛,并且新技术也层出不穷,木文仅仅对当前容灾的 主要技术做了介绍和总结,希望能对同行自所帮助。2. 容灾技术应用2.1容灾分类2.1.1 hlr数据容灾数据容灾的方案实际为数

21、据异地(异系统)备份的方案,即新建一个(或多 个)hlr容灾备份中心,每个hlr容灾备份中心存储了所有(或部分)主用hlr 的用户数据。在止常的运行过程中,对用户的任何静态数据的更改都将通过营账 系统同步到hlr容灾备份中心,以保证数据的一致性。当发现有主用hlr发生故 障时,通过人工对备用hlr加载故障hlr的用户数据,然后修改msc、gmsc、hstp、 lstp等相关设备的配置,使对原主用iilr的信令流程重路由到容灾备份iilr。由 于容灾备份hlr设备已经加载了和故障hlr同步的用户静态数据,因此可以顺利 接管故障hlr的一般功能。当故障hlr修复后,首先恢复该主用hlr的用户数据,

22、 然后把相关的信令流程重新定位冋到该主用hlr,便实现了故障恢复。单纯的hlr设备数据容灾对主备用hlr设备的功能均无特别耍求,一般仅备 份静态数据,倒换和倒冋都需要人工操作完成,是非实时的,考虑到备用iilr加 载数据和启动的时间,一般倒换时间较长(在数十分钟级)。而在倒换效果上,数据容灾可以很好地保证用户主叫业务不受影响,但是, 由于无法做到hlr设备的动态数据的同步,备份hlr屮只冇用户的静态数据,缺 乏如vlr位置信息,前转号码、漫游限制等补充业务的动态数据,因此,需要对 全网下发map_hlr_reset消息,在用户位置信息更新询,故障hlr设备内用户做 被叫无法正常接续。至于用户的

23、呼叫前转、呼叫限制等补充业务则由于动态数据 丢失,而无法使用,需要用户再次设置方可,因此,备份效果较差。一般的,单纯的hlr设备数据容灾,对除营账系统外的周边网元的功能没有 特别耍求。但是,由于各厂家hlr设备内部数据格式各不相同,数据结构差异很 大,而各厂家iilr设备对营账接口的指令格式和指令语言也大不相同,因此,如 果要实现异厂家hlr数据的容灾,就需要营账系统具备以下功能。a)如果主备用hlr设备厂家对营账系统的接口指令不能使用统一的标准操 作指令,则需要主用hlr厂家接口指令对备用hlr厂家接口指令翻译功能。b)营账系统对主用iilr设备操作指令成功写入后,能门动将操作指令存储 为文

24、件存放在指定存储位置,以供备份hlr倒换时加载使用。c)在主用hlr故障期间,营账系统对备用hlr设备操作指令成功写入后, 需要能自动将操作指令存储为文件存放在指定存储位置,以备主用hlr恢复时加 载。数据远程备份技术的具体实现方式可分为4种:(1) 基于硬件存储设备的备份方式存储设备之间通过高速光纤通道相连,完成异地复制功能,如emc公司的 clariion cx 系列磁阵1。(2) 基于虚拟卷(存储)的软件备份方式由软件来接替unix文件系统的虚拟卷(存储)的硬件i/o操作,将写入虚拟 卷的数据通过数据链路传输到备份节点并形成远程的文件镜像,以实现主节点到 备份节点数据的备份,如ibm公司

25、的hageo软件2。(3) 基于数据库备份的方式通过数据库复制工具将主节点的数据复制到备份节点上,如oracle公司的 data guard 系统3。(4) 基于私有软件的备份方式通过内部协议将数据从一个节点备份到另一个节点以实现远程备份。4种备份方式的特点如图1所示。4种远程备份方式技术比较如表1所示。主用系抚耳于私肓毅悴的曲粉方式耳于奴据库的曲份方式戛于虔拟卷的朝徉甘盼方式戛于疗储ii件的曲份方式1 4#备冊方龙的借贞嶺14种数据远租备聊技水比较说暗耳于融ift留的方式屋于删應的方式耳于擁库的方式耳于血用致杵的方式白用処理开据 hr®®低应対白用処理冊1讪531<

26、1品<3复制顷主鬲如复制夷k住宕宕需ffifis侖宽蒿换与血阱租主对于上居翻 ss画刑于上居虑屈33翩对观瞰縊需育安裝期时的影前需中断业勇建迦本宕宕平台梅主垢吊颛目的箭巧潮目的市敕烦同罚韦点邂同罚工度高宕t9kji5 嚼»2咄色于.1»用户熒锯珈刑慰据库 记 ssfrats刑观醯弟影 wsdxhk平台踊一定幻束较低sgshk较低破孵s据只能jfiffltiat厂冢的述较低可 不前平台从复制实时性考虑,数据远程备份技术可以分为同步方式和杲步方式:(1) 同步方式。同步传输方式数据传输流程如图2所示,数据先写到远端, 等完成后再回到本地做写入动作。同步能保证两个地方的数据

27、在任何时刻都保持 精确的一致,但显然速度较慢,使得本地生产中心的应用执行效率低,因为它总 是要等待两端的数据都写好以后才能继续下一 步操(2) 异步方式。异步传输方式数据传输流程如图3所示,资料先写到远端, 但不等完成即在本地做写入动作,在本地写完后,给上层应用返回成功响应,速 度快。i最据写入占通知生产方救据已焼写入槪盘30.数据写入丄f本地2.记录数据唸改标记jd 7.数据奇改标迟数据5較据写入戦盘窃忖地点:苏州生产地点;上逼因3算步传输方式示西从数据远程备份技术的体系结构上分可以分为1+1容灾方式和n +1容灾方 式:(1)1+1容灾方式两个生产节点互为主备方式,即i1lr1作为生产节点

28、同时还承担iilr2数据备 份的任务。当hlr2发生故障时,hlr1接管hlr2的业务,反之亦然。(2)n +1容灾方式备份集中在一个备份中心,集中管理,对应多个生产中心。任何一个生产屮 心故障,业务都会被切换到备份屮心。从生产地点和备份地点的数据库逻辑实现上分可以分为同构数据库容灾和 界构数据库容灾方式:(1) 同构数据库容灾方式同构数据库容灾是指生产地点的数据库和备份地点的数据库采用相同的数 据模型。(2) 异构数据库容灾方式界构数据库容灾是指生产地点的数据库和备份地点的数据库采用不同的数 据模型。hlr容灾系统的实现原理如图4所示。利用多信令点技术,备份地点hlr 配置自己以及生产地点h

29、lr的信令点,移动交换中心(msc)对每个生产地点的hlr 和信令连接控制部分(sccp)做备选路由到备份地点i1lr,当生产地点iilr发生故 障导致业务不能继续进行时,通过7号信令链路和数据库切换可以将生产地点 hlr的全部业务倒换到备份地点hlr,用于实现hlr业务的恢复。两个hlr的数 据部件之间由光纤通道或atm连接,可采用基于逻辑卷或者基于硬件等远程同步 技术实现用户数据的同步备份。mscim5c.0同歩 通道奴同通生产hirhir :归厨位霄疗器m5c-槪和交:恆中卷hlr业务接管处理过程如下:(1) 确定生产地点hlr发生短期内无法恢复的严重故障(以下称其为故障 hlr),需要

30、切换到备份地点hlro(2) 手工操作数据库同步软件,将该iilr数据库切换到备份地点iilr;因为 在同步状态下,备份数据库是不可写的,所以必须要中断同步关系,将备份数据 库状态更改为可读可写。(3) 将备份地点hlr配置模块中备用数据库属性由“备用”改为“主用”, 同步配置。(4) 手工阻塞故障iilr的7号信令链路,激活备份地点iilr的7号信令链路, 将该iilr的7号信令切换到备份地点hlro2. 1.2 ulr业务容灾技术业务容灾是指容灾倒换后,备用hlr能基木上在功能上替代主用hlr,倒换 效果较好,用户业务使用连续性基木不受影响的容灾方式。由于目前各厂家hlr 设备内部数据结构

31、各不相同,且数据格式互不开放,因此,业务容灾一般只能在 同一厂家的hlr z间进行,主用hlr和备份hlr z间通过内部协议进行动态数据 的更新,动态数据的更新可以是实时的,也可以是准实时的(根据网上的实际负 荷情况,可以用人工的方式定义动态数据更新周期间隔)。当主用hlr发生故障时,由于在容灾实施时,主用iilr相关直连网元设备的配置已经修改为用备用 hlr的信令链路作为迂回路由,口j以使对原來hlr的信令自动重新路出到容灾备 份hlro由于备份hlr具有和故障hlr同步的数据,因此很容易就接管了故障hlr 的一切操作。当故障恢复后,首先恢复该主用hlr的用户数据,然后恢复主用 hlr相关信

32、令链路,则相关的信令重新路由到该hlr,这样便实现了故障恢复。1+1互备hlr设备1+1互备容灾方式数据关系如图1所示。hlr1hlri内用卢鱷住)hlk2内用户鱷(备)hlr设备1+1互备容灾方式是指在hlr配置时,每2台hlr设备之间配置成 互为备份的关系,每台的备份容量都等于另外1台hlr的主用容量,互备hlr z 间通过ip专网/线或七号信令链路相连,实时或定时进行数据同步,任何静态、 动态数据更改都必须实时同步到备份hlr屮,互备hlr小的用户数据部分应保持 完全一致,并有定期一致性检查能力。当“配对”中的某个iilr故障时,另一台 msc server能以自动或人工方式激活对故障h

33、lr备份的相关静态配置数据和动 态用户数据,接管故障hlr的业务。配置为1 + 1互备容灾的hlr设备基木网络组 织如图2所示。1ilr 】hlji2tdm團2 hl li i7备l+l容灾方式网络绍织圉n+l主hlr设备n+1互备容灾方式数据关系如图3所示。hlr】iilh2 lllkn备钳hlr1ilh1内用门敎据(主1k1h2内用户数据(主iilh1内用户数据(番)hlr2内用r数据(备)hlrn内用门數數主)i ilrji 用户数据(备)hui设备a + 1互备容灾方式数据关系示意图hlr设备n+1容灾方式是指在建设有n个主用hlr的网络中,设置一个备份 用的iilr设备,平时n个ii

34、lr正常工作,备份用的iilr设备只同时运行与主iilr 设备相同的软件和数据,并存储所有主用iilr设备内数据的镜像,而其与外部网 元如msc / (g) msc server / sgsn/scp / smsc / stp的信令链路正常连接,冃这 些链路中一般并无信令负荷,只在与主用hlr的心跳链路(可以通过stp转接) 中有定期传递的“心跳”消息。当n个正常工作的hlr屮任一个出现故障时,备 份hlr将通过“心跳”消息判断出来,并提出告警,在倒换时,加载并激活故障 的i1lr设备用户数据,从而达到备用的hlr完全接管故障的hlr下用户业务功能 的效果。配置为n+1主备容灾的hlr设备基本

35、网络组织如图4所示。n+m主备hlr设备的n+m主备容灾实现,一般是基于用户数据的统一管理的,而其中 基于用户数据的统一存储和调用的技术,被称为分布式hlr技术,作为一种新兴 的超大容量hlr组网技术,正成为近年来hlr设备制造技术发展的热点。分布式hlr技术,将hlr分为业务前端(fe)和数据后端(be),分离设置, be集屮存储用户数据,be 般釆用数据库服务器实现,木身也可以做异地分布 式设置,be之间采用内部接口,统一提供用户数据的存储和高可靠性的备份能力;fe完成业务处理,可以实现n+m主备设置。fe使用内部接口,通过1p承载 专网对be进行数据访问。iilr设备n+m主备容灾方式数

36、据关系如图5所示。hljln内川数据(并)h1j i殳备n+m匸济衽灾方式数据*系示酚在n+m主备容灾组网中,建设有n个主用hlr与m个备用hlr,设置一个或 多个集中用户数据调度或存储用的数据库设备,平时n个iilr te常工作,实时通 过tp承载专网将动静态数据更新传送给数据库,备份用的hlr设备只同时运行 与主hlr设备和同的软件和数据,并不激活任何用户数据,而其与外部网元如 msc / (g) msc server / sgsn/scp / smsc / stp的信令链路正常连接,且这些链 路中一般并无信令负荷。当n个主用hlr屮任一个出现故障时,备份hlr将通过分布式hlr故障判断机

37、制发现,并捉出告警,在倒换时,通过ip承载专网从用 户数据库加载并激活故障的i1lr设备用户数据,从而达到备用的iilr完全接管故 障的hlr下用户业务功能的效果。配置为n+m主备容灾的hlr设备基本网络组织 如图6所示。hlri i 1 11ilrfdmullkl h1b2 iilknhl.ki hlr2 hlfu:2. 2.业务容灾的原则和方式2. 2. 1业务容灾配置原则hlr设备业务容灾实现的网元配置原则如下:a)主备用hlr设备应同厂家设备,并且硬件平台、软件版本保持一致。b)在1+1互备配置时,任一 hlr的容量等于与其配对的两个hlr设备实际 动态容量之和。c)n+1互备方案:备

38、份hlr设备的动态容量应至少大于等于n个主用hlr 中动态容量最大者,才可以保证当n个主用hlr屮的任一台发生故障时,倒换后 业务的完全接管;而备份hlr的静态容量需要配置为n个主用hlr中动态容量之 和,以保证用户数据的存储和实时更新。d)n+m主备方案:任一备份hlr的动态容量应至少大于等于其所备份的主 用hlr中动态容量最大者,才可以保证当主用hlr设备中的任一台发生故障时, 倒换后业务的完全接管;而be设备的数据库容量应至少为n台主用iilr设备的 动态容量和,以保证用户数据的存储和实时更新。e)由于业务容灾实现时的配置方式均为各厂家采用备用hlr配置多信令点 模式进行支持,备用hlr

39、能够配置的最大信令点数量就成为制约业务容灾方式中 最大备份能力的限制条件。当主用hlr数量较多时,该限制条件需要在设备配置 屮进行考虑。f)在1+1互备和n+1主备容灾实现时,由于备用hlr需要对所冇其备份主 用hlr的用户数据进行分别存储,因此,设备的静态数据容量也成为制约其实现 的限制条件。当主用hlr总容量较大吋,该限制条件需要在设备配置屮进行考虑。2. 2.2业务容灾数据同步方式hlr网元级业务容灾的实现,离不开主备用hlr之间用户数据的传递和同步。 其中,hlr静态数据的同步方式一般冇3种。方式一是改造营账系统,使营账系统具备同时向主备用两个iilr输入操作指 令,并对执行失败的指令

40、进行记录的功能,部分厂家提供第三方软件定期核对数 据的一致性功能(可选)。方式二是由主用hlr设备实现同步,即营账系统仍只向主用hlr输入操作指 令,由主用hlr通过ip承载专网(可以是专为此搭建的ip承载专网/线或者利 用现有的网管网或者营账网络等dcn网络)主动向备用iilr发出数据更新,并对 执行失败的指令进行记录的功能,部分厂家也提供第三方软件定期核对数据的一 致性功能(可选)。方式三是新增一个专用系统,营账系统只需要对此系统输入操作指令,此系 统完成将操作指令同时转发给主备hlr设备,并对执行失败的指令进行记录的功 能。对于方式三,如果新增系统前端是一套接口设备,网络中仍难免单点故障

41、的 隐患,但是新增系统若前端设置两套接口设备,营账系统就无法避免改造需求。 因此,方式三只在n+m容灾方式中才会考虑。ifij hlr的动态数据同步也冇2种实现方式。a)通过no. 7信令网进行数据同步,这就需要主备iilr之间通过no. 7信令 链路传递动态数据同步消息,这些信令链路可以是宜连链路也可以通过stp设备 转接。b)通过ip承载专网进行数据同步,即主备hlr之间通过ip承载专网以私 有数据包传递动态用户数据同步消息,所使用的ip承载专网可以是专为此搭建 的ip承载专网/线,也可以利旧使用现有的网管/营账网络,只需要保证必要的 带宽要求和qos要求即可。2.6业务容灾对相关网元配置

42、的影响在hlr的业务容灾方案实施时,为了保证容灾效果,在核心网设备侧需要与 主用hlr设备直连的核心网元设备和stp设备支持并启用信令路由优先级功能, 将到备用iilr设备spc的信令链路配置为到主用iilr的spc的备用路由(低优先 级路由)。而在营账和网管系统侧,则需要采取如下措施。a)如果釆用营账网络或者网管网络作为动/静态数据同步的承载网络,就需 要营账网络、网管网络捉供足够的带宽和qos保障。b)如果静态数据同步采用方式一,则需要营账系统改造,使之具备同时向 主备两个hlr输入操作指令,并对执行失败的指令进行记录的功能。c)在倒换和倒回完成后,需要及时通知计费和网管屮心将采集点ip地

43、址修 改为备用(主用)hlr设备的ip地址。2. 3虚拟卷/硬件基于硬件存储设备的备份方式和操作系统无关,能够在atx和windows平台 下使用。相对于虚拟卷方式,对系统性能影响小。缺点在于需要特殊规格的磁阵。基于虚拟卷的软件备份方式和操作系统紧密结合,对系统性能影响较大,但 不需要特殊的磁阵配置。选择基于硬件的复制方式还是基于虚拟卷的复制方式,主要考虑现冇硬件情 况。对于windows平台+sql server数据库的情况,建议选择基于emc磁阵的硬 件复制方式;对于aix+oracle数据库的组合,选择基于硬件和虚拟卷的复制方 式都可以。2. 4容灾系统的容量容灾系统的容量设计需要考虑两

44、个方面的指标:故障接管时的业务处理能力、h常运行时数据同步能力。如果希槊故障接管时,保持全业务处理能力。对于采用1+1方式的容灾系统来说,意味着两个hlr必须配置7号前置机和业务处理机为当前运行能力一倍兀余。对于采用容灾中心的容灾系统来说,意味着容灾中心的7号前置机和业务处理机配置应该和业务量最人的一个生产hlr相同。如果希望节约成木,则可以减少冗余设备,甚至只使用当前设备,在故障接管时,通过流量控制,牺牲部分业务。对于数据库节点,需要考虑单个数据库节点能容纳多少用户。在启用容灾系统后,整个系统性能会有很大下降(35%),意味着如果原系统单数据库节点最大负荷100力用户,那么实行容灾后系统可能

45、只能支持60万用户,需要新增数据库节点,才能满足要求。2. 5. hlr容灾的实施建议hlr设备是核心网元容灾中首要考虑的网元设备,其容灾技术经过多年的发 展,也都已经比较成熟。在实施核心网hlr容灾备份方案时,不仅要考虑捉高 iilr设备的容灾能力、提高网络服务质量,还应兼顾经济效益,制定尽可能满足 多方面要求的安全保障措施。在国内移动通信运营商进行hlr容灾规划实施时,建议如下:a) 随着大容量hlr的逐步引入和用户服务质量要求的不断提高,各省级分 公司应在满足集中化维护管理的要求的前捉下,在满足条件地区积极推进n+1业 务容灾备份方案,使业务恢复时间达到分钟级,同时对用户服务质量影响最小

46、。b) 对于目前现网已部署实施完毕的hlr设备容灾备份方案暂不作改造,积 极推进分布式hlr的试验和实施。c) 诃未实施及部分实施了 hlr设备容灾备份的省公司,可分为以下2种情 况,逐步完成对所有大容量hlr设备容灾建设。(a) 对投资效益较好、网络安全可靠性耍求较高的省公司,在设备具备支 持条件的情况下,可优先采用n+1实时动态数据备份方案,分设备厂家进行hlr 容灾建设。(b) 对投资压力较大的省公司,可采用基于n+1静态数据容灾备份方案, 以省为单位统一建设备用hlr平台,并建立完善的日常数据备份制度和应急倒换 预案,以便充分利用有限的投资成本,提供更好的hlr设备安全保障。另外,在经

47、过充分测试后,可以考虑在新建hlr设备时,开始刈用户快速增 长地区考虑采用分布式hlr系统提供服务,并对现网无法实施动态数据容灾的陈 ih hlr设备,有计划地进行替换,以提高移动通信网hlr设备整体服务质量和可 靠性。3. 存储网络容灾备份3. 1.概况随着数据的可用性成为区别企业能力的重要指标,企业正在将越來越多的资源用 于确保业务的连续运营。思科提供的先进技术可以帮助企业以一种更加可扩展、 更加安全、更加经济的方法,建设端到端的备份和恢复解决方案以及灾难恢复解 决方案。在服务器上存有关键任务型数据的跨国企业需要为它们的应用提供不间断 的可用性。为了防止数据受损,这些数据至少应当定期备份到

48、磁带。但是,不断 增长的数据容量需要更大的存储容量、更快的服务器,也需要更长的备份时间。 用户还必须考虑到,花儿个小时进行备份意味着需要用相同的时间来进行恢复。 用户往往无法接受这么长的恢复时间,因为它会导致停机时间的延长,从而导致 收入的损失。因此,在很多情况下,磁带备份被视为是灾难恢复(dr)计划的最低 等级。为了确保企业应用所需要的99. 999%的正常运行时间,存储设计必须在每个 级别考虑高可用性因素。所有企业都应制定一个灾难恢复计划,以便在发生大规 模屮断时无缝地将数据转移到某个备用站点。除了磁带备份以外,企业通常需要 在它们的容灾备份计划中,使用复制技术來远程复制整个数据中心。因此

49、,恢复 计划现在除了从磁带恢复数据以外,还应当包括在发生故障时将数据中心转移到 一个远程地点。灾难可能由多种因素导致,并且很难预测。下面列出了可能导致 灾难的主要因素:设备故障、应用故障、人为错误、口然和非口然灾害、每个 企业都必须找出所有需要保存、以实现连续访问的关键性数据,为从灾难中恢复 做好充分准备。因此,用户必须进行业务影响和风险分析,以确定对企业最重要 的地点、职能或者应用。一个远程数据中心dd即主数据中心的镜像,可以用于 在发牛大规模灾难之后继续提供完整的访问。很多容灾备份解决方案都需要在将 数据备份到磁带的同时,保存数据的实时镜像。复制技术还可以提供适用于不同 应用需求的选项。尽

50、管复制技术可以帮助一个企业更快地从灾难性故障屮恢复, 但是它也存在一定的限制,例如它会将受损数据和有效数据一同复制。因此,企 业仍然需耍进行磁带备份,以存档有效数据。本文着重介绍作为整个容灾备份计 划的一个组成部分的磁带备份的技术、架构和选项。3.2技术篇3. 2.1.磁带备份在今天的企业环境中,大多数应用服务器都是通过并行scsi直接连接到专 用的磁带驱动器上。因为需要管理的磁带设备的数量与应用服务器的数量成止 比,所以专用资源的部署和维护成本都很高。但是,直接连接的磁带驱动器可以 保障性能,因为服务器是唯一使用驱动器的设备。成本因素促使企业转向网络备 份模式,即磁带驱动器放置在一个lan上

51、,供多个服务器共享。在一个典型的 基于lan的备份模式中,数据和备份流量都会通过和同的lan传输。这种网络备 份模式有助于提高磁带的利用率和可管理性,但是也会带来一些问题,下面将详 细介绍这些问题。首先,需要备份的大量数据会增加lan ±的流量,导致应用性能的降低。备份通常都在下班之后进行,以便最大限度地减少对应用流量的影响。不断增长 的数据量会导致备份时间的延长,有可能需要占用上班时间。随着企业业务的全 球化,企业对24x7正常运行的耍求越来越高,可以用于备份的时间也越来越 短。其次,让备份和应用流量都通过lan传输,就可能会导致备份中断,进而 导致备份任务全都失败。第三,备份和数

52、据应用共用同一个mn经常会导致很 高的成木,因为一个环境的固件升级或者不稳定性可能会导致另外一个环境的屮 断。为了在一个共同的lan中消除这些潜在的冲突,管理员建议将应用和备份 隔离开。在较新的部署中,客户正在向无需lan的架构传型,以便隔离备份流 量和应用,下面将具体介绍这种架构。很多客户已经开始部署专门用于备份的存 储网络。目前部署的备份流程都是手动的,需耍投入很多人力,而h经常会遇到因为 人为错误而导致的故障。发生故障的备份常常不会被发现,从而导致在故障z后 丢失数据。磁带必须手动插入、轮换,并取出运输到异地,以确保可恢复性。因 为手动管理的成本很高,企业必须提高自动化水平,即利用h动控

53、制装置加强对 磁带的管理。集中备份应用可以将多个磁带组织成磁带池,因而人量备份可以被 合并到一个磁带上。当某个磁带装满之后,备份应用会继续使用磁带池中其他未 被使用的磁带,从而可以大幅度地提高可管理性。需要管理的磁带驱动器的大幅 度减少有助于降低成本。备份需耍增加应用服务器的活动,以便从磁盘获取数据和将其写入磁带。应 用服务器通常忙于处理人量对延时和性能非常敏感的数据。数据的移动和调度需 要占用额外的cpu周期,而进行备份通常会对应用木身造成严重的影响。无需 服务器的解决方案可在应用服务器本身进行备份时,消除备份对于应用性能的影 响。这种架构将移动数据和安排连接的任务交给了一个专门的备份服务器

54、。一个 强大的备份解决方案必须解决下列问题:1. 优化备份资源的使用,包括磁带、驱动器和工作时间;2. 最大限度地降低对应用流量的影响;3. 隔离备份域,以降低应用服务器的cpu负载。下面儿节将详细地介绍新出现的儿种备份解决方案。3. 2. 2.无需lan的备份无需lan的备份让每个应用服务器都可以通过存储网络,直接将数据移动 到某个磁带设备,而不需耍经过专门的备份服务器。利用通用的共享存储选项, 每个应用服务器都可以充当一个介质服务器,因为它们口j以直接将数据发送到磁 带。每个服务器确定一个专用的磁带驱动器,并在备份过程屮独占该磁带驱动器。 用户还可以利用对磁带库中磁带驱动器的专用访问权限对

55、应用服务器进行配置, 而不是使用共享选项。经过存储网络传输的数据流冇助于减少lan流量。一个 磁带也可以被多个应用共享,并且可将多个备份流合并到所管理的磁带库和驱动 器中。lan仍然口j以用于在备份服务器和客户端之间传输元数据和用以跟踪数据 变化位置的环境表,但是实际的备份数据将通过存储网络传输。无需lan的备 份可以隔离数据域和备份域,但是不能减轻应用服务器的cpu负载,因为它们 仍然需耍从磁盘读取备份数据。卜面将要介绍的服务器负担较轻的备份方式可以 解决这个问题。3. 2. 3.服务器负担较轻的备份服务器负扌口较轻(或者无需服务器)的备份需耍在数据不经过应用服务器本 身的情况下,将备份数据

56、从磁盘发送到磁带。在服务器负担较轻的备份中,对所 要备份数据的复制对服务器上的应用影响非常小,或者根本不会造成任何影响。 数据的复本随后会智能地从磁盘发送到磁带,而不需要经过服务器。这个流量有 助于减轻应用服务器的cpu负载,i大i为它并不处于备份数据的传输路径上。宜 接在磁盘和磁带之间直接传输数据的机制被称为scsi扩展复制命令。执行扩展 复制scsi命令的组件可能位于san交换阵列或者服务器软件中。目前所部署的 服务器负担较轻的备份(例如legato celestra power和veritas netbackup) 可以通过备份服务器管理整个流程。大部分客户口前都倾向于为备份部署专门的

57、san, i大i为这样有助于隔离数据域和备份域。i大i此,他们可能不会部署这个解决 方案,因为磁盘子系统和磁带驱动器必须位于同一个san上。3. 2. 4.备份行业和产品概述软件供应商推出了很多集中备份软件,例如veritas netbackup> veritas backupexec> legato networker 和 computer associates brightstor arcserve 2000高级版。所有这些产品都采用了一种集中机制,备份都是通过一个专用备 份服务器和宜接连接的存储设备进行。一个集中备份系统叮能还需要设计很多不 同的软件和硬件模块。用户必须了解备份解决方案的这些不同组件,以及它们的 功能和对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论