




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、系统运维管理备份与恢复管理()版本历史编制人:审批人:专业资料目 录目 录-21.数据中心容灾备份解决案 -31.1灾备解决案原则 -31.2灾备解决案设计需要考虑的因素 -51.2.1 RTO 和 RPO -51.2.2数据安全 -61.2.3网络安全 -61.2.4业务连续性 -71.3国标系统灾备等级划分及应对措施 -71.4容灾技术分析 -81.4.1备份式 -81.4.2数据复制技术 -91.4.4操作系统虚拟化技术 -111.5总体架构设计 -131.5.1Primeton “两地三中心”容灾解决案架构设计 -131.5.2基于不同服务需求选择不同可靠性“两地三中心”架构-17专业
2、资料1.数据中心容灾备份解决案随着社会的发展和科技的进步,政府日常工作越来越依赖于数据处理来进行,政务系统的连续性依赖于数据中心系统的稳定运行。然而,灾难就像灰尘一样伏击在运营环境围, 政务系统的数据中心可能正在一个充满风险和威胁的环境下运行。如果不能对这些风险采取有效治理,一旦数据由于某种原因丢失,就很有可能对政府的日常工作造成重的影响。如果核心数据丢失, 将会使得某些核心功能陷入瘫痪, 造成不可估量的损失。 因此,保证政务的连续性和数据的高可靠性和可用性,已经成为政府部门在数据中心建设中,必须要考虑的问题。1.1 灾备解决案原则首先,在制定容灾系统案的过程中要考虑的就是容灾系统建设对原有业
3、务系统带来的影响。 比如,采用数据复制技术对系统I/O 带来的延迟, 应用数据同步对日常业务处理系统带来的压力等。因此,企业要通过密的测试和分析来规避容灾系统建设时带来的这些风险, 以保证业务系统不会因容灾系统的建设而出现在处理性能上下降的问题。第二,数据状态要保持同步。 为保证在灾难发生时, 业务可以成功地切换到备份中心,就必须保证容灾系统数据同步机制的可靠性。因此,建立可靠的数据同步校验机制是必须的 ; 同时,还要考虑建立定时的、自动的数据同步核查对比机制,以检验两个中心数据的一致性,这是数据容灾工作中非常重要的一部分。专业资料第三,容灾系统的日常维护工作要尽可能轻,并能承担部分业务处理和
4、测试的工作。容灾系统的维护和管理是容灾切换成功的重要保证,在系统建设中, 就必须要考虑系统的维护管理流程。 生产中心任业务处理过程的改变都必须完整地复制到备份中心 ; 所有新业务系统上线时,必须通知备份中心,并在备份中心配置好数据同步机制 ; 对原程序的改动也必须保证两个中心同时上线。第四,系统恢复时间要尽可能短。 容灾系统主要是为了实现在主中心系统发生灾难时,可以在规定时间切换到备份中心,保证数据不会丢失, 并且继续向用户提供服务。 但往往在灾难发生时, 主要技术人员不能及时到达现场,为了顺利实现系统间的切换,应该让系统切换操作尽可能地简单; 并建立固定化的、标准化的切换流程,要求维护人员在
5、切换演习时格按照流程的指导步骤进行操作。第五,可实现部分业务子系统的切换和回切。当人事变动、业务变化、IT设施变化以及其他可能引起恢复规划文档失效的变化发生时,应及时更新各恢复规划文档,并在必要时启动模拟测试或演习,确保业务连续性系统的工作能力。第六,技术案选择要遵循成熟稳定、高可靠性、可扩展性、透明性的原则。目前,国际上比较成熟的容灾技术包括:SAN/NAS技术、远程镜像技术、虚拟存储、基于 IP 的 SAN 互连技术以及快照技术等。其中基于IP 的 SAN 远程数据容灾备份技术应用比较广泛,其是利用基于IP 的 SAN 的互连协议,将主数据中心 SAN 中的信息通过现有的TCP/IP 网络
6、,远程复制到备份中心的SAN 中的。当备份中心存储的数据量过大时,可利用快照技术将其备份到磁带库或光盘库。这种基于 IP 的 SAN 远程容灾备份,可以跨越LAN 、 MAN 和 WAN ,成本低、可扩展性好。基于IP 的互连协议主要包括FCIP、 iFCP、 InfiniBand 、iSCSI等。第七,构建系统案可以选择多种技术组合式。目前,业应用较多的容灾案是专业资料基于智能存储系统的远程数据复制技术,它是由智能存储系统自身实现的数据远程复制和同步,即智能存储系统将对该系统中的存储器I/O 操作请求复制到远端的存储系统中并执行。 由于在这种式下, 数据复制软件运行在存储系统,因此较容易实现
7、主中心和容灾备份中心的操作系统、数据库、系统库和目录的实时拷贝及维护能力,且不会影响主中心主机系统的性能。如果在系统恢复场具备了实时数据,那么就可以做到在灾难发生时,及时开始应用处理过程的恢复。但这种案也有开放性差 (不同厂家的存储设备系统一般不能配合使用)、对于主、备中心之间的网络条件 (稳定性、带宽、链路空间距离)要求较苛刻等缺点。1.2 灾备解决案设计需要考虑的因素1.2.1 RTO 和 RPORTO( RecoveryTime Object):是指灾难发生后, 从 IT 系统宕机导致业务停顿之刻开始,到IT 系统恢复至可以支持各部门运作,业务恢复运营之时,此两点之间的时间段成为RTO。
8、 RTO 是反映业务恢复及时性的指标,表示业务从中断到回复正常所需要的时间。RTO 值越小,代表容灾系统的数据恢复能力越强。各种容灾解决案的RTO 有较大差别,基于光通道技术的同步数据复制,配合异地备用的业务系统和跨业务中心与备份中心的高可用管理,这种容灾解决案具有最小的 RTO。RPO( Recovery Point Objective),是指从系统和应用数据而言,要实现能够恢复至可以支持各部门业务运作,系统及生产数据应恢复到怎样的更新程度。 RPO 是反映恢复数据完整性的指标,在同步数据复制式下,RPO 等于数据传输延迟的时间;在异步数据复制下,RPO 基本为异步传输数据排队的时间。专业资
9、料在实际应用中, 考虑导数据传输的因素, 业务数据库与容灾备份数据库的一致性( SCN)是不同的, RPO 表示业务数据库与容灾备份数据库SCN 的时间差。发生灾难后,启动容灾系统完成数据恢复,RPO 就是新恢复业务系统的数据损失量。设计容灾系统不能只看RTO 和 RPO ,对于不同的业务系统和用户特殊的要求,其它一些指标有可能成为选择容灾解决案的主要因素。例如,某些地区为了防一些特定自然灾害的风险, 要求容灾备份中心与业务中心保持足够的距离,在这种情况下,容灾备份中心与业务中心的距离要求就是容灾系统的重要指标。1.2.2 数据安全数据的完整性, 一致性是保证业务连续的关键。在本地,数据安全需
10、要使用RAID 技术来保证。在灾备案的设计中,数据复制案的设计是整个设计的基础。目前业界主流的数据复制技术有:基于数据库本身的复制技术, 基于操作系统的数据复制,基于虚拟存储的复制技术和基于存储的复制技术。在案所用技术的选择时,应当根据客户的预算,现场的条件,综合来进行考量。后续在1.6.1 数据同步章节,将会有这4 类数据复制技术的综合对比,可以作为选择的参考。1.2.3 网络安全通信网络是容灾系统的组成部分, 通信线路的质量也是容灾系统的性能指标之一,其中包括网络的数据传输带宽、网络传输通道的冗余和网络服务商的服务水平(网络年中断率)。如果容灾系统使用的通信网络是确定的,为了比较不同容灾解
11、决案,可以用单位存储容量的数据库在同一通信网络上的数据完全恢复时专业资料间作为一项设计指标。1.2.4 业务连续性业务连续性是灾备案的最终目标,是案的价值所在。为了保证业务的连续,首先需要数据的连续, 之前我们讨论了数据安全相关的容。其次,在数据连续的基础上,出现灾难时,系统需要能够满足(1)网络切换( 2)应用切换。以此,来保证系统能够顺利切换到灾备地,继续安全运营,最大化保证客户利益。1.3 国标系统灾备等级划分及应对措施信息系统灾难恢复规 (GB/T 20988-2007 )规定了六个级别的容灾,下表分别针对每个级别给出了相应的应对措施。级别容措施Level6数据零丢失和远程集群支持实现
12、远程数据实时备份,实现零丢失;应用软件可以实现实时无缝切换;远程集群系统的实时监控和自动切换能力;Level5实时数据传输及完整设备支持实现远程数据复制技术;备用网络也具备字哦那个或集中切换能力;Level4电子传输及完整设备支持配置所需要的全部数据和通讯线路及网络设备,并处于就绪状态;7*24 运行;更高的技术支持和运维管理;Level3电子传输和部分设备支持配置部分数据,通信线路和网络设备;每天实现多次的数据电子传输;备用场地配置专制的运行管理人员;Level2备用场地支持预定时间调配数据,通信线路和网络设备;专业资料备用场地管理制度;设备及网络紧急供货协议;Level1基本支持每至少做一
13、次完全数据备份;制定介质存取验证和转储的管理制度;完整测试和演练的灾难恢复计划;1.4 容灾技术分析1.4.1 备份式(1) 冷备份备份系统未安装或未配置成与当前使用的系统相同或相似的运行环境, 应用系统数据没有及时装入备份系统。 一旦发生灾难,需安装配置所需的运行环境,用数据备份介质 (磁带或光盘) 恢复应用数据, 手工逐笔或自动批量追补孤立数据,将终端用户通过通讯线路切换到备份系统,恢复业务运行。优点:设备投资较少,节省通信费用,通信环境要求不高。缺点:恢复时间较长,一般要数天至1,数据完整性与一致性较差。(2) 温备份将备份系统已安装配置成与当前使用的系统相同或相似的系统和网络运行环境,
14、安装了应用系统业务定期备份数据。一旦发生灾难, 直接使用定期备份数据,手工逐笔或自动批量追补孤立数据或将终端用户通过通讯线路切换到备份系统,恢复业务运行。优点:设备投资较少,通信环境要求不高。缺点:恢复时间长,一般要十几个小时至数天,数据完整性与一致性较差。(3) 热备份专业资料备份处于联机状态,当前应用系统通过高速通信线路将数据实时传送到备份系统,保持备份系统与当前应用系统数据的同步;也可定时在备份系统上恢复应用系统的数据。 一旦发生灾难, 不用追补或只需追补很少的孤立数据,备份系统可快速接替生产系统运行,恢复营业。优点:恢复时间短,一般几十分钟到数小时,数据完整性与一致性最好,数据丢失可能
15、性最小。缺点:设备投资大,通信费用高,通信环境要求高,平时运行管理较复杂。在计算机服务器备份和恢复中,冷备份服务器(coldserver )是在主服务器丢失的情况下才使用的备份服务器。冷备份服务器基本上只在软件安装和配置的情况下打开,然后关闭直到需要时再打开。温备份服务器( warm server)一般都是期性开机,根据主服务器容进行更新,然后关机。经常用温备份服务器来进行复制和镜像操作。热备份服务器( hot server )时刻处于开机状态,同主机保持同步。当主机失灵时,可以随时启用热备份服务器来代替。对于关键的业务, Primeton建议采用同城热备异地热备的式进行部署,对于一般性的业务
16、, 建议采用同城热备异地温备(应用不启动, 数据保持异步复制)的式进行部署。1.4.2 数据复制技术目前数据复制技术主要有如下表所列4 种,基于红色字体部分的要求, 结合客户的需要, Primeton推荐采用基于存储或者基于应用程序的数据复制技术来进行数据同步。专业资料存储系统数据复制操作系统层数基于存储的应用程序层数据复制虚拟存储技术据复制数据复制基数据的复制过程通过通过操作系统复制技 术是伴随着存 储数据库的异地复制技 术,通常采用日本 本地的存储系统和远端的或者数据卷管理器局域网的出 现引入的,通过构志复制功能, 依靠本地和 远程主机间的日原 存储系统之间的通信完来实现对数据的远建虚拟存
17、储上实现数据复制。志归档与传递来实现两端的数据一致。理 成。程复制。平与平台无关,台需要增加 专有的复制服同构主机、异构同构存储与平台无关要务器或带有复制功能的SAN 存储求交换机复制高高高较高性能资源对生产系统存储性能对生产系统主对网络要求高占用部分生 产系统数据库资源占 有影响机性能有影响用技术成熟度有待提高,非主流成成熟成熟成熟复制技术。熟度投入较高,需要同构一般高,需要同构存 储较高,需要 专有设备成主机部分软件免费,如 DataGuard本复 IBM PPRCBrocadeTapestry原厂技术:Oracle DataGuard专业资料制EMC SRDFDMMIBM AIX LVM
18、Oracle GoldenGate软HP CA (ContinuesUIT SVMHP-UINXDNT IDR件 Access )EMC VSMMirrorDiskDSG RealSyncHDS TrueCopySunSolarisQuest SharePlexSVM专业的复制软件:SymantecSF/VVR1.4.3 重复数据删除技术重复数据删除技术是指将存储系统中存在的大量容相同的数据删除,只保留其中一份,从而缩减存储空间的技术。 在云灾备中, 该技术既能大幅减少灾备中心存储的数据量, 降低灾备中心的建设和运维成本,又能大幅减少数据备份和恢复过程中用户和灾备提供商间的数据传输量,提高备份
19、和恢复的性能, 是一项十分重要的技术。随着灾备中心的规模不断增大,存储的数据量和访问量不断增加,单一节点上的重复数据删除法已不能满足性能和容量的需求。除上述基本重复数据删除技术外,一些优化和改进技术对云灾备是至关重要的,包括高性能、可扩展的、分布式的重复数据删除技术, 以及为提高灾备中心数据可靠性的高可靠重复数据删除技术。1.4.4 操作系统虚拟化技术除了数据级的灾备,还应提供系统级的灾备。 即在将数据复制到云端的同时,专业资料也将受保护的应用程序的状态复制到云端,当灾难发生时可以立即切换到云端的应用程序运行, 保证业务连续性。 系统级灾备是通过操作系统虚拟化和检查点实现的。检查点用来捕获进程
20、某一时刻的运行状态,从而实现进程迁移。 进程迁移既可以是用户应用程序进程到云灾备中心的迁移,也可以是云灾备中心部的虚拟机池间进程迁移,以实现根据前端用户的需求自动地调节灾备服务提供商有限的硬件与软件资源,动态地、弹性的反应前端业务对灾备的需求。当程序因故障中断, 如果不能保留其中间运行状态,恢复后从头运行将会带来极大的消耗。检查点技术能够解决这个问题。通过保留各个进程的运行状态,恢复时能够复原到最近一次保留的数据映像。传统的检查员机制是基于库的检查点机制。例如以静态库的形式实现, 或通过加载动态库来追踪程序运行过程中的数据变化。也有一些检查点机制实现于核级别甚至硬件级别。 例如通过在文件系统层
21、之上引入一个中间层来实现保留文件系统状态的检查点机制;或者借助Fuse 核模块实现的支持检查点机制的文件系统,通过 Fuse 侦测、拦截核级别的文件系统操作并将控制权传递给用户,从而能够在用户空间对文件系统状态进行保留。随着操作系统虚拟化技术的发展, 基于虚拟容器的检查点技术也得到了很好的应用。虚拟容器是通过系统虚拟化技术构建出来的一个进程运行的较独立的上下文环境。虚拟容器检查点技术能够有效保护容器运行的应用程序和服务而不需要对应用进行修改。专业资料1.5 总体架构设计1.5.1Primeton“两地三中心”容灾解决案架构设计结合近年国出现的大围自然灾害,以同城双中心加异地灾备中心的“两地三中
22、心”的灾备模式也随之出现,这一案兼具高可用性和灾难备份的能力。1.5.1.1 “两地三中心”本地高可用和容灾保护策略(1)本地保护策略:? 本地高可用? 本地 clone? 持续数据保护? B2D BVTL? 磁带备份? Archive Log 备份(2)容灾保护策略? 应用级或者数据级容灾? 同级容灾、降级容灾? 同步数据保护异步数据保护? 容灾数据复制技术? 主备中心运营式双主中心运营式多中心运营式? 短、中、远期容灾策略专业资料1.5.1.2 “两地三中心”功能定位生产中心同城备份中心异地灾备中心生产生产(双活或热备)生产备份备份备份灾备灾备灾备开发监控测试测试监控监控管理管理同城双中心
23、是指在同城或邻近城市建立两个可独立承担关键系统运行的数据中心,双中心具备基本等同的业务处理能力并通过高速链路实时同步数据,日常情况下可同时分担业务及管理系统的运行,并可切换运行; 灾难情况下可在基本不丢失数据的情况下进行灾备应急切换,保持业务连续运行。 与异地灾备模式相比较,同城双中心具有投资成本低、建设速度快、运维管理相对简单、可靠性更高等优点。异地灾备中心是指在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。1.5.1.3 “两地三中心”容灾架构设计逻辑架构模型设计:专业资料物理架构设计:案特点:?
24、同城围有效保证了数据的安全性和业务连续性;专业资料? 异地复制数据根据灾难情形,尽可能降低数据丢失机率;? 同城双中心为同步复制,数据实时同步, RPO=0 ;? 异地无距离限制,保证数据一致性,保证了数据的有效保护;? 异地容灾带宽要求低,先进的复制机制提高带宽利用率。对于本地本级备份,应建立在线、近线、离线等多级存储备份系统,充分利用先进的备份手段和备份策略,形成完整的本地备份管理解决案;备份的数据包括操作系统、数据文件以及应用服务环境等多个面;日常访问的重要数据采用磁盘或者虚拟带库式备份, 归档数据和非重要数据采用磁带库式备份;重要数据应至少保证每做一个全量备份,平时做增量备份。对于数据
25、级异地灾备中心, 选址上,应进行风险分析, 避免异地备份中心与主中心同时遭受同类风险; 网络备用系统上, 必须在核心网络层面实现热备,保证灾备中心区域通信的可靠性;数据备份系统上, 主中心与备份中心的备份链路应有冗余,并确保 2 小时将主中心的增量数据复制或备份到灾备中心;数据处理备用系统上,配备灾难恢复所需的全部数据处理设备,并处于就绪状态或运行状态,与主中心共同承担部分核心应用的查询服务功能。对于同城应用级灾备中心,选址上,主中心与同城灾备中心距离应小于100KM ;网络备用系统上,在核心网络层面实现热备,主中心与应用级灾备中心间通过裸光纤互联或VPLS 互联,部署 TRILL构建大二层网
26、络,满足虚拟化需求;网络负载均衡上, 主中心网络与灾备中心网络的负载均衡,提高灾备网络利用率与灾备网络可用性, 正常情况下数据流同时使用两个中心的网络,主中心网络出现故障时, 则全部数据流向灾备网络;应用集群切换上, 关键业务系统集群实现手动切换, 主中心与同城灾备中心之间建立高可用性监控技术,实现灾备中专业资料心应用服务器集群与主中心生产服务器集群之间的高可用性切换;云计算技术采用上,采用虚拟化技术对同城灾备中心进行规划建设,同时,根据业务关键程度、对性能的要求,系统平台选择不同档次和不同平台的主机资源池、存储资源池。1.5.2 基于不同服务需求选择不同可靠性“两地三中心”架构1.5.2.1
27、 服务等级划分的可靠性服务级别tier1tier2tier3tier4服务容关键任务关键业务高端技术没有关键服务 ,需要最高 服务的运维和和工具将会尽服务运行,运维级别的可靠性。 tier1一样,但是量(略低于 tier1和支撑只要能高端技术和工某些限制非可和 tier2 )被用来够在一个可以具将会被用来靠级别的服务满足最高级别接受的围即可。满足最高级别可以容忍短时的可靠性。允有的可靠性。如果间的不可恢复多个单点故障。丢失一个组件, 的影响。高端技 仅仅 在计 划上如服务器,一块术 和 工具 将会有一些伸缩性。存储,或者一个尽量(略低于通信,都将会导 tier1 )被用来满致服务不可靠。足最高级别的专业资料每个应用和基可靠性。系统设础服务都会制计和指导里面定性能指标。这必须包含 些指标都将 会没有单点故障。被监控,并会通过业务支持的流程以特定格式输出。这个site 不仅仅包含基础架构组件。关键指标99.99% 的99.5% 的可95%的可靠没有可靠可靠性,数据中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 金融衍生品市场创新与风险防范:2025年金融风险管理技术发展报告
- 2025年能源行业储能技术多元化在储能电站运营中的设备维护与成本优化报告
- 2025年生态保护修复资金申请与生态修复工程可持续发展研究报告
- 好天气坏天气课件
- 2025年中考数学一轮讲练测-章节综合训练六 圆(测试)(原卷版)
- 澳洲税务基础知识培训课件
- 澧县公共基础知识培训课件
- 2025短视频项目短视频IP授权与运营合作合同
- 2025版煤矿转让买卖居间合同(含安全生产标准)
- 二零二五年度办公室水电工程安全风险评估与节能改造合同
- EPC工程总承包招标
- 抗结核药物所致肝损伤
- 抗菌药物临床应用指导原则(2023年版)
- 城市道路工程设计规范-局部修订稿(完整资料)
- 神的《全备之救》
- GA 38-2021银行安全防范要求
- 第一章数字印刷概述课件
- 【医院管理】-科研创新助推学科建设课件
- 《卷烟原料配方设计》配套教学课件
- 介入诊疗质量安全计划与指标
- 新课标高考英语词汇表3500
评论
0/150
提交评论