2014-电力公司应用级容灾解决方案_第1页
2014-电力公司应用级容灾解决方案_第2页
2014-电力公司应用级容灾解决方案_第3页
2014-电力公司应用级容灾解决方案_第4页
2014-电力公司应用级容灾解决方案_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

XXXX电力公司容灾设计方案方案制作:柏科数据中国公司电话:http柏科(RORKE)容灾网关灾备系统设计方案项目背景XXXX电力公司系统信息化建设已经经历了十多年历程,各地市供电公司已经积累了大量的系统应用,如电力营销管理系统,生产管理系统,OA系统等等,以数据量较大的合肥供电公司为例,在网用户最多达到900多台,数据量已达到400余GB。目前,各地市供电公司的主机系统主要均采用PC服务器,主数据库服务器多采用服务器与磁盘柜的双机集群方式,没有独立的存储区域网,各地市公司现阶段业务系统,按其数据库类型划分,可分为oracle数据库,SQLSERVER数据库,DominoR5。IT环境电力营销系统Oracle(Win2000)办公自动化OA系统DominoR5数据库系统(Win2000)大部分应用系统数据库SQLSERVER集中数据库(Win2000)2台大型HPUNIX服务器其他高端PCSERVER服务器Legato备份软件地市应用生产管理系统、生产运行系统、办公自动化、电力营销系统、网站、财务、档案、配网、电能采集问题与挑战传统备份机制策略落后,不能满足故障发生后数据最小丢失率要求传统备份机制无法提供快速恢复能力,一旦发生意外就必须忍受长时间停机(至少5小时以上)灾备建设目标实现PRO=0,RTO=1分钟;不改变目前的IT基础架构;实现本地问题,本地解决;实现全方位的数据保护(硬件故障、逻辑故障、误删除、病毒感染等)实现生产库与查询库分开;易于演练与管理实现生产中心与灾备中心的应用级容灾体系灾备设计原则为XXXX电力公司提供的数据保护方案,目的是来提高整体数据安全性能,防止在出现意外的情况下的数据损失,满足用户的要求。在设计灾备系统时,应该遵循以下原则:旁路接入不改变原有架构由于此容灾网关是采用旁路接入方式,不改变原有存储架构,不影响原有性能,减少风险。任意多时间点的数据恢复面对不同的灾难环境,灾备架构都能过轻松对应。多种数据的保护/恢复策略,能够恢复到任何特定的时间点,恢复出标定时间的任何数据。窄带宽传输降低广域网带宽容灾网关产品在传输数据时,最低只需要2M带宽,降低广域网带宽,提高数据传输效率。技术成熟灾备系统作为核心数据的保护方案,必须选择成熟的技术、成熟的软硬件产品。否则一旦出了问题,难免冒丢失数据的巨大风险。支持复杂的异构环境在复杂的计算机网络业务环境中,可能会包括了各种操作平台,如各种厂家的UNIX、NetWare、WindowsNT、Linux、等,并安装了各种应用系统,如ERP、数据库、群集系统等。选用的灾备架构,要支持各种操作系统、数据库和典型应用。快速的数据恢复能力建设灾备架构最终目的就是为了快速恢复数据及业务。当意外发生时、当服务端提出恢复需求时,灾备的数据要能快速、可靠的恢复,这样的灾备系统才是值得信赖的,才有其存储的意义。高性能对于XXXX电力公司巨大的数据量、小备份窗口以及容灾系统尽可能对生产系统造成小的影响要求灾备系统能在最短时间内完成数据灾备任务,这就要求灾备系统具备足够高的性能。易管理易操作数据灾备应用于不同领域,进行数据容灾的操作管理人员也处于不同的层次。这就需要一个直观的、操作简单的在任何操作系统平台下都统一的图形化用户界面,缩短操作人员的学习时间,减轻操作人员的工作压力,使灾备份工作得以轻松地设置和完成。大的扩展能力应用和数据都在不断增加,容灾系统应具有相应的扩展能力,确保系统能方便的升级和灵活的拓展。灾备设计思想不改变原有架构,不影响原有性能。提供足够多的任意时间点的恢复数据。快速高效恢复操作系统和数据。降低广域网带宽提高数据传输效率。全面的数据备份,不留死角灾备考虑的问题不能对生产系统产生不利影响易管理性防止有灾无备防止灾备死角出现数据安全漏洞硬件和数据库开放性节约带宽降低网络运营成本灾备需求分析经过前期的技术交流,目前XXXX电力公司需求对目前的数据,进行一下要求:本次项目要对本地数据提供全方面的数据保护,即操作系统的保护,数据库的保护要提供多方面的数据恢复方式(磁盘镜像、数据快照、任意时间的恢复轨迹日志)信息中心机房与灾备中心机房采用1对1的容灾网关模式实现应用级容灾系统。灾备系统的设备选型根据XXXX电力公司的需求和运行系统的环境,我公司从目前较成熟的几种方式里,选择了柏科DR4000和DR3000(RORKE)容灾网关的容灾方式来建设此系统,目前较成熟的方式有:容灾网关的容灾方式基于数据库的容灾方式软件工具的实现容灾方式基于磁盘阵列的容灾方式容灾网关――旁路式灾备系统柏科容灾网关采用旁路(sideband)的控制方式,对于I/O流量进行旁路监控和分流,实现异地数据镜像、复制,部署时不改变已有存储网络的任意连接和访问方式,将容灾网关部署在存储链路中,以避免部署方案时影响现有生产系统的正常运行。采用旁路方式其优点主要体现在:容灾数据与生产数据的传输分离,最大限度减少容灾对生产系统的影响旁路部署,最大限度减少容灾对生产系统的结构影响,并且保证容灾设备不会成为新的IT瓶颈旁路方案部署后,生产服务器与容灾服务器之间仍然是主机对主机容灾,简化旁路方案部署的复杂度,并享有主机到主机容灾方案的所有优势可同时支持FCSAN/IPSAN存储网络的带外旁路应用容灾基于数据库数据复制实现容灾数据库复制技术有两种,一种是物理复制,一种是逻辑复制。物理复制又被称作数据库重做日志方式数据复制,它的基本原理是利用数据库被归档的重做日志,在副本数据库进行“重做”,恢复生产数据;逻辑复制需要对重做日志进行分析,反向生成SQL语句,传送到容灾系统,再进行重做操作。目前的主流数据库,如DB2Oracle、Sybase、Infomix、MSSQLServer等都具有数据远程复制功能。可以从主中心数据库把数据发到备中心数据库。这种数据备份方式优点有:在实现单个数据库的远程备份时实现方便依靠数据库的功能,数据量比较少;网络带宽占用低,不需要任何特别的网络技术;物理复制可以通过“延迟”回滚的方式,避免逻辑故障(例如误删除数据)传播;缺点有:保护的数据有限,只能保护数据库数据。物理复制基于异步方式,在线的重做日志不能传送,丢失数据量较大;并非所有的数据都可以复制,例如一些数据库管理的操作(及结果)不会被复制,使用RowID等唯一数据的操作等等;管理、恢复操作过程最杂;备份中心要求有专门的数据接收主机,操作系统的版本与生产机相同,当主数据中心有多种类型主机时需要在备份中心也采购多台各种类型的主机,并增加数据库软件投资。通过操作系统级软件工具实现容灾操作系统逻辑卷复制技术GeoRM和GLVM是与IBMAIX操作绑定的一种数据复制技术,已经被使用了相当长的时间,它截获系统的写操作,通过网络将其传送到远端系统,异步方式下容灾距离可以达到数千公里。这种容灾方式的优点是:历史悠久,经过多年的实践检验,稳定可靠;价格低廉;所有镜像的数据被“物理”复制,不存在不可复制的数据;与存储完全无关对应用程序透明集成了HACMP,可实现故障的自动诊断和恢复适用于任何TCP/IP之上的网络无距离限制缺点是:需要一定的管理操作;数据不能直接使用(但通过一些操作系统技术可以实现)采用主机实现数据拷贝,占用主机CPU资源较多,大约10%~20%左右。备份中心要求有专门的数据接收主机,操作系统的版本与生产机相同,当主数据中心有多种类型主机时需要在备份中心也采购多台各种类型的主机。基于智能磁盘阵列数据复制的容灾方案一些高端磁盘阵列可以提供自动数据复制功能,生产中心的磁盘阵列可以自动将数据实时复制到备份中心的磁盘阵列。物理存储复制技术是随着智能存储技术的发展而产生的较先进的复制技术。这种复制技术利用存储中的CPU进行数据标记,并完成两台存储之间的数据复制。一旦生产中心发生故障,可以在备份中心磁盘阵列上启动应用服务器,保证业务处理的正常运行。以上方案的优点是:与主机无关,对应用完全透明。可以进行复杂的数据处理,例如快照、同步/异步复制等独立于服务器,数据操作不影响服务器性能(同步数据复制导致的性能影响例外)所有镜像的数据被“物理”复制,不存在不可复制的数据实施和维护方便,数据一致性程度高。可以实现双向数据拷贝,降低灾难后切换回主中心的停机时间。同时,可以通过配置对等节点的远程集群,将两个数据中心做成互为备份。缺点是:网络带宽要求最高,一般需要专用的存储网络(SAN或者通过FCIP的转换设备);相同或者同类的产品之间才能进行复制,而且一般是高端;成本通常比较高生产中心本地数据灾备拓扑图生产中心本地数据灾备拓扑图生产中心本地数据灾备拓扑图的说明如上图所示,使用原有EMCCX340作为XXXX电力公司数据的集中存储;同时,利用带持续数据保护技术的柏科数据DR3000容灾网关提供XXXX电力公司本地数据保护、灾备系统。我公司采用柏科DR3000容灾网关方案,是为XXXX电力公司信息系统设计的一套行之有效的,集磁盘镜像、数据备份、数据远程容灾于一体的综合容灾解决方案。由于数据库的变化构成生产系统数据的主体,因此在此项目的配置中,所有生产数据库服务器均先配置柏科的远程容灾和实时备份模块,生产系统架构中的服务器一般为固定内容,因此在灾备中心建立相应的服务器系统,并实现内容和程序的同步安装即可。其基本架构为:在信息中心生产中心使用原有EMCCX340磁盘存储系统,采用SAN存储架构,实现生产管理系统、生产运行系统、办公自动化、电力营销系统、网站、财务、档案、配网、电能采集等IBM小型机和HPUNX及其他x86服务器数据的集中存储.在信息中心生产中心机房,对业务系统软件不作任何改动,部署一台柏科数据DR3000容灾网关,旁路接入两台EMCDS4100光纤交换机上,考虑的用户的业务增长,配置12TB的存储容量。生产中心本地容灾网关配置256份历史快照和历史轨迹日志,实现多历史点保护和任意IO的回退机制。生产中心的各数据库服务器分别通过同步镜像工具实现数据向容灾网关的实时抽取.需要进行数据远程复制的服务器为信息电力营销系统、办公系统数据库等,这些服务器均安装柏科的数据库代理(DBagent)和数据实时抽取工具。柏科数据容灾网关同时提供FC接口和IP接口,中心机房可利用FC接口,连接于光纤交换机,对生产卷进行数据镜像(RPO趋近于0),保证了生产卷数据的安全。柏科数据容灾网关不仅可以保护生产数据,保持生产数据的一致性,同时,可对服务器的操作系统盘也进行保护。单服务器操作系统出现故障时,可从容灾网关上远程启动操作系统。DR提供持续的快照技术,保证软件、程序错误、人为操作、病毒或黑客等逻辑错误恢复.生产中心多台业务服务器及ORACLE数据库数据分别通过实时系统镜像和Agent(数据库代理)实现数据向柏科数据DR容灾网关的实时写入,无须干预,没有任何备份窗口。ORACLE数据库系统采用DB2agent进行数据同步和抓取。柏科数据DR容灾网关采用旁路式部署,对业务系统性能不会产生明显的影响数据库快照代理,确保时间点数据库恢复的瞬间完成和一致性操作系统故障时,可通过本地中心机房DR容灾网关进行系统远程启动生产数据故障时,可通过本地中心机房的DR容灾网关进行快速的数据恢复如果本地信息中心出现人为的错误,需提取数据进行查询或纠正错误,只需对远程对应的快照(或本地快照)瞬间可用即可,这一过程1分钟即可完成(RTO小于1分钟)。生产中心和灾备中心远程数据灾备拓扑图远程数据灾备拓扑图远程数据灾备拓扑图的说明我们所采用的柏科容灾方案,是为XXXX电力公司信息系统设计的一套行之有效的,集磁盘镜像、数据备份、数据远程容灾于一体的综合容灾解决方案。由于数据库的变化构成生产系统数据的主体,因此在灾备中心的配置中,所有生产数据库服务器均配置柏科的远程容灾和实时备份模块,灾备中心的启动则基于最新的复制数据。生产系统架构中的服务器一般为固定内容,因此在灾备中心建立相应的服务器系统,并实现内容和程序的同步安装即可。其基本架构为:在生产中心,针对电力营销系统、OA等系统设置一台DR4000容灾网关,这台容灾网关外接光纤存储,需要提供12TB的空间,分别各自分配给前端的应用服务器。生产中心的各数据库服务器分别通过同步镜像工具实现数据向DR容灾网关的实时抽取.需要进行数据远程复制的服务器为电力营销系统、OA系统等务器均安装数据库代理(DBagent)和数据实时抽取工具。对于各类X86服务器系统则是通过DR容灾网关技术将整个系统实现持续数据保护,针对WEB服务器、ftp服务器我们部署对其进行保护、在灾备中心部署一台DR3000容灾网关,该DR3000初期配置空间12TB。同样配置iscsi和FC接口。灾备中心的DR3000可以直接作为灾备中心运行存储也可以新增磁盘阵列,也可以作为数据分析、查询的数据源。灾备中心的恢复主机可以通过FC和iscsi分别连接到DR3000上实现灾备状态的业务运行)。生产中心和灾备中心的两台容灾网关之间配置replication的远程容灾复制模块,形成基于异地传输的远程容灾体系。所有的数据复制连接均通过IP网络进行。生产中心容灾网关配置255份历史快照和历史轨迹日志,实现多历史点保护和任意IO的回退机制。远程复制采用TCP/IP协议,复制策略根据实际的数据增量和传输带宽灵活制定。那么利用柏科的精简复制技术,可以实现连续传输的模式,将数据丢失量降到最低(有可能实现零丢失)。除了连续模式,柏科的复制策略还包括间隔复制,可以基于时间,也可以基于数据增量。生产中心和灾备中心P2P、P2V、V2V拓扑图P2P就是生产中心容灾网关对灾备中心的容灾网关,做应用的接管及数据的保护,V2V就把一台虚拟机的业务无缝迁移到另一台虚拟机上,保证业务的正常使用,下面我公司以P2V方案就行介绍:P2V拓扑图P2V拓扑图的说明将业务系统从原来的物理机上“搬移”到虚拟机上运行何时使用P2V服务器硬件(硬盘、主机)损坏,暂无备件可用搭建测试环境P2V的特点无需另配服务器硬件无需另配存储空间可将整个生产环境搬到ESX中运行搬移速度快,仅需几分钟灾备的RPO/RTO传统的容灾RPO/RTO需要的时间在进行数据灾备系统建设时,为了区别传统的数据备份环境,最常见的设计指标有:RTO和RPO。RPO和RTO是衡量传统备份和业务连续性的时候,经常会用到的两个概念。恢复点目标(RPO)是在发生灾祸的情况下用户可接受的数据丢失量的衡量标准。受到目前备份和恢复技术上的限制,很多用户设定的RPO是24小时――在预定的增量备份过程发生之间。换言之,即使用户通过备份系统完全恢复数据,也损失了24小时的业务数据量。恢复时间目标(RTO)是指灾难发生后,业务恢复运营所用的时间,一般的用户从数小时到数天都是比较实际的RTO。然而这也是由于目前备份技术和操作上的限制造成的,而不是业务需求。各种灾备解决方案的RTO有较大差别,基于光通道技术的同步数据复制或镜像,配合异地备用的业务系统和跨业务中心与备份中心的高可用管理,这种容灾解决方案具有最小的RTO。实际上,灾备系统为获得最小的RTO,往往需要投入大量资金。RPO反映了恢复数据完整性,在使用数据镜像或同步复制方式时,RPO等于数据传输时延的时间;而在异步数据复制方式下,RPO为异步传输数据排队的时间。在数据中心与备用中心相差距离不超过10KM的时候,通过光纤做数据镜像或同步数据复制方式的灾备系统的PRO可以做到几乎为0。传统的备份方式是在某个时间点上(如晚上12点)对数据备份到某个介质上(如磁带、磁盘)。这种备份方式在进行数据恢复的时候需要较长的还原时间,且会出现大量数据的丢失(只能恢复到上个备份点上),也就是RPO/RTO数值大。柏科的容灾网关RPO/RTO需要的时间柏科的DR4000和DR3000的RPO允许数据丢失量几乎等于0,柏科的DR4000和DR3000容灾网关采用连续I/O记录技术可以将数据恢复到任意历史轨迹(秒级和I/O级均可),柏科的DR4000和DR3000会单独在磁盘上开辟一个区域,用于记录生产卷每一个历史I/O。恢复时,通过“拉杆”可将数据恢复到任意历史点,并且该历史点数据可单独进行查询,不影响生产卷的状态。柏科的DR4000和DR3000的RTO对于UNIX平台可以直接接管,恢复时间几乎为零,对于windwos平台允许应用恢复时间在5分钟,主机硬盘损坏通过容灾网关的镜像盘,可以远程启动,需要重新主机时间在5分钟,数据库损坏通过容灾网关的快照功能,把快照替换坏的数据库表时间在1分钟,如果主存储损坏直接把容灾网关的镜像卷分给前端应用服务就行了时间为1分钟。多种策略的远程replication技术柏科的容灾网关提供远程复制选件,这是一个基于多种复制策略的异地传输服务,将数据从生产站点按一定的复制策略复制到远端站点的存储设备中。Replication复制具有各类可供选择和调整的策略(一般的灾备技术只具备局部策略),因而远程复制具备了可调整能力和优化策略能力:基于连续IO的复制CDR一天中的特定时间。例如:在每天晚上的12:00开始复制持续时间间隔。例如:每10分钟复制一次容量的变化量。例如:新数据超过5MB就开始复制这几种策略可以单独使用或组合使用,使得为管理员提供了一个非常灵活的策略触发机制,实现数据的保护而不受灾难的影响。目前,柏科的CDP/CDR技术也是所有灾备技术中唯一具备所有复制策略(连续/时间增量/数据增量/同步)的灾备技术。如果发生灾难或复制的目标盘要使用,CDP提供了提升(Promote)操作可以将此盘提升出来并中断复制关系以供远程站点的应用服务器访问,同时也可以不中断复制关系的情况用CDP提供的时间标记功能将磁盘视图提取出来以供远程站点查询、校对、审查等操作。CDP的远程数据复制使管理可以自定义不同的策略来控制复制的过程,利用CDP存储管理源服务器内建的快照引擎和CDP存储管理目标服务器的“接收”机制,确保复制进程能够在瞬间内真正完成,从而获得最高级别的数据完整性。业务应用及数据保护XXXX电力公司GIS、ERP等数据,是本次数据保护系统的主要目的。DR容灾网关解决方案的核心内容如下:使用镜像功能对核心数据卷、关键的操作系统卷进行实时镜像保护;使用计划的快照技术对多份历史数据进行保护;使用镜像卷“提升”功能直接替换损坏的存储设备或应用服务器本地硬盘;使用远程引导功能直接将镜像卷作为应用服务器损坏的本地系统盘,立即重新启动应用服务器;使用数据库代理,捕捉最细微的数据库事务变化,最大化保护数据库;使用“标尺恢复”功能,将对数据的保护提升到难以置信的“秒”级别;使用快照技术提供立即可用的测试卷,进行数据保护的测试;使用相互间的远程复制功能,进行数据的远程保护;使用高级的数据比对功能,提高数据传输能力达58倍,相对应使远程带宽缩小到原先需求的1/8到1/5;使用数据导出功能结合物理磁带库,进行数据的离线归档;二期建设中,使用现有8M网络,把下属地市院的数据集中保护到省信息中心,保证数据的安全性。核心存储失效问题DR容灾网关存储特有的“提升”能力,可以在主存储设备发生损坏,数据卷完全丢失的情况下,立即提升在DR容灾网关的镜像卷为生产卷,从而使得生产服务器可以使用原镜像卷作为数据卷,并继续使用原先镜像的数据提供服务。在主存储修复,数据镜像回主存储的数据卷后,可以手工将DR容灾网关的数据卷重新降为镜像卷,因此完全解决了主存储损坏时系统长时间的停顿的风险。由于逻辑错误等引起数据损坏柏科数据DR容灾网关在对核心的数据卷做完整的保护的同时,可以使用快照技术保护历史数据。我们知道,在误操作、病毒、黑客等问题发生时,不但可能非法修改数据,还可能恶意删除数据。在数据被恶意删除的时候,镜像卷的数据将同步进行删除操作。而使用快照功能,可以保留快照。快照可以按照时间进行计划,也可以手工完成。在实施数据卷的快照时,只保留快照点时间开始数据的变化量,因此使用的空间极小,但用户却依次能保留多个数据的副本。利用快照技术,不但可以完全防止各种有意无意的数据删除动作,还能追溯不同时间的不同数据版本,进行数据分析或测试。结合“标尺”恢复技术,可以利用快照将数据损失减少到“秒”的级别。DR容灾网关从本质上面使用了完全不同于传统备份方式的数据保护技术,非常适合于大数据量系统的保护。首先,DR容灾网关使用了高速高性能的RAID磁盘组为数据保护介质,与磁带相比较,磁盘,特别是做RAID后的磁盘,在性能、可靠性等方面远远超过了传统的磁带、光盘等备份介质,因此在保护数据时,对原始数据源的影响时间极大缩短;与传统备份所需要的备份窗口比较,做一次完整的数据保护所需要的时间几乎可以忽略。其次,DR容灾网关在对数据保护时,可以灵活使用FC协议或IP协议。这意味着在对数据进行保护的时候,采用FC链路对业务网络的影响降到了0的影响。而在使用传统方式进行备份时,想达到完整的LANFREE备份,所需要的备份软件的许可费用将达到一个巨大的数字。如图,使用FC协议时,镜像数据数据流是从服务器交换机数据保护设备,根本无须经过业务网络。再一个,使用DR容灾网关进行数据保护时,无须各种复杂的管理技巧,你不需要去了解什么“LANFREE”,什么数据库代理等等复杂的专业知识,只需要对你想保护的数据卷进行定义,将该卷的内容划入保护对象,仅此而已!这极大地减少了系统管理员的工作压力和负荷。在对TB级或更多数据进行保护时,采用传统的备份方式是一个艰巨的、不可意料的任务;而使用DR容灾网关进行数据保护,则完全是一个轻松的任务。而对于一般性的数据意外删除的恢复,使用DR容灾网关时所需要做的只是从最近的一次快照中直接恢复一个数据,分分钟即可解决问题。完全解决了交易系统RTO的严格要求。另外,为提高数据的保护能力,我们在远程中心使用物理磁带库进行离线归档,使用这种本地保护+离线归档的方式保护数据有以下好处:对中心的数据进行离线归档而不是对生产系统进行备份,直接减少了对生产系统的影响,真正做到对系统“零影响”的数据备份;对的镜像数据进行离线备份,从根本上节省了庞大的备份软件开支,也相应节省了备份软件管理的资金和人力投入,更无须时刻关心软件的升级;轮换一份离线的介质可以最大化保护数据的安全,即便在线系统完全损坏,也还有一套完整的离线数据用于系统重建和数据恢复,同时轮换也可以校验数据磁带的可用性。如果使用传统备份方式,难以保证备份和恢复的成功,更难以实现快速的数据恢复能力,从而决定了系统恢复时间的不确定性使用DR容灾网关进行数据保护时,数据保存在硬盘上面,数据是否可用,能否访问,均一目了然,也无须先恢复到某个设备上面来查看备份的数据集是否完整,是否可用。而使用磁带等设备进行保护时,数据保存在不同的介质上面,你就必须时刻关心介质是不是可用,有没有损坏;在需要验证备份数据时,最保险的只能是把数据恢复到某个设备上面,才能对数据的完整性加以充分验证。其次,在发生意外需要恢复数据时,传统备份方式恢复数据需要多个步骤,恢复时间会很长,而且恢复时间很难控制。而使用DR容灾网关进行数据恢复,通过快照功能几乎是瞬间完成。传统备份只能从备份记录中确认备份工作成功,却不能保证数据能够用于正确恢复。DR容灾网关在服务器端就能快速转换为快照并浏览快照内容,通过ISCSI或FC与应用服务器连接,时间点磁盘快照技术直接检查快照瞬间恢复数据无需耗时恢复。使用DR容灾网关的快照功能和时间标杆功能,可以使数据的保护达到惊人的“秒”级别。柏科数据DR容灾网关不但具备“立即提升”镜像卷功能,更具有可用于启动的磁盘快照技术,远程引导功能支持从远程直接启动磁盘快照恢复系统运行,无需要重新安装软件,不用等待数据恢复。P2V恢复启动磁盘快照恢复系统运行,无需要长时间转换文件系统,无需物理备机可在10分钟内就能从虚拟机上启动系统,快速恢复服务。DR容灾网关已经成为一种数据保护的高级形式,基于DR容灾网关技术的灾难备份技术已经成为一种全新的数据保护技术。相对于传统的数据备份与容灾方式,DR容灾网关实现了革命性飞跃:通过持续捕捉和连续跟踪数据块的变化,将现实数据与历史数据反映到各个保护层面,实现在本地与异地架构的瞬间恢复体系。强大的DR容灾网关技术不但可以充分地解决上面的问题,此外还有以下优点:完美结合虚拟技术,有效降低灾备成本,DR容灾网关与先进的虚拟技术无缝整合,在核心存储设备发生意外时可以用灾备存储设备取代核心存储设备,从而大幅降低了采购成本与维护支出,以经济有效的方式构建起异地灾备系统。传统备份只能从备份记录中确认备份工作成功,却不能保证数据能够用于正确恢复。DR容灾网关在服务器端就能快速转换为快照并浏览快照内容,通过ISCSI或FC与应用服务器连接,时间点磁盘快照技术直接检查快照瞬间恢复数据无需耗时恢复。系统扩展成本低,是一种一次构建长期受益的技术,在未来扩展时,无需要对基础架构进行改动,充分保护了既有的投资。全面支持开放的存储设备,所面向的对象也由集中存储的设备扩展到所有系统的各类存储。一体化的本地/异地备份与数据保护体系。采用DR容灾网关技术,可以很轻松拥有备份与数据实时保护的双重效果,进行恢复时你可以自主选择在本地还是在异地进行,而且其效果远远超过各类传统的灾难保护方式。易于维护,简单的图形化管理,可以对庞大的应用进行灾备部署和应急管理,也为过去代价高昂的灾备系统维护成本大大下降,应急效率大为提高。DR容灾网关通过快照代理保证数据一致性,可以快速访问数据的以前版本。多块磁盘的数据一致性,如果同时保护互相相关的多块磁盘、或多个分区时,可以将它们编组加入到同一组中,来对这个组施加同一快照操作;安全恢复,针对恢复可以设定Password,从而可确保恢复时能单独恢复通过认证的主机。在本项目中,通过快照代理内含的SQL/Oracle数据库支持选件保护业务服务器数据;对数据库数据可以在线进行备份;不但如此,也可以保护文件服务器、网站、财务服务器等服务器的数据。关键备份任务和软件模块的目标如下表所示:不同类型应用的DR容灾网关解决方案问题特点解决方案备注SQLORACLE数据库在线数据库的文件和日志始终处于打开状态快照代理(SnapshotAgent)套件,用于使数据库应用、电子邮件应用和文件系统在发生快照时暂时静止,从而确保捕获的快照的交易完整性可以对数据库中的表文件进行备份与恢复文件服务器读取或写入的文件处于打开状态可以为磁盘或数据卷提供连续或定制的块级保护(限于Windows版本)确保能被正确备份,不管处于何种状态操作系统的保护操作系统是应用的基础。操作系统的保护是应用数据保护的一个重要组成部分。对操作系统的保护主要有两个方面的要求:能有效保护操作系统相应信息,包括系统卷信息、+类注册数据库、活动目录、引导文件、注册表信息和系统文件等。在硬件损坏、系统崩溃、发生意外灾难、维护等时候能快速、正确地恢复系统到原先的状态。众所周知,操作系统中的系统信息,包括系统卷信息、+类注册数据库、活动目录、引导文件、注册表信息等是无法直接进行拷贝的,如果没有相应的软件支持,这部分的信息将随系统丢失而丢失。专用的DR容灾网关技术能充分支持本地、远程的服务器的系统信息,包括系统状态、系统文件、磁盘卷的信息、活动目录信息、网络磁盘信息、磁盘限额信息等等。这部分信息对于系统的恢复至关重要。在对数据卷做镜像的同时,DR容灾网关也可以对各应用服务器的系统卷进行全面全功能的镜像。利用该镜像,在应用服务器的本地硬盘损坏的时候,只需要使用一个可以引导的iSCSI协议/FC协议等HBA卡,将DR容灾网关内的系统卷镜像提升为生产卷,即可进行远程引导,立即重新启用应用系统。灾难的快速恢复根据XXXX电力公司的核心业务、数据保护设计要求,柏科数据DR容灾网关可以提供本地信息中心系统及数据实时保护方案。在灾难的恢复体系中,本地的恢复直接利用容灾网关所具有的瞬间恢复功能即可完成,而需要异地进行站点级恢复的恢复体系则涉及以下的组成部分:HA主机系统故障恢复存储恢复和提取数据库启动和应用启动文件丢失恢复操作系统的远程启动数据的远程接管HA主机系统故障恢复应用主机操作系统或应用系统出现故障时,可以快速通过柏科的容灾网关进行本地数据恢复如业务服务器已搭建HA双机环境,当服务器应用系统出现故障时,通过主机的HA集群系统可以从一个主机上切换到另一台主机上。当失效的主机修复后,只要加入到原有的集群环境就可以恢复到原先系统的运行状态。主磁盘阵列故障磁盘阵列的故障是一种极为严重的威胁,往往对于业务系统具有致命的杀伤力,经常导致许多业务系统的完全瘫痪。以往的各个行业的IT系统对付这类故障一般没有好的解决方法,都是采用备份系统花费大量的时间恢复到前一天的备份点,即无法达到RPO的数据保存指标,也无法达到RTO的业务恢复指标。本系统中,柏科的灾备架构完全解决了这一点。一旦核心的磁盘阵列故障,柏科的容灾网关设备会立即接替其运行,应用系统只需等待较短的挂起时间,因此,磁盘系统的故障已完全纳入了为无法造成业务威胁的范围,完全解决了众多IT系统的杀手问题。数据库记录丢失如果是数据库的部分表或记录受损,只需将前某一时刻点的数据逻辑快照提取出来(可以在本地也可以在异地),分配给原有主机,将数据库切换到这一时刻点的版本,然后导出所需的表或记录,再将数据库切换到当前数据状态,导入前一版本导出的数据,以恢复数据库受损的部分数据整个数据库出现错误,利用DR容灾网关,恢复当然也十分简单,只需要将指定时间点的快照mount上来,完整的历史点数据库就可以使用了,当然你可以抽取任何丢失的记录。文件丢失的恢复如果意外删除文件,或查询某一时刻之前的部分数据,通过DR容灾网关的时间点功能,可以针对某一主机数据所在的DR容灾网关管理服务器提供的逻辑卷进行自动快照生成,同时也可以在线将任意一个逻辑快照(历史点)提取出来,分配给所对应的主机,或其它同平台的主机,这份逻辑快照在主机看起来如同是前某一时刻点版本的所有数据。利用上述这一功能,如需要恢复部分受损的文件,只需在线的将前某一时刻点版本数据的文件通过主机直接拷贝到当前磁盘中,以恢复受损的文件。整个站点失效下的恢复当生产站点全部受损时(如停电、自然灾害等),利用在容灾中心的备用系统,先将相对应的应用生产磁盘卷提升出来,使其能直接通过FC交换机分配在灾备中心的备用应用主机,启动备用主机就可以恢复业务系统的生产。此时可以修复生产系统,当生产系统重新启动后,恢复到原有状态时,只需按照相对应的磁盘卷反向复制到生产中心的磁盘阵列中,待数据同步后,就可以切换应用到生产中心的应用主机上运行。操作系统的恢复(物理机直接远程启动)单机运行环境下,如果业务服务器硬盘损坏或系统故障导致业务服务器无法运行,可通过主机BIOS更改引导路径,从DR容灾网关上远程引导直接启动磁盘快照恢复系统运行,无需要重新安装软件,不用等待数据恢复。P2V恢复启动磁盘快照恢复系统运行,无需要长时间转换文件系统,无需物理备机可在5分钟内就能从虚拟机上启动系统,快速恢复服务。Windows主服务器文件丢失或损坏当发现Windows主服务器文件丢失或损坏时(包括数据库文件和应用程序文件),使用柏科的容灾网关恢复只需要3个步骤大约1分钟的恢复时间。柏科的容灾网关可以对镜像过来的生产数据做定时的256份快照,如果发现单个文件丢失或损坏,可以找到没有丢失的时间点提取快照,并分配给应用主机,然后在应用主机的磁盘管理中立刻就可以获取这一时间数据完整的磁盘。这种恢复方法十分直观,恢复十分方便。Windows的主服务器应用系统无法正常启动的故障恢复当主服务器由于主机升级或打补丁引起应用系统无法启动时或者由于磁盘阵列故障导致系统停止运行,可以直接利用柏科容灾网关进行远程启动(使用保存的可运行版本),恢复正常运行。用这种方法进行恢复非常迅速,因为备份的数据和生产系统数据格式相同,数据立即可用,与数据量无关,一般来说恢复的时间不会超过10分钟。Windows主服务器感染病毒后的故障恢复当主服务器感染病毒但无物理损坏时,也可以使用柏科的容灾网关进行接管和恢复。你仍然可以直接利用容灾网关进行远程启动(使用保存的可运行版本),恢复正常运行,也可以利用柏科所提供的恢复光盘,直接启动来自容灾网关的系统数据一键式还原。远程数据接管当生产站点全部受损时(如停电、自然灾害等),如果远程中心具备一套相似的备用主机系统,则可利用在远程中心的备用系统,先将相对应的应用生产磁盘卷提升出来,使其能直接通过FC交换机分配给远程中心的备用应用主机,此后,利用在远程灾备中心服务器保存的配置文件,直接将主机的应用环境切换到故障系统的配置状态,启动备用主机和数据库就可以恢复业务系统的生产。实时备份和容灾流程柏科的灾备方案实际上实现了本地的实时备份和异地的灾难备份,从逻辑上,可以看成由这两个部分组成。下面我们阐述容灾流程。在本方案中,我们在生产中心配置了1台DR4000容灾网关系统,实现对于生产系统的同步镜像基于IP环境的unix和windows系统的系统保护。第一步本地实现数据保护在增加了DR4000设备的新的存储架构下,系统首先在本地就提供了3种数据保护和恢复模式:磁盘镜像保护,有效抵御磁盘系统物理故障。对于数据库系统,我们采用了同步镜像技术,实现了“原主存储系统”到“容灾网关存储系统”的本地实时数据保护,这种保护模式可以有效应对存储设备的单点故障引起的数据灾难。在“主存储”系统发生设备故障时,容灾网关系统可以立即提供存储服务,保证应用服务的持续性。通过容灾网关设备提供的逻辑快照功能,可以获得多达256个快照。这种模式可以应对任何数据逻辑故障,包括:数据库逻辑错误、人为误操作和病毒等引起的数据库数据丢失、人为或病毒引起的数据库崩溃等故障。利用容灾网关快照,我们不仅可以对数据库各类错误实现快速恢复,还可以解决传统备份无法实现的数据库“表级恢复”。比如在误操作导致某个数据库表被误删除的情况下,不需要对整个数据库进行恢复,只需要从快照中提取丢失的“表”,把它恢复到还在运行的数据库中即可。需要说明的一个技术优势是:实现这256个快照全备份,并不需要其他备份方式那样需要的“256倍存储空间”,只需要增加大约50%的额外存储空间就可以满足所有备份的需要。有了这256个全备份的支持能力,我们可以非常方便的制定数据备份策略,根据需要,我们可以选择制定诸如以下案例的备份策略:每小时一次的快照(全备份),可以保留11天左右的历史数据备份,使得我们有能力追溯到11天以前的历史数据。这种模式可应用于大部分有数据备份要求的应用系统,其最大特点是,利用备份可以瞬间将数据系统恢复到60分钟之前的状态,结合数据库本身的日志功能,可以在较短的时间内恢复数据库系统。每10分钟一次的快照,可以保留2天的历史数据备份,使得我们有能力追溯到接近2天以内的历史数据。而且,柏科提供了精细日志恢复技术,甚至于可以在快照点与当前点之间,恢复到任何一秒钟的应用状态。第二步利用CDP实现本地数据的再利用本地保存的CDP数据是我们的有效数据资源,我们可以利用本地快照数据进行广泛的2次利用,我们可以根据需要,将快照数据“提供”给其他应用服务器系统,用于诸如报表生产、历史数据归档等用途,同时实现“ServerFree”的应用效果,也就是说,我们对这些数据的2次利用,技术上不会占用应用系统的主机资源。第三步远程复制和容灾在生产中心和灾备中心构建了容灾网关之后,远程数据实时备份或灾备就变得非常简单了。我们只需要在两地容灾网关上各增加一套持续数据复制模块“CDR”即可。柏科的远程复制策略分为三种:连续远程复制时间增量复制数据增量复制一般在宽带的远程传输系统上,可以采用连续方式传递,而在常规的广域网络中,则建议采用定时增量的方式传输。我们以定时增量传输方式为例进行过程描述。本地容灾网关数据保护器将时间间隔内的差量block(利用了snapshot缓存区)经由TCP/IP传到远端的容灾网关中。远端容灾网关先将数据放入暂时存储区中,待确认所有数据均传输无误后,才确认完成,否则需重新续传。远端容灾网关将暂时存储区中的数据写入到对应的逻辑卷中。远端容灾网关可搭配快照提取功能进行快照的提取。柏科的远程复制拥有极大的优点: 柏科的replication经由TCP/IPWAN传输,因是标准的协议,故可由两台容灾网关的网卡直接传输。一般传统灾备技术中的磁盘阵列的replication则由两台磁盘阵列的控制器经WAN专线传输,不论是透过磁盘阵列的ESCON接口或FCswitch的光纤端口,都必须搭配一对非常昂贵的gateway网关转WAN来传输,导致其建设、管理与维护成本大幅提高。柏科容灾网关的replication利用了microscan技术进行小单元数据传输(传输单元512字节为单位

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论