同城应用级灾备建设项目可行性报告2016-4-25.doc_第1页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

江苏长江商业银行同城灾备建设调研及可行性报告我行科技信息部在项目启动后,主要完成了以下几个方面的工作:一是学习了监管机构对于业务连续性和灾备中心建设的相关要求和规范。二是先后与省内多家金融机构进行了沟通交流,取得了其它金融机构在灾备中心建设中的成熟经验和做法。三是与国内多家较大的系统服务商和云计算服务商进行了技术交流沟通,了解当今主流容灾技术、云计算技术和虚拟化技术的现状和发展趋势。四是和省内多家数据中心外包服务商进行了沟通交流,了解数据中心基础环境设施、外包服务资源、运维服务能力,调研结果及项目可行性报告如下:一、我行同城灾备中心建设必要性(一)、不断提高的业务连续性要求信息系统安全运行是企业正常生产的基础,随着我行规模的逐步扩大,各种金融应用、支付手段、服务渠道不断增加,对业务连续性的要求也越来越高,任何重要交易系统的非正常停运,都会对企业的声誉产生非常严重的影响,甚至可能造成无法预测的重大损失。由此可见,信息系统的安全及业务连续性直接关系到客户和切身利益和银行生死存亡。所以,建设切实有效的同城应用级灾备中心对我行极为必要的。若生产中心发生不可恢复故障或灾难,同城灾备中心可迅速恢复接管生产运行并实现业务办理,能极大地提高业务持续运行能力,降低信息系统安全风险。(二)、监管机构对灾备建设的要求监管机构对我行的业务连续性风险管理非常重视,。2015年江苏省法人银行金融机构信息科技风险管理指导委员会全体会议中,银监局指出的辖内金融机构信息科技现存的问题,列举了各家金融机构科技信息建设和风险管理方面的不足。并且,省银监局潭局长要求我行务必于2016年启动同城灾备系统建设,全面提高我行信息科技抗风险能力,要及时启动构建同城灾备中心,发挥其接管业务、延续业务和双活运行的作用。我行高管层组织了科技部门负责人,认真学习了省银监局潭局长在会议上的讲话,根据省我行董事会和高管层非常重视监管领导提出的同城灾备中心建设意见,已把同城灾备中心建设列为我行全年的重点项目之一。二、项目背景及实施资源调研情况(一)、监管机构相关规范要求一直以来,监管部门对银行业务连续性风险管理和灾备建设工作高度重视,在灾备建设方面,通过以下相关文件进行规范管理。1、2003年,中央办公厅、国务院下发的国家信息化领导小组关于加强信息安全保障工作的意见,对基础信息网络和重要信息系统灾难备份恢复作了原则规定,第一次提到了重要信息系统需要具备灾难恢复能力。2、信息安全技术信息系统灾难恢复规范(GB/T20988-2007)于2007年颁布,是灾难备份与恢复的第一个国家标准。3、2008年,人民银行颁布了银行业信息系统灾难恢复管理规范(JR/T0044-2008),针对银行业灾难备份与恢复制定了规范。4、银监会2010年下发的商业银行数据中心监管指引(银监办发【2010】144号,对商业银行灾备中心建设有明确要求:商业银行应于取得金融许可证后两年内,设立生产中心;生产中心设立后两年内,设立灾备中心;总资产规模在1000亿元人民币以上且跨省设立分支机构的商业银行应设立异地灾备中心,灾难恢复等级达到信息安全技术信息系统灾难恢复规范中的第5级实时数据传输及完整设备支持,必须建立起完善的灾备体系和业务连续性保障体系。其它法人商业银行应设立同城模式灾备中心并实现数据异地备份,重要信息系统灾难恢复能力应达到信息安全技术信息系统灾难恢复规范中定义的第4级别(含)以上。相比较而言,国标信息安全技术信息系统灾难恢复规范(GB/T20988-2007)和商业银行数据中心监管指引(银监办发【2010】144号)两文中的内容细致清晰,便于执行机构参照实施落地,通过调研省内其它金融机构了解到,大部分银行机构都遵从上述两文件实施灾备系统建设和管理。以我行现在的资产规模,整体灾备建设级别需要遵从商业银行数据中心监管指引(银监办发【2010】144号):应设立同城模式灾备中心并实现数据异地备份,重要信息系统灾难恢复能力应达到信息安全技术信息系统灾难恢复规范中定义的第4级别(含)以上。RTO(灾难恢复时间)应为数小时至2天,RPO(数据丢失时间)应为数小时至1天。(二)、省内金融机构同城灾备中心建设情况江苏银行:生产中心位于南京市徐庄软件园,同城应用级灾备中心位于南京市洪武北路,距离约为15公里,采用了裸光纤和华为DWDM技术。异地应用级灾备中心位于苏州市,实现了核心及重要系统的应用级同城和异地容灾。南京银行:生产中心位于南京市中山路,同城应用级灾备中心位于一街之隔的汇杰广场,采用了裸光纤及EMC存储底层复制技术,实现了数据实时同步。异地灾备中心位于山东日照,采用了存储异步复制技术,重要生产系统实现了异地应用级灾备。苏州银行:生产中心和同城应用级灾备中心都位于苏州市区,两数据中心距离约为9公里,采用了裸光纤及存储底层复制技术,异地应用级灾备中心位于深圳。江阴农商行:生产中心和同城应用级灾备中心都位于江阴市区,两数据中心距离约为8公里,采用了裸光纤及存储底层复制技术,异地数据级灾备中心位于江苏淮安盱眙市。江南银行:生产中心和同城应用级灾备中心都位于常州市区(灾备机房现使用电信机房过渡),采用了裸光纤及存储底层复制技术,异地灾备中心正在筹建中。昆山、太仓农商行:两家农商行都将同城灾备设备托管到对方的数据中心机房内,采用了裸光纤及存储底层复制技术,重要应用系统实现了应用级灾备,异地灾备中心正在规划筹建。江苏省农村信用社联合社:生产中心和同城应用级灾备中心都位于南京市区(河西新大楼与虎距路),距离约为7公里,采用了裸光纤及存储底层复制技术,异地数据级灾备中心位于无锡市,异地灾备中心正在实施由数据级升级应用级的建设中。通过调研了省内多家银行灾备建设情况了解到,省内大部分金融机构都完成了同城应用级灾备系统的建设,可实现核心重要应用系统的同城应用级切换接管,同城应用级灾备主要采用了裸光纤(部分使用了光纤DWDM复用技术)和存储设备底层复制,实现了数据同步复制不丢失。规模较大的机构实现了异地应用级灾备,规模较小的机构实现了异地数据级灾备。(三)、省内可使用的数据中心机房情况科技部对总行周边150公里内可提供环境外包服务的机房资源进行了调查,可以提供机房外包服务的机构有以下四个:万国数据苏州、苏州国科、无锡国际数据中心、泰州电信云计算中心。万国数据GDS苏州昆山数据中心:该数据中心物业产权归属万国数据公司,位于昆山市花桥镇国际商务城,占地30亩,距离我行约150公里,建设标准为T3+级,总投资约9亿元,机房面积约为8千平方米。现已有百度、腾讯、美洲银行、巴黎证券等机构外包入驻。万国数据提供容灾咨询、虚拟主机租赁、基础设施及设备运维服务。科技信息部王珂、孙宏祥、薛锋于2011年现场参观了该数据中心。苏州国科苏州园区数据中心(简称SISDC):该数据中心物业产权归属于苏州工业园区政府,是为园区外资企业服务的基础设施服务平台,位于苏州市工业园区,距离我行约130公里,建设标准为T4级(国际标准ANSI/TIE-942-2005中最高级别),机房面积约为1.2万平方米。该中心目前托管外包运维了已有近八十家国际大型外资企业的IT基础设施设备。无锡国际数据中心:该数据中心物业产权是中国电信无锡分公司,位于无锡市滨海区,占地65亩,距离我行约70公里,按照T4级标准建设,机房面积约为1万平方米。该中心目前托管外包运维了近百家企业及金融机构的IT基础设施设备(托管了江苏银行异地数据级灾备设备)。泰州电信云计算中心:该数据中心的物业产权归属于泰州市医药城管理委员会,电信泰州分公司租赁该建筑并建设了该数据中心提供外包服务。位于泰州市海陵区数据大厦,距离我行约70公里,总投资约为8000万元,机房面积约为2000平方米。该中心目前托管运行泰州社保局、泰州市地税局等二十多家机构的IT基础设施设备。科技信息部王珂、薛锋于今年4月份现场参观了该数据中心。靖江电信公司机房:该数据中心的物业产权归属于靖江电信公司,位于靖江人民路,距离我行约1.5公里,机房面积约为400平方米。大楼承重、供电、接地防雷设施的建设标准较高,但内部设施陈旧,托管了几家靖江地区的网络公司设备,靖江电信公司计划于近期对该数据中心重新装修。通过调研上述个IDC外包数据中心了解到,上述机房中,万国数据苏州、苏州国科、无锡国际数据中心机房的建设标准非常高,泰州电信云计算中心机房相比较上述三家稍有差距,上述四家机房都能满足我行灾备系统设备运行条件,也能满足监管机构对于机房建设标准的要求。并且上述四家公司均能提供场地外包、虚拟主机租赁、基本的设备运维服务。所有服务商均不提供应用软件、数据库系统的运维服务。靖江电信公司机房若能按照较高标准重新装修,也可以考虑做为同城灾备机房。三、可选择的同城灾备复制技术灾备系统的关键复制技术,就是将生产中心的数据,完整、完全、及时地复制到灾备中心的复制工具。选择何种复制技术,将决定灾备系统的RPO值。通过与同业金融机构交流和沟通,目前应用比较多的技术包括以下几大类。(一)、基于存储设备的底层复制技术这是国内金融机构最常见的同城容灾复制技术。由存储厂家提供专用的底层技术及软件,实现生产中心存储设备与灾备中心存储设备的直接镜像,将数据以同步或异步的方式复制到远端。距离较近时,多采用光纤方式连接,距离较远时采用网络连接时,就只能实现数据异步方式复制。省内其它金融机构,如南京银行、苏州银行等,同城应用级灾备系统用的就是EMC公司的SRDF存储底层同步复模式。优点:该复制技术的日常管理极为方便,数据复制稳定,对主机系统的资源没有影响,同城采用光纤时可以做到数据实时同步零丢失,该技术非常成熟并且应用广泛,实施同城灾备使用的效果最好。缺点:必须在本地端和灾备端分别配置两套相同品牌的存储系统,软硬件投资较高,若实施同步模式必须使用光纤连接并距离不能超过40公里,数据同步对生产端的存储性能有影响。(二)、基于存储虚拟化的复制技术随着存储技术的发展,为灾备系统建设提供了多种可选的容灾技术。存储虚拟化复制这是近年来兴起的一种容灾技术,该技术通过安装在服务器或专用装置上的软件,对存储设备进行虚拟化进行统一管理及远程复制。优点:实施成本相对较低,能兼容不同厂家的存储设备。由于对存储实施了虚拟化管理,存储资源池的镜像、扩容、复制等操作管理异常简单。缺点:需要专用的设备或带复制功能的SAN交换机,对网络要求较高。并且存储虚拟化的厂商和标准较多,该技术更换换代发展迅速。若要实现数据同步复制,就必须使用光纤连接且距离不能超过40公里。(三)、基于数据库的复制技术基于数据库的容灾技术主要是指是数据库层面的复制软件,通常采用日志复制功能,依靠本地和远程主机间的日志归档与传递来实现两端的数据一致。该技术与存储类型以及主机服务器平台类型无关,有较好的灵活性。优点:软件成本较低,部分软件免费。复制数据占用的网络带宽较小,灾备端的数据库随时可用。缺点:每一个数据库均需要安装一套复制客户端,占用部分生产系统数据库资源,实施和维护成本较高,数据复制日常管理维护非常麻烦,并且有丢失数据的可能。而且只能复制数据库,虚拟化环境和主机操作系统还需要使用其它方式进行远程复制。(四)、复制技术选择和灾备距离之间关系每种容灾复制技术都有自身的技术特点和应用局限性,数据复制技术的选择,都会对灾备系统最终效果以及基础设施架构造成重要影响。但生产中心与灾备中心之间的距离,决定了采用何种网络方式连接以及带宽,并对数据复制技术的选择有决定性的影响。通过与多家集成公司交流,有以下几点经验:1、不管基于什么技术方案,数据复制都是依赖网络,网络带宽可以不断的扩大,而光纤网络随着距离的增长带来的延时问题是物理学上的限制,现阶段无法解决。2、若要实现同城灾备中心数据与生产中心数据同步,两个数据中心之间必须有非常高的网络带宽,一般使用裸光纤连接,并且由于光的延时问题,光纤距离不能超过40公里。3、同城应级级灾备建设中,数据实时同步的复制技术一般采用存储底层复制或虚拟化复制,数据库复制技术由于对维护人员要求很高,后期维护工作量大,故较少使用。综合上述分析得知,根据上述的灾备数据中心距离决定了数据复制是否同步所以,我行的同城灾备项目若实现数据实时同步,灾备中心与生产中心当距离必须小于40公里,并且两中心使用祼光纤连接,根据前文中对周边地区机房资源情况的调研,只有靖江电信机房在距离方面符合要求。三、我行同城应用级灾备中心项目建设思路(一)、建设必须能有效接管的应用级灾备系统根据董事会和行领导的要求,我行建设的同城灾备系统为应用级,该灾备系统建设完成后,我行将能使用该系统进行业务真实切换,防范生产中心发生的灾难事故风险,而不是仅仅只是为满足监管的要求。(二)、做好前期的规划工作,兼顾技术发展趋势,采用先进成熟的技术 近年来,主机虚拟化、存储虚拟化、云计算、分布式架构等IT技术发展非常迅猛,随着云计算技术发展和应用的深入,未来的生产和灾备中心很可能都将在基于云来建立,大部分企业都不再需要单独建立数据中心。所以,我行的同城应用级灾备项目实施过程中,应分析上述技术在我行灾备系统建设中的落地使用,应综合考虑整体基础设施和技术架构,通盘考虑现在信息系统基础架构的迁移改造,生产和灾备系统的应能满足未来互联网金融平台易于扩展、易于管理、快速部署、高度冗余等要求,采用较先进成熟的技术实现应用级灾备,考虑到我地将在新大楼内建立新数据中心,本次同城灾备系统的技术选型,应为今后两地三中心模式和双活数据中心建设过渡打好基础。(三)、综合考虑投入产出比,建设适合我行的灾备系统建设灾备系统需要周密规划,除了要考虑技术实现外,还要考虑各类业务的不同需要;除了考虑资源投入外,还要考虑产出和利用;除了考虑通用的灾备模式,还要考虑自身的技术和管理能力。总之,没有所谓最好的灾备系统,只有最符合自身需要的灾备系统。目前,国内银行在进行灾备体系建设时一般有自建和外包两种模式,各有优缺点。自建具有较高的可靠性与安全性,但投入大、周期长,对银行技术人员的能力要求较高,适用于大型金融机构。外包是指由专业服务商提供基础环境外包和设备运维服务,此模式的投入小、周期快,对银行人员能力要求相对较低,适用于中小型金融机构。项目组认为,在我行现有的技术能力和资本规模情况下,选用外包模式应是比较好的选择。(四)重视灾备管理体系建设灾备系统建设只是提供了技术和设备上的保障。灾难情况下,灾备中心可将信息系统恢复,但是行领导的决策和组织、监管机构的报告和指导、相关部门的有效沟通和协调、业务数据的完整性检查和交易补录、各个条线业务部门有效业务恢复预案和相应的演练验证体系也同样重要。随着灾备建设的逐步完善和演练等多作的开展和深入,只有所有相关人员都掌握相应的预案和流程,把灾备和业务连续性当作常态化工作,才能真正保障在灾难和系统严重故障时,整个业务连续性体系有效运作和快速恢复。所以,灾备系统能否取得预期的效果,灾备管理体系的建设是非常重要的,项目组需要制定切实可行的应急预案、详细的业务连续性计划,需要行领导班子的高度重视、相关业务部门的积极参与和掌握,保证在生产中心停运后,各个方面能各司其职、有效组织、高效协同地完成业务恢复。四、应用级灾备建设前的工作目前我行的基础技术架构于2011年制定并部署,五年以来基本没有经历大的变更升级,随着近期互联网平台应的大量批量上线,同城应用级灾备的规划实施,都需要对我行现有主机资源、存储资源、网络管理、网络安全等基础架构进行大范围的优化调整改造,以满足业务部门不断快速增长的计算、存储、网络和安全要求。我行应用系统之间的基础资源相对独立,不能实现共享、整合计算和存储资源,安装、部署新服务器、存储和应用所需的时间长,不能灵活快速地对新的业务需求做出响应,复杂的 IT架构和大量的服务器也让运维人员力不从心。由于大量使用物理主机,设备管理员也无法迅速为负载大的应用服务器动态增加 CPU和内存资源。项目组通过与多家公司分析了现有的系统架构后认为,云计算技术可以极大提升我行IT资源管理水平,随着云计算等技术在互联网企业和金融机构部署应用表明,云架构是金融机构IT基础设施的必然方向,主机的虚拟化、存储虚拟化实施部署是云计算落地应的基础。在我行灾备项目实施前,建议可以先行实施主机虚拟化整合、存储虚拟化(云存储)集中化整合、主机地址域名化整合、全行计算机域控制器管理、网络安全检查规划工作。(一)、主机系统虚拟化整合(云计算)主机虚拟化是建设企业私有云平台的第一步,我行于2015年底通过实施管理系统主机虚拟化平台,取得了非常良好的效果,随着网贷平台等系统对主机资源的大批量需求,我们认为实施数据中心主机虚拟化整合是非常必要的,意义如下:(1)解决了我行现有机房承载能力不足问题,并能极大减少了服务器采购及投资。科技部去年通过实施管理平台主机的虚拟化项目,已将15台物理主机退出了生产,只使了三台服务器进行了替换,若未来完成核心区和外联区服务器虚拟化整合,将减少约40台物理机设备,节省了大量的能源、空间和成本。(2)极大地提高了服务器的高可用性、安全性、资源利用率和扩展性。物理主机故障后,集群切换时间约为3分钟,而虚拟化主机集群切换时间约为秒级,并且主机资源利用率也大幅提高。虚拟化把资源切割为更小的、可以更好调度的资源单位,以达到调度过程中充分利用硬件资源的能力,从而使金融业数据安全性得到增强、信息共享速度得到加快、服务质量得到提高、运营成本得到降低等。(3)极大地提高了运维管理效率,提高数据承载能力和处理能力。主机虚拟化部署后,使运维人员能够从业务需求出发,快速按需配置所需要的资源,生产开发测试环境的操作系统、数据库、中间件的安装均可以实现几分钟内完成,这极大地提高了运维人员和开发测试团队的工作效率。(4)主机虚拟化可极大简化同城灾备的实施和管理难度由于我行现阶段管理系统服务器均采用了物理机,大部分采用热备或冷备方式,现有的架构下,灾备端也必须配置相同数量的服务器,实现同城操作系统级复制的代价高昂,实施备份和灾备的难度较大。生产中心的物理设备故障后,灾备中心恢复生产系统的难度非常大,所需恢复业务的时间也较长。通过实施主机虚拟化,生产与灾备中心主机操作系统可以做到即时同步,灾备中心的主机可随时启动接管应用。(二)、存储系统的虚拟化或集中化整合(云存储)根据董事长的总体部署,微利贷、网贷平台等互联网应用的快速上线,打造一个线上的长江银行的战略正在逐步推进,可以非常明确的是,今后我行业务数据量将快速爆发式地增长。我行现有3台中端存储阵列有,其中2台为IBM-DS5100(核心、重要应用、管理系统使用),1台是华为5500V3(管理系统虚拟化使用),为网贷平台等系统上线时,需要对两台DS5100存储进行一次扩容,为了同城容备以及后续数据量的爆发式增长,需要在灾备实施过程中将存储进行统一整合,通过存储集中化或者存储虚拟化方式解决容量不足和数据复制问题。(三)、主机的地址DNS域名化整合DNS(Domain Name Service)它的作用:将域名翻译成IP地址。这样用户在浏览器中输入域名,通过DNS知道用户请求的目标服务器,然后才将对应的内容返回给用户。另外,DNS系统还可以为灾备提供支持,简化灾备流程,缩短业务恢复时间。部署DNS系统能全面规范行内主机IP地址及域名的管理,推动IT系统访问的规范化,方便应用系统的部署和变更,从而保证应用系统在迁移过程中的访问连续性,降低系统切换的风险。(四)、全行计算机域控AD管理我行现在的办公计算机是分散的管理模式,每一台计算机都是独自自主的,用户账户和权限信息保存在本机中,同时借助工作组来共享信息,共享信息的权限设置由每台计算机控制。域管理就是通过域控制器来管理域中的计算机,实现的是主/从管理模式,通过一台域控制器来集中管理域内用户名和权限,用户信息保存在域控制器内,共享信息分散在每台计算机中,但是访问权限由控制器统一管理。通过域控方式管理全行员工电脑有以下好处:1、基于AD域模式可以实现了集中式管理,以前在每个员工的客户端要重复多次的设置,只要在域控制器上做一次设置就可实现,极大地减少了管理员的工作量。2、原来是工作组每个人都是本地计算机的管理员,但在在域模式下,普通的员工对于客户机的权限很少,失去了对办公计算机的控制。3、AD是一个大的安全边界,员工只要在登录时验证了身份,这个域中所有允许访问资源都可以直接访问,不用再做身份验证,提高的效率减少了维护成本,为今后统一身份认证打下基础。4、每位员工都能通过文件夹的重定向把重要文件存放至服务器上,重要文件可以实现集中备份,不用担心客户端重装和故障造成文件丢失产。并且,员工在域中任何计算机登录都可以找到自己的文档,实现文档跟随着用户的走。五、项目总体推进计划灾备系统建设是项庞大的系统工程,涉及面广,技术难度大,建设周期长。灾备体系建设的每一项任务,都需要我行科技部门和各业务部门的充分配合,项目总体推进计划如下。(一)、完成基础设施的资源规划整合工作1、计划在五月底前完成主机虚拟化平台的规

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论