数据集中模式下运行维护体系建设.doc_第1页
数据集中模式下运行维护体系建设.doc_第2页
数据集中模式下运行维护体系建设.doc_第3页
数据集中模式下运行维护体系建设.doc_第4页
数据集中模式下运行维护体系建设.doc_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据集中模式下的运行维护体系建设当前基层人民银行计算机应用系统的数量在迅速膨胀,应用系统随着其功能的不断完善日益复杂,管理成本也不断增加,基层人行的科技工作强度逐年增大,而大多数中心支行存在科技队伍结构不合理, 面对越来越多的各种应用系统,在管理上常常是心有余而力不足。经过几年实践证明, 这种以地市中心支行为基础单位分布构建的分布式的系统模式带来许多负面效果,基层人行存在的科技风险越来越大。主要表现在以下几个方面:1)计算机资源利用率低。分散的数据、分散的技术力量导致机器、软件系统资源不可共享,各地区管理水平不平衡。2)越来越多的业务系统带来的沉重维护压力,使得力量相对薄弱的基层人行科技人员不堪重负,增加了计算机系统的运行风险。3)分散的数据存储增加了数据安全性、完整性的风险。4)软件需要分散地重复投资,开发、安装及维护费用急剧上升。5)没有形成数据集中及应用集中,因此无法快速有效地为管理者提供辅助信息,信息共享不及时。6)无法承受灾难备份的投资,在众多分散数据中心的条件下,实施灾难备份的费用非常庞大。由于基层人行计算机网络设备维修困难,缺乏应有的备份,一旦遇到设备损坏或其他紧急情况,往往不能及时应对处理。7)计算机安全意识风险。部分计算机操作人员缺乏基本的计算机安全知识,对计算机安全不重视,违反计算机操作规程的情况时有发生, 客观上为某些人利用工作便利进行计算机犯罪提供了方便。8)在硬件投入较大的情况下,中心支行在自身能力的限制下难以充分发挥硬件设备的作用,优化系统的性能。在系统维护方面,系统监控和维护还处于手工阶段,监控内容少;故障发现不够及时,故障处理依赖于个人因素;流程不规范、不完善。为了解决这些运维管理中的问题,满足系统管理的需要,有效防范和及时化解系统风险,就需要改变人民银行目前的分布式的系统模式,实行数据集中,并建立与之相适应的运行维护体系。目前,我国多数商业银行已经实现了以省为单位的数据集中或大的区域数据集中,部分商业银行已经在全国范围内实现数据集中处理。银行业的数据集中处理已经成为银行业务发展的大趋势。近年来,人民银行开发、推广的一些应用系统逐步开始采用物理数据集中模式和应用处理集中模式,实现集中管理,提高了效率,降低了业务风险。例如人民币个人结算账户管理信息系统采用了物理数据集中模式,它以省直辖市为单位,以分行和省会城市中心支行为数据处理中心,地市中心支行不再保留本地数据库,系统的安装、维护、升级变得更为简单方便,对硬件设备的要求大大降低,有效地防范和化解了系统风险。一、数据集中的优势数据集中管理给人民银行信息科技的发展带来了许多新的挑战,同时,网络技术的日趋成熟也为实现数据集中管理提供了条件。数据集中的优势体现在以下几个方面:1)跨地区数据交换更迅速、更可靠。把原来异地之间通过数据交换进行的交易处理变成一个中心中的数据处理,使时效性、可靠性、数据一致性的问题都得到圆满解决。2)减少了低水平重复建设,节约了成本。通过将数据集中到中心支行等几个大的数据中心,取消地市级支行的数据中心,从而减少了数据中心数量,可以在很大程度上减少低水平重复建设,并能统一实施数据的灾难备份,降低了建设和维护成本。3)提高了数据的一致性、完整性。目前的分布式处理系统仍存在交易不畅、可靠性差等问题,虽然网络硬件技术的发展使这种状况大有改观,但如何保证两地数据一致性仍然没有可靠的技术解决方案。随着金融行业内部竞争压力不断加剧以及对人民银行金融服务要求的不断提高,跨地区的数据交换势必增多,从目前技术状况来看,只有将数据集中处理,才能保证数据的一致性、完整性。4)实现集中管理,提高了效率,降低了业务风险。随着人民银行业务的发展,越来越需要加强对各分支机构的管理。数据集中有利于适应管理和业务工作“扁平化”模式发展需要。为提高管理和业务工作效率建立“扁平化”工作模式已经日益成为各行各业适应现代社会发展需要的一个重要目标,而实现数据集中,减少中间环节,正是以信息为中心的业务工作扁平化的重要支撑。数据集中后,可以对各机构的报表以及各类数据资源进行有效的管理,同时还能杜绝假账、假表、假数据,保证统计数据高度的真实性、一致性、完整性和准确性。内部风险可以得到有效的、及时的控制。5)提高了系统的可靠性和安全性。系统安全建设是信息化建设的一个重要组成部分,涉及到网络安全、操作系统、数据安全和管理制度等方面其中数据安全建设是核心。数据集中处理有利于制定各种安全管理制度便于系统维护和系统访问控制,符合提高系统安全性的要求;同时数据集中便于实施相应的数据备份和系统容灾方案。数据的安全性大大提升。6)有利于集中科技力量,合理配置人力资源。人民银行的业务处理系统总是需要一定数量的科技人员去维护,同时还需要相当数量的软件开发人员拓展业务,开发新的业务处理系统。在分布式系统中,各基层单位都要组织一定数量的科技人员做系统维护工作,一方面造成了计算机专业人员的浪费,另一方面在部分基层人行难以具备合格的维护人员。只有数据集中才能集中科技人才力量,实现人力资源的有效配置。例如,工行数据大集中后,成立了珠海软件开发中心和北京、上海、广州、杭州四个软件研发部,集中了全行软件技术人员,采用现代的工业化软件开发模式,提高了软件开发效率,提高了质量,工行在短时间内就可发表一个新软件产品,并且立刻可在工行全国范围内推广应用,而各地已不再有对主机的维护要求。7)有利于数据挖掘和分析。业务系统中,积累了大量历史数据,这些历史数据对管理决策有很大帮助,但由于数据量庞大,数据分析手段少,在现行数据分布存储的情况下,数据挖掘和网上统计分析很难开展,基层单位常常为填写报表伤透脑筋,而且统计数据也很难保证其准确性。数据的集中处理将使数据分析更准确、更具有普遍性。数据集中后,利用数据仓库和OLAP(联机分析处理)等相关技术,实现数据挖掘,提供决策支持系统,数据集中保证了分行拥有最新最全面的数据,可以很方便地开展数据挖掘和网上统计分析这将使数据统计分析工作迈上新的台阶。二、数据集中产生的问题和风险数据集中处理策略在带来许多优势的同时也带来了一些问题,产生了许多隐患。随着数据的大集中,信息技术风险大大增加,对技术,业务和生产运营的统一规范管理提出了更多更高要求,对软件开发和系统运行的质量要求大大提高,对数据安全和灾难备份的保障要求更是刻不容缓。1)中心服务器的压力大大增加,选用性能一般的服务器可能无法承担集中处理带来的压力。随着应用规模的提升、扩大,对中心服务器的配置要求会越来越高。2)中心的网络压力大大增加,有可能造成网络的堵塞随着今后应用规模的不断提升,图像、视频等大数据传输将对网络产生压力,当所有的压力集中到中心这一点时就可能造成中心的网络堵塞。3)中心数据库的压力大大增加,如果处理不当,有可能数据库性能骤减、甚至无法使用。由于数据量和并发用户数的骤然增加,中心数据库承担了巨大压力,因此如何保证中心数据库的处理性能至关重要。这就要求数据库管理人员能够根据要求在数据库设计、维护方面尽量优化,提高性能,同时在应用模式上采用中间件技术和三层架构(即数据库服务器,应用服务器、客户工作站),实现负载均衡,提高并发处理能力。如果仍然使用原有的一些老应用系统,由于体系结构的原因,如采用客户机服务器二层体系结构,在大规模应用时会直接对数据库产生巨大压力,同时数据库服务器过于暴露,安全性受到影响;此外,数据库结构设计时使用不当的数据类型和存储方案也很有可能导致数据库性能降低。4)对应用软件开发质量的要求大大提高。一些不成熟的应用软件可能对中心服务器的性能产生巨大影响,导致其它系统无法正常运行多个应用在大集中数据库系统中运行,就很有可能发生一个应用出现问题,其它的应用也就受到了影响例如,如果某个应用系统在数据库设计时性能没有调整好,或者其应用程序的SQL(数据查询)语句没有注意优化,处理效率低,就可能造成整个数据库性能骤减、甚至无法使用5)系统安全管理压力加大。安全的威胁主要来自以下几方面:(1)系统自身软硬件故障造成的不能正常工作和数据丢失(2)自然灾害和客观环境的影响。(3)计算机病毒感染、恶意破坏和攻击。(4)信息保密需求,以及访问控制和管理。(5)内部人员滥用权力、越权访问机密信息或篡改数据。为此,分行科技工作的责任更加重大,数据丢失、涉密信息外泄或数据被非法修改可能导致责任追究。分行科技处必须加强安全技术保障,规范管理制度,强化督促检查严禁无关人员随意出人中心机房,加强物理运行环境监控,坚决防止火灾等灾难发生。三、构建与数据集中相适应的运行维护体系数据集中后运行维护管理的内容大大增加,大量的设备需要维护,系统的网络、主机,数据库、中间件和应用需要监控,而目前系统监控和维护还处于手工阶段。监控内容少,故障发现不够及时故障处理依赖于个人因素,流程不规范、不完善。为了解决这些运维管理中的问题,满足系统管理的需要,有效防范和及时解决各类故障统一规范业务部门的问题反馈渠道,有效控制日常维护工作的流程,变被动服务为主动服务提高维护管理水平,为业务运行及发展提供有力的技术保证,因此建立一套适合实际情况的规范化、标准化、高效的运行维护体系对于保证系统的安全稳定运行有着非常重要的意义。为此,分行科技处需要转变思想,进一步搞好队伍和制度建设,借助先进的技术手段和工具,实行预见性维护、预防性维护和预警性维护,进一步减少系统风险,保障分行各项工作的正常开展。1、数据集中模式下运行维护体系建设的目标按照总行的规划,通过建设规范化、标准化的一体化运运行维护体系,规范分行数据中心的运行维护工作;保障人民银行数据集中条件下网络和应用系统安全、稳定、高效、持续运行;整合并统一管理全省的技术和技术服务资源,实现资源的优化配置,降低运行维护成本;实现运行维护工作标准化,提高整体运行维护水平和效率;为全行员工提供高效、便利、全方位的技术支持服务,提供良好的办公环境;促进分行系统运行维护工作知识共享和交流,加强运行维护工作人才队伍建设。2、数据集中模式下运行维护体系架构运行维护体系由运行维护制度、运行维护流程、运行维护组织和队伍、运行维护手段和工具以及运行维护对象等组成,即“制度”、“人”、“技术”、“对象”四类因素。制度是规范运行维护管理工作的基本保障,也是流程建立的基础。运行维护组织中的相关人员遵照制度要求和标准化的流程,采用先进的技术手段和工具对各类运行维护对象进行规范化的运行管理和技术操作。图1 XX分行运行维护体系XX分行运行维护体系是以系统监控、运行维护管理为核心手段,以控制故障发生和性能优化为基本目标,首先对生产环境的网络、主机、数据库、中间件、应用程序等重要环节实现自动的、集中的监控,对系统运行中出现的异常情况具有预警和报警功能,便于系统维护人员全面、及时了解系统运行状况提高系统的故障应急处理能力。在系统监控逐步完善的基础上以运行维护管理中的流程管理为理念,建立运行维护管理平台,规范服务台管理、故障管理、问题管理、变更管理、发布管理、配置管理、资产管理和知识库管理的流程,提高整体的应用服务水平和服务能力(图1)。2。1运行维护制度建设总结现有的运行维护管理经验,遵照国内外相关运行维护标准,按照总行的要求,结合我行的实际情况,统一制订运行维护管理制度和规范。通过定期和不定期的检查,促进各项制度规范的贯彻落实,从而建立标准的、规范的运行维护管理工作方式。运行维护制度的建设是一个长期的、不断完善的过程,需要在实践中不断的摸索探讨。同时,随着人民银行XX分行信息化建设的不断发展,也要保证各项制度的及时更新。制度体系内容要涵盖机房管理、网络管理、资产管理、主机和应用管理、存储和备份管理、技术服务管理、安全管理、文档管理以及人员管理等类别。需要制定的主要流程规范包括问题管理规范、变更管理规范、配置管理规范、知识库管理规范、测试管理规范、数据管理规范、资产管理规范等。2。2运行维护组织和队伍针对人民银行两级数据中心的运行维护工作要求,在总行科技司指导下,XX分行科技处负责本辖区数据集中处理的应用系统和分行开发的应用系统部署和运行维护;承担辖内网络的运行管理;遵照总行制定的相关制度、规范和流程建立辖内运行维护体系。XX分行科技处根据运行维护服务工作内容和流程确定各项工作中的岗位设置和职责分工,并按照相应岗位的要求配备所需不同专业、不同层次的人员,组成专业分工下高效协作的运行维护队伍。2。3运行维护服务管理XX分行的运行维护服务管理包括监控管理和运行维护管理平台。监控管理是运行维护服务管理的基础和信息来源。从运行维护的流程来说,服务请求首先提交到运行维护管理平台的服务台,如图2所示。对于现有知识库不能解决的问题被传递到相应的二线技术持,二线技术支持包括运行技术支持、网络技术支持和安全技术支持。当二线技术支持无法解决问题时将会得到总行技术支持中心和相关产品服务商的支持。在上述支持体系中,每一层次都有对应的服务角色。服务台定义有服务台值班人员,运行、网络和安全的技术支持中定义有相应的负责人、系统管理员、维护员、值班人员和文档管理员等等,每一个角色须规定相应的职责和约束。服务流程则包括服务台管理、故障管理、问题管理、变更管理、发布管理和配置管理等图2 运行维护管理平台实现框架从图2可以看出,服务台是服务提供者和用户、IT系统资源之间日常工作的单一联系点负责记录、处理IT服务运作过程中的服务请求和报告突发事件。服务台通过运行维护管理平台来协调用户和科技部门之间的关系,提供技术支持,提高用户满意度。从服务流程的角度而言,服务台提交的未处理的突发事件需要转人故障管理。故障管理就是在尽可能小地影响业务的情况下使IT系统尽快恢复正常。对于一些在很短时间内难以解决的深层次问题需要进入问题管理流程来处理。问题管理是通过调查和分析故障产生的潜在原因,并制定防止故障再次发生的措施的服务管理流程。对于故障管理和问题管理,需要在知识库中记录故障和问题解决方案。无论是故障管理还是问题管理,都可能涉及系统的变更,需要进行变更管理。变更管理是确保在变更实过程中使用标准的方法和步骤,尽快地实施变更。变更并经过测试的软(组)件需要通过发布管理流程导入实际应用环境中。发布管理负责将经测试无误的软硬件版本发布到目的变更点并规范其过程。以上管理流程在实施过程中都会涉及到配置管理。配置管理是指识别和确认系统的配置项、记录和报告配置项状态及其相互关系、变更请求、检验配置项的正确性和完整性。2。3。1监控管理1)集中监控通过对硬件、操作系统、网络、数据库、中间件、应用软件、存储等IT资源进行集中监控一旦出现故障,能够主动、及时通过运行维护管理平台集中反映在总控台上,便于值班人员及时发现解决。系统运行状态的监控包括CPU负载、内存占用、交换区空间、子进程、僵尸进程、磁盘状态、网卡状态、数据库的日志、各业务应用关键进程的实例数、各业务应用日志。同时对操作系统、数据库、应用软件等关键部分的性能进行监控分析为改进性能提供参考数据。2)安全管理安全管理是运行维护中的一个重要组成部分,并贯穿在其他各个流程之中,其目的是为了保证信息的机密性、完整性和可用性。安全管理的主要活动包括制定信息安全管理框架、确定安全需求,制定安全策略、实施安全计划、评估安全状况、处理安全应急事件等。通过对关键业务主机上的网络访问控制、用户登录控制、用户权限控制、系统资源访问控制和安全审计限制对主机的访问,并对访问过程进行自动地记录,从而提高系统的安全性。2。3。2服务管理1)服务台服务台是其他服务流程的“前台”,是用户与技术部门之间的“联系点”。服务台不仅负责对用户提交的事件、问题和服务请求进行初步处理,同时还为其他流程提供接口,将无法解决的部分问题和请求转交给二线支持或三线支持来处理。2)故障管理故障管理通过规范对引起业务系统非正常运行的因素所采取的解决措施,在尽可能小地影响客户和业务的情况下使系统尽快恢复到正常状态。服务台值班人员发现管理平台的故障报警,或接到由相关部门提交的故障单后,确定故障处理级别,导致业务中断的故障视为紧急,其余为一般。值班人员参照知识库对故障进行分类。对于知识库能够解决的故障,由服务台值班人员解决。知识库不能解决的故障。则提交二线技术支持包括运行系统技术支持、网络系统技术支持、应用系统技术支持和存储系统技术支持。二线技术支持负责人接到服务台提交的故障单后,根据故障级别逐级上报运行中心负责人和主管部领导,同时组织相关人员分析故障原因确定故障解决方案。如果无法在规定时间内解决出现的故障,则联系相应的产品服务商。在总行技术支持中心和产品服务商的帮助下,二线技术支持要在尽可能短的时间内解决故障,恢复系统正常运行。故障解决后将故障解决方案录入知识库。3)问题管理问题管理通过调查和分析查明故障产生的潜在原因,防止故障再次发生。问题管理的主要任务是发现、记录和分析系统运行中出现的问题,确定问题的解决方案。对于已解决的故障,二线技术支持负责对引发故障的潜在问题进行深入的调查和分析确定根本的原因和解决方案,对于新问题及其解决方案需录入知识库。4)变更管理变更管理的任务是针对各种变更请求进行变更分析,制定变更实施计划,确保快速、有序地实施变更。更换硬件设备对操作系统、数据库、中间件等进行升级,对硬件系统、系统软件的配置进行优化以及应用软件的版本更新,业务需求的变更都需要遵循变更管理的流程。当系统需要变更时变更实施人须详细说明变更原因及变更内容,确定变更类别及变更级别。交二线技术支持负责人。该负责人组织相关人员制定变更实施计划,分析变更对生产系统的影响,报主管领导审批。主管领导审批同意后,由该负责人组织相关技术人员在测试环境中进行变更。变更完成后,须对变更进行测试。二线技术支持负责人负责实施变更并对所作变更进行观察跟踪。5)发布管理发布管理主要规范业务系统生产环境的前台、后台应用软件版本更新后及时进行通知,以及对下级支行终端应用软件分发的服务流程。发布管理只是针对应用软件的版本更新,对于内部的变更则不进行发布处理。6)配置管理配置管理是指识别和确认系统配置项,记录和报告配置项状态和变更,检验配置项正确性和完整性等活动构成的服务管理流程,所有配置项信息和配置项之间的关系都被存储在配置管理数据库中。配置管理运作中需要其他流程提供信息,如变更管理中IT组件变更的信息,同时配置管理信息也可以为其他流程的运作提供支持,如事件管理人员和问题管理人员需要利用配置管理数据库的信息进行事件和问题的调查分析。7)知识库管理通过知识库管理,将日常故障和问题处理过程中各种解决方案进行长期积累,并藉此实现知识储备。通过知识库可将日常的技术经验转变为知识,将个人知识提升为组织知识,利用现有的和挖掘潜在的知识资源,建立知识型的运行维护管理体系。同时,也减少由于员工岗位变动、人员流动所造成的损失。8)资产管理资产管理是指对购买价格超过一定限额的资产进行监控的管理活动,包括记录各类资产的购买价格、折旧、所处位置、所有人等信息,制定各类资产从购买到淘汰的使用计划等。通过运行维护体系的建设,将对业务系统的运行维护管理起到如下几个方面的作用:(1)提高了故障应急处理能力。集中监控系统可以实现集中的预警机制和主动式报警,可以迅速发现并定位故障点及时进行故障处理,保证了系统运行的稳定性,合理调配使用系统资源提高故障应急处理能力,使被动和低效的管理转变为主动和高效的管理。(2)实现了运行维护管理的流程化。通过将IT管理活动按照流程的方式加以组织并赋予每个流程以特定的目标、范围和职能从而加强IT管理的全面性和综合性,使IT对业务的支持更为彻底和有效。(3)增强系统运行维护管理的决策能力。实现对运行维护管理

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论