系统维护和机房运维方案设计_第1页
系统维护和机房运维方案设计_第2页
系统维护和机房运维方案设计_第3页
系统维护和机房运维方案设计_第4页
系统维护和机房运维方案设计_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实用文档实用文档文案大全文案大全实用文档文案大全运维服务方案2016年5月18日目录服务内容...................................................................................................服务目标.............................................................................................信息资产统计服务 ....................................................................................网络、安全系统运维服务................................................................................主机系统运维服务 .....................................................................................存储系统运维服务 .....................................................................................数据安全存储及灾备运维服务............................................................................传统的灾备方式....................................................................................容灾方案的关键指标................................................................................常见的备份策略....................................................................................容灾的核心问题....................................................................................容灾的实现方式....................................................................................异地容灾技术.........................................................................................8灾难恢复级别........................................................................................容灾建设方式..............................................................................................企业信息系统保护层次................................................................................容灾技术模型........................................................................................业务平台的保护---业务处理能力的冗余.....................................................................数据平台的保护---业务状态数据的复制...................................................................接入平台冗余和贴换...................................................................................1.7.6容灾模式............................................................................................. 1.7.6.1容灾层次 ..................................................................................... 1.7.6.2容灾范围 .....................................................................................25 1.7.6.3同级容灾或降级容灾 ........................................................................... 1.7.6.4容灾技术概述 .................................................................................... 1.7.6.5基于存储的数据复制技术建设容灾系统 .............................................................1.7.6.6小结..........................................................................................31运维服务流程.............................................................................................服务管理制度规范.........................................................................................服务时间.............................................................................................行为规范.............................................................................................现场服务支持规范 ...................................................................................问题记录规范........................................................................................4应急服务响应措施.........................................................................................37应急基本流程............................................................................................预防措施..................................................................…………....37...................突发事件应急策略.........................................................................................1服务内容1.1服务目标可为提供的运行维护服务包括,信息系统相关的主机设备、操作系统、存储设备容灾的运行维护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。用户信息系统的组成主要可分为两类:硬件设备和软件系统。硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件等)、业务应用软件等。通过运行维护服务的有效管理来提升用户信息系统的服务效率,协调各业务应用系统的内部运作,改善网络信息系统部门与业务部门的沟通,提高服务质量。结合用户现有的环境、组织结构、IT资源和管理流程的特点,从流程、人员和技术三方面来规划用户的网络信息系统的结构。将用户的运行目标、业务需求与IT服务的相协调一致。提供的信息系统服务的目标是,对用户现有的信息系统基础资源进行监控和管理,及时掌握网络信息系统资源现状和配置信息,反映信息系统资源的可用性情况和健康状况,创建一个可知可控的IT环境,从而保证用户信息系统的各类业务应用系统的可靠、高效、持续、安全运行。服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:运行状态、故障情况配置信息可用性情况及健康状况性能指标1.2信息资产统计服务此项服务为基本服务,包含在运行维护服务中,帮助我们对用户现有的信息资产情况进行了解,更好的提供系统的运行维护服务。机房服务内容包括:机房电源、温度、湿度信息统计记录硬件设备型号、数量、版本等信息统计记录➢软件产品型号、版本和补丁等信息统计记录存储产品型号、版本和性能等信息统计记录网络结构、网络路由、网络IP地址统计记录综合布线系统结构图的绘制其它附属设备的统计记录1.2.1机房电源、温度、湿度要求频率频率输入电压相位电流开关备注50Hz220V单相2线+地线20A单相交流电参数参数运行状态非运行状态温度℃10--40—10---50相对湿度%8--808--90温度变化℃10℃10℃硬件设备清单如下表统计:1.3网络、安全系统运维服务从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。网络、安全系统基本服务内容:序号序号服务模块内容描述提供方1现场备件安装配合用户进行,按备件到达现场时间工程师到达现场xxx公司2现场软件升级首先分析软件升级的必要性和风险,配合用户进行软件升级xxx公司33现场故障诊断按服务级别:7×24小时5×8小时xxx公司4电话远程技术支持7×24小时xxx公司5问题管理系统对遇到的问题进行汇总和发布xxx公司机房网络核心交换机信息系统管理单位:维保单位:设备名:设备型号:管理IP:检查内容参考标准检查结果检查结论巡视方法描述巡检周期硬件运行状态电源运行状态□正常□异常风扇运行状态□正常□异常模块运行状态□正常□异常系统运行状态检查VLAN状态□正常□异常配置状态□正常□异常OSPF状态□正常□异常日志检查日志状态□正常□异常其他检查内容□正常□异常□正常□异常□正常□异常(1)用户现场技术人员值守可根据用户的需求提供长期的用户现场技术人员值守服务,保证网络的实时连通和可用,保障接入交换机、汇聚交换机和核心交换机的正常运转。现场值守的技术人员每天记录网络交换机的端口是否可以正常使用,网络的转发和路由是否正常进行,交换机的性能检测,进行整体网络性能评估,针对网络的利用率进行优化并提出网络扩容和优化的建议。现场值守人员还进行安全设备的日常运行状态的监控,对各种安全设备的日志检查,对重点事件进行记录,对安全事件的产生原因进行判断和解决,及时发现问题,防患于未然。同时能够对设备的运行数据进行记录,形成报表进行统计分析,便于进行网络系统的分析和故障的提前预知。具体记录的数据包括:➢配置数据➢性能数据➢故障数据(2)现场巡检服务现场巡检服务是对客户的设备及网络进行全面检查的服务项目,通过该服务可使客户获得设备运行的第一手资料,最大可能地发现存在的隐患,保障设备稳定运行。同时,将有针对性地提出预警及解决建议,使客户能够提早预防,最大限度降低运营风险。巡检包括的内容如下:编号编号内容1硬件运行状态检查项目单板状态检查电源模块状态检查风扇状态检查整机指示灯状态检查机框防尘网检查机房温度、湿度检查设备地线检查2软件运行情况检查项目设备运行情况检查网络报文分析设备对接运行状况检查路由运行情况检查3网络整体运行情况调查网络运行问题调查网络变更情况调查网络历史故障调查(3)网络运行分析与管理服务网络运行分析与管理服务是指工程师通过对网络运行状况、网络问题进行周期性检查、分析后,为客户提出指导性建议的一种综合性高级服务,其内容包括: 服务内容 服务优点向客户提供网络专家电话号码。 保证重大问题第一连线至网络专家。网络专家组每周与客户进行不少于2小时的以最小成本保证及时解答客户关心的技术问题,并就某一领域技术问题展开深层次沟通。电话技术交流每月向客户提交CASE汇总分析报告,并可使客户了解网络历史故障情况以及故障预防建议,最大程度减少网络故障隐患,更高效扩展到每年17次(月度、季度、年度)的进行网络管理。(4)重要时刻专人值守服务深刻知道保证重要时刻设备稳定运行对客户成功尤为关键,因此,可对客户文案大全文案大全文案大全实用文档序号序号服务模块内容描述提供方1现场备件安装配合用户进行。按备件到达现场时间工程师到达现场设备厂商、xxx公司2补丁服务消除软件漏洞给系统带来的安全隐患,并对安装补丁所引起的系统连锁反应进行合理的平衡。xxx公司3升级服务对系统进行软件或硬件的升级,以改进、完善现有系统或消除现有系统的漏洞。xxx公司4现场故障诊断按服务级别:7×24小时5×8小时xxx公司5电话远程技术支持×724小时xxx公司6问题管理系统对遇到的问题进行汇总和发布xxx公司7系统优化对客户系统的括主机、存储设备、操作系统、提供优化服务。现场值守人员可进行监控管理的内容包括:CPU性能管理;内存使用情况管理;➢硬盘利用情况管理;系统进程管理;➢主机性能管理;实时监控主机电源、风扇的使用情况及主机机箱内部温度;监控主机硬盘运行状态;监控主机网卡、阵列卡等硬件状态;监控主机HA运行状况;主机系统文件系统管理;监控备份服务进程、备份情况(起止时间、是否成功、出错告警);实用文档1.5网络存储系统运维服务提供的机房存储环境(SAN、NAS)运行维护服务是包括存储的IOPS和Space利用管理,存储的主动IOPS性能和Space利用管理对系统运维非常重要。可了解用CIFS、iscsi、FC、FCoE、NFS协议运行状况,通过性能管理可了解存储的日常运行状态,识别存储的IOPS性能,有针对性地进行性能优化。同时,密切注意存储系统的变化,主动地预防可能发生的问题。实用文档实用文档的一致性,一旦双机双存储发生的是逻辑错误时,无论是主服务器还是备用服务器都将无法启动。容灾不是简单备份真正的数据容灾就是要避免传统冷备份的先天不足,它能在灾难发生时,全面、及时地恢复整个系统。容灾按其容灾能力的高低可分为多个层次,例如国际标准SHARE78定义的容灾系统有七个层次:从最简单的仅在本地进行磁盘备份,到将备份的磁盘存储在异地,再到建立应用系统实时切换的异地备份系统,恢复时间也可以从几天到小时级到分钟级、秒级或0数据丢失等。1.6.2灾备方案的关键指标RTO(RecoveryTimeObject)RTO即恢复时间目标:是指“将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态”所需时间,其中包括备份数据恢复到可用状态所需时间、数据处理系统切换时间、以及备用网络切换时间等,该指标用以衡量容灾方案的业务恢复能力。实用文档实用文档RPO(RecoveryPointTime)RPO即数据恢复点目标:是指业务系统所允许的灾难过程中的最大数据丢失量(以时间来度量),这是一个与数据备份系统所选用的技术有密切关系的指标,用以衡量灾难恢复方案的数据冗余备份能力。容灾半径容灾半径是指生产中心和灾备中心之间的直线距离,用以衡量容灾方案所能防御的灾难影响范围。显然,具有零RTO、零RPO和大容灾半径的灾难恢复方案是用户最期望的,但受系统性能要求、适用技术及成本等方面的约束,这种方案实际上是不大可行的。所以,用户在选择容灾方案时应该综合考虑灾难的发生概率、灾难对数据的破坏力、数据所支撑业务的重要性、适用的技术措施及自身所能承受的成本等多种因素,理性地作出选择。1.6.3常见的备份策略备份策略描述FullBackup完全备份是每次对系统进行完全的备份。当数据发生数据丢失灾难时。完全备份所需要的时间最长和消耗的磁带最多,但恢复时间最短和操作最方便。IncrementalBackup增量备份是备份上一次全备份或者增量备份系统发生改变的数据。这种备份策略的优点时节省了磁带空间,缩短了备份时间。其缺点在于当灾难发生时,数据的恢复比较麻烦而且可靠性比较差。其中任何一盘磁带出现问题都会影响之后的磁带恢实用文档实用文档复。DifferentialBackup差量备份是备份上一次全备份后到系统发生改变过的文件。其优点是无需要每天对系统做完全备份,备份所需要时间短并且节省了磁带空间。它的灾难恢复也很方便。系统管理员只需要全备份和增量备份的介质就可以进行系统的恢复。SyntheticBackup合成备份是当备份窗口较短时进行。在进行合成备份的时候,会从完全备份、增量备份和差量备份中读取信息,然后创建一个新的完全备份。这种完全备份可以离线进行且网络还是在继续使用,不会降低系统性能或者妨碍网络中的用户。差异增量备份(DifferentialIncrementalBackup):此备份主要在于每次备份的内容是从上次0级或1级备份以来发生改变的内容。累积增量备份(CumulativeIncrementalBackup):此备份主要在于每次备份的是从上次0级备份以来发生改变的内容。实用文档实用文档1.6.4容灾的核心问题容灾适应性指的是容灾系统在实施和使用的过程中对原有的生产系统、硬件系统、网络系统的影响,有的容灾系统可能需要冻结原有的生产系统的情况下进行数据的复制,有点容灾系统可能要对硬件、网络环境进行改造,改造成系统所要求的条件。这些对改造对原有的系统和数据都存在一定的风险性。容灾可见性指的是容灾系统的容灾效果是不是可见、可查询的。有的容灾系统的容灾效果要等灾难发生之后,备用系统恢复之后才能验证是不是真做到了数据零丢失的效果。如果数据复制失败不能马上反应出来同样达不到容灾的效果。所以容灾系统的核心问题:能否构建一个绿色容灾系统,在实施和使用过程中不会影响原生产系统,无需改造硬件和网络环境,其容灾结果的好与坏又实时可见、可验证。1.6.5容灾的实现方式通常,应用服务器通过SAN访问存储资源。针对SAN共享存储模型进行了进一步的细化,把SAN存储分为:应用层文件/记录层块管理物理存储设备实用文档实用文档如下图所示。SNA共享存储模型因此,可以从文件/记录层、块管理层来实现容灾。根据容灾的发起端来进行划分,容灾可分为:数据库级容灾:基于数据库的容灾技术传输的是SQL指令或者重作日志文件。如Oracle数据库自带的DataGuard技术。卷管理级容灾:基于主机卷管理软件的容灾技术可以选择同步或者异步复制方式。存储目标数据的逻辑卷不能被业务系统所使用,属于冷容灾方式。如VERITASVVR远程数据复制软件。网络级容灾:网络级容灾主要是指基于虚拟存储技术的容灾。例如IBM的PPRC、EMC的Mirrorview、HDS的Truecopy复制技术。存储设备级容灾:通过存储控制器实现的设备级数据远程镜像或复制是传统容灾方式中最高效最可靠的方式。基于磁盘系统的同步数据复制功能可实现异地数据的容灾。实用文档实用文档虚拟化存储产品实现远程复制1.6.6异地容灾技术远程镜像技术远程镜像技术是在主数据中心和备援中心之间的数据备份时用到。远程镜像又叫远程复制,是容灾备份的核心技术,同时也是保持远程数据同步和实现灾难恢复的基础。远程镜像按请求镜像的主机是否需要远程镜像站点的确认信息,又可分为同步远程镜像和异步远程镜像。同步远程镜像(同步复制技术)是指通过远程镜像软件,将本地数据以完全同步的方式复制到异地,每一本地的I/O事务均需等待远程复制的完成确认信息,方予以释放。同步镜像使远程拷贝总能与本地机要求复制的内容相匹配。当主站点出现故障时,用户的应用程序切换到备份的替代站点后,被镜像的远程副本可以保证业务继续执行而没有数据的丢失。但它存在往返传播造成延时较长的缺点,只限于在相对较近的距离上应用。异步远程镜像(异步复制技术)保证在更新远程存储视图前完成向本地存储系统的基本I/O操作,而由本地存储系统提供给请求镜像主机的I/O操作完成确认信息。远程的数据复制是以后台同步的方式进行的,这使本地系统性能受到的影响很小,传输距离长(可达1000公里以上),对网络带宽要求小。但是,许多实用文档实用文档拟化存储技术在系统弹性和可扩展性上开创了新的局面。它将几个IDE或SCSI驱动器等不同的存储设备串联为一个存储池。存储集群的整个存储容量可以分为多个逻辑卷,并作为虚拟分区进行管理。存储由此成为一种功能而非物理属性,而这正是基于服务器的存储结构存在的主要限制。虚拟存储系统还提供了动态改变逻辑卷大小的功能。事实上,存储卷的容量可以在线随意增加或减少。可以通过在系统中增加或减少物理磁盘的数量来改变集群中逻辑卷的大小。这一功能允许卷的容量随用户的即时要求动态改变。另外,存储卷能够很容易的改变容量,移动和替换。安装系统时,只需为每个逻辑卷分配最小的容量,并在磁盘上留出剩余的空间。随着业务的发展,可以用剩余空间根据需要扩展逻辑卷。你也可以将数据在线从旧驱动器转移到新的驱动器上,而不中断服务的运行。存储虚拟化的一个关键优势是它允许异质系统和应用程序共享存储设备,而不管它们位于何处。公司将不再需要在每个分部的服务器上都连接一台磁带设备。1.6.7灾难恢复级别国家《信息系统灾难恢复规范》中根据数据备份系统、备用数据处理系统、备用网络系统、备用基础设施、技术支持、运行维护支持、灾难恢复预案这七个要素的不同要求,把灾难恢复分为6个级别:实用文档实用文档不同层次的数据中心保护如上图所示,对企业集中化数据中心的IT系统和业务数据进行保护可以有多种不同层次的保护方案,主要分为本地保护和远程保护两个方面。企业数据中心面向运营的保护及恢复包括三个层次:平台保护—主要是平台的高可用,如采用主机群集系统和高可用存储平台(包括SAN网络环境的高可用和存储系统的高可用),保证IT平台没有单点故障,实现业务和应用的高可用性。数据备份—对业务数据进行经常性的本地备份,在IT系统出现物理故障或逻辑故障时,数据备份都能提供可靠的数据保护。数据恢复—在出现数据错误或丢失时能够进行快速、可预见的数据恢复,减少IT系统的中断时间,降低对业务运营的影响。建设了完善的本地保护和恢复后,企业需要规划建设面向灾难保护及恢复的“远程”数据及业务保护,它包括三个层次:远程的信息保护—是将企业的所有重要数据安全的存储在远程站点,提供保护,避免灾难性的事件破坏数据。远程自动处理—除了提供对生产数据的远程保护外,能够自动进行系统切换、回切及数据恢复等工作,从而在灾难事件发生时能够快速恢复业务运行。多数据中心保护—通过建设多个数据中心,采用多数据中心的数据保护、恢复技术,防范更大范围的灾难事件。实用文档实用文档1.7.2容灾技术模型容灾技术平台建设是企业业务连续性建设的重要基础。XXX公司将企业的IT平台划分为“接入平台、应用平台、数据平台”三部分,建议企业的容灾技术平台建设应该主要着眼于对业务处理平台,数据平台和接入平台这三个重要的系统领域的保护。容灾技术模型示意图1.7.3业务平台的保护——业务处理能力的冗余容灾技术方案建设中,对于企业的业务平台的保护,主要表现为对业务处理能力的冗余和复用,其中牵涉:支持应用系统运行的服务器和操作系统等系统软件支持应用系统运行的存储器及存储器和服务器的连接(存储网络等)连接服务器的IP网络系统支持应用系统实现的中间件或数据库等客户将需要在容灾中心应该配置与需要保护的生产中心相同厂家、相同版本、相同配置的应用服务器、中间件和数据库。要确保主数据中心和容灾中心的软件运行环境相同。实现业务逻辑的应用软件系统咨询服务部门将可以为客户对上述各方面进行调查评估,分析客户的当前生产中实用文档实用文档灾要求的容灾模式和运营方式。1.7.6.1容灾层次根据业务恢复时间的长短可以将容灾建设划分为不同的层次:只做数据的灾难保护,仅能保证数据的完整性,此类业务在容灾中心只需要配置存储平台,实现数据的远程复制和存储即可。这种方式可以降低投资,但业务恢复时间很长(一般在3天以上)。数据的灾难保护是仅将生产中心的数据完整地复制到容灾中心的容灾方式。数据的灾难保护是异地容灾的最低级形式,也是最基本的方式,是实现更高级容灾方式的基础。在灾难发生时,仅有数据的灾难保护无法保证业务的连续性,仅可以保证数据是可用的,若技术策略选择得当,可以保证业务数据的完整性。采用这种模式有以下特性:业务恢复速度较慢,通常情况下RTO>72小时业务恢复难度大,需要新增设备实现技术难度比较低运行维护成本较低投资比较节省除数据的灾难保护外,实现应用的高可用,确保业务可以快速恢复。容灾系统的应用不改变原有的业务处理逻辑,是对生产中心系统的基本复制。这种方式有以下特性:业务恢复速度较快,通常情况下RTO小于24小时,也可以达到几小时级别业务恢复过程相对简单实现技术难度比较高运行维护成本较高,如:增加软件版本管理、软件部署、维护人员等投资比较高1.7.6.2容灾范围根据业务影响分析结果,容灾备份存储平台项目的业务将划分为关键业务和非关键业务两大类。未来可以根据需要选择要做容灾保护的业务种类,可以先建实用文档实用文档设关键业务容灾,未来实现全业务容灾。关键业务容灾:业务需求定义中通过业务影响分析定义关键业务的容灾全业务容灾。1.7.6.3同级容灾或降级容灾根据容灾中心配置的处理能力不同,可以分为同级容灾和降级容灾。若未来的在容灾中心为需要进行容灾保护的业务系统都配置与生产中心相同处理能力和高可用能力的业务处理平台(主要是指主机性能,高可用群集等),则为同级容灾设计。如果未来的在容灾中心为需要进行容灾保护的业务系统配置比生产中心的处理能力低或高可用能力降低(比如没有做群集等),则为降级容灾设计。采用同级或降级容灾方式取决于业务需求和投资预算,降级容灾可以减少投资(在主机方面的投资)。实用文档实用文档1.7.6.4容灾技术概述不同企业的不同业务需求和应用特点将可能需要有不同的容灾技术要求,可以采用多种容灾技术来建容灾系统,XXX专业咨询服务部将更许客户的实际需求提供不同的技术方案。对所有客户的容灾技术平台建设而言,容灾方案的技术核心是数据的保护,实现远程数据复制,并能够在灾难发生时在远端利用复制数据提供企业业务运营支撑服务,因此数据复制技术是构建容灾技术平台的核心。不同数据复制技术的分类如下:如上图所示,对容灾项目而言,比较可行的是采用连续数据复制技术。根据不同容灾方案所采用数据远程复制技术位于企业IT架构不同层面又可以分为以下三类容灾方案:基于存储层面的容灾方案—利用存储系统的远程数据复制功能建设容灾系统,它包括:同类存储平台之间的数据复制;异构存储平台之间利用虚拟存储技术实现数据复制。基于主机层面的容灾方案—利用主机厂家提供的相关功能软件或第三方的主机软件实现远程的数据复制,建设容灾系统。实用文档实用文档1.7.6.5基于存储的数据复制技术建设容灾系统采用基于存储的容灾方案的技术核心是利用存储阵列自身的盘阵对盘阵的数据块复制技术实现对生产数据的远程拷贝,从而实现生产数据的灾难保护。在主数据中心发生灾难时,可以利用灾备中心的数据在灾备中心建立运营支撑环境,为业务继续运营提供IT支持。同时,也可以利用灾备中心的数据恢复主数据中心的业务系统,从而能够让企业的业务运营快速回复到灾难发生前的正常运营状态。基于存储的容灾方案示意图如下:基于存储数据复制技术的容灾方案示意图采用基于存储的数据复制技术建设容灾系统是目前金融、电信企业、政府采用较多的容灾方案,有非常多的应用案例,是容灾建设可选择的技术方案之一。基于存储的复制可以是如上示意图的“一对一”复制方式,也可以是“一对多或多对一”的复制方式,即一个存储的数据复制到多个远程存储或多个存储的数据复制到同一远程存储;而且复制可以是双向的。基于存储的容灾方案有两种方式:同步方式和异步方式,说明如下:同步方式,可以做到主/备中心磁盘阵列同步地进行数据更新,应用系统的I/O写入主磁盘阵列后(写入Cache中),主磁盘阵列将利用自身的机制同时将写I/O写入后备磁盘阵列,后备磁盘阵列确认后,主中心磁盘阵列才返回应用实用文档实用文档很多,有非常多的成功经验,而目前同城容灾环境中已经具备上述条件,可以很方便部署同步方式复制;采用异步方式虽然存在一定的数据丢失的风险,但没有距离限制,可以实现远距离保护。异地数据中心,则采用与北京两个中心的异步复制方式进行数据保护。灾备中心的数据可以得到有效利用。对于基于应用、基于主机、基于存储的三种容灾方案而言,灾备中心的数据通常不可用,仅为生产系统中的数据提供灾难保护和灾难恢复。但对采用基于存储技术的容灾方案中,有很灵活的技术手段可以充分利用灾备中心的数据,从而提高企业的业务运营效率,带来更多的投资回报。如下图所示:基于存储的容灾方案有效利用灾备数据如上图所示,生产中心的“源数据—R1”通过存储本身的数据复制机制被复制到了灾备中心,即“目标数据R2”。“目标数据R2”在正常生产情况下是不可访问的,灾备中心的后备主机只能在灾难发生时,主中心服务停止后,才可以访问“目标数据”,接管主中心的服务(基于主机和应用的容灾方案的灾备中心数据与此类似)。但采用基于存储的容灾方案时,我们可以为“目标数据”建立一个BCV卷或快照、克隆,从而可以给到另外的服务器使用。利用这种机制,用户可以在容灾中心做很多工作:用户开发测试人员可以利用R2-BCV或R2快照得到真实的数据进行新应用开发、测试工作,从而保证新应用的质量,加快新产品上市时间。这种方式实用文档实用文档在采用基于主机方案和基于应用方案都很难实现,或在获得一份真实数据进行开发测试时需要很长的时间,消耗大量的资源。用户的其它应用也可以利用R2-BCV或R2快照满足其它业务的需要。如数据仓库应用通常需要从生产系统抽取数据,一旦进行大规模数据抽取,生产系统几乎处于停顿状态,这时可以利用R2-BCV卷进行数据抽取,从而避免数据抽取给生产系统带来的巨大性能冲击。企业的决策分析系统的数据来源也都可以基于R2-BCV来实现。由于以上优点,基于存储灾难保护方案是目前采用最多的灾难保护方案。1.7.6.6小结基于应用的容灾方案、基于主机的容灾方案和基于存储(包括虚拟存储技术)的容灾方案都有各自的适用范围,适用于不同的灾难保护需要。用户需要根据具体的实际需求来选择合适的容灾保护方案。不同的用户不同的业务系统、不同应用对容灾的要求不同,要求不同的容灾服务等级。在未来将按照科学流程和方法,并利用XXX公司在信息存储管理领域的专业技能和经验为用户进行IT环境的评估和业务影响分析,发掘客户业务需求对容灾技术的要求,从而建议最合适的容灾方案。对企业而言,选择容灾方案既要考虑选择合适技术方案,也需要考查实现该方案的产品在技术上是否成熟、可靠,性能和灵活性是否满足要求,同时也需要考查提供该解决方案的供应商是否有丰富的经验和认证的技能来保证方案的确实可行并能够成功实施。实用文档实用文档文案大全文案大全实用文档文案大全2运维服务流程建议用户采用的服务方式为两种:一种为技术人员现场值守,另一种是定期巡检结合故障现场服务。技术人员现场值守运行维护服务的基本操作流程如下图所示:IT资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资 资资资资 资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资 资资资资资资资资资 定期巡检结合故障现场运行维护服务的基本操作流程如下图所示:IT资资资资资资资资资资资7*24资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资资 资资资资资资资资资3服务管理制度规范3.1服务时间接收服务请求和咨询:在5*8小时工作时间内设置由专人职守的热线电话,接听内部的服务请求,并记录服务台事件处理结果。在非工作时间设置有专人7*24小时接听的移动电话热线,用于解决内部的技术问题以及接听7*24小时机房监控人员的机房突发情况汇报。服务响应时间: 故障级别 响应时间 故障解决时间I级:属于紧急问题;其具体现象为:系统30分钟,2小时内12小时以内崩溃导致业务停止、数据丢失。提交故障处理方案II级:属于严重问题;其具体现象为:出现30分钟,2小时内部分部件失效、系统性能下降但能正常运行, 24小时以内提交故障处理方案不影响正常业务运作。III级:属于较严重问题;其具体现象为:30分钟,2小时内出现系统报错或警告,但业务系统能继续运 48小时以内提交故障处理方案行且性能不受影响。IV级:属于普通问题;其具体现象为:系统30分钟,2小时内技术功能、安装或配置咨询,或其他显然不 5天内提交故障处理方案影响业务的预约服务。技术支持人员在解决故障时,会最大限度保护好数据,做好故障恢复的文档,力争恢复到故障点前的业务状态。对于“系统瘫痪,业务系统不能运转”的故障级别,如果不能于12小时内解决故障,xxx公司将在16小时内提出应急方案,确保业务系统的运行。故障解决后24小时内,提交故障处理报告。说明故障种类、故障原因、故障解决中使用的方法及故障损失等情况。3.2行为规范遵守用户的各项规章制度,严格按照用户相应的规章制度办事。与用户运行维护体系其他部门和环节协同工作,密切配合,共同开展技术支持工作。出现疑难技术、业务问题和重大紧急情况时,及时向负责人报告。现场技术支持时要精神饱满,穿着得体,谈吐文明,举止庄重。接听电话时要文明礼貌,语言清晰明了,语气和善。遵守保密原则。对被支持单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播。3.3现场服务支持规范运维服务人员要做到耐心、细心、热心的服务。工作要做到事事有记录、事事有反馈、重大问题及时汇报。严格遵守工作作息时间,严格按照服务工作流程操作。现场支持工程师应着装整洁、言行礼貌大方,技术专业,操作熟练、严谨、规范;现场支持时必须遵守用户单位的相关规章制度。现场支持工程师在进行现场支持工作时必须在保证数据和系统安全的前提下开展工作。现场支持时出现暂时无法解决的故障或其他新的故障时,应告知用户并及时上报负责人,寻找其他解决途径。故障解决后,现场支持工程师要详细记录问题的发生时间、地点、提出人和问题描述,并形成书面文档,必要时应向用户介绍故障出现的原因及预防方法和解决技巧。3.4问题记录规范根据使用人员提出问题的类别,将问题分为咨询类问题和系统缺陷类问题二类:咨询类问题是指通过服务热线或现场解疑等方式能够当场解决用户提出的问题,具有问题解答直接、快速和实时的特点,该问题到现场支持人员处即可中止,对于该类问题的记录可使用咨询类问题记录模版进行记录。系统缺陷类问题是指使用人员提出的问题涉及到系统相应环节的确认修改,需要经过逐级提交、诊断、确认、处理和回复等环节,处理解决需要xxx项目组的分析确认,问题有解决方案后,将解决方案反馈给用户。具体提交流程如下:问题提交。应用信息系统的用户发现属于系统缺陷类的问题时,填写系统缺陷类问题提交单,提交服务支持中心。问题分析。服务中心接到用户提交的问题单,要组织相应人员对问题单中描述的问题进行分析研判,确定问题的类型(技术问题、业务问题或者操作问题)。属于技术问题,提交服务中心技术人员对存在的问题提出具体的处理意见和建议;属于业务问题,提交服务中心业务人员进行处理;属于操作问题,可安排相关人员对问题提出人进行解释,并将系统缺陷类问题提交单转为系统咨询类问题提交单。问题确认、解决。服务中心的技术人员和业务人员收到

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论