版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
项目验收运维初始化服务验收在初始化服务实施结束阶段,和客户将根据方案计划,对于设计文档共同进行回顾与验收,对于初始化服务的结束认可将自动标志日常运维服务阶段的开始。序号验收内容验收标准验收结果备注1开放平台系统支持信息收集收集信息是否完整2建立完善ITIL运维服务管理体系(事件、配置、变更)运维体系是否建立3部署运维自动化系统(巡检工具)工具是否部署、使用4建立日常运维管理文档体系文档体系是否建立5运维支持过渡运维期过渡是否顺利交接驻场运维项目验收在项目服务期内,项目团队计划一段时间进行一次项目总结和评估,在每个服务年度结束时进行年度服务总结和评估,每次项目总结和评估后,项目团队将向客户方提交服务总结报告。项目结束前一周,我方将向客户提出服务项目验收请求,项目验收应履行正式验收流程,双方成立专门的验收工作组,负责组织、监督和裁决整个项目生命周期内服务交付情况,并给出最终验收意见。
应急处置预案 应急处置预案是为了提高云平台运维人员应对云平台紧急事件的响应处理速度,避免在发生问题时出现考虑不全,错误决策的现象,确保出现重大问题后能够快速回复生产运行,最大程度减少对业务连续性的影响。 云平台应急处置预案具体内容请参见-附件1《1110项目云平台应急处置预案》应急预案预案名称服务器、网络故障应急预案等级高组织部门客户信息中心涉及组织及职责客户信息中心:故障处理总协调、技术方案审定驻场团队:负责故障诊断、事故调查、评估损失设备厂商:故障处理预案事件描述公司服务器网络、核心路由器遭到破坏性攻击,网络性能严重下降,各应用系统不能提供正常服务预案处理要求及早发现攻击根源,将影响降低为最少。通知相关人员到岗,恢复网络通信。保留现场。追查原因。演练要求1.对在线系统不造成影响2.在主要人员变更和网络结构发生变更时要进行演练。3.演练前应填写工作单,确保系统有最新的全备份。4.演练结束形成演练总结报告。预案流程说明1.事件报警与确认:代维工程师每天定时对网络进行监测,及时发现网络中的异常流量及其它故障。当代维人员巡检发现情况或网络用户举报发现情况时,应由代维人员首先判断是否发生服务器、网络、核心路由器遭到破坏性攻击,判断网络性能下降的严重程度,启用相关应急预案(该预案在服务期内由制定);2.收集故障现象(不同网段ping服务器网段丢包率、延迟率)通知相关人员,保留现场。3.判断是否是某个主机系统或应用系统故障,如果是启动相应的应急预案。3.判断网络是否存在异常流量,发现可能存在的来源,是否有故障线路和设备。4察看核心路由器和服务器网段交换机设备状态及配置信息,并尽可能导出系统日志并分析,联系设备厂商提供现场支持,及早发现故障原因,及时切断异常信息来源,确定是设备故障尝试重新启动设备,不能恢复时更换备用设备;5.判断网络中是否发生病毒爆发事件或黑客供给事件,如果是启动相应的应急预案6.安全审计及事故分析通过网络设备日志、防火墙日志、入侵检测系统日志等,对事件进行审计,对损失进行评估,追查事件的发生原因。7.消除隐患、调整策略:根据审计结果,修正防火墙、入侵检测、主机防护系统策略。8.损失评估、责任追究:由信息中心、运维团队共同评估损失,追究责任。9.安全报告、归档:形成事故分析报告,分析事故原因,修正预案处理流程并归档。预案流程备注:预案名称数据库系统应急预案等级高组织部门客户信息中心涉及组织及职责客户信息中心:故障处理总协调、技术方案审定驻场团队:负责故障诊断、事故调查、评估损失设备厂商:故障处理预案事件描述运行数据库系统的主机由于不可抗力故障,导致数据库服务中断,影响业务系统对外服务。预案处理要求通知相关人员到岗,按照业务系统的要求,恢复数据库系统,应用部门核实数据恢复状况,同时查明原因,做好事故分析。演练要求1.对在线系统不造成影响2.在主要系统管理员人员变更和服务器、操作系统、数据库实例名等发生变更时要进行演练。3.演练前应填写工作单,并做全备份。4.演练结束形成演练总结报告。预案流程说明1.事件报警与确认:驻场工程师每天定时、时时检查系统数据情况,对数据进行监测,及时发现数据库物理资源的异常及其它故障。当故障发生时,首先确认数据库服务器、操作系统、数据库系统能否正常启动,如都不能启动完成修复工作,启动本应急预案。2.数据库服务器故障,通知相关人员,保留现场,分析网络、主机、操作系统、数据库系统的状态和资源情况。(1)通知主机系统管理员、安全系统管理员、应用系统维护管理员、数据库备份管理员。(2)确认网络是否正常、主机是否正常、操作系统及主机资源(磁盘空间、CPU、内存)是否正常,数据库系统各项服务是否正常。(3)备份相关文件,以便日后分析事故原因。(4)按照,主机、操作系统、数据库系统的顺序逐级排查原因,确认恢复点,对于属于数据库故障,启动数据库恢复方案,恢复数据库,对于数据库系统之下的故障原因,确认可修复的程度,如果重新安装。3.恢复备份数据:恢复备份的数据到原有系统,启动应用系统,查看应用状态。4.数据恢复测试:业务系统管理员核实数据恢复的情况,应用系统是否正常。5.安全审计及事故分析通过系统日志、主机防护系统日志、防火墙日志、入侵检测系统日志、数据库日志等,对事件进行审计,对损失进行评估,追查事件的发生原因。6.消除隐患、调整策略:根据审计结果,修正数据库防护系统策略、排查硬件资源,消除隐患。9.损失评估、责任追究:客户信息中心和运维团队评估损失,追究责任。10.安全报告、归档:客户信息中心形成事故分析报告,分析事故原因,修正预案处理流程并归档。预案流程事件报警及确认事件报警及确认切断连接,通知相关人员到场、保留现场切断连接,通知相关人员到场、保留现场确认故障点恢复数据库确认故障点恢复数据库数据核实数据核实否成功否?否成功否?是是恢复应用恢复应用安全审计及事故安全审计及事故分析消除安全隐患,安全策略调整消除安全隐患,安全策略调整损失评估、责任追究损失评估、责任追究安全报告、归档安全报告、归档备注注:以上预案为案例,实际预案需与客户具体调研后得出。1、应急方案制定更新与演练将为客户制定一套整体的应急方案,以确保客户在系统发生突发事件或灾难情况下能够迅速恢复IT服务,从而保证业务的持续运行。根据普遍认可的最佳实践指导原则,IT应急和IT灾难恢复的定义应该是:“计算机系统灾难是指任何造成计算机系统不能处理业务的时间超过了可容忍程度的事故。应急方案是指计算机系统灾难发生后,按照既定的应急恢复方案在一定时间内恢复系统运行和业务处理的过程。”为了应对生产系统可能出现的紧急故障(重大、严重故障),我方将从事前预防和事后处理两个方面制定紧急故障应处理预案。(A)事前预防:双方指定专人负责在紧急故障发生时及时沟通,我方将由驻场项目经理负责响应;我方专家支持团队进行系统风险评估,提出系统整改建议,制定紧急故障应急处理预案;进行一定次数的实际演练,包括后备系统切换测试、备份数据还原测试;对流程进行持续性跟踪,系统出现变更后,重新评估流程的有效性。(B)事后处理:响应时间:有驻场工程师立即做出响应;故障修复:由经验丰富的专家支持团队提供专人支持,包括搭建测试环境、远程和现场故障诊断和排除;同时建议客户启动紧急故障处理流程,按既定程序做应急处理。2、紧急故障应急预案制定及处理服务规范序号内容服务规范补充说明1服务范围为生产系统或其它关键业务系统制定紧急故障应急处理预案,并对预案进行持续性改进。2服务时间紧急故障预案制定:双方协商。紧急故障处理:全年7×24小时。3服务方式远程或现场。4服务发起由客户提出服务请求。5紧急故障应急处理流程涵盖范围软件介质、安装文档、系统配置文档完备,并由双方专人保管,随时可以查阅。双机配置正确,处于自动切换状态。数据备份系统可靠运行,数据已得到安全备份,并有完善的数据恢复流程文档。我方驻场工程师7×24小时接受服务请求,在无法处理的情况下立即转交专家支持团队。制定远程专家故障诊断和修复流程,我方专家支持工程师远程尽快排除系统故障。6实际演练根据客户要求,组织一定次数的实际演练,演练内容包括:服务流程演练:定期执行流程运转演练,保障流程的顺畅运行。容灾切换演练:定期执行双机热备切换演练,测试双机冗余的可用性。业务替代演练:定期进行冷备机启动业务替代演练,备份系统启动演练,测试灾难情况下冷备系统的可用性。备份演练:定期在测试机上演练灾难情况下的备份恢复,测试灾难情况下备份恢复的可用性。3、应急演练应急演练计划至少每季度一次进行测试和演练,以保证:计划内容能够反映当前的状况;计划的有效性和可操作性;应急演练人员熟悉应急恢复流程。演练应当由所有运维项目组织成员(包括客户方运维人员)共同进行,演练完成之后提交相关报告及改进建议。有下述三种测试和演练的方式:1.PaperWalkThroughs 这种方式是所有相关人员坐在一起,快速地审阅应急预案计划,以确认应急恢复计划的可用性。这种方式简单、经济,通常可以作为全面测试的一个开始。2.计划测试 这种方式是首先测试某个单一恢复模块,对小的组件测试应急恢复计划。在组件测试成功后,将测试扩展到多个恢复模块,如此反复,直到全部应急恢复计划得到模拟的测试。3.非计划实际演
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年医疗结构化面试题及答案护理
- (2025年)幼儿园保育员测试题及答案
- 行政管理学试题库及答案
- 护理除颤仪试题及答案
- 水电工程类笔试题(附答案)
- 《鱼我所欲也》课后练习答案
- 技能培训企业培训师三级真题及答案
- 公共卫生知识题库附答案
- 安全员技师模拟试题及参考答案
- 难点详解人教版八年级物理上册第6章质量与密度-质量专项训练试卷(含答案详解版)
- 2024年国家公务员考试《行测》真题卷(行政执法)答案和解析
- 生猪屠宰兽医卫生检验人员理论考试题库及答案
- 《诗二首 雨巷》(课件)
- 古籍如何修复古籍修复步骤流程
- 完整版全国行政区域身份证代码表(EXCEL版)TextMarkTextMark
- 仙居县国企招聘考试真题及答案
- 工业机器人系统集成(高职)PPT全套完整教学课件
- 美学原理PPT课件:技术美
- 应力腐蚀和氢脆
- GA/T 830-2021尸体解剖检验室建设规范
- 责任担当斗争精神自查问题清单
评论
0/150
提交评论