附件一、业务支撑网网管系统-服务管理流程分册_第1页
附件一、业务支撑网网管系统-服务管理流程分册_第2页
附件一、业务支撑网网管系统-服务管理流程分册_第3页
附件一、业务支撑网网管系统-服务管理流程分册_第4页
附件一、业务支撑网网管系统-服务管理流程分册_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国移动业务支撑网网管系统规范服务管理流程分册中国移动通信集团公司2004年4月目录1综述32运维管理流程详述421事件管理4211事件管理描述4212事件管理目的4213事件管理范围5214相关定义6215流程职责/角色11216主要内容12217流程衡量标准13218流程图举例16219事件信息项1822问题管理19221问题管理描述19222问题管理目的21223问题管理范围21224相关定义21225职责/角色25226主要内容25227流程衡量标准26228流程图举例28229问题信息项3123变更管理32231描述32232目的33233范围33234相关定义33235职责/角色38236主要内容39237流程衡量标准41238流程图举例44239变更请求信息项4624配置管理47241描述47242目的48243范围48244相关定义49245职责/角色52246主要内容53247流程衡量标准54248流程图举例55249常见配置元素属性表573运维管理流程关系和运维支持体系6731运维流程相互关系6732整体运维支持体系694附录7141ITIL国际规范简介71411ITIL国际规范简介71412分阶段实施方法7342名词解释761综述本文作为中国移动业务支撑网网管规范附件之一,将详细描述本期中国移动业务支撑网网管的四大管理功能,及四大管理功能之关的关系,并借助于流程图的实例进行详细说明。运维管理流程包括事件管理、问题管理、变更管理、配置管理,本附件将分别对其进行定义和描述,包括管理目的、管理范围、主要内容、职责/角色规划、流程示例等。在本附件最后,还简单介绍ITIL的相关内容和实施方法。2运维管理流程详述根据本期业务支撑网网管系统建设目标,本期运维管理主要实现事件管理、问题管理、变更管理和配置管理,而管理流程是运维管理的主线,它将整个运维管理工作有机地联接起来,下面将对每个流程的内容及其实际应用做一个详细介绍。21事件管理211事件管理描述事件管理流程是为IT用户尽快回到正常工作状态而设计,其关心的重点是快速响应、快速恢复,使故障对业务的影响最小化。事件管理流程受事件触发和驱动,所谓事件,是指发生了非常规的运作情况,包括系统崩溃、软件故障、任何影响用户业务操作和系统正常运作的事情、以及影响业务流程或违背服务水平协议的情况。事件也包括一个用户的请求,如,重设用户密码。不是所有的事件都由用户产生,监控管理平台产生的告警也可引发事件。通常由帮助台负责记录事件相关信息,向用户提供对已知问题的处理方法,报告事件和尽快恢复服务,目的是在事件管理阶段获得尽可能高的事件解决率。所有的事件应该基于相关配置元素的关键等级和影响度进行优先级分类。事件管理的责任是记录、分类、调查/诊断、解决已知问题、监控跟踪事件、与用户和问题管理流程交流、最终解决事件。212事件管理目的事件管理流程的主要功能是尽快解决环境中出现的事件,保持IT环境的稳定性,其目的包括在成本允许的范围内尽快恢复服务快速响应系统监控产生的故障或用户的电话请求在线获得帮助沟通问题解决的状态进行事件控制记录事件就事件的优先级、紧急性和严重性进行分类分析、诊断,必要时进行升级监视,并结束事件支持业务运行对业务应用提供二级支持解答有关如何使用的问题记录关于新服务的需求记录关于改变的请求提供一个与业务部门的日常接口提供关于服务状态的信息更新新服务的报告关于即将到来的新服务或事件的通知进行事后回顾提供IT管理信息人力利用情况服务可用性产品质量支持效率供应商服务情况213事件管理范围在BOSS系统运维范围内所指的事件,包括所有与IT基础架构和业务相关的如下事件申告故障咨询业务处理维护作业工科事件的产生有两类由监控管理平台自动发现并产生的告警事件由用户/IT维护人员报告的事件但不包括外部用户汇报的事件在开发和测试环境中的设备或系统产生的事件“事件管理”流程不一定必须找到问题发生的根本原因,其重点在于如何在尽量短的时间内,恢复已经中断的IT服务,提高服务的可用性。214相关定义重分配规则事件的及时、正确分配和接手处理是确保事件在解决时限内解决的关键因素。一线和二线技术人员可以拒绝并根据重分配原则重新分配不属于自己运维范围的事件。事件性质根据移动的业务要求和管理要求,按照事件性质定义如下六类事件性质描述申告针对BOSS系统的IT用户投诉故障指因BOSS系统错误或非正常因素由监控管理平台发现的告警事件咨询指对系统操作、业务流程等方面的求助和询问业务处理指需要运维人员进行后台数据处理的要求维护作业指运维人员的日常维护作业或临时进行的维护作业其他其他性质的事件。事件来源当接到一个问题时,帮助台人员需要记录事件来源的类型。帮助台的事件来源可以包括以下来源描述用户来自IT用户的事件可以有以下几种记录方式电话/邮件/传真来自用户/IT维护人员报告的事件自助开单用户/支持人员发现问题,直接在服务台系统客户端开单客服平台来自客服平台的事件其他其他方式进入帮助台的事件监控管理平台监控管理平台发现的告警事件,通过与服务管理平台接口发送告警信息到服务管理系统中事件优先级优先级是事件管理的一个关键要素,优先级决定处理事件的顺序及所需的资源,事件优先级可分为四级,如下表所示事件的优先级分两个层面来定义和确认帮助台帮助台在接到来自监控管理平台的告警事件或IT用户报告的事件时,迅速根据事件相关的业务/子业务或IT系统/设备的关键级别及事件的性质,定义该事件的优先级别。如果为紧急事件,立即升级到一线。对于监控管理平台上传的报警事件,应包含该事件相关联的配置元素的搜索代码,帮助台人员据此确定配置元素及其关键级别。帮助台人员可参考下表确定事件优先级编号优先级1紧急2高3中4低本次事件所对应CI的关键级别事件优先级1231紧急高中2紧急中低故障3高低低申告高中低事件性质咨询/业务处理/维护作业中低低一线一线人员在接受到帮助台升级上来的事件后,根据该事件相关的业务或IT系统/设备的实际故障情况,并结合其他相关因素,再次确定事件优先级,如确实为紧急事件,则启动升级机制。确定事件优先级后,即可以确定事件的处理时限,优先级对应的事件解决时限参考下表优先级紧急高中低解决时限小时482448事件的升级事件升级的目的是确保基于事件的优先级等级及时通知有关技术人员和领导,引起更多的重视,提供合适的资源,从而快速找到解决事件的方案。可根据所要求的处理时间定义事件优先级升级规则,包括不同等级的事件在不同的时间被升级到不同级别的人员时间优先级即时响应15分钟处理时限30处理时限40处理时限紧急ABDEF高ABCDE中ABCD低ABC升级组群A帮助台B一线支持人员C二线支持人员D事件经理E管理层F集团公司各省可以根据业务的实际情况调整升级标准。事件分类根据移动目前的事件种类,事件的分类层次设计不超过三层,第一级分类,称之为“类别”,第二级分类,称之为”子类”,第三级分类,称之为”条目”。本规范给出第一级、第二级分类。各省市根据自己的情况决定是否要定义到第三层。下表为事件分类表举例类别子类条目网络通讯系统服务器基础架构存储系统操作系统数据库中间件双机热备软件系统软件系统监控软件采集计费结算客服业务业务管理账务管理账务处理一级BOSS拨测其他空调UPS机柜照明温湿度传感器外设配套设施其他事件状态代码事件状态代码表明事件所处的处理状态,本规范规定的事件状态如下事件状态代码描述新建新开事件记录分配事件在帮助台一线处理一线支持人员已接手处理事件二线处理二线支持人员已接手处理事件供应商处理由供应商处理已解决事件已找到解决方案关闭确认解决方案,事件得以关闭事件结束代码事件结束代码说明了事件是在何种情况下关闭的,本规范规定的结束代码如下事件结束代码描述暂时解决用变通办法暂时解决帮助台由帮助台人员成功解决一线解决由一线人员成功解决已解决二线解决由二线人员成功解决第三方解决由第三方成功解决其他包括消失,误操作,可忽略等处理是否超时事件超时代码描述未超时事件最后时限范围内结束超时事件未能在最后时限范围内结束215流程职责/角色事件管理流程主要分为以下几个职责/角色,分别简述如下事件经理作为事件流程的负责人,负责制定流程的规则、策略、步骤调度资源,协调解决跨小组、部门的事件指导日常操作,确保流程的执行符合预定的要求和规则建立流程的衡量指标和报表与用户、服务商和管理层交流流程的使用情况确认和实施对流程的变更/改进计划帮助台人员在指定的响应时间内响应所有帮助台热线电话、邮件、传真等事件报告完整记录所有接收的事件信息,包括记录事件报告人的详细联系方式、事件特征表现、描述、发生时间等为事件进行适当的分类、为事件分配优先级等属性尝试使用工具、初步诊断、分析相关信息等方式解决问题如果帮助台不能解决这个事件,应当将事件分配给最合适的一线支持小组/人员来处理检查事件记录的处理进度,保持与事件报告人的联系,适时通知事件处理进展与用户确认事件解决方案,关闭事件一线支持人员一线支持人员负责提供对帮助台无法解决的事件进行快速有效的分析并提出解决方案以尽快恢复服务,并在必要时提供现场支持。验证事件的描述和信息,进一步收集相关信息决定需要采取何种措施恢复服务并实施有效的行动必要时提供现场支持根据优先级提供有效的解决方案已解决的事件转回帮助台,由帮助台关闭事件实施事件解决方案更新事件解决信息,已解决的事件转回帮助台,由帮助台关闭事件如果一线不能解决这个事件,应当决定选择最合适的二线支持小组/人员来处理二线支持人员二线支持人员是相关问题领域的专家。负责提供对一线支持人员无法解决的问题进一步进行调研,找出解决方案并尽快恢复服务。各省可以考虑按照所维护的应用、系统进行分组,如,网络组、主机组等。进行事件的深入调查研究根据经验和专业技能,决定需要采取何种措施恢复服务并实施有效的行动必要时引入供应商的支持在系统中更新事件根源和最终解决方案更新事件记录,确保事件状态代码真实反映事件状态。及时提供有效解决方案与其他小组合作,确定解决方案已解决的事件转回帮助台,由帮助台关闭事件如果二线不能在解决时限内解决这个事件,应当将事件进行升级216主要内容事件管理流程始于事件的探测和报告,结束于事件的解决。该流程包含下述主要内容事件接收和记录这个环节是事件管理流程的起点。所有用户或系统报告的IT事件必须由此步骤开始。此步骤的目的是在事件发生时快速准确地发现,以协助事件的诊断和解决并通知相关人员。在此步骤中将会收集创建事件记录所需的信息。该环节的关键是信息的准确性和完整性。分类和在线支持事件可以是一个服务请求、信息请求或服务故障,对于每个事件,需要确立优先级、影响度、和分类。若没有现成的解决方案或临时解决措施,该事件将分配给合适的支持人员对此进行调查。该环节的关键是需要知识库支持和正确的事件分派。调查和诊断若在线支持人员无法解决事件,可运用自身技能、知识库、诊断工具等进行更加深入的分析以找到恢复服务的临时措施,必要时将使用多名技术员以寻求解决措施。解决和恢复技术人员实施事件的解决方案,并将解决完毕的事件转回帮助台,由帮助台通知用户解决的结果,并得到用户的确认。紧急事件和事件升级对于紧急事件,帮助台应立即提交给一线人员,由一线人员判断,上报给事件经理,并同时上报给集团公司,由事件经理决定紧急处理的方式,确保其得到最快速的解决。当事件处理超过预期时限,将自动升级或由运维人员升级,以引起相关人员和管理人员的重视和参与。结束事件当用户确认事件解决后,此时可结束该事件,并在必要时更新知识库。若用户对此解决方案不满意,则对该事件继续进行处理,不能关闭。217流程衡量标准事件管理流程的主要衡量指标如下事件记录数量,可按照部门、事件分类等分别统计事件关闭的数量,可以按照优先级,或者按照分类分别统计事件成功关闭的数量规定时间内解决的事件数量/百分比帮助台解决率事件解决的平均时间,可以按照事件分类统计超时的事件数量,可以按人员、组别统计统计报表事件记录的数量,可按照事件分类、事件性质、事件优先级等分别按月、周、日汇总统计该时间段内创建的事件记录数量故障申告咨询业务处理维护作业其他紧急高中高中低中低中低中低紧急高中低网络设备服务器存储系统计费结算客服处于各状态的事件数量,可按事件来源、事件分类、事件状态实时汇总事件记录数量新建分配一线处理二线处理供应商处理已解决关闭网络设备服务器存储系统计费结算客服事件关闭的数量,可按事件来源、事件分类、事件结束代码等分别按月、周、日汇总统计该时间段内创建的事件记录的关闭数量成功解决可忽略事件后续操作解决部分解决部门1监控系统1成功解决可忽略事件后续操作解决部分解决网络设备服务器存储系统按时、超时解决的事件数量/百分比,可按事件来源、事件分类、处理角色等分别按月、周、日汇总统计该时间段内创建的事件记录的解决数量帮助台一线二线第三方按时超时按时超时按时超时按时超时数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比部门1监控系统1帮助台一线二线第三方按时超时按时超时按时超时按时超时数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比网络设备服务器存储系统各角色事件解决率,可按事件来源、事件分类、处理角色等分别按月、周、日汇总统计该时间段内创建的事件记录的解决率帮助台一线二线第三方部门1监控系统1帮助台一线二线第三方网络设备服务器存储系统218流程图举例如下是事件管理的逻辑示意图事件管理逻辑流程帮助台一线支持省公司IT用户集团公司二线支持事件经理1002优先级最高1006解决了吗1009解决了吗YNYNNYY第三方10012解决了吗10013需要第三方支持NNY10014超出时限YN用户报告事件系统产生事件1001创建事件记录并分类1005尝试解决1007事件转发至一线10016确认并关闭事件通知事件经理通知事件经理10010事件转发至二线1008检查事件信息并解决10011调查诊断并解决事件10015技术支持Y上报集团1004优先级最高YES1003确认优先级NY流程说明序号步骤名称责任人输入说明输出1001创建事件记录并分类帮助台事件特征描述接受从IT用户或监控管理平台报告的事件,在帮助台系统中产生新服务记录,填入相关信息。并对事件进行分类,根据设定标准进行分类和分优先级,设置相关属性。事件记录1002优先级最高帮助台事件记录根据事件相关的配置元素CI的关键级别。确定事件的优先级是否最高,如是立即升级到一线支持人员,否则尝试解决。优先级确定结果1003确认优先级别一线事件记录一线支持人员根据事件相关配置元素和其他相关信息确定该事件是否确属优先级最高已确定优先级的事件记录1004优先级最高一线已确定优先级的事件记录如果优先级确实最高,则立即升级到事件经理,并通报集团公司,并立即开始处理,如不是,则返回帮助台N/A通知事件经理事件经理事件记录最高优先级事件必须立即通知事件经理,由事件经理决定是否由原处理人按照原流程执行,还是需要采取必要手段干预(例如启动危机处理流程、会紧急解决方案议等)。上报集团集团事件记录紧急事件必须上报集团公司并在事件处理过程中的每个状态变化点将最新事件记录上传到集团公司紧急事件1005尝试解决帮助台事件记录通过查询知识库,尝试电话支持解决方案1006解决了吗帮助台N/A如果解决了,则进入10016,确认并关闭事件;如果不能解决,进入1007,转发至一线。N/A1007事件转发至一线帮助台事件记录选择适当的一线人员,将事件转发转发的事件1008检查事件并解决一线事件记录检查事件信息,寻求解决方案解决方案1009解决了吗一线N/A如果解决,则将解决方案记入事件记录,并发还帮助台,进入10016;如果不能解决,则需在事件记录中说明原因,转发二线N/A10010事件转发至二线一线事件记录选择适当的二线人员,将事件转发转发的事件10011调查诊断并解决二线事件记录进行进一步调查分析,找出解决方案解决方案10012解决了吗二线N/A如果”是”,则将解决方案记入事件记录,发还帮助台,进入10016;如果”否”,则转入10013。需要供应商支持N/A10013需要第三方支持二线N/A判断是否需要引入第三方第三方包括厂商和其他部门的支持人员“是”,转入10015;“否”,转入10014N/A10014超出时限二线N/A如果超出处理时限,必须及时通知事件经理N/A通知事件经理事件经理N/A事件经理应当特别关注超时的事件,并帮助协调资源,监督事件尽快解决N/A10015技术支持供应商支持请求供应商得到通知后,应参与事件的解决,并提出解决方案,由二线人员监控供应商的响应速度和处理速度。解决方案10016确认并关闭事件帮助台已解决的事件帮助台应与用户确认是否接受解决方案,如果用户认可,则可关闭事件,如果用户不能接受,则发还处理人员,继续处理。关闭的事件记录219事件信息项本规范规定事件管理流程必须包含如下事件信息项信息项说明填写方式事件流水号工单号码系统生成报告人信息本次事件报告人的联络信息,包括姓名省/分公司部门根据报告人的搜索代码,自动获取CMDB中报告人信息电子邮件办公电话手机/BP生成时间在帮助台生成事件记录的时间系统生成地点事件发生的地点发生时间事件发生的实际时间事件性质从事件所属性质的角度来确定其处理流程,如申告、故障、求助、业务处理、维护作业等。事件来源指事件工单产生的途径,有人工产生、系统自动产生两类。由监控管理平台自动产生的,可自动填写事件优先级事件优先级决定了事件的解决时限和处理次序,通过综合衡量配置元素的关键级别和其他相关信息得出。事件分类从事件从属的系统或技术架构的类型来进行分类,如数据库,服务器等。事件标题事件的标题由监控管理平台自动产生的,可自动填写事件描述对于整个事件内容的详细描述由监控管理平台自动产生的,可自动填写事件解决确认人在帮助台得到用户确认的有关人员事件状态在事件整个生命周期中的不同状态系统生成分配对象被分配的技术支持组和人员事件日志反映事件处理过程中的事件处理信息,包括人员,时间等信息是否超时事件处理时间是否超出解决时限系统生成解决时间事件得到解决的时间解决方案描述事件解决方案的描述事件结束代码根据事件结束的不同方式赋予不同的结束代码22问题管理221问题管理描述问题是一个或几个已暂时处理但根本原因尚不明确的事件,许多事件往往是由同一个问题引起的。问题的来源主要有以下几种已经关闭的事件,经过回顾分析后,可能形成一个问题;重大事件,虽然经过紧急处理恢复服务,但未找到根本原因,也形成一个问题;对于趋势性事件的分析,形成问题。问题管理流程的根本目的是消除或减少事件的发生,将BOSS系统内部缺陷导致的业务事件或问题的负面影响降到最低限度,此流程分析发生在生产环境的事件常常是已关闭的事件记录,确定最常发生或具有最大影响的事件,找出根本原因,然后生成变更请求RFC、变通方法或建议的预防性措施来防止事件的再次发生。所以问题管理流程需要和变更管理流程一起来实施找出的解决方案以从根本上解决问题。问题通常具有以下特征中的一个或全部一组具有一定关系的已结束的事件一个重大或紧急事件事件处理结束后定义为问题,由问题管理找出根本解决方案问题管理与事件管理之间的差异问题管理与事件管理并不相同,它的主要目的是查明事件的潜在原因,并制定随后的解决方案和预防方法。在大多情况下,此目的与事件管理目的之间有一定冲突,因为事件管理的目的是尽快地恢复客户服务,通常是通过实施替代方案,而非确定一个永久性的解决方案(例如为了尽可能地预防未来可能出现的事件,寻求改善信息技术基础架构的结构)。就问题管理而言,对潜在原因的调查可能需要一定的时间,找到解决方案的速度是次要的考虑因素,但是预防了问题的再次发生。问题管理流程可以按照不同领域的问题(如网络问题,或应用问题等)由相关组的技术支持专家来执行,原则上这些专家可以是事件管理的二线支持专家,他们在负责接受来自一线支持人员(帮助台员工)的支持请求的同时,也负责对以往事件进行分析,找出事件产生的根本原因,从而确定解决方案,消除这些根本原因,最终使此类事件不再发生;同时,也要从发生的事件中找出事件的发展趋势或潜在可能发生的问题,从而预先采取措施,保证IT服务的正常化。问题的根本原因找出后即成为已知错误,对已知错误实施解决方案,从而解决问题。所以问题管理流程的输出有变更请求变通方法根本解决方案预防性措施已知错误222问题管理目的问题管理流程在IT部门设立的主要目的是分析已被列为问题的事件(一组或一个)的根本原因,然后找出解决方案。包括分析并确定事件的根本原因,以防止再次发生主动提供预防性措施提高IT服务的可靠性降低IT支持成本提高IT部门的整体形象和名誉223问题管理范围问题管理范围是对所有IT生产环境中未根本解决的问题和已知错误进行管理,并采取主动性预防措施来降低事件数量,重大或紧急事件在处理完后也被定义为问题以分析其产生的根本原因。一般对IT服务影响最大或最占用支持人员资源的事件优先进行分析。问题管理范围不包括处于开发或测试环境的系统和应用。224相关定义优先级需要确定解决方案的紧急程度,本规范定义如下问题优先级编号优先级代码解释1紧急关键级别为1的业务中断或将中断,影响一个以上关键地区或半数以上地区2高关键级别为1的业务中断或将中断,影响一个以上地区但未达到紧急标准3中关键级别为1的子业务或半数以上子业务中断或将中断4低未达到以上标准问题状态代码问题在整个生命周期中的不同状态。本规范定义如下问题状态问题分类CLASSIFICATION从问题从属的系统或技术架构的类型来进行分类。本规范定义如下问题分类类别子类条目网络通讯系统服务器基础架构存储系统操作系统系统软件数据库编号代码描述1已登记问题登录到系统中2处理中问题正在处理过程中3拒绝问题分派被拒绝4已知错误问题根本原因已找出5已有解决方案解决方案已找到6RFC已提交RFC7结束问题已结束8回顾问题已做回顾中间件双机热备软件系统监控软件采集计费结算客服业务管理账务管理业务账务处理一级BOSS拨测其他空调UPS机柜照明温湿度传感器外设配套设施其他问题性质根据问题的不同来源进行分类。本规范定义如下问题性质编号代码备注1升级事件从事件管理中升级的事件2系统构架问题技术专家提出的问题3主动防范性分析事件记录找出的问题问题结束代码问题结束代码根据事件结束的不同方式赋予不同的结束代码。本规范定义如下问题结束代码编号代码说明1根本解决找出问题的根本原因,并得到解决方案,成功解决2变通方法未找出根本原因,但有临时解决方案作为变通方法3没有解决问题无法解决4消失问题无法再现225职责/角色问题管理流程主要分为如下几个职责角色,分别简述如下问题经理整体上对流程负责,确保流程的有效执行定期评估流程,制定流程改进计划确定或定义问题,并确保有效协调资源监视问题的诊断,分析和处理过程提出实施解决方案的变更请求定期制定IT问题报表,提供正确决策信息问题分析专家接受问题经理分派过来的问题分析和诊断问题,确定根本原因确定和测试解决方案协助事件支持人员进行重大或紧急事件的处理226主要内容问题管理流程着重于消除事件或减少事件发生,确定事件的根本原因。主要活动包括分析事件、找出问题、分派问题、确定根本原因、找出解决方案以消除事件或在其发生时降低对用户或业务的影响。其主要内容如下1分析事件定期分析事件,找出潜在问题2生成问题记录在系统中生成问题记录并把所有相关事件与此记录关联起来重大或紧急事件处理完后定义为问题技术支持专家在日常运维中发现的问题主动性防范3分派根据问题内容将问题记录分派给适当的技术小组。4根本原因分析被分派的小组人员将调查问题以期找出其原因,制定解决方案、变通方法或提出预防性措施,以消除产生原因,或在重发时使其影响力最小化。5更新已知错误问题记录必须被更新以反映它是已知错误状态,并且把任何变通方法、避免或最小化负面影响的动作行为也记录下来(如果需要添加到知识库中)。6提出变更请求对问题的解决方案进行评估,通过提出变更请求(RFC)以对该方案进行测试和实施。如果RFC没有被批准,问题记录保持为已知错误,它们可以被事件支持人员在事件再次发生时参考借鉴。7关闭一旦找出问题根本原因,并实施了解决方案,确认已解决了问题,问题记录可以关闭。8事后回顾问题必须进行回顾以找出改进机会或总结预防性措施。包括改进事件监测、找出技能差距和文档资料改进等。227流程衡量标准问题管理流程的主要衡量指标如下每一阶段内的已知错误数量在每一阶段内未结的问题记录每一阶段内未了结的由问题引发的RFC数量在IT环境中存在的临时性变通办法数量统计报表问题的数量,可按问题分类、问题性质、优先级、影响度等分别按月、周、日汇总统计该时间段内创建的问题记录数量优先级影响程度紧急高中低高中低无网络设备服务器存储系统优先级影响程度紧急高中低高中低无升级事件系统构架问题主动防范性处于各状态的问题数量,可按问题分类、问题性质、问题状态分类实时汇总已登记处理中拒绝已知错误已有解决方案RFC结束回顾网络设备服务器存储系统已登记处理中拒绝已知错误已有解决方案RFC结束回顾升级事件系统构架问题主动防范性问题关闭的数量,可按问题分类、问题事件、问题结束代码等分别按月、周、日汇总统计该时间段内创建的问题记录的关闭数量根本解决变通方法没有解决消失网络设备服务器存储系统根本解决变通方法没有解决消失升级事件系统构架问题主动防范性228流程图举例如下是问题管理的逻辑示意图举例问题管理逻辑流程事件管理人员变更管理人员省公司管理层问题经理问题分析专家集团公司3001分析事件3007推荐解决方案/变通方法3009提交变更请求/监视变更实施3006分析根本原因在必要时升级到管理层接受吗YN需要变更吗NY3002创建问题记录3003问题优先级和分类3004分派给工作组/监视3005拒绝问题30010关闭问题记录30011回顾3008安排实施解决方案上报集团公司Y评估/实施变更优先级最高吗N事件记录升级到管理层关于该逻辑流程的简单描述如下序号步骤名称责任人输入说明输出3001分析事件问题经理事件记录定期分析回顾事件,主动发现潜在问题。分析事件的频度和严重度,和其他的相关因素进行关联,如CI位置、宕机时间、特定用户、硬件平台、软件版本和一天中发生的时间等。具体的做法可以是一周开一次由主要事件支持人员参加的例会,讨论上周发生的IT事件。分析结果3002创建问问题分析结把找出的问题记录到系统中去,并进行详细说明问题记题记录经理果录3003问题优先级及分类问题经理问题记录根据问题的实际情况,给其分派一个优先级代码和影响度代码必要时进行升级,如优先级最高时,并根据拟定的分类原则给问题赋予适当的类别代码并根据问题具体情况设定一个解决时限。已分类问题优先级最高吗问题经理已分类问题如果问题优先级为最高,由问题经理立即把该问题上报到集团公司,并把该问题升级到管理层N/A3004分派给工作组/监视问题经理问题记录初步判断问题的可能原因,把问题分派给相应工作组或个人,并监视问题的解决过程,如有必要如超过解决时限启动升级流程已分派问题在必要时升级问题经理N/A问题经理在监视问题解决的过程中,根据具体情况可把该问题升级到管理层,如问题超出解决时限时N/A判断是否接受问题分析专家N/A问题分析专家对问题进行初步分析,以决定接受与否。如拒绝转向300。6继续,如接受转向300。7继续。N/A3005拒绝问题问题分析专家已分派问题问题分析专家根据判断发现问题应该由其他组分析解决,就把问题发回问题经理,注明拒绝理由并推荐组名。转向300。4继续。已拒绝问题3006分析根本原因问题分析专家已接受问题如果问题确应由本人或本小组解决,接受分派的问题,然后调查诊断问题,如有必要成立问题分析小组,举行问题根本原因分析研讨会议并确定问题的潜在原因。必要时更新问题状态。问题根本原因3007推荐解决方案/变通方法问题分析专家问题记录、问题根本原因找出问题的根本原因后,根据实际情况制定变通方法或根本性解决方案,并确保这些方法或方案将降低或消除事件的发生率或影响度,更新问题记录。问题解决方案问题变通方法3008安排实施解决方案问题经理问题解决方案问题变通方法根据问题专家提供的解决方案或变通方法,计划并实施解决方案以解决问题解决方案实施计划判断是否需要问题经理N/A判断实施上述解决方案是否需要进行变更,如不需要变更转向300。10继续,如需要变更转向300。9N/A变更以提出变更请求。3009提交变更请求问题经理解决方案实施计划根据问题分析专家制定的解决方案或变通办法,提出变更请求,填写变更请求单,递交到变更管理流程,并监视变更的实施过程,和变更管理保持沟通。变更请求RFC30010关闭问题记录问题经理已解决的问题变更结束后,确认问题已经解决,选择相应的结束代码,更新问题状态,关闭问题记录。已关闭的问题30011回顾问题经理已关闭的问题对所有已关闭问题都进行回顾,找出可能改进的机会,包括问题的解决方案和管理流程方面,如改进升级规则、改进事件监测、找出技能差距和文档资料改进等;回顾之后更新问题状态。已回顾的问题229问题信息项本规范规定问题管理流程必须包含如下问题信息项信息项说明问题流水号系统自动生成的工单号码生成时间生成问题记录的时间地点问题发生的地点问题性质指问题的来源问题优先级问题优先级决定找到解决方案的紧急程度影响程度问题对IT环境的影响程度问题分类从问题从属的系统或技术架构的类型来进行分类,如数据库,服务器等。问题标题问题的标题问题描述对于整个问题内容的详细描述问题状态在问题整个生命周期中的不同状态问题日志反映问题处理过程中的问题处理信息,包括人员,时间等信息解决时间问题得到解决的时间解决方案描述问题解决方案的描述问题结束代码根据问题结束的不同方式赋予不同的结束代码23变更管理231描述变更管理通过一个单一的职能流程来控制和管理整个IT运行环境中的一切变更,并和配置管理建立接口。变更管理应该由管理工具来支持,管理的范围可包括软件,硬件,网络设备和文档等的变更。变更请求通常由于问题的解决方案中需要对生产环境进行某些改变而产生。需成立一个变更顾问委员会CHANGEADVISORYBOARD,以下简称CAB来帮助和支持变更经理,根据变更内容来决定CAB的成员,可以包括客户代表、运维支持人员、应用开发和供应商等跟变更有关的人员。CAB通过开会讨论等手段来评估变更请求RFC的潜在风险和影响实施变更需要的资源是否批准变更如果批准,什么时间实施CAB也负责变更实施后的回顾以考察变更是否成功是否产生其他副作用实际所用的资源和预期的是否一致批准后,变更将进入计划,测试/构建和实施阶段。计划/构建阶段也包括开发一个回退计划FALLBACKPLAN,用以在实施阶段出现问题或紧急状况时需要把变更回退回去。变更管理流程也负责紧急变更,在此种情况下,变更的评估、计划、测试和实施阶段都将快速进行。232目的变更管理流程将通过标准统一的方法和步骤来管理和控制所有对IT生产环境有影响的变更。主要的目的包括IT部门可以管理和引导用户变更需求通过对所有变更的正确评估,可以维护IT生产环境的完整性变更和变更实施得到正确记录,并提供审核统计减少或消除由于变更实施准备不当等原因出现的对IT环境的破坏作用提高资源使用率233范围变更管理流程涵盖生产环境的所有变更。一般不包括尚处于开发和测试阶段的系统和应用的变更不需要IT部门介入的、由用户控制的行为动作234相关定义优先级优先级用来说明变更需要得到实施的紧急程度风险等级除了常规变更,还需通过下表所列的衡量因素来评估实施变更可能带来的风险。衡量因素条件得分序号优先级说明1紧急要求变更在提出申请后二天内完成2正常除了常规和紧急之外的变更3常规预先定义的日常类变更衡量因素条件得分影响一个以上关键地区或半数以上地区1影响一个以上地区但未达到半数,并没有关键地区受影响2影响一个地区的全部用户3地市/区域IT用户数量(受到实施或取消的影响)影响一个地区的部分用户43个或更多支持小组12个支持小组2超过1人,相同的支持小组3准备/实施必需的资源1人4无法测试,变更失败可能性很高1能实现部分测试,变更失败可能性较高2有成熟的变更方案,变更失败可能低3变更成功的可能性无需测试,变更失败可能性没有46天或更长126天212天3变更规划时间小于1天4超过2小时或在线/服务断供期112小时2不到1小时3变更实施时间不到30分钟4回退时间超过2小时1回退难度中等以上(12小时)2回退难度适中(1小时或更短)3回退时间易于回退(30分钟或更短)4注紧急变更的实际规划时间很短,但评估时应按照该变更正常处理情况下所需的规划时间来评估。根据上表,对每个变更进行评估,最终得分为各分项得分的总和,再根据总分确定对应的风险等级和实施完成后的观察期总得分风险等级实施完后的观察周期69重大67天1013较大45天1417中等23天18较小小于等于1天以上风险等级由变更主管进行初步评定,再由CAB进行最终确定。状态变更请求从提出、实施到结束的整个生命周期中的不同状态结束代码根据结束变更的不同方式赋予不同代码序号代码说明1完全成功完全达到变更目的2部分成功部分达到变更目的3取消变更实施过程中被取消4拒绝变更请求被CAB拒绝类别(CATEGORY)根据中国移动目前的变更种类,变更的分类层次设计不超过三层。第一级分类,称之为”类别”,第二级分类,称之为”子类”,第三级分类,称之为”条目”。本规范给出第一级、第二级分类,各省市根据自己的情况决定是否要定义到第三层。下表为变更分类表举例类别子类条目网络通讯系统基础架构服务器序号状态说明1已登记变更请求已登入系统2已评估变更请求已得到CAB评估3已授权变更请求已得到CAB授权4已计划变更实施计划已由变更经理收集并确定可执行5进行中变更实施过程中6已结束变更已结束7观察中变更实施结束后处于观察状态7已回顾变更已得到回顾8关闭变更请求已关闭存储系统操作系统数据库中间件双机热备软件系统软件系统监控软件采集计费业务结算客服业务管理账务管理账务处理一级BOSS拨测其他空调UPS机柜照明温湿度传感器外设配套设施其他235职责/角色变更管理流程主要分为如下几个职责角色,分别简述如下变更请求者发现或获取变更需求确定并分析变更需求和内容填写变更请求单并提交给相关相应变更主管变更经理整体上对流程负责,确保流程的有效执行确保变更请求得到有效评估,授权和实施确保只有授权和必要的变更才被实行,并使该种变更影响最小化定期召开变更会议,回顾/制定下阶段变更规划定期评估流程,制定流程改进计划定期制定变更管理报表,提供正确决策信息变更顾问委员会CAB针对具体变更请求,评估并分派相应资源回顾所有提交的RFC,并确保它们的潜在影响和风险得到评估回顾所有已执行的变更,确保满足变更目的参加CAB会议和紧急CAB会议协助变更经理确定变更优先级及变更规划一般根据不同变更内容有不同人员组成变更主管由与变更请求内容相关的具体技术领域的负责人如组长担任检查由变更申请人提交的变更请求RFC,并完善或调整RFC信息,必要时拒绝无关或无法实施或没有必要的变更请求作为具体变更的项目经理,负责领导变更的构建测试,实施和参与回顾制定变更项目计划和时间规划等确保变更在预定的时间,资源和成本内完成在必要时,确保回退计划(FALLBACKPLAN)得以正确实施变更实施人员根据变更主管制定的变更实施计划执行分派的任务以推进变更项目向变更主管汇报工作进程现场负责变更实施236主要内容变更管理流程通常将包括如下内容提出RFC变更申请人提出RFC,由变更主管负责检查和完善其内容,并进行风险等级、优先级的初步评估。接受RFC变更经理接受RFC。变更请求分类和升级通过分类,确定是否为重大变更、紧急变更,如果是常规变更请求,则由相应变更主管安排实施;如果风险等级为”重大”的变更请求,应上报省公司管理层和集团公司;紧急变更适用同一流程但将得到快速批准和实施。变更顾问委员会()评估变更经理将根据特定的变更请求成立特定的CAB,成员包括对该变更的评估和批准提供应有附加价值的技术人员和管理人员评估工作包括技术可行性,对容量的影响,对现有服务的影响,资源需求等批准RFC变更经理确定对该RFC有批准权的人员参加CAB,必要时参与评估评估后CAB根据判断决定是否批准RFC。建立变更实施计划测试结果,并批准实施变更请求得到评估和批准后,变更主管安排相应资源进行变更的构建/开发、测试,并制定实施计划。随后提交计划和测试结果给变更经理以获得批准。规划RFC实施计划一旦获得批准,变更主管必须根据资源和其他情况进行规划,确定实施时间表,分配相应资源,并通知请求人。协调变更实施一切就绪后,可以实施变更相应小组实施变更,变更主管监视实施过程,并在必要时进行协调更新变更状态在整个变更过程中,变更的状态从登记,评估,回顾到最后关闭是不同的变更经理负责更新预先定义好的变更状态回顾和关闭实施变更后,CAB负责从技术和流程角度去回顾变更,确保RFC得到了预期效果,并寻找流程的改进机会。随后,变更经理负责关闭RFC。总结汇报向管理层提供流程报表,提供变更的用价值的信息,定期向相关小组部门根据流程衡量标准汇报。变更会议变更经理负责定期或不定期召开变更会议,与IT内部成员和用户沟通,传递将要实施的变更等信息,以及对变更流程的反馈和建议等。变更流程回顾建议定期回顾变更管理流程以提高效率和效能,在实施变更流程不久之后,可以进行第一次回顾,以确保流程得到正确实施并起到预期目的。对发现的问题必须追根溯源并尽快解决之后,可以定期举行正式的回顾,如每六个月回顾一次。237流程衡量标准变更管理流程的主要衡量指标如下每一类型的变更数量执行回退计划FALLBACKPLAN的变更数量变更实施的成功率紧急变更所占的比率被拒绝的RFC的数量或比例每一类优先级的变更数量统计报表RFC数量,按优先级、风险等级、变更类别、申请人部门/归属小组等分别按月、周、日汇总统计该时间段内创建的RFC数量风险等级重大风险等级高风险等级中风险等级低紧急正常常规优先级风险等级紧急正常常规重大高中低网络设备服务器存储系统优先级风险等级紧急正常常规重大高中低部门1小组1处于各状态的RFC数量,可按优先级、风险等级、变更类别、申请人部门/归属小组、状态实时汇总优先级风险等级紧急正常常规重大高中低已登记已评估已授权已计划进行中已结束观察中已回顾关闭已登记已评估已授权已计划进行中已结束观察中已回顾关闭网络设备服务器存储系统已登记已评估已授权已计划进行中已结束观察中已回顾关闭部门1小组1RFC关闭的数量,可按优先级、风险等级、变更类别、关闭代码等分别按月、周、日汇总统计该时间段内创建的RFC的关闭数量优先级风险等级紧急正常常规重大高中低完全成功部分成功取消拒绝完全成功部分成功取消拒绝网络设备服务器存储系统完全成功部分成功取消拒绝部门1小组1238流程图举例如下是变更管理的逻辑示意图举例变更管理逻辑流程省公司管理层集团公司变更实施人员变更主管变更顾问委员会CAB变更经理变更请求者NYNNNYYYY4008制定具体计划如不是常规类变更,则继续重大变更变更经理风险等级为”重大”的变更请求,变更经理应立即上报至集团和省公司管理层紧急变更变更经理判断是否为紧急变更,如是,则转向紧急变更流程,否则继续400。4协调CAB相关活动变更主管确定的CAB名单相关变更主管与已确定的CAB成员进行沟通,确保RFC具体内容得到共识,并准备CAB会议CAB成员都已明确RFC内容400。5评估风险/影响变更顾问委员会CAB待评估的RFC召开会议或指定人员对变更请求进行评估并得出结论RFC得到评估,包括变更风险,优先级,影响度等授权吗变更顾问委员会CAB决定是否对该变更请求授权,如果授权,则继续,否则拒绝变更请求并由变更经理与变更请求者进行沟通400。6制定测试/实施计划变更主管得到授权的RFC变更主管负责测试和制定实施计划,并把测试结果和实施计划递交给变更经理以批准实施变更的测试计划和实施计划批准吗变更经理决定是否批准实施变更,必要时召集变更顾问委员会,如批准,则继续,否则把测试结果和实施计划退还给变更主管并要求重新提交400。7总体变更计划变更经理变更的测试计划和实施计划综合其他RFC,来制定或修改总体变更计划总体变更计划需要集团公司审批吗变更经理N/A对于重大变更,还需判断是否属于需要集团公司审批的变更,如是,则上报集团公司,等待批准,如批准,则转400。8,制定具体计划,如不批准,则转400。6,重新制定测试和实施计划;如不需要集团公司审批的变更,则直接转400。8进行制定具体计划N/A400。8制定具体计划和协调沟通变更主管变更测试计划和实施计划总体变更计划综合总体变更计划、变更测试和实施计划,确定一个最合适的实施时间,根据需要与相关部门进行充分沟通具体实施计划400。9实施变更实施人员具体实施计划根据具体实施计划执行变更实施,在必要时启动回退计划FALLBACKPLAN并在实施完成后得到配置经理授权更新相关配置信息已实施的变更已更新的配置信息400。回顾变更顾已实施的变更经理召开CAB会议对实施的变更进行已回顾的变10问委员会CAB变更回顾以确定变更目的是否已达到更400。11结束变更经理已回顾的变更更新相关信息,关闭变更记录变更请求关闭239变更请求信息项本规范定义如下变更请求信息项信息项说明变更请求序列号为每个变更请求分配一个唯一的序列号记录创建时间变更请求创建的时间发起人信息记录变更请求者的基本信息,包括姓名省/分公司部门电子邮件办公电话手机/BP优先级紧急正常常规风险等级重大高中低所影响的应用系统实施该变更将对哪些应用产生影响变更类别变更的分类变更描述简单描述变更请求变更详细内容详细描述变更的内容变更完成时限变更要求完成的时限变更状态RFC所处的状态变更主管填入变更主管姓名,变更请求应当先由变更主管检查变更主管提交时间变更主管提交变更请求的时间变更审批记录记录变更审批的历史记录,包括审批人姓名审批结果原因时间变更计划包括变更的实施计划、测试计划、回退计划等,以及变更任务分配给哪些实施者变更日程安排变更实施的时间安排变更实施情况由变更实施人填写,用于描述实施时的现场情况变更测试情况描述测试的情况、测试结果变更观察情况描述变更结束后,观察期间的情况变更关闭状态完全成功部分成功取消拒绝关闭时间变更关闭的时间关闭人关闭人的姓名24配置管理241描述配置管理是一个描述、跟踪和汇报所有IT基础架构中的每一个设备或系统的管理流程。这些设备和系统被称为配置元素CI。每一个CI必须被有效管理、跟踪和控制以支持IT服务和基础设施成功运行。配置管理流程所管理的配置元素包括硬件、软件和网络设备、文档等IT基础架构中所有必须控制的组成部份。所有的数据存在配置管理数据库CMDB中。在说明一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论