中国移动业务支撑网网管系统_第1页
中国移动业务支撑网网管系统_第2页
中国移动业务支撑网网管系统_第3页
中国移动业务支撑网网管系统_第4页
中国移动业务支撑网网管系统_第5页
已阅读5页,还剩119页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国移动业务支撑网网管系统维护管理流程梳理项目广东省问题管理流程细化说明书惠普咨询顾问小组北京市朝阳区建国路112号中国惠普大厦861065643888文档信息项目名称中国移动业务支撑网网管系统维护管理流程梳理项目项目经理侯红燕文档版本编号VER13项目阶段实施文档提交日期2006419起草人文档起草日期2006125复审人复审日期2006314分发名单来自FROM日期电话/传真HP咨询顾问小组2006041901065643888给TO操作截止日期电话/传真伍春萍经理审核2006041913802880810赵朋审核2006041913802881222操作类型批准,复审,通知,存档,所需行动,参加会议,其它请指明版本历史信息版本编号版本日期创建/修改人说明文件名122006315HP咨询顾问小组流程推广阶段交付版本问题管理流程细化说明书广东省V12DOC132006419HP咨询顾问小组根据集团公司概要设计V22修订问题管理流程细化说明书广东省V13DOC版权说明本文件中出现的任何文字叙述、文档格式、插图、照片、方法、过程等内容,除另有特别注明,均为保密信息。任何个人、机构未经中国移动通信有限公司与中国惠普有限公司的书面授权许可,不得复制、引用或传播本文件的任何片断,无论通过电子形式或非电子形式。目录41综述11设计目的412适用范围413相关术语42问题管理流程设计621流程目的622流程主要内容623与其他流程的关系724流程范围725流程执行原则726流程相关定义927流程概要设计1328流程详细设计1529问题状态迁移图23210关键角色、职责定义26211关键流程衡量指标29212集团、省公司两级交互30213省公司报表30214省公司上报报表35综述设计目的本问题管理细化流程说明书是在概要设计基础上,通过对各省业务支撑网维护管理流程现状的了解和分析得出。本流程说明书旨在帮助省公司业务支撑网维护管理能够有效降低或消除相应突发事件,提高IT系统和服务的质量,向业务人员和相关用户提供更优质的IT服务,以有效地帮助省公司的业务支撑网维护管理从被动管理转向主动管理。适用范围本问题管理流程适用于中国移动集团公司和省公司的业务支撑系统维护工作中的问题管理。相关术语ITIL(ITINFRASTRUCTURELIBRARY)是英国政府在1987年制定的有关IT服务管理的方法论,现已成为事实上的IT管理标准。帮助台(SERVICEDESK)帮助台从根本上来说是提供了用户和IT部门的唯一接口。此项功能常通过集中方式提供服务。帮助台的根本目的是提供初始支持,并通过变通方法、解决方案或升级到一线、二线支持等手段帮助用户恢复到正常工作状态。事件管理(INCIDENTMANAGEMENT)ITIL流程之一,事件管理负责解决所有的IT事件、问题和用户请求。它的目的是尽快恢复被中断或受到影响的IT服务,所以它的特点往往是以解决表征现象为目的,而不在于查找根本原因。问题管理(PROBLEMMANAGEMENT)ITIL流程之一,问题管理负责解决重大紧急事件或具有相同症状的一组事件。它的目的是找出事件的根本原因,并通过解除该根本原因从而防止类似事件的再次发生。同时问题管理流程也负责预防事件的发生。配置管理(CONFIGURATIONMANAGEMENT)ITIL流程之一,配置管理负责描述,跟踪和汇报所有IT基础架构中的每一个设备或系统的管理流程。这些设备和系统被称为配置项CI。每一个CI必须有效管理,跟踪和控制以支持公司的IT服务和基础设施成功运行。配置管理数据库(CMDBCONFIGURATIONMANAGEMENTDATABASE)是在配置管理流程中用于记录企业所有IT相关配置项信息及其相互关系而建立的数据库。变更管理(CHANGEMANAGEMENT)ITIL流程之一,通过控制和管理IT相关的变更,使变更对生产环境可能的影响和风险将到最小,从而提高IT环境的整体稳定性。问题管理流程设计流程目的问题管理流程的根本目的是消除或减少生产环境中事件发生的数量和严重程度,从而为企业建立一个稳定的IT环境,提高IT服务的可用性。此流程对发生在中国移动业务支撑系统生产环境中的问题进行管理,找出产生这些问题的根本原因,然后根据需要通过变更请求RFC、变通方法或建议的预防性措施来防止事件的再次发生。问题管理流程常常需要和变更管理流程一起来实施找出的解决方案,以便从根本上解决问题。其目的包括分析并确定事件的根本原因,找到最终解决方案,以防止此类事件再次发生确保问题分派了正确支持人员,提高解决率根据问题优先级合理分派IT资源对事件记录做趋势性分析,主动提供预防性措施提高IT服务的可靠性降低IT支持成本流程主要内容问题管理流程着重于消除事件或减少事件发生,确定事件的根本原因。主要活动包括分析事件、找出问题、分派问题、确定根本原因以及找出解决方案、回顾及关闭,以消除事件或在其发生时降低对用户或业务的影响。其主要内容如下分析事件定期分析事件,找出潜在问题。生成问题记录在系统中生成问题记录并把所有相关事件与此记录关联起来紧急事件处理完后定义为问题技术支持专家在日常维护中发现的问题事件历史记录趋势分析分派根据问题内容将问题记录分派给适当的技术小组。根本原因分析被分派的小组人员将调查问题以期找出其原因,制定解决方案、变通方法或提出预防性措施,以消除产生原因,或在重发时使其影响力最小化。记录必须被更新以反映它是已定位原因状态,并且把任何变通方法、避免或最小化负面影响的动作行为也记录下来(如果需要添加到知识库中)。开发、确认、提出实施解决方案对问题的解决方案进行评估、测试,提出变更请求(RFC)或实施具体的解决方案。回顾对问题的解决方案进行回顾,确认解决方案达到了预期的效果。总结及关闭确认问题的信息记录填写完整,并关闭问题记录。与其他流程的关系和事件管理流程的关系紧急事件将升级为问题,或根据事件的趋势分析,发现潜在的问题,同时问题的解决方案实施为事件流程提供了解决办法。和变更管理流程的关系问题管理流程的解决方案常常需要通过变更管理流程来完成,因此问题管理将会提出变更申请给变更管理流程。和配置管理流程的关系配置管理提供配置项信息给问题管理流程。流程范围问题管理流程范围是对BOSS系统、客服系统、经营分析系统、容灾系统和BOSS网管的IT生产环境中发生的问题进行管理,以采取主动性预防措施来降低事件数量。问题管理范围不包括处于开发或测试环境的系统和应用流程执行原则常规原则建立独立问题管理流程,在整个企业范围内应该与事件管理流程相对独立,事件经理与问题经理应该尽可能的由不同的人员担任应该每半年对问题管理流程的流程关键衡量指标、流程执行效率、流程支撑工具有效性等进行回顾,以改进和优化流程应该每月定期回顾和产生问题管理报表,对没有解决的问题,应该举行定期的问题管理会议对这些问题进行评估流程关联原则和事件管理的关联所有优先级为紧急的事件在恢复服务后,都应该创建问题单(问题单必须和事件单建立关联)和变更管理的关联问题处理过程中,如果需要对系统进行变更,必须按照变更管理的定义,提交变更请求单(变更单必须和问题单建立关联),变更完成后,继续问题单的处理和配置管理的关联问题处理过程中,可以通过配置管理查询相关的配置项信息问题处理过程中,如果可以将根本原因定位到某个配置项,则必须将问题单与该配置项关联所有权原则有效管理问题的前提是必须确保每个问题在任何时段都有适当的人员负责问题首先由问题经理审核,再负责分派给合适的问题处理专家或组当问题分派到问题处理专家后,问题处理专家负责该问题的诊断与解决问题经理负责与服务台或问题请求者沟通问题处理过程中的关键信息再分派原则再分派又称转派,它确保问题单不被过于频繁的相互转派、以至于无法在规定时间内得到解决,应当尽量减少问题单再分派的几率,一个问题单再分派的次数不应该超过两次。问题单再分派必须经过问题经理。重复问题原则重复问题是指经过分析之后,根本原因相同的问题。例如问题处理专家提出了几个问题,但是经过分析之后,发现这几个问题的根本原因是相同的,这几个问题就可以定义为重复问题。对于重复问题需要进行标志,将相关问题记录进行关联,当问题解决时同时进行回顾。问题关闭原则通常,问题单在实施了解决方案之后,需要经过一段时间的回顾,由问题处理专家和问题经理一起来回顾解决方案是否达到了预期的效果,如果成功的实施,则提交给问题经理,由问题经理确认问题信息记录完整,关闭问题。问题单重开原则已关闭的问题单不允许重开。如果问题重复发生,则创建一个新的问题单。趋势分析原则问题经理定期组织会议,对所处理事件历史记录进行趋势分析参加者应包括事件经理及问题处理专家会议定期组织定义趋势分析规则流程相关定义问题信息项问题单包含如下信息项序号信息项描述1问题ID为每个问题分配一个唯一的序列号(系统自动产生)2请求人信息问题请求人的信息,包括姓名、省/分公司、部门、电子邮件、办公电话、手机(手工填写)3登记时间生成问题记录的时间(系统自动产生)4地点记录问题发生的地点(手工填写)5问题来源参见“问题来源”定义6问题优先级参见“问题优先级”定义7问题所属系统类型参见“问题所属系统类型”定义8问题分类参见“问题分类”定义9问题标题简单描述问题(手工填写)10问题描述详细描述问题内容(手工填写)11问题拒绝原因详细描述拒绝问题原因,并推荐其他专家或专家组(手工填写)12变通方法详细记录问题的变通方法13问题原因详细记录问题产生的根本原因(手工填写)14重复问题标记标记为重复问题,用已有标题号标注(手工填写)15问题状态参见“问题状态”定义16分配对象将问题分配到各组问题处理专家(手工填写)17问题日志反映问题处理过程中问题信息项的变化历史,包括分配的人员,状态等信息(系统自动产生)18实际开始诊断时间问题状态更新为“分析中”的时间(手工填写)19实际诊断结束时间问题状态更新为“已有解决方案”的时间(手工填写)20解决方案问题解决方案的详细描述(手工填写)21相关联的地市/部门受影响的地市或部门(手工填写),以便于解决方案通告或订制变更实施范围时参考22问题结束代码参见“问题结束代码”定义23问题无法解决原因解释问题无法解决的原因(手工填写)24关联配置项记录问题的配置项代码(手工填写)25关联的事件单号记录引发该问题的事件单号(手工填写)26关联的变更单号记录由问题发变更时,关联的变更单号(手工填写)27是否由重大事件升级“是”或“否”,在问题创建时,根据关联的事件手工填写28问题关闭时间当问题状态更新为“结束并关闭“的时间(手工填写)问题来源根据问题的不同来源对问题分类如下编号代码描述1事件升级紧急事件恢复服务后提出的问题,以便进行紧急事件的根本原因分析。例如某日发生了一起集群无法切换的事件,导致某台主机发生故障后,没有切换到备用主机中去,从而影响了业务,紧急事件的处理人员在采取了手工切换的替代措施后,恢复了服务。为了分析为什么会发生该紧急事件,以及查看其他的集群是否也存在类似的问题,此时可以提出一个问题记录,以便对该紧急事件进行分析。2维护中提出技术专家在日常维护工作中提出的问题。例如维护专家在日常维护中发现,目前的数据库版本可能会存在着死锁、心跳不一致确矫娴奈侍猓耸本涂梢蕴岢鲆桓鑫侍饧锹迹员惴治觥3趋势分析分析事件记录找出的问题。例如在定期的会议中,对计费类的事件进行分析后发现,上周该类型的事件比平常的时候多了30,超过了规定的阀值,这表明计费系统有可能存在着一些潜在的隐患,此时就可以提出一个问题记录,以找出问题的原因并解决。问题优先级问题的优先级是问题处理专家解决问题的参照标准,对于关键优先级的问题,管理层应该优先协调资源进行这些问题的解决。结合中国移动的实际情况,问题的优先级定义如下编号代码描述1关键紧急事件升级来的问题;维护专家提出或趋势分析产生的问题从如下方面考虑,问题是否影响到关键业务(如综合帐务、定单管理、电话呼叫中心等)影响范围极大(如一个关键地区或半数以上非关键地区)紧迫程度最高(如必须马上着手处理)问题处理后可大幅节省投资、人力,有效提高服务质量和维护效率2重要从如下方面考虑,问题是否影响到较关键业务(如综合采集、融合计费、产品管理等)影响范围较大(如一个以上非关键地区)紧迫程度较高问题处理后可有效节省投资、人力,一定程度提高维护质量3普通从如下方面考虑,问题是否影响到非关键业务有一定影响范围问题处理后对维护质量和效率的提升有限问题状态为了记录问题处理的生命周期,需要设置不同的状态加以描述,如下所示编号代码描述1已登记问题登录到系统中2分析中问题处理专家正在分析问题过程中3已定位原因问题根本原因已找出4已有解决方案解决方案已找到5已提出变更请求已提交变更请求(RFC)6已回顾已经对问题进行了回顾7结束并关闭问题结束问题所属系统类型根据业务支撑系统架构的问题所属的业务系统定义,当问题发生时,可以初步定位到是哪个系统出现问题。注条目类需要在软件平台实施时提供可配置接口,做到“其他系统”内的子类以及所有“条目”可添加、删除和修改。业务系统子类条目BOSS系统营销管理开户过户销户停机开机渠道管理客户服务产品管理客户管理资源管理订单管理服务开通综合采集融合计费综合帐务综合结算合作伙伴管理系统管理统计报表一级BOSS其它客服系统电话呼叫中心互联网呼叫中心短信呼叫中心工单管理知识管理人力资源质量管理数据统计分析其它经营分析通用分析专题分析其它容灾系统BOSS数据保护BOSS业务接管BOSS资源复用其它BOSS网管监控管理服务管理其它其它系统110系统12580系统AMS系统GMCC网站动感地带网站其他问题分类问题分类是针对问题所属的专业类型进行划分的,通过问题分类可以定位解决问题的人,并针对问题分类进行分类统计。问题的分类层次设计不超过三层,第一级分类,称之为“类别”,第二级分类,称之为”子类”,第三级分类,称之为”条目”。注条目类需要在软件平台实施时提供可配置接口。做到“子类”和“条目”可增加、删除和修改。类别子类条目系统硬件路由器网络交换机小型机PC服务器磁盘阵列存储光纤交换机磁带库光盘库客服设备排队机CTI服务器CCSIVR服务器安全设施防火墙IDS入侵监测系统IPS入侵防护系统防毒墙安全软件系统软件操作系统数据库中间件集群软件备份软件系统管理软件营销规则引擎配套设施UPS空调其它应用软件进程数据参数代码接口问题结束代码为了表明问题的不同解决方式,定义如下结束代码编号代码描述1根本解决找出问题的根本原因,并得到解决方案,成功解决2变通方法没有根本解决方案或目前没有办法实施根本解决方案,但有临时解决方案作为变通方法3无法解决未找到问题的根本原因,没有解决方案,或目前无法实施解决方案,也无变通方法4取消问题被问题经理拒绝流程概要设计问题管理概要设计流程图如下问题管理概要流程描述如下序号步骤名称责任人说明3001问题识别与记录问题处理专家/问题经理对紧急事件、来自维护管理技术专家发现的问题以及通过对事件记录进行的分析发现的潜在问题,根据需要在系统中进行记录,并对问题信息进行描述。根据问题所属领域进行分类,并初步判断问题的优先级。3002问题审核问题经理问题经理对新建的问题进行审核问题经理确定问题是否有效、是否是重复问题,优先级的分配是否合适,问题信息项填写是否完整。如果问题确认无效,则关闭问题,并通知请求者。上报集团公司问题经理对确认有效的问题,如果其优先级是”关键”,在处理的同时,将问题升级到部门主管领导、省公司领导及集团,同时也需要将问题处理的关键状态定时上报。3003问题分派问题经理根据问题的分类,把问题分派给相应问题处理专家。如问题处理专家发现问题应该由其他组分析解决,就把问题发回问题经理,注明拒绝理由并推荐其他分析组。3004分析并诊断问题/提供变通方法问题处理专家问题处理专家接受问题,更新问题状态及实际开始诊断时间如需其他问题处理专家协助分析、诊断,则通知问题经理,由问题经理协调资源,成立问题分析小组,举行问题根本原因分析研讨会议,并确定问题的潜在原因,提供或更新问题变通方法,以降低问题在根本解决前对业务产生的影响;将问题产生根本原因及变通方法及时更新到问题记录中;将问题根本原因及变通方法通知问题经理;如果问题处理专家预计无法找到问题的根本原因,及时通报问题经理。3005问题监控问题经理问题经理负责问题分析、诊断、解决过程中的跟踪和监控在问题找到根本原因或解决方案之后,根据需要,向帮助台或问题请求人员通报该问题的解决情况,以帮助和提高事件的解决率。对于问题处理专家认为无法找到根本原因或虽有解决方案,但目前无法实施(如实施的代价太大等),问题经理协调问题处理专家进行分析判断,决定该问题是继续诊断、解决还是关闭该问题。3006开发、确认、实施解决方案问题处理专家对于已经找到根本原因的问题,需要确定解决方案,以便永久的解决。推荐并测试根本性解决方案,并确保这些方案彻底解决问题,更新问题记录中的实际诊断结束时间。判断实施上述解决方案/变通方法是否需要通过其他流程(如变更流程等)如需要,提交到相应的流程,并和该流程人员保持沟通,了解问题的解决状况;如不需要变更,计划并组织实施解决方案以解决问题。如果需要第三方介入,则问题处理专家负责与第三方的接口与协调。如果问题处理专家预计在无法找到根本解决方案或虽有解决方案但目前无法实施(如实施的代价太大),通报问题经理。3007问题回顾问题处理专家问题处理专家对问题进行回顾,确认问题是否被正确的解决,如果没有解决,转到3004分析并诊断问题/提供变通方法。3008问题总结与关闭问题经理问题经理对问题记录的信息项进行总结,更新问题记录并关闭问题。对于由紧急事件产生的问题上报集团。流程详细设计问题管理详细流程设计如下(3001)问题的识别与记录详细流程描述如下序号步骤名称责任人输入输出说明趋势分析问题经理事件详细记录事件趋势,潜在问题问题经理周期性的召集由事件经理、问题处理专家参加的会议,对事件记录详细信息进行趋势分析(可以每周/每月为周期)在本周期内每类事件的数量发生的频度有不断增加的趋势的事件对于没有根本解决的事件记录进行分析可采取趋势突变法(如有30增长率的某类事件)或阈值法对事件进行分析,发现需进一步分析的潜在问题。另外,问题经理也可以根据需要召集问题处理专家等相关技术人员对于未根本解决的问题进行再次分析,以决定是否需要创建问题来进一步分析。事件升级事件经理紧急事件详细记录在紧急事件处理完成后无论是否根本解决,都由事件经理将紧急事件的处理情况、事件记录提交给问题经理。刑岢维护专家由维护技术人员在日常维护工作中根据自己的经验或分析,在自己负责的领域内发现并提出的问题请求通过日常巡检发现的问题对日常维护监控数据进行分析30011创建问题记录问题经理/问题处理专家问题记录综合上述三种情况,由问题经理或问题处理专家在系统中创建问题记录选择问题来源;记录问题详细描述,包括产生时间、地点、标题及现象描述等,例如在问题描述中也需要指出问题的来源具体人员;问题状态设置为“已登记”。30012初步确定问题优先级及分类问题经理/问题处理专家问题记录问题优先级/分类问题记录创建时,问题创建人需要完成根据问题记录的实际情况及预先制定的优先级描述,初步给问题记录分配相应的优先级代码;根据问题的来源和所涉及的领域,及已定义的分类原则,初步对问题进行分类。30013关联相关CI及事件记录问题经理/问题处理专家问题记录进行关联之后的问题记录根据问题记录的信息描述,对创建的问题记录关联相关CI,并将问题与系统中的事件记录进行关联。以利于问题处理专家对问题的分析、解决。例如问题记录是由紧急事件升级而成的,此处便可以将该问题记录与原紧急事件记录做关联。(3002)问题审核详细流程描述如下序号步骤名称责任人输入输出说明30021审核问题记录的完整性问题经理审核后的问题记录需完善的问题记录/通知问题请求者问题经理对新登记的问题记录进行审核,检查问题记录信息是否正确和完整;如果问题记录信息不完整或不正确,则通知问题请求者,由其提供完善的问题信息。问题有效吗问题经理问题经理审核该问题的有效性,如问题经理需判断该问题是否值得解决、该问题是否在将来的版本中已经考虑等,如果是无效问题,到30022关闭问题记录/通知问题请求者。30022关闭问题记录/通知请求者问题经理问题记录关闭问题记录更新该问题记录信息,更新该问题的状态代码为“关闭“,更新结束代码为“取消”,关闭该问题记录。通知问题请求者,如自动触发EMAIL。重复问题吗问题经理判断该问题是否与系统中的其他问题记录匹配,如果是,到30023标志重复问题。30023标志重复问题问题经理问题记录已标志重复的问题标记使用已有问题的问题ID更新该问题信息单中的问题重复标记。该问题的分析诊断及状态变化将与原主问题保持一致。优先级/分类正确吗问题经理判断该问题的优先级及分类是否正确,如果不正确,到30024更新正确优先级/分类。30024更新正确优先级/分类问题经理更新的问题记录更新问题记录中的优先级及分类代码。是关键问题吗问题经理问题记录关键问题上报集团公司如果是,将关键问题的信息上报集团公司。(3003)问题分派详细流程描述如下序号步骤名称责任人输入输出说明30031分派问题到问题处理专家问题经理问题记录已分配的问题根据问题所属类别,把问题分派给相应的问题处理专家。若问题比较复杂,问题经理需组建问题分析小组,并将该问题分配给当中最主要的处理人员。接受吗问题处理专家已分派问题拒绝分派问题问题处理专家在收到问题经理分派的问题后,对问题进行初步分析,以决定接受与否如拒绝,注明拒绝的理由,并推荐相应的工作组或个人,将问题发回问题经理重新进行分派,并通知问题经理;如接受,则将状态改为“分析中”,转向3004分析并诊断问题/提供变通方法。(3004)分析并诊断问题/提供变通方法详细流程描述如下序号步骤名称责任人输入输出说明30041查找可能原因列表问题处理专家已分配问题记录问题可能原因列表问题处理专家对问题进行分析,找出可能的原因列表。如果该问题比较复杂,需要其他专业组配合,则通知问题经理来协调资源,召开问题分析小组会议来共同分析。30042确认问题根本原因问题处理专家问题可能的原因列表问题根本原因分析问题的原因列表,找出最有可能的原因并测试,从而确定问题的根本原因;当问题处理专家预见或确认目前不能确定问题的根本原因时,通报问题经理,来共同分析对该问题的处理。30043推荐变通方法问题处理专家问题根本原因变通方法问题处理专家根据需要制定相应的变通方法(如果已预见到根本性解决问题需要时间而问题需要首先临时性解决或得到控制),以降低问题的影响;将问题根本原因及变通方法信息更新到问题管理系统中,并更新问题状态为“已定位原因”,并通报问题经理;如需要,更新相应的知识库。(3005)问题监控详细流程描述如下序号步骤名称责任人输入输出说明30051检查问题状态问题经理问题记录问题经理定期检查问题状态,当检查问题的处理情况,认为需要时;接受到问题处理专家在问题分析诊断及解决过程中发来的的通报时。问题经理(需要时协调问题处理专家)根据问题记录的当前状态、现在的解决进度等来分析判断该问题如何继续。需要通报吗问题经理判断该问题是否需要与帮助台、问题请求者等沟通,如果需要通报,则转到30052通报问题原因/变通方法。20052通报问题原因/变通方法/根本解决方案问题经理需要通报的问题信息如需要,及时将问题根本原因/变通方法/根本解决方案通知(通过电话,EMAIL等)帮助台及问题请求者,使帮助台能快速响应类似或相关事件,降低对业务的影响。需要上报吗如果是关键问题的状态更新为“已定位原因”或“已有解决方案”,则需要将问题的信息单上报。需要关闭吗问题经理问题信息判断该问题记录是否需要关闭,例如根据分析判断目前无法找到该问题的根本原因或无法根本解决该问题,或该问题已经消失等,或者由于其他原因需要将该问题记录关闭;如果需要关闭,则转到30053协调/通知相关人员。20053协调/通知相关人员问题经理问题记录需关闭问题问题经理与问题处理专家沟通将关闭该问题,并通知问题请求者。(3006)开发、确认、实施解决方案详细流程描述如下序号步骤名称责任人输入输出说明30061尝试找出解决方案问题处理专家根本原因已找到的问题可能解决方案根据问题的根本原因,问题处理专家尝试找出所有可能的解决方案。30062记录最可能解决方案问题处理专家解决方案对所有可能的解决方案进行分析,找出最有可能的解决方案,并对解决方案进行测试;确认问题根本解决方案,并详细更新到问题记录系统中,更新问题记录的状态为“已有解决方案”,并通报问题经理;当问题处理专家预见目前不能实施根本解决方案时,通报问题经理,来共同分析对该问题的处理。需要变更吗问题处理专家判断实施解决方案是否需要进行变更,如果需要转30063提交RFC/监视变更的实施;如果不需要变更,转30064计划和安排实施。30063提交RFC/监视变更的实施问题处理专家变更请求填写变更请求单(RFC),提交到变更管理流程,并跟踪监视变更的实施情况,更新问题状态为“已提出变更请求”。30064计划和安排实施问题处理专家实施解决问题处理专家(必要时协调问题经理)组织人员实施解决方案制定方案实施计划,包括参加人员,实施时间等;实施解决方案。(3007)问题回顾详细流程描述如下序号步骤名称责任人输入输出说明30071对问题进行回顾问题处理专家问题的解决方案已经实施根据问题的描述、优先级以及具体的解决方案等内容,对问题的改正效果进行监控,以确保问题被正确的解决。问题都解决了吗问题处理专家判断问题是否被正确的解决,如果问题没有被正确解决,转3004分析并诊断问题/提供变通方法,重新对问题的根本原因进行分析。问题优先级为关键吗问题处理专家判断是否是关键问题,如果是,转30072编写关键问题报告;如果不是,转3008问题总结与关闭。30072编写关键问题报告问题处理专家关键问题问题分析报告编写关键问题报告,内容包括问题描述、原因分析、解决方案、经验总结。(3008)问题总结与关闭详细流程描述如下序号步骤名称责任人输入输出说明30081对问题记录进行检查问题经理问题信息完善的问题信息检查问题信息项的填写情况,例如问题描述是否恰当、问题的根本原因、变通方法及解决方案是否填写完整等,如需要,做必要调整,以确保每条问题的信息记录准确且完整。30082对问题进行总结问题经理问题信息预防措施针对问题产生原因,分析当前运营环境中是否有类似情况,借鉴本问题的根本原因及解决方案,提前预防;对由重大事件产生的关键问题,参照问题处理专家编写的”关键问题报告”,完成”重大事件问题分析报告”,内容包括问题的发生时间、处理人、处理过程、影响范围、原因分析、解决方案、后续工作及经验归纳;对其他关键问题,审核相应的”关键问题报告”。30083关闭问题问题经理状态选择相应的结束代码,更新问题状态为“结束并关闭”;对于重大事件产生的关键问题,需将问题信息单及”重大事件问题分析报告”上报集团公司;对于其他关键问题,需将问题信息单及”关键问题报告”上报集团公司;关闭问题记录,如需要,通报事件管理流程。问题状态迁移图当前状态为已登记状态时,可迁移的状态状态合法描述分析中是问题经理将问题分派给问题处理专家,问题处理专家开始分析诊断已定位原因否已有解决方案否已提出变更请求否已回顾否结束并关闭是对于无效问题,可以结束并关闭当前状态为分析中状态时,可迁移的状态状态合法描述已登记否已定位原因是经过问题处理专家分析,找到根本原因已有解决方案否已提出变更请求否已回顾否结束并关闭是对于现在判断无法找到根本原因,但需关闭的问题当前状态为已定位原因状态时,可迁移的状态状态合法描述已登记否分析中否已有解决方案是经过问题处理专家分析测试,找到根本解决方案已提出变更请求否已回顾否结束并关闭是对于现在判断无法找到根本解决方案,但需关闭的问题当前状态为已有解决方案状态时,可迁移的状态状态合法描述已登记否已登记为问题单初始状态分析中否已定位原因否已提出变更请求是如果实施问题解决方案需要通过变更管理流程,提出变更请求已回顾是实施完成后,已对问题解决方案回顾完成结束并关闭是对于现在判断无法实施解决方案,但需关闭的问题当前状态为已提出变更请求状态时,可迁移的状态状态合法描述已登记否已登记为问题单初始状态分析中否问题经理将问题分派给问题处理专家,问题处理专家开始分析诊断已定位原因否已有解决方案否已回顾是问题经实施完成后,进入回顾结束并关闭否当前状态为已回顾状态时,可迁移的状态状态合法描述已登记否分析中是对于问题回顾后发现没有根本解决的问题,由问题处理专家重新进行分析已定位原因否已有解决方案否已提出变更请求否已回顾否结束并关闭是实施回顾后,结束并关闭当前状态为结束并关闭状态时,可迁移的状态不迁移至任何状态。关键角色、职责定义流程的实现是通过不同的流程角色以及其所赋予的职责来实现的,因此流程的每一个角色可以被定义为一系列职责的集合。在实际的管理操作中,不同的角色可以将被赋予不同的人员,也可能一个人被赋予多个角色,同时也可以将其职责授权给其管理结构之下的人员。因此,以下所提及的问题管理流程和角色的目的是为了在充分满足流程所需角色的基础上,为具体的实现提供足够的灵活性。具体部署由中国移动在实际实施中的流程执行负责人决定。问题管理流程主要分为问题管理流程负责人、问题经理及问题处理专家三个角色。问题管理流程负责人问题管理流程负责人从总体上对问题管理流程的设计、实施、执行及优化负责,确保问题管理流程在业务支持中心范围内被正确的执行。当流程不能够适应业务支持中心的情况时,流程负责人必须及时的对此进行分析、找出缺陷、进行改进,从而实现可持续提高。职确保问题流程的设计、实施及执行,能够取得管理层的参与和支持确保问题流程符合公司实际状况和公司IT发展战略整体上对问题流程负责,建立流程实施、评估和持续优化机制确保问题流程的有效执行,定期评估流程,制定流程改进计划保持与其他流程负责人的定期沟通技能要求深刻理解问题管理流程充分理解业务支撑网维护管理流程梳理项目的其他流程,能够进行流程接口设计能够很好地理解业务对于问题管理的需求对质量控制与保障有很深入的了解有决策权,能够确保问题管理流程设计要求在实施项目中得到贯彻和执行具有很好的沟通技能,能够取得公司高层的支持,获得所需资源具有较强的计划、组织、领导和控制才能,能够综合各方意见,按时制订和定期优化问题管理流程问题经理问题经理负责协调日常的问题管理工作,包括对问题的审核、监控、所需资源的协调、定期产生报表等。职责领导问题管理小组,确保大家的积极性、技能水平定期组织相关人员对事件记录进行分析,发现潜在问题确认和审核问题必要时对问题进行上报监视问题的诊断、分析和处理过程必要时与帮助台及问题请求者沟通问题的相关信息必要时协调所需资源定期制定问题报表,提供正确决策信息技能要求具有较好的沟通和口头表达能力熟悉技术平台和技术环境较强的分析事件趋势的能力深刻熟悉问题管理流程问题处理专家问题处理专家为问题的诊断及解决提供技术支持。通常由各专业组技术人员承担。职责接受问题经理分派过来的问题分析和诊断问题,确定根本原因确定和测试解决方案提交变更请求并监控变更实施协助事件支持人员进行重大或紧急事件的处理需要时协调第三方的资源来帮助诊断和改正问题技能要求较强的问题解决能力,能够对问题进行分析并给出解决方案较强的专业知识较强的分析问题的能力和技巧较好的沟通和表达能力流程角色和人员对应表角色成员问题管理流程负责人BOSS系统问题经理问题分析专家主机组存储组网络组中间件组数据库组应用维护组基础配套设施组客服系统问题经理问题分析专家主机组网络组存储组中间件组数据库组应用维护组基础配套设施组经营分析系统问题经理问题分析专家主机组网络组存储组中间件组数据库组应用维护组基础配套设施组BOSS网管系统问题经理问题分析专家主机组存储组网络组中间件组数据库组应用维护组基础配套设施组其他系统问题经理问题分析专家主机组存储组网络组中间件组数据库组应用维护组基础配套设施组容灾系统问题经理问题分析专家主机组存储组网络组中间件组数据库组应用维护组基础配套设施组注在软件平台实施时提供角色及成员可配置接口。平台实施前,由广东移动公司根据实际运维架构完成映射关键流程衡量指标为了较好地控制问题管理流程的质量,必须为问题管理流程设置考核指标,通过对指标的分析,可以有效地对流程的运行情况进行监控和改进。问题管理流程的关键衡量指标如下序号衡量指标指标计算说明1问题总数数量在问题单中根据以下条件过滤,【重复问题标记】为空【问题结束代码】不等于取消【登记时间】在统计周期内2已找到根本原因的问题数量数量在问题总数中,【问题状态】已定位原因的问题个数3趋势分析问题所占比率数量在问题总数中,【问题来源】趋势分析的问题个数比率数量/问题总数1004关闭问题数量数量【问题关闭时间】在统计周期内,【问题状态】结束并关闭的问题个数5通过变通办法解决的问题数量数量在关闭问题数量中,【问题结束代码】变通方法的问题个数6问题成功解决率数量在关闭问题数量中,【问题结束代码】根本解决的问题个数比率数量/关闭问题数量1007平均诊断时间诊断完成问题数量【实际诊断结束时间】在统计周期内的问题个数平均诊断时间累加诊断完成问题的(【实际诊断结束时间】【实际诊断开始时间】)/诊断完成问题数量集团、省公司两级交互为便于集团公司及时、准确地了解各省业务支撑网的问题管理流程执行状况,指导各省IT服务管理模式的规范化,集团公司业务支撑网网管系统可以实时或定期地获取各省公司业务支撑网网管系统的重要指标数据及统计报表数据。对于优先级为“关键”的问题,省公司应上报集团公司,并在该问题处理过程中的关键状态点,将最新问题记录信息上传到集团公司。在将来条件成熟时,集团公司收到各个省公司上报的问题信息后,对相应的解决方案加以收集、归纳、整理,形成全集团的知识,可以向其他省公司通报,以提高各个省公司的支撑水平。上报方式触发条件上报内容问题信息项附件内容(问题报告)服务管理平台问题经理审核后确认优先级为关键时所有问题信息项N/A问题状态更新为“已定位原因”时所有问题信息项N/A问题状态更新为“已有解决方案”时所有问题信息项N/A问题经理将问题关闭时所有问题信息项如果问题是由重大事件升级,上报时增加”重大事件问题分析报告”;报告内容包括问题的发生时间、处理人、处理过程、影响范围、原因分析、解决方案、后续工作及经验归纳。其他关键问题提供”关键问题报告”问题描述、原因分析、解决方案、经验总结。省公司报表省公司报表定义如下,同时,上报集团报表也可以供省公司使用。问题目录列表问题ID所属系统类型问题分类问题优先级问题来源问题处理专家问题状态问题描述根本原因变通方法解决方案实际诊断开始时间地点指标说明反映在统计周期内的未关闭的问题列表,包括问题ID、问题所属系统类型、问题分类、问题优先级、问题处理专家、问题状态,问题描述、根本原因、变通方法、解决方案、实际诊断开始时间及与该问题来源的相关联地市或部门。按照地市及优先级的问题记录统计报表地市公司/部门优先级问题总数问题来源问题状态平均诊断时间事件升级维护中提出趋势分析已登记分析中已定位原因已有解决方案已提出变更请求已回顾结束并关闭广州关键重要普通深圳关键重要普通指标说明序号指标名称指标计算说明1问题总数数量在问题单中根据以下条件过滤1【重复问题标记】为空2【问题结束代码】不等于取消3【登记时间】在统计周期内2事件升级数量在问题总数中,【问题来源】事件升级的问题个数3维护中提出数量在问题总数中,【问题来源】维护中提出的问题个数4趋势分析数量在问题总数中,【问题来源】趋势分析的问题个数5已登记数量在问题总数中,【问题状态】已登记的问题个数6分析中数量在问题总数中,【问题状态】分析中的问题个数7已定位原因数量在问题总数中,【问题状态】已定位原因的问题个数8已有解决方案数量在问题总数中,【问题状态】已有解决方案的问题个数9已提出变更请求数量在问题总数中,【问题状态】已提出变更请求的问题个数10已回顾数量在问题总数中,【问题状态】已回顾的问题个数11结束并关闭数量在问题总数中,【问题状态】结束并关闭问题个数12平均诊断时间诊断完成问题数量【实际诊断结束时间】在统计周期内的问题个数平均诊断时间累加诊断完成问题的(【实际诊断结束时间】【实际诊断开始时间】)/诊断完成问题数量13地市公司/部门按照【地点】字段过滤分类产生按照分类别统计的新增问题报表地市类别子类问题总数问题来源问题状态优先级事件升级维护中提出趋势分析已登记分析中已定位原因已有解决方案已提出变更请求已回顾结束并关闭关键重要普通广州(其他地市)系统硬件路由器网络交换机小型机PC服务器磁盘阵列存储光纤交换机磁带库光盘库客服设备排队机安全设施防火墙IDS入侵监测系统IPS入侵防护系统防毒墙安全软件系统软件操作系统数据库中间件集群软件备份软件系统管理软件营销规则引擎配套设施UPS空调其它应用软件进程数据参数代码接口指标说明序号指标名称指标计算说明1地市按照【地点】过滤分类产生2问题总数数量在问题单中根据以下条件过滤1【重复问题标记】为空2【问题结束代码】不等于取消3【登记时间】在统计周期内3事件升级数量在问题总数中,【问题来源】事件升级的问题个数4维护中提出数量在问题总数中,【问题来源】维护中提出的问题个数5趋势分析数量在问题总数中,【问题来源】趋势分析的问题个数6已登记数量在问题总数中,【问题状态】已登记的问题个数7分析中数量在问题总数中,【问题状态】分析中的问题个数8已定位原因数量在问题总数中,【问题状态】已定位原因的问题个数9已有解决方案数量在问题总数中,【问题状态】已有解决方案的问题个数10已提出变更请求数量在问题总数中,【问题状态】已提出变更请求的问题个数11已回顾数量在问题总数中,【问题状态】已回顾的问题个数12结束并关闭数量在问题总数中,【问题状态】结束并关闭问题个数13关键数量在问题总数中,【问题优先级】关键的问题个数14重要数量在问题总数中,【问题优先级】重要的问题个数15普通数量在问题总数中,【问题优先级】普通的问题个数按照分类别统计的已关闭问题报表地市类别子类关闭问题数量结束代码平均诊断时间根本解决变通方法无法解决取消关键重要普通广州(其他地市)系统硬件路由器网络交换机小型机PC服务器磁盘阵列存储光纤交换机磁带库光盘库其它客服设备排队机安全设施防火墙IDS入侵监测系统IPS入侵防护系统防毒墙安全软件系统软件操作系统数据库中间件集群软件备份软件系统管理软件营销规则引擎配套设施UPS空调其它应用软件进程数据参数代码接口指标说明序号指标名称指标计算说明1地市按照【地点】过滤分类产生2关闭问题数量数量【问题关闭时间】在统计周期内,【问题状态】结束并关闭的问题个数3根本解决数量在关闭问题数量中,【问题结束代码】根本解决的问题个数4变通方法数量在关闭问题数量中,【问题结束代码】变通方法的问题个数5无法解决数量在关闭问题数量中,【问题结束代码】无法解决的问题个数6取消数量在关闭问题数量中,【问题结束代码】取消的问题个数7平均诊断时间(优先级为关键)诊断完成问题数量【实际诊断结束时间】在统计周期内,【问题优先级】关键的问题个数平均诊断时间累加诊断完成问题的(【实际诊断结束时间】【实际诊断开始时间】)/诊断完成问题数量8平均诊断时间(优先级为重要)诊断完成问题数量【实际诊断结束时间】在统计周期内,【问题优先级】重要的问题个数平均诊断时间累加诊断完成问题的(【实际诊断结束时间】【实际诊断开始时间】)/诊断完成问题数量9平均诊断时间(优先级为普通)诊断完成问题数量【实际诊断结束时间】在统计周期内,【问题优先级】普通的问题个数平均诊断时间累加诊断完成问题的(【实际诊断结束时间】【实际诊断开始时间】)/诊断完成问题数量省公司上报报表统计周期每月1号0时每月最后一天24时(日历时间)。上报时间在每个月的第5个工作日上报上个统计周期的报表数据。按业务系统对新增问题进行统计业务系统新增问题总数问题来源优先级事件升级维护中提出趋势分析关键重要普通BOSS系统客服系统经营分析容灾系统BOSS网管指标说明序号指标名称解释指标计算说明1新增问题总数在统计周期内新增的问题,剔除掉重复问题、被问题经理拒绝等非有效问题。数量在问题单中根据以下条件过滤1【重复问题标记】为空2【问题结束代码】不等于取消3【登记时间】在统计周期内2问题来源在新增问题总数中,分别统计不同问题来源的问题数量在新增问题总数中,分别过滤不同的【问题来源】,包括事件升级、维护中提出、趋势分析3优先级在新增问题总数中,分别统计不同优先级的问题数量在新增问题总数中,分别过滤不同的【问题优先级】,包括关键、重要、普通4业务系统按问题所属业务系统分别统计分别过滤【问题所属系统类型】的业务系统按问题分类对新增问题进行统计类别子类新增问题总数问题来源优先级事件升级维护中提出趋势分析关键重要普通系统硬件路由器网络交换机小型机PC服务器磁盘阵列存储光纤交换机磁带库光盘库客服设备排队机CTI服务器CCSIVR服务器安全设施防火墙IDS入侵监测系统IPS入侵防护系统防毒墙安全软件系统软件操作系统数据库中间件集群软件备份软件系统管理软件配套设施UPS空调其它应用软件进程数据参数代码接口指标说明序号指标名称解释指标计算说明1新增问题总数在统计周期内新增的问题,剔除掉重复问题、被问题经理拒绝等非有效问题。数量在问题单中根据以下条件过滤1【重复问题标记】为空2【问题结束代码】不等于取消3【登记时间】在统计周期内2问题来源在新增问题总数中,分别统计不同问题来源的问题数量在新增问题总数中,分别过滤不同的【问题来源】,包括事件升级、维护中提出、趋势分析3优先级在新增问题总数中,分别统计不同优先级的问题数量在新增问题总数中,分别过滤不同的【问题优先级】,包括关键、重要、普通4子类按问题分类分别统计分别过滤【问题分类】中的子类按业务系统对关闭的问题进行统计业务系统关闭问题总数问题结束代码根本解决变通方法无法解决取消BOSS系统客服系统经营分析容灾系统BOSS网管指标说明平均诊断时间以”小时”计算。序号指标名称解释指标计算说明1关闭问题总数在本统计周期内关闭的所有问题数量。数量在问题单中根据以下条件过滤1【重复问题标记】为空2【问题关闭时间】在统计周期内3【问题状态】结束并关闭2问题结束代码在关闭问题总数中,分别统计不同问题结束代码的问题数量在关闭问题总数中,分别过滤不同的【问题结束代码】,包括根本解决、变通方法、无法解决、取消3业务系统按问题所属业务系统分别统计分别过滤【问题所属系统类型】的业务系统按照业务系统、优先级对关闭的问题进行统计业务系统关闭问题总数优先级为”关键”优先级为”重要”优先级为”普通”数量平均诊断时间数量平均诊断时间数量平均诊断时间BOSS系统客服系统经营分析容灾系统BOS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论