iso20000认证问题管理流程手册_图文.docx_第1页
iso20000认证问题管理流程手册_图文.docx_第2页
iso20000认证问题管理流程手册_图文.docx_第3页
iso20000认证问题管理流程手册_图文.docx_第4页
iso20000认证问题管理流程手册_图文.docx_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

上海博辕信息技术服务有限公司问题管理流程手册文件编号by-itsm-2-pm-01上海博辕信息技术服务有限公司iso20000体系文件 问题管理流程手册上海博辕信息技术服务有限公司2012年8月文档信息文档编号:by-itsm-2-pm-01文档名称:问题管理流程手册起草人: 贝创成审核人:李立明批准人: 成海林生效日期:2012-8-1发布范围:上海博辕信息技术服务有限公司版本记录版本号版本日期修改修改章节修改记录v0.12012-1贝创成创建新文档v0.22012-4贝创成评审修订v1.02012-8金新蕾统一发布目 录1文档介绍11.1编写目的11.2适用范围12术语定义13内容23.1流程介绍23.1.1流程解释23.1.2流程策略33.1.3关闭策略53.1.4问题单代码设计53.2角色及职责83.2.1概要定义83.2.2详细定义93.3流程输入及输出103.3.1流程触发条件103.3.2输入113.3.3输出113.3.4流程关闭条件113.4问题管理流程描述123.4.1作业流程图123.4.2流程活动说明143.5流程衡量指标及报表194参考204.1相关文件与记录203上海博辕信息技术服务有限公司 上海博辕信息技术服务有限公司问题管理流程手册文件编号by-itsm-2-pm-011 文档介绍1.1 编写目的本文档编写的目的是为了有效地解决客户it环境的问题隐患,减少或消除事件的发生,提高it服务的质量,为客户提供更优质的it服务,并且可以促进其他相关服务管理流程,如:事件的解决,变更的实施。通过本文档的定义,将建立一个完整的问题管理体系,从而实现:l 确保分析并确定事件的根本原因,以防止事件再次发生l 确保问题分派了正确支持人员,提高解决率l 根据it资源情况划分问题优先级l 主动提供预防性措施l 及时改进it架构的重大隐患l 提高it服务的可靠性l 降低it支持成本1.2 适用范围本流程适用于博辕信息的it服务团队。管理范围指的是博辕信息所有维保服务管理对象,问题与事件管理的范围保持一致。2 术语定义中 文 术 语英 文 术 语定 义问题problem导致一起或多起事件的潜在原因。这种原因会(或可能会)导致一起或多起事件的发生。问题管理pm(problem management)问题管理旨在发现it基础设施中事件问题产生背后的根本原因,包括问题处理和问题控制,其目标在于将it基础设施中的事件问题对业务产生的负面影响减小到最低,以及防止与这些错误有关的事件再次发生。为了实现这个目标,问题管理调查分析事件的根本原因然后采取有关行动改进或纠正这种情形。主动问题管理proactive problem management是指在事件发生之前发现和解决的有关问题和已知错误,从而使事件对服务的负面影响及相关成本控制到最低的一种管理活动。通过化被动为主动,it支持组织提供了更好的服务并提高了自身的资源使用效率。已知错误known error问题经过诊断后找到根本原因时所处的状态称之为已知错误。在这种状态下,变通方法(workarounds)或永久性的方案已经得到确认。如果出现了一个已知错误,则应当提出一个变更请求(rfc)。但是,在通过一项变更将此已知错误永久性地修复之前,它仍将作为一个已知错误。3 内容3.1 流程介绍3.1.1 流程解释问题管理流程的根本目的是消除或减少事件的发生,此流程分析发生在生产/运行环境的事件,确定最常发生或具有最大影响的事件,找出根本原因,然后生成相应的变更请求、临时解决方法或建议的预防性措施来防止事件的再次发生。所以问题管理流程需要和变更管理流程一起来实施找出的解决方案以从根本上解决问题。问题通常具有如下特征:l 同一事件,反复发生:在某一时段内,同一个对象的某一事件反复发生l 多个事件,相同症状:同类设备所发生的多个事件具有相同或相似症状l 单个重大故障:单个对业务造成严重影响的重大故障,如大范围业务中断l 变通方法解决的事件:由事件管理上报通过变通方法临时解决的事件 l 日常主动发现:定期/不定期对用户基础设施监控或组件巡检和分析,发现的潜在且待根源分析的重大故障/隐患当上述现象发现或发生时,应创建问题单进行问题分析。3.1.2 流程策略3.1.2.1 流程策略l 所有问题都应该被完整准确的记录下来,并保证相关信息尽可能详细。 l 各个项目可在本文定义的策略之下进行裁剪与定制。l 所有对用户业务环境可能造成影响的问题都应通过问题管理流程处理,并遵守流程定义的相关策略。l 明确问题管理的问题信息来源,定义事件和问题的接口。问题可能来源于某些事件的进一步调查,也可能来源于主动巡检和例会制度。l 应定义主动问题管理策略,定期分析事件趋势,采取预防措施。l 应该定期(每月)制定问题管理报表。对未解决的问题,应该举行问题管理会议进行讨论并对其评估与分析。l 应当定期(每年)进行流程回顾和评审,以改善问题管理流程,问题流程的回顾由问题管理流程负责人负责。3.1.2.2 责任人策略责任人策略用来确保每个问题在任何处理过程中都有适当的人员负责,从而保证问题处理的及时性及有效性。 一旦问题单提交后,问题经理作为该问题单的责任人 需要向问题发起人通知处理情况时,由问题经理负责3.1.2.3 再分派策略再分派又称转派,指第一次分派后被分派对象,将问题单分派给其他部门或个人。需要确保问题单不被过于频繁的相互转派,防止问题无法在规定时间内得到解决。所有问题单的转派,必须通过问题经理。3.1.2.4 优先级策略问题的优先级表明了该问题对服务所产生的业务影响。它是评定问题处理优先等级的一个重要指标。与事件优先级分类类似,优先级的分类主要根据问题的“影响度”和“紧急度”组合决定。影响度是指受影响业务系统的关键程度,通常通过受影响的客户数量、可能造成的业务损失,或是业务系统的重要程度来决定。紧急度是指解决问题所需要的速度(注:一个高影响度的问题并不一定非常紧急,反之亦然)。博辕信息分别定义自己的“问题影响度/紧急度和优先级策略”,定义方法两种: l 先定义紧急度和影响度的级别与含义,然后再定义优先级矩阵l 直接结合紧急度与影响度要素定义优先级分类优先级在问题的生命周期中是可以改变的。关于更改问题单优先级的原因和行为应该在问题单中记录。博辕信息的问题优先级定义同事件优先级定义,可参考三级文件问题管理策略。3.1.2.5 目标解决时间策略为了更好控制问题的有效解决,整个流程被分解成几个组成部分。每个流程的阶段都设定了目标时间。问题的目标时间与事件的明显不同,这是由于两个管理流程目标不同决定的。通常,事件比问题的目标时间更严格。博辕信息所定义的“目标解决时间策略”请参见三级文件。3.1.2.6 升级策略升级策略的目的是,对于不同优先级的问题,确保分配到合适的资源来解决问题。为了达到这个目的,定义了升级策略的时间框架。当达到下列时间时,如果问题还未解决,将触发升级策略。博辕信息所定义的“升级策略”请参见三级文件。3.1.3 关闭策略问题单的关闭策略定义如下:l 只有问题经理才有权关闭问题单l 问题单不会被自动关闭3.1.4 问题单代码设计3.1.4.1 问题信息项问题单应该包含如下问题信息项,博辕信息的it服务团队可以在此基础上进行选择和修改:序号信息项说明1问题编号问题单流水号2问题状态参见“问题状态”定义3问题登记时间问题单记录在系统中的实际登记时间4问题提出人问题提出人的姓名信息5问题来源参见“问题来源”定义6问题对应用户问题发生或影响的用户7问题发生设备问题发生的网络设备信息,记录发生问题的设备编号8问题标题问题的简要描述9问题描述问题的详细描述10问题分类参见“问题分类”定义11问题影响程度参见“问题影响程度”定义12问题紧急程度参见“问题紧急程度”定义13问题优先级参见“问题优先级”定义14计划分派时间按优先级计算问题计划分派的时间点15计划找到根源时间按优先级计算问题计划找到根源时间点16计划提供方案时间按优先级计算问题计划提供方案时间点17计划解决时间问题流程经理参考问题时限定义与问题分析专家共同确定计划解决时间18分配工作组被分配问题分析专家所在工作组/团队19分配人员被分派的问题分析专家20问题实际分派时间问题实际派发给问题分析专家的时间点21问题实际受理时间问题分析专家正式开始处理问题的时间点22工作日志问题处理过程的工作记录23问题根本原因问题对应的根本原因描述24问题根源发现人找到问题根本原因的人员姓名25问题找到根源时间找到问题根本原因的时间点26解决方案/变通方法问题对应的解决方案或变通方法描述27问题方案提交人提交问题解决方案/变通方法的人员姓名28问题提交方案时间找到问题的解决方案/变通方法的时间点29实际解决时间问题实际得到解决的时间点30关联配置项编号问题关联的配置项记录的编号31关联变更单号问题引发变更记录的单号32关联事件单号引发问题的事件单号33信息附件附件的主要目的是协助问题的分析处理,例如:问题现象报告:由问题提交人提供问题分析报告:由问题分析专家提供问题协调报告:如果问题涉及其他部门,需要使用问题协调报告,由问题经理或问题分析专家提交问题跟踪报告:如果无法立即解决问题,需要利用问题跟踪报告来跟踪问题进展,由问题分析专家提交 34请求人反馈意见请求人对事件处理过程及结果的意见或建议35结束代码参见“问题结束代码”定义36关闭时间将事件状态设置为“结束”的时间点3.1.4.2 问题来源问题来源代码用来标明问题的提出方式,问题来源可以包括以下几种:问题来源描述事件流程升级l 单个重大故障升级为问题l 事件流程中通过变通方法临时解决的事件,可作为的问题在问题流程中找到其根本原因和最终解决方案主动分析事件记录l 类似的事件在某个时间周期内(如周/月)反复发生 l 多个事件具有相同症状l 某类事件出现比例高于其他类型事件l 某类事件数量连续数月呈逐渐攀升态势日常运维发现l 日常运维工作中发现的系统隐患或需重视的异常l 已知的应用系统及第三方系统尚未解决的技术缺陷3.1.4.3 问题分类问题采用与事件一致的分类,详见问题管理策略。3.1.4.4 问题状态问题状态代码表明问题所处的处理状态,问题状态建议如下:编号代码描述1新建问题被识别并创建2已分派问题已被分派给问题分析专家3处理中问题分析专家接受并开始处理问题4已找到原因问题分析专家通过分析诊断,找到导致问题发生的根本原因5已提交方案问题分析专家在找到问题根本原因后,进一步分析并提交问题的解决方案或变通方法6挂起问题信息不完整,或在某些情况下阻止问题分析专家对问题的处理,挂起的原因为: 等待问题提交人进一步提供信息 等待rfc变更流程处理 等待其他厂商/第三方处理7已完成问题解决方案调查完成,可以进入问题关闭阶段8关闭问题请求人已对问题处理结果进行了确认,并同意关闭问题3.1.4.5 问题关闭代码问题关闭代码说明了问题是在何种情况下关闭的,关闭代码示例如下:问题关闭代码描 述成功通过彻底的解决方案解决问题无法实施已找到问题解决方案,但由于目前条件/资源的限制而无法处理临时措施无法找到彻底的解决方案,通过变通方法解决问题取消由于问题为重复或者无效问题,或涉及过大的成本及资源,相应问题单被问题经理评审后取消3.2 角色及职责3.2.1 概要定义问题管理流程角色主要职责问题管理流程负责人l 问题管理解决方案的责任人;l 对于整个问题管理解决方案的结果承担责任;问题经理l 协调问题管理步骤的日常操作l 根据定义的标准,确保问题得到解决并关闭 l 确保问题分派给问题分析专家l 确保问题分析专家在其管辖范围内的可用性和能力问题分析专家l 进行深入的问题分析,以找出根本原因,并提供解决方案问题提交人l 记录问题基本信息并将其与相应事件、ci进行关联l 将问题归类,设定其紧急度、影响度和优先级l 将问题提交给问题经理3.2.2 详细定义3.2.2.1 问题管理流程负责人问题管理流程负责人监控流程,确保问题流程在博辕信息it服务团队范围内被正确的执行。随着业务需求和it环境的改变,流程负责人必须定期或不定期进行流程分析、找出缺陷、进行改进,从而实现服务能力的可持续提升。职责定义:l 确定问题管理流程的衡量指标l 确保问题管理流程能够取得管理层的参与和支持l 确保问题管理流程符合公司实际状况和公司 it发展战略l 总体上管理和监控流程,建立问题管理流程实施、评估和持续优化改进机制l 对问题管理流程中的成本和投资负责l 保持与其他流程负责人的定期沟通3.2.2.2 问题流程经理问题经理负责协调问题管理活动的日常执行和问题管理流程中的工作调度。职责定义:l 定期组织相关人员对事件记录进行主动分析,发现潜在问题l 对提交的潜在问题进行预审,并对所需资源进行评估l 跟踪监控问题的分析、诊断和处理过程,确保问题能及时有效的得到解决l 负责对分析专家提交的问题解决方案进行审核l 定期制定问题报表,提供正确的决策信息l 负责与事件及其他流程经理的沟通交流,确保与各个相关流程的有效合作3.2.2.3 问题分析专家问题分析专家负责寻找问题的根源,并提供和协助落实解决方案,必要时寻求it服务团队内部或第三方资源的帮助。通常由各专业组技术人员担任。职责定义:l 定期分析事件记录数据及相关信息,发现和识别问题,进行主动预防;l 接受问题经理分派的问题,将本人不能受理的问题单及时退还给问题经理;l 分析诊断问题的根本原因;l 提出解决方案并落实执行,必要时发起变更请求并监控变更实施;l 必要时协调配合第三方供应商诊断和解决问题;l 将常见或者典型的问题整理为知识记录。3.3 流程输入及输出3.3.1 流程触发条件l 事件升级: 一段周期内,同个事件,反复发生(如一个项目,在一月发生三次以上同杨事件) 多个事件,具有相同的症状 单个重大故障l 事件趋势分析产生的问题单l 通过巡检发现的系统层面重大问题/隐患;可通过例会制度讨论3.3.2 输入l 关闭代码为“成功但有问题”的事件单,需要通过问题管理流程解决l 对事件趋势分析的结果l 虽然尚未发生事件,问题分析专家主动发现的新问题3.3.3 输出l 关闭的问题单l 临时措施或解决方案l 知识条目3.3.4 流程关闭条件l 问题单分析处理完毕并经过评审,并在判断是否需要提交知识条目后可以关闭。3.4 问题管理流程描述3.4.1 作业流程图3.4.2 流程活动说明1) 主要活动说明:编 码活 动责任人说 明参考pm.1问题识别和记录问题提交人l 识别问题(主动或是被动)l 创建问题单并确定其分类l 根据影响度和紧急度决定问题的优先级q 流程策略l 优先级策略q 代码设计l 问题来源l 问题信息项l 问题状态(新建)l 问题分类q 三四级文件l 问题单l 问题管理策略pm.2问题评审和分派问题经理l 判断该问题是否值得或是否可能解决l 确定是否正式创建问题l 将该问题到分派给问题受理员q 流程策略l 目标解决时间策略l 优先级策略l 再分派策略l 升级策略q 代码设计l 问题分类l 问题状态(已分派)q 三四级文件l 问题单l 问题管理策略pm.3问题调查和诊断问题分析专家l 确定问题信息的来源l 对问题进行分析l 找出问题的根本原因q 流程策略l 目标解决时间策略l 升级策略q 代码设计l 问题状态(处理中)q 三四级文件l 问题单l 问题管理策略pm.4问题解决问题分析专家l 找出已成为“已知错误”的问题的解决方案l 如果找到即实施该方案以解决问题q 流程策略l 目标解决时间策略q 代码设计l 问题状态(已找到原因/已提交方案)q 三四级文件l 问题单l 问题管理策略pm.5问题关闭问题经理l 评审问题并关闭问题记录l 通知相关人员q 流程策略l 问题关闭策略l 目标解决时间策略q 代码设计l 问题状态(关闭)l 问题关闭代码q 三四级文件l 问题单l 问题管理策略2) 分活动说明编 码活 动责任人说 明pm 1.1问题记录问题提交人l 问题提交人记录问题细节。l 问题提交人将相关事件与问题进行关联l 问题提交人将相关ci/资产与问题进行关联l 问题提交人将问题分类l 问题提交人确定问题的影响度和紧急度l 影响度和紧急度确定后将自动确定其优先级q 流程策略l 优先级策略q 代码设计l 问题来源l 问题信息项l 问题分类q 三四级文件l 问题单l 问题管理策略pm 1.2提交给问题经理问题提交人l 问题提交人将问题提交给问题经理,等待其评审l 一旦问题经理确认收到该问题,则问题提交员不能撤销其提交的问题l 问题单状态被标识为“新建”q 流程策略l 优先级策略q 代码设计l 问题状态(新建)q 三四级文件l 问题单pm 2.1问题确认与审核问题经理l 问题经理对问题提交人提交的问题单进行复核l 问题经理对问题单进行初步审核,综合现有信息、资源决定是否需要进行问题调查q 流程策略l 目标解决时间策略l 责任人策略l 优先级策略q 代码设计l 问题分类q 三四级文件l 问题单l 问题管理策略pm 2.2确认是否继续进行调查问题经理l 问题经理决定是否继续调查l 如果不继续,则取消调查,关闭问题单,问题结束代码标记为“取消”l 否则,转入任务pm2.3“分派问题单以查找根本原因”q 流程策略l 目标解决时间策略l 优先级策略l 责任人策略q 代码设计l 问题分类q 三四级文件l 问题单l 问题管理策略pm 2.3分派问题问题经理l 问题经理将问题指派给问题分析专家l 问题分析专家获得问题受派通知l 将问题单状态标识为“已分派”q 流程策略l 目标解决时间策略l 优先级策略l 再分派策略q 代码设计l 问题分类l 问题状态(已分派)q 三四级文件l 问题单l 问题管理策略pm 2.4确认是否接受指派问题分析专家l 问题分析专家确定是否接受分派l 如果接受分派,转入任务pm3.1“启动问题调查”,问题单状态变为“处理中”l 否则,转入任务pm2.5“说明拒绝理由”,从而进行问题的重新分配。lpm 2.5说明拒绝理由问题分析专家l 问题分析专家填写不接受分派的原因,如果问题分类不正确,时将问题重新分类;l 问题分析专家可以提出重分派建议,之后将问题单重新退回到问题经理,由问题经理重新分派问题,转入任务pm2.3“分派问题”。q 流程策略l 再分派策略q 三四级文件l 问题单pm3.1问题调查和分析问题分析专家问题分析专家负责查找问题的根源。问题调查和分析包括如下一系列过程:l 问题分析专家检查最近的变更,看问题是否由相关ci近期实施的变更引起。如果是则将变更与问题进行关联l 否则,看是否与已知错误相匹配。如果找到,则记录已知错误,否则继续诊断问题l 如果从变更和已知错误找根源都失败,那么问题分析专家继续收集相关信息对问题进行分析诊断,查找问题根源l 在此活动中,问题分析专家通常采取召开多位问题专家一起进行问题诊断q 流程策略l 目标解决时间策略l 优先级策略q 代码设计l 问题状态(处理中)q 三四级文件l 问题单l 问题管理策略pm 3.2确定根源是否查明问题分析专家l 问题分析专家确定是否找到根源l 如果找到,转到pm3.4“记录问题根源”l 否则,转向pm3.3“是否需要升级”lpm3.3是否需要升级问题分析专家l 如果需要,则进入pm3.5“注明调查情况并升级到问题经理”l 否则,问题挂起pm 3.4记录问题根源问题分析专家l 问题分析专家将分析得出的问题产生原因完整记录下来l 将问题单状态标识为“已找到原因”l 进入任务pm4.1“调查问题解决方案”q 代码设计l 问题状态(已找到原因)q 三四级文件l 问题单pm 3.5注明调查情况并升级到问题经理问题分析专家l 问题分析专家将问题升级到问题经理,并重新转到pm3.1“问题调查和分析”q 流程策略l 目标解决时间策略l 升级策略q 代码设计l 问题状态(处理中)q 三四级文件l 问题单l 问题管理策略pm 4.1调查解决方案问题分析专家l 问题分析专家根据问题根源,调查解决方案l 问题找到根源后,无论是否解决问题,都可以视为问题已经完成,问题分析专家应该尽力寻找问题的解决方案。q 代码设计l 问题状态(已找到原因)q 三四级文件l 问题单pm 4.2确认是否已经找到了解决方案问题分析专家l 问题分析专家判断是否已经找到了该问题的解决方案,l 如果找到,则进入pm4.3,“实施并记录问题解决方案”l 如果找不到解决方案,则进入pm4.5“升级到问题经理”处理。lpm4.3实施并记录可行的解决方案问题分析专家l 问题分析专家确定该解决方案可行,并记录解决方案l 将问题单状态标识为“已提交方案”q 代码设计l 问题状态(已提交方案)q 三四级文件l 问题单pm4.4问题完成问题分析专家l 无论是否找到解决方案和是否需要实施,只要找到解决方案,都可视为问题完成。l 如果找到并实施了解决方案,问题分析专家将解决方案和实施结果补充到问题单中,问题完成l 问题分析专家将问题单的状态标识为“已完成”l 转向pm5.1“验证并与用户确认问题处理结果”q 代码设计l 问题状态(完成)q 三四级文件l 问题单pm4.5升级到问题经理问题经理l 由问题经理决定是否需要进一步对问题展开调查。qpm 5.1验证并确认问题处理结果问题经理l 问题分析专家验证问题调查记录,确认解决方案和问题信息l 问题经理确认问题处理结果,判断是否达到预期q 代码设计l 问题状态(完成)q 三四级文件l 问题单pm 5.2判断是否可以关闭问题问题经理l 问题经理判断是否可以关闭问题,l 如果“是”则进入pm5.3,继续判断是否需要作为知识条目提交,更新知识库;如果“否”则进入pm3.1“问题调查分析”。lpm5.3是否需要更新知识库问题分析专家l 问题经理判断是否需要将该解决方案作为知识条目提交到知识库,如果“是”则进入pm5.4,进行知识条目的创建;l 如果“否”则直接进入pm5.5“问题关闭”lpm5.4创建知识条目问题经理问题分析专家l 问题经理创建知识条目,进入知识管理流程lpm5.5关闭问题问题经理l 问题经理关闭问题单,将问题单状态标识为“已关闭”l 问题经理设置关闭相应的代码。q 流程策略l 问题关闭策略l 目标解决时间策略q 代码设计l 问题状态(关闭)l 问题关闭代码q 三四级文件l 问题单l 问题管理策略

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论