中烟公司信息运维体系建设-ITIL问题管理.doc_第1页
中烟公司信息运维体系建设-ITIL问题管理.doc_第2页
中烟公司信息运维体系建设-ITIL问题管理.doc_第3页
中烟公司信息运维体系建设-ITIL问题管理.doc_第4页
中烟公司信息运维体系建设-ITIL问题管理.doc_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中烟信息运维体系建设_itil问题管理流程介绍主要介绍和描述问题管理流程,并将作为中烟信息日常it维护所涉及的问题管理流程的参考。本文介绍了如何在问题创建、根本原因诊断、到关闭的整个生命周期中实施问题管理,并定义支持运作问题管理流程相关的人员职责。本流程提供了问题管理流程中相关的规则和步骤的基本框架,以满足准确、及时有效地确定和解决事件的需要。一、流程概述支持应用组、系统组和设备组组员作为问题分析员,在事件处理过程中发现知识库中未记录的未知错误后,提出问题,创建问题单,转交相应组长审核,组长审核后提交支持经理助理,支持经理助理作为问题经理进行问题的分派,受理问题的组员进行问题的调查、诊断、解决与关闭。对于疑难问题,受理问题的组员向组长汇报后,由组长协调组内技术讨论会。对于需要多组人员参加的技术讨论,在组长向经理助理汇报后,由经理助理协调组织。在问题管理流程中,支持经理助理作为问题经理对整个问题的处理负责,提出问题组员所在组的组长对整个问题流程进行跟踪。决策管理系统问题管理流程如下图所示:图. 决策管理系统问题管理流程图二、流程步骤描述(1) 问题检测与记录本步骤的主要目的是识别问题(主动或是被动),创建问题单以及对问题进行严重等级的判断。图.问题检测与记录问题单的来源未解决的事件单,需要通过问题管理查找根本原因。已解决的但需要进行根本原因分析的事件对事件趋势分析的结果虽然尚未发生事件,问题分析员主动发现的新问题问题单的记录问题分析员创建新的问题单,判断严重等级和分类,然后将此问题单提交给相对应的支持组组长审核,由该支持组组长审核后提交给问题经理,进入下一流程“问题分派”。(2)问题分派这个步骤首先由问题经理将问题分派给支持部门中的问题分析员,然后这个问题分析员将开始收集数据判断这个问题是否可能解决,然后该问题分析员对应的业务岗位的支持组组长开始跟踪问题解决的整个流程。如果这个问题没有被正确分派,将经由该问题分析员对应的支持组组长退回问题经理重新分派。图. 问题分类与分派 (3) 问题调查与诊断该步骤确定了问题信息的来源,对数据进行分析,找出问题的根本原因。图. 问题调查与诊断当分派来的问题单或在“问题关闭”步骤中,认为解决方案不足的问题单需要进入“问题调查与诊断”步骤。“问题调查与诊断”步骤需要问题分析员回顾与该问题相关的所有文件资料,如配置历史日志 、错误日志、特征数据等,调查问题的相关数据,找出可能的已知错误,将问题与现有的已知错误相匹配。如果找到匹配的,记录根本原因;否则,继续诊断问题,以期找出根本原因。查找根本原因时可以寻求其他专家(如:中软、供应商,中烟信息其他部门)的支持,协同工作,确定根本原因。如果找到根本原因,则记录根本原因,并且已记录的问题标记为“已知错误”,如果此问题是由一个事件单创建的,问题分析员通知事件记录员,一个新的已知错误产生,以便事件记录员在向用户更新事件状态时,回答用户。在调查与诊断期间,如果需要更多的信息帮助诊断,转入步骤“问题分派”继续“收集问题数据”。如果对这个问题的诊断已经投入了大量资源,但还是没有找出根本原因,可以通过步骤“问题分派”将问题交给问题经理,由他判断是否继续。中烟信息运维体系建设_itil问题管理(二)(4) 问题解决本步骤的目的是为成为“已知错误”的问题提供一个最终的解决方案,或者临时的变通方法,并进行实施。并且需要引入变更管理流程来完成解决方案的实施。图. 问题解决问题解决的来源经过调查和诊断的问题已知错误问题解决步骤的任务(1) 调查解决方案的可行性调查问题的解决方案是否可行。对于被提议的解决方案,问题分析员需要考虑技术、资源,以及成本因素,判断其可行性,如果可行,转入任务“建立解决方案” ,如果不可行,转入任务“寻求变通方法”。(2) 寻求变通方法创建变通方法,如果成功,转入任务“记录变通方法”;如果不成功,转入任务“与客户回顾探讨”(3) 与客户回顾探讨问题分析员将找不到变通方法的问题经问题分析员组长提交给问题经理.问题经理联络用户,请求用户同意关闭问题。转入任务“问题关闭”(4) 记录变通方法如果找到变通方法,则记录变通方法如果此问题单与任何事件单关联,则需要通知事件管理流程找到了变通方法转入任务“创建rfc”(5) 建立解决方案当经过验证,问题的解决方案是可行的,则需要制定具体解决方案,完成后,转入任务“记录解决方案”(6) 记录解决方案记录解决方案转入任务“创建rfc”注意:如果有任何事件单和此问题关联在一起,那么和执行变通方法不同,事件单的解决是通过此处创建rfc完成的(7) 创建rfc创建变更请求,转入任务“监控变更请求”(8) 监控rfc监控变更请求的审批过程如果变更请求未得到批准,则将问题提交给问题经理进行升级,转入任务“升级问题”如果变更请求得到批准,则继续监控变更的执行当变更成功实施,转入步骤“问题关闭”(9) 升级问题必要的话,将问题报告给事件经理,让事件经理与客户进行回顾探讨。进入问题经理的任务“与客户探讨回顾”(5) 问题关闭 这个步骤确保问题的处理情况令人满意。问题单的信息是正确、完整的,处理过程中的经验能够得到记录以形成可重用的知识。图. 问题关闭问题单可以关闭的情况已解决的问题单信息不足直接关闭的问题单无解决方案,也无变通方案的问题单,经客户回顾可关闭的问题单问题关闭步骤的任务(1) 验证结果 验证解决方案/变通方法是否对于解决问题足够好。如果解决方案/变通方法还可以有改进之处,进入步骤“调查与诊断”,任务“收集问题数据”如果解决方案/变通方法足够好,则进入任务“如有必要更新知识库”(2) 如有必要更新知识库如果该问题有可能对其他问题处理有借鉴左右,判断是否将该问题解决方案/变通方法作为知识库的候选条目,交给知识管理员检查。交给问题经理,进入任务“关闭问题”(3) 关闭问题单问题经理判断问题的处理过程是否令人满意,如果不满意,进入步骤“分类与分派”,任务“分派问题”鉴别问题关闭的原因选择适当的关闭代码,更新问题单关闭问题单,停止监控更新相关联的问题单通知事件记录员关闭相关联的事件单中烟信息运维体系建设_itil事件管理(一)事件管理流程旨在介绍和描述事件管理流程,并将作为中烟信息日常it维护所涉及的事件管理流程的参考。本文介绍了如何在事件发生、诊断、关闭的整个生命周期中实施事件管理,并定义支持、运作事件管理流程相关的人员职责以及事件的升级策略。一、流程概述客服工业组、商业组和国家局组组员作为事件记录员,根据用户提出的服务请求,或在日常监控过程中发现的事件,创建事件单,搜索知识库,根据级别为一二级的知识库条目以及通过常规恢复操作尝试进行事件的初步分析、解决、跟踪和关闭,对于知识库中缺乏相关知识条目或知识条目级别为“三级”的事件向各自组长汇报并提交组长处理。客服组长根据知识库判断该组员是否能够处理该事件,能够处理的返回该客服组员进行处理。对于不能处理的事件,客服组长判断是属于应用、系统还是设备方向的事件,提交支持相应组长处理。支持组长受理客服组长转交的事件后,根据经验分派到相关组员处理。支持组员作为事件分析员进行事件的分析处理,事件恢复后汇报支持组长,支持组长将事件处理情况反馈该事件相关的客服组长,客服组长安排组员通知用户并关闭事件单。对于支持组员仍然无法恢复的事件,汇报支持组长后,由支持组长协调组织组内技术讨论会。涉及需要支持多组人员参与讨论的,在支持组长向支持经理汇报后,由支持经理协调组织技术讨论会。在事件管理流程中,客服组长作为事件经理对整个事件的处理负责,受理事件并创建事件单的客服组员对整个事件流程进行跟踪,并及时答复用户事件处理情况。决策管理系统事件管理流程如下图所示:(1)事件检测与记录事件检测与记录步骤是事件管理流程的起点。该步骤的目的是快速、准确地探测和捕捉所有在it生产环境中发生的错误,并在将来的问题管理流程中帮助确定问题和解决问题。在本步骤中,将收集创建一个事件单所需要的信息,重点是准确、完整地记录必要的信息。(一)事件的检测 一线事件记录员在受理事件后检查是否已存在该事件单,若存在则将事件转由当前的受理人处理。否则,创建新事件单。(二)事件的记录事件的记录遵循决策管理系统工单编制规范进行填写。 (2)事件分类与初步支持 该步骤包括:为了对用户的请求进行分析而进一步收集信息。该步骤的目的是对每个事件进行正确的分类(依据决策管理系统分类规范进行),随即在现存的知识库中查询与该事件相匹配的条目。若没有找到合适的解决方案或变通方法,则该事件需要转派给一线组长,后者根据知识库判断该组员是否能够处理该事件,能够处理的返回该客服组员进行处理。对于不能处理的事件,客服组长判断是属于应用、系统还是设备方向的事件,提交二线组长,由二线组长再根据实际情况分配给一个具有合适技能的事件分析员。在处理过程中,事件记录员需要根据处理的情况详细记录整个处理过程和结果,记录信息应与实际情况一致。若根据当前已有知识库条目能够解决事件,则在解决完事件后,在事件单中记录和填写故障根源和解决方案。若解决方案比较复杂,还需附上附件。(3)事件调查和诊断这个步骤阶段的目标是进行深入的调查,以解决事件。各个技术水平的事件分析员(二线人员)将会参与寻找一个解决方案或变通方案。若事件分析员(二线人员)认为该事件根据知识库条目或其他常规方式能够解决,则返回一线事件记录员进行解决与恢复。若通过调查和诊断还是不能解决事件,可能需要问题管理流程也参与进来进行更加深入的分析研究。一线事件记录员应及时跟踪事件的整个处理过程,并适时向用户说明处理情况。(4)解决和恢复这个步骤尝试使用解决方案和变通方法来解决事件。某些情况下,需要引入变更管理来批准评估实施步骤。事件解决完毕后,二线支持人员需要依据解决情况创建知识库条目,并进行等级划分,然后定期对一线人员进行新知识库条目的培训。(5)事件关闭这个步骤确保客户对事件的处理情况感到满意。这里分两种情况,若是用户提出的事件,则所有工单关闭前都需要征得用户同意;若是监控发现的事件,则在解决后直接关闭。(6)监控事件这个步骤监控目前尚未解决或正在解决的事件,它由事件单创建时开始,在事件单关闭时结束。这个步骤目前基本上是由一线组长人工来执行,只有触发升级策略才会由后台工具发出邮件通知。三、常用政策中烟信息所支持的操作环境中,所有对操作特性有影响的事件会通过事件管理流程处理;将通过流程中定义的标 准、政策和指导进行管理。所有报告事件的部门或人员将会参与统一的事件管理流程,不应该有任何例外。所有it支持人员对严重等级1和2的事件所采取的恢复服务的行动,相比其他任务具有优先权。应该定期产生和回顾事件管理报表。应该定期对流程进行回顾,以改进事件管理流程。(1)责任人政策有效的管理事件的重要因素是定义一个责任人政策,以确保每个事件在任何时段都有适当的人员负责。当一个事件被创建后,事件记录员负责这个事件单,直至事件单关闭。当事件单被分派并接受后,事件分析员负责此事件单;但是作出分派的二线组长有责任通知被分派的事件分析员并要求他接受或是拒绝此事件单。该事件单的记录员有责任跟踪整个处理过程。如果需要向客户通知处理情况,由事件记录员负责(2)再分派政策再分派又称转派,指第一次分派后被分派对象将事件单分派给其他部门或个人。再分派政策是另一项关键的政策,它确保事件单不被过于频繁的相互转派,以至于无法在规定时间内得到解决。这里明确规定,事件单的再分派由当前业务组的组长决定和负责。(3)严重等级事件的严重等级表明了该事件对服务所产生的业务影响。它是中烟信息评定事件处理优先等级的一个重要指标。事件的严重等级依据事件的紧急度和影响度综合评定,二者共同决定了一个事件的优先级次序。紧急度用于衡量一个中断的服务等待恢复的迫切程度,即对时间的急迫性。影响度用于衡量一个中断的服务的影响范围,即对业务的影响程度。下表定义了判断紧急度的参考时间值和影响度的参考范围以及严重等级的划分办法:表一 紧急度的参考时间紧急度 等级紧迫要求level 1高24小时内需要得到解决level 2中在24-72小时内需要得到解决level 3低 72小时以上解决即可表二 影响度的参考范围影响度 等级影响范围level 1高企业关键业务或多个企业的业务受到影响level 2中企业局部业务受到影响level 3低服务请求、变更请求、咨询请求,及系统存在潜在风险的情况表三 系统故障严重等级划分办法严重等级影响程度紧急程度高中低高123中234低345紧急度和影响度基于受影响的业务情况来划分,事件紧急度和影响度可参考事件单严重级别的划分及环节升级规范进行划分。事件的严重等级划分需遵循以下要求:(1)根据事件的紧急度和影响度的定义和指南准确划分紧急度和影响度;(2)紧急度和影响度划分后将自动生成严重等级,不能人为修改严重等级而导致严重等级与紧急度和影响度划分情况不符;(3)严重等级在工单创建后不能再进行修改和调整。(4)通知政策目前的通知政策基于以下原则: 事件单被分派后,被分派人会接收到相关邮件通知; 事件单的严重等级为1(紧急)和2(高)时,将发送邮件通知事件经理。(5)标准的通知内容通过通知政策进行沟通的事件信息目前通过电子邮件方式发送,并将遵循标准的格式。几个通知内容项描述如下: 事件的简要描述 事件的优先级(6)事件单关闭政策事件单的关闭必须由事件记录员得到用户确认后完成,但是事件经理可以超越(override)此规则。事件单的客户可以主动的关闭此事件单,例如:误报、错报事件。(7)事件单重开政策已关闭的事件原则上不允许重新打开,但事件经理有权重新打开事件单。itil与iso20000的关系itil它不是一个服务管理标准,而更应该说是一种结构化的方法或流程框架。基于这种方法和框架,已经有越来越多的it服务管理标准被开发出来了。在这些基于itil的it服务管理标准中,最突出的要属英国标准bs15000-1:2002以及澳大利亚标准as 8018.1-2004. 此外,还有一个南非版的bs15000标准。国际标准组织(iso)已经接受了bs15000 (2005年5月17日iso正式接受bs15000为国际标准iso20000) iso20000对itil可能产生的影响,我们还需要进一步等待和观察。然而,值得提出的是,iso20000也绝不是一家解决所有it问题的药到病除的“万能药”。没有一种模型或方法论能够立竿见影地实现其roi(投资回报率,译者注)以及与整合业务的潜力。就拿t恤来打比,一种尺码的也不可能适合所有人。为了取得it流程标准化的全部效益,在实施基于itil的itsm时也还必须通盘考虑其他的质量框架,如六西格码、cobit、cmm以及相关的iso标准。 一、itil与iso/iec 20000简介 itil(it infrastructure library信息技术基础架构库)是ccta(英国国家计算机和电信局)于20世纪80年代末开发的一套it服务管理标准库,它把英国各个行业在it管理方面的最佳实践归纳起来变成规范,旨在提高it资源的利用率和服务质量。 itil最初是为提高英国政府部门it服务质量而开发的,但它很快在英国的各个企业中得到了广泛的应用和认可,逐渐成为业界通用的事实标准。 2001年,英国标准协会在国际it服务管理论坛(itsmf)上正式发布了以itil为核心的英国国家标准bs15000。 国际标准化组织及国际电工委员会以bs15000为核心,在2005发布了iso/iec 20000:2005it服务管理(以下称iso20000)国际标准(itsms),并将“it服务管理”定义为“管理服务以满足业务要求”, 使之成为国际公认的it服务管理体系建设和评估的最佳方法。 通常讲:itil是it服务管理国际最佳实践(关注流程),iso20000是it服务管理国际标准(关注结果)。 现国际通用认证标准为iso20000,国内有包括ibm全球服务(中国)、神州数码、华为、交通银行、信达等多家企业通过认证。 二、itil的核心 it服务管理是itil框架的核心,它是一套协同流程(process),并通过服务级别协议(sla)来保证it服务的质量。它融合了系统管理、网络管理、系统开发管理等管理活动和变更管理、资产管理、问题管理等许多流程的理论和实践。itil把it管理活动归纳为一项管理功能和十个核心流程,主要如下: 1、服务台(service desk) 有时也称帮助台,即通常人们所指呼叫中心或客户服务中心,它不是一个服务管理过程,而是一种服务职能。服务台经常与事件管理紧密结合,用来连接其他的服务管理流程,逐渐被称为一线服务支持的代名词。 2、服务支持(service support) (1)配置管理 (configuration management) 配置管理是将一个系统中软件和硬件等配置项资源进行识别和定义,并记录和报告配置状态和变更请求以及检验配置项的正确性和完整性等活动构成的过程。 (2)变更管理 (change management) 变更管理是要确保在it服务变动的过程中能够有标准的方法,以有效的监控这些变动,降低或消除因为变动所造成的问题。它的目的并不是控制和限制变更的发生,而是对业务中断进行有效管理,确保变更有序进行。 (3)发布管理(release management) 发布管理是指对经测试后导入实际应用的新增或修改后的配置项进行分发和宣传的管理流程,目的是要保障所有的软件组件的安全性,以确保只有经过完整测试的正确版本得到授权进入正式运行环境。 (4)事件管理 (incident management) 事件管理指的是突发事件管理或意外事件管理,处理it的危机并要从中恢复运转。即在出现事故的时候,能够尽可能地恢复服务的正常运作,避免业务中断,以确保最佳的服务可用性级别。 (5)问题管理 (problem management) 问题管理是指负责解决it服务运营过程中遇到的所有问题的流程。问题管理的主要活动实质上就是分析以被列出问题的事件的根本原因,找出解决方案,把事件的影响最小化,并通过找到已发生事件或潜在事故的根本原因来减少事件的数量或消除事件的再次发生。 3、服务交付(service delivery) (6)服务等级管理(service level management) 服务级别管理是一种严格的超前方法论和处理程序,是定义、协商、订约、检测和评审提供给客户的服务质量水准的流程。 (7)it服务的财务管理(financial management of it services) 财务管理是在提供深入了解it服务管理流程的基础上,对it恢复运作的费用及成本重新分配并进行正确管理的程序,其目标是帮助it部门在提供服务的同时加强成本效益核算,以合理利用it资源、提高效益及财务资源使用的有效性。 (8)可持续性管理(continuity of it services) 可持续性管理是指确保发生灾难后有足够的技术、财务与管理资源来确保it能持续服务的管理流程。 (9)容量管理(capacity management) 容量管理是指在成本和业务需求的双重约束下,通过配置合理的服务能力来确保服务的持续提供和it资源的正确管理,以发挥最大效能;以合理的成本及时提供有效的it服务,以满足组织当前及将来的业务需求。 (10)可用性管理 (availability management) 可用性管理是在正确使用资源、方法及技术的前提下保障it服务的可用性和实践可用性要求。目标是确保it服务的设计符合业务所需的可用性级别。 三、iso/iec 20000框架 iso20000包括五个过程域共十三个管理流程: 1、服务交付过程(service delivery process) (1)服务等级管理(service level management); (2)it服务的财务管理(financial management of it services); (3)可持续性管理(continuity of it services) ; (4)容量管理(capacity management); (5)可用性管理 (availability management); (6)服务报告(service reporting); 2、关系过程(relationship process) (7)业务关系管理(business management); (8)供货商管理(supplier management); 3、解决过程(resolution process) (9)事件管理 (incident management); (10)问题管理 (problem management); 4、控制过程(control process) (11)变更管理 (change management) (12)配置管理 (configuration management) ; 5、发布过程(release process) (13)发布管理(release management) 说明:iso20000bs15000在itil基础上新增的业务关系管理(business management)与供货商管理(supplier management),对于itil来说,这些已经同时包含在服务等级管理(service level management)之中;iso20000新增的服务报告(service reporting),事实上也涵盖在itil的每个管理流程当中。 四、itil给企业带来什么? itil给企业带来的好处,包括: it服务的提供变得更加以客户为中心,同时在服务质量上的协商一致改进了双方的关系; 可以对服务质量,可用性,可靠性和服务成本进行更好的管理; 改进业务部门与it部门的沟通,因为大家采用都是同一个框架; it部门形成了一个更为明晰的架构,从而变得更为有效率和更为关注公司目标; it部门更加对其负责的基础架构和服务实施控制,同时变更也的更易于管理。 五、中小企业与iso20000 中国企业有80以上都是中小企业,对中小企业用户来说,itil似乎还是复杂了一点,在实施itil的过程中总会些许不尽意,希望但又不知道应该如何在itil的流程上做裁减,现在iso/iec 20000的提出给我们提供了新的思路,把最重要的流程控制住就可以了。 iso/iec 20000规定了5个关键的服务管理过程,服务提供过程包括服务级别管理、可用性管理和能力规划管理;关系过程包括服务提供者与客户和供应商之间的接口;解决过程关注需要解决和预防发生的事件和事故;控制过程包括变更管理,资产管理和配置管理;发布过程包括新的或更新的软件和硬件的发布。 itil对于中小企业来说,当用户的规模效应达不到的时候,如果照搬itil也会面临很大的问题和挑战。iso/iec 20000提供了非常清晰的目标导向的关注点,如果用户抓这些关注点可能并不需要完全遵照这么复杂的流程去做。因此,中小企业的it服务之路已并不遥远 本人2年前通过了itil m的认证,最近也通过了iso/iec 20000的审计课程的认证。综合学习的过程,我觉得iso/iec 20000是一个衡量标准,在条款中,他以一种shall 、should来表示,他提供it service的组织或者企业应该以一个什么样的标准来实现对it服务有效的管理。而itil,大家可以理解为may,他里面的所有流程是一种实践的集合,这些实践是否符合你公司的需求,不一定,不需要强制去遵守。他仅仅是提供一种方法的建议。不通过itil,是否可以实现有效的it服务管理。答案是可以的。 1、itsm,即it服务管理是很多it服务企业应对激烈竞争所要做的迫切事情,是一项任务或目标。而iso20000和itil是itsm的指导思

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论