已阅读5页,还剩5页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ITIL 的事件管理 IT 服务管理的质量直接影响业务的质量 进而影响企业的市场声誉和客户满意 度 信息技术基础架构库 IT Infrastructure Library ITIL 为企业的 IT 服务管 理实践提供了一个严谨 客观 可量化的标准和规范 是一套以流程为导向 以客户为中心的管理方法 对 IT 基础架构进行全面而集中的管理 以确保企业 业务的平稳 高效运营 企业的 IT 部门可参考 ITIL 制定其 IT 服务管理流程 从而确保企业能够高效地实现 IT 服务管理 为企业的运作提供更好的支持 基于 ITIL 的 IT 服务管理由服务台 事件管理 问题管理 变更管理 配置管理 发布管理 服务级别管理组成 事件管理是整个支持系统中的首要环节 具 有应用广 重要性大的特点 目前 我国实施 IT 服务管理的企业中绝大部分已 执行了事件管理流程 事件管理往往以快速解决表征现象为目的 而不在于查 找根本原因 因此 时效性成为评价企业事件管理水平的重要标志 事件管理是 IT 服务管理中的一个核心流程 提升事件管理时效性 回归事 件管理本身属性 可以提高 IT 服务的质量 有效改变目前我国企业普遍存在的 重开发 轻运维的现象 真正践行以服务为导向的 ITIL 理念 通过切实有效的 IT 服务管理为企业创造价值 一 事件管理的目的 事件是指引起或可能引起服务中断和服务质量下降的事件 也可以是一种 为个人提供特殊服务的请求 事件管理是负责解决 IT 服务过程中的突发事件 问题以及客户需求等内容的运维管理 事件管理中的事件是一个广义的概念 不是狭义的故障 它可能是软件 硬件问题 也可能是服务需求事件 目前 很多公司 IT 运维管理部门没有建立事件处理的优先级和解决时限关 联 不能保障事件解决的实效性和 IT 资源的有效利用 事件发生后没有明确而 唯一的责任人 缺乏有效的对事件监控和跟踪的机制 没有统一的 IT 服务管理 应对事件受理的界面 完整的记录和及时反馈 缺乏事件监控和诊断等技术工 具 事件不能在技术工具的支持下得到主动 快速处理 IT 人员工作被动 只 能像救火队一样 不知道什么时候 什么地方会出现 火 情 只有当事件发 生并且已造成业务影响时才能发现和着手处理 这种被动 救火 不但使 IT 服 务人员终日忙碌 也使 IT 服务本身质量很难提高 导致 IT 和业务部门的满意 度都不高 因此 将 IT 服务管理的理念和方法应用到企业信息技术的服务管理 中 是确保企业 IT 工作发挥效益的重要举措 企业在实施 IT 服务管理的过程 中采取的方式和进程并不相同 有的全盘开展 ITIL 所有流程 有的仅从建立服 务台开始 循序渐进 事件管理流程是服务支持中的第一项流程 是在 IT 系统 遇到问题之后 解决问题的第一个环节 与其他流程相比 它的应用最广 重 要性最大 事件管理的目标就是对组织及用户在尽可能小的影响情况下 使 IT 系统尽 快恢复到服务级别协议所定义的服务级别 以确保最好的服务质量和可用性级 别 也就是说 迅速解决问题 将不利影响降到最低 提高追踪和事件升级的 效率 更好地控制整个管理过程 为了实现这个目的 事件管理流程必须最佳 地利用资源支持业务 开发和维护有效的事件记录以及设计和应用统一的事件 报告方法 事件管理侧重于恢复服务 为了能够有效地解决问题 事件管理还 必须对不同的事件进行分类和排队 分类就是要分成不同的优先级 排队就是 要识别它们 因此 事件管理的主要活动有两个 一是对事件进行优先级分类 二是记录事件 把记录下来的内容形成一个资源库 为将来分析挖掘知识储备 资源 事件管理的主要任务是及时识别并跟踪发生的事件 对事件进行分类并提供 初步支持 对事件进行调查分析 识别引发事件的潜在原因 解决事件并恢复服务 跟 踪和监督所有事件的解决过程 并随时进行沟通 因此 研究事件管理对解决 目前 IT 运维中存在的服务问题具有重要的意义 事件管理的时效性将直接影响 整个企业的 IT 服务质量和整体运营状况 二 事件管理的基本流程 事件管理流程大概如下 当一个事件输入的时候 首先要对事件进行检查 定位 检查事件的时候要与它不断交互 明确它的影响范围和紧急程度 还要 进行初步的归类评估 服务台 ServiceDesk 是事件的唯一入口 它接收事件后 操作人员通过查阅 CMDB 配置管理数据库 进行处理 具体流程如图 1 所 示 图 1 事件管理的基本流程 1 事件的查明和记录 服务台记录一些标识客户的基本信息 如姓名 工作地点 电话号码等 而事件管理记录详细的事件信息 如事件发生的时间 受事件影响的服务等 这样做的目的是便于确认事件的影响 问题管理可以根据这些信息查找事件原 因 密切跟踪事件进展 首先 当用户 服务台工作人员或其他 IT 部门人员发现或系统检测到某系 统发生事件时 就将其报告给服务台 服务台将基本信息输入事件数据库并报 告给事件管理人员 通常所有的事件都是先报告给服务台 再由服务台工作人 员将其输入事件数据库 服务支持小组是不允许直接记录事件的 其次 事件管理人员给事件一个唯一的编号 事件单号 记录一些基本的 事件分析信息 时间 症状 位置 用户 受影响服务 硬件等 并补充其他 的事件信息 与用户的交互信息和配置管理数据库等 再次 事件管理人员根据服务台提供的信息和事件数据库信息判断此类事 件是否与已有的事件相同或类似 如果有就更新事件信息或建立原事件的从属 记录 并在必要时修改原事件的影响度和优先级 如果没有则创建新事件记录 最后 事件管理需要判断事件是否严重 如果严重就先向管理层报告并告知 用户有关情况 再采取进一步行动 如果不严重就直接进入下一步的事件初步 归类和支持 2 初步归类和初步支持 经过第一步的事件查明和记录 可从用户处获取的事件信息基本上已得到 事件管理数据库已经根据这些信息进行更新 接下来就是事件的初步归类和 初步支持 这里强调初步 就是为了能够尽可能快地恢复用户的正常工作 尽 量避免或者减少事件对 IT 服务质量的影响 归类的目的是发现事件原因以便采取相应行动 一般来说 许多事件是重 复出现的 因此 当某个事件再次出现时 只需要根据已有的经验和措施采取 行动即可 当新的事件出现时 就有一个与其问题和知名错误 知识库 相匹配 的过程 如果匹配成功就可直接用已有的方案将其解决 而不需要进一步调查 否则就要继续进行下面提到的其他几个步骤 服务台如果没有成功解决事件 就将事件转交给二线 三线支持处理 然 后负责记录事件并联系各支持小组 采取必要的措施以确保用户满意 如果碰 到未出现过的事件或事件解决过程非常复杂 就必须对事件进行调查和分析 3 事件调查和分析 事件在第一阶段和第二阶段没有圆满解决时 专家支持小组应介入处理过 程 对其进行调查和分析 一旦事件被分派给某个支持小组 他们应当完成以下工作 确认接收事件处 理任务 同时指定有关日期和时间以保障正常更新事件状态和历史信息 经过 服务台及时通知客户事件最新进展 说明事件当前所处的状态 尽可能快地把发 现的权宜措施提供给服务台和客户 参考知名错误 问题 解决方案 计划的变 更和知识库等对事件进行评审 必要时要求服务台根据协议的服务级别 重新评 价事件影响度和优先级 并在必要时对其进行调整 记录所有相关信息 包括解 决方案 新增的或修改的分类 将所有相关事件的更新 花费的时间以及处理结 果反馈给服务台以让其终止此类事件 4 解决事件和恢复服务 在分析和调查事件后 支持小组根据更新的事件信息 提议的权益措施和 解决方案以及有关的变更请求 解决事件并恢复服务 同时更新有关事件信息 5 事件终止 解决事件和恢复服务后 事件到达终止阶段 这个阶段输入的是上一阶段 更新后的事件记录和已解决的事件 采取的行动主要是和客户一起确认事件解 决是否成功 输出的结果为更新的事件信息和事件记录 在事件解决后 服务 台应该确保以下内容 有关用于解决事件的行动的信息是准确的 易懂的 根据事 件产生的根本原因对其归类 客户同意事件解决方案和方案的执行及最终结果 详 细记录事件控制阶段的所有相关信息 如客户是否满意和满意度如何 处理事 件所花费的时间 事件终止的日期和时间 6 事件处理过程的跟踪和监督 服务台负责跟踪和监督所有事件的解决过程 在这个过程当中 服务台要 做到以下儿点 监督事件状态和事件处理最新进展及其影响服务级别的状况 特别 注意事件处理责任在不同专家支持小组间的转移 因为转移往往因支持人员的 责任不明确而发生拖延 更多注意高影响度的事件 及时通知受影响的用户关于事 件处理的最新进展 检查相似的事件 有助于保障每个事件在规定的或者最短的 时间内得到解决 我们在实际工作中还要尽量避免支持人员把过多的时间用于 调查和分析而忽视用户比较急切的需求 即本文后面将提出的事件管理问题化现 象 三 提高事件管理时效性的措施 根据事件管理的基本流程 可以从流程的每个衔接环节入手 主动管理 提高事件管理时效性 具体措施如下 1 减少进入事件管理流程的事件数量 服务台作为 IT 服务管理的一个基本流程 包括呼叫中心 Call center 和帮 助台 Helpdesk 以及邮件系统等 其主要职能是受理客户需求 记录并跟踪事 件 向客户反馈其服务需求以及事件的进展情况 根据服务级别协议对客服需 求做出初步评估 尽力解决或将其安排给有关人员解决等 服务台是服务提供 方和日常联络处 一般作为事件的一线部门 负责报告事件和处理服务需求 同事件管理流程联系最为紧密 服务台要跟踪和记录各种事件 并负责协调二 线 三线支持小组处理和解决事故 服务台应利用既有资源 通过匹配知识库 等方法努力解决所受理的事件 提高事件的一线解决率 减少进入事件管理流 程的事件数量 减少事件的不必要流转 提高事件管理的时效性 从而提升事 件管理效率 2 准确评定事件级别 提高事件的解决效率 在日常企业 IT 运维过程中 有时必须同时处理数个事件 但受时间 人力 物力等条件的限制 必须对事件处理顺序进行排列 这里就必须对事件进行 分级 通常可以按照受影响的用户数 系统数以及事件的严重性等因素来确定 事件的影响程度和紧急程度 然后根据影响程度和紧急程度来确定事件级别 见 图 2 事件级别是根据事件影响程度和紧急程度而制定的处理事件的先后顺序 首先 事件管理部门可以根据事件级别的不同 优先处理高级别事件 减 小其对业务的影响 避免客户投诉等问题 其次 可以根据事件级别的不同 针对不同级别事件建立具体的时效性指 标 要求二 三线支持部门在指定时间内完成事件的处理 并及时向客户反馈 处理结果 确保事件解决 对于服务已恢复 原因无法确定的事件应及时转至 问题管理流程处理 3 监控事件处理过程 适时进行事件升级管理 服务台可以成立一个专门的事件监控小组 承担跟踪和监控事件处理过程 的工作 当事件处理进展不尽如人意时 服务台可以根据已经定义好的升级程 序进行事件升级 图 2 事件级别确定途径 事件升级是指一线处理部门 服务台 在规定时间内不能解决或没有解决某 个事件时 将事件转二线 三线支持部门处理 事件升级是根据上文提到的事 件级别和事件解决时间确定的 事件升级具体过程如图 3 所示 4 避免事件管理问题化 企业在事件管理过程中通常会出现的一个误区是未能分清事件管理同问题 管理的区别 在处理事件过程中注重事件具体原因和解决力 法 未将恢复因 此中断的服务放在事件管理的首位 将事件管理问题化 问题管理的主要目标是要查明事件发生的潜在原因并找到解决此事件的方 法或防止其再次发生的措施 而事件管理的主要目标是在事件发生后尽可能快 地恢复客户服务 可能采取的是一些应急措施而不是永久的解决方案 事件管 理强调速度 而问题管理强调质量 把速度放在第二位 为了发现事件原因和 防止事件再次发生 问题管理可能需要花费更多时间解决事故且可能推迟恢复 服务 5 不断推动事件管理工具建设事件管理依赖于知识库的建立 维护和相关管理工具的支持 在事件处理过程中 应尽可能发挥工具的作 用 根据事件管理工作需要推动开发
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 计算机网络技术考试试题库含答案
- 2025年行业物联网应用推广项目可行性研究报告及总结分析
- 2025年互联网金融风险控制系统开发项目可行性研究报告及总结分析
- 2025年奇葩无领导面试题及答案
- 2025年高科技农业市场开发项目可行性研究报告及总结分析
- 2025年南通市海门市保安员招聘考试题库附答案解析
- 2025年旅游大巴司机安全操作模拟考试试卷含答案
- 计算机ms测试题及答案
- 2025年体育赛事智能管理系统项目可行性研究报告及总结分析
- AIDC电源行业市场前景及投资研究报告:柴油发电机供需错配量价空间国产重大机遇
- 贵州辅警面试题目及答案
- 仓储物流月工作总结
- 2025年门球一级裁判试题及答案
- 生产成本控制及核算数据表格模板
- 安全生产备案制度
- 2025年时事政治热点题库道及参考答案
- 部队地雷使用课件
- 二保焊理论考试题库及答案及
- 期末图形与几何专项测试卷(含答案)五年级数学上册(人教版)
- 高中政治学考课件
- 污水处理厂绩效考核评分细则
评论
0/150
提交评论