ITILfoundation认证资料-服务运营(共172页).ppt_第1页
ITILfoundation认证资料-服务运营(共172页).ppt_第2页
ITILfoundation认证资料-服务运营(共172页).ppt_第3页
ITILfoundation认证资料-服务运营(共172页).ppt_第4页
ITILfoundation认证资料-服务运营(共172页).ppt_第5页
已阅读5页,还剩167页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第 5 5 章章服务运营服务运营(Module 5 Service Operation )服务运营(Service Operation) 服务运营原理(Service Operation Principles) 服务运营流程(Service Operation Processes) 事件管理(Event management) 故障管理(Incident management) 请求履行(Request fulfillment) 问题管理(Problem management) 访问管理(Access management) 普通的服务运营活动(Common Service Operatio

2、n Activities) 服务运营的组织(Organizing for Service Operation) 技术考虑(Technology Consideration) 实施服务运营(Implemention of Service Operation) 挑战、风险和关键成功因素(Challenges, Risks and Critical Success Factors )*中国信息化培训中心2/172服务运营基础(Service operation fundamental)通过服务运营来提供业务价值优化服务运营的绩效服务运营中的流程事件管理、故障管理、请求履行、问题管理和访问管理服务运营

3、中的职能服务台、技术管理、IT运营管理和应用程序管理*中国信息化培训中心3/172在服务运营中达到平衡( Achieving balance in Service Operation ) 内部的IT视角 VS 外部的业务视角(Internal IT view versus external Internal IT view versus external business viewbusiness view) IT的外部视角就是用户或客户所经历的一套IT服务; IT的内部视角是用于提供这些服务的系统和IT组件。 稳定性 VS 响应机制(Stability versus responsivene

4、ss) 这意味着服务运营需要保证IT基础架构是稳定的和可用的(按设计要求)。同时,服务运营也需要认识到业务和IT需求是变化的。 服务质量 VS 服务成本(Quality of service versus cost of service) 服务运营要持续地向客户和用户提供满足协定的级别的IT服务,同时要保持成本和资源的利用在一个优化的水平上。 被动 VS 主动(Reactive versus proactive) 一个被动的组织在没有外部因素驱动的情况下不做任何事情; 一个主动的组织寻找机会去改进目前的概况,它不停地审视内部和外部的环境。*中国信息化培训中心4/172服务质量与服务成本的平衡(

5、图示)HighHighLowLowCost of serviceMay be out of balance:focus on keeping costslow at the expenseof desired qualityLevel of serviceinvestmentRange of optimalbalance betweencost and qualityas agreedbetween IT andthe businessMay be out of balance:focus on providing highlevels of quality thatexceed the bu

6、sinessvalue of the serviceQuality of service(performance, availability, accuracy)*中国信息化培训中心5/172提供好的服务(Providing good service)所有服务运营的人员必须很清楚地知道他们是为业务提供服务的他们必须提供及时的、专业的和客气的服务,以便业务部门能够执行他们自己的活动运营人员不仅要接受关于IT服务的交付与支持方面的培训,而且还要接受关于提供服务的方法的培训*中国信息化培训中心6/172沟通(Communication)日常运营沟通关于倒班的沟通绩效报告项目沟通关于变更的沟通关于例外

7、的沟通关于紧急事件的沟通对新的或定制的流程和服务设计的培训与服务运营团队沟通战略、设计和转换的事情*中国信息化培训中心7/172归档(Documentation)参与流程手册的定义和维护建立他们自己的技术程序手册参与计划文档的创建和维护,如容量计划、可用性计划和IT服务连续性计划参与服务组合的创建和维护参与服务管理工具的创建和维护*中国信息化培训中心8/172服务运营(Service Operation) 服务运营原理(Service Operation Principles) 服务运营流程(Service Operation ProcessesService Operation Proces

8、ses)事件管理(Event management) 故障管理(Incident management) 请求履行(Request fulfillment) 问题管理(Problem management) 访问管理(Access management) 普通的服务运营活动(Common Service Operation Activities) 服务运营的组织(Organizing for Service Operation) 技术考虑(Technology Consideration) 实施服务运营(Implemention of Service Operation) 挑战、风险和关键成功

9、因素(Challenges, Risks and Critical Success Factors )*中国信息化培训中心9/172目的和目标 目的(Purpose) 在事件的整个生命周期中管理它们,活动的生命周期包括检测事件、弄清它们的含义,然后决定采取适当的控制行动。事件管理也因此成为“运营监视与控制”的基础 如果这些事件代表运营的信息以及警告( warnings)和例外 ( exceptions ),它们就作为日常自动化运营活动的基础。例如, 在远程的设备上去执行一个脚本,或者提交一个处理工单 目标(Objective) 检测任何对于CI或IT服务的管理有意义的状态的改变 决定采取适当的

10、控制行动,并保证与适当的职能进行沟通 为执行服务运营流程或活动提供触发器或切入点 提供一种手段或方法,去把实际的运营绩效和行为与设计标准和SLAs做比较 为服务保证和报告,以及服务改进提供一个基础*中国信息化培训中心10/172范围(Scope)配置项(Configuration Items-CI)环境条件(如火和烟的检测)软件许可(License)的监控安全(如入侵检测-intrusion detection)正常活动(如跟踪一个应用程序的使用情况或一台服务器的性能)*中国信息化培训中心11/172对业务的价值事件管理提供一种早期检测故障的机制事件管理使一些自动化的活动成为可能与其它的服务管

11、理流程集成(如可用性和容量管理),事件管理能够就状态的改变或例外发出信号,从而使有关人员或小组提早做出响应事件管理为自动化运营提供了基础事件管理与服务交付和客户满意度有直接的关系*中国信息化培训中心12/172策略、原则和基本概念(Policies, principles and basic concept)策略(Policies)事件通知应该只发给那些与事件有关的人员事件管理和支持应该尽可能地集中如果可能,所有应用程序的事件应该使用一套相同的消息、日志标准和协议事件处理行动应该尽可能自动去做一套标准的分类办法应该提前做好所有已知的事件应该被捕捉并记录*中国信息化培训中心13/172策略、原则

12、和基本概念(续)原则和基本概念事件的类型(Types of events) 信息事件(Informational events) 一个计划的任务已经完成 一个用户已经登录去使用一个应用程序 一个邮件已经到达它的目的地 警告事件(Warning events) 一台服务器的内存使用率已经达到它可接受的最高性能级别的5%以内 一个事务的完成时间比正常时间超出了10%*中国信息化培训中心14/172策略、原则和基本概念(续)原则和基本概念(续)事件的类型(Types of events) 例外事件(Exception events) 一个用户尝试用不正确的口令登录到一个应用程序 一个业务流程发生了不

13、寻常的情况,它可能代表一个需要进一步调查的例外事件(例如一个Web页报警,指出支付授权站点不可用正在影响业务交易的财务审批) 一个设备的CPU在可接受的利用率之上 一个PC扫描显示安装了非授权的软件*中国信息化培训中心15/172策略、原则和基本概念(续)原则和基本概念(续)事件过滤(Filtering of events) 几个能获得正确的过滤级别的战略: 集成(Integration)如果可能,把事件管理集成到所有的服务管理流程中去,这将保证仅仅对这些流程有意义的事件被报告 设计(Design)在设计新的服务时考虑事件管理 痕迹和错误(Trail and error)无论你的前期工作做的多

14、么好,还是会有某些事件得不到适当的过滤。因此,事件管理必须有一个正式的程序去评估过滤的效力 计划(Planning)应该有一个针对整个IT基础架构的事件管理软件的开发计划*中国信息化培训中心16/172策略、原则和基本概念(续)原则和基本概念(续)设计事件管理(Designing event management) 设计事件管理时需要考虑的关键因素: 需要监控什么? 要求什么类型的监控(主动还是被动,性能还是输出)? 什么时候需要产生一个事件? 事件中需要传达什么类型的信息? 信息要送给谁? 谁负责事件的识别、沟通、升级和采取行动?*中国信息化培训中心17/172流程活动、方法和技术(Proc

15、ess activities,methods and techniques)请参考文档“配套大图-2011”上的图*中国信息化培训中心18/172流程活动、方法和技术(续) 事件发生(Event occurs) 事件通知(Event notification) 事件检测(Event detection) 事件过滤(Event filtering) 一级事件关联和过滤(First-level event correlation and filtering) 事件的意义(Significance of events) 信息传递(Informational) 警告(Warning) 例外(Excep

16、tion) 二级事件关联(Second-level event correlation) 需要进一步的行动吗?(Further action required?) 选择回应(Response selection) 回顾行动(Review actions) 关闭事件(Close event)*中国信息化培训中心19/172信息管理(Information Management)消息,例如SNMP消息数据库,例如IT设备的MIB(Management Information Bases)供应商的监控工具代理软件(Agent software)包含用于决定事件含义和响应机制的关联引擎*中国信息化培训

17、中心20/172CSF和KPICSF检测所有对于CIs和IT服务的管理有意义的状态的改变KPI:事件的数量与故障的数量的比较及其比例每个平台或应用程序产生的事件的数量与所有平台或应用程序产生的事件总数的比较及其比例*中国信息化培训中心21/172CSF和KPI(续)CSF保证所有的事件都告知了需要通知的或需要采取进一步行动的职能KPI:需要人员干预的事件的数量和百分比,还有是否被执行了已经发生的故障的数量,以及没有匹配的事件作为触发器的故障的百分比*中国信息化培训中心22/172CSF和KPI(续)CSF提供一种方法或手段,去把实际运营的性能和状况与设计标准和SLAs做比较KPI:还没有影响到

18、业务就被解决掉的故障的数量和百分比导致故障或变更的事件的数量和百分比由存在的问题或已知错误导致的故障的数量和百分比代表性能问题的事件的数量和百分比代表潜在的可用性问题的事件的数量和百分比*中国信息化培训中心23/172CSF和KPI(续)CSF为服务保证、报告和服务改进提供一个基础KPI:重复发生的事件的数量和百分比没有引起实际的服务/功能降低的事件/报警的数量*中国信息化培训中心24/172Challenges和RisksChallenges(挑战) :首先面临的挑战可能是部署必要的工具所需要的资金最大的挑战之一是建立正确的过滤级别在整个IT基础架构中部署监控代理可能是困难的、长期的自动化的

19、监控活动会产生额外的网络流量,这可能对计划的网络容量级别产生不利的影响获得必要的技巧也是个花时间和成本的事情部署了事件管理工具,但没有建立相应的流程去运行它们*中国信息化培训中心25/172Challenges和Risks(续)Risks(风险):不能获得足够的资金保证正确的过滤级别在整个IT基础架构中部署监控代理时不能获得持续的动力*中国信息化培训中心26/172服务运营(Service Operation) 服务运营原理(Service Operation Principles) 服务运营流程(Service Operation ProcessesService Operation Pro

20、cesses) 事件管理(Event management)故障管理(Incident management) 请求履行(Request fulfillment) 问题管理(Problem management) 访问管理(Access management) 普通的服务运营活动(Common Service Operation Activities) 服务运营的组织(Organizing for Service Operation) 技术考虑(Technology Consideration) 实施服务运营(Implemention of Service Operation) 挑战、风险和关

21、键成功因素(Challenges, Risks and Critical Success Factors )*中国信息化培训中心27/172目的和目标目的(Purpose)故障管理的主要目的是尽快恢复正常的服务运营,并把故障对业务的影响降到最低。“正常的服务运营”( Normal service operation )被定义为一种运营状态,它代表协定的服务和运营级别。目标(Objective)保证用标准的方法和程序去有效、迅捷地处理故障对业务和IT支持人员增加故障的可见度和沟通通过使用专业的方法来快速解决和沟通故障来增强业务对IT的感知使故障管理活动与业务优先级相匹配用IT服务质量来维护客户满

22、意度*中国信息化培训中心28/172范围(Scope)故障管理包括任何使服务中断或可能使服务中断的事件*中国信息化培训中心29/172对业务的价值为业务和IT支持团队减少由于故障而导致的非计划的人工和成本通过检测和解决故障来降低业务不可用的时间,反过来说,它代表了服务的高可用性保证IT活动与实时的业务优先级相匹配识别潜在的服务改进机会服务台可以帮助识别额外的服务或培训需求*中国信息化培训中心30/172策略、原则和基本概念策略(Policies)故障和它们的状态必须被及时、有效地沟通故障必须在业务可接受的时间之内解决客户满意度在任何时候都要保持故障处理要与整个的服务级别和目标相匹配所有的故障应

23、该在一个单独的管理系统中保存和管理所有的故障应该按一个标准的分类方案来进行分类故障记录要定期进行审计,以保证故障的正确录入及分类所有的故障记录应该尽可能使用相同的格式对于故障的优先级和升级,应该尽可能有一套标准*中国信息化培训中心31/172策略、原则和基本概念(续)原则和基本概念( Principles and basic concepts )时间表( Timescales ) 基于SLA中约定的故障反应和解决目标而做出的,表示故障处理阶段时间安排的表格故障模型(Incident Models) 处理故障应该采取的步骤 这些步骤对应的时间分配情况,还要考虑其他的依赖关系、协同处理等因素 职责

24、:谁应该做什么? 完成这些活动的时间表和阈值 评估程序:什么时候、联系什么人 任何必须要保留痕迹的活动*中国信息化培训中心32/172策略、原则和基本概念(续)原则和基本概念(续)重大故障( Major incidents) 就是一些优先级高的故障,需要单独的程序去处理,它的时间表会更短,紧急度会更高故障状态跟踪(Incident status tracking) 开放(Open)故障已经被识别,但还没有分派资源去解决它 进行中(In progress)故障正在调查和解决中 解决(Resolved)针对故障的解决方案已经提供,但正常的服务运营状态还没有得到业务或最终用户的确认 关闭(Close

25、d)业务或用户已经认可故障已解决,正常的运营状态已经恢复*中国信息化培训中心33/172流程活动、方法和技术(Process activities, methods and techniques)故障识别(Incident identification)从业务的角度来说,当用户已经受到了影响,并且联系服务台之后,才会有人来处理故障,这种情况是不可接受的因此,所有的关键组件都应该被监控,以便失败或潜在的失败能够在早期检测,这意味着故障管理流程能够快速启动在理想情况下,故障应该在影响到用户之前得到解决*中国信息化培训中心34/172故障日志(Incident Logging)Unique refe

26、rence numberIncident categorization (often broken down into between two and four levels of sub-categories)Incident urgencyIncident impactIncident prioritizationDate/time recordedName/ID of the person and/or group recording the incidentMethod of notification (telephone, automatic, e-mail, in person,

27、etc.)Name/department/phone/location of userCall-back method (telephone, mail, etc.)Description of symptoms(症状描述)Incident status (active, waiting, closed, etc.)Related CISupport group/person to which the incident is allocatedRelated problem/Known ErrorActivities undertaken to resolve the incidentReso

28、lution date and timeClosure categoryClosure date and time.流程活动、方法和技术(续)*中国信息化培训中心35/172流程活动、方法和技术(续)故障分类(Incident categorization)*中国信息化培训中心36/172流程活动、方法和技术(续)故障优先级(Incident prioritization)*中国信息化培训中心37/172流程活动、方法和技术(续)初始诊断(Initial diagnosis)请参考文档“配套大图-2011”上的图*中国信息化培训中心38/172流程活动、方法和技术(续)故障升级(Inciden

29、t escalation)职能性升级(Functional escalation)一旦服务台明确他们不能解决这个故障,就必须立即升级这个故障以得到进一步的支持层次性升级(Hierarchic escalation)如果故障是一个严重事件(比如优先级是1的事件),那么适当级别的IT经理必须要通知到。如果故障的解决时间会比较长或者难度很大,也需要进行权力性升级。*中国信息化培训中心39/172流程活动、方法和技术(续)调查和诊断(Investigation and diagnosis)弄清到底是哪里出了错,或者用户到底想找什么理解事件的先后顺序确认故障的全部影响,包括所影响的用户的数量和范围识别可

30、能触发了这个故障的任何事件通过搜索故障/问题记录、KEDB或厂商/供应商的知识库来获得关于故障的详细知识*中国信息化培训中心40/172流程活动、方法和技术(续)解决和恢复(Resolution and recovery)要求用户在他们的桌面或远程设备上直接采取行动服务台通过集中的或远程的方式实施解决方案要求专家支持小组去实施特定的恢复行动(例如重新配置一台路由器)要求第三方的供应商或维护人员去解决故障*中国信息化培训中心41/172流程活动、方法和技术(续)故障关闭(Incident closure)关闭分类(Closure categorization)用户满意度调查(User satis

31、faction survey)故障归档(Incident documentation)目前还存在或可能再次出现的问题(Ongoing or recurring problem)正式关闭(Formal closure)*中国信息化培训中心42/172流程活动、方法和技术(续)重新打开事件的规则(Rules for re-opening incidents)举例说明:如果一个已经关闭的故障的问题在一天内又出现,则可以把这个故障重新打开。如果超过了一天,则要产生一个新的故障,但要和前一个故障做一个链接。*中国信息化培训中心43/172信息管理(Information Management)故障管理工

32、具故障记录*中国信息化培训中心44/172CSF和KPICSF尽可能快地解决故障,使其对业务的影响最小KPI:解决或规避故障所需要的时间,通过影响代码来分解处理故障时每个阶段所花费的时间服务台直接关闭的故障的百分比(没有请教其它支持级别)远程解决的故障数量和百分比(不需要去现场)还没有影响到业务就被解决的故障的数量*中国信息化培训中心45/172CSF和KPI(续)CSF维护IT服务的质量KPI:故障总数对每一个IT服务来说,当前故障的积压情况对每一个IT服务来说,重大故障的数量和百分比*中国信息化培训中心46/172CSF和KPI(续)CSF维护IT服务的用户满意度KPI:客户/用户满意度调

33、查的平均分数收回的调查问卷占送出去的调查问卷的百分比*中国信息化培训中心47/172CSF和KPI(续)CSF对业务和IT支持团队增加故障的可见性和沟通KPI:业务用户就已经报告的故障给服务台打电话或通过其它方式联系服务台的平均数量业务用户就故障沟通的内容和质量而提出的抱怨的数量*中国信息化培训中心48/172CSF和KPI(续)CSF故障管理活动与业务优先级的匹配KPI:在协定的响应时间内得到处理的故障的百分比每个故障的平均成本(Average cost per incident)*中国信息化培训中心49/172CSF和KPI(续)CSF确保使用标准的方法和程序处理故障KPI:被错误分配的故

34、障的数量和百分比被错误分类的故障的数量和百分比每个服务台人员处理的故障的数量和百分比与变更和发布有关的故障的数量和百分比*中国信息化培训中心50/172Challenges和RisksChallenges(挑战):尽早检测故障的能力让所有的成员(技术团队以及用户)都知道所有的故障都要记录下来,并鼓励使用基于Web的自助服务能力关于问题和已知错误信息的可用性与CMS集成,以便在执行一线支持时确定CIs之间的关系,并查阅CIs的历史与SLM流程集成,这将帮助故障管理正确评估故障的影响和优先级,并帮助定义和执行升级程序*中国信息化培训中心51/172Challenges和RisksRisks(风险)

35、:由于缺乏可用的或经过良好培训的人员,致使不能在客户可接受的时间内处理故障由于采用了不合适的支持工具,导致不能给出报警信息或进展报告,使故障的处理难于推进由于采用了不适当的工具或缺乏集成,导致信息源的不足由于没有OLAs或UCs而导致的目标或行动的不一致*中国信息化培训中心52/172服务运营(Service Operation) 服务运营原理(Service Operation Principles) 服务运营流程(Service Operation ProcessesService Operation Processes) 事件管理(Event management) 故障管理(Incid

36、ent management)请求履行(Request fulfillment) 问题管理(Problem management) 访问管理(Access management) 普通的服务运营活动(Common Service Operation Activities) 服务运营的组织(Organizing for Service Operation) 技术考虑(Technology Consideration) 实施服务运营(Implemention of Service Operation) 挑战、风险和关键成功因素(Challenges, Risks and Critical Succ

37、ess Factors )*中国信息化培训中心53/172目的和目标(Purpose and objective)目的(Purpose)请求履行是负责管理所有来自用户的服务请求生命周期的流程目标(Objective)通过有效地、专业地处理所有的服务请求来维护客户和用户的满意度为用户提供一个请求和接收标准服务的渠道。所谓标准服务是指预先定义好的、已经批准的、有相应处理流程的服务向用户提供关于服务可用性的信息,以及获得这些信息的程序提供请求的标准服务的组件,如License和软件介质协助收集信息、处理抱怨和意见*中国信息化培训中心54/172范围(Scope)服务请求的内容可能是五花八门的,服务请

38、求与故障的区别在于:故障一般是“非计划的”,而服务请求一般来说是“能够或应该有计划的”对于一般的机构来说,服务请求是先提交给故障管理,然后再由故障管理流程给筛选出来对于一些服务请求很多的机构,也可以把这个流程完全独立出来,单独记录、单独管理*中国信息化培训中心55/172对业务的价值对标准服务提供快速、有效的访问,使业务人员能够改进他们的生产力、或者提高业务服务和产品的质量有效地减少在对现有服务或新的服务的访问中所存在的官僚主义,这也会降低提供这些服务的成本通过一个集中的满足职能来增加对所请求服务的控制级别*中国信息化培训中心56/172策略、原则和基本概念策略(Policies):用于满足请

39、求的活动要按照事先定义好的流程图(模型)来执行,这包括满足请求所需要的步骤、需要联系的个人或小组、目标时间表和升级路径等服务请求的所有者应该在一个集中的职能(如服务台)内工作,以便及时地监视、升级、派遣,以及满足用户的请求那些会影响到CIs的服务请求应该通过实施一个标准变更来满足所有的服务请求都应该通过一个单一的系统来管理,包括记录、控制、协调、提升等在执行满足活动之前,所有的服务请求都需要被授权请求的履行应该在一套协商好的标准下发生怎么提交请求、怎么查看请求的状态,这些都需要有明确的交代*中国信息化培训中心57/172策略、原则和基本概念(续) 原则和基本概念( Principles and

40、 basic concept ) 请求模型(Request models) 菜单选择(Menu selection) 请求状态跟踪(Request status tracking) 为请求指定优先级(Prioritizing request) 升级请求(Escalating request) 财务批准(Financial approval) 一些服务请求可能涉及到费用问题,需要走财务审批的程序 其他批准(Other approval) 一些服务请求可能涉及到有关的政策、法规等,也可能与别的流程相关,所以,还要走其他的批准程序 履行(Coordination of fulfillment act

41、ivities) 简单的服务请求可以由服务台来满足(一线支持),复杂的请求可能要传递到特殊的小组或供应商那里去处理 关闭(Closure) 服务请求被履行之后,必须在服务台把它关闭*中国信息化培训中心58/172流程活动、方法和技术(Process activities, methods and techniques)请参考文档“配套大图-2011”上的图*中国信息化培训中心59/172流程活动、方法和技术(续)接收请求(Receive request)请求记录和确认(Request logging and validation)请求分类(Request categorization)请求优先

42、级(Request prioritization)请求授权(Request authorization)请求检查(Request review)请求模型的执行(Request model execution)请求关闭(Request closure)重新打开服务请求的规则(Rules for reopening requests)*中国信息化培训中心60/172信息管理(Information Management)什么服务正在被请求要求谁去授权这个服务哪个流程将被用来满足这个请求谁被分配去处理请求,采取了什么行动记录请求的日期和时间,以及采取的所有行动的日期和时间关闭细节RFCs*中国信息化

43、培训中心61/172CSF和KPICSF请求必须用有效的、及时的方式来满足,它与每类请求的服务级别目标相吻合KPI:处理每一类服务请求的时间在协定的目标时间之内完成的请求的数量和百分比服务请求各阶段的分解(记录、处理、关闭)由服务台直接关闭的服务请求的百分比通过远程或自动化手段解决的服务请求的数量和百分比总的请求数量每种类型服务请求的平均成本*中国信息化培训中心62/172CSF和KPI(续)CSF只有授权的请求才应该得到满足KPI:在所有满足的服务请求中,有适当授权的请求所占的百分比请求履行活动所产生的故障中,与安全威胁有关的故障的数量*中国信息化培训中心63/172CSF和KPI(续)CS

44、F用户满意度必须被保持KPI:与处理服务请求相关的用户满意度级别与请求履行活动有关的故障的总数量当前积压的、没有解决的服务请求的数量*中国信息化培训中心64/172Challenges和RisksChallenges(挑战) :清楚定义并归档的服务请求流程的范围,使大家都知道这个流程是干什么的自助服务的工具需要给用户提供一个前端的接口每一类服务请求的服务级别目标都需要去协商和沟通满足请求的成本必须也要协商明确什么服务可以标准化,谁可以请求使用他们关于“什么请求是可用的”这种信息应该能够很容易得到请求需要按照一个预定义的标准履行程序去执行请求履行对用户满意度有很大的影响*中国信息化培训中心65/

45、172Challenges和Risks(续)Risks(风险):如果范围不清楚,人们将不知道这个流程到底管什么事情如果用户接口设计的不好,可能会导致用户提交请求很困难如果请求履行流程的后台设计不好,可能会导致无法处理大量的、已经提交的用户请求监视能力的不足,可能会导致准确的指标不能被收集*中国信息化培训中心66/172服务运营(Service Operation) 服务运营原理(Service Operation Principles) 服务运营流程(Service Operation ProcessesService Operation Processes) 事件管理(Event manag

46、ement) 故障管理(Incident management) 请求履行(Request fulfillment)问题管理(Problem management) 访问管理(Access management) 普通的服务运营活动(Common Service Operation Activities) 服务运营的组织(Organizing for Service Operation) 技术考虑(Technology Consideration) 实施服务运营(Implemention of Service Operation) 挑战、风险和关键成功因素(Challenges, Risks

47、and Critical Success Factors )*中国信息化培训中心67/172目的和目标(Purpose and objective)目的(Purpose)问题管理是负责管理所有问题的生命周期的流程,它寻求把故障和问题给业务带来的负面影响降到最低。目标(Objective)阻止问题和故障的发生消除重复发生的故障如果不能阻止故障的复发,则要把它的影响最小化*中国信息化培训中心68/172范围(Scope)诊断故障的根本原因,给出相应的解决方案,并保证这些解决方案通过适当的控制程序去实施(如变更管理和发布管理)维护问题和解决方案的信息,以便组织能够降低故障的数量和影响。在这个方面,问

48、题管理和知识管理有密切的关系故障管理和问题管理虽然是两个独立的流程,但他们之间的关系非常近。比如使用相同的工具,使用相似的分类、影响和优先级的编码系统。*中国信息化培训中心69/172对业务的价值通过减少故障的数量和持续时间来提高IT服务的可用性通过减少由于故障而导致的非计划的工作和使用知识库来提高IT人员的生产力降低由于无效的变通方案(Workaround)或修复行动而产生的开销降低由于做“消防队员”或解决重复发生的故障而带来的成本*中国信息化培训中心70/172策略、原则和基本概念(Policies,principles and basic concept)策略(Policies)问题和故

49、障应该分开来跟踪所有的问题应该在一个单独的系统中保存和管理所有的问题都应该遵循一个标准的分类方案*中国信息化培训中心71/172策略、原则和基本概念(续)原则和基本概念( Principles and basic concept )问题(Problem) 一个或多个故障的原因。变通方案(Work-around) 在一个完全的解决方案还没有开发出来之前,先用一个临时的办法来降低和消除故障或问题的影响。已知错误(Known Error) 一个找到了根本原因,并给出变通方案或永久解决方案的问题。*中国信息化培训中心72/172策略、原则和基本概念(续)原则和基本概念( Principles and

50、basic concept )被动和主动的问题管理活动 被动问题管理活动典型地是由对一个已经发生的故障的响应来触发的,被动问题管理是故障管理的补充,它聚焦在寻找故障的根本原因上 主动问题管理活动是由寻求服务改进的活动来触发的问题模型 许多问题都是唯一的,它的解决办法也是独特的。但是,也有这样的情况:许多故障背后的原因其实是一个问题*中国信息化培训中心73/172策略、原则和基本概念(续)原则和基本概念(续)故障 Vs 问题 故障是一个IT服务非计划的停止或质量下降 问题是从另外一个角度去看故障,它要查找故障的根本原因,而这个根本原因也可能造成了别的故障 故障不会“变成”问题 故障管理聚焦在把服

51、务恢复到正常运营的状态 问题管理聚焦在寻求一种方法去阻止故障的发生*中国信息化培训中心74/172策略、原则和基本概念(续)原则和基本概念(续)问题分析技术(Problem analysis techniques)Chronological Analysis(按时间顺序排列分析)Pain-Value Analysis(痛值分析)Kepner and Tregoe(KT分析)Brainstorming(头脑风暴)Ishikawa Diagrams(石川图,鱼刺图)Pareto Analysis(帕累托图)*中国信息化培训中心75/172流程活动、方法和技术(Process activities,

52、methods and techniques)请参考文档“配套大图-2011”上的图*中国信息化培训中心76/172流程活动、方法和技术(续) 问题检测(Problem detection) 问题日志(Problem logging) 问题分类(Problem Categorization) 问题优先级(Problem Prioritization) 问题调查和诊断(Problem Investigation and Diagnosis) 变通方案(Workarounds) 产生一个已知错误记录(Raising a Known Error Record) 问题解决(Problem resolu

53、tion) 问题关闭(Problem Closure) 重大问题回顾(Major Problem Review)*中国信息化培训中心77/172信息管理配置管理系统(CMS)CMS拥有IT基础架构的所有组件以及组件间关系的详细信息,它为问题诊断和问题影响的评估提供一个有价值的信息来源它也包含以前活动的信息,可以作为有价值的历史数据的来源,去帮助识别趋势和潜在的弱点主动问题管理的一个重要组成部分已知错误数据库(KEDB)KEDB的目的是允许保存以前关于故障和问题的知识,它们是怎样被克服的,如果复发的话,能够快速诊断和解决已知错误记录应该包括已经发生的故障的详细信息,以及Workaround或解决

54、方案的详细信息*中国信息化培训中心78/172CSF和KPICSF最小化不能阻止的故障对业务的影响KPI:添加到KEDB中的已知错误的数量KEDB准确度的百分比(来自审计结果)由服务台直接关闭的故障的百分比解决连接到问题记录的故障的平均时间*中国信息化培训中心79/172CSF和KPI(续)CSF通过消除重复发生的故障来维护IT服务的质量KPI:问题的总数量对每一个IT服务来说,当前积压的问题的多少对每一个IT服务来说,重复发生的故障的数量*中国信息化培训中心80/172CSF和KPI(续)CSF通过提供完整的、专业化的问题处理活动来维护业务对IT能力的信心KPI:重大问题的数量成功执行了重大

55、问题回顾的重大问题所占的百分比被错误分配或分类的问题的数量和百分比没有解决的问题的积压程度,以及其发展趋势(稳定、减少、增加?)超过了目标解决时间的问题的数量和百分比在SLAs目标之内解决的问题的百分比每个问题的平均成本*中国信息化培训中心81/172Challenges和RisksChallenges(挑战) :问题管理的一个主要依靠是建立一个有效的故障管理流程和工具问题解决团队识别故障根本原因的能力和技巧有时也是一个挑战如果使用不同的工具记录故障和问题,那关联故障和问题的能力也可能会成为一项挑战问题管理活动与CMS集成的能力保证技术人员接受持续的培训二线、三线人员应该与一线人员有很好的工作

56、关系保证参与解决问题的人员对业务所受的影响有很好的理解*中国信息化培训中心82/172Challenges和Risks(续)Risks(风险):由于缺乏可用的或适当的培训资源而不能在客户可接受的时间表内处理问题由于不合适的支持工具被用于调查,致使问题处理陷入泥潭,不能前进由于采用了不合适的工具或缺乏集成,导致缺乏准确的、及时的信息来源没有经过适当培训的支持人员去调查问题、寻找根本原因,或者去识别删除已知错误的活动由于没有OLAs或UCs而导致的目标或行动的不一致*中国信息化培训中心83/172服务运营(Service Operation) 服务运营原理(Service Operation Pr

57、inciples) 服务运营流程(Service Operation ProcessesService Operation Processes) 事件管理(Event management) 故障管理(Incident management) 请求履行(Request fulfillment) 问题管理(Problem management)访问管理(Access management) 普通的服务运营活动(Common Service Operation Activities) 服务运营的组织(Organizing for Service Operation) 技术考虑(Technology

58、 Consideration) 实施服务运营(Implemention of Service Operation) 挑战、风险和关键成功因素(Challenges, Risks and Critical Success Factors )*中国信息化培训中心84/172目的和目标(Purpose and objective)目的(Purpose)访问管理为用户提供使用一个或一组服务的权限,因此它执行定义在信息安全管理中的策略和活动。目标(Objective)按照定义在信息安全管理中的策略和活动来管理对服务的访问对服务的访问请求做出有效的响应,改变访问权限或限制访问监督对服务的访问,以保证所授予

59、的权限没有被不适当地使用*中国信息化培训中心85/172范围(Scope)执行信息安全管理所制定的策略访问管理保证用户有权去使用一个服务,但它并不保证你随时都可以使用服务,因为你还要受可用性管理的制约访问管理是一个由所有的技术和应用程序管理职能来执行的流程,它一般不是一个单独的职能访问管理可以由一个服务请求来触发*中国信息化培训中心86/172对业务的价值保证对服务的访问是受控的,这使得组织能有效地维护信息安全保证雇员有正确的访问级别去有效地执行他们的工作减少不熟练的用户在数据录入或使用关键服务时产生错误提供能力去审计服务的使用情况,追踪服务滥用提供撤销访问权限的能力提供并阐明符合法律法规的要

60、求*中国信息化培训中心87/172策略、原则和基本概念(Policies,principles and basic concept)策略(Policies)访问管理的活动要受信息安全策略的指导和控制访问管理应该记录和跟踪对服务的使用情况,保证所提供的权限被适当使用访问管理要保证用户对服务的访问权限与用户身份的变更相匹配访问管理应该维护谁访问了什么、谁尝试访问什么的历史信息用于处理、升级和沟通安全事件的程序必须被清楚地定义并归档*中国信息化培训中心88/172策略、原理和基本概念(续)原理和基本概念( Principles and basic concept )访问(Access)指用户能在什么

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论