已阅读5页,还剩164页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中国联通公司企业标准 QB/CU XXX-2012 中国联通云运维管理技术规范中国联通云运维管理技术规范 China Unicom Cloud Computing Operations Management Technical Specification(OAM) (V1.0) 2012-XX-XX 发布2012-XX-XX 实施 中国联通公司发布 目 录 目目 录录.II 前前 言言.V 中国联通云运维管理技术规范中国联通云运维管理技术规范V1.01 1 范围 1 2 规范性引述文件 1 3 缩略语和术语 1 3.1 缩略语.1 3.2 术语及定义.1 4 云运维管理体系框架 2 4.1 云运维管理的概述2 4.2 体系框架定位4 4.3 体系框架设计原则5 4.4 体系架构管控策略5 4.5 体系框架总图6 4.6 云运维管理活动概述10 4.7 云运维管理活动指标体系12 5 云运维管理架构 22 5.1 云运维管理功能架构22 5.2 云运维管理与外围系统/平台关系.24 6 运维门户 24 6.1 门户基础服务25 6.2 工作台29 6.3 信息发布30 6.4 综合展现31 6.5 系统帮助33 7 运维需求管理 33 7.1 功能定义33 7.2 功能要求34 8 运维服务管理 35 8.1 效益提升域35 8.2 系统保障域53 8.3 服务管控域64 9 云资源管理 66 9.1 资源状态管理66 9.2 资源数据核查67 9.3 资源数据提供68 9.4 资源拓扑管理68 9.5 资源数据模型管理71 9.6 资源数据维护71 9.7 资源预警72 9.8 资源数据模型73 10 资源监控管理 80 10.1 数据采集技术要求80 10.2 告警管理84 10.3 服务质量管理90 10.4 性能管理94 10.5 监控拓扑管理97 10.6 资源服务质量监控97 10.7 日志管理98 10.8 监控指标体系99 11 业务监控管理 111 11.1 业务系统信息管理111 11.2 业务拓扑管理112 12 云平台策略管理 112 12.1 资源纳管112 12.2 资源分配113 12.3 资源调度114 12.4 容量管理116 12.5 策略操作管理119 13 云平台配置管理 119 13.1 资源配置操作管理119 14 统计分析 121 14.1 功能定义121 14.2 功能要求121 15 集成管理 122 15.1 内部接口122 15.2 与IaaS平台接口.122 15.3 与PaaS平台接口135 15.4 与SaaS平台接口139 15.5 与云运营管理接口143 15.6 与其他系统及平台的接口145 16 系统自管理 145 16.1 参数配置145 16.2 日志管理146 16.3 平台监视146 16.4 用户管理146 16.5 系统备份和恢复147 16.6 版本控制管理147 AI.AI.私有云运营管理私有云运营管理.147 A1.1.用户对象.147 A1.2.运营和运维关系.148 A1.2.1.定义.148 A1.2.2.管理对象.148 A1.3.运营功能.148 A1.3.1.运营门户.149 A1.3.2.云用户管理.149 A1.3.3.云服务管理.151 A1.3.4.订单管理.158 A1.3.5.服务等级管理.158 A1.3.6.计量/计费管理.159 B1.B1.云平台策略云平台策略.160 B1.1弹性伸缩策略.160 B1.2负载均衡策略.161 B1.3业务维护策略.161 前 言 随着云计算技术的成熟,中国联通基于云计算的内部支撑系统建设逐步推进。基础设施、平台和终 端架构向云计算演进,一方面新建系统普遍采用云计算架构,另一方面已有系统也在向云计算平台迁移。 为了更好的指导中国联通云化后的IT运维管理,本规范对中国联通未来云化后的IT运维管理提出了全面 要求,用于指导中国联通未来云计算运维管理的建设,实现按需的IT服务支撑。 本规范遵循中国联通业务需求和云计算技术堆栈相结合的原则,依据中国联通已开展云计算项目、 云计算业务发展需求和规划,同时充分调研云计算相关国际标准、行业标准、技术发展现状及竞争对手 企标进展情况,在这基础上,结合联通规划,对中国联通云运维管理提出了全面要求,明确了云计算运 维管理的范围、用户、对象及体系架构,规定了中国联通云计算运维管理的功能要求、技术要求,以及 中国联通云计算运维管理的资源数据模型和监控指标体系等。随着业务需求和技术的不断发展,本标准 将不断进行补充和完善。 本规范适用于指导中国联通未来云计算运维管理的建设。中国联通在此之前的文件与本规范不一致 的,应以本次规范要求为准,并在相关的具体规范发布后废止。 本标准由中国联通公司信息化事业部提出。 本标准由中国联通公司技术部归口。 本标准主要起草单位:中国联通信息化事业部,联通研究院。 本标准主要起草人:孙海峰,张云勇,宋积慧,李卫,王智明。 本标准的修改和解释权属中国联合网络通信有限公司。 中国联通云运维管理技术规范 V1.0 1 范围 本规范阐述了云计算运维管理的范围、用户、对象及体系架构,规定了中国联通云计算运维管理的 功能要求、技术要求,以及中国联通云计算运维管理的资源数据模型和监控指标体系等。 本技术规范适用于指导中国联通未来云计算运维管理的建设。 2 规范性引述文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的 修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究 是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 1 QB/CU 191-2012中国联通云计算技术体制 V1.0 2 QB/CU 165-2012 中国联通 IT 云计算 IaaS 平台技术规范 V1.0 3 QB/CU 166-2012中国联通 IT 云计算 IaaS 接口技术规范 V1.0 3 缩略语和术语 3.1 缩略语 缩略语缩略语英文全称英文全称中文含义中文含义 APIApplication Programming Interface应用程序编程接口 IaaSInfrastructure as a service基础设施即服务 ITInformation Technology信息技术 PaaSPlatform as a service平台即服务 PRMPartner Relationship Management合作伙伴关系管理 SaaSSoftware as a service软件即服务 SOAService Oriented Architecture面向服务的体系架构 3.2 术语及定义 术语术语/ /定义定义解释解释 ESB 基于开放的标准消息总线,用于通过标准的适配器和接口,来提供各程序和组件 之间的互操作功能。它支持相互独立的异构环境中的服务、消息及基于事件的交 互,并且具有适当的服务级别和可管理性。 ETL 指数据抽取、转换、装载的过程。能够按照统一的规则集成并提高数据的价值, 是负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步 骤。 IaaS以服务的形式,提供计算、存储、网络等基础设施资源,用户无需购买服务器、 存储设备、网络设备,只需通过互联网租赁即可搭建自己的应用系统,帮助削 减IT基础设施的建设成本和运维成本。 PaaS 以服务的形式,提供软件开发、测试、部署和运行环境,以及能力开放接口或应 用服务引擎,屏蔽软件开发底层复杂的操作,用户可以快速开发出基于云平台的 高性能、高可扩展的服务。 SaaS以服务的形式,提供各种在线软件,用户不必购买软件,只需按需租用软件。 SOA 一种新型的软件体系架构模式,它是在计算环境下设计、开发、应用、管理分散 服务单元的一种规范,它将应用程序的不同功能单元(称为服务)通过服务间定 义良好的接口和契约联系起来。可以根据需求通过网络对松散耦合的粗粒度服务 进行分布式部署、组合和使用。 云监控提供对云服务的资源监控,供用户查看资源的使用情况、运行性能等,包括了CPU 的使用率、磁盘读写和网络流量情况 云计算一种新的计算方法和商业模式,通过虚拟化、分布式处理和宽带网络等技术,按 照“即插即用”的方式,将计算、存储、网络等IT基础设施,以及其上的开发平 台、软件等服务,抽象成高效、弹性、可运营、可管理的公共信息处理资源,通 过公众通信网络,以按需分配的服务形式向用户提供动态可扩展信息处理能力和 应用服务,用户按实际使用数量进行付费在云计算下,使用者通过公众通信网络, 以按需分配的服务形式,获得动态可扩展信息处理能力和应用服务,也是电信运 营商新的信息服务产品和ICT交付模式,资源出租转化为能力出租,由自建自营到 开放共赢。 云平台云平台是指云运维管理所辖的IaaS/PaaS/SaaS综合管理平台, 资源池资源池是一组物理资源或一组虚拟资源的集合,可以从池中获取资源,也可将资 源回收到池中。资源包括物理机、虚拟机、虚拟网络设备、物理网络设备和IP地 址等。 4 云运维管理体系框架 4.1 云运维管理的概述 4.1.1 云运维管理的范围 根据云计算的可运营、可管理特性,以及专业管理分工特点,云计算的一体化服务支撑由云运营管 理和云运维管理构成。 云运营管理负责面向云资源使用者,提供云计算服务需求受理、开通、计量/计费和客户服务。云运 营管理的最终用户是云资源使用者。 云运维管理负责面向云资源管理者和云运维人员,提供云资源的规划、监控、调度、分配、调拨、 维护和优化建议。云运维管理的最终用户是云运维管理部门(云资源管理者)和云运维支撑部门(云运 维人员)。 本规范将聚焦于云运维管理的技术要求和功能要求。 4.1.2 云运维管理的用户 云运维管理的最终用户是云运维管理部门(云资源管理者)和云运维支撑部门(云运维人员)。 4.1.3 云运维管理的对象 云运维管理的对象包括 IaaS 平台、PaaS 平台和 SaaS 平台内的所有云资源。 云资源包括 IaaS 层的物理资源和虚拟资源,PaaS 层的数据库资源、中间件资源和技术服务组件资源, 以及 SaaS 的私有云应用和公有云应用等。 由于 IaaS/PaaS/SaaS 综合管理平台容量规模限制及管理要求,可能存在多个 IaaS/PaaS/SaaS 综合 管理平台。 4.1.4 云运维管理与传统 IT 运维管理的差异 云运维管理与当前传统 IT 运维管理的不同表现为:集中化和资源池化。 原有的 IT 运维管理采用总部-省分二级三中心模式,即总部一级管理中心、总部二级 I 管理中心和 省分管理中心。云运维管理将采用集中化方式,统一管理中国联通公司内部所有云资源的规划、监控、 调度、分配、调拨、维护和优化建议;具有规范性和统一性,可以降低整体的维护成本,但也会提高对 云运维管理和运维人员的要求。云运维管理需要尽量实现自动化和流程化,避免在管理和维护中因为人 工操作带来的不确定性问题。同时云运维管理需要针对不同的用户(各级领导和云运维管理部门)提供 个性化的视图,帮助管理和维护人员查看、定位和解决问题。 资源池化意味着云运维管理管理的资源是中国联通公司内部的共享资源。云运维管理和运维人员面 向的是所有的云资源,要完成对不同资源的分配、调度和监控。同时应能够向用户展示虚拟资源和物理 资源的关系和拓扑结构。 云运维管理的目标就是适应上述的变化,改进运维的方式和流程来实现云资源的运行维护管理。 4.1.5 中国联通的云运维管理体系 中国联通云运维管理体系具有如下典型的三级部署架构: 云运维管理 IaaS综合管 理平台 传统硬件 云运营管理 PaaS综合管 理平台 SaaS综合管 理平台 SaaS资源池PaaS资源池IaaS资源池 图4-1 云运维管理的三级部署架构 对应于云运维管理体系的部署架构,其运维支撑体系也进行了三级划分,相比较传统IT服务支撑的 运维支撑体系增加了虚拟化资源池和IaaS/PaaS/SaaS平台运维职责,同时在三线运维人员增加了虚拟化 平台和IaaS/PaaS/SaaS平台的原厂。 运维职责运维角色 云运维 三 线 运 维 人 员 IaaS/PaaS/SaaS平台运维 二 线 运 维 人 员 一 线 运 维 人 员 资源池运维传统硬件运维 图4-2 云运维管理体系 运维人员设置为一线运维人员、二线运维人员和三线运维人员,职责如下: 一线运维人员主要负责对 IaaS/PaaS/SaaS 资源池以及传统硬件的运维。云运维管理体系中一线 维护人员参与的流程可参照代维对象代维管理办法中提供的流程。 二线运维人员主要负责对 IaaS/PaaS/SaaS 平台的运维。云运维管理体系中二线维护人员参与的 流程可参照代维对象代维管理办法中提供的流程。 三线运维人员完成效益提升域、系统保障域和服务管控域中的运维管理工作。三线维护人员针 对云运维管理进行维护。 4.2 体系框架定位 联通云运维管理体系是联通信息化部关于建设集中化云运维管理所依据的总体纲领,其阐述了云运 维管理的管理领域和建设内容,是各组织人员在进行云运维管理相关建设时的建设纲领和建设标准。各 组织人员在进行云运维管理建设时,在严格遵循体系要求的前提下,根据各自的管理现状进行具体内容 建设。 体系框架定义了联通云运维管理体系所涵盖的管理域,包括组织人员、流程制度、技术工具、信息 管控四个方面。 云运维管理体系在联通信息化建设架构中的定位如下图所示: 企企业业战战略略 及及业业务务需需 求求 信信息息技技术术 驱驱动动 系系统统管管理理系系统统架架构构 服服务务 客客户户企企业业 管管理理 企企业业资资源源:系系统统、人人员员和和资资金金等等 规规 划划 管管 理理 建建 设设 管管 理理 专专 业业 考考 核核 评评 价价 管管 理理 运运 行行 维维 护护 管管 理理 专专 业业 队队 伍伍 建建 设设 资资 源源 分分 配配 云云运运维维管管理理体体系系 IaaS PaaS 应应用用架架构构 私私有有云云应应用用公公有有云云应应用用 数数据据库库中中间间件件技技术术服服务务业业务务服服务务 计计算算资资源源 存存储储资资源源网网络络资资源源 图 4-3 云运维管理体系定位 4.3 体系框架设计原则 为了保证体系架构既适合联通实际,又充分吸取业界最佳实践和管理标准;既做到统一、规范、标 准,又充分响应各组织人员的特色运维管理需求。体系架构在设计时遵循了以下原则: 有效支撑联通一体化运维/运营企业战略的原则。 管控透明化、标准化、集中化、自动化的原则。 联通的企业实践为根本,验证吸收 ITIL(V3)最佳实践和其他业界标准的原则。 各组织人员的共性化管理需求作为联通的企业实践主要输入的原则。 各组织人员需求统一提交、统一规范、统一下发的原则。 体系框架持续优化、定期修正的原则。 4.4 体系架构管控策略 为了保障云运维管理体系最终的建设效果,切实提升中国联通信息化部的云运维管理水平和服务质 量,各组织人员在进行云运维管理体系建设时,需严格执行以下管控策略: 各组织人员应严格遵循本次规范的要求,保证规范内容的有效落地 各组织人员应建立量化管控机制,通过量化管控的建设落实指标化管理。 建设单位要保证规范要求中的人员配套措施落实到位,要做到职责落实到岗、落实到人。 建设单位要充分认同实现全国一体化运维/运营的建设目标,优先开展全国一体化运维/运营服 务受理体系和服务台建设。 各组织人员在建设过程中需保障规范中明确提出的总部信息化部管控要求的落地实现,例如流 程建设中总部信息化部参与的要求;总部信息化部要求的管控指标等。 4.5 体系框架总图 本次云运维管理体系设计,充分参考国内外运营商和互联网企业在云运维方向上的成功建设经验和 ITIL (V3)的最佳实践,采用 PPIT 方法论,从组织人员、流程制度、技术工具、信息管控四个方面描述 IT 服务支撑体系。具体如下: 信息管控技术工具流程制度组织人员 服务台 服务管理职能运维第三方管理职能 运维管理团队 服务管控域系统保障域效益提升域 持续优化 运维门户 运维服务管理 资源监控管理业务监控管理 服务价值域 业务指标 运维质量域 应用指标 平台指标 数据模型 服务域人员组织域资源域 服务保障域 服务指标 资源策略管理 运维需求管理资源管理 集成管理资源配置管理统计分析 规划建设分配运维 公共资源管理职能 运维支撑团队 图 4-4 云运维管理体系框架总图 4.5.1 组织人员域 组织人员域包含的管理内容为:保证 IT 云化后服务支撑体系建设的组织保障要求,包括组织职能、 组织架构、岗责等管理内容。 本规范中定义的组织与人员域所阐述的范围是联通信息化部门,立足于对未来联通 IT 云化后服务管 理体系落地的组织保障要求,定义了 IT 云化后服务支撑体系所涉及的组织管理职能,并对相应职能进行 定义说明,指导信息化部的组织配套措施的落地。 组织人员域提到的管理职能是针对虚拟组织而言,各级单位在进行角色设置和职责落实时,可以根 据自身的组织架构和管理现状将要求的各管理职能映射到组织中的对应人员或部门,并在该人员或部门 职责中,增加对其的职责要求组织人员域包含的管理内容为:保证云运维管理体系建设的组织保障要求, 包括组织职能、组织架构、岗责等管理内容。 4.5.2 流程制度域 流程制度域包含的管理内容为:云运维管理相关的各类管理流程和保障其落实的管理制度。 本次规范流程制度域的设计,在吸取联通信息化部前几版规范的实际建设经验的基础上,提出了以 联通现有实际工作现状和需求为基础,以云计算运维服务管理为基本内容,并与 ITIL(V3)最佳实践相 互印证的原则,对流程制度域的具体管理流程进行了梳理和定义,以保证一切从实际出发、有的放矢, 取得立竿见影的运维实施效果,避免出现全盘照搬 ITIL 给各组织人员在运维实施过程中带来困惑和束缚。 各组织人员在流程建设的同时,应根据各自的特点,完善维护、考核等相关制度,配合云运维管理 技术要求的落实,确保云运维管理目标的实现。 本管理域中提到的每个流程的详细设计要求都在本规范中进行了详细阐述,定义了流程的目标、范 围、活动、角色与职责、流程间的交互关系、流程管理政策、关键控制点、流程 KPI 和参考信息等要素, 各组织人员在运维实施过程中可以参考本规范的具体要求,结合自身实际情况,进行具体的落地实现。 4.5.3 技术工具域 技术工具域包含的管理内容为:承载云运维管理体系落地的各类云运维管理功能模块。 本规范定义了用于承载云运维管理体系的技术工具,以实现云运维管理体系框架中提到各类管理要 求、管理流程、管理信息的最终落实,具体包括以下内容: 运维门户:整合中国联通云运维管理的功能应用,提供个性化的门户展现。面向管理者,根据 其用户权限,提供云资源的规划、调度等策略管理界面,提供云资源的状态查看界面,提供云资源的健 康度分析、优化管理建议的展现;面向运维人员,根据其用户权限,提供分层级的云资源的状态查看界 面,提供分层级的云资源的告警信息查看和策略设置。 运维需求管理:负责云运维管理的需求的全生命周期流程化管理,包括需求获取、需求处理、 需求分析、需求验证和需求后评估五个管理过程。 运维服务管理:负责对云运维管理提供的各种运维服务进行管理,包括效益提升域的资源容量 管理类流程、I/P/S平台管理类流程、资源管理识别类流程、资源管理使用类流程、资源管理回收类流程、 资源配置管理类流程、资源管理通用类流程;系统保障域的故障处理类流程、维护类流程、应急预案类 流程;服务管控域的运维评价考核类流程、运维平台使用咨询类流程。 云资源管理:实现对各类云资源的全生命周期的静态管理,包括资源状态管理、资源数据模型、 资源数据核查、资源数据提供、容量管理、资源拓扑管理、资源数据模型管理、资源数据维护、资源预 警等。 资源监控管理:负责对各类云资源的性能和状态进行监控、管理、维护和统计,包括对IaaS平 台、PaaS平台、SaaS平台实现实时监控、捕获资源的部署状态、性能指标、运行指标、各类告警信息等, 以及资源操作日志、资源服务质量监控、监控体系等。 业务监控管理:负责对业务的性能、状态进行监控、管理、维护和统计,包括对各业务系统的 信息管理、业务的拓扑展现等。 云平台策略管理:负责管理IaaS平台、PaaS平台和SaaS平台的资源纳管、分配、调度和容量管 理,向云运维管理的管理者或运维人员提供策略的制订、修改、删除、审核和发布等操作管理功能。 云平台配置管理:负责管理IaaS平台、PaaS平台和SaaS平台的资源配置,向云运维管理的管理 者或运维人员提供配置的制订、修改、删除、审核、发布和审计等功能。 统计分析:负责对各类云资源的各项信息进行多维度的统计分析,为管理者或运维人员提供资 源健康状况分析和资源管理优化等建议。 集成管理:负责云运维管理内部功能模块之间的接口,以及云运维管理与IaaS平台、PaaS平台、 SaaS平台、云运营管理等接口的实现和管理。 系统自管理:负责云运维管理自身的各项管理,包括参数管理、日志管理、平台监视、用户管 理、系统备份和恢复、版本控制管理等。 技术工具的具体要求可参照国内外电信运营商及互联网企业在云运维管理方面的先进技术和研究成 果,并遵循企业现有的中国联通 IT 服务支撑流程管理规范 v1.0、中国联通 IT 服务支撑系统业务 规范 v1.0和中国联通 IT 服务支撑系统技术规范 v1.0等主要技术要求。 4.5.4 信息管控域 信息管控域包含的管理内容为:支撑云运维管理要求的各项管理数据,包括资源信息、考核指标、 管理报告等内容。本次规范在信息管理域的要求主要包括指标体系和数据模型两个方面的内容: 指标体系包括监控指标和服务类指标两大类,监控类指标定义了未来监控系统需要监控的相关 指标,服务类指标定义了客户感知和运维考核类指标。 数据模型定义资源管理的管理范围和管理颗粒度,数据模型包括被管对象的分类、属性、关系 和命名规则。 4.5.4.1 指标体系 4.5.4.1.1 指标设计目标 为了有效支持联通云计算运营,合理评估云计算运维支撑体系的建设成果,不断提升管理水平,制 定了本指标分册,其总体目标是: 统一云计算运维服务水平的量化标准。 建立指标框架,指导云计算运维管理实践中梳理和建立自身的监控指标与服务管理指标体系。 建立管控指标库,实现与时俱进的绩效考核目标,持续提高中国联通整体云计算运维管理水平。 4.5.4.1.2 指标体系定义 指标是实现 IT 服务量化管理的基础,是对业务服务或者专业服务的可用性和能力等服务水平的描述; 本规范之指标体系是一套针对中国联通 IT 服务的服务水平进行实时监控和后评估的方法体系。 本指标体系框架主要定义了以下 3 个域: 4.5.4.1.3 服务价值 业务是指由中国联通云计算业务,这些业务直接面向信息化部的内部使用者,也称之为客户。因此 业务价值域指标也称之为客户体验指标,用于反映云计算服务对内部客户的服务水平,在本文中,我们 称之为业务指标。 定义该域的目的:提升内部用户感知和满意度。 4.5.4.1.4 运维质量 运维质量指标是用于衡量应用系统及其承载这些应用系统的基础设施(包括提供计算服务的主机服 务器、提供数据通信服务的网络系统以及提供数据存储服务的存储系统等)自身处理能力及其可用性状 况的指标。可分为应用指标和平台指标两大类。 定义该域的目的: 考核和提升应用系统及其基础平台处理能力。 考核和控制企业 IT 风险,防范因 IT 故障对企业业务造成的损失。 4.5.4.1.5 服务保障 云服务保障域指标也称之为服务指标,是用于衡量企业服务管理规章及相关流程执行能力和效果的 指标。 定义该域的目的: 考核和提升组织资源服务能力; 考核和控制组织资源服务的合规性。 4.5.4.2 数据模型 数据模型定义了中国联通云运维管理系统所管理的云计算各类资源、服务数据模型,定义了资源管 理的范围和颗粒度,具体包括资源域、服务域、人员组织域三大主题域。 云运维管理系统所管理的实体范围按照主题划分为云资源、云服务、人员组织三大主题。云资源管 理的核心数据是资源项,任何受资源管理控制的事物都属于资源项,可以是包括软硬件在内的完整系统, 也可以简单到其中的一个硬件模块,也可以是一项资产,服务组件或者项目,资源域和服务域的事物都 属于资源项范畴。 云资源主题:描述的资源是中国联通云计算服务过程中所涉及到的所有物理的、逻辑的实体, 资源根据资源的存在形态来划分,分为硬件资源、软件资源、辅助资源和空间资源: 物理资源是确实存在的、可见的的有形资源,从物理角度描述资源信息。包括主机服务器、 网络设备、存储设备、终端等硬件设备。从资源项的管理层次进一步细化,系统可将更细 化的可独立存在的硬件模块作为资源项,包括磁盘、内存、CPU、网卡等。 虚拟资源是通过虚拟化后的资源,通常包括虚拟计算资源、虚拟存储资源、虚拟网络资源。 虚拟资源是依赖物理资源而存在的,物理资源为虚拟资源的运行起支撑作用。 软件资源是运行在硬件资源上的软件实体,软件资源与硬件资源一起对外提供各种系统服 务。包括操作系统、基础软件、应用系统等软件。从资源项的管理层次进一步细化,系统 可将更细化的可独立存在的逻辑单元作为资源项,如进程等。 辅助资源是在生产过程中,对 IT 系统的运行起辅助性作用,包括规划信息、工程工程、文 档、合同、软件包等。 空间资源:描述的是资源项相关的位置信息,包括资源项存放的地理位置信息和和资源项 的管理区域。联通管理区域是中国联通根据平台自管理需要进行的区域划分。 云服务主题:描述的服务是对内部客户所能够提供的云计算服务能力,从服务的提供形式来划 分,分为 IaaS 服务、PaaS 服务和 SaaS 服务三大类。 IaaS 服务: PaaS 服务: SaaS 服务: 人员组织主题:IT 人力资源也将作为信息化部对外提供服务所需要的一类资源,包括角色和人 员,供应商是一类特殊的 IT 人力资源。IT 人力资源对资源进行有效的支撑和管理,保障 IT 系 统的正常运转。 4.6 云运维管理活动概述 组织人员域阐述了 IT 云化后服务支撑体系对组织职能的要求,各级建设单位应将要求的组织职能落 实到自身组织架构中,完成组织保障。 服务台:业务用户使用信息化部 IT 服务的单一联系点,是 IT 和信息化部对外的服务窗口 职能描述 通过统一集中的服务台对投诉、故障申告、问题咨询的受理、初步处理、分派和追踪, 提高处理过程的透明度和处理的时效性 7x24 服务支持,强化统一受理,确保所有投诉、故障申告、问题咨询得到准确的记录 和及时的分派;确保投诉、故障申告、问题咨询在需要跨专业技术领域协调解决时得 到及时有效的分派和处理;客户满意度调查和反馈 通过普及和宣传,帮助用户更好地使用 IT 服务 及时向客户传递 IT 服务变化通告 服务管理职能:实现信息化部整体服务管理,驱动组织建立以服务为导向,以流程为工作方式的 运维模式 职能描述 规划信息化部 IT 云化后的服务管理的发展思路,提出年度项目/举措建议并对批准的 项目/举措进行落实跟进 梳理和定义 IT 云化后的服务支撑体系,推动关键流程角色的岗位和考核落实,与各流 程经理一起推动运维管理流程体系的推广与落地实施 对运维人员进行流程与制度培训和流程运行指导 梳理和定义运维绩效指标,对流程执行情况进行质量监控,实现运维服务绩效的量化 管理;结合流程使用者的反馈,对服务流程进行持续优化 负责信息化部 IT 资源(硬件、IaaS 平台、PaaS 平台、应用系统)的 SLA 制定及评估。 定期提供运维服务管理报告,组织运维管理会议,向管理层汇报,对会议形成的改进 措施牵头落实 业务价值 通过服务管理职能推动横向的流程贯穿和信息共享,提高运维效率,降低运维风险 提高信息化部在运维管理工作方面决策的科学性,增强决策的执行力。通过可量化的 指标和职能保障,可以系统化地分阶段提升组织的整体 IT 云化后的运维成熟度,以 更好地实现与业务整合 公共资源管理职能:实现信息化部 IT 公共资源(软硬件、中间件、数据库、机房等)的全生命 周期管理 职能描述 负责信息化部 IT 资源的规划、纳管、扩容、分配、回收、调拨等管理,并对 IT 资源 的整体配置策略进行集中统一管控 运维第三方管理职能:运维第三方服务管理统一的组织保障,实现信息化部整体运维第三方服务 管理,加强对运维第三方的控制,对运维第三方服务实现量化的绩效管理。 职能描述 规划信息化部运维第三方服务的策略和范围,对运维第三方服务管理工作进行年度总 结和计划 建立运维第三方服务管理的整体流程体系和质量要求 对运维第三方服务需求进行统一归口管理,积极参与运维第三方的谈判和选择过程, 为第三方服务建立服务水平协议,量化服务产出。确保运维第三方服务范围描述清楚、 考核设计科学、日常运作职责和接口明确 维护和管理运维第三方服务列表和服务商信息,对所有运维第三方服务进行绩效跟踪 管理,确保第三方提供高质量的无缝服务 建立与运维第三方之间的关系管理机制,增强与第三方之间的信任和透明度 对运维第三方服务合同纠纷、合同变更、合同中止及服务移交等进行有效管理 业务价值 降低运维第三方服务带来的业务风险 提高运维第三方服务质量,降低整体运维成本 清楚界定信息化部与运维第三方间的分工界面 运维管理团队:承担专业技术领域(硬件、IaaS 平台、PaaS 平台、应用系统)的运维管理职责。 职能描述 规划信息化部专业技术领域(硬件、IaaS 平台、PaaS 平台、应用系统)的运维管理策 略和范围,制定运维支撑团队的工作计划,并进行指导和考核 负责信息化部专业技术领域(硬件、IaaS 平台、PaaS 平台、应用系统)的运行监控及 故障协调处理 负责信息化部 IT 资源(硬件、IaaS 平台、PaaS 平台、应用系统)的 SLA 转化 (KQI/KPI 分解)。 运维支撑团队:传统硬件运维支撑、IaaS 平台运维支撑、PaaS 平台运维支撑、应用运维支撑、 原厂等团队。 职能描述 传统硬件的运行监控、维护及故障处理 IaaS 平台的运行监控、维护及故障处理 PaaS 平台的运行监控、维护及故障处理 应用系统的运行监控、维护及故障处理 负责信息化部 IT 资源(硬件、IaaS 平台、PaaS 平台、应用系统)的 SLA 监控与保障。 三线运维支持:第三方软硬件原厂、虚拟化平台/IaaS 原厂、中间件/数据库/PaaS 平 台原厂的三线支持 7x24 监控值班 基础运行维护,包括维护作业计划执行、机房巡视等 上述管理职能,各级建设单位应根据自身单位专业团队的架构和特点,进行相应的职能映射,以保 证管理职能的落实。 4.7 云运维管理活动指标体系 4.7.1 系统保障域流程 4.7.1.1 故障处理类流程 4.7.1.1.1 故障处理评估指标 表4-1故障处理评估指标 指标名称指标名称指标描述指标描述 系统数系统数 据要求据要求 指指 标标 算算 法法 建议建议 采集采集 间隔间隔 数数 据据 类类 型型 级级 别别 是是 否否 上上 报报 故障总量 针对云运维管理所辖范围内 IaaS/PaaS/Saas平台,考核周 期内受理的故障总量 1天 整 型 高否 故障平均处 理时长 针对云运维管理所辖范围内 IaaS/PaaS/Saas平台,考核周 期内故障的平均处理时长 1天 整 型 高否 故障处理及 时完成率 针对云运维管理所辖范围内 IaaS/PaaS/Saas平台,在流程 时限要求内完成故障处理的 比例 1天 整 型 高否 故障处理完 成率 针对云运维管理所辖范围内 IaaS/PaaS/Saas平台,考核周 期内完成故障处理的比例 1天 整 型 高否 4.7.1.1.2 重大紧急告警事件处理评估指标 表4-2 重大紧急告警事件处理评估指标 指标名称指标名称指标描述指标描述 系统系统 数据数据 指标指标 算法算法 建议采建议采 集间隔集间隔 数数 据据 级级 别别 是是 否否 要求要求类类 型型 上上 报报 上报重大紧急告 警事件总数 考核周期内上报的重大 紧急告警事件总数 1天 整 型 高否 重大紧急告警事 件平均处理时长 考核周期内重大紧急告 警事件平均处理时长 1天 整 型 高否 重大紧急告警事 件处理及时率 在流程时限要求内完成 重大紧急告警事件上报 的比例 1天 比 值 高否 4.7.1.1.3 云终端故障申告处理评估指标 表4-3 云终端故障申高处理评估指标 指标名称指标名称指标描述指标描述 系统系统 数据数据 要求要求 指指 标标 算算 法法 建议建议 采集采集 间隔间隔 数据数据 类型类型 级级 别别 是是 否否 上上 报报 申告总数 考核周期内受理的云终端故障 申告总数 1天整型高否 申告平均处 理时长 考核周期内受理的云终端故障 申告平均处理时长 1天整型高否 申告及时完 成率 在SLA内完成的云终端故障申 告申请比例 1天整型高否 故障申告的 一次完成率 核周期内受理的云终端故障申 告通过一次电话远程支持解决 的比率, 1天整型高否 4.7.1.2 维护变更请求类流程 表4-4 维护变更请求处理评估指标 指标名称指标名称指标描述指标描述 系统系统 数据数据 要求要求 指标指标 算法算法 建议建议 采集采集 间隔间隔 数据数据 类型类型 级级 别别 是是 否否 上上 报报 系统变更总量 针对云运维管理所辖范围内 IaaS/PaaS/Saas平台,考核周期 内系统变更总量 1天整型高否 系统变更平均 处理时长 针对云运维管理所辖范围内 IaaS/PaaS/Saas平台,考核周期 内系统变更平均处理时长 1天整型高否 系统变更及时 完成率 针对云运维管理所辖范围内 IaaS/PaaS/Saas平台,考核周期 内系统变更及时完成率 1天整型高否 4.7.1.3 应急预案类流程 表4-5 应急预案处理评估指标 指标名称指标名称指标描述指标描述 系统系统 数据数据 要求要求 指指 标标 算算 法法 建议建议 采集采集 间隔间隔 数数 据据 类类 型型 级级 别别 是是 否否 上上 报报 配置项维护总量 考核周期内配置项维护总量 1月 整 型 高否 平均处理时长 考核周期内配置信息维护流 程平均处理时长 1月 比 值 高否 完成及时率 考核周期内配置信息维护完 成及时率 1月 整 型 高否 4.7.1.4 配置管理类流程 表4-5 配置管理处理评估指标 指标名称指标名称指标描述指标描述 系统系统 数据数据 要求要求 指指 标标 算算 法法 建议建议 采集采集 间隔间隔 数数 据据 类类 型型 级级 别别 是是 否否 上上 报报 配置项维护总量 考核周期内配置项维护总量 1月 整 型 高否 平均处理时长 考核周期内配置信息维护流 程平均处理时长 1月 比 值 高否 完成及时率 考核周期内配置信息维护完 成及时率 1月 整 型 高否 4.7.1.5 日常运维类流程 4.7.1.5.1 作业计划评估指标 表4-6 作业计划评估指标 指标名称指标名称指标描述指标描述 系统系统 数据数据 要求要求 指指 标标 算算 法法 建议建议 采集采集 间隔间隔 数据数据 类型类型 级级 别别 是是 否否 上上 报报 作业计划总量 考核周期内执行作业计划的总 量(包含地域、部门、业务、 完成状态等) 1月整型高否 作业按时执行率 作业计划按时执行率 1月比值高否 作业成功执行率 作业计划成功执行率 1月比值高否 4.7.1.5.2 值班管理评估指标 表4-7 值班管理评估指标 指标名称指标名称指标描述指标描述 系统系统 数据数据 指指 标标 建议建议 采集采集 数据数据 类型类型 级级 别别 是是 否否 要求要求算算 法法 间隔间隔上上 报报 故障发现总量考核周期内值班发现的故障总量 1月整型高否 按时接班率考核周期内按时接班率 1月整型高否 4.7.2 服务管控域流程 4.7.2.1 运维服务及时性 4.7.2.1.1 事件处理的及时性 表4-8 事件处理及时性指标 指标名称指标名称指标描述指标描述系统数据要求系统数据要求指标算法指标算法 建议采建议采 集间隔集间隔 数据数据 类型类型 级级 别别 是是 否否 上上 报报 事件处理 成功率 运维事件处 理的成功率 P1:成功量 P2:失败量 P1、P2 1天 数 值 型 中是 事件处理 成功量 运维事件处 理成功量 P1:成功量 P1 1天 数 值 型 中是 事件处理 失败量 运维事件处 理失败量 P1:失败量 P1 1天 数 值 型 中是 事件处理 时长 运维事件处 理时长 P1:事件处理 接受时间 P2:事件处理 完成时间 average(p2- p1) 1天 数 值 型 中是 事件处理 等待时长 运维事件处 理等待时长 P1:事件提交 起始时间 P2:接受时间 或放弃时间 average(P2- P2) 1天 数 值 型 中是 4.7.2.1.2 问题处理的及时性 表4-9问题处理及时性指标 指标名称指标名称指标描述指标描述系统数据要求系统数据要求指标算法指标算法 建议采建议采 集间隔集间隔 数据数据 类型类型 级级 别别 是是 否否 上上 报报 问题处理 成功率 运维问题处 理的成功率 P1:成功量 P2:失败量 P1、P2 1天 数 值 型 中是 问题处理 成功量 运维问题件 处理成功量 P1:成功量 P1 1天 数 值 型 中是 问题处理 失败量 运维问题处 理失败量 P1:失败量 P1 1天 数 值 型 中是 问题处理 时长 运维问题处 理时长 P1:问题处理 接受时间 P2:问题处理 完成时间 average(p2- p1) 1天 数 值 型 中是 问题处理 等待时长 运维问题处 理等待时长 P1:问题提交 起始时间 P2:接受时间 或放弃时间 average(P2- P2) 1天 数 值 型 中是 4.7.2.1.3 重大紧急告警事件处理的及时性 表4-10 重大紧急告警事件处理及时性指标 指标名称指标名称指标描述指标描述系统数据要求系统数据要求指标算法指标算法 建议建议 采集采集 数据数据 类型类型 级级 别别 是是 否否 间隔间隔上上 报报 重大紧急告 警事件处理 成功率 重大紧急告警事 件处理的成功率 P1:成功量 P2:失败量 P1、P2 1天 数 值 型 中是 重大紧急告 警事件处理 成功量 重大紧急告警事 件处理成功量 P1:成功量 P1 1天 数 值 型 中是 重大紧急告 警事件处理 失败量 重大紧急告警事 件处理失败量 P1:失败量 P1 1天 数 值 型 中是 重大紧急告 警事件处理 时长 重大紧急告警事 件处理时长 P1:故障处理 接受时间 P2:故障处理 完成时间 average( p2-p1) 1天 数 值 型 中是 重大紧急告 警事件处理 等待时长 重大紧急告警事 件处理等待时长 P1:故障提交 起始时间 P2:接受时间 或放弃时间 average( P2-P2) 1天 数 值 型 中是 4.7.2.2 客户服务准确性 表4-11客户服务的准确性指标 指标名称指标名称指标描述指标描述 系统数据系统数据 要求要求 指标指标 算法算法 建议采建议采 集间隔集间隔 数据数据 类型类型 级别级别 是否是否 上报上报 云服务非计划 中断的数量 客服投诉中云服 务非计划中断的 投诉量 P1:投诉 量 P1 1天 数值 型 中是 4.7.2.3 运维需求实现情况 4.7.2.3.1 等待审批的运维需求量 表4-12 等待审批的运维需求量指标 指标名称指标名称指标描述指标描述 系统数据系统数据 要求要求 指标指标 算法算法 建议建议 采集采集 间隔间隔 数据数据 类型类型 级别级别 是否是否 上报上报 等待审批的业 务需求数量 处于等待审批环节 (状态为已申请、已确 认)的业务需求量; P1:等待 审批的业 务需求量 P1 1天 数值 型 低是 4.7.2.4 运维需求完成情况 表4-13 运维需求完成情况指标 指标名称指标名称指标描述指标描述系统数据要求系统数据要求指标算法指标算法 建议建议 采集采集 间隔间隔 数数 据据 类类 型型 级级 别别 是是 否否 上上 报报 运维需求 完成平均 时限 运维需求 完成的平 均时限; 运维需求的提出时间P1、 运维需求的完成时间P2、 已完成的运维需求数量P3 sum(P2- P1)/P3 1天 数 值 型 中是 运维需求 完成及时 率 按时间点 监视运维 需求完成 的及时率; 按时完成的运维需求量 P1、总运维需求量P2(不 含被拒绝、待审批的运维 需求) P1/P2 1天 数 值 型 中是 用户满意 度 用户对运 维需求完 成情况的 满意率; 用户满意的运维需求完成 量P1、总运维需求量 P2(不含被拒绝、待审批 的运维需求) P1/P2 1天 数 值 型 中是 4.7.2.5 事件解决情况 4.7.2.5.1 事件类型分布情况 表4-14 事件类型分布情况指标 指标名称指标名称指标描述指标描述 系统数系统数 据要求据要求 指指 标标 算算 法法 建议建议 采集采集 间隔间隔 数据类数据类 型型 级级 别别 是是 否否 上上 报报 发生事件数量 周期内云运维管理范 围内发生的事件数量 P1:事 件数 P1 1天数值型中是 云资源管理触 发的事件数 周期内云资源管理发 生的事件数量 P1:事 件数 P1 1天数值型中是 资源监控管理 触发的事件量 周期内资源监控管理 发生的事件数量 P1:事 件数 P1 1天数值型中是 运维服务管理 触发的事件量 周期内运维服务管理 发生的事件数量 P1:事 件数 P1 1天数值型中是 所辖 IaaS/PaaS/Saa S平台上报事件 量 周期内所辖 IaaS/PaaS/SaaS平台 上报的事件数量 P1:事 件数 P1 1天数值型中是 云运营管理平 台上报的事件 量 周期内云运营管理平 台上报的事件数量 P1:事 件数 P1 1天数值型中是 使用咨询数量用户的使用咨询数量 P1:使 用咨询 数量 P1 1天数值型中是 4.7.2.5.2 本月事件处理情况 表4-15 本月事件处理情况指标 指标名称指标名称指标描述指标描述 系统数系统数 据要求据要求 指标指标 算法算法 建议建议 采集采集 间隔间隔 数据数据 类型类型 级级 别别 是是 否否 上上 报报 及时完成的事件总 数量 统计本月云运维管理范 围内及时完成的事件总 量 P1:事 件数量 P1 1月 数值 型 中是 云资源管理及时完 成的事件量 云资源管理及时完成的 事件的量 P1:及 时完成 的事件 量 P1 1月 数值 型 中是 资源监控管理及时 完成的事件量 资源监控管理及时完成 的事件的量 P1:及 时完成 的事件 量 P1 1月 数值 型 中是 运维服务管理及时 完成
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《探秘数据编码》教案-2025-2026学年鲁教版(新教材)小学信息技术四年级下册
- 餐饮安全智慧监管平台
- 中级会计资格:财务分析与评价找答案三
- 某渔业厂数据存档细则
- 某食品厂卫生检验管理制度
- 某麻纺厂物料流转准则
- 某电信公司服务流程细则
- 2026年中国煤化工产品结构分析与发展展望
- 钨矿石买卖合同
- 七牌二图布置方案
- 电气防爆管线安装规范
- GB/T 3917.3-2025纺织品织物撕破性能第3部分:梯形试样撕破强力的测定
- 人工智能班会主题班会
- DB11T 2335-2024 既有建筑外门窗改造及验收技术标准
- 《公路建设项目文件管理规程》
- 期货基础知识期权讲解
- 红色经典影片与近现代中国发展学习通超星期末考试答案章节答案2024年
- 国家开放大学《Web开发基础》形考任务实验1-5参考答案
- 幼小衔接全套课件
- 宅基地永久转让协议
- 幽门螺杆菌科普
评论
0/150
提交评论