我国联通云运维管理技术设计规范方案v1.10(去年写的)_第1页
我国联通云运维管理技术设计规范方案v1.10(去年写的)_第2页
我国联通云运维管理技术设计规范方案v1.10(去年写的)_第3页
我国联通云运维管理技术设计规范方案v1.10(去年写的)_第4页
我国联通云运维管理技术设计规范方案v1.10(去年写的)_第5页
已阅读5页,还剩134页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

QB/CUXXX-200X××××—××××./WORD格式整理版中国联通公司发布2012-XX-XX实施2012-XX-中国联通公司发布2012-XX-XX实施2012-XX-XX发布中国联通云运维管理技术规范ChinaUnicomCloudComputingOperationsManagementTechnicalSpecification<OAM>〔V1.0QB/CUXXX-2012中国联通公司企业标准.目录目录II前言V中国联通云运维管理技术规范V1.011范围12规范性引述文件13缩略语和术语13.1缩略语13.2术语及定义14云运维管理体系框架24.1云运维管理的概述24.2体系框架定位44.3体系框架设计原则54.4体系架构管控策略54.5体系框架总图64.6云运维管理活动概述104.7云运维管理活动指标体系125云运维管理架构225.1云运维管理功能架构225.2云运维管理与外围系统/平台关系246运维门户246.1门户基础服务256.2工作台296.3信息发布306.4综合展现316.5系统帮助337运维需求管理337.1功能定义337.2功能要求348运维服务管理358.1效益提升域358.2系统保障域538.3服务管控域649云资源管理669.1资源状态管理669.2资源数据核查679.3资源数据提供689.4资源拓扑管理689.5资源数据模型管理719.6资源数据维护719.7资源预警729.8资源数据模型7310资源监控管理8010.1数据采集技术要求8010.2告警管理8410.3服务质量管理9010.4性能管理9410.5监控拓扑管理9710.6资源服务质量监控9710.7日志管理9810.8监控指标体系9911业务监控管理11111.1业务系统信息管理11111.2业务拓扑管理11212云平台策略管理11212.1资源纳管11212.2资源分配11312.3资源调度11412.4容量管理11612.5策略操作管理11913云平台配置管理11913.1资源配置操作管理11914统计分析12114.1功能定义12114.2功能要求12115集成管理12215.1内部接口12215.2与IaaS平台接口12215.3与PaaS平台接口13515.4与SaaS平台接口13915.5与云运营管理接口14315.6与其他系统及平台的接口14516系统自管理14516.1参数配置14516.2日志管理14616.3平台监视14616.4用户管理14616.5系统备份和恢复14716.6版本控制管理147AI.私有云运营管理147A1.1.用户对象147A1.2.运营和运维关系148A1.2.1.定义148A1.2.2.管理对象148A1.3.运营功能148A1.3.1.运营门户149A1.3.2.云用户管理149A1.3.3.云服务管理151A1.3.4.订单管理158A1.3.5.服务等级管理158A1.3.6.计量/计费管理159B1.云平台策略160B1.1弹性伸缩策略160B1.2负载均衡策略161B1.3业务维护策略161.前言随着云计算技术的成熟,中国联通基于云计算的内部支撑系统建设逐步推进。基础设施、平台和终端架构向云计算演进,一方面新建系统普遍采用云计算架构,另一方面已有系统也在向云计算平台迁移。为了更好的指导中国联通云化后的IT运维管理,本规范对中国联通未来云化后的IT运维管理提出了全面要求,用于指导中国联通未来云计算运维管理的建设,实现按需的IT服务支撑。本规范遵循中国联通业务需求和云计算技术堆栈相结合的原则,依据中国联通已开展云计算项目、云计算业务发展需求和规划,同时充分调研云计算相关国际标准、行业标准、技术发展现状及竞争对手企标进展情况,在这基础上,结合联通规划,对中国联通云运维管理提出了全面要求,明确了云计算运维管理的范围、用户、对象及体系架构,规定了中国联通云计算运维管理的功能要求、技术要求,以及中国联通云计算运维管理的资源数据模型和监控指标体系等。随着业务需求和技术的不断发展,本标准将不断进行补充和完善。本规范适用于指导中国联通未来云计算运维管理的建设。中国联通在此之前的文件与本规范不一致的,应以本次规范要求为准,并在相关的具体规范发布后废止。本标准由中国联通公司信息化事业部提出。本标准由中国联通公司技术部归口。本标准主要起草单位:中国联通信息化事业部,联通研究院。本标准主要起草人:孙海峰,张云勇,宋积慧,李卫,王智明。本标准的修改和解释权属中国联合网络通信有限公司。.中国联通云运维管理技术规范V1.0范围本规范阐述了云计算运维管理的范围、用户、对象及体系架构,规定了中国联通云计算运维管理的功能要求、技术要求,以及中国联通云计算运维管理的资源数据模型和监控指标体系等。本技术规范适用于指导中国联通未来云计算运维管理的建设。规范性引述文件下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单〔不包括勘误的内容或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。[1]QB/CU191-2012《中国联通云计算技术体制V1.0》[2]QB/CU165-2012《中国联通IT云计算IaaS平台技术规范V1.0》[3]QB/CU166-2012《中国联通IT云计算IaaS接口技术规范V1.0》缩略语和术语缩略语缩略语英文全称中文含义APIApplicationProgrammingInterface应用程序编程接口IaaSInfrastructureasaservice基础设施即服务ITInformationTechnology信息技术PaaSPlatformasaservice平台即服务PRMPartnerRelationshipManagement合作伙伴关系管理SaaSSoftwareasaservice软件即服务SOAServiceOrientedArchitecture面向服务的体系架构术语及定义术语/定义解释ESB基于开放的标准消息总线,用于通过标准的适配器和接口,来提供各程序和组件之间的互操作功能。它支持相互独立的异构环境中的服务、消息及基于事件的交互,并且具有适当的服务级别和可管理性。ETL指数据抽取、转换、装载的过程。能够按照统一的规则集成并提高数据的价值,是负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。IaaS以服务的形式,提供计算、存储、网络等基础设施资源,用户无需购买服务器、存储设备、网络设备,只需通过互联网租赁即可搭建自己的应用系统,帮助削减IT基础设施的建设成本和运维成本。PaaS以服务的形式,提供软件开发、测试、部署和运行环境,以及能力开放接口或应用服务引擎,屏蔽软件开发底层复杂的操作,用户可以快速开发出基于云平台的高性能、高可扩展的服务。SaaS以服务的形式,提供各种在线软件,用户不必购买软件,只需按需租用软件。SOA一种新型的软件体系架构模式,它是在计算环境下设计、开发、应用、管理分散服务单元的一种规范,它将应用程序的不同功能单元〔称为服务通过服务间定义良好的接口和契约联系起来。可以根据需求通过网络对松散耦合的粗粒度服务进行分布式部署、组合和使用。云监控提供对云服务的资源监控,供用户查看资源的使用情况、运行性能等,包括了CPU的使用率、磁盘读写和网络流量情况云计算一种新的计算方法和商业模式,通过虚拟化、分布式处理和宽带网络等技术,按照"即插即用"的方式,将计算、存储、网络等IT基础设施,以及其上的开发平台、软件等服务,抽象成高效、弹性、可运营、可管理的公共信息处理资源,通过公众通信网络,以按需分配的服务形式向用户提供动态可扩展信息处理能力和应用服务,用户按实际使用数量进行付费在云计算下,使用者通过公众通信网络,以按需分配的服务形式,获得动态可扩展信息处理能力和应用服务,也是电信运营商新的信息服务产品和ICT交付模式,资源出租转化为能力出租,由自建自营到开放共赢。云平台云平台是指云运维管理所辖的IaaS/PaaS/SaaS综合管理平台,资源池资源池是一组物理资源或一组虚拟资源的集合,可以从池中获取资源,也可将资源回收到池中。资源包括物理机、虚拟机、虚拟网络设备、物理网络设备和IP地址等。云运维管理体系框架云运维管理的概述云运维管理的范围根据云计算的可运营、可管理特性,以及专业管理分工特点,云计算的一体化服务支撑由云运营管理和云运维管理构成。云运营管理负责面向云资源使用者,提供云计算服务需求受理、开通、计量/计费和客户服务。云运营管理的最终用户是云资源使用者。云运维管理负责面向云资源管理者和云运维人员,提供云资源的规划、监控、调度、分配、调拨、维护和优化建议。云运维管理的最终用户是云运维管理部门〔云资源管理者和云运维支撑部门〔云运维人员。本规范将聚焦于云运维管理的技术要求和功能要求。云运维管理的用户云运维管理的最终用户是云运维管理部门〔云资源管理者和云运维支撑部门〔云运维人员。云运维管理的对象云运维管理的对象包括IaaS平台、PaaS平台和SaaS平台内的所有云资源。云资源包括IaaS层的物理资源和虚拟资源,PaaS层的数据库资源、中间件资源和技术服务组件资源,以及SaaS的私有云应用和公有云应用等。由于IaaS/PaaS/SaaS综合管理平台容量规模限制及管理要求,可能存在多个IaaS/PaaS/SaaS综合管理平台。云运维管理与传统IT运维管理的差异云运维管理与当前传统IT运维管理的不同表现为:集中化和资源池化。原有的IT运维管理采用总部-省分二级三中心模式,即总部一级管理中心、总部二级I管理中心和省分管理中心。云运维管理将采用集中化方式,统一管理中国联通公司内部所有云资源的规划、监控、调度、分配、调拨、维护和优化建议;具有规范性和统一性,可以降低整体的维护成本,但也会提高对云运维管理和运维人员的要求。云运维管理需要尽量实现自动化和流程化,避免在管理和维护中因为人工操作带来的不确定性问题。同时云运维管理需要针对不同的用户〔各级领导和云运维管理部门提供个性化的视图,帮助管理和维护人员查看、定位和解决问题。资源池化意味着云运维管理管理的资源是中国联通公司内部的共享资源。云运维管理和运维人员面向的是所有的云资源,要完成对不同资源的分配、调度和监控。同时应能够向用户展示虚拟资源和物理资源的关系和拓扑结构。云运维管理的目标就是适应上述的变化,改进运维的方式和流程来实现云资源的运行维护管理。中国联通的云运维管理体系中国联通云运维管理体系具有如下典型的三级部署架构:云运维管理云运维管理IaaS综合管理平台传统硬件云运营管理PaaS综合管理平台SaaS综合管理平台SaaS资源池PaaS资源池IaaS资源池图4-1云运维管理的三级部署架构对应于云运维管理体系的部署架构,其运维支撑体系也进行了三级划分,相比较传统IT服务支撑的运维支撑体系增加了虚拟化资源池和IaaS/PaaS/SaaS平台运维职责,同时在三线运维人员增加了虚拟化平台和IaaS/PaaS/SaaS平台的原厂。运维职责运维职责运维角色云运维三线运维人员IaaS/PaaS/SaaS平台运维二线运维人员一线运维人员资源池运维传统硬件运维图4-2云运维管理体系运维人员设置为一线运维人员、二线运维人员和三线运维人员,职责如下:一线运维人员主要负责对IaaS/PaaS/SaaS资源池以及传统硬件的运维。云运维管理体系中一线维护人员参与的流程可参照代维对象代维管理办法中提供的流程。二线运维人员主要负责对IaaS/PaaS/SaaS平台的运维。云运维管理体系中二线维护人员参与的流程可参照代维对象代维管理办法中提供的流程。三线运维人员完成效益提升域、系统保障域和服务管控域中的运维管理工作。三线维护人员针对云运维管理进行维护。体系框架定位联通云运维管理体系是联通信息化部关于建设集中化云运维管理所依据的总体纲领,其阐述了云运维管理的管理领域和建设内容,是各组织人员在进行云运维管理相关建设时的建设纲领和建设标准。各组织人员在进行云运维管理建设时,在严格遵循体系要求的前提下,根据各自的管理现状进行具体内容建设。体系框架定义了联通云运维管理体系所涵盖的管理域,包括组织人员、流程制度、技术工具、信息管控四个方面。云运维管理体系在联通信息化建设架构中的定位如下图所示:图43云运维管理体系定位体系框架设计原则为了保证体系架构既适合联通实际,又充分吸取业界最佳实践和管理标准;既做到统一、规范、标准,又充分响应各组织人员的特色运维管理需求。体系架构在设计时遵循了以下原则:有效支撑联通一体化运维/运营企业战略的原则。管控透明化、标准化、集中化、自动化的原则。联通的企业实践为根本,验证吸收ITIL<V3>最佳实践和其他业界标准的原则。各组织人员的共性化管理需求作为联通的企业实践主要输入的原则。各组织人员需求统一提交、统一规范、统一下发的原则。体系框架持续优化、定期修正的原则。体系架构管控策略为了保障云运维管理体系最终的建设效果,切实提升中国联通信息化部的云运维管理水平和服务质量,各组织人员在进行云运维管理体系建设时,需严格执行以下管控策略:各组织人员应严格遵循本次规范的要求,保证规范内容的有效落地各组织人员应建立量化管控机制,通过量化管控的建设落实指标化管理。建设单位要保证规范要求中的人员配套措施落实到位,要做到职责落实到岗、落实到人。建设单位要充分认同实现全国一体化运维/运营的建设目标,优先开展全国一体化运维/运营服务受理体系和服务台建设。各组织人员在建设过程中需保障规范中明确提出的总部信息化部管控要求的落地实现,例如流程建设中总部信息化部参与的要求;总部信息化部要求的管控指标等。体系框架总图本次云运维管理体系设计,充分参考国内外运营商和互联网企业在云运维方向上的成功建设经验和ITIL<V3>的最佳实践,采用PPIT方法论,从组织人员、流程制度、技术工具、信息管控四个方面描述IT服务支撑体系。具体如下:图44云运维管理体系框架总图组织人员域组织人员域包含的管理内容为:保证IT云化后服务支撑体系建设的组织保障要求,包括组织职能、组织架构、岗责等管理内容。本规范中定义的组织与人员域所阐述的范围是联通信息化部门,立足于对未来联通IT云化后服务管理体系落地的组织保障要求,定义了IT云化后服务支撑体系所涉及的组织管理职能,并对相应职能进行定义说明,指导信息化部的组织配套措施的落地。组织人员域提到的管理职能是针对虚拟组织而言,各级单位在进行角色设置和职责落实时,可以根据自身的组织架构和管理现状将要求的各管理职能映射到组织中的对应人员或部门,并在该人员或部门职责中,增加对其的职责要求组织人员域包含的管理内容为:保证云运维管理体系建设的组织保障要求,包括组织职能、组织架构、岗责等管理内容。流程制度域流程制度域包含的管理内容为:云运维管理相关的各类管理流程和保障其落实的管理制度。本次规范流程制度域的设计,在吸取联通信息化部前几版规范的实际建设经验的基础上,提出了以联通现有实际工作现状和需求为基础,以云计算运维服务管理为基本内容,并与ITIL〔V3最佳实践相互印证的原则,对流程制度域的具体管理流程进行了梳理和定义,以保证一切从实际出发、有的放矢,取得立竿见影的运维实施效果,避免出现全盘照搬ITIL给各组织人员在运维实施过程中带来困惑和束缚。各组织人员在流程建设的同时,应根据各自的特点,完善维护、考核等相关制度,配合云运维管理技术要求的落实,确保云运维管理目标的实现。本管理域中提到的每个流程的详细设计要求都在本规范中进行了详细阐述,定义了流程的目标、范围、活动、角色与职责、流程间的交互关系、流程管理政策、关键控制点、流程KPI和参考信息等要素,各组织人员在运维实施过程中可以参考本规范的具体要求,结合自身实际情况,进行具体的落地实现。技术工具域技术工具域包含的管理内容为:承载云运维管理体系落地的各类云运维管理功能模块。本规范定义了用于承载云运维管理体系的技术工具,以实现云运维管理体系框架中提到各类管理要求、管理流程、管理信息的最终落实,具体包括以下内容:运维门户:整合中国联通云运维管理的功能应用,提供个性化的门户展现。面向管理者,根据其用户权限,提供云资源的规划、调度等策略管理界面,提供云资源的状态查看界面,提供云资源的健康度分析、优化管理建议的展现;面向运维人员,根据其用户权限,提供分层级的云资源的状态查看界面,提供分层级的云资源的告警信息查看和策略设置。运维需求管理:负责云运维管理的需求的全生命周期流程化管理,包括需求获取、需求处理、需求分析、需求验证和需求后评估五个管理过程。运维服务管理:负责对云运维管理提供的各种运维服务进行管理,包括效益提升域的资源容量管理类流程、I/P/S平台管理类流程、资源管理识别类流程、资源管理使用类流程、资源管理回收类流程、资源配置管理类流程、资源管理通用类流程;系统保障域的故障处理类流程、维护类流程、应急预案类流程;服务管控域的运维评价考核类流程、运维平台使用咨询类流程。云资源管理:实现对各类云资源的全生命周期的静态管理,包括资源状态管理、资源数据模型、资源数据核查、资源数据提供、容量管理、资源拓扑管理、资源数据模型管理、资源数据维护、资源预警等。资源监控管理:负责对各类云资源的性能和状态进行监控、管理、维护和统计,包括对IaaS平台、PaaS平台、SaaS平台实现实时监控、捕获资源的部署状态、性能指标、运行指标、各类告警信息等,以及资源操作日志、资源服务质量监控、监控体系等。业务监控管理:负责对业务的性能、状态进行监控、管理、维护和统计,包括对各业务系统的信息管理、业务的拓扑展现等。云平台策略管理:负责管理IaaS平台、PaaS平台和SaaS平台的资源纳管、分配、调度和容量管理,向云运维管理的管理者或运维人员提供策略的制订、修改、删除、审核和发布等操作管理功能。云平台配置管理:负责管理IaaS平台、PaaS平台和SaaS平台的资源配置,向云运维管理的管理者或运维人员提供配置的制订、修改、删除、审核、发布和审计等功能。统计分析:负责对各类云资源的各项信息进行多维度的统计分析,为管理者或运维人员提供资源健康状况分析和资源管理优化等建议。集成管理:负责云运维管理内部功能模块之间的接口,以及云运维管理与IaaS平台、PaaS平台、SaaS平台、云运营管理等接口的实现和管理。系统自管理:负责云运维管理自身的各项管理,包括参数管理、日志管理、平台监视、用户管理、系统备份和恢复、版本控制管理等。技术工具的具体要求可参照国内外电信运营商及互联网企业在云运维管理方面的先进技术和研究成果,并遵循企业现有的《中国联通IT服务支撑流程管理规范v1.0》、《中国联通IT服务支撑系统业务规范v1.0》和《中国联通IT服务支撑系统技术规范v1.0》等主要技术要求。信息管控域信息管控域包含的管理内容为:支撑云运维管理要求的各项管理数据,包括资源信息、考核指标、管理报告等内容。本次规范在信息管理域的要求主要包括指标体系和数据模型两个方面的内容:指标体系包括监控指标和服务类指标两大类,监控类指标定义了未来监控系统需要监控的相关指标,服务类指标定义了客户感知和运维考核类指标。数据模型定义资源管理的管理范围和管理颗粒度,数据模型包括被管对象的分类、属性、关系和命名规则。指标体系指标设计目标为了有效支持联通云计算运营,合理评估云计算运维支撑体系的建设成果,不断提升管理水平,制定了本指标分册,其总体目标是:统一云计算运维服务水平的量化标准。建立指标框架,指导云计算运维管理实践中梳理和建立自身的监控指标与服务管理指标体系。建立管控指标库,实现与时俱进的绩效考核目标,持续提高中国联通整体云计算运维管理水平。指标体系定义指标是实现IT服务量化管理的基础,是对业务服务或者专业服务的可用性和能力等服务水平的描述;本规范之指标体系是一套针对中国联通IT服务的服务水平进行实时监控和后评估的方法体系。本指标体系框架主要定义了以下3个域:服务价值业务是指由中国联通云计算业务,这些业务直接面向信息化部的内部使用者,也称之为客户。因此业务价值域指标也称之为客户体验指标,用于反映云计算服务对内部客户的服务水平,在本文中,我们称之为业务指标。定义该域的目的:提升内部用户感知和满意度。运维质量运维质量指标是用于衡量应用系统及其承载这些应用系统的基础设施〔包括提供计算服务的主机服务器、提供数据通信服务的网络系统以及提供数据存储服务的存储系统等自身处理能力及其可用性状况的指标。可分为应用指标和平台指标两大类。定义该域的目的:考核和提升应用系统及其基础平台处理能力。考核和控制企业IT风险,防范因IT故障对企业业务造成的损失。服务保障云服务保障域指标也称之为服务指标,是用于衡量企业服务管理规章及相关流程执行能力和效果的指标。定义该域的目的:考核和提升组织资源服务能力;考核和控制组织资源服务的合规性。数据模型数据模型定义了中国联通云运维管理系统所管理的云计算各类资源、服务数据模型,定义了资源管理的范围和颗粒度,具体包括资源域、服务域、人员组织域三大主题域。云运维管理系统所管理的实体范围按照主题划分为云资源、云服务、人员组织三大主题。云资源管理的核心数据是资源项,任何受资源管理控制的事物都属于资源项,可以是包括软硬件在内的完整系统,也可以简单到其中的一个硬件模块,也可以是一项资产,服务组件或者项目,资源域和服务域的事物都属于资源项范畴。云资源主题:描述的资源是中国联通云计算服务过程中所涉及到的所有物理的、逻辑的实体,资源根据资源的存在形态来划分,分为硬件资源、软件资源、辅助资源和空间资源:物理资源是确实存在的、可见的的有形资源,从物理角度描述资源信息。包括主机服务器、网络设备、存储设备、终端等硬件设备。从资源项的管理层次进一步细化,系统可将更细化的可独立存在的硬件模块作为资源项,包括磁盘、内存、CPU、网卡等。虚拟资源是通过虚拟化后的资源,通常包括虚拟计算资源、虚拟存储资源、虚拟网络资源。虚拟资源是依赖物理资源而存在的,物理资源为虚拟资源的运行起支撑作用。软件资源是运行在硬件资源上的软件实体,软件资源与硬件资源一起对外提供各种系统服务。包括操作系统、基础软件、应用系统等软件。从资源项的管理层次进一步细化,系统可将更细化的可独立存在的逻辑单元作为资源项,如进程等。辅助资源是在生产过程中,对IT系统的运行起辅助性作用,包括规划信息、工程工程、文档、合同、软件包等。空间资源:描述的是资源项相关的位置信息,包括资源项存放的地理位置信息和和资源项的管理区域。联通管理区域是中国联通根据平台自管理需要进行的区域划分。云服务主题:描述的服务是对内部客户所能够提供的云计算服务能力,从服务的提供形式来划分,分为IaaS服务、PaaS服务和SaaS服务三大类。IaaS服务:PaaS服务:SaaS服务:人员组织主题:IT人力资源也将作为信息化部对外提供服务所需要的一类资源,包括角色和人员,供应商是一类特殊的IT人力资源。IT人力资源对资源进行有效的支撑和管理,保障IT系统的正常运转。云运维管理活动概述组织人员域阐述了IT云化后服务支撑体系对组织职能的要求,各级建设单位应将要求的组织职能落实到自身组织架构中,完成组织保障。服务台:业务用户使用信息化部IT服务的单一联系点,是IT和信息化部对外的服务窗口职能描述通过统一集中的服务台对投诉、故障申告、问题咨询的受理、初步处理、分派和追踪,提高处理过程的透明度和处理的时效性7x24服务支持,强化统一受理,确保所有投诉、故障申告、问题咨询得到准确的记录和及时的分派;确保投诉、故障申告、问题咨询在需要跨专业技术领域协调解决时得到及时有效的分派和处理;客户满意度调查和反馈通过普及和宣传,帮助用户更好地使用IT服务及时向客户传递IT服务变化通告服务管理职能:实现信息化部整体服务管理,驱动组织建立以服务为导向,以流程为工作方式的运维模式职能描述规划信息化部IT云化后的服务管理的发展思路,提出年度项目/举措建议并对批准的项目/举措进行落实跟进梳理和定义IT云化后的服务支撑体系,推动关键流程角色的岗位和考核落实,与各流程经理一起推动运维管理流程体系的推广与落地实施对运维人员进行流程与制度培训和流程运行指导梳理和定义运维绩效指标,对流程执行情况进行质量监控,实现运维服务绩效的量化管理;结合流程使用者的反馈,对服务流程进行持续优化负责信息化部IT资源〔硬件、IaaS平台、PaaS平台、应用系统的SLA制定及评估。定期提供运维服务管理报告,组织运维管理会议,向管理层汇报,对会议形成的改进措施牵头落实业务价值通过服务管理职能推动横向的流程贯穿和信息共享,提高运维效率,降低运维风险提高信息化部在运维管理工作方面决策的科学性,增强决策的执行力。通过可量化的指标和职能保障,可以系统化地分阶段提升组织的整体IT云化后的运维成熟度,以更好地实现与业务整合公共资源管理职能:实现信息化部IT公共资源〔软硬件、中间件、数据库、机房等的全生命周期管理职能描述负责信息化部IT资源的规划、纳管、扩容、分配、回收、调拨等管理,并对IT资源的整体配置策略进行集中统一管控运维第三方管理职能:运维第三方服务管理统一的组织保障,实现信息化部整体运维第三方服务管理,加强对运维第三方的控制,对运维第三方服务实现量化的绩效管理。职能描述规划信息化部运维第三方服务的策略和范围,对运维第三方服务管理工作进行年度总结和计划建立运维第三方服务管理的整体流程体系和质量要求对运维第三方服务需求进行统一归口管理,积极参与运维第三方的谈判和选择过程,为第三方服务建立服务水平协议,量化服务产出。确保运维第三方服务范围描述清楚、考核设计科学、日常运作职责和接口明确维护和管理运维第三方服务列表和服务商信息,对所有运维第三方服务进行绩效跟踪管理,确保第三方提供高质量的无缝服务建立与运维第三方之间的关系管理机制,增强与第三方之间的信任和透明度对运维第三方服务合同纠纷、合同变更、合同中止及服务移交等进行有效管理业务价值降低运维第三方服务带来的业务风险提高运维第三方服务质量,降低整体运维成本清楚界定信息化部与运维第三方间的分工界面运维管理团队:承担专业技术领域〔硬件、IaaS平台、PaaS平台、应用系统的运维管理职责。职能描述规划信息化部专业技术领域〔硬件、IaaS平台、PaaS平台、应用系统的运维管理策略和范围,制定运维支撑团队的工作计划,并进行指导和考核负责信息化部专业技术领域〔硬件、IaaS平台、PaaS平台、应用系统的运行监控及故障协调处理负责信息化部IT资源〔硬件、IaaS平台、PaaS平台、应用系统的SLA转化〔KQI/KPI分解。运维支撑团队:传统硬件运维支撑、IaaS平台运维支撑、PaaS平台运维支撑、应用运维支撑、原厂等团队。职能描述传统硬件的运行监控、维护及故障处理IaaS平台的运行监控、维护及故障处理PaaS平台的运行监控、维护及故障处理应用系统的运行监控、维护及故障处理负责信息化部IT资源〔硬件、IaaS平台、PaaS平台、应用系统的SLA监控与保障。三线运维支持:第三方软硬件原厂、虚拟化平台/IaaS原厂、中间件/数据库/PaaS平台原厂的三线支持7x24监控值班基础运行维护,包括维护作业计划执行、机房巡视等 上述管理职能,各级建设单位应根据自身单位专业团队的架构和特点,进行相应的职能映射,以保证管理职能的落实。云运维管理活动指标体系系统保障域流程故障处理类流程故障处理评估指标表4-1故障处理评估指标指标名称指标描述系统数据要求指标算法建议采集间隔数据类型级别是否上报故障总量针对云运维管理所辖范围内IaaS/PaaS/Saas平台,考核周期内受理的故障总量1天整型高否故障平均处理时长针对云运维管理所辖范围内IaaS/PaaS/Saas平台,考核周期内故障的平均处理时长1天整型高否故障处理及时完成率针对云运维管理所辖范围内IaaS/PaaS/Saas平台,在流程时限要求内完成故障处理的比例1天整型高否故障处理完成率针对云运维管理所辖范围内IaaS/PaaS/Saas平台,考核周期内完成故障处理的比例1天整型高否重大紧急告警事件处理评估指标表4-2重大紧急告警事件处理评估指标指标名称指标描述系统数据要求指标算法建议采集间隔数据类型级别是否上报上报重大紧急告警事件总数考核周期内上报的重大紧急告警事件总数1天整型高否重大紧急告警事件平均处理时长考核周期内重大紧急告警事件平均处理时长1天整型高否重大紧急告警事件处理及时率在流程时限要求内完成重大紧急告警事件上报的比例1天比值高否云终端故障申告处理评估指标表4-3云终端故障申高处理评估指标指标名称指标描述系统数据要求指标算法建议采集间隔数据类型级别是否上报申告总数考核周期内受理的云终端故障申告总数1天整型高否申告平均处理时长考核周期内受理的云终端故障申告平均处理时长1天整型高否申告及时完成率在SLA内完成的云终端故障申告申请比例1天整型高否故障申告的一次完成率核周期内受理的云终端故障申告通过一次电话远程支持解决的比率,1天整型高否维护变更请求类流程表4-4维护变更请求处理评估指标指标名称指标描述系统数据要求指标算法建议采集间隔数据类型级别是否上报系统变更总量针对云运维管理所辖范围内IaaS/PaaS/Saas平台,考核周期内系统变更总量1天整型高否系统变更平均处理时长针对云运维管理所辖范围内IaaS/PaaS/Saas平台,考核周期内系统变更平均处理时长1天整型高否系统变更及时完成率针对云运维管理所辖范围内IaaS/PaaS/Saas平台,考核周期内系统变更及时完成率1天整型高否应急预案类流程表4-5应急预案处理评估指标指标名称指标描述系统数据要求指标算法建议采集间隔数据类型级别是否上报配置项维护总量考核周期内配置项维护总量1月整型高否平均处理时长考核周期内配置信息维护流程平均处理时长1月比值高否完成及时率考核周期内配置信息维护完成及时率1月整型高否配置管理类流程表4-5配置管理处理评估指标指标名称指标描述系统数据要求指标算法建议采集间隔数据类型级别是否上报配置项维护总量考核周期内配置项维护总量1月整型高否平均处理时长考核周期内配置信息维护流程平均处理时长1月比值高否完成及时率考核周期内配置信息维护完成及时率1月整型高否日常运维类流程作业计划评估指标表4-6作业计划评估指标指标名称指标描述系统数据要求指标算法建议采集间隔数据类型级别是否上报作业计划总量考核周期内执行作业计划的总量〔包含地域、部门、业务、完成状态等1月整型高否作业按时执行率作业计划按时执行率1月比值高否作业成功执行率作业计划成功执行率1月比值高否值班管理评估指标表4-7值班管理评估指标指标名称指标描述系统数据要求指标算法建议采集间隔数据类型级别是否上报故障发现总量考核周期内值班发现的故障总量1月整型高否按时接班率考核周期内按时接班率1月整型高否服务管控域流程运维服务及时性事件处理的及时性表4-8事件处理及时性指标指标名称指标描述系统数据要求指标算法建议采集间隔数据类型级别是否上报事件处理成功率运维事件处理的成功率P1:成功量P2:失败量P1、P21天数值型中是事件处理成功量运维事件处理成功量P1:成功量P11天数值型中是事件处理失败量运维事件处理失败量P1:失败量P11天数值型中是事件处理时长运维事件处理时长P1:事件处理接受时间P2:事件处理完成时间average<p2-p1>1天数值型中是事件处理等待时长运维事件处理等待时长P1:事件提交起始时间P2:接受时间或放弃时间average<P2-P2>1天数值型中是问题处理的及时性表4-9问题处理及时性指标指标名称指标描述系统数据要求指标算法建议采集间隔数据类型级别是否上报问题处理成功率运维问题处理的成功率P1:成功量P2:失败量P1、P21天数值型中是问题处理成功量运维问题件处理成功量P1:成功量P11天数值型中是问题处理失败量运维问题处理失败量P1:失败量P11天数值型中是问题处理时长运维问题处理时长P1:问题处理接受时间P2:问题处理完成时间average<p2-p1>1天数值型中是问题处理等待时长运维问题处理等待时长P1:问题提交起始时间P2:接受时间或放弃时间average<P2-P2>1天数值型中是重大紧急告警事件处理的及时性表4-10重大紧急告警事件处理及时性指标指标名称指标描述系统数据要求指标算法建议采集间隔数据类型级别是否上报重大紧急告警事件处理成功率重大紧急告警事件处理的成功率P1:成功量P2:失败量P1、P21天数值型中是重大紧急告警事件处理成功量重大紧急告警事件处理成功量P1:成功量P11天数值型中是重大紧急告警事件处理失败量重大紧急告警事件处理失败量P1:失败量P11天数值型中是重大紧急告警事件处理时长重大紧急告警事件处理时长P1:故障处理接受时间P2:故障处理完成时间average<p2-p1>1天数值型中是重大紧急告警事件处理等待时长重大紧急告警事件处理等待时长P1:故障提交起始时间P2:接受时间或放弃时间average<P2-P2>1天数值型中是客户服务准确性表4-11客户服务的准确性指标指标名称指标描述系统数据要求指标算法建议采集间隔数据类型级别是否上报云服务非计划中断的数量客服投诉中云服务非计划中断的投诉量P1:投诉量P11天数值型中是运维需求实现情况等待审批的运维需求量表4-12等待审批的运维需求量指标指标名称指标描述系统数据要求指标算法建议采集间隔数据类型级别是否上报等待审批的业务需求数量处于等待审批环节<状态为已申请、已确认>的业务需求量;P1:等待审批的业务需求量P11天数值型低是运维需求完成情况表4-13运维需求完成情况指标指标名称指标描述系统数据要求指标算法建议采集间隔数据类型级别是否上报运维需求完成平均时限运维需求完成的平均时限;运维需求的提出时间P1、运维需求的完成时间P2、已完成的运维需求数量P3sum〔P2-P1/P31天数值型中是运维需求完成及时率按时间点监视运维需求完成的及时率;按时完成的运维需求量P1、总运维需求量P2〔不含被拒绝、待审批的运维需求P1/P21天数值型中是用户满意度用户对运维需求完成情况的满意率;用户满意的运维需求完成量P1、总运维需求量P2〔不含被拒绝、待审批的运维需求P1/P21天数值型中是事件解决情况事件类型分布情况表4-14事件类型分布情况指标指标名称指标描述系统数据要求指标算法建议采集间隔数据类型级别是否上报发生事件数量周期内云运维管理范围内发生的事件数量P1:事件数P11天数值型中是云资源管理触发的事件数周期内云资源管理发生的事件数量P1:事件数P11天数值型中是资源监控管理触发的事件量周期内资源监控管理发生的事件数量P1:事件数P11天数值型中是运维服务管理触发的事件量周期内运维服务管理发生的事件数量P1:事件数P11天数值型中是所辖IaaS/PaaS/SaaS平台上报事件量周期内所辖IaaS/PaaS/SaaS平台上报的事件数量P1:事件数P11天数值型中是云运营管理平台上报的事件量周期内云运营管理平台上报的事件数量P1:事件数P11天数值型中是使用咨询数量用户的使用咨询数量P1:使用咨询数量P11天数值型中是本月事件处理情况表4-15本月事件处理情况指标指标名称指标描述系统数据要求指标算法建议采集间隔数据类型级别是否上报及时完成的事件总数量统计本月云运维管理范围内及时完成的事件总量P1:事件数量P11月数值型中是云资源管理及时完成的事件量云资源管理及时完成的事件的量P1:及时完成的事件量P11月数值型中是资源监控管理及时完成的事件量资源监控管理及时完成的事件的量P1:及时完成的事件量P11月数值型中是运维服务管理及时完成的事件量运维服务管理及时完成的事件的量P1:及时完成的事件量P11月数值型中是所辖IaaS/PaaS/SaaS平台及时完成的事件量所辖IaaS/PaaS/SaaS平台及时完成的事件的量P1:及时完成的事件量P11月数值型中是云运营管理平台及时完成的事件量云运营管理平台事件及时完成的量P1:及时完成的事件量P11月数值型中是转派电子运维事件数量统计本月转派电子运维的事件数量P1:转派电子运维的事件数量P11月数值型中是云运维管理架构云运维管理功能架构云运维管理提供对中国联通公司内部所有云资源的统一规划、监控、调度、分配、调拨、维护和优化建议,提供IaaS层、PaaS层、SaaS层资源的全生命周期的运维管理,实现对物理资源、虚拟资源的统一管理。云运维管理的功能模块包括运维门户、运维需求管理、运维服务管理、云资源管理、资源监控管理、业务监控模块、云平台策略管理、云平台配置管理、统计分析、集成管理和系统自管理。云运维管理功能架构如图5-1所示。图5-1云运维管理功能架构运维门户:整合中国联通云运维管理的功能应用,提供个性化的门户展现。面向管理者,根据其用户权限,提供云资源的规划、调度等策略管理界面,提供云资源的状态查看界面,提供云资源的健康度分析、优化管理建议的展现;面向运维人员,根据其用户权限,提供分层级的云资源的状态查看界面,提供分层级的云资源的告警信息查看和策略设置。运维需求管理:负责云运维管理的需求的全生命周期流程化管理,包括需求获取、需求处理、需求分析、需求验证和需求后评估五个管理过程。运维服务管理:负责对云运维管理提供的各种运维服务进行管理,包括效益提升域的资源容量管理类流程、I/P/S平台管理类流程、资源管理识别类流程、资源管理使用类流程、资源管理回收类流程、资源配置管理类流程、资源管理通用类流程;系统保障域的故障处理类流程、维护类流程、应急预案类流程;服务管控域的运维评价考核类流程、运维平台使用咨询类流程。云资源管理:实现对各类云资源的全生命周期的静态管理,包括资源状态管理、资源数据模型、资源数据核查、资源数据提供、容量管理、资源拓扑管理、资源数据模型管理、资源数据维护、资源预警等。资源监控管理:负责对各类云资源的性能和状态进行监控、管理、维护和统计,包括对IaaS平台、PaaS平台、SaaS平台实现实时监控、捕获资源的部署状态、性能指标、运行指标、各类告警信息等,以及资源操作日志、资源服务质量监控、监控体系等。业务监控管理:负责对业务的性能、状态进行监控、管理、维护和统计,包括对各业务系统的信息管理、业务的拓扑展现等。云平台策略管理:负责管理IaaS平台、PaaS平台和SaaS平台的资源纳管、分配、调度和容量管理,向云运维管理的管理者或运维人员提供策略的制订、修改、删除、审核和发布等操作管理功能。云平台配置管理:负责管理IaaS平台、PaaS平台和SaaS平台的资源配置,向云运维管理的管理者或运维人员提供配置的制订、修改、删除、审核、发布和审计等功能。统计分析:负责对各类云资源的各项信息进行多维度的统计分析,为管理者或运维人员提供资源健康状况分析和资源管理优化等建议。集成管理:负责云运维管理内部功能模块之间的接口,以及云运维管理与IaaS平台、PaaS平台、SaaS平台、云运营管理等接口的实现和管理。系统自管理:负责云运维管理自身的各项管理,包括参数管理、日志管理、平台监视、用户管理、系统备份和恢复、版本控制管理等。云运维管理与外围系统/平台关系云运维管理与外围系统/平台关系如图5-2所示。图5-2云运维管理功能架构运维门户运维门户是云运维管理的统一入口,通过整合中国联通云运维管理的功能应用,提供个性化的门户展现。通过单点登录,使云资源管理者和运维人员能够统一地进行中国联通公司内部所有云资源的规划、监控、调度、分配、调拨、维护和优化建议工作,并通过运维门户提供的个性化功能设置符合个人使用习惯的工作界面。面向管理者,根据其用户权限,提供云资源的规划、调度等策略管理界面,提供云资源的状态查看界面,提供云资源的健康度分析、优化管理建议的展现;面向运维人员,根据其用户权限,提供分层级的云资源的状态查看界面,提供分层级的云资源的告警信息查看和策略设置。运维门户应与企业门户进行集成,支持运维人员通过企业门户统一访问运维门户。门户基础服务单点登录功能定义单点登录实现授权用户在运维门户中只需进行一次身份认证,即可使用运维门户提供的所有被授权功能,无需二次身份认证。根据运维门户与企业门户的集成要求,此处的单点登录实现授权用户单点登录本地企业门户后,即可根据用户权限访问云运维管理的相关应用。功能要求支持中国联通认证平台进行统一认证;实现运维门户向认证系统发起用户名和密码认证请求。可根据安全管理需要决定是否增加第三方〔如短信验证的辅助验证。对于安全性较高的应用,允许进行二次或二次以上的身份验证。单独登陆的认证内容一般为用户名+密码。门户展现功能定义门户展现支持对云运维管理所辖的IaaS/PaaS/SaaS综合管理平台中所涉及的各种信息、数据〔如资源数据、监控数据等以不同的展现形式〔如报表、图形等在运维门户中统一进行展现。功能要求支持主流网页浏览器访问展现〔如IE,FireFox。支持不同分辨率自适应展现。支持栏目以URL链接访问或、嵌入或弹出式展现。支持栏目的最小化和最大化展现。支持运维门户应用根据不同权限进行展现。与企业门户集成时,运维门户的VI〔主要指与运维门户界面有关的风格、样式、色调等方面的内容要求遵从现有企业门户的VI规范。支持多角色〔如管理角色、监控角色、运维角色视图展现,支持授权用户的运维门户定制,提供信息展示的丰富手段门户审计功能定义门户审计用来实现对用户在运维门户中的活动记录进行统计和检查,具体包括:审计分类:对审计信息进行分类处理,审计内容包括认证、授权、登录/登出、访问等内容。审计分级:根据审计信息的严重程度进行分级,审计内容包括严重、警告、一般等内容。审计过滤:根据定义的过滤规则,对审计信息进行过滤,便于分析和展现,过滤的属性,审计内容包括时间、帐号、操作类型、操作名称等内容。功能要求认证审计:认证日志由中国联通认证平台提供,当用户进行认证时,记录认证日志;授权审计:授权管理日志由中国联通帐号管理平台提供,当帐号被授权和被清权时,记录操作日志;登录/登出审计:登录记录由中国联通认证平台提供,当用户登录运维门户时,记录登录日志;访问审计:运维门户提供集成云运维管理功能模块的访问资源,运维门户所有的页面提供审计的配置。用户管理功能定义用户管理主要包括用户信息的管理和用户帐号的管理:用户管理提供用户的数据提供、信息获取等功能;用户信息一般包括用户名称、职务、公司、部门、性别、角色等。帐号管理提供对用户帐号的管理,包括帐号的创建、修改和删除等维护;用户帐号主要是用户使用系统的身份标识,一个用户可以拥有多个帐号。运维门户的用户主要分为以下两类:内部用户:联通正式用户,如企业IT部门工作人员;外部用户:非联通正式用户,如联通临时用户、厂家人员、外包运维人员等。功能要求用户管理运维门户的内部用户数据来源于企业门户的全国用户目录,支持从该目录系统获取内部用户和组织信息;不提供对内部用户的创建与维护,对这些用户数据不可编辑;提供对外部用户的管理功能,包括创建、修改、删除等;提供用户的浏览、查询和显示功能,支持树形展现方式。提供查询手段,可根据用户信息、组织信息、角色等信息进行多种条件的查询;遵从中国联通已有目录系统的接口要求,并满足目录系统对组织、人员节点和属性的读写权限控制要求〔请详见中国联通门户规范中用户管理相关描述。用户帐号管理用户帐号管理包括用户注册、用户登录、用户注销、用户信息修改、密码更改及密码重置、设置用户状态、查询用户信息等操作。用户注册:用户注册由用户帐号管理员进行注册。当管理员注册用户完成后,将相关帐号、密码信息通过Email或短信方式发送给用户。平台支持用户信息的批量导入、注册。用户注销:用户注销由用户帐号管理员进行注销。用户注销时,平台应释放为该用户制定的访问系统权限。用户注销后,平台用Email或短信的方式通知用户注销结果。用户信息修改:用户可修改保存在云运维管理的用户信息。用户登录运维门户后,可对其个人信息进行修改。关键信息〔如用户名等可设置为不允许用户修改。密码修改:用户登录运维门户后,可对其登陆密码进行修改。用户需输入原密码、新密码、确认新密码。提交平台验证成功后,平台提示用户操作结果。密码重置:密码重置为用户获取重置密码的功能。获取重置密码的方式包括手机短信和发送Email两种方式。用户选择获取方式并提交重置申请后,平台自动生成重置密码,以Email或短信的方式通知用户。设置用户状态:管理员可对用户的状态进行设置。可将用户状态设为挂起,禁止用户在平台上进行运维等操作,并暂停其账户下的所有权限使用。用户挂起后也可将其状态恢复为正常。用户信息查询:用户和管理员均可查询用户信息。用户可通过运维门户查看自己的相关信息,管理员可通过运维门户查看所有用户的信息。用户组管理用户组管理是指对用户按照级别进行分层次维护和管理的功能。用户组管理实现对云运维管理中的用户分类并分层管理,云运维管理支持将用户划分为多个用户组,不同用户组的用户拥有不同的权限。支持按用户级别指定用户对资源的各类权限;用户分组支持多级划分,可用于体现真实用户的组织结构;支持创建,修改,查询和删除用户组;支持增加,修改,删除组内用户;支持用户组的查询和统计。角色管理角色管理是指权限的集合分类。用户帐号管理员可以将权限添加到角色中,用于方便权限的分配。角色管理功能要求如下:支持角色创建,修改,查询和删除;支持增加,修改,删除权限;支持为用户赋予/取消角色;支持角色浏览;角色应包含以下内容:角色ID、角色名、角色属性、角色分类、是否有效、权限级别等。权限管理权限管理是指对云运维管理中的功能进行分层、统一访问控制。功能要求:支持权限浏览;支持权限创建,修改,查询和删除;支持权限分级;支持对用户帐号、用户组、角色等不同的集合进行权限的配置和管理;支持权限审计;权限应包括以下内容:权限ID、权限名、权限级别、权限对象、是否有效;遵循中国联通企业门户及中国联通认证平台系统的统一认证和权限控制要求。支持对用户帐号的管理,包括帐号的创建、修改、删除等维护;支持"用户-角色-权限"视图的展现,例如一个用户拥有哪些角色,每个角色拥有哪些权限。授权管理功能定义授权管理主要管理和配置用户访问运维门户和门户集成的云运维管理功能模块应用的帐号权限。功能要求权限主要指访问权权的配置和管理;支持通过策略、单个条件或组合条件进行的权限操作;支持权限的生命周期管理;支持对用户、用户组、角色等不同的集合进行权限的配置和管理;用户帐号对运维门户的访问权限可以统一配置和管理;用户帐号对运维门户集成的云运维管理功能模块应用的访问权限可以统一配置和管理;支持"用户-角色-权限"视图的展示,例如一个用户拥有哪些角色,每个角色拥有哪些权限。认证管理功能定义认证管理主要提供对用户身份验证方式、认证策略等内容的配置管理。功能要求支持认证策略的配置和管理,包括认证策略的创建和维护。支持不同应用系统或不同用户、角色等认证策略的绑定。认证策略支持用口令+密码、口令+密码+第三方认证等的形式。工作台工作台是个人在运维门户中的一个工作区域,包含个人需要处理的待办工单,以及提供在门户中进行栏目和内容展示的个性化设置的功能。工单查询功能定义在运维门户中,用户可以自助管理各类运维服务工单,为了了解工单的处理情况,需要对自己负责的工单处理情况进行查询。功能要求支持工单以模糊条件或精确条件查询。支持工单处理状态、信息查询。支持在处理和历史工单的查询。支持分类搜索。支持关键字搜索。支持搜索结果排序。工单查询结果主要包括工单ID、工单标题、工单类别、提交时间、提交人、处理状态等字段。待办工单功能定义待办工单为用户待处理的工作事项。待办工单提供给用户一个集中的待办工单区域。功能要求集成与云运维管理中所有涉及的待办工单。在门户首页展现一定数量的待办工单信息列表〔如5份待办。通过点击待办工单标题链接访问工单应用。支持在门户首页嵌入待办的提示信息〔如"有2份待办",显示在主页或醒目位置。数据要求待办工单信息主要包括:序号、工单标题、工单类别、接收时间等字段。个性化定制功能定义不同的用户对自己操作的门户界面可能有不同的展现要求,个性化定制提供给用户在运维门户中对自己有权限操作的栏目进行栏目属性、栏目布局等方面的设置。功能要求支持对单个或一组栏目进行批量设置。提供对栏目隐藏和显示的设置。不提供颜色、风格和样式的个性设置。门户栏目设置功能定义门户栏目指用户在门户中所访问和使用的功能应用栏目,不同的用户对自己操作的栏目可能有不同的使用要求。栏目设置支撑用户可选取云运维管理的所有功能栏目,以提供在门户中进行访问和使用。功能要求提供栏目的选择或取消功能。支持对单个或多个栏目列表进行设置。支持栏目视图,例如用户可查自己所拥有的栏目名称。信息发布公告管理功能定义公告管理是为了让用户可以方便的发布信息给所有使用云运维管理的用户,主要功能包括公告的发布、公告的审核、公告查看历史记录、过期失效的公告等相关方面的内容。功能要求发布信息给所有使用云运维管理的用户;记录公告的访问日志信息;支持公告的编写、审核、下发、查询公告;可设定公告的有效期;可灵活设定公告的发送范围、发送时间;可支持定时自动发送与手工发送模式。信息交流运维门户提供信息交流功能。信息由单向的"阅读"向"共同创建"发展,由被动的接受信息向多方主动创建、交流信息迈进。登陆用户可以使用信息交流,达到解决各种问题的目的。信息发布和订阅功能定义云运维管理应该提供信息发布和信息订阅的功能,并满足其权限管理,实现用户在线信息交流。功能要求信息发布:登录用户可以发布新信息或修改已发布的信息,并且设置评价权限。信息评价:登陆用户可以评价已开放评价权限的信息。信息订阅:登陆用户可以订阅相关的信息,以书签的形式表现。信息管理:管理员通过信息管理功能,可关闭或删除用户发布的信息。即时通信功能定义云运维管理应该提供与即时通信工具的集成,满足用户在线通信交互的需要。相关人员在处理工单时,可以随时和上报人进行即时沟通,并能将沟通信息作为附件保存在流程的工单中。功能要求能集成即时通信工具实现在线通信功能。应支持云运维管理的所有用户之间使用即时通讯工具进行通讯。应支持选择向单个或一群用户发送消息、图片、表情图标或者附件。应支持根据用户名查找交谈用户,发起一个交谈。应支持选择多个用户创建一个讨论组,讨论组中每个用户发送的消息,组中所有其它成员都可以收到。应支持向不在线的用户发送消息、图片、表情或者附件,该用户一登录平台,就能提醒用户有新消息。应保存用户之间的历史交谈记录,历史交谈记录的保存位置可配置。综合展现报表管理运维门户应当提供报表和查询统计功能,应具有报表生成的灵活性和呈现的多样性,以适应用户不断变化的需求。主要包括报表模版定义,报表生成计划和报表发布等功能。用户可以根据预定义的报表模板,设置相关的条件,生成报表。报表只作为呈现数据使用,可以不具有交互性。报表模板管理功能定义方便报表模板的创建、修改和删除;按照类别管理。功能要求用户能够根据具体需要创建报表模板提供报表引擎,用户可以根据平台中的各个数据表,自定义自己的报表,并存储成报表模版。报表模板包含数据的内容列表,格式的描述等信息。报表的内容列表可以由用户通过数据库中的数据生成,也可以由报表模板中已有的字段通过函数计算生成。用户可以设置过滤方式、显示格式、排序条目等,报表展现形式可以支持表格、饼图、柱图、线条图等。支持生成WEB格式报表,支持其他多种数据格式。例如:PDF、EXCEL等。用户可以将查询结果保存为报表模版。支持对报表模板的增/删/改等操作。报表模板的分类支持对已经生成的报表模板进行分类管理,例如:可以按照业务类别〔比如:计费、帐务等、地域、产生周期等进行分类。支持对报表模板类别的增/删/改等操作。报表的生成与发布功能定义支持报表任务的管理、报表参数设置、报表的生成等。支持报表通过各种渠道发送,如电子邮件、短信、彩信等。支持报表的2次开发。功能要求报表任务的管理平台应支持用户增加、删除及编辑自动生成报表任务。平台自动生成的报表基于平台已有的报表模板。自动生成任务中可包括一个或多个报表模板,以及用户预设的报表生成条件。报表生成参数配置报表生成参数应包括报表名称、执行方式、执行时间、设定人等内容。执行时间可以有周期性和非周期性方式,周期性的执行方式支持周、月、固定天数等,非周期性为一个确定的时间。报表的自动生成支持报表自动生成,用户可以定义报表生成的计划,在计划的时间自动按照模版的定义生成报表。报表的发布支持自动或手动通过电子邮件、短信、彩信等方式发布给相关人员。支持报表发布的权限管理。历史报表的操作对平台已产生的报表可定义查询条件进行检索,并可对检索结果进行浏览、导出、打印和分发。报表的权限对于定义的报表,可以设置权限,只有通过授权的人员才能查看,其他人员无法看到报表内容。支持用户设置自己的本地报表。报表数据的开放性云运维管理的数据库结构应该开放,可自行开发或采用第三方工具的方式进行报表制作。统计分析功能定义主要是对各类数据和云运维支撑人员的工作进行数据分析。可以评估流程管理的有效性和效率;可以评价运维服务管理工作的工作数量和工作质量;可以评估运维人力资源规划,有效控制人力资源投入,避免人力资源的重复、过度投入,最大发挥运维人力资源使用效率。功能要求可以提供多维视图的数据组织、管理与多维分析。可以支持各种统计分析方法,例如:提供比较分析、趋势分析、排名分析、比较分析等。具有丰富的图形展现功能。可以灵活地定制不同的分析指标和各种指标计算公式,实现OLAP分析的动态化处理。并具有切片、切块、旋转、钻取和钻透等多维分析操作。可以钻取到详细数据,也能进行多维数据和详细数据的混合分析。分析结果可输出为多种文件格式,例如:Excel、PDF等。对分析指标指定警告值的,在分析报表或图形中以突出方式进行显示。支持针对不同操作人员的权限,显示不同的分析视图。系统帮助功能定义管理员可以设置帮助信息。帮助信息支持丰富的多媒体格式。例如:音频、视频教学等。用户登录后,可以指导用户的行为,解决用户使用中遇到的各种问题。功能要求管理员通过此功能,可以对帮助内容进行新增、修改和删除等维护。管理员可以使用帮助上线功能发布已维护的帮助信息。登陆用户通过此功能搜索相关的帮助内容,提高帮助使用效率。支持以模糊条件或精确条件查询。支持分类搜索。支持关键字搜索。支持搜索结果排序。支持基于单词级别的数据匹配,匹配结果以高亮形式显示。支持某类帮助的订阅。查询结果主要包含帮助ID、帮助名称、帮助类别、排名、发布日期等字段。运维需求管理功能定义需求管理系统是指对需求生命周期的流程化管理,包括需求获取、需求处理、需求分析、需求验证和需求后评估五个管理过程。云运维管理的运维需求管理模块应能与中国联通需求管理平台对接。功能要求需求管理应实现以下需求生命周期管理流程:图7-1需求生命周期管理流程需求获取:收集针对云运维管理用户的管理或运维需求,通过筛选、会审,形成公司云运维需求计划的过程。需求处理:对需求获取过程收集到的需求进行评审,形成云运维管理功能需求书的过程。需求分析:系统需求分析人员按照云运维管理功能需求书的要求,分析并确认云运维管理应具有哪些功能、数据、规则,以及流程和数据之间联系的过程。需求验证:需求验证包括两个方面:云运维管理需求测试流程和云运维管理功能需求验证流程。云运维管理需求测试是指:对于软件功能是否满足云运维管理需求书以及标准规范的要求进行测试的过程。云运维管理功能需求验证是指:对于软件功能是否满足云运维管理功能需求书中点对点应答已确定支持的需求进行验证的过程。需求后评估:通过对需求的变更情况、上线后的云运维管理使用情况进行评估,反过来对云运维管理功能需求提出的质量、需求有效性、需求变更的频率及其影响进行评价,为后续的需求管理工作提供指导的过程。运维服务管理运维服务管理负责对云运维管理提供的各种运维服务进行管理,包括效益提升域的资源容量管理类流程、I/P/S平台管理类流程、资源管理识别类流程、资源管理使用类流程、资源管理回收类流程、资源配置管理类流程、资源管理通用类流程;系统保障域的故障处理类流程、维护类流程、应急预案类流程;服务管控域的运维评价考核类流程、运维平台使用咨询类流程。效益提升域资源容量管理类流程I/P/S平台拆分流程流程定义I/P/S平台拆分流程主要是指对I/P/S平台的容量分析及拆分。流程图图8-1I/P/S平台拆分流程流程说明作业001容量分析:容量分析可周期性自动触发或由资源预警触发。I/P/S平台拆分建议:可由云平台策略管理模块自动生成建议。与其它流程的关系活动003调用资源回收流程;活动004调用平台注册流程;活动005调用资源分配流程。I/P/S平台合并流程流程定义I/P/S平台合并流程主要是指对I/P/S平台的容量分析及合并。流程图图8-2I/P/S平台合并流程流程说明作业001容量分析:容量分析可周期性自动触发或由资源预警触发。I/P/S合并建议:可由云平台策略管理模块自动生成建议。与其它流程的关系活动003调用资源调拨流程;活动004调用平台注销流程;资源扩容管理流程流程定义资源扩容管理流程的触发场景主要有:云运维管理自身发现资源不足;云运营管理向云运维管理请求资源时发现资源不足;I/P/S平台自身发现资源不足。流程图图8-3资源扩容管理流程流程说明作业001分析容量可由云运维管理周期性容量管理触发;也可由云运营管理向云运维管理请求资源、发现资源不足时触发;还可以由I/P/S平台发现资源不足、向云运维管理提交扩容申请时触发。与其它流程的关系活动002调用资源采购流程;活动003调用资源转资流程;活动004调用资源分配流程。I/P/S平台管理类流程I/P/S平台注册流程同资源纳管流程。I/P/S平台注销流程流程定义I/P/S平台注销是指将已有的I/P/S平台从云运维管理中注销,更新资源管理信息,完成对资源整体管控的整个过程。流程图图8-4平台注销流程流程说明无与其它流程的关系活动002调用资源库信息更新流程。资源管理识别类流程资源纳管流程流程定义资源纳管是指将新建的IaaS/PaaS/SaaS综合管理平台纳管〔注册到云运维管理,为新建IaaS/PaaS/SaaS综合管理平台分配平台ID,通过下发云平台配置管理要求、审计资源配置、下发运维管理要求、更新资源管理信息后,完成对新纳管资源整体管控的整个过程。流程图图8-5资源纳管流程流程说明无与其它流程的关系无资源分配流程流程定义资源分配是指云运维管理完成资源扩容后,将新资源分配给指定的IaaS/PaaS/SaaS综合管理平台,IaaS/PaaS/SaaS综合管理平台接管新资源后,反馈资源编号,更新资源库数据信息的过程。流程图图8-6资源分配流程流程说明作业001分配指定资源到指定I/P/S平台过程中,对指定I/P/S平台的确定有:请求中明确指定的,可以直接确定I/P/S平台;请求中未明确指定的,可通过资源分配策略进行确定。与其它流程的关系活动005调用资源库信息更新流程。资源调拨流程流程定义资源调拨管理是指将指定I/P/S平台的资源回收后分配给另一指定I/P/S平台的过程。流程图图8-7资源调拨流程流程说明无与其它流程的关系活动003调用资源退网流程;活动004调用资源分配流程。资源管理使用类流程资源调度流程资源申请调度流程流程定义资源申请调度是针对云运营管理申请开通云资源服务的请求,根据资源调度策略,为云运营管理指定提供云资源服务的IaaS/PaaS/SaaS综合管理平台ID的过程。云运营管理据此与指定的IaaS/PaaS/SaaS综合管理平台交互,将资源交付给请求资源的用户,完成资源的供给。流程图图8-8资源申请调度流程流程说明作业005接收拒绝请求和修正请求意见后,可触发资源扩容管理流程与其它流程的关系无。扩容变更调度流程流程定义扩容变更调度是针对云运营管理申请扩容已开通云资源服务的请求,根据资源扩容变更调度策略,为云运营管理指定提供云资源服务的IaaS/PaaS/SaaS综合管理平台ID的过程。云运营管理据此与指定的IaaS/PaaS/SaaS综合管理平台交互,进行资源的扩容交付,完成资源供给变更。资源扩容变更调度策略应考虑当前提供云资源服务的IaaS/PaaS/SaaS综合管理平台的资源是否能够满足扩容要求。当前提供云资源服务的IaaS/PaaS/SaaS综合管理平台的资源能够满足扩容要求时,应能够返回原提供云资源服务的IaaS/PaaS/SaaS综合管理平台ID,云运营管理据此与指定的IaaS/PaaS/SaaS综合管理平台交互,将新扩容资源交付给请求资源的用户,完成资源的供给;当前提供云资源服务的IaaS/PaaS/SaaS综合管理平台的资源不能够满足扩容要求时,应能够拒绝云运营管理的请求,提供修改资源请求建议;当前提供云资源服务的IaaS/PaaS/SaaS综合管理平台的资源不能够满足扩容要求时,在IaaS/PaaS/SaaS综合管理平台可实现跨平台资源供给或业务迁移情况下,应能够根据资源调度策略,将扩容变更调度转为资源申请调度;应能够记录因资源不足导致资源调度失败的原因,作为云运维管理扩容规划参考依据。流程图图8-9扩容变更调度流程流程说明作业001发起扩容变更调度请求时,需附上原资源供给的平台ID发送;作业005接收拒绝请求和修正请求意见后,可触发资源扩容管理流程。和其它流程的关系无。回收变更调度流程流程定义回收变更调度是针对云运营管理申请减容已开通云资源服务的请求进行审批的过程。云运营管理据此与指定的IaaS/PaaS/SaaS综合管理平台交互,进行资源的释放和回收,完成资源供给变更过程。流程图图8-10回收变更调度流程流程说明无。与其它流程的关系无。一般变更调度流程流程定义一般变更调度是针对云运营管理申请申请变更已开通云资源服务〔如变更物理机/虚拟机操作系统参数的请求,根据资源一般变更调度策略进行审批的过程。云运营管理据此与指定的IaaS/PaaS/SaaS综合管理平台交互,指定的IaaS/PaaS/SaaS综合管理平台进行相应的变更〔如先释放与回收原提供资源,并为用户重新申请符合变更需求的新资源,完成资源供给变更过程。流程图图8-11一般变更调度流程流程说明作业001发起一般变更调度请求时,需附上待变更的资源ID;与其它流程的关系无。资源管理回收类流程资源退网流程流程定义资源退网是指将云资源从某个IaaS平台中下线,并退还给资产管理部门进行再分配。流程图图8-12资源退网流程流程说明作业001发起资源退网请求时,需附上待退网的资源ID。与其它流程的关系活动004调用资源库信息更新流程。资源报废流程流程定义资源报废是指将云资源从某个IaaS平台中下线,并退还给资产管理部门进行报废。流程图图8-13资源报废流程流程说明作业001发起资源报废请求时,需附上待报废的资源ID。与其它流程的关系活动004调用资源库信息更新流程;活动005调用资源转资流程。资源配置管理类流程资源配置审计流程流程定义资源配置审计流程是审计实际运行的IaaS/PaaS/SaaS综合管理平台资源配置项是否满足云运维管理资源配置要求的过程。资源的配置审计触发包括2种:周期触发和实时触发。实时触发主要针对资源纳管、资源分配和资源调拨。流程图图8-14配置审计流程说明无与其它流程的关系无资源管理通用类流程资源库信息更新流程流程定义资源库信息更新流程是对云运维管理所辖各I/P/S平台中的所有资源、资产信息项的变更操作进行规范化记录和管理的过程,通过对变更记录的规范化管理,能实时的更新资源库,从而更好的满足业务需求。包括信息项信息的维护整理、审核、更新、确认、关闭等环节。流程图图8-15资源库信息更新流程流程说明无。与其它流程的关系活动001和活动006调用资源识别类流程;活动002和活动007调用资源使用类流程。系统保障域故障处理类流程重大紧急告警事件处理流程定义重大紧急告警事件处理流程,是对IaaS/PaaS/SaaS综合管理平台重大紧急级别的告警事件处理过程中,参照监控制定的重大紧急告警约束条件,认定为重大或紧急级别的告警事件情况,资源监控管理模块自动向相关平台的运维管理人员上报告警事件状态及处理情况的管理流程。包括:重大紧急告警事件自动上报、重大紧急告警事件跟踪、重大紧急告警事件协同处理等

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论