版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
云平台运维管理详细
计
方
案
目录
1范围1
2规范性引述文件1
3缩略语和术语1
3.1缩略语1
3.2术语及定义1
4私有云运维管理体系框架2
4.1私有云运维管理的概述2
4.2体系框架定位4
4.3体系架构管控策略5
4.4体系框架总图6
4.5体系框架特点7
4.6云运维管理与传统IT运维管理的差异7
5云运维管理要求8
5.1云运维管理体系概述8
5.2云运维管理业务场景(需讨论业务场景的描述方式)8
5.3云运维组织人员管理18
5.4云运维流程制度管理(需讨论对每个流程的描述方式:流程定义O、流程图、流程说明?流程图也
需统一格式)25
服务台发了到期提醒租户未反馈的,先短信自动提醒,还未处理的需提交给客服处理27
5.5运维活动考核指标(与5.4章节流程对应)(考核指标表格格式未统一)66
6云运维技术要求(需讨论数据要求的格式)76
6.1租户管理技术要求(亿阳)76
6.2云资源管理技术要求(中兴)76
6.3云监控技术要求(HP)92
6.4服务目录管理技术要求(华胜)(服务目录具有灵活的增删改能力,需要提服务设计,通过服务设计来
新增服务目录条目,服务目录的删除也需要提资源的回收等)102
6.5服务等级管理技术要求(华胜)103
6.6自动化部署技术要求(普元)103
6.7策略管理技术要求(东软)104
6.8配置管理技术要求(东软)104
6.9资源数据模型设计要求(VMware)104
6.10配置数据模型设计要求(VMware)117
6.11云监控指标体系设计要求(VMware)119
7云运维数据采集要求(泰岳)(参见《CUS_ITSM_03」T服务管理支撑平台接口规范VL0(送审稿)》)..145
7.1业务数据采集接口技术要求145
7.2数据采集性能要求146
7.3同步接口要求147
7.4与laaS平台接口168
7.5与PaaS平台接口190
7.6与SaaS平台接口193
7.7与短信网关接口201
7.8与网管系统接口201
7.9与计费系统接口201
1范围
2规范性引述文件
3缩略语和术语
3.1缩略语
缩略语英文全称中文含义
APIApplicationProgrammingInterface应用程序编程接口
laaSInfrastructureasaservice基础设施即服务
ITInformationTechnology信息技术
PaaSPlatformasaservice平台即服务
PRMPartnerRelationshipManagement合作伙伴关系管理
SaaSSoftwareasaservice软件即服务
SOAServiceOrientedArchitecture面向服务的体系架构
3.2术语及定义
术语/定义解释
基于开放的标准消息总线,用于通过标准的适配器和接口,来提供各程序和组件之
ESB间的互操作功能。它支持相互独立的异构环境中的服务、消息及基于事件的交互,
并且具有适当的服务级别和可管理性。
ETL指数据抽取、转换、装载的过程。能够按照统一的规则集成并提高数据的价值,是
负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。
laaS以服务的形式,提供计算、存储、网络等基础设施资源,用户无需购买服务器、
存储设备、网络设备,只需通过互联网租赁即可搭建自己的应用系统,帮助削
减IT基础设施的建设成本和运维成本。
PaaS以服务的形式,提供软件开发、测试、部署和运行环境,以及能力开放接口或应用
服务引擎,屏蔽软件开发底层复杂的操作,用户可以快速开发出基于云平台的高性
能、高可扩展的服务。
SaaS以服务的形式,提供各种在线软件,用户不必购买软件,只需按需租用软件。
一种新型的软件体系架构模式,它是在计算环境下设计、开发、应用、管理分散服
务单元的一种规范,它将应用程序的不同功能单元(称为服务)通过服务间定义良
SOA
好的接口和契约联系起来。可以根据需求通过网络对松散耦合的粗粒度服务进行分
布式部署、组合和使用。
云监控提供对云服务的资源监控,供用户查看资源的使用情况、运行性能等,包括了CPU
的使用率、磁盘读写和网络流量情况
云计算一种新的计算方法和商业模式,通过虚拟化、分布式处理和宽带网络等技术,按照
“即插即用”的方式,将计算、存储、网络等IT基础设施,以及其上的开发平台、
软件等服务,抽象成高效、弹性、可运营、可管理的公共信息处理资源,通过公众
通信网络,以按需分配的服务形式向用户提供动态可扩展信息处理能力和应用服
务,用户按实际使用数量进行付费在云计算下,使用者通过公众通信网络,以按需
分配的服务形式,获得动态可扩展信息处理能力和应用服务,也是电信运营商新的
信息服务产品和ICT交付模式,资源出租转化为能力出租,由自建自营到开放共赢。
云平台云平台是指云运维管理所辖的IaaS/PaaS/SaaS综合管理平台,
资源池资源池是一组物理资源或一组虚拟资源的集合,可以从池中获取资源,也可将资源
回收到池中。资源包括物理机、虚拟机、虚拟网络设备、物理网络设备和IP地址等。
4私有云运维管理体系框架
4.1私有云运维管理的概述
4.1.1私有云运维管理的范围
根据私有云计算在运维和运营方面的特点,以及管理范畴的模糊划分,
云运维管理的一体化服务支撑涵盖运营管理和运维管理两部分内容。
云运维管理一方面面向内部的云资源使用者(租户),提供云计算服务
需求受理、开通、服务计量和客户服务等服务;另一方面面向云资源管理
者和云运维工程师,提供云资源的规划、监控、调度、分配、调拨、维护
和优化建议。云运维管理的最终用户是运维管理人员及支撑人员。
本规范将聚焦于私有云运营管理及运维管理的管理要求、技术要求及
接口要求。
4.1.2私有云运维管理的用户(最终用户对象需确认)
私有云运维管理的最终用户包括内部的使用者、运维技术人员、运维
管理人员及运营支撑人员。
4.1.3云运维管理的对象
云运维管理的对象包括laaS平台、PaaS平台和SaaS平台内的所有云
资源。
云资源包括laaS层的物理资源和虚拟资源,PaaS层的数据库资源、
中间件资源和技术服务组件资源,以及SaaS的私有云应用和公有云应用
等。
由于IaaS/PaaS/SaaS综合管理平台容量规模限制及管理要求,可能
存在多个IaaS/PaaS/SaaS综合管理平台
4.1.4的云运维管理体系
云运维管理体系具有如下典型的三级部署架构:(资源池需统一画一起,
传统硬件与云运维管理之间加入IT资源管理)
对应于云运维管理体系的部署架构,其运维支撑体系也进行了三级划分,
相比较传统IT服务支撑的运维支撑体系增加了虚拟化资源池和
IaaS/PaaS/SaaS平台运维职责,同时在三线运维工程师增加了虚拟化平台
和IaaS/PaaS/SaaS平台的原厂。(传统硬件运维箭头调整到云运维处)
图4-2云运维管理体系
运维工程师设置为一线运维工程师、二线运维工程师和三线运维工程师,
职责如下:
■一线运维工程师主要负责对IaaS/PaaS/SaaS资源池以及传统硬件的
运维。云运维管理体系中一线维护人员参与的流程可参照代维对象
代维管理办法中提供的流程。
■二线运维工程师主要负责对IaaS/PaaS/SaaS平台的运维。云运维管
理体系中二线维护人员参与的流程可参照代维对象代维管理办法中
提供的流程。
■三线运维工程师完成效益提升域、系统保障域和服务管控域中的运
维管理工作。三线维护人员针对云运维管理进行维护。
4.2体系框架定位
云运维管理体系是信息化部关于建设集中化云运维管理所依据的总体
纲领,其阐述了云运维管理的管理领域和建设内容,是各组织人员在进行
云运维管理相关建设时的建设纲领和建设标准。各组织人员在进行云运维
管理建设时,在严格遵循体系要求的前提下,根据各自的管理现状进行具
体内容建设。
体系框架定义了云运维管理体系所涵盖的管理域,包括组织人员、流程
制度、技术工具、信息管控四个方面。
云运维管理体系在信息化建设架构中的定位如下图所示:
客户企业
服务
企业战略
及业务需
阂
求
信息技术
管理
企业资源:系统、人员和资金等
图4-3云运维管理体系定位
4.3体系架构管控策略
为了保障云运维管理体系最终的建设效果,切实提升信息化部的云运
维管理水平和服务质量,各组织人员在进行云运维管理体系建设时,需严
格执行以下管控策略:
■各组织人员应严格遵循本次规范的要求,保证规范内容的有效落地
■各组织人员应建立量化管控机制,通过量化管控的建设落实指标化
管理。
■建设单位要保证规范要求中的人员配套措施落实到位,要做到职责
落实到岗、落实到人。
■建设单位要充分认同实现全国一体化运维/运营的建设目标,优先
开展全国一体化运维/运营服务受理体系和服务台建设。
■各组织人员在建设过程中需保障规范中明确提出的总部信息化部管
控要求的落地实现,例如流程建设中总部信息化部参与的要求;总
部信息化部要求的管控指标等。
4.4体系框架总图
本次云运维管理体系设计,充分参考国内外运营商和互联网企业在云
运维方向上的成功建设经验和ITIL(V3)的最佳实践,采用PPIT方法论,
从组织人员、流程制度、技术工具、信息管控四个方面描述IT服务支撑
体系。具体如下:(技术工具的门户需修改成自服务门户和运维门户)
服务台
组
织
人服务管理职能公共资源管理职能运维第己方管理职能
员
运维管理团队运维支撑团队
持续优化
流
程建设分配运维
制
度
:升域服务管控域系统保障域
运维门尸
技
术运维服务管理运维需求管理资源管理
工
具资源监控管理业务监控管理资源策略管理
资源配置管理集成管理统计分析
服务价值域运维质量域
业务指标
信^^^艮务保障域―
息
管服务指标
控
数据模型
服务域人员组织域资源域
图4-4云运维管理体系框架总图
4.5体系框架特点
4.6云运维管理与传统IT运维管理的差异
5云运维管理要求
5.1云运维管理体系概述
5.2云运维管理业务场景(需讨论业务场景的描述方式)
5.2.1服务开通受理场景(普元)
5.2.1.1场景描述
在云环境下,一切可对外提供的软、硬件资源、能力等均可视为服务。
云环境下的所有服务的使用者均视为租户。当租户申请服务后,并经过审
批流程审批通过,到服务开通受理。
根据服务开通申请流程提交的申请单的详细要求,服务管理员人工进
行受理。并根据租户的需求相应派发到IAAS、PAAS、SAAS层的管理员提供
相应服务,当服务提供完成后,提交服务管理员,服务管理员验证无误后
通知提出申请的租户,标志服务开通受理完成。
5.2.1.2需求分析
服务开通受理单应明确标识IAAS、PAAS、SAAS层的需求,且经过审批
后要符合现有云平台能提供的能力,如超出现有云平台能力视为无效申请,
将不予受理,打回重新申请。
硬件资源申请:应指明几台虚拟机、是否集群、每台虚拟机的CPU、内
存、磁盘等参数。
软件平台资源申请:应指明web服务器类型及版本、中间件平台的名称
及版本、数据库的名称及版本等。
软件服务申请:应指明服务接口名称,平均调用次数,最高并发调用
及单次调用内存占用量,可能存在的并发高峰期的时间范围。
5.2.1.3解决方案
文字
服务开通受理流程
租户服务管理员云平台运维管理员
・不满足重新分配资源分配
5.2.2服务变更场景(普元)
5.2.2.1场景描述
场景一:租户发起的服务变更。
租户根据实现业务需求变化发起的服务变更。如系统上线过程中,前
期上线5个省,已经申请了5个省的服务资源,现在要全国上线,还需要再
申请其余省份的服务资源,需要发起服务变更流程。
场景二:服务提供方发起的服务变更。
由于最终用户的需求发生变更,导致原有的服务接口中参数要发生变
化。如财务系统与银行系统对接,由于银行系统实行全国统一规范,导致
服务接口变化,从而导致财务系统的服务接口变化,需要发起服务变更流
程。
52.2.2需求分析(缺乏场景二的需求分析)
场景一:
租户提交变更申请单,包含两部分:一是租户要变更的服务的现状说
明,需要给租户提供已经定购的服务列表,租户可以在列表中选择相应的
服务,点击可展示定购服务的全部信息,二是变更后的服务需求,两部分
要同时提交。
变更申请单的内容也要明确标识IAAS、PAAS、SAAS层的现状及需求。
服务管理员在接受变更后,可自动转派到云IAAS、PAAS、SAAS的各层
云运维管理员,各层云系统应与管理平台建立自动配置接口或流程贯通。
5.2.2.3云运维管理解决方案
5.2.3服务撤销场景(普元)
5.2.3.1场景描述
在云环境下,系统由于实际业务变更,已经定购的服务不再需要,需
要对已经使用的服务进行撤消,因此由租户发起服务撤消流程。
5.2.3.2需求分析
服务撤消流程需要由租户发起对已经定购的服务发起撤消的流程。需
要给租户提供已经定购的服务列表,租户可以在列表中选择相应的服务,
点击可展示定购服务的全部信息,并从这发起服务撤消申请。
5.2.3.3云运维管理解决方案
服务撤消流程
租户服务管理员云平台运维管理员
渔务撤消前'
胆\
请,单
<1
、r
做E11
职
1
服务与殳源回
回收不正确A收,力口入资
源库
3
1-■tefr、恺亡击日不E
雷
/验证•撤消]
(
5.2.4资源稽查场景(泰岳)
5.2.4,1场景描述
子场景与过程描述对应角色
A:定制数据一致性、完整性、规范性资源数据稽核;
资源数据有效性稽核资源管理员
B:资源数据可用率稽核
分配的资源长时间闲置资源管理员
分配的资源利用率过低资源管理员
在资源池忙闲时分配不均,资源池利用率资源管理员
过低
资源使用情况不均资源管理员
A、定制数据一致性、完整性、规范性资源数据稽核
1、资源数据有效性稽核,在云资源管理的日常活动中对相关资源信
息进行校验核查,发现差错后,触发资源核查流程进行纠正,从而
保证资源数据质量。
B、资源数据可用率稽核
1、分配的资源长时间闲置:通过监控系统提供的资源报表查看分配
资源数据使用情况;
2、分配的资源利用率过低,系统定义资源利用率阈值,当分配的资
源利用率低于阈值,则分配的资源利用率过低;
3、在资源池忙闲时分配不均,资源池利用率过低:例如分配的资源
池资源数据在白天时不够用,在夜晚时候资源过剩的情况;
4、资源使用情况不均:有的系统使用资源过高,有的系统使用资源
数据过低;
5.2.4.2需求分析
资源管理员通过监控系统提供的资源报表查看资源使用不均的情况,
申请资源重新分配,资源评审人员收到申请后评估是否可行,如果通过审
核,转向租户审核,租户审核通过后,系统进入资源分配子流程。
•通过定制数据一致性、完整性、规范性、资源数据使用率核查规则,
在云资源管理的日常活动中对相关资源信息进行校验核查,发现差
错后,触发资源核查流程进行纠正,从而保证资源数据质量。
•资源数据稽核包括数据有效性检查、数据格式检查、数据使用率检
查等。资源数据稽核应该包含资源数据入库前数据验证、入库后数
据核查功能、云运维管理中资源数据与IaaS/PaaS/SaaS综合管理平
台实际运行资源稽核等。
5.2.4.3解决方案
■资源数据稽核触发方式应能够支持以下两种:
>即时判断,主要针对用户手工录入或者通过文件批量导入以及自动
采集的资源数据进行数据格式和有效性校验检查;
>手工触发或定期自动检查云运维管理与IaaS/PaaS/SaaS平台的数据
一致性检查,可以根据资源类型而确定选择范围,同时选定稽核规
则。检查过程中,将发现的错误记录下来。
>资源利用率核查,
■资源稽核规则定义
根据核查规则对资源数据进行核查,并提供对核查规则的制定和查看功能。
核查规则包括但不限于以下规则,需满足用户提供的多种核查规则:
>固定值比较:比如某类资源的某个属性大于或小于某个固定值或在
某个范围内的核查规则。
>属性值比较:比如某类资源的某个属性和其他属性的比较规则。
>数据格式合法性:比如日期的格式不正确、没有按照规定的格式填
写特殊的字符串,应该是数字的填写了字符、应该填写日期的地方
填写了数字、必填项为空等合法性核查规则。
>资源关系一致性:比如某类资源的某属性和其他资源的某属性需要
一致的核查规则。
>数据一致性比对管理:云运维管理中的资源数据与IaaS/PaaS/SaaS
综合管理平台实际运行的资源一致性比对
■数据稽核结果处理
>系统要根据资源核查报告,提供交互式操作支持,对核查出来的差
错应生成核查报告或报表,同时通过告警通知方式统一由云运维管
理的通知模块通知laaS/PaaS/SaaS综合管理平台管理人员。
>对于一致性检查结果,支持自动或手工纠正。对于自动纠正,系统
应能定制纠正规则,默认以IaaS/PaaS/SaaS综合管理平台数据为准。
>系统可以支持按以下几种方式供用户查看核查结果:日志、核查报
表、主动提醒。
5.2.5资源纳管场景(泰岳)
5.2.5.1场景描述
子场景与过程描述对应角色
A:定义IaaS/PaaS/SaaS综合管理平台ID编号规则
编制资源纳管策略,为新建的云运维工程师
IaaS/PaaS/SaaS综合管理平台分配唯一标
识的平台ID编号
B:定义规范化审计流程
对新纳管的IaaS/PaaS/SaaS综合管理平台运维管理人员
下发云平台配置管理
对新纳管的IaaS/PaaS/SaaS综合管理平台运维管理人员
进行资源配置审计
对资源配置审计未通过的新纳管运维管理人员
IaaS/PaaS/SaaS综合管理平台提出资源配
置整改要求
C:定义下发的运维管理要求
根据新纳管IaaS/PaaS/SaaS综合管理平台云运维工程师
资源信息,更新资源管理信息
A、定义IaaS/PaaS/SaaS综合管理平台ID编号规则
编制资源纳管策略,为新建的IaaS/PaaS/SaaS综合管理平台分配唯一
标识的平台ID编号
B、定义规范化审计流程
1、对新纳管的IaaS/PaaS/SaaS综合管理平台下发云平台配置管理
2、对新纳管的laaS/PaaS/SaaS综合管理平台进行资源配置审计
3、对资源配置审计未通过的新纳管IaaS/PaaS/SaaS综合管理平台提出
资源配置整改要求
C、定义下发的运维管理要求
1、根据新纳管IaaS/PaaS/SaaS综合管理平台资源信息,更新资源管理
信息。
5.2.5.2需求分析
将新建的IaaS/PaaS/SaaS综合管理平台纳管(注册)到云运维管理,
为新建IaaS/PaaS/SaaS综合管理平台分配平台ID,通过下发云平台配置管
理要求、审计资源配置、下发运维管理要求、更新资源管理信息后,完成
对新纳管资源整体管控的整个过程。
系统支持一些功能:
1、分配IaaS/PaaS/SaaS综合管理平台ID;
2、下发云平台配置管理要求;
3、审计资源配置;
4、下发运维管理要求;
5、更新资源管理信息;
5.2.5.3云运维管理解决方案
资源纳管的功能要求如下:
■应能够根据资源纳管策略,为新建的IaaS/PaaS/SaaS综合管理平台
分配唯一标识的平台ID编号;
■应能够对新纳管的IaaS/PaaS/SaaS综合管理平台下发云平台配置管
理要求;
■应能够对新纳管的IaaS/PaaS/SaaS综合管理平台进行资源配置审计;
■应能够对资源配置审计未通过的新纳管laaS/PaaS/SaaS综合管理平
台提出资源配置整改要求;
■应能够对新纳管IaaS/PaaS/SaaS综合管理平台下发运维管理要求;
■应能够根据新纳管IaaS/PaaS/SaaS综合管理平台资源信息,更新资
源管理信息。
资源纳管的技术要求如下:
■定义IaaS/PaaS/SaaS综合管理平台ID编号规则;
■定义规范化审计流程;
■定义下发的运维管理要求。
5.2.6资源优化场景(亿阳)
5.2.6.1场景描述
在资源池内运行的应用系统,经常出现部分应用负载过低,导致严重的
资源浪费,同时某些核心应用时常资源进行或因为系统宕机导致业务中断
的情况。
5.2.6.2需求分析
资源池内包括多种硬件资源和不同的虚拟化平台,资源优化是为了上层
所有应用得到更好地支撑,实现业务应用稳定运行的同时避免资源的浪费。
5.2.6.3云运维管理解决方案
在资源池内,将硬件(服务器、存储等)、虚拟化平台按照产品品牌分
类,如下:
服务器分类如:IBM服务器、HP服务器、戴尔服务器、华为服务器等。
根据性能和故障率的统计信息将服务器分为不同等级。
虚拟化平台分类:如Vmware平台、Citrix平台、KVM平台等。通过根据
性能和稳定性的统计信息将其分为不同等级。
通过综合上述统计,管理员可设定基于不同的硬件+虚拟化平台组合的
应用运行环境的等级。例如IBM+Vmware为一等运行环境、IBM+KVM为二等以
此类推。用户可根据自己业务的重要性为核心业务申请较高等级的资源,
边缘业务申请较低等级的资源,从而达到资源优化的效果。
5.2.7资源回收场景(东软)
5.2.7.1场景描述
5.2.7.2需求分析
5.2.7.3云运维管理解决方案
5.2.8服务计量场景(东软)
5.2.8,1场景描述
5.2.8.2需求分析
5.2.8.3云运维管理解决方案
5.2.9故障排查及处理场景(华胜)
5.2.9,1场景描述
5.2.9.2需求分析
5.2.9.3云运维管理解决方案
5.3云运维组织人员管理
5.3.1服务经理(亿阳)
5.3.1.1职责
服务经理的职责包括:监督管理服务管理员,并对服务管理员提交上来
的服务申请或变更申请做最终的审批。
5.3,1.2活动
服务经理的活动主要包括:
■服务管理员的人员以及权限设定
■服务变更最终审批:由服务管理员提交,初级变更审批由服务管理
员完成,服务经理负责最终审批(高级)
■SLA需求申请审批(高级),由服务管理员提交,初级初级SLA申请由
服务管理员完成,服务经理负责最终审批(高级)
5.3.2服务管理员(亿阳)
5.3.2.1职责
服务管理是整个平台的核心管理层,服务管理员负责指导资源管理员并
保证云平台为用户和应用提供可靠的服务支撑。职责包括:用户管理、订
单管理、资源模板管理、服务报表、服务变更管理、系统状态监控、在线
客服、安全管理、用户备案信息管理等相关门户应用。
5.3.2.2活动
服务管理员的活动包括:
■提供基于用户或业务的服务统计报表
■用户的订单和变更单(初级)的审批和投诉建议处理
■提供SLA报表和SLA需求申请审批(初级)
■资源优化的发起
5.3.3资源管理员(亿阳)
5.3,3.1职责
资源管理员的职责是根据服务管理员的需求,管理资源池内的所有资源,
确保资源对应用的良好的支撑。资源是在云服务中所包含的,可用于服务
用户的各类有形和无形资源。资源的类型包括虚拟机、X86物理机、虚拟机
备份、对象存储、块存储、网络带宽、公网IP地址以及云监控等。
5.3.3.2活动
资源管理员的活动主要包括:
■资源池内物理设备以及虚拟机的健康状况的维护,如使用率,负载
等
■资源纳管:资源池内新添设备,老旧设备淘汰等
■资源优化:记录资源的使用情况,对不同的设备、品牌、虚拟化平
台的故障率做统计,推荐最优资源优化方案
5.3.4变更经理(亿阳)
5.3.4.1职责
变更经理全面负责变更管理流程中的所有具体活动执行,保障所有变更
依照预定流程顺利执行。通常由具有决策权的人员担任。
5.3.4.2活动
■帮助变更管理员协调必要的变更时间、人员等方面的协调工作
■审批变更请求,确保只有授权和必要的变更才被实行,并使该种变更
影响最小化
■成立变更咨询委员会,并领导和主持变更咨询委员会
■定期召开变更会议,回顾变更
■参与流程评估,对流程改进提出意见和建议,与流程负责人共同制定
流程改进建议
5.3.5变更管理员(亿阳)
5.3,5.1职责
变更主管通常由与变更请求内容相关的具体技术领域的负责人或直接
变更处理人担任。可以根据不同的变更种类,分派不同的人员作为变更主
管。变更主管主要关注在实施方案、详细实施计划等方面。
5.3,5.2活动
■检查由变更申请人提交的每一个变更请求,检查变更的正确性和必要
性,必要时拒绝无关、无法实施或没有必要的变更请求。
■确定和检查变更请求的分类、变更时间要求、分析风险等。
■作为具体变更的项目经理,负责领导变更的构建/测试,实施和参与
回顾。
■制定变更实施计划、测试计划、回退计划等。
■针对具体变更请求,评估并分派相应资源。
■确保变更在预定的时间,资源和成本内完成。
■在必要时,确保回退计划得以正确实。
■负责收集与该变更有关的部门或小组的意见,综合变更对于应用的影
响。
5.3.6变更咨询委员会(亿阳)
5.3.6.1职责
变更咨询委员会是IT组织中对变更进行评估和决策、批准或者拒绝某个
变更请求的虚拟组织,帮助变更经理进行变更决策。
5.3.6.2活动
■针对具体变更请求,评估潜在影响和风险。
■协助变更经理对变更做出审批、决策。
■参加变更咨询委员会会议。
■回顾失败的变更,以确保今后不再发生类似情形。
■回顾已成功执行的重大变更,确保满足变更的目的。
■对流程改进提出意见和建议。
5.3.7租户(亿阳)
5.3.7.1职责
租户是指一个正在使用云平台所提供服务的个人、部门或的企业合作伙
伴。租户的职责是根据自己的业务需求向云平台提出资源的使用申请或使
用已申请的资源。服务申请以订单的形式提交给服务管理员。
5.3.7.2活动
租户的活动主要包括:
■服务申请的发起:根据自身业务的需求请求服务申请
■服务变更的发起:根据业务负载变化发起服务变更
■SLA管理的发起:向服务管理员提供SLA管理申请
■故障申告的发起:如遇故障着则发起故障申告和投诉建议
■使用咨询的发起:向服务管理员提出咨询请求
5.3.8服务提供者(亿阳)
5.3,8.1职责
服务提供者根据对租户需求的调研,设定各类服务。租户和资源池之间
通过服务提供者建立订购关系。
服务提供者的职责主要包括:
■调研租户需求,根据业务或用户需求制定服务模板并制定服务计量
计费
■承上启下,根据服务管理来制定资源管理规范
5.3.8.2活动
服务提供者的活动包括:
■租户所能看到的服务类型的定义
■租户订单请求相应
■租户的服务变更初级审批
5.3.9租户管理员(亿阳)
5.3,9.1职责
租户管理员的职责主要包括:租户的完整生命周期管理以及状态查询和
修改。
5.3.9.2活动
主要活动租户注册、租户注销、修改租户信息、修改密码、密码重置、
设置用户状态、查询用户信息、补充用户资料等用户管理相关功能。
5.3.10服务台接线员(亿阳)
5.3.10.1职责
负责接收所有的事件,对事件进行初步的处理,并根据实际情况将事件
分派到合适的云运维管理工程师或业务系统运维管理工程师。
5.3.10.2活动
■负责24X7的值班和系统监控
■响应客户投诉、热线电话、邮件、传真等事件报告
■完整记录所有接收的事件信息,包括:记录事件报告人的详细联系方
式、事件特征表现、描述、发生时间等
■为事件进行适当的分类、为事件分配优先级等属性
■尝试使用工具、初步诊断、分析相关信息等方式解决问题
■将事件分配给最合适的云运维管理工程师处理
■检查事件记录的处理进度,保持与事件报告人的联系,适时通知事件
处理进展
■与用户确认事件解决方案,关闭事件
5.3.11云运维管理工程师(亿阳)
5.3.11.1职责
云运维管理工程师负责对服务台无法解决的事件进行快速有效的分析,
提出解决方案以尽快恢复服务,并在必要时提供现场支持。
5.3.11.2活动
■验证事件的描述和信息,进一步收集相关信息
■进行深入调查研究或协调厂商支持,提供有效的解决方案
■实施事件解决方案
■更新事件解决信息,已解决的事件转回服务台
5.3,12业务系统运维管理工程师(亿阳)
5.3.12.1职责
业务系统运维管理工程师是相关问题领域的专家。负责提供对云运维管
理工程师无法解决的问题进一步进行调研,找出解决方案并尽快恢复服务。
5.3.12.2活动
■验证事件的描述和信息,进一步收集相关信息
■进行深入调查研究或协调厂商支持,提供有效的解决方案
■实施事件解决方案
■更新事件解决信息,已解决的事件转回服务台
5.3.13运维经理(亿阳)
5.3,13.1职责
根据需要在系统中制定作业计划。
5.3.13.2活动
作业计划的制定。
5.3.14运维管理员(亿阳)
5.3,14.1职责
对作业计划进行审批,同时对作业计划执行的结果进行审核;并负责的
值班调度工作。
5.3.14.2活动
■审批作业计划
■定期安排值班工作
■对值班人提出的班次调度进行审核确认
■通过值班日志以及值班作业计划记录定期检查值班人员的工作情况
■对值班过程中所遇到的问题进行协调
5.3.15审计员(亿阳)
5.3.15.1职责
审计员的职责是对云平台中相关资源的操作行为进行审计跟踪分析和
监督检查,以及时发现违规行为。
定期分析相关业务操作人员业务处理过程日志文件,定期检查运维记录,
对可疑的信息进行审计和跟踪控制,发现违规活动即时向运维负责人进行
汇报。
审计员定期提交审计报告。
5.3.15.2活动
资源审计合规检查
5.3.16优化咨询委员会(亿阳)
5.3,16.1职责
优化咨询委员会的职责是对资源池内的资源优化方案的评估。委员会成
员由资源管理员、服务管理员、服务经理、应用维护人员以及其他云计算
专家组成。资源管理员或服务管理员通过对系统的运维和监控提出资源的
优化方案并提交给优化咨询委员会。
5.3.16.2活动
优化咨询委员会的就已提出的优化方案进行评估和审批,决定是否采用
特定的优化方案。
5.4云运维流程制度管理(需讨论对每个流程的描述方式:流程定义()、
流程图、流程说明?流程图也需统一格式)
5.4.1用户服务域
5.4.1.1服务申请类(普元)
5.4.1.1.1标准化服务申请流程
5.4.1.1.1.1流程定义
5.4.1.1.1.2流程图
(定义角色:租户申请(经过租户领导审批的申请)、系统判断资源是否符合
需求?返回成功或失败信息,一个判断,成功返回开通成功,失败通知租
户。)
5.4.1.1,1.3流程说明
(需由系统管理员设定一个阈值,超过阈值走工单申请)本流程只适用于
小批量申请,大批量走工单申请,系统可配置。
租户申请为经过租户领导审批的申请,属于线下流程,系统外流程。)
5.4.1.2服务变更类(普元)
5.4.1.2.1服务延期申请流程
5.4.1.2.1.1流程定义
5.4.1.2.1.2流程图
人员:租户申请(通过租户领导审批过的申请),云平台更新客户信息,
返回延期申请成功信息。
服务延长申请流程
租户服务台
租户提交经租户领
导审批过的延长服
务申请单
5.4.1.2.1.3流程说明
服务台发了到期提醒租户未反馈的,先短信自动提醒,还未处理的需
提交给客服处理
租户延期申请为经过租户领导审批的申请,属于线下流程,系统外流
程。
租户只有在满足提交申请条件下才能启动服务延期申请流程。
此流程只有在服务期内才能生效。
5.4.1.2.2资源变更流程
5.4.1.2.2.1流程定义
5.4.1.2.2.2流程图
人员:租户变更申请(通过租户领导审批过的变更申请),云平台更新客
户信息,返回变更申请成功信息。(此图需修改)
5.4.1.2.2.3流程说明
无
5.4.1.2.3服务撤销流程
5.4.1.2.3.1流程定义
5.4,1.2,3,2流程图
人员:租户发起(经过租户领导审批的申请)云平台更新客户信息,进
入资源回收子流程,返回服务撤销成功信息。
服务撤销流程
租户服务台
f开始;
一—
租户提交经租户领
导审批过的服务撤
销申1请单
资源回收
*
更新租户服务信息
更新资源库
服务撤销成功
C结束
5.4.1.2.3.3流程说明
服务撤销支持立即撤销和预约撤销,未到预约撤销时间租户可以取消该预
约撤销申请。
5.4.1.3SLA服务开通及变更流程(亿阳)
5.4.1.3.1流程定义
5.4.1.3.2流程图
人员:服务经理申请、服务管理员设计、反馈给服务经理结束。
5.4.1.3.3流程说明
5.4.1.4投诉处理流程(华胜)
5.4.1.4.1.1流程定义
5.4.1.4,1.2流程图
人员:租户发起,服务台接线员启动工单流转到故障处理流程,反馈处理
结果
5.4.1.4.1.3流程说明
投诉处理分技术类和非技术类,技术类流转到故障处理流程,非技术
类由接线员参见相关客服规则进行处理。
5.4.1.5建议流程(华胜)
5.4.1.5,1.1流程定义
5.4.1.5.1.2流程图
人员:租户发起(按建议类别),服务台接线员定期导出技术类建议,转
交给建议处理流程。
5.4.1.5.1.3流程说明
服务台接线员定期对租户技术类建议导出,建议分技术类和非技术类,
技术类流转到建议处理流程,非技术类由接线员参见相关客服规则进行处
理。
5.4.2效益提升域
5.4.2.1资源识别类(泰岳)
5.4.2.1.1资源稽核流程
5.4.2.1.1.1流程定义
资源稽核是指资源管理员通过监控系统提供的资源报表查看资源使用
不均的情况,申请资源重新分配,资源评审人员收到申请后评估是否可行,
如果通过审核,转向租户审核,租户审核通过后,系统进入资源分配子流
程。
5.4.2.1.1.2流程图
人员:资源管理员、资源经理,租户
5.4.2.1.1.3流程说明
资源管理员通过监控系统提供的资源报表查看资源数据,分析资源分配
不均的情况;
5.4.2.1.2资源纳管流程
5.4.2.1,2.1流程定义
资源纳管是指将新建的IaaS/PaaS/SaaS综合管理平台纳管(注册)到
云运维管理,为新建IaaS/PaaS/SaaS综合管理平台分配平台ID,通过下发
云平台配置管理要求、审计资源配置、下发运维管理要求、更新资源管理
信息后,完成对新纳管资源整体管控的整个过程。
5.4,2.1,2,2流程图
人员:资源管理员发起资源纳管、资源经理审批、返回资源管理员进行纳
管
资源纳管流程
运维管理人员云运维人员平台建设项目经理
否更新资源库数据信
息
5.4.2.1.2.3流程说明
1、平台项目经理申请资源纳管;
2、运维管理人员审核通过后,由云运维工程师分配IaaS、PaaS、SaaDID;
3、云运维工程师给平台项目经理下发配置管理要求;
4、平台项目经理执行平台配置;
5、云运维工程师审计配置;
6、云运维工程师更新资源库数据信息;
5.4.2.2服务目录管理流程(HP)
5.4.2.2.1服务目录创建
5.4.2.2.1.1流程定义
5.4.2.2.1.2流程图
人员:服务经理发起,服务管理员执行(创建服务目录id),服务管理员
反馈给服务经理结果,服务经理定义计量,进入服务计量子流程。
5.4.2.2.1.3流程说明
5.42.2.2服务目录删除
5.42.2.2.1流程定义
5.4流程图
人员:服务经理发起,服务管理员执行(删除服务目录id),服务管理员
反馈给服务经理结果。
5.42.2.2.3流程说明
5.4.2.3服务计量流程(东软)(待讨论)
5.4.2.3,1.1流程定义
5.4.2.3.1.2流程图
人员:服务经理
5.4.2.3.1.3流程说明
5.4.2.4资源回收流程(东软)
5.4.2.4.1.1流程定义
5.4.2.4.1.2流程图
(服务撤销流程-启动资源回收-回收网络资源/计算资源/存储资源/软件
资源-结束)没涉及人员,只画流程图,平台自动完成。
5.4.2.4.1.3流程说明
两种情况触发资源回收:1,服务到期,资源自动回收;2,租户主动
撤销,发起资源回收申请。
服务撤销触发资源回收流程,资源回收成功之后,服务撤销成功。
5.4.2.5合规审计流程(泰岳)
5.4.2.5.1流程定义
5.4.2.5.2流程图
人员:去掉运维系统负责人,其他人员保留
5.42.5.3流程说明
运维管理人员线下得到合规要求,定义合规规则。
、合规规则参考如下:
1、服务器合规
♦根据系统内置的业界审计规范定义巡检策略或通过脚本能够实现业
界规范的巡检策略。
♦能够更新和输入国际规范的合规审计信息和策略(包括:
PCICIS,HIPAA等)o
♦根据业界审计规范定义巡检策略进行系统巡检或通过相关脚本实现。
・审计功能配置
o审计功能的开启
。所有信息事件配置
。所有用户审计
O审计数据的安全保护
oSyslog的运行与配置安全
♦检查当前服务器是否满足业界审计规范的要求。
♦出具相关的合规报表
2、网络设备合规
♦根据系统内置的业界审计规范定义巡检策略或通过脚本能够实现业
界规范的巡检策略
♦出具相关的合规报表
3、操作审计
1)功能定义
a)审计分类
对审计信息进行分类处理,审计内容包括认证、授权、登录/登出、
访问等内容。
b)审计分级
根据审计信息的严重程度进行分级,审计内容包括严重、警告、一般
等内容。
c)审计过滤
根据定义的过滤规则,对审计信息进行过滤,便于分析和展现,过滤
的属性,审计内容包括时间、帐号、操作类型、操作名称等内容。
2)功能要求
♦所有的操作要有详细的审计记录(包括命令行操作记录和作业
记录)
♦认证审计:认证日志由认证平台提供,当用户进行认证时,记
录认证日志;
♦授权审计:授权管理日志由帐号管理平台提供,当帐号被授权
和被清权时,记录操作日志;
♦登录/登出审计:登录记录由认证平台提供,当用户登录运维门
户时,记录登录日志;
♦访问审计:运维门户提供集成云运维管理功能模块的访问资源,
运维门户所有的页面提供审计的配置。
♦审计功能配置
>审计功能的开启
>所有信息事件配置
>所有用户审计
>审计数据的安全保护
>Syslog的运行与配置安全
5.4.2.6资源优化流程(亿阳)
5.4.2.6.1流程定义
5.4.2.6.2流程图
人员:当租户的资源达到资源优化触发条件时,系统向资源管理员推送资
源优化消息,资源管理员查看资源利用率统计报表,判定是否正常,若不
正常,上报服务管理员,服务管理员根据策略和实际情况,判定是否向租
户下发资源优化建议。
5.4.2.6.3流程说明
5.4.3系统保障域
5.4.3.1故障处理类(华胜)
5.4.3.1.1重大故障及安全事件上报流程
5.4.3.1.1.1流程定义
5.4.3.1.1.2流程图
人员:服务台传送故障工单给运维工程师及运维管理人员,运维工程师判
定是否能独立处理,是则运维工程师处理故障并将处理结果上报给运维管
理人员,否则走技术支援流程,获取处理结果上报给运维管理人员。
重大故障及安全事件上报流程
5.4.3.1.1.3流程说明
5.4.3.1.2技术支援流程(亿阳)
5.4.3.1.2.1流程定义
本流程适用于运维工程师在面对不能解决的疑难故障处理、参数设置、
投诉处理等情况时向技术支援人员寻求指导的场景。
5.4.3.1.2.2流程图
5.4.3.1.2.3流程说明
流程活流程活输入信息输出信息
动名称动说明部室/角信息名部室/信息名称
色称角色
在故障处理
过程中面临
发现重重大或者技术支
的重大、疑难运维工程技术支援
大、疑难疑难故障援申请
故障处理、参师工单
故障信息人
数配置等情
况。
确认受理
接收到相应
技术支援
的技术支援技术支援技术支援技术支技术支援
工单
工单,提供支专家工单援专家工单
进行技术
持服务。
支援工作
通过提供技
术支援服务
确定故障是
否消除。
技术支
是:确认并分
援专
析故障解决技术支援技术支援技术支援
能否解决家;
方案。专家工单工单
设备厂
否:对于各专
家
业技术支援
组解决不了
的问题,触发
技术支援流
程,申请设备
厂家进行处
理。
集团技
集团技术
提出对于该术支援
提出解决支援专技术支援技术支援
问题的解决专家;
方案家;工单工单
方案。设备厂
设备厂家
家
各专业技术
支援专家整
确认并分理集团或设区技术
技术支援技术支援技术支援
析故障的备厂家反馈支援专
专家工单工单
解决方案的故障解决家
方案支持故
障解决。
对故障处理技术支
故障处理运维工程技术支援技术支援
确认业务是援申请
确认师工单工单
否恢复。人
专家的技术
技术支
支援是否解运维工程技术支援技术支援
是否解决援申请
决了存在的师工单工单
人
问题。
技术方案入技术支援
运维工程技术支援技术支
知识库。工单人知
入知识库师工单援专家
识库
5.4.3.2维护变更请求流程(中兴)
维护变更请求流程,是对通过初验上线运行的相关系统单一层级进行的
维护变更请求(如:软件(含补丁)升级、硬件更新、网络调整、系统参数修
改),通过标准、统一的方法和步骤来管理和控制的过程。包括变更请求申
请、变更请求审批及变更请求实施等环节。
维护变更请求
5.4.3.3日常运维类(中兴)
5.4.3.3.1作业计划流程
作业计划流程
运维工程师运维管理人员
结束
5.4.3,3,2值班管理流程
5.43.3.3知识库管理流程机房施工申请流程
5.43.3.4机房施工申请流程
5.43.3.5IT机房设备申请流程
IT机房设备申请流程
运维工程师运维管理人员
结束
5.4.3.3.6基线检查流程
5.43.3.7数据备份管理流程
5.4,3.3.8设备巡检流程
5.4.3.4应急预案流程(中兴)
应急预案管理流程,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 福建省福州市台江区重点名校2026年初三下学期质量调研考试(一模)语文试题含解析
- 安贞医院观光电梯钢结构施工方案剖析
- 湖北省华中学师大一附中2025-2026学年初三下学期第二次调研语文试题试卷含解析
- 传统文化教育的课程化路径
- 夜间施工方案措施(3篇)
- 地勘施工方案变更(3篇)
- 堤防破除施工方案(3篇)
- 半包墙体施工方案(3篇)
- 应急管理预案系统(3篇)
- 开盘仪式应急预案(3篇)
- 2024秋期国家开放大学专科《民事诉讼法学》一平台在线形考(任务1至5)试题及答案
- 核电厂常规岛施工图设计文件内容深度规定 第9部分:水工工艺
- 2024建筑施工拉杆式悬挑脚手架安全技术规程
- 2024详解新版《公司法》课件
- 工伤知识与工伤预防培训
- 微机电惯性导航系统测试方法
- 屈原【六幕话剧】郭沫若
- 全球十大环境问题课件
- CJJ-T 135-2009 (2023年版) 透水水泥混凝土路面技术规程
- 人民日报金句摘抄
- 阳明计米器mc-262说明书
评论
0/150
提交评论