某公司业务支持系统运行维护管理平台业务技术规范(DOC 79页).doc_第1页
某公司业务支持系统运行维护管理平台业务技术规范(DOC 79页).doc_第2页
某公司业务支持系统运行维护管理平台业务技术规范(DOC 79页).doc_第3页
某公司业务支持系统运行维护管理平台业务技术规范(DOC 79页).doc_第4页
某公司业务支持系统运行维护管理平台业务技术规范(DOC 79页).doc_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国联通业务支持系统(BSS)运行维护管理平台业务技术规范(讨论稿)中国联通2004年6月目 录1. 总体概述11.1 行业背景11.2 系统现状分析11.3 编制目的21.4 适用范围21.5 起草单位21.6 解释权21.7 参考文献22. 建设目标及原则32.1 建设目标32.1.1 近期目标32.1.2 远期目标32.1.3 建设规划42.2 建设原则53. 系统总体结构63.1 系统定位以及与现有网管系统之间的关系63.1.1 系统定位63.1.2 与现有网管系统之间的关系63.2 系统组织结构73.3 系统体系结构83.3.1 数据层93.3.1.1 监控数据93.3.1.2 管理数据103.3.1.3 系统数据103.3.1.4 文档数据103.3.2 功能层103.3.3 接入展现层133.4 与外部系统之间的关系134. 业务功能与流程154.1 各模块之间的关系154.2 岗位与角色描述154.2.1 岗位描述154.2.2 角色描述164.3 业务功能描述184.3.1 服务支持184.3.1.1 服务台184.3.1.2 事件管理204.3.1.3 问题管理244.3.1.4 变更管理274.3.1.5 配置管理304.3.1.6 日常运维管理334.3.1.7 供应商管理344.3.1.8 知识库管理354.3.2 系统监控384.3.2.1 监控台384.3.2.2 性能管理384.3.2.3 告警管理404.3.2.4 配置处理464.3.3 系统管理485. 系统技术要求505.1 总体技术要求505.1.1 应用软件505.1.2 数据要求515.1.3 性能要求515.1.4 开发工具515.2 统计报表525.3 拓扑展现525.3.1 拓扑的生成方式525.3.2 技术要求535.4 工作流535.5 安全管理565.5.1 对安全管理的统一维护565.5.2 运维管理平台的安全性565.6 数据采集575.6.1 数据源类型575.6.2 数据采集要求575.6.3 数据预处理586. 系统接口596.1 接口原则596.2 服务支持与系统监控的接口606.2.1 接口定义606.2.2 接口方式606.2.3 接口要求606.2.4 接口内容606.3 与业务应用系统的接口626.3.1 接口定义626.3.2 接口方式626.3.3 接口策略626.3.4 接口要求636.3.5 接口内容636.4 与系统平台的接口636.4.1 接口定义636.4.2 接口方式636.4.3 接口要求646.4.4 接口内容646.5 两级运维系统间的接口646.5.1 接口定义646.5.2 两级接口文件命名规则及相关约束656.5.2.1 文件命名规则656.5.2.2 回执文件格式约定656.5.2.3 错误信息说明666.5.3 上传关键业务指标686.5.3.1 接口定义686.5.3.2 接口实现686.5.4 工单信息的传递706.5.4.1 接口定义706.5.4.2 接口实现716.5.5 知识库信息传递726.5.5.1 接口定义726.5.5.2 接口实现736.5.6 上传统计报表736.5.6.1 接口定义736.5.6.2 接口实现746.6 与其他系统的接口746.6.1 接口定义746.6.2 接口实现741. 总体概述1.1 行业背景当今通信市场正由传统的以通信网为中心的服务质量的竞争转变成以客户为中心的服务质量的竞争,中国联通为了适应市场竞争的变化,必须建立以客户服务为中心的服务机制。综合电信业务支撑系统在中国联通公司的整体运营中起着至关重要的支撑作用,因此在监控业务支撑系统硬件和系统软件的基础上还应对各业务应用系统进行监控,通过对各业务应用系统的整个处理流程进行监控,掌握各业务系统的运行状况。同时,运维管理应逐步实现从被动服务到主动发现系统中存在的问题,变被动为主动,以流程贯穿整个运维管理过程;减少运维人员的劳动强度,提高效率,切实保障各业务支撑系统可靠、稳定、高效地运行,进一步提高用户的满意度和忠诚度,全面提升中国联通的服务质量。1.2 系统现状分析中国联通公司是目前国内电信业务最多的综合性电信业务运营商,经营着GSM、CDMA、市话、互联网等业务。在中国联通的统一规划和领导下,建设了各省综合电信业务支撑系统。综合电信业务支撑系统是一个包括众多子系统的复杂系统,需要对各业务子系统的硬件及软件平台进行管理,保障各业务子系统的正常运行。而各业务子系统在建设过程中有的考虑了网管监控有的没有考虑,后来进行了网管与网络安全工程的建设实现对各业务子系统的管理,因此在系统中可能存在多个网管工具,对不同的系统维护需要到不同的管理平台上进行处理,大多数只能对硬件平台(网络、主机等)和系统软件(数据库、中间件等)进行监控,不能对各业务子系统进行监控(或者只能监控到应用系统是否在运行状态下而不能监控其运行效率)。同时各省缺乏对业务子系统处理流程的监控,监控手段和效率较低,因此需要在原有网管系统的基础上进行完善,引进先进的IT管理方法和手段,提高整体运维水平。1.3 编制目的中国联通制定本业务支持系统运行维护管理平台(以下简称BSS运维管理平台)业务技术规范,主要用来规范指导中国联通各省分公司运行维护管理平台的建设。1.4 适用范围本业务技术规范是中国联通业务支持系统运行维护管理平台规划与建设的基本依据。中国联通各省分公司应依照本业务技术规范,结合本地实际情况进行规划和建设本省BSS运维管理平台。1.5 起草单位本业务技术规范的起草单位为中国联通有限公司,由中国联通有限公司计费、结算与信息系统部进行管理。1.6 解释权本业务技术规范的解释权属于中国联通有限公司计费、结算与信息系统部。1.7 参考文献UNI-IT体系架构指南;中国联通网管及网络安全系统总体方案;中国联通企业信息化(UNI-IT)系统运行维护规程(试行)。2. 建设目标及原则2.1 建设目标BSS运维管理平台应整合目前的系统,逐步实现对“网元级、资源级、应用级”和系统安全等维护管理。同时,结合各省分公司的实际管理情况,由对业务子系统的管理延伸到对人员的管理,逐步实现以流程贯穿整个管理过程,进而实现对业务支持系统“统一管理、集中监控、集中运维”。2.1.1 近期目标近期完成BSS运维管理的基本功能,实现对业务子系统(采集、计费、营业、帐务、结算系统等)系统平台和应用软件的运行状况监控以及日常运维管理(如作业计划等),保障业务支撑网的正常运行。n 在统一平台上实现对系统运行状态的集中管理(主要包含主机设备、网络设备、存储设备、备份设备、数据库、中间件、应用软件等),保障业务支撑网的正常运行;n 实现对业务子系统应用软件关键点的监视和保障,确保系统的运行质量;n 通过对业务子系统中各类告警信息的分析,进行故障的快速定位和告警功能;n 建立日常运维工作流程,实现对日常运维活动的管理,从而实现对维护人员工作的监控和量化;n 建立运维管理知识库系统,实现知识交流与共享;n 实现供应商的有效管理;n 掌握业务子系统的资源配置信息;n 实现省公司和总部之间通过运维管理平台上传下达规定的考核指标、运维报表、重大故障/变更等。2.1.2 远期目标实现“统一管理、集中监控、集中运维”的现代化运维管理模式,以流程贯穿运维管理过程,建成面向应用、面向市场的BSS运维管理平台;同时通过总部与省两级运维管理平台的协同工作,实现系统的科学管理和规划,从而全面提升中国联通业务支撑网的服务质量。具体包括:n 实现事件的集中统一管理;n 实现对运维管理中变更过程的有效控制和管理;n 实现对运维管理中配置过程的有效控制和管理;n 实现问题管理,减少和避免同类事件的再次发生;n 通过对应用软件流程的监控,实现对业务运行质量的分析和保障,实现业务运行质量的有机管理;n 通过对各种运行的状态数据和资源配置数据的分析,为系统安全稳定运行提供合理的优化建议方案;n 完善工作流程,提高系统运行维护的质量和维护人员管理的科学化。2.1.3 建设规划BSS运维管理平台应分步实施,逐步完善。分步实施如下图所示:图2.1 BSS运维管理平台建设规划图2.2 建设原则BSS运维管理平台的建设原则包括:n 集成性:通过统一的管理平台集成系统平台和应用平台的管理;n 先进性:基于先进的IT管理理念和管理流程,采用成熟、先进的管理平台,适应技术的发展方向;n 实用性:根据用户需要进行成功的客户化定制,满足实际管理需要,真正解放管理人员的日常维护工作;n 规范性:接口的标准化和规范化原则,建立全国统一的KPI,运维管理流程规范化;n 开放性:系统应遵循行业的标准或建议,采用标准的、开放性的技术;n 扩充性:既要充分考虑到未来技术的发展变化又要考虑到将来运维管理的新需求;n 安全性:系统本身要提供较高的安全性;n 兼容性:能同第三方的管理软件以及原有网管软件集成,充分保护原有投资。3. 系统总体结构3.1 系统定位以及与现有网管系统之间的关系3.1.1 系统定位本系统的管理对象是以业务支持系统(BSS)为核心,包括采集、计费、结算、营业、帐务等子系统,实现对业务子系统的统一管理、集中监控和集中运维。3.1.2 与现有网管系统之间的关系本系统与已经建设的网管和网络安全系统的关系是互为补充,而不是互为替代。原网管系统在建设过程中所购买的网管软件和在其上实现的系统监控,可与现有各业务系统的分散的应用监控相结合,在充分利用原有投资和资源的基础上,完善功能,综合利用系统平台和应用系统的监控信息,形成运维管理平台的重要组成部分:系统监控部分,以便统一展现支撑平台和业务系统的运行状况,统一监控和维护各种告警、配置、性能数据。同时,为了强化对运行维护人员、流程和信息的管理,避免由于人员的疏忽和信息的混乱所造成的系统运行和服务质量问题,在ITIL理论的指导下,结合联通业务支撑系统运行维护管理规程和各省分公司的实际情况,建设该系统的另外一个重要组成部分:以流程管理和资源配置信息管理为核心的服务支持部分,从而进一步梳理、优化运维流程,建立监控手段与运维人员之间的有机联系,初步建立人员绩效考核机制,实现突发事件的快速解决和业务迅速恢复,并尽可能消除或减少突发事件的发生,实现系统的逐步优化,提高现有系统的稳定性。图3.1 与现有网管系统之间的关系图如图所示,网管与网络安全系统主要包括综合信息传输平台、网管、网络安全三部分内容的建设,同时为实现上述功能需要对信息系统部现有各系统进行优化和改造。一方面,网管与网安系统中的网管功能可纳入运维管理平台中的系统监控部分,另一方面,网管与网安系统的综合传输平台和网安部分可作为运维管理平台中系统监控部分的被监管对象进行管理。此外,系统监控部分和服务支持部分之间可通过自动或人工的方式进行事件和配置信息的交互,从而实现这两部分的功能及信息内容可以在展示层面进行整合,在数据层面进行综合分析,为系统安全稳定运行提供更加合理、高效的管理手段和方案。3.2 系统组织结构系统组织结构如下图所示:图3.2 BSS运维管理平台组织结构图中国联通业务支持系统运维管理平台分为两级结构,第一级为总部运维管理平台;第二级为总部计费、结算中心运维管理平台和各省、自治区、直辖市运维管理平台。第一级总部运维管理平台主要功能为负责对中国联通各省业务支撑系统的运行状况的监督管理;掌握各省的资源配置信息及各资源的性能信息,为系统的升级改造提供依据;对省公司上报的重大故障和总部市场部、客户部等部门的投诉进行管理,并监督和协调省公司的处理;采集各省公司业务系统考核指标,并对省公司进行考核;建立总部与省公司运维管理信息的上传和下达通道,使总部的相关通知信息等能及时下达,省公司上传的重大故障和变更、运维统计报表数据等能及时上传;统计各省分公司的相关运维管理信息,掌握全国业务支撑系统的运行状况。第二级省运维管理平台负责对相应省各业务支撑系统具体的管理,包括各业务支撑系统中的应用软件、主机设备、网络设备、存储设备、备份设备、数据库、中间件等,确保各系统稳定可靠地运行,并按总部要求上报相应的数据。3.3 系统体系结构BSS运维管理平台体系结构如下图所示:图3.3 BSS运维管理平台体系结构图运维管理平台体系结构可分为三个层次:数据层、功能层、接入展现层。3.3.1 数据层3.3.1.1 监控数据监控数据来自系统平台(网络、主机、存储、数据库、中间件等)、应用平台(采集、计费、营业、帐务、结算等)、业务支撑系统安全系统(主机系统安全、网络安全)以及机房环境等。通过各类采集手段或接口实现对监控数据的采集,通过系统监控的各个功能组件实现对监控数据的处理和分析,通过统一的接入展现层实现对监控数据的展现,监控数据从内容角度又可以分为告警数据、性能数据和配置处理数据等,监控数据从时间维度可以分为当前数据和历史数据。3.3.1.2 管理数据管理数据主要是为实际管理需要定义或录入的数据,其数据主要通过手工录入获得,内容包括工单、供应商情况,也包括流程配置、告警严重级别、告警过滤规则、相关性模型、告警升级规则、告警传递规则、性能门限配置、配置数据静态信息(设备编号、地理位置等)、值班/排班定义、设备/人员优先级别、服务水平定义、紧急程度定义等,同时管理数据还包括各种与监控数据相关的维度数据,如银行编码与名称对照表、营业厅名称等等。管理数据同时包含系统中的各种过程数据,如事件管理和问题管理中从受理到结束的每一步处理过程,变更过程中的变更计划书、变更授权书、变更评估报告、变更实施报告、变更验证报告等也都归类于管理数据。3.3.1.3 系统数据系统数据主要是由运维管理平台自身运行所需要或使用的数据构成,主要包括组织机构、人员信息(登录信息、联系方式)、权限状况、角色定义、日志文件、字典表数据和规则数据,包括系统自身运行日志、历史数据保留规则、不同时间粒度报表定时生成规则、设备厂家/型号对照表等、数据采集任务定义等。3.3.1.4 文档数据文档数据主要是以附件等形式存放的文件数据,主要包括规章制度、设计文档、培训文档、实施方案等,同时也包括知识库中的知识数据、供应商管理中的合同信息、配置管理中的文件形式的配置数据,在流程管理以附件形式派发的公文信息等。3.3.2 功能层运维管理平台的功能层主要由两大部分构成,即系统监控和服务支持。(1). 系统监控n 系统监控的管理对象是UNI-CRM系统中的所有系统平台设备(网络、主机、数据库、中间件、存储备份设备等)和业务应用系统(主要指采集、计费、营业、帐务、结算等)。n 系统监控的监控内容主要是业务支撑系统的平台类和应用类KPI指标(具体指标参见附件),通过接收或采集数据层生成的指标数据(或原始数据),并对这些指标进行统一的存储、处理与分析,将处理结果转发至服务支持部分或直接上传接入展现层。n 系统监控的功能组成主要包括四个部分:l 监控台:用于统一展现系统平台和业务应用系统的运行状况,统一配置和维护系统监控的各种展现数据和管理规则;l 告警管理:用于统一接收、采集系统中发生的各种异常情况,并通过对这些信息统一处理(标准化、压制、合并、过滤、故障源定位等)实现“全面监控、准确告警、及时通知、快速解决”的目的,告警管理在保证告警信息准确性的条件下,可通过各种外部接口(邮件、短信、语音)通知指定维护人员,对于较严重的、需要维护人员人工解决的告警信息,应通过服务支持部分自动生成工单,进入闭环处理流程,对于重大告警信息,应通过相应接口及时通报总部,告警管理是系统监控最核心的部分;l 性能管理:用于统一存储、处理、分析各类性能指标,实现对性能指标异常变化情况的及时告警、通过对历史性能数据的统计分析为业务系统运行趋势变化分析和系统扩容、优化提供量化依据,性能管理部分是系统监控内容最丰富的部分;l 配置处理:用于统一存储、处理、分析各类配置指标,在发生配置数据异常变化时能够生成告警信息,并提供对配置数据的统计、分析和查询,配置处理是系统监控的数据基础。(2). 服务支持n 服务支持的使用者主要是信息系统部的各类人员,包括值班人员、维护人员、管理人员等;n 服务支持的管理内容主要是依据ITIL理论,根据总部发布的运行维护规程和各省运维组织机构和人员组成情况,结合实际运维状况,梳理、优化运维流程,实现运维工作的流程化、规范化、电子化和自动化,建立监控手段与运维人员之间的有机联系,初步建立人员绩效考核机制;n 服务支持的功能组成主要包括8个部分l 服务台:为流程的起点和终点,是信息系统部为部门内部和其它部门提供的统一服务窗口,统一受理事件、申告、投诉和告警;l 事件管理:对于突发事件的流程化处理,事件来源包括系统监控中的告警管理模块以及电话、传真、手工生成等,事件管理的核心是注重突发事件的快速解决和业务迅速恢复;l 问题管理:寻求故障根源,解决存在或多发问题的流程,问题管理的核心是注重消除或减少事件的发生,实现系统的逐步优化,提高现有系统的稳定性;l 变更管理:对变更请求进行记录、跟踪与管理的流程,消除或减少变更对生产系统的影响和风险,保证变更的顺利完成;l 配置管理:管理各配置、资源、资产数据的流程,包括定义和维护配置数据相互间的关联与依赖关系;l 日常运维管理:包括机房值班、排班、交接班、作业计划、日志等内容,主要目的是强化日常运维工作的规范性,为各种运维制度提供有效的落实手段;l 供应商管理:对业务支撑系统集成商、软件供应商的相关资料、与联通签订的服务合同等信息进行管理维护,并对各集成商、软件供应商的产品质量、服务情况进行评分管理,并将评分定期上报总部,使省公司及总部及时、全面地了解供应商的阶段性服务状况;l 知识库管理:通过对知识库系统维护和使用,不仅可以在故障自动处理和人工处理的过程中在知识库中得到相关故障维护的分类和快速定位,找到匹配的处理案例,便于处理人进行借鉴,而且知识库具有的业务帮助功能,使相关人员可以通过关键字查询业务帮助、产品、市场活动、发生过的处理流程、电子文档等。3.3.3 接入展现层接入展现层是运维管理平台提供给值班人员,运维人员和管理人员的统一入口。实现运维管理平台的功能及信息内容在展示层面进行整合,并针对不同角色的使用者提供与角色关联的个性化的展示内容。同时提供对多种设备和接入方式的支持。3.4 与外部系统之间的关系运维管理平台与外部系统之间的关系如下图所示:图3.4 BSS运维管理平台与外部系统关系示意图对于目前建有网管系统的省分公司,现有网管系统将来应融入到运维管理平台中。运维管理平台可从现有网管系统(专业网管或应用网管等)中获得主机、网络、数据库、中间件、业务应用系统等网管信息。运维管理平台从业务应用系统、系统平台、机房环境及安全系统中获得的主要数据内容为:配置数据、性能数据、告警数据等。二级运维管理平台向一级运维管理平台提供的主要数据为:配置数据、重大故障数据、重大变更数据、性能数据和相关的统计报表等。运维管理平台预留有与其他系统的接口,例如MSS可以从运维管理平台中获得运维相关的信息,如运维管理平台的考核结果通过MSS系统进行发布,另外运维管理平台可以接收MSS系统的有关运维管理的通知等。运维管理平台的用户包括值班人员、运维人员、管理人员。进一步运维管理平台通过运维人员等受理其他部门如市场部、客服部等对业务支撑系统运行情况的咨询、用户投诉、变更请求等,并反馈处理结果,为其他部门提供服务。4. 业务功能与流程4.1 各模块之间的关系各模块之间的关系如下图所示:图4.1 BSS运维管理平台功能模块关系图4.2 岗位与角色描述4.2.1 岗位描述岗位组织结构如下所示:图4.2 岗位组织结构图其中运维部门管理负责人、技术业务管理负责人、技术工程师、业务工程师、值班人员的岗位定义、职责详见中国联通企业信息化(UNI-IT)系统运行维护管理规程。其中:n 上级主管(总部):总部的运维管理负责人,负责批示省分公司运维过程的重大故障、重大变更等问题;n 值班经理:协调组织值班人员进行日常运维值班任务,通常由技术工程师或业务工程师担任;n 服务供应商:作为中国联通的外协单位,负责协助、完成系统的运行维护,可包括原厂商、集成商、服务商。4.2.2 角色描述运维管理平台涉及的角色为:n 服务台:是一种管理职能,通过服务台角色在不同流程中的功能体现其职能,同时担任分类、升级、跟踪、协调、一线支持职能,服务台角色由值班人员、值班经理担任;n 二线支持:经过服务台初步支持不能解决的事件、问题,由二线支持角色处理,二线支持由技术或业务工程师担任;n 三线支持:经过二线支持不能解决的事件、问题,由三线支持解决完成,三线支持由联通方的专家和服务供应商的技术专家担任;n 管理人员:与运维部门管理负责人完全对应;n 问题管理员:在问题管理流程中负责事件的分析、问题的起草、提交审批、问题总结的人员,由业务或技术工程师担任;n 问题解决方:负责问题的调查分析、提出问题的解决方案、问题的处理,由技术和业务工程师、服务供应商的相关技术人员担任;n 变更管理员:在变更管理流程中负责起草变更请求、分类/分级、编写变更计划,由技术和业务工程师担任;n 变更顾问组:负责评估变更请求的必要性以及计划的合理性,由技术业务管理负责人、专家、服务供应商组合担任;n 变更实施方:负责变更过程的组织、实施,包括变更的构建、测试、发布、恢复等职能,由技术和业务工程师、服务供应商共同担任;n 配置管理员:配置管理中负责配置信息的录入、核实、归档,由技术和业务工程师担任。角色与岗位的关系如表:角色岗位服务台值班人员值班经理二线支持技术业务管理负责人技术工程师业务工程师三线支持联通方的专家服务提供商管理人员运维部门管理负责人问题管理员技术业务管理负责人技术工程师业务工程师问题解决方技术业务管理负责人技术工程师业务工程师服务提供商变更管理员技术业务管理负责人技术工程师业务工程师变更顾问组技术业务管理负责人联通方专家服务提供商变更实施方技术工程师业务工程师服务提供商配置管理员技术工程师业务工程师上级主管上级主管4.3 业务功能描述4.3.1 服务支持4.3.1.1 服务台4.3.1.1.1 定义服务台是一个综合接口平台,统一接收来自于综合电信业务支撑系统各业务子系统及其他途径的各种服务请求信息(告警、投诉等),提供必要的初始支持,并根据需要启动相应的服务流程、并对服务流程跟踪监督,同时向服务请求方反馈服务结果信息。4.3.1.1.2 功能管理、协调并尽快解决各类事件,允许各类事件流程能够集成到服务管理基础架构之中。不仅能处理故障、投诉和疑问,还可提供与其他过程的接口。(1) 接口服务模块n 提供统一接收各种事件、故障、投诉等服务请求的信息流逻辑接口;n 响应、确认、核实、记录和维护各种服务请求信息;n 提供服务支持管理的统一接口;n 提供服务处理结果反馈的统一接口。(2) 初始服务提供:对于一些能够直接处理而不必启动服务流程的服务请求,由服务台提供必要的初始服务支持。(3) 服务流程启动:对于通过初始服务支持无法解决的服务请求,服务台记录并判断确定服务类别和级别,并启动相应的服务流程。(4) 服务流程监控:跟踪、管理、协调流程处理过程,调整事件优先级,检查流程的处理进度。(5) 服务反馈:在服务过程中,保持与服务提出者的联系,及时通知服务进展;在服务结束后,告知提出者处理结果。4.3.1.1.3 流程及业务规则服务台负责记录事件相关信息,向用户提供对已知问题的处理方法,报告事件并启动相关服务流程,达到尽可能快速、有效地解决问题的目的。服务台接收的事件信息:n 系统获得的故障告警、性能告警、配置告警等告警信息;n 从其它系统获得的事件信息,如客服系统的投诉信息等;n 人为事件,包括从电话、传真、邮件等途径获得的事件信息,以及其他人工录入事件;n 其他事件。如果服务台不能解决这个事件,应当启动维护流程,将事件分配给最合适的服务支持小组/人员来处理,并进行如下工作:n 记录相应事件;n 判定服务类别;n 判定事件优先级(各省分公司根据自己的实际情况,制定可操作的、量化的优先级判定的标准);n 检查事件记录的处理进度,根据需要调整事件优先级;n 保持与事件报告者的联系,及时通知事件处理进展;n 最后关闭事件。4.3.1.1.4 与其他模块之间的关系n 与系统监控功能模块接口:从告警管理接收待处理监控事件信息,返回处理结果。n 与事件管理模块接口:记录、发起、并监控服务过程。4.3.1.2 事件管理4.3.1.2.1 定义事件管理是对监控管理产生的事件以及人工发起的事件处理请求进行管理的功能模块。事件包含告警事件、投诉事件、请求事件。事件可以来源于系统平台、应用平台、机房环境、系统安全等的告警,也可来自外部的投诉、请求等。根据其对服务的影响程度,事件可分为:一般事件和故障事件两大类。在上述事件中,凡开通运行的系统、设备和设施,在承担业务期间,造成质量降低至用户无法使用,均定为故障。故障的分级:按影响范围、持续时间和性质严重程度,将故障分为重大故障、严重故障和一般故障。4.3.1.2.2 功能n 事件记录:从服务台获取事件信息后,记录入系统中;n 事件判定:根据事件和故障的现象以及产生原因确定其类别、对业务的影响程度、紧急度和优先级,并指定事件和故障的解决时限;n 事件处理:包含对事件的原因和解决方法的分析、故障的解决以及服务(业务)的恢复,同时包括事件处理的流程管理、事件的升级和根据规则向不同级别的上级报告;l 分析判断:通过与相关服务、技术支持人员共同研究分析发现事件发生的原因,或查找以前是否发生过同类突发事件,是否有处理方法;l 上报:发生严重故障和重大故障时,维护部门直接向省分信息系统部和运行监督部报告;对于重大故障,要上报联通总部信息系统部和运行监督部;l 解决和业务恢复:利用找到的处理方法解决问题,恢复业务。对于紧急级的事件,在事件管理过程中直接执行紧急变更管理过程,不再向“变更管理”提交工单;l 事件、故障升级:对于系统中持续出现以及超过规定处理时间仍未解决的事件和故障,需要升级该事件级别,以保证得到优先、及时的处理。当事件处理超过预期时限,根据预定义的升级条件,将该事件自动/手工升级到更高级别,并通知到指定级别的管理人员。n 处理跟踪:跟踪事件和故障处理过程和时限,升级和督促突发事件,随时通知用户处理进展;n 事件完结:事件处理完成后,要将结果记录入系统并将处理结果反馈给事件发起方;n 统计查询:提供灵活的统计和查询功能,方便对事件的处理状况、处理结果进行查询,并提供统计和汇总报表功能。4.3.1.2.3 流程及业务规则事件管理的处理流程如下图所示:业务规则:n 上报总部:对重大故障,分别由省分信息系统部和运行监督部上报至总部信息系统部和运行监督部;n 升级规则:对超过处理时限的事件,根据超出的时限,系统自动升级到相应级别,并根据事件级别定义,系统流程自动将消息通知对相应级别的管理人员。4.3.1.2.4 与其他模块之间的关系n 通过配置管理取得相关资源和配置数据,并将处理过程中对配置的修改提交给配置管理;n 根据对事件、故障原因的分析,根据需要产生变更请求并进入变更管理;n 将典型的事件处理过程和结果提供给知识库。4.3.1.3 问题管理4.3.1.3.1 定义问题管理是通过识别问题的真正的潜在原因,控制运维中的故障的过程。问题管理采取积极主动的办法,通过对已发生的问题进行分析,提出解决方案并尽早采取防御措施,防止同类事件或故障的再次发生。问题指已经发生、并且重复多次的事件或重大故障所蕴含的尚未查明的、真正的潜在原因。问题来源于事件、故障管理流程中的非突发事件或多次重复发生的事件信息的总结和分析。4.3.1.3.2 功能问题管理是问题的提出、分析、解决的管理过程,并提供问题解决方法的记录以及问题的统计分析和查询功能。n 问题提交:从对事件的分析中,对于未探明原因的严重事件或对多次重复发生的事件提出问题报告,以待对问题的根源进行分析和解决方法的提出;n 问题分析研究:对提交的问题安排相关的技术专家、维护人员和业务管理人员进行研究分析,给出问题的解决方案,并将初步的分析结果和对应的解决方案记录系统;n 问题处理:根据对问题的分析得出的解决方案,产生相应的变更工单,交变更管理过程进行处理。n 问题完结:对解决方案的处理结果进行记录并进行评估、总结;n 统计查询:提供对问题的处理过程、处理结果的灵活查询功能以及统计报表功能。4.3.1.3.3 流程及业务规则问题管理的业务流程:n 问题提出、分类;n 问题分析:由相关专家和管理人员通过会议、研究等方式分析问题原因和提出解决方案;n 问题解决:根据解决方案产生变更工单,进行变更处理;n 处理结果的记录和总结:记录问题的处理过程和最终结果,并对问题的处理结果进行回顾评价,如果未解决问题,再进行相应的分析和处理。4.3.1.3.4 与其他模块之间的关系n 与事件管理/故障管理的关系:对一般事件和故障事件的分析总结是问题管理的数据源。n 与变更管理的关系:在处理、解决问题的过程中,可能需要对系统配置、软件版本进行修改升级。因此,问题管理可以派生出变更流程。n 与知识库管理的关系:问题管理过程积累的问题的典型处理方法为知识库管理提供数据源。4.3.1.4 变更管理4.3.1.4.1 定义变更是指针对被管理系统中某对象及其配置所进行的修改,大到整个业务支撑系统的升级改造,小到某设备参数的细微调整。为了避免和减少变更所造成新的系统问题和故障隐患,对系统变更过程需要规范化管理,包含提出变更计划及申请、申请评估、审批、授权、实施、验证等流程。变更管理是指对这些流程的规范化管理,以确保使用规范的方法和过程实现快速、有效的变更,保证变更过程的可控性、可管理性和有序性,减少变更带来的突发事件,促进日常工作的正常进行。4.3.1.4.2 功能变更管理需要包含如下功能和主要环节:n 变更请求:由系统或者业务人员填写变更单,提出变更请求。填写内容包括变更提出人姓名、变更原因、变更对象以及变更实施计划、实施时间等具体要求。n 变更评估:由变更评估小组对变更申请方案及对系统的影响进行评估。变更评估对于将对系统产生重大影响的变更(如系统升级),是非常必要和重要的;对于影响较小的变更可根据具体情况简化评估流程或直接提交审批。变更评估过程中,评估未通过的申请,会出现两种结果:一种是评估小组并未否定变更请求,而是对变更提出了其他意见,申请人根据意见重新填写申请,再次提交;一种是评估小组否定了变更的请求,变更终止。n 变更审批:负责人对通过评估的申请进行审批。如审批通过,则进入变更授权流程,否则,进入变更终止。n 变更授权:负责人指定相应部门及人员负责变更的实施。n 变更实施:可以根据变更对项目的影响程度定义实施流程。对于有重大影响的变更,实施过程将包括变更的准备、变更前试验、变更实施、变更测试、验证等。此外,还需要制定完善的测试恢复计划,以保证在实施过程中,出现意外或实施结果不符合期望时,根据恢复计划进行系统恢复,减少变更对服务质量的影响。变更实施完成后,将通知申请人。n 变更终止:变更终止分成两种情况,一种是变更实施成功完成,变更工作结束,对变更进行评价;一种在变更过程中,由于各种情况变更撤销。对于变更撤销,要求记录变更撤销原因。4.3.1.4.3 流程及业务规则变更管理的业务流程如下图所示:业务规则:n 任何涉及对主机、网络设备配置、系统软件、应用软件、相关文档的修改都应该通过变更管理规范和记录;n 变更流程对配置和设备的修改都应该更新配置记录;n 涉及单台设备、非核心系统(非核心网络设备、服务器和应用)的配置修改为简单变更,可以省略审批过程,但必须启动变更流程并更新配置记录;n 非紧急变更需要根据具体的业务要求由相关人员(变更经理或变更顾问团)审批。4.3.1.4.4 与其他模块之间的关系n 与事件及问题管理的关系:在处理、解决系统故障和问题的过程中,经常需要对其配置、版本进行修改。因此,事件管理和问题产生变更请求。n 与日常运维管理的关系:在日常运维管理工作过程中也需要修改系统的参数和配置,也需要启动变更流程。n 与配置管理的关系:变更的结果导致设备和/或配置的变化,变化的结果需要在配置管理中体现。因此,变更管理导致配置记录项的变更。n 与知识库的关系:变更管理积累的经验和对典型变更过程的评价分析,都可以作为知识库的内容供其他相似案例参考。4.3.1.5 配置管理4.3.1.5.1 定义配置管理是指识别和确认IT系统配置项,记录和报告配置项状态和变更历史,检验配置项的正确性和完整性等活动构成的服务管理流程。配置项是指IT系统的组件或IT系统提供服务的相关的配置信息(如主机的设备型号、CPU/内存配置、硬盘配置、网络接口卡配置以及IP地址、端口、性能配置参数等)。配置管理的目的是管理并及时提供准确可靠的IT系统基础架构(硬件、软件资源、机房内资源等)的配置信息。通过对配置信息当前情况的了解,指导系统的升级、改造。系统应提供配置数据的自动和手工输入并进行合法性等检查,对历史数据进行管理。4.3.1.5.2 功能配置管理的功能结构如下图所示:n 配置项设置:是“配置项”定义的工具,通过它实现配置项列表的定义和调整,并定义配置项的层次(颗粒度)和关系以及数据获取方式;n 配置项采集:获取资源配置项的完整属性信息,采集方式包含“自动采集”和“手工采集”两种方式,其中“自动采集”部分由系统监控中的“配置处理”来完成,并通过“系统监控”和“服务支持”的接口完成数据的传递;n 配置项管理:实现对资源配置项的编辑、修改、调整和变更历史记录;n 配置信息查询:提供对配置信息的多途径和目的的查询;n 统计分析:实现对配置信息、变更信息按主题和目的进行统计汇总和分析。4.3.1.5.3 流程及业务规则配置项采集流程:n 自动、手工获取配置信息或配置信息变更;n 对比当前配置项信息:l 新增项:增加新记录;l 变更项:产生变更历史记录;n 变更审核,确认配置项变更;n 信息更新。流程图如下: 4.3.1.5.4 与其他模块之间的关系n 配置管理为各功能模块提供系统的配置信息;n 系统监控中的“配置处理”自动获取的配置信息和配置变更信息,是配置管理的信息来源。配置处理与配置管理保持配置数据的一致。n 事件管理、变更管理产生配置项的变动,变更结果记入配置管理数据库。4.3.1.6 日常运维管理4.3.1.6.1 定义日常运维管理是对日常运维活动的管理,包括值班与交接班管理、作业计划管理、系统与设备巡检和运维考核管理等日常运维管理活动。4.3.1.6.2 功能日常运维管理目前包括值班与交接班管理、作业计划管理、系统和设备巡检等功能。根据运维管理的工作的实际需要,可以根据省分公司工作的需要,增加必要的功能模块。(1) 值班与交接班管理n 值班管理:根据运维规程,值班人员执行系统、设备运行状况巡视,记录和处理系统异常状况和故障。值班管理的功能包括:值班人员排班管理、上岗、离岗的签到、签离,值班日志记录等;n 交接班管理:交接班是现值班人员和接班人员的工作交接过程,包含交接班日志填写,接班人员的签收等功能。(2) 作业计划管理n 维护作业计划包含拟定,审批,执行和检查等四个功能环节;n 系统提供不同作业计划的流程配置功能;n 提供作业计划的查询、跟踪、统计功能。(3) 系统与设备巡检n 巡检记录:记录巡检的详细内容;n 信息查询:对历史巡检数据进行查询。(4) 运维考核管理n 考核指标定义:定义运维考核的指标集以及评分标准;n 考核评分:定期或现场对考核项进行评分,并记录考核结果;n 报表定制:灵活定制、生成考核的报表。4.3.1.6.3 流程及业务规则各省根据运维规程和实际运维情况制定适合本地的日常运维流程及业务规则。4.3.1.6.4 与其他模块之间的关系n 与事件管理的关系:值班管理中对系统、设备巡视中发现的异常问题和故障是事件管理的信息源之一。4.3.1.7 供应商管理4.3.1.7.1 定义对业务支撑系统集成商、软件供应商的相关资料和服务质量服务能力、以及与联通签订的服务合同等信息进行管理维护。对各集成商、软件供应商的产品质量、服务情况进行评分管理,将评分定期上报总部。使省分公司及总部及时、全面地了解供应商的阶段服务状况。4.3.1.7.2 功能供应商管理的功能结构图如下图所示:n 供应商资料管理:对供应商的公司信息,法人信息、联系人、产品等资料进行记录、维护管理,便于进行供应商相关信息查询;n 供应商服务合同管理:对供应商的服务合同、服务内容等内容进行归类、维护,并提供例如合同到期、工程验收等提醒、通知功能;n 供应商评分管理:供应商管理是对其提供服务的一个综合评价,如供应商提供服务的能力,响应速度等,方便联通对供应商服务质量进行排名;n 统计分析汇总:对管理的供应商的信息和服务进行统计、汇总和报表定制功能。同时实现供应商的服务能力、水平的对比分析。4.3.1.7.3 流程及业务规则供应商评分流程:n 设置供应商评分指标;l 指标的增减;l 指标权重的设定、修改。n 采集供应商评分指标数据;n 根据指标数据及其权重进行计算,得到评定分数;n 对评定分数进行汇总、累加,得到最终评分。4.3.1.7.4 与其它模块之间的关系n 与总部的接口:向总部提供供应商考核评分数据。4.3.1.8 知识库管理4.3.1.8.1 定义通过对知识库系统维护和使用,不仅可以在故障自动处理和人工处理的过程中在知识库中得到相关故障维护的分类和快速定位,找到匹配的处理案例,便于处理人进行借鉴,而且知识库具有的业务帮助功能,使相关人员可以通过关键字查询业务帮助、产品、市场活动、发生过的处理流程、电子文档等。知识库管理系统也包括对相关文档(如系统业务需求书、方案建议书、设计文档等)的管理。知识库管理系统还提供相关业务与管理人员交流的“主题论坛”,交流在相关专业领域的经验教训,推进运维业务的知识管理。4.3.1.8.2 功能知识库管理的功能结构图如下图所示:(1) 知识库功能n 知识的输入:系统提供人工和自动的方式进行知识库的添加,对输入的知识库信息审核(是否是重复的知识库信息等)。n 分类目录:提供目录导航功能,使检索人员可以方便直观的检索信息。目录结构的设计是运维业务管理知识的高度总结。n 查询、检索功能:系统提供完善的查询和全文检索功能,例如:知识列表、关键字查询等。提供日常查询界面,供运维人员获取、学习。n 知识库接口:为其他功能模块提供主题相关的访问入口。(2) 文档功能在IT系统的运行维护中,产生大量的文档,包括:n 规章制度;n 项目设计文档;n 项目实施文档;n 培训文档;n 从其他功能中归档的文档;n 厂商提供的文档(产品、版本、配置、技术方案等);n 其他。文档管理提供对上述文档资料的管理,提供:文档浏览、添加、更新、检索、版本管理等功能。(3) 主题讨论“主题讨论”提供按不同主题区进行讨论的论坛功能,比如按主机、数据库、中间件、计费、营帐、结算等进行分类。“主题讨论”的功能包括:n 论坛灵活创建;n 用户管理;n 论坛管理(删除、归类);n 访问量显示(热点);n 评价;n 知识库归档;n 其他。4.3.1.8.3 流程及业务规则n 提供支持人员提交经验和知识的输入接口或界面;n 具有不同等级用户环境的区别,不同级别的用户完成不同的知识库任务;n 提供知识库的分类整理管理,易于扩充、调整;n 积累业务支撑系统维护经验,逐步建立、完善对全网存在的共性问题、典型问题的处理手段或优化措施,为维护人员日常工作提供辅助分析手段;n 提供各类相关的技术、业务等运维相关文档,方便查找信息;n 提供完善、全面的查询功能,例如:知识列表、关键字查询、模糊查询等;n 省分公司与总部交互数据,达到知识库的共享。4.3.1.8.4 与其它模块之间的关系n 与事件管理、问题管理、变更管理的关系:这些模块的典型处理案例可以是知识库的知识素材;n 知识库提供给各功能模块的知识查询功能。4.3.2 系统监控4.3.2.1 监控台监控台提供对系统平台和业务应用平台的集中监控,集中展示系统整体状况,是整个运维管理平台接入展现层的重要组成部分。n 采用C/S客户端方式或B/S结构,维护人员能够方便的通过监控台实现日常监控管理;n 通过监控台应能够统一完成拓扑展示、告警管理、性能管理、配置处理等各项功能和数据的配置、展现、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论