综合性能场景监控系统.doc_第1页
综合性能场景监控系统.doc_第2页
综合性能场景监控系统.doc_第3页
综合性能场景监控系统.doc_第4页
综合性能场景监控系统.doc_第5页
免费预览已结束,剩余6页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

成果上报申请书成果名称综合性能场景监控系统关键词索引(35个)性能监控、场景监控、gis展现、性能告警管理对企业现有标准规范的符合度:符合中国移动集中化网络性能管理分场景呈现省端规范,实现集中化网络性能管理十大场景功能建设,实现资源、告警、性能、工单、应急灯数据的场景化监控视图开发,可通过多维视图、GIS视图、图形报表等方式监控在网设备的网络运行情况。如果该成果来源于研发项目,请填写研发项目的年度、名称和类型(类型包括:集团重点研发项目、集团联合研发项目、省公司重点研发项目、其他研发项目),可填写多个:无成果简介:简要描述成果目的和意义,解决的问题,取得的社会和经济效益。移动网管支撑系统经过十年的持续建设和发展,已形成以话务网管、数据网管、传输网管、动环监控等专业网管系统、信令监测、业务拨测、电子运维系统为主体的立体化的网络运维支撑平台,实现了对运维生产和管理工作的支撑。但随着网络规模的发展以及网络集中监控要求的提高,烟囱式的支撑模式已经不能满足监控业务要求,无法面向全业务形成关联的业务监控视图,不能有效支撑公司的全业务运营战略;来自各专业网管及独立系统的数据较为分散,无法实现数据的共享与关联,未能对各系统数据进行综合利用;功能相似、风格不同的各专业网管系统无法适应集中管理的要求。同时,依据2012年集团网络工作会打造一流监控中心的工作目标,为更好的发挥监控龙头作用,以告警和性能为抓手,落实集团提出十大标杆、十大场景、十大要求、十大标准、十大明星等五个“十”目标,迫切需要结合集团公司对可视化监控体系的要求,通过加强监控支撑手段来进一步提升实时发现、指挥调度、信息枢纽、网络展示等监控核心能力,以满足迅速发展的工作趋势与集团相关目标。为解决上述问题,我们建设了支撑全业务的综合性能场景监控系统,实现性能十大场景的功能建设,完成交换、无线、传输、动环、数据,全专业资源、性能、告警的接入工作,实现省级网络健康监控视图、概况与区域监控、场景监控、拓扑监控、告警关联、性能指标监控等模块开发,通过图表、GIS、多维视图等方式进行图形化展现,呈现各场景多维度(省级、地市级、网元级别)的指标劣化趋势、告警详情、工单派发信息等,为监控人员、性能管理人员、网络优化维护人员提供统一的场景化的综合监控工具,有效提升在日常监控、重大节假日、应急调度、突发事件等各类状况下陕西移动网络监控运维工作效率与质量。目前,该系统已完成建设共实现了十大性能场景功能,包括日常区域场景、重点区域场景、节假日场景、汛情场景、高校场景、高铁场景、城市道路场景、突发事件场景、重大活动场景、新业务新技术场景(互联网监控场景、集团客户监控场景),共接入500多个性能指标、配置55个重点区域场景, 4条高铁场景, 185个高校场景, 8条高速公路场景,以及多个突发事件场景。该系统已于2012年9月投入应用,该系统上线之前,全省监控仅通过概况监控完成,监控粒度不明晰,重点不突出,覆盖专业不全面。不能体现各场景的监控特点、重点关注指标,故障定位支撑较为有限,不能合理调配应急资源配置。此系统应用后,在重大事件时用场景化的方式开展重点监控工作,帮助监控人员实现“业务集中,热点集中,保障集中”方式,完成了由设备监控向客户感知方向的转变。在每次重大事件保障工作,通过场景监控工作提高监控重大事件保障能力,提升了企业的社会形象。综合性能场景监控系统应用效果评价主要表现四个方面:首先是故障定位发现能力的提升,其次重点区域的保障能力,再次监控应急指挥调度能力的提升,最后是监控窗口服务工作的综合展示能力的提升。1、提升重点故障定位发现能力:通过及时掌握重点区域设备故障,将告警与GIS结合,直观故障影响范围、关联全专业告警分析故障产生原因、快速计算故障损失;分析总结各场景用户分布规律、业务峰值规律,指导网络优化工作改善用户感知。2、提升重点区域的保障能力,通过细分场景,放大关注重点区域的指标,将当前业务指标值与历史值的比较,监控业务异常波动预警网络降质发生,进一步提升重点区域关注度。 3、提升监控应急指挥调度能力:通过投诉热点与劣化小区结合,降低劣化导致投诉,提升用户满意度。对应急资源按区域划分、及时调度,实时掌握各场景配置应急资源合理进行调配,做好重点区域应急预案,保障业务突增时网络负载能力不受影响。 4、最后是监控窗口服务工作的综合展示能力的提升,该系统具有较为流畅的展示界面,监控部门作为网络工作的窗口,在多次接待上级部门领导、集团客户的过程中,利用该系统圆满的完成接待展示任务,提升了公司的社会形象。省内试运行效果:描述成果引入后在本省试运行方案、取得的效果、推广价值和建议等。完整系统能能建设,以及资源、性能、告警数据接入调测后,2012年9月该系统在我省落地应用,该系统以监控部门、性能管理部门、网优调测部门为主用应用对象,初期以监控部门应用为主,上线应用后取得了非常突出的应用效果。综合性能场景应用效果评价主要表现四个方面:首先是故障定位发现能力的提升,其次重点区域的保障能力,再次监控应急指挥调度能力的提升,最后是监控窗口服务工作的综合展示能力的提升。1、提升重点故障定位发现能力:通过及时掌握重点区域设备故障,将告警与GIS结合,直观故障影响范围、关联全专业告警分析故障产生原因、快速计算故障损失;分析总结各场景用户分布规律、业务峰值规律,指导网络优化工作改善用户感知。(针对故障的抢通时间由应用前的2小时以上,通过告警与GIS结合,直观故障影响范围、关联全专业告警分析故障产生原因、快速计算故障损失手段,缩短到应用场景监控手段后的40分钟以下,并能够针对重点保障区域优先保障。减少了公司损失。)-参考案例2,52、提升重点区域的保障能力,通过细分场景,放大关注重点区域的指标,将当前业务指标值与历史值的比较,监控业务异常波动预警网络降质发生,进一步提升重点区域关注度。(针对保障人员在重点区域保障时,需要对各类指标进行不同专业的人工核对、计算,在应用前需要20多人以上进行保障,通过将当前性能与日常值、历史值做对比,分析业务增/降幅度,将人员较少到5人,大大减少人员成本,提升工作效率。)-参考案例2 3、提升监控应急指挥调度能力:通过投诉热点与劣化小区结合,降低劣化导致投诉,提升用户满意度。对应急资源按区域划分、及时调度,实时掌握各场景配置应急资源合理进行调配,做好重点区域应急预案,保障业务突增时网络负载能力不受影响。(针对退服基站等告警,通过GIS呈现具体位置、影响范围,监控该区域内出现投诉及用户感知劣化,赶在用户感知劣化前发现并解决网络异常。自通过动派发工单、短信,及时告知地市维护人员,启动应急预案,派遣应急通讯车,应用前大约判断故障点,调度人员前往现场处理,需用时1小时左右。经过流程梳理、缩短到30分钟左右。提升客户感知,保障网络运维正常。)-参考案例4,5 4、最后是监控窗口服务工作的综合展示能力的提升,该系统具有较为流畅的展示界面,监控部门作为网络工作的窗口,在多次接待上级部门领导、集团客户的过程中,利用该系统圆满的完成接待展示任务,提升了公司的社会形象。由此可见,此系统具有较大的应用推广价值。文章主体(3000字以上,可附在表格后): 一、项目背景及目标移动网管支撑系统经过十年的持续建设和发展,已形成以话务网管、数据网管、传输网管、动环监控等专业网管系统、信令监测、业务拨测、电子运维系统为主体的立体化的网络运维支撑平台,实现了对运维生产和管理工作的支撑。但随着网络规模的发展以及网络集中监控要求的提高,烟囱式的支撑模式已经不能满足监控业务要求,无法面向全业务形成关联的业务监控视图,不能有效支撑公司的全业务运营战略;来自各专业网管及独立系统的数据较为分散,无法实现数据的共享与关联,未能对各系统数据进行综合利用;功能相似、风格不同的各专业网管系统无法适应集中管理的要求。同时,依据2012年集团网络工作会打造一流监控中心的工作目标,为更好的发挥监控龙头作用,以告警和性能为抓手,落实集团提出十大标杆、十大场景、十大要求、十大标准、十大明星等五个“十”目标,迫切需要结合集团公司对可视化监控体系的要求,通过加强监控支撑手段来进一步提升实时发现、指挥调度、信息枢纽、网络展示等监控核心能力,以满足迅速发展的工作趋势与集团相关目标。为解决上述问题,我们建设了支撑全业务的综合性能场景监控系统,实现性能十大场景的功能建设,完成交换、无线、传输、动环、数据,全专业资源、性能、告警的接入工作,实现省级网络健康监控视图、概况与区域监控、场景监控、拓扑监控、告警关联、性能指标监控等模块开发,通过图表、GIS、多维视图等方式进行图形化展现,呈现各场景多维度(省级、地市级、网元级别)的指标劣化趋势、告警详情、工单派发信息等,为监控人员、性能管理人员、网络优化维护人员提供统一的场景化的综合监控工具,有效提升在日常监控、重大节假日、应急调度、突发事件等各类状况下陕西移动网络监控运维工作效率与质量。二、实现方案及功能说明1、建设方案:综合性能场景监控系统,实现性能十大场景的功能建设,完成交换、无线、传输、动环、数据,全专业资源、性能、告警的接入工作,实现省级网络健康监控视图、概况与区域监控、场景监控、拓扑监控、告警关联、性能指标监控等模块开发,通过图表、GIS、多维视图等方式进行图形化展现,呈现各场景多维度(省级、地市级、网元级别)的指标劣化趋势、告警详情、工单派发信息。该系统总体技术架构分为采集层、处理层、应用层: 采集层: 为整个系统提供数据的采集,包括资源、性能、告警、工单等信息的采集。 该模块为告警监控、场景监控、性能监控等模块所共有,提供统一的采集层。 处理层: 完成告警处理、性能处理、资源处理以及各场景模块的处理服务。 应用层: 提供Web GIS组件、拓扑组件、告警信息组件、资源信息组件、图表控件等基础控件,供各个应用模块服用。 完成告警处理、性能处理以及场景模块的人机交互。2、功能介绍综合性能场景监控系统根据不同情景下客户感知差异化需求和网络管理要求建立性能管理模型,关注不同的性能指标集合,研究不同的性能指标的阈值动态算法,突出不同情景下的网络管理特点,为管理者、监控及维护人员提供可视可控的标准化网络性能管理手段。1、性能管理场景分类(1)通用型场景:覆盖全专业、全区域、全时段的网络整体性能管理模型,如:日常管理场景。其特征为:对全专业性能管理指标进行管理;质量指标一般采用静态阈值,业务量指标一般采用动态阈值;网络健康报告、网元周期挂牌、实时性能告警多种问题管理模式结合。 日常场景:为监控人员提供日常监控模式下的性能管理手段,通过多种形式的网络问题管理,达到提升用户感知的目标。时间维度上覆盖网络运行的全周期,空间维度上覆盖省、地市级整体网络直至最小粒度网元,指标集包括话务统计、各专业网管、主动监控系统等多数据源的全专业网络质量、业务质量、业务量指标。呈现全专业的网络整体性能(如网络健康报告形式),兼顾实时问题和周期性网络性能问题隐患的发现能力,具备指标钻取式分析、关联式分析能力,具备完整的问题发现-督办-闭环管理流程。(2)事件型场景:在事件触发的时间段内聚焦关注的专题性能管理模型,如:节假日、重大活动、突发事件、汛情保障场景。其特征为:主要针对无线、交换专业指标进行管理,同时关注网络完好性指标;一般采用静态阈值;以实时性能告警形式为主进行问题管理;可支持对局部区域、特定网元及指标的快速场景配置。 节假日场景:用于节假日保障期间呈现和管理全省通信网络运行情况,具备及时发现、定位节假日期间业务量、网络质量突变事件的能力,同时对于重要告警、网络完好性也具备一定呈现能力。基于矢量地图及GIS地图呈现资源信息、告警信息、性能信息、工单信息、工程信息、业务量监控信息等。基于定制的窗口掌握节假日保障区域总体情况。节假日保障场景下,通过GIS图层和窗口可以实现资源信息、应急保障信息、故障信息、性能信息、工单信息的可视。 重大活动场景:重大活动场景用于重大活动期间呈现和管理保障区域通信网络运行情况,基于地图呈现资源信息、告警信息、性能信息、工单信息、工程信息、业务量监控信息等。基于定制的窗口掌握重大活动保障区域总体情况。重大活动场景下,通过GIS图层和窗口可以实现资源信息、应急保障信息、故障信息、性能信息、工单信息的可视。 突发事件场景:突发事件场景用于呈现和管理突发事件保障区域及周边通信网络运行情况,基于地图呈现资源信息、告警信息、性能信息、工单信息、工程信息、业务量监控信息等。基于定制的窗口掌握突发事件保障区域总体情况。突发事件场景下,通过GIS图层和窗口可以实现资源信息、应急保障信息、故障信息、性能信息、工单信息的可视。 汛情保障场景:汛情场景用于汛情保障期间呈现和管理全省通信网络运行情况,基于地图呈现资源信息、告警信息、性能信息、工单信息、工程信息、业务量监控信息等。基于定制的窗口掌握汛情保障区域总体情况。汛情场景下,通过GIS图层和窗口可以实现资源信息、应急保障信息、故障信息、性能信息、工单信息的可视。(3)特殊对象场景:聚焦特定区域、网元、业务的性能管理模型,如:重点区域、高铁、高校、城市道路、新技术与新业务场景。其特征:主要针对无线、交换、数据专业指标进行管理;一般采用静态阈值;采用网元周期挂牌的问题管理模式。 重点区域场景:重点区域监控场景用于呈现和管理重点区域设备运行情况,基于GIS地图呈现资源信息、告警信息、性能信息、工单信息、工程信息、业务量监控信息等。基于定制的窗口掌握重点区域总体情况。重点区域监控场景下,通过GIS图层和窗口可以实现资源信息、故障信息、性能信息、工单信息的可视。 高铁场景:高铁监控场景用于呈现和管理铁路及附近设备运行情况,基于GIS地图呈现告警信息、性能信息、工单信息、工程信息、业务量监控信息等。基于定制的窗口掌握高铁区域总体情况。高铁监控场景下,通过GIS图层和窗口可以实现故障信息、性能信息、工单信息的可视。 高校场景:高校监控场景用于呈现和管理高校及周边区域设备运行情况,基于GIS地图呈现资源信息、告警信息、性能信息、工单信息、工程信息、业务量监控信息等。基于定制的窗口掌握高校区域总体情况。高校监控场景下,通过GIS图层和窗口可以实现资源信息、故障信息、性能信息、工单信息的可视。 城市道路场景:城市道路监控场景用于呈现和管理城市主干道及附近设备运行情况,基于GIS地图呈现告警信息、性能信息、工单信息、工程信息、业务量监控信息等。基于定制的窗口掌握城市道路区域总体情况。城市道路监控场景下,通过GIS图层和窗口可以实现故障信息、性能信息、工单信息的可视。 新技术与新业务场景:新技术和新业务场景描述的主体是指有一定规模应用的新技术或新业务,且具备已经开发的指标或具备指标开发条件。由于新技术或新业务更新较快,为适应后续新的新技术、新业务的植入,场景应该具备随机调配功能,能够临时增加或更换监控对象,快速生成监控场景。通过地图、趋势图、矩阵、拓扑等场景呈现方式呈现新技术和新业务的业务场景和特色场景,通过新技术新业务的指标波动和场景的不同渲染方式达到故障发现的目的。三、该项目创新点综合性能场景监控系统主要创新点如下:1、 实现交换、无线、数据、传输、动环全专业基于设备告警、性能告警、性能指标、故障工单、投诉工单、资源预警、社会事件等为基础的场景展现;2、 将监控区域分为省内交通干线及枢纽、旅游景点、党政军、高等学校等需要重点关注的区域,不同区域需要保障的要求不同,关注指标不同,不同时间业务变化也不同。因此将其从全网监控中单独选出来,提升其监控重要程度。并根据重点区域具有监控区域固定、人群密度大、长期关注度高、网络结构复杂、设备类型多等特点,建设重点关注场景,加强监控力度,融入一线值班人员日常监控工作中。3、 在传统的图形化监控形式的基础上,引入GIS地图、多维视图等多种形式,并将各种方式有机结合,监控界面具有多维度、友好性强、展示流程等优点。4、 在进行全网监控的同时,引入性能指标管理考核体系,能够实现性能实时告警生成展现与派单,以及性能指标劣化网元的挂摘牌管理功能。综合性能场景监控系统主要难点如下:1、 各专业网管数据之间的关联。2、 各专业性能、告警数据与综合资源数据的关联。3、 各场景接入指标不同,涉及网元不同,性能指标接入后的准确性核对工作。4、 性能实时预警阀值的调校工作。四、应用效果未开展综合性能场景监控系统之前,全省监控仅通过概况监控完成,监控粒度不明晰,重点不突出,覆盖专业不全面。不能体现各场景的监控特点、重点关注指标,故障定位支撑较为有限,不能合理调配应急资源配置。开展综合性能场景监控系统之后,运用场景化的方式开展重点监控工作,帮助监控人员实现“业务集中,热点集中,保障集中”方式,完成了由设备监控向客户感知方向的转变。在每次重大事件保障工作,通过场景监控工作提高监控重大事件保障能力,提升了企业的社会形象。应用效果评价主要表现四个方面:首先是故障定位发现能力的提升,其次重点区域的保障能力,再次监控应急指挥调度能力的提升,最后是监控窗口服务工作的综合展示能力的提升。提升重点故障定位发现能力:通过及时掌握重点区域设备故障,将告警与GIS结合,直观故障影响范围、关联全专业告警分析故障产生原因、快速计算故障损失;分析总结各场景用户分布规律、业务峰值规律,指导网络优化工作改善用户感知。(针对故障的抢通时间由应用前的2小时以上,通过告警与GIS结合,直观故障影响范围、关联全专业告警分析故障产生原因、快速计算故障损失手段,缩短到应用场景监控手段后的40分钟以下,并能够针对重点保障区域优先保障。减少了公司损失。)提升重点区域的保障能力,通过细分场景,放大关注重点区域的指标,将当前业务指标值与历史值的比较,监控业务异常波动预警网络降质发生,进一步提升重点区域关注度。(针对保障人员在重点区域保障时,需要对各类指标进行不同专业的人工核对、计算,在应用前需要20多人以上进行保障,通过将当前性能与日常值、历史值做对比,分析业务增/降幅度,将人员较少到5人,大大减少人员成本,提升工作效率。) 提升监控应急指挥调度能力:通过投诉热点与劣化小区结合,降低劣化导致投诉,提升用户满意度。对应急资源按区域划分、及时调度,实时掌握各场景配置应急资源合理进行调配,做好重点区域应急预案,保障业务突增时网络负载能力不受影响。(针对退服基站等告警,通过GIS呈现具体位置、影响范围,监控该区域内出现投诉及用户感知劣化,赶在用户感知劣化前发现并解决网络异常。自通过动派发工单、短信,及时告知地市维护人员,启动应急预案,派遣应急通讯车,应用前大约判断故障点,调度人员前往现场处理,需用时1小时左右。经过流程梳理、缩短到30分钟左右。提升客户感知,保障网络运维正常。) 最后是监控窗口服务工作的综合展示能力的提升,该系统具有较为流畅的展示界面,监控部门作为网络工作的窗口,在多次接待上级部门领导、集团客户的过程中,利用该系统圆满的完成接待展示任务,提升了公司的社会形象。场景应用案例说明:1、人群密度高的重点区域,针对易用户激增引发的大话务冲击的问题案例。9月30日至10月7日,累计上华山的游客20.1万人次,到华山游客近百万人。其中,10月2日引发万余游客滞留山上”,华山游客数量超过4.1万人次,10月3日超过4.3万人次,10月4日游客也接近4万,是近3年来游客最多的一次,出现游客滞留山上无法下山情况。详细如下:案例1、网络负荷问题: 通过监控华山景区BSC负荷变化,根据系统前期性能阈值设定规则,观察健康展示灯变红。案例2、语音业务峰值问题: 滞留事件发生时,当日话务量达到 2944erl,较平日增幅189%。 高话务压力下,TCH拥塞率有所恶化,其中拥塞率达到5.77%。 根据话务量浮动超过动态阈值,自动衍生三级黄色性能告警,TCH拥塞率大于5衍生一级红色告警。系统自动生成性能工单,并自动派发,通知无线一线维护人员。案例3、投诉及用户感知劣化问题: 通过统计华山景区的五高一弱小区、查看劣化详情,以及投诉工单在gis上呈现情况,确认

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论