智能巡检平台研发ppt课件.pptx_第1页
智能巡检平台研发ppt课件.pptx_第2页
智能巡检平台研发ppt课件.pptx_第3页
智能巡检平台研发ppt课件.pptx_第4页
智能巡检平台研发ppt课件.pptx_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

智能巡检平台研发,1,小组概况,2,2,活动计划表,计划时间,实际时间,时间:2011年1月第1-2次小组会议制定活动计划表,制表人:刘春燕,3,名词解释,电子运行维护系统(EOMS):实现公司相关管理流程的信息化落地,是管理、维护人员日常工单处理的支撑平台。,集中运行维护平台:通过指令接口完成网管系统对网络配置信息、主动监控指标、实时信息的查询等操作,实现各类网元指令统一下发、采集、分析、处理。,综合告警平台:通过接入各类网元告警信息,实现通信网络告警的统一采集、统一关联、统一呈现,统一派单。,4,选择课题,随着通信市场竞争的日趋激烈,网络质量已成为保障客户感知的生命线,其战略地位尤为重要。同时,网络管理也正向集中化、一体化逐渐演进。,宏观环境,网络质量,竞争对手,“携号转网”这项惠民政策的开展,使北京移动面临比之前更大的市场竞争压力,同时也对网络安全也提出了更高的要求。,客户感知,2011年中国移动将提升客户感知作为改善网络质量的指导方向,继续发挥“网络质量大会战”的重要作用。,李跃总裁在网络工作会上指出:“实现全网质量全面领先竞争对手,建立起集中监控、集中网管、集中维护、集中优化的现代化维护体系。北京公司领导在网络工作会上指出:要“创新网络管理,推进“一体化”维护。,战略规划,5,选择课题,6,预防性维护,故障处理,网络优化,投诉处理,网络建设,27个局点,2000余万用户,10000余台设备,皂君庙区域,西客站区域,望京区域,幸福区域,网运中心作为北京移动通信网核心网络的维护部门,保障着移动通信网的安全、稳定、高效的运行,同时也是公司的日常运营收入重要保证。而核心交换设备承载着数十万的交换任务,因此关系客户感知的核心设备的预防性维护就成为我们工作中的重中之重。,6,选择课题,7,小组对2010年下半年预防性维护问题发现情况进行了统计分析,得出目前的网络预防性维护方式不能完全及时准确地发现网络安全隐患。,1、每天耗时150余人时,出错数由年初月均3件上升为年底月均5件。,3、近1%的维护项目不能确保每项核查。,2、不能及时处理呈上升趋势。,4、有3%的维护项目无专人负责。,时间:2011年3月第34次小组维护作业计划现状进行分析并归纳原因,制表人:刘春燕,故障隐患发现率在98%左右,主要原因:手工查询工作量大、易出错、不及时,7,4000余项日例行维护作业计划,500台核心网设备,12名维护人员,4个维护组,选择课题,时间:2011年2月第34次小组维护作业计划现状进行分析并归纳原因,制表人:刘春燕,从左图我们可以看出一年的日例行维护作业计划多达146万项,但我们的实际维护手段还主要停留在手动执行命令及通过小程序半自动执行的混合状态,手动执行效率低下,存在人为疏忽和遗忘,通过半自动工具手段也无法保证预防性工作的准确及时运行。,实际运维手段分析:,8,选择课题,预防性维护,HLR,SGSN,MGW,MSS,CDS,时间:2011年3月第5次小组设定课题目标,制表人:刘春燕,选题:,智能巡检平台研发,传统维护方式:,1、不能完全及时准确地发现网络安全隐患。2、手工执行预防性维护工作量大、易出错。3、很难通过增加人力及加大考核来提升效率。,小组决定开发一种全新智能化维护模式,达到及时发现故障、提高维护效率、确保审计效力的目的。经过小组讨论决定本次QC活动针对最重要的五类网元(HLR、SGSN、MGW、MSS、CDS)进行试点。,9,设定目标,98%,活动前,活动目标,99.99%,100%,活动前,活动目标,60%,故障隐患发现率,工作量,目标1:实现99.99%故障隐患发现率目标2:维护工作量降低40%,课题目标,10,提出方案并确定最佳方案-总体方案设计,针对提升预防性维护工作的迫切需求,小组成员运用“头脑风暴法”提出了11个想法。并通过亲和图进行绘制整理:,11,使用现有半自动化工具,对现有工具进行优化,开发周期短,业务有变更后快速修改,根据现有情况定制开发,灵活度高,基于区域的分散式开发解决方案,集中操作维护平台已经实现到各网元的通道,可通过EOMS故障工单的方式督促专人处理,可以利用现有网管系统,无需新购硬件设备,综合告警平台与EOMS已开发完成相应接口,提供整体的解决方案,基于网管的集中式开发解决方案,可利用多套网管系统进行联动开发,将预防性维护内容纳入统一的故障管理,开发完成后的平台有专人维护,时间:2011年4月第6次小组会议成员头脑风暴利用亲和图归纳总体方案,制图人:刘彦挺,11,提出方案并确定最佳方案-总体方案设计,我们通过使用亲和图法,提出了两种解决方案:,VS,时间:2011年4月第6次小组会议成员头脑风暴利用亲和图归纳总体方案,制图人:刘彦挺,12,提出方案并确定最佳方案-总体方案设计,需求满足,开发实现,维护保障,时间:2011年4月第7-8次小组会议对两个总体方案进行对比讨论,制图人:刘彦挺,100%满足现有维护作业计划,100%满足现有维护作业计划,平均变更实现时间为1天,平均变更实现时间为3天,预计开发2个月,预计开发1个月,需自主开发,实现较困难,需自主开发,实现较困难,目前网管系统已经实现,目前网管已有派单接口,需进行少量修改即可满足,由于缺少专业测试,可用性较差,年平均系统可用性为:98%,由开发人员进行监控维护,故障监控率为58.33%,由于拥有专业测试,可用性较高,年平均系统可用性为:99.9%,由专业的维护人员进行7*24监控,故障监控率为100%,对比项,基于区域的分布式解决方案,基于网管的集中式解决方案,对现有巡检任务的契合度,智能巡检变更的灵活度,开发周期,是否方便与综合告警对接,是否能够进行故障派单,系统可用性,系统维护性,采用,13,提出解决方案并确定最佳方案-细化方案的确定,小组在确定总体方案后,根据目前网管系统对各业务系统的运行状态提供多种支撑方式,可根据具体运维流程需要进行灵活的组合分配,满足预防性维护工作的各种要求。具体细化方案如下:,时间:2011年5月第9-11次小组会议讨论细化方案并进行试验,制图人:刘磊,14,提出解决方案并确定最佳方案-细化方案的确定,集中运行维护平台,维护人员,网元,1.集中运行维护平台通过网管系统向网元发送指令并采集返回的报文结果。,2.维护人员直接登录集中运行维护平台对全部日例行维护作业计划项目进行查看和审核,并根据异常结果来处理故障。,细化方案一:基于集中运行维护平台的一站式维护,0101010,0101010,时间:2011年5月第9-11次小组会议讨论细化方案并进行试验,制图人:刘磊,15,提出解决方案并确定最佳方案-细化方案的确定,16,测试方案,测试过程,测试方案一,结果分析,时间:2011年5月第9-11次小组会议讨论细化方案并进行试验,制图人:刘磊,结论:对报告的审核会消耗大量时间和人力,可继续优化,16,细化方案二:基于综合告警平台的人工派单式维护,提出解决方案并确定最佳方案-细化方案的确定,1.集中运行维护平台自动完成报文结果的审核,对异常项目生成智能巡检告警送至综合告警平台。,2.由专门的监控人员分析综合告警平台上生成的维护作业计划告警信息。,3.监控人员派发EOMS故障工单给相应区域的维护人员,维护人员根据故障工单来处理故障。,网元,综合告警平台,0101010,0101010,智能巡检告警,时间:2011年5月第9-11次小组会议讨论细化方案并进行试验,制图人:刘磊,17,测试方案二,提出解决方案并确定最佳方案-细化方案的确定,测试方案,测试过程,结果分析,时间:2011年5月第9-11次小组会议讨论细化方案并进行试验,制图人:刘磊,结论:人工手动派单会花费较多的时间,可继续优化,18,细化方案三:基于智能巡检告警的自动派单式维护,提出解决方案并确定最佳方案-细化方案的确定,1.集中运行维护平台自动完成报文结果的审核,对异常项目生成智能巡检告警送至综合告警平台,综合告警平台自动完成对告警信息的分析并送至EOMS平台。,2.EOMS平台根据告警信息自动生成维护作业计划告警工单,维护人员根据故障工单来处理故障。,网元,综合告警平台,0101010,0101010,智能巡检告警,EOMS平台,维护人员,时间:2011年5月第9-11次小组会议讨论细化方案并进行试验,制图人:刘磊,19,提出解决方案并确定最佳方案-细化方案的确定,测试方案,测试过程,测试方案三,结论:最佳方案!,时间:2011年5月第9-11次小组会议讨论细化方案并进行试验,制图人:刘磊,采用,20,提出解决方案并确定最佳方案-方案流程的确定,21,A0,A1,A2,A3,Z,B1,B2,C1,C2,D1,D2,基于PDPC法给出处理流程,时间:2011年6月第12次小组会议讨论确定处理流程,制图人:刘磊,21,根据方案确认需要开发的系统模块,提出解决方案并确定最佳方案-方案流程的确定,22,时间:2011年6月第12次小组会议讨论确定开发模块,制图人:刘磊,涉及3套网管系统,涉及7个功能,涉及开发调整5个模块,22,制定对策,制定5W1H对策表:,时间:2011年7月第13次小组会议讨论确定对策表,制图人:刘彦挺,23,对策实施,添加巡检方案,完成任务调度,模块1,模块2,模块3,模块4,模块5,分析智能巡检告警,自动生成告警信息,根据告警信息,自动派发EOMS告警工单,移植操作指令,开发命令脚本模板,数据采集接口开发与调整,对策,开发集中运行维护平台的数据采集接口及参数优化,实施,2011年7月31日完成集中运行维护平台上数据采集接口的开发,为了保证集中运行维护平台数据采集的成功率,我们使用正交实验法进行测试,找出最优的参数组合。,实验情况,1.制定因素位级表,2.因素说明表,时间:2011年7-9月第14-20次小组会议进行实施阶段分析及总结,制图人:刘磊,24,对策实施,添加巡检方案,完成任务调度,分析智能巡检告警,自动生成告警信息,根据告警信息,自动派发EOMS告警工单,移植操作指令,开发命令脚本模板,数据采集接口开发与调整,实验情况,3.设计实验方案,模块1,模块2,模块3,模块4,模块5,时间:2011年7-9月第14-20次小组会议进行实施阶段分析及总结,制图人:刘磊,25,对策实施,添加巡检方案,完成任务调度,分析智能巡检告警,自动生成告警信息,移植操作指令,开发命令脚本模板,数据采集接口开发与调整,实验情况,4.实验结果分析,“直接看,可靠又方便”:直接比较9个实验的成功率,容易看出,第4号的数据采集成功率最高为99.9%,“直接看”的好条件为A1B2C2。“算一算,有效又简单”:按照位级之和越大条件越好,我们得出“算一算”的好条件为A3B2C2。小组成员在7月18日-7月22日对“直接看”和“算一算”的好条件分别进行了批量实验。,根据批量时间结果,我们可以看出,”直接看”好条件的平均成功率为99.9%,”算一算”好条件的平均成功率为99.8%,在集中运行维护平台数据采集接口开发中,我们根据实验结果和实际情况选择“A1B2C2”的好条件,即连接网元并发数为10个,指令下发间隔时间为40秒,失败后重复连接次数为3次。,效果确认,在集中运行维护平台成功完成了数据采集接口的开发,通过正交实验,选择出了最优的参数组合,可将数据采集的平均成功率保持在99.9%。效果确认时间:7月23日-7月25日,模块1,模块2,模块3,模块4,模块5,根据告警信息,自动派发EOMS告警工单,时间:2011年7-9月第14-20次小组会议进行实施阶段分析及总结,制图人:刘磊,跟踪试验,26,对策实施,添加巡检方案,完成任务调度,分析智能巡检告警,自动生成告警信息,移植操作指令,开发命令脚本模板,数据采集接口开发与调整,对策,使用JavaScript编写脚本,移植人机命令并开发命令脚本的模板,实施,截至2011年8月31日,完成HLR、SGSN、MGW、MSS和CDS的脚本编写工作,并完成全部网元所有日例行维护作业计划的命令脚本共计49个模板。,脚本编程实现。,应用情况,效果确认,日例行维护作业计划中100%的项目完成脚本的测试。制作完成全部5类网元所有日例行维护作业计划的命令脚本的模板。效果确认时间:9月1日-9月3日,模块1,模块2,模块3,模块4,模块5,根据告警信息,自动派发EOMS告警工单,时间:2011年7-9月第14-20次小组会议进行实施阶段分析及总结,制图人:刘磊,27,对策实施,添加巡检方案,完成任务调度,分析智能巡检告警,自动生成告警信息,移植操作指令,开发命令脚本模板,数据采集接口开发与调整,对策,添加巡检方案,按照集团公司要求完成任务调度,实施,根据需要下发的模板和巡检网元建立巡检方案,集中运行维护平台自动生成相应的元任务,根据集团下发的设备维护细则完成所有元任务的调度工作。截至2011年8月31日,完成了全部5类网元所有日例行维护作业计划共计155项元任务的调度工作。,脚本编程实现。,应用情况,效果确认,完成了集中运行维护平台上所有元任务的建立和调度工作,实现了日例行维护作业计划项目100%的覆盖率。效果确认时间:9月1日-9月3日,模块1,模块2,模块3,模块4,模块5,根据告警信息,自动派发EOMS告警工单,时间:2011年7-9月第14-20次小组会议进行实施阶段分析及总结,制图人:刘磊,28,对策实施,添加巡检方案,完成任务调度,分析智能巡检告警,自动生成告警信息,移植操作指令,开发命令脚本模板,数据采集接口开发与调整,对策,集中运行维护平台与综合告警平台进行联调,实现巡检任务触发告警信息,实施,截至2011年8月31日,完成集中运行维护平台与综合告警平台的联调,利用告警解析脚本的规则产生的智能巡检告警(包含告警号)送至综合告警平台分析,触发综合告警平台自动生成标准告警信息。,脚本编程实现。,应用情况,效果确认,完成集中运行维护平台上告警解析脚本开发,并实现了与综合告警平台的连接,成功将智能巡检告警送至综合告警平台进行分析,正确生成告警信息。效果确认时间:9月1日-9月3日,综合告警平台,生成告警号送往综合告警平台,模块1,模块2,模块3,模块4,模块5,根据告警信息,自动派发EOMS告警工单,分析告警号生成标准告警信息,时间:2011年7-9月第14-20次小组会议进行实施阶段分析及总结,制图人:刘磊,29,对策实施,添加巡检方案,完成任务调度,分析智能巡检告警,自动生成告警信息,移植操作指令,开发命令脚本模板,数据采集接口开发与调整,对策,针对智能巡检告警,实现EOMS平台的自动派单,实施,截至2011年8月31日,实现了HLR、SGSN、MGW、MSS和CDS全部网元的智能巡检上线工作,完成了100%覆盖集团要求的日例行维护作业计划,对于异常项目集中运行维护平台将智能巡检告警送至综合告警平台分析,并生成告警信息,EOMS平台根据告警信息自动派发EOMS告警工单。,脚本编程实现。,应用情况,效果确认,EOMS平台根据综合告警平台送来的告警信息,及时将维护作业计划告警工单派发至相应的EOMS账号下,并可以短信提醒相关的维护人员。效果确认时间:9月1日-9月3日,模块1,模块2,模块3,模块4,模块5,根据告警信息,自动派发EOMS告警工单,收到维护作业计划告警工单,工单号:ID-3161-111226-00167,主题:SCCP子系统状态异常,时间:2011年7-9月第14-20次小组会议进行实施阶段分析及总结,制图人:刘磊,30,一、智能巡检方式和手工执行方式的预防性维护故障隐患对比分析,9月20日-12月19日期间智能巡检方式和手工执行方式并行执行,通过上述分析,我们可以得出:采用手工执行方式完成预防性维护工作,无法保证所有设备的故障隐患发现率都达到100%。采用智能巡检平台完成预防性维护工作,HLR、SGSN、MSS、MGW和CDS均能实现100%预防性维护故障隐患发现率。,效果检查-故障隐患发现率对比分析,0101010,0101010,VS,网元,31,效果检查-工作量对比分析,二、智能巡检方式和手工执行方式的工作量对比分析,从上表可以看出9月20日-12月19日期间,采用智能巡检平台完成预防性维护工作,平均日工时从之前三个月的12.2小时降低到了6.24小时,维护效率提高了(12.2-6.24)/12.2*100%=47.5%。而在9月20日-12月19日期间平均日工时也从手工执行方式的12.4小时降低智能巡检方式的6.24小时,维护效率提高了(12.4-6.24)/12.4*100%=49.6%。,32,32,效果检查,效果确认时间:2011年09月20日-2011年12月19日,共计3个月,时间:2011年9-12月第21-22次小组会议对实施效果进行分析,制图人:刘春燕,圆满完成活动目标,活动前,活动目标,活动后,98%,99.99%,100%,故障隐患发现率,工作量,活动前,活动目标,活动后,100%,60%,50.4%,效果1:实现100%故障隐患发现率效果2:维护工作量降低49.6%,33,效果检查,34,实用技术,提升故障隐患发现率的同时降低维护人员的工作负荷。,网管提供开放的环境,由业务人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论