基于感知学习算法的地铁通信故障研究.doc_第1页
基于感知学习算法的地铁通信故障研究.doc_第2页
基于感知学习算法的地铁通信故障研究.doc_第3页
基于感知学习算法的地铁通信故障研究.doc_第4页
基于感知学习算法的地铁通信故障研究.doc_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于感知学习算法的地铁通信故障研究 现代电子技术Modern ElectronicsTechnique2019年4月15日第42卷第8期Apr.2019Vol.42No.8上海地铁11号线采用基于通信技术的列车控制系统(Communication BasedTrain Control,CBTC)信号技术,经过不断调试及升级改造,当前运行质量得以大幅提升1。 但由于周围环境等因素的影响,经常出现车地通信异常情况,造成联动失效等问题,影响列车运行效率。 经多次观察、测试发现,作为车地无线通信系统中的核心设备,轨旁通信设备无线接入点(Aess Point,AP)的不稳定运行是造成以上现象的主要原因2?3。 虽然该线路采用冗余覆盖通信,但往往在覆盖同一区域的AP均失效的情况下,通信报警才会失效,这时故障已经发生,维护工作处于被动状态4?5。 AP通信失效往往隐藏较深,常表现为“假死”,即设备基本状态正常,但已经无法正常通信。 这种情况下,一旦相邻两个AP均处于“假死”状态,故障必然会出现6。 从上海地铁公司获知,车地无线通信系统每天都产生大量日志数据。 通过分析通信系统中的日志信息,可以得到列车的实时运行状态。 使用统计、过滤、机器学习等方法对日志数据进行处理,可得到多维度的AP状态信息,以便对AP历史状态追踪,及时发现故障AP设备,降低故障发生频次,为地铁维护工作人员提供更好的维护建议,提升列车运行质量。 基于感知学习算法的地铁通信故障研究孙亚非1,2,郭盛2,李可1(1.燕山大学信息科学与工程学院,河北秦皇岛066004;2.沧州职业技术学院信息工程系,河北沧州061000)摘要针对上海地铁11号线出现的车地无线通信失效的问题,提出一种基于感知学习算法的故障预测方法以改善通信状况。 该方法主要采用感知学习算法(PLA)相关知识,对无线通信系统中列车运行时产生的日志大数据进行分析研究,并使用AP时间?状态曲线图、AP异常状态统计图和AP告警统计表三种方式对轨旁通信设备AP运行状态信息进行统计及可视化展示。 利用地铁公司提供的真实日志数据,验证了这种故障预测方式的有效性。 这种方式能够帮助地铁工作人员及时发现AP设备隐患,预测其故障并及时维护,从而改善通信质量、提高通信效率;同时对其他地铁沿线预测通信故障具有重要的借鉴意义。 关键词地铁通信;无线通信;故障预测;感知学习算法;大数据分析;APTN913?34;TP391A1004?373X (2019)08?0094?06Research onsubway municationfault based on perception learning algorithmSUNYafei1,2,GUO Sheng2,LI Ke1(1.School ofInformation Scienceand Engineering,Yanshan University,Qinhuangdao066004,China;2.Department ofInformation Engineering,Cangzhou TechnicalCollege,Cangzhou061000,China)AbstractAiming atthe failureproblem ofwireless municationbetween the metro andsubway inShanghai metro line11,a fault prediction methodbased onthe perception learning algorithmis proposedto improvethe municationstate.In themethod,the relevantknowledge of the perceptionlearning algorithm(PLA)is mainlyused toanalyze andstudy thelog bigdatagenerated duringthemetrooperation inwireless municationsystem.Three modesof theAP time?state curvediagram,AP ab?normal statestatistical diagramand AP alarm statisticstable areused toperform statisticaland visualdisplay ofthe operationstateinformation ofthe tracksidemunication deviceAP.The effectivenessofthefault predictionmethod isverified byusingthe reallog dataprovided bythe subwaypany.The methodcan helpthe subwaystaff discoverhidden dangersof AP devicesin time,predict theirfaults andmaintain themtimely,so asto improvethe municationquality andefficiency,and mean?while,it hasan importantreference significancefor predictingmunication faultsalong othersubways.Keywordssubway munication;wireless munication;faultprediction;perceptionlearningalgorithm;big dataanalysis;AP2018?07?06修回日期2018?08?17基金项目国家自然科学基金项目 (60974018)Project Supportedby NationalNatural ScienceFoundationof China (60974018)DOI10.16652/j.issn.1004?373x.2019.08.02194第8期1日志信息分析系统设计1.1功能设计上海地铁11号线整条线路共708台AP设备,系统每天都产生一个日志文件。 为减弱或排除列车行驶沿线的无线通信设备对11号线车地通信信号的干扰,从xx年8月开始,地铁工作人员逐步对地铁AP设备加入了滤波器。 因此,选取xx年7月、9月和11月的日志文件,分别对这3个月的数据进行统计分析。 通过观察日志数据,可知AP设备的运行状态。 依据状态信息所显示的系统运行时所受影响的程度,按照由弱到强的顺序对相应的状态进行编码。 选取其中11种最具有代表性的状态进行分析,AP设备运行状态与编码对照表如表1所示。 表1AP设备运行状态与编码对照表Table1Comparison foroperation statesandcodes of AP devices编码1234561920212230AP状态列车驶入列车驶出连接到另外一个AP设备AP状态改变AP会话过期设备有心跳响应设备无心跳响应接口建立连接接口关闭连接设备重启设备挂掉状态标志Roamed IntoRoamedOutTo AnotherWirelessAgedOutResponseNo ResponseInterfaceLink UpInterfaceLink DownWarmStart&Cold StartDeviceDown在状态编码基础上,对这些日志信息进行统计分析,并使用AP时间?状态曲线图、AP异常状态统计图和AP告警统计表3种方式对统计结果进行可视化展示。 1.2系统设计对车地通信系统产生的大量日志数据进行分析,需要获取AP设备的基础信息(AP名称、位置、上下行、所属车站等)、日志信息(AP状态、具体信息、收集时间等)以及AP的故障信息(开始时间、结束时间、最差状态等)。 AP日志分析系统主要分为客户端和服务器两部分。 分析日志采用经典的MVC框架在View展示层,通过HTML网页将AP的状态、AP故障信息等展示在前端;在Control控制层,使用Spring控制器,实现前端与后端数据的交互;在Model模型层,使用MySQL数据库存储数据,通过mybatis关联数据库,获取数据库数据,并对数据进行加工分析,从而得到AP故障信息。 1.3故障预测分析算法设计AP设备在运行过程中,若正常工作,则一直处于列车驶入、列车驶出等正常状态;当AP设备陷入异常波动时,则会持续处于接口断开连接、重新启动,甚至设备宕机等异常状态。 但由于日志中的单个异常状态无法判断AP设备是否为异常,只有出现大量异常状态才能表示AP异常,所以无法使用简单的规则来对AP异常状况进行判断,只能根据已知的异常情况,通过机器学习的方法预测AP运行过程中的异常状况。 对于单个AP设备,在运行时间窗口T秒内,假设AP设备正常运行的状态、设备挂掉、设备重启、接口关闭连接、接口重新建立连接和设备无心跳响应的出现数目分别为x1,x2,x6,设AP无任何状态的最长间隔时间为x7。 通过分析可知,x1,x2,x7对判读AP是否正常的权重并不一样。 设置状态出现数目x i对应的权重为w i,则AP设备异常严重程度的函数可以表示为y=i=17x iw i (1)对于AP的异常严重程度,设置告警阈值t。 当AP的异常严重程度大于t时,则判定时间窗口T内,出现一次告警;当AP的异常严重程度小于等于t时,则判定AP正常运行。 AP告警函数f可以表示为f=-1,yt1,yt (2)式中f=-1表示该时间窗口T内出现告警;f=1表示该时间窗口T内AP正常运行。 对式 (2)进行函数变换并展开,设x0=-1,w0=t,则f表示为f=y-t=i=17x iw i+x0w0=i=07x iw i (3)对式 (3)进行矩阵变换,设x变量矩阵X=x0,x1,x7,设参数矩阵W=w0,w1,w7,则AP告警函数f的矩阵表示为f(X)=WX T (4)求解出参数矩阵W,就能通过移动窗口计算出AP设备在何时告警,以及告警时长。 在一个确定的时间窗口T内,x0=1,x1,x2,x7都可以通过统计获得,进而得到矩阵X,而参数矩阵W是的。 因此,对AP告警的求解问题转化成求解线性方程参数矩阵W的问题。 使用机器学习中的二元分类函数PLA来求解AP告警问题。 PLA算法是一种用于解决线性可分问题的分类算法,最终将问题分为两类,即是或不是7?9。 如果问题不完全是线性可分,则使用贪心法则,在所有的分类中,找到一个能将最多样本分开的线性分类器,即为该孙亚非,等基于感知学习算法的地铁通信故障研究95现代电子技术2019年第42卷问题的最优解10。 从日志数据中分别随机抽取n个大小为T的独立时间窗口,并判断在这些时间窗口内AP是否正常工作,得到资料N=?X1?X n?y1?y n。 其中X i表示第i个时间窗口内的状态;y i表示这个时间窗口内AP是否正常,取值为0或1。 由于资料是随机抽取的,则当n足够大时,如果能够找到一个W,使得绝大部分的资料都满足f(X i)=WXTi=y i,那么,根据机器学习的VC维理论,则W有很大概率能够代表实际的告警参数规则。 在实际应用中,由于资料N中数据存在噪音(数据可信度不一定为100%),很难使得所有的资料都满足f(X)函数。 因此,机器学习算法PLA需要保证让尽可能多的资料都能满足分类函数。 为了保证尽可能多的资料满足条件,PLA算法引入了误差函数err err=1ni=1nf(X i)y i (5)初始化一个线性分类向量W0,将W0代入资料N中,得到err0,同时记录错误的资料E=?X i?X j?y i?y j,此时由于错误的存在,需要对W0进行一定程度的修正,来获取更好的分类向量W。 从E中选取出一个资料X iy i,对线性向量W0进行一定角度的旋转W1=W0+y iX i (6)得到新的W后,重新将资料N代入得到err,依次往复,直到进行K次修正之后,从K次修正中获取err最小的分类向量W s,该分类向量即为AP设备在实际窗口T内的告警分类器。 通过PLA分类算法,可以方便地获得时间窗口T内的最佳分类向量,接下来的工作就是如何确定最佳的时间窗口T大小。 在一个确定的时间窗口T内,AP告警分类的平均误差函数为err=1Terr=1Tni=1nf(X i)y i (7)通过不同大小的时间窗口T和PLA计算获得时间窗口下的平均误差err,当平均误差err最小时,即为AP告警问题的最优解。 通过PLA算法得到时间窗口与平均误差的线性图如图1所示。 可以看出,当时间窗口为9min时,计算出来的平均误差最小。 因此,选取9min作为样本提取的最佳时间窗口。 在确定时间窗口之后,通过时间窗口获取样本,代入上述PLA算法,对PLA分类进行调整、校正,得到最终的分类函数为f=10+0.298x1-41.232x2-1.309x3-0.134x4-0.042x5-0.825x6-0.086x7 (8)从式 (8)可以看出,对正常运行状态x1,如果在时间窗口内,正常运行状态越多,则AP在该时间窗口内异常可能性越小;如果AP出现宕机状态,则有极大可能发生异常。 图1时间窗口与平均误差曲线图Fig.1Curve diagram of timewindow andaverage error2日志信息分析结果2.1数据整体分析分析7月、9月和11月三个月份的日志数据,总计1727万条。 在这些数据中,各状态占比如表2所示。 表2日志信息各状态占比统计表Table2Percentage statisticsfor variousstatesof loginformation状态列车驶入列车驶出AP状态改变AP会话过期设备有心跳响应设备无心跳响应接口建立连接接口关闭连接设备重启设备挂掉数目82469578059484103405103299685096816152796260365271725167状态百分比/%47.7433446.658020.598630.598020.396610.039460.884571.507311.573070.00097由表2可知,AP设备稳定运行状态占比达96%以上。 而在非稳定运行状态中,除了设备宕机这种特殊的状态外,其他异常状态并不能直接说明设备的异常情况。 以设备重启为例,设备在正常状态下,由于设备运行的需要会有规律、低频次地热重启。 因此,设备异常状态的判断依赖相关算法分析。 2.2AP时间状态曲线图AP时间状态曲线图反映AP设备运行实时状态变96第8期化情况,如图2所示。 通过状态曲线图可以方便地观察到AP的状态变化。 图2AP状态变化曲线图Fig.2Curve diagramof APstate variation从图2可以看出,AP一直处于平稳的低分状态,并伴有规律地保持着接口重启和热重启状态,以维持系统的正常运行。 对绝大部分AP的大部分时期,AP都处于这种正常的波动状态。 但对于异常AP设备而言,它将在很长时间内都处于异常状态,甚至产生死机的情况,如图3所示,异常点明显异于正常心跳波动。 图3AP异常状态变化曲线图Fig.3Curve diagramofAP abnormal statevariation通过AP时间状态曲线图,可直观地观察AP实时的状态信息,并且能够长时间地观测AP的信号状态,是跟踪和追溯AP状态的一个良好途径。 但曲线图也存在局限性,即在异常AP情况下,需对所有AP设备逐个、逐天观察才能发现其异常状态,难以快速地定位异常。 同时,这种直观观察AP异常的方式,难以量化异常的发生时间、严重程度及异常的持续时长。 2.3异常状态统计图AP异常状态统计图反映的是在一段时间内,AP设备异常状态出现的数量占比。 它分为两个维度站点维度和AP设备维度。 其中,站点维度可以快速查询一段时间内,车站的异常占比,如图4所示;AP设备维度可以查询在一个站点下,所有AP设备的异常占比,如图5所示。 图411号线地铁站点异常状态统计图Fig.4Pie chartfor abnormal state statisticsofstations of metro line11图511号线地铁某一站点AP异常状态统计图Fig.5Pie chartfor APabnormalstatestatisticsof acertain stationofmetroline11通过两个维度对日志信息统计分析,能够从整体上查看AP告警状态,快速定位错误较高的AP设备。 如图6所示,通过站点统计图观察AP重启次数可以看出,编号为AP2101的设备重启次数远高于其他设备,那么可以判定该AP设备存在告警状况可能性极大。 图6站点AP重启次数异常统计Fig.6Abnormal statisticsfor APrestart timesof stationsAP异常状态统计图是从整体角度分析AP异常状态。 通过异常统计图,可以从站点和AP设备两个维度定位异常状态,避免了逐个AP查询观察的困扰,加快了定位异常设备的速度。 统计图能快速定位出严重异常的AP,但是对于AP设备的短暂异常,异常状况容易被淹没于大量的数据流中,很难准确定位出短暂异常;同孙亚非,等基于感知学习算法的地铁通信故障研究97现代电子技术2019年第42卷样,该统计图不能量化AP异常的严重程度、异常发生时间及异常的持续时长。 2.4AP告警状态大数据分析预测由于上述两种统计方式都存在难以量化、难以准确定位故障AP设备的问题。 但分析车地通信日志数据信息的主要目标是能够快速直观地显示AP的告警状态并迅速定位故障AP设备。 通过机器学习的方法,使用线性二分类算法,从日志数据中抽取AP异常告警信息作为样本,训练出分类参数,进而将分类参数代入分类线性公式,得到线性分类模型。 然后从AP实时信号特征中抽取特征,将特征代入线性分类模型中,最终得到训练结果。 使用机器学习方法对数据模型进行反复训练,得到AP告警状态统计表如图7所示。 图7AP告警状态统计表Fig.7Statistics ofAPalarmstates从统计表中可得知,在一段时间内,信息包括告警的车站信息、AP信息、告警状态、开始时间、结束时间及持续时长等。 通过这些告警信息能够快速、直观、量化地表现AP告警的状态,为准确快速定位故障AP设备提供很好的参考价值。 选取7月、9月及11月若干天的日志数据进行统计分析。 异常AP设备统计结果情况如表3所示。 表3三个月份日志数据异常AP统计分析表Table3Abnormal APstatistics analysisforlog dataof threemonths日志数据日志统计天数/天异常AP数异常次数异常持续时间/min日均异常AP日均异常次数日均异常时长7692.77477.699月7749114651.007.001637.8611月12111353140.921.08442.83从表3可以看出,11月和7月相比,AP异常数量和异常次数都大幅减少,但9月比7月和11月存在更多的异常次数。 通过对9月日志数据观察发现,9月的AP2101从9月22日25日时间段内,AP一直处于反复重启甚至宕机的不工作状态,从而造成9月份AP异常状态过多现象。 9月编号为AP2101的AP设备状态曲线图如图8所示。 图8编号为AP2101的AP设备9月份状态变化图Fig.8State variationdiagramofNo.AP2101APdevicein September由于AP2101号AP设备从9月22日25日时间段内存在系统故障,对正常的信号异常分析产生了较大的干扰,因此需要将该系统故障异常状态排除。 排除系统故障异常后,AP异常状态统计情况如表4所示。 表4排除系统故障之后AP异常状况统计表Table4Statistics ofAPabnormalstatesafter systemfault removal日志数据日志统计天数/天异常AP数异常次数异常持续时间/min日均异常AP日均异常次数日均异常时长7692.77477.699月76833210.861.14474.4311月12111353140.921.08442.83表4详细列出了7月、9月及11月三个月份的日均异常AP设备数量、日均异常次数、日均异常时长所占比例。 通过对比发现,加入滤波器之后,AP的异常数量、异常次数、异常时长所占比例都有所减少,说明滤波器在一定程度上起到了降低AP异常干扰的效果。 但添加滤波器的方法仍存在一些不足,比如并不能彻底解决AP故障的问题,即添加AP滤波器之后,AP异常状况依然存在;另外,通过异常状况统计表可知,虽然AP异常频率降低了,但日均异常持续时长并没有降低,异常情况依然存在。 3结论从AP时间状态曲线图可直观地观察AP实时的状98第8期态信息,并且能够长时间地观测AP的信号状态,但不容易发现并定位AP设备异常状态。 AP异常状态统计图可以从站点和AP设备两个维度定位异常状态,避免了逐个AP查询观察的困扰,加快了定位异常设备的速度,但很难准确定位出AP设备短暂异常状态。 以上两种方式难以量化异常的发生时间、严重程度及异常的持续时长。 而AP告警统计表能够快速、直观、量化地表现AP告警的状态,展示告警的车站信息、AP信息、告警状态、开始时间、结束时间及持续时长等。 这三种方式虽然都不能彻底解决列车运行时车地通信时产生的故障,但能够帮助地铁工作人员及时发现AP设备隐患及预测其故障,及时维修和更换通信设备,从而改善通信质量,提高通信效率。 参考文献1张捷.上海轨道交通11号线基于通信的列车控制系统车?地通信故障分析J.城市轨道交通研究,xx,18 (7)81?84.ZHANG Jie.Analysis ofvehicle/ground municationfault ofShanghaimetroline11based onCBTC systemJ.Urban masstransit,xx,18 (7)81?84.2李欣磊.地铁无线AP信号质量监测方法研究D.上海上海工程技术大学,xx.LI Xinlei.Research onwireless APsignal qualitymonitoringmethod ofsubwayD.ShanghaiShanghai University of Engi?neering Science,xx.3宫光天.地铁无线AP信号质量检测算法的研究与优化D.上海中国科学院上海高等研究院,xx.GONG Guangtian.Research andoptimization ofwireless APsignalquality detection algorithm ofsubwayD.ShanghaiShanghai AdvancedResearch Instituteof ChineseAcademy ofSciences,xx.4陶小婧.上海轨道交通CBTC系统无线车地通信研究及通信异常分析J.上海工程技术大学学报,xx,31 (2)149?153.TAO Xiaojing.Analysis onwireless TWCand abnormalmu?nication forCBTC systemof Shanghairail transitJ.Journal ofShanghaiUniversityofEngineering Science,xx,31 (2)149?153.5刘志涛.地铁车辆CBTC系统车载信号常见故障归类分析J.科技创新与应用,xx (15)121.LIU Zhitao.Common faultclassification analysisfor on?boardsignals ofsubway vehicleCBTC systemJ.Technology innova?tion andapplication,xx (15)121.6肖彦博.谈城轨交通CBTC系统故障归类及其设计应对策略J.现代城市轨道交通,xx (3)12?14.XIAO Yanbo.Failure classificationand correspondingdesignstrategy forCBTC systemof transitJ.Modern urbantransit,xx (3)12?14.7刘建伟,申芳林,罗雄麟.感知器学习算法研究J.计算机工程,xx,36 (7)190?192.LIU Jianwei,SHEN Fanglin,LUO Xionglin.Research onper?ceptionlearningalgorithmJ.Computer engineering,xx,36 (7)190?192.8周志华.机器学习M.北京清华大学出版社,xx.ZHOU Zhihua.Machine le

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论