轮对压装曲线中异常点数据的处理方法_第1页
轮对压装曲线中异常点数据的处理方法_第2页
轮对压装曲线中异常点数据的处理方法_第3页
轮对压装曲线中异常点数据的处理方法_第4页
轮对压装曲线中异常点数据的处理方法_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、轮对压装曲线中异常点数据的处理方法肖 峻,李光海,韩建斌(武汉理工大学 机电工程学院,湖北 武汉 430070)摘 要:为了去除轮对压装压力信号中的异常点,获得真实的压装曲线,提出了一种异常点数据处理算法-增量均值法,该算法结合压装压力信号的特点,能较好的识别并剔除异常点数据。经过在轮对压装过程中的实际应用,该算法收到了较好的效果,消除了干扰对轮对压装曲线的影响,减少了对压装质量的误判。关键词:轮对压装曲线;异常点;增量均值法中图分类号: TP301.65轮对是机车和车辆走行部的主要部件之一,是由一根车轴与两个车轮以及齿轮、制动盘等组成的完整装置。车轴与车轮、齿轮、制动盘采用过盈配合的连接方式

2、,通过压装的方法组成轮对。在轮轴压装过程中,压装曲线(即压力-位移曲线)是反映压装质量的重要评判依据。在目前广泛使用的数控轮对压装机中,压装压力信号是由计算机数据采集系统采集到的一系列具有固定时间间隔(采样频率固定)的数字时序信号。理想情况下,采集到的数字时序信号与压装过程中的压装压力是一致的,但是由于实际应用场合存在一定的干扰(突变的电、磁场或其它因素),使采集到的压力数字时序信号夹杂有信号突变,即异常点。这些异常点并不能反映油缸压力的真实变化,如果不对其加以剔除,会使压装曲线失真,造成对压装质量的误判。1 异常点对压装曲线的影响以某一台数控轮对压装机为例,其压装 曲线是通过压力传感器和位移

3、传感器采集到的数据经过数字滤波后绘制的。图1为某一轮对中左轮的压装曲线,曲线在压装位移大约42mm处出现了降吨凹槽,依据TB/T1718-2003铁道车辆轮对组装技术条件中关于轮对压装的判断标准,此车轮压装不合格。为了寻找造成该现象的原因,需要对采集信号做进一步的分析。图1 某一轮对的压装曲线在压力-位移曲线中,将出现降吨凹槽的部分放大显示,如图2所示,可以看到,在42mm之前,压力信号匀速上升,之后,有3个数据()陡然变化,由300kN降到数据(270kN),然后又急速上升到(281kN),再急速上升到(296kN)。然而,反映压装过程中压装压力收稿日期:作者简介:肖峻(1964),男,湖北

4、武汉人,武汉理工大学机电工程学院教授;博士.基金项目:湖北省科学技术研究与开发基金项目(201097289).的动态压力信号是连续变化的,经过等间隔的数据采集后获得的压力时序信号,其数据间的变化不应该有突变。因而,可以断定,此处数据的急速突变并不是压装过程中压力变化的真实反映,而是干扰数据点,应该加以剔除。图2 信号突变位置2 数据异常点的挖掘方法异常点产生有很多原因,根据不同的角度,可以将异常点分为如图3所示的几种类型。图3 异常点分类目前,比较常用的异常点挖掘方法有以下几大类:(1) 基于统计模型的挖掘方法基于统计模型的异常点挖掘方法,其思想主要来自于统计学,统计中常用的方法是:对于给定的

5、数据集合,先假设一个分布 (例如一个正态分布),然后根据该分布模型,采用不一致的原则对异常点进行检验挖掘。这种方法的缺陷在于,需要事先知道数据集数据模型、分布参数和估计的异常点的数目。由于统计学方法要求预先知道关于数据集合参数的知识,例如数据分布,但许多情况下,数据分布是未知的,尤其是在没有特定检验的情况下,统计学方法不能发现所有的异常点,或者观察到的分布情况过于特殊,不能用标准分布来建模描述。(2) 基于距离模型的挖掘方法基于距离的异常点DB(p,d)的定义:如果数据集合中至少有p部分对象与对象O的距离大于d,则对象O是一个带参数p、d的基于距离的异常点,即DB(p,d)。由上面关于异常点的

6、定义可看出,DB(p,d)统一了异常点的概念,对异常点的判断方法也比较明确,例如,设存在一个正态分布数据集,如果数据集中存在与均值之间的距离大于或等于3倍偏差的数据对象,则被认为是异常点。直观而言,如果不依赖于统计检验,可将基于距离的异常点看作是那些没有足够多邻居的对象,此处邻居是基于给定对象之间的距离定义的目前,该领域研究人员提供了若干高效的基于距离的异常点挖掘算法,比较有代表性的是基于索引的算法、嵌套循环算法和基于单元的算法,这些算法的主要特点是以对象间的距离作为相似性度量。基于距离模型的异常点挖掘方法概括了基于统计模型的异常点的含义,并且对相对高维数据集有较好的挖掘效果,然而,当数据集由

7、不同密度的子集混合而成时,基于距离的异常点挖掘效果不好。(3) 基于密度模型的挖掘方法Hawkwins异常点的定义如下:异常点是明显地偏离了其他测量值,使人们对其真实性产生怀疑,怀疑它的产生机理的点。如图4所示,为一个二维数据集的例子,该数据集包含两个聚类C1、C2和两个异常点O1、O2,虽然O1、O2都为异常点,但是有区别的,O1是局部异常点,O2是全局异常点。根据上面提到的算法,O2异常点特征明显,容易挖掘,但O1异常点却比较难挖掘出来。图4一个二维数据集从上面的例子可看出,基于距离的异常点定义DB(p,d)在一些特定的情况下是准确和充分的,但如果数据聚类密度存在不同的单元,就会出现问题。

8、为了有效的解决这个问题,基于密度模型的局部异常点挖掘算法被提出,从而保证可以判断出O1和O2在数据集中都是异常点。基于密度的诊断方法引入了度量单位:局部离群系数,来表示一个数据集中数据的离群程度,正常数据的基本上都近似等于1,所以它们不是异常点。根据局部异常点的定义及其特征,可通过对数据集中的计算来确定异常点,只要一个数据对象的远大于1,它很有可能是一个异常点,应该引起注意或者加以排除。但是,基于密度的诊断方法仍然存在一定的问题,在数据量较大时,处理时间比较长,效率比较低。(4) 基于相似度的挖掘方法数据集的相似度随应用领域的不同,相似度的定义也不同。例如,两个量的变化速度(斜率描述)保持一致

9、;波形允许在一定范围内漂移、伸缩。这种诊断方法,可以大大的减少计算量,提高效率。但相似度的确定是一个难点。3 增量均值法在介绍增量均值法之前,先给出以下定义:定义1(时间序列)时间序列是一组或多组由记录时间和记录值共同组成的元素有序集合,记为X=,,元素表示时间序列在时刻的记录值为,记录时间是严格增加的。在本文所采用的压力数据采集系统中,时间序列的采样间隔相等(采样周期为70ms),可以认为,此时将压力信号时间序列简记为。用代表时间序列中的第各元素。定义2(元素距离)元素与元素的距离是指它们的序列号之差的绝对值,记为。定义3(邻域)压力信号时间序列中的元素的邻域是指以元素为中心,与的距离不超过

10、的所有元素的集合,记为。定义4(压力增量绝对值)指压力信号时间序列中的元素相对于其前一个采样点的变化量的绝对值,记为。正常情况下,压力信号是连续均匀变化的,相邻数据的变化量在一定的范围内。以上述车轮的压力数据为例,将压力数据中相邻元素的压力增量绝对值计算出来,如图5所示,横坐标为元素序列编号,纵坐标为元素相对于其前一个元素的增量绝对值。从图5中可以看出,正常情况下,压力增量绝对值在一定的范围微小波动,当有外界干扰时,压力增量绝对值陡增,超出了正常的波动范围(10kN左右)。因此,可以通过设定适当的压力增量绝对值阈值来识别异常点。当时,则认为为压力数据序列中的异常点,应加以剔除。由此可见,的取值

11、是非常关键的。取值过小,剔除效果不明显,异常点对压装曲线的影响大,从而可能导致压装质量的误判。取值过大,则有可能将反映压装过程的真实压力数据剔除,造成压装曲线失真。图5 压力变化量分布增量均值法定义:对于压力时序信号中的元素,求出其邻域内所有元素压力增量绝对值的均值,再乘以系数来确定阈值,当时,则认为为压力时序信号中的异常点,应加以剔除。和用公式表示为:式中:为经验取值系数,值的确定可以通过多次的试验来获得。信号中的异常点去除后,可用该异常点前面的数据加上增量均值替代,即:。经过对大量压装压力数据的试验分析,最终确定,可以得到最佳的剔除效果。4 实验结果分析对上述车轮带有干扰的压装压力数据进行

12、测试,图6为对压力数据中干扰区域的检测结果,型点为检测到的异常点。可以看到,增量均值法对压装压力数据中的异常点剔除效果很好,特别是那些变化幅度很大,影响到压装曲线判断的异常点,得到了有效的消除。图6压装压力信号中异常点的检测结果异常点剔除后,再对压装压力数据进行简单的滑动平均处理,异常点对压装曲线的影响便被基本消除,压装曲线得到了正确的修正。修正后上述车轮的压装曲线如图7所示。图7 处理后上述车轮的压装曲线5 结论从以上的分析可以看出,增量均值法对轮对压装压力数据中的异常点剔除效果明显。增量均值法是在莱茵达法的基础上总结出来的一种新的剔除异常点的方法,其计算方法简便,易于计算机编程。经过在轮对

13、压装过程中的实际应用,收到了较好的效果,消除了由于干扰造成的对压装质量的误判。参考文献:1 郑东.铁路货车轮对压装曲线记录仪的 研制D.成都:西南交通大学,2003.6.2 TBT 1463-2003,机车轮对组装技术条件 S.3 朱明.数据挖掘M.合肥:中国科技大学 出版社,2002.4 詹艳艳,陈晓云,徐荣聪.基于时间序列模式表示的异常检测算法J.计算机应用研究,2007,24(11):78-79.5 詹艳艳,徐荣聪.时间序列异常模式的k-均距异常因子检测J.计算机工程与应用,2009,45(9):141-145.6 杨世杰.动态测试数据中坏点处理的一种新方法-绝对均值法及应用研究J.中国

14、测试技术,2006,32(1):48-49.7 何平.剔除测量数据中异常值的若干方 法J.航空计测技术,1995(01):19-22.8 薛年喜.MATLAB在数字信号处理中的 应用M.北京:清华大学出版社,2003.9 郑斌祥,席裕庚,杜秀华.基于离群指数的时序数据离群挖掘J.自动化学报,2004,30(1):71-76.10 高品贤.测试信号分析处理方法与程序M.成都:西南交通大学出版社,1999.A new algorithm for removing outliers from press fitting curveXIAO Jun, LI Guanghai, HAN JianbinAbstract: In order to remove outliers from press signals acquired in press fitting process, obtain true press fitting curve, a new algorithm, incremental mean algorithm is presented in this paper. According to the traits of press signals, the algorithm can distinguish

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论