付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于统计学习理论的故障诊断方法研究
故障诊断技术可分为三种类型:基于分析模型的方法(如状态评估方法)、基于处理器的方法(如基于小波变换的方法)和基于知识的方法(如基于神经网络的方法)。由于工业系统(设备)变得越来越复杂,因此基于解析模型的方法在实际中的使用受到了很大的限制;而后两类方法在处理对象的复杂特性方面具有较大的优势,因此近年来一直倍受重视,并取得了相当的研究成果。然而这两类方法在本质上都是基于数据学习的,其理论基础是传统的统计学。按经典统计数学中的大数定律,统计规律只有当训练样本数目接近无限大时才能准确地被表达。然而在处理故障诊断等实际问题时,只能得到有限的样本数据,样本数目极其有限。因此利用传统的基于经验风险最小化方法得到的故障诊断模型的性能较差,影响了实际使用效果。上世纪60年代以来,以Vapnik为代表的研究人员建立了一套能保证从有限样本得出预报能力最强的数学模型的“统计学习理论”,并先后提出分类和回归的支持向量机算法(简称SVM)。它们既能有效地处理非线性数据,又能限制过学习,特别适合于小样本集的数据处理。该理论一经提出,在国内外机器学习等领域引起高度重视,并逐步在多个领域得到了应用。本文首先根据统计学习理论,分析了传统的故障诊断方法存在的局限性。然后,提出了基于支持向量机的故障诊断方法和步骤。冷冻压缩机组诊断实例表明,与神经网络方法相比,该方法是十分有效的。1神经网络故障诊断模型建立的前提基于数据学习的传统故障诊断方法(如神经网络方法)的局限性主要表现在:(1)对学习样本的要求高:神经网络故障诊断方法对样本的要求高首先表现在样本的数量,即样本数据的分布要能覆盖故障模式,这样样本数目必然要多。其次要求样本的质量高,即训练样本必须包含尽可能多的故障模式,类似的故障模式样本不能有矛盾或冲突。然而,在实际问题研究中,这样的要求较难满足。首先,一个复杂系统(设备)的故障模式是有限的,而在该设备的生命周期中,每一类型的故障至少出现一次的概率较小。其次,由于现代制造技术、控制技术和企业管理技术等的发展,设备发生故障的可能性越来越小。再者,许多类型的机械设备,即使是同样的设备,在不同的安装和使用条件下,设备故障模式样本也会相差很大。因此,只可能得到该设备的故障模式样本,而不是该类设备的故障模式样本。显然,某具体设备的故障模式样本必定非常有限。综上所述,已知的故障模式样本通常是小样本数据,它们在数量和质量上都不能满足高性能神经网络故障诊断模型对学习样本的要求。(2)模型的泛化性能较差:传统的神经网络故障诊断模型基于经验风险最小化的原则,这样很容易导致神经网络的过学习,即训练误差过小而导致泛化能力的下降。产生过学习现象的原因一是样本不充分,二是故障诊断模型设计不合理,且这两个问题是相互关联的。对于两类分类问题,根据统计学习理论,对指示函数集中的所有函数(包括使经验风险最小的函数),经验风险Remp(ω)和实际风险R(ω)之间以至少1-η的概率满足以下关系:R(ω)≤Remp(ω)+(h(ln(2n/h)+1)-ln(η/4)n)1/2(1)R(ω)≤Remp(ω)+(h(ln(2n/h)+1)−ln(η/4)n)1/2(1)式中,R(ω)为实际风险;Remp(ω)为经验风险;h是函数集的VC维,n是样本数。这一结论从理论上说明了学习机器的实际风险由两部分组成:一是经验风险(训练误差),另一部分称作置信范围,它和学习机器的VC维及训练样本数有关。式(1)可以简单地表示为:R(ω)≤Remp(ω)+Φ(h/n)(2)R(ω)≤Remp(ω)+Φ(h/n)(2)式(2)表明,在有限训练样本条件下,故障诊断模型的VC维越高(复杂性越高)则置信范围越大,导致真实风险与经验风险之间可能的差别越大,这就是出现过学习的原因,从而导致故障诊断模型的泛化性能差。建立故障诊断模型的过程不但要使经验风险最小,还要使VC维尽量小以缩小置信范围,以取得较小的实际风险,即对未来的样本有较好的推广性。(3)模型的结构和参数难于优化:为了得到好的故障诊断模型,传统的基于数据学习的故障诊断方法中,对于故障诊断模型和算法的选择有“试凑”的过程,该过程可以理解为调整置信范围的过程。如果模型比较适合现有的样本(相当于h/n值适当),则可以取得较好的效果。但因为缺乏理论指导,这种选择只能依赖先验知识和技巧,造成了对使用者技巧的依赖。然而,由于没有系统性的方法,即使一个“技巧”高明的设计者,也不能保证每次都可以得到模型结构和参数都接近最优的故障诊断模型。从以上分析可知,传统的基于数据学习的故障诊断方法的局限性的根源就在于其是基于经验风险最小化的理论,而该理论大样本数据的要求在实际使用中较难满足。而支持向量机采用结构风险最小化原理,兼顾训练误差和泛化能力,在解决小样本数据集及非线性问题上有独特的优势,特别适合用于建立故障诊断模型。2基于支持向量机的故障诊断方法2.1线性不可分的非线性变换SVM方法是从线性可分情况下的最优分类面提出的。所谓最优分类面,就是这样的分类超平面、它不但能够将所有训练样本正确分类,而且使训练样本中离分类面最近的点到分类面的距离(定义为间隔)最大,如图1所示。通过使间隔(margin)最大化来控制分类器的复杂度、进而实现较好的泛化能力。在线性不可分的情况下,通过非线性变换将输入空间变换到一个高维特征空间。在这个新空间中求取最优线性分类面,而这个非线性变换是通过内积核函数实现的。支持向量机的训练算法主要有以SVM-light为代表的分解算法、序惯分类方法(SMO)和在线训练算法等。本文采用SMO算法训练故障分类器。2.2故障诊断模型支持向量机在分类问题上只考虑了二值分类的简单情况,在解决故障诊断等多值分类问题时,需要建立多个支持向量机。比较典型的方法有两种:一种是“一对多”(Oneagainsallmodel)策略,即一个SVM分类器将每一类模式与剩下的所有类别的模式区分开,这样需要构造的SVM故障分类器的数目等于故障模式个数。这种方式的缺点是对每个分类器的要求较高。第二种是“一对一”(Oneagainstonemodel)策略,即为了对n个类的训练样本进行两两区分,分别构造[n(n+1)]/2个SVM分类器。在测试时,使用成对的SVM进行鉴别比较,每一次淘汰一个SVM分类器,而优胜者间继续进行竞争淘汰,直到最后仅剩一个优胜者。该优胜SVM分类器的输出决定测试数据的类别。由于故障诊断研究中,故障模式的数量不会太多,因此本文选择用“一对多”策略来研究故障诊断问题。已知某系统故障训练样本(x1,y1),…,(xl,yl),其中xi∈Rn,yi∈{-1,1},l为样本容量,n为故障诊断特征参数的个数,并设系统故障种类数为m,则建立SVM故障诊断模型的步骤为:步骤1数据准备:(1)对训练数据进行规一化处理,以消除量纲的影响。(2)调整yi:若故障属于第q类,则yqi=1,否则yqi=-1。步骤2建立SVM故障分类器:把训练样本通过函数ue001φ映射到高维特征空间,选择适当的核函数和惩罚参数C,利用训练样本(xi,yi)求解如下的二次优化问题,以获得(αi,b)及其对应的支持向量:maxW(α)=-12l∑i,j=1αiαjyqiyqjΚ(xi,xj)+l∑i=1αi(3)s.t.αi≥0‚l∑i=1αiyqi=0;q=1,2,⋯‚mmaxW(α)=−12∑i,j=1lαiαjyqiyqjK(xi,xj)+∑i=1lαi(3)s.t.αi≥0‚∑i=1lαiyqi=0;q=1,2,⋯‚m式中αi,αj为拉格朗日乘子,而在参数b求解中利用了Karush-Kuhn-Tucker条件。K(xi,xj)为核函数。核函数在支持向量机中起了重要作用,它将高维特征空间中的非线性运算转换为原输入空间的核函数计算,避免了“维数灾难”和确定非线性函数的形式和参数等复杂问题。而核函数的选择却并不是难事,根据Mercer定律,核函数是满足Mercer条件的任意对称函数。常用的核函数有:线性核K(x,xi)=x·xi;径向核K(x,xi)=exp-∥x-xi∥22σ2−∥x−xi∥22σ2;多项式核K(x,xi)=(x·xi+1)d,d=1,2,…,N;感知器核K(x,xi)=tanh(βxi+b)本文选用了径向核函数。利用获得的αi,b以及支持向量(xi,yqi),可以得到第q类故障的诊断模型:fq(x)=p∑i=1αiyqiΚ(x,xi)+b(4)重复进行步骤2共m次,得到m个故障分类模型。步骤3利用获得的诊断模型,即可根据故障输入模式,判断故障类型。若第q个诊断模型的输出等于1,则有第q类故障发生;若第q个诊断模型的输出等于-1,则无第q类故障发生。训练好的故障诊断分类器,对每一个故障输入,应该只有一个SVM分类器的输出为1。若出现多个SVM分类器的输出为1,则SVM的分类模型要重新训练。3故障诊断模型某企业YORK冷冻机组使用时间较长,已经到了事故易发阶段,因此,为该机组开发了状态监测与故障诊断系统。该系统能诊断的常见故障有:不平衡(F1)、不对中(F2)、喘振(F3)、油膜振荡(F4)、齿轮损坏(F5)、装配件松动(F6)、轴承偏心(F7)、部件摩擦(F8)和止推轴承破坏(F9)等。状态监测系统采集了大量振动和工艺参数,工作人员通过主监视图、时基图、频谱图、时基-频谱图等多个监测窗口,能初步掌握冷冻机组的工作状况,一旦有异常,即可启动故障诊断模块。诊断模块采用轴承振动烈度作为评定标准,用频谱图及频率分布分析的方法来确定故障模式。由于频谱图上的一些倍频及工频的分数倍频的振幅集中了振动的大部分能量,体现了各种振动状态,因此可以用这些频率下的振幅作为故障特征。可以把每一测点的振动信号进行傅立叶变换,选用(0~0.39)X、(0.4~0.49)X、0.5X、(0.51~0.99)X、1X、2X、(3~5)X、(6-z)X及≥zX等共9个频段作为特征频率,其中X为轴转速频率,即工频,zX为齿轮啮合频率。根据不同的频率分量对应不同的振动原因,通过分析各种频率的幅值大小和引起振动的主要频率成分,判断出各种故障。用标准故障模式训练故障诊断模型,共得到7个故障
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学生作业管理办法
- 文化办公用品公司工作管理办法
- 汽车顾问式销售-【实训指导书】项目九 服务跟踪
- 学习文学写作:如何高效阅读积累写作素材
- 2026年高职(工商管理)岗位实操测试试题及答案
- 2026年高职(港口航道与治河工程)航道疏浚工艺专项测试题及答案
- 双减背景下卓越教师提高教学成绩的“四大支柱”
- 2026年精密测量技术试卷及答案
- 步进梁加热炉炉温综合优化控制策略:模型、方法与应用
- 心理健康辅导技巧日常应用试卷
- 2026年及未来5年市场数据中国离子色谱仪行业市场深度研究及投资策略研究报告
- 2025年陕西国防工业职业技术学院单招职业技能考试试题及答案解析
- 介入治疗围手术期疼痛管理专家共识2026
- 2025年青岛地铁校园招聘笔试题及答案
- 2026海南海口市纪委监委所属事业单位招聘4人备考题库(第一号)完整参考答案详解
- 2025年扬州市职业大学单招职业技能考试题库附答案解析
- 三国空城计课件
- 中药饮片GSP培训课件
- 鼎捷软件在线测评答案
- 血透患者用药课件
- 2025年省属国企公开招聘备考题库参考答案详解
评论
0/150
提交评论