【《基于最小二乘支持向量机的水轮机组振动故障诊断分析》3800字】_第1页
【《基于最小二乘支持向量机的水轮机组振动故障诊断分析》3800字】_第2页
【《基于最小二乘支持向量机的水轮机组振动故障诊断分析》3800字】_第3页
【《基于最小二乘支持向量机的水轮机组振动故障诊断分析》3800字】_第4页
【《基于最小二乘支持向量机的水轮机组振动故障诊断分析》3800字】_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于最小二乘支持向量机的水轮机组振动故障诊断分析目录TOC\o"1-3"\h\u19514基于最小二乘支持向量机的水轮机组振动故障诊断分析 1176751.1引言 1196091.2SVM的基本原理 2252431.2.1硬间隔支持向量机 2211181.2.2软间隔支持向量机 413571.2.3支持向量机回归 5237861.2.4多分类支持向量机 5244841.3最小二乘支持向量机 5280871.3.1最小二乘支持向量机基本原理 6102211.3.2最小二乘支持向量机的核函数 757391.4仿真分析 8215671.1.1诊断实例一 873671.3.2诊断实例二 91.1引言水轮机组振动信号故障诊断在本质上是一个分类算法的问题,是对经过降噪预处理的信号,通过提取到的特征与已知各类型故障的的特征进行比对,达到判别或预判故障的目的。传统故障诊断方法多通过实验的方式进行无法自动的诊断故障,针对对于水轮机组故障类型具有不确定性的多元耦合振动信号的特点,无法使故障类型与振动信号建立一一映射的关系准确的判别故障类型,诊断效率低、精度差;且传统故障诊断方法基于经验风险理论对实际上有限的振动故障样本进行训练,造成对于未知样本特征识别分类会出现欠拟合或过拟合显现,造成故障模式分类的错误限制了在于多分类问题方面的推广性。随着人工智能的发展,机器学习方法的出现对于小样本、非线性、高维模式识别问题表现出了良好的学习能力和推广性能。其中以统计学习理论(StatisticalLearningTheory,STL)为基础,采用结构风险最小化的理论代替传统的经验风险最小化的评价标准,进行分析数据训练分类器并从中寻找规律生成特定数据处理规则进行模式识别。支持向量机理论有严谨的理论基础支撑,在有限的训练样本的情况下进行训练具有较高的适应性能和泛化能力;采用核函数将输入映射到高维空间实现了对非线性信号使用线性算法求解,解决了线性不可分问题;且凸二次规划算法可求得最优解避免多解产生,并自动建立网络拓扑结构,提高分类问题的精确度,因而在故障诊断和模式识别领域得到了广泛的应用。但也存在着多个支持向量机构建方式难以协调规划确定、诊断性能对参数的选择依赖性过大、非此即彼的原理对于不确定问题缺乏灵活性等问题。因此,本文在支持向量机的基础上提出了最小二乘支持向量机简化了计算过程的复杂性以避免过度训练,提高了训练的效率、提高故障诊断的实时性;对支持向量机的参数进行优化,提高参数的适配度以参数降低错分样本谬误性、提高诊断模式分类精度。1.2SVM的基本原理支持向量机是基于结构风险最小化原则而提出的一种通用学习算法。SVM的提出最初是为了解决二分类问题,其核心思想就是将维输入空间中所有待分类的样本映射到具有较低VC维的维高维空间中,然后利用凸二次规划算法寻找能将这些数据分开的最优超平面,使两类数据点均位于其两边,且与此平面的间隔最大化,使平衡泛化能力与拟合能力都达到最佳效果。通常利用每个数据的Lagrange算子计算两类别之间“最大间隔”。1.2.1硬间隔支持向量机设维输入样本集,可分为1和2两类。对于,如果它属于类别1,标记,如果属于类别2,则标记。若样本集为线性可分的,可构建合适的超平面即决策函数的表达式为: 满足 其中,为超平面的权值维矢量,为偏置常数;“.”代表向量内积。该样本集线性可分因而没有在超平面上的样本。决策函数簇为: 对应的目标函数可定义为: 其中,为任意一个样本点距离最优超平面的距离,为决策函数的泛化区域。引入Lagrange算子后,定义如下函数: 其中,为Lagrange系数。求解的关键在于利用和确定出函数的最小值。令,则目标函数变为 其中为该方程最优解。有对偶性可将上式等效为: 其中为该方程最优解,且。因此,可对系数,和进行偏微分处理,由库恩-塔克条件(KarushKuhnTucker,KKT)可得: 此时变量仅为,通过添加原约束条件即可将上述问题转换为凸二次规划的对偶问题: 求出后,可得 1.2.2软间隔支持向量机当训练样本线性不可分时,可通过非线性函数将低维数据点投影到对应的高位线性空间为后续进行相应的线性划分做准备,通过定义适当的核函数计算得到最优分类面实现对样本的分类过程。同时,在映射过程中维数会急剧增长,为避免出现“维数灾难”现象,在求解时通常不用选取,而只采用核函数将这一过程转移到输入空间中,在高维空间中只作内积运算以减弱计算的复杂性。具体过程如下:引入松弛变量进行优化,使所有样本都可被超平面正确分类,可得: 其中,为惩罚因子常数,可以避免时样本被误判,提高泛化能力,平衡最大间隔和最小分类误差达到最佳效果。同理可知,线性不可分样本SVM二次规划算法完成后可得到: 其中,称为SVM的核函数,会影响核空间中输入样本的分布情况是实现线性不可分样本分类的关键。该优化问题的特点是大部分;当时,对应的样本为支持向量机;当时,所对应的样本为标准支持向量(NormalSupportVector,NSV)。综上,可得决策函数为: 其中,为的数目,代表的集合。1.2.3支持向量机回归支持向量机的回归问题不中输出可取任意实数,而在支持向量机的分类问题中输出只允许取两个值(或有限个值)。因此,回归问题可以当作是分类问题上的优化升级,本文在水轮发电机组振动故障诊断方面使用的是支持向量分类机,所以支持向量回归机方面的理论就不再叙述了。1.2.4多分类支持向量机标准支持向量机的输出有两个值,因此只能将样本分为两类,但在实际应用过程中面临的问题不仅仅需要将样本分为两类,还需将样本按照不同的特征分为几类。为了简化分类过程,按照以下方法进行分类。一对多构造方法:对类样本,构造个两分类子分类器,第个子分类器以第类为正,其余类型为负,最后子分类器输出值最大的一类为样本所属类别。但存在正样本数量远远小于负样本数量造成分类精度较低,以及训练过程要适用所有样本数据导致效率较低的问题。一对一构造方法:对类样本,在标准支持向量机的分类方法分为两类,因而共需要进行次分类,然后比较每次分类结果的准确度,共计次数最多的类别即为判断得出的结果。相对于一对多分类方法,一对一的方法具有更高的精度,但当训练样本类别较多时同样效率较低。1.3最小二乘支持向量机最小二乘支持向量机是以支持向量机为基础,采用了最小二乘线性系统作为损失函数代替二次规划算法,用等式条件代替传统支持向量机中的不等式条件,进而利用等式方程来获取最优分类超平面,简化了运算过程,进而提升了运收敛速度与诊断精度。1.3.1最小二乘支持向量机基本原理图4-1输入空间到特征空间的映射图图中,为样本空间,为的输入向量,为高维特征空间,为的投射向量。给定训练样本。其中,为维输入向量,为1维输出向量。用作函数逼近的LSSVM,其优化问题为: 其中,为正规化参数。约束条件为: 同理,引入Lagrange乘子后可构造函数: 根据KKT条件对上式进行优化可得: 消去和后,得到: 其中,,,,根据Mercer定理,存在映射函数和核函数,使得: 则LSSVM的决策函数为: 1.3.2最小二乘支持向量机的核函数对于给定的函数,高维特征空间中的内积可以用输入空间中的函数来表示的充要条件(Mercer条件)是: 对于任意给定的函数有: 那么就对应了特征空间中的一个内积。采用不同的内积函数(核函数)就定义了不同的支持向量机,LSSVM的常用核函数函数有:径向基函数(RadialBasisFunction,RBF) 其中,为函数的宽度参数,取决于样本的复杂程度。此时支持向量机是径向基函数支持向量机分类器,在特征空间中具有平移不变性。多项式核函数(PolynomialKernelFunction,PKF) 其中,,且由用户决定。此时支持向量机为阶多项式核函数的支持向量分类机。Sigmoid核函数 其中,,,可以决定Sigmoid的特性,应使Sigmoid满足Mercer定理。支持向量机网络的权值、隐含层的层数即隐含层节点数目都是由算法自动确定的。RBF核函数来构建LSSVM的学习能力和训练结果均优于其它两种,且具有较少的参数仅包括和,统称为“超参数”。当一定时,若较小,会造成过学习的现象增加测试偏差的产生,反之欠学习将减弱分类精度;当一定时,若较小,将导致欠学习,使得分类误差随的增加而逐步减小,提高泛化能力会提高,反之亦然。因此,选取合适的和参数,是使最小二乘支持向量机学习与泛化性能相对达到最佳状态以保证诊断精度的关键。1.4仿真分析1.1.1诊断实例一为了验证模型在水电机组故障诊断中的可行性,以美国西储大学的滚动轴承数据集作为样本进行仿真分析。选取滚动轴承正常工作,内圈故障(故障深度为0.007英寸),外圈故障(故障深度为0.007英寸),内圈故障(故障深度0.014英寸)以及外圈故障(故障深度为0.014英寸)五种不同的工作状态,分别赋予标签1,2,3,4,5。五种工作状态下各有40个样本,每个样本容量为3000。将所有样本均进行基于EMD的小波阈值降噪的特征提取处理。然后,在这200个样本中,随机选取每种工作状态的35个样本数据作为训练样本训练最小二乘支持向量机模型,并将剩下的5个样本数据作为测试模型测试模型的诊断精度。共计175个训练数据和25个测试数据。采用一对一的方式建立多故障分类器,惩罚因子参数为10,核函数参数为20。这里仿真软件采用的是MATLAB。训练完毕后,用测试样本测试模型的诊断精确度,诊断精度结果如图4-2和表4-1所示,结果表明针对不同的故障类型表现出不同的诊断精度,对故障深度为0.014英寸的外圈故障诊断精度最高。图4-2仿真分析结果表4-1LSSVM对五种特征的识别率故障特征正常工作内圈故障(0.007)外圈故障(0.007)内圈故障(0.014)外圈故障(0.014)识别率98.6795.7996.5096.6197.661.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论