版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于堆栈降噪自编码网络的故障监测分析案例目录TOC\o"1-3"\h\u4446基于堆栈降噪自编码网络的故障监测分析案例 196461.1引言 1251291.2随机森林算法 293811.3自编码器概述 222641.3.1自编码器 2243171.3.2降噪自编码网络 38331.3.3堆栈降噪自编码网络 4219001.4基于降噪自编码网络的故障监测 5183891.4.1故障监测指标 55531.4.2RF-SDAE故障监测流程 6311241.5实验结果与分析 7210711.5.1TE仿真平台介绍 7134681.5.2TE仿真数据实验验证 930531.5.3美国密西根大学IMS滚动轴承全寿命实验平台 11621.5.4滚动轴承全寿命数据实验验证 121.1引言复杂工业过程数据的高维度、非线性等特性,导致故障监测系统运行存在计算量大、运算耗时长等问题。为实时监测复杂工业过程的故障状态,就需要降低模型的计算时间。实际上,在某些故障情况下,并非所有过程变量都受到干扰。一些变量将受到严重干扰,而其他变量则可能与正常情况下的变量保持相似,可能不包含与故障相关的信息,因此一个重要的问题是排除冗余特征。随机森林具有分析复杂相互作用分类特征的能力,能够处理很高维度的数据,在训练完后,它能够给出哪些特征比较重要。具有较快的学习速度,其变量重要性度量可以作为高维数据的特征选择工具,近年来已经被广泛应用于各种分类、预测、特征选择以及异常点检测问题中[58-63]。针对复杂工业过程数据的高维度、非线性等问题,本文先利用随机森林算法选择重要的特征,排除非相关性特征。再用堆栈降噪自编码网络进一步提取非线性故障特征,对特征进行重构,进而根据重构误差构造平方预测误差(SquaredPredictionError,SPE)统计量作为故障的监测统计量。最后,利用核密度函数对SPE设定阈值,进而对新的数据进行故障判断。1.2随机森林算法随机森林算法是一种集成机器学习方法,能够计算单个特征变量的重要性,利用随机重采样技术bootstrap和节点随机分裂技术构建多棵决策树,通过投票得到最终分类结果。复杂工业过程数据特征多,含有大量噪声,因此,需要计算出每一个特征的重要性并对这些特征进行排序,进而可以从所有特征中选择出重要性靠前的特征。一方面可消除无关特征对结果的干扰,另一方面可有效降低模型复杂度,节省模型训练时长和计算成本。给定一个特征集F={f1,f2,…,fn}(n为特征集的数目),使用随机森林算法进行特征选择时,以特征重要性为标准。定义输出特征重要性集合I={I1,I2,…,Im},Ix为第x个特征的重要性大小Ix=1Mi=1其中,M为训练样本的个数;Rmoob、Rmjoob分别表示随机森林特征选择的步骤为:Step1:初步估计和排序:a)对随机森林中的特征变量按照变量重要性进行降序排序;b)从当前的特征变量中剔除比例不重要的指标,从而得到一个新的特征集;c)利用新的特征集建立新的随机森林,计算特征集中每个特征的重要性,并进行排序;d)重复以上步骤,直到剩下M个特征。Step2:根据Step1中得到的每个特征集和它们建立起来的随机森林,计算对应的袋外误差率,将袋外误差率最低的特征集作为选定的特征集。1.3自编码器概述1.3.1自编码器自编码器(AutoEncoder,AE)由编码器和解码器两个子网络组成,它使用了反向传播算法,对输入数据特征进行重构,让解码层的重构特征等于编码层的输入特征[64]。自1986年Rumelhart提出自编码神经网络,将其用于数据降维处理,极大地促进了深度神经网络的发展。传统神经网络的训练数据通常是有标签的,根据网络实际输出与样本标签间的误差,使用基于误差梯度的反向传播方法对神经网络进行训练。而AE是一种无监督学习算法,不需要标签信息,进而将输入数据本身作为期望输出进行参数学习,如图2-1所示。图2-1AE原理Fig.2-1TheprincipleofAE输入样本经由编码器计算后得到的输出为输入的编码表示,即所提取的特征。特征经由解码器计算后可以得到输入的重构,之后通过调整编码器与解码器的参数使得重构误差最小。但是自编码器本身存在如下两个问题:(1)在不施加任何约束的情况下,自编码器无法学习到有效特征,比如极端情况,只需使用恒等函数就能实现输入样本的完美重构,此时没有学到任何特征表示;另一方面自编码器也可能会学到很多干扰噪声。(2)自编码器在大规模数据集上的学习能力有限,无法学习到观测样本的深层特征。针对问题(1),改进的算法为降噪自编码(DenosingAutoencoder,DAE),其在自编码网络的基础上,从输入向量x中随机选择若干个元素,将其值重置为0后得到腐蚀的输入数据x,然后利用x代替x参与AE训练,得到重构向量z。DAE的原理为“丢弃部分噪声数据不会影响特征表达”,即“优质特征可以冲腐蚀的输入中获得,具有鲁棒性且能够重构原始输出数据”,因此DAE能够减少干扰数据对特征质量的影响。针对问题(2),由于DAE的编码能力有限,可以将多个DAE叠加起来可以组成一个深度学习框架“堆栈降噪自编码器”(StackedDenosingAutoencoder,SDAE),进而可以处理超大规模的数据,挖掘样本数据的深层特征。1.3.2降噪自编码网络降噪自编码(DenoisingAutoEncoder,DAE)[65]是自编码网络经典的变种,如图2-2所示,它的核心思想是向原始数据中加入部分干扰元素,DAE需要克服这些杂质的干扰以重构出原始数据,因此可以提炼出更具鲁棒性的特征。它的编码和解码部分公式为:Y=σ(W1X+Z=σW2Y+B式2为编码过程,式3为解码过程,σ为非线性激活函数,这里选Sigmoid函数,W1、W2为编码网络和解码网络的权重矩阵,B1、B2为偏置向量,X为加入噪声后的数据,Y为隐含层数据,即提取出的鲁棒特征,Z为输出层数据。它在训练时利用反向传播算法来最小化重构误差,其误差函数可以表示为式4,其中XL=12|Z−图2-2降噪自编码Fig.2-2DenoisingAutoEncoder为了防止过拟合问题而对输入的数据(网络的输入层)加入噪音,使学习得到的编码器具有较强的鲁棒性,从而增强模型的泛化能力。破损数据一定程度上减轻了训练数据与测试数据的代沟。由于降噪自编码器训练初始化参数是以重构误差为基础进行设置。重构误差越小,说明降噪自编码神经网络在从原始时域信号中学到的高维特征能够最大程度地恢复原始训练样本数据信号,则该神经网络恢复原始信号的能力越强。1.3.3堆栈降噪自编码网络将多个DAE进行堆叠得到的深层神经网络模型称为堆栈降噪自编码网络(StackedDenoisingAutoencoder,SDAE)[66]。堆栈降噪自编码深层网络直接对整体进行训练可能会引起梯度的消失,因此在训练时要采用逐层贪婪原则。“逐层训练,整体微调”是一种贪婪的、非监督训练方法,已被广泛应用于深度学习的网络训练且效果优异。单独训练每一层的DAE神经网络,保证重构误差实现最小化。如果每一层的DAE编码都能够实现较好的重构效果,那么SDAE就可以较好的实现高维特征降维以及深度特征的提取。堆栈降噪自编码网络的结构如图2-3所示。图2-3堆栈降噪自编码Fig.2-3StackDenoisingAutoEncoder1.4基于降噪自编码网络的故障监测1.4.1故障监测指标SPE和T2是生产过程故障检测当中两个常用的统计量[67-69],通过SDAE模型得到原始数据的低维特征和重构特征后,根据低维特征和重构残差建立HotellingT2和预测误差平方SPE统计量进行故障监测。对于SDAE模型得到的低维特征𝐹,T2T2=FΣF其中,ΣF是F的协方差矩阵,SPE统计量的计算方法为:SPE=eTe=其中,x为原始数据特征,y为重构数据特征。本文采用核密度估计法(KernelDensityEstimation,KDE)来计算统计量T2和SPE的阈值。此处选用的核函数为径向基函数(RadialBasisFunction,RBF),T2统计量的核密度估计ρh(T2其中,Ti2是fi的T2统计量,h为估计参数,且h>0ρh(SPE)=12π本文基于自编码重构特征构造故障监测统计量,采用SPE统计量作为故障监测统计量。1.4.2RF-SDAE故障监测流程本文所提出的基于RF-SDAE的故障监测具体步骤如下:Step1:利用随机森林算法对采集数据进行分析,选择与故障相关特征作为输入特征,并对数据进行归一化处理。通过对训练数据𝑋进行归一化处理,再引入随机噪声生成数据X;Step2:训练SDAE网络,把训练数据带入模型进行训练,得到最优参数W,b;Step3:利用重构特征与原始特征的残差求出故障监测统计量SPE,并利用核密度函数算出阈值,并根据阈值判断xi的时刻是否发生故障Step4:在线采样得到xN+1Step5:使用训练好的SDAE模型得到训练数据编码后的重构特征;Step6:计算xN+1的Step7:根据阈值判断xN+1所在时刻是否出现故障本文基于SDAE网络重构原始特征,根据重构误差构造SPE统计量对故障进行监测。基于SDAE网络的故障监测流程图如图2-4所示:图2-4SDAE故障监测流程图Fig.2-4Flowchartoffaultmonitoring1.5实验结果与分析1.5.1TE仿真平台介绍对于任何大型工业过程而言,数据是无法公开得到,获取途径比较困难。为验证本文所提算法在时序数据异常监测中的有效性,选用了TE仿真平台数据对本文算法进行验证。田纳西伊斯曼过程(TennesseeEastmanprocess,TEP)作为一个公开的化工模型仿真平台,在1990年的美国化学学会(AIChE)年会第一次出现。该平台由美国伊士曼化学公司的Downs和Vogel提出,为开发和研究过程控制和监测方法提供了一个典型的化工过程的故障检测和诊断平台,在控制、优化、过程监测、故障诊断等领域已被广泛研究和应用。TE过程由反应器、产品冷凝器、汽液分离塔、循环压缩机和产品分离器这5个主要的单元组成,图2-5为该过程的工艺流程图。气态的反应物进入反应器进行反应,生产物液态流出反应器,气态反应需要在催化剂B的条件下进行。产物流以气态的形式进入冷凝器进行冷凝,然后进入汽液分离器进行分离,气态组分通过压缩机后送回反应器,冷凝部分进入产品分离器进行产品分离,而惰性成分和副产品在汽液分离器中最先被除去。图2-5TE过程工艺流程图Fig.2-5FlowchartofTEprocess表2-1TE过程21种故障描述Tab.2-1FaultdescriptionsinTEprocess故障序号描述类型故障1A/C进料变化,B含量保持不变阶跃故障2B含量变化,A/C进料流量比值不变阶跃故障3物料D的温度变化阶跃故障4反应器冷却水入口温度变化阶跃故障5冷凝器冷却水入口温度变化阶跃故障6物料A损失阶跃故障7物料C的压力头损失阶跃故障8物料A,B,C的组成变化随机波动故障9物料D的温度变化随机波动故障10物料C的温度变化随机波动故障11反应器冷却水入口温度变化随机波动故障12冷凝器冷却水入口温度变化随机波动故障13反应器动力学常数变化缓慢漂移故障14反应器冷却水阀门粘滞故障15冷凝器冷却水阀门粘滞故障16未知未知扰动故障17未知未知扰动故障18未知未知扰动故障19未知未知扰动故障20未知未知扰动故障21阀门粘滞在稳定位置恒定位置TennesseeEastman过程仿真实验中包含21个预定义的故障,这些故障可以分为16个已知故障和5个未知故障,故障的具体信息如表2-1所示。其中,故障1-7与过程变量的阶跃变化有关,故障8-12与一些过程变量的可变性增大有关,属于随机波动故障。故障13是反应动力学的缓慢漂移,另外的三个故障则与粘滞阀有关,故障21是由粘滞阀固定在恒定位置引起的。TE过程数据包含了正常状态以及21种不同故障,每种状态分为训练部分和测试部分,分别是480组和960组数据。TE过程的故障数据是基于TE过程的仿真程序得到的,具有非线性,强耦合和动态等特征。在仿真程序中将预先定义好的21种故障模式有选择的加入到过程中,仿真数据集包含了所有41个测量变量和11个控制变量(不包含反应器的搅拌速度),总共有m=52个观测变量。在某时刻的观测向量表示为:X=[XMEAS1.5.2TE仿真数据实验验证本文选择52个变量[XMEAS对于缓慢漂移类型的故障13,首先利用随机森林算法选择与故障相关的特征,特征选择结果如图2-6所示,红色柱状图的高度代表相应特征权重的大小,按照降序排列。按照特征重要性选择前30个特征作为堆栈降噪自编码网络的输入数据。在特征选择之后,对输入特征添加噪声,这里选择的是高斯噪声,对数据进行损坏,从“损坏”的原始数据编码、解码,然后恢复真正的原始数据,使学习得到的自编码网络具有较强的鲁棒性,从而增强模型的泛化能力。为了防止过拟合问题而对输入的数据(网络的输入层)加入噪音,使学习得到的编码器具有较强的鲁棒性,从而增强模型的泛化能力。故障监测效果如图2-7所示,红色曲线为控制限,蓝色曲线为故障统计量SPE在每个时刻的状态,所提的RF-SDAE网络在故障发生时能够监测到故障。图2-6故障13随机森林特征选择结果Fig.2-6ResultofRFfeatureselectionforfault13图2-7故障13监测效果Fig.2-7Faultmonitoringperformanceoffault13同样对于故障8数据进行特征选择,选择结果如下图所示,红色柱状图的高度代表相应特征权重的大小,按照降序排列。图2-8故障8随机森林特征选择结果Fig.2-8ResultofRFfeatureselectionforfault8故障8监测效果图如图2-9所示,红色虚线为控制限,蓝色曲线为SPE曲线,SDAE网络在第161时刻故障发生时能够监测到故障。图2-9故障8监测效果Fig.2-9Faultmonitoringperformanceoffault8由图2-7和图2-9可以看到,对于缓慢漂移故障和随机故障,所提方法都能够在故障发生时监测到故障,表明所提出的SDAE方法有效。1.5.3美国密西根大学IMS滚动轴承全寿命实验平台为了验证所提方法在实际中的有效性,采用美国密西根大学的智能维修中心(Centerforintelligentmaintenancesystems,IMS)实测的滚动轴承全生命周期振动数据[70]对本文所提方法进行验证,轴承实验台如图2-10所示,试验台包括4个RexnordZA-2115双列轴承,始终保持在2000rpm的转速,并通
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年湖北省潜江市高考物理周测模拟卷含完整答案详解【易错题】
- 2025年福建省石狮市高考物理一轮复习测试卷带答案详解(突破训练)
- 2025年福建省漳平市高考物理一模测试卷(模拟题)附答案详解
- 2026年湖北省宜城市高考物理强基计划考试卷含答案详解
- 2026四川达州市卫生健康委员会市本级医疗卫生辅助岗人员招募20人考试备考试题及答案详解
- 2025年云南省泸水市高考物理一模考试卷及参考答案详解【模拟题】
- 2026年四川省马尔康市高考物理三轮冲刺测试卷及答案详解【历年真题】
- 2026广东东莞市麻涌镇人力资源服务有限公司招聘12名专管员考试备考题库及答案详解
- 2025年广东省雷州市高考物理模拟预测考试卷含答案详解(B卷)
- 2026年广东省罗定市高考物理一模测试卷【培优A卷】附答案详解
- 2026年浙江杭州市中考政治试题及答案
- 广东省化工(危险化学品)企业安全隐患排查指导手册(油气储存企业专篇)
- (2026年)围术期的衰弱综述课件
- 脐带脱垂的课件
- 2026贵州中考:历史必考知识点归纳
- 部队文职面试答题技巧
- 2025年政府采购评审专家考试试题库(附答案)
- 2026年高中化学学业水平考试知识点归纳总结(复习必背)
- 昆明理工大学《分子生物学大实验》2025-2026学年第一学期期末试卷
- 2026年 中国汽车金融行业市场前瞻与投资战略规划分析报告
- 保安停车场培训课件
评论
0/150
提交评论