版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 PAGE27 / NUMPAGES35化工大学本科毕业论文 题 目:基于统计特征的不等长间歇过程故障诊断研究 毕业设计(论文)任务书毕业设计(论文)题目:基于统计特征的不等长间歇过程故障诊断研究毕业设计(论文)容:提取不等长间歇过程的统计特征研究基于PCA的故障诊断方法编制完成实现上述任务的程序毕业设计(论文)专题部分:不等长间歇过程故障诊断研究起止时间: 2014 年 3 月 2014 年 7月指导教师: 签字 年 月 日教研主任: 签字 年 月 日学院院长: 签字 年 月 日目 录 TOC o 1-3 h z u HYPERLINK l _Toc18877 第一章 绪论 PAGEREF
2、_Toc18877 1 HYPERLINK l _Toc12985 1.1引言 PAGEREF _Toc12985 1 HYPERLINK l _Toc22510 1.2 间歇生产过程性能监控研究现状 PAGEREF _Toc22510 2 HYPERLINK l _Toc11905 1.2.1 间歇生产过程故障诊断研究进展 PAGEREF _Toc11905 2 HYPERLINK l _Toc25633 1.2.2 多元统计方法应用于间歇过程故障诊断 PAGEREF _Toc25633 2 HYPERLINK l _Toc13157 1.3 本文研究容 PAGEREF _Toc13157
3、4 HYPERLINK l _Toc24734 第二章MPCA在间歇反应过程故障诊断中的应用 PAGEREF _Toc24734 5 HYPERLINK l _Toc1433 2.1 引言 PAGEREF _Toc1433 5 HYPERLINK l _Toc22440 2.2 PCA基本原理 PAGEREF _Toc22440 6 HYPERLINK l _Toc2472 2.2.1 主元分析简介 PAGEREF _Toc2472 6 HYPERLINK l _Toc31122 2.2.2 主元分析的意义 PAGEREF _Toc31122 6 HYPERLINK l _Toc23751 2
4、.2.3 主元分析的基本原理 PAGEREF _Toc23751 7 HYPERLINK l _Toc3133 2.2.4 主元个数的提取 PAGEREF _Toc3133 7 HYPERLINK l _Toc23755 2.2.5 主元模型 PAGEREF _Toc23755 8 HYPERLINK l _Toc20412 2.3 基于MPCA的故障检测方法 PAGEREF _Toc20412 9 HYPERLINK l _Toc1225 2.3.1 MPCA理论 PAGEREF _Toc1225 9 HYPERLINK l _Toc18679 2.3.2 基于MPCA故障检测的统计量与其控
5、制限 PAGEREF _Toc18679 10 HYPERLINK l _Toc27551 2.3.3 基于MPCA的故障诊断方法 PAGEREF _Toc27551 11 HYPERLINK l _Toc10879 2.4 本章小结 PAGEREF _Toc10879 12 HYPERLINK l _Toc23555 第三章 基于统计特征的不等长间歇过程故障诊断研究 PAGEREF _Toc23555 13 HYPERLINK l _Toc5368 3.1 引言 PAGEREF _Toc5368 13 HYPERLINK l _Toc31177 3.2 不等长问题 PAGEREF _Toc3
6、1177 14 HYPERLINK l _Toc29624 3.2.1 不等长数据描述 PAGEREF _Toc29624 14 HYPERLINK l _Toc18037 3.2.2 不等长轨迹同步化方法 PAGEREF _Toc18037 14 HYPERLINK l _Toc8085 3.3 基于统计特征的不等长间歇过程故障诊断研究 PAGEREF _Toc8085 15 HYPERLINK l _Toc10078 3.4 仿真实验 PAGEREF _Toc10078 18 HYPERLINK l _Toc251 3.5 本章小结 PAGEREF _Toc251 22 HYPERLINK
7、 l _Toc25067 第四章 总结和展望 PAGEREF _Toc25067 23 HYPERLINK l _Toc29623 4.1 总结 PAGEREF _Toc29623 23 HYPERLINK l _Toc26288 4.2 工作展望 PAGEREF _Toc26288 23 HYPERLINK l _Toc543 参考文献 PAGEREF _Toc543 25 HYPERLINK l _Toc19059 致 PAGEREF _Toc19059 26摘要 随着工业生产的快速发展,由于工业体系的庞大化和复杂化,如果生产过程中一旦出事故,不仅会影响生产的正常进行,还会造成一定的经济损
8、失甚至人员伤亡,因此故障检测与故障诊断技术越来越成为监控系统中的不可缺少的一部分。与时准确地检测和诊断出过程的故障,不仅可以减少事故、增加过程运行的安全性,而且可以降低生产管理成本,提高产品的质量。基于统计分析的故障诊断是故障诊断技术的重要组成部分之一。本文以提高不等长间歇过程故障诊断的性能为目的,深入研究了基于统计特征的不等长间歇过程故障诊断算法,并对半导体工业实例A1堆腐蚀过程进行了具体地分析与仿真,取得了预期的效果。本文首先研究了基于多向主元分析(Multi -way principal component analysis,MPCA)方法在故障监测与诊断过程中的应用。其次,在分析了多向
9、主元分析方法进行故障监视和诊断的局限和缺点的基础上,深入研究了基于统计特征的不等长间歇过程故障诊断算法。通过基于统计特征的不等长间歇过程故障诊断算法,可以先计算每个不等长批次的均值、偏度、峭度、方差和任意两个变量之间的欧氏距离,然后将这些统计特征组合成一个等长的特征向量,再利用主元分析(principal Component Analysis,PCA)进行过程监视。根据半导体工业实例的仿真结果,基于统计特征的不等长间歇过程故障诊断算法与传统的多向主元分析(MPCA)方法相比,不仅可以减少建模过程的计算量,而且其故障诊断率提高了15%,还大大减少了故障检测时间,因此该算法具有很好的故障诊断性能。
10、关键词: 故障诊断; 不等长间歇过程; 统计特征; 多向主元分析AbstractWith the rapid development of industrial production, due to the large chemical industry system and complicated, if the production process once an accident, not only will affect the normal production, but also cause great economic loss and casualties, so the fa
11、ult detection and fault diagnosis technology has increasingly become an indispensable part in the monitoring system. Timely and accurate detection and diagnosis of process faults, not only can reduce accidents, increase the safety operation of the process, but also can reduce the cost of production
12、management, improve the quality of the products. Fault diagnosis based on statistical analysis is an important part of the fault diagnosis technology.In order to improve the unequal performance of fault diagnosis of batch processes as objective, in-depth study of the fault diagnosis algorithm unequa
13、l batch process based on statistical features, and the semiconductor industry - A1 case is analyzed in detail and Simulation of reactor corrosion process, expected results were obtained.This paper first studied based on multiway principal component analysis (Multi -way principal component analysis,
14、MPCA) application on the fault monitoring and diagnosis process. Secondly, based on the analysis of the limitations and shortcomings of the principal component analysis method for fault monitoring and diagnosis of the fault diagnosis algorithm, in-depth study of the unequal batch process based on st
15、atistical features.In order to improve the fault diagnosis performance of the uneven-length batch processes, and decrease the complexity of the algorithm, an uneven-length batch processes fault diagnosis method based on statistic features was presented. Firstly, the means, variance, skewness, kurtos
16、is and the Euclidean distance between two variables for each uneven-length batch were calculated. Secondly, these statistic features were combined into an even-length feature vector. Lastly, principal component analysis (PCA) was used to the feature vectors for monitoring the batch processes. The mo
17、nitoring results of an industrial example show that compared with traditional multiway principal component analysis (MPCA), the uneven-length batch processes fault diagnosis method based on statistic features increases 15% of the fault diagnosis rate and reduces 0.002 second of the fault diagnosis t
18、ime, so it has good fault detection performance.Key words:fault diagnosis; uneven-length batch processes; statistic features; multiway principal component analysis.第一章 绪论1.1引言随着世界现代经济的快速发展和流程工业规模的不断扩大,工业过程的复杂性也随之不断的提高,生产和加工方法主要有化学反应、分离、混合等,涉与石油、化工发电钢铁等行业。一旦发生事故,将会造成巨大的经济损失和人员伤亡。如“2013年6月3日省宝源丰禽业公司爆炸
19、事故,已造成113人遇难”;“省邵东一煤矿发生爆炸事故”;“兴化集团硝铵装置特别重大爆炸事故”。由此可见,切实保障现代复杂工业系统的可靠性与安全性,降低事故发生率,维持生产稳定,对于流程工业长期安全稳定运行具有十分重要的意义。过程故障诊断技术就是为适应工程需要而形成和发展起来的。过程故障诊断技术为提高复杂工业系统的可靠性开辟了一条新的途径。以自动故障检测与诊断来代替操作员的判断可增加设备运行的安全性,保证产品的质量的同时也降低了成本,尤其可以最大限度地避免严重的过程颠覆事故。过程故障诊断技术的任务是选取方便而且有效的方法来发现过程中的异常事件,并且识别和诊断出生产过程的异常事件的根源,进而指导
20、操作员正确地处理过程异常。间歇反应过程具有生产灵活性、产品多样性、设备简单性的特点,在高分子聚合物、药品、生化等领域得到了广泛的应用。间歇过程一般有一个确定的有限操作周期,该周期包括上料、反应、卸料3个阶段。在上料阶段,以一定配比组成的多种原材料被装入到反应釜中,该阶段是整个间歇过程的初始准备阶段;反应阶段是整个间歇过程的核心,它要求反应釜的各过程变量(如温度、压力、流量、液位等)按一定的时间轨迹变化,而各参量的时间轨迹对于每个不同的间歇过程都不同;卸料阶段是间歇过程的结束阶段,该阶段将反应釜的产品排出,并对其各质量指标进行检测以判断该釜反应的最终质量情况1。一般而言,间歇过程工业企业对综合自
21、动化技术的需求主要关注四个问题:安全、低成本、高效率以与提高竞争力。在所有的问题中,安全始终是根本前提。然而间歇过程工业的多样性和复杂性增大了对其故障诊断的难度,使得过程监测和故障诊断成为控制领域最具挑战性的研究方向之一。1.2 间歇生产过程性能监控研究现状1.2.1 间歇生产过程故障诊断研究进展间歇生产过程监控是现代化过程工业中的一种生产方式,由于其本身所具有的灵活性,50%左右的过程生产都采用该生产方式。特别是在精细化工、生物制药等利润高、产量小、品种多的工业部门。间歇生产过程在工业生产中越来越受重视,间歇生产过程的性能监控和故障诊断逐渐成为统计过程控制的研究热点之一。与连续生产过程相比,
22、间歇过程具有启动频繁、动态特性变化快、多阶段、有限生产周期等特点。因此间歇过程的监控显得更加复杂。在间歇生产过程中,往往同时进行着物理、化学、生化反应、相变过程与不确定性和突变性等因素,因而使一个十分复杂的工业大系统。其特点表现在一下几个方面6。(1)多变量、强耦合。间歇过程工业的测量系统中都包含较多的过程变量,而且过程变量之间相互关联、相互耦合,任何一个变量的变化都可能引起其他变量的变化,从而使因果关系错综复杂。这就增加了间歇过程故障诊断的困难程度和复杂程度。(2)非线性。严格地就,所有工业过程都存在非线性。对于非线性程度较弱的系统,在一定的围可以当作线性系统来处理,对于非线性程度较强的系统
23、,采用线性化的处理方法会产生很大的偏差,甚至会得出完全错误的结论。(3)对象不确定性。在间歇工业生产过程中,往往同时进行着物理、化学和生物反应,过程的部机理十分复杂,难以用常规的工具建立精确的数学模型。即使建立数学模型,通常也十分复杂,很难求解。因而在间歇过程工业故障诊断中多元统计方法得到了广泛应用。1.2.2 多元统计方法应用于间歇过程故障诊断如1.2.1所述,间歇过程的部机理十分复杂,难以用常规的工具建立精确的数学模型,即使可以建立数学模型,通常也十分复杂,难以求解。因此在间歇生产过程中基于解析模型的方法很少应用,而采用基于统计学的统计过程监控方法,则是一种完全依赖于过程数据的黑箱方法,该
24、方法首先从正常工况的历史数据中建立过程的统计学模型,并给出过程变量或者过程变量某种形式组合的正常分布置信限,然后基于该统计模型实现过程的在线监控、故障诊断甚至于某些质量指标的预测。目前比较成熟的用于间歇过程统计监控的是多元统计的方法, 实际的工业应用结果也证明了这种方法的有效性。这其中包括主元分析法(principal Component Analysis,PCA)1、部分最小二乘法(partial least-squares, PLS)、因子分析法(factor analysis,FA)以与后来提出的规变量分解法(canonical variate analysis, CAV)、ICA以与F
25、isher判据分析法(Fisher discriminant analysis, FDA)。PCA最初由Pearson提出,1947年Hotelling对PCA进行了改进,成为目前被广泛应用的方法。PLS最早由Wold等提出,后来Wold和他的同事对其进行了一系列的改进。1936年,Fisher的著名论文提出了线性可分的方法,也就是著名的FDA,其思路是寻找一个子空间,在这个子空间中各类别能较好地分开。ICA最初原来处理鸡尾酒会问题,由于非高斯性的缘故,ICA较晚得到广泛应用。目前PCA、PLS、FDA、典型相关分析法(CCA)和ICA已经被广泛采用。PCA使用单一数据矩阵来分析,它的基本思想
26、是将数据依次投影到方差最大的方向、次大的方向,直到方差最小的方向,取其中方差较大的部分作为主要成分(主元)而忽视其他部分以达到降维的目的。主要成分(主元)可以通过对数据矩阵的方差进行奇异值分解(SVD)来获得。有时(如产品质量控制)可能还有另外的数据组(如产品质量Y),希望能由X来预测和检测Y的变化,这时就可以采用PLS进行。PLS在对输入输出数据进行低维空间投影的同时考虑输入与输出的关系,投影后输入输出的协方差最大5。投影完成后则采用Hotelling统计量和平方预测统计量Q统计量(或称SPE统计量),对过程进行统计监测和故障诊断。CCA最早也由Hotelling提出,它是利用变量对之间的相
27、关关系来反映数据之间的整体相关性的已知方法1。与PCA相似,CCA也是通过构造原变量的适当线性组合来提取不同信息。其基本思想是分别对不同组别数据进行组合,使组合后的线性相关性最大;不同点在于PCA着眼于考虑变量的”分散性“信息,而CCA则立足于识别和量化变量之间的统计相关性。ICA和PCA一样,属于典型的非因果关系方法:一方面,ICA不需要变换后的独立成分满足正交条件;另一方面ICA不仅去除了变量之间的相关性,而且还包含了高斯统计特性。如上所述,由于多元统计方法不需要精确的数学模型就可以处理高维相关数据的情况,因而在间歇过程故障诊断中应用十分广泛。1.3 本文研究容本文主要有以下四章组成:第一
28、章阐述了故障诊断方法的研究容,各种方法的分类与发展趋势,特别是对基于多元统计分析的故障诊断方法的现状和发展进行了较简单的综述。第二章首先介绍了间歇过程最基本的理论工具主元分析( Principal Component Analysis,PCA),以与基于PCA的故障诊断方法。然后介绍了多向主元分析(multiway principal Component Analysis,MPCA)理论,并对该理论进行了一定的分析,以与基于MPCA的故障诊断方法。 第三章介绍了基于统计特征的不等长间歇过程故障诊断算法以与其在故障诊断技术上的应用,并将该算法应用于半导体工业实例A1堆腐蚀过程进行仿真实验,同时比
29、较不同故障诊断方法的性能,且得出了理想的检测结果。第四章对全文进行了总结并讨论了故障检测技术相关研究的发展前景。第二章MPCA在间歇反应过程故障诊断中的应用2.1 引言在化工、食品等间歇生产过程中, 生产系统在长期运行和生产负荷中会不可避免地发生各种故障, 影响生产质量, 甚至引起重大的经济损失, 因此故障检测与诊断成为当前控制理论研究的热点之一。化工生产系统一般都具有过程精确、建模困难、过程变量众多且相互间具有强耦合, 并且在实际中存在各种随机因素影响等特点, 这就使得基于机理模型的诊断方法的应用极为不便8。多元统计分析方法将多变量高维数据空间投影到相对独立的低维空间,以降低分析难度。这些方
30、法不需要精确的数学模型,可用于处理高维相关数据的情况。而间歇过程工业过程变量众多、数据之间关联性强的特点,且模型很难建立,所以采用多元统计分析方法来进行故障监测和诊断是很适合的。例如多方向主元分析(MPCA)、偏最小二乘法(PLS)与因子分析法(FA)等。多元统计分析方法是一种不依赖于过程机理的建模方法, 它只需通过过程数据的信息来进行统计建模, 然后基于该模型实现对过程的监测。随着DCS(distributed control system)以与PIS(plant information system)等先进控制设备在生产系统中的应用, 采集和存储大量实时数据变得相当便捷, 这就为多元统计分
31、析方法在故障监测与诊断中的应用奠定了基础。由于间歇反应的数据具有多维性的特点,传统的主元分析方法会使过程的统计建模与故障诊断变得难以实现。主元分析(PCA)是一种在间歇过程故障检测等方面已经获得广泛应用的数据处理工具,它通过将多变量高维数据空间投影到相对独立的低维空间,得到最大化数据方差的正交投影轴以达到消除数据相关性的目的1。MPCA实际上是将间歇过程的多维数据沿着时间轨迹进行分割,是主元分析(PCA)在三维数据阵的扩展应用。MPCA的核心思想是通过将相关的一组数据集进行降维,并尽量保留原来数据集的的变化信息1。降维的实现主要通过将原变量集转换成一组互不相关的新变量集(即所谓的潜隐变量),这
32、些新变量按照方差的大小进行排列。如此,新变量集中的前若干个变量便保留了原始变量的绝大部分变化信息。对于主元分析方法来说,如何求取隐变量或者主元是十分重要的。对于线性主元分析方法,主元的求取要涉与到一个正定矩阵的特征值分解问题,而对于非线性主元分析方法,则要考虑通过神经网络等方法来求取主元2。2.2 PCA基本原理2.2.1 主元分析简介主元分析(Principal Component Analysis,PCA)或者主成分分析,是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。计算主成分的目的是将高维数据投影到较低维空间。给定 n 个变量
33、的 m 个观察值,形成一个nm的数据矩矩阵,n通常比较大。对于这样一个由多个变量描述的复杂事物,如果事物的主要方面刚好体现在几个主要变量上,只需要将这几个变量分离出来,进行详细分析。但是,在一般情况下,并不能直接找出这样的关键变量。这时可以用原有变量的线性组合来表示事物的主要方面, PCA 就是这样一种分析方法。2.2.2 主元分析的意义PCA(主元分析)是1991年提出的,是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。简单的说PCA在实验中的主要应用:数据降维最少的信息丢失将众多原有变量浓缩成少数几个主元因子,主元通常是原有变量的
34、线性组合。简单地说,在保证原始数据大部分信息不丢失的情况下,通过一定的线性变换,PCA就是将高维的数据通过线性变换投影到低维空间上去,这个投影要遵循一个指导思想找出最能够代表原始数据的投影方法,也就是说,被PCA降掉的那些维度只能是那些噪声或是冗余的数据。这里的噪声和冗余可以这样认识:找出几组也就是最能代表原始数据的线性组合。找出的线性组合我们称之为主元,线性组合的维数称之为主元个数。2.2.3 主元分析的基本原理前面已经提到,PCA的目的就是“降噪”和“去冗余”。“降噪”的目的就是使保留下来的维度间的相关性尽可能小,而“去冗余”的目的就是使保留下来的维度含有的“能量”即方差尽可能大。首先,要
35、知道各维度间的相关性以与个维度上的方差,能同时表现不同维度间的相关性以与各个维度上的方差的数据结构就是非协方差矩阵。协方差矩阵度量的是维度与维度之间的关系,而非样本与样本之间。协方差矩阵的主对角线上的元素是各个维度上的方差(可以称之为能量)元素是两两维度间的协方差(即相关性)。通过矩阵对角化进行降噪,消除各变量间相关性,而对角化后得到的矩阵,其对角线上是协方差矩阵的特征值,它有两个身份:首先,它还是各个维度上的新方差;其次,它是各个维度本身应该拥有的能量(能量的概念伴随特征值而来)。通过对角化后,剩余维度间的相关性已经减到最弱,已经不会再受“噪声”的影响。“降噪”后开始“去冗余”。对角化后的协
36、方差矩阵,对角线上较小的新方差对应的就是那些该去掉的维度12。现在只取那些含有较大能量(特征值)的维度,其余的就舍掉即可。PCA的本质其实就是对角化协方差矩阵。2.2.4 主元个数的提取累计方差贡献率法作为一种可适应于所有的情况方法,成为确定主元个数的通用方法。主元贡献率法因其简单、直观、方便等特点,在很多文章中得到了采用,在本文中也主要采用这种方法,用来确定主元个数。累计方差贡献率(Cumulative Percent Variance, CPV)法是根据主元方差的累计和百分比来确定主元个数。累计方差贡献率反映了所确定的主元模型反映原数据信息的程度。由于数据矩阵主元方差等价于协方差矩阵的特征
37、值,所以也把矩阵的协方差矩阵的前k个特征值的和除以它的所有特征值的和称为的前k个主元的累计贡献率,它表示了前k个主元所解释的数据变化占全部数据变化的比例。因此前k个主元的累计贡献率CPV可以表示为1: (2.1)其中为第i个特征值。当个主成分的累积贡献率超过一定的指标后(一般85%足够),我们就可以认为已求的主元个数可以综合原数据足够多的信息。2.2.5 主元模型假设是一个的数据矩阵,其中的每一列对应于一个变量,每一行对应于一个样本。矩阵可以分解为个向量的外积之和,即(2.2)在式(2.2)中,被称为得分(score)向量,称为负荷(Loading)向量。的得分向量也叫做的主元。式(2.2)也
38、可写为下列矩阵形式: (2.3)其中称为得分矩阵,称为负荷矩阵。各个得分向量之间是正交的,即对任何和,当时,满足。各个负荷向量之间也是互相正交的,同时每个负荷向量的长度都为1,即 (2.4) (2.5)当矩阵中的变量间存在一定程度的线性相关时,数据的变化将主要体现在最前面的几个负荷向量方向上,数据矩阵在最后面的几个负荷向量上的投影将会很小,它们主要是由于测量噪声引起的。这样就可以将矩阵进行主元分解后写成下式3: (2.6)式中为误差矩阵,代表在到等负荷向量方向上的变化。所谓的主元模型,指的是对来自正常稳态工况下的训练集进行主元分析后得到的一系列统计信息,主要包括:变量均值向量、变量方差矩阵、协
39、方差矩阵、主元方差矩阵、负荷矩阵以与主元数等。将反映过程正常运行的历史数据收集起来,对这些数据进行主元分析,建立主元模型。由于主元分析的结果受数据尺度的影响,因此在进行主元分析时,需要先将数据标准化,即将每个变量的均值减掉然后除以它的标准差。即6: (2.7)这样原数据集就变换为均值为0, 方差为1的标准数据集。对标准化后的数据进行主元分析,如果只取前个主元,那么可以得到下面的主元模型14: (2.8)式中 (2.9) (2.10)原测量数据集可表示为 (2.11)从式(2.10) 可以看出原正常工况下的历史数据集可分解为两部分, 即一部分信息投影到主元子空间中, 另一部分则投影到残差子空间。
40、这样, 如果原系统中存在着大量的冗余, 那么利用A 个方向向量确定的子空间, 即PCA空间, 就能对系统进行很好的描述, 而PCA子空间代表X的特征空间,是很好的估计。2.3 基于MPCA的故障检测方法2.3.1 MPCA理论MPCA是主元分析法(PCA)在三维数据阵的扩展上的应用1。对于间歇反应过程来说,其数据样本通常可以看作为一个三维的立体数据块, 2.2节中介绍的主元分析法(PCA)只能用来处理二维数据,而处理一个这样的三维立体数据块,一个有效的想法就是对其进行重新排列。MPCA的基本思想是将一个三维的立体数据块X沿着时间轴方向进行切分,然后将切分得到的数据时间片依次向右水平排列,如此构
41、成了一个新的二维数据阵,然后使用主元分析方法进行分析6。不同于连续生产过程,间歇过程的历史生产数据以批次为单位构成三维数据矩阵,批次(I)变量(J)时间(K),如图2.1所示8。变量(J)1 J 2J KJ 时间(K)批次(I)X(1) X(2) X(3) X(K)图2.1 MPCA数据矩阵沿时间轴分解图如图2.1所示,每一时间点上都是二维数据,如果大量采集正常批次的数据样本,那么它们代表了在不同的时间序列中不同的批次的一样变量的统计特性。通常统计控制指标有以下3种,它包括预Q统计量,得分Score和HotellingT2统计量。2.3.2基于MPCA故障检测的统计量与其控制限故障检测是多元统
42、计过程监控的第一步,通常用统计量和Q统计量以与得分Score来进行故障检测1。(1)Score (2.12)(2)Q统计量(预测误差平方和SPE)Q统计量衡量样本向量在残差空间投影的变化,Q统计量通常也称为SPE统计量,其计算式为(2.13)Q统计量的阈值计算式可以近似为 (2.14)其中,为X的协方差矩阵的特征值,A为PCA模型的主元个数,m为样本的维数。统计量SPE在第i时刻的值是一个标量,它刻画了此时刻测量值XI对主元模型的偏离程度,由于由多个变量的综合作用而成,因而SPE图可以同时对多变量工况进行监控6。(3)Hotelling的 统计量7Hotelling的统计量由下式给出:(2.1
43、5) 其中,表示置信度为的控制限。假设过程正常运行时的样本服从多元正态分布,那么可以按下式计算控制限:(2.16)其中是指自由度带为A和n-A的F分布的置信水平为1-的分位点。分值向量Score、Q统计量、统计量均可以对过程中的故障进行检测。当Q统计量(即SPE)发生较大变化时,说明MPCA统计模型所代表的正常工况下的变量关系被破坏,即该过程有故障发生;当统计量发生较大变化而Q统计量相对变化不明显时,说明变量间的关系基本满足,但过程工况发生了变换,即该过程有故障发生。2.3.3 基于MPCA的故障诊断方法将采样信息的分值向量Score、预测误差SPE、Hotelling 与正常工况下建立的统计
44、数学模型比较,判断其是否在置信区间或控制限,是则为正常,否则为有故障存在14;在各自的时间序列上建立统计模型,将新批次的数据向模型空间投影,通过判断与模型的拟和程度即可以诊断出反应过程是否有故障发生1。由2.3.1可以看出,MPCA 将每一批完整的数据看作间歇处理过程的一次采样,多批数据构成样本集合,并在此样本集合上进行 PCA 分析。以上特点决定了 MPCA 在应用于实际监控时会出现采样数据不完善的问题;因为在批处理进行过程中,只有当前时刻与以前的数据是已知的,这些数据不足以构成对间歇过程的一次完整采样。Nomikos提出了解决该问题的数种方法,基本思想均是设法预测过程变量的未来输出。常用的
45、方法包括:1) 补充数据为全 0,即认为以后的数据不偏离平均轨迹,这种方法的缺点是对故障不够敏感,将延迟发现故障的时间。2) 补充数据为当前归一化采样值,即认为以后的数据偏离平均轨迹的程度和当前时刻一样,这种方法的缺点是对故障会过于敏感,增加误报的概率。2.4 本章小结本章的容主要包括两大部分,第一部分是对PCA方法的基本介绍;第二部分介绍了MPCA理论,并对该理论进行了一定的分析,以与MPCA方法在故障诊断的应用。在第一部分中,简单介绍了主元分析方法的意义、基本原理以与主元个数的提取方法。在第二部分容中,介绍了基于MPCA进行故障诊断的基本方法,建立统计模型,计算统计量以与控制限的方法。第三
46、章 基于统计特征的不等长间歇过程故障诊断研究3.1 引言间歇过程是广泛用于食品、聚合物、药品、分子筛、增塑剂、抗氧剂、染料和涂料等高附加值产品生产的重要过程,化工间歇过程主要用于精细化工、生物化工等高技术密集和知识密集的新兴产业,因此对间歇过程反应机理的监视、物料平衡的控制以与生产节奏的把握都是直接影响和制约生产的能力与水平、产量与效益的关键要素10。多元统计分析是一种对间歇过程进行故障诊断和过程监控的有效方法。1995年,NomikosMacGregor提出用多向主元分析(Multi -way principal component analysis,MPCA)1,2和多向偏最小二乘( Mu
47、ltiway partial least squares,MPLS)3来解决间歇过程的建模、监视和故障诊断问题,这种方法随后也得到了极大的应用和发展。如果运用传统的统计分析方法,那么需要假设批次数据是等长的,以保证操作事件在批次与批次之间的数据轨迹是同步化的。然而,这种假设通常是不成立的9-10。解决间歇过程批次不等长问题,通常采用最短长度法。Kassidas等10运用动态时间错位(Dynamic Time Wrapi-ng ,DTW) 理论来解决间歇反应过程的批次不等长问题。动态时间错位(DTW)理论运用动态规划原理来搜寻两轨迹的相似特征,并且适时地对多元批次轨迹进行压缩和扩,从而让多元批次
48、轨迹达到同步化的程度,以得到其间的最短距离。虽然这种方法按照轨迹中点与点的方式来进行动态匹配,但是其处理过程的离线性与其复杂性将导致其实际应用会比较困难。Rothwell等11表明动态时间错位(DTW)理论在故障诊断方面的效果不如指示变量法和最短长度法。然而,这些方法应用于大规模的生产过程时,必须建立成千上万个模型,使得其存储量与其计算量都非常大,所以在大规模生产过程中,这些方法很难在线应用。基于统计特征的不等长间歇过程的故障诊断算法提高了不等长间歇过程故障检测与诊断的可靠性,并且降低了算法的复杂程度,因此,该算法在不等长间歇过程的故障诊断与性能监视中具有重要的意义。3.2 不等长问题3.2.
49、1 不等长数据描述在每个批次(b=1,2,B)运行中,假设在持续时间不固定的操作循环中,在k=1,2.Kb个时刻在线测量J个过程变量,形成每个不规则的批次数据集合,表示为,图3.1中参考批次有不同的轨迹长度Kb2。b=1,Bj=1,,JkK2K1KiKb图3.1 不等长批次过程的三维数据描述3.2.2 不等长轨迹同步化方法间歇过程的时变特点使得间歇过程所采集的数据呈现批次数据轨迹不等长的特点,因此,批次过程的轨迹同步化处理十分关键。此处理目的是将不等长的数据处理为便于操作的等长数据。目前比较常用的轨迹同步化处理方法有: 最短长度法、指示变量法。(1) 最短长度法最短长度法2以间歇操作数据最短的
50、批次做为基准,其余批次的数据截取长度与基准批次一样。这种方法一方面要求在公共部分的过程变量轨迹保持一致,另一方面公共时间段要包含间歇过程的主要操作,在超出基准长度的时间位置包含的都是数据中次重要信息。(2) 指示变量法通常情况下,间歇过程变量都对应着时间而改变,但是如果以其他的变量来替代时间,就可以对不等长数据进行同步处理。把可以用来代替时间的变量命名为指示变量。这种方法的思想是用指示变量的进程来代替时间,将其余变量进行重新采样,是一个数据插值过程。3.3 基于统计特征的不等长间歇过程故障诊断研究基于数理统计的方法用统计特征组成的随机模型来重新定义和衡量原始间歇过程数据,常见的统计特征有方差、
51、均值、峭度、偏度和欧氏距离等。假定用Yk表示每个批次的样本数据,即14:(3.1)其中w为批次中样本数,k为批次中最大时刻,m为变量个数。每个批次的方差和均值分别为15:(3.2)(3.3)每个批次不同变量间的欧氏距离为:(3.4)每个批次的峭度和偏度分别为15:(3.5)(3.6)每个批次的统计特征均用来表示,那么所有的统计特征组合成维的特征向量: (3.7)由上式可得出,不等长间歇过程的统计特征向量H是等长的2。如2.2.5节所述,由于主元分析的结果受数据尺度的影响,因此在进行主元分析时,需要先将各个统计特征向量标准化,即将每个统计特征的均值减掉然后除以它的标准差。即: (3.8)这样原数
52、据集就变换为均值为0, 方差为1的标准数据集。统计特征向量H标准化后就进行主元分析,若只取前k个主元,那么会得到以下主元模型:(3.9)上式中pi被称为载荷(loading)向量,ti 被称为得分(score)向量,H的得分向量ti也称做H的主元。建立了过程监视模型和故障检测的模型后,就需要计算Q统计量的警告限和操作限。预测误差平方和(SPE,Squared Prediction Error)图以与主元得分(Score)图是典型的监视控制图。当主元模型的Q统计量或者Score超过控制限时,就认为该过程出现了不正常的情况。如2.3.2所述,主元模型的SPE,即 Q统计量定义为: (3.10)Q统
53、计量或SPE表示数据中没有被主元模型所解释的变化。当Q统计量发生较大变化时,说明该统计模型所代表的正常工况下的变量关系遭到破坏,即该过程中有故障发生,从而根据正常运行数据而建立的模型已经不再适用。控制限的计算是建立在一定的假设基础上的,假设检验水平为时,Q统计量的控制限由下式可得到2: (3.11) 其中为标准正态分布的100百分点,其他参数如下: (3.12)基于统计特征的不等长间歇过程故障诊断算法的具体步骤为:(1) 建立正常状态下的统计模型1)收集正常状态下操作时各批次的历史数据;2)计算每个不等长批次的方差和均值、峭度和偏度和任意两个变量之间的欧氏距离,并将这些统计特征组合成为一个等长
54、的特征向量H;3)建立过程监视和故障检测的PCA模型;4)确定警告限和操作限; (2) 故障诊断1) 计算新批次等长的各个统计特征向量,并将其标准化;2) 计算新批次数据的Q统计量;3) 根据Q统计量的值是否超过了建模控制限来判断新的批次有没有发生故障。若SPE值超过了控制限,那么说明新的批次是故障的;反之则是正常的。3.4 仿真实验本文应用半导体工业实例A1堆腐蚀过程比较不同故障诊断方法的性能。半导体工业数据由108个正常硅片和21个故障硅片构成。 由于两个批次过程数据的大量丢失,本文应用107个正常硅片和20个故障硅片进行仿真研究。因为步骤4和5是主要的腐蚀步骤,仿真仅应用这两个步骤中的数
55、据点,进行故障诊断的17个非定点过程变量如表3.1所示。这个物理问题表明这些变量应该与过程和最终产品的状态有关。正如前面所指出的,半导体过程有些独特的特性。这些特性包括不等长的批次时间、不等长的阶段与过程漂移和转变。两个例子(变量EndPt A 和TCP Load)表明了这些特性,如图3.2所示。表3.1 A1堆腐蚀过程的故障诊断变量序号过程变量1BC132C12 Flow3RF Btm Pwr4RF Btm Rfl Pwr5EndPt A6Pressure7RF Tuner8RF Load9RF Phase Err 10RF Pwr 11RF Impendance12TCP Tuner13T
56、CP Phase Err14TCP Impedance15TCP Top Pwr16TCP Load17Vat Valve时间EndPt A0204060801001200500100015002000250030003500(a) EndPt ATCP Load时间 (b) TCP Load图3.2 数据集中的两个变量该仿真实验中,每个批次有17个过程变量。每个批次是不等长的,持续时间在95-112秒之间变化。随机抽取96个正常批次为建模数据,其余11个正常批次为校验数据。为了消除传感器中初始的波动影响,去除开始的5个样本,保留85个样本以适应最短的批次。对96个等长的正常批次数据运用MPC
57、A方法进行建模,并对11个校验批次数据和20个故障批次进行故障检测。MPCA方法的SPE检测结果如图3.3所示。MPCA方法检测出了故障4、7、12和13,然而,由于它们的数值较大,没有显示在图3.3中。运用基于统计特征的方法进行故障诊断,不需要数据预处理2。直接计算96个不等长批次的均值、方差、偏度、峭度和任意两个变量间的欧氏距离,并将这些统计特征组合成一个等长的特征向量,然后运用PCA进行过程监视。本文方法的SPE检测结果如图3.4所示。本文方法检测出了故障4和12,同样没有显示在图3.4中。图3.3 MPCA方法的SPE监测图图3.4 本文方法的SPE监测图两种方法的SPE检测结果对比如
58、表3.2所示。从表3.2可以看出,本文方法和传统MPCA对正常批次的SPE检测率均为100%;本文对故障批次的SPE故障检测率为80%,而传统的MPCA的检测率为65%。证明运用本文方法进行检测的准确率远远高于传统的MPCA方法,大大提高了故障检测率,减少了故障的误报率和漏报率。表3.2 SPE监测结果对比 TCP Load方法校验批次总数检测的校验批次总数校验批次检测比例故障批次总数检测的故障批次总数故障批次检测比例MPCA1111100%201365%本文方法1111100%201680%表3.3是在Matlab7.1平台下传统MPCA和本文方法故障检测所需的CPU时间(CPU:Penti
59、um Dual-core 2.93GHz RAM: 1.96GB)。由表3.3可知,MPCA方法需要计算14451445维的协方差矩阵,而本文方法协方差矩阵的维数仅为204204,减少了存储空间。与MPCA方法相比,本文方法降低了特征向量的维数,但是故障检测时间仅比MPCA方法减少了0.002秒。这是由于本文方法在运用MPCA进行故障诊断之前,需要先计算统计特征向量,增加了时间。表3.3 MPCA和本文方法故障检测对比方法特征向量大小协方差矩阵大小故障检测时间(s)MPCA14453144514450.0319本文方法20432042040.03173.5 本章小结传统的MPCA方法可以有效的
60、对等长批次生产过程中存在的故障进行检测和诊断,但是由于间歇过程具有间歇性、操作的不确定性、反应过程的多模态与不等长等特性,致使MPCA不能直接应用于间歇过程故障诊断。本章提出的基于统计特征的不等长间歇过程故障诊断方法可以有效的解决这些问题,使故障检测结果更加准确。同时,本章所介绍的算法减少了计算量和存储空间,降低了故障检测时间。第四章 总结和展望4.1 总结伴随着现代工业生产技术和科学的大力进步,生产装置向大型化、结构复杂化的趋势变得非常明显,在这一方面虽然大幅度提高了生产效率,但同时,生产过程发生事故的可能性也大大增加。传统的控制理论中的故障诊断方法主要是建立在系统的精确模型基础上的,这对于
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026中国农业科学院饲料研究所新兽药与免疫调控创新团队科研助理招聘2人备考题库参考答案详解
- 2026甘肃天水市张家川县县直事业单位选调33人备考题库及参考答案详解(b卷)
- 2026年河南省经济技术协作集团公司校园招聘笔试备考题库及答案解析
- 2026广东阳江市阳春市招聘乡村公益性岗位12人备考题库(第六批)及完整答案详解一套
- 2026年云南联通新通信有限公司校园招聘考试备考试题及答案解析
- 2026河南洛阳创业投资有限公司实习生招募考试参考题库及答案解析
- 2026年国电电力新疆新能源开发有限公司校园招聘笔试参考题库及答案解析
- 2026浙江国检检测技术股份有限公司第一轮招聘员工5人备考题库含完整答案详解(有一套)
- 2026浙江嘉兴市海宁市儿童福利院招聘2人备考题库(名校卷)附答案详解
- 2026年神皖能源校园招聘笔试备考试题及答案解析
- 弘法寺义工规章管理制度
- 大货车转租合同协议书
- T/ZJSEE 0016-2023高压电缆线路故障定位在线监测装置技术规范
- 2025全国英语等级考试(PETS)二级试卷:智能城市英语阅读理解
- 安全管理提升工作方案
- 小学生我的梦想课件
- 临床护理带教中的人文关怀
- 部编人教版8年级下册历史全册
- 马克思主义宗教观课件
- 项目式学习在小学数学教学中的应用
- 河道生态修复治理实施方案
评论
0/150
提交评论