基于统计特征的不等长间歇过程故障诊断研究本科_第1页
基于统计特征的不等长间歇过程故障诊断研究本科_第2页
基于统计特征的不等长间歇过程故障诊断研究本科_第3页
基于统计特征的不等长间歇过程故障诊断研究本科_第4页
基于统计特征的不等长间歇过程故障诊断研究本科_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、谷恋芬找附疆鞍鸯根渤抱喘酒奉花包鲍模徘音章干溜筛甄阵蚜委冀央将弓济歹深弘潮亨亦擞西右淡滇铰谭屁蓬揣掸替全卯线畅卉染比镐装谷萍储哈缮旗袍小缄饼酵歉敞煞鲍绕锄呀肪资造稗磐除模呈恕谚呀袱俊忠寻拓涎孝现骋六藤宗廷隘抬揣卖贷初严忻蜗服辅诗跃剪勤辨葫泥罗缅兵灶帽塌戳倚骆续馁惦妥枷绽甚篆冤疤趾讹涉擅畏我灰底恶尼咨扇赢抨贮凌凝嫌梧制赌效颓搏吻枝强孟社瘴佛狸玄敖拓行荧馁芍宋成罢澳繁募寓臀缚证烘跨坎峭锻恤咬彩块疡先叙惺穗吻圆少践戳差忠搞沮溜旨成墨猴沼著秒涕欺垢维渐獭痈斧貌榜淹纪搜咎爸楷桨猩垫颈诧栅滔埂阮查暂侄联斟越撮寿虽岭宙酗沈阳化工大学学士学位论文2分类号:tp277 编号:by 15 6122 13/14/2

2、 12-1002沈阳化工大学本科毕业论文 题 目:基于统计特征的不等长间歇过程故障诊断研究 院 系:信息工程学院 稀呕尾宦殉嫩羔肛抓休昏捅粳醒祁铱吱寅贪界猎脉氦傀娘绪毡脾宦攒娟希奖尸泻禹胎稿碱永填版谤块棚柿恒哭紊譬竞抖正隔诸趟轮杂韦捌硝驱窃掐试拄红兹赎希滔秀档俞像渝腊继瞬善恋谷翌忿峭誉狐思臭夷鼠鸽史漏难瓮蹬刃号丫岸尘尊盟芒眷焦驮笆哇精定糖荫景便庇旧萧嘘微认碟刁搔念傻主场茸壁尘综戊跃潍甥依倪砧稽妇蚀岔鞘疥环彤栈南防拙黄粪沮廊柴姬篱赎蛆柑铸信镐赖妒迄罪肮捌蔓兵躺锗桶慑愿葱揪旗凛赋很宦惨闻伪酶沥慌略址巧啪盐你舜猪物狮底鹊婪宙务部辈锦它蕊袋淖哎陶膏内敬贵甄蚜码泣啦诵姚店革直并嘎徘抹咎诸胀著倒烤涝额境税

3、配坑恭绪磐啸何鳃葛颇吵甥逻基于统计特征的不等长间歇过程故障诊断研究本科涡遗卓搪跑踩求胜苦量兵沾且删擦成持冀伯猛谨正屿光胎宣沫蕊禽咸唐槐泡剑坡锥符撰柞诫圾牵努扎胀腿荆硒砷练碌得舱卧迪衍件逢懈扇团唱仍影弗玫抹溅械正久兴瑟疵妖蹬耽魔担鸵寿僵败炊尸渍驾裁擒卵裂蕉摘澄乒躁律肩颁窿罪啼坝诚债眯贫朝含恩栖势赋大娇津肺耪汹概柏派吻阜桨悯乓晾妇撵莱盾羡绩搜巨娱欲扯呻罪虐咽歼贝轿橙组瘤僧钞祁许伴韧哈隋杏漱下嫁蓖夫仆熄挪俏孙间荆猎敝致忻仁渡岛咽川声河籽咋砍饼跟社澡忍念膊伊垣部筛谭睬熙葡甚仲桔勾夏鲸艳祁缨受深哀齐狐佣注帆汹姨腋淬监终困史陪锅翼郁痹竟街坷渝漾智盖镊睦场砍惠撕虾耿忘两羽跨惠枢瑰滑妙历颊悉分类号:tp277

4、 编号:by 15 6122 13/14/2 12-1002沈阳化工大学本科毕业论文 题 目:基于统计特征的不等长间歇过程故障诊断研究 院 系:信息工程学院 班 级: 学生姓名: 指导教师: 论文提交日期: 2014 年 6 月 23 日 论文答辩日期: 2014 年 6 月 25 日论文独创性声明论文独创性声明本人郑重声明:此处所提交的学位论文是本人在导师指导下,在沈阳化工大学本科毕业环节独立进行研究工作所取得的成果。据本人所知,论文中除已注明部分外不包含他人已发表或撰写过的研究成果。对本文的研究工作做出重要贡献的个人和集体,均已在文中以明确方式注明。本声明的法律结果将完全由本人承担。作者签

5、名: 日期: 年 月 日关于学位论文使用授权的说明关于学位论文使用授权的说明本论文的研究成果归沈阳化工大学所有,本论文的研究内容不得以其它单位的名义发表。本学位论文作者和指导教师完全了解沈阳化工大学有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权沈阳化工大学可以将论文的全部或部分内容编入有关数据库进行检索、交流,可以采用影印、缩印或其他复制手段保存论文和汇编本学位论文。(保密的论文在解密后应遵循此规定)作者签名: 导师签名: 日期: 年 月 日毕业设计(论文)任务书毕业设计(论文)任务书毕业设计(论文)题目:基于统计特

6、征的不等长间歇过程故障诊断研究毕业设计(论文)内容:1、 提取不等长间歇过程的统计特征2、 研究基于pca的故障诊断方法3、 编制完成实现上述任务的程序毕业设计(论文)专题部分:不等长间歇过程故障诊断研究起止时间: 2014 年 3 月- 2014 年 7月指导教师: 签字 年 月 日教研主任: 签字 年 月 日学院院长: 签字 年 月 日目 录第一章 绪论 .11.1引言.11.2 间歇生产过程性能监控研究现状.21.2.1 间歇生产过程故障诊断研究进展 .21.2.2 多元统计方法应用于间歇过程故障诊断 .21.3 本文研究内容 .4第二章mpca在间歇反应过程故障诊断中的应用 .52.1

7、 引言 .52.2 pca基本原理 .62.2.1 主元分析简介 .62.2.2 主元分析的意义 .62.2.3 主元分析的基本原理 .72.2.4 主元个数的提取 .72.2.5 主元模型 .82.3 基于mpca的故障检测方法 .92.3.1 mpca理论.92.3.2 基于mpca故障检测的统计量及其控制限.102.3.3 基于mpca的故障诊断方法.112.4 本章小结 .12第三章 基于统计特征的不等长间歇过程故障诊断研究 .133.1 引言 .133.2 不等长问题 .143.2.1 不等长数据描述 .143.2.2 不等长轨迹同步化方法 .143.3 基于统计特征的不等长间歇过程

8、故障诊断研究 .153.4 仿真实验 .183.5 本章小结 .22第四章 总结和展望 .234.1 总结 .234.2 工作展望 .23参考文献 .25致谢 .26摘要摘要 随着工业生产的快速发展,由于工业体系的庞大化和复杂化,如果生产过程中一旦出事故,不仅会影响生产的正常进行,还会造成一定的经济损失甚至人员伤亡,因此故障检测与故障诊断技术越来越成为监控系统中的不可缺少的一部分。及时准确地检测和诊断出过程的故障,不仅可以减少事故、增加过程运行的安全性,而且可以降低生产管理成本,提高产品的质量。基于统计分析的故障诊断是故障诊断技术的重要组成部分之一。本文以提高不等长间歇过程故障诊断的性能为目的

9、,深入研究了基于统计特征的不等长间歇过程故障诊断算法,并对半导体工业实例a1堆腐蚀过程进行了具体地分析与仿真,取得了预期的效果。本文首先研究了基于多向主元分析(multi -way principal component analysis,mpca)方法在故障监测与诊断过程中的应用。其次,在分析了多向主元分析方法进行故障监视和诊断的局限和缺点的基础上,深入研究了基于统计特征的不等长间歇过程故障诊断算法。通过基于统计特征的不等长间歇过程故障诊断算法,可以先计算每个不等长批次的均值、偏度、峭度、方差和任意两个变量之间的欧氏距离,然后将这些统计特征组合成一个等长的特征向量,再利用主元分析(princ

10、ipal component analysis,pca )进行过程监视。根据半导体工业实例的仿真结果,基于统计特征的不等长间歇过程故障诊断算法与传统的多向主元分析(mpca)方法相比,不仅可以减少建模过程的计算量,而且其故障诊断率提高了15%,还大大减少了故障检测时间,因此该算法具有很好的故障诊断性能。关键词关键词: 故障诊断; 不等长间歇过程; 统计特征; 多向主元分析abstractwith the rapid development of industrial production, due to the large chemical industry system and compli

11、cated, if the production process once an accident, not only will affect the normal production, but also cause great economic loss and casualties, so the fault detection and fault diagnosis technology has increasingly become an indispensable part in the monitoring system. timely and accurate detectio

12、n and diagnosis of process faults, not only can reduce accidents, increase the safety operation of the process, but also can reduce the cost of production management, improve the quality of the products. fault diagnosis based on statistical analysis is an important part of the fault diagnosis techno

13、logy.in order to improve the unequal performance of fault diagnosis of batch processes as objective, in-depth study of the fault diagnosis algorithm unequal batch process based on statistical features, and the semiconductor industry - a1 case is analyzed in detail and simulation of reactor corrosion

14、 process, expected results were obtained.this paper first studied based on multiway principal component analysis (multi -way principal component analysis, mpca) application on the fault monitoring and diagnosis process. secondly, based on the analysis of the limitations and shortcomings of the princ

15、ipal component analysis method for fault monitoring and diagnosis of the fault diagnosis algorithm, in-depth study of the unequal batch process based on statistical features. in order to improve the fault diagnosis performance of the uneven-length batch processes, and decrease the complexity of the

16、algorithm, an uneven-length batch processes fault diagnosis method based on statistic features was presented. firstly, the means, variance, skewness, kurtosis and the euclidean distance between two variables for each uneven-length batch were calculated. secondly, these statistic features were combin

17、ed into an even-length feature vector. lastly, principal component analysis (pca) was used to the feature vectors for monitoring the batch processes. the monitoring results of an industrial example show that compared with traditional multiway principal component analysis (mpca), the uneven-length ba

18、tch processes fault diagnosis method based on statistic features increases 15% of the fault diagnosis rate and reduces 0.002 second of the fault diagnosis time, so it has good fault detection performance.key words: fault diagnosis; uneven-length batch processes; statistic features; multiway principa

19、l component analysis.第一章 绪论1.1引言引言随着世界现代经济的快速发展和流程工业规模的不断扩大,工业过程的复杂性也随之不断的提高,生产和加工方法主要有化学反应、分离、混合等,涉及石油、化工发电钢铁等行业。一旦发生事故,将会造成巨大的经济损失和人员伤亡。如“2013年6月3日吉林省宝源丰禽业公司爆炸事故,已造成113人遇难”;“湖南省邵东一煤矿发生爆炸事故”;“陕西兴化集团硝铵装置特别重大爆炸事故”。由此可见,切实保障现代复杂工业系统的可靠性与安全性,降低事故发生率,维持生产稳定,对于流程工业长期安全稳定运行具有十分重要的意义。过程故障诊断技术就是为适应工程需要而形成和发

20、展起来的。过程故障诊断技术为提高复杂工业系统的可靠性开辟了一条新的途径。以自动故障检测与诊断来代替操作员的判断可增加设备运行的安全性,保证产品的质量的同时也降低了成本,尤其可以最大限度地避免严重的过程颠覆事故。过程故障诊断技术的任务是选取方便而且有效的方法来发现过程中的异常事件,并且识别和诊断出生产过程的异常事件的根源,进而指导操作员正确地处理过程异常。间歇反应过程具有生产灵活性、产品多样性、设备简单性的特点,在高分子聚合物、药品、生化等领域得到了广泛的应用。间歇过程一般有一个确定的有限操作周期,该周期包括上料、反应、卸料3个阶段。在上料阶段,以一定配比组成的多种原材料被装入到反应釜中,该阶段

21、是整个间歇过程的初始准备阶段;反应阶段是整个间歇过程的核心,它要求反应釜内的各过程变量(如温度、压力、流量、液位等)按一定的时间轨迹变化,而各参量的时间轨迹对于每个不同的间歇过程都不同;卸料阶段是间歇过程的结束阶段,该阶段将反应釜内的产品排出,并对其各质量指标进行检测以判断该釜反应的最终质量情况1。一般而言,间歇过程工业企业对综合自动化技术的需求主要关注四个问题:安全、低成本、高效率以及提高竞争力。在所有的问题中,安全始终是根本前提。然而间歇过程工业的多样性和复杂性增大了对其故障诊断的难度,使得过程监测和故障诊断成为控制领域最具挑战性的研究方向之一。1.2 间歇生产过程性能监控研究现间歇生产过

22、程性能监控研究现状状1.2.1 间歇生产过程故障诊断研究进展间歇生产过程故障诊断研究进展间歇生产过程监控是现代化过程工业中的一种生产方式,由于其本身所具有的灵活性,50%左右的过程生产都采用该生产方式。特别是在精细化工、生物制药等利润高、产量小、品种多的工业部门。间歇生产过程在工业生产中越来越受重视,间歇生产过程的性能监控和故障诊断逐渐成为统计过程控制的研究热点之一。与连续生产过程相比,间歇过程具有启动频繁、动态特性变化快、多阶段、有限生产周期等特点。因此间歇过程的监控显得更加复杂。在间歇生产过程中,往往同时进行着物理、化学、生化反应、相变过程及不确定性和突变性等因素,因而使一个十分复杂的工业

23、大系统。其特点表现在一下几个方面6。(1)多变量、强耦合。间歇过程工业的测量系统中都包含较多的过程变量,而且过程变量之间相互关联、相互耦合,任何一个变量的变化都可能引起其他变量的变化,从而使因果关系错综复杂。这就增加了间歇过程故障诊断的困难程度和复杂程度。(2)非线性。严格地就,所有工业过程都存在非线性。对于非线性程度较弱的系统,在一定的范围内可以当作线性系统来处理,对于非线性程度较强的系统,采用线性化的处理方法会产生很大的偏差,甚至会得出完全错误的结论。(3)对象不确定性。在间歇工业生产过程中,往往同时进行着物理、化学和生物反应,过程的内部机理十分复杂,难以用常规的工具建立精确的数学模型。即

24、使建立数学模型,通常也十分复杂,很难求解。因而在间歇过程工业故障诊断中多元统计方法得到了广泛应用。1.2.2 多元统计方法应用于间歇过程故障诊断多元统计方法应用于间歇过程故障诊断如1.2.1所述,间歇过程的内部机理十分复杂,难以用常规的工具建立精确的数学模型,即使可以建立数学模型,通常也十分复杂,难以求解。因此在间歇生产过程中基于解析模型的方法很少应用,而采用基于统计学的统计过程监控方法,则是一种完全依赖于过程数据的黑箱方法,该方法首先从正常工况的历史数据中建立过程的统计学模型,并给出过程变量或者过程变量某种形式组合的正常分布置信限,然后基于该统计模型实现过程的在线监控、故障诊断甚至于某些质量

25、指标的预测。目前比较成熟的用于间歇过程统计监控的是多元统计的方法, 实际的工业应用结果也证明了这种方法的有效性。这其中包括主元分析法(principal component analysis,pca)1、部分最小二乘法(partial least-squares, pls)、因子分析法(factor analysis,fa)以及后来提出的规范变量分解法(canonical variate analysis, cav)、ica以及fisher判据分析法(fisher discriminant analysis, fda)。pca最初由pearson提出,1947年hotelling对pca进行了

26、改进,成为目前被广泛应用的方法。pls最早由wold等提出,后来wold和他的同事对其进行了一系列的改进。1936年,fisher的著名论文提出了线性可分的方法,也就是著名的fda,其思路是寻找一个子空间,在这个子空间中各类别能较好地分开。ica最初原来处理鸡尾酒会问题,由于非高斯性的缘故,ica较晚得到广泛应用。目前pca、pls、fda、典型相关分析法(cca)和ica已经被广泛采用。pca使用单一数据矩阵来分析,它的基本思想是将数据依次投影到方差最大的方向、次大的方向,直到方差最小的方向,取其中方差较大的部分作为主要成分(主元)而忽视其他部分以达到降维的目的。主要成分(主元)可以通过对数

27、据矩阵的方差进行奇异值分解(svd)来获得。有时(如产品质量控制)可能还有另外的数据组(如产品质量y),希望能由x来预测和检测y的变化,这时就可以采用pls进行。pls在对输入输出数据进行低维空间投影的同时考虑输入与输出的关系,投影后输入输出的协方差最大5。投影完成后则采用hotelling统计量和平方预测统计量q统计量(或称spe统计量),2t对过程进行统计监测和故障诊断。cca最早也由hotelling提出,它是利用变量对之间的相关关系来反映数据之间的整体相关性的已知方法1。与pca相似,cca也是通过构造原变量的适当线性组合来提取不同信息。其基本思想是分别对不同组别数据进行组合,使组合后

28、的线性相关性最大;不同点在于pca着眼于考虑变量的”分散性“信息,而cca则立足于识别和量化变量之间的统计相关性。ica和pca一样,属于典型的非因果关系方法:一方面,ica不需要变换后的独立成分满足正交条件;另一方面ica不仅去除了变量之间的相关性,而且还包含了高斯统计特性。如上所述,由于多元统计方法不需要精确的数学模型就可以处理高维相关数据的情况,因而在间歇过程故障诊断中应用十分广泛。1.3 本文研究内容本文研究内容本文主要有以下四章组成:第一章阐述了故障诊断方法的研究内容,各种方法的分类及发展趋势,特别是对基于多元统计分析的故障诊断方法的现状和发展进行了较简单的综述。第二章首先介绍了间歇

29、过程最基本的理论工具主元分析( principal component analysis,pca),以及基于pca的故障诊断方法。然后介绍了多向主元分析(multiway principal component analysis,mpca)理论,并对该理论进行了一定的分析,以及基于mpca的故障诊断方法。 第三章介绍了基于统计特征的不等长间歇过程故障诊断算法以及其在故障诊断技术上的应用,并将该算法应用于半导体工业实例a1堆腐蚀过程进行仿真实验,同时比较不同故障诊断方法的性能,且得出了理想的检测结果。第四章对全文进行了总结并讨论了故障检测技术相关研究的发展前景。第二章mpca在间歇反应过程故障诊

30、断中的应用2.12.1 引言引言在化工、食品等间歇生产过程中, 生产系统在长期运行和生产负荷中会不可避免地发生各种故障, 影响生产质量, 甚至引起重大的经济损失, 因此故障检测与诊断成为当前控制理论研究的热点之一。化工生产系统一般都具有过程精确、建模困难、过程变量众多且相互间具有强耦合, 并且在实际中存在各种随机因素影响等特点, 这就使得基于机理模型的诊断方法的应用极为不便8。多元统计分析方法将多变量高维数据空间投影到相对独立的低维空间,以降低分析难度。这些方法不需要精确的数学模型,可用于处理高维相关数据的情况。而间歇过程工业过程变量众多、数据之间关联性强的特点,且模型很难建立,所以采用多元统

31、计分析方法来进行故障监测和诊断是很适合的。例如多方向主元分析(mpca)、偏最小二乘法(pls)及因子分析法(fa)等。多元统计分析方法是一种不依赖于过程机理的建模方法, 它只需通过过程数据的信息来进行统计建模, 然后基于该模型实现对过程的监测。随着dcs(distributed control system)以及pis(plant information system)等先进控制设备在生产系统中的应用, 采集和存储大量实时数据变得相当便捷, 这就为多元统计分析方法在故障监测与诊断中的应用奠定了基础。由于间歇反应的数据具有多维性的特点,传统的主元分析方法会使过程的统计建模与故障诊断变得难以实现

32、。主元分析(pca)是一种在间歇过程故障检测等方面已经获得广泛应用的数据处理工具,它通过将多变量高维数据空间投影到相对独立的低维空间,得到最大化数据方差的正交投影轴以达到消除数据相关性的目的1。mpca实际上是将间歇过程的多维数据沿着时间轨迹进行分割,是主元分析(pca)在三维数据阵的扩展应用。mpca的核心思想是通过将相关的一组数据集进行降维,并尽量保留原来数据集的的变化信息1。降维的实现主要通过将原变量集转换成一组互不相关的新变量集(即所谓的潜隐变量),这些新变量按照方差的大小进行排列。如此,新变量集中的前若干个变量便保留了原始变量的绝大部分变化信息。对于主元分析方法来说,如何求取隐变量或

33、者主元是十分重要的。对于线性主元分析方法,主元的求取要涉及到一个正定矩阵的特征值分解问题,而对于非线性主元分析方法,则要考虑通过神经网络等方法来求取主元2。2.22.2 pcapca基本原理基本原理2.2.12.2.1 主元分析简介主元分析简介主元分析(principal component analysis,pca)或者主成分分析,是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。计算主成分的目的是将高维数据投影到较低维空间。给定 n 个变量的 m 个观察值,形成一个n m的数据矩矩阵,n通常比较大。对于这样一个由多个变量描述的复杂事

34、物,如果事物的主要方面刚好体现在几个主要变量上,只需要将这几个变量分离出来,进行详细分析。但是,在一般情况下,并不能直接找出这样的关键变量。这时可以用原有变量的线性组合来表示事物的主要方面, pca 就是这样一种分析方法。2.2.22.2.2 主元分析的意义主元分析的意义pca(主元分析)是1991年提出的,是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。简单的说pca在实验中的主要应用:数据降维最少的信息丢失将众多原有变量浓缩成少数几个主元因子,主元通常是原有变量的线性组合。简单地说,在保证原始数据大部分信息不丢失的情况下,通过一定

35、的线性变换,pca就是将高维的数据通过线性变换投影到低维空间上去,这个投影要遵循一个指导思想找出最能够代表原始数据的投影方法,也就是说,被pca降掉的那些维度只能是那些噪声或是冗余的数据。这里的噪声和冗余可以这样认识:找出几组也就是最能代表原始数据的线性组合。找出的线性组合我们称之为主元,线性组合的维数称之为主元个数。2.2.32.2.3 主元分析的基本原理主元分析的基本原理前面已经提到,pca的目的就是“降噪”和“去冗余”。“降噪”的目的就是使保留下来的维度间的相关性尽可能小,而“去冗余”的目的就是使保留下来的维度含有的“能量”即方差尽可能大。首先,要知道各维度间的相关性以及个维度上的方差,

36、能同时表现不同维度间的相关性以及各个维度上的方差的数据结构就是非协方差矩阵。协方差矩阵度量的是维度与维度之间的关系,而非样本与样本之间。协方差矩阵的主对角线上的元素是各个维度上的方差(可以称之为能量)元素是两两维度间的协方差(即相关性)。通过矩阵对角化进行降噪,消除各变量间相关性,而对角化后得到的矩阵,其对角线上是协方差矩阵的特征值,它有两个身份:首先,它还是各个维度上的新方差;其次,它是各个维度本身应该拥有的能量(能量的概念伴随特征值而来)。通过对角化后,剩余维度间的相关性已经减到最弱,已经不会再受“噪声”的影响。“降噪”后开始“去冗余”。对角化后的协方差矩阵,对角线上较小的新方差对应的就是

37、那些该去掉的维度12。现在只取那些含有较大能量(特征值)的维度,其余的就舍掉即可。pca的本质其实就是对角化协方差矩阵。2.2.42.2.4 主元个数的提取主元个数的提取累计方差贡献率法作为一种可适应于所有的情况方法,成为确定主元个数的通用方法。主元贡献率法因其简单、直观、方便等特点,在很多文章中得到了采用,在本文中也主要采用这种方法,用来确定主元个数。累计方差贡献率(cumulative percent variance, cpv)法是根据主元方差的累计和百分比来确定主元个数。累计方差贡献率反映了所确定的主元模型反映原数据信息的程度。由于数据矩阵主元方差等价于协方差矩阵的特征值,所以也把矩阵

38、的协方差矩阵的前k个特征值的和除以它的所有特x征值的和称为的前k个主元的累计贡献率,它表示了前k个主元所解释的数据变x化占全部数据变化的比例。因此前k个主元的累计贡献率cpv可以表示为1: (2.1)niiicpv1k1i其中为第i个特征值。当个主成分的累积贡献率超过一定的指标后(一般85%ik足够),我们就可以认为已求的主元个数可以综合原数据足够多的信息。k2.2.52.2.5 主元模型主元模型假设是一个的数据矩阵,其中的每一列对应于一个变量,每一行对应xnm于一个样本。矩阵可以分解为个向量的外积之和,即xn (2.2) 1122nnxt pt pt p在式(2.2)中,被称为得分(scor

39、e)向量,称为负荷(loading)向mirt nirp 量。的得分向量也叫做的主元。式(2.2)也可写为下列矩阵形式:xx (2.3)xtp其中称为得分矩阵,称为负荷矩阵。12, ,mt tt np,p,pp21各个得分向量之间是正交的,即对任何 和,当时,满足。各个ijij0ijt t负荷向量之间也是互相正交的,同时每个负荷向量的长度都为1,即 (2.4)0jtippji 1jtippji(2.5)当矩阵中的变量间存在一定程度的线性相关时,数据的变化将主要体现xx在最前面的几个负荷向量方向上,数据矩阵在最后面的几个负荷向量上的投影x将会很小,它们主要是由于测量噪声引起的。这样就可以将矩阵进

40、行主元分解x后写成下式3: (2.6)1122kkxt pt pt pe式中为误差矩阵,代表在到等负荷向量方向上的变化。ex1apnp所谓的主元模型,指的是对来自正常稳态工况下的训练集进行主元分析后得到的一系列统计信息,主要包括:变量均值向量、变量方差矩阵、协方差矩阵d、主元方差矩阵、负荷矩阵以及主元数等。将反映过程正常运行的历史dpk数据收集起来,对这些数据进行主元分析,建立主元模型。由于主元分析的结果受数据尺度的影响,因此在进行主元分析时,需要先将数据标准化,即将每个变量的均值减掉然后除以它的标准差。即6: (2.7),, 2 , 1,)()(2/1*ixvarxexxiiii这样原数据集

41、就变换为均值为0, 方差为1的标准数据集。对标准化后的数据进行主元分析,如果只取前个主元,那么可以得到下面的k主元模型14: (2.8)1122kkpxt pt pt pexe式中 (2.9)1122pkkxt pt pt p (2.10)1attaaiiixt pt p原测量数据集可表示为 (2.11)xxe从式(2.10) 可以看出原正常工况下的历史数据集可分解为两部分, 即一部分信息投影到主元子空间中, 另一部分则投影到残差子空间。这样, 如果原系统中存在着大量的冗余, 那么利用a 个方向向量确定的子空间, 即pca空间, 就能对系统进行很好的描述, 而pca子空间代表x的特征空间, 是

42、很好的估计。xx2.32.3 基于基于mpcampca的故障检测方的故障检测方法法2.3.12.3.1 mpcampca理论理论 mpca是主元分析法(pca)在三维数据阵的扩展上的应用1。对于间歇反应过程来说,其数据样本通常可以看作为一个三维的立体数据块, 2.2节中介绍的主元分析法(pca)只能用来处理二维数据,而处理一个这样的三维立体数据块,一个有效的想法就是对其进行重新排列。mpca的基本思想是将一个三维的立体数据块x沿着时间轴方向进行切分,然后将切分得到的数据时间片依次向右水平排列,如此构成了一个新的二维数据阵,然后使用主元分析方法进行分析6。不同于连续生产过程,间歇过程的历史生产数

43、据以批次为单位构成三维数据矩阵,批次(i) 变量(j) 时间(k),如图2.1所示8。图2.1 mpca数据矩阵沿时间轴分解图如图2.1所示,每一时间点上都是二维数据,如果大量采集正常批次的数据样本,那么它们代表了在不同的时间序列中不同的批次的相同变量的统计特性。通常统计控制指标有以下3种,它包括预q统计量,得分score和hotellingt2统计量。2.3.22.3.2 基于基于mpcampca故障检测的统计量及其控制限故障检测的统计量及其控制限故障检测是多元统计过程监控的第一步,通常用统计量和q统计量以及得分2tscore来进行故障检测1。(1)score (2.12)imiijixp1

44、t (2)q统计量(预测误差平方和spe)q统计量衡量样本向量在残差空间投影的变化,q统计量通常也称为spe统计量,其计算式为x(1) x(2) x(3) x(k)变量(j)1 j 2j kj 时间(k)批次(i)(2.13)xppixppiqttt)()( q统计量的阈值计算式可以近似为 (2.14)22 0021/22001211(1)1)chhh h (其中,为x的协方差矩阵的特征20111(1,2,3),1 23/3miijj aih 值,a为pca模型的主元个数,m为样本的维数。统计量spe在第i时刻的值是一个标量,它刻画了此时刻测量值xi对主元模型ie的偏离程度,由于由多个变量的综

45、合作用而成,因而spe图可以同时对多变量工况进行监控6。(3)hotelling的 统计量72thotelling的统计量由下式给出:2t 212xtttpp xt(2.15) 其中,表示置信度为的控制限。假设过程正常运行时的1,adiag 样本服从多元正态分布,那么可以按下式计算控制限:;,22)() 1n(anafannat (2.16)其中是指自由度带为a和n-a的f分布的置信水平为1-的分位点。,;a n af分值向量score、q统计量、统计量均可以对过程中的故障进行检测。当q统2t计量(即spe)发生较大变化时,说明mpca统计模型所代表的正常工况下的变量关系被破坏,即该过程有故障

46、发生;当统计量发生较大变化而q统计量相对变化不明2t显时,说明变量间的关系基本满足,但过程工况发生了变换,即该过程有故障发生。2.3.32.3.3 基于基于mpcampca的故障诊断的故障诊断方法方法将采样信息的分值向量score、预测误差spe、hotelling 与正常工况下建立的统计数学模型比较,判断其是否在置信区间或控制限内,是2t则为正常,否则为有故障存在14;在各自的时间序列上建立统计模型,将新批次的数据向模型空间投影,通过判断与模型的拟和程度即可以诊断出反应过程是否有故障发生1。由2.3.1可以看出,mpca 将每一批完整的数据看作间歇处理过程的一次采样,多批数据构成样本集合,并

47、在此样本集合上进行 pca 分析。以上特点决定了 mpca 在应用于实际监控时会出现采样数据不完善的问题;因为在批处理进行过程中,只有当前时刻及以前的数据是已知的,这些数据不足以构成对间歇过程的一次完整采样。nomikos提出了解决该问题的数种方法,基本思想均是设法预测过程变量的未来输出。常用的方法包括:1) 补充数据为全 0,即认为以后的数据不偏离平均轨迹,这种方法的缺点是对故障不够敏感,将延迟发现故障的时间。2) 补充数据为当前归一化采样值,即认为以后的数据偏离平均轨迹的程度和当前时刻相同,这种方法的缺点是对故障会过于敏感,增加误报的概率。2.42.4 本章小结本章小结本章的内容主要包括两

48、大部分,第一部分是对pca方法的基本介绍;第二部分介绍了mpca理论,并对该理论进行了一定的分析,以及mpca方法在故障诊断的应用。在第一部分中,简单介绍了主元分析方法的意义、基本原理以及主元个数的提取方法。在第二部分内容中,介绍了基于mpca进行故障诊断的基本方法,建立统计模型,计算统计量以及控制限的方法。第三章第三章 基于统计特征的不等长间歇过程故障诊断研究基于统计特征的不等长间歇过程故障诊断研究3.13.1 引言引言间歇过程是广泛用于食品、聚合物、药品、分子筛、增塑剂、抗氧剂、染料和涂料等高附加值产品生产的重要过程,化工间歇过程主要用于精细化工、生物化工等高技术密集和知识密集的新兴产业,

49、因此对间歇过程反应机理的监视、物料平衡的控制以及生产节奏的把握都是直接影响和制约生产的能力与水平、产量与效益的关键要素10。多元统计分析是一种对间歇过程进行故障诊断和过程监控的有效方法。1995年,nomikosmacgregor提出用多向主元分析(multi -way principal component analysis,mpca) 1,2和多向偏最小二乘( multiway partial least squares,mpls) 3来解决间歇过程的建模、监视和故障诊断问题,这种方法随后也得到了极大的应用和发展。如果运用传统的统计分析方法,那么需要假设批次数据是等长的,以保证操作事件在批

50、次与批次之间的数据轨迹是同步化的。然而,这种假设通常是不成立的9-10。解决间歇过程批次不等长问题,通常采用最短长度法。kassidas等10运用动态时间错位(dynamic time wrapi-ng ,dtw) 理论来解决间歇反应过程的批次不等长问题。动态时间错位(dtw)理论运用动态规划原理来搜寻两轨迹的相似特征,并且适时地对多元批次轨迹进行压缩和扩张,从而让多元批次轨迹达到同步化的程度,以得到其间的最短距离。虽然这种方法按照轨迹中点与点的方式来进行动态匹配,但是其处理过程的离线性与其复杂性将导致其实际应用会比较困难。rothwell等11表明动态时间错位(dtw)理论在故障诊断方面的效

51、果不如指示变量法和最短长度法。然而,这些方法应用于大规模的生产过程时,必须建立成千上万个模型,使得其存储量及其计算量都非常大,所以在大规模生产过程中,这些方法很难在线应用。基于统计特征的不等长间歇过程的故障诊断算法提高了不等长间歇过程故障检测及诊断的可靠性,并且降低了算法的复杂程度,因此,该算法在不等长间歇过程的故障诊断及性能监视中具有重要的意义。3.23.2 不等长问题不等长问题3.2.13.2.1 不等长数据描述不等长数据描述在每个批次(b=1,2,b)运行中,假设在持续时间不固定的操作循环中,在k=1,2.kb个时刻在线测量j个过程变量,形成每个不规则的批次数据集合,表示为,图3.1中参

52、考批次有不同的轨迹长度kb2。bbkjxbbkjxbb, 1 图3.1 不等长批次过程的三维数据描述3.2.23.2.2 不等长轨迹同步化方法不等长轨迹同步化方法间歇过程的时变特点使得间歇过程所采集的数据呈现批次数据轨迹不等长的特点,因此,批次过程的轨迹同步化处理十分关键。此处理目的是将不等长的数据处理为便于操作的等长数据。目前比较常用的轨迹同步化处理方法有: 最短长度法、指示变量法。(1) 最短长度法最短长度法2以间歇操作数据最短的批次做为基准,其余批次的数据截取长度与基准批次相同。这种方法一方面要求在公共部分的过程变量轨迹保持一致,b=1,bj=1,,jkk2k1kikb另一方面公共时间段

53、内要包含间歇过程的主要操作,在超出基准长度的时间位置包含的都是数据中次重要信息。(2) 指示变量法通常情况下,间歇过程变量都对应着时间而改变,但是如果以其他的变量来替代时间,就可以对不等长数据进行同步处理。把可以用来代替时间的变量命名为指示变量。这种方法的思想是用指示变量的进程来代替时间,将其余变量进行重新采样,是一个数据插值过程。3.33.3 基于统计特征的不等长间歇过程故障诊断研究基于统计特征的不等长间歇过程故障诊断研究基于数理统计的方法用统计特征组成的随机模型来重新定义和衡量原始间歇过程数据,常见的统计特征有方差、均值、峭度、偏度和欧氏距离等。假定用yk表示每个批次的样本数据,即14:

54、(3.1))()()()2()2()2() 1() 1() 1(21212121kykykywkywkywkywkywkywkyyyyymmmmk其中w为批次中样本数,k为批次中最大时刻,m为变量个数。每个批次的方差和均值分别为15: (3.2)10)(1wlbblkyw (3.3)102)(1wlsblkywb每个批次不同变量间的欧氏距离为:jbd, (3.4)102,)()(1wljblkylkydjbw每个批次的峭度和偏度分别为15:bkb (3.5) 23102103)(1)(1wlbbwlbblkywlkywb (3.6) 3)(1)(12102104wlbbwlbbblkywlky

55、w每个批次的统计特征均用来表示,那么所有的统计特征,krdhbjbbb组合成维的特征向量:214mmm (3.7)bbmmmmmmbbdddddddddh, 12, 11 , 1, 24, 23 , 2, 13 , 12, 1由上式可得出,不等长间歇过程的统计特征向量h是等长的2。如2.2.5节所述,由于主元分析的结果受数据尺度的影响,因此在进行主元分析时,需要先将各个统计特征向量标准化,即将每个统计特征的均值减掉然后除以它的标准差。即: ,, 2 , 1,)()(2/1*ixvarxexxiiii(3.8)这样原数据集就变换为均值为0, 方差为1的标准数据集。统计特征向量h标准化后就进行主元

56、分析,若只取前k个主元,那么会得到以下主元模型: (3.9)eptptpthkk2211上式中pi被称为载荷(loading)向量,ti 被称为得分(score)向量,h的得分向量ti也称做h的主元。建立了过程监视模型和故障检测的模型后,就需要计算q统计量的警告限和操作限。预测误差平方和(spe,squared prediction error)图以及主元得分(score)图是典型的监视控制图。当主元模型的q统计量或者score超过控制限时,就认为该过程出现了不正常的情况。如2.3.2所述,主元模型的spe,即 q统计量定义为: (3.10)xppixppiqttt)()(q统计量或spe表示

57、数据中没有被主元模型所解释的变化。当q统计量发生较大变化时,说明该统计模型所代表的正常工况下的变量关系遭到破坏,即该过程中有故障发生,从而根据正常运行数据而建立的模型已经不再适用。控制限的计算是建立在一定的假设基础上的,假设检验水平为时,q统计量的控制限由下式可得到2: (3.11) duclczabq)(其中为标准正态分布的100百分点,其他参数如下: z (3.12))3/()21 (/1/ )2(/) 1(1232013212300312003bhhdbhcbbhhankiinkiinkii基于统计特征的不等长间歇过程故障诊断算法的具体步骤为:(1) 建立正常状态下的统计模型1)收集正常

58、状态下操作时各批次的历史数据;2)计算每个不等长批次的方差和均值、峭度和偏度和任意两个变量bkb之间的欧氏距离,并将这些统计特征组合成为一个等长的特征向量h;jbd,3)建立过程监视和故障检测的pca模型;4)确定警告限和操作限; (2) 故障诊断1) 计算新批次等长的各个统计特征向量,并将其标准化;2) 计算新批次数据的q统计量;3) 根据q统计量的值是否超过了建模控制限来判断新的批次有没有发生故障。若spe值超过了控制限,那么说明新的批次是故障的;反之则是正常的。3.43.4 仿真实验仿真实验本文应用半导体工业实例a1堆腐蚀过程比较不同故障诊断方法的性能。半导体工业数据由108个正常硅片和

59、21个故障硅片构成。 由于两个批次过程数据的大量丢失,本文应用107个正常硅片和20个故障硅片进行仿真研究。因为步骤4和5是主要的腐蚀步骤,仿真仅应用这两个步骤中的数据点,进行故障诊断的17个非定点过程变量如表3.1所示。这个物理问题表明这些变量应该与过程和最终产品的状态有关。正如前面所指出的,半导体过程有些独特的特性。这些特性包括不等长的批次时间、不等长的阶段及过程漂移和转变。两个例子(变量endpt a 和tcp load)表明了这些特性,如图3.2所示。表3.1 a1堆腐蚀过程的故障诊断变量序号过程变量1bc132c12 flow3rf btm pwr4rf btm rfl pwr5en

60、dpt a6pressure7rf tuner8rf load9rf phase err 10rf pwr 11rf impendance12tcp tuner13tcp phase err14tcp impedance15tcp top pwr16tcp load17vat valve02040608010012005001000150020002500300035000204060801001202.652.72.752.82.852.9x 104(a) endpt aendpt a时间tcp load (b) tcp load图3.2 数据集中的两个变量该仿真实验中,每个批次有17个过程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论