




已阅读5页,还剩31页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
分类号 TP277 编号 BY 15 6122 13 14 2 12 1002 沈阳化工大学 本科毕业论文 题 目 基于统计特征的不等长间歇过程 故障诊断研究 院 系 信息工程学院 班 级 学生姓名 指导教师 论文提交日期 2014 年 6 月 23 日 论文答辩日期 2014 年 6 月 25 日 论文独创性声明论文独创性声明 本人郑重声明 此处所提交的学位论文是本人在导师指导下 在 沈阳化工大学本科毕业环节独立进行研究工作所取得的成果 据本人 所知 论文中除已注明部分外不包含他人已发表或撰写过的研究成果 对本文的研究工作做出重要贡献的个人和集体 均已在文中以明确 方式注明 本声明的法律结果将完全由本人承担 作者签名 日期 年 月 日 关于学位论文使用授权的说明关于学位论文使用授权的说明 本论文的研究成果归沈阳化工大学所有 本论文的研究内容不得 以其它单位的名义发表 本学位论文作者和指导教师完全了解沈阳化 工大学有关保留 使用学位论文的规定 即 学校有权保留并向国家 有关部门或机构送交论文的复印件和电子版 允许论文被查阅和借阅 本人授权沈阳化工大学可以将论文的全部或部分内容编入有关数据 库进行检索 交流 可以采用影印 缩印或其他复制手段保存论文和 汇编本学位论文 保密的论文在解密后应遵循此规定 作者签名 导师签名 日期 年 月 日 毕业设计 论文 任务书毕业设计 论文 任务书 毕业设计 论文 题目 基于统计特征的不等长间歇过程故 障诊断研究 毕业设计 论文 内容 1 提取不等长间歇过程的统计特征 2 研究基于PCA的故障诊断方法 3 编制完成实现上述任务的程序 毕业设计 论文 专题部分 不等长间歇过程故障诊断研究 起止时间 2014 年 3 月 2014 年 7月 指导教师 签字 年 月 日 教研主任 签字 年 月 日 学院院长 签字 年 月 日 目 录 第一章 绪论 1 1 1引言 1 1 2 间歇生产过程性能监控研究现状 2 1 2 1 间歇生产过程故障诊断研究进展 2 1 2 2 多元统计方法应用于间歇过程故障诊断 2 1 3 本文研究内容 4 第二章MPCA在间歇反应过程故障诊断中的应用 5 2 1 引言 5 2 2 PCA基本原理 6 2 2 1 主元分析简介 6 2 2 2 主元分析的意义 6 2 2 3 主元分析的基本原理 7 2 2 4 主元个数的提取 7 2 2 5 主元模型 8 2 3 基于MPCA的故障检测方法 9 2 3 1 MPCA理论 9 2 3 2 基于MPCA故障检测的统计量及其控制限 10 2 3 3 基于MPCA的故障诊断方法 11 2 4 本章小结 12 第三章 基于统计特征的不等长间歇过程故障诊断研究 13 3 1 引言 13 3 2 不等长问题 14 3 2 1 不等长数据描述 14 3 2 2 不等长轨迹同步化方法 14 3 3 基于统计特征的不等长间歇过程故障诊断研究 15 3 4 仿真实验 18 3 5 本章小结 22 第四章 总结和展望 23 4 1 总结 23 4 2 工作展望 23 参考文献 25 致谢 26 摘要摘要 随着工业生产的快速发展 由于工业体系的庞大化和复杂化 如果生 产过程中一旦出事故 不仅会影响生产的正常进行 还会造成一定的 经济损失甚至人员伤亡 因此故障检测与故障诊断技术越来越成为监 控系统中的不可缺少的一部分 及时准确地检测和诊断出过程的故障 不仅可以减少事故 增加过程运行的安全性 而且可以降低生产管 理成本 提高产品的质量 基于统计分析的故障诊断是故障诊断技术 的重要组成部分之一 本文以提高不等长间歇过程故障诊断的性能为目的 深入研究了 基于统计特征的不等长间歇过程故障诊断算法 并对半导体工业实例 A1堆腐蚀过程进行了具体地分析与仿真 取得了预期的效果 本文首先研究了基于多向主元分析 Multi way principal component analysis MPCA 方法在故障监测与诊断过程中的应用 其次 在分 析了多向主元分析方法进行故障监视和诊断的局限和缺点的基础上 深入研究了基于统计特征的不等长间歇过程故障诊断算法 通过基于 统计特征的不等长间歇过程故障诊断算法 可以先计算每个不等长批 次的均值 偏度 峭度 方差和任意两个变量之间的欧氏距离 然后 将这些统计特征组合成一个等长的特征向量 再利用主元分析 princi pal Component Analysis PCA 进行过程监视 根据半导体工业实例的仿真结果 基于统计特征的 不等长间歇过程故障诊断算法与传统的多向主元分析 MPCA 方法相比 不仅可以减少建模过程的计算量 而且其故障诊断率提高了15 还大大减少了故障检测时间 因此该算法具有很好的故障诊断性能 关键词关键词 故障诊断 不等长间歇过程 统计特征 多向主元分析 Abstract With the rapid development of industrial production due to the large chemical industry system and complicated if the production process once an accident not only will affect the normal production but also cause great economic loss and casualties so the fault detection and fault diagnosis technology has increasingly become an indispensable part in the monitoring system Timely and accurate detection and diagnosis of process faults not only can reduce accidents increase the safety operation of the process but also can reduce the cost of production management improve the quality of the products Fault diagnosis based on statistical analysis is an important part of the fault diagnosis technology In order to improve the unequal performance of fault diagnosis of batch processes as objective in depth study of the fault diagnosis algorithm unequal batch process based on statistical features and the semiconductor industry A1 case is analyzed in detail and Simulation of reactor corrosion process expected results were obtained This paper first studied based on multiway principal component analysis Multi way principal component analysis MPCA application on the fault monitoring and diagnosis process Secondly based on the analysis of the limitations and shortcomings of the principal component analysis method for fault monitoring and diagnosis of the fault diagnosis algorithm in depth study of the unequal batch process based on statistical features In order to improve the fault diagnosis performance of the uneven length batch processes and decrease the complexity of the algorithm an uneven length batch processes fault diagnosis method based on statistic features was presented Firstly the means variance skewness kurtosis and the Euclidean distance between two variables for each uneven length batch were calculated Secondly these statistic features were combined into an even length feature vector Lastly principal component analysis PCA was used to the feature vectors for monitoring the batch processes The monitoring results of an industrial example show that compared with traditional multiway principal component analysis MPCA the uneven length batch processes fault diagnosis method based on statistic features increases 15 of the fault diagnosis rate and reduces 0 002 second of the fault diagnosis time so it has good fault detection performance Key words fault diagnosis uneven length batch processes statistic features multiway principal component analysis 第一章 绪论 1 1引言引言 随着世界现代经济的快速发展和流程工业规模的不断扩大 工业过程的复杂 性也随之不断的提高 生产和加工方法主要有化学反应 分离 混合等 涉及石 油 化工发电钢铁等行业 一旦发生事故 将会造成巨大的经济损失和人员伤亡 如 2013年6月3日吉林省宝源丰禽业公司爆炸事故 已造成113人遇难 湖 南省邵东一煤矿发生爆炸事故 陕西兴化集团硝铵装置特别重大爆炸事故 由此可见 切实保障现代复杂工业系统的可靠性与安全性 降低事故发生率 维持生产稳定 对于流程工业长期安全稳定运行具有十分重要的意义 过程故障 诊断技术就是为适应工程需要而形成和发展起来的 过程故障诊断技术为提高复 杂工业系统的可靠性开辟了一条新的途径 以自动故障检测与诊断来代替操作员 的判断可增加设备运行的安全性 保证产品的质量的同时也降低了成本 尤其可 以最大限度地避免严重的过程颠覆事故 过程故障诊断技术的任务是选取方便而 且有效的方法来发现过程中的异常事件 并且识别和诊断出生产过程的异常事件 的根源 进而指导操作员正确地处理过程异常 间歇反应过程具有生产灵活性 产品多样性 设备简单性的特点 在高分子聚 合物 药品 生化等领域得到了广泛的应用 间歇过程一般有一个确定的有限操 作周期 该周期包括上料 反应 卸料3个阶段 在上料阶段 以一定配比组成的多 种原材料被装入到反应釜中 该阶段是整个间歇过程的初始准备阶段 反应阶段是 整个间歇过程的核心 它要求反应釜内的各过程变量 如温度 压力 流量 液位 等 按一定的时间轨迹变化 而各参量的时间轨迹对于每个不同的间歇过程都不同 卸料阶段是间歇过程的结束阶段 该阶段将反应釜内的产品排出 并对其各质量 指标进行检测以判断该釜反应的最终质量情况 1 一般而言 间歇过程工业企业对综合自动化技术的需求主要关注四个问题 安 全 低成本 高效率以及提高竞争力 在所有的问题中 安全始终是根本前提 然而间歇过程工业的多样性和复杂性增大了对其故障诊断的难度 使得过程监测 和故障诊断成为控制领域最具挑战性的研究方向之一 1 2 间歇生产过程性能监控研究现间歇生产过程性能监控研究现状状 1 2 1 间歇生产过程故障诊断研究进展间歇生产过程故障诊断研究进展 间歇生产过程监控是现代化过程工业中的一种生产方式 由于其本身所具有 的灵活性 50 左右的过程生产都采用该生产方式 特别是在精细化工 生物制药 等利润高 产量小 品种多的工业部门 间歇生产过程在工业生产中越来越受重 视 间歇生产过程的性能监控和故障诊断逐渐成为统计过程控制的研究热点之一 与连续生产过程相比 间歇过程具有启动频繁 动态特性变化快 多阶段 有 限生产周期等特点 因此间歇过程的监控显得更加复杂 在间歇生产过程中 往往同时进行着物理 化学 生化反应 相变过程及不 确定性和突变性等因素 因而使一个十分复杂的工业大系统 其特点表现在一下 几个方面 6 1 多变量 强耦合 间歇过程工业的测量系统中都包含较多的过程变量 而且过程变量之间相互关联 相互耦合 任何一个变量的变化都可能引起其他变 量的变化 从而使因果关系错综复杂 这就增加了间歇过程故障诊断的困难程度 和复杂程度 2 非线性 严格地就 所有工业过程都存在非线性 对于非线性程度较弱 的系统 在一定的范围内可以当作线性系统来处理 对于非线性程度较强的系统 采用线性化的处理方法会产生很大的偏差 甚至会得出完全错误的结论 3 对象不确定性 在间歇工业生产过程中 往往同时进行着物理 化学和 生物反应 过程的内部机理十分复杂 难以用常规的工具建立精确的数学模型 即使建立数学模型 通常也十分复杂 很难求解 因而在间歇过程工业故障诊断 中多元统计方法得到了广泛应用 1 2 2 多元统计方法应用于间歇过程故障诊断多元统计方法应用于间歇过程故障诊断 如1 2 1所述 间歇过程的内部机理十分复杂 难以用常规的工具建立精确的 数学模型 即使可以建立数学模型 通常也十分复杂 难以求解 因此在间歇生 产过程中基于解析模型的方法很少应用 而采用基于统计学的统计过程监控方法 则是一种完全依赖于过程数据的黑箱方法 该方法首先从正常工况的历史数据 中建立过程的统计学模型 并给出过程变量或者过程变量某种形式组合的正常分 布置信限 然后基于该统计模型实现过程的在线监控 故障诊断甚至于某些质量 指标的预测 目前比较成熟的用于间歇过程统计监控的是多元统计的方法 实际的工业应用结果也证明了这种方法的有效性 这其中包括主元分析法 princ ipal Component Analysis PCA 1 部分最小二乘法 partial least squares PLS 因子分析法 factor analysis FA 以及后来提出的规范变量分解法 canonical variate analysis CAV ICA以及Fisher判据分析法 Fisher discriminant analysis FDA PCA最初由Pearson提出 1947年Hotelling对PCA进行了改进 成为目前被 广泛应用的方法 PLS最早由Wold等提出 后来Wold和他的同事对其进行了一系列 的改进 1936年 Fisher的著名论文提出了线性可分的方法 也就是著名的FDA 其思路是寻找一个子空间 在这个子空间中各类别能较好地分开 ICA最初原来处 理鸡尾酒会问题 由于非高斯性的缘故 ICA较晚得到广泛应用 目前PCA PLS FDA 典型相关分析法 CCA 和ICA已经被广泛采用 PCA使用单一数据矩阵来分析 它的基本思想是将数据依次投影到方差最大的 方向 次大的方向 直到方差最小的方向 取其中方差较大的部分作为主要成分 主元 而忽视其他部分以达到降维的目的 主要成分 主元 可以通过对数据 矩阵的方差进行奇异值分解 SVD 来获得 有时 如产品质量控制 可能还有另外的数据组 如产品质量Y 希望能由 X来预测和检测Y的变化 这时就可以采用PLS进行 PLS在对输入输出数据进行低 维空间投影的同时考虑输入与输出的关系 投影后输入输出的协方差最大 5 投影 完成后则采用Hotelling统计量和平方预测统计量Q统计量 或称SPE统计量 2 T 对过程进行统计监测和故障诊断 CCA最早也由Hotelling提出 它是利用变量对 之间的相关关系来反映数据之间的整体相关性的已知方法 1 与PCA相似 CCA也 是通过构造原变量的适当线性组合来提取不同信息 其基本思想是分别对不同组 别数据进行组合 使组合后的线性相关性最大 不同点在于PCA着眼于考虑变量的 分散性 信息 而CCA则立足于识别和量化变量之间的统计相关性 ICA和PCA一 样 属于典型的非因果关系方法 一方面 ICA不需要变换后的独立成分满足正交 条件 另一方面ICA不仅去除了变量之间的相关性 而且还包含了高斯统计特性 如上所述 由于多元统计方法不需要精确的数学模型就可以处理高维相关数 据的情况 因而在间歇过程故障诊断中应用十分广泛 1 3 本文研究内容本文研究内容 本文主要有以下四章组成 第一章阐述了故障诊断方法的研究内容 各种方法的分类及发展趋势 特别 是对基于多元统计分析的故障诊断方法的现状和发展进行了较简单的综述 第二章首先介绍了间歇过程最基本的理论工具 主元分析 Principal Component Analysis PCA 以及基于PCA的故障诊断方法 然后介绍了多向主元分析 mult iway principal Component Analysis MPCA 理论 并对该理论进行了一定的分析 以及基于MPCA的故障诊 断方法 第三章介绍了基于统计特征的不等长间歇过程故障诊断算法以及其在故障诊 断技术上的应用 并将该算法应用于半导体工业实例 A1堆腐蚀过程进行仿真实验 同时比较不同故障诊断方法的性能 且得出了理想 的检测结果 第四章对全文进行了总结并讨论了故障检测技术相关研究的发展前景 第二章MPCA在间歇反应过程故障诊断中的应用 2 12 1 引言引言 在化工 食品等间歇生产过程中 生产系统在长期运行和生产负荷中会不可避免地发生各种故障 影响生产质量 甚至引起重大的经济损失 因此故障检测与诊断成为当前控制理论研究的热点之一 化工生产系统一般都具 有过程精确 建模困难 过程变量众多且相互间具有强耦合 并且在实际中存在各种随机因素影响等特点 这就使得基于机理模型的诊断方法的应用极为不便 8 多元统计分析方法将多变 量高维数据空间投影到相对独立的低维空间 以降低分析难度 这些方法不需要 精确的数学模型 可用于处理高维相关数据的情况 而间歇过程工业过程变量众 多 数据之间关联性强的特点 且模型很难建立 所以采用多元统计分析方法来 进行故障监测和诊断是很适合的 例如多方向主元分析 MPCA 偏最小二乘法 PLS 及因子分析法 FA 等 多元统计分析方法是一种不依赖于过程机理的建 模方法 它只需通过过程数据的信息来进行统计建模 然后基于该模型实现对过程的监测 随着DCS distributed control system 以及PIS plant information system 等先进控制设备在生产系统中的应用 采集和存储大量实时数据变得相当便捷 这就为多元统计分析方法在故障监测与诊断中的应用奠定了基础 由于间歇反应的数据具有多维性的特点 传统的主元分析方法会使过程的统计 建模与故障诊断变得难以实现 主元分析 PCA 是一种在间歇过程故障检测等方面 已经获得广泛应用的数据处理工具 它通过将多变量高维数据空间投影到相对独立 的低维空间 得到最大化数据方差的正交投影轴以达到消除数据相关性的目的 1 MPCA实际上是将间歇过程的多维数据沿着时间轨迹进行分割 是主元分析 PCA 在 三维数据阵的扩展应用 MPCA的核心思想是通过将相关的一组数据集进行降维 并尽量保留原来数据集的的变化信息 1 降维的实现主要通过将原变量集转换成 一组互不相关的新变量集 即所谓的潜隐变量 这些新变量按照方差的大小进行 排列 如此 新变量集中的前若干个变量便保留了原始变量的绝大部分变化信息 对于主元分析方法来说 如何求取隐变量或者主元是十分重要的 对于线性主 元分析方法 主元的求取要涉及到一个正定矩阵的特征值分解问题 而对于非线 性主元分析方法 则要考虑通过神经网络等方法来求取主元 2 2 22 2 PCAPCA基本原理基本原理 2 2 12 2 1 主元分析简介主元分析简介 主元分析 Principal Component Analysis PCA 或者主成分分析 是一种掌握事物主要矛盾的统计分析方法 它 可以从多元事物中解析出主要影响因素 揭示事物的本质 简化复杂的问题 计 算主成分的目的是将高维数据投影到较低维空间 给定 n 个变量的 m 个观察值 形成一个n m的数据矩矩阵 n通常比较大 对于这样一个由多个变量 描述的复杂事物 如果事物的主要方面刚好体现在几个主要变量上 只需要将这 几个变量分离出来 进行详细分析 但是 在一般情况下 并不能直接找出这样 的关键变量 这时可以用原有变量的线性组合来表示事物的主要方面 PCA 就是这样一种分析方法 2 2 22 2 2 主元分析的意义主元分析的意义 PCA 主元分析 是1991年提出的 是一种掌握事物主要矛盾的统计分析方法 它可以从多元事物中解析出主要影响因素 揭示事物的本质 简化复杂的问题 简单的说PCA在实验中的主要应用 数据降维 最少的信息丢失将众多原有变量浓缩成少数几个主元因子 主元通常是原有变量 的线性组合 简单地说 在保证原始数据大部分信息不丢失的情况下 通过一定 的线性变换 PCA就是将高维的数据通过线性变换投影到低维空间上去 这个投影 要遵循一个指导思想 找出最能够代表原始数据的投影方法 也就是说 被PCA降掉的那些维度只能是那 些噪声或是冗余的数据 这里的噪声和冗余可以这样认识 找出几组也就是最能 代表原始数据的线性组合 找出的线性组合我们称之为主元 线性组合的维数称 之为主元个数 2 2 32 2 3 主元分析的基本原理主元分析的基本原理 前面已经提到 PCA的目的就是 降噪 和 去冗余 降噪 的目的就是 使保留下来的维度间的相关性尽可能小 而 去冗余 的目的就是使保留下来的 维度含有的 能量 即方差尽可能大 首先 要知道各维度间的相关性以及个维 度上的方差 能同时表现不同维度间的相关性以及各个维度上的方差的数据结构 就是非协方差矩阵 协方差矩阵度量的是维度与维度之间的关系 而非样本与样 本之间 协方差矩阵的主对角线上的元素是各个维度上的方差 可以称之为能量 元素是两两维度间的协方差 即相关性 通过矩阵对角化进行降噪 消除各变量 间相关性 而对角化后得到的矩阵 其对角线上是协方差矩阵的特征值 它有两 个身份 首先 它还是各个维度上的新方差 其次 它是各个维度本身应该拥有 的能量 能量的概念伴随特征值而来 通过对角化后 剩余维度间的相关性已经 减到最弱 已经不会再受 噪声 的影响 降噪 后开始 去冗余 对角化 后的协方差矩阵 对角线上较小的新方差对应的就是那些该去掉的维度 12 现在只取那些含有较大能量 特征值 的维度 其余的就舍掉即可 PCA的本质 其实就是对角化协方差矩阵 2 2 42 2 4 主元个数的提取主元个数的提取 累计方差贡献率法作为一种可适应于所有的情况方法 成为确定主元个数的 通用方法 主元贡献率法因其简单 直观 方便等特点 在很多文章中得到了采 用 在本文中也主要采用这种方法 用来确定主元个数 累计方差贡献率 Cumulative Percent Variance CPV 法是根据主元方差的累计和百分比来确定主元个数 累计方差贡献率反映了 所确定的主元模型反映原数据信息的程度 由于数据矩阵主元方差等价于协方差 矩阵的特征值 所以也把矩阵的协方差矩阵的前k个特征值的和除以它的所有特 X 征值的和称为的前k个主元的累计贡献率 它表示了前k个主元所解释的数据变X 化占全部数据变化的比例 因此前k个主元的累计贡献率CPV可以表示为 1 2 1 n i i i CPV 1 k 1 i 其中为第i个特征值 当个主成分的累积贡献率超过一定的指标后 一般85 i k 足够 我们就可以认为已求的主元个数可以综合原数据足够多的信息 k 2 2 52 2 5 主元模型主元模型 假设是一个的数据矩阵 其中的每一列对应于一个变量 每一行对应Xnm 于一个样本 矩阵可以分解为个向量的外积之和 即 X n 2 2 1122nn Xt pt pt p 在式 2 2 中 被称为得分 score 向量 称为负荷 Loading 向 m i Rt n i Rp 量 的得分向量也叫做的主元 式 2 2 也可写为下列矩阵形式 XX 2 3 XTP 其中称为得分矩阵 称为负荷矩阵 12 m t tt n p p pP 21 各个得分向量之间是正交的 即对任何 和 当时 满足 各个ijij 0 ij t t 负荷向量之间也是互相正交的 同时每个负荷向量的长度都为1 即 2 4 0 j T i ppji 1 j T i ppji 2 5 当矩阵中的变量间存在一定程度的线性相关时 数据的变化将主要体现XX 在最前面的几个负荷向量方向上 数据矩阵在最后面的几个负荷向量上的投影X 将会很小 它们主要是由于测量噪声引起的 这样就可以将矩阵进行主元分解 X 后写成下式 3 2 6 1122kk Xt pt pt pE 式中为误差矩阵 代表在到等负荷向量方向上的变化 EX 1 a p n p 所谓的主元模型 指的是对来自正常稳态工况下的训练集进行主元分析后得 到的一系列统计信息 主要包括 变量均值向量 变量方差矩阵 协方差矩阵 D 主元方差矩阵 负荷矩阵以及主元数等 将反映过程正常运行的历史 DPk 数据收集起来 对这些数据进行主元分析 建立主元模型 由于主元分析的结果 受数据尺度的影响 因此在进行主元分析时 需要先将数据标准化 即将每个变 量的均值减掉然后除以它的标准差 即 6 2 7 2 1 2 1 i XVar XEX X i ii i 这样原数据集就变换为均值为0 方差为1的标准数据集 对标准化后的数据进行主元分析 如果只取前个主元 那么可以得到下面的k 主元模型 14 2 8 1122kkp Xt pt pt pEXE 式中 2 9 1122pkk Xt pt pt p 2 10 1 A TT AAii i XT Pt p 原测量数据集可表示为 2 11 XXE 从式 2 10 可以看出原正常工况下的历史数据集可分解为两部分 即一部分信息投影到主元子空间中 另一部分则投影到残差子空间 这样 如果原系统中存在着大量的冗余 那么利用A 个方向向量确定的子空间 即PCA空间 就能对系统进行很好的描述 而PCA子空间代表X的特征空间 是很好的估计 X X 2 32 3 基于基于MPCAMPCA的故障检测方的故障检测方法法 2 3 12 3 1 MPCAMPCA理论理论 MPCA是主元分析法 PCA 在三维数据阵的扩展上的应用 1 对于间歇反应过 程来说 其数据样本通常可以看作为一个三维的立体数据块 2 2节中介绍的主元分析法 PCA 只能用来处理二维数据 而处理一个这样的三 维立体数据块 一个有效的想法就是对其进行重新排列 MPCA的基本思想是将一 个三维的立体数据块X沿着时间轴方向进行切分 然后将切分得到的数据时间片依 次向右水平排列 如此构成了一个新的二维数据阵 然后使用主元分析方法进行 分析 6 不同于连续生产过程 间歇过程的历史生产数据以批次为单位构成三维数 据矩阵 批次 I 变量 J 时间 K 如图2 1所示 8 图2 1 MPCA数据矩阵沿时间轴分解图 如图2 1所示 每一时间点上都是二维数据 如果大量采集正常批次的数据样本 那么它们代表了在不同的时间序列中不同的批次的相同变量的统计特性 通常统 计控制指标有以下3种 它包括预Q统计量 得分Score和HotellingT2统计量 2 3 22 3 2 基于基于MPCAMPCA故障检测的统计量及其控制限故障检测的统计量及其控制限 故障检测是多元统计过程监控的第一步 通常用统计量和Q统计量以及得分 2 T Score来进行故障检测 1 1 Score 2 12 i m i iji xp 1 t 2 Q统计量 预测误差平方和SPE Q统计量衡量样本向量在残差空间投影的变化 Q统计量通常也称为SPE统计量 其计算式为 X 1 X 2 X 3 X K 变量 J 1 J 2J KJ 时间 K 批次 I 2 13 xPPIxPPIQ T T T Q统计量的阈值计算式可以近似为 2 14 2 2 0 0 2 1 2 200 1 2 11 1 1 ch h h h 其中 为X的协方差矩阵的特征 2 011 1 1 2 3 1 23 3 m i ij j A ih 值 A为PCA模型的主元个数 m为样本的维数 统计量SPE在第i时刻的值是一个标量 它刻画了此时刻测量值XI对主元模型 i e 的偏离程度 由于由多个变量的综合作用而成 因而SPE图可以同时对多变量工况进 行监控 6 3 Hotelling的 统计量 7 2 T Hotelling的统计量由下式给出 2 T 212 xT T TPP xT 2 15 其中 表示置信度为的控制限 假设过程正常运行时的 1 A diag 样本服从多元正态分布 那么可以按下式计算控制限 2 2 1n AnA F Ann A T 2 16 其中是指自由度带为A和n A的F分布的置信水平为1 的分位点 A n A F 分值向量Score Q统计量 统计量均可以对过程中的故障进行检测 当Q统 2 T 计量 即SPE 发生较大变化时 说明MPCA统计模型所代表的正常工况下的变量关系 被破坏 即该过程有故障发生 当统计量发生较大变化而Q统计量相对变化不明 2 T 显时 说明变量间的关系基本满足 但过程工况发生了变换 即该过程有故障发 生 2 3 32 3 3 基于基于MPCAMPCA的故障诊断的故障诊断方法方法 将采样信息的分值向量Score 预测误差SPE Hotelling 与正常工况下建立的统计数学模型比较 判断其是否在置信区间或控制限内 是 2 T 则为正常 否则为有故障存在 14 在各自的时间序列上建立统计模型 将新批次的 数据向模型空间投影 通过判断与模型的拟和程度即可以诊断出反应过程是否有故 障发生 1 由2 3 1可以看出 MPCA 将每一批完整的数据看作间歇处理过程的一次采样 多批数据构成样本集合 并在 此样本集合上进行 PCA 分析 以上特点决定了 MPCA 在应用于实际监控时会出现采样数据不完善的问题 因为在批处理进行过程中 只有当前时刻及以前的数据是已知的 这些数据不足以构成对间歇过程的一次完 整采样 Nomikos提出了解决该问题的数种方法 基本思想均是设法预测过程变量 的未来输出 常用的方法包括 1 补充数据为全 0 即认为以后的数据不偏离平均轨迹 这种方法的缺点是对故障不够敏感 将延 迟发现故障的时间 2 补充数据为当前归一化采样值 即认为以后的数据偏离平均轨迹的程度和当前时 刻相同 这种方法的缺点是对故障会过于敏感 增加误报的概率 2 42 4 本章小结本章小结 本章的内容主要包括两大部分 第一部分是对PCA方法的基本介绍 第二部分 介绍了MPCA理论 并对该理论进行了一定的分析 以及MPCA方法在故障诊断的应 用 在第一部分中 简单介绍了主元分析方法的意义 基本原理以及主元个数的 提取方法 在第二部分内容中 介绍了基于MPCA进行故障诊断的基本方法 建立 统计模型 计算统计量以及控制限的方法 第三章第三章 基于统计特征的不等长间歇过程故障诊断研究基于统计特征的不等长间歇过程故障诊断研究 3 13 1 引言引言 间歇过程是广泛用于食品 聚合物 药品 分子筛 增塑剂 抗氧剂 染料 和涂料等高附加值产品生产的重要过程 化工间歇过程主要用于精细化工 生物 化工等高技术密集和知识密集的新兴产业 因此对间歇过程反应机理的监视 物 料平衡的控制以及生产节奏的把握都是直接影响和制约生产的能力与水平 产量 与效益的关键要素 10 多元统计分析是一种对间歇过程进行故障诊断和过程监控 的有效方法 1995年 Nomikos MacGregor提出用多向主元分析 Multi way principal component analysis MPCA 1 2 和多向偏最小二乘 Multiway partial least squares MPLS 3 来解决间歇过程的建模 监视和故障诊断问题 这种方法随后也得到了极大的应 用和发展 如果运用传统的统计分析方法 那么需要假设批次数据是等长的 以 保证操作事件在批次与批次之间的数据轨迹是同步化的 然而 这种假设通常是 不成立的 9 10 解决间歇过程批次不等长问题 通常采用最短长度法 Kassidas等 10 运用动 态时间错位 Dynamic Time Wrapi ng DTW 理论来解决间歇反应过程的批次不等长问题 动态时间错位 DTW 理论运用动态规 划原理来搜寻两轨迹的相似特征 并且适时地对多元批次轨迹进行压缩和扩张 从 而让多元批次轨迹达到同步化的程度 以得到其间的最短距离 虽然这种方法按 照轨迹中点与点的方式来进行动态匹配 但是其处理过程的离线性与其复杂性将 导致其实际应用会比较困难 Rothwell等 11 表明动态时间错位 DTW 理论在故障诊 断方面的效果不如指示变量法和最短长度法 然而 这些方法应用于大规模的生 产过程时 必须建立成千上万个模型 使得其存储量及其计算量都非常大 所以 在大规模生产过程中 这些方法很难在线应用 基于统计特征的不等长间歇过程的故障诊断算法提高了不等长间歇过程故障 检测及诊断的可靠性 并且降低了算法的复杂程度 因此 该算法在不等长间歇 过程的故障诊断及性能监视中具有重要的意义 3 23 2 不等长问题不等长问题 3 2 13 2 1 不等长数据描述不等长数据描述 在每个批次 b 1 2 B 运行中 假设在持续时间不固定的操作循环中 在k 1 2 Kb个时刻在线测量J个过程变量 形成每个不规则的批次数据集合 表 示为 图3 1中参考批次有不同的轨迹长度Kb 2 bb KJX BbKJX bb 1 图3 1 不等长批次过程的三维数据描述 3 2 23 2 2 不等长轨迹同步化方法不等长轨迹同步化方法 间歇过程的时变特点使得间歇过程所采集的数据呈现批次数据轨迹不等长的 特点 因此 批次过程的轨迹同步化处理十分关键 此处理目的是将不等长的数 据处理为便于操作的等长数据 目前比较常用的轨迹同步化处理方法有 最短长度法 指示变量法 1 最短长度法 最短长度法 2 以间歇操作数据最短的批次做为基准 其余批次的数据截取长 度与基准批次相同 这种方法一方面要求在公共部分的过程变量轨迹保持一致 b 1 B j 1 J k K2 K1 Ki Kb 另一方面公共时间段内要包含间歇过程的主要操作 在超出基准长度的时间位置 包含的都是数据中次重要信息 2 指示变量法 通常情况下 间歇过程变量都对应着时间而改变 但是如果以其他的变量来 替代时间 就可以对不等长数据进行同步处理 把可以用来代替时间的变量命名 为指示变量 这种方法的思想是用指示变量的进程来代替时间 将其余变量进行 重新采样 是一个数据插值过程 3 33 3 基于统计特征的不等长间歇过程故障诊断研究基于统计特征的不等长间歇过程故障诊断研究 基于数理统计的方法用统计特征组成的随机模型来重新定义和衡量原始间歇 过程数据 常见的统计特征有方差 均值 峭度 偏度和欧氏距离等 假定用Yk表 示每个批次的样本数据 即 14 3 1 2 2 2 1 1 1 21 21 21 21 kykyky wkywkywky wkywkywky yyyY m m m mk 其中w为批次中样本数 k为批次中最大时刻 m为变量个数 每个批次的方差和均值分别为 15 3 2 1 0 1 w l bb lky w 3 3 1 0 2 1 w l sb lky w b 每个批次不同变量间的欧氏距离为 jb d 3 4 1 0 2 1 w l jb lkylky d jb w 每个批次的峭度和偏度分别为 15 b k b 3 5 2 3 1 0 2 1 0 3 1 1 w l bb w l b b lky w lky w b 3 6 3 1 1 2 1 0 2 1 0 4 w l bb w l bb b lky w lky w 每个批次的统计特征均用来表示 那么所有的统计特征 krdH bjbbb 组合成维的特征向量 2 1 4 mm m 3 7 bbmmmmmmbb dddddddddH 12 11 1 24 23 2 13 12 1 由上式可得出 不等长间歇过程的统计特征向量H是等长的 2 如2 2 5节所述 由于主元分析的结果受数据尺度的影响 因此在进行主元分 析时 需要先将各个统计特征向量标准化 即将每个统计特征的均值减掉然后除 以它的标准差 即 2 1 2 1 i XVar XEX X i ii i 3 8 这样原数据集就变换为均值为0 方差为1的标准数据集 统计特征向量H标准化后就进行主元分析 若只取前k个主 元 那么会得到以下主元模型 3 9 EptptptH kk 2211 上式中pi被称为载荷 loading 向量 ti 被称为得分 score 向量 H的得分向量ti也称做H的主元 建立了过程监视模型和故障检测的模型后 就需要计算Q统计量的警告限和操 作限 预测误差平方和 SPE Squared Prediction Error 图以及主元得分 Score 图是典型的监视控制图 当主元模型的Q统计量或 者Score超过控制限时 就认为该过程出现了不正常的情况 如2 3 2所述 主元模型的SPE 即 Q统计量定义为 3 10 xPPIxPPIQ T T T Q统计量或SPE表示数据中没有被主元模型所解释的变化 当Q统计量发生较大变化 时 说明该统计模型所代表的正常工况下的变量关系遭到破坏 即该过程中有故 障发生 从而根据正常运行数据而建立的模型已经不再适用 控制限的计算是建 立在一定的假设基础上的 假设检验水平为时 Q统计量的控制限由下式可得到 2 3 11 d UCL czabQ 其中为标准正态分布的100百分点 其他参数如下 z 3 12 3 21 1 2 1 1 2 320 1 3 2 1 2 3 0 03 1 2 003 bh hd bhc b bhha n ki i n ki i n ki i 基于统计特征的不等长间歇过程故障诊断算法的具体步骤为 1 建立正常状态下的统计模型 1 收集正常状态下操作时各批次的历史数据 2 计算每个不等长批次的方差和均值 峭度和偏度和任意两个变量 b k b 之间的欧氏距离 并将这些统计特征组合成为一个等长的特征向量H jb d 3 建立过程监视和故障检测的PCA模型 4 确定警告限和操作限 2 故障诊断 1 计算新批次等长的各个统计特征向量 并将其标准化 2 计算新批次数据的Q统计量 3 根据Q统计量的值是否超过了建模控制限来判断新的批次有没有发生故障 若SPE 值超过了控制限 那么说明新的批次是故障的 反之则是正常的 3 43 4 仿真实验仿真实验 本文应用半导体工业实例 A1堆腐蚀过程比较不同故障诊断方法的性能 半导体工业数据由108个正常硅片和 21个故障硅片构成 由于两个批次过程数据的大量丢失 本文应用107个正常硅片和20个故障硅片进行 仿真研究 因为步骤4和5是主要的腐蚀步骤 仿真仅应用这两个步骤中的数据点 进行故障诊断的17个非定点过程变量如表3 1所示 这个物理问题表明这些变量 应该与过程和最终产品的状态有关 正如前面所指出的 半导体过程有些独特的 特性 这些特性包括不等长的批次时间 不等长的阶段及过程漂移和转变 两个 例子 变量EndPt A 和TCP Load 表明了这些特性 如图3 2所示 表3 1 A1堆腐蚀过程的故障诊断变量 序号过程变量 1BC13 2C12 Flow 3RF Btm Pwr 4RF Btm Rfl Pwr 5EndPt A 6Pressure 7RF Tuner 8RF Load 9RF Phase Err 10RF Pwr 11RF Impendance 12TCP Tuner 13TCP Phase Err 14TCP Impedance 15TCP Top Pwr 16TCP Load 17Vat Valve 020406080100120 0 500 1000 1500 2000 2500 3000 3500 020406080100120 2 65 2 7 2 75 2 8 2 85 2 9 x 10 4 a EndPt A EndPt A 时间 TCP Load b TCP Load 图3 2 数据集中的两个变量 该仿真实验中 每个批次有17个过程变量 每个批次是不等长的 持续时间 在95 112秒之间变化 随机抽取96个正常批次为建模数据 其余11个正常批次为校验数 据 为了消除传感器中初始的波动影响 去除开始的5个样本 保留85个样本以适 应最短的批次 对96个等长的正常批次数据运用MPCA方法进行建模 并对11个校 验批次数据和20个故障批次进行故障检测 MPCA方法的SPE检测结果如图3 3所示 MPCA方法检测出了故障4 7 12和13 然而 由于它们的数值较大 没有显示 在图3 3中 运用基于统计特征的方法进行故障诊断 不需要数据预处理 2 直接计算96 个不等长批次的均值 方差 偏度 峭度和任意两个变量间的欧氏距离 并将这 些统计特征组合成一个等长的特征向量 然后运用PCA进行过程监视 本文方法的S PE检测结果如图3 4所示 本文方法检测出了故障4和12 同样没有显示在图3 4中 图3 3 MPCA方法的SPE监测图 时间 图3 4 本文方法的SPE监测图 两种方法的SPE检测结果对比如表3 2所示 从表3 2可以看出 本文方法和传 统MPCA对正常批次的SPE检测率均为100 本文对故障批次的SPE故障检测率为80 而传统的MPCA的检测率为65 证明运用本文方法进行检测的准确率远远高于传 统的MPCA方法 大大提高了故障检测率 减少了故障的误报率和漏报率 表3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 民航机场行李搬运与安全监管协议
- 宠物销售服务合同模板
- 监控室接线员培训
- 乐博乐博培训
- 简单急救知识培训
- AIDS合并结核的护理
- 幼儿园灶房食品安全培训
- 肿瘤免疫治疗机制与应用
- 挠骨中段骨折课件
- 文化创意产业园区创意产业园区发展规划与实施路径研究报告
- 会计电算化基础知识2025年考试试卷及答案
- 2024年威宁自治县在职在编教师考调真题
- 小学生反洗钱课件
- 酒店前厅部管理制度
- 2022~2023学年广东广州天河区初一下学期期末语文试卷(标准版)
- 广东省深圳市光明区2025年八年级下学期期末数学试题及答案
- 黔西南州工业投资(集团)有限公司招聘笔试题库2025
- 建设工程总包合同EPC课件
- 初中英语跨学科项目设计心得体会
- 《斯大林格勒战役》课件
- 监控系统培训资料
评论
0/150
提交评论