(系统工程专业论文)基于主元分析的自适应过程监控方法研究.pdf_第1页
(系统工程专业论文)基于主元分析的自适应过程监控方法研究.pdf_第2页
(系统工程专业论文)基于主元分析的自适应过程监控方法研究.pdf_第3页
(系统工程专业论文)基于主元分析的自适应过程监控方法研究.pdf_第4页
(系统工程专业论文)基于主元分析的自适应过程监控方法研究.pdf_第5页
已阅读5页,还剩58页未读 继续免费阅读

(系统工程专业论文)基于主元分析的自适应过程监控方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浙江大学硕士学位论文 摘要 主元分析法( p r i n c i p a lc o m p o n e n ta n a l y s i s , p c a ) 是当前过程监控领域应用 最为广泛的数据驱动方法。主元分析技术将过程数据投影到能准确表征过程状态 的低维空间,在很大程度上简化和改进了过程监控流程。针对传统主元分析法基 于静态模型的缺陷,自适应主元分析方法按照一定的准则实时更新主元模型,实 现了对过程正常慢漂移的有效跟踪,具有重要的理论研究意义和广泛的应用前 景。 本文首先综述了用于故障检测与诊断的主元分析方法以及自适应p c a 方法 的研究现状,并将滑动窗p c a 与指数加权p c a 两种自适应算法应用于t e p 标准故 障数据以及一批溶剂脱水塔工业数据,对两种方法进行比较研究。 本文探讨了新的在线过程监控的可视化方法:首先介绍了在三维空间内绘制 主元得分图及统计量控制限的方法,接下来提出了一种新的三维故障诊断图方 法。三维故障诊断图方法可以监测过程变量间相关关系的变动,并拓展故障诊断 辅助图形的信息量。在溶剂脱水塔数据上的应用证明该方法对过程故障及传感器 故障都具备很高的辨识度。 在综合滑动窗p c a 与指数加权p c a 两种自适应方法性能特征的基础上,本文 提出了一种用于自适应过程监测的柔性主元分析方法。该方法基于滑动窗p c a 算 法的框架提出,通过引入柔性因子对主元模型区域实施不同程度的位移和变形, 来实现监控性能侧重点的灵活变动。在t e p 仿真数据及溶剂脱水塔卫业过程数据 上的应用结果表明,该方法可通过对柔性因子的调节,在高故障灵敏度与高监测 鲁棒性之间选择与实际需要相符合的工作点。柔性主元分析方法解决了自适应监 控算法的性能不可调问题,可以改善多工况过程监测的应用效果。结合对数据滑 动窗口长度的调节,该方法可以在更大程度上满足多工况的工业应用需求,具有 良好的可行性与优越性。 关键词:过程监控、故障检测及诊断、主元分析、自适应主元分析、柔性主元分析 浙江大学硕士学位论文 a b s t r a c t p r i n c i p a lc o m p o n e n ta n a l y s i s ( p c a ) i st h em o s tw i d e l yu s e dd a t a - b a s e dm e t h o d i nt h ef i e l do fp r o c e s sm o n i t o r i n g b yr e f l e c t i n gp r o c e s sd a t ai n t ol o w e rd i m e n s i o n s , t h ep r o c e s sm o n i t o r i n gc a nb es i m p l i f i e da n di m p r o v e db yp c am e t h o d s t o o v e r c o m et h es h o r t a g eo ft h ef i x e d m o d e lp c a , s e v e r a la d a p t i v ep c am e t h o d sh a v e b e e np r o p o s e d b yu p d a t i n gt h ep c am o d e l 晰t hc e r t a i nr u l e s ,t h ea d a p t i v ep c a m e t h o d sc a l ls u c c e s s f u l l yt r a c kt h es l o wa n dn o r m a lp r o c e s sc h a n g e sa n da l eo fg r e a t t h e o r e t i c a ls i g n i f i c a n c ea n dw i d ea p p l i c a t i o np r o s p e c t 。 i nt h i st h e s i s ,t h ep c am e t h o d sf o rf a u l td e t e c t i o na n dd i a g n o s i sa n dt h er e s e a r c h s t a t u so fa d a p t i v ep c ai sr e v i e w e df i r s t l y m e t h o d so fm o v i n gw i n d o wp c a ( m w p c a ) a n de x p o n e n t i a l l yw e i g h t e dp c a ( e w p c a ) a r ea p p l i e do nd a t af r o m t e n n e s s e ee a s t m a np r o c e s ss i m u l a t i o na n dar e a li n d u s t r i a lp r o c e s sa n da n a l y s e df o r c o m p a r i s o n ? n e wv i s u a l i z a t i o nm e t h o d so fo n l i n ep r o c e s sm o n i t o r i n ga l ee x p l o r e d an e w m e t h o do ft h r e e d i m e n s i o n a lp r i n c i p a lc o m p o n e n t ss c o r e se h a l ti sp r e s e n t e d t h e n a n o t h e rn e wm e t h o do ft h r e e d i m e n s i o n a lf a u l td i a g n o s i sc h a r ti sp r o p o s e d o nt h e n e wc h a r t ,t h ev a r i a t i o no fc o r r e l a t i o nb e t w e e nv a i l a b l e sc a l lb er e f l e c t e d a p p l i c a t i o n s o ns o l v e n t d e h y d r a t i o nt o w e rp r o c e s sd a t ad e m o n s t r a t eh i 曲 d i s c r i m i n a t i o no ft h en e wm e t h o do nb o t hp r o c e s sf a u l t sa n ds e n s o rf a u l t s af l e x i b l ep c a ( f p c a ) a l g o r i t h mw h i c hc o m b i n e st h ec h a r a c t e r i s t i c so fm w p c a a n de w p c ai sp r o p o s e dt oc o m p r o m i s et h es e n s i t i v i t yw i t ht h er o b u s t n e s s 。功e m o v i n gd a t aw i n d o wi se m p l o y e ds t i l li nt h en e wm e t h o da n daf l e x i b i l i t yf a c t o ri s u s e dt or e s h a p et h ee l l i p s o i d a ls t a t i s t i c a lr e g i o ne s t a b l i s h e db yt h et r a i n i n gd a t ai n o r d e rt op u tm o r ee m p h a s i so nm o r er e c e n td a t a 珏es i m u l a t i o nr e s u l t sb a s e do nt h e t e pd a t as e ta n da l li n d u s t r i a lp r o c e s sd a t as e td e m o n s t r a t et h a tw i t ht h ef l e x i b i l i t y f a c t o rt h en e wm e t h o dc a np r o v i d ea l la d j u s t m e n to fs e n s i t i v i t ya n dr o b u s t n e s sf o r t h o s ew h om a ya l t e rt h e i rn e e d sf o rs e n s i t i v i t yt op r o c e s sd i s t u r b a n c e ,c o m b i n i n g w i t ht h ea d j u s t m e n to fd a t al e n g t ho ft h em o v i n gw i n d o w , t h em e t h o dc a ns a t i s f yt h e n e e do ft h em u l t i p r o d u c tm o n i t o r i n gt oag r e a t e re x t e n t ,w h i c hs h o w sg o o d f e a s i b i l i t ya n da d v a n t a g e s k e y w o r d s :p r o c e s sm o n i t o r i n g ,f a u l td e t e c t i o na n dd i a g n o s i s ,p r i n c i p a lc o m p o n e n t a n a l y s i s ,a d a p t i v ep c a ,f l e x i b l ep c a n 第一章绪论 第一章绪论 摘要 本章介绍了统计过程控制的含义,阐述了过程监控与多元统计过程控制的基本概念及 发展,重点阐述了主元分析方法的理论与应用成果。同时对自适应过程监控的应用发展进 行了综述。最后介绍了本文的内容。 关键词:统计过程控制、多元统计分析、一主元分析、自适应过程监控 1 1 引言 本文研究的自适应监控方法属于过程系统工程中的统计过程控制( s t a t i s t i c a l p r o c e s sc o n t r o l ,s p c ) 领域。由于过程波动具有统计规律性,在过程受控时,过 程特性一般服从稳定的随机分布;失控时,过程分布将发生改变。因此,统计过 程控制方法可以利用过程波动的统计规律性来确定生产过程是否处于统计受控 状态。 统计过程控制基本思想最早由s h e w h a r t 博士于2 0 世纪3 0 年代提出。从一开 始,统计过程控制就被视为一种提高产品质量和生产效率的技术手段。从质量控 制的角度来看,统计过程控制又被称为统计质量控制( s t a t i s t i c a lq u a l i t yc o n t r o l , s o c ) 由于产品质量在现代工业中的重要地位,使统计过程控制已经在机械、 纺织、汽车、电子产品等离散制造业中得到了广泛应用,并正逐渐向造纸、炼油、 化工、食品等间歇工业和连续制造业渗透【l 】。 统计过程控制经历了从单变量到多变量的发展。由于单变量控制图在检测和 诊断多变量过程故障上能力的有限,导致了多元统计过程控$ 1 j ( m u l t i v a r i a t e s t a t i s t i c a lp r o c e s sc o n t r o l ,m s p c ) 研究的大量涌现。多元统计分析方法可以对过 程正常运行数据建立低维统计过程模型,并使用一系列统计指标来检测样本数据 对数学模型的偏离。通过对过程测量数据的多元统计分析,可以了解过程内部的 变化,实现对过程的故障诊断; 1 2 过程监控与多元统计过程控制 1 2 1 过程监控及故障检测与诊断 : 过程监控系统对保障设备、生产过程的安全以及保证、提高产品质量具有十 分现实的意义。随着现代流程工业的发展,生产过程中发生事故的可能性也在不 断增大。由于过程中的异常波动很难及时得到发现,往往导致产品质量严重下降, 或者延误生产计划的正常执行,造成巨大的经济损失。据统计,近年来在美国仅 浙江大学硕士学位论文 石化工业每年由于生产中的异常质量波动情况而造成的损失就高达2 0 0 多亿美 元。因此,一套可靠的过程监控系统对于企业的安全和效益是不可或缺的。 过程故障是指工业过程出现的一些异常现象,这些异常表现为系统中至少一 个特性或变量的不允许的偏离【3 1 ,其类型包括过程参数的变化、干扰参数的编号、 执行器的问题和传感器的问题【4 1 。为了确保过程运行状况满足给定的性能指标, 需要对故障进行检测、诊断和消除。统计过程控制也把这些问题称为过程监控。 过程监控就是通过对工业过程信息的采集、加工和分析处理,监督生产过程的运 行状态,检测系统的故障信息、诊断故障原因,分析和预测生产过程的动态趋势, 从而达到减小产品质量波动、保障系统可靠运行的目标,并为企业综合自动化系 统提供有效信息,使生产系统始终处于最佳运行状态。 、 过程监控的目标是通过识别不正常行为来确保过程按计划运行的。确定故障 是否发生的操作就是故障检测。故障检测的关键在于针对异常情况,尽早对将会 出现的问题提出有价值的警告,并采取合适的补救措施,从而避免严重的过程颠 覆。具体而言,可以对某些量度设置界值,一旦计算出来的某个量度超出了界值, 就认为检测到了一种故障f 5 】。在检测出过程故障的情况下,从已知( 预定) 的故 障集中确定出故障源的操作被称作故障诊断。目前,故障检测与诊断( f a u l t d e t e c t i o n a n d d i a g n o s i s ,f d d ) 方法及应用已成为国际自动控制界的热点研究方 向之一。 1 2 2 过程监控的基本方法 过程监控方法包括解析的【6 】、基于知谢7 】的和数据驱动【8 】的方法。 解析法根据过程基本原理来构造数学模型。这种方法在理论上比较成熟,它 的主要优点是能够把对过程的物理认识与过程监控系统结合起来。但是,解析法 的成功应用需要有可靠的过程数学模型,而实际过程通常比较复杂,准确的模型 不易获得。当模型不准确时,该方法常常不能具有很好的鲁棒性。而且由于前提 限制比较严,使其应用范围受到了限制。只有在航空、航天等领域,模型比较准 确的情况下,该方法才获得比较多的应用,而其在流程工业中解析法尚未获得很 好的应用。 基于知识的方法使用定性的模型来获得过程监控的量度,特别适合于不能获 得详细数学模型,但有大量生产经验和工艺知识可利用的系统。这种方法不需要 准确的数学模型,它可以具有自学习+ 的功能,同时又能有效地把专家知识融入到 故障诊断中去。但此方法在以下方面存在瓶颈:知识表示、不确定性推理、机器 学习等,难以发展成为一种通用的、适合一般流程工业的理论体系和方法,而要 与其它方法结合使用才更为有效。同解析法相似,基于知识的方法大多应用到输 入、输出和状态数目相对较小的系统中。 2 第一章绪论 , 数据驱动方法不需要过程的数学模型。该方法直接对系统的输入输出数据进 行滤波,通过分析滤波后数据的特征来进行故障诊断和预报工作。数据驱动技术 的优势在于它们能够对高维的数据实施降维操作,并从中获取重要的信息。但数 据驱动方法的效果高度依赖于过程数据的数量和质量,而且需要对故障信号做一 定的假设,同时计算的工作量比较大,实现实时在线故障检测和预报有一定的困 难。通过与过程知识相结合,该方法有望成为工业上通用的过程监测与诊断方法。 无论是解析的、基于知识的,还是基于数据驱动的方法,都有其优缺点。因 此,没有一种方法对所有的应用来说都是最优的。通常,较好的过程监控方案是 把多种统计量或方法应用到故障检测、识别和诊断中例。 1 2 3 多元统计过程控制 流程工业控制系统面对的是许多连续的过程量,同一过程中的不同变量间往 往存在相互关联的关系。故障有时可以表现在某一个开关量的异常变化上,有时 却需要分析多个不同变量之间的相互联系才能得出正确的诊断结果。多元统计过 程控制是一种对多变量数据进行分析处理的有效工具。多元统计过程控制主要是 针对流程生产中操作人员经常关心的生产运行中装置物料是否平衡、生产过程本 身及仪表是否异常、产品质量状况如何等问题而提出的解决方案。这些问题是多 元统计质量控制的目标。由于这些目标往往涉及多个过程变量,一般采用多元统 计图,通过对多元统计量的集中监视,实现对物料平衡、过程及仪表运行状态、 产品质量等目标的监控。利用多元统计过程控制图,不仅可以观察到过程变量的 平均值、方差变动,而且可以反映出过程变量之间相关关系的变化。 生产过程中常见的故障有过程故障和仪表故障两种。在过程故障发生的初始 阶段,各个过程变量的波动往往还没有超过其正常的范围,肉眼观察难以发现异 常。但此时过程变量之问的相关关系很有可能已经发生了异常的变化,如能用多 元统计过程控制图来反映这种异常变化,则有可能对过程故障的发生起到预警的 作用。如果发生仪表故障,例如仪表显示值逐渐偏离实际值,操作人员将无法知 道这是过程变量的真实变动还是仪表故障所导致,有可能因为采取了误操作而使 仪表故障发展成为过程故障。此时,由于仪表故障往往只发生在单个过程变量上, 与仪表故障相应的过程变量和其它过程变量之间的相关关系也被破坏了,也可以 用多元统计过程控制图来反映这种异常变化,从而起到发现仪表故障的作用,预 防过程故障的产生。 多元统计分析理论的研究和发展具有较长的历史,数学基础理论成熟而完 备。其工程应用十分广泛,在化学、物理学、生物学、医学、农学、地质学、和 工学的各领域都有应用,主要用于实现统计质量控制、过程监控、生产数据的分 析挖掘、故障诊断等。目前,用于故障检测技术的多元统计分析方法主要有主元 3 浙江大学硕士学位论文 分析法( p c a ) 、部分最d * - - - 乘法( p l s ) 、费舍尔判别分析( f d a ) 和规范变 量分析( c v a ) 等。这些方法基于严格的多变量统计学的降维技术,完全由数据 驱动来完成计算。由于数据驱动方法不需要过程的精确解析模型,并且易于考虑 工业过程的特点,因此所获得的理论成果和方法一般都能较快地应用于实际生产 中。一些研究工作在实际生产中已成功得到应用,显著提高了产品质量和减少了 经济损失。1 9 9 3 年m i l l e r 等报告了美国柯达公司应用多元统计质量控制的情况, 并提出了贡献图方法1 2 1 。1 9 9 5 年k o s a n o v i c h 和p i o v o s o 报告了美国杜邦公司应用多 变量统计控制的情况【1 0 1 。此外,s h e l l 公司在采用多元统计工具解决了催化床 的局部热点问题后,带来了2 0 0 万美元以上的年收益【i 。而在线m s p c 技术在一 个大型工业流化床反应器中的应用则带来了1 0 0 万英镑年的收益,显示出良好的 应用前景【1 2 】。此外,关于多元统计过程控制的商业软件也逐渐增多。如瑞典 u m e t r i c s 公司推出的s i m c a 系列软件包,可以用于工业过程数据的离线分析 或在线监测。 1 2 4 主元分析方法 主元分析( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a ) 是工业监控系统中使用得最 为广泛的多元统计分析方法。p c a 是一种根据已获取数据的方差而进行的最优降 维表示,它解决了变量间的相关性1 1 3 , 1 4 。对某些过程来说,在数据中的大部分信 息仅用二维或三维即可能获取【1 5 】,主要的过程变化可以用单张图显示出来。无论 在低维空间中需要多少维度,使用r 2 和s p e 统计量控制图都可以将所有维度的信 息表达出来。这些控制图可以帮助操作员和工程师们解释过程数据的重要走向 8 】 o 从2 0 世纪8 0 年代起,p c a 技术开始应用于工业过程的监测,利用控制图等简 单的工具实现初步的诊断功能。9 0 年代以来,学术界和工业界都对p c a 的应用进 行了深入研究【1 6 1 7 1 ,一些公司也介绍t p c a 对工厂数据的应用 i s , 1 9 ,而另一些研 究则基于计算机过程仿真得到的数据而进行【她扪p - 2 l 。 在传统( 线性、静态) p c a 统计模型的基础上,也形成了多种扩展的和改进 的p c a 统计建模技术,如非线性p c a 、动态p c a 、多尺度p c a 、间歇生产p c a 、 多工况及自适应p c a 等: 1 ) 非线性p c a ( n o n l i n e a rp c a ) p c a 是一种线性降维技术,它忽略了过程数据中可能存在的非线性。然 而工业过程本质是非线性的。因此,在某些情况下,用于过程监测的非线性 方法与线性方法相比表现出更好的性能。k m m e 一2 3 】通过运用自适应神经元 网络,把p c a 扩展到了非线性情况。d o n g ;g l m c a v o y 2 4 l 研究了一种基于主曲 线和神经元网络的、能产生独立主元的非线性p c a 方法。在参考文献 2 5 】中 4 第一章绪论 对三种用于过程监控的神经元网络方法进行了比较。然而由于被监测变量之 间是否为线性关系与p c a 监测模型的有效性并无直接联系,非线性p c a 监测 方法并未深入系统地得到发展,近年来已少有报道。 2 ) 动态p c a ( d y n a m i cp c a ,p c a ) 传统p c a 监控方法都隐含地假定:一个时刻的观测值对于前面时刻的观 测值来说是统计独立的。对于典型的工业过程,这一假定只对长采样间隔是 有效的。这表明需要一种考虑到数据中序列相关性,用来实现快速采样时间 的过程监控方法。处理这个问题的方法之一是用靠前的h 个观测样本对每个 观测向量进行扩充( 确定h 的方法见文献【2 6 】) 。这种方法称为动态p e a 。 通过检验p c a 和d p c a 求解田纳西伊斯曼问题证实了d p c a 比p c a 更适于求 解相关数据检测故障【2 6 1 。另一方面,在实践中已经证明,当有足够的数据来 表示过程的全部正常变化时,数据中的序列相关性并不会影响静态p c a 统计 方法的有效性口兀。 3 ) 多尺度p c a ( m u l t i s c a l ep c a ) 工业数据本质上具有多尺度特性,反映了不同生产工况和设备状况下的 信息。多尺度p c a 首先利用小波技术,将过程数据进行多尺度分解,以获得 不同层次下的过程信息【2 8 1 。由于小波系统的正交性,在不同尺度下的分解系 数是相互不关联的,并且同一尺度下的系数也互不关联【2 9 j 。多尺度p c a 分别 对小波分解后不同层次下的过程信息进行p c a 建模和监测,最后对总的重构 信息进行p c a 监测。一般而言,多尺度p c a 更适合刻画生产进行时的状况。 4 ) 多向p c a ( m u l t i w a yp c a ) 。 对于制药、生化反应和高分子聚合反应等高附加值的生产,一般均以间 歇方式进行。在间歇过程中所采集的数据通常可以表示为一个三维的立体数 据块。多向p c a 将这个立体数据块的每一个水平的( 或垂直的) 切片拼接成 一个矩阵,然后对这个矩阵进行主元分析 3 0 , 3 1 刀1 。多向主元分析可以用来改 进过程的操作以及用来理解引起过程不同的主要因素。 5 ) 多工况与自适应p c a 多工况p c a 可以在同一生产线上的多工况切换情况下,快速对p c a 统计 监测模型进行更新和重组,以实现对生产的监测与产品质量控制【3 3 ,3 4 】。而自 适应p c a 依据一定的准则实时更新主元模型,以适应更高性能场合的应用 1 3 5 1 。自适应p c a 的详细介绍见本文下一节。 p c a 的其它工业应用包括数据协调与粗差检测 3 6 1 、软测量建模【3 7 1 、过程控 带1 t 3 s , 3 9 1 以及产品设计1 4 0 l 、- 1 - 况分析1 4 n 、数据挖掘 4 2 1 、动态辨识建模【4 3 1 等。近几 年来,越来越多的p c a 及其衍生方法被报道成功应用于工业过程【4 4 a 5 1 - 5 浙江大学硕士学位论文 1 3 白适应过程监控 1 3 1 自适应监控的含义 将基于静态模型的多元统计分析方法应用于过程监测,理论上需要做出以下 的假定:建模数据基本涵盖正常工况的数据空间,而且工业过程是时不变的,即 变量之间的线性关系不会随着时间的推移而发生改变。然而在实际工业生产过程 中,绝大多数过程都会呈现出缓慢而正常的漂移,过程数据往往具有慢时变的特 性。这与多元统计分析方法的理论假定相悖,必然导致监控系统对正常过程数据 的误判:在工况漂移之后,正常工况数据往往偏移出模型的统计边界,原来的建 模数据已不能涵盖当前工况数据的范围,而造成大范围的误警。 依赖静态模型,是传统多元统计分析方法应用于过程监控的一个很大的局 限。为此,在实际应用中需要按照一定的准则实时更新监控模型,使其适应工况 的不断变动。这就是自适应监控方法的基本思想。 1 3 2 自适应主元分析方法综述 针对实时工况变动的过程监测技术,目前主要有以下三种基于p c a 的方法 湖 1 ) 建立一个通用的p c a 模型来覆盖所有的工况模式。 在此方法下,监控模型将变得十分保守,可能产生较大的漏检率。由于一般 难以采集包含所有工况的建模数据,该方法可行性不高。 2 ) 辨识出不同工况模式,基于各种模式建立p c a 模型库。 该方法即多工况p c a ,其关键之处在于如何辨识系统不同工况间的切换。例 如:黄孝彬等人于2 0 0 4 年提出针对火电厂锅炉过程工况变动的在线监测方法:根 据关键操作变量来区分不同工况,并通过判断过程数据是否为稳态数据,来决定 是否对当前实时数据进行故障诊断【4 刀。h d j i n 铝】等人则利用过程知识来推理判 断数据统计量的超限是由于工况的切换还是由于发生故障而引起。d a e - h e e r l w a n g t 4 9 】等人介绍了一种通过聚类来构建“超级”p c a 模型的监控方法。 3 ) 针对工况的变动,实时自动更新监控模型,即自适应p c a ( a d a p t i v ep c a ) 。 自适应p c a 寻前有基于数据滑动窗和基于指数加权的两种方法,即滑动窗主 元分析法( m o v i n gw i n d o wp c a ,m w p c a ) 与指数加权主元分析法( e x p o n e n t i a l l y w e i g h t e dp c a ,e w p c a ) 。 前者通过用新的正常工况数据实时取代较早的建模数据来更新监控模型。根 据工况数据特点的不同,可以对整个监控模型进行参数更新,或者只更新数据的 归一化参数来适应工况数据均值和方差的变化。w e i h u al i 3 5 】等人于2 0 0 0 年提出 6 第一章绪论 基于数据滑动窗实时更新建模数据的自适应p c a 算法。d o a nxt i e n 伺等人在其 基础上提出仅实时更新归一化参数,而使用初始建模数据来计算新采样点的统计 量的方法。h d j i n 4 8 】等人于2 0 0 6 年进一步提出鲁棒递归p c a 方法。另外,f l a t e n 【5 0 等人提出了使用两个相邻的滑动窗来检测过程数据波动的“毛毛虫力算法,黄孝 彬【4 7 】等人介绍了利用滑动窗累计递推来选择合适建模数据长度的方法,x u n w a n g t 5 l 】等人则将自适应p c a 应用到故障诊断领域。 后者采用递归的方法,将新的测量数据以一定的权值包含到待处理的数据协 方差矩阵中。这些权值以指数减小,使得历史数据的信息对当前数据矩阵的影响 随着过程的进行逐渐减少。w o l d 5 2 】于1 9 9 4 年首次提出指数加权主元分析的概念, 讨论了将指数加权滑动平均( e x p o n e n t i a l l yw e i 曲t e am o v m ga v e r a g e , e w m a ) 滤波与p c a 、p l s 的结合使用。d a y a l 、m a c g r e g o r t s 3 l 和q i n 5 4 1 等人提出了与自适 应控制和模型预测相结合的指数加权部分最小二乘( e w p l s ) 递归算法。r a n n o 始j 等人把与基于p c a 的e w m a 方法类似的分级p c a ( h i e r a r c h i c a lp c a ) 方法应用 于自适应批量生产监控。w c i h u al i 【4 3 】等人在前人基础上提出了基于遗忘因子的 指数加权主元分析递归算法,并由“5 6 】等人将此方法应用于聚合薄膜生产过 程。在其它一些过程的成功应用见文献 5 7 】。 上述自适应p c a 方法与其它多元统计控制方法结合,被成功应用于石油精 炼、污水处理等实际工业过程【5 8 删,或在工业过程数据上进行了应用研究 6 0 l 。同 时,在使用对不同工况模式分别建模的方法时,往往结合使用自适应p c a 方法 f 4 7 ,4 8 】 o 上述两种自适应p c a 方法的具体算法见第二章。 1 4 本文的内容 本文对现有的自适应主元分析监控算法进行了概述和比较研究,并提出了一 种用于自适应过程监测的柔性p c a 方法。该方法可通过对变形因子的调节来改变 方法在故障灵敏度或工况追踪性能上的侧重点。在t e 过程仿真数据以及在溶剂 脱水塔工业过程数据上的应用结果表明,该方法可以适应多样的工业应用需求。 同时,本文提出了一种可以监测过程变量间相关关系的变动的三维故障诊断 图方法。在溶剂脱水塔数据上的应用证明该方法对过程故障及传感器故障同时具 备很高的辨识度。 本文第一章对过程监控、多元统计分析和自适应监控的含义及方法进行了介 绍。第二章详细介绍了进一步研究所必需的基础知识:传统p c a 、自适应p c a 的 具体算法,以及用于分析各监控算法性能的仿真及工业实例。第三章对基于基本 主元分析和自适应主元分析的实倒应用进行了深入探讨,同时也探讨了新的在线 过程监控的可视化方法。第四章在结合两种自适应算法的特点和优势的基础上提 7 浙江大学硕士学位论文 出了一种可用于多工况过程监测的柔性p c a 方法,同时研究了建模数据长度变换 的柔性特征。第五章对全文内容进行了总结,并提出展望。 8 第二章基础知识 第二章基础知识 摘要 本章对本文研究工作需要的基础知识进行了介绍。详细阐述了基于主元分析的过程监 控方法,具体介绍了两种自适应p c a 算法,并介绍了用于分析各监控算法性能的仿真及工 业实例。 关键词:主元分析、过程监控、自适应p c a 、滑动窗p c a 、指数加权f c a 2 1 主元分析的基本原理 主元分析法在有一定相关性的m 个样本值和7 1 个参数所构成的数据阵列 x ( 埘以) 的基础上,通过建立较小数目的综合变量,使其更集中的反应原数据阵 列中包含的信息。其基本方法是根据数据在各负荷向量上的方差大小来确定主元 方向的主次地位,按主次顺序得到彼此之间线性无关的各个主元。 为了透彻理解主元分析法的基本原理,本节分别从代数与几何两方面对主元 分析法进行阐述。、 2 1 1 主元分析法的代数原理 主元在代数上是m 个随机数据变量五,屯,毛的一些特殊的线性组合。 对p 维随机矩阵x = “,毫x p ) r ,它的第i 个主成分为: ” 咒= l i r x = l i f 五+ 乙屯+ + 0 ( 2 1 ) 同时各主成分满足以下条件:以,奶,y p 两两互不相关,且其对应方差从大到小 排列。 另外,为了使各主元方差不因系数向量乘以某个常数而增大,要求各系数向 量为单位向量,即r = 1 各主元可根据如丁定理来确定: 定理2 1 6 1 1 设总体工= “,x 2 x p ) r 的协方差阵为,的顺序排列的特征根为: 之五乃o ,q ,乞匕为对应的单位化的正交特征向量,则第f 个主成分 为: 咒= p r 工 ( 2 2 ) 此时: v a r ( y f ) = g 岛= a ,i = l ,2 ,p 9 浙江大学硕士学位论文 c o y ( y , 乃) = e f = o ,i j 可见,主元分析法是对过程数据矩阵的最优重构,各数据样本点将以最为均 匀、集中的方式分布于各主元向量的周围。 2 1 2 主元分析法的几何意义 设在多维空间中,总体x 以常密度分布于以为中心的椭球上。 令= 0 ,将椭球平移至坐标原点处,则椭球面方程为: 了i ty 1 2 + 了1 咒2 + + j 1 一z = c 2 ( 2 3 ) 1 其中密度常数c 2 = o 一脚r 叫o 一) 。 该椭圆主轴沿q 的方向,其余较次要的坐标轴沿乞,气的方向。 ,在几何上,由随机变量线性组合而成的各主元代表了一个新的坐标系,它是 以五,屯, 为坐标轴的原坐标系旋转后得到的。新坐标轴代表数据变异最大的 方向,并且提供了对协方差结构的一个更为精炼的刻画。 在实际应用中,一般假设各变量服从正态分布。此时,可以界定出统计意义 上的椭球边界,并通过观察检测样本点对椭球的偏离程度来进行故障检测。 2 2 基于主元分析法的过程监控方法 : 对于大部分化工生产过程来说,由于过程变量之间普遍存在较强的线性相关 关系,主元分析就成为一种非常有用的统计分析工具。主元分析方法通过对高维 相关变量向低维空间映射,将其转换为几个相互独立的低维空间变量来建立相应 过程数据的主元模型。主元模型利用变量之间的线性相关关系对多维信息进行统 计压缩;用少部分互不相关的主元变量来描述多维空间的绝大部分动态信息,使 多个变量的监测可通过对少数几个主要的不相关变量的监测来完成,同时去除了 变量测量噪声。在实际应用中,首先根据正常历史过程数据建立p c a 统计模型, 确定丁2 和s p e 的统计控制限,并且将采样过程数据向p c a 模型投影,通过观测 采样数据的统计量是否超出控制限,来检测系统中的故障情况。在此基础上,可 以结合各变量对统计量的贡献值或贡献图来寻找故障源,实现初步故障诊断。 2 2 1 数据预处理 为了从与过程监控相关的数据中有效地提取信息,通常需要对训练集中的数 据进行预处理。数据预处理一般包括去除变量、标准化、剔除野点等步骤【5 1 。 训练集中的数据可能包含一些与监控过程信息不相关的变量,在进一步分析 之前应该将这些变量去除。由于传感器标定不准或在物理上脱离了部分被监控过 i o 第二章基础知识 程,可能使得某些变量呈现出很大的测量误差去除这些不适当的变量,可以提 高过程监控方法的效率。 数据标准化可以避免个别特殊变量在过程监控方法中占主导地位,是基于过 程数据的建模方法的一个重要环节。数据标准化通常包含两个步骤1 6 2 1 :数据的中 心化处理和无量纲处理。 数据的中心化处理是指将数据进行平移变换,使得新坐标系下的数据和样本 集合的重心重合。中心化处理不会改变数据点之间的相互位置以及变量间的相关 性。对于数据阵x ( m x n ) ,中心化处理的数学表达式如下: 亏j = 玉j 一一,f = l ,2 ,册,_ ,= l 2 ,刀 ( 2 4 ) 一= 当 ( 2 5 ) 为了消除数据的假变异现象,确保在应用过程监控方法前每个变量被赋予相 等的权重,需要将不同变量的方差归,以免变化大的过程变量占据主导地位。 数据无量纲化的数学表达式如下: = 巴,扣1 ,2 ,朋,7 歹= 1 ,2 ,一- , n ( 2 6 ) 厂了一,? 。巳2 志( 一纡) 2 ( 2 7 ) 在建模时,最常用的数据标准化是对数据同时作中心化和方差归一化处理: 毫,:丑丝 ( 2 8 )玉,= 二三厶“卅 。 o i 从训练集中剔除野点可以显著改善参数估计,这也是对数据进行预处理的基 本步骤【6 3 1 。野点是被分离出的不正确的测量值,这些值可能会严重影响统计参数 的估计值。明显的野点可以通过3 仃准则等来去除。 下述文中若无特别说明,所用数据都假设已做过预处理。 2 2 2 主元模型的建立 所谓主元模型是指对过程变量历史数据进行主元分析后得到的过程变量多 元统计信息集合,它包括过程变量的均值向量= 【一,鸬,以】,标准差向量 o - = o - , ,吼,吒】,协方差矩阵的特征值五( 待l ,2 , 刀) 和相应的特征向量 a o = l ,2 ,拧) ,所采用的主元个数k 等。不同的历史数据集将得出不同的p c a 模型。 利用定理2 1 的结果,对标准化之后的数据矩阵j ( 朋x ,z ) 的协方差矩阵 r = 牙r 别( 历一1 ) 作奇异值分解: r 2 呱u 1 ( 2 9 ) 浙江大学硕士学位论文 式中q 轴为酉矩阵,岛= d i a g ( 磊,扣l ,刀) 为对角矩阵。 求得尺的刀个特征值a 五五o 和对应的单位化正交向量 u i ( i - 1 , 以) 。向量矩阵u = 阻,吃,】即为r “空间的一组标准基,过程数据集 在新的基底u 下将获得最佳的描述,其列向量即为负荷向量岛( f = 1 ,2 ,n ) 。 “ 选择能概括数据主要变化的前k 个主元。通常采用的标准是方差累计和百分 比: t c p v = 五名 ( 2 1 0 ) i - - i i = i j 一般取c p v 8 5 为标准。 、 称u 的前七维线性无关向量p = 【“。,屹, 蚝】构成的子空间为主元空间。后 n - k 维向量沁+ ,巾一、】构成残差空间。则数据矩阵j 可分解为: 上 “f - = t p r + = + (211)tp ee “ 1 += t 矿+ ( 2 f 暑i ;其中,t = “,f 2 ,。气】和p = p l ,扔,以】分别表示主元得分矩阵和负荷矩阵,e 为模型误差,可以表示为: e = 矽= ( 2 1 2 ) i f f i k + l 其中于和户为对应较小特征值的残差得分矩阵和负荷矩阵,于= k + p 气杞, 乙】, p = 【风+ i ,r + 2 。、见】。 从几何上来说,上述主元负荷向量所o = 1 ,2 ,靠) 是彤空间的一组标准化正 交基,而每个得分向量则是数据矩阵j 在和这个得分向量相对应的负荷向量方 向上的投影。负荷向量a 代表数据矩阵j 变化最大的方向,见与p 。正交并代表 牙变化的第二大方向,而见则代表数据变化最小的方向。数据矩阵又的信息主 要体现在较大方差所对应的前几个负荷向量的方向上,而较小方差所对应的负荷 向量上的投影将会很小。一般情况下,认为主元子空间包含了原始数据中有意义 的信息,而残差空间中负荷向量的方差则代表了测量噪声等干扰信息,对其的忽 略往往不会引起有用信息的明显损失,而且可能大大压缩数据维数,方便进一步 的分析计算。 至此,一个基于建模数据的p c a 模型已被建立起来。 2 2 3 基于主元得分图的工况监测 在获得正常过程数据的主元模型后,即可利用其进行故障检测与诊断。p c a 模型反映了正常工况数据的变化关系,当工业过程未发生故障时,来自过程的其 它数据样本投影到主元空间中的得分向量也应该落在主元模型内部,这就是利用 1 2 第二章基础知识 主元分析方法进行过程监控的基本思想。 从算法上来说,得分矩阵z 是数据矩阵j 的线性变化,所以对r 作统计分析 与对j 作统计分析的效果是等价的。对于新采集的数据j ,可求得新数据的主 元得分: t = x p ( 2 1 3 ) 将于的统计特性与r 的统计特性相比较就可以对系统的当前状态做出评估。 通常的方法是在主元子空间建立h o t e l l i n gt 2 统计量、在残差子空间建立s p e ( q ) 统计量进行统计检验k 5 1 。在工业应用中,一般利用多元统计过程控制图进行监控, 常用的有主元得分图、h o t e l l i n gt 2 图、s p e 图和贡献图等。 主元得分图是一种具体而形象地反映各数据样本在主元空间内的投影情况 的过程控制图。主元得分图分为一维主元得分图和二维主元得分图,其中后者更 为常见。主元得分图既可以是反映单个主元的控制图,也可以是多个主元所构成 的平面、立体的轨迹图,还可以与s p e 统计量构成平面、立体的s p e s c o r e 图。 而当主元数k = 2 时,主元昆和办与控制限的关系正好为一个椭圆区域。此时高 维的数据空间的变化监测问题,可以在二维的平面图形上进行直观的考察,如图 2 1 。这也是p c a 早期被应用于工业过程监控的一个典型的优点和原因之一。 图2 i二维主兀得分图 主元得分向量按如下公式计算: t l = 娩 其中为得分向量,x 为过程数据矩阵,a 为负荷向量。 主元得分向量的统计控制限为: k = 五白2 , m - i i a ,l f 口 其中磊是协方差矩阵的第i 个特征值,口是置信度为口的得分向量, ( 2 1 4 ) ( 2 1 5 ) 若毛 口, 浙江大学硕士学位论文 则表明该时刻主元得分统计量正常。 对任意实时数据玉,其在二维主元

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论