(控制理论与控制工程专业论文)基于改进opls间歇过程监测、质量预测及异常变量追溯.pdf_第1页
(控制理论与控制工程专业论文)基于改进opls间歇过程监测、质量预测及异常变量追溯.pdf_第2页
(控制理论与控制工程专业论文)基于改进opls间歇过程监测、质量预测及异常变量追溯.pdf_第3页
(控制理论与控制工程专业论文)基于改进opls间歇过程监测、质量预测及异常变量追溯.pdf_第4页
(控制理论与控制工程专业论文)基于改进opls间歇过程监测、质量预测及异常变量追溯.pdf_第5页
已阅读5页,还剩74页未读 继续免费阅读

(控制理论与控制工程专业论文)基于改进opls间歇过程监测、质量预测及异常变量追溯.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

l o - _ 一一一 111,l at h e s i sf o rt h e d e g r e e e n g i n e e r i n g p r o c e s sm o n i t o r i n g v a r i a b l e sd e t e c b yw 抽gj i n f e n s u p e r v i s o r :a s s o c i a t ep r o f e s s o rc h a n gy u q i n g n o r t h e a s t e r nu n i v e r s i 够 j u n e 2 0 0 9 f 1 p t 独创性:声明 本人声明,所呈交的学位论文是在导师的指导下完成的。论文中取得 的研究成果除加以标注和致谢的地方外,不包含其他人己经发表或撰写过 的研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同工 作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢 = 也 恧。 学位论文作者签名:王金务 日期:m z 石乡 学位论文版权使用授权书 本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论 文的规定:即学校有权保留并向国家有关部门或机构送交论文的复印件和 磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学位论文的全部 或部分内容编入有关数据库进行检索、交流。 作者和导师同意网上交流的时间为作者获得学位后: 半年口一年口一年半口两年口 学位论文作者签名:互盆药 导师签名 签字 日期:节舌勿签字日期 一l 一 : 盲动丁矗 :二一 b 、弓o l l l 毒 丫,- r r 它 东北大学硕士学位论文摘要 基于改进o p l s 的间歇过程监测、质量预测及异常变量追溯 摘要 提高产品质量、保证生产安全一直是现代工业追求的目标,如何对产品质量实时预 测、实施过程监测,及时有效的修复故障,成为现在研究的热点之一。随着计算机等相 关技术的发展,工业过程可获得大量甚至冗余的数据,这些数据蕴含着与生产过程运行 状态及最终产品质量密切相关的信息,若能充分利用这些数据将具有非常重要的意义。 本文以多变量统计方法为理论,提出了基于窗口均值o p l s 的质量预测、过程监测 及异常变量追溯方法,并将其应用到连续退火生产过程中。主要工作包括: 本文通过参考国内外相关文献,介绍了基于p l s 方法的质量预测、过程监测及异常 变量追溯。为使模型更易于解释和理解,引入了o p l s 算法。在o p l s 算法中,正交成 分个数的确定是一个关键的问题,本文提出了一种改进的0 p l s 算法,为准确的确定正 交成分个数提供了一个有效的手段。针对建模变量多、模型结构复杂、数据不等长等问 题,提出了窗口均值o p l s 算法,该方法依据工艺时段确定窗口宽度,并在每一个窗口 宽度内取过程变量的均值作为输入变量建立o p l s 模型;在进行异常变量追溯时,本文 提出了贡献控制限、超限率的思想,为及时修复故障提供了可靠的保证。 连续退火过程具有过程变量多、数据采样频率高等特点,在生产过程中带钢硬度很 难在线测得,主要是通过截取带钢头、尾部进行离线实验分析获得,控制也主要依据操 作工人的经验来实现,具有较大的滞后性和盲目性,而且在连续退火生产中带钢的硬度 缺陷很难弥补。本文将窗口均值o p l s 算法应用到连续退火过程带钢质量预测、过程监 测及异常变量追溯中,验证了该方法的有效性。 关键词:窗口均值0 p l s ;连续退火;质量预测;过程监测;异常变量追溯 一i i 、, 9 - 东北大学硕士学位论文 a b s t r a c t p r o c e s sm o n i t o r i n g ,q u a l i t yp r e d i c t i o na n da b n o r m a lv - a r i a b l e s d e t e c t i o nb a s e do ni m p r o v e do p l s a b s t r a c t i th a sb e e na p e r s i s t e n tg o a lf o rp r o c e s si i l d u s t r yt oi n c r e a s em eq u a l i 妙o fp r o d u c t sa n d e n s u r et h es a f e t yo fo p e r a t i o n ,a r l dh o wt op r e d i c tt h eq u a l i t y ,m o n i t o rm ep r o c e s s ,f i n d 龇l d r e s t o r ef a u l tt i m e l yh a v eb e e n 也er e s e a r c hf o c u sa u c c o r d i n g l y w i 也t h e 缸ti m p r 0 v i n go f c o m p u t e rt e c l l l _ 1 i q u ea n ds oo n ,a b u l l d a mo re v e nr e d u i l d a n td a t ac a nb eo b t a i n e d ,w m c h i n c l u d e si m m a t i o nc l o s e l yr e l a t e d 谢t l lo p e r a t i o ns t a t e sa i l df i n a lq u a l 岖n 而l lb em u c h m o r em e a i l i n g m l i fw ec a 芏lm a l ( em uu s eo fm e s ed a t a i nt l l i sp a p e r ,讹d o w s - m e a no p l s ( o n h o g o n a lp 枷a ll e a s ts q u a r e s ) i sp r o p o s e df o r q u a l 时p r e d i c t i o n ,p r o c e s sm o i l i t o r i n ga n da b n o m a lv 撕a b l e sd e t e c t i o nb a s e do nm u l t i v 撕a t e s t a t i s t i c a lm e m o d sa 1 1 dd a t a m i l l i n gt e c h n o l o g y f i n a l l y ,i ti s 抽t r o d u c e d t 0c o n t i n u o u s a n n e a l i n gp r o c e s s 1 1 1 em a i nc o n t r i b u t i o n so f “sd i s s e r t a t i o nc a nb es 咖姗撕z e d 硒f o l l o w s : t h eq u a l i t yp r e d i c t i o n ,p r o c e s sm o m t o r i n ga n da b n o m a lv a r i a b l e sd e t e c t i o nb a s e do n p l s ( p a n i a jl e a s ts q u a r e s ) 跹dm p l s ( m u l t i w a yp a n i a l l e 嬲ts q u a r e s ) a r ed e s c m e da c c o r d i n g t ol i t e r a l u r e sb o t l lh o m e 锄da l b r o a d o p l si si i l t r d d u c e dt oma :k et l l em o d e le a s i e rt o i n t e 印r e t e t h ed e t e m l i n a t i o no fn u m b e ro fo r m o g o n a lc o m p o n e n t si sa ni m p o r t a i l ti s s u ei 1 1 o p l sa l g o r i t h m a ni m p r o v e do p l sa l g o r i t h mi sp r o p o s e dt op r o v i d ea ne f r e c t i v em e t h o dt o d e t e 加:l i n em en u m b e ro f o r t l l o g o n a lc o m p o n e n t s a tt l l es 锄et i m e ,w i n d o w s - m e a n0 p l s i s p u tf o m 瞰d t od e a l 晰mp r o b l e m so fn u m e r o u sv 撕a b l e sf o rm o d e l i n ga i l du n e q u a ll e n g t i lo f d a t a i tp e 墒m so p l so nm ea v e r a g e 删e c t o r i e so fv 撕a b l e sb a s e do nt 1 1 e 、析d mo ft 1 1 e p r o c e s ss e g m e n t i ti se m p l o y e dt op r e d i c tt h eq u a l i 哆o f t h es t e e li i lc o n t i n u o u sa r m e a l i n g p r o c e s s am e m o dt od e t e c ta b n o m a lv a r i a b l e s 黟o u n d e do nc o n t r o l l i i t l i t so fc o n t 曲u t i o na 1 1 d r a t i oo fo v e r l i m i ti sp r e s e n t e d i tm a k e si tm o r er e l i a b l et 0r e s t o r ef a u l ti np r o c e s st i m e l y t h ec o n t i r m o u sa n n e a l i n g p r o c e s sh a s c h a r a c t e r i s t i c so fm a l l yv 撕a b l e sa n dm g h 行e q u e n c yo fs 锄p l i n g t h eh 2 u r d n e s so fs t e e l i sd i m c u l tt ob em e a l s u r e do m i n e i ti so b t a i n e d m a i n l yb yo m i n ea n a l y s i s ,锄dt h ec o n t r o l i sa l 、v a y so p e r a t e da c c o r d i n gt oe x p e r i e n c e s ,w h i c h c a u s eb l i n d n e s sa 1 1 dp o s t e r i o r i 够w i n d o w s - m e a l lo p l si sa p p l i e dt 0t 1 1 eq u a l i t ) ,p r e d i c t i o n , p r o c e s sm o n i t o r i n ga n da b n o h n a lv a r i a b l e sd e t e c t i o n e x p e r i m e n t sv e r i 母i t sv a l i d i 妙 一i i i 一 、,j崎 -r1 一一 ” i p 一 k j , 东北大学硕士学位论文 目录 目录 独创性声明l 摘要i i a b s t r a c t i i i 第1 章绪论1 1 1 课题研究的目的和意义1 1 2 建模方法研究现状2 1 2 1 基于机理的建模方法2 1 2 2 基于人工智能的建模方法2 1 2 3 基于过程数据的建模方法。3 1 3 过程监测与异常变量追溯方法研究现状一6 1 4 论文内容安排7 第2 章基于p l s 的过程监测及异常变量追溯方法9 2 1 引言9 2 2 偏最小二乘( p l s ) 算法9 2 2 1 数据预处理9 2 2 2p l s 算法基本原理1 l 2 3 多向偏最小二乘( m p l s ) 算法1 4 2 3 1 数据预处理1 5 2 3 2m p l s 算法基本原理1 6 2 4 基于p l s 的过程监测1 7 2 4 1 统计量控制限的确定1 7 2 4 2 在线统计量的计算2 0 2 5 基于p l s 的异常变量追溯2 0 2 5 1 离线贡献的确定2 l 2 5 2 在线贡献的计算2 1 2 6 本章小结2 1 第3 章基于窗口均值o p l s 的质量预测方法研究2 3 3 1 引言。2 3 3 2 正交信号校正基本理论2 3 3 2 1o s c 算法基本思想2 3 v 一 目录 :1 3 :1 6 :1 7 法2 8 :1 9 :;l :;:! 钢质量预测3 3 :;:; 3 6 2 模型结构选择3 7 3 6 3 仿真研究3 8 3 7 本章小结4 7 第4 章基于窗口均值o p l s 的过程监测及异常变量追溯4 9 4 1 引言4 9 4 2 过程监测及异常变量追溯的基本框架4 9 4 3 基于窗口均值o p l s 的过程监测5 0 4 3 1 过程监测模型的建立5 0 4 3 2 在线监测51 4 4 基于窗口均值o p l s 的异常变量追溯,5 l 4 4 1 异常变量追溯模型的建立5 1 4 4 2 在线异常变量追溯5 2 4 5 仿真测试分析5 4 4 5 1 连退机组正常状况测试分析5 4 4 5 2 连退机组异常状况测试分析5 6 4 6 本章小结。6 0 第5 章结论与展望6 1 参考文献6 3 致 射6 7 一一 、 一 r 东北大学硕士学位论文第l 章绪论 第1 章绪论 1 1 课题研究的目的和意义 如何保证产品的质量已成为各项研究工作的一个热点。在工业生产过程中,通过准 确、稳定地对产品质量进行预测、实施过程监控,及时有效地发现和修复过程故障,成 为提高产品质量一个重要途径。 在间歇过程中,很多质量指标往往不能在线测量,通常是在一个批次结束后,根据 产品采样分析值判断最后的产品质量好坏,具有较大的滞后性;“安、稳”是流程工业 企业广泛追求的目标。随着现代流程工业的规模越来越大,生产装置越来越复杂,各生 产单元耦合也越来越强,使得生产过程发生事故的可能性增大,并且过程中的异常波动 或事故很难及时得到发现,往往导致产品质量严重下降,或延误生产计划的正常执行, 造成巨大的经济损失。特别是市场竞争的加剧,能源、环保要求的提高,为了获得稳定、 持续的高质量产品,单纯依靠传统的控制技术并不能从根本上解决生产的问题,企业迫 切需要采用新的技术和手段来保证生产安全和产品质量【l 】。 随着电子技术和计算机应用技术的飞速发展,现代工业过程大都具有完备、甚至冗 余的传感测量装置,可获得大量的实时数据,这些数据具有这样一些特点:测点多,产 生的数据量巨大;数据实时性强;数据间往往存在复杂的非线性关系和严重的耦合现象, 使得数据分析困难;数据的质量和操作参数之间存在较大的时间滞后;很难得到操作参 数与质量指标之间精确对应关系的数据记录;数据存在较大的噪声和孤立点【2 】。由于传 感器故障等因素使得数据中不可避免地存在孤立点,这进一步增加了数据提取和分析的 难度。然而这些数据中蕴含着与生产过程运行状态以及最终产品质量密切相关的信息。 因此,若能充分利用这些数据将具有非常重要的意义。 近年来,随着研究人员探索将基于输入输出数据的多变量统计过程控制技术,以及 数据挖掘的新技术支持向量机、偏最小二乘算法、预测控制等一些新方法应用于过 程控制的研究不断深入,促进了信息技术和冶金自动化的进一步结合,同时也为冶金过 程基于数据信息的处理、建模和控制提供了一种新的途径,开辟了一个新领域。 因此,本论文以获取的正常工况下的数据为基础,以能有效克服多变量数据相关性 的多变量统计过程控制技术o p l s 为主要工具,建立可测过程变量与质量之间的回 归模型,进而实现质量的实时预测和过程监测及异常变量追溯。在报警时,预测模型的 逆向推理获得异常过程变量,提出优化操作建议,为工艺操作提供指导。 东北大学硕士学位论文第l 章绪论 1 2 建模方法研究现状 1 2 1 基于机理的建模方法 机理分析法建模又称数学分析法建模或理论建模。对于一些简单的被控过程建模可 采用此方法。机理建模是根据过程内部的机理( 运动规律) ,运用一些已知的定律和原理, 如生物学定律、化学动力学原理、物料平衡方程、能量平衡方程、传热传质原理等,建 立过程的数学模型【3 1 。机理分析法建模的最大特点是当生产设备还处于设计阶段就能建 立其数学模型。由于该模型的参数值与性能参数有关,因此对新设备的研究和设计具有 重要意义。另外,对于不允许进行试验的场合,该方法是唯一可取的。机理分析法建模 主要是基于分析过程的结构及其内部的物理化学过程,因此要求建模者应有相应学科领 域的知识。 因为机理关系可以清楚地展示过程的内在结构和联系,机理模型建好后,可以用来 模拟实际系统的运行情况,加深对实际过程的理解,提高操作水平;同时,通过模型仿 真,可以帮助掌握对象的动态特性,为过程优化和控制奠定基础。但是,对于实际的工 业过程,机理分析只能用于简单的过程建模。对于一个复杂的生产过程,这种建模方法 存在很大的局限性。因为进行机理建模时,对所研究的对象必须提出合理的简化假设, 否则会使问题复杂化,然而这些假设往往不一定能符合对象的实际情况,甚至对某些过 程对象的机理并不了解;另一方面,建立一个机理模型通常需要耗费很大的精力,且不 适用于机理尚不完全清楚的工业过程;再者,过程中的某些因素在不断变化,而且其变 化难以精确描述。所以机理分析建模方法的有效性是建立在对工艺过程机理了解程度的 基础上,由于绝大多数过程控制存在非线性性、不确定性和复杂性等客观因素,难以建 立其精确的数学模型,并且在线计算量大难以满足实时要求。 1 2 2 基于人工智能的建模方法 人工智能( a n i 6 c i a l1 1 1 t e l l i g e l l c e ) 一词最初是在l9 5 6 年d a n m o u t h 学会上提出的,以 后研究者们发展了众多理论和原理,人工智能的概念也随之扩展。人工智能是一门极富 挑战性的科学,从事这项工作的人必须懂得计算机知识、心理学和哲学:人工智能是包 含十分广泛的科学,它由不同的领域组成,如机器学习、计算机视觉等等。总的说来, 人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复 杂工作。目前能够用来研究人工智能的主要物质手段以及能够实现人工智能技术的机器 就是计算机,人工智能的发展历史是和计算机科学与技术的发展史联系在一起的。除了 计算机科学以外,人工智能还涉及信息论、控制论、自动化、心理学、数理逻辑、语言 学、医学和哲学等多门学科。其主要内容包括:知识表示、机器学习和知识获取、知识 ,一 k 7 一 东北大学硕士学位论文第l 章绪论 处理系统、自然语言理解、计算机视觉、智能机器人、自动程序设计等方面【2 1 。 1 2 2 1 基于模式识别的建模 该种建模方法是采用模式识别的方法对工业过程的操作数据进行处理,从中提取系 统的特征,构成以模式描述分类为基础的模式识别模型。基于模式识别方法建立的模型 与传统的数学模型不同,它是一种以系统的输入、输出数据为基础,通过对系统特征提 取而构成的模式描述式模型。该方法的优势在于它适用与缺乏系统先验知识的场合,可 利用日常操作数据来实现建模。在实际应用中,该种建模方法常常和人工神经网络以及 模糊技术结合在一起。 1 2 2 2 基于模糊技术的建模 模糊技术能够模仿人类的推理思维过程,描述具有不确定性和不精确性的知识。二 十世纪9 0 年代初期,k o s k 0 先后独立证明不同类型的模糊逻辑系统是在紧致集上连续 函数的万能逼近器,能够以任意精度逼近任意的连续实函数。同时模糊系统包含的规则 可以采用专家知识构建,从而将定性知识与定量数据以互补的方式组合,相对于其它非 线性近似技术,模糊系统提供了一种对非线性系统更加透明的描述,可以以人们熟悉的 方式将过程数据转化到模型中,同时进行分析【5 1 。 模糊逻辑系统是基于特定应用领域中的人类专门知识和经验而建成的系统。对于那 些难以建模或模型表示过于复杂的系统,可通过模糊条件语句描述系统的主要特征,建 立相应的模糊逻辑系统,并可以此作为研究该系统控制问题的设计模型。以模糊逻辑系 统为基础的模糊建模,属非线性建模方法,一般通过多段线性逼近实现全局的非线性逼 近,且逼近精度可达任意小,在处理信息系统的知识不完整、不精确问题中越来越得到 广泛应用。模糊逻辑系统具有以下特征:( 1 ) 模糊逻辑系统的规则结构使它在建模中易于 直接包含人类对目标系统的专门知识,亦即领域的先验知识;( 2 ) 当拥有目标系统的输入 输出数据时,传统的系统辨识技术可用于模糊建模,帮助确定系统的结构和参数。然而, 特定应用领域中的人类专门知识和经验如何帮助模糊逻辑系统的模糊规则和隶属度函 数的自动生成,一直是阻碍其应用的一大难题。 1 2 3 基于过程数据的建模方法 对于机理不清楚的对象,可采用基于试验的建模方法,因为过程的输入输出信号总 是可以通过测量得到的。而过程的动态特性必然表现在这些输入输出数据之中,则可以 使用这些数据提供的信息来建立过程的模型。或利用输入输出数据中提取有用的信息, 构建主导变量与辅助变量之间的模型,这种方法也称为辨识方法。由于这种方法无需了 解太多对象的先验知识,因而是一种较为通用的建模方法。 一3 一 输 图1 2m 州估计参数 f i g 1 2a n no f p a r a m e t e re s t i m a t i o n 神经网络的结构类型很多,大致可以分为前向网络和反馈网络。在建模中常用多层 前向网络,其中最常用的两种是b p 神经网络和i 出f 神经网络,另外还有基于这两种网 络的多种改进模型。传统的b p 网络算法采用基于误差反向传播的梯度算法,充分利用 了多层前向网络的结构优势,在正反向传播过程中每一层的计算都是并行的,算法在理 论上比较成熟,且已有许多商用软件可供使用;而r b f 网络利用了差值法的研究成果, 采用了前馈的结构,二者都是对真实神经网络不同方面的近似,各有其优缺点【2 】。 一4 一 k - , 东北大学硕士学位论文笫l 章绪论 1 2 3 2 基于支持向量机的建模 支持向量机( s u p p o r tv e c t o rm a c h i n e ,简称s v m ) 是一种新的机器学习算法,它的基 础是由v a p n i k 创建的统计学习理论【7 1 ,近年来成为机器学习和模式识别的研究热点,已 广泛应用于模式识别、系统辨识等许多领域中【引。 大多数传统方法都是基于经验风险最小化原则,使训练误差达到最小;与传统学习 方法相比,s v m 则基于结构风险最小化原则,最小化的是推广误差的上界,从而通过 在模型的复杂性和训练误差之间寻求平衡点,得到一个最优的网络结构,较好的解决了 过学习和欠学习问题。另外,同时该理论把机器学习问题转化为一个二次规划问题,可 以得到唯一的全局最优解,而不像神经网络训练那样容易陷入局部极小点。正是由于上 述优点,s v m 在模式识别领域得到了广泛的应用,而且,近年来还被扩展应用到了回 归、时间序列预测等方面f 4 1 。 s 除了前面提到的优点外,在设计上也很灵活。首先,可以通过选择不同的核 函数、不同的优化目标函数、不同的范数、不同的参数得到不同的分类器和函数逼近器: 其次,s v m 的结构中隐层单元数是通过优化目标函数得到的,从而避免了结构选择的 困难【4 1 。 1 2 3 3 基于状态估计的建模 假设已知系统对象的状态空间模型为【9 】 x = a x + b n + e v j ,= ( 1 1 ) 9 = c e x + w 其中,x 为过程的状态变量;l ,w 分别表示白噪声;j ,秒分别表示过程的主导变量 和辅助变量。 如果系统主导变量作为的系统的状态变量关于辅助变量是完全可观的,那么软测量 问题就转化为典型的状态观测和状态估计问题。采用k a l m a n 滤波器和l u e n b e r g e r 观测 器是解决问题的有效方法。 状态估计已经在工业上得到成功的应用。t h 锄等给出两种自适应估计器,成功用 于发酵反应的发酵率、精馏塔塔顶产品组分和聚合物的熔融指数的估计。g u i l a n d o u s t 等在自适应估计器基础上,采用自适应推理控制技术对精馏塔塔底产品组分进行控制。 q u i n t e r o - m a 彻o l 等将扩展l u e n b e 唱e r 观测器用于多成分精馏塔,通过测量的温度变量 对精馏产品组分进行预测【4 】o 1 2 3 4 基于回归分析的建模 经典的回归分析是一种建模的基本方法,应用范围相当广泛。以最小二乘原理为基 一5 一 东北大学硕士学位论文第1 章绪论 础的一元和多元线性回归技术目前已相当成熟,常用于线性模型的拟合。线性回归假设 自变量x 和因变量l ,具有如下线性关系: l ,= 淞+ 冒 ( 1 2 ) 式中,e 为模型误差,曰为回归系数。在工业过程中,x 通常为容易测量的过程 变量,l ,为质量变量的实际测量值。对于方程( 1 2 ) ,可以采用普通最小二乘方法求解, 从而得到回归系数b : 曰= ( x r x ) 。1 x 7 l r ( 1 3 ) 在式( 1 3 ) 中,( x r x ) 。1 必须是可逆矩阵。因此,当自变量中存在严重的多重相关性 或自变量中的样本数与变量个数相比太少时,这个最小二乘估计曰将会失效,并引发一 系列应用方面的困难。 主元回归( p c r ) 方法采用主元分析( p c a ) 【1o 】的思想,首先对x 矩阵进行主元分析, 提取自变量空间相互正交的主元,再建立因变量和正交主元间的回归模型,从而较好地 解决了共线性问题。但p c a 在选取主元时以最大限度地概括自变量空间的数据变化信 息为准则,并没有考虑自变量主元对于因变量的解释作用,删除的次要主元有可能包含 对回归有益的信息,而保留的主元很可能会夹杂进一些对于回归无益的噪声。p l s 方法 就是针对这一问题提出来的,它不是孤立地选取x 的主元或l ,的主元,而是同时提取x 和i ,的主元进行线性回归,而且在选取主元时考虑二者间的关系,使它们的协方差尽可 能大,因此建立的模型具有更好的预测性。 由于p l s 回归方法能够有效地解决共线性问题,非常适用于过程变量较多而且耦合 严重的工业过程建模,因此在过程建模【1 1 1 、监控和故障诊断【1 2 】等领域得到了广泛应用。 1 3 过程监测与异常变量追溯方法研究现状 就工业过程的监测领域而言,过程监测与异常变量追溯当前研究方法可分为三大 类:基于数学模型的方法、基于知识的方法和基于数据驱动的方法。基于模型的方法发 展时间较长,相对比较成熟,但主要成果限于线性系统,监测性能的好坏很大程度上依 赖于过程模型的准确程度。由于流程工业的复杂性、严重非线性以及强耦合性等特点, 基于模型的方法在流程工业的性能监控中难以得到广泛应用。基于知识的方法主要是利 用人工智能的方法包括模糊逻辑、因果分析、专家系统等,构造某些系统功能以模仿和 实现人类熟练操作人员、技术人员、专家在监测控制过程中的某些思维和行为,自动完 成整个监测和诊断过程。基于数据驱动的方法以采集的过程数据为基础,通过各种数据 处理与分析方法如多元统计方法、聚类分析、频谱分析、小波分析等挖掘出数据中隐含 的信息,从而指导操生产。相比较而言,基于数据驱动的过程监测的研究不需过程的精 确解析模型,所获得的理论成果和方法能够较快地应用于实际工业生产中【1 3 】。 一6 一 , “ k - 产 东北大学硕士学位论文第l 章绪论 基于数据驱动的方法是直接利用过程数据的一种监控方法。其优势在于它们能够将 高维数据变换成低维的数据,并从中获取总要的信息。基于数据驱动的监控方法不需要 精确的数学模型,而是采用多元投影的方法,将高维过程和质量数据从高维数据空间投 影到有效的低维特征空间,摈弃冗余,是一种高维数据分析的有效数据。数据驱动方法 可以分为主元分析和部分最小二乘法,除了基本的方法之外,它们都有各自不同的扩展, 以适应不同场合中应用的需要,v e n k a t a s u b r 锄a i l i a ( 2 0 0 3 ) 将基于人工智能的方法也包含 在数据驱动方法中,并将基于数据驱动的方法从定性和定量两个角度进行分类,如图1 3 所示。在计算机系统普遍应用,控制技术日益提高,有丰富的生产数据的情况下,采用 多变量统计方法,能有效地提高产品质量、增加经济效益【1 3 】。 f 专家系统 基f 定性的方法 翕 l 动态趋势分析 磊1f 神经网络 耄i 定量的方法f 单变量统计方法:s h e w h a n 控制图等 法。 l 统计的方法 多变量统计方法:p l s 等 、 l 统计分类:f i s h e r 判别式等 图1 3 基于数据驱动的分类方法 f i g 1 3c l 弱s i f i c a t i o nm e t h o db a s e do nd a t a - d r i v e n 1 4 论文内容安排 本论文以课题组项目“冷轧连续退火机组带钢质量预测及炉况优化调整 为依托, 进行了多元统计方法的研究,即“基于窗口均值o p l s 的间歇过程监测、质量预测及异 常变量追溯 。本文以o p l s 方法为主线,研究了其在间歇过程中的应用。 第1 章介绍论文研究工作的背景,综述了建模方法、过程监测及异常变量追溯的研 究现状,最后介绍了本论文的内容安排。 第2 章从理论上介绍了p l s 方法及其扩展方法多向p l s ( m p l s ) 算法,研究了 基于核密度估计的控制限确定方法,并在此基础上介绍了基于p l s 过程监测和异常变量 追溯的基本原理。 第3 章介绍了一种将o s c 算法与p l s 算法相结合的方法o p l s 算法。首先介 绍了o s c 的几种典型算法,并将其与p l s 算法相结合,介绍了o p l s 算法的基本思想; 提出了一种改进的o p l s 算法,为准确的确定正交主元个数提供了一个有效地方法;提 出了一种寻找正交信息来源的方法,有助于合理的选取建模变量;针对变量多、采样频 率高、数据不等长问题,提出窗口均值o p l s 算法,该方法在简化模型结构、减小计算 量的同时,使得模型更加容易解释和理解;将该方法应用于连退机组带钢硬度预测,验 一7 一 第1 章绪论 窗口均值o p l s 算法的过程监测与异常变量追溯。首先介绍了统 ;提出了一种基于窗口均值o p l s 算法的过程监测和故障诊断的 常变量,提出了一种基于变量贡献控制限和超限率的异常变量追 连续退火过程,具有较好的监测和追溯性能。 了总结,并指出可进一步研究的方向。 一8 一 东北大学硕士学位论文第2 章基于p l s 的过程监测及异常变量追溯方法 第2 章基于p l s 的过程监测及异常变量追溯方法 2 1 引言 在当今激烈的市场竞争压力下,现代工业迫切需要能够直接控制产品质量、监测生 产过程的方案,然而大多数质量指标难以直接测量,且生产过程一旦出现故障后,不能 及时的确定主导异常变量,因此需要通过构造某种数学关系,以解决各种质量指标不可 直接测量、故障无法及时排除等问题,更好地控制产品质量、进行生产过程监测、提高 企业效益。建立详细的机理模型通常很耗费时间和精力,而且需要对机理非常了解。为 了解决这个问题,基于数据的统计模型得到越来越多的应用。 偏最小二乘( p l s ) 方法自w r o l d 【1 4 】提出以来,由于其良好的性能,已广泛地应用于工 业过程的建模、监测、故障诊断等领域【l l - 1 2 1 。p l s 方法通过将高维数据空间投影到低维 特征空间,得到相互正交的特征向量,再建立特征向量间的线性回归关系。正交特征投 影使p l s 有效地克服了普通最小二乘回归的共线性问题。但是p l s 方法并不能直接应 用于间歇过程,一些学者提出了多向p l s ( m p l s ) 方法用于间歇过程的建模。 本章首先介绍了p l s 算法及m p l s 算法,在此基础上,介绍了基于p l s 算法的间 歇过程监测及异常变量追溯。 2 2 偏最小二乘( p l s ) 算法 偏最小二乘算法( p a n i a ll e 硒ts q u a r e s ) 是一种新型的多元统计数据分析方法。它于 1 9 8 3 年由伍德【1 3 1 ( s w - 0 l d ) 和阿巴诺( c a l b a l l o ) 等人首次提出。偏最小二二乘算法的出现是 为了解决传统的多变量回归方法在以下两个方面的不足: ( 1 ) 数据共线性问题。现代工业过程的测量变量之间存在一定程度的相关性,即变 量和变量之间存在耦合关系。变量间的这种相关关系会导致预测矩阵的协方差矩阵 三= x 7 x 是一个病态矩阵,这将降低最小二乘回归方法中回归参数曰= ( x7 x ) j x r y 的 估计精度,从而造成回归模型的不稳定【1 5 】。 ( 2 ) 小样本数据的回归建模,尤其是样本个数少于变量个数的情况【1 6 】。一般来说, 普通回归建模方法要求样本点数目是变量个数的两倍以上,而对于样本点个数小于变量 个数的情况则无能为力。 2 2 1 数据预处理 在进行p l s 回归分析时,通常首先要对数据进行预处理,常用的方法是标准化处理。 一个好的标准化方法可以很大程度上突出过程变量之间存在的相关关系、去除过程中存 一9 一 东北大学硕士学位论文第2 章基于p l s 的过程监测及异常变量追溯方法 在的一些非线性特性、剔除过程变量之间不同的测量量纲对模型的影响、简化数据模型 的结构。数据标准化通常包含两个步骤:数据的中心化处理和消量纲化处理。 数据的中心化处理是指将数据进行平移变换,即【1 6 】: 嘞+ = 勃一弓( 汪l ,;j = 1 ,) ( 2 1 ) 弓= 专而 ( 2 2 ) 其中,是样本点个数,是变量个数,为标准化前的矩阵x 的第f 行第列,x 。, 为标准化后的数据,i 为x 的第列的均值。 该变换可以使新坐标原点与样本点集合中心重合,既不会改变样本点之间的相互位一 置,也不会改变变量间的相关性。但变换后,却常有许多技术上的便利。 如果各变量的测度单位是一致的,可以采用欧氏距离来测定样本空间,中点点之间 的距离,有 d 2 ( ,黾) = i 薯一吒1 1 2 = ( 毛,一) 2 然而在实际问题中,不同变量的测量单位却往往是不一样的。例如,在连续退火过 程中,卷取机张力在一万牛顿左右,而水冷区水温一般在几十摄氏度左右变动。由于卷 取机张力比较大,它在坐标图上的变异就显得很大,而水温的变异就显得比较小。因此 若利用这些数据进行分析时,就会夸大卷取机张力的作用,而忽略水温的变化。事实上, 卷取机张力这种大的变化是由于测量单位导致的,卷取机张力变化几百牛顿相对于其量 程来说变化并不是很大,而水温变化一两度,相对于其量程来说变化则是比较明显的。 统计学中称这种不能真实反映数据本身变化的情况为假变异现象。 为了消除这种假变异的不良影响,就要消除变量的量纲效应,是每一个变量具有相 同的表现力。数据分析中常用的消量纲的方法,是对不同的变量进行所谓的压缩处理, 使每个变量的方差均为1 ,即 薯,。= 丑( f = 1 ,;歹= 1 ,)( 2 3 ), 3 j _ = 击( 而一秒( 川,) ( 2 4 ) 。, 其中,已为x 的第列的方差,工,、弓的定义如前。 还有其他的消量钢的方法,如 i 2 :赢o - l ,l 产l ( 2 5 ) 一1 0 , 东北大学硕士学位论文第2 章基于p l s 的过程监测及异常变量追溯方法 t ,2 i 矗害著i i o = l ,;= 1 ,j ) ( 2 6 ) o = 等( 扛1 ,州= 1 ,州r = 朋甜) f _ m 伽) f ) ( 2 7 ) m 纵 勃) ,为x 的第列的最大值,研圳嘞) ,为x 的第列的最小值,尺为二者之差。 本文采用如式( 2 3 ) 所示的消量纲方法。 数据标准化则是对数据同时作中心化和消量纲化处理: 玎2 学”1 ,州_ 1 , 2 2 2p l s 算法基本原理 ( 2 8 ) 设有m 个因变量 j ,。,儿,j ,肼) 和,个自变量 ,吒,而 。为研究因变量与自变量 的统计关系,观测了j 个采样点,由此构成了自变量与因变量的数据表 x = “,) ,l ,= j ,。,奶,) 。设矩阵x 和l ,均已标准化,则p l s 模型基本关 系式为【1 7 】: x = t 只r + e = 冲r + 占 ( 2 9 ) 一 y = 吩吼r + f = 坦r + f ( 2 1 0 ) 墨i u 2 l 矗 【z 1 1 ) 式( 2 9 ) 、( 2 1 0 ) 也称为p l s 算法的外部模型,式( 2 1 1 ) 为p l s 算法的内部模型。其中, ( ,1 ) 和吩( ,1 ) 为得分矢量( 主元) ,只( j 1 ) 和吼( ,1 ) 为载荷向量,丁( ,彳) 和u ( ,么) 为x 和l ,的得分矩阵,p ( ,彳) 和q ( m 彳) 为x 和l ,的载荷向量,e ( ,) 和,( ,m ) 为x 和l ,的残差矩阵,彳为保留的主元( 隐变量) 个数。曰( 彳彳) = 饿口g ( 6 l ,屯) 为对角 矩阵,描述输

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论