




已阅读5页,还剩39页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大连理工大学硕士学位论文 摘要 工业过程往往具有结构复杂、非线性、时变、耦合、不确定性、信息量少的特点。 随着生产过程规模的进一步扩大和复杂程度的提高,透彻分析其过程机理并建立精确数 学模型已经变得越来越困难,利用可测量的生产数据建立其辨识模型已成为必然的选 择。自1 9 9 5 年v a p n i k 等人提出支持向量机算法以来,基于核的机器学习方法( 简称核 方法) 取得了迅速的发展,目前已成为人工智能和机器学习领域的研究热点之一,已经 在模式识别、系统辨识等许多领域中得到成功应用,因此,本文以一类具有非线性特性 的复杂工业过程为背景开展研究工作,将核方法应用于工业过程数据特征提取、建模和 预报。 本文提出一种基于核方法和贪婪思想的主元提取模糊神经网络模型。采用核函数把 输入变量向高维特征空间映射来充分挖掘变量的隐藏信息,经贪婪算法优化选取主元, 输入自适应神经模糊推理系统后,网络以规则的形式来反映数据间蕴含的关系,避免出 现规则爆炸,为提高模糊神经网络建模精度提供一个有效的方法。此外,以统计回归方 法为基础,建立一种基于核方法的贝叶斯回归模型。与传统人工经验控制方法相比,回 归模型能消除随机因素的影响,提高动态过程控制精度。在分别采用增量回归及贝叶斯 回归模型对工业过程量建模,并进行比较后发现,基于核方法的贝叶斯模型在保证建模 精度的情况下,还能自动对参数进行有效估计,避免人工干预的影响。 最后,以转炉炼钢工业过程为应用实例,应用基于核方法的贝叶斯回归模型计算补 吹氧量的结果,结合三阶段梯形脱碳曲线理论建立碳指数模型,对熔池碳含量的实时变 化及终点情况做出指导。并对碳积分模型进行修正,结合炉气分析仪的实测数据,计算 总脱碳量,为碳含量的终点预报提供一个新途径。 关键词:核方法;工业过程建模;贪婪思想;贝叶斯回归;转炉炼钢 基于核方法的复杂工业过程建模研究 r e s e a r c ho n c o m p l e x i n d u s t r i a lp r o c e s sm o d e l i n g ba s e do nk e r n e lm e t h o d a b s tr a c t i n d u s t r i a lp r o c e s s e sa r ea l w a y sw i t ht h o s ec h a r a c t e r i s t i c s :t h eh i g hd e g r e eo fs t r u c t u r e c o m p l e x i t y ,s t r o n g l yn o n l i n e a rb e h a v i o r , t i m ev a r y i n gc h a r a c t e r i s t i c s ,c l o s ec o u p l e da n d l l i 曲d e g r e eo fu n c e r t a i n t y ,f e wu s e f u li n f o r m a t i o n , e t c w i t ht h ed e v e l o p m e n to ft e c h n o l o g y a n dp r o d u c t i v i t y ,t h es y s t e m so ft h ei n d u s t r i a lp r o c e s sc o n t r o lb e c o m em o r ec o m p l e xd u et o t h el a c ko fp r e c i s e ,f o r m a lk n o w l e d g ea b o u ts y s t e m o w i n gt ot h el a c ko fp r e c i s e m a t h e m a t i c a lm o d e l ,i ti sd i m c u l t ,e v e ni m p o s s i b l e ,t oc o n t r o ls u c hc o m p l e xs y s t e m s s i n c e p r o f v a p n i kp r o p o s e dt h es u p p o r tv e c t o rm a c h i n e ( s v m ) b a s e do ns t a t i s t i c a ll e a r n i n g t h e o r yi n19 9 5 ,k e m e lm e t h o db a s e dm a c h i n el e a r n i n ga l g o r i t h mh a sb e e nd e v e l o p e dr a p i d l y i tb e c o m e so n eo ft h eh o tp o i n t si na c a d e m i cr e s e a r c hn o wa n dh a sb e e nw i d e l yu s e di n p a t t e r nr e c o g n i t i o n ,s y s t e m i d e n t i f i c a t i o n s u c c e s s f u l l y ,e t c t h e r e f o r e ,b a s e d o nt h e b a c k g r o u n do fn o n l i n e a ra n dc o m p l e xi n d u s t r i a lp r o c e s s i n g ,t h i sp a p e ra p p l i e st h ek e r n e l m e t h o dt ot h ef e a t h e rs e l e c t i o n ,m o d e l i n ga n d p r e d i c t i o no ft h ed a t ao fi n d u s t r i a lp r o c e s s t h ep a p e rp r o p o s e sap r i n c i p a lc o m p o n e n tf u z z yn e u r a ln e t w o r km o d e lb a s e do nk e r n e l m e t h o da n dg r e e d ya l g o r i t h m ,w h i c hm a pt h ei n p u tv a r i a b l e si n t ot h eh i g hd i m e n s i o n a ls p a c e i no r d e rt of u l l ym i n et h eh i d d e ni n f o r m a t i o n t h r o u g hg r e e d ya l g o r i t h mt os e l e c tt h e p r i n c i p a lc o m p o n e m s ,w h i c ha r ei m p o r ti n t ot h ef u z z yn e u r a ln e t w o r km o d e l ,t h en e t w o r k r e f l e c t st h eh i d d e nr e l a t i o n s h i pb e t w e e nt h ed a t au s i n gr u l e s ,a v o i dt h ee x p l o s i o no ft h er u l e s a n dp r o v i d ea l le f f i c i e n tm e t h o dt oi m p r o v et h ep r e d i c t i o na c c u r a c yo ft h ef u z z yn e u r a l n e t w o r k a d d i t i o n a l l y ,a c c o r d i n gt ot h es t a t i s t i c sr e g r e s s i o nm e t h o d ,t h ep a p e rc o n s t r u c t sa b a y e s i a n sm o d e lb a s e do nt h ek e r n e lm e t h o d c o m p a r i n gw i t ht h et r a d i t i o n a la r t i f i c i a l e x p e r i e n c e s ,t h em o d e lg e t sr i do ft h ei n f l u e n c eo fr a n d o mf a c t o r s ,a n di m p r o v e st h ea c c u r a c y o fd y n a m i cp r o c e s sc o n t r 0 1 u s i n gi n c r e m e n tr e g r e s s i o nm o d e la n db a y e s i a n sr e g r e s s i o n m o d e lt ob u i l dt h em o d e lo ft h ei n d u s t r i a lp r o c e s sr e s p e c t i v e l y ,t h ep a p e rc o m p a r et h er e s u l t s o fb o t ht h em e t h o d s a n dt h eb a y e s i a n sm o d e lb a s e do nt h ek e m e lm e t h o da n da u t o m a t i c a l l y e s t i m a t et h ep a r a m e t e r s ,a v o i d i n gi n f l u e n c eo fm a n p o w e ri n t e r f e r e n c e i nt h ee n d ,t a k eb o fs t e e i m a k i n gf o re x a m p l e ,t h ep a p e rc o m p u t e st h es e c o n db l o w i n g o x y g e nv o l u m eu s i n gt h er e s u l to ft h eb a y e s i a n sm o d e lb a s e do nt h ek e r n e lm e t h o d ,w h i c h c o m b i n e st h et h e o r yo ft h r e es t e p so fd e c a r b u r i z a t i o nt oc o n s t r u c tt h ee x p o n e n t i a lm o d e l ,i n o r d e rt od i r e c tt h er e a lt i m eo ft h ec o n t e n to fc a r b o na n de n d p o i n tc o n d i t i o n a n dt h ep a p e r m o d i f i e st h ei n t e g r a lm o d e lo fc a r b o n ,c o m b i n i n gt h ed a t ad e t e c t e db ye x h a u s tg a sa n a l y s i s ,t o i i 大连理工大学硕士学位论文 c o m p u t et h et o t a la m o u n to fd e c a r b u r i z a t i o n ,s ot h a tan e wa p p r o a c ht op r e d i c tt h ec a r b o n c o n t e n to ft h ee n d p o i n ti sp r o v i d e d k e yw o r d s :k e r n e lm e t h o d ;i n d u s t r i a lp r o c e s sm o d e l i n g ;g r e e d ya l g o r i t h m ;b a y e s i a n s r e g r e s s i o n ;b o fs t e e l m a k i n g i i i 大连理工大学学位论文独创性声明 作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究 工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外, 本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请 学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献 均已在论文中做了明确的说明并表示了谢意。 若有不实之处,本人愿意承担相关法律责任。 学位论文题目:差童丛墨蔓竺量塾些壁亟蕉嫠坐 作者签名:立卤单 一一一 日期:二丛年上三月盥 大连理工大学硕士研究生学位论文 大连理工大学学位论文版权使用授权书 本人完全了解学校有关学位论文知识产权的规定,在校攻读学位期间 论文工作的知识产权属于大连理工大学,允许论文被查阅和借阅。学校有 权保留论文并向国家有关部门或机构送交论文的复印件和电子版,可以将 本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、 缩印、或扫描等复制手段保存和汇编本学位论文。 学位论文题目: 墨垂彗左堕鱼星差圭垒篷径建塑巳耸整 作者签名: 盔巫。盈 日期:选年l 月鱼二日 导师签名:复丛日期:壁年尘月2 饵 大连理工大学硕士学位论文 1绪论 基于核的机器学习方法自从上个世纪9 0 年代被提出后,在许多领域中得到很好的应 用,然而在过程工业中由于问题的复杂性及特殊性,核方法的工业应用的拓展还需要进 一步的努力。本文结合过程工业数据的特点,提出基于核思想的建模方法,并将之应用 于复杂工业过程实际应用中。本章首先阐述论文的研究背景和意义,然后介绍目前国内 外将机器学习方法应用于复杂工业过程建模的研究进展和现状,并对其作简要的分析与 总结,最后给出本文的主要研究内容。 1 1 课题的研究背景及意义 随着生产规模的日益扩大,工业过程的系统复杂度也不断提高,如何建立描述这些 系统行为的模型,成为研究人员关注的一个焦点。建立工业过程模型一般有三种途径【l 】: ( 1 ) 从系统内在机理出发,推导出机理模型,机理建模方法通常要针对具体问题仔 细分析系统的动力学特性,建立物理化学平衡方程; ( 2 ) 根据输入输出信号,用系统辨识或参数估计求取一个微积分或差分数学模型, 系统辨识或状态估计主要是一些信号处理方法; ( 3 ) 根据系统运行状态下的输入输出数据,通过智能方法,建立一个基于知识的模 型。利用知识发现和人工智能的建模方法是近3 0 年以来兴起的一个方向。 在这些多变量、非线性时变的工业过程系统中,其物理或化学动力学过程具有以下 特点:状态变量维数高、各变量强相互关联、检测信号粗糙而不完整、干扰随机、系统 参数时变等等。这就要求被控对象的动力学模型不仅有学习和识别的能力,而且对环境 和干扰有较强的鲁棒性,所以建立数学解析模型具有一定的困难。因此,作为数学解析 建模的一种补充方法,过程辨识和人工智能是研究者们关注的一个研究方向。由于过程 辨识和人工智能能够在信息量不足、不完备的情况下,对那些用数学模型难以描述的复 杂系统进行建模,在工业过程、计划决策、商品制造中得到了广泛应用。 随着机器学习理论的发展,其应用已遍及多个领域,如专家系统、人脸识别、语音 识别、计算机视觉和网络安全等。常用的机器学习方法包括支持向量机、贝叶斯网络、 决策树等,这为传统控制理论难以解决的复杂工业过程建模问题提供了一条新的途径。 基于核的机器学习方法或称核方法( k e r n e lm e t h o d ,峋,是以支持向量机为核心算法的 一类新的机器学习方法,是统计学习理论与核技术相结合的产物。它具有两个显著的特 点【2 】:首先是在线性与非线性间架设起一座桥梁,其次是通过巧妙地引入核函数,避免 了维数灾难,也没有增加计算复杂度。目前,支持向量机己成为核机器学习领域内重要 基于核方法的复杂工业过程建模研究 的研究内容之一。对核方法的深入研究,无论是对机器学习的进一步发展,还是对其在 工业建模中的实际应用,都有重要的意义。 1 2 国内外研究现状及分析 核函数本质上是一个内积( 或点积) ,即通过引入核函数,把基于内积运算的线性算 法非线性化,为处理许多问题提供了一个统一的框架。核函数理论已有很长的历史, m e r c e r 定理【3 】可追溯到1 9 0 9 年;再生核( r e p r o d u c t i o nk e r n e l ,r k ) h i l b e r t 理论f 4 ,5 1 是2 0 世纪4 0 年代发展起来的;1 9 7 5 年,p o g g i o t 6 1 首用到了多项式核函数。随着核函数理论 的发展,核函数的思想后来发展成核方法。1 9 9 5 年,统计学习理论的创始人v a p n i k 等 人利用“核技巧”( k e r n e lt r i c k ,k t ) ,即通过引入核函数代替内积,构建了一种新的核 方法一支持向量机( s u p p o r tv e c t o rm a c h i n e ,s v m ) ,至此,核方法的重要性得到了充分 的重视【4 ,7 】。支持向量机自2 0 世纪9 0 年代初提出,迄今已经历了近2 0 年的发展。支持 向量机由核函数与训练集完全刻画,在模式识别、预测以及聚类等方面,成功的应用屡 见不鲜,在理论上也取得了很大进展【8 】。该方法大大提高了学习性能,掀起了机器学习 领域的一场革命,进一步推动了核理论和核机器学习研究的热潮1 9 , 1 0 ,目前已被广泛应 用于模式识别、函数逼近、数据挖掘、遥感图像分析和网络安全等领域,并已逐步扩展 到工业领域【l 卜h 】。 除支持向量机外,还有基于核的主成分分析、基于核的f i s h e r 判决等等。1 9 9 8 年, s c h o l k o p f 等人对线性主成分分析( l i n e a rp r i n c i p a lc o m p o n e n ta n a l y s i s ,l p c a ) 方法进行 核化,得到了相应的核主成分分析( k e r n e lp r i n c i p a lc o m p o n e n ta n a l y s i s ,k p c a ) 方法f 1 4 】。 核主元分析通过非线性映射,将原始数据从数据空间变换到特征空间,然后在高维特征 空间中利用主元分析求出最佳投影方向,从而获得非线性特征。核主元已被证明比主元 分析在特征提取上适用性更强、效果更好【1 5 】。而f i s h e r 线性鉴别分析【1 6 , 1 7 1f :, 成为特征抽 取的最为有效的方法之一。此外,核典型相关分析( k e r n e lc a n o n i c a lc o r r e l a t i o na n a l y s i s 。 k c c a ) 是由m i k a 等人于1 9 9 9 年提出的方法,是模式识别中进行特征提取的重要技术 b t 0 另外,核方法通常采用的是单核学习,即在学习过程中使用一个核函数。近年来, 随着对核方法的深入研究,针对多数据源或异构数据集问题,s o n n e n b u r g 等人提出了多 核学习的概念f l 列。与单核学习相比,多核学习可以提高分类精度,鲁棒性更强。r a t s c h 等人则将多核学习用于生物序列数据的分类,取得了良好的效果【1 9 j 。 大连理工大学硕士学位论文 此后,研究人员相继提出了许多不同的核方法以及针对支持向量机的改进算法,使 得核理论不断地完善,应用领域不断扩大。以核方法的典型代表支持向量机为例, 它在智能建模和模型控制方面以其杰出的分类和拟合能力得到了成功的应用。 m i i l l e r 等人将支持向量机应用于时间序列预测【2 0 1 。采用两种损失函数8 不敏感损失 函数和h u b e r 鲁棒损失函数,将s v m 应用到时间序列的预测,结果显示s v m 具有极 好的性能。 g r e t t o n 采用s c h o l k o p t 提出的,- s v m 算法【2 l 】,讨论了基于s v m 拟合的黑箱系统辨 识,并对液压机器人手臂进行了动态建模。仿真结果表明该模型相比于小波网络和单隐 层s i g m o i d 神经网络有更好的建模效果,同时指出算法) , - s v m 回归相对于传统s v m 回 归的优势【2 2 】。 w a n g 对s v m 和l s s v m 回归的性能进行了比较,指出s v m 用于大量数据集拟合 时,计算时间及所占用内存巨大,无疑会限制其应用。l s s v m 由于是解线性等式,而 不是二次规划问题,所以不会存在上述问题,引入较简单的修剪算法即可解决l s s v m 的稀疏性问题。仿真实验表明带修剪的l s s v m 算法可以得出与s v m 算法极其相似的 拟合结果,但前者的计算效率远远高于后者f 2 3 1 。 s u y k e n s 和v a n d e w a l l e 利用递归结构的l s s v m 进行非线性辨识研究,指出即使在 训练数据集相对较少的情况下也可获得较好的泛化推广能力1 2 4 j 。 s a l a t 提出了一种关于高压电力传输线故障定位的混合算法,首先根据测量到的电压 和电流值,利用s v m 拟合建立故障大致位置的智能模型;再分析该位置周边的高频特 性,并与测量得到的高频范围内的频率峰值比较,得出确切的故障位置,该方法对不同 类型的故障均有较高的准确率【2 5 1 。r o j o a l v a r e z 研究了基于s v m 的a r m a 模型辨识, 分析了残差和s v m 。a r m a 算法中l a g r a n g e 乘子的解析关系,并指出通过适当选择算法 中的自由参数可以去除野值的影响,同时还将s v m 方法与经典的最小二乘方法和相关 系数法做了数学上的对比【2 6 l 。r o j o a l v a r e z 又将上述基于s v m 的线性时不变a r m a 系 统辨识方法扩展为线性信号处理的一般框架【2 7 】。 王春林等应用s v m 算法建立了大型四角切圆燃烧锅炉飞灰含碳量特性的模型,并 利用飞灰含碳量的热态实炉试验的数据对模型进行了校验,讨论了s v m 学习算法中参 数的选择,结果说明s v m 与其它建模方法相比具有泛化能力好,计算速度快等优点, 是锅炉飞灰含碳量特性建模的有效工具【2 引。李信等采用l s s v m 建立油品调合数学模 型,对模型进行仿真实验,结果表明采用l s s v m 建立的模型精确,并具有良好的泛化 性f 毙t 2 9 。 基于核方法的复杂工业过程建模研究 n a 等研究了基于s v m 建模和遗传优化的s p 1 0 0 空间反应器中的热电能量控制。 由于是实际问题,控制量和控制增量都受制于约束。其中s v m 用来预测未来的热电能 量,遗传算法用来解多目标优化问题,仿真结果表明了该算法的有效性【3 0 1 。但遗传算法 本质上也是一种基于初始种群的迭代寻优算法,当种群规模较大时不能保证解的实时 性。 刘斌等针对非线性系统,利用基于r b f 核函数的l s s v m 离线建立被控对象的模 型,并将离线模型关于当前采样点线性化,得到系统的在线输入输出线性关系,再采用 广义预测控制算法来实现对被控对象的预测控制。非线性p h 中和过程的仿真结果表明 该控制策略具有很好的效果1 3 。本方法虽然给出了控制律的解析解,但代价是采样点的 模型线性化近似处理,这需要占用一定的在线计算时间,况且如果所求出的控制量较上 一时刻有较大变化,则线性化模型失真,影响控制效果。 此外,核方法在其它领域也有许多成功的应用,例如c a m p b e l l 等人提出了一种基 于s v m 的奇异点的检测方法1 3 2 1 ,用于故障检测等。s v m 应用于网络安全的异常检测, 也取得了比较好的效果口3 1 。此外,还广泛应用于数字识别 4 】、文本分类1 3 4 1 、人脸识别p 5 , 3 6 1 和生物技术领域1 3 7 , 3 8 j 。 尽管核方法在许多领域得到很好的应用,然而在复杂过程工业中,核方法的应用却 受到很大限制,已有的一些应用其效果也没有像在商业、金融、气象、生物学等领域中 所报道的那样好。究其原因,一个很重要的因素是由于复杂过程工业的数据特点所决定 的。复杂过程工业中的历史数据具有以下几个特点: ( 1 ) 生产装置产生的数据量巨大,数据样本维数多。以炼钢工业为例,影响终点出 钢钢水质量的因素众多,而过程控制系统对过程中可实时监测的控制量实时记录和控 制,每隔几秒、十几秒就在实时数据库中产生一组数据,如何从庞大的数据中提取有用 的知识,仍是一个需要解决的难题; ( 2 ) 数据时间性强,随着时间波动。过程工业的连续生产中,由于工况的改变、操 作控制的调整、原料改变,生产数据时刻在变化,增加了机器学习的难度; ( 3 ) 过程工业数据的属性之间往往存在复杂的非线性关系以及相互耦合的现象; ( 4 ) 过程工业数据中往往存在较大噪声或者孤立点。由于原料改变、工艺改变、人 为因素、生产装置故障以及测量仪表问题使得过程工业数据中不可避免地存在孤立点, 进一步增加了数据分析的难度; 对于这类复杂工业过程的建模,首先需要对工艺有比较全面的了解,需要了解影响 质量指标的主要操作参数有哪些,另外可能因为影响质量指标的操作参数太多,建模时 只能选择其中的一部分,还要充分利用先进的机器学习理论来进行建模研究。 大连理工大学硕士学位论文 1 3 论文的主要内容及结构 本研究来源于国家高技术研究发展计划( 8 6 3 计划) 项目“转炉炼钢二级过程控制动 态模型的研究与应用”( 2 0 0 7 a a 0 4 2 1 5 8 ) 。本文是以炼钢厂转炉吹炼工业过程为背景,以 核方法为工具,从建模角度对输入变量主元提取、贝叶斯回归参数估计及其在转炉炼钢 工业中的应用进行了研究。 全文内容安排如下: 第1 章:绪论。阐述论文的研究背景、研究意义,并总结目前核方法的研究现状与 进展,并对其工业应用存在的问题进行分析。 第2 章:基于贪婪核主元提取的模糊神经网络建模方法。针对工业生产过程数据多 为多输入的高维数据,存在信息冗余的现象,本章结合贪婪思想和核方法,对输入变量 的主元进行有效提取,并采用模糊神经网络作为建模工具,以进一步提高模型精度。 第3 章:基于核方法的贝叶斯回归模型及其应用。基于大量统计样本的多元回归模 型结构简单、应用广泛,是许多复杂工业过程分析和建模的基本方法。本章分别采用增 量回归及基于核方法的贝叶斯回归模型消除随机因素的影响,其中,基于核方法的贝叶 斯模型还能对参数进行有效估计。该方法可以有效的计算补吹氧量。 第4 章:补吹氧量用于碳含量动态变化研究。本章基于第3 章补吹氧量的研究结果, 结合机理分析,建立吹炼后期碳含量动态变化指数模型。并依据炉气分析仪的高技术检 测分析结果,计算整个吹炼过程的总脱碳量。所建立的碳指数模型可以为吹炼过程中不 能被连续检测的碳含量实时变化情况做出指导。 第5 章:结论。对本文主要研究的内容以及所取得的结果进行归纳,对有待进一步 研究的问题进行讨论。 基于核方法的复杂工业过程建模研究 2 基于贪婪核主元提取的模糊神经网络建模方法 由于工业过程的复杂性( 多变量、非线性、时变等) ,基于机理方法建立模型十分困 难,大量研究集中在根据过程的历史数据采用各种非线性函数拟合的方法建立模型。在 用径向基函数( r a d i a lb a s i sf u n c t i o n ,r b f ) 棚络、误差反传( b a c kp r o p a g a t i o n ,b p ) 神经网络等智能方法建模时,往往是将其全部直接输入,建立基于输入输出数据的模型, 而未根据输入变量的特点做相应处理,数据量多信息却不足,限制了模型的精度【3 9 1 。因 此本章从简化输入变量着手,在充分挖掘其隐藏信息、去除冗余信息的基础上,建立基 于贪婪核主元的模糊神经网络模型,并将该模型应用于转炉炼钢终点预报的仿真,最后 给出本章的小结。 2 1 贪婪核主元模糊神经网络模型 由于复杂工业过程往往受到随机噪声和不可控噪声的影响,过程变量不仅互相关而 且自相关,传统的独立成分分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 、主元分析 ( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a ) 等变量提取方法不能有效地对动态多变量过程进行 特征提取。因此,本节提出基于核和贪婪算法的主元提取方法。 2 1 1基于核和贪婪算法的主元提取 核主元提取是普通主元分析p c a 方法的非线性扩展。输入训练数据的n 维空间的 某个集合( 其中z 为变量个数) : t x = x l x ,) ,x i x r 一,i = 1 , ( 2 1 ) 映射到高维特征空间f 中,其映射关系为矽:c 专f ,训练集为:= 矽( x ,) ,矽( x m , 一般矽的具体形式很难估计,为此引入核函数,将原空间的非线性问题转化成特征空间 中的内积运算问题: k ( x i ,x j ) = ( 2 2 ) 其中歹= l ,且i c j ; 表示内积。则核函数向量可以表示为: k ( x ) = 【k ( x i ,x 1 ) ,k ( x i ,x f ) r ( 2 3 ) 降维后z r m ,满足:z = a 丁k ( x ) + b ,其中a r t 侧为参数矩阵,h i m 。1 】为偏置向量。 寻找重构特征向量( x 。) 使得重构误差最小。重构误差可表示为: 大连理工大学硕士学位论文 ( a ,b ) = 愀x 。) 一万( x ;) 1 1 2 ( 2 4 ) j 司 在核主元分析的基础上,引入贪婪算法优化主元的选择。贪婪算法( g r e e d ym e t h o d , g m ) t 4 0 1 来源于贪婪思想,即:当存在可选择的机会时必须保证选择方案能够获得最大的 “利润”。它采用逐步构造最优解的思想,在问题求解的每一个阶段,都做出一个在一定 标准下为最优的决策,根据该决策求取局部最优解;并且决策一旦做出,就不可再更改。 优化手段中的遗传算法也是常用的方法之一,而贪婪算法与遗传算法相比,主要区别在 于:在交叉和变异遗传操作中,遗传算法总是将新产生的个体作为下一代,而贪婪算法 却能够确保最佳个体被遗传到下一代而不受破坏,从而加快了算法的收敛速度。贪婪算 法的基本步骤如下: ( 1 ) 首先随机选择一个可能的主元为当前的主元x ; ( 2 ) 对当前主元x 进行一次邻域搜索操作,得到新的主元x ; ( 3 ) 判断所施操作是否使得x 更接近最优解。若是,则把当前主元更新为f ; ( 4 ) 重复( 2 ) 、( 3 ) ,依次确定出所有的主元,并满足所有邻域操作均不能改变主元的 质量为止。 输入训练数据如式( 2 1 ) 所示,降维后z 酞册,满足: z = a r k s ( x ) + b ( 2 5 ) 其中4 胁叫为参数矩阵,h i 1 x 1 】为偏置向量,k s ( x ) y 寸贪婪核函数向量,可以表示为: k s ( x ) = 防( x i ,s ,) ,k ( x i ,s ,) 】 ( 2 6 ) 如是以训练集t x 的一个子集毛= 置,劫 为中心的核函数。其中,d 为子集瓦的大 小参数。 。 贪婪核主元分析以子集b ,而不是t x 为研究对象,减少了式( 2 5 ) 的复杂性。 因此,输入变量主元提取的具体步骤如下: ( 1 ) 根据矽将输入变量向高维空间映射; ( 2 ) 根据式( 2 5 ) 将高维特征空间r ”映射到低维空间r 肼; ( 3 ) 计算出最佳逼近重构向量痧( x ) 的x 。r ”满足: x 叫。= a r g m i n | l 矽( x ) 一万( x i n ) 1 1 2 ( 2 7 ) 基于核方法的复杂工业过程建模研究 核函数包括线性核函数、多项式核函数和s i g m o i d 核函数。在本文中,选用r b f 核函数,其表达形式为: k ( x , y ) :e x p ( 一鳟) ( 2 8 ) z o - 2 1 2 模糊神经网络模型 利用核思想和贪婪优化算法提取了输入变量的主元后,输入到模糊神经网络中,建 立转炉炼钢终点预报模型。此处所用的模糊神经网络模型为自适应模糊推理系统 ( a d a p t i v en e u r o f u z z yi n f e r e n c es y s t e m ,a n f i s ) h ,它等效为1 9 8 5 年t a k a g i 和s u g e n o 于提出的t 。s 模糊模型,是模糊推理系统和神经网络相结合的产物,同时具有二者的优 势:模糊推理系统能提取数据中蕴含的规则,便于处理结构化知识;神经网络则具有很 强的自适应学习功能。 经过对输入变量提取隐藏信息和减少冗余的处理后,转炉炼钢终点预报的模糊神经 网络模型变为具有3 个输入1 个输出的一阶a n f i s 系统。考虑到a n f i s 的输出一般只 有1 个,因此本文针对终点【q 、r 分别建立模糊神经网络预报模型。预报终点 c 】、r 的两个模型结构相似,均可等效为以下5 层结构,如图2 1 所示。 第1 层第2 层第3 层 第4 层第5 层 图2 1a n f i s 结构图 f i g 2 1 a r c h i t e c t u r eo f a n f i s 第1 层:信号模糊化。该层输出为: o 。0 ) = ( 而) ( 2 9 ) 大连理工大学硕士学位论文 其中,麓为节点i 的输入,( 誓) 为溉属于矿的隶属度,d 等为模糊集矿的隶属度。 第2 层:计算规则的可信度。 w2 ( 五) ( 吃) ( ) ( 2 1 0 ) 第3 层:计算可信度的归一化值。 羁= 心,m ( 2 1 1 ) 第4 层:计算每条规则的输出。 西4 ) = 羁z ( 2 1 2 ) 第5 层:计算总输出。 d f 5 = ,羁z ( 2 1 3 ) a n f i s 将模糊逻辑与神经网络有机结合,采用反向传播算法和最小二乘法的混合算 法调整规则的前件参数和后件参数,并自动生成i f - m e n 规则。对输入变量做贪婪核主元 提取后,使得a n f i s 模型的规则数大大减少,模型的预报精度也得到提高,是因为提 取主元后a n f i s 模型的输入维数变得简洁有效,很好地避免了维数灾难导致的规则爆 炸问题,a n f i s 模型的泛化能力也得到保证【4 2 1 。 2 2 仿真研究 转炉( b a l s i co x y g e nf u m a e e ,b o f ) 炼钢工业生产过程中可靠且准确的终点预报是保 证出钢钢水质量的一个重要环节。虽然智能方法已经得到了良好的应用,但输入变量维 数高、数据量大信息却不足,限制了模型精度的进一步提高。本节以该过程为研究对象, 将基于贪婪核主元模糊神经网络模型应用于转炉炼钢终点预报的建模。 2 2 1 工艺流程 在转炉炼钢过程中,氧枪向熔池表面喷吹氧气,持续发生的物理、化学反应生成炉 渣、气体等,同时释放热量,使得杂质脱除和熔池升温。由于硫、磷、硅等杂质在预处 理阶段和吹炼前期就已基本去除,转炉炼钢的主要任务是脱碳升温。该过程的原料包括: 主原料( 铁水和废钢) 和辅原料( 氧气、矿石、石灰、白云石等) ,其产品为温度和成分( 主 要指熔池碳含量) 要求合格的钢水。在吹炼之前,由静态模型对整个炼钢过程需要的氧 气量做出预算,吹炼进行到该值的8 5 左右时停吹,进行第一次副枪检测,然后将检测 基于核方法的复杂工业过程建模研究 到的【q 、丁与本炉的冶炼目标值相比较,确定出本炉需要的补吹氧气量和补加冷却剂量, 继续吹炼,直至得到合格的钢水f 4 3 1 。图2 2 为转炉设备示意图。 钢 图2 2 转炉设备示意图 f i g 2 2 g e n e r a lv i e wo fb o f 气 氧枪 氧气流 炉渣 转炉冶炼过程中自上一炉的出钢、倒渣完成到本炉的出钢、倒渣为止称为一个冶炼 周期,其过程包括装料、吹炼、终点控制、出钢、溅渣护炉和倒渣几个阶段。一般而言, 氧气转炉炼钢的冶炼周期为3 0 m i n 左右,其中吹氧时间通常为1 2 1 8 m i n 。 根据熔池成分和温度的变化规律,氧气转炉炼钢的吹炼过程大致分为三期: ( 1 ) 硅锰氧化期( 吹炼前期) ,该期间熔池硅、锰元素的氧化迅速,同时碳元素也被 氧化,熔池升温速度很快,约占吹炼过程的1 4 1 3 左右: ( 2 ) 碳氧化期( 吹炼中期) ,当硅锰氧化基本结束后,随着熔池温度升高,碳的氧化 速度得以提高,同时伴随锰的还原现象,该时期钢水升温速度趋于缓慢; ( 3 ) 碳氧化末期( 吹炼末期) ,当碳含量 o 1 5 之后,脱碳速度又趋于下降,同时铁 的氧化更强烈,并出现锰的二次氧化,该时期熔池升温速度又明显加快。 转炉炼钢的主要原料是铁水和废钢,铁水的物理热与化学热是氧气顶吹转炉炼钢的 基本热源。铁水一般占转炉装入量的7 0 1 0 0 ,废钢是冷却效果稳定的冷却剂,通常 占装入量的3 0 以下。适当地增加废钢比,可以降低转炉钢消耗和成本。在供氧的同时 加入大部分渣料,在开吹后再加入一部分渣料,终点控制时根据具体情况确定是否再加 入渣料。终点前提起氧枪,降下副枪对钢水温度和含碳量进行测量,根据副枪测得的信 息确定补吹氧气量和再加冷却剂的量以达到终点目标。在炼钢过程中,转炉过程控制模 大连理工大学硕士学位论文 型根据铁水状况来确定主辅原料的加入量、氧枪的初始高度以及复吹供气模式等,完成 转炉生产过程的控制和模型的自学习。转炉炼钢的工艺流程如下图2 3 所示: 铁水、废钢 石灰等辅料 第一次副枪测量 v 第一次吹炼补吹 二次吹娲 - 主吹 生产时间 图2 3 转炉炼钢工艺流程 f i g 2 3 b o fs t e e lm a k i n gp r o c e s sf l o w c h a r t 在铁水、废钢和一定的造渣剂放入转炉后,吹炼过程从氧气的吹入开始。在吹氧中 途可以选择补加造渣剂也可以选择在吹氧前一次性加入。在第一次吹氧结束后降下副枪 测量钢水中碳含量和钢水温度,如果钢水合格则可出钢,如果不合格则根据测得的钢水 信息补吹氧气和补加冷却剂,直到得到合格钢水为止。 吹炼过程到达终点的标志是:( 1 ) 钢中碳含量达到所炼钢种的控制范围;( 2 ) 钢中p 、 s 含量低于规格下限以下的一定范围;( 3 ) 出钢温度能保证顺利进行精炼、浇铸;( 4 ) 对 于沸腾钢,钢水应有一定的氧化性。出钢时机的选择主要是根据钢水碳含量和温度。所 以,转炉炼钢过程最根本的控制就是对终点温度和终点碳含量的控制。 2 2 2 算法应用 考虑到预报模型的输入数据如铁皮、石灰砜、混料l 、矿石阢和白云石 甄v 等变量中零元素很多,而补吹氧量圪、副枪检测时钢水的碳含量【c 钉和温度乃等数 据中不含零元素,数据呈现一定的分布特性,结合数据此特点,首先利用核函数,将输 入数据7 个输入变量向高维特征空间映射,以核函数内积形式运算,充分挖掘圪、 c f 】 或乃等数据的隐藏信息;然后采用贪婪算法优化,去除圪、 c f 】或乃扩维后和、巩h 、 砜l 、贩。、甄v 等变量的冗余量,最后将主元输入模糊神经网络a n f i s ,实现对转炉炼 钢终点 c 1 、r 的预报。采用贪婪核主元分析自适应模糊推理系统( g r e e d yk e r n e lp r i n c i p a l c o m p o n e n t sa n a l y s i s a n f i s ,g k p c a a n f i s ) 来建立转炉终点预报模型,其流程如图 2 4 所示。 基于核方法的复杂工业过程建模研究 图2 4g k p c a - a n f i s 流程图 f i g 2 4g k p c a - a n f i sf l o wc h a r t 由于生产中某些炉次并不需要补加冷却剂和造渣剂,这些数据多余且对转炉生产过 程的分析与建模造成干扰,故对其进行简化来实现降维是非常必要的。 2 2 3 仿真结果 对某钢厂1 8 0 吨转炉的6 0 炉实际测量数据进行实验研究洋】,取前5 0 炉用于 g k p c a a n f i s 预报模型的训练,后1 0 炉用于测试。网络训练时,先进行归一化,消 除数据因量纲不同而造成的淹灭,主元个数选定为3 ,r b f 核宽度为0 0 5 ,模糊语言值 个数均为3 ,误差准则为0 ,训练后预报模型的节点数为3 8 ,总规则数为5 条。图2 5 、 图2 6 分别为采用g k p c a a n f i s 预报钢水终点 q 、f 的仿真结果图。 将本章提出的g k p c a a n f i s 预报模型分别与目前研究最多的r b f 、a n f i s 预报 模型对比,其预报结果的误差指标如表2 1 所示。a n f i s 模型改进前后模型结构与预报 精度对比如表2 2 所示。 仿真发现,当采用r b f 网络对转炉炼钢终点温度进行预报时,其温度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年新能源工业互联网在新能源行业智能检测与故障诊断中的应用前景报告
- 烟囱建设项目施工方案与安全措施
- 2025年新能源行业绿色制造工艺标准与绿色金融支持报告
- 城际河堤加固施工施工方案
- 物流企业运输合同及风险管理
- 2025年交通运输行业人才需求与行业发展趋势研究报告
- 新能源安全管理2025年技术创新与政策导向报告
- 农业节水灌溉工程承包合同
- 小学数学思维培养活动方案设计
- 人工草皮购销协议
- 2025房屋买卖合同范本(下载)
- 融合教育课件
- 2025年常州市中考英语试卷(含标准答案及解析)
- 南昌教师考试题目及答案
- 公安财务培训课件
- 2个商铺租赁合同范本
- 2025年贵州事业单位护理专业知识试题和答案
- 2025年秋期新教科版6年级上册小学科学教学计划+进度表
- 2025至2030中国仓库货架行业项目调研及市场前景预测评估报告
- 静脉留置针敷贴护理
- 海运销售入门培训
评论
0/150
提交评论