(农业电气化与自动化专业论文)基于fcm与lssvm的生物发酵过程软测量建模方法研究.pdf_第1页
(农业电气化与自动化专业论文)基于fcm与lssvm的生物发酵过程软测量建模方法研究.pdf_第2页
(农业电气化与自动化专业论文)基于fcm与lssvm的生物发酵过程软测量建模方法研究.pdf_第3页
(农业电气化与自动化专业论文)基于fcm与lssvm的生物发酵过程软测量建模方法研究.pdf_第4页
(农业电气化与自动化专业论文)基于fcm与lssvm的生物发酵过程软测量建模方法研究.pdf_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

独创性声明 删删 y 18 9 4 5 “8 “6 ” 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究 工作所取得的成果。除文中己注明引用的内容以外,本论文不包含任何其他个人 或集体已经发表或撰写过的作品成果,也不包含为获得江苏大学或其他教育机构 的学位或证书而使用过的材料。对本文的研究做出重要贡献的个人和集体,均己 在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。 学位论文作者签名: 彳可鱼 2 。f | 年f 月胛 学位论文版权使用授权书 江苏大学、中国科学技术信息研究所、国家图书馆、中国学术期刊( 光盘版) 电子杂志社有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、 缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致, 允许论文被查阅和借阅,同时授权中国科学技术信息研究所将本论文编入中国 学位论文全文数据库并向社会提供查询,授权中国学术期刊( 光盘版) 电子杂 志社将本论文编入中国优秀博硕士学位论文全文数据库并向社会提供查询。 论文的公布( 包括刊登) 授权江苏大学研究生处办理。 本学位论文属于不保密口 指导撕签名:孙t b 川1 年月加眵 月 j 男“ z婆年 1沮飞 一乙 名签者作文沦位学 江苏大学硕士学位论文 摘要 目前,微生物发酵工业基本采用手动操作和经验控制,效率及可靠性都比较 低,发酵过程的自动化程度也不高。发酵过程中的在线检测对象,多数集中在一 些物理化学参数诸如温度、压力、p h 值、流量等等,而发酵过程关键生物参数 如菌丝浓度,产物浓度等,则受工艺技术水平限制只能采用离线测量的方法,无 法满足发酵过程实时控制的需求。这使得对整个发酵过程进行最优控制变得十分 的困难,软测量技术正是解决此问题的有效途径之一。 本文以青霉素发酵过程为研究对象,在软测量理论的基础上,采用模糊c 均值聚类( f c m ) 与最d , - - 乘支持向量机( l s s v m ) 相结合的方法建立软测量模型, 并对菌丝浓度、产物浓度这两个重要生物参数进行预测,同时实现了其工程实用 化软件的开发。仿真结果表明,本文所建立的模型能够更加有效、快速地逼近真 实值,预测精度较高。本文所做的具体研究如下: ? 7 ,: 。i l :在大量阅读文献以及对微生物发酵机理进行分析的基础上,论文采用了 模糊c 均值聚类算法进行分类,并考虑到将多个模型结合起来能够提高模型的 预测精度,分类后的多个子模型再分别采用最小二乘支持向量机进行建模。 2 为了去除模型变量问的冗余信息、减小相关性并且降低模型的复杂度。 建模前,利用主元分析法对样本数据进行预处理。 3 根据程序模块化的思想,实现了基于f c m 与l s s v m 的青霉素发酵过 程软测量工程化软件设计。应用v c + + 建立用户界面,并调用m a t l a b 实现软 测量算法,选用a c c e s s 作为后台数据库,进行了总体设计和详细设计,实现 了各个子模块的具体功能。 关键词:模糊c 一均值,最d - - - - 乘支持向量机,软测量,主元分析,v c 十+ ,m a t l a b 江苏大学硕士学位论文 a b s t r a c t a tp r e s e n t ,m a n u a lo p e r a t i o na n de x p e r i e n c ec o n t r o la r en o r m a l l ya d o p t e di nt h e t r a d i t i o n a lf e r m e n t a t i o ni n d u s t r y , b u tt h ee f f i c i e n c ya n dr e l i a b i l i t yo ft h ef e r m e n t a t i o n a r er e l a t i v e l yl o w a d d i t i o n a l l yt h ea u t o m a t i o no ff e r m e n t a t i o np r o c e s si sn o th i 曲 f o ro n l i n ed e t e c t i o no b j e c t si nt h ef e r m e n t a t i o np r o c e s s ,m o s to ft h eo b j e c t sf o c u so n t h ep h y s i c a la n dc h e m i c a lp a r a m e t e r ss u c ha st e m p e r a t u r e ,p hv a l u e ,p r e s s u r e ,f l o w b u ti nt h ef e r m e n t a t i o np r o c e s s ,s u c ha st h ep e n i c i l l i nf e r m e n t a t i o np r o c e s s ,t h em o r e c o m p l e xv a r i a b l e sa r el i m i t e dt ot e c h n o l o g yw h i c hc a no n l yb ed e t e r m i n e db yo f f - l i n e l a b o r a t o r ya n a l y s i s ,a n dc a n tm e e tt h en e e d so fr e a l - t i m ec o n t r o ls y s t e m t h i si sa l s o t h er e a s o nw h yi tb e c o m e sv e r yd i f f i c u l tt om a k et h ew h o l ef e r m e n t a t i o np r o c e s st o o p t i m i z ec o n t r 0 1 a n ds o f t s e n s o rt e c h n i q u ei so n eo ft h em o s te f f e c t i v em e t h o d st o s o l v et h i sp r o b l e m t h i sa r t i c l et a k ep e n i c i l l i nf e r m e n t a t i o np r o c e s sa sr e s e a r c ho b j e c t a n das o f t s e n s o rm o d e l i n gf o r t h ep e n i c i l l i nf e r m e n t a t i o nb a s e do n f u z z yc - m e a n s ( f c m ) c l u s t e r i n ga n dl e a s ts q u a r es u p p o r tv e c t o rm a c h i n e ( l s s v m ) i sp r o p o s e d a n di ti s u s e df o r p r e d i c t i n gt h et w oi m p o r t a n tv a r i a b l e s ( c e l lc o n c e n t r a t i o n ,p r o d u c t i o n c o n c e n t r a t i o n ) m e a n w h i l et h ed e s i g na n di m p l e m e n t a t i o no ft h es o f t w a r eo f s o f t - m e a s u r i n gm e t h o di se x p l a i n e d t h es i m u l a t i o ne x a m p l es h o w st h a tt h es o f t m e a s u r e m e n tp r o p o s e di nt h ep a p e r , c a na p p r o a c ht h ee x p e c t e dr e s u l te f f e c t i v e l y , a n d c a na l s oe n h a n c et h ep r e d i c t i o np r e c i s i o n t h ec o n c r e t ew o r ki sa sf o l l o w i n g 1 o nt h eb a s i so fr e a d i n gl i t e r a t u r e sa n da n a l y z i n gt h em e c h a n i s mo fm i c r o b i a l f e r m e n m t i o n ,c o n s i d e r i n g t h a tt h e f o r e c a s t i n gp r e c i s i o n c a nb e i m p r o v e db y c o m b i n i n gm u l t i p l em o d e l st o g e t h e r n i sp a p e rp r o v i d e sam e t h o do fu s i n gt h ef u z z y c - m e a n sc l u s t e r i n ga l g o r i t h mf o rc l a s s i f y i n g ,t h e nl s - s v mi su s e dt oc o n s t r u c t m o d e l sb a s e do ne a c hc l u s t e r 2 b e f o r et h ea p p l i c a t i o no ff c m ,w es h o u l du s ep r i n c i p a lc o m p o n e n ta n a l y s i s m e t h o dt o p r e p r o c e s st h es a m p l ed a t a ,w h i c hc a ne f f e c t i v e l yr e m o v er e d u n d a n t i n f o r m a t i o na m o n gt h ev a r i a b l e s ,r e d u c et h ed i m e n s i o n so ft h eo n l i n em e a s u r a b l e p a r a m e t e r s ,a n di tc a na l s or e d u c et h er e l e v a n c ea n dc o m p l e x i t yo ft h em o d e l 3 t h es o f t w a r eo fs o f ts e n s o rm o d e l i n go ft h ep e n i c i l l i nf e r m e n t a t i o nb a s e do n f c mc l u s t e r i n ga n dl s - s v mi sp r o g r a m m e db a s e do nt h em o d u l a r i z a t i o nt h e o r y u s e ri n t e r f a c ei sc r e a t e db yv c + + ,w h i c hc a l l st h em a t l a bs o f t m e a s u r i n g a l g o r i t h m a n dt h ed a t a b a s ei ss u p p o r t e db ya c c e s s t h es o f t w a r ei sc a r r i e do u tb ya g e n e r a ld e s i g n ,a n dt h es p e c i f i cf u n c t i o no fe a c hs u b - m o d u l ei si m p l e m e n t e d k e yw o r d s :f u z z yc m e a n sc l u s t e r i n g ,l s s v m ,s o f ts e n s o r ,p r i n c i p l ec o m p o n e n t a n a l y s i s ,v c + + ,m a t l a b l l 江苏大学硕士学位论文 目录 第一章绪论1 1 1 研究背景和意义一l 1 2 国内外发展现状2 1 3 软测量技术的原理4 1 4 本文研究内容及安排一7 第二章模糊c 一均值聚类算法9 2 1 弓l + 言9 2 2 模糊聚类方法的基础9 2 2 1 模糊聚类的定义9 2 2 2 模糊聚类的分类9 2 3 模糊c 一均值算法原理11 2 3 1 硬c 均值聚类算法1l 2 3 2 模糊c 均值聚类算法1 2 2 3 3 模糊c 均值聚类算法有效性研究1 3 2 3 4 模糊c 均值算法存在的问题1 4 2 4 改进模糊c 均值聚类算法1 4 2 4 1 类别数的调整。1 4 2 4 2 初始聚类中心的选取15 2 4 3 类核代替类心一16 2 4 4 隶属度的修j 下17 2 5 小结1 7 第三章l s s v m 回归建模原理1 9 3 1 引言1 9 3 2 统计学习理论19 3 2 1 经验风险最小化原则( e i t m 原则) 2 0 3 2 2v c ( v a p n i kc h e r v o n e n k i s ) 维21 3 2 3 推广性的界2 2 3 2 4 结构风险最小化准则2 2 3 3l s s v m 回归建模原理2 3 3 3 1 支持向量机回归概述一2 3 3 3 2l s s v m 原理2 6 3 4 仿真研究2 9 1 1 1 江苏大学硕士学位论文 3 5 小结31 第四章基于f c m 与l s s v m 的软测量建模方法在青霉素发酵过程中的应用 :;:1 4 1 引言3 2 4 2 青霉素发酵过程3 2 4 2 1 青霉素简介3 2 4 2 2 青霉素发酵过程3 2 4 3 基于f c m 与l s s v m 的青霉素软测量建模研究3 4 4 3 1 青霉素发酵数据的预处理3 4 4 3 2 青霉素发酵过程软测量辅助变量的选择一3 6 4 3 3 基于f c m 的l s s v m 建模算法4 0 4 3 4 仿真研究一4 2 4 4 j 、结4 6 第五章青霉素发酵过程软测量工程化软件设计4 7 5 1 软件开发工具与总体结构的设计4 7 5 1 1 软件开发工具4 7 5 1 2 系统总体结构的设计4 8 5 2 数据采集与处理5 0 5 2 1 上下位机的通讯5 0 5 2 2 数据采集与测定5 1 5 2 3 数据库访问技术与设计5 2 5 3 软件功能模块5 4 5 3 1 数据预处理模块5 5 5 3 2 模糊c 均值分类模块5 6 5 3 3 最小二乘支持向量机计算模块一5 6 5 3 4 预报输出模块5 6 5 3 5 其它功能模块5 7 5 4 小结5 7 第六章结论和展望5 8 6 1 工作总结5 8 6 2 展望5 9 参考文献6 0 致谢6 4 攻读硕士期间发表论文6 5 l v 江苏大学硕士学位论文 1 1 研究背景和意义 第一章绪论 目前,在传统的微生物发酵工业】中,为保证产品的产量和质量,需要对一些关键的 过程变量进行实时的监督和控制。但是,在实际的工业生产过程中,由于受到传感技术以 及工艺水平的限制,对于比较复杂的过程变量比如产物浓度、菌丝浓度等,一般只能采取 离线分析测量或者在线分析仪表这两种方法。离线分析测量方法,即在发酵过程中,每隔 一段时间采样一次数据并送化验室分析处理,这种方法的优点是:耗费的成本相对较低, 但缺点是离线分析通常会滞后一段时间,难以满足实时控制这一生产要求。在线分析仪表 目前普遍存在的问题是成本高、维护相对困难、分析周期长、精度低,难以做到准确地提 供质量信息作为实时控制的反馈信号。这两种方法远远无法满足微生物发酵过程系统实时 控制的需求。 加强微生物发酵过程的监督和控制是提高发酵经济效益最直接的办法。利用计算机技 术、现代控制理论、现代测量技术、生物化工理论相结合来解决发酵过程中优化控制、发 酵过程中测量以及辅助操作等问题,对于提高我国发酵工业水平及经济效益有着重要的意 义。 随着近年来计算机技术的发展,将计算机用于发酵过程对发酵过程进行控制和信息管 理,有利于发挥软件系统和硬件系统的优势,从而对发酵过程进行准确的监督和控制。显 然,发酵过程是一非线性的时变系统,参数相关很严重。利用计算机对其进行实时控制, 对一些技术水平成熟的能够在线测量的物理参数、化学参数进行采集分析并优化,指导发 酵操作,这将进一步的提高发酵工业经济效益,同时也降低了手动操作和经验控制带来的 风险。在此基础上研究人员提出了软测量技术【2 j ,基于7 0 年代b r o s i l l o w 提出的推断控制 思想【3 】,将工艺机理和控制理论有机的结合了起来,可以对那些可测或者难以检测的参数 进行连续计算,这在一定程度上可以取代在线分析仪表,提高产量和产品质量。 软测量模型是软测量技术的核心。它区别于一般意义下的数学模型,强调通过二次变 量来对主导变量进行最佳估计。常用的软测量建模方法有:机理建模、统计建模、混合建 模。而常用的统计建模方法有:状态估计、线性回归、神经网络、模糊技术、支持向量机 回归。这几种方法各有优势,各有缺点,本文主要采用基于数据驱动的建模方法来建立软 江苏大学硕士学位论文 测量模型。 考虑到将多个模型结合起来能够提高模型的预测精度而提出的多模型软测量思想,其 子模型是在不同的工作点范围内分别建立的,根据可测扰动点的分类结果来确定具体该选 哪个模型作为最终的软测量模型。文献1 4 1 中的子模型是基于黑箱的r b f 神经网络模型,用 模糊聚类后的隶属度将各个子模型进行加权求和而获得统一的软测量模型。本文提出用模 糊c 均值聚类算法进行分类,分类后的多个模型再采用最d , - - 乘支持向量机【5 】方法进行建 模。 1 2 国内外发展现状 自上世纪7 0 年代开始,国外就对发酵过程的动力学模型以及优化控制做了大量的研 究工作,并且从1 9 7 9 年开始就每隔三年进行一次计算机应用于发酵工程的世界型大会。 而国内由于起步比较晚,技术相对落后,直到1 9 8 9 年才成立了微生物学会生化过程模型 化和控制专业委员会,每隔三年召开一次大会1 6 】。近年来,采用软测量技术分析研究微生 物发酵过程中关键变量的在线预测估计已经取得了一定进展,主要研究成果包括:基于机 理分析、基于回归分析、基于人工神经网络、基于模糊系统和基于支持向量机的方法。 1 基于机理分析方法 在全面了解过程的反应机理后,就能写出有关平衡方程式,并且确定不可测主导变量 和可测二次变量之间的数学关系,从而建立估计主导变量的机理模型。但是机理模型建模 要求研究者对具体对象有着深入的了解,能够全面把握实际过程中所牵涉到的基本规律: 热力学中的状态方程、物理化学中的反应动力学、相平衡、物料平衡、能量平衡,以及聚 合反应过程、高分子化学等诸多交叉学科方面的知识。 虽然机理建模在很多方面取得了成功,如s a r k a r 和g u p t a 7 , s 】建立了丙烯聚合搅拌釜反 应器( c s t r ) 模型等等。但是,基于质能平衡方程和m o n o d 型方程建立的“白箱 模型, 在发酵过程中微生物菌体生长反应理论处理上大为简化,因此,基于机理分析建立的模型 不能真实反映微生物生长的实际过程,而且移植能力差。且出于细胞生化学理论的局限, 研究者对微生物发酵过程在一定程度上还是缺乏足够的了解,现阶段做不到对每个菌体的 发酵过程进行精确的机理建模,也就是出于这个原因,基于机理建模的分析方法在微生物 发酵软测量模型在工业应用中甚少。 2 基于回归分析方法 线性回归假设自变量x 和因变量】,具有如下线性关系: 2 江苏大学硕士学位论文 y = a x + e ( 1 1 ) 式中,e 为模型误差,a 为回归系数。在实际工业过程中,x 通常为易测量的过程变 量,】,为质量变量的实际测量值。对于方程( 1 1 ) ,可采用普通最小二乘法( o l s ) 求解,从而 得到回归系数彳: a = 。x ) 叫x 。y( 1 2 ) 但是在实际工业生产中,x 之问往往有一定的相关性,即矩阵x 不满秩,因此采用普 通最小二乘法求解方程( 1 1 ) 将会出现病态解。所得到的模型对样本数据也比较敏感,这就 是所谓的共线性问题。 主元回归就是为了解决共线性问题而产生的,它通过建立输入变量之问的线性组合从 而达到减少变量个数。但是采用主元分析( p c a ) 在选取主元时,没有考虑到自变量主元因 变量之问的解释作用,删除的次要主元可能包含有对回归有益的信息,同时保留的主元中 很可能会夹杂进一些影响结果的噪声,因此,提出了偏最小二乘回归( p l s ,p a r t i a ll e a s t s q u a r e s ) 。它不是孤立的选取x 的主元或者】,的主元,而是同时对x 和】,的主元进行线性 回归,并且在选取主元时尽量使他们的协方差尽可能的大,因此建立的模型具有更好的预 测性。 p l s 回归方法能够有效地解决共线性问题,比较适合用于过程变量较多而且耦合严重 的工业过程建模,因此,在监控和故障诊断以及过程建模等领域得到了广泛的应用。 在非线性系统建模中,线性回归模型无法充分描述过程的非线性特性,而且由于其对 测量误差十分敏感等缺点,基于回归分析的软测量建模方法难以得到广泛的应用。 3 基于人工神经网络方法 人工神经网络方法近年来得到迅速发展。从二十世纪8 0 年代以来,研究者提出了各 种不同类型的神经网络结构及其学习算法,其中在建模和控制中用的比较多的是:多层感 知器( m l p ) 、径向基函数网络( r b f ) 、b 样条神经网络和h o p f i e l d 神经网络等等。在学习算 法的研究中,r u m e l h a r t 和m c c l e l a n d l 9 1 提出的反向传播( b p ) 算法掀起了8 0 年代人工神经网 络的研究高潮。在b p 算法的基础上,众多研究者纷纷提出了各种改进的算法来提高训练 效率。1 9 8 9 年,c y b e n k 0 1 1 0 1 、h o m i k 等分别证明了:具有一个隐层的多层前向神经网络能 够以任意精度逼近在紧致集上的任意连续的实函数。目前神经网络已成功地应用于复杂工 业过程的动态建模、故障诊断以及系统辨识和控制等方面。 但是,神经网络建模也有其局限性,普遍存在如下问题:模型存在过拟合、推广能力 差;如何确定隐层及节点数目通常依靠经验;容易陷入局部极小点,不能保证全局最优等 江苏大学硕士学位论文 等。 4 基于支持向量机的方法 支持向量机( s u p p o r tv e c t o rm a c h i n e s ,s v m ) 为一种针对小样本学习问题的通用学习算 法,能够从理论上克服人工神经网络的缺陷。s v m 根据有限样本信息,在模型的学习能力 和复杂性之间寻求平衡,实现置信范围和经验风险的最小化。与神经网络相比,支持向量 机能够很好的解决以往困扰很多学习方法的小样本过学习、局部最优、高维数等实际难题, 同时具有很强的泛化能力,为解决软测量建模问题提供了一个有效的解决途径。针对工业 生产过程,可采用支持向量机来估计一些不可测变量,由此来代替价格昂贵且效果不尽人 意的在线分析仪表,实现软测量建模。本文将在第三章详细介绍支持向量机算法。 1 3 软测量技术的原理 早期的软测量技术主要应用于控制变量与扰动不可测的场合,其目的是实现工业过程 的复杂控制,从而采用的软测量模型也是和控制系统模型相对应的线性模型或机理模型。 随着测量技术的发展,为了满足对数据的精度要求,软测量研究也逐步向“黑箱”模型的 方向发展。 软测量技术的工作原理如图1 1 所示,u 为控制输入,d l 为可测输入扰动,d 2 为不可 测输入扰动,x 为辅助变量,】,为主导变量,】,为模型输出值,】,表示主导变量离线分 析值。 图1 1 软测量工作原理 软测量的基本思想就是根据某种最优准则,选择一组与主导变量有密切关系并且又容 易测量的变量,通过构造它们之间的数学关系,来估计主导变量。用数学关系可以表达成: y f ( u ,d l ,x ,】,+ ,f ) ( 1 3 ) 4 江苏大学硕士学位论文 式( 1 3 ) 反映了主导变量】,和一般意义输入的关系,同时还反映了】,与辅助变量x 的关 系,且离线分析值y 7 常被用于软测量模型的校正。 在应用过程中,软测量模型的参数、结构并不是一成不变的,随时间的迁移工况和操 作点可能发生改变,这就需要对它进行在线或者离线的修正,使之得到更合适当前状况的 软测量模型,提高模型的适用度。图1 2 为软测量的结构图j ,用以说明在软测量中各模 块之间的关系。 历史数据 初始模型 崮菱州燃忻 在线校正模型 石聂r 历史数据u 图1 2 软测量的结构图 建立软测量仪表的步骤包括:辅助变量的选择;数据的采集;数据的预处理;软测量 模型的建立及软测量模型的在线校正。在这几个步骤中,软测量的建模是该技术的核心部 分。 1 辅助变量的选择 辅助变量的选择能确定软测量的输入信息矩阵,因而直接确定了模型的结构和输出, 对软测量的结果至为关键。其中辅助变量的选择包括变量类型的选择、数量的选择以及检 测点位置的选择。 对辅助变量的选择,一般是首先了解和熟悉软测量对象及整个装置的工艺流程。根据 工艺机理的分析,选择所有影响主导变量的初始辅助变量。再根据变量的灵敏性、特异性、 工程适用性、精确性和鲁棒性的原则选择最终的辅助变量。辅助变量个数的下限是主导变 量的数量,而最佳的个数则与过程的自由度和测量噪声以及模型的不确定性有关。总之, 变量数确定的原则以精简性为原则【1 2 】。这种采用机理分析来选择辅助变量的方法,可以使 软测量的设计更为合理。但是如果软测量对象的工艺过于复杂或者缺乏机理知识,则可采 用主元分析、核主元分析、或者回归分析的方法找出影响主导变量的主要因素。 2 数据采集和预处理 气 江苏大学硕士学位论文 在选定了辅助变量的基础上,如何采集过程数据也是一个非常重要的问题,因为数据 的正确性和可靠性直接关系到软测量模型的输入精度。在软测量建模所用的数据当中,主 要是针对辅助变量的实时测量值进行数据预处理,对主导变量的分析值一般不进行处理。 数据的采集主要是指建模所需要的训练样本数据的采集。在对数据进行采集时,要做 到使采集的样本空间尽可能的覆盖整个操作范围,同时也要本着有代表性、均匀性以及精 简性的原则进行选取【1 3 l 。其中均匀性和代表性,是指采集的数据不仅要覆盖整个操作范围, 并且从每个特征点选取的样本个数都要均匀,且采集的每一个数据在样本空间中要有一定 的代表性。精简性是指选取的样本数量不能过于庞大,只要满足模型训练效果就行,这样 做的优点是:防止网络结构过于复杂、学习困难、模型泛化性能过差。 在实际的工业生产过程中,数据一般是通过现场测量仪表获得的,但是由于受到仪表 的精度及现场测量环境和测量方法等人为因素的影响,不可避免会带来各种各样的误差, 从而会影响过程建模效果和控制品质,因此对原始数据进行预处理,剔除误差数据是极其 必要的。 测量误差一般分为两大类:随机误差和过失误差4 1 。随机误差是指受不可避免的随机 因素的影响产生的,譬如操作过程中微小的波动或检测信号的噪声等等。随机误差是不可 避免的,但是它有一定的统计规律,正是因为它的规律性,可以通过数字滤波等方法去除。 近年来利用冗余对测量数据进行随机误差处理去除,使之满足约束关系的数据协调方法, 也得到了广泛的发展。其基本思想是:根据物料平衡方程建立起来的数学模型,以估计值 和测量值的方法最小为优化目标,然后构造一个估计模型,这样就为测量数据提供一个最 优估计,目的足为了及时准确地检测误差的存在,从而剔除或补偿其带来的影响。过失误 差通常是因为以下三神情况产生的:人为因素、不完全或者不正确的过程模型、测量的系 统偏差。过失误差使得测量的数据严重的失真,也就使得测量值和真实值之问存在着显著 的差异。常用的处理方法有:硬件冗余法、理论分析法、统计效验法。硬件冗余是借助于 不同的测量精度的手段对一个过程变量进行反复测量,然后进行比较、判断,这种方法的 缺点是在变量很多的情况下,可操作性太差,因此不适合推广使用。理论分析法是对可能 导致过失误差的因素进行理论分析,但是在分析过程中,容易遗漏一些造成过失误差的潜 在因素,因此不易推广使用。统计效验法是利用所得数据的统计特性进行检验,因为这种 方法对硬件设备没有过多要求,方法具有普遍性,因此得到了广泛的应用【l5 1 。 在完成了对采集的数据进行误差处理之后,一般还需要对数据进行标准化处理,即同 时对处理后的数据进行中心化处理和无量纲处理。这么做的原因是:工业过程中的测量数 6 江苏大学硕士学位论文 据通常都有着不同的单位,变量之间数据的数量级一般都不同,如果直接使用这些数掘进 行计算,通常不能反映数据本身的变化情况,很有可能引起算法的数值不稳定性问题。 3 软测量模型的建立 软测量模型的建立是软测量技术的核心部分,是研究者在深入了解过程机理的基础 上,利用建模以及辨识的方法得到适用于估计的模型。它区别于一般意义下的数学模型, 主要强调的是通过辅助变量来得到对主导变量的最佳估计。 4 软测量模型在线校正 考虑到生化生产过程的复杂性,一般难以建立精确的数学模型来描述实际工业过程, 但是工业过程软测量模型通常只能大致的反映实际过程的变化趋势,因此模型必然存在误 差。此外,在模型投入运行后,随着时问的推移,由于系统存在时变性、不确定性和非线 性的特点,测量对象的特性和工作点通常都会发生变化,这样就会进一步的使模型误差增 大。因此良好的在线校正技术是解决这类问题的保证。 软测量模型在线校正一般分为模型输出校正和模型参数校正。模型输出校正是通过模 型的估计值与实际对象主导变量分析值之问的偏差来修正软测量模型目前的估计值。这种 技术相对比较简单,但是只适用于工况变化不大的情况。模型参数校正就是在线的校正软 测量模型的参数,即随着时问的推移,根据样本不断修正模型参数【1 6 1 。其中对软测量模型 的校正有两种思想:短期学习和长期学习。短期学习是以离线分析值和模型输出的值之差 为动力,在不改变模型的结构的前提下,根据新得到的数据对模型中的关系数进行在线更 新;而长期学习是指在原料、工况发生较大变化的情况下,利用新采集的较多数据重新建 立模型。 1 4 本文研究内容及安排 微生物反应过程的内在机理十分复杂,具有高度的非线性、时变性和迟滞性。在实际 的工业生产过程中,由于受到传感技术以及工艺的限制,一些关键的生物参数难以实现在 线测量,而这些关键生物参数正是实现优化控制必不可少的条件。采用软测量方法测量微 生物发酵过程中的生物参数是一种较为有效的方法。本文主要研究微生物发酵过程中关键 生物参数的在线软测量方法,并针对青霉素发酵过程进行建模研究,最后开发了其工程实 用化软件。全文共分为六章: 第一章:绪论。阐明了研究的背景和意义,并概述了微生物发酵过程软测量方法的国 内外研究现状与软测量技术的原理。 7 江苏大学硕士学位论文 第二章:模糊c 均值聚类。本章主要介绍了该方法的理论基础。研究了模糊c 均值聚 类算法有效性及其存在的问题,并提出了改进方法。 第三章:最小二乘支持向量机建模。本章简单介绍了统计学习理论,并分析了最d - - 乘支持向量机模型参数对模型精度的影响,研究了网格搜索和交叉验证相结合的最d , - - 乘 支持向量机软测量模型的参数优化方法。最后与标准支持向量机软测量模型通过仿真进行 对比研究。 笫四章:基于f c m 与l s s v m 的软测量建模方法在青霉素发酵过程中的应用。将此 方法应用于青霉素发酵过程中,并对发酵过程中关键生物参数进行了预测,最后通过仿真 进行分析和比较。 第五章:青霉素发酵过程软测量工程化软件设计。本章主要是介绍了青霉素软测量系 统软件的设计思路、结构和功能。并建立用户界面,调用m a t l a b 实现本文提出的算法, 后台数据库选用a c c e s s ,实现了各个子模块的具体功能。 第六章:总结与展望。对本文进行总结,并对今后的工作进行了展望。 江苏大学硕士学位论文 2 1 引言 第二章模糊c 一均值聚类算法 数值聚类的问题是许多分类和系统建模问题的基础。它是从大量的数据中抽取固有的 特征,来获得系统行为的问接表示。通过聚类的方法能够将数据在不知道具体分类属性的 情况下,自动将其分成有限个簇。分类原则是尽量使得簇内相似性程度高,簇问相似性尽 可能低【1 7 1 ,从而简明地表示系统行为。 模糊c 一均值算法f l8 j 是b e z d e k 于1 9 8 1 年提出的,它是目前广泛采用的一种聚类算法。 它能给出每个样本隶属于某个聚类的隶属度,微生物发酵过程中的变量往往很难找到明显 的分类,因此f c m 在这方面有一定的优势。 2 2 模糊聚类方法的基础 2 2 1 模糊聚类的定义 聚类,作为一个古老的研究问题,随着人类社会的产生和发展而得到不断的深化。它 将物理或者抽象对象的集合分成由类似对象组成的多个类的集合,并且是按照一定的规律 对数据进行区别和划分的。在这一分类过程中,并没有任何分类的先验知识,而是只靠事 物f n j 的相似性作为类属划分的准则,显然,它是一种无监督的分类过程。所谓类( c l u s t e r ) 是指相似元素的集合。聚类分析( c l u s t e ra n a l y s i s ) 又叫群分析( g r o u p ) 就是对事物按照一定 要求进行聚类的数学方法。聚类分析能够在研究对象的特征数据的过程中发掘出有用的信 息,因而是一种很有效的信息处理方法。传统的聚类分析是一种硬划分( c r i s pp a r t i t i o n ) , 它能把每个待辨识的对象划分到不同的类中。而以模糊数学方法为基础的聚类分析叫做模 糊聚类分析( f u z z yc l u s t e ra n a l y s i s ) ,模糊聚类分析其实就是把模糊数学的概念引入聚类分 析中,是数值分类的一门分支,也是无监督模式识别的一个分支。 2 2 2 模糊聚类的分类 到目前为止,人们提出了很多种聚类算法,这些算法大致可以分为以下几类: 9 江苏大学硕士学位论文 1 划分法( p a r t i t i o nm e t h o d ) :即给定一个由x 个元组或样本组成的数据集,构造 r ( r x ) 个分组,每一个分组就代表一个类。对于给定的y ,算法先给出一个初始的分组 方法,然后通过一次次的迭代来改变分组,使每次改进以后的分组方案都比上一次有更好 的效果。所谓更好的效果的标准是:同一个分组中的样本越来越接近,而不同组中的样本 离得越来越远。基于距离的聚类( k m e a n s ) ij 9 , 2 0 算法、k 中心点算法、随机搜索优化算法就 是利用这个思想产生的算法。图2 1 就是基于距离聚类算法的一个简单例子。 。 图2 1基于距离聚类算法的一个简单例子 2 层次法( h i e r a r c h i c a lm e t h o d ) 包括自底向上法和自顶向下法两种方案。通过对数据集 进行层次似的分解,直到满足某种条件为止。其中代表的算法有:平衡迭代衰减聚类算法 ( b m c h ) 、c l u s t e r i n gu s i n gr e p r e s e n t a t i v e s ( c u r e ) 算法及动态层次聚类算法等等2 1 2 2 j 。 3 基于密度的方法的指导思想是:只要一个区域中的点密度大于某个阈值,就把它 加到与之相近的聚类中去。其代表算法有:基于密度分布函数的聚类算法等; 4 基于网格的方法:首先,将数据空间划分成有限个网络结构,然后所有的处理都 以单个的单元为对象。这种方法的突出优点是处理速度很快,而且算法通常与目标数据库 中的样本个数无关,只与把数据空问分成单元的个数有关。其代表算法有:基于网格和密 度相结合的聚类算法。 5 基于模型的方法:首先,给每一个聚类假定一个模型,然后寻找能够很好满足这 个模型的数据集。它的一个潜在假定就是:目标数据集是由一些列的概率分布决定的。 除上述几种方法外,在各种文献中还存在着其他的大量聚类方法。比较常用的包括: 处理高维数据的聚类方法、基于遗传算法的聚类方法、处理大规模数据的聚类方法【2 3 1 以及 将基本聚类方法与各种新技术结合的聚类方法等等。 所有的聚类方法都有各自的特点。有些以方法简单、执行效率高为特点( o uk 均值聚 类算法) ;有些则对任意形状、大小的类识别能力比较强。但这些方法都有各自的局限性, 如k m e a n s 方法只能识别大小近似的球形类别。在实际应用中,较受欢迎、研究比较多的 基于目标函数的模糊聚类算法,此方法设计简单,解决问题的范围比较广,同时还能将问 1 0 江苏大学硕士学位论文 题转化为可以借助经典教学的非线性规划理论去求解的优化问题,并且能在计算机上实 现;在基于目标函数的模糊聚类算法中,模糊c 一均值聚类算法的理论研究最为完善,应用 也较为广泛。 2 3 模糊c 均值算法原理 2 3 1 硬c 均值聚类算法 给定数据集x = 五,x 2 ,x m ) cr 5 为模式空问中所个模式的一组有限观测样本集,其 中以= ( x k 。,:,) 7 r 5 为观测样本吒的特征矢量,对应的特征空间中的一个点:为 特征矢量以的第,维特征上的值。硬c 均值聚类就是要产生对于给定的样本集x 的c 个划 分,即得到c 个子集置,x z ,x c ,同时满足条件式( 2 1 ) : x 、,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论