




已阅读5页,还剩96页未读, 继续免费阅读
(分析化学专业论文)模式识别在炭黑生产过程优化及建模中的应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
四j i i x 学硕士学位论文模式识别在炭黑生产过程优化及建模中的应用分析化学专业研究生黎金明指导老师李梦龙炭黑是由许多烃类物质( 固态、液态或气态) 经不完全燃烧或裂解生成的。炭黑是橡胶制品( 主要是轮胎) 的重要补强剂和填充剂,橡胶工业没有炭黑工业辅助配合是不可能发展的。针对目前炭黑工业生产主要以经验为主的不利境况,本文尝试将模式识别用于炭黑生产过程优化,构建生产工艺参数与炭黑质量指标之间的模型,另外开发了炭黑工艺参数优化系统。首先,本文采用模式识别中的聚类分析法、非线性映照法、主成分分析法、白化变换一线形映照法以及多重判别矢量法处理炭黑工艺数据,挖掘炭黑生产过程中的规律性。通过比较分析,相比之下发现多重判别矢量法中样本分类效果较好,两个判别矢量几乎包含了全部原始样本信息。根据得到的样本分类图,找到比较明显的局部优区,判定了优化方向;分析计算结果后得出炭黑生产过程中的关键影响参数,详细解析了各工艺参数在优化过程中的变化趋势;将模式识别优化结果与实际生产过程结合制定了模式识别优化方案。结果表明,将基于模式识别的信息挖掘技术引入炭黑工业,对于提高生产优质炭黑的能力,改进炭黑生产技术,具有一定现实指导意义。其次,我们采用m l r 、p c r 、s r 、p l s r 等线性回归方法,构建炭黑工艺参数与质量指标之间的预测模型,校正集和预测集中模型计算值与实际生产值之间的相对误差超过53 0 ,且模型计算值都在狭小范围内,不能准确反映实际生产情况。采用改良b p 、e l m 、r b f 网络构建炭黑生产过程非线性映射模型,比较后得出r b f 模型中平均预测误差、平均预测相对误差以及误差平方和相对较小,是校正和预测的最佳模型,以炭黑吸碘值和吸油值为目标变量,训练集中拟合相对误差在10 0 以内,预测集中r b f 模型的平均预测相对误差分别为四川大学硕士学位论文l7 4 、14 4 ,达到实际生产要求。结果表明,炭黑生产过程存在比较强的非线性,不适宜采用线性回归方法建立模型,而具有良好逼近能力和学习速度的径向基神经网络适宜于炭黑生产过程建模,比较好地解决了炭黑生产过程中预测模型的构建问题。另外,初步开发了炭黑工艺参数优化系统。我们采用m a t l a b 语言编写了各计算程序,整个管理系统以m i c r o s o f ts q l - s e v e r2 0 0 0 为后台数据库,m i c r o s o f tv is u a is t u d i 0 n e t 为开发平台,采用面向对象程序设计语言v i s u a lc # 编码,做到v i s u a lc # 调用m a t l a b 计算程序。我们进行了系统模块设计、数据库设计,开发出了登录、注册、数据录入界面、运算、帮助等功能模块,实现数据更新、数据预处理、优化及建模方法的调用及计算结果显示等炭黑数据处理过程。关键词:炭黑工艺模式识别优化建模优化系统四川大学硕士学位论文a p p l i c a t i o no fp a t t e r nr e c o g n i t i o ni no p t i m i z a t i o na n dm o d e l i n gf o rc a r b o n b l a c kp r o d u c t i o np r o c e s sa n a l y t i c a lc h e m i s t r yp o s t g r a d u a t e :l ij i n - m i n ga d v i s o r :l im e n g - l o n gc a r b o nb l a c k ( c b ) i sc r e a t e df r o mt h ei n c o m p l e t ec o m b u s t i o no rc r a c k i n gp r o c e s s e so fh y d r o c a r b o nm a t e r i a l ( s o l i d ,l i q u i do rg a s ) c bi sa ni m p o r t a n tp a d d i n go fr u b b e rp r o d u c t s ( m o s t l yt i r e s ) r u b b e ri n d u s t r yc a n ts u c c e s s f u l l yd e v e l o pw i t h o u tt h ea s s i s t a n c eo rc o o p e r a t i o no fc bi n d u s t r yi na l l u s i o nt ot h ed i s a d v a n t a g e o u sc o n d i t i o no nt h ep r o d u c t i o no fc bp r i n c i p a l l yd e p e n d i n go ne x p e r i e n c e p a t t e r nr e c o g n i t i o n ( p r lw a sp u tf o r w a r dt ot h eo p t i m i z a t i o no fc bp r o d u c t i o np r o c e s sw ea p p l i e dp rt os e t t i n gu pt h em o d e lb e t w e e nt e c h n i c sp a r a m e t e r sa n dq u a l i t vt a r g e t si na d d i t i o n ,w eh a v ed e v e l o p p e dt h eo p t i m i z a t i o ns y s t e mf u rc a r b o nb l a c kt e c h n i c sp a r a m e t e r s f i r s t l y , s e v e r a lm e t h o d si np a t t e r nr e c o g n i t i o nw e r ea p p l i e dt om i n et h ed a t ai n f o r m a t i o ni nc a r b o nb l a c kp r o d u c t i o np r o c e s st h em e t h o d s s u c ha sc l u s t e ra n a l y s i s ( c a ) ,i i o n - l i n e a rm a p p i n g ( n l m ) ,p r i n c i p a lc o m p o n e n ta n a l y s i s ( p c a ) ,w h i t e n i n gt r a n s f o r m a t i o n 1 i n e a rm a p ( w t l m ) m u l t i d i s c d m i n a t i o nv e c t o r ( m d v 、a n ds oo n ,w e r eu s e da f f e rt h ec o m p a r i s o nf o rt h er e s u l t so ft h e s em e t h o d s ,w ef u u n dt h a tt h eo p t i m i z a t i o nr e s u l t sf r o mm d vw e r eb e t t e r , a n dt w od i s c r i m i n a t i o nv e c t o r sn e a r l yc o n t a i no n eh u n d r e dp e r c e n to ft h ei n f o r m a t i o ni no r i g i n a ls a m p l e sf r o mt h es a m p l ec l a s s i f i c a t i o nf i g u r e ,l o c a lo p t i m a la r e aa n do p t i m i z a t i o nd i r e c t i o nw e r ef o u n do u ta st h ec a l c u a t e dr e s u l t sb a s e do nm d vw e r ed i s c u s s e d 、p r m a r yc o n t r o lp a r a m e t e r sf o rc a r b o n - b l a c kp r o d u c t i o nw e r ec o n c l u d e d a n dt h ec h a n g et e n d e n c yf u re a c hp a r a m e t e ri nt h eo p t i m i z a t i o np r o c e s sw a sr e s o l v e di nd e t a i lb yt h ec o m b i n a t i o no ft h er e s u l t so fp ra n da c t u a lp r o d u c t i o n t h eo p t i m a ls c h e m ew a se s t a b l i s h e dt h er e s u l t si n d i c a t e dt l l a ti f t h ed a t a m i n i n gt e c h n o l o g yb a s e do np a t t e r nr e c o g n i t i o nw a si n t r o d u c e di n t oc a r b o nb l a c ki n d u s t r y t h ea b i l i t yo fp r o d u c i n gh i g hq u a l i t yc a r b o n - b l a c kw o u l db ei m p r o v e d ,a n dt h ep r o d u c t i o nt e c h n o l o g yw o u l db ea m e l i o r a t e da l lt h er e s u l t sh a v es o m ed i r e c t i v ef u n c t i o nf o rt h ed e v e l o p m e n to fc a r b o nb l a c ki n d u s t r ys e c o n d l y , w eh a v ee s t a b l i s h e dt h ej i n e a rr e g r e s s i o nm o d e lb e t w e e np a r a m e t e r sa n dq u a l i t yt a r g e t su s i n gt h e s em e t h o d si np r ,s u c ha sp r i n c i p a lc o m p o n e n tr e g r e s s i o n ( p c r ) ,m u l t i p l el i n e a rr e g r e s s i o n ( m l r ) ,s t e p w i s er e g r e s s i o n ( s r ) a n d四川大学硕士学位论文p a r t i a li e a s ts q u a r e sr e 笋e s s i o n ( p l s r ) f o rv a l i d a t i o nd a t as e ta n dp r e d i c t i o nd a t a s e t ,t h ec h a n g er a n g eo ft h ec a l c u l a t e dv a l u ei sc o n f i n e di nt h e s el i n e a rm o d e l a n dt h er e l a t i v ee r r o rb e t w e e nt h ep r e d i c t i o nv a l u e sa n dt h ea c t u a lv a l u e si sm o r et h a n53 0 w h i c hd o e s n tt r u l yr e f l e c tt h ea c t u a lp r o d u c t i o nw eh a v ea l s os e tu pt h en o n l i n e a rm a p p i n gm o d e lw i t ht h ea r t i f i c i a ln e u r a ln e t w o r k sb a s e do ne r r o rb a c k p r o p a g a t i o n( a n n b p ) ,r a d i a lb a s i sf u n c t i o nn e t w o r k s ( e d 3 f ) a n de l m a nn e u r a ln e t w o r k s b yt h ec o m p a r i s o nf o rt h e s em o d e l s ,w ec o n c l u d e dt h a tt h ea v e r a g ep r e d i c t i o ne r r o r ( a p e ) ,a v e r a g er e l a t i v ep r e d i c t i o ne r r o r ( a r p e ) ,a n ds u m s q u a r e de r r o r ( s s e ) ,i nr b fw e r es m a l l e rt h a no t h e r s t h ef i t t i n gr e l a t i v ee r f o ri nt r a i n i n gd a t as e ti sj e s st h a n1o o ,a n da r p ef o ri s s aa n dd b pa r e 】7 4 a n d1 4 4 r e s p e c t i v e l y ,w h i c hs a t i s f i e st h ea c t u a jd e m a n dt h er e s u l t ss h o wt h a tt h e r ee x i s t sc o m p l e xn o n l i n e a ri nt h ep r o d u c t i o np r o c e s so fc b ,t h el i n e a rr e g r e s s i o nm e t h o d sa r en o tf i tf o rs e t t i n gu pt h ep r e d i c t i o nm o d e l ,w i t hf a v o r a b l ea p p r o a c ha b i l i t ya n dl e a r n i n gr a t e w h i l er b fi ss u i t a b l et oc o n s t r u c tt h em o d e io fc a r b o n b l a c kp r o d u c t i o np r o c e s sr b fh a sp r e f e r a b l ys o l v e dt h ep r o b l e mo fs e t t i n gu pp r e d i c t i o nm o d e li nc a r b o n b l a c kp r o d u c t i o np r o c e s si na d d i t i o n ,w eh a v ed e v e l o p p e dt h eo p t i m i z a t i o ns y s t e mo fc a r b o nb l a c kt e c h n i c sp a r a m e t e r sw eh a v ec o m p i l e dt h ec a l c u l a t i o np r o g r a mw i t hm a t l a bm i c r o s o f fs q l - s e v e r2 0 0 0w a sd a t a b a s e ,a n dv i s u a lc 荐w a st h ep r o g r a mi a n g u a g ew i t hm i c r o s o f tv i s u a ls t u d i o n e ta sd e v e l o p m e n tp l a tt h es y s t e mh a sr e a l i z e dt h ec o m b i n a t i o nb e t w e e nt h ea l g o r i t h mp r o g r a m sb a s e do nm a t l a ba n dv i s u a ic #p r o g r a mw eh a v ec a r r i e do u tt h ed e s i g no fs y s t e mm o d u l ea n dd a t a b a s e ,a n de x p l o i t e dt h ei n t e r f a c ef o rl a n d ,l o g i na n dt h ei n p u ti n t e r f a c e 。o fd a t as e tt h es y s t e mh a st h ef u n c t i o n s ,s u c ha st h eu p d a t eo f d a t a ,t h ep r e t r e a t m e n to f d a t a ,t h ea p p l i c a t i o no fo p t i m i z a t i o na n dm o d e l i n gm e t h o d s ,a n dt h es h o wo fc a l c u l a t e dr e s u l t s k e y w o r d s :c a r b o nb l a c kt e c h n i c s ,p a t t e r nr e c o g n i t i o n ,o p t i m i z a t i o n ,m o d e l i n g ,o p t i m i z a t i o ns y s t e m4四川大学硕士学位论文 前言炭黑是由许多烃类物质( 固态、液态或气态) 经不完全燃烧或裂解生成的。炭黑是橡胶制品( 主要是轮胎) 的重要补强剂和填充剂,橡胶工业没有炭黑工业辅助配合,是不可能发展的。反之,炭黑工业没有橡胶工业的支撑,也是不可能得到迅速的发展,两者相互依存,共同发展“1 。橡胶工业的技术更新和不断突破,相应要求更为优质的炭黑,从而刺激炭黑生产技术从经验式生产转向自动化、数字化生产,同时达到精细化( 如纳米炭黑、专用特种炭黑等) 生产“1 1 。在烃类物质质量稳定的情况下,炭黑质量的好坏主要受生产工艺参数的影响,炭黑生产工艺参数约4 5 个,分别归属于温度、压力和流量三种类型,可见工艺数据为高维数据;炭黑质量衡量标准中的全指标为1 3 个,敌又为多指标问题。目前,年生产能力上万吨级的炭黑生产工艺,大都实现了自动化控制,比如d s c ( d y n a m i cs t a b i l i t yc o n t r 0 1 ) 控制系统,能够在计算机上调节各工艺参数“,但如何根据炭黑产品信息调节工艺参数方面的技术处理并不清晰,甚至有些工厂还是主要凭借经验,而在实际生产中也只建立了简单的线性回归模型,能做粗略的工况预测。这对于提高炭黑质量更好地满足橡胶工业及其它相关产业的发展极为不利。因此,本文提出采用模式识别技术对炭黑生产进行优化处理。模式识别中蕴涵了强大的数据分析、解析能力“。“,比如主成分分析( p r i n c i p a lc o m p o n e n ta n a l y s i s ,简称p c a ) 法、白化变换一线形映照( w h i t e n i n gt r a n s f o r m :i i n e a rm a p ,简称w t l m ) 法,多重判别矢量( m u l t i d i s c r i m i n a t i o nv e c t o r , 简称) 法、偏最小二乘( p a r t i a ll e a s ts q u a r e s ,简称p l s ) 法、最优判别平面( o p t i m a ld i s c r i m i n a t i o np l a n e ,简称o d p ) 法等等,可以压缩高维数据实现降维,提取有用信息及样本特征,对样本特征进行二维映照,还可以找到参数的优化方向和优化区域。“。而且,运用化学计量学中的主成分回归( p r i n c i p a lc o m p o n e n tr e g r e s s i o n ,简称p c r ) 、多元线性回归( m u l t i p l el i n e a rr e g r e s s i o n 简称m l r ) 、非线性回归( n o n l i n e a rr e g r e s s i o n ,简称n r ) 、逐步回归( s t e p w i s er e g r e s s i o n ,简称s r ) 等等回归方法建立参数与指标之间的回归模型;同样利用人工神经网络中的b p 算法( a r t i f i c i a ln e u r a ln e t w o r kw i t he r r o rb a c k p r o p a g a t i o n 简称a n n b p ) 、径向基网络( r a d i a lb a s i sf u n c t i o nn e t w o r k s ,简称r b f n ) 等也可建立参数与指标之间的映射模型o ”1 。本文e 作的目的就是:采用模式识别技术对炭黑生产过程进行信息挖掘,四川大学硕士学位论文试图发现炭黑生产中的普遍规律,进而对生产工艺进行优化,找到工业生产的优区、优化方向,实现炭黑生产优区控制。同时对生产中的普遍现象给予模式识别方面的解释,丰富生产理论,正确指导工艺调节。根据模式识别分类图预报优化工艺参数,克服盲目生产造成损失,通过与实际生产结合建立优化方案,提高生产优质炭黑的能力,改进炭黑生产技术。考虑到工业生产中生产条件不断变化,以及工艺设备损耗等等因素,导致生产不稳定,只是单纯凭借优化控制i 基调整工艺是不够严谨的,各工艺参数增加或减小的幅度,如果没有建立参数与优化目标之间的模型,也只能凭经验去调整,这样既不准确、科学,又需消耗大量人力、物力和财力来做实验。因此有必要构建比较好的预测模型,实现动态跟踪现场生产条件的变化,适时对优区和模型进行校正,使得出的优区和模型满足不断变化的情况。总之,采用模式识别中的数据解析方法可以解决炭黑工艺生产中许多问题,对改进炭黑的生产技术、提高产品质量有不可低估的作用。为了能够根据炭黑质量检验信息适时调节参数,快速计算出结果调整工艺,加强生产自动化控制能力,提高管理水平,我们进行了炭黑工艺参数优化系统的开发。整个管理系统以s q l s e v e r 2 0 0 0 为后台数据库,n e t 为开发平台,采用面向对象程序设计语言v i s u a lc # 编码,c # 调用m a t l a b ,实现全过程的实时监控和动态管理。另外,查取了大量相关资料,文献来源包括中文期刊、i n t e r n e t 网络报道、国外期刊、s c i ( s c i e n c ec i t a t i o ni n d e x ) 杂志、e i 杂志等等途径,得知目前运用模式识别技术处理炭黑工艺中的问题未曾报道过。参考文献 1 李炳炎炭黑生产与应用手册,化学工业出版杜,2 0 0 0 2 j a n i kmf u e la n de n e r g y 2 0 0 1 ,4 2 ( 1 ) ,2 4f u l c h e r l ,p r o b s tn f l a m a n tgc a r b o n ,2 0 0 2 ,4 0 ( 2 ) ,1 6 9 1 7 6f r a t z s c h e rh ,v o s s h e r t r i c hrf u e la n de n e r 9 5 ,1 9 9 8 3 9 ( 1 ) ,2 96四川大学硕士学位论文 5 俞汝勤化学计量学导论,湖南教育出版社,1 9 9 1 6 刘树深易忠胜基础化学计量学科学出版社,1 9 9 9 7 陈念贻,钦佩,陈瑞亮等模式q , r se j 方法在化学化工中的应用,科学出版社,2 0 0 0 8 朱尔一杨梵原化学计量学技术及应用,科学出版社,2 0 0 1 9j梁逸曾俞汝勤分析化学手册( 第十分册化学计量学) ,化学工业出版社,2 0 0 0 1 2 1 0 孪介谷蔡国廉计算机模式识别技术,上海交通大学出版社,1 9 8 6 11 kb a u m a n njc h e m o m e t r i c s ,2 0 0 2 ,1 6 ( 7 ) ,3 3 9 3 5 0 12 】l e w i p a u ljc h e m o mi n t e l ll a bs y s t ,1 9 9 5 ,2 8 ( 1 ) ,2 3 3 3 1 3 k e v i nj j o h n s o n r o b e r t ,es y n o v e cc h e m o m i n t e l l l a bs y s t ,2 0 0 2 ,6 0 ( 1 2 ) ,2 2 5 - 2 3 7 1 4 t a w f i k “b a s s e la p p l i e d m a t h e m a t i c sa n dc o m p u t a t i o n ,2 0 0 0 ,1 1 1 ( 1 ) ,8 7 一一1 0 1 1 5 s k u b a l s k a r a f a j l o w i c zen o n l i n e a ra n a l y s i s ,2 0 0 1 ,4 7 ( 1 ) ,3 l5 - 3 2 6 1 6 h o n gs ejl i l l e ,w e i s s ,s h o l o mmp a t t e r nr e c o g n i t i o nl e t t e r s ,2 0 0 1 ,2 2 0 ) ,5 5 - 6 1 1 7 d u i n r o b e r tp w p a t t e r n r e c o g n i t i o n l e t t e r s ,1 9 9 9 ,2 0 ( 1 1 - 1 3 ) ,1 1 7 5 1 l8 l【1 8 d o v i v g ,m a g a l ,r e v e r b e r i ap c h e m i c a l e n g i n e e r i n gj o u m a l ,1 9 9 7 ,6 8 ( 1 ) ,3 5 4 0【】9 b h a v i k rc o m p u t e r sa n d c h e m i c a le n g i n e e r i n g ,2 0 0 2 ,2 6 ( 2 ) 1 6 1 - 1 7 4f _ :2 ( ) s a l e n i e k sa l v i s w o o o hs a n g m a v r o v o u n i o t i s jp r o c e s sc o n t r o l ,1 9 9 7 ,7 ( 3 ) ,l5 5 16 7 2 1 l e o n h a r d ts ,a y o u b imc o n t r o le n g i n e e r i n gp r a c t i c e ,1 9 9 7 ,5 ( 5 ) ,6 8 3 - 6 9 2 2 2 j i ey a n g ,p e n g f e is h i e x p e r ts y s t e m sw i t ha p p l i c a t i o n s ,1 9 9 6 ,1 0 ( 3 - 4 ) ,4 3 5 4 3 9 2 :”l eb l a n cla ,h a s h e m i e x p e r ts y s t e m sw i t ha p p l i c a t i o n s ,2 0 0 1 ,2 0 ( 2 ) ,1 6 3 1 7 1 2 4ja n n ad ej u a n ,r o m 6t a u l e rjc h e m o m e t r i c s ,2 0 0 1 ,1 5 ( 1 0 ) ,7 4 9 - 7 7 1 2 5 c l w i s t i a nl i n n e b e r g ,a g n a rh 6 s k u l d s s o njc h e m o m e t r i c s ,2 0 0 0 ,1 4 ( 5 6 ) ,5 7 3 5 8 3f 2 6 g i a c i n t o g p a o l n c c i r r o l i fp a # e r n r e c o g n i t i o n l e t t e r s ,1 9 9 7 ,ls ( 1 1 - 1 3 ) ,1 3 5 3 - 1 3 6 2 2 7im e g a nl c o o p e rdj c o m p u t e r sa n dc h e m i c a le n g i n e e r i n g ,1 9 9 5 ,1 9 ( 2 ) ,1 7 1 18 6 2 8 l i o uc h a n g y u a n ,t a iw e n p i n a r t i f i c i a li n t e l l i g e n c e ,2 0 0 0 ,l1 6 ( 1 - 2 ) ,2 6 5 2 8 6( 2 9 】s u k h a s w a m imb ,p u j a r i ,a r i mk ,p a t t e r nr e c o g n i t i o nl e t t e r s ,1 9 9 6 ,1 7 ( 1 ) ,l 1 0 3 0 m i n g - y e o u g ,t e o s l a n g k o ka r t i f i c i a li n t e l l i g e n c ei ne n g i n e e r i n g ,1 9 9 5 ,9 ( 2 ) ,8 5 - 9 4【3 ljk u orjc o m p u t e r si ni n d u s t r y ,1 9 9 7 ,3 2 ( 3 ) ,2 7 3 2 8 0l :3 2 s o m a k u m a rr ,c h a n d r a s e k h a rje n g i n e e r i n gp r a c t i c e ,1 9 9 9 ,7 ( 5 ) ,6 1 1 6 2 17四川大学颁士学位论文2 模式识别的基本理论依国际化学计量学学会( t h ei n t e r n a t i o n a lc h e m o m e t r i c ss o c i e t y ,i c s )的定义:“化学计量学是一门化学分支学科,它应用数学和统计学方法( a ) 设计和选择最佳的测量程序与实验方法;( b ) 通过解析化学数据提供最大限度的化学信息”。在分析化学领域中,化学计量学则是应用数学和统计学方法以最佳方式获取关于物质系统的有关信息“1 1 。化学计量学可视为数学、统计学、计算机科学与化学化工的“接口”,它的成氏与发展同上述科学紧密相关“”1 。随着这些科学的发展,很多新的原理、方法与技术将不断地引入这一领域,使化学计量学的理论与应用研究得以扩大和深入,并在解决复杂的化学问题中显示出强大的生命力;作为- f 新兴的交叉学科,随着研究工作深入而广泛的开展。化学计量字的研究方法、内容与应用领域一直在不断扩充和更新。化学计量学研究内容很多。3 ,其基本研究方向如图2 1 所示。图2 1 化掌计量学的组成化学模式泌别是化学计量学( c h e m o m e t r i c s ) 的重要分支之一。人们在生活中无时不在谀别事物,其范围非常广泛,如中医通过望、闻、问、切诊断疾病:化学工作者借助色谱、光谱和质谱鉴定化合物等等。人类自身在许多方面( 如低维空剞、模糊识别) 所表现出来的模式识别能力是现代计算机及任何模式识别方法无法比拟的,如人脸识别、语音识别等等。但是,在高维空间,数学方8四川大学硕卜学位论文法与计算机技术充分显示其优越性。模式识别发展于2 0 世纪5 0 年代初期,属于人工智能范畴,已广泛应用于自然科学、社会科学的各个分支领域“3 。作为一种分类与识别方法,模式识别是通过对某些特征进行分类,在错误概率最小的条件下,使识别的结果尽量与客观事物相符。模式的含义相当广泛,可以是数据、图形、波形、语音符号、不同疾病、各种动植物类别乃至自然界中各种各样需要识别的对象。2 1 模式识别的分类模式识别从总体上来说可分为两类,即统计模式识别( s t a t i s t i c a lp a r e mr e c o g n i t i o n ) 和句法模式识别( s y n t a c t i cp a t t e r nr e c o g n i t i o n ) 两大类。统计模式识别以数学上的决策理论为基础,根据这些理论建立统计学识别模型,进行大量统计分析,从中找出规律性认识:句法模式识别立足于分析模式的结构,通过规范化语句加以表达,以弥补前者的某些缺陷与不足。从学习方法上来说,模式识别可分为有监督学习与无监督学习系统。有监督学习系统要运用一组已知其类别的样本,样本在空间的分布点集叫训练集;该系统就是通过训练来获得识别的准则,再用这些准则来判决未知模式的所属类别。无监督学习系统不依赖于训练集而是在特征空间中直接寻找点群或其它可以识别的数据结构,这种识别方法又称为聚类分析( c l u s t e ra n a l y s i s ) 。2 2 模式识别基本过程模式识别的一个基本过程大致如图2 2 所示,图中虚线下部是学习或训练过程,上部是识别过程。在学习过程中,将分类情况已知的模式样本进行数值化后,录入计算机,经过分析,去掉对分类无效或易造成混淆的那些特征尽量保留对分类判别特别有效的数值特征,该过程称为特征选择:必要的话,还可通过某种变换技术,如主成分分析,对数据进行处理得出数目比原来少的综合性特征用于分类,此过程为特征提取:然后,按预定的分类判决数学模型进行分类,并将分类结果与已知类别的输入模式作对比,经不断修改,制定出错误率最小的判决规则;9四川大学硕士学位论文最后,应用学习过程中制定的数学模型对未知模式在相同条件下进行分类,得出识别结果。未知模式特征的数据采集训练模式样本的特征数据输入未知模式特征的选择和特征维数的压缩训j 练模式样本特征的选择和特征提取日圈图2 2 统计模式识别流程图尽管各种模式识别的理论与方法存在着差异,但模式的所有分类与描述都应以若干公认的假设为基础:存在一个有代表性的样本集可供使用,以获得所研究问题的范围;一个简单模式,具有表征其类别的类属性特征:一个类的模式,其特征在线性空间中组成某种程度上的一个集群区域,不同类的特征组成的区域是彼此分离的,即性质相近的样本在模式空间中所处的位置相近,它们在空间组成“簇”;一个“复杂”的模式具有“简单”的组成部分,它们之间存在着确定的关系,模式被分解成这些组成部分,且它们应有一个确定的而不是任意的结构。如果两个模式的特征或其简单的组成部分仅有微小的差别,则称这两个模式是相近的。以上的5 个假设,是构成简单模式类别以及具有相似特性的复杂模式集合的全部理论方法的基础。221 数据预处理在化学模式识别中,实验数据常以多维空间的一个点来表示,对于某一样1 0一一一一一一一一一一一tf|厂i一一一一一一一一一一j一一一一一一一一一一一 j _一竺翱四川大学硕士学位论文本的测量结果,可用n 维空间中的向量表示为:x = ( x ,x - t ,x 。) 其中册为变量的值,变量亦被称为特征。模式识别中将需作处理的样本集t 一般用如下矩阵形式表示:= g ,) 。fz i iz 1 2lx 2 1x 2 2i。+l 工。工。:z l 删z 2 x ( 2 一1 )矩阵中的每一行表示一个样本点,其中,7 为样本数,田为特征数。故为拧x m 阶矩阵,锄为第个样本的第j 个特征参数。在历维空阅中,两个样本间的相似程度应正比于两个样本点在维空间中的接近程度。由于埘个变量的量纲和变化程度不同,其绝对值大小可能相差许多倍。为了消除量纲和变化幅度不同带来的影响,原始数据应作标准化处理( a u t o s c a l i n g ) ,有关计算公式如下:i = 杰x 。i ll = 1只=工:量兰、s( 2 - 2 )( 2 - 3 )( 2 - 4 )其中x i j 为经标准化处理后的数据,各变量权重相同,均值为o ,方差为l 。222 特征提取与压缩特征提取是模式识别中的关键步骤,尽管研究的很广泛,但尚无通用的理论可以遵循“4 1 一般应根据所研究问题及对象,并结合专业知识来选取对分类有效的特征。化学领域的常用特征包括分子拓扑指数、分子形状、电子参数、1,llll四川大学硕士学位论文沸点、疏水性参数、化合物谱图特征以及物质化学组成等等,化工领域中的原料成分、温度、压力、流量、配比、生产设备参数、生产要求以及传热、传质、循环量等等特征变量。特征提取的原则是以得到好的分类结果为宗旨,若特征数太多,可对所选特征进行压缩,在不损失分类信息的前提下,应使特征数减至最少。特征提取与压缩的方法较多,化学领域广泛应用的有:偏差权重法逐步判别法学习手几法主成分分析法偏最小二乘法 1 俞汝勤i2 1 李梦龙 : 1 陈念贻 4 朱尔一 5 粱逸曾 6 挛介谷参考文献化学计量学导论,湖南教育出版社,1 9 9 t化学计量学基础四川i 大学化学学院,1 9 9 8钦佩陈瑞亮等模式识别方法在化学化工中的应用,科学出版社2 0 0 0杨梵原化学计量学技术及应用。科学出版社2 0 0 1俞汝勤分析化学手册( 第十分册,化学计量学) ,化学工业出版社,2 0 0 0 1 2蔡国廉计算机模式识别技术,上海交通大学出版社,1 9 8 62四j i l 大学硕士学位论文3 模式识别在化学化工中的应用模式识别方法大致可分为统计模式识别和句法模式识别两大类,其中旬法模式识别着眼于突出模式结构的信息,采用形式语言理论来分析和描述模式的结构。这类方法己在遥感图片处理、指纹分析、汉字识别等方面广泛应用。而统计模式识别将每个样本( 一组数据) 用特征参数表示为特征向量空间的一个点,根据各点间的距离及各点在特征向量空间的相对位置关系来判别、分类和总结规律,统计模式识别发展比较早,在化学及工业调优中都有广泛运用,比如运用模式识别中的主成分分析法、多重判别分析法、偏最小二乘法、聚类分析、人工神经网络法等等,可以寻找到工艺优化方向,建立工艺模型“。1 。模式识别是近年来倍受人们重视的学科,目的就是要研究出能自动进行模式分类和描述的机器系统,以实现人类模式识别的功能。早在2 0 世纪3 0 年代就有人试图以当时的技术来解决一些识别问题,但最近二十几年来,随着计算机科学技术的发展和推广应用,这门学科才真正得到发展,迄今为止,它的理论和技术都远未完善。模式识别以“物以类聚”为前提,具有相同特性的被观察体应具有相似的模式,即具有数据结构上的类同性。因此,可以借助定义某些相似性的度量标准和判别规则来确定群体的特征,辨认各个模式的类别。计算机的介入,使人们在影响因素众多的情况下仍能处理大量数据,选择描述群体特性的基本单元或特征参量,作出最佳的分类决策。这使模式识别在近年来成为一种引起入们很大关注的信息处理技术,并成功地应用于对象的辨识、建模、预测、优化和控制等等“。模式识别的基本假定在于:倘若被观察体之间的区别由一组参量确定,则同类的个体应比较相似,这种相似性使它们在同一模式空问中聚集,且不同的类应占据不同的空间区域。因此,对于我们所研究的特定问题,如工业生产中的产品收率问题,可转化为建立某个模式空间,在此空间中划分出高收率产品所占据的空间范围,从而得到相应的优化控制模型。假设生产工艺由膨个工艺参数表示,骱工艺参数( 特征变量) 组成维模式空间,一。种工况即个模式点,对应予维空间中的个点而称之为样本点,个样本点组成一个维数据集m 以优化目标作为划分样本类别属性的依据,将目标划分为若干类,通过对数据集z 的模式识别处理,找出优类样本子集在吖维模式7 蔓阃中的分布区域,建立数学模型,从而给出优化控制方案。四川大学硕士学位论文3 1 模式识别在钢铁炼制领域中的应用高炉炼铁是钢铁工业的龙头,要保证顺利生产,焦炭的质量是关键。焦炭的质量指标包括耐压指标和耐磨指标。而炼焦生产过程是一个复杂的物理化学过程,焦炭质量受到许多因素的影响,在炼焦时间、温度等工艺参数较稳定的隋况下,焦炭质量主要取决于原煤的质量和比例。陈念贻等。应用模式识别方法对鞍l u 钢铁厂和涟源钢铁厂的配煤数据作了分析,用线形映照和逆映照方法考查了5 种煤( 气煤、肥煤、瘦煤、炼焦煤1 号、炼焦煤2 号) 的比例与焦炭强度和耐磨性的关系,优化炼焦煤的配方,在生产上实施效益显著。涟源钢铁总厂的李典忠。利用模式识别中的p c a 、p l s 、k n n 、o d p 、s i m c a 等对4 5 种烧结原料配比进行优化,以降低燃料比为优化目标,得出p c a 方
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汉字真有趣课件照片
- 《Photoshop CC平面广告设计》高职全套教学课件
- Unit6 Plan for Yourself单元测试(无答案)人教版(2024)八年级英语上册
- 汉字多的课件
- 新能源汽车充电基础设施建设规
- 高端家电市场品牌竞争策略研究
- 汉子家园言课件
- 水边玩耍的安全教育
- 消防设施功能测试方案
- 建筑工程施工阶段安全监控方案
- 2025年体育教练员执业能力考试试题及答案解析
- 2025年住培结业考试题库及答案
- 2025年重庆辅警管理知识模拟100题及答案
- 创伤急救基本知识培训课件
- DB42∕T 2151-2023 应急物资储备库建设规范
- 2025年二级建造师继续教育题库及参考答案(完整版)
- 胶水储存管理办法
- 精神患者家属健康教育讲座
- 分包招采培训课件
- 公司全员销售管理办法
- 考试真题及答案解析注册安全工程师
评论
0/150
提交评论