(食品科学专业论文)智舌中智能模式识别单元的实现与应用研究.pdf_第1页
(食品科学专业论文)智舌中智能模式识别单元的实现与应用研究.pdf_第2页
(食品科学专业论文)智舌中智能模式识别单元的实现与应用研究.pdf_第3页
(食品科学专业论文)智舌中智能模式识别单元的实现与应用研究.pdf_第4页
(食品科学专业论文)智舌中智能模式识别单元的实现与应用研究.pdf_第5页
已阅读5页,还剩79页未读 继续免费阅读

(食品科学专业论文)智舌中智能模式识别单元的实现与应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浙江工商大学硕:仁学位论文 智舌中智能模式识别单元的实现与应用研究 摘要 食品质量安全的快速、实时、在线监控技术一直是食品质量控制 的主要发展方向之一。电子舌是2 0 世纪8 0 年代中期发展起来的一种 用于液体的整体特征分析、识别的新型现代化检测仪器,其快速、无 损、实时的特点,非常适合于食品质量安全控制技术的研究与应用。 电子舌主要由三个部分组成:( 1 ) 低选择性、非特异性并且具有稳定 信号输出的传感器阵列;( 2 ) 激励信号激发和响应信号采集的装置; ( 3 ) 合适的模式识别方式或是多元统计分析方法。模式识别作为电 子舌重要组成部分之一,在电子舌的应用与研究当中起着举足轻重的 作用。并且由于电子舌的检测对象为复杂成分,而各种模式识别算法 具有不同的识别特点和识别能力,不存在一种适用于任何场合的模式 识别方法。因而,加强电子舌模式识别方法研究对智舌系统的研究与 完善,具有十分重要的意义。 智舌是本实验室自主研发,以脉冲伏安电化学技术和惰性金属裸 电极为基础,结合原创组合脉冲驰豫谱思想的一种新型电子舌系统。 本文从线性和非线性两个角度对智舌模式识别方法进行系统研究。以 牛奶、茶饮料和白酒作为分析识别对象,对主成分分析、判别函数分 析和神经网络算法进行研究。结果如下: 浙江r t 商大学硕卜学位论文 ( 1 ) 采用m a t l a b 7 1 软件实现主成分分析算法,并在软件上实现 了智舌对牛奶、茶饮料和白酒等产品快速区分辨识应用; ( 2 ) 将判别函数分析引入智舌系统,并采用m a t l a b 7 1 软件实现 其算法;结果显示,智舌系统利用判别函数分析模块,实现了对牛奶、 茶饮料和白酒等样品的初步品质控制应用; ( 3 ) 探索了神经网络在智舌系统中的应用,分别实现了竞争神 经网络与概率神经网络算法。竞争神经网络对于牛奶、茶饮料、不同 香型白酒、浓香型白酒、清香型白酒和米香型白酒分别为9 1 7 、 8 9 6 、7 9 2 、7 8 6 和9 7 2 ,概率神经网络对这些样本的识别率 分别为1 0 0 、1 0 0 、1 0 0 、1 0 0 、9 7 6 和l o o ;概率神经网络 明比竞争神经网络更适合于智舌模式识别的应用。 本研究实现了智舌系统的数据处理软件,为后续智舌系统的研究 与完善提供基础。 关键词:智舌;模式识别;主成分分析;判别函数分析;人工神经网 络 浙江工商大学硕上学位论文 r e s e a r c ho fi m p l e m e n t a t i o na n d a p p l i c a t i o no fs m a r tp a 丌e r n i 砸c o g n i t i o ni ns 【a i 汀0 n g u e a b s t r a c t f a s t ,r e a l t i m e ,o n - l i n ei n s p e c t i o no ff o o dq u a l i t ya n ds a f e t yh a s b e e no n eo ft h em a i nd e v e l o p m e n t a lg o a l si nf o o d q u a l i t y c o n t r 0 1 e l e c t r o n i ct o n g u ew a sd e v e l o p e di nt h em i d - e i g h t i e so ft h et w e n t i e t h c e n t u r y i ts e r v e sa san o v e li n s t r u m e n tt oa n a l y z ea n dr e c o g n i z et h e w h o l ec h a r a c t e ro ft h e l i q u o r w i t ht h ef e a t u r e so fb e i n g f a s t , n o n d e s t r u c t i v ea n do n t i m ew h i c hm a k ei ts u i t a b l ef o rt h er e s e a r c ha n d a p p l i c a t i o ni nt h ef o o dq u a l i t yc o n t r 0 1 e l e c t r o n i ct o n g u em a i n l yi n c l u d e s t h r e ep a n s :( 1 ) s e n s o r sa r r a yw i t hl o w s e l e c t i v i t y , n o n s p e c i f i c i t ya n d s t a b l er e s p o n d i n gs i g n a l ;( 2 ) t h ee q u i p m e n tf o ra c t u a t i n gs i g n a le x c i t a t i o n a n dr e s p o n d i n gs i g n a lc o l l e c t i o n ;( 3 ) s u i t a b l ep a t t e r nr e c o g n i t i o no r m u l t i v a r i a t ea n a l y s i sm e t h o d p a t t e r nr e c o g n i t i o n ,a so n eo ft h et h r e e m a i np a n si ne l e c t r o n i ct o n g u e ,p l a y sac r u c i a lr o l ei nt h ea p p l i c a t i o na n d t h er e s e a r c ho fe l e c t r o n i ct o n g u e t h ec o m p l e x i t yo ft h ed e t e c t e do b je c t s i i i 浙江工商大学硕:七学位论文 a n dt h ec h a r a c t e r i s t i cr e c o g n i t i o nf e a t u r ea n da b i l i t yo f e a c hr e c o g n i t i o n a l g o r i t h mm a k ei tt r u et h a tn ou n i v e r s a lr e c o g n i t i o nm e t h o de x i s t i n gf o r a l lt h ec a s e s t h e r e f o r e ,t h er e s e a r c ho np a t t e r nr e c o g n i t i o nm e t h o df o r t h es m a r t o n g u es e e m st ob ee x t r e m e l y i m p o r t a n tf o ri t si m p r o v e m e n t s m a r t o n g u e ,b a s e d o nt h e p u l s e v o l t a m m e t r y e l e c t r o c h e m i c a l m e t h o da n dt h ei n e r t i an u d em e t a l e l e c t r o d e s ,i sd e v e l o p e db yo u r l a b o r a t o r ya san o v e le l e c t r o n i ct o n g u ew h i c hi sa t t r i b u t e dt ot h eo r i g i n a l c o n c e p to fc o m b i n a t o r i a lp u l s er e l a x a t i o ns p e c t r u m i nt h i sw o r k , p r i n c i p l ec o m p o n e n ta n a l y s i s ,d i s c r i m i n a n tf u n c t i o na n a l y s i sa n d a r t i f i c i a ln e u r a ln e t w o r k ( a n n ) ,t h et h r e er e p r e s e n t a t i v em e t h o d so f l i n e a ra n dn o n l i n e a rp a t t e mr e c o g n i t i o n ,w e r eu s e dt oe v a l u a t e t h er e s u l t s f r o mm i l k ,t e ab e v e r a g ea n dc h i n e s el i q u o rd e t e c t e db ys m a r t o n g u e t h er e s u l t sa r ea sf o l l o w s : f i r s t l y , t h ea l g o r i t h mo fp r i n c i p l ec o m p o n e n ta n a l y s i si sr e a l i z e db y m a t l a b7 1s o f t w a r e p c ac a nd oh e l ps m a r t o n g u et od i s c r i m i n a t et h e m i l k ,t e ab e v e r a g ea n dc h i n e s el i q u o rq u i c k l y s e c o n d l y , d i s c r i m i n a n tf u n c t i o na n a l y s i sw a si n t r o d u c e da san e w k i n do fp a t t e r nr e c o g n i t i o ni n t os m a r t o n g u ea n dm a t l a b7 1s o f t w a r ew a s u s e dt or e a l i z ei t sa l g o r i t h m t h er e s u l ts h o w e dt h a ts m a r t o n g u ef u l f i l l e d t h ep r e l i m i n a r ya p p l i c a t i o no fd i s c r i m i n a n tf u n c t i o na n a l y s i si nq u a l i t y c o n t r o lo ft h em i l k ,t e ab e v e r a g ea n dc h i n e s el i q u o r t h i r d l y , w ee x p l o r e dt h ea p p l i c a t i o no fa n ni ns m a r t o n g u ea n d i v 浙江工商人学硕1 :学位论文 r e a l i z e dt h ea l g o r i t h mo fc o m p e t i t i v en e u r a ln e t w o r ka n dp r o b a b i l i s t i c n e u r a ln e t w o r k t h er e c o g n i t i o nr a t ef o rm i l k ,t e ab e v e r a g e ,c h i n e s e l i q u o ro fd i f f e r e n tf l a v o r , d i f f e r e n tc h i n e s el i q u o ro fl u z h o u - f l a v o r , d i f f e r e n tc h i n e s el i q u o ro ff e n - f l a v o ra n dd i f f e r e n tc h i n e s el i q u o ro f r i c e f l a v o ri s91 7 ,8 9 6 ,7 9 2 ,7 8 6 a n d9 7 2 ,r e s p e c t i v e l yb y c o m p e t i t i v en e u r a ln e t w o r k ,a n d10 0 ,1 0 0 ,10 0 ,9 7 6 a n d10 0 r e s p e c t i v e l yb yp r o b a b i l i s t i cn e u r a l n e t w o r k p r o b a b i l i s t i cn e u r a l n e t w o r ki sm u c hm o r es u i t a b l et os m a r t o n g u ep a t t e mr e c o g n i t i o nt h a n c o m p e t i t i v en e u r a ln e t w o r k t h ei m p l e m e n t a t i o no fd a t ap r o c e s s i n gs o f t w a r es e tt h es t a g ef o rt h e f o l l o w i n gs t u d y k e y w o r d s :s m a r t o n g u e ;p a t t e mr e c o g n i t i o n ;p r i n c i p l ec o m p o n e n t a n a l y s i s ;d i s c r i m i n a n tf u n c t i o na n a l y s i s ;a r t i f i c i a ln e u r a ln e t w o r k v 浙江工商人学硕士学位论文 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 本人为获得浙江工商大学或其它教育机构的学位或证书而使用过的 材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作 了明确的说明并表示谢意。 一:步 签名:丝如 踏一年a 归 关于论文使用授权的说明 本学位论文作者完全了解浙江工商大学有关保留、使用学位论文 的规定:浙江工商大学有权保留并向国家有关部门或机构送交论文的 复印件和磁盘,允许论文被查阅和借阅,可以将学位论文的全部或部 分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制 手段保存、汇编学位论文,并且本人电子文档的内容和纸质论文的内 容相一致。 保密的学位论文在解密后也遵守此规定。 签名:卫:萎芝 导师签名: e l 期:年月日 浙江工商大学硕:t 学位论文 1 1 电子舌简介 第1 章前言 1 1 1 电子舌定义及原理 电子舌( e l e c t r o n i ct o n g u e ) 是2 0 世纪8 0 年代中期发展起来的一种用于分析、 识别液体总体特征的新型检测仪器。它主要由传感器阵y o ( s e n s o ra r r a y s ) 、信号采 集系统和模式识别系统三个部分组成,传感器阵列对液体试样作出响应并输出信 号,信号经计算机系统进行数据处理和模式识别后,得到反映样品味觉特征的结 果。这种技术也被称为味觉传感器( t a s t es e n s o r s ) 技术或人工味觉识另 ( a r t i f i c i a l t a s t er e c o g n i t i o n ) 技术,与传统的化学分析方法相比,不同在于传感器输出的并非 样品成分的分析结果,而是一种与样品某些特性有关的信号模式( s i g n a lp a t t e r n s ) , 这些信号通过具有模式识别能力的计算机分析后,能够得出对样品味觉特征的总 体评价。 味觉的产生,源于舌头上的被称为“味蕾 的味觉感受器。味蕾由几十个味 觉细胞构成,昧细胞通常有3 0 - - - 5 0m v 的膜电位,如果在舌头表面放一带味的食 品,则味细胞膜发生极化现象,一般来说就会有称为“感受器电位”的电位变化。 一旦产生这种感受器电位变化,刺激信号就从味细胞传到味神经,昧神经就产生 脉冲放电,味道的不同,产生的刺激强度也不同。大脑根据这些不同的刺激强度 得出该食品的味觉感官特性。电子舌就是模仿生物的味觉感受机制( 图1 1 ) 研制 出来的。电子舌系统中的传感器阵列即相当于生物系统中的舌头,感受不同的化 学物质,采集各种不同的信号信息输入电脑。电脑代替了生物系统中的大脑功能, 通过软件进行分析处理,区分辨识不同性质物质的整体特征,最后给出各个物质 的感官信息。传感器阵列中每个独立的传感器像舌面上的味蕾,具有交互敏感作 用,即一个独立的传感器并非只感受一种化学物质,而是感受一类化学物质,并 且在感受某类特定化学物质的同时,还感受一部分其它性质的化学物质。 浙江t 商大学坝j 学位论文 畸鸯莺 采集数据 太脑持析 梗式识别统计分析 传感器 叫 软件持忻叫指纹识射 凹1 - l 电子舌系统原理图 f i g 1 it h ep r j n a 出d i a g r a m o f e l e c t r o n i c t o n g u e s y s t e m 电子舌的最初设计模型来源于传统分析化学的多传感器多组分分析。这类特 异性传感器阵列多组分分析可以用以下数学式进行表达:假设某溶液中含有n 种组分,并且每种组分的浓度分别为c 1 、c 2 、c n ,现在用由m 个传感器 组成的传感器阵列的电子舌系统对溶液进行测定,同时每个组分都会在传感嚣得 到响应,以p i ( 1 兰i 绷作为第i 个传感器的信号强度。这样,m 个传感器组成的 阵列可以得到如下方程: 只= 4 l q + 一l2 c 2 + + a 川。 只= 4 l c j + 42 c 2 + + 爿2 o ( 1 一i ) 匕= a m :g + a u , 2 c 2 + + a m , n c 其中,由于每个传感器都是特异性的,即只对溶液中某种独立的组分响应, 所以a 。是第i 个传感器响应强度信号和第j 种组分浓度之间的比例常数。从方 程式( 1 一1 ) 可知,只要m 兰n 时,方程可以通过矩阵运算求出溶液中各种组分的浓 度。 电子舌系统在技术上与传统多传感器多组分分析最大的不同就是把生物味 觉系统中味蕾的交互敏感原理和传统的多传感器阵列多组分分析结合在一起,即 用选择性不是特别强,且具有一定交互敏感性的传感器代替传统的具有强选择 性、特异性传感器来组成传感器砗列。这样,方程式( 1 1 ) 中的系数a 。变成与溶 液中第j 个组分浓度相关的一个非线性函数。此时,对方程式( 1 1 ) 求解的时候, 就要求使用人工神经网络等非线性的模式识别方式首先对电子舌进行训练,建 立自学习专家数据库,建立a 。的标准形式,然后再进行计算。 从e 述可以发现,电子舌设计思想来源于传统分析化学的传感器阵列多组分 分析,因此,在很长一段时间内,大量研究者认为溶液中有n 种组分,必须由n 浙江工商大学硕士学位论文 个传感器组成的传感器阵列对溶液检测分析。随着电子舌技术的发展,各种电化 学方法的应用,结果发现,电子舌传感器阵列中传感器的数量是可以减小的,只 需在检测p i 信号的同时,再掺入另一个激发信号s 。例如,用脉冲伏安法检测电 流的同时,掺入脉冲时间及脉冲时间间隔变化的信号;采用阻抗谱法时,检测溶 液性质的同时提取频率的信息【2 1 。根据提取的另一信号s ,并且假设其参数变化 为1 k ,这样可以重新对方程式( 1 。1 ) 修正,针对某个特定的采集信号强度p i ,参 入不同强度的s 信号,列方程如下: o = a u ( i c l + 彳2 c 2 + + a 叫o ,) c 鼻2 = 4 ;c i + 么g g + + 彳i 碧c ( 1 - 2 ) 只眯) - 4 f c i + a “( k c 2 + + a “( k c 其中,p i k 即为在信号s 某个特定参数下的传感器响应强度,a i j 。) 与a i j 一 样,是关于溶液中各个组分浓度的非线性函数。同方程式( 1 1 ) 一样,当a i j ( k ) 确 定为常数时,只要k n ,方程可以通过矩阵运算求出溶液中每个组分的浓度。 然后,再结合传感器阵列中传感器的数量,可列方程为: 只= 彳0 c i + 么:2 c 2 + + 彳:冀c 鼻但= 彳g c l + 么c 2 + + 彳i ( c 只x = 么 f c l + 彳三c 2 + + 么j 三c 耳”= a 。( t ,) c l + a 。( t 。) c 2 + + 。a 2 ( t ,) p 、一 尸2 ( 2 = 彳i j c l + 彳i 翟c 2 + + a 。( 一2 ) c j v p 2 ( 足) = 么! :l f c 。+ 彳i 墨c :+ + 彳:互c ( 1 - 3 ) 尸f = 彳嚣! 。c 。+ 彳01 :c :+ + 彳嚣j c 一2 = 么譬j c 。+ 彳管? 2 c :+ + 4 譬? c 硝足= a 。( k ,) c l + 彳:c 2 + + a 。( k 。) c 从方程组( 1 - 3 ) 可以发现,当a i j k 为确定常数时,只要当m k n 时,电子舌 系统就能求出每个组分的确切浓度。同时,从方程组( 1 3 ) 的求解条件可以发现, 浙江工商大学硕士学位论文 在n 不变的情况下,随着k 的不断增加,m 可以相对地减小。这就为目前电子 舌使用5 至6 个传感器,甚至一个独立的传感器代替传感器阵列,对各种液体类 物质分析检测以及各组分浓度回归拟合提供了理论依据【3 】。 1 1 2 国内外电子舌技术研究进展 目前,国内外的电子舌主要类型有:电位型电子舌、伏安型电子舌、表面声 波电子舌、阻抗谱型电子舌和光寻址电子舌。 电位型电子舌以日本九州大学k i y o s h it o k o 课题组【4 - 7 与俄罗斯圣彼得堡大 学l e g i n 课题纠8 1 2 1 为代表,k i y o s h it o k o 课题组在1 9 9 2 年以脂类膜修饰传感器 开发了世界上第一台电位型电子舌系统,被其称之为味觉传感器系统( t a s t e s e n s o r ) 。1 9 9 5 年l e g i n 8 】课题组开发了以硫属化合物玻璃材料为传感器敏感膜的 电位型电子舌系统,并在世界上第一次提出了电子舌( e e l e c t r o n i ct o n g u e ) 这个名 称。 伏安型电子舌以瑞典l i n k 6 p i n g 大学w i n q u i s t 为代表。w i n q u i s t 研究组【1 3 舶】 以金属裸电极为基础,将脉冲响应谱应用于电子舌的检测分析中,成功开发了伏 安型电子舌系统。此外,邓少平课题组【1 7 - 2 2 将组合脉冲弛豫谱思想应用到电子舌 的检测分析中,开发了可商品化的多频脉冲电子舌系统。 阻抗谱型电子舌以巴西r i u l 课题组【2 3 之5 】为代表,r i u l 凭借其在l a n g m u i r b l o d g e t t 膜上长期研究所积累的成果和经验,以聚吡珞( p p y ) 以及聚苯胺( p a n ) 掺杂 硬脂酸( s a ) 制成的l a n g m u i r - b l o d g e t t 膜传感器为基础,成功地将电化学阻抗谱 法应用于电子舌的检测分析中,并且取得良好应用效果。 表面声波型电子舌以c o l e t 2 6 ,2 7 墩授课题小组为代表,其所研制的电子舌主 要检测味质不同的声波相变化来反映修饰传感器与流体之间物理的相互作用,得 到的信息更多地偏向于溶液的物理味觉,主要是对液态食品的物理信号表征。 光寻址电位传感器【2 8 】是半导体的内光电效应光伏电压的电子舌,这种传感 器由参考电极、样本溶液、类脂膜、氧化物、半导体结构组成,当其他参数固定 后,外电流的大小变化反映了膜的响应。l a p s 也称为表面光伏技术或电位测量 交流生物传感器,光寻址电位传感器具有灵敏度高、稳定性好、可寻址能力容易 实现和高度集成的优点。但由于这些传感器只能检测某些特定的成分,因此在使 用上受到了局限。 4 浙江工商大学硕士学位论文 电子舌除了在实验室的研究进展迅速,同时商品化的电子舌系统也相继出 现。例如法国a l p h am o s 公司的a s t r e e 电子舌和日本k i y o s h it o k o 教授的 a n r i t u s 电子舌,其中a l p h am o s 公司生产的电子舌系统占全世界电子舌市场 的9 9 以上。商品化电子舌的出现,极大的推动了电子舌研究与应用的技术进步。 目前,电子舌广泛应用于环境、食品、生物、化工等领域,并且其应用领域还在 进一步拓宽。 1 2 模式识别技术 1 2 1 模式识别回顾 模式识别( p a t t 锄r e c o g n i t i o n ) 是对感知信号( 图像、视频、声音等) 进行分析, 对其中的物体对象或行为进行判别和解释的过程。模式识别能力普遍存在于人和 动物的认知系统,是人和动物获取外部环境知识,并与环境进行交互的重要基础。 现在所说的模式识别一般是指用机器实现模式识别过程,是人工智能领域的一个 重要分支。 现代模式识别是在2 0 世纪4 0 年代计算机发明以后逐渐发展起来的。在更早 的时候,就有用光学和机械手段实现模式识别的例子,例如在1 9 2 9 年g u s t a v t a u s c h e k 就在德国获得了光学字符识别的专利。作为统计模式识别基础的多元统 计分析和鉴别分析2 9 1 也在电子计算机出现之前就被提出来了。1 9 5 7 年,i b m 的 c h o wc k 将统计决策方法用于字符识别3 0 1 。然而,“模式识别 这个词被广泛 使用并形成一个领域则是在2 0 世纪6 0 年代以后。1 9 6 6 年,由i b m 组织在波多 黎各召开了第一次以模式识别 为主题的学术会议【3 1 1 。n a g y 的综述【3 2 1 和k a n a l 的综述分别介绍了1 9 6 8 年以前和1 9 6 8 1 9 7 4 的研究进展。7 0 年代相继出版了 几本很有影响的模式识别教材( 如f u k u n a g a 3 4 1 ,d u d a & h a r t 3 5 1 ) 和1 9 7 2 年第一届 国际模式识别大会( i c p r ) 的召开标志着模式识别领域的形成。同时,国际模式识 别协会( i a p r ) 在1 9 7 4 年第二届国际模式识别大会上开始筹建,于1 9 7 8 年第四届 大会上正式成立。 统计模式识别方法主要包括:b a y e s 决策、概率密度估计( 参数方法和非参数 方法) 、特征提取( 变换) 和选择、聚类分析等,在2 0 世纪6 0 年代以前就已经成型。 然而,统计方法不能表示和分析模式的结构,7 0 年代以后结构和句法模式识别 方法受到重视。尤其是付京荪( f uk s ) 提出的句法结构模式识别理论在7 0 8 0 年 浙江f t 商大学硕上学位论文 代受到广泛的关注。但是,句法模式识别中的基元提取和文法推断( 学习) 问题直 到现在还没有很好地解决,因而没有太多的实际应用。 2 0 世纪8 0 年代b a c k p r o p a g a t i o n ( b p ) 算法【3 6 】的重新发现和成功应用再次推 动了人工神经网络研究和应用的热潮。神经网络方法与统计方法相比具有不依赖 概率模型、参数自学习、泛化性能良好等优点,至今仍在模式识别中广泛应用。 然而,神经网络的设计和实现依赖于经验,泛化性能不能确保最优。9 0 年代支 持向量机【3 7 j ( s v m ) 的提出吸引了模式识别界对统计学习理论和核方法( k e m e l m e t h o d s ) 研究的极大兴趣。与神经网络相比,支持向量机的优点是通过优化一个 泛化误差界限自动确定一个最优的分类器结构,从而具有更好的泛化性能。而核 函数的引入使很多传统的统计方法从线性空间推广到高维非线性空间,提高了表 示和判别能力。 结合多个分类器的方法从9 0 年代前期开始在模式识别界盛行,后来受到模 式识别界和机器学习界的共同重视。多分类器结合可以克服单个分类器的性能不 足,有效提高分类的泛化性能。这个方向的主要研究问题有两个:给定一组分类 器的最佳融合和具有互补性的分类器组的设计。其中一种方法,b o o s t i n g ,现已 得到广泛应用,被认为是性能最好的分类方法。 目前,模式识别理论和技术已经成功地应用于生物医学、工业、国防、科研、 金融等诸多领域,如生物医学的细胞或组织分析、指纹识别、遥感图片的机器判 读、系统故障诊断、具有视觉的机器人、文字及语音信号的识别等等,并且逐渐 向其它领域延伸。 1 2 2 模式识别基本概念 广义地说,存在于时间和空间中可观察的事物,如果我们可以区别它们是否 相同或是否相似,都可以称之为模式【3 8 】。通常,我们把某一事物的具体体现称 之为模式,而把模式所属的类别或同一类中模式的总体称为模式类。模式识别中 心任务就是利用计算机对具体对象进行分类,在错误概率最小的条件下,使识别 的结果尽可能的与实际相符合。对于一个给定的模式,将面临识别或分类这两个 任务:( 1 ) 监督模式识别,将模式归类到已知的模式类中;( 2 ) 无监督模式识别, 将模式纳入到未知的模式类别中。 模式识别系统由三个部分构成3 9 】:( 1 ) 数据的获取与前处理:用计算机可以 6 浙江丁商大学硕:t :学位论文 运算的符号来表示所研究的对象;前处理对获取的模式信息进行去噪声,提取有 用信息;( 2 ) 特征提取与选择:对原始数据进行变换,得到最能反映分类本质的 信息;( 3 ) 分类决策:用已有的模式及模式类的信息进行训练,获得一定分类准 则,对未知模式进行分类。图1 2 是典型的模式识别详细图框,传感器是把声音 图像等输入转化为输入信号;分割器用于将物体与背景及其他物体分割开;特征 提取用于提取分类物体的属性;分类器根据特征给物体赋予标记;后处理做一些 其他处理,比如上下文信息、错误代价、选择合适的动作。分类器的设计是在训 练样本集合上进行优化( 如使每一类样本的表达误差最小或使不同类别样本的分 类误差最小) 的过程,也就是一个机器学习过程。这种描述强调了信息单方向自 左而右的流动,但有些系统则采用反馈机制( 虚线) 进行训练。 特 分 后 厶 决 征 类 口 提 器 处 策 取 理 图1 - 2 模式识别系统 f i g 1 - 2t h es y s t e mo fp a t t e r nr e c o g n i t i o n 1 2 3 模式识别分类 化学模式识别方法包括聚类分析、判别分析、特征投影显示等方法。按照有 没有训练集可以划分为无监督的模式识别方法和有监督的模式识别方法。无监督 模式识别方法包括聚类分析、主成分分析、最小生成树;有监督模式识别方法包 括线性判别分析、s i m c a 、人工神经网络等;特征投影显示既可属于无监督的, 也可属于有监督的。显示方法包括线性投影、非线投影性、变量- 变量绘图和 脸谱法等。 1 2 3 1 主成分分析 主成分分析( p r i n c i p l ec o m p o n e n ta n a l y s i s ,p c a ) 是一种最古老的多元统计分 析技术,属于无监督模式识别。p e a r s o n 删于1 9 0 1 年首次引入主成分分析的概念, h o t e l l i n g 4 1 1 在2 0 世纪3 0 年代对主成分分析进行了发展。主成分分析的中心目的 是将数据降维,简化问题,使数据可视化。因此,主成分分析将原始变量转换成 新变量,即所谓的主成分。每个主成分都是原始变量的线性组合。此方法得到的 7 浙江工商大学硕士学位论文 主成分轴是该数据矩阵方差最大的方向,且相互正交的。第一主成分携带的信息 量最多,第二主成分与第一主成分不相关,携带的信息量次之。实际上,主成分 分析仅保留携带足够多的有效信息的主成分。原始变量的线性组合系数称之为载 荷,即原始变量与新变量的相关系数。对得分矩阵作图,称之为得分图,可给出 各样本的区分归类效果,结果直观明了。 1 2 3 2 聚类分析 聚类分析4 2 】是无监督模式识别法的代表,其主要思路就是利用同类样本彼 此相似,即常说的“物以类聚 ,相类似的样本在多维空间中彼此间的距离应小 些,而不相似的样本在多维空间中彼此间的距离应大些。聚类分析即为如何使相 似的样本“聚 在一起,从而达到分类的目的。 1 2 3 3 判别分析 判别分析4 2 小1 是多变量统计中的基本方法之一,它是用一批己经具有明确分 类的样本( 训练样本) ,根据特定的测量指标,找出一个或多个判别函数用于判别 任意己知特定测量指标的取值,但未知分类的样本归属于哪一类,其目的是通过 筛选具有判别能力的指标,建立判别函数,用于新样本的分类。 1 2 3 4 软独立簇类模式分类 软独立簇类模式分类【4 5 ( s o f ti n d e p e n d e n tm o d e l i n go fc l a s sa n a l o g y , s i m c a ) 属于有监督模式识别,是在1 9 7 6 年由瑞典学者w o l d 所提出,很快受到普遍的 重视,并在化学中得到广泛的应用。s i m c a 方法是一种建立在主成分分析基础 上的模式识别方法,其基本思路是先利用主成分分析的显示结果得到一个样本分 类基本印象,然后分别对各类样本建立相应的类模型,继用这些类模型来对未知 类进行判别分析,以确定其属于哪一类,或不属于哪一类。其实,s i m c a 是在 循环地使用主成分分析方法,先是对整个样本进行主成分分类,然后通过建立各 类样本的主成分模型,来检验未知样本属于哪个类。每一类模型训练集的主成分 数目是通过交叉检验确定的。这样,保留的主成分尽可能多的保留每类变量的有 效信息,同时确保了高信噪比。 1 2 3 5 偏最小二乘判别分析 偏最小二乘判别分析 4 4 1 ( p a r t i a ll e a s ts q u a r e sd i s c r i m i n a n ta n a l y s i s ,p l s d a ) 是特征投影显示方法的一种,揭示自变量( x ) 和因变量( y ) 之间的模型关系,特别 浙江工商大学硕上学位论文 适用于自变量个数多于观测样本数目或变量之间存在高度相关的场合。p l s 的原 则是寻找输入矩阵( x ) 的那些与输入变量尽可能相关的成分,同时与y 矩阵的目 标值达到最大相关。因此,p l s 模型寻找描述y 的隐变量同时也能描述x 的隐 变量。偏最小二乘判别目标是寻找校正集中类判别的变量和方向。校正集中最佳 隐变量个数由交叉有效性检验确定。 在p l s d a 中,假设矩阵y 由l 和0 构成( 对两类模型而言) ;而对于多类模 型,可以由其他整数,如l ,2 ,3 等构成。矩阵x 和y 分解产生得分矩阵和 载荷矩阵。与p c r 相比,p l s 除利用x 信息之外,也考虑y 的信息。其中,x 的载荷是通过y 的得分来计算的,而y 的载荷是通过x 的得分来确定,分解过 程不是独立的。一个样本的预测值与y 中元素1 接近,则属于l 类;反之,则 属于另一类。 1 2 3 6 人工神经网络 人工神经网络( a r t i f i c i a ln e u r a ln e t ,a n n ) 的研究起始于2 0 世纪4 0 年代,但 发展一直比较缓慢。2 0 世纪8 0 年代后,由于h o p f i e l d 4 6 ,4 7 j 的- rf l e 大大地推动了 人工神经网络的研究及应用。现在人工神经网络已经成为解决化学问题的一种重 要的化学计量学手段。人工神经网络的基本思想是基于人脑细胞( 神经元) 的工作 原理来模拟人类思维方式,以建立模型来进行分类与预测。但是,人工神经网络 方法只是简单地借用神经元来表示一个计算单元。误差反传算法的三层前传网络 是一种典型的人工神经网络,从下往上分别称为输入层、隐蔽层和输出层。最底 层为输入层,每个结点代表一个输入元素,通过权重系数和活性函数与隐蔽层中 的结点相连接,然后隐蔽层中的隐节点在通过权重系数和活性函数与输出层中的 结点连接,最终输出结裂4 4 ,4 8 1 。人工神经网络具有对于问题的了解较少、适用 高速并行处理系统、可对特征空间进行较为复杂的划分等优点,但是人工神经网 络理论也不是完美的,例如,需要更多的训练数据,在非并行处理系统中模拟运 行速度很慢,以及无法获得特征空间中的决策面。 常用的人工神经网络有前馈神经网络、k o h o n e n 神经网络、自组织映射神经 网络等,最为流行的是b p 算法神经网络。如图1 3 所示 9 浙江工商大学硕士学位论文 一 x 2 x n w 1 y 输入 出层 藏层 入层 图l - 3 神经兀和神经网络示意图 f i g 1 - 3t h es k e t c hm a po f n e u r a la n dn e u r a ln e t 1 2 3 7 新的模式识别方法 近些年来,一些新的模式识别方法不断呈现。v a p n i k 提出的支持向量机作为 一种新的统计模式识别方法,成为机器学习研究的一个新热点。支持向量机是基 于结构风险最小化原理,通过非线性将输入变换到新的高维空间,然后在这个新 空间中求取最优线性分类面,实现样本分类【3 7 ,3 8 1 。支持向量分类函数形式上类 似于一个神经网络,输出是中间节点的线性组合,每个中间节点对应一个支持向 量。该方法应用于函数逼近、时间序列预测、故障预测和识别、信息安全、电力 系统手写数字识别、语音识别、人脸图像识别、文本分类等领域。 x lx ?)ca 图1 4 支持向量机示意图 f i g 1 - 4t h es k e t c hm a p o fs u p p o r tv e c t o rm a c h i n e 独立成分分析【4 9 巧3 1 是近些年新发展起来的一种新的信号和数据处理方法,最 早是为解决鸡尾酒问题而被提出的。它是主成分分析从二阶统计量向高阶统计量 的一种拓展,用于非高斯数据的线性变换。经独立成分分析获得的各成分之间是 统计独立或尽可能的独立,突出源信号的本质结构。用于揭示随机变量、测量数 据或信号中的隐藏成分。其基本模型如下: l o 浙江工商大学硕:t 学位论文 设观测信号可概括为线性模型: x ( f ) = 彳s ( f ) + ,2 ( f )( 1 - 4 ) 其中:a 为信号的混合矩阵;x ( t ) 为n 维观测信号矢量;s ( t ) 为独立的m ( m 鳓 维未知源信号矢量;n ( t ) 为观测噪声矢量。 i c a 的目的就是寻求一线性变换w ,通过它能由观测信号恢复相互独立的 源信号s ( t ) : 少( f ) = w x ( t ) = w a s ( t )( 1 5 ) 其中:y ( t ) 即为s ( t ) 的估计矢量。当分离矩阵w 是a 的逆时,源信号s ( t ) 能 被精确地提取出来。在i c a 的理论和算法中,一般都作了如下假设: ( 1 ) 观测信号x ( t ) 的数目大于或等于源信号s ( t ) 的数目; ( 2 ) 源信号s ( t ) 的各成分是瞬时统计相互独立的; ( 3 ) s ( t ) 中至多有一个高斯信号; ( 4 ) 无噪声或只有低的添加性噪声时,( 1 4 ) 式的模型可简化为x ( f ) = a s ( t ) 。 目前,该方法在语音信号分离、特征提取、故障诊断、生物医学信号处理、 无线通信、金融时间序列分析和数据挖掘等实际领域中的应用报道正在不断涌 现;与此同时,也出现了作为电子鼻模式识别方法的相关报道【体5 7 1 。 1 3 模式识别在电子舌中的应用现状 随着模式识别技术的不断发展以及电子舌应用领域的不断拓宽,应用于电子 舌的模式识别方法越来越多。目前,电子舌常用的模式识别方法有线性的主成分 分析、p l s d a 、s i m c a 、判别函数分析以及非线性的人工神经网络等。 w i n q u i s tf 等【5 8 1 采用p c a 方法对不同的果酱进行了区分,但是无法将橘子酱 和苹果酱区分开;k i k k a w a 等采用p c a 对不同味觉特征的氨基酸进行区分; l e g i na 等【删采用p c a 方法对不同的饮料进行区分:t i a ns y 等【1 7 】采m p c a 对不 同的酒、茶进行区分;k i mj d 等【6 1 】采用p c a 和c 均值模糊识别方法对不同的啤 酒和茶叶进行区分辨识。主成分分析具有计算快速和结果直观明了的优点,几乎 为所有电子舌课题所采用,但其无

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论