(应用化学专业论文)复杂色谱谱图自动解析技术在烟草分析中的应用.pdf_第1页
(应用化学专业论文)复杂色谱谱图自动解析技术在烟草分析中的应用.pdf_第2页
(应用化学专业论文)复杂色谱谱图自动解析技术在烟草分析中的应用.pdf_第3页
(应用化学专业论文)复杂色谱谱图自动解析技术在烟草分析中的应用.pdf_第4页
(应用化学专业论文)复杂色谱谱图自动解析技术在烟草分析中的应用.pdf_第5页
已阅读5页,还剩79页未读 继续免费阅读

(应用化学专业论文)复杂色谱谱图自动解析技术在烟草分析中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 随着色谱技术的进步,色谱的分辨能力日益提高,在分析检测领域的应用也 逐渐广泛,在烟草分析领域亦是如此。为了提高烟草的品质,需要了解烟草中种 种化学成分的组成与含量,因此,作用化学分析的一把利器,色谱分析在烟草化 学中的地位日益重要。然而,大量的复杂色谱谱图的分析却成了人们必须要解决 的一个难题。面对大量复杂的色谱数据,设计一个自动化的色谱系统成为了亟待 解决的问题。 为此,我们综述了烟草分析领域主要的一些分离、分析技术,并以此为基础, 做了一些初步的尝试,建立了一种快速确定重叠色谱组分数的方法,并且完成了 e m g 模型的快速实现。在积累了一些经验之后,我们将关注的重点集中在色谱 解析中的两大难题:基线漂移和谱峰重叠。 针对基线漂移,依据移动平均的特点,我们提出了基于多通道移动平均的基 线消除算法,尝试将基线从色谱曲线中进行剥离。通过验证,多通道移动平均对 基线提取具有很好的效果。为了确定多通道移动平均的窗v 1 尺寸,我们设计了衰 越函数,最终实现了在无人指导的条件下,对色谱曲线进行自动的基线消除,取 得了令人十分满意的结果。 基线消除算法的实现,为复杂色谱的自动化解析铺平的道路。结合面积重现 法和基于高阶导数的谱峰识别方法,我们实现了复杂色谱谱图的自动化解析。通 过模拟色谱和烟气色谱进行处理,实验结果表明我们提出的自动化色谱解析系统 具有良好的性能。 另外,有一点值得提出的是,我们的提出的基线消除算法和自动化谱图解析 方法不仅适用于色谱,也适用于其它的谱图,比如:c e 、n m r ,x r d 等。 关键词:烟草分析基线消除谱峰识别谱峰重叠色谱解析 a b s t r a c t a b s t r a c t a l o n gw i t ht h ed e v e l o p m e n to fc h r o m a t o g r a p h i ct e c h n i q u e s ,t h er e s o l v i n gp o w e r o ft h ec h r o m a t o g r a p h i ci n s t r u m e n t sh a sb e e ni m p r o v e d ,w h i c ha r eu s e db r o a d l yi nt h e a n a l y s i sf i e l d i no r d e r t oi m p r o v et h eq u a l i t yo ft h et o b a c c o ,i ti sr e q u i r e dt ok n o wt h e s p e c i e sa n dc o n t e n t so ft h ec h e m i c a lc o m p o u n d si nt h et o b a c c o a st h em a i nm e t h o d i nc h e m i c a la n a l y s i s ,c h r o m a t o g r a p h i ca n a l y s i st a k e si m p o r t a n tr o l ei nt h et o b a c c o c h e m i s t r y h o w e v e li ti si n t r a c t a b l ep r o b l e mt or e s o l v et h ea b u n d a n td a t a s o ,i ti sa n e c e s s a r yt od e s i g nas y s t e mt or e s o l v et h ec h r o m a t o g r a p h i cs i g n a l sa u t o m a t i c a l l y f i r s t ,t h em a i nm e t h o d sa b o u tt h es e p a r a t i o na n da n a l y s i si nt h et o b a c c os c i e n c e w e r er e v i e w e d b a s e do nt h i s ,an e wm e t h o dw a sp r o p o s e dt od e t e r m i n et h e c o m p o n e n tn u m b e ri nt h eo v e r l a p p i n gc h r o m a t o g r a p h i cp e a k sr a p i d l y m e a n w h i l e ,w e a c h i e v e dt h ee x p e d i e n tr e a l i z a t i o no ft h ee m gm o d e l w i t hs o m ee x p e r i e n c e ,o u r t a r g e tw a sm o v e dt o t h et w ob a s i cp r o b l e m si nt h er e s o l u t i o no fc h r o m a t o g r a p h i c s i g n a l s :b a s e l i n ed r i f t i n ga n dp e a ko v e r l a p p i n g a c c o r d i n gt ot h ep r o p e r t yo ft h em o v i n ga v e r a g em e t h o d ,m u l t i p l e p a s sm o v i n g a v e r a g eb a s e dm e t h o dw a sp r o p o s e dt od e a lw i t ht h eb a s e l i n ed r i f t i tw a sp r o v e dt h a t t h i sm e t h o dw a se f f e c t i v e i no r d e rt od e t e r m i n et h ew i n d o ws i z eo ft h em u l t i p l e p a s s m o v i n ga v e r a g em e t h o d ,d e c a yc u r v ew a su s e d ,w h i c hm a d et h ea l g o r i t h m t o e l i m i n a t et h eb a s e l i n ea u t o m a t i c a l l y t h er e a l i z a t i o no fb a s e l i n ee l i m i n a t i o nm a d ei t p o s s i b l e t or e s o l v et h e c o m p l i c a t e dc h r o m a t o g r a p h i cs i g n a l sa u t o m a t i c a l l y a r e ar e p r o d u c t i o nm e t h o dw a s i n t r o d u c e di nc o m b i n a t i o nw i t h p e a kr e c o g n i t i o na l g o r i t h mb a s e do nh i g h o r d e r d e r i v a t i v e st oa u t o m a t et h ec h r o m a t o g r a m sd i v i s i o n ,p e a kr e c o g n i t i o na n dr a p i d r e s o l u t i o n i tw a sp r o v e dt h a tt h em e t h o dw a sau s e f u lt o o lb ya p p l y i n gi tt ot h em o d e l a n ds m o k ec h r o m a t o g r a p h i cs i g n a l s f u r t h e r m o r e ,i ti sw o r t h yt on o t et h a tt h em e t h o dp r o p o s e di nt h i sp a p e rw a sa l s o c a p a b l et oo t h e rs i g n a l s ,f o re x a m p l e :c e ,n m r ,x r d ,e t a 1 k e yw o r d s :t o b a c c oa n a l y s i s ,b a s e l i n ee l i m i n a t i o n ,p e a kr e c o g n i t i o n ,p e a k o v e r l a p p i n g ,r e s o l u t i o no fc h r o m a t o g r a p h i cs i g n a l s , i i 中国科学技术大学学位论文相关声明 本人声明所呈交的学位论文,是本人在导师指导下进行研究工作 所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任 何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究 所做的贡献均已在论文中作了明确的说明。 本人授权中国科学技术大学拥有学位论文的部分使用权,即:学 校有权按有关规定向国家有关部门或机构送交论文的复印件和电子 版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 保密的学位论文在解密后也遵守此规定。 作者签名: 2 勺年 f 第1 章烟草分析中的主要方法,:二其【町对的挑战 第l 章烟草分析中的主要方法及其面对的挑战 烟草是一种叶用经济作物,其主要用途是将其叶片加工成各种各样的烟制品 供人们吸食。和其它的食品一样,烟草的品质受到人们的广泛关注。烟草的品质 主要是由其内在化学成份的组成含量所决定的。 比如,酚类物化合物是自然界中常见的一类化合物,烟气中酚类物质有4 0 多种,其中最主要的有苯酚、苯二酚和甲基苯酚等。烟气酚类化合物主要来源于 烟叶中多酚化合物( 绿原酸、芸香苷) 的裂解,对烟草的香气品质有很重要的作用, 但有些酚类物质则具有促痛作用,而且苯酚、甲基苯酚、儿茶酚等还有难闻的气 味;问一甲苯酚、对一甲苯酚、邻一甲苯酚、间一苯二酚、儿茶酚以及苯酚则是 降低烟草危害性的控制成分。另外,多环芳烃是最早发现的具有“致癌、致畸、 致突变”作用的环境污染物之一,也是烟气中类主要的致癌物。 因此,了解烟草化学成分的结构、性质以及含量是烟草化学研究的一个重要 内容。然而,烟草的化学成分极为复杂,已经分离出来的就有5 0 0 0 多种。在1 9 8 2 年1 0 月召开的3 6 届美国烟草化学工作者会议( t c r c ) 上,m f d u b e 和c g r e e n 报道了存在于烟气和烟草中的化学成分有1 1 3 5 种,仅存在于烟草中的化学成分 有1 4 1 4 中,仅存在于烟气中的化学成分有2 7 4 0 种,共计5 2 8 9 种。 要搞清楚这些物质的结构、性质和含量是一个十分困难的过程,为了应对这 个挑战,人们发展了一系列的分离、分析以及解析方法,极大地推动了烟草化学 的发展。 1 1烟草分析中的分离技术 为了取得更好的分析效果,首先要进行分离处理,将一部分化学成分从烟草 样品中分离出来。常见的分离方法除了常见的溶剂萃取、水蒸气蒸馏以外,还有: 固相萃取、超临界流体萃取、同时蒸馏萃取法等。下面我们将做一个简要的介绍。 1 1 1固相萃取 固相萃取( s o l i dp h a s ee x t r a c t i o n ,s p e ) 是由液一固萃取和液相色谱柱技术相 第l 章烟草分析中的土要方法及其面对的挑战 结合而发展起来的一种样品前处理方法,自从1 9 7 8 年第一次出现s p e 商品柱算 起,s p e 已有2 0 多年的历史了。在许多情况下,s p e 作为液体试样制备的优先 方案取代了传统的液一液萃取法( l i q u i d l i q u i de x t r a c t i o n ,l l e ) 。与l l e 法相比, s p e 技术有如下优点:( 1 ) 有机溶剂消耗小,待分析成分被s p e 柱富集仅仅需要 少量的洗脱剂( 1 3 m 1 ) 就能把待分析成分洗下,有机溶剂消耗远远低于传统的液 一液萃取。( 2 ) 富集倍数高,用s p e 柱富集样品时,如环境水样,可把几十至几 百毫升样品中的待测组分富集到几个毫升的洗脱液中,富集倍数达数十到数百 倍,富集倍数远远高于传统的l l e ,而且待测组分浓度越低,方法优势越明显。 ( 3 ) 克服了l l e 易乳化,相分离慢的缺点,对环境的污染小,符合绿色化学的要 求。( 4 ) 能有效地进行样品纯化和干扰组分的预分离。s p e 技术可结合待测组分 的特点,有针对性的选用柱材料,有选择性地富集待测组分,也可以让干扰组分 保留在小柱上而让待测组分不保留,从而分离干扰组分。所以,除了富集之外, s p e 技术还是样品纯化和干扰组分预分离的有效手段。( 5 ) 便于样品的储存和运 送,s p e 可通过样品中待测组分富集在小柱上保存,克服了液体样品在运输储存 过程中易发生变化和损失,大体积不易运输储存的缺点,特别适合远距离如环境 监测中的现场采样。此外,s p e 技术具有操作简便,易实现自动化,便于批量样 品处理,速度快等特点。 1 1 2 超临界萃取 超临界流体萃取( s u p e r c r i t i c a lf l u i de x t r a c t i o n ,s f e ) 足7 0 年代末发展起来的 种新型物质分离、精制技术,随后便以其环保、高效等显著优势轻松超越传统 技术,迅速渗透到萃取分离、石油化工、化学反应工程、材料科学、生物技术、 环境工程等诸多领域,并成为这些领域发展的主导之一。所谓超临界流体,是指 物体处于其临界温度和临界压力以上时的状态。这种流体兼有液体和气体的优 点,密度大,粘稠度低,表面张力小,有极高的溶解能力,能深入到提取材料的 基质中,发挥非常有效的萃取功能,而且这种溶解能力随着压力的升高而急剧增 大。这些特性使得超临界流体成为一种很好的萃取剂。而超临界流体萃取就是利 用超临界流体的强溶解能力的特性,从动、植物中提取各种有效成分,再通过减 压将其释放出来的过程。虽然对应各种压力范围所得到的萃取物不可能是单一 2 第1 童烟草分忻中的主要方法及其丽对的挑战 的,但是可以控制条件得到最佳比例的混合成分,然看借助减压、升温的方法使 超临界流体变成普通气体,被萃取物质则完全或基本析出,从而达到分离提纯的 目的,所以超临界流体过程是由摹取和分离组合而成的。超临界流体作为介质或 反应物已引起人们的极大兴趣,因为环境友好的超临界流体( 如超临界二氧化碳、 超临界水等) 有望取代有害的有机溶剂。 1 1 - 3同时蒸馏萃取 同时蒸馏萃取( s i m u l t a n e o u sd i s t i l l a t i o ne x t r a c t i o n 。s d e ) 是将水蒸气蒸馏和 溶剂提取两个步骤合并,直接得到挥发性、半挥发性的有机溶剂浓缩液。同时蒸 馏萃取具有良好的重复性和较高的萃取量,而且操作简便、定性定量效果好,是 一种行之有效的前处理方法。 1 2色谱 随着色谱技术的进步,色谱分析方法在烟草化学中的应用越来越受到人们的 关注。气相色谱( g a sc h r o m a t o g r a p h y , g c ) 、高效液相色谱( h i g hp e r f o r m a n c e l i q u i dc h r o m a t o g r a p h y , h p l c ) 及其它们与质谱的联用技术在烟草分析中占有重 要地位。 色谱法,又称层析法,根据其分离原理,有吸附色谱、分配色谱、离子交换 色谱与排阻色谱等方法。吸附色谱是利用吸附剂对被分离物质的吸附能力不同, 用溶剂或气体洗脱,以使组分分离。常用的吸附剂有氧化铝、硅胶、聚酰胺等有 吸附活性的物质。分配色谱是利用溶液中被分离物质在两相中分配系数不同,以 使组分分离。其中一相为液体,涂布或使之键合在固体载体上,称固定相;另一 相为液体或气体,称流动相。常用的载体有硅胶、硅藻土、硅镁型吸附剂与纤维 素粉等。离子交换色谱是利用被分离物质在离子交换树脂上的离子交换势不同而 使组分分离。常用的有不同强度的阳、阴离子交换树脂,流动相一般为水或含有 有机溶剂的缓冲液。排阻色谱又称凝胶色谱或凝胶渗透色谱,足利用被分离物质 分子量大小的不同和在填料上渗透程度的不同,以使组分分离。常用的填料有分 子筛、葡聚糖凝胶、微孔聚合物、微孔硅胶或玻璃珠等,可根据载体和试样的性 质,选用水或有机溶剂为流动相。色谱法的分离方法,有柱色谱法、纸色谱法、 3 第l 章烟草分忻中的t 要方法及其面对的挑战 薄层色谱法、气相色谱法、高效液相色谱法等。 高效液相色谱法按分离机制的不同分为液固吸附色谱法、液液分配色谱法 ( 正相与反相) 、离子交换色谱法、离子对色谱法及分子排阻色谱法。 1 液固色谱法 使用固体吸附剂,被分离组分在色谱柱上分离原理足根据固定相对组分吸附 力大小不同而分离。分离过程是一个吸附一解吸附的平衡过程。常用的吸附剂为 硅胶或氧化铝,粒度5 1 0 1 a m 。适用于分离分子量2 0 0 1 0 0 0 的组分,大多数用 于非离子型化合物,离子型化合物易产生拖尾。常用于分离同分异构体。 2 液液色谱法 使用将特定的液态物质涂于担体表面,或化学键合于担体表面而形成的固定 相,分离原理是根据被分离的组分在流动相和固定相中溶解度不同而分离。分离 过程是一个分配平衡过程。涂布式固定相应具有良好的惰性;流动相必须预先用 固定相饱和,以减少固定相的流失:温度的变化和不同批号流动相的区别常引起 柱子的变化;另外在流动相中存在的固定相也使样品的分离和收集复杂化。由于 涂布式固定相很难避免固定液流失,现在已很少采用。现在多采用的是化学键合 固定相,如c 1 8 、c 8 、氨基柱、氰基柱和苯基柱。液液色谱法按固定相和流动相 的极性不同可分为正相色谱法( n p c ) 和反相色谱法( r p c ) 。 正相色谱法 采用极性固定相( 如聚乙二醇) ;流动相为相对非极性的疏水性溶剂( 烷烃 类如正已烷、环已烷) ,常加入乙醇、异丙醇、四氢呋喃、三氯甲烷等以调节组 分的保留时间。常用于分离中等极性和极性较强的化合物( 如酚类、胺类、羰基 类及氨基酸类等) 。 反相色谱法 一般用非极性固定相( 如c 1 8 、c 8 ) ;流动相为水或缓冲液,常加入甲醇、 乙腈、异丙醇、丙酮、四氢呋喃等与水互溶的有机溶剂以调节保留时间。适用于 分离非极性和极性较弱的化合物。r p c 在现代液相色谱中应用最为广泛,据统 计,它占整个h p l c 应用的8 0 左右。随着柱填料的快速发展,反相色谱法的 应用范围逐渐扩大,现已应用于某些无机样品或易解离样品的分析。为控制样品 在分析过程的解离,常用缓冲液控制流动相的p h 值。但需要注意的是,c 1 8 和 4 第1 章烟草分听中的主要方法及其面对的挑战 c 8 使用的p h 值通常为2 5 7 5 ( 2 8 ) ,太高的p h 值会使硅胶溶解,太低的p h 值会使键合的烷基脱落。 3 离子交换色谱法 固定相是离子交换树脂,常用苯乙烯与二乙烯交联形成的聚合物骨架,在表 面末端芳环上接上羧基、磺酸基( 称阳离子交换树脂) 或季氨基( 阴离子交换树 脂) 。被分离组分在色谱柱上分离原理是树脂上可电离离子与流动相中具有相同 电荷的离子及被测组分的离子进行可逆交换,根据各离子与离子交换基团具有不 同的电荷吸引力而分离。缓冲液常用作离子交换色谱的流动相。被分离组分在离 子交换柱中的保留时间除跟组分离子与树脂上的离子交换基团作用强弱有关外, 它还受流动相的p h 值和离子强度影响。p h 值可改变化合物的解离程度,进而 影响其与固定相的作用。流动相的盐浓度大,则离子强度高,不利于样品的解离, 导致样品较快流出。离子交换色谱法主要用于分析有机酸、氨基酸、多肽及核酸。 4 离子对色谱法 又称偶离子色谱法,是液液色谱法的分支。它是根据被测组分离子与离子对 试剂离子形成中性的离子对化合物后,在非极性固定相中溶解度增大,从而使其 分离效果改善。主要用于分析离子强度大的酸碱物质。分析碱性物质常用的离子 对试剂为烷基磺酸盐,如戊烷磺酸钠、辛烷磺酸钠等。另外高氯酸、三氟乙酸也 可与多种碱性样品形成很强的离子对。分析酸性物质常用四丁基季铵盐,如四丁 基溴化铵、四丁基铵磷酸盐。离子对色谱法常用o d s 柱( 即c 1 8 ) ,流动相为甲 醇水或乙腈水,水中加入3 1 0m m o l l 的离子对试剂,在一定的p h 值范围内 进行分离。被测组分保留时问与离子对性质、浓度、流动相组成及其p h 值、离 子强度有关。 5 排阻色谱法 固定相是有一定孔径的多孑l 性填料,流动相是可以溶解样品的溶剂。小分子 量的化合物可以进入孔中,滞留时间长;大分子量的化合物不能进入孔中,直接 随流动相流出。它利用分子筛对分子量大小不同的各组分排阻能力的差异而完成 分离。常用于分离高分子化合物,如组织提取物、多肽、蛋白质、核酸等。 第i :蕈烟草分析中的土要方法及其面对的挑战 1 3 色谱一质谱联用技术 质谱法( m a s ss p e c t r o m e t r y , m s ) 的基本原理是有机物样品在离子源中发生电 离,生成不同质荷比的带正电荷离子,经加速电场的作用形成离子束,进入质量 分析器,再利用电场和磁场使用发生色散、聚焦,获得质谱图。根据质谱提供的 信息可进行有机物、无机物的定性、定量分析,复杂化合物的结构分析,同位素 比的测定以及固体表面的结构和组成的分析。 而色谱法是一种对有机化合物有效的分离和分析方法,特别适合进行有机化 合物的定量分析,但定性分析则比较困难。 通过色谱一质谱的联用,将色谱的分离能力和质谱的鉴别能力相结合,可实 现对复杂混合样品进行分离、定性以及定量分析,是一种很好的现代分析方法。 两者的有机结合为化学家提供了一个进行复杂物质高效的定性、定量分析的工 具。目前,色谱一质谱联用已经是一个比较成熟的技术,它结合了色谱对混合有 机化合物较强的分离能力和质谱的极高的灵敏度和强大的鉴定能力,成为剖析有 机混合物的利器。 1 。4 面对的挑战 在日常色谱定量分析中,出现色谱峰形异变或鬼峰,不但严重影响定量精度, 甚至使分析工作无法进行。通过寻找峰形变异原因,排除各种故障之后,这些问 题大多可以得到解决。然而,基线漂移、谱峰重叠依然是色谱分析中要面对的巨 大挑战。 1 4 1 基线飘移 在色谱分析中,时常会遇到基线漂移问题,表现为基线的无规则变化,对色 谱图的解析造成很大的困难,严重降低了色谱分析的准确性,特别是弱信号的测 量影响更大【1 引。基线漂移问题,原则上可以采用空白实验信号进行扣除,但实 际操作中会造成操作上的多种麻烦,更重要的是基线不一定具有很好的重现性。 6 第l 章烟草分析中的主要方法及其面对的挑战 1 4 2 谱峰重叠 在处理复杂体系的时候,常常由于待分析物种的物理化学性质比较相似,而 导致保留时间接近,形成重叠峰的情况,对色谱解析是一个十分困难的问题4 巧j 。 1 5 本章总结 在本章中,我们介绍了烟草分析中主要的分离技术和分析技术,特别是色谱 技术。色谱分析是目前应用最为广泛的分析方法,基线漂移和谱峰重叠是色谱分 析面对的最大挑战,为我们下一步的研究指明了方向。 参考文献 【l 】王瑛,莫金垣计算机与应化学,2 0 0 3 ,2 0 ( 5 ) :7 0 1 7 0 2 【2 】胡劲松,鲍吉龙,周方洁,管博分析化学,2 0 0 6 ,3 4 ( 3 ) :4 l8 - 4 2 0 【3 】孔宏传,路鑫,阮春海,等分析化学,2 0 0 3 ,31 ( 4 ) :4 0 9 4 1 3 4 】邵学广,孙培艳,蔡文生,等分析化学,1 9 9 7 ,2 5 ( 6 ) :6 7 1 6 7 4 5 】张小叶,祝惠英分析化学,1 9 9 9 ,2 7 ( 11 ) :1 3 2 4 1 3 2 8 7 第2 章色谱解俨技术及乓进展 第2 章色谱解析技术及其进展 随着色谱技术的进步,色谱的分辨能力同益提高,在分析检测领域的应用也 逐渐广泛。近年来,人们提出了许多色谱解析的方法,在本章中,我们将简要的 就常见的免算:上、爨体等;上、小波变换以及人工冲经网络等方法作一下简单的 介绍。最后,我们在此基础之上,就色谱解析问题做了一些简单的尝试。 2 1色谱模型 选择合适的色谱模型是色谱解析过程中至关重要的一步。为此,人们建立了 一系列的色谱模型,相关文献1 对此有详尽的比较和讨论。其中比较经典的是 g a u s s 模型和e m g 模型。 2 1 1g a u s s 模型 r e t e n t i o ntm e ( r a i n ) f i g u r e2 1 g a u s sm o d e l 根据塔板理论,当塔板数目足够多时,流出曲线的组分峰趋于讵态分布。目 8 第2 章色谱解析技术,殳其进:琵 前,高剪i 馍型 | ! j 一沪日来描述色,酱峰形并取得了良好的效果。高斯模? 鬯的函数形 勾 矿= 扣p 卜2 亿, 其中n 为q 分数,c t 为组分i 的浓度,一为组分f 的保留时间,彬为组分f 的 半高宽。 从图2 1 可以看出,g a u s s 模型描述的是一个对称的峰形。 2 1 2 e m g 模型 r e t e n t i o nt i m e ( m i n ) f i g u r e2 2e m g m o d e l e m g 模型,即指数修正的高斯模型,在化学领域有着十分重要的应用,在 色谱的定性、定量方面的应用尤其广泛。e m g 模型整合了e f t 函数,是对高斯模 型的一个修正,有效地描述了色谱峰的拖尾现象。因此,e m g 模型可以很好地 拟合色谱曲线,结合演化算法等技术,就可以实现对各种色谱曲线的拟合解析。 e m g 模型模拟重叠色谱,如下所示: 9 第2 章色谱解析技术及其进展 心) = 知f ,立2 r 2 导止而1 唧( 卜 亿2 , 7 一t t g o g 厶一一 g o t 6 其中a 为峰面积,g 为保留时间,r 为指数修正时间常数,o g 控制峰的拖尾。 从图2 2 可以发现,e m g 模型可以对拖尾的色谱峰进行很好的描述。 2 2 色谱解析技术 基于模拟生物体系的智能计算方法的研究在近年来受到了人们的广泛关注, 其中主要包括免疫算法、遗传算法以及人工神经网络等。免疫算法( i m m u n e a l g o r i t h m ,i a ) 是近几年发展起来的另一种基于模拟生物体系的算法,是基于对免 疫系统中免费过程的模拟,已在信息科学、工来控制模拟、计算机科学等领域有 。1 一l所应用,但在化学领域的应用才刚圈0 起步【4 捌。遗传算法( g e n e t i ca l g o r i t h m ,g a ) 是基于达尔文进化论中“优胜劣汰”思想通过对群体进化过程的模拟,主要应用于 优化、搜索等问题的解决【1 0 0 1 1 。人工神经网络( a r t i f i c i a ln e u r a ln e t w o r k ,a n n ) 是 基于对神经系统的模拟,主要应用于模式识别、参数优化等领域【l2 1 。 2 2 1免疫算法 生物体的免疫系统是一个复杂的自适应系统,它能有效地抵抗外来的入侵 者,如细菌、病毒等等。免疫系统的主要任务是识别细胞是否是自我的,然后激 励适当的防御机制与外来抗原进行抗争。从信息处理方面来看,免疫系统犹如是 一个高度并行和分布式的计算机系统,具有一些信号处理的关键特征,例如识别、 特征提取、多样性、学习、记忆、分布式和随机探测、自我调节、阈值机制、联 合激励和动态保护等。因此,不断涌现出各类计算机模型,用来模拟免疫系统的 不同功能或生物学意义上的整体行为。 免疫算法是基于免疫系统中抗体与抗原的相互作用过程的模拟而建立的一 种计算方法。免疫作用的基本过程呵简单描述为:由抗原( 病毒或病毒的碎片) 的 入侵开始,当抗原进入血液和淋巴系统后被b 细胞膜中的抗体识别,然后t 细 l o 第2 章色谱解析技术硬其进展 胞接受到吞噬细胞关于抗原的信息并刺激b 细胞的繁殖。b 细胞产生抗体并有一 部分转化为记忆细胞,同时产生t 抑制细胞调整b 细胞的繁殖。抗体通过心脏 进入血液并与抗原结合,在吞噬细胞和其它蛋白质的协同作用下杀死抗原。如果 抗原仍然存在,将产生新的亲和力更强的抗体。免疫算法的过程如下图所示: f i g u r e2 3 f l o w c h a r to fi m m u n ea l g o r i t h m 免疫算法具有以下特点: ( 1 ) 产生的抗体具有多样性 免疫系统通过细胞的分裂和分化作用产生大量的抗体抵御外来的抗原,这一 机制使免疫算法在解决问题时具有全局性,有助于解决优化算法中的局部优化问 题。 第2 章色谱解忻技术及其进展 ( 2 ) 自我凋节能力 免疫系统根据目前的抗原情况和外界环境通过对抗体的促进、变异、抑制等 自我调节抗体的种类和数量,这一机制有助于提高免疫算法的自适应性。 ( 3 ) 识别和信息交流能力 免疫系统中各个作用单元( 细胞、抗体等) 之间不仅具有识别能力而且具有信 息的交流,这一机制将提高免疫算法解决问题的针对性和启发性,从而也提高了 免疫算法的效率和解决问题的速度。 ( 4 ) 记忆能力 免疫系统中产生的部分细胞会作为记忆细胞被保存下来,这一机制不仅使免 疫算法解决同一类型的问题时具有特别高的效率,而且使免疫算法具有学习功 能。 根据免疫算法的基本原理和基本步骤,提出了一种用于分析信号处理的免疫 算法。该方法模拟免疫系统中抗体一抗原的相互作用,通过系统对抗原( 输入信 号) 的识别、抗体( 标样信号) 与抗原亲和力的调整,以及抗体对抗原的消除等实现 了分析化学中重叠信号的解析和有用信号的提取。 2 2 2 遗传算法 遗传算法是一类借鉴生物界的进化规律( 适者生存,优胜劣汰遗传机制) 演化 而来的随机化搜索方法。它是由美国的j h o l l a n d 教授1 9 7 5 年首先提出,其主 要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定;具有内在 的隐并行性和更好的全局寻优能力;采用概率化的寻优方法,能自动获取和指 导优化的搜索空间,自适应地调整搜索方向,不需要确定的规则。遗传算法的这 些性质,已被人们广泛地应用于组合优化、机器学习、信号处理、白适应控制 和人工生命等领域。它是现代有关智能计算中的关键技术之一。 达尔文的自然选择学说是一种被人们广泛接受的生物进化学说。这种学说认 为,生物要生存下去,就必须进行生存斗争。生存斗争包括种内斗争、种间斗争 以及生物跟无机环境之间的斗争三个方面。在生存斗争中,具有有利变异的个 体容易存活下来,并且有更多的机会将有利变异传给后代;具有不利变异的个体 就容易被淘汰,产生后代的机会也少的多。因此,凡是在生存斗争中获胜的个 1 2 第2 章色谱解析技术及其进展 体都是对环境适应性比较强的。达尔文把这种在生存斗争中适者生存,不适者淘 汰的过程叫做自然选择。它表明,遗传和变异是决定生物进化的内在因素。自 然界中的多种生物之所以能够适应环境而得以生存进化,是和遗传和变异生命现 象分不开的。正是生物的这种遗传特性,使生物界的物种能够保持相对的稳定; 而生物的变异特性,使生物个体产生新的性状,以至于形成新的物种,推动了生 物的进化和发展。 遗传算法是模拟达尔文的遗传选择和自然淘汰的生物进化过程的计算模型。 它的思想源于生物遗传学和适者生存的自然规律,是具有“生存+ 检测”的迭代过 程的搜索算法。遗传算法以一种群体中的所有个体为对象,并利用随机化技术指 导对一个被编码的参数空间进行高效搜索。其中,选择、交叉和变异构成了遗传 算法的遗传操作;参数编码、初始群体的设定、适应度函数的设计、遗传操作 设计、控制参数设定五个要素组成了遗传算法的核心内容。 作为一种新的全局 优化搜索算法,遗传算法以其简单通用、鲁棒性强、适于并行处理以及高效、实 用等显著特点,在各个领域得到了广泛应用,取得了良好效果,并逐渐成为重 要的智能算法之一。 我们习惯上把h o l l a n d 在1 9 7 5 年提出的g a 称为传统的g a 。它的主要步骤 如下: 编码: g a 在进行搜索之前先将解空问的解表示成遗传空间的基因型串结构数据, 这些串结构数据的不同组合便构成了不同的点。 初始群体的生成: 随机产生n 个初始串结构数据,每个串结构数据称为一个个体,n 个个体 构成了一个群体。g a 以这n 个串结构数据作为初始点开始迭代。 适应性值评估检测: 适应性函数表明个体或解的优劣性。不同的问题,适应性函数的定义方式也 不同。 选择: 选择的目的是为了从当前群体中选出优良的个体,使它们有机会作为父代为 下一代繁殖子孙。遗传算法通过选择过程体现这一思想,进行选择的原则是适应 第2 章笆:普解析技术及其进展 性强的个体为下一代贡献一个或多个后代的概率大。选择实现了达尔文的适耆生 存原则。 交换: 交换操作是遗传算法中最主要的遗传操作。通过交换操作可以得到新。代个 体,新个体组合了其父辈个体的特性。交换体现了信息交换的思想。 变异:变异首先在群体中随机选择一个个体,对于选中的个体以一定的概率 随机地改变串结构数据中某个串的值。同生物界一样,g a 中变异发生的概率很 低,通常取值在0 0 0 6 4 ) 0 1 之间。变异为新个体的产生提供了机会。 遗传算法作为一种快捷、简便、容错性强的算法,在各类结构对象的优化过 程中显示出明显的优势。与传统的搜索方法相比,遗传算法具有如下特点: 搜索过程不直接作用在变量上,而是在参数集进行了编码的个体。此编码操 作,使得遗传算法可直接对结构对象( 集合、序列、矩阵、树、图、链和表) 进 行操作; 搜索过程是从一组解迭代到另一组解,采用同时处理群体中多个个体的方 法,降低了陷入局部最优解的可能性,并易于并行化; 采用概率的变迁规则来指导搜索方向,而不采用确定性搜索规则; 对搜索空间没有任何特殊要求( 如连通性、凸性等) ,只利用适应性信息, 不需要导数等其它辅助信息,适应范围更广。 2 2 3 人工神经网络 人工神经网络是对人脑功能的简单模拟,是一种能够解决许多复杂化学学科 领域问题的有力化学计量学工具。二十世纪八十年代,h o p f i e l d 的研究工作极大 地推动了工人神经网络的研究及应用。r u m e l h a r t 等的研究工作和l i p p m a n n 的贡 献使得人工神经网络在化学、生物化学、化学工程及药物学中获得了广泛的应用。 目前已有多篇论文对人工神经元网络的原理及应用给出了详尽叙述。人工神经元 网络有多种类型,但大致可分为两类:即有管理的人工神经元网络和无管理的人 工神经元网络。前者需用已知样本进行网络训练,方能对未知样本进行预测,后 者则无需用己知样本对网络进行训练即可用来对未知样本进行预测。 a 基于误差反相传输训练方法的多层感知器人工神经网络方法 1 4 第2 章色谱解忻技术及其进展 多层感知器人工神经元网络是一种抽象的数学模型,通过“学习”过程,多层 感知器神经元网络通过不断调整各个神经元间的连接权重与偏置( b i a s ) ,从而使 误差函数达到最小值。当完成对网络的训练之后,向网络输入一组特定的输入值, 网络能够通过对该组输入值的特征的概括与提取,进而给出其相应的输出值。多 层感知器人工神经网络是一种从输入到输出的非线性映射。目前化学学科文献报 道最多的多层感知器神经网络训练方法是误差反相传输训练方法。 多层感知器神经网络一般有三层神经元网络结构,即输入层、隐含层和输出 层。一般情况下,三层的网络结构即可满足大多数问题的要求。由于人工神经元 网络的结点值定义为0 1 之间,因而必须对输入层的变量进行标准化处理。以蜀 为原始输入变量的标准化值,f 为输入层结点,则从输入层的每一个结点f 输入 至隐蔽层结点h 的输入加权值仇为: 纸= 够。s ,+ 皖 ( 2 3 ) f - l 其中为输入层结点i 与隐蔽层结点h 之间的连接权重,2 为输入层的结点数, o h 为隐蔽层结点乃的输入偏簧。隐蔽层结点h 的输出可用“s ”函数予以计算: q = 专 ( 2 4 ) 其中q 为隐蔽层结点h 的输出值。对于输出层结点d 有如下类似公式: 纯= s h + o o ( 2 5 ) h = l 0 d = 去 ( 2 6 ) 其中瓯为隐蔽层结点h 的输出,q 为输出层结点0 的输出。 人工神经元网络训练的最终目的是通过不断调整连接权重侧q 。和及相 应的偏置,从而使误差函数e 达到最小值,误差函数的表达式为: p 1尸m, e = = 寺( 口胛- - o p m ) 2 ( 2 7 ) 其中p 为样本总数,”为输出层结点数,与d 朋分别为输出层结点朋的目标 1 5 第2 章色谱铲沂技术及其逆喂 值与预测值。 权重的凋整是反向的,即首先调整输出层与隐蔽层间的连接权重,然后再调 整隐蔽层与输入层间的连接权重。误差函数的最小化是沿着权重的梯度方向进行 的。迭代中的权重修j 下公式为: 簖t :一7 7 竺+ 必织( 2 8 ) u q 蟛:一7 7 竺+ 跳碗 ( 2 9 ) u “k 式中参数刁是学习速率( 1 e a r n i n gr a t e ) ,即步长。此参数决定训练( 即迭代) 的速度a 是学习动量( 1 e a r n i n gm o m e n t u m ) ,该参数改善神经网络的训练时间,并使神经网 络训练过程中的稳定性增加。n 为训练过程中的迭代次数。其中, a c o ”= 力”一缈舻1 ( 2 1 0 ) 当神经网络的误差函数值达剑预设的条件时,则停止迭代,神经网络训练过程结 束。 b 基于共轭梯度下降训练方法的多层感知器人工神经网络方法 采用共扼梯度下降训练方法的多层感知器神经网络与采用误差反向传输训 练方法的多层感知器神经网络的结构基本相同,即:采用该训练方法的神经网络 也采用了线性后突触势函数和对数活性函数。平方和误差函数也被用于监控神经 网络的训练过程。共扼梯度下降算法的初始搜索方向由下式给出: d o = 一g o ( 2 1 1 ) 搜索方向的更新基于p o l a k r e b i e r e 公式: d j + l = 一g j + l + 局嘭 ( 2 1 2 ) 局= 驾乒 ( 2 1 3 ) c 径向基函数神经网络 径向基函数神经网络模型基于相关径向基函数的线性组合。一般意义上讲, 径向基函数神经网络也可用于解决回归及分类问题。径向基函数神经网络同样包 含三层,即输入层、隐含层和输出层。输入该神经网络的信息不在输入层中经过 1 6 第2 章色谱解析技术及箕进展 单元。在径向基函数的作用下,隐含层中的单元对输入数据显示非线性响应。最 常用的径向基函数为高斯型函数,其表达式如下所示: 吲小唧 - ( 剀 仁,4 , 其中,肛一巳0 是输入矢量x 与第个径向基函数的中心矢量巳间的e u c l i d e a n 距 离,q 代表第个径向基函数的扩展程度。l ( x ;q ;q ) 表示隐含层中第个径向 基单元的输出值。对于输出层中的单元,输出值的计算基于线性模型,该模型由 ( 2 1 5 ) 其中,耽( x ) 表示输入矢量x 经过径向基函数神经网络计算后在输出层单元七中 的输出值。吆表示输出层单元七与隐含层单元间的连接权重。玩表示输出单 元露的偏置。径向基函数神经网络的设计包括两个步骤:选择径向基函数的中心 和宽度以及相关联结权重的优化。多种方法可用以选择径向基函数的中心,诸如 随机取样法、k 均值算法以及k o h o n e n 算法等。各个单元的径向基函数的宽度 可设定为固定值,或对每个单元设定为不同值。 d 通用回归神经网络模型 通用回归神经网络模型是径向基函数神经网络模型的一个变种。通用回归神 经网络模型用以处理回归问题。运用通用回归神经网络模型,一种基于统计方法 的函数近似模型可通过神经网络形式来实现。通用回归神经网络共有四层:输入 层、径向中心层、回归单元层以及输出层。径向层单元代表着训练数据集的聚类 中心,径向层的训练基于聚类算法。 e 线性神经元网络 线性神经元网络仅仅有两层:一个输入层和一个输出层。该模型运用线性后 触突势函数和线性活性函数。尽管许多问题并不能用线性神经网络模型获得解 决,但有些问题可以运用线性神经网络模型获得较好地解决。线性神经网络模型 1 7 钆 + 、i , z 一, 勺 膏 哆 。一 i i 、l , x ,j欺 第2 章色谱解忻技术及其进展 通常可作为一个标准与其他复杂的非线性神经网络模型进行比较。 2 2 4 小波变换 小波变换( w a v e l e tt r a n s f o r m ,w t ) 是从傅立叶变换( f o u r i e rt r a n s f o r m ,f t ) 发 展起来的一种信号处理方法,2 0 世纪8 0 年代,s m a l l a t 建立了构造小波基及其 多尺度分析的方法之后,小波变换的研究和应用开始迅速发展起来,逐渐地应用 到不同的科学和工程领域的信号与图像处理技术之中【1 3 - 2 6 1 。小波变换也在化学信 号处理中展现了独特的优势。 传统的傅立叶变换在数学、自然科学和工程学的很多领域得到了广泛的应 用,傅立叶分析是根据信号的周期性提出来的一种方法,运算过程中使用正弦和 余弦函数,提供的是光谱信号存整个时问域中的频率信息。虽然,f t 的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论