(分析化学专业论文)化学因子分析及其在二维色谱信号解析中的应用研究.pdf_第1页
(分析化学专业论文)化学因子分析及其在二维色谱信号解析中的应用研究.pdf_第2页
(分析化学专业论文)化学因子分析及其在二维色谱信号解析中的应用研究.pdf_第3页
(分析化学专业论文)化学因子分析及其在二维色谱信号解析中的应用研究.pdf_第4页
(分析化学专业论文)化学因子分析及其在二维色谱信号解析中的应用研究.pdf_第5页
已阅读5页,还剩61页未读 继续免费阅读

(分析化学专业论文)化学因子分析及其在二维色谱信号解析中的应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国科学技术大学硕士毕业论文摘要 摘要 本论文在深入了解化学戮子分季厅及免疫箨法摄理静基戳上,对因子分辨 方法进行了发袋,并应蒋予实际体系混舍耘鱼坌餐车羹h p l c d a d 二维数据豹 解析。 葛根是卫生部颁布的“药食同源”的药用植物之一,其中具有药埋活性的 成分是些黄酮类物质。本文采用反相高效液相色谱及二极管阵列检测器,对 葛报黄酮提取物的分离与分析条件进行了研究,采用c ,。柱为固定相,甲醇一水 混会溶滚为流动掘,分别对流动翅中彤醇比例澍保翟肘间期响应谯的影响进行 了磷究,褥到较为理想螅梯度洗聪条件。定量分援结果表明:实艨样品圆收警 分子9 20 9 7 6 ,r s d 分子17 8 2 9 8 之阉,表明该方法定鲞准薅,蚕袋 性好。 为了简化实验条件和掇出快速的定量分析方法,采用窗口因子分析方法对 等度洗脱条件下得到的葛根黄酮提取物h p l c d a d 重叠色谱进行了解析,得到 了较为满意的结果。 采媚一毒中新的因子分枣厅方法一子鬻口因子分掇法,对具有强致癌性的偶氮 t 染料的g c - m s 重_ 叠落进行了解摄。孵孝厅结果表暖,此方法可直接进季亍是标缌 分豹质谱分辨,褥到基标缀分豹凄谱嚣,进两得到该缀分黥琶谱嬲。与密墨嚣 子分柝相跣,予窗强因子分析法酉墩实现爨标缀分韵麓接分辨,予餐臼的选择 更糯容易,入工干预少,擀祈速度快。该研究可为纺织品中偶氮染料定往定羹 分析提供快速、简便的途径。 基于免疫算法的基本原理提出了一种新的因子分析算法,称为免疫主成分 分析法( p c a ) 。该方法的基本思想是将某数据矩晦作为抗原,欲提取的特征向 量作为抗体,遵过对特征肉量所表示的主贼分进弦逐步消减实现矩跨豹正交分 孵。首先通过模拟数据对1 p c a 寒p c a 遴行了比较,结象表爨:i p c a 渡褥剩 汝特征爨羹帮特征傻与传统p c a 翁结巢福钕,但邋逶误差分轿表裙,在对有孺 中国科学技术大学硕士毕业论文摘要 信号的提取方面优于传统p c a 法;通过对不同碟音水平信譬的处理表稍:与p c a 相比, p c a 具有更好的抗噪性能。将i p c a 算法与窗口因子分析技术结合,成 功地实现了对h p l c 。d a d 凛叠信号的解析。对模拟数据和实骏数据的解析结果 表明,i p c a - w f a 与p c a w f a 可得到相似的结果,但i p c a - w f a 在多组分 h p l c d a d 重登信号解移亍方面具有更强的艇卡厅能力。如 鞋 中国科学技术大学硕士毕业论文 摘要 a b s t r a c t c h e m i c a lf a c t o ra n a l y s i sp r o v i d e sap r o m i s i n gt o o l f o rr e s o l u t i o no fm u l t i d i m e n s i o n a ld a t a i nt h i st h e s i s ,b a s e do ni n v e s t i g a t i o no fc h e m i c a lf a c t o ra n a l y s i s m e t h o d sa n dt h ep r i n c i p a lo fi m m u n ea l g o r i t h m ,an e wf a c t o ra n a l y s i sm e t h o dw a s d e v e l o p e d ,a n ds u c c e s s f u l l ys e v e r a lm u l t i c o m p o n e n tt w o d i m e n s i o n a lg c - m sa n d h p l c d a dd a t as e t so fr e a ls a m p l e sw e r e a n a l y z e d k u d z ui so n eo ft h et r a d i t i o n a lc h i n e s eh e r b a lm e d i c i n e s i t sm a i na c t i v e c o m p o n e n t s a r ep u e r a r i al o b a t ai s o f l a v o n o i d b yu s i n gt h er e v e r s e d p h a s eh i g h p e r f o r m a n c el i q u i dc h r o m a t o g r a r i h y w i t hd i o d ea r r a yd e t e c t or t h es e p a r a t ec o n d i t i o n s w e r eo p t i m i z e df o rt h ep u e r a r i at o b a t ai s o f l a v o n o i de x t r a c t u s i n gc l 8 c o l u m na s s t a t i o n a r yp h a s ea n dm e t h a n o l w a t e rs o l u t i o na sm o b i l ep h a s e ,t h ee f f e c t so fe l u t i o n c o m p o s i t i o no fm o b i l ep h a s eo nt h er e t e n t i o nt i m ea n dc h r o m a t o g r a p h i cr e s p o n s e w e r ei n v e s t i g a t e da g r a d i e n te l u t i o ns e p a r a t i o na n dd e t e r m i n a t i o nw a so b t a i n e db y t h er e s u l to fq u a n t i t a t i v e a n a l y s i s ,i t w a ss h o w nt h a tr e c o v e r i e sa r eb e t w e e n 9 2 - 9 76 a n dr s da r eb e t w e e n1 7 8 一29 8 i no r d e rt o s i m p l i f ye x p e r i m e n t a l c o n d i t i o na n dp r o p o s ef a s td e t e r m i n a t i o n m e t h o d ,w i n d o wf a c t o ra n a l y s i st e c h n i q u ew a su s e df o rr e s o l u t i o no ft h eo v e r l a p p i n g m u l t i c o m p o n e n t st w o - w a y d a t ao b t a i n e dw i t ht h ei s o c r a t i ce l u t i o nr e s u l t ss h o wt h a t p u r ec h r o m a t o g r a m s a n dt w os p e c t r ao fe a c hc h e m i c a lc o m p o n e n tc a nb eo b t a i n e db y w i n d o wf a c t o ra n a l y s i s ,s a t i s f a c t o r y q u a l i t a t i v er e s u l t sc a na l s ob eo b t a i n e d an e wf a c t o ra n a l y s i sm e t h o dc a l l e ds u b w i n d o wf a c t o ra n a l y s i sw a s a p p l i e dt o r e s o l u t i o no f o v e r l a p p i n gg c m s d a t as e to f a z o b i p h e n y ld y e s r e s u l t ss h o wt h a t ,b y u s i n gt h i s m e t h o db o t h m a s s , s p e c t r aa n dc h r o m a t o g r a mo fc o m p o n e n t sc a nb e r e s o l v e df r o mm u l t i c o m p o n e n t o v e r l a p p i n gd a t ac o m p a r e dw i t hw i n d o wf a c t o r a n a l y s i st e c h n i q u e ,t h es e l e c t i o no fs u b w i n d o w sc a nb em o r ec o n v e n i e n t a n dt h e 越 妻堕登堂茎奎盔堂鎏主望些鎏壅 塑萋 一 一 一 s p e e do f r e s o l u t i o nc a nb ei n c r e a s e d t h i sp r o v i d e das i m p l ea n dv a l i dw a y f o rf a s t a n a l y s i so f a z o b i p h e n y ld y e si nf a b r i c b a s e do nt h ep r i n c i p a lo fi m m u n ea l g o r i t h m ,an o v e la l g o r i t h mf o rc h e m i c a l f a c t o ra n a l y s i sw a sp r o p o s e d 。c a l l e di m m u n ep r i n c i p a lc o m p o n e n ta n a l y s i s ( r p c a ) t h eb a s i ci d e ao ft h i sm e t h o di st h a ti tt a k e sad a t am a t r i xo fm i x t u r ea sa n t i g e n ,t h e r e t r i e v i n ge i g e n v e c t o r sa sa n t i b o d i e s ,a n dt h eo r t h o g o n a ld e c o m p o s i t i o no f t h em a t r i x c a l lb ea c h i e v e db ya ni t e r a t i o no f s u b t r a c t i n gt h ep r i n c i p a lc o m p o n e n tr e p r e s e n t e db y t h ee i g e nv e c t o r , w h i c hs i m u l a t e st h ep r o c e s so ft h ei n t e r a c t i o nb e t w e e na n t i b o d ya n d a n t i g e ni na ni m m u n es y s t e m c o m p a r e dw i t ht h ec o n v e n t i o n a lp r i n c i p a lc o m p o n e n t a n a l y s i s ,s i m i l a rr e s u l t sc a nb eo b t a i n e d b u te r r o ra n a l y s i ss h o w st h a ti p c ai sb e t t e r t h a np c af o re x t r a c t i n ga v a i l i n f o r m a t i o n b yc o m b i n a t i o no f t h ei p c aa l g o r i t h m w i t hw i n d o wf a c t o ra n a l y s i st e c h n i q u e ,r e s o l u t i o no fo v e r l a p p i n gi - i p l c - d a ds i g n a l s w a si n v e s t i g a t e d b o t hs i m u l a t e da n de x p e r i m e n t a ld a t as e t sw e r ea n a l y z e d + s i m i l a r r e s u l t sw e r eo b t a i n e db yt h ei p c aa n dp c af o rp r i n c i p a lc o m p o n e n ta n a l y s i s ,b u tt h e i p c a - w f ai ss u p e r i o rt ot h ec o n v e n t i o n a lw i n d o wf a c t o ra n a l y s i si na b i l i t y 致谢 本论文自始至终是在邵学广教授的悉心指导下进行的。论文完成过程中, 邵老师倾注了大量的心血,他对学生的耐心指导、鼓励以及严格的要求,使本 论文得以顺利完成。邵老师严谨的治学态度、勤奋的工作精神、勤勉的育人作 风,以及对学科前沿敏锐的洞察力令我受益非浅。在此,谨向邵老师致以诚挚 的谢意。 邵利民老师对本论文的研究工作给予了许多有益的建议与帮助。徐智秀老 师在论文实验过程中耐心地帮助分析、解决仪器和实验中出现的各种问题,并 提出多方面的建议。在此一并表示衷心感谢。 感谢安徽出入境检验检疫局的崔镜、朱梦栩高工、盛旋工程师为样品的分 析测试提供了便利条件。 感谢安徽农业大学宛晓春教授、李大祥博士对实验样品及标样的无私提供。 感谢姜海燕、虞正亮、王蕾、陈达、程龙玖、马超雄、宋惠宇以及已经毕 业的孙莉、陈宗海等实验室所有同学的帮助和支持,他们的聪明睿智、奋发进 取的工作精神和兄弟姐妹般盼隋谊,让我在这里度过了愉快而充实的三年。 感谢我父母多年来辛勤的培养和全家人悉心的爱护。感访f 我丈夫及女儿对 我学习上的支持和鼓励,生活上的关一i 3 与照顾。 谨以此文献给我挚爱的亲人, f f j l r i 所有关心、帮助我的老师、同学和朋友们 李梅青 2 0 0 2 年5 月1 日于科大 中国科学技术大学硕士学位论文 第一章色谱分析中的化学因子分析 第一章色谱分析中的化学因子分析 化学计量学( c h e m o m e t r i c s ) 是研究化学测量的基础理论与方法学的新兴化学 分支学科,其基本任务是运用数学、统计学、计算机科学以及其它相关学科的 理论与方法,设计或优化化学量测方法,并通过解析化学实验数据,最大限度 地获取有关分析对象的化学信息及其它相关信息,其基础理论己基本上构成了 一个较完整的体系。近年来,已有大量的化学计量学方面的专著和教材 1 1 0 出 版,也有一些综述性文献对化学计量学的方法、应用及进展进行了评述 1 1 - 2 1 。 目前,化学计量学的研究方向大致可分为以下几个方面:1 ) 采样理论与方 法 2 2 ,2 3 ;2 ) 实验设计与化学化工过程的优化控制 2 4 ,2 5 :3 ) 分析信号的处 理 2 6 ;4 ) 分析信号的多元校正与多元分辨 2 7 2 9 ;5 ) 化学过程与化学测量 过程的计算机模拟 3 0 1 ;6 ) 化学模式识别 31 ,3 2 】:7 ) 化学定量构效关系 3 3 ,3 4 】; 8 ) 人工智能与化学专家系统 3 5 ,3 6 。化学计量学已逐渐发展为一个内涵丰富的 化学分支,并为其它化学分支学科,特别是分析化学 3 7 ,3 8 、环境化学 3 9 ,4 0 、 药物化学 4 1 ,4 2 、食品化学 4 3 4 5 、有机化学和化学工程 4 6 ,4 7 等提供了许多 解决问题的新思路、新方法和新途径。化学计量学的发展方兴未艾,并将对分 析化学产生深刻的影响,以构成分析化学第二层次基础理论和方法学的重要组 成部分 4 8 ,同时正向各个必须进行化学测量的分支学科进行渗透,并得到更 广泛的应用。 多元校正与多元分辨( m u l t i v a r i a t e c a l i b r a t i o na n dr e s o l u t i o n ) 是利用化学量测 数据构造分析体系的模型,并对模型中含有的参量进行估计以获取分析体系中 化学组分的定性、定量信息,是目前分析化学中最活跃的领域之- - 4 9 ,5 0 1 。化 学因子分析方法以其特有的多元统计分析技术,已成为解决多元分辨与校正强 有力的工具之一。 1 1 化学因子分析 因子分析( f a c t o r a n a l y s i s ,f a ) 是一种多元统计分析方法,其模型最早由j p e a r s o n 和cs p e a r m a n 提出,应用于心理学研究。后来逐渐被推广到其它学科、 中国科学技术大学硕士学位论文第一章色谱分析中的化学e 吁分析 领域,如经济学、生物学、植物学、地质学、化学等。在运用该技术研究、解 决化学问题的过程中,已逐步形成有浓厚化学特色的化学因子分析方法 ( c h e m i c a lf a c t o ra n a l y s i s ,c f a ) ,并成为化学计量学中强有力的方法之一。 因子分析是通过对一组数据矩阵进行特征分析、旋转变换等操作,获得有 关信息的数学方法。由于该方法是一种多元统计分析方法,因此在解决多变量 问题时,具有显著的优点。图11 给出因子分析步骤的顺序及从每一步骤的结 果所获得的有关信息。 图l1 因子分析的主要步骤框图 f i g 1 1s c h e m eo f f a c t o ra n a l y s i s 数据预处理和特征分解是所有因子分析法的共通步骤,此时得到的抽象解 不具有明确的物理或化学意义,在大多数科学问题中,针对不同特点的数据, 必须通过变换得到有实际意义的解。 随着大量新型分析化学仪器和联用技术的相继问世,计算机技术的广泛使 用,二维化学数据的分辨在复杂体系的研究中占有重要的地位,化学因子分析 以其特有的多元统计分析技术,已成为解决多元分辨与校正强有力的工具之一。 针对不同特点的测量数据,已发展出一系列不同的化学因子分析方法。在化学 中,因子分析的用途可概括为:1 ) 确定影响特定的测量数据阵的因子数:2 ) 获得对测量数据的定性或定量的解释。 2 生里型兰垫查奎堂堡圭兰垡迨苎 丝二童鱼堕坌堑! 堕些鲎型! 坌堑 1 2 化学因子分析方法进展 因子分析是基于二维或多维数据矩阵的多元统计分析方法。二维化学数据 通常是由几个样本的某种谱( 光谱或波谱) 组合在一起形成的矩阵形式的数据 结构。当前能够产生二维化学数据的仪器比较多,主要有g c m s 、l c m s 、 g c i r 、h p l c d a d 、荧光分析仪、多维核磁共振仪等。另外一些化学分析方 法与仪器分析方法相结合也能产生二维数据,如:滴定分析与紫外扫描光谱仪 结合就可以得到二维数据;流动注射分析与二极管阵列联用,也可以产生类似 于h p l d d a d 类型的二二维数据。g c m s 、l c m s 、g c r 和h p l c d a d 均是 利用色谱( 气相或高效液相色谱) 的分离性能来产生多个子样本,并由质谱、 红外光谱记录仪或二极管阵列( d a d ) 来记录子样本的光谱,把这些光谱组合起 来就形成了一个二维色谱数据矩阵。由于色谱系统的良好分离性能赋予了这些 二维矩阵特殊的结构,即体系中各组分在保留时间方向上服从依次流出、先入 先出规则,使之特别适合于因子分析方法的处理,而且可以实现唯一分辨。而 荧光分析仪、多维核磁共振仪由于其产生的数据缺乏二维数据解析所要求的特 征,所以它们产生的二维数据很少被用来作二维数据解析。 化学计量学家们正不断提出新的分析方法和数学模型,以适应解决不同问 题的需要。目前,化学因子分析方法的发展主要分为两大方面:一是二维( 或 高维) 数据矩阵的化学组分数估计方法;二是二维( 或高维) 数据矩阵的解析 方法。 1 2 1 二维数据矩阵的化学组分数估计方法 数据预处理和特征分解是所有因子分析法的共通步骤,其结果是得到二维 数据矩阵的特征向量和特征值。通常情况下,特征向量和特征值与数据矩阵中 所含有的化学组分数有着很密切的联系。因此怎样根据二维化学矩阵的特征向 量和特征值估计出分析体系中所含有的化学组分数一直是化学计量学中最受关 注的热点之- - 5 i - 6 4 。现有的确定化学体系组分数的方法,几乎都是建立在主 成分分析( p c a ) 的基础上。 主成分分析又称抽象因子分析,即对数据矩阵的协方差阵进行正交变换, 3 ! 里型堂垫查查堂堡主鲎垡鲨塞麓二兰鱼堂坌堑妻塑些篓里王笪堑 一 找出协方差阵的特征向蹩和特征值,继而确定主成分或主因子数( 化学组分数) 。 糟矩阵中不存在测量误差,则特征值五。,五:,五。中不等于0 的特征值个数就等 于该体系中独立的化学组分数。但由于测量误差的存在,不等于0 的特征值个 数总蹩大子 奉系中独立髂纯举缰分数。诧时,酃些代表化学缀分贡黻酌特征整 髂为主特,延毽,代表噪声的特薤缓被稼为次憋征值。化学组分数 古计款任务裁 是区分主、次特征值。 除一些特殊方法外,现有的二维化学数据矩阵的因子数估计方法大致可以 分为两类。第一类方法建根据二维数据斑阵特征值晌大小来估计因子数 5 l “5 7 。 第二类方法燹莓是建立在二维簸簿懿特徭簿量掰携带瑟信患兹基璐土 5 8 6 6 。 1 基于特征值的化学组分数估计法 从统计意义t 说,主、次特征值代表不同的意义,即分别代表化学组分信 意和测量误差,故二者之间存在箍著纛异,基于该原毽,美国仡举计羹学家 m a l i n o w s k i 对_ l 逝送行了全嚣系统豹疆变,提出了因子分援误麓理论鏊t 】,基在 误差理论的基础上提出”了,尽统计梭验的因子数估计方法 5 2 ,5 3 。该方法是建立 在“约化”特征值基础上的,即特征值除以自由度。m a l i n o w s k i 发现对次特征 值来说“约化”特征值是一个恒定的常数,由此可判断船主因子数。以聪,又 援密嵌入误麓函数i e 5 4 、因子指示函数n d 5 4 等二维数据化学缀分数的佶计 方法。f a b e r 等对m a l i n o w s k i 靛f - 统计检验遴孬了改进f 5 5 】,镬其灵敏发毒辑 提高。 除了建立在误差分析理论基础上的因子数估计方法外,a l e x 和s a v i o e 5 6 1 以及何锡文等 5 7 1 从考察特征值之间的麓别角度出发,分别提出了v p v r s 和e r 薄个经验缓分数嵇诗方法。 a l e x 魏s a v o i e 5 6 根据特征缀的变她婕况提出瓣叫做百分比方差平方根 的误蓑判据。这种误差判据的构造思想是把最后一个主特征慎与第一个次特征 值之间的差别认为地予以加大。啪判据可用下面的数学公式来描述: 蹭敞墨= 伉一 + 1 ) 魄+ 1 一 + 2 l f 一1 ,2 ,m 一2 ( 11 ) 警f 等于所分析的数据阵中所含的化学缀分数时,这一伪函数将出现极大值。 傣锈文等 5 7 1 提出一稃不依赖蜜验谈差倍计静攒据,霹骰特征值 & 舌硒,萁 4 生里型兰垫查奎兰堡主兰垡堡茎 笙二童鱼堂坌堑! 塑些兰里王坌堑 一 定义为: e r = i = 1 , 2 , - , m - i ( 12 ) 将e r 对特征值序数f 作图,当l 等于真实因子数时,曲线出现极大点。 2 基于特征向量的化学组分数估计法 s h r a g e 等 5 8 利用从光谱数据中得到的特征向量的相关函数,鉴别除高噪 声向量( 噪声向量被认为是无意无意义的) ,从而确定因子数。 r o s s i 等【5 9 将主成分分析得到的特征向量进行傅立叶变换,利用经过变换 后得到的特征向量频率分布来鉴别高噪声向量,对于含有高噪声数据因子数确 定得到了颇为理想的结果。 王继红等 6 0 提出利用特征向量的形态因子来确定因子数的新思路。t u 等 6 1 提出用典型相关方法来判断带有实验误差的数据矩阵中的因子数。 s h a o 等 6 2 】等利用小波对信号分频的特性,将信号按频率的大小分解成高 频和低频两部分,由于随机噪声相对于化学信号而言,基本处于较高频率范围, 因此采用小波变换能较容易地把噪音从信号中分离出来,而后进行主成分分析 得到正确的因子数,取得了理想效果。 r a m s y 和s i l v e r m a n 6 3 ,6 4 根据物质光谱具有的平滑特性意味着特征向量也 具有一定的平滑特性提出平滑主成分分析( s m o o t h i n gp r i n c i p a lc o m p o n e n t a n a l y s i s ,s p c a ) ,通过对一组惩罚系数的确定把特征向量限制在一定的平滑空 间,得到较为理想的结果。在此基础上,c h e n 等 6 5 提出r e s o 因子数估计方 法,利用平滑主成分分析和普通主成分分析的对应特征值的比值( r e s o ) ,准确 地判断出低信嗓比色谱数据的主因子数。邵学广等 6 6 年1 j 用小波变换强有力的 平滑滤噪能力,将小波变换平滑技术与因子分析结合,提出小波变换平滑因子 分析( w a v e l e tb a s e ds m o o t h i n gp r i n c i p a lc o m p o n e n ta n a l y s i s ,w b s p c a ) ,大大提 高了对低信噪比数据处理的能力。 3 其它方法 w o l d 等 6 7 ,6 8 提出交互检验法。首先从二维数据中删去一行( 或多行) , 得到一个简化矩阵,然后进行主成分分析,再用不同的主成分模型来预测在第 5 ! 里型兰垫查奎兰堡主兰垡笙苎 笙二皇鱼堂坌塑竺些鲎里王坌堑 一 一步中删去的元素,计算预测误差。重复以上过程,直到原始二维数据的每一 行都被删去一次为止。则该二维数据的化学组分数就等于使以下p r e s s 函数达 到最小时的k 值,即 p r e s s k :宝宝g 。一量缈 ( 1 3 ) i = 11 = 1 式( 13 ) 中,量擎为用k 个主成分模型对x 。的预测值。p r e s s 即被删除样本的实 际观察值x 与其预测值求出预测残差的平方和( p r e d i c t i v er e s i d u a le r r o rs u m o f s q u a r e s ,p r e s s ) 。 沈海林等 6 9 】提出二维数据秩估计的子空间比较法,通过比较两种不同的 正交化方法所构造的正交子空间的差异进行秩的估计,即化学组分数估计。 谭涌溪、梁逸曾等 7 0 基于具有化学意义的子空间对在一个方向上的二维 数据变换是最稳定的这一特性,提出线性变换下稳定的化学子空间法用于二维 数据的因子数判断。 1 2 2 二维数据矩阵的解析方法 因子分析经过对矩阵的特征分解,得到的只是数学上的抽象解,不具有明 确的化学的意义,在大多数科学问题中,针对不同特点的数据,必须通过变换 才能得到有实际意义的解。对此,化学计量学家们不断提出一些方法和数学模 型以适应解决实际问题的需要,现已经发展出多种因子分析方法,包括目标因 子分析( t a r g e tf a c t o ra n a l y s i s ,t f a ) 、秩消因子分析( r a n ka n n i h i l a t i o nf a c t o r a n a l y s i s ,f a f a ) 、渐进因子分析( e v o l u t i o n a r yf a c t o ra n a l y s i s ,e f a ) 、窗口因子 分析( w i n d o wf a c t o ra n a l y s i s ,w f a ) 和直观推导式演进特征投影分析( h e u r i s t i c e v o l v i n gl a t e n tp r o j e c t i o n ,h e l p ) 等。其中渐进因子分析( e f a ) 71 ,7 2 、窗口因子 分析( w f a ) 7 3 和直观推导式演进特征投影分析( h e l p ) f 7 4 7 5 1 对先验知识的要求 极少,特别适合处理一些黑色体系的数据。 1 渐进因子分析 g a m p p 和m a e d e l 等 7 1 ,7 2 提出的渐进因子分析法,巧妙地利用了二维色 谱数据的结构特点,第一次实现了二维色谱数据的唯一分辨。二维色谱数据的 6 中国科学技术大学硕士学位论文第一章色谱分析中的化学因子分析 ,- _ _ _ _ _ _ _ _ _ _ _ _ _ - q - _ _ _ _ _ _ _ - - ,_ _ _ _ _ _ j _ _ _ _ _ _ _ _ - _ _ _ - _ _ _ _ _ _ _ _ - _ ,一 结构特点就是:沿某坐标方向组分数不断变化,新的物种不断出现,已有的 物种不断消失:某物种的浓度先是不断增加随后逐渐减小具有一个( 且只有一 个) 极大值。该算法的基本思想即首先选取数据阵的前两行进行主成分分析, 然后逐步地扩展到整个数据阵,从获得的特征值谱图判断各组分的流入、流出 点。由于该法包含前向、后向分析两部分,且采用的是逐步增大计算数据矩阵 大小的方案,因此其计算量较大,有时可能需要几十分钟才能完成。另外由于 每次分析的矩阵大小不同会使背景或噪音的特征值谱图也呈现出一定流入、流 出的假象,从而影响组分数的判断和分辨的结果。 2 固定窗口渐进因子分析 k e l l e r 和m a s s a r t 7 6 ,7 7 提出固定窗口渐进因子分析法,在某种程度上解决 了渐进因子分析法的两个不足之处,它采用固定每次分析的矩阵大小( 即窗口) , 从数据的第一行起直至数据阵的终点,对所有子矩阵进行主成分分析,用获得 的特征值的对数值对保留时间作图,确定各组分的流入、流出时刻。 3 窗口因子分析 m a l i n o w s k i 7 3 于2 0 世纪9 0 年代提出的窗口因子分析充分利用人们已有 的、非常宝贵的先验知识,利用渐进过程中每个组分在渐进轴上对应一个特定 范围,预先设定一个窗口,通过尝试并结合一些经验性窗口判据确定每个组分 的最佳浓度窗口和分布,然后用已获得的最佳浓度矩阵计算出各组分的光谱。 4 直观推导式演进特征投影法 梁逸曾等 7 4 ,7 5 提出的直观推导式演进特征投影法,与e f a 、w f a 一样是 为了解决渐进过程中的组分数、组分浓度变化等问题而提出的。该方法基本思 想可以用“c o m p o n e n ts t r i p p i n g ”形象地描述,因此又被称为“剥皮”技术,综 合考虑色谱方向上的选择性区域和零组分区域所提供的信息,对体系中的每个 组分一个一个地进行解析,使二维数据的结果更为准确可靠。本过程可分为三 步:1 ) 寻找最外层组分的“选择性窗口”( s e l e c t i v ew i n d o w , s w ) 和“零浓度窗 口”( z e r o c o n c e n t r i a t i o nw i n d o w , z c w ) :2 ) 根据s w 和z c w 的信息求解出最 7 中国科学技术大学硕士学位论文 第一章色谱分析中的化学因子分析 外层组分的光谱和色谱;3 ) 从原始数据矩阵中减去最外层组分的信息,继续求 解剩余的最外层组分的信息。对于s w 和z c w 的确定,l i a n g 等提出了演进特 征投影图方法。这些选择性区域的信息使得分辨工作变得更加容易。 此外,还有一些颇有创意的方法被发展出。 m a n n e 等【7 8 ,7 9 】提出子窗口因子分析法( s u b w i n d o wf a c t o ra n a l y s i s , s w f a ) ,摆脱了原有的全组分解析的思路,实现了只对体系中一个或几个组分 的直接解析。 数字差分运算具有放大噪音信号的缺点,但c h e n 等 8 0 却利用二阶差分导 出一个平滑矩阵,与因子分析相结合,提出平滑窗口因子分析法( s m o o t h i n g w i n d o wf a c t o ra n a l y s i s ,s w f a ) 实现了二维数据的平滑处理,成为解析低信噪 比和高相似性数据的一种有效工具。 化学计量学家还根据所碰到问题的不同,提出了一些相应的改进方法和数 学模型,如l o r b e r 等 8 1 ,8 2 提出的正交投影分辨法( o r t h o g o n a lp r o j e c t i o n r e s o l u t i o n ,o p r ) ,l o h n e s 等 8 3 ,8 4 提出的窗口目标检验因子分析法( w i n d o w t a r g e t t e s t f a c t o ra n a l y s i s ,w t t f a ) ,m a l i n o w s k i 8 5 提出的二维数据自动窗口 因子分析方法等,以适应解决实际问题的需要。广义秩消因子方法( g r a m ) 也 是处理双线性数据的常用因子分析方法,最早由k o w a l s k i 等人 8 6 提出,并有 多种演变算法 8 7 ,8 8 。 值得指出的是,除了不断探索新的因子分析方法外,化学计量学家还注重 将因子分析方法与其它化学计量学方法相结合,充分发挥不同方法的优点,解 决更加复杂的问题。 潘忠孝等【8 9 】将小波分析与因子分析相结合,大大提高对混合物吸收光谱 的滤噪性能:s h a o 等 9 0 】采用小波变换对h p l c d a d 信号进行平滑处理,与 w f a 联用,从混合信号中成功地解析出单一组分的信息;褚小立等【9 1 将因子 分析与模糊聚类方法结合用于渣油烃族的聚类与识别:m a 等 9 2 将p c a 与人 工神经网络技术应用于新石器时代中国陶瓷的分类。 8 ! 堕登兰楚查查鲎堕圭堂垡鎏苎 丝二:塞璺堂坌堑生塑堡堂堕! 坌笪 1 3 化学因子分析在色谱研究中的应用 隧羞最谱仪器熬更耨与发展,联瘸技术弱普建采用,二维( 或意维) 色谱 数据的获取变得更加餐易。化学因子分析在分析化学的许多领域,如:拉曼光 谱、荧光光谱、x 掳t 线、电子能谱等数据分析,化学平衡及化学动力学问题研 究,模式识别、定量构效研究等方面有着诸多应掰。而色谱系统的良好分离谶 涟斌予了这些二维短薄特豫翡结梭,俊之特澍逶舍于因子分孛厅豹处理。因鼗, 化学因子分手厅方法近年来在色谱磷究中i 导到更加广泛鲍应用,提赢了色潜研究 的水平。其应用范围大多集中在识谱理论研究、复杂体系的色谱分析等方面。 1 3 1 因子分析在色谱理论研究方筒的庶庵 g i a c o m e l l i 等 9 3 1 采用a f a 和t f a 方法对磅蒸苯胺在正榷h p l c 中的保留 槐毒遗行了锈究。磷究发袋,有嚣令爨子与其保整行为糖关。 王岳松等 9 4 1 基予方差最大的正交旋转与p r o m a x 斜旋转因子分橱法,对2 4 种苯鼢和苯胺类衍生物进行了分类,并进行多元线性回归分析,发现其色谱保 留值与分子结构之间存在较强的多元线性相关关系。 赵国肇等 9 5 】将渐进因子分析法用于解析有梳污染镪降解静动力学过程, 获褥了偶氮染料类季蒸橙熬降解避程中豹组分数及簿鼹动力攀模型等信息。 z h a o 靼m a l i n o w s k i 9 6 将p c a 法用于甲醇水分子间相互作用行为的研 究,从中确定存在三种形态:水、甲醇以及水甲醇复合物,采用w f a 法解析 出三种形态的色谱曲线,通过对复合物的计算发现,箕组成楚由个甲醇分子 与两个水分子构成。遮结栗与其它撮道的结果不同。 r i c h a r d 等 9 7 1 爰攫p c a 法谬俊反艇裹效滚耱绝谱挫对强碱毪物矮豹分离效 果。 w e r l i c h 等 9 8 用多元校正方法研究保留因子与固定相和流动相的物理化学 常数之间的关系,并用来预测5 种酚类物质的洗脱顺序。 1 3 。2 因子分辑农色谱分辑方嚣的癍用 目前,因子分析方法在色谱分析方面的应用主要集中在对复杂体系重叠信 9 主里型兰茎查查兰堡主兰垡堡茎丝二皇垒堕坌塑! 塑垡兰里王坌堑一 号的解析方面,研究对象涉及化工、环境、药学、食品等领域。 k v a l h e i n 和l i a n g 等 7 5 ,7 6 :采f f jh e l p 法对香港大气颗粒污染物中的多环 芳烃。龚范等【9 9 采用h e l p 法对冬虫夏草子座和虫体分别进行了多组分同时 定性定量测定,减少样本提取分离的步骤,降低色谱分离条件的要求,提高检 测准确度。陈迪钊等 1 0 0 ,1 0 1 采用h e l p 法对葛根芩连片中单味药葛根、黄芩、 黄连、甘草等有效成分进行t n 定,得到更为准确的定量结果。 s h e n 等 1 0 2 采用子窗口因子分析,实现了五种杀虫剂混合物的h p l c d a d 重叠图谱的解析,得到r 理想的结果。 b r a e k e l e e r 等【1 0 3 采用正交投影法和固定尺寸移动窗口渐进因子分析法对 盐酸四环素h p l c d a d 谱峰的纯度进行了估计并进行了充分的解析,克服了即 使通过优化实验条件也无法确切估计峰纯度的缺点。 b y l u n d 等 1 0 4 1 同样采用固定尺寸移动窗口渐进因子分析方法用于l c m s 数据进行谱峰纯度估计,也得到了理想的结果,同时获得了相应的质谱图。 q u i n n 等i r e s 将化学计量学方法应用于对工业生产具有非常重要意义的批 反应控制过程光学纤维紫外可见成分的监测。反应过程中的混合物被等间隔不 断地取出并进行h p l c 分析,采用色谱峰面积校正实时监测产物的生成和反应 物的消耗;同时采用自动窗口因子分析方法估计出反应物、中间产物和最终产 物的自模式色谱曲线( s m c r ) 和各组分的光谱。结果发现:通过s m c r 可以监 测到一些中间产物的存在,而h p l c 法却无法监测到。 在色谱重叠信号解析工作中,个突出性的工作是l i a n g 等 1 0 6 对完全重 叠峰的解析进行了积极的探索,提出了一种改进的o p a 法和e m 法( e n t r o p y m a x i m i z a t i o n ) ,成功地实现了五种混合成分一一i p r o d i o n e 、p r o c y m i d o n e 、 c h l o r o t h a l o n i l 、f o l p e t 和t r i a z o p h o s 重叠谱的解析。 而陈迪钊等 1 0 7 对此加以丰富,提出了三种完全重叠色谱峰的解析方法, 峰形约束曲线拟合解析( c p s c f ) ,交替正交投影( i o p ) 和秩消失因子分析 ( r a f a ) 。对联用色谱数据阵如果约束条件得到满足,这些方法能被证明用于被 嵌人组分的光谱和嵌入组分的浓度曲线分辨是完全可能地。 除上述内容外,还有许多优秀的工作限于篇幅不再一一赘述。综上所述, 化学因子分析方法在色谱理论和色谱分析研究中发挥了许多依靠传统实验技术 1 0 中国科学技术大学硕士学位论文第一章色谱分析中的化学因子分近 难以实现的作用,已成为色谱研究中一个非常有效的工具之一。 1 4 化学因子分析发展趋势 醚着分析化举数箔特点豹交纯,讫学因子分析研究豹趋势也发生了稻应的 变化,最毅进展 零瑷巷疆大方嚣:一是发曩确定 理想体系( 或复杂终系) 化 学组分数方法和解析方法;二是不断发展高维化学数据因子分析方法。现有的 确定因子数( 化学组分数) 方法耍么只是建立在特征值的基础上,要么仅仅利 厢了特征向堂所携带的信息,在实际应蠲中弱限往较大,不适用予一些非理想 麓二线数据侮系,螽:组分竞谱懿共线淫严燕、存在徽爨缓分、存在营豢干撬 等。发展同时含礴特缝值和特征匙量信息的方法也许能便估谤结果踅为准确。 在解析方法上,发展适应体系的多样性以及背景的干扰、灵敏度更高的算法成 为二维数据解析的一个至关重要的问题。 随着薪型联丽仪器的发震,三维( 或更高维) 化学数据分析已悄然送入化学 计量学家懿视线。三终亿学数据分辑的突出傻势三线淫分簿搂鳖懿难一憾,及 该模型与大多数二除分李厅仪器的相应模式( 即b e e r 定律) 的一致蛙,其分析缀 果直接对应于体系中化学组分的定性( 融谱或光谱) 与定量信息( 浓度) ,不存 在类似于二维数据解析中的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论