




已阅读5页,还剩105页未读, 继续免费阅读
(分析化学专业论文)化学因子分析新型算法及其在分析化学中的应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
! 塑鎏蹬燮! ! ! 滢篓圭羔鳖篓茎 摘婺 本文对亿学因子分丰斤( c f a ) 方法静理论和应用进行了探讨和研究。全文 共五章,萁中第一章为综述,其余四章分别为博士生期间的研究工作。 笼一章酋先介绍了常见c f a 方法的錾本原理、主要特点靼逶用问题,然羼 通过详细的文献调职,综述了c f a 在色谱分扳、电分孝厅化学以及其它分摄化学 镁域中的应娟现状秘秘究方囱。本肇还总结了e f a 兹摄毅研究进展,对i 蜃几年 来出现的一些敬遂帮新方法进行了奔绍,通过对阚题背景帮方法原淫的扼要描 述,突矗 了当前c f a 淫论中的热点河题和研究惑路。 在第二章建立了一种密口因子分柝( w f a ) 的新算法。w f a 属于自模因子 分板,是鼹板渐进过程数据的霾要方法,德到了广泛的应用。但噪声对w f a 干扰严耋,导致解孝厅结暴信噪拢降低甚至变形,影赡严重对使瓣援失败。通过 对传统w 淞箨法熬误嫠研究,分丰厅了茭易受噪声影嫡的理论爨因,并在此基 础上踅新提出了w f a 改进算法,理论上证明了该算法可敬进步减小噪声豹 影响。使用模拟和实验h p l c d a d 数据对改进算法进行了验证,并与传统算法 对比,结果表明改进的算法可以很大程度上克服噪声的影响,从原始信号中获 得更多有用信息,解析结果的信噪比得到提高,特征更接近纯组分信号,当噪 声的影响使传统算法失效时,改进的算法仍然可以得到令人满意的缀果。 第三章楚免疫主成分分析( i p c a ) 静研究。主成分分柝( p c a ) 怒绝大多 数c f a 方法的基础。但在e f a 中p e a 仅是一个缀数学交换,摹本出发点是裰 据变疆问的距离,并不适合所有实际问题。根据免疫算法( i m m u 聪a l g o r i t m ,i a ) 的基本原理提出的一种免疫主成分分析方法,i p c a 根据交量间的相似程度对原 始数据进行正交分解。使用模拟和实验h p l c d a d 数据对i p c a 进行了验证, 结果表噬i p c a 是一绅非迭代方法,只需要完成一次计算过程即可得到一个主 戏分,爨此l p c a 不仅能够显萋撮裹运算速度,露且可以避免迭代法中的误差 积累润题。使用t 融器w 融对l p c a 故降维性进 亍了研究,发现尽管l p c a 对信怠在主成分辛的分配与传统p e a 不丽,餐释维焉麓够保赘足够抟缀分信 息,与传统p c a 的绪采无统计学差异。l p c a 建我们改交传统p c a 的纯数学处 理,从其体化学问题的特点入手对数据艇阵实施正交分解的一个尝试,绪采表 明这种尝试是成功的。 第爨章楚对主因子数判凝方法的研究。曩测矩阵螅圭因子数对确定体系组 分数、估计量测误差和降维都肖重要熬意义,鼹管这阕题理论上并不复杂, 而且也发展了不少羯据,值实际串由于嗓声、;# 线性的影响,努嚣静判定方法 串簿辩学技寒太学搏士学链论文 一 一。一w _ _ _ - - - _ _ _ - _ _ _ _ _ _ _ - _ _ m h _ _ _ _ _ ,_ m 一 般需簧稳纛验 歪才髓给出较为可靠的结采。根据i a 的基本思想,提出了一种 基于免疫识别算法( i m m u n e c o g 硝t i o na l g o 矗t ,l r a ) 鲢主困予数判叛方法。 i a 中的免疫思想使残差矩阵成为i r a 的研究对象,通过亲合力数值的变化可以 清楚螽羹分辨一系蠢残余矩阵,款雨褥到主因子数。通过模叛数瓣和实验数据对 i r a 进行了验证,著与其它几转常用的判别方法进褥了对比。结果表明,l r a 判据明照,结果准确,特别是当其它方法处理实验数据不成功时,i r a 均获得 了正确翁主嚣子数,勇并i r a 菲常燹敏,除褥播主翻子数外,还能够稳溺劐其 它性质的因子数变化。 第五章是对峰包含体系解析的研究。色谱中有一类特殊的羹叠情形:一个 缱分的色谱蜂完全包含在另一个组分的色谱蜂中,遮被称为蜂包含体系。由于 不害孥合“先出现,先漕失;磊爨褒,蘑消失”黪濒进特性,已有懿c 瓢方法都 无法完全解析这类体系。本章对这类体系进行了比较详细的理论分析,根摆直 接求解旋转向星的恩路,将之转化为一个单交量的求解问题,并采用小波变换 微分的方法进行分辨,从瑟摄如了一穆线。眭搜索( l s ) 载方法对这类体系遴孳亍 解析。模拟数据验证结果表明,l s 方法具有过程简洁、抗噪声能力强、结果准 确豹优点,可敬解祈其它分辨方法尚不能解析的类型。我们的磷究结果不仅迸 一步揭示了峰包含体系的本质,焉虽为发展最终解聿厅方法提供了一个磷究方淘。 壁坠型杰壁曼主塑笙壅 a b s t r a c t t h et h e o r i e sa n d a p p l i c a t i o n so fs e v e 列c h e m i c a lf a c t o ra n a l y s j s ( c f a ) m e t h o d s a r ei n v e s t i g a i e di nt h i sd i s s e r t a t i o n t h ec o m e n t s 盯ec o n s t i t u t e db y 讯e c h a p t e r s t h e n r s tc h 印t e ri sar e v i e wo f t h ec f a w h i l e 血eo t h e r sc o n c e mo u rr e s e a r c h e s 1 nc h a p t e r1 ,s e v e r a lc o m m o n l yu s e dc f am e t h o d sa r ei n t r o d u c e di na s d e c t so f f u n d a m e n t a lt l e o r i e s ,m a i nc h a r a c t e r i s t i c sa 1 1 dv a l i dr a l l g e s t h e a p p l i c a t i o n so f t 1 1 e c f ai nc h m m a t o g r a p h y ,e l e c t r o c h e m i s t r ya 1 1 do t h e ra n a l y t i c a l c h e m i s t r yn e l d sa r e f e v i e w e d 讯t ha b u n d a n tr e f b r e n c e s s o m en e wa d v a n c e so fc f ar e s e a r c ha r ea i s o i n t r o d u c e d ,i ti se x p e c t e dt 1 1 a t 也eb r i e fd e p i c t i o n so ft l l e s ei m p r o v e m e m sa n dn e w m e t h o d sc a nr e v e a lc u r r e n ti s s u e sa n dt r e n d si nc f ar e s e a r c h c h a p t e r2c o n c e m s t h er e s e a r c ho nt h ew i n d o wf a c t o ra n a l y s i s ( w f a ) w f ai sa p o w e r f u ls e l f - m o d e l i n gt e c l l l l i q u e t or e s o l v ed a t ao f e v 0 1 u t i o n a r yp r o c e s s ,a n d b e c o m e sw i d e l ya p p l i e d h o w e v e r ,w f ai sf o u n dt ob eg r e a t l ya f 诧c t e db yt h en o i s e f r o mm e a s u r e m e m a ne r r o ra n a l y s i si sd o n e ,a n dt h et h e o r e t i c a lr e a s o ni sf o u n dt o a c c o u n tf o rt h ed i s t o n i o no ft h ec o n v e n t i o n a jw f a b y t l 】en o i s e b a s e do nt 1 1 ee i t o r a i l a l y s i s , a i m p r o v e da l g o r i t h m f o rw f ai s p r o p o s e d b o ms i m u l a t e da n d e x p e r i m e n t a lh p l c d a dd a t a a r er e s o l v e db yt h ec o n v e n t i o n a la 1 1 dm ei m p r o v e d m e t h o d s r e s u l t ss h o wt h a tt h ei m p r o v e dm e t h o dc a ng e to v e rt h en o i s et oag r e a t e x t e n t ,a m e n d 也es i g n a l l t o n o i s er a t i oa n d 也es h a p eo ft h er e s u l t t h ed a t as e t s , w h i c hd i s a b l et h ec o n v e n t i o n a lm e t h o d ,a r ea l s os u c c e s s f u l l yr e s 0 1 v e db ym e i m p r o v e d o n e c h a p t e r3c o n c e m st h er e s e a r c ho nt h ei m m u n ep r i n c i p a lc o m p o n e n ta n a l y s i s ( i p c a ) i nm a n yc f a m e t h o d s ,p c as e r v e sa sa 1 1o n h o g o n a lt r a l l s f o n n a t i o nt 0 0 1 b u t t h i st r a n s f o r m a t i o nb a s e do nt h ed i s t a n c e sb e t w e e nv a r i a b i e si so n i yam a t h e m a t i c a l p r o c e s s ,n o ts u i t a b l e f o ra uc h e m i s t r yp r o b l e m s an e wa l g o r i t m ,c a l l e di m m u n e p r i n c i p a lc o m p o n e n ta n a l y s i s ( i p c a ) ,i sp r o p o s e db a s e do nt h ei m m u n ea l g o r i t h m ( i a ) t h ei p c ap e r f o h n so r t h o g o n a ld e c o m p o s i t i o n b a s e do nt l l es i m i l a r i t i e sb e t w e e n v a r i a b l e s i tc a nb ef o u n dt 1 1 a tt h ei p c a ,a san o n i t e r a t i v em e t l l o d ,c 柚o b t a i no n e p r i n c i p a lc o m p o n e n t ( p c ) b yo n l y o n ec a l c u l a t i n gp r o c e s s n l e r e f o r et h ei p c ai sn o t o n l vf a s ti nc a l c u l a t i o n ,b u tc a na v o i d 也ec u m u l a t i v ee r r o rs u 施r e db yi 把r a t i v e m e t h o d s t h ed i m e n s i o nr e d u c t i o nb yi p c ai st e s t m e db yt f a a n dw f a ,i tj sf o u n d t h a ta l t h o u 西t h ei n f o m a t i o nd i s t r i b u t i o n so fi p c ad i f i e r 抒o m 也o s eo fp c a ,m o s t i n f o 咖a t i o ni sr e s e n r e d t h ei p c ai sas u c c e s s f u la t t e m p tt op e r f 0 咖o r t h o g o n a l d e c o m 口o s i t i o n 、v i 出c o n s i d e r a t i o no f s p e c 墒c a 儿y c h e m j c a ic h a r a c 锄j s t i c s i i i 中国科学技术大学博士学位论文 c h a p t e r4c o n c e m st h er e s e a r c ho n 也ed e t e m i n a t i o no ft h ep r i n c i p a lf a c t o r n u r n b e r a l t h o u g hs e v e r a lm e m o d sh a v eb e e nd e v e l o p e dt oa t t a c kt h i sp r o b l e m ,n o n e i se n t i 豫l ys 毛王c c e s s 1 弧l el m m h n e f e c o g n i i o na l g o 是t h i & a ) m e t h o di sp p o s e d b a s e do n 妇i r n m u n e a l g o r i t h f n ( i a ) t h ei d e ao f t h ei am a k e st h er e s i d u a lm a t r i c e s b et h ek e yi ni r a ,w i t ht h ev a r i a t i o no ft h ea 麟n i t yv a j u e s ,as e r i e so fr e s i d u a l m 8 t f i c e sc a 珏b ed i s e 瘛毪i n 8 t e d ,撼d 氆e r i n e i p a lf a c o r 珏毽m b e ri so b t a i n e d f r o mt h e t e s t so fs i m u l a t e da n de x p e r i m e n t a lh p l c d a dd a t a ,i r am e m o ds h o w st h e s u p e r i o r i t yo v e rm em e t h o d s o ft h ei m b e d d e de r r o r ( i e ) ,也ef a c t o ri n d i c a t o rf 妇c t o n ( 粼国躐d 臻e c o s sv 8 i i d a j o 亟( c v ) 。羚括a s o 叠u n d 拯a 啦ej r ai sv 髓ys e n s 拟v e , c a ne v e nd e t e c to t h e rc h a n g e si nf a c t o rn u m b e r s c h a p t e r 5c o n c e m st h er e s o l u t i o no ft h e p e a k e m b e d n gc h f o m a t o 酽a m b e c 鑫珏s eo f 氆en 一是f s t i 建f i 燃一o u t p p e r t y , s u c h c h r o m a t o g r 煳 c a n n o tb e c o m p 】e f e j yr e s o j v e db yt h ec u n - e n te v 0 1 v i n gm e t h o d s b a s e d o nad e t a i l e dt h e o r e t i c a l a n a l y s i s ,m er e s o l u t i o ni sp r o v e dt ob ea ne q u i v a l e n to f ao n e w 畦a b l ep r o b l e m ,i e t h ef o t 稚i o nv e e t o ti no 斑e rt oo b _ 【a i n 搬er o t a t i o nv e c t o r ,as t 豫t e g yo fd i r e c t i o ns e a h i sa d o p t e d ,w i t l lt h ew a v e l e tt r a n s f o m lt op e r f o r mt h ed i s c r i m i n a t i o n a sar e s u l t ,a l i n e a rs e a r c h ( l s ) m e t h o d sp r o p o s e d f r o mt h et e s t s ,t h el s 靠l e 氇。娃i s 岛u n dt ob e s i m p i e ,i s e - r e s i s 拯n t ,a n da c c u r a t e o u r f e s e a r c hn o t o n i yf 融h e rr e v e a l st h ee s s e n c e o fs u c hc h r o m a t o g r a m ,b u ta l s om a yi n d i c a t ead i r e c t i o nf o rt h e 矗n a l r e s o i u t i o n 1 v 量塑墅兰堂萎塑塑曼麴兰圭登童坚垒整一 篓量堡塑兰堕兰 a ,b ,c 一 a ,b ,c 。 心1 ,譬4 ,c , a ,b ,c a ,b ,c t 珉,j 如r ( a ) d i a g t 的 蕊裙( 8 ) ,d 村七( a ) 护a c e ( a ) a f a : a l s : c f a : e f a : f s w e f a g r a f a : g r a m : h e l p : l 琰s f : 1 1 7 t f a : l s : o p a : p c a : p m f : r a f a : s m c r : s w a : t f a : w e f a : w f a : w t t f a : 符号说明与缩写 大写的黑体字母表示矩阵 表示矩阵的转置 表示矩辫懿逶 小写的黑体字母表示列向摄 列向量的转置表示行向量 表示矩黪a 串第| 行,第,列懿元素 表示矩阵a 的行列式 表示矩阵a 的主对角线元素构成的向量 表示以巍量8 为主对是线元素瓣矩跨 表示矩降a 的秩或求秩操作 表示矩阵a 的迹或求迹操作 a b s t r a c tf a c t o ra 1 1 a l y s i s ,抽象因子分析 a i 耗m a t i n g 】e a s ts q u a r e s ,交替疑小= 乘 镄e m i c 啦盎c t o ra n a l y s i s ,化学因子分辑 e v o l v i n gf a c t o ra 1 1 a l y s i s ,渐进因子分析 f i x 醯s i z e 豳d o w e v o i v m g 蠡l c 辩ra n a l y s i s ,溺定尺寸窗掰渐遗因子分折 g e n e r 越i z e dr a 呔a n l l i h i l a t i o n 如c t o f 烈越y s i s , 广义秩瀵因予分柝 g e n e r a l j z e d 删1 】( a j j l j l a t j o nm e t h o d ,广义秩消方法,同g r a f a h e u r i s t i ee v o l v i n gl a t e n tp 嘲e c t i o n ,赢蕊接导式演迸特征投影 i t e r a 如ek e ys e tf a c t o fa n a l y s i s ,迭代特,征子集因子分耄睡 i t e r a t i v et a r 学tt r a n s f o m a t i o nf a c t o ra n a l y s 氓迭代目标转换因子分析 l i n e a rs e a r c h ,线瞧接索 0 f t h o g o n a lp 嘲e c t i o na p p r o a c h ,正交投影方法 p r i n c i p a lc o m p o n e n ta n a l y s i s ,主成分分析 p o s i 萏v em 雏童xf 爵t o 疸z 破i o n ,菠矩阵滚子纯 r a n ka n n m i l a t i o nf 犯t o ra n a l y s i s ,秩消因子分掇 s e l f - m o d e l i n gc u er e s o l u t i o n ,自模曲线分辨 s 曲w i 晡o w 鑫e 毫o ra n 8 l y s i s ,予塞墨鬻子分橱 协g e t f a c t o ra n a l y s i s ,目标因予分析 w i n d o we v 0 1 v i n g f a c t o r a n a l y s i s ,窗口渐进因子分析,同f s w e f _ a 锄n 面wf 8 c 协r 曩n a l v s i s ,鬻日戳子分援 w i n d o wt a 嘻e t - t e s t i n gf 乱t o ra n a l y s i s ,窗口目标检验因子分析 v 生里塑! 鱼鲨盔兰塑壹主堂焦笙塞箍二童些堂因子分析( c f a ) 及其在分析化学中的应用 第一章化学因子分析( c f a ) 及其在分析化学中的应用 第一节化学因子分析( c f a ) 的基本原理及方法 计算机化是现代分析化学的重要特征。方面,计算机的应用使分析手段 获得了革命性的发展,一些现代分析仪器,如h p l c d a d 、g c 埘s 、相分辨荧 光光谱等,能够提供二维矩阵甚至三维张量形式的多变量原始数据,包含了关 于分析对象更丰富的信息。另一方面,特别是微机的普及,使不少功能强大但 因计算过于复杂而无法实现的数学方法得以应用。因此迅速而有效地处理这些 复杂的量测数据,从中获得更多的化学信息是现代分析工作者的一个重要研究 课题。在这种背景下,相继出现了化学计量学( c h e m o m e t r i c s ) 和化学信息学 ( c h e m o i n f o m a t i c s ) 两个新的化学分支i ”,前者是“应用数学和统计学方法( 借 助计算机技术) ,设计和选择最优的测量程序和实验方法,并且通过解释化学数 据而获得最大限度的信息”;后者则是“利用计算机技术和计算机网络技术,对 化学信息进行表示、管理、分析、模拟和传播,以实现化学信息的提取、转化 与共享”。 因子分析( f a c t o ra 1 1 a l y s i s ,f a ) 的历史可以追溯到2 0 世纪3 0 年代,心理学 和统计学的数据分析者面对的是数据量很大而且变量间存在相互影响的数据表 ( 相当于一个二维矩阵) ,需要借助多元统计分析方法对原始数据进行冗余信息 的排除和有用信息的提取,这样形成了因子分析。所以从数学原理上看,因子 分析是一种多元统计分析方法。化学因子分析( c h e m j c a lf a c t o ra 1 1 a j y s i s ,c f a ) 是因子分析在分析化学中的应用和发展,是具有鲜明化学特色的因子分析方法。 c f a 的开创性工作是k a l l l ( a r e l 2 l 完成的,他首次使用抽象因子分析( a b s t r a c tf a c t o r a n a l v s i s ,a f a ) 处理配位化合物的吸光度数据,建立起矩阵的数学秩与化学体 系中吸光物种之间的关系。m a l i n o w s k i 【3 】在c f a 发展史上是一位里程碑式的人 物,他建立了c f a 的误差理论,而且发展了不少c f a 方法。我国的分析工作 者也做出了不少贡献1 ,值得一提的是梁逸曾教授将分析化学中复杂多组份体 系划分为白色( 已知各组分的定性信息) 、灰色( 己知各组分的定性信息,但存 在未知干扰) 和黑色( 没有任何先期信息) 三种情况,得到了较为广泛的认可。 化学因子分析出现于2 0 世纪7 0 年代初,随着计算机的飞速发展,其应用 日趋广泛。现在分析体系的复杂程度和数据解析的质量要求不断提高,c f a 越 来越引起人们的重视,研究和应用逐渐增多,已经发展了很多各具特色的c f a 方法,适合解决不同化学体系的问题。下面介绍一些比较典型的方法。 三坚堕塑壁i ! 达堂竖主堂垡迨奎 箜= 童些堂里王坌堑! ! 坠! 星基垄坌堑些堂主盟生星 ( 一) 抽象因子分析( a b s t r a c tf a c t o ra 1 1 a l y s i s ,a f a ) a f a 在数学上等价于主成分分析( p f i n c i p a lc o m p o n e n ta n a ly s i s ,p c a ) ,即 对原始量测矩阵d ( ,c ) 进行如下分解 2 。旦麓+ 曼, ( 1 一1 ) r x c ,x n 月c 、 式中u 为得分( s c o r e s ) 矩阵,相当于p c a 中的主成分p c ,其列向量相互正 交但不归一:v 为载荷矩阵( l o a d i n g s ) ,相当于p c a 中的特征向量矩阵,其 列向量相互正交且归一:r 为残余矩阵。第,个得分向量( 矩阵u 的第,列) 反映了原始矩阵在第,个载荷向量上投影的大小,而该得分向量的模则等于第, 个特征向量对应的特征值,所以c f a 中,特征值可以作为确定主因子数胛的依 据。 化学中的二维量测数据常可视为一双线性矩阵( b i l i n e a rm a t r i x ) ,以”组分 的h p l c d a d 数据为例,其量测数据符合以下数学模型 d=c s , ( 1 2 ) 式中c 和s 分别为各组分的色谱和光谱矩阵。比较( 1 1 ) 和( 1 2 ) 两式,如 果忽略残余矩阵的影响,有 cs = u v ( 1 3 ) 上式表明,a f a 的结果包含了组分的全部信息,但u 和v 中的列向量并不是各 组分的光谱和色谱,只是一种纯数学解,是“抽象”的。上式还表明a f a 的一 个重要性质:c 和u ( s 和v ) 的列向量张成的线性空间相等。所以u 或v 的 列向量是组分色谱或光谱向量空间的组正交基,可以线性表出体系中每一组 分的真实光谱或色谱,这一线性表出通常是使用旋转矩阵( 即线性变换系数矩 阵) 来完成的,旋转矩阵的不同构造方法就形成了不同的c f a 方法。 a f a 虽然不能提供更多有化学意义的信息,却是其它c f a 方法的基础和分 析过程的首要步骤。通过a f a 可以获得量测矩阵的主因子数,进而对体系的化 学成分数作出估计:忽略次要因子( 即公式( 1 1 ) 中残余矩阵r 中的信息) 可 以对原始数据进行降维和滤噪处理,提高了数据的质量。a f a 将几乎全部有用 信息“转移”到一些相互正交的向量中,这对理论分析和数据处理都非常有利。 ( 二) 目标因子分析( 陆g e t f a c t o r a n a l y s i s ,t f a ) t f a 是m a l i n o w s k i l 7 j 提出的一种c f a 方法,通过数学手段检验分析体系中 是否存在某种模型。在t f a 中,分析者首先根据化学理论知识、实验知识或直 观经验知识获得与原始数据有关的物理或化学参数,并由此构造出目标向量( 目 标因子) ,然后通过实验数据信息( 量测矩阵的a f a 结果) 对这些向量进行检 验以确定其是否为真实因子,最后根据检验后的真实因子来确定数据模型,获 中国科学技术大学博士学位论文第一章化学因子分析( c f a ) 及其在分析化学中的应用 得分析者所关心的化学信息,如组分的浓度分布、吸收光谱等信息。 t f a 的一般步骤为:首先对量测矩阵d 进行a f a ,如( 1 一1 ) 所示,得到矩 阵u 和v ,然后构造目标向量r ( 相当于d 的行向量) 或c ( 相当于d 的列向 量) ,通过下面两式计算出相应的预测向量 f = t r r ,誊= t c c ,( 1 4 ) 式中t r = v ( v v ) - v ,t c = u ( u u ) 1 u 称为最小二乘变换器。直观地比较f 与 r ,芒与c 在一定误差范围内是否相等,就可以确定目标向量是否是真实因子, 另外也可以通过可靠性函数r e l i 、损害函数s p o i l 进行检验以提高结果的客 观性。m a l i n o w s k i 还发展了一种基于统计学f 检验的判据【”,用于判断目标向 量的可接受性,效果很好。r u m m e l 的结论【8 l 是:r m s 系数、叠合系数和组合 相关系数特别适用于比较两个向量的相似性。 t f a 的实质是多元线性拟合。以目标向量r 的检验为例,如果r 为真实因 子,那么可以认为其位于d 的行向量所张成的因子空间,所以r 可以被v 的列 向量线性表出。设线性系数向量为a ,则应有 v a = r ( 1 5 ) 上式的最小二乘解为a :( v t v ) - 1 v r ,所以r 的预测值为f = v ( v 。v ) _ 1 v r ,这 和( 1 4 ) 式的结果完全一致,所以预测向量是目标向量的最小二乘估计。这种 意义上,真实因子就是拟合误差小的目标向量。 尽管t f a 需要分析者构造检验向量,但t f a 有一个显著的优点:在处理复 杂混合体系时不需要其它因子的单一信息就可以对某一因子进行检验a t f a 已 经得到了比较广泛的应用,特别适用于混合体系各组分的定性、定量分析,以 及单一组分信息的提取。 ( 三) 迭代目标转换因子分析( i t e r a t i v et a r g e tt r a n s f o 咖a t i o nf 犯t o ra 1 1 a l y s i s , i t t f a ) i t t f a 是r o s c o e 、g e m p e r l i n e 和v a 皿d e g i n s t e 等人”分别提出的,是t f a 的发展。i t t f a 从目标向量一个初值开始,通过迭代获得最终的预测向量。以 上面t f a 中目标向量r 的检验为例,设其初值为r o ,则i t t f a 过程可以表示为 a 2 【v v ) v l 一- ( 玎:l ,2 ) ( 1 6 ) l = v a 一般以一l 一。0 小于一个常数为迭代终止条件。 i t t f a 具有以下优点:第一放宽了对构造目标向量的限制,有数据分析实 例表明,在目标向量缺少半数以上的数据时,i t t f a 依然可以得到理想的结 ! 旦型堂堇查盔堂堕学堡堡皇第二章堡学因子分析( c f a ) 及其在分析化学中的应用 果。第二i t t f a 适合处理由于组分量测谱( 如光谱) 的高度相似而导致原始数 据矩阵秩亏损的情况,此时( 1 4 ) 式中的转换矩阵t 近乎奇异,求逆过程中的 条件数会很大,由此导致的误差使计算结果完全无效。i t t f a 使用的是载荷矩 阵和得分矩阵进行运算,矩阵求逆不仅误差很小,而且非常容易,所以能够降 低实验误差在计算过程中的传播和放大。第三,如果初始向量选择合适,通过 i t t f a 可以得到单一组分的信息( 多数情况下是获得浓度分布,因其初始向量 比较容易构造【1 0 1 ) ,从而实现完全解析。迭代法能否得到准确结果的关键在于初 值,如何选择合适的初始向量,使迭代收敛于真实因子,目前仍i t t f a 的一个 值得研究的问题o 1 ”。 ( 四) 秩消压l 子分析( r a l l i ( a l l n i l i i a t i o nf k t o ra 1 1 a i y s i s ,r a f a ) i 乙气f a 是h o 等人m 删在研究荧光的激发发射光谱的定量分析时提出。从数 学角度看,矩阵的秩是其行( 或列) 向量中线性无关向量的数目,所以理想情 况下,一个混合分析体系的量测矩阵的秩就是该体系中独立组分的个数。尽管 实际分析中由于噪声的影响上述结论并不严格成立,但矩阵的秩和体系的独立 组分数总是存在高度的相关性。r a f a 的基本思想就是如果能够将某一组分的 信息从原始量测矩阵中( 完全) 除去,那么矩阵的秩将减小1 。设量测矩阵为 d ,其中组分f 的信息为d 。,对应浓度为q ,该组分标样的量测矩阵为d f 。,标 样浓度为c 则r a f a 可以表示为 ,册七( d d ) = 阳础( d 一柚1 0 ) = m ( d ) 一1 ( 1 7 ) 改变值的大小,使式中的等号成立,就表明组分f 的信息已经从原始矩阵中 完全扣除,根据i 值可以获得组分j 的单一信息,d ,= 柚q = 虹。h o 等人 使用迭代法求解( 1 7 ) 式,迭代在矩阵最后一个有意义的特征值达到极小时停 止。h o 等人还用一个类b e s s e l 不等式来检验量测矩阵中是否含有待测标准物的 信息。 上述方法的一个缺点是计算量太大,为此l o r b e r 【“提出了一种非迭代计算 方法,将r a f a 转化为一个广义特征值问题进行求解。该方法首先对d 进行奇 异值分解 d = u s v ( 1 8 ) 取矩阵u 、s 和v 的前月列( 月为主因子数) ,得到u 、s 。和,则女值可通 过下式计算得到 七= 1 抛卯【u :d 帅s 刘 ( 1 9 ) r a f a 对有标样信息的组分的定量分析非常方便,特别是当只需分析混合样 品中的某一个或几个组分时特别有效。r a f a 的缺点是每次只能分析一个组分, 4 皇星型堂堡垄奎兰璺主堂垡鲨塞鳖二童些坐旦至齄堑j c f a ) 及其在分折化学中的应用 恧基每分援一次裁霉要一令技准矩终,s a 珏c 沁z 和k o w a l 虫i 提出熬广义秩消因 子分析( g e n e r a l i z e dr a n ka r u l i h i l 鲥o n f a c t o r a n a l y s i s ,g r a f a ) 【1 7 l ,克服了r a f a 的不足,能够确定各维分的双线往光谱及萁褶对含量。 ( 五) 澎避浚手分析( 琶v 。l v i n g 蠡c o r 鞣a l y s i s ,琶f a ) e f a 楚一类l 常黧要豹c f a 方法,从e f a 派生出很多著名豹因子分蜒方法。 e f a 的处理对象是存在渐进过程( e v o l v i n gp r o c e s s ) 的分析体系。所谓渐进过 程感指某种仡学组分胍生成蓟消失酌渐变过程,蒸辩溺辐上酌量浓度趋绕表壤 为从基线舞始逐澎势裹,到达一个极大螽逐渐下降,辫回到基线。濒进过程在 分析化学中非常普遍,如色谱、滴定、动力学过程等,所以研究能够解析渐进 过稔的数学方法具有稽当的必要性和鬟要往。e f a 最翠由g a m p p 鞠m 撕膏”1 提 出,包摇蹲个独立熬郏分:初级e f a 鄹终缀e f a ,实现方法有糊) e r l i n c i ”l 、 v d k l 2 0 1 和g m m z 【”) ,都是根据提出者的姓名来命名,前两种方法的实质是基于 目栎检验,g m m z 的系统往强,也容荔理群,莓籍静庭稻琵较广泛。 初级e f a 有正向和反囱两个过稷。仍以h p l c - d a d 数据为例,要求每个 波长点下的量测谱均为一个渐进过程的记录,所以量测d 的列为色谱,行为光 谱。在量测低限和离黻范淹舞,董测馇近于零。沿海逡方匙逶过璇下方式取源 始矩阵d 的子矩阵 睁髅:,凄篆篙 3 ,一”+小蚴 对予这一系列予矩阵班,通过奇异筐分解等手敬,褥翔矩簿靛祷薤值。翔栗体 系翰缝分数为掰,藏把洳+ 4 ) 躐掰+ 5 ) 令大豹特征餐鹣对数慰i 擘强,瑷爨建 丢失有用信息。以所有的第一个特征值绘制曲线1 ,以所有的第二个特征值绘 制曲线2 ,余此类推。一个较大的、有意义的特征值的出蕊意味着在混合物的 渐遴过程中,蠢一个新穆释凄蠛,或者说,一令颓熬濒进避程开始。瓢另努 个角度饕,如果新增加的魑测馕包含了新的、与所有融出现的物种都线性无关 的物种信息,则有个新的特征值开始以较大的正值出现,并虽会随新物种浓 度瓣增鸯鞋舔增秀霹。稳反,疑果毅增熬豹量测焦只毽含擐来已经出现的物转信息, 那么原来的特征值会有缓慢的增加,但不会出现新的特征值。 对于正向e f a ,新的因子( 较大特征值) 表示有新物种的出现,对于爱向 e f a ,爨表示莱一纺耪豹瀵失。瑟滋,藉莱一物秘约耍淘帮反匀搬强趣线,可 以得到该物种的存在范围( 或称“浓度窗翻”) 。难向e f a 的第f 条和及向e f a 的第( f 十l n ( f 为因子数) 魏线表示同一物种。 终极e 王浊是投据翘级e f a 躲结果,对冬组分的浓度分布( 色谱曲线) 进行 估计。如公式( 1 2 ) 和( 1 3 ) 所示,组分的真实色谱向薰( c 的列向量) 和 ! 旦型兰塾:! ! 堂堕主兰垒堡塞 丝= 重些堂圈王坌堑! ! 坠! 壁基垄坌堑些堂主塑窒旦 抽象浓度向量( u 的列向量) 张成同一线性空间,所以有如下关系成立 c = u r ( 1 1 1 ) 式中,r 表示旋转矩阵。同理,对于某组分“存在如下等式 c 。= ur f ,( 1 1 2 ) 式中c 。为该组分的单一色谱,r ,表示对应的旋转向量。 根据初级e f a 获得的窗口参数,将c ,与u 中对应于组分,浓度窗口的数据 与行向量删除,得到c ? 和u ? ,根据( 1 1 2 ) 应有以下等式成立 c ? = u ( 1 1 3 ) 理想情况下,c ? 是一个零向量,所以上式是一个具有明显无效解l = o 的齐次方 程组。为求解出有意义的r ,可以指定向量i 中的任一个元素为l ,即i ,= 1u 为任意值) ,这样向量r l 中的其它元素可以用最小二乘法求出。如果用u :表示 u ? 的第,列,用u :,) 表示将u :从u ? 去掉后得到的子矩阵,用r j ( ,) 表示r i 中去掉 第,个元素( 等于1 ) 的向量,于是有 ) = 一慨j ) l u :,) 广u 搿u ; ( i - 1 4 ) 然后将t ( ,j 和1 组合即可得到t ,同理其它组分对应的旋转向量可以求出。有的 方法指定r 的对角线元素为1 ,有的则是指定r 的第一行元素为1 ,对于模拟 数据来说,二者结果基本一致。终极e f a 的图解如下,其中深色部分表示组分 浓度分布范围。 皿 c :u r c 。= u r l。? = u o r 图1 】e f a 计算组分浓度分布的过程示例( 三组分体系) 获得旋转矩阵r 后,根据( 1 1 1 ) 式就可以求出获得组分的真实浓度分布 矩阵c ,最后利用最小二乘法求出光谱矩阵s ,完成数据解析。 e f a 具有明显的化学含义,建立方法时考虑了渐进过程的特点,而数学原 理又是完备的,无需对研究对象加以特定模型的限制,所以e f a 受到了c f a 6 ! 里型堂堇查盔堂竖圭堂垡笙塞蔓二童丝堂旦量分析( c f a ) 及其在分析化学中的应用 工作者的广泛关注,在许多方面的应用都获得了令人振奋的成功,e f a 的一些 基本概念和思想对以后的因子分析方法产生过重大的影响。 但e f a 也存在一些不足,初级e f a 的计算量太大:没有考虑实验误差的影 响,而这种影响有时是灾难性的:如果没有充分的量测误差信息,则无法确定 误差归属的阈值,解释特征值图就会出现混乱,不仅无法确定体系的组分数, 而且也无法准确确定各组分的浓度窗口。 ( 六) 固定尺寸窗口渐进因子分析( f i x e ds i z e 晰n d o we v o l v i n gf a c t o ra n a l v s i s , f s w e f a ) f s w e f a 是k e l
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年自考专业(人力资源管理)考前冲刺练习题附参考答案详解(典型题)
- 2025年期货从业资格之《期货法律法规》题库高频难、易错点100题模拟试题及参考答案详解【新】
- 2025年护士资格证每日一练试卷(达标题)附答案详解
- 驾驶机小车考试题及答案
- 嘉禾班考试题目及答案
- 2025年云南省香格里拉市中考数学试题及1套完整答案详解
- 农发行六安市舒城县2025秋招笔试英文行测高频题含答案
- 农村旅游与农业产业升级
- 工作技能与专业能力
- 光子晶体制度
- Kappa测试数据分析报告
- 安吉汽车物流运输优化方案全套
- 新教材-人教版高中物理选择性必修第一册 第一章 动量守恒定律 知识点考点重点难点提炼汇总
- 变更董事股东会决议
- 02jrc901b电子海图操作jan中文说明书
- 精选幼儿园体能大循环方案
- 全国中学生物理竞赛复赛实验考查
- 例谈小组合作学习在小学英语教学中的有效开展(讲座)课件
- 部编版五年级道德与法治上册第3课《主动拒绝烟酒与毒品》优秀课件【最新】
- 《认识分式》教学课件【初中数学】公开课
- 制造企业物料试用单
评论
0/150
提交评论