




已阅读5页,还剩31页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 化学量测数据的校正与分辨是2 1 世纪化学计量学的主要发展领域之一,正 交投影算法在该领域中占据重要地位。正交投影算法在化学计量学中有着广泛的 应用:从一维矢量数据的分析到高维数据的校正与分辨中都可以采用正交投影算 法;从局部曲线拟和,联用色谱重叠峰中目标光谱的二次投影分辨,到纯分析信 号系列、正交信号校正系列,以及其它多种校正和分辨方法都采用了正交投影算 法的思想。 首先,本文讨论了正交投影算法的基本思想。正交投影算法在化学计量学方 法中最早最直接的应用就是多元校正模型的检验了,通过多元校正模型的检验我 们可以领会到正交投影算法的本质。接着我们介绍了正交投影算法的其它两个应 用局部曲线拟和法,联用色谱重叠峰中目标光谱的二次投影分辨方法。 其次,本文讨论了正交投影算法在纯分析信号算法的应用。纯分析信号最早 用来评价两维数据的校正与分辨的结果,它应用正交投影算法思想,使得各种分 析结果的评价标准都有了简单明了的表达形式。接着我们介绍了利用纯分析信号 的直接校正方法h l a 和我们提出的h l a e ( n a p ) ,并把他们与传统的分析校正 方法p l s 做了一个比较。 再次,本文系统的介绍了正交信号校正的系列算法。正交信号校正方法是一 种分析数据的预处理方法。它与传统分析数据的预处理方法不同之处在于能够确 保每次被校正掉的量测数据信息与待分析量测信息无关,这样正教信号校正能够 完好的保全量测数据中的有用信息。正交信号校正的系列算法在本质上是一致 的,但表达形式上的不一样使得它们应用范围不同,在总体性能上也体现出一定 的差异。 最后,本文详细介绍了我们提出的一种高维正交信号校正方法。这是我们借 用二维p l s 到高维p l s 的发展思想,从适用于二维数据预处理的正交信号校正 方法发展成适用于高维数据预处理的方法。这不仅在理论上丰富了正交信号校正 方法,在实际应用中也能有效的对高维数据进行预处理( 使后继的高维数据校正 或分辨方法取得更优的分析结果) 。 h a b s t r a c t a b s t r a c t 1 1 l em e t h o d sa b o u to r t h o g o n a lp r o j e c t i o na c ta sa l li m p o r t a n tr o l ei nq u a n t i t a t i v e a n a l y s i sa n dq u a l i t a t i v ea n a l y s i so fc h e m o m e t r i c s o n eo fm a i nf i e l dw h i c hw i l lb e t a k e ni n t oa c c o u n ti n21e n 劝em e t h o d sa b o u to r t h o g o n mp r o j e c t i o nh a v eb e e n w i d e l ya p p l i e di nc h e m o m e t r i c s p r o j e c t i o na l g o r i t h mc a l l b ea p p l i e di nm a n y d i f f e r e n tf o r m so fd a t a ,f r o mav e c t o rd a t at oam u l t i - w a ym e t r i c sd a t a t h e ya l s oc a n b ea c t e d 弱m a n yd i f f e r e n tf o r m si nm a n ym e t h o d s ,s u c h 嬲l o c a lc u r v ef i t t i n g m e t h o d s ,t a r g e ts p e c t r o s c o p yi nh y p h e n a t e dc h r o m a t o g r a p h yo v e r l a p p i n gp e a k sf o r t w op r o j e c t i o nr e s o l u t i o n , t h es e r i e so fn a s ( n e ta n a l y t es i g n a l ) a n dt h es e r i e so f o s c ( o r t h o g o n a ls i g n a lc o r r e c t i o n ) ,e t c f i r s t , t h ep a p e ri n t r o d u c e st h ee s s e n c eo fo r t h o g o n a lp r o j e c t i o n n 硷m e t h o d j l e s t i n go fm u l t i v a r i a t ec a l i b r a t i o nm o d e l c a nb es e e n 觞t h ef i r s ta p p l i c a t i o no f p r o j e c t i o na l g o r i t h mi nc h e m o m e t r i c s w ec a ns e ei n t ot h ee s s e n c eo fo r t h o g o n a l p r o j e c t i o no v e ri t t h e n , w et a l ka b o u tt o wo t h e rm e t h o d sw h i c ha d o p tt h ei d e a lo f o r t h o g o n a lp r o j e c t i o n o n ei sl o c a lc u r v ef i t t i n gm e t h o d s ;t h e o t h e ri st a r g e t s p e c t r o s c o p yi nh y p h e n a t e dc h r o m a t o - g r a p h yo v e r l a p p i n gp e a k sf o rt w op r o j e c t i o n r e s o l u t i o n s e c o n d ,t h ep a p e rd i s c u s s e sn e ta n a l y t es i g n a l n a si sd e f i n e da st h ep a r to ft h e s i g n a lt h a ti so r t h o g o n a lt ot h es p e c t r ao ft h eo t h e rc o m p o n e n t s n a si sa l le f f e c t i v e w a yt oe x p r e s se r r o rp r o p a g a t i o na n df i g u r e so fm e r i tf o rq u a n t i f i c a t i o n a f t e rt h e w o r k so fa v r a h a ml o r b e r , a n d r e wj b e r g e r , l i a n gx u ,h c t o rc g o i c o e c h e a , e t c , n a sh a sb e e nd e v e l o p e dag o o dm e t h o dw h i c hc a nb ed i r e c ta p p l i e di nq u a n t i t a t i v e a n a l y s i s 砸r d ,t h ep a p e rd i s c u s s e st h es e r i e sm e t h o d so fo r t h o g o n a ls i g n a lc o r r e c t i o n o s ca c t s 雒as p e c t r a lp r e p r o c e s s i n gm e t h o d m sp r e p r o c e s s i n gw a yr e m o v e s s y s t e m a t i cn o i s ei n f o r m a t i o na sc l o s et oo r t h o g o n a la sp o s s i b l et oag i v e ny - v e c t o ro r y - m a t r i x an u m b e ro fo s ca l g o r i t h m st h a th a v ea p p e a r e da r ec o m p a r e df r o ma t h e o r e t i c a lv i e w p o i n t l a s t ,t h ep a p e rd i s c u s s e sam u l t i w a ym e t h o do fo s c - n o s c i nd e t a i l w ep u t f o r w a r dt h em e t h o df r o mt r a d i t i o n a lo s ci nt e r m so ft h ei d e ao ff r o mt r a d i t i o n a lp l s t om u l t i w a yp l s n p l s t h em u l t i w a yd a t aa f t e rp r e p r o c e s s e dw i t hn o s cw i l l h a v ea l lo p t i m a la n a l y t i cr e s u l tb yp l s 1 符号表 符号表 1 凡是文章中未特别说明的地方,符号均采用下述定义。 l :分析体系样品数。 k :分析体系的组份数。 m 、n :m 波长扫描采样点数、n 保留时间采用点数。 x :量测矩阵,大小l l 表示矢量数据,l m 表示二雏矩阵、l n m 表示 三维数据。 y :待测信息矩阵,一般指浓度阵,大小l k 。 c ,s :体系中纯物质的色谱、光谱阵。 c - j :体系中去掉第j 种组份后余下组份纯色谱阵。 i :单位矩阵,大小在每一个等式中不一样。 p d :表示矩阵d 的正投影矩阵d d + ,用于表示d 自身张成的线性空间。 a d :表示矩阵d 的反投影矩阵( i d d 十) ,用于表示d 张成的线性空问的正交 补空问。 x :x 的转置阵。 x + 、x 一:x + 的m o o r e - - p e n r o s e 逆、x 一的广义逆。 x 一1 的逆。 九、p :矩阵的特征值,特征向量 w :权重矢量 t :得分矢量 p :载荷矢量 z 回归系数r 、均方根偏差r s 和回收百分率r t 尼s 2 = 奎( f l i , o b s - - y i , p r e ) 2 酉 k 足2 :l 一乏i c 。( y i , o b s - y i , p r e 百d ) 2 篇咖一y i , a v g ) z ( 踢) = ( y f 嘭油l o o ) i v 前言 前言 自然科学与技术科学的信息化是迈入2 1 世纪科技发展的重要趋势。信息以 及材料和能量被公认为构成现代文明的三大要素。信息技术实际已成为现代文明 的科技基础。以计算机技术为核心,一场深刻的新技术革命已渗透到几乎所有的 学科领域j 。 信息技术涉及信息的获取、传输、存储、处理、检测、显示等诸多方面。分 析化学是一门研究化学量测与表征的科学。分析工作者通过化学量测获取用于化 学袁征所需要的信息。分析化学是一门计量科学,它发展、优化、应用量测过程, 以获取全局或局部性的化学品质信息,解决所提出的量测课题睇j 。分析化学实际 上是一门化学信息科学i j j 。分析工作者的工作对象,不在于合成某种信息的化合 物,而是要提供有关物质的化学成分与结构有关的信息。 化学计量学( c h c m o m e t r i c s ) 是7 0 一8 0 年代发展起来的一门新兴化学分支学 科,它应用数学、统计学与计算机科学的工具和手段设计或选择最优化学测量方 法、并通过解析化学测量数据以最大限度地荻取、表达、显示相关化学信息。可 以认为,化学计量学是化学、分析化学、数学、统计学及计算机科学之间的“接 1 :7 叫4 1 。化学计量学以化学量测的基础理论与方法学为研究对象。它涉及的问题 很多是分析化学的基础性问题,或者说它构成分析化学第二层次的基础理论的重 要组成部分i 引。如果说分析化学是化学学科的信息化的结果的话,则化学计量学 与实际的量测方法学构成了分析化学的两大基石。 分析化学与化学计量化学在2 1 世纪的几个主要发展领域如下i l l : 1 采样、试验设计、与优化获取化学信息的起点获取信息的第一步是 采样、试验设计与优化。随着化学计量学的发展,分析采样理论渐趋完善j 。 2 化学量测数据的校正和分辨从化学量测数据中获取有用信息最基本的 一步,是校正与分辨。总的说来,按有关分析试样的先验信息,可将分析体系分 类为白、灰、黑三类1 4 l 。通常特定的方法只适用于特定类别的体系。k v a l h e i m 与 梁逸曾提出的直观推导式演进特征投影( h e l p ) 1 7 】方法是很有效的黑色体系分 析方法。 3 化学计量学方法的稳健化稳健的化学计量学方法大大降低了量测异常 值、测试仪器的漂移对分析结果的影响。将投影寻踪( p p ) 引入p c a t s l 并采用 前言 s a 作为全局优化算法f 9 j ,能构建陛能较优异的稳健p c a ( r p c a ) 。 4 人工神经网络等用于非线性校正、化学模式识别及构效关系等研究 人工 神经网络( a n n ) 1 0 1 1 1 ,遗传算法【1 2 等在化学计量学中应用甚广,是一种有效 的非线性校正方法。 5 化学计量学教学及其它b r o w n 0 3 1 指出,化学计量学教学远未普及,他认 为化学家习惯于将9 9 的精力与资源用在数据的收集上,只余下1 用于将数据 转换为信息。这种与信息时代的观念相悖的习惯应通过化学教育加以改变。 本文研究的主要对象是基于正交投影的化学计量学方法及其应用,是有关量 测数据的校正与分辨领域内的内容。在化学计量学发展初期,正交投影算法主要 是其它主流化学计量学方法的一些辅助分析,如多元校正模型的检验等。目前正 交投影算法在化学计量学中有着广泛的应用。例如,k a r s t a n g 和k v a l h e i m 提出 的局部曲线拟合法( l c f ) 1 4 l ,l c f 用来对矢量数据进行定量分析;陈迪钊的联 用色谱重叠峰中目标光谱的二次投影分辨方法【15 1 ,二次投影分辨方法用来对二维 数据进行定性解谱。更有a v r a h a ml o r b e r 提出的纯分析信号( n a s ) 1 6 1 概念、 s w o l d 提出的正交信号校正( o s c ) i l 列以及大量关于谱图分析的算法在化学分析 中的广泛使用。 纯分析信号经过a v r a h a ml o r b e r l 堋,a n d r e wj b e r g e r i t 9 l l i a n gx u 【2 0 】,h 6 c t o r c g o i e o e c h e a t 2 1 】等人发展后,纯分析信号已经成为一个比较完备的化学计量学方 法了。纯分析信号即可用来评价矩阵数据的定量分析结果,亦可以直接用来对矩 阵数据进行定量分析。 正交信号校正是一种全新数据预处理方法,它在复杂体系的校正与分辨中特 别有用。j s j 6 b l o m t 2 2 1 ,w i s ea n dg a l l a g h e r t 2 3 l ,c l a u sa a n d e r s s o n 2 4 1 ,t o mf e a m l 2 5 l , h 6 c t o rc g o i c o e c h e a 2 1 】,j o h a na w e s t e r h u i s l 2 6 】等先后对o s c 做了不同的改进与 发展,使得o s c 已成为一个应用广泛的数据预处理方法。 论文工作期间,作者先后研究了大量现有的一些基于正交投影的化学计量学 算法,并综述了其中部分算法,在此基础上作者提出了两个全新的基于正交投影 的化学计量学算法,扩展的h l a 算法h l a e 和适用于高维数据的预处理方法高 维o s c n o s c 。h k 墟算法只需要p l s 算法的先验信息就可以得到相当于h l a 算法的分析结果。n o s c 则将目前广泛应用的o s c 拓展到高维数据的预处理中。 传统的高维化学计量学方法校正或分辨经过n o s c 预处理过的高维数据能够获 得曼优的分析结果。 2 第蕈投影算法 第一章正交投影算法 1 1 正交投影算法的数学本质 正交投影算法的本质就是计算一个线性空间上的点在新的坐标系上的坐标。 单纯的投影运算是非常简便的。其主要作用是提取或屏蔽掉原始数据的部分信 息。下面我们通过一个简单的立体空间的三维坐标变换来理解投影算法的本质。 对于一个任意的三雏坐标( 254 】( 这是在i 张成的空间上的坐标) ,其在矢量 001 】 张成的空间上的投影是4 : 1 25 叫 = 4 很明显这样得到的是坐标【2 54 】在轴 001 】上的坐标,它屏蔽掉的轴【10 0 】和 o1 o 】。我们可以将其投影在任意三维矢量张成的线性空阀上以得到其在该空间上的 坐标信息同时屏蔽掉其在该空间的正交补空间上的信息。例如我们将【254 】投影 在轴【1 10 】上得到的7 ,至于这次投影是否有意义完全取决于实施投影的人。因 此当我们确定用投影算法从原始坐标上提取信息后,确定投影空间就成为成败的 关键所在。 如此简单的投影算法在化学计量学上的应用却是广泛而丰富的。许多算法利 用了投影算法的思想,然而形式上千差万别,推导过程上也互不相同。这是因为 化学计量学的研究领域互不相同,人们提取信息的目的也互不相同,这样人们思 维的着入点也不同,使得这些算法虽然都基于投影算法的思想却并不显得冲突而 是都成为了化学计量学的常用方法。其实这些现象在数学物理上的信号、图像等 处理上也都表现出来了,各种各样的投影算法层出不穷。 对于下面一个简单的化学模型: 工= y f c f + y b j c 茸= r c + x b 对于一个混合体系来说人们总可以把它分为两部分:我们感兴趣的部分y c 及其 背景信息部分x b 。x b 的存在常常挫败我们准确分析y c 的努力,显然我们有必 要从x 中提取出y c 或滤除掉x b ,这样正交投影算法显然有了用武之地。在绝 大部分的分析体系中【c i l c b j 】是一个线性无关的矩阵。通常我们能够有的先验信息 包含c ,在化学上经常构造这样的投影矩阵p c = c 十c 和a c = ( i c + c ) 。p c 在化 3 第一章投影算法 学分析的应用远不如a c 来得广泛。这是因为p c 作用在x 上( 即x 在p c 上的投 影) 虽然能够保证保留y c 部分的信息,但并不意味着) ( b 在p c 上的投影为零, 实际上使得x x p c 与x 并没有什么本质上的不同。在这种情况下想直接提取y c 部分的信息并不明智,所以人们往往是先提取x b 的信息再利用其它手段把它滤 除掉,这其实就是绝大多数利用正交投影的算法的数学基础。让我们看看在x 上是怎样提取x b 的信息的: 彳= x x 如= ( 比+ ) ( ,一c + c ) - r ( c - 二叱十o + 以( ,一c + c )( 1 1 ) = x b ( i c c ) = x ; 从式( 1 1 ) 可以看出x 中不再包含y c 部分的信息而全是x b 的信息。a c 其实就是 c 张成的线性空间在一个全空间( i 张成的空间) 上的正交补空间,这样y c 在 其正交补空间a c 上的投影便为零,x 中的y c 部分就被滤除掉了。虽然得到x 并非是我们最终的目的但却是后续操作的必要条件。 正交投影算法本身是一个简洁成熟的算法,如题本文研究的重点不在于正交 投影算法本身,而在于其在化学计量学中的应用。正交投影算法在化学计量学中 的广泛应用并非偶然的结果,化学计量学作为化学的信息学其主要目的显然是对 分析数据信息的提取,信息的提取则包括提取感兴趣的信息、滤除干扰背景信息, 这与正交投影的数学功能不谋而合。正交投影算法充分的利用了体系各组份光谱 或色谱信息互不相关的特点,通过先验信息建模特定的投影空同以截取或滤除掉 特定的信息,这样化学计量学家就能够对相对纯正的数据进行处理,以得到比对 原始数据直接处理更佳的定量定性结果。深入研究正交投影算法在化学计量学中 的应用可以充分理解现有算法的优缺点,这不只是为能够最佳的利用现有的算 法,主要是为了能够对现有算法提出新的发展或者提出全新的化学计量学算法, 使得化学计量学能够获得更广泛的应用范围、更优的定量定性分析结果。 本章的2 3 节我们简单介绍的三种基于正交投影的化学计量学方法。第二、 三、四章我们详细的介绍的n a s 、o s c 的概念和我论文研究的工作。 1 2 多元校正模型的检验 灰色分析体系的基本特征是已知待测物质存在于待分析的样本中,但对是否 存在未知干扰不清楚。故对灰色分析体系而言,确定采用何种分析方法之前确定 4 第一章投影算法 该体系是否存在未知干扰是十分必要的。可以说,这是解析灰色体系的第一步。 多元校正模型检验的基本思路是:如果混合样品中确实只含有待测的几种物 质,则混合物光谱矢量必可由这几种已知的待测物质纯光谱矢量线性表示,换言 之,它必然落在由这几种标准物种光谱矢量为基矢量所张成的线性空间之中,只 需把这几个纯物种光谱组成一正交投影矩阵,对其进行投影运算,即可得一零矢 量,也就说,在其正交补空间上为一零矢量。反之,如混合样品中含有未知干扰 物,则在其正交补空间上不为零,这就构成了该算法的数学基础。 对于如下的分析体系: x = y f c f + 以+ e = y c + x 6 + e ( 1 2 ) 要对式( 1 2 ) 表示的灰色体系数学模型进行检验,关键是要找到一个正交投 影矩阵来对混合物量测矢量进行投影运算。对式( 1 2 ) 表示的校正模型,作为 检验用的正交投影矩阵可由式( 1 3 ) 给出: p = ( ,一c + c )( 1 3 ) 如果将( 1 3 ) 式定义的正交投影矩阵作用在由( 1 2 ) 式给出的混合物量测 矢量上,则有: x 。= x p ;( m c + 叉6 + e ) ( ,一c + c ) = r ( c - c c + c ) + 彳_ ( ,一c + c ) + e ( - c + c )( 1 4 ) = 或+ e + 这里假定x 为一量测矢量,如为量测矩阵其道理相同,可将它看成由多个独 立矢量组成。从( 1 4 ) 式可以看出,如果( 1 2 ) 式给出的混合物量测矢量中没 有背景干扰矢量那一项,可知经过这样的投影运算后,就只剩下误差项,在此 e 应仍为一具有零均等方差的随机矢量,反之,若体系中合有未知干扰,则除此 误差项外,还有一项x b + 存在,除非x b 可由( 1 2 ) 式中c i 线性表示。因为x b 的存在,x 就不是一零均等方差的误差矢量了。 根据以上分析,可建立如下的模型检验方法,首先,用t 分布检验x 是否为 一零均等方差的随机矢量,即原假设h 0 :e ( x 0 = 0 ,令统计量t 为: t = ( 昱( z ) 一o ) x 4 m l 这! s m = 一x 一e q l 订? m 卜e 似l 、) = z x , f m ;m 沟:k g rg z 道_ 数。 如f | tj j t 破则否定假设h o 。t 以可由t 分布表查得。 仅对x 进行均值检验尚不充分,还需检验x 的模,即所谓二范数i ix i | , 5 第章投影算法 是否显著大于量测误差。如光度分析的量测误差一般在1 - - - 2 之间,故可假设 由下式估计: 口2 = 0 0 1 例2 如| jx | | 2 0 2 3 ,即此时的信噪比大于3 ,根据分析化学中的检测下限定义,可 认为体系中存在未知干扰物,不能认为x + 为一随机矢量。综上所迷,如果例 缸,2 且f lx 02 6 3 ,则可认为校正模型不准确,体系确实存在未知干扰物,此时不 能直接使用白色分析体系的校正方法进行校正,必须先去除背景干扰。 1 3 局部曲线拟合法 局部曲线拟合法由k a r s t a n g 和k v a l h e i m 提出【1 4 1 ,其主要思路是利用背- r t :g 谱的极大值来进行校正,实因如对光谱进行微分后,背景光谱的极大处为零,即 在这一波长点上背景干扰将不对待测物的定量测定带来影响,从而达到滤除未知 背景干扰的效果。然而背景干扰是完全未知的,则通过已知条件来正确确定背景 光谱的极大值的波长位置将是该法成功的关键。 对于一般的灰色分析体系的矢量数学模型,均可简化为以下只含一个待测分 析物的情况,即: ( 1 5 ) 这样我们就把一般的灰色分析体系转化成只含一个待测分析物的灰色分析体系 模型。可以通过不断改变不同的分析物来迟到为每一个待测组份定量分析的目 的。 首先介绍以下为什么找到了这样的极大位置就能够对待测物进行定量分析。 注意到x 是一个量测光谱矢量,所以,它是一个波长的函数,如果我们对( 1 5 ) 式进行波长方向的微分,可得 a x | d 丸= y r d g d x d xb d 丸 设在假设的未知干扰的量测光谱存在有一个极大点,记为点m 则有, 凼d g = y , d c b 。| d 入l d x ,m | d 天 因为吨,膨在极大点为零,所以有 y 。= 。i d 抽i 咄t 。| d 砷 ( 、1 6 1 6 e + qy 。m +c y = e+ 以 +c y =z 第一章投影算法 也就说,只要我们找到了未知干扰的量测光谱的一个极大点的波长位置,就可以 利用这一点采求得待测物的相对浓度。 接下来,我们将通过一种基于迭代目标因子分析方法来估计未知干扰的量测 光谱极大点波长位置: 1 用c l 构造一个正交投影矩阵p : p = ( ,一c l ( q c i f ) 一c 1 ) 2 用正交投影矩阵p 对混合物量测光谱进行投影,得到一与c l 正交的,即 属于c i 矢量零空间的一个矢量x 。,该矢量已将c l 的影响全部扣除,主 要反映了未知干扰的量测光谱的信息; x p = ( 少l c l + 爿6 ) ( ,一c i t ( c l c l t ) 一1 c 1 ) = x b p = x 3 用c l 和x 构成一个矩阵x c ,即x c = ) ( ;c l 】,并对其进行主成分分解, x c = u s v = u t 7 。继用构成迭代用投影矩阵,对x 进行迭代运算: 令r o = x ,i - l ,2 , r i = u v r i i 在每次迭代时,先将酢i 中的负元素都置为零,然后再进行投影运算,这样 迭代过程一直进行到j lr i - - r i 1 i 小于某一个给定值。这样迭代求得的背景矢量将 会很靠近真实的背景,此时,找到该背景的极大值波长位置,用式( 1 6 ) 来求 得待测分析物的相对浓度。 一般说来,该法求出的待测分析物的相对浓度,在背景光谱与分析物光谱重 叠度不大时结果将与实际值比较靠近,因为背景光谱极大值的波长位置估计比较 准确。然而,如果背景光谱重叠度很大时结果将不太可靠。 1 4 联用色谱重叠峰中目标光谱的二次投影分辨 联用色谱重叠峰中目标光谱的二次投影分辨( t p r t w op r o j e c t i o n r e s o l u t i o n ) 是陈迪钊在2 0 0 0 年提出的一种利用正交投影算法进行色谱重叠峰分辨的化学计 量学方法。1 1 p r 能够在黑色分析体系中对自己感兴趣的某个纽份进行快速分辨。 k 种组份二维色谱重叠响应数据阵x 可以写成如下形式 f t f x = c t s i + c j s j + e c i s i 为目标组份的响应,本节中s 指标准光谱( 标准光谱满足s s ) 。t p r 对x 7 第一章投影算法 阵的纯光谱s i 、纯色谱c i 的矢量进行分辨,实现灰色体系种目标组份的定性定量 分析。 1 4 1 重叠峰中光谱的分辨 设有两个大小分别为r x m 和q m 的窗口,在x 阵中截取两个子阵x l a 。m 和x 2 q x m ,使得两个子阵仅共有一个目标组份i 的光谱影响,其它组份皆不相同。 x 1 = e i s ! + + c ,s + + c f 砖( 1 j i ) x 2 = q + + c k s k + c r j r ( f k ) 对x i 阵作奇异值分解 z i = u r i d r ! i 显然u a t 阵包含x l 阵的完整色谱信息,v a l 阵包含x l 阵的完整光谱信息。然后 将x 2 阵投影在v r i 的正交补空闯上。 x 2 p = p ,墨+ + c k s k + + c n s n ) ( ,一l v r i ) = ( c i + l 节“l + + c k s k + + c n s n ) ( i 一l l 。) 令j = s x ( i 一l l 。) ,则上式可以表达成: x 2 尸- - c i + 1 j 件i + + c t j 七+ + c j 可以看出在x 2 p 保留了x 2 中除目标组份的所以其它组份的完整色谱信息。对其 进行奇异值分解可得。 x 2 p = u r 2 d r 2 z r 2 显然u r 2 完整的保留了x 2 t , 的色谱信息,然后将x l 投影到u r 2 的正交补空间上。 x k = ( ,一u r 2 u r 2 ) ( c i s i + + c k s k + + c _ f v s , v ) = ( ,- u r 2 u e 2 ) e i s i 2 q 以 此时阵中仅保留了目标组份的光谱和一新的色谱信息。对作奇- r r - a t 分解 取栽荷矩阵( v ) 的第一列矢量即为x 阵目标组分i 的光谱信息。 1 4 2 重叠峰中色谱的分辨 显然在x 阵中将x 的色谱看成x 光谱、光谱看成x 色谱,利用上述方法可 以轻而易举的求出目标组份的色谱信息。 8 第二章纯分析信号 第二章纯分析信号 纯分析信号( n e t a n a l y t es i g n a l ) 【1 q 是以色列化学家a v r a h a ml o r b e r 在1 9 8 6 年首先提出的。他提出n a s 目的是提供一种方法用来评价矩阵数据的定量分析 及其计算过程中的误差传递。在一个混合物体系中,n a s 是特籀某个纯物质的 描述符,它的定义如下: n a s l = c = c j ( i - c _ y + q ) = 勺止_ , ( 2 1 ) 从( 2 1 ) 式的定义可以看出一个物质的纯分析信号就是它的纯光谱在其背景( 该 分析体系中的背景) 光谱信息的正交补空间上的投影。a v a r a h a ml o r b e r 把n a s 用在定量分析的选择性( s e l e c t i v i t y ) 、灵敏度( s e n s i t i v i t y ) 、准确度( a c c u r a c y ) 、 检测限( l i m i to fd e t e r m i n a t i o n ) 等属性以及误差传递形式的表达上,都取得了 令人满意的袁达效果。 后人利用a v a r a h a ml o r b e r 的n a s 思想发展了一些直接的定量分析方法。这 里先介绍一下n a s 为什么可以用来进行定量分析。令6 = | 勺,则有: y ;= xx b b j c j + y j c 一a j c j t = y j c j a j c j = y j k q 玛 从( 2 2 ) 式可以看出量测矩阵同某个物质的纯分析信号转置的积便是该物质的 浓度与一个标量k 的积。显然只要采取一定的方法把k 归一化为数。l ”就能够 从( 2 2 ) 式直接获取物质j 的浓度,即物质j 的定量分析结果。令 b = b b - n = 疋j c j | o j a j c j 、 则有: y ;= x x b = y j c a j c i 沁j a j c j 、) = y j q 从( 2 3 ) 式可以看出对一个分析体系只要构造出某个物质的回归系数b 就能对 该物质进行定量分析。下面介绍的两种方法正是利用这个思想建立起来的,它们 适用与不同的情况。 2 1h l a h l a ( h y b i r dl i n e a ra n a l y s i s ) 【19 】是a n d r e wj b e r g e r 发展的一种方法。a n d r e w 之所以把这种算法取名为杂交的线性分析算法,是指其分析体系的已知条件介于 9 第二章纯分析信号 适用p l s 和适用o l s 的分析条件之间。传统的线性分析方法o l s 要求分析体系 中所有物质的纯光谱信息已知,p l s 则不要求分析体系的任何物质的纯光谱信 息;h l a 则希望分析体系中待测物质的纯谱信息已知。h l a 能够利用这个对于 p l s 来说富余的信息,获得比p l s 更好的分析结果,当然在h l a 的一次分析过 程中只能对一种物质分析。h l a 首先从量测矩阵中扣除已知物质的信息获得相 对该物质的背景信息,然后利用背景信息的正交投影矩阵构造已知物质的校正矢 量。 对于形如:x = y l c i + = j ,l c i + 儿q i = 2 的化学体系来说,我们可以通过下述步骤来求解某个感兴趣组份的校正矢量b 。 1 从校正体系中去除已知物质的光谱信息,从而获得相对于已知物质的背 景信息: x b = x y l c t 2 构造一个矩阵,使其能够线性表达背景x b 的光谱信息。可以通过类似 p c a 的方法获得这样的矩阵,即获得x b 的载荷矩阵v 。这里只要通过对x b 进行奇异值分解就能够提取v 阵: ,s ,v 】= s v d ( x 6 ) 这里v 是一个p c s ( x b 的组份数) 行,m 列的标准正交阵。 3 获得已知物质的先谱c l 在背景光谱的正交补空间的投影: r = c l ( i v n 这样获得的r 与v 线性无关,即与v 正交。 4 将r 归一化后我们就得到了已知物质的校正矢量b 。从下式我们可以看出 b 正是已知物质的纯分析信号。 b = r ) ( c i 一) = ( 1 - v v ) c 1 ( c l ( - v v ) c l ) 5 最后我们来看看b 是怎样具有预报功能的: y r - - x b = ( 少l q + 彳1 ) 6 = y l c l ( ,一v 。v ) c 1 ( c l ( ,一v 矿) c 1 ) = y i 在上式中因为x b 中的光谱信息张成的线性空间与v 张成的线性空间实际上 是同一线性空间,所以x b 在v 的正交补空间( i v ,v ) 中的投影为零。 l o 第二章纯分析信号 h l a 方法在建模时需要同时得到待测物质准确的浓度和纯谱信息,在实际 情况中虽然建模体系的组份的准确浓度信息不难获得,但是准确的纯谱信息却并 非总能够获取,例如混合体系中组份的光谱信息与纯物质的光谱信息表现并不总 是一致的。在待测物质谱图信息不够准确的情况下,h l a 算法的应用受到限制。 我们利用h l a 的思想发展了一种新的算法,并把它定义为一种扩展的h l a 算法 - h l a e ,该算法在上面这种情况下仍能取得比h l a 、p l s 更好的结果。h l a e 中把物质浓度信息也看成是物质的一种谱信息,把浓度信息用到投影运算过程 中。该算法与h l a 算法最大区别在于:( 1 ) h l a e 不需用到体系组分的纯谱信 息;( 2 ) h l a e 利用已知物质的浓度信息构造投影矩阵用来提取体系背景信息, 然后又用浓度信息和背景信息构造该物质的校正矢量。具体算法如下: 1 用已知物质的浓度信息构造它的正交补空间p i : 丑= i - y l y l + 2 提取已知物质的背景信息) ( b ,将x 投影到空间p l 上: 3 构造一个矩阵,使其能够线性表达背景x b 的光谱信息。可以通过类似p c a 的方法获得这样的矩阵,即获得x b 的载荷矩阵v 。这里只要通过对强进行 奇异值分解就能够提取v 阵: 【u ,s ,v 】= s v d ( x b ) 4 构造背景信息光谱信息的正交补空间p 2 : e 2 = i v v 5 获得已知物质的光谱c l 在背景光谱的正交补空间的投影: r = y i + ( x p 2 ) = y l + 夕l t 7 l 最= c l 忍 6 将r 归一化后我们就得到了已知物质的校正矢量b 。从下式我们可以看出 b 正是已知物质的纯分析信号。 b = r ( r ,) = ,( c l ( ,一v v ) ( - v v ) c l ) - ( 一v v ) c i i ( c l ( ,一v 。v ) c i 。) 7 显然这里的校正矢量b 与h l a 算法得到的校正矢量b 在数学上的意义上 c 所 。越 鼻 = 瓦毋 i l x 毋 = 瓦 第二章纯分析信号 是一致的,同样这里的b 是也具有预报功能。 2 3 结果与讨论 2 3 1 模拟数据 为了能够更好的比较h l a 、h l a e 在各种条件下的计算结果,我们模拟三 组分体系x = y c + e x ;y = y + e y ;c = c + e 。改变e 【、e v 、e c 的大 小使得我们可以模拟多种条件。同时我们还将结果与传统p l s 作了一个比较。 浓度y 设置成非线性相关的一组数据,本文中采用随机函数给出;c 用高斯函 数模拟的一纽非线性相关的谱图信息,每一物质的谱图由两个高斯函数之和模 拟;误差e 均为随机误差。体系中各组分的谱图信息如下图( 2 1 ) 所示。 图( 2 1 ) 拟和体系三组分的纯光谱 比较结果如表( 2 1 ) : 表( 2 1 ) 不同误差条件下的定量分析结果 x ( 1 坳,v ( 0 1 呦,c ( 3 呦x ( 1 ) ,v ( 0 1 ) c o )x ( o 5 ) ,v ( 0 1 ) ,c ( o 5 ) h l a h l a ep l sh l ah l a ep l sh l ah l a ep l s 0 9 9 6 70 9 9 8 30 9 9 7 60 9 9 8 70 9 9 8 6 0 9 7 9 9 0 9 9 9 90 9 9 9 90 9 9 7 8 0 9 9 9 50 9 9 9 2 0 9 9 7 7 0 9 9 9 9 0 9 9 9 50 9 9 9 30 9 9 9 90 9 9 1 60 9 8 4 7 0 9 9 9 40 9 9 9 70 9 9 7 60 9 9 9 90 9 9 9 9 0 9 9 7 0 1 0 0 0 00 9 9 8 80 9 9 9 2 0 9 9 7 50 9 9 9 90 9 9 9 90 9 9 9 9 0 9 9 9 60 9 8 6 6 0 9 9 9 90 9 9 9 80 9 9 8 0 0 9 9 8 90 9 9 9 00 9 9 7 20 9 9 9 60 9 9 9 60 8 7 4 71 0 0 0 00 9 9 9 90 9 9 6 0 模拟数据中共有五次计算结果,每次建模产生十组数据,其中前五组数据用 于建模,后五组数据用于预报分析,每次计算过程中随机数据重新产生,最终结 果为预报数据的回归系数( 回归系数以及均方根偏差的计算请参考附录) 。对三 种情况进行了比较见上表( 2 1 ) 。从上袁数据中可以看出,三种情况下h l a e 均取 1 2 第二章纯分析信号 得了比p l s 更佳的效果。在能够准确的纯光谱情况下( 如上表误差) ,h l a 计 算结果比h l a e 好。但对于纯光谱不易获得的情况难以提取纯物质或者谱 图量测不够准确( 如上表误差) ,h l a e 的计算结果则优于h l a 。通过上表的 比较我们确实能够获得h l a e 优于p l s 的结论,一般情况下可以获得h l a 相当 的结果,在纯光谱不够准确的情况下h l a e 完全可以用来代替h l a ;同时h l a e 优于h l a 之处还在于根本不用去为了获得纯光谱而烦扰。 2 3 2 实验数据 本文对抗茵药复方头孢氨苄胶囊的成分头孢氨苄( c e x ) 和甲氧苄啶 ( t m p ) 组成的两纽分体系进行定量分析。实验对9 个样品进行了分析,定量分 析的数据是混合物的紫外光谱数据。c e x 、t m p 的纯光谱数据我们通过简单的 量测一定浓度下纯物质溶液得到。对数据分别进行了h l a 、h l a e 、p l s
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025浙江台州市温岭市交通旅游集团有限公司面向社会招聘编外人员1人备考练习试题及答案解析
- 2025西咸新区空港新城花园小学见习招聘(8人)考试参考试题及答案解析
- 2025中国人民财产保险股份有限公司巨鹿支公司招聘备考练习题库及答案解析
- 公路建设施工图纸审核方案
- 河北省三河市2024-2025学年七年级下学期期末考试英语试题(含答案无听力)
- 储备物资信息化管理系统建设方案
- 2025云南省玉溪市红塔区第二幼儿园招聘编制外工作人员(5人)考试参考试题及答案解析
- 高电压理论考试题及答案
- 2025年闵行区机关事业单位编外人员招聘35人考试参考试题及答案解析
- 北师大版(2024)二年级上册 5.4分香蕉 课后作业(含解析)
- 中级注册安全工程师《法律法规》试题及答案
- 2025年汽车转向系统行业需求分析及创新策略研究报告
- 2025年四川省成都市高新区事业单位招聘考试综合类面试真题模拟试卷
- 2025年秋统编版语文二年级上册全册课件(课标版)
- 七下期末人教版数学试卷
- 2025新疆巴音郭楞州和硕县面向社会招聘社区工作者7人笔试参考题库附答案解析
- 2025年六安市裕安区石婆店镇公开招考村级后备干部8名笔试备考试题及答案解析
- 2025年事业单位考试题库及参考答案
- 2025年公安机关人民警察(基本级)执法资格等级题库及答案
- 物流客服培训课件
- 人教版(2024)八年级上册英语Unit 2 Home Sweet Home教案
评论
0/150
提交评论