




已阅读5页,还剩114页未读, 继续免费阅读
(应用数学专业论文)化学计量学基础算法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 化学计量学是- - r l 新兴发展的交叉学科,它从化学的角度,运用和发展数学、统计学和计 算数学方法,并且充分利用计算机这个现代化工具来设计或选取最优化学量测方法,通过对化 学数据的分析处理,最大限度地获取物质的化学组成及其相关结构信息。本论文针对数学、统 计学和优化理论中与化学计量学关系密切的几个问题进行了深入研究。这些问题也是目前化学 计量学的难点以及化学计量学家普遍关心的问题,具体分为三个部分: l 1 多元校正和定量结构与保留指数关系研究中模型的建立与预测e 第一部分第一至第三章) 一一 l 化学计量学校正方法多数基于隐变量方法,如偏最小二乘回归和主成份回归方法。尤其是 偏最小二乘回归方法,由于它是源于直观而导入的一种方法,能比较好的处理模型中变量 共线性问题。本部分先给出偏晟小二乘回归估计更为简单清楚的表达式。利用这个表达式, 方法的作用原理可清晰的显现,其统计性质也较容易获得。在此基础上提出了广义偏最小 二乘回归方法,将偏最小二乘回归与岭回归有机结合起来,使不同的p l s 组份能得到不同 的压缩。广义p l s 方法比普通p l s 方法能更有效地解决模型变量中的共线性问题,从而 提高模型预测的精度和稳定性。在定量结构与保留指数关系模型和多元校正模型研究中, 模型的确立问题,其本质是变量选择( 或组份数确立) 的问题,这也是统计学中回归分析的 一个焦点问题。化学计量学中应用最多的每次去掉一个样本点的交互检验。遗憾的是,它 倾向选择过多的变量( 或过多的组份) 保留在模型中,从而导致模型产生过拟合。m o n l e c a r l o 交互检验是上世纪九十年提出的一种具有相容性的选变量方法。本部分首次将此方法 用于多元校正模型和定量结构与保留指数关系模型的研究中,成功的解决了模型的确立 ( 或变量的选择) 问题,避免了过拟合的产生。由于m o n t ec a r l o 交互检验值所表现的是用 比给定样本小的多样本所得模型的平均预测能力,用它作为模型的预测能力是不合适的。 1 ,一 本文推出修正m o n t ec a r l o 交互检验值的公式,并且证明它更接近模型的预测误差。, , 2 复杂体系的多元分辨方法的研究第一部分第四至第六章)色谱联用( 如液相色谱与二极管 一 一 l 阵列联用仪h p l c d a d ,气象色谱与质谱联用仪g c m s ) 的二维数据的解析,直是化学 计量学关注的热点问题。化学计量学己发展出许多的解析方法,如窗口因子分析、正交投 影分辨和直观推导式演进特征投影等方法。本部分首先证明窗口因子分析和正交投影分辨 这两种主要的解析方法在代数空间上是等价的。揭示它们在数学本质上具有的内在联系, 这对于评价这些方法具有重要意义。对于色谱联用数据的难点问题包含峰的解析,上 述这些方法都无能为力。本部分提出了一个迭代优化算法,成功的解析中草药等复杂体系 中的包含峰。 多组份体系分辨的方法大多需要使用者具备较好的数学基础和丰富的经验,而智能解析 却容易为实际工作者所掌握。因此,多组份体系智能解析是多元分辨的方向之一。智能解 析系统的重要环节是体系组份数判定的自动实现。本部分最后提出一个算法,将体系随机 误差分解成垂直的两部份,当体系中的组份全被提取时,只剩下体系随机噪声的主要部分, 、 可由一个判别函数自动识别,从而,实现体系组份数的自动判定。y , 3 数论方法在述墅递廿和优化方法应用研究博验设计是化学计量学的主要研究内容之一。 良好的试验设计可最有效的获取相应的化学信息,以达到优化化学反应条件或化工工艺参 数的目的。较常用的试验设计有部分因子设计,正交设计,均匀设计和最优设计,其中均 匀设计是由方开泰和王元发明,它是数论与统计学结合的结晶。与因子设计和正交设计不 同,均匀设计的水平数可以较多。因此,在非线性化学模型中,均匀设计很有希望表现良 好。本部分将均匀设计用于非线性模型的建立和预测,发现在均匀设计所确立的模型与真 实模型的偏差最小,在随机误差相对不大时,预测误差也较小。对于化学反应动力学的参 数估计以及预测。比较了均匀设计、最优设计和正交设计的优缺点,进一步确立了它们各 、一 自适用范围,证实了均匀设计是更稳健的试验设计方法。r 数论优化( 也称为q u a s i m o n t ec a r l o 优化) 方法作为一种全局优化算法,近年来 受到相当的关注。其改进后的序贯数论优化算法的收敛速度大大加快。本部分最后提出聚 类多重序贯数论优化算法,利用新的聚类方法,得到若干最可能为全局最优潜在点,然后, 以这若干点为中心进行序贯。这一算法,改变了序贯数论优化算法过于依赖于第一次均匀 布点的缺陷,使得算法收敛到局部最优的可能性进一步降低。 a b s t r a c t a sav e r yd e v e l o p i n gc o m p o s i t ed i s c i p l i n e i nc h e m i s t r y , c h e m o m e t r i c su s e sm e t h o d s o fm a t h e m a t i c sa n ds t a t i s t i c st od e s i g no rc h o o s eo p t i m a lm e a s u r e m e n tp r o c e s sw i t ht h e h e l po fc o m p u t e ra n da f f o r d sg r e a t l y c h e m i c a li n f o r m a t i o nb a s e do na n a l y z i n gt h e m e a s u r e m e n td a t a i nt h ep r e s e n td i s s e r t a t i o n ,t h ea t t e n t i o n sa r ep a i dt ot h ea s p e c t si n m a t h e m a t i c sa n ds t a t i s t i c st h a ta r ew i t hc l o s er e l a t i o n s h i pt oc h e m o m e t r i c s t h e s ea s p e c t s a r ea l s ot h e i m p o r t a n t a r e a si nc h e m o m e t r i c sa n da t t r a c t m u c ha t t e n t i o no f c h e m o m e t r i c i a n sc u r r e n t l y t h ed i s s e r t a t i o ni sc o n s i s t so f t h r e ep a r t s : 1t h em o d e l i n ga n d p r e d i c t i o n i nm u l t i v a r i a t ec a l i b r a t i o na n d q u a n t i t a t i v e s t r u c t u r er e t e n t i o nr e l a t i o n s h i pr e s e a r c h ( p a no n e :c h a p t e r1 - 3 ) m o s tm e t h o d so f m u l t i v a r i a t ec a t i b r a t i o ni nc h e m o m e t r i c sa r et h el a t e n tv a r i a b l em e t h o d ss u c ha sp a r t i a l l e a s ts q u a r e sr e g r e s s i o n ( p l s ) a n dp r i n c i p a lc o m p o n e n t sr e g r e s s i o n p l sm e t h o d s e e m st ob em o r ee f f e c t i v et od e a lw i t ht h ec o l l i n e a rp r o b l e mi n t h em o d e l i nt h e c h a p t e r1 ,t h es i m p l ef o r m u l a o fp l se s t i m a t e si so b t a i n e d a c c o r d i n gt ot h i sf o r m u l a , i ti ss i m p l et os e et h a th o we a c ho fp l sc o m p o n e n t sw o r k sa n ds o m eo ft h es t a t i s t i c a l p r o p e r t i e sa r eo b t a i n e de a s i l y t h e n p l sa n dr i d g er e g r e s s i o n sa r ec o m b i n e dt o g e t h e r t of o r man e w r e g r e s s i o nm e t h o d :g e n e r a l i z e dp l sr e g r e s s i o n ( g p l s ) c o m p a r i n g t o p l sr e g r e s s i o n ,g p l sc a ng i v em o r ea c c u r a c ye s t i m a t e sa n di sm o r es t a b l em e t h o d i n c h e m o m e t r i c s ,l c a v e - o n e - o u tc r o s sv a l i d a t i o na r et h ec o m m o n l yu s e dm e t h o dt od e a l w i t ht h e p r o b l e m s o fm o d e ls e l e c t i o na n d p r e d i c t i o n u n f o r t u n a t e l y , i t i sa n a s y m p t o t i c a l l y i n c o n s i s t e n tm e t h o d ,i tt e n d st os e l e c t sam o d e lw i t hu n n e c e s s a r y v a r i a b l e sa n dm a k e st h es e l e c t e dm o d e lo v e r f i t t e d i nc h a p t e r2a n d3 ,m o n t ec a r l o c r o s sv a l i d a t i o n a n a s y m p t o t i c a l l yc o n s i s t e n tm e t h o 出i su s e d i nt h er e s e a r c ho f m u l t i v a r i a t ec a l i b r a t i o na n dq u a n t i t a t i v es t r u c t u r er e t e n t i o nr e l a t i o n s h i p i ts u c c e s s f u l l y s e l e c t st h ec o r r e c tm o d e la n da v o i d so v e r - f i t t i n g b e c a u s et h ev a l u eo fm o n t ec a r l o c r o s sv a l i d a t i o ne v a l u a t e st h ea v e r a g ep r e d i c t i o na b i l i t yb a s e do nt h ec a l i b r a t i o ns e t , w h i c hi sm u c hs m a l l e rt h a nt h ew h o l es a m p l es e t i ti su n s u i t a b l ef o ri tt oe s t i m a t et h e p r e d i c t i o na b i l i t yf o rt h em o d e l t h u s ,t h ec o r r e c t e dm o n t ec a r l oc r o s sv a l i d a t i o ni s p r o p o s e d t h ev a l u eo ft h ec o r r e c t e dm o n t ec a r l oc r o s sv a l i d a t i o ni sp r o v e nt o b e m o r e a c c u r a c ye s t i m a t eo f t h ep r e d i c t i o ne r r o r 2 t h er e s e a r c ho ft h er e s o l u t i o na l g o r i t h m sf o rt h em u l t i - c o m p o n e n t s y s t e m s ( p a r t t w o :c h a p t e r4 6 ) t h er e s o l u t i o nm e t h o d sf o rt h et w o w a yd a t a , s u c ha sd a t af r o m h p l c - d a da n dg c m s ,a r et h ef o c u so fc h e m o m e t r i c sd u r i n gr e c e n ty e a r st h e w i n d o wf a c t o ra n a l y s i s ,e v o l v i n gw i n d o wf a c t o ra n a l y s i s ,h e u r i s t i c e v o l v i n gl a t e n t p r o j e c t i o n sa n do r t h o g o n a lp r o j e c t i o nr e s o l u t i o na r e s o m eo ft h e m i nt h ec h a p t e r4 , t h et w om a j o rr e s o l u t i o nm e t h o d s ,w i n d o wf a c t o ra n a l y s i sa n do r t h o g o n a lp r o j e c t i o n r e s o l u t i o na r ep r o v e ni nt h e o r yt h a tt h e ya r ee q u i v a l e n t t oe a c ho t h e ri na l g e b r a i cs p a c e f o rt h er e s o l u t i o no f e m b e d d e dp e a k so f t w o w a yd a t a ,ad i f f i c u l ta n do p e np r o b l e mi n t h ef i e l d ,t h em e t h o d sm e n t i o n e da b o v es e e mn o tt ob es u i t a b l et o o l sf o rt h ep r o b l e m i nc h a p t e r5 ,a ni t e r a t i v eo p t i m a la l g o r i t h mi sd e v e l o p e d t h i sm e t h o dc a ns o l v et h e c o m m o nt y p e so fe m b e d d e dp e a k sa n di t i ss u c c e s s f u l l yu s e df o rt h er e s o l u t i o no ft h e e m b e d d e dp e a k si nac h i n e s et r a d i t i o n a lm e d i c i n es y s t e m i nc h a p t e r6 ,ap r o c e d u r e t h a tc a na u t o m a t i c a l l yr e c o g n i z en u m b e ro fc o m p o n e n t si nt h es y s t e mi sp r o p o s e d b a s e do nd e c o m p o s i n gt h er a n d o me r r o ri n t ot w om u t u a lo r t h o g o n a lp a r t s w h e nt h e i n f f r m a t i o no fc h e m i c a lc o m p o u n d si sa b s t r a c tf r o mt h ed a t at h er e s t sa r et h er a n d o m e r r o r sa n dc a nb ea f f i r m e da u t o m a t i c a l l yb yaf u n c t i o n t h u s ,t h en u m b e ro f c o m p o n e n t s c a nb ed e t e r m i n e d 3 t h ea p p l i c a t i o nr e s e a r c ho f n u m b e r - t h e o r e t i cm e t h o di ne x p e r i m e n t a ld e s i g na n d n u m e r i c a lo p t i m i z a t i o n ( p a r tt h r e e :c h a p t e r7 - 9 ) e x p e r i m e n t a ld e s i g ni so n eo ft h e m a j o ri s s u e st h a tc h e m o m e t r i c ss p e c i a l l yc o n c e r n s t h ec o m n l o nu s e de x p e r i m e n t a l d e s i g n sa r ef r a c t i o n a lf a c t o r i a ld e s i g n ,o r t h o g o n a ld e s i g n ,u n i f o r r nd e s i g na n do p t i m a l d e s i g n k a i - t a if a n ga n dw a n g y u a ni n v e n t e dt h eu n i f o r md e s i g n i ti st h ec r y s t a lo f t h ec o m b i n a t i o no fn u m b e r t h e o r y a n ds t a t i s t i c s u n l i k ef a c t o r i a l d e s i g n a n d o r t h o g o n a ld e s i g n ,t h e l e v e l so ft h eu n i f o r md e s i g nc a nb ea sm a n ya s p o s s i b l e t h e r e f o r e ,i ti se x p e c t e dt oh a v eg o o dp e r f o r m a n c ei nn o n l i n e a rm o d e l i nc h a p t e r7 , t h em o d e lb i a so fu n i f o r md e s i g na p p l i e dt oan o n l i n e a rm o d e li sd i s c u s s e di ns o m e d e t a i l t h e n ,i nc h a p t e r8 ,i ti su s e dt oe s t i m a t et h ep a r a m e t e r sf o rac h e m i c a lk i n e t i c s m o d e l t h ep e r f o r m a n c e so ft h r e ee x p e r i m e n t a ld e s i g n sa r ed i s c u s s e di nd e t a i l s t h e q u e s t i o nw h e na n d w h e r eo n es h o u l du s ew h i c hk i n do fe x p e r i m e n t a l d e s i g n i s a n s w e r e d a sag l o b a l o p t i m i z a t i o nm e t h o d ,n u m b e r - t h e o r e t i co p t i m i z a t i o nm e t h o d ( a l s o c a l l e dq u a s i - m o n t ec a r l oo p t i m i z a t i o n ) i sd e v e l o p e dq u i c k l yi ns t a t i s t i c s i nc h a p t e r 9 ,an e wo p t i m i z a t i o nm e t h o di sd e v e l o p e d ,w h i c hi sc a l l e dm u l t i - s e q u e n t i a ln u m b e r - t h e o r e t i c o p t i m i z a t i o na l g o r i t h mb a s e d o n c l u s t e r i n g m e t h o d w i mt h e h e l p o f c l u s t e r i n gm e t h o d ,t h ep o i n t s ,w h i c ha r et h em o s tp o s s i b l et ob eg l o b a lo p t i m a lp o i n t s , a r er e t a i n e df o rf u r t h e rs e a r c h t h i s c e r t a i n l y l o w sd o w nt h e p r o b a b i l i t y f o rt h e m e t h o dt oc o n v e r g e n tt ol o c a lo p t i m u m - i v 塑堕茎兰壁旦墼兰妻些堕主兰垡堡苎 塑妻丝 一丝坚! 翌l 一 绪论 数学理论对任何自然科学的重要性早已被人们所认识。早在十八世纪,德国哲学家康德就 说过:“在自然科学的各个分支中,只有那些能以数学表述的学科,才是真正的科学。”化学 从最初的观察性和实验性的学科发展为有定量基础的科学正是其数学化的过程化学计量学是 7 0 8 0 年代发展起来的- - j l 新兴化学分支学科,它运用和发展现代统计学、数学和计算数学方 法,并且充分利用计算机这个工具来设计或选取最优化学量测方法,通过解析化学数据以最大 限度地获取物质的化学组成及其相关结构信息。化学计量学研究的对象是化学中各类量测过程 的共性问题,包括化学量测的试验设计、测试数据中有关信息的提取、优化和分析处理的方法, 是化学量测的基础理论和方法学。 传统的分析化学处理数据的方法一般只能处理由一些简单仪器产生的单变量数据。例如对 光谱只取其最大吸收点,而色谱只用其面积。这样的数据很难准确表述复杂多组份和非线性化 学系统。现代科学技术的迅速发展使科学仪器的基本特征发生根本变化。随着电子技术和计算 机科学的发展以及联用技术的采用( 如液相色谱与二极管阵列联用仪h p l c - d a d 、气相色谱与 质谱联用仪g c m s ,气相色谱与红外联用仪g c i r ,多维核磁共振谱等) ,化学家获得的将是 一个矩阵( 或张量) 型的数据。这些多维数据能更多更准确地提供复杂化学样本的定性与定量信 息。高维数据无论是从其量的大小还是从其复杂程度来讲,传统的分析、处理和解析方法都是 无能为力的。化学计量学的产生和发展为分析、处理和解析这些高维数据开辟了新的道路1 2 i 。 应当指出的是,不能简单的认为化学计量学仅仅是数学,统计学或者计算数学在化学中的应 用由于实际化学体系的多样性和复杂性,表述其特征的数学模型也是复杂的甚至是非线性 的对于这样的问题,现代数学和统计学也面临挑战因此,化学计量学也为数学,统计学和 计算数学理论和应用研究提供了广阔的领域化学体系的数据有自己的特征,例如浓度和波谱 的非负性,色谱曲线流出的依次性和单峰性,作为化学重要分支的化学计量学也发展了具有自 己特色的理论和应用方法j 例如,渐进因子分析广义标准加入法等如何进一步将现代统计 学、计算数学以及其它相关数学的最新发展与化学数据本身所固有的特点有机结合,研究能解 决化学家或化= 专家所遇到的理论和实际问题的化学计量学方法,是统计学家、应用数学家和 化学计量学家共同的任务。近二十年来,化学计量学伴随着数学,统计学和计算数学的发展而 不断发展,已日趋成熟。 本论文针对数学、统计学和优化理论中与化学计量学关系密切的几个问题进行了深入研 究。这些问题也是目前化学计量学的难点以及化学计量学家普遍关心的问题,具体分为三个部 分: i 多元校正和定量结构与保留指数关系研究中模型的建立与预测化学计量学校正方法多数 塑堕查堂窒里垫兰童些苎主兰堡笙苎 ! ! 宣丝 一墨坐j 兰l 旦一 基于隐变量( 1 a t e n tv a r i a b l e ) 方法,如偏最小缃i ) 3 ( p l s r ) 1 3 1 和主成份回归( p c r ) 引方法。 尤其是p l s 方法由于它是源于直观而导入的一种方法,能比较好的处理模型中变量共线性 问题。但由于通常p l s 是以算法的形式给出,其作用原理以及统计性质并不十分清楚。本 部分先给出p l s 估计更为简单清楚的表达式。利用这个表达式,p l s 方法的作用原理可清 晰的显现,其统计性质也较容易获得。在此基础上提出了广义p l s 方法,将p l s 与岭同归 有机结合起来,使不同的p l s 组份能得到不同的压缩,而不仅仅简单的选择若干p l s 组份 数来克服共线性问题。广义p l s 方法比普通p l s 方法能更有效地解决模型变量中的共线性 问题,从而提高模型预测的精度和稳定性。在构效关系模型和多元校正模型研究中,确立 模型的问题,其本质是变量的选择问题,这也是统计学中回归分析的个焦点问题。回归 分析已经提出了许多选变量的方法,如a k a i k e 信息准则吲,g 统计量吲以及化学计量学中 应用最多的每次去掉一个样本点的交互检验( c r o s sv a l i d a t i o n ) t 1 o ”l 等。遗憾的是,它们 在理论上并不具有相容性。一般地,这些方法倾向选择过多的变量( 或过多的组份) 保留在模 型中,从而导致模型产生过拟合。m o n t ec a r l o 交互检验1 是上世纪九十年提出的一种具有 相容性的选变量方法。本部分首次将此方法用于多元校正模型和构效关系模型的研究中, 成功的解决了模型的确立f 或变量的选择) 问题,避免了过拟合的产生。由于m o n t ec a r l o 交 互检验值所表现的是用比给定样本小的多样本所得模型的平均预测能力,用它作为模型的 预测能力是不合适的。本文推出修止m o n t ec a r l o 交互检验值的公式,并且证明它更接近模 耻的预测误差。 2 复杂体系的多元分辨方法的研究色谱联用( 如液相色谱与二极管阵列联用仪h p l c - d a d , 气相色谱与质谱联用仪g c m s ) 的二维数据的解析,一直是化学计量学关注的热点问题。 化学计量学已发展出许多的解析方法,如窗口因子分析( w f a ) ”】、正交投影( o p a ) t “方 法和亩观推导式演进特征投影等方法( h e l p ) t ”。“,这些方法在数学本质上是否具有内在联 系? 这对丁二评价这些方法具有重要意义。本部分首先证明w f a 和o p a 这两种主要的解析 方法在代数空间上是等价的。对于色谱联用数据的难点问题包含峰的解析,上述这些 方法就无能为力i 。如对色谱峰形作一些限制,即假设色谱曲线由高斯函数的指数衰减修 正函数描述( e m g ) 【”1 或假设为在大色谱峰在峰顼附近是对称的,似可利用色谱曲线的曲 线拟合或可通过对时间的导数来解析包含峰口i 。但是,对于复杂体系,色谱曲线大都不满 足这样的假定。因此,寻求更一般的方法对解决这类问题有重要意义。本部分提出了一个 迭代优化算法,成功的解析中草药等复杂体系中的包含峰。 多组份体系分辨的方法大多需要使用者具备较好的数学基础和丰富的经验。而智能解析 却容易为广大分析工作者所掌握。因此,多组份体系智能解析是多元分辨的方向之一。智 能解析系统的重要环节是体系组份数判定的自动实现。本部分最后提出一个算法,将体系 随机误差分解成垂直的两部份,当体系中的组份全被提取时,只剩下体系随机误差的主要 部分,可由一个判别函数自动识别从而,实现体系组份数的自动判定。 3 数论方法在试验设计和优化方法中的应用研究试验设计是化学计量学的主要研究内容之 2 塑壹查兰些旦塑兰主些竖主兰些堡墨! ! 塑竺兰坐立兰l _ 一 一。良好的试验设计可最有效的获取相应的化学信息,以达到优化化学反应条件或化l _ 艺参数的1 7 的 :”。较常用的试验设计有因子【2 2 1 禾1 部分因子设计2 ”,正交设计2 “,均匀设计2 副 和最优设计】,其中均匀设计是由方开泰和王元发明,它是数论与统计学结合的结晶。与因 子设计和正交设计不同,均匀设计的水平数可以较多。因此,在非线性化学模型中2 ”, 均匀设计很有希望表现良好。本部分将均匀设计用于非线性模型的建立和预测,发现在均 匀设计所确立的模型与真实模型的偏差最小,在随机噪声相对不大时,预测误差也较小。 对于化学反应动力学的参数估计以及预测。比较了均匀设计、最优设计和正交设计的优缺 点,进一步确立了它们各自适用范围,证实了均匀设计是更稳健的试验设计方法。 数论优化( 也称为q u a s i - m o n t ec a r l o 优化) 方法作为一种全局优化算法,近年来 受到相当的关注。其改进后的序贯数论优化算法i ”3 的收敛速度大大加快。本部分晟后提 出聚类多重序贳数论优化算法,利用新的聚类方法,得到若干最可能为全局最优潜在点, 然后,以这若干点为中心进行序贯。这算法,改变了序贯数论优化算法过于依赖r 第一 次均匀布点的缺陷,使得算法收敛到局部晟优的可能性进一步降低。 参考文献 f 1 1 俞汝勤,化学计量学导论,1 9 9 l ,湖南教育出版社 f 2 】梁逸曾,白灰黑复杂多组份分析体系及其化学计量学算法,1 9 9 6 ,湖南科学技术出版社 【3 】h w o l d ,e n c y c l o p a e d i ao f s t a t i s t i c a ls c i e n c e s , v 0 1 6 ,e d s n l j o h n s o na n ds k o l z , 】9 8 4 5 8 1 5 9 1 w i l e y n e wy o r k 【4 w f m a s s y ,a m e rs t a la s s o c i a t i o n ,6 0 ( 1 9 6 5 ) ,2 3 4 - 2 4 6 5 h a k a i k e ,1 e e e n a n s a c l f 0 h s o n a u t o m a t i c c o n t r o l ,1 9 ( 1 9 7 4 ) ,7 1 6 7 2 3 6 jcl m a l l o w s ,t e c h n o m e t r i c s ,1 5 ( 1 9 7 3 ) ,6 6 i 6 7 5 f 7 1d ma l l e n ,t e c h n o m e t r i c s ,1 6 ( 1 9 7 4 ) ,1 2 5 - 1 2 7 f 8 1m s t o n e ,jrs t a t i s ts o c ,b 3 6 ( 1 9 7 4 ) ,11 1 - 1 4 7 9 g w a h b a ,s w o l d ,c o m m u n s t a t ,4 ( 1 9 7 5 ) ,1 - 1 7 10 1s w o l d ,t e c h n o m e t r i c s ,2 0 ( 1 9 7 8 ) ,3 9 7 4 0 5 l1 】j s h a o ,ja m e rs t a t i s t a s s o c ,8 8 ( 1 9 9 3 ) ,4 8 6 - 4 9 4 【1 2 】er m a l i n o w s k i ,w i n d o w f a c t o ra n a l y s i s :,c h e m o m ,6 ( 1 9 9 2 ) ,2 9 4 0 【1 3 】er m a l i n o w s k i ,f a c t o ra n a l y s i si nc h e m i s t r y ,2 n de d n ,1 9 8 9 ,w i l e y , n e wy o r k 1 4 】vl i a n g ,0 m k v a l h e i m ,a h a lc h i ma c t a ,6 6 ( 1 9 9 4 ) ,4 3 5 1 湖南大学应用数学专业博 学位论史许青松 1 5 o m k v a l h e i ma n dy - zl i a n g ,a n a l c h e m ,6 4 ( 1 9 9 2 ) ,9 3 6 - 9 4 5 16 y :z l i a n g ,o m k v a l h e i m ,h r k e l l e r , d lm a s s a r t ,ek i e c h l ea n de e m i , a n a lc h e m ,6 4 ( 1 9 9 2 ) ,9 4 6 - 9 5 3 【1 7 】rm a n n e ,c h e m o mi n t e l l l a bs y s t ,2 7 ( 1 9 9 5 ) ,8 9 9 4 【1 8 1 李浩春,林彬生,罗春荣,卢佩章,尹屋群髯b ,5 ( 1 9 8 6 ) ,4 4 9 - 4 6 i 1 9 】卢佩章张玉愧,梁鑫淼,高效液相色谱法及其专家系统,1 9 9 2 ,辽弓2 科学技术出版社 【2 0 】l i a n gyz ,o mk v a l h e i m ,a n a lc h i ma c t a ,2 7 6 ( 1 9 9 3 ) ,4 2 5 - 4 4 0 2 1 】g e p b o x ,w g h u n t ,j s h u n t ,s t a t i s t i c s f o r e x p e r i m e n t s :a n i n t r o d u c t i o n t o d e s i g n , d a t aa n a l y s 旭a n d m o d e l b u i l d i n g ,19 7 8 ,w i l e y ,n e wy o r k 2 2 d c m o n t g o m e r y ,d e s i g n sa n d a n a l y s i so f e x p e r i m e n t s ,19 9 7 ,w i l e y ,n e wy o r k 【2 3 】ad e y ,o r t h o g o n a lf r a c t i o n a lf a c t o r i a ld e s i g n s ,1 9 8 5 ,w i l e y ,n e wy o r k 2 4 a v g e r a m i t a ,s e b e r r y ,o r t h o g o n a ld e s i g n s ,19 7 9 ,m a r a c e ld e k k e r ,i n cn e w y o r k 1 5 】k t f a n g ,y w a n g ,n u m b e rt h e o r e t i cm e t h o d si ns t a t i s t i c s ,1 9 9 4 ,c a p m a na n d h a l l ,l o n d o n 2 6 】ac a t k i n s o n ,a n d o n e y o p t i m u me x p e r i m e n t a ld e s i g n s ,19 9 2 ,c l a r e n d o n p r e s s ,o x f o r d 【1 7 】a c a t k i n s o n ,b b o g a e k a ,m bb o g a c k i ,c h e m o ml a b 跏,4 3 ( 1 9 9 8 ) ,1 8 5 1 9 8 ( 2 8 】dp e r e z - b e n d i t o ,m s i l v a ,k i n e t i cm e m o & i na n a m i c a lc h e m i s ,厂19 8 8 e l l i s h o r w o o d l i m i t e d ,e n g l a n d 2 9 h n i e d e r r e i t e r ,s t u d i e si n 尸w pm a t h ,19 8 3 ,5 2 3 5 2 9b i r k h a u s e r b a s e l 3 0 】hn i e d e r r e i d e r ,p p e a r t ,s i a m js c ls t a t i s tc o m p u t ,7 ( 1 9 8 6 ) ,6 6 0 6 6 4 3 1 k t f a n g ,y w a n g ,c o m p u tm a t h ,9 ( 1 9 9 1 ) ,9 - 1 6 4 湖南大学应用数学专业博士学位论文 许青松2 0 0 1 年6 局 第一部分多元校正和定量结构与保留指 数关系研究中模型的建立与预测 多元校正长期以来一直是是化学计量学研究的中心内容之一,它是从化学数据中获得 有关化学物质具体定量成份的基本方法。回归分析中多元线性回归、主成份回归和偏晟小 二乘回归等方法是多元校正研究的主要工具。对于校正模型,由于众多的回归变量( 分析通 道) ,使得模型中变量的共线性非常严重。岭回归和偏最小二乘回归以及主成份回归都可用 来处理这一问题。本部分首先推出广义偏最小二乘回归,将岭回归与偏最小二乘回归有机 结合起来,广义p l s 方法比普通p l s 方法能更有效地解决模型变量中的共线性问题,从而 提高模型预测的精度和稳定性。 定量结构与保留指数关系研究是要建立化合物的结构( 通常用分子拓扑指数表述) 与其 保留指数之间的定量关系模型。无论是定量结构与保留指数关系或多元校正模型研究中 模型的确立问题,其本质是变量的选择( 或组份数的确立) 问题,化学计量学用的最多的是 每次剔除一个样本交互检验来确立模型的变量。遗憾的是,它在理论上并不具有相容性, 一般地,倾向选择过多的变量( 或过多的组份) 保留在模型中,从而导致模型产生过拟合。 m o n t ec a r l o 交互检验是上世纪九十年提出的一种具有相容性的选变量方法。本部分首次 将其用于多元校正模型和定量结构与保留指数关系模型的研究中,成功的解决了模型的确 立( 或变母的选择) 问题,避免了过拟台的产生。由于m o n t ec a r l o 交且检验值所表现的 是刚比给定样本小的多样本所得模型的平均预测能力,用它作为模型预测能力的估计是不 合适的。本部分最后推出修正m o n t ec a r l o 交互检验值的公式,并且证明它更接近模型的 随机误差。 1 1 引
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年学历类自考专业(国贸)线性代数(经管类)-线性代数(经管类)参考题库含答案解析(5套试卷)
- 2024年烟草四川公司招聘考试真题及答案
- 中级计量经济学知到智慧树答案
- 计算机三级(信息安全技术)考试题(含答案)
- 中外名建筑赏析知到智慧树答案
- 中西方文化比较知到智慧树答案
- 中西医结合基础思路研究与方法知到智慧树答案
- 中学生物实验教学知到智慧树答案
- 2025版水电安装工程合同履行与维护合同
- 2025年仓储配送一体化大数据分析服务合同
- 勉县一中小升初数学试卷
- 2025一建《建设工程经济》计算、时间、数字考点笔记
- 校园基孔肯雅热防控措施课件
- 第1课 中国古代政治制度的形成与发展 课件 统编版高中历史选择性必修1
- 药师考试历年真题综合测试试卷(含答案)
- 2025年村级防疫员考试模拟试题及答案
- 快餐公司门店设备夜间关闭管理制度
- 以童心为笔:基于儿童心理发展需求的小学校园公共活动空间设计
- 2025年度日语能力测试N4级试卷含答案与解析
- 2025秋人教版(2024)八年级上册地理 【教学课件】1.1.2《疆域》
- 物理治疗颈椎病讲课件
评论
0/150
提交评论