已阅读5页,还剩120页未读, 继续免费阅读
(分析化学专业论文)gcms重叠信号解析与nirs数据建模研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中冈科学技术人学溥i 学位论义 摘要 g c m s 重叠信号解析和n i r s 数据建模是化学计量学研究领域的重要研究内 容 论文提出了能够直接从g c m s 重叠信号中提取纯组分质谱和色谱信息的新方 法 建立了基于两种不同极性色谱柱保留时间的有机化合物双柱沸点预测模型 研究了叶蝉散 一种氨基甲酸酯农药 的裂解规律 进行了n i r s 建模方法研究 论 文主要内容包括 1 综述了定量构效关系 q s a r 研究描述符 数据分析方法及典型应用 概述 了重叠色谱信号解析方法及是新进展 并对n i r s 数据预处理与建模方法进行了总 结 2 采用多元回归分析和统计重要性评价 研究了有机化合物沸点与气相色谱 保留时间之间的相关性规律 说明烃类化合物沸点与非极性柱保留时间具有较好 的线性相关性 而含有羟基 羰基或不饱和氮等有机化合物的沸点与极性柱保留 时间具有非线性相关性 对于单柱沸点预测模型 只有基于非极性色谱柱保留时 间的烃类化合物能够取得理想的预测结果 基于极性相差较大色谱柱保留时问的 有机化合物双拄沸点预测模型 对单一类型和多种类型化合物共存时沸点预测均 可得到满意结果 双柱沸点预测模型更为全面地反映了化合物沸点的影响因素 具有更好的统计重要性 能够克服单柱模型的不足 是通用性较强的沸点预测模 型 3 提出了解析g c m s 重叠信号的自适应免疫算法 a i a 实现了直接从g c m s 重叠信号中提取纯组分质谱信息和纯组分色谱曲线的新途径 在质谱和色谱两方 面完成了g c m s 重叠信号解析 将a i a 用于模拟重叠信号与苯丙氨酸裂解产物 g c m s 分析重叠信号的解析 成功地从含有背景的重叠信号中解析得到了纯组分 和背景信号的质谱信息与色谱曲线 与交互自模混合物分析 s i m p l i s m a 方法相 比 a i a 受背景信号的干扰较小 对g c m s 重叠信号的解析效果更好 a i a 为g c m s 重叠信号的解析提供了新的途径和方法 4 初步研究了采用平均场一独立成分分析 m f i c a 法进行g c m s 重叠信号解 析 在m f i c a 中通过源信号后验分布的平均值来预测源信号 纯组分质谱 解析 g c m s 重叠信号时 根据实际应用条件 对源信号和混合矩阵 纯组分相对浓度矩 中冈科学技术大学博 学位论文 阵 设置非负约束的先验性限制 避免源信号之间相关性较高 重叠较为严重 时提 取的质谱和色谱信息出现不合理的负值 克服了传统i c a 提取纯组分质谱和色谱信 息时的不足 结果表明 m f i c a 是改善i c a 算法的有效途径之一 对i c a 在实际 分析化学信号解析中的应用具有重要意义 5 以化学计量学方法辅助g c m s 分析组分定性确认研究了叶蝉散的裂解规 律 确认了8 0 个裂解组分 包括叶蝉散受热分解产物 高温条件下的二次裂解产 物以及裂解碎片聚合形成的多种化合物 结果表明 化学计量学方法辅助g c m s 分析可用于实际复杂样品分析 同时 根据裂解组分含量随温度的变化规律 说 明了叶蝉散的裂解规律和裂解机理 为评价高温条件下叶蝉散的毒性或生物活性 改变等提供了必要的化学信息 6 运用离散小波变换 d w t 连续小波变换 c w t 遗传算法 交互检验等 方法与偏最小二乘 p l s 法和支持向量回归 s v r 等相结合 实现了n i r s 数据的高 倍压缩 特征变量筛选和背景信号扣除等 建立了复杂植物样品中不同组分测定 的数学模型 结果表明 有效的变量筛选可以极大地减少模型的变量个数 降低 模型复杂程度 改善预测的准确度 c w t s v r 方法优于全谱数据的s v r 和p l s 法 模型具有更好的稳定性和适应性 中罔科学技术大学博士学位论文 a b s t r a c t r e s 0 1 u t i o no fo v e r l a p p i n gg c m ss i g n a la n dm o d e l i n go f n i r sd a t aa r ei m p o n a n t c o n t e n t si nc h e n l o m e t r i cr e s e a r c hf i e l d s i n 血i sd i s s e r t a t i o n n e wm e t h o d st h a tc a n d i r e c t l y e x t r a c tt h em a s s s p e c t r a l a n dc h r o m a t o g r a p h i ci n f b m o no ft h ep u r e c o m p o n e n t sf r o ma no v e r l a p p i n gg c m ss i g n a lw e r ep r o p o s e d am o d e lf b rb o i l i n g p o i n tp r e d i c t i o no fo r g a n i cc o m p o u n d su s i n gr e t e n t i o nt i m e so nt w oc o l u m n sw i t h d i f 琵r e n tp o l a r i t yw a sb u i l t t h ep y r 0 1 y s i sb e h a v i o ro fi s o p r o c a r b at y p eo fc a r b a m a t e i n s e c t i c i d e w a si n v e s t i g a t e dw i t ht h e a i do fc h e m o m e t r i cm e m o d s t h em o d e l i n g m e t h o d sf o rn i r sd a t a v e r ea l s os t u d i e d t h em a i nc o n t e m so fm i sd i s s e r 七a t i o na r ea s f o l l o w i n g s 1 d e s c r i p t o r s d a t aa n a l y s i s a p p r o a c h e s a n d 印p l i c a t i o n s o f q u a n t i t a t i v e s t m c t u r e a c t i v i t yr e l a t i o n s h i p q s a r w e r er e v i e w e d t h ea i g o r i t h m sa n dt h e i rr e c e n t a d v a n c e sf o rr e s o l u t i o no fo v e r l a p p i n gc h r o m a t o g r a p h i cs i g i l a lw e r cs u i n m a r i z e d t h e c o m m o n l yu s e dm e t h o d sf o r 出n ap r e p r o c e s s i n ga n dm o d e l i n go fn i r sd a t aw e r e i n t r o d u c e d 2 t h eq u a n t i t a t i v er e l a t i o n s h i p sb e t w e e nt h eb o i l i n gp o i n t sa r l dr e t e n t i o nt i m e so f o r g a n i cc o m p o u n d so ng cc a p i l l a r yc o l u 砌sw e r es t u d i e d 2 7 1c o m p o u n d sw i t h d i v e r s ef h c t i o ng r o u p sa r ei n v e s t i g a t e di nt h es t u d i e dd a t a s e t i ti sf o u l l dt h a t s a t i s f a c t o r ym o d e l i n gc a l l i l o tb eo b t a i n e du s i n go n l yr e t e n t i o nt 血e so nas i n g l ec o l u m n e v e nd i v i d i n gt h e2 71c o n l p o u n d si n t of o u rg r o u p sa c c o r d i n gt o 血e i rf h n c t i o ng r o u p s o n l yt h eh y d m c a r b o n so nn o n p o l a rc o l u m ng i v eg o o dr e s l l l t sw i t hal i n e a rm o d e l h o w e v e r i ft h er e t e m i o nt i m e so nt w oc o l 啪n so fd i 彘r e n tp 0 1 a r i t ya r eu s e dt ob u i l d t h em o d e l as a t i s f a c t o r yt w o p a r a m e t e rm o d e lc a nb eo b t a i n e df o rt l l ew h o l ed a t a s e ta 1 1 d e a c h s u b g r o u p t h er e s u l t sa l s os h o wt h a tt h es t a t i s t i c a l i m p o r t a n c eo fm e t v o p a r 锄e t e rm o d e l i sm u c hb e t t e rt 1 1 a nt h a to ft h eo n e p 啪c t e rm o d e l 3 a na d a p t i v ei m m u n ea l g o r i t h a i a w a sp m p o s e df o rr e s o l u t i o no fm e o v e r l a p p i n gg c m ss i 印a 1 i na i a t h em a s ss p e c t r a li n f o r n l a t i o no ft h ep u r e c o m p o n e n t s i s d i r e c t l y e x t r a c t c d 丹o mt l l e o v e r l 印p i n gg c m ss i g n a l a 1 1 dt h e c 1 1 r o m a t o g r a p h i cp r o f i l e sa r ec a l c u l a t e db yi m m u n eo p e r a t i o n t h eo v e r l a p p i n gs i g n a l w i t hb a c k g r o u n do ft h es i m u l a t e dd a t aa i l dt h ee x p e r i m e n t a lm e a s u r e dd a t aw e r e r e s 0 1 v e du s i n gm ea i a t h em a s ss p e c t m li n f o n n a t i o n t h ec h r o m a t o g r a p h i cp r o 矗i e so f 中国科学技术人学博卜学位论文 t h ep u r ec o m p o n e n t s a n dt h eb a c k g r o u n da r ee x t r a c t e d f u r t h e l m o r e t h ei n d j s c o v e f a b l e o v e r l a p p i n gc o m p o n e n t sb yt h ec o n v e n t i o n a lm e t h o da r ei d e m i 矗e d c o m p a r i n gw i t ht h e s e i f m o d e i i n gm i x t u r ea n a i y s i sm e t h o d s i m p l i s m a a i ai s 1 e s sa f r e c t e db yt h e d i s t u r b a l l c eo ft h eb a c k g r o u n da n dh a sb e t t e rr e s 0 1 u t i o nr e s u t sf o rt h eo v e r l a p p i n g g c m ss 培n a lw i t hb a c k g r o u n d a i ai sap m m i s i n gt 0 0 1f o rr e s o l u t i o no fo v e r l 印p i n g g c m ss 适n a l 4 ap r i m a r ys t u d yo na p p l i c a t i o no f m f i c a m e a nf i e l d i n d e p e n d e mc o m p o n e n t a n a l y s i s f o rr e s o l u t i o no fo v e r l a p p i n gg c m ss i g n a lw a sc a r r i e do u t i nt 1 1 em f i c a a p p r o a c h t h es o u r c e sa r ee s t i m a t e df r o mt h em e a 工lo ft h e i rp o s t e r i o rd i s 删b u t i o n f o r r e s o l u t i o no ft h eo v e r l a p p i n gg c m ss i g n a l t h ei r r a t i o n a l n e g a t i v ev a l u e so ft h e s o u r c e s m a s s s p e c t r a a n dm i x i n gm a t r i x c 王1 r o m a t o g r a m canb ea v o i d e db y s p e c i f i c a t i o no fn o n n e g a t i v e p o s i f i v e p r i o r sf o r t h es o u r c e sa n dm i x i n gm a t x m f i c as h o u i db ea na j t e m a t et o o if o rr e s o l u t i o no f o v e r l a p p i n gc h e m i c a ls i g n a l s 5 t h ep y r o l y s i sb e h a v j o r o fi s o p r o c a r bw a si n v e s t i g a t e d 1 1 1 e t o t a l l y 8 0 c o m p o n e n t sw e r ei d e n t i 矗e dw i t ht h e a i do fc h e m o m e t r i cm e t l l o d s t h ed e t e r m j n e d c o m p o n e n t si n c u d et h et h e r m a ld e c o m p o s i t i o n so fi s o p r o c a r b 也es e c o n d a r yp y r o l y s i s c o m p o n e n t sa th 追ht e m p e r a t u r e a j l dt h ec o m p o u n d sf o r m e db yt h ep o i y m e r i z a t i o no f t h ep o i y t i cf a g m e n t s t h ep y r o l y s i sm e c h a n i s mo fi s o p m c a r bi s u s t r a t e db a s e do n m ec o n t e n t sv a r i o no ft h ep y r o l y s a t ev e r s u st h et e m p e r a t u r e ni ss h o w nt h a tt h e d e t e r m i n a t i o no ft h ec o m p o n e n t sw i t ht l ea i do fc h e m o m e t r i cm e t h o d si ss i m p l ea n d c o n v e n i e n tw i t ha c c u r a c y m l dm ed e t e r m i n a t i o no f t h ep y r o l y s a t ec a i lp m v i d ee s s e m i a l c h e m i c a l i n f o r m a t i o nf o re v a l u a t i o no ft h ec h a n g eo ft o x i c i t 帅i o a c t i v i i yo fi s o p r o c a r b a th i g ht e r r l p e r a t u r e 6 s e v e r a lm e t h o d sf o rp r e p m c e s s i n ga i l dm o d e l i n gt h er a wn i r sd a t ao fc o m p l e x p l a n ts 锄p l e sa r ep r o p o s e db yc o m b i n a t i o no fd i s c r e t ew a v e l e tt r a n s f o 舯 d w t c o n t i n u o u sw a v e j e t 仃a n s f o m c w t g e n e t i ca 培o r i t 圭t m g a a i l dc m s sv a l i d a t i o n c v w i l hp a n ia li e a s ts q u a r e s p l s a n ds u p p o r tv e c t o rr e g r e s s i o n s v r i ti sf o u n dm a tt h e r a wn i r sd a t ac a nb ec o m p r e s s e dw i mh j 曲r a t i ou s i n gd w t t h ec h a r a c t e r i s t i c v a 血b l e sc a nb es e l e c t e db yg a cv t h es p e c t r a lb a c k g r o u i l dc a t lb er e m o v e db yc w t f u n h e r m o r e t h em o d e i sb a s e do nt h ep r e p r o c e s s e dd a t aa r ei e s sc o m p l e xa n dm o r e a c c u r a t ec o m p a r e dw i t ht r a d i t i o n a lp l sm e t h o d a n dt h ec w t s v rm e t h o di sb e t t e r t h a nt h ec o n v e n t i o n a l 如l i s 臼e c t r a is v ra r l dp l s 中周科学技术大学博i 学位沦文 a b c a t b c t a b i c 一 a b c a t b t c t o c i a f a a i a a l s b p c f a c v c w t d w t g a e f a f i a h e l p i a i c i c a m a p m f m l r n i r n i r s 符号说明与缩写 大写的黑体字母表示矩阵 表示矩阵的转置 表示矩阵的逆 小写的黑体字母表示列向量 列向量的转置 表示行向量 表示矩阵a 中第f j 亍第 列 a b s t r a c tf a c t o ra n a l y s i s 抽象因子分析 a d a p t i v ei m m u n ea i g o r i t l l n l 自适应免疫算法 a l t e m a t i n g1 e a s ts q u a r e s 交替最小二乘 b o i l i n gp o i n t 沸点 c h e m i c a lf a c t o ra n a l y s i s 化学因子分析 c r o s sv a l i d a t i o n 交互检验 c o n t i n u o u sw a v e l e tt r a n s f o n n 连续小波变换 d i s c r e t ew a v e l e tt r a l l s f o m 离散小波变换 g e n e t i ca l g o r i t l l r n 遗传算法 e v o i v i n gf a c t o ra 1 1 a l y s i s 渐进因子分析 f l o w 岫e c t i o na n a l y s i s 流动注射分析 h c u r i s t i ce v o l v i n gl a t e n tp r o j e c t i o n 启发渐进式特征投影 i m m u n ea l g o r i m m 免疫算法 i n d e p e n d e n tc o m p o n e n t 独立组分 i n d 印e n d e mc o m p o n e n ta n a l y s i s 独立成分分析 m a x i m u ma p o s t e r i o r 极大化后验 m e a l lf i e l d 平均场 m u l t i p l el i n e a rr e g r e s s i o n 多元线性回归 n e a ri n n a r e d 近红外 n e a ri n f r a r e ds p e c t r u m 近红外光谱 中国科学技术大学博士学位论文 o p a p c a p b m p l s p m f p v a q s a r q s p r q s r r r a f a r j r m a t c h r m s e r r s s q s i m p l i s m a w f a o n h o g o n a lp r o j e c t i o na p p r o a c h 正交投影法 p r i n c i p a lc o m p o n e n ta n a i y s i s 主成分分析 p r o b a b i l i t y 七a s e dm a t c h i n 昌基于概率的匹配 p a r t i a ll e a s ts q u a r e s 偏最小二乘 p o s i t i v em a 砸xf a c t o r i z a t i o n 正矩阵因子分解 p u r ev a r i a b l ea p p r o a c h 纯变量法 q u a n t i t a t i v es t r u c t u r e a c t i v i c yr e l a t i o n s h i p 定量构效关系 q u a n t i t a t i v es t r u c t u r e p m p e n yr e l a t i o n s h i p 定量结构性质相关 q u a n t i t a t i v es t n l c t u r e r e t e n l i o nr e l a t i o n s h i p 定量结构行为相关 r a n ka 1 1 n i l l i la t i o n f k t o ra 1 1 a l y s i s 秩消因子分析 l e er e t e n t i o ni n d e x l e e 保留指数 r e v e r s em a t c l l i n gf a c t o l 反向匹配因子 r o o tm e a l ls q u a r ee r r o l 均方根误差 r e i a t i v er o o to f s u mo f s q u a r ed i 彘r e n c e s 相对根差方和 匹迅巳 e t o u s e 主n t e r a c t i v e 墨e l f m o d e l i n g 堡i x t u r e 旦n a i y s i s 交互自 模混合物解析 s e l o m o d e l i n gc u r v er e s o l u t i o n 自模曲线解析 s u r ns q u a r e sr o o t 根差方和 s u p p o nv e c t o rm a c h i n e 支持向量机 s u p p o r tv e c t o r r e g r e s s i o n 支持向量回归 s u b w i n d o wf a c t o ra 1 1 a l y s i s 子窗口因子分析 t o t a lp l a ma l k a l o i d s 总植物碱 t a 唱e tf a c t o ra i l a l i s 目标因子分析 t o t a ln i t r o g e n 总氮 t o t a ls u g 屿总糖 t o t a lv o l a t i l e 出a l o i d s 总挥发碱 t o t a j o l c u r r e n to r t o t a 0 nc u r t e n tc h r o 工n a t o g r 黝 总离子流或总 离子流色谱图 w i n d o wf a c t o ra n a l y s i s 窗口因子分析 跳 w 豫 岍 姒 睑 m 蚤 忱 盼 砉雪 耄 m 姗 俄 吼 兰 飓 至 腿 中国科学技术大学博上学位论文 第一章文献综述 第一章文献综述 化学计量学 c h e m o m e t r i c s 诞生至今已有3 0 多年的历史 其最初定义为 化 学汁量学是化学的 门分支学科 它应用数学和统计学方法 设计或选择最优的 测量程序和实验方法 并通过解析化学测量数据而获取最大限度的信息 在化学 计量学的发展过程中 特别是2 0 世纪9 0 年代以后 化学计量学的内涵得到了发展 w o l d 重新界定了化学计量学的基本涵义 即 从化学测量数据中获取 表述 显 示相关化学信息 并指出 化学计量学的主要特征是把化学问题构造成可阻通 过数学关系表达的数学模型 b r o w n 则认为 化学计量学是定量测量化学与应用 统计学的一个交叉领域 通过数学与统计学方法从化学数据中提取信息 从化学计量学的基本涵义及其实际应用可以看出 化学计量学的研究领域极 为广泛 内容极为丰富 凡是施行化学测量的所有领域 都可以应用化学计量学 其中 结构与活性相关的定量构效关系 q u a n t i t y s 虹u c t u r ea c i i v i t yr e l a t i o n s h 弧q s a r 研究 化学信号处理特别是重叠分析化学信号解析 化学实验信号处理与建模方 法研究等 是化学计量学研究与应用的重要方面 本章对定量构效关系 化学信 号处理中的重叠色谱信号解析 近红外光谱 n e a r i n 疳a r e ds p e c t r u m n i r s 数据预处 理与建模方法等方面的研究进行简要评述 并说明了论文研究工作的设想与意义 1 1 定量构效关系研究 q s a r 研究是从分子结构入手 应用适当的描述符建立分子结构与生物活性 化学或物理化学特性 药物活性等之间的定量关系 是理论化学研究中的一个重 要目标 q s a r 通过直接研究可以测定的物理 化学 药理或毒理学性质等 采用 统计回归 多元校正 和模式识别等方法建立化学结构与性能之间的关系 从而 达到预测化合物特性的目的 1 1 1 1q s a r 研究常用描述符 分子结构与性质的关系一般可以分为两种 一种称为加和性 即分子的性顾 中周科学技术人学博 学位论义第一章义献综述 等f 分子巾各组成部分相应性质之和 如原子化热 分子量 摩尔折射率等 另 一种称为结构性质 即分子的性质主要取决于分子内原子的排列顺序及键的性质 如有机物的熔点 沸点和溶解度等 活性化合物的一些生理作用与其化学结构相 关 两者之间的关系可以借助数学模型加以描述 q s a r 研究的基础是分子和分子 碎片描述符 包括理化参数 几何参数 电子参数和拓扑指数等 2 1 g v e r s 和v 0 0 9 t 3 对环境毒理学q s a r 研究中所使用的分子描述符进行了洋细分类 q s a r 研究中常 用的描述符主要包括结构描述符 量子化学描述符 分子表面积描述符等几种类 犁 f 1 1 结构描述符 分子的结构系统由小的单位构成 系统中每个小单位有其相对位置和准确的 大小 结构描述符主要包括 电子结构描述符 代表电子的数量 描述电子在分子和原子中的分布方式 可以直接根据拓扑学和量子化学方法计算得到 与结构有关的分子性质也属这类 描述符 这些性质大多可以根据宏观实验方法直接得到 较常用的电子结构描述 符包括价连接指数 原子上的电子电荷 电矩 如偶极矩 和极化率等 原子 碎片 分子结构描述符 代表原子 基团的数量或原子 基团组成分子 的方式 它们可能因为构成分子的原子和键的取值不同而不同 这些描述符可通 过量子力学 半经验 原子 原子势 数学方法及实验测量来获得 该类描述符又 可进一步分成几何描述符和拓扑描述符 几何描述符可根据原予中心的位置及原 予半径计算而得到 非立体描述符与分子内部结构有关 立体描述符与分子外部 结构有关 几何描述符有长度 宽度比 距离指数 范德华体积和立体重叠体积 等形式 拓扑描述符用来描述分子结构性质 当分子变形而键没有断裂时 描述 符的值不变 基团贡献法 g r o u pc o n t r i b u t i o n sm e 也 d 是由w i l s o n 等 4 l 在对化合物亚结构信 息和生物活性相关研究基础上建立的 该方法认为一种给定的亚结构对分子的总 活性有一个累加或固定的贡献 且一种特定的亚结构对活性的贡献依赖于取代基 在母体环结构上的位置 基团贡献法不必计算化合物的理化参数 通过回归分析 将数据拟合成某一模型进行计算 从而确定每一种可能的取代基在特定取代位置 上对分子活性的影响 该法比较适用于具有相同母体结构的化合物 尽管该法不 第一章文献综述 能直接给出活性机制 但因其方法简单 常被用来对化合物毒性进行初评或进行 物理化学性质 如沸点 熔点等 进行预测 分子间结构描述符 描述分子间相对位置及方位 例如 生物活性化合物与 受体靶位的结合方式或连接方式 这些描述符可以通过量子化学 几何方法和半 经验 原予 原予势 方法及实验方法得到 宏观结构描述符 用来描述宏观状态结构 也可以用来计算结构描述符及预 测物理化学性质 通常可由实验方法获得 较为普遍使用的宏观结构描述符有摩 尔体积和密度等 分子连接性指数 分子连接性指数法是由k i e r 等 5 1 根据图论方法与拓扑指数 的关系而发展的一种拓扑学方法 该方法根据分子中各个骨架原子排列或连接方 式的不同来描述分子的结构性质 反映分子中原子的价键连接状况及分支的多少 分子连接性指数能反映分子的立体结构和杂原子的价电子信息 并直观显示分予 结构对化学反应性质和生物活性的影响 分子连接性指数可以根据分子的结构式 和原子的点价计算得到 具有方便 简单且不依赖于实验等优点 得到了厂 泛的 应用和发展 2 能量描述符 能量描述符是描述系统中元素间或系统与其环境之间的反应 在分子或亚分 子水平上 当处理少量粒子时 仅量子力学能量是相关的 而在宏观水平上或处 理大量粒子时 统计热力学自由能或焓和熵是相关的 熵 描述系统有序的程度 也可划分到宏观描述符中 其热力学表达式和信 息理论表达式很相似 电子 自由 能描述符 描述原子 键和分子的电子能量 包括原子 分子中 电子间的吸引和排斥 它们可用量子力学方法计算或由实验测定的性质中获得 代表性的电子能量描述符有电负性 离子势 电子亲合性 h 舢e t t 电子常数 还 原势及h n c k e l 万键能等 原子 分子 自由 能描述符 反映原子键的长度 分子中原子间的吸引和排斥 作用 它们和分子的化学稳定性和分子活性有关 这些性质 键长 分予间力和分 子内的原子一原子势等 可用量子力学和半经验 原子一原子势 方法计算得到或由实 验测定的宏观性质推得 由田科学技术大学博 学位论义 第一章文献练述 分子f 刚 自由 能描述符 用来描述范德华 静电 诱导和色散 作用 分子间 i i 一键能 分子问电荷转移能和排斥能 这些性质 t a n 常数 势能场参数和反相色 谱保留指数等 可由量子力学和半经验 原子一原子势 l i p p i n g c o t s c h r o d e t 势 方法计 算得到 也可根据宏观测得的性质推得 宏观 自由 能描述符 主要包括辛醇 水分配系数 1 9 彤 1 3 j 色谱保留指数 酸 碱离解常数p k a 和醚的水解常数等 用来研究性质一活性相关 p h y s i c a i p r o p e r t y a c t i v i t yr e l a t i o n s h i p s p a r l g k 作为一种亲脂性或疏水性键合的量度参 数 是q s a r 研究中最常用 最重要的理化参数 在化合物 大分子或受体相互作 用中起着关键作用 与各种生物活性 如药效 毒性 杀虫活性等具有显著的相 关性 同时 药物的亲脂特性在药物代谢中是一个重要的影响因素 不同类型化 合物的吸收分配和代谢与l g 彪 关系紧密 许多化合物的l g k 可通过实验测定而 得 也可以用碎片常数法进行估算而得 由于辛醇 水分配系数法参数较易得到目 计算简便 己成为人们普遍接受的方法 线性自由能描述符 线性自由能描述符由h a n s c h 等 7 j 提出 h a j l s c h 认为 如 果不考虑有机物在生物体内的代谢 那么生物毒性可以认为是该物质的立体效应 常数 电子效应常数及疏水效应的函数 多数情况下h a l l s c h 相关方程中并不一定 同时包含这3 个参数 如果有机物分子不太大 那么电子效应和立体效应有时便可 忽略 这便是常用的辛醇 水分配系数法 h a f l s c h 法参数较易获得 而且具有一定 的理论意义 有助于人们了解生物活性的作用机制 也是人们常用的方法 线性溶剂化能描述符 k a m l e t 等 8 认为 化合物的性质及活性与溶质和溶剂 的反应性质有关 分子的特征可用分子体积 分子极性 氢键给予体酸性能力参 数 氢键接受体碱性能力参数等进行表征 其中分子体积可以通过结构参数 键 长及键角计算得到 也可用m c g o w a n 法进行估算 其他参数可用紫外 可见光谱测 定获得 许多化合物的该类参数尚未确定 在一定程度上限制了该法的应用 3 量子化学描述符 通过对有机物分子进行量子化学计算 可以全面获得分子的电子结构和立体 结构信息 如分子轨道能级 原子的电荷密度 偶极矩 分子净电荷以及优势构 象等 目前 量子化学在q s a r 研究中的主要应用一方面是物理化学参数的计算 使理化参数的计算更为准确 对理化参数所表征的物理意义的认识更为明确 另 4 第一章文献综谜 一方面是直接应用于q s a r 研究 比如用量子化学计算得到的电子效应参数代替 h a l l s c h 方程的电子效性参数进行蚓归分析 研究化合物的生物活性与其电子结构 之间的定量关系 量子化学参数包含大量的物理信息 仅通过化合物及其取代物 的分子结构就可以直接定性 根据化合物的化学活性直接描述化合物的各种活动 方式 使q s a r 模型也能表示分子的物理化学特性 用于化合物活性预测 4 分子表面积描述符 h e l a n s 等 9 1 从分子结构角度计算分子总表面积 并从理论上建立溶解度与分 子表面积的关系 2 0 世纪8 0 年代产生了精确的计算方法他1 2 0 世纪9 0 年代 又发 展了简便易行且准确的计算方法 1 2 一些学者研究了有机物的生物毒性与分子 表面积之间的相关性 1 4 1 1 2q s a r 研究常用数据分析方法 q s a r 研究数据分析方法主要包括多元回归分析 多变量分析和亚结构分析等 三大类 由于原始数据中含有一些背景或噪音信号干扰 观察变量问的自相关性 数据矩阵维数高等 也经常需要对原始的测量数据进行一定的预处理 使0 s a r 模 型具有更好的稳健性和更高的预测准确度 j 多元回归分析 主要用来研究相似性化学物质 对于相对简单的研究对象 仅用一种描述符 就可建立起化合物性质的关系模型 如根据烃类化合物非极性色谱柱保留时间的 沸点预测 1 多数情况下 需要同时采用多种描述符来描述化合物的性质 由于 多元回归分析特别是多元线性回归分析模型的简洁性与明确的物理意义 多元回 归分析成为q s a r 研究中极为重要和常用的数据分析方法 z h o u 等 1 6 利用多元线性 回归分析研究了氢键相关分类的分子电负性距离矢量 h y d r o g e n a s s o c i a j o n c l a s s i 矗e dm o l e c u l a re l e c t r o n e g a t i v i t y d i s l a n c ev e c t o r h m e d v 与环脲化合物抗艾滋 活性之间的关系 d im a r z i o 等 1 对鱼类毒性研究的结果表明 利用h a n s c h 描述符 仪用简单的回归分析 即可对非极性化台物建模 但对同时包含极性与非极性化 合物的研究对象 l g 足 单一描述符的q s a r 模型对化合物生物活性的预测能力不 中田科学技术大学博一i 学位论文帮一章文献综述 强 而采用改进的w h i m w e i 譬h t e dh o l i s t i ci n v a r i a n tm o l e c u l a r 指数 回归模型的预 测能力较强 说明在某些研究中分子掐述符较l g 世 具有更高的预测能力 o s a r 模型中不同描述符的重要性是不同的 此时有必要对模型中所使用的变 量 描述符 进行筛选 逐步回归分析与交互检验相结合 j 遗传算法与多元回归 变量选择相结合 i s 1 川等是其中常用的变量选择方法 多元回归分析是目前q s a r 研究中常用的数据分析方法 在许多领域得到了应 用 而对于非线性q s a r 模型 人工神经网络是一种有效的特征映射工具 与多 元同归分析结合 能够处理q s a r 研究中结构与活性之间的非线性关系 f 2 多变量分析 多变量分析在q s a r 研究中用于分析不同类型的化学物质 以期获得结构信息 模型 通常采用的方法有判别分析 模式识别 主成分分析和因子分析等 k u l k a m i 等 2 0 采用s 种物理化学参数对包括优先污染物的多种有机化合物进行 q s a r 建模 并采用条件指数 c o n d i t i o ni n d e x 和k 相关指数进行奇异值诊断 c o s t a 等 2 l 对1 4 一二氢嘧啶衍生物进行主成分分析 将这些衍生物分为低活性和高活性 组 发现对相同的化合物集合 采用主成分分析 多元回归分析与多元线性回归 分析模型不同选择的量子化学参数不同 m u r c i a s o l e r 等f 2 2 在低血糖试剂0 s a r 研 究中采用线性判别分析进行低血糖活性选择 c h e n 等 2 3 1 在对除草剂的0 s a r 研究 中 比较了多种数据分析方法对特定问题的处理效果 这些数据分析方法包括多 元线性回归分析 主成分分析 偏最小二乘法 神经网络等 l e o n a r d 等 2 4 j 在苯甲吡唑取代物受体键合力0 s a r 研究中采用主成分分析法选 择多元回归模型变量 并对所得q s a r 模型进行留一法交互检验 s o r i c h 等 2 5 比较 了线性和非线性分类算法的模式识别技术预测药物或化学品代谢行为 随机共振算法 s t o c h a s t i cr e s o n a n c ea l g o r i t s r a 可以利用噪音对信号检测 的能量贡献 提高含有噪音的弱小信号检测的信噪比和灵敏度口6 27 1 也可以用于 q s a r 的研究b 使经s r a 预处理后的q s a r 模型中与活性相关的变量得到加强 能量谱改变显著而与生物活性变化规律相似 考虑到研究对象的复杂性 多变量分析是q s a r 研究中最为重要的结构 活性 研究方法 f e r r e i r a 2 9 综述了
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年资阳环境科技职业学院单招综合素质考试必刷测试卷及答案1套
- 2026年铜川职业技术学院单招职业技能测试必刷测试卷新版
- 2026年长江艺术工程职业学院单招职业倾向性测试题库新版
- 2026年鹤岗师范高等专科学校单招职业倾向性考试必刷测试卷及答案1套
- 2026年河南省许昌市单招职业倾向性测试题库新版
- 2026年云南林业职业技术学院单招职业技能考试必刷测试卷及答案1套
- 2026年陕西工业职业技术学院单招职业技能考试题库及答案1套
- 2026年延边职业技术学院单招职业适应性考试必刷测试卷新版
- 2026年河北科技学院单招职业适应性考试题库附答案
- 2026年河南建筑职业技术学院单招职业适应性测试题库及答案1套
- 氧化碳气瓶搬运、存放及使用管理制度
- 上代文学完整版本
- 《传承工匠精神主题班会课件版》
- 设备采购方案投标文件(技术方案)
- 烹饪专业产教融合运行事项方案
- 第5课 数学运算讲方法(说课稿)2024-2025学年五年级上册信息技术人教版
- 安全生产管理制度的检查评估报告
- 50项护理基础操作评分标准
- 质量奖知识和信息管理
- 中药智慧药房系统建设方案
- 鸿星尔克公司管理现状
评论
0/150
提交评论