




已阅读5页,还剩83页未读, 继续免费阅读
(分析化学专业论文)有机物定量结构—水溶解性相关研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
桂林工学院硕士学位论文 中文摘要 有机物的水溶解性是其最重要的性质之一,绝大多数有机物所具有的物化 性质和生物活性都与其水溶解性有关,掌握这一性质及其规律对于了解有机物 的环境及生物效应具有极为重要的意义。应用定量结构一性质相关( q s p r ) 技 术可以对难以获得的有机物水溶解性数据作出估计或预测。本文采用基于分子 电性距离矢量的二维拓扑描述子,研究了若干有机化合物的结构与水溶性之问 的定量关系,建立了一系列定量结构一水溶解性相关模型,获得满意结果。 主要研究内容及成果如下: 1 应用- t 0 新的修正e 状态指数表征一系列单官能团有机物化合物的分 子结构,并用其对含醇、酮、酯、醚、卤代烃、炔烃、烯烃、芳烃、烷烃等结 构的1 5 6 个化合物的水溶解性进行了q s p r 研究。在分别对9 类单官能团化合 物建立q s p r 模型的基础上,建立了修正e 状态指数与1 5 6 个有机物水溶解性 的定量模型,所得多元线性回归模型的相关系数,与模型均方根误差r m s e e 分别为0 9 5 2 7 和0 4 0 2 ,l o o 交互校验相关系数q 与均方根误差r s m e p 分别 为o 9 4 5 6 和o 4 3 0 。分子建模与预测结果表明,修正e 状态指数具有较高的结 构选择性和良好的性质相关性,描述予变量具有明确的结构意义,所得模型稳 定,能准确估计与预测该系列有机化合物的水溶解性。 2 应用m e d v - 1 3 描述子对1 2 9 0 个有机物的水溶解性数据进行了q s p r 研究。以p l s 、v s m p 方法进行了变量优化,成功建立了有机物水溶解性与 m e d v - 1 3 描述子之间的6 变量线性模型,模型相关系数r 和均方根误差r m s e e 分别为0 8 1 2 7 和1 1 8 ,l o o 交互检验的预测相关系数q 和均方根误差r m s e p 分别为o 8 1 0 1 和1 1 9 ,证明所得q s p r 模型稳定,具有一定的预测能力。以2 1 个典型有机化合物的外部样本检验模型,结果满意。 3 通过对有机物水溶解性的q s p r 研究,为有机物水溶解性的评价与预测 提供了有效方法。建立了一批有机物分子结构参数和性质数据库。 关键词:定量结构一性质相关( q s p r ) 有机物水溶解性修正e - 状态指数 m e d v - 1 3 描述子 桂林工学院硕士学位论文 a b s t r a c t a q u e o u ss o l u b i l i t yo fo r g a n i cc o m p o u n d si so n eo ft h em o s tf u n d a m e n t na n d i m p o r t a n tp r o p e r t i e s ,a n di sd i r e c t l yr e l e v a n tw i t ht h eb i o l o g i c a la c t i v i t i e sa n d e n v i r o n m e n t a lb e h a v i o r so fm o s t d r u gm o l e c u l a r s o re n v i r o n m e n t a li n t e r e s t s t h e r e f o r , a q u e o u ss o l u b i l i t yh a sb e e ne x t e n s i v e l ys t u d i e df o re s t i m a t i o no ft h i s h i g h l yi m p o r t a n tp r o p e r t y q u a t i t a t i v es t r u c t u r e p r o p e r t yr e l a t i o n s h i p ( q s p r ) i sa f a s t ,r e l i a b l e ,a n dg e n e r a l l ya p p l i c a b l es t r u c t u r e b a s e dm e t h o df o rp r e d i c t i o no f a q u e o u ss o l u b i l i t yo fo r g a n i cc o m p o u n d s i nt h i sp a p e r , t w ok i n d so f2 dt o p o l o g i c d e s c r i p t o r s b a s e do nm o l e c u l a r c l c c 【r o n c g a i i v i t y d i s t a n c e v e c t o ra r cu s e dt oe s t a b i l i s has e i r e s q u a t i t a t i v e s t r u c t u r e w a t e rs o l u b i l i t yr e l a t i o n s h i p s t h em a i nc o n t e n t si nt h i sp a p e ra r ea sf o l l o w s : 1 an o v e lm o d i f i e de s t a t ei n d e xb a s e do n4 3a t o m i ca t t r i b u t ei su s e dt o r e p r e n s e n tt h e s t r u c t u r e so fas e i r e so fd i v e r sf u n c t i o n a l o r g a n i cc o m p o u n d s c o m p o s e do fa l c o h o l s ,k e t o n e s ,e s t e r s ,e t h e r s ,a l k y lh a l i d e s ,a l k y n e s ,a l k e n e s , a r o m a t i c sa n da l k a n e s av a r i a b l es e l e c t i o na n dm o d e l i n gm e t h o db a s e do nt h e p r e d i c t i o n ( v s m p ) i sa d o p t e dt oc h o o s eab e s ts u b s e tf r o ml3v a r i a b l e sf o rt h e15 6 c o m p o u n d s b ym u l t i p l el i n e a rr e g r e s s i o n ( m l r ) ,t h eq s p rm o d e li se s t a b l i s h e d w i t ht h ec a l i b r a t e dc o r r e l a t i o nc o e f f i c i e n t o fn 9 5 2 7a n dr o o tm e a ns q u a r ee r r o r ( r m s e e ) o f o 4 0 2i nc a l i b r a t i o n ,a n dp r e d i c t e dc o r r e l a t i o nc o e f f i c i e n t ( g ) ,r o o tm e a n ! s q u a r ee r r o r ( r m s e p ) v a l u e so f0 9 4 5 6a n d0 4 3 0r e s p e c t i v e l yi nl o ov a l i d a t i o n t h eg o o dq u a l i t ya n dp r e d i c t i o na b i l i t yo ft h em o d e li sp r o v e db yt h es t s t i s t i c s i n b o t hc a l i b r a t i o nm o d e l l i n ga n dl 0 0 p r e d i c t i o n 2 aq s p rm o d e li s d e v e l o p e db e t w e e nm e d v - 1 3d e s c r i p t o r sa n dw a t e r s o l u b i l i t i e so f12 9 0o r g a n i cc o m p o u n d s a h e rv a r i a b l es e l e c t i o nb yp l sa n dv s m p m e t h o d t h eg e n e r a lp r e d i c t i o nm o d e lw i t h6v a r i a b l e si se s t a b l i s h e dw i t hs a t i s f i e d s t a t i s t i c s t h ec o r r e l a t i o nc o e f f i c i e n ti nm o d e l i n gp ) a n dr o o tm e a ns q u a r ee r r o r ( r m s e e ) i nm o d e l i n gi s o 812 7a n d1 18r e p e c t i v e l y w h a t sm o r e ,t h ep r e d i c t e d c o r r e l a t i o nc o e f f i c i e n t ( g ) a n dr o o tm e a ns q u a r ee r r o r ( r m s e p ) i nl 0 0v a l i d a t i o ni s o 810la n d1 19r e s p e c t i v e l y t of u r t h e rv a l i d a t et h ea c t u a lp r e d i c t i o np o t e n t i a lo f t h em o d e l ,at e s ts e tc o m p o s e do f2 1c o m m o n l yu s e dc o m p o u n d so fp h a r m a c e u t i c a l 桂林工学院硕士学位论文 ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! 竺! ! ! ! ! ! ,! i l l e ! ! ! ! ! 竺! 竺! ! ! a n da n v i r o n m e n t a li n t e r e s ti sc a l c u l a t e dw i t ha c c e p t a b l es t a n d m dd e v i a t i o no f0 8 0 3 a n e wm e t h o df o re s t i m a t i o na n dp r e d i c t i o no f a q u e o u ss o l u b i l i t yo f o r g a n i c c o m p o u n d si sd e v e l o p e d b e s i d e s ,ac e r t a i nd a t a b a s eo fs t r u c t u r ed e c r i p t o r sa n d p r o p e r t i e so fo r g a n i cc o m p o u n d si se s t a b l i s h e df o rf u r t h e rq s a r q s p rr e s e a r c h k e yw o r d s :q u a t i t a t i v es t r u c t u r e p r o p e r t yr e l a t i o n s h i p ( q s p r ) ,o r g a n i cc o m p o u n d s a q u e o u ss o l u b i l i t y , m o d i f i e de s t a t ei n d e x ,m e d v - 1 3d e s c r i p t o r s i l l 桂林工学院硕士学位论文 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不 包含其他人已经发表或撰写过的研究成果,也不包含为获得桂林工学院或其 它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所 做的任何贡献均己在论文中作了明确的说明并表示了谢意。 签名:嘶日期:! 竺! 关于论文使用授权的说明 本人完全了解桂林工学院有关保留、使用学位论文的规定,即:学校有 权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全 部或部分内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密论文在解密后应遵守此规定) 签名:传! 熏导师签名 烨日期 瑚u 6 桂林工学院硕士学位论文 1 绪论 绝大多数化学物质都是由分子组成的。自十六世纪中叶,人们就知道分子 具有一定的结构,从那时起,建立起分子结构与其物化性质之间的因果关系就 成了化学家们努力的主要目标之一,这些努力也取得了相当的成果。定量结构 性质活性相关( q s a p u q s p r ) 研究就是随之发展起来的研究手段之,它将 化合物分子结构与其生物活性物化性质之间定量联系起来,一旦定量关系建 立,就可以仅由简单的分子结构估计那些没有测定或尚未合成的分子的相应性 质。由于q s a r q s p r 技术能快速、便捷地预测某些化合物的“未知”性质, 导致这项技术作为化学、生物、环境、药物等研究领域的重要工具因而受到越 来越多的重视和发展。 1 1 定量结构性质,活性相关研究概述 早在1 9 世纪,就有人开始设法建立化合物的理化性质与其结构的关系, 到了2 0 世纪初,人们普遍认为化合物的生物效应主要取决于它们的物理性质 【2 】,直至2 0 世纪6 0 年代,h a n s c h 3 年l lf r e e w i l s o n t 卅借助计算机技术,应用统 计理论开创了具有现代意义的q s a r q s p r 研究方法。这种研究结构和性质关 系的方法,其主要目的都在于解释和预测某些分子的性质,如药物化学家及环 境化学家所关心的相对药效,污染物活性等。此后,q s a r q s p r 的研究得到 了迅速发展,涌现出了许多新方法以及它们在各领域的应用1 5 。“,也正因为这 项技术的应用逐渐成为了一项新的研究热点,大量该领域的评述文章被发表和 关注【13 1 7 。 q s a r q s p r 的研究至今己呈现出一个“百家争鸣”的时期,即各种各样 的方法都应当去尝试、检验、讨论、修正、淘汰。也就是说,目前该方法研究 的核心仍然是方法学问题,其中包括化合物结构的描述方法,理论模型的推导 方法,函数关系的建立方法等等。这些方法形式多样,但都需以一个前提为基 础,即化合物结构( 结构描述符) 与活性之间存在函数关系( 式1 1 ) ,并且根 据这一函数关系可以外推至新的化合物: a p = , ( 分子结构) = f ( 结构描述子) ( 1 1 ) 桂林工学院硕士学位论文 式中的a 和p 分别代表分子活性( a c t i v i t y ) 与性质( p r o p e r t y ) 。 q s a r q s p r 研究步骤 q s a r q s p r 研究的第一步,是分子结构表征即分子结构的数字化,也称 结构参数化,这些数字化数据称为分予描述子或描述符。这一步可以说是将分 子结构与其活性联系起来的“桥梁”。第二步,应用特征筛选方法选择特征描述 符,这一步也被称为变量选择过程,通常使用的方法有偏最小二乘分析( p l s ) , 主成分分析( p e a ) ,遗传算法( g a ) 以及人工神经网络( a n n ) 等。第三步, 用筛选得到的变量与活性数据建立回归模型。第四步,验证模型,即在建立定 量构效相关模型后,用校验数据或“交互验证”方法检验模型,判断模型的稳 定性及预测能力。最后,根据q s a r q s p r 模型所阐明的构效关系的结果,为 设计、筛选或预测任意生物活性的化合物指明方向。 图1 1q s a r q s p r 研究过程 o s a 剐q s p r 研究的特点 目前的q s a r q s p r 研究主要呈现以下几个特点: 1 综合性;主要研究化合物分予结构与物化性质、生物活性之内定量函 数关系,因而它是一个覆盖了化学与物理学、生命科学的交叉学科点,而定量 结构性能活性研究发展至今,越来越多地借助于数理统计方法和计算机技术 的最新发展,所以要求研究者必须熟悉化学、物理学、生物学、数理统计和计 算机的有关知识。 桂林工学院硕士学位论文 2 理论性:早期的q s a r q s p r 研究往往比较注重定量结构性能活性相 关模型的预测能力,期望能得到具有良好统计量的模型。而最近的q s a r q s p r 研究则更注意定量模型的理论性,人们总是期望一个成功的运算模型,能从本 质上揭示和解释影响物质某种性质的本质因素,提示和描述生物活性的作用机 制,从而达到提高有用的生物活性,控制有害的生物毒性的根本目的。这种发 展趋势则要求描述化合物的参数更加全面、细致,物理意义更加明晰。 3 智能化:化合物的物化性质和生物活性,受到诸多因素的影响。化合物 的结构因素也是多种多样的,包括电子结构、立体结构和理化参数等等。其中 某些因素对特定的性质影响较大,而另一些因素则影响较小,其间的关系复杂 多样,当化合物结构范围宽时,要在化合物结构因素与某种性质之间建立满意 的运算关系必须借助于更为先进的多变量分析方法和计算机的自适应功能。因 此,主成分分析、因子分析、偏最小二乘回归、判别分析、聚类分析、模式识 别、模拟退火、神经网络、遗传算法等善于处理复杂问题的多变量优化分析方 法最近被越来越多地应用于q s a r j q s p r 研究,并辅以计算机的智能技术,促 使q s a r q s p r 研究向智能化发展。 4 程序化:一个q s a r q s p r 模型的建立往往是基于对大量化合物的分析, 包括化合物生物活性参数、化合物结构参数等等,还需从诸多参数中筛选对化 合物的特定性质具有显著影响的变量,参数的计算、分析工作十分繁杂,而且 容易出错。这样大规模的数据,仅依靠人工计算是不可想象并且难以实现的, 只能借助计算机程序化计算来完成。 5 实用化:随着工业的发展,越来越多的人工合成化合物进入生态环境, 这些化合物经过复杂的迁移、转化、归趋过程,最终达到一定的暴露浓度,对 生物圈包括人类产生各种各样的毒性效应。通过实验方法对化合物进行全面危 险性评价是一个费钱耗时的过程,而q s a r q s p r 既可对化学品的暴露水平作 出预测,又可对化学品的生物效应作出评价,为化学品危险性评价提供一种简 便实用的途径。其次,由于通过q s a r q s p r 研究可以发现并确定对化合物活 性起关键作用的化合物结构因素,因而对于定向合成高效低毒的新化合物具有 指导意义。此外,q s a r q s p r 是建立化学品性质、毒性数据库的一个必要组 成部分,化合物的化学性质、生物活性测试过程费钱耗时,建立q s a r q s p r 模型有助于从已经测定的数掘中最大限度地获取有用信息。此类模型的建立不 桂林工学院硕士学位论文 仅使得数据库具有预测功能,而且可以发现数据中偏离定量模型的“可疑数据”。 而这些“可疑数据”的发现往往又帮助和启示人们寻找一些更为重要的规律。 1 2q s a r q s p r 方法中的描述子 化合物结构是一个内涵很广的概念,它可以包含如下信息:对各种性质有 贡献的特殊功能基团的存在;分子中原子的空间位置和相互联系:化合物的电 子、立体结构和物理化学性质等。如何将一个个分子结构具体量化到它们的结 构编码? 这就需要借助分子描述子来实现分子结构表征,建立q s a r q s p r 中 化合物结构与性质活性之间的联系。获取分子中各种重要结构信息的分子结构 表征方法很多,主要包括物理化学描述子、量子化学描述子、拓扑描述予以及 3 d 描述子等。 物理化学描述子 理化参数的使用起源于h a m m e t t 和t a f t 的开拓性研究。h a m m e t t 研究的是 芳环取代基的电子效应,他引进了能表示取代基对反应性有贡献的参数。这些 取代常数已被证明能较合理地反映各种有机反应的电子效应。该方法的成功促 使t a f t 建立一个相似的立体参数西。从h a n s c h 开始,q s a r q s p r 研究中理 化性质的应用范围大大扩大了。最常见的物理化学参数包括电性参数、立体参 数、疏水性参数以及溶剂化自由能等。 取代基引起药物分子的物理性质的变化可以认为主要有三种:即电性、立 体性和疏水性。h a n s c h 等b 4 】提出如下假设:取代基对分子生物性质的影响是 由于上述某些或全部物理性质的变化引起的,并且取代基对生物效应( 以i c 表示) 的电性影响、立体效应影响以及疏水效应影响是彼此独立可加的,这些 假设为h a n s c h 方程的线性形式奠定了基础: l o g 石1 = a l o g p + b e s + p c r + d ( 1 2 ) 式中,口、b 、p 、d 为常数,p 为油水分配系数,是疏水性参数,西为立体效应 常数,d 为h a m m e t t 取代常数。可采用多重回归分析法拟合方程。在某些情况 下,许多类型的化合物的生物活性合l o g p 之刚并不服从线性关系。根据经验, h a n s c h 等将其拟合成抛物线方程式,以下式表示: 桂林工学院硕士学位论文 1 1 0 9 - 去= a l o g p b ( 1 0 9 p ) 2 + c e s + p c r + d ( 1 3 ) l 目前应用多元回归分析建立化合物生物活性与物理化学参数的相关性研究 已得到了广泛的应用,但它要求被研究的分子所显示的活性具有相同的作用机 理,因此只能适用于同系物,并且参数值必须设定适当的范围以保证统计真实 性。 量子化学描述子 借助计算机不断增长的超凡的计算能力,使得量子化学计算方法飞速发展, 为测定化合物的分子结构和电子结构性质提供了一个可靠的理论计算工具,由 量子化学方法计算得到的参数为探求分子结构和性质之间的合理关系提供了进 一步的理论依据。 量子化学计算方法有从头计算( a bi n # i o ) 方法和半经验量子化学计算方法, 由于半经验量子化学计算方法的计算速度比从头计算快成千上百倍,因而其在 量子化学参数计算方面的应用非常广泛。如果不刻意追求计算的精度,而仅仅 是计算化合分子的性质,并由此研究化合物结构与功能之间的关系,半经验量 子化学计算方法是一个很好的选择【18 1 。著名的m o p a c 软件就是计算量子化学 参数的常用工具之一。常见的量子化学参数有:( 1 ) 电性结构参数,包括最高 占据轨道能级e 1 4 0 m o 、最低未占据轨道能级既啪,原子静电荷、分子静电势、 键级等:( 2 ) 几何参数,包括原子间距、键角、二面角等;( 3 ) 分子形状参数, 包括分子体积、分子表面积等。 量子化学描述子可以定义分子整体或局部( 原子、碎片、取代基) 的形状、 化学键情况以及反应性等信息,有助于说明和解释所研究化合物的活性机制。 拓扑描述子 分子的许多性质受制于分子的拓扑结构( 原子的连接性) ,这些性质包括分子的 宏观热力学性质,如沸点、分子体积、折光率等,也包括分子的微观特性。许 多生物活性也可以由分子的拓扑加以解释。拓扑描述子直接产生于化合物的分 子结构,它是从化合物分子结构的直观概念出发采用图论的方法以数字来表征 分子结构。自首个拓扑描述予w i e n e r 指数( 1 9 4 7 ) 1 9 1 被提出以来,已经出现了 一 桂林工学院硕士学位论文 上百种拓扑描述子。由于拓扑描述子提供了一个简单易行的描述分子形状、大 小、支链以及环状结构、对称性的方法,并能直接由分子结构计算得到,它已 经成为q s a r q s p r 研究中应用最广,最有效的选择之一【2 “3 7 1 。为了便于比较 阅读,表1 1 概括了最常见的几种拓扑描述子和它们的定义。 3 d 描述子 分子的三维结构对生物活性具有重要意义。q s a r q s p r 研究中的3 d 描述 子一般借助于分子图形学加以表达,主要包括静电势、立体场、静电场、距离 几何( 相似性比较等) 、用不同物质的探针原子产生的静电、氢键、疏水性作用 力等。 著名的3 d q s a r 方法c o m f a ( c o m p a r a t i v em o l e c u l a rf i e l da n a l y s i s ,比 较分子场分析) 【50 】就是基于3 d 描述子的力场分析方法,它是目前应用最广且 最为成功的一种3 d q s a r 方法,并还在不断地发展完善之中1 5 卜53 1 。c o m f a 的 基本步骤为:首先选择有相同作用机制的一系列活性已知的化合物,优化其三 维结构,确定药效构象;其次按照一定的规则将化合物叠合在起,并在其周 围产生格点,使该网格能包容所有叠合的分子;第三,以小分子或基团作探针, 计算探针在每个格点上与每个化合物的立体作用能和静电作用能,这些能量组 成自变量矩阵;第四,用偏最小二乘回归( p l s ) 建立q s a r 模型:第五,用 三维等值线图显示计算结果,用不同的颜色直观表明化合物各部位立体或静电 性质的变化对活性的影响;最后用q s a r 模型预测新化合物的活性。常规 c o m f a 中立体场采用l e n n a r d ,j o n e s 6 - - 1 2 势,静电场采用c o u l o m b 势,其中 介电项采用l 一形式。探针原子采用印3 杂化的c + ,当探针原子受到的立体排 斥能和静电吸引能超过设定的阀值时,该网格点的场值设为阀值。近年来也有 将疏水场引入作为第三个场信息,以及针对不同的场采用不同的探针的做法。 事实上,研究表明,3 d 描述子中的静电能、立体能、疏水作用能与传统的物理 化学描述予中的结构参数a 瓜,1 0 扩有很好的相关性。 分子结构表征或分子结构描述予研究是一个相当广阔的领域。目前已出现 大量优秀的2 d 与3 d 结构描述子,它们都具有良好的模型估计与预测能力并被 广泛地应用于分子模拟的各个领域中。2 d 与3 d 方法各有优缺点,如传统的 桂林工学院硕士学位论文 表1 1 常见拓扑描述子 拓扑描述子定义 w i e n e r 指数( w i ) 1 9 1 渺( g ) = 三l ( s u m ( s u m ) ) ) ( ,。) 其中出为原子i l l j 间的拓扑距离 h o s o y a 指数p 8 n ,2 z ( g ) = p ( g ,足) ( 1 5 ) r = 0 其中k 为分子图形中的边数,p 侮,均为不邻接的边 的组合数 k a p p a 指数 3 9 , 4 0 1k = 2 1 p m a x l p m i n ( 。p ) 2 ( 1 6 a ) 2 k = 22 p m a x 2 p r a i n ( 2 p ) 2 ( 16 b ) 3 k = 4 3 p m a x 3 p m i n ( 3 只) 2 ( 1 6 c ) 分子连接性指数1 4 1 , 4 2 z = ( z y a 。” ( 1 7 a ) ( m o l e c u l a rc o n n e c t i v i t yi n d e x ) 。局= ( k 圪) 。” ( 1 7 b ) d he 蜘 其e e 圪z j , 攻分别是原子i j , 的项角度数 扩展w i e n e r 指数【4 3 1 f w = i ( i 一1 ) ( f 一2 ) ( f 一( 一1 ) ) 叩, ( 1 8 ) ( e x t e n d e dw i ) i = k - i 其中聩是距离为i 时的顶角对数 柔性指数4 4 】中= k 。2 k a( 1 9 ) ( f l e x i b i l i t yi n d e x );g e ea 为原子数,k 与。h 分别为一阶与二阶k a p p a 指数 电性状态指数【4 5 】 墨= ,+ , ( 1 1 0 ) r e s t a t ei n d e x ) 其中 为原子i 的蚓有状态值,4 如是对的扰动: i := l :一i 、d 2 :j 分子拓扑指数【4 6 】 m t i = e , ( 川) ( m o l e c u l a rt o p o l o g i c a li n d e x ) j :t 其中历是v ( a + d ) 的行矩阵,v 为顶角度数 h a r a r y 指数【4 7 】 h = ( 1 2 ) z z ( d ) ( 1 1 2 ) j = l2 = 1 其中d 为原子i 和j 之间的拓扑距离 d e t o u r 指数1 4 5 , 4 9 甜= ( 1 2 ) ( f ) ( 1 1 3 ) , j 其中f 为d e t o u r 矩阵中的元素 2 d q s a r 方法简单快速,其结果用一个方程便可以表达,而且可以用于多种生 7 一 桂林工学院硕士学位论文 物活性,而c o m f a 方法则可用于非同系物体系,其结果以三维图形显示,为 研究者提供直观指导,且不必担心缺乏参数。虽然从理论上讲,3 d 方法更接近 实际,应该更加优越,但就目前情况看,由于3 d 方法需要首先对分子结构进 行三维结构搜索并依据能量最低原理进行优化以获得优势构象或寻求生物活性 构象以及实施叠合策略,因此要构建有效的基于三维分子结构的3 d q s a r 模 型仍是相当困难和很耗时的。正因为如此,在发展3 d q s a r 技术的同时,许 多优秀的2 d - q s a r 方法仍在不断地改进,新的2 d q s a r 方法也在不断地提出。 事实证明,许多优秀的2 d 方法具有与复杂的3 d 方法一样的模型稳定性和可预 测性。因此,在生物信息学与化学信息学逐渐成熟的今天,优秀2 d 与3 d 方法 具有同样的生命力,正在各自发挥自己强有力的功能。 1 3 本文立项依据及主要研究内容 本文采用基于分子电性距离矢量的二维拓扑描述子研究了若干有机化合物 的结构与水溶性之间的定量关系。 水溶解性是有机化合物最重要的物化性质之一【55 剐。有机物的水溶解性决 定了污染物在环境中的分布、迁移、降解及归趋,决定了药物分子在体内的吸 收、转化、代谢和最终的生物活性和药效,可以说,绝大多数有机物的物化性 质与生物活性都跟其水溶解性有关。因此,掌握这一性质及其规律对于了解有 机物的环境及生物效应具有极为重要的意义。尤其是近年来,随着组合化学和 高通道筛选( h t s ) 技术的发展,要求对短时间内合成的成百上千个分子迅速 作出分析评价【5 7 】。用传统的方法进行合成和测定每一化合物的性质数据是很难 实现的。因此,用方便、快速的定量结构一性质模型估计和预测有机物的水溶 解性成为各种方法中的首选 5 8 1 。 至今已提出了很多用定量结构一性质模型预测水溶解性的方法【5 ”j ,这些 研究一般都是采用各种参数建立多元线性回归模型或人工神经网络模型进行预 测。根据模型所使用的参数不同,这些方法大致可分为三类:( 1 ) 借实验参数 建立模型 5 9 , 6 0 1 ;( 2 ) 基团贡献方法【6 4 1 ;( 3 ) 基于结构描述子分析的方法【6 5 州】。 第1 类方法通常是从个或若干个由实验测得的物化性质估算水溶解性,如水 一辛醇分配系数、熔沸点以及摩尔体积等。显然,由于受到实验数据的限制, 此类方法不适用于预测那些尚未合成或很难分离提纯的化合物。第2 类方法通 桂林工学院硕士学位论文 过分子中某基团( 官能团) 对分子性质的影响建立预测模型。这种方法需要一 个较大的化合物库获得到各官能团对性质的贡献规律,有时,若分子中含有基 团贡献模型中未定义的基团,会存在预测误差较大的现象。第3 类方法借助统 计方法建立各种描述子与性质之间的相关关系,其中描述子可以直接由分子的 二维或三维结构计算得到。由于不受实验数据的限制且计算方便快速,使该法 成为预测有机物水溶解性最有效的手段之一。目前,此类方法尚存在的主要不 足之处在于:模型中的描述予过于复杂,物化意义不明确,描述子与水溶解性 之间的关系不够直观,如e n g k l i s t 等人【7 1 1 建立了含有6 3 个物化及拓扑描述子的 模型,使计算过于复杂。此外,目前尚未发现能够准确预测复杂药物分子水溶 解性的通用模型蟑”。 分子电性距离矢量( m o l e c u l a re l e c t r o n e g a t i v i t y d i s t a n c ev e c t o gm e d v ) 是 基于分子二维拓扑结构,利用经化学键长修饰的分子距离矩阵以及分子个非氢 原子的相对电性提出的矢量型分子描述子。这个描述子对有机物分子包括药物 分子有高的结构分辨率和性质活性的良好相关性,已用于有机化合物的沸点、 密度、折光指数、临界温度和压力、表面张力、摩尔体积与折光率、c 1 3 核磁 共振波谱化学位移、色谱保留指数等多种物理化学性质与生物活性的估计与预 测 7 卯。本文的目的是,研究分子电性距离矢量与有机物水溶解性之间的定量关 系,构建描述子计算简单、物化意义明确、且具有较高预测能力的模型,建立 一批有机物分子结构参数和性质数据库,为有机物性质的预测、筛选和评估提 供新方法和技术。 全文共分为5 章: 第l 章为绪论,概述了q s a r q s p r 研究进展及分子结构表征中常用的描 述子以及本文的研究背景和主要内容。 第2 章介绍本研究中使用的矢量描述子及变量优化的计算方法。 第3 章和第4 章是应用部分。第3 章用修正的e 一状态指数对1 5 6 个含有9 种单官能团的有机物进行了q s p r 研究,建立了修正e 一状态指数与一系列有机 物水溶解性之间的定量预测模型。 第4 章应用m e d v - 1 3 描述子对一批含有各种结构与官能团的1 2 9 0 个有机 化合物的水溶性进行了q s p r 研究,分别以p l s 和v s m p 优化方法进行变量优 化,建立了较通用的有机物水溶解性的定量预狈4 模型,并以若干典型药物分予 桂林工学院硕士学位论文 与环境有机物对该模型的预测能力进行了检验。 第5 章为结论。 1 4 主要创新点 本文主要应用分子电性距离矢量对有机物水溶解性定量结构相关做了系统 研究。 ( 1 ) 首次提出一种新的修正e 状态指数并用于有机物水溶解性q s p r 研 究,证明了修正e 一状态指数能良好表征一系列单官能团化合物的分子结构,具 有较高的结构分辨性和良好的模型相关性,能准确估计和预测该系列化合物的 水溶解性。 ( 2 ) 建立了分子电性距离矢量m e d v - 1 3 与一系列复杂有机物水溶解性之 间的定量关系,为有机物水溶解性的预测、筛选和评估提供新方法和技术。 ( 3 ) 建立了一批有机物分子结构参数和性质数据库。 桂林工学院硕士学位论文 2 计算方法 本章将介绍在第3 章与第4 章中使用的重要算法和原理。根据这些原理编 制的计算程序g q s a r f ( 本研究室编制) 是本研究使用的计算软件。 2 1 矢量描述子 “矢量型结构描述子”或“结构描述予矢量”,用来特指那些由多个等价的 标量描述子或单数值描述子共同表征一个分子结构的描述子集合【75 1 。这里的 “等价”特别重要,那些从有关参数库中选择的多个产生途径不同进而编码不 同结构特征信息的描述子集合不是矢量型的。比如由编码不同结构信息的有关 拓扑指数与有关量子力学描述子一起表征一个分子的结构,这样的描述子集合 就不是矢量描述子。而刘树深等提出的分子电性距离矢量【7 6 7 可中含有的描述子 全部基于分子二维距离矩阵,都是以同样的计算方法从非氢原子的相对电性和 原子之| t j 的相对距离而得到的,是矢量描述子。 2 1 1 原子类型,原子属性和原子固有状态 首先引入m e d v 4 1 7 6 - 7 s 1 、m h d v l 7 9 1 年 m e d v 1 3 i s o , s 1 1 研究中原子类型、原 子属性和原子固有状态的概念。 原子类型( a t o m i ct y p e ) 是同时考虑非氢原子本身和与其相连的原子的元 素特性定义的。在本研究中的“原子类型”定义为与该原子相连的非氢原予个 数加上该原子的识别特性或识别号( i d ) 。各非氢原子的识别号定义为:i d = 4 f v 一4 ) ,式中v 为价电予层电子数。按照上述定义,划分了1 3 种原子类型。 原子属性( a t o m i ca t t r i b u t e ) 是一个反映非氢原子在分子中是通过什么样的 共价键与其它非氢原子相连的概念,它是一个表征处于化学环境中的非氢原子 所属元素原子特征以及在分子中所属化学键的特性。本研究中的原子属性是参 照h a l l 和k i e r 提出的e 状态指数【4 5 】中原子类型方案划分的,对含有c 、n 、0 、 s 、p 、f 、c l 、b r 、i 等非氢原子的药物分子所属原子属性进行划分,共计4 3 类。 原子固有状态( d 定义为: 桂林工学院硕士学位论文 ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! _ _ _ _ _ _ _ _ _ _ _ _ - _ _ _ _ _ - _ 一1 1 1 - - _ _ i l _ _ l - _ i - _ - 一 ,= v 4 ( ( 2 , ) 2 占+ 1 ) 8( 2 1 ) 式中v 是原子价电子层的电子数,”是该原子价电子层所属主量子数,和j 是 原子在不同分子环境中构成不同共价键时的分子连接性j 值: 6 = a h , 5 ”= o + t c h ( 2 2 ) 式中a 和万分别是该原子参与盯轨道和7 轨道成键的电子数;h 是与该原子相 连的氢原子个数。由于孤对电子没有参与共价键的形成,因而未计入矿中。也 正因为如此,同一周期中与非氢原子形成相同叮键和石键的各元素原子属性( 比 如一c h 3 ,一n h 2 ,一o h 和一f 等) 将具有相同的和d 值。为使处于同一周期不 同价电子状态的原子具有不同的固有状态,值,引入了系数( v 4 ) “2 。由上可知, 原子固有状态,是与原子在分子中的具体化学环境即参与形成的化学键类型及 数日密切相关的。定义原子属性概念的丛本朋则是:相同原予倒性具有榭l i 日, 值,不同原子属性具有不同,值。 1 3 种原子类型、4 3 种原子属性及对应的原子固有状态值( ,) 见表2 1 。 表2 11 3 种原子类型,4 3 个原子属性和原子固有状态 原子 原子 原子固有 原子 原子 原子剖有 原子8 原子 类型属性状态类型属性 状态, 一c h 3 112 0 0 0 0 n - 7 2 3l0 8 8 2 一c h r 221 5 0 0 0= n h52 433 5 4 l c h c ( 4 4 i2 5 0 0 = - n5 2 644 7 2 1 = c h 2 l53 0 0 0 0 一n h 5 2 727 9 5 i = c h 262 0 0 0 0,n 一62 81 9 5 6 6 = c s ; l i3 411 3 4 0 一c p -74 2o8 6 9 6 一n h 2 52 1 22 3 6 1p - k ;v = 1 ,2 ,3 ,9 1 )( 2 4 ) e k i 自“ 式中或f 是各非氢原子原子类型。由式( 2 4 ) 可知,输入每一个药物分子结构 编码后,都可以得到9 1 个等价的矢量描述子( 表2 2 ) ,这些等价矢量描述予经 过预处理之后在下一步的变量选择过程中作为原始变量继续优化。 _ - l卢2= 31 - - 4忙51 - 忙7- - 8 。= 9 _ - 1 0- _ 1 1_ - l2卢1 3 k = - l 1234s 6789 1 01 11 2l3 k = - 21 4151 61 71 81 92 02 12 22 32 42 5 k = - 32 62 72 82 93 03 l 3 2 3 33 43 5 3 6 k = 43 73 83 94 04 l4 24 34 44 54 6 k = - 54 74 84 95 05 】5 25 3 5 45 5 k = 65 65 75 85 96 06j 。6 26 3 l - - - 76 46 56 66 76 86 9 7 0 k = 8 7j7 27 37 47 57 6 女z 97 77 87 98 08 i t = j 08 28 38 48 5 k = l l8 68 78 8 七= 1 28 99 0 尼= 1 39 1 桂林工学院硕士学位论文 2 2q s a
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年教师招聘之《小学教师招聘》通关提分题库(典优)附答案详解
- 演出经纪人之《演出经纪实务》综合提升练习试题附参考答案详解ab卷
- 教师招聘之《幼儿教师招聘》考前冲刺测试卷附参考答案详解【典型题】
- 教师招聘之《小学教师招聘》能力提升题库附答案详解(a卷)
- 教师招聘之《小学教师招聘》试题预测试卷【典型题】附答案详解
- 2025呼伦贝尔农垦那吉屯农牧场招聘笔试及完整答案详解
- 2025年教师招聘之《小学教师招聘》题库检测试卷附参考答案详解(综合题)
- 押题宝典教师招聘之《小学教师招聘》试题及参考答案详解【培优】
- 教师招聘之《小学教师招聘》考前冲刺训练试卷含完整答案详解(全优)
- 2025内蒙古呼伦贝尔农垦集团有限公司社会招聘笔试备考附答案详解(突破训练)
- 口腔科消毒管理制度
- DB31/T 1052-2017临床核医学工作场所放射防护与检测评价规范
- 货币互换协议书
- 航运企业船员安全培训及宣传制度
- 高校教师命题能力培养机制研究
- GB/T 37507-2025项目、项目群和项目组合管理项目管理指南
- 粪菌移植技术进展
- GB 14930.2-2025食品安全国家标准消毒剂
- 《食品专业英语》课件-1 Food+Processing-+An+Overview
- 2025年人教部编版小学三年级语文上册全册单元测试题及答案(全套)
- 全过程跟踪审计实施方案
评论
0/150
提交评论