(分析化学专业论文)酚类化合物水生毒性的qsar研究.pdf_第1页
(分析化学专业论文)酚类化合物水生毒性的qsar研究.pdf_第2页
(分析化学专业论文)酚类化合物水生毒性的qsar研究.pdf_第3页
(分析化学专业论文)酚类化合物水生毒性的qsar研究.pdf_第4页
(分析化学专业论文)酚类化合物水生毒性的qsar研究.pdf_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

桂林理工大学硕士学位论文 摘要 酚类化合物由于其在环境中残留期较长,有较强的生物富集作用,对环境污染造成的 危害较大,尤其表现为对水生生态系统的影响和破坏。为了研究苯酚及其衍生物对环境生 物的毒性作用,本文应用多种结构描述子对酚类化合物的分子结构进行表征,建立了具有 较高预测能力的生物毒性与结构描述子的q s a r 模型。 1 利用d r a g o n 描述子表征了3 1 个苯酚衍生物和2 3 个邻苯二酚的分子结构,v s m p 选择最佳描述子,建立了与老鼠肝细胞半数致死浓度的对数值之间的3 变量q s a r 模型, 采用外部样本验证和y - r a n d o m i z a t i o n 检验进行了验证,模型的相关系数,分别为o 9 3 8 4 和0 9 6 8 0 ,交叉验证系数g 分别为0 9 2 3 2 和0 9 5 6 1 。结果表明:影响单酚化合物毒性的 主要结构因素为分子质量,影响邻苯二酚毒性的主要结构因素是碳氧双键,并建立了全部 样本的q s a r 模型。 2 利用量子化学描述子和取代基位置描述子表征了4 1 个烃基苯酚衍生物分子结构, v s m p 选择最佳变量,建立了与梨形四膜虫的半数致死浓度负对数值之间的单变量和2 变量的q s a r 模型,并采用外部样本验证法和y - r a n d o m i z a t i o n 检验进行了验证,模型具 有较好的估计能力和稳定性( 严o 9 4 3 4 ,r m s e = o 2 5 4 8 ,q = 0 9 1 7 0 ,r m s v - - 0 3 0 6 6 ) 。结 果表明:影响烃基酚化合物毒性的主要结构因素为极化率。 3 利用分子全息方法和比较分子力场方法对2 5 0 个苯酚衍生物建立了模型,h q s a r 模型的主成分数为6 ,9 2 为0 6 2 6 ,姬为o 5 1 3 ,模型的相关系数户为0 7 3 5 5 ,标准误差s 为0 4 3 1 3 :三维模型主成分数为9 ,q ? 为0 6 1 7 ,拟合相关系数,为0 9 0 0 ,标准偏差s 为0 2 6 7 。结合色码图探讨了化合物二维信息中各基团对化合物的活性的综合贡献以及苯 酚衍生物的基团对四膜虫的毒性的影响:根据对c o m f a 力场三维等高图可以直观的反应 此类化合物活性与其结构的关系。 4 利用量子化学描述子和取代基位置描述子表征了2 1 个苯酚化合物的分子结构, v s m p 选择最佳描述子,建立了3 变量多元线性回归q s a r 模型,并采用外部样本验证 和y r a n d o m i z a t i o n 检验进行了验证,模型具有一定的估计能力( r = 0 7 7 4 2 ,r m s e = o 3 2 7 6 ) 和稳定性( q = 0 6 5 5 6 。r m s v - - - 0 3 9 0 8 ) ,并讨论了分子结构对毒性的影响。通过与其它生物 指示物毒性的对照,发现青海弧菌q 6 7 对苯酚类化合物的毒性敏感度较好,并探讨了苯 酚类化合物毒性生物指示物之间的定量活性和活性之间的关系q a a r s 。 桂林理工大学硕士学位论文 关键词:定量结构活性相关( q s a r ) ;基于预测的变量选择与模型化方法( v s m p ) ; d r a g o n 描述子;量子化学参数;分子全息( h q s a r ) ;比较分子力场( c o m f a ) : y - r a n d o m i z a t i o n 检验 桂林理工大学硕士学位论文 a b s t r a c t p h e n o l sa r ek n o w na sc l a s s i cp o l l u t a n t sd u et ot h er e s i d u e si nt h ee n v i r o n m e n tf o rl o n g p e r i o d sa n dt h eb i o c o n c e n t r a t i o n si nt h ew a t e r , t h ed a n g e rc a u s e dt ot h ee n v i r o n m e n t a lp o l l u t i o n i sr e l a t i v e l yg r e a t ,e s p e c i a l l ys h o w na st h ei m p a c to na q u a t i ce c o s y s t e m i no r d e rt os t u d yt h e t o x i c i t yo fp h e n o l s ,u s i n gt h ev a r i o u ss t r u c t u r ed e s c r i p t o r st oc h a r a c t e r i z et h es t r u c t u r e so f p h e n o l s ,s o m eh i 曲q u a l i t i e sq s a a m o d e l sb e t w e e nt h et o x i c i t yo fo r g a n i s m sa n ds t r u c t u r e d e s c r i p t o r sw e r eb u i l t 1 u s i n gd r a g o nd e s c r i p t o r st oc h a r a c t e r i z et h es t r u c t u r eo f3 1p h e n o ld e r i v a t i v e sa n d2 3 c a t e c h o l sa n dt h ev s m pm e t h o d ,v a r i a b l es e l e c t i o na n dm o d e l i n gb a s e do np r e d i c t i o n ( v s m p ) , t os e l e c tt h eo p t i m a ld e s c r i p t o r s ,a3 - v a r i a b l el i n e a rm o d e lb e t w e e np h e n o l sa n dt h el o g a r i t h m o fc o n c e n t r a t i o nt oi n d u c e5 0 c y t o t o x i c i t yo fi s o l a t e dr a th e p a t o c y t e si n2h o u rw a sb u i l t r e s p e c t i v e l y u s i n gt h ee x t e m a ls a m p l ev a l i d a t i o n a n dam e t h o dc a l l e dy - r a n d o m i z a t i o nt o v a l i d a t et h em o d e l s ,t h ec o r r e l a t i o nc o e f f i c i e n t s ( 力o fb e s tm o d e lw e r eo 9 3 8 4a n d0 9 6 8 0 ,a n d l e a v e o n e o u t ( l 0 0 ) c r o s s v a l i d a t i o nc o r r e l a t i o nc o e f f i c i e n t s ( q ) w e r eo 9 2 3 2a n d0 9 5 61 t h e r e s u l ts h o w e dt h a tt h em a i ns t r u c t u r ef a c t o r si n f l u e n c i n gt h el o g a r i t h mo fc o n c e n t r a t i o nt o i n d u c e5 0 c y t o t o x i c i t yo fi s o l a t e dr a th e p a t o c y t e sa r ea t o m i cm a s sf o rp h e n o l sa n dd o u b l e b o n do fc a r b o nt oo x y g e nf o rc a t e c h o l s ,i na d d i t i o nt h em o d e lf o ra l ls a m p l e sw a sb u l i t 2 u s i n gq u a n t u mc h e m i c a ld e s c r i p t o r sa n ds u b s t i t u t i n gg r o u pp o s i t i o nd e s c r i p t o r st o c h a r a c t e r i z et h es t r u c t u r e so f41a l k y lp h e n o l sa n dv s m pt os e l e c tt h eo p t i m a ld e s c r i p t o r s ,a t w ov a r i a b l e sm o d e lw a sd e v e l o p e df o rt o x i c i t yo f41a l k y l p h e n o l st ot e t r a h y m e n ap y r i f o r m i s u s i n gt h ee x t e m a ls a m p l ev a l i d a t i o na n dam e t h o dc a l l e dy - r a n d o m i z a t i o nt ov a l i d a t et h e m o d e l s ,t h eb e s tm o d e ls h o w e dag o o de s t i m a t i o na b i l i t y ( r - - 0 9 4 3 4 , r m s e = o 2 5 4 8 ) a n da h i 曲s t a b i l i t y ( q = 0 9 1 7 0 ,r m s v - 0 3 0 6 6 ) t h e r e s u l ts h o w e dt h a tt h ep o l a r i z a b i l i t yw a st h em a i n s t r u c t u r ef a c t o ri n f l u e n c i n gt h et o x i c i t yo fa l k y l p h e n o l s 3 u s i n gt h eh o l o g r a p h i cq s a g ( h q s a r ) t e c h n o l o g y a n dt h ec o m p a r a t i v em o l e c u l a r f i e l da n a l y s i s ( c o m f a ) i n3 d - q s a rt ob u i l dt h em o d e lo f2 5 0p h e n o ld e r i v a t i v e s ,t h r o u g h p l sa n a l y s i s ,t h en o n c r o s sv a l i d a t i o nc o e f f i c i e n tri sr e s p e c t i v e l y0 7 3 5 5a n d0 9 0 0 ,t h e c r o s s 。v a l i d a t i o nc o r r e l a t i o nc o e f f i c i e n tq 2i sr e s p e c t i v e l y0 6 2 6a n d0 6 1 7 ,a n dt h en u m b e ro f p r i n c i p a lc o m p o n e n t si sr e s p e c t i v e l y6a n d9 t h e i rt o x i c i t ym e c h a n i s mw a s s t u d i e db yv i s u a l c o l o rc o d i n go ft h eh q s a rt e c h n i q u e t h ec o m f aa n a l y s e so nt h es t e r i cf i e l d sa r o u n d i i i 桂林理工大学硕士学位论文 m o l e c u l e si n d i c a t et h a tt h es t e r i ce f f e c t so fs u b s t i t u e n t sp l a ya ni m p o r t a n tr o l ei nt h et o x i c i t yo f p h e n o l s 4 u s i n gq u a n t u mc h e m i c a ld e s c r i p t o r sa n ds u b s t i t u t i n gg r o u pp o s i t i o nd e s c r i p t o r s t o c h a r a c t e r i z et h es t r u c t u r e so f21p h e n o l sa n dv s m pt os e l e c tt h eo p t i m a ld e s c r i p t o r s ,al i n e a r m o d e lb e t w e e nn e g a t i v el o g a r i t h mo fh a l fe f f e c tc o n c e n t r a t i o no fq 6 7 ( p e c s o ) a n dt w o d e s c r i p t o r s w a s b u i l t u s i n g t h ee x t e r n a l s a m p l e v a l i d a t i o na n dam e t h o dc a l l e d v r a n d o m i z a t i o nt ov a l i d a t et h em o d e l s ,t h eb e s tm o d e ls h o w e dag o o de s t i m a t i o na b i l i t y ( r - - 0 7 7 4 2 ,r m s e = o 3 2 7 6 ) a n dah i 曲s t a b i l i t y ( q = 0 6 5 5 6 ,r m s v - - 0 3 9 0 8 ) q u a n t i t a t i v e a c t i v i t y - a c t i v i t yr e l a t i o n s h i p sw i t ht h et o x i c i t yo ft h ec h e m i c a l st oo t h e rs p e c i e s ( t e t r a h y m e n a p y r i f o r m i s ,v i b r i of i s c h e r i ,p i m e p h a l e sp r o m e l a s 。c h l o r e l l av u l g a r i s a n dt h et a d p o l er a n a j a p o n i c a ) s h o w e ds t r o n gr e l a t i o n s h i p s ,a l t h o u g hs o m ed i f f e r e n c e sr e s u l t i n gf r o m d i f f e r e n t p r o t o c o l sw e r ee s t a b l i s h e d ,e s p e c i a l l yv i b r i oq i n g h a i e n s i ss p - - q 6 7w a s b e t t e rs e n s i t i v eo nt h e t o x i c i t yo fp h e n o l s k e y w o r d s :q u a n t i t a t i v es t r u c t u r e a c t i v i t yr e l a t i o n s h i p s ( q s a r ) ;v a r i a b l e s e l e c t i o na n d m o d e l i n gb a s e do np r e d i c t i o n ( v s m p ) ;d r a g o nd e s c r i p t o r s ;q u a n t u mc h e m i c a ld e s c r i p t o r s ;t h e h o l o g r a p h i cq s a r ( h q s a r ) ;t h ec o m p a r a t i v e m o l e c u l a rf i e l da n a l y s i s ( c o m f a ) ; y - r a n d o m i z a t i o nv a l i d a t i o n i v 研究生学位论文独创性声明和版权使用授权书 独创性声明 本人声明:所呈交的论文是本人在导师指导下进行的研究工作及取得的研 究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含他 人已经发表或撰写过的研究成果,也不包含为获得其它教育机构的学位或证书 而使用过的材料。对论文的完成提供过帮助的有关人员已在论丈中作了明确的 说明并表示谢意。 学位论文作者( 签字) :量! 监j 庭i 签字日期:趟:么 学位论文版权使用授权书 本学位论文作者完全了解( 学校) 有关保留、使用学位论文的规定,有权保 留并向国家有关部门或机构送交论文的印刷本和电子版本,允许论文被查阅和 借阅。本人授权( 学校) 可以将学位论文的全部或部分内容编入有关数据库进行 检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。同时授权 中国科学技术信息研究所将本学位论文收录到中国学位论文全文数据库,并 通过网络向社会公众提供信息服务。( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:五观砷 签字日期:呷年f 月f 1 日 新擗多幽杪 签字日期易rt1 日 桂林理工大学硕士学位论文 第1 章绪论 1 1 酚类化合物的水生毒性研究意义、国内外研究现状 自然界的许多过程都会产生酚。例如,动植物的体内代谢过程,动植物残体的生物 降解过程,及粪便和含氯有机物的生物分解过程,都会产生一定量的酚类化合物。这与芳 香化合物被微生物降解时总是先生成邻苯酚,然后再继续降解的特点有直接的关系。随着 工业的发展,酚类化合物作为一种有机化工和农药制造中常见的反应物和中间体被广泛使 用。含酚废水大量的排放和含酚农药过量的使用导致了酚类化合物对环境造成了严重污 染。世界各国对于酚类化合物的环境污染和生态效应都给予了普遍的关注和高度的重视。 美国在7 0 年代中期就将1 1 种酚类化合物列入环境优先控制污染物黑名单,而我国在8 0 年代末提出了中国的环境优先污染物,其中包括了6 种酚类化合物,分别为苯酚、间苯酚、 2 ,4 二氯酚,2 ,4 ,6 三氯酚、五氯酚和对硝基酚旧1 。 酚类化合物在环境中经过复杂的迁移、转化和归趋过程,最终达到一定的暴露浓度, 对生物圈包括人类产生各种各样的毒性效应。酚类化合物对生态系统的毒性主要是由于酚 类化合物易溶于水,进入水体后主要残留在水中,并且其在环境中残留期较长,在沉积物 和生物体内都有一定的富集作用,所以几乎对一切生物个体都有毒害作用。尤其是苯酚分 子被氯取代后,水溶性下降,脂溶性相应增强,且氯代程度越高,在生物体内的累积性也 越显著,有较强的生物富集作用,对环境污染造成的危害较大口1 。毒性主要表现为对水生 系统的污染,会直接影响水的饮用和水产养殖,还可强烈地抑制水生生物的自然生长速度。 水体受酚污染后,会严重影响鱼类、贝类、海带等水生生物的产量和质量。酚还能大大抑 制水体中微生物和藻类的生长和繁殖,从而影响水体生态系统的平衡。有时甚至使它们停 止生长,对生态环境产生严重后果。 面对环境污染程度的不断加剧,能否对恶化的污染趋势加以控制,首要的问题是要对 优先控制污染物对水生物的毒性效应和作用机制进行分析。对于化合物毒性测定通常会导 致费用昂贵,耗时多。此外,毒性测定应考虑多种环境和所有生物的相互作用与生物体的 生态系统,数据往往不易获得且有一定的局限性。因此,借助定量结构活性相关( q s a r ) 技术来研究与预测酚类化合物对水生生物的毒性,将有效地降低测试成本,并更好地帮助 理解导致酚类化合物致毒的结构因素。 有机化合物定量结构与活性相关( q u a n t i t a t i v es t r u c t u r e a c t i v i t yr e l a t i o n s h i p s ,q s a r ) 是指有机污染物分子结构与其生物活性之间的定量关系。其中“生物活性”一般指有机毒 桂林理工大学硕士学位论文 物对不同物种不同生理生化指标的毒性,如急性毒性、亚急性毒性、酶抑制毒性、生殖和 遗传毒性、免疫毒性、发育毒性、神经毒性等。2 0 世纪初6 0 年代,h a n s c h 等人为有机 物定量结构一活性相关研究做出重要贡献,借助计算机技术建立的结构一活性关系表达式, 标志着q s a r 时代的开始。2 0 世纪7 0 年代以来,由于对进入环境的大量有机化学品的生 态风险性评价的需要,q s a r 开始在环境科学中得到广泛的应用,并得到迅猛发展。 许多环境科学研究者通过各种有机污染物结构一活性关系的研究,建立了多种具有较 强预测能力的环境模型,对已进入环境的污染物及尚未投放市场的新化合物的生物活性和 毒性乃至其环境行为进行了成功的预测和评价,为发展污染物的控制和阻断技术以及风险 削减技术提供了理论指导,为新化合物的风险评价和筛选提供了基础数据。在2 0 0 3 年, 国际知名刊物e n v i r o n m e n t a lt o x i c o l o g ya n dc h e m i s t r y 的2 2 卷第8 期作为q s a r 专刊刊出 了2 3 篇q s a r 的综述性文章,涵盖有机化合物的物理化学性质、环境归趋、生物活性及 生态效应等方面的内容,集中而详细地介绍了q s a r 在环境领域的发展和应用。随着计 算机技术的发展和应用,从最初作为定量药物设计的一个研究分支领域发展起来,扩展到 有机化学、药物化学、环境化学、计算化学、农药、生物信息学等学科的前沿课题,q s a r 方法成为了药物分子设计与药物评价,有机污染物毒性预测与风险评价中不可缺少的重要 技术。美国有毒物质及疾病管理局,美国环保局哺础及美国食品与药品管理局等政府部门 己经承认并接受了q s a r 的活性预测数据和结果,并将其作为确定有机污染物优先等级、 进行有毒有机污染物的危险性评价和管理的决策依据,欧盟的一些国家和加拿大也拟将 q s a r 方法用于有机化合物的评价和管理。 根据有机污染物q s a r 研究建立的模型,可以对目标化合物的环境行为和生态毒性 进行预测和评价,从而为进一步的完全评价和化合物的筛选提供必要的基础数据;此外, 根据其研究结果,结合化学和生物学等方面的相关知识,可以探求有机污染物与环境的相 互作用规律,及其对生物体的毒性作用机理,从而为发展有机污染物的控制和削减技术提 供理论指导。 目前,有关酚类化合物水生毒性的q s a r 研究已经取得了很多进展,也建立了一些 比较成功的模型。苏丽敏等陋1 用q s a r 模型预测了苯酚类化合物对发光菌的联合毒性;星 炯浩等阳3 通过逐步回归建立了卤代酚对水生梨形四膜虫毒性的q s a r 模型。各国研究者通 过构建了包括二维、三维、量子化学、量子力学、物理化学参数等大量的分子结构描述符, 例如刘征涛等阻町通过分子连接性指数建立了烷基酚对发光菌毒性的q s a r 模型;l e e 等 通过多元线性回归建立了酚类化合物与辛醇水分配系数的相关关系;z h e n g 【1 2 j 等通过逐 步回归建立了氯代酚类化合物的毒性与一些量子化学参数的相关关系;r e i s 等n 朝采用一 些半经验的量子化学参数建立了4 1 个酚类化合物的多元线性回归q s a r 模型;d u c h o w i c z 等口钉通过多元线性回归建立了酚类化合物与拓扑,几何,及电子的分子描述符的相关关系。 桂林理工大学硕士学位论文 不同的结构描述符表征不同的结构信息,但是对于这些描述符与化合物毒性之间的关系并 不是很明确,分析各描述子与酚类化合物毒性关系,从结构上探讨影响毒性的因素仍然很 有必要。 随着分子结构描述符数量的增加,对于变量筛选的工作就显得尤其重要。各研究者通 常是利用某一类描述符通过逐步回归、最佳子集等方法挑选部分最适合的描述符建立模 型,但是随着描述符的增加,这些方法已经越来越难以应对。于是各种优化算法如更换方 法n 制,主成分分析口5 1 ,遗传算法n 引,k 最近邻n7 1 ,等方法引入到描述符的挑选,这些方法 理论上能够找到最佳子集组合,但实际上没有办法确定找到的子集即为最佳,因此变量选 择的研究一直都是q s a r 研究中的热点。模型的建立也发展了多种方法,线性建模常见 的有多元线性回归和偏最小二乘回归,非线性建模常见的有人工神经网络n 8 3 和支持向量机 回归9 l ,不同的模型构建方法各有优劣,而对模型的验证仍然没有一种较好而且统一的方 法。发展新的模型验证工具,建立快速经济的毒性测试方法和大尺度变量选择方法都是当 前研究的热点。通过对未知化合物毒性进行预测,为发展相应的污染系统防治技术作好理 论准备。因此,如何有效评估和预测酚类化合物的水生毒性仍需要深入的研究。 1 2 本文研究内容 本文在研究与分析文献方法优劣基础上,构建了多种不同的分子描述子来进行表征酚 类化合物的结构,结合v s m p 的方法,系统深入地研究酚类化合物的水生毒性与分子结 构之间的定量关系,并采用y - r a n d o m i z a t i o n 检验和外部样本检验对模型的可靠性和预测 能力进行了验证。选择了老鼠肝细胞,梨形四膜虫,q 6 7 发光菌,绿藻,弧菌,鲦鱼,蝌 蚪和l 1 2 1 0 癌细胞等多种生物指示物的半数抑制生长浓度或者致死浓度作为环境毒性参 数,研究建立评估与预测苯酚衍生物环境毒性的q s a r 模型并深入讨论影响苯酚衍生物 毒性的主要结构因子。主要研究内容如下: 采用d r a g o n 描述子表征了5 1 个苯酚衍生物的分子结构,并建立了分子结构与老鼠肝 细胞半数致死浓度之间的定量构效关系,得到了多元线性回归模型,考察了结构与毒性之 间的关系: 采用量子化学参数表征了4 1 个烃基酚类化合物的分子结构,建立了分子结构与四膜 虫的半数致死浓度之间的多元线性回归模型,研究了化合物结构与毒性之间的关系。 对2 5 0 个苯酚衍生物进行二维和三维结构描述子的表征,并建立了分子结构对梨形四 膜虫的半数致死浓度之间的偏最小二乘统计模型,研究了不同结构碎片及三维结构对毒性 的影响: 以2 1 个酚类化合物为研究对象,应用量子化学参数表征分子结构,建立了量子化学 桂林理工大学硕士学位论文 描述子对青海弧菌q 6 7 的半数效应浓度的多元线性模型,并对8 种不同的指示生物的毒 性之间考察了其定量活性与活性q a a r s 之间的关系,说明了同一种酚类化合物对不同指 示生物的毒性敏感程度。 1 3 本文研究路线 为了研究方便,将本文的技术路线列于图1 1 。 图1 1 本研究技术路线图 对于所研究的化合物,首先利用化学软件c h e m o f f i c e 2 0 0 8 画出化合物的结构式,对 化合物分别使用g u s s i a n 0 3 计算了其量子化学参数,使用d r a g o n 计算了其2 0 组结构参数, 使用s y b y l 7 3 计算了其全息结构和3 d 结构参数,将这些结构参数作为其分子结构描述子, 采用实验室自编程序g v s m p 选择最佳描述子集,建立具有较高预测能力的最佳q s a r 模型,对所建立模型的稳定性和预测能力进行校正与检验,然后利用可靠的模型解析影响 酚类化合物毒性的主要因素。 桂林理工大学硕士学位论文 第2 章原理与方法 2 1 分子结构描述子的构建 2 1 1d r a g o n 描述子 d r a g o n 描述子是由d r a g o n 软件计算所得。d r a g o n 软件最初是由m i l a n o 教授的 化学计量学和q s a r 研究组研究发展得来的。这些描述子主要是用来进行评估分子定量 结构活性关系( q s a r ) 或者定量分子结构性能关系( q s p r ) 。 d r a g o n 描述子包括1 6 0 0 个参数,被划分为2 0 个不同的模块,将2 0 个不同的模块列 于表1 1 ,从表中可以看出d r a g o n 软件不仅可以计算简单的原子类型,官能团,结构 碎片,而且可以提供拓扑描述子,连接性指数和几何描述子等,自从1 9 9 7 年之后,作为 新的分子结构参数逐步得到了广泛的应用,推动了q s a r 的研究。具体操作的计算步骤 极其简易,只需在c h e m b i o o f f i c e 软件下画出不缺氢的分子结构式图,并且保存为 s y b y l 2 输入格式* m 0 1 2 ,将分子结构式文件直接输入d r a g o n 软件选择要计算的模 块,即可得到该模块的描述子。 表2 1d r a g o n 描述子组 2 1 2 量子化学描述子 在有机污染物的结构活性关系研究中,量子化学( q u a n t u mc h e m i s t r y ) 应用量子力学 的原理和方法研究分子的微观结构,是获得分子结构参数的重要途径之一。利用量子化学 方法可以获得分子的电子结构和立体结构信息,如分子轨道能级、原子的电荷密度、极化 率以及分子的静电势等。与其它的分子结构参数相比,量子化学参数具有明确的物理意义, 桂林理工大学硕士学位论文 有利于探讨影响污染物的环境行为和过程机制的结构因素,量子化学参数与从实验得来的 参数有本质的不同,量子化学参数没有统计误差。 量子化学计算方法根据对h a t r e e f o c k r o o t h a a n 方程的求解过程中是否引入其它的近 似和简化,产生了不同的分子轨道计算方法,例如分为从头算法( a bi n i t i o ) ,h u c k e l 分 子轨道法( h m o ) ,推广的h u c k e l 分子轨道法( e h m o ) 半经验( s e m i e m p i r i c a l ) 算法 等。本文主要采用从头算法计算酚类化合物的量子化学参数。 量子化学从头算法( a bi n i t i o ) 根据量子力学的基本原理,在求解h a t r e e f o c k r o o t h a a n 方程时,不再引入新的简化和近似,不借助任何经验参数,通过计算体系全部的分子积分 而求解h a t r e e f o c k r o o t h a a n 方程的方法,称为从头计算法。从头算法在理论上最严格, 计算结果精度高,可靠性大,但计算量极大,耗时太多,只适用于中等大小的分子体系, 对于一些复杂的体系难以处理。随着计算机技术的发展和新的计算方法的建立,现已可对 生物大分子进行处理。文中主要采用g a u s s i a n 0 3 程序模块进行计算,得到的参数再利用 基于预测的最佳子集回归方法进行计算。主要步骤为: ( 1 ) 首先画出分子的结构图并保存为术m o l 文件( 可以只画隐氢图) 。 ( 2 ) 将上述保存的二维分子结构图转换为三维分子结构图并转存为牢g j f 文件。 ( 3 ) 选定一组合适的原子轨道基函数。 常以s l a t e r 型轨道函数( s t o ) 的线性组合表示分子轨道,每个s t o 用若干个g a u s s i a n 型轨道函数( g t o ) 来逼近。因为s l a t e r 型轨道函数适合于描写电子云的分布,。但不便于 计算多中心积分,而g a u s s i a n 函数由于具有一个重要特性两个不同中心的g a u s s i a n 函数的乘积能够用另一个中心的g a u s s i a n 函数的线性组合表达出来因此使多中心积 分容易进行。 最小的基组由最少的原子轨道组成,恰好容纳基态原子的所有电子。经常使用的最小 基组是s t o 3 g ,即由3 个g a u s s i a n 函数逼近s l a t e r 轨道。同时3 2 1 g 、4 3 1 g 和6 3 11 g 基组也广泛用于从头计算中,其中4 3 1 g 表示原子内层轨道由4 个g a u s s i a n 函数逼近, 内外价键轨道分别由1 个和3 个g a u s s i a n 函数逼近。从头算法由于不需要实验数据来拟 合经验参数,因此特别适合于实验数据很少或根本没有实验数据的情况。本文在计算时采 用s t o 3 g 基组进行优化,然后再利用6 3 l1 g 基组进行振动分析。 ( 4 ) 读取参数,然后利用基于预测的最佳子集多元回归方法进行q s a r 研究并建模。 量子化学方法与分子模拟技术能够计算分子、分子碎片以及取代基等的反应性、形 状和键合性质,能够获得有关分子的电子结构、电子分布、立体化学及静态和动态的能量 分布等信息。用于定量结构一活性关系研究中常用的量子化学参数有: ( 1 ) 分子轨道能量 最高占有轨道能量( e h o m o ) 和最低空轨道能量( 尻u m o ) 是最经常应用的量子化学参数。 桂林理工大学硕士学位论文 最高占有轨道能量( 晶o m o ) ,用于表示分子给予电子的能力;最低空轨道能级( e l u m o ) ,用 于表示分子得电子的能力。两者都能够比较准确地描述分子局部之间的相互作用和分子的 反应活性。 ( 2 ) 偶极距( d i p o l em o m e n t ) 分子偶极距一般用来表征分子的极性,分子极性对于很多理化性质都很重要,总偶极 距反应的是分子的极性,局部极性可以由局部偶极距来表征,也可以由原子上的净电荷差 以及拓扑指数等来表征。偶极距能够很好地表示电子移动的能力,与物质的亲水性和溶解 度有密切的关系。 ( 3 ) 分子极化率 分子在外部电场存在时发生的极化是以分子体积的第n 级敏感性张量给出。第一极为 极化率,第二极为第一超极化率。极化率最显著的性质是与分子的体积或大小有关,因此 极化率的数值与化合物的疏水性具有相关关系,也与化合物的生物活性具有相关关系。另 外,分子的电子极化率与亲电超离域度具有同样的特征。一级极化率包含分子中可能的诱 导相互作用的信息,极化率的总各向异性代表分子接受电子的性质。 ( 4 ) 原子电荷或者电子密度 电子密度是原子之间静电荷力的源泉。电子密度决定物质性质和反应活性,因而经常 被应用做结构参数,用于表示分子之间的弱作用力。根据经典的化学理论,所有的化学相 互作用在本质上都是静电荷的( 极性的) 或轨道性质的( 共价的) 。分子中的电子电荷是静电 相互作用的动力。目前已经证明定域电荷密度或电荷对于很多化学反应都很重要。根据经 典的点电荷静电模型,净原子电荷很适用于表征相互作用,部分电荷的平方和或绝对值之 和也可以用来表征分子间的相互作用,例如溶质一溶剂相互作用。其它常见的电荷参数还 有最正、最负净原子电荷等。原子静电荷、前线轨道密度等,用来表示分子的反应性;分 子静电势,用来表示化合物分子与受体的亲和性;键级,用来表示化合物的稳定性。 ( 5 ) 分子形状参数 包括分子体积、分子表面积以及溶剂可接触分子表面积等,其可以反映分子和受体结 合时的几何形状是否匹配、化合物在体内传输等情况。 ( 6 ) 其它量子化学参数 包括原子一原子极化率、原子轨道电子集居数、重叠集居数、孤对电子密度矢量、原 子的自由价、键级以及生成热等。 总之,由于量子化学参数具有突出的优点,它们的应用是q s a r 发展的必然趋势, 量子化学参数在二维和三维结构活性关系中的应用必将推动q s a r 向理论化、智能化和 微观性发展。 桂林理工大学硕士学位论文 2 1 3 比较分子立场 比较分子场分析( c o m p a r a t i v em o l e c u l a rf i e l da n a l y s i s ,c o m f a ) 方法是 c r a m e ri i i t 川j 提出来的一种三维定量构效关系研究方法。它是种通过把药物分子的生 物活性与分子本身所具有的作用力场相联系而建立起来的一种q s a r 方法。该方法充分 考虑了化合物的三维结构信息,计算目标分子在它周围三维区域的每个网格点上造成使外 来分子( 即探针) 感受到的立体场和静电场,以这些三维特征信息和化合物的分子活性相 互关联。该方法认为药物和受体大分子可逆性的结合主要通过静电、氢键、范德华作用和 疏水作用实现的。这些作用总的归结为非键作用的静电作用和范德华作用两部分。作用于 同受体的一系列药物分子,它们与受体之间的两种作用力场应该有一定的相似性。这样, 在不了解受体三维结构的情况下研究这些药物分子周围作用力场的分布,把它们与这些药 物分子的生物活性定量地联系起来,即可以推测新分子的生物活性。 2 1 3 1c o m f a 的势场与理化意义 在c o m f a 方法中,化合物的势场由立体场和静电场两部分组成,应用两种势场函数 结合不同类型的探针对化合物的立体场和静电场进行计算。 空间场应用l e n n a r d j o n e s 势能函数进行计算: 月厂j广、 e v d w = f 多一i ( 2 1 ) i = 1 101 日) 式中:丘咖表示化合物的空间势场能量( 也称为v a nd e rw a a l s 作用能) ;珞表示分 子中原子i 与位于网格,上的探针之间的距离;a f 和g 是取决于相应原子v a nd e rw a a l s 半径的常数:n 为分子中原子的个数。 静电势场应用c o u l o m b 势能函数进行计算得到: 占g ,q , e c2 乞青( 2 2 ) i = l “盯 式中:展为化合物的空间势场能量( 也称为v a nd e rw a a l s 作用能) ;g f 为分子中原 子电荷,在c o m f a 中通常选用g a s t e i g e r h c k e l 方法计算得到的原子净电荷;垡f 为探针的 电荷:d 是介电常数;r o 为分子中原子i 与位于网格,上的探针之间的距离:以为分子中 原子的个数。 在c o m f a 中,生物活性分子周围的势场是通过不同类型的探针原子或基团在包含所 有化合物的空间网格上与化合物中各原子的相互作用计算得到。探针类型的选择通常是根 据分子本身的性质及对生物活性基团的预测而定。通常用中性( 碳) 原子、分子或基团( 如 c h 3 ) 研究化合物周围的立体势场:用带电荷的原子( 如h + 或带+ 1 价电荷的c + ) 作探针 8 桂林理工大学硕士学位论文 研究化合物周围的静电场;用氢键给体或氢键受体( 如h 2 0 ) 作探针研究化合物周围的 氢键或疏水性等相互作用。 2 1 3 2 比较分子力场分析的基本步骤 c o m f a 方法的基本步骤如下: l 、选择有相同作用机制的一系列活性已知的化合物,优化其三维结构,确定药效构 象。 2 、按照一定的规则将化合物叠合在一起,并在其周围产生几千到数万个网格点,该 网格能包容所有叠合的分子。 选择合适的叠合规贝j j ( a l i g n m e n tr u l e ) 叠合分子是c o m f a 的关键步骤,较理想方法是 按药效构象叠合,但实际很难做到,常用叠合规则主要有三种方法: ( 1 ) 在了解作用机制的情况下,用已知活性构象为模板,使其它分子与之相叠合晗; ( 2 ) 活性类似物法( a c t i v ea n a l o ga p p r o a c h ,a a 舢,对一系列分子进行构象搜索,找 出它们的共同构象,从而确定其活性构象瞳引; ( 3 ) 直接用活性最高的分子为模板,使其它分子与之叠合,可用最小二乘匹配( r m s f i t ) 或场匹配( f i e l d f i t ) 方法心副。 3 、以小分子或基团作探针,计算探针在每个网格点上与每个化合物的立体作用能和 静电作用能,这些能量值组成自变量矩阵。 4 、用偏最小二乘( p a t r i a ll e a s ts q u a r e ,p l s ) 方法建立q s a r 模型。 为了准确反映药物分子周围力场的分布与变化,势场计算所用的网格点数目即自变量 的数目通常在2 0 0 0 个以上,使得统计分析中自变量的数目远远超过化合物的数目,常规 的多元回归方法已不能适用。要建立生物活性与分子的立体场、静电场之间的相关性,就 是要回归单个的生物活性数据与分子周围几千到数万个网格点上的立体场、静电场数据之 间的相关方程,c o m f a 方法运用p l s 解决这个问

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论