




已阅读5页,还剩132页未读, 继续免费阅读
(分析化学专业论文)线性和非线性方法在qsarqspr研究中的应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
兰捌丕生虽卫士盛途奎 摘要 定量结构一性质活性相关( q s p r q s a r ) 研究应用各种统计学方法和理论计 算方法研究化合物的结构与其各种物理化学性质以及生物活性之间的定量关系, 是计算化学和化学信息学研究中的研究热点之一。其研究对象包括化合物的各种 物理化学性质、生物活性、毒性、药物的各种代谢动力学参数等等,研究领域涉 及药物设计、分析化学、环境化学、食品科学和材料科学等诸多学科。 过去1 0 余年的工作中,我们研究小组深入研究了误差反传神经网络 ( e r r o r - b a c kp r o p a g a t i o nn e t w o r k ,b p ) 、径向基函数神经网络( r a d i a lb a s i s f u n c t i o nn e u r a ln e t w o r k s ,r b f n n ) 以及支持向量机( s u p p o r tv e c t o rm a c h i n e , s v m ) 方法的机理,并成功用于药物设计、分析化学、环境化学、材料科学等领 域中,建立了准确的q s p r q s a r 模型。本论文的工作主要分为两部分,第一部 分的工作通过建立简单的线性模型就获得了令人满意的预测结果,体现了 q s p r q s a r 方法的简单有效性;第二部分的工作在线性方法的基础上,为了获 得更为精确的预测结果,进行了非线性方法的研究。 论文第一章简述了q s p r q s a r 的发展历史、基本原理以及研究现状。同时概 述了其在药物设计、分析化学、环境化学、食品科学和在材料科学等不同学科领 域内的广泛应用。 在论文第二章中,线性方法应用于建立q s a r 模型,主要包括以下的研究工作: ( 1 ) 用启发式方法( h e t t r i s t i cm e t h o d , h m ) 建立了预n 2 4 5 个药物通过聚 二甲硅氧烷膜的最大稳定态流量( 1 0 9 , ) 的数学模型。在计算大量的分子描述 符的基础上,首先用h m 筛选出4 个能代表化合物分子结构的描述符,并建立了线 性模型。所建模型具有较好的预测能力,相关系数的平方的平均值达n o 8 4 3 2 。 提供了一个预测此类化合物渗透性的简单、快速、有效方法。 在第三章中,非线性方法应用于建立q s p r 模型,主要包括以下几个方面的 研究工作: ( 1 ) 研究t 7 9 个杀虫剂在生物分配胶柬液相色谱中的保留因子与5 个分子描 述符之间的关系,分别用h m 和s v m 方法建立了线性和非线性的q s p r 模型。s v m 模型的结果优于h m 模型的结果,两种方法对测试集的均方根误差r m s 分别为 1 0 9 4 和1 6 4 4 ,获得了令人满意的预测结果。 ( 2 ) 通过h m 和s v m 方法建立线性和非线性的q s p r 模型,预测了2 1 7 个烃 类化合物在电解质溶液中的溶解度,仅用3 个描述符就获得了精确的预测结果。 为了与烃类化合物在纯水中的溶解度进行对比,相同的参数用于建立线性模型预 测烃类化合物在纯水中的溶解度,同样得到了精确的预测结果。以上研究表明本 工作所建立的q s p r 模型适用于预测烃类化合物在不同溶剂中的溶解度。 ( 3 ) 研究了两组多肽( 不同实验条件下) 在毛细管电泳中的有效迁移率, 应用h m 和r b f n n 方法分别建立了线性和非线性的q s p r 模型,r b f n n 模型的结 果略优于h m 模型的结果。本工作所建立的两个模型表明:q s p r 是一种有效的方 法,它能预测不同实验条件下的多肽迁移率,同时也从分子水平上找到了与多肽 的有效迁移率有关的结构特征。本工作提出了一种解决大分子问题的新思路。 ( 4 ) 预测了结构各不相同的1 2 1 个卤代化合物、烷基苯和酚的生物富集因子。 h m 和r b f n n 分别用来建y r 3 个分子描述符和生物富集因子之间的线性和非线性 定量关系模型。对于测试集,h m 和r b f n n 模型预测的相关系数r 2 分别为0 8 8 8 , 0 9 2 3 ;均方根误差r m s 分别为0 5 5 1 ,0 4 6 1 。非线性的关系更准确地描述了1 2 1 个有机污染物的生物富集因子和结构参数之间的关系。所建模型表明:从分子水 平上识别和提供与非离子有机化合物的生物富集过程有关的结构特征,有助于提 高我们对有机化合物生物富集机理的认识。 关键词:计算化学,化学计量学,定量结构一性质活性关系,支持向量机, 径向基函数神经网络,启发式方法。 兰刮叁芏星里王盛主硷塞 a b s t r a c t q u a n t i t a t i v es t r u c t u r e - a c t i v i t y p r o p e r t yr e l a t i o n s h i p s ( q s p r q s a r ) s t u d i e sh a v e b e e nw i d e l yu s e df o rp r e d i c t i o no fv a r i o u sp h y s i c o c h e m i c a lp r o p e a i e sa n db i o l o g i c a l a c t i v i t i e so fo r g a n i cc o m p o u n d sb yd i f f e r e n ts t a f i s f i c mm e t h o d sa n dv a r i o u sk i n d so f m o l e c u l a rd e s c r i p t o r s 。t h e ya r ei m p o r t a n tr e s e a r c ht o p i c si nc o m p u t a t i o n a lc h e m i s t r y a n dc h e m o i n f o r m a t i c s q s p r q s a rh a sb e e nw i d e l ya p p l i e dt op r e d i c td i f f e r e n t p h y s i c o c h e m i c a lp r o p e r t i e s ,b i o l o g i c a la c t i v i t i e s ,t o x i c i t i e s ,m e t a b o l i cd y n a m i c p a r a m e t e r so fd r u g s n o w , t h em e t h o dh a sb e e ni n t r o d u c e dt od r u gd e s i g n ,a n a l y t i c a l c h e m i s t r y ,e n v i r o n m e n ts c i e n c e ,f o o ds c i e n c ea n dm a t e r i a ls c i e n c e i nt h ep a s tt e ny e a r s ,t h em e c h a n i c so fe r r o r - b a c kp r o p a g a t i o nn e t w o r k ( b p ) ,r a d i a l b a s i sf u n c t i o nn e u r a ln e t w o r k sf l 强r n n ) a n ds u p p o r cv e c t o rm a c h i n e ( s v m ) h a v e b e e np r o f o u n d l ys t u d i e db yo b rg r o u p t h e s en o n l i n e a rm e t h o d sh a v eb e e nw i d e l y u s e di nd r u gd e s i g n , a n a l y t i c a lc h e m i s t r y , e n v i r o n m e n ts c i c n c e ,f o o ds c i e n c ea n d m a t e r i a ls c i e n c e a n da c c u r a t eq s a r q s p rm o d e l sw e r ea c h i e v e d r e s e a r c h f o c u s i n go nt w oa s p e c t st h em e t h o di sp r e s e n t e di nt h i st h e s i s t h ef i r s ta r e ao ft h e r e s e a r c hi sa c h i e v i n gs a t i s f y i n gr e s u l t sw i t hs i m p l el i n e a rm o d e l s ;t h es e c o n da r e ao f t h er e s e a r c hi sd e v e l o p i n gn o n l i n e a rm o d e l st oa c h i e v em o l ea c c u r a t er e s u l t s i nc h a p t e r1 ,a nb r i e fi n t r o d u c t i o no ft h eq s p r q s a r h i s t o r y ,m e t h o d o l o g ya n d s i t u a t i o ni sp r e s e n t e d a n da no v e r v i e wo ft h ew i d ca p p l i c a t i o n so fq s p r q s a ri n d r u gd e s i g n ,a n a l y t i c a lc h e m i s t r y ,e n v i r o n m e n ts c i e n c e ,f o o ds c i e n c ea n dm a t e r i a l s c i e n c ei sg i v e n i nc h a p t e r2 ,w ea p p l i e dl i n e a rm e t h o di nq s a r ab r i e fd e s c r i p t i o nw a sg i v e na s f o l l o w s : ( 1 ) aq u a n t i t a t i v es t r u c t u r e - a c t i v i t yr e l a t i o n s h i p ( q s a r ) m o d e lw a sd e v e l o p e db y t h eh e u r i s t i cm e t h o d ( h m ) t os t u d yt h ep e n e t r a t i o no f2 4 5d r a g sa c r o s sa p o l y d i m e t h y l s i l o x a n e ( p d m s ) m e m b r a n e t h ed e s c r i p t o r s o ft h i s s t u d yw e r e c a l c u l a t e db yt h es o f t w a r ec o d e s s a h mw a su s e db o t hf o rp r e s e l e c t i n gm o l e c u l a r d e s c r i p t o r sa n df o rd e v e l o p i n gt h el i n e a rm o d e l l o g a r i t h m so ft h em a x i m u n ls t e a d y s t a t ef l u x v a l u e sa r ec o r r e l a t e dw i t hf o u rd e s c r i p t o r s ,w i t has q u a r e dc o r r e l a t i o n c o e f f i c i e n t ( 五2 ) o f0 8 4 4a n dr o o t - m e a n - s q u a r e ( r m s ) e r r o ro f0 4 3 8 ,r e s p e c t i v e l y t h i sp a p e rp r o v i d e sas i m p l ea n ds t r a i g h t f o r w a r d w a y t op r e d i c tt h el o 辱,v a l u e so f t h e d r u g sf r o mt h e i rs t r u c t u r e sa l o n ea n dg i v e ss o m ei n s i g h ti n t os t r u c t u r a lf e a t u r e s r e l a t e dt ot h ep e n e t r a t i o no f d r u g s i nc h a p t e r 3 ,n o n l i n e a rm e t h o d sw e r ea p p f i e dt oq s p rs t u d y : ( 1 ) t h er e t e n t i o nf a c t o r so o 鳓i nt h eb i o p a r t i t i o n i n gm i c e l l a rc h r o m a t o g r a p h y ( b m c ) o f 7 9h e t e r o g e n e o u sp e s t i c i d e sw e r es t u d i e db yq s p rm e t h o d i - l ma n ds v m m e t h o dw e r eu s e dt ob u i l dl i n e a ra n dn o n l i n e a rm o d e l s ,r e s p e c t i v e l y c o m p a r e dt h e r e s u l t so ft h e s et w om e t h o d s ,t h o s eo b t a i n e d b yt h es v mm o d e la r em u c h b e t t e r 嬲e r 煳o f s v m a n d h m f o r t h e t e s t 晰w e r e1 0 9 4a n d1 6 4 4 r e s p e c t i v e l y t h ep r o p o s e dq s p rm o d e l s , b yt h et w om e t h o d s , c o n t a i nt h es 锄ed e s c r i p t o r st h a t a g r e ew i t ht h ec l a s s i c a la b r a h a mp a r a m e t e r so fw e l l k n o w nl i n e a rs o l v a t i o ne n e l l g y r e l a t i o n s h i p s ( l s e r ) ( 2 ) s v ma n dh m w e r eu s e dt od e v e l o pn o n l i n e a ra n dl i n e a rm o d e l sb e t w e e nt h e s o l u b i l i t yo f2 1 7n o n e l e c t r o l y t e si ne l e c t r o l y t ec o n t a i n i n gs o d i u mc m o d d ea n dt h r e e m o l e c u l a rd e s c r i p t o r s t h em o l e c u l a rd e s c r i p t o r sr e p r e s e n t i n gt h es t r u c t u r a lf e a t u r e s o ft h ec o m p o u n d si n c l u d et w ot o p o l o g i c a la n do n ee l e c t r o s t a t i cd e s c r i p t o r t h et h r e e m o l e c u l a rd e s c r i p t o r ss e l e c t e db yh mi nc o d e s s aw e r eu s e da si n p u t sf o rs v m t h er e s u l t so b t a i n e db yh ma n ds v mb o t hw e r es a t i s f a c t o r y t h em o d e lo f r i ml e a d s t oa c o r r e l a t i o n c o e m c i e m o f 0 9 8 0a n dr o o t - m e a n - s q u a r ee r r o r ( e , m s ) o f 0 2 1 9 f o rt h et e s ts e t f u r t h e r m o r e ,ap r e d i c t i v ec o r r e l a t i o nc o e f f i c i e n tr = o 9 8 8a n dr m s f i l l o ro fo 1 7 0f o rt h et e s ts e tw e r eo b t a i n e db ys v m t h ep r e d i c t i o nr e s u l t s 黜i n v e r yg o o da g r e e m e n tw i t ht h ee x p e r i m e n t a lv a l u e s t h es 锄ed e s c r i p t o r sw e r ea l s o e m p l o y e dt ob u i l dt h em o d e li np u r ew a t e r , a n dt h ep r e d i c t i o nr e s u l t sw e r ec o n s i s t e n t w i t ht h ee x p e r i m e n t a ls o l u b i l i t i e s t h i sp a p e rp r o v i d e dan e wa n de f f e c t i v em e t h o df o r p r e d i c t i n gt h es o l u b i l i t yi ne l e c t r o l y t ea n dr e v e a l e ds o m ei n s i g h ti n t ot h es t r u c t u r a l f e a t u r e st h a ta r er e l a t e dt o t h en o n e l e t r o l y t e s ( 3 ) t h ea i mo ft h i sw o r kw a st op r e d i c te l e c t r o p h o r e t i cm o b i l i t i e so fp e p t i d e si n c a p i l l a r y z o n ee l e e t r o p h o r e s i s ( c z e ) u s i n gh ma n dr b f n n t w od a t a s e t s , 兰! 盟盔堂呈卫监主逢塞 c o n s i s t i n go f1 2 5p e p t i d e sr a n g i n gi ns i z eb e t w e e n2a n d1 4a m i n oa c i d sa n d5 8 p e p t i d e sr a n g i n gi ns i z eb e t w e e n2a n d3 9a m i n oa c i d s ,a l er e s e a r c h e dt ot e s t a p p l i c a b i l i t yo ft h eq s p rm e t h o d s i nt h i ss t u d y ,r m se r r o r so ft h et r a i n i n gs e t ,t h e t e s ts e ta n dt h ew h o l es e to f d a t as e t1a l e1 3 7 6 6 ,1 5 6 0 8 ,1 4 1 5 7a n dr 2 a l eo 9 7 4 0 , o 9 6 7 1a n do 9 7 2 4p r e d i c t e db yr b f n n r e s p e c t i v e l y w h i l et h er m se r r o r so f t h e t r a i n i n gs e t ,t h et e s ts e ta n dt h ew h o l es e to fd a t as e t2i s0 6 2 7 9 ,o 8 1 4 5 ,o 6 6 7 3a n d r 2a l e0 9 7 7 3 ,o 9 4 8 9a n do 9 7 3 2 ,r e s p e c t i v e l y s ot h eo f f o r d sc h a r g e o v e r - u l a s s t e r m ( q i m 2 3 ) c o m b i n e dw i t hd e s c r i p t o r sc a l c u l a t e db yc o d e s s ar e p r e s e n t st h e s t r u c t u r a lf e a t u r e so ft h ep e p f i d e sa p p r o p r i a t e l y t h ee l e c t r o p h o r e t i em o b i l i t i e so f p e p t i d e sc a n b ea c c u r a t e l yp r e d i c t e db yt h el i n e a la n dn o n l i n e a rm o d e l ( 4 ) r b f n na n dh mw e r eu s e dt od e v e l o pm o d e l sb e t w e e nt h eb i o c o n c e n t m t i o n f a c t o r s ( b c f ) a n dt h r e em o l e c u l a rd e s c r i p t o r so f1 2 1n o n i o n i co r g a n i cc o m p o u n d s t h et h r e em o l e c u l a rd e s c r i p t o r sr e p r e s e n t i n gt h es t r u c t u r a lf e a t u r e so ft h ec o m p o u n d s w e r es e l e c t e db yh mi nc o d e s s a , w h i c hi n c l u d et o p o l o g i c a l ,g e o m e t r i c a la n d e l e c t r o s t a t i cd e s c r i p t o ra n dw e r eu s e da si n p u t sf o rr b f n n t h er e s u l t so b t a i n e db y h ma n dr b f n nb o t hw e r es a t i s f a c t o r y t h em o d e lo f h ml e a d st or 2 0 f 0 8 8 8a n d r m so f o 5 5 1f o rt h et e s ts e t f u r t h e r m o r e ap r e d i c t i v e 舻o f 0 9 2 3a n dr m se 1 r o r o fo 4 1 6f o rt h et e s ts e tw g r eo b t a i n e db yr b f n n t h ep r e d i c t i o nr e s u l t sa l ei nv e r y g o o da g r e e m e n tw i t ht h ee x p e r i m e n t a lv a l u e s t h i sp a p e rp r o v i d e da ne f f e c t i v e m e t h o df o rp r e d i c t i n gt h eb c fa n dr e v e a l e ds o m ei n s i g h ti n t ot h es t r u c t u r a lf e a t u r e s t h a ta l er e l a t e dt ot h eb c fo f n o n i o n i co r g a n i cc o m p o u n d s k e y w o r d s :c o m p u t a t i o n a lc h e m i s t r y ,c h e m o m e t r i c s ,q s p r q s a rs v m , r b f n n ,i - i v 1 原创性声明 本人郑重声明:本人所呈交的学位论文,是在导师的指导下独立进行研 究所取得的成果。学位论文中凡引用他人已经发表或未发表的成果、数据、 观点等,均已明确注明出处。除文中已经注明引用的内容外,不包含任何其 他个人或集体已经发表或撰写过的科研成果。对本文的研究成果做出重要贡 献的个人和集体,均已在文中以明确方式标明。 本声明的法律责任由本人承担。 论文作者签名:措日期:越童星 关于学位论文使用授权的声明 本人在导师指导下所完成的论文及相关的职务作品,知识产权归属兰州 大学。本人完全了解兰州大学有关保存、使用学位论文的规定,同意学校保 存或向国家有关部门或机构送交论文的纸质版和电子版,允许论文被查阅和 借阅;本人授权兰州大学可以将本学位论文的全部或部分内容编入有关数据 库进行检索,可以采用任何复制手段保存和汇编本学位论文。本人离校后发 表、使用学位论文或与该论文直接相关的学术论文或成果时,第一署名单位 仍然为兰州大学。 保密论文在解密后应遵守此规定。 论文作者签名:二维导师签名:i :l ! 查鱼 日期:竺z 彳 论文创新之处 本论文应用线性和非线性方法建立了可靠的定量结构一活性性质关系 ( o s a r o s p r ) 预测模型,主要包括以下几个创新性的研究工作: ( 1 ) 用启发式方法( h e u r i s t i cm e t h o d , 玎讧) 建立了预狈d 2 4 5 个药物通过聚 二甲硅氧烷膜最大稳定态流速的数学模型。传统方法使用大量描述符进行预测仍 未获得较好的预测结果,本工作的创新之处在于仅用4 个分子描述符和简单的线 性方法对大量化合物建立了令人满意的模型。提供了一个预测药物渗透性的简 单、快速、有效方法。 ( 2 ) 首次预测了杀虫剂在生物分配胶束液相色谱( b i o p a r t i t i o n i n gm i c e l l a r c h r o m a t o g r a p h y ,b m c ) 中的保留因子。由于许多化合物在生物膜中的分配难以 直接测定,b m c 能够模拟这种行为,不但简便而且重现性好。因此,通过对化 合物在b m c 中保留的研究进一步研究化合物在生物膜中的分配。 ( 3 ) 通过删和支持向量机( s u p p o r v e c t o r m a c h i n e , s 旧方法建立线性和非 线性的q s p r 模型,预测了2 1 7 个烃类化合物在电解质溶液中的溶解度,仅用3 个描 述符就获得了精确的预测结果。为了与烃类化合物在纯水中的溶解度进行对比, 相同的参数用于建立线性模型预测烃类化合物在纯水中的溶解度,同样得到了精 确的预测结果。以上研究表明本工作所建立的o s p r 模型适用于预测烃类化合物在 不同溶剂中的溶解度。 ( 4 ) 研究了两组多肽在毛细管电泳中的有效迁移率( 不同实验条件下) 。 本工作所建立的两个模型表明:q s p r 是一种有效的方法,能预测不同实验条件 下的多肽迁移率,同时也从分子水平上找到了与多肽的有效迁移率有关的结构特 征。本工作提出了一种解决大分子问题的新思路。 第一章定量结构一性质活性关系的基本理论及研究进展 1 。1 定量结构一性质,活性关系的概述 随着现代科技的发展,化学家们获得了大量数据,如何从中提取有用的信息 成为现代化学所面临的一个新问题。计算化学将统计方法成功的用于解决各种化 学问题,其研究目的就是应用统计方法从化学数据中寻找和发现规律。定量构效 关系( q u a n t i t a t i v es t r u c t u r e - a c t i v i t y p r o p e r t yr e l a t i o n s h i p s ,q s a r q s p r ) 是计 算化学研究中十分活跃的领域之一。q s a r q s p r i 勺研究可以追溯至t j 2 0 世纪中期, 有机反应性相关分析( c o r r e l a t ea n a l y s i so fo r g a n i cc h e m i s t r y , c a o c ) 研究可看作 是q s a 刚q s p r 研究的前身1 。h a n s e h 2 ,3 等在二十世纪六十年代提出的h 孤s c h 多 元回归方法研究化合物的性质或活性与其结构之间的关系被普遍认为是经典 q s a r i 开究的开始。其后陆续出现t f r e e - w i l s o n j l l :l 合模型m ,模式识别p 2 1 ,拓 扑指数i m 朔,分子模型化n 孓矧和量子化学方法闭等许多研究方法嘲。 q s a r q s p r 研究的主要思想是将理论计算方法和各种统计分析工具相结合 研究化合物的结构与其生物学性质或各种物理化学性质之间的定量函数关系。其 基本假设是分子性质的变化依赖于其结构的变化,而且分子的结构可以用反映分 子结构特征的数值,即分子描述符来描述。也就是说化合物的性质或生物活性可 以用化学结构的函数来表荆1 翔- 2 9 。人们探索、寻找结构与性质间隐含的定性和 定量关系,一方面期望通过改变分子内部结构来达到改变分子性质的目的;另一 方面,可以根据实验测定的性质来推测和获取分子结构方面的信息 3 0 l 。随着计 算化学的发展,q s a r q s p r 的研究也提高到了一个新的水平,近年来得到了很 大的发展。同时也创办了一些与之相关的刊物。目前,计算化学领域的国际相 关刊物包括: c h e m o m e t r i c sa n d i n t e l l i g e n t l a b o r a t o r y s y s t e m s ( 1 9 8 7 ) ,a 甜r m ,o f c h e m i c a li n f o r m a t i o na n d m o d e l i n g ( 1 9 6 1 ) j o u r n a lo f c h e m o m e t r i c s ( 1 9 8 7 ) j o u r n a lo f c o m p u t a t i o n a lc h e m i s t r y ( 1 9 8 0 ) j o u r n a l o f c o m p u t e r - a i d e d m o l e c u l a r d e s i g n ( 1 9 8 3 ) j o u r n a lo f t h e o r e t i c a l c o m p u t a t i o n a lc h e m i s t r y ( 2 0 0 2 ) 兰趔丕堂墨卫垩熊圭丝塞 q s a r c o m b m a 向r i a ls c i e n c e ( 1 9 9 3 ) s a r a n d q s a r i n e n v i r o n m e n t a l r e s e a r c h ( 1 9 8 2 ) 还有一些期刊虽然不属于计算化学领域,但也发表了很多和q s a r q s p r 相关的 论文: a n a l y t i c ac h i m i c a a c t a a n a l y t i c a lc h e m i s t r y c h e m o s p h e r e e l e c t r o p h o r e s i s e u r o p e a nj o u r n a lo f m e d i c i n a lc h e m i s t r y j o u r n a lo f c h r o m a t o g r a p h y a t a l a n t a t h ej o u r n a lo f p h y s i c a lc h e m i s t r y a t h ej o u r n a lo f p h y s i c a lc h e m i s t r yb 在q s a r q s p r 研究不断发展的同时,出现了许多商业和学术用途的化学软 件,包括s y b y l 、m o e 、c o d e s s a 、c e r i u s 、a d a p t 等,这些软件具有计算描 述符,选择参数,以及建立线性和非线性模型并进行交互检验等功能。其它软件 还有h y p e r c h e m 、i s i s d r a w 、m o p a c 和d r a g o n 等。 近年q s a 刚q s p r 研究呈现出以下几个特点【1 】= 1 综合性;定量构效关系主要采用数学方法和计算机技术研究化合物结构与其 活性、性质之间的定量函数关系,因而它是一个覆盖了化学、数学、计算机科学 和生命科学的交叉学科。 2 理论性:早期的q s a r q s p r 硼:究往往比较注重模型的预测能力,只要能得到 良好的预测结果就可以了。而近年的q s a 刚q s p r 研究则更注重定量模型的理论 性,人们期望一个成功的相关性模型,能够从本质上揭示化合物的性质及活性的 作用机制。 3 智能化:化合物的q s a r q s p r 关系是一个复杂的关系,q s a r q s p r 模型的 建立往往是基于对大量化合物的分析,包括化合物参数的计算,需要从诸多参数 中筛选对化合物活性或性质有显著影响的变量,以及在化合物结构参数与性质之 间建立满意的函数关系等。分析过程也非常繁杂,有时必须借助先进的多变量分 析方法。因此,判别分析、聚类分析、模式识别、人工神经网络、回归分析、遗 箜= 童室量缝堑= 丝厦! 适丝羞丕笪基查垄迨星堑塞堂星 传算法等善于处理复杂问题的方法被越来越多地应用于q s a r q s p r 磊) 究,促使 其向智能化方向发展。 4 实用化:随着工业的发展,越来越多的人工合成化合物被生产出来,通过实 验方法对化合物进行全面的测定、评价是一个需要耗费大量时间和资金,并且具 有一定危险性的过程。q s a r q s p r 可以建立准确的相关模型对化合物的活性、 性质做出预测,为化合物的测定、评价提供了一种简便、实用的途径。 1 2q s a r q s p r 研究方法的应用进展 q s a r q s p l t 研究方法可以应用于化学与生命科学中的诸多领域。 在药物设计领域,q s a r 通过研究生物活性和理化参数之间的相关性来预测 新化学品的活性,指导新药和杀虫剂的合成。近年来,分子生物学和计算机技术 的迅速发展,使得开发新药的技术路线发生了重大变革,计算机辅助分子设计 ( c o m p u t e r - a i d e dm o l e c u l a r d r u gd e s i g n s ,c a m d 或c a d d ) 尸, 发展成为一门新 兴并趋于完善的研究领域。它可以帮助实验化学家有预见地合成一些生物活性较 高、副作用小的化合物,排除从理论上根本不可能有活性或活性很低的结构,缩 短发现新药的周期,达到资源的合理利用。也为人们攻克一些顽症提供了崭新的 思路和成功的希望凸1 ,3 勿。 在分析化学中,q s a r q s p r 力i 法最常见于对色谱保留值以及毛细管电泳行 为的预测。从1 9 7 7 年开始,q s a r q s p r 力 法在色谱中应用的文章开始出现,称 之为定量结构一保留相关( q u a n t i t a t i v es t r u c t u r e - r e t e n t i o nr e l a t i o n s h i pq s r r ) 。目 前,q s r r 已成为色谱科学的一个新的研究分支领域。通过结构与保留的关系研 究,可以对一个新溶质的保留进行预测;确定溶质的最有用的结构信息;揭示色 谱分配的分子机理;估算溶质复杂的物理化学性质;以及对一系列溶质的相对生 物活性进行预测。在毛细管电泳中,根据电泳分离的基本原理即被分析物电泳淌 度的不同,采用计算的方法得到一定条件下分析物的电泳淌度,为快速优化实验 条件提供了一定的理论依据【3 3 州。 在环境化学领域,q s a r 用来预测化学品的环境行为和物理化学性质。环境 行为包括对微生物和低等生物的急性毒性、亚急性毒性、生长抑制毒性、酶抑制 兰捌盍堂墨里垩熊迨塞 毒性等;对高等生物和人类的急性毒性、三致毒性( 致癌性、致畸性和致突变性) 、 环境内分泌干扰活性( 生殖和遗传毒性、免疫毒性、生长发育毒性、内分泌干扰、 神经毒性等) 。物理化学性质包括污染物的水溶解度、疏水性、挥发性、熔点、 沸点、极性等理化性质,以及描述污染物在不同介质之间的吸附、分配、迁移以 及降解、水解、光解等常数 3 5 1 。定量构效关系研究在研究污染物对环境冲击作 用中占有重要位置。在系列污染物结构参数和性质参数之间建立定量模式的意义 在于:模式就是规律。通过内插与外延,可以预报未知化合物的活性或环境效应, 因此将有利于减少在化学品安全评价工作的筛选量。此外,模式本身在一定程度 上可以表达污染物与受体之间的相互作用,有助于启发阐明该作用机理的毒理学 研究。基于q s a r q s p r 在环境化学领域的研究意义,美国环保局已肯定由 q s a r q s p r 产生的预报值可被应用于化学品安全评价和环境污染物的生态风险 性评价之中。此外,建立化学品性质、毒性数据库,q s a r 是一个必要组成部分, 化合物的化学性质、生物活性测试过程费钱耗时,建立q s a r q s p r 模型有助于 从已经测定的数据中最大限度地获取有用信息。 在食品科学中,由于食品中成分复杂,对其生物活性的评价是一项巨大的工 程。引入q s a r q s p r 方法,能大大提高对食品成分毒性和功能性的预测能力; 通过研究防腐剂结构和抗菌活性的关系,能够更有目的地开发一些新的添加剂 脚】。对于新产品的开发,评测具有很大的帮助作用。 在材料科学中,q s a r q s p r 方法和计算机信息处理方法使寻找新材料的工 作方式有所改进,节省了大量人力、物力和时间。 1 3q s a r q s p r 方法的主要步骤 q s a r q s p r 6 f 究的主要步骤包括:获得和整理数据;输入分子结构;优化 分子结构;计算分子描述符;选择分子描述符;建立和评价预测模型;使用模型 进行预测。主要步骤可以用图1 1 表示 2 9 , 3 7 , 3 8 】: 4 图1 ,lq s a r 研究的主要步骤 f i g l 1t h es t e p so f q s a r q s p r 下面的章节将针对以上步骤进行逐一说明。其中特征选取和建模是 q s p r q s a r 研究的重要内容,本论文也将其作为主要研究内容,并给出较为详 尽的表述。 1 3 1q s a r q s p r 研究中数据的整理和获得 在q s p r q s a r 研究中,数据的可靠性是获得准确模型的关键,只有确保数 据的可靠性,模型的结果才有意义。一般要求样本的数目不能太少,通常情况下 不少于1 0 个,否则样本没有意义。选择的化合物可以含有c 、n 、o 、s 、p 、 e l 、f 、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司年度培训服务合作协议及实施计划
- 语调社会文化因素-洞察及研究
- 装修合同增加项补充协议
- 装修窗户合同协议书范本
- 装饰公司分公司协议合同
- 补充劳动合同协议书范本
- 一楼车库租房合同协议书
- 公寓物业转让协议书模板
- 外墙铝板拆除合同协议书
- 电磁给料机采购合同范本
- 2025玉溪市公安局公开招聘警务辅助人员(120人)笔试参考题库附答案解析
- 人教PEP版(2024)新四年级上册 教材解读
- 2025四川省高级人民法院招聘聘用制审判辅助人员30人考试备考题库及答案解析
- 南京大学课程《普通地质学》教学大纲及教案
- 加气块砌筑知识培训课件
- 智慧养老服务与管理课件
- 2025年湖南安全技术职业学院招聘考试笔试试题(含答案)
- 配电带电作业工考试试卷与答案
- 2025年河南省机关事业单位工勤技能岗位等级考试(兽医防治员·高级技师/一级)(综合评审技能)历年参考题库含答案详解(5卷)
- 2025年职业技能鉴定考试(地勘钻探工)历年参考题库含答案详解(5套)
- 医院感控知识培训
评论
0/150
提交评论