




已阅读5页,还剩107页未读, 继续免费阅读
(基础数学专业论文)基于level+set演化曲面的蛋白质分子场建模与特征分析研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 捅要 蛋白质是生命活动的物质基础,蛋白质分子的运动与构象在生命活动中扮演 着极为重要的角色。其中蛋白质分子的空间结构与功能的关系更是人们关注的 焦点【l ,2 】。目前,许多来自生物、化学、计算机、数学、物理等领域的科学家 正致力于研究和分析蛋白质复杂的空间三维结构,借助于信息科学、生物信息 学、计算生物学、计算化学等手段,推演和预测蛋白质结构和功能关系。 考虑到现有的分子拓扑建模方法缺乏对分子的运动、分子势能场的有力刻 画难以描述生物分子的活性及动态功能,我们将生物大分子描述为包含多种作 用力的原子系统,构建原子尺度上描述分子体系能量的势能场( 即分子场) ,并对 分子场进行几何、拓扑等方面的特征抽取与特征分析研究。本文介绍了我们在 生物大分子的分子场建模与可视化、以及利用l e v e ls e t 演化曲面探索分子场几 何和拓扑等特征的研究工作。主要包括: 从蛋白质分子三维空间结构出发,分别采用分子力学和量子力学理论,构建 原子尺度上的蛋白质分子场。力图通过对蛋白质空间分子场的特征抽取来 揭示蛋白质分子活性位点和功能区域;我们在空间分子场每个采样点上实 施离散一阶、二阶局部微分计算。从而筛选出一系列数据场内的临界点; 继而。计算数据场内各种型值的分子势能面,交互地探寻具有一定生物活性 的”通道”区域;同时。探索运用多种点、面和体可视化技术,来寻找分子内 部的宏观结构。 从蛋白质分子场出发,构建其l e v e ls e t 演化曲面。我们在已有的c h a n v e s e 模型基础上设计无需周期初始化的l e v e ls e t 模型与传统的l e v e ls e t 方 法相比此模型在分子场上进行特征提取更加精确和有效;同时在每个迭 代过程中实时计算演化轮廓曲面的一些几何测度,并判断演化曲面是否收 敛;进一步地,调整方程中各项参数,分析其对最终结果的影响程度;我们 将l e v e ls e t 曲面演化应用n h i v - 1 蛋白酶分子场和d p s 蛋白质分子场上探 讨其生物学意义。 对不同蛋白质分子场的l e v e ls e t 曲面进行拓扑特征抽取及多属性比对进 一步揭示蛋白质分子场与分子生物活性之间的关系。一方面,构造体特征 函数、抽取l e v e ls e t 曲面的拓扑特征;另一方面。计算l e v e l s e t 曲面上的几 何、生物多种属性并通过比较这一系列属性的相似度。来判断l e v e ls e t 曲 一i 一 摘要 面演化过程中分子场的变化,进而研究分子场能量分布的特点及变化趋 势。 基于共形几何理论。继续探索分子场l e v e ls e t 曲面的几何、拓扑性质。首 先,计算分子场l e v e ls e t 曲面的高斯曲率、平均曲率,得到该曲面局部几何 特征分布;然后,根据欧拉示性数公式计算分子场l e v e ls e t 曲面的亏格数, 描述该曲面的拓扑信息;再根据常数曲率度量对曲面进行分类,借鉴g u 等 人的计算共形几何理论。对亏格为0 、1 、 2 的三种曲面分别实现共形参 数化;最后,计算分子场l e v e ls e t 曲面所有点的共形因子分布,揭示l e v e l s e t 曲面内蕴的几何特性。我们采用蛋白质分子场l e v e ls e t 曲面的共形因子 分析方法对不同分子场进行了比较。 实验表明我们基于蛋白质分子场的l e v e ls e t 演化曲面计算出来的特征与已 有生物结论相一致女 i d p s 蛋白质与铁离子结合的空腔区域。h i v - 1 蛋白酶内部的 水分子排除通道h i v l 蛋白酶在水溶液中进行s m d 模拟时的生物活性变化以 及g l o b i n 同源蛋白进化过程中的异同等。生物学家认为这些结果可能对今后研 究h i v - 1 蛋白酶的亲水、疏水性有重要的价值,并可作为“蛋白质蛋白质”相互作 用或“蛋白质配体”相互作用中首要参考的活性位点。具有很好的研究意义。 关键词:分子场,特征分析,l e v e ls e t 演化曲面,变分方程,结构及生物学属性,共 形因子,h i v - 1 蛋白酶,d p s 蛋白质,g l o b i n 同源蛋白 一一 a b s t r a c t a b s t r a c t p r o t e i np l a yac r u c i a lr o l ei nl i f e sp r o c e s s e s i nr e c e n ty e a r s ,t h e r eh a sb e e na g r o w i n gi n t e r e s ti ne x p l o i t i n gt h er e l a t i o n s h i pb e t w e e nm o l e c u l a rs t r u c t u r ea n db i o - l o g i c a la c t i v i t y m a n ys c i e n t i s t sf r o md i f f e r e n tr e s e a r c ha r e a s ,e g b i o l o g i s t ,c h e m i s t , c o m p u t a t i o n a ls c i e n t i s t ,m a t h e m a t i c i a no rp h y s i c i s t ,a r et r y i n gt om a k es o m ep r o g r e s s e s f r o mt h ev i e wo fe i t h e re x p e r i m e n t so rc o m p u t a t i o n a la n a l y s i s n o wo n eo ft h em a i n t h e m e si su s i n gw e l l k n o w np r o t e i ns t r u c t u r et op r e d i c tu n k n o w n p r o t e i nm o l e c u l a r a c t i v i t y , b a s e do nt h ek n o w l e d g eo fc o m p u t a t i o n a ls c i e n c e ,b i o l o g i c a li n f o r m a t i c s ,c o r n - p u t a t i o n a lb i o l o g y , c o m p u t a t i o n a lc h e m i s t r ya n ds oo n e x i s t i n gm o l e c u l a rm o d e l sa r em o s t l yc o n s t r u c t e db ya t o mp o s i t i o n sa n dc o n n e c - t i o n sb e t w e e na t o m s t h e yd o n tc o n t a i nt h ei n f o r m a t i o no fm o l e c u l a rm e c h a n i c so r m o l e c u l a rf o r c ee n e r g y , a n dm a yl i m i tt h es t u d yo fm o l e c u l a rs t r u c t u r e - a c t i v i t yr e l a - t i o n s h i p s i nt h i sp a p e r , w ec o n s i d e rt h ep r o t e i na saw h o l es y s t e mc o m p o s e do fd i f - f e r e n tf o r c ei n t e r a c t i o n s w h i c hi sc a l l e d ”m o l e c u l a rf i e l d ”t h e nw eu s el e v e ls e t e v o l u t i o n a ls u r f a c e st oe x t r a c ta n da n a l y z et h ef e a t u r eo fm o l e c u l a rf i e l d ,a n ds h o wt h e r e s u l t sb ys e v e r a lk i n d so fr e n d e r i n gt e c h n i q u e s o u rm a i nc o n t r i b u t i o n si n c l u d e : m o l e c u l a rf i e l di na q u a n t i t a t i v em a n n e ri sc o n s t r u c t e d ;t h e nb ya p p l y i n gt h ef i r s t o r d e ra n dt h es e c o n do r d e rl o c a ld i f f e r e n t i a lo p e r a t o r so ni n d i v i d u a ln o d e ,as e t o fc r i t i c a lp o i n t sw h i c hp o t e n t i a l l yd e p i c t st h ea c t i v er e g i o no fp r o t e i nm o l e c u l e a r ef o u n d ;a l s ot h i sc h a p t e rg i v e ss o m er e s u l t sa b o u tc o m p u t i n gas e q u e n c eo f m o l e c u l a rp o t e n t i a le n e r g yi nt h ed a t af i e l da n di n t e r a c t i v e l ye x p l o r i n gt h ep o t e n t i a l “t u n n e l ”r e g i o ne x h i b i t i n gb i o l o g i c a ls e n s e i na d d i t i o n ,t h ep o i n t b a s e d , s u r f a c ea n dv o l u m er e n d e r i n gt e c h n i q u e sa r ee x p l o i t e dt of i n dt h em a c r o - s t r u c t u r e i n s i d et h ed a t af i e l d l e v e ls e tm o d e li nm o l e c u l a rf i e l di sp r e s e n t e d w h i c hi sb a s e do nc h a n v e s e m o d e lb u td o e s n tn e e dt or e i n i t i a l i z el e v e ls e tf u n c t i o ni np e r i o d ;b yu s i n g t h eg e o m e t r i c a lm e a s u r e ,t h ec o n v e r g e n c eo fl e v e ls e tm o d e li sd e t e c t e d ;a n d t h ei n f l u e n c e so fe a c hp a r a m e t e r si nt h ew h o l ep r o c e s sa r ed i s c u s s e d ;f i n a l l y t h i sc h a p t e rs h o w sr e s u l t sa n dd i s c u s s i o na b o u tt h el e v e ls e tm o d e l so nh i v 二l p r o t e a s em o l e c u l a rf i e l da n dd p sp r o t e i nm o l e c u l a rf i e l d s 一n t a b s t r a c t t e c h n i q u e so ft o p o l o g i c a la n a l y s i sa n dm u l t i a t t r i b u t ec o m p a r i s o no fl e v e ls e t e v o l u t i o n a ls u r f a c e sa r ep r e s e n t e d o no n es i d e ,w ep r o p o s eav o l u m ef e a t u r e e x t r a c t i o nf u n c t i o nt od e t e c tt h et o p o l o g i c a lf e a t u r e si m b e d d e di nt h el e v e ls e t s u r f a c e s ;o nt h eo t h e rs i d e ,w ec o m p u t et h eg e o m e t r i c a la n db i o l o g i c a la t t r i b u t e s o nl e v e ls e ts u r f a c e ,a n de x p l o r em u l t i p l ea t t r i b u t e so nt h el e v e ls e ts u r f a c et o s t u d yt h ep r o g r e s s i o no ft h em o l e c u l a rf i e l d b a s e dc o n f o r m a lg e o m e t r yt h e o r y , t h ef u r t h e rs t u d yo fg e o m e t r i c a la n dt o p o l o g i - c a lf e a t u r eo nl e v e ls e ts u r f a c ei sp r e s e n t e d f i r s t ,w ec o m p u t et h eg a u s s i a nc u r - v a t u r ea n dm e a nc u r v a t u r eo fl e v e ls e ts u r f a c eo nm o l e c u l a rf i e l d ,t oe x p l o r et h e s u r f a c el o c a lg e o m e t r i c a lf e a t u r ed i s t r i b u t i o n ;a l s o ,b yu s i n ge u l e r - c h a r a c t e r i s t i c f o r m u l a r , t h eg l o b a ls u r f a c et o p o l o g i c a lf e a t u r ei sd e s c r i b e db yg e r m sn u m b e r ; t h e nw ec l a s s i f ys u r f a c e sb yt h ec o n s t a n tc u r v a t u r em e a s u r e ,a n dc o n f o r m a lm a p t h el e v e ls e ts u r f a c e so nm o l e c u l a rf i e l d ;f i n a l l y , w ec o m p u t et h ec o n f o r m a lf a c - t o rd i s t r i b u t i o no nl e v e ls e ts u r f a c e w h i c hi n d i c a t e st h es u r f a c ei n t r i n s i cf e a t u r e t h e nw ec o m p a r ed i f f e r e n tm o l e c u l a rf i e l du s i n gt h e i rc o n f o r i l l a lf a c t o r s o u ra p p r o a c hp r o v i d e sa l li n t u i t i v ew a yt os t u d ym o l e c u l a rs t r u c t u r e 。a c t i v i t yr e l a - t i o n s h i p s i n i t i a lr e s u l t so ns o m et y p i c a lp r o t e i nm o l e c u l e sr e v e a l st h e i ra c t i v er e g i o n i n s i d e ,s u c ha st h ee s c a p er o u t eo fw a t e rm o l e c u l e sh i d d e ni nt h eh i v - 1p r o t e a s e ,t h e i n t e r n a lc a v i t yo ft h ed p sp r o t e i nf b rt l l ei r o na t o m se n t r yo rd e p o s i t i o n t h em o l e c u l a ra c t i v i t yc h a n g eo fh i v - ip r o t e a s ei nw a t e rd u r i n gs m dp r o c e s s ,a n dt h eg l o b i n h o m o l o g yp r o t e i ng r o u ps i m i l a r i t yd u r i n ge v o l u t i o nc a nb es u c c e s s f u l l yf o u n d ,w h i c h a r ei na c c o r d a n c ew i t hb i o l o g i c a le x p e r i m e n t s k e yw o r d s : m o l e c u l a rf i e l d ,f e a t u r ea n a l y s i s ,l e v e ls e te v o l u t i o n a ls u r f a c e s , v a r i a t i o n a lf o r m u l a t i o n ,s t r u c t u r a la n db i o l o g i c a lp r o p e r t i e s ,c o n f o r m a lf a c t o r , h i v - 1p r o t e a s e ,d p sp r o t e i n ,g l o b i np r o t e i n 一一 f 4 目录 图i 1 图1 2 图1 3 图i 4 图1 5 图2 1 图2 2 图2 3 图2 4 图2 5 图3 1 图3 2 图3 3 图3 4 图3 5 图3 6 图3 7 图3 8 图3 9 图3 1 0 图3 1 1 图3 1 2 图3 1 3 图4 1 图4 2 图4 3 图4 4 图4 5 图4 6 图4 7 图4 8 图4 9 图4 1 0 图4 1 1 图4 1 2 图目录 蛋白质分子四种结构水平2 x 一射线衍射测定蛋白质结构示意图2 冷冻电子显微术测定蛋白质结构示意图 4 i d p s 蛋白质分子的多种表示模型5 分子表面示意图7 类固醇分子的c o m f a 力场计算示意图1 4 h i v - i 蛋白酶的新卡通模型和球棍模型2 0 h i v - i 蛋白酶分子场临界点分布2 2 h i v - i 蛋白酶分子场等值面2 3 蛋白质分子的三维数据场体绘制效果2 5 散乱点三角网格重建图:? 2 7 三角网格曲面去噪、光顺与增强图2 7 体数据上抽取等值面2 8 l e v e ls e t 方法应用于图像分割图2 9 l e v e ls e t 方法应用于流体动画图2 9 l e v e ls e t 方法应用于生物医学图像3 0 速度函数,与界面r 的关系3 1 l e v e ls e t 方程计算流程图4 2 h i v - i 蛋白酶v a l ld e rw a a i s 能量场数据的l e v e ls e t 等值面的两种绘制方法4 3 d p s 蛋白质v a i ld e rw a a i s 和静电势能量场数据的l e v e ls e t 等值面4 4 h i v - i 蛋白酶v a nd e rw a a l s 能量场数据的l e v e ls e t 等值面演化中参数t 的选 取对演化结果体积以及表面积的影响4 5 h i v - i 蛋白酶v a _ r id e rw a a l s 能量场数据的计算中对由的不同初始化对演化结果 体积以及表面积的影响4 6 d p s 蛋白质v a nd e rw a a l s 能量场数据的计算中演化结果体积及表面积的变化4 7 木瓜蛋白酶的m o r s e - s m a l e 复形表面分析5 0 n e g h i p 电子云随机分布场的m o r s e s m a l e 复形分析5 1 肌浆球蛋白分子曲面的m o r s e - s m a l e 复形分析( a - b ) ,以及分子( p d b i d :1 b r s ) 曲面 的m o r s e s m a l e 复形5 1 血红素分子的电子密度场等值面( a ) 及其轮廓树( b ) 5 2 血色素蛋白时变数据场轮廓树分析结果5 2 i a t t ( 左图) 和i k a a ( 右图) 的凹形区域轮廓树比较5 2 分子场等值面与l e v e ls e t 曲面5 3 d p s 蛋白质v a nd e rw a a l s 能量场的l e v e ls e t 曲面演化过程5 4 构造体特征函数抽取拓扑结构特征区域示意图5 5 静态d p s 蛋白质v a nd e rw a a l s 能量分子场的带属性l e v e ls e t 曲面的相似度分析6 1 蛋白质分子条带模型( a ,c ) 和分子场的l e v e ls e t 曲面( b ,d ) 6 2 动态h i v - i 蛋白酶分子场l e v e ls e t 曲面体绘制效果6 4 图目录 图4 1 3 图4 1 4 图4 1 5 图5 1 图5 2 图5 3 图5 4 图5 5 图5 6 图5 7 图5 8 图5 9 图5 1 0 图5 1 1 蛋白质分子场的拓扑特征抽取及可视化6 5 h i v - 1 蛋白酶动态分子场拓扑特征的变化6 7 分子场的l e v e ls e t 曲面的多属性相似度分析6 8 大脑皮层曲面的共形映射结果7 0 结肠曲面的共形映射结果7 1 动态h i v - 1 蛋白酶分子场l e v e ls e t 曲面的高斯曲率分布图7 8 动态h i v - 1 蛋白酶分子场l e v e ls e t 曲面的平均曲率分布图8 0 分子场l e v e ls e t 曲面亏格图8 1 c i r c l e 角度示意图8 4 欧式三角形、双曲三角形、球面三角形8 7 相同物种脱氧血色素分子曲面的共形因子分布比较8 9 不同物种血色素分予曲面的共形因子分布比较9 0 h i v - 1 蛋白酶动态分子场l e v e ls e t 曲面的共形因子分布9 0 h i v - i 蛋白酶动态分子场l e v e ls e t 曲面的共形因子分布变化9 1 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得逝姿盘堂或其他教育机 构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献 均已在论文中作了明确的说明并表示谢意j 学位论文作者签名:研节 签字日期 伽7 年 舌月箩日 学位论文版权使用授权书 本学位论文作者完全了解迸江盘鲎有关保留、使用学位论文的规定, 有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和 借阅。本人授权迸姿盘堂可以将学位论文的全部或部分内容编入有关数据库 进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名: 研啼 导师签名: 劳乡拜侈 签字日期:汩c 7 年1 月f 日 签字日期:幽汐降6 月日 学位论文作者毕业后去向: 工作单位: 通讯地址: 电话: 邮编 第一章绪论 第一章绪论 1 1 蛋白质分子三维结构研究的重要性 c b a n f i n s e n 在进化的分子基础一书中指出:理解细胞行为的最佳方 式是研究蛋白质分子的结构与功能的关系。随着二十世纪生物学宏伟计划“人 类基因组计划”的完成,生命科学的研究正步入崭新的蛋白质组学时代,其主 要任务之一是揭示人体中约1 0 万种蛋白质的结构、功能及其与人类疾病之间的 关系,寻求预防和治疗疾病的方法。借助于x 射线晶体学、多维核磁共振技术 或同源性建模等手段,科学家已经确定了许多蛋白质的空间三维结构【3 ,4 】,有 关蛋白质分子的结构与功能信息数据已得到大量积累。但迄今为止,对于蛋白 质功能进行分析的主流方法仍依赖于实验过程,例如常用的定点突变、基因敲 除、过量表达、二维凝胶色谱等。这些实验往往需要耗费大量的资金和时间。 “欲理解蛋白质分子的功能,必须先了解其结构”已成为分子生物学家的 共识。如何对这些耗费实验科学家大量时间和心血所累积的宝贵信息资源进行 挖掘、分析、处理、理解及综合,并进而构建起能全面揭示蛋白质本质的结 构功能模型,不仅对于在分子水平上揭示生命的奥秘具有重要的意义,而且也 为化学、制药等产业所亟需。 目前一般将蛋白质分子的空间结构理解为四级。第一级指多肽链中氨基酸 的顺序,靠共价键维持多肽链的连接;第二级结构指多肽链骨架的局部空间结 构,不考虑侧链的构象及整个肽链的空间排列,典型的有q 螺旋,p 折叠等;第 三级结构指整个肽链的折叠情况,包括侧链的排列,即蛋白质分子的空间结构 或三维结构;第四级结构描述的是多个肽链的组合( 如图1 1 ) 。 从生物学的角度看,蛋白质生物功能的关键在于其空间构象,运动着的结 构决定了蛋白质分子的生物功能,一个伸展开来或随机排布的肽链不具备生物 活性。生物学实验已经表明,某些一级结构高度相似的蛋白质分子,其功能有 时可能大相径庭。因此,研究蛋白质的三维结构不仅有助于了解蛋白质序列和 一1 一 第一章绪论 f a l 一缎镕目 呼怒翳叁 ( ”- 缎结构( c ) = g 结构 圈1i蛋白质分子四种结构水平 “) 口n # 构 结构之间的关系,也有助于发现蛋白质结构和功能之日j 的关系。 1 2 蛋白质分子三维结构的采集方法 迄今为止,通过殳验手段测定蛋白质结构的土要方法宵:x 一射线衍射【5 】、 核磁共振( n m r ) 6 1 、冷冻电镜显微术( c r y o e l e c t r o nm i c r o s c o p y , c r y o m e ) i t 、紫 外可见吸收光谱、质谱分析等。前= 种是目前最主要的史验测定蛋白质结构的 手段。 x 一射线衍射洲定蛋白质结构的流程是首先准备极纯的均一样品,并使之 结晶;再用x 线照射晶体,检测仪记录其衍射图;最后用计算机重建分子 的原千结构( 如图( 12 ) 所示) : 铒 0 、画 q j 图i2x 射线衍射测定蛋白质结构示意隔 这项技术的优点是:( 1 ) 可获得高分辨的蛋白质一配体复合物三维结构,( 2 ) 直 一2 一 曩矿 一q 茚 第一章绪论 接提供结合部位的结构信息和相互作用机理,( 3 ) 并可以测定尺寸较大的蛋 白质分子结构;但前提是要获得合适的蛋白质一配体复合物结晶作为实验准 备,而且得不到动力学信息。 核磁共振技术是1 9 4 6 年由美国斯坦福大学布洛赫( e b i o c k ) 和哈佛大学珀赛 尔( e m p u r c e l l ) 各自独立发现的。它是一种生物磁自旋成像技术。首先将 氢原子置于外加的强磁场内,用射频脉冲激发氢原子,产生核磁共振现 象;再利用空间编码技术,用探测器检测并接受以电磁形式放出的核磁共 振信号,输入计算机;最后处理转换数据,形成图像,得到分子的三维结 构。 与x 射线衍射技术相比,核磁共振方法的优点在于:( 1 ) 不需要获得蛋白质 一配体复合物晶体,( 2 ) 可以得到蛋白质的动力学信息,( 3 ) 直接提供详细的 结合部位信息和相互作用机理,( 4 ) 无需完整地测定蛋白质一配体复合物的 空间结构:但缺点是只能测定尺寸较小的蛋白质分子,而且不能测定混合蛋 白的结构。 二十世纪七十年代t a y l o rk 和g l a e s e rr m 开创了冷冻电子显微术,经过近 三十年的发展,这项技术已经成为研究生物大分子结构与功能的强有力的 手段。它的研究对象非常广泛,包括病毒、膜蛋白、肌丝、蛋白质核苷酸 复合体、亚细胞器等等。基本思路是快速冷冻生物样品溶液,并用电子束 照射,通过检测仪探测电子的散射情况,最后生成二维图像并用计算机重 建分子的三维结构。 冷冻电子显微术并不要求所研究的生物样品具有晶体结构;由于生物样品 是通过快速冷冻的方法进行固定的,克服了因化学固定、染色、金属镀膜 等过程对样品构象的影响,所以测得的结构数据更加接近样品的生活状 态。但缺点是测定结构的分辨率是以上三种技术中最低的。 尽管x 射线晶体学、核磁共振技术、冷冻电子显微术目前是蛋白质结构测 定最为有效的手段,但它们所获得的结构数据远远满足不了需要。因此,人们 一3 一 第一章绪论 ;, ! 孽蔓 。一 图1 3 冷冻电r 显微术测定蛋白鹿结构示意图【8 】 也借助f 信息、自动化方法对蛋白质分子结构进行理论预测,当前主要的方法 有三种: 一种是从头算方法( a b i n i d o ) ,如r o t b 【9 j 。这种方法理论上精确但计算 复杂度非常高。比如,对十一个只包含3 个町变二面角的小分子,若每隔6 0 度计 算一次能量,需计算2 1 6 个点;包含5 个可变二面角的分子需计算7 7 7 6 个点;对 于包含1 0 个可变二面角分子计算的点将会超过6 千万个。 第二种方法是线段模r d ( t h r c a d i n g ) ,如3 d p s s m i o ,即利用模式匹配的方 法,基于其同已知线段序列的吻合度得到结构信息。 第三种方法是间源性比较方法( h o m o l o g y ) ,如s w i s s m o d e l 1l 】,其基奉 原理是相似的序列结构,功能也相近,根据序列l 可源件分析、调整己知结构进 行结构预测。后者是目前最为有效的方法之一。 这些方法中,一类主要依赖于序列信息采用统计的方法来分析生物结构 和功能【1 2 】。另一类直接从实验测定已知的( 或预测出的) 二维结构出发,着 重考虑结构与儿何拓扑性质,进而分析其功能【1 3 ,1 4 。这两类方法均建立在对 生物大分子结构合理建模的基础之上。 一4 一 _ ,。 第章绪论 13 现有的蛋白质分子三维结构表示方法 对蛋白质分子的台理建模有助于耐f 宄人员理解蛋白质空m 结构及功能的关 系。从二十世纪七f 年代开始,研究者们推 h , 系列蛋白质分了的几何模 戳典型的有线状模型、棍状模型、球棍模型、c p k 模型、点石模型、带状模 型、 通模型、啪d e r w a a l s 模型等f 如罔l4 ) 。 懿豢 缱状挂 ( b ) c p k 模型 i 模州 黪擘繁 ( d ) 拳带模 ( 日十m 横利 ( o 啪如r w 刊s 摸 图14 】d p s 蛋白质分f 的多种表示模型 上述模型均基r 实验数据通过对蛋白质三维结构原了卒问定竹世连接关 系、g 链、二级结构、摸体( m o t i f ) 等进 r 合理抽象,将分了结构表达为一系列 空问线段和面模型的集合。它们的优势在于能为用,1 t 提供一种简单、直观和交 互的方式辅助观察分子的几何干拓扑结构。 近年来,蛋白质分子结构模型已经不限于单纯的硅示模型,f l 现了分了表 面模型和分子拓扑模型等辅助分析模型1 5 1 7 1 ,用以描述、显示蛋白质分子表 第一章绪论 面的溶剂小分子可达( a c c e s s i b l e ) 面积和蛋白质分子内原子或基团的排列结构 等,并发展成可以分析蛋白质的运动,进而预测蛋白质的功能及其相互作用的 新方法。1 9 9 9 年,m a r c o t t e 及其合作者提出可以从基因组序列推断蛋白质的相 互作用。该方法从序列信息中发现一些相关的结构域,这些结构域在有机体中 可以组合成特定肽链。该方法基于蛋白质的亲和性对蛋白质相互作用的结构域 进行预测。这些方法大大提高了我们对蛋白质功能的认识能力 1 8 】。但是,仍 然无法对一级结构高度相似而功能却不同的蛋白质分子的作用机理作出解释。 不难发现,现有的分子几何模型缺乏对分子的运动、分子静电势场的有力 刻画。其一是,分子图和线面表示缺乏对力场的表示。力场是一个分布在三维 空间中连续的空间量。在分子图表示中,原子之间的距离用连通关系表示,而 线面表示中,力的作用是通过球面之间相连的棍状表示。两者仅仅反映了关系 的存在,而无法表达力的大小、位置和相对方位。其二,蛋白质分子时刻都处 于运动之中,三维空间中的力场是一个变化的量。已有的蛋白质三维结构模型 难以表达出动态的整体状态。因而在此基础上进行几何结构分析尚存在难以突 破的局限性。 1 4 蛋白质分子三维结构分析方法 关于蛋白质分子的建模与分析的文献很多,本节我们简单描述最相关的代 表性工作。 1 4 1 分子拓扑学 自pg m e z e y 开展分子势能面拓扑性质的研究以来,微分和拓扑已经成为 有效地分析分子体系化学结构以及与反应机理之间关系的工具。这些工具通常 考虑某一邻域范围内关键点,并有效地抽取局部特征。例如,定义分子势能面 为多维空间上的超曲面,在其上定义一个连续的势能函数u ( x ) ,其临界点即梯 度为零的点。由于临界点处蕴涵着某种特征,故须在临界点处对势能函数做二 阶微分,计算曲率并分析其类别。基于数据来源的限制,分子势能函数u ( x ) 多 一6 一 第一章绪论 以离散形式表示。 拓扑分析的方法也存在一定的局限性。例如,它缺乏定量描述,没有具体 的感知和度量标准,需要和其它有效的分析方法相结合来描述分子势能面特 性。 1 4 2 分子表面分析 分子表面是分子的边界,在一定程度上蕴含了分子的生化属性信息,对分 子表面的分析将有助于理解分子对接、识别、相互作用等问题。目前已发展 出多种分子表面生成算法,如c o n n o l y 1 9 通过计算水分子探针球在原子表面的 滚动路径,来生成溶剂可达曲面( s o l v e n ta c c e s s i b l es u r f a c e ,s a s ) 、溶剂外部曲 面( s o l v e n te x c l u d e ds u r f a c e ,s e s ) ( 女i 图1 5 ) ;j i a n g 2 0 等人剖分蛋白质分子所在空 间,用一系列空间立方体表示分子表面;s h o i c h e t 与k u n t z 2 1 将分子表面表示为不 同半径球的集合等等。 图1 5分子表面示意图 从分子表面出发的蛋白质相似度研究具有代表性的工作有: b d c k m a n n d x 组【2 2 】以c o n n o l l y 函数生成的分子溶剂可达曲面为研究对象,计 算分子表面上所有离散点的局部c a n o n i c a l i 抽率,并将区域内所有点的曲率平 均值作为该区域的整体曲率,用来判断分子相互作用过程中分子表面的形 状相似度及互补可能性。 f i s c h e r 2 3 等人依据几何哈希范例比对分子曲面相似度。主要分为三 一7 一 第一章绪论 步:( 1 ) 搜索匹配种子对:将分子表面表示为一系列球的集合,利用几何哈 希范例计算每种刚性变换下的匹配原子对个数;( 2 ) 聚类匹配种子对:将同 等变换下匹配的种子对聚为一类;( 3 ) 扩展匹配种子对。 m a s e k 2 4 等人定义分子皮肤( s k i n ) ,并利用两个相互作用分子皮肤之间的 相交部分体积大小来描述分子的相似度。所谓皮肤是指分子内外表面之 间的夹层部分,其中,分子内表面可为v a nd e rw a a l s 曲面或溶剂可达曲面,在 分子内表面基础上增加个水分子半径的距离曲面,即得到分子外表面。 然后通过旋转、平移等刚性变换来得到相互作用分子的最佳匹配。 1 4 3 相关分子数据场分析方法 注意到一个生物大分子是一个包含成千上万个原子的系统,其内部存在多 种作用力:化学键力、氢键力、库仑力、范德华力等。单个分子的能量除了电 子能量和核间排斥能外,还有分子的平动能、转动能和振动能等。当原子相互 接近到吸引和排斥达到平衡时,体系能量最低,此时原子间保持一定的接触 距离。这个包含各种力作用的原子系统可统一表示为分子力场( m o l e c u l a rf o r c e f i e l d ) ,形成相对稳定的空间分子结构。 对分子力场进行分析有多种思路,下面主要讲述与我们研究相关的两种分 析方法。 1 针对药物小分子的比较分子场分析法: 在计算机辅助药物设计中,比较分子场分析法( c o m p a r a t i v em o l e c u l a rf i e l d a n a l y s i s ,c o m f a ) 直是研究的热点,经过十几年的发展,目前已成为 最成熟且应用最广泛的三维定量构效方法( t h r e e d i m e n s i o n a lq u a n t i t a t i v e s t r u c t u r e a c t i v i t yr e l a t i o n s h i p s 。3 d q s a r ) 。其基本原理是:首先在分子周 围定义分子场空间并均匀划分,在每个格点上计算分子场特征( 一般为静 电场和立体场,有时也包含疏水场和氢键) ,然后采取偏最小二乘法进行 回归分析,建立化合物生物活性和分子场特征之间的关系。 一8 一 第一章绪论 对于小分子( l n r a ) ,c o m f a 从分子的拓扑、几何、结构、物理、化学属 性出发,揭示结构与功能的关系,取得一定的成功。c o m f a 对于静态小分 子场分析较为有效,但对于蛋白质等大分子尚缺乏有效的算法构建具有明 确物理意义的数据场。 2 对分子电子密度场的分析方法: 利用分子的电子密度场分析蛋白质结构特性是一种较常用的方法,但这种 数据场本身仅仅反映了分子的各个原子在空间中的分布情况,只适合于描 述分子的结
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医疗旅游中的人文关怀服务设计研究
- 医疗创新科技引领职业教育的变革与进步
- 审计历史与未来发展的趋势试题及答案
- 2025年西班牙语DELE考试真题卷:西班牙语考试阅读理解与解题技巧试题
- 医疗卫生的桥梁-公共卫生与劳动教育的结合
- 中级审计师考试中的知识整合与试题及答案
- 完整概述初级审计师考试内容试题及答案
- 从理论到实践区块链技术在加密经济中的应用研究
- 医疗伦理视角下的共情决策分析
- 河南全国计算机msoffice题库单选题100道及答案
- GB/T 3953-2024电工圆铜线
- 碘缺乏病知识宣传课件
- 曙光医院网上查报告
- GA/T 1093-2023安全防范人脸识别应用出入口控制人脸识别技术要求
- 港口危货作业单位主要安全管理人员试题及答案(536道)
- 2024年监理工程师考试《三控》真题与答案
- 2024年天津市初中地理学业考查试卷
- 《电工安全操作规范》课件
- 卧床患者常见并发症护理专家共识
- 管理干部安全生产培训课件
- 山东药品食品职业学院招聘真题
评论
0/150
提交评论