




已阅读5页,还剩52页未读, 继续免费阅读
(生物物理学专业论文)不同类型氨基酸网络参量及其与蛋白质折叠的关系研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
, y 1 7 8 7 百岑芗 s t u d y o nt h ec h a r a c t e r so fd i f f e r e n t t y p e s o fa m i n oa c i dn e 们o r k sa n d t h e i rr e l a t i o n sw i t hp r o t e i nf o l d i n g ad i s s e r t a t i o ns u b m i t t e dt ob e i ji n gu n i v e r s i t y o f t e c h n 0 1 0 9 y f o rm a s t e r sd e g r e e b y l i c h e n gy a n d i r e c t e db yp r o f e s s o rc u n x i nw a n g c o l l e g eo fl i f es c i e n c ea n db i o e n g i n e e r i n g b e i ji n gu n i v e r s 时o ft e c h n o l o g y m a y ,2 0 1 0 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育 机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何 贡献均己在论文中作了明确的说明并表示了谢意。 关于论文使用授权的说明 抽f 口e 【秒 本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有 权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部 或部分内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 虢手“新繇已舀秒眇吖、。 摘要 摘要 蛋白质是生命系统中重要的生物大分子,它在生物体的繁衍、新陈代谢、 生长发育等一切生命活动中发挥着重要的生物学功能。研究蛋白质结构的形成 机制具有重要的理论和现实意义。自由能曲面理论为蛋白质折叠机理的研究提 供了很好的理论框架,被广泛应用于蛋白质折叠热力学和动力学机制的研究。 然而,能量函数和能量曲面的构建又存在一些困难。大量的实验和理论研究表 明,蛋白质的折叠速率和机制在很大程度上是由天然态的拓扑结构所决定的, 而不是完全取决于原子之间的精细的相互作用。因而,探究蛋白质拓扑结构和 折叠机制之间的内在联系,通过蛋白质拓扑特征的分析获取折叠动力学信息, 是一个很有意义的研究内容。 。 在本论文中,基于残基物理化学性质的差异性,分别构建了蛋白质氨基酸 网、疏水网、亲水网、亲水一疏水网,进而计算了各网络的匹配系数和聚集系 数,计算表明除了亲水一疏水网,其它类型的氨基酸网络的匹配系数均为正值。 通过考察这两个参量与折叠速率之间的关系,发现疏水网的匹配系数与折叠速 率之间有着非常明显的线性正相关关系。这说明了疏水残基之间相互作用的协 同性对于蛋白质的快速折叠是有利的,可以促使蛋白质在非常短的时间内折叠 成特定的三维空间结构。同时,亲水网的聚集系数与折叠速率有明显的线性负 相关关系,表明疏水残基间三角结构的形成不利于蛋白质快速折叠。另外,我 们还构建了相应的长程网络以观察各网络中长程残基间的相互作用对蛋白质折 叠过程的影响,发现长程网络的平均聚集系数与折叠速率呈现出明显的负相关 关系,说明序列上长距离残基之间接触的形成不利于快速折叠。 论文的研究结果表明,蛋白质的天然拓扑结构中蕴含了非常丰富的生物学 信息,通过复杂网络的方法可以有效地提取并分析这些信息,进而有助于我们 更进一步理解和揭示蛋白质折叠机理。 关键词:蛋白质折叠;氨基酸网络;拓扑性质:网络参量;折叠速率 a b s t r a c t a b s t r a c t p r o t e i n sp l a ya ni n l p o n a l l tr o l ei nt h el i f es y s t e m ,a 1 1 dp e r f 0 ms i 印i 丘c a i l t b i o l o g i c a l 内n c t i o n si na l lo ft h el i f ea c t i v i t i e s ,s u c ha sm u l t i p l i c a t i o n ,m e t a b o l i s m , 孕d w t ha i l dd e v e l o p m e n to fl i f e f o n n s i ti st 1 1 e o r e t i c a l l ya n dp r a c t i c a l l ys i g n i f i c a m t os t l l d yt h em e c h 锄i s mo fp r o t e i nf o l d i n g t h em e o 巧o f 五r e ee n e r g ys u r f a c eh a s p r o v i d e dt h em e o r e t i c a l 缸i m e w o r kt os t u d yp r o t e i nf o l d i n gm e c h a i l i s m ,w h i c hh a s b e e l lw i d e l yu s e di nt h er e s e a r c ho ft h e n l l o d y n 锄i c sa i l dl ( i n e t i c so fp r o t e i nf o l d i n g h o w e v e r ,t h e r ea r es t i l ls o m et r o u b l e si nc o n s 咖c t i n go ft h ee 1 1 e r g ys u r f a c e m a i l y e x p e n m e n t a l a i l dt h e o r e t i c a ls t u d i e sh a v es h o w e dt h a tt l l e f 0 1 d i n g r a t ea l l d m e c h a n i s mo fp r o t e i n sa r el a r g e l yd e t e n 】 1 i n e db yt h e i rn a t i v es t n l c t u r et o p 0 1 0 9 y i n s t e a do ft h ed e t a i li n t e r a c t i o n sb e t w e e na t o m s t h e r e f o r e ,i ti s m e a n i n g 如l t o e x p l o r et h er e l a t i o n s h i pb e t w e e np r o t e i ns t n l c t u r a lt o p o l o g ya n di t sc o r r e s p o n d i n g f o l d i n gm e c h a i l i s m ,a n dt h e nt oo b t a i nt h ei n f o r m a t i o na b o u tf o l d i n gd y l l 锄i c s t h r o u 曲t h ea n a l y s i so fp r o t e i nt o p 0 1 0 9 i c a lf e a t u r e s i nt h i sd i s s e r t a t i o n ,a c c o r d i n gt ot h ed i f f e r e n tp h y s i c o c h e m i c a lp r o p e r t i e so f d i f ! f e r e n tr e s i d u e s ,w eh a v ec o n s t m c t e da m i n o - a c i dn e t w o r k ,h y d r o p h o b i c 锄i n oa c i d n e t 、) i ,o r k ,h y d r o p h i l i c 锄i n oa c i dn e t 、v o r k ,a n dh y d r o p h o b i c - h y d r o p h i l i c 锄i n oa c i d n e 觚o r k t h e n , t h ea s s o r t a t i v ec o e 伍c i e n ta n d c l u s t e r i n gc o e m c i e n to ft h e s e n e 研o r k sw e r ec a l c u l a t e d ,r e s p e c t i v e l y i ti sf o u n dt h a tt h ea s s o r t a t i v ec o e m c i e n to f a l lt h e s et y p e so f 锄i n o a c i dn e t w o r ki sp o s i t i v ee x c 印t y d r o p h o b i c h y d r o p h i l i c 锄i n oa c i dn e t w o r k ni sa l s of o u n dt h a tt h e r ei sc l e a r l yal i n e a rp o s i t i v ec o r r e l a t i o n b e 觚e e nt h ea s s o n a t i v ec o e 佑c i e n to ft h eh y d r o p h o b i ca m i n oa c i dn e t w o r ka n dt h e f o l d i n gr a t eo ft h ec o l l r e s p o n d i n gp r o t e i n ,w h i c hi n d i c a t e st h a tt h ec o o p e r a t i v e i n t e r a c t i o n so ft h eh y d r o p h o b i cr e s i d u e sc a np r o m o t et h ep r o c e s so fp r o t e i nf o l d i n g m o r e o v e r ,t h er e s u l t sa l s os h o wt h a tt h ec l u s t e r i n gc o e 街c i e n to ft h eh y d r o p h o b i c n e t w o r kh a sa i lo b v i o u s l yl i n e a rn e g a t i v ec o r r e l a t i o n ,w i t ht h ef o l d i n gr a t e ,w h i c h i m p l i e st h a tt h ef o m i n go ft h e 锕a n 9 1 es t l l l c t u r ei nt h ep r o t e i nw a su n f a v o r a b l ef o r p r o t e i nf o l d i n g i na d d i t i o n ,w ea l s oc o n s t r u c t e dl o n g d i g t a n c e i n s e q u e n c en e t w o r k s 北京工业大学理学硕二l = 学位论文 t o 咖d yt h e 硼u e n c eo f t l l ei n t e r a c t i o n sb e 似e e nl o n 争d i s t a n c er e s i d u e si ns e q u e n c e o np r o t e i nf o l d i i l g i ti sf o u n dt h a tt l l ef o m l i n go ft h ec o n t a c t sb e t w e e nd i s t a i l t r e s i d u e si ns e q u e n c ew i l ld e l a yt h ep r o c e s so fp r o t e i nf o l d i n g t h ea b o v er e s u l t ss h o wm a tt h en a t i v et o p o l o 西cs t n l c t u r eo fp r o t e i n sc o n t a i n s p l e n t yo f b i o l o g i c a l i n f o 咖“o n ,a n di t c a nb ee 虢c t i v e l yo b t a i n e da n da n a l y z e db y t h ei n t r o d u c t i o no fc o m p l e xn e t w o r k t h es t u d i e si nt 1 1 i sd i s s e f t a t i o nh e l pu st o 矗l n b e ru n d e r s t a i l dp r o t e i nf o l d i n gm ec _ h a i l i s m s k e yw o r d s :p r o t e i nf o l d i i l g ;锄i n o a c i dn e t w o r k ;t o p o l o g i c a lf e a t u r e ;c h a r a c t e ro f n e 觚o r k ;f o l d i n gr a t e 目录 目录 摘要i a b s t r a c t i i i 第1 章蛋白质折叠研究方法与现状1 1 1 蛋白质折叠的研究背景及意义1 1 2 蛋白质折叠研究现状2 1 3 蛋白质折叠的模型介绍和计算机模拟方法3 1 3 1 折叠模型介绍3 1 3 2 分子动力学模拟5 1 3 3 蒙特卡罗模拟6 1 4 蛋白质天然拓扑结构对折叠过程的影响一7 第2 章复杂网络方法及其在生命科学中的应用1 1 2 1 引言1 1 2 2 复杂网络的统计特征1 3 2 2 1 度和度分布1 3 2 2 2 平均路径长度1 3 2 2 3 聚集系数1 4 2 2 4 介数1 5 2 2 5 度和聚集系数之间的相关性1 5 2 2 6 加权网络1 6 2 3 复杂网络在生命科学中的应用1 7 2 3 1 复杂网络在蛋白质结构一功能关系研究中的应用1 7 2 3 2 疾病传播18 2 3 3 生物网络一1 9 2 4 本章小结2 0 第3 章不同类型氨基酸网络参量与蛋白质折叠的关系2 1 3 1 引言_ 2 l 3 2 体系与方法2 2 北京工业大学理学硕七学位论文 3 3 结果与讨论2 3 3 3 1 氨基酸网络的拓扑特征2 3 3 3 2 网络拓扑参量与蛋白质折叠之间的关联2 6 3 4 本章小结3 0 总结与展望3 3 参考文献3 5 攻读硕士学位期间发表的学术论文4 3 致谢4 5 第1 章蛋白质折叠研究方法与现状 第1 章蛋白质折叠研究方法与现状 1 1 蛋白质折叠的研究背景及意义 随着人类基因组计划的顺利完成,以功能基因组学和蛋白质组学为主要研 究内容的后基因组时代已经到来。n a t u r e 、s c i e n c e 在2 0 0 1 年2 月公布人 类基因组草图的同时,分别发表了“a n dn o wf o rt 1 1 ep r o t e o m e ”【1 】和“p r o t e o m i c s i ng e n o m e l a l l d ”【2 】的评述与展望,将蛋白质组学的地位提到前所未有的高度。 蛋白质折叠是蛋白质组学研究的热点领域之一,具有重要的理论和现实意义。 储存在d n a 分子中的遗传信息,转录到r n a ,然后翻译为蛋白质的氨基 酸序列,三联密码的破译使人们掌握了这种从d n a 到氨基酸序列的信息传递 过程。但是,氨基酸一级序列如何折叠成蛋白质特定的三维结构,目前还不清 楚。这一问题称为蛋白质折叠问题,也称为“第二遗传密码”【3 】。2 0 世纪6 0 年代,a n f i n s e n 及其同事完成了一系列蛋白质变性复性实验后,提出了蛋白质 折叠的“热力学假说”【4 】:蛋白质的一级结构包含了其三维折叠结构的全部信 息,即蛋白质一级结构决定其三级结构。在合适的条件下,蛋白质能够从完全 伸展的肽链自发折叠到一个稳定的具有生物活性的天然状态。大量理论和实验 结果表明,蛋白质的折叠过程在很大程度上是由其天然拓扑结构所决定的,而 不是取决于原子间的精细的相互作用【5 ,6 1 。因而,探究蛋白质拓扑结构和折叠机 制之间的内在联系,通过蛋白质拓扑特征的分析获取折叠动力学信息,是一个 很有意义的研究内容。 、, 除了其重要的理论意义以外,蛋白质折叠的研究还有其现实意义和应用前 景。人们对由于基因突变引起疾病的情况已有所了解,即所谓“分子病”,如地 中海镰刀状红血球贫血症就是因为血红蛋白分子中第六位的谷氨酸突变成了颉 氨酸。现在发现蛋白质分子的氨基酸序列没有改变,只是结构或者说构象有所 改变也能引起疾病,即所谓“构象病”,或称“折叠病”【7 1 。许多疾病,如阿兹海默 症( a 1 z h e i l n e r s ) ,疯牛病( m a dc o w ,b s e ) ,可传播性海绵状脑病( c j d ) , 肌萎缩性脊髓侧索硬化症( a l s ) ,还有帕金森氏症( p a r k i n s o n s ) 等正是由于 一些细胞内的重要蛋白质聚沉或错误折叠而造成的。因此,深入了解蛋白质折 北京工业大学理学硕十学位论文 叠与错误折叠的机理对于这些疾病的致病机制的阐明以及治疗方法的寻找将大 有帮助。除此以外,基因测序技术的发展使我们得到了大量的蛋白质序列,而 要揭示它们的生物学功能,相应结构信息的获得是十分重要的。依靠现有手段 ( x m y 晶体衍射、n m r 及电镜) 测定蛋白质的结构需要较长的时间,因此结 构解析的步伐己落后于发现新蛋白的步伐。而基于知识的蛋白质结构预测的方 法虽然速度较快,但可靠性并不高,只有当我们对于维持蛋白质结构,驱动蛋 白质折叠的理化因素更为了解,这一方法才可能有根本的改进。另外,我们对 于蛋白质蛋白质相互作用与识别也有赖于蛋白质折叠机制的阐明。 1 2 蛋白质折叠研究现状 a n f i n s e n 的著名蛋白质复性实验证明了蛋白质完全有能力完成自发折叠, 并且一级结构中也包含了折叠所需要的所有信息。并且蛋白质的自发折叠还是 生物自组织性的一个简单的实例,有着非凡的意义。然而从“第一原理”出发, 直接计算蛋白质折叠过程,就目前的计算机发展水平还是非常困难的。目前, 用蛋白质的全原子模型【8 】进行折叠过程的模拟还只能在一些小肽中实现【9 】,虽然 己取得一些进展,但距离真正用计算机模拟真实蛋白质整个折叠过程还有很长 距离。美国i b m 公司在2 0 0 0 年提出一个名为“蓝色基因”计划,即要用五年时 间,研制一台一百万个处理器的大规模并行系统,以便用3 天c p u 时间,算出 一个实际蛋白的折叠过程。如此庞大的计划表明在相当长的时间内,人们还必 须依靠实验和一些理论简化模型来研究蛋白质折叠这个基本课题。 当前,蛋白质折叠研究主要包括以下三个方面:( 1 ) 蛋白质折叠机制研究 【1 0 】,即蛋白质是如何在生物学的时间尺度内从一条伸展的多肽链到达其天然构 象;( 2 ) 蛋白质逆折叠( 蛋白质设计) 问题研究】,即天然结构是如何选择它 的氨基酸序列的。我们知道,蛋白质序列是进化的结果,而进化选择的机制是 什么呢? 我们如何设计出一条好的蛋白质序列从而能折叠到给定的结构昵? ( 3 ) 蛋白质结构预测【l2 1 ,即在已知序列的情况下,如何结合生物信息学以及计 算机算法来预测它的天然三维结构。 第1 章蛋白质折叠研究方法与现状 1 3 蛋白质折叠的模型介绍和计算机模拟方法 1 3 1 折叠模型介绍 为了研究伸展的多肽链是如何折叠成特定的三维空间构象,许多学者根据 不同的研究对象,提出了些蛋白质折叠的模型。 ( 1 ) 框架模型( f r 锄e w o r km o d e l ) 【1 3 】 该模型是基于相对稳定的、螺旋肽的研究提出的,它认为在多肽链折叠过 程中,在短时间内先迅速形成二级结构,一般倾向于首先形成螺旋和转角,以 及少量的发卡。这些二级结构也是不稳定的,多肽链在二级结构的基础上再 进行组装,借助于溶剂的相互碰撞,逐渐形成更大的微单元,最终形成三级结 构。该模型认为二级结构的形成通常先于三级结构的形成,并且是独立的。即 使是一个小分子的蛋白也可以一部分一部分的进行折叠,其间形成的“亚结构 域”是折叠中间体的重要结构。 ( 2 ) 成核生长模型( n u c l e a t i o ng r o w t hm o d e l ) 【1 4 】 该模型认为,折叠过程中不存在中间态,二级结构的形成和塌缩过程同时 发生。在折叠进程的初期,自由伸展的多肽链先形成若干小“核 ( n u c l e i ) , 这些小“核 由8 1 8 个氨基酸残基组成,这些残基在进化中属于保守残基,它 们之间不是由疏水作用维系的,而是由某些特异的相互作用使这些残基形成了 紧密堆积。这些小“核”随机波动,很不稳定,多肽链的其他部分以“核”为 模板,快速折叠“生长”,最终形成天然结构,而成核阶段被认为是折叠的限速 步骤。 ( 3 ) 疏水塌缩模型( h y d r o p h o b i cc o l l a p s em o d e l ) 【1 5 】 该模型认为,疏水驱动力通过排开溶剂,将非极性残基埋藏到蛋白质分子 内部,是蛋白质折叠的原动力。疏水作用首先驱动多肽链整体塌陷,使折叠发 生在有限的构象空间内,从而减少了构象搜索空间,这就导致多肽链形成“熔 球体 1 6 1 ( m o l t e n9 1 0 b u l e ) 。在此基础上,又由于局部和长程的氨基酸残基之 间的相互作用而形成天然结构。该模型还认为,疏水坍塌过程先于二级结构和 一些天然接触形成。目前,实验上已经观察到一些球蛋白在折叠过程中发生部 北京_ 下业大学理学硕士学位论文 分疏水坍塌,例如,肌红蛋白,芽胞杆菌r n a 酶抑制剂( b a r s t 砌【1 7 1 。 ( 4 )成核凝聚模型( n u c l e “o n c o n d e n s a t i o nm o d e l ) 删 随着蛋白质工程研究的深入,人们发现某些蛋白质符合简单的两态动力学 模型,不存在中间体,即蛋白质的二级和三级结构同时形成【1 9 】,于是f e r s h t 提 出了成核凝聚模型。该模型认为蛋白质在折叠过程中,形成的二级结构具有内 在的不稳定性,需通过三级结构的形成来增强其稳定性。在折叠过渡态中,长 程相互作用和其他一些天然疏水相互作用的形成有效地稳定了其中相对较弱的 二级结构。对于大部分蛋白质而言,在其折叠过渡态中,长程的三级相互作用 和二级结构构成了稳定的折叠子。过渡态的空间拓扑结构与蛋白质天然结构很 接近,可看作是天然态结构的一种扭曲形式。最接近天然态结构的稳定的折叠 子被称作折叠核,在过渡态中,离折叠核的距离越远,则扭曲越大。这个模型 综合了疏水塌缩模型和框架模型的特点,可以认为是疏水塌缩模型和框架模型 的一种中间路线。在折叠过程中,随着稳定的二级结构的数目增多,折叠将会 变的更有层次性,这时成核压缩模型倾向于框架模型。该模型已得到实验上的 验证。 ( 5 ) 扩散一碰撞模型( d i f j m s i o nc o l l i s i o nm o d e l ) 【2 0 ,2 1 ,2 2 】 该模型认为,蛋白质的折叠起始于多肽链上的几个位点,在这些位点上会 形成不稳定的二级结构单元或疏水簇。这些局部结构以非特异性的布朗运动的 方式扩散、碰撞、粘附,如果这种组装是有利的,这些“微结构域”就会稳定下 来,然后再进一步折叠成无活性的高度有序的中间体,最后转变为有活性的完 整天然态。该模型已被成功应用于理解和分析蛋白质折叠动力学的许多特征。 这些模型各有特点,它们之间存在许多相似之处。如“框架模型”中的“亚 结构域”与“成核生长模型”的“核”的观点有些相似。b a l d w i n 认为【2 引,在 多肽链的起始阶段,“疏水折叠”和二级结构的形成( 框架模型) 是互补的,它 们在多肽链的起始阶段是可以同时存在的。除了这些折叠模型以外,还有人从 另外的角度来考虑多肽链在体内的折型2 4 1 。在细胞中,新生肽链的折叠速度比 在体外的折叠速度快得多,而这一过程会受到细胞内许多酶的催化。细胞中还 存在着许多可以帮助蛋白质新生肽链折叠的蛋白质,称为分子伴侣【2 5 1 。这是一 类具有与疏水基团结合能力的蛋白质,在a t p 存在的条件下,不同的分子伴侣 4 第1 章蛋白质折叠研究方法与现状 作用或协同作用都能使伸展的多肽链重新折叠为具有天然构象的蛋白质。 实际上,由于蛋白质折叠方式的高度复杂性,很难用某一机制来描述所有 蛋白质折叠的过程。如对于二态折叠蛋白质c 1 2 ( c h y m o t r y p s i ni n h i b i t o r 2 ) ,其 折叠是高度协同的,过渡态必需是类天然的,折叠过程完全符合成核一凝聚机 制;而蛋白e n h d ( e n g r a i l e dh o m o e d o m a i n ) 含有很多稳定的螺旋结构,折叠 是逐步进行的,折叠过程大致符合框架模型。所以蛋白质折叠机制的研究还有 待于实验技术和理论方法的更大突破以及实验数据的进一步积累,才能建立起 对蛋白质折叠的本质l 生和规律性的认识。 1 3 2 分子动力学模拟 分子动力学模拟( m d ) 用于生物大分子的研究始于上世纪7 0 年代末【2 6 1 。 一般的实验系统对于分子内部精细的相关作用过程和机制缺乏足够的“透视”能 力,而模拟不但可以使我们了解事件发生的细节,而且能够较为本质地给出清 晰的结构与功能的关系。采用计算机模拟的方法,还可以对实验中复杂多变的 环境因素进行有效方便的控制和调节,能自如地控制体系内的各种相互作用和 考察感兴趣的因素对体系的影响,从而对体系演化过程的主要驱动力和物理本 质有更深入的理解。近年来随着计算机处理能力的大幅度提高,计算机模拟方 法在蛋白质折叠问题的研究中发挥着越来越重要的作用。在蛋白质折叠的模拟 研究中,分子动力学( m o l e c u l a rd y n 锄i c ,m d ) 【2 7 ,2 8 3 方法和蒙特卡罗( m o n t e c o ,m c ) 【2 9 ,3 0 1 方法应用最为广泛。 m d 模拟是在原子水平上,用经典的牛顿力学方程描述分子的运动过程,它 , 可以得到原子的运动轨迹,对于平衡系统,将m d 模拟采集到的轨迹进行时间 平均可以计算一个物理量的统计平均值。由于现在实验手段的局限,非平衡系 统的热力学过程中的许多微观细节在实验中无法观测到,这时,可通过对体系 进行一定时间尺度的m d 模拟来进行观察。随着计算机计算能力的提高、构象 空间采样技术的发展以及力场参数越来越精确,m d 模拟已广泛应用于生物大 分子动力学过程的研究【8 】。目前,显含水的蛋白质分子全原子m d 模拟的时间 尺度可达到上百纳秒甚至微秒【9 1 。1 9 9 8 年d u a n 和k o l l m a n 刚用全原子相互作用 势的m d 方法,模拟了个3 6 个氨基酸残基组成的多肽链在3 0 0 0 个水分子的 北京工业人学理学硕士学位论文 环境下的构象变化情况。整个模拟过程耗时2 个月,获取了去折叠态到一个稳 定中间态的1 微秒内的折叠轨迹。 体系中各个原子的初始位置以及描述原子间相互作用的经验势函数【3 2 】是影 响m d 模拟重要的两个因素。在实际应用中,解决办法是通过能量优化来消除 体系构象中原子问的不合理的接触,从而尽可能选择体系的平衡位置来作为计 算的初始位置,按照一定温度下的麦克斯韦分布对体系原子赋初速度。于是势 函数的选择成为影响m d 模拟结果精确性的最主要因素。分子力场的经验势函 数主要包括以下几项:键长能、键角能、二面角能( 正常二面角和非正常二面 角) ,范德华相互作用和静电相互作用,有的能量函数还包括氢键项。目前,常 用的力场主要有:a m b e r ( a s s i s t e dm o d e lb u i l d i n gw i me n e r g yr e 矗n e m e n t ) 力 场【3 3 】、h a r m m ( c h e m i s t wa th a r v a r dm o l e c u l a rm e c h a n i c s ) 力场3 4 1 、嘣p o s 力场【3 5 1 、g r o m o s ( g r o n i n g e rm o l e c u l a rs i m u l a t i o ns o f l w a r e ) 力场【3 6 1 。 目前分子动力学模拟方法已经在蛋白质动力学研究领域得到了广泛应用, 但是在研究蛋白质功能性运动时,就会表现出一定的局限性。主要体现在:第 一,在蛋白质体系内,分子的高频运动决定了m d 模拟中选取的积分步长通常 只能为飞秒时间量级,这就造成对长时间、大体系的分子模拟变得无法实施; 第二,动力学所描述的势函数的势能面不是光滑的,中间存在许多局部极小点。 当模拟采样陷入这样的局部极小点,需要较大的驰豫时间才能到达新的采样范 围,而采样时间是非常有限的,所以采样空间因此而受到限制。 针对以上存在的一些问题,人们提出了许多新的方法和技术。例如,对于 不同的运动类型采用不同的时间步长 3 7 1 。此外,还可以采用模拟退火【3 8 】和多复 本交换3 9 1 扩大采样空间。另外,还可以在体系原有势能的基础上,增加额外的 诱导力,以加速体系运动,相关的研究有s e l f 二g u i d em d 【4 0 1 、t a r g e t e dm d 【4 1 1 、 s t e e r e dm d 【4 2 】等。 1 3 3 蒙特卡罗模拟 m c ( m o n t ec 砌o ) 【4 3 卅方法是通过对系统的相空l 司进行随机抽样,来推 求模拟体系中各统计性质的方法。其基本思想是:在相空间中随机地采样并计 算目标函数值,经过大量采样后,计算体系中力学量的统计平均值。m c 方法 6 第1 章蛋白质折叠研究方法与现状 不受解空间结构和分布的影响,在采样数趋近无穷时收敛到最优解。然而现实 操作中不可能无限地试探解空间的点,为了让采样更有效,一般采用重要性抽 样方法。通过构造一定的m a r k o v 链,使得所获得的状态满足一定的分布。最 常用的重要性抽样方法就是m e 仃o p o l i s 方法。这个方法的基本思想是:假定体 系的温度为丁,当前的状态为口,其能量为e ( 仃) ,而下一步搜索得到的状态为 盯,其能量为e ( 盯) ,则对新状态的选取几率是: i l e ( 盯) e ( 仃) 尸2 t e 坤 兰墅三冬i 芋鳢 e c 盯, e c 盯, ( 1 - 1 ) 其中,尼b 为b o l t z m 锄常数。这样便构造了满足一定转移几率的m a r k o v 链,通过 这样采样获得的状态序列满足正态分布。对这样的序列进行平均,也就相应的得 到了一个等温系综的平均值。在实际模拟中,蛋白质的动力学过程是通过模拟多 肽链在格点上的自回避行走而实现的。 m c 算法是一种概率算法,未必能真实反映分子的折叠过程,实验上已经 发现蛋白质的多路径折叠,其折叠方式也存在一定的随机性,因此用m c 方法 来模拟折叠过程是合适的。尽管这一模拟方法不如全原子m d 那么准确,但是 它能够抓住折叠的一些重要的本质特征。m d 模拟结果基于粒子运动轨迹的时 间平均,而m c 模拟结果基于抽样所得各种状态的系综平均。考虑到动力学的 遍历性和模拟时间的可及性,两种方法获得结果有一定的差异性,通过结果的 对比则可以更好地理解蛋白质折叠过程受热力学主导还是动力学主导这一难 。题。 r ,: 1 4 蛋白质天然拓扑结构对折叠过程的影响 近年来的实验数据呈爆炸性增长,大量数据表明折叠进程中体现的基本物 理机制比我们事先想象的要简单的多。蛋白质结构的复杂性来源于肽链和氨基 酸残基上的原子之间如何相互作用。然而,不同蛋白质的多肽链折叠到天然态 在空间( 拓扑结构) 上的路径是非常相似的。蛋白质折叠速率和机制由空间拓 扑结构决定,而并非内部原子间的精细相互作用f 4 5 1 ,实验上从以下三个不同角 北京工业大学理学硕:卜学位论文 度证明了这一点: 1 、在人工实验【4 6 4 7 1 和进化过程4 8 1 中不改变蛋白质的整体拓扑结构的情况 下,氨基酸序列上的大规模改变对折叠速率的影响都在1 0 倍以内。这同时也说 明进化过程中蛋白质序列并没有达到最优化而实现快速折叠,也为简单模型的 方法学研究提供了可行性。 2 、人们对突变体的折叠动力学进行了研究,并用来预测那些拓扑结构相似, 而序列差异性大的蛋白质的过渡态结构,发现序列上的大规模差异对这些蛋白 质的过渡态结构的影响相对较小。 3 、小蛋白的折叠速率与其天然态拓扑结构的“接触序”有密切相关的关系。 不同蛋白质内部,若序列上距离近的原子( 低接触序) 相互作用所占比例较大, 则折叠速率会大于序列距离远( 高接触序) 的相互作用所占比例大的蛋白质。 这种相关性对折叠速率可以产生百万倍的影响,在将序列和拓扑结构不同的蛋 白质分别进行对比的时候显得尤其明显。简单的空间几何的知识就可以基本解 释不同蛋白质问的折叠速率的差异。 我们知道在折叠初期形成远程连接需要花费相对较大的熵损耗,因此天然 拓扑结构对折叠速率会产生非常重要的影响。由于序列距离远的残基间形成接 触将影响这些中间片段可能形成的构象数目,所以蛋白质中序列距离近的残基 间形成接触对快速折叠更为有利。类似地,我们可以知道在折叠过程中,距离 近的接触的形成时间总是先于那些远程连接。总的来说,形成所有的有利的本 地接触所花费的熵损耗的总量取决于蛋白质的天然拓扑结构。拓扑结构的重要 性在折叠的计算模型中也有所体现【4 9 ,5 0 ,5 1 ,5 2 1 。 由于蛋白质的序列结构决定了三维空间结构,因此蛋白质的稳定性和折叠 机制应该最终都是由氨基酸序列决定。但是研究发现,只有蛋白质稳定性与内 部原子接触有密切相关的联系( 将某些包埋在内部的碳原子移除后,蛋白质的 稳定性会发生较大的变化) ,折叠机制更加依赖于天然态的粗粒化的空间几何结 构。 综上所述,大量的实验和理论研究表明,蛋白质折叠过程很大程度上由其 天然拓扑结构所决定。如何通过蛋白质拓扑结构特征的分析来发掘蛋白质折叠 信息,具有重要的科学意义。本论文利用近年来发展起来的复杂网络理论和方 8 第1 章蛋白质折叠研究方法与现状 法,把蛋白质抽象为由大量氨基酸及其相互作用所构成的复杂网络,通过分析 网络的静态拓扑参量,揭示蛋白质拓扑结构与蛋白质折叠之间的内在联系。 9 北京t 业大学理学硕= j j 学位论文 1 0 第2 章复杂网络方法及其在生命科学中的应用 第2 章复杂网络方法及其在生命科学中的应用 2 1 引言 结构决定功能是系统科学的基本观点。如果我们将系统内部的各个元素作 为节点,元素之间的关系视为连接,那么系统就构成了一个网络,例如神经网 络可以看作是大量神经细胞通过神经纤维相互连接形成的网络、计算机网络可 以看作是计算机通过通信介质如光缆、双绞线、同轴电缆等相互连接形成的网 络,类似的还有电力网络、社会关系网络、交通网络等等。强调系统的结构并 从结构角度分析系统的功能正是复杂网络的研究思路,所不同的是这些抽象出 来的真实网络的拓扑性质不同于以前研究过的网络,且节点众多,故称其为复 杂网络( c o m l ) l e xn e t w o r k s ) 。复杂网络在自然界中大量存在,每一事物的出现 和事物之间的相互联系是随机的,对于单个事物我们无法通过它刻画出集体特 征,但是对由单个事物构成的整体研究却可以得到令人鼓舞的结果。人们已经 研究过的真实网络有互联网【5 3 1 ,代谢网络和生态网络【5 4 5 5 1 ,以及包括演员合作 网和科学网在内的社会网络【5 6 ,5 7 1 等。不论是哪一种网络其基本元素都是节点和 边,不同网络中作为研究对象的节点是不同的实体,边反映实体间的联系,这 种联系对i n t e m e t 是计算机间的物理连接,对于w r o r l d w i d ew 曲是网页间的超 链接,对细胞代谢网络则是将细胞联系在一起的化学反应。 大量研究发现,网络的拓扑结构决定着网络所拥有的特性5 9 ,6 0 ,6 1 ,6 2 1 ,例 如e r d 6 s 和r 6 n 虮在1 9 5 9 年提出的随机网络模型具有p o i s s o n 度分布,w s 模型 是w a t t s 。和s t r o g a t z 在1 9 9 8 年提出的小世界特征的网络模型,s c a l ef r e e 网络( s f ) 是1 9 9 9 年b a r a b a s i 和a l b e r t 提出的网络的度分布服从p o w e r - l a w 。因此研究网络 拓扑的构成有着不同寻常的重要意义。近年来,复杂网络取得进展的方面主要集 中在生物、医学、社会学等领域,利用概率的方法汲取随机生长网络的各种宏观 性质,从而达到认识真实网络的目的。 复杂网络研究对实际有重要的指导意义。由于通信网和代谢网的健壮性使 得通信网不会因为局部的攻击和故障而导致整个系统崩溃【5 9 1 ,同样急剧变化的 环境和大量使用药物也不会对一个相当简单的组织生长造成影响。复杂网络的 北京工业大学理学硕:j 二学位论文 这稳定性应归功于这种网络中节点的充分连接,文献证明网络的这种容错性只 属于s f 网络所特有的。因此设计信息网的首选应是具有s f 拓扑以提防局部问 题扩大到整个系统;相反传染病网络的s f 拓扑有些令人烦恼,控制疾病的手段 只能是对连接中心作出有效防疫。经验结果证明h l t e m e t 、社会网络、细胞网络 等许多真实网络都是s f 网络。 每一个系统中的网络都有其自身的特殊性质,有其紧密联系在一起的独特 现象,有其自身的演化机制,但是由于都可以使用网络分析的方法,所以有其 共性。例如关于顶点度值、介数的分析方法以及大量不同网络中存在的相同的 统计特征,再如随机去点与选择性攻击对网络结构的影响及其分析方法。研究 网络的几何性质,网络的形成机制,网络演化的统计规律,网络上的模型性, 以及网络的结构稳定性,并把它与具体系统结合起来是复杂网络研究的中心内 容。 统计物理与图论都是研究复杂网络的有力工具。网络g = ( 矿,e ) 作为图论的 概念是指由一个点集矿( g ) 和一个边集e ( g ) 组成的一个图,且e ( g ) 中的每条 边q 有y ( g ) 的一对点( “,1 ,) 与之对应。记顶点数为= m ,边数为己= 蚓。如 果任意( “,1 ,) 与( v ,“) 对应同一条边,则称为无向网络,否则为有向网络;如果 任意蚓= 1 ,则称为无权网络,否则为加权网络。从统计物理学的角度来看,网 络是一个包含了大量个体以及个体之间相互作用的系统,是把某种现象或某类 关系抽象为个体( 顶点) 以及个体之间相互作用( 边) 而形成的用来描述这一现 象或关系的图。统计物理学是从微观到宏观的桥梁。研究网络中顶点与边的度 值与权值等微观性质与网络的几何性质、效率与稳定性等宏观性质之间的关系 正是复杂网络研究的核心内容。因而,与
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 鲁迅的故乡情结与《朝花夕拾》教学
- 狼特殊句式课件
- 狗狗采耳知识培训班课件
- 牧场消防安全培训课件
- 山东省潍坊市2025年中考数学真题附真题答案
- 安全教育培训重要性课件
- 跨境公司面试题库及答案
- 农业产业园项目2025年产业政策适应性评估及可行性研究
- 2025年新能源风能发电技术创新与风力发电控制系统报告
- 农业2025年数字化转型典型案例剖析报告
- 朝天区东溪河大桥建设工程(主引道)行洪论证与河势稳定评价报告
- 中国历史简介
- 普外科21个病种临床路径-
- 期权考试题库答题版
- 给排水巡视检查记录表
- YY/T 1754.1-2020医疗器械临床前动物研究第1部分:通用要求
- 新闻编辑(修改版)马工程课件 第六章
- GB/T 17188-1997农业灌溉设备滴灌管技术规范和试验方法
- 2022年资阳市雁江区社区工作者招聘考试笔试试题及答案解析
- 帮助卧床老年人使用便器排便课件
- 质量管理学课件第1章
评论
0/150
提交评论