(生物物理学专业论文)加权蛋白质折叠构象网络的拓扑特征研究.pdf_第1页
(生物物理学专业论文)加权蛋白质折叠构象网络的拓扑特征研究.pdf_第2页
(生物物理学专业论文)加权蛋白质折叠构象网络的拓扑特征研究.pdf_第3页
(生物物理学专业论文)加权蛋白质折叠构象网络的拓扑特征研究.pdf_第4页
(生物物理学专业论文)加权蛋白质折叠构象网络的拓扑特征研究.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

(生物物理学专业论文)加权蛋白质折叠构象网络的拓扑特征研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 蛋白质是生物功能的体现者,每一个蛋白质分子都有一个特定的三维结构。 蛋白质的氨基酸序列包含着决定其三维结构的重要信息。但蛋白质如何从一级的 氨基酸序列折叠形成具有生物学功能的三维结构人们了解得还不清楚,这个问题 称为蛋白质折叠。该问题至今尚未解决。蛋白质折叠是个异常复杂的问题,它不 仅是个由热力学引导的过程,也是一个由动力学控制的过程。人们也为此提出了 各种理论和实验的方法来研究这个问题。近年来,复杂网络方法的出现为蛋白质 折叠这个问题的研究提出了一个新的思路。如何利用复杂网络的方法来研究蛋白 质折叠在国际上还刚刚起步,有许多问题值得进一步研究。是国际上的热点研究 领域之一。 本论文工作主要包括三个部分。第一部分,构建了加权的蛋白质折叠构象网, 并分析得出加权构象网同时具有小世界网络( s m a l l w o r l d ) 和无标度网络 ( s c a l e f r e e ) 拓扑特征;第二部分,进一步研究了折叠构象网的无标度拓扑特性和 蛋白质折叠动力学之间的关系;第三部分,我们考察了加权构象网的模块化性质。 采集由二维短链在格点空间自回避行走产生的全部构象,并以此构建构象网 络。每一个构象是网络中的一个点,而构象之间的转变是网络的边。通过研究发 现,如果忽略构象中氨基酸残基之间的相互作用,则构象网络只有小世界网络的 性质而没有无标度网络的特性,而当我们考虑构象中氨基酸残基之间的相互作 用,并以此构建加权构象网络,研究发现此加权构象网既有小世界网络的特征又 具有无标度网络的特性。这个结果说明能量对网络拓扑的形成起着重要作用。加 权构象网络的“无标度 拓扑特征说明在蛋白质折叠过程中,重要构象的分布具 有层次性,而蛋白质在折叠过程中更倾向于选择这些重要的构象做为折叠路径中 的构象,而不是在构象空间中随机搜索,预示蛋白质折叠是沿着一定的路径进行 的。 构象网络的无标度拓扑特征是由其度分布的幂律形式所刻画的。为研究加权 构象网络的拓扑特征和蛋白质折叠动力学之间的关系,论文考察了加权构象网络 度分布的幂指数和参数z s c o r e 参数之间的关系。z s c o r e 这个参数经常被用 来表述给定的一条序列多大程度上是一条天然序列,即是否具有热力学稳定性、 北京工业大学理学硕士学位论文 相对较快的折叠速度和较强的抗突变能力。研究发现加权构象网络度分布的幂指 数和参数z s c o r e 参数这二者之间有很好的相关性。由于幂指数刻画的是构象 网络的拓扑性质,而z s c o r e 则刻画链的动力学性质,二者之间良好的相关性 说明网络的拓扑性质对蛋白质折叠动力学有深刻影响。论文还基于能量地形面理 论给出了这种相关性的物理含义。 最后,本论文还考察了加权构象网络的模块化性质。网络的模块化指的是网 络中有一部分点做为一个集合,在这个集合内部,点之间的连接很紧密,而集合 之内的点和集合外面的点连接很稀疏。首先,利用模块化算法得出加权构象网络 的模块化系数q ,并研究了q 值和z s c o r e 值以及q 值和网络幂指数的关系。 研究发现,加权构象网络有显著的模块化结构,而且z - s c o r e 值和q 值呈负相关, 这说明折叠速度越大的序列其对应的网络的模块化程度就越低。最后,利用能量 地形面的理论解释了这种联系的物理图像。 关键词:蛋白质折叠;复杂网络;加权构象空间网络;拓扑性质 a b 钉r a c l 曼! ! ! 蔓! ! 曼曼曼曼曼! 曼! ! 曼曼曼曼! ! 曼曼曼曼曼曼! ! ! ! 曼曼曼曼! ! ! 曼! 曼曼曼! ! 曼曼曼! ! ! ! 曼曼曼曼 a b s t r a c t p r o t e i n sp l a ya l li m p o r t a n tb i o l o g i c a lr o l ei no u rl i f ea c t i v i t i e s ,a n de a c hp r o t e i n h a st h eu n i q u et h r e e d i m e n s i o n a ln a t i v es t r u c t u r e i t sa m i n oa c i ds e q u e n c ei n c l u d e s t h ee s s e n t i a li n f o r m a t i o no ft h en a t i v es t r u c t u r eo fp r o t e i n t h ep r o c e s st h a tt h ea m i n o a c i ds e q u e n c ef o l d st ot h en a t i v es t r u c t u r ei sd e f i n e da s p r o t e i nf o l d i n g ,w h i c hh a s n o tb e e nc o m p l e t e l yr e s o l v e dy e t a sw eh a v ek n o w n ,t h ep r o c e s so fp r o t e i n f o l d i n g i sn o to n l yl e a db yt h e r m o d y n a m i c s ,b u ta l s oc o n t r o l l e db yd y n a m i c s m a n y m e t h o d s ,i n c l u d i n ge x p e r i m e n t a la n dt h e o r e t i c a la p p r o a c h e s ,h a v eb e e nd e v e l o p e d t os t u d yt h ep r o b l e mo fp r o t e i nf o l d i n g i nr e c e n ty e a r s ,t h em e t h o do fc o m p l e x n e t w o r kp r o v i d e san e ww a yt oe x p l o r et h ep r o t e i nf o l d i n gp r o c e s s ,a n dm a n y p r o b l e m sd e s e r v et ob ei n v e s t i g a t e d t h e r ea r et h r e e p a r t s i nt h i sd i s s e r t a t i o n i nt h ef i r s t p a r t ,t h ew e i g h t e d c o n f o r m a t i o ns p a c en e t w o r k ( c s n ) w a sc o n s t r u c t e d i ti sf o u n dt h a tt h e r ea r eb o t h s m a l l w o r l da n ds c a l e f r e ep r o p e r t i e si nt h ew e i g h t e dc s n i nt h es e c o n dp a r t ,t h e r e l a t i o n s h i pb e t w e e nt h es c a l e - f r e ep r o p e r t yo ft h ew e i g h t e dc s na n dt h ef o l d i n g d y n a m i c sw a sf u r t h e rs t u d i e d f i n a l l y ,t h em o d u l a rs t r u c t u r eo ft h ew e i g h t e dc s n w a sa l s oa n a l y z e d a l lc o n f o r m a t i o n sg e n e r a t e db yt h es e l f - a v o i dw a l ko fas h o r ts e q u e n c ei nt h e t w o d i m e n s i o nl a t t i c ew e r em a p p e di n t oc o m p l e xn e t w o r k ac o n f o r m a t i o ni san o d e i nt h en e t w o r k , a n dt h e r ei sal i n kb e t w e e nt w on o d e si ft h e c o r r e s p o n d i n g c o n f o r m a t i o nc a nt r a n s f e rf r o mo n et oa n o t h e r i th a sb e e ns h o w nt h a tt h i sn e t w o r k h a ss m a l l w o r l dp r o p e r t y ,b u tn os c a l e - f r e es t r u c t u r e ,i ft h ei n t e r a c t i o nb e t w e e n a m i n oa c i d sh a sn o tb e e nc o n s i d e r e d nw ec o n s i d e rs u c hi n t e r a c t i o na n db u i l d t h ew e i g h t e dn e t w o r k ,t h er e s u l ts h o w st h a tt h ew e i g h t e dn e t w o r kh a sn o to n l y s m a l l w o r l dp r o p e r t yb u ta l s os c a l e - f r e ec h a r a c t e r i s t i c s u c hr e s u l t ss u g g e s tt h a t i n t e r a c t i o nb e t w e e na m i n oa c i d sh a sh u g ei n f l u e n c eo nt h et o p o l o g yo fc o m p l e x n e t w o r k t h es c a l e f r e ea n ds m a l lw o r l dp r o p e r t i e ss u g g e s tt h a ti nt h ep r o c e s so f p r o t e i nf o l d i n g ,t h ed i s t r i b u t i o no f t h ei m p o r t a n tc o n f o r m a t i o n si sh i e r a r c h i c a l ,a n d 北京工业大学理学硕士学位论文 p r o t e i n st e n dt oc h o o s et h e s ei m p o r t a n tc o n f o r m a t i o n sa st h e i ro n - p a t hc o n f o r m a t i o n n o tt os e a r c hr a n d o m l yt h ec o n f o r m a t i o n si nt h ec o n f o r m a t i o ns p a c e , i m p l y i n gt h e p r o c e s so fp r o t e i n f o l d i n gi so fp a t h w a y s t h e r ei sad e e pr e l a t i o n s h i pb e t w e e nt h es c a l e f r e es t r u c t u r eo ft h ew e i g h t e d c s na n dt h ep r o t e i n f o l d i n gd y n a m i c s t op r o b et h i sc o n n e c t i o n ,w ei n v e s t i g a t e dt h e r e l a t i o n s h i pb e t w e e nt h es c a l i n ge x p o n e n ta n dt h ezs c o r e , w h i c hw a so f t e na p p l i e d t om e a s u r eh o wm u c has e q u e n c ei s “p r o t e i n l i k e ”i ti sf o u n dt h a tt h e ya r ed i s t i n c t l y c o r r e l a t i e d c o n s i d e r i n g 也a tt h ez s c o r ei sag o o dt o u c h s t o n ef o rt h et h e r m o d y n a m i c s t a b i l i t ya n dk i n e t i co ft h es e q u e n c e s ,t h er e s u l ti m p l i e st h a tt h et o p o l o g yo ft h e w e i g h t e dc s n i so fd e e pc o n n e c t i o nw i t ht h ef o l d i n gd y n a m i c so ft h es e q u e n c e s f i n a l l y ,t h em o d u l a rs t r u c t u r eo ft h ew e i g h t e di sa l s oi n v e s t i g a t e d t h ec o n c e p t o fc o m m u n i t ym e a n st h ea p p e a r a n c eo ft h ed e n s e l yc o n n e c t e ds u b s e t so fv e a i c e s , w i mo n l ys c a n t yc o n n e c t i o n sb e t w e e ns u b s e t si nac o m p l e xn e t w o r k t h em o d u l a r a l g o r i t h mw a su s e dt oc a l c u l a t et h em o d u l a rc o e f f i c i e n tqo ft h ew e i g h t e dc s n ,t h e n t h er e l a t i o n s h i pb e t w e e nt h eqv a l u ea n dz s c o r ew a ss t u d i e d t h er e s u l t ss h o wt h a t t h es e q u e n c e sw h i c hf o l dr e l a t i v e l yr a p i d l ya v o i dt of o r mc o n s p i c u o u sm o d u l a r i t y s t r u c t u r e si nt h ew e i g h t e dc s n s t h e s er e s u l t s i m p l yt h a t t h e r ei s p r o f o u n d r e l a t i o n s h i pb e t w e e nt h em o d u l a rs t r u c t u r eo ft h ew e i g h t e dc s na n dt h ep r o t e i n f o l d i n gd y n a m i c k e yw o r d s :p r o t e i nf o l d i n g ;c o m p l e xn e t w o r k ;w e i g h t e dc o n f o r m a t i o ns p a c en e t w o r k ; t o p o l o g i c a lp r o p e r t i e s i v 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 签名: 关于论文使用授权的说明 本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权 保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部 分内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 签名: 己舀静 导师签名:么日期: 毕一2 第1 章蛋白质折叠研究进展 第1 章蛋白质折叠研究进展 1 1 蛋白质折叠的研究背景及意义 蛋白质是生物功能的体现者,其结构和功能的研究是从分子水平了解生命现 象的基础。每一个蛋白质分子都有一个独特的三维结构,而蛋白质的功能很大程 度上依赖于其特定的结构。所有的蛋白质都是由一维的氨基酸序列折叠成其特定 的三维结构后,才能发挥正确的生理功能。但蛋白质如何由其一级的氨基酸序列 组装成天然的三维结构,仍是一个未解决的难题,称为“蛋白质折叠”【l 】。蛋白质 折叠问题被列为“2 l 世纪的生物物理学”的重要课题,它是分子生物学中心法则 尚未解决的一个重大生物学问题。在生物体内,生物信息的流动可以分为两个部 分:第一部分是存储于d n a 序列中的遗传信息通过转录和翻译传入蛋白质的一 级序列中,这是一维信息之间的传递,三联子密码 2 1 介导了这一传递过程;第二 部分是肽链经过疏水塌缩、空间盘曲、侧链聚集等折叠过程形成蛋白质的天然构 象,同时获得生物活性,将生命信息表达出来,这一过程也称为生物中心法则的 “第二遗传密码”p 】。到目前为止,人们对转录和翻译过程已经有了相当程度的了 解,但是多肽链是如何折叠成具有生物活性的蛋白质这一步还不是太清楚。蛋白 质折叠机制的阐明将揭示生命体内的第二套遗传密码,具有重要的理论意义。 除了其重要的理论意义以外,蛋白质折叠的研究还有其现实意义和应用前 景。人们对由于基因突变造成蛋白质分子中仅仅一个氨基酸残基的变化引起疾病 的情况已有所了解,即所谓“分子病”,如地中海镰刀状红血球贫血症就是因为血 红蛋白分子中第六位的谷氨酸突变成了颉氨酸。现在发现蛋白质分子的氨基酸序 列没有改变,只是结构或者说构象有所改变也能引起疾病,即所谓“构象病”,或 称“折叠病”1 4 j 。许多疾病,如阿兹海默症( a l z h e i m e r s ) ,疯牛病( m a dc o w ,b s e ) , 可传播性海绵状脑病( c j d ) ,肌萎缩性脊髓侧索硬化症( a l s ) ,还有帕金森氏症 ( p a r k i n s o n s ) 等正是由于些细胞内的重要蛋白发生突变,导致蛋白质聚沉或错 误折叠而造成的。因此,深入了解蛋白质折叠与错误折叠的机理对于这些疾病的 致病机制的阐明以及治疗方法的寻找将大有帮助。除此以外,基因测序技术的发 北京工业大学理学硕士学位论文 展使我们得到了大量的蛋白质序列,而要揭示它们的生物学功能,相应结构信息 的获得是十分重要的。依靠现有手段( x r a y 晶体衍射、n m r 及电镜) 测定蛋 白质的结构需要较长的时间,因此结构解析的步伐已落后于发现新蛋白的步伐。 而结构预测的方法虽然速度较快,但可靠性并不高,只有当我们对于维持蛋白质 结构,驱动蛋白质折叠的理化因素更为了解,这一方法才可能有根本的改进。另 外,我们对于蛋白质蛋白质相互作用与识别也有赖于蛋白质折叠机制的阐明。 1 2蛋白质折叠研究现状 从蛋白质的一级结构来预测二级结构已经发展了一些比较好的算法了【5 j 。但 进一步预测其三级结构仍是一个非常具有挑战性的问题。目前,p d b 里已经测 定三维结构的蛋白有5 万多个,但人们发现,在这么多结构中,只有一千多种折 叠单元。为何基本折叠单元的种类这么少? 这是一个令人感兴趣的问题,现在有 了部分答案。研究表明,同一条一级序列不允许折叠到两个以上能量同样低的结 构,即稳定的折叠单元不仅要满足某种能量最低的条件,而且要具有唯一性。那 些折叠结果不唯一的序列,已经在进化过程中被淘汰。决定蛋白质折叠的基本相 互作用力的种类,其物理本质是清楚的。然而从“第一原理”出发,直接计算蛋白 质折叠过程,就目前的计算机发展水平还是非常困难的。目前,用蛋白质的全原 子模型【6 】进行折叠过程的模拟还只能在一些小肽中实现【_ 7 1 ,虽然已取得一些进展, 但距离真正用计算机模拟真实蛋白质整个折叠过程还有很长距离。美国i b m 公 司在2 0 0 0 年提出一个名为“蓝色基因”计划,即要用五年时间,研制一台一百万 个处理器的大规模并行系统,以便用3 天c p u 时间,算出一个实际蛋白的折叠 过程。如此庞大的计划表明在相当长的时间内,人们还必须依靠实验和一些理论 简化模型来研究蛋白质折叠这个基本课题。 目前,蛋自质折叠问题主要包括以下三个方面:( 1 ) 蛋白质折叠机制【8 1 ,即 蛋白质是如何在生物学的时间尺度内到达其天然构象;( 2 ) 蛋白质逆折叠( 蛋白质 设计) 问题【9 l ,即一个好的天然结构是如何选择它的氨基酸序列的。我们知道,蛋 白质序列是进化的结果,而进化选择的机制是什么呢? 我们如何设计出一条好的 蛋白质序列从而能折叠到给定的结构呢? ( 3 ) 蛋白质结构预测【10 1 ,即给定序列, 2 第1 苹蛋臼质折叠研冗进展 如何结合生物信息学以及计算机算法来预测它的天然三维构象。 蛋白质折叠理论的核心问题是,从理论上建立起一个蛋白质的合理模型,研 究蛋白质折叠过程中不同阶段的行为特征及物理本质,从而寻找一个统一的框架 来描述蛋白质折叠的物理机制。另一方面,人们也希望能定量地分析和预测一些 氢基酸序列、链的拓扑、p h 值、盐浓度和温度的环境因素对折叠过程的动力学、 热力学及结构的影响。从理论模型和实验已提供了大量证据表明,蛋白质在折叠 过程中表现出丰富的热力学和动力学性质。 1 3 蛋白质折叠的热力学和动力学控制 根据分子生物学中心法则【】,生物遗传信息是由如下的复杂过程进行传递 的。d n a 经过r n a 转录( t r a n s c r i p t i o n ) ,r n a 经过翻译( t r a n s l a t i o n ) 形成多肽 链,多肽链再经过折叠形成具有生物活性的蛋白质分子。到目前为止,人们对 于多肽链为什么以及如何能折叠成具有生物活性蛋白质这个过程了解的还不是 很清楚而问题的焦点主要集中在两个方面:第一,折叠过程是由热力学控制还 是由动力学控制? 第二,折叠过程的路径是什么? 是否有中间体存在? 中间体的 数目和性质是什么? 以a n f i n s e n 1 2 】为代表,认为蛋白质折叠是由热力学控制的,即经典的“热力 学假说”这个假说是a n f i n s e n 等根据核糖核酸酶a ( r n a s e a ) 复性研究的经典实 验提出来的,r n a s e a 多肽链在8 m o l l 和b e t a 巯基乙醇中还原变性,当透析除 去尿素和b e t a - 巯基乙醇后,变性的r n a s e a 在空气中被氧化并能自发折叠形成 具有生物活性的r n a s e a 由此,a n f i i l s e l l 等认为多肽链一级结构从根本上决定 着自身折叠成特定的天然结构,即一级结构决定三级结构。他们认为天然蛋白质 多肽链所采取的构象是在一定环境中( 如p h ,温度,溶液组分,离子强度) 使整 个系统的吉布斯自由能最低的构象,所以处在变性状态的多肽链在给定的环境下 能够自发折叠成天然结构。以此观点,天然结构是最稳定的结构。伸展的多肽链 在适当的溶剂环境中,不需要其他别的任何信息、诱导或能量,就能自发地折叠 成天然构象。 但是,有人却对这一观点提出质疑,认为蛋白质折叠是由动力学控制的过程 北京工业大学理学硕士学位论文 【1 3 】。1 9 6 8 年,l e v i n t h a l 提出著名的l e v i n t h a l 悖论:假定每个氨基酸残基可能 的构象状态数为i ,一个有n + 1 个氨基酸残基,n 个肽单位的完全去折叠蛋白质, 其可能获得的构象状态数为i n 。假定j = 8 ,一个有1 0 0 个氨基酸残基的较小的蛋 白质,其肽链的可能构象状态为8 1 0 0 。如果从一个构象搜索到另一个构象所需的 最少时间是1 0 1 3 秒,那么遍历1 0 0 个氨基酸残基的蛋白质所有构象要历经1 0 6 6 年,超过了宇宙的存在年限。然而,实验观测到的蛋白的折叠时间是毫秒到秒的 量级,即1 0 一1 秒。这就表示,蛋白质折叠不是一个随机过程,而是通过特定的 动力学途径达到天然构象。蛋白质在折叠的过程中所经历的构象是有限的,折叠 是有其特定的路径的,而且在折叠路径的过程中会存在某个或某些能垒,阻碍蛋 白最稳定分子构象的获得,从而使得蛋白质结构处在某种亚稳态。w e t l a u f e r 和 r i s t o w f l 4 j 认为:可能多数蛋白质的天然结构并非吉布斯自由能最低,从动力学 观点出发,它可能是可得到的结构中自由能最小的一种结构。b a k e r 等人进一步 指出【l5 1 ,对某些蛋白而言,天然构象也许并非是多肽链自由能最低或唯一的低能 态,多肽链采取的某些非天然构象也很稳定,而且这两种低能量构象之间的相互 转变要克服较高的能垒而难于实现,那么蛋白质折叠过程中就会有两种途径相互 竞争,即一种正确折叠形成天然构象的途径( o n p a t h w a y ) ;另一种是错误折叠形 成稳定的非天然结构的途径( o f f - p a t h w a y ) 蛋白质多肽链能够能正确折叠,是因 为很多因素在蛋白质折叠的动力学过程中起到控制作用,促使多肽链走入正确折 叠路径。 从总体上来讲,蛋白质折叠是遵循“热力学假说”的,从高能态向低能态转变, 但在这个过程中会受到动力学上的控制。热力学控制和动力学控制在蛋白质折叠 中是统一的,不同的蛋白质的折叠过程二者所体现出来的作用大小可能有所不 同。对一些小分子单结构域的蛋白质来说,折叠过程相对简单一些,在热力学控 制下能较容易的进行可逆变性和复性。对一些结构较为复杂的蛋白质,特别是折 叠过程中涉及二硫键重排等限速步骤,虽然从总体来讲受热力学控制,但折叠路 径,即动力学控制就显的很重要了。 1 4 蛋白质折叠的模型介绍 4 第l 章蛋自质折叠研究进展 “热力学假说”和动力学控制只是从整体上给出了蛋白质折叠的一般规律,但 没有告诉我们一条伸展的多肽链是如何折叠成具有生物学功能的三维空间结构。 许多学者根据不同的研究对象,提出了一些蛋白质折叠的模型。 ( 1 1 折叠漏斗模型 蛋白质折叠过程既有自由能全局塌小的热力学性质,又有和路径相荑的动力 学性质。1 9 9 5 年,w o l y n e s 等人提出了一种所谓“折叠漏斗”的新观点| 一个蛋 白质分子有许多内部自由度其自由能作为多自由度的高维函数构成了抽象空间 的能量地形面( f r e e e n e r g yl a l a d s c a p es u r f a c e ) 能量地形面是一个高低起伏且具 有众多局域极小值和极大值的复杂的高维曲面。如图1 - 1 。蛋白质的天然结构对 应于自由能的全局极小态。又由于进化选择的压力,能量地形面具有漏斗的 围1 - 1 蛋白质折叠漏斗【1 7 r i g i e 1 - 1 p r o t e i n f o l d i n g f u n n e l 形状,从而使天然蛋白能够快速折叠到天然态。如图l - l 所示。这种观点把蛋白 质折叠过程描述成一个具有部分折叠结构的系综在能量地形面上的集体进展。这 就好像多溪流水从具有复杂地形结构的山坡上流下一样,而不是一条溪流从单一 嬲=。 一隧一 銎寥k翰臻翁嚣 北京工业大学理学硕士学位论文 山谷中流下,这种图像着重于蛋白质链状分子的系综特征和多折叠路径。自由能 曲面的形状和粗糙度控制着整个折叠过程,而地形面上的粗糙度来源于氨基酸相 互作用之间的竞争,这种相互作用起着稳定折叠态的作用,也导致地形面上的 阻挫的形成。 ( 2 ) 成核快速生长模型t 1 9 】 伸展多肽链开始折叠的时候,多肽链上先形成许多小的“核”( n u c l e i ) ,这些 小核由8 1 8 氨基酸残基组成,这些残基在进化中属于保守残基。它们随机波动, 很不稳定,多肽链的其他部分以“核”为模板,快速折叠“生长”,最终形成天然结 构。在这个模型当中,成核阶段被认为是限速步骤。 ( 3 ) 疏水坍塌模型( h y d r o p h o b i cc o l l a p s em o d e l ) z o l 伸展的多肽链在极性的水溶液环境中,其疏水侧链基团为避开极性环境而导 致多肽链快速折叠,形成“熔球体,【2 1 1 ( m o l t e ng l o b u l e ) 。该模型认为,疏水作用 首先驱动多肽链整体塌陷,是折叠发生在有限的构象空间内,从而减少了构象搜 索空间。该模型还认为,疏水坍塌过程先于二级结构和一些天然接触的形成。目 前,实验上观察到一些球蛋白在折叠过程中发生部分疏水坍塌,例如,肌红蛋白, 芽胞杆菌r n a 酶抑制剂( b a r s t a r ) 【2 2 1 ( 4 ) 框架模型( f r a m e w o r km o d e l ) 2 3 】 在多肽链折叠过程中,先迅速形成二级结构,这些二级结构也是不稳定的, 多肽链在二级结构的基础上再进行组装,形成三级结构。该模型认为即使是一个 小分子的蛋白也可以一部分一部分的进行折叠,其间形成的亚结构域是折叠中间 体的重要结构。 ( 5 ) 成核一压缩模型( n u c l e a t i o n c o n d e n s a t i o nm o d e l ) t 2 4 1 基于蛋白质工程以及o 值分析对类天然过渡态的结构特征的进一步澄清, 近几年人们提出了成核压缩模型。该模型认为蛋白质在折叠过程中,形成的二 级结构具有内在的不稳定性,而其稳定性需通过三级结构的形成来加强。长程以 及其他一些天然疏水相互作用的形成在折叠过渡态中稳定了弱的二级结构。对于 大部分蛋白质,在其折叠过渡态中,长程的三级相互作用和二级结构导致了稳定 的折叠子。过渡态的拓扑结构距蛋白质天然结构很接近,可看作是天然态结构的 一种小的扭曲形式,离折叠核的距离越远,则扭曲越大。这个模型综合了疏水坍 6 第1 苹蛋白质折叠研冗进展 曼! ! ! ! ! ! 曼! ! ! ! ! 蔓曼! ! ! ! 曼! ! 曼! ! ! ! 曼! ! ! 曼! ! ! ! ! ! ! ! ! 曼! ! ! ! ! ! ! ! 曼! ! 曼曼 塌模型和框架模型的特点,可以认为是框架模型和疏水坍塌模型的一种中间路 线。在折叠过程中,随着稳定的二级结构的数目增多,折叠将变的更有层次性, 这时成核压缩模型倾向于框架模型。 这些模型各有特点,它们之间有许多相似之处。如“框架模型”中的“亚结构 域”与“成核快速生长模型”的“微核”的观点有些相似。b a l d w i n 认为【2 5 1 ,在多肽 链的起始阶段,“疏水折叠”和二级结构的形成( 框架模型) 是互补的,它们在多肽 链的起始阶段是可以同时存在的。除了这些折叠模型以外,还有学者从另外的角 度来考虑多肽链在体内的折叠【2 6 1 。在细胞中,新生肽链的折叠速度比在体外的折 叠速度快得多,而这一过程会受到细胞内许多酶的催化。细胞中还存在着许多可 以帮助蛋白质新生肽链折叠的蛋白质,称为分子伴侣【27 1 。这是一类具有与疏水基 团结合能力的蛋白质。在a t p 存在的条件下,不同的分子伴侣作用或协同作用 都能使伸展的多肽链重新折叠为具有天然构象的蛋白质。 除了理论上和实验上的方法外,计算机模拟的方法也被大量的运用于蛋白质 折叠的研究。为了适应计算机模拟方法,很多学者提出了一些适合在计算机上进 行蛋白质折叠模拟的计算模型。 1 格点模型( 1 a t t i c em o d e l ) 计算机模型很早就被用于蛋白质折叠的研究。在这些研究中,早期比较成功 的简化模型是伊辛模型( i s i n gm o d e l ) 2 s ,它较早时被用于研究蛋白质去折叠以 及蛋白质氢交换过程。p t i t s y n 和r a s h i n 【2 9 】在研究肌血球素蛋白的折叠时,把蛋 白质做了在二级结构水平上的简化,将a 【螺旋抽象为刚体圆柱。采用如此简化的 模型,他们得出结论认为蛋白质折叠是一个成核增长过程,类似于晶体的生长。 在七十年代晚期,一个相对精细的模型被用于蛋白质折叠的研究【3 0 m 】,即l e v i t t 和w a r s h e l 采用l a n g e v i n 动力学和能量最优化方法研究了牛胰腺胰蛋白抑制剂 ( b p t i ) t 3 1 】和鲤鱼肌浆蛋白( c a r pm y o g e n ) t 3 2 1 的折叠过程。在这些研究中,他们 将每个氨基酸用两个点来代替。通过这样的简化,他们观察到了蛋白质二级结构 在折叠过程中的形成和断裂过程。d i l l 等人1 2 0 1 在1 9 8 5 年引入h p ( h y d r o p h o b i c - h y d r o p h i l i c ) 模型。在这个模型中,d i l l 把2 0 类氨基酸简化归类两 类氨基酸:疏水氨基酸和亲水氨基酸。而一个蛋白质用由n 个节点组成的链来 表示,蛋白质的构象对应于链在二维或三维正方格子空间自回避行走所得的轨 7 北京工业大学理学硕士学位论文 迹。n 为组成蛋白质的氨基酸总数,链中的每一个结点占据着格点空间的一个格 点。蛋白质的构象变化对应于链在格点空间的自回避行走。 格点模型的优势是显而易见的。模型的高度简化使构象的全空间采样成为可 能,而这在计算机还不发达的年代是异常重要的。如果设计的合理,用格点模型 能够得到可用来分析的全局极小点。实际上,由于模型的简化性,利用格点模型 可以得到全部构象且能够计算出体系的自由能,从而刻画出自由能曲面的一些形 状特征。如果能够合理的选用参数,格点模型也可以被用来进行蛋白质结构预测, 并取得一些有意义的结果【3 3 1 。此外,在蒙卡模拟过程中;研究者也使用格点模型 采集构象来计算系综平均值。这点非常重要,早期的实验测出来的实验值都是宏 观量,而我们知道那样得出来的实验值是系综平均值。只有充分采集构象,我们 由计算得到的系综平均值才越接近于真实,从而能够和实验值相比较。 在计算机模拟中使用的格点模型大体上有两种。第一种是g o 及其合作者发 展的【3 4 1 。这种模型经常被用于蛋白质折叠物理机制的研究。它的好处就是模型的 简单性。一个很好的例子就是w o l y n e s 及其合作者u 6 , 3 5 1 通过格点模型模拟,得出 蛋白质折叠是在一个具有漏斗形状的能量地形面上从高自由能态往低自由能态 转变的过程。还有一个很好的例子是d i l l 等人【3 6 1 用格点模型来研究蛋白质折叠 机制,他们把每个残基简化为一个点,只区分残基的亲疏水性,以此简化模型来 研究蛋白质折叠机理。其他一些例子还包括l i t 3 7 1 和s h a k h n o v i c h l 3 8 1 等人利用格点 模型研究了序列的可折叠性等。由于不是基于真实的蛋白设计的,所以这类的格 点模型只能告诉我们一些蛋白质折叠的普遍性质。在s k o l n i c k 【3 3 】、j e m i g a n 3 9 1 等 人的工作中所使用的格点模型属于第二类。这类格点模型是基于真实蛋白设计 的,而其参数的选择也是通过拟合真实蛋白而得到的。由于这类格点模型是基于 真实蛋白设计的,又由于模型本身的简单性,所以其在蛋白质结构预测方面的前 景是很值得期待的。 虽然格点模型有它自身的优点,但其自身也存在着一些问题。例如,格点模 型忽略蛋白质结构一些细节的部分,比如说侧链;由于格点构象只能在特定的格 点上行走,这给构象转变的动力学很强的约束,虽然限制了构象空间的大小,但 有可能导致采样不充分而影响到最后的结果:另外,格点模型的势函数选择太简 化。 8 第1 章蛋白质折叠研究进展 2 非格点模型 非格点模型能够有效地克服以上格点模型所存在的问题。在非格点模型中, 构象没有被限制在特定的格点上面,而且可以考虑诸如侧链等一些精细的结构 等。在这里,我们介绍一种重要的非格点模型即全原子模型。在计算机模拟中, 全原子模型考虑了蛋白质分子中所有原子及蛋白质分子周围溶剂。且力场参数是 通过量子化学计算小肽片断拟合获得的。 使用全原子模性有许多优点。首先,蛋白质去折叠过程的全原子模拟可以用 来重构自由能曲面。通过使用加权分布图方法( w e i g h t e dh i s t o g r a mm e t h o d ) , b r o o k s 及其合作者【4 0 】构建了三螺旋束、链状球菌的g 蛋白的b 1 片断以及 b e t a n o v a 蛋白的能量地形面【4 卜4 引。他们证实了能量地形面的漏斗形状以及蛋白质 折叠是沿着多路径进行的。同时,他们的结果认为能量地形面的形状是和蛋白质 类型有关的。此外,他们还观察到了蛋白质在处于折叠中间态时,其内部疏水效 应增加了能垒的高度,从而说明了水分子在蛋白质折叠过程中发挥着重要的作 用。 其次,全原子模型可以很直观的回答蛋白质折叠的中心问题,即蛋白质是如 何到达它的天然构象? 对于这个问题,人们已经从模拟一些小肽得到一些有意义 的结果1 4 4 4 7 1 。t o b i a s 和b r o o k s 研究了p 转角在水环境中的形成过程。删;c a s e 及 其合作者研究p 转角两个模体构象的转变,数据结果和n m r 实验很吻合【4 5 1 : d a u r a 等人f 4 7 】进行了短p 片在甲醇中的折叠和去折叠模拟,他们在5 0 纳秒的时 间尺度内观察到了可逆的二级结构的形成和去折叠过程。这些研究为我们提供了 在原子水平上蛋白质折叠的行为,加深了我们对蛋白质的认识。 虽然全原子模拟有诸多优点,是蛋白质折叠的计算机模型一个重要的发展方 向,但就目前的发展情况来看,它还存在着一些问题。首先,采用这么精细的模 型需要模拟的体系是巨大的,一般多于1 0 0 0 0 个,另一方面,模拟步长一般是飞 秒量级( 1 0 1 5 秒) ,而蛋白质的折叠的时间尺度一般是微秒到秒的量级,在这么 长的模拟时间内模拟这么庞大的体系其工作量是巨大的。因此,直接模拟蛋白质 折叠过程是很困难的。目前,全原子模型还只是被用来研究一些小蛋白质的折叠 行为,而且还要加上一些外因素作用,例如,升温、加压、加外作用力等,来加 速模拟过程。此外,其巨大计算量决定了采用全原子模型只能进行短时间模拟, 9 北京工业大学理学硕士学位论文 而在这么短过程中,需要考虑一些很精细的模拟技巧。例如,我们需要在模拟过 程中需要仔细地控制水处在平衡态,因为若水不处在平衡态,就会使模拟陷入微 小坍塌过程( t r i v i a lc o l l a p s ep r o c e s s ) ,影响模拟结果。而水的平衡态在短时间模 拟过程中是很容易被熵焓不平衡( e n t r o p y e n t h a l p yi m b a l a n c e ) 破坏的。最后, 全原子模拟中的力场参数是通过量子力学方法拟合小肽蛋白得到的,而如何采用 更精细的量子力学方法得到更精细的力场参数也是一个艰巨的任务。 1 5 蛋白质折叠的计算机模拟方法 1 5 1 分子动力学模拟 分子动力学模拟( m d ) 用于生物大分子的研究始于上世纪7 0 年代末 4 9 1 。m d 模拟是在原子水平上,用经典的牛顿力学方程描述分子的运动过程,它可以得到 原子的运动轨迹,对于平衡系统,还可以用m d 模拟采集到的轨迹进行时间平均 来计算一个物理量的统计平均值。对于系统的非平衡态热力学过程,由于现在实 验手段的局限,有许多微观细节在实验中无法观测到,这时,可通过对体系进行 一定时间尺度的m d 模拟来进行观察。随着计算机计算能力的提高、构象空间采 样技术的发展以及力场参数越来越精确,m d 模拟已广泛应用于生物大分子动力 学过程的研究【6 j 。目前,显含水的蛋白质分子全原子m d 模拟的时间尺度可达到 上百纳秒甚至微秒r 。 影响m d 模拟重要的两个因素是体系中各个原子的初始位置以及描述原子 间相互作用的势函数【5 0 1 。在实际模拟中,可通过能量优化来消除体系构象中原子 间的不合理的接触,从而尽可能选择体系的平衡位置来作为计算的初始位置。在 一定温度下,按照麦克斯韦分布对体系原子赋初速度。势函数的选择对m d 模拟 的最后结果至关重要。分子力场的经验势函数主要包括以下几项:键长能、键角 能、二面角能( 正常二面角和非正常二面角) ,范德华相互作用和静电相互作用, 有的能量函数还包括氢键项。目前,一些常用的力场的在分子模拟的软件中被采 用,主要有:a m b e r ( a s s i s t e dm o d e lb u i l d i n gw i t he n e r g yr e f i n e m e n t ) j 3j :历f

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论