




已阅读5页,还剩101页未读, 继续免费阅读
(生物医学工程专业论文)蛋白质设计及蛋白质网络模型的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
北京工业大学工学博士学位论文 真实情况。另外,分析加权网的网络特征量在胰凝乳蛋白酶抑制剂2 ( c h y m o t r y p s i ni n h i b i t o r2 ,c 1 2 ) 高温去折叠路径上的变化,发现结构解聚主要表 现为疏水核心的破坏;网络集聚系数对二级结构的变化不敏感;平均最短路径随 着结构的解聚而增大:折叠核心的介数值为局部极大,且加权网介数对折叠核的 区分能力强于非加权网。基于加权氨基酸网,构建了新的对接打分函数s n 。采 用该打分函数对4 2 个体系的b o u n d 与u n b o u n d 对接采样结果进行打分排序,并 与其他打分函数( r p ) 结果进行比较,发现基于氨基酸网络的打分函数s n 在一 些指标上优于r p 打分函数。通过分析发现,s n 打分函数更加适合于考虑蛋白质 柔性的对接采样。本工作为进一步应用复杂网络的方法,研究蛋白质折叠机制以 及蛋白质结构功能关系奠定了基础。 利用高斯网络模型( g n i v l ) 和各向异性网络模型( a n m ) 研究了谷氨酰胺 结合蛋白的“张开”构象、“闭合”构象以及g i n b p g i n 复合物的慢运动模式。研究 发现,谷氨酰胺结合蛋白的开合运动主要表现为小结构域的运动,尤其是小结构 域顶端两个口螺旋和两个片的大幅运动;开合运动的轴心位于l y s 8 7 和g l n l 8 3 处:g i n b p 的开合运动是蛋白质结构所固有的一种动力学属性。另外,还研究了 谷氨酰胺结合蛋白不同的拓扑特性对功能性开合运动模式的影响。研究发现:蛋 白质的拓扑结构以及两结构域之间的相互作用直接决定了开合运动的趋势,随着 两结构域之间的作用增强,这种开合运动趋势会下降,从而为理解谷氨酰胺的输 运过程,以及蛋白质与配体相互结合的现象提供了有价值的生物学信息。 关键词:蛋白质设计;相对熵;h n p 模型;氨基酸加权网络;高斯网络模型: 各向异性网络模型 n a b s t r a c t p r o t e i ni sad o m i n a n tp a r t i c i p a t o ro fl i f ea c t i v i t y , a n dt h ea m i n oa c i ds e q u e n c e ( p r i m a r y m u c u s ) o fp r o t e i nc o n t a i n st h en e c e s s a r yi n f o r m a t i o nt od e t e r m i n et h et e r t i a r ys 扭u c t u r co f p r o t e i n p r o t e i nf o l d i n g m e a n sh o w t op r e d i c tt h et e r t i a r ys t r u c t u r ef r o mt h ep r i m a r ys t r u c t u r eo f p r o t e i n t h e r ea r et w oa s p e c t si nt h e p r o t e i nf o l d i n g ”:f o l d i n ga n di n v e r s ef b l d i n g t h ef o l d i n g i s s u ec o n c e r l 鸺h o wt op r e d i c tt h es t o r e os t r u e t u r eo f p r o t e i nf r o mt h ea m i n oa c i ds e q u e n c e ,a n dt h e i n v e r s ef o l d i n gi s s u ec o n c e r n sh o wt od e s i g na t a m i n oa c i ds e q u e n c ew h i c hc a nf o l dt oag i v e n t e r t i a r ys t r u c t u r e a tt h es a m et i m e ,i ti sn o te n o u g hj u s tw i t ht h ei n f o r m a t i o no ft h es t e r e o s l r u c t u r eo fp r o t e i n , a n dt h ec o r r e s p o n d i n gr e s e a r c ho ft h er e l a t i o n s h i pb e t w e e ns t r u c t u r ea n d f u n c t i o no 印r o t e i ni sah o ts p o to f t h ec u r r e n tr e s e a r c hf i e l d , t h em a i nc o n t e n t so f t h i sw o r kc o n s i s to f t h ef o l l o w i n gt h r e ea s p e c t s :t h ef i r s tp a r ti si b o 试 t h ep r o t e i nd e s i g nb a s e do nt h er e l a t i v ee n 仃o p ya n dt h eh n pm o d e l ;t h es e c o n dp a r ti so nt h e r e l a t i o n s h i pb e t w e e ns t r u c t u r ea n df u n c t i o no f p r o t e i nb a s e do nt h ew e i g h t e da m i n oa c i dn e t w o r k ; a n dt h et h i r dp a r ti sa b o u tt h ef u n c t i o n a lm o v e m e n t so ft h eg l u t a m i n e - b i n d i n gp r o t e i n ( g i n s p ) w i t ht h eg a n s s i a nn e t w o r km o d e l ( o u l v oa n dt h ea n i s o t r o p i cn e t w o r km o d e l ( a n m ) t h ep r o t e i nd e s i g na p p r o a c hb a s e do nt h er e l a t i v ee n t r o p yt h e o r ya n dh pm o d e li se x t e n d e d t ot h eh n pm o d e lo f a m i n oa c i d t h e r e f o r e , an e wa p p r o a c hb a s e do nt h er e l a t i v ee n t r o p ya n dt h e h n pm o d e li sp r o p o s e df o rp r o t e i nd e s i g ni nt h i sw o r k i nt h i sa p p r o a c h ,t h er e l a t i v ee n t r o p yi s u s e da st h em i n i m i z a t i o no b j e c tf u n c t i e nt or e p l a c et h em d i t i o n a lo p t i m i z eo b j c c tf u n c t i o n h a m i l t o n l a n ,t h e nt h ep r o b l e mo b t a i n e df i o mt h ed i r e c to p t i m i z a t i o no f t h eh a m i l t o n i a nc a nb e o v e r c o m e t h em e t h o dh a sb e e nt e s t e do nar e a lp r o t e i n so f f - l a t t i c em o d e ls u c c e s s f u l l y , a n dt h e r e s u l t sr e a c ht h es i m i l a rl e v e lo fo t h e rd e s i g ns t u d i e s i na d d i t i o n , t h ea p p r o x i m a t i o nc a l c u l a t i o n f o rt h ee n s e m b l ea v e r a g eo f t h ec o n t a c ti n t e n s i t yi si m p r o v e d , a n da ni t e r a t i v ec a l c u l a t i o nm e t h o d i si n t r o d u c e d w h i c hh a sb e e ns u c c e s s f u l l yu s e do nt h er e a lp r o t e i n sh :n pm o d e l i tc a l lb ea p p l i e d 船au n i f o r mf r a m ef o rb o t hf o l d i n ga n di n v e r s ef o l d i n go f p r o t e i n an c wm e t h o di sp r o p o s e dt oc o n s t r u c tt h ew e i g h t e da m i n oa c i dn e t w o r k t h ew e i g h to fl i n k i sb a s e do nt h ec o n t a c te n e r g yb e t w e e nr e s i d u e s f o rt h e1 9 7p r o t e i n sw i t hl o wh o m o l o g y , t h e “s m a l l - w o r l d ”p r o p e 啊w a ss t u d i e db a s e do nt h i sm e t h o d a d d i t i o n a l l y , t h ea n a l y s e sw e r ec a r r i e d o u tf o rt h es t a t i s t i cc h a r a c t e r i s t i c so ft h en e t w o r kp a r a m e 协r s t h ei n f l u e n c eo ft h ew e i g h to nt h e i i i 。,。,| | 些耋三些窒耋耋呈塑耋耋兰篁篓耋二,。,二,。,一 n e t w o r kp a r a m 矾e r s ,t h en e t w o r kp a r a m e t e rd i f f e r e n c eo fa m i n oa c i d sa n dt h el i n k sb e t w e e nt h e h y d r o p h o b i ca n dt h eh y d m p h i l i cr e s i d u e s u s i n gt h i sm e t h o d ,w es t u d i e dt h en e t w o r kp a r a m e t e r c h a n g ef o rc h y m o t r y p s i ni n h i b i t o r2 ( c 1 2 ) o ni t sh i g ht e m p e r a t u r eu n f o l d i n gp a t h w a y i t i sf o u n d t h a tt h eu n f o l d i n go f t h ep r o t e i ni sm a i n l ye x h i b i t e da st h ed e r o g a t i o no f t h eh y d r o p h o b i c c o r ea n d t h ea v e r a g es h o r t e s tp a t hl e n g i l lr i s e si n c r e a s i n g l yw i t ht h eu n f o l d i n gp r o c e s s t h ec l u s t e r i n g c o e m c i e mo ft h en e t w o r ki sn o ts e n s i t i v et ot h ec h a n g eo ft h es e c o n d a r y s t r u c t u r e t h e :咖e e n n e s so f t h ef o l d i n gn u c l e ia r el o c a lm a ) ( i m u m ,a n dt h eb e t w e e n n e s so f t h ew e i g h t e da m i n o a c i dn e t w o r kh a v em o r ed i s t i n g u i s h a b l ep o w e rf o rf o l d i n gn u c l e it h a nt h a to ft h eu n w e i g h t e d a m i n oa c i dn e t w o r k i na d d i t i o n 。an e ws c o r ef u n c t i o ns ni sc o n s t r u c t e df o rp r o t e i nd o c k a n dt h e o r i n gr e s u i t sf o rt h eb o u n da n du n b o u n dd o c ks t r u c t u r eo f 4 2s y s t e m sw e r ec o m p a r e dw i t ht h e r e s u l t so b t a i n e df r o mt h er ps c o r i n g i ti sf o u n dt h a tt h es ns c o r ef u n c t i o ng o ts o m eb e t t e rr e s u l 协 o ns o m et a r g e t st h a nt h er ps c o r ef u n c t i o na n di ti sm o r es u i t a b l ew h e nt h ef l e x i b i l i t yo f p r o t e i ni s t a k e ni n t oa c c o u n ti nt h ed o c k i n gp r o c e s s t h i sw o r ki sh e l p f u lf o rt h es t u d i e so fp r o t e i nf o l d i n g a n dt h er e l a t i o n s h i pb e t w e e nt h es t r u c t u r ea n df u n c t i o nu s i n gt h ec o m p l e xn e t w o r kt h e o r y i nt h i sw o r k t h es l o w e s tm o d e so fg l u t a m i n e - b i n d i n gp r o t e i n s ( g i n b p ) t h r e e f o r m s ( 1 i g a n d - f r e eo p e n 1 i g a n d b o u n dc l o s e da n dl i g a n d ,雠ec l o s e dg i n b p ) w e r ei n v e s t i g a t e dw i t ht h e a i do fg a n s s i a nn e t w o r km o d e l “讣m da n dt h ea n i s o t r o p ye l a s t i cn e t w o r km o d e l a n i v i ) t h e r e s u l t ss h o wt h a tt h e “o p e n - c l o s e d t r a u s i t i o nm a i n l ye x h i b i t sa st h el a r g em o v e m e n to ft h es m a l l d o m a i n ,e s p e c i a l l yt h et o pr e g i o ni n c l u d i n gt w o 口- h e l i c e s a n dt w of l - s t r a n d s t h eo p e n - c l o s e m o t i o no ft h et w od o m a i n sh a sac o m m o nh i n g ea x i sc e n t e r e do nl y s 8 7a n dg l n l 8 3 a n dt h e “o p e n - c l o s e d ”c o n f o r m a t i o nt r a n s i t i o ni st h ed y n a m i cb e h a v i o ro f t h et o p o l o g ys t r u c t u r eo f g i n b p i na d d i t i o n ,t h ei n f l u e n c eo fd i f f e r e n ts t r u c t u r et o p o l o g yp r o p e r t yw a ss t u d i e do nt h em o t i o n m o d e s i ti sf o u n dt h a tt h et r e n do ft h e o p e n - c l o s o m o t i o ni sc o r r e l a t i v ew i t ht h ei n t e r a c t i o n b e t w e e nt h et w od o m a i n s ,a n da l s ot h et r e n di sc o r r e l a t i v ew i t ht h et o p o l o g yp r o p e r t yo ft h e s t r u c t u r eo fp r o t e i n w h e nt h ec o n t a c t sb c t w 伽t h el a r g ed o m a i na n dt h es m a l ld o m a i ni n c r e a s e , t h ea b i l i t yo ft h e o p e n - c l o s e d m o t i o ni sd e c r e a s e d t h i sw o r ks u p p l i e su s e f u li n f o r m a t i o nf b r u n d e r s t a n d i n gt h et r a n s i t i o np r o c e s so f t h eg i na n dt h eb i n d i n gb e t w e e np r o t e i na n di g a i l d - k e y w o r d s :p r o t e i nd e s i g n ;r e l a t i v ee n t r o p y ;t h eh n p m o d e l ;t h ew e i g h t e da m i n oa c i dn e t w o r k ; t h eg a n s s i a nn e t w o r km o d e l ;t h ea n i s o t r o p ye l a s t i cn e t w o r km o d e l 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特另口加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 躲衄瞬堡世 关于论文使用授权的说明 本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权 保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部 分内容,可以采用影印、缩印或其他复制手段保存论文 ( 保密的论文在解密后应遵守此规定) 签名: 导师签名呈塾婪隰 第1 章绪论 1 1 蛋白质折叠 1 1 1 简介 第1 章绪论 蛋白质是生命活动的主要承担者,对其结构与功能的研究具有重要的意义 【l 】。所有蛋白质都是由一维的氨基酸序列形成特定的三维结构后,才能发挥正确 的生理功能。但如何由蛋白质的氨基酸序列预狈4 其三维结构,是一个仍未解决的 问题,称为“蛋白质折叠” 2 1 。蛋白质折叠是一个涉及分子生物学、物理、化学的 交叉领域。人们在发现遗传信息储存在一个线性的、一维的d n a 碱基序列之后, 分子生物学中心法则的概念和框架就建立起来,即d n a _ i t n a j 蛋白质。 “一维线性观点”曾渗透到分子生物学的许多方面。但是,蛋白质只有折叠成特定 的空间结构后,才能发挥其生物功能。特别是起催化作用的各种酶,往往需折叠 成接近球形的特定形状,才能发挥作用。蛋白质折叠不对甚至还会导致病变。疯 牛病就是一种蛋白质折叠病【3 】。生物学提供了明显的例子,表明一维遗传信息的 存储和处理都不是简单的一维的。 细长的高分子链,可以形成各种空间构象。随着分子量增加,构象数目迅速 上升。蛋白质是长链型的分子,一般由5 0 到5 0 0 个氨基酸组成,而自然界只有 2 0 多种不同的氨基酸,这是蛋白质的突出特性。蛋白质的一级结构是指蛋白质 由一个特定的氨基酸序列组成,它的长度和分子量都是确定的。新合成的肽链的 某些段落会以较快的速度形成局部的二级结构。常见的二级结构有a 螺旋和平行 或反平行的p 片,它们都是由隔一定距离的氨基酸之间的氢键维系着。这些含二 级结构的肽链再以较慢的速度折叠成最终的三级结构。来自多个蛋白质的三级结 构会再形成多个亚基的复合体,称为蛋白质的四级结构。 蛋白质各自特有的三维空间结构决定了它的功能,蛋白质只有保持它特定的 天然三维结构时才能发挥生物功能。活细胞内大多数催化和化学功能都通过蛋白 质来完成。所以,问题归结为:蛋白质的残基序列是如何控制它在空间中的折叠, 并控制蛋白质功能。1 9 7 3 年,a n f i n s e n 4 1 傲了一个著名实验,变性蛋白质( 通过 北京工业大学工学博士学位论文 升温和或改变到不适当的p h 或盐浓度环境) 在适当的溶液环境下可以恢复其功 能,即折叠成天然态,而不需要任何细胞机制的辅助。后来又表明,蛋白质变性 也是个一级相变过程【5 6 1 。这种蛋白质折叠现象可能只是信息处理的简单例子, 但它在本质上是一个多维的、具有合作效应的问题。尽管a n f l n s e l 的实验说明 氨基酸序列( 一级结构) 已经包含了足以使它找到天然的空间折叠结构的必要 信息,但它的处理方式不是简单的符号到符号的顺序推进,而必须协同序列的其 它部分同时进行。 1 1 2 蛋白质折叠研究现状 从蛋白质的一级结构,预测二级结构已经有一些较好的算法和程序。进一步 预测三级结构,则仍然是颇具挑战性的难题。首先,已经测定的4 万多个蛋白质 的三维结构,只包含不超过一千种基本的折叠单元。为何基本折叠单元的种类这 么少? 这是一个物理学家感兴趣的问题,现在已经有了部分答案。原来,稳定的 折叠单元不仅要满足某种能量最低的条件,而且要具有唯一性,即同一条一级序 列不允许折叠到两个以上能量同样低的结构。那些折叠结果不唯一的序列,已经 在进化过程中被淘汰。其次,生物学家更感兴趣的问题是特定的一级序列会折叠 成什么样子,发挥何种生物功能。现在全世界每天可以从测序得到的d n a 序列 中翻译出上千条可能的蛋白质序列,而所有测定蛋白质结构的实验室目前每个月 总共只能给出约2 0 0 个结构。用实验方法确定所有重要蛋白质的结构,绝非短期 内能做到的事情。用理论方法从蛋白质一级结构预测其二级和三级结构,是当前 的紧迫课题。决定蛋白质折叠的基本相互作用力,其物理本质是清楚的。然而从 第一原理”出发,直接计算折叠过程仍然超出现有的最大计算机的能力。目前, 完全用蛋白质的物理模型进行分子动力学模拟,在小蛋白质的结构模拟中已经取 得突破进展。d u a n 7 1 和k o l l m a n 利用a m b e r 全原子力场,在充分溶剂化的情况 下对于一个3 6 肽在由几百个c p u 构成的并行超级计算机( c r a yt 3 e ) 进行了l 微秒的分子动力学模拟,得到了与晶体结构有一定类似性的结构,并观察到蛋白 质折叠的中间体。尽管这只是一个特例,但至少提示我们用于蛋白质结构模拟的 力场有很大程度的合理性。美国m m 公司在2 0 0 0 年提出个名为蓝色基因”的 计划,要用5 年时间,研制一台有1 百万个处理器的大规模并行系统,以便用3 2 第1 章绪论 天c p u 时间,算出一个实际蛋白质的折叠过程。这一计划即使顺利实现,也只 能表明人类对蛋白质折叠过程的认识水平,而不可能在近期内完全解决问题。在 相当长的时期内,人们还必须依靠已经积累的实验数据,用各种粗粒化方法做推 测。 对蛋白质折叠的理解意味着对它的氨基酸序列与天然结构关系的理解。这包 括下面三个方面: ( 1 ) 蛋白质折叠的机制,即蛋白质是如何在生物学的时间尺度内达到其天然 态的。一条残基链有许多可能的不同构象。假设一个残基相对于它的相邻残基平 均有j 个分离的不同的“旋转”构象( j 估计为1 6 左右) ,那么有个氨基酸的序 列就有膨= s ”个可能的构象。蛋白质折叠意味着从膨个可能构象中找到对应的 天然构象。最简单的办法就是在整个构象空间中穷尽搜索,但是膨的大小将随 着成指数增长,耗费的搜索时间将远远超过实验室观察到的蛋白质折叠的时 间尺度( 0 1 秒) ,甚至用天文时间尺度都不足以完成搜索,这就是所谓的l e v i n t h a l 悖论嘲。真实蛋白质的折叠必须要克服l e v i n t h a l 悖论。 ( 2 ) 蛋白质逆折叠( 蛋白质设计) 问题,即一个较好的折叠结构是如何选择 它的氨基酸序列的。有个氨基酸残基的蛋白质存在2 0 ”个可能的序列,所以蛋 白质的序列选择不可能通过穷尽搜索序列空间来找到。可以设想蛋白质序列是进 化选择的结果。而选择的机制又是什么昵? 或者,如何设计出一个氨基酸序列能 够既具有给定的折叠结构,又能克服l e v i n t h a l 悖论? 而自然界是否以同样的方 式进行进化选择,又是一个未解的问题。 ( 3 ) 蛋白质折叠结构预测,即给定序列,如何预测它的天然三维构象。这是 沟通基因信息与生物学功能的关键一步。目前最成功的预测是基于经验的方法, 比如基于同源性比较的方法,它假设两个类似的序列将有类似的折叠。这方面的 一个著名例子是t a r e a d i n g 方法【9 】。 蛋白质折叠理论研究的中心焦点是,从理论上建立相互作用模型,研究蛋白 质折叠过程中不同阶段的行为特征及其物理本质,从而寻找一个统一的框架来描 述蛋白质折叠的物理机制。并期望对真实蛋白质而言,能定量地分析和预测一些 因素如氨基酸序列、链的拓扑、p h 、盐浓度和温度等对折叠过程的运动学、熟 力学及结构的影响。理论模拟和实验已提供了大量证据,表明蛋白质在折叠过程 北京工业大学工学博士学位论文 中表现出丰富的热力学和动力学性质。 1 1 3 蛋白质折叠的热力学与动力学控制 根据分子生物学中心法则,生物遗传信息是由d n a - - * r n a ( t r a n s c r i p t i o n , 转录) ,一多肽链( t r a n s l a t i o n ,翻译) ,一具有生物活性的蛋白( f o l d i n g ,折叠) 进行转递的,到目前为止,人们对转录和翻译过程已经有了相当清晰和深入的了 解,但是多肽链是如何折叠成具有生物活性的蛋白分子这一步还不是十分清楚。 一条伸展的多肽链为什么能折叠成具有特定空间构象的蛋白分子,经典的“热力 学假说梭好地回答了这个问题,这个假说是a 幽s 等根据对k n a s e 复性研究 的经典实验提出来的,即一级结构决定三级结构。认为天然蛋白质多肽链所采取 的构象是在一定环境条件下热力学上最稳定的结果,采取天然构象的多肽链和它 所处的一定环境条件( 如溶液组分、p h 、温度、离子强度等) 整个系统的总自由 能( g i b b sf r e ee n e r g y ) 最低,所以处于变性状态的多肽链在一定的环境条件下 能够白发折叠成天然构象。在这种情况下,伸展多肽链向天然状态转变的折叠途 径就显得不重要。自从“热力学假说”提出后,得到了许多实验证据的证明,许多 蛋白( 特别是一些小蛋白) 在体外可以可逆的进行变性、复性。因此,“热力学假 说”得到了广泛的支持。但是,随着对蛋白质折叠研究的广泛开展,人们发现许 多蛋白质在体外的变性复性过程并非完全可逆,有的变性多肽链的复性效率很 低,而且多肽链在体外的复性速度大大低于在体内的折叠速度。多肽链在折叠过 程中实际上受到许多因素的限制作用,显然受到动力学上的控制。b a k e r 等【l o 】 认为,如果多肽链所采取的所有构象中仅有一个低自由能状态即天然构象,那么 所有非天然构象多肽链将遵循热力学假说由高能态向低能态转变,最终形成天然 构象。但是,对某些蛋白质而言,天然构象也许并非是多肽链自由能最低状态或 唯一的低能量状态,多肽链采取的某些非天然构象也很稳定。若某一多肽链具有 两种低能量状态:一种是天然构象,一种是非天然构象,而且处于这两种低能量 状态的多肽链的相互转变由于要克服较高的能垒( e n e r g yb a r r i e r ) 而难以实现,那 么在蛋白质折叠过程中就会有两种途径相互竞争,一种是正确折叠形成天然构象 的途径( o n - p a t h w a y ) ,另一种是错误折叠成稳定的非天然构象的途径( o 疗 p a t h w a y ) 。蛋白质多肽链之所以能正确折叠,是由于一些因素在蛋白质折叠的动 4 第1 章绪论 力学过程中起到控制作用,促进多驮链走入正确折叠途径。比如 p r o ”肽段对溶 解蛋白酶多肽链的折叠,在动力学上起到了控制作用,它抑制了错误折叠途径, 促进溶解蛋白酶多肽链沿正确折叠途径形成天然构象。不仅如此,人们现在已分 离到一些能在动力学上促进多肽链正确折叠的辅助因子。分子伴侣可通过与伸展 多肽链结合而帮助多肽链进行正确的非共价组装,但分子伴侣,在蛋白质分子伸 展与折叠过程中可能只是起到了消除不正确折叠与促成正确折叠的作用,或者只 是起到了稳定折叠中间体的作用,有关蛋白质高级结构的信息仍全部包含在其一 级结构中。蛋白质的一级结构决定高级结构这一论点,仍然是进行蛋白质结构预 测的理论基础。上述事实有力的说明了动力学控制在多肽链正确折叠过程中所起 的重要作用及其真实性。对蛋白质折叠的动力学控制的研究是建立在热力学假说 基础上对蛋白质折叠研究的进一步完善和发展。对不同的蛋白质而言,它们的折 叠并不是千篇一律,恧是各有特点。从总体上讲,蛋白质的折叠是遵循“热力学 假说”的,从高能态向低能态转变,但在这个过程中会受到动力学上的控制。热 力学控制与动力学控制在蛋白多肽链的折叠中是统一的,不同的蛋白质的折叠过 程所体现出来的二者所起作用的大小可能有所不同。对一些小分子单结构域的蛋 白来说,折叠过程相对简单一些,在热力学控制下能较容易的进行可逆的变性、 复性。对一些结构较为复杂的蛋白质特别是折叠过程中涉及到二硫键重排,脯氨 酰顺反异构化等限速步骤的多肽链的折叠反应来说,虽然从总体上讲是受热力学 控制,但折叠途径即动力学控制就显得比较重要了。 1 1 4 蛋白质折叠模型简介 “热力学假说圾动力学控制只是在总体上描述了蛋白质多肽链的折叠规律, 但没有告诉我们一条伸展的多肽链具体通过何种方式快速折叠而形成特定的三 维空间构象的。许多学者根据各自研究对象的折叠规律,提出了一些蛋白质折叠 的模型,在此我们简单介绍以下几种: ( 1 ) 成核快速生长模型( t h en u c l e a t i o n r a p i dg r o w t hm o d e l ) u i 】 伸展多肽链开始折叠时,多肽链上先形成许多小的“核”( n u ,这些小核 由8 1 8 个氨基酸残基组成,它们随机波动,很不稳定。多肽链的其它部分以“核” 为模板,快速折叠“生长”,最终形成天然构象。在这个模型中,成核阶段 5 北京工业大学工学博士学位论文 ( n u c l e a t i o n ) 是限速步骤。折叠核被认为是由一些关键的在进化中保守的残基接 触形成的。 ( 2 ) 扩散一碰撞一缔合模型( t h ed i f f u s i o n - c o l l i s i o n - a d h e s i o nm o d e l ) n 2 】 这一模型认为预先形成的较大的二级结构单元通过随机扩散和碰撞组装成 整个的折叠结构。多肽链在折叠起始阶段迅速形成一些类天然结构或称馓结构 域”( m i c r o d o m a i n ) ,如a - h e l i c e s ,1 3 - s t r a n & 等,这些结构在伸展的多肽链中不 稳定,它们之间相互碰撞、相互作用而结合在一起时,如果组装是有利的,这些 馓结构域”就稳定下来,多肷链进一步折叠形成天然构象。 ( 3 ) 框架模型( t h ef r a m 部v o r km o d e l ) u ” 在多肽链折叠过程中,先迅速形成二级结构,二级结构的形成通常先于三级 结构的形成,并且是独立的。多肽链在二级结构的基础上再进行组装,形成三级 结构。这个模型认为,即使是一个小蛋白也可以一部分一部分地进行折叠,其间 形成的亚结构域( s u b - d o m a i n ) 是折叠中间体的重要结构。 ( 4 ) 快速疏水坍缩折叠模型( t h e 脚i dh y d r o p h o b i cc o l l a p s em o d a l ) u 4 】 与以上模型相比,它强调了蛋白质折叠的主要驱动力为疏水效应。疏水坍缩 模型认为蛋白质折叠的初始阶段是分子坍缩。伸展多肽链处在极性的水溶液环境 中,其疏水侧链基团为避开极性环境而将非极性残基埋藏在蛋白质分子里面,导 致多肽链快速折叠,形成熔球体”( m o l t o n g l o b u l e ) ,然后形成二级结构及特殊 相互作用,再进一步折叠形成天然构象。 ( 5 ) 分级折叠模型,认为蛋白质折叠先在局部进行,然后扩展到更大的局部, 折叠的单元通过一步一步的方式组装起来,最后达到天然结构。将一个蛋白质分 解为几个较小的组成部分,如果这些部分仍然保留有折叠的能力,并且折叠成与 这些部分在整体蛋白质中一样的结构,这部分结构称为自折叠单元。自折叠单元 可以看作较大蛋白质的基本结构因子,它的序列中就完全包含有决定自己结构的 信息。不可能穷尽一个蛋白质的构象空间来寻找它的最佳结构,如果能把一个蛋 白质分解成若干个自折叠单元,蛋白质折叠的研究就能得到简化。其中的一个例 子是嗜热菌蛋白酶( t h e r m o l y s i n ) 。这个蛋白含有3 1 6 个氨基酸残基,由n 端及 c 端两个结构域组成,其中n 端结构域不具有独立折叠的能力,而c 端结构域 则可以折叠,最小的一个自折叠单元由6 1 个残基组成。这个自折叠结构与相应 6 第1 章绪论 序列在稳定蛋白质中的结构极为相似。这就证实了这个片断中的序列包含了形成 相应结构所需要的全部信息。 以上模型各有特点。与模型提出者们各自研究的对象及侧重点不同有关,它 们之间有许多相似之处。如“框架模型”中“微结构域、“扩散一碰撞一缔合模型” 中的“f l i c k e r i n gc l u s t e r ,以及“成核快速生长模型”的一些观点之问的相似性。 b a l d w i n l l 5 j 认为,在多肽链折叠的起始阶段,“疏水折叠”和二级结构的形成( 框 架模型) 是互补的,它们在多肽链折叠的起始阶段可以同时存在。因为在“溶球 体”中有大量的二级结构。除了这些折叠模型外,还有学者从另外的角度来考虑 多肽链在体内快速折叠的问题,如k a r p l u s 等【1 6 1 用m o n t ec a r o l 法对2 0 0 个随机 序列折叠动力学进行了研究,发现其中3 0 种能快速折叠,而其中1 4 6 种折叠速 度很慢。他们认为,在生物进化过程中,自然界容易选择那些能快速折叠而最终 达到热力学上稳定结构的序列,而那些折叠缓慢的多肤链在生物体内容易被蛋白 酶降解而被自然界淘汰。另外,多肽链在体内的快速折叠显然是由生物体内这个 特殊的生理环境所决定的,折叠过程受到许多酶的催化。如蛋白质二硫键异构酶 ( p d i ) ,脯氨酰顺反异构酶口p d 等,分子伴侣在这个过程中也会起到重要作用, 多肽链在体内折叠还可能是伴随着翻译转移( t r a n s l a t i o n t r a n s p o r t a t i o n ) 进 行的。b e r g n m n 和k u e b l ( 】发现免疫球蛋白轻链的c y s 3 5 c y s l 0 0 这对天然二硫 键是伴随着多肽链的翻译及向内质网转移的过程中形成的,说明多肽链n 端部 分在翻译还未完成时就开始折叠,这也是多肽链在体内快速折叠的一个原因 当然,以上模型不是互相排斥的,它们之间有交叉和共同的地方。这些理论 都有较强的物理背景,方法上多采用m o n t ec a r l o 方法对格点模型进行模拟。但 目前对于折叠机制的了解程度还不足以预测一个特定的序列如何折叠到天然构 象,或用逆折叠方法设计出能折叠到具有稳定结构的真实蛋白的新序列。实验技 术的发展,如动态n m r 、光谱技术、飞秒激光技术等,将提供时间和空间分辨 率越来越高的蛋白质运动细节。面计算机模拟能力的快速增强,在时间和空阃分 辨率上将逐步达到与实验可比较的程度。因而从原子细节上用m d 模拟方法研究 真实的或接近于真实的蛋白质的折叠机理也是可能的。如对b a r n a 船的变性, v i l l i n h e a d p e a c e 折叠中间态,和小肽的可逆折叠过程等,以及用m o n t e c a r l o 模 拟方法对如b 发卡形成的研究等。全原子动力学模拟达到了在结构和相互作用上 7 北京工业大学工学博士学位论文 的细致水平,但这无疑需耗费较多的计算机机时。适当简化的基于残基的动力学, 既可简化算法程序,又能兼顾到真实蛋白的具体结构。适用于这一方法的一个比 较细致的联合残基相互作用势已建立了起来。 要解决蛋白质折叠的问题,需要冲破微秒障碍。斯坦福大学的个研究组开 发了一种新的模拟蛋白质折叠方式f o l d i n g h o m e 川,它是一个研究蛋白质折叠、 错误折叠、聚合以及由此引起的相关疾病的分布式计算工程。他们使用联网式的 计算方式和大量的分布式计算能力来模拟蛋白质折叠的过程,并对由错误折叠引 起的一系列疾病进行研究。这是一种将工作单元分解成多个部分,使用多台处理 器来模拟的办法,用来冲破毫秒障碍。在从2 0 0 0 年l o 月到2 0 0 1 年l o 月的一年 内,这个小组使用实验性检验的方法获得了一些较小且能快速折叠的蛋白质。现 在正在进一步开发这个方法,并推广到模拟一些更加复杂的蛋白质,进一步研究 蛋白质正常折叠与错误折叠的闯题。 1 1 5 蛋白质折叠研究的热点 目前蛋白质折叠的研究热点有两个方面:一是蛋白质模型的研究。这方面集 中在简单的格点模型,但非格点模型越来越受到重视,主要内容有3 个方面:( 1 ) 水分子影响:( 2 ) 侧链的影响;( 3 ) 拓扑结构研究。二是蛋白质折叠机理的研究, 主要内容有;( 1 ) 热力学性质分析;c 2 ) 动力学过程的研究;( 3 ) 折叠初期研究。 下一步,蛋白质折叠的研究会更需要实验研究的深入,特别是蛋白质折叠初期快 速过程的研究;另一方厩蛋白质折叠过程需要更长时间的计算机模拟,这包括全 原子模型和简化的非格点模型。最后,我们还注意到,对一些基本问题的研究显 得越来越重要,如水分子如何与大分子相互作用,疏水相互作用的本质等。 1 2 蛋白质设计 蛋白质设计的目的是改造天然蛋白质或设计新的蛋白质,以获得最佳的结构 与性能。按照对蛋白质改造的程度,蛋白质设计可以分成三类:一是小范围改造, 比如定点突变等;二是较大
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 市政供热管网施工应急预案(3篇)
- 宜兴紫砂知识培训班课件
- 湖南省疾控中心应急预案(3篇)
- 防水注浆堵漏施工方案(3篇)
- 煤矿应急预案下载(3篇)
- 2025应急救援安全知识竞赛题库及答案
- 餐饮人员突发事件应急预案(3篇)
- 新学期推迟开学应急预案(3篇)
- 林区学校森林火灾应急预案(3篇)
- 广东江门幼儿师范高等专科学校《数据访问技术框架方向》2024-2025学年第一学期期末试卷
- 医院传染病预防和上报
- 期末核心考点:运动和力(含解析)-2024-2025学年人教版八年级物理下册
- 中成药合理使用培训课件
- 2025-2031年中国AI成人娃娃行业市场发展规模及投资机会研判报告
- 护士轮岗管理办法
- 记者证考试题库及答案
- 2025年林木种苗工考试林木种苗工(高级)试卷与答案
- 2025年公安部交管局三力测试题库及答案
- 复发性流产护理
- 2025年西藏自治区事业单位招聘考试教师招聘体育学科专业知识试卷(模拟试题)
- 先天性甲状腺功能减退症诊治指南解读课件
评论
0/150
提交评论