(生物物理学专业论文)两态和单态蛋白质折叠机制的研究.pdf_第1页
(生物物理学专业论文)两态和单态蛋白质折叠机制的研究.pdf_第2页
(生物物理学专业论文)两态和单态蛋白质折叠机制的研究.pdf_第3页
(生物物理学专业论文)两态和单态蛋白质折叠机制的研究.pdf_第4页
(生物物理学专业论文)两态和单态蛋白质折叠机制的研究.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(生物物理学专业论文)两态和单态蛋白质折叠机制的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 1 i i llli i 1 1 rt 1 l lu y 18 9 5 9 2 3 s t u d i e so nt h em e c h a n i s mo ft w o s t a t ea n do n e s t a t e p r o t e i nf o l d i n g at h e s i ss u b m i t t e dt o d a l i a nm a r i t i m eu n i v e r s i t y i np a r t i a lf u l f i l l m e n to ft h e r e q u i r e m e n t sf o r t h ed e g r e eo f m a s t e ro fs c i e n c e b y m e n gw e n q i a n ( b i o p h y s i c s ) t h e s i ss u p e r v i s o r :p r o f e s s o rm i d o n g j u n e2 0 1 1 大连海事大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:本论文是在导师的指导下,独立进行研究工作所取得的成果, 撰写成博士硕士学位论文= = 匦查塑望查蛋自厦堑童扭亟9 的班峦:。除论文中 已经注明引用的内容外,对论文的研究做出重要贡献的个人和集体,均已在文中 以明确方式标明。本论文中不包含任何未加明确注明的其他个人或集体已经公开 发表或未公开发表的成果。 本声明的法律责任由本人承担。 论文作者签名:盂艾茴弘l j 年占月z 。1 日 学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连海事大学研究生学位论文提交、 版权使用管理办法 ,同意大连海事大学保留并向国家有关部门或机构送交学位 论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连海事大学可以将 本学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或 扫描等复制手段保存和汇编学位论文。 保密口,在年解密后适用本授权书。 本学位论文属于: 保密口 不保密口( 请在以上方框内打“ ) 论文作者签名:壶文西导师签名: 日期: j 年6 月z 了日 中文摘要 摘要 蛋白质折叠问题是生物学研究的前沿课题之一。为了能定量地解释蛋白质折 叠过程中的观测事实,也为了能统一解释单态和两态蛋白质折叠的共同机制,本 文在氨基酸层次上提出了一个一般的蛋白质折叠模型。 考虑到溶剂分子的“随机相互作用 和蛋白质多肽链内原子的“有序相互作 用 在蛋白质折叠的不同阶段所起的作用不同,我们把蛋白质折叠过程分为两个 相继的阶段:第一阶段是从开始折叠到形成第个天然接触的过程( 假设蛋白质 共有个天然接触) 。在这个过程中,溶剂分子的“随机相互作用 在蛋白质折 叠中占主导地位,这个阶段也是蛋白质折叠速率的决定步骤;第二阶段是从形成 第个天然接触到形成天然态的过程。在这个过程中,构成蛋白质的原子问的“有 序相互作用 在蛋白质折叠中起决定作用。在此阶段,自由能快速下降,过程几 乎是瞬间完成的。这样,第一阶段所用的时间就近似为蛋白质折叠时间。根据理 论假设,利用主方程的方法,可得到蛋白质折叠速率( 或折叠时间) 的表达式。 进一步的分析表明,不同的折叠条件对应模型中不同的参数范围,从而对应蛋白 质两态和单态不同的折叠模式。 我们选取了6 6 个折叠速率和天然结构都已知的两态小蛋白,编写程序计算了 其天然接触数。分析发现,折叠速率的自然对数与天然接触数之间存在近线性关 系,这与理论模型所预言的结果是一致的。对于单态蛋白质,由于对相关实验结 果存在争议,目前还难以直接用实验观测证明理论预言的结果。但分析表明,理 论预言的蛋白质最快折叠时间与实验观测到的蛋白质最快折叠时间符合的相当 好。 本文所建立的蛋白质折叠模型,一方面弥补了目前流行的折叠模型不能定量 解释部分实验现象的缺陷,同时也可用来统一描述两态和单态蛋白质的折叠机制。 希望我们的工作能为蛋白质折叠机制的进一步研究提供有益的启示。 关键词:蛋白质折叠机制;两态折叠;单态折叠;主方程;天然接触 英文摘要 a b s tr a c t p r o t e i nf o l d i n gi so n eo ft h em o s ta d v a n c e dt o p i c si nb i o l o g y t oq u a n t i t a t i v e l y e x p l a i nt h ef a c t so b s e r v e di ne x p e r i m e n t sa n dc o e x p l a i nt h em e c h a n i s mo fb o t h d o w n h i l lp r o t e i na n dt w o - s t a t ep r o t e i nf o l d i n g , ag e n e r a lp r o t e i n - f o l d i n gm o d e li s p r o p o s e da tt h ea m i n oa c i dl e v e li nt h i sp a p e r c o n s i d e r i n gt h ed i f f e r e n te f f e c t so ft h e s t o c h a s t i ci n t e r a c t i o n s o fs o l v e n t m o l e c u l e sa n dt h e o r d e ri n t e r a c t i o n s a m o n ga t o m si np o l y p e p t i d ei nd i f f e r e n t f o l d i n gs t a g e s ,w ed i v i d et h ef o l d i n gp r o c e s so fp r o t e i ni n t ot w os u c c e s s i v ep h a s e s : t h er a t e - d e t e r m i n i n gs t e p ,d o m i n a t e db yt h e “s t o c h a s t i ci n t e r a c t i o n s o fs o l v e n t m o l e c u l e s ,a n dt h er a p i dp h a s e ,d o m i n a t e db yt h e “o r d e ri n t e r a c t i o n s a m o n gm o m s i n p o l y p e p t i d e s u p p o s et h a tt h et o t a ln u m b e ro fn a t i v ec o n t a c t si sm f r o mt h eb e g i n n i n g o ff o l d i n gt ot h ef o r m a t i o no ft h en t hn a t i v ec o n t a c ti st h e f as t s t a g e ,w h i l e c o n f o r m a t i o n a lc h a n g e sb e t w e e nf o r m i n ga l lnn a t i v ec o n t a c t st of i n a lf o l d e ds t a t ei s t h es e c o n ds t a g e t h es e c o n dp h a s eg o e sd o w n h i l li nf r e ee n e r g y , a n di sr e g a r d e da s a na l m o s ti n s t a n t a n e o u sp r o c e s s h e n c et h ef i r s tp h a s ei sa p p r o x i m a t e l yc o n s i d e r e da s t h ep r o t e i n f o l d i n gt i m eh e r e t h em a s t e re q u a t i o na p p r o a c hi su s e dt oi n v e s t i g a t et h e f o l d i n gk i n e t i c si nt h et h e o r y , a n da na n a l y t i c a lt r e a t m e n to ft h em a s t e re q u a t i o n y i e l d sas i m p l et h r e e - p a r a m e t e re x p r e s s i o nf o rf o l d i n gt i m e ( o rf o l d i n gr a t e ) f u r t h e r a n a l y s i ss h o w sm 咄b o 也t w o s t a t ea n dd o w n h i l lp r o t o nf o l d i n gc a l lb ed e s c r i b e db ya u n i f y i n gm o d e l ,d e p e n d i n go nd i f f e r e n tf o l d i n gc o n d i t i o n s ,a n dt h e r e f o r et h ed i f f e r e n t p a r a m e t e rv a l u e si i lt h em o d e l as e to f6 6s m a l lt w o s t a t ep r o t e i n sa r es e l e c t e di nt h es t u d y , w h e r ea l lt h e f o l d i n gr a t e sa n dn a t i v es t r u c t u r e sw e r em e a s u r e db ye x p e r i m e n t w ew r i t eap r o g r a m t oc a l c u l a t et h en u m b e ro fn a t i v ec o n t a c t so ft h e s ep r o t e i n s i ti sf o u n dt h a tt h e r e l a t i o n s h i pb e t w e e nt h en a t u r a ll o g a r i t h mo ff o l d i n gr a t ea n dt h en u m b e ro fn a t i v e c o n t a c t si s n e a r l yl i n e a r , w h i c hi s c o n s i s t e n tw i t ht h er e s u l t s p r e d i c t e db yt h e t h e o r e t i c a lm o d e l d u et ot h ec o n t r o v e r s ys u r r o u n d i n gt h ee x p e r i m e n t sa n dt h el a c ko f a c c e p t e de x p e r i m e n t a ld a t a , i ti sd i f f i c u l ta tp r e s e n tt od i r e c t l yv 嘶匆t h et h e o r e t i e a l 英文摘要 p r e d i c tb ya s e to fv a l i dd o w n h i l lf o l d i n gp r o t o n s h o w e v e r , t h ef o l d i n gs p e e dl i m i t t h a te x p e r i m e n t a la n dt h e o r e t i c a la p p r o a c h e sp r e d i c ti sc l o s e o nt h eo n eh a n d ,t h ee s t a b l i s h e du n i f y i n gm o d a lo fp r o t e i nf o l d i n gm a k e su pt h e d e f e c tt h a tt h ep o p u l a rf o l d i n gm o d e l sc a nn o te x p l a i ns o m ee x p e r i m e n t a lp h e n o m e n a q u a n t i t a t i v e l y ;o nt h eo t h e rh a n d ,i tc a nb eu s e dt od e s c r i b eb o t ht w o - s t a t ep r o t e i n f o l d i n ga n do n e - s t a t ep r o t e i nf o l d i n g h o p eo u rw o r kc a np r o v i d eu s e f u li n s p i r a t i o nt o t h ef u r t h e rs t u d yo fp r o t e i nf o l d i n gm e c h a n i s m k e yw o r d s :p r o t e i nf o l d i n gm e c h a n i s m ;t w o - s t a t ef o l d i n g ;o n e - s t a t ef o l d i n g ; t h em a s t e re q u a t i o n ;n a t i v ec o n t a c t 目录 目录 第l 章引言1 1 1 蛋白质概述。l 1 1 1 蛋白质的组成1 1 1 2 蛋白质的结构1 1 1 3 蛋白质的功能2 1 2 蛋白质折叠3 1 2 1 蛋白质折叠研究的理论意义:一3 1 2 2 蛋白质折叠研究的应用价值4 1 3 研究蛋白质折叠的方法5 1 4 本文研究的目的和意义。6 第2 章目前流行的蛋白质折叠模型7 2 1 两态和单态蛋白质的折叠现象7 2 1 1 序列唯一决定结构。8 2 1 2 两态折叠现象8 2 1 3 单态折叠现象。9 2 1 4 折叠速率与蛋白质的拓扑参数间的定量关系1 1 2 2 当前流行的蛋白质折叠模型1 1 2 3 流行的蛋白质折叠模型存在的问题1 5 第3 章两态和单态蛋白质折叠的统一模型1 6 3 1 理论模型1 6 3 2 数学推导17 第4 章理论预言与实验结果的比较2 l 4 1 两态蛋白质2l 4 1 1 选取要分析的两态蛋白质及其相关实验数据2 l 4 1 2 编写程序计算两态小蛋白质的天然接触数2 3 4 1 3 确定两态蛋白质折叠速率的自然对数与其天然接触数的最大相关 1 生2 3 4 1 4 理论模型中参数的确定2 8 4 2 单态蛋白质2 9 第5 章总结与展望3l 参考文献3 3 附录蛋白质p d b 编号和名称3 8 攻读学位期间公开发表论文4 0 目录 致谢4 1 研究生履历4 2 两态和单态蛋白质折叠机制的研究 1 1 蛋白质概述 第1 章引言 1 1 1 蛋白质的组成 蛋白质是一种复杂的有机化合物,主要由碳、氢、氧、氮元素组成,一般蛋 白质可能还会含有磷、硫、铁、锌、铜、硼、锰、碘、钼等元素。蛋白质的基本 组成单位是氨基酸。存在于自然界的氨基酸有3 0 0 多种,但构成天然蛋白质的氨 基酸仅有2 0 种。氨基酸间通过脱水缩合形成肽链。蛋白质可能由一条或者多条 肽链组成,每一条肽链有几十至几百个氨基酸残基不等。根据分子生物学的“中 心法则”,蛋白质的氨基酸序列是由基因编码决定的,各种氨基酸按照一定的顺 序排列,折叠成一定的空间结构,从而发挥某一特定功能。在生物体内,蛋白质 是在核糖体上合成的。 1 1 2 蛋白质的结构 一般来说,蛋白质的结构分可为四个等级,如图1 1 所示: ( 1 ) 一级结构:氨基酸的线性排列,相邻氨基酸的羧基和氨基通过形成肽 键,组成蛋白质多肽链。 ( 2 ) 二级结构:依靠不同氨基酸之间的c = o 和n h 基团间的氢键形成的 稳定结构,主要为a 螺旋和b 折叠【。 ( 3 ) 三级结构:多个二级结构在三维空间的排列形成蛋白质分子的三维结 构。稳定蛋白质三级结构的主要因素是疏水作用,另外还有氢键、盐键和范德华 力以及肽链内的二硫键、肽链和所含金属元素间的配位键等。 ( 4 ) 四级结构:有的蛋白质分子由两条或两条以上具有独立三级结构的肽 链通过非共价键相连聚合而成,其多肽链间通过次级键相互组合而形成的空间结 构称为蛋白质的四级结构。 蛋白质并不是完全刚性分子,在生物体内常会进行结构的相互转换。在溶液 中,由于热振动以及蛋白质与其他分子之间的碰撞,蛋白质的结构也会发生动态 变化。 第1 章引言 一缪结构 两态和单态蛋白质折叠机制的研究 1 2 蛋白质折叠 蛋白质一般都会呈现出一个特定的三维结构,我们称这一特定结构为天然 态。大部分蛋白质通过本身氨基酸序列的性质自发进行折叠,也有些蛋白质需要 分子伴侣的帮助来进行正确的折叠。蛋白质由其松散的多肽链状态( 一级结构) 卷曲形成为紧致的天然状态( - - 级结构) 的过程称为蛋白质的折叠。 目前,蛋白质折叠问题不仅是生物学的前沿课题之一,甚至也被视为整个科 学中的一个悬而未决的重大问题【3 1 。蛋白质折叠是结构生物学中最复杂的问题之 一【4 】。蛋白质的折叠包括两个方面的问题:其一是结构预测问题,即从蛋白质的 一级结构( 氨基酸序列) 预测其天然的三级结构;其二是折叠机制问题,即蛋白 质是如何由一个多肽链折叠成其天然结构的【5 1 。这两个方面并不是孤立的,而是 相互关联的。 1 2 1 蛋白质折叠研究的理论意义 现代分子生物学中最基本最重要的规律之一“中心法则,是指遗传信 息从d n a 传递给d n a ,以及从d n a 传递给r n a ,再从r n a 传递给蛋白质的 信息传递过程。也就是说,在生物体内,存在着“纵和“横 两个方向的信息 流动:“纵向流动指的是遗传信息经过d n a 复制传递给下一代;“横”向流 动指的是遗传信息通过转录、翻译传递到蛋白质中表达生命信息。 “横向流动又包括两个方面。一方面是d n a 携带着遗传信息通过转录、 翻译过程决定氨基酸的排列,形成蛋白质的一级结构,这一传递过程是由三联子 密码介导的。另一方面是肽链经过疏水塌缩、空间盘曲、侧链聚集等折叠过程形 成蛋白质的天然构象,同时获得生物活性,从而将生命信息表达出来。 蛋白质的结构决定其生物学功能。仅仅知道基因组序列并不能使我们 了解蛋白质的功能,也不能知道蛋白质的工作机理。蛋白质作为生命信息表 达的载体,从一级结构的氨基酸排列到三维结构的转化过程,使得蛋白质具有了 特定的空间构象,才具有生物学功能【6 】。 蛋白质的三级结构是由氨基酸排列的一级结构决定的,那么,两者之间肯定 存在着某种联系。也许正如三联子密码( 三个核苷酸决定一个氨基酸) 主宰氨基 酸排列顺序那样,蛋白质的折叠也是有规律可循的。也有人把蛋白质这种由一级 3 第1 章引言 结构决定空间结构的密码称为“第二遗传密码【7 p 。显然,“第二遗传密码,是 分子生物学“中心法则 的必要组成部分。 1 2 2 蛋白质折叠研究的应用价值 研究蛋白质的折叠不仅具有重要的理论意义,而且还有广阔的应用前景。例 如: ( 1 ) 包涵体复性 目前,可以利用d n a 重组将外源基因导入宿主细胞,但是重组基因的产 物往往形成无活性、不溶解的包涵体8 1 。阐明蛋白质折叠机制对于包涵体的复性 有重要的意义。 ( 2 ) 人工设计蛋白质 d n a 重组和多肽合成技术使人们可以按照自己的意愿设计较长的多肽链。 但是由于不了解多肽链的折叠机制,也就无法按照自己的意愿设计出需要的、具 有特定功能的蛋白质。 ( 3 ) 寻找致病机理 许多疾病,如阿兹海默症,疯牛病,可传播性海绵状脑病,肌萎缩性脊髓 侧索硬化症,还有帕金森氏症等正是由于一些细胞内的重要蛋白发生突变,导致 蛋白质聚沉或错误折叠而造成的【9 1 。因此,掌握蛋白质折叠的机制就可以从这些 疾病的致病机理上研发治疗方法,为人类健康做出卓越贡献。 ( 4 ) 揭示蛋白质功能 基因组序列的发展使我们得到了大量的蛋白质序列,结构信息的获得对于 揭示它们的生物学功能是十分重要的。依靠现有手段( x - r a y 晶体衍射、n m r 及电镜) 测定蛋白质的结构需要较长的时间,因此结构解析的步伐已落后于发现 新蛋白的步伐。而结构预测的方法虽然速度较快,但可靠性并不高,只有当我们 对于维持蛋白质结构,驱动蛋白质折叠的理化因素更为了解,这一方法才可能有 根本的改进。另外,我们对于蛋白质相互作用、配体与蛋白质的作用等结构与功 能关系的研究也有赖于蛋白质折叠机制的阐明。 两态和单态蛋白质折叠机制的研究 1 3 研究蛋白质折叠的方法 研究蛋白质折叠的方法主要有以下三种:实验、理论和模拟。 采用实验方法研究蛋白质折叠又分为在体内( i nv i v o ) 和在体外( i nv i t r o ) 两大类。 ( 1 ) 体内研究着重于蛋白质在细胞或者整个组织中的活性作用,从而可以 了解蛋白质发挥功能的场所和相应的调节机制。因而,体内蛋白质研究常常专注 于蛋白质在细胞中的合成和定位。蛋白质在细胞内进行生物合成时,其多肽链都 是在一种由多种蛋白质和核糖核酸所组成的被称为核糖体的复合物上,以信使核 糖核酸为模板,从氨基末端开始,按照三联密码,一个氨基酸接着一个氨基酸加 上去而合成出来的【5 1 。一般认为,多肽链是一边进行长度上的不断增加,一边进 行折叠的,而不是在合成完成脱离核糖体后再自发折叠成为蛋白质。另外,细胞 内有许多蛋白质还要借助于分子伴侣的帮助才能折叠到其天然结构。考虑到体内 蛋白质的折叠往往需要有其他辅助因子的参与,并伴随有a t p 的水解,目前要 想用这种方法研究蛋白质的折叠过程还是非常困难的。 ( 2 ) 在体外,可将纯化后的蛋白质置于可控制的环境中,以期获得它们的 结构和功能方面的信息。例如,酶动力学相关的研究可以揭示酶催化反应的化学 机制和与不同底物分子之间的相对亲和力。同时,利用可控制的环境条件,还可 观察、测量蛋白质的具体折叠过程的许多信息。本文中所应用到的蛋白质数据都 是在体外研究得到的。 采用理论方法研究蛋白质折叠,主要是从蛋白质的结构出发,利用化学、物 理原理来研究蛋白质的折叠机制。在第2 章中列出的几种模型都属于采用理论方 法研究。但从力场的精确性和计算机的计算能力来看,在目前以及可预见的将来 要想真正模拟蛋白质的折叠过程还是不太现实的。 采用模拟方法研究蛋白质折叠,主要是在计算机( i ns i l i c o ) 上,从各种层 次建立蛋白质的折叠模型,用计算机模拟出蛋白质折叠的热力学和动力学过程。 这种方法需要建立在理论研究的基础之上。 第1 章引言 1 4 本文研究的目的和意义 根据能量图景理论【1 0 1 ,蛋白质折叠可以分为四种类型( 详见第2 章) 。其中, 单态和小的两态折叠蛋白质( k ,即k i 。在这种情况下,式( 3 1 0 ) 中等号右边的后两项相对 于第一项来说很小,可以忽略,方程( 3 1 0 ) 可近似写成: r 茎=足 ( k 一1 ) 2 k ( 3 1 1 ) 由上式可知,对于两态折叠动力学,折叠时间随着的增加呈指数上升。 由于折叠时间是折叠速率的倒数,则有上式可得, i n k = 口一b n ( 3 1 2 ) 其中,a = l n e ( k - 1 ) 2 k + k ,b = i n k 。 与两态折叠相反,如果随着天然接触数的增大,对应的自由能下降,这时, 疋 k ,即k i 。在这种情况下,式( 3 1 0 ) 中等号右边的第一和第三部分项相对 于第二项来说很小,可以忽略,方程( 3 1 0 ) 可近似写成: f 旦一 ( 1 - k ) t ( 3 1 3 ) 与两态蛋白质折叠不同,上式表明,折叠时间随着的增加呈线性上升。显然, 这种情况对应着单态蛋白质的折叠。同样,对于单态折叠蛋白质,我们有, i n k - - c i n n ( 3 1 4 ) 其中,k = 1 r ,c = i n 0 - k ) k + 】。 第3 章两态和单态蛋白质折叠的统一模型 式( 3 1 2 ) 表明,两态小蛋白质折叠速率的自然对数i n k 和其天然接触数 之间存在线性关系;式( 3 1 4 ) 表明,单态蛋白质折叠速率的自然对数i n k 和其 天然接触数的自然对数m 之间存在线性关系。这个结论是由所建立的蛋白质统 一折叠模型中推导出来的。要判断此统一折叠模型的正确性及有效性,就要看一 看由这个模型推导出来的主要结论能在多大程度上与实际情况相一致。在下一 章,我们将对蛋白质折叠试验中与折叠速率和天然结构有关的定量结果作一分 析,以期能与上述模型的主要结论加以比较。 两态和单态蛋白质折叠机制的研究 第4 章理论预言与实验结果的比较 4 1两态蛋白质 4 1 1 选取要分析的两态蛋白质及其相关实验数据 为了确定蛋白质的折叠速率与其天然接触数之间的关系,既需要知道蛋白质 的折叠速率,又要知道其三维结构。我们选取了6 6 个两态小蛋白,其中4 7 个来 自参考文献【鲫,其余来自蛋白质折叠动力学数据库【6 1 1 。 表4 1 是所选取的6 6 个两态小蛋白质及其折叠速率的自然对数。我们知道, 蛋白质折叠速率受到许多外界环境因素的影响,比如温度、p h 、缓冲液、变性 剂浓度等等。在这里,我们选取的是标准状态,即2 5 、p h = 7 0 、5 0 r a m 缓冲 液【6 1 , 6 2 1 。表4 1 中各列的含义:p d bi d 是相应的蛋白质在p d b 数据库中的编码; f i r s tr e s 、l a s tr e s 和l e n g t h 分别是所研究的p d b 中的蛋白质的第一和最后一个 氨基酸在多肽链中的位置和氨基酸个数;l n k 是折叠速率的自然对数。 表4 1 两态蛋白质及其折叠速率 t a b 4 1t w o - s t a t ep r o t e i n sa n dt h e i rf o l d i n gr a t e su s e di nt h i ss t u d y p d bi dc mf i r s tr e sl a s tr e s l e n g t hp d b l n k 1 时sl19 89 81 5 1 a v zc 8 51 4 1 5 74 8 8 1 a y in a18 68 67 2 1 b a 5a55 34 95 9 1 b d d n al6 0 6 01 1 7 4 1 b r sd18 98 93 4 1 c 8 ca16 46 47 1 c i s12 08 56 63 8 7 1 c s pn al6 76 76 5 1 p g b ln a4 15 61 61 2 1 c u na 7 1 1 21 0 64 8 l d ln a5 81 4 99 23 2 7 1 d 2 n al5 6 5 66 1 1 e o la 1 3 73 71 0 6 1 e o ma13 73 78 9 l e n hn a35 65 4 1 0 5 9 l f e xa l5 9 5 98 2 1 f k bn a11 0 71 0 71 5 第4 章理论预言与实验结果的比较 1 c 9 0a 16 66 6 7 2 1 f k fa 11 0 71 0 71 6 1 f n fn a1 3 2 71 4 1 58 9 - 0 9 1 g 6 p1 a16 66 6 6 3 1 g v 2a 1 4 41 9 04 78 7 1 h r cn a11 0 41 0 4 7 9 4 i l m q n a18 68 67 3 1 j m q a 54 44 08 4 1 j 0 8n a1 5 85 82 4 6 1 j y ga 16 96 99 1 1 l 2 y 1 a12 02 01 2 4 3 1 l m ba68 58 08 5 1 m 9 s n a3 9 14 6 67 63 9 8 l m j cn a2 7 06 95 3 1 n 8 8l a19 69 62 0 2 1 n t i 1l8 68 66 9 6 1 0 6 x1 a 18 18 16 8 1 p b a118 18 16 8 1 p g b 2n a 15 65 66 1 p i na6 3 93 49 4 4 1 p k sn a47 97 6- 1 0 5 1 p n ja 1 a8 48 6- 1 1 p o hn al8 58 5 2 7 1 p i ma 75 34 71 3 8 l p s fa 16 96 93 2 1 i 江a15 51 3 2 7 88 3 6 1 r i s n a19 79 75 9 1 r l q n a 96 45 64 3 6 1 s h fa8 4 1 4 2 5 9 4 5 1 s h gn a 66 25 71 4 l s p ra21 0 4 1 0 38 7 l s r ln a96 45 6 4 1 t 8 ja 22 32 31 1 8 1 t e nn a8 0 3 8 9 18 91 1 1 u 5 pa 1 6 6 21 7 7 11 1 0 1 1 1 u b q n a1 7 67 65 9 1 u r na29 79 6 5 8 1 v i in a4 17 63 61 1 5 1 1 w i tn a 19 39 3o 4 1 y c cn al1 0 31 0 39 6 2 2 a 3 dn a18 37 31 2 2 2 a b d118 6 8 66 6 2 a c yn a 19 89 8o 9 2 2 2 两态和单态蛋白质折叠机制的研究 2 c 1 2a2 08 36 45 8 2 p d d134 34 19 8 2 p t l11 87 76 04 1 3 g b la15 65 66 3 2 5 6 ba l1 0 6 1 0 61 2 2 4 1 2 编写程序计算两态小蛋白质的天然接触数 首先给出接触的定义:在天然结构的蛋白质分子中,任何两个氨基酸残基, 只要其( 可以以氨基酸的口碳原子为基准,也可以以氨基酸的质心为基准) 在空 间的距离d 在一定的范围内,而在一维序列上又有一定的氨基酸间隔数,就规 定它们形成了一个天然接剧5 1 。 显然,要计算每个蛋白质的接触数,需要给定d 和,的具体值。我们让d 和 ,在一定的范围内变化,分别计算出折叠速率的自然对数与接触数之间的相关系 数,通过找出最大的线性相关性来确定最优的d 和,的数值。在计算接触数时, 我们选择d 在0 4 纳米1 3 纳米间变化,每次增加0 1 纳米;选择,在3 - 3 0 个 氨基酸间变化,每次增加1 个氨基酸。这样就可计算出与不同 以n 值对应的天 然接触数,然后,再分别求它们与蛋白质折叠速率的自然对数的线性相关性。 4 1 3 确定两态蛋白质折叠速率的自然对数与其天然接触数的最大相关性 以氨基酸的口碳原子为基准计算接触数,当d = 0 6 纳米,分别取3 - - 3 0 时, ,与相关系数r 的关系如图4 1 所示。从图上我们看出,在d = 0 6 纳米时,在 5 1 8 之间取值时,相关系数尺的值都大于0 7 6 。 当d = 0 7 纳米,z 分别取3 - - 3 0 时,与相关系数r 的关系如图4 2 所示。从 图上我们看出,在d = 0 7 纳米时,在5 1 9 之间取值时,相关系数r 的值都大 于0 7 6 。 当d = 0 8 纳米,分别取3 - 3 0 时,与相关系数尺的关系如图4 3 所示。从 图上我们看出,在d = 0 8 纳米时,在乱1 6 之间取值时,相关系数尺的值都大 于0 7 6 。 第4 章理论预言与实验结果的比较 o 8 0 o 7 5 o 7 0 o 6 5 o 6 0 o 5 5 o 5 0 0 4 5 o246 81 01 21 41 6 1 82 02 22 42 62 83 03 2 两态和单态蛋白质折叠机制的研究 o 8 0 o 7 5 o 7 0 0 匕0 6 5 o 6 0 o 5 5 0 5 0 o246 81 01 21 41 61 8 2 0 2 2 2 4 2 62 8 3 0 3 2 i 图4 3 相关系数与氨基酸间隔数的关系( d = 0 8 纳米) f i g 4 3r e l a t i o n s h i pb e t w e e n t h ec o r r e l a t i o nc o e f f i c i e n t sa n dt h ea m i n oa c i d si n t e r v a l s ( 扣0 8 n m ) 当l = 5 个氨基酸,d 分别取4 1 3 a 时,d 与相关系数r 的关系如图4 4 所示。 从图上我们看出,在l = 5 个氨基酸时,d 在6 8 之间取值时,相关系数尺的值都 大于0 7 6 。 当l - - 1 3 个氨基酸,d 分别取4 1 3 a 时,d 与相关系数r 的关系如图4 5 所示。 从图上我们看出,在l = 1 3 个氨基酸时,d 在6 8 之间取值时,相关系数尺的值 都大于0 7 6 。 第4 章理论预言与实验结果的比较 0 8 0 0 7 5 o 7 0 o 6 5 叱0 6 0 o 5 5 o 5 0 0 4 5 o 0 3 567891 01 11 21 31 4 d 图4 4 相关系数与空间距离的关系( ,= 5 个氨基酸) f i g 4 4r e l a t i o n s h i pb c d n e e l lt h ec o r r e l a t i o nc o e f f i c i e n t sa n dt h ed i s t a n c e ( i = 5r t n i l l oa c i d s ) 两态和单态蛋白质折叠机制的研究 f i g 4 5r e l a t i o n s h i pb e t w e e nt h ec o r r e l a t i o nc o e f f i c i e n t sa n dt h ed i s t a n c e ( ,= 1 3a m i n o a c i d s ) 对比以上五幅图,我们可以看出,d 从0 6 纳米到0 8 纳米,从6 - - 1 6 个氨 基酸,对折叠速率的自然对数与接触数之间的相关系数r 都没有显著的影响, 其值一直都大于0 7 6 。 当d = 0 7 纳米,= 1 3 个氨基酸时,折叠速率的自然对数与接触数之间的最 大相关系数r = 0 8 1 。此时,相应的折叠速率的自然对数i n k 和接触数的具体值 如表4 2 所示。 表4 2 接触数及折叠速率的自然对数 t a b 4 1c o n t a c t sa n dt h en a t u r a ll o g a r i t h mo ft h ef o l d i n gr a t e s p d bi dni n kp d bi d n i n kp d bi d ni n k 1 a p s 1 4 7- 1 51 g v 238 71 r i s1 0 65 9 1 a v z6 74 8 81 h r c 7 2 7 9 4 1 r l q 6 34 3 6 l a y i2 57 2 i l m q 4 27 31 s h f6 94 5 1 b a 5 5 5 91 j m q 1 38 41 s h g6 41 4 1 b d d1 41 1 7 41 j 0 8 7 2 2 4 61 s p r 7 68 7 1 b r s7 03 4l j y g1 79 11s i 也6 24 1 c 8 c3 7 71 l 2 y21 2 4 31 t 8 j011 8 1 c i s7 63 8 71 l m b 1 9 8 51 t e n 1 3 91 1 1 c s p 7 56 51 m 9 s8 73 9 81 u 5 p1 91 1 1 p g b l 51 21 m j c7 85 3 1 u b q 7 25 9 1 c u n2 24 81 n 8 81 0 42 0 21 u r n9 85 8 l d 1 9 03 2 71 n t i4 86 9 6l v i i61 1 5 1 1 d 23 76 11 0 6 x 6 5 6 81 w i t 1 5 4 0 4 1 e o l1 0l o 6l p b a6 86 81 y c c6 89 6 2 l e o m 1 28 9l p g b 24 062 a 3 d1 31 2 2 l e n h31 0 5 91 p 酣 11 9 4 42 a b d5 46 6 1 f e x58 21 p k s1 0 41 0 52 a c y1 3 5o 9 2 l f k b 1 5 61 51 p n j8 812 c 1 26 75 8 1 c 9 07 37 21 p o h9 42 72 p d d 1 0 9 8 1 f k f1 5 31 6l p r b1 71 3 82 p t l5 34 1 1 f n f1 4 0- o 9 1 p s f7 53 23 g b l4 1 6 3 1 g 6 p8 86 31 r f a 7 3 8 3 62 5 6 b3 71 2 2 线性回归分析显示,折叠速率的自然对数i n k 和接触数满足关系: i n k = 1 0 4 1 4 0 0 7 1 n( 4 1 ) 第4 章理论预言与实验结果的比较 其中,相关系数r = - 0 8 1 ,线性相关的p 值非常小,p 0 0 0 0 1 ,说明此结果是高 度可信的。 图4 6 是当d = 0 7 纳米,z = 1 3 个氨基酸时,蛋白质的折叠速率的自然对 数i n k 和以o 碳原子为基准计算出的接触数的线性相关图。 1 6 1 4 1 2 1 0 8 蔷 6 l 4 2 0 - 2 2 0o2 04 06 08 01 0 01 2 01 4 01 6 0 n 图4 6l n k 和的相关性 f i g 4 6c o r r e l a t i o nb e t w e e ni n ka n dn 与相对接触序中的天然接触不同,形成一个天然接触的两个残基在空间上 很近,但是在序列上很远。例如,在q 螺旋中由于主链氢键结合的两个残基不会 形成一个天然接触。事实上,这种天然接触强调在蛋白质折叠中长程相互作用的 重要性。 4 1 4 理论模型中参数的确定 对比第三章中理论模型推导出的等式( 3 1 2 ) 和本章中线性拟合得到的等 式( 4 1 ) ,对于两态蛋白质折叠动力学来说,我们可以得出: | = 6 5 x 1 0 6 s 一1 ,k = 7 0 x 1 0 6 s 一1( 4 2 ) 两态和单态蛋白质折叠机制的研究 表4 1 中提到的8 个蛋白质( 1 e o l 、i e n h 、1 l 2 y 、1 l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论