(凝聚态物理专业论文)蛋白质结构和功能的计算机模拟.pdf_第1页
(凝聚态物理专业论文)蛋白质结构和功能的计算机模拟.pdf_第2页
(凝聚态物理专业论文)蛋白质结构和功能的计算机模拟.pdf_第3页
(凝聚态物理专业论文)蛋白质结构和功能的计算机模拟.pdf_第4页
(凝聚态物理专业论文)蛋白质结构和功能的计算机模拟.pdf_第5页
已阅读5页,还剩55页未读 继续免费阅读

(凝聚态物理专业论文)蛋白质结构和功能的计算机模拟.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘耍 摘要 利用分子动力学模拟和静电分析的方法研究了蛋白质t c 2 3 0 的热稳定机制。 通过对蛋白整体静电势的计算解释了蛋白质的热稳定性。通过弹性网络模型,分 子动力学模拟及计算自由能的f e p 方法分析了霍乱毒素( c h o l e r at o x i n ) 的结构与 功能。利用分子动力学结合粗粒度势场对口2 微球蛋白8 3 8 9 片断的聚集现象进行 了研究。具体包括: 1 利用全原子分子动力学在显式水环境中模拟了不同温度下耐热性邻苯二酚双 加氧酶( t c 2 3 0 ) 分子及其突变体p 2 2 8 s 的动力学过程。通过分析与结构熵相关的 多弛豫指数从微观上揭示了两者热稳定性的差异。针对t c 2 3 0 表面富含带净电菏 残基的特征,结合求解线性p o i s s o n 方程的方法得出蛋白整体静电势,在一定程度 上阐释t t c 2 3 0 依靠表面静电势提高蛋白质热稳定性的机制。 2 通过弹性网络模型简单分析了霍乱毒素( c h o l e r at o x i n ) 的柔性及预测了可能 的低频运动模式。使用全原子分子动力学模拟了霍乱毒素b 子单元的结合位点的 柔性,并利用f e p ( f r e ee n e r g yp e r t u r b a t i o n ) 的方法计算了单配体与单个b 子单元在 水溶液中的结合自由能,在定量上较好的与实验结果相符。 3 利用分子动力学方法结合聿r 榜度的o p e p 势场对口2 微球蛋白8 3 8 9 片断的聚集现 象进行了1 6 # s 的模拟。对8 聚体的模拟得出了明显的口结构聚集的倾向。利用主 成分分析( p r i n c i p a lc o m p o n e n ta n a l y s i s ) 方法及与成核相关的理论对模拟中出现的 构型进行了分析。结合模拟的结果和已有的实验结论,对淀粉状纤维形成的机理 给出了尝试性的解释。 关键词:分子动力学蛋白质的热稳定表面静电势自由能扰动弹性网络模型 蛋白质聚集口2 微球蛋自主成分分析 i i a b s t r a c f a b s t r a c t t h et h e r m o s t a b l em e c h a n i s m o f w i l d t y p et c 2 3 0p r o t e i ni ss t u d i e db ye x p l i c i ts o l r v e n tm o l e c u l a rd y n a m i c ss i m u l a t i o nm e t h o da n de l e c t r o s t a t i ce n e r g yc a l c u l a t i o n t h e c o m p u t a t i o no fg l o b a le l e c t r o s t a t i cp o t e n t i a ls h o wt h a tt h es u r f a c ep o t e n t i a lo ft c 2 3 0 i su n e v e n l yd i s t r i b u t e d t h es t r u c t u r ea n df u n c t i o no fc h o l e r at o x i ni ss t u d i e db ye l a s t i cn e t w o r km o d e l ,m o l e c u l a rd y n a m i c ss i m u l a t i o n ,a n df r e ee n e r g yp e r t u r b a t i o n ( f e p ) m e t h o d m dm e t h o di sa l s op e r f o r m e dw i t ho p e pc o a r s e - g r a i n e dp o t e n t i a li ns t u d y i n g t h ea g g r e g a t i o nm e c h a n i s mo ff r a g m e n t8 3 8 9i nh u m a n3 2m i c r o g l o b u l i n 1 a l la t o me x p l i c i ts o l v e n tm o l e c u l a rd y n a m i c ss i m u l a t i o ni sa p p l i e dt op r o d u c e d t h ed i f f e r e n td y n a m i cb e h a v i o ro fw i l d t y p et c 2 3 0a n di t sm u t a n tp 2 2 8 sa td i f f e r e n t t e m p e r a t u r e c o n s i d e r i n gt h ea c i d i c r e s i d u er i c hc h a r a c t e r , s o l v i n gl i n e a rp o i s s o ne q u a t i o ng i v e st h ep r o t e i n sg l o b a le l e c t r o s t a t i cp o t e n t i a l ,w h i c ht h r o wl i g h to nt h eg l o b a l e l e c t r o s t a t i cp o t e n t i a lo p t i m i z a t i o nf e a t u r eo ft c 2 3 0 st h e r m o s t a b i l i t y 2 e l a s t i cn e t w o r km o d e l ( e n m ) i su t i l i z e dt os t u d yt h ef l e x i b i l i t yi nd i f f e r e n t p a r t so fc h o l e r at o x i n ( c t ) ,s e v e r a ll o wf r e q u e n c ym o t i o n sa r ee x t r a c t e di np r e d i c t - i n gt h ed o m a i nm o v e m e n t so fc t _ a l la t o mm o l e c u l a rd y n a m i c ss i m u l a t i o t i sa r ea l s o p e r f o r m e da n du s e dt oc o n f i r mt h ed o m a i nm o t i o ng i v e nb ye n m t e m p e r a t u r er e l a t e d f l e x i b i l i t ya t t h e l i g a n d b i n d i n gs i t e i n bs u b u n i t i sa l s o o b s e r v e d i na l la t o m m ds i m u l a - t i o n s f e pm e t h o dp r e s e n t sg o o dc o n s i s t e n c yw i t ht h ee x p e r i m e n t a lr e s u l ti nc o m p u t i n g t h eb i n d i n gf r e ee n e r g yo fs i n g l eg m lg a n g l i o s i d et obs u b u n i t 3 g e n e r a lm o l e c u l a rd y n a m i c sm e t h o d sg o e sw i t ho p e pc o a r s e g r a i n e df o r c e f i e l dr e p l i c a t et h ea g g r e g a t i o np h e n o m e n o no f f r a g m e n t8 3 8 9i nh u m a n3 2m i c r o g l o b u l i ni n1 6 z ss i m u l a t i o n f o rt h i so c t a m e r ,r e g u l a r s t r a n ds t r u c t u r ef r e q u e n t l yf o r m e d w h i c hi m p l i e st h ef a v o r e ds e c o n d a r ys t r u c t u r ep r e p e n s i t yo ft h i ss e q u e n c e p r i n c i p a l c o m p o n e n ta n a l y s i s ( p c a ) m e t h o da n dn u l e a t i o nt h e o r ya r ea p p l i e d i nc o n f i g u r a t i o n i 一 一 垒! ! 竺坚 a n a l y s i sp r o d u c e db ym di n n s s i g n i f i c a n tc o n s i s t e n c yo c c u r sb e t w e e no u rc o n c l u s i o n s a n dp r e v i o u se x p e r i m e n t a lr e s u l t s w h i c hl e n d sf u r t h e rs u p p o r tt oe i s e n b u r g st e n t a t i v e h y p o t h e s i s k e yw o r d s :m o l e c u l a rd y n a m i c s p r o t e i n t h e m o s t a b i l i t y s u r f a c ee l e c - 奸o s t a f i cp o t e n t i a lf r e ee n e r g yp e r t u r b a t i o n e l a t i en e t w o r km o d e l p r o t e i n a g g r e g a t i o n 3 2 m i c r o g l o b u l i np r i n c i p a lc o m p o n e n ta n a l y s i s i v 、 论文独戗性声明 本论文是我个人在导师指导下进行的研究工作及取得的研究成果。论文中除 了特别加以标注和致谢的地方外,不包含其他人或其它机构已经发表或撰写过的 研究成果。其他同志对本研究的启发和所做的贡献均已在论文中作了明确的声明 并表示了谫 意。 作者签名:虫i 篁 日期: 作者繇牟曰磐: 论文使用授权声明 掣r 本人完全了解复旦大学有关保留、使用学位论文的规定,即:学校有权保留 送交论文的复印件,允许论文被查阅和借阅;学校町以公布沦文的全部或部分内 容,可以采用影印、缩印或其它复制手段保存论文。保密的论文在解密后遵守此 规定。 作者签名: 鸷i 兰 导师签名 引言 引言 三百年前,牛顿和莱布尼茨发明了微积分,开启了近代科学的第一扇门。当 这座城门被攻破以后,给世界带来的是第一次工业革命。当微分方程盛及一时, 其标志为麦克斯韦以组不可分的微分方程概括了电与磁之间的关系,第二次工 业革命到来了。就在五六十年前。一边是贝尔试验室的s h o c k l e y 和b a r d e n 制出第 一支可用的三极管,另一边是逐渐成熟的电路理论,从而v l s i 的到来如雨后春笋, 第三次科技革命到来了。现代科学的进步使我们能看到万亿光年以外的事物,让 我们的足迹踏上月球,让我们探究小到看不见的分子,原子,夸克,不可谓不神通 广大。然而,我们对我们自身的关注却是甚少,困扰我们的疾病让我们束手无策。 我们渴望了解并鳃决我们自身的问题,而这切的切都被蛋自质这生物领域 的基石所决定。在生物领域的蛋白质正如在物理领域的原子分子,作为相互作用 的自然单元,这也是目前在生物实验上可以显式观测并被追溯到的最小单位,尽 管这并不方便,而且耗费毖巨。 对于蛋白质的理解,物理学家们已经作了接近半个世纪的努力。他们从各个侧 面,越来越了解这个貌似容易然而却是在热力学上出名棘手的玻璃态系统。p a u t i n g 将x 射线衍射引入生物大分子结构解析让我们知道千万种蛋白的原子微观排布, 之后各种各样基于物理原理的实验手段戍运而生:n m r ,圆二色光谱分析( c d s p e c t r u m ) ,氢交换等等。然而特别值得提到的是理论工作者在这方面的努力。虽 然我们拥有各种各样的手段,然而每种手段都有缺陷,甚至有些是共有的。退一 步言之,即使有了可用的手段,要解决一个实际问题,阐明一个机制,没有许多可 重复可支撑的实验是难以说明问题的。所以,单纯靠实验无论在时间还是金钱上 都耗费甚巨。理论模型的建立和计算机模孑蛆的出现则填补了这一空白。举例说 明,传统的新药开发以实验筛选,平均3 天筛选个前导化合物,在使用q s a r ( 定 量构效关系) 后平均一天能筛选1 0 0 0 一1 0 0 0 0 个,大大提高了效率。h i v 抑制剂的 设计,h s n i 病毒蛋自突破点的寻找无不与蛋自的结构有关。a l z h e i m e r ( 阿尔海默 症,又称老年性痴呆) ,二型槽尿病的发生则是直接与蛋白二绂结构的突变有关, 世界上无数的小组正在为攻克这些普遍威胁到入类健康的大敌而努力。下个世纪 在生物,尤其是基因和蛋白质这些重要的微观方向,其投入越来越多,美国向生 v 物科技的战略转移已经预示了这趋势。我国在这方面的投入也越来越多,无论 是在物质上还是在人才上。 目前,中国在这个生物物理领域的研究者还为数不多。作为刚近入这一领域, 具有物理背景的研究人员,我希望更多的用学到的物理知识为生物科学的理性研 究徽一些有意义的工作。 v i 第一章蟹向质相关的生化知识及分子模拟知识概要 第一章蛋白质相关的生化知识及分子模拟知识概要 1 1 蛋白质的构象 蛋白质是由2 0 种l 一型。氨基酸组成的长链分子。蛋白质按其分子外形的对称 程度可以分为球蛋白( g l o b u l a r p r o t e i n ) ,膜蛋l 刍( m e m b r a n ep r o t e i n ) ,和纤维状蛋白 质( f i b r o u sp r o t e i n ) 三大类。大多数蛋白质属于球蛋白。 蛋白质分子是由氨基酸首尾相连而成的共价多肽链,然而天然蛋白质并非 一条随机的松散肽链,而是折叠成某种特定的空间结构,这种空问结构称为蛋白 质的构象( p r o t e i nc o n f o r m a t i o n ) 。捕述蛋白质结构的空问结构可分成不同的层次 结构:级结构( p r i m a r ys t r u c t u r e ) 指多肽链排列的氮基酸序列( 如图i ,1 ) 。二级结 图j 1 一条多肽序列的一 级序列( 上排为三字母表示 法,f 摊为单字母表示法) 图1 2 一条口折叠二级当! ; 构的c a r t o o n 表示法 圈i 3 一条。螺旋_ 二级结 构的c a r t o o n 表示法 构( s e c o n d a r ys t r u c t u r e ) 指多肽链由氢键排列成沿维方向具有周期性结构的构象。 有几种类型的二级结构是特别稳定且在蛋白质中广泛出现,其中最主要的有两种 结构:口折叠和o z 螺旋( 如图1 2 ,1 3 ) 。 l i n u sp a u l i n g 和r o b e r tc o r e y 由x 射线衍射结果预测了这两种二级结构的存 在。三级结构( t e r t i a r ys t r u c t u r e ) 是指具有二级结构的多肽链进步出非共价键作 用( 范德瓦尔斯作用和静电相互作用) 折叠成具有特定空问结构的紧密堆叠构型。 更高级的四级结构则是由折叠成三级结构的大子单元结合成更大的聚合体。 其中,二缴结构是由级结构向更高级结构过渡的基础,对于二级结构的研 究也成为蛋白质折叠和功能研究中比较重要的一部分。连接氨基酸之间的肽键在 二级结构的形成中具有重要意义,它同时具有刚性和平面性,从而在维度上约束 了蛋白质的折叠。p a u l i n g 与c o r e ) , 于1 9 3 0 年发现在在一段多肽中的肽键c n 较般 第一章蛋向质相关的生化知识及分子模拟知识概要 氨基化合物中的c n 键为短,而且与其相联的3 个原子都在个平面内( 图1 1 ) ,即 称其为肽平面。肽平面可分别绕肽键c - n 和c c 。键旋转形成二面角,绕这两个轴 旋转帽对应形成的角度分别记为曲和妒,整个蛋白质所有的西和妒值的集合描述了 蛋白质的二级结构,称之为r a m a c h a n d r a n 构象图f 1 1 。在多肽链中的正常的n 结构 有类似螺旋的结构,周期为3 6 个残基指脱水后以肽键橱连的氮基酸) ,螺距为0 5 6 n m 。其他的n 螺旋( 如3 一l o 螺旋和7 r 螺旋) 有类似的结构,但周期不同。在多肽链中 的口结构具有伸展的结构,z 形的多肽骨架以紧邻的方式排列,其排列方式山氢 键的结合方式来区分可分为平行和反平行两种。从结构而言,平行结构的周期较 短( 0 6 5 n m ,反平行结构周期为0 7 0 n m ) ;从能量而言,反平行结构的结构能量比 平行的结构低些。 1 2 蛋白质折叠的物理机制 a n f i n s e n 2 对核糖核酸酶的研究工作发现其在体外的可逆变化,于是提出了 从解折叠态到折叠态的变化是由热力学主导的过程,折叠态对应的是自由能全局 最小的构象。然而,在另一方面,l e v i n t h a l 3 1 于1 9 6 9 年提出了一个佯谬,由于解 折叠得多肽链有大量的自由度,从丽整个多肽链的町能构象组合可达到天文数字 量绂( 对于1 0 0 个氨基酸序列,可能构象超过1 0 1 3 0 种的量级) 。就算多肽链以恒定的 高速率( p s 。) 随机采样构象空间所需时间将超过宇宙年龄的量级( 1 0 1 0 年) 。然而 事实上,蛋白质的折叠时间是在p s s 量级。因此,肽链采样构象空间的方式应该 不是随机的。蛋白质在折叠的初级阶段可酷认为是近似随机的,然而在缓下来的 折叠过程中则的采样则是有倾向的,其折叠过程是协同的,或者说存在特定的折 叠路径。这条路经在物理上被认为遵循最小阻挫原理,其能将蛋白质这样一个玻 璃态体系带入自由能的全局最小【4 1 ( 也存在一种观点,认为自然态达到的并非全 2 第一章蛋白质相关的生化知识及分二f 模拟知识概要 局最低而是所需时间最短最容易达到的动力学态【5 】) 。 蛋自质的自然态构象相对其它可能的构象而言更为稳定一些,在生理条件下 的蛋白质的折叠态和解折叠态的自由能差大约在2 0 至l j 6 5 k j m o l 的范围【6 】。一条多 肽链在理论上可以有无数多种构象,因此解折叠的蛋白质具有较高的构象熵。这 种构象熵以及氨基酸的侧链与溶剂之间的氢键作用是使多肽链保持其解折叠构象 的原因。在另一方面,各种弱相互作用,如肽链内的氢键,盐桥,疏水相互作用等 则是驱动折叠的力量。整个蛋白质分子的折叠就是这些弱相互作用竞争的结果。 可以设想,对于不同的氨基酸序列,各种相互作 j 所占的比例是不同的( 取决于各 氨基酸侧链的性质) ,可能导致的结果就是其折叠机制的不同。对于个较好的序 列,容易折叠到自然态的序列,根据t a n g c h a o 等人的研究【7 】应具有较裔的可设计 性( d e s i g n a b i l i t y ) ,即在靠近自然态周围的非自然态构象密度越小,蛋白质分子越 稳定。近年来发现某些许多疾病与蛋白的误折叠有关( 疯牛病,老年性痴呆,克雅 氏症,i i 型糖尿瘸等) ,其由援常的自然态折叠结构转变成纤维状聚集结构,其中纤 维结构的形成是由于一歼始形成一些具有卢结构特征的寡聚体( o l i g o m e r s ) 8 l 。本 论文的第三部分即研究了蛋臼聚集的初始阶段的动力学过程( k i n e t i c s ) 。 1 3 理论工具和基本原理 1 3 1 分子动力学 对于分子或原予系统的准确描述需要用到量子力学理论,然而做这样的汁算 代价高昂,从而只适用于1 0 一1 0 0 个原子的体系,并升i 适用于具有成千上万的原子 体系,即使这样计算可行,而我们的目的也许仅仅是想得到一个统计上的性质。 使用经验势场,将注意力放在原予核的运动,用有限的j l 个经验参数系统的描述 一套空间构型在某些情况下褥是好的近似。在给定了势场参数的条件下通过解经 典的牛顿方程即能够预测空侧原子排布随时| 日j 变化的轨道。 r ( ) = m ;a l ( ) 其中力的计算由势场决定 一篆= 蔷 t , 次l硼 ” 其具体臼勺算法实现依赖积分算子,在大部分的生物分子动力学模拟程序中使用的 3 第一章蛋白质相关的生化知识及分子模拟知识概要 积分算子都是v e d e t 算予 r ( c + ) = r ( ) + v ( t ) + a t 2 f a 一( t ) ( 1 2 ) a ( 归鼍岩 ( 1 3 ) ,( + ) = v ( 。+ ;f a ( ) + a ( + ) 】 ( 1 ,4 ) 在确定了势场和分子动力学的积分算予之后便是边界条件和系综的选取。对于 比较早的液滴( d r o p l e t ) 溶剂环境模拟,使用了真空边界条件,这样的边界条件不 适合进行较长时间的动力学模拟,原因是最外层水分子在无约束条件下将向外逃 逸,会影响到体系密度等宏观量。如果采用这样的体系,应该对最外层的溶剂分 子加以谐约束( 固定边界条件) 。另种广泛使用且较好的边界条件是周期性边界 条件( p e r i o d i cb o u n d a r yc o n d i t i o n ) 。前者的优势在于体系的形状可由分子形状而 定,能降低模拟体系的大小,而后者则较前者体系为大,另外对于周期性系统本 身的计算也比单位 搴系的计算多出许多,尤其是长程作用的计算。然而前者由于 在边界上的处理过于简单,需要将溶剂层取得较大来减少边界效应,无形中也增 加了计算量。同时,由于对长程的静电相互作用作简单的截断,其带来的误差不 可避免;而周期性边界条件使得各种较为商效且准确求长程静电相互作用的算 法( p m e ,p p p m ,多极展开) 得以实施。在本文的第三部分研究对短肽片段的隐式 溶剂分子动力学模拟中,采用了球边界条件,其在球边界的处理方法采用对触碰 原子其垂直球面动量分量反弹的方法使分子反方向折回。 对于生物分子体系的模拟系综选择。除非在考虑体系在较短时间内的动力 学性质,对体系进行短时间采样;才使用n v e 系综进行模拟。否则,一方面为 了与实验对比从而在正确的温度、压强条件下得到构型,另一方面弥补算法缺 陷或者其他因素导致的系统有大的热涨落。使之与热库交换而较快达到平衡。 就需要选用n v t 或n p t 系综。在生物分子模拟中一般使用b e r e n d s e n 9 或者n o s e h o o v e r 1 0 算法进行对体系的温度或压强耦合。在本文中还使用到了另外两种恒 温算法,其中一种是很简单的速度重标度( r e s c a l e ) ,用于简单的转换到不同目标温 度进行n v e 系综模拟: 4 第一章蛋白质相关的生化知识及分子模拟知识概要 弘r 麓 n o r m a lm o d e l e q u i v a l e n ta t o mm o d e l 其中,n 为系统中的自由原子数( 未约束) ,为目标温度 另一种则是在n a m d 程卑中得到实现的l a n g e v m 动力学方法,其可对温度和 压强同时进行耦合,适合般的分子的n v t ,n v r 系, 综模拟 m ;学= 吨圳沪哪;掣 ( 1 5 ) 其中随机力 ( ) 满足如下条件的高斯分布: ( ( ) ) = 0 ( ) 工( o ) ) = 2 口五,玩m :6 ( ) ( 1 6 ) ( 1 7 ) 为b o l t z m a n n 常数,为祸合的热库温度,摩擦系数阮可应用于逐原子( 般默认各原子具有相同的摩擦系数) 。由此导出的具有较为复杂的对速度的迭代 度标系数表达式,从而也周期性地对速度作度标。本文研究中用到的分子动力学 程序主要有两套,第一套是由伊利诺伊香摈分校( u n i v e r s i t yo fi l l i n o i sa tu r b a n a - c h a m p a i g n ) 的生物物理组开发的n a m d 程序l 1ij 。陔程序适合大规模并行,适合计 算较大体系,采用全碾子c h a r m m 势场【1 2 1 ,算法较为多样化。另一套是由n o r m a n d m o u s s e a u 等人合作编写的可扩展通用分子动力学程序s i m u l a t e u r ,适合进行小蛋白 折叠的长时日j 模拟,采用o p e p 势场【1 3 1 ,能够进行副本交换模拟( r e p l i c ae x c h a n g e m o l e c u l a rd y n a m i c s ) 。 1 3 2 分子模拟力场 对蛋白质等生物分子的模拟,根据目的和计算需求采用了不同的力场。 c h a r m m 势场 对于常规全原子模型的大规模模拟,采用了m a n i n k a 巾1 u s 及其在h a n ,a r d 的小 组发展的c 王l 啦m m ( c h e l t i i s 时a th a r v a r dm a c r o m o l e c u l a rm e c h a n i c s ) j 场。该力 场从c h a r m m l t y :始提供全原子参数,苣i c h a r m m 2 2 始完全使用全原子模型。 5 第一章蛋白质相关的生化知识及分子模拟知识概要 目前已发展至c h a r m m 2 7 ( 氨基酸残基参数采用c h a r m m 2 2 ,核酸参数包含于 新的c h a r m m 2 7 ) 。该力场是目前使用广泛且较为稳定的全原子模型力场之一, 适用于分子构象动力学和中等长时色j 的模拟。其势场分解到备经验参数的表达式 为: y ( r ) = ;( 1 i k 。) 2 + 鲁( 矾一只,。) 2 + 鲁( 1 + c 。s 一7 ) ) 出竺“,。,、2 ( 1 8 ) + f 一岫) 2 “7 + 娄,飘”一( 酬+ 盏) 其中的各项分别为键长项( b o n d ) ,键角项( a n g l e ) ,二面角项( d i h e d r a l ) ,旋转二面 ( i m p r o p e r ) ,6 1 2 范德瓦尔斯项,和静电库仑力项。 对于本文中研究霍乱毒素与g m l 神经节苷脂( m o n o s i a l o g a n g l i o s i d eg m l l 的 相互作用的课题除了需要一般氨基酸残基经验参数,还需要小分子g m lg a n g l i o s i d e 的力场。小分子g m l 一g a n g l i o s i d e 多个不同种类的单糖( o d 葡萄糖( o d g l u c o s e ) ,卢一d 一半乳糖( p d g a l a c t o s e ) 。p d 一半乳檐胺( n a c e t y l d g a l a c t o s a m i n e ) ,芦 d 一葡萄糖( d g l u c o s e ) ,唾液酸( s i a l i ca c i d ) ) 脱水构成。根据调研,国际目前对于 在水溶液中的单糖分子构象势场的参数化还处在初始阶段,比较可靠且被公认的 力场主要有两套:一套是由w o o d s d , 组开发的剑桥糖类势场参数( g l y c a m ) ,参数 拟和兼容a m b e r 力场,其力场基本包含大部分单糖分子,种类丰富,且包含新 分子力场拟含工具;另套则是i :d b r a d y 等人在发展的c s f f ( c a r b o h y d r a t es o l u t i o n f o r c ef i e l d ) 参数拟和兼容c h a r m m 势场,然而这套比较新的参数在穑分子种类 上寥寥可数。由于由单糖分子缩水得到的多糖在溶剂中构象十分多样化,是目前 研究的热点,意图自己通过从头计算对每一自出度扫描或者优化构型来拟和力学 和电荷参数将是十分繁杂且负荷重的工作。于是在计算中仍选用了j b r a d y 较早发 布( 经b i l l w e i s s 修正) 结合实验和小基组计算的全原子糖力场1 1 4 ,1 5 1 ,其中包含有 计算所需的所有分子( 仅需对q ,异构体二面角做对称性修正) 。通过和c s f f ( 以6 3 i * g 基组计算) 对应的相同参数对比发现,其各项误差均在0 1 以下,故认为可 以将其用于模拟。 6 第一章蛋向质相关的生化知识及分子模拟知识概要 o p e p 势场 除了使用全原子分子势场来研究分子构象变化,在对长时间的分子模拟研究 蛋白质分子聚集运动( k i n e t i c s ) 时,使用了车r 粒度( c o a r s eg r a i n e d ) 的联合原子力场 模型( u n i t e da t o mm o d e l ) 来降低计算量。同时大大拓展了模拟的时间尺度( 从纳秒 量级到微秒量级) 。o p e p ( o p t i m i z e dp o t e n t i a lf o re f f i c i e n tp e p t i a es t r u c t u r ep r e d i e - t i o ni na q u e o u ss o l u t i o n ) 势场基于扩散过程控制的蒙特卡洛方法,其能够产生一套 由热力学主导的自然构型系综( n a t i v es t a t ee n s e m b t e ) ,区别予其它全空间构象搜 索方法,更具有物理性。该势基于对多种在水溶液中具有不同构型的1 0 2 8 个 氨基酸长度的i ) i i 练多肽集合的m c 模拟从而优化已有势函数形式的各项具体参 数。o p e p 势场的建模使用6 原予代表一残基的方法,即每个氨基酸保留主链上 的n ,h ,c a ,c ,o 五个原子,以及额外再用一个原子表示侧链( 脯氨酸除外) 。 o p e p 势场的表达为经验参数的具体形式为: e :h e h b l + u h h e h b 2 + u l el + w s c e s c ,s c + 。一如。“+ “,拳邵+ 叫量睇( 1 9 ) 2 02 0 + w v e x p + a ) s q e s s 其中e _ f f 8 l 和e h b 2 表征主链氯键相互作用能,前者为两残基作用能,后者为四残 基作用能;e i 为二次函数形式,所有的键长、键角、二面角以次表达:侧链相互 作用点舀c s c 用6 一1 2 范德瓦尔斯相互作用和与氨基酸性质相关的m j 系数( m i y a z a w a a n d e m i g a n ) 为函数的能量项模拟;主链相互作用勋。同样以6 t 2 范德瓦尔斯相 互作用模拟;e # 和睇分别为2 0 个氨基酸的口螺旋及折叠结构倾向 k 一尸和l b 则 对脯氨酸和二硫键单独计算能量。各个能量项前的u 为待定权重,通过训练集拟 和。 文中使用的o p e p 势是已拟和好的势场。 7 第二章耐热蛋自, 质t c 2 3 0 热稳定机制的分子动力学模拟 第二章耐热蛋白质t c 2 3 0 热稳定机制的分子动力学模拟 耐热邻苯二酚2 ,3 - 双加氧酶( t c 2 3 0 ,t h e r m o s t a b l ec a t e c h o l2 , 3 d i o x y g e r n a s e ) 是 由复旦大学遗传所表达、纯化、结晶的一种能降解芳香族化合物的具有商热稳定 性的酶。对t c 2 3 0 的实验研究表明,t c 2 3 0 具有较高的热稳定性和酸碱稳定性, 其热变性发生在7 0 8 0 。c ,在p h 5 ,5 1l 的广阔范围具有稳定性。d a i ,l 等解析 出t t c 2 3 0 的晶体结构并对其进行建模l1 6 j 。j ic n 等报道了突变体p 2 2 8 s 的晶体 结构和x 射线散射分析,分析t t c 2 3 0 中对热稳定性做出贡献的一些残基f 1 7 1 。 在理论计算方面,z h a n g j h 通过对t c 2 3 0 在不同水环境的分子动力学模拟,验 证了水环境是影响蛋白质热稳定性的因素。通过对蛋白质残基的定点突变,并 结合与分子中弛豫过程相关的指数3 的研究,在一定程度上比较了t c 2 3 0 与其 同源蛋自i m p y 的热稳定性差剐n 8 】。此外,还研究了离子替代对全蛋白方均位 移( r m s d ) 的影响。 在本文中,主要研究使t c 2 3 0 稳定的热稳定机制,利用理论计算的方法致力 于找出使t c 2 3 0 保持热稳定性的因素,具体定位到某些关键性残基,将其与实验 对比。用到的主要方法是显式溶剂的分子动力学模拟和静电自由能计算。 2 1t c 2 3 0 的建模与模拟细节 野生型t c 2 3 0 的晶体原子坐标取自复旦大学基因工程国家重点实验室。完 整的t c 2 3 0 蛋白序列共包含3 2 7 个残基,在蛋臼质的两个催化活性中心各存 在一个二价镁离子。t c 2 3 0 在三级结构上类似于其喜温同源体一变儿茶酚 酶( m e t a p y r o c a t e c h a s e ,m p c ) 及b p h c 酶 隶属于邻苯二酚1 ,2 - 双加氧酶家族) 。为 更广泛的对比野生型t c 2 3 0 与其它喜温同源蛋白的整体特征差别,研究中对三者 进行了比较。后两种蛋白质的原子坐标p d b 文件可从蛋白质数据库( p r o t e i nd a t a b a n k ) 中取得( p d bi d 分别为1 m p y 和i d h y ) 。 在模拟之前首先对在原始x 射线衍射结构中丢失的原子坐标使用了 随n a m d 程序i 勺p s f g e n 模块程序重建,从丽使德蛋白质结构完整。然后,沿分子外 形对蛋白质分子包覆了7j :l 的水分子层。为研究离子浓度对野生型t c 2 3 0 热稳定 的影响,添加了正负离子( n a + 和a 一) 。离子在溶剂内的先随机置放,满足d e b y e - 8 第二章耐热蛋自质t c 2 3 0 热稳定机制的分子动力学模拟 h t i c k l e 近似下的生理浓度( o 1 5 4 m 0 1 l o ) 。然后对离予进行多步的m o n t e c a r l o 移 动从而中和局部带电残基的电荷。以上水和离子的添加均出s o l v a t e 程序完成。模 拟中非成键力的截断长度设为t 2 k ,截断平滑开关函数的长度设为s a 。模拟中 使用的积分步长为1 0f s ,系统先经历结构优化过程( 能量最小化) 。使用共轭梯 度法优化6 0 0 0 0 步,力梯度误差低于6 1 0 k c a l m o l 。系统温度开始设于3 0 k ,经 历z o p s 的构象平衡( e q u i l i b r i u m ) 。而后系统从3 0 k 开始以1 0 k 为间隔单位递增,在 每个温度段内连续进行1 0 p s 的n v e 模拟,一直模拟至4 5 0 k ,温度段间的转换通过 速度的度标变换实现。单个模拟的总持续时间为4 9 0 p s 。为了产生蛋白质的点突 变结构,再建模中使用了s w i s s - p d bv i e w e r d e e p v i e w 软件。该软件能在实行残基 突变后给出其在局部结构是否存在与其他残基侧链的碰撞抑或是能形成有利的 氧键。还允许手动调整侧链二商角及在完成突变之后实现对蛋白质的局部或整体 的结构优化。 2 2 理论计算与结果的分析 通过简单比较各种氨基酸成分在t c 2 3 0 、变儿茶酚酶及b p h c 酶所占的比例, 如表2 1 ,可见在t c 2 3 0 中侧链带不同种净电菏的氨基酸残基的比例与其他两种喜 温蛋白的相应比例表现出更大的不对称性。同时,其对不同同源体各氨基酸残基 种类的分类统计亦如下表示。通过比较可以发现,t c 2 3 0 的酸性氨基酸残基( 侧 蕾- h k l 啊i h “喇哪铀呷口幽f t ( :2 3 0 4 一i r 嘲8 l 蚵ih l 譬 图2 1t c 2 3 0 及其喜温同源体的氩基酸组成成分比较 链带净负电荷) 数目要比碱性氨基酸残基( 侧链带净正电荷) 数目多出不少( 对比于 其它两个喜温同源体而言) ;同时,极性氨基酸残基的数目也远多于其它两者,大 部分分布于蛋白质的表面。从后者给出的一个比较直接的假设就是t c 2 3 0 在疏 9 第- 二章耐热蛋向质t c 2 3 0 热稳定机制的分于动力学模拟 水核的埋藏上要比其它两个同源体好,但是与1 m p y 的对比对这一结论产生了质 疑,t c 2 3 0 表面有2 5 一3 0 区域有较大的疏水区暴露,其主要成分为脯氨酸, 而i m p y 的表面则几乎全部由亲水氨基酸构成。而表中数据显示,t c 2 3 0 的脯氨 酸成分也高于其它两种同源蛋白。脯氨酸对蛋白质的热稳定的贡献在蛋白质工程 中已被广为认知,且在工程上广泛的被用于用于提高蛋白质的热稳定性,其稳定 蛋自质的原因目前主要归结为其侧链与主链骨架原子相连成健,增强了骨架的刚 性,许多已有韵研究表明 1 9 2 0 ,2 1 ,2 2 ,也有相当大一部分耐热蛋白质的稳定性 是由静电相互作用贡献的,通过改善局部或者整体优化静电相互作用能很大的提 高热稳定性,其中比较典型的例子就是冷休克蛋( j ( c o l ds h o c k p r o t e i n ) ,其中的两 个残基被认为是对蛋白质的热稳定有重要作用的,蟹换这两个残基能影响蛋白质 的变性温度约1 6 。c ,静电相豆作用贡献的热稳定性有个显著特点,就是受阁嗣 电荷环境影响很大,p h 值的变化或者周酮离_ f 浓度的变化将极大的影响蛋白质 的热稳定性。为了了解这些带电残基对蛋白质热稳定性的影响,进行了加入离子 中和体系电荷与( 含盐) 不加入离子中和体系电荷( 不含赫) 的分子动力学模拟。加 离子与不加离子体系的方均根位移偏差( r m s d ,r o o tm e a ns q u a r ed e v i a t i o n ) 随温 度的变化如下图所示同时,为了定量分析分析蛋白质的热稳定性,引入了t s a i 等 图2 2 在含离子体系中的t c 2 3 0 模拟和不会 离子体系中的模拟方均根位移偏筹 圜2 3 由过渡散射函数经k w w 数拟台给 出多弛豫指数卢曲线,由1 开始下降表示弛豫过 程由单个到多个 人【2 3 ,2 4 在研究蛋白质动力学相变的中子散射实验中提出的多弛豫指数来定量 表征蛋自质的构象动力学。分子动力学模拟能够提供每一个原子i 随时间推移相 应的位胃矢量n ( ) ,为了与实验结果比较。必须计算出实验中相关的动力学结构 l o 第二章耐热蛋白质t c 2 3 0 热稳定机制的分子动力学模拟 因子s ( q ,) ,其中q 和u 分别对应于系统和入射中子之间交换的动量与能量。动 力学结构因子是v a nh o f f t 自相关函数的傅立叶变换,由分子动力学的数据可以计 算出时阃相关函数。过渡散射函数,。( q ,t ) ( i n t e r m e d i a t es c a t t e r i n gf u n c t i o n ) h h 下 式给出: l 。( q ,t ) = 醒,。f 4 ( r i ( 卜“0 1 1 ) ( 2 1 ) 。( q ,站与s ( q ,。) 的可经过一次傅立叶变化得到 s ( q ,u ) = i ( q ,t ) e x p ( i w t ) d t ( 2 2 ) 在低温情况下,体系近似谐振,+ 厶。( q ,f ) 可以只用单个指数函数表现蛋白质的振 动弛豫。当高温下同时有较多的热激发并且存在溶剂效应时,将出现多弛豫过程, 则j 。( q ,) 可写为这多个过稃作用的结果 如。( 眦) = r x pl i - t 亿3 ) 其中n 表征不同弛豫过程的弛豫时间常数。应用k o h l r a n s c h w i l l i a m s w a t t s ( k w w ) 函数 2 5 1 将其写为简单的指数式 归e 塞,e x p 一一斟 亿, 当只存在单个弛豫过程的时候,p = l ,弛豫过程数n n 增加的时候,相应的指数芦将 下降,故而目是一个描述弛豫过程的指数。当蛋白质达到接近变性的转变态路径 的时刻,由于可观测构象的迅速增加将导致许多物理量发生改变( 自由能,定压 摩尔热容,西值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论