




已阅读5页,还剩62页未读, 继续免费阅读
(原子与分子物理专业论文)蛋白质折叠的计算机模拟研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
山东师范大学硕士学位论文 蛋白质折叠的计算机模拟 中文摘要 蛋白质折叠问题 即蛋白质是如何由结构简单的肽链折叠成为特定的三维空 间结构的问题 是生命科学中非常重要的研究方向 在蛋白质的折叠过程中 有 多种复杂的因素对它产生影响 包括溶剂的作用 温度的作用 酸碱度的作用 压强的作用等 很多原因可以使蛋白质错误折叠形成难溶性的纤维状聚集物 导 致疾病 例如阿尔茨海默症 高压使蛋白质变性实验越来越受到人们的重视 研究蛋白质折叠问题 除了利用一系列实验技术例如x 射线晶体衍射 核 磁共振光谱等以外 计算机模拟具有不可替代的作用 g r o m o s 9 是分子动力学模 拟领域著名的软件 它根据生物分子的结构原理 建立理论模型 通过模拟原子 运动得到生物大分子的结构信息及动力学消息 本文以淀粉样蛋白ab 为对象 研究高压对ab 蛋白去折叠过程中结构变化 的影响 我们选择a b4 0 和a b4 2 它们的三维结构已经测出 采用g r o m o s 9 6 软件包 使ab4 0 和ab4 2 分别在常温不同压强0 1 m p a 2 0 0 m p a 1 0 0 0 m p a 下 运行6 0 n s 的去折叠动力学模拟 并对模拟结果进行了分析 本论文共分六章 第一章为综述 主要讲述了蛋白质的组成及结构 蛋白质 折叠问题的由来 折叠路径问题 折叠中的动力学假说与热力学假说以及折叠过 程情况 蛋白质折叠的计算机模拟的意义 第二章为分子动力学模拟及g r o m o s 介绍了分子动力学模拟的原理 介绍了进行分子动力学模拟的软件g r o m o s 以 及该软件模拟的原理 其中包括经验力场和位能函数 分子动力学模拟的v e r l e t 蛙跳方法 s h a k e 约束技术以及能量优化的最速下降法和共轭梯度法 第三章为 阿尔茨海默症和淀粉样蛋白ab 介绍本文的研究对象淀粉样蛋白ab 和阿尔茨 海默症的研究现状 第四章 第五章分别为高压环境下对ab4 0 和ab4 2 所作的 分子动力学模拟和结果分析 得出了一些有益的结果 主要内容如下 高压致淀粉样蛋白ab4 0 和ab4 2 结构变化的分子动力学模拟 利用 g r o m a c s 9 6 软件包 o p l s 一从力场 常温下 我们使ab4 0 在分别在1 大气压 2 0 0 0 大气压 1 0 0 0 0 大气压下 进行分子动力学模拟 对模拟输出的轨迹分析其 二级结构 回旋半径 原子坐标的均方根偏差 以及溶剂疏水残基的可及性表面 积 并对不同的压强作用效果进行分析 结论为不同的压强对不同的蛋白质具有 不同的效果 但是在蛋白质去折叠的初期 旷螺旋由于受到疏水中心的保护作用 山东师范大学硕士学位论文 它在高压下的去折叠要比常压下的时间延迟 而且 2 0 0 0 大气压能够抑制ab4 2 在水溶液中形成s 一折叠片结构 最后一章为全文总结 比较分析了高压影响ab4 0 和ab4 2 结构变化的异同 关键词 蛋白质 蛋白质折叠 分子动力学模拟 淀粉样蛋白a b 高压去折叠 结构变化 分类号 q 6 1 5 i i 山东师范大学硕士学位论文 m o l e c u l a rd y n a m i cs i m u l a t i o n so fp r o t e i o nf o l d i n g a b s t r a c t d e t e r m i n i n g t h ep r o c e s s b yw h i c hp r o t e i n s f o l di n t o p a r t i c u l a rs h a p e s c h a r a c t e r i s t i co ft h e i ra m i n oa c i ds e q u e n c e i sc o m m o n l yc a l l e d t h ep r o t e i nf o l d i n g p r o b l e m w h i c h i sa ni m p o r t a n t t o p i c s i ns t r u c t u r a lb i o l o g y ap r o t e i nf o l d s s p o n t a n e o u s l yi n t oau n i q u e3 ds t r u c t u r eu n d e rp h y s i o l o g i c a lc o n d i t i o n s i nc o n t r a s t t h i ss t r u c t u r ec a nb ee a s i l yb r o k e nu n d e rs o m ea r t i f i c i a lc o n d i t i o n s s u c ha s h i g h t e m p e r a t u r e s l o w h i g hp h h i g hp r e s s u r e o rp r e s e n c eo fd e n a t u r a n t s p r o t e i nf o l d i n g c a l lg ow r o n gf o rm a n yr e a s o n s i r r e v e r s i b l ym i s f o l d e dp r o t e i nf o r mi n s o l u b l ep r o t e i n a g g r e g a t e sf o u n di nc e r t a i nt i s s u e st h a ta lec h a r a c t e r i s t i co fs o m ed i s e a s e s s u c ha s a l z h e i m e r sd i s e a s e p r e s s u r ei sb e c o m i n gi n c r e a s e s i n g l yp o p u l a ra sat o o lf o r i n v e s t i g a t i n gp r o t e i nu n f o l d i n g m o l e c u l a rd y n a m i c ss i m u l a t i o n s w h i c hm a k eu s eo fc l a s s i c a ln e w t o nm e c h a n i c s t og e n e r a t et r a j e c t o r i e s a r ep l a y i n ga l le v e r e x p a n d i n gr o l ei ni nc o m p u t a t i o n a lp o w e r a n dc o n c o m i t a n ti m p r o v e m e n t si nf o r c ef i e l d s i np a r t i c u l a r t h ec o n t r i b u t i o no fs u c h s t u d i e st op r o t e i nf o l d i n gi si m m e n s e i nt h i st h e s i s w ef o c u so nt h ea m y l o i d1 3 一p e p t i d e ab t oc h a r a c t e r z et h es t r u c t u r a lc h a n g e si nb o t ha 1 3 4 0a n da 1 3 4 2p e p t i d e m o n o m e r s w ep e r f o r m6i n d e p e n d e n tl o n g t i m em o l e c u l a rd y n a m i c s m d s i m u l a t i o n sa tv a r i a b l ep r e s s u r eo fo 1m p a 2 0 0 m p aa n d10 0 0 m p af o rt o t l eo f3 6 0 n s i nc h a p t e ro n e i td i s c u s s e st h ef o l l o w i n gt h r e ep r o b l e m s 1 t h ec o m p o s i n ga n d s t r u c t u r eo fp r o t e i n 2 t h eo r i g i no fp r o t e i nf o l d i n g f o l d i n gp a t h w a y f o l d i n gc o u r s e a n dt h et h e r m o d y n a m i c sh y p o t h e s i sa n dd y n a m i c sh y p o t h e s i sd u r i n gf o l d i n g 3 t h e s i g n i f i c a n c eo fp r o t e i nf o l d i n gw i t hc o m p u t e rs i m u l a t i o n s i nc h a p t e rt w o t h em o l e c u l a rd y n a m i c ss i m u l a t i o ns o f t w a r eg r o m o sa n di t s s t i m u l a n tp r i n c i p l ea r ed i s c u s s e d i tc o m p r i s e se x p e r i e n t i a lf o r c ef i e l da n dp o t e n t i a l e n e r g yf u n c t i o n a n ds h a k e c o n s t r a i n t a tl a s t v e r l e tl e a p f r o gm e t h o do fm o l e c u l a r s i m u l a t i o na n de n e r g ym i n i m u mm e t h o ds u c ha ss t e e p e s td e s c e n t sm e t h o da n d c o n j u g a t eg r a d i e n t sm e t h o da r ea n a l y s i s e d i nc h a p t e rt h r e e t h ea l z h e i m e r sd i s e a s ea n dt h ec h a r a t e r so fa m y l o i d 1 3 p e p t i d e ab i si n t r o d u c e d i i i 山东师范大学硕士学位论文 i nc h a p t e rf o u ra n df i v e t h ep r e s s u r e i n d u c e ds t r u c t u r a lc h a n g e so fa 阻oa n d a 1 3 4 2a r ed i s c u s s e d a f e rd o w n l o a d i n gt h e3 d s t r u c t u r eo fa i b 4 0a n da 1 3 4 2f r o mt h e p r o t e i nd a t ab a n k w i t hg r o m o s 9 6s o f t w a r ep a c k a g e w ep e r f o r m6i n d e p e n d e n t l o n g t i m em o l e c u l a rd y n a m i c s m d s i m u l a t i o n sa t v a r i a b l ep r e s s u r eo fo 1m p a 2 0 0 m p aa n dl0 0 0 m p af o rt o t a lo f3 6 0 n s a t3 0 0 ki na q u e o u ss o l u t i o n a n dt h e n w e d i s c u s s e dt h es t r u c t u r a lc h a n g e su n d e rv a r i o u sp r e s s u r e t h em o d e r a t ep r e s s u r es u c h a s2 0 0 m p ac o u l da c c e l e r a t et h eu n f o l d i n gr a t eo fa h e l i x w h i l eh i g e rp r e s s u r e s u c ha s10 0 0 m p ar e s t r a i n e di t su n f o l d i n gr a t e a n da i m 2c o u l d n tf o r mi b s h e e t w h i l e a i m 0c o u l d k e yw o r d s p r o t e i n m o l e c u l ed y n a m i c ss i m u l a t i o n a m y l o i d1 3 p e p t i d e a i m 0 a i m 2 p r e s s u r e i n d u c e du n f o l d i n g c l a s s i f i c a t i o n q 615 i v 独创声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果 据我所知 除了文中特别加以标注和致谢的地方外 论文中不包含其 他人已经发表或撰写过的研究成果 也不包含为获得 注 如 没有其他需要特别声明的 本栏可空 或其他教育机构的学位或证书使用过的材 料 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明 并表示谢意 学位论文作者虢罗套萝 导师签字 王叁华 学位论文版权使用授权书 本学位论文作者完全了解堂撞有关保留 使用学位论文的规定 有权保 留并向国家有关部门或机构送交论文的复印件和磁盘 允许论文被查阅和借阅 本人授权堂撞可以将学位论文的全部或部分内容编入有关数据库进行检索 可 以采用影印 缩印或扫描等复制手段保存 汇编学位论文 保密的学位论文在 解密后适用本授权书 学位论文作者签名 罗孝聋 签字日期 2 0 0 夕年歹月箩日 导师狞王老学 签字日期 2 0 罗年 日 山东师范大学硕士学位论文 第一章蛋白质综述 1 1 蛋白质的结构 蛋白质是一切生命的物质基础 是生命活动的承担者 没有蛋白质就没有 生命 蛋白质构成人体的每个组织 如 毛发 皮肤 肌肉 骨骼 内脏 大脑 血液 神经 内分泌等 蛋白质构成人体必需的催化和调节功能的各种酶 保证 我们体内的生化反应正常进行 蛋白质维持肌体正常的新陈代谢和各类物质在体 内的输送 蛋白质帮助凝血和伤口愈合 蛋白质是制造抗体唯一来源 增加免疫 力抵抗感染 蛋白质调节体内水份平衡 维持身体各种机能 所有的蛋白质都是 由2 0 种氨基酸排列组合而成 按照组成的比例和排列顺序的不同 人体中的蛋 白质可达数1 0 万种 它们的结构 功能干差万别 形成了生命的多样性和复杂 性 蛋白质的结构决定其生物功能 只有当蛋白质折叠为正确的三维空间结构时 它才具有正常的生物功能 蛋白质研究的根本目的是根据需要的生物功能对蛋白 质结构进行改造以及设计新的蛋白质来满足人类的需要 1 1 1 蛋白质的基本组成单位 蛋白质分子是由氨基酸缩聚失水成肽键相连的链型多肽大分子 自然界中组 成蛋白质的氨基酸有2 0 种 氨基酸是蛋白质的基本组成单位 氨基酸是带有氨基 的有机酸 它由一个氨基 一个羧基 一个氢原子和一个r 基团组成 如图1 1 蛋白质分子主链c 原子称为c 与c 相连的是c 与c 相连的是c 等等 这2 0 种 氨基酸其侧链基团r 在大小 形状 电荷 形成氢键的能力和化学活性方面都存 在着差异 蛋白质实现的功能范围所以如此之广 就是由于这2 0 种氨基酸的差异 以及它们的各种组合的变化的结果 r 1 0 0 a a 的折叠过稗中 通常会有类似融球卷的中间体h 现睁 然而众多单结构域小蛋白 l o o a a 或更小 的折叠却表现为明显的两卷过 程 只有完全非折叠卷和自然态两种状态存在 两态折叠必须符合以下儿个条件 l 封 一 蛋白质的变复性曲线都必须呈现单指数f 降的特征 在动力学实验中测 得的自然态和非折叠态的信号差必须一致 二 蛋白变复性的速率常数必须要 和平衡常数相等 三 表征蛋白不同结构部分的检测手段检测到的蛋白折叠过程 必须相同 解释蛋白两态折叠行为有两种机制 过渡态理论和漏斗模型 在过渡态理论中 个能最屏障阻碍了非折叠多肤向过渡奎 t s 的转换 在 到达过渡志后 蛋白会迅速达到其自然状态构象 在此理论中 非折叠态 l 态 过渡卷 t s 态 自然态 卷 是三个宏观状态 每一个宏观状态都包含丁一系列 具有特定性质的微观状态 特定的妓基结构和链的构象 这三个宏观状态单线完 成丁蛋白的折叠过程 u t s n 圈1 1 0 过渡态的形成是蛋白两志折叠 过程中的瓶颈 在漏斗模型中 蛋白的两态折叠可以用非常平滑的能量地形来 描述 如图19 a 所示 漏斗上部是平滑的 到达自然态的路径是陡蛸险峻的 这 个模型显示了大量不同的非折叠态构象如何快速到达特定构象自然态的过程 然 而漏斗模型不足之处在于缺乏一个能量屏障 不能很好地解释二态折叠的动力 学 相反地 过渡态理论虽然可以解释折叠曲线的单指数彳亍为 却不能实际上说 山东师范大学硕士学位论文 明折叠的高速率 因为理论上能量屏障是会降低折叠速率的 近来 s c h o n b r u n 和d i l l 为解释快速折叠动力学提出了三条结论 他们认为多条平行微观折叠 路径的存在引发了蛋白的快速折叠 折叠的一开始 多肽并不会去寻找非折叠的 构象空间 相反它们会沿着漏斗形的能量平面滑下 大量的折叠路线在到达漏斗 的瓶颈处 相应于折叠曲线的转换区 才会大大减少 非折叠多肽在折叠的开始很 容易形成类似自然结构中的一些作用力 大量路径的存在 折叠会进行的非常迅 速 然而 在蛋白到达类自然的构象以后 要折叠到完全自然结构则需要更长的 时间 折叠路径的减少 g i o k e a c t i o nc o o 喇ln a t e 图1 1 0 蛋白两态折叠的过渡态理论 m a c r o s t a t e st h a t c o n t a i n sd i s t i n c t e n s e m b l e so f m i c r o s t a t e s 1 2 4 蛋白质折叠过程中隐藏的中间体 近来的研究发现 在一些表现为两态机制的蛋白折叠过程中 会有一系列隐 藏的中间体存在 5 这些中间体处于比非折叠态更高的能垒或存在于限速步骤之 后 传统的动力学方法没办法检测到这些中间体的存在 隐藏中间体的发现对解 释两态折叠过程的漏斗模型提出了质疑 因为在漏斗模型中 能量平面是平滑连 续的 它强调的是大量平行折叠路径的存在 而不是一系列不连续中间体的存在 然而 用两维折叠模型o z k n a 进行的计算机模拟表明 隐藏的中间体和隐藏的 过渡态是可以平行发生的 1 2 1 所以即使在表观的两态折叠过程中 能量地形也 不是完全平滑的 而是有一定的粗糙度 山东师范大学硕士学位论文 到目前为止 研究人员已经建立了多个解释蛋白质高效折叠机制的模型 如 框架模型 扩散碰撞模型 疏水折叠模型 成核模型 漏斗模型等 虽然这几个 模型都能解释一些蛋白质的折叠机理 由于蛋白质分子的多样性以及折叠过程的 复杂性 至今还无法建立一个通用的模型来解释蛋白质的折叠机理 1 3 蛋白质的去折叠和重折叠 蛋白质的去折叠和重折叠亦即蛋白质的变性和复性 蛋白的边缘稳定性有着 重要的应用 蛋白要行使其功能 蛋白分子就必须具有足够的柔性 另外 在合 适的时间里 蛋白还要能在细胞内降解 这一切都要求蛋白分子不能太过稳定 蛋白质的自然折叠状态只有在最合适的条件下才能存在 环境的改变 诸如温度 p h 变性剂 压力等作用都可使蛋白质的结构被破坏f 1 4 1 1 3 1 温度引起的蛋白变性 温度引起蛋白变性的物理基础是 不同构象的蛋白质分子热容不同 热容是 一个跟蛋白质分子疏水表面和熔剂可接近表面积有关的一个参数 它的改变是熵 和焓的值随之改变 1 5 1 1 2 帮一p a 丁 a 丛 a c p 二 二一 a 仃 t 当ac p 一定 温度由t r 升到t 时 a h a h 昱 a c j p p 一 r r a s a s r a c p l 仃 瓦 在t m 时 a h r m a s 1 2 焓和熵的变化可表示为 1 3 1 4 1 5 a s 胡贾 瓦 a c 尸p 一瓦 1 6 最终蛋白非折叠的热力学参数可以由下式得到 山东师范大学硕士学位论文 a g 龃rf t r a c e l n t t r 1 7 1 3 2 化学试剂诱导的蛋白变性 最常用的使蛋白变性的化学试剂有尿素和盐酸胍 这些化学试剂引起蛋白变 性的机理还不是很清楚 一种观点认为这些变性剂直接和非折叠的多肽结合 稳 定了多肽的存在 通过增强非折叠部分的水溶性 1 6 1 7 j 另外也有观点认为 变性 剂的加入通过增强溶剂水的流动性以及其熵值从而影响蛋白质的折叠 两者可能 都起着作用 变性剂如尿素和盐酸胍等可使蛋自质结构中的氢键发生断裂 这增 加了非极性分子包括氨基酸侧链的溶解度 减少了疏水相互作用 尿素还可以深 入到蛋白质分子的内部影响蛋白质分子的密堆积 从化学试剂诱导的蛋白变性曲 线的跃迁区域 可以得到折叠的平衡常数 从而进一步得到折叠反应的自由能变 1 3 3 压力诱导的蛋白变 性 使用温度和化学试剂使蛋白变性研究通常是在常压下进行 已经为蛋白质的 折叠机制提供了大量的信息 但是这些已获得的信息并不足以完全了解蛋白质究 竟是如何折叠成天然状态的 许多生化过程 如酶催化反应 蛋白质变性 蛋白 质解聚 蛋白质 核酸相互作用 蛋白质 膜相互作用等 往往伴随着体积变化 根据l ec h a t e l i e r 原理 若对上述反应体系施加压力 就可以改变原有的平衡状 态 使其朝向体积减小的方向移动 降压后体系又可能恢复到原有的平衡状态 因此可以用高压力方法研究上述过程 许多研究表明蛋白质的解折叠大都伴随着 蛋白质 溶剂系统体积的减小 1 8 9 高压作用遵循l ec h a t e l i e r 原理 即增加压力引起化学平衡向体积减小的方 向移动 或者促进体积较大的基态向体积较小的过渡态的转化 在压力低于 1 0 0 0 m p a 的条件下 低分子量的生物分子 如多肽 脂类等 的共价结构和生 物大分子 如蛋白 核酸等 的一级结构是不会被改变的 而非共价的分子间相 互作用则易受压力影响 带电基团的溶剂化往往伴随着体积的减小 静电相互作 用的形成往往伴随着体积的增大 疏水相互作用的形成已经被证明伴随着体积的 增大 而芳香环的堆积可导致体积微小的减少 同样氢键对于压力也很敏感 这 1 3 山东师范大学硕士学位论文 样造成的直接结果就是静电相互作用和疏水相互作用在压力条件下很不稳定 2 0 2 1 o 热变性 化学试剂变性 压强以及p h 引起的变性均不会破坏蛋白质的共价 键而只是涉及到氢键 盐键 疏水相互作用 范德华相互作用等次级键的破坏 有些变性的蛋白质当变性因素被除去后又可自动地恢复到天然状态 这种现象称 为蛋白质的复性 这种复性即蛋白质折叠研究中的重折叠现象 1 3 4 蛋白质错误折叠及其相关疾病 蛋白质异常的三维空间结构可以引发疾病 疯牛病 老年性痴呆症 囊性纤 维病变 家族性高胆固醇症 家族性淀粉样蛋白症 某些肿瘤 白内障等等都是 折叠病 多种人类疾病的发生与特定蛋白的聚集有关 这些聚集或多或少包 含在疾病发生的病理环境中 最终形成淀粉样纤维 淀粉样变性病 2 2 尽管淀 粉状纤维原子水平上的结构还不清楚 大体的结构包括平行或反平行的1 3 一折叠 片 最近有报道称许多跟淀粉状疾病没关的蛋白也可以形成纤维状结构 这表明 虽然只有大约2 5 个蛋白和淀粉状疾病相关 多肽链能形成纤维状结构可能是个 共性 淀粉状纤维形成过程中的一系列事件的特定机理虽然还不清楚 但已有充 分的证据表明要形成淀粉状纤维核心交叉1 3 一折叠片结构 蛋白质分子的结构必 须经过一个重排过程 这就使得形成非天然的局部折叠态成为必要 2 3 蛋白折 叠和人类疾病发生的相关性使得研究蛋白质的折叠不仅具有重大的科学意义 而 且在医学和在生物工程领域具有极大的应用价值 随着实验条件和计算条件的进步 蛋白质的折叠问题必将为人类所攻破 困 扰人们多年的一些疾病 疑难问题也将迎刃而解 1 4 蛋白质折叠的计算机模拟 计算机模拟是一种计算机实验 它是从原子水平上的相互作用出发 借助计 算机数值模拟的方法 得到生物大分子的结构 动力学 热力学方面的信息 以 及研究这些信息与生物功能的关系 如图1 1 1 所示 2 4 通过计算机可以探测实 验难以探测到的性质 可以与实验结合解释实验结果 以及预测结构变化引起的 1 4 山东师范大学硕士学位论文 新的性质 由于受细胞内折叠时间的限制 一般在毫秒量级 人们很难对其折叠过程 进行观察研究 利用计算机模拟技术 模拟步长可达到l 飞秒 能得到较为详细 的折叠数据 因而利用计算机模拟蛋白质折叠 对了解蛋白质的折叠机制具有不 可替代的作用 图1 1 1 生物大分子的计算机模示意图 蛋白质晶体x 射线衍射技术仍然是当今蛋白质空间结构测定的主要方法 近3 0 多年来发展起来的二维和多维核磁共振方法 己显示了它对蛋白质在溶液 中的空间结构和运动状态方面研究的优势 由于不需要结晶 测定可以在溶液中 进行 较之晶体x 衍射方法 有其在样品制备上的优越性 只是该方法目前还 仅限于分子量较小的蛋白质 截止到2 0 0 8 年9 月1 6 日 用x 射线衍射和核磁 共振方法确定了空间结构并存入蛋白质结构数据库 p r o t e i nd a t ab a n k 简称 p d b 的蛋白质为5 3 1 0 3 t 2 5 这些空间结构已被测定的蛋白质 只不过是自然界 数以百万计的蛋白质中的二个微不足道的部分 蛋白质空间结构的测定已成为生 命科学发展的 瓶颈 并且 实验方法测定蛋白质的结构 除需要使人类不堪 重负的天文数字般的耗资外 其技术上还存在不可逾越的障碍 在克隆 表达 纯化和结晶过程中 大约在2 0 个蛋白质中能得到1 个可供结构测定的晶体 一 些蛋白质 如膜蛋白 根本不能被结晶 除非近期内 实验技术上的重大突破 实验方法将不可能胜任全部蛋白质结构的测定工催2 6 1 利用计算机模拟进行预测空间结构 是从理论上最直接地去解决蛋白质折叠 问题 是解决上述 瓶颈 的最有效途径之一 计算机模拟预测成本较低 速度 较快 目前空间结构预测的方法大致可分为两大类 一类是假设蛋白质分子天然 构象处于热力学最稳定 能量最低状态 3 考虑蛋白质分子中所有原子间的相互 作用以及蛋白质分子与溶剂之间的相互作用 根据物理化学 量子化学 量子物 理的基本原理 采用分子动力学的能量极小化方法 从理论上计算蛋白质分子的 空间结构 由于蛋白质中含有较多原子 计算量较大 由这种方法计算空间结构 耗时较多 2 兀 因而用得较少 一般用作其他预测方法的补充 第二类方法是所 谓 基于知识的预测方法 通过对已知空间结构的蛋白质进行研究和分析 找 1 5 山东师范大学硕士学位论文 出蛋白质一级结构和空间结构之间的联系 总结出一定的规律并建立一些经验 规则 来预测序列已知而结构未知的蛋白质结构 最后排除不合理的模型 再根 据能量最低原理利用分子动力学模拟进行优化得到修正的结构 随着计算机计算能力的提高 我们期望能利用理论方法来预测蛋白质三维结 构以及蛋白质折叠的物理规律 这类理论方法主要包含 同源建模 2 8 折叠识 别 2 9 1 以及从头预测方法 3 0 前两种方法是基于已知结构的建模预测 即把未 制知结构的蛋白质序列同已知结构的蛋白质序列进行比对 当序列相似性高于 3 0 时 可以认为这两个序列采用相同的折叠方式 这两个蛋白质属于同源蛋白 质 当序列相似性低于3 0 时 可以考虑用第二种方法 这种方法的理论依据 是同源性较差的蛋白质也可能存在相同的折叠类型 从头预测法是基于物理模 型 从理论上计算蛋白质分子的空间结构 所依据的是一个基本的热力学假定 一个蛋白质分子在溶液中的天然构象相应于热力学上最稳定的 自由能最低的构 象 理论上来说 从头预测方法是最准确最可靠的方法 但是蛋白质分子的结构 非常复杂 微小的结构变化都可能带来很大的能量变化 另外 蛋白质分子自由 度非常大 导致每一个蛋白质都会存在可能的结构 这些都阻止了从头预测方法 的实现 从头预测模拟方法主要包含有分子动力学 分子力学 蒙特卡罗 模拟 退火以及遗传算法等 我们主要介绍分子动力学模拟方法 1 5 本论文的主要工作 本文以淀粉样蛋白at 34 0 和a1 34 2 为研究对象 利用g r o m a c s 分子动力学模 拟软件 进行了一系列实验研究 主要做了以下工作 i 在常温下 使a1 34 0 和a1 34 2 分别在0 1 m p a 2 0 0 m p a 和1 0 0 0 m p a 下 利 用o p l s a a 力场 s p c 水分子模型 在合适的矩形盒子里 利用周期性边界条件 加入离子 以保持溶液的中性条件 使各个系统运行6 0 纳秒的自由动力学模拟 2 利用g r o m a c s 3 0 提供的分析程序和g r o m o s 9 6 程序包自带的一些分析程 序 采用d s s p 程序进行二级结构分析 对输出的轨迹对蛋白质的二级结构 原 子位置坐标的均方根涨落r m s d 回转半径r g 可及性表面积a s a 以及主链氢 键进行分析 并比较不同的压强对a1 34 0 和a1 34 2 结构变化的影响 1 6 山东师范大学硕士学位论文 第二章分子动力学模拟和g r o m o s 软件 2 1 分子动力学模拟 对生物分子的理论研究主要是从原子水平探究其结构 功能和动力学之间的 关系 目前还无法直接使用量子力学的方法解决 分子动力学模拟方法是在原子 水平上利用经典的牛顿力学方程求解分子体系问题的重要计算机模拟方法 随着 计算机计算能力的提高 分子动力学模拟方法已经成为生物大分子理论研究的一 种有力工具 能用于研究生物体系中复杂的动力学过程 具体包括 蛋白质稳定 性研究 蛋白质折叠 构象转变 分子识别 离子传输 辅助研究关于药物设计 以及验证x 射线晶体衍射方法和核磁共振方法得到的分子体系的实验结构 自 1 9 9 7 年对牛胰岛素抑制剂 b p t i 基于一个简单的力场在真空中的短时间分子 动力学模拟被报道以来 分子动力学模拟方法无论是在采样效率还是在势能函数 准确性上都取得了巨大的进步 分子动力学模拟是在原子水平上 用经典的牛顿力学方程描述分子的运动过 程 分子内和分子间的相互作用几乎都是用经验势的能量模型 首先给出生物体 里每个原子的初始位置以及初始速度 接着需要考虑使用何种溶剂化模型处理溶 剂效应以及何种分子力场处理分子之间的相互作用势 对初始结构进行能量优化 以及结构平衡 接着做分子动力学模拟 最后是对分子动力学模拟的轨迹进行分 析得到我们想要的结果 每一步动力学模拟遵循下面的步骤 首先给出生物体系 里每个原子的初始坐标以及初始速度 选定计算所用经验势 包含分子力场以及 溶剂化模型 得到势能以及作用在每个原子上的力 势能对原子位置坐标的负 的偏导数 可以得到样子运动的加速度 利用l e a p f r o g 算法 3 l 或者v e r l e t 算法 3 2 j 可以得到原子的下一步位置坐标和速度 循环这个步骤 就可以得到能 量或者坐标相关的轨迹文件 模拟中步长的选择必须足够小使得能计算体系中最 快的运动 在生物分子模拟中 最快的运动可以认定是共价键的振动 要求的时 间步长为0 5 f s 通常在模拟中 我们可以考虑利用s h a k e 算法约束键长 3 3 1 这 样模拟的时间步长可以增加到2 f s 分子动力学模拟结果的可靠性和准确性主要依赖于模拟中所选用的势能函 数 包含分子力场和溶剂化模型 1 7 山东师范大学硕士学位论文 2 2 1 分子力场 2 2 分子力场和经验势函数 分子动力学模拟方法把分子体系看作是质点在势能面中的运动 由于每个分 子体系的势能面是高度复杂的 难于精确描述 为了实用 往往选用某些与原子 坐标相关的函数对势能面进行拟合 得到势能面的近似解析表示 这种势能面的 表示方法称为力场 而这组与坐标相关的函数称为经验势函数 一个分子力场通 常包含三个部分 原子类型 经验势函数 和力场参数1 3 4 2 2 2 分子力场经验势函数 根据量子力学的波恩一奥本海默近似 因为电子的质量远远小于原子核的质 量 可以认为电子能量能够根据原子核位置的变化迅速的调整自己的位置 因此 原子核和电子的运动就可以分为独立的两步 而分子的能量就可以看成是只与原 子核的位置相关的函数 而描述这种分子能量和分子结构之间关系的就是分子力 场势函数 3 5 1 在分子力学模型中 每个粒子通常代表一个原子 在此基础上建 立的力场称为全原子力场 有时也可以代表一个非极性基团 基于这个想法建立 的力场称为整合原子力场 分子力场势能函数为来自实验结果的经验公式 对分 子能量的模拟比较粗糙 但是相比于精确的量子力学从头计算方法 分子力场的 计算量要小数十倍 因此对大分子复杂体系而言 分子力场方法是一套有效的方 法 在分子力场中 体系的能量通常被经验性的划分成若干个能量项 每个能量 项用一个简单的函数形式来表示 其一般的形式为 每 6 一b 2 争疗 口一0 0 2 i 1 1 c o s 玎矽一硝 扣善嘲2 驯c 巧i 2 c 6 o etorsionsp a i r sp a i r si j 嚣0 砌旺 l j l 1 7 r 上式右边第一项是键长畸变能 它用简单的弹簧来模拟 这里k 是弹性强度系 数 b 是成键原子间的平衡距离 这一项的求和遍及所有共价键 2 1 式的第 二项是键角畸变能 它采用了与第一项类似的形式 k 一是键角畸变的强度常数 巩是平衡键角 此项求和遍及所有实在键角 第三项和第四项均与扭角有关 1 8 山东师范大学硕士学位论文 第三项代表沿着一个给定的键旋转时引起的二面角畸变的能量 它在本质上是周 期性的 这里丸是力常数 n 是周期 万为一参考角 第四项代表共平面原子偏 离平面的程度 k 是力常数 彘是平衡位置 第五项反映了体系的范德华相互 作用 它通常用l e n n a r d j o n e s 位能表示 弗项代表亲和力 而 2 项代表近程排 斥 c 1 和e 为常数 2 2 式的最后一项是体系中的库仑相互作用 这里g g 分别为原子i 和j 的电荷 和 是真空介电常数和相对介电常数 在实际使用 时 往往取作与距离成正比 l j 在能量势函数中反映非键相互作用的范德华项和静电项 对维持蛋白质的构 象是很重要的 为了节省计算机时 在实际的运行程序中 往往总是指定一个距 离 只计算距离小于这一制定值的非键相互作用 2 3 1g r o m o s 2 3g r o m o s 简介 g r o m o s 软件是结合计算机模拟和相互作用势能函数用于研究生物体系的 分子动力学模拟软件 g r o m o s 是英文g r o n i n g e nm o l e c u l a rs i m u l a t i o n 的缩写 1 3 6 j 它可以用分子动力学 随机动力学或者路径积分方法模拟溶液或晶体中的 任意分子 进行分子能量的最小化 还可以通过构建模型或计算机模拟分析由实 验 x r a y n m r 得到的分子构象 它的模拟程序包包含g r o m o s 力场及模拟原理 分子模型 进行模拟或能量优化的程序 以及对计算所得到的构象轨迹进行分析 和处理的软件 研究的范围包括从玻璃和液晶 到聚合物 晶体和生物分子溶液 工作平台为l i n u x 或u n i x 它的最新版本是1 9 9 6 年完成的g r o m o s 9 6 该 软件作为优秀的分子动力学模拟软件之一 受到国际同行的认可 基于该软件的 研究成果 不断见诸各种高水平的刊物 近期国内基于该软件的研究文献也很多 2 3 2g r o m o s 经验势函数附加项 为了适应研究特定的体系 常常需要对经验势能函数加以修饰 在g r o m o s 中常因以下情况而附加约束项 1 位置约束或固定原子在模拟分子体系时 常需要使某些原子限定在一 指定的位置上 比较好的办法是通过对原子施加谐振约束 使之在指定位置附近 运动 位置约束的形式为 1 9 山东师范大学硕士学位论文 y 尹 s k 只一群 2 2 2 2 n l 上式中的求和遍历所有选定的 个原子 在每一步积分前令原子的速度和所受 力为零 则实现原子固定 2 原子距离约束在模拟分子系统时 有时需要对选定的原子间距加以约 束 使之保持某一给定值或不超过某一临界值 该项具有谐振子或部分具有谐振 子的形式 当原子n 和行7 间的实际距离 与参考距离穗 偏离较小时 约束具有 谐振子形式 当二者偏离较大时 若仍采用谐振子形式 得到的能量和所受力将 非常巨大 约束改为线性形式 对于排斥距离约束和吸引距离约束 表达式形式 不同 3 键角约束在g r o m o s 中没有实现键角约束的程序 键角约束是通过距 离约束来实现的 如原子f 歹和k 间的键角o i j 一七 约束 是通过对三个距离 f 一 一k 和k f 的约束来实现的 4 二面角约束g r o m o s 中二面角约束的形式为 n v d i r 尹 s k d f r 织一群 2 2 2 3 n l 式中求和遍历 个二面角纯 5 局部提升作用分子动力学模拟常用于在构象空间搜寻能量最小的构 象 由于存在相对高的能量势垒 模拟会局限在一个局部极小区域 为避免重复 构象取样 对搜寻过的构象在局部范围内提升其能量面 从而在势能函数中引进 一个附加项 2 4 分子动力学模拟方法 在分子动力学模拟中 把每个原子作为一个粒子 对一个含有n 个粒子的体 系 第f 个粒子的质量记作m i 它的空间位置记作矢量只 而空间坐标对时间的 导数则用在该矢量上边加逗点来表示 如p r 根据牛顿第二定律 有 f 一 2 4m ir24 f2 l 这里f 是所有其他粒子作用到粒子f 上的合力 它可以由n 个粒子的位能函数v 的负梯度来计算 f 一a y a 亏 2 5 在笛卡儿坐标体系中可用它的3 个分量来表示 若x f 是时刻t 粒子i 在石方向 的坐标 使用t a y l o r 展开 可以得到 x t a t x 以 膏f t a t 童f o a t 2 2 2 6 2 0 山东师范大学硕士学位论文 和 x o a t x f o 一戈 o a t x t a t 21 2 2 7 这里戈 f 和义j f 是时刻t 粒子f 在x 方向的速度和加速度 将公式 2 6 与 2 7 分别相加与相减可得n x i o f 2 x f o 一x f a t x fo 2 2 8 其中戈 六 m x f x o a t 一x f a t 2 a t 2 9 这里厶表示第f 个粒子在x 方向受到的作用力 由于在t 和f 一出时刻 第f 个粒子的位置是知道的 加速度可以从位能函数 的负梯度求出 所以 以后任何时刻粒子的位置 速度和加速度都可迭代求解 这就是计算牛顿运动方程的v e r l e t 方法 这一方法是简单的 但它存在两个缺 点 第一个缺点是速度又 f 是由两个大数相减得出 因而会导致动能与温度计 算的较大误差 第二个缺点是粒子的位置x f 不是从速度计算出来的 因而体 系就不能通过速度的重新标度来控制温度和能量 v e r l e t 蛙跳法 v e r l e t l e a p f r o gm e t h o d 就是克服了上述缺点而发展起来的一种方法 如果矿是时间t 和f 一垃间粒子f 的平均速度 则在时刻t 一垃时 粒子f 在x 方 向的位置可表示为 x 垃 x i f 圪 岔 2 1 0 再如果假设平均速度圪非常接近粒子f 在时间间隔 f t a t 中点的速度 即 圪 x f o a t 2 2 1 1 则可有 戈 f a t 2 戈心一a t 2 以 垃 2 1 2 这里口 是粒子f 在时刻f 的加速度 所以 哎 一x i f f xf 2 此时 2 和 2 1 0 式可 重t 写 m 为 1312 x i o a t 2 x f f a t 2 x o a t 2 1 4 和 x f a t x i f x i f a t 2 a t 2 1 5 式 2 1 4 和 2 1 5 则为求解牛顿运动方程v e r l e t 蛙跳法 这是在分子动力学模 拟中目前最广泛使用的方法 2 5s h a k e 方法 积分的时间步长 是分子动力学积分过程的一个关键参数 为了加快计算 速度 往往采用大的时间步长 但太长的时间步长会引起积分过程失稳和积分值 2 1 山东师范大学硕士学位论文 不准确 选择积分步长的主要限制是体系的高频运动 如果能够冻结不太感兴趣 的分子内部高频运动 像键的伸缩 键角的张合等 那么在进行分子动力学模拟 时 就能够选择较大的时间步长 冻结的办法就是限制距离 比如原子i j k 形成了两个键i j 和j k 及一个键角么眺 那么 当把原子i j 及原子k 之间的 距离限制在一个期望值时 这两个键长的高频运动就被冻结了 在g r o m o s 中 通过s h a k e 方法来实现限制 设在体系存在n 个距离限制 第k 个限制与局和幻个两个原子间距有关则 吼 尹 兰五 d k i 0 k 1 2 n c 2 1 6 这里磊 是k 1 和k 2 原子间实际距离 破南为限制距离 此时的运动方程 2 1 4 2 1 5 的积分求解应满足 2 1 6 的限制条件 采用拉格朗日待定乘因子方法 将 个包含待定乘因子以 f 的零项加到运动方程中 为此由 2 1 1 2 1 2 式 得 n c 所 露 一导 y 尹 a f 吼 芦 2 1 7 v
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025广东广州市横沥人力资源管理服务有限公司招聘服务外包人员1人模拟试卷及答案详解(夺冠)
- 2025年福建泉州市华侨大学分析测试中心招聘实验技术系列人员(4月)模拟试卷及答案详解(名师系列)
- 2025湖南郴州市嘉禾县事业单位第一批公开招聘引进高层次人才和急需紧缺人才13人考前自测高频考点模拟试题及答案详解(历年真题)
- 2025甘肃科源电力有限公司高校毕业生招聘40人考前自测高频考点模拟试题及答案详解参考
- 户外变压器知识培训总结课件
- 公司中继泵站运行工专项考核试卷及答案
- 2025年烟台市退役军人事务局所属事业单位卫生类岗位公开招聘工作人员(5人)模拟试卷附答案详解(完整版)
- 建设项目工程监理工作方案
- 城市景观生态修复与优化方案
- 800MWh独立共享储能电站技术方案
- 抗肿瘤药项目建议书(立项报告)
- JG/T 411-2013电动卷门开门机
- 品质测量员试题及答案
- 洁净灯具行业跨境出海战略研究报告
- 2024-2025学年山东省济南市高一上册第一次月考数学学情检测试题
- 二零二五年度版学校合作协议范本:高校与中小学合作培养协议
- 《水的组成说课课案》课件
- 无人驾驶车辆在医疗物资运输中的应用研究-洞察分析
- 暴雨过后工地复工复产方案
- 快件处理员(中级)职业技能鉴定考试题库(含答案)
- TNBSIA 001-2024 建筑设备一体化管控平台建设技术要求
评论
0/150
提交评论