结构生物学2-大分子模拟_第1页
结构生物学2-大分子模拟_第2页
结构生物学2-大分子模拟_第3页
结构生物学2-大分子模拟_第4页
结构生物学2-大分子模拟_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、l生物大分子的计算机模拟生物大分子的计算机模拟l生物大分子的计算机模拟方法l蛋白质三维结构的模建l核酸结构的模拟l量子力学量子力学l分子力学分子力学l分子动力学分子动力学l概率统计热力学统计物理概率统计热力学统计物理l量子力学是微观世界物质运动的普遍规律l一个分子体系的状态可以用Schrodinger方程来表示,通过求解Schrodinger方程可以得到分子体系的结构和性质l量子力学的计算方法:量子力学的计算方法:l从头计算;l密度泛函理论;l半经验计算方法l量子力学方法的特点:计算结果精确度高,限于计算机的计算能力,能够计算的体系小从头计算方法:100个原子;半经验计算:1000-10,00

2、0个目前,生物大分子体系还不能只用量子力学方法模拟,但与分子力学和分子动力学结合后发展了一些新的方法l分子力学是一种近似处理方法 忽略电子的运动,将体系的势能看作是原子核位置的函数l力场:分子体系的势能函数 分子的势能 = 键伸缩能 + 键角扭曲能 + 扭转势能 + 非键相互作用项函数形式和参数力场是经验的“原子”的定义l特点:l针对局域能量极小,不是整个系统l能够计算含有大量原子的体系l简单有效,目前应用得最广泛l分子动力学是建立在牛顿力学基础上的一种分子模拟方法将分子体系的运动看作是在势能面中质点的运动,求解运动方程可得到体系中所有原子的轨迹,从轨迹中可计算得到各种性质l特点:可以搜索很大

3、的构象空间,模拟时间在纳秒级l应用分子模型的动力学变化研究大分子体系低能构象的模建X射线晶体学和NMR中的结构优化l生物大分子的计算机模拟方法比较建模(comparative moddeling method); 反向折叠法 (inverse folding or threading); 从头预测法 (ab initio prediction method)l蛋白质三维结构的模建l核酸结构的模拟l模建(modeling)l蛋白质结构的基本概念l蛋白质结构预测的从头计算l同源和比较模建方法l蛋白质折叠类型识别法l蛋白质二级结构预测l蛋白质结构预测方法准确性的评估l应用实例l蛋白质的三维结构模建是

4、从氨基酸序列出发理论预测蛋白质的三维结构l模建研究的意义中心法则的延伸第二遗传密码蛋白质结构测定的速度远远落后于序列测定的速度,使理论预测的方法成为一种迫切的需要 蛋白设计、药物开发l到2007年3月,已知的蛋白质序列超过60万条,而测定了三维结构的蛋白质仅为4万多个l蛋白质三维结构的测定已经成为生命科蛋白质三维结构的测定已经成为生命科学发展的学发展的“瓶颈瓶颈”l蛋白质的二级结构单元 a螺旋 b折叠股(b-strand)和b折叠片(b-sheet)环(loop) b-转角(b-turn)l蛋白质的结构可以通过旋转键的扭角来确定主链扭角:f, y, w侧链扭角:c1, c2, 蛋白质分子的二级

5、结构蛋白质分子的二级结构(Secondary Structure)l蛋白质的二级蛋白质的二级(Secondary)(Secondary)结构是指结构是指肽链的主链在空间的排列肽链的主链在空间的排列, ,或规则的或规则的几何走向、旋转及折叠。它只涉及几何走向、旋转及折叠。它只涉及肽链主链的构象及链内或链间形成肽链主链的构象及链内或链间形成的氢键。的氢键。(即多肽链本身的折叠和(即多肽链本身的折叠和盘绕方式盘绕方式)l主要有主要有a a- -螺旋、螺旋、b b- -折叠、折叠、b b- -转角转角lb b-sheetsl Turnsl Random coil (its neither!) 肽键的键

6、长介于单键和双键之间,具有部分双键的性质,肽键的键长介于单键和双键之间,具有部分双键的性质,不能自由旋转。不能自由旋转。 酰胺平面酰胺平面a a螺旋螺旋 螺旋结构螺旋结构 最常见、含量最丰富的二级结构最常见、含量最丰富的二级结构 l在在a a- -螺旋中肽平面的键长和键角一定;螺旋中肽平面的键长和键角一定;l肽键的原子排列呈反式构型;肽键的原子排列呈反式构型;l相邻的肽平面构成两面角;相邻的肽平面构成两面角;CONCN+O-CNCOHCl多肽链中的各个肽平面围绕同一多肽链中的各个肽平面围绕同一轴旋转,形成螺旋结构,螺旋一轴旋转,形成螺旋结构,螺旋一周,沿轴上升的距离即螺距为周,沿轴上升的距离即

7、螺距为0.54nm,0.54nm,含含3.63.6个氨基酸残基;两个氨基酸残基;两个氨基酸之间的距离为个氨基酸之间的距离为0.15nm;0.15nm;l肽链内形成氢键,氢键的取向几肽链内形成氢键,氢键的取向几乎与轴平行,第一个氨基酸残基乎与轴平行,第一个氨基酸残基的酰胺基团的的酰胺基团的-CO-CO基与第四个氨基与第四个氨基酸残基酰胺基团的基酸残基酰胺基团的-NH-NH基形成基形成氢键。氢键。l蛋白质分子为右手蛋白质分子为右手a a- -螺旋。螺旋。a a螺旋螺旋 a a-螺旋的末端是极性的,通常位于蛋白质分子的表面。螺旋的末端是极性的,通常位于蛋白质分子的表面。a a-螺旋在蛋白质分子中的长

8、度变化很大,可以从螺旋在蛋白质分子中的长度变化很大,可以从4个到个到40个不等。个不等。 在蛋白质分子结构中观察到在蛋白质分子结构中观察到a a-螺旋几乎都是右手螺旋,螺旋几乎都是右手螺旋,短的左手螺旋偶尔也会出现。短的左手螺旋偶尔也会出现。 a a-螺旋中的氢键均指向相同的方向。总体效应是产生螺旋中的氢键均指向相同的方向。总体效应是产生一个有意义的净偶极。一个有意义的净偶极。a a-螺旋的氨基端可提供部分正电螺旋的氨基端可提供部分正电荷,羧基端可以提供部分负电荷。荷,羧基端可以提供部分负电荷。 不同的氨基酸残基对于不同的氨基酸残基对于a a-螺旋有着倾向性的偏好和厌螺旋有着倾向性的偏好和厌恶

9、。恶。 a a-螺旋在蛋白质分子中的分布是有倾向性的。螺旋在蛋白质分子中的分布是有倾向性的。a a螺旋螺旋 a a-螺旋中的氢键均指向相同的方向,即肽单位沿螺旋轴处于相螺旋中的氢键均指向相同的方向,即肽单位沿螺旋轴处于相同的取向。由于肽单位有来自不同的同的取向。由于肽单位有来自不同的NH和和CO基团的偶极运动,基团的偶极运动,这些偶极运动也是沿着螺旋轴的方向,总体效应是产生一个有意这些偶极运动也是沿着螺旋轴的方向,总体效应是产生一个有意义的净偶极。义的净偶极。a a-螺旋的氨基端可提供部分正电荷,羧基端可以提螺旋的氨基端可提供部分正电荷,羧基端可以提供部分负电荷,这些电荷可以攻击反电荷的配基。

10、供部分负电荷,这些电荷可以攻击反电荷的配基。 带负电荷的配基尤其当它们包含磷酸基团时,通常结合到带负电荷的配基尤其当它们包含磷酸基团时,通常结合到a a-螺旋螺旋的氨基端。这样的配基相互作用在蛋白质结构中是比较常见的。的氨基端。这样的配基相互作用在蛋白质结构中是比较常见的。a a螺旋螺旋 除了脯氨酸外,除了脯氨酸外,a a-螺旋中的所有氨基酸残基的侧链均处于螺旋螺旋中的所有氨基酸残基的侧链均处于螺旋的外侧。由于脯氨酸主链的环状结构,往往引起的外侧。由于脯氨酸主链的环状结构,往往引起a a-螺旋的有意义螺旋的有意义的弯曲。当然,并非所有的的弯曲。当然,并非所有的a a-螺旋的弯曲都是由于脯氨酸残

11、基的螺旋的弯曲都是由于脯氨酸残基的存在。存在。 不同的氨基酸残基对于不同的氨基酸残基对于a a-螺旋有着倾向性的偏好和厌恶:螺旋有着倾向性的偏好和厌恶: Ala, Glu, Lue, Met等对等对a a-螺旋有着倾向性的偏好,螺旋有着倾向性的偏好,Pro, Gly, Ser等倾向于不参加等倾向于不参加a a-螺旋。螺旋。b b回折回折lb b- -折叠是由两条或多条几乎完全伸展的肽链平行折叠是由两条或多条几乎完全伸展的肽链平行排列,通过链间的氢键交联而形成的。肽链的主排列,通过链间的氢键交联而形成的。肽链的主链呈锯齿桩折叠构象链呈锯齿桩折叠构象l在在b b- -折叠中,折叠中,a a- -碳

12、原子总是处于折叠的角上,氨碳原子总是处于折叠的角上,氨基酸的基酸的R R基团处于折叠的棱角上并与棱角垂直,两基团处于折叠的棱角上并与棱角垂直,两个氨基酸之间的轴心距为个氨基酸之间的轴心距为0.350.35nmnm; lb b- -折叠结构的氢键主要是由两条肽链之间形成的;也可以折叠结构的氢键主要是由两条肽链之间形成的;也可以在同一肽链的不同部分之间形成。几乎所有肽键都参与链在同一肽链的不同部分之间形成。几乎所有肽键都参与链内氢键的交联,氢键与链的长轴接近垂直。内氢键的交联,氢键与链的长轴接近垂直。lb b- -折叠有两种类型。一种为平行式,即所有肽链的折叠有两种类型。一种为平行式,即所有肽链的

13、N-N-端都端都在同一边。另一种为反平行式,即相邻两条肽链的方向相在同一边。另一种为反平行式,即相邻两条肽链的方向相反。反。b-sheets fulfill the hydrogen bonding potential of the main-chain atoms, except at the edges. Adjacent strands are usually close in sequence.Properties:Distance between Ca as is 3.6 in an extended strandDistance between strands 4.6 Strand

14、s are not flat. They have a characteristic right-handed twistHow are sheets defined?Antiparallel b-sheetParallel b-sheet反平行反平行b b回折回折平行平行b b回折回折 蛋白质分子的另一种主要结构成分是蛋白质分子的另一种主要结构成分是b b回折,这种结构是蛋回折,这种结构是蛋白质分子中若干段区域的称为白质分子中若干段区域的称为b b-链的多肽链形成的。链的多肽链形成的。 在在b b回折中,回折中, b b-链处于伸展状态,一条链的链处于伸展状态,一条链的CO与另一条链与另一条

15、链的的NH形成氢键。形成氢键。b b-链可以有两种方式形成链可以有两种方式形成b b回折:一种是所有回折:一种是所有的的b b-链均具有相同的方向链均具有相同的方向(平行平行b b回折回折),另一种是相互靠近的两,另一种是相互靠近的两条条b b-链具有相反的方向链具有相反的方向(反平行反平行b b回折回折)。除了位于两侧的。除了位于两侧的b b-链外,链外,所有肽链上的所有肽链上的CO基团和基团和NH基团均形成了氢键。基团均形成了氢键。b b回折回折b b回折回折 b b回折也可以混合的平行和反平行的形式回折也可以混合的平行和反平行的形式存在。几乎所有的存在。几乎所有的b b回折,不管是平行的

16、、回折,不管是平行的、反平行的、或者是混合的,均存在着链的扭反平行的、或者是混合的,均存在着链的扭曲,这种扭曲通常大部分是右手的。曲,这种扭曲通常大部分是右手的。E.coli thioredoxinAgkistrodon acutus serine proteaseAgkistrodon acutus zinc-metalloproteinase 蛋白质分子中肽链出现蛋白质分子中肽链出现180 的回折,又称为的回折,又称为弯曲、链回转或发夹结构。弯曲、链回转或发夹结构。l在在b b- -转角部分,由四个氨基酸残基组成转角部分,由四个氨基酸残基组成; ;l弯曲处的第一个氨基酸残基的弯曲处的第一个

17、氨基酸残基的 -C=O -C=O 和第四个残和第四个残基的基的 N-H N-H 之间形成氢键,形成一个不很稳定的之间形成氢键,形成一个不很稳定的环状结构。环状结构。l这类结构主要存在于球状蛋白分子中。这类结构主要存在于球状蛋白分子中。 转角靠第一个氨基酸转角靠第一个氨基酸残基的残基的C=O和第四个氨基酸和第四个氨基酸残基的残基的NH形成氢键维持稳定,形成氢键维持稳定,多数存在于球状蛋白质分子的多数存在于球状蛋白质分子的表面。表面。 无规则卷曲无规则卷曲也称自由回转或无规则线团也称自由回转或无规则线团蛋白质分子表面的环区域蛋白质分子表面的环区域蛋白质分子表面的环区域(蛋白质分子表面的环区域(LO

18、OP) 大多数蛋白质分子是由大多数蛋白质分子是由a a-螺旋和螺旋和/或或b b回折构成的。这回折构成的。这些些a a-螺旋和螺旋和/或或b b回折通常由不同长度和不规则形状的环回折通常由不同长度和不规则形状的环区域相连接。区域相连接。 螺旋与回折的组合形成了分子的稳定的疏水内核,螺旋与回折的组合形成了分子的稳定的疏水内核,环区域位于分子的表面。主链上的这环区域的环区域位于分子的表面。主链上的这环区域的CO和和NH基团一般不相互形成氢键,而是与溶剂中的水分子基团一般不相互形成氢键,而是与溶剂中的水分子形成氢键。暴露于溶剂中的环区域的残基通常是一些形成氢键。暴露于溶剂中的环区域的残基通常是一些带

19、电的和亲水的残基,据此进行的环区域的预测可信带电的和亲水的残基,据此进行的环区域的预测可信度往往比对度往往比对a a-螺旋和螺旋和b b回折的预测还要高。回折的预测还要高。 不同种属的蛋白质氨不同种属的蛋白质氨基酸残基序列同源比较基酸残基序列同源比较表明,某些残基的插入表明,某些残基的插入/缺失往往发生在环区域。缺失往往发生在环区域。在分子进化的过程中,在分子进化的过程中,蛋白质分子的内核要比蛋白质分子的内核要比环区域更稳定。由于环环区域更稳定。由于环区域具有连接螺旋、回区域具有连接螺旋、回折的功能,故环区域通折的功能,故环区域通常参与形成蛋白质的常参与形成蛋白质的“结合部位结合部位”或酶的或

20、酶的“活性中心活性中心”。抗体的抗原结合部位的抗体的抗原结合部位的“发夹环发夹环”锌金属蛋白酶锌金属蛋白酶的的“Met-turn”蛋白质分子表面的环区域蛋白质分子表面的环区域l蛋白质的结构可以通过旋转键的扭角来确定蛋白质的结构可以通过旋转键的扭角来确定多肽链折叠的主链构象角多肽链折叠的主链构象角NHONHfywc1c2l从头计算法(ab initio)搜索分子的构象空间,找到最合适的构象基本假设:天然构象 = 能量最低构象 l搜索构象空间的方法l蛋白质的简化模型l特点:不依赖于已知的结构模式,是一种普适的解决方法,目前尚处于探索阶段l根据蛋白质结构的相似性,以已知蛋白质的结构为模板构建未知蛋白

21、质的三维结构在进化过程中蛋白质三维结构的保守性远大于序列的保守性,当两个蛋白质的序列同源性/相似性高于35%时,一般情况下它们的三维结构基本相同同源模建方法是目前最常被采用的也是最成功的结构预测方法l主要步骤确定模板确定未知蛋白质与已知结构蛋白质的序列比对确定结构保守性的主链结构片断构建结构变化的区域侧链模建用能量计算的方法进行结构优化l影响同源模建质量的因素序列相似性大小(插入和删除片断)30%序列比对的准确性l序列比对(sequence alignment)将两个或多个序列之间的相似区域和保守性位点对齐以分析它们的相似程度在同源模建中非常重要,影响结构预测的准确性程序:BLAST /Fas

22、ta1、从相似性推断同源性、从相似性推断同源性相似性(相似性(similarity) Similar:having characteristics in common -Merriam-Webster Dictionary同源性(同源性(homology): A similarity often attributable to common origin -Merriam-Webster Dictionary同源同源进化上有共同的起源进化上有共同的起源l分子生物学的中心法则DNARNA蛋白质转录翻译遗传信息:贮存在DNA的核苷酸序列中进化中被复制以及发生变异的是 基因的核苷酸序列(以及相应的蛋

23、白质序列)因此,按照分子生物学的基本原理,我们应该根据核苷酸序列或者氨基酸序列上的共同特征来判断序列的是否同源最简单: 序列一致性 (sequence identity)l同源蛋白应该具有相对保守的功能 (催化同类化学反应、结合同类型的其他分子等)l蛋白质功能依赖于三维结构按照上述原理,我们同样应该能够根据三维结构上的共同特征来判断蛋白质分子是否同源。最简单: 主链原子位置的均方根偏差(RMSD)2、发现和利用不同特征间的关联关系(Guilty by association)序列整体特征序列同源性结构整体特征序列局部特征(如motif)结构局部特征功能模式例如:关联关系的发现: 数据搜集、特征

24、提取与数据建模、参数估计的过程。知识发现。关联关系的利用:数据检索、统计检验、实验验证的过程。知识利用。例:根据序列预测蛋白质在核内的定位序列motif蛋白在细胞核内定位(核定位信号,NLS,nuclear localization signal)/predictNLS/l实验数据分析实验观察到的NLS有没有共同点?这些共同点是否足以区分核蛋白和非核蛋白?能否根据序列间的进化关系对实验数据进行扩展?l根据进化特征对结构功能进行预测根据进化特征对结构功能进行预测保守性保守性l绝对保守绝对保守l相对保守相对保守(变异速率相对较慢变异速率相对

25、较慢,变异类型受到变异类型受到约束约束)l非保守非保守协变性或关联性协变性或关联性Conservation analysisPhylogenetic profilingEvolutionary tracingl给定位点上的氨基酸给定位点上的氨基酸/核苷酸同源蛋白质分子间的核苷酸同源蛋白质分子间的保守性保守性l给定序列模式或结构模式在蛋白质家族内或家族给定序列模式或结构模式在蛋白质家族内或家族间的保守性间的保守性l给定二级结构单元(蛋白质、给定二级结构单元(蛋白质、RNA)在蛋白质家)在蛋白质家族或超家族间的保守性族或超家族间的保守性l给定蛋白质分子在物种间的保守性给定蛋白质分子在物种间的保守性

26、。l从相似性从相似性-同源性同源性序列相似,或者结构相似序列相似,或者结构相似l发现和利用不同特征间的关联发现和利用不同特征间的关联NLS模式与核定位模式与核定位利用同源序列对序列模式进行扩展利用同源序列对序列模式进行扩展Swissprot 数据库(数据库(uniProt 知识库)知识库)覆盖率、正确率是两个重要指标覆盖率、正确率是两个重要指标l利用进化特征利用进化特征保守性协变性保守性协变性ConSurf 对蛋白质序列各个位点的保守性进行分析,并对蛋白质序列各个位点的保守性进行分析,并投影到三维结构上,可能与功能相关联投影到三维结构上,可能与功能相关联Score = 233 bits (59

27、3), Expect = 4e-61 Identities = 118/251 (47%), Positives = 162/251 (64%), Gaps = 9/251 (3%) Query: 29 IGIYKWHYSGLNRWHGAGSTADFQKIIQERCDTYTQTIRPGSRSRNCQAIRQAFMSAFIS 88 +G+ W S + G+T I+ RC TYT+ + P R+C+ I F SAF+SSbjct: 40 VGVLTWRQSSM-GATDHVSAIVLGRCLTYTRNMHPELRNQDCKKILNTFTSAFVS 93 Query: 89 KDPCKATKEDYN

28、SLINLAPPTVPCGQQVFWSKTKELAHEYAK-RRRLMTLEDTLLGYLAD 147 KDPC TKEDY LI+L TVPC + +FWS+KELAH+Y+ + + TLEDTLLGY+AD Sbjct: 94 KDPCNITKEDYQPLIDLVTQTVPCNKTLFWSRSKELAHQYSGIQKEMFTLEDTLLGYIAD 153 l互联网上的同源模建服务器SWISS-MODEL http:/www.expasy.ch/swissmod/SWISS-MODEL.html EMBL www.embl-heidelberg.de/predictprotein/pred

29、ictprotein.htmll蛋白质的折叠模式是有限的自然界中蛋白质家族的数目大约为23100个,现有的蛋白质结构分属600个家族,其中折叠模式只有约300种估计蛋白质的折叠模式的总数在几百到一千种l蛋白质折叠类型识别法:又名反向折叠法(threading)针对那些没有明显的同源性但又采取类似结构的蛋白质将一个序列与蛋白质折叠库中的所有结构类型进行匹配,找出最接近的一种需要构建非重复的蛋白质折叠模式库l常用的程序THREADER: http:/insulin.brunel.ac.uk/jones/ 蛋白质折叠类型识别网站:/Home蛋白质

30、逆折叠模建 (1). 反向折叠法 Inverse folding; or Threading 主要原理:将未知空间结构的蛋白质的氨基酸序列,和已知的蛋白质结构进行匹配,找出一种或几种匹配最好的结构,作为未知结构蛋白质的预测结构。 实现过程:总结出已知的独立的蛋白质结构模式,作为未知结构进行匹配的模板,然后用对现有数据库的学习,总结出可以区分正误结构的平均势函数,作为判别标准,来确定最好的匹配方式。 (2). 蛋白质序列镶嵌 1). 基于经验势函数的方法 希望通过对已知结构的蛋白质进行结构分析,建立形式各异的势函数,用折叠构象的能量最低标准来指导目标蛋白质的序列镶嵌,看它能与哪个已知的结构模板相匹配。 2). 基于剖面分析的方法 3D Profile 建立一个3D剖面库,应用动态规划,把新序列与剖面库中的剖面进行比较,寻找最优

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论