同源模建的方法及结果分析_第1页
同源模建的方法及结果分析_第2页
同源模建的方法及结果分析_第3页
同源模建的方法及结果分析_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、-. z.同源模建的方法与结果分析序言:作为一个以实验为主的生化工作者来说,很多时候可以通过分子生物学手段获取自己需要的目的基因,并在各种表达载体和宿主中进展对应蛋白的表达,随后对于这些蛋白的特性进展研究,这也是一般酶学研究的特定套路。而近十几年来,人们开场思考是否能够将特性与蛋白质的三级构造进展关联,从分子水平理解蛋白质与底物之间的相互作用呢?于是类似于蛋白构造模建、分子对接、分子动力学模拟、量化计算等多种手段相继被创造以及应用。在这些方法中,同源模建无疑是最根底也是最重要的一个步骤,因为其质量的好坏直接决定了后续工作是否可信。因此,本文打算就同源模建的根本原理、常用软件及效劳器以及结果分析

2、与改良提供一些个人的经历,并希望各位朋友能够给予批评指正。同源模建的原理及应用限制两点根本原理:1.一个蛋白质的构造由其氨基酸序列唯一的决定。知道其一级序列,至少在理论上足以获取其构造2. 构造在进化中更稳定,变化比序列层面的变化要缓慢许多。应用限制:模板蛋白和目标蛋白的序列一致性需要大于30%,且越大建模准确性越有保障。了解了根本的原理,我们需要知道在实际操作中,同源模建都需要怎么样进展。同源模建的过程从实践中可分为以下7个步骤:模板识别和初始比对在序列一致性比拟高的时候,可以通过简单的序列比对程序如BLAST获取目标蛋白的构造将比对的数据库选择为PDB数据库。比对结果的校正用以上的方法确定

3、一个或多个建模模板后,应该采用更为准确的方法已取得更优的比对结果。有时在序列一致性较低的区域比对两条序列可能会具有困难,这个时候,我们可以采取其他同源蛋白序列一起参与比对来找到解决的方法。主链生成比对完成后,就可以开场实际的建模过程了,相对与后面几步来说,主链建模时最没有难度的一步了,因为大局部软件都是通过简单的拷贝模板蛋白的主链坐标来实现这一目的的。环区建模这一局部主要是目标蛋白和模板蛋白的比对结果中存在缺口的局部如何处理的问题。第一种解决的方式是略去模板蛋白存在的残基,留下一个必须补上的缺口。另一种情况是将主链截断,插入缺少的残基。侧链建模当我们比拟构造相似的蛋白质中保守残基的侧链构象时,

4、我们会发现他们的侧链构象通常会比拟相似。这就告诉我们如果加保守残基的侧链构象完整的拷贝到模建蛋白上时,在*些时候比先拷贝主链构象之后,再预测侧链构象来的可靠。但是这一经历规则在实际运用中仅在两者序列一致性较高,并且保守残基之间形成接触的情况下才能实现。因此,在现有的测序中,都是构造各种可能的构象体,并利用基于能量的函数打分来实现侧链构象的选择的。模型优化模型优化其实是一个比拟复杂的问题,其质量依赖于高准确性的预测侧链构象体,而为了到达这种目的,我们需要正确的主链,这一步骤实际又依赖于侧链构象体正确的堆积。因此,这一优化过程是迭代直至收敛的过程。需要注意的是,对于构造进展能量优化需要十分慎重。因

5、此偏离正确构造的途径比指向正确构造的途径多很多。在优化中的每一步可以排除一些大的误差,但是也会引入很多小的误差,这些小的误差经过多步积累,就有可能使你的结果更加偏离正确的构造。模型验证所有的模型都包含误差,误差的多少主要依赖于两方面的容:1.序列一致性的上下,越低的话引入误差的可能性就越大。2. 模板蛋白中的误差:如果这种误差是局域性的,尤其是远离活性位点的,对于你最后进展分子对接等研究室几乎没有影响的。如果是蛋白整体的,则需要小心处理。常用软件、效劳器2.1常用效劳器: = 1 * GB3 SWISS-MODEL: 网址SWISS-MODEL可能是目前非专业人士应用最为广泛的一个在线建模效劳

6、器了。其常见的模式可分为:Automated mode:自动模式,可以称为是最傻瓜的方式了进去之后只需要填上你的email以及在底下的框框输入你所想模建的蛋白序列,再点击submit modeling request即可,底下还有高级选项,支持自定义模板蛋白的pdb以及chain,或者自己上传模板文件,简而言之,真是非常易于操作。这种方法适用于PDB数据库中存在高度同源的蛋白构造时的建模(蛋白序列一致性最好大于80%,个人经历)Alignment mode:比对模式根本的操作和自动模式类似,但是其序列提交的时候可以提交目标蛋白与模板蛋白的序列比对结果(FASTA,MSF,ClustalW等格式

7、),如下所示:这种模式比拟适合目标蛋白与模板蛋白具有较高的相似性,但是利用自动模式未必能找到最适宜模板的情况,或者使用者有目的的使用特定的模板蛋白(比方具有更为相似的活性位点结果,而不是更为相似的整体构造)Project mode:工程模式工程模式主要是针对于目标蛋白和模板蛋白序列的相似性不高,两者的三级构造相似程度难以直接通过序列比对获得,需要人工插入调节(借助蛋白构造编辑软件deepview),这个模式能够交互式的提高前面两种模式的模型质量(通过将前两种模式模建出的蛋白进展人为调整)。属于针比照拟困难(序列一致性较低)的建模的一种有效途径。 = 2 * GB3 I-TASSAR: (貌似被

8、墙了?)*也可以下载本地安装包个人使用评价:根据结果质量检验,貌似在用过的自动建模的软件里是结果最好的了不过缺点是给结果时间比拟长。 = 3 * GB3 HOMER: 个人使用评价:这个软件需要序列蛋白与模板蛋白的构造比对文件上传(FASTA格式),可对模建的蛋白进展loop区优化以及侧链优化。尚未深入的研究 = 4 * GB3 CPHmodels 3.2 Server:个人使用评价:貌似没有任何特色,只需要一条蛋白序列既可以完成自动建模。常用软件: = 1 * GB3 Modeller:说到同源模建,不得不提其名鼎鼎的modeller, 要是做同源模建的娃们没有听过modeller, 实在是

9、不好意思说自己玩转了同源模建的。哈哈该软件由Sali lab开发,目前最新的版本是9.11,可在win下和linu*运行,需要对应版本的python 3.0。该软件好在什么地方呢?主要是可以自己控制的地方特别多,但这个也给新手带来了不少困扰,比方终究在特定的场合用什么参数等等。(本人将在自己以后的学习过程中继续分享对这个软件的学习心得,真的是挺有意思的)可实现的功能包括:多聚体建模,二硫键建模,杂原子建模(配体、辅酶等)。具体的运算流程稍后补充:其最成熟的GUI为 easymodeller,最新版本为4.0。使用方法稍后补充。同源模建结果评价与改良策略在我们通过各种软件构建出一个蛋白的同源模型

10、后,我们如何评价这一模型是否准确?如果不准确如何进展进一步的修饰能使其更好的应用于我们的后续模拟中呢?这些问题将在本节得以讨论同源模建结果的评价本人最常使用的构造检测方法来源于UCLA-DOE的SAVES效劳器,其网址为:提供的检测工具包括5种方法:PROCHECK: 该程序可以给出特定蛋白质模型的一系列立体化学参数,并且能以直观的彩图输出局部结果。该方法的原理主要是通过对蛋白质数据库中高分辨的蛋白晶体构造的参数进展整理,作为标准参数。将输入蛋白构造所具有的参数与标准参数进展比照,如果两者差异显著,则说明输入的蛋白构造存在明显问题。其输出的结果包括:拉氏图,主链的键长与键角,二级构造图,平面侧

11、链与水平面之间的背离程度等。WHATCHECK:包含大量的检测项,可以针对给定的蛋白构造与正常构造之间的差异,产生一个非常长而且详细的报告。ERRAT: 计算0.35 nm围之,不同原子类型对之间形成的非键相互作用的数目。原子按照C、N、O/S进展分类,所以有六种不同的相互作用类型:CC、CO、 NN、 NO、 OO。如果这些相互作用类型出现的频率与正常值相比有较大的区别,蛋白质模型的质量就值得疑心了通常使用9个氨基酸长度的滑行窗口用于获得每一个窗口的相互作用频率。类似的分析方法可以用于定位局部有问题的区域。Verify_3D: PROVE: 该程序可以比拟给定构造的原子体积与预先计算好的一系

12、列标准体积之间的差异。体积的计算方法采用Voronoi polyhedra几何模型,通过在原子及其邻近原子间放置一个个分散的平面来定义每一个原子占据的空间。以下以我研究的一个酶C-C键水解酶BphD的模型进展实例讲解:背景:首先利用BLAST进展蛋白一致性搜索,找出最适宜的蛋白模板,经确定为2OG1,以此蛋白构造为模板,利用modeller进展模建,得到我们的BphD的初始构造,提交到SAVES效劳器进展处理:PROCHECK结果:本局部主要需要的是拉氏图,在第一行中可以点击ps格式、PDF格式以及JPG格式进展下载,我下载了个PDF文件,大家可以看看下面的截图:这个效劳器最好的一点就是可以提

13、供处于各个区域的氨基酸残基占总数的百分比。拉氏图的结果主要分成4个区域:核心区域,允许区,大致允许区以及禁阻区。从图中可以看到大局部的氨基酸残基均位于核心区域 (95.9%),落在允许区和大致允许区的各有1个残基,而处于禁阻区的只有残基Ser112。通过我们对这个蛋白本身的了解可知,Ser112为该水解酶的催化三联体,其模板蛋白的Ser112同样处于禁阻区。接下来我们看看ERRAT的结果,该结果中Overall quality factor值越高越好,一般高解析度的晶体构造该值可以到达95,而对于解析度一般的来说该值只能到91%左右。本例中的ERRAT值为89.928,已经比拟接近低解析度的晶

14、体构造了,但是应该还有继续改良的空间。在图中存在的两条误差限表示的是位于其线以上的区域有多大的可能性是有问题的区域。根据这一结果,可以看出从残基120-150之间是一个需要高度注意的区域,另一个需要注意的区域是250-255。从BphD的PDB构造来看这两段主要是loop区,本身具有较大的弹性,因此再接下来的过程中可能需要重点关注这一段构造的优化。其他的参数如verify_3D等数值较好,在本例中未详细给出,将在下一个修改版中放出首先,我们考虑采用计算量较少的chiron效劳器对模建构造的clash进展处理。其结果给出原始蛋白构造中存在的构造间的冲突以及其修正后的结果与原始构造的叠合结果。接下来我们利用SAVES对于经过处理的蛋白

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论