医学专题—5-蛋白质三级结构预测课件_第1页
医学专题—5-蛋白质三级结构预测课件_第2页
医学专题—5-蛋白质三级结构预测课件_第3页
医学专题—5-蛋白质三级结构预测课件_第4页
医学专题—5-蛋白质三级结构预测课件_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学专题5-蛋白质三级结构预测蛋白质结构蛋白质结构(jigu)预测预测肖肖 飞飞第一页,共四十页。医学专题5-蛋白质三级结构预测蛋白质三级结构预测(yc)的方法123第二页,共四十页。医学专题5-蛋白质三级结构预测方法方法(fngf)比较比较第三页,共四十页。医学专题5-蛋白质三级结构预测同源同源(tn yun)建模比较建模建模比较建模 根底根底 - 相似的序列结构相似的序列结构(jigu)相近相近 - PDB结构数据库的快速增长结构数据库的快速增长 - 结构基因组学的启动结构基因组学的启动 - 发散进化发散进化 特点特点 - 相对精确可靠相对精确可靠第四页,共四十页。医学专题5-蛋白质三级结

2、构预测 假设待预测三维结构假设待预测三维结构(jigu)的目标蛋白质为的目标蛋白质为UUnknown,利用同源模型化方法建立结构,利用同源模型化方法建立结构模型的过程包括下述模型的过程包括下述6个步骤:个步骤: 1搜索结构模型的模板搜索结构模型的模板(T) 2序列比对序列比对 3建立骨架建立骨架 4构建目标蛋白质的侧链构建目标蛋白质的侧链 5构建目标蛋白质的环区构建目标蛋白质的环区 6优化模型优化模型U T第五页,共四十页。医学专题5-蛋白质三级结构预测预测结果准确率:预测结果准确率: 对于具有对于具有60%等同的序列等同的序列(xli),用上述方法,用上述方法所建立的三维模型非常准确。假设序

3、列所建立的三维模型非常准确。假设序列(xli)的等同局部超过的等同局部超过60%,那么预测结果将接近于,那么预测结果将接近于实验得到的测试结果。实验得到的测试结果。 一般如果序列的等同局部大于一般如果序列的等同局部大于30%,那么可以,那么可以期望得到比较好的预测结果。期望得到比较好的预测结果。第六页,共四十页。医学专题5-蛋白质三级结构预测同源(tn yun)建模数据库搜索数据库搜索选择模板选择模板依据模板构建骨架模型依据模板构建骨架模型环状、侧链的构建,优化环状、侧链的构建,优化结构合理性评估结构合理性评估结构模型结构模型YESNO第七页,共四十页。医学专题5-蛋白质三级结构预测NoIma

4、geNoImage分子式:分子式:pGlu-His-Trp-Ser-Tyr-Gly-Leu-Arg-Pro-Gly-NH同源模建确定(qudng)一对柔性分子相应功能团可能的空间取向模 板加模板(mbn)第八页,共四十页。医学专题5-蛋白质三级结构预测3. 3. 同源同源(tn(tn yun) yun)建模法的局限性建模法的局限性 传统的比较建模是通过传统的比较建模是通过PSI-BLASTPSI-BLAST找到结构找到结构的 相 关 蛋 白 。 最 近 如 进 行的 相 关 蛋 白 。 最 近 如 进 行 p r op r o 比 较 和 有 效比 较 和 有 效(yuxio)(yuxio)利

5、用结构信息的更加复杂的方法已不利用结构信息的更加复杂的方法已不仅显著增加了比对的质量而且远程同源仅显著增加了比对的质量而且远程同源(remote (remote homologue)homologue)检测的能力。因此,比较建模和折叠检测的能力。因此,比较建模和折叠识别在基于模板的建模方法中的区别现已十分模识别在基于模板的建模方法中的区别现已十分模糊。开发新的比较建模和折叠识别的算法导致网糊。开发新的比较建模和折叠识别的算法导致网上各种预测方法的出现,这包括结构预测上各种预测方法的出现,这包括结构预测meta-meta-效劳器。效劳器。第九页,共四十页。医学专题5-蛋白质三级结构预测蛋白质三维

6、结构预测效劳通过因特网对公众免费开蛋白质三维结构预测效劳通过因特网对公众免费开放放( (同源建模同源建模) ):瑞士生物信息瑞士生物信息(xnx)(xnx)研究所研究所 SWISS-MODEL SWISS-MODEL丹麦技术大学生物序列分析中心丹麦技术大学生物序列分析中心 CPHmodels CPHmodels比利时拿摩大学比利时拿摩大学 ESyPred3D ESyPred3D英国癌症研究中心英国癌症研究中心 3DJigsaw 3DJigsaw4. 4. 常用建模效劳器和软件常用建模效劳器和软件(run jin)(run jin)简简介介Accelrys Discovery Studio 软件

7、软件(run jin)InsightIIFAMS第十页,共四十页。医学专题5-蛋白质三级结构预测同源同源(tn yun)蛋白质结构预测的方法蛋白质结构预测的方法1片段组装法:片段组装法:SWISS-MODEL2距离距离(jl)几何法:几何法:MODELLERSWISS-MODEL:第十一页,共四十页。医学专题5-蛋白质三级结构预测SWISS-MODEL: ://SWISS-MODEL.html第十二页,共四十页。医学专题5-蛋白质三级结构预测提交查询(chxn)序列第十三页,共四十页。医学专题5-蛋白质三级结构预测14模板序列模板序列(xli)与查与查

8、询序列询序列(xli)的装载的装载结构结构(jigu)的精细比对的精细比对分子分子(fnz)骨架的形成骨架的形成侧链形成和优化侧链形成和优化参加氢原子、参加氢原子、优化回环优化回环能量最小化、结能量最小化、结构封装构封装SWISS-MODEL的工作过程:的工作过程:第十四页,共四十页。医学专题5-蛋白质三级结构预测15最后最后(zuhu)的预测结果的预测结果第十五页,共四十页。医学专题5-蛋白质三级结构预测 蛋白质具有很少的折叠类型1000 根本步骤 将目标蛋白质序列(xli)与的折叠进行比对 将目标序列“安装到选择的模板结构上 对模型进行优化、调整 检验模型的合理性 关键方法 序列-结构比对

9、 穿针引线(chun zhn yn xin)法第十六页,共四十页。医学专题5-蛋白质三级结构预测 穿针引线方法折叠识别方法穿针引线方法折叠识别方法有很多蛋白质具有相似的空间结构,但它们的序列有很多蛋白质具有相似的空间结构,但它们的序列等同局部小于等同局部小于25%,即远程同源,即远程同源(tn yun)。 对于这类蛋白质,很难通过序列比对找出它们之间对于这类蛋白质,很难通过序列比对找出它们之间的关系,必须设计新的分析方法。的关系,必须设计新的分析方法。第十七页,共四十页。医学专题5-蛋白质三级结构预测 对于一个未知结构的蛋白质对于一个未知结构的蛋白质U, 如果找到一个结构的远程同源蛋白质如果找

10、到一个结构的远程同源蛋白质T, 那么那么(n me)可以根据可以根据T的结构模板通过远程同的结构模板通过远程同源模型化方法建立源模型化方法建立U的三维结构模型。的三维结构模型。U T远程(yunchng)同源第十八页,共四十页。医学专题5-蛋白质三级结构预测 一个远程同源模型化方法要解决三个问题:一个远程同源模型化方法要解决三个问题: 1检测远程同源蛋白质检测远程同源蛋白质T; 2U和和T的序列必须被正确地比照排列;的序列必须被正确地比照排列; 3修改一般的同源模型化过程,以应用于相似度非常低修改一般的同源模型化过程,以应用于相似度非常低的情况,即处理更多的环区,建立合理的三维结构模型。的情况

11、,即处理更多的环区,建立合理的三维结构模型。 如何如何(rh)解决第一个和第二个问题?解决第一个和第二个问题? 根本思想是建立一个从根本思想是建立一个从U到结构到结构T的线索,并通过一些基于环的线索,并通过一些基于环境或基于知识的势,评价序列与结构的适应性。境或基于知识的势,评价序列与结构的适应性。 至于最后建立三维结构模型那么是非常困难的至于最后建立三维结构模型那么是非常困难的序列(xli)结构比对第十九页,共四十页。医学专题5-蛋白质三级结构预测 线索化的主要思想:线索化的主要思想: 利用氨基酸的结构倾向如形成二级结构利用氨基酸的结构倾向如形成二级结构的倾向、疏水性、极性等,评价一个序列的

12、倾向、疏水性、极性等,评价一个序列所对应的结构是否所对应的结构是否(sh fu)能够适配到一个能够适配到一个给定的结构环境中。给定的结构环境中。第二十页,共四十页。医学专题5-蛋白质三级结构预测 建立序列到结构的线索的过程建立序列到结构的线索的过程(guchng)称为线称为线索化,线索技术又称折叠识别技术。索化,线索技术又称折叠识别技术。 线索化或者折叠识别的目标是为目标蛋白质线索化或者折叠识别的目标是为目标蛋白质U寻找寻找适宜的蛋白质模板,这些模板蛋白质与适宜的蛋白质模板,这些模板蛋白质与U没有显著没有显著的序列相似性,但却是远程同源的。的序列相似性,但却是远程同源的。 第二十一页,共四十页

13、。医学专题5-蛋白质三级结构预测 线索化方法一般有线索化方法一般有5个根本组成局部:个根本组成局部: 1三维折叠结构的数据库;三维折叠结构的数据库; 2一种适合于进行序列一种适合于进行序列-结构比对的三维折叠结构比对的三维折叠信息信息(xnx)的表示方法;的表示方法; 3一个序列一个序列-结构匹配函数,该函数对匹配程结构匹配函数,该函数对匹配程度进行打分;度进行打分; 4建立最优线索的策略,或者是进行序列建立最优线索的策略,或者是进行序列-结结构比对的策略;构比对的策略; 5一种评价序列一种评价序列-结构比对显著性的方法。结构比对显著性的方法。第二十二页,共四十页。医学专题5-蛋白质三级结构预

14、测假设存在有限数目的核心折叠假设存在有限数目的核心折叠core folds核心折叠实际上是构成核心折叠实际上是构成(guchng)蛋白质空间形状蛋白质空间形状的根本模式。的根本模式。建立核心折叠数据库建立核心折叠数据库预测预测- 建立线索建立线索U序列(xli)与数据库核心(hxn)折叠比对取最正确核心折叠U结构模型第二十三页,共四十页。医学专题5-蛋白质三级结构预测 一种基于序列与结构比对的最优线索化算法一种基于序列与结构比对的最优线索化算法 令令: s1, s2, sn为蛋白质序列为蛋白质序列S的的n个元素个元素 C1, C2, Cm为数据库中核心折叠为数据库中核心折叠(zhdi)C的的m

15、个核心区域个核心区域Cij为第为第i个核心区域第个核心区域第j个氨基酸位置个氨基酸位置 每一个核心区域由假设干个氨基酸残基构成每一个核心区域由假设干个氨基酸残基构成 第二十四页,共四十页。医学专题5-蛋白质三级结构预测 设设t是一个从序列到核心折叠的线索,那么是一个从序列到核心折叠的线索,那么t说明说明了序列了序列S的哪些元素的哪些元素si,sj,sk,代表核心区域代表核心区域C1, C2, C3,的起始的起始(q sh)位置。位置。 这实际上是一种从序列这实际上是一种从序列S到核心折叠到核心折叠C的比对的比对 令令 代表核心折叠代表核心折叠C中的环到序列中的环到序列S中空位的映射,中空位的映

16、射,显然显然 是通过线索化而确定的。是通过线索化而确定的。第二十五页,共四十页。医学专题5-蛋白质三级结构预测令令f(t)是进行比对的得分函数,其定义如下:是进行比对的得分函数,其定义如下: f(t) = g1 (v,t) + g2 (u,v,t) + g3 (,t)g1 (v,t) 评价氨基酸残基评价氨基酸残基v所处的位置所处的位置g2 (u,v,t) 评价残基评价残基u和和v的相对的相对(xingdu)位置,如位置,如果果u和和v 键合,那么得分高;键合,那么得分高;g3 (,t)评价环区,根据环区的大小进行打分。评价环区,根据环区的大小进行打分。 线索化问题:线索化问题:对于给定的序列对

17、于给定的序列S和核心折叠和核心折叠C,选择一个线索,选择一个线索t,使得使得f(t)的值最小,即寻找一个从的值最小,即寻找一个从S到到C的最正确的最正确映射。映射。第二十六页,共四十页。医学专题5-蛋白质三级结构预测 动态(dngti)规划 人工神经网络 分支定界法 线性规划 Monte Carlo方法 穿针引线穿针引线(chun zhn yn xin)(chun zhn yn xin)法法第二十七页,共四十页。医学专题5-蛋白质三级结构预测 理论根底 蛋白质的天然构象是热力学最稳定构象、也是 能量最低构象 能量函数 通过原子间作用力计算出的热力学能量 精确,但难以计算 伪能量函数 根据(gn

18、j)的三维结构知识得到的势能函数 常见的结构 低能量 不常见的结构 高能量 极罕见的结构 极高能量 从头从头(cngtu)(cngtu)预测法预测法第二十八页,共四十页。医学专题5-蛋白质三级结构预测原子间作用力 第二十九页,共四十页。医学专题5-蛋白质三级结构预测蛋白质的势能(shnng)第三十页,共四十页。医学专题5-蛋白质三级结构预测能量(nngling)函数第三十一页,共四十页。医学专题5-蛋白质三级结构预测蛋白质的势能(shnng)第三十二页,共四十页。医学专题5-蛋白质三级结构预测 根本步骤 选择蛋白质能量函数模型 选择三维结构的表示(biosh)方法 选择三维结构的评价函数 选择

19、寻找最优结构的优化方法 关键问题 大规模非线性规划 大量的局部极小点 在计算时间和准确度之间寻找平衡 基于能量(nngling)最小化的从头预测法第三十三页,共四十页。医学专题5-蛋白质三级结构预测非线性规划 最速下降(xijing)法 牛顿法 共轭梯度法 全局优化方法 遗传算法 分解-结合法 离散化方法 最优化方法(fngf)第三十四页,共四十页。医学专题5-蛋白质三级结构预测分子(fnz)动力学方法 对蛋白质中原子间的作用力进行建模 用动力学方程跟踪蛋白质折叠时每个原子的位置 求解(qi ji)这些方程的解析解是极其困难的 用离散动力系统的方法来确定数值解 问题 模拟蛋白质折叠过程是非常消耗时间的 模拟 10-9 秒的蛋白质折叠过程大约需要一天时间 蛋白质的实际折叠时间大约在 10-4 秒的数量级或者更多 需要超级计算机 第三十五页,共四十页。医学专题5-蛋白质三级结构预测新的趋势(qsh)混合(hnh)预测方法 在比较建模法和折叠识别法中使用从头预测法来预测局部难以找到模板的片断 在从头预测法中使用二级结构预测的结果和其他结构信息辅助建模 Meta-predictor 使用多个预测方法 对收集的结果进行综合比较和分析 改进收集的结果 第三十六页,共四十页。医学专题5-蛋

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论