已阅读5页,还剩71页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十讲蛋白质二级结构预测,中心法则(thecentraldogma)蛋白质结构蛋白质功能,折叠密码(foldingcode),又称“第二遗传密码”,蛋白质的氨基酸序列与其三维空间结构间的关系。破译折叠密码:从蛋白质的一级结构得到立体结构,即可直接从基因推测其编码蛋白质所对应的生物学功能。破解折叠密码被列为“21世纪的生物学”的重要课题。,在生物学研究中,分子的结构是最重要的数据它提供很多信息,包括生物分子的功能、作用机制、进化历史等,如何获得蛋白质结构,.-Gly-Ala-Glu-Phe-.,解决方法一:实验测定,.-Gly-Ala-Glu-Phe-.,X-射线晶体衍射核磁共振电镜技术,?,20世纪60年代解析一个蛋白质结构可以获得诺贝尔奖;20世纪70年代解析一个蛋白质结构则可成为轰动世界的新闻;20世纪80年代解析一个蛋白质结构则可申请到教授的职位;20世纪90年代解析一个蛋白质结构通常可以获得博士学位;,蛋白质结构解析的发展,X射线晶体学全解析的第一个蛋白质结构肌红蛋白,2005年,线粒体膜蛋白复合物2精细结构,X射线衍射测定蛋白和核酸精细结构,为新药设计提供了全新方向,中国科学家研制抗癌新药首获瑞典爱明诺夫奖,2016.03,Lastupdate:TuesdayMar01,2016at4PMPST,数量大技术难度高瓶颈,实验测定蛋白质结构,三维结构数据与一维序列数据在量上增长速度严重不协调,解决方法二:结构预测,.-Gly-Ala-Glu-Phe-.,蛋白质结构预测:指从蛋白质的氨基酸序列预测出其三维空间结构。,Levinthal悖论(LevinthalsParadox),一个100个氨基酸组成的肽链的折叠:假设:三种可能构象/氨基酸残基3100种不同构象;即使:10-13秒(0.1皮秒)/可能构想,(一皮秒:十亿分之一秒的千分之一)5x1034秒,or1027年(宇宙年龄1010年),CyrusLevinthal(1996):美国分子生物学家,蛋白质结构预测的理论基础:Anfinsen理论(Anfinsensdogma),ChristianBoehmerAnfinsen,Jr.(19161995)美国生物化学家,1972诺贝尔化学奖获得者,蛋白质序列含有蛋白质折叠的全部信息!,凡人改变世界?,Foldinghome:(始于2000年10月)分布式蛋白质折叠计算,它是众多分布式计算项目之一,也是最出名、普及最广泛的之一。它所凝聚的志愿者计算能力,比肩世界最快的超级计算机“天河二号”。Intel、Google、NVIDIA、AMD(前ATI)、索尼、苹果、戴尔等厂商形成了一个支持Foldinghome项目发展的同盟。,蛋白质结构的层次与结构预测,初级结构(primarystructure),四级结构(quaternarystructure),三级结构(tertiarystructure),SCOP(StructuralClassificationofProteins)CATH(Class,Architecture,Topology,Homology),蛋白质的二级结构预测判断每一段中心的残基是否处于-螺旋、-折叠(或其它状态)的二级结构态。,1.经验参数法(Chou-Fasman方法)由Chou和Fasman在70年代提出来。通过统计分析,获得的每个残基出现于特定二级结构构象的倾向性因子(P(-helix)、P(-sheet)),进而利用这些倾向性因子预测蛋白质的二级结构。理论依据:每种氨基酸出现在各种二级结构中倾向或者频率是不同的。例如:谷氨酸(Glu,E):-螺旋()缬氨酸(Val,V):-折叠()脯氨酸(Pro,P):-螺旋(X),氨基酸残基的构象倾向性因子定义:Pi=Ai/Ti(i=,c,t)i表示构象态:如螺旋、折叠、转角、无规卷曲等;Ti是所有被统计残基处于构象态i的比例;Ai是第A种残基处于构象态i的比例;Pi大于1.0表示该残基倾向于形成二级结构构象i,小于1.0则表示倾向于形成其它构象。四个转角参数,f(i)、f(i+1)、f(i+2)和f(i+3)。这四个参数分别对应于每种残基出现在转角第一、第二、第三和第四位的频率(例如,脯氨酸约有30%出现在转角的第二位,然而出现在第三位的几率不足4%)。,Chou-Fasman参数,基本思想是在序列中寻找规则二级结构的成核位点和终止位点。扫描输入的氨基酸序列,发现可能成为特定二级结构成核区域的短序列,然后对于成核区域进行扩展,不断扩大成核区域,直到倾向性因子小于某个阈值(1.0)为止。,Chou-Fasman参数法预测二级结构的经验规则,氨基酸残基,(i)螺旋规则(ii)折叠规则(iii)转角规则(iv)重叠规则,经验规则,(i)螺旋规则沿蛋白质序列寻找螺旋核相邻的6个残基中如果有至少4个残基倾向于形成螺旋,则认为是螺旋核。从螺旋核向两端延伸直至四肽片段的螺旋倾向性因子的平均值P1.03,则预测为螺旋。(ii)折叠规则相邻6个残基中若有4个倾向于形成折叠,则认为是折叠核。折叠核向两端延伸直至4个残基的平均折叠倾向性因子P1.05,则预测为折叠。,在实际运用中有50-60%的准确率,虽然有文章宣称能达到更高的准确率(数据集受限),(iii)-转角规则,转角的模型为四肽组合模型,要考虑每个位置上残基的组合概率,即特定残基在四肽模型中各个位置的概率。在计算过程中,对于从第i个残基开始的连续4个残基的片段,将上述概率相乘,根据计算结果判断是否是转角。如果f(i)f(i+1)f(i+2)f(i+3)大于7.510-5,四肽片段Pt的平均值大于100,并且Pt的均值同时大于P的均值以及P的均值,则可以预测这样连续的4个残基形成转角。,2.基于氨基酸疏水性的预测方法,螺旋的两亲特特征:螺旋的一侧通常处于蛋白质的疏水核心,另一侧则常处于亲水表面,因此,-螺旋中亲疏水氨基酸残基的出现位置也就有一定的规律性,亲水残基多出现在亲水侧面,而疏水残基则多出现在疏水侧面,反映在序列上就是一些特征的亲疏水残基间隔模式。,-螺旋的两亲特特征与结构预测,基于氨基酸疏水性的预测螺旋的形成规律:在一段序列中发现第i、i+3、i+4位(如1、4、5)是疏水残基时,这一片段就被预测为螺旋;当发现第i、i+1、i+4位(如7,8,11)为疏水残基时,这一片段也被预测为螺旋。,基于氨基酸疏水性的预测折叠的形成规律:对于折叠,也存在着一些特征的亲疏水残基间隔模式,埋藏的折叠通常由连续的疏水残基组成,一侧暴露的折叠则通常具有亲水-疏水的两残基重复模式。原则上,通过在序列中搜寻特殊的亲疏水残基间隔模式,就可以预测螺旋和折叠。,将待预测的片段与数据库中已知二级结构的片段进行相似性比较,根据相似性得分以及数据库中的构象态,构建出待预测片段的二级结构。该方法对数据库中同源序列的存在非常敏感,若数据库中有相似性大于30%的序列,则预测准确率可大大上升。,3.基于多重序列比对的方法(同源法),已知二级结构的氨基酸片段T=TNGIYT的二级结构为(H代表-螺旋):HHHHH,待预测二级结构的氨基酸片段U=TSGVF,序列比对:T=TNGIYU=TSGVF将T的构象态赋予U,相似序列相似结构,4.综合方法,多个程序同时预测综合评判,一致结果双重预测:首先预测蛋白质的结构类型,然后再预测二级结构,经验参数法基于氨基酸疏水性的预测方法同源分析法,蛋白质二级结构预测的意义,由蛋白质二级结构统计分析得到的规则可用于全新蛋白质设计或蛋白质突变体的设计。当序列同源性较低时,二级结构的指认有助于确定蛋白质间结构与功能的关系。在基于二级结构片段堆积的三级结构预测中正确的二级结构预测是第一步。二级结构的预测有助于多维核磁共振中二级结构的指认,同时也有助于晶体结构的解析。,蛋白质二级结构在线预测,PHDsecneuralnetworkforsecondarystructureprediction,accesibility,andtrans-membranehelix.Usesmultiplealignments.Reliability70%.Jpreduses2neuralnetworksandincludesevolutiveinformation(PSI-BLAST).Theversion2evaluatestheresultsof4networks(JNet,NSSP,Predator,PHD)toimprovereliability.pbio.dundee.ac.uk/jpred/PROFBasedonmultiplealignmentsandotherresiduepropertiesobtainedfromdatabases.Relaibility70%.PSIpredBasedonfilteredpsi-blastprofilesandneuralnetworks(combinesreultsfromdifferentmethods).relaibilityis76%.,PredictProtein(PHDsec),PsiPred,JPred,蛋白质折叠病,同源建模法(Homologymodelling)线索化法/折叠识别法/串线法(Threading/Foldrecognition)从头预测法(Abinitio/Denovomethods),蛋白质三级结构预测,蛋白质三级结构预测1.同源蛋白质结构预测,依据:任何一对蛋白质,如果两者的序列等同部分超过30%(序列比对长度大于80),则它们具有相似的三维结构,即两个蛋白质的基本折叠相同,只是在非螺旋和非折叠区域的一些细节部分有所不同。主要思想:对于一个未知结构的蛋白质,找到一个已知结构的同源蛋白质,以该蛋白质的结构为模板,为未知结构的蛋白质建立结构模型。,搜索结构模型的模板,序列比对,建立骨架,构建目标蛋白质的侧链、环区、加入氢原子,优化模型,同源建模的过程,将模板结构的坐标拷贝到目标U,仅拷贝匹配残基的坐标,分子力学分子动力学模拟退火,PDB数据库,SWISS-MODEL:/SWISS-MODEL.html,同源建模方法特点,绕过了二级结构预测目前蛋白质结构预测方法中最成功、最准确、使用最多局限是:仅仅是一种技术手段,而非理论应用范围收已有同源结构的限制Loop区域准确率差,又称蛋白质折叠类型识别依据:蛋白质折叠模式的有限性:一些序列(小于25%,远程同源)功能不同的蛋白质采用类似的结构,蛋白质折叠模式的种类是有限的。序列中的残基的结构信息比残基本身更加保守。,蛋白质三级结构预测2.线索化方法,蛋白质结构分类数据库,SCOP(StructuralClassificationofProteins)CATH(Class,Architecture,Topology,Homology),CATH的结构层次,主要思想:利用氨基酸的结构倾向(如形成二级结构的倾向、疏水性、极性等),评价一个序列所对应的结构是否能够适配到一个给定的结构环境中。建立序列到结构的线索的过程称为线索化,线索技术又称折叠识别技术。具体做法是即将结构转换为含有这三个结构的字符串,然后对这些字符串进行比较。线索技术的首要任务是建立核心折叠数据库在预测蛋白质空间结构时将一个待预测结构的蛋白质序列与数据库中核心折叠进行比对,找出比对结果最好的核心折叠,作为构造待预测蛋白质结构模型的根据。序列与模板进行比对(sequence-structurealignment),即建立线索。,目标序列,与数据库核心折叠比对,取最佳核心折叠,结构模型,evaluationwithcompatibilityfunctions,thestructuremostcompatiblewiththesequence,在既没有已知结构的同源蛋白质、也没有已知结构的远程同源蛋白质的情况下使用根
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 设备管理与维护的标准化作业程序手册
- 山东低压电工证考试题库及答案
- 单位协作发展协议签订承诺书4篇
- 船舶电工考试题库及答案
- 2025年人工智能行业语音识别与智能交互技术研究报告及未来发展趋势预测
- 2025年生物科技在医药健康领域中的创新药物研发与应用报告
- 业务报告自动化生成工具
- 跨部门协作平台的沟通工具与技巧
- 财务管理月度报告标准化输出工具
- 食品安全法培训试题6及答案解析
- 流程改造三年计划
- 江西洪城水业环保有限公司面向社会公开招聘工勤岗工作人员【28人】笔试考试备考试题及答案解析
- 2025四川南充市嘉陵城市发展集团有限公司招聘工作人员10人笔试历年参考题库附带答案详解
- 2025年财务主管备考题库及答案解析
- 婴幼儿卫生与保健期末考试卷及答案
- 2025年大学《印度尼西亚语》专业题库- 印尼语语法与写作
- 代办相关资质合同范本
- 真菌毒素代谢途径-洞察与解读
- 2025年能源资源管理与可持续发展试卷及答案
- 2025-2030基因治疗行业市场深度调研及前景趋势与投资研究报告
- 无人机飞行安全预案与应急处理方案
评论
0/150
提交评论