生物信息学 第六章 蛋白质结构预测及分子设计.ppt_第1页
生物信息学 第六章 蛋白质结构预测及分子设计.ppt_第2页
生物信息学 第六章 蛋白质结构预测及分子设计.ppt_第3页
生物信息学 第六章 蛋白质结构预测及分子设计.ppt_第4页
生物信息学 第六章 蛋白质结构预测及分子设计.ppt_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物信息学第六章蛋白质结构预测及分子设计,生物科学与技术学院,引子,单个蛋白涉及的问题结构预测(2D,3D)物理化学性质功能空间位置研究方法提取纯化制作晶体,决定结构理解机制,功能,多个蛋白涉及的问题表达过程(DNARNA蛋白,调控网络)相互作用(yeasttwo-hybrid,亲和层析)蛋白家族(family)检测(2D-PAGE,质谱仪,蛋白质芯片)研究方法基因组测序蛋白预言计算机分析结构理解机制,功能,一级结构(primary):氨基酸序列二级结构(secondary):螺旋、片层、.三级(维)结构(tertiary):亚基,结构域四级结构(quaternary):亚基之间特定的空间关系

2、,蛋白质的结构,一些单氨基酸(aa)突变可引起蛋白结构的重大变化CFTR的F508突变改变螺旋结构,从而改变其功能另一些变化则不明显一些蛋白引起的疾病囊肿性纤维化(cysticfibrosis):CFTR镰刀性贫血:血红蛋白疯牛病:朊蛋白阿尔兹海默氏征:淀粉样前体蛋白,蛋白结构与人类疾病(重要性),蛋白结构的主要仓库PDB,始建于197132000个结构数据(其中约3万是蛋白),读取PDB文件的门户网站Swiss-Prot,NCBI,EMBL,PDB,CATH,Dali,SCOP,FSSP解释PDB文件的数据库,用”PubMed”搜蛋白结构(NCBI),1、进入”PubMed”2、选择”Str

3、ucture”3、输入要找的蛋白名称或ID号等(如RecBCD,E.coliDNArepair)4、点击”Go”5、点击感兴趣的结果(1W36,进入MMDB)结果列表中包含相关蛋白(poweredbyBLAST)、文献、结构域(domain)、配体(ligand)、3D缩略图、三维查看器,在MMDB看搜到蛋白的结构(NCBI),MMDB(MolecularModelingDatabase):NCBI的大分子三维结构数据库,数据来自PDB打开的单个蛋白的页面中包括文献、简单描述、入库日期、物种(taxonomy)该蛋白的PDB,VAST链接(entirechain/View3DAlignment

4、)三维查看器(Cn3D)分子成分(图):chain,3Ddomain,classification/family,ligand,点击其中的PDB(RCSB)链接,显示,三维结构实验数据蛋白分类SCOP链接:结构域(家族,超家族)CATH链接:域,Class,Architecture,Topology,HomologyGO链接:功能,过程,细胞组成更多信息生化性质,配体,SNP(SequenceDetails)图形显示各域的分布,类别,DSSP二级结构,PDP域更多外部链接(对于RecBCD多达26个),更多有用的链接,PDB的外部链接中ComputepIMw点击ChainB(可计算各链分子量)

5、在打开的ComputepI/Mw页面中点击EX5B_ECOLI(ExPASy,大量信息,链接)在打开的UniProtKB/Swiss-Prot页面中点击EcoCyc:EG10824-MONOMER(biocyc,参与的反应/路径图),蛋白质结构预测及分析的主要内容,蛋白质结构预测过程,ORF翻译,实验数据,蛋白质序列,蛋白质理化性质和一级结构,数据库搜索,结构域匹配,已知结构的同源蛋白?,三维结构模型,可用的折叠模型?,蛋白质的基本性质,蛋白质的基本性质:相对分子质量氨基酸组成等电点(pI)消光系数半衰期不稳定系数总平均亲水性.,蛋白质理化性质分析工具,ProtParam工具简介,基于蛋白质序

6、列的组分分析氨基酸亲疏水性等分析为高级结构预测提供参考Expasy开发的针对蛋白质基本理化性质的分析:ProtParam工具/tools/protparam.html,计算以下物理化学性质:相对分子质量氨基酸组成等电点(pI)消光系数半衰期不稳定系数总平均亲水性,如果分析Swiss-Prot和TrEMBL数据库中序列直接填写Swiss-Prot/TrEMBLAC号(accessionnumber)如果分析新序列:直接在搜索框中粘贴氨基酸序列,输入Swiss-Prot/TrEMBLAC号,将protein.txt蛋白质序列粘贴在文本框中,返回结果,氨基酸数

7、目,相对分子质量,氨基酸组成,正/负电荷残基数,消光系数,半衰期,原子组成,分子式,总原子数,E(Prot)=Num(Tyr)*Ext(Tyr)+Num(Trp)*Ext(Trp)+Num(Cystine)*Ext(Cystine)proteinsinwatermeasuredat280nm:Ext(Tyr)=1490,Ext(Trp)=5500,Ext(Cystine)=125Absorb(Prot)=E(Prot)/Molecular_weight,不稳定系数,脂肪系数,总平均亲水性,40unstable,注意:ProtParam没有考虑蛋白质翻译后修饰、蛋白质多聚体等情况,故用户在预测和

8、分析此类特定蛋白质的基本理化性质时需要仔细审视反馈结果。,蛋白质结构预测,跨膜区预测:膜蛋白是一类结构独特的蛋白质,在各种细胞中普遍存在,同时发挥着重要的生理功能。,一、跨膜区分析,(a)-TypeImembraneprotein(b)-TypeIImembraneprotein(c)-Multipasstransmembraneproteins(d)-Lipidchain-anchoredmembraneproteins(e)-GPI-anchoredmembraneproteins,蛋白质跨膜区特性典型的跨膜螺旋区主要是由2030个疏水性氨基酸(Leu、Ile、Val、Met、Gly、Al

9、a等)组成;亲水残基往往出现在疏水残基之间,对功能有重要的作用;基于亲/疏水量和蛋白质跨膜区每个氨基酸的统计学分布偏好性。跨膜蛋白序列“边界”原则胞外末端:Asp(天冬氨酸)、Ser(丝氨酸)和Pro(脯氨酸)胞外-内分界区:Trp(色氨酸)跨膜区:Leu(亮氨酸)、Ile(异亮氨酸)、Val(缬氨酸)、Met(甲硫氨酸)、Phe(苯丙氨酸)、Trp(色氨酸)、Cys(半胱氨酸)、Ala(丙氨酸)、Pro(脯氨酸)和Gly(甘氨酸)胞内-外分界区:Tyr(络氨酸)、Trp(色氨酸)和Phe(苯丙氨酸)胞内末端:Lys(赖氨酸)和Arg(精氨酸),常用蛋白质跨膜区域分析工具,TMpred工具简介

10、,/software/TMPRED_form.html依靠跨膜蛋白数据库TMbase预测跨膜区和跨膜方向,主要参数/选项序列在线提交形式:直接贴入蛋白序列填写SwissProt/TrEMBL/EMBL/EST的ID或AC,输出格式,最短和最长的跨膜螺旋疏水区长度,输入序列名(可选),选择序列的格式,贴入protein.txt蛋白质序列,输出结果可能的跨膜螺旋区相关性列表,可能的跨膜螺旋区,位置,分值,片段中点位置,26,建议的跨膜拓扑模型,最优拓扑结构,每一位置计算分值,http:/www.cbs.dtu.dk/services/TMHMM-2.0

11、/,TMHMM,二、信号肽分析,信号肽:指分泌蛋白表达时氨基端(N-,有时不在N端)的20余个氨基酸,将引导该蛋白质最终分泌到细胞外,但这段信号肽会被信号肽酶切掉,所以成熟的分泌蛋白是不含这段信号肽的。信号肽可以指导蛋白质的跨膜转移。信号肽预测工具:SignalPserver(http:/www.cbs.dtu.dk/services/SignalP/),三、蛋白质二级结构分析(螺旋、折叠),蛋白质二级结构及类型二级结构取决于氨基酸侧链结构,由氢键形成1、螺旋(helix):4-40aa2、折叠(sheet):5-10aa,平行或反平行(C,N端方向一致或相反)3、转角(turn)4、无规则卷

12、曲(randomcoil),蛋白质二级结构分析工具,PredictProtein(/)可以获得功能预测、二级结构、基序、二硫键结构、结构域等许多蛋白质序列的结构信息。该方法的平均准确率超过72%,最佳残基预测准确率达90%以上。因此,被视为蛋白质二级结构预测的标准。用户需要注册ID、验证E-mail后,才能使用PredictProtein工具。,如何使用PredictProtein工具,将protein.txt蛋白质序列粘贴在文本框中,分析方法,重要的算法:PROFsec(螺旋,折叠等基本二级结构预测)PHDhtm(典型跨膜螺旋区预测)P

13、roSite(特征Motif识别方法),ProSitemotif搜索结果,置信度,二硫键位置,二硫键位置预测结果,PHD跨膜螺旋区预测结果,跨膜螺旋区,非跨膜螺旋区,PROF二级结构预测结果,螺旋结构,片层结构,无规则卷曲,四、蛋白质结构域预测,结构域(StructuralDomain)是蛋白序列的功能、结构和进化单元。结构域通常都是几个超二级结构单元的组合,即蛋白质多肽链在二级结构的基础上进一步卷曲折叠成几个相对独立的近似球形的组装体。结构域是介于二级和三级结构之间的另一种结构层次。结构域的实质是二级结构的组合体,充当三级结构的元件。,基本类型:,折叠,折叠,/折叠,+折叠,蛋白质结构域数据

14、库,InterPro数据库简介,InterPro:http:/www.ebi.ac.uk/interpro/InterPro数据库由EBI开发,整合蛋白质家族、结构域和功能位点等资源。整合UniProt、PROSITE、Pfam等12个成员数据库,检索结果准确。目前最新的InterPro34.0版本包含22245个条目,涵盖6309个结构域、14854个蛋白质家族(截至2011年11月底)。,序列提交框,InterProScan:http:/www.ebi.ac.uk/Tools/pfa/iprscan/提供在线提交和本地分析工具(Linux系统),分析工具,InterProScan工具结果反

15、馈,图形化结果(VisualOutput)以示意图的形式显示保守区和结构域表格式结果(SummaryTable)显示保守区和结构域的具体位置以及蛋白家族信息和GO分类号GO分类号:GO【GeneOntology(基因本体论)】,用于蛋白的功能分类。包含基因产物的相关分子功能、生物学途径和细胞学组件,根据这三个方面的内容对基因进行分类。,保守区示意图,InterPro蛋白家族信息,该家族蛋白在不同种类生物体中出现情况,其他家族与该家族的重叠情况,五、蛋白三级结构研究方法,实验方法1、X光晶体衍射2、核磁共振(NMR)计算方法1、从头算方法(abinitio/denovo)/理论分析法分子动力学能

16、量最低假设2、比较建模(comparativemodeling)基于同源性,1、从头算方法(abinitio/denovo)/理论分析法,根据物理化学原理(如原子之间作用力),建立模型,预测结构一些问题自然的蛋白质结构和未折叠的蛋白质结构,两者之间的能量差非常小(1kcal/mol数量级)蛋白质可能的构象空间庞大,针对蛋白质折叠的计算量非常大计算模型中力场参数的不准确性待测蛋白没有同源性时可用此法,2、比较建模/同源模型化方法(统计方法),通过同源序列分析或者模式匹配预测蛋白质的空间结构或者结构单元,如:锌指结构、螺旋-转角-螺旋结构、DNA结合区域等(motif)原理:许多不同的序列会采用同

17、一个基本的折叠,具有相似序列的蛋白倾向于有相似结构,一对自然进化的蛋白,如果它们的序列具有2530%的等同部分,可以假设它们结构相似。步骤Step1、识别结构保守域Step2、将待测蛋白与模板比对,保留30%同源性的结果Step3、建模Step4、评价模型,一般而言,同源性越高,结构预言越精确,50%同源性,精确度可达1埃,比较建模网站,蛋白质结构预测精度,同源建模法分析步骤:1、多序列比对与已有晶体结构的蛋白质序列比对2、确定是否有可以使用的模板序列相似度30%序列相似度30%,结合功能,蛋白质一级序列、二级结构或结构域信息3、构建三维模型4、三维模型准确性检验Whatcheck程序Rama

18、chandranplot计算检验5、手工调整多序列比对,重新拟合,构建新的模型,SWISS-MODEL工具(/)同源建模方法与PDB数据库已知结构的蛋白质序列比对进行预测,SWISS-MODEL工具简介,自动模式,比对模式,工程模式,SWISS-MODEL工作模式,主要参数/选项,粘贴SWISS-MODEL.txt中的蛋白质序列,输入用户E-mail(选填),模型和模板信息,下载pdb格式文件,模型和模板信息,模型质量参数,比对结果,模型评估(略),Anolea(AtomicNon-LocalEnvironmentAssessment):i

19、saserverthatperformsenergycalculationsonaproteinchain,evaluatingtheNon-LocalEnvironment(NLE)ofeachheavyatominthemolecule.Theenergyofeachpairwiseinteractioninthisnon-localenvironmentistakenfromadistance-dependentknowledge-basedmeanforcepotentialthathasbeenderivedfromadatabaseof147non-redundantproteinchainswithasequenceidentitybelow25%andsolvedbyX-Raycrystallographywitharesolutionlowerthan3.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论