生物信息学-PowerPointPresentatio.ppt_第1页
生物信息学-PowerPointPresentatio.ppt_第2页
生物信息学-PowerPointPresentatio.ppt_第3页
生物信息学-PowerPointPresentatio.ppt_第4页
生物信息学-PowerPointPresentatio.ppt_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物信息学,第九章结构生物信息学,本章内容提要,1.蛋白质的结构与功能2.蛋白质结构的数据库、结构分类以及可视化3.蛋白质二级结构预测4.蛋白质三级结构预测,1.蛋白质的结构与功能,蛋白质的结构主要由一级序列所决定蛋白质的功能主要由三级结构所决定球蛋白(Globularproteins):疏水的内核&亲水的表面膜蛋白(Membraneproteins):特定的疏水表面亚稳态(marginallystable):折叠之后的蛋白质无序性(Intrinsicallydisordered):许多蛋白质必须与其他蛋白质结合后才能够获得稳定的结构因此,预测蛋白质的结构和功能非常的困难,蛋白质结构的四个基本层面,一级和二级结构,1.一级结构氨基酸的线性序列氨基酸残基之间连接的共价键2.二级结构氨基酸残基局部空间内的排列短程的、非共价的相互作用周期性的结构模式:-helix,b-sheet,loops,coils,a-helix,1.蛋白质中最多的二级结构2.平均长度:10个氨基酸残基(10A0)长度范围:5-40aa每一圈:3.6个aa通过氢键(per4aa)稳定结构通常在内核的表面,疏水残基向内,亲水残基向外,helix通过氢键稳定结构,C=blackO=redN=blue,R-侧基分布在helix的外侧,helices:氨基酸偏好,Ala,Glu,Leu,Met:出现频率高Pro,GlyTyr,Ser:出现频率低,-Strands&Sheets,1.一般不单独出现,成对或多个出现2.链通过氢键连接,稳定结构3.相互作用的部分通过短的/长的loop连接4.平行或反平行的-sheet,反平行的-sheet,平行的-sheet,混合的-Sheets,Loops,1.连接-helix和b-sheet2.长度和三级结构不定3.在蛋白质结构的表面4.受点突变的影响小5.柔性好,构象变化余地大6.带电荷、极性的氨基酸比例高7.倾向成为活性位点,Coils,无序性(Intrinsicallydisordered):介导蛋白质-蛋白质之间的相互作用,三级和四级结构,三级结构肽链折叠成三维的空间结构二级结构在空间上的排布长程的、共价与非共价的相互作用四级结构多个肽链在空间上的排布,超二级结构,1.StructuralMotifs:超二级结构或二级结构的组合2.Domains:Motifs的组合,一些常见的结构性motifs,1.Helix-turn-helix:e.g.,DNAbinding2.Helix-loop-helix:e.g.,Calciumbinding3.b-hairpin:2adjacentantiparallelstrandsconnectedbyshortloop4.Greekkey:4adjacentantiparallelstrands5.bb:2parallelstrandsconnectedbyhelix,H-T-HH-L-H,b-hairpin,Greekkey,Beta-alpha-beta,Domains:Motifs的组合,一个或多个domains,六种蛋白质的结构类型,(1)aDomains:a螺旋束通过loops连接(2)Domains:主要是反平行片,两对片形成sandwich结构(3)aDomains:a螺旋连接的平行的片(4)aDomains:a螺旋和片各自形成单独的结构(5)Multidomain(a):包含多种domains(6)Membrane&cell-surfaceproteins,-domainstructures:4-helixbundles,Up-and-downsheetsandbarrel,Greekkeymotifs,aDomainsTIMbarrelRossmanfold,2.蛋白质结构数据库、结构分类以及可视化,1.蛋白质结构的数据库:PDB,MMDB,MSD2.蛋白质结构的分类:SCOP,CATH,DALI/FSSP3.蛋白质结构的可视化:Cn3D,Rasmol/Raswin,蛋白质结构的数据库,1.PDB(ProteinDataBank):蛋白质结构数据库/pdb/home/home.do2.MMDB(MolecularModelingDatabase):分子模拟数据库/sites/entrez?db=structure3.MSD(MolecularStructureDatabase):大分子的相互作用和结合位点http:/www.ebi.ac.uk/msd,PDB(RCSB),MMDB,MSD,蛋白质结构的分类,1.SCOP(StructuralClassificationofProteins):folds,superfamilies,andfamilieshttp:/scop.mrc-lmb.cam.ac.uk/scop/2.CATH(ClassificationbyClass,Architecture,Topology&Homology)/3.DALI/FSSP:蛋白质三级结构的比较DALIserverhttp:/ekhidna.biocenter.helsinki.fi/dali_server/index.htmlDALIDatabase(foldclassification)http:/ekhidna.biocenter.helsinki.fi/dali/start,蛋白质结构的可视化,RasWin,Cn3D,3.蛋白质二级结构预测,1.Chou-Fasmanpredictions:Empirical2.Garnier,OsguthorpeandRobson(GOR):HMM3.DavidT.Jones:PSSM4.Frishman,Argos:Nearestneighbormethods5.SujunHua:Supportvectormachine,Chou-Fasman,1.预测三种主要的二级结构:-helix,b-sheet,Coils2.训练数据:15个已知构象的蛋白质结构,共2473个氨基酸残基3.定义:蛋白质构象参数(proteinconformationalparameters):氨基酸残基在二级结构中的重要性P,P,Pc,氨基酸在各种二级结构中的频率,InnerHelix:IncludedinHelix,P,P,Pc的计算,P&P,-helix,b-sheet,经验规则与预测性能,1.规则一:对于给定一个6aa的片段,P均值1.03,并且P的均值P的均值,则判定为-Helix2.规则二:对于给定一个6aa的片段,P的均值1.05,并且P的均值P的均值,则判定为-sheet3.预测性能:准确性50-60%;对于-sheet性能较差,准确性65%,Garnier,OsguthorpeandRobson(GOR):HMM,DavidT.Jones:PSSM,PSIPRED:PSSM+NeuralNetwork,准确性76.5%78.3%,Frishman,Argos:Nearestneighbormethods,准确性72%,SujunHua:Supportvectormachine,准确性76.2%,4.蛋白质三级结构预测,(1)结构基因组学(2)蛋白质折叠的动力学(3)蛋白质三级结构的预测:具有最小自由能的构象A.HomologymodelingB.ThreadingC.AbinitoPrediction,结构基因组学,1.人的基因组中包含22,00个基因2.细胞内:通常3,000种蛋白质3.序列与结构2millionsequencesinUniProt33,000proteinstructuresinthePDB4.目标:通过实验或者计算的手段解析所有蛋白质在自然条件下的三级结构,蛋白质折叠的动力学,1.蛋白质的折叠:细胞内:自发的;酶的介导;伴侣蛋白的介导体外:许多蛋白质不能自发折叠2.动态:蛋白质的结构在自然条件下并不是固定的蛋白质的功能常常依赖其构象的改变3.自然条件下与变性之后的能量差非常小(5-15kcal/mol)大约等于1-2个氢键的能量4.折叠过程中,熵与焓都发生改变,ProteinFoldingCode,1.蛋白质结构预测/“蛋白质折叠”给定一个蛋白质的氨基酸序列,预测其三级结构2.“反向折叠给定一个蛋白质的结构,找出所有符合这个结构的氨基酸序列,HomologyModeling,1.搜索已知三级结构的同源蛋白质序列(模板)PSI-BLASTmultiplesequencealignment(MSA)2.选取与给定序列相似性最高的结构作为模板3.将氨基酸残基替换到结构模板中对应的位置上,降低自由能4.准确性好序列相似性高模型可靠性高30%sequenceidentity5.常用工具:MODELLER,Swiss-model,HomologyModeling:WorkWell,Threading-FoldRecognition,1.“大积木”2.实验发现:蛋白质折叠的类型有限(1,000)3.问题:能否根据不同的模版,预测给定蛋白质的折叠类型,并进一步拼装成三级结构?4.计算要求:能量函数模版库(templatelibrary)5.计算方法将给定序列与每一个模板的序列匹配,打分将模板连接起来,氨基酸残基替代优化模型:能量函数6.计算性能:不定序列相似性高模型可靠性高,Threading,将给定序列与模板库做序列比较(foldlibrary)评分准则:给定序列是否与模板的结构吻合(1D-3Dprofile)根据打分结果对模板适用性给予排序,TargetSequence,StructureTemplates,ALKKGFHFDTSE,AbInitioPrediction,1.能量函数键能(bondenergy)键的转角能(bondangleenergy)二面角能(dihedralangleenergy)范德华力(vanderWaalsene

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论