蛋白质的序列分析及结构预测 教育学习_第1页
蛋白质的序列分析及结构预测 教育学习_第2页
蛋白质的序列分析及结构预测 教育学习_第3页
蛋白质的序列分析及结构预测 教育学习_第4页
蛋白质的序列分析及结构预测 教育学习_第5页
已阅读5页,还剩134页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

蛋白质的序列分析及结构预测,1,优质课件,2,优质课件,一、蛋白质数据库介绍二、蛋白质序列分析三、蛋白质结构预测四、应用分子设计,3,优质课件,一、蛋白质数据库介绍,蛋白质的结构主要分为四级,一级结构、二级结构、三级结构以及四级结构。依据这种结构层次,将蛋白质数据库分为:1.蛋白质序列数据库:如PIR、SWISS-PROT、NCBI,这些数据库的数据主要以蛋白质的序列为主,并赋予相应的注释;2.蛋白质模体及结构域数据库:如PROSITE、Pfam,这些数据库主要收集了蛋白质的保守结构域和功能域的特征序列;3.蛋白质结构数据库:如PDB等,这些数据库主要以蛋白质的结构测量数据为主;4.蛋白质分类数据库:如SCOP、CATH、FSSP等,这其中有以序列比较为基础的序列分类数据库以及以结构比较为基础的结构分类数据库之分。,4,优质课件,蛋白质数据库特征:这些数据库种类有差别,但内部是相互联系的.每个数据库都有指针指向其他数据库,而且数据库之间的序列以及相应的结构是共享的,同一种蛋白质依次会出现在不同的数据库.这样的数据沟通有助于更深层地挖掘蛋白质的内在生物信息,这些数据库是融序列信息的索取、处理、存储、输出于一身的。,5,优质课件,1.蛋白质序列数据库,(1)PIR(proteininformationresource,PIR)和PSD(proteinsequencedatabase,PSD)/pirwwwPIR-PSD是一个综合全面的、非冗余的、专业注释的、分类完整的蛋白质序列数据库。PIR-PSD的序列来自于将GenBank/EMBL/DDBJ三大数据库的编码序列的翻译而成的蛋白质序列、发表的文献中的序列和用户直接提交的序列。(2)SWISS-PROT/TrEMBL数据库/swissprot,数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰位点、特殊位点和区域、二级结构、四级结构、与其他序列的相似性、序列残缺与疾病的关系、序列变异体等信息。,6,优质课件,2.模体以及结构域数据库,模体数据库(1)PROSITE蛋白质家族及结构域数据库(/prosite/)PROSITE数据库收集了有显著生物学意义的蛋白质位点序列、蛋白质特征序列谱库以及序列模型,并能依据这些特征属性快速可靠地鉴定出一个未知功能蛋白质序列属于哪个蛋白质家族,即使在蛋白质序列相似性很低的情况下,也可以通过搜索隐含的功能结构模体(motif)来鉴定,因此是有效的序列分析数据库。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、金属离子结合位点、二硫键、小分子或者蛋白质结合区域等,此外PROSITE还包括由多序列比对构建的序列表谱(profile),能更敏感地发现序列中的信息。,7,优质课件,PROSITE同时数据库提供了序列分析工具:ScanProsite是用于搜索所提交的序列数据是否包含PROSITE数据库中的序列模式或者SWISS-PROT数据库中已提交的序列模式;MotifScan用于查找未知序列中所有可能的已知结构组件,数据库包括PROSITE序列表谱、PROSITE模式、Pfam收集的隐马尔可夫模式(HMM)。,8,优质课件,(2)PRINTSFingerprintDatabasewww.bioinf.man.ac.uk/dbrowser/PRINTS/这个数据库包含1500个蛋白质指纹图谱,编码9136个单一模体。(3)BLOCKS(/)BLOCKS是通过一些高度保守的蛋白质区域比对出来的无空位的片段。,模体数据库,9,优质课件,蛋白质结构域数据库(1)蛋白质家族序列比对以及隐马尔可夫模式数据库Pfam(proteinfamiliesdatabaseofalignmentsandHMMs)Pfam是蛋白质家族序列比对以及隐马尔可夫模式数据库,其网址是:www.sanger.ac.uk/Software/Pfam/index.shtml。(2)蛋白质结构域数据库ProDomhttp:/prodes.toulouse.inra.fr/prodom/doc/prodom.html(3)SMARTSMART是一个简单的结构研究工具,可对可转移的遗传因子进行鉴定和注解,以及分析结构域结构,可以检测出500多个参与信号传导、胞外和染色体相关蛋白质的结构域家族,对这些结构域又在系统进化树分布、功能分类、三级结构和重要的功能残基方面做了注解。http:/smart.embl-heidelberg.de/,10,优质课件,3.蛋白质结构数据库,PDB(proteindatabank,PDB)http:/www.rcsb.o

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论