蛋白质家族课件_第1页
蛋白质家族课件_第2页
蛋白质家族课件_第3页
蛋白质家族课件_第4页
蛋白质家族课件_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

bioinformaticsbioinformatics蛋白质家族张力蛋白质家族张力同一蛋白家族的多序列联配可以用来推断结构、功能和家族关键氨基酸的信息。多序列联配信息的表示的表示方法有很多种,包括联配本身、一致序列、保守序列和残基模式、序列轮廓以及其他的序列家族的概率模型(隐马可夫模型)。同一蛋白家族的多序列联配可以用来推断结构、功能和家族关键氨基一致序列:在两个或多个同源序列的每一个位置上多数出现的核苷酸或氨基酸组成的序列。一致序列:在两个或多个同源序列的每一个位置上多数出现的核苷酸PROSITE:PROSITE数据库是与蛋白质家族成员关系有关的序列模式数据库。例如序列模式:[LIVM]-[ST]-A-[STAG]-H-C代表有6个氨基酸残基组成的序列,[LIVM]表示L、I、V、M中的一个残基,[ST]表示S或T,然后是A,然后是S、T、A或G,然后是H,然后是C还有一些其他表示方法,比如x(2),表示任意的两个氨基酸,x(2,4),表示任意的2到4个氨基酸,{ST},表示除S和T之外的任意一个氨基酸/PROSITE:PROSITE数据库是与蛋白质家族成员关系有例子:在prosite搜索酵母的Hexokinase(己糖激酶)例子:在prosite搜索酵母的Hexokinase(己糖激己糖激酶信号的序列模式为:[LIVM]-G-F-[TN]-F-S-[FY]-P-x(5)-[LIVM]-[DNST]-x(3)-[LIVM]-x(2)-W-T-K-x-[LF]酵母的153-178位氨基酸的序列为:LGFTFSYPASQNKINEGILQRWTKGF酵母的序列与己糖激酶信号的序列模式完全匹配:[LIVM]-G-F-[TN]-F-S-[FY]-P-x(5)-[LIVM]-[DNST]-x(3)-[LIVM]-x(2)-W-T-K-x-[LF]|||||||||||||||LGFTFSYPASQNKINEGILQRWTKGF己糖激酶信号的序列模式为:PROSITE模式也有很多缺点首先,他们长度较短,不相关序列中有假阳性出现。其次,他们允许描述特定位置的变化,但无法计算该变化的概率。例如[LIVM]指某位点可能是L、I、V或M,但他没有说明L在家族中90%的序列中出现,I、V、M进出现在10%的序列中。所以又出现了很多其他的序列模式数据库PROSITE模式也有很多缺点PRINTS和BLOCKS:PRINTS和BLOCKS分别通过来自一组蛋白或蛋白家族中最高度保守区域的多序列联配无空位片段的形式来表示蛋白质家族。这种多序列联配无空位片段分别定义为blocks(在BLOCKS中)或motifs(在PRINTS中)。例如:SH3家族SH3家族在PRINTS中用4个motif表示,每个motif表示一个保守区域,因此PRINTS模式可以覆盖更大的序列区域,克服了PROSITE的部分缺点。与PROSITE不同,序列中motif的匹配通常要考虑氨基酸替换矩阵,不要求严格匹配。PRINTS和BLOCKS:PRINTS和BLOCKS分别通PRINTS搜索到的序列不一定与motif中的完全匹配,比如motif2。这里用p值来量化搜到结果的显著意义,p值通常可以被解释为匹配分支至少与随机序列偶然发生的匹配一样高的概率。例如,在PRINTS中搜索下面序列:YEDEEAAVVQYNDPYADGDPAWAPKNYIEKVVAIYDYTKDKDDELSFMEGAIIYVIKKNDDGWYEGVCNRVTGLFPGNYVESIMHYTD可以搜索到SH3DOMAINPRINTS搜索到的序列不一定与motif中的完全匹配,比如PRINTS:http://www.bioinf.man.ac.uk/dbbrowser/PRINTS/index.php例子:在PRINTS搜索酵母的Hexokinase(己糖激酶)PRINTS:http://www.bioinf.man.aPRINTS搜索显示提交的序列为HEXOKINASE家族。在PRINTS中,HEXOKINASE家族用7个motif表示,提交的序列都匹配上,有较低的p值。PRINTS搜索显示提交的序列为HEXOKINASE家族。在Pfam:Pfam数据库手机了蛋白质机构与家族多序列联配和隐马尔科夫模型。Pfam:http://pfam.sanger.ac.uk/例子:在prosite搜索酵母的Hexokinase(己糖激酶)Pfam:Pfam数据库手机了蛋白质机构与家族多序列联配和隐Pfam搜索显示此序列包含Hexokinase_1和Hexokinase_2两个Pfammatches。Pfam搜索显示此序列包含Hexokinase_1和Hexo课堂练习分别使用PROSITE、PRINTS、Pfam搜索一下几个序列包含哪些一致序列,包含哪些结构域,属于哪个家族:>aMVKQIESKTAFQEALDAAGDKLVVVDFSATWCGPCKMIKPFFHSLSEKYSNVIFLEVDVDDCQDVASECEVKCMPTFQFFKKGQKVGEFSGANKEKLEATINELV>bMNPLLILTFVAAALAAPFDDDDKIVGGYNCEENSVPYQVSLNSGYHFCGGSLINEQWVVSAGHCYKSRIQVRLGEHNIEVLEGNEQFINAAKIIRHPQYDRKTLNNDIMLIKLSSRAVINARVSTISLPTAPPATGTKCLISGWGNTASSGADYPDELQCLDAPVLSQAKCEASYPGKITSNMFCVGFLEGGKDSCQGDSGGPVVCNGQLQGVVSWGDGCAQKNKPGVYTKVYNYVKWIKNTIAANS>cMEEPQSDPSVEPPLSQETFSDLWKLLPENNVLSPLPSQAMDDLMLSPDDIEQWFTEDPGPDEAPRMPEAAPPVAPAPAAPTPAAPAPAPSWPLSSSVPSQKTYQGSYGFRLGFLHSGTAKSVTCTYSPALNKMFCQLAKTCPVQLWVDSTPPPGTRVRAMAIYKQSQHMTEVVRRCPHHERCSDSDGLAPPQHLIRVEGNLRVEYLDDRNTFRHSVVVPYEPPEVGSDCTTIHYNYMCNSSCMGGMNRRPILTIITLEDSSGNLLGRNSFEVRVCA

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论