版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
bioinformaticsbioinformatics蛋白质家族张力蛋白质家族张力同一蛋白家族的多序列联配可以用来推断结构、功能和家族关键氨基酸的信息。多序列联配信息的表示的表示方法有很多种,包括联配本身、一致序列、保守序列和残基模式、序列轮廓以及其他的序列家族的概率模型(隐马可夫模型)。同一蛋白家族的多序列联配可以用来推断结构、功能和家族关键氨基一致序列:在两个或多个同源序列的每一个位置上多数出现的核苷酸或氨基酸组成的序列。一致序列:在两个或多个同源序列的每一个位置上多数出现的核苷酸PROSITE:PROSITE数据库是与蛋白质家族成员关系有关的序列模式数据库。例如序列模式:[LIVM]-[ST]-A-[STAG]-H-C代表有6个氨基酸残基组成的序列,[LIVM]表示L、I、V、M中的一个残基,[ST]表示S或T,然后是A,然后是S、T、A或G,然后是H,然后是C还有一些其他表示方法,比如x(2),表示任意的两个氨基酸,x(2,4),表示任意的2到4个氨基酸,{ST},表示除S和T之外的任意一个氨基酸/PROSITE:PROSITE数据库是与蛋白质家族成员关系有例子:在prosite搜索酵母的Hexokinase(己糖激酶)例子:在prosite搜索酵母的Hexokinase(己糖激己糖激酶信号的序列模式为:[LIVM]-G-F-[TN]-F-S-[FY]-P-x(5)-[LIVM]-[DNST]-x(3)-[LIVM]-x(2)-W-T-K-x-[LF]酵母的153-178位氨基酸的序列为:LGFTFSYPASQNKINEGILQRWTKGF酵母的序列与己糖激酶信号的序列模式完全匹配:[LIVM]-G-F-[TN]-F-S-[FY]-P-x(5)-[LIVM]-[DNST]-x(3)-[LIVM]-x(2)-W-T-K-x-[LF]|||||||||||||||LGFTFSYPASQNKINEGILQRWTKGF己糖激酶信号的序列模式为:PROSITE模式也有很多缺点首先,他们长度较短,不相关序列中有假阳性出现。其次,他们允许描述特定位置的变化,但无法计算该变化的概率。例如[LIVM]指某位点可能是L、I、V或M,但他没有说明L在家族中90%的序列中出现,I、V、M进出现在10%的序列中。所以又出现了很多其他的序列模式数据库PROSITE模式也有很多缺点PRINTS和BLOCKS:PRINTS和BLOCKS分别通过来自一组蛋白或蛋白家族中最高度保守区域的多序列联配无空位片段的形式来表示蛋白质家族。这种多序列联配无空位片段分别定义为blocks(在BLOCKS中)或motifs(在PRINTS中)。例如:SH3家族SH3家族在PRINTS中用4个motif表示,每个motif表示一个保守区域,因此PRINTS模式可以覆盖更大的序列区域,克服了PROSITE的部分缺点。与PROSITE不同,序列中motif的匹配通常要考虑氨基酸替换矩阵,不要求严格匹配。PRINTS和BLOCKS:PRINTS和BLOCKS分别通PRINTS搜索到的序列不一定与motif中的完全匹配,比如motif2。这里用p值来量化搜到结果的显著意义,p值通常可以被解释为匹配分支至少与随机序列偶然发生的匹配一样高的概率。例如,在PRINTS中搜索下面序列:YEDEEAAVVQYNDPYADGDPAWAPKNYIEKVVAIYDYTKDKDDELSFMEGAIIYVIKKNDDGWYEGVCNRVTGLFPGNYVESIMHYTD可以搜索到SH3DOMAINPRINTS搜索到的序列不一定与motif中的完全匹配,比如PRINTS:http://www.bioinf.man.ac.uk/dbbrowser/PRINTS/index.php例子:在PRINTS搜索酵母的Hexokinase(己糖激酶)PRINTS:http://www.bioinf.man.aPRINTS搜索显示提交的序列为HEXOKINASE家族。在PRINTS中,HEXOKINASE家族用7个motif表示,提交的序列都匹配上,有较低的p值。PRINTS搜索显示提交的序列为HEXOKINASE家族。在Pfam:Pfam数据库手机了蛋白质机构与家族多序列联配和隐马尔科夫模型。Pfam:http://pfam.sanger.ac.uk/例子:在prosite搜索酵母的Hexokinase(己糖激酶)Pfam:Pfam数据库手机了蛋白质机构与家族多序列联配和隐Pfam搜索显示此序列包含Hexokinase_1和Hexokinase_2两个Pfammatches。Pfam搜索显示此序列包含Hexokinase_1和Hexo课堂练习分别使用PROSITE、PRINTS、Pfam搜索一下几个序列包含哪些一致序列,包含哪些结构域,属于哪个家族:>aMVKQIESKTAFQEALDAAGDKLVVVDFSATWCGPCKMIKPFFHSLSEKYSNVIFLEVDVDDCQDVASECEVKCMPTFQFFKKGQKVGEFSGANKEKLEATINELV>bMNPLLILTFVAAALAAPFDDDDKIVGGYNCEENSVPYQVSLNSGYHFCGGSLINEQWVVSAGHCYKSRIQVRLGEHNIEVLEGNEQFINAAKIIRHPQYDRKTLNNDIMLIKLSSRAVINARVSTISLPTAPPATGTKCLISGWGNTASSGADYPDELQCLDAPVLSQAKCEASYPGKITSNMFCVGFLEGGKDSCQGDSGGPVVCNGQLQGVVSWGDGCAQKNKPGVYTKVYNYVKWIKNTIAANS>cMEEPQSDPSVEPPLSQETFSDLWKLLPENNVLSPLPSQAMDDLMLSPDDIEQWFTEDPGPDEAPRMPEAAPPVAPAPAAPTPAAPAPAPSWPLSSSVPSQKTYQGSYGFRLGFLHSGTAKSVTCTYSPALNKMFCQLAKTCPVQLWVDSTPPPGTRVRAMAIYKQSQHMTEVVRRCPHHERCSDSDGLAPPQHLIRVEGNLRVEYLDDRNTFRHSVVVPYEPPEVGSDCTTIHYNYMCNSSCMGGMNRRPILTIITLEDSSGNLLGRNSFEVRVCA
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025松原经开职业学校有限公司工作人员招聘考试试题
- 2025景谷傣族彝族自治县职业高级中学工作人员招聘考试试题
- 2025昌乐宝石中等专业学校工作人员招聘考试试题
- 基坑防护台阶的施工方案
- 2026年5G通信基站能耗优化报告
- 初中历史教学中数字博物馆资源利用与历史思维培养课题报告教学研究课题报告
- 2026年土壤修复法规政策分析报告
- 技术创新驱动养老:2025年社区嵌入式养老服务站项目可行性研究
- 公用事业行业研究:双碳考核落地强化约束各省规划深化能源转型
- 2026年生物技术在海藻养殖的创新报告
- 印尼东南亚群岛多元风情
- JT-T 1037-2022 公路桥梁结构监测技术规范
- 高中数学课本中的定理公式结论的证明
- 蚂蚁集团区块链计划书
- 地下水监测井建设规范
- 全国优质课一等奖高中物理必修一《曲线运动》课件
- 产业经济学-产业组织理论
- 缺血性脑卒中的抗凝治疗课件
- 江苏省南师附中、天一中学、海门中学、海安中学2022-2023学年高二下学期6月四校联考化学答案
- 医疗器械经营监督管理办法考核试题及答案
- 艾媒咨询:2023年中国虚拟人产业发展与商业趋势研究报告
评论
0/150
提交评论