蛋白质序列分析_第1页
蛋白质序列分析_第2页
蛋白质序列分析_第3页
蛋白质序列分析_第4页
蛋白质序列分析_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于蛋白质序列分析第1页,讲稿共70页,2023年5月2日,星期三蛋白质序列结构信息蛋白质序列的基本性质分析结构域分析及motif搜索蛋白质二级结构蛋白质三级结构蛋白质序列分析第2页,讲稿共70页,2023年5月2日,星期三一、蛋白质序列的基本性质分析理化性质分析疏水性分析跨膜区分析信号肽预测Coil区分析亚细胞定位蛋白质序列分析第3页,讲稿共70页,2023年5月2日,星期三蛋白质理化性质分析Protparam工具/tools/protparam.html计算以下物理化学性质:相对分子质量理论pI值氨基酸组成原子组成消光系数半衰期不稳定系数脂肪系数总平均亲水性蛋白质序列分析第4页,讲稿共70页,2023年5月2日,星期三主要选项/参数序列在线提交形式:如果分析SWISS-PORT和TrEMBL数据库中序列直接填写Swiss-Prot/TrEMBLAC号(accessionnumber)如果分析新序列:直接在搜索框中粘贴氨基酸序列蛋白质序列分析输入Swiss-Prot/TrEMBLAC号打开protein.txt,将一条蛋白质序列粘贴在搜索框中第5页,讲稿共70页,2023年5月2日,星期三输入Swiss-Prot/TrEMBLAC号—分不同的功能域肽段输出结果功能域用户自定义区段蛋白质序列分析第6页,讲稿共70页,2023年5月2日,星期三点击不同功能域或是以直接粘贴氨基酸序列的方式得到以下结果蛋白质序列分析氨基酸数目相对分子质量理论pI值氨基酸组成原子组成分子式总原子数第7页,讲稿共70页,2023年5月2日,星期三消光系数半衰期不稳定系数脂肪系数总平均亲水性蛋白质序列分析第8页,讲稿共70页,2023年5月2日,星期三ProtScale工具

/tools/protscale.html氨基酸标度表示氨基酸在某种实验状态下相对其他氨基酸在某些性质的差异,如疏水性、亲水性等收集50多个文献中提供的氨基酸标度默认值为Hphob.Kyte&Doolittle,做疏水性分析蛋白质疏水性分析蛋白质序列分析第9页,讲稿共70页,2023年5月2日,星期三20种氨基酸的疏水K-D标度氨基酸K-D标度氨基酸K-D标度Ile(I)4.5Trp(W)-0.9Val(V)4.2Tyr(Y)-1.3Leu(L)3.8Pro(P)-1.6Phe(F)2.8His(H)-3.2Cys(C)2.5Asn(N)-3.5Met(M)1.9Asp(D)-3.5Ala(A)1.8Gln(Q)-3.5Gly(G)-0.4Glu(E)-3.5Thr(T)-0.7Lys(K)-3.9Ser(S)-0.8Arg(R)-4.5第10页,讲稿共70页,2023年5月2日,星期三主要选项/参数序列在线提交形式:如果分析SWISS-PORT和TrEMBL数据库中序列直接填写Swiss-Prot/TrEMBLAC号(accessionnumber)如果分析新序列:直接在搜索框中粘贴氨基酸序列蛋白质序列分析输入Swiss-Prot/TrEMBLAC号氨基酸标度打开protein.txt,将一条蛋白质序列粘贴在搜索框中第11页,讲稿共70页,2023年5月2日,星期三计算窗口(7-11)相对权重值

权重值变化趋势

第12页,讲稿共70页,2023年5月2日,星期三输出结果输入Swiss-Prot/TrEMBLAC号—分不同的功能域肽段蛋白质序列分析功能域用户自定义区段第13页,讲稿共70页,2023年5月2日,星期三点击不同功能域或直接粘贴氨基酸序列的方式得到以下结果蛋白质序列疏水区域分布预测图蛋白质序列分析图形结果文本结果序列参数

每个位置的得分第14页,讲稿共70页,2023年5月2日,星期三跨膜区分析膜蛋白不溶于水,分离纯化困难,不容易生长晶体,很难确定其结构膜蛋白跨膜区可能作为膜受体,也可能是定位在膜上的锚定蛋白或离子通道蛋白预测跨膜螺旋主要基于已知的跨膜螺旋信息,应用统计模型或神经网络方法使用单一的预测软件准确性不太高,综合不同的软件预测结果并结合疏水性图,可以获得较好的预测,对于跨膜螺旋和膜向性预测准确率达80%~95%蛋白质序列分析第15页,讲稿共70页,2023年5月2日,星期三跨膜区在线分析工具蛋白质序列分析名称网址说明TMHMMhttp://www.cbs.dtu.dk/services/TMHMM/判定是否是膜蛋白Tmpred/software/TMPRED_form.html预测跨膜片断TMPhttp://www.mbb.ki.se/tmap/用多序列比对方法预测跨膜区跨膜蛋白数据库Tmbase来源于Swiss-Prot数据库,提供如跨膜结构区的数量、位置及其侧翼序列等信息。数据库下载地址:http://www.isrec.isb-sib.ch/ftp-server/tmbase第16页,讲稿共70页,2023年5月2日,星期三跨膜区实例分析蛋白质序列分析使用TMHMMserver2.0对水稻瘤矮病毒(RGDV)外层衣壳P8蛋白进行跨膜区分析

。TMHMM基于隐马尔可夫模型预测,综合了跨膜区疏水性、电荷偏倚、螺旋长度和膜蛋白拓扑学限制等性质,可对跨膜区及膜内外区进行整体预测。TMHMM在区分可溶性蛋白和膜蛋白方面尤为见长,常用于判定一个蛋白是否为膜蛋白。第17页,讲稿共70页,2023年5月2日,星期三贴入RGDVp8.txt蛋白质序列第18页,讲稿共70页,2023年5月2日,星期三P8蛋白的1~405位氨基酸位于细胞膜表面406~425位氨基酸形成一个典型的跨膜螺旋区第19页,讲稿共70页,2023年5月2日,星期三信号肽预测蛋白质合成后要运送到细胞中不同的部位,有的蛋白质要通过内质网膜进入内质网腔内,最终成为分泌蛋白。分泌蛋白的N端都有一段约15~35个氨基酸的疏水性肽段,其功能是引导蛋白质多肽链穿过内质网膜进入腔内,称为信号肽(signalpeptide)。按照氨基酸组成及其位置特征,可将信号肽分为4大类:分泌信号肽 2.脂蛋白信号肽3. Pilin-like信号肽 4.细菌素和细菌素信号肽蛋白质序列分析第20页,讲稿共70页,2023年5月2日,星期三信号肽主要由三个domain组成:N-region、H-regin和C-region.N-region为正电荷区域,至少含有一个精氨酸(R)或赖氨酸(K).H-region为疏水核,一般长为12~14个氨基酸.C-region包含信号肽酶(SPase)的剪切位点,在剪切位点的-1位和-3位上多为中性的丙氨酸,该区域也称为富含丙氨酸区域.NHC

N端C端蛋白质序列分析第21页,讲稿共70页,2023年5月2日,星期三信号肽预测在线分析工具蛋白质序列分析名称网址说明ChloroPhttp://www.cbs.dtu.dk/services/ChloroP/预测植物中叶绿体转运肽LipoPhttp://www.cbs.dtu.dk/services/LipoP/预测革兰氏菌中的信号肽酶I、II的剪切位点NetNEShttp://www.cbs.dtu.dk/services/NetNES/预测富含亮氨酸的核输出信号SecretomePhttp://www.cbs.dtu.dk/services/SecretomeP预测真核生物中非经典类型的和无导肽的分泌蛋白SignalPhttp://www.cbs.dtu.dk/services/SignalP/预测革兰氏阳性菌(G+)、预测革兰氏阴性菌(G-)、真核生物信号肽MITOPROThttp://ihg.gsf.de/ihg/mitoprot.html预测线粒体、叶绿体信号肽PlasMit.chemie.uni-frankfurt.de/plasmit//

线粒体转运肽第22页,讲稿共70页,2023年5月2日,星期三水稻条文病毒NSVc2蛋白信号肽预测蛋白质序列分析SignalP3.0

Server主页NSVc2序列输出结果:Cscore:剪切位点分值Sscore:信号肽分值Yscore:综合剪切位点分值综合两种算法,NSVc2含有信号肽序列,为MHFKSYFIYTTIFNMAWG,说明NSVc2蛋白可能在跨膜运输中起信号识别作用剪切位点位于第18~19位氨基酸,表明成熟肽始于第18位氨基酸第23页,讲稿共70页,2023年5月2日,星期三Coil区分析卷曲螺旋(coiledcoil)是蛋白质中由2~7条α螺旋链缠绕成麻花状结构的总称。卷曲螺旋是控制蛋白质寡聚化的元件,含有卷曲螺旋结构的蛋白质主要是一些转录因子、骨架蛋白、动力蛋白、膜蛋白、酶等,在机体内执行着分子识别、代谢调控、细胞分化、肌肉收缩、膜通道等生物学功能。七肽重复区(heptadrepeat,HR)是典型的卷曲螺旋结构类型之一,由多个七肽单元连接而成的重复序列,每个重复序列中的7个氨基酸残基依次用a-b-c-d-e-f-g表示。蛋白质序列分析第24页,讲稿共70页,2023年5月2日,星期三a、d位多为非极性疏水氨基酸,位于卷曲螺旋结构的内侧;e、g多为极性带电氨基酸,与a、d位残基相互作用形成疏水核心的外侧。a、d、e、g位置上的氨基酸对于整个卷曲螺旋结构的稳定性及特异性具有重要作用。COILSServer:/software/COILS_form.html根据卷曲螺旋蛋白结构数据库和包含球状蛋白序列的PDB次级数据库,可计算出目的序列形成卷曲螺旋的概率。使用COILSServer对RGDVP2蛋白卷曲螺旋预测分析。蛋白质序列分析第25页,讲稿共70页,2023年5月2日,星期三已有文献研究表明,RDV的P2蛋白含有一个N端的疏水肽、两个七肽重复区和一个跨膜区。RGDVP2蛋白与RDVP2蛋白在病毒粒体中位置相同、大小相似,具有高度保守的氨基酸序列和相似的一级结构,表明两者可能具有相似的结构。使用COILSServer分析RGDVP2是否由七肽重复区。COILSServer网页MTK:根据肌球蛋白、原肌球蛋白和角蛋白得到的打分矩阵MTIDK:由肌球蛋白、原肌球蛋白、中间纤维类蛋白、桥立蛋白和角蛋白得到的打分矩阵蛋白质序列分析第26页,讲稿共70页,2023年5月2日,星期三COILS_20424_6595.txt第27页,讲稿共70页,2023年5月2日,星期三亚细胞定位亚细胞定位与蛋白质的功能存在着密切的联系通过氨基酸组成进行亚细胞定位主要基于如下原理:不同的细胞器多具不同的理化环境,根据蛋白质的结构及表面理化特征选择性容纳蛋白蛋白质表面直接暴露于细胞器环境中,它由序列折叠过程决定,而后者取决于氨基酸组成蛋白质序列分析第28页,讲稿共70页,2023年5月2日,星期三亚细胞定位预测步骤:抽取一个高质量的亚细胞定位数据集并分为训练集和测试集从选取的蛋白质数据中抽取出特征信息选择合适的算法预测用测试数据集对预测结果进行评价蛋白质序列分析第29页,讲稿共70页,2023年5月2日,星期三常用的亚细胞定位在线工具蛋白质序列分析名称网址TargetPhttp://www.cbs.dtu.dk/services/TargetP/PSORTIIhttp://psort.nibb.ac.jpSubLoc/SubLoc/MultiLocrmatik.uni-tuebingen.de/Services/MultiLoc/GNBSL/webtools/GNBSL/index.htm第30页,讲稿共70页,2023年5月2日,星期三使用TargetP对RSVNSVc2蛋白进行亚细胞定位TargetP是预测真核蛋白亚细胞定位软件,主要基于叶绿体转运肽(chloroplasttransitpeptide,cTP)、线粒体导肽(mitochondrialtargetingpeptide,mTP)及分泌通路信号肽(secretorypathwaysignalpeptide,SP)的N端序列进行预测预测结果:蛋白NSvc2的分泌途径为“-”型,即定位到其他细胞器。蛋白质序列分析第31页,讲稿共70页,2023年5月2日,星期三二、蛋白质结构域及motif搜索结构域分析Motif搜索蛋白质序列分析第32页,讲稿共70页,2023年5月2日,星期三结构域分析结构域(structuredomain)是在蛋白质三级结构中介于二级和三级结构之间的可以明显区分但又相对独立的折叠单元,每个结构域自身形成紧实的三维结构,可以独立存在或折叠,但结构域与结构域之间关系较为松散。结构域通常由25~300个氨基酸组成,不同蛋白质结构域数目或同一蛋白质结构域相似度差异较大蛋白质序列分析第33页,讲稿共70页,2023年5月2日,星期三常见的结构域主要有5种:全平行结构域反平行结构域α+β结构域α/β结构域其他折叠类型结构域是蛋白质的功能、结构和进化单元,结构域分析对于蛋白质结构的分类和预测有着重要作用。蛋白质序列分析第34页,讲稿共70页,2023年5月2日,星期三结构域分析工具及数据库蛋白质序列分析工具网址说明InterProScanhttp://www.ebi.ac.uk/InterProScan/蛋白质结构域和功能位点分析SMARThttp://smart.embl-heidelberg.de/蛋白质结构域分析数据库网址说明Pfamhttp://pfam.sanger.ac.uk/蛋白质结构域数据库ProDomhttp://prodom.prabi.fr/prodom/current/html/form.php蛋白质结构域数据库第35页,讲稿共70页,2023年5月2日,星期三使用SMART(SimpleMolecularArchitectureResearchTool)分析RGDVP8蛋白的结构功能域。两种搜索模式:常规模式和基因组模式在常规模式下粘贴RGDVP8序列,选PFAMdomain蛋白质序列分析第36页,讲稿共70页,2023年5月2日,星期三预测结果:第1~426位是个高度保守的结构功能域Phytoero_P8,该结构域由多个植物呼肠孤病毒属外层衣壳蛋白P8序列组成,具有结构分子活性蛋白质序列分析点击第37页,讲稿共70页,2023年5月2日,星期三第38页,讲稿共70页,2023年5月2日,星期三motif搜索motif(模体)是序列中局部的保守区域。motif通常由2、3个二级结构单位组成,二级结构一般为α螺旋、β折叠和环(loop)motif作为结构域中的亚单位,表现结构域的各种生物学功能。有几十个motif类,详见:/wiki/Category:Protein_structural_motifs/蛋白质序列分析第39页,讲稿共70页,2023年5月2日,星期三几种motif空间结构图蛋白质序列分析亮氨酸拉链(Leucinezipper)Aleucinezipper,akaleucinescissors,isacommonthree-dimensionalstructuralmotifinproteins.ThesemotifsareusuallyfoundaspartofaDNA-bindingdomaininvarioustranscriptionfactors,andarethereforeinvolvedinregulatinggeneexpression.Leucinezippersarefoundinbotheukaryoticandprokaryoticregulatoryproteins,butaremainlyafeatureofeukaryotes.第40页,讲稿共70页,2023年5月2日,星期三几种motif空间结构图蛋白质序列分析螺旋-转角-螺旋(Helix-turn-helix)Inproteins,thehelix-turn-helix(HTH)isamajorstructuralmotifcapableofbindingDNA.Itiscomposedoftwoαhelicesjoinedbyashortstrandofaminoacidsandisfoundinmanyproteinsthatregulategeneexpression第41页,讲稿共70页,2023年5月2日,星期三几种motif空间结构图蛋白质序列分析锌指(Zincfinger)CartoonrepresentationoftheCys2His2zincfingermotif,consistingofanαhelixandanantiparallelβsheet.Thezincion(green)iscoordinatedbytwohistidineresiduesandtwocysteineresidues第42页,讲稿共70页,2023年5月2日,星期三几种motif空间结构图蛋白质序列分析罗斯曼折叠(Rossmannfold)TheRossmannfoldisaproteinstructuralmotiffoundinproteinsthatbindnucleotides,especiallythecofactorNAD.Thestructurewithtworepeatsiscomposedofsixparallelbetastrandslinkedtotwopairsofalphahelicesinthetopologicalorderbeta-alpha-beta-alpha-beta.第43页,讲稿共70页,2023年5月2日,星期三常见的motif数据库蛋白质序列分析数据库网址说明PROSITE/prosite基于一般的正则表达式PROFILEhttp://www.biochem.ucl.ac.uk/bsm/dbbrowser/jj/pfscan2.html基于序列谱的数据库PRINTShttp://www.bioinf.man.ac.uk/Dbbrowser/bioactivity/protein2frm.html基于蛋白质指纹技术BLOCKS基于蛋白质序列模块Pfamhttp://www.sanger.ac.uk/software/Pfam基于隐马尔可夫模型第44页,讲稿共70页,2023年5月2日,星期三Motif搜索方法有两种:序列模式(Pattern)和序列特征谱(Profile)序列模式方法直接搜索关键的几个保守残基,如L-x(6)-L-x(6)-L-x(6)-L(x表示任意的氨基酸)序列特征谱搜索是基于蛋白质序列多重比对结果,考虑了保守氨基酸在相应位置上的权重,可以检测到进化距离较远蛋白质的motif。使用PROSITE数据库对RGDVP2蛋白进行motif搜索点击ScanProsite链接,进行高级搜索蛋白质序列分析第45页,讲稿共70页,2023年5月2日,星期三参数设置:排除高频率出现的motif:选中后,N-糖基化位点、酪蛋白激酶II磷酸化位点等33种常见motif序列模式将被排除在外。不进行序列特征谱搜索搜索自定义的motif,这里设置序列模式为:[RK]-x(2,3)-[DE]-x(2,3)-Y输出结果:RGDVP8蛋白中有1处与指定的序列模式相匹配,为142~148位的氨基酸序列:

KAYDIPY蛋白质序列分析第46页,讲稿共70页,2023年5月2日,星期三三、空间结构预测蛋白质的二级结构预测蛋白质的三级结构预测蛋白质结构预测方法评价蛋白质序列分析第47页,讲稿共70页,2023年5月2日,星期三蛋白质的二级结构预测蛋白质的二级结构是指多肽链借助于氢键沿一维方向排列成具有周期性结构的构象,主要有α螺旋β折叠β转角无规则卷曲蛋白质序列分析第48页,讲稿共70页,2023年5月2日,星期三-螺旋(1)螺旋走向,稳定以氢键连接,氢键与轴平行。(2)侧基R伸向螺旋外侧。(3)棒状结构,高度压缩,紧密排列。(4)规律排列(5)由1条充分伸展的肽链的肽键平面折叠成的右手螺旋。(6)每隔3.6个氨基酸残基螺旋上升一圈,螺距0.54nm。(7)1个螺圈内有13个原子。Hydrogenbonds(yellowdots)stabilizinganalpha-helix第49页,讲稿共70页,2023年5月2日,星期三

-折叠第50页,讲稿共70页,2023年5月2日,星期三两种-折叠方式反平行:肽链的N端不处于同一端,氢键与肽链走向垂直。如:丝心蛋白。第51页,讲稿共70页,2023年5月2日,星期三平行:所有肽链的N端处于同一端,氢键不与肽链走向垂直。如:β-角蛋白。第52页,讲稿共70页,2023年5月2日,星期三4种二级结构第53页,讲稿共70页,2023年5月2日,星期三蛋白质二级结构预测网络资源蛋白质序列分析名称网址APSSPhttp://imtech.res.in/raghava/apssp/CDM/cdm/PSIPREDhttp://bioinf.cs.ucl.ac.uk/psipred/psiform.htmlFORTERhttp://distill.ucd.ie/porter/PredictproteinSSpro/第54页,讲稿共70页,2023年5月2日,星期三使用SSPro服务器预测RGDVPns10蛋白质二级结构SSPro使用神经网络和同源分析混合进行蛋白质二级结构预测Email接收的预测结果:双行显示,上行为目的序列,下行为对应的二级结构,其中C表示Coil(无规则卷曲),H表示Helix(α螺旋),E表示Extented(β折叠)蛋白质序列分析蛋白质二级结构预测实例1第55页,讲稿共70页,2023年5月2日,星期三使用PORTER服务器预测HCVE蛋白质二级结构由于膜蛋白难以纯化,丙型肝炎病毒膜蛋白的三维至今未知,预测其膜蛋白的二级结构有利于三级结构的模建和功能研究本例使用丙型肝炎病毒中国湖北株(GI:149389442)Email接收的预测结果:双行显示,上行为目的序列,下行为对应的二级结构,其中C表示Coil(无规则卷曲),H表示Helix(α螺旋),E表示Extented(β折叠)蛋白质序列分析蛋白质二级结构预测实例2第56页,讲稿共70页,2023年5月2日,星期三蛋白质的三级结构预测蛋白质的生物学功能很大程度取决于蛋白质的空间结构通过X射线晶体衍射、NMR核磁共振等物理方法测定蛋白质的三级结构以及通过生化方法研究蛋白质的功能,成本高、速度慢、效率低,无法满足蛋白质序列飞速增长的需要生物信息学方法可对一个未知结构的蛋白质序列作出分析,预测其空间结构蛋白质三级结构预测方法:同源模建、折叠识别和从头预测蛋白质序列分析第57页,讲稿共70页,2023年5月2日,星期三同源模建同源模建(homologymodeling)是目前较为成功的而且比较实用的蛋白质结构预测方法同源模建的前提是已知一个或多个同源蛋白质的结构。当两个蛋白质的序列相似性大于35%,一般认为它们具有相同的三维结构。同源模建的四个步骤:搜索与目的蛋白序列相匹配的模板模建目的蛋白结构保守区的主链、结构变异区的主链目的蛋白侧链的模建及其优化对模建的结构进行优化和评估蛋白质序列分析第58页,讲稿共70页,2023年5月2日,星期三同源建模法分析步骤:多序列比对与已有晶体结构的蛋白质序列比对确定是否有可以使用的模板序列相似度>25%序列相似度<25%,结合功能,蛋白质一级序列、二级结构或结构域信息构建三维模型三维模型准确性检验Whatcheck程序Ramachandranplot计算检验手工调整多序列比对,重新拟和,构建新的模型*蛋白质序列分析第59页,讲稿共70页,2023年5月2日,星期三RanmachandranPlots是蛋白质主链φ角和ψ角散点图,黄色区域为最理想的,蓝色区域外为不合理的区域。若有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论