蛋白质结构及功能实验课_第1页
蛋白质结构及功能实验课_第2页
蛋白质结构及功能实验课_第3页
蛋白质结构及功能实验课_第4页
蛋白质结构及功能实验课_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 UniProKB界面简介 实例: 对GFAP人胶质纤维酸性蛋白人胶质纤维酸性蛋白 (glial fibrillary acidic protein)glial fibrillary acidic protein)进行结构与功能预测 网址网址: 点击Resource A.Z点击UniPro或直接点UniPro输入 GFAP选择物种:人点击进入命名与起源命名与起源蛋白质属性蛋白质属性注释注释 OMIMOMIM链接链接 序列相似性家族序列相似性家族细胞组分 编码序列多样性 翻译后修饰翻译后修饰 完整的完整的GOGO分析分析基因本体(Gene Ontology,GO)数据

2、库旨在建立注释基因和蛋白质知识的标准词汇体系,涵盖基因细胞组分(cellular component)、分子功能(molecular function)、生物学过程(biological process)3方面信息。ISOFORM ISOFORM 比对信息比对信息序列注释(特征)序列注释(特征)多态性,多态性,SNP位点位点三维结构分析三维结构分析蛋白与蛋白相互作用数据库蛋白与蛋白相互作用数据库翻译后修饰数据库KEGG日本京都基因和基因组百科全书全球影响力最大的代谢数据库之一,它的生物学途径(pathway)数据库有细分成代谢(metabolism)、遗传信息处理(genetic inform

3、ation processing)、环境信息处理(environmental information processing)细胞代谢(cellular process)和人类疾病(human disease)5个方面P14136无代谢通路注释牛视紫红质蛋白(Unipro:P02699)代谢通路图 二、蛋白质一级结构分析二、蛋白质一级结构分析 2.1 Blast :序列比对,得到同源蛋白BLAST是基本局部比对搜索工具(basic local alignment search tool)的缩写。是对生物不同蛋白质的氨基酸序列或不同的基因的DNA序列极性比对。并从相应数据库中找到相同或相似序列。同

4、源性同源性(homology): 指从一些数据中推断出的两个基因或蛋白质序列具而共同祖先的结论,属于质的判断质的判断。说A和B的同源性为80都是不科学的。相似性相似性(similarity): 是指一种很直接的数量关系数量关系。比如说,A序列和B序列的相似性是80,或者4/5。序列的相似性和序列的同源性有一定的关系,一般来说序序列间的相似性越高的话,它们是同源序列的可能性就更高列间的相似性越高的话,它们是同源序列的可能性就更高,所以经常可以通过序列的相似性来推测序列是否同源。正因为存在这样的关系,很多时候对序列的相似性和同源性就没有做很明显的区分,造成经常等价混用两个名词。所以有出现A序列和B

5、序列的同源性为80一说。也可以直接输入/blast/ProParam是计算氨基酸理化参数常用的工具,提供计算蛋白质的分子量、理论等电点、氨基酸组成、原子组成、消光系数(extinction coefficient)、半衰期、不稳定系数、脂肪系数和总平均疏水性(GRAVY)等。2.2 ProtParam:蛋白质理化性质分析消光系数反映了蛋白在特定波长下吸收可见光或不可见光的能力,可用来测蛋白浓度不稳定系数预测对应蛋白质在试验中稳定性。 小于40时,预测蛋白稳定 大于40时,预测蛋白不稳定脂肪系数计算球状蛋白脂肪族氨基酸侧链所占相对体积,反映了蛋白质的热稳定

6、性。或直接输入/protparam/蛋白质的疏水性预测可以根据蛋白质的疏水性预测可以根据gravygravy值来预测。值来预测。GRAVYGRAVY值的范围在值的范围在2 2 与与- -2 2之间,正值表明此蛋白为疏水性蛋白,负值表明为亲水蛋白。疏水性之间,正值表明此蛋白为疏水性蛋白,负值表明为亲水蛋白。疏水性信息可被用于跨膜螺旋的预测,信息可被用于跨膜螺旋的预测, 2.3 ProtScale 蛋白质亲疏水性分析蛋白质亲疏水性氨基酸的组成是蛋白质折叠的主要驱动力。蛋白质折叠时会形成疏水内核和亲水表面,同时在潜在跨膜区出现高疏水值区域,据此可以测定跨膜螺旋

7、等二级结构和蛋白质表面氨基酸的分布。或直接输入/protscale/ GFAP亲疏水性分布图,横坐标为序列位置,纵坐标为氨基酸的标度值。Hphob.kyte&Doolittle 标度(default)定义疏水性氨基酸较高的打分值(0值表示疏水性,0值表示亲水性)。 2.4 TMPred 跨膜区结构预测 蛋白质疏水区域可作为评判潜在跨膜区的依据,但预测得到的疏水区并不一定就是跨膜区域。对于多次的跨膜区,则以亲水残基区和较长的疏水残基区交替出现;膜内外交界处多出现色氨酸,酪氨酸和苯丙氨酸;胞外端末端多出现Asp、Ser、Pro;胞内末端多出现Lys和Arg。

8、 TMpred TMpred为EMBnet 开发的在线分析蛋白质跨膜区软件. /software/TMPRED_form.html 它基于对TMbase数据库的统计分析来预测蛋白质跨膜区和跨膜方向。也可用TMHMM分预测P14136是否存在跨膜区 http:/www.cbs.dtu.dk/services/TMHMM-2.0/P14136:GFAPP14136预测结果牛视紫红质蛋白(Swiss-Prot/TrEMBL AC:P02699)存在7个跨膜区,其跨膜区预测位置和TMpred预测结果基本吻合。 TMpred TMpred分析预测结果分析预测

9、结果 SignalP:预测蛋白质序列中信号肽的剪切位点 http:/www.cbs.dtu.dk/services/SignalP/信号肽作用:引导新合成的蛋白质进入内质网腔而信号肽序列则在信号肽酶的作用下被切除 。信号肽结构:信号肽位于分泌蛋白的N端。一般由1530个氨基酸组成。包括三个区:一个带正电的N末端,称为碱性氨基末端;一个中间疏水序列以中性氨基酸为主,它是信号肽的主要功能区;一个较长的带负电荷的C末端,含小分子氨基酸,是信号序列切割位点也称加工区。SignalP的功能是预测给定的氨基酸序列中是否存在潜在的信号肽剪切位点及其所在,原核生物和真核生物都可以进行预测。 预测结果 三、蛋白

10、质二级结构分析蛋白质二级结构是指氨基酸残基形成的-helix、-sheet、coil和motif等组件常用软件:PSIPRED http:/bioinf.cs.ucl.ac.uk/psipred/KEGG数据库中对P14136 motif 分析(可以直接从unipro找kegg链接)四、蛋白质结构域与功能分析结构域(domain)是蛋白质序列功能、结构和进化的单元,通常由50-300个氨基酸组成,有空间构象特异性。4.1 Pfam是大规模收集蛋白质家族的数据库,网址为http:/pfam.sanger.ac.uk4.2 Prosite4.2 Prosite(http:/prosite.expa

11、/)/)Protsite数据库是基于对蛋白质家族中同源序列多重序列比对得到的保守性区域,这样区域通常与生物学功能有关,例如酶的活性位点、配体或金属结合位点等。Prosite数据库实际上是蛋白质序列功能位点数据库。通过对Prosite数据库的搜索,可判断该序列包含什么样的功能位点,从而推测其可能属于哪一个蛋白质家族。 理论模式IV-K-TACI-Y-RKH-E-LM-L-DE I - A - T -Y- R - K L -L- E 实际序列实际序列Examples : AC-x-V-x(4)-EDThis pattern is tran

12、slated as: Ala or Cys-any-Val-any-any-any-any-any but Glu or Asp同源建模是蛋白质三维预测的主要方法。对蛋白质数据库PDB分析可以得到这样的结论:任何一对蛋白质,如果两者的序列等同部分超过30%(序列比对长度大于80),则它们具有相似的三维结构,即两个蛋白质的基本折叠相同,只是在非螺旋和非折叠区域的一些细节部分有所不同。这是同源建模方法预测蛋白质结构方面成功的保证。5、蛋白质三维结构分析/建模部分结果Anolea:以原子经验平均力势计算每个氨基酸和周围环境的相互作用能量,能量越高

13、越不稳定(为正值,红色表示),反之亦然(为负值,绿色表示)。Gromos:反映氨基酸位点的能量,同样低能量对结构稳定性有利。模板搜索结果:同源建模核心是参考模板蛋白的结构信息来构建未知蛋白的结构,合适的模板增加预测结构的可靠性 总结:总结:GFAPGFAP为一中等分子量的酸性蛋白,分子中含有较多的为一中等分子量的酸性蛋白,分子中含有较多的GluGlu,每个,每个分子大约带分子大约带9 9个负电荷。该蛋白无跨膜区域,并且亲水,不是膜蛋白。个负电荷。该蛋白无跨膜区域,并且亲水,不是膜蛋白。GFAPGFAP是一种结构蛋白,属于是一种结构蛋白,属于IFIF家族,主要参与中间纤维的构成,在神家族,主要参

14、与中间纤维的构成,在神经元内环境的维持和血脑屏障中起着重要作用。到目前为止,该蛋白经元内环境的维持和血脑屏障中起着重要作用。到目前为止,该蛋白的空间结构尚未完全解析出来,有待于进一步研究的空间结构尚未完全解析出来,有待于进一步研究。作业 MELAALCRWGLLLALLPPGAASTQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQGNL ELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNG DPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQL

15、A LTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCARCKGPLPTDCCHEQC AAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACP YNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSAN IQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLP DLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHL

16、CFVHTV PWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQEC VEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVARC PSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSIISAVVG ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQMRILKETEL RKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILD

17、EAYVMAGVGSP YVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMSYLEDVR LVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMALESILRRRFT HQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDVYMIMVKCWM IDSECRPRFRELVSEFSRMARDPQRFVVIQNEDLGPASPLDSTFYRSLLEDDDMGDLVDA EEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPSEEEAPRSPLAPSEG AGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSETDGYVAPLTCSPQPEYV N

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论