蛋白质抗原的表位分析_第1页
蛋白质抗原的表位分析_第2页
蛋白质抗原的表位分析_第3页
蛋白质抗原的表位分析_第4页
蛋白质抗原的表位分析_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、有鉴定表位的相关技术和文献。也有一些表位预测软件。 一般来说,目前研究主要集中在线性表位上,而构象表位的预测和鉴定方法目前不 是很成熟。找到一个帖子,楼主可以参考:1、B 细胞表位预测对于多种免疫学研究是必不可少的。针对不同的蛋白,应选择不 同的方法。一般来说,蛋白质的 C 端具有较好的亲水性、表面可及性和柔性,所以 是很好的抗原决定簇区域。本课题选用的蛋白质C-末端序列标签都是唯一的、或是其家族中的几个成员所共有的。在人蛋白质中,约81%的蛋白质其C末端的5个氨基酸残基的小肽是该蛋白质所特有的,制备针对蛋白质C末端小肽的抗体,常常能得到特异性识别该全蛋白的抗体。另外,蛋白的二级结构是 B 细

2、胞表位计算机预测 的重要参数之一,B转角为凸出结构,多出现在蛋白质抗原表面,有利于与抗体结 合,较可能成为抗原表位。而 a螺旋和B折叠结构规则不易变形,较难结合抗体, 一般不作为抗原表位。 含有 5 个以上的氨基酸残基的转角又常称为环 (loop) 。以往的 研究表明, 蛋白表面的 loop 区可能为功能性抗体的识别位点, 特异性好, 可及性强。 本课题选用的 HPO、 G-CSF、 HSA 空间结构已明确,所以直接选择 loop 区或无规 卷曲作为 B 细胞表位。举例:人Pif1基因编码至少两种蛋白亚型,分子量分别为74kDa和80kDa,与酵母具有高度的同源性,a型和B型Pif1只有C末端

3、不同20,其余部分完全相同,并且二者 的C末端在蛋白数据库中都是唯一的,选择a型和B型的C末端作为B细胞表位,既满足特异性的需要,也能区分亚型。GPAA1 是一种跨膜蛋白,原核表达非常困难,形成包涵体,且包涵体难以溶解和复 性。对这一类型的蛋白,非常适合选择其特有的 B 细胞表位免疫动物,来最终制备 识别全蛋白质的抗体。 ABCpred 是基于人工神经网络模型的线性 B 细胞表位预测工 具,该系统检验了源于 Bcipep数据库的700个非冗余B细胞表位和源于Swiss-Prot 数据库的 700 个长度为 1020 个氨基酸的随机选择多肽,准确率近 66%。 Bepipred 结合隐马尔科夫模

4、型和亲水性参数评分预测线性 B 细胞表位, AROC 评分达到 0.671。将两种预测方法得到的预测结果进行比较, 其共有的预测表位是真正 B 细胞 表位的几率更大,如果能进一步结合蛋白质二级结构预测结果,就可以选出可信度 更高的 B 细胞表位。 如何选择有效的 B 细胞表位是能否实现无完整蛋白质抗原条件 下抗体制备的关键。2、对于 B 细胞表位的选择,对于已有空间结构信息的蛋白质抗原,直接选择蛋白 分子表面的 loop 区或无规卷曲区域的小肽序列作为候选 B 细胞表位;对于缺乏空间 结构信息的蛋白质抗原,需要根据蛋白质抗原的特点具体分析。若蛋白质抗原C末端的序列亲水性好,可以选择C末端的61

5、0个氨基酸的序列作为候选 B细胞表位, 并且最好该序列为该蛋白质所特有;也可采用 B 细胞表位预测程序进行分析,选择 不同程序预测的共有 B 细胞表位;对于同源性很高的家族蛋白,根据序列比对结果 选择差异较大的区域,并且所选序列应该符合 B 细胞表位的特征。基于以上原则, 本实验选择了 10个蛋白的 14 个表位,并对其中的 12 个表位进行了验证。3、对于 B 细胞表位的选择,(1) 对于空间结构已知的蛋白质,直接选择蛋白分子表面的loop 区或无规卷曲区 域的小肽序列。(2)对于空间结构未知的蛋白质,可采用以下策略进行选择:A :若蛋白质C末端序列的亲水性好,可以选择 C末端的610氨基酸

6、的序列作为 候选 B 细胞表位,最好该序列为该蛋白质所特有。 可采用 SIB BLASTNetwork Service(http:/www.expasy.ch/tools/blast/)的 BLAST 软件进行比对,数据库选择homosapiens;B:采用B细胞表位预测程序 ABCpred和BepiPred等进行表位预测,选择不同程序 预测的共有 B 细胞表位;C:对于同源性很高的蛋白质,首先根据序列比对结果选择差异较大的区段,并且 所选序列应该符合 B 细胞表位的特征。4、 二级结构预测 分别应用 EX-PASY 服务器(http: /www. expasy. org/tools)上的 G

7、OR44>、 HNN (Hierarchical Neural Network meth-od) 、 SOPMA、 nnPredictUniversity ofCalifornia atSa nFran cisco (UCSF)> 等方法。亲水性、柔韧性、表面可能性和抗原表位预测应用 DNAstar 软件的子程序Protean采用Hopp-Woods禾口 Kyte-Doolittle方案预测氨基酸的亲水性 5, 6>,采用 Karplus-Schultz和Emini方案预测柔韧性及表面可能性7, 8>,采用Jameson-Wolf方案 9>和吴氏抗原指数法 10&

8、gt;预测潜在的 B 细胞抗原表位。5、对获取序列的生物信息学处理分析使用 DNASTAR 软件分析获取的序列 ,结合 NCBI 上的 BLAST 寻找最匹配的短 序列。用全部和部分肽序列查询各国专利数据库 :http: /appft1. uspto. gov/netahtml/PTO/search-adv. ht/http: /www. freepatentsonline. com /5194592. htm /http: /www. stcsm. gov. cn/resource/data/zhuanl.i asp#1使用蛋白质在线分析工具分析多肽的疏水性、PI值、稳定性:http: /w

9、ww. expasy. org/http: /www. rcsb. org/pdb/cgi/explore. cg?i pdbId=1fi6http: /www. rcsb. org/pdb/search/searchSequence. dohttp: /www. expasy. org/sitemap. htmlhttp: /www. expasy. org/tools/#translatehttp: /www. expasy. org/tools/blast/常用数据库和预测工具:名称 网址 说明ABCpred http:/www.imtech.res.in/raghava/abcpred

10、 人工神经网络线性 B 细胞表位预 测工具AgAbDb http:/202.4 1.70.51:8080/agabdb2/ 抗原-抗体共结晶结构的分子相互作用数 据库AntiJen http:/www.jenner.ac.uk/AntiJen B 细胞表位定量结合数据库Bcipep http:/www.imtech.res.in/raghava/bcipep/ B 细胞表位数据库Bepipred http:/www.cbs.dtu.dk/services/BepiPred 基于序列的线性表位预测工具 CEP http:/bioinfo.ernet.in/cep.htm 基于结构的连续性和非连续

11、性表位预测工具 DiscoTope http:/www.cbs.dtu.dk/services/DiscoTope 基于序列 /结构的非连续性表位 预测工具Epitome /services/epitome 抗原-抗体相互作用残基数据库 HIV database /content/immunology HIV 免疫表位数据库IEDB T 细胞和 B 细胞表位数据库含阴性数据IEDB B-cell /t

12、ools/bcell/iedb_input 基于序列的线性表 位预测工具epitope tools 6、B 细胞表位预测的方法及应用 线性表位的预测方法B 细胞表位的预测方法主要集中于线性表位,在二十世纪七、八十年代发展起来的 大量的预测B细胞表位的算法都是基于蛋白质序列。这些算法包括:蛋白质的亲 水性算法 (Hydrophilicity) :认为蛋白质各氨基酸残基可分为亲水残基和疏水残基两 类。在机体内,疏水性残基一般被埋在蛋白内部,而亲水性残基位于蛋白质表面, 因此,蛋白的亲水部位与蛋白抗原表位有着密切的联系。 Hopp-Woods(Hoop TP et al.,1981)算法为最常用的。

13、可及性算法(Accessibility):常用的有Janin可及性参数, 即指蛋白质抗原中氨基酸残基被溶剂分子接触的可能性(Rudolph R et al.,1990)。它反映了蛋白质抗原各个氨基酸残基的分布情况。蛋白质可塑性算法(Flexibility):此算法认为蛋白质抗原构象的多肽链骨架具有一定程度的活动性,活动性强的氨基酸 残基即可塑性大,易形成抗原表位(Karplus PA et al.,1985)。蛋白质二级结构预测 算法(Secondary structure):该算法认为蛋白质二级结构与蛋白质表位的分布关系密 切。a螺旋、B折叠化学键键能比较高,形态固定,常处于蛋白质内部,难以

14、与抗体 嵌合,而B转角和无规则卷曲多处于蛋白质的表面,结构松散,易展示在蛋白质表 面,有利于与抗体嵌合,成为抗原表位的可能性大(来鲁华,1993)。 蛋白质抗原性算法(Antigenicity) : Welling(Welling GW.,1985)通过对20个已研究得很透的蛋白质的 69 个连续位点的 606个氨基酸统计分析, 用各氨基酸残基在已知 B 细胞表位中出现 的百分率与其通常在蛋白质中出现的百分率比值的对数建立了抗原性刻度,并以此 计算蛋白中各亚序列的抗原性。 这些方法的代表软件有 PEOPLE(Alix AJ et al.,1999)、 PREDITOP(Pellequer JL

15、 et al.,1993)、 BEPITOPE(Odorico M et al.,2003)、 Bcepred(Saha S et al.,2004)等。但是最近 Blythe 及 Flower(Blythe MJ et al.,2005)对氨基酸的性质与 线性表位的关系做了一个评估,结果表明基于氨基酸序列信息来预测线性表位,即 使很好的结合了氨基酸的各种性质,其预测结果仅略强于随机预测。近年来,一些 应用隐形马尔可夫模型(HMM)、人工神经网络(ANN)、支持向量机算法(SVM)及其 他技术的机器研究方法(Po no mare nko JV et al.,2007)已经被引入来预测 B细胞表

16、位, 取得了较好的结果。代表软件有 ABCpred(Saha S et al.,2006)、 BepiPred(Larsen JEet al.,2006)、APP(Chen J et al.,2007等。ABCpred采用人工神经网络来预测线性表位, 从Bcipep和SwissProt数据库中提取非冗余的表位肽和非表位肽作为训练集,采用 5-折交叉验证,预测敏感性约为 67%,特异性约为 64%。 BepiPred 结合氨基酸的性 质(亲水性、柔韧性、可及性、极性、暴露表面、转角)和隐形马尔可夫模型来预 测线性表位, 预测结果表明, 同那些仅依赖于氨基酸性质的预测方法相比, BepiPred

17、预测结果的准确性有一定程度的提高。Chen et al.(2007)发现氨基酸通常成对出现在抗原表位的频率要比其出现在非表位肽段的频率高,基于此,并联合支持向量机算 法建立了 APP方法。应用此方法在872个表位肽和872个非表位肽数据集中,采用 5-折交叉验证,预测准确度为 71%。 Yasser EL-Manzalawy(EL-Manzalawy Y et al.,2008) 等采用同一数据集对这三种方法进行比较, 结果表明 ABCpred 预测表位的准确性略 高于 BepiPred 及 APP。构象表位的预测方法目前,绝大多数 B 细胞表位预测方法都是基于蛋白质的一级或二级结构的,但这些

18、方法只能用来预测由连续的氨基酸残基构成的线性表位,而基 于蛋白质的三级结构来预测构象表位的方法比较少,这是因为各种抗原的构象表位 可获得的数据要远远少于线性表位,并且到目前为止,几乎没有哪个抗原的所有的 表位都能够彻底的研究清楚(HasteAndersen P et al.,2006基于蛋白质三级结构来预 测 构象 表 位 的 方法 CEP(Kulkarni-Kale U et al.,2005)(Conformational Epitope Prediction):这是第一个以抗原蛋白的三级结构PDB文件作为输入条件,以构象性表位预测为主要目的的网上免费服务软件。它提供了一个预测构象表位的

19、web界面,这种方法除了能够预测构象表位,同时也能预测线性表位。它主要根据氨基酸残基 的 溶剂可及性及空间距离截值来预测 表位 , 其公布的 预测 精度达 75%。 DiscoTope(Haste An dersen P et al.,2006:)是通过蛋白质三级结构数据来预测构象表位 的一种新方法,这种方法通过对 X 射线晶体衍射确定的 76 个抗原抗体复合物所组 成的构象表位数据集进行大量统计度量、空间特征分析和表面可及性计算,对 B 细 胞构象性表位进行预测,最终对组成蛋白序列的每个氨基酸打分,通过分值来反映 某一氨基酸成为表位的可能性,并提供了阈值来确定组成表位的氨基酸残基。预测 蛋白

20、质与蛋白质相互作用位点的方法除以上两种方法之外,还有最近发展起来的一 些预测蛋白质与蛋白质相互作用位点的方法。 由于抗原抗体之间的相互作用属于蛋白质与蛋白质之间相互作用中的一种,因此, 可以参这些方法来预测 B 细胞表位。分子对接:主要用来研究分子间的相互作用与 识别,进而预测复合物结构。常用的分子对接软件有 ZDOCK(Chen R et al.,2003) 、 DOT(Shoichet BK et al.,1991)、DOCK(Mandell JG et al.,2001)、ClusPro(Comeau SR et al.,2004)等。其中ClusPro是一个提供网上服务的分子对接软件,

21、其能够根据形状互 补快速的筛选 ZDOCK 和 DOT 程序产生的对接结果, 并对对接结果聚类, 根据聚类 情况对对接结果打分, 最终返回 10 个得分最高的对接结果, 再根据这些对接结果来 确定蛋 白 质相互作用的 位点。 PPI-Pred(Bradford JR et al.,2005)(protein-protein in terface predicti on)将支持向量机的方法同曲面分析结合在一起预测蛋白质相互作 用 位 点 。 ProMate(Neuvirth H et al.,2004)(Predicting the location of potential prote in-prote in binding sitesfor unbound prote ins)是将一些蛋白质相互作用界面的重要 性质综合起来预测蛋白质相互作用位点。这些性质包括:结合位点通常偏向位于B片层及非结构的链;芳香族氨基酸的侧链常会参与蛋白质与蛋白质的相互作用;疏 水氨基酸和极性氨基酸常聚集在蛋白质与蛋白质相互作用的界面;以及在晶体结构 中结合位点的周围有更多的水分子与之结合。Ponomarenko和Bourne采用以上几种方法预测构象表位并使用同一评估体系对其进

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论