人Latexin基因及蛋白质的生物信息学分析_王兆松_第1页
人Latexin基因及蛋白质的生物信息学分析_王兆松_第2页
人Latexin基因及蛋白质的生物信息学分析_王兆松_第3页
人Latexin基因及蛋白质的生物信息学分析_王兆松_第4页
人Latexin基因及蛋白质的生物信息学分析_王兆松_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第20卷第2期生命科学研究Vol.20 No.2 2016 年 4 月Life Science Research Apr. 2016DOI:10.16605/ki.1007-7847.2016.02.006 人Latexin基因及蛋白质的生物信息学分析王兆松,赵文铖,周蒙,魏梅,董秋萍,许世磊*(天津医科大学肿瘤医院国家肿瘤临床医学研究中心天津市肿瘤防治重点实验室,中国天津300060摘要:Latexin(Lxn是人的羧肽酶抑制剂,并有肿瘤抑制因子的作用。利用生物信息学分析Lxn基因的启动子和CpG岛以及Lxn蛋白质的理化性质、结构特点、功能特征后发现,Lxn基因存在两个启动子和CpG岛,且一

2、个CpG岛与启动子重合; Lxn是全长222个氨基酸,等电点5.52,无信号肽、无跨膜结构的亲水不稳定蛋白质;蛋白质二级结构有4 个螺旋和9个折叠,三级预测结构可信度为99.55%,拉曼图表明结构稳定;与Lxn 相互作用的蛋白质主要是羧肽酶, 另外 Lxn还参与炎症反应和温度引起的痛觉反应等生物过程; 启动子和氨基酸在灵长类间的同源性极高。对Lxn的表达、结构及功能的预测分析可以为研究Lxn在生命过程中的作用提供重要的信息。关键词:Latexin;羧肽酶抑制剂;肿瘤抑制因子;生物信息学中图分类号:Q811.4 文献标识码:A 文章编号:1007-7847(201602-0125-06Bioin

3、formatic Analysis of Human Latexin Gene and Protein WANG Zhao-song, ZHAO Wen-cheng, ZHOU Meng, WEI Mei,DONG Qiu-ping, XU Shi-lei*(Tianjin Key Laboratory of Cancer Prevention and Therapy, National Clinical Research Center for Cancer, Tianjin MedicalUniversity Cancer Institute and Hospital, Tianjin 30

4、0060, ChinaAbstract: Latexin (Lxn is a carboxypeptidase inhibitor in human and acts as a tumor -inhibiting factor. Through bioinformatic analysis, predictions on the promoter and CpG island of Lxn gene, as well as physico- chemical properties, structural and functional characteristics of Lxn protein

5、 were performed. It was found that there are two promoters and two CpG islands in the gene and one CpG island is located in one promoter region. Lxn protein is composed of 222 amino acids, with isoelectric point of 5.52. It is a hydrophilic and unstable protein without a signal peptide and transmemb

6、rane domain. As for the advanced structure, four -helices and 9 -sheets were predicted in the secondary structure. The reliability of predicted tertiary struc- ture reached up to 99.55% and the structure was proven to be stable by Ramachandran plot. The advanced structure influenced the function of

7、protein. Lxn not only interacted with carboxypeptidase but also took part in inflammatory response and pain sense stimulated by temperature and so on. Whats more, the homologies of promoters and amino acids in primates were very high. The analysis results provide important messages for further studi

8、es on function of Lxn in human life activities.Key words: Latexin; carboxypeptidase inhibitor; tumor-inhibiting factor; bioinformatics(Life Science Research,2016,20(2:125130Latexin(Lxn是目前已知的哺乳类动物中唯且调控了干细胞中蛋白质表达的丰度3。Liang等4 一的羧肽酶抑制剂1,具有222个氨基酸残基,相发现小鼠Lxn的表达影响其体内造血干细胞的数对分子质量为29 kD。Lxn在人的心脏、前列腺、卵量, Mut

9、husamy等5发现Lxn的表达与干细胞因子巢、肾脏、胰腺、结肠等多个器官中均有表达2,并的表达呈现负相关的关系,而Liu等6证明Lxn具收稿日期:2015-08-08;修回日期:2015-09-28基金项目:国家自然科学基金资助项目(81301711作者简介:王兆松(1989-,男,山东泰安人,硕士研究生,主要从事分子生物学研究;*通讯作者:许世磊(1981-,男,天津人,助理研究员,博士,主要从事肿瘤细胞生物学研究,Tel: 022-*-6009,E-mail:slxu。 126生命科学研究2016 年有抑制血液系统的恶性肿瘤的作用,并且这种抗肿瘤的作用不依赖于其羧肽酶抑制剂的功能。随着对

10、Lxn研究的深入,它对肿瘤抑制作用的研究也在不断增加,如通过促进细胞凋亡以抑制淋巴瘤的生长6,使细胞停滞于G0期,从而抑制肝癌细胞的增殖7。另外,有临床研究证明Lxn能够有效抑制胃癌、乳腺癌、甲状腺癌等恶性疾病810。因此,对Lxn 的深入研究可为人类肿瘤的治疗、抗肿瘤药物的开发及愈后的检测提供大量可行的指导意见。本研究借助生物信息学的方法对人Lxn基因启动子及甲基化进行分析预测,并对Lxn蛋白质的理化性质、亲疏水性、二级结构、三级结构以及蛋白质之间的相互作用等进行预测分析,为Lxn的后续研究奠定理论基础。1材料与方法1.1 材料Lxn 基因(Gene ID: 56925相关序列来自 NCBI

11、 网站; Lxn蛋白质的氨基酸序列(NP_064554.3来自NCBI 网站。1.2 方法利用在线数据库及分析软件对Lxn基因相关序列及Lxn蛋白质氨基酸序列进行分析,并得出相应的结果。2结果与分析2.1 人Lxn基因启动子及转录因子预测与分析使用Promoter Scan(http:/www-bimas.cit.nih. gov/molbio/proscan/对 Lxn 基因起始密码子上游3 000 bp 和下游 1 000 bp 共 4 000 bp 的片段进行启动子的预测。通过预测发现Lxn基因存在两个启动子,并且预测得到与相应启动子结合的所有转录因子,启动子位置及序列如表1所示,其中P

12、romoter 1横跨起始密码子。预测所得的与两个启动子相结合的转录因子分别如表2和表3所示。表1 人Lxn基因启动子预测Table 1 Promoter prediction of human Lxn genePromoter Start Stop Score SequencePromoter 1 3 241 2 991 59.40 GCGGGGCCTCAGAAGCAGTCAGCCCAGGGCTCTCGGATGCAGGGAGCCTGGGCCCAAACAGCAGCTTCCGGAGTCGGAAGGAGCTGAGGAAGAAGACTGACTGAAGGAGCTTGCGACTTTTCCGCCTCGGC

13、AACCGGACCCAGCAGCAAGCAGGACGGGCGGCGCTCTGCTACTGGTCCCGTTAAGCCAGAGTAGCCCAAGCCCTGAAGTCACTGCTCATCCGGAATGGAAATCCCGCC-GACCAACTACCCA Promoter 2 419 160 54.56 AGATCAAATTCAGTTTTATATGAACTTGGAATATTTTATCATTATGTAATAAAACCTGGAAGACATATAATCAACTTTAAATAAATATTATTTTGTTACAGCTCACCCAAATTCATCTATTAATCAGAAATATTTTATACATTTTTAAAAAT

14、ATAATTTATAAACTTTATATTCAAAAATCATTAAATCATGTTTAAGAGCTCCTCTTTTATCTTGAAAACTTGTTTTTTTTTTTTTTTTTTTTTTTTTGA表 2 Promoter 1 结合的转录因子表 3 Promoter 2 结合的转录因子Table 2 Transcription factors combined with Promoter 1 Table 3 Transcription factors combined with Promoter 2 Name Strand Location Weight Name Strand Locatio

15、n WeightSp1 - 3 229 3.191 000 TFIID - 330 2.618 000NF-B - 3 226 2.869 000 TFIID - 321 1.971 000NF-B - 3 226 1.080 000 TFIID - 298 2.920 000Sp1 + 3 224 3.119 000 TFIID - 179 2.920 000AP-2 + 3 186 1.091 000 TFIID - 179 2.618 000GCF - 3 155 2.361 000 TFIID - 179 1.971 000Sp1 - 3 152 3.292 0002.2 人 Lxn

16、基因启动子区域 CpG 岛及甲基化区GCF + 3 149 2.284 000Sp1 + 3 147 3.361 000 域的预测与分析AP-1 - 3 095 8.606 000使用在线MethPrimer 软件(http:/www.uro-AP-2 + 3 013 1.091 000/cgi-bin/methprimer/methprimer.cgi对 Lxn APRT-mouse_US - 2 997 6.003 000EARLY-SEQ1 - 2 996 6.322 000 基因起始密码子上游3 000 bp和下游1 000 bp共AP-2 - 2 996 1.108

17、0004 000 bp 片段进行甲基化预测, 得到如图 1 所示结(Sp1 - 2 996 8.117 000Sp1 - 2 995 2.755 000 果。在4 000 bp中存在两个CpG岛,长度分别为Sp1 - 2 994 3.292 000106 bp(491-596 bp和 151 bp(3 060-3 210 bp, GCF + 2 991 2.284 000 第 2 期 王兆松等:人 Latexin 基因及蛋白质的生物信息学分析127其中一个 CpG 岛完全落在 Promoter 1 中, CpG 岛 的存在会抑制基因的转录, 因此 Promoter 1 及其甲基化对于 Lxn

18、的转录调控具有更重要的作用。 图 1 人 Lxn 启动子序列甲基化预测图谱Fig.1 MethPrimer predication of human Lxn promoter2.3 人 Lxn 基因启动子及 CpG 岛同源性分析使 用 NCBI 的 nucleotide blast (/Blast.cgi 在线系统, 对人 Lxn 基因得分较高的启动子(启动子 1和落在其中的CpG 岛共同进行同源性分析, 输出结果中覆盖度(query cover 达 100%的多为灵长目物种, 其中与黑猩猩、绿猴、狒狒、恒河猴的序列的相似性(i -den

19、tity 分别为 98%、92%、90%、92%, 这说明在灵长类动物中, 启动子序列具有高度的保守性, 因此 Lxn 基因可以被相同的转录因子所结合。通过ClustalX2.1 序列比对软件, 对人 Lxn 启动子与黑猩猩、绿猴、狒狒、恒河猴的序列进行多重比对,并构建系统进化树, 使用 NJplot 对进化树进行可视化分析(图 2, 结果显示人与黑猩猩之间的进化距离小于 0.016, 与绿猴、狒狒、恒河猴之间的进化距离大于 0.035。Papio anubisChlorocebus sabaeusHomo sapiens Macaca mulattaPongo( 0.01A0.032Pong

20、o0.016Homo sapiens1 0000.035Chlorocebus sabaeusMacaca mulatta658 0.012Papio anubis(B 图 2 不同物种间 Lxn 基因启动子及 CpG 岛同源性分析 (A 人、黑猩猩、绿猴、狒狒、恒河猴 Lxn 基因启动子及 CpG 岛序列比对结果;(BLxn 基因启动子及 CpG 岛系统进化树。 Fig.2 Homologous analysis of Lxn promoters and CpG islands in different species(A Sequence alignment of promoters an

21、d CpG islands in hu-man, pongo, chlorocebus sabaeus, papio anubis, macaca mu-latta; (B Phylogenetic tree of promoters and CpG islands.2.4 人 Lxn 蛋白质的理化性质分析将 Lxn 蛋白质序列(NP_064554.3提交到ProtParam 在线分析软件(/ protparam 分析发现: Lxn 总共有 222 个氨基酸残基 ; 相对分子质量为 25 750.1; 理论等电点为5.52; 在 222 个氨基酸残基中负

22、电荷氨基酸残基(Asp+Glu 总数为 28, 正电荷氨基酸残基(Arg+ Lys 总数为 21; 蛋白质总分子式为 C 1157H 1779 - N 307O 344S 8, 其原子总数为 3 595; 不稳定系数为 43.70, 属于不稳定蛋白质 ; 蛋白质的疏水值为 78.11, 平均总亲水性值为-0.593。2.5 人 Lxn 蛋白质的同源性预测和分析使 用 NCBI 的 protein blast (http:/blast.ncbi. /Blast.cgi 在线系统, 对人 Lxn 蛋白质进行同源性分析, 输出结果中覆盖度达 100%的为哺乳动物, 其中与黑猩猩

23、、恒河猴、牛、鼠的序列的相似性分别为 99%、97%、86%、85%, 这说明在哺乳动物中, Lxn 具有高度的同源性, 因此它在其他物种中的生理功能可能与在人体中的功能相同。通过ClustalX2.1 序列比对软件, 对人 Lxn 氨基酸序列与黑猩猩、恒河猴、牛、鼠的序列进行多重比对, 并构建系统进化树, 使用 NJplot 对进化树进行可视化分析(图 3, 结果显示人与黑猩猩、恒河猴之间的进化距离小于 0.014, 但与牛、鼠之间的进化距离大于0.06。蛋白质同源性分析的结果与启动子、CpG 岛分析的结果基本一致, 遗传进化越接近的物种之间, Lxn 的表达调控及作用机制越相似。2.6 人

24、 Lxn 蛋白质的亲水性/疏水性预测与分析使 用 ProtScale 程 序(/tools/ protscale.html , 按其默认算法, 得到 Lxn 蛋白质Homo sapiensPongoMacaca mulatta Bos Taurus Mouse(A 0.010.014Pongo7430.061Homo sapiens0.014Macaca mulatta1 0000.071mouse0.0090.064Bos Taurus(B 图 3 不同物种间 Lxn 蛋白质的同源性分析(A 人 、黑猩猩 、恒河猴 、牛 、鼠 Lxn 序列比对结果 ;(BLx

25、n 蛋白质的系统进化树。Fig.3 Homologous analysis of Lxn in different species(A Sequence alignment of Lxn in human, pongo, macaca mulatta, bos taurus, mouse; (B Phylogenetic tree of Lxn. 128 生 命 科 学 研 究2016 年亲疏水性序列分析图谱(图 4。该蛋白质存在两个高分值(score>1.5峰, 即 137-141 区和 143-145区, 其中最大值是第 139 位的 Leu 的 2.144。而 6个低分值(scor

26、e<0 峰分别位于第 26、50、101、155、171、214 氨基酸位点附近 , 其中最小值是101 位 Glu 的-3.022。通过分析得知, ProtScale 统计的人 Lxn 蛋白质的 214 个氨基酸(5-218中, 74.30%(159 个分布在低分值区, 25.70%(55 个分布在 score>0 区, 这说明 Lxn 存在大量的亲水域, 属于亲水性蛋白质。ProtScale output for user sequence321 S c o r e-1-2-3-450100 150200Position图 4 人 Lxn 亲水性/疏水性分析Fig.4 Hydr

27、ophilcity/hydrophobicity analysis of human Lxn2.7 人 Lxn 蛋白质的信号肽预测与分析 将 Lxn 蛋白质的氨基酸序列提交到信号肽在线预测程序 SignalP 4.1 Server (http:/www.cbs.dtu. dk/services/SignalP/, 得到如图 5 的预测结果, 其中 C 、Y 、S 的最大值分别为 0.126、0.111、0.128, S-mean 、D 值分别为 0.102、0.106, 通过该数据得知人 Lxn 蛋白质无信号肽。SignalP-4.1 prediction(euk networks:LXN1.

28、0C-scoreS-score0.8Y-scoreS c o r e102030 40506070Position图 5 人 Lxn 信号肽分析Fig.5 Signal peptide analysis of human Lxn2.8 人 Lxn 蛋白质的跨膜区预测与分析使用 TMHMM 在线分析程序(http:/www.cbs.dtu.dk/services/TMHMM/对人 Lxn 蛋白质氨基酸序列进行分析后得到如图 6 的预测结果, 发现Lxn 无跨膜区域, 说明 Lxn 蛋白质不是跨膜蛋白质。Lxn 可能分布于细胞质中, 当需要行使功能时, 在相应部位与靶蛋白质特异性

29、结合, 因此它不存在跨膜区。TMHMM posterior probabilities for LXN1.2P r o ba b i l i t y1.00.250100 150 200TransmembraneInsideOutside图 6 人 Lxn 跨膜区预测Fig.6 Transmembrane structure prediction of human Lxn2.9 人 Lxn 蛋白质二级机构的预测与分析Jpred 采用了 Jnnet 神经网络算法, 它对蛋白质二级结构的预测平均准确率大于 81%。将人 Lxn的氨基酸序列提交到 Jpred4.0(pbio. du

30、ndee.ac.uk/jpred/进行二级结构的预测, 得到如图 7 所示的结果。人 Lxn 蛋白质含有 4 个 螺旋区和 9个 折叠区, 螺旋占 26.58%(59/222,折叠片层占 32.88%(73/222。这说明 Lxn 蛋白质中大部分氨基酸可以形成一定的结构域。图 7 人 Lxn 二级结构预测 H : 螺旋;E : 折叠。Fig.7 Secondary structure prediction of human LxnH: -helix; E: -sheet.2.10 人 Lxn 蛋白质三级结构预测与分析蛋白质的高级结构与蛋白质的功能息息相关,因此分析蛋白质的三级结构对于研究其功能

31、必不可少。Swiss-Model 采用同源建模方法预测蛋白质的三级结构。将 Lxn 蛋白质序列提交到在线程序 Swiss-Model (/中,得到 3 个预测结果。如图 8 所示,与模板相比, A的相似度为 99.55%, B 的相似度为 85.14%, C 的相似度为 16.09%。分析人 Lxn 蛋白质与同源蛋白质的相似性波形图显示, 结果 A 的预测值高且稳定, 因此预测得到的模型 A 更趋于其体内的真实高级结构。为了进一步验证预测模型 A 的可靠性, 将预测所得到的模型使用在线分析网站 The Structure Analysis

32、and Verification Server (/SAVES/进行拉曼图分析, 得到如图 9 所示的结果。预测所得蛋白质模型 A 中的所有氨基酸残基, 除甘氨酸(标示外, 均位于黄色及红 第 2 期 totarg et 王兆松等:人 Latexin 基因及蛋白质的生物信息学分析 0.8 1.0 129 Local quality estimate Ramachadran plot model-1 180 135 90 similarity local 0.4 0.6 0 50 100 150 200 250 Psi(degress Pre

33、dict ed 0.2 45 0 -45 -90 (A similarit y totarget 1.0 0.8 0.6 0.4 0.2 0 50 Residue number Local quality estimate Predicte d local -135 -180 -135 -90 -45 0 45 90 135 180 Phi(degress 100 150 200 Residue number 250 (B similarity totarget 1.0 0.8 0.6 0.4 0.2 0 图 9 人 Lxn 预测三级结构模型 A 的拉曼图分析 图中区域由白到红 ,颜色越深该区

34、域二面角越合理 。 : 甘氨 酸;:除甘氨酸外的其他氨基酸。 Local quality estimate Fig.9 Ramachandran plot analysis of predicted 3D model A of human Lxn The deeper the color, the more reasonable the dihedral angle. : Glycine; : Other amino acids except glycine. 50 100 150 200 Residue number 250 Predict ed local (C Lxn 蛋白质进行分析,

35、得到 10 个与 Lxn 相互作用紧 密的蛋白质(图 10 ) 。 相互作用蛋白质的信息及预 测得分见表 4, 得分较高的是羧肽酶, 这与 Lxn 图 8 人 Lxn 三级结构预测 (A 蛋白质 A 模型三级结构及其与同源蛋白质相似性波形图; (B 蛋白质 B 模型三级结构及其与同源蛋白质相似性波形图; (C 蛋白质 C 模型三级结构及其与同源蛋白质相似性波形图。 Fig.8 Tertiary structure prediction of human Lxn (A Tertiary structure of model A and its similarity waveform to the homologous protein; (B Tertiar

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论