ILKAP基因及蛋白质的生物信息学分析_第1页
ILKAP基因及蛋白质的生物信息学分析_第2页
ILKAP基因及蛋白质的生物信息学分析_第3页
ILKAP基因及蛋白质的生物信息学分析_第4页
ILKAP基因及蛋白质的生物信息学分析_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录 摘要.- 1 - ABSTRACT.- 2 - 1 前 言.- 3 - 2 相关知识的简介 .- 5 - 2.1 生物信息学简介 .- 5 - 2.2 数据库简介 .- 5 - 2.3 相关分析软件及网站 .- 6 - 2.4 本研究的目的与意义.- 6 - 3 方法与分析 .- 7 - 3.1 ILKAP 基因及蛋白质一级结构分析 .- 7 - 3.1.1 ILKAP 基因 cDNA 的成分分析 .- 7 - 3.1.2 开放阅读框查找分析.- 8 - 3.1.3 ILKAP 蛋白质一级结构分析 .- 10 - 3.2 ILKAP 蛋白质二级结构分析 .- 10 - 3.2.1 ILKAP 蛋白质二级结构 .- 10 - 3.2.2 跨膜结构域分析 .- 12 - 3.2.3 蛋白的卷曲螺旋结构预测 .- 12 - 3.2.4 信号肽预测.- 13 - 3.2.5 蛋白质的疏水性预测分析 .- 14 - 3.2.6 蛋白质结构域预测分析.- 15 - 3.3 ILKAP 蛋白质三级结构预测分析 .- 16 - 3.4 序列相似性分析.- 17 - 4 结论与讨论 .- 20 - 4.1 结论.- 20 - 4.2 讨论.- 20 - ILKAP 基因及蛋白质的生物信息学分析 摘要摘要 整合素连接激酶相关丝氨酸/苏氨酸磷酸酶(integrin-linked kinase-associated serine/threonine phosphatase, ILKAP)是近年来发现的一种重要的蛋白磷酸酶。本论文 利用 NCBI 数据库,DNAman,DNASTAR-Lasergene 等相关的生物信息学软件及相应 的生物信息学分析网站,对大鼠进行基因和蛋白质结构的预测和分析,结果表明: ILKAP 基因序列全长 1318bp,包含一个 461224bp 的开放阅读框,编码一个由 392 个 氨基酸残基组成的蛋白质,主要由 螺旋(146 个) 、无规则卷曲(149 个)和少量的 折叠(69 个)构成。ILKAP 在哺乳动物中高度保守,人与大鼠、小鼠以及大鼠与小鼠 之间的同源性分别高达 95%、95%、97%。ILKAP 蛋白具有 PP2C 结构域,结合结构域结合结构域 的功能和其他物种中的的功能和其他物种中的 ILKAP 的功能,综合分析的功能,综合分析 ILKAP 可能与细胞凋亡的密切联系,可能与细胞凋亡的密切联系, 而凋亡信号的阻断,导致了肿瘤的发生与发展。而凋亡信号的阻断,导致了肿瘤的发生与发展。 关键词关键词: ILKAP,生物信息学,核酸和蛋白质分析,同源性 Abstract Integrin-linked kinase-associated serinethreonine phosphatase(ILKAP) is found in recent years of a kind of important protein phosphatase. This paper use the NCBI database, DNAman, DNASTAR-Lasergene and related bioinformatics software and corresponding bioinformatics analysis website, on Rattus norvegicus gene and protein structure prediction and analysis, the results show that: The ILKAP gene sequence of the full-length 1318bp, contains a 46 1224bp open reading frame, encoding a consists of 392 amino acid residues of proteins, mainly composed of an alpha helix (146), without the rules of curling (149) and a small amount of folding (69). ILKAP in mammals is highly conserved, the homology between the man and Rattus norvegicus, Mus musculus and Rattus norvegicus and Mus musculus were as high as 95%, 95%, 97%. ILKAP protein has a PP2C domain, binding domain of the function and other species in the ILKAP function, comprehensive analysis of ILKAP may be associated with apoptosis in close contact, and apoptotic signal blocking, resulted in tumor genesis and development. Key words:ILKAP,Bioinformatics,Nucleic acid and protein analysis,homology 1 前前 言言 整合素连接激酶相关丝氨酸/苏氨酸磷酸酶integrin-linked kinase-associated serine/threonine(ILKAP)是近年来发现的一种重要的蛋白磷酸酶。从它被发现开始就 显示出其与细胞凋亡的密切联系,而凋亡信号的阻断,导致了肿瘤的发生与发展。 ILKAP主要通过抑制整合素连接激1(integrin-linked kinase-1,ILK-1)的活性负调控 整合素激酶信号通路,以及通过去磷酸化凋亡信号调节激酶1(apoptosis signal- regulating kinase 1,ASK1)的Thr845正调控JNK/SAPK信号通路而发挥作用。而这两条 信号通路与肿瘤的发生、发展都有非常密切的关系。 ILKAP 最初是在大鼠中发现的一种蛋白质,这种蛋白质与大鼠 PP2C 或 PP2C 有 30%左右的序列同源性,并且它的 C 端片段具有蛋白磷酸酶 2C 结构域,但是其 N 端 的 76 个氨基酸残基是其特有的,与目前所发现的任何一种蛋白质都没有同源性。后来 将其列入 PP2C 蛋白家族,ILKAP 由 392 个氨基酸残基组成,相对分子量约为 43kDa, 包含 N 端特异的 76 个氨基酸残基以及 C 端的 PP2C 类催化结构域。ILKAP 在各种组织中 均有广泛的表达,尤其是在骨骼肌,肝脏,肾脏中都有高水平的表达。 ILKAP 在哺乳动物中高度保守,ILKAP 所包含的 PP2C 结构域,与 PP2C,C,PP2C 所包含 PP2C 结构域的同源性分别为 31%、29%、38%,而大鼠、大鼠、 小鼠以及大鼠与小鼠之间的同源性分别高达小鼠以及大鼠与小鼠之间的同源性分别高达 95%、95%、97%。ILKAP 的 C 端大部分片段 要是 PP2C 结构域,并包含了 PP2C 结构域共有的全部 11 个保守的活性位点,使 ILKAP 具备了丝氨酸/苏氨酸蛋白磷酸酶的催化活性。研究发现,东方田鼠抗日本血吸虫抗性 相关基因 E7743 ORF 编码的产物为整合素连接激酶相关丝氨酸/苏氨酸磷酸酶 ,与 之相互作用的蛋白为整合素连接蛋白激酶(integrin-linked protein kinase,ILK)。 而现有研究表明,ILKAP 在细胞生长与凋亡的调控过程中起重要作用。E7743 编码的 产物可能为 ILKAP 基因在东方田鼠中的同源基因。 PP2C 的生理功能主要是通过去磷酸化作用负调控蛋白激酶级联信号系统,从而参 与细胞周期调控、信号转导、基因转录、蛋白质翻译及翻译后修饰等细胞过程。ILKAP 是 PP2C 的成员之一,作为一种抑癌基因,在肿瘤的发生发展中有其重要作用。它的主 要生理功能是介导细胞凋亡,与肿瘤的发生、发展密切相关。了解 ILKAP 的基因各种 信息,掌握其一级结构和高级结构对研究肿瘤发生及细胞凋亡有重要作用,研究其各 种生物信息进行分析,并与其他物种的 ILKAP 进行对比,这将为各种抗癌的生物制药提 供重要线索。本研究主要通过所学的生物学知识,在导师的带领和指导下,运用现代 计算机技术,网络资源,相关的在线分析软件和图书馆等平台,完成 ILKAP 的生物学 信息分析,掌握现代生物信息学分析技能。 2 相关知识的简介相关知识的简介 2.1 生物信息学简介 生物信息学是一门交叉学科。它包含了生物信息的获取、管理、分析、解释和应 用在内的所有方面。它综合运用生物学、计算机科学和数学等多方面知识与方法,来 阐明和理解大量生物数据所包含的生物学意义,并应用于解决生命科学研究和生物技 术相关产业中的各种问题。 生物信息学主要有三个组成部分:建立可以存放和管理生物信息数据的数据库; 研究开发科利用有效分析与挖掘生物学数据的方法、算法和软件工具;使用这些工具 去分析和解释不同类型的生物学数据,包括 DNA、RNA 和蛋白质序列、蛋白质结构、 基因表达及生化途径等。 生物信息学这个术语从 20 世纪 90 年代开始使用,最初主要指的是 DNA、RNA 及 蛋白质序列的数据管理和分析。自从 20 世纪 60 年代就有了序列分析的计算机工具, 但是那时并未引起人们很大的关注,直到测序技术的发展使 GenBank 之类的数据库中 存放的序列数量出现了迅猛的增长。现在该术语已扩展到几乎覆盖各种类型的生物学 数据,如蛋白质结构、基因表达和蛋白质互作等。 2.2 数据库简介 据保守估计,目前世界上平均每一分钟就有一个序列增加到核酸序列数据库中, 能够从飞速增长的序列数据更高效的提取信息,建立生物信息中心,通过互联网实现 全球范围内的信息共享成为必然。欧美各国及日本等西方国家相继成立了生物信息资 源和研究中心,如美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)、位于英国的欧洲生物信息研究所(European Bioinformatics Institute,EBI)、位于瑞士日内瓦的蛋白质专家分析系统(The Expert Protein Analysis System,ExPaSy)、日本国立遗传学研究院(National Institute Genetics,简称 NIG)等。 以西欧各国为主的欧洲分子生物学网络组织(European Molecular Biology network ,EMBnet),成立于 1988 年,是目前国际上最大的分子生物信息研究、开发和服务机构。 它把欧洲乃至世界各国的生物信息中心联系在一起,实现信息共享,并合作进行开发、 研究、培训。 2.3 相关分析软件及网站 序列分离软件:GeneStudio 序列翻译软件:Editseq 序列拼接软件:DNASTAR-Lasergene v6 开发阅读框:/gorf/gorf.html 美国国立生物技术信息中心(NCBI):http:/www. ncb.inlm. nih. gov 卷曲螺旋结构预测软件:http:/www.ch.embne.torg 信号肽预测软件:http:/www.cbs.dtu.dk/services/SignalP 跨膜结构预测软件:http:/www.ch.embne.torg/software/TMPRED_form. html 一级结构:http:/wolfpsor.tseq.cbrc.jp 二级结构:/gor/ 三级结构:/swissmod/swiss-model.htm 蛋白质数据库或 DNA 数据库中进行相似性比较的分析(BLAST): /Blast.cgi 2.4 本研究的目的与意义 一 、课题目的 ( 1 )对 ILKAP 的基因及蛋白质氨基酸序列组成进行生物信息学分析。 ( 2 )通过本论文的实施,熟悉 NCBI 进行生物信息学检索。掌握重要生物信 息学分析软件,进行生物信息学分析。 二、课题意义 ILKAP 作为一种抑癌基因,在肿瘤的发生发展中有其重要作用,了解 ILKAP 的 基因各种信息,掌握其一级结构和高级结构对研究肿瘤发生及细胞凋亡有重要作用。 通过所学的生物学知识,在导师的带领和指导下,运用现代计算机技术,网络资 源,相关的在线分析软件和图书馆等平台,掌握现代生物信息学分析技能。 ILKAP 是一种蛋白磷酸酶,与细胞调亡密切相关,研究其各种生物信息进行分析,并 与其他物种的 ILKAP 进行对比,这将为各种抗癌的生物制药提供重要线索。 3 方法与分析方法与分析 3.1 ILKAP 基因及蛋白质一级结构分析 3.1.1 ILKAP 基因 cDNA 的成分分析 先在 NCBI 中检索出 ILKAP 的核酸序列,然后采用 DNASTAR 软件中的 Editseq 程序,分析 cDNA 的碱基组成。结果如下: (1)碱基序列 lcl|NM_022606.1_gene_1 gene=Ilkap location=1.1318 CGCCGCCCAGGCTAGCGCGAGCCTCCGCTCCATCGCCCCGCCGCCATGGACCTAT TCGGGGACTTGCCGG AGCCCGAGCGCCCGCCGCGGCCGTCTGCCGGGAAAGAAGCACAGGAAGGACCCG TGCTCTTCGAGGACCT GCCCCCGACCAGCAGTACTGACTCAGGATCTGGGGGACCTTTACTCTTTGATGGT CTTCCACCTGCTGGC AGCGGCAATTCAGGTTCTCTTGCCACATCAGGCTCCCAGGTGGTGAAGAACGAAG GAAAAGGAGCAAAGA GGAAAGCCCCTGAGGAAGAGAAGAATGGCGGTGAAGAGCTTGTGGAAAAGAAA GTTTGTAAAGCCTCTTC GGTGATCTTTGGTTTGAAAGGCTACGTGGCAGAGCGGAAGGGTGAGAGGGAGGA GATGCAGGACGCCCAT GTCATCCTGAATGATATCACTCAGGAGTGTAATCCTCCATCATCTCTCATTACTCG GGTTTCATACTTTG CTGTTTTTGATGGACATGGAGGAATTCGAGCCTCGAAATTTGCTGCACAGAATTT GCACCAGAACTTAAT CAGGAAATTTCCTAAAGGAGATGTAATCAGTGTGGAGAAGACTGTGAAGAGGTG CCTGCTAGATACTTTT AAGCACACCGATGAAGAGTTCCTGAAACAGGCTTCAAGCCAGAAGCCTGCCTGG AAAGACGGGTCCACTG CCACGTGTGTCCTGGCTGTGGACAACATCCTGTATATCGCCAACCTTGGAGATAG TCGGGCAATCCTGTG (2)碱基成分 Total number of bases is 1318 % A = 24.51 323 % G = 29.36 387 % T = 22.23 293 % C = 23.90 315 % A+T = 46.74 616 % C+G = 53.26 702 BASE COUNT 323 a 315 c 387 g 293 t 3.1.2 开放阅读框查找分析 对 ILKAP 拼接全长 cDNA 序列用 NCBI ORFfinder(/gorf/gorf.html)进行开放阅读框分析,输入检索号 即可。见图 1,大鼠 ILKAP 基因的开放阅读框为 461224bp。 46 atggacctattcggggacttgccggagcccgagcgcccgccgcgg M D L F G D L P E P E R P P R 91 ccgtctgccgggaaagaagcacaggaaggacccgtgctcttcgag P S A G K E A Q E G P V L F E 136 gacctgcccccgaccagcagtactgactcaggatctgggggacct D L P P T S S T D S G S G G P 181 ttactctttgatggtcttccacctgctggcagcggcaattcaggt L L F D G L P P A G S G N S G 226 tctcttgccacatcaggctcccaggtggtgaagaacgaaggaaaa S L A T S G S Q V V K N E G K 271 ggagcaaagaggaaagcccctgaggaagagaagaatggcggtgaa G A K R K A P E E E K N G G E 316 gagcttgtggaaaagaaagtttgtaaagcctcttcggtgatcttt E L V E K K V C K A S S V I F 361 ggtttgaaaggctacgtggcagagcggaagggtgagagggaggag G L K G Y V A E R K G E R E E 406 atgcaggacgcccatgtcatcctgaatgatatcactcaggagtgt M Q D A H V I L N D I T Q E C 451 aatcctccatcatctctcattactcgggtttcatactttgctgtt N P P S S L I T R V S Y F A V 496 tttgatggacatggaggaattcgagcctcgaaatttgctgcacag F D G H G G I R A S K F A A Q 541 aatttgcaccagaacttaatcaggaaatttcctaaaggagatgta N L H Q N L I R K F P K G D V 586 atcagtgtggagaagactgtgaagaggtgcctgctagatactttt I S V E K T V K R C L L D T F 631 aagcacaccgatgaagagttcctgaaacaggcttcaagccagaag K H T D E E F L K Q A S S Q K 676 cctgcctggaaagacgggtccactgccacgtgtgtcctggctgtg P A W K D G S T A T C V L A V 721 gacaacatcctgtatatcgccaaccttggagatagtcgggcaatc D N I L Y I A N L G D S R A I 766 ctgtgtcgatataacgaggaaagtcaaaagcatgcagccttaagc L C R Y N E E S Q K H A A L S 811 ctcagcaaagagcacaatccaactcagtatgaagagcgcatgagg L S K E H N P T Q Y E E R M R 856 atacagaaggctggaggcaatgtcagagatggccgtgtcttgggt I Q K A G G N V R D G R V L G 901 gtgctggaggtatcccgctccattggagatgggcagtacaagcgt V L E V S R S I G D G Q Y K R 946 tgcggggtcacatccgtgcctgatatcagacgctgccagttgacc C G V T S V P D I R R C Q L T 991 cccaatgacaggttcattttgctggcttgtgatgggctcttcaag P N D R F I L L A C D G L F K 1036 gtctttaccccagaagaagctgtgaacttcatcttgtcctgcctt V F T P E E A V N F I L S C L 1081 gaggatgagaagatccagacccgagaagggaagcctgctgttgat E D E K I Q T R E G K P A V D 1126 gcccgctatgaagctgcatgcaacaggctggctaacaaggcagtg A R Y E A A C N R L A N K A V 1171 cagcggggctcggcagataacgtgacggtgatggtggtgaggata Q R G S A D N V T V M V V R I 1216 ggacactga 1224 G H * 图 1 ILKAP ORF 预测图 3.1.3 ILKAP 蛋白质一级结构分析 (1)氨基酸序列 利用 DNASTAR 软件中的 Editseq 程序,放入基因序列,选中开放阅读框检索出 氨基酸序列,结果如下: MDLFGDLPEPERPPRPSAGKEAQEGPVLFEDLPPTSSTDSGSGGPLLFDGLPPAGSGNS GSLATSGSQVVKNEGKGAKRK APEEEKNGGEELVEKKVCKASSVIFGLKGYVAERKGEREEMQDAHVILNDITQECNP PSSLITRVSYFAVFDGHGGIRAS KFAAQNLHQNLIRKFPKGDVISVEKTVKRCLLDTFKHTDEEFLKQASSQKPAWKDGS TATCVLAVDNILYIANLGDSRAI LCRYNEESQKHAALSLSKEHNPTQYEERMRIQKAGGNVRDGRVLGVLEVSRSIGDG QYKRCGVTSVPDIRRCQLTPNDRF ILLACDGLFKVFTPEEAVNFILSCLEDEKIQTREGKPAVDARYEAACNRLANKAVQRG SADNVTVMVVRIGH (2)基因所编码蛋白质的特征分析 利用 http:/wolfpsor.tseq.cbrc.Jp 将所得的氨基酸进行分析,发现氨基酸数:392; 理论 PI 6.68;负电荷数:54;正电荷数:53;分子式:C1859H2992N542O585S14 总原 子数:5992;估计半衰期:30h;不稳定指数:42.19;脂肪指数:78.11;总平均亲水 性:-0.484。 (3)氨基酸组成 见表 1 表 1 氨基酸组成成分 氨基酸 Ala (A) Arg (R) Asn (N) Asp (D) Cys (C) Gln (Q) Glu (E) Gly (G) His (H) Ile (I) 数 量3124172210153235717 百分率7.9%6.4%4.3%5.6%2.6%3.8%8.2%8.9%1.8%4.3% 氨基酸 Leu (L) Lys (K) Met (M) Phe (F) Pro (P) Ser (S) Thr (T) Trp (W) Tyr (Y) Val (V) 数 量3228 4142129161729 百分率8.2%7.1%1.0%3.6%5.4%7.4%4.1%0.3%1.8%7.4% 3.2 ILKAP 蛋白质二级结构分析 3.2.1 ILKAP 蛋白质二级结构 进入网站 /gor/,输入氨基酸序列于框中,提交,结果见图 2。 MDLFGDLPEPERPPRPSAGKEAQEGPVLFEDLPPTSSTDSGSGGPLLFDGLPPAGSGNSGSLATSGS QVV hhhetccccccccccccccccccccceeeeccccccccccccccceeetcccccccccccccccchhhhh KNEGKGAKRKAPEEEKNGGEELVEKKVCKASSVIFGLKGYVAERKGEREEMQDAHVILNDITQE CNPPSS hhhcttccccchhhhhhhhhhhhhhhhhhtccheeehhhhhhhhtcchhhhhhhhhhhhhhccccccccc LITRVSYFAVFDGHGGIRASKFAAQNLHQNLIRKFPKGDVISVEKTVKRCLLDTFKHTDEEFLKQA SSQK ccccceeeeeectttcchhhhhhhhhhhhhhhhhcccccccchhhhhhhhhhhhhhhhhhhhhhhhhtcc PAWKDGSTATCVLAVDNILYIANLGDSRAILCRYNEESQKHAALSLSKEHNPTQYEERMRIQKAG GNVRD ccccttccheeeeeetteeeeecccccheeeeetccccccceeeeeeccccccchhhhhhhhhttceeet GRVLGVLEVSRSIGDGQYKRCGVTSVPDIRRCQLTPNDRFILLACDGLFKVFTPEEAVNFILSCLED EKI tceeeeeehhhhttccccccceeecccccceeeccttcheeeeetttcheeccchhhhhhhhhhhhhhhh QTREGKPAVDARYEAACNRLANKAVQRGSADNVTVMVVRIGH Hccccccchhhhhhhhhhhhhhhhhhttcccceeeeeeeecc 注:H 代表螺旋,E 代表折叠,C 代表卷曲结构。 Alpha helix (Hh) 螺旋 : 146 is 37.24% Random coil (Cc) 无规卷曲 : 149 is 38.01% Extended strand (Ee) 折叠片 : 69 is 17.60% 图 2 ILKAP 蛋白二级结构预测结果 螺旋又称 3.613-螺旋,它是由氢键封闭的 13 元环,每圈螺旋占 3.6 个氨基酸。 螺旋由于与溶剂的作用或中间有脯氨酸等也会发生弯曲。不同的残基对于 螺旋中间 部位及 N 端或 C 端出现的倾向性不同。 折叠片是带状的 折叠股间形成氢键而构成 的,在氨基酸序列上往往是不连续的,几乎所有的 折叠片在沿着 折叠股的方向均 发生右手的扭曲,在 折叠股间形成左手的扭曲,某些残基倾向于出现 折叠中,- 转角是由第一个残基的 C=O 与第四个残基的 N-H 氢键结合而形成一个紧密的环无规卷 曲泛指那些不能被归入明确的二级结构的多肽区段。 预测结果显示,组成 ILKAP 蛋白 的 392 个氨基酸中,146 个氨基酸可能形成 螺旋结构,69 个氨基酸可能形成 折叠 片,149 个氨基酸可能形成无规卷曲。ILKAP 蛋白以三种形式存在, 螺旋,折叠, 无规则卷曲。其中 螺旋,无规则卷曲占主要地位。 3.2.2 跨膜结构域分析 进入网站 http:/www.cbs.dtu.dk/services/TMHMM-2.0/,输入氨基酸序列,提交, 结果见图 3,结果预测显示 ILKAP 蛋白质无跨膜结构域。 图 3 ILKAP 蛋白质跨膜结构域预测结果 3.2.3 蛋白的卷曲螺旋结构预测 进入网站 /software/COILS_form.html,放氨基酸序列于框 内,提交,结果见图 4。结果显示,存在两个卷曲螺旋结构,区域在 110140、340390 位置,但通过跨膜结构分析知道在这些区域里并没有跨膜结构, 所以,这些区域可能是其他的功能区域。 图 4 ILKAP 蛋白质卷曲螺旋结构预测图 3.2.4 信号肽预测 进入网站 http:/www.cbs.dtu.dk/services/SignalP/,放氨基酸序列于框内,提交, 结果见图 5。结果预测显示,没有信号肽,该蛋白质不是分泌蛋白。 max. C 38 0.124 max. Y 38 0.111 max. S 8 0.155 mean S 1-37 0.106 D 1-37 0.108 0.450 NO 图 5 ILKAP 蛋白质信号肽预测图 3.2.5 蛋白质的疏水性预测分析 进入网站 /protscale/,放氨基酸序列于框内,提交,结果见图 6。 蛋白质的疏水性分析是蛋白质二级结构和三级结构预测中的一个必要过程,通过分 析可以得到蛋白质的亲疏水区域,一方面可以为二级结构预测结果提供参考,另一方 面还可以为结构域以及功能域的划分提供依据。20 种氨基酸的预测图及疏水参数见下 表。 (高正值的氨基酸具有更大的疏水性,而低负值的氨基酸则更加亲水。 ) 表 2 20 种氨基酸的预测图及疏水参数 AlaArgAsnAspCysGlnGluGlyHisIle 1.800-4.500-3.500-3.5002.500-3.500-3.500-0.400-3.2004.500 LeuLysMetPhe ProSerThrTrpTyrVal 3.800-3.9001.9002.800-1.600-0.800-0.700-0.900-1.3004.200 图 6 ILKAP 蛋白质的疏水性预测图 从表中及图中可以看出整个蛋白质疏水性最大值为 2.345。最小值为-3.245。在 320349 区域氨基酸的疏水性最强。其次是 220230 区域、390395 区域、100110 区 域具有一定的疏水性。表现出整体具有一般的疏水性。 3.2.6 蛋白质结构域预测分析 结构域是在二级结构或超二级结构的基础上形成三级结构的局部折叠区,一条多 肽链在这个域围内来回折叠,但相邻的域常被一个或两个多肽片段连结。通常由 50300 个氨基酸残基组成,其特点是在三维空间可以明显区分和相对独立,并且具有 一定的生物功能如结合小分子。通过 /prosite 对 ILKAP 蛋白结构 域分析,显示有 C 端的 PP2C 类催化结构域,见图 7。 Hits by PS01032 PP2C Protein phosphatase 2C signature : USERSEQ1 (392 aa) 147 - 155: level tag: (0) YFAVFDGHG 图 7 ILKA 蛋白质结构域预测分析 3.3 ILKAP 蛋白质三级结构预测分析 蛋白质三级

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论