




已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
豌豆凝集素基因(Pisum sativum lectin ,PSL1)的生物信息学分析摘 要:大量的蛋白质和核酸数据的积累与理性地分析这些数据中所蕴涵的生物学意义的双重需要,产生了综合生物学研究与计算技术研究等领域最新成果的交叉性学科生物信息学。本文就是利用生物信息学手段来研究豌豆凝集素基因(Pisum sativum lectin ,PSL1)的一些基本性质,该序列全长1659bp,读码框828nt,编码275个氨基酸。该基因编码的豌豆凝集素在豌豆与根瘤菌相互作用识别过程中起到重要作用,因此,对该序列的研究与利用将对整个生物固氮领域有着重要意义。关键词:生物信息;PSL1;序列分析Bioinformatics Analysis on PSL 1 GeneAbstract: A large number of proteins and nucleic acids of data accumulation and rational analysis of these data implied the biological significance of the dual need to produce a comprehensive biological research and calculation of latest achievements in research areas such as cross-discipline of bioinformatics. This paper is the use of bioinformatics tools to study the pea lectin gene (Pisum sativum lectin, PSL1) some of the basic properties,whose total-length was 1659bp,and the longest cds of PSL1 gene was 828nt, which encoded 275 amino acids.PSL1 gene encoded pea lectin and the pea lectin is very important for the identification between the pea and the leguminus bacteria.Keywords: Bioinformatics; PSL1; Sequence analysis前言:随着信息时代的迅猛发展,软硬件的快速更新,生物信息学这一集合了生命科学与计算机科学等众多领域的交叉学科的日益成熟,为后基因组时代的研究提供了更快、更新、更准确的研究手段。生物信息学包含了生物信息的获取、处理、储存、分析和解释等方面,集合数学、统计、计算机与生物医学等工具研究,阐明大量生物学数据所包含的生物学意义。也就是说,生物信息学是把核酸、蛋白质等生物大分子的数据库作为主要的研究对象,并结合数学、统计、计算机科学等研究手段来对大量生物学原始试验数据进行存储、整理、管理、注释、加工,使之成为具有明确生物学意义的生物信息。生物信息学自诞生以来发展迅速,其发展大致经历了3个阶段: 前基因组时代,标志性工作包括生物数据库的建立、检索工具的开发以及DNA和蛋白质序列分析; 基因组时代,标志性工作包括基因寻找和识别、网络数据库系统的建立和交互界面的开发; 后基因组时代,标志是大规模基因组分析、蛋白质组分析以及各种数据的比较和整合。本文就是利用生物信息学技术来对PSL1的核酸序列及其所编码的蛋白质序列进行分析。1.材料与方法1.1材料:豌豆凝集素基因(PSL1)(GenBank: M18160.1)1.2生物信息学方法核酸序列基本分析、开放阅读框(ORF)分析、同源性分析、Blastn分析、系统进化树分析、蛋白质序列基本分析、蛋白质功能分析、Blastp分析、蛋白质结构预测。2.生物信息学分析结果2.1获取基因序列全长使用NCBI:/ 检索M18160.1得到豌豆凝集素基因(Pisum sativum lectin ,PSL1),该核酸全长1659bp。序列如下: 1 taggttaatt tttaattgga tgagatacaa attaaattaa ttggatgaga tacaaatttt 61 atcattaaat atattattta tatcatccac tccataagtt ttaaataaat atcagcccta 121 aaaaactctt taaataaatt gaaatttaat gagtcatatt cttttaacat ataaatttta 181 atagttatcg taccgaacaa aaacagtaat catgatctaa accgaacaac ctcgaagaaa 241 tacaagttat tacatgcaaa aatatatagt aataaataaa taaactagtt aaacaaaata 301 caatattttt tgtcttcaaa gaagattcga tggacgcgta gaaaaatgat gggacatgtg 361 tgtatatgtg tttcatgtaa cgctctataa agacacgtag aatgagtcat caccactata 421 taaacaagta cagcatgtgc atgcatgcaa ttataaccaa taatggcttc tcttcaaacc 481 caaatgatct cattctatgc gatatttcta tccattctct taacaacaat ccttttcttc 541 aaggtgaact caactgaaac cacttccttc ttgatcacca agttcagccc cgaccaacaa 601 aacctaatct tccaaggaga tggctatacc acaaaagaga agctgacact gaccaaggca 661 gtaaagaaca ctgttggcag agccctctat tcctcaccta tccatatctg ggatagagaa 721 acaggcaacg ttgctaattt tgtaacttcc ttcacttttg tcataaatgc acccaacagt 781 tacaacgttg ccgacgggtt tacgttcttc atcgcacctg tagatactaa gccgcagacc 841 ggcggtggat atctcggagt tttcaatagc gcagagtatg ataaaaccac tcaaactgtt 901 gctgtggagt ttgacacttt ctataatgct gcatgggatc caagcaacag agatagacat 961 attggaatcg atgtgaacag tatcaaatcc gtaaacacta agtcgtggaa gttgcagaat 1021 ggtgaagagg ctaatgttgt gatagctttt aatgctgcta ctaatgtgtt aactgttagt 1081 ttaacttatc ctaattcact tgaggaagag aatgtaacta gttatactct tagcgacgtt 1141 gtgtctttga aggatgttgt tcctgagtgg gtaaggattg gtttctcagc taccacagga 1201 gcagaatatg cagcacatga agttctttca tggtcttttc attctgagtt gagtggaact 1261 tcaagttcta agcaagctgc agatgcatag tttttttgct tttcatcatc atgcatgtca 1321 agtcatgtgt gacagatcca gtttctataa ataaactgcg catatgcagt acttttgtaa 1381 tgttgttatg tatgttactt gatgcgttta ttaatcatgt gtgtgattaa ttgtttgagt 1441 tatgtgtgtt aaattagata gttactctct ttttaaatat tatttggcca aatgcaaaaa 1501 ctgttaagca ttagtgatca ctagtatagg gcctaataga acccattctt ggcaattggg 1561 acatgcatac tccggggcag agacaccttg ttttgtaccc aggggttcat gtgcacctct 1621 caacattttg gatttacaca tacgttattt tatgttttg2.2核酸序列的基本分析2.2.1分子质量与碱基组成通过BioEdit软件对豌豆凝集素基因PSL1核酸序列(M18160.1)的分子质量与碱基组成进行分析,结果如图2-1、图2-2所示。图2-1豌豆凝集素基因(PSL)的分子量及碱基组成图2-2豌豆凝集素基因(PSL1)的碱基组成2.2.2限制性酶切分析通过DNAMAN软件进行酶切位点分析,选用DraI、Eam1105I、EcoRV、NsiI、PstI、EcoRI、SmaI、HindIII、SacI这9种酶对DNA片段进行切割,结果如图2-3所示。图2-3豌豆凝集素基因(PSL1)的酶切图谱如图所示,该片段上没有EcoRI、SmaI、HindIII、SacI这4种酶的酶切位点。DraI在102、131、1474(TTT/AAA)三个位置有酶切位点,Eam1105I在1140(GACNNN/NNGTC)位置有一个酶切位点,EcoRV在850(GAT/ATC)位置处有一个酶切位点,NsiI在445、1287、1315、1567(ATGCA/T)四个位置处有酶切位点,PstI在1281(CTGCA/G)位置处有一个酶切位点。2.3开放阅读框(ORF)分析网址如下:./gorf/gorf.htmL,豌豆凝集素基因核苷酸序列进行ORF分析,结果如图2-4。图2-4豌豆凝集素基因(PSL1)ORF分析通过NCBI的ORF Finder程序对序列作开放阅读框分析,如图2-4 所示,序列4631290位存在一个长828nt的开放阅读框,编码275氨基酸,起始密码子为atg,终止密码子为tag。开放阅读框及其编码的氨基酸序列如下:463 atggcttctcttcaaacccaaatgatctcattctatgcgatatttM A S L Q T Q M I S F Y A I F508 ctatccattctcttaacaacaatccttttcttcaaggtgaactcaL S I L L T T I L F F K V N S553 actgaaaccacttccttcttgatcaccaagttcagccccgaccaaT E T T S F L I T K F S P D Q598 caaaacctaatcttccaaggagatggctataccacaaaagagaagQ N L I F Q G D G Y T T K E K643 ctgacactgaccaaggcagtaaagaacactgttggcagagccctcL T L T K A V K N T V G R A L688 tattcctcacctatccatatctgggatagagaaacaggcaacgttY S S P I H I W D R E T G N V733 gctaattttgtaacttccttcacttttgtcataaatgcacccaacA N F V T S F T F V I N A P N778 agttacaacgttgccgacgggtttacgttcttcatcgcacctgtaS Y N V A D G F T F F I A P V823 gatactaagccgcagaccggcggtggatatctcggagttttcaatD T K P Q T G G G Y L G V F N868 agcgcagagtatgataaaaccactcaaactgttgctgtggagtttS A E Y D K T T Q T V A V E F913 gacactttctataatgctgcatgggatccaagcaacagagatagaD T F Y N A A W D P S N R D R958 catattggaatcgatgtgaacagtatcaaatccgtaaacactaagH I G I D V N S I K S V N T K1003 tcgtggaagttgcagaatggtgaagaggctaatgttgtgatagctS W K L Q N G E E A N V V I A1048 tttaatgctgctactaatgtgttaactgttagtttaacttatcctF N A A T N V L T V S L T Y P1093 aattcacttgaggaagagaatgtaactagttatactcttagcgacN S L E E E N V T S Y T L S D1138 gttgtgtctttgaaggatgttgttcctgagtgggtaaggattggtV V S L K D V V P E W V R I G1183 ttctcagctaccacaggagcagaatatgcagcacatgaagttcttF S A T T G A E Y A A H E V L1228 tcatggtcttttcattctgagttgagtggaacttcaagttctaagS W S F H S E L S G T S S S K1273 caagctgcagatgcatag 1290Q A A D A *2.4 同源性分析2.4.1 blastn分析网址如下:/Blast.cgi。序列M18160.1的blastn分析结果如图2-5。图2-5 序列M18160.1的blastn分析结果2.5蛋白质序列的基本性质分析2.5.1 蛋白质的分子量与氨基组成采用BioEdit软件对蛋白质一级序列分析,分析结果如下Protein: pslLength = 275 amino acidsMolecular Weight = 30268.12 DaltonsAmino Acid Number Mol% Ala A 23 8.36 Cys C 0 0.00 Asp D 13 4.73 Glu E 14 5.09 Phe F 19 6.91 Gly G 14 5.09 His H 4 1.45 Ile I 15 5.45 Lys K 13 4.73 Leu L 19 6.91 Met M 2 0.73 Asn N 19 6.91 Pro P 8 2.91 Gln Q 9 3.27 Arg R 5 1.82 Ser S 28 10.18 Thr T 31 11.27 Val V 24 8.73 Trp W 5 1.82 Tyr Y 10 3.64图2-6氨基酸组成分析由分析有结果可知,该蛋白质分子量为30268.12 Daltons,共有275个氨基酸,其中含有18个强碱性氨基酸(K,R)、27个强酸性氨基酸(D,E)、105个疏水性氨基酸(A,I,L,F,W,V)和97个极性氨基酸(N,C,Q,S,T,Y)。2.5.2蛋白质等电点(pI)分析采用DNAMAN软件对蛋白质序列进行等电点(pI)分析,分析结果如图2-7所示。图2-7 蛋白质等电点分析蛋白质等电点pI=4.66,由此可知该蛋白为一个酸性蛋白质。在Ph7.0的环境中他带有-8.05电荷。2.5.3蛋白质疏水性分析网址如下:/tools/protscale.html图2-8蛋白质疏水性分析2.5.4信号肽预测网址为http:/genome.cbs.dtu.dk/services/SignalP-2.0/,对该蛋白质进行信号肽预测,结果如图2-9所示。图2-9蛋白质信号肽预测预测结果显示,该蛋白质存在信号肽的概率为37.8%,在区间30与31之间。2.5.5跨膜区分析网址为http:/genome.cbs.dtu.dk/services/TMHMM-2.0/,对该蛋白质进行跨膜区分析,结果如图2-10所示:图2-10蛋白质跨膜区分析分析结果表明该蛋白质跨膜区为9到26之间。2.6蛋白质功能预测2.6.1功能分析NCBI对蛋白质进行Blastp分析, 对氨基酸序列的保守区域进行分析,结果显示没有特殊结构域。网址为/Blast.cgi。2.6.2磷酸化位点分析网址为http:/genome.cbs.dtu.dk/services/NetPhos/,对该蛋白质进行磷酸化位点分析,结果如图2-11所示。图2-11磷酸化位点分析由磷酸化位点分析(如图2-11)得知,有11个Ser,8个Thr,2个Tyr可能成为蛋白激酶磷酸化的位点。2.6.3糖基化位点分析网址为http:/www.cbs.dtu.dk/services/NetNGlyc/,对该蛋白质进行糖基化位点分析,结果如图2-12所示。图2-12糖基化位点分析由糖基化位点分析(如图2-14)得知,分别在29处和217处的位置各存在一个糖基化位点。2.7蛋白质结构预测2.7.1二级结构预测网址为http:/npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_phd.html,对蛋白质二级结构预测结果如图2-13所示。图2-13蛋白质二级结构预测二级结构分析结果表明,该序列以延伸主链(Extended strand)为主,共有117个,所占比例为61.26%,其余氨基酸序列为无规卷曲(Random
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 李老师不会做课件的原因
- 餐饮股东合作协议书范本与餐饮股东合作协议范本4篇
- 李清照正式课件
- 2025年盐城市中考英语试题卷(含答案)
- 家具体业生产安全培训课件
- 2025年碳纤维增强塑料项目申请报告模范
- 李树整形修剪课件
- 文档资金监管委托合同3篇
- 工程施工合同补充协议书6篇
- 2025年电子线圈设备项目规划申请报告
- 2025年本科院校团委笔试备考手册
- GB/T 45940-2025网络安全技术网络安全运维实施指南
- 敦煌课件讲解稿子
- 教育与宗教分离课件
- 2025年环境工程师初级职称考试试题及答案解析
- 眼科特检基础知识培训课件
- 高考历史一轮复习资料(人教版)专题二古代中国的农耕经济专题质量检测(A卷)
- 2025 年小升初沈阳市初一新生分班考试数学试卷(带答案解析)-(人教版)
- 统编版高中思想政治必修1第一课社会主义从空想到科学、从理论到实践的发展1.2科学社会主义的理论与实践 教学课件
- 摄影剪辑基本知识培训课件
- 高校学管中心面试真题与答案解析
评论
0/150
提交评论