梨小食心虫线粒体基因全分析及进化树的构建毕业论文.doc_第1页
梨小食心虫线粒体基因全分析及进化树的构建毕业论文.doc_第2页
梨小食心虫线粒体基因全分析及进化树的构建毕业论文.doc_第3页
梨小食心虫线粒体基因全分析及进化树的构建毕业论文.doc_第4页
梨小食心虫线粒体基因全分析及进化树的构建毕业论文.doc_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

梨小食心虫线粒体基因全分析及进化树的构建摘要:伴随着生物信息学的发展,现在越来越多的学科接受了生物信息学的分析手段和分析方法,并将生物信息学的分析结果作为验证实验成果的有力依据。梨小食心虫的危害也越来越突出,并且梨小食心虫的研究也已经进入了分子研究阶段,非常需要生物信息学的科学分析方法和分析结论,为其分子水平的结果作有力论证。本论题的研究主要内容为运用生物信息学的各种成熟软件对从NCBI数据库中获取的梨小食心虫体内的线粒体基因全序列进行生物学分析,重点对基因的数列、外显子信息、编码蛋白及其理化性质进行分析,并预测其编码蛋白的结构与功能,并通过与代表性的生物进行同源进化树的构建。通过实验论证,我们得出梨小食心虫线粒体基因的NCBI的登录号NC 014806,基因全长为15717bp,为一环形的双链DNA,于67487299处存在一个长552bp的开放阅读框,可编码为183个氨基酸,其翻译的蛋白质为酸性蛋白,亲水性较强,且以螺旋肽链盘绕为主,其序列与日本的野桑蚕线粒体有很高的同源性。经过与八种物种进行多序列比对,构建进化树,我们可以得知梨小食心虫与其中的茶小卷叶蛾、朝灰蝶进化关系关系最近。关键词:生物信息学;梨小食心虫;线粒体基因序列;基因分析;进化树 The complete analysis of Grapholita molesta mitochondrial DNA and the construction of the evolutionary treeAbstract: With the development of bioinformatics, more and more subjects accept of the tools and analytical methods of bioinformatics, and the result of bioinformatics analysis can be as a strong basis for the verification. Grapholitha molestas hazards has become increasingly prominent, and Grapholitha molestas research has entered a phase of molecular studies, a great need for the scientific analysis methods and conclusions of the bioinformatics, make a strong argument for the results of its molecular.The main content of this study is to use a variety of sophisticated bioinformatics software to analysis the mitochondrial gene sequences of the pear borer obtained from the NCBI database , focusing on the gene sequence, exon information,coding proteins and their physical and chemical properties, and forecast its encoded protein structure and function, to expect the valuable biological data obtained from the mass of biological data, and to construct the evolution tree through the compare with the representation of the biology. Through experiments, we can know that the Grapholitha molesta mitochondrial gene sequences is circular double-stranded DNA, the NCBI accession number for the NC 014806, Full-length is 15717bp,and between 6748 and 7299 exist of a long open reading frame of 552bp, encoding 183 amino acids,whose translation of the protein is acidic protein, a strong hydrophilic, and coiled-based by -helical peptide chain, the sequence have a high homology with the Japan wild silkworm mitochondria. Through the construction of evolutionary tree, we know that Grapholitha molesta with Adoxophyes honmai and Coreana raphaelis have the recently evolutionary relationship in the eight species. Key words:Bioinformatics;Grapholitha molesta;mitochondrial DNA sequence;Genetic analysis; evolutionary tree;1 前言(Introduction)52 材料和方法(Marerials and Methods)62.1 研究思路62.2 搜索基因72.2.1 在NCBI中搜索梨小食心虫线粒体全基因序列72.2.2 用DNAMAN分析其基因结构72.2.3 碱基同源性分析的方法72.2.4 开放性阅读框(ORF)分析的方法72.3 基因编码蛋白质的理化性质分析72.3.1 氨基酸组成、分子质量、等电点分析方法72.3.2 亲疏水性分析方法82.4 基因编码蛋白质的结构分析82.4.1 蛋白质的二级结构分析82.4.2 蛋白质的三级结构分析82.5 基因编码蛋白质的功能分析92.5.1 信号肽预测的方法92.5.2 磷酸化位点分析的方法92.5.3 亚细胞定位的方法92.5.4 二硫键分析的方法102.6 构建系统进化树102.7 生物信息学主要软件介绍112.7.1 DNAMAN112.7.2 ExPaSy112.7.3 Clustalx123 结果与分析(Results and Analysis)123.1 梨小食心虫线粒体基因的获取与分析123.1.1 梨小食心虫线粒体全基因序列的获取123.1.2 DNAMAN对基因序列的分析 梨小食心虫mtDNA基因组结构 梨小食心虫mtDNA基因组核苷酸组成 梨小食心虫线粒体基因组tRNA结构分析123.1.3 碱基同源性分析133.1.4 开放性阅读框(ORF)分析133.2 基因编码蛋白质的理化性质分析133.2.1 氨基酸组成、分子质量、等电点分析133.2.2 疏水性分析143.3 基因编码蛋白质的结构分析143.3.1 蛋白质二级结构分析143.3.2 蛋白质三级结构分析143.4 基因编码蛋白质的功能分析143.4.1 信号肽预测143.4.2 磷酸化位点分析143.4.3 亚细胞定位143.4.4 二硫键分析143.5 构建系统进化树154 总结和展望(Summary and Outlook)15参考文献16致谢17附录181、前言(Introduction)英国自然杂志网络版2006年5月18日报道,科学家已对含有2.23亿个碱基对,占人类基因组中碱基对总量的8%左右的人类第一号染色体完成测序,宣告持续16年的人类基因组计划全部完成。作为人类自然科学史上重要的里程碑,“人类基因组”的研究已从“结构基因组”阶段进入“功能基因组”阶段。在人类基因组计划后相继推出的水稻基因组计划、马铃薯基因组计划、草鱼基因组计划等,和快速增长的微生物基因测序,“海量”的基因信息的积累,催生了“功能基因组”时代的来临。针对充分利用“海量”基因组信息的生物信息学不仅应运而生,而且为以注释、阐明基因功和利用基因生物学功能的“后基因组时代”的研究发挥了重大作用。生物信息学是把基因组DNA序列信息分析作为源头,在获得了蛋白质编码区的信息后,进行蛋白质空间结构的预测和模拟,然后依据特定蛋白质的功能进行必要的药物设计。就是说,生物信息学的主要任务是组织和分析生物学数据,而生物学数据的分析离不开计算机算法的运用。因此,可以说生物信息学是一门集生命科学、计算机科学、数学、物理学为一身的多学科交叉的前沿学科。动物mtDNA属母系遗传,是共价闭合的双链DNA分子,核酸序列和组成比较保守,基因的排列顺序比较稳定而且紧密,无重组和单拷贝。由于其结构和进化上的特点,mtDNA已成为研究动物起源进化以及群体遗传分化的理想对象。昆虫mtDNA大小约为154163kb,其基因组大小的变化受A+T-rich区长度变化的影响十分显著。A+T-rich区(A+T丰富区)的长度最短为399 bp,最长达4601 bp,两者相差4202bp,前者见于Tricholepidion gertschi,后者见于黑尾果蝇Drosophila melanogaster。昆虫线粒体基因组由2个rRNA基因(1rRNA和srRNA)、22个tRNA基因、13个蛋白编码基因Cytb基因(细胞色素b基因,cytochrome oxidase b),ATPase6和ATPase8(ATP酶亚基基因6和8,ATP synthase subunits 6 and 8),CO、CO和CO(细胞色素氧化酶亚基基因-,cytochrome oxidasesubunit -),NDl-6和ND4L(NADH降解酶基因16和4L,NADH dehydrogenase subunit 1-6 and 4L),共37个基因和1个包含复制启动子的非编码区(A+T-rich区)组成。Aloni 和 Attardi将mtDNA两条链中密度较小者命名为轻链(L链),另一条命名为重链(H链)。考虑到昆虫mtDNA没有明显的L链与H链之分,Simon等根据昆虫mtDNA中多数基因都是从一条链上转录的特点,将这一条链定义为J链,另一条链定义为N链1-3。自Wolstenholme和Clary第一个报道了果蝇Drosophila yakuba mtDNA全序列以来,GenBank已收录了80余种昆虫mtDNA全序列,其中双翅目昆虫有15个种。在双翅目实蝇科昆虫中,地中海实蝇Ceratis capitata和油橄榄果实蝇Bactrocera oleae的线粒体基因组全序列已有报道4。梨小食心虫,学名Grapholitha molesta (Busck),简称“梨小”,别名有梨小蛀果蛾、东方果蠹蛾、梨姬食心虫、桃折梢虫、小食心虫、桃折心虫。属于鳞翅目(Lepidoptera),小卷叶蛾科(Olethreutidae)。梨小在各地果园均有发生,是梨树的重要害虫,在梨、桃树混栽的果园为害尤为严重。梨小除为害梨、桃树外,也为害李、杏、苹果、山楂等,严重影响果品质量及梨果产量,尤其是长江、黄河流域最严重5。因此,我的论文是通过NCBI下载的梨小食心虫的全线粒体基因,并对其结构和功能进行分析。2、材料和方法(Marerials and Methods)2.1、研究思路1、基因序列的获取 2、基因序列的分析 3、同源性分析 4、开放阅读框的分析 梨小食心虫线粒体基因序列1、蛋白质理化性质分析 2、蛋白质二级结构分析 3、蛋白质三级结构分析 梨小食心虫线粒体蛋白质序列与同源性最相近的物种进行进化树的构建 进化树的构建基因的功能结构及科研意义 得出结论2.2、搜索基因2.2.1、在NCBI中搜索梨小食心虫线粒体全基因序列方法:首先进入NCBI的官网/,在Search中选择All Databases,在查询框中输入Grapholita molesta mitochondrion,点击Search,然后选择Geneome,总共出现一条记录,即选择NC 014806, Display 选择为Genbank,选择Download中的Genbank格式,即可下载得到梨小食心虫的线粒体全基因序列。2.2.2、用DNAMAN分析其基因结构对于获取的海量数据,我们要先进行一些基本的分析,确定基因的分子量、碱基的组成等信息。方法:选取梨小食心虫的线粒体基因,选取显示的方式为包含cds,点击确认,即可。2.2.3、碱基同源性分析的方法方法:进入网址:/BLAST/,在序列中提交NC 014806,其他选项默认设置。通过在线的BLAST的比对,可以找到与梨小食心虫线粒体同源性最高的物种,从而可通过研究其同源性高的物种,间接研究该物种,为该物种的进一步研究提供一定的理论依据。2.2.4、开放性阅读框(ORF)分析的方法方法:利用NCBI的ORF Finder程序对NC 014806做开放性阅读框分析。网址如下:/projects/gorf/orfig.cgi参数选择:Genetic Codes:1 Standard开放阅读框open reading frame,0RF 是结构基因的正常核苷酸序列,从起始密码子到终止密码子的阅读框可编码完整的多肽链,其间不存在使翻译中断的终止密码子。ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的部分或全部的先决条件6。通过ORF的分析,我们可以确定全基因中哪段基因片段可以翻译为蛋白质,从而为特定蛋白质的功能的确定提供依据。2.3、基因编码蛋白质的理化性质分析利用ExPaSy中的Protparam和Protscale进行蛋白质的氨基酸组成、分子质量、等电点以及疏水性分析7。2.3.1、氨基酸组成、分子质量、等电点分析方法利用ExPaSy软件包中的Protparam工具进行氨基酸组成、分子质量、等电点分析网址如下:/cgi-bin/protparam通过氨基酸组成、分子质量、等电点分析,我们可以确定编码蛋白的最基本性质,为进一步研究蛋白质的二级结构、三级结构提供依据。2.3.2、亲疏水性分析方法利用瑞士生物信息学研究所(Swiss Institute of Bioinformatics, SIB)的ExPASy服务器上的ProtScale程序对ORF 翻译后的氨基酸序列SEQUENCE进行亲疏水性分析网址如下:/cgi-bin/protscale.pl参数选择:Hphob. / Kyte & Doolittle正值表明疏水,负值表明亲水。通过疏水性分析,可以让我们了解蛋白质是否属于亲水蛋白。2.4、基因编码蛋白质的结构分析2.4.1、蛋白质的二级结构分析方法:利用Expasy服务器下的SWISS-MODEL中的Psipred进行蛋白序列的二级结构分析网址:/workspace/index.php?func=tools_targetidentification1蛋白质二级结构:指蛋白质肽链本身的折叠和盘绕的方式。二级结构主要有-螺旋、-折叠、-转角。常见的二级结构有-螺旋和-折叠。二级结构是通过骨架上的羰基和酰胺基团之间形成的氢键维持的,氢键是稳定二级结构的主要作用力。蛋白质二级结构预测,是通过氨基酸序列,预测蛋白质二级结构的过程。氨基酸序列具有不同的长度,不同的氨基酸排列顺序。实验分析表明这种差异能够形成不同的蛋白质结构。研究蛋白质的结构意义重大,不但有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,认识蛋白质与蛋白质之间的相互作用,而且对生物学、医学和药学都有非常重要的作用8。2.4.2、蛋白质的三级结构分析方法:将分析的结果向蛋白质立体结构数据库PDB ( Protein Data Bank)提交该蛋白质序列,利用RasMol软件显示该蛋白的三维分子结构蛋白质三级结构(protein tertiary structure): 蛋白质分子处于它的天然折叠状态的三维构象。三级结构是在二级结构的基础上进一步盘绕,折叠形成的。三级结构主要是靠氨基酸侧链之间的疏水相互作用,氢键,范德华力和盐键(离子键)维持的。此外共价二硫键在稳定某些蛋白质的构象方面也起着重要作用。通过研究蛋白质的三级结构,可以让我们更直观的通过其结构了解其功能性,从而为蛋白质功能的确定提供有力的依据9。2.5、 基因编码蛋白质的功能分析2.5.1、信号肽预测的方法方法:利用丹麦科技大学(DTU)的CBS服务器蛋白质序列的信号肽(signal peptide)预测,进入Prediction Serves 页面。网址如下:http:/www.cbs.dtu.dk/services/SignalP/参数选择:Eukaryotes;Both;GIF (inline);Standard信号肽,常指新合成多肽链中用于指导蛋白质的跨膜转移(定位)的N-末端的氨基酸序列(有时不一定在N端)。信号肽位于分泌蛋白的N端。一般由1530个氨基酸组成。包括三个区:一个带正电的N末端,称为碱性氨基末端:一个中间疏水序列以中性氨基酸为主,能够形成一段d螺旋结构,它是信号肽的主要功能区;一个较长的带负电荷的C末端,含小分子氨基酸,是信号序列切割位点也称加工区。信号肽的作用,可使正在翻译的核糖体附着到RER膜上,还可以在信号肽指引下蛋白质在细胞内10。通过信号肽的预测,可以让我们知道蛋白质是如何跨膜转移的。2.5.2、磷酸化位点分析的方法方法:磷酸化和去磷酸化是细胞内信号传导的重要方式,利用丹麦科技大学(DTU)的CBS服务器上的NetPhos2.0 Server程序做磷酸化位点分析。NetPhos2.0 Server程序是基于神经网络算法,对蛋白序列中的Ser、Thr和Tys三种氨基酸残基可能成为的磷酸化位点作出预测。网址如下:http:/www.cbs.dtu.dk/services/NetPhos/蛋白质磷酸化是最常见、最重要的一种蛋白质翻译后修饰方式,它参与和调控生物体内的许多生命活动.通过蛋白质的磷酸化与去磷酸化,调控信号转导、基因表达、细胞周期等诸多细胞过程.随着蛋白质组学技术的发展和应用,蛋白质磷酸化的研究越来越受到广泛的重视11。2.5.3、亚细胞定位的方法方法:通过WoLF PSORT工具基于其氨基酸序列预测蛋白质亚细胞定位点网址如下:http:/wolfpsort.seq.cbrc.jp/参数选择:Fungi;From Text Area亚细胞定位是指某种蛋白或表达产物在细胞内的具体存在部位。例如在核内、胞质内或者细胞膜上存在。GFP是绿色荧光蛋白,在扫描共聚集显微镜的激光照射下回发出绿色荧光,从而可以精确地定位蛋白质的位置12-14。2.5.4、二硫键分析的方法运用scratch protein Predictor 对蛋白质的二硫键做出分析。网址如下:/baldig/scratch/index.html 参数选择:Dlpro(Disulfide Bonds)二硫键是指两个硫原子之间形成的共价键,一般指多肽链中的两个半胱氨酸残基侧链的硫原子之间形成的共价键。对于维持许多蛋白质分子的天然构象和稳定性十分重要。二硫键与蛋白质高级结构的生物活性有关同时与蛋白质的复性也有关联。如核糖核酸酶A经巯基乙醇(还原剂)和尿素(蛋白质变性剂)处理后,发生变性作用,四对二硫键断裂,多肽链伸展开来,高级结构发生变化,失去生物活性。如果用透析法将大量还原剂和变性剂除去,在微量还原剂存在下,四对二硫键在原来的位置重新形成,伸展开的多太肽链会自发折叠成天然构象,生物活性得到恢复。次试验也证明蛋白质高级结构的信息存在于一级结构中15。2.6、 构建系统进化树选取不同进化层次的典型物种基因,利用ClustalX 软件的N-J法构建系统进化树。方法:1、序列的输入将Fasta格式的多序列文件在Clustal X中的file菜单下的“load sequence ”中导入,读取多重序列数据文件。2、序列的多重比对和比对结果的输出在Clustal X中选择Alignment菜单下的“outputformat options”设定输出格式,然后选择“Do Complete Alignment”,对序列做多重比较,同时生成所需的多重序列比较文件 *.aln文件。3、打开mega 4.1,选择file菜单下的“convert to mega format”,弹出分析文件的对话框,点击文件夹图标,从目的文件夹中选中Clustal X 比对分析后产生的*.aln文件,此时即转换到准备分析的目标文件夹,将其转换为meg格式的文件。之后用“open data”将其导入到mega 中进行系统树构建。4、构建进化树在mega中,先选择Phylogeny菜单下的“Construct Tree”,然后再选择“Neighbor-Jioning(NJ)”来构建NJ树,并保存树文件。此次构建系统进化树,主要采用的软件是clustalx,选取的进化树构建物种为有代表性的动植物,通过和其同源性比较相近的线粒体基因,构建系统进化树,从而确定梨小食心虫在进化系统中的地位和其他物种的亲缘关系。算法选用邻位相邻算法(neighbor joining,NJ),原因在于它是一种距离矩阵算法,不仅可以计算两两的比对距离,还对整个树的长度进行最小化,从而对树的拓扑结构进行了限制,是目前应用最广泛的基于距离的算法16。主要采用的物种有:1、梨小食心虫线粒体(Grapholita molesta mitochondrion)NCBI登录号为gi|315270918|ref|NC_014806.1|2、中国桑野蚕线粒体(Bombyx mandarina from China mitochondrion)NCBI登陆号为gi|291575900|gb|GU966621.1|3、日本桑野蚕线粒体(Bombyx mandarina from Japan mitochondrion)NCBI登陆号为gi|291575508|gb|GU966593.1|4、桑尺蠖线粒体(Phthonandria atrilineata mitochondrion)NCBI登陆号为gi|170522569|gb|EU569764.1|5、中国二化螟线粒体(Chilo suppressalis mitochondrion)NCBI登陆号为gi|291575900|gb|GU966621.1|6、茶小卷叶蛾线粒体(Adoxophyes honmai mitochondrion)NCBI登录号为gi|291575900|gb|GU966621.1|7、美国白蛾线粒体(Hyphantria cunea mitochondrion)NCBI登陆号为gi|290758069|gb|GU592049.1|8、朝灰蝶线粒体(Coreana raphaelis mitochondrion)NCBI登陆号为gi|68272052|gb|DQ102703.1|9、蔗螟线粒体(Ostrinia furnacalis mitochondrion)NCBI登陆号为gi|18314304|ref|NC_003368.1|共九种进行系统进化树的构建, 参数选择为默认参数2.7、生物信息学主要软件介绍2.7.1 DNAMAN DNAMAN是美国LynnonBiosoft公司开发的高度集成化的分子生物学综合应用软件,可以用于多序列比对、PCR引物设计、限制性酶切分析、质粒绘图、蛋白质分析等,几乎囊括了所有日常核酸、蛋白质序列的分析工作。2.7.2 ExPaSyExPASy是Expert Protein Analysis System的缩写,从字面理解即为专业蛋白质分析系统.从取名就可以看出网站背后的牛人们的气势和专业精神。ExPASy由瑞士生物信息学研究所维护(Swiss Institute of Bioinformatics ),提供从序列(Swiss-Prot)到结构(Swiss-Model),以及2-D Page等蛋白质操作相关的全套服务。2.7.3 ClustalxCLUSTALX是CLUSTAL多重序列比对程序的Windows版本。Clustal X为进行多重序列和轮廓比对和分析结果提供一个整体的环境。序列将显示屏幕的窗口中。采用多色彩的模式可以在比对中加亮保守区的特征。窗口上面的下拉菜单可让你选择传统多重比对和轮廓比对需要的所有选项17,18。 3、结果与分析(Results and Analysis)3.1、梨小食心虫线粒体基因的获取与分析3.1.1、梨小食心虫线粒体全基因序列的获取通过NCBI,得到梨小食心虫线粒体的登陆号为:NC 014806,具体序列见附录1。3.1.2、DNAMAN对基因序列的分析通过DNAMAN软件对梨小食心虫的线粒体基因进行分析,可以得到如下结论,具体分为以下三点结论,具体分析图见附录1:、梨小食心虫mtDNA基因组结构梨小食心虫线粒体基因组全长15717bp,为一环形的双链DNA(见附录1-1)。其长度比油橄榄果实蝇(15815bp)短98 bp,比地中海实蝇(15 980 bp)短263bp。梨小食心虫线粒体基因组全序列已录入GenBank数据库,序列号为NC_014806。梨小食心虫mtDNA由22个tRNA,2个rRNA,13个蛋白编码基因以及一个包含起始复制和转录的控制区(A+T-rich区)组成。从J链编码的基因有C0-、ND2、ND3、ND6、ATP6、ATP8、Cvt6和13个tRNA基因(包括tRNA-11e、tRNA-Met、tRNA-Trp、tRNA-Leu-UUR、tRNA-Lys、tRNA-Asp、tRNA-Gly、tRNA-Ala、tRNA-Arg、tRNA-Asn、tRNA-Ser-AGN、tRNA-G1u和tRNA-Thr),从N链编码的基因有NDl、ND4、ND4L、ND5、lrRNA、srRNA和9个tRNA基因(包括tRNA-Gln、tRNA-Cys、tRNA-Pro、tRNA-Tyr、tRNA-Phe、 tRNA-Leu-CUN、tRNA-His 和 tRNA-Val、tRNA-Ser-UCN)。、梨小食心虫mtDNA基因组核苷酸组成梨小食心虫mtDNA基因组核苷酸组成在梨小食心虫线粒体基因组全序列中,各碱基的总含量分别是40.3% A,11.2% C,7.9% G,40.6% T,AT总含量高达51.8,表现出昆虫线粒体基因组中著名的“A+T偏好性”。、梨小食心虫线粒体基因组tRNA结构分析在梨小食心虫mtDNA的22个tRNA中,除亮氨酸(Leu)和丝氨酸(ser)所对应的tRNA有2个以外,其他的氨基酸都只有一个tRNA与之对应。21个tRNA均有规则的三叶草结构,仅tRNAser(AGN)无D臂,由8个核苷酸取代了该位置,这是节肢动物线粒体基因组的一个普遍特征。具体如下图:基因/控制区位置基因/控制区位置tRNA-Met1-68tRNA-Asn6072-6140tRNA-Ile69-133tRNA-Ser-AGN6141-6202tRNA-Gln131-199tRNA-Glu6203-6276ND2262-1260tRNA-Phe6277-6341tRNA-Trp1261-1327ND56325-8058tRNA-Cys1327-1385tRNA-His8076-8140tRNA-Tyr1386-1452ND48079-9479CO1453-2990ND4L9480-9794tRNA-Leu- UUR2991-3056tRNA-Thr9795-9868CO3057-3738tRNA-Pro9869-9934tRNA-Lys3739-3809ND69935-10461tRNA-Asp3812-3878CYTB10462-11637ATP83879-4040tRNA-Ser- UCN11638-11701ATP64034-4711ND111721-12659CO4919-5507tRNA-Leu- CUN12660-12728tRNA-Gly5510-5575l-rRNA12729-14107ND35576-5929tRNA-Val14107-14172tRNA-Ala5930-5996s-rRNA14173-14946tRNA-Arg5997-6071D-loop14947-157173.1.3、碱基同源性分析通过分析结果可得知:分析图见附图2和附图3。梨小食心虫的线粒体全基因与日本的野桑蚕线粒体(Bombyx mandarina from Japan mitochondrion)最为相似,高达到了99%。3.1.4、开放性阅读框(ORF)分析通过分析可得:分析过程见附录4、附录5。序列NC 014806,67487299位存在一个长552bp的开放阅读框,编码为183个氨基酸,起始密码子为ATG,终止密码子为TAG,在此将该阅读框命名为SEQUENCE,方便以后使用。3.2、基因编码蛋白质的理化性质分析3.2.1、氨基酸组成、分子质量、等电点分析试验结果表明, SEQUENCE蛋白质分子式为C1024H1603N241O243S5,原子总数为3116,分子质量为21338.7,等电点为9.40。在氨基酸组成上亮氨酸33,占18%,异亮氨酸32个,占17.5%,苯丙氨酸,15个,占8.2%,甘氨酸 1236个,占8.0%。氨基酸对应的英文名称和单个字母缩写见附录5-1。3.2.2、疏水性分析分析可得到结果:分析过程见附录6,得知该蛋白有4个疏水性区域14个亲水区域。3.3、基因编码蛋白质的结构分析3.3.1、蛋白质二级结构分析经分析可得:分析图见附录7、8、9。SEQUENCE的二级结构,主要以-螺旋,不规则盘绕和延伸链为蛋白最大量的结构元件,-折叠散布于整个蛋白质中。3.3.2、蛋白质三级结构分析结果见附录10。3.4、基因编码蛋白质的功能分析3.4.1、信号肽预测分析可得结果:具体图谱见附录11、12。由附录11、12分析,可知信号肽序列为:MAGITANYEFDLKKIIALSTLRQLGLIIRILRIGLP,具体对应的氨基酸见图5-1,在生物体内,蛋白质的合成场所与功能场所常常被一层或多层细胞膜所隔开,这样就产生了蛋白质转运的问题。核糖体是真核生物细胞内合成蛋白质的场所,几乎在任何时候,都有数以百计或千计的蛋白质离开核糖体并被输送到细胞各个部分,以补充细胞的物质成分和更新细胞功能。由于细胞各部分都有特定的蛋白质组分,因此,合成的蛋白质必须准确无误地定向运送才能保证生命活动的进行。一般认为,蛋白质定位的信息存在于该蛋白质自身结构中,并且通过与膜上特殊受体的互相作用得以表达。在起始密码子后,有一段编码疏水性氨基酸序列RNA片段,这个氨基酸序列就称为信号序列。含有信号肽的蛋白质一般能够被分泌到细胞外,可能作为重要的细胞因子起作用,从而具有潜在的应用价值。SEQUENCE的第36 -37位之间有信号肽的剪切位点。3.4.2、磷酸化位点分析通过分析可得结论:具体图谱见附录13和附录14。由磷酸化位点分析,有1个Ser,1个Thr,2个Tyr可能成为蛋白激酶磷酸化位点。3.4.3、亚细胞定位结果如下:k used for kNN is: 27queryProtein details mito: 15.0, plas: 5.0, E.R.: 3.0解释:mito为线粒体、plas为质粒、E.R为 内质网由上可得结论:亚细胞定位分析可知SEQUENCE最有可能存在线粒体中。3.4.4、二硫键分析 由分析可知:具体见附录15,SEQUENCE含有3个Cys,共形成1个二硫键,分别连接着第56位和第86位Cys。绝大多数情况下二硫键是在多肽链的转角附近形成的。二硫键的形成并不规定多肽链的折叠,然而一旦蛋白质采取了它的三维结构则二硫键的形成将对此构象起稳定作用。假如蛋白质中所有的二硫键相继被还原将引起蛋白质的天然构象改变和生物活性丢失。在许多情况下二硫键可选择性的被还原。同时,该蛋白含有二硫键也使得该蛋白对热、对蛋白酶降解较为稳定。3.5、构建系统进化树最终获得的系统进化树如图:从上图我们不难看出,梨小食心虫与茶小卷叶蛾、朝灰蝶进化关系关系最近。4、总结和展望(Summary and Outlook)本章通过对梨小食心虫的线粒体基因序进行生物信息学的分析,总结结果如下:梨小食心虫线粒体基因的NCBI的登录号NC 014806,基因全长为15717bp,为一环形的双链DNA,并且于67487299处存在一个长552bp的开放阅读框,可编码为183个氨基酸,起始密码子为ATG,终止密码子为TAG。将其ORF出的氨基酸序列(命名为SEQUENCE)继续进行生物信息学的分析,SEQUENCE与目前数据库中存有的数据中具有明显的同源性,尤其与日本的野桑蚕线粒体高达99%。对其进行的一级结构分析和二级结构分析中,表明SEQUENCE是一个酸性蛋白,亲水性较强,疏水性较弱,信号肽序列为第36位第37位,亚细胞定位最大可能性为定位于线粒体。主要以-螺旋,不规则盘绕和延伸链为新蛋白最大量的结构元件,-折叠散布于整个蛋白质中。与此同时,经过与八种物种进行多序列比对,构建进化树,我们可以得知梨小食心虫与其中的茶小卷叶蛾、朝灰蝶进化关系关系最近。 通过这些分析数据,可以从功能、结构上获得有价值的信息,为下一步的研究及开发利用做出探索、提出可参考的研究方案。在人类基因组计划的推动下,以生物信息的采集、处理、存储、传布、分析和解释等多个方面为研究内容的生物信息学得到了很好的发展。本次通过运用生物信息学研究内容的一部分对一个基因序列的结构和功能进行了预测,为下一步研究方案的制定提供了依据,以期研究的顺利进行18。但是,不容忽视的是,目前生物信息还不是一个很完善的学科,所以通过生物信息获取的结论目前并不能直接转化为生产力,用于应用,更多的是作为别的学科的一个佐证,但是在不远的未来,生物信息获取的数据结果一定可以直接产生价值,用于实际的应用。所以,此次论文的写作,更多的是为未来更好的研究提供一种思路,一种方法,开拓新的视野。参考文献1 周润清,刘磊,刘凤章等.梨小食心虫的发生与防治.落叶果树,2007,(2):44-472 李伟,茅矛.生物信息学新进展第六届国际生物信息学和基因组研究年会综述.国外医学遗传学分册,1999,22(2):104-1073 郭志云,张怀渝,梁龙.生物信息学技术进展.生物技术通讯2004,5(3):313-3174 丁达夫,梁卫平,陈洁.生物信息学.1998,50,2(3):205 欧阳曙光,贺福初.生物信息学:生物实验数据和计算技术结合的新领域.科学通报,1999,44(14):1457-14686 文建平,李雄彪.数字透出的信息生命科学正在蓬勃发展.中国生物工程杂志,2004,24(4)7 王斌会.生命科学中的信息学生物信息学. 医学信息,2000,13(10):519-5208 陈铭.后基因组时代的生物信息学.生物信息学,2004,2(2):29-349 郑珩,王非.药物生物信息学.北京:化学工业出版社:现代生物技术与医药科技出版中心,200410 Attwood T.K., Pasrry-Smith D.J.著,罗静初等译.生物信息学概论.北京:北京大学出版社,200211 郝柏林,张淑誉编著.生物信息学手册.上海:上海科学技术出版社,200012 Andreas D.Baxevanis.The Molecular Biology Database Collection:2002 update.Nucleic Acids Research,2002,30(1):1-1213 张成岗,贺福初编著.生物信息学方法与实践:科学出版社,200214 Kyte J.Jensen,Skovgaard M,and Brunak S.Prediction of novel archaeal enzymes from sequence-derived features. Protein Science,2002,(11):2894-2898 15 Hofmann K., Bucher P., Falquet L.,Bairoch A.The Prosite database, its status in 1999.Nucleic Acids Research,1999,(27):215-21916 Blom,N., Gammeltoft, S.,and Brunak, S.Sequence-and structure-based prediction of eukaryotic protein phosphorylation sites. Journal of Molecular Biology,1999,294(5):1351-136217 王镜岩编著,生物化学(第三版),北京:北京大学出版社,124-12718 陈梅香,骆有庆,赵春江等.梨小食心虫研究进展.北方园艺2009,(8):144-147致谢附录附图1、梨小食心虫线粒体基因的核酸分析图SEQ NC_014806: 15717 bp;Composition 6328 A; 1767 C; 1239 G; 6382 T; 1 OTHERPercentage: 40.3% A; 11.2% C; 7.9% G; 40.6% T; 0.0%OTHERMolecular Weight (kDa): ssDNA: 4839.39 dsDNA: 9684.68COLOURS sequence = 1 features = 0FEATURES cds 262.1260 /name=ND2 cds 1460.2990 /name=COX1 cds 3057.3738 /name=COX2 cds 3879.4040 /name=ATP8 cds 4034.4711 /name=ATP6 cds 4719.5507 /name=COX3 cds 5576.5929 /name=ND3 cds 632

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论