版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
入侵物种紫茎泽兰的叶绿体全基因组分析入侵物种紫茎泽兰的叶绿体全基因组分析研究背景紫茎泽兰是危害最大的入侵物种之一,在世界范围内造成了严重的经济损失和环境破坏。然而,关于紫茎泽兰的序列资源和基因组信息却十分有限,使得其系统发育的鉴定以及进化方面的研究难以进行。这里我们报道了基于Illumina测序获得的紫茎泽兰完整叶绿体基因组。研究背景紫茎泽兰是危害最大的入侵物种之一,在世界范围内造成了研究背景叶绿体被认为是起源于蓝细菌的内共生作用,是植物所特有的细胞器,能进行光合作用来为植物和藻类提供必要的能量。它们有着自己的遗传复制机制,能对自己的基因组进行转录并进行母系遗传。在高等植物中,叶绿体基因组是一个大小在120到160bp的双链环状DNA分子。通常,陆生植物的叶绿体基因组在基因顺序、基因内容以及基因组组织方式上都是高度保守的。叶绿体基因组高度保守的特性以及低的进化速率说明它能较为统一地进行不同物种的比较性研究,但是在捕捉进化史上的事件时又具能产生有效的分歧,这使得其成为分子系统发育学以及分子生态学研究的合适且不可多得的工具。研究背景叶绿体被认为是起源于蓝细菌的内共生作用,是植物所特有研究背景紫茎泽兰是一种多年生草本植物,属于菊科(泽兰族)。它原产于中美洲,在墨西哥至哥斯达黎加均有分布,在十九世纪被作为观赏植物引进至欧洲,澳大利亚以及亚洲。紫茎泽兰能抑制那些本土植物生长,还能毒害动物。它最初是于二十世纪四十年代从缅甸入侵中国云南省,随后迅速地传播至中国南部及西南各省,包括贵州、广西、四川及重庆。如今它已经成为了当地环境中的优势种,影响了当地的生物多样性以及生态系统,在其入侵地区造成了严重的经济损失。研究背景紫茎泽兰是一种多年生草本植物,属于菊科(泽兰族)。它研究背景在过去的二十年间,大量基于叶绿体DNA序列数据的研究从种、属和族的水平上促进了我们对于被子植物进化上关系的理解。同时,叶绿体基因组在系统发生学、DNA条形码、光合作用研究以及最近的叶绿体转化上的重要性,使得越来越多的叶绿体基因组被测序。自从烟草的完整叶绿体基因组被首次公布以来,已有超过200个完整的叶绿体基因组被测序及分析。随着下一代测序技术的出现,由于其具有高通量、省时以及廉价等特点而被逐渐用于叶绿体基因组测序。研究背景在过去的二十年间,大量基于叶绿体DNA序列数据的研究研究背景尽管菊科有五个成员的叶绿体基因组已被测序完成,包括小油菊、向日葵、银胶菊(均属向日葵族)、莴苣(莴苣族)以及新疆千里光(千里光族),但目前并未有泽兰族物种的叶绿体基因组被测序完成。这里我们报道了使用Illumina高通量测序技术获得的紫茎泽兰完整叶绿体基因组序列。该叶绿体基因组序列将为紫茎泽兰种群的研究提供有用的遗传学工具,并帮助揭示外来物种入侵的遗传学和进化机制。研究背景尽管菊科有五个成员的叶绿体基因组已被测序完成,包括小材料和方法①叶绿体提取和DNA测序从中国云南腾冲县生长的紫茎泽兰中采集新鲜的叶子样本。采用向日葵细胞器分离所用的方法进行了叶绿体的分离。经DNA酶处理之后提取出了其叶绿体基因组DNA。构建了短插入片段文库,根据中国深圳BGI提供的操作流程使用IlluminaGAII进行测序。测序以51bp的单末端进行,进一步的图像分析以及碱基读出是使用IlluminaPipeline软件进行的。材料和方法①叶绿体提取和DNA测序材料和方法②基因组的装配和注释叶绿体基因组的过程中,首先使用perl脚本剔除了Illumina测序的低质量片段。随后我们比较了两种装配短片段序列的方法:其一:直接将质量筛选后的片段使用SOAPdenovo进行最小长度为100bp的重叠群的组装,随后使用BLAST软件将这些重叠群与向日葵叶绿体基因组进行比对(将其用作参考基因组),并将进行比对的重叠群按照参考基因组进行排列。材料和方法②基因组的装配和注释材料和方法其二:先使用BLAST从原始的质量筛选后的片段中捕捉叶绿体片段,并使用向日葵、小油菊、银胶菊、莴苣和烟草的叶绿体基因组作为参考。随后,这些捕捉的片段再通过使用SOAP
denovo组装成最小长度为100bp的重叠群,接着,通过与向日葵叶绿体基因组进行比对,将短的重叠群拼接成长的重叠群。最后,对照向日葵基因组使用原始片段的连贯序列来代替denovo重叠群之间的缺口,剩余的缺口通过使用PCR以及Sanger测序来进行填补。材料和方法其二:材料和方法叶绿体基因组的注释是是基于可用的在线程序DOGMA来进行的。tRNA基因的鉴定使用的是DOGMA和默认设置下的tRNAscan-SE。内含子位置的确定使用了向日葵叶绿体基因组中的内含子作为参考。叶绿体基因的功能分类参考了叶绿体基因组数据库。环形的cp基因图谱的绘制使用了OGDRAW软件。为了证实组装和注释的正确性,我们对大单拷贝区域和反向重复序列以及小单拷贝区域和反向重复序列之间的连接处进行了PCR以及测序来验证。材料和方法叶绿体基因组的注释是是基于可用的在线程序DOGMA材料和方法TableS1.Primersusedforgapfillingandassemblyvalidation.
Primer*Sequence(5’>3’)Ampliconsize1F:AGTTACTAATTATGATCTGGCATGTR:
ATAGCAATGAGATTCCCCAA5792F:TGGGGAGAAATGACAAGAR:TTTATCTTATTATTAATCACGGA10893(IR1/LSC)F:
TGTTGACCTAAAGCGTATR:TGAACCCTGTAGACCATC4634(LSC/IR2)FAAGCGTTGGCTAGGTAAGR:TAGCCAAGTGGATCAAGG8965(IR2/SSC)FCCA
GGGCTATGGAACAAAGR:AAACCACAACGACCGAAT6526(SSC/IR1)F:CTCGCTAACATTGAACTTGGR:ACCTCCCGTTCTTCATACTT660*Primerpairs1and2wereusedtofillthegapsoftheassembledgenome;Primerpairs3-6wereusedtoverifythejunctionsbetweentheIRsandSSC/LSCregions.材料和方法TableS1.Primersusedfo材料和方法③与菊科其它植物叶绿体基因组的比较以及标记的鉴定使用mVISTA软件来将紫茎泽兰cp基因组与菊科其他物种(包括向日葵、莴苣、银胶菊、小油菊和新疆千里光)进行比对。所有的在六个基因组中进行比对发现存在分歧的区域均被提取出来用于标记的鉴定。这些区域均使用手动调整过的ClustalW软件进行了比对。为获得这些区域的信息位点,使用最大简约法构建了系统发育树,所用软件为Mega4.0。简约信息位点、一致性指数(CI)以及保留指数(RI)的值也同样被计算了出来。材料和方法③与菊科其它植物叶绿体基因组的比较以及标记的鉴定材料和方法④重复结构以及序列分析使用TandemrepeatFinder软件进行了串联重复的分析。使用REPuter对散在重复序列进行了鉴定和定位,包括正向重复和回文重复,设置重复的一致性要大于90%(汉明距离<3),长度要大于30bp。在软件分析过后,我们对少于15bp的串联重复序列以及REPuter的冗余结果进行了手动剔除。材料和方法④重复结构以及序列分析材料和方法⑤系统发育分析选取了33个代表了被子植物所有家系的物种的cp基因组。选用了35个蛋白质编码基因:atpA,atpB,matK,petA,petB,petD,petG,petN,psaA,psaB,psbA,psbB,psbC,psbD,psbE,psbF,psbH,psbI,psbJ,psbK,psbN,psbT,rpoB,rpoC1,rpoC2,rps8,rps11,rps14,ycf3,ndhA,ndhD,ndhH,ndhF,rpoA以及rbcL。这35个基因在这33个叶绿体基因组中普遍存在。材料和方法⑤系统发育分析材料和方法序列通过ClustalW进行了比对。最大简约(MP)分析使用了PAUP*4.10。使用PhyMLv3.0进行了最大似然(ML)分析。使用了萍蓬草属和睡莲属作为外群。材料和方法序列通过ClustalW进行了比对。最大简约(MP结果和讨论①测序及基因组装配使用Illumina测序技术,我们获得了16,977,743个51bp长度的原始序列,包括11,117,985个唯一序列,筛选后获得了11,617,950条结果清晰的序列。随后我们比较使用了两种方法来对短片段进行装配:第一种:使用SOAPdenovo法直接进行富集,获得了12,161个重叠群,大小100到14,932bp,这些重叠群以向日葵的叶绿体基因组为参照进行排列,213个重叠群与参照基因组具有同源性。将排列的重叠群按照参照基因组的顺序进行了整理。使用此方法获得了一段长为145519bp的序列草图。结果和讨论①测序及基因组装配结果和讨论第二种方法是先从原始的质量筛选后的序列中捕捉叶绿体序列(在材料与方法中有介绍),总共获得了1,815,199条叶绿体基因组序列,总长度达90,759,950bp,为向日葵叶绿体基因组的510.66倍。随后,通过使用SOAP对获得的片段进行富集,得到了了190个重叠群,长度为100bp到8,810bp不等。这些重叠群按照向日葵叶绿体基因组进行了整理和排序。最后获得了一个长度为149,899bp的基因组草图。结果和讨论第二种方法是先从原始的质量筛选后的序列中捕捉叶绿体结果和讨论为了确定哪一种方法更好,把以上两个基因组草图与向日葵、莴苣、小油菊的叶绿体基因组进行了比对。序列比对发现两种方法富集得到的序列之间有95%的序列具有一致性,且第二种方法富集得到的基因组草图包含了一些第一种方法中缺失的区域。结果和讨论为了确定哪一种方法更好,把以上两个基因组草图与向日结果和讨论与向日葵叶绿体基因组相比,本研究中的基因组草图仍含有两处缺口。使用PCR以及Sanger测序对缺口进行了补全,由此得到了一个完整的150,698bp的紫茎泽兰叶绿体基因组。为了对富集结果进行验证,使用PCR对反向重复序列之间以及大/小单拷贝区域间的连接区域进行了扩增并进行了Sanger测序。我们将测序的结果与富集得到的基因组进行了直接比对,没有发现错配或者插入缺失,这就证实了富集结果的正确性。结果和讨论与向日葵叶绿体基因组相比,本研究中的基因组草图仍含结果和讨论②基因组内容及组织方式紫茎泽兰叶绿体基因组大小与其它被子植物相当。其叶绿体基因组GC含量为37.5%,这一点与已报道的其它菊科物种的叶绿体基因组相一致。大小单拷贝区域的GC含量分别为35.8%和30.1%,在反向重复序列中该值为43.0%。结果和讨论②基因组内容及组织方式结果和讨论结果和讨论结果和讨论紫茎泽兰叶绿体基因组包含有80个蛋白质编码基因,其中七个(rps19,rps7,rpl23,rpl2,ycf2,ndhB和ycf15)在反向重复序列中存在重复。此外,基因组中分布着有编码全部20种氨基酸的28个tRNA基因(1个发现于SSC,20个发现于LSC,7个发现于IR中)。在该基因组中还鉴定出了4个rRNA基因,位于反向重复序列中。结果和讨论紫茎泽兰叶绿体基因组包含有80个蛋白质编码基因,其结果和讨论总的来说,紫茎泽兰叶绿体基因组中存在130个基因,其中14个基因(8个蛋白质编码基因以及6个tRNA基因)含有一个内含子,3个基因(rpoC1,ycf3,clpP)含有两个内含子。结果和讨论总的来说,紫茎泽兰叶绿体基因组中存在130个基因,结果和讨论在这17个含有内含子的基因中,有12个位于LSC之中(包括8个蛋白质编码基因和4个tRNA编码基因,其中9个含有一个内含子,3个含有两个内含子),4个位于IR中(两个蛋白质编码基因和两个tRNA编码基因,均只含一个内含子),1个位于SSC中(单内含子)。结果和讨论在这17个含有内含子的基因中,有12个位于LSC之rps12是一个反式拼接基因,其5'端的外显子位于大单拷贝区域而其重复的3'端外显子位于反向重复序列中。trnK-UUU有着最大的内含子(1,559bp),其中含有另一个基因matK。结果和讨论rps12是一个反式拼接基因,其5'端的外显子位于大单拷贝区结果和讨论编码内容蛋白质tRNArRNA比例49.56%2.32%5.94%除此之外,剩下的42.18%为非编码区域,其中包含了内含子、基因间隔区以及假基因。结果和讨论编码内容蛋白质tRNArRNA比例49.56%2.结果和讨论结果和讨论结果和讨论③与菊科其它植物叶绿体基因组的比较这种序列长度上的变异可能主要是由大单拷贝区域和反向重复序列间的长度差异导致的。另外,研究也发现紫茎泽兰的叶绿体基因组有着六个物种之中最长的LSC以及最短的IR。新疆千里光(150,689bp)莴苣(+2.07kp)小油菊(+0.77kp)向日葵(+0.4kb)紫茎泽兰(150,698bp)银胶菊(+2.1kp)结果和讨论③与菊科其它植物叶绿体基因组的比较这种序列长度上结果和讨论菊科多个植物叶绿体基因组的获得提供了一个从基因组水平来比较菊科物种序列变异的机会,使用VISTA软件以注释后的紫茎泽兰叶绿体基因组为参考计算了前述六个菊科物种叶绿体基因组的序列同源性。尽管在这些基因组之间发现了一些分歧区域,整个序列的排列显示菊科植物叶绿体基因组具有相当的保守性。与其他被子植物相比,编码区要比非编码区域更加保守。在所有的基因中,rpoC1基因是分化程度最高的。结果和讨论菊科多个植物叶绿体基因组的获得提供了一个从基因组水结果和讨论结果和讨论结果和讨论紫茎泽兰rpoC1基因含有两个内含子,只有一个内含子在菊科另外五个物种的叶绿体基因组中有发现。除了rpoC1之外,ycf1基因也显示出了高度的分化。ycf1基因在紫茎泽兰和银胶菊中是一个假基因,由于各种插入和缺失而具有高度的分化。叶绿体非编码区域被证明适用于被子植物系统发育研究。六个物种的叶绿体基因组中的非编码区域显示出比编码区域更高的序列分歧。在比对的序列之中,一些区域显示出了高度的分歧,包括ndhD-ccsA,psbI-trnS,trnH-psbA,ndhF-ycf1以及ndhI-ndhG。结果和讨论紫茎泽兰rpoC1基因含有两个内含子,只有一个内含结果和讨论④分子标记的鉴定在叶绿体基因组比较分析中鉴定出一些包含序列分歧的区域,适合用于系统学研究。为检测哪些区域能用于紫茎泽兰系统发育分析,那些在六个基因组之间进行比对发现存在分歧的序列,以及那些在系统发育鉴定中常用的区域,均被从六个菊科植物的叶绿体基因组中提取出来使用最大简约法进行分析。结果和讨论④分子标记的鉴定结果和讨论结果和讨论结果和讨论在此前的研究中,ndhC-trnV,psbM-trnD以及clpP区域已被鉴定为分歧区域,这些区域作为菊科系统发育学标记含有大量的系统发育信息。其他的几个区域是我们在当前研究中新发现的,此外,这些区域中很多还未被用到现有的分子系统发育研究中,它们在进一步的研究中可能会有价值。结果和讨论在此前的研究中,ndhC-trnV,psbM-tr结果和讨论一般来说,通过分子标记获得的系统树应该与该物种的进化相一致,因为序列进化的速率与物种的进化和生活史是相关的。但是当基因和物种的进化并未一致进行的时候,基因的系统树可能出现与物种不一致的情况。为研究我们新鉴定的DNA区域中是否有与物种进化一致的系统树,我们对所有存在分歧的比对区域进行了最大简约系统发育树的构建。结果和讨论一般来说,通过分子标记获得的系统树应该与该物种的进结果和讨论结果和讨论结果和讨论在本研究中,一些新的DNA区域被鉴定出含有大量的系统发育信息,它们可能成为系统发育分析的潜在分子标记。这些区域将会在通用性引物的开发及其在菊科物种分子系统学研究的应用中起到很大帮助。结果和讨论在本研究中,一些新的DNA区域被鉴定出含有大量的系结果和讨论⑤反向重复区域的收缩和扩张一般来说,IR的末端在各个不同的植物物种间存在差异。IR的收缩和扩张常导致叶绿体基因组长度的变异。在六个菊科物种基因组中对IR-SSC和IR-LSC的边缘序列以及邻近的基因进行了比较。总的来说,虽然菊科物种在反向重复序列的收缩和扩张上存在少许变异,反向重复序列长度与叶绿体基因组的总大小并不存在相关性。结果和讨论⑤反向重复区域的收缩和扩张结果和讨论结果和讨论结果和讨论⑥重复结构和序列分析重复区域被认为在基因组重组以及重排中起着重要作用。在目前的研究中,我们把重复序列划分为两类:串联重复和散在重复。在对紫茎泽兰叶绿体基因组中的这些重复进行分析(见材料和方法部分)之后,使用Tandemrepeatfinder软件鉴定出了31个不小于15bp的串联重复,其中18个为15-20bp大小,11个为21-30bp大小,1个为32bp大小,1个为85bp。结果和讨论⑥重复结构和序列分析同时,28个散在重复也被鉴定出来,其中15个为正向重复,13个为反向重复(回文结构),在28个散在重复中,8个为31-40bp,9个为41-60bp,5个为51-60bp,2个为61-70bp,其余的均为100bp以上。总的来说,从紫茎泽兰叶绿体基因组中鉴定出了59个重复序列,大多数(64.4%)的重复都分布于基因间隔区域,还有16.9%和18.7%分别位于内含子和编码区之中(图5C),这些重复单元将会为种群和系统发育研究中标记的开发提供非常有用资源。结果和讨论同时,28个散在重复也被鉴定出来,其中15个为正向重复,13结果和讨论⑦系统发育分析菊科植物是被子植物最大的类群之一,该科大概包含1500个属和23000个种。叶绿体序列资源对于研究菊科植物在被子植物中的分类地位以及该科物种间亲缘关系分析中具有重要意义。为研究菊科植物的系统发育联系已进行了大量的研究,如Denda等人利用matK基因分析了菊科植物的分子系统发育,而Panero和Funk结合了来自108个分类群的10个叶绿体位点研究了菊科植物物种间的主要亲缘关系,但关于菊科植物在分子水平上的系统发育上仍存在诸多不确定,且缺乏强有力的证据支持。结果和讨论⑦系统发育分析结果和讨论为了了解菊科植物的系统发育地位,我们将来自各种植物叶绿体基因组的蛋白质编码基因进行了序列比对。我们的系统发育数据包含了来自于33个植物物种的35个基因序列,包括了菊科这六个物种。在连接比对之后,比对的序列长度达到35,114bp。MP分析构建了一个长度为41,667的进化树。Bootstrap分析显示30个节点中有25个的bootstrap值大于95%,22个达到了100%。最大似然(ML)分析获得了一个bootstrap值很高的进化树,所有的30个节点均获得100%的bootstrap支持。MP和ML进化树有着相同的结构。结果和讨论为了了解菊科植物的系统发育地位,我们将来自各种植物结果和讨论结果和讨论结论使用Illumina高通量测序技术,我们获得了紫茎泽兰叶绿体基因组的完整序列。这是首个测序完成的的泽兰族植物叶绿体基因组,也是菊科中的第六个。与其它菊科植物叶绿体基因组相比,该基因组相对较小,但其基因的组织方式和内容却高度相似。从中鉴定出了五个含有2%以上简约信息位点的区域以及59个重复结构,它们可能适用于本物种以至菊科的分子系统发育以及分子生态学研究。结论使用Illumina高通量测序技术,我们获得了紫茎泽兰叶入侵物种紫茎泽兰的叶绿体全基因组分析入侵物种紫茎泽兰的叶绿体全基因组分析研究背景紫茎泽兰是危害最大的入侵物种之一,在世界范围内造成了严重的经济损失和环境破坏。然而,关于紫茎泽兰的序列资源和基因组信息却十分有限,使得其系统发育的鉴定以及进化方面的研究难以进行。这里我们报道了基于Illumina测序获得的紫茎泽兰完整叶绿体基因组。研究背景紫茎泽兰是危害最大的入侵物种之一,在世界范围内造成了研究背景叶绿体被认为是起源于蓝细菌的内共生作用,是植物所特有的细胞器,能进行光合作用来为植物和藻类提供必要的能量。它们有着自己的遗传复制机制,能对自己的基因组进行转录并进行母系遗传。在高等植物中,叶绿体基因组是一个大小在120到160bp的双链环状DNA分子。通常,陆生植物的叶绿体基因组在基因顺序、基因内容以及基因组组织方式上都是高度保守的。叶绿体基因组高度保守的特性以及低的进化速率说明它能较为统一地进行不同物种的比较性研究,但是在捕捉进化史上的事件时又具能产生有效的分歧,这使得其成为分子系统发育学以及分子生态学研究的合适且不可多得的工具。研究背景叶绿体被认为是起源于蓝细菌的内共生作用,是植物所特有研究背景紫茎泽兰是一种多年生草本植物,属于菊科(泽兰族)。它原产于中美洲,在墨西哥至哥斯达黎加均有分布,在十九世纪被作为观赏植物引进至欧洲,澳大利亚以及亚洲。紫茎泽兰能抑制那些本土植物生长,还能毒害动物。它最初是于二十世纪四十年代从缅甸入侵中国云南省,随后迅速地传播至中国南部及西南各省,包括贵州、广西、四川及重庆。如今它已经成为了当地环境中的优势种,影响了当地的生物多样性以及生态系统,在其入侵地区造成了严重的经济损失。研究背景紫茎泽兰是一种多年生草本植物,属于菊科(泽兰族)。它研究背景在过去的二十年间,大量基于叶绿体DNA序列数据的研究从种、属和族的水平上促进了我们对于被子植物进化上关系的理解。同时,叶绿体基因组在系统发生学、DNA条形码、光合作用研究以及最近的叶绿体转化上的重要性,使得越来越多的叶绿体基因组被测序。自从烟草的完整叶绿体基因组被首次公布以来,已有超过200个完整的叶绿体基因组被测序及分析。随着下一代测序技术的出现,由于其具有高通量、省时以及廉价等特点而被逐渐用于叶绿体基因组测序。研究背景在过去的二十年间,大量基于叶绿体DNA序列数据的研究研究背景尽管菊科有五个成员的叶绿体基因组已被测序完成,包括小油菊、向日葵、银胶菊(均属向日葵族)、莴苣(莴苣族)以及新疆千里光(千里光族),但目前并未有泽兰族物种的叶绿体基因组被测序完成。这里我们报道了使用Illumina高通量测序技术获得的紫茎泽兰完整叶绿体基因组序列。该叶绿体基因组序列将为紫茎泽兰种群的研究提供有用的遗传学工具,并帮助揭示外来物种入侵的遗传学和进化机制。研究背景尽管菊科有五个成员的叶绿体基因组已被测序完成,包括小材料和方法①叶绿体提取和DNA测序从中国云南腾冲县生长的紫茎泽兰中采集新鲜的叶子样本。采用向日葵细胞器分离所用的方法进行了叶绿体的分离。经DNA酶处理之后提取出了其叶绿体基因组DNA。构建了短插入片段文库,根据中国深圳BGI提供的操作流程使用IlluminaGAII进行测序。测序以51bp的单末端进行,进一步的图像分析以及碱基读出是使用IlluminaPipeline软件进行的。材料和方法①叶绿体提取和DNA测序材料和方法②基因组的装配和注释叶绿体基因组的过程中,首先使用perl脚本剔除了Illumina测序的低质量片段。随后我们比较了两种装配短片段序列的方法:其一:直接将质量筛选后的片段使用SOAPdenovo进行最小长度为100bp的重叠群的组装,随后使用BLAST软件将这些重叠群与向日葵叶绿体基因组进行比对(将其用作参考基因组),并将进行比对的重叠群按照参考基因组进行排列。材料和方法②基因组的装配和注释材料和方法其二:先使用BLAST从原始的质量筛选后的片段中捕捉叶绿体片段,并使用向日葵、小油菊、银胶菊、莴苣和烟草的叶绿体基因组作为参考。随后,这些捕捉的片段再通过使用SOAP
denovo组装成最小长度为100bp的重叠群,接着,通过与向日葵叶绿体基因组进行比对,将短的重叠群拼接成长的重叠群。最后,对照向日葵基因组使用原始片段的连贯序列来代替denovo重叠群之间的缺口,剩余的缺口通过使用PCR以及Sanger测序来进行填补。材料和方法其二:材料和方法叶绿体基因组的注释是是基于可用的在线程序DOGMA来进行的。tRNA基因的鉴定使用的是DOGMA和默认设置下的tRNAscan-SE。内含子位置的确定使用了向日葵叶绿体基因组中的内含子作为参考。叶绿体基因的功能分类参考了叶绿体基因组数据库。环形的cp基因图谱的绘制使用了OGDRAW软件。为了证实组装和注释的正确性,我们对大单拷贝区域和反向重复序列以及小单拷贝区域和反向重复序列之间的连接处进行了PCR以及测序来验证。材料和方法叶绿体基因组的注释是是基于可用的在线程序DOGMA材料和方法TableS1.Primersusedforgapfillingandassemblyvalidation.
Primer*Sequence(5’>3’)Ampliconsize1F:AGTTACTAATTATGATCTGGCATGTR:
ATAGCAATGAGATTCCCCAA5792F:TGGGGAGAAATGACAAGAR:TTTATCTTATTATTAATCACGGA10893(IR1/LSC)F:
TGTTGACCTAAAGCGTATR:TGAACCCTGTAGACCATC4634(LSC/IR2)FAAGCGTTGGCTAGGTAAGR:TAGCCAAGTGGATCAAGG8965(IR2/SSC)FCCA
GGGCTATGGAACAAAGR:AAACCACAACGACCGAAT6526(SSC/IR1)F:CTCGCTAACATTGAACTTGGR:ACCTCCCGTTCTTCATACTT660*Primerpairs1and2wereusedtofillthegapsoftheassembledgenome;Primerpairs3-6wereusedtoverifythejunctionsbetweentheIRsandSSC/LSCregions.材料和方法TableS1.Primersusedfo材料和方法③与菊科其它植物叶绿体基因组的比较以及标记的鉴定使用mVISTA软件来将紫茎泽兰cp基因组与菊科其他物种(包括向日葵、莴苣、银胶菊、小油菊和新疆千里光)进行比对。所有的在六个基因组中进行比对发现存在分歧的区域均被提取出来用于标记的鉴定。这些区域均使用手动调整过的ClustalW软件进行了比对。为获得这些区域的信息位点,使用最大简约法构建了系统发育树,所用软件为Mega4.0。简约信息位点、一致性指数(CI)以及保留指数(RI)的值也同样被计算了出来。材料和方法③与菊科其它植物叶绿体基因组的比较以及标记的鉴定材料和方法④重复结构以及序列分析使用TandemrepeatFinder软件进行了串联重复的分析。使用REPuter对散在重复序列进行了鉴定和定位,包括正向重复和回文重复,设置重复的一致性要大于90%(汉明距离<3),长度要大于30bp。在软件分析过后,我们对少于15bp的串联重复序列以及REPuter的冗余结果进行了手动剔除。材料和方法④重复结构以及序列分析材料和方法⑤系统发育分析选取了33个代表了被子植物所有家系的物种的cp基因组。选用了35个蛋白质编码基因:atpA,atpB,matK,petA,petB,petD,petG,petN,psaA,psaB,psbA,psbB,psbC,psbD,psbE,psbF,psbH,psbI,psbJ,psbK,psbN,psbT,rpoB,rpoC1,rpoC2,rps8,rps11,rps14,ycf3,ndhA,ndhD,ndhH,ndhF,rpoA以及rbcL。这35个基因在这33个叶绿体基因组中普遍存在。材料和方法⑤系统发育分析材料和方法序列通过ClustalW进行了比对。最大简约(MP)分析使用了PAUP*4.10。使用PhyMLv3.0进行了最大似然(ML)分析。使用了萍蓬草属和睡莲属作为外群。材料和方法序列通过ClustalW进行了比对。最大简约(MP结果和讨论①测序及基因组装配使用Illumina测序技术,我们获得了16,977,743个51bp长度的原始序列,包括11,117,985个唯一序列,筛选后获得了11,617,950条结果清晰的序列。随后我们比较使用了两种方法来对短片段进行装配:第一种:使用SOAPdenovo法直接进行富集,获得了12,161个重叠群,大小100到14,932bp,这些重叠群以向日葵的叶绿体基因组为参照进行排列,213个重叠群与参照基因组具有同源性。将排列的重叠群按照参照基因组的顺序进行了整理。使用此方法获得了一段长为145519bp的序列草图。结果和讨论①测序及基因组装配结果和讨论第二种方法是先从原始的质量筛选后的序列中捕捉叶绿体序列(在材料与方法中有介绍),总共获得了1,815,199条叶绿体基因组序列,总长度达90,759,950bp,为向日葵叶绿体基因组的510.66倍。随后,通过使用SOAP对获得的片段进行富集,得到了了190个重叠群,长度为100bp到8,810bp不等。这些重叠群按照向日葵叶绿体基因组进行了整理和排序。最后获得了一个长度为149,899bp的基因组草图。结果和讨论第二种方法是先从原始的质量筛选后的序列中捕捉叶绿体结果和讨论为了确定哪一种方法更好,把以上两个基因组草图与向日葵、莴苣、小油菊的叶绿体基因组进行了比对。序列比对发现两种方法富集得到的序列之间有95%的序列具有一致性,且第二种方法富集得到的基因组草图包含了一些第一种方法中缺失的区域。结果和讨论为了确定哪一种方法更好,把以上两个基因组草图与向日结果和讨论与向日葵叶绿体基因组相比,本研究中的基因组草图仍含有两处缺口。使用PCR以及Sanger测序对缺口进行了补全,由此得到了一个完整的150,698bp的紫茎泽兰叶绿体基因组。为了对富集结果进行验证,使用PCR对反向重复序列之间以及大/小单拷贝区域间的连接区域进行了扩增并进行了Sanger测序。我们将测序的结果与富集得到的基因组进行了直接比对,没有发现错配或者插入缺失,这就证实了富集结果的正确性。结果和讨论与向日葵叶绿体基因组相比,本研究中的基因组草图仍含结果和讨论②基因组内容及组织方式紫茎泽兰叶绿体基因组大小与其它被子植物相当。其叶绿体基因组GC含量为37.5%,这一点与已报道的其它菊科物种的叶绿体基因组相一致。大小单拷贝区域的GC含量分别为35.8%和30.1%,在反向重复序列中该值为43.0%。结果和讨论②基因组内容及组织方式结果和讨论结果和讨论结果和讨论紫茎泽兰叶绿体基因组包含有80个蛋白质编码基因,其中七个(rps19,rps7,rpl23,rpl2,ycf2,ndhB和ycf15)在反向重复序列中存在重复。此外,基因组中分布着有编码全部20种氨基酸的28个tRNA基因(1个发现于SSC,20个发现于LSC,7个发现于IR中)。在该基因组中还鉴定出了4个rRNA基因,位于反向重复序列中。结果和讨论紫茎泽兰叶绿体基因组包含有80个蛋白质编码基因,其结果和讨论总的来说,紫茎泽兰叶绿体基因组中存在130个基因,其中14个基因(8个蛋白质编码基因以及6个tRNA基因)含有一个内含子,3个基因(rpoC1,ycf3,clpP)含有两个内含子。结果和讨论总的来说,紫茎泽兰叶绿体基因组中存在130个基因,结果和讨论在这17个含有内含子的基因中,有12个位于LSC之中(包括8个蛋白质编码基因和4个tRNA编码基因,其中9个含有一个内含子,3个含有两个内含子),4个位于IR中(两个蛋白质编码基因和两个tRNA编码基因,均只含一个内含子),1个位于SSC中(单内含子)。结果和讨论在这17个含有内含子的基因中,有12个位于LSC之rps12是一个反式拼接基因,其5'端的外显子位于大单拷贝区域而其重复的3'端外显子位于反向重复序列中。trnK-UUU有着最大的内含子(1,559bp),其中含有另一个基因matK。结果和讨论rps12是一个反式拼接基因,其5'端的外显子位于大单拷贝区结果和讨论编码内容蛋白质tRNArRNA比例49.56%2.32%5.94%除此之外,剩下的42.18%为非编码区域,其中包含了内含子、基因间隔区以及假基因。结果和讨论编码内容蛋白质tRNArRNA比例49.56%2.结果和讨论结果和讨论结果和讨论③与菊科其它植物叶绿体基因组的比较这种序列长度上的变异可能主要是由大单拷贝区域和反向重复序列间的长度差异导致的。另外,研究也发现紫茎泽兰的叶绿体基因组有着六个物种之中最长的LSC以及最短的IR。新疆千里光(150,689bp)莴苣(+2.07kp)小油菊(+0.77kp)向日葵(+0.4kb)紫茎泽兰(150,698bp)银胶菊(+2.1kp)结果和讨论③与菊科其它植物叶绿体基因组的比较这种序列长度上结果和讨论菊科多个植物叶绿体基因组的获得提供了一个从基因组水平来比较菊科物种序列变异的机会,使用VISTA软件以注释后的紫茎泽兰叶绿体基因组为参考计算了前述六个菊科物种叶绿体基因组的序列同源性。尽管在这些基因组之间发现了一些分歧区域,整个序列的排列显示菊科植物叶绿体基因组具有相当的保守性。与其他被子植物相比,编码区要比非编码区域更加保守。在所有的基因中,rpoC1基因是分化程度最高的。结果和讨论菊科多个植物叶绿体基因组的获得提供了一个从基因组水结果和讨论结果和讨论结果和讨论紫茎泽兰rpoC1基因含有两个内含子,只有一个内含子在菊科另外五个物种的叶绿体基因组中有发现。除了rpoC1之外,ycf1基因也显示出了高度的分化。ycf1基因在紫茎泽兰和银胶菊中是一个假基因,由于各种插入和缺失而具有高度的分化。叶绿体非编码区域被证明适用于被子植物系统发育研究。六个物种的叶绿体基因组中的非编码区域显示出比编码区域更高的序列分歧。在比对的序列之中,一些区域显示出了高度的分歧,包括ndhD-ccsA,psbI-trnS,trnH-psbA,ndhF-ycf1以及ndhI-ndhG。结果和讨论紫茎泽兰rpoC1基因含有两个内含子,只有一个内含结果和讨论④分子标记的鉴定在叶绿体基因组比较分析中鉴定出一些包含序列分歧的区域,适合用于系统学研究。为检测哪些区域能用于紫茎泽兰系统发育分析,那些在六个基因组之间进行比对发现存在分歧的序列,以及那些在系统发育鉴定中常用的区域,均被从六个菊科植物的叶绿体基因组中提取出来使用最大简约法进行分析。结果和讨论④分子标记的鉴定结果和讨论结果和讨论结果和讨论在此前的研究中,ndhC-trnV,psbM-trnD以及clpP区域已被鉴定为分歧区域,这些区域作为菊科系统发育学标记含有大量的系统发育信息。其他的几个区域是我们在当前研究中新发现的,此外,这些区域中很多还未被用到现有的分子系统发育研究中,它们在进一步的研究中可能会有价值。结果和讨论在此前的研究中,ndhC-trnV,psbM-tr结果和讨论一般来说,通过分子标记获得的系统树应该与该物种的进化相一致,因为序列进化的速率与物种的进化和生活史是相关的。但是当基因和物种的进化并未一致进行的时候,基因的系统树可能出现与物种不一致的情况。为研究我们新鉴定的DNA区域中是否有与物种进化一致的系统树,我们对所有存在分歧的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025湖南永州市蓝山县城市建设投资开发有限责任公司专业技术岗位招聘12人笔试参考题库附带答案详解
- 2025海南省粮食和物资储备集团有限公司招聘下属企业财务经理1人笔试参考题库附带答案详解
- 2025浙江温州市瓯海区农合实业发展公司仙岩资金互助会招聘1人笔试参考题库附带答案详解
- 2025浙江宁波市基础设施运营管理有限公司招聘5人笔试参考题库附带答案详解
- 2025江苏盐城市东台市交通投资建设集团有限公司招录城乡公交班线驾驶员3人笔试参考题库附带答案详解
- 2026及未来5年中国4-二甲氨基吡啶市场数据分析及竞争策略研究报告
- 浙江国企招聘2025嘉兴桐乡市国有资本投资运营有限公司招聘笔试历年备考题库附带答案详解
- 马鞍山市2025安徽马鞍山市事业单位定向招聘驻马部队随军家属2人笔试历年参考题库典型考点附带答案详解
- 福州市2025福建福州市仓山区城市管理局编外人员招聘8人笔试历年参考题库典型考点附带答案详解
- 海南省2025海南红色娘子军纪念园管理中心招聘事业编制工作人员3人(第1号)笔试历年参考题库典型考点附带答案详解
- 2023年北京重点校初二(下)期中数学试卷汇编:一次函数章节综合2
- 材料研究方法课件
- 直播间选品策略
- 《银行保险机构公司治理准则》解读
- 2023玻纤增强聚氨酯门窗工程技术规程
- 工业产品生产企业质量安全考试试题
- 胶粉聚苯颗粒外墙保温技术交底
- YS/T 429.2-2012铝幕墙板第2部分:有机聚合物喷涂铝单板
- JJF 1069-2012法定计量检定机构考核规范
- GB/T 7689.4-2013增强材料机织物试验方法第4部分:弯曲硬挺度的测定
- 小麦高产栽培和主要病虫害防治技术研究与示范课件
评论
0/150
提交评论