版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
StudyonPhylogeneticRelationshipsofCamelliaosmanthaandItsRelativesABSTRACT【OBJECTIVE】
Camelliaosmantha
(C.osmantha)isanemergingwoodyoilcrop.Ithascharacteristicslikerapidgrowth,thinbark,abundantseeds,andhighfruitoilyield.Thisstudyhasanaim.TheaimistorevealtheevolutionaryrelationshipofC.osmanthaanditsrelatedspecies.Thiswilllayatheoreticalfoundationforsubsequentmolecularbreeding.【METHODS】Thisstudyusedhigh-throughput10xgenomeresequencingtechnology.Itanalyzed68samplesfrom12speciesoftheCamelliagroup.ThesequencingresultswereassembledbyusingHybPiper2.0.Then,14paralogousgenesandlow-qualitysiteswereexcluded.Finally,283single-copynucleargenes(SCNGs)wereobtained.CamelliacostataandC.taliensiswereselectedasoutgroups.ThemaximumlikelihoodanalysiswascarriedoutusingRAxMLv8.2.ThiswastoconstructthephylogeneticframeworkofC.osmanthaanditsrelatedspecies.【RESULTS】Thephylogenetictreerevealedmultiplehighlysupportedclades(bootstrapsupport,BS≥70%).Notably,
C.kissi,
C.brevistyla,and
C.osmantha
formedastableevolutionarybranch(BS=82%),while
C.oleifera,
C.brevistyla,and
C.meiocarpa
clusteredintoamonophyleticgroup(BS=74%),confirmingtheircloseevolutionaryaffinity.
C.grijsii
formedanindependentbranchwithfullsupport(BS=100%),suggestingitsuniquegeneticdifferentiationtrajectory.【CONCLUSION】
ThisstudyisthefirsttosystematicallyanalyzethemolecularphylogeneticrelationshipsofplantsintheC.osmanthasectionthroughalarge-scaleSCNGsdataset.ItrevealsthegeneticrelationshipbetweenC.osmanthaanditsrelatedspecies,providingcrucialmolecularevidencefortherevisionofMinTianlu'sclassificationsystem.Atthesametime,itwillalsoprovidetheoreticalbasisforfuturemolecularbreedingofC.osmantha.Keywords:
Camelliaosmantha;single-copynucleargenes(SCNGs);phylogenetics;genomeresequencing;maximumlikelihoodmethod香花油茶及其近缘种的演化关系研究1引言香花油茶(Camelliaosmantha)是山茶属短柱茶组(Sect.
Paracamellia)的特有物种REF_Ref1867613440\r\h[1]。2012年发现于广西南宁,香花油茶具有耐高温REF_Ref1910740202\r\h[2]、抗病虫害REF_Ref1910975500\r\h[3~4]和速生丰产的优良特性,因此成为北回归线以南兼具生态适应性和经济价值的特色油茶资源REF_Ref672106842\r\h[5]。然而,香花油茶与近缘类群之间的演化关系(如C.kissi、C.grijsii及短柱茶组内其他物种)长期存在争议:其形态特征(如钟状花冠、宿存苞片)与C.kissi高度相似,而种子油脂组成却趋近于C.grijsii,暗示种间可能存在基因渐渗或表型趋同进化REF_Ref672678280\r\h[6]。传统分类学基于柱头裂数、叶缘锯齿等形态特征的划分REF_Ref673014420\r\h[7],难以解释其地理分布破碎化背景下杂交成种的潜在影响,因此需要组学信息为进一步研究提供证据REF_Ref677922064\r\h[8]。然而长期以来,植物系统发育研究主要依赖的叶绿体、线粒体和核糖体ITS序列均存在一定的弊端REF_Ref1659660429\r\h[9~11],例如:质体基因的母系遗传特性(大多数被子植物)虽可为杂交事件追溯母本来源提供证据REF_Ref678224590\r\hREF_Ref1663878986\r\h[12],但其单亲遗传模式无法解析双亲遗传信号;核糖体ITS序列则因多拷贝特性易受致同进化干扰REF_Ref678409467\r\h[13]。对比前面两种组学数据,核基因组不仅携带双亲遗传信息,且进化速率约为叶绿体的两倍,能提供更丰富的变异位点REF_Ref678644765\r\h[14]。但是由于核基因本身旁系同源基因REF_Ref678829642\r\h[15]、多拷贝现象REF_Ref679031326\r\h[16]的复杂性,核基因的应用长期受到制约。针对上述问题,单拷贝核基因(SCNGs)凭借直系同源性强、信息位点充足的优势,逐渐成为系统发育研究的新标准REF_Ref679249817\r\h[17]。Olmstead与PalmerREF_Ref679451501\r\h[18]提出的分子标记选择原则进一步强化了SCNGs的科学价值。该原则强调了SCNGs在序列长度、直系同源属性及双亲遗传模式上的优势,使SCNGs在构建高分辨率系统发育树中具有不可替代性REF_Ref679669992\r\h[19]。近年来,技术革新推动了SCNGs的高效获取。早期低拷贝核基因开发依赖引物设计-克隆筛选的繁琐流程REF_Ref679871676\r\h[20]。随着高通量测序技术与生物信息学的发展,基于近缘物种参考基因组的同源比对成为可能REF_Ref680291851\r\h[21-25]。二代测序技术结合浅层测序策略(10×覆盖度),已在多个植物类群中广泛应用。在杜鹃花属REF_Ref688779386\r\h[26]、草海桐科REF_Ref688913842\r\h[27]、玉蕊科REF_Ref689367631\r\h[28]等研究中,该技术成功捕获单拷贝核基因(SCNGs)标记,并构建出高可信度的系统发育树,有效解决了近缘种间的系统发育冲突问题。此外,通过提取单核苷酸多态性位点(SNP)构建物种树的方法,也在木兰属REF_Ref689989490\r\h[29]、秋海棠属REF_Ref690157560\r\h[30]等类群研究中发挥重要作用。此方法揭示了核质冲突与基因渐渗事件,进一步证实了利用核基因组数据开展研究的显著优势。基于此,本研究选取香花油茶及其12个近缘物种的68份样本,运用NovaSeq6000测序平台,以10倍覆盖度对样本全基因组进行重测序,再通过HybPiper软件从测序数据中筛选出单拷贝核基因(SCNGs)位点。采用最大似然法和贝叶斯推断方法,构建物种系统发育树,研究物种间的进化关系。研究目标包括:(1)解析香花油茶复合群的演化谱系,澄清其与C.kissi、C.grijsii等类群的亲缘关系;(2)验证闵天禄分类系统中油茶组植物分类处理的合理性,为种质资源保护与定向育种提供理论依据。在实验设计上,选取的样本既涵盖短柱茶组、油茶组等关键进化分支,又考虑不同地理区域样本的差异。数据分析时,利用分区模型优化和拓扑一致性检验的方法,提高研究结果的可靠性。最终,通过多种研究方法结合,构建出可信度高的油茶组植物系统发育树,揭示香花油茶及其近缘物种的进化关系。2材料与方法2.1实验材料本研究以香花油茶及其亲缘物种为对象,对多个地区采集的样本进行研究。样本取自中国云南、广西、湖南、台湾,以及越南、老挝和泰国清迈等地,包含油茶组12个物种共68份样本,具体地理分布信息详见附表1。选择Camelliacostata(突肋茶)和C.taliensis(大理茶)作为外类群对照。植物样本采集遵循严谨流程:选取生长良好、形态典型的健康植株,采集顶部新生嫩叶,操作中避免物理损伤与微生物污染。样本即刻装入预编号防降解袋,加入变色硅胶快速干燥,低温运输至实验室后,存放于-80℃超低温冰箱。所有植物标本均由中国科学院昆明植物研究所标本馆(KUN)REF_Ref1885966684\r\h[31]永久保存,以保障研究数据的可追溯性与实验重复性。表1采集地及原始数据信息Table1Collectionsitesandoriginaldatainformation样品名称采集地点种名基因组大小测序数据5002广西林科院Camelliadrupifera8G60G4565湖南新宁Camelliabrevistyla6G60G4638广西上思Camelliafluviatilis3G60G4968_1昆明植物园Camelliagrijsii6G60G6201越南婆婆山Camelliakissi2.8G60G6090泰国清迈Camelliakissi5.31G30G6091_1泰国清迈Camelliakissi5.31G30G6091_5泰国清迈Camelliakissi5.31G30G6448云南盈江Camelliakissi2.8G30G6452云南盈江Camelliakissi2.8G30G6461_1云南盈江Camelliakissi3G30GYXQ275-1-10广西林科院Camelliaosmantha7G35G4512湖南洞口Camelliabrevistyla2.67G30G4525湖南武冈Camelliabrevistyla2.67G30G4563湖南新宁Camelliabrevistyla2.67G30G4564湖南新宁Camelliabrevistyla2.67G30G4565_15湖南新宁Camelliabrevistyla2.67G30G4566_5湖南新宁Camelliabrevistyla2.67G30G4566_6湖南新宁Camelliabrevistyla2.67G30G4567_6湖南新宁Camelliabrevistyla2.67G30G4567_10湖南新宁Camelliabrevistyla2.67G30G5043_11台湾屏东Camelliabrevistyla2.67G30G5043_19台湾屏东Camelliabrevistyla2.67G30G4033_1广西上思Camelliafluviatilis2.21G30G4033_5广西上思Camelliafluviatilis2.21G30G4163_1广西金秀Camelliafluviatilis2.21G30G4163_5广西金秀Camelliafluviatilis2.21G30G4207_11广西昭平Camelliafluviatilis2.21G30G4207_15广西昭平Camelliafluviatilis2.21G30G6064贵州赤水Camelliagrijsii6.4G60G6065贵州赤水Camelliagrijsii6.4G60G6066贵州赤水Camelliagrijsii6.4G60G6067贵州赤水Camelliagrijsii6.4G60G6802重庆北碚Camelliagrijsii6.4G760G5575_1云南保山Camelliakissi2.8G30G5575_5云南保山Camelliakissi2.8G30G6211_5越南婆婆山Camelliakissi2.8G30G6227_6越南浪平山Camelliakissi2.8G30G5345_1老挝川圹Camelliakissi5.31G30G续表1采集地及原始数据信息Table1(Continued)Collectionsitesandoriginaldatainformation样品名称采集地点种名基因组测序数据5345_6老挝川圹Camelliakissi5.31G30G6899广西桂林Camelliameiocarpa4.57G60G6900广西桂林Camelliameiocarpa4.57G60G6901广西桂林Camelliameiocarpa4.57G60G6902广西桂林Camelliameiocarpa4.57G60GYXQ276-1广西林科院Camelliameiocarpa4.57G60GYXQ276-6广西林科院Camelliameiocarpa4.57G60GYXQ306_1广西林科院Camelliaosmantha7G90GYXQ306_5广西林科院Camelliaosmantha7G90GYXQ306_10广西林科院Camelliaosmantha7G90GYXQ306_15广西林科院Camelliaosmantha7G90GYXQ306_20广西林科院Camelliaosmantha7G90GYXQ312_1广西林科院Camelliaosmantha7G90GYXQ312_5广西林科院Camelliaosmantha7G90GYXQ312_10广西林科院Camelliaosmantha7G90GYXQ313_10广西林科院Camelliaosmantha7G90GYXQ313_20广西林科院Camelliaosmantha7G90GYXQ364江西林科院Camelliabrevistyla2.67G30GYXQ365江西林科院Camelliabrevistyla2.67G30G6227_10越南浪平山Camelliakissi2.8G30G5069_1四川峨嵋Camelliaoleifera8G60G5069_16四川峨嵋Camelliaoleifera8G80G6906湖北宣恩Camelliaoleifera8G40G6908湖北宣恩Camelliaoleifera8G80G6910湖北宣恩Camelliaoleifera8G80GYXQ353广西林科院Camelliaoleifera8G80G5566云南保山Camelliataliensis7G90G5527_1广西昭平Camelliacostata4.57G60G2.2实验方法2.2.1基因组DNA的提取实验所用DNA样本源于经硅胶脱水的植物叶片。借助植物基因组提取试剂盒,运用改良CTAB法完成植物总DNA提取,该过程包含组织破碎裂解、蛋白质及杂质去除、DNA沉淀洗涤与溶解纯化等步骤。核酸质量检测采用双重验证机制:通过1%琼脂糖凝胶电泳观察基因组条带完整性,有无拖尾现象;用超微量分光光度计测定其浓度及A260/A280比值,分析其纯度REF_Ref1886319631\r\h[32]。只有电泳条带清晰完整,且A260/A280比值处于1.7-1.9区间的DNA样本才判定为合格。合格的DNA溶液经分装后,储存于-20℃环境,为后续实验提供可靠保障。2.2.2文库构建天津诺禾致源生物信息科技有限公司的技术团队负责文库制备和测序工作。具体流程如下:先通过超声处理,将基因组DNA剪切成长度小于1000bp的随机片段,再利用AMPureXP磁珠(AGENCOURT)筛选出约350bp的目标片段。对cDNA片段进行末端修复并与衔接子连接后进行PCR扩增。PCR产物热变性成单链后环化得到单链环状DNA文库REF_Ref1886487701\r\h[33]。文库质量通过多种方法检测。采用Agilent2100生物分析仪对构建好的文库片段大小进行质量控制REF_Ref1887059139\r\h[34],结合Qubit荧光定量系统测定文库浓度。只有当文库片段分布峰值在标准值±15%以内,且浓度达到2nM及以上,符合IlluminaNovaSeq6000平台的建库标准时,才会进行双端150bp(PE150)的高通量测序。测序过程严格遵循Illumina的标准操作流程,并持续校准碱基识别精度,确保Phred得分不低于30,从而保证数据质量满足后续分析需要。2.2.3测序基于合成测序(SequencingbySynthesis,SBS)技术原理,通过聚合酶介导的链延伸反应,实时捕获四种荧光标记dNTP的掺入信号,对固定于流动池基底的高密度分子克隆阵列进行大规模并行测序。光学成像设备收集荧光信号后,利用碱基识别算法将信号转化为核苷酸序列。符合质量标准的文库均采用双端测序(PE150)方法进行大规模数据采集,每个样本数据量至少达到10Gb,保证有足够的测序深度用于全基因组变异检测。原始数据经过IlluminaNovaseq平台处理后变成带有序列信息和质量评分的双端测序片段。以FASTQ标准格式输出原始数据文件。这些文件按照规范命名,标明样本编号、测序批次和片段方向(R1/R2),同时添加Phred质量评分(Q≥30),用于衡量单个碱基识别的准确性。对测序数据进行严格质量检查,各项指标均满足全基因组分析的要求。具体而言,单碱基错误率始终保持在0.03%以下,明显低于Illumina平台设定的0.1%理论误差值;GC碱基含量平均值为39.98%,与真核生物基因组35%-45%的碱基组成范围相符;在质量评分体系中,Q20(单碱基错误概率≤1%)的比例达到96.82%。这些数据表明测序结果具有较高的可信度,为后续基因组结构解析和群体遗传研究提供了可靠的数据基础。原始数据处理使用Fastpv0.23.7软件,设置特定参数(--cut_by_quality3--cut_window_size4--cut_mean_quality20)进行筛选。软件通过智能过滤方式,去除平均质量低于Q20的测序片段窗口和长度不足90bp的短序列,最终保留95%以上的有效数据,确保后续分析能够得到准确完整的结果。2.3数据分析2.3.1质控原始数据使用IlluminaNovaseq6000测序平台得到的原始数据(rawreads),双端序列里会有碱基错误、质量不高或者不完整的片段。像测序引物(adapter)、接头(index)这些多余序列也包含在内,会影响后续数据分析。因此,对这些原始序列进行过滤筛选,是保证数据质量的重要环节。在高通量测序操作里,判断测序序列是否可靠,需要对每个碱基的质量做评估,具体使用公式Qphred=-10Log10Perror来计算。在这个计算体系中,Q20指的是碱基出现错误的概率为1%,Q30则表示碱基错误概率是0.1%。通常情况下,当测序数据里达到Q20标准的碱基比例高于90%,就说明这批测序数据的质量达到较好水平。利用Fastpv0.23.47质控软件过滤操作从多个方面展开:切除如adapter这类多余序列;移除碱基质量低于Q20标准的序列片段;剔除不合格碱基比例超过40%的序列;筛除长度不足36个碱基对的短序列;设定复杂度阈值为30,将复杂度低于30%的序列一并去除。质控处理后,测序数据质量参数显著改变。Q20值从96.87%提升至97.13%,Q30值由92.03%升至92.36%。GC含量则出现细微波动,由40.24%降至40.12%。通过去低质量序列、去接头污染等过程完成数据处理得到高质量的序列,称之为CleanReads,后续所有分析都是基于CleanReads
进行REF_Ref1887059139\r\h[35]。使用FastQCv0.12.1软件对其进行质量控制(QC)以确定测序数据是否满足后续分析要求REF_Ref1887260823\r\h[36]。2.3.2建立参考基因组序列研究借助MarkerMinerv.1.0软件,从铁观音茶树(C.sinensisvar.sinensiscv.Tie-guanyin,登记号GWHASIV00000000)参考基因组的蛋白质编码序列中,提取单拷贝核基因数据。提取时限定基因最短长度为600个碱基对,并以Tcacao作为参照基因组。获取数据后,在Geneiousv.8.02分析平台上,使用Megablast程序,依据6种已公开的山茶属植物基因组信息(C.sinensisvar.sinensiscv,Biyun,DOl:10.1038/s41438-021-00542-x;C.sinensis,DOI:10.1038/s41467-020-17498-6;C.sinensisvar.sinensiscv.Longjing43,DOl:10.1038/s41467-020-18228-8;C.sinensisvar.sinensiscv.Shuchazao,Dol10.1038/s41438-020-0288-2;Camellialanceoleosa,DOI10.1111/tpj.15739;C.oleiferavar.“Nanyongensis”,DOI:10.1186/s13059-021-02599-2),对初始数据集开展多轮筛选。具体筛选条件为:单次比对最多保留60条匹配结果,最大期望值设为1×10-10,字长参数设定为28,匹配分数范围-2至-1。经过筛选,去除重复拷贝数大于1的基因,最终确定283个单拷贝核基因构成数据集。该数据集将作为标准参照序列,应用于后续基因分析研究。2.3.3组装核基因组使用hybpiper2.0组装核基因组,PREMISE的HybPipe管道是组装对象富集序列捕获)对于系统发育基因组学数据分析的使用最广泛的工具之一REF_Ref2056224430\r\h[37]。HybPiper是一套基于Python脚本的生物信息学工具包,用于从高通量测序读长中提取目标序列并进行分析。主要输出为每个基因的核苷酸序列及其翻译的氨基酸序列,这些序列均从测序读长中组装得到。HybPiper还提供了多个后处理脚本,用于从多个样本中提取序列、汇总统计数据并生成可视化结果,以及提取侧翼内含子序列等。另外,Hybpiper还可用于提取旁系同源物,在基因座序列的产生和系统发育分析研究中,旁系同源物的准确识别对于进化关系推断至关重要。HybPiper分三个阶段实现序列组装的并行执行:读取映射、重叠群组装和目标序列提取REF_Ref2058627831\r\h[38]。通过Hybpiper中包含的Python和R脚本检索提取的基因序列,并对提取效率进行总结和可视化。基于质控后双末端测序数据的cleandata,使用hybpiperassemble-r命令或脚本批量组装68个样本,分别组装单个样品中的2个fatsq.gz文件,组装后得到单个样品完整核基因组的bam文件便于后续分析。根据上述步骤得到组装成功核基因组的系列文件,可以通过genes_with_seqs文件查看提取的直系同源单拷贝核基因数量该文件无需提取核基因序列即可查看提取核基因数量,结果见表2。表2重测序数据提取单拷贝核基因数量结果Table2ResultsofSingle-CopyNuclearGenes(SCNGs)ExtractionfromResequencingData种名样品名称Q20ReadsGC含量SCG数量Camelliadrupifera500296.63%41036775239283Camelliaoleifera5069_197.23%43914929240283Camelliabrevistyla456596.04%44358075039283Camelliafluviatilis463896.55%43853658239283Camelliagrijsii4968_197.58%41656174438283Camelliakissi620197.21%42842893640283Camelliakissivar.confusa609096.67%18639713039283Camelliakissivar.confusa6091_195.68%17608608439283Camelliakissivar.confusa6091_596.23%18777951639283Camelliakissi644896.22%18935062040283Camelliakissi645296.56%18055384443283Camelliakissi6461_196.37%46319795640283Camelliaoleifera690697.12%90796718039283CamelliaosmanthaYXQ275-1-1096.64%99778503239283Camelliabrevistyla451296.98%25445143040283Camelliabrevistyla452597.02%19303412040283Camelliabrevistyla456396.35%33033552442283Camelliabrevistyla456496.65%30248801241283Camelliabrevistyla4565_1597.10%27265422041283Camelliabrevistyla4566_596.85%24533238639283Camelliabrevistyla4566_696.64%22493117841283Camelliabrevistyla4567_696.94%23059018642283Camelliabrevistyla4567_1097.21%23534302841283Camelliabrevistyla5043_1196.47%25939435239283Camelliabrevistyla5043_1996.89%23944148239283Camelliafluviatilis4033_196.44%30965699242283Camelliafluviatilis4033_597.02%25074674841283Camelliafluviatilis4163_197.24%19706248639283Camelliafluviatilis4163_596.76%21826961240283Camelliafluviatilisvar.megalantha4207_1196.89%22420888439283Camelliafluviatilisvar.megalantha4207_1596.35%27980596439283Camelliagrijsii606496.36%41426664241283
续表2重测序数据提取单拷贝核基因数量结果Table2(Continued)ResultsofSingle-CopyNuclearGenes(SCNGs)ExtractionfromResequencingData种名样品名称Q20ReadsGC含量SCG数量Camelliagrijsii606597.42%42454077040283Camelliagrijsii606696.46%49642688041283Camelliagrijsii606797.05%60222017245283Camelliagrijsiivar.shensiensis680296.89%40248667238283Camelliakissi5575_197.49%20843017841283Camelliakissi5575_596.98%66878207642283Camelliakissi6211_596.74%27608337641283Camelliakissi6227_697.33%195883144422832.3.4建立系统发育树构建系统发育树是研究系统发生学最基础的手段。达尔文的共同祖先学说即所有的生物都可以追溯到共同祖先是建树的理论基础REF_Ref2061905196\r\h[39]。向前追溯物种的进化过程,物种DNA序列的相似度越高,其亲缘关系也越接近,通过树状图形及分支演化可以展现出物种间的亲缘关系。系统发育树分为有根树和无根树,其中有根树可以推断出共同祖先和进化方向,无根树不能推断出共同祖先和进化方向REF_Ref1687862575\r\h[40]。除了最基本的进化关系的研究,系统发生树还可以重建共同祖先性状,估算各分类阶元间的分歧时间等。根据计算原理可以将常用的构建系统发育树方法分为四大类,即距离法、最大似然法(maximumlikelihood)REF_Ref1716131949\r\h[41]、最大简约法(maximumparsimony)和贝叶斯推断法(bayesianinference)。本研究主要利用最大似然法进行系统发育树的构建,选择突肋茶(Camelliacostata)和大理茶(Camelliataliensis)为外类群,构建系统发育树。提取直系同源单拷贝核基因使用Hybpiper的stats-t_dna命令来统计12个物种68个样品所能捕获的SCNGs。在命令运行完毕得到hybpiper_stats.tsv和seq_lengths.tsv两个文件,共捕获283个单拷贝核基因。执行hybpiperrecovery_heatmapseq_lengths.tsv命令,完成核基因热图绘制;运用hybpiperparalog_retrievernamelist.txt-t_dna1_scg_Oleifera.fasta命令,获取并可视化旁系同源序列。依据热图呈现的覆盖度数据及旁系同源基因图谱,删除14个50%覆盖度不足0.6的直系同源单拷贝核基因以及3个旁系同源基因。整个数据处理流程均在Hybpiper平台完成。图1直系同源单拷贝核基因可视化热图Figure1Visualizationheatmapoforthologoussingle-copynucleargenes注:图示为基因在不同样品中的覆盖率,左侧为样品名称,下方为基因名称图2旁系同源单拷贝核基因可视化热图Figure2Visualizationheatmapofparalogoushomologoussingle-copynucleargenes注:黑色区域为旁系同源单拷贝核基因序列比对使用Mafftv.7.3.1REF_Ref1725392606\r\h[42]进行多重序列比对,保持首尾序列一致。运行foriin$(ls)domafft--auto$i>$i.mafft.fastadone脚本,将266个单拷贝核基因的FNA格式进行比对输出为fasta格式。保守区域修剪对于处理后的269个SCNGs的fasta格式序列,使用trimALv.1.2软件实施序列修剪操作。运行trimal-automated1命令自动选择-gappyout、-strict和-strictplus其中一个参数作为最适合当前输入文件的修剪策略,比对修剪序列,保留比对结果中的保守区域。使用trimALv.1.2软件对已完成比对的269个SCNGs的fasta格式序列进行修剪。采用trimal-automated1命令,此命令会自动从-gappyout、-strict和-strictplus三个参数中选择最适配当前序列文件的修剪方案。保留序列比对结果中的保守部分,从而完成序列修剪。序列格式转换使用Geniousv.9.1.4软件来进行文件格式的转换。删除缺失比例超50%且覆盖度低于0.6的序列,剔除长度不足300bp的单拷贝基因。经处理,共去除18个基因,剩余248个核基因输出为phy格式,用于构建基因树。RaxML建立基因树关于基因树的构建,大多数研究采用最大似然法(ML),常用软件包括IQTREE和RAxML。在本研究中,采用RAxMLv8.2.12进行ML分析。系统发生树的支持率采用bootstrap分析检验REF_Ref1744031569\r\h[43]。PhyloSuite是一个整合并流程化了多基因联合系统发育分析步骤的可视化平台。借助该平台,将269个单拷贝基因(all.tre.phy)进行了合并。选择GTRCAT作为替代模型,每个运行1000代,并重复取样1000次。运行raxml.sh脚本(命令为:raxmlHPC-AVX-sall.tre.phy-nall.tre.phy-mGTRCAT-fa-p12345-N1000-x12345-o5566,5527)。基于all.tre.phy基因通过1000次Bootstrap重复构建最大似然树,并指定了分类单元5566和5527作为外类群。figtree可视化系统发育树将结果文件导入到figtree中进行可视化。调整分支长度并对齐、显示bootstrap值等,结果见图3。使用RAxML_bipartitions.phy树文件。3基于单拷贝核基因的系统发育分析结果基于图3,落瓣油茶(Camelliakissi)与窄叶短柱茶(C.brevistyla)及香花油茶(C.osmantha)遗传距离较近,形成高支持率分支(BS≥0.82)。普通油茶(C.oleifera)、短柱油茶(C.brevistyla)与小果油茶(C.meiocarpa)聚为一支(BS≥0.74),表明其近缘演化关系,这也解释了其形态特征上的趋同性。长瓣短柱茶(C.jrijsii)单独形成一个独立演化分支(BS=1),支持了其遗传上的独特性,提示其可能为独立演化谱系。支持率用于评估进化支的可信度,分支的BS值高于70%(ML)或者PP值高于0.95(BI)被认为是高支持率REF_Ref1720770681\r\h[44~45]。图示支持率均在60以上,说明该物种树较为可靠。图3基于RAxML构建的山茶属单拷贝核基因系统发育树,外类群为C.costata和C.taliensis。分支标注Bootstrap支持率(BS≥60%)。Figure3PhylogenetictreeofCamelliabasedonsingle-copynucleargenesconstructedbyRAxML.C.costataandC.taliensisweredesignatedasoutgroups.Bootstrapsupportvalues(BS≥60%)areindicatedonthebranches.4讨论4.1油茶组物种的亲缘关系与形态差异结果显示,落瓣油茶(Camelliakissi)、窄叶短柱茶(C.brevistyla)与香花油茶(C.osmantha)在进化树上聚为一支,自展支持率达到82%,表明这三个者亲缘关系紧密。它们都分布在湖南、广西等地,由于生长区域重叠且生态环境相似,为物种间的基因交换提供了可能。普通油茶(C.oleifera)、短柱油茶(C.brevistyla)和小果油茶(C.meiocarpa)同样在进化树上聚在一起,自展支持率为74%,显示出一定的亲缘关系。但在外观特征上,这些物种的果实大小、花柱长度等存在明显差异。这种形态分化被认为是长期适应不同生态环境的进化产物。长瓣短柱茶(C.grijsii)以100%自展支持率单独成支,说明它与油茶组其他物种的遗传差异较大。这种植物主要分布在云南高海拔地区。其花瓣细长的特殊形态,推测可能是为了适应高海拔寒冷气候或强烈紫外线环境进化而来,但具体的进化原因还需要进一步研究确定。4.2分类学争议与闵天禄系统的修订目前,油茶组植物的分类主要依据花朵和叶片的形态特征。不过本研究显示,植物之间亲缘关系的远近,并不能完全通过外观形态来判断。比如短柱油茶(C.brevistyla)从遗传层面看,它与香花油茶、普通油茶的关系都比较近,这可能意味着短柱油茶内部存在不同的遗传类型。后续还需要收集更多样本,或者结合其他基因数据做进一步研究确认。小果油茶(C.meiocarpa)在进化关系上虽然和普通油茶属于同一分支,但它的果实明显比普通油茶小。这种果实形态的差异,推测是长期适应特定生长环境的结果。因此,从植物分类的角度,建议将小果油茶作为普通油茶的一个变种(C.oleiferavar.meiocarpa),让现有的分类体系更加科学准确。4.3单拷贝核基因在系统发育中的优势与局限本研究利用单拷贝核基因数据集分析,有效排除串联重复序列和叶绿体基因干扰。研究中发现两个关键问题。物种树多数分支支持率达70%以上,整体可靠性较高,但部分基因进化过程与物种分化并不同步,后续可借助溯祖模型更精准测定物种分化时间。此外,283个单拷贝核基因中部分功能基因存在多态性,这种现象很可能由自然选择导致,需通过选择压力分析判断其属于中性进化还是适应性演化。5结论本研究基于大规模SCNGs数据集,深入研究山茶属油茶组植物的进化关系。研究发现,证实香花油茶(C.osmantha)与落瓣油茶(C.kissi)、窄叶短柱茶(C.brevistyla)具有密切亲缘联系,并筛选出关键的分子标记,可用于准确鉴定油茶组物种、普通油茶(C.oleifera)、短柱油茶(C.brevistyla)与小果油茶(C.meiocarpa)的遗传聚类与形态分化矛盾,暗示生态适应在油茶组物种表型可塑性中的关键作用。长瓣短柱茶(C.grijsii)的独立分支支持其作为油茶组内独特演化单元的分类地位。本研究提出的SCNGs标记体系可为油茶分子育种提供理论依据,既能够为油茶分子育种提供理论参考,帮助培育优良品种,也能为制定山茶属植物保护方案提供数据支持,助力保护植物多样性。参考文献廖旺姣,钟雅婷,韦维,等.香花油茶无性系苗期炭疽病调查及病菌致病力分化[J].广西林业科学,2022,51(05):676-685.DOI:10.19692/j.issn.1006-1126.20220513.马锦林,张日清,叶航,等.香花油茶的半致死温度与耐寒耐热性[J].经济林研究,2013,31(01):150-152+175.DOI:10.14067/ki.1003-8981.2013.01.036.韦维,张照远,叶航5个油茶物种对南方根结线虫的抗性研究[J].热带农业科学,2013,33(2):57-61.刘凯,周招娣,王东雪,等5个油茶物种的耐涝性[J].广西林业科学,2013,42(4):329-332.马锦林,叶航,叶创兴.香花油茶——山茶属短柱茶组一新种[J].广西植物,2012,32(06):753-755.刘宇轩,李敏,黄亚辉.分子标记技术在茶树育种中的应用研究:进展与展望[J/OL].茶叶通讯,2025,(预出版):1-7[2025-04-17].
刘福平.茶花育种研究现状与趋势[J].广西农业科学,2008,39(6):815-819.李渊,孙典荣,李文涛,等.基于matK、rbcL和ITS序列的5种大叶藻系统发育研究[J].水产学报,2011,35(02):183-191.OlmsteadRGPalmerJD.ChloroplastDNAsystematics:areviewofmethodsanddataanalysis[J].AmericanJournalofBotany199481:1205-1224.SoltisDESoltisPS.Choosinganapproachandanappropriategeneforphylogeneticanalysis[A].SoltisDESoltisPSDoyleJJ,etal.MolecularSystematicsofPlants.Ⅱ.DNAsequencing[M].Boston:KluwerAcademyPublications,1998.AlvarezI,WendelJF·RibosomalITSsequencesandplantphylogeneticinference[J].MolecularPhylogeneticsandEvolution,2003,29:417——434NessR.W.,GrahamS.W.,BarrettS.C.H.Reconcilinggeneandgenomeduplicationevents:usingmultiplenucleargenefamiliestoinferthephylogenyoftheaquaticplantfamilyPontederiaceae[J].
MolecularBiologyandEvolution,2011,28(11):3009-3018.SandersonM.J.,DoyleJ.J.Reconstructionoforganismalandgenephylogeniesfromdataonmultigenefamilies:concertedevolution,homoplasy,andconfidence[J].
SystematicBiology,1992,41(1):4-17.SonnhammerE.L.L.,KooninE.V.Orthology,paralogyandproposedclassificationforparalogsubtypes[J].
TrendsinGenetics,2002,18(12):619-620.刘志鹏,王能飞,赵爱云,等.低拷贝核基因在异源多倍体植物中的进化与表达[J].遗传,2007,(02):163-171.DOI:10.16288/j.yczz.2007.02.008.OlmsteadR.G.,PalmerJ.D.ChloroplastDNAsystematics:areviewofmethodsanddataanalysis[J].
AmericanJournalofBotany,1994,81(9):1205-1224.马兰,黄原.单拷贝核基因在昆虫分子系统学中的应用[J].昆虫知识,2006,(01):6-9.LemeyP.,SalemiM.,VandammeA.M.
Thephylogenetichandbook:apracticalapproachtophylogeneticanalysisandhypothesistesting[M].Cambridge:CambridgeUniversityPress,2009.LiuB.B.,MaZ.Y.,RenC.,etal.Capturingsingle-copynucleargenes,organellargenomes,andnuclearribosomalDNAfromdeepgenomeskimmingdataforplantphylogenetics:AcasestudyinVitaceae[J].
JournalofSystematicsandEvolution,2021,59(5):1124-1138.王晓慧,汤晓闯,杨恩秀,等.随机扩增多态性DNA标记技术及其在药用植物研究中的应用[J].时珍国医国药,2009,20(3):732-735.JamesT.Y.,KauffF.,SchochC.L.,etal.ReconstructingtheearlyevolutionofFungiusingasix-genephylogeny[J].
Nature,2006,443(7113):818-822.凡星,廖莎,沙莉娜,等.猬草及其近缘属植物单拷贝核Pgk1基因序列的系统发育分析[J].遗传,2009,31(10):1049-1058.丁铭,曾丽萍,马红,等.初探低拷贝核基因在低等分类阶元系统发育重建中的适用性——以十字花科为例[J].植物分类与资源学报,2012,34(03):211-221.宋云,陈岩,徐晗,等.稻属单拷贝核基因TPI序列分析及其在疣粒野生稻鉴定中的应用[J].生物技术通报,2012,(12):76-81.DOI:10.13560/ki.biotech.bull.1985.2012.12.007.WeiS.,LiufuY.,ZhengH.,etal.Usingphylogenomicstountanglethetaxonomicincongruenceofyellow-floweredCamelliaspecies(Theaceae)inChina[J].
JournalofSystematicsandEvolution,2022,61(5):748-763.
FuC.N.,MoZ.Q.,YangJ.B.,etal.TestinggenomeskimmingforspeciesdiscriminationinthelargeandtaxonomicallydifficultgenusRhododendron[J].
MolecularEcologyResources,2022,22(1):404-414.BergerB.A.,HanJ.,SessaE.B.,etal.Theunexpecteddepthsofgenome-skimmingdata:AcasestudyexaminingGoodeniaceaefloralsymmetrygenes[J].
ApplicationsinPlantSciences,2017,5(10):1700042.VargasO.M.,OrtizE.M.,SimpsonB.B.Conflicti
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年测试出轨的心理测试题及答案
- 2026年舞蹈理论测试题及答案
- 2026年苏教版弹力测试题及答案
- 2026年情侣间性格相投测试题及答案
- 2026年服务岗位测试题及答案
- 2026年客服人员测试题及答案
- 2026年面试考核测试题及答案
- 2026年初中重力测试题及答案
- 方城县2025-2026学年四年级数学第二学期期末质量检测模拟试题(含答案解析)
- 2026年上海公安文职行测试题及答案
- 《廉颇蔺相如列传》教案 公开课 全国赛课一等奖 教学设计
- 2026重庆市合川区渭沱镇招聘农村基层本土人才13人考试备考题库及答案解析
- 2025上交所技术有限责任公司校园招聘20人笔试历年参考题库附带答案详解
- 高中学考英语作文基本模板
- 2026广西南宁市良庆区良庆镇人民政府招聘工作人员21人笔试参考试题及答案解析
- 2026年光伏建筑一体化(BIPV)行业分析报告及未来发展趋势报告
- 项目部消防应急预案
- 2025年山东青岛市八年级地理生物会考真题试卷(含答案)
- 2026年形势与政策期末测试题及答案
- 广东省广州市七区2021-2022学年高二下学期期末地理试题
- 2026贵州贵旅集团第十四届贵州人才博览会招聘71人笔试备考题库及答案详解
评论
0/150
提交评论