版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于转录组数据的黄花菜EST-SSR位点的生物信息学分析摘要:黄花菜也叫安神菜、忘忧草或柠檬萱草等,属于百合目百合科草本植物。其营养丰富,食用价值高,而且具药用价值功效REF_Ref2535\n[11],深受人们喜爱,能带来可观的经济效益。基于转录组数据的黄花菜EST-SSR位点的生物信息学相关分析可以在黄花菜的遗传研究开展、优质黄花菜筛选等方面起到重要的理论支持的作用。首先通过Illumina平台的高通量测序取得黄花菜的转录组数据,然后对转录组数据拼接组装、EST-SSR位点的挖掘,分析其生物信息学信息。转录组处理、拼接组装获得193337条unigenes。用MISA对测到的unigenes进行SSR位点的检测,最终在32352条unigenes中测出42642个SSR位点。42642个位点中,位点数量最多为单核苷酸重复,占20678个;二核苷酸重复次之,为11437个;重复数量位第三的为三核苷酸,为9055个;而四核苷酸、五核苷酸、六核苷酸较少,分别为996、264和212个。黄花菜转录组EST-SSR位点总共出现了178种重复基元。据数据分析显示,单核苷酸重复位点的优势重复基元类型为A/T,重复次数6-10次的有9206个;重复次数达到11-15次有7852个,重复次数大于十五次的有2318个。而AG/CT和AT/AT数量在二核苷酸重复基元中较多,分别为5838、3752个,所占比例分别为13.69%、8.74%。黄花菜转录组检测到的SSR中,有44.45%的SSR分布在非编码区域(untranslated,UTR)或编码区域(codingsequence,CDS)上,分布数量表现为CDS>3’UTR>5’UTR,而还有有55.55%的位置未知。此外,通过设计可以得到29719对黄花菜EST-SSR位点特异性引物。转录组EST-SSR位点发掘为优质黄花菜的筛选、遗传性状的分析、黄花菜遗传图谱构建等提供理论和方法支持。关键词:黄花菜;转录组;SSR位点;重复基元
Bio-informationalAnalysisofDaylilyEST-SSRbyTranscriptomeSequencingAbstract:HemerocallisCitrinaBaronisalsoknownasDaylily,nepenthe,lemonHemerocallisandsoon,aherbaceousplantbelongingtoLilialesandLilyfamily.Itisnutritiousandhasmedicinaleffect.TheEST-SSRsitebioinformaticsanalysisofHemerocallisCitrinaBarontranscriptomebasedontranscriptomedatacanprovideimportanttheoreticalsupportforthedevelopmentofgeneticresearchandtheselectionofhigh-qualityofHemerocallisCitrinaBaron.Firstly,thegenetranscriptomedataofHemerocallisCitrinaBaronwereobtainedbyhigh-throughputsequencingonIlluminaplatform.thenthetranscriptomedataweresplicedandassembled,andEST-SSRsitesminingandcorrespondingbioinformaticsanalysiswerecarriedout.Afterprocessingandassemblyoftranscriptomedata,atotalof193337unigeneswereobtained,andSSRsiteswereretrievedfrom32352unigenesbyMISAsoftware.Finally,atotalof42642SSRsitesweresearchedfrom32352unigenesusingMISAsoftware.Amongthem,thenumberofrepetitionsitesofsinglenucleotidewasthemost,with20678.Followedbythatofdinucleotide,with11437.Thenumberoftrinucleotideswasthethird,with9055.Thenumberoftetraconucleotides,pentinucleotides,andhexanucleotideswasrelativelysmall,996,264,and212,respectively.Therewereatotalof178repeatprimitivesatEST-SSRsitesinthetranscriptomeofHemerocallisCitrinaBaron.Accordingtothedataanalysis,insinglenucleotiderepeats,thedominantrepeatingprimitivetypewasA/T,andthenumberofrepeatswas9,206,with6to10times.Therewere7,852repetitionsof11-15times,and2,318repetitionsofmorethan15times.ThenumberofAG/CTandAT/ATwasmoreinthedinucleotiderepeatprimitives,5838and3752,accountingfor13.69%and8.74%respectively.AmongtheSSRSdetectedbythetranscriptomeofHemerocallisCitrinaBaron,55.55%wereunknown,andtheremaining44.45%weredistributedinthenon-codingregionorinthecodingregion,andthequantitativedistributionwasrepresentedasCDS>3’UTR>5’UTR.Inaddition,29719pairsofEST-SSRsitespecificprimersweredesigned.ThediscoveryofEST-SSRsitesinthetranscriptomeofHemerocallisCitrinaBaronwillprovidetheoryandmethodsupportfortheanalysisofgenetictraits,theselectionofhighqualityandtheconstructionofgeneticmapofHemerocallisCitrinaBaron.KeyWords:Daylily;transcriptome;SSRlocus;repeatelement黄花菜(Daylily)是百合科萱草属多年生草本植物,别名金针菜。具有食用、观赏、药用、水土保持等功能。是我国独有的蔬菜,具有丰富的营养价值,适应性强、栽培方法简单,具有较高的经济价值REF_Ref2535\n[11]。SSR(Simplesequencerepeat,简单重复序列)即微卫星标记或短串联重复序列(simplesequencerepeats),其串联重复的核心序列为6bp,长度大都在100-200bp,均匀分布于真核生物基因组中的简单重复序列REF_Toc40133434\n[1]。SSR标记具有操作方便、易检测、可靠性高、位点数量多等特点。在遗传多样性、遗传图谱构建、群体结构分析、分子标记辅助育种中有极大价值REF_Toc40133437\n[4]。目前国内外关于黄花菜SSR的研究较少,其多态性和通用差,限制了黄花菜的遗传多样性、遗传图谱构建、分子标记辅助育种等相关进展的研究。近年来,高通量测序技术迅猛发展,转录组测序(RNAsequencing,RNA-Seq)技术为转录组信息研究指明新方向。利用SSR标记技术可直接获得大量ESTs信息,从而进一步用于SSR分子标记开发REF_Ref2023\n[7]。目前,基于转录组序列开发EST-SSR标记已在岷江百合、东方百合以及其他种百合科植物上得到广泛的应用REF_Toc40133438\n[5]。本研究通过RNA-Seq技术对黄花菜叶片进行测序,对测序数据拼接组装获得unigenes,对unigenes中包含的EST-SSR位点的组成和分布特征,为其后续遗传分析、遗传图谱的构建和辅助育种等提供了理论支持。
材料与方法黄花菜来源与总RNA提取本研究黄花菜来源于山西大同大学黄花菜园圃,选取一年生灌溉Na离子浓度0mol/ml、150mol/ml、300mol/ml三组大同黄花菜叶片作为试验材料。每5g作为一个样本,每组设置3个样本重复。从黄花菜样品中提取总RNA,Nanordrop2000对总RNA的浓度、纯度检查,用琼脂糖凝胶电泳检验RNA完整性,使用Agilent2100软件对RIN值测定,样品RNA量为1µg,浓度≥50ng/µL,OD260/280值1.8~2.2之间时,则说明提取的RNA满足建库要求。转录组测序及序列拼接组装采用llluninaHiseq平台实现对转录组的测序,并用SeqPrep软件和Sickle软件对测序后的原始序列去接头序列、去低质量读段、去N(不确定碱基信息)率较高和长度过短序列,可取得高质量测序数据。之后将所有质控后的测序读段经过Trinity软件的从头组装生成单一序列和重叠群。拼接后利用TransRate软件和CD-HIT软件,分别进行过滤优化和去除冗余、相似序列。最后使用BUSCO软件评估转录组的组装完整性。黄花菜转录组EST-SSR位点挖掘利用MISA软件(http://perch.ipk-gatesleben.de/miss/)对Unigene进行SSR检测。虽然SSR重复单位的大小、序列及拷贝数呈多态性,但其两端往往具备专一性和相对保守性的,是以可以利用其特点依据两端的序列设计特异引物,经过过PCR技术扩增出微卫星序列应用琼脂糖电泳技术或聚丙酰胺取得其长度多态性信息。搜索标准如表1所示。表1黄花菜转录组EST-SSR位点的搜索标准黄花菜转录组EST-SSR位点引物设计利用Primer3.0软件对黄花菜的转录组的unigenes序列进行EST-SSR位点引物设计,软件参数的设置采用默认值设置,不做改变,针对检索得到的EST-SSR位点同时设计3对特异性引物以方便后期实验选择。结果与分析原始序列组装结果如图1,黄花菜转录组的测序原始数据组装拼接后一共可得到unigenes193337条,unigenes总长度到达了152308955bp,平均长度787.79bp。序列长度500bp-1000bp的unigenes为45225条,占总unigenes的23.29%;而大于1000bp的unigenes有34319条,占总unigenes的17.75%。图1unigenes的长度分布黄花菜EST-SSR位点数量分布特征如图2所示,经检索后后黄花菜转录组unigenes序列一共发现了32352条unigenes,而其中含有42642个EST-SSR位点,占总unigenes数量的16.73%。从黄花菜叶片中检测到了6种核苷酸重复类型,数量最多的为单核苷酸重复,占总EST-SSR位点数量的48.49%;其次则为二核苷酸重复数量和三核苷酸重复数量,分别占总EST-SSR位点数量26.82%和21.23%;六核苷酸的数量最少,仅占总EST-SSR位点数量的0.50%。图2黄花菜EST-SSR类型数量分布如表2所示,SSR重复基元的重复次数分布在5~55次之间,其中单核苷酸重复基元的重复次数分布在10~55次。二核苷酸的重复次数为6~35次,主要集中在6~10次之间。表2黄花菜转录组EST-SSR位点的数量与分布黄花菜EST-SSR重复基元的分布特征如图3所示,在42642个黄花菜EST-SSR位点中,有178种重复基元。单核苷酸重复基元为20678个,最常出现的为A/T,占总EST-SSR位点的45.45%;在检测到的11437个二核苷酸重复中,最常出现的重复基元为AG/CT,出现数量为5838个,占总EST-SSR位点的13.69%,其次为AT/AT和AC/GT两种类型的重复基元,出现次数分别为3752个和1821个,占了总数的8.74%和4.27%,重复基元CG/CG出现数量最少,仅53个,占总数的0.12%;三核苷酸重复共9055个重复基元,其中最常出现的为AAG/CTT,数量为2208个,占总EST-SSR位点的5.18%,其次为AAC/GTT,共有1442个(3.33%),出现频率最少的为ACG/CGT,共192个,仅占总数的0.45%.图3黄花菜单、二、三核苷酸重复单元频率黄花菜转录组SSR位点在unigenes位置分布特征将黄花菜unigenes按照NIR(Non-redundant)蛋白库,Swissprot蛋白库的优先级顺序依次进行比对,若比对上,则从比对结果中提取出转录本的开放阅读框(openingreadingframe,ORF)编码框信息,并依照标准密码子表将编码区序列翻译成氨基酸序列(按照5’>3’的顺序);若没有比对上NR蛋白库、Swissprot蛋白库的序列,或者比对上未预测出结果的序列,则采用ESTscanl软件预测其ORF,从而获得这部分基因编码的核酸序列和氨基酸序列。由图4可知,黄花菜转录组检测到的SSR中,根据55.55%的位置尚不明确,其余的SSR位点分布在编码(codingsequence,CDS)或非编码区域(untranslated,UTR)上,分布数量表现为CDS>3’UTR>5’UTR。 图4黄花菜转录组微卫星的分布区域进一步对不同核苷酸重复单元在CDS及UTR区域中的分布情况进行统计发现(表3),除单核苷酸重复外的20795个SSR中,在UTR区域,二核苷酸重复单元数量最多,为2191个,占整个UTR区域的24.14%,同时,三碱基重复单元在5’UTR区域的分布比例比3'UTR要高:而在CDS区域,三核苷酸重复数量最多,为2445个,其次则为二核苷酸重复单元,为1052个。表3黄花菜不同长度微卫星在unigenes上的分布黄花菜转录组EST-SSR位点引物设计如表4,采用Primer3.0软件对检索到的黄花菜EST-SSR位点进行特异引物设计,一共可得到对29719对特异引物,经统计与计算得出成功率77.89%。在已经设计成功的29719对引物中,扩增产物为单核苷酸重复的最多,占了13665个,呈现为总数的45.98%;其次为二核苷酸、三核苷酸重复基元,分别有6294、5858个,占21.18%,19.71%。另外,PCR产物表现为复合型重复(即含有2个及以上重复基元类型)的有2722个,占了总扩增产物的9.16%。表4PCR扩增产物中包含的重复基元黄花菜转录组EST-SSR位点可用性评价多态性是判断SSR分子标记可用性的重要参考,而长度是多态性高低的重要因素之一。根据调查研究表明,当SSR位点的长度大于20bp时,这个位点就具有高度多态性,而如果位点长度位于12-20bp之间时,此位点的多态性则位于中等水平,而如果SSR位点的长度小于12bp的,其多态性就较低[17]。因此在本研究中对黄花菜的转录组EST-SSR位点进行搜索时,严格遵守此条规律性,将筛选标准定为单核苷酸重复不得低于10次,二核苷酸重复不得低于6次,而三核苷酸到六核苷酸的重复次数则要不低于5次。经统计所得,黄花菜EST-SSR位点的长度分布在10~424bp之间,其中长度大于20bp的EST-SSR位点即高度多态性共有9207个,占总EST-SSR位点的21.59%;长度在12-20bp之间的即呈现中等多态性EST-SSR位点有17896个,占总数的41.97%。研究发现,高级重复基元类型的SSR位点(如四核苷酸、五核苷酸、六核苷酸)的多态性要明显低于低级重复基元类型REF_Ref3799\n[18]。在检索到的黄花菜转录组的EST-SSR位点中低级重复基元类型SSR位点占主要地位。经统计发现,单核苷酸、二核苷酸、三核苷酸重复基元所占比例竟高达96.54%,远高于大部分植物,表现出良好的多态性。对黄花菜转录组EST-SSR位点长度进行统计计算分析时发现,长度大于20bp的9207个EST-SSR位点中,单核苷酸、二核苷酸与三核苷酸重复基元类型分别含有有688、1782、2148个,三者总占比达到54.73%。这表明了黄花菜转录组EST-SSR位点具有高度多态性的潜能,呈现出良好的利用潜质和丰富的利用前景。讨论与结论SSR位点在真核生物基因组中分布广泛,据不完全统计统计,真核生物中几乎平均每相隔10~50kb长度就会出现一个SSR位点。而在植物基因组中,平均每相隔23.3kb就存在1个SSR位点REF_Ref3339\n[15]。目前,转录组学分析研究涉及到的物种愈发多样广泛,因此在研究基因组序列还未公布的物种时,产生了大量可供研究的基因转录组测序数据,对于这些数据的深度挖掘、利用、推广理所当然成为了当代研究的热点之一。此次研究通过RNA-Seq技术对黄花菜叶进行转录组测序,并通过拼接组装后得到193337条unigenes,检索后获得到合条件的EST-SSR位点有42642个,经计算,其出现频率为22.05%,其出现频率明显要高于岷江百合REF_Toc40133438\n[5]、银杏REF_Toc40133434\n[1]等物种。据讨论,有研究人员认为造成这些不同物种间EST-SSR位点出现频率差异的原因可能是物种间SSR位点组成及分布的差异性。黄花菜转录组中EST-SSR位点种类与数量均比较丰富,可为黄花菜SSR分子标记的开发提供重要的参照。不同物种之间EST-SSR位点主要重复类型同样也有所不同,许多植物EST-SSR位点重复基元类型主要以二核苷酸和三核苷酸为主,例如云南松等REF_Toc40133435\n[2]。但是本实验发现,黄花菜转录组EST-SSR位点重复基元类型以单核苷酸重复为主,占总SSR位点的48.49%,其次则为二核苷酸重复,这与银杏、白皮松、湿地松、岷江百合等相似,但与刺梨、鱼腥草等物种有所差异,后者提及的物种EST-SSR位点以三核苷酸重复为主要重复基元REF_Toc40133436\n[3]。本研究发现,在黄花菜转录组EST-SSR位点重复基序类型中,单核苷酸重复基元存在最多的类型是A/T,占总SSR位点数量的45.45%;二核苷酸重复基元类型次之,其中,最常出现为AG/CT,占了13.69%。而AT/AT出现次数同样不低,占SSR位点比例为8.74%,表现出了较为明显的A/T优势。G/C在单核苷酸重复基元类型中的出现频率相对而言比较低,仅占总位点的3.05%,在二核苷酸重复中则CG/CG出现次数最少,仅出现53次,占比0.12%。研究表明EST-SSR在CDS区的出现频率要显著低于UTR区域,并非随机分布REF_Ref2708\n[16]。本研究所检测到SSR标记却显示出了不同同的分布规律,表现为CDS>3’UTR>5’UTR,这可能与黄花菜测序基因数据库资源过少,55.55%序列无法比对,未知序列过多有关。进一步研究发现不同核苷酸重复单元在不同的区域中分布有差异,如在UTR区域,重复基元呈现以二核苷酸为主的态势,而在CDS区域,三核苷酸重复单元的数量则最多,这可能是由于编码区的序列为密码子序列造成的,它的长度变化时可能会影响到蛋白质的翻译,甚至会出现新的表型性状,使编码区SSR面临更大的选择压力REF_Ref2783\n[12]。黄花菜转录组EST-SSR位点不仅具有出现频率高、平均分布频率广等特点,并且类型丰富,呈现出了较高的多态性潜能和可用性。本实验积累了大量黄花菜EST-SSR位点并初步研究分析了它的基本特征,可以为开发黄花菜SSR分子标记和遗传图谱构建等奠定重要的理论基础。本研究的开展对加快黄花菜功能基因资源的开发和利用,建立黄花菜种质资源评价和改良机制,分子标记辅助育种等具有重要的意义。参考文献:秦姣姣;杨玉琦;胡晓艳;杜淑辉.银杏转录组数据中EST-SSR位点的生物信息学分析.江苏农业科学.2020,48(3):96-100易敏;张露;雷蕾;程子珊;孙世武;赖猛.湿地松转录组SSR分析及EST-SSR标记开发.南京林业大学学报(自然科学版).2020,13(4):78-86杨旭;杨志玲;谭美;程小燕.厚朴转录组特征分析及EST-SSR标记的开发.核农学报.2019,33(7):60-71李延龙;张华敏;崔蕴刚;陈建华;吕爱芹;李纪军;李艺潇.韭菜全长转录组SSR信息分析及分子标记开发.园艺学报.2019,46:1-10葛亮.基于转录组信息的百合SSR标记开发及种质分子鉴定研究.中国农业科学院.2012年杜方.百合不同器官转录组分析及SSR标记开发应用.浙江大学.2014年李俊仁;陈秀珍;汤小婷;何瑞;詹若挺.穿心莲转录组SSR位点信息分析.中国中药杂志.2018,43(12):97-102贺丹;吴芳芳;张佼蕊;谢栋博;李小康;刘艺平;栗燕;何松林.牡丹转录组SSR信息分析及其分子标记开发.江苏农业学报.2019,35(6):170-175杨光;梁坤南;黄桂华;周再知;王西洋.基于高通量测序的柚木边材转录组分析.分子植物育种.2019,46(6),:1-19周宵;彭映辉;蒋丽娟;陈景震;王明怀;何祯祥;陈勇;康向阳;张良波.木本油料植物光皮树SSR特征分析及其SSR-PCR反应体系优化.分子植物育种.2019,12(26):1-10韩志平;张海霞;王丽君;张琨.黄花菜组织培养研究进展.山西农业科学.2019,47(12):167-172温强,徐林初,江香梅,等,基于45年测序的油茶DNA序列微卫星观察与分析[J]。林业科学,2013,49(8):4943-50。SharmaHimanshu;KumarPankaj;SinghAbhishek;AggarwalKanika;RoyJoy;SharmaVikas;RawatSandeep.DevelopmentofpolymorphicEST-SSRmarkersandtheirapplicabilityingeneticdiversityevaluationinRhododendronarboreum.[J].Molecularbiologyreports,2020,47(4):2447-2457.GittaM.Kocsisné;DávidBolla;UlrikeC.M.Anhalt-Brüderl;AstridForneck;JánosTaller;LászlóKocsis.Geneticdiversityandsimilarityofpear(PyruscommunisL.)cultivarsinCentralEuroperevealedbySS
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年避孕药具管理考试题及答案
- 新余学院《现代物业管理》2025-2026学年期末试卷
- 漳州卫生职业学院《大学美育补充》2025-2026学年期末试卷
- 赣东学院《酒店市场营销》2025-2026学年期末试卷
- 扬州大学《中央银行学》2025-2026学年期末试卷
- 轨道交通信号设备噪声优化
- 泉州经贸职业技术学院《社会保障概论》2025-2026学年期末试卷
- 厦门兴才职业技术学院《犯罪心理学》2025-2026学年期末试卷
- 供水管网漏损监测与改造方案
- 给水管道铺设工艺方案
- 用友渠道合作方案
- 农民工欠薪起诉书模板
- 课题研究存在的问题及今后设想
- DINEN1706铝和铝合金铸件化学成分和机械性能(中文版)
- 2023年康复医学考试重点复习资料
- 伊利经销商设立、变更、撤销、评估管理及考核办法
- 诗经卫风淇奥公开课获奖课件
- 0电连接安装施工作业指导书
- FZ/T 73072-2022矿工袜
- 第15章含硫、含磷和含硅有机化合物课件
- (精华版)朱立言-公共管理概论
评论
0/150
提交评论