发展与抗病相关的分子标记genesin菜豆基于全基因组序列.doc_第1页
发展与抗病相关的分子标记genesin菜豆基于全基因组序列.doc_第2页
发展与抗病相关的分子标记genesin菜豆基于全基因组序列.doc_第3页
发展与抗病相关的分子标记genesin菜豆基于全基因组序列.doc_第4页
发展与抗病相关的分子标记genesin菜豆基于全基因组序列.doc_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

发展与抗病性相关的分子标记genesin菜豆基于全基因组序列摘要菜豆(菜豆)是最重要的谷物豆类供人类直接消费在世界中,特别是在发展中国家构成蛋白质的主要来源。Unfortu-nately、刀豆产量稳定性受到害虫和疾病。resistantgenotypes的使用是最经济和生态安全意味着控制植物病害,已经努力描述基因抗性基因在菜豆(R基因)。尽管它农学 importance,基因组菜豆中可用的资源是有限的,直到最近sequencingof菜豆基因组(安第斯基因型G19833)。除了允许注释NucleotideBinding-Leucine丰富重复(NB-LRR)编码基因家族,疾病的流行类Rgenes在植物、访问的整个基因组序列菜豆可以很大的帮助intenseselection增加作物的整体效率改进程序使用分子标记辅助区(MAS)。本文介绍了常见的艺术状态bean NB-LRR基因簇,在subtelomeres peculiarlocation和相关基因单基因R基因特征,以及演出整个基因组序列的可用性可以提高分子标记简称forMAS的发展IntroductionCommon bean(菜豆)是世界上最重要的foodlegume尤其是ascentral等发展中国家和南美洲和非洲东南部。在这些国家,刀豆代表蛋白质的饮食的一个重要来源,因此com-bat营养不良的一个关键组成部分数亿小农(/)。此外,有许多健康bene-fits吃豆类包括降低血液胆固醇”水平进而减轻某些类型的癌症,type2糖尿病和心血管疾病1。尽管agronomicimportance,基因组中可用的资源菜豆werelimited直到最近。因此,常见的bean是统称“孤儿作物”,对应于庄稼不exten-sively交易和研究人员相比,所谓的“主要”作物如玉米、水稻和小麦2。然而,最近完整的植物基因组测序已经成为下一代sequenc-ing increasinglymore常规出现以来(上天)技术3。常见的bean是一个自花受精的二倍体(2 n = 2 x = 22)物种基因组相对较小587 Mb。Inthat背景下,整个基因组的菜豆最近beensequenced4。限制大豆生产的主要问题之一是diseasessuch bean生锈(Uromyces appendiculatus)5,角叶斑病(Pseudocercospora griseola)6,白粉病(白粉菌属diffusa)7或光环枯萎病(两)5。炭疽病,相关专业hemibiotrophic刺盘孢属真菌linde-muthianum,是常见的最重要的疾病之一beanthroughout世界8。感染疾病暴发一般originatefrom污染种子或植物碎片(9、10)。Becausechemical控制是昂贵的和代pathogen-freeseeds往往是困难的在发展中国家,基因resistancerepresents最可靠的控制策略8。使用resistantgenotypes managementstrategy是最经济和生态安全。对炭疽病抗性育种主要focusedon单基因显性抗性基因后gene-for-gene模型11。几个主要炭疽病抗性基因(R基因),称为基因被描述图1所示。物理图谱的11个菜豆pseudomolecules个人主办和TNLs khipu卫星,和近似位置的基因characterizedmonogenic抗病基因。376 NL编码基因的相对位置地图显示在个人pseudomolecules描绘中标识的染色体Pv01-Pv114。每个基因都有能标签代表去年的7位数的注释。例如,G002600位于pseudomolecule Phvul.003G002600 3对应的基因。积极的DNA链基因编码的描述在右边的染色体,而负链编码的左边所示。TNL sequencesare在粉色字体和CNL序列是在黑色字体。NLs对应伪基因都用星号(*)在他们的名字。与粉红色酒吧Khipu sequencesare表示pseudomolecule结构与块大小根据38与Khipu单位的数量成正比。着丝粒位置上individualpseudomolecules被确定使用着丝粒卫星重复识别37表示,浅灰色pseudomolecules酒吧。Pseudomolecules Pv05、Pv07 Pv08,Pv11比连杆组在同一方向(LG)B5,B7、B8,B11,分别在Pseudomolecules Pv01,Pv02,Pv03,Pv04,Pv06,Pv09,andPv10相反方向相对于LG B1-B4,B6,B9,和B10分别根据基因地图(86,87)。定位R基因物理图谱,可用链接标记的序列被用作查询BLASTN分析对G19833基因组(/pz/portal.html)。近似locationsof单基因抗病基因是由灰色区域表示连接彩色泡沫(R基因)候选人pseudomolecules位置。公司是炭疽病(刺盘孢属lindemuthianum)抗病位点885、12 - 14、16 - 19日。安第斯和中美洲炭疽病抗性基因座是由蓝色和蓝绿色的泡沫,分别。你生锈(Uromyces appendiculatus)抗病位点(Ur-Dorado Ur-Ouro黑人,Ur-BAC 6参考线源的不知名的基因)5,89,Phg angularleaf现货(Pseudocercospora griseola)抗病位点(16岁,46),下午白粉病(白粉菌属diffusa)抗病位点48和Pse Rpsar光环枯萎病(两)抗病位点(43岁,47)。我是抵抗轨迹BCMNV普通花叶坏死病毒(Bean),BCMV(Bean普通花叶病毒),ZYMV(西葫芦黄花叶病毒),BSMV(Bean严重花叶病毒),PWVK(有木质virus-K),对WMV(西瓜花叶病毒2)CabMV(豇豆aphid-borne花叶病毒),ThPV(泰国passifloramosaic病毒)和SMV(大豆花叶病毒)49岁、50、65、90 - 92年)。Bct是抵抗质疑的轨迹(甜菜大前病毒)5,2是一个R基因抵抗BYMV(Beanyellow花叶病毒)和CLYVV(苜蓿黄脉病毒)52,PvCMR1 R基因(TNL)抗巨细胞病毒(黄瓜花叶病毒)定位使用specificPCR引物序列作为查询BLASTN分析对G19833基因组(/pz/portal.html)93。R-BPMV是抵抗BPMV的R基因(Bean podmottle病毒)51和bc隐性基因BCMNV阻力和BCMV94 - 94。菜豆(5、19)。然而,这些特定的使用R geneshas没有提供持久的阻力,尤其是在拉丁Amer-ica菜豆起源领域20。解释为特定的R基因的快速分解依赖于extensivepathogenic多样性显示c . lindemuthianum evidencedby众多种族中描述文学(8、15、21)。一个应对sin-gle赋予的短期保护基因,是金字塔特定R基因植入一种植物(22、23)。即使金字塔的机制(s)增加durabilityare不清楚,标准的教条已”,probabilityof无性繁殖的病原体变异对所有毒性R genesin金字塔将单独eachgene概率的乘积,因此,让毒性pathotypearising极不可能的概率”24。最好的记录suc-cess故事基于这一策略的控制杆和小麦leafrusts24。事实上,直到锈病raceUg99最近发现,耐药基因通过控股公司已成功控制小麦stemrust自1950年代中期以来25。对于interac-tion p .寻常的/ C。lindemuthianum,安第斯andMesoamerican R基因的组合,提出了以实现对炭疽病durableresistance5。事实上,适应的c . lin-demuthianum株植物同源观察inwild刀豆的数量增长的中心diver-sity p的寻常的以及驯化bean15。然而,将多个R基因整合到单个育种行isa困难,时间和相应的任务,因为epistaticinteractions R基因需要testcrossing和progenytesting不同菌株之间的病原体。成金字塔形状的基因在单一的品种,作为持久抗性的策略,可以通过分子标记辅助选择(MAS)greatlyfacilitated26。发展的分子标记最近得益于NGS-based正成功地用于新创全基因组shotgunsequencing参考基因型和全基因组resequenc-ing。MAS有着巨大的潜力和代表一个伟大challengeof分子育种在21世纪(途径)。在分子水平上,大多数克隆R基因编码intracellularproteins包含nucleotide-binding(NB)网站和C-terminalleucine rich-repeat(远程雷达)域(29、30)。R基因属于学已确定在不同的植物物种,在monocotsas在双子叶植物,和对应于R基因有效againstall类型的病原体和害虫,包括真菌、细菌、病毒、线虫、卵菌纲和昆虫。NB-LRR(NL)可分为两个子类的基础上他们的伴序列,对应两个古老血统31:那些编码n端结构域与人数/ Interleukin-1受体同源性(TIR-NB-LRR或TNL),和那些编码n端coiled-coilmotif(CC-NB-LRR或补偿中子测井)29。NB-LRR可以编码蛋白质的基因plantsand家庭最大和最变量通常是在复杂的集群组织基因紧密相连(32、33)。在目前的审查,利用整个genomesequence刀豆,我们将分配ofNB-LRR豆基因组中基因,他们潜在的协同定位withgenetically阻力对variouspathogens特异性特征以及繁殖的阻力、特别是foranthracnose可以受益于刀豆的全基因组序列的可用性。2。基因和基因组的分布monogenicresistance genome2.1基因共同bean。全基因组序列的菜豆:ancientorphan作物加入现代eraG19833安第斯菜豆基因型的国际热带农业中心(国际热带农业中心),测序桑格的使用组合,454年,Illumina公司HiSeq2000读取。Agenetic地图基于7015个SNP标记被用来组装thereference基因组序列4。总共有473 Mb的587 - mbgenome组装,和98%的这个序列是genet-ically锚定在11 chromosome-scale pseudomolecules。Theassembled基因组序列注释使用transcriptomedata和从头开始的方法,允许识别的27197个蛋白编码基因座,其中包括27197替代文本。在addi-tion,重复序列也被确定。以前曾有报道称,事实上,commonbean基因组包含大量大量的重复序列34与其他豆类speciespresenting相比更大的基因组大小,如三叶草被(956 Mb;35)和大豆(1103 Mb;36)。转位因子wereshown代表45%的基因组。此外,卫星DNAswere还在基因组层面特征如khipu和Nazcapresenting相同的528 pb单元大小和subtelomeric andcentromeric分布,分别(37、38).2.2(图1)。复杂的阻力集群往往对应但不是alwaysto大NB-LRR clustersThe全基因组序列的可用性提供了一个uniqueopportunity研究问序列的分布。com-plete组问蛋白被发现在一个反复的过程。首先,预测蛋白质序列的一个嗯搜索Phase-olus(p .寻常的G19833;变得,版本1.0)是为了identifysequences包含NB-ARC域。此外,identifyhomologs(如不同或不被确认为羊痘疮theautomated注释)错过了在第一步中,所有问predictedproteinpredictedprotein序列中确定第一步被用作查询totBLASTn整个基因组4。总共376 NLs基因,which106 TNLs和270主办,被确定(图1)。绝大多数ofNLs序列是身体组织的复杂的集群,oftenlocated染色体末端的(图1)。特别是,threelarge集群是位于染色体末端的Pv04,Pv10and Pv11和包含40多个NLs基因enrichedfor CNL(Pv04和Pv11)或TNL(Pv10)基因。对于这些三大NLclusters,大量khipu卫星序列(inpink呈现在图1)也在场。抗病性的遗传研究的长期共同的bean。例如,p . vul-garis之间的交互和c . lindemuthianum是第一个报告race-cultivarspecificity39-41。许多疾病R基因多样化pathogenshave经过基因映射和/或相关分子markersdescribed图1中所示的(见参考资料)。图1给出的近似位置asynthesis基因characterizedR在菜豆对各种病原体的基因。大多数thecomplex R基因的基因簇特征超过pseudomolecules结束和对应问基因(二氧化碳、Co-32 Co-4、Co-43 Co-5,Co-6,co-8,Co-9和Co-u)和R基因的安第斯山脉起源(Co-15)18。因此,Co-x,一个稀缺的安第斯炭疽病R基因特征,出现托比特别感兴趣的R基因通过控股公司计划与otherMesoamerican R基因。参考基因组序列的基础上G19833,PCR primerpairs旨在扩大约1 kb的GC %50% frequenciesof多态性基因间区域,这些地区目前高于编码区域。引物的特异性P。寻常的基因组检查使用自定义基于Perl脚本在发表计划58。第一步,根据approximatelocation感兴趣的基因的基因组和segregatingpopulation R基因,是确定侧翼标记。然后,标记可以逐步设计基于整个genomesequence限制目标地区周围感兴趣的基因。使用此策略,55 locus-specific pcr标记与最接近gen-erated制造商定义一个58 kb间隔在Co-x基因18。这些标记构成了原材料foroptimizing,感兴趣的基因型,标记,用来在MAS(Co-x)。这一战略的局限性(i)abil-ity设计轨迹目标地区特定的引物(导致重复序列的存在),(ii)的水平polymor-phism双亲之间的隔离人口在目标地区,和(3)重组事件的数量在目标区域隔离人群。后者param-eter取决于大小和隔离的本质populationas以及基因组的目标区域的位置。的确,比较不同speciessuch遗传和物理距离的玉米、大豆和菜豆都表明dis-tal的染色体区域高度重组comparedto pericentromeric地区59 - 61。forCo-x描述的例子中,这项研究是在一个有利的背景下进行的。首先,Co-xgenetic映射进行了中美洲之间的人口瑞来斯派生从十字架上繁殖BAT93和theAndean长白猪JaloEEP558,呈现高水平的polymor-phism。此外,瑞来斯的人口,作为小informativeas F2群体遗传距离62。最后,dis-tal Co-x的位置上考虑torecombination Pv01也是一个积极点。在这种情况下,使用一个人口只有181瑞来斯,可以精细地图Co-x R基因的间隔58 kb剧中几周。这个简单和廉价策略快速identifytightly链接标记基于整个基因组序列可以用于任何耐药基因呈现在图1。Co-x R基因,其中大部分位于远端地区的染色体终究也因此受益recombina-tion在那些地区,更高水平的一个重要因素来确定密切linkedmarkers。重复序列的存在如khipu satel-lite几家大型电阻集群(Pv04年底,Pv10 Pv11)可能复杂轨迹的设计特定的引物。然而,即使大量的khipu(30 kb)现在的某个时候,他们总是被non-repeated序列themarkers应该设计优先63。这种策略是设计的另一个limi-tation pcr标记最为占主导地位的时间。这不是一个问题对于RILspopulations。然而,如果需要,如在F2野生的情况下,转换为共显性标记是可能的,即使morecomplicate和耗时。还有其他的例子全基因组序列意在设计分子标记在菜豆。狂轰滥炸之一是大量的健壮indel标记bylow通过测序发现14个不同的大豆基因型和mappingthe读取参考基因组。由此产生的“易于使用”pcr标记特定平托,黑色,海军,和肾脏beanmarket类64。另一个例子是优雅identificationof分子标记与我基因位于chro-mosome Pv02基于在硅的隔离分析(BSA)耀目豆500行和基因分型的多样性面板Illu-mina英6 k SNP BeadChip(BARCBEAN 3)65。这strategyled SNP标记的识别与我基因密切相关(25 kb)在共显性的转换KASP(Kompetitive AlleleSpecific PCR)和帽子(裂解放大多态序列)。显然这两个例子展示如何使用commonbean基因组序列可以提高molecularmarkers的发展。然而,重新排序和SNP基因分型strategiesare相当昂贵相比之前提出tar-geted pcr标记设计策略,这些策略可以看作是互补的。即使它并不重要知道anR基因的分子基础包括在MAS繁殖计划这informationmight是一个重要的标准来选择基因的结合。例如,育种者可以选择她们金字塔R基因不同的分子基础,因为他们可以阻止病原体atdifferent水平的循环。因为电阻是一个“基因型个别特质”,参考基因组(G19833)是不够的,还需要得到目标序列的基因型carry-ing R基因通过远程PCR和/或非网格BAClibrary,一个最快的替代传统网格BAC库66。基因的功能验证候选人(s)将possi-ble利用病毒诱导基因沉默(中收取),BPMV-derivedVIGS向量最近优化菜豆(51、67、68)。参考基因组序列的可用性是一个资源,无疑将促进Rgenes共同点bean.4图谱克隆。假设有关的巨大规模subtelomeric NLclusters beanIn菜豆基因组一样,大多数的R基因clustersare位于染色体的末端和现在比其他物种hugesize(图1),其中一些flu-orescence原位杂交(鱼)分析显示asubtelomeric位置。这是Pv04 B4集群的情况下,二氧化碳集群Pv11和Co-4集群Pv08(63、69、70)。关于他们的体型巨大,但它是特别令人印象深刻的为问集群位于Pv04,Pv10,Pv11 eachcontaining 40多问序列。Microsynteny analysisbased低复制基因的二氧化碳和B4集群betweensoybean和菜豆问序列的令人印象深刻的amplifi-cation菜豆唯一20 nls被确定在相应地区的大豆为B4和二氧化碳集群,分别为(63、71)。这表明地区来往菜豆是R geneproliferation有利的“利基市场”。R基因表达可能与健身相关成本在寄主植物(72、73)。因此,R基因表达需要仔细监管特别是植物物种manyNL基因。各种机制正在成为牵连在监管问序列包括microrna的调制ofNL表达式(74、75)。然而,因为这个过程不是个别刀豆,因为它已被确定在variousplant物种从番茄云杉,它无法解释的问集群hugesize菜豆(76 - 78)。特殊特性ofcommon豆基因组包括终端旋钮(het-erochromatic块)的存在,他们中的大多数包含khipu satelliteDNA63。如前所述,远端地区chro-mosomes高度重组pericentromericregions相比,因此有利于促进NL amplifica-tion通过不平等的互换。此外,identificationof大量khipu串联重复序列紧密相连的3大问Pv04集群,Pv10,Pv11表明ampli -对问序列可以被提升了unequalcrossing涉及khipu序列。此外,epigeneticsilencing邻近基因的异色的区域和重复序列通过甲基化的传播过程和已知(79、80)。因此,我们建议这pecu-liar基因环境可能支持大型Rgene集群由于扩散,不仅增加了复合,还可以让他们某种形式的沉默81允许大量扩增NLsequences没有健身成本。Subtelomeres往往被视为可变位点含有飞速发展基因家族参与自适应过程和arehot斑点染色体间的重组(82、83)。的plas-ticity subtelomeres被描述在各种organismssuch酵母,锥体虫,真菌与人类,然而信息缺乏植物subtelomeres(82、83)。豆一样,使用系统的组合和鱼的方法,我们提出,B4集群(Pv04)源自Co-2cluster(Pv11)之间通过一个异位重组异源染色体subtelomeric地区63。Wholegenome菜豆序列在基因组层面提供了独特的possibilityto研究物理andphylogene

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论