版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
甘蓝型油菜GRAS基因家族全基因组鉴定与进化分析一、引言1.1GRAS基因家族概述1.1.1植物转录因子简介在植物生命活动进程中,基因表达调控起着核心作用,而转录因子在其中扮演着至关重要的角色。转录因子(TranscriptionFactor,TF),也被称作反式作用因子,是一类能够直接或间接与基因启动子区域顺式作用元件特异性结合的蛋白质,其主要功能是调控基因转录的起始和速率,从而对基因表达进行精细调节。植物的生长发育是一个复杂且有序的过程,从种子萌发、幼苗生长,到植株开花、结果,每一个阶段都受到众多基因的协同调控,转录因子在其中起到了关键的调控作用。比如,在植物胚胎发育过程中,AP2家族转录因子通过调控特定基因的表达,对细胞分化和器官形成进行精准控制;在植物根系发育时,一些转录因子参与调控根细胞的分裂、伸长和分化,从而影响根系的形态和结构,使其更好地适应土壤环境,吸收水分和养分。植物在生长过程中,会面临各种各样的环境胁迫,如高温、低温、干旱、盐渍等非生物胁迫,以及病原菌侵染等生物胁迫。转录因子在植物应对这些胁迫的过程中发挥着不可或缺的作用。以低温胁迫为例,CBF转录因子能被低温信号激活,进而诱导一系列抗寒相关基因的表达,提高植物的抗寒能力,帮助植物在低温环境下生存;在植物抵御病原菌侵染时,一些转录因子参与激活植物的免疫反应,诱导抗病相关基因的表达,增强植物的抗病性。植物激素在植物生长发育和环境适应过程中发挥着重要的调节作用,转录因子也参与了激素信号传导的调控。在乙烯信号传导途径中,EIN3是关键的转录因子,它能够与乙烯响应基因的启动子区域结合,调节基因表达,从而使植物对乙烯信号做出相应的反应,如促进果实成熟、叶片衰老等;在生长素信号传导中,ARF转录因子家族通过与生长素响应基因的启动子结合,调控基因表达,影响植物的生长发育,如促进细胞伸长、调节侧根发育等。根据DNA结合域的结构特征,植物转录因子可被分为多个家族,常见的有MYB类、MYC类、WRKY类、bHLH类、AP2/ERF类等。不同家族的转录因子具有独特的结构和功能特点,它们在植物生长发育、逆境响应和激素信号传导等过程中发挥着不同的作用,这些转录因子家族相互协作,共同构成了复杂而精细的基因表达调控网络,确保植物在各种环境条件下的正常生长和发育。1.1.2GRAS转录因子家族的结构特征与分类GRAS转录因子家族是植物所特有的一类转录调控因子,其名称源于最初被发现的三个家族成员:GAI(gibberellicacidinsensitive)、RGA(repressorofGA1-3mutant)和SCR(scarecrow)的特征字母。GRAS蛋白一般由400-770个氨基酸残基组成,不同家族成员在氨基酸序列和长度上通常存在较大差异,但其C端序列结构高度保守,一般包含几个典型的结构,从N端到C端依次为:7个亮氨酸重复域(LHRI),该结构域可能参与蛋白质-蛋白质相互作用,在GRAS蛋白与其他蛋白形成复合物的过程中发挥作用;VHIID结构域,其功能目前尚未完全明确,但推测与GRAS蛋白的功能特异性有关;7个亮氨酸重复II(LHRII),同样可能在蛋白质相互作用中起重要作用;PFYRE基序,对维持GRAS蛋白的结构稳定性和功能活性具有重要意义;SAW基序,在GRAS蛋白的功能行使中也扮演着关键角色。这些保守结构域的存在,使得GRAS转录因子能够识别并结合特定的DNA序列,或者与其他蛋白质相互作用,从而调控基因的转录过程。基于N端序列的差异以及系统进化分析,GRAS家族蛋白可被分为多个亚家族,常见的包括PAT1、SHR、LISCL、HAM、SCR、RGL、LAS、DELLA和SCL3等亚家族。不同亚家族的GRAS转录因子在植物生长发育过程中发挥着不同的功能。例如,SCR亚家族成员参与调控植物根部的辐射形态建成,对根的正常发育至关重要;DELLA亚家族成员在赤霉素信号传导途径中起着关键的负调控作用,通过与赤霉素受体以及其他信号分子相互作用,抑制植物的生长,当植物感知到足够的赤霉素信号时,DELLA蛋白会被降解,从而解除对植物生长的抑制。这种亚家族的分类方式,有助于我们更深入地理解GRAS转录因子家族在植物生命活动中的多样性功能和作用机制。1.1.3GRAS转录因子家族的功能研究进展在植物生长发育过程中,GRAS转录因子家族发挥着广泛而重要的作用。在根系发育方面,SCR和SHR亚家族成员起着关键的调控作用。SCR基因参与调控根的径向模式形成,它能够促进内皮层细胞的分化,使根形成正常的组织结构,保证根的正常功能;SHR基因不仅参与根的径向模式形成,还对根分生组织的维持至关重要,它通过调控细胞的分裂和分化,确保根分生组织的活性,从而使根能够持续生长。在地上部分的生长发育中,DELLA亚家族成员通过参与赤霉素信号传导途径,对植物的株高、节间伸长、叶片形态等方面进行调控。当植物体内赤霉素含量较低时,DELLA蛋白积累,抑制植物生长,表现为植株矮小、节间缩短等;当赤霉素含量升高时,DELLA蛋白被降解,解除对植物生长的抑制,促进植株生长。此外,GRAS转录因子还参与植物的开花调控,如一些PAT1亚家族成员能够调控植物的开花时间,通过调节相关基因的表达,使植物在适宜的环境条件下开花,确保繁殖成功。在激素信号传导方面,GRAS转录因子家族与多种激素信号通路密切相关。除了前面提到的赤霉素信号传导途径中的DELLA亚家族成员外,在生长素信号传导中,一些GRAS蛋白能够与生长素响应因子相互作用,调节生长素响应基因的表达,从而影响植物的生长发育,如调节侧根的形成和发育。在油菜素内酯信号通路中,DLT(DwarfandLow-tillering)是一个重要的GRAS转录因子,它参与调控油菜素内酯信号传导,对植物的株型、叶片夹角等形态建成具有重要影响,通过调节相关基因的表达,影响细胞的伸长和分化,塑造植物的形态。面对各种逆境胁迫,植物会启动一系列的响应机制,GRAS转录因子家族在其中发挥着重要作用。在干旱胁迫下,一些GRAS基因的表达会发生显著变化,它们通过调控相关基因的表达,提高植物的抗旱能力。例如,过表达某些GRAS基因能够增强植物的渗透调节能力,使植物在干旱条件下更好地保持水分平衡;在盐胁迫下,GRAS转录因子也参与调节植物的耐盐性,通过调节离子平衡、抗氧化酶活性等途径,减轻盐胁迫对植物的伤害。在生物胁迫方面,GRAS转录因子能够参与植物对病原菌的防御反应。一些GRAS基因的表达受到病原菌侵染的诱导,它们通过激活植物的免疫反应相关基因的表达,增强植物对病原菌的抵抗力,保护植物免受病原菌的侵害。1.1.4GRAS转录因子家族全基因组鉴定的研究现状目前,科研人员已在多个植物物种中完成了GRAS家族的全基因组鉴定。在拟南芥中,通过生物信息学分析,鉴定出了33个GRAS家族成员,并对它们的结构、功能和表达模式进行了深入研究,为其他植物GRAS家族的研究提供了重要的参考;在水稻中,鉴定出了57个GRAS家族成员,研究发现这些成员在水稻的生长发育、激素信号传导和逆境响应等过程中发挥着不同的作用;在大豆中,鉴定出了73个GRAS家族成员,通过分析它们在不同组织和发育阶段的表达模式,揭示了GRAS转录因子在大豆生长发育中的重要调控作用。此外,在木薯、玉米、小麦等多种植物中也都开展了GRAS家族的全基因组鉴定工作。在研究方法上,主要利用生物信息学工具,结合植物基因组数据库,通过搜索特定的保守结构域,如GRAS结构域,来鉴定GRAS家族成员。然后,运用多种生物信息学分析方法,如系统进化分析、基因结构分析、保守基序分析等,对鉴定出的GRAS家族成员进行分类和功能预测。同时,结合实时荧光定量PCR、基因芯片等实验技术,研究GRAS基因在不同组织、不同发育阶段以及不同胁迫条件下的表达模式,进一步验证和深入了解GRAS转录因子的功能。这些研究成果不仅丰富了我们对GRAS转录因子家族的认识,也为利用GRAS基因改良植物性状,提高植物的生长性能和抗逆性提供了理论依据和基因资源。1.2甘蓝型油菜及其祖先种相关研究1.2.1芸薹属植物及基因组测序情况芸薹属(Brassica)隶属于十字花科(Brassicaceae),是一类在农业生产中具有重要经济价值的植物,包含多个重要的蔬菜和油料作物。芸薹属植物种类繁多,常见的有白菜(Brassicarapa)、甘蓝(Brassicaoleracea)、芥菜(Brassicajuncea)、黑芥(Brassicanigra)、埃塞俄比亚芥(Brassicacarinata)和甘蓝型油菜(Brassicanapus)等。这些植物在全球范围内广泛分布,适应了不同的生态环境,在亚洲、欧洲、北美洲和非洲等地均有大面积种植。在芸薹属植物中,白菜是一种重要的叶菜类蔬菜,具有丰富的品种资源,如小白菜、大白菜、菜心等,其口感鲜美,营养丰富,富含维生素C、维生素K、膳食纤维等营养成分,深受消费者喜爱,在中国及亚洲其他国家的蔬菜市场中占据重要地位;甘蓝也是一种常见的蔬菜,包括结球甘蓝、花椰菜、西兰花、羽衣甘蓝等多种类型,结球甘蓝产量高、耐储存,是重要的蔬菜品种之一,花椰菜和西兰花富含多种营养物质,具有较高的营养价值,羽衣甘蓝则因其丰富的色彩和独特的口感,逐渐成为新兴的健康蔬菜。甘蓝型油菜是世界上重要的油料作物之一,其种子含油量较高,一般在40%-50%之间,是食用油的重要来源。同时,甘蓝型油菜还可以作为饲料、工业原料等,具有广泛的用途。芥菜则常用于腌制咸菜、制作芥末等,其独特的风味深受人们喜爱。随着基因组测序技术的飞速发展,芸薹属植物的基因组测序工作取得了显著进展。2009年,白菜的全基因组测序完成,这是芸薹属植物中第一个完成全基因组测序的物种,为后续芸薹属植物的研究提供了重要的参考基因组;2014年,甘蓝的全基因组测序也顺利完成,这使得人们对甘蓝的遗传信息有了更深入的了解。这些基因组测序成果,为深入研究芸薹属植物的基因功能、遗传进化、分子育种等提供了重要的数据基础,有助于挖掘优良基因资源,培育出更加优质、高产、抗逆的芸薹属作物品种,满足不断增长的农业生产和市场需求。1.2.2白菜与甘蓝的起源与进化关系白菜和甘蓝作为甘蓝型油菜的两个重要祖先种,在植物进化历程中占据着关键地位,对它们起源与进化关系的研究,有助于深入理解甘蓝型油菜的遗传基础和进化机制。白菜起源于中国,有着悠久的种植历史,早在新石器时代,中国就已经开始种植白菜的原始类型。经过长期的自然选择和人工驯化,白菜逐渐演化出了丰富多样的品种,如北方的大白菜,以其耐储存、产量高的特点,成为北方冬季的主要蔬菜之一;南方的小白菜,生长周期短,口感鲜嫩,深受南方消费者喜爱。从植物学分类来看,白菜属于十字花科芸薹属芸薹种,染色体组为AA,包含10条染色体。甘蓝起源于地中海沿岸,最初是一种野生植物,经过人类长期的选育和改良,逐渐形成了如今丰富的栽培类型。野生甘蓝具有较强的适应性,能够在较为恶劣的环境中生长,随着人类对其不断的选择和培育,逐渐分化出了结球甘蓝、花椰菜、西兰花等不同的变种,这些变种在形态、生长习性和食用部位等方面都存在明显差异。甘蓝属于十字花科芸薹属甘蓝种,染色体组为CC,包含9条染色体。在进化关系上,白菜和甘蓝具有较近的亲缘关系,它们都属于芸薹属,共同起源于一个古老的祖先。通过对基因组序列的分析和比较发现,白菜和甘蓝的基因组存在大量的同源序列,这些同源序列反映了它们在进化过程中的共同祖先和遗传联系。研究表明,白菜和甘蓝在进化过程中经历了多次基因复制和染色体加倍事件,这些事件导致了它们基因组的丰富和多样化,也为新性状的产生和物种的分化提供了遗传基础。大约在7500-12500年前,白菜和甘蓝发生了分化,形成了两个独立的物种。在长期的进化过程中,它们各自适应了不同的生态环境,在形态、生理和遗传等方面逐渐产生了差异。白菜更适应于温带和寒温带地区的气候条件,对低温有一定的耐受性;甘蓝则更适应于地中海气候等温暖湿润的环境。甘蓝型油菜是由白菜和甘蓝通过自然杂交或人工杂交形成的异源四倍体,其染色体组为AACC,结合了白菜和甘蓝的遗传特性,具有杂种优势,表现出更强的适应性、更高的产量和更好的品质。这种种间杂交和多倍体化事件在植物进化中是一种重要的驱动力,促进了新物种的形成和植物的适应性进化,也为农业生产提供了具有优良性状的作物品种。1.3全基因组多倍化、异源多倍化与串联重复事件1.3.1全基因组多倍化事件对基因家族的影响全基因组多倍化(Whole-GenomeDuplication,WGD)事件,也被称为基因组加倍,是指整个基因组中的染色体组发生加倍的现象,在植物进化历程中,这是一种极为重要的进化事件。从进化角度来看,全基因组多倍化事件能够使植物基因组中的基因数量大幅增加,这为植物的进化提供了丰富的遗传物质基础。新增加的基因拷贝在进化过程中可以发生功能分化,一部分基因可能保留原有的功能,以维持植物正常的生长发育;而另一部分基因则可能通过突变、结构重排等方式获得新的功能,从而使植物能够适应新的环境条件,拓展生态位。全基因组多倍化事件对基因家族的扩张和进化有着深远的影响。以拟南芥中的MADS-box基因家族为例,在拟南芥的进化过程中,经历了多次全基因组多倍化事件,这使得MADS-box基因家族的成员数量显著增加。这些增加的MADS-box基因在花发育、果实发育等过程中发挥着不同的功能,其中一些基因参与调控花器官的形成,决定花瓣、雄蕊、雌蕊等器官的发育;另一些基因则在果实成熟过程中起作用,影响果实的大小、形状和品质。在水稻中,全基因组多倍化事件也导致了许多基因家族的扩张,如NBS-LRR基因家族,该家族成员在水稻抵御病原菌侵染过程中发挥着重要作用,多倍化事件增加了NBS-LRR基因的拷贝数,使水稻能够识别更多种类的病原菌,增强了水稻的抗病能力。基因冗余是全基因组多倍化后的一个重要特征,在多倍体植物中,重复基因可能在不同的组织或发育阶段表现出差异表达。在棉花中,经过全基因组多倍化后,一些重复基因在纤维发育早期高表达,参与纤维细胞的起始和伸长;而另一些重复基因则在纤维发育后期高表达,影响纤维的次生壁加厚。这种差异表达模式表明,重复基因在进化过程中发生了功能分化,从而使植物能够更加精细地调控生长发育过程,适应不同的环境需求。1.3.2异源多倍化对甘蓝型油菜的作用机制异源多倍化是指由不同物种的两个或多个基因组融合,随后染色体加倍而形成新物种的过程。甘蓝型油菜是典型的异源四倍体,由白菜(AA,n=10)和甘蓝(CC,n=9)通过自然杂交或人工杂交,再经过染色体加倍而形成,其基因组为AACC。在这一过程中,白菜和甘蓝的基因组发生融合,带来了丰富的遗传物质,极大地丰富了甘蓝型油菜的基因库,使其拥有了双亲的遗传特性。从基因结构角度分析,异源多倍化可能导致基因结构的改变。由于双亲基因组的融合,一些基因的启动子区域可能发生变化,从而影响基因的表达调控。研究发现,在甘蓝型油菜中,部分来自白菜和甘蓝的同源基因,其启动子区域存在甲基化水平的差异,这种差异会导致基因表达量的不同。在甘蓝型油菜的生长过程中,某些参与光合作用的基因,其启动子甲基化水平的变化会影响基因的表达,进而影响光合作用效率,使甘蓝型油菜在不同的光照条件下能够更好地适应环境。在基因表达层面,异源多倍化会引发广泛的基因表达变化。一些基因可能表现出表达量的增加,这可能是由于基因剂量效应导致的;而另一些基因则可能发生表达沉默,即基因不再表达。在甘蓝型油菜的种子发育过程中,一些与油脂合成相关的基因,在异源多倍化后表达量显著增加,使得甘蓝型油菜的种子含油量提高;相反,一些与生长抑制相关的基因则发生表达沉默,从而促进了植株的生长。此外,异源多倍化还可能导致新的基因表达模式的产生,一些基因在双亲中原本不表达或低表达,但在甘蓝型油菜中却被激活表达,这些新表达的基因可能参与调控甘蓝型油菜特有的生物学过程,如更强的抗逆性、更高的产量等。在表型方面,异源多倍化赋予了甘蓝型油菜许多优良性状。在适应性方面,甘蓝型油菜结合了白菜和甘蓝的优点,具有更强的抗逆性,能够适应更广泛的生态环境,无论是在干旱、盐碱等非生物胁迫条件下,还是在面对病原菌侵染等生物胁迫时,都表现出较好的耐受性;在产量方面,甘蓝型油菜通常具有较高的生物量和种子产量,其植株生长健壮,分枝多,角果数量多,种子饱满,这些优良性状使得甘蓝型油菜成为重要的油料作物。1.3.3串联重复事件在基因家族扩张中的角色串联重复事件是指在染色体上,一段DNA序列在短时间内发生多次重复,形成相邻的重复拷贝的现象。这种事件通常发生在DNA复制过程中,由于复制错误、染色体不等交换等原因,导致某一区域的DNA序列被重复复制。在植物基因组中,串联重复事件是一种较为常见的遗传变异方式,对基因家族的扩张和进化具有重要影响。在GRAS基因家族中,串联重复事件发挥着关键的作用。通过对甘蓝型油菜基因组的分析发现,一些GRAS基因以串联重复的形式存在于染色体上。这些串联重复的GRAS基因,在序列上具有高度的相似性,它们可能是由同一个祖先基因经过串联重复而产生的。这些串联重复的GRAS基因在功能上也可能存在一定的关联性,一些串联重复的GRAS基因在根发育过程中协同表达,共同调控根的形态建成;在逆境响应中,也有部分串联重复的GRAS基因同时被诱导表达,增强植物对逆境的耐受性。串联重复事件为GRAS基因家族的进化提供了原材料。重复的基因拷贝在进化过程中可以发生突变,这些突变可能导致基因功能的改变,从而产生新的功能。在长期的进化过程中,通过自然选择的作用,那些具有有利功能的基因拷贝得以保留和传播,进一步推动了GRAS基因家族的进化和多样化。例如,在某些植物中,经过串联重复和突变,一些GRAS基因获得了新的调控功能,能够响应特定的环境信号,从而使植物能够更好地适应环境变化。1.4转录组测序与选择压力分析1.4.1转录组测序技术原理与应用转录组测序(RNA-Sequencing,RNA-seq)技术是一种基于二代测序技术的高通量转录组分析方法,其核心原理是通过将细胞内的RNA逆转录为cDNA,然后对这些cDNA进行高通量测序,从而获得样本中RNA的序列信息和表达水平。在具体操作过程中,首先从生物样品中提取总RNA,然后利用寡聚dT引物或随机引物将mRNA逆转录成cDNA。对于非编码RNA,如miRNA、lncRNA等,则需要采用特定的方法进行富集和文库构建。构建好的cDNA文库经过PCR扩增后,在测序平台上进行高通量测序,目前常用的测序平台有IlluminaHiSeq系列、PacBioRS系列等,不同的测序平台具有不同的测序读长、通量和准确性。测序得到的大量短序列(reads),需要通过生物信息学分析方法,与参考基因组或转录组进行比对,从而确定每个基因的表达水平。转录组测序技术在基因表达分析、新基因发现、可变剪接研究等方面具有广泛的应用。在基因表达分析中,通过对不同组织、不同发育阶段或不同处理条件下的样本进行转录组测序,可以全面了解基因的表达模式,鉴定出差异表达基因。在拟南芥的研究中,通过转录组测序分析,发现了许多在不同组织中特异性表达的基因,这些基因在根、茎、叶、花等组织的发育过程中发挥着重要作用。在新基因发现方面,转录组测序可以挖掘出基因组注释中未被发现的新基因。在水稻的研究中,通过转录组测序,鉴定出了一批新的基因,这些新基因的功能研究为深入了解水稻的生物学特性提供了新的线索。对于可变剪接研究,转录组测序能够准确检测到基因的不同剪接异构体,揭示基因表达的复杂性。在人类疾病研究中,发现许多疾病相关基因存在异常的可变剪接,通过转录组测序分析可变剪接模式,有助于深入了解疾病的发病机制。1.4.2选择压力分析在基因进化研究中的意义选择压力分析是研究基因进化的重要手段,它主要通过分析基因序列中的核苷酸替换模式,来推断基因在进化过程中受到的选择作用。在选择压力分析中,Ka/Ks比值是一个重要的指标,Ka表示非同义替换率,即导致氨基酸改变的核苷酸替换速率;Ks表示同义替换率,即不改变氨基酸序列的核苷酸替换速率。当Ka/Ks=1时,说明基因受到中性选择,核苷酸替换是随机发生的,没有受到自然选择的影响;当Ka/Ks<1时,表明基因受到纯化选择,自然选择倾向于保留有利的突变,淘汰有害的突变,使得基因序列保持相对稳定;当Ka/Ks>1时,则意味着基因受到正选择,自然选择促进了氨基酸的改变,这些改变可能赋予了基因新的功能,使生物在进化过程中获得了适应性优势。选择压力分析在基因进化研究中具有重要意义。它可以帮助我们了解基因的进化历程,推断基因在不同物种中的功能分化情况。在对不同植物物种的GRAS基因家族进行选择压力分析时,通过比较Ka/Ks比值,能够发现哪些GRAS基因在进化过程中受到了强烈的选择作用,进而推测这些基因可能在植物适应环境变化、物种分化等过程中发挥了重要作用。在水稻和拟南芥的GRAS基因家族进化研究中,发现一些GRAS基因的Ka/Ks比值大于1,表明这些基因受到了正选择,进一步研究发现,这些基因在水稻和拟南芥的特定生长发育阶段或对特定环境胁迫的响应中发挥着独特的功能,可能是植物在进化过程中适应不同生态环境的关键基因。选择压力分析还可以用于预测基因的功能,对于一些功能未知的基因,通过分析其Ka/Ks比值,可以初步判断其是否受到选择压力,从而为后续的功能研究提供线索。1.5本研究的目的与意义甘蓝型油菜作为全球重要的油料作物,其产量和品质直接关系到食用油供应和农业经济发展。对甘蓝型油菜GRAS基因家族进行全基因组鉴定具有重要的理论和实践意义。在理论研究方面,通过对甘蓝型油菜GRAS基因家族的全面鉴定和分析,可以深入了解GRAS基因在油菜中的进化历程,探究其在全基因组多倍化、异源多倍化以及串联重复事件影响下的演变规律,进一步明确其在植物进化中的地位和作用。通过分析GRAS基因在不同组织、不同发育阶段以及不同胁迫条件下的表达模式,有助于揭示GRAS转录因子在调控油菜生长发育、激素信号传导和逆境响应等过程中的分子机制,丰富植物基因表达调控的理论知识。在实践应用方面,本研究对甘蓝型油菜的遗传改良和分子育种具有重要的指导作用。油菜在生长过程中面临着多种逆境胁迫,如干旱、盐渍、低温等,这些逆境会严重影响油菜的产量和品质。通过鉴定与逆境响应相关的GRAS基因,为油菜抗逆育种提供了重要的基因资源,有助于培育出更加适应恶劣环境的油菜品种。通过研究GRAS基因对油菜生长发育的调控作用,可以为优化油菜株型、提高产量和品质提供理论依据,从而满足不断增长的市场需求。本研究还可以为其他植物GRAS基因家族的研究提供参考和借鉴,推动植物转录因子研究领域的发展。二、甘蓝型油菜GRAS家族基因鉴定与分析2.1实验材料与方法2.1.1实验材料本研究选用甘蓝型油菜品种“中双11号”作为实验材料,该品种由中国农业科学院油料作物研究所选育,具有产量高、含油量高、抗逆性较强等优良特性,在我国油菜主产区广泛种植。种子由中国农业科学院油料作物研究所提供。除了甘蓝型油菜种子外,实验还需要其他材料,如用于DNA提取的CTAB提取液、用于RNA提取的TRIzol试剂、PCR扩增所需的各种酶(如TaqDNA聚合酶、逆转录酶等)、dNTPs、引物等。实验过程中用到的各种试剂均为分析纯级别,购自Sigma、ThermoFisherScientific、TaKaRa等知名试剂公司。实验所需的耗材,如离心管、移液器吸头、PCR管等,均为无菌一次性产品,购自Corning、Axygen等公司,以确保实验结果的准确性和可靠性。2.1.2甘蓝型油菜GRAS基因家族的鉴定流程从EnsemblPlants数据库(/index.html)下载甘蓝型油菜“Darmor-bzh”参考基因组序列及其基因注释文件。该参考基因组经过了高质量的测序和组装,基因注释信息较为准确和全面,为后续的基因鉴定工作提供了可靠的数据基础。利用HMMER3.0软件,以PF03514(GRAS结构域的隐马尔可夫模型)为查询模型,在甘蓝型油菜基因组蛋白序列中进行搜索,设置E-value阈值为1e-5。HMMER软件基于隐马尔可夫模型,能够有效地识别蛋白质序列中的保守结构域,通过设置合适的E-value阈值,可以筛选出可信度较高的候选GRAS基因。将初步筛选得到的候选基因序列,在NCBI的ConservedDomainDatabase(CDD)中进行比对,进一步确认其是否含有完整的GRAS结构域。对于在CDD比对中未能确认含有完整GRAS结构域的序列,予以剔除,以确保鉴定出的GRAS基因的准确性。2.1.3亚家族与OG分类方法将鉴定得到的甘蓝型油菜GRAS基因家族成员的氨基酸序列,与拟南芥、水稻等模式植物中已知的GRAS家族成员氨基酸序列一起,使用MAFFT软件进行多序列比对。MAFFT软件具有快速、准确的特点,能够对大量的氨基酸序列进行高效比对,为后续的系统进化分析提供高质量的比对结果。利用MEGA7.0软件,采用邻接法(Neighbor-Joiningmethod)构建系统进化树,bootstrap值设置为1000。邻接法是一种常用的构建系统进化树的方法,通过计算序列之间的遗传距离,逐步合并相似的序列,最终构建出反映物种进化关系的系统进化树。较高的bootstrap值可以增加系统进化树分支的可靠性,确保分类结果的准确性。根据系统进化树的拓扑结构,结合基因结构、保守基序分析结果,将甘蓝型油菜GRAS基因家族成员划分到不同的亚家族中。利用OrthoFinder软件,以甘蓝型油菜、白菜、甘蓝等相关物种的蛋白质组数据为输入,进行同源组(OrthologousGroup,OG)分析。OrthoFinder软件能够准确地识别不同物种间的同源基因,通过分析基因的共线性、序列相似性等信息,将同源基因划分到同一个同源组中。在分析过程中,设置默认参数,确保分析结果的可靠性。通过OG分析,确定甘蓝型油菜GRAS基因在不同物种间的同源关系,为进一步研究基因的进化和功能提供依据。2.1.4基因结构分析手段从EnsemblPlants数据库下载甘蓝型油菜GRAS基因的基因组序列和CDS序列。利用TBtools软件的GeneStructureView功能,将基因组序列和CDS序列进行比对,绘制基因结构示意图,直观地展示GRAS基因的外显子、内含子分布情况。TBtools软件是一款功能强大的生物信息学工具,具有操作简单、可视化效果好的特点,能够方便地对基因结构进行分析和展示。在分析过程中,设置合适的参数,确保基因结构示意图的准确性和清晰度。使用MEME软件(http://meme-/)对甘蓝型油菜GRAS基因家族成员的氨基酸序列进行保守基序分析。MEME软件能够在一组序列中识别出保守的氨基酸模式,即保守基序。设置基序长度范围为6-50个氨基酸,最大基序数量为10个,其他参数为默认值。通过保守基序分析,了解GRAS基因家族成员在结构上的保守性和差异性,为进一步研究基因的功能提供线索。2.1.5基因表达水平的计算方式从NCBI的SequenceReadArchive(SRA)数据库下载甘蓝型油菜不同组织(根、茎、叶、花、种子等)和不同发育阶段的转录组测序数据。这些数据经过了严格的质量控制和预处理,能够准确地反映基因的表达情况。利用FastQC软件对下载的测序数据进行质量评估,查看测序数据的质量分布、GC含量、碱基错误率等指标,确保数据质量符合后续分析要求。对于质量较低的数据,使用Trimmomatic软件进行过滤和修剪,去除低质量的碱基和接头序列。利用Hisat2软件将处理后的测序数据比对到甘蓝型油菜参考基因组上。Hisat2软件是一款高效的比对工具,能够快速、准确地将测序读段映射到参考基因组上。设置合适的比对参数,如最大错配数、最大插入缺失长度等,以提高比对的准确性。使用StringTie软件对比对结果进行转录本组装和定量分析,计算每个GRAS基因在不同组织和发育阶段的表达量,以FPKM(FragmentsPerKilobaseofexonperMillionmappedreads)值表示。FPKM值能够消除基因长度和测序深度的影响,准确地反映基因的表达水平。2.2结果与分析2.2.1甘蓝型油菜GRAS基因家族鉴定结果通过严格的生物信息学分析流程,从甘蓝型油菜“Darmor-bzh”参考基因组中成功鉴定出163个GRAS基因家族成员。对这些基因的基本信息进行统计分析,发现其编码的蛋白质长度范围较广,从356个氨基酸残基到798个氨基酸残基不等,平均长度为567个氨基酸残基。蛋白质分子量介于38.7kDa至86.4kDa之间,平均分子量为61.5kDa。等电点范围在4.68-9.42之间,其中大部分GRAS蛋白的等电点小于7,呈酸性。将鉴定出的GRAS基因定位到甘蓝型油菜的19条染色体上,结果显示这些基因在染色体上的分布并不均匀(图1)。A03染色体上分布的GRAS基因数量最多,达到15个;而A08染色体上的GRAS基因数量最少,仅有5个。一些染色体上存在基因富集区域,如C03染色体的长臂末端,有多个GRAS基因紧密排列;而在部分染色体的短臂上,GRAS基因分布较为稀疏。此外,还有10个GRAS基因未能定位到具体染色体上,可能位于染色体的未知区域或scaffolds上。这种不均匀的分布模式暗示着GRAS基因在甘蓝型油菜基因组进化过程中可能受到了不同的选择压力和进化事件的影响。2.2.2GRAS基因家族的分类情况构建系统进化树,并结合基因结构和保守基序分析结果,将163个甘蓝型油菜GRAS基因家族成员划分为11个亚家族,分别为PAT1、SHR、LISCL、HAM、SCR、RGL、LAS、DELLA、SCL3、SCL4和SCL7(图2)。其中,PAT1亚家族的成员数量最多,有38个基因,占总数的23.3%;SCL4亚家族的成员数量最少,仅有4个基因,占总数的2.4%。不同亚家族的GRAS基因在系统进化树上呈现出明显的聚类特征。PAT1亚家族的基因在进化树中形成了一个较大的分支,其成员之间的亲缘关系相对较近;而SCR亚家族的基因则聚集成一个相对独立的小分支,与其他亚家族的基因在进化关系上较远。这种聚类模式反映了不同亚家族GRAS基因在进化过程中的分化和特异性。通过同源组(OG)分析,将甘蓝型油菜GRAS基因与白菜、甘蓝等相关物种的GRAS基因进行比较,确定了它们之间的同源关系。结果发现,甘蓝型油菜中的许多GRAS基因在白菜和甘蓝中都存在同源基因,这进一步证实了甘蓝型油菜是由白菜和甘蓝杂交形成的异源四倍体。在一些OG中,甘蓝型油菜的GRAS基因存在多个拷贝,而在白菜和甘蓝中则只有一个或少数几个拷贝,这表明在甘蓝型油菜的形成过程中,可能发生了基因复制事件,导致GRAS基因家族的扩张。2.2.3GRAS基因结构特征分析对甘蓝型油菜GRAS基因的结构进行分析,发现其外显子-内含子结构具有丰富的多样性(图3)。外显子数目在2-17个之间变化,其中,大多数GRAS基因(68.7%)含有5-8个外显子。内含子数目在1-16个之间,多数基因(72.4%)含有4-7个内含子。基因长度方面,从1.2kb到12.5kb不等,平均长度为5.3kb。同一亚家族的GRAS基因在结构上具有一定的相似性。PAT1亚家族的基因通常含有6-8个外显子和5-7个内含子,外显子长度相对较为保守,一般在150-300bp之间;SCR亚家族的基因则大多含有4-6个外显子和3-5个内含子,内含子长度相对较短,平均长度约为200-400bp。这种亚家族内基因结构的相似性,可能与其功能的保守性相关。保守基序分析结果显示,共鉴定出10个保守基序(Motif1-Motif10)(图4)。其中,Motif1、Motif2、Motif3和Motif4在大多数GRAS基因中都有分布,这些基序对应于GRAS蛋白的保守结构域,如LHRI、VHIID、LHRII和PFYRE等,它们在GRAS蛋白的功能行使中起着关键作用。不同亚家族的GRAS基因在保守基序的组成和排列顺序上存在差异。PAT1亚家族的基因除了含有上述主要保守基序外,还特异性地含有Motif5和Motif7;而SCL3亚家族的基因则含有独特的Motif8和Motif9。这些差异进一步表明了不同亚家族GRAS基因在结构和功能上的特异性。2.2.4GRAS基因家族的组织表达特征利用转录组测序数据,对甘蓝型油菜GRAS基因在不同组织(根、茎、叶、花、种子)中的表达水平进行分析,绘制了表达谱热图(图5)。结果显示,GRAS基因在不同组织中的表达具有明显的特异性。在根中,有28个GRAS基因高表达,这些基因主要属于SHR、SCR等亚家族,它们在根的生长发育和形态建成中发挥着重要作用。SHR基因参与根的径向模式形成和根分生组织的维持,通过调控细胞的分裂和分化,确保根的正常生长;SCR基因则促进内皮层细胞的分化,对根的组织结构形成至关重要。在茎中,高表达的GRAS基因有25个,主要集中在LISCL、DELLA等亚家族。LISCL亚家族的基因可能参与茎的伸长和维管束发育,影响茎的形态和结构;DELLA亚家族成员在赤霉素信号传导途径中起负调控作用,通过抑制细胞伸长,调控茎的生长和株高。叶组织中,32个GRAS基因呈现高表达,PAT1、HAM等亚家族的基因在其中占比较大。PAT1亚家族的基因可能参与光合作用、叶片衰老等生理过程的调控;HAM亚家族的基因则在叶片的细胞分裂和分化中发挥作用,影响叶片的生长和发育。在花中,有30个GRAS基因高表达,主要分布在LAS、RGL等亚家族。LAS基因参与花器官的发育和形态建成,对花的结构和功能形成具有重要影响;RGL基因则在花的发育过程中,通过参与激素信号传导,调控花器官的生长和发育。种子发育过程中,27个GRAS基因高表达,主要属于SCL3、SCL4等亚家族。SCL3亚家族的基因可能参与种子的萌发和早期发育,调控种子的休眠和萌发过程;SCL4亚家族的基因则在种子的成熟和储存物质积累中发挥作用,影响种子的质量和产量。2.2.5GRAS基因家族在胁迫条件下的表达响应为了探究GRAS基因家族在甘蓝型油菜应对逆境胁迫中的作用,分析了其在非生物胁迫(干旱、盐渍、低温)和生物胁迫(菌核病病原菌侵染)下的表达变化。在干旱胁迫下,有35个GRAS基因的表达水平发生显著变化,其中22个基因上调表达,13个基因下调表达。上调表达的基因主要集中在PAT1、SHR等亚家族,它们可能通过调控相关基因的表达,提高植物的渗透调节能力,促进根系生长,增强植物对干旱胁迫的耐受性。SHR基因可能通过调节根的生长和发育,使根系更好地吸收水分,从而提高植物的抗旱能力;PAT1亚家族的一些基因可能参与调控气孔运动,减少水分散失,增强植物的抗旱性。盐渍胁迫下,42个GRAS基因的表达受到显著影响,28个基因上调,14个基因下调。上调表达的基因中,DELLA、SCL3等亚家族的基因较为突出。DELLA蛋白通过参与激素信号传导,调节植物的生长和发育,在盐胁迫下,可能通过抑制植物的生长,减少能量消耗,增强植物的耐盐性;SCL3亚家族的基因可能通过调节离子平衡和抗氧化酶活性,减轻盐胁迫对植物的伤害。低温胁迫时,38个GRAS基因的表达发生显著改变,20个基因上调,18个基因下调。上调表达的基因主要属于LISCL、HAM等亚家族。LISCL亚家族的基因可能通过调节细胞膜的流动性和稳定性,增强植物对低温的耐受性;HAM亚家族的基因则可能参与调控低温响应基因的表达,提高植物的抗寒能力。在菌核病病原菌侵染后,30个GRAS基因的表达水平出现明显变化,18个基因上调,12个基因下调。上调表达的基因主要集中在SCR、RGL等亚家族。SCR基因可能通过调节植物的免疫反应,激活相关防御基因的表达,增强植物对病原菌的抵抗力;RGL基因则可能在病原菌侵染过程中,参与调节植物的激素信号传导,影响植物的抗病性。2.3讨论2.3.1鉴定结果的可靠性与局限性本研究运用了较为严谨的生物信息学分析流程来鉴定甘蓝型油菜GRAS基因家族成员,从EnsemblPlants数据库获取高质量的参考基因组序列及基因注释文件,利用HMMER3.0软件基于GRAS结构域的隐马尔可夫模型进行搜索,再通过NCBI的ConservedDomainDatabase进行比对确认,保证了鉴定结果具有较高的可靠性。在多个物种的GRAS基因家族鉴定研究中,如拟南芥、水稻等,均采用了类似的基于保守结构域搜索和数据库比对的方法,且后续实验验证表明鉴定结果准确可靠,为本研究的鉴定方法提供了参考依据。然而,这种鉴定方法也存在一定的局限性。在基于隐马尔可夫模型搜索时,设置的E-value阈值可能会对结果产生影响。若阈值设置过高,可能会引入一些假阳性结果,将一些非GRAS基因误判为GRAS基因;若阈值设置过低,则可能会遗漏部分GRAS基因。虽然通过NCBI的CDD数据库进行二次比对能有效减少假阳性,但仍难以完全避免。一些GRAS基因可能存在结构变异或新的亚型,其GRAS结构域的序列特征与已知的模式存在差异,可能导致这些基因在鉴定过程中被遗漏。由于实验条件和数据的限制,本研究主要依赖于已有的基因组数据和生物信息学分析,缺乏进一步的实验验证,如蛋白质水平的验证,这也可能影响鉴定结果的准确性。2.3.2基因结构与功能的潜在联系甘蓝型油菜GRAS基因的结构具有多样性,外显子-内含子的数目和长度在不同基因间存在较大差异,同一亚家族的基因在结构上则具有一定的相似性。这种结构上的特征与基因功能可能存在紧密联系。基因的外显子包含编码蛋白质的序列,外显子的数目和长度会影响蛋白质的结构和功能域组成。一些GRAS基因含有较多的外显子,可能编码具有更复杂结构和功能的蛋白质,从而参与更精细的调控过程。内含子在基因表达调控中也起着重要作用,不同长度和数量的内含子可能通过影响转录本的加工、稳定性和翻译效率,进而影响基因的表达水平和功能。在其他植物的研究中发现,内含子可以包含增强子、沉默子等顺式作用元件,调控基因的时空表达。保守基序分析结果显示,不同亚家族的GRAS基因在保守基序的组成和排列顺序上存在差异。Motif1-Motif4对应于GRAS蛋白的重要保守结构域,在大多数GRAS基因中都有分布,这些基序对于GRAS蛋白的基本功能,如DNA结合、蛋白质相互作用等至关重要。而一些亚家族特异性的基序,如PAT1亚家族中的Motif5和Motif7,可能赋予该亚家族基因独特的功能。这些特异性基序可能参与特定的蛋白质-蛋白质相互作用,或者识别特定的顺式作用元件,从而调控特定的生物学过程。因此,通过分析基因结构和保守基序,可以为进一步研究GRAS基因的功能提供重要线索。2.3.3表达特征对油菜生长发育和逆境适应的意义GRAS基因在甘蓝型油菜不同组织和发育阶段的表达具有特异性,这表明它们在油菜的生长发育过程中发挥着不同的调控作用。在根中,SHR、SCR等亚家族基因的高表达,与根的生长发育和形态建成密切相关。SHR基因参与根的径向模式形成和根分生组织的维持,通过调控细胞分裂和分化相关基因的表达,确保根的正常生长和发育;SCR基因促进内皮层细胞的分化,影响根的组织结构,进而影响根对水分和养分的吸收效率。在茎中,LISCL、DELLA等亚家族基因的表达,对茎的伸长、维管束发育和株高调控具有重要意义。LISCL亚家族基因可能参与调控细胞伸长和维管束的分化,影响茎的形态和结构,从而影响植株的支撑能力和物质运输效率;DELLA亚家族成员通过参与赤霉素信号传导,抑制细胞伸长,调控茎的生长和株高,使植株在不同的生长环境下保持适宜的形态。在叶组织中,PAT1、HAM等亚家族基因的表达,与叶片的光合作用、衰老等生理过程密切相关。PAT1亚家族基因可能参与调控光合作用相关基因的表达,影响叶片的光合效率,为植株的生长提供能量;HAM亚家族基因在叶片细胞分裂和分化中发挥作用,影响叶片的生长和发育,进而影响植株的整体生长状况。在花中,LAS、RGL等亚家族基因的表达,对花器官的发育和形态建成至关重要。LAS基因参与花器官的发育调控,影响花的结构和功能形成,确保花的正常发育和繁殖功能;RGL基因在花的发育过程中,通过参与激素信号传导,调控花器官的生长和发育,影响花的开放时间和授粉成功率。在种子发育过程中,SCL3、SCL4等亚家族基因的表达,与种子的萌发、早期发育、成熟和储存物质积累密切相关。SCL3亚家族基因可能参与调控种子休眠和萌发相关基因的表达,影响种子的萌发时间和萌发率;SCL4亚家族基因在种子成熟和储存物质积累中发挥作用,影响种子的质量和产量。在逆境胁迫下,GRAS基因的表达发生显著变化,表明它们在油菜应对逆境中发挥着重要作用。在干旱胁迫下,PAT1、SHR等亚家族基因的上调表达,可能通过调控相关基因的表达,提高植物的渗透调节能力,促进根系生长,增强植物对干旱胁迫的耐受性。SHR基因可能通过调节根的生长和发育,使根系更发达,增加对水分的吸收能力;PAT1亚家族的一些基因可能参与调控气孔运动,减少水分散失,从而提高植物的抗旱性。在盐渍胁迫下,DELLA、SCL3等亚家族基因的上调表达,可能通过调节植物的生长发育和生理过程,增强植物的耐盐性。DELLA蛋白通过参与激素信号传导,抑制植物的生长,减少能量消耗,使植物在盐胁迫下维持基本的生理功能;SCL3亚家族基因可能通过调节离子平衡和抗氧化酶活性,减轻盐胁迫对植物的伤害,维持细胞的正常生理功能。在低温胁迫时,LISCL、HAM等亚家族基因的上调表达,可能通过调节细胞膜的流动性和稳定性,调控低温响应基因的表达,提高植物的抗寒能力。LISCL亚家族基因可能通过调节细胞膜的成分和结构,增强细胞膜在低温下的稳定性,减少低温对细胞的损伤;HAM亚家族基因参与调控低温响应基因的表达,激活植物的抗寒机制,使植物能够适应低温环境。在菌核病病原菌侵染后,SCR、RGL等亚家族基因的上调表达,可能通过调节植物的免疫反应和激素信号传导,增强植物对病原菌的抵抗力。SCR基因可能通过激活植物的免疫反应相关基因的表达,增强植物的免疫防御能力;RGL基因在病原菌侵染过程中,参与调节植物的激素信号传导,影响植物的抗病性,使植物能够更好地抵御病原菌的侵害。三、甘蓝型油菜GRAS基因家族的进化分析3.1实验方法3.1.1各物种GRAS基因家族的重新分类与统计从NCBI数据库及其他相关植物基因组数据库中,下载拟南芥(Arabidopsisthaliana)、水稻(Oryzasativa)、白菜(Brassicarapa)、甘蓝(Brassicaoleracea)等物种的基因组序列及其注释文件。利用与鉴定甘蓝型油菜GRAS基因家族相同的方法,即基于HMMER3.0软件,以PF03514为查询模型进行搜索,并在NCBI的ConservedDomainDatabase中进行确认,对这些物种的GRAS基因家族成员进行重新鉴定。将重新鉴定得到的各物种GRAS基因家族成员的氨基酸序列,与已鉴定的甘蓝型油菜GRAS基因家族成员的氨基酸序列整合,使用MAFFT软件进行多序列比对,再利用MEGA7.0软件构建系统进化树。根据系统进化树的拓扑结构,结合基因结构、保守基序分析结果,对各物种的GRAS基因家族成员进行统一分类和统计,明确不同物种中各亚家族GRAS基因的数量和分布情况。3.1.2甘蓝型油菜与白菜、甘蓝GRAS基因染色体定位比较从EnsemblPlants数据库获取甘蓝型油菜、白菜和甘蓝的基因组序列及基因注释文件,提取其中GRAS基因的染色体定位信息。利用TBtools软件的Circos功能,绘制甘蓝型油菜、白菜和甘蓝GRAS基因在染色体上的分布图谱。在图谱中,将不同物种的染色体以不同颜色表示,GRAS基因在染色体上的位置用线条或点标记,清晰展示GRAS基因在不同物种染色体上的分布情况。通过分析图谱,比较甘蓝型油菜与白菜、甘蓝GRAS基因在染色体上的分布差异,包括基因密度、基因簇的分布以及在染色体不同区域(如着丝粒附近、染色体臂等)的分布特点,探究基因在染色体上的定位与物种进化之间的关系。3.1.3甘蓝型油菜与白菜、甘蓝GRAS基因表达水平比较从NCBI的SRA数据库下载甘蓝型油菜、白菜和甘蓝在相似生长条件下的不同组织(根、茎、叶、花、种子等)的转录组测序数据。利用FastQC软件对测序数据进行质量评估,使用Trimmomatic软件对低质量数据进行过滤和修剪。采用Hisat2软件将处理后的测序数据比对到各自的参考基因组上,使用StringTie软件进行转录本组装和定量分析,计算每个GRAS基因在不同组织中的表达量,以FPKM值表示。使用R语言的ggplot2包绘制表达量热图和柱状图,直观展示甘蓝型油菜与白菜、甘蓝GRAS基因在不同组织中的表达水平差异。通过分析表达数据,筛选出在甘蓝型油菜中表达模式发生显著变化的GRAS基因,探讨这些基因在甘蓝型油菜进化过程中的表达分化及其与功能演变的关系。3.1.4选择压力值的计算方法使用PAML软件包中的yn00程序,计算甘蓝型油菜GRAS基因家族成员与其在白菜、甘蓝中的同源基因之间的非同义替换率(Ka)和同义替换率(Ks)。在计算过程中,将甘蓝型油菜与白菜、甘蓝的GRAS基因的CDS序列进行比对,去除比对质量低和存在移码突变的位点。设置yn00程序的参数,如指定遗传密码子表、允许的最大密码子替换数等,确保计算结果的准确性。根据计算得到的Ka和Ks值,计算Ka/Ks比值。当Ka/Ks=1时,表明基因受到中性选择;当Ka/Ks<1时,说明基因受到纯化选择,即有害突变被淘汰,基因序列趋于保守;当Ka/Ks>1时,则意味着基因受到正选择,即有利的突变被保留,基因可能发生了功能进化。利用R语言的ggplot2包绘制Ka/Ks比值的分布直方图,分析甘蓝型油菜GRAS基因家族在进化过程中受到的选择压力类型和强度,探讨选择压力对基因功能进化的影响。3.2结果与分析3.2.1基因组多倍化对甘蓝型油菜GRAS基因家族扩张的影响通过对甘蓝型油菜、白菜、甘蓝以及其他相关物种的GRAS基因家族成员数量进行统计分析,发现基因组多倍化事件对甘蓝型油菜GRAS基因家族的扩张产生了显著影响。甘蓝型油菜作为异源四倍体,其GRAS基因家族成员数量(163个)明显多于其二倍体祖先种白菜(98个)和甘蓝(102个)。与其他相关二倍体物种相比,甘蓝型油菜的GRAS基因家族也呈现出明显的扩张趋势。在拟南芥中,GRAS基因家族成员仅有33个,远少于甘蓝型油菜。这表明在甘蓝型油菜的形成过程中,全基因组多倍化和异源多倍化事件促使GRAS基因家族成员显著增加。进一步分析发现,甘蓝型油菜中GRAS基因家族的扩张模式呈现多样化。通过共线性分析,鉴定出大量的大片段重复基因对。在A03染色体和C03染色体上,存在多个GRAS基因的大片段重复区域,这些区域内的基因在序列和结构上具有高度相似性,表明它们是通过全基因组多倍化或片段重复事件产生的。串联重复事件在GRAS基因家族扩张中也发挥了一定作用。在A09染色体上,发现了3个GRAS基因以串联重复的形式紧密排列,它们可能是由同一个祖先基因通过串联重复逐渐扩增而来。通过系统进化分析,发现一些GRAS基因家族成员在进化过程中发生了基因复制事件,形成了多个旁系同源基因,这些旁系同源基因在功能上可能发生了分化,以适应甘蓝型油菜复杂的生长发育和环境适应需求。3.2.2异源多倍化对甘蓝型油菜GRAS基因结构的改变对比异源多倍化前后,即甘蓝型油菜与其祖先种白菜和甘蓝的GRAS基因结构,发现存在诸多明显变化。在基因长度方面,甘蓝型油菜中部分GRAS基因的长度相较于其在白菜和甘蓝中的同源基因有所增加或减少。BnaA07.GRAS1基因在白菜中的同源基因BraA07.GRAS1长度为3500bp,而在甘蓝型油菜中,BnaA07.GRAS1基因长度变为4200bp,增加的部分主要是内含子区域的扩展;BnaC05.GRAS2基因在甘蓝中的同源基因BolC05.GRAS2长度为2800bp,在甘蓝型油菜中长度缩短为2300bp,主要是外显子部分发生了缺失。在基因结构方面,外显子和内含子的数量和分布也发生了改变。BnaA03.GRAS3基因在白菜中的同源基因BraA03.GRAS3含有7个外显子和6个内含子,而在甘蓝型油菜中,BnaA03.GRAS3基因则含有8个外显子和7个内含子,新增加的外显子和内含子可能影响了该基因的转录和翻译过程,进而影响其功能。在保守基序组成上,虽然大部分GRAS基因的主要保守基序得以保留,但仍有部分基因出现了基序的缺失或增加。BnaC02.GRAS4基因在甘蓝中的同源基因BolC02.GRAS4含有Motif1-Motif5,而在甘蓝型油菜中,BnaC02.GRAS4基因缺失了Motif3,这种基序的变化可能导致蛋白质结构和功能的改变。3.2.3异源多倍化对甘蓝型油菜GRAS基因染色体定位的影响通过绘制甘蓝型油菜、白菜和甘蓝GRAS基因在染色体上的分布图谱,发现异源多倍化对GRAS基因的染色体定位产生了显著影响。在甘蓝型油菜中,GRAS基因在染色体上的分布呈现出独特的模式。A基因组和C基因组来源的GRAS基因在染色体上并非均匀分布,而是存在一定的聚集现象。在A03染色体的长臂上,集中分布了多个来自A基因组的GRAS基因;在C03染色体的短臂上,也有多个来自C基因组的GRAS基因聚集。对比白菜和甘蓝的GRAS基因染色体定位,发现一些同源基因在甘蓝型油菜中的染色体定位发生了改变。白菜中位于A06染色体上的BraA06.GRAS5基因,在甘蓝型油菜中,其同源基因BnaA06.GRAS5却定位到了A07染色体上;甘蓝中位于C04染色体上的BolC04.GRAS6基因,在甘蓝型油菜中,其同源基因BnaC04.GRAS6定位到了C05染色体上。这种染色体定位的改变可能与异源多倍化过程中的染色体重排、基因转座等事件有关。分析基因定位变化与进化的关系,发现染色体定位的改变可能影响基因的表达调控和功能进化。一些定位到新染色体区域的GRAS基因,其表达模式与在祖先种中的同源基因相比发生了显著变化。BnaA07.GRAS5基因在甘蓝型油菜中的表达水平明显高于其在白菜中的同源基因BraA06.GRAS5,且表达模式也从组成型表达转变为组织特异性表达,在花和种子中高表达,而在根和茎中低表达。这表明染色体定位的改变可能使基因受到新的顺式作用元件和反式作用因子的调控,从而导致基因表达和功能的进化。3.2.4异源多倍化对GRAS基因表达特征的影响对甘蓝型油菜、白菜和甘蓝在相似生长条件下不同组织的转录组测序数据进行分析,发现异源多倍化对GRAS基因的表达特征产生了显著影响。在组织特异性表达方面,甘蓝型油菜中部分GRAS基因的组织表达模式与白菜和甘蓝中的同源基因存在差异。在白菜和甘蓝中,BraA05.GRAS7和BolC05.GRAS7基因在叶和茎中均有较高表达,但在甘蓝型油菜中,其同源基因BnaA05.GRAS7和BnaC05.GRAS7在叶中的表达水平显著降低,而在花中的表达水平明显升高。这表明异源多倍化可能导致基因的表达调控网络发生改变,使基因在不同组织中的表达模式发生分化。在表达水平上,一些GRAS基因在甘蓝型油菜中的表达量与在祖先种中的同源基因相比发生了显著变化。BnaA02.GRAS8基因在甘蓝型油菜中的表达量是其在白菜中同源基因BraA02.GRAS8的3倍,而BnaC03.GRAS9基因在甘蓝型油菜中的表达量仅为其在甘蓝中同源基因BolC03.GRAS9的一半。这种表达量的变化可能与基因剂量效应、基因沉默以及调控元件的改变等因素有关。通过分析表达数据,筛选出了在甘蓝型油菜中表达模式发生显著变化的GRAS基因,这些基因可能在甘蓝型油菜的进化过程中获得了新的功能,或者在调控甘蓝型油菜特有的生长发育和环境适应过程中发挥着重要作用。3.2.5选择压力值分析结果利用PAML软件包中的yn00程序,计算甘蓝型油菜GRAS基因家族成员与其在白菜、甘蓝中的同源基因之间的Ka/Ks比值,分析基因受到的选择压力类型和强度。结果显示,大部分GRAS基因的Ka/Ks比值小于1,表明这些基因在进化过程中受到了纯化选择作用,基因序列相对保守,以维持其基本功能。BnaA01.GRAS10基因与其在白菜中的同源基因BraA01.GRAS10的Ka/Ks比值为0.35,在甘蓝中的同源基因BolC01.GRAS10的Ka/Ks比值为0.42,均远小于1,说明该基因在进化过程中受到了较强的纯化选择压力,其功能可能较为保守,对甘蓝型油菜的生长发育具有重要的基础作用。然而,也有少数GRAS基因的Ka/Ks比值大于1,表明这些基因受到了正选择作用,可能发生了功能进化。BnaC09.GRAS11基因与其在甘蓝中的同源基因BolC09.GRAS11的Ka/Ks比值为1.23,大于1,这意味着该基因在进化过程中可能发生了适应性突变,获得了新的功能或功能增强,以适应甘蓝型油菜在进化过程中面临的新环境或新的生长发育需求。绘制Ka/Ks比值的分布直方图(图6),可以直观地看出大部分GRAS基因集中在Ka/Ks比值小于1的区域,而Ka/Ks比值大于1的基因数量较少。这表明在甘蓝型油菜GRAS基因家族的进化过程中,纯化选择是主要的选择压力,维持了基因家族的稳定性和功能的保守性;而正选择作用虽然相对较少,但对部分基因的功能进化和新功能的产生起到了重要的推动作用。3.3讨论3.3.1基因家族进化的驱动因素探讨多倍化事件在甘蓝型油菜GRAS基因家族进化中扮演了极为重要的角色。甘蓝型油菜作为异源四倍体,由白菜和甘蓝杂交并经过染色体加倍形成,这一过程导致其基因组中GRAS基因数量显著增加,相比其二倍体祖先种,基因家族呈现出明显的扩张态势。全基因组多倍化使整个基因组复制,为基因进化提供了大量的遗传物质基础。这些新增加的基因拷贝在进化过程中可能发生功能分化,一部分基因保持原有功能,维持油菜的基本生长发育;另一部分基因则可能通过突变、结构重排等方式,获得新的功能,以适应环境变化或满足油菜复杂的生理需求。在拟南芥中,全基因组多倍化事件导致许多基因家族的扩张,其中一些基因在进化过程中发生了功能分化,参与到新的生物学过程中。自然选择是基因家族进化的另一个关键驱动力。选择压力分析表明,大部分甘蓝型油菜GRAS基因受到纯化选择,这意味着自然选择倾向于保留这些基因的原有功能,淘汰有害突变,以维持油菜正常的生长发育。如BnaA01.GRAS10基因,其在进化过程中受到较强的纯化选择压力,Ka/Ks比值远小于1,表明该基因功能保守,对油菜生长发育起着基础且重要的作用。而少数GRAS基因受到正选择作用,Ka/Ks比值大于1,这些基因在进化过程中发生了适应性突变,可能获得了新的功能,有助于油菜在特定环境下生存和繁衍。BnaC09.GRAS11基因受到正选择,可能在甘蓝型油菜适应新环境或应对特殊生态需求时发挥重要作用。自然选择通过对不同基因的选择作用,塑造了GRAS基因家族的进化方向,使其更好地适应油菜的生存和发展需求。3.3.2进化过程中基因功能的保守性与分化从进化分析结果来看,甘蓝型油菜GRAS基因家族在进化过程中既表现出功能的保守性,又存在功能的分化。功能保守性主要体现在一些基因在不同物种间的同源性较高,其结构和功能在进化过程中相对稳定。在多个物种中,SHR和SCR亚家族的GRAS基因在根的发育过程中都起着关键作用,调控根的径向模式形成和内皮层细胞分化。在甘蓝型油菜及其祖先种白菜和甘蓝中,这些基因的序列和功能具有较高的相似性,表
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026 五年级下册《读孟子选段》课件
- 2026 三年级上册《Hello 问候交际》课件
- 2026年丽水初中生物试题及答案
- 当前的研究热点是粮食仓储大模型和决策支持制度
- 建立分层分类的培训机制教育部门要健全教师培训制度
- 2026年娄底购房合同(1篇)
- 2026年入会协议合同(1篇)
- 工会福利物品采购制度
- HIV感染的抗逆转录病毒治疗
- 屋面SBS防水专项施工方案
- 2025年中石油高级职称英语考试真题+答案
- 律师协议书模板
- 慢性粒细胞白血病
- 核电厂爆破施工方案
- 国家事业单位招聘2025国家药品监督管理局医疗器械技术审评检查大试题库带答案
- DB53∕T 1130-2022 滇重楼林下栽培技术规程
- 耕地复耕申请书范文
- 标本采集错误课件
- 《房屋市政工程生产安全重大事故隐患判定标准(2024版)》解读
- 基于PLC的苹果自动多级分拣控制系统设计
- 制药技术专业毕业论文
评论
0/150
提交评论