




已阅读5页,还剩55页未读, 继续免费阅读
(作物遗传育种专业论文)植物内含子进化模式研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
独创性声明 本人声明,所呈交的学位( 毕业) 论文,是本人在指导教师的指导下独立完 成的研究成果,并且是自己撰写的尽我所知,除了文中作了标注和致谢中已作 了答谢的地方外,论文中不包含其他人发表或撰写过的研究成果。与我一同对本 研究做出贡献的同志,都在论文中作了明确的说明并表示了谢意,如被查有侵犯 他人知识产权的行为,由本人承担应有的责任 学位( 毕业) 论文作者亲笔签名: 论文使用授权的说明 日期:矽咿r 讶 本人完全了解福建农林大学有关保留、使用学位( 毕业) 论文的规定,即学 校有权送交论文的复印件,允许论文被查阅和借阅:学校可以公布论文的全部或 部分内容,可以采用影印、缩印或其他复制手段保存论文。 保密,在年后解密可适用本授权书 口 不保密,本论文属于不保密口 学位( 毕业) 论文作者亲笔签名:屋彳耄雹 i t d 日期:力矽r 哆 ip ,o 指导教师亲笔签名: 曩妃 魄0 7 易垆 福建农林大学硕士论文 摘要 内含子是真核生物基因组中重要的组成元件,关于内含子的起源、进化动力 和变化机制的争论已经持续了2 0 多年,然而我们对于这些问题的认识仍然有限。 进入基因组时代后,大量的基因组序列信息推动了内含子研究的进展,但是植物 内含子的进化的研究才刚刚开始 本研究对不同植物物种的内含子进行了大规模的分析,并的到如下的结果: 1 、通过分析3 2 个植物物种的内含子位点和长度信息,发现植物内含子的 平均长度通常较短,即便在基因组巨大的物种中内含子的平均长度仍然 比动物的内含子长度短,藻类和高等植物有着明显不同的内含子密度 2 、通过新的内含子获得丢失分析算法,发现整个植物界内含子的获得率较 低,同时以数量减少为主,个别物种出现较高的内含子获得率。此外通 过分析1 2 个不同植物物种相互之间的内含子位点的保守性,发现在高 等植物的基因组内内含予位置保守,部分内含子位点与藻类内含子位点 相同。这些结果表明在植物祖先的早期进化过程中新内含子大量出现, 在藻类中发生了大量的丢失。 3 、为了解内含子长度与内含子丢失所受到的进化动力和选择以及基因表 达对其的影响,我们分析了基因表达量和表达宽度于它们之间的相关 性,发现内含子长度和丢失是受不同的因素影响的,两者相对独立。 4 、进一步研究发现,在水稻和拟南芥旁系同源基因中内含子的变化速率要 高于物种间的同源基因的内含子变化,内含子丢失和获得比率近似2 :1 通过比较拟南芥区段重复基因和串联重复基因之间的内含子位置,我们 发现串联重复基因中内含子获得率大大高于其他类型基因,内含子丢失 和获得比率接近1 :1 。结果表明基因复制确实对内含子变化有影响,串 联重复基因更易发生内含子获得 5 、通过分别比对十字花科、豆科和禾本科以及早期陆生植物多个科属内的 内含子变化,发现大豆和小麦以及玉米等转座子活性较强的物种有着较 高的内含子获得率进一步对新获得内含子序列的分析,发现大多数这 福建农林大学硕士论文 7 、 8 、 些内含子内都包含有转座子的重复序列片段,暗示了植物界内新内含子 很大程度上与转座子有关 研究发现海链藻和莱茵衣藻存在大量物种特异的内含子位点。和其他藻 类内含子进行比较后,证实这两个藻类物种首先经历了大量的内含子丢 失后又在近期获得了大量的新内含子 根据以上结果,我们开发了一个潜在内含子多态分子标记数据库。 最后本研究提出了一个新的关于内含子进化的假说,内含子的丢失和获 得可能是相对独立的过程,内含子的丢失速率代表了物种的进化速率, 而内含子获得的速率主要与物种的转座子有关,同时还受到基因重组率 的影响。 关键词:内含子;进化;植物基因组;获得;丢失 2 福建农林大学硕士论文 a b s t r a c t c o n s i d c r a b l ed e b a t er e m a i n so v 盯s e v e r a ly e a r sa n da s p e c t so ft l a ce v o l u t i o no f s p l i e c o s o m a li n t r o l 嗡am a j o r c l a s so f g e n e t i ce l e m e n t ,i n c l u d i n gt h et i m i n 9 6 0 fi n t r o n o a g i a n dp r o l i f e r a t i o n , t l a cm e c h a r t i s m sb y w h i e l ai n t r o n sa r cl o s ta n dg a i n e d , a n dt h e f i ) r e e st h a th a v es h a p e di n t m e v o l u t i o n a t t e re n t e r e di n t ot h eg c n o m i ee r a , r e s e a r c h o ft h os p l i e e o s o m a li n t r o e v o l u t i o nh a sb e e ne x t r e m e l ya e t i v c db yt h em a s sg e n o r s e q u e n c e s ;l m w e v a r , p l a n ti n t r o ns t a yh a sj u s tb e g u n h e r ew ec a n yo u tal a r g e - s 1 ca n a l y s i so ni n t r o n s 妯d i f f e r e n tp l a n ts p i 龉,a n d t l a er e s u l t sa 托a sf o l l o w s : 1 w el n e , a s u l et l a ci n t r o nl o c a t i o na n dl e n g t hp r o f i l i n gi n3 2p l a n ts p e c i e s ,t h a t a v c r a g ei n t r o nl e n g t hi np l a n ti ss h o r t e rt h a ni na n i m a l , e v c :1 1i n $ o l n l bh u g e g e n o m es i z ep l a n tl i n e a g e s w ce s t i m a t et h a ti tr e m a r k a b l ed i f f e r e n c ei ni n t r o n d e n s i t ye x i s t b e t w e e na l g a ea n dh i g e rp l a n t s 2 a n a l y s e dw i t ho u r n e wi n t r o ng a i n l o s sd c t c e ta l g o r i t h m , t h er e s u l t su n d e r s c o r e t h a tl o wi n t r o ng a i nr a t e sa n di n t r o nn u m b e rr e d u e t i o na 托c o m m o nf e a t u r e so f r e a e e n tp l a n te v o l u t i o n w ea l s of i n dh i g hi n t r o ng a i nr a t e si nf e ws p e c i e s w e o b s e r v et h a tm o s to f i n t r o np o s i t i o n sa l l ec o n s e r v e a ti nh i g h e rp l a n t s , s o l n co f t h c m s h a r e dw i t ha 培t h i sp a t t e r ni m p l i e st h a tr a t e so fi n t r o nc r e a t i o nw c 托h i g h d u r i n ge a r l i e rp e r i o d so f p l a n t e v o l u t i o t la n d a l g a eh a v e b e e nal o to f i n t r o nl o s s 3 t o g a i ni n s i g h ti n t ot h ef i ) r e e st h a tc o n t r o li n t r o ne - v o l u t i o n e a n di t si m p a c tf o r t h e i n t r o nl c g t ha n di n t r o nl o s s , w et e s tt h er e l a t i o n s h i pb i 蚋懒g e n ee x p r e s s i o n a n di n t r o np r o f i l i n g t h er e s u l t ss h o wt h a ti n t r o nl c n g t l aa n di n t r o nl o s s 撒a f f e c t w i t hd i f f e r e n tf a c t o r s , t l a e ya r ci n d , c p c n d e n , z c 4 w bo b s e r v et h a ti n t m c b 柚g cr a t e sa m o n gp a r a l o gg e n e sa l l = h i g h e rt h a na m o n g o r t l a o l o gg a a c s 缸r i e ca n da r a b i a o r 培i s , r a t eb c t w e c l ai n t r o 1 0 s sa n dg a i ni s2 :1 m o i e o v c i , t a n d e md u p l i c a t i o ng e n e ss h o wn d i n t r o ng a i n s , r a t eb e t w e e ni n t r o n l o s sa n dg a i ni sa l m o s t1 :1 t h i sr e s u l ts u g g e s t st h a tg e n cd u p l i c a t i o nm a ya c t i v e i n t r o ng a i na n dl o s s 3 福建农林大学硕士论文 5 c i n em a x , t r i t i c u ma e s t i v u ma n dz e am a y s , w h i c hw i t ha c t i v e l yt r a n s p o s o u s , h a v eh 讪i n t r o ng a i nr a t e si nt h e i rg e n u s f h r t h e rs e q u e n c ea n a l y s i so fn 钾 g a i n c di n t r o ns h o w sm o s to f t h e i n t t o u sh a v es i m i l a rs e q u e n c ew i t ht r a n s p o s o n , 蛔p j i e st h a t 脚i n t r o nm a y c r e a t ew i t ht r a n s p o s o ni n s e r t i o n 6 t h a l a s s i o s i r ap s e u d o n a n aa n d c h l a m y d o m o n a s r e i n h a r d t i ih a v el a r g en u m b e ro f s p e c i e s - s p e c i f i ci n t r o np o s i t i o n t h r o u g hc o m p a f i n g 僦av a r i e t yo f a l a g ei n t r o n p o s i t i o n , w ec o n f i r mt h a tt h e s et w ol i n e a g e sh a v ep a s s e d t h r o u g hav e r y i n t r o n - p o o rs t a g es i n c ee a r l y p l a n te v o l u t i o na n dg a i n e dl a r g en u m b e ro f i n t r o ni n r c n le v o l u l i o m 7 b a s e do na b o v er e s u l t s , w e d c v e l o p o d ad a t a b a s eo fp o t t i a li n t r o n p o l y m o r p h j s m ( p i p ) m a r k e r s 8 i na d d i t i o nw ea d v a 雠ap r o p o s a la b o u ti n t m ne v o l u t i o n :i n t r o ng a i na n dl o s sa r c i n d e p e n d e n tp 】c o f e s s i n t r o nl o s sr a t e sm i g h ts i m p l yb er a t eo fe v o l u t i o n , g a i n r a t e sm i g h tb et i e r e dw i t ht r a n s p o s o na n dr e c o m b i n a t i o nr a t e si ng e n o m e k c y w o r & :i n t r o n ;e v o l u t i o n ;p l a n tg e n o m e ;g a i n ;l o s s 4 福建农林大学硕士论文 1 前言 剪接内含子是真核生物基因在形成成熟r n a 过程中由蛋白质r n a 复合体 识别并剪接掉的基因组序列。剪接体内含子产生的时问和进化机理是基因组进化 研究中一个很重要的内容近来,最近关于内含子进化的研究十分活跃。关于 剪接体内含子起源的时间,机制及原因的研究和争论既解决了许多老问题,同时 也产生了许多新问题【l - q 真核生物物种间内含子数量差异巨大,内含子富集和 内含子缺乏的物种散布于真核生物进化树,这些现象表明这内含子进化是一种复 杂的进化模式。尽管争论还在继续,但是近几年的焦点已经转到原核生物( 缺乏 内含子) 和真核生物的共同祖先是否存在内含子上i t - 3 1 。假设他们的祖先没有内 含子,那么在真核生物的进化过程中就会出现了大量的内含子获得但是已有的 研究表明现存真核生物祖先基因组中就已经存在大量内含子。同时,对近缘物种 的分析也没有发现大量的内含子位点差异,这表明真核生物中现有的内含子可能 来自于古老的祖先,至少最近的进化过程没有出现大量的新内含子。对不同真核 生物分支和不同类型物种的内含子的研究得到了许多不同的结果。如对人类和老 鼠的分析发现,两者没有发生内含子的获得,只有老鼠经历了非常少量的内含子 丢失嘲。但是在不同线虫种之间的比较却发现存在大量的丢失和获得【6 ,7 1 。有一 些理论来解释物种间巨大的内含子变化差异的现象,如外显子重排理论,i i 类内 含子插入起源,转座子插入获得等等i t , i t - 1 2 1 在大量研究关注于早期内含子起源和不同真核生物之间的内含子差异时,植 物中的内含子研究也在展开关于拟南芥和水稻基因组内重复基因间内含子变化 的研究显示不同的植物物种有着不同的内含子进化模式同时发现,植物重复基 因间的内含子变化速率要高于物种问1 1 丑1 4 1 。r o y 等人对拟南芥和水稻内含子的分 析发现,两物种问的内含子高度保守,这些内含子位点同样出现于不同的藻类基 因中,这意味着现代高等植物中的内含子可能在植物祖先中就已经存在,而植物 在进化过程中内含子主要以丢失为主1 1 坷在最新的t t t 自t i 中,r o y 等发现了一个近 期发生过大量内含子获得的藻类物种海链藻。研究显示,海链藻可能首先经历了 大量的内含子丢失,此后在近期又发生了大量的内含子获得,这种获得在植物和 动物中都是少见的1 1 6 1 5 福建农林大学硕士论文 但是目前对植物内含子的进化研究仍十分有限,所研究的物种仅限于拟南芥 和水稻,无法确切的区分获得和丢失。对藻类的内含子的分析也仅是针对少数几 十个基因,缺乏全面的多物种和针对不同基因的系统分析研究对于植物中内含 子丢失的机制,变化规律和影响动力目前仍完全未知,需要开展进一步的研究 为此本研究试图解决关于植物内含子的一些问题,包括了解不同植物中内含 子的分布、长度和位点保守程度;重大进化历史事件对内含子进化的影响;从单 细胞到多细胞,水生到陆生植物,维管束的形成,根茎叶的分化出现,种子植物 出现等进化事件对内含子的影响;内含子在不同植物进化分支中的演变过程;了 解植物内含子的丢失和获得的相关因素( 如基因组复制对内含子进化的影响,多 倍体化,基因组大小的影响还有何种基因缺乏内含子,何种基因倾向于更多的内 含子或保守的内含子? 基因表达与内含子长度和有无的关系? 同源基因之间的 转换对内含子的影响? 内含子与其他遗传学元件的关系,如重复序列,转座子等。 基因复制是否会促进内含子的变化? 同时检验现有内含子丢失模型的几个推论, 如内含子丢失在基因中是否存在位置偏好? 特别是在1 0 0 0 个氨基酸残基以上的 长基因是否存在这种偏好? 是否存在l 临近内含子共同丢失的倾向? 何种表达的 基因倾向于内含子丢失,花粉、种子还是花器官? 有多少内含子是严格丢失的, 有多少是出现空缺? ) 此外我们希望通过分析发现最近的内含子获得例子,从而 追溯内含子插入前的来源。最后我们将讨论植物内含子研究在遗传学和育种中的 应用 6 福建农林大学硕士论文 2 文献综述 内含子是真核生物中普遍存在的遗传元件,但是无论是剪接识别机制、起源、 变化机制还是进化动力都还是谜团,。即便在内含子发现近3 0 年后我们对于内含 子的认识也才刚刚开始。 2 1 内含子的概念、类型及特点 内含子是基因在形成成熟r n a 时切去的基因组序列。目前为止已经发现了 三类内含子,i 类、类存在于一些细菌以及细胞器的基因组内,i 类内含子还存 在于原生生物和真菌核内的核糖体r n a ( r r n a s ) 中i x - 1 9 1 这两类内含子有着 独特的r n a 结构使其能够自剪接,有些其中包含有开放阅读框( o p e nr e a d i n g f r a m e , o r f ) 至今为止已经鉴定了大约1 ,5 0 0 个i 类和2 0 0 个n 类内含子 第三类内含子,也就是剪接体内含子,存在于几乎所有的真核生物中这类 内含予的序列近似随机序类,同时通常不舍o r f 。不同物种间内含子序列的长 度也存在极大差异,从一些原生生物的几十碱基到哺乳动物的几十万碱基。剪接 复合体由5 个r n a 和上百个蛋白质组成的复杂结构,它能将内含子从r n a 转 录本中切除,这一过程是和其他转录过程紧密联系在一起的 z o l 。尽管剪接体内含 子和其他两类之间存在重要的差异,但是其与类内含子在剪接机制的一定程 度的相似,可能表明这两者之间存在一定的进化关系b 1 - 2 s l 。 剪接体内含子产生的时间和进化机理是基因组进化研究中一个很重要的内 容。原核生物缺乏剪接体内含子,而在真核生物不同物种之间内含子数量的差异 是巨大的,从一些物种的全基因组仅有1 0 0 个内含子到脊椎动物和植物拥有数十 万个内含子。尽管如此巨大的数量差异表明显然有大量的内含子获得和,或丢失 发生,但是我们对于其机制和进化动力的了解相较于其他主要遗传学元件的了解 要少的多。在编码区域存在这上百万的内含子,但是目前只知道一例物种内内含 子“有一与“无一的多态1 2 6 1 ,而且仅有3 例内含子插入能了解确切的起源阿铡 目前有许多似是而非的理论用于解释新内含子的起源,就内含子是被正向选择还 是负向选择还是中性选择仍然没有达成共识 不同真核生物之间巨大的内含子数量差异带来了一个重要的闯题,即是什么 7 福建农林大学硕士论文 决定了基因组的复杂性? 比如有理论认为是自私遗传元件t s o - 3 2 1 ,组织复杂性 3 s - 3 7 1 或群体大小l 强别。确实,内含子在一些解释基因组进化的理论中起着非常重要的 作用。一个长期存在的关于内含子起源的理论假设内含子内的重组有利于解释第 一个全长基因p 3 s s 4 4 | ,一个类似的理论也用于解释多功能域的后生动物基因的起 源毕1 1 1 内含子也被认为可能能通过增加基因间重组从而提高适应性b t o t 2 s s l , 或者在早期真核生物中通过无义介导降解( n o n s e n s e - m e d i a t e dd e c a y , 来保 证转录的准确性嘲。一个假设也将内含子的数量差异作为最佳例子,用来解释基 因组复杂性增加是有害突变的结果或者内含子本身就是有害突变i 弱s t l 。所以对剪 接体内含子进化的了解对于许多基本的进化问题的解决都有帮助对于剪接体内 含子起源时间,机制和起源原因的研究在最近的几年里十分活跃,解决了许多老 的争论也产生了许多新的争论 这里我们将讨论关于剪接体内含子的近期研究,包括内含子在真核生物进化 过程中的数量变化,内含子获得和丢失的机制以及对这些变化可能产生影响的进 化动力【l l 。 2 2 内含子进化的时间问题 有两个自内含子发现之初就提出的主要理论来解释内含予的起源。内含子早 期起源( m ) 模型假设内含子是极端古老的,大量地存在于真核生物和原核生物 的祖先中盼嬲州。通过这些内含子经由“内含子重排”使得小的内含子和编码片 断模块化的组合成了早期的全长基因在这一模型中原核生物中的内含子全部丢 失了。相对的,内含子晚期起源( m ) 模型根据在进化分支中仅存在于真核生物 的剪接体内含子认为它们是在真核和原核生物分化后通过后来插入到没有内含 子的基因中而产生的 2 3 - 2 5 ,“- e t l 。 随着越来越多证据的出现。两种模型的极端版本一一几乎所有内含子都是极 端古老或新产生一一开始变为更多的不同版本。最近m 的追随者们假定仅有少 量的现代内含子是继承自真核和原核生物分化时的祖先p 7 州,而绝大多数l l 的 支持者相信内含子是细菌中类内含子插入到早期真核生物基因中产生的1 2 3 - 2 q 但是关于内含子在真核和原核生物祖先中是否存在和真核生物中内含子获得和 丢失重要性的争论仍然在继续 3 福建农林大学硕士论文 真核生物物种之间巨大的内含子数量差异以及内含子富集和内含子缺乏物 种散布于真核生物进化树表明这是一复杂的进化模式。它暗示着存在周期性的大 量内含子丢失和或获得。在一个极端,所有内含子富集和内含子缺乏物种的共 同祖先都是内含子缺乏的,而内含子富集物种经过了更多的近期插入在这一情 况下,不同分支树物种的相同的内含子位点的数量应该是很少的在另一个极端, 几乎所有现代内含子都是继承自内含子富集的祖先,而内含子缺乏物种经历的大 量的内含子丢失。在这一情况下,不同分支物种几乎所有的内含子位点都应该相 同。 实际的情况介乎着两种极端之间l e a 6 9 l 。r o g o z i n 和他的同事们发现9 个已经 完成涮序基因组的6 8 4 组直系同源基因中大量但不是全部的内含子位点是相同 的他们发现2 5 的人类内含子和对应的拟南芥基因的内含子位置完全相同, 4 0 的酿酒酵母的内含子位置和来自一个非真菌物种的内含子位置相同嗍。另一 方面,2 0 - - 6 8 的内含子是物种特异的。这些结果揭示了在过去的几亿年中内含 予经历了大量的获得和丢失事件。 是否能由不同分支物种同一位置独立插入内含子来解释呢 5 8 , 7 0 铘1 7 这种“平 行插入”的个别例子已有报道阳,而越来越多的证据表明内含子的插入“偏好” 于特定的序列这也使得这种多次获得的可能性增大隅7 1 侧。但是,平行插入似乎 不能解释如此多的内含子相应位置。根据r o g o z i n 等对内含子目标位点模拟的数 据分析显示仅有5 1 0 的对应内含子位置能被平行插入准确解释网。而实际的 平行插入数日可能更少,因为如果大量的内含子是从祖先物种一直被保留下来 的,那么后来插入的内含子数量比模拟的更少,平行插入也就更少了。 即便绝大多数对应的内含子位置代表了祖先的内含子位点。对于这些发现的 模式的意义仍然存在争议r o g o z l n 等使用简约模型( d b p a r i s m o n y ) 来估计共 同祖先物种中出现的内含子数量,以及后来各个分支中的内台子获得或丢失的数 量他们认为既存在着祖先内含子的保留,也存在着大量的分支特异的内含子丢 失和获得i 卿。但是这一方法对于显然存在大量丢失的数据来说是不准确的嗍 大量的独立丢失事件将导致简约方法低估祖先的内含子数量 g i l b e r t 等采用最大似然分析( m a j d m u mh 强e l i h o o d a n a l y s i s ) 结合内含予丢失 来分析了相同的数据,总体结论表明这些物种的共同祖先有着大量的内含子,其 9 福建农林大学顷士论文 密度几乎近似于内含子密度最高的现代物种刚。这些估计说明随着物种的分支进 化,内含子的数量是在下降的,造成了现代物种中更加适中的内含子密度。但是 在这些结果被广泛的认可之前,我们需要做更多工作来更好的认识这些估计所基 于的两个重要假设的可靠性融硼,它们是:共有的内含子位置代表了祖先的内含 予以及所有的内含子在一个分支中有着相同的丢失速率 简约法和最大似然估计都证明了内含予丢失的重要作用,在一些分支中内含 子的丢失要比获得更多。亲缘关系很远的物种中一再发生的内含子丢失的概率可 能高的让人惊讶,但是在对亲缘关系较近的物种的研究也显示了相同的模式在 对小鼠和人类近加,0 0 0 内含子位点的分析发现了6 个内含子丢失而没有发现获 得阿,对果蝇、酵母亚种的分析也发现丢失比获得多| 8 1 - , b 3 。因此看来内含子数量 的减少在真核生物自共同祖先分化以来是很普遍的- u p 便是那些高密度或中等 内含子密度的物种,而是否存在着同样戏剧性的内含予获得目前仍然是个争论 2 3 内含子丢失是否是进化的主导? 也有其他的一些研究显示内含子获得同样在最近的进化中起着很重要的作 用。秀丽隐杆线虫的基因可能来自于缺少内含子的原核生物的后来转移,相较于 其他的线虫基因有更高的内含子密度刚,对其的研究发现这些基因曾经经历了同 样大量的内含子丢失和获得,从而导致了大量特异的内含子位点的产生陋一。这 至少表明一些物种在近期经历了大量的内含子获得。 以上的研究表明了在真核生物群分化前的祖先中存在着至少中等密度的内 含子数量。但是最早的真核生物呢? 这一问题的解答因真核生物进化树的不确定 而变得困难。植物和动物的分化可能代表了最早的真核生物分支陟蜘,也可能植 物和动物的分化比较近,还有其他的真核生物分支更早盼明。这样植物和动物或 者真菌中相同的内含子位点将不代表最早的真核生物。如果是后一种情况那最早 的真核生物中内含子会如何? 内含子和剪接复合体在真核生物最早期的分化物种中都有发现眇- l 叼现在关 于这些。早期分化”物种和相距很远的物种之间共同内含子位点的证据不断出现 陬9 9 , 1 叼这表明至少一些内含子和一个初生的剪接体在所有现代真核生物的祖 先中已经存在最近c o l l i n s 和p e n n y 发现许多剪接体和相关的蛋白不仅在植物 l o 福建农林大学硕士论文 动物和真菌中保守f 1 叫,即便在一些可能是早期分化真核生物中也保守 i o l l 。所以 一个复杂的剪接机制可能在真核生物的祖先中已经存在。 2 4 内含子丢失和获得的机制 2 4 1 内含子丢失的机镧 关于内含子丢失有两个主要的模型,图1 显示了主要的内含子丢失模型 图1 主要的内含子丢失模型 f i 孚1m a i i n t r o nl o s sm o d e l s 。反转录m r n a 重组丢失模型b 、基因组序列删除模型( 图片来自m ) 经典模型认为基因的基因组拷贝序列经历了基因转换( g e n ec o n v e r s i o n ) 或者与 自身的m r n a 反转录拷贝发生了双交换,从而切除了一个或临近的多个内含子 p 0 4 - 1 1 0 1 另一个模型认为内含子可以经由( 近似) 精确的基因组删除而丢失根 据这两个模型能推导出几个预测译lh 1 i 首先,通过i r r - m r n a 的重组能够严格 完全的去除内含子而基因组切除则不规则,有时会将附近的编码序列切除或者留 下部分的内含子序列其次,r t - m r n a 介导的丢失需要m r n a 作为中间媒介 而基因组变化只有在发生在种系( g e r m l i n e ) 细胞时才能被遗传,因而这类内含 子丢失会被限定在种系细胞内表达的基因。第三,因为反转录的过程由3 端到 1 1 福建农林大学硕士论文 5 端进行,非常容易被中断,这样产生的序列多为3 端序列,所以可以预测 内含子丢失存在3 端偏好( 也有认为这一结果是由于5 端内含子中存在更多 的调控元件导致的1 1 1 2 1 ) 。最后,偶然的r t - m r n a 基因转换通常导致相邻的内含 子同时丢失,而基因组切除通常只切单个内含子 只有第三和第四个预测经过系统的检验,而结果却是不同的。在对几个线虫 基因的分析发现既没有3 端丢失偏好也没有相邻内含子丢失i s l ,对4 个物种的 真菌2 0 7 3 组的直系同源基因还有大量的多功能域后生动物基因的分析结果支持 基因组切除 t 1 3 。而另外一些研究则支持r t - m r n a 模型【l 埘。内含子稀少基因【1 1 5 l 和基因组 1 1 6 1 的内含子更倾向于集中于5 端,符合3 端丢失偏好。分化很远的 物种的共有内含子也显示5 端偏好0 1 7 1 ,而6 8 4 组直系同源基因的内含子丢失 也显示3 端内含子丢失偏好和相应的奸盔近基因丢失 t t s l 。对临近物种基因组的 测序将能更好的澄清这两种不同的机制。 2 a 2 内含子获得的机镧 关于新内含子的起源有5 个主要的模型瞄甜,”- 2 9 , 5 6 , 5 7 1 挣2 3 1 ,图2 显示了主 要的获得模型。 图2 内含子获得模型 巧辱2 , h j o r i n t r o n p i n m o d e l s 气内含子调换模型,b 、转庄子插入模型,c 串联基因组复耐模型,d 内含子转移模型,b 自剪接n 共内古子转变模型( 图片来自哪) 1 2 福建农林大学硕士论文 内含子调换一直是最被人们认可的内含子获得模型( 尽管缺乏直接的证据) ,它 假定变为r n a 且刚被从转录本上切除下的内含子序列插入到一个新的( 或原来 的) m r n a 的一个位置中而获得内含子的序列又经过反转录并通过基因转换 将新内含子转移到基因组拷贝中其他的模型包括通过临近基因组序列的重复而 获得内含子序列,转座子插入,内含子转移还有自剪接的类内含子转变。目 前只有在水稻中发现了一个过氧化氢酶a 基因一个内含子存在种内内含子多态, 该内含子是由一个p - s i n e l 转座子插入产生的吲。对线虫g k , b i 蛋白旁系同源 基因的分析也发现了经由内含子转移获得的一个例子刚 2 5 关于内含子起源的两个紧密联系系统 目前没有一个单一的模型能够同时解释内含子剪接系统的最初起源和最近 的内含子获得。现有所有新内含子获得模型都需要一个前提:已经存在内含子剪 接体。唯一包含有剪接机制起源的模型是i i 类自剪接内含子转变模型甜,2 5 l , 但是却不能解释线虫中最近大量的内含子获得,因为线虫和动物线粒体一样没有 类内含子。依据n 类内含子转变模型,剪接体和第一个剪接体内含予来源于 类内含子,而一些近期的内含子获得则是通过其他机制获得的。 2 6 内含子进化的动力 关于导致现代内含子分布的进化动力的争论仍在继续有许多关于内含子有 利的模型:细胞数目,世代更替时间和群体大小的一些证据表明有着长世代更替 时问和较小群体的多细胞物种倾向于内含子富集,相对的单细胞物种则倾向于内 含子稀少。经典的解释p 1 - 3 8 , 3 9 认为内含子和其他的非必需d n a 一样在单细胞物 种中是不利的,因为存在强大的选择压力来选择更短的基因组复制时问,而这在 多细胞中则近乎中性。一个由l y n c h 等提出的最新假说鲫认为群体大小带来了这 些差异 两者都没能预测到最近发现的早期内含子富集真核生物以及后来不断发生 的内含子的丢失经典模型直接预测早期单细胞真核生物是低内含子数目的为 解释相关的早期内含子富集真核生物,群体大小模型要求早期真核生物有较小的 群体大小而且存在持续的群体扩增,而这个假定是不可能的此外,其他的初期 福建农林大学颂士论文 数据也不符合群体大小的推想。这些假说无法解释在多细胞生物和单细胞生物之 间巨大的内含子数量差异,而且无论是多细胞还是单细胞生物在群体大小和内含 子数目之间也没有明显的联系嗣 2 7 一种新的解释:不同的重组率 上面的假想试图将内含子数量差异归因于内含子丢失一获得这一类似生态 学的平衡。在有着长世代更瞽时间或较小群体的物种中。内含子数量主要反映了 自然发生的内含子获得和内含子丢失突变的平衡。平衡的内含子数量在快速复制 物种或有着较大群体的物种中会较低,源于有更多成功的内含子丢失突变和较少 成功的内含子获得突变,源于对内含子更强或有效的选择 但是,对于祖先内含子数量的讨论说明存在着广泛的不平衡l 如果如最大 似然法估计的那样,真核生物进化经历了更多的内含子丢失,那么内含子数量的 不同可能很大程度反映出进化速率:进化较慢的物种较进化快的物种保留了更多 的祖先内含子。如果内含子是通过r t - m r n a 发生基因转换而丢失的话,内含子 的丢失率可能依赖于总旁系同源基因的重组速率。在一些物种中绝大部分的重组 发生于减数分裂,内含子丢失率可能符合单位时间内减数分裂次数:物种经历更 多的有性世代将丢失更多的内含子。 最初看来,数据好像支持这一假想,哺乳动物中老鼠比人类经历了更多的世 代。也有更多的内含子丢失嗍,线虫也是如此1 6 7 1 但是这一假想难以解释不同 物种问数十倍的内含子获得速率差异【1 j 2 8 植物内含子进化研究及其特点 对于植物内含子获得和丢失模式的研究还十分有限一份最近的研究报告显 示,在拟南芥的片断重复基因对中有着较商的内含子获得,比内含予丢失高出 5 0 【1 4 j 同时l i n 等对水稻所进行的相似研究则有着相反的结果l 切。而对一个被 俘获的绿藻的内含予分析研究表明这一倍数为2 8 倍r o y 等对上述结果重新分 斩后认为拟南芥的内含子丢失大约为获得的1 2 6 倍。水稻为9 8 倍嗍。此外他嚣】 还发现内含子的丢失十分的完全,还伴有临近内含子的丢失倾向,据此他们认为 较低的内含子获得率和内含子数目的减少在真核生物中是一个普遍现象。这一模 1 4 福建农林大学硕士论文 式暗示在早期真核生物进化时期创造了大量的内含子。 r o y 等最近对海链藻基因组内含子的分析显示海链藻有着独特的内含子位 点,推断其曾经经历了大量的内含子获得,这一特点在目前的真核生物中是一倒 外【i q 。 福建农林大学硕士论文 3 材料与方法 3 1 序列和注释来源 拟南芥t h a l i a n a ) 的基因组序列与注释来自于t i g r p u ! 的第6 号版本数据。 水稻( o s a t i v a ) 的基因组和注释数据也来自,1 1 g r ,采用的是第5 号版本数据。 白杨( p o p u l u s f f f c h o c a r 阳) 的基因组是下载自j o i t l 2 q 的v 1 1 版本首蓿( m e d i c a g o t r u n c a t u l a ) 来自两部分数据,主要的注释数据下载自m i p s 【l 硐,此外还增加了一 部分来1 刍n c b i ( n a t i o n a lc e n t e rf o rb i o t e c h n o l o g yi n f o r m a t i o n ) 1 1 2 7 l 拥有内含子剪 接注释的苜蓿核基因数据。玉米( z e am a y s ) 的注释数据同样包括两部分,一部 分来自g 棚m 鹏提供的b a c e 隆测序注释下载1 1 2 s l ,另一部分补充来n c b i 的玉 米基因数据。p h y s c o m i t r e l l a p a t e n s 基因组序列和基因内含子位点预测数据下载 自了j g i 的v 1 1 。莱茵衣藻( c h l a m y d o m o n a $ r e h l h a r d t i i ) 也是来自j g i 的v 3 1 版本1 1 2 9 l 的注释基因组数据。海链藻( t h a l a s s i o s i r a p s e u d o n a n a ) 的基因组注释数 据也是来自j g i 的v 3 版本数据1 1 螂。红藻( c y a n i d i o s c h y z o nm e r o l a e1 0 d ) 的基因 组及注释数据来创1 3 1 1 。绿藻( o s t r e o c o c c u s t a u r i ) 的基因组注释数据下载 j 1 3 2 1 。 o s t r e o c o c c u sl u c i m a r i n u s 下载自j g i 的v 2 0 。p h a e o d a c t y l u mt r i c o r n u t u m 基因组及 基因预测信息下载自j g i 的v 2 0 g a l d i e r i as u l p h u r a r i a 基因组b a c 克隆2 0 下载自 ( g e n o m i c s m s t l c d u g a l d i c f i a ) ,使用a u g u s t u s 2 0 的g a l d i e r l as u l p h u r a r i a _ i l i 练集进行了基因及内含子预测。百脉根( l o t u s j a p o n i c u s ) 采用了m i p s 2 0 0 6 年7 月2 2 日的拼接和自动注释数据卸。小立碗藓( p h y s c o m i t r e l l a p a t e n s ) 的基因数 据下载自n c b i n 明其他2 2 个植物物种基因组序列及内含子注释信息均来自 n c , b i p 2 7 l ,详细基因列表见补充材料 3 2 相关内含子信息的整理及内含子矩阵获得 对于来自n c b i 和拥有准确内含子注释信息的物种,利用p c l l 程序转化为内含 子位点和长度信息。出现多个可变剪接的转录产物时选取其中最长的序列进行分 析将缺乏内含子注释信息的物种和基因,利用b u 虹叫1 将物种自身c d n a 序列 与基因组序列进行1 0 0 匹配度的比对,从而确定内含子位置,再通过b i , 2 s e o 福建农林大学硕士论文 程序【l 蜘将蛋白质序列与c d n a j 亭列进行比对,确定起始密码子的位置。最后将所 有的信息转化为内含子在基因蛋白质序列上的位置,长度和相位信息使, 甩p c r l 程序将所有的内含子信息按照相位转化b 、u 、z 三个字母方式插入到相应的蛋白 质序列中。 3 3 确定同源序列 3 3 1 直系同源基因确定 将所有物种的蛋白质序列与拟南芥的蛋白质序列进行双向最佳b l a s t p 比 对,选取符合加匹配度,长度长于1 0 0 个残基的匹配作为物种间的直系同源基 因对。以拟南芥基因为标准,将包含有四个物种以上的同源基因组合成组 3 3 2 拟南芥和水稻旁系同源基因确定 首先确定水稻和拟南芥的直系同源基因,将其作为水稻和拟南芥分化前的共 有祖先基因,然后将剩余的蛋白质序列与这些祖先基因进行b l a s t 最佳匹配。 匹配度符合4 0 的基因按祖先基因分组。这样就获得了以拟南芥或水稻的直系同 源基因分别作为外类群,自身的祖先基因和分化后由其产生的基因组成豹许多集 合 3 4 多序列联配 利屠c i l l 殴a i ,w 程序【i 蛔,使用默认参数对历有已经包含有内畲子信息的蛋 白质序列组合进行多序列联配。判断在包含内含子的位置左右两侧5 个氨基酸残 基的保守程度,构建出多序列联配后的对应内含子位置的矩阵,如图3 所示如 果这一段氨基酸残基出现多于5 个联配空缺则视为缺乏信息不予加入分析在一 个内含子位置左右两侧相差一个氨基酸残基视为同一位置。为了了解不同的序列 匹配度对于内含子进化分析的影响,采用了4 个不同的标准的序列保守程序,分 别是2 5
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 集宁幼师面试绘画真题及答案
- 《部分持续投资》课件
- 《秩序之魂-班会课件中的纪律教育》
- 《设备维护与管理》课件
- 《类风湿性关节炎病例分析》课件
- 购物者趋势调查
- 《初中主题班会课件:绿色生活为地球母亲描绘生机勃勃的明天》
- 2025年浙江省考申论真题B类及答案
- 第一课古代农业
- 建筑电气基础课件-电气照明系统设计
- 2025-2030中国振动监测系统行业市场发展趋势与前景展望战略研究报告
- 合肥高新美城物业有限公司招聘笔试题库2025
- 《词汇构建法:课件中的词根词缀解析》
- 华为系统面试题及答案
- 2025年山东省济南市历城区中考一模物理试题(原卷版+解析版)
- Unit 7 第1课时 Welcome to the unit【基础深耕】七年级英语下册高效课堂(译林版2024)
- 2025年第33批 欧盟REACH SVHC高度关注物质清单247项
- 2024年江苏省南京市中考物理试卷真题(含答案)
- K30自动生成及计算试验记录
- 2024-2025春鲁教版(五四学制)(2024)化学初中八年级全一册第七单元 燃烧及其控制《第二节促进燃烧与防止爆炸》教学设计
- DL-T 1476-2023 电力安全工器具预防性试验规程
评论
0/150
提交评论