已阅读5页,还剩73页未读, 继续免费阅读
(生物化学与分子生物学专业论文)基因重复通过初始化进化的内在机制研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基因重复通过初始化进化的内在机制研究 专业:生物化学与分子生物学 博士生:薛成 指导教师:符云新屈良鹄教授 摘要 通常人们认为基因重复为遗传新特性的产生提供原材料,并与生物进化密切 相关。但目前对它支持进化的机制还不十分清楚,包括重复基因的保存和进化轨 迹。在本论文中,四个渐进的研究揭开了基因重复的部分进化机制。 不同基因组间基因的分歧很大程度上是由于局部、整块或基因组范围重复后 基因家族的扩大所造成的,所以理解基因重复后的动态变化很重要。目前解释重 复后基因保存的模型有勺h n o 的通过遗传漂变新功能化经典模型,f o r c e 等的 通过遗传漂变子功能化模型( d d c ) 以及基于基因剂量增长的正向选择模型。然 而在这一领域仍有一些重要的问题无法通过上述三种模型得到合理的解释。其 中,为什么有那么多重复基因被保留在简单生物中,如酵母茵。在这些生物中, 用子功能化模型解释很不可靠,因为单细胞生物没有调控分区,并且有效群体很 大造成子功能化概率很小。进一步说,酵母菌中大量的重复基因也不可能出现每 对重复基因都经过新功能化保存,或都是由于增长的剂量需求增加了适应度。这 样现存的模型不能合理解释观察到的基因组数据。本论文将围绕单细胞生物( 如 酵母菌等) 基因重复后的进化议题展开。 在第一章中,我提出了一种新的重复基因存留解释。我认为许多重复基因可 以以原样保留在基因组中。这一解释与经典模型和d d c 模型明显不一样,因为 经典模型和d d c 模型需要重复后功能的获得或部分丧失。这一新的解释我命名 为初始化。这一概念涉及一个假设,假设两个重复基因座有一种显性上位的关 系,其中强调一种叫单倍体不足选择模型,即在两个基因座上的四个等位基因中 有两个以上( 包括两个) 的野生型等位基因产生同样的适应度,而有两个以上( 不 包括两个) 突变型具有致死效应。运用模拟和数学分析工具分析显示,在这样的 假设下净化选择趋向于以原始状态保存重复基因( 阻止空等位基因的固定) ,造 成重复基因丢失的时间很长。 第二章中,观察了重复基因通过初始化后的新功能化进化轨迹。结果显示, 重组可以加速大群体中基因重复的新功能化进程,并提高新功能化概率,特别是 对于单倍体不足基因重复。来源于初始化的新功能化很可能是一条保存重复基因 的有效途径,并可能与物种分化并行。重组在在这一过程中扮演着突出的作用。 在第三章,观察和比较了经典模型和d d c 模型下基因重复解析( 子功能化 和去功能化) 平均时间。结果显示,初始化现象在两个模型中都出现了。这说明, 初始化可能是大群体生物( 如酵母菌) 中重复基因进化中的一个普遍经历的过程。 第四章,当不使用重复基因假设,而仅考虑两个基因座间的上位效应时,在 适当的遗传参数下,通过初始化,重组可能改变两个基因座上选择的进化轨迹和 选择结果,甚至偏向于适应度小而突变率高的选择。这一结果建议重组可能通过 初始化在多基因座选择进化中扮演重要角色。 上述研究表明,初始化在大群体重复基因进化中是一种内在的机制和现象; 在这一过程中,重组具有重要的作用。我希望这些努力能帮助我们更进一步探索 基因重复( 或多基因座) 的进化规律,理解初始化过程以及在基因组进化中重组 的积极作用。 关键词:基因重复初始化进化突变重组 e s s e n t i a le v o l u t i o n a r ym e c h a n i s mo fg e n ed u p l i c a t i o nb y o r i g i n a l i z a t i o n m a j o r :b i o l o g i c a lc h e m i s t r ya n dm o l e c u l a re v o l u t i o n n a m e :c h e n gx u e s u p e r v i s o r :y u n x i nf u ,l i a n g h uq up r o f e s s o r s a b s t r a c t i t i sc o m m o n l yc o n s i d e r e dt h a tg e n ed u p l i c a t i o np r o v i d e sr a wm a t e r i a l sf o r g e n e t i cn o v e l t ya n di sc l o s e l yr e l a t e dt ot h e e v o l u t i o n a tp r e s e n ti ti ss t i l lu n c l e a rh o w i tf a c i l i t a t e st h ee v o l u t i o n , i n c l u d i n gd u p l i c a t e g e n ep r e s e r v a t i o na n de v o l u t i o n a r y t r a j e c t o r yo fg e n ed u p l i c a t i o n i nt h i st h e s i s ,f o u rs t e p - b y - s t e ps t u d i e sa r ec a r r i e do u t t ou n c l o s et h ep a r t i a lu n d e r l y i n gm e c h a n i s mf o rg e n ed u p l i c a t i o n t h ed i v e r s i t yo fg e n e sw i t h i ng e n o m e si sd u ei nl a r g ep a r tt oe x p a n s i o no fg e n e f a m i l i e s b yl o c a l ,b l o c k ,o rg e n o m e w i d ed u p l i c a t i o n s ,s ou n d e r s t a n d i n g p o s t - d u p l i c a t i o nd y n a m i c si sv e r yi m p o r t a n t m o d e l sh a v eb e e np r o p o s e dt oe x p l a i n t h e r e t e n t i o no f g e n e s a f t e r d u p l i c a t i o n n o t a b l y t h ec l a s s i c n e o f u n c t i o n a l i z a t i o n - b y - d r i f tm o d e lo fo h n o ,t h es u b f u n c t i o n a l i z a t i o n - b y - d r i f td d c m o d e lo ff o r c ee ta 1 ,a n dt h ep o s i t i v es e l e c t i o nm o d e lb a s e do ni n c r e a s e dg e n e d o s a g e b u tt h e r ea r ei m p o r t a n to p e nq u e s t i o n si n t h i sa r e a o n ep u z z l ei sw h ys o m a n yd u p l i c a t eg e n e sh a v eb e e nr e t a i n e di ns i m p l eo r g a n i s m sl i k ey e a s t i nt h e s e o r g a n i s m s ,t h ed d c m o d e li sn o tv e r yc o n v i n c i n g ,b e c a u s et h e r ei s l i t t l em o d u l a r i t y i n s i n g l e - c e l lo r g a n i s m s ,a n dl a r g ep o p u l a t i o n s i z e sm a k et h e p r o b a b i l i t yo f s u b f u n c t i o n a l i z a t i o nl o w f u r t h e r , i ti su n l i k e l yt h a tt h el a r g en u m b e ro fd u p l i c a t e g e n e si ny e a s ti sd u et ot h ee v o l u t i o no fn e wf u n c t i o n si nm e m b e r so fe v e r yp a i r , o r t h a tf o ra l lt h e s ed u p l i c a t e si n c r e a s e dd o s ei n c r e a s e sf i t n e s s t h u st h ee x i s t i n g m o d e l sd on o te x p l a i nt h eo b s e r v e dd a t a ,s ot h i si m p o r t a n to p e nq u e s t i o ni sb e i n g a d d r e s s e di nt h i sp a p e r i nc h a p t e r1 ,ap u t a t i v e l yn o v e le x p l a n a t i o nf o rt h er e t e n t i o no fd u p l i c a t eg e n e si s i i i p r o p o s e d u n l i k et h ec l a s s i cm o d e lo fn e o f u n c t i o n a l i z a t i o na n dt h er e c e n td d c m o d e l , w h i c hr e q u i r eg a i no rp a r t i a l ( a n dc o m p l e m e n t a r y ) l o s so ff u n c t i o na f t e r d u p l i c a t i o n , i ti sp r o p o s e dt h a tm a n yg e n e sw i l lb er e t a i n e di nt h e i ro r i g i n a lf o r m t h i s p r o c e s si sc a l l e do r i g i n a l i z a t i o n t h i sc o n c e p tr e v o l v e sa r o u n da na s s u m p t i o na b o u t t h ed o m i n a n c e e p i s t a s i sr e l a t i o n s h i p sb e t w e e nt h ef o u ra l l e l e sa tt h et w ol o c ia f t e r d u p l i c a t i o n ;e m p h a s i z et h ec a s e ,w h i c hi sc a l l e dt h eh a p l o i n s u f f i c i e n ts e l e c t i v em o d e l , w h e r eh a v i n gz e r o ,o n e ,o rt w on u l la l l e l e sa tt h ef o u rg e n ec o p i e s ( w i t ht h eo t h e r a l l e l e sw i l d t y p e ) y i e l di d e n t i c a lf i t n e s s e s ,b u th a v i n ge i t h e rt h r e eo rf o u rn u l la l l e l e s ( w i t ho n eo rz e r ow i l d t y p ec o p i e s ) i sl e t h a l s i m u l a t i o n sa sw e l la sa na n a l y t i c a l a p p r o a c ha r eu s e dt os h o wt h a tu n d e rs u c hc o n d i t i o n sp u r i f y i n gs e l e c t i o nt e n d st o p r e s e r v eb o t hl o c i ( t h a ti s ,p r e v e n t i n gf l x a t i o no ft h en u l la l l e l e ) ,m a k i n gt h et i m et o l o s so f t h ed u p l i c a t ev e r yl o n g i nc h a p t e r2 ,e v o l u t i o no fg e n ed u p l i c a t i o nb yn e o f u n c t i o n a l i z a t i o nf o l l o w i n g o r i g i n a l i z a t i o ni sf u r t h e ro b s e r v e d r e s u l t ss h o wt h a tr e c o m b i n a t i o nm i g h ta c c e l e r a t e n e o f u n c t i o n a l i z a i t o n f o r g e n ed u p l i c a t i o n a n di n c r e a s et h e p r o b a b i l i t y o f n e o f u n c t i o n a l i z a t i o ni nt h el a r g e rp o p u l a t i o n , e s p e c i a l l yf o rh a p l o i n s u f f i c i e n tg e n e d u p l i c a t i o n n e o f u n c t i o n a l i z a t i o np r o c e e d i n gf r o mo r i g i n a l i z a t i o ni sl i k e l yt ob ea n e f f e c t i v em e c h a n i s mo fp r e s e r v i n g d u p l i c a t eg e n e s ,w h i c hm i g h tc o u p l ew i t h s p e c i a t i o n a n dr e c o m b i n a t i o np l a y sap r o m i n e n tr o l ed u r i n gt h i sp r o c e s s i nc h a p t e r3 ,t h eb e h a v i o r so fm e a nt i m et or e s o l u t i o n ( s u b f u n c t i o n a l i z a t i o no r n o n f u n c t i o n a l i z a t i o n ) o fg e n ed u p l i c a t i o nu n d e rt h ec l a s s i c a la n dd d cm o d e la r e o b s e r v e da n dc o m p a r e d o r i g i n a l i z a t i o nm i g h ta p p e a ru n d e rb o t ht h e s eh y p o t h e t i c a l m o d e l s t h e s er e s u l t ss u g g e s tt h a to r i g i n a l i z a t i o nm i g h tb eac o m m o np r o c e s si nt h e e v o l u t i o no fg e n ed u p l i c a t i o n i nc h a p t e r4 ,w h e nt h ea s s u m p t i o no f d u p l i c a t eg e n e si sr e d e da n do n l ye p i s t a s i s b e t w e e nt w ol o c ia r ec o n s i d e r e d ,w i t ha p p r o p r i a t ep a r a m e t e r s ,r e c o m b i n a t i o nm i g h t a l t e rt h ee v o l u t i o n a r yt r a j e c t o r ya n dc o n s e q u e n c eo fs e l e c t i o n sd r a m a t i c a l l yt h r o u g h o r i g n a l i z a t i o n , a n de v e np r e f e rt of a c i l i t a t et h el e s s - f i t n e s s - a n d - m o r e m u t a t i o n - r a t e s e l e c t i o n t h e s er e s u l t ss u g g e s tt h a tr e c o m b i n a t i o nm i g h tp l a ya ni m p o r t a n tr o l ei nt h e c o n s e q u e n c eo fs e l e c t i o n sa tm u l t il o c it h r o u g ho r i g i n a l i z a t i o n a b o v es t u d i e si n d i c a t et h a to r i g i n a l i z a t i o ni sa ne s s e n t i a le v o l u t i o n a r ym e c h a n i s m o fg e n ed u p l i c a t i o ni nl a r g ep o p u l a t i o n s ;a n dd u r i n gt h i sp r o c e s s ,r e c o m b i n a t i o nm i g h t p l a yak e yr o l e ,w h i c hm i g h tb ea t t r a c t i v ei nu n d e r s t a n d i n gt h ee v o l u t i o n ih o p et h a t i v t h e yc a nb eh e l p f u lf o ru st os h e dl i g h t so nt h ee v o l u t i o no fg e n ed u p l i c a t i o n ( o r m u l t i l o c u s ) a n du n d e r s t a n dm o r ec l e a r l yt h ep r o c e s so fo r i g n a l i z a t i o n a n dt h e b e n e f i c i a lr o l eo f r e c o m b i n a t i o nf o rg c n o m i ce v o l u t i o n k e yw o r d s :g e n ed u p l i c a t i o n , o r i g i n a l i z a t i o n , e v o l u t i o n , s e l e c t i o n , r e c o m b i n a t i o n v 论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论 文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文 的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本 人完全意识到本声明的法律结果由本人承担6 学位论文作者签名: 彰 、 肴、 侈千 y 白期:喇年月1 e l 学位论文使用授权声明 本人完全了解中山大学有关保留、使用学位论文的规定,即:学 校有权保留学位论文并向国家主管部门或其指定机构送交论文的电 子版和纸质版,有权将学位论文用于非赢利目的的少量复制并允许论 文进入学校图书馆、院系资料室被查阅,有权将学位论文的内容编入 有关数据库进行检索,可以采用复印、缩印或其他方法保存学位论文。 保密的学位论文在解密后使用本规定。 学位论文作者签名:y 鸲- 导师獬:抒杰耋叮 学位论文作者签名:莒毒、勺,导师签名:寻寸幺考叮 日期:嘲年月- z b日期:2 。豸年月2e l 第一章重复基因通过初始化保存 小结 在以前的研究中,人们提出新功能化、子功能化和正向选择( 源于剂量需求) 是解释重复基因保存的三种模型。可是,在单细胞生物中,如酵母菌 s a c c h a r o m y c e sc e r e v i s i a e ,由远古时期全基因组重复( w g d ) 产生的重复基因中还 有相当的部分在基因组中保留至今。用上述模型无法完全解释这一现象。在本文 中,我们提出另外一种解释途径一初始化,即在净化选择作用下重复基因以原始 状态高频率保存在群体中。本文中所做的模拟,数值分析和数学推导的结果都显 示,当两个重复基因座上的突变率相近时,不连锁单倍体不足( h i ) 基因的平均沉 默时间( t ) 明显拉长了;在这一拉长了的进化时间段中,两个重复基因座上原( 野 生型) 基因的频率在群体中可能会持续较高。对酵母菌基因组数据的分析也表明 初始化现象可能出现在w g d 产生后的重复基因进化中。这些结果提示初始化可 能是保存原重复基因的另一有效、动态、中间的方式,这可能有利于重复基因的 最终长久的保存一新功能化。 1 1 前言 有关基因重复进化机制的议题已经争论了很多年f m 】。根据中性理论,有益突 变出现的概率远小于有害突变( 即丧失功能的基因退化) 出现的概率, o h n o ( 1 9 7 0 ) 提出去功能化可能是多数重复基因的进化命运,即一个重复基因失去功 能而另一个保持原有功能( 这被称为经典模型) 【l l 。可是通过对基因组数据的观 察结果表明,实际情况并非如此。由远古时期的全基因组重复事件产生的重复基 因很大部分现在还保留在一些生物基因组中,如四倍体鱼【4 l ,x e n o p u sl a e v i si s 】, 玉米,和酵母菌s a c c h a r o m y c e sc e r e v i s i a e 3 1 。为此,f o r c ee ta l ( 1 9 9 9 ) 提出了另 一条保存重复基因的途径孑功能化,即祖先基因的功能被分解,由后代重复基 因互补性地承担,这样重复基因都被自然选择保留。这被称为重复退化一互补 ( d d c ) 模型【6 1 。 最近,在解释酵母菌基因组数据时d d c 模型也受到了质疑【3 l 。由于酵母菌 的有效群体大小可能很大,并且作为一种单细胞生物,它没有细胞分化,因此在 酵母菌基因组中重复基因通过子功能化保存难以实现【3 ,。丌。实际上,1 亿年前酵 母菌基因组发生过一次w g d 事件,但这次事件后许多重复基因至今仍被保留在 酵母菌基因组中【8 1 。目前还不清楚这些重复基因在多倍体化后是如何保存的? 新功能化( 即在一个重复基因座上新基因得到固定,而另一重复基因座上基 因保留原有功能) 已经在很多文献中探讨过,被认为是提供进化基础物质的重要 方式【1 3 一。上面已经说过,由于有益突变出现的速率通常远低于有害突变出现 的速率,在经典模型下重复基因的最终命运是去功能化,而不是新功能化【6 j 。新 功能化还是不能解释上面酵母菌上基因重复的观察结果。 最近一个大胆的假说【协1 2 1 提出,自重复事件发生后这些重复基因就可能一直 被源于剂量需求的正向选择作用所保留;其中一个重复基因的第二、辅助、低水 平表达的功能被放大为高水平表达,这样两个重复基因都得到永久保存。这一过 程被称为放大化。放大化和子功能化的主要区别是子功能化是一个近中性过程, 而放大化从一开始就有正向选择作用( 在两个冗余的、一样的重复基因座上) 。 现实中不太可能出现酵母菌大量的重复基因中每对重复基因都经过新功能化保 存,或都是由于增长的剂量需求增加了适应度。这样现存的模型不能合理解释观 察到的基因组数据。 h e 和z l 1 a n g ( 2 0 0 4 ) 认为在重复事件后,重复基因可能经历了一个短暂的近 中性进化过程子功能化,然后是一个拉长的新功能化过程f 1 3 】。可是,在酵母菌 中,由于子功能化可能在重复基因进化中出现概率很低( 原因见上) 1 3 一,那么新功 能化为什么,又是怎样被拉长的呢? t a k a h a t a 和m a r u y a m a ( 1 9 7 9 ) 报道过不连 锁单倍体不足基因重复的平均沉默时间在大群体( n l o ,n 是有效群体大小,p 是重复基因座上的突变率) 中被大大# 2 长t t l 4 1 。在这一研究提示下,就可以预测 有益突变可能在这一延长的期间( 而不是子功能化) 更有可能在群体中出现,就 像h e 和z h a n g ( 2 0 0 4 ) 建议的那样【1 3 1 。可是目前还没有支持这一观点的理论证据。 在本文中,我们将通过模拟,数值分析和数学推导等手段揭开上面讲到的酵母菌 w g d 重复基因进化之谜,并为不连锁单倍体不足基因重复的平均沉默时间拉长 现象提供理论证据。 2 另外,以前有关基因重复的理论研究多数都假设两个重复基因座上的突变率 是一样的阢1 4 1 5 】。可是,并没有证据支持或反对这一假设。因此在本文中这一假 设被去掉了。为了更细致地解释结果,我们使用了单倍体足够( 也就是常用的双 无隐性,d n r ) 以及单倍体不足( h 1 ) 选择模型。这些选择模型将在下面详细描 述。在本文中,我们主要关注大片段重复事件引起的重复基因的进化,比如w g d , 因此对于作用在小片段重复事件上的遗传力量的影响,如u n e q u a lc r o s s i n g o v e r 和g e n ec o n v e r s i o n 等,将不探讨。 本文得出的理论结果一致显示,当重复基因座上的突变率相近时,不连锁 h i 基因重复的t 即使在一个中等大小的群体中都可能变得特别大,其原因是在 重复基因座上原基因频率在群体持续保持得较高。这一现象,我们称为初始化, 即野生型重复基因在净化选择,而不是正向选择的作用下,很长一段时间内不变 地保存在群体中。并且一个简单的酵母菌基因组数据分析也表明,初始化可以用 来解释这些观察到的数据。 1 2 模拟方法和结果 在模拟中我们使用l y n c h 和f o r c e ( 2 0 0 0 ) 描述的基于配子算法【7 l ,其中每代 都跟踪染色体单倍型的频率。为了简化染色体单倍型的表述,假设重复基因座都 在同一条染色体上,用0 表示一个基因座上的野生型等位基因,而1 为突 变型等位基因。这样,对于重复基因座,在基因池中就有了4 种染色体单倍型, 分别表示为 0 0 ”, 0 1 ”,“1 0 ”,和“1 1 ”。 在d n r ( 单倍体足够) 选择模型下,双无隐性是致死的,即如果一个个体拥有 两条单倍型为“1 1 ”的染色体,则这个个体死亡。在h i ( 单倍体不足) 选择模型下, 在重复基因座上只有一个或没有野生型等位基因时,则该个体不能存活,例如, 如果一个个体拥有两条单倍型分别为“1 0 和“1 1 ”的染色体则这个个体死亡。 l y n c h 和f o r c e 的模拟算法已经描述过重组、突变、选择和遗传漂变等过程 的处理l _ 丌。这里为了简化和理清模拟过程的数学表述,我们修改了l y n c h 和 f o r c e 的模拟算法。在每一代,重组,突变和选择的影响都直接用数学公式来计 算,这一点与l y n c h 和f o r c e 以前的算法不同忉。 用x 0 ,x l ,x 2 ,x 3 分别表示染色体单倍型 0 0 ”, 0 1 ”,“1 0 ”和“l l ”的频率。在 3 d n r 和h i 选择模型下各种基因型个体的适应度见表1 1 。每一代由重组、突变 和选择引发的染色体单倍型频率的微分变化可以由下式计算: x o = x ox 3 2 + rx lx 2 一rx ox 3 + 2s lx ox lx 3 + 2s lx ox 2x 3 一( 肛l + 2 ) x o x l = x lx 3 2 一rx lx 2 + rx 0x 3 s lx lx 3 + 2s 】x 1 2x 3 + 2s ix lx 2x 3 + p 1x o 一 x l x 2 = x 2x 3 2 一rx lx 2 + rx ox 3 s lx 2x 3 + 2s lx lx 2x 3 + 2s lx 2 2x 3 + x o p l x 2 x 3 = x 3 3 + rx lx 2 一rx ox 3 s lx lx 3 s lx 2x 3 x 3 2 + 2s lx lx 3 2 + 2s lx 2x 3 2 + 比x l + p lx 2( 1 - 1 ) 其中r 是重复基因座间的重组率,对于连锁的基因重复,r = 0 ,对于不连锁基因 重复r = 0 5 ;“l 和分别为两个重复基因座上的突变率。在d n r 选择模型下, s l = 0 ;在h i 选择模型下,s l = 1 公式1 1 的简要推导见后。 表1 - 1 经典模型下各种基因型个体的适应度 在d n r 选择模型下,s l = 0 ;在h i 选择模型下,s ,= 1 作为遗传漂变的影响,下一代的实际染色体单倍型频率通过多项采样获得。 因此整个修改了的算法如下: 起初,令基因池中x o = l ,x i = x 2 = x 3 - = o 。 1 基因池中各染色体单倍型频率依照公式1 1 进行微分变化; 2 通过多项分布抽取2 n 个配子,再计算下一代基因池中各染色体单倍型实 际频率; 3 重复1 ,进行下一代操作,直到一个重复基因最终沉默。 使用这一算法的模拟仅需要很少的内存,并且即使在一台普通的p c 机上运 算速度也相当快。我们得到的结果与前人基于配子算法的结果非常相似【7 1 。数值 和数学分析都基于这一算法( 见下面) ,这意味着该算法成为模拟,数值和数学 分析的一个共同的基础。模拟程序的源代码如果有人需要,我们可以提供。 4 在模拟中,我们主要关注不同情况下t 的变化,如两个重复基因座突变速率 不等,连锁和选择模型等。假设一个重复基因座上的突变率为u 1 - 10 - a ,两个重 复基因座上突变率的比值为a ,则另一个基因座上的突变率u 2 等于a u l 。模拟 结果见表1 2 。为了让模拟结果显得更具有生物学意义,我们还选用了p t = 1 0 。6 和 9 2 = l 旷的遗传参数,结果见图1 1 我们可以从中得到一些基因重复进化的启 示。 第一,当a l 时,比如模拟中的a = 0 1 ,基因重复的t 表现得就像一个中 性基因座上的基因沉默时间一样( 数据没有显示) 。在群体遗传学原理上,小群 体中一个中性进化基因沉默的t 约为l i p l ,这与在重复基因上a = 0 1 的模拟结果 ( n = 1 0 ) 很接近。在大一点的群体中,模拟结果也显示t 只轻微地受重组和选择模 型的影响。 第二,如果两个重复基因座上的突变率相等,在d n r 选择模型下不连锁重 复基因t 的估计己由w a t t e r s o n ( 1 9 8 3 ) 给出0 6 1 t n 1 0 9 ( 2 n ) 一v ( 2 n g ) 】( 1 - 2 ) 其中、i ,( ) 是d i g a m m a 函数。w a t t e r s o n 认为这个公式适用于大的n 2 6 】,并且 l y n c h 和f o r c e ( 2 0 0 0 ) 认为它可以对n 全范围内的t 都给出很好的估计1 7 。然 而,经过更细致的比较发现模拟得到的t 略微大于公式1 2 给出的预计值( 更多 的数据没有在这里显示) 。这表明公式1 2 有点低估了d n r 选择模型下不连锁基 因重复的t ( 见表1 2 ) 表1 - 2 经典模型下基因重复平均沉默时间的模拟结果( 单位为n 代,t n ) 0 8 9 7 ( 6 7 ) 1 0 9 1 ( 6 5 ) o 5o 5 0 8 1 o 1 2 7 ( 9 8 ) 12 0 ( 9 2 ) 1 1 5 ( 8 8 ) 10 7 ( 7 5 ) 1 0 1 ( 6 9 )9 2 ( 6 0 ) 1 7 2 ( 1 4 2 ) 1 8 4 ( 1 5 6 ) 1 8 4 ( 1 5 6 )1 2 3 ( 9 4 ) 1 0 9 1 0 300 5 3 3 5 ( 1 8 8 )3 9 4 ( 2 1 9 ) 0 8 3 6 3 ( 2 0 5 ) 4 4 8 ( 2 4 6 ) 1 0 3 6 4 ( 2 0 9 ) 4 5 2 ( 2 4 7 )5 0 ( 3 0 ) 0 50 5 4 0 0 ( 2 3 0 ) 9 4 5 ( 7 19 ) 0 8 6 4 9 ( 4 6 3 ) 1 3 6 8 ( 1 3 4 9 ) 1 0 7 9 1 ( 6 0 8 )9 6 7 1 ( 9 3 2 6 ) 1 2 3 ( 9 4 ) 7 2 l0 400 5 0 7 4 ( 0 2 7 ) 0 9 2 ( 0 3 2 ) 0 8 1 4 8 ( 0 81 ) 1 8 0 ( 0 8 5 ) 1 0 2 8 1 ( 1 9 8 ) 3 3 1 ( 2 0 6 )4 1 ( 2 6 ) 0 50 5 o 7 4 ( 0 2 4 )5 7 7 ( 4 19 ) 0 8 1 4 7 ( o 6 0 ) 0 0 1 0 7 7 ( 5 8 ) 8 1 ( 6 1 ) 6 9 表中数值的单位为n 代;扩号内是标准差。 在一个重复基因座上退化突变率假设为1 t l = l o ,而另一个基因座上退化突变 率1 t 2 = a l , t ,其中a 等于肛2 “1 d n r 和h 1 分别为d n r 和h i 选择模型下模拟结果,模拟重复1 0 5 次 。l i 是l i 的模拟结果n 5 1 。w a t 是公式卜2 的预计结果b 6 1 6 第三,在n 不太小时( 比如,n = 1 0 0 ,1 0 0 0 和1 0 0 0 0 ) ,在d n r , h i 选择模型 下不连锁重复基因的t 通常大于连锁基因的t 。虽然在d n r 选择模型下t 的这 一观察与前人的研究一致【7 ,”l ,但其机理还没有解释清楚。我们将在下一节中用 数值分析工具解释它。另一方面,对于不连锁重复基因,h i 选择模型下t 大于 d n r 选择模型下t ,并且当n ( g l + 9 2 ) 和q 都接近1 的时候,h i 选择模型下t 变 得令人惊奇地大。有的时候t 值太大以至于重复基因无法沉默,因此在表1 2 中 它被写成了无穷大的符号。 第四,在l l l = i t 2 = 1 0 击的情况下,这一现象也出现在了不连锁基因重复进化中 ( 见图1 1 ) 。当n 5 0 0 0 0 0 ( n p l o 5 ) 时,由于t 太大( 超过1 0 1 0 代或者1 0 4n 代) , 我们也很难得到h i 选择模型下不连锁基因重复的t 。这一观察与上面表1 2 中 肛l _ 旷1 0 。3 的模拟结果一致。 这表明在单倍体不足、不连锁基因重复进化中,t 的延长在一个中等大小的群体中都是较为普遍的,甚至是在突变率d , n 接近现实 值的时候。 虽然t a k a h a t a 和m a r u y a m a ( 1 9 7 9 ) 通过模拟观察到大群体( n p l = 1 0 和 i l = ) 中h i 选择模型下不连锁重复基因的t 通常大于连锁基因重复的t ,但是他们观 察到连锁和不连锁基因重复间t 的差别远小于我们所观察到的1 1 4 1 。特别是我们 观察到即使在一个中等大小群体中,以及重复基因座上退化突变率略微不一样, 不连锁、单倍体不足基因重复的t 仍然会显著延长。这一结果在生物学上非常有 意思,下面我们进一步通过数值和数学分析工具细致探索和分析这一现象下的机 理。 7 图1 - 1 经典模型和不同的选择模型下重复基因平均沉默时间的模拟结果,其中 “。= 1o 。和a = 1 星点和园点分别代表连锁( r = o ) 和不连锁( r = 0 5 ) 基因重复的模 拟结果。实线和点线分别代表d n r 和h i 选择模型下的模拟结果。模拟重复1 0 0 0 次。 1 3 数值分析 假设群体很大以至于遗传漂变对重复基因进化的影响很小,可以忽略。公式 1 1 可以当作一组常微分方程组( o d e s ) 。这样,通过r u n g e k u t t a 方法 i r l 就可 以得到给定条件( 如重组率和选择模型) 下o d e s 的数值解,其起始条件为x o = 1 x l = x 2 - - - - x 3 = o 。这样就可以获得各染色体单倍型频率随时间( 代数) 的动态变化, 其中p l = 1 0 。和不同的a = p 2 似1 ) 。由于在一个重复基因沉默时x o 一定为o ,所 以) 【0 的动态变化可以作为沉默的观测值。不同条件下x o 的动态变化见图1 2 和 1 3 ,其中有几个特点较明显。 8 n 5 1 522 5 3 x 1 矿 图1 - 2 在经典和d n r 选择模型下连锁( - i - 图a 中重组率r = o ) 和不连锁( - y 图b 中重组率r = o 5 ) 基因重复的原染色体单倍型频率( x o ) 的动态变化。图中数据为 公式卜1 的数值分析结果,其中一个重复基因座上突变率p 。= 1 0 一,和n = m 9 , 帖 眩 &言idz i5l暑ic|6甚奄分5,量l n 怕位矾n 誊蠹璺 图b 中酽o 8 和酽1 o 的曲线是重合的 鼾妻兰銎一主= 餐 郴卿:枇芝与絮一 赫赫删峨这 & ( 删和不连锁5 ) x o 的动态变化在融确旧引。1 m 叭4 第二,对于连锁基因重复, ) 【0 通常以近指数分布下降为0 ,并且在不同的 选择模型中a 相同时x o 变化相似( 见图1 - 2 a 和1 3 a ) 在图1 3 a 中m 选择模 型尾部) o 比图1 - 2 a 中d n r 选择模型下的) o 大。这提示在较大群体中h l 选择 模型中连锁基因重复的t 可能略大于d n r 选择模型下的。这些提示都已经在模 拟中观察到( 见表1 2 ) 。这也表明) 【o 是大群体中t 的一个合理的近似观测值。 第三,对于不连锁基因重复( f 0 5 ) ,当a = l ,x o 通常很快下降到一个平衡值。 如果0 t 不等于1 ,d n r 选择模型下拗就会下降为0 ;而在h i 选择模型下,当仅 接近l 或不偏离1 太多时( 见图1 3 b 中a = 0 5 ,0 8 和1 0 的情况) ,x o 还会降到一 个平衡值或者下降很慢( 图1 3 b 中a = 0 8 和a = 1 0 的曲线重合) 。因此h i 选择模 型下不连锁重复基因坚固、稳定、具有弹性的) 【o 准平衡可能是上面模拟观察到 的t 在大群体中明显被拉长的主要原因。 最后,不连锁基因重复】( o 比连锁基因重复) 【o 要花更多的时间下降为0 ,除 非0 【1 。 当a = l 时,连锁基因重复) 【o 以近指数下降到0 ,而不连锁基因重复 x o 很快下降到一个平衡值( 见图1 3 ) 。这些观察可以解释模拟结果中在较大群体 中不连锁基因重复的t 通常显得比连锁基因重复的大( 见上面的模拟结果;以 及参考文献7 ) 1 4 基因重复的数学分析 虽然上面的数值结果可以勾画出模拟观察结果的机制,但它们是在假设群体 非常大的情况下得到的,因此,其结论可能会被批评为不够令人信服。现在,让 我们放弃这一假设,从数学角度来考虑有限群体里基因重复各染色体单倍型频率 的动态变化和t 的估计。 在前人的研究中有两种
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 14926.22-2026实验动物小鼠肝炎病毒检测方法
- 保洁打扫卫生考勤制度
- 学校集体考勤制度
- 上班下班考勤制度
- 单位考勤制度
- 公司企业考勤制度
- 小学办公考勤制度
- 基于RAG的知识库构建方案课程设计
- 本科机械工程课程设计
- 小米集团产品创新战略及实施方案
- 2025新疆公务员申论真题及答案
- 宝山区国有企业招聘笔试题库2025
- 《法律职业伦理(第三版)》全套完整教学课件
- 双汇授权合同
- 中国能源争议解决年度观察2025
- 2025化工安全事故案例
- 蔬菜配送安全培训课件
- 莫兰迪工作总结计划
- 办公楼垃圾分类与回收管理执行手册
- Python程序设计 课件 第9章 NumPy与数值计算
- 2024年青海高等职业技术学院单招职业技能测试题库及答案解析
评论
0/150
提交评论