




已阅读5页,还剩49页未读, 继续免费阅读
(遗传学专业论文)酵母重复基因的适应性进化.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 酵母重复基因的适应性进化 遗传学专业硕士研究生李文乐 指导教师张泽教授 摘要 基因的重复以及其后的分化一直以来就被视为新基冈功能产生的主要引擎和动力 源泉。什么机制驱动了重复基冈获得新功能对于理解高等生物复杂性进化至关重要。一 般认为适应性进化是基因新功能进化的唯一机制。科学家们已经提出了两个模型即新功 能化( n e o f ) 模型和逃脱适应性冲突( e a c ) 模型来说明重复基冈的适应性进化。尽管 有实例研究结果分别支持这两个模型,但是在基因组水平上对这两个模型相对重要性评 价的研究仍然未见报道。啤酒酵母s a c c h a r o m y c e sc e r e v i s i a e 大约在1 0 0 百万年前经历了一次 全基因组重复事件,经过漫长的进化后,到今天约有1 0 的酵母全基因组重复基因保留在了 基冈组中。这些保留的重复基因经历了适应性进化吗? 如果经历了适应性进化,新功能化 ( n e o f ) 模型和逃脱适应性冲突( e a c ) 模型哪一个更流行? 为了回答这些问题,我们 利用基于系统发生的极大似然方法和来自多个酵母种的序列数据探测了重复基因适应 性进化即经历正选择的证据。对2 2 3 个平衡数据集的分析得到了如下结果: 1 相当数量的啤酒酵母重复基因的进化经历了正选择 运用在正选择探测方面使用较为普遍的枝长位点模型a 与其空白模型构建似然比测验 ( l r t ) ,在啤酒酵母2 2 3 对经历过全基因组重复中保留下来的基因对中,发现其中有1 0 8 个 ( 4 8 ) 基因在紧接全基因组重复后的一条或两条枝上有正选择的证据,表明适应性进化是促 进酵母重复基因保留的主要机制之一。将这些基因与没有正选择证据的基冈进行g o 分析发现 这些有正选择证据的基因在抗氧化,分子转换器和生物粘连性三个方面有一定比例,而那些 没有正选择证据的基因却都表现为0 ,表明了这三个功能组对酵母适应性进化的重要性。 2 e a c 模型是酵母重复基因适应性进化的主要机制之一 我们严格按照两种适应性进化模型的特点以及辨别标准,创新性地仅仅运用p a m l 的计 算结果从着手对e a c 和n e o f 模型进行了划分。在模型b 的结果中,有3 8 个基因被鉴定 为e a c 模型,有8 7 个基冈被鉴定为n e o f 模型;在模型a 下,e a c 和n e o f 模型的数量 分别为4 3 和6 5 。而将两种模型综合起来,先用模型b 做一次筛选,再将剩下的结果用模型a 进行鉴定,这样得到的结果为:e a c5 个,n e o f1 7 个。这些结果表明尽管n e o f 模型比e a c 1 两南大学硕十论文 模型更普遍,但e a c 模型也是酵母重复基因适应性进化的主要机制之一。 从以上的结果我们可以得到两点结论:第一,虽然啤酒酵母基因组在1 0 0 个百万年以前 经历了全基因组重复,其年代已经十分的久远,但当我们对紧接基因组重复后的进化枝运用 极大似然法进行正选择位点探测时,仍然在近一半( 4 8 ) 的基因中发现有适应性进化的证据。 这说明适应性进化机制对于重复基冈进化有着极为重要的作用。第二,虽然酵母重复基因进 化符合e a c 模型的比例比符合n e o f 模型的小,但由于其在基因新功能进化中的特殊地位, 其重要性仍然不容忽视。 关键词:重复基因适应性进化正选择极大似然法 a b s t r a c t a d a p t i v ee v o l u t i o no fy e a s to h n o l o g yg e n e s m a s t e r :、n l el i s u p e r v i s o rp r o f e s s o r :z ez h a n g g e n ed u p l i c a t i o n ,a n ds u b s e q u e n td i v e r g e n c e ,h a sl o n gb e e nt h o u g h tt ob et h ep r i n c i p a le n g i n e s p o w e r i n gt h ee v o l u t i o no fn e wg e n ef u n c t i o n w h a tm e c h a n i s md r i v e sd u p l i c a t eg e n e sa c q u i r i n g n o v e l t yf u n c t i o n a l l yi se s s e n t i a l f o ru n d e r s t a n d i n gt h ee v o l u t i o no fc o m p l e x i t yo fh i g h e ro r g a n i s m s i ti sg e n e r a l l yb e l i e v e dt h a ta d a p t i v ee v o l u t i o ni st h eo n l ym e c h a n i s mo fn o v e lf u n c t i o ne v o l u t i o no f g e n e s t w om o d e l s ,n a m e l yn e wf u n c t i o n a l i z a t i o nf n - e o f ) m o d e la n de s c a p ef r o ma d a p t i v ec o n f l i c t ( e a c ) m o d e l ,h a v eb e e np r o p o s e dt oe x p l a i na d a p t i v ee v o l u t i o no fd u p l i c a t eg e n e s a l t h o u g ht h e r e h a v e b e e nc a s es t u d i e st o s u p p o r tt h e s et w om o d e l s ,r e s p e c t i v e l y , e v a l u a t i o no ft h er e l a t i v e i m p o r t a n c eo ft h e s et w om o d e l sh a s n o tb e e np e r f o r m e da tg e n o m i cl e v e l b r e w e r s y e a s t s a c d h a r o m y c e sc e r e v i s i a eh a su n d e r g o n ew h o l e g e n o m ed u p l i c a t i o n ( w g d ) e v e n ta b o u t 10 0 m i l l i o ny e a r sa g o ,t h r o u g hal o n gt i m ee v o l u t i o n ,a p p r o x i m a t e10 o f t h ed u p l i c a t eg e n e sc r e a t e db y w g dw e r er e t a i n e di nt h eg e n o m e h a v et h e s er e t a i n e dd u p l i c a t eg e n e su n d e r g o n ea d a p t i v e e v o l u t i o n ? i fs o m eo ft h e mh a v ee x p e r i e n c e da d a p t i v ee v o l u t i o n ,w h i c ho ft h en e wf u n c t i o n a l i z a t i o n 洲e o - f ) m o d e la n de s c a p ef r o ma d a p t i v ec o n f l i c t ( e a c ) m o d e li sm o r ep o p u l a rt h a nt h eo t h e r ? t o a n s w e rt h e s eq u e s t i o n s ,w eu s e dp h y l o g e n y - b a s e dm a x i m u ml i k e l i h o o dm e t h o d sa n dt h es e q u e n c e d a t af r o mv a r i o u sy e a s ts p e c i e st od e t e c tt h ee v i d e n c eo fa d a p t i v ee v o l u t i o n ( h a v i n ge x p e r i e n c e d p o s i t i v es e l e c t i o n ) i nd u p l i c a t eg e n e s w ea n a l y z e d2 2 3b a l a n c ed a t as e t sa n do b t a i n e dt h ef o l l o w i n g r e s u l t s : 1 an u m b e ro fo h n o i o g si n & c e r e v i s i a eh a v eu n d e r g o n ep o s i t i v es e l e c t i o n w ea p p l i e dt h eb r a n c h - s i t em o d e laa n di t sn u l lm o d e lt h a tw a sw i d e l yu s e di nt h ea s p e c to f p o s i t i v es e l e c t i o nd e t e c t i o nt oc o n s t r u c tl i k e l i h o o dr a t i ot e s t ( l r t ) a m o n gt h e2 2 3o h n o i o g s ,w e f o u n dt h a t10 8o f 2 2 3g e n e s ( 4 8 ) h a dt h ee v i d e n c eo fp o s i t i v es e l e c t i o ne i t h e ri no n eb r a n c hr i g h t a f t e rw g do ri nb o t h t h i ss u g g e s t e dt h a ta d a p t i v ee v o l u t i o nw a sp r i m a r ym e c h a n i s mf a c i l i t a t i n g r e t e n t i o no fo h n o i o g sa f t e rw g d e x p e r i e n c e db y c e r e v i s i a e t h e n w eu s e dt h e s eg e n e sa g a i n s t t h o s ew i t h o u tp o s i t i v es e l e c t i o ne v i d e n c et ou n d e r t a k eg oa n a l y s i s t h er e s u l ts h o w e dt h a tt h e g e n e sw i t he v i d e n c eo fp o s i t i v es e l e c t i o nh a dac e r t a i np r o p o r t i o ni nt h ef u n c t i o no fa n t i o x i d a t i o n , m o l e c u l a rt r a n s d u c e ra n db i o l o g i c a la d h e s i o n ,w h i l et h o s ew i t h o u te v i d e n c eo fp o s i t i v es e l e c t i o n w e r en o n ei nt h e s et h r e ea s p e c t s t h i si n d i c a t e dt h a tt h e s et h r e ef u n c t i o n a lg r o u p sw e r ei m p o r t a n tt o a d a p t i v ee v o l u t i o ni ny e a s t i i i 两南。人学硕十论文 2 e a cm o d e li so n eo fa d a p t i v ee v o l u t i o nm e c h a n i s m so ft h ey e a s to h n o l o g yg e n e s w eu s e ds t r i c ts t a n d a r d st od i s t i n g u i s ht h et w oa d a p t i v ee v o l u t i o nm o d e l so fd u p l i c a t eg e n e s t h a ti s ,t h ef o ( n o n s y n o n y m o u ss u b s t i t u t i o nv s s y n o n y m o u ss u b s t i t u t i o nr a t i o ) v a l u e sa l o n gt h e b r a n c h e sf i g h ta f t e rw g dw e r eu s e dt oc l a s s i f ye a ca n dn e o fm o d e l s u n d e rt h em o d e lb ,t h e r e w e r e3 8g e n e si d e n t i f i e da se a cm o d e la n d8 7g e n e sa sn e o fm o d e l ;b u tu n d e rt h em o d e la ,t h e n u m b e r so fe a ca n dn e o - fm o d e l sw e r e4 3a n d6 5 ,r e s p e c t i v e l y w h e nt h ec o m b i n a t i o no fb o t h t h et w om o d e l saa n dbw a sa p p l i e d ,t h en u m b e r so fe a ca n dn e o - fr e d u c e dt o5a n d17 r e s p e c t i v e l y t h e s er e s u l t si m p l i e dt h a ta l t h o u g ht h en e o fm o d e lw a sm o r ep o p u l a rt h a ne a c m o d e l ,t h ee a cm o d e lw a sa l s oam a j o rm e c h a n i s mo fa d a p t i v ee v o l u t i o no fy e a s td u p l i c a t eg e n e s w ec o u l dm a k et w oc o n c l u s i o n sf r o mt h ea b o v er e s u l t s :f i r s t l y ,a l t h o u g ht h ey e a s tw g de v e n t o c c u r r e da b o u t10 0m i l l i o ny e a r sa g o ,n e a r l yh a l f ( 4 8 ) o ft h ed u p l i c a t eg e n e sw e r ef o u n dt oh a v e e v i d e n c eo fa d a p t i v ee v o l u t i o nw h e nf o c u s i n go np o s t d u p l i c a t i o nb r a n c h e sf o l l o w e dw g du s i n g m a x i m u ml i k e l i h o o dm e t h o dt od e t e c tp o s i t i v es e l e c t i o ns i t e s t h i ss h o w e dt h a ta d a p t i v ee v o l u t i o n h a sa ne x t r e m e l yi m p o r t a n tr o l et or e t a i nd u p l i c a t eg e n e s s e c o n d i 5a l t h o u g ht h ep r o p o r t i o no f d u p l i c a t eg e n e sc o n s i s t e n tw i t he a cm o d e li ss m a l l e rt h a nt h a to ft h o s ec o n s i s t e n tw i t hn e o fm o d e l , t h ei m p o r t a n c eo fe a cm o d e lc o u l dn o tb e e ni g n o r e db e c a u s eo fi t s s p e c i a lr o l ei n n e wf u n c t i o n e v o l u t i o no fg e n e s k e yw o r d s :d u p l i c a t eg e n e s a d a p t i v ee v o l u t i o np o s i t i v es e l e c t i o n m a x i m u ml i k e l i h o o d m e t h o d i v 独创性声明 学位论文题目:酵母重复基因的适应性进化 本人提交的学位论文是在导师指导下进行的研究工作及取得的研究成果。论文中引用他 人已经发表或出版过的研究成果,文中已加了特别标注。对本研究及学位论文撰写曾做 出贡献的老师、朋友、同仁在文中作了明确说明并表示衷心感谢。 学位论文憾套交乐签字眺动勿年f 月加日 学位论文版权用户许可证书 本学位论文作者完全了解西南大学有关保留、使用学位论文的规定,有权保留并向国家 有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权西南大学 研究生院( 筹) 可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影 印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书,本论文:口不保密, 口保密期限至年月止) 。 学位论文作者签名: 签字目期: 纵年彳月加目 导师签名p 签字目期: 伽f r o 年6 月厂f ,曰 第一章文献综述 第一章文献综述 1 1 重复基因 1 1 1 重复基因的概念及产生缘由 基因重复是指含有基因的d n a 片段发生重复,从一段变为两段甚至多段。在 人类基因组中有1 5 的蛋白质编码基因属于重复基因,而在拟南芥中这个数字 可以高达2 5 1 2 3j 。重复基因发生的原因也是多种多样的,这可以是由于同源重组 出错造成的,也可以是由于基因发生了不等交换,或者反转录转座与全基因组重 复,从而产生一个与原基因相似的基因或碱基序列1 4 l 。基因的重复与生物体基因组 大小的进化、新基因的起源、物种的分化以及基因抗突变的能力大小等都密切相 关。所以现如今对于重复基因的研究才会变得如此倍受关注。专门以重复基因为 研究对象的研究小组也在世界各地悄然崛起,著名的有w o l f ek h 以及j i a n z h i z h a n g 等的研究小组。 1 1 2 同源基因的分类 同源基因可以划分为几个大类,第一类是直系同源基因( o r t h o l o g yg e n e s ) ;第 二类称为旁系同源基因( p a r a l o g yg e n e s ) 或重复基因( d u p l i c a t eg e n e s ) 。其中,直 系同源基因主要起源于物种分化,它们由于起源于共同祖先,所以通常在不同的 物种中具有相似结构与功能。然而旁系同源基因的起因却是基因重复,而并非物 种分化。在发生基因重复以后通常会产生两个基因拷贝,而这两个拷贝互为旁系 同源基因。旁系同源基因通常具有相同或相似的功能,但并不绝对。如果其中一 个缺乏原始的选择性压力,那么该拷贝就很有可能自由进化从而获得一种新功能, 例如n e o f 模型,而这在遗传学上具有显著地意义,也正是如此,生物体才能够 不断进化以适应新的外部应激。第三类,也就是所谓的o h n o l o g s ,它专指那些经 历过全基因组重复而产生的旁系同源基因,这个名词是w o l f e 为将其与一般的旁系 同源基因作区分,在他的一篇论文中第一次使用的1 5 i 。 1 1 3 重复基因的研究历史 基因重复在生物的进化过程中扮演着极为重要的角色。基因的重复以及 分化一直以来就被视为新的基因功能产生的主要引擎和动力源泉1 4 j 。正是由 于它的存在,才使得一些高等动物的基因组变得十分复杂【6 】。重复基因一直 以来就是一个十分让人着迷的课题。科学家们对于重复基因在进化创新性以 及适应性机制上的认识至少可以追溯到1 9 3 6 ,b r i d g e s ( 1 9 3 6 ) 第一次观察到 在黑腹果蝇d r o s o p h i l am e l a n o g a s t e r 的一种眼睛大小明显减小的突变体中有染色 两南大号! 硕十论文 体带的加倍现象【7 】,表明基因或染色体区段的重复可能对某些表型性状有效应。 后来,s u s u m uo h n o ( 1 9 7 0 ) 在他的著作基因重复的进化中才第一次对基因 重复作了综合全面的阐述【8 】。他提出基因重复是在共同祖先出现以后最为重要的进 化驱动力【9 】。在这之后,w o l f e 和s h i e l d s 在1 9 9 7 年利用完整的基因组序列,在 啤酒酵母s a c c h a r o m y c e sc e r e v i s i a e 中发现了古代全基因组重复的分子证据i l 。随 后,k e l l i s 等人以及d i e t r i c h 等人在2 0 0 4 年分别通过基因组比对的方法证实了 这个发现【1 1 1 2 】。更为重要的是,k e l l i s 等人在2 0 0 4 年的一项研究中就已经鉴定出 4 5 7 对起源于酵母全基因组重复大约1 0 0 个百万年以前的重复基因对j 。这表明 有大约1 0 的酵母基因在全基因组重复以后保留在了基因组中。然而,到底是什 么机制使得这些重复基因得以保留仍然有待阐明。 1 2 适应性进化 1 2 1 什么是适应性进化 所谓的适应性进化是指同一种生物在不同的生活环境中经过长期对外界环境 的刺激从而在外观和机能上产生一些相应的变化以更能好的适应当地的生存条 件。据文献报道,高等的哺乳动物,鸟类跟低等的爬行动物以及两栖动物的基因 组中的g c 含量相比起来所占的比例要高【1 3 】。有的文献在其开展的研究中指出这 主要是因为g c 碱基对的热稳定性要比a t 好,较高含量的g c 碱基对就是那些温 血动物( 哺乳动物,鸟类) 的一种适应性进似1 4 】。 1 2 2 适应性进化理论的发展历史 自从1 8 5 9 年达尔文在物种起源中指出自然选择充当了促进物种进化的最 主要动力以来,围绕着这个观点的争论便一直持续了一个多世纪。在上个世纪6 0 年代,木村资生提出了中性进化理论,他指出在进化过程中,绝大多数核苷酸替 代都是中性或近中性的突变,而不是正选择的结果【1 5 】,该观点一经提出便马上在 整个分子生物学术界得到了广泛的重视。随后在1 9 6 9 年,k i n g 和j u k e s 对中性理 论进行了验证与补充,他们从另一个角度指出:许多蛋白质多态性在选择上表现 为中性或近中性,并在突变引入与随机消亡之间保持平衡l l6 1 。但后来很多科学家 对此提出了不同看法。到了1 9 8 7 年,日本科学家n e i 提出尽管大多数的氨基酸替 代都是通过随机固定产生的,但的确有部分替换是适应的i l7 1 。这种适应性进化理 论可以看作是对中性进化理论的进一步修正,在随后的多项研究中均发现了正选 择位点的存在,这也支持了适应性进化的理论f 1 8 之0 1 。 第一章文献综述 曼曼曼曼曼曼曼曼曼皇曼曼曼曼曼曼曼曼曼曼曼曼曼量曼曼曼曼曼曼曼曼曼曼曼曼曼曼! 皇曼曼曼曼曼曼曼曼曼曼量曼曼曼曼曼曼曼量曼曼曼曼曼童皇曼曼n n n ii 曼曼曼! ! ! ! ! ! 曼曼 1 2 3 正选择与适应性进化的关系 正选择,又称作定向选择或者达尔文选择,是指将含有发生了有利突变 并因此提高个体适合度的等位基因固定下来的选择作用【2 。那么,换个角度 来思考,正选择其实就是适应性进化的一个判断指标。如果一个基因存在正 选择位点,那么该基因就很有可能经历了一个适应性进化的过程。对于一个 物种而言,曾经历过的正选择是进化历史中的重大事件,因为这意味着该物 种能够对环境中与其生存密切相关的某一生长因子的适应,也暗示着在这个 时间点上有些蛋白产生了新的功能。这对于该功能基因的一些后续研究也有 重要的参考价值。 1 3 基因重复的进化机制 1 3 1 适应性进化机制 o h n o 于1 9 7 0 年在他的著作基因重复的进化中提出了基因重复的经典进化 模型嘲o f ( 新功能化) 模型。他提出当基因发生重复以后,其中一个基因拷 贝会保留祖先的原始功能,而如果另一个拷贝的突变是有利的,那么它将受到正 选择的作用并自由进化,最终获得新功能博j 。 当代分子进化的核心问题就是阐述新功能的适应性进化机制,而新功能化模型 无疑成为了重复基因适应性进化的典型代表并已经得到了广泛的研究。实际上, 在很多研究中确己证明了两个重复拷贝中的一个在正选择作用下获得新功能而另 一个拷贝仍然维持祖先功能。然而,在组织器官中,尤其是在真核生物中,单拷 贝基因表现出多功能也是极为常见的事。在这种情况下,很有可能改变其中一个 功能会对同一个基因所表现的其它功能产生有害的多效性。在基因发生重复以后, 这种抑制作用会减弱,并使得每个拷贝的各个功能独立的进行进化。关于这种模 型最初的思想可以追溯到1 9 9 0 年p i a t i g o r s k y 和w i s d o w 的研究【2 2 】。随后,h u g h e s 在1 9 9 4 年发表的论文中进一步阐述了这种模型并将其命名为逃脱适应性冲突 ( e s c a p ef r o ma d a p t i v ec o n f l i c t ( e a c ) ) 23 1 。e a c 模型断定两个拷贝在基因重复以后均 会经历适应性进化并获得新的功能。自从e a c 模型被提出以来,主要由于没有找 到使人信服的证据并没有被科学家们给与足够的重视。然而幸运的是,最近的两 项研究使用了引人注目的分子证据对e a c 模型进行了阐述并指出e a c 很可能比以 前所认为的那样有更高的发生频率,而这将对新功能的进化有着极为深远的意义 【2 4 ,2 5 】 o 以上两个模型均有至少一个重复基因拷贝有适应性进化发生,因而称其为适 两南大学硕十论文 应性进化模型。有两条准则可以用来区分n e o f 模型和e a c 模型。首先,e a c 中 适应性变化发生在两个重复拷贝而n e o f 模型由于纯化选择作用于其中一个拷贝 使其维持祖先功能只有一个拷贝经历了适应性改变。第二,e a c 模型的祖先功能 得到了改变而n e o f 却没有什么变化。当然,随着计算工具的发展,也可以用计 算的方法对两个模型加以区分【2 5 1 。 从理论上想要从分子水平上找到适应性进化的证据只需要对有正选择作用的 重要位点进行鉴定。这样不仅可以有助于对基因功能区的预测,又可以为解决某 些人类一直无法攻克的生物技术和生物医学难题提供崭新的思路。目前,正选择 作用的检测也开始为越来越多的生物学家所重视,并成为研究各种分子生物学问 题的重要方法。 1 3 2 非适应性进化机制 在基因组中,除了适应性进化机制以外还有大量的非适应性进化机制的模型存 在。其中如果由于基因重复事件创造了两个具有完全相同功能的重复拷贝,其中 一个拷贝可能由于功能的冗余在基因重复以后以中性的方式进化。因为有害突变 会比中性或有利的突变更容易发生,因此在绝大多数情况下,一个祖先基因在发 生基因重复以后,其中一个拷贝积累功能丢失的突变退化而完全失去其功能从而 成为假基因,我们将其叫做非功能化模型( n o n f u n c t i o n a l i z a t i o n ) 。这也是最容易被 理解的一种模型。相反,一些研究表明保留在基因组中的重复基因跟祖先基因相 比并没有获得新的功能。在高等生物的基因组中,祖先基因往往通过亚功能化 ( s u b f u c n t i o n a l i z a t i o n ) 将其原始功能在后代基因中进行分割,而这却是基因维护的一 种有效手段1 2 引。亚功能化也称为重复一退化一互补模型 ( d u p l i c a t i o n d e g e n e r a t i o n c o m p l e m e n t a t i o n ( d d c ) ) 。该模型认为重复基因被中性进化 机制所保留下来,每个旁系同源拷贝所积累的功能丢失突变会被另一个拷贝补偿 【27 1 。因此,d d c 模型$ i n o n f 模型一样本身不会发生适应性进化,这两种模型称 为非适应性进化模型。 1 4 正选择的直接判断指标d n 和d s 1 9 6 8 年日本人木村资生根据核酸、蛋白质中的核苷酸及氨基酸的替换速率, 以及这些替换所造成的核酸及蛋白质分子的改变不会对生物大分子的功能造成影 响事实,提出了分子进化的中性学说。他提出除了选择能够导致生物体发生进化 以外,不经历选择同样也能导致进化。当然两者的差别在于前者发生在表型水平 上,而后者发生在分子水平上1 1 5 1 。中性突变即是指生物体发生的突变对生物体本 身的生存既没有好处,也没有害处,也就是说,对生物的生殖力和生活力,即适 4 第一苹文献综述 合度没有影响,因而自然选择对它们不起作用,从另一个角度出发也可以叫做同 义突变。 生物体的遗传密码具有简并性,即决定一个氨基酸的密码子多数情况下并不 止一个,三联体密码子中如果在第三个核苷酸的位置上发生了碱基替换,这往往 不会改变氨基酸的组成。在大多数情况下,核苷酸的替换率远远高于氨基酸的替 换率,而这正是由于简并密码子的存在。由于密码子第三位上的核苷酸替换往往 都是同义的,所以第三位的核苷酸替换率也远远高于第一和第二位的1 2 引。因此, 了解同义替换和非同义替换发生的速率很有意义。 d n 和d s 分别表示氨基酸的非同义替换和同义替换,在中性进化过程中,同义 替换和非同义替换理论上是相等的,核苷酸的替换多数是随机的和中性的,而对 编码的基因来说,突变大多是有害的,并且,执行功能的序列进化的慢。正因为 如此,对同义替换和非同义替换发生速率的计算成为了分子进化研究中的一个重 要课题。大量理论上和经验上的研究结果表明估算非同义替换与同义替换的比值 ( = d n d s ) 是在分子水平上探测正选择的一项重要指标【2 9 ,3 0 1 。d n d s 1 ,这就是达尔文正选择证据的标记,在此基础上,基因就有可能与祖先基因 在功能上发生分化从而进化为一种新的功能。这种基于密码子模型的方法已经成 功并大量的用以鉴定那些经历过适应性进化的特定基因 3 1 - 3 4 j 。 1 5 用于正选择探测的基本工具p a m l 1 5 1p a m l 概述 p a m l ( 基于最大似然法的系统发生分析) 是一个利用极大似然法来对d n a 和蛋白质序列进行系统发生分析的程序包。当前的p a m l 软件包包括众多运用程 序,可以完成许多实际的数据分析工作,包括:系统发生树的比较和测试( b a s e m l 和c o d e m l ) ;复杂替换模型中的参数估计,包括位点间可变速率模型和多基因或位 点分区的组合分析模型( b a s e m l 和c o d e m l ) ;通过应用模型间比较来进行假设的似 然比检验( b a s e m l ,c o d e m l ,c h i 2 ) ;在全局和局域分子钟模型下的分化时间估计 ( b a s e m l 和c o d e m l ) ;用核苷酸,氨基酸和密码子模型来进行祖先序列的似然重建 ( 经验贝叶斯) ( b a s e m l 和c o d e m l ) ;通过蒙特卡罗模拟进行的核苷酸,密码子和 氨基酸序列基因的产生( e v o l v e r ) ;同义和非同义替换速率的估计和蛋白质编码d n a 序列中正选择的检测( y n 0 0 和c o d e m l ) ;化石校准中包含不确定性物种分歧时间 的贝叶斯估计( m c m c t r e e ) 1 35 1 。运行p a m l 通常只需要准备对齐后的氨基酸或者 气 两南大学硕十论文 d n a 序列以及这些序列相对应的树形文件。前者可直接使用p a m l 格式或者也可 按照示例文件里后缀名为n u c ,a a n e x 的文件那样进行格式设置。至于树形文件, 可用p a u p ,m a c c l a d e 或者m e g a 等常用的建树软件直接生成。不过有“【& u 标号指定的无根树将会被忽略。为了能成为p a m l 所接受的无根树,需要手动调 整树文件使树根部有一个三分叉,例如,把“( ( ( 1 ,2 ) ,3 ) ,4 ) ”改为“( ( 1 ,2 ) ,3 ,4 ) ”l j 圳。 1 5 2 位点模型 在本研究使用的c o d e m l 程序中常用的主要有位点模型和枝长一位点模型。其中, 位点模型( s i t em o d e l ) 允许在位点间变化( 在密码子或者蛋白质氨基酸之间) 3 7 3 8 】。大量此类模型在c o d e m l 的控制文件中通过使用变量n s s i t e s ( m o d e l = 0 ) 来 进行设置。你可以通过指定多个n s s i t e s 值一次运行几个位点模型。例如,n s s i t e s = 0 l278 将一次用相同的数据运行五种模型。位点模型已经被运用于真实数据分析并 在计算机模拟研究中进行评估【3 9 4 。其中有两对模型尤为重要,它们可以形成两 个正选择的似然速率测验。第一对是m l a ( 近中性) 和m 2 a ( 正选择) ,而第二对 是m 7 ( b e t a ) 矛0 m 8 ( b e t a & 0 3 ) m l a ( 近中性) 和m 2 a ( 正选择) 是m 1 ( 中性) a n d m 2 ( 选择) 【3 7 1 模型的轻微调整。在两个检测中,自由度都为2 。 m l a m 2 a 对照 比m 7 m 8 对照更为稳定。参照下表。旧模型m 1 和m 2 固定了c o o = 1 幂0 0 3 1 = 1 ,没有考 虑到o 0 3 1 之间的位点,这样不切实际。在m l a 矛f l m 2 a 的新模型中,o 0 3 0 1 从 数据中计算得到而0 3 l = 1 是固定不变的,这在3 1 4 ( 2 0 0 4 ) 以后的版本中开始执行。 同时用于鉴定正选择位点的b e b 过程也会在3 1 4 版本中执行。 表1 位点模型的基本参数设置。 墅竺垒! !型兰! i ! 箜罡堑幽! ! 呈垡 m o ( o n eratio、0 1 m1a ( n e u t r a l ) 12 p o ( p 1 2 1 - ) 9 0 ) 。 0 9 0 1 的时候,就说明我们所指定的前景枝上的某些位点受到正选择的作用 【4 6 】 o 1 5 4c o d e m l 的控制文件 在执行p a m l 程序的时候,和以前运用的许多软件不一样,我们需要先准备好 两南大学硕十论文 i i 待分析的序列文件以及相应的树形文件,在c o d e m l 的控制文件里对所选择的模型 及参数进行设定,然后双击执行程序或在d o s 操作系统下键入命令来执行运算。 对于本研究中使用的c o d e m l 程序,默认控制文件是c o d e m l c t l ,如下所示( 其中的星 号宰表示对该项参数的注释) 。 s e q f i l e = s t e w a r t a a 木s e q u e n c ed a t af i l en a m e o u t f i l e = m l c 木m a i nr e s u l tf i l en a m e t r e e f i l e = s t e w a r t t r e e s 木t r e es t r u c t u r ef i l en a m e n o i s y = 9 木o ,1 ,2 ,3 ,9 :h o wm u c hr u b b i s ho nt h es c r e e n v e r b o s e = 0 水1 :d e t a i l e do u t p u t o :c o n c i s eo u t p u t r u n m o d e = 0 o :u s e r t r e e ;1 :s e m i - a u t o m a t i c ;2 :a u t o m a t i c 木3 :s t e p w i s e a d d i t i o n ; ( 4 ,5 ) :p e r
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 副校长在全体教师大会上的讲话:让每一堂课都成为师生共赴的成长之旅
- 化学空气氧气试题及答案
- 装饰公司物资管理办法
- 智能化驱动与供应链融合-洞察及研究
- 规范餐饮标准管理办法
- 财务外包交付管理办法
- 融资招投标管理办法
- 《无形资产管理办法》
- 行政仓库库存管理办法
- 老小区如何管理办法
- 《牙体牙髓病学》教学大纲
- 制造型企业销售管理制度
- 非标自动化公司技术部管理制度
- 应用型高校产教融合:模式构建与实践路径探索
- 中医药健康知识讲座课件
- XXX学校教辅材料选用方案范文
- 检验检测机构数字化应用指南-
- 2025年“安康杯”安全知识竞赛题库(含答案)
- 海龟汤题目和答案(100题)
- 门窗员工劳动合同协议书
- 胃息肉个案护理
评论
0/150
提交评论