




已阅读5页,还剩52页未读, 继续免费阅读
(遗传学专业论文)原绿球藻和聚球藻密码子使用偏好和适应性进化研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
- 3 , 一 目录 论:j j e :1 中文摘要2 英文摘要4 前言7目q 吕, 材料与方法8 结果17 分析讨论2 7 参考文献33 附录3 8 致谢4 4 综述4 5 前言45丹q 吕) 参考文献5 4 独创性申明。57 2 位论文 偏好和适应性进化研究 中文捅姜 海洋单细胞蓝藻是世界上最原始的光合自养型原核生物,是全球碳循环的主 要参与者和初级生产力的主要贡献者之一,其中以原绿球藻和聚球藻为典型代 表。本研究中,我们使用比较基因组学手段深入探讨了多个具有代表性的亲缘关 系较近的海洋单细胞蓝藻同义密码子使用偏好方式,揭示了影响同义密码子使用 方式差异的原因,并且比较了原绿球藻和聚球藻进化速率之间的差异分析两者在 进化压力上的不同。同时,我们还在两大类蓝藻中检测到了多个与环境适应相关 正选择的基因。 研究目的: 1 计算各个海洋单细胞蓝藻的最优密码子,比较分析原绿球藻和聚球藻在同义 密码子使用偏好方式上的差异,并揭示两者引起同义密码子使用不同的原因; 2 用比较基因组学手段分析两类蓝藻的进化速率差异,并且分析他们在进化压 力上的不同; 3 检测两类蓝藻中经历正选择的基因,并分析适应性进化与蓝藻生存环境之l 、日j 的关系。 方法: 1 将2 2 个海洋单细胞蓝藻基凼组从i m g 数据库上下载,并自己编写p e r l 脚本 对其进行处理,用0 r t h o m c l 软件确定直系同源关系基因簇。首先将具有直系 同源关系的氨基酸序列使用c l u s t a l w 程序进行多序列比较,再使用e m b o s s 软件将基因序列按照其相应的氨基酸序列空位方式进行比对,得到1 1 1 3 个同 源基因簇。 2 提取基因组中的1 6 s r n a 序列,使用m e g a 4 0 软件,采用距离邻接法建立系统 发育树。 3 通过c o d o n w 及p e r l 脚本,分析2 2 个海洋单细胞蓝藻直系同源基因的密码子 使用方式,计算r s c u 、e n c 、c a i 、c b i 、f o d 和g c 3 。等值,并确定各个物 种的最优密码子。 4 分析两类海洋单细胞蓝藻密码子使用方式不同的原因。 5 使用p a m l 软件包对2 2 个蓝藻基因组进行d n d s 计算,分析他们的进化速率及 进行j 下选择检验,并使用c o g 对经历了正选择的基因进行功能注释。 结果: 1 通过对两类蓝藻密码子使用分析,我们发现他们的密码子使用方式差异非常 3 、缬氨酸( v a l ) 、苏氨酸( t h r ) 、 丝氨酸( s e r ) 、脯氨酸( p r o ) 、异亮氨酸( 1 1 e ) 、甘氨酸( g i y ) 及谷氨酸( g l u ) 等氨基酸均偏好使用a g a 、u u a 、g u u 、a c u 、c c a 、u c a 、u c u 、a u u 、g g u 及c a a 等密码子编码;而在聚球藻中,这些氨基酸则更喜欢使用c g c 、c u g 、g u g 、 a c c 、c c c 、a g c 、a u a 、g g c 以及c a g 等密码子。而且聚球藻偏好使用最优密 码子,而原绿球藻则更使用的较少。 2 通过对两类蓝藻密码子使用影响因素的分析,我们发现导致两类蓝藻密码子 使用方式不同的原因并不一致。原绿球藻主要由于基因组组成和突变的作用, 而聚球藻则更多是受选择作用的影响。 3 通过比较基因组学分析,我们发现两类蓝藻的进化速率并不一致,聚球藻进 化速率明显快于原绿球藻。而且聚球藻中有6 6 个基因检测到了正选择信号, 而在原绿球藻中只发现了6 3 个。 结论: 本研究中我们通过比较基因组学方法首次系统而深入的对两类海洋单细胞 蓝藻进行密码子偏好使用分析和进化机制及适应性进化研究,发现尽管他们亲缘 关系非常相近,但是他们的密码子使用方式差异非常大,而且导致他们密码子使 用方式不同的原因也各不相同,原绿球藻密码子使用主要受基因组组成限制和突 变作用,而聚球藻则受选择作用更大。同时,对进化速率的分析,我们发现两类 藻在进化分歧后,聚球藻的进化速率明显要快于原绿球藻。此外,通过适应性进 化分析发现两类蓝藻中有多个基因发生了适应性进化,这与他们生存的环境和面 临的进化压力有着密切的关系。一 关键词: 海洋单细胞蓝藻;密码子使用偏好;突变;选择;适应性进化 4 c o d o nu s a g ep a t t e r n s a n da d a p t i v ee v o l u t i o no f m a r i n e u n i c e l l u l a rc y a n o b a c t e r i as y n e c h o c o c c u sa n d p r o c h l o r o c o c c u s a b s t r a c t m a r i n eu n i c e l l u l a r c y a n o b a c t e r i a , r e p r e s e n t e db ys y n e c h o c o c c u s a n d p r o c j i l f d r o c d c c 凇,d o m i n a t et h et o t a lp h y t o p l a n k t o n b i o m a s sa n dp r o d u c t i o n i n o l i g o t r o p h i co c e a n i nt h i ss t u d y , w ee m p l o y e dac o m p a r a t i v eg e n o m i c sa p p r o a c h t o e x t e n s i v e l yi n v e s t i g a t et h es y n o n y m o u s c o d o nu s a g ea n de v o l u t i o n a r yr a t e si na l o to f c l o s e l vr e l a t e ds p e c i e so fm a r i n eu n i c e l l u l a rc y a n o b a c t e r i a b yc a l c u l a t i n gt h ec o d o n u s a g ep a t t e r n s o ft w og r o u p so fc y a n o b a c t e r i a s ,w ec o m p a r a t i v e l ya n a l y z et h e d i f f e r e n c eo ft h ec o d o nu s a g ep a t t e r n so fp r o c h l o r o c o c c u sa n ds y n e c h o c o c c u s ,a n d r e v e a lt h er e a s o nw h yt h ec o d o nu s a g ep a t t e r n s o ft w og r o u p sa r ed i f f e r e n t - m e a n w h i l e w eh a dc h e c k e dl o t so ft h ep o s i t i v es e l e c t e dg e n e so ft w og r o u p s ,w h i c h h a v eac l o s er e l a t i o n s h i pw i t ht h e i re n v i r o n m e n t o b j e c t i v e 1 c a l c u l a t et h ec o d o nu s a g ep a t t e r n sa l lk i n d so fc y a n o b a c t e r i a s ,c o m p a r a t i v e l y a n a l y s i st h ed i f f e r e n c eo ft h ec o d o nu s a g ep a t t e r n s o ft w og r o u p so fm a r i n e u n i c e l l u l a rc y a n o b a c t e r i aa n dr e v e a lt h er e a s o nw h y t h ec o d o nu s a g e sp a t t e r n so f t w og r o u p sa r ed i f f e r e n t 2 a n a l y s i s t h ed i v e r g e n c eo f t h e e v o l u t i o n a r y r a t e so fs y n e c h o c o c c u sa n d p r o c h l o r o c o c c u sa n dt h er e l a t i o n sw i t he n v i r o n m e n ta d a p t i o nb yc o m p a r a t i v e g e n o m i c sa p p r o a c h 3 c h e c kt h ep o s i t i v es e l e c t e dg e n eo ft w og r o u p s ,a n da n a l y z et h er e l a t i o n s h i p b e t w e e na d a p t i v ee v o l u t i o na n dl i v i n ge n v i r o n m e n t m e t h o d s 4 d o w n l o a dt h eg e n o m e so f2 2m a r i n eu n i c e l l u l a rc y a n o b a c t e r i af r o mt h ei m g d a t a b a s e ,t h e ni d e n t i f yt h eo r t h o l o g o u sg r o u p su s i n gt h eo r t h o m c lp r o g r a ma n d o w n p e r ls c r i p t w ea l i g n e dt h ea m i n oa c i ds e q u e n c e su s i n g t h ec l u s t a l wp r o g r a m w i t ht h ed e f a u l ts e t t i n g s ,a n dt h ec o r r e s p o n d i n gn u c l e o t i d es e q u e n c e sw e r et h e n a l i g n e dt of o l l o wt h es a m eg a pp a t t e r n su s i n gt h et r a n a l i g np r o g r a mi m p l e m e n t e d i nt h ee m b o s sp a c k a g e f i n a l l y , t h e r ea r e1 1 13g e n e sf o re a c hs p e c i e st a k e nf o r f u r t h e ra n a l y s i s 5 e x t r a c tt h e1 6 s r n as e q u e n c e sf r o mg e n o m e s ,a n dc o n s t r u c tt h ep h y l o g e n e t i ct r e e u s i n gt h en e i g h b o r - j o i n i n gm e t h o d ,w h i c ha r ei m p l e m e n t e d i nt h em e g a4 p r o g r a m a n a l y s i st h e c o d o nu s a g ep a t t e r n so ft h eo r t h o l o g o u sg r o u p so f2 2 5 、 温州医学院硕上学位论文 m a r i n eu n i c e l l u l a rc y a n o b a c t e r i ab ye o d o n wa n dp e r ls c r i p t c a l c u l a t e dt h ev a l u e o fr s c u ,e n c ,c a i ,c b i ,f o pa n dg c 3 s ,a n di d e n t i f i e dt h eo p t i m a lc o d o n so f e a c h s p e c m s 6 a n a l y z et h ec o d o nu s a g ep a t t e r n so ft h eo r t h o l o g o u sg r o u p so f2 2m a r i n e u n i c e l l u l a rc y a n o b a c t e r i ab yc o d o n wa n dp e r ls c r i p t c a l c u l a t et h ev a l u eo f r s c u , e n c ,c a i ,c b i ,f o pa n dg c 3 s ,a n di d e n t i f i et h eo p t i m a lc o d o n so fe a c hs p e c i e s 7 a n a l y z et h er e a s o nw h yt w og r o u p so fc y a n o b a c t e r i au s ed i f f e r e n tc o d o nu s a g e p a t t e r n s 8 c a l c u l a t et h ed n d sv a l u ea n d e v o l u t i o n a r y r a t e so f2 2m a r i n eu n i c e l l u l a r c y a n o b a c t e r i ao r t h o l o g o u sg e n e s ,t h e nd e t e c tp o s i t i v es e l e c t i o ng e n e sa n dc l a s s i f y t h e i rf u n c t i o n s ,b yu s i n gp a m l p r o g r a mp a c k a g ea n dc o g sd a t a b a s e 1 沁s u i t s 1 b yt h ea n a l y s i so fc o d o nu s a g ep a t t e r n so ft w og r o u p so fc y a n o b a c t e r i a ,w ef o u n d t h a tt h e i rc o d o nu s a g e p a t t e r n s a r e s h a r p l y d i f f e r e n t f o ri n s t a n c e s ,i n p r o c h l o r o c o c c u s ,t h ea m i n oa c i d so fa r g i n i n e ,l e u c i n e ,v a l i n e ,t h r e o n i n e ,s e r i n e , p r a l i n e ,i s o l e u c i n e ,g l i c i n ea n dg l u t a m i n ea r ep r e f e r r e dt ob ee n c o d e db ya g a , u u a ,g u u ,a c u ,c c a ,u c a , u c u ,a u u ,g g ua n dc a a h o w e v e r , i n s y n e c h o c o c c u s ,t h e ya r ep r o n et ou s ec g c ,c u gg u g , a c c ,c c c ,a g c ,a u a , g g ca n dc a gt oe n c o d es u c ha m i n oa c i d s b e s i d e s ,s y n e c h o c o c c u sp r e f e r st o u s eo p t i m a lc o d o n s 2 i nt h i ss t u d y , w ef o u n dt h a tt h e r ea r ed i f f e r e n tr e a s o n sc a u s i n gt h ec o d o nu s a g e p a t t e r n so fp r o c h l o r o c o c c u sa n ds y n e c h o c o c c u sv a r i o u s l y p r o c h l o r o c o c c u sw a s m a i n l yc a u s e db ym u t a t i o na n dg e n o m ec o m p o s i t i o n a lc o n s t r a i n t s ,i n s t e a do f s e l e c t i o ni ns y n e c h o c o c c u s 3 w ef o u n dt h a tt h ee v o l u t i o n a r yr a t e so f2 2m a r i n eu n i c e l l u l a rc y a n o b a c t e r i aa r e q u i t ed i f f e r e n t ,a n dt h ea v e r a g er a t ei ns y n e c h o c o c c u si sf a s t e rt h a nt h a ti n p r o c h l o r o c o c c u s a f t e rt h ec o m p a r a t i v eg e n o m i c sa n a l y s i s ,w ed e t e c t e dt h a t6 6 g e n e sh a v eu n d e r g o n ep o s i t i v es e l e c t i o ni ns y n e c h o c o c c u s ,b u to n l y6 3g e n e si n p r o c h l o r o c o c c u s c o n c l u s i o n s o u re v o l u t i o n a r yg e n o m i ca n a l y s i sp r o v i d e saf i r s ti n s i g h ti n t ot h ec o d o nu s a g e , e v o l u t i o n a r yg e n e t i cm e c h a n i s ma n de v i r o n m e n t a la d a p t a t i o no fs y n e c h o c o c c u sa n d p r o c h l o r o c o c c u sa f t e rd i v e r s i f i c a t i o n t h e s et w og r o u p so fc y a n o b a c t e r i ah a v eac l o s e p h y l o g e n e t i cr e l a t i o n s h i p ,b u ti nt h i ss t u d y , w ef i n dt h a tt h e i rc o d o nu s a g ep a t t e r n sa r e 6 h i g h l vd i v e r g e n t ,s oi t i st h ed e r i v i n gf o r c eb e h i n dt h ed i v e r s i f i c a t i o n i ti s r e v e a l e d m a tt h em u t a t i o na n dg e n o m ec o m p o s i t i o n a l c o n s t r a i n t sa r et h em a l n i o r c e s c o n t 抽u t i n gt ot h ec o d o nu s a g eb i a s i np r o c h l o r o c o c c u s ,i n s t e a do fs e l e c t i o nm 曲n e c 砌c d c c “s i na d d i t i o n ,t h en u c l e o t i d e s u b s t i t u t i o nr a t ea n a l y s i si n d i c a t e st h a t t h e s et w 0g r o u p so fm a r i n ec y a n o b a c t e r i aa r e n o te v o l v i n ga tac o n s t a n tr a t ea t t e rt h e d i v e r g e n c ea n dt h ea v e r a g ed n d sv a l u eo fo r t h o l o g o u sg e n e si ns y n e c h d c d c c 珊a r e s i g n i f i c a n t l vh i g h e rt h a nt h a ti np r o c h l o r o c o c c u s b e s i d e s ,w ef o u n d al o to fg e n e s h a v eu n d e r g 叫ep o s i t i v es e l e c t i o ni n t h i st w og r o u p so fc y a n o b a c t e r i a ,w h l c h h a sa 、 c l o s er e l a t i o n s h i pw i t ht h e i re n v i r o n m e n ta n de v o l u t i o n a r yp r e s s u r e s k e vw o r d s : m a r i n eu n i c e l l u l a rc y a n o b a c t e r i a , c o d o nu s a g ep a t t e m s , m u t a t l o n s e l e c t i o n ,a d a p t i v ee v o l u t i o n 7 温州医学院硕士学位论文 前言 海洋单细胞蓝藻是世界上最原始的光合自养型原核生物,是全球碳循环的主 要参与者和初级生产力的主要贡献者之一,也是海洋中主要的食物和氧气提供 者,兼具植物与细菌的一些特点。海洋单细胞蓝藻分布极广,具有漫长的进化史, 能够适应紫外辐射、高盐碱、低温等恶劣自然环境的选择性压力,除了能够进行 光合作用外,有的还有固定空气中氮的能力。他们形态各异,种类繁多,常见的 有聚球藻( s y n e c h o c o c c u ss p ) 、集胞藻( s y n e c h o c y s t i ss p ) 、原绿球藻 ( p r o c h l o r o c o c c u ss p ) 以及管孢藻( c h a m a e s i p h o n a l e s ) 中代表种类如厚皮藻 ( p l e u r o c a p s as p ) 等,但主要以原绿球藻和聚球藻为代表。海洋单细胞蓝藻广 泛应用于光合作用、细胞分化与氮的固定、碳源与氮源的利用、逆境胁迫以及分 子进化等研究领域,以及生产光合色素、氢气等有用物质和降解有机污染物、控 制蚊虫等应用领域。 原绿球藻是世界上已知细胞最小、数量最大的放氧型光合自养原核生物, 直径o 5 o 7 微米,含有叶绿素a b 、玉米黄素、q 一胡萝卜素以及少量叶绿素c 类似物。1 9 8 8 年由c h i s h o l m 等首次提出并根据其叶绿素组成,于1 9 9 2 年命名 为原绿球藻。根据其分布及生理特性的差异心1 ,可以分为高光适应型和低光适应 型两种生态类型,前者以p r o c h i o r o c o c c u sm a r i n u sm e d 4 为代表,主要分钮在大 洋的表层海水中;后者以p r o c h l o r o c o c c u sm a r i n u sm i t 9 3 1 3 为代表,主要分布 在1 0 0 2 0 0 米的深水中。“。聚球藻在生理特征和进化距离上与原绿球藻非常相 近,两者主要区别在于光合作用色素的不同,前者主要以藻胆体素进行,而后者 则以叶绿素a 和叶绿素b 完成瞄1 。聚球藻和原绿球藻一起参与了三分之二的海洋 生态系统碳固定和地球上三分之一的初级生产力1 。随着高通量基因组测序技术 的突破,目前已有1 2 个原绿球藻和1 0 个聚球藻基因组测序完成并公布了序列 ( h t t p :i m g j g i d o e g o v c g i b i n p u b m a i n c g i ? s e c t i o n = f i n d g e n o m e s & p a g e = f i n d g e n o m e s ) ,因此海洋单细胞蓝藻为我们研究适应性进化、逆境胁迫和海洋 初级生产力提供了绝佳材料,成为藻类研究的热点之一。 密码子是遗传信息表达调控过程中最关键的步骤之一,是研究基因组进化、 蛋白质功能以及遗传和环境相互作用的重要环节。自上世纪6 0 年代密码子破译 以来,一直是生物学领域研究热点。除少数物种外,大部分原核生物、病毒以及 真核生物均采用标准的遗传编码系统进行蛋白质翻译工作。由于密码子和氨基酸 在数目上的差异,出现了多个密码子编码同一个氨基酸的现象,这样的密码子就 是同义密码子。这些密码子在编码氨基酸的时候并不均衡出现,而是倾向于使用 某些特定的密码子,这就形成了密码子的偏好现象。密码子使用方式的研究对外 源基因表达量的提高、现有物种的改良、加快功能基因组学的研究、精准新基因 8 ,咛 温州医学院硕十学位论文 预测等方面都有重大意义。 同义密码子偏好现象广泛存在于原核生物和真核生物中,每一个物种都有自 己独特的密码子使用方式,而且亲缘性越近的物种,他们的使用方式也越相近。 有学者对五个不同的杨树物种进行了密码子使用偏好性研究n 1 ,发现在进化压力 ( 如突变压力,基因漂移,自然选择等) 作用下,即使亲缘性较近的物种,他们 的密码子使用偏好也发生了巨大的变化。另有学者在对果蝇的研究中发现哺,他 在密码子使用上比微生物更具有偏好性,而且在种i 日j 杂交时对密码子的选择还会 发生很大改变。密码子的研究在许多物种中都有进行,而这些在对海洋单细胞蓝 藻的研究中却依然处于空白。现在,新一代高通量测序技术为我们提供了绝佳的 机会去揭示这些近缘海洋单细胞蓝藻中的密码子使用偏好方式。 同义密码子使用偏好主要由同义突变引起。同义突变比非同义突变在基因 组范围内存在更为普遍,他直接反映了物种进化压力,见证了近缘物种在进化上 的差异以及在进化速率上的不一致。同义突变和非同义突变的比值直接体现了物 种适应性进化的压力,若非同义突变速率高于同义突变速率,则表明该物种进化 加速了,若小于同义突变速率,则表明该物种进行纯向进化,而相等表示中性进一 化。在对部分蓝藻的研究中,发现适应性进化直接导致了藻胆蛋白质的进化分歧 和原绿球藻两大类型的不同进化方向旧3 。 本论文中,我们采用比较基因组学手段对多个亲缘性较近的海洋单细胞蓝藻 进行系统的密码子使用偏好性研究和进化速率分析。我们发现,尽管原绿球藻和 聚球藻在进化距离上非常相近,但是他们的密码子使用方式已经发生了巨大变 化。原绿球藻明显偏好使用a u 结尾的密码子,而聚球藻则偏好使用g c 结尾的密 码子,并且聚球藻在最优密码子使用比重上也要明显高于原绿球藻,引起同义密 码子使用方式分歧的原因也各不相同,在原绿球藻中主要由碱基组成突变引起, 而聚球藻则更多是因为选择作用。同时,我们在对两者的进化速率分析时也发现, 他们的进化速率和面临的进化压力也不再一致。此外,我们还对两类蓝藻进行了 适应性进化分析,发现在一些与代谢调控、d n a 修复和翻译相关基因上,聚球藻 进化速率明显快于原绿球藻。 材料与方法 2 1数据来源 为了能够更加系统而全面的了解海洋单细胞蓝藻的密码子使用方式,我们搜 集了目前已经公布的1 2 个原绿球藻和1 0 个聚球藻基因组序列,这些基因组序列 全部可以在i m g 数据库内下载n 引,物种信息见下表( 表1 ) 。 9 一 温州医学院硕十学位论文 表1 海洋单细胞蓝藻基因组数据 物种 基凶组( m b )基因数个 p r o c h l o r o c o c c u sm a r l n u sm i t9 3 0 1 1 6 4 1 9 6 3 p r o c h l o r o c o c c u sm a n n u sm i t9 2 1 5 1 7 4 2 0 5 9 p r o c h l o r o c o c c u sm a r i n u sa s 9 6 0 1 1 6 71 9 8 3 p r o c h l o r o c o c c u sm a n n u sm i t9 3 1 2 1 7 11 8 5 6 p r o c h l o r o c o c c u sm a r l 。n u sm i t9 5 1 5 1 7 01 9 6 4 p r o c h l o r o c o c c u sm a n n u sp a s t o r i sc c m p l 9 8 6 1 6 6 1 7 6 5 p r o c h l o r o c o c c u sm a n n u sn 棚,2 a 1 8 41 9 4 2 p r o c h l o r o c o c c u sm a r l n u sn a r l l a 1 8 62 2 4 7 p r o c h l o r o c o c c u sm a n n u sm a r i n u sc c m p l 3 7 5 1 7 5 1 9 3 2 p r o c h l o r o c o c c u sm a n n u sm i t9 2 1 1 1 6 91 9 0 1 p r o c h l o r o c o c c u sm a r i n u sm i t9 3 1 3 2 4 12 3 3 4 p r o c h l o r o c o c c u sm a r i n u sm i t9 3 0 3 2 6 83 1 2 8 s y n e c h o c o c c u ss p w h7 8 0 32 3 72 5 8 6 s y n e c h o c o c c u ss p w h7 8 0 52 6 22 9 3 7 s y n e c h o c o c c u ss p c c 9 3 1 1 2 6 12 9 4 5 s y n e c h o c o c c u ss p w h8 1 0 2 2 4 3 2 5 8 6 s y n e c h o c o c c u ss p c c 9 9 0 22 2 32 4 0 3 s y n e c h o c o c c u ss p c c 9 6 0 52 512 7 5 6 s y n e c h o c o c c u ss p b l l0 7 2 2 8 2 5 5 5 s y n e c h o c o c c u ss p r s 9 9 1 72 5 82 8 2 2 s y n e c h o c o c c u ss p r s 9 9 1 62 6 63 0 1 0 s y n e c h o c o c c u ss p r c c 3 0 72 2 22 5 8 3 2 2 数据处理 , 从下载的2 2 个基因组序列中提取1 6 s r n a 进行进化距离分析。我们使用由美 国宾夕法尼亚大学开发的m e g a 4 1 进化树分析软件,采用距离邻接法 ( n e i g h b o r j o i n i n gm e t h o d ) 计算,并且每个分支的可靠性通过1 0 0 0 次 b o o t s t r a p 测试得到进化树。 采用o r t h o m c l 软件n 2 1 确定全部海洋单细胞蓝藻基因组中的直系同源基因 簇。直系同源基因簇( o r t h o l o g sg e n e ) 是指来自于不同物种的由垂直物种进化而 来的基因,并且这些基因依然保留着最原始基因的功能。在这样的基因簇中,每 个物种都有同样功能的基因,而且这些基因来源相同。为了能够减少样本错误, 1 0 温州医学院硕士学位论文 我们从提取的直系同源基因簇中剔除长度少于3 0 0 个核苷酸的基因,同时去除内 部含有终止密码子的基因用于后续分析。 2 3实验方法 2 3 1 多序列比对 、 首先,通过自己编写p e r 脚本保留o r t h o m c l 结果中具有“一对一”关系的 直系同源基因,一共得到l l1 3 直系同源基因簇,占蓝藻全基因组的3 5 5 8 ( 1 1 1 3 3 1 2 8 ,p r o c h l o r o c o c c u sm a r i n u sm i t9 3 0 3 ) 到6 3 0 6 ( 1 l1 3 1 7 6 5 , p r o c h l o r o c o c c u sm a r i n u sp a s t o r i sc c m p l 9 8 6 ) 。 a ) 使用c a t 命令对所有2 2 个海洋单细胞蓝藻基因组进行整合,形成一个 含有2 2 个蓝藻基因组的大文件,用于后续工作的基因提取。氨基酸序 、列工作与此类似。 b ) 产生l l l 3 个具有直系同源关系的独立基因簇和蛋白簇,每个文件中仅 含2 2 个序列,一个物种一条对应序列。 o p e ni n l ,”a 1 1 n u c ”ii ”$ ! ”: l o c a l $ = : w h i l e ( ) c h o m p : i f ( w + :( s + ) ,l c ? n ( :l :) s ) i f ( w + :( s w ) d ( 一d + ) 木? n ( 水) s ) $ t m p n a m e = s 1 $ 2 ; $ h a s h a ll _ s e q $ t m p n a m e - $ 3 : ) e l s e $ h a s h a ll _ s e q $ 1 ) _ $ 2 : ) e l s i f ( d + s ( a z s + ) 木? n ( 术) s ) $ h a s h a l l _ s e q $ 1 ) = $ 2 : 温州医学院硕上学位论文 ) c l o s ei n l : f o r ( $ i = l :$ j : o p e no u t ,” $ i n u c ”ii ”$ ! ”: w h il e ( ) c h o m p : i f ( w + ? 一( s + ) n ( 木) s ) p r i n to u t ” $ 1 n $ h a s h a l l s e q $ 1 n ”: ) ) c l o s eo u t : c l o s ei n 2 : c ) 用c l u s t a l w 程序n 踟对1 1 1 3 个氨基酸序列集进行多序列比对,参数都采 用默认。将同源基因簇序列以其相应的氨基酸序列空位方式比对,该步 骤由p e r l 脚本调用e m b o s s 工具包n 钔完成。这样我们就得到了所有比对 好的同源基因簇。 c l u s t a l w 在l i n u x 下运行,“c l u s t a l w i n f i l e = $ i p r o s e q u e n c e o u t p u t = f a s t a - o u t o r d e r = i n p u t ”,其他参数均采用默认,这样我们就 完成了对氨基酸序列的比对。然后调用e m b o s s 工具包中t r a n a l i g n 程 序,运行“t r a n a li g n a s e q u e n c e $ i d n a b s e q u e n c e $ i p r o f a s t a o u t s e q $ i d n a f a s t a 对其相应的基因序列进行比对。至此,得到 1 l1 3 个比对完成的同源基因和氨基酸序列文件。 d ) 对直系同源基因进行密码子指标计算和d 耐s 计算,以及后续进行蛋白质 适应性进化分析。 1 2 温州医学院硕上学位论文 2 3 2 密码子使用分析指标 在进行密码子使用偏好性分析时,需要引入一些量化指标。这罩介绍一些比 较有用的以及本文采用的密码子量化指标。 1 ) 相对密码子使用频率( r e l a t i v es y n o n y m o u s c o d o nu s a g e ,r s c u ) 。 该指标最早由s h a r p n 5 1 6 1 等人在1 9 8 6 年提出,是衡量密码子使用偏好最为 直接的指标,可以排除氨基酸序列组成对密码子偏好性观察的影响。r s c u 是以 某一密码子使用次数的观察值为分子,以该密码子所有同义密码子出现次数的平 均值为分母。 r s c 矾- ,z f 竺 x o b s i j 么一 一 j 暑l 公式中o b s u 是指编码氨基酸某一密码子的出现次数,分母是编码该氨基酸 所有同义密码子出现次数总值。n ;是编码该氨基酸的同义密码子种类,其数值范 围为l 6 。从公式中我们可以发现,r s c u 取值越大则表示密码子偏好性越强,反 之,则偏好性弱,大于1 值时,即表示该同义密码子在编码氨基酸时超过了预期 频率,属于经常使用的密码子;0 0 5 r s c u = i ,表示该同义密码子在编码氨基酸 时低于预期频率;而r s c u = o 0 5 ,则表示这类密码子为稀有密码子6 1 7 1 。 2 ) 密码子适应指数( c o d o na d a p t a ti o ni n d e x 。c a i ) 密码子适应指数是基于r s c u 而提出的,通过对r s c u 的计算得到,最早由 s h a r p 和l i 在1 9 8 7 n 明年提出的。c a i 是指对于某一个基因编码序列,实际编码 该蛋白的所有密码子对于完全使用最优密码子编码该蛋白的情况下的适应性指 数,通过计算实际使用的密码子与其对应的最优密码子的r s c u 值的几何平均数 比值所得。公式表示为: c a :c a i o b , : 甜 r s c u 。是指在基因中第k 个密码子所对应的r s c u 值,r s c u 蛔,是指在基因序列 中该密码子编码的氨基酸所对应的r s c u 最大值,l 则表示该基因所包含的密码 子数( 包括终止密码子) 。 c a i 取值从o 1 ,值越大,说明密码子偏好程度越大,等于1 时,密码子偏 温州医学院硕士学位论文 好性达到最大程度,即所有氨基酸都是由最优密码子编码,反之亦然。c a i 值一 般用来预测种内基因的表达水平,目前发现对于单细胞生物比较适用,而并不能 用于表示哺乳动物基因表达水平。该指标的计算和基因表达水平呈正相关
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电动车经销协议5篇
- 2025年区块链行业技术发展与应用前景研究报告
- 商场安全办主任培训内容课件
- 2025年电影产业全球市场格局与发展前景分析报告
- 2025年旅游行业全球旅游市场分析及前景展望报告
- 2025年汽车行业自动驾驶技术应用前景展望研究报告
- 2025年网络安全技术在智能家居设备中的应用前景研究报告
- 宜宾市2025四川宜宾高新区综合服务中心第一次招聘雇员6人笔试历年参考题库附带答案详解
- 商圈安全培训资料内容课件
- 国家事业单位招聘2025中国药学会招聘2人笔试历年参考题库附带答案详解
- 产品开发生产合同8篇
- 篮球场围网施工方案
- 盘柜安装施工方案
- 中医面瘫护理个案汇报
- 《水基路用聚合物稳定碎石基层技术规程》
- 快递柜租赁合同
- 产品研发流程管理指南
- 《车刀与切削原理》课件
- 2024高考物理全国二卷
- 2024-2030年中国猎头公司市场发展前景调研及投资战略分析报告
- 注塑检验员培训
评论
0/150
提交评论