(生物物理学专业论文)应用多样性增量方法识别人类基因组microrna前体序列.pdf_第1页
(生物物理学专业论文)应用多样性增量方法识别人类基因组microrna前体序列.pdf_第2页
(生物物理学专业论文)应用多样性增量方法识别人类基因组microrna前体序列.pdf_第3页
(生物物理学专业论文)应用多样性增量方法识别人类基因组microrna前体序列.pdf_第4页
(生物物理学专业论文)应用多样性增量方法识别人类基因组microrna前体序列.pdf_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本人声明:所呈交的学位论文是本人在导师的指导下进行的研究工作及取得的研究成果。除本文已 经注明引用的内容外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得凼墓直太堂及 其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中 作了明确的说明并表示谢意。 学位论文作者签名:边l 量 日期:趁! ! :互:2 塞 指导教师签名:遂受li 美 日期:塑! 里! 茎! 蛰 在学期问研究成果使用承诺书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:内蒙古大学有权将学位论文的全 部内容或部分保留并向国家有关机构、部门送交学位论文的复印件和磁盘,允许编入有关数据库进行检索, 也可以采用影印、缩印或其他复制手段保存、汇编学位论文。为保护学院和导师的知识产权,作者在学期 间取得的研究成果属于内蒙古大学。作者今后使用涉及在学期间主要研究内容或研究成果,须征得内蒙古 大学就读期间导师的同意;若用于发表论文,版权单位必须署名为内蒙古大学方可投稿或公开发表。 学位论文作者签名: i 虱盏垒 日期: 巡! 生:妄:至垒 指导教师签名:遂堑l ! 基 日期:丝! 殳! s ,羔墨 内蒙古大学硕士学位论文应用多样性增量方法识别人类基因组m i c r o r n a 前体序列 应用多样性增量方法识别人类基因组m i c r o r n a 前体序列 摘要 m i c r o r n a 是一类约为2 1 2 6 个碱基长度的非编码单链r n a 。m i c r o r n a 在细 胞生长和发育的过程中起着多种调节作用,参与生命过程中一系列的重要进程, 包括发育、造血、器官形成、凋亡、细胞增殖、甚至肿瘤发生。m i c r o r n a 对癌 症、心脏病、艾滋病等各种疾病都有一定的影响。 根据最近研究显示,r n a 最初转录物( p r i r n a ) 分子经过r n a s ei i ld r o s h a 剪切,成为7 0 9 0 个碱基大小、具有发夹结构的m i c r o r n a 的前体 ( p r e - m i c r o r n a ) ,再由e x p o n i n 5 将p r e m i c r o r n a 从细胞核运输到细胞质中,经 d i c e r 酶加工生成m i c r o r n a 。p r e m i c r o r n a 最显著的特点就是具有发夹结构。 p r e m i c r o r n a 特殊的发夹结构不仅能够使p r e m i c r o r n a 与e x p o r t i n - 5 结合从而 输出到细胞质,而且还是其与d i c e r 酶作用的必要结构。这两点就使得发夹结构 对于m i c r o r n a 和p r e m i c r o r n a 都非常重要。 根据m i c r o r n a s 前体序列的碱基保守特征和二级结构特征,应用多样性增 量方法( i d 方法) 和支持向量机( s v m ) 分析,以内含子 又( i n t r o n ) 、外显子区( e x o n ) 、 基因间区( i n t e 唱e n i c ) 三类序列分别作为负集,对人类的p r e m i r n a s 进行分析和预 测。当以i n t e r g e n i c 区并l i n t r o n 区序列为训练负集时,其以二级结构三联体、四联 内蒙古大学硕士学位论文应用多样性增量方法识别人类基因组m i c r o r n a 前体序列 体和五联体( 3 m e r 、4 - m c r 、5 - m e r ) 为特征参量的敏感性、特异性、整体精度都在 8 9 以上,相关系数在0 7 以上。 关键词:p r c m i r n a s ,多样性增量,二级结构特征 i l 内蒙古大学硕士学位论文 应用多样性增量方法识别人类基因组m i c r o r n a 前体序列 i d e n t i f i c a t i o no fm i c r o r n ap r e c u r s o r so ft h e h u m a ng e n o m es e q u e n c eu s i n gi n c r e m e n to f d i v e r s i t ya p p r o a c h a b s t r a c t m i c r o r n a ,an o n - c o d i n gs i n g l e - s t r a n d e dr n a ,w i t ht h el e n g t ho f21 - 2 6b p , c o u l d p a r t i c i p a t ei nas e r i e so fi m p o r t a n tl i f ep r o c e s s e s ,s u c ha sd e v e l o p m e n t , h e m a t o p o i e s i s ,o r g a n o g e n e s i s ,a p o p t o s i s ,c e l lp r o l i f e r a t i o n ,a n d e v e nt u m o r s m i c r o r n ah a si m p o r t a n ti n f l u e n c e sf r o mc a n c e r , h e a r td i s e a s e ,a i d st ov a r i o u so f d i s e a s e s a c c o r d i n gt or e c e n tr e s e a r c h ,r n ai n i t i a lt r a n s c r i p t ( p r i - r n a ) m o l e c u l e sa r ec u t i n t ot h em i c r o r n ap r e c u r s o r ( p r e m i c r o r n a ,a b o u t7 0 9 0b a s e sw i t hh a i r p i n ) b y t h er n a s ei i id r o s h a t h ep r e - m i c r o r n aw i l lb et r a n s i tf r o mt h en u c l e u st ot h e c y t o p l a s mb yt h ee x p o r t i n 一5 ,t h e np r o c e s s e di n t om i c r o r n ab yd i c e re n z y m e t h e m o s ts i g n i f i c a n tf e a t u r eo f p r e - m i c r o r n a i st h eh a i r p i ns t r u c t u r e t h es p e c i a lh a i r p i n s t r u c t u r ei st h en e c e s s a r ys t r u c t u r eo fp r e - m i c r o r n ab i n d i n gw i t he x p o r t i n - - 5a n d d i c e re n z y m e t h e s et w op o i n t sm a k eh a i r p i ns t r u c t u r ev e r yi m p o r t a n tf o rt h e m i c r o r n aa n dp r e - m i c r o r n a i i i 内蒙古大学硕士学位论文 应用多样性增量方法识别人类基因组m i c r o r n a 前体序列 b a s e do nt h ec o n s e r v a t i o na n ds e c o n d a r ys t r u c t u r a lc h a r a c t e r i s t i co fm i c r o r n a s p r e c u r s o rs e q u e n c e s ( p r e m i r n a s ) ,t h em e t h o do fi n c r e m e n to fd i v e r s i t y ( i d m e t h o d s ) a n ds u p p o r t v e c t o rm a c h i n e ( s v m ) w a sa p p l i e dt o a n a l y s i s a n d c l a s s i f i c a t i o no fh u m a np r e m i r n a s u s i n gt h ec h a r a c t e r i s t i cp a r a m e t e r so ft h e n u m b e ro f3 - m e r , 4 - m e t , 5 - m e r , m i c r o r n a sp r e c u r s o rs e q u e n c e sw e r ei d e n t i f i e d f r o mn e g a t i v es e q u e n c e st h a th a v et h es t e m - l o o ps t r u c t u r e ,s e p a r a t e l yi ni n t r o n ,e x o n a n di n t e r g e n i cr e g i o n t h es e n s i t i v i t y 、o v e r a l la c c u r a c ya n ds p e c i f i c i t yw e r em o r e t h a n8 9 t h ec o r r e l a t i o nc o e f f i c i e n t sw e r e0 7u p w a r d s k e yw o r d s :p r e m i r n a s ,i n c r e m e n to fd i v e r s i t y ,h a i r p i ns t r u c t u r a lc h a r a c t e r i s t i c i v 内蒙吉大学硕士学位论文应用多样性增量方法识别人类基因组m i c r o r n a 前体序列 目录 第一章绪论l 1 1 研究课题的背景一1 1 2m i c r o r n a 的生物学背景和生物学知识2 1 2 1m i c r o r n a 的发现2 1 2 2 m i c r o r n a 的合成机制一3 1 2 3m i c r o r n a 的生物学特性5 1 2 4m i c r o r n a 的作用机制7 1 2 5 m i c r o r n a 与s i r n a 8 1 2 6m i c r o r n a 的功能l o 1 2 7m i c r o r n a 与肿瘤1 1 1 3m i c r o r n a 的研究方法1 2 1 3 1m i c r o r n a 的生物信息学分析1 2 1 3 2 m i c r o r n a 靶标的生物信息学分析1 4 第二章理论预测模型与评价1 6 2 1多样性和多样性增量1 6 2 1 1多样性1 6 2 1 2 多样性增量1 7 2 2 支持向量机18 2 3 预测结果的评价2 0 第三章人类基因组中p r e m i c r o r n a 序列的预测一2 1 3 1数据库2 1 3 2参数定义2 3 3 3 结果2 3 3 4 讨论2 5 内蒙古大学硕士学位论文 应用多样性增量方法识别人类基因组m i c r o r n a 前体序列 3 5 展望一i 2 6 参考文献2 7 致谢3 3 攻读硕士学位期间发表的学术论文3 4 内蒙古大学硕士学位论文应用多样性增量方法识别人类基因组m i c r o r n a 前体序列 1 1 研究课题的背景 第一章绪论 2 0 0 1 年人类基因组草图的绘制完成标志着生命科学研究进入了后基因组时代,研究的重 点从获取静态的d n a 图谱转为对基因表达调控的研究。在人类基因组测序之初,研究人员 估计人类基因组包括了约十万个编码蛋白质的基因。然而人类基因组测序完成后,却仅能找 到约2 5 万个蛋白编码基因,不仅在数量上与小鼠基因相近,而且序列上也有近9 9 都是相 同的。相比之下就连低等的线虫和果蝇也分别具有约1 9 万和1 5 万个蛋白编码基因,而且其 中的大部分与人类基因高度相似。显然,蛋白质编码基因的数量并不能反映生物体的复杂程 度。随着研究的深入,人们逐渐认识到在物种迸化的过程中,调控机制的演变起到决定性作 用。 , 基因表达是d n a 通过转录形成r n a ,r n a 翻译形成蛋白质的过程。在传统的认识中, r n a 被认为仅是d n a 到蛋白质之间的一个信息传递者而受到相对冷落。然而人类基因组测 序结果表明,整个人类基因组中只有不足2 的序列用于编码蛋白质。早期的观点认为这些 非编码的区域绝大部分都是进化上遗留下来的垃圾( j u n k ) 序列。但随着实验手段的进步和 研究成果的不断积累,越来越多的证据表明这些非编码的区域同样具有重要功能。2 0 0 5 年, a f f y m e t r i x 公司利用嵌合芯片( t i l i n ga r r a y ) 对人类的十条染色体研究后发现,基因组中5 0 以上的区域都存在初级转录产物。而最近完成的e n c o d e 探索计划更是表明基因组上超过 9 0 的区域都能被转录【2 】。这些初级转录产物大部分都不参与编码蛋白质,在进化上相对不太 保守。人们将这类不编码蛋白质的r n a 统称为非编码r n a ( n o n c o d i n gr n a ,n c r n a ) 。其 中小的非编码r n a ( s m a l li a ) 尤其受到关注。小r n a 通常指那些长度仅有几十个碱基的 r n a 分子,包括m i c r o r n a ,s i r n a 和p i r n a 等。研究表明,这些小r n a 分子在基因表达 调控过程中扮演着重要角色。在过去的7 年中,( ( s c i e n c e ) ) 杂志曾5 次将该领域的研究评选为 全球年度十大科学进展之一。而2 0 0 6 年的诺贝尔医学和生理学奖也授予了美国科学家法尔和 内蒙古大学硕士学位论文应用多样性增量方法识别人类基因组m i c i ! o r n a 前体序列 梅洛,以表彰他们在研究r n a 干扰( r n 赴) 机制方面做出的贡献。 m i c r o r n a 是一类长度为大约2 2 n t 的内源性非编码r n a 基因,它通过序列互补配对的方 式对靶标m r n a 的表达进行调控。由于m i c r o r n a 很小,而且往往只在特殊的组织和时间表 达,所以在很长的时间里它都一直没有被人发现,因而曾有人将它比喻为生命体里的“暗物 质”。直到1 9 9 3 年l e e 等才在秀丽隐杆线虫( c a e n o r h a b d i t i se l e g a n s ) 中找到了第一个m i c r o r n a 基因l i l l 4 【3 】。然而,m i c r o r n a 虽小,其作用却不小。研究表明m i c r o r n a 参与了一系列的重 要的生命过程,包括发育进程,造血过程,器官形成,细胞凋亡,细胞增殖,并且与肿瘤等 绳 多种疾病的发生密切相关【4 1 。近年来m i c r o r n a 领域的研究取了巨大进展,到目前为止已经 有数千个m i c r o r n a 基因在包括动物、植物和病毒在内的众多物种中被发现,并且其数目还 在快速不断地增长。m i c r o r n a 的研究目前已经成为生物学领域新的研究热点。 对m i c r o r n a 的研究有着重要意义,一方面m i c r o r n a 在细胞中起着重要调控作用,而 与其相关的外源s i r n a 和r n a 干涉技术由于具有相对简单、高效和特异等特点成为未来基 因药物设计中的首选,因此了解其作用机理和功能对生物学研究与疾病治疗都有着重大意义。 另一方面,对m i c r o r n a 的研究热潮极大地推动了人们对基因组非编码区的研究,大量新的 非编码r n a 基因被相继报道,有迹象表明n c r n a 基因的数量和功能远比我们想象的要多的 岁5 6 1 。这些发现使得我们有必要重新审视r n a 在生命体中的地位,它们有可能会改变我们 对整个生命活动的认识。因此,本论文选择了m i c r o r n a 作为我们的研究对象。 在下面的两个小节中,我们首先将简要介绍m i c r o r n a 相关的生物学背景知识,然后对 m i c r o r n a 研究领域的现状和存在的问题进行简要的综述。 1 2m i c r o r n a 的生物学背景和生物学知识 1 2 1m i c r o r n a 的发现 m i c r o r n a 最早在线虫中被发现。19 9 3 年,l e e t 3 】等人在对秀丽新小杆线虫( c e l e g a n s ) :突 变体进行遗传分析中发现了一种控制细胞发育时序的长度约为2 2 n t 的l i n 一4r n a ,它只在线 虫发育的第一期( l 1 期) 和第二期( l 2 期) 大量表达,它通过碱基配对的方式结合到靶标m r n a 1 i n - 4 的3 非翻译区( 3 u n t r a n s l a t e dr e g i o n ,3 一u t r ) 抑制l i n 一4 的翻译,却不影响其转录,短暂下 2 内蒙古大学硕士学位论文应用多样性增量方法识别人类基因组m i c r o r n a 前体序列 调l i n 一4 蛋白质的表达水平,使线虫由l l 期向l 2 期转化。另外,l i n 一4 还抑制l i n 一2 8 基因的 翻译,l i n 2 8 基因编码一个冷休克域蛋白,它介导线虫从l 2 期到l 3 期的发育转变。l i l l 4 基 因发生突变会引起线虫发育的延迟,表现为幼虫发育停滞在l 1 期,不向l 2 期过渡。之后, 人们又筛选到一个表型完全相反的突变体l i n 1 4 ,此突变体表现为线虫幼虫时期细胞系早熟, 直接进入到l 2 期,并且在很大程度上保持着l 2 期细胞的特性【7 】。l i n 一4 及其特异靶标翻译抑 制功能的发现,表明在发育过程中存在基因表达调控的新机制。为什么一个只有2 i n t 的r n a 分子起着如此重要的调节作用? 当时人们无法理解这种稀少的个别现象。但是,2 0 0 0 年第二 个m i c r o r n al e t 7 及其人类和果蝇中同源物的发现改变了人们的看法。m i c r o r n a 可能是一 类进化上保守的、在生命中起着重要调控作用的分子。它们能有效地抑制相关蛋白质的合成, 导致靶标m r n a 的降解,或者其它形式的调节机制来抑制靶标基因的表达,产生基因沉默。 近年来的发现表明,m i c r o r n a 可能在基因表达调控过程中起着非常重要的作用,m i c r o r n a 的序列特征、结构差异和作用方式的差异,使其可能作为蛋白质编码m r n a 的重要调节因子。 1 2 2m i c r o r n a 的合成机制 在动物中,成熟m i c r o r n a 的形成主要经历了以下三个阶段:首先,编码m i c r o r n a 的 基因转录成初始转录物p r i m i c r o r n a 。之后,p r i m i c r o r n a 在细胞核中被r n a 聚合酶i i i d r o s h a 切割成7 0 个核昔酸左右,具有茎环结构的p r e m i c r o r n a 。其次,切割后的p r e m i c r o r n a 被转运蛋白e x p o r t i n 一5 由细胞核转运到细胞质中。最后,由另一种r n a 聚合酶i i i d i c e r 将 p r e m i c r o r n a 切割成m i c r o r n a :m i c r o r n a * z 聚体【8 】。此后,r n a 解旋酶作用于此二聚体, 使之解旋。成熟的m i c r o r n a 与其他蛋白共同组成r n a 诱导的沉默复合体( g n a i n d u c e d s i l e n c i n gc o m p l e x ,e d s c ) 发挥作用,而m i c r o r n a * 贝, l j 被降解。如图1 1 所示。 已知的m i c r o r n a 基因多数位于基因间区,这些m i c r o r n a 基因与蛋白质基因相距较远, 可能拥有自己独立的启动子进行转录。对于有些成簇分布的m i c r o r n a 基因,则通常以共同 的启动子转录成多顺反子【9 1 。另外,也有一些m i c r o r n a 基因位于编码基因的内含子区,这 些m i c r o r n a 基因的多数与内含子转录方向相同,说明他们可能先与寄主基因共同转录,然 后再从蛋白质内含子中剪切出来。目前,对于m i c r o r n a 基因如何转录成p r i m i c r o r n a 的具 体机制还了解甚少,但研究发现m i c r o r n a 基因的转录主要是由r n a 聚合酶来完成的【1 0 1 。 对l e t 一7 的研究发现,其p r i m i c r o r n a 具有5 帽和3 尾,这正是聚合酶i i 合成产物的特点【】。 内蒙古大学硕士学位论文应用多样性增量方法识别人类基因组m i c r o r n a 前体序列 但有证据表明,r n a 聚合酶i 也有可能参与了m i c r o r n a 基因的转录过程【1 2 】。 基凶沉默 图1 1m i c r o r n a 的加工成熟过程 f i g 1 1m i e r o r n ab i o g e n e s i sp a t h w a y 从p r i m i c r o r n a 到p r e m i c r o r n a 的加工是由核糖核酸酶i i i ( r n a s e l l i ) d r o s h a 来指导完 成的。d r o s h a 包含一个脯氨酸富集区,一个精氨酸一丝氨酸富集区,两个核糖核酸酶i i i 结构 域及一个双链砌峪( d s m 妊) 结合域【1 3 】。两个核糖核酸酶i 结构域可形成分子内的二聚体,分 别负责5 部分和3 部分的切割。d r o s h a 不是单独发挥作用,它能与其他蛋白一起形成多蛋白 复合体来共同促使p r i m i c r o r n a 到p r e m i c r o r n a 的切割。例如,在果蝇、线虫和一些哺乳 动物的多蛋白复合体中,存在一种双链的r n a 结合蛋白一p a s h a ( p a r t n e r o f d r o s h a ) 。研究表明, 抑制p a s h a 的表达将会干扰p r e - m i c r o r n a 的合成,细胞核内p r i m i c r o r n a 的量将增加,而 成熟m i c r o r n a 的数量将会减少【1 4 】。在人类中,存在d g c r8 ( t h ed i g e o r g es y n d r o m ec r i t i c a l r e g i o ng e n e8 ) 与d r o s h a 共同参与p r i m i c r o r n a 的成熟。实验表明,d g c r8 的敲除将会引 起p r i m i c r o r n a 的积累,p r e m i c r o r n a 和成熟m i c r o r n a 的量则相应减少。剪切后形成的 p r e m i c r o r n a 具有茎环结构,且3 末端有2 碱基的突出( 核糖核酸酶i 作用的主要特征) 。 在d r o s h a 等作用下产生的p r e m i c r o r n a 需要输出到细胞质中才能被d i c e r 加工成为 m i c r o r n a 双链。这一过程是由r a n g t p e x p o r t i n 5 转运机制来完成的f 8 】。在细胞核中,r a n g t p 浓度较高,这样依赖于r a n g t p 的e x p o r t i n 一5 就可以将p r e m i c r o r n a 从细胞核转运到细胞质 中。到了细胞质中,r a n g t p 转变为r a n g d p ,p r e m i c r o r n a 则被释放。 在细胞质中,对p r e m i c r o r n a 的加工是由d i c e r 来完成的。d i c e r 酶包含一个r n a 解旋 酶结构域,一个d u f 2 8 3 结构域,一个p a z ( p i w i a r g o n a u t e z w i ll e ) 结构域,两个相继的r n a s e i i i 结合域和一个d s r n a 结合域。其中的p a z 结构域可识别d r o s h a 剪切产物的末端一5 端磷酸 4 内蒙古大学硕士学位论文应用多样性增量方法识别人类基因组m i c r o r n a 前体序列 化及3 端突出( 1 5 1 ,而两个相继的r n a s e i i i 结构域可完成对双链的有效切割。d i c e r 在茎环的基 部对双链进行切割,形成了5 端磷酸化,3 端有突出的m i c r o r n a :m i c r o r n a * 双链结构。 在m i c r o r n a :m i c r o r n a * 双螺旋结构中,只有一条单链可以进入r i s c 中,另一条单链 则被降解。选择哪一条单链进入r i s c 中,是由单链的稳定性决定的。一般而言,m i c r o r n a 这条单链由于5 端有未配对的小突起而变得不稳定,所以倾向于选择m i c r o r n a 进入r i s c 中,m i c r o r n a * 将被降解1 6 , 1 7 】。 植物m i c r o r n a 的成熟过程与动物有所不同。在植物中没有检测到d r o s h a 的同源物。对 拟南芥m i r - 1 6 3 的研究揭示,m i c r o r n a 的成熟过程与d c l l 有关。m i r 一1 6 3 的形成至少经历 了三个步骤:首先,由p r i m i c r o r n a 切割得到长的m i r 1 6 3 的前体;其次,由长的m i r 一1 6 3 的前体得到短的m i r 1 6 3 的前体;最后,由短的m i r 1 6 3 的前体切割得到成熟的m i r - 1 6 3 。 突变实验显示,d c l l 至少参与了第一步和第二步切割反应。拟南芥中存在四种类似于 d i c e r ( d i c e r - l i k e ) 的酶d c l l ,d c l 2 ,d c l 3 ,d c l 4 。其中d c l l 与m i c r o r n a 的成熟相关, d c l 2 和d c l 3 与s i r n a 相关。d c l l 是r n a s e l i i 超家族成员之一,具有d r o s h a 和d i c e r 的双 重特性,其可能参与了植物m i c r o r n a 成熟的全过程【1 8 】。另外,由于d c l l 蛋白含有两条核 定位信号序列,所以植物m i c r o r n a 的成熟是在细胞核中完成的。在核内产生的m i c r o r n a : m i c r o r n a * 双链由e x p o r t i n 5 的同源体h a s t y 负责转运出核1 9 2 0 1 ,最终进入r i s c 来行使其 功能。 1 2 3m i c r o r n a 的生物学特性 1 、保守性 m i c r o r n a 在进化过程中是保守的。在c e l e g a n s 中,已经鉴定出8 8 种m i c r o r n a 基因, 这些m i c r o r n a 基因从属于4 8 个m i c r o r n a 基因家族,其中有8 6 个m i c r o r n a 基因( 从属于 4 6 个基因家) 。在c b r i g g s a e 中有同源体,占c e l e g a n sm i c r o r n a 基因的9 7 以上。同样在这 4 8 个基因家中又有2 2 个家族( 包含了3 3 个c e l e g a n s 的m i c r o r n a 基因) 。在人类中有同源体, 即在己鉴定的c e l e g a n s 的m i c r o r n a 基因中,至少有1 3 在人类和其他脊椎动物中保守【8 】。 l e t 7 基因虽在线虫中发现,却广泛存在于关系较远的动物中,包括从节肢动物到脊椎动物。 且l e t 7 的时序调控也是保守的,除在线虫和果蝇的幼虫末期表达外,还在斑马鱼受精后4 8 小时间表达,另外在环节动物和软体动物的成虫阶段也有表达【2 们。另外,在已知的鼠和人类 5 内蒙古大学硕士学位论文应用多样性增量方法识别人类基因组m i c r o r n h 前体序列 的m i c r o r n a 中,有5 3 与f u g um b r i p e s 或d a n i or e d o 同源,而在f u g ur u b r i p e s 或d a n i or e r i o 中又大约有一半与c a e n o r h a b d i t i s ee l e g a n s 或d r o s o p h i l am e l a n o g a s t e r 同源。m i c r o r n a 的保守 性具有重要的生物学意义,它提示在各种生物的发育过程中m i c r o r n a 可能具有相同的调控 机制。 2 、基因簇集现象 许多m i c r o r n a 并不是分散分布的,多个m i c r o r n a 基因可以聚集在一个基因簇中,这 意味着它们是以多顺反子的形式转录出原初转录本,再通过内切核酸酶加工产生成熟的 m i c r o r n a 基因:果蝇中普遍存在基因簇集现象,其中最大的基因簇聚集在同一d n a 的1 k b 的片断之内,包括了7 个m i c r o r n a 基因,它们没有明显的序列同源性,但功能上是相关的, 并表现共表达的特点【2 1 2 2 ,2 3 1 。线虫中,m i r - 3 5 - m i r - 4 1 的基因簇转录成一条r n a 前体链,进而 被加工成m i r 3 5 - m i r 一4 1 2 4 1 。在人类基因组中,1 9 号染色体上有5 4 个m i c r o r n a 基因组成 一个基因簇,且只在胎盘中表达;在x 染色体上也有1 0 个m i c r o r n a 聚集成簇,且只在睾 丸中表达【2 5 l 。另外,有些m i c r o r n a 基因位于基因组的其他基因簇中。例如,m i r - 1 9 6 存在 于哺乳类同源异型框( h o m e o b o x ,h o x ) 基因簇h o xa 、h o x b 、h o xc 中,推测这些h o x 基因很可能就是m i r 一1 9 6 的靶。m i r - 1 0 位于昆虫的a n t e n n a p e d i a 复合体中,在哺乳动物两个 h o x 簇的同源位置也发现有m i r - 1 0 的存在。根据h o x 簇中其他基因的作用,推测h o x m i c r o r n a 可能具有相应的调节发育的功能【4 】。 图1 2m i c r o r n a 的基因簇结构 f i g 1 2c l u s t e rs t r u c t u r e o fm i c r o r n ag e n e 6 内蒙古大学硕士学位论文应用多样性增量方法识别人类基因组m i c r o r n a 前体序列 3 、时空特异性表达 m i c r o r n a 具有在时间上和组织中特异表达的性质。目前,研究的比较清楚的l i l l - 4 和l c t 一7 就均呈时间特异性表达。其中,l i n 4 在线虫幼虫的第一期和第二期存在;而l e t 7 在幼虫第三 期,第四期及成虫期存在。m i c r o r n a 的表达还呈现出组织特异性。有研究者对干细胞和已 经分化的细胞进行了鉴定,发现有些m i c r o r n a 是干细胞所特有的,如在小鼠干细胞中特异 表达的m i r - 2 9 0 - - m i r 2 9 5 及在人干细胞中特异表达的m i r 3 7 1 、 m i r 3 7 3 2 6 1 等。由于这些 m i c r o r n a 在干细胞中特异表达,所以推测他们是维持细胞全能性所必需的并且参与了细胞 的分化过程。而有些m i c r o r n a 只在分化后的细胞中才能检测到,则可能与维持分化后细胞 的功能有关。植物中的m i c r o r n a 亦呈现出时序特异性。m i r - 1 5 7 在树苗中表达量最高,而 m i r - 1 7 1 在花期表达量最高,这暗示着他们可能在这些阶段或组织中对发育进行调节【2 7 1 。另 外,同一m i c r o r n a 在不同生物中时序特异性和组织特异性存在差异。m i r 1 在小鼠胚胎中 具有阶段特异性,而在人类中却具有组织特异性,它仅在人类的心肌细胞中表达,这表明 m i c r o r n a 具有极其复杂的功能。 1 2 4 m i c r o r n a 的作用机制 m i c r o r n a 能够通过两种沉默机制中的一种指导r i s c 下调目的基因的表达:m r n a 的切 割或翻译抑制。如果m r n a 与m i c r o r n a 具有完美的互补性,m i c r o r n a 就指导m r n a 特异性 切割,或者如果两者没有足够的互补性,贝j j m i c r o r n a 就指导翻译抑制。 大多数植物m i c r o r n a 与靶序列的开放阅读框( o r f ) 完全匹配,因而在植物中,m i c r o r n a 主要进入r n a 干涉途径以降解靶分子【2 引。植物中的r i s c 是a r g o n a u t e ( a g o ) 蛋白、 m i c r o r n a 或s i r n a 及相关蛋白组成。a g o 蛋白具有与d i c e r 酶一样的p a z 结构域以及p i w i 结 构域。p i w i 结构域具有与r n a s eh 类似的结构。据报道,m i c r o r n a 的3 末端位于p a z 结构域 的亲水性结构域内,而靶分子位于p i w i 结构域中,两者识别互补之后,r n a 酶水解作用于靶 分子中与m i c r o r n a 的第1 1 或第1 2 碱基所对应的残基的磷酸键,随后降解靶分子的5 端序列。 因而当m i c r o r n a 指导切割时,切点的位置是由相关的m i c r o r n a 的残基所决定,即从配对 区的中部向m r n a 的5 方向切割【2 9 3 们。在植物中,两者完全匹配在大多数情况下是引起切割, 但是有时并非如此,m i r 一1 7 2 与m i r 1 7 2 样基因与靶分子完全匹配却产生翻译抑制。研究人员 发现,经过切割之后,靶分子上与m i c r o r n a 匹配位点相邻的序列会产生内源性的s i r n a ,以 7 内蒙古大学硕士学位论文应用多样性增量方法识别人类基因组m i c r o r n 前体序列 增强沉默效应【3 0 】。m i c r o r n a 切割之后,m r n a 仍然是完整的,而且能够指导另外的m r n a 的 识别和切割。 通常动物m i c r o r n a 与靶m r n a 的3 - u t r 部分序列反向互补结合。与r n a i 不同的是,靶 m r n a 的稳定性不受影响,而其翻译起始后的表达受到影响。这种新的调控机制首次在线虫 的l i l l 一1 4m r n a 得到证实,l i n 一1 4m r n a 受l i n - 4m i c r o r n a 的调控。m i c r o r n a 可能抑制翻译 的延伸或终止,或降解核糖体新合成的新生肽链。然而简单地影响翻译延伸是不可能的,因 为未受到抑制的多核糖体的形态与由m i c r o r n a 抑制的靶m r n a 的多核糖体的形态是相同 的。当l i n 1 4 蛋白水平下降时,难以区分处于线虫幼虫第一阶段和幼虫后期阶段的l i n 一1 4m r n a 的多核糖体外型【2 9 1 。具体的调控机制目前还不是很清楚,有待于科学家进一步研究。多数 m i c r o r n a 是以m i r n p 形式与靶m r n a 结合并使之抑制。最近研究人员发现,处于不稳定状态 的m r n a 的3 一u t r 中的富含a u 元件( 伽迎s ) 能够指导m r n a 的降解。参与m i c r o r n a j j i 工和功 能行使的蛋白,巳p d i c e r l ,a 9 0 1 和a 9 0 2 是肿瘤坏死因子m r n a 快速降解所必需的,该m r n a 含有a r e s 元件。人的m i r 1 6 具有与a r e s 互补的u a a a u a u u 序列,它使得具有a r e s 的r n a 易于降解【2 8 】。 线虫l i n 1 4 的3 u t r 具有与l i n 4m i c r o r n a 的5 区域互补的核心区域,这说明多细胞动物 m i c r o r n a 5 端互补的重要性。这可从以下事实得到支持:( 1 ) 几种无脊椎动物的m i c r o r n a 的 2 - - - 8 残基与靶m r n a3 u t r 是完全互补的;( 2 ) 在第一个确认的无脊椎动物的m i c r o r n a 与靶分 子的互补位点之间,m r n a 与m i c r o r n a2 - - - 8 残基配对的部分在其它种类的同源信息中是完全 保守的,一个邻近的至少六个碱基对的螺旋几乎总是出现在这个区域;( 3 ) m i c r o r n a 的2 - - - 8 残基在同源的后生动物m i c r o r n a 中是保守的;( 4 ) 预测哺乳动物m i c r o r n a 的靶分子时,要 求跨越m i c r o r n a2 - - 8 残基的七聚体具有完全的碱基配对,比要求m i c r o r n a 的其它任何一个 七聚体的配对更有效率。如果不考虑互补位点其它区域的互补程度,与核心区域的错配就可 抑制起始时对靶分子的识别,因而阻止了切割或翻译抑制。如果同时允许m i c r o r n a 的其余部 分有足够的配对,将产生切割作用。然而仅由一些侧翼配对来补充核心配对,再与r i s c 共同 作用,足以介导翻译抑制【2 9 】。 1 2 5m i e r o r n a 与s i r n a r n a 干扰是一种古老而保守的防卫机制,在植物中称为转录后基因沉默,在真菌中称为 内蒙古大学硕士学位论文应用多样性增量方法识别人类基因组m i c r o r n a 前体序列 压制( q u e l l i n g ) 。当外源的双链r n a ( d o u b l e s t r a n d e dr n a ,d s r n a ) 侵入生物体被r

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论