(分析化学专业论文)不同剪接频率外显子的组成特征分析.pdf_第1页
(分析化学专业论文)不同剪接频率外显子的组成特征分析.pdf_第2页
(分析化学专业论文)不同剪接频率外显子的组成特征分析.pdf_第3页
(分析化学专业论文)不同剪接频率外显子的组成特征分析.pdf_第4页
(分析化学专业论文)不同剪接频率外显子的组成特征分析.pdf_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 目前,选择性剪接已被用来作为人类和小鼠中蛋白编码基因数目和功能复杂 性之间的矛盾的一种解释。选择性剪接是在进化过程中在转录后水平上通过去除 或保留外显子,从而对基因表达进行调控的一种重要机制,目前的生物信息学研 究和实验研究都已经揭示了选择性剪接正在脊椎动物中以很高的频率发生。尽管 选择性剪接及其剪接机制都已被展示,并且顺式调控序列对于准确的剪切位点识 别和外显子定义的重要性也被详细的报道,但是对于发生不同的剪接频率的选择 性剪接外显子的调控机制还没有被广泛的研究,是什么导致不同的外显子发生分 化剪接? 这些以不同的频率发生分化剪接的外显子是否经历着某些潜在调控元 件或潜在调控信号的分化调控? 以往的研究总是把外显子总体分为选择性的和 组成性的两大类,在本文的研究中,我们把发生选择性剪接的人类和同源小鼠基 因的外显予根据剪接频率的不同分为四种类型,利用e s e f i n d e r 等生物软件和其 他各种生物信息学方法,以人类选择性剪接基因和同源小鼠基因为研究对象,对 其剪接频率不同的外显子做了大规模的组成成分分析,包括外显子剪接增强子 ( e s e s ) 调控元件、外显子长度、g c 含量和重复元件,来试图揭示外显子的各 种组成特征与外显子的不同剪接频率之间存在的潜在关系。结果表明,不同类型 的外显子有着不同的组成特征和调控特征,随着剪接频率的降低,外显子平均长 度增长,g c 含量升高,剪接调控元件和重复元件也有较高的富集。这就表明, 剪接频率是很可能被这些调控因子所影响的,从而说明以往的将发生选择性剪接 的外显子总体分为两类就有可能忽视了不同剪接频率的外显子之间的区别。另 外,通过比较分析非选择性剪接小鼠基因与同源选择性剪接人类基因,我们发现, 剪接频率最低的外显子很有可能是最近新生成的选择性剪接外显子,它们将会随 着进化过程逐步获得功能和改变剪接频率。这些分析结果揭示了影响外显子剪接 频率的潜在组成特征,也为进一步解读新的选择性剪接外显子的生成、剪接选择 和转录调控提供了线索。 关键词:选择性剪接剪接频率外显子剪接增强予重复元件g c 含量 同源基因 a b s t r a c t a l t e r n a t i v es p l i c i n gh a sb e e ns u g g e s t e da so n ee x p l a n a t i o nf o rt h ed i s c r e p a n c y b e t w e e nt h en u m b e ro fp r o t e i nc o d i n gg e n e sa n dt h ef u n c t i o n a lc o m p l e x i t yi nh u m a n a n dm o u s e a l t e r n a t i v es p l i c i n gi sa ni m p o r t a n tm e c h a n i s mf o rt h ef i n et u n i n go fg e n e e x p r e s s i o nb ye x c l u d i n go ri n c l u d i n ge x o n sa tt h ep o s t t r a n s c r i p t i o n a l l e v e li nt h e c o u r s eo fe v o l u t i o n r e c e n tb i o i n f o r m a t i c ss t u d i e sa n de x p e r i m e n t a ls t u d i e sh a v e r e v e a l e dah i g hf r e q u e n c yo fa l t e r n a t i v es p l i c i n gi nv e r t e b r a t e a l t h o u g ht h e m e c h a n i s mo fa l t e r n a t i v es p l i c i n ga n dr e g u l a t i o no fs p l i c i n gh a v eb e e nr e v e a l e d ,a n d t h ei m p o r t a n c eo fc s r e g u l a t o r ys e q u e n c e sf o ra c c u r a t es p l i c es i t er e c o g n i t i o na n d e x o nd e f i n i t i o nh a sb e e nw e l ld o c u m e n t e d ,t h er e g u l a t i o no nd i f f e r e n ta l t e m a t i v e l y s p l i c e de x o n sw i t hd i f f e r e n ts p l i c i n gf r e q u e n c yh a sn o tb e e nw i d e l ys t u d i e d w h a t c a u s e de x o n st ob ed i f f e r e n t l ys p l i c e da n dw h e t h e rs p l i c e de x o n sw i t hd i f f e r e n t f r e q u e n c yu n d e r g od i v e r g e n tr e g u l a t i o nb ys o m ep o t e n t i a le l e m e n t so rs p l i c i n gs i g n a l s ? b e y o n dt h eg e n e r a lc l a s s i f i c a t i o nw i t ha l t e r n a t i v ea n dc o n s t i t u t i v e ,h e r e ,w ec l a s s i f i e d t o t a le x o n sf r o ma l t e m a t i v e l ys p l i c e dh u m a na n do r t h o l o g o u sm o u s eg e n ei n t of o u r t y p e sf i r s t l yb a s e do ns p l i c i n gf r e q u e n c y t h e n ,w ea n a l y z e de s ee l e m e n t ,e x o n l e n g t h ,g cc o n t e n ta n dr e p e t i t i v ee l e m e n to ft h e s ee x o n sw i t hd i f f e r e n ts p l i c i n g f r e q u e n c yb yu s i n ge s e f i n d e ra n do t h e rb i o i n f o r m a t i cm e t h o d st oa t t e m p t t ou n c o v e r t h ep o t e n t i a lr e l a t i o n s h i pb e t w e e nt h e s ep r o p e r t i e sa n ds p l i c i n gr e g u l a t i o no f d i f f e r e n t e x o n sw i t hd i f f e r e n ts p l i c i n gf r e q u e n c y t h er e s u l t si n d i c a t e dt h a td i f f e r e n tt y p e so f e x o np r e s e n t e dd i v e r g e n tc o m p o s i t i o n a la n dr e g u l a t o r yp r o p e r t i e s i n t e r e s t i n g l y , w i t h t h ed e c r e a s eo fs p l i c i n gf r e q u e n c y , t h ee x o n ss h o wh i g h e re x o nl e n g t h ,h i g h e rg c c o n t e n t ,m o r ea b u n d a n te s ee l e m e n ta n dm o r er e p e t i t i v ee l e m e n t i tm a yi m p l yt h a t t h es p l i c i n gf r e q u e n c yi sp r o b a b l yi n f l u e n c e db yf a c t o r sm e n t i o n e da n dt h eg e n e r a l c l a s s i f i c a t i o nm a yo m i tt h ed i f f e r e n c ea m o n gt h ea s e sw i t hd i f f e r e n ts p l i c i n g f r e q u e n c y f u r t h e r , b yc o m p a r i n gn a sm o u s eg e n e sw i t ho r t h o l o g o u sa sh u m a n g e n e s ,w ef o u n dt h a tt h ee x o n sw i t hl o w e s tf r e q u e n c ym a y b en e w l yc r e a t e da s e s w h i c hg a i nf u n c t i o na n da l t e rs p l i c i n gf r e q u e n c yg r a d u a l l yd u r i n ge v o l u t i o n t h e s e a n a l y s e sd i s c l o s et h ep o t e n t i a lc o m p o n e n t si n f l u e n c i n gt h ee x o ns p l i c i n gf r e q u e n c y , a n dp r o v i d et h ec l u ef o rf u r t h e rd e c i p h e r m e n to fn o v e la s e sc r e a t i o n , s p l i c i n g s e l e c t i o na n dt r a n s c r i p t i o nr e g u l a t i o n k e yw o r d s :a l t e r n a t i v es p l i c i n g ,s p l i c i n gf r e q u e n c y , e x o n i cs p l i c i n ge n h a n c e r , r e p e t i t i v ee l e m e n t ,g cc o n t e n t ,o r t h o l o g o u sg e n e l l 中国科学技术大学学位论文原创性声明 本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成 果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写 过的研究成果。与我一同工作的同志对本研究所做的贡献均己在论文中作了明确 的说明。 作者签名:j 雌 签字日期:j 鱼乒丛一 中国科学技术大学学位论文授权使用声明 作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥 有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交 论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人 提交的电子文档的内容和纸质论文的内容相一致。 保密的学位论文在解密后也遵守此规定。 幽开口保密( 年) 作者签名: 塞葺 签字日期:上鲤乒丝 导师签名: 签字日期: 第一章绪论 第一章绪论( 选择性剪接及其生物学意义) 1 1 选择性剪接介绍 1 1 1基因的选择性剪接 1 9 7 7 年,r o b e , srj 和s h a r pp a 分别发现断裂基因( i n t e r r u p t e dg e n e ) 。基 因的编码序列被称为外显子( e x o n ) ,非编码序列被称为内含子( i n t r o n ) ,在一 个结构基因中,编码某一蛋白质不同区域的各个外显子并不连续排列在一起,而 常常被长度不等的内含子所隔离,形成镶嵌排列的断裂方式。其后研究进一步了 解到真核生物基因大部分都是断裂的,断裂基因在较低等的真核生物中出现较 少,而在高等真核生物的基因组中却是大量存在的。在这种不连续的基因序列中, 插进去的序列称为居间序列( i n t e r v e n i n gs e q u e n c e ) ,需在转录后通过r n a 的拼 接加以切除,使编码区成为连续的序列。这是基因表达调控的一个重要环节。基 因的大小根据所含内含子的数量和长度不同而变化很大,典型的哺乳动物基因一 般含有7 - 8 个外显子,两者交互穿插,组成基因,虽然基因的结构是断裂的,但 是m r n a 的结构却不是断裂的,所以基因的初始转录产物必须进行加工。基因 的初始转录物与基因的结构是相同的,我们一般称这种初始转录产物为m r n a 前体,从m r n a 前体中去除内含子得到信使m r n a 的过程就称为m r n a 剪接 ( m r n a s p l i c i n g ) ,而对同一个m r n a 前体,通过不同的剪接方式( 选择不同的 剪接位点组合) 产生不同的m r n a 选择性剪接变体的过程就称为选择性剪接 ( a l t e r n a t i v es p l i c i n g ) 。而选择性剪接便是利用这样的特性,将同一基因中的外 显子以不同的组合方式来表达,使一个基因在不同时间、不同环境中能够制造出 不同的蛋白质。 r n a 的选择性剪接是在高等真核生物基因中普遍存在的一种生命现象,它 在真核基因表达调控中起着十分重要的作用,w a n g 等人利用对m r n a s 的深度 测序来研究不同人组织和癌症中的选择性剪接。通过将序列数据与剪接点进行比 对,他们发现,选择性剪接在人类多外显子基因中实质上是普遍现象。他们还发 现,选择性剪接与m r n a 多腺苷酸化在机制上有联系。后来的基因组测序更是 说明了选择性剪接在基因组中所起的作用。人类和小鼠基因组测序工程的结果向 人类揭示了总的基因数目不能用来说明生物表型的高复杂性,因为测序结果证实 蛋白编基因没有我们期望的那么多 卜2 。例如人类和小鼠基因组的基因数目大 第一章绪论 约是2 5 ,0 0 0 ,并不明显多于线虫基因组中蛋白编码基因的数目( 约1 9 ,0 0 0 ) ,并 且低于水稻基因组中蛋白编码基因的数目( 约4 0 ,0 0 0 ) 1 - 4 1 ,这就说明生物体 的复杂性和其编码蛋白质的基因数目没有直接的联系,他们之间的矛盾只能用选 择性剪接来解释说明。选择性剪接是生物的一种基本且重要的调控机制,它在人 类基因组中也广泛存在,是增加蛋白质多样性和基因表达复杂性的主要原因。选 择性剪接使得单个m r n a 前体产生多个不同类型的m r n a 转录产物,然后编码 成具有多个功能的蛋白质,使蛋白质的多样性和生物功能的复杂性成为可能。选 择性剪接不仅在扩增蛋白多样性上有重要作用,而且也为有机体的多样表达提供 了额外的调控空间 5 - 7 ,这也说明,使基因功能多样化的机制在简单生物向复 杂生物的进化过程中扮演着非常重要的角色,而基因的选择性剪接正是在这中间 扮演着主要角色 8 - 9 。 1 1 2 选择性剪接的作用模式 真核生物的m r n a 前体要通过5 戴帽、剪接、3 加尾、剪接分支位点等加 工才能成为成熟的m r n a 。在剪接过程中,含有内含子和外显子的m r n a 前体, 通过剪接切除内含子,并将外显子依次连接起来。剪接是由剪接体来催化的,它 是以五个不同的小核核糖核酸( s n r n s ) 以及不下于一百个蛋白质所组成的大型 核糖核酸蛋白质复合物,称为小核糖核蛋白复合体( s n r n p s ) ,s n r n p s 的r n a 会和内含子进行杂交反应,并且参与剪接的催化反应,剪接反应是通过多个小核 糖核蛋白复合体和多种蛋白质组成的剪接体,以及它们之间的多种相互作用,来 精确的切除内含子和连接外显子的。 以外显子和内含子为单元的基因结构形式在真核生物中普遍存在,人类基因 中的大多数都含有内含子。因此通过切除内含子把外显子按一定的顺序拼接起来 形成成熟的m r n a ,再经过翻译产生蛋白质就是种最普遍的基因表达方式。基 因的内含子具有多种多样的结构,因此剪接机制也是多种多样的,有些内含子可 以催化自身拼接,有些内含子需在剪接体的作用下才能剪接。 选择性剪接有多种剪接方式,如类型i 自我剪接、类型i i 自我剪接、核m r n a 的剪接体的剪接、核t r n a 的酶促剪接。类型i 自我剪接首先是在四膜虫的研究 中发现的,此剪接过程出现在稀少的内含子组成的核酸酶,只需要1 价和2 价阳离 子以及鸟苷酸存在即能自发进行,无需共给能量和酶催化。类型i 自我剪接的内 含子分布很广,存在于真核生物的细胞器基因中,低等真核生物核的r r n a 的基 因中,细菌和噬菌体的个别基因中。类型n 自我剪接内含子本身也具有催化功能, 能够自我完成剪接,与类型i 内含子自我剪接的差别在于转酯反应无需游离鸟苷 酸发动,而是由内含子靠近3 端特定腺苷的2 一羟基攻击5 一磷酸基剪接位点引起 2 第一章绪论 的,从而形成一个套索,经过两次转酯化反应,内含子成为套索结构而被切除, 两个外显子得以连接在一起。类型i i 自我剪接内含子的结构更复杂,也更保守, 其剪接活性有赖于其二级结构和进一步折叠,这种剪接方式只见于某些真菌线粒 体和植物叶绿体基因中。核m r n a 的拼接体的剪接与类型i i 的剪接基本相同,但 是核m r n a 前体的内含子数目庞大,他们占据了所有内含子的绝大部分,其内含 子的催化功能上有着区别。核t r n a 的酶促剪接是一种较罕见的剪接方式,但却 经常在t r n a 中出现,它的剪接反应涉及与剪接体或自剪接不同的生物学过程, 核糖核酸酶切开r n a ,而连接酶将外显子结合。这种剪接方式不需要任何r n a 分子来催化,而是一种完全由蛋白质催化和作用的反应,整个过程并没有出现转 酯化作用。上述四类剪接均为分子内剪接,即顺式剪接,但有事实表明,生物体 内存在分子间的剪接,即反式剪接,这样基因发生选择性剪接的机会就更多了, 其中,对顺式选择性剪接来说,被选择性剪接的外显子定位在一条p r e m r n a 上, , 顺式剪接可以把位于分离的p r e m r n a 的外显子连接起来,而p r e m r n a 的选择性 反式剪接是连接分离的p r e m r n a 上不同的外显子产生不同的m r n a s 。 选择性剪接有多种作用模式,目前研究最广泛的是以下四种模式:( 1 ) 外显 子跳跃:不同的剪接方式中,某外显子可以作为一个整体保留在成熟的m r n a 中 或被切除掉。( 2 ) 内含子保留:内含子没有别剪切掉,而是作为外显子保留在成 熟m r n a 中。( 3 、4 ) 选择性3 和5 剪接位点:是在外显子的末端由于两个或 多个剪接位点的识别导致的,因此基因的3 和5 端可以被选择性的延伸或缩短。 另外还有外显子互斥( 一对外显子在一种剪接方式中,在成熟的m r n a 中保留一 个外显子,而另一种剪接方式中在成熟的m r n a 中则只能保留另一个外显子,而 不能同时保留这两个外显子) 等多种剪接模式。报道表明,在人类和小鼠之间保 守的选择性剪接事件中,外显子跳跃是最普遍的一种,大约占到保守事件的3 8 ; 内含子保留模式约占到人类和小鼠基因组中选择性剪接保守事件的3 ;选择性 3 和5 剪接位点分别约占人类和小鼠选择性剪接保守事件的8 和1 8 ;另外 还有多种选择性剪接模式,例如,选择性起始、选择性终止及外显子互斥等 1 0 1 1 ( 见图1 1 ) 。这样,通过不同的剪接方式,一个m r n a 前体可以产生十几种甚至 几十种选择性剪接变体。 1 1 。3 选择性剪接的调控机制 真核细胞m r n a 前体经过剪接成为成熟的m r n a ,而m r n a 前体的选择性 剪接极大地增加了蛋白质的多样性和基因表达的复杂程度,剪接位点的识别可以 以跨越内含子的机制( 内含子限定) 或以跨越外显子的机制( 外显子限定) 进行。 选择性剪接有多种剪接形式:选择不同的剪接位点,选择不同的剪接末端,外显 3 第一章绪论 子的不同组合及内含子的剪接与否等。m r n a 前体的剪接过程由二步连续的转酯 反应组成,该过程中产生一个套索状中间体( 1 a r i a ti n t e r m e d i a t e ) ,结果使两个原 先被分隔的外显予连接在一起。细胞核内的小分子r n a ( 一般3 0 0 碱基) 一 s n r n a ( s m a l ln u c l e a rr n a ) ,包括u 1 u 6 等,s n r n a 与特异的蛋白质形成复合 物一s m 矾p ,m r n a 前体与s n r _ n m 形成的复合物一剪接体,m r n a 前体的剪接通 常通过剪接体进行,其中u 2 、u 6 、u 4 u 6s n r n p 等都是活性剪接体的主要成 份。 选择性剪接作为转录后水平上基因调控的一种方式,其本身也存在多种调控 方式。选择性剪接过程受到许多顺式元件和反式因子的调控,并与基本剪接过程 紧密联系,剪接体中的一些剪接因子也参与了对选择性剪接的调控。选择性剪接 的调控主要体现在剪接位点的识别上。剪接位点的准确识别主要是依赖于四种剪 接信号:3 和5 剪接位点;分支点( b r a n c hs i t e ) 和多聚嘧啶区域( p p t , p o l y p y r i m i d i n et r a c t ) ,其中,分支点是位于3 剪接位点上游的一段序列,多聚 嘧啶区域是处于3 剪接位点与分支点之间的一段序列 5 ,1 2 1 3 。然而,尽管 选择性剪接是由两步简单的转酯反应完成的,这些信号还不足于支持位点选择的 精确性,选择性剪接还受到许多来自邻近外显子和内含子内的顺式调控元件和反 式因子的调控,它们共同决定外显子的选择性剪接。 顺式元件可以位于外显子内或位于内含子内,来促进外显子的包含或跳跃 1 4 1 8 。反式因子可以通过识别剪接增强子或剪接沉默子等顺式调控元件对不 同的剪接位点进行选择。基本剪接因子间的协同作用和拮抗作用以及相对浓度的 改变可以影响剪接位点的选择,特异性剪接因子可以调控特异的剪接过程。目前 研究较多的主要有四种顺式调控元件:外显子剪接增强子( e s e s ) ;外显子剪接 沉默子( e s s s ) ;内含子剪接增强子( i s e s ) ;内含子剪接沉默子( i s s s ) 。目前, 研究最为广泛的顺式调控元件就是外显子剪接增强子,该调控元件是作为色氨酸 精氨酸一富集蛋白质家族( s r 蛋白质家族) 的结合位点,剪接增强子多位于它 们所调节的剪接位点附近,有助于吸引剪接因子到剪接位点上,变更它们的位置 还可使剪接活性发生很大改变,甚至使它们转变成为负调控元件。当它们出现在 外显子中时可以增强m r n a 前体的剪接作用,并在组成性剪接和选择性剪接过程 中都起着重要的作用 1 9 - 2 1 。 目前已有许多方法成功的预测到可能的外显子剪接增强子序列信号,包括位 点导向的突变法、通过指数富集配合体的系统演化法( s e l e x ) 、权重矩阵法和 其他计算机方法 1 5 ,1 9 ,2 2 - 2 7 。其中e s e f i n d e r 软件的开发使用为后来的选择 性剪接调控因子的研究提供了有利的工具,该软件可以对人类s r 蛋白可识别的 细胞中存在着的e s e 序列进行筛选和评分,定位在选择性剪接过程中起着重要作 4 第一章绪论 用的调控元件,这些蛋白包括s f 2 a s f 、s r p 4 0 、s r p 5 5 、s c 5 ,从而进一步证实 了与e s e 序列相关的s r 蛋白,在外显子的定位过程及组成性剪接和选择性剪接过 程中有着重要作用 2 2 。鉴于e s e 在选择性剪接调控上的重要作用和成熟的预测 方法,本文就系统了研究了此类剪接调控元件对不同剪接频率外显子的影响。 e x o ns r i p p i n g3 8 a i t a t r l a l i v e3 ,8 d i 随8 l t e 88 i n t r o nr e t e n t i o n3 图1 1 基因选择性剪接的四种主要模式 1 1 4 选择性剪接的研究现状 越来越多的证据显示,r n a 成熟加工是真核基因表达调控中的重要一 环,m r n a 剪接则直接影响了相应基因的编码信息。二十年来,人们对r n a 剪接 机制的了解有了长足的进步,但对于m r n a 剪接反应涉及的r n a 与蛋白、蛋白与 蛋白问的相互作用方式、r n a 剪接位点选择忠实性的保证机制以及较为特殊的 r n a 反式剪接分布范围、作用机制及其存在的生物学意义等目前仍知之甚少。 随着相关分子生物学、生物化学和遗传学信息的大量积累,尤其是新的实验技术 和方法的创建,人们对于真核基因m r n a 剪接机制的认识必将会不断突破。同时, m r n a 剪接机制的研究也将有助于揭示某些特殊生理和病理现象的分子基础,促 进相应基因的表达调控研究。 许多研究表明,选择性剪接是哺乳动物基因组中的一种普遍现象,b l a c k 利 用人类和其他有机体大量的转录体数据,用生物信息学等方法揭示出选择性剪接 几乎存在于所有的高等真核生物基因组中 1 2 。利用大量的c d n a 数据库和表 5 一 能 一 锄,:茎 一 了 、一 一一,了 一 第一章绪论 达序列标签( e s t ) 数据库,来发现和预测选择性剪接基因。目前已有许多大规 模研究利用生物信息学方法来估测选择性剪接在哺乳动物基因组中的普及范围。 较早的研究揭示出大约有3 5 到6 5 的人类基因经历着选择性剪接,产生多个 转录变体 1 ,2 1 ,2 8 - 3 3 1 ;最近的研究则估测到约有7 0 到8 0 的多外显子人类 基因是发生选择性剪接的 3 4 - 3 5 ,另外,其他的一些基因组也是以很高的频率 发生着选择性剪接的 3 6 ,研究表明至少有4 1 的多外显子小鼠基因经历选择 性剪接,并且可能高达6 0 3 7 - 3 9 。 既然选择性剪接是以这么高的频率发生于哺乳动物基因组中,因此其研究也 涉及到多个领域,例如,是否组成性剪接和选择性剪接经历着相同的进化力? 选 择性剪接得到的产物是否都是有功能的? 选择性剪接是怎样进化的? 它遵守什 么样的进化优势? 许多高通量可行的方法,如大规模测序和微矩阵等方法,为解 决此领域提出的各种问题提供了非常有力的工具。对此类问题的研究,目前已经 总结了很多,最新的一篇文章就以进化的观点来系统总结了关于选择性剪接的诸 多问题 4 0 。在众多研究领域内,选择性剪接调控一直以来就是个热门问题,它 不仅具有灵活性,而且在特殊情况下又具有特异性,对有机体各个不同生理阶段 有着极其重要的作用,本文就是在选择性剪接调控方面提出了问题,从而进行解 答。值得提出的是,目前利用生物信息学的方法研究选择性剪接相关方面的问题 已成为潮流之趋,其中生物信息学的一个重要研究应用就是设计软件辅助解决生 物学问题和阐明生物学现象,设计软件发现选择性剪接的位点,为寻找选择性剪 接的基因提供设计实验的依据。另外,可以利用生物信息学方法来建立数据库, 给设计实验提供依据并让生物学家从众多的数据中总结出生物学规律。 1 2 选择性剪接研究的生物学意义 选择性剪接现象的发生,给生物学家带来了一系列令人困惑的疑问。为什么 生物机体要先转录内含子,然后将其切除? r n a 的选择性剪接的耗费是巨大的, 其收益是什么? 内含子由何而来? 为什么内含子主要出现在真核生物种? 内含 子序列有无生物功能? 围绕这些问题曾提出了不少设想,争论很大,至今尚无定 论,但是选择性剪接给生物界带来了广泛的研究范围,目前许多问题正在被逐一 解答。 r n a 的选择性剪接有着重要的生物学意义。首先,选择性剪接是生物机体 在进化历史中形成的,是进化的结果。基因与基因产物蛋白质是由一些构造元件 即模块装配而成,但是资料显示,并不是所有的基因其外显子与蛋白质结构域、 亚结构域或基序有很好的对应关系,约有半数的基因是不能找出这种对应关系 6 第一章绪论 的,这就因为在漫长的进化历程中由于变异而将这些模块的边界逐渐模糊以至完 全消失。其次,选择性剪接是基因表达调节的重要环节。r n a 转录后通过剪接 而提取有用信息,形成连续的编码序列,并可通过选择性剪接而控制生物机体生 长发育,因此这是真核生物遗传信息精确调节和控制的方式之一。第三,由于基 因是由模块装配而成的,模块间的间隔序列也就演化成为内含子,因此外显子和 内含子有着相同古老的历史,因此,通过分析它们的剪接方式和分布可以大致推 测其起源时间。第四,r n a 的选择性剪接主要存在于真核生物中,原核生物极 为少见,但并非完全没有。最后,外显子和内含子是相对的,有些内含子具有编 码序列,能够产生蛋白质或功能r n a ,因此不能将内含子看为无用的序列。 另外,m r n a 前体的选择性剪接是真核生物的一种基本而又重要的调节机 制,通过选择性剪接,可以使同样的m r n a 前体产生很多不同的蛋白质,它精细 协调基因的功能,高效调节基因的定量表达以及蛋白质功能的多样化,影响主要 发育方向的确定,对细胞的分化、发育、生理功能和疾病状态都有着重要意义 8 9 。选择性剪接通过对外显子和内含子进行选择性的切除和保留,使剪接后 的转录体长度发生改变,在此过程中就可能造成转录后翻译过程的提前终止、氨 基酸或蛋白质c 末端位置发生改变、基因功能性片段的丢失,从而改变基因的结 构和功能。研究发现,有7 0 - - 8 0 的选择性剪接改变了蛋白质的功能 3 0 - 3 1 。 在真核生物细胞中,选择性剪接机制的存在,极大的促进了物种蛋白质结构和功 能的多样性,也推动着生物的进化历程。同时,m r n a 前体的选择性剪接参与转 录因子的表达、个体分化发育和细胞凋亡、兴奋、收缩等关键的生理过程,因此, 对选择性剪接机制的研究,不仅有助于进一步揭示某些特殊生理和病理现象的分 子基础,解释细胞行为和疾病的发生机制,探索相应基因表达调控的规律性,而 且可以在分子水平上为人类疾病的诊断、治疗、和预防提供科学的依据和使用技 术。 目前的许多研究都是和人类息息相关的,如选择性剪接与人类疾病已成为目 前研究的重点。这一类研究选择性剪接主要有以下几个目的:( 1 ) 发展一些有效 的计算方法,用这些方法和大量的e s t 数据预测人类的选择性剪接基因; ( 2 ) 建立一个实验验证过的选择性剪接数据库或创建一个预测性的选择性剪接基因 数据库,它可以当作最初的资源去检测特定基因的选择性剪接情况,也可以用做 疾病基因的诊断标记,对研究选择性剪接事件的起源也十分重要;( 3 ) 用实验 验证生物信息学方法预测的选择性接剪接基因,确定剪接位点预测的正确性,进 而可以验证预测方法是否正确,以获得可靠的预测方法。另外,在医学界,人类 提出了“人类疾病与基因”工程,并被指定为2 1 世纪医学研究的主题,围绕这一 主题将展开以下三方面的研究:人类疾病相关基因的识别与克隆;疾病相关基因 7 第一章绪论 的结构与功能的研究;与疾病防治相关的基因表达的调控研究,同时每个研究主 题下面又包含多个小的研究课题,总之,关于选择性剪接的研究对人类疾病的防 治也起着非常重要的作用。 参考文献 1 l a n d e re s ,l i n t o nl m ,b i r r e nb ,e ta 1 2 0 0 1 i n i t i a ls e q u e n c i n ga n da n a l y s i so ft h eh u m a n g e n o m e n a t u r e ,4 0 9 :8 6 0 - 9 2 1 2 w a t e r s t o nr h ,l i n d b l a d t o hk ,b i r n e ye ,e ta 1 2 0 0 2 i n i t i a ls e q u e n c i n ga n dc o m p a r a t i v e a n a l y s i so f t h em o u s eg e n o m e n a t u r e ,4 2 0 :5 2 0 5 6 2 3 c o n s o r t i u m ,t c e s 19 9 8 g e n o m es e q u e n c eo ft h en e m a t o d ec e l e g a n s :ap l a t f o r mf o r i n v e s t i g a t i n gb i o l o g y s c i e n c e ,2 8 2 :2 0 12 - 2 0 18 4 v e n t e rj c ,a d a m sm d ,m y e r se w ,e ta 1 2 0 01 t h es e q u e n c eo ft h eh u m a ng e n o m e s c i e n c e , 2 9 1 :1 3 0 4 1 3 5 1 5 g r a v e l e yb r 2 0 0 1 a l t e r n a t i v es p l i c i n g :i n c r e a s i n gd i v e r s i t yi nt h ep r o t e o m i cw o r l d t r e n d s g e n e t ,1 7 :1 0 0 1 0 7 6 h a s t i n g sm l ,k r a i n e ra r 2 0 01 p r e m r n as p l i c i n gi nt h en e wm i l l e n n i u m c u r ro p i nc e l l b i o ,13 :3 0 2 - 3 0 9 7 a s tg 2 0 0 4 h o wd i da l t e r n a t i v es p l i c i n ge v o l v e ? n a tr e vg e n e t , 5 :7 7 3 - 7 8 2 1 8 b l e n c o w eb i 2 0 0 6 a l t e r n a t i v es p l i c i n g :n e wi n s i g h t sf r o mg l o b a la n a l y s e s c e l l ,12 6 :3 4 - 4 7 9 x i n gyl e ec 2 0 0 6 a l t e r n a t i v es p l i c i n ga n d r n as e l e c t i o n p r e s s u r e - e v o l u t i o n a r y c o n s e q u e n c e sf o re u k a r y o t i cg e n o m e s n a tr e vg e n e t ,7 :4 9 9 5 0 9 10 s u g n e tc w :k e n tw j ,a r e sm ,e ta 1 2 0 0 4 t r a n s c r i p t o m ea n dg e n o m ec o n s e r v a t i o no f a l t e r n a t i v es p l i c i n ge v e n t si nh u m a na n dm i c e p a cs y m pb i o c o m p u t , 2 0 0 4 :6 6 7 7 1 1 k i me ,m a g e na ,a s tg2 0 0 7 d i f f e r e n tl e v e l so fa l t e r n a t i v es p l i c i n ga m o n ge u k a r y o t e s n u c l e i c a c i dr e s ,3 5 :1 2 5 1 3 1 12 b l a c kd l 2 0 0 3 m e c h a n i s mo fa l t e r n a t i v ep r e - m e s s e n g e rr n as p l i c i n g a n n ur e vb i o c h e m , 7 2 :2 9 1 3 3 6 13 b r o wd a 2 0 0 2 a l l o s t e f i cc a s c a d e o fs p l i c e s o m ea c t i v a t i o n a n n ur e vg e n e t ,3 6 :3 3 3 3 6 0 14 b l e n c o w eb j 2 0 0 0 e x o n i es p l i c i n ge n h a n c e r :m e c h a n i s mo fa c t i o n ,d i v e r s i t ya n dr o l ei n h u m a ng e n e t i cd i s e a s e s t r e n d sb i o c h e ms c i ,2 5 :1 0 6 1 1 0 15 c a r t e g n il ,c h e ws l ,k r a i n e ra r 2 0 0 2 l i s t e n i n gt os i l e n c ea n du n d e r s t a n d i n gr l o n s e n s e - e x o n i cm u t a t i o n st h a ta f f e c ts p l i c i n g m o lc e l lb i o l ,2 0 :6 4 14 - 6 4 2 5 16 z h a n gx h ,k a n g s a m a k s i nt c h a om s ,e ta 1 2 0 0 5 e x o ni n c l u s i o ni sd e p e n d e n to i l 8 第一章绪论 p r e d i c t a b l ee x o n i cs p l i c i n ge n h a n c e r s m o lc e l lb i o l ,2 5 :7 3 2 3 - 7 3 3 2 17 l a d da n ,c o o p e rt a 2 0 0 2 f i n d i n gs i g n a l st h a tr e g u l m ea l t e r n a t i v e s p l i c i n gi n t h e p o s t - g e n o m i ce r a g e n o m eb i o l ,3 :r e v i e w s 0 0 0 8 18 p o z z o hu ,s i r o n im 2 0 0 5 s i l e n c e r sr e g u l a t eb o t hc o n s t i t u t i v ea n da l t e r n a t i v es p l i c i n ge v e n t s i nm a m m a l s c e l lm o ll i f es e i ,6 2 :15 7 9 - 16 0 4 1 9 g r a v e l e yb r 2 0 0 0 s o r t i n go u tt h ec o m p l e x i t yo f s rp r o t e i nf u n c t i o n r n a ,6 :1 1 9 7 - 1 2 1 1 2 0 w a n gj ,p h i l i pj ,s m i t ha re ta 1 2 0 0 5 d i s t r i b u t i o no fs rp r o t e i ne x o n i es p l i c i n ge n h a n c e r m o t i f si nh u m a np r o t e i n - c o d i n gg e n e s n u c l e i ca c i dr e s ,3 3 :5 0 5 3 5 0 6 2 21 k a nz ,s t a t e sd ,g i s hw 2 0 0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论