已阅读5页,还剩70页未读, 继续免费阅读
(细胞生物学专业论文)癌症相关点突变共同定位的外显子剪接增强子ese特征分析.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学位论文独创性声明 本人承诺:所呈交的学位论文是本人在导师指导下所取得的研究成果。论文中除特别加以标注和致 谢的地方外,不包含他人和其他机构已经撰写或发表过的研究成果,其他同志的研究成果对本人的启示 和所提供的帮助,均已在论文中做了明确的声明并表示谢意。 学位论文作者签名:荔监 学位论文版权的使用授权书 本学位论文作者完全了解辽宁师范大学有关保留、使用学位论文的规定,及学校有权 保留并向国家有关部门或机构送交复印件或磁盘,允许论文被查阅和借阅。本文授权辽宁 师范大学,可以将学位论文的全部或部分内容编入有关数据库并进行检索,可以采用影印、 缩印或扫描等复制手段保存、汇编学位论文,并且本人电子文档的内容和纸质论文的内容 相一致。 保密的学位论文在解密后使用本授权书。 学位论文作者签名:壅鳓 指导教师签名: 签名日期: 力i d 年6 月7 日 辽宁师范大学硕士学位论文 摘要 位于基因编码区的点突变( 错义突变无义突变) 是导致人类遗传疾病突变中最常 见的类型。但是,这些与疾病相关的点突变并不仅仅是在基因编码序列上随机分布,而 是会在基因编码序列的某些区域出现富集现象。导致这些疾病相关点突变在某些特定基 因编码区域内发生富集现象的原因,以及发生点突变富集的编码区域内特定外显子功能 元件的分布特点,到目前为止还不是十分清楚,仍是生物学家研究的焦点。而癌症作为 当今世界人类最关注的疾病之一,癌症相关点突变是否也存在着这种在基因编码区特定 区域富集的现象? 本文主要就此问题进行了研究,通过系统分析9 9 个人类疾病基因中 1 ,2 2 7 个癌症相关点突变,发现其中大于6 0 的点突变所在的位点同时也是外显子剪接 增强子( e s e ) 基序上的位点。这个结果充分说明了大多数癌症相关点突变存在着与e s e 基序共同定位的现象,这种共同定位的关系很可能是导致癌症发生的重要原因之一 与外显子的非正常剪接相关。此外,为了阐明这些癌症相关点突变共同定位的e s e 潜在 的生物学特征,本文对9 9 个疾病基因中与癌症相关点突变共同定位的e s e 基序及其这 些癌症相关点突变进行了较系统的特征分析。 主要的分析结果如下: 1 定位于e s e 基序上癌症相关点突变更倾向位于外显子5 和3 末端i n t - - - 5 0 n t 的区 域。 2 定位于e s e 基序上癌症相关点突变更倾向是“保守型”突变,这种类型的突变并不 改变编码蛋白的结构或影响很小。 3 癌症相关点突变共同定位的e s e 共有序列比已知e s e 共有序列更加保守。 4 位于e s e 基序上每个c p g 位点上发生癌症相关点突变的频率是位于非e s e 基序上( 除 e s e 基序以外外显子其他区域) 每个c p g 位点上发生突变的4 倍左右。这表明c p g 双核苷酸是e s e 基序上发生癌症相关点突变的热点区。 , 综上所述,大多数癌症相关点突变改变了e s e 基序从而使其不能与剪接因子s r 蛋 白正确结合,而导致外显子不能被识别产生外显子跳跃现象;此外,e s e 基序共同定位 的癌症相关点突变更多的位于外显子两端,表明这些点突变更可能对外显子的正常识别 和剪接产生影响。以上两个结果都充分说明了癌症相关点突变的主要致病原因之一是与 外显子的非正常剪接存在着密切的联系。 关键词:点突变;癌症;外显子剪接增强子;c p g 双核苷酸 癌症相关点突变共同定位的外显子剪接增强子( e s e ) 特征分析 f e a t u r e so fc a n c e r r e l a t e dp o i n tm u t a t i o n sa r ec o l o c a l i z d ew i t he x o n i c s p l i c i n ge n h a n c e r s ( e s e ) a b s t r a c t p o i n tm u t a t i o n ( m i s s e n s em u t a t i o n n o n s e n s em u t a t i o n ) i nt h ec o d i n gs e q u e n c eo fg e n ei s t h em o s tc o m m o nt y p eo fm u t a t i o nc a u s i n gi n h e r i t e dh u m a nd i s e a s e s d i s e a s e r e l a t e dp o i n t m u t a t i o n sd o n tj u s tr a n d o m l yd i s t r i b u t ei nt h ec o d i n gs e q u e n c eo fg e n e sb u ts i t ei ns o m e s p e c i f cr e g i o n s m a th a sc a u s e dd i s e a s e r e l a t e dp o i n tm u t a t i o n ss i t e di ns o m es p e c i f i c r e g i o n sa n dw h e t h e rt h e s er e g i o n sh a v es o m ep a r t i c u l a rf u n c t i o n a le l e m e n t so fe x o n s ? a t p r e s e n t ,i ti ss t i l lh o tr e s e a r c hi s s u ei nb i o l o g i c a lf i e l d a tt h es a m et i m e ,n o w a d a y sc a n c e rh a s b e c o m eo n eo ft h em o s tc o n c e r n e dd i s e a s e s w h e t h e rc a n c e r r e l a t e dp o i n tm u t a t i o n sa l s oh a v e t h ef e a t u r et h a te n r i c hi ns o m es p e c i f i cr e g i o n si nt h ec o d i n gs e q u e n c eo f g e n e s ? i nt h i sp a p e r , w eh a v ea n a l y z e d1 , 2 2 7c a n c e r r e l a t e dm u t a t i o n si n9 9h u m a nd i s e a s e - r e l a t e dg e n e s ,a n d i d e n t i f i e dm o r et h a n6 0 m u t a t i o n ss i t e dp o s i t i o n sw h i c ha l s oa r ee x o n i cs p l i c i n ge n h a n c e r ( e s e ) s i t e s t h i sf i n d i n gs u g g e s t e dt h a tc a n c e r - r e l a t e dp o i n tm u t a t i o n ss t r o n g l yc o l o c a l i z e d w i t he s em o t i f s s ot 1 1 e i rp a t h o g e n i ce f f e c t sa r es p l i c er e l a t e d t ou n d e r s t a n dt h ep o t e n t i a l f e a t u r e so fe s em o t i f st h a tc o n t a i n e dc a n c e r - r e l a t e dp o i n tm u t a t i o n s ,i nt h ep r e s e n ts t u d y , w e h a v ee v a l u a t e dc o l o c a l i z a t i o nc a n c e r - r e l a t e dp o i n tm u t a t i o n sw i t hp u t a t i v ee s em o t i f si n9 9 g e n e s t h e s em a i n l yr e s u l t sw e r ea sf o l l o w : 1 t h ec a n c e r - r e l a t e dp o i n tm u t a t i o n sw i t h i ne s em o t i f sm o r e p r e f e r e n t i a l l ys i t e dw i t h i nln t t o5 0 n tr e g i o n sa tt h ee n d so fe x o n s 2 t h ec a n c e r - r e l a t e dp o i n tm u t a t i o n sl o c a t e di n s i d ee s em o t i f sw e r em o r el i k e l yt ob e c o n s e r v a t i v em u t a t i o n st h a tm i g h tn o th a v ee f f e c to nt h ec h a n g eo ft h ec o d i n gp r o t e i n 3 t h es e q u e n c e so fc a n c e r - r e l a t e dp o i n tm u t a t i o n sa s s o c i a t e d e s em o t i f sw e r em o r e c o n s e r v e dt h a nt h o s eo fk n o w ne s em o t i f s 4 t h en u m b e ro fc a n c e r - r e l a t e d p o i n tm u t a t i o n si np e rc p gi n s i d ee s em o t i f sw a s a p p r o a c hf o u rt i m e sh i g h e rt h a nt h a ti nc p g so u t s i d ee s em o t i f s ,i n d i c a t e dc p g d i n u c l e o t i d e sw e r eh o ts p o t sf o rc a n c e rp a t h o g e n i cp o i n tm u t a t i o n si ne s em o t i f s i ns u m m a r y ,e s em o t i f sc a n tc o r r e c t l yb i n dw i t hs rp r o t e i na sm o s to fc a n c e r r e l a t e d p o i n tm u t a t i o n sc h a n g ee s em o t i f s ,a n dr e s u l ti ne x o ns k i p p i n g b e s i d e ,t h ec a n c e r - r e l a t e d p o i n tm u t a t i o n sw i t h i ne s em o t i f sm o r ep r e f e r e n t i a l l ys i t e a tt h eb o t he n d so fe x o n s ,t h i s r e s u l td e m o n s t r a t e st h e s em u t a t i o n sm o r ee a s i l yd i s r u p te x o n sn o r m a lr e c o g n i t i o na n ds p l i c e t h et w or e s u l t s f u l l yi l l u s t r a t eo n eo fm a j o rp a t h o g e n i ce f f e c t so fc a n c e r r e l a t ep o i n t m u t a t i o n sm i g h tb es p l i c er e l a t e d i i l 辽宁师范大学硕士学位论文 k e yw o r d s :p o i n tm u t a t i o n ;c a n c e r ;e x o n i cs p l i c i n ge n h a n c e r ;c p gd i n u c l e o t i d e i i i 癌症相关点突变共同定位的外显子剪接增强子( e s e ) 特征分析 目录 摘要i a b s t r a c t i i 弓i言1 1绪论。2 1 1 癌细胞基因组中体细胞突变2 1 2 外显子剪接增强子4 1 2 1 外显子剪接增强子的作用模式4 1 2 2 外显子剪接增强子的确定5 1 2 3 外显子剪接增强子的预测6 1 3 点突变与e s e 基序之间的关系7 1 4d 、结8 2 癌症相关点突变共同定位的外显子剪接增强子特征分析9 2 1 引言9 2 1 1 癌症相关点突变与外显子剪接增强子相互关系的分析9 2 1 2 癌症相关点突变共同定位的外显子剪接增强子特征分析9 2 2 材料和方法1 0 2 2 1 材料。1 0 2 2 2 方法。1 0 2 3 结果与讨论1 1 2 3 1 癌症相关点突变的特征分析1 1 2 3 2 癌症相关点突变与外显子剪接增强子相互关系的分析1 5 2 3 3 癌症相关点突变与c p g 双核苷酸关系的分析1 6 2 3 4e s e 基序共同定位的癌症相关点突变分布特征分析1 7 2 3 5 “保守型”错义突变与“根本型”错义突变的分析1 9 2 3 6e s e 共有序列的分析。2 0 2 4 结论2 2 3 主要创新点2 4 4 研究前景2 5 结论:1 6 参考文献2 8 附录a 癌症相关点突变信息3 2 i v 辽宁师范大学硕士学位论文 攻读硕士学位期间发表学术论文情况。6 4 致 射6 5 一v 一 辽宁师范大学硕士学位论文 引言 目前,癌症已经成为人们最关注的疾病之一。癌症的致病机理可追溯到影响细胞生 长和转移的d n a 突变。这些d n a 突变包括:单核苷酸突变、短小或较大d n a 片段的插入 和删除、d n a 序列拷贝数的增加或降低n 3 。其中,单核苷酸突变也叫做点突变,又可分 为错义突变和无义突变。研究表明导致人类遗传疾病突变中,最常见的突变类型就是错 义突变胆卅。当今,对癌症基因的研究也主要围绕着癌症基因中点突变与肿瘤发生之间的 关系瞄3 。所以,对癌症相关错义突变和无义突变进行研究,不仅能够为深入研究癌症的 生物学特征提供依据,而且可以对新发现的单核苷酸多态性( s n p ) 的致癌作用做一个 初步的预测。 引起癌症的错义突变通常是通过改变其编码氨基酸序列和蛋白质结构而导致疾病 1 ;引起癌症的无义突变则是通过直接缩短其编码氨基酸序列而产生无功能蛋白质而导 致疾病盯1 。然而,关于组成性剪接和选择性剪接的研究表明,事实上,当点突变位于顺 式作用元件外显子剪接增强子( e s e ) 时,突变导致疾病的原因是与外显子的非正 常剪接相关的以2 1 。外显子剪接增强子( e s e ) 是位于外显子上由6 到8 个离散并且简并 的核苷酸组成的短小序列n 3 1 制。基于对正常剪接模式的研究表明,大多数外显子至少含 有一个具有功能的e s e 基序,1 4 1 蜘。e s e 是外显子进行剪接时最基本的剪接因子,是富 含丝氨酸( s e r ) 和精氨酸( a r g ) s r 蛋白家族的靶标序列阻纠”。一些相关研究已经表明, 位于e s e 基序内的单核苷酸突变可以导致s r 蛋白与e s e 基序之间不能正确的结合,从 而使剪接复合体不能识别该e s e 基序所在的外显子,最终导致外显子跳跃旧1 l1 8 1 。因此, 位于e s e 基序内的点突变,不仅可以改变m r n a 序列和所编码氨基酸序列的组成,而且 可以扰乱外显子的正常剪接。 为了探究癌症相关点突变存在的潜在特征。本文从人类基因突变数据库( t h eh u m a n g e n em u t a t i o nd a t a b a s e ,h g m d ) u 钔中获得了1 ,2 2 7 个引起癌症的点突变,分别位于 9 9 个基因中。然后,利用生物信息学方法对这些点突变进行了系统的特征分析。同时, 为了揭示与癌症相关点突变共同定位的e s e 基序存在的潜在生物学特征,也对这些e s e 基序在基因编码序列上的分布及c p g 双核苷酸在e s e 基序上的富集情况进行了分析。 癌症相关点突变共同定位的外显子剪接增强子( e s e ) 特征分析 1绪论 1 1癌细胞基因组中体细胞突变 全世界范围内,八分之一的死亡是因癌症导致的砼伽。癌症( c a n c e r ) ,医学术语亦 称恶性肿瘤( m a li g n a n tn e o p l a s m ) ,是由控制细胞生长增殖机制失常而引起的疾病。 癌细胞除了生长失控外,还会局部侵入周遭正常组织甚至经由体内循环系统或淋巴系统 转移到身体其他部分。翻。癌症包括1 0 0 多种具有不同危险因素和流行病学的疾病。 癌症主要根据肿瘤来源组织的细胞类型和其生物学行为进行分类。 随着生命科学的发展,d n a 作为遗传分子的发现蛆鄙及其结构的确定瞳钔。人们发现d n a 结构的破坏和突变的产生同样会导致癌症心6 1 。随后,越来越多关于癌细胞染色体的分析 表明,特定的并且重复出现的基因异常与特定种类的癌症相关。最后,事实证明将人类 癌症全部基因组导入到表型正常的n i h 3 t 3 细胞中可以将其转变成癌细胞心6 ,2 7 1 。分离癌 细胞中具有转化活性的特定d n a 片段以确定第一步自然反应的发生,发现癌症的产生是 由于d n a 序列变化导致的单核苷酸替代g t 从而使删基因的密码子1 2 甘氨酸 ( g l y ) 改变成了缬氨酸( v a l ) 汹2 钔。1 9 8 2 年这个具有巨大影响的发现,开创了搜索异常 致癌基因的新世纪,并为人类诊断及治疗癌症奠定了基础。 癌细胞谱系表型正常时就可能已经获得了突变,反应为正常细胞有丝分裂时获得的 固有突变和外因引起的有机体突变物质导致的突变。癌细胞的发生经历多种不同类型的 突变,最后的结果与哪些突变起主导作用相关( 图1 1 ) 。 川嘲蝴帅洲删器勰 固蚺侈移侈+ m t 曲1 0 f - i _ _ _ _ _ _ _ i _ _ i _ 。砷目岍 c m 甜耳搿- _ l 1 - 1 0 玎n x n d r w b rn 岫t s 1 0 s - 1 so tm 愉 1 0 s - 1 0 0 0 0 0 口m o m a n 帅价ea 聊9 嘲n 时m u 【翻黼 图1 1 从癌细胞中获得体细胞突变的时期及突变过程 f i g 1 1t h et i m i n go ft h es o m a t i cm u m t i o n sa c q u i r e db yt h ec a n o e l c e l la n d t h ep r o c e s s e st h a tc o n t r i b u t et ot h e m 辽宁师范大学硕士学位论文 癌细胞基因组中的体细胞突变主要包括下面几种不同类型的d n a 改变:a ) 点突变 ( p o 主n tm u t a t i o n s ) 一种碱基核苷酸替换成另一种碱基核苷酸。b ) 短小或者较大 d n a 片段的插入和删除。c ) 重排d n a 序列在某处断裂,然后其他位置上的d n a 整合 到此d n a 序列。d ) d n a 序列拷贝数的增加或减少( 图1 2 ) 。 c o p y - n u m b e rc h a n g e 图1 2 癌细胞基因组中体细胞突变图谱 f i g 1 2f i g u r a t i v ed e p i c t i o no ft h el a n d s c a p eo fs o m a t i cm u t a t i o n sp r e s e n ti nas i n g l ec r n c e rg e n o m e 在这些导致癌症发生的体细胞d n a 突变中,点突变是最常见的突变类型。点突变又 可根据发生位置和对基因功能的影响分为两类:错义突变( m i s s e n s em u t a t i o n s ) 碱基的改变导致了编码氨基酸的变化,从而使蛋白质序列和功能发生改变;无义突变 ( n o n s e n s em u t a t i o n s ) 碱基的改变产生了提前终止的密码子,从而缩短了氨基酸 序列或产生没有功能的蛋白质。 癌症相关点突变共同定位的外显子剪接增强子( e s e ) 特征分析 1 2 外显子剪接增强子 1 2 1 外显子剪接增强子的作用模式 随着2 0 世纪8 0 年代早期,基因选择性剪接现象在免疫球蛋白u 基因和降钙素基 因中被发现。并且,e r i c 等人通过高通量测序技术惊奇的发现人类基因组中9 2 - - 9 3 的基因都存在着选择性剪接现象。科学家确定基因序列自身肯定存在着某些基序对选择 性剪接起着重要的调控作用,并且确定这些调控基序与剪接因子有着特殊的关联性。 随后,科学家发现了对基因选择性剪接起着重要调控作用的顺式作用元件和反式作 用元件啪1 。顺式作用元件又可根据所在的位置和作用特点分为:外显子剪接增强子 ( e s e ) 、内含子剪接增强子( i s e ) 、外显子剪接沉默子( e s s ) 、内含子剪接沉默子 ( i s s ) 。其中,外显子剪接增强子在组成性剪接和选择性剪接中都起着非常重要作用。 外显子剪接增强子( e x o n i cs p l i c i n ge n h a n c e r s ,e s e ) 是由位于外显子上6 到8 个离散并且简并的核苷酸组成的短小基序。它可以提示并且增强h n r n a 和p r e r n a 剪接 成信使r n a ( m r n a ) 。e s e 的存在对于外显子剪接位点的正确识别是十分重要的。科学 家们基于对正常剪接模式的研究表明大多数外显子中至少含有一个以上具有功能的e s e 基序。 e s e 基序是s r 蛋白的靶标序列能够与s r 蛋白特异结合口h3 羽。s r 蛋白是在真核生物 r n a 剪接中发挥重要作用的一类剪接因子,它们的结构相近并且高度保守。s r 蛋白的特 点是存在卜2 个r n a 识别基序( r r m ) 和一个明显的羧基端( c 一端) 结构域富含丝氨酸 s e r ( s ) 和精氨酸a r g ( r ) 二肽羽。r r m 介导序列特异的结合e s e 基序,所以它决定了 底物的特异性。而r s 结构域则主要参与蛋白质间的相互作用。 外显子剪接增强子位点与s r 蛋白中的r r m 特异结合后,会将u 2 a f 蛋白引导到3 剪接位点处,同时将u 1s n r n p 引导到5 剪接位点处,以此来提高相邻剪接位点的活性 ( 图1 3 ) 羽。这是外显子剪接过程中的一个关键步骤,该步骤决定着哪些剪接位点将 被连接起来。 辽宁师范大学硕士学位论文 图1 3s r 蛋白与外显子剪接增强子结合模式 f i g 1 3 m o d e l so fs rp r o t e i na c t i o ni ne x o n i c - s p l i c i n g - e n h a n c e r - d e p e n d e n ts p l i c i n g 1 2 2 外显子剪接增强子的确定 目前,寻找外显子剪接增强子基序的主要方法是指数富集配合体的系统演化法 ( s y s t e m a t i ce v o l u t i o no fl i g a n d sb ye x p o n e n t i a le n r i c h m e n t ,s e l e x ) 。该方 法既可以在体外进行试验5 矧也可以在体内进行试验7 1 。s e l e x 方法的具体步骤如下:a ) 将位于短小基因中的一个外显予固有的剪接增强子用来源于寡核苷酸文库中的短小随 机序列替代。b ) 将重新组成的短小基因转染到成熟的细胞中或者进行体外转录,以此来 构建p r e m r n a s 库。c ) 接下来,在体内或者体外p r e m r n a s 进行外显子的剪接。d ) 将 被剪接的m r n a 进行凝胶提纯并通过反转录( r t ) - p c r 进行扩增,最后进行测序分析得到 e s e 基序。短小的( 6 - 8 n t ) 、简并的、部分重叠的e s e 基序都可以通过s e l e x 方法在外 显子中找到,并且实验得到的e s e 基序可以用来统计预测外显子中可能存在的e s e 基序 1 3 3 9 】 o 为了确定e s e 基序结合哪一种类型的s r 蛋白,外显子剪接步骤在带有四种不同的 s r 蛋白( s f 2 a s f ,s c 3 5 ,s r p 4 0 ,s r p 5 5 ) s 1 0 0 提取扩增中进行n 3 - 强3 钔。具体步骤是: 从免疫球蛋白一l a ( i g h m m ) 中获得转录本,用2 0 n t 的随机核苷酸序列替换其中固有的剪 接增强子。然后,经过几个循环扩增后,对剪接产物进行测序并与共有序列进行比对。 最后,利用得分矩阵计算每个位点上单个核苷酸出现的频率,以此来推测在外显子序列 上e s e 基序结合的s r 蛋白的类型( 表1 1 ) m 4 1 1 。 癌症相关点突变共同定位的外显子剪接增强子( e s e ) 特征分析 表1 1s r 蛋白识别的e n a 基序 t a b 1 1r n am o t i f sr e c o g n i z e db yh u m a ns rp r o t e i n s 注1 ) 核苷酸标识:m ,a c ;r ,a g ;w ,a u :y ,c u ;s ,c g :k ,g u 1 2 3 外显子剪接增强子的预测 目前,已经有许多分子生物学和生物信息学的方法都可以成功预测得到外显子上存 在的e s e 基序。其中主要方法有:导向突变法、权重矩阵法、e s e f i n d e r 在线预测软件 ( h t t p :r u l a i c s h l e d u e s e )和r e s c u e - e s e在线预测软件 ( b 主主乜;么么兰堕! 垒i :曼兰b ! :金鱼坠么璺g i 二鱼i 旦么主q q ! 墨z 曼s 曼圣么) 等。 其中,e s e f i n d e r 预测软件是人们最常用来预测e s e 基序的生物信息学软件。该软 件利用序列权矩阵的得分对e s e 基序进行预测,同时对候选的e s e 基序进行分类也 就是对e s e 基序结合的s r 蛋白类型进行判断。通过权矩阵得分预测e s e 基序的价值是, 通常外显子上富含高得分e s e 基序并且e s e 基序成簇的区域包含该外显子固有的e s e 基 序阻删。z a t k o v a 等人通过实验证明e s e f i n d e r 预测软件可以正确预测得到e s e 基序h 别。 最近,另外一种被叫做r e s c u e e s e 的计算方法也可以用来预测外显子上的e s e 基 序。该方法是由w i l l i a mg f a i r b r o t h e r 等人开发的,主要通过分析内含子与外显子 交接区和外显子与外显子交接区剪接位点的强弱,结合统计学方法来预测剪接相关的 e s e 基序。并且通过对高通量数据的分析,初步预测了1 0 个存在于人类基因中的外显子 剪接增强子h 鲫。 鉴于对e s e 基序成熟的预测方法,本文对癌症相关基因中可能存在的e s e 基序进行 了预测。 辽宁师范大学硕士学位论文 1 3 点突变与e s e 基序之间的关系 剪接信号区是遗传疾病和癌症相关突变最频繁发生的区域。k r a w c z a k 等人通过调 查,估算至少有1 5 的点突变是因为r n a 剪接的紊乱而导致遗传疾病的h 制。这个结果得 到了人类基因突变数据库( h u m a ng e n em u t a tio nd a t e b a s e ,h g m d ) 的支持实验证 实1 6 ,0 0 0 个点突变是通过扰乱剪接而导致疾病的。目前,绝大多数数据库中已证实的 突变数据主要是通过对基因组d n a 分析得出。然而,突变对m r n a 或编码蛋白影响的预 测则主要是通过对主要序列的分析完成的( 如剪接位点,顺式或反式作用元件) ,而不 是通过实验确定m r n a 的表达和剪接模式。因此,人们将发生在内含子区域内并且影响 剪接位点共有序列的点突变认为是剪接突变;而将发生在编码序列上同时没有产生异常 剪接位点的点突变认为是错义突变、无义突变和沉默突变。 许多报告已经指出,在编码区特定的点突变与外显子跳跃是相关的。最近,科学家 们在d n a 和r n a 水平对神经纤维瘤i 型病( t h en e u r o f i b r o m a t o s ist y p e1 ) 和共济失 调毛细血管扩张症( a t a x i at e l a n g i e c t a s i am u t a t e d ) 患者的n f l 和a t m 突变基因中 存在的突变进行了系统的分析h5 矧。结果发现5 0 ( 分别为1 6 5 2 和3 0 6 2 ) 的患者, 疾病的发生是由于基因突变而导致异常剪接引起的或者是因为外显子跳跃或者是 因为激活了潜在的剪接位点。鉴于此,本文分析了癌症相关点突变与剪接之间的关系。 点突变很可能改变对正常剪接起主要调控作用的顺式作用元件。其中,通过改变e s e 基序而扰乱正常剪接的主要模式如图1 4 。当点突变意外地发生在e s e 基序内时,导致 了s r 蛋白不能正确的识别相应的e s e 基序,这样就使该外显子不能被正确剪接而导致 了该外显子的跳跃。 e 壬爿圣向一 正 e 七连里妇一圃 i v , 1e x o n i n t r o n 口e s e宁p o i n tm u t a t i o n i 图1 4 点突变扰乱e s e 的模式图 f 遮i 4 t h em o d e l p i c t u r eo fp o i n tm u t a t i o n sd i s r u p te s e 在许多研究中,这种通过扰乱e s e 基序而引起的外显子跳跃已得到了实验证实。例 如,乳腺癌易感基因( t h eb r e a s tc a n c e rs u s c e p t i b i l i t yg e n e ,b r c a l ) 外显子1 8 上 癌症相关点突变共同定位的外显子剪接增强子( e s e ) 特征分析 的无义突变e 1 6 9 4 x 导致了外显子的跳跃。利用e s e 得分矩阵对外显子1 8 序列进行分析 表明的,e 1 6 9 4 x 无义突变使一个预测得到的e s e 基序不能被s r 蛋白s f 2 a s f 识别。进 一步分析表明,该外显子的保留与外显子是否存在高得分的e s e 基序相关m 1 。当e s e 基 序分析扩展到人类疾病基因中其他5 0 个导致外显子跳跃的点突变时,超过一半的单核 苷酸替代至少破坏了一个高得分的e s e 基序m 1 。另外在洲( s p i n a lm u s c u l a ra t r o p h y ) 基因外显子7 中,研究者利用生物信息学软件预测得到的一个e s e 基序被废除。在体内 和体外利用尉州衍生的小基因进行实验表明,洲基因外显子7 的保留取决于s r 蛋白 s f 2 a s f 是否能够正确结合同源的e s e 基序。特别是,当对突变改变的e s e 基序重新调 整为能与s f 2 a s f 直接结合的共有序列时,该外显子又能被正确的剪接h 。这个结果再 一次强调生物信息学工具的重要性,它们可以精确地预测到e s e 基序及确定这些e s e 基 序被哪种剪接因子识别。这将为正确区分导致非正常剪接的突变与基因多态性提供可靠 的工具: 这些研究结果都表明当外显子顺式作用元件受到干扰时会影响到外显子的正常剪 接,并且不恰当的外显子跳跃是普遍存在的现象。鉴于此,本文主要就位于e s e 基序上 的癌症相关点突变进行研究。 1 4 小结 如上所述,疾病相关点突变与外显子剪接增强子之间存在着紧密的联系。那么,目 前人类最关注的疾病之一癌症,癌症相关点突变是否也会更多的出现在e s e 位点 上? 如果是的话,那么大多数癌症相关点突变是否同样是因为剪接的扰乱而导致癌症? 到目前为止,仍没有较系统的进行研究。尽管,研究者们也通过单个实验证明了癌症相 关点突变可以通过改变e s e 基序从而导致外显子跳跃引起疾病,但分子生物学研究发现 仅限于一个或少数几个基因的研究。生物信j 息学研究方法则可以通过将大量的癌症相关 点突变与预测的e s e 基序结合起来,对癌症相关点突变进行较系统的分析研究。这将为 进一步揭示癌症的发病机理及对点突变的正确分类都具有十分重要的意义。随着外显子 剪接增强子预测软件的逐渐完善以及公共数据库数据量的迅速增加,为利用生物信息学 研究和揭示疾病相关点突变与e s e 之间的关系创造了机遇。 辽宁师范大学硕士学位论文 2 癌症相关点突变共同定位的外显子剪接增强子特征分析 2 1 引言 2 1 1 癌症相关点突变与外显子剪接增强子相互关系的分析 点突变导致癌症的主要根源之一。目前研究者们最关注的问题是:为什么点突 变是有害的? 这种有害性除了直接对其编码的氨基酸序列和蛋白结构产生影响外,是否 还对外显子上其他功能元件产生作用? 最近几项研究表明,一些点突变的有害性是因为它们扰乱了顺式作用元件外显 子剪接增强子( e s e ) 。但是。目前仍不清楚点突变引起相应e s e 基序改变的有害作用 是否普遍存在。近年来,也有很多研究者利用分子生物学和生物信息学方法,通过对单 个或几个基因进行实验证明了疾病相关点突变与e s e 之间存在着紧密的相关性。但是, 到目前为止并没有研究者利用生物信息学方法对导致具体某一类疾病的点突变与e s e 之 间的相互关系进行系统的研究。同时,突变数据库可以被看作一个基因的功能组织足迹, 因此可用于推断其功能组织。 鉴于此,本文应用人类疾病突变基因数据库( h u m a ng e n em u t a t i o nd a t e b a s e ,h g m d ) n 钔,从库中分析得到了1 ,2 2 7 个癌症相关点突变并对这些点突变进行了较系统的特征分 析。同时,结合e s e 预测软件e s e f i n d e r 对这些癌症相关点突变是否定位于e s e 基序进 行了统计分析以确定与它们之间的关系。 2 1 2 癌症相关点突变共同定位的外显子剪接增强子特征分析 近期的研究结果显示,癌症发生的主要原因之一是由于点突变导致e s e 基序不能正 确的结合剪接因子s r 蛋白,从而使剪接信号减弱或消失引起外显子跳跃导致的。那 么,就是说癌症相关点突变很可能与外显子剪接增强子之间存在着某种共存关系。 但是到目前为止,仍没有对这些癌症相关点突变共同定位的e s e 基序进行系统的生 物信息学研究。这些与癌症相关点突变共同定位的e s e 基序是否存在着某些共有特征? 它们在分布上是否遵循着某种规律? 它们的基序是否存在某些位点是点突变经常发生 的位点? 它们的共有序列与已知的共有序列相比较,保守性更大还是突变性更大? 这些 问题到目前为止仍不十分清楚。 鉴于此,本文利用生物信息学和统计学相结合的方法,对统计得到的癌症相关点突 变共同定位的e s e 基序进行了系统的特征分析。分析得到的结果,将对点突变的正确分 类以及e s e 基序更准确的预测产生重要的影响。 癌症相关点突变共同定位的外显子剪接增强子( e s e ) 特征分析 2 2 材料和方法 2 2 1 材料 人类基因突变数据库( h u m a ng e n em u t a t i o nd a t e b a s e ,h g m d ) ( h 主羔巳;么么型:h 趔垒:璺:垒璺:坠基么垒璺么i 翌垒星墨:巳虹) 为研究学者和非盈利组织提供了6 4 ,9 7 1 个突变数据( 公开发布的) ,其中大多数的突变( 3 7 ,4 2 3 ) 为错义突变n 9 1 。 为了对癌症相关点突变的特征以及它们是否定位于e s e 基序进行研究,利用人类基 因突变数据库得到了1 ,2 2 7 个癌症相关点突变。同时对这些点突变在编码区上的位置, 突变类型,密码子的改变,氨基酸的改变以及点突变导致癌症的类型进行了提取( 附录 a 1 ,附录a 2 ) 。 得到的1 ,2 2 7 个癌症相关点突变分布在9 9 个人类疾病基因中。同时提取了这9 9 个 疾病基因的基因符号,染色体上的位置,基因的编码序列,及一些其他的基因相关信息 ( 表2 1 ) 。 2 2 2 方法 ( 1 ) 外显子剪接增强子的预测 将得到的9 9 个带有癌症相关点突变的疾病基因编码序列,通过在线软件 e s e f i n d e r 3 0 ( h t t p :r u l a i c s h l e d u c g i b i n t o o l s e s e 3 ) 预测可能存在的e s e 基 序“7 1 。e s e f i n d e r 预测软件是根据不同的权矩阵来判断s r 蛋白家族中s f 2 a s f 蛋白,s c 3 4 蛋白,s r p 4 0 蛋白和s r p 5 5 蛋白所结合的e s e 基序。我们应用了软件推荐的阈值:七聚 物s f 2 a s f 蛋白1 9 5 6 ,八聚物s c 3 5 蛋白2 3 8 3 ,七聚物s r p 4 0 蛋白2 6 7 ,六聚物s r p 5 5 蛋白2 6 7 6 。同时,去除了位于外显子与外显子交接处的e s e 基序,并且计算了每个外 显子和每个基因e s e 基序所占的比值。最后,判断癌症相关点突变是否与e s e 基序共同 定位( 附录a 1 ,附录a 2 ) ,以及点突变在相应e s e 基序上的位置。 ( 2 ) “保守型”和“根本型 突变的分类 氨基酸可以根据所带的电荷分为三类:带正电荷的( r ,h ,k ) ,带负电荷的( d ,e ) , 和不带电荷的( a ,n ,c ,q ,g ,i ,l ,m ,f ,p ,s ,t ,w ,y ,v ) 4 8 o 然后,将癌症 相关错义突变根据氨基酸的改变分为“保守型”突变和“根本型 突变:如果氨基酸的 改变在同一类中进行,即为“保守型 突变;如果氨基酸在两类中进行改变,即为“根 本型 突变旧1 。因为,无义突变导致的结果是在转录m r n a 上产生了提前终止的密码子, 所以并不能将其根据氨基酸改变进行“保守型”和“根本型 突变的分类。 ( 3 ) e s e 共有序列的获得 辽宁师范大学硕士学位论文 从e s e
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学数学哪个数字不见了
- 规二路西延工程环境影响报告书
- 2025年高考山东数学真题及答案
- 日本换驾照考试题及答案
- 公安编制考试真题及答案
- 2025年大工机械考研真题及答案
- 灼烫应急预案风险分析(3篇)
- 2025年小学成语答题题库及答案
- 童装O2O竞争策略-洞察与解读
- 驾校智力测试题目及答案
- 【社区工作者真题试卷】未来教育2025年社区工作者考试及答案
- 2025年杭州入团考试题库及答案
- 东方航空秋招笔试题及答案
- 2025年大学《文化遗产-国际文化遗产保护》考试备考试题及答案解析
- 《快乐的小河》新课标课件(第二课时)
- 法学生职业规划
- 2025年河北廊坊霸州市公安局公开招聘警务辅助人员100名考试笔试备考试题及答案解析
- 数据安全管理培训
- 2025年双十一全网销售数据解读报告
- 狼疮脑病的护理
- 《海滨小城》教学课件(第二课时)
评论
0/150
提交评论