版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、可变剪接分析主要内容n可变剪接介绍n使用UCSC Genome browser分析n可变剪接成因分析n其它分析工具及数据库n基因表达谱一、可变剪接介绍 可变剪接 (alternative splicing) 即一个mRNA 前体通过不同的内含子去除方式可以获得不同成熟mRNA 。 可变剪接示意图可变剪接是生物多样性的重要成因可变剪接是生物多样性的重要成因高等生物与低等生物的基因数量并没有特别显著的差别,如人的基因估计约30000-40000,小鼠的基因也为30000左右,而且人鼠基因有很多存在有很高的相似性。果蝇、线虫等基因约为15000,基因数量的差别不足以解释以上物种间存在的显著差异。据估
2、计,人40-60%的基因存在可变剪接形式。通过可变剪接,产生多种蛋白产物,放大了对不同物种基因组的差别,极大的扩展了不同物种的变化空间。可变剪接与蛋白质组可变剪接与蛋白质组可变剪接的生理意义可变剪接的生理意义n可变剪接与基因表达的时空性息息相关,在不同时期,不同组织基因的表达形式可能不同,与物种发育的不同时期对应。n可变剪接的调控与生物体的健康息息相关,其突变可以直接导致疾病。 1.1 可变剪接背景知识n内含子剪接信号 内含子剪接需要区分外显子及内含子,识别信号主要包括 内含子5 及 3 末端序列及中间分支点(branch site)附近的序列。内含子剪接信号n内含子5 剪接点称为供体点(do
3、nor site),3剪接点称为受体点(acceptor site)。n内含子开始和末尾的两对碱基最为保守,大多数情况为 GU-AG (约占99.24%),少数为GC-AG(约占0.7%), 极少数为AT-AC(0.05%)。除了这两对保守碱基外,他们附近的碱基在不同物种间存在差异,但在物种内有保守性。如如脊椎动物5剪接信号AG|GUAAGU 。内含子剪接信号n分支点(branch site)通常位于3剪接点上游50bp,处于一段富含嘧啶的区域,分支点腺嘌呤附近区域为YNYURAY 。剪接识别信号剪接体n剪接由剪接体(spliceosome)催化完成。剪接体主要由几个核糖蛋白亚基组成,每个亚基
4、都由RNA链和蛋白组成。另外还有几十个小多肽参与构成剪接体。n剪接体分主要剪接体(major spliceosome) 和次要剪接体(minor spliceosome)。前者主要针对剪接信号为GU-AG模式的内含子,包括U1,U2,U4,U5,U6等亚基,后者主要对应AT-AC模式,由另外一组亚基组成 。剪接过程,U1结合donor site, U2结合branch site, U4,U5,U6连结U1,U21.2 可变剪接的主要模式n可变剪接主要有四种模式: 内含子不切割 5或3切点竞争 外显子跳过 外显子互斥可变剪接的主要模式内含子不剪切切点竞争外显子跳过外显子互斥可变剪接的结果n由于采
5、用不同的外显子,导致编码蛋白质的不同,有时会出现蛋白提前终止,起到分子开关的作用。1.3 可变剪接的调控n可变剪接的调控机制目前还不清楚。但越来越多的研究表明,可变剪接的调控是通过基因序列上的顺式作用元件和核内反式作用分子的相互作用进行的。可变剪接的调控主要的顺式作用元件有: ESE: exon splicing enhancer 外显子剪接增强子外显子剪接增强子 ISE: intron splicing enhancer 内含子剪接增强子内含子剪接增强子 ESS: exon splicing silencer 外显子剪接沉默子外显子剪接沉默子 ISS: intron splicing sil
6、encer 内含子剪接沉默子内含子剪接沉默子 反式作用因子nSR 蛋白 因富含serine/arginine 得名,该蛋白通常含有一至两个RNA 识别模体(RRM,RNA Recognition Motif),羧基端有RS结构域(RS 二肽富集区)。 RRM负责介导RNA结合,决定各SR蛋白的底物特异性。RS结构域主要参与蛋白-蛋白相互作用。SR 蛋白nSR蛋白主要与外显子剪接增强元件ESE结合,通过直接招募剪接体蛋白或是拮抗剪接抑制因子的作用来发挥作用。 nSR蛋白主要对5位点的选择起作用: 通过招募剪接体蛋白如U2AF或是U1-70K,在pre-mRNA的两个或多个5可变剪接位点中促进选择
7、使用距内含子3端较近的5位点。 其它反式作用蛋白n其它如hnRNP蛋白,多聚嘧啶序列结合蛋白(PTB),CELF蛋白家族等等也有各自不同的调节作用。nESE 与SR 蛋白的作用模式可能是可变剪接调控中最普遍的调控形式。已有实验表明由于外显子中剪接增强子序列的突变不能与SR蛋白结合可以导致外显子的跳过(exon skipping)。 二、可变剪接的分析n可变剪接的分析主要包括剪接体序列的校正,剪接体之间的比较,以及剪接机制的探索。剪接体序列的校正n克隆试验得到的mRNA 往往不是全长,测序反应也不能保证100%的正确,所以拿到一条序列首先要对其进行校正,尽可能保证使全长序列且无错误。n校正可以通
8、过剪接体序列与EST数据及基因组的比对进行。剪接体序列的校正n与EST及基因组的比对可以到NCBI使用BLAST进行,根据多数原则进行修正。但这样做每次只能查看一条序列,没有一个总体的概念。因此我们推荐使用加州大学圣克鲁兹分校提供的Genome Browser 进行。2.1 UCSC Genome BrowsernGenome Browser 是美国加州大学圣克鲁兹分校(University of California, Santa Cruz)开发的一套基因组注释浏览工具。其特点是以基因组区域为单位把相关注释信息整合在一个直观的界面上。( ) Gen
9、ome Browser 简介nGenome Browser 可以理解为一个基因组的浏览器,选择一定区域后,则会显示在该区域内的一系列性质,如图谱信息(STS,FISH clone, chromosome band),定位在该区域的已知基因情况以及通过基因预测软件预测的基因情况,与该段基因组匹配的mRNA 与 EST信息,人与其它物种如小鼠,大鼠,黑猩猩基因组的比对情况等等,都直观的显示在一张图上。Genome Browser 使用nGenome Browser提供一个与基因组比对的程序blat, 用户可以提交序列用blat进行基因组定位。Blat 提交界面可以从下拉菜单中选择不同基因组Blat
10、 结果可以看到QUERY AY174119为用户提交序列,比对得分为742, 提交序列全长774,其中4-755的序列可以匹配在16号染色体正链区域(66376615-66389357),有99.6%的匹配序列与提交序列完全相同。“details”为比对的文本显示,“browser”为在Genome Browser中查看结果 Details 结果图中显示有四个block, 即提交序列可以分为四个区段与染色体上四个区域对应,即有四个外显子。蓝色区域为完全匹配,浅蓝色为比对区域的边缘序列,可以理解为外显子边界Details 结果点击每个block 可以看到对应的外显子序列,block之间可以认为是
11、内含子序列,可以观察是否符合GT-AG 或是GC-AG模式Genome Browser 中的结果基因图中每个方块对应一个外显子,方块之间带有箭头的连线对应基因组上的内含子序列。箭头的方向代表序列转录的方向(5-3)。Genome Browser 中的结果基因跨度约12.7k。在该区域中有23个已知基因(根据SWISS-PROT, TREMBL, Refseq数据库中的注释),在本例中这23个基因都对应着一个基因(cklfsf1)23个不同的剪接形式。 Genome Browser 中的结果该组剪接体总体分为两组,第一组包括上方20条序列,起始位点相同。第二组包括最后三条序列,其起始位点在第一组
12、序列中的内含子区域。两组序列共有7个外显子区域。Genome Browser 中的结果从图上看造成不同剪接体的原因有三种:转录起始位点不同。第二组序列起始点位于第一组序列内含子区域,可能表明该附近区域可能有启动子活性。外显子的跳越现象。3,4,5,6外显子均存在被切除的现象。剪接位点的偏移。在同一外显子区域,外显子的大小不同(对应方块的大小不同),可能是由于内含子内存在多个相邻的剪接信号,导致不同的剪接结果。 查看EST支持nGenome Browser 提供的一个重要资源是EST在染色体上的定位信息,其基本做法是把EST数据与基因组作比对后,按照最好的匹配结果将EST唯一的定位到基因组上。
13、n通过EST可以对不同剪接体提供佐证Genome browser 中的EST 数据分为两个集合:已剪接EST集合(human ests that have been spliced)包括未剪接EST的所有EST集合(human ests including unspliced) 后者包括前者。已剪接EST集合是与基因组比对后可以被分成多个外显子结构,且外显子之间的序列符合内含子剪接位点模式(GT-AG模式)的EST。全部EST集合则不考虑是否含有剪接位点,其中可能有染色体污染和一些未经剪接的EST数据。Spliced ESTTotal ESTsEST 数据选择n整条序列在染色体上以单外显子形式
14、出现很可能是染色体污染。一般优先看已剪接EST数据对基因的支持情况,如数量不足再看包含未剪接EST的所有EST集合改变查看区域n在browser 里可以任意移动查看,改变位置的方法有两种,一是直接输入定位数字,二是通过窗口下方的方向箭头移动。 改变查看区域查看其它性质n有些注释信息默认不显示,用户可以在browser下方选择显示。比如查看spliced EST使用Genome Browser 获得序列使用genome browser除了可以浏览基因的相关信息外,还可以很方便的获取想得到的基因组序列。方法是通过browser 上方的DNA 连结。使用Genome Browser 获得序列出现的页
15、面框中为要获得序列的位置,可以改变范围或是包括任意长上游或下游序列,比如要分析启动子序列,可以选取基因起始点上游1K的序列。 (如果序列与基因组序列互补,应向后取)2.2 可变剪接成因分析n从Genome browser 中可以看到,上例中不同剪接体的形成的主要原因可能是采用了不同的启动子或是出现了外显子的跳过现象。这就促使我们考虑采用不同的手段预测可能导致这些剪接出现的原因。 (1) 寻找潜在的启动子Cold Spring Harbor的Michael Zhang 小组开发的FirstEF程序针对第一外显子和启动子的预测,其准确度在同类软件中较高,因此选用该程序对我们序列进行预测。实际上在g
16、enome browser中也包括firstexon 预测结果。 该软件网址/tools/FirstEF/FirstEF 结果promoter 区为预测的启动子区域,exon 为预测的第一个exon区域,点击可查看具体位置信息。该程序预测66376104-66376673为启动子区域,第一外显子区域为66376604-66376834或是66376604-66377167。第一组序列的起始位置为66,376,615 , 第二组序列的起始位置为66,376,969。已有实验证明第一组序列的启动子可能在其上游约1.5Kb处,故此处的启动子可能为第二组序列的启
17、动子。FirstEF 预测n单独预测时可以先把基因序列定位到基因组上,在从上游多取1000bp,跟原序列一起去作预测。不能只提交上游序列,因为该程序同时预测第一外显子,如不带外显子区则打分会低于阈值而无结果返回。 其它启动子预测软件nPromoterinspectorhttp:/www.genomatix.de/cgi-bin/promoterinspector/promoterinspector.plnFunSitePhttp:/compel.bionet.nsc.ru/FunSite/fsp.htmlnCpGProD http:/pbil.univ-lyon1.fr/software/cp
18、gprod.htmlnPromoter 2.0http:/www.cbs.dtu.dk/services/Promoter/ (2)外显子跳过n有试验证明,很多外显子的跳过是由于外显子内部的ESE (exon splicing enhancer) 序列发生突变,导致不能与SR蛋白结合而引起外显子的跳过。因此可以考察跳过外显子内部的SR结合序列的情况SR 蛋白结合序列预测n已知的SR蛋白主要有四种,SF2/AF, SC35, SRp40, SRp55, 各自有不同的RNA结合序列。同样是由Michael Zhang 实验室开发的ESE finder可以预测RNA中 这 些 蛋 白 的 结 合 位
19、 点 。/ESE/ 提交序列2号外显子预测预测结果分析n根据预测结果,2号外显子中含有比较显著的外显子剪接增强子序列,导致跳过的原因可能与局部突变有关。虽然未必一定是由于SR蛋白的作用,也许其它顺式作用元件与反式作用因子起了重要作用,这里的预测只能为试验提供线索。2.3 其它分析工具和数据库n可变剪接比对 多个不同剪接体的序列比对,不同于一般的多序列比对,不同剪接形式之间可能存在较大的gap,比对结果不够精确。Asalign (alternative splicing align) 是专门针对可变剪接体比对设计的程序,比对结果更加精确。5/Asalign.html 可变剪接数据库nGeneNest gene indices http:/genenest.molgen.mpg.de/ nEASED: Extended Alternatively Spliced EST Databas
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 房屋租赁合同(保障性住房·2025合规版)
- 2026-2031年中国紫外线吸收剂UV-1市场调研分析及投资战略研究报告
- 2025重庆铜梁区福果镇人民政府招聘备考题库附答案详解(培优)
- 2025广东广州市荔湾区龙津街除四害消毒管理站招聘1人备考题库及参考答案详解
- 2025安康平利县城市管理综合执法大队协管员招聘备考题库及完整答案详解一套
- 2026年陕西省选调生招录备考题库(面向中央财经大学)及答案详解(考点梳理)
- 2025宁波象山县总工会公开招聘工会社会工作者3人备考题库含答案详解(a卷)
- 2025年河北省石家庄市深泽县公开招聘社区工作者13名备考题库附答案详解(综合卷)
- 2026中信银行西安分行校园招聘备考题库附答案详解(完整版)
- 2026上海中和所长期招募实习生3人备考题库含答案详解(满分必刷)
- 贵州国企招聘:2025贵州凉都能源有限责任公司招聘10人备考题库完整答案详解
- 航空油料员岗位招聘考试试卷及答案
- 并购居间协议书范本
- 谢鸿飞民法典合同编课件
- Unit5Whatanadventure!StartingoutListening课件-高中英语外研版
- 2025国家外汇管理局中央外汇业务中心校园招聘笔试历年参考题库附带答案详解
- 2025吉林吉林市舒兰市总工会招聘工会社会工作者8人考试笔试参考题库附答案解析
- 大学生职业生涯规划与就业创业指导教学教案
- 杜城村道路施工方案
- 2025及未来5年渗水砖项目投资价值分析报告
- 2024南京交通职业技术学院辅导员招聘笔试真题
评论
0/150
提交评论