




免费预览已结束,剩余55页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
可变剪接分析 yup 主要内容 可变剪接介绍使用UCSCGenomebrowser分析可变剪接成因分析其它分析工具及数据库基因表达谱 一 可变剪接介绍 可变剪接 alternativesplicing 即一个mRNA前体通过不同的内含子去除方式可以获得不同成熟mRNA 可变剪接示意图 可变剪接是生物多样性的重要成因 高等生物与低等生物的基因数量并没有特别显著的差别 如人的基因估计约30000 40000 小鼠的基因也为30000左右 而且人鼠基因有很多存在有很高的相似性 果蝇 线虫等基因约为15000 基因数量的差别不足以解释以上物种间存在的显著差异 据估计 人40 60 的基因存在可变剪接形式 通过可变剪接 产生多种蛋白产物 放大了对不同物种基因组的差别 极大的扩展了不同物种的变化空间 可变剪接与蛋白质组 可变剪接的生理意义 可变剪接与基因表达的时空性息息相关 在不同时期 不同组织基因的表达形式可能不同 与物种发育的不同时期对应 可变剪接的调控与生物体的健康息息相关 其突变可以直接导致疾病 1 1可变剪接背景知识 内含子剪接信号内含子剪接需要区分外显子及内含子 识别信号主要包括内含子5 及3 末端序列及中间分支点 branchsite 附近的序列 内含子剪接信号 内含子5 剪接点称为供体点 donorsite 3 剪接点称为受体点 acceptorsite 内含子开始和末尾的两对碱基最为保守 大多数情况为GU AG 约占99 24 少数为GC AG 约占0 7 极少数为AT AC 0 05 除了这两对保守碱基外 他们附近的碱基在不同物种间存在差异 但在物种内有保守性 如如脊椎动物5 剪接信号AG GUAAGU 内含子剪接信号 分支点 branchsite 通常位于3 剪接点上游50bp 处于一段富含嘧啶的区域 分支点腺嘌呤附近区域为YNYURAY 剪接识别信号 剪接体 剪接由剪接体 spliceosome 催化完成 剪接体主要由几个核糖蛋白亚基组成 每个亚基都由RNA链和蛋白组成 另外还有几十个小多肽参与构成剪接体 剪接体分主要剪接体 majorspliceosome 和次要剪接体 minorspliceosome 前者主要针对剪接信号为GU AG模式的内含子 包括U1 U2 U4 U5 U6等亚基 后者主要对应AT AC模式 由另外一组亚基组成 剪接过程 U1结合donorsite U2结合branchsite U4 U5 U6连结U1 U2 1 2可变剪接的主要模式 可变剪接主要有四种模式 内含子不切割5 或3 切点竞争外显子跳过外显子互斥 可变剪接的主要模式 内含子不剪切 切点竞争 外显子跳过 外显子互斥 可变剪接的结果 由于采用不同的外显子 导致编码蛋白质的不同 有时会出现蛋白提前终止 起到分子开关的作用 1 3可变剪接的调控 可变剪接的调控机制目前还不清楚 但越来越多的研究表明 可变剪接的调控是通过基因序列上的顺式作用元件和核内反式作用分子的相互作用进行的 可变剪接的调控 主要的顺式作用元件有 ESE exonsplicingenhancer外显子剪接增强子ISE intronsplicingenhancer内含子剪接增强子ESS exonsplicingsilencer外显子剪接沉默子ISS intronsplicingsilencer内含子剪接沉默子 反式作用因子 SR蛋白因富含serine arginine得名 该蛋白通常含有一至两个RNA识别模体 RRM RNARecognitionMotif 羧基端有RS结构域 RS二肽富集区 RRM负责介导RNA结合 决定各SR蛋白的底物特异性 RS结构域主要参与蛋白 蛋白相互作用 SR蛋白 SR蛋白主要与外显子剪接增强元件ESE结合 通过直接招募剪接体蛋白或是拮抗剪接抑制因子的作用来发挥作用 SR蛋白主要对5 位点的选择起作用 通过招募剪接体蛋白如U2AF或是U1 70K 在pre mRNA的两个或多个5 可变剪接位点中促进选择使用距内含子3 端较近的5 位点 其它反式作用蛋白 其它如hnRNP蛋白 多聚嘧啶序列结合蛋白 PTB CELF蛋白家族等等也有各自不同的调节作用 ESE与SR蛋白的作用模式可能是可变剪接调控中最普遍的调控形式 已有实验表明由于外显子中剪接增强子序列的突变不能与SR蛋白结合可以导致外显子的跳过 exonskipping 二 可变剪接的分析 可变剪接的分析主要包括剪接体序列的校正 剪接体之间的比较 以及剪接机制的探索 剪接体序列的校正 克隆试验得到的mRNA往往不是全长 测序反应也不能保证100 的正确 所以拿到一条序列首先要对其进行校正 尽可能保证使全长序列且无错误 校正可以通过剪接体序列与EST数据及基因组的比对进行 剪接体序列的校正 与EST及基因组的比对可以到NCBI使用BLAST进行 根据多数原则进行修正 但这样做每次只能查看一条序列 没有一个总体的概念 因此我们推荐使用加州大学圣克鲁兹分校提供的GenomeBrowser进行 2 1UCSCGenomeBrowser GenomeBrowser是美国加州大学圣克鲁兹分校 UniversityofCalifornia SantaCruz 开发的一套基因组注释浏览工具 其特点是以基因组区域为单位把相关注释信息整合在一个直观的界面上 http genome ucsc edu GenomeBrowser简介 GenomeBrowser可以理解为一个基因组的浏览器 选择一定区域后 则会显示在该区域内的一系列性质 如图谱信息 STS FISHclone chromosomeband 定位在该区域的已知基因情况以及通过基因预测软件预测的基因情况 与该段基因组匹配的mRNA与EST信息 人与其它物种如小鼠 大鼠 黑猩猩基因组的比对情况等等 都直观的显示在一张图上 GenomeBrowser使用 GenomeBrowser提供一个与基因组比对的程序blat 用户可以提交序列用blat进行基因组定位 Blat提交界面 可以从下拉菜单中选择不同基因组 Blat结果 可以看到QUERYAY174119为用户提交序列 比对得分为742 提交序列全长774 其中4 755的序列可以匹配在16号染色体正链区域 66376615 66389357 有99 6 的匹配序列与提交序列完全相同 details 为比对的文本显示 browser 为在GenomeBrowser中查看结果 Details结果 图中显示有四个block 即提交序列可以分为四个区段与染色体上四个区域对应 即有四个外显子 蓝色区域为完全匹配 浅蓝色为比对区域的边缘序列 可以理解为外显子边界 Details结果 点击每个block可以看到对应的外显子序列 block之间可以认为是内含子序列 可以观察是否符合GT AG或是GC AG模式 GenomeBrowser中的结果 基因图中每个方块对应一个外显子 方块之间带有箭头的连线对应基因组上的内含子序列 箭头的方向代表序列转录的方向 5 3 GenomeBrowser中的结果 基因跨度约12 7k 在该区域中有23个已知基因 根据SWISS PROT TREMBL Refseq数据库中的注释 在本例中这23个基因都对应着一个基因 cklfsf1 23个不同的剪接形式 GenomeBrowser中的结果 该组剪接体总体分为两组 第一组包括上方20条序列 起始位点相同 第二组包括最后三条序列 其起始位点在第一组序列中的内含子区域 两组序列共有7个外显子区域 GenomeBrowser中的结果 从图上看造成不同剪接体的原因有三种 转录起始位点不同 第二组序列起始点位于第一组序列内含子区域 可能表明该附近区域可能有启动子活性 外显子的跳越现象 3 4 5 6外显子均存在被切除的现象 剪接位点的偏移 在同一外显子区域 外显子的大小不同 对应方块的大小不同 可能是由于内含子内存在多个相邻的剪接信号 导致不同的剪接结果 查看EST支持 GenomeBrowser提供的一个重要资源是EST在染色体上的定位信息 其基本做法是把EST数据与基因组作比对后 按照最好的匹配结果将EST唯一的定位到基因组上 通过EST可以对不同剪接体提供佐证 Genomebrowser中的EST数据 分为两个集合 已剪接EST集合 humaneststhathavebeenspliced 包括未剪接EST的所有EST集合 humanestsincludingunspliced 后者包括前者 已剪接EST集合是与基因组比对后可以被分成多个外显子结构 且外显子之间的序列符合内含子剪接位点模式 GT AG模式 的EST 全部EST集合则不考虑是否含有剪接位点 其中可能有染色体污染和一些未经剪接的EST数据 SplicedEST TotalESTs EST数据选择 整条序列在染色体上以单外显子形式出现很可能是染色体污染 一般优先看已剪接EST数据对基因的支持情况 如数量不足再看包含未剪接EST的所有EST集合 改变查看区域 在browser里可以任意移动查看 改变位置的方法有两种 一是直接输入定位数字 二是通过窗口下方的方向箭头移动 改变查看区域 查看其它性质 有些注释信息默认不显示 用户可以在browser下方选择显示 比如查看splicedEST 使用GenomeBrowser获得序列 使用genomebrowser除了可以浏览基因的相关信息外 还可以很方便的获取想得到的基因组序列 方法是通过browser上方的DNA连结 使用GenomeBrowser获得序列 出现的页面框中为要获得序列的位置 可以改变范围或是包括任意长上游或下游序列 比如要分析启动子序列 可以选取基因起始点上游1K的序列 如果序列与基因组序列互补 应向后取 2 2可变剪接成因分析 从Genomebrowser中可以看到 上例中不同剪接体的形成的主要原因可能是采用了不同的启动子或是出现了外显子的跳过现象 这就促使我们考虑采用不同的手段预测可能导致这些剪接出现的原因 1 寻找潜在的启动子 ColdSpringHarbor的MichaelZhang小组开发的FirstEF程序针对第一外显子和启动子的预测 其准确度在同类软件中较高 因此选用该程序对我们序列进行预测 实际上在genomebrowser中也包括firstexon预测结果 该软件网址http rulai cshl org tools FirstEF FirstEF结果 promoter区为预测的启动子区域 exon为预测的第一个exon区域 点击可查看具体位置信息 该程序预测66376104 66376673为启动子区域 第一外显子区域为66376604 66376834或是66376604 66377167 第一组序列的起始位置为66 376 615 第二组序列的起始位置为66 376 969 已有实验证明第一组序列的启动子可能在其上游约1 5Kb处 故此处的启动子可能为第二组序列的启动子 FirstEF预测 单独预测时可以先把基因序列定位到基因组上 在从上游多取1000bp 跟原序列一起去作预测 不能只提交上游序列 因为该程序同时预测第一外显子 如不带外显子区则打分会低于阈值而无结果返回 其它启动子预测软件 Promoterinspectorhttp www genomatix de cgi bin promoterinspector promoterinspector plFunSitePhttp compel bionet nsc ru FunSite fsp htmlCpGProDhttp pbil univ lyon1 fr software cpgprod htmlPromoter2 0http www cbs dtu dk services Promoter 2 外显子跳过 有试验证明 很多外显子的跳过是由于外显子内部的ESE exonsplicingenhancer 序列发生突变 导致不能与SR蛋白结合而引起外显子的跳过 因此可以考察跳过外显子内部的SR结合序列的情况 SR蛋白结合序列预测 已知的SR蛋白主要有四种 SF2 AF SC35 SRp40 SRp55 各自有不同的RNA结合序列 同样是由MichaelZhang实验室开发的ESEfinder可以预测RNA中这些蛋白的结合位点 http exon cshl org ESE 提交序列2号外显子预测 预测结果分析 根据预测结果 2号外显子中含有比较显著的外显子剪接增强子序列 导致跳过的原因可能与局部突变有关 虽然未必一定是由于SR蛋白的作用 也许其它顺式作用元件与反式作用因子起了重要作用 这里的预测只能为试验提供线索 2 3其它分析工具和数据库 可变剪接比对多个不同剪接体的序列比对 不同于一般的多序列比对 不同剪接形式之间可能存在较大的gap 比对结果不够精确 Asalign alternativesplicingalign 是专门针对可变剪接体比对设计的程序 比对结果更加精确 http 166 111 30 65 Asalign html 可变剪接数据库 GeneNestgeneindiceshttp genenest molgen mpg de EASED ExtendedAlternativelySpliced
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教育孩子的发言稿
- 法国供应商培训
- 新能源课件大班
- PDCA循环工作方法培训课件
- 二零二五年高炮广告牌制作与城市地标建设合同
- 2025版商业综合体工程劳务承包与智能化合同
- 2025版智能制造业股权转手与增资升级合同
- 二零二五年度茶叶品牌营销策划合同样本
- 2025版墓地拆迁重建安置补偿合同
- 二零二五年度科技园区运维短期劳务合同范本
- 2025年燃气电厂笔试题库及答案
- 2025年科技咨询师考试题库
- 四川省凉山州2024-2025学年高一下册期末统一检测数学检测试卷
- 2025年道路运输两类人员安全员考试考核试题库答案
- 2025年历年医疗卫生卫健委面试真题及答案解析
- 2025年学法减分试题及答案
- 《智能建造概论》高职完整全套教学课件
- 心衰病人的观察与护理
- 2025年教育综合理论知识试题及答案
- 食品安全卫生试题及答案
- GB/T 30807-2025建筑用绝热制品浸泡法测定长期吸水性
评论
0/150
提交评论