全基因组表达谱分析方法(dge)_第1页
全基因组表达谱分析方法(dge)_第2页
全基因组表达谱分析方法(dge)_第3页
全基因组表达谱分析方法(dge)_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

全基因组表达谱分析方法(DGE)-基于新一代测 序技术的 技术路线 该方法首先从每个 mRNA 的 3端酶切得到一段 21bp 的 TAG 片段(特异性标记 该基因);然后通过高通量测序,得到大量的 TAG 序列,不同的 TAG 序列 的数 量就代表了相应基因的表达量;通过生物信息学分析得到 TAG 代表的基因、基 因表达水平、以及样品间基因表达差异等信息。技术路线如下: 1、 样品准备: a) 提供浓度300ng/ul、总量6ug、OD260/280 为 1.82.2 的总 RNA 样品; 2、 样品制备(见图 1-1): a) 类似 SAGE 技术,通过特异性酶切的方法从每个 mRNA 的 3末端得到一段 21bp 的特异性片段,用来标记该基因,称为 TAG; b) 在 TAG 片段两端连接上用于测序的接头引物; 3、 上机测序: a) 通过高通量测序每个样品可以得到至少 250 万条 TAG 序列; 4、 基本信息分析: a) 对原始数据进行基本处理,得到高质量的 TAG 序列; b) 通过统计每个 TAG 序列的数量,得到该 TAG 标记的基因的表达量; c) 对 TAG 进行注释,建立 TAG 和基因的对应关系; d) 基因在正义链和反义链上表达量间的关系; e) 其它统计分析; 5、 高级信息分析: a) 基因在样品间差异表达分析; b) 库容量饱和度分析; c) 其它分析; 测序优势 利用高通量测序进行表达谱研究的优势很明显,具体如下: 1数字化信号:直接测定每个基因的特异性表达标签序列,通过计数表达标签 序列的数目来确定该基因的表达量,大大提高了定量分析的准确度。整体表达 差异分布符合正态分布,不会因为不同批次实验引起不必要的误差。 2可重复性高:不同批次的表达谱度量准确,能够更准确的进行表达差异分析。 3高灵敏度:对于表达差异不大的基因能够灵敏的检测其表达差异;能够检测 出低丰度的表达基因。 4全基因组分析,高性价比:由于该技术不用事先设计探针,而是直接测序的 方式,因此无需了解物种基因信息,可以直接对任何物种进行包括未知基因在 内的全基因组表达谱分析,因此性价比很高。 5高通量测序:已有数据表明,当测序通量达到 200 万个表达标签时,即可得 到样本中接近全部表达基因的表达量数据,而目前每个样本分析可以得到 300 万600 万个表达标签。 6无需重复实验。 7可同时发现新的转录本、基因组表达调控区域等。 8完整深入的生物信息学分析支持,更有助于进行重要的科学发现,发高质量 的文章。 表达谱案例分析 肺癌组织的表达谱分析:选取 2 个肺癌病人(5T 和 10T)的组织提取总 RNA, 进行分析。 实验目的:为了检测两个病人中表达差异较大的基因,以便找出两个病人症状 差异的原因,并进行下一步相关的研究。 1、 数据质量的概述 通过严格的质量标准筛选后,通过率达到 80%,最终得到 500 万左右的 Tag 标 签。 2、 标签的初步分析统计 两个样品中有 95%的 Tag 重复频度超过 1,73%以上的 Tag 重复频度超过 50。 3、 表达谱测序饱和度分析 通过对表达谱测序饱和度的分析,通常在表达谱 Tag 数目达到 200 万时,测序 Tag 接近饱和。因此,通过 Solexa 测序,仅需要 1 次试验,就可以得到足够后 续进行表达分析的数据。 4、 样品重复性。 5、 Tag 标签的注释(含 cDNA,预测基因,EST,线粒体基因组,基因组等) 本案例中,人的 2 万 7 千个基因中有 5060%都被 Tag 所覆盖。即一般的基因的 表达量差异被检测出来。为了提高 Tag 同基因关联的可信度,我们仅仅选取了 在基因序列中唯一定位的 Tag。这部分唯一定位的 Tag 占全部 Tag 数目的 50%左 右。 另外,除去上述用于基因表达量统计的唯一定位 Tag,有大约 20%的 Tag 被定位 到了基因组的未注释区域,其中大约有 10 万个 Tag 在基因组上的位置是唯 一 的。利用这些数据我们找到了许多新的转录本和调控区域。同时发现了若干潜 在的两个样品间显著差异的区域。为后续的实验提供了可靠的研究目标。 6、 参考 Tag 标签的统计分析 下表显示的人的参考 Tag 的统计信息,我们可以看到 96.53%的基因都拥有 Tag。说明 Tag-based 新一代测序技术的方法进行表达谱分析的可行性 7、 基因表达量的分布统计 8、 样本间表达差异基因的相关分析 通过对表达差异基因的统计和分析,我们可以选取样品间表达存在差异的基因, 反馈给用户;此外一些已经报道可能相关的基因,是这一部分研究的重点,通 过表达差异,我们可以推测出相关基因可能发生的变化。针对此例,图 3-3 中 2 个基因是已经报道的在 10T 样品中高表达的基因。 9、 样本间表达差异

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论