第三代测序技术(单分子实时DNA测序)与第二代测序技术(高通量测序技术)简介_第1页
第三代测序技术(单分子实时DNA测序)与第二代测序技术(高通量测序技术)简介_第2页
第三代测序技术(单分子实时DNA测序)与第二代测序技术(高通量测序技术)简介_第3页
第三代测序技术(单分子实时DNA测序)与第二代测序技术(高通量测序技术)简介_第4页
第三代测序技术(单分子实时DNA测序)与第二代测序技术(高通量测序技术)简介_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 第三代测序技术(单分子实时 DNA测序)与第二代测序技术(高通量测序技术) 简介 第三代测序技术简介 如果有人告诉你用显微镜实时观测单分子 DNA 聚合酶复制 DNA,并用它来测序,你一定会认为他异想天开,没有一点生物的 sense。 我最初就是这样认为的,然而它不仅可以实现,而且已经实现了!这个就是被称为第三代的测序技术, Pacific Biosciences公司推出的 “Single Molecule Real Time (SMRT) DNA Sequencing”(单分子实时 DNA测序)。 我有幸在 NIH听到 了这个技术发明人 Stephen Turner博士的讲座,根据自己粗浅的理解记录整理一下。 要实现单分子实时测序,有三个关键的技术。 第一个是荧光标记的脱氧核苷酸。显微镜现在再厉害,也不可能真的实时看到 “单分子 ”。但是它可以实时记录荧光的强度变化。当荧光标记的脱氧核苷酸被掺入DNA链的时候,它的荧光就同时能在 DNA链上探测到。当它与 DNA链形成化学键的时候,它的荧光基团就被 DNA聚合酶切除,荧光消失。这种荧光标记的脱氧核苷酸不会影响 DNA聚合酶的活性,并且在荧光被切除之后,合成的 DNA链和天然的 DNA链完全一 样。 第二个是纳米微孔。因为在显微镜实时记录 DNA链上的荧光的时候, DNA链周围的众多的荧光标记的脱氧核苷酸形成了非常强大的荧光背景。这种强大的荧光背景使单分子的荧光探测成为不可能。 Pacific Biosciences公司发明了一种直径只有几十纳米的纳米孔 zero-mode waveguides (ZMWs),单分子的 DNA聚合酶被固定在这个孔内。在这么小的孔内, DNA链周围的荧光标记的脱氧核苷酸有限,而且由于 A, T, C, G 这四种荧光标记的脱氧核苷酸非常快速地从外面进入到孔内又出去,它们形成了非常稳定 的背景荧光信号。而当某一种荧光标记的脱氧核苷酸被掺入到 DNA链时,这种特定颜色的荧光会持续一小段时间,直到新的化学键形成,荧光基团被 DNA聚合酶切除为止(见图)。 2 第三个是共聚焦显微镜实时地快速地对集成在板上的无数的纳米小孔同时进行记 录。由于我对显微原理的物理知识匮乏,而 Pacific Biosciences公司又没有非常强调在这方面的发明,不做进一步探讨。 他们还对这一技术进行进一步的优化。 第一个是把双链 DNA 环化反复测序。人们可以在双链 DNA 的两头连上发夹结构的 DNA adaptor,从而使 DNA环化。而 DNA聚合酶就能够以环化的 DNA作为模板滚环复制,反复测一段 DNA序列。这种反复测序,纠正了偶尔出现的复制错误,从而使测序精度非常高。 第二个是激发光中断测序法。 DNA 聚合酶虽然很稳定,但是在强大的激发光作用下酶也是有一定寿命的。 如果把激发光中断一段时间,在这段时间内 DNA聚合酶继续复制 DNA,当激发光重新开启以后,人们就可以测到长 DNA链后面的序列。 第三代测序技术非常可怕。 1、它实现了 DNA 聚合酶内在自身的反应速度,一秒可以测 10个碱基,测序速度是化学法测序的 2万倍。 2、它实现了 DNA聚合酶内在自身的 processivity(延续性,也就是 DNA聚合酶一次可以合成很长的片 3 段),一个反应就可以测非常长的序列。 二代测序现在可以测到上百个碱基,但是三代测序现在就可以测几千个碱基。这为基因组的重复序列的拼接提供了非常好的条件。 3、它的 精度非常高,达到 99.9999%。 此外,它还有两个应用是二代测序所不具备的。 第一个是直接测 RNA的序列。既然 DNA聚合酶能够实时观测,那么以 RNA为模板复制 DNA的逆转录酶也同样可以。 RNA的直接测序,将大大降低体外逆转录产生的系统误差。 第二个是直接测甲基化的 DNA序列。实际上 DNA聚合酶复制 A、 T、 C、 G的速度是不一样的。正常的 C 或者甲基化的 C 为模板, DNA聚合酶停顿的时间不同。根据这个不同的时间,可以判断模板的 C 是否甲基化。 Pacific Biosciences公司预计 2010年或者 2011年就 会推出商业化的测序仪器。在不远的将来,如果他们能和二代测序一样集成 100万个纳米微孔,那么一台仪器15 分钟就能够准确地测出一个人的基因组。以后每个人的基因组测序成本将变成 100美元,人人都可以消费得起。想想人类基因组计划耗资 30亿美元,费时十几年,无数科学家参与其中,技术的革新意义是多么重大啊! 高通量测序技术 第二代测序技术 高通量测序技术是对传统测序一次革命性的改变,一次对几十万到几百万条DNA 分子进行序列测定,因此在有些文献中称其为下一代测序技术 (next generation sequencing)足见其划时代的改变,同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序 (deep sequencing)。 自从 2005年 454 Life Sciences公司( 2007年该公司被 Roche正式收购)推出了454 FLX 焦磷酸测序平台( 454 FLX pyrosequencing platform)以来,曾推出过 4 3730xl DNA 测序仪( 3730xl DNA Analyzer)的 Applied BioSystem( ABI)这家一直占据着测序市场最大份额的公司的领先地位就开始动摇了,因为他们的拳头产 品 毛 细 管 阵 列 电 泳 测 序 仪 系 列( series capillary array electrophoresis sequencing machines)遇到了两个强有力的竞争对手,一个就是罗氏公司 (Roche)的 454 测序仪 (Roch GS FLX sequencer),另一个就是 2006 年美国 Illumina 公司推出的 Solexa 基因组分析平台( Genome Analyzer platform),为此, 2007年 ABI公司推出了自主研发的 SOLiD 测序仪 (ABI SOLiD sequencer)。这三个测序平台即为目前高通量测序平台的代表。(见表一) 公司名称 技术原理 技术开发者 商业模式 Apply Biosystems(ABI) 基于磁珠的大规模并行克隆连接DNA测序法 美国 Agencourt 私人基因组学公司( APG) 上市公司: 销售设备和试剂获取利润 Illumina 合成测序法 英国 Solexa公司首席科学家 David Bentley 上市公司: 销售设备和试剂获取利润 Roche 大规模并行焦磷酸合成测序法 美国 454 Life Sciences公司的创始人 Jonathan Rothberg 上市公司: 销售设备和试剂获取利润 Helicos 大规模并行单分子合成测序法 美国斯坦福大学生物工程学家 Stephen Quake 上市公司: 2007年 5月首次公开募股( IPO) Complete Genomics DNA 纳米阵列与组合探针锚定 连接测序法 美国 Complete Genomics公司首席科学家 radoje drmanac 私人公司:投资额为4650万美元 表一:主流测序平台一览 这些平台共同的特点是极高的测序通量,相对于传统测序的 96 道毛细管测序,高通量测序一次实验可以读取 40万到 400万条序列。读取长度根据平台不同从 5 25bp到 450bp,不同的测序平台在一次实验中,可以读取 1G到 14G不等的碱基数,这样庞大的测序能力是传统测序仪所不能比拟的。尽管如此,在这项新的划时代的测序技术刚出现的时候,科学界对这项新技术却并不热衷。许多 习惯用桑格技术的科学家怀疑新技术的准确度、阅读能力、成本消费、实用性。代理 Sanger型测序硬件的经销商害怕其投资失败而首先提出了这些怀疑。 图一:在芯片上进行的测序: Illumina测序平台 然而大多数人却忽略了一个事实,即桑格 技术的普及最初也遇到同样的阻碍。桑格技术刚开发出来时,阅读能力很难超过 25bp,即使在 Fred Sanger双脱氧终止法发明后也只达到 80bp,如今却达到了 750bp;而新发展的合成测序技术,应用焦磷酸测序方法,其阅读能力最初只有 100bp,推向市场 16个月后增加至 250bp,随着技术的不断完善,目前已达到了 400bp,很快就接近桑格技术目前的水平。除了阅读能力外,能否以有限的成本用一台仪器产生足够数量的序列标记也是另一个需要改善的重要问题。这个问题已经被 Roche公司解决了,应用他们的系统,仅花费阅读 35bp或者更小片段的成本就能产生比 35bp多 10倍的序列标记。 6 图二: GS FLX 高通量测序方法原理示意图 一、高通量测序的应用 高通量测序可以帮助研究者跨过文库构建这一实验步骤,避免了亚克隆过程中引入的偏差。 依靠后期强大的生物信息学分析能力,对照一个参比基因组 (reference genome)高通量测序技术可以非常轻松完成基因组重测序 (re-sequence), 2007 年van Orsouw等人结合改进的 AFLP 技术和 454 测序技术对玉米基因组进行了重测序,该重测序实验发现的超过 75%的 SNP位点能够用 SNPWave技术验证,提供了一条对复杂基因组特别是含有高度重复序列的植物基因组进行多态性分析的技术路线。 2008年 Hillier对线虫 CB4858 品系进行 Solexa重测序,寻找线虫基因组中的 SNP 位 点和单位点的缺失或扩增。但是也应该看到,由于高通量测序读取长度的限制,使其在对未知基因组进行从头测序 (novo sequencing)的应用受到限制,这部分工作仍然需要传统测序 (读取长度达到 850 碱基 )的协助。但是这并不影响高通量测序技术在全基因组 mRNA 表达谱, microRNA 表达谱,ChIP-chip以及 DNA甲基化等方面的应用。 2008年 Mortazavi等人对小鼠的大脑、肝脏和骨骼肌进行了 RNA 深度测序,这项工作展示了深度测序在转录组研究上的两大进展,表达计数和序列分析。对测得的每条序列进行计 数获得每个特定转录本的表达量,是一种数码化的表达谱检测,能检测到丰度非常低的转录本。分析测得的序列,有大于 90%的数据显示落在已知的外显子中,而那些在已知序列之外的信息通过数据分析展示的是从未被报道过的 RNA剪切形式, 3端非翻译区,变动的启动子区域以及潜在的小 RNA 前体,发现至少有 3500 个基因拥有不止一种剪切形式。而这些信息无论使用芯 7 片技术还是 SAGE文库测序都是无法被发现的。 高通量测序另一个被广泛应用的领域是小分子 RNA 或非编码 RNA(ncRNA)研究。测序方法能轻易的解决芯片技术在检测小分子时遇 到的技术难题 (短序列,高度同源 ), 而且小分子 RNA 的短序列正好配合了高通量测序的长度,使得数据 “不浪费 ”,同时测序方法还能在实验中发现新的小分子 RNA。在衣藻、斑马鱼、果蝇、线虫、人和黑猩猩中都已经成功地找到了新的小分子 RNA。在线虫中获得了 40 万个序列,通过分析发现了 18个新的小 RNA分子和一类全新的小分子 RNA。 在 DNA蛋白质相互作用的研究上,染色质免疫沉淀 深度测序 (ChIP-seq)实验也展示了其非常大的潜力。染色质免疫沉淀以后的 DNA 直接进行测序,对比 ref seq可以直接获得蛋白与 DNA结合的位点信息,相比 ChIP-chip, ChIP-seq可以检测更小的结合区段、未知的结合位点、结合位点内的突变情况和蛋白亲合力较低的区段。 图 三 : Independent Flow Cells( SoLidTM System) 二、高通量测序的前景 目前,大多分析家都无法相信新一代测序技术能完全取代目前的芯片测序技术。不过,有些分析家也的确认为芯片测序技术正面临着挑战,他们认为到了 2012年新一代的测序技术将会带来高达 2。 15亿美元的产值。 2006 年,整个芯片测序市场大概价值 8 亿美元,其中 65%的市场份额都是有关基因表达谱分析产品的,剩下 35%的市场份额则由基因型分析芯片占据。不过美国哈佛大学( Harvard University)遗传学教授 George Church认为,这部分市场 8 也会受到新一代测序技术的冲击。 重测序芯片( resequencing arrays)、单核苷酸多态性分析芯片以及基因拷贝数目变异分析芯( copy number variant array)市场也会受到影响。也有分析家不赞同这个观点,他们认为即使新一代测序技术很便宜,还是有不少人会选择传统的测序仪的。 新一代测序技术相对传统芯片测序技术的优势,最终还得依靠广告和市场营销手段的推广才能获得大众的认可。去年夏天,由 Frost & Sullivan 公司对学术科研机构和私人研究团体进行的一项调查研究结果表明,在实际应用领域,例如进行表达谱分析时,人 们还是倾向于选择传统的芯片产品,而并非青睐新一代的测序产品。 新一代测序仪推广困难可能由其价格昂贵导致。平均采购一台新一代测序仪大约要花费 50万美元,除非该实验室测序的工作量非常大,否则是不会考虑购买的。即使像 Polonator这样的新一代测序仪也需要花费 15万美元左右,这笔费用对于一个小实验室来说是无法承受的。这时,只需要 150美元一块的芯片就非常有竞争力了。以基因芯片产品享誉业界的美国 Affymetrix 公司市场部副总裁 Jay Kaufman认为,新一代测序技术对于芯片市场来说的确会带来一定的冲击,不过要完全取代表达谱分析芯片还需要一定的时间。 但是,基因芯片也有其自身的缺点,就在于它是一个 “封闭系统 ”,它只能检测人们已知序列的特征 (或有限的变异 )。而高通量测序的强项, 就在于它是一个 “开放系统 ”, 它的发现能力和寻找新的信息的能力,从本质上高于芯片技术。 研究者可以充分享受这两个平台的比较优势,在获取新信息的基础上,利用芯片的强项, 即对已知信息的高通量、低成本 (相对 )的检测能力, 对大量样品进行快速检测,短时间内获得有大量有效的数据。 作为两个高通量的基因组学研究技术,在应用的某些方面存在重叠和竞争, 但是在更多方面是优势互补,两种方法联合使用,将解决以前的单种技术难以解决的问题。 三、结语 新一代测序已显示出巨大的潜力。也正是因为科学的不断进步,在给测序技术提出新要求的时候,也给这项技术带来了新的增长点: 9 2008年 4月 Helico BioScience公司的 Timothy等人在 Science上报道了他们开发的真正的单分子测序技术,也被称为第三代测序技术,并利用该技术对一个 M13病毒基因组进行重测序。这项技术之所以被称为真正的单分子测序,是因为它完全跨过了上述 3 种高通量测序依赖的基于 PCR 扩增的信号 放大过程,真正达到了读取单个荧光分子的能力,向 1000 美元测定一个人类基因组的目标迈出了一大步。 基于半导体技术的纳米孔测序技术 技术在新型测序技术中的重要作用。 新一代测序技术,即第三代测序技术,不同于前两代测序,第一代测序技术是双脱氧链末端终止法 根据核苷酸在某一固定的点开始,随机在某一个特定的碱基处终止,产生 A, T, C, G 四组不同长度的一系列核苷酸,然后在尿素变性的 PAGE胶上电泳进行检测,从而获得 DNA序列。第二代测序技术是焦磷酸测序法 由 4种酶催化的同一反应体系中的酶级联化学发光反应,适 于对已知的短序列的测序分析。 而第三代测序技术则是基于纳米孔的单分子读取技术,这种方法读取数据更快、有望大大降低测序成本,改变个人医疗的前景。这一技术的研发是系统工程,涉 10 及生物、半导体、计算机、化学、光学等多个领域,需要不同学科 顶尖力量的合作。 Science文章重点提到了其中的半导体技术,离子激流公司( Ion Torrent)的测序仪就是一种硅芯片,是利用与半导体一样的方式构建的,利用这种技术,科学家们在 Science杂志上公布了三个低成本的完整人类基因组序列。 这种高质量,低成本(文章还报道了不同样本的测序成本,包括了从 $8,005( 87x coverage)到 $1,726( 45x coverage)的范围)的基因组测序方法能帮助研究人员对成千上百个某种疾病患者的完整基因组序列进行分析,从而获得对这种疾病的深入了解,最终找出预 防和治疗的方法。 基于半导体技术的纳米孔测序技术, DNA 分子依靠被称为核酸外切酶的蛋白质以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论