三代基因组测序技术原理简介_第1页
三代基因组测序技术原理简介_第2页
三代基因组测序技术原理简介_第3页
三代基因组测序技术原理简介_第4页
三代基因组测序技术原理简介_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

三代基因组测序技术原理简介 图 1 测序技术的发展历程 生命体遗传信息的快速获得对于生命科学的研究有着十分重要的意义 以上 图 1 所描述的是自沃森和克里克在 1953 年建立 DNA 双螺旋结构以来 整个测序技术的发展历程 第一代测序技术 第一代 DNA 测序技术用的是 1975 年由桑格 Sanger 和考尔森 Coulson 开创的链终止法或者是 1976 1977 年由马克西姆 Maxam 和吉尔伯 特 Gilbert 发明的化学法 链降解 并在 1977 年 桑格测定了第一个基因组序列 是噬菌体 X174 的 全长 5375 个碱基 1 自此 人类获得了窥探生 命遗传差异本质的能力 并以此为开端步入基因组学时代 研究人员在 Sanger 法的多年实践之中不断对其进行改进 在 2001 年 完成的首个人类基因组 图谱就是以改进了的 Sanger 法为其测序基础 Sanger 法核心原理是 由于 ddNTP 的 2 和 3 都不含羟基 其在 DNA 的合成过程中不能形成磷酸二酯 键 因此可以用来中断 DNA 合成反应 在 4 个 DNA 合成反应体系中分别加入一定比例带有放射性同位素标记的 ddNTP 分为 ddATP ddCTP ddGTP 和 ddTTP 通过凝胶电泳和放射自显影后可以根据电泳带的位置确定待测分子的 DNA 序列 图 2 这个网址为 sanger 测序法制作了一个小短片 形 象而生动 值得注意的是 就在测序技术起步发展的这一时期中 除了 Sanger 法之外还出现了一些其他的测序技术 如焦磷酸测序法 链接酶法等 其中 焦磷 酸测序法是后来 Roche 公司 454 技术所使用的测序方法 2 4 而连接酶测序法是后来 ABI 公司 SOLID 技术使用的测序方法2 4 但他们的共同核心手段都是 利用了 Sanger1中的可中断 DNA 合成反应的 dNTP 图 2 Sanger 法测序原理 第二代测序技术 总的说来 第一代测序技术的主要特点是测序读长可达 1000bp 准确性高达 99 999 但其测序成本高 通量低等方面的缺点 严重影响了其真正大 规模的应用 因而第一代测序技术并不是最理想的测序方法 经过不断的技术开发和改进 以 Roche 公司的 454 技术 illumina 公司的 Solexa Hiseq 技 术和 ABI 公司的 Solid 技术为标记的第二代测序技术诞生了 第二代测序技术大大降低了测序成本的同时 还大幅提高了测序速度 并且保持了高准确性 以前完成一个人类基因组的测序需要 3 年时间 而使用二代测序技术则仅仅需要 1 周 但在序列读长方面比起第一代测序技术则要短很多 表 1 和图 3 对第 一代和第二代测序技术各自的特点以及测序成本作了一个简单的比较 5 以下我将对这三种主要的第二代测序技术的主要原理和特点作一个简单的介绍 图 3 测序成本的变化 1 Illumine Illumina 公司的 Solexa 和 Hiseq 应该说是目前全球使用量最大的第二代测序机器 这两个系列的技术核心原理是相同的 2 4 这两个系列的 机器采用的都是边合成边测序的方法 它的测序过程主要分为以下 4 步 如图 4 1 DNA 待测文库构建 利用超声波把待测的 DNA 样本打断成小片段 目前除了组装之外和一些其他的特殊要求之外 主要是打断成 200 500bp 长的序列片段 并 在这些小片段的两端添加上不同的接头 构建出单链 DNA 文库 2 Flowcell Flowcell 是用于吸附流动 DNA 片段的槽道 当文库建好后 这些文库中的 DNA 在通过 flowcell 的时候会随机附着在 flowcell 表面的 channel 上 每个 Flowcell 有 8 个 channel 每个 channel 的表面都附有很多接头 这些接头能和建库过程中加在 DNA 片段两端的接头相互配 对 这就是为什么 flowcell 能吸附建库后的 DNA 的原因 并能支持 DNA 在其表面进行桥式 PCR 的扩增 3 桥式 PCR 扩增与变性 桥式 PCR 以 Flowcell 表面所固定的接头为模板 进行桥形扩增 如图 4 a 所示 经过不断的扩增和变性循环 最终每个 DNA 片段都将在各 自的位置上集中成束 每一个束都含有单个 DNA 模板的很多分拷贝 进行这一过程的目的在于实现将碱基的信号强度放大 以达到测序所需的信 号要求 4 测序 测序方法采用边合成边测序的方法 向反应体系中同时添加 DNA 聚合酶 接头引物和带有碱基特异荧光标记的 4 中 dNTP 如同 Sanger 测 序法 这些 dNTP 的 3 OH 被化学方法所保护 因而每次只能添加一个 dNTP 在 dNTP 被添加到合成链上后 所有未使用的游离 dNTP 和 DNA 聚合酶会被洗脱掉 接着 再加入激发荧光所需的缓冲液 用激光激发荧光信号 并有光学设备完成荧光信号的记录 最后利用计算机分析 将光学信号转化为测序碱基 这样荧光信号记录完成后 再加入化学试剂淬灭荧光信号并去除 dNTP 3 OH 保护基团 以便能进行下一轮的测 序反应 Illumina 的这种测序技术每次只添加一个 dNTP 的特点能够很好的地解决同聚物长度的准确测量问题 它的主要测序错误来源是碱基的 替换 目前它的测序错误率在 1 1 5 之间 测序周期以人类基因组重测序为例 30 x 测序深度大约为 1 周 图 4 Illumina 测序流程 1 Roche 454 Roche 454 测序系统是第一个商业化运营二代测序技术的平台 它的主要测序原理是 图 5 abc 2 1 DNA 文库制备 454 测序系统的文件构建方式和 illumina 的不同 它是利用喷雾法将待测 DNA 打断成 300 800bp 长的小片段 并在片段两端加上不同的接头 或将待测 DNA 变性后用杂交引物进行 PCR 扩增 连接载体 构建单链 DNA 文库 图 5a 2 Emulsion PCR 乳液 PCR 其实是一个注水到油的独特过程 454 当然 DNA 扩增过程也和 illumina 的截然不同 它将这些单链 DNA 结合在水油包被的直径约 28um 的磁珠上 并在其上面孵育 退火 乳液 PCR 最大的特点是可以形成数目庞大的独立反应空间以进行 DNA 扩增 其关键技术是 注水到油 水包油 基本过程是在 PCR 反应前 将包含 PCR 所有反应成分的水溶液注入到高速旋转的矿物油表面 水溶液瞬间形成无数个被矿物油包裹的小水滴 这些小水滴就构成了独立的 PCR 反 应空间 理想状态下 每个小水滴只含一个 DNA 模板和一个磁珠 这些被小水滴包被的磁珠表面含有与接头互补的 DNA 序列 因此这些单链 DNA 序列能够特异地结合在磁珠上 同时孵育体系中含有 PCR 反应试 剂 所以保证了每个与磁珠结合的小片段都能独立进行 PCR 扩增 并且扩增产物仍可以结合到磁珠上 当反应完成后 可以破坏孵育体系并将带有 DNA 的磁珠富集下来 进过扩增 每个小片段都将被扩增约 100 万倍 从而达到下一步测序所要求的 DNA 量 3 焦磷酸测序 测序前需要先用一种聚合酶和单链结合蛋白处理带有 DNA 的磁珠 接着将磁珠放在一种 PTP 平板上 这种平板上特制有许多直径约为 44um 的 小孔 每个小孔仅能容纳一个磁珠 通过这种方法来固定每个磁珠的位置 以便检测接下来的测序反应过程 测序方法采用焦磷酸测序法 将一种比 PTP 板上小孔直径更小的磁珠放入小孔中 启动测序反应 测序反应以磁珠上大量扩增出的单链 DNA 为模 板 每次反应加入一种 dNTP 进行合成反应 如果 dNTP 能与待测序列配对 则会在合成后释放焦磷酸基团 释放的焦磷酸基团会与反应体系中的 ATP 硫酸化学酶反应生成 ATP 生成的 ATP 和荧光素酶共同氧化使测序反应中的荧光素分子并发出荧光 同时由 PTP 板另一侧的 CCD 照相机记录 最后通过计算机进行光信号处理而获得最终的测序结果 由于每一种 dNTP 在反应中产生的荧光颜色不同 因此可以根据荧光的颜色来判断被测分子的 序列 反应结束后 游离的 dNTP 会在双磷酸酶的作用下降解 ATP 从而导致荧光淬灭 以便使测序反应进入下一个循环 由于 454 测序技术中 每 个测序反应都在 PTP 板上独立的小孔中进行 因而能大大降低相互间的干扰和测序偏差 454 技术最大的优势在于其能获得较长的测序读长 当前 454 技术的平均读长可达 400bp 并且 454 技术和 illumina 的 Solexa 和 Hiseq 技术不同 它最主要的一个缺点是无法准确测量同聚物的长度 如当 序列中存在类似于 PolyA 的情况时 测序反应会一次加入多个 T 而所加入的 T 的个数只能通过荧光强度推测获得 这就有可能导致结果不准确 也正 是由于这一原因 454 技术会在测序过程中引入插入和缺失的测序错误 图 5 Roche 454 测序流程 1 Solid 技术 Solid 测序技术是 ABI 公司于 2007 年开始投入用于商业测序应用的仪器 它基于连接酶法 即利用 DNA 连接酶在连接过程之中测序 图 6 2 4 它的原理是 图 6 a Solid 测序技术 1 DNA 文库构建 片段打断并在片段两端加上测序接头 连接载体 构建单链 DNA 文库 2 Emulsion PCR Solid 的 PCR 过程也和 454 的方法类似 同样采用小水滴 emulsion PCR 但这些微珠比起 454 系统来说则要小得多 只有 1um 在扩增的 同时对扩增产物的 3 端进行修饰 这是为下一步的测序过程作的准备 3 修饰的微珠会被沉积在一块玻片上 在微珠上样的过程中 沉积小室 将每张玻片分成 1 个 4 个或 8 个测序区域 图 6 a Solid 系统最大的优点就是每张玻片能容纳比 454 更高密度的微珠 在同一系统中轻松实 现更高的通量 3 连接酶测序 这一步是 Solid 测序的独特之处 它并没有采用以前测序时所常用的 DNA 聚合酶 而是采用了连接酶 Solid 连接反应的底物是 8 碱基单链 荧光探针混合物 这里将其简单表示为 3 XXnnnzzz 5 连接反应中 这些探针按照碱基互补规则与单链 DNA 模板链配对 探针的 5 末 端分别标记了 CY5 Texas Red CY3 6 FAM 这 4 种颜色的荧光染料 图 6 a 这个 8 碱基单链荧光探针中 第 1 和第 2 位碱基 XX 上的 碱基是确定的 并根据种类的不同在 6 8 位 zzz 上加上了不同的荧光标记 这是 Solid 的独特测序法 两个碱基确定一个荧光信号 相当于一 次能决定两个碱基 这种测序方法也称之为两碱基测序法 当荧光探针能够与 DNA 模板链配对而连接上时 就会发出代表第 1 2 位碱基的荧光 信号 图 6 a 和图 6 b 中的比色版所表示的是第 1 2 位碱基的不同组合与荧光颜色的关系 在记录下荧光信号后 通过化学方法在第 5 和第 6 位碱基之间进行切割 这样就能移除荧光信号 以便进行下一个位置的测序 不过值得注意的是 通过这种测序方法 每次测序的位置都相差 5 位 即第一次是第 1 2 位 第二次是第 6 7 位 在测到末尾后 要将新合成的链变性 洗脱 接着用引物 n 1 进行第二轮测序 引物 n 1 与 引物 n 的区别是 二者在与接头配对的位置上相差一个碱基 图 6 a 8 也即是 通过引物 n 1 在引物 n 的基础上将测序位置往 3 端移动一 个碱基位置 因而就能测定第 0 1 位和第 5 6 位 第二轮测序完成 依此类推 直至第五轮测序 最终可以完成所有位置的碱基测序 并且每 个位置的碱基均被检测了两次 该技术的读长在 2 50bp 后续序列拼接同样比较复杂 由于双次检测 这一技术的原始测序准确性高达 99 94 而 15x 覆盖率时的准确性更是达到了 99 999 应该说是目前第二代测序技术中准确性最高的了 但在荧光解码阶段 鉴于其是双碱基 确定一个荧光信号 因而一旦发生错误就容易产生连锁的解码错误 图 6 b Solid 测序技术 第三代测序技术 测序技术在近两三年中又有新的里程碑 以 PacBio 公司的 SMRT 和 Oxford Nanopore Technologies 纳米孔单分子测序技术 被称之为第三代测序 技术 与前两代相比 他们最大的特点就是单分子测序 测序过程无需进行 PCR 扩增 其中 PacBio SMRT 技术其实也应用了边合成边测序的思想 5 并以 SMRT 芯片为测序载体 基本原理是 DNA 聚合酶和模板结合 4 色荧光标记 4 种 碱基 即是 dNTP 在碱基配对阶段 不同碱基的加入 会发出不同光 根据光的波长与峰值可判断进入的碱基类型 同时这个 DNA 聚合酶是实现超长读长的 关键之一 读长主要跟酶的活性保持有关 它主要受激光对其造成的损伤所影响 PacBio SMRT 技术的一个关键是怎样将反应信号与周围游离碱基的强大荧光 背景区别出来 他们利用的是 ZMW 零模波导孔 原理 如同微波炉壁上可看到的很多密集小孔 小孔直径有考究 如果直径大于微波波长 能量就会在衍射 效应的作用下穿透面板而泄露出来 从而与周围小孔相互干扰 如果孔径小于波长 能量不会辐射到周围 而是保持直线状态 光衍射的原理 从而可起保护 作用 同理 在一个反应管 SMRTCell 单分子实时反应孔 中有许多这样的圆形纳米小孔 即 ZMW 零模波导孔 外径 100 多纳米 比检测激光波长小 数百纳 米 激光从底部打上去后不能穿透小孔进入上方溶液区 能量被限制在一个小范围 体积 20X 10 21 L 里 正好足够覆盖需要检测的部分 使得信号仅来自这个小 反应区域 孔外过多游离核苷酸单体依然留在黑暗中 从而实现将背景降到最低 另外 可以通过检测相邻两个碱基之间的测序时间 来检测一些碱基修饰情况 既如果碱基存在修饰 则通过聚合酶时的速度会减慢 相邻两峰之间的距离增大 可以通过这个来之间检测甲基化等信息 图 7 SMRT 技术的测序速度 很快 每秒约 10 个 dNTP 但是 同时其测序错误率比较高 这几乎是目前单分子测序技术的通病 达到 15 但好在它的出错是随机的 并不会像第二 代测序技术那样存在测序错误的偏向 因而可以通过多次测序来进行有效的纠错 图 7 PacBio SMRT 测序原理 Oxford Nanopore Technologies 公司所开发的纳米单分子测序技术与以往的测序技术皆不同 它是基于电信号而不是光信号的测序技术 5 该技术的 关键之一是 他们设计了一种特殊的纳米孔 孔内共价结合有分子接头 当 DNA 碱基通过纳米孔时 它们使电荷发生变化 从而短暂地影响流过纳米孔的 电流强度 每种碱基所影响的电流变化幅度是不同的 灵敏的电子设备检测到这些变化从而鉴定所通过的碱基 图 8 该公司在去年基因组生物学技术进展年会 AGBT 上推出第一款商业化的纳米孔测序仪 引起了科学界的极大关注 纳米孔测序 和其他第三代测序技术 有望解决目前测序平台的不足 纳米孔测序的主要特点是 读长很长 大约在几十 kb 甚至 100 kb 错误率目前介于 1 至 4 且是随机错误 而不是聚 集在读取的两端 数据可实时读取 通量很高 30 x 人类基因组有望在一天内完成 起始 DNA 在测序过程中不被破坏 以及样品制备简单又便宜 理论上 它也能 直接测序 RNA 纳米孔单分子测序计算还有另一大特点 它能够直接读取出甲基化的胞嘧啶 而不必像传统方法那样对基因组进行 bisulfite 处理 这对于在基因组水平 直接研究表观遗传相关现象有极大的帮助 并且改方法的测序准确性可达 99 8 而且一旦发现测序错误也能较容易地进行纠正 但目前似乎还没有应用该 技术的相关报道 图 8 纳米孔测序 其他测序技术 目前还有一种基于半导体芯片的新一代革命性测序技术 Ion Torrent6 该技术使用了一种布满小孔的高密度半导体芯片 一个小孔就是一个测序反 应池 当 DNA 聚合酶把核苷酸聚合到延伸中的 DNA 链上时 会释放出一个氢离子 反应池中的 PH 发生改变 位于池下的离子感受器感受到 H 离子信号 H 离子信号再直接转化为数字信号 从而读出 DNA 序列 图 9 这一技术的发明人同时也是 454 测序技术的发明人之一 Jonathan Rothberg 它 的文库和样本制备跟 454 技术很像 甚至可以说就是 454 的翻版 只是测序过程中不是通过检测焦磷酸荧光显色 而是通过检测 H 信号的变化来获得序列 碱基信息 Ion Torrent 相比于其他测序技术来说 不需要昂贵的物理成像等设备 因此 成本相对来说会低 体积也会比较小 同时操作也要更为简单 速度也相当快速 除了 2 天文库制作时间 整个上机测序可在 2 3 5 小时内完成 不过整个芯片的通量并不高 目前是 10G 左右 但非常适合小基因组和外 显子验证的测序 图 9 Ion Torrent 小结 以上 对各代测序技术的原理做了简要的阐述 这三代测序技术的特点比较汇总在以下表 1 和表 2 中 其中测序成本 读长和通量是评估该测序技术先 进与否的三个重要指标 第一代和第二代测序技术除了通量和成本上的差异之外 其测序核心原理 除 Solid 是边连接边测序之外 都是基于边合成边测序 的思想 第二代测序技术的优点是成本较之一代大大下降 通量大大提升 但缺点是所引入 PCR 过程会在一定程度上增加测序的错误率 并且具有系统偏向 性 同时读长也比较短 第三代测序技术是为了解决第二代所存在的缺点而开发的 它的根本特点是单分子测序 不需要任何 PCR 的过程 这是为了能有效 避免因 PCR 偏向性而导致的系统错误 同时提高读长 并要保持二代技术的高通量 低成本的优点 表 1 测序技术的比较 第 X 代公司平台名称测序方法检测方法 大约读长 碱基数 优点相对局限性 第一代ABI 生命技术公司 3130 xL 3730 xL 桑格 毛细管电泳 测序法 荧光 光学 600 1000 高读长 准确 度一次性达标 率高 能很好 处理重复序列 和多聚序列 通量低 样 品制备成本 高 使之难 以做大量的 平行测序 第一代贝克曼GeXP 遗传分析系统 桑格 毛细管电泳 测序法 荧光 光学 600 1000 高读长 准确 度一次性达标 率高 能很好 处理重复序列 和多聚序列 易小型化 通量低 单 个样品的制 备成本相对 较高 第二代 Roche 454 基因组测序仪 FLX 系统焦磷酸测序法光学 230 400 在第二代中最 高读长 比第 一代的测序通 量大 样品制备较 难 难于处 理重复和同 种碱基多聚 区域 试剂 冲洗带来错 误累积 仪 器昂贵 第二代 IlluminaHiSeq2000 HiSeq2500 MiSeq 可逆链终止物和合 成测序法 荧光 光

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论