高通量测序原理_第1页
高通量测序原理_第2页
高通量测序原理_第3页
高通量测序原理_第4页
高通量测序原理_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

利用onetouch生成油包水微滴(微球?)和PCR反应,利用RainDropDigitalPCR的sense检测(CCD)(454,SOLID,HISEQ,PACBIO,流式细胞仪,显微镜,单分子的光信号)454直到2005年,454推出了FLX焦磷酸测序平台美吉生物拥有罗氏454公司开发的第二代DNA高通量测序仪GenomeSequencerFLX+(GSFLX+)。GSFLX+的命名正是来源于其在多领域的灵活(flexible)应用。该系统性能的提升和应用领域的不断扩展,对大规模基因序列研究的相关应用领域产生了巨大的推动作用。试剂:GSFLXTitaniumsequencingKitXL+产量:100万序列∕Run读长:最高可达1000bp测序通量每次实验可以产生400~800Mb数据运行时间每次实验只需23h序列读长单条序列的平均读长在600bp以上序列质量单碱基准确率为99%序列产量平均每次实验可以产生100万条的序列应用:基因组denovo测序、转录组denovo测序、宏基因组测序、重测序Illumina1999年,Illumina只是一家拥有25人的初创公司,主要销售微阵列芯片(microarraychip),这种芯片可用来检测基因组上特定部位的重要变化。2007年,Illumina宣布以6亿美元收购基因测序公司Solexa,从而进军基因测序市场。Solexa的基因测试技术较竞争对手快百倍,且价格低廉。2013年收购了无创产前诊断公司VerinataHealth。自2005年以来,Illumina在并购领域的投资已超过12亿美元。2014年1月,Illumina发布了新款高端基因测序仪,可以准确测出全基因组序列,而成本还不到1000美元。[2]

高通量运行模式*快速运行模式*读长双流动槽(仅适用于HiSeq2500)单流动槽(HiSeq1500或2500)双流动槽运行时间双流动槽(仅适用于HiSeq2500)单流动槽(HiSeq1500或2500)双流动槽运行时间1×3695-105Gb47-52Gb2天18-22Gb9-11Gb7小时2×50270-300Gb135-150Gb5.5天50-60Gb25-30Gb16小时2×100540-600Gb270-300Gb11天100-120Gb50-60Gb27小时2×150N/AN/AN/A150-180Gb75-90Gb40小时通过过滤的读取最多30亿个单端读取或60亿个末端配对读取最多15亿个单端读取或30亿个末端配对读取

最多6亿个单端读取或12亿个末端配对读取最多3亿个单端读取或6亿个末端配对读取

质量在2x50时,≥85%的碱基高于Q30在2x100时,≥80%的碱基高于Q30在2x50时,≥85%的碱基高于Q30在2x100时,≥80%的碱基高于Q30在2x150时,≥75%的碱基高于Q30应用:基因组denovo测序、基因组重测序、转录组测序、小RNA测序、ChIP-Seq测序、甲基化测序平台概况

HiSeq2500:强大的测序仪如今更快更灵活[新品推荐]

HiSeq2000系统绝对是当前最广泛采用的新一代测序主流平台。HiSeq1500/2500系统是这个平台中的最新成员。相同的核心结构,整合最新进展如内置簇生成和快速运行模式,可实现最快的无人值守流程:能够在大约24小时内完成整个基因组的测序,即“一天一个基因组”。今年初,Illumina公司宣布推出HiSeq2500测序系统,能够让研究人员和临床医生能够在大约24小时内完成整个基因组的测序,即“一天一个基因组”。这款仪器的出现,让科学界兴奋不已。经过大半年的等待,HiSeq2500终于面世。同时上市的还有HiSeq1500系统。生物通

HiSeq1500/2500系统是世界上最广泛采用的新一代测序平台中的最新成员。HiSeq1500/2500系统具有与革命性的HiSeq2000系统相同的核心结构,并整合最新进展,如内置簇生成和快速运行模式,实现了最快的无人值守流程。前所未有的灵活性生物通

HiSeq2500系统是Illumina第一台特有两种运行模式的测序系统,包括快速运行和高产量运行模式,可使用一个或两个流动槽,使之成为一个灵活且可扩展的平台。快速运行模式提供快速的结果、数量有限样品的高效处理,以及更长的末端配对150bp读取,这带来了更深度的覆盖,并改善denovo应用的组装。高产量模式特别适合样品量较多的大型研究,或需要最深度覆盖的应用。高产量模式可处理的样品量是快速模式的~5倍,让大型项目可通过尽可能少的运行来完成。HiSeq2500的多个配置让产量可调,既能在7小时内获得~10Gb或~3亿个单端读取,又能在11天内获得600Gb或60亿个末端配对读取,这取决于应用需求或项目期限。高效的样品批处理从未如此简单,而周转时间也从未如此之快。HiSeq1500也具有这两种运行模式,支持单个流动槽,而不是两个。HiSeq1500/2500系统让您的实验室拥有前所未有的灵活性,以便支持最广泛的应用和研究规模。惊人的速度和通量生物通

快速运行模式是HiSeq系统设计上的一个革命性附加,它通过缩短的循环时间和内置的簇生成来显著加快运行。在快速运行模式下,您能够完成全自动的簇生成和测序,在一个工作日内实现短读取应用,或在一天多的时间内通过末端配对100bp读取实现全基因组测序应用。数据通量超过100Gb,因此一天内人类基因组的测序覆盖度超过30倍(图1)。在需要快速且准确的答案时,快速运行时间再加上卓越的数据质量很关键。快速运行模式的加速运行以及平行处理约6亿个测序模板的能力带来了现有测序系统中最高的每日通量。出色的数据质量生物通

高的数据质量是通过行业中最广泛采用的边合成边测序(SBS)技术的应用来确保的。HiSeq1500/2500系统的SBS技术利用专利的可逆终止子方法对数百万个片段进行测序,在单个碱基掺入增长的DNA链时检测它们。由于每个测序循环中四种与可逆终止子结合的dNTP都存在,故自然竞争让掺入偏向最小化,与其他技术相比大大降低了原始错误率。最终结果是高度准确的base-by-base测序,几乎避免了序列背景特异的错误,即使是在那些重复序列区和同聚物中。Illumina测序带来了行业中任何覆盖水平的最准确人类基因组、最高产量的无错误读取以及最高比例的>Q30碱基检出(图2)。卓越的数据质量和存储方案生物通

Illumina生物信息学的新发展包括数据压缩改善、测序比对算法更快,以及一套即插即用的数据计算和存储方案。HiSeq1500/2500软件将数据体积缩小50%以上,而不会损害数据质量。这允许产量加倍,而无需将数据存储能力扩大两倍。HiSeq1500/2500软件还能够与BaseSpace®实时连接,这是一种云计算环境,可实现实时的碱基检出、比对后的数据分析以及可扩展的数据存储。将数据上传至BaseSpace可实时进行,通常在运行完成几分钟后结束。BaseSpace中的数据上传、数据比对或变异检出不会产生任何额外的费用。研究人员可通过BaseSpace云端开展合作,与世界上的任何人即时安全地共享数据。生物通

BaseSpace还提供Illumina序列分析和比较软件(iSAAC™)-目前最快的比对软件。iSAAC软件的速度有了4-6倍的提高,可在几小时内将一个30x的基因组与参考基因组比对。比对可在BaseSpace中免费开展,或利用经济的商业化计算硬件开展。iSAAC软件对生物学家而言简单易用,而对生物信息学家而言又足够灵活,可访问并修改开放源代码。BaseSpace应用商店将提供更多的工具和软件,带来商业化、免费软件和用户开发应用的组合。研究人员也可使用IlluminaCompute™,这是一套即插即用的测序数据计算和存储方案。IlluminaCompute特有来自我们的合作伙伴Dell和EMCIsilon的行业领先技术,来自Illumina客户解决方案的安装和维护,以及一套预置的软件,用于数据处理、比对和变异检测。有了IlluminaCompute,实验室可在几周而不是几个月内全面投入运作,甚至无需预先购买IT设备。Illumina公司开发的MiSeq测序仪,它是Illumina公司于2011年2月推出的小型测序平台,是一台内置簇生成和数据产生的测序仪,具有测序速度快,数据准确的优点,可实现300bp×2的测序长度,具备革命性的便捷流程。读长时间总数据量Q301×36~4hrs540-610Mb﹥90%2×150~24hrs4.5-5.1Gb﹥80%2×250~39hrs7.5-8.5Gb﹥75%2×300~65hrs13.2-15Gb﹥70%应用:微生物多样性分析、宏基因组测序、转录组denovo测序、微生物基因组测序、小RNA测序、表达谱、ChIP-Seq性能参数:SolexaSOLiD3运行一次即获得50GBLeroyHood上世纪80年代中期设计了第一台自动荧光测序仪之后,ABI迅速收购了一家测序公司——AgencourtPersonalGenomics,并在2007年底推出了SOLiD新一代测序平台。SOLiD全称为supportedoligoligationdetetion,它的独特之处在于以四色荧光标记寡核苷酸的连续连接合成为基础,取代了传统的聚合酶连接反应,可对单拷贝DNA片段进行大规模扩增和高通量并行测序。就通量而言,SOLiD3系统是革命性的,目前SOLiD3单次运行可产生50GB的序列数据,相当于17倍人类基因组覆盖度。而其无以伦比的准确性、系统可靠性和可扩展性更让它从其他新一代测序平台中脱颖而出。为什么SOLiD能轻松实现貌似不可能的任务?让生物通带你从测序原理入手,一探究竟。

SOLiD工作流程

a.文库制备

SOLiD系统能支持两种测序模板:片段文库(fragmentlibrary)或配对末端文库(mate-pairedlibrary)。使用哪一种文库取决于你的应用及需要的信息。片段文库就是将基因组DNA打断,两头加上接头,制成文库。如果你想要做转录组测序、RNA定量、miRNA探索、重测序、3’,5’-RACE、甲基化分析、ChIP测序等,就可以用它。如果你的应用是全基因组测序、SNP分析、结构重排/拷贝数,则需要用配对末端文库。配对末端文库是将基因组DNA打断后,与中间接头连接,再环化,然后用EcoP15酶切,使中间接头两端各有27bp的碱基,再加上两端的接头,形成文库。

b.乳液PCR/微珠富集在微反应器中加入测序模板、PCR反应元件、微珠和引物,进行乳液PCR(EmulsionPCR)。PCR完成之后,变性模板,富集带有延伸模板的微珠,去除多余的微珠。微珠上的模板经过3’修饰,可以与玻片共价结合。看到这里,是不是有一种似曾相识的感觉呢?那就对了,此步骤与454的GSFLX基本相同。不过SOLiD系统的微珠要小得多,只有1um。乳液PCR最大的特点是可以形成数目庞大的独立反应空间以进行DNA扩增。其关键技术是“注水到油”,基本过程是在PCR反应前,将包含PCR所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的PCR反应空间。理想状态下,每个小水滴只含一个DNA模板和一个P1磁珠,由于水相中的P2引物和磁珠表面的P1引物所介导的PCR反应,这个DNA模板的拷贝数量呈指数级增加,PCR反应结束后,P1磁珠表面就固定有拷贝数目巨大的同来源DNA模板扩增产物。

c.微珠沉积

3’修饰的微珠沉积在一块玻片上。在微珠上样的过程中,沉积小室将每张玻片分成1个、4个或8个测序区域。SOLiD系统最大的优点就是每张玻片能容纳更高密度的微珠,在同一系统中轻松实现更高的通量。

d.连接测序这一步可就是SOLiD的独门秘笈了。它的独特之处在于没有采用惯常的聚合酶,而用了连接酶。SOLiD连接反应的底物是8碱基单链荧光探针混合物。连接反应中,这些探针按照碱基互补规则与单链DNA模板链配对。探针的5’末端分别标记了CY5、TexasRed、CY3、6-FAM这4种颜色的荧光染料。探针3’端1~5位为随机碱基,可以是ATCG四种碱基中的任何一种碱基,其中第1、2位构成的碱基对是表征探针染料类型的编码区,下图的双碱基编码矩阵规定了该编码区16种碱基对和4种探针颜色的对应关系,而3~5位的“n”表示随机碱基,6~8位的“z”指的是可以和任何碱基配对的特殊碱基。

单向SOLiD测序包括五轮测序反应,每轮测序反应含有多次连接反应。第一轮测序的第一次连接反应由连接引物“n”介导,由于每个磁珠只含有均质单链DNA模板,所以这次连接反应掺入一种8碱基荧光探针,SOLiD测序仪记录下探针第1、2位编码区颜色信息,随后的化学处理断裂探针3’端第5、6位碱基间的化学键,并除去6~8位碱基及5’末端荧光基团,暴露探针第5位碱基5’磷酸,为下一次连接反应作准备。因为第一次连接反应使合成链多了5个碱基,所以第二次连接反应得到模板上第6、7位碱基序列的颜色信息,而第三次连接反应得到的是第11、12位碱基序列的颜色信息……几个循环之后,引物重置,开始第二轮的测序。由于第二轮连接引物n-1比第一轮错开一位,所以第二轮得到以0,1位起始的若干碱基对的颜色信息。五轮测序反应反应后,按照第0、1位,第1、2位...…的顺序把对应于模板序列的颜色信息连起来,就得到由“0,1,2,3…”组成的SOLiD原始颜色序列。

e.数据分析

SOLiD测序完成后,获得了由颜色编码组成的SOLiD原始序列。理论上来说,按照“双碱基编码矩阵”,只要知道所测DNA序列中任何一个位置的碱基类型,就可以将SOLiD原始颜色序列“解码”成碱基序列。但由于双碱基编码规则中双碱基与颜色信息的简并特性(一种颜色对应4种碱基对),前面碱基的颜色编码直接影响紧跟其后碱基的解码,所以一个错误颜色编码就会引起“连锁解码错误”,改变错误颜色编码之后的所有碱基。和其它所有测序仪一样,测序错误在所难免,关键是对测序错误的评价和后续处理。由于SOLiD系统采用了双碱基编码技术,在测序过程中对每个碱基判读两遍,从而减少原始数据错误,提供内在的校对功能。这样,双保险确保了SOLiD系统原始碱基数据的准确度大于99.94%,而在15X覆盖率时的准确度可以达到99.999%,是目前新一代基因分析技术中准确度最高的。为避免“连锁解码错误”的发生,SOLiD数据分析软件不直接将SOLiD原始颜色序列解码成碱基序列,而是依靠reference序列进行后续数据分析。SOLiD序列分析软件首先根据“双碱基编码矩阵”把reference碱基序列转换成颜色编码序列,然后与SOLiD原始颜色序列进行比较,来获得SOLiD原始颜色序列在reference的位置,及两者的匹配性信息。Reference转换而成的颜色编码序列和SOLiD原始序列的不完全匹配主要有两种情况:“单颜色不匹配”和“两连续颜色不匹配”。由于每个碱基都被独立地检测两次,且SNP位点将改变连续的两个颜色编码,所以一般情况下SOLiD将单颜色不匹配处理成测序错误,这样一来,SOLiD分析软件就完成了该测序错误的自动校正;而连续两颜色不匹配也可能是连续的两次测序错误,SOLiD

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论