测序技术介绍PPT课件_第1页
测序技术介绍PPT课件_第2页
测序技术介绍PPT课件_第3页
测序技术介绍PPT课件_第4页
测序技术介绍PPT课件_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,测序技术简介,2,测序技术发展史,第三代测序,1954年,Whitfeld等多聚核糖核苷酸序列用化学分解法测定,是有关DNA排序技术的早期报告。桑格1977年DNA脱氧核苷酸末端测序(chainterminatorsequencing),A.M.Maxam和W.Gilbert在DNA化学分解测序(chemicaldegradationsequencing),4、Sanger测序的原理,每个DNA测序反应由4个单独的反应组成;在DNA双链中,核苷酸由3-5-磷酸通过酯键连接,因此在测序过程中添加2 ,3-脱氧核糖苷-ddNTP (3-OH除外),ddNTP在DNA双链延长端时无羟基如果终止站点混合了ddATP,则新链端点为a;如果混合了ddTTP、ddCTP和ddGTP,则新链端点为t、c或g。、9等排序技术将模板、引物、4种dNTP(含有放射性同位素标记的核苷酸)与DNA聚合酶绝热制成的混合物,包含了很多长度不同的片段,最终分离出这种混合物,得到放射性同位素自显影带(SDS-PAGE),人们根据凝胶电泳图,得到DNA双重、自动测序实际上已成为当今DNA序列分析的主流。美国PEABI制作了373英寸、377英寸、310英寸、3700英寸、3100英寸等DNA测序仪,其中310英寸是临床试验实验室最常用的型号之一。14,分析测序过程中常见的问题,在DNA测序过程中,引物的10-30碱基不一定能完整读取。由于DNA结构的原因,有时会发生反应不能在途中进行的情况。示例:G/Crich;G/c群集;波莉亚,波莉蒂的连续结构等。另一种情况是反应中间出现的皮层现象,通常是DNA结构的重复序列,使测序引物和模板之间有两个以上的结合部位。具体问题分析如下。1:测序结果有很多峰。n值原因分析也出现很多。PCR产品直接排序,PCR产品长度后没有反应信号,机器会产生很多n值。序列的开头出现n值,这主要是由于未去除的染料单体引起的干扰峰,机器无法正确读取输出值的情况。如果损失了引物二聚体或起始端的一小块,也会出现n值。模板本身包含混合序列,具有等位基因。15,分析排序过程中常见的问题,2:为什么找不到我的PCR引物序列?以PCR引物作为排序引物测量的序列始于引物3结束后的第一个碱基,因此找不到排序引物。通过进行反向排序,可以得到引物的反向互补序列。您还可以将正在测试的碎片复制到相应的托架中。通用引物与插入序列相距一定距离,因此可以测量引物序列。3:为什么测序结果和文献不同?原因很多,动物、种族、个体之间的基因序列不一定相同。如果是PCR产品的复制排序,PCR过程中也有不一致的因素。我们提供的排序结果是客户样本序列的忠实结果,不能保证与文献序列完全一致。4:为什么太短的PCR产品不适合直接排序?首先,一般PCR产品精制套件不能精制太短的PCR产品,因为产品片段必须大于200bp。更何况,排序的前50bp和后50bp的序列不好,不适合直接排序。16,分析测序过程中经常出现的问题,5:如果酒精不挥发,在约300bp时会发生连续异常g峰,酒精挥发时间长会导致DNA断裂。第一峰值,重叠干涉。如果不通过扰动最高峰进行解读,样本不纯,基因组DNA的话,该部位可能会出现SNP现象(T/G),这一事实很好地说明了。如果读数是方解棒,我们可以把样品在这里的基本情况判定为t。第二峰值,电位干扰。如果不解释为干涉峰,则样本可能比预期的多一个基(g),如果解释为干涉峰,则只需确认此处的基本t为行。17,分析排序过程中常见的问题,6:在用PCR产品或质粒进行排序时,为什么经常发生循环现象?下图是pGEM-T向量排序的结果,在83个部位出现了排序结果bimodal,虽然模板包含两个或更多相同的向量,但插入片段不同。解决方案:重新选择单个克隆或重新提取质粒。需要注意的是,PCR反应或酶鉴定的重新发现只是其克隆只包含插入片段的证据,不足以证明模板的统一性。据分析,7: poly结构的排序结果poly在polyA/T结构后经常发生代码迁移现象,而poly/c后经常发生排序信号的衰退。解决方法:使用逆向引物对模板进行排序,并测量poly结构,就可以完成模板的全长剥离。19,第二代排序技术,20,各自的优点,从454测序平台上获得的片段达到400bp,可以读取长质量;如果数据量相同,Solexa排序平台仅是454排序平台的1/10。SOLiD排序平台的准确度达99.94%,片段覆盖度为15时,排序准确度可能接近100%。21,2005年末,454公司推出了基于巧克力测序原理的第一个高质量基因组测序系统GenomeSequencer20System。这是核酸测序技术发展史上的里程碑。之后,Roy以1.55亿美元收购了454家公司,在2006年的10个小时内获得了100万个读取长度(reads)、4亿到6亿个基本信息(basepair),并引入了准确度超过99%的更新GSFLX排序系统。2008年,GSFLX系统再次升级,通量增加了5倍,读取长度和准确度也增加了。虽然454GS排序平台可能不是市场份额最高的排序,但截至2011年3月,利用该系统的研究论文发表了1000多篇,在阅读方面比其他两个系统更出色,从一开始就在排序(denovo)和宏基因组排序(metagenome)方面显示出了不可替代的位置。22,2006年Solexa也正式提供了其NGS系统GenomeAnalyzer。基于DNA群集(DNAcluster)、网桥PCR(BridgePCR)和可逆阻塞等核心技术的系统具有高吞吐量、低错误率、低成本和大范围复盖等优点。2007年,Illumina公司以6亿美元的价格收购了Solexa,将GA商品化。GA的最早版本还意味着1GbAnalyzer,因为它一次可以获取1Gb的数据,最新的Hiseq2000平台在10天内可以获取300Gb以上的数据,读取的默认长度约为150bp。有人消息说,Illumina完成了600Gb的生产测试,在一些客户中进行了前期体验,还将在年内进行Tb(1000Gb)级测试Run。据不完全统计,Illumina销售了600多个ga/gaix和Hiseq2000平台,2010年仅深圳化工大学基因研究所一家就购买了128台Hiseq2000,跃升为世界最大的基因组测序和分析中心,Illumina在测序领域发挥了影响力。23,在Sanger排序时代,美国应用生物系统(ABI)是该行业的领导者,其垄断权从任何人都不能动摇的早期377到完全自动化的3730 XL,ABI的排序器广泛应用于基因组学研究的各个方面。但是在第二代测序技术快速发展的初期,ABI开始得晚了一点。在2005年454家公司推出GS平台之前,ABI的领导受到威胁,迅速收购了开发NGS的小公司Agencourt,并在2007年推出了SOLiD sequencing platform。从此以后,SOLiD继续升级,并达到了当前的SOLiD5版本(SOLiD5500 XL)。SOLiD的全称是sequencgbyoligoligationdetection,即低聚体连接检测排序,其基本原理是通过标有荧光的8碱单链DNA探针与模板配对,发送不同的荧光信号以读取目标序列的默认排序顺序。在此方法中,目标序列中的所有碱基读取两次,因此SOLiD的最大优点是高精度。据悉,SOLiD5平台的排序通量为30Gb/天,成本低于60美元/Gb,准确度达99.99%。此外,SOLiD系统使用DNA合成和排序,而不是PCR反应,因此GC对高采样具有很大的优势。2020/6/8,24,454排序原理,phi排序原理,2020/6/8。25,454排序原理,pie排序原理,2020/6/8。26,454排序的原理,phi排序的原理,2020/6/8。在27,454测序原理,454测序器中,a,t,g,c的4个碱基分别存储在单独的试瓶中,在每个阶段,4个碱基对依次放入反应器,碱基对结合的时候,释放1个馅饼,这个包裹垫片被酶氧化成荧光神,释放成光信号,读取这个位置的碱基信息。454测序仪的整个实验阶段可以大大总结。样品处理库制造emPCR反应板,进行机器排序,2020/6/8。28,454测序原理,样品处理:样品处理主要以基因组DNA、Fosmid或BAC质粒等大片段的DNA分子为对象,用超声波或氮中断切割,然后用琼脂糖凝胶电泳回收或纯化,选择500-800bp的DNA片段。非编码RNA或PCR产品不需要此步骤。2020/6/8,29,454排序原理,库准备包括连接器连接和磁珠精炼两个阶段,454的库连接器由a、b、每个44bp、20bp的PCR引物、20bp的排序引物、4bp(TCAG)的“键”碱基组成。磁珠连接和DNA变性后,只有a目的片段b形式的连接物被浓缩,其他两种形态(AA,BB)的产物被去除。2020/6/8,30,454排序原理,emPCR(乳液PCR)是454排序的关键阶段,将富集的库与排序磁珠、各反应物混合,添加特定矿物油和表面活性剂,利用振荡器进行剧烈振动,使反应系统成为油水捕收(water-in-oil)在理想条件下,每一滴或微反应器将只包含一个磁珠和一个单链DNA,通过控制此阶段的条件,可以在1mL乳液中形成至少10的6次方的理想微反应器。PCR扩增后,将在每个磁珠上形成高密度的DNA簇,这些DNA序列完全相同,可以用于下一步。接着乳液混合物碎了,扩增的片段还结合在自己的珠子上。2020/6/8,31,454排序原理,454排序反应板称为PicoTiterPlate(PTP),由350万个小孔的光纤组成的每个孔的直径为29m,排序磁珠的直径为20m,因此每个孔只能容纳一个磁珠。将磁珠和排序试剂添加到PTP中,使其可用于机器排序。2020/6/8,32,454排序原理,排序阶段如上所述,4个碱基在泵控制下依次放入反应板,反应结束后,每次一个或多个碱基展开时,就会释放光信号,记录信号的有无和强度,从而测量DNA序列。2020/6/8,33,2020/6/8,34,454排序原理,优缺点:454排序准确度高,超过400bp的读取以上,其准确度仍可达到99%以上;主要错误发生在相同聚合物(例如attg)的连续扩展中,但是a和g的读取没有问题,但是由于t仅记录一次光信号,并且只有信号强度不同于ATG序列中的t,因此同聚体越长,可能发生的错误就越多。目前,454测序器在阅读方面有明显的优势,因此广泛应用于大基因组的首次测序(denovo)、转录组分析、基因组结构分析等领域。2020/6/8,35,Solexa排序,2020/6/8,36,Solexa排序,常用术语:SBS:边缘合成边缘排序反应,每个SBS扩展一个碱基。大约需要70分钟。Run:单个机器排序反应可以生成4G-75G排序通量。通路:单个通路,每个通路可以直接在物理上区分排序样本,一次运行最多可以同时拥有8个通路。Channel:通路的同义词。Tile:每个Lane有两个tile列,共120个社区。每个小区都分布着很多簇合部位。Cluster:群集,Solexa排序技术使用桥接PCR方法创建DNA群集,从而允许每个DNA群集生成CCD可以区分的荧光点。2020/6/8,37,Solexa排序,Index:标签,Solexa多排序(MultiplexedSequencing)过程中使用Index分隔样本,完成常规排序后在Index部分执行7个附加循环排序,Index标识Barcode:Index同义词Fasta:序列存储格式。如果序列文件以FASTA格式保存,则每个序列的第一行以“开头”遵循序列的ID号(唯一标识符)和有关该序列的说明信息。第二行的内容是序列,如果序列短于61nt,则会排成一行。如果序列长度大于61nt,则每行存储61nt,最后小于61nt的保留下来,并与最后一行对齐。第二个序列从另一行开始,以“”和序列的ID号开始,以此类推。2020/6/8,38,Solexa排序,Fastq:Fastq是反映排序序列基本质量的Solexa排序技术。第一行以“”符号开头,后跟一个序列的说明

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论