测序技术发展史.doc_第1页
测序技术发展史.doc_第2页
测序技术发展史.doc_第3页
测序技术发展史.doc_第4页
测序技术发展史.doc_第5页
免费预览已结束,剩余23页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大事记(人物、方法、公司、仪器、成果)技术发展及原理公司的竞争及仪器的研发、升级服务项目(应用领域)简述测序技术发展大事件1975-1977年 DNA测序时代来临:SangerSanger是英国生物化学家,1918年8月13日生于英格兰格洛斯特夏郡,在剑桥大学圣 约翰学院获哲学博士学位,毕业后到著名的剑桥医学研究会分子生物学实验室工作。Sanger的工作主要研究蛋白质的结构,特别是研究测定胰岛素分子的结构,成功地测定了胰岛素的精细结构,因而获得了1958年的诺贝尔化学奖。60年代后他致力于核糖核酸(RNA)和(脱氧核糖核酸)DNA的结构研究,利用酶解图谱法确定了RNA中各种碱基的排列顺序和DNA中核苷酸的排列顺序,所以1980年再度获诺贝尔化学奖。提出酶法测序,Maxam和Gilbert提出化学降解法测序。尽管这么多年一直是Sanger测序的天下,但是在刚刚问世时,Maxam-Gilbert测序更受欢迎。1977年 第一个基因组测序完成,那就是phi X174噬菌体的基因组。这项工作是由Sanger及其同事完成的。phi X174噬菌体的基因组为单链环状,共有5836个碱基。1980年 “鸟枪法测序”诞生,这是Sanger的又一大革命性发现。他和同事使用这种技术来测序和拼接重叠的读数。从那时起,一些病毒基因组就陆续完成,包括229kb的巨细胞病毒基因组,186kb的天花基因组。1981年 Akiyoshi Wada与日本日立(Hitachi)公司合作开发出一种高通量的自动测序仪,稍后整合到ABI的测序产品中。1986年 第一台商业化的DNA测序仪(ABI Prism 370A)由Applied Biosystems推出,产量为1000个碱基/天。1990年 人类基因组计划(HGP)启动。此计划由美国科学家于1985年率先提出,于1990年正式启动的。美国、英国、法国、德国、日本和我国科学家共同参与了这一预算达30亿美元的人类基因组计划。按照这个计划的设想,在2005年要揭开组成人体4万个基因的30亿个碱基对的秘密。人类基因组计划与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划。1995年 Amersham推出循环测序Thermo Sequenase Applied Biosystems推出第一台毛细管电泳测序仪(Prism 310)。它采用毛细管电泳技术取代传统的聚丙烯酰胺电泳,通过单引物PCR测序反应,生成的PCR产物是相差1个碱基的3末端为4种不同荧光染料的单链DNA混合物,使得四种荧光染料的测序PCR产物可在一根毛细管内电泳,从而避免了泳道间迁移率差异的影响,大大提高了测序的精确度。它的产量为5,000-15,000个碱基/天 第一个活生物流感嗜血杆菌(Haemophilus influenzae)的基因组测序完成。当初挑选它是因为项目领导人之一Hamilton Smith(1978年的诺贝尔生理学/医学奖得主)一直在研究它,能够提供高质量的DNA文库。它的基因组有1.83 Mb个碱基对,当时使用的测序方法是全基因组鸟枪法。1996年 第一个真核生物酿酒酵母(Saccharomyces cerevisiae)的基因组测序完成。它的基因组大约有12.5 Mb和6275个基因,其中约5800个基因被认为是有功能的基因。1997年 Molecular Dynamics推出MegaBACE 1000毛细管电泳测序仪;产量为250,000-500,000个碱基/天。该公司2003年被GE收购。1998年 焦磷酸测序被开发出。与Sanger测序不同的是,它依赖核苷酸掺入时焦磷酸的释放而不是双脱氧核苷酸的链终止。该技术无需电泳,操作极为简便。 PE Biosystems推出Prism 3700毛细管测序仪;产量为 500,000-1,000,000个碱基/天。后来PE被Applied Biosystems Inc.(ABI)公司收购、分拆、再转卖。 第一个多细胞真核基因组被测序:线虫(Caenorhabditis elegans)。线虫基因组计划是由Sanger研究院和华盛顿大学的基因组测序中心合作完成的。1998年12月,几近完整的线虫序列发表在Science杂志上,序列中最后余下的缺口是在2002年10月完成的。1999年 12月1日,英国科学家宣布,人类重大科学研究项目之一人类基因组计划取得突破性成果,第22号染色体全部破译。这项工作完成了对第22号染色体上的3350万个碱基对的测序,共发现了679个基因,其中有55是人们以前不知道的。2000年 第一个植物基因组被测序:拟南芥(Arabidopsis thaliana)。12月4日出版的Nature杂志报道了拟南芥完整基因组测序工作完成并首次发表了其完整基因组序列。这成为植物科学史上的一个重要里程碑。科学家已经绘制出拟南芥的基本基因图谱,其中包含11600万个碱基对,编码大约26000个基因。2001年 人类基因组序列的草图公布31,000个预测基因,基因组的95%是非编码的。人类基因组测序公共组在2001年2月15日的nature杂志上公开发表了人类基因组计划的拼接和分析结果,同时,Celera公司在2月16日的science杂志上发表了他们的结果。2004年 人类基因组的常染色质序列完成;预测的基因数量降至24,000。2004年10月,人类基因组测序公共组在自然周刊上发表了人类基因组常染色质全序列测定的论文,宣布人类基因组的常染色质部分中99%的序列已经被测定,其精度达到每10万个碱基中只有一个测量误差。2005年 454 Life Science推出了革命性的基于焦磷酸测序法的超高通量基因组测序系统Genome Sequencer 20 System,被Nature杂志以里程碑事件报道,开创了边合成边测序的先河,也成为第二代测序的先锋。它的产量为20,000,000个碱基/天。2006年 美国和英国科学家于5月18日在英国自然杂志网络版上发表了人类最后一个染色体1号染色体的基因测序。这标志着历时16年的人类基因组计划书写完了最后一个章节。2007年 美国贝勒医学院和454 Life Science共同完成了DNA双螺旋发现者之一沃森的个人基因组的测序工作,并将图谱数据免费赠予沃森。这项工作历时4个月,大约花费150万美元。 10月,Applied Biosystems公司推出SOLiD系统,每轮运行可产生超过40亿碱基的可定位数据,原始碱基数据的准确度大于99.94%,而在15覆盖率时的准确度更达到99.999%。2008年 10月11日深圳华大基因对外宣布,他们已经成功绘制完成第一个完整中国人基因组图谱(又称“炎黄一号”),这也是第一个亚洲人全基因序列图谱。这个研究成果登上了11月6日的nature杂志封面。其中所用的基因组DNA来自杨焕明院士,前北京基因组研究所所长,也是文章的作者之一。研究人员利用Illumina公司的Genome Analyzer测序仪对整个基因组进行测序,测序数据总量达到1177亿碱基对,基因组平均测序深度达到36倍,有效覆盖率高达99.97,变异检测精度达99.9以上。 同年,第一张女性个人基因组图谱、第一张癌症基因组图谱、第一张非洲人基因组图谱也陆续出炉。2009年 第三代测序风起云涌。多家第三代测序公司如Complete Genomics、Pacific Biosciences和Helicos Biosciences纷纷计划推出自己的测序系统或服务,欲与第二代测序一争高下。 更多物种的基因组图谱出炉。基于目前“百花齐放”的测序技术,究竟谁会赢得基因组Archon X大奖2006年底,美国X大奖基金会设立了基因组Archon X大奖,奖金高达1000万美元。这项大奖将颁给第一个能在10天之内,用不到100万美元的费用,完成100个人类基因组测序的民间团队。附加条件是覆盖率不小于98%,误差不大于1/10000 bp。,相信很快就会见分晓。二、测序技术原理及发展1、萌芽早在1954年,Whitfeld等就提出了测定多聚核糖核苷酸链的降解法,该方法利用磷酸单酯酶的脱磷酸作用和高碘酸盐的氧化作用从链末端逐一分离寡核糖核苷酸并测定其种类。但由于操作复杂等原因,该方法并没有被广泛应用。1975年,Sanger和Coulson发明了“加减法”测定DNA序列。2、第一代测序技术在1977年,Sanger等提出了经典的双脱氧核苷酸末端终止测序法。该方法的原理是:由于ddNTP的2和3都不含羟基,在DNA合成反应中不能形成磷酸二酯键,因此可以被用来中断DNA合成反应。在4个DNA合成反应体系中分别加入一定比例的带有放射性同位素标记的某一种ddNTP,通过凝胶电泳和放射自显影后,可以根据电泳带的位置确定待测分子的核苷酸序列。双脱氧核苷酸 (ddNTP) 分子的结构及 DNA 链合成终止反应如下图:A.正常的 DNA 合成反应; B.ddNTP 掺入到 DNA 合成反应后导致反应终止该方法以待测单链或双链 DNA 为模板,使用能与 DNA 模板结合的一段寡核苷酸为引物,在 DNA 多聚酶的催化作用下合成新的 DNA 链。正常情况下的 DNA 多聚酶催化反应在其反应体系中只含有四种脱氧核苷酸(dATP、dCTP、dGTP和dTTP),合成与模板 DNA 互补的新链。当这个反应体系中加入了一种放射性同位素 32P 或 35S 标记的双脱氧核苷酸(*-ddATP 或 *-ddCTP 或 *-ddGTP 或 *-ddTTP)后,在 DNA 合成过程中,标记的 *-ddNTP (例如 *-ddATP)将与相应的 dNTP (例如 dATP)竞争掺入到新合成的 DNA 互补链中。如果是 dNTP 掺入其中, DNA 互补链则将继续延伸下去;如果是 *ddNTP 掺入其中, DNA 互补链的合成则到此终止。而双脱氧核苷酸的掺入是随机的,故各个新生 DNA 片段的长度互不相同。不同长度 DNA 片段在凝胶中的移动速率不同,而聚丙烯酰胺凝胶分辨率极高,通过聚丙烯酰胺凝胶电泳能分辨出小至一个碱基长度差的 DNA 片段,从而将混合产物中不同长度 DNA 片段分离开,再通过放射自显影曝光,根据片段尾部的双脱氧核苷酸读出该 DNA 的碱基排列顺序。作为标记用的放射性同位素主要有 a-32dNTP,a-33dNTP 或 a-35SNTP)。同一年,A.M. Maxam 和 W. Gilbert等人提出了化学降解法。其原理为:将一个DNA片段的5端磷酸基作放射性标记,再分别采用不同的化学方法修饰和裂解特定碱基,从而产生一系列长度不一而5端被标记的DNA片段,这些以特定碱基结尾的DNA片段群通过凝胶电泳分离,再经放射线自显影,确定各片段末端碱基,从而得出目的DNA的碱基序列。化学降解法原理如下图:Maxam-Gilbert化学降解法测序的常用化学试剂:碱基体系化学修饰试剂化学反应断裂部位Gdimethyl sulphate(硫酸二甲酯)甲基化GA+Gpeperidine formate(哌啶甲酸),pH 2.0脱嘌呤G和AC+Thydrazine(肼,联氨NH2NH2)打开嘧啶环C和TChydrazine + NaCl(1.5M)打开胞嘧啶环CA+C90,NaOH(1.2M)断裂反应A和C硫酸二甲酯dimethyl sulphate ,DMS ,(CH3O)2SO2是一种碱性化学试剂,可以使 DNA 链上的腺嘌呤 A 的 N2 和鸟嘌呤 G 的 N 甲基化,但是鸟嘌呤 G 的 N 甲基化速度比腺嘌呤 A 的 N2 甲基化速度要快 4-10 倍,并且在中性 pH 环境中, DMS 主要作用于鸟嘌呤 G ,使之甲基化,导致糖苷键断裂。哌啶甲酸可以使 DNA 链上的嘌呤在酸的作用下发生糖苷水解,导致 DNA 链在脱嘌呤位点(G和A)发生断裂。肼,又称联氨 NH2NH2 ,在碱性环境中作用于胞嘧啶 C 和胸腺嘧啶 T 的 C4 和 C6 位置,导致糖苷键断裂。如果加入高浓度的盐(1.2M NaOH),肼则主要作用于胞嘧啶 C ,使之断裂。作为标记用的放射性同位素主要有 -32(-32ATP,-32GTP, -32TTP ,或-32CTP),或 -33NTP , S-35NTP 。Maxam-Gilbert 化学降解测序法不需要进行酶催化反应,因此不会产生由于酶催化反应而带来的误差;对未经克隆的 DNA 片段可以直接测序;化学降解测序法特别适用于测定含有如 5-甲基腺嘌呤 A 或者 G , C 含量较高的 DNA 片段,以及短链的寡核苷酸片段的序列。化学降解测序法既可以标记 5-末端,也可以标记 3-末端。如果从两端分别测定同一条 DNA 链的核苷酸序列,相互参照测定结果,可以得到准确的 DNA 链序列。此后,在Sanger法的基础上,80年代中期出现了以荧光标记代替放射性同位素标记、以荧光信号接收器和计算机信号分析系统代替放射性自显影的自动测序仪。早在1985年,Smith等采用激光激发标记的荧光,并用CCD检测,比常规电泳测序速度提高9倍,速度达8000bp/h以上。另外,90年代中期出现的毛细管电泳技术使得测序的通量大为提高。80年代初,Jorgenson和Lukacs提出了毛细管电泳技术(capillary electrophoresis)。1992年美国的Mathies实验室首先提出阵列毛细管电泳(capillary array electrophoresis)新方法,并采用激光聚焦荧光扫描检测装置,25只毛细管并列电泳,每只毛细管在1.5h内可读出350bp,DNA序列的分析效率可达6000bp/h。ABI3730系列自动测序仪即是基于毛细管电泳和荧光标记技术的DNA测序仪。如ABI 3730XL测序仪拥有96道毛细管,4种双脱氧核苷酸的碱基分别用不同的荧光标记。在通过毛细管时不同长度的DNA片段上的4种荧光基团被激光激发,发出不同颜色的荧光,被CCD检测系统识别,并直接翻译成DNA序列。除此之外,这一时期还出现了一些其他的测序方法,如焦磷酸测序法(pryosequencing)、连接酶测序法(sequencing by ligation,SBL)、杂交测序法(sequencing by hybridization,SBH)等。其中焦磷酸测序法即为后来Roche公司454技术使用的测序方法,连接酶测序法即为后来ABI公司SOLiD技术使用的测序方法。杂交测序法是20世纪80年代末期出现的一种测序方法,它利用DNA杂交原理,将一系列已知序列的单链寡核苷酸片段固定在基片上,把待测的DNA片段变性后与之杂交,根据杂交情况排列出样品的序列信息。杂交测序速度快,采用标准化高密度寡核苷酸芯片能大幅降低检测成本,但误差较大,且不能重复测定。3、第二代测序技术尽管第一代测序技术已经帮助人们完成了从噬菌体基因组到人类基因组草图等大量的测序工作,但由于其存在成本高、速度慢等方面的不足,并不是最理想的测序方法。经过不断的开发和测试,进入21世纪之后,以Roche公司的454技术(GS FLX测序平台)、Illumina公司的Solexa技术和ABI公司的SOLiD技术为标志的第二代测序技术诞生了。与第一代测序技术相比,第二代测序技术不仅保持了高准确度,而且大大降低了测序成本并极大地提高了测序速度。使用第一代Sanger测序技术完成的人类基因组计划,花费了30亿美元巨资,用了三年时间;然而,使用第二代的SOLiD测序技术,完成一个人的基因组测序现在只需要一周左右的时间。由于第二代测序技术产生的测序结果长度较短,因此比较适合于对已知序列的基因组进行重新测序,而在对全新的基因组进行测序时还需要结合第一代测序技术。(1)Roche公司的454测序技术454测序系统是第二代测序技术中第一个商业化运营的测序平台。它的原理是:待测DNA文库的构建把待测序列用喷雾法(nebulization)(高压氮气?)打断成300-800bp的小片段(若是snRNA或PCR产物可直接进入下一步),并利用核酸内切酶、聚合酶和激酶的作用在单链DNA片段的5端加上磷酸基团,3端变成平端,然后和两个44个碱基长的衔接子(adaptor)A、B进行平端连接。A、B 衔接子各自含有20个碱基的PCR 引物序列、20个碱基的测序引物序列和4个碱基的对照序列(TACG),除此之外,B衔接子的5端还标记有一个生物素基团,供后续的分离合适的测序模板使用。Emulsion PCR扩增乳液PCR将这些ssDNA与水油包被的直径大约28m的磁珠在一起孵育、退火,由于磁珠表面含有与接头互补的寡聚核苷酸序列,因此ssDNA会特异地连接到磁珠上。每一个磁珠只携带唯一一个单链模板。扩增试剂将磁珠乳化,形成油包水的混合物,这样形成许多只包含一454测序技术流程个磁珠和一个独特片段的微反应器,因此可以保证每一个与磁珠结合的小片段都会在各自的孵育体系中独立扩增,扩增产物仍可以结合到磁珠上。反应完成后,破坏孵育体系并富集带有DNA的磁珠。经过扩增反应,每一个小片段都将被扩增大约100万倍,从而达到下一步测序反应所需的模板量。测序预先用Bacillus stearothermophilus聚合酶一种嗜热的脂肪芽孢杆菌聚合酶和单链结合蛋白处理带有DNA的磁珠,然后将磁珠放置在一种叫做PicoTiterPlate(PTP)的平板上。PTP板上含有很多直径不同论文有所不同,包括磁珠直径?约为44m的小孔,每个小孔仅能容纳一个磁珠,通过这个方法固定每个磁珠的位置以监测接下来的测序反应。测序反应采用焦磷酸测序法。测序反应以磁珠上大量扩增的单链DNA为模板,每次反应加入一种dNTP进行合成反应,如果这种dNTP能与待测序列配对,则会在合成后释放焦磷酸基团。释放的焦磷酸基团能与体系中的ATP硫酸化酶反应生成ATP。生成的ATP和荧光素酶共同氧化体系中的荧光素分子并发出荧光。产生的荧光信号由放置在PTP板另一侧的CCD照相机记录,再经计算机分析转换为测序结果。由于每种dNTP在反应中产生的荧光颜色不同,因此可以根据荧光的颜色来确定被测分子的序列。反应结束后游离的dNTP会在双磷酸酶的作用下降解ATP,导致荧光淬灭,从而使反应体系再生。作为一个反应器,由于PTP板上每个小孔独立,因而大大降低了反应的干扰和误差。优缺点。454技术的主要缺点是无法准确测量同聚物(homopolymer)的长度。例如当待测序列中出现poly(A)的情况下,测序反应会一次加上多个T,而加入T的数目只能从荧光信号的强度来推测,有可能造成结果不准确。也正是这个原因,454技术的主要错误不是来自核苷酸的替换,而是来自插入或缺失。454最大的优势在于较长的读取长度,使得后继的序列拼接工作更加高效、准确。虽然其成本比其它新一代测序平台高很多,但对于需要长读长的应用,如从头测序,它仍是最理想的选择。(2)Illumina公司的Solexa技术Illumina公司的Genome Analyzer于2006年问世,它是一种基于Solexa技术的测序系统。该技术利用边合成边测序的方法(sequencing by synthesis,SBS),它的原理是:待测DNA文库的构建把待测序列打断成200-500bp另有论文为100-200bp的小片段,并在小片段两端加上不同的接头,连接载体,构建ssDNA文库。DNA与流动槽(flow cell)的附着将DNA片段变成单链后通过接头与芯片表面的引物碱基互补而使一端固定在芯片上,另外一端随机和附近的另外一个引物互补,也被固定住,形成桥状结构。流动槽是一种含有8个chanel的微纤维板,它的表面固定有很多接头,能支持DNA在其表面进行桥式扩增。Bridge PCR(桥式PCR)向反应体系中添加未标记的核苷酸和酶,进行bridge PCR扩增。Bridge PCR以流动槽表面的固定接头为模板,将桥型ssDNA扩增为桥型dsDNA。将桥型dsDNA变性为ssDNA,继续扩增。经不断的扩增-变性循环,每一种ssDNA都在各自的位置集中成束(cluster),每一束含有单个模板分子的500-1000个拷贝另有论文为“约1000个”,从而达到能支持下一个测序反应所需信号强度的模板量。随后将DNA簇线性化。测序测序采用边合成边测序的方法(SBS)。向反应体系中同时添加DNA聚合酶、接头引物和带有碱基特异荧光标记的4种dNTP(可逆终止子)。由于这些dNTP的3羟基被化学方法保护,因而每轮合成反应只能添加一个dNTP,在dNTP被添加到合成链上之后,所有未使用的游离dNTP和DNA聚合酶会被洗脱。加入激发荧光所需的缓冲液,用激光激发荧光信号,用光学设备完成荧光信号的记录,再通过计算机分析转化为测序结果。当荧光信号的记录完成后,加入化学试剂淬灭荧光信号并去除dNTP的3羟基保护基团,以便进行下一轮测序反应。Solexa测序技术流程2009年,Solexa推出对读测序方法(paired-end)方法(或末端配对法),即在构建待测DNA文库时在两端的接头上都加上测序引物结合位点,在第一轮测序完成后,去除第一轮测序的模板链,用对读测序模块(Paired-End Module)引导互补链在原位置再生和扩增,以达到第二轮测序所用的模板量,进行第二轮互补链的测序。优缺点。使用对读测序方法,Solexa读取长度可达2*75bp,相比454后续序列拼接工作的计算量和难度大大增加。但由于Solexa技术在合成中每次只能添加一个dNTP,因此很好地解决了同聚物长度的准确测量问题。其主要错误来源为核苷酸的替换,而不是插入或缺失。(3)ABI的SOLiD技术SOLiD全称Supported Oligo Ligation Detetion,ABI的SOLiD测序系统基于连接酶测序法,即利用DNA连接酶在连接过程中进行测序。它的原理是:待测DNA文库的构建SOLiD系统支持两种测序模板:片段文库(fragment library)或配对末端文库(mate-paired library)。片段文库就是把待测序列打断成很小的片段,并在小片段两端加上不同的接头,连接载体,构建ssDNA文库。该文库适合转录组测序、RNA定量、miRNA研究、重测序、3,5-RACE、甲基化分析及ChIP测序等。配对末端文库是将基因组DNA打断后,与中间接头连接,环化,然后用EcoP15酶切,使中间接头两端各有27bp的碱基,最后加上两端接头,形成文库。该文库适用于全基因组测序、SNP分析、结构重排及拷贝数分析等。Emulsion PCR与454技术的Emulsion PCR类似,将带接头的ssDNA固定在磁珠表面,进行PCR扩增,并对扩增产物进行3端修饰。连接酶测序将3端修饰的磁珠沉积于上样玻片(Slide),进行连接酶测序。在沉积过程中可对磁珠密度进行调整,以达到最大通量。向体系中加入DNA连接酶、通用测序引物n和具有3-XXnnnzzz-5结构的的八聚核苷酸。在这个八聚核苷酸中,第1和第2位(XX)上的碱基是确定的,并根据种类的不同在第6-8位(zzz)上加了不同的荧光标记。这种由两个碱基决定的测序方法被称为两碱基测序(two base encoding)。当八聚核苷酸因第1和第2位配对而被连接酶连接上时,会发出荧光。在记录下荧光信息后,通过化学方法在第5和第6位之SOLiD测序技术流程间进行切割,淬灭荧光信号,以进行下一个位置的测序。通过这种方法,每次测序的位置都相差五位,即第一次测第1和第2位,第二次测第6和第7位在测到末尾后,将新和成的链变性、洗脱。然后用通用引物n-1进行第二轮测序。接下来,分别加入通用测序引物n-2、n-3、n-4进行测序,这样可以完成全部位置的测定,且每个位置均被测定了2次。优缺点。与Solexa类似,后续的序列拼接工作非常复杂。但由于采用两碱基测序,准确率较高。4、第三代测序技术Helicos公司的Heliscope单分子测序仪、Pacific Biosciences公司的SMRT技术和Oxford Nanopore Technologies公司研究的纳米孔单分子测序,被认为是第三代测序技术。其最大的特点是单分子测序。其中,Heliscope技术和SMRT技术利用荧光信号进行测序,而纳米孔单分子测序技术利用不同碱基产生的电信号进行测序。Helicos公司的Heliscope单分子测序仪基于边合成边测序的思想。将待测序列打断成小片段并在3端加上poly(A),用末端转移酶在接头末端加上Cy3荧光标记。用小片段与表面带有寡聚Poly(T)的平板杂交。然后加入DNA聚合酶和Cy5荧光标记的dNTP进行DNA合成反应,每一轮反应加入一种dNTP。将未参与合成的dNTP和DNA聚合酶洗脱,检测上一步记录的杂交位置是否有荧光信号,若有,则说明该位置结合了所加入的这种dNTP,用化学试剂去掉荧光标记,以便下一轮反应。经过不断地重复合成、洗脱、成像、淬灭过程完成测序。读取长度约为30-35bp,每循环数据产出量为21-28Gb。类似454,在面对同聚物时有一些困难,但并不十分严重。同聚物合成导致荧光信号减弱,可据此推测同聚物长度;另外可通过二次测序来提高准确度。对Heliscope来说,主要错误来源是缺失,由合成中可能掺有未标记的碱基所致。斯坦福大学的科学家利用heliscope单分子测序仪,用了48000美元的试剂和4个星期的时间,对一名白人男子的基因组进行了测序。覆盖度达28倍,覆盖90%人类参考基因组,读长24-70bp,平均读长32bp,并鉴定出280万个SNP位点和752万个拷贝数变异。Pacific Biosciences的SMRT技术基于边合成边测序的思想,以SMRT芯片为载体进行测序反应。SMRT芯片是一种带有很多ZMW(zero-mode waveguides)孔的厚度为100nm的金属片。将DNA聚合酶、待测序列和不同荧光标记的dNTP放入ZMW孔的底部进行合成反应。与其他技术不同的是,荧光标记的位置是磷酸基团而不是碱基。当一个dNTP被加入到合成链上的同时,会进入ZMW孔的信号检测区并在激光束的激发下发出荧光,根据荧光种类可判断dNTP种类。且由于其在检测区停留的时间(ms)与进入、离开的时间(s)相比很长,所以信号强度很大。在下一个dNTP被添加之前,这个dNTP的磷酸集团会被氟聚合物(fluoropolymer)切割并释放,荧光分子离开荧光信号检测区。SMRT技术测序速度很快,可达每秒10个dNTP。SMRT技术测序流程Oxford Nanopore Technologies公司正在研究的纳米孔单分子技术是一种基于电信号测序的技术。他们设计了一种以-溶血素为材料制作的纳米孔,在孔内共价结合有分子接头环糊精。用核酸外切酶切割ssDNA时,被切下来的单个碱基会落入纳米孔,并和孔内的环糊精相互作用,短暂地影响流过纳米孔的电流强度,这种电流强度的变化幅度就成为每种碱基的特征,碱基在纳米孔内的停留时间是毫秒级的,它的解离速率常数与电压有关,180mV的电压就能够保证在电信号记录后将碱基从纳米孔中清除。另一大特点是能够直接读取甲基化的胞嘧啶,而不像传统方法那样必须要用重亚硫酸盐(bisulfite)处理,这对于在基因组水平研究表观遗传相关现象提供了巨大的帮助。该方法准确率高,且发现错误易修正,因为4种碱基中的2种与另外2种的电信号差异很明显。另外,每次只测定一个核苷酸,很容易解决同聚物长度的测量问题。目前面临的问题是寻找合适的外切酶载体以及承载纳米孔平台的材料。 目前,我国也启动了第三代测序技术的研究。2009年12月,中科院北京基因组研究所与浪潮成立“中科院北京基因组研究所-浪潮基因组科学联合实验室”,利用各自的优势联合研发国产第三代测序仪,第一台样机预计2013年问世,届时有望缓解测序仪核心技术受制于国外公司的现状。5、测序技术的发展趋势三代测序的比较见下页表。测序成本、读取长度和测序通量是评价测序技术先进与否的重要标准。测序成本在一定程度上决定了基因组测序应用的普及性。1995年,随着自动测序仪的出现,检测1个碱基的成本大约是1美元。到1998年,使用ABI Prism 3700 DNA Analyzer成本降到了0.1美元。目前广泛使用的第二代测序技术成本更低。National Human Genome Research Istitute(NHGRI)预测,在未来5年内(从2009年)测序成本还将下降100倍。读取长度是指一个反应能测得数据的长度,它对测序成本和数据质量有很大的影响,更长的读取长度可以减少测序后拼接的工作量,但也可能降低结果的准确性。测序通量是指在一定时间内获得的数据输出量。仪器的测序通量是指在样品准备充分的前提下,测序仪每24小时产生的数据量。更高的测序通量能在一定程度上降低测序成本、提高科研工作的效率。第二代测序技术与第一代Sanger测序法都是基于边合成边测序的思想,原理上没有本质的飞跃。测序时间和费用都大大降低的原因是第二代测序采用了高通量测序技术,从Sanger法一次读取一条序列到毛细管电泳测序的一次读取96条序列,再到现在的一次读取几百万条序列的实现,不得不说是对第一代测序的革命性变革。然而由于第二代测序技术测序前要通过PCR手段对待测片段进行扩增,因此增加了测序的错误率。并且由于Solexa和SOLiD测序结果都较短,比较适合重测序,而不太适用于没有基因组序列的全新测序。实际应用中,结合多种测序平台可以得到更好的效果。第三代单分子测序解决了错误率问题,通过增加荧光信号的强度和提高仪器的灵敏度等方法,使测序不再需要PCR扩增这个环节,实现单分子测序并继承了高通量测序的优点。纳米孔单分子测序更是在原理上作出了变革,不再基于边合成边测序的思想,而是使用外切酶从末端逐个切割单碱基并对单碱基进行检测,更好地提高了读取长度,减少了拼接的工作量,实现对未知基因组进行测序。高通量是第二、三代测序的共同特点,一次可获上百万,甚至几百万条序列信息,因此可对某一组织、某一时间的所有mRNA进行序列测定,故又被称为深度测序。因其实现了不同组织mRNA表达差异的检测,具有取代“基因芯片”技术的态势。基因芯片的检测范围取决于芯片上探针的信息,因此只能检测人们已知序列的特征,缺乏发现新基因的能力,高通量测序可弥补这方面的不足。但因高通量测序发展时间短,不成熟,信息储备量有限,基因芯片技术还会在短时间内占主导优势。但相信不久的将来,高通量测序会更加成熟并得到更加广泛的应用。Kahvejian在2008年的一篇综述中提到:“如果你可以随心所欲地测序,你会开展哪些研究?”人类基因组计划的完成和近年来高通量测序技术的发展,使越来越多的科研工作者认识到,我们对于生物界的认识才刚刚起步。基因图谱的绘制并不意味着所有遗传密码的破解,癌症基因组的开展也没有解决所有的医学难题。DNA变异的模式和进化机制,基因调控网络的结构和相互作用方式,复杂形状及疾病的分子遗传基础等,仍是困扰生物学家和医学家的难题,而高通量测序的广泛应用,也许可以让我们知道的更多。5、创新与改进(1)测序费用直线下降,千元基因组计划指日可待。ABI 3730使用第一代测序技术完成一个人类基因组成本约100万美元,第二代测序成本约10万美元,第三代成本约在1000-10000美元之间。就在2009年,研究人员利用Complete Genomics技术,耗资4400美元就完成了人类基因组测序。(2)序列长度限制拼接,数据质量有待提高。序列长度是限制新一代测序技术广泛应用的关键因素。据现行测序原理,通量的增加注定以牺牲序列片段为代价,而序列长度对后续的拼接工作非常重要。在测序质量方面,错误率偏高也是困扰科研工作者的主要问题。更多研究者依然选择Sanger测序,因其准确性毋庸置疑。如何改善序列长度,并最大限度降低错误率是应着手解决的问题。但其必定需要一定的过程,Sanger最初也只有25bp的读长,后来逐渐增加到750,1000bp;而454技术也同样从最初的100bp提升到GS FLX的250bp,直到现在的400bp;第三代测序有望在序列长度和准确性方面获更大突破。(3)样品准备步骤繁琐,文库构建仍需简化。二代测序采用体外扩增方法,样品需经过打断、加接头、反转、扩增、割胶等多重步骤,势必引入更多误差,费用也相应提高,且在实际操作中,也需要解决更多的问题。首先是割胶回收。割胶是测序成败的关键之举,几个碱基的差别也将影响到测序结果,特别是小RNA研究中,割胶回收片段的长度对后续测序片段的大小分布而言至关重要。而目前的割胶过程受多种主、客观因素影响,因而需引入更高效、精确的片段分离技术。其次是样品起始量的问题。如在RNA-seq研究中,先打断后反转可得到更全面的转录本信息,但前提是RNA的纯度和浓度都必须很高,必然增加了取材的难度。再次就是成本问题。割胶纯化、乳滴PCR、后续库检都需要庞大的费用。(4)海量数据提出挑战,信息平台尚未完善。一方面,如何充分挖掘隐藏在原始数据中的生物学意义,解释各种生物学现象;另一方面,如何高效地对数据进行分类、存档,也是研究人员必须面临的一个问题。目前软件类型主要包括序列比对,组装拼接,质量评估等。然在实际应用中,仍面临很多困难。如在使用AMOScmp对邻近物种短序列组装的过程中,只有两个物种的相似度在90%以上,才会得到较好的拼接效果。此外,质量评分也是备受关注的问题之一。尽管测序公司提供的测序报告中包含有质量文件,但由于不同测序平台缺乏统一可靠的交叉评价系统,错误率的问题仍然令人担忧。在数据存储方面,NCBI已建立了专门的短序列数据库(the Sequence Read Archive,SRA),云计算时代的到来也为海量数据的存储和交流提供了便利。三、公司的竞争及仪器的研发、升级454生命科学公司于2005年底最早推出了第二代测序平台Genome Sequencer 20 System,并测序了支原体Mycoplasma genitalium的基因组。这一技术的建立开创了边合成边测序(sequencing by systhesis)的先河,被nature杂志以里程碑事件报道。在2007年推出了性能更优的第二代基因组测序系统Genome Sequencer FLX System(GS FLX)。罗氏(Roche)诊断公司在2005年便与454洽谈并购事宜,2007年3月29日以1.55亿美元完成并购,紧接着公布了DNA双螺旋的发现者之一沃森(Jim Watson)的个人基因组,测序总花费不到一百万美元。Roche自2005年就已经成为了454的独家分销商(exclusive distributor),希望通过这一收购能巩固对未来454测序仪的使用权,并且将其发展成为可以利用的体外诊断应用工具。2008年10月,Roche 454在不改变机器的情况下,推出了全新的测序试剂-GS FLX Titanium,全面提升了测序的准确性、读长和测序通量。454公司于2010年推出初级版的新一代测序仪GS Junior,预计每次反应能得到100 000条序列,是GS FLX的十分之一,平均读长为400bp,准确率达99%,更适合规模较小的实验室。Illumina公司的测序仪最早由Solexa公司研发,利用其专利核心技术“DNA簇”和“可逆性末端终结(reversible terminator)”,实现自动化样本制备和大规模并行测序。Illumina公司于2007年初花费6亿美元巨资收购了Solexa。2010年初,Illumina将其第二代测序仪Genome Analyzer IIx升级到HiSeq 2000。HiSeq 2000含有两张Flow cell,可同时运行或只运行其中一张。读长为100nt,同时支持Fragment、Pair-end和Mate-Paired文库。每次运行最多可产生200GB的数据量(读长为2100nt)。一上市就受到了极大的关注,华大基因立马订购了128台。该系统也使得Illumina上半年的仪器收入同比增长30%。当然,并不是每个实验室都需要那么高的通量,况且其价格也不是一般实验室所能承受的。为此,Illumina又推出了两款经济型的测序仪Genome Analyzer IIe和HiSeq 1000。HiSeq 1000具有与HiSeq 2000相同的前沿、双表面成像技术和操作易用性,为通量需求较低的研究人员提供了一个理想的平台。过去20年,美国应用生物系统公司(ABI)在一代测序方面一直占着垄断地位。ABI最早推出基于荧光标记的Sanger法的半自动测序仪ABI 370。二代测序出现之后,ABI公司不甘落后,迅速赶上,于2007年底推出了SOLiD第二代测序平台。2010年初发布SOLiD 4,2010年末发布了最新产品SOLiD 5500和5500xl测序平台。短短三年,连升五级。目前最新款SOLiD 5500xl含有两张微流体芯片(microfluidic FlowChip),每张芯片含有6条相互独立的运行通道(run lane)。每条lane都能运行相对独立的测序反应,这样的设计使得SOLiD 5500xl测序平台极具灵活性。最大测序读长75nt,同样支持Fragment、Pair-end和Mate-Paired文库。单次运行能得到的最大数据量为300GB(使用最新设计的nanobeads)。测序的系统准确性能达到99.99%。Life Technologies(2008年Invitrogen和Applied Biosystems-ABI宣布正式合并为Life Technologies Corporation。合并后,Life Technologies将继续保留Invitrogen和Applied Biosystems(以下简称ABI)作为新公司的独立品牌。新公司仪器和系统解决方案,如SOLiD, RT-PCR and 质谱都将继续以ABI品牌销售,而原ABI旗下的试剂品牌,如Ambion等产品,包括众多的试剂都将归于Invitrogen品牌。新公司不仅为客户提供最好的仪器,而且还有最优化的系统解决方案,以及试剂销售渠道。 )在第三代测序上也不甘落后,即将推出单分子测序平台。此平台将使用Qdot纳米晶体作为核心的测序引擎,监测核苷酸实时掺入到增长的DNA链中。它最大的与众不同之处在于有望通过试剂更换实现没有限制的读长,这一点听上去相当有吸引力,连Craig Venter都被吸引了。JCVI等研究所目前正在试用。该平台有望在2011年上市。有时名不见经传的小公司也能让人刮目相看。在2010年的美国基因组生物学技术进展年会(AGBT),Ion Torrent推出了一款廉价小巧的新一代测序仪,成为本次年会最大的惊喜。该平台被戏称为“测序的pH计”。它在半导体芯片的微孔中固定DNA链,随后依次掺入ACGT。随着每个碱基的掺入,释放出氢离子,并改变溶液的pH值,从而被离子传感器所检测。该平台价廉物美,前途无量,Life Technologies也看到了这一点,于是在年中的时候以3.75亿美元收购了Ion Torrent,并于不久前推出了Ion Personal Genome Machine(PGM)测序仪。2010年的另一个惊喜来自于Pacific Biosciences的SMRT(单分子、实时)系统。该系统能让研究人员在短短的几分钟内对长片段DNA进行测序。从样本制备到测序,所需的时间还不到一天。典型的测序运行时间低至30分钟。序列数据在几分钟之内就能产生,而不是几天,这对于传染病监控和分子病理学尤为重要。目前的读长超过1kb,比第二代测序要长得多。PacBio RS测序仪已于2010年11月上市,听说购买的人太多了,工厂根本来不及生产。相比之下,最早推出新一代测序仪的罗氏/454公司似乎沉寂了不少,今年只有GS Junior推出。不过454正在与IBM合作,欲共同开发基于纳米孔的测序技术。根据罗氏和IBM的说法,与其它现有测序技术或正在开发的技术相比,这项技术在费用、通量、规模和速度上都具有“重大优势”。让我们拭目以待吧。四、第二代测序技术的应用领域简述1、从头测序(de-novo sequencing)对于基因组未被测序过的生物,其基因组测序需要从头测序。受测序读取长度的限制,新一代测序技术中只有454能够独立完成复杂基因组如真核生物基因组的从头测序,Solexa和SOLiD只能完成简单生物如细菌的基因组的从头测序。在复杂基因组的从头测序中,将Solexa、SOLiD与454测序技术或传统的Sanger测序技术相结合,分别利用它们的高通量和较长读长优势,可大大降低检测成本,提高测序速度。如黄瓜的全基因组测序,就联合运用了Solexa技术和Sanger技术,得到平均72.2倍覆盖度的黄瓜基因组序列,其中3.9倍是用Sanger技术得到了,68.3倍是运用Solexa的GA测序平台得到的。2、重测序如果对照一个参考基因组,新一代测序技术可以在短时间内非常轻松地完成一个基因组的重测序。通过重测序,可以看到单核苷酸多态性,突变热点,基因组结构变异,群体多态性等信息。2008年,由中国、美国和英国共同启动的千人基因组计划(1000 Genomes Project)是人类基因组计划的延续,也是迄今最大的基因组重测序计划。454、Illumina和ABI共同加入了该计划。SNP全称是Single Nucleotide Polymorphism,意即单核苷酸多态性,是指不同个体的基因组上单个核苷酸的变异,包括替换、缺失和插入。SNP在基因组中分布相当广泛,一般来说,SNP是指变异频率大于1%的单核苷酸变异。SNP可作为标记,许多表型变异、对药物或疾病的易感性等等都可能与SNP有关。研究SNP是人类基因组计划走向应用的重要一环,因为它提供了一个强有力的工具,用于高危群体的发现、疾病相关基因的鉴定、药物的设计和测试以及生物学的基础研究等。新一代测序技术利用其高

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论