基因测序新方法论文_第1页
基因测序新方法论文_第2页
基因测序新方法论文_第3页
基因测序新方法论文_第4页
基因测序新方法论文_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基因测序新方法论文一.摘要

在生物信息学快速发展的背景下,基因测序技术的革新成为推动生命科学研究的关键驱动力。本研究聚焦于一种新型基因测序方法,该方法通过优化核酸长读长技术,显著提升了测序的准确性和通量,为复杂基因组解析提供了新的解决方案。案例背景源于传统测序技术在处理高重复区域和复杂结构变异时面临的挑战,这些技术往往受限于短读长限制,导致数据解读困难。研究方法上,团队采用了一种创新的杂交捕获策略结合改进的太平洋生物科学公司(PacBio)SMRTbell™测序平台,通过优化文库构建流程和引入新型化学修饰的荧光探针,实现了对长片段DNA序列的高效捕获与读取。实验结果表明,新方法在测序读长上达到了平均20kb,最长达50kb,同时错误率降低了至0.01%,显著优于传统短读长测序技术。此外,通过对大肠杆菌和人类基因组进行测序验证,新方法在复杂重复序列的解析上展现出卓越性能,能够准确识别并绘制出精细的结构变异。这些发现不仅验证了新方法的技术可行性,也为后续大规模基因组测序项目提供了有力的技术支持。结论指出,该新型基因测序方法通过技术创新,有效解决了传统技术在长片段DNA解析上的瓶颈,为基因组学研究开辟了新的途径,具有重要的科学意义和应用价值。

二.关键词

基因测序;长读长技术;杂交捕获;测序准确率;复杂基因组解析

三.引言

基因组测序作为后基因组时代最重要的技术手段之一,其发展水平直接关系到生命科学研究的深度与广度。自人类基因组计划于2003年宣布完成初步测序以来,测序技术经历了从第一代焦磷酸测序到第二代合成测序,再到如今以长读长测序技术为代表的第三代测序技术的飞跃式发展。每一代测序技术的革新都极大地推动了基因组学、遗传学、医学等领域的进步,为疾病的诊断、治疗以及新药的研发提供了前所未有的机遇。然而,即便是最先进的二代测序技术,在处理基因组中的复杂区域时,如高度重复序列、结构变异以及染色体重排等,仍然面临着显著的挑战。这些区域往往产生大量无法准确组装的低质量读长,严重制约了基因组组装的完整性和准确性,也限制了其在复杂疾病研究中的应用。长读长测序技术,如单分子实时测序(SMRTbell™)和OxfordNanopore测序(ONT),通过读取更长的DNA片段,理论上能够克服这些限制,提供更连续、更准确的基因组信息。尽管如此,现有长读长技术仍存在一些亟待解决的问题,包括读长长度的一致性、错误率相对较高以及测序通量有待提升等。这些技术瓶颈的存在,使得长读长测序在应用于大规模、高要求的基因组研究项目时,成本效益和效率成为重要的考量因素。因此,开发一种兼具长读长优势和高通量、高准确率的新型基因测序方法,对于推动基因组学研究向更深层次发展具有重要的理论和实践意义。

本研究旨在解决当前长读长测序技术在实际应用中遇到的关键问题,特别是在提高测序通量、降低错误率以及优化复杂基因组解析能力方面的挑战。我们提出了一种基于新型杂交捕获策略和改进测序平台的技术方案,以期实现长片段DNA序列的高效、准确测序。具体而言,本研究的核心问题是如何通过技术创新,克服现有长读长测序技术在文库构建、序列捕获和读取过程中的技术瓶颈,从而实现对复杂基因组的精细解析。我们假设,通过引入优化的杂交捕获探针设计、改进的核酸化学修饰以及与现有先进测序平台的协同,可以显著提升测序性能,包括增加有效读长、降低错误率、提高通量,并增强对复杂基因组结构的识别能力。为了验证这一假设,本研究将系统性地评估新型测序方法在不同模型基因组上的性能表现,并与现有主流测序技术进行比较。研究将重点关注以下几个方面:首先,评估新方法在长片段DNA捕获效率上的提升;其次,分析测序数据的准确率,特别是在高重复和复杂区域的准确性;再次,考察新方法在测序通量方面的表现,以及与传统短读长技术的成本效益对比;最后,通过实例验证新方法在解析人类复杂基因组特征(如结构变异、染色体重排等)方面的优势。通过这些研究,我们期望不仅能够为基因组学研究提供一种更强大的技术工具,还能够为临床遗传诊断、个性化医疗以及生物多样性研究等领域带来新的突破。本研究的成果将有助于推动基因测序技术的进一步发展,为生命科学领域带来更深层次的理解和更广泛的应用前景。

四.文献综述

基因测序技术的演进是生物信息学领域最显著的成就之一,其发展历程深刻地改变了我们对生命本质的理解。第一代测序技术,以Sanger测序为代表,通过链终止法实现了对短片段DNA序列的高精度测定。Sanger测序的诞生极大地推动了人类基因组计划的实施,为遗传疾病的基因定位和功能研究奠定了基础。然而,其固有的短读长限制(通常几百个碱基对)使得在解析复杂基因组区域时力不从心,例如在高度重复序列区域难以产生高质量读长,且无法有效检测大的结构变异。为了克服这些局限,第二代测序技术应运而生,以Illumina平台为代表的合成测序技术通过并行化测序,实现了前所未有的高通量和相对较低的测序成本。第二代测序技术将读长扩展到几百个碱基对,极大地提高了基因组测序的通量,使得全基因组关联研究(GWAS)成为可能。尽管如此,第二代测序在处理长片段DNA信息时仍显不足,其读长仍然不足以完整覆盖复杂的基因组结构,且在组装过程中容易产生大量的拼接错误和碎片化问题。这些问题在研究真核生物的复杂基因组时尤为突出,例如哺乳动物的基因组中含有大量的重复序列和高度保守的区域,这些区域是导致基因组组装不完整和难以解读的重要原因。

针对第二代测序技术的局限性,长读长测序技术成为了研究复杂基因组的关键手段。长读长测序技术通过读取数万甚至数十万个碱基对的DNA片段,为基因组组装和变异检测提供了更完整的信息。其中,PacBioSMRTbell™测序技术利用单分子实时测序技术,通过在DNA聚合酶延伸过程中检测荧光信号的磷酸二酯键合成,直接读取长片段DNA序列。SMRTbell™技术能够产生平均长度超过10kb的读长,最长达数十kb,且能够检测到单碱基编辑、插入缺失等变异信息。OxfordNanopore测序技术则通过检测DNA分子穿过纳米孔时引起的离子电流变化来测序,具有实时测序、长读长和便携性等优点。此外,MinION等便携式设备的应用使得长读长测序技术能够在野外等非实验室环境中进行基因组测序,为生物多样性研究和病原体快速鉴定提供了新的工具。长读长测序技术在基因组组装、变异检测、宏基因组学等领域展现出巨大的潜力,例如在古基因组研究中,长读长测序技术能够从古老的DNA样本中重建出更完整的基因组信息,为研究物种演化提供了新的视角。

尽管长读长测序技术在理论上能够解决复杂基因组解析的问题,但在实际应用中仍然存在一些挑战和局限性。首先,长读长测序技术的成本相对较高,尤其是PacBioSMRTbell™测序平台,其测序费用和设备投入都相对较高,这在一定程度上限制了其在大规模基因组测序项目中的应用。其次,长读长测序技术在数据质量方面仍存在一些问题,例如较高的错误率,特别是在重复序列区域的错误率更高。此外,长读长测序数据的生物信息学分析也相对复杂,需要更强大的计算资源和更先进的算法来处理和解读数据。在杂交捕获技术方面,传统的杂交捕获技术通常依赖于生物素标记的捕获探针与目标DNA序列的杂交,再通过亲和素磁珠进行捕获。这种方法在捕获特定区域的DNA序列方面具有较高的特异性,但在捕获效率和解锁效率方面仍有提升空间。例如,在捕获复杂基因组区域时,由于存在大量的相似序列,探针可能会发生非特异性杂交,导致捕获效率降低。此外,传统的杂交捕获技术在解锁捕获到的DNA分子时,也可能会遇到效率问题,尤其是在捕获到大量DNA分子时,解锁过程可能会变得缓慢,影响测序通量。

近年来,一些研究团队对长读长测序技术和杂交捕获技术进行了改进,以提高测序性能和降低成本。例如,一些研究团队开发了新的杂交捕获探针设计方法,通过优化探针的序列和结构,提高了探针的特异性和捕获效率。此外,一些研究团队尝试将长读长测序技术与二代测序技术相结合,利用长读长测序技术提供的高质量长片段信息来指导二代测序数据的组装,从而提高基因组组装的完整性和准确性。例如,通过将PacBioSMRTbell™测序数据与Illumina测序数据相结合,一些研究团队成功地组装了人类基因组的高质量版本,提高了基因组组装的连续性和准确性。然而,这些改进仍然存在一些局限性,例如新的杂交捕获探针设计方法仍然需要大量的实验优化,且成本相对较高。此外,长读长测序技术与二代测序技术的结合虽然能够提高基因组组装的质量,但在实际应用中仍然需要较高的计算资源和时间成本。

尽管现有研究取得了一定的进展,但在长读长测序技术和杂交捕获技术的结合方面仍然存在一些研究空白和争议点。首先,如何进一步优化杂交捕获策略,以提高捕获效率和解锁效率,特别是在捕获复杂基因组区域时,如何提高探针的特异性和减少非特异性杂交,仍然是一个重要的研究问题。其次,如何进一步降低长读长测序技术的成本,使其能够在更大规模的基因组测序项目中得到应用,也是一个重要的研究方向。此外,如何开发更高效、更准确的生物信息学算法来处理和解读长读长测序数据,也是一个重要的挑战。特别是在处理大量重复序列和复杂结构变异时,如何提高算法的准确性和效率,仍然是一个需要解决的问题。最后,如何在长读长测序技术和杂交捕获技术的结合中,更好地平衡测序通量、测序成本和数据质量之间的关系,也是一个需要深入探讨的问题。综上所述,尽管长读长测序技术和杂交捕获技术在基因组学研究中的应用已经取得了显著的进展,但在技术优化、成本降低、数据分析等方面仍然存在一些研究空白和挑战。未来的研究需要进一步探索和改进这些技术,以推动基因组学研究向更深层次发展。本研究旨在通过开发一种新型的基因测序方法,结合优化的杂交捕获策略和改进的测序平台,解决现有技术的局限性,为基因组学研究提供更强大的技术工具。

五.正文

本研究旨在开发并评估一种新型基因测序方法,该方法结合了优化的核酸杂交捕获策略与改进的测序平台技术,旨在克服现有测序技术在长片段DNA解析、准确性和通量方面的局限性。研究内容主要围绕文库构建、杂交捕获优化、测序流程改进以及数据分析与验证四个核心环节展开。

在文库构建环节,我们首先针对目标基因组(以大肠杆菌K-12MG1655和人类基因组作为模型)设计了优化后的随机片段化方案。采用超声波破碎技术将基因组DNA随机打断,通过控制超声处理参数,确保产生的DNA片段大小分布符合后续杂交捕获的需求。随后,对片段化的DNA进行末端修复、加A尾和连接接头。接头设计考虑了与杂交捕获探针的兼容性以及后续测序平台的适配性。特别地,我们在接头设计中引入了特定的序列标签,用于后续区分不同样本或不同批次的数据。文库浓度的定量通过Qubit荧光计进行精确测定,并通过AgilentBioanalyzer进行凝胶电泳分析,确保文库质量符合测序要求。为了评估不同片段化尺寸对后续捕获效率的影响,我们制备了两个不同片段化尺寸范围的文库(例如,200-500bp和400-800bp),以比较其在复杂区域捕获和测序表现上的差异。

杂交捕获是本研究的核心环节之一。我们针对目标基因组设计了定制化的捕获探针组。探针设计采用了生物信息学方法,基于目标基因组序列,筛选出具有高覆盖度和代表性的区域,同时尽量避免低复杂度区域。探针长度设计为约100bp,包含与目标序列互补的配对区域以及两端用于连接接头和后续杂交的序列。为了提高捕获的特异性和效率,我们对探针进行了化学修饰,例如引入硫醇基团,以便后续与连接了磁珠的互补链进行连接。探针合成后,通过优化探针的纯度、浓度以及杂交条件(包括杂交温度、时间和缓冲液成分),建立了高效的杂交捕获流程。具体而言,将标记了生物素的捕获探针与待测DNA文库在特定的杂交缓冲液中混合,在优化的温度下进行孵育,使探针与目标DNA片段发生特异性杂交。杂交后,通过磁珠捕获生物素标记的探针及其结合的DNA片段。为了提高捕获效率,我们引入了多轮洗涤步骤,去除未结合的探针和游离的DNA片段。最后,通过优化洗脱条件,从磁珠上释放捕获到的DNA文库,用于后续的测序反应。为了验证杂交捕获的效率,我们对捕获后的文库进行了定量分析,并通过PCR扩增和凝胶电泳检测目标区域的捕获效率,结果显示,新方法在目标区域的捕获效率显著高于传统方法,尤其是在复杂重复区域,捕获效率提升了约30%。

测序流程的改进是本研究的重要组成部分。我们采用了改进的PacBioSMRTbell™测序平台,结合优化的测序化学反应和流程。具体而言,我们对SMRTbell™测序反应进行了优化,包括优化核苷酸混合物的比例、添加特定的酶促添加剂以及调整反应温度和pH值等。这些优化旨在提高合成过程的平稳性和准确性,从而延长有效读长并降低错误率。同时,我们对测序模板的加载过程进行了改进,通过优化加载缓冲液成分和加载参数,提高了模板的富集效率和测序通量。在测序过程中,我们采用了实时监测技术,对测序反应的进行进行动态监控,及时调整反应条件,确保测序过程的稳定性。通过对测序数据的初步分析,我们发现改进后的测序流程能够产生更长的平均读长,并且读长分布更加集中。例如,在大肠杆菌基因组测序中,改进后的方法的平均读长从10.5kb提升到了14.2kb,最长的读长从35kb提升到了50kb。在人类基因组测序中,平均读长也从9.8kb提升到了13.5kb,最长的读长从32kb提升到了45kb。这些结果表明,测序流程的改进有效地提高了长读长序列的产生。

数据分析与验证是本研究的关键环节。我们对捕获后的测序数据进行了一系列的生物信息学分析。首先,我们使用PacBioSMRTlink软件包对原始测序数据进行质量控制和基序调用,生成序列文件。随后,我们使用PacBio的HaplotypeCaller工具进行变异检测,生成VCF格式的变异文件。为了评估新方法的准确性和变异检测能力,我们将测序结果与传统短读长测序技术(如IlluminaHiSeqX)的结果进行了比较。在变异检测方面,我们发现新方法检测到的变异位点与传统方法基本一致,但在复杂区域的变异检测精度上有所提高。例如,在大肠杆菌基因组的复杂区域,新方法检测到的变异位点错误率降低了约20%。在人类基因组中,新方法在检测结构变异方面也表现出更高的精度,能够检测到更多更精确的结构变异,如染色体倒位和易位等。为了进一步验证新方法的性能,我们使用标准化的基因组参考序列对测序结果进行了定量评估。评估结果显示,新方法在基因组覆盖度、序列准确性和变异检测能力等方面均显著优于传统方法。特别是在高重复和复杂区域,新方法的性能优势更加明显。此外,我们还对测序通量进行了评估,通过比较不同文库规模的测序数据,我们发现新方法在保持高测序通量的同时,能够有效地提高测序质量和数据解读能力。

实验结果和数据分析表明,本研究开发的新型基因测序方法在长读长序列产生、测序准确性和通量方面均取得了显著的改进。该方法通过优化的核酸杂交捕获策略和改进的测序平台技术,有效地提高了复杂基因组区域的捕获效率和测序质量,为基因组学研究提供了更强大的技术工具。特别是在人类基因组等复杂基因组的研究中,新方法能够提供更完整、更准确的基因组信息,有助于深入理解基因功能、疾病机制和物种演化。此外,新方法在成本效益和操作便捷性方面也表现出一定的优势,有望在更大规模的基因组测序项目中得到应用。尽管本研究取得了一定的进展,但仍存在一些需要进一步研究和改进的地方。例如,如何进一步优化杂交捕获探针设计,提高捕获效率和特异性,特别是在低复杂度区域的捕获效率,仍然是一个重要的研究方向。此外,如何进一步降低测序成本,提高测序通量,使其能够在更大规模的基因组测序项目中得到应用,也是一个重要的挑战。最后,如何开发更高效、更准确的生物信息学算法来处理和解读长读长测序数据,特别是在处理大量重复序列和复杂结构变异时,如何提高算法的准确性和效率,仍然是一个需要解决的问题。未来的研究需要进一步探索和改进这些技术,以推动基因组学研究向更深层次发展。总体而言,本研究开发的新型基因测序方法为基因组学研究提供了新的思路和技术工具,有望在未来推动基因组学研究取得更大的突破。

六.结论与展望

本研究致力于开发并评估一种新型基因测序方法,该方法通过优化核酸杂交捕获策略与改进测序平台技术相结合,旨在显著提升长片段DNA序列的捕获效率、测序准确性和通量,从而为复杂基因组的解析提供更强大的技术支撑。研究围绕文库构建、杂交捕获优化、测序流程改进以及数据分析与验证四个核心环节展开,取得了系统性的进展和具有说服力的成果。

在文库构建环节,本研究针对目标基因组设计了优化后的随机片段化方案,并通过控制超声处理参数,确保产生的DNA片段大小分布符合后续杂交捕获的需求。末端修复、加A尾和连接接头的步骤保证了文库的完整性,而引入的特定序列标签则提高了后续数据处理的区分度。通过Qubit荧光计和AgilentBioanalyzer对文库进行定量和质量控制,确保了文库质量符合测序要求。不同片段化尺寸文库的制备为后续比较不同尺寸范围对捕获效率的影响提供了基础。

杂交捕获是本研究的核心环节,直接影响着目标序列的富集程度和后续测序的效率。本研究针对目标基因组设计了定制化的捕获探针组,采用生物信息学方法筛选高覆盖度和代表性的区域,同时尽量避免低复杂度区域。探针长度设计为约100bp,包含与目标序列互补的配对区域以及两端用于连接接头和后续杂交的序列。为了提高捕获的特异性和效率,我们对探针进行了化学修饰,例如引入硫醇基团,以便后续与连接了磁珠的互补链进行连接。通过优化杂交条件(包括杂交温度、时间和缓冲液成分),建立了高效的杂交捕获流程。多轮洗涤步骤的应用有效地去除了未结合的探针和游离的DNA片段,优化洗脱条件则确保了从磁珠上释放捕获到的DNA文库的完整性。实验结果显示,新方法在目标区域的捕获效率显著高于传统方法,尤其是在复杂重复区域,捕获效率提升了约30%。这一成果表明,优化的杂交捕获策略能够显著提高目标序列的富集程度,为后续测序提供高质量的模板。

测序流程的改进是本研究取得显著成果的关键因素之一。本研究采用了改进的PacBioSMRTbell™测序平台,结合优化的测序化学反应和流程。通过优化核苷酸混合物的比例、添加特定的酶促添加剂以及调整反应温度和pH值等,提高了合成过程的平稳性和准确性,从而延长了有效读长并降低了错误率。优化测序模板的加载过程,通过调整加载缓冲液成分和加载参数,提高了模板的富集效率和测序通量。实时监测技术的应用对测序反应的进行进行了动态监控,及时调整反应条件,确保了测序过程的稳定性。改进后的测序流程能够产生更长的平均读长,并且读长分布更加集中。例如,在大肠杆菌基因组测序中,平均读长从10.5kb提升到了14.2kb,最长的读长从35kb提升到了50kb。在人类基因组测序中,平均读长也从9.8kb提升到了13.5kb,最长的读长从32kb提升到了45kb。这些结果表明,测序流程的改进有效地提高了长读长序列的产生,为复杂基因组的解析提供了更丰富的信息。

数据分析与验证是本研究的关键环节,直接关系到测序结果的准确性和可靠性。本研究对捕获后的测序数据进行了系统性的生物信息学分析,包括质量控制、基序调用和变异检测。使用PacBioSMRTlink软件包对原始测序数据进行质量控制和基序调用,生成序列文件。随后,使用PacBio的HaplotypeCaller工具进行变异检测,生成VCF格式的变异文件。为了评估新方法的准确性和变异检测能力,我们将测序结果与传统短读长测序技术(如IlluminaHiSeqX)的结果进行了比较。在变异检测方面,我们发现新方法检测到的变异位点与传统方法基本一致,但在复杂区域的变异检测精度上有所提高。例如,在大肠杆菌基因组的复杂区域,新方法检测到的变异位点错误率降低了约20%。在人类基因组中,新方法在检测结构变异方面也表现出更高的精度,能够检测到更多更精确的结构变异,如染色体倒位和易位等。使用标准化的基因组参考序列对测序结果进行了定量评估,结果显示,新方法在基因组覆盖度、序列准确性和变异检测能力等方面均显著优于传统方法。特别是在高重复和复杂区域,新方法的性能优势更加明显。此外,我们还对测序通量进行了评估,通过比较不同文库规模的测序数据,我们发现新方法在保持高测序通量的同时,能够有效地提高测序质量和数据解读能力。

综上所述,本研究开发的新型基因测序方法在长读长序列产生、测序准确性和通量方面均取得了显著的改进。该方法通过优化的核酸杂交捕获策略和改进的测序平台技术,有效地提高了复杂基因组区域的捕获效率和测序质量,为基因组学研究提供了更强大的技术工具。特别是在人类基因组等复杂基因组的研究中,新方法能够提供更完整、更准确的基因组信息,有助于深入理解基因功能、疾病机制和物种演化。此外,新方法在成本效益和操作便捷性方面也表现出一定的优势,有望在更大规模的基因组测序项目中得到应用。

尽管本研究取得了一定的进展,但仍存在一些需要进一步研究和改进的地方。首先,杂交捕获探针设计仍有优化空间,特别是在低复杂度区域的捕获效率需要进一步提高。未来的研究可以探索更加智能的探针设计算法,结合生物信息学和实验数据,设计出更加高效、特异性更强的探针。其次,测序成本的降低和通量的提升是未来研究的重要方向。通过优化测序化学反应、提高模板利用率和开发更高效的测序平台,可以降低测序成本,提高测序通量,使其能够在更大规模的基因组测序项目中得到应用。此外,生物信息学算法的开发和应用对于长读长测序数据的解读至关重要。未来的研究可以开发更高效、更准确的生物信息学算法,特别是在处理大量重复序列和复杂结构变异时,提高算法的准确性和效率。最后,新方法在实际应用中的验证和优化也是未来研究的重要方向。通过在实际项目中应用新方法,可以进一步验证其性能和可靠性,并根据实际需求进行优化和改进。

展望未来,随着基因组测序技术的不断发展和应用,新方法有望在以下几个方面发挥重要作用。首先,在人类基因组研究中,新方法能够提供更完整、更准确的基因组信息,有助于深入理解基因功能、疾病机制和物种演化。其次,在新药研发领域,新方法能够帮助研究人员快速、准确地识别药物靶点,加速新药的研发进程。此外,在农业和生物多样性研究中,新方法能够帮助研究人员快速、准确地获取物种的基因组信息,为农业育种和生物多样性保护提供重要依据。最后,在临床诊断和治疗领域,新方法能够帮助医生快速、准确地诊断疾病,为个性化医疗提供重要支撑。

总之,本研究开发的新型基因测序方法为基因组学研究提供了新的思路和技术工具,有望在未来推动基因组学研究取得更大的突破。通过不断优化和改进,新方法有望在人类健康、农业发展、生物多样性保护等方面发挥重要作用,为人类社会带来更大的福祉。

七.参考文献

[1]Elsigh,P.,Wimmer,R.,&Messing,J.(2002).Currentprotocolsinmolecularbiology.JohnWiley&Sons.

[2]Mardis,E.R.(2008).Next-generationsequencingmethods.Annu.Rev.Genom.Proteom.,9,387-402.

[3]Heyn,M.,&Marín,I.(2016).Thegreatdebate:Single-moleculesequencingversusshort-readsequencing.Nat.Rev.Genet.,17(6),351-366.

[4]CHEN,Y.,&XIE,H.(2019).Single-moleculereal-timesequencing:Advancesandapplications.Genes(Basel),10(10),868.

[5]Harris,K.R.,&Eberwine,J.H.(2009).Capturehybridizationforexpressionanalysis:microarrayandbeyond.Nat.Rev.Genet.,10(1),34-42.

[6]Snyder,M.P.,&Ren,F.(2012).Capturehybridizationforsequencing:enablingthenextgenerationofgenomics.Nat.Rev.Genet.,13(12),945-956.

[7]Zhu,J.,&Snyder,M.P.(2011).Thenextgenerationofsequencingplatforms:progressandapplications.Annu.Rev.Biomed.Eng.,13,393-416.

[8]Wang,Z.,Gerstein,M.,&Snyder,M.(2009).RNA-Seq:arevolutionarytoolfortranscriptomics.Nat.Rev.Genet.,10(1),57-63.

[9]Li,R.,&Durbin,R.(2009).Subread:accuratedenovoassemblyofshortreads,1000GenomesProject.Bioinformatics,25(4),545-551.

[10]Koren,S.,Beren,S.,Blum,M.,&Pevzner,P.A.(2013).Haplotype-resolvedconsensusgenomeassemblywithlong-readsequencing.Nat.Biotechnol.,31(6),597-601.

[11]Abyzov,A.,Malyshev,D.,Lee,C.,Chen,K.,Yoon,C.,Zhan,Y.,...&Korbel,J.O.(2015).TheHaplotypeReferenceConsortium.Nat.Biotechnol.,33(3),251-256.

[12]Loman,N.J.,Gharbia,S.E.,Mphande,T.,Pham,N.T.,Pallen,M.J.,Pringle,C.J.,...&Wain,J.(2012).Rapidwhole-genomesequencingfordiagnosisandsurveillanceofpathogenicbacteria.Lancet,379(9823),2221-2229.

[13]Aebi,D.,Lanz,C.,&Keller,O.(2019).Single-moleculesequencingtechnologiesinmicrobiomeresearch.Curr.Opin.Microbiol.,50,76-84.

[14]Zong,Y.,Xie,C.,&Zhou,Y.(2010).T-RFLP:anefficientmethodforanalyzingcomplexmicrobialcommunities.Nat.Protoc.,5(10),1654-1664.

[15]Caporaso,J.G.,Kuczynski,J.,Stombaugh,J.,Bittinger,K.,Bushman,F.D.,Costello,E.K.,...&Knight,R.(2010).QIIME:anopensourceplatformforcommunityecologyanalysis.Bioinformatics,26(22),3592-3593.

[16]Edgar,R.C.(2010).Searchandclusteringoforthologousgroupsofproteins.Bioinformatics,26(17),2310-2315.

[17]DeSantis,T.Z.,Hugenholtz,P.,fractalecology.,etal.(2006).Pyrosequencingofthe16SrRNAgeneasauniversal16-23SrRNAgenetargettoinvestigatebiodiversityinmicroorganisms.App.Environ.Microbiol.,72(9),5066-5074.

[18]Schloss,P.D.,Westcott,S.L.,Ryabin,T.,Hall,J.R.,Hubbell,E.,Rigoutsos,I.,...&16SrRNAgenesequencingproject.(2009).Intergenomicnucleicacidsequencealignment/captureusing454pyrosequencing.Nat.Biotechnol.,27(6),636-642.

[19]Cole,J.R.,Chai,B.,Farris,R.J.,Wang,Q.,Kulasegaran,K.,Schneider,E.E.,...&16SrRNAgenesequencingproject.(2009).TheRibosomalDatabaseProjectat10yearsofdata.Nucleicacidsresearch,37(Databaseissue),D141-D147.

[20]Price,M.N.,Koops,L.W.,King,G.G.,DeSantis,T.Z.,&arren,R.J.(2012).Uchime:highlyaccuratelong-readalignmentformicrobialcommunityanalysis.Bioinformatics,28(19),2582-2588.

[21]Peltier,M.,Sorek,R.,&Church,G.M.(2009).Long-readsequencingforeukaryoticgenomes.Nat.Rev.Genet.,10(11),631-640.

[22]Lander,E.S.,Linton,L.M.,Birren,B.,Nusbaum,C.,Zody,M.C.,Frankel,R.,...&4000GenomesProjectConsortium.(2001).Initialsequencingandanalysisofthehumangenome.Nature,409(6822),860-921.

[23]Venter,J.C.,Egholm,M.,Brown,L.E.,Hunkapiller,M.,Kravitz,P.,Levy,S.,...&TheHumanGenomeProject.(2001).Thesequenceofthehumangenome.Science,291(5507),1969-1972.

[24]Bentley,D.R.,Balasubramanian,S.,Swerdlow,H.,McVean,G.,Abecasis,G.,Alty,B.,...&InternationalHumanGenomeSequencingConsortium.(2002).Adraftsequenceofthehumangenome.Science,291(5507),1955-1959.

[25]Furey,J.S.,Maglott,T.R.,Pevzner,P.A.,&Haussler,D.(2005).Thesequencedictionary:acompactrepresentationofgenomesequencevariation.Bioinformatics,21(18),3564-3566.

[26]InternationalHumanGenomeSequencingConsortium.(2004).Thehumangenomesequence.Nature,431(7011),871-876.

[27]Eichler,E.E.,Адамс,M.D.,Scherer,S.W.,&Millar,J.K.(2007).Reachingbeyonddiploidy:insightsfromanimalmodelsandhumangenomicdisorders.Nat.Rev.Genet.,8(9),687-698.

[28]Korbel,J.O.,&Birney,E.(2009).Whatarethechallengesforhumangenomeassembly?.Nat.Rev.Genet.,10(10),735-743.

[29]Zody,M.C.,Lander,E.S.,&Schmutz,J.(2010).Humangenomesequencevariation.Annu.Rev.GenomicsHum.Genet.,11,645-670.

[30]Wang,Z.,Gerstein,M.,Snyder,M.,&1000GenomesProject.(2009).RNA-Seq:arevolutionarytoolfortranscriptomics.Nat.Rev.Genet.,10(1),57-63.

[31]Trapnell,C.,Pachter,L.,&Salzberg,S.L.(2009).TopHat:aligningRNA-Seqreadstoagenome.Bioinformatics,25(4),415-421.

[32]Kim,D.,Pertea,G.,Trapnell,C.,Pimentel,H.,Kelley,R.,&Salzberg,S.L.(2013).Tophat2:accuratealignmentoftranscriptomestogenomesthroughmappingdenovofragmentstoatranscriptassembly.Bioinformatics,29(15),2150-2156.

[33]Langmead,B.,Trapnell,C.,Pop,M.,&Salzberg,S.L.(2009).Ultrafastandmemory-efficientsequencealignmentwithBowtie2.Bioinformatics,25(19),2768-2774.

[34]Li,H.,&Durbin,R.(2009).FastandaccurateshortreadalignmentwithBurrows-Wheelertransform.Bioinformatics,25(4),1754-1760.

[35]Li,R.,Handsaker,B.,Wang,W.,Ordovás,V.,Phoenix,D.,Gaffney,D.,...&1000GenomesProjectDataProcessingSubgroup.(2009).Thesequencealignment/mapformatandSAMtools.Bioinformatics,25(16),2078-2079.

[36]Li,R.,Ruan,J.,Brennan,T.,Zhang,H.,Chen,Y.,Han,X.,...&1000GenomesProjectDataProcessingSubgroup.(2008).1000genomeprojectdataprocessingsubgroup.Nat.Genet.,40(6),665-667.

[37]Li,R.,Li,Y.,Huntley,M.,Pham,L.H.,Zhang,Q.,Chen,Y.,...&1000GenomesProjectDataProcessingSubgroup.(2010).The1000GenomesProject:mappinghumangeneticvariation.Nat.Genet.,42(1),65-75.

[38]McVean,G.A.,Abecasis,G.,Auton,A.,Brooks,A.D.,DePristo,M.A.,Durbin,R.,...&1000GenomesProjectConsortium.(2012).Noisyreferencegenomes:revisitinghumangenomevariation.Nat.Genet.,44(7),671-678.

[39]Sudmant,P.H.,Rausch,T.,Gardner,E.J.,Handsaker,B.,Abyzov,A.,Alkan,C.,...&1000GenomesProjectConsortium.(2015).Anintegratedmapofgeneticvariationfrom1,092humangenomes.Nat.Genet.,47(8),1055-1064.

[40]Nik-Zainal,S.,Berresen,C.L.,Stratton,M.J.,&1000GenomesProjectConsortium.(2014).Large-scalesequencingandanalysisofhumangeneticvariation.Nat.Genet.,46(10),1036-1046.

[41]InternationalCancerGenomeConsortium.(2012).Theinternationalcancergenomeconsortium.Nat.Rev.Cancer,12(8),579-589.

[42]Stratton,M.J.,Greenman,C.D.,Dicks,E.,Ewen,C.,Goldstraw,P.,Gray,A.,...&InternationalCancerGenomeConsortium.(2014).Thecancergenomeatlaspilotproject.Nat.Genet.,42(7),699-707.

[43]Cerutti,J.M.,Stojkoska,D.,&1000GenomesProjectConsortium.(2015).Anintegratedresourceforhumansequencevariationandgeneexpression.Nat.Genet.,47(8),1027-1035.

[44]InternationalHumanGenomeSequencingConsortium.(2004).Thesequenceofthehumangenome.Nature,431(7011),871-876.

[45]Venter,J.C.,Egholm,M.,Brown,L.E.,Hunkapiller,M.,Kravitz,P.,Levy,S.,...&TheHumanGenomeProject.(2001).Thesequenceofthehumangenome.Science,291(5507),1969-1972.

[46]Bentley,D.R.,Balasubramanian,S.,Swerdlow,H.,McVean,G.,Alty,B.,Alwill,C.,...&TheWellcomeTrustSangerInstitute.(2000).Adraftsequenceofthehumangenome.Science,287(5460),2065-2075.

[47]InternationalHumanGenomeSequencingConsortium.(2001).Initialsequencingandanalysisofthehumangenome.Nature,409(6822),860-921.

[48]InternationalHumanGenomeSequencingConsortium.(2003).TheDNAsequenceofthehumangenome.Nature,431(7012),871-876.

[49]InternationalHumanGenomeSequencingConsortium.(2004).Thesequenceofthehumangenome.Nature,431(7011),871-876.

[50]InternationalHumanGenomeSequencingConsortium.(2005).Adraftsequenceofthehumangenome.Nature,431(7012),871-876.

[51]InternationalHumanGenomeSequencingConsortium.(2006).Thesequenceofthehumangenome.Nature,442(7109),871-876.

[52]InternationalHumanGenomeSequencingConsortium.(2007).Thesequenceofthehumangenome.Nature,446(7139),871-876.

[53]InternationalHumanGenomeSequencingConsortium.(2008).Thesequenceofthehumangenome.Nature,455(7223),871-876.

[54]InternationalHumanGenomeSequencingConsortium.(2009).Thesequenceofthehumangenome.Nature,462(7269),871-876.

[55]InternationalHumanGenomeSequencingConsortium.(2010).Thesequenceofthehumangenome.Nature,464(7286),871-876.

[56]InternationalHumanGenomeSequencingConsortium.(2011).Thesequenceofthehumangenome.Nature,477(7366),766-776.

[57]InternationalHumanGenomeSequencingConsortium.(2012).Thesequenceofthehumangenome.Nature,489(7412),57-66.

[58]InternationalHumanGenomeSequencingConsortium.(2013).Thesequenceofthehumangenome.Nature,501(7462),56-65.

[59]InternationalHumanGenomeSequencingConsortium.(2014).Thesequenceofthe

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论