CN114072523B 用于检测核酸变体的方法 (阿尔缇玛基因组学公司)_第1页
CN114072523B 用于检测核酸变体的方法 (阿尔缇玛基因组学公司)_第2页
CN114072523B 用于检测核酸变体的方法 (阿尔缇玛基因组学公司)_第3页
CN114072523B 用于检测核酸变体的方法 (阿尔缇玛基因组学公司)_第4页
CN114072523B 用于检测核酸变体的方法 (阿尔缇玛基因组学公司)_第5页
已阅读5页,还剩134页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2021.12.31PCT/US2020/0311472020.05.01WO2020/227137EN2020.11.12US2012046177A1,2012.02.23US2013073214A1,2013.03.21本文描述了用于检测测试样品中的短遗传从测试核酸分子获得的一个或多个测序数据集的核苷酸流中提供的非终止核苷酸对测试核酸述了使用两个或更多个不同的流动循环顺序和/或每个循环具有五个或更多个核苷酸流的扩展2分开的核苷酸流中提供的非终止核苷酸对靶序列进行测序获得靶测序数据集和参考测序的可能性的统计参数,其中碱基计数指示在该流动位置处测序的测试核酸分子的碱基数,并且其中统计参数是通过使用机器学习算法由在测序过程中检测到的模拟据每个流动位置处与靶序列相关的碱基计数的可能性的乘积所确定的指示与测试核酸分考序列相关的碱基计数的可能性的乘积所确定的指示与核酸分子相关的测试测序数据集其中所述流动循环顺序包括4个或更多个分开的核苷酸流,每个分开的核苷酸流是指2.权利要求1的方法,包括使用根据流动循环顺序在分开的核苷酸流中提供的非终止4.权利要求1的方法,包括使用一个或多个处理器针对与测试样品相关的受试者生成6.权利要求1的方法,其中通过在计算机中对靶序列和参考序列进行测序来获得靶测7.权利要求1的方法,其中靶测序数据集在多于两个非连续流动位置处不同于参考测8.权利要求1的方法,其中靶测序数据集在多于两个连续流动位置处不同于参考测序9.权利要求1的方法,其中靶序列在X个碱基位置处不3使用一个或多个处理器选择测试测序数据集中的每个流动位置处对应于该流动位置使用一个或多个处理器选择测试测序数据集中的每个流动位置处对应于该流动位置并使用一个或多个处理器确定指示测试测序数据集与参考序列匹配的可能性的匹配18.权利要求17的方法,其中对于一个或多个测试测序数据集中的每一个单独判定靶19.权利要求17的方法,其中多个测试测序数据集的至少一部分与具有不同测序起始开的核苷酸流中提供的非终止核苷酸对一个或多个测试核酸分子进行测序来确定第一测序在分开的核苷酸流中提供的非终止核苷酸对一个或多个测试核酸分子进行测序来确定4其中所述流动循环顺序包括4个或更多个分开的核苷酸流,每个分开的核苷酸流是指21.权利要求20的方法,包括使用根据第一流动循环顺序在分开的核苷酸流中提供的22.权利要求20的方法,其中匹配得分指示第一测试测序数据集与候选序列匹配的可23.权利要求20的方法,其中匹配得分指示第一测试测序数据集和第二测序数据集两使用一个或多个处理器从两个或更多个不同的候选序列中选候选序列具有与第一测试测序数据集、第二测试测序数据集或两者的最高可能性的匹配;和使用一个或多个处理器使用所选的候选序列判定测试样品中短遗传变体的存在或不25.权利要求24的方法,其中来自两个或更多个不同候选序列的至少一个未选择的候选序列在根据第一流动循环顺序或第二流动循环顺序的两个或更多个流动位置处不同于所选的候选序列。26.权利要求24的方法,其中来自两个或更多个不同候选序列的至少一个未选择的候选序列在根据第一流动循环顺序或第二流动循环顺序的两个或更多个非连续流动位置处不同于所选的候选序列。27.权利要求24的方法,其中来自两个或更多个不同候选序列的至少一个未选择的候选序列在根据第一流动循环顺序或第二流动循环顺序的3个或更多个流动位置处不同于所选的候选序列。28.权利要求24的方法,其中来自两个或更多个不同候选序列的至少一个未选择的候选序列在X个碱基位置处不同于所选的候选序列,并且其中与测试核酸分子相关的测试测同于来自两个或更多个不同候选序列的至少一个未选择的候选序列。更多个不同候选序列的至少一个未选择的候选序列跨一个或多个流动循环地不同于所选30.权利要求20的方法,其中流动信号包括指示在每个流动位置处测序的测试核酸分531.权利要求20的方法,其中流动信号包括指示每个流动位置处多个碱基计数的可能动位置处对应于该流动位置处候选序列的碱35.权利要求31的方法,其中匹配得分是跨第一测试测序数据集和第二测试测序数据使用一个或多个处理器选择靶短遗传变体,其中通过使二流动循环顺序在分开的核苷酸流中提供的非终止核苷酸对靶序列进行测序来获得靶测40.权利要求37的方法,其中如果使用根据第一流动循环顺序或第二流动循环顺序在个或更多个流动位置处不同于参考序列。对测试核酸分子进行测序,包括根据第一流动循环顺序在对相同的测试核酸分子进行测序,包括根据第二流动循环顺序在分647.权利要求1-45任一项的方法,其中至少一个单独分开的流动包括2种或3种不同的48.权利要求1-45任一项的方法,包括使用一个或多个处理器生成或更新指示测试样非暂时性计算机可读介质,其存储包括用于实施权利要求1-527[0004]以下提交的ASCII文本文件的内容通过引用整体并入本文中:计算机可读形式[0011]在一些实施方案中,一种用于检测测试样品中的短遗传变体的方法包括(a)选择传变体的靶序列相关的靶测序数据集在多于两个流动位置处不同于与参考序列相关的参相关,每个测试核酸分子至少部分重叠于与靶短遗传变体相关并源自测试样品的基因座,其中通过使用根据流动循环顺序在分开的核苷酸流中提供的非终止核苷酸对测试核酸分8分子相关的测试测序数据集与靶序列匹配的可能性的匹配得分(matchscore),或指示与核酸分子相关的测试测序数据集与参考序列匹配的可能性的匹配得分;和(d)使用一个或多个所确定的匹配得分来判定测试样品中靶短遗传变苷酸流中提供的非终止核苷酸对测试核酸分[0013]在以上方法的一些实施方案中,在判定测试样品中存在或不存在靶短遗传变体列进行测序来获得预期的靶测序数据集和预期的参考+2)个流动位置差包括基本上等于零的值与基本上大于零的值之间的差。在一些实施方案信号包括指示在每个流动位置处测序的测试核酸分子的碱基确定指示测试测序数据集与参考序列匹配的可能性的[0020]在上述方法的一些实施方案中,流动循环顺序包括以相同顺序重复的4个单独分9测试测序数据集包括在对应于核苷酸流的流动位置处的流动信号;(b)获得一个或多个第个候选序列的候选序列匹配的可能性;和(d)使用所确定的匹配得分判定测试样品中短遗使用在分开的核苷酸流中提供的非终止核苷酸对测试核酸分指示第一测试测序数据集和第二测序数据集两者与候选列的至少一个未选择的候选序列在根据第一流动循环顺序或第二流动循环顺序的两个或选序列的至少一个未选择的候选序列在根据第一流动循环顺序和第二流动循环顺序两者个不同候选序列的至少一个未选择的候选序列在根据第一流动循环顺序或第二流动循环两个或更多个不同候选序列的至少一个未选择的候选序列在根据第一流动循环顺序和第动循环顺序或第二流动循环顺序的两个或更多个连续流动位置处不同于所选的候选序列。第一流动循环顺序和第二流动循环顺序两者的两个或更多个连续流动位置处不同于所选选序列在根据第一流动循环顺序或第二流动循环顺序的3个或更多个流动位置处不同于所序列在根据第一流动循环顺序和第二流动循环顺序两者的3个或更多个流动位置处不同于的候选序列在X个碱基位置处不同于所选的候选序列,并且其中与测试核酸分子相关的测试测序数据集在根据第一流动循环顺序或第二流动循环顺序的(X+2)个或更多个流动位置中,来自两个或更多个不同候选序列的至少一个未选择的候选序列在X个碱基位置处不同顺序和第二流动循环顺序两者的(X+2)个或更多个流动位置处不同于来自两个或更多个不序列跨一个或多个流动循环不同于所选的候选序列。测试测序数据集和第二测试测序数据集中的每个流动位置处对应于该流动位置处候选序试测序数据集和第二测试测序数据集中的流动位置的所选统计参数的据第一流动循环顺序或第二流动循环顺序使用在单独分开的核苷酸流中提供的非终止核靶序列相关的靶测序数据集在两个或更多个流动位置处不同于与参考序列相关的参考测动循环顺序或第二流动循环顺序使用在分开的流动中提供的非终止核苷酸对参考序列进根据第一流动循环顺序和第二流动循环顺序两者使用在分开的流动中提供的非终止核苷循环不同于参考序列。顺序包括以相同顺序重复的5个或更多个单独分开的所述方法包括向患者或患者的健康护理代表提性(如星号所示)选择最可能的序列。个流动位置与候选序列匹配的可能性的乘积来确定测序数据与给定序列个由延伸引物的序列表示)与两个候选序列H1(SEQIDNO:5)和H2(SEQIDNO:6)(每个由它们的互补序列表示)比对的比对结果。图2B显示对应于R1的测序数据,其中迹线表示H1[0048]图4A显示了通过使用第一流动循环顺序(T-A-C-G)对核酸分子测序获得的具有延伸引物序列TATGGTCGTCGA(SEQIDNO:1)的核酸分子的测序数据,和图4B显示了通过使用显示了来自第一候选序列TATGGTCGTCGA(SEQIDNO:1)(实心圆)和第二候选序列[0051]图7说明了根据一个实施方案的计算装置的实例,其可用于实施本文中所描述的[0053]图9显示了对于四个示例性流动循环顺序(包括其中三个是扩展的流动循环顺[0055]本文描述了用于检测源自受试者的测试样品中的一个或多个短遗传变体的方候选单倍型序列和/或参考序列))之间的匹配,这可以通过确定指示匹配的接近度的匹配然后可以使用匹配得分来判定测试样品中短遗传变体的存在或身份或不存根据流动循环顺序在分开的核苷酸流中提供的非终止核苷酸对测试核酸分子进行测序来见的变体类型(取代SNP)将产生两个或更多个不同的流动信号(其可以传播整个流动循环[0057]给定遗传变体的流动空间中的多信号指示符提高了可以在碱基空间分析中鉴定体,并且可以选择那些变体和/或流动顺序以确保生成期望数量的流动信号差异来确信地[0058]在碱基空间中确定的序列与候选序列(如候选单倍型序列)的比对在计算上是昂动空间确定的可能性可以替换HaplotypeCaller的PairHMM模块以用于计算上更有效的变测试测序数据集是通过根据流动顺序使用在分开的核苷酸流中提供的非终止核苷酸对测据集与一个或多个候选序列匹配的可能性的匹配得分;和(c)使用一个或多个确定的匹配得分判定测试样品中靶短遗传变体的存在或不个或多个测试测序数据集通过使用根据流动循环顺序在分开的核苷酸流中提供的非终止序数据集与参考序列匹配的可能性的匹配得分;和(d)使用一个或多个确定的匹配得分来判定测试样品中靶短遗传变体的存在或不存第一测试测序数据集包括对应于核苷酸流的流动位置处的流动信号;(b)获得一个或多个或多个候选序列的候选序列匹配的可能性;以及(d)使用所确定的匹配得分来判定测试样个程序可以包括用于执行本文所述的任何一种或多种[0071]“流(动)顺序”是指用于使用非终止核苷酸对核酸分子进行测序的单独分开的核苷酸多态性(MNP)和长度为10个连续碱基或更延伸引物中的所得序列应为模板多核苷酸分子序列的反向互补序列。在一些实施方案中,[0086]可以在引物延伸过程中以流动顺序引入核苷酸,其可以进一步划分成流动循环。循环顺序可以是T-C-A-C-G-A-T-G-C-A-T-G-C-T-A-G,其中这16个分开提供的核苷酸以该在一些实施方案中,与总核苷酸相比,标记的核苷酸部分为约0.01%至约100诸如约通过桥式扩增或其他扩增技术)以生成多核苷酸测序集落。簇内扩增的多核苷酸基本上相同或互补(在扩增过程期间可能引入一些误差,使得多核苷酸的一部分可能不一定与原始中的延伸可以包括使用具有一种或多种不同碱基类型的核苷酸逐步延伸引物的一个或多50个碱基至约100个碱基长、约100个碱基至约250个碱基长、约250个碱基至约500个碱基[0094]用于本文所述方法中的多核苷酸可以从任何合适的生物来源获得,例如组织样判定共有序列的方法通常使用独特分子标识符(UMI)标记核酸分子并将核酸分子扩增以生不使用独特分子标识符(UMI)的情况下获[0102]流动图可以是二进制或非二进制的。二进制流动图检测整合的核苷酸存在(1)或不存在(0)。非二进制流动图可以更定量地确定从每次逐步引入整合的核苷酸的数目。例重复流动循环顺序用以下序列延伸的引物:TATGGTCGTCGA(SEQIDNO:1)可以产生图1A中文进一步讨论的统计分析,其中真零值可能引起计算误差或不充分地区分不可能性的水[0105]指示给定序列的测序数据集的可能性的值可以从没有序列比对的测序数据集确据每个流动位置处的最可能的碱基计数来确定引物延伸的序列:TATGGTCGTCGA(SEQIDNO:1)序列(或反向互补序列),这个测序数据集的可能性可以确定为在每个流动位置处所讨论的)指示测序数据集可能来自具有与紧密匹配的候选序列相同序列的核酸分子。在一则反之亦然),并且可以在流动空间或碱基空间中进行映射。与映射序列相对应的基因座的核酸分子的序列不需要使用比对算法与每个候选序列比对,这通常在计算上是昂贵的。TATGGTCATCGA(SEQIDNO:2)的候选引物延伸序列。图1C(显示图1A中的相同测序数据集)NO:2)匹配的可能性的匹配得分基本上不同于指示测序数据与第二候选序列TATGGTCGTCGA[0109]匹配得分可用于将测试测序数据和/或与测试测序数据相关的核酸分子分类。分者可以指示空判定。空判定既不指示与测试测序数据相关的核酸分子中存在或不存在变择测序数据集中的每个流动位置处的与该流动位置处的候选序列的碱基计数相对应的统选测序数据集来生成。示例性候选测序数据集显示在图1C中的测试数据测序数据集下方,其中第一候选序列(TATGGTCATCGA(SEQIDNO:2))对应于实心圆迹线,并且第二候选序列遗传变体的候选序列(例如,从两个或更多个候选序列中产生具有最高可能性匹配的匹配未选择的候选序列在X个碱基位置处不同于所选的候选序列,其中与序列核酸分子相关的测序数据集在(X+2)个或更多个流动位置处不同于未选择的候选序列。所选择的候选序列与未选择的候选序列之间的不同流动位置的数量的增加(其中测序的核酸分子测序数据集与所选择的候选序列最佳匹配)降低了从使用未选择的候选序列对核酸分子进行测序而得0.0001。测序的核酸分子的测序数据集与所选的候选序列匹配的可能性优选高,如大于[0114]可以使用一个或多个确定的匹配得分来判定测试样品中短遗传变体的存在(或同类为具有较低置信度匹配得分的变体的两个或更多个核酸HaplotypeCaller算法,确定指示多个测试测序数据集与候选序列匹配的可能性的匹配得forvariationdiscoveryandgenotypingusingnext-generationDNAsequencingVariantDiscoverytoTensofKestomenofSamples,BioRxiv,www.bioR/content/10.1101/201178v3(2018年7月24日);Hwang等,SystematicComparisonofVariantCallingPipelinesUsingGoldStandardPersonalExomeVariants,[0118]如本文所述的鉴定短遗传变体的方法在预先选择了一个或多个靶短遗传变体时可能是特别有用的。对于给定短遗传变体的检测限(LOD)可取决于短遗传变体的序列背景过对具有靶序列的核酸分子和/或具有参考序列的核酸分子进行实际测序来确定靶和参考基位置处不同于参考序列,并且其中靶测序数据集在(X+2)个或更多个连续流动位置处不的靶序列相关的靶测序数据集在两个或更多个流动位置处不同于与参考序列相关的参考用于生成靶和参考测序数据集的相同流动循环顺序使用在分开的核苷酸流中提供的非终参考序列匹配的可能性的匹配得分),并且可以使用所确定的匹配得分来判定测试样品中[0123]在一些实施方案中,使用多个测试测序数据集检测测试考序列匹配的可能性的匹配得分),并且可以使用所确定的匹配得分来判定测试样品中靶[0125]图3显示了用于检测测试样品中的短遗传变体的示例性方法的流程图。在步骤苷酸流中提供的非终止核苷酸对靶序列进行测序来获得靶测序数据集和参考测序数据集包括在所述多个流动位置处的流动信号;(c)对于与测试测序数据集相关的每个测试核酸指示与核酸分子相关的测试测序数据集与参考序列匹配的可能性的匹配得分;和(d)使用多于两个连续流动位置或多于两个非连续流动位置)处不同于参考测序数据集。在一些实列相关的靶测序数据集在多于两个流动位置处不同于与参考序列相关的参考测序数据集,其中流动位置对应于核苷酸流;(b)使用根据流动循环顺序在分开的核苷酸流中提供的非核酸分子至少部分重叠于与靶短遗传变体相关并源自测试样品的基因座;(c)对于与测试可能性的匹配得分;和(d)使用一个或多个确定的匹配得分来判定测试样品中靶短遗传变核酸分子相关的测试测序数据集与参考序列匹配的可能性的匹配得分;和(d)使用一个或位置对应于核苷酸流;(b)使用根据流动循环顺序在分开的核苷酸流中提供的非终止核苷至少部分重叠于与靶短遗传变体相关并源自测试样品的基因座;(c)对于与测试测序数据匹配得分;和(d)使用一个或多个确定的匹配得分来判定测试样品中预先选择的靶短遗传包括预先选择的靶短遗传变体的靶序列相关的靶测序数据集在多于两个流动位置处不同的流动循环顺序使用在分开的核苷酸流中提供的非终止核苷酸对测试核酸分子进行测序集与参考序列匹配的可能性的匹配得分;和(d)使用一个或多个确定的匹配得分来判定测对与测试样品相关的受试者生成个性化生物标志物组,该生物标志物组包括靶短遗传变跨一个或多个流动循环不同于参考测序数据包括预先选择的靶短遗传变体的靶序列相关的靶测序数据集在多于两个流动位置处不同流动循环顺序使用在分开的核苷酸流中提供的非终止核苷酸对一个或多个测试核酸分子进行测序以获得一个或多个测试测序数据集,每个测试测序数据集与测试核酸分子相关,并且每个测试核酸分子至少部分重叠于与靶短遗传变体相关并源自测试样品的基因座;(c)对于与测试测序数据集相关的每个测试核酸分子,确定指示与核酸分子参考序列匹配的可能性的匹配得分;和(d)使用一个或多个确定的匹配得分来判定测试样测试样品相关的受试者生成个性化生物标志物组,该生物标志物组包括所述靶短遗传变跨一个或多个流动循环不同于参考测序数据序包括流动循环顺序中的论最大值可以产生不同于参考(或候选)序列的针对多于两个流动位置的新信号。如上所述,传播的信号差异增加了测试测序数据集与不正确匹配的候选序列之间的差异可能性。四碱基流动循环顺序T-A-C-G可以导致测试测序数据集在多于两个流动位置处与参考测序数据集不同。如本文进一步讨论的,鉴于足够高的测序深度(即,采样足够大量的起始位或除了导致均聚物长度变化的那些之外的所有SNP)可以在测试测序数据集和参考测序数靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异,所述两个测序数据集与在至少5%的随机测序起始位置的约50%至87.5%的SNP排列中SNP不同考测序数据集)之间的多于两个流动位置处产生信号差异,所述两个测序数据集与在至少5%的随机测序起始位置的约70%至87.5%的SNP排列中SNP不同的核酸分子相关。在一些候选或参考测序数据集)之间的多于两个流动位置处产生信号差异,所述两个测序数据集与在至少5%的随机测序起始位置的约80%至87.5%的SNP排列中SNP不同的核酸分子相靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异,所述两个测序数据集与在至少10%的随机测序起始位置的约50%至87.5%的SNP排列中SNP不如,测试或靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异,所述两个测序数据集与在至少10%的随机测序起始位置的约60%至87.5%的SNP排或靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异,所述两个测序数据集与在至少10%的随机测序起始位置的约70%至87.5%的SNP排列中SNP数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异,所述两个测序数据集与在至少10%的随机测序起始位置的约80%至87.5%的SNP排列中SNP不同的核靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异,所述两个测序数据集与在至少20%的随机测序起始位置的约50%至87.5%的SNP排列中SNP不如,测试或靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异,所述两个测序数据集与在至少20%的随机测序起始位置的约60%至87.5%的SNP排或靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异,所述两个测序数据集与在至少20%的随机测序起始位置的约70%至87.5%的SNP排列中SNP数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异,所述两个测序数据集与在至少20%的随机测序起始位置的约80%至87.5%的SNP排列中SNP不同的核靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异,所述两个测序数据集与在至少30%的随机测序起始位置的约50%至87.5%的SNP排列中SNP不如,测试或靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异,所述两个测序数据集与在至少30%的随机测序起始位置的约60%至87.5%的SNP排或靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异,所述两个测序数据集与在至少30%的随机测序起始位置的约70%至87.5%的SNP排列中SNP数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异,所述两个测序数据集与在至少30%的随机测序起始位置的约80%至87.5%的SNP排列中SNP不同的核“移位灵敏度(shiftsensitivity)”是指在所有可能的SNP排列上在两个测序数据集(例如,测试或靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号流动相下的SNP排列上在两个测序数据集(例如,测试或目标测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异的最大灵敏度。[0145]在一些实施方案中,一种核酸测序方法包括(a)将核酸分子与引物杂交以形成杂[0147]由于所检测的短遗传变体的灵敏度取决于用于对核酸分子进行测序的流动循环核酸分子(或具有重叠基因座的多个核酸分子)。可以基于两个或更多个不同测序数据集上所述的匹配得分来判定变体的存在或不存在和/或选择候选序列。[0148]该方法可以包括获得与源自使用第一流动循环顺序测序的测试样品的测试核酸伸的测序引物;以及通过根据第二流动循环顺序在分开的核苷酸流中提供非终止核苷酸,4B)确定的具有延伸引物序列TATGGTCGTCGA(SEQIDNO:1)的核酸分子的示例性测序数据序列不改变。在测序数据集内,可以选择每个流动位置处与第一候选延伸引物序列TATGGTCGTCGA(SEQIDNO:1)(实心圆)和第二候选延伸引物序列TATGGTCATCGA(SEQIDNO:2)(空心圆)的碱基计数相对应的统计参的差异在流动位置12-20处是明显的(图4A),而使用第一流动循环顺序的第一候选序列和[0150]可以确定指示第一测序数据集和第二测序数据集与一个或多个候选序列(例如,序列或其他可能的候选序列(如单倍型))匹配的可能性的匹配得分,并且可以判定靶短遗传变体的存在或不存在或选择候选序列。[0151]如本文所讨论的,对在共同基因座处重叠的多个不同测使用第一流动循环顺序测序的测试核酸分子相关,并且可以获得多个第二测试测序数据含预先选择的靶短遗传变体的序列的参考序列或其他可能的候选序列(如单倍型))匹配的[0152]图5显示了用于检测测试样品中存在或不存在短遗传变体的示例性方法。在步骤顺序使用在分开的核苷酸流中提供的非终止核苷酸对一个或多个测试核酸分子进行测序通过接收一个或多个第二测试测序数据集或通过对一个或多个核酸分子进行测序来获得根据不同于第一流动循环顺序的第二流动循环顺序使用在分开的核苷酸流中提供的非终确定的匹配得分来判定测试样品中短遗传变体的存在或不存在。[0153]图6显示了用于检测测试样品中存在或不存在短遗传变体的另一种示例性方法。或第二流动循环顺序或两者使用在分开的核苷酸流中提供的非终止核苷酸对靶序列进行环顺序使用在分开的核苷酸流中提供的非终止核苷酸对一个或多个测试核酸分子进行测通过接收一个或多个第二测试测序数据集或通过对一个或多个核酸分子进行测序来获得根据不同于第一流动循环顺序的第二流动循环顺序使用在分开的核苷酸流中提供的非终[0154]在一些实施方案中,用于检测测试样品中短遗传变体的存在或不存在的方法包一个或多个第一测试测序数据集包括对应于核苷酸流的流动位置处的流动信号;(b)获得与来自一个或多个候选序列的候选序列匹配的可能性;和(d)使用所确定的匹配得分来判定测试样品中短遗传变体的存在或不存在。包括:(a)根据第一流动循环顺序使用在分开的核苷酸流中提供的非终止核苷酸对源自测序数据集与不同的测试核酸分子相关;(b)根据第二流动循环顺序使用在分开的核苷酸流数据集与第一测试测序数据集中的一个相同的测试核酸分子相关;(c)对于每个第一测序[0156]在一些实施方案中,用于检测测试样品中短遗传变(a)获得一个或多个第一测试测序数据集,每个第一测试测序数据集与源自测个或多个第一测试测序数据集包括在对应于核苷酸流的流动位置处的流动信号;(b)获得与来自一个或多个候选序列的候选序列匹配的可能性;(d)从两个或更多个不同候选序列两者匹配的最高可能性;和(e)使用所选的候选序列判定测试样品中短遗传变体的存在或一个或更多个流动循环)流动位置(其可以是连续的或非连续的)处与所选的候选序列不来自一个或多个候选序列的候选序列匹配的可能性;(d)从两个或更多个不同候选序列中两者匹配的最高可能性;和(e)使用所选的候选序列判定测试样品中短遗传变体的存在或一个或更多个流动循环)流动位置(其可以是连续的或非连续的)处与所选的候选序列不[0158]在一些实施方案中,用于检测测试样品中短遗传变体的存在或不存在的方法包开的核苷酸流中提供的非终止核苷酸对靶序列进行测序来获得靶测序数据集和参考测序用在分开的核苷酸流中提供的非终止核苷酸对一个或多个测试核酸分子进行测序来确定分开的核苷酸流中提供的非终止核苷酸对一个或多个测试核酸分子进行测序来确定第二测试测序数据集,其中测试测序数据集包括在对应于核苷酸流的流动位置处的流动信号;序列的候选序列匹配的可能性;和(e)使用所确定的匹配得分来判定测试样品中短遗传变[0159]在一些实施方案中,用于检测测试样品中短遗传变体的存在或不存在的方法包开的核苷酸流中提供的非终止核苷酸对靶序列进行测序来获得靶测序数据集和参考测序个第一测试测序数据集与不同的测试核酸分子相关;(c)根据第二流动循环顺序使用在分开的核苷酸流中提供的非终止核苷酸对源自测试样品的相同的一个或多个测试核酸分子或多个候选序列的候选序列匹配的可能性;和(e)使用所确定的匹配得分来判定测试样品中短遗传变体的存在或不存在。[0160]在一些实施方案中,用于检测测试样品中短遗传变体的存在或不存在的方法包开的核苷酸流中提供的非终止核苷酸对靶序列进行测序来获得靶测序数据集和参考测序顺序使用在分开的核苷酸流中提供的非终止核苷酸对一个或多个测试核酸分子进行测序序使用在分开的核苷酸流中提供的非终止核苷酸对一个或多个测试核酸分子进行测序来两者与来自一个或多个候选序列的候选序列匹配的可能性;(e)从两个或更多个不同候选据集或两者匹配的最高可能性;和(f)使用所选的候选序列判定测试样品中短遗传变体的候选序列根据第一流动循环顺序和/或第二流动循环顺序在两个或更多个(或三个或更多个,或跨一个或更多个流动循环)流动位置(其可以是连续的或非连续的)处与所选的候选[0161]在一些实施方案中,用于检测测试样品中短遗传变体的存在或不存在的方法包开的核苷酸流中提供的非终止核苷酸对靶序列进行测序来获得靶测序数据集和参考测序一测试测序数据集与不同的测试核酸分子相关;(c)根据第二流动循环顺序使用在分开的核苷酸流中提供的非终止核苷酸对源自测试样品的相同的一个或多个测试核酸分子进行据集或两者匹配的最高可能性;和(f)使用所选的候选序列来判定测试样品中短遗传变体的候选序列根据第一流动循环顺序和/或第二流动循环顺序在两个或更多个(或三个或更多个,或跨一个或更多个流动循环)流动位置(其可以是连续的或非连续的)处与所选的候[0163]上述操作(包括参考附图所述的那些操作)任选地由图7中所描绘的部件来实现。本领域的普通技术人员会清楚地知道可如何基于图7中所描绘的部件来实现其他过程,例[0167]可以存储在存储器740中并由处理器710执行的软件750可以包括例如体现本公开[0171]设备700可以实现适合于在网络上操作的任何操作系统。软件1850可以用任何合用软件可以以不同的配置部署,如以客户端/服务器布置或例如通过web浏览器作为基于[0172]本文描述的方法任选地进一步包括报告使用分析方法确定的信息和/或生成包括的测试测序数据集与参考序列匹配的可能性的匹配得分;和(d)使用一个或多个确定的匹集跨一个或多个流动循环不同于参考测序数置对应于核苷酸流;(b)使用根据流动循环顺序在分开的核苷酸流中提供的非终止核苷酸少部分重叠于与靶短遗传变体相关并源自测试样品的基因座;(c)对于与测试测序数据集配得分;和(d)使用一个或多个确定的匹配得分来判定测试样品中靶短遗传变体的存在或靶序列相关的靶测序数据集在多于两个流动位置处不同于与参考序列相关的参考测序数测试测序数据集包括多个流动位置处的流动信号;(c)对于与测试测序数据集相关的每个(d)使用一个或多个确定的匹配得分来判定测试样品中预先选择的靶短遗传变体存在或不序列相关的靶测序数据集在多于两个流动位置处不同于与参考序列相关的参考测序数据试核酸分子至少部分重叠于与靶短遗传变体相关并源自测试样品的基因座;(c)对于与测的可能性的匹配得分;和(d)使用一个或多个确定的匹配得分来判定测试样品中预先选择的靶短遗传变体的靶序列相关的靶测序数据集在多于两个流动位置处不同于与参考序列序使用在分开的核苷酸流中提供的非终止核苷酸对测试核酸分子进行测序来确定一个或匹配的可能性的匹配得分;和(d)使用一个或多个确定的匹配得分来判定测试样品中预先短遗传变体的靶序列相关的靶测序数据集在多于两个流动位置处不同于与参考序列相关序数据集与参考序列匹配的可能性的匹配得分;和(d)使用一个或多个确定的匹配得分来第一测试测序数据集包括对应于核苷酸流的流动位置处的流动信号;(b)获得一个或多个来自一个或多个候选序列的候选序列匹配的可能性;和(d)使用所确定的匹配得分来判定测试样品中短遗传变体的存在或不存在。据第一流动循环顺序使用在分开的核苷酸流中提供的非终止核苷酸对源自测试样品的一的流动信号的第一测试测序数据集,每个第一测试测序数据集与不同的测试核酸分子相关;(b)根据第二流动循环顺序使用在分开的核苷酸流中提供的非终止核苷酸对源自测试个候选序列的候选序列匹配的可能性;和(d)使用所确定的匹配得分来判定测试样品中短遗传变体的存在或不存在。第一测试测序数据集包括对应于所述核苷酸流的流动位置处的流动信号;(b)获得一个或配来自一个或多个候选序列的候选序列的可能性;(d)从两个或更多个不同候选序列中选者匹配的最高可能性;和(e)使用所选的候选序列判定测试样品中短遗传变体的存在或不个或更多个流动循环)流动位置(其可以是连续的或非连续的)处与所选的候选序第一流动循环顺序使用在分开的核苷酸流中提供的非终止核苷酸对源自测试样品的一个流动信号的第一测试测序数据集,每个第一测试测序数据集与不同的测试核酸分子相关;(b)根据第二流动循环顺序使用在分开的核苷酸流中提供的非终止核苷酸对的相同的一个或多个测试核酸分子进行测序以获得一个或多个包括对应于核苷酸流的流顺序,每个第二测试测序数据集与第一测试测序数据集中的一个相同的测试核酸分子相关;(c)对于每个第一测序数据集和第二测序数据集,确定一个或多个候选序列的匹配得循环)流动位置(其可以是连续的或非连续的)处与所选的候选序列传变体的靶序列相关的靶测序数据集在两个或更多个流动位置处不同于与参考序列相关核苷酸流中提供的非终止核苷酸对一个或多个测试核酸分子进行测序来确定第一测试测的核苷酸流中提供的非终止核苷酸对一个或多个测试核酸分子进行测序来确定第二测试候选序列匹配的可能性;和(e)使用所确定的匹配得分来判定测试样品中短遗传变体的存传变体的靶序列相关的靶测序数据集在两个或更多个流动位置处不同于与参考序列相关对应于核苷酸流;(b)根据第一流动循环顺序使用在分开的核苷酸流中提供的非终止核苷同的测试核酸分子相关;(c)根据第二流动循环顺序使用在分开的核苷酸流中提供的非终序数据集与第一测试测序数据集中的一个相同的测试核酸分子相关;(d)对于每个第一测传变体的靶序列相关的靶测序数据集在两个或更多个流动位置处不同于与参考序列相关酸流中提供的非终止核苷酸对一个或多个测试核酸分子进行测序来确定第一测试测序数流中提供的非终止核苷酸对一个或多个测试核酸分子进行测序来确定第二测试测序数据多个候选序列的候选序列匹配的可能性;(e)从两个或更多个不同候选序列中选择候选序流动循环)流动位置(其可以是连续的或非连续的)处与所选的候选序传变体的靶序列相关的靶测序数据集在两个或更多个流动位置处不同于与参考序列相关对应于核苷酸流;(b)根据第一流动循环顺序使用在分开的核苷酸流中提供的非终止核苷同的测试核酸分子相关;(c)根据第二流动循环顺序使用在分开的核苷酸流中提供的非终序数据集与第一测试测序数据集中的一个相同的测试核酸分子相关;(d)对于每个第一测环)流动位置(其可以是连续的或非连续的)处与所选的候选序列流动循环顺序在分开的核苷酸流中提供的非终止核苷酸对靶序列进行测序来获得靶测序个流动位置处不同于与参考序列相关的参考测序数据集,其中流动位置对应于核苷酸流;(b)在一个或多个处理器接收一个或多个测试测序数据集,每个测试测序数据集或多个处理器确定指示与核酸分子相关的测试测序数据集与靶序列匹配的可能性的匹配(d)在一个或多个处理器中并使用一个或多个所确定的匹配得分来判定测[0188]在一些实施方案中,计算机实施的用于检测测试样品中的短遗传变体的方法包分开的核苷酸流中提供的非终止核苷酸对靶序列进行测序来获得靶测序数据集与参考序序数据集包括多个流动位置处的流动信号;(c)对于与测试测序数据集相关的每个测试核的匹配得分;和(d)在一个或多个处理器中并使用一个或多个所确定的匹配得分来判定测与测试样品相关的受试者生成个性化生物标志物组,该生物标志物组包括靶短遗传变体。[0189]在一些实施方案中,计算机实施的用于检测测试样品中的短遗传变体的方法包选择的流动循环顺序使用在分开的核苷酸流中提供的非终止核苷酸对靶序列进行测序来的核苷酸流中提供的非终止核苷酸对测试核酸分子进行测序来确定一个或多个测试测序参考序列匹配的可能性的匹配得分;和(d)在一个或多个处理器中并使用一个或多个确定的匹配得分来判定测试样品中预先选择的靶短遗传变体存在或不存在。在一些实施方案两个连续流动位置或多于两个非连续流动位置)处不同于参考测序数据集。在一些实施方(a)在一个或多个处理器处选择靶短遗传变体,其中通过使用根据流动核苷酸流中提供的非终止核苷酸对靶序列进行测序来获得靶测序数据集与参考序列相关中通过根据所述流动循环顺序使用在分开的核苷酸流中提供的非终止核苷酸对测试核酸指示与核酸分子相关的测试测序数据集与参考序列匹配的可能性的匹配得分;和(d)在一个或多个处理器中并使用一个或多个确定的匹配得分来判定测试样品中靶短遗传变体存据集。[0191]在一些实施方案中,计算机实施的用于检测测试样品中的短遗传变体的方法包分开的核苷酸流中提供的非终止核苷酸对靶序列进行测序来获得靶测序数据集和参考测一个或多个处理器中确定指示与核酸分子相关的测试测序数据集与靶序列匹配的可能性分;和(d)在一个或多个处理器处并使用一个或多个所确定的匹配得分来判定测试样品中[0192]在一些实施方案中,计算机实施的用于检测测试样品中的短遗传变体的方法包选择的流动循环顺序使用在分开的核苷酸流中提供的非终止核苷酸对靶序列进行测序来的核苷酸流中提供的非终止核苷酸对测试核酸分子进行测序来确定一个或多个测试测序参考序列匹配的可能性的匹配得分;和(d)在一个或多个处理器处并使用一个或多个所确两个连续流动位置或多于两个非连续流动位置)处不同于参考测序数据集。在一些实施方[0196](a)选择靶短遗传变体,其中通过使用根据流动循环顺序在分开的核苷酸流中提遗传变体的靶序列相关的靶测序数据集在多于两个流动位置处不同于与参考序列相关的过使用根据流动循环顺序在分开的核苷酸流中提供的非终止核苷酸对测试核酸分子进行[0198](c)对于与测试测序数据集相关的每个测试核酸分子,确定指示与核酸分子相关[0199](d)使用一个或多个所确定的匹配得分判定测试样品中靶短遗传变体存在或不存[0200]实施方案2.实施方案1的方法,其中获得苷酸流中提供的非终止核苷酸对测试核酸分[0203]实施方案5.实施方案1-4任一个的方法[0206]实施方案8.实施方案7的方法,其中[0207]实施方案9.实施方案1-8任一个的方[0211]实施方案13.实施方案1-12任一个的[0212]实施方案14.实施方案1-13任一[0213]实施方案15.实施方案1-14任一个[0214]实施方案16.实施方案1-15任一个[0216]选择测试测序数据集中的每个流动位置处的与该流动位置处的靶序列的碱基计[0218]选择测试测序数据集中的每个流动位置处的与该流动位置处的参考序列的碱基计数相对应的统计参数,并确定指示测试测序数据集与参考序列匹配的可能性的匹配得[0222]实施方案21.实施方案1-20任[0223]实施方案22.实施方案21的方法,其中对[0224]实施方案23.实施方案21或22的方法,其[0225]实施方案24.实施方案1-23任一个[0229]通过在一个或多个处理器接收一个或多个测试测序数据集来获得一个或多个测[0236](a)获得一个或多个第一测试测序数据集,每个第一测试测序数据集与源自测试[0237](b)获得一个或多个第二测试测序数据集,每个第二测试测序数据集与第一测试酸流中提供的非终止核苷酸对一个或多个测试核酸分子进行测序来确定第二测试测序数[0238](c)对于每个第一测序数据集和第二测序数据集,确定一个或多个候选序列的匹[0240]实施方案29.实施方案28的方法,包括根分开的核苷酸流中提供的非终止核苷酸对测试核酸分子进行[0241]实施方案30.实施方案28或29的方法,[0242]实施方案31.实施方案28或29的方更多个不同的候选序列,对于与第一测序数据集和第二测序数据集相关的每个核酸分子,[0246]实施方案33.实施方案32的方法,其中个未选择的候选序列根据第一流动循环顺序或第二流动循环顺序在两个或更多个流动位置处不同于所选的候选序列。[0247]实施方案34.实施方案32的方法,其个未选择的候选序列根据第一流动循环顺序和第二流动循环顺序两者在两个或更多个流动位置处不同于所选的候选序列。[0248]实施方案35.实施方案32的方法,其中个未选择的候选序列根据第一流动循环顺序或第二流动循环顺序在两个或更多个非连续流动位置处不同于所选的候选序列。[0249]实施方案36.实施方案32的方法,其中个未选择的候选序列根据第一流动循环顺序和第二流动循环顺序两者在两个或更多个非连续流动位置处不同于所选的候选序列。[0250]实施方案37.实施方案32的方法,其个未选择的候选序列根据第一流动循环顺序或第二流动循环顺序在两个或更多个连续流动位置处不同于所选的候选序列。[0251]实施方案38.实施方案32的方法,其中来个未选择的候选序列根据第一流动循环顺序和第二流动循环顺序两者在两个或更多个连续流动位置处不同于所选的候选序列。[0252]实施方案39.实施方案32的方法,其中来自两个或更个未选择的候选序列根据第一流动循环顺序或第二流动循环顺序在3个或更多个流动位置处不同于所选的候选序列。[0253]实施方案40.实施方案32的方法,其中个未选择的候选序列根据第一流动循环顺序和所述第二流动循环顺序两者在3个或更多个流动位置处不同于所选的候选序列。[0254]实施方案41.根实施方案3一个未选择的候选序列在X个碱基位置处不同于所选的候选序列,并且其中与测试核酸分子相关的测试测序数据集根据第一流动循环顺序或第二流动循环顺序在(X+2)个或更多个流动位置处不同于来自两个或更多个不同候选序列的至少一个未选择的候选[0255]实施方案42.实施方案32的方法,其中来个未选择的候选序列在X个碱基位置处不同于所选的候选序列,并且其中根据第一流动循环顺序和第二流动循环顺序两者,与测试核酸分子相关的测试测序数据集在(X+2)个或更多个流动位置处不同于来自两个或更多个不同候选序列的至少一个未选择的候选序列。[0257]实施方案44.实施方案32的方法,其个未选择的候选序列根据第一流动循环顺序或第二流动循环顺序跨一个或多个流动循环不同于所选的候选序列。[0258]实施方案45.实施方案32的方法,其中来自至少的至少一个未选择的候选序列根据第一流动循环顺序和第二流动循环顺序两者跨一个或确定匹配得分包括选择第一测试测序数据集和第二测试测序数据集中的每个流动位置处每个流动位置处的候选序列的碱基计数的候选测序集和第二测试测序数据集中的流动位置的所选分开的核苷酸流中提供的非终止核苷酸对靶序列进行测序来获得靶测序数据集与参考序[0270]实施方案55.实施方案54的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论