CN114096682B 通过合成方法的快进测序（阿尔缇玛基因组学公司）

上传人：1*** IP属地：山西上传时间：2026-07-04 格式：DOCX 页数：200 大小：11.56MB 积分：12 举报 版权申诉

CN114096682B 通过合成方法的快进测序（阿尔缇玛基因组学公司）_第2页

CN114096682B 通过合成方法的快进测序（阿尔缇玛基因组学公司）_第3页

CN114096682B 通过合成方法的快进测序（阿尔缇玛基因组学公司）_第4页

CN114096682B 通过合成方法的快进测序（阿尔缇玛基因组学公司）_第5页

已阅读5页，还剩195页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

2021.12.31PCT/US2020/0311632020.05.01WO2020/227143EN2020.11.12本文描述了针对多核苷酸生成偶联测序读包括在偶联测序读段对内不直接测序的基因座二区域流动顺序提供的核苷酸进一步将引物延的核苷酸进一步延伸引物来生成与多核苷酸的2(b)使用第一区域流动顺序的一个或多个流动步骤中提供的核苷酸生成与多核苷酸的(c)使用以第二区域流动顺序的10个或更多个流动步骤中提供的核苷酸将步骤(b)中伸引物中的核苷酸的标记的存在或不存在；并且其中(i)在第二区域流动顺序的至少一个2.权利要求1的方法，其中引物通过第二区域的延伸比引物通过第一区域的延伸进行4.权利要求1的方法，其中用于使引物延伸通过第二区域的核苷酸的至少一部分是未7.权利要求1的方法，还包括使用参考序列和第二区域流动顺序确定第二区域的预期8.权利要求1的方法，其中使用以第三区域流动顺序提供的核苷酸将引物延伸通过第序列相关的测序数据是相同或不同的针对第三区域生成15.权利要求14的方法，其中使用以第三区域流动顺序中提供的核苷酸将引物延伸通3动顺序和第三区域的参考序列确定第三区域的预16.权利要求14的方法，其中使用以第三区域流动顺序中提供的核苷酸将引物延伸通中与第三区域的序列相关的测序数据是相同或不同的针对第三区域生成17.权利要求14的方法，其中第二区域或第三区域的预期参考测序数据包括二进制或将根据权利要求1-17任一项的方法生成的偶联测序读段对使用指示所述第二区域长度的距离信息将未映射的第一三区域或其部分映射到参考序列。将根据权利要求1-17任一项的方法生成的偶联测序读段对的第一区域或其部分或第三区域或其部分映射到参考序列；使用指示第二区域长度的距离信息，确定未映射的第一区域或其通过将未映射的第一区域或其部分或未映射的第三区域或其部分的测序数据与预期将根据权利要求1-17任一项的方法生成的偶联测序读段对的第一区域或其部分或第将根据实施方案1-17任一个的方法生成的偶联测序读段对的第一区域或其部分和第三区域或其部分映射到参考序列；通过将映射的距离信息与第二区域的预期距离信息进行比较来检测结将根据权利要求1-17任一项的方法生成的偶联测序读段对的第一区域或其部分和第三区域或其部分映射到包含第一位置和第二位置的两个或更多个不同位置对处的参考序对于所述两个或更多个位置对，使用指示第二区域长度的第一距4置与第二位置之间的距离的第二距离信息来选25.一种检测根据权利要求1-17任一项生成的偶联测序读段对的两个测序区域之间的变体的方法，其中使用以第三区域流动顺序提供的核苷酸将延伸的引物延伸通过第三区将第一区域或其部分映射到参考序列；通过将第三区域的预期测序数据与生成的与第三区域的序列相关的测序数据进行比29.权利要求25的方法，其中将该方法用于检测测试变体，并且参考序列包括测试变31.权利要求29的方法，包括将检测的整合变体与多核苷酸的第一区域或第三区域中32.一种生成用于检测多核苷酸未测序区域中碱基颠换存在的偶联测序读段对的方(b)通过使用标记的核苷酸延伸引物并检测整合的标记的核苷酸存在或不存在来生成(c)使用包含(1)胞嘧啶和胸腺嘧啶以及(2)腺嘌呤和鸟嘌呤的交替核苷酸对的流动顺(b)使用包含(1)胞嘧啶和胸腺嘧啶以及(2)腺嘌呤和鸟嘌呤的交替核苷酸对的流动顺将根据权利要求33-35任一项生成的偶联测序读段对的第一区域或其部分和第三区域5使用第二区域流动顺序、第三区域流动顺序和参考序列来确基于第三区域的预期测序数据与生成的第三区域的测序数据之间的差异检测碱基颠考序列和第三区域的参考序列来确定第三区域的预参考序列以及生成的与第三区域的序列相关的序列数据来确定第三区域的预期测序数据，其中生成的与第三区域的序列相关的序列数据是相同或不同的针对第三区域生成的序列40.一种生成一个或多个共有序列的方法，包括组装根据权利要求1-17任一项生成的41.权利要求40的方法，还包括使用与所选的共有序列的一部分相关的所选的偶联测使用第二区域流动顺序、第三区域流动顺序和所选的共有序列通过将所选的偶联测序读段的第三区域的预期测序数据与生成的第三区域的测序数在根据权利要求1-17任一项生成的多个重叠的偶联测序读将与多核苷酸的第三区域的序列相关的测序数据与多核苷酸的第三区域的预期序列44.权利要求1-17和32-35中任一项的方法，其中与第一区域45.权利要求1-17和32-35中任一项的方法，其中流动循46.权利要求1-17和32-35中任一项的方法，其中流动循环顺序包括5或更多个单独分6使用以第四区域流动顺序提供的核苷酸进一步延伸引物通通过使用标记的核苷酸进一步延伸通过第四区域延伸的引物并检测整合的标记的核苷酸存在或不存在来生成与多核苷酸的第五区域的序列相48.权利要求47的方法，还包括将第五区域的测序数据与第一区域的测序数据或第三(a)使用滚环扩增(RCA)扩增多核苷酸以生成至少包含所述多核苷酸的第一拷贝和多(c)使用第一区域流动顺序的一个或多个流动步骤中提供的核苷酸生成与多核苷酸的(d)使用以第二区域流动顺序提供的核苷酸使引物进一步延伸通过多核苷酸的第一拷贝内的多核苷酸的第二区域，其中(i)将引物延伸通过多核苷酸的第一拷贝内的多核苷酸域流动顺序的至少一个步骤中使用至少两种不同类型的核苷酸碱基(e)通过使用标记的核苷酸进一步延伸引物，并检测整合的标记的核苷酸存在或不存(f)将针对多核苷酸的第三区域生成的测序数据与针对多核苷酸的第三区域的预期序51.权利要求50的方法，其中引物通过多核苷酸的第一拷贝内的多核苷酸的第二区域的延伸比引物通过多核苷酸的第一拷贝内的多(a)使用滚环扩增(RCA)扩增多核苷酸以生成至少包含多核苷酸的第一拷贝和多核苷(c)使用以第二区域流动顺序提供的核苷酸使引物延伸通过多核苷酸的第一拷贝内的多核苷酸的第二区域，其中(i)引物延伸通过的至少一个步骤中使用至少两种不同类型的核苷酸碱基(d)通过使用标记的核苷酸进一步延伸引物并检测整合的标记的核苷酸存在或不存在7来生成与多核苷酸的第三区域的序列相关的(e)将针对多核苷酸的第三区域生成的测序数据与针对多核苷酸的第三区域的预期序54.权利要求50-53中任一项的方法，其55.权利要求50-53中任一项的方法，其中引物延苷酸的第二区域而不检测整合到延伸引物中的核苷酸的标记存在或56.权利要求50-53中任一项的方法，用于使核苷酸的第二区域的核苷酸的至少一部分是未57.权利要求50-53中任一项的方法，用于使(b)根据第一区域流动顺序使用标记的核苷酸将引物延伸通过多核苷酸拷贝的第一区(c)使用一个或多个重定相流动使引物延伸通过多核苷酸拷贝的第二区域，其中在所述一个或多个重定相流动中的至少一个中使用至少两种不同类型的核苷酸碱基的混合物；和(d)根据第三区域流动顺序使用标记的核苷酸将引物延伸通过多核苷酸拷贝的第三区59.权利要求58的方法，其中在一个或多个重定相流动中的至少一个中使用三种不同62.权利要求58或59的方法，包括通过在将引物延伸通过第一区域的同时检测整合的标记的核苷酸存在或不存在来生成与第一区域的序列相关的测63.权利要求58或59的方法，包括通过在将引物延伸通过第三区域的同时检测整合的标记的核苷酸存在或不存来生成与第三区域的序列相关的测8年9月23日提交的美国临时专利申请序列号码62/904,274；以及于2020年2月7日提交的美[0004]以下提交的ASCII文本文件的内容通过引用整体并入本文中：计算机可读形式[0011]从多核苷酸生成偶联测序读段对的方法包括：(a)将多核苷酸与引物杂交以形成存在来生成与多核苷酸的第一区域的序列相关的测序数据；(c)使用第二区域流动顺序提动顺序的至少一个步骤中使用至少两种不同类型的核苷酸碱基的混合物，或(iii)引物通步延伸步骤(c)中延伸的引物并检测整合的标记的核苷酸存在或不存在来生成与多核苷酸9[0012]在一些实施方案中，从多核苷酸生成偶联测序读段对的方法包括(a)将引物与多核苷酸的第一区域杂交以形成杂交模板；(b)使用以第二区域流动顺序提供的核苷酸将引物延伸通过第二区域，其中(i)引物延伸通过第二物并检测整合的标记的核苷酸存在或不存在来生成与多核苷酸的第三区域的序列相关的方案中，诱导的信号变化是新的基本上零(或新的零)或新的基本上非零(或新的非零)信用第二区域流动顺序和第二区域的第二参考序列确定第二区域的预期测试变体测序数据，第三区域的序列相关的测序数据是相同或不同的步骤(d)中生成的测序数据。在一些实施的至少一个步骤中使用至少两种不同类型的核苷酸碱基的混合物，或(iii)引物通过第四区域的延伸比步骤(b)或步骤(d)中的引物延伸进行得更快；和(f)通过使用标记的核苷酸进一步延伸步骤(e)中延伸的引物，并检测整合的标记的核苷酸存在或不存在来生成与多的测序数据与第一区域的测序数据或第三区域的测序数据的长度的距离信息将未映射的第一区域或其部分或者未映射的第三区域或其部分映射到参考序列。分或者未映射的第三区域或其部分的测序数据与预期测序数据进行比较来检测结构变体，其中未映射的第一区域或其部分或者未映射的第三区域或其部分的测序数据与预期测序度的预期距离信息来确定参考序列内的结构变体测序读段对的第一区域或其部分和第三区域或其部分映射到包含第一位置和第二位置的域长度的第一距离信息和指示第一位置与第二位置之间的距离的第二距离信息来选择正自使用参考序列和第二区域流动顺序确定的第二区域的预期测序数据。在一些实施方案[0028]本文还描述了一种检测根据上述任一种方法生成的偶联测序读段对的两个测序区域之间的变体的方法，其中使用以第三区域流动顺序提供的核苷酸延伸步骤(d)中延伸或不同的步骤(d)中生成的序列数据；并通过将第三区域的预期测序数据与生成的与第三[0029]本文还描述了一种检测根据上述任一种方法生成的偶联测序读段对的两个测序形成杂交模板；(b)通过使用标记的核苷酸延伸引物并检测整合的标记的核苷酸存在或不嘧啶以及(2)腺嘌呤和鸟嘌呤的交替核苷酸对的流动顺序进一步延伸步骤(b)中延伸的引核苷酸的第一区域杂交以形成杂交模板；(b)使用包含(1)胞嘧啶和胸腺嘧啶以及(2)腺嘌呤和鸟嘌呤的交替核苷酸对的流动顺序将引物延伸通过第二区域；和(c)通过使用标记的[0032]在一些实施方案中，检测多核苷酸的未测序区域中碱基颠换将根据以上描述的方法生成的偶联测序读段对的第一区域或其部分和第三区域或其部分使用第二区域流动顺序、第三区域流动顺序和参考序列来确定第三区域的预期测序数据；以及基于第三区域的预期测序数据与生成的第三区域的测序数据之间的差异检测碱基颠动顺序和所选的共有序列的部分来确定所选的偶联测序读段的第三区域的预期测序数据；以及通过将所选的偶联测序读段的第三区域的预期测序数据与生成的第三区域的测序数比较变体状态，所述多个重叠的偶联测序读段对包含对应于测试变体的基因座的基因座；的偶联测序读段的变体状态指示所选的偶联测序读段的第多核苷酸的第三区域生成的测序数据与多核苷酸的第三区域的预期测序数据匹配的可能每个流动位置处的至少一个碱基计数的碱基计数可能性的统计参数。在一些实施方案中，动顺序提供的核苷酸进一步延伸引物通过第四区域，其中个步骤中使用至少两种不同类型的核苷酸碱基的混合物，或(iii)引物通过第四区域的延延伸通过第四区域延伸的引物并检测整合的标记的核苷酸存在或不存在来生成与多核苷序数据与第一区域的测序数据或第三区域的测序数据核苷酸延伸引物并检测整合的标记的核苷酸存在或不存在来生成与多核苷酸的第一拷贝内的多核苷酸的第一区域的序列相关的测序数据；(d)使用以第二区域流动顺序提供的核苷酸使引物进一步延伸通过多核苷酸的第一拷贝内的多类型的核苷酸碱基的混合物，或(iii)引物通过多核苷酸的第一拷贝内的多核苷酸的第二区域的延伸比引物通过第一区域的延伸进行得更快；(e)通过使用标记的核苷酸进一步延伸引物并检测整合的标记的核苷酸存在或不存在来生成与多核苷酸的第三区域的序列相关的测序数据；(f)将针对多核苷酸的第三区域生成的测序数据与针对多核苷酸的第三区域的预期序列预期的测序数据进行比较；(g)判定多核苷酸的第二区域中短遗传变体的存在；(h)通过使用标记的核苷酸延伸引物并检测整合的标记的核苷酸存在或不存在来生成与多核苷酸的第二拷贝内的多核苷酸的第二区域的序列相关的测序数据；和(i)判定多核贝内的多核苷酸的第二区域的延伸比引物通过多核苷酸的第一拷贝内的多核苷酸的第一伸通过多核苷酸的第一拷贝内的多核苷酸的第二区域的核苷酸的至少一部分是未标记的动顺序的至少一个步骤中使用三种不同类型的核苷酸碱扩增(RCA)扩增多核苷酸以生成RCA扩增的多核苷酸，所述RCA扩增的多核苷酸包括至少多核苷酸的第一拷贝和多核苷酸的第二拷贝；(b)使引物与多核苷酸的第一拷贝内的多核苷酸的第一区域杂交以形成杂交模板；(c)使用以第二区域流动顺序提供的核苷酸使引物延伸通过多核苷酸的第一拷贝内的多核苷酸的第二区第一拷贝内的多核苷酸的第二区域而不检测整合到延伸引物中的核苷酸的标记存在或不的混合物；(d)通过使用标记的核苷酸进一步延伸引物并检测整合的标记的核苷酸存在或不存在来生成与多核苷酸的第三区域的序列相关的测序数据；(e)将针对多核苷酸的第三区域生成的测序数据与针对多核苷酸的第三区域的预期序列的预期测序数据进行比较；(f)判定多核苷酸的第二区域中短遗传变体的存在；(g)通过使用标记的核苷酸延伸引物，第二区域的序列相关的测序数据；以及(h)判定多核苷酸的第二区域中的短遗传变体的身酸的第一拷贝内的多核苷酸的第二区域而不检测整合到延伸引物中的核苷酸的标记存在内的多核苷酸拷贝杂交；(b)使用根据第一区域流动循环的标记的核苷酸将引物延伸通过多核苷酸拷贝的第一区域；(c)使用一个或多个重定相流动使引物延伸通过多核苷酸拷贝核苷酸碱基的混合物；和(d)使用根据第三区域流动循环的标记的核苷酸将引物延伸通过括四个或更多个流动步骤。在一些实施方案中，一个或多个重定相流动以任何顺序包括：括在将引物延伸通过第三区域的同时通过检测整合的标记的核苷酸存在或不存在来生成[0048]图3说明了偶联测序读段对的第三区域映射到两个不同的基因座时，如何使用指示偶联测序读段对的第二区域的长度的距离信息将偶联测序读段对映射[0049]图4说明了偶联测序读段对的第三区域映射到重复区域时，如何使用指示偶联测序读段对的第二区域的长度的距离信息将偶联测序读段对映射到[0052]图7说明了使用偶联测序读段对检测受试者基因组中的结构变体的示意图，其中[0053]图8说明了使用偶联测序读段对检测受试者基因组中的结构变体的示意图，其中[0054]图9说明了使用偶联测序读段对检测受试者基因组中的结构变体的示意图，其中域的长度的距离信息将偶联测序读段对用于检测结构变体的一易地确定的互补模板链的测序信息是同等有效的。图14B显示了图14A中所以按每个流动位置与候选序列匹配的可能性的乘积来确定测序数据与给定序列匹配的可[0060]图15A显示了测序读段R1(SEQIDNO:15)、R2(SEQIDNO18)(各自由延伸引物的序列来表示)与两个候选序列H1(SEQIDNO:19)和H2(SEQIDNO:[0061]图16显示了使用A-T-G-C流动循环顺序测序的假定核酸分子的测序数据。可以使用潜在的单倍型序列(各自由其互补序列来表示)TATGGTCG-TCGA(SEQIDNO:21)(H1)和[0064]图19A显示了将测序引物延伸通过多核苷酸时，来自每个流动测序循环后在第一[0065]图19B显示了将测序引物延伸通过多核苷酸时，来自每个流动测序循环后在第一[0066]图20A-20E显示了在100个核苷酸流(图20A)和设计为使测序簇内的引物同步的重[0067]图21A-21E显示了在100个核苷酸流(图21A)和设计为使测序簇内的引物同步的重[0068]图22A-22E显示了在100个核苷酸流(图22A)和设计为使测序簇内的引物同步的重[0069]图23显示了对于四个示例性流动循环顺序(包括其中三个是扩展的流动循环顺相(或片段化起始位置)的分数，而y轴指示在多于两个流动位置处具有诱导的信号变化[0070]图24显示了矩阵，该矩阵显示了使用模拟快进测序方案检测的各种SNP变体的碱和第三区域中的流动的平均碱基整合，其中每个流动包括三种不同核苷酸碱基的混合物。[0072]图26A显示了对于对照方案(105轮T-G-C-A流动循环)或重定相方案(105轮T-G-C-[0073]图26B显示了对于对照方案(105轮T-G-C-A流动循环)或重定相方案(105轮T-G-C-[0074]图26C显示了对于对照方案(105轮T-G-C-A流动循环)或重定相方案(105轮T-G-C-[0075]图26D显示了对于对照方案(105轮T-G-C-A流动循环)或重定相方案(105轮T-G-C-[0076]图26E显示了对于对照方案(105轮T-G-C-A流动循环)或重定相方案(105轮T-G-C-000个模拟流动图上累积的总定相误差之和(滞后定相误差加上超前定相误差)的分布。平[0077]图26F显示了对于对照方案(105轮T-G-C-A流动循环)或重定相方案(105轮T-G-C-000个模拟流动图上累积的总定相误差之和(滞后定相误差加上超前定相误差)的分布。平[0078]图26G显示了对于对照方案(105轮T-G-C-A流动循环)或重定相方案(105轮T-G-C-[0079]图26H显示了对于对照方案(105轮T-G-C-A流动循环)或重定相方案(105轮T-G-C-[0080]图26I显示了对于对照方案(105轮T-G-C-A流动循环)或重定相方案(105轮T-G-C-[0081]图26J显示了对于对照方案(105轮T-G-C-A流动循环)或重定相方案(105轮T-G-C-和G的混合物的第四重定相流动)，在10,000个模拟流动图上累积的总定相误差之和(滞后区域被引物完全跳过)，所以即使第二区域不以与第一区域相同的方式测序也可以得到第核苷酸与引物杂交以形成杂交模板；(b)通过使用标记的核苷酸延伸引物并检测整合的标记的核苷酸存在或不存在来生成与多核苷酸的第一区域的序列相关的测序数据；(c)使用以第二区域流动顺序中提供的核苷酸进一步延伸步骤(b)中延伸的引物通过第二区域，其将多核苷酸与引物杂交以形成杂交模板；(b)通过使用标记的核苷酸延伸引物并检测整合的标记的核苷酸存在或不存在来生成与多核苷酸的第一区域的序列相关的测序数据；(c)使用以第二区域流动顺序中提供的核苷酸进一步延伸步骤(b)中延伸的引物通过第二区域，其中引物延伸通过第二区域而不检测整合到延伸引物中的核苷酸的标记存在或不存将多核苷酸与引物杂交以形成杂交模板；(b)通过使用标记的核苷酸延伸引物并检测整合的标记的核苷酸存在或不存在来生成与多核苷酸的第一区域的序列相关的测序数据；(c)使用以第二区域流动顺序中提供的核苷酸将步骤(b)中延伸的引物进一步延伸通过第二区整合的标记的测序系统时间)使得更快的引物延伸通过第二区域，但不能直接确定测序数中的变体可以影响第三区域内确定的测序数据。参考序列可以用于确定预期的测序数据生成的流动图)之间的比较可以在第三区域中进行(以检测第二区域中的变体)。这种方法的3'端或5'端的测序数据不受多核苷酸的3'端和5'端之间的多核苷酸中的变[0093]“预期测序数据”是指如果用于生成偶联测序读段对的多核苷酸的序列或所述多[0094]“流(动)顺序”是指用于使用非终止核苷酸对核酸分子进行测序的单独分开的核苷酸多态性(MNP)和长度为10个连续碱基或更延伸引物中的所得序列应为模板多核苷酸分子序列的反向互补序列。在一些实施方案中，添加核苷酸，这允许将添加的核苷酸整合到存在模板链中的互补碱基的测序引物的末端。循环可以具有相同的核苷酸顺序和不同碱基类型的数量，或不同的核苷酸顺序和/或不同时使用的一个或多个不同碱基)在相同的循环(如本文使用的术语)中重复，其可以提供作在一些实施方案中，与总核苷酸相比，标记的核苷酸部分为约0.01％至约100诸如约链的序列。[0115]流动图可以是二进制或非二进制的。二进制流动图检测整合的核苷酸的存在(1)或不存在(0)。非二进制流动图可以更定量地确定来自每个逐步引入的整合核苷酸数。例通过桥式扩增或其他扩增技术)以生成多核苷酸测序集落。簇内扩增的多核苷酸基本上相同或互补(在扩增过程期间可能引入一些误差，使得多核苷酸的一部分可能不一定与原始伸通过多核苷酸的第一区域和第三区域之间的第二区域可以比引物延伸通过第一区域和/或第三区域更快地进行。例如，引物延伸通过第二区域可以通过延伸引物而不检测整合到[0119]通过在引物延伸通过第二区域期间使用的流动顺序的至少一个步骤中使用至少针对SEQIDNO:1模板延伸引物的流动图导致在引物延伸的快进部分期间添加多达6个碱动顺序需要10个四步循环以使引物延伸通过多核苷酸，这基本上比使用表2中提供的流动顺序用于使引物延伸通过多核苷酸的5个四步中的延伸可以包括使用具有一种或多种不同碱基类型的核苷酸逐步延伸引物的一个或多[0123]通过第二区域的引物延伸可以通过任何数量的流动步骤进行。在一些实施方案没有聚合酶停滞。在一些实施方案中，引物延伸通过第二区域包括1至约10,000个流动步测序数据。引物通过第二区域的延伸可以以比引物通过第一和/或第三区域的延伸更快的至少两种不同类型的核苷酸碱基的混合物来延伸引物(其中引物通过第一和/或第三的延伸可以以比引物通过第一和/或第三区域的延伸更快的速率发生，例如不检测整合到延伸可以如本文所述地分析偶联测序读段对(例如，通过将选定区域之间的区域视为如针对本[0125]图1说明了从多核苷酸(如DNA)产生偶联测序读段对的示例性方法的示意图。在延伸引物106并检测整合的标记的核苷酸的存在或不存在来生成多核苷酸104的第一区域之后洗涤杂交的模板以在检测整合的标记核苷酸存在或不存在之前去除未整合的核苷酸。106可以以比步骤110中的引物延伸更快的速率延伸通过第二区域116。这种加速的引物延苷酸延伸引物106并检测整合的标记的核苷酸存在或不存在来生成多核苷酸104的第三区域118的测序数据。第三区域118的测序数据的生成可以以与针对第一区域112生成测序数124包括第一区域112和第三区域120的测序数据，第一区域112和第三区域120被第二区域[0126]不需要根据本文所述的一些实施方案来生成多核苷酸第一区域的测序数据。例以第二区域流动顺序提供的核苷酸将引物延伸通过第二区域顺序的至少一个步骤中使用至少两种不同类型的核苷酸碱基的混合物；和(c)通过使用标生成与多核苷酸的第三区域的序列相关的测序循环1与第一区域相关，其序列容易被确定为碱基的互补序列(即，碱基流A-C-T-G对应于可以使用用于使引物延伸通过第二区域的流动顺序和参考序列来生成第二区域的预期测测整合的标记的核苷酸存在或不存在而生成的测序数据或通过其他方法(例如，独立地对多核苷酸的第三区域的第三区域进行测序)获得的且对应于第二区域的参考序列和第二区域流动顺序可以用于确定第二区域的预期参考测域的序列以及第三区域流动顺序来确定第三区域的预期考序列，或将第一区域(或其部分)和第三区域(或其部分)两者映射到参考序列。在步骤204，使用第二区域流动顺序和参考序列来确定第二区域的预期测序数据(诸如预期流动[0132]如果多核苷酸包括第二区域内的变体，则生成的与第三区域相关的测序数据(例[0134]本文所述的变体检测方法的灵敏度可以取决于变体的背景和/或用于在第一、第用不同的用于将引物延伸通过多核苷酸的第一、第二和/或第三区域中的一个或多个的流[0135]用于本文所述方法中的多核苷酸可以从任何合适的生物来源获得，例如组织样判定共有序列的方法通常使用独特分子标识符(UMI)标记核酸分子并将核酸分子扩增以生不使用独特分子标识符(UMI)的情况下获得核酸测成以线性序列共价连接的核酸分子的多个拷贝。参见例如Dean等，RapidAmplificationofPlasmidandPhageDNAUsingPhi29DNAPolymeraseandMultiply-Primed品中的短遗传变体的方法可以包括(a)使用滚环扩增(RCA)扩增多核苷酸以生成RCA扩增的的测序数据；(d)使用以第二区域流动顺序提供的核苷酸使所述引物进一步延伸通过多核苷酸的第一拷贝内的多核苷酸的第二区域，其中(者(iii)引物延伸通过多核苷酸的第一拷贝内的多核苷酸的第二区域比引物延伸通过第一区域更快地进行；(e)通过使用标记的核苷酸进一步延伸引物并检测整合的标记的核苷酸存在或不存在来生成与多核苷酸的第三区域的序列相关的测序数据；(f)将针对多核苷酸的第三区域生成的测序数据与多核苷酸的第三区域的预期序列的预期测序数据进行比较；核苷酸的第二拷贝内的多核苷酸的第二区域的序列相关序包括流动循环顺序中的四碱基流动循环顺序T-A-C-G可以导致测试测序数据集在多于两个流动位置处与参考测序数据集不同。如本文进一步讨论的，鉴于足够高的测序深度(即，采样足够大量的起始位或除了导致均聚物长度变化的那些之外的所有SNP)可以在测试测序数据集和参考测序数靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异，所述两个测序数据集与在至少5％的随机测序起始位置的约50％至87.5％的SNP排列中SNP不同考测序数据集)之间的多于两个流动位置处产生信号差异，所述两个测序数据集与在至少5％的随机测序起始位置的约70％至87.5％的SNP排列中SNP不同的核酸分子相关。在一些候选或参考测序数据集)之间的多于两个流动位置处产生信号差异，所述两个测序数据集与在至少5％的随机测序起始位置的约80％至87.5％的SNP排列中SNP不同的核酸分子相靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异，所述两个测序数据集与在至少10％的随机测序起始位置的约50％至87.5％的SNP排列中SNP不如，测试或靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异，所述两个测序数据集与在至少10％的随机测序起始位置的约60％至87.5％的SNP排或靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异，所述两个测序数据集与在至少10％的随机测序起始位置的约70％至87.5％的SNP排列中SNP数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异，所述两个测序数据集与在至少10％的随机测序起始位置的约80％至87.5％的SNP排列中SNP不同的核靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异，所述两个测序数据集与在至少20％的随机测序起始位置的约50％至87.5％的SNP排列中SNP不如，测试或靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异，所述两个测序数据集与在至少20％的随机测序起始位置的约60％至87.5％的SNP排或靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异，所述两个测序数据集与在至少20％的随机测序起始位置的约70％至87.5％的SNP排列中SNP数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异，所述两个测序数据集与在至少20％的随机测序起始位置的约80％至87.5％的SNP排列中SNP不同的核靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异，所述两个测序数据集与在至少30％的随机测序起始位置的约50％至87.5％的SNP排列中SNP不如，测试或靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异，所述两个测序数据集与在至少30％的随机测序起始位置的约60％至87.5％的SNP排或靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异，所述两个测序数据集与在至少30％的随机测序起始位置的约70％至87.5％的SNP排列中SNP数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异，所述两个测序数据集与在至少30％的随机测序起始位置的约80％至87.5％的SNP排列中SNP不同的核“移位灵敏度(shiftsensitivity)”是指在所有可能的SNP排列上在两个测序数据集(例如，测试或靶测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号流动相下的SNP排列上在两个测序数据集(例如，测试或目标测序数据集和候选或参考测序数据集)之间的多于两个流动位置处产生信号差异的最大灵敏度。一些实施方案中，诱导的信号变化是新的基本上零(或新的零)或新的基本上非零(或新的[0154]一个或多个重新定相流动可以用作第二区域或在第二区域内用于重定相(即同流动循环使用标记的核苷酸将引物延伸通过多核苷酸拷贝的第一区域；(c)使用一个或多的每一个中使用至少两种不同类型的核苷酸碱基的混合物；和(d)根据第三区域流动循环使用标记的核苷酸将引物延伸通过多核苷酸拷贝的第定相流动中提供的核苷酸将步骤(b)中延伸的引物进一步延伸通过第二区域，其中在一个或多个重定相流动中的每一个中使用至少两种不同类型的核苷酸碱基的混合物；和(d)通过使用标记的核苷酸进一步延伸步骤(c)中延伸的引物，并检测整合的标记的核苷酸存在[0157]重定相流动顺序(或重定相流动循环)包括一个或多个允许滞后引物赶上测序簇核苷酸的流动步骤；(iii)包括包含A和G核苷酸的混合物并省略T(和/或U)和C核苷酸的流包含可逆终止子的A核苷酸的混合物的流动步骤。通过整合基于模板链的核苷酸来延伸引[0162]本文所述的用于使测序簇内的延伸引物同步的方法可以用于边合成边测序方法[0165]映射序列是指一个序列(如区域或其部分的序列)与另一个序列(如参考序列)的选择的映射阈值(映射分数)不能映射到另一序列的序列。可以基于错误风险容限来预定(即，在映射之前选择)分数。例如，将一个序列映射到另一个序列时，可以使用Smith-Burrows-Wheeler变换(BWT)的比对器。参见例如，Miller等，AssemblyalgorithmsforDenovofragmentassemblywithshortmate-pairedreads：doesthereadlengthmatter？GenomeResearch，第19卷，第336-346页(2009)；Mielczarek等，ReviewofalignmentandSNPcallingalgorithmsfornext-generationsequencingdata，页(2011)；和Hwang等，Systematiccomparisonofvariantcallingpipeline酸第二区域内的结构变体(如插入或缺失)或分解基因组内的多个可映射基因座(例如，第一区域或第三区域包括重复区域后其他非独特序列)是有用的。如本文讨论的距离信息涉二区域流动顺序相关的信息)和第二区域中碱基的概率分布来确定距离信息。第二区域中环步骤，每个循环步骤包括三个其他碱基)并假设第二区域中碱基的分布与作为整体的基度可以近似为第二区域流动顺序中的步骤数第二区域的距离信息来选择映射到参考序列的第一区域和第二区域的正确位置对。例如，将偶联测序读段对映射到参考序列的方法可以包括将偶联测序读段对的第一区域(或其部分)和第三区域(或其部分)在包含第一位置和第二位置的两个或更多个不同位置对处映射[0171]图3说明了如何使用指示偶联测序读段对的第二区域长度的距离信息将偶联测序读段对映射到参考序列。偶联测序读段对304包括第一区域306、第二区域308和第三区域而不能明确地映射到精确位置时，距离信息可以用于将偶联测序读段对映射到参考序列。图4说明了当偶联测序读段对的第三区域映射到重复区域时，如何使用指示偶联测序读段对的第二区域的长度的距离信息将偶联测序读段对映射到参考序列。图4显示了参考序列402和偶联测序读段对404。偶联测序读段对包括第一区域406、第二区域408和第三区域者可以是外源插入(如插入源自受试者基因组以外的来源的基因座中的序列，如插入受试试者基因组内的外源插入变体提出了额外的挑战。本文所述的方法可用于检测和/或定位法包括将偶联测序读段对的第一区域(或其部分)映射到参考序列，并尝试将第三区域(或基因组内的外源插入的方法可以包括将偶联测序读段对的第三区域(或其部分)映射到参息。一旦确定了未映射的第一区域(或其部分)或未映射的第三区域(或其部分)的基因座，测序数据与预期测序数据之间的差异指示该基因座[0179]图7说明了使用偶联测序读段对用于检测受试者基因组中的结构变体的示意图，其中结构变体是插入。受试者的基因组702包括第一区域704和第一参考区域708与第二参域710，但不包括第一参考区域708和第二参考区域710之间的插入706(插入可以对应于在期基因座722的起点从第一区域704的末端大约n个碱基开始。然后如本文所述的可以确定基因座的预期测序数据不同于生成的偶联测序读段对714的第三区域718的测序数据(这是[0180]图8说明了使用偶联测序读段对检测受试者基因组中的结构变体的示意图，其中参考区域806和第二参考区域808之间的附加区域812。尽管附加区域812存在于参考序列区域816(对应于第一区域804)和第三区域818(对应于第二参考区域808)，其将第二区域的预期基因座822的起点为从第一区域804的末端大约n个碱基开始。然后如本文所述的可在预期基因座处。如果预期基因座的预期测序数据不同于生成的偶联测序读段对814的第[0181]图9说明了使用偶联测序读段对检测受试者基因组中的结构变体的示意图，其中序列910的第一区段904。距离信息指示偶联测序读段对912的第二区域918的长度为大约n段906(而不是第三区段908)在参考序列910中的预期基因座处。如果预期基因座的预期测序数据不同于生成的偶联测序读段对912的第三区域916的测序数据(这是图9说明的示例1020的预期基因座1024的起始为从第一片段1004的末端大约n个碱基开始。然后可以如本果预期基因座的预期测序数据不同于生成的偶联测序读段对1016的第三区域1020的测序的距离信息指示映射到参考序列的第一区域的映射位置和映射到参考序列的第三区域的读段对的第二区域的长度的预期距离信息(例如使用第二区域和参考序列的流动顺序，或如本文另外描述的)。预期距离信息与映射距离信息之间的比较可用于检测结构变体。例1214和第三区域1216分开。可以将第一区域1214和第三区域1216的序列分别在第一区段区域1214和第三区域1216之间的距离(即，参考序列1202的第一区段1204和第二区段1206被确定为m。然后可以通过将映射的距离信息n与预期的距离信息m进行比较来确定结构变[0189]在检测第二区域内变体(例如结构变体或SNP)的另一种方法中，将预期的测序数区域之间的变体的方法(其中使用以第一区域流动顺序提供的核苷酸将引物延伸通过第一区域和/或使用以第三区域流动顺序提供的核苷酸将引物延伸通过第三区域)包括将第一区域(或其部分)和/或第三区域(或其部分)映射到参考序列。然后确定其他区域或其部分的预期参考测序数据(即，如果第一区域或部分被映射，则其他区域是指第三区域或其部与其他区域的序列相关的测序数据(其可以是在生成偶联测序读段对时生成的相同测序数[0190]在一些实施方案中，检测偶联测序读段对的两个测序区域之间的变体(如结构变或缺失)或SNP)的方法(其中使用以第一区域流动顺序提供的核苷酸延伸引物)包括将第三骤1302，将偶联测序读段对的第一区域或其部分或者第三区域或其部分映射到参考序列。过将第一区域或第三区域的预期测序数据与生成的与第一区域或第三区域的序列相关的述的方法可以用于确定产生偶联测序读段对的多核苷酸是否与具有所鉴定的等位基因或以与在多核苷酸的第一区域或第三区域中测序的等位或其部分的预期测试变体测序数据与确定的第三区域或其部分的测序数据进行比较来检测受试者基因组内测试变体的存在。如果预期的测试变体测序数据与确定的测序数据匹个测序区域之间的测试变体的方法(其中已经使用以第一区域流动顺序提供的核苷酸将引物延伸通过第一区域和/或已经使用以第三区域流动顺序提供的核苷酸将引物延伸通过第三区域)包括将第一区域或其部分映射到包括测试变体的参考序列。然后确定其他区域或区域流动顺序、其他区域的流动顺序以及与其他区域的序列相关的测序数据(其可以是生成偶联测序读段对时生成的相同测序数据，或通过其他手段生成的测序数据)来确定预期[0195]本文所述的方法可用于检测第二区域内的短遗传变体(例如，SNP或短插入缺失[0199]流动图可以是二进制或非二进制的。二进制流动图检测整合的核苷酸存在(1)或不存在(0)。非二进制流动图可以更定量地确定从每次逐步引入整合的核苷酸的数目。例重复流动循环顺序用以下序列延伸的引物：TATGGTCGTCGA(SEQIDNO:15)可以产生图14A[0202]指示给定序列的测序数据集的可能性的值可以从没有序列比对的测序数据集确根据每个流动位置处的最可能的碱基计数来确定引物延伸的序列：TATGGTCGTCGA(SEQID讨论的)指示测序数据集可能来自具有与紧密匹配的候选序列相同序列的核酸分子。在一则反之亦然)，并且可以在流动空间或碱基空间中进行映射。与映射序列相对应的基因座的核酸分子的序列不需要使用比对算法与每个候选序列比对，这通常在计算上是昂贵的。TATGGTCATCGA(SEQIDNO:16)的候选引物延伸序列。图14C(显示图14A中的相同测序数据见图14B)的迹线在图14C中使用空心圆显示。指示测序数据与第一候选序列TATGGTCATCGA(SEQIDNO:16)匹配的可能性的匹配分数基本上不同于指示测序数据与第二候选序列[0206]匹配分数可用于将测试测序数据和/或与测试测序数据相关的核酸分子分类。分者可以指示空判定。空判定既不指示与测试测序数据相关的核酸分子中存在或不存在变择测序数据集中的每个流动位置处的与该流动位置处的候选序列的碱基计数相对应的统遗传变体的候选序列(例如，从两个或更多个候选序列中产生具有最高可能性匹配的匹配分数的候选序列)。由具有短遗传变体的序列核酸分子产生的测序数据将与具有短遗传变的候选序列可以在两个或更多个流动位置处与所选择的候选序列(其与测序的核酸分子测序数据集最佳地匹配)不同，所述两个或更多个流动位置可以是两个或更多个连续流动位的候选序列，其中与序列核酸分子相关的测序数据集在(X+2)个或更多个流动位置处不同的增加(其中测序的核酸分子测序数据集与所选择的候选序列最佳匹配)降低了从使用未选择的候选序列对核酸分子进行测序而得到的测序的核酸分子测序数据0.0001。测序的核酸分子的测序数据集与所选的候选序列匹配的可能性优选高，如大于[0211]可以使用一个或多个确定的匹配分数来判定测试样品中短遗传变体的存在(或身HaplotypeCaller算法，确定指示多个测试测序数据集与候选序列匹配的可能性的匹配分forvariationdiscoveryandgenotypingusingnext-generationDNAsequencingVariantDiscoverytoTensofKestomenofSamples，BioRxiv，www.bioR/content/10.1101/201178v3(2018年7月24日)；Hwang等，SystematicComparisonofVariantCallingPipelinesUsingGoldStandardPersonalExomeVariants，数据集中的每个值指示每个流动位置处指示的碱基计数正确的可能性。基于测序数据集，基因组的基因座与潜在的单倍型序列TATGGTCGTCGA(SEQIDNO:15)(H1)和TATGGTCATCGA中提供的非终止核苷酸对假设的核酸分子进行测序，得到图16中所示的测试测序数据集。个流动位置的单倍型序列的碱基计数相关的可能性值来确定给定的每个单倍型的测序数[0217]颠换是将嘌呤交换为嘧啶或反之亦然的SNP。可以实施本文所述的方法以对于检检测整合的标记的核苷酸的存在或不存在来生成与多核苷酸的第一区域的序列相关的测序数据；(c)使用包含(1)胞嘧啶和胸腺嘧啶以及(2)腺嘌呤和鸟嘌呤的交替核苷酸对的流[0219]用于颠换检测生成的偶联测序读段对可用于通过映射偶联测序读段对的第一区于第三区域的预期参考测序数据与第三区域的生成测序数据之间的差异来检测碱基颠换[0220]第三区域或其部分(或第一区域或其部分)的预期参考测序数据可以通过例如使生成的与第三区域的序列相关的序列数据是生成偶联测序读段对时生成的相同或不同的二区域起始点和/或不同的第三区域起始点)，或者可以使用不同的第二区域流动顺序生偶联测序读段对处的变体的基因座与参考序列1404的基因座1406对齐。偶联测序读段对1412未识别基因座1422处的变体(例如，由于测序读段错误或由于变体的内容与第二区域[0227]根据本文所述方法生成的偶联测序读段对可用于通过组装该偶联测序读段对来见例如Zerbino等，Velvet:Algorithmsfordenovoshortreadassemblyusingde的循环步骤，每个循环步骤包括三个其他碱基)并假设第二区域中碱基的分布与整个基因[0230]偶联测序读段对可用于验证一个或多个共有序列或一个或多个共有序列的一部了验证共有序列，可以将第一区域或其部分(或第三区域或其部分)映射到所选的共有序区域流动顺序(如果预期的测序数据是针对第一区域或其部分)或第三区域流动顺序(如果预期的测序数据是针对第三区域或其部分)来确定预期的测序数据。然后可以将预期的测序数据与对应区域处生成的偶联测序读段对的测序数据进行比较，以验证共有序列部分。体(例如，健康人是二倍体生物体，并且每个染色体具有两个拷贝(男性中的性染色体除染色体对组装共有序列)。将偶联测序读段对分配给多倍体生物体的相应染色体的过程可用来自本文所述的偶联测序读段对的第二区域的信息将测试变体与第一染色体或第二染色体(或来自多倍体生物体的其他另外的染[0233]上述操作(包括参考图1-17所述的那些操作)任选地由图18中所描绘的部件来实现。本领域的普通技术人员会清楚地知道可如何基于图18中所描绘的部件来实现其他过子设备)，如电话或平板电脑。设备可以包括例如处理器1810、输入设备1820、输出设备[0237]可以存储在存储器1840中并由处理器1810执行的软件1850可以包括例如体现本[0238]软件1850还可以在任何非暂时性计算机可读存储介质内存储和/或传输，以供指用软件可以以不同的配置部署，如以客户端/服务器布置或例如通过web浏览器作为基于[0242]本文描述的方法任选地进一步包括报告使用分析方法确定的信息和/或生成包含[0247](b)通过使用标记的核苷酸延伸引物并检测整合的标记的核苷酸的存在或不存在来生成与多核苷酸的第一区域的序列相关的[0248](c)使用以第二区域流动顺序中提供的核苷酸将步骤(b)中延伸的引物进一步延伸通过第二区域，其中(i)引物延伸通过第二[0250]实施方案2.实施方案1所述的[0254](b)通过使用第二区域流动顺序中提供的核苷酸将引物延伸通过第二区域，其中(i)将引物延伸通过第二区域而不检测整合到延伸引物中的核苷酸的标记的存在或不存[0257]实施方案6.实施方案1-5任一个的方[0258]实施方案7.实施方案1-6任一个的方法[0259]实施方案8.实施方案1-6任一个的方法，其[0260]实施方案9.实施方案1-8任一个的方法骤中使用至少两种不同类型的核苷酸碱基的[0262]实施方案11.实施方案10任一个的[0265]实施方案14.实施例1-13任一个的方[0266]实施方案15.实施方案1-14任一个[0267]实施方案16.实施方案15的方法，其中[0271]实施方案20.实施方案1-19中任一[0274]实施方案23.实施方案22的方法，[0275]实施方案24.实施方案22的方法[0278]将根据实施方案1-25任一个的方法生成的偶联测序读段[0281]将根据实施方案1-25任一个的方法生成的偶联测序读段对的第一区域或其部分[0284]通过将未映射的第一区域或其部分或未映射的第三区域或其部分的测序数据与区域或其部分的测序数据与预期测序数据之间的差[0286]将根据实施方案1-25任一个的方法生成的偶联测序读段对的第一区域或其部分[0287]实施方案29.实施方案28的方法未映射的第三区域或其部分桥接到相对于参考序列的插入[0291]将根据实施方案1-25任一个的方法生成的偶联测序读段对的第一区域或其部分[0295]实施方案34.实施方案27-32任一个的方法，其中变体是第二区域内的插入或缺[0297]实施方案36.实施方案35的方法，其中与第[0298]实施方案37.实施方案35或36所述的[0300]实施方案39.实施方案38的方法，其中[0302]将根据实施方案1-25任一个的方法生成的偶联测序读段对的第一区域或其部分和第三区域或其部分映射到包含第一位置和第二位置的两个或更多个不同位置对处的参一位置与第二位置之间的距离的第二距离信息来选[0304]实施方案41.实施方案40[0305]实施方案42.实施方案41的方法，其中与第二[0306]实施方案43.实施方案41或[0307]实施方案44.实施方案40的方法，[0308]实施方案45.实施方案44的方法，其中[0309]实施方案46.一种检测根据实施方案1-25任一个生成的偶联测序读段对的两个测[0312]通过将第三区域的预期测序数据与生成的与第三区域的序列相关的测序数据进[0317]实施方案51.实施方案50的方[0318]实施方案52.实施方案50或51的方法[0319]实施方案53.一种生成用于检测多核苷酸未测序区域中的碱基颠换存在的偶联测[0321](b)通过使用标记的核苷酸延伸引物并检测整合的标记的核苷酸的存在或不存在来生成与多核苷酸的第一区域的序列相关的[0322](c)使用包含(1)胞嘧啶和胸腺嘧啶以及(2)腺嘌呤和鸟嘌呤的交替核苷酸对的流[0326](b)使用包含(1)胞嘧啶和胸腺嘧啶以及(2)腺嘌呤和鸟嘌呤的交替核苷酸对的流[0328]实施方案55.实施方案54的方法，其中[0331]将根据实施方案54-56任一个生成的偶联测序读段对的第一区域或其部分和第三[0333]基于第三区域的预期测序数据与生成的第三区域的测序数据之间的差异检测碱[0334]实施方案58.实施方案57的方法[0335]实施方案59.实施方案57的方法[0337]实施方案61.一种生成一个或多[0338]实施方案62.实施方案61的方法，其中使长度的距离信息来组装一个或多个共有序列。[0339]实施方案63.实施方案61的[0340]实施方案64.实施方案63的方法，其中与[0341]实施方案65.实施方案63或[0342]实施方案66.实施方案62的方法，[0343]实施方案67.实施方案66的方法，其成所选的偶联测序读段时的延伸通过第三区域的引物是使用以第三区域流动顺序提供的[0346]通过将所选的偶联测序读段的第三区域的预期测序数据与生成的第三区域的测[0348]在根据实施方案1-25任一个生成的多个重叠偶联测序读所述多个重叠偶联测序读段对包含对应于测试变体的基因座的[0350]实施方案70.实施方案69的方法，其中[0351]实施方案71.实施方案69或70的[0352]实施方案72.实施方案71的方法，其偶联测序读段中的其他偶联测序读段的至少一[0353]实施方案73.实施方案71或72所述[0356]将与多核苷酸的第三区域的序列相关的测序数据与多核苷酸的第三区域的预期[0359]将与多核苷酸的第三区域的序列相关的测序数据与多核苷酸的第三区域的预期[0361]实施方案76.实施方案74或75的方法，[0362]实施方案77.实施方案1-76任[0363]实施方案78.实施方案77的方法，其[0364]实施方案79.实施方案78的方法，置处的预期序列的碱基计数，并确定指示测序数据集与预期序列匹配的可能性的匹配分[0368]实施方案81.实施方案80的方[0369]实施方案82.实施方案1-81任一个的[0372]使用以第四区域流动顺序提供的核苷酸进一步将引物延伸通过第四区域，其中(i)将引物延伸通过第四区域而不检测整合到延伸引物中的核苷酸的标记存在或不存在，(ii)在第四区域流动顺序的至少一个步骤中使用至少两种不同类型的核苷酸碱基的混合[0374]实施方案85.实施方案84所述的方法，[0377](a)使用滚环扩增(RCA)扩增多核苷酸以生成至少包含所述多核苷酸的第一拷贝生成与多核苷酸的第一拷贝内的多核苷酸的第一区域的序列[0380](d)使用以第二区域流动顺序提供的核苷酸使引物进一步延伸通过多核苷酸的第一拷贝内的多核苷酸的第二区域，其中(i)将引物延伸通过多核苷酸的第一拷贝内的多核区域流动顺序的至少一个步骤中使用至少两种不同类型的核苷酸碱基的混合物，或(iii)引物延伸通过多核苷酸的第一拷贝内的多核苷酸的第二区域比引物延伸通过第一区域更[0381](e)通过使用标记的核苷酸进一步延伸引物，并检测整合的标记的核苷酸存在或[0382](f)将针对多核苷酸的第三区域生成的测序数据与针对多核苷酸的第三区域的预[0386]实施方案88.实施方案87的方法，其中核苷酸的第二区域比引物延伸通过多核苷酸的第一拷贝内的多核苷酸的第一区域进行得[0388](a)使用滚环扩增(RCA)扩增多核苷酸以生成至少包含多核苷酸的第一拷贝和多[0389](b)使引物与多核苷酸的第一拷贝内的多核苷酸的第一区域杂交以形成杂交模[0390](c)使用以第二区域流动顺序提供的核苷酸使引物延伸通过多核苷酸的第一拷贝内的多核苷酸的第二区域，其中(i)将引物延伸通过多核苷酸的第一拷贝内的多核苷酸的流动顺序的至少一个步骤中使用至少两种不同类型的核苷[0391](d)通过使用标记的核苷酸进一步延伸引物，并检测整合的标记的核苷酸存在或[0392](e)将针对多核苷酸的第三区域生成的测序数据与针对多核苷酸的第三区域的预[0396]实施方案90.实施方案89的方法，其拷贝内的多核苷酸的第二区域，而不检测整合到延伸引物中的核苷酸的标记存在或不存第一拷贝内的多核苷酸的第二区域的核苷酸的至少一部[0405](b)根据第一区域流动循环使用标记的核苷酸将引物延伸通过多核苷酸拷贝的第[0406](c)使用一个或多个重定相流动使引物延伸通过多核苷酸拷贝的第二区域，其中在一个或多个重定相流动中的至少一个中使用至少两种不同类型的核苷酸碱基的混合物；和[0407](d)根据第三区域流动循环使用标记的核苷酸将引物延伸通过多核苷酸拷贝的第[0408]实施方案98.实施方案97的方法，其中在[0409]实施方案99.实施方案97或98的方法域的同时检测整合的标记的核苷酸存在或不存在来生成与第一区域的序列相关的测序数荧光标记的非终止核苷酸交替流动，并且使用荧光检测器确定每个步骤后的核苷酸整合。[0426]在标准流动测序方法中对相同的262个碱基的构建体进行完整测序，而没有中间将来自多核苷酸两端的测序数据相关联以生成偶联测序读段对[0429]在这个实施例中描述了SEQIDNO:4内变体的检测(相对于参考序列SEQIDNO:时包括多种不同的核苷酸碱基类型，所以与在任何给定步骤中仅使用单一碱基类型相比，引物延伸得更快。SEQIDNO:1(参考序列)和SEQIDNO:4(SNP序列)的流动图显示于表6和SEQIDNO:4之间的测序数据之间的差异指示第二区域内变体的存[0435]在这个实施例中描述了SEQIDNO:8内变体的检测(其包括相对于参考序列SEQIDNO:1在碱基位置23后的ATC插入)。可以使用包括通过第二区域的快进部分的流动测序方法针对SEQIDNO:1和SEQIDNO:8生成偶环，其中循环1用于将引物延伸通过第一区域，循环2和循环3用于将引物延伸通过第二区4和循环5)是3'-AC-5'。SEQIDNO:1和SEQIDNO:8之间的测序数据之间的差异表明第二[0437]在这个实施例中描述了SEQIDNO:9内变体(其相对于参考序列SEQIDNO:1包括时包括多种不同的核苷酸碱基类型，所以与在任何给定步骤中仅使用单一碱基类型相比，指示SEQIDNO:1的第三区域(循环4和循环5)是3'-CTGAC-5'(SEQIDNO:5)，并且SEQID[0439]在这个实施例中描述了SEQIDNO:12内变体的检测(其相对于参考序列SEQID区域的快进部分的流动测序方法针对SEQIDNO:1和SEQIDNO:12生成偶联测序读段对。序数据指示SEQIDNO:1的第三区域(循环4和循环5)是3'-CTGAC-5'(SEQIDNO:5)，并且设具有10,000个相同模板链的测序簇，并使用假设A-C-T-G流动顺序的非终止核苷酸对模图20A显示了在100个流动步骤后在每个读段碱基处延伸的引物(链)的数量，其中第100个后引物代表的是在测序过程期间的某个点将预期的核苷酸整合到延伸引物中而失败的引两个流动位置处诱导信号变化的可能性。扩展的流动顺序设计为具有最少12个碱基序列，

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

CN114096682B 通过合成方法的快进测序（阿尔缇玛基因组学公司）

文档简介

温馨提示

最新文档

评论

CN114096682B 通过合成方法的快进测序 （阿尔缇玛基因组学公司）

文档简介

温馨提示

最新文档

评论

相关文档

CN114096682B 通过合成方法的快进测序（阿尔缇玛基因组学公司）