CN113661249B 用于分离无细胞dna的组合物和方法 (夸登特健康公司)_第1页
CN113661249B 用于分离无细胞dna的组合物和方法 (夸登特健康公司)_第2页
CN113661249B 用于分离无细胞dna的组合物和方法 (夸登特健康公司)_第3页
CN113661249B 用于分离无细胞dna的组合物和方法 (夸登特健康公司)_第4页
CN113661249B 用于分离无细胞dna的组合物和方法 (夸登特健康公司)_第5页
已阅读5页,还剩125页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(19)国家知识产权局(12)发明专利62/799,6372019.01.31USPCT/US2020/0161202020WO2020/160414EN2020.08.06地址美国加利福尼亚州有限公司11262分区102分区102分区2加标签104汇集106对来自分区的数据的计算机模拟分析分区1分区1本文公开了用于分离DNA诸如无细胞DNA方案中,通过该方法分离的DNA使用序列可变靶set)和表观遗传靶区组(anepigenetictargetregionset)捕获,其中序列可变靶区组以比表序至比表观遗传靶区组的捕获的cfDNA更深的测21.一种非暂时性计算机可读介质,所述非暂时性计算机可读介质包括计算机可执行的指令,所述计算机可执行的指令在由至少一个电子处理器执行时进行一种鉴定由肿瘤产生从测试受试者收集cfDNA,使用甲基结合结构域,将从所述测试受试者获得的cfDNA基于甲基化水平分区为2个或更多个级分,并且对每个级分进行方法的随后步骤;使用靶特异性探针,从所述cfDNA中捕获多于一个其中(i)所述多于一个靶区组包括序列可变靶区组和表观遗传靶区组,从而产生捕获的cfDNA分子组,(ii)在捕获的cfDNA分子组中,对应于所述序列可变靶区组的cfDNA分子以比对应于所述表观遗传靶区组的cfDNA分子高的捕获产量被捕获;以及(iii)所述表观遗传靶区组选自以下中的一种或更多种:(a)超甲基化可变靶区组;(b)低甲基化可变靶区组;(d)片段化可变靶区组,其中所述片段化可变靶区组包括转录起始位点区和/或CTCF结合区;对所述捕获的cfDNA分子进行测序,其中所述序列可变靶区组的捕获的cfDNA分子被测序至比所述表观遗传靶区组的捕获的cfDNA分子深至少2倍的测序深度;将所述多于一个序列读段映射至一个或更多个参考序列以产生映射的序列读段;和处理对应于所述序列可变靶区组和所述表观遗传靶区组的映射的序列读段,以确定所述受试者具有癌症的可能性。2.根据权利要求1所述的非暂时性计算机可读介质,其中在测序之前,将所述序列可变靶区组的捕获的cfDNA分子与所述表观遗传靶区组的捕获的cfDNA分子汇集。3.根据权利要求2所述的非暂时性计算机可读介质,其中在同一测序池中对所述序列可变靶区组的捕获的cfDNA分子和所述表观遗传靶区组的捕获的cfDNA分子进行测序。5.根据权利要求4所述的非暂时性计算机可读介质,其中cfDNA扩增包括将包含条形码的衔接子与所述cfDNA连接的步骤。6.根据权利要求1所述的非暂时性计算机可读介质,其中所述捕获所述cfDNA的多于一个靶区组包括使所述cfDNA与对所述序列可变靶区组特异性的靶结合探针和对所述表观遗传靶区组特异性的靶结合探针接触。7.根据权利要求6所述的非暂时性计算机可读介质,其中对所述序列可变靶区组特异性的靶结合探针以比对所述表观遗传靶区组特异性的靶结合探针高至少4倍或5倍的浓度存在。8.根据权利要求1所述的非暂时性计算机可读介质,其中所述表观遗传靶区组的足迹3比所述序列可变靶区组的尺寸大至少2倍。9.根据权利要求8所述的非暂时性计算机可读介质,其中所述表观遗传靶区组的足迹比所述序列可变靶区组的尺寸大至少10倍。10.根据权利要求1所述的非暂时性计算机可读介质,其中所述2个或更多个级分包括超甲基化级分和低甲基化级分,并且所述方法还包括将所述超甲基化级分和所述低甲基化级分差异加标签或者对所述超甲基化级分和所述低甲基化级分单独地测序。11.根据权利要求10所述的非暂时性计算机可读介质,其中所述超甲基化级分和所述低甲基化级分被差异加标签,并且所述方法还包括在测序步骤之前汇集差异加标签的超甲基化级分和低甲基化级分。12.根据权利要求1所述的非暂时性计算机可读介质,所述方法还包括确定对应于所述表观遗传靶区组的cfDNA分子是否包含或指示癌症相关表观遗传修饰。13.根据权利要求12所述的非暂时性计算机可读介质,其中所述癌症相关表观遗传修饰包括一个或更多个超甲基化可变靶区中的超甲基化。14.根据权利要求12所述的非暂时性计算机可读介质,其中所述癌症相关表观遗传修饰包括CTCF结合的一个或更多个扰动。15.根据权利要求12所述的非暂时性计算机可读介质,其中所述癌症相关表观遗传修饰包括转录起始位点的一个或更多个扰动。4[0001]相关申请的交叉引用[0002]本申请要求2019年1月31日提交的美国临时专利申请第62/799,637号的优先权的权益,该申请出于所有目的通过引用并入本文。背景技术[0003]癌症每年导致全世界数百万人死亡。癌症的早期检测可能导致改进的结果,因为早期癌症倾向于对治疗更敏感。[0004]不当控制的细胞生长是癌症的标志(hallmark),癌症通常由遗传改变和表观遗传改变诸如拷贝数变异(CNV)、单核苷酸变异(SNV)、基因融合体、插入和/或缺失(插入缺失(indels))的积累引起,表观遗传变异包括胞嘧啶的5-甲基化(5-甲基胞嘧啶)以及DNA与染色质蛋白和转录因子的缔合。[0005]活检代表了用于检测或诊断癌症的传统方法,其中从可能的癌症部位提取细胞或组织,并分析相关的表型和/或基因型特征。活检具有侵入性的缺点。[0006]基于体液诸如血液分析的癌症检测(“液体活检”)是基于对来自癌细胞的DNA被释放到体液中的观察结果的有趣的替代方法。液体活检是非侵入性的(可能仅需要抽血)。然而,考虑到无细胞DNA的低浓度和异质性,开发用于分析液体活检材料的准确且灵敏的方法是有挑战的。分离可用于液体活检程序中进一步分析的无细胞DNA级分是该过程的重要部分。因此,对于用于分离无细胞DNA(例如用于液体活检)发明内容[0007]本公开内容提供了用于分离DNA,诸如无细胞DNA的组合物和方法。本公开内容部分地基于以下认识。分离无细胞的DNA以便捕获两个靶区组——序列可变靶区组和表观遗传靶区组(其中序列可变靶区组的捕获产量大于表观遗传靶区组的捕获产量)可能是有益的。在本文描述的涉及序列可变靶区组和表观遗传靶区组的所有实施方案中,序列可变靶区组包括表观遗传靶区组中不存在的区域,并且反之亦然,尽管在一些情况下,区域的级分可以重叠(例如,基因组位置的级分可以在两个靶区组中呈现)。捕获产量的差异可以允许例如在同时测序期间诸如在同一测序池(sequencingcell)中或在同一待测序材料池中在序列可变靶区组中进行深度且因此更准确的序列确定,以及在表观遗传靶区组中进行浅且更广泛的覆盖。[0008]表观遗传靶区组可以以各种方式进行分析,包括不依赖于靶内特定核苷酸序列确定中的高度准确度的方法。实例包括确定甲基化和/或片段的分布和尺寸,这可以指示获得片段的细胞中正常或异常的染色质结构。这样的分析可以通过测序来执行,并且与确定序列突变(诸如碱基取代、插入或缺失)的存在或不存在相比,需要更少的数据(例如,序列读段的数量或测序覆盖的深度)。[0009]与本文描述的方法相比,以相同的捕获产量分离表观遗传靶区组和序列可变靶区组将导致表观遗传靶区组不必要的冗余数据的产生和/或提供比确定序列可变靶区组成员5的基因型所期望的更低的准确度。[0010]本公开内容旨在满足对于改进无细胞DNA分离的需求和/或提供其他益处。因此,提供了以下示例性实施方案。获从测试受试者获得的cfDNA的多于一个靶区组,其中多于一个靶区组包括序列可变靶区序列可变靶区组的cfDNA分子以比对应于表观遗传靶区组的cfDNA分子更高的捕获产量被捕获。[0012]在另一方面,本公开内容提供了一种分离无细胞DNA(cfDNA)的方法,使从测试受试者获得的cfDNA与靶特异性探针组接触,其中靶特异性探针组包括对序列可变靶区组特异性的靶结合探针和对表观遗传靶区组特异性的靶结合探针,并且靶特异性探针组被配置为以比对应于表观遗传靶区组的cfDNA更高的捕获产量捕获对应于序列可变靶区组的cfDNA,从而形成靶特异性探针和cfDNA的复合物;并且将复合物与未与靶特异性探获的cfDNA分子组进行测序。在一些实施方案中,该方法还包括将对应于序列可变靶区组的cfDNA分子测序至比对应于表观遗传靶区组的cfDNA分子更深的测序深度。[0013]在另一方面,本公开内容提供了一种鉴定由肿瘤产生的DNA的存在的方法,该方法包括:从测试受试者收集cfDNA,从cfDNA中捕获多于一个靶区组,其中多于一个靶区组包括序列可变靶区组和表观遗传靶区组,从而产生捕获的cfDNA分子组,对捕获的cfDNA分子进行测序,其中序列可变靶区组的捕获的cfDNA分子被测序至比表观遗传靶区组的捕获的[0014]在另一方面,本公开内容提供了一种确定受试者具有癌症的可能性的方法,包括:a)从测试受试者收集cfDNA;b)从cfDNA中捕获多于一个靶区组,其中多于一个靶区组包括序列可变靶区组和表观遗传靶区组,从而产生捕获的cfDNA分子组;c)对捕获的cfDNA分子进行测序,其中序列可变靶区组的捕获的cfDNA分子被测序至比表观遗传靶区组的捕获的cfDNA分子更深的测序深度;d)获得由核酸测序仪通过对捕获的cfDNA分子进行测序而产生的多于一个序列读段;e)将多于一个序列读段映射至一个或更多个参考序列以产生映射的序列读段;以及f)处理对应于序列可变靶区组和表观遗传靶区组的映射的序列读段,以确定受试者具有癌症的可能性。[0015]在一些实施方案中,序列可变靶区组的捕获的cfDNA分子被测序至比表观遗传靶区组的捕获的cfDNA分子深至少2倍的测序深度。在一些实施方案中,序列可变靶区组的捕获的cfDNA分子被测序至比表观遗传靶区组的捕获的cfDNA分子深至少3倍的测序深度。在一些实施方案中,序列可变靶区组的捕获的cfDNA分子被测序至比表观遗传靶区组的捕获的cfDNA分子深4-10倍的测序深度。在一些实施方案中,序列可变靶区组的捕获的cfDNA分子被测序至比表观遗传靶区组的捕获的cfDNA分子深4-100倍的测序深度。[0016]在一些实施方案中,cfDNA扩增包括将包含条形码的衔接子与cfDNA连接的步骤。在一些实施方案中,cfDNA扩增包括将包含条形码的衔接子与cfDNA连接的步骤。[0017]在一些实施方案中,捕获cfDNA的多于一个靶区组包括使cfDNA与对序列可变靶区组特异性的靶结合探针和对表观遗传靶区组特异性的靶结合探针接触。在一些实施方案6组特异性的靶结合探针以比对表观遗传靶区组特异性的靶结合探针高至少4倍或5倍的浓[0019]在一些实施方案中,分组特异性的靶结合探针的捕获产量比对表观遗传靶区组特异性的靶结合探针的捕获产量一个靶区组包括序列可变靶区组和表观遗传靶区组,其中对应于序列可变靶区的捕获的产生映射的序列读段;(iii)处理对应于序列可变靶区组和表观遗传靶区组的映射的序列区组的测序深度比对应于表观遗传靶区组的7中,表观遗传靶区组包括低甲基化可变靶区组。在一些实施方案中,表观遗传靶区组包括甲基化对照靶区组。[0027]在一些实施方案中,表观遗传靶区组包括片段化可变靶区组。在一些实施方案中,片段化可变靶区组包括转录起始位点区。在一些实施方案中,片段化可变靶区组包括CTCF结合区。[0028]在一些实施方案中,表观遗传靶区组的足迹比序列可变靶区组的尺寸大至少2倍。在一些实施方案中,表观遗传靶区组的足迹比序列可变靶区组的尺寸大至少10倍。[0029]在一些实施方案中,序列可变靶区组的足迹是至少25kB或50kB。[0030]在又另一方面,本公开内容提供了一种组合物,所述组合物包含捕获的cfDNA,其中捕获的cfDNA包括捕获的序列可变靶区和捕获的表观遗传靶区,并且序列可变靶区的浓度大于表观遗传靶区的浓度,其中浓度针对序列可变靶区和表观遗传靶区的足迹尺寸进行归一化。[0031]在一些实施方案中,捕获的cfDNA包含序列标签。在一些实施方案中,序列标签包括条形码。在一些实施方案中,序列可变靶区的浓度比表观遗传靶区的浓度大至少2倍。在一些实施方案中,序列可变靶区的浓度比表观遗传靶区的浓度大至少4倍或5倍。在一些实施方案中,浓度是针对靶区的足迹尺寸归一化的质量/体积浓度。[0032]在一些实施方案中,表观遗传靶区包括超甲基化可变靶区;低甲基化可变靶区;转括甲基化对照靶区。[0033]在一些实施方案中,组合物根据本文别处公开的方法产生。在一些实施方案中,捕获在单个容器中进行。[0034]在一些实施方案中,本文公开的系统和方法的结果被用作输入以生成报告。报告可以是纸质格式或电子格式。例如,如由本文公开的方法或系统确定的关于序列信息的信息和/或从序列信息导出的信息可以展示在这样的报告中。在一些实施方案中,该信息是如由本文公开的方法或系统确定的受试者的癌症状态。本文公开的方法或系统还可以包括将报告传送至第三方的步骤,第三方诸如是样品来源的受试者或健康护理从业者。[0035]在另一方面,本公开内容提供了一种确定测试受试者中癌症复发风险的方法,该方法包括:在对测试受试者进行一次或更多次先前的癌症治疗之后的一个或更多个预选时间点,从被诊断为患有癌症的测试受试者收集起源于或衍生自肿瘤细胞的DNA;从DNA中捕获多于一个靶区组,其中多于一个靶区组包括序列可变靶区组和表观遗传靶区组,从而产测序至比表观遗传靶区组的捕获的DNA分子更深的测序深度,从而产生序列信息组;使用序列信息组检测起源于或衍生自肿瘤细胞的DNA在预选时间点的存在或不存在;并且确定癌症复发评分,所述癌症复发评分指示起源于或衍生自测试受试者的肿瘤细胞的DNA的存在或不存在,其中在癌症复发评分被确定为处于或高于预定阈值时,测试受试者的癌症复发状态被确定为处于癌症复发风险,或者在癌症复发评分低于预定阈值时,测试受试者的癌症复发状态被确定为处于较低的癌症复发风险。[0036]在另一方面,本公开内容提供了一种将测试受试者分类为随后癌症治疗候选者的方法,该方法包括:在对测试受试者进行一次或更多次先前的癌症治疗之后的一个或更多8个预选时间点,从被诊断为患有癌症的测试受试者收集起源于或衍生自肿瘤细胞的DNA;从DNA中捕获多于一个靶区组,其中多于一个靶区组包括序列可变靶区组和表观遗传靶区组,列可变靶区组的捕获的DNA分子被测序至比表观遗传靶区组的捕获的DNA分子更深的测序深度,从而产生序列信息组;使用序列信息组检测起源于或衍生自肿瘤细胞的DNA在一个或更多个预选时间点的存在或不存在;确定癌症复发评分,所述癌症复发评分指示起源于或衍生自肿瘤细胞的DNA的存在或不存在;并且将测试受试者的癌症复发评分与预定的癌症复发阈值进行比较,从而在癌症复发评分高于癌症复发阈值时,将测试受试者分类为随后癌症治疗的候选者,或者在癌症复发评分低于癌症复发阈值时,不将测试受试者分类为疗法的候选者。[0037]以下是根据本公开内容的实施方案的示例性列表。[0038]实施方案1是一种分离无细胞DNA(cfDNA)的方[0039]捕获从测试受试者获得的cfDNA的多于一个靶区组,[0040]其中多于一个靶区组包括序列可变靶区组和表观遗传靶区组,[0042]其中在所述捕获的cfDNA分子组中,对应于所述序列可变靶区组的cfDNA分子以比对应于所述表观遗传靶区组的cfDNA分子更高的捕获产量被捕获。[0043]实施方案2是一种分离无细胞DNA(cfDNA)的方法,所述方法包括:[0044]使从测试受试者获得的cfDNA与靶特异性探针组接触,[0045]其中所述靶特异性探针组包括对序列可变靶区组特异性的靶结合探针和对表观遗传靶区组特异性的靶结合探针,并且所述靶特异性探针组被配置为以比对应于所述表观遗传靶区组的cfDNA更高的捕获产量捕获对应于所述序列可变靶区组的cfDNA,[0046]从而形成靶特异性探针和cfDNA的复合物;并且[0047]将所述复合物与未与靶特异性探针结合的cfDNA分开,从而提供捕获的cfDNA分子[0048]实施方案3是实施方案1或2所述的方法,所述方法还包括对所述捕获的cfDNA分子组进行测序。[0049]实施方案4是实施方案3所述的方法,所述方法包括将对应于所述序列可变靶区组的cfDNA分子测序至比对应于所述表观遗传靶区组的cfDNA分子更深的测序深度。[0050]实施方案5是一种鉴定由肿瘤产生的DNA的存在的方法,所述方法包括:[0051]从测试受试者收集cfDNA,[0052]从所述cfDNA中捕获多于一个靶区组,[0053]其中所述多于一个靶区组包括序列可变靶区组和表观遗传靶区组,从而产生捕获[0054]对所述捕获的cfDNA分子进行测序,[0055]其中所述序列可变靶区组的捕获的cfDNA分子被测序至比所述表观遗传靶区组的捕获的cfDNA分子更深的测序深度。[0056]实施方案6是实施方案3-5中任一项所述的方法,其中所述序列可变靶区组的捕获的cfDNA分子被测序至比所述表观遗传靶区组的捕获的cfDNA分子深至少2倍的测序深度。9[0057]实施方案7是实施方案3-5中任一项所述的方法,其中所述序列可变靶区组的捕获的cfDNA分子被测序至比所述表观遗传靶区组的捕获的cfDNA分子深至少3倍的测序深度。[0058]实施方案8是实施方案3-5中任一项所述的方法,其中所述序列可变靶区组的捕获的cfDNA分子被测序至比所述表观遗传靶区组的捕获的cfDNA分子深4-10倍的测序深度。[0059]实施方案9是实施方案3-5中任一项所述的方法,其中所述序列可变靶区组的捕获的cfDNA分子被测序至比所述表观遗传靶区组的捕获的cfDNA分子深4-100倍的测序深度。[0060]实施方案10是实施方案3-9中任一项所述的方法,其中在测序之前,将所述序列可变靶区组的捕获的cfDNA分子与所述表观遗传靶区组的捕获的cfDNA分子汇集。[0061]实施方案11是实施方案3-10中任一项所述的方法,其中在同一测序池中对所述序列可变靶区组的捕获的cfDNA分子和所述表观遗传靶区组的捕获的cfDNA分子进行测序。[0062]实施方案12是前述实施方案中任一项所述的方法,其中所述cfDNA在捕获之前被扩增。[0063]实施方案13是实施方案12所述的方法,其中所述cfDNA扩增包括将包含条形码的衔接子与所述cfDNA连接的步骤。[0064]实施方案14是前述实施方案中任一项所述的方法,其中所述表观遗传靶区组包括超甲基化可变靶区组。[0065]实施方案15是前述实施方案中任一项所述的方法,其中所述表观遗传靶区组包括低甲基化可变靶区组。[0066]实施方案16是实施方案14或15所述的方法,其中所述表观遗传靶区组包括甲基化对照靶区组。[0067]实施方案17是前述实施方案中任一项所述的方法,其中所述表观遗传靶区组包括片段化可变靶区组。[0068]实施方案18是实施方案17所述的方法,其中所述片段化可变靶区组包括转录起始位点区。[0069]实施方案19是实施方案17或18所述的方法,其中所述片段化可变靶区组包括CTCF结合区。[0070]实施方案20是前述实施方案中任一项所述的方法,其中捕获所述cfDNA的多于一个靶区组包括使所述cfDNA与对所述序列可变靶区组特异性的靶结合探针和对所述表观遗传靶区组特异性的靶结合探针接触。[0071]实施方案21是实施方案20所述的方法,其中对所述序列可变靶区组特异性的靶结合探针以比对所述表观遗传靶区组特异性的靶结合探针更高的浓度存在。[0072]实施方案22是实施方案20所述的方法,其中对所述序列可变靶区组特异性的靶结合探针以比对所述表观遗传靶区组特异性的靶结合探针高至少2倍的浓度存在。[0073]实施方案23是实施方案20所述的方法,其中对所述序列可变靶区组特异性的靶结合探针以比对所述表观遗传靶区组特异性的靶结合探针高至少4倍或5倍的浓度存在。[0074]实施方案24是实施方案20-23中任一项所述的方法,其中对所述序列可变靶区组特异性的靶结合探针具有比对所述表观遗传靶区组特异性的靶结合探针更高的靶结合亲和力。[0075]实施方案25是前述实施方案中任一项所述的方法,其中所述表观遗传靶区组的足迹比所述序列可变靶区组的尺寸大至少2倍。[0076]实施方案26是实施方案25所述的方法,其中所述表观遗传靶区组的足迹比所述序列可变靶区组的尺寸大至少10倍。[0077]实施方案27是前述实施方案中任一项所述的方法,其中所述序列可变靶区组的足迹是至少25kB或50kB。[0078]实施方案28是前述实施方案中任一项所述的方法,其中从所述测试受试者获得的cfDNA基于甲基化水平被分区为至少2个级分,并且对每个级分进行所述方法的随后步骤。[0079]实施方案29是实施方案28所述的方法,其中分区步骤包括使收集的cfDNA与固定在固体支持物上的甲基结合试剂接触。[0080]实施方案30是实施方案28或29所述的方法,其中所述至少2个级分包括超甲基化级分和低甲基化级分,并且所述方法还包括将所述超甲基化级分和所述低甲基化级分差异加标签或者对所述超甲基化级分和所述低甲基化级分单独地测序。[0081]实施方案31是实施方案30所述的方法,其中所述超甲基化级分和所述低甲基化级分被差异加标签,并且所述方法还包括在测序步骤之前汇集差异加标签的超甲基化级分和低甲基化级分。[0082]实施方案32是前述实施方案中任一项所述的方法,所述方法还包括确定对应于所述序列可变靶区组的cfDNA分子是否包含癌症相关突变。[0083]实施方案33是前述实施方案中任一项所述的方法,所述方法还包括确定对应于所述表观遗传靶区组的cfDNA分子是否包含或指示癌症相关表观遗传修饰或拷贝数变异(例如,聚焦扩增(focalamplification)),任选地,其中所述方法包括确定对应于所述表观遗传靶区组的cfDNA分子是否包含或指示癌症相关表观遗传修饰和拷贝数变异(例如,聚焦扩增)。[0084]实施方案34是实施方案33所述的方法,其中所述癌症相关表观遗传修饰包括一个或更多个超甲基化可变靶区中的超甲基化。[0085]实施方案35是实施方案33或34所述的方法,其中所述癌症相关表观遗传修饰包括[0086]实施方案36是实施方案33-35中任一项所述的方法,其中所述癌症相关表观遗传修饰包括转录起始位点的一个或更多个扰动。[0087]实施方案37是前述实施方案中任一项所述的方法,其中所述捕获的cfDNA分子组因表达(Helicos)、下一代测序(NGS)、单分子合成测序(SMSS)(Helicos)、大规模并行测序、的测序。[0088]实施方案38是一种用于捕获由肿瘤细胞产生的cfDNA的靶特异性探针的集合,所述集合包含对序列可变靶区组特异性的靶结合探针和对表观遗传靶区组特异性的靶结合探针,其中对所述序列可变靶区组特异性的靶结合探针的捕获产量比对所述表观遗传靶区组特异性的靶结合探针的捕获产量高至少2倍。11[0089]实施方案39是实施方案38所述的靶特异性探针的集合,其中对所述序列可变靶区组特异性的靶结合探针的捕获产量比对所述表观遗传靶区组特异性的靶结合探针的捕获产量高至少4倍或5倍。[0090]实施方案40是实施方案38或39所述的靶特异性探针的集合,其中所述表观遗传靶区组包括超甲基化可变靶区探针组。[0091]实施方案41是实施方案38-40中任一项所述的靶特异性探针的集合,其中所述表观遗传靶区组包括低甲基化可变靶区探针组。[0092]实施方案42是实施方案40或41所述的靶特异性探针的集合,其中所述表观遗传靶区探针组包括甲基化对照靶区探针组。[0093]实施方案43是实施方案38-42中任一项所述的靶特异性探针的集合,其中所述表观遗传靶区探针组包括片段化可变靶区探针组。[0094]实施方案44是实施方案43所述的靶特异性探针的集合,其中所述片段化可变靶区探针组包括转录起始位点区探针。[0095]实施方案45是实施方案43或44所述的靶特异性探针的集合,其中所述片段化可变[0096]实施方案46是实施方案38-45中任一项所述的靶特异性探针的集合,其中在所述序列可变靶区组中存在至少10个区域,并且在所述表观遗传靶区组中存在至少100个区域。[0097]实施方案47是实施方案38-46中任一项所述的靶特异性探针的集合,其中所述表观遗传靶区组的足迹比所述序列可变靶区组的尺寸大至少2倍。[0098]实施方案48是实施方案47所述的靶特异性探针的集合,其中所述表观遗传靶区组的足迹比所述序列可变靶区组的尺寸大至少10倍。[0099]实施方案49是实施方案38-48中任一项所述的靶特异性探针的集合,其中所述序列可变靶区组的足迹是至少25kB或50kB。[0100]实施方案50是实施方案38-49中任一项所述的靶特异性探针的集合,其中所述探针存在于单一溶液中。[0101]实施方案51是实施方案38-50中任一项所述的靶特异性探针的集合,其中所述探针包括捕获部分。[0102]实施方案52是一种组合物,所述组合物包含捕获的cfDNA,其中所述捕获的cfDNA包括捕获的序列可变靶区和捕获的表观遗传靶区,并且所述序列可变靶区的浓度大于所述表观遗传靶区的浓度,其中所述浓度针对所述序列可变靶区和所述表观遗传靶区的足迹尺寸进行归一化。[0103]实施方案53是实施方案52所述的组合物,其中所述捕获的cfDNA包含序列标签。[0104]实施方案54是实施方案53所述的组合物,其中所述序列标签包括条形码。[0105]实施方案55是实施方案52-54中任一项所述的组合物,其中所述序列可变靶区的浓度比所述表观遗传靶区的浓度大至少2倍。[0106]实施方案56是实施方案52-54中任一项所述的组合物,其中所述序列可变靶区的浓度比所述表观遗传靶区的浓度大至少4倍或5倍。[0107]实施方案57是实施方案52-56中任一项所述的组合物,其中所述浓度是针对所述靶区的足迹尺寸归一化的质量/体积浓度。[0108]实施方案58是实施方案52-57中任一项所述的组合物,其中所述表观遗传靶区包三种或四种;任选地,其中所述表观遗传靶区还包括甲基化对照靶区。[0109]实施方案59是实施方案52-58中任一项所述的组合物,所述组合物根据实施方案1-37中任一项所述的方法产生。[0110]实施方案60是一种确定受试者具有癌症的可能性的方法,所述方法包括:[0111]从测试受试者收集cfDNA;[0112]从所述cfDNA中捕获多于一个靶区组;[0113]其中所述多于一个靶区组包括序列可变靶区组和表观遗传靶区组,从而产生捕获[0114]对所述捕获的cfDNA分子进行测序,[0115]其中所述序列可变靶区组的捕获的cfDNA分子被测序至比所述表观遗传靶区组的捕获的cfDNA分子更深的测序深度;[0116]获得由核酸测序仪通过对所述捕获的cfDNA分子进行测序而产生的多于一个序列[0117]将所述多于一个序列读段映射至一个或更多个参考序列以产生映射的序列读段;[0118]处理对应于所述序列可变靶区组和所述表观遗传靶区组的映射的序列读段,以确定所述受试者具有癌症的可能性。[0119]实施方案61是实施方案60所述的方法,具有实施方案21-38中任一项所述的特征。[0120]实施方案62是实施方案60或61所述的方法,其中在获得所述多于一个序列读段和/或在同一测序池中测序之前,将所述序列可变靶区组的捕获的cfDNA分子与所述表观遗传靶区组的捕获的cfDNA分子汇集。[0121]实施方案63是实施方案60-62中任一项所述的方法,其中所述cfDNA在捕获之前被扩增,任选地,其中所述cfDNA扩增包括将包含条形码的衔接子与所述cfDNA连接的步骤。[0122]实施方案64是实施方案60-63中任一项所述的方法,其中所述表观遗传靶区组如实施方案15-19中任一项所述。[0123]实施方案65是实施方案60-64中任一项所述的方法,其中捕获所述cfDNA的多于一个靶区组包括使所述cfDNA与对所述序列可变靶区组特异性的靶结合探针和对所述表观遗传靶区组特异性的靶结合探针接触。[0125]通信接口,所述通信接口通过通信网络接收由核酸测序仪通过对捕获的cfDNA分子组进行测序而产生的多于一个序列读段,其中所述捕获的cfDNA分子组通过从cfDNA样品中捕获多于一个靶区组来获得,其中所述多于一个靶区组包括序列可变靶区组和表观遗传靶区组,其中对应于所述序列可变靶区的捕获的cfDNA分子被测序至比对应于所述表观遗[0126]控制器,所述控制器包括或能够访问包括非暂时性计算机可执行指令的计算机可读介质,所述指令在由至少一个电子处理器执行时进行一种方法,所述方法包括:[0127](i)通过所述通信网络接收由所述核酸测序仪产生的序列读段;[0128](ii)将所述多于一个序列读段映射至一个或更多个参考序列以产生映射的序列[0129](iii)处理对应于所述序列可变靶区组和所述表观遗传靶区组的映射的序列读段,以确定受试者具有癌症的可能性。[0130]实施方案67是实施方案66所述的系统,其中对应于所述序列可变靶区组的测序深度比对应于所述表观遗传靶区组的测序深度深至少2倍。[0131]实施方案68是实施方案66所述的系统,其中对应于所述序列可变靶区组的测序深度比对应于所述表观遗传靶区组的测序深度深至少3倍。[0132]实施方案69是实施方案66所述的系统,其中对应于所述序列可变靶区组的测序深度比对应于所述表观遗传靶区组的测序深度深4-10倍。[0133]实施方案70是实施方案66中任一项所述的系统,其中对应于所述序列可变靶区组的测序深度比对应于所述表观遗传靶区组的测序深度深4-100倍。[0134]实施方案71是实施方案66-70中任一项所述的系统,其中在测序之前,将所述序列可变靶区组的捕获的cfDNA分子与所述表观遗传靶区组的捕获的cfDNA分子汇集。[0135]实施方案72是实施方案66-71中任一项所述的系统,其中在同一测序池中对所述序列可变靶区组的捕获的cfDNA分子和所述表观遗传靶区组的捕获的cfDNA分子进行测序。[0136]实施方案73是实施方案66-72中任一项所述的系统,其中所述表观遗传靶区组包括超甲基化可变靶区组。[0137]实施方案74是实施方案66-73中任一项所述的系统,其中所述表观遗传靶区组包括低甲基化可变靶区组。[0138]实施方案75是实施方案72或73所述的系统,其中所述表观遗传靶区组包括甲基化对照靶区组。[0139]实施方案76是实施方案66-75中任一项所述的系统,其中所述表观遗传靶区组包括片段化可变靶区组。[0140]实施方案77是实施方案66-76中任一项所述的系统,其中所述片段化可变靶区组包括转录起始位点区。[0141]实施方案78是实施方案76或77所述的系统,其中所述片段化可变靶区组包括CTCF结合区。[0142]实施方案79是实施方案66-78中任一项所述的系统,其中所述表观遗传靶区组的足迹比所述序列可变靶区组的尺寸大至少2倍。[0143]实施方案80是实施方案79所述的系统,其中所述表观遗传靶区组的足迹比所述序列可变靶区组的尺寸大至少10倍。[0144]实施方案81是实施方案66-80中任一项所述的系统,其中所述序列可变靶区组的足迹是至少25kB或50kB。[0145]实施方案82是以上实施方案中任一项所述的方法或系统,其中捕获在单个容器中[0146]实施方案83是实施方案1-37中任一项所述的方法,其中所述测试受试者先前被诊断为患有癌症并接受了一种或更多种先前的癌症治疗,任选地,其中所述cfDNA在所述一种或更多种先前的癌症治疗之后的一个或更多个预选时间点获得。[0147]实施方案84是前一项实施方案所述的方法,所述方法还包括对所述捕获的cfDNA分子组进行测序,从而产生序列信息组。[0148]实施方案85是前一项实施方案所述的方法,其中所述序列可变靶区组的捕获的DNA分子被测序至比所述表观遗传靶区组的捕获的DNA分子更深的测序深度。[0149]实施方案86是实施方案84或85所述的方法,所述方法还包括使用所述序列信息组检测起源于或衍生自肿瘤细胞的DNA在预选时间点的存在或不存在。[0150]实施方案87是前一项实施方案所述的方法,所述方法还包括确定癌症复发评分,所述癌症复发评分指示起源于或衍生自所述测试受试者的肿瘤细胞的DNA的存在或不存在。[0151]实施方案88是前一项实施方案所述的方法,所述方法还包括基于所述癌症复发评分确定癌症复发状态,其中在癌症复发评分被确定为处于或高于预定阈值时,所述测试受试者的癌症复发状态被确定为处于癌症复发风险,或者在所述癌症复发评分低于所述预定阈值时,所述测试受试者的癌症复发状态被确定为处于较低的癌症复发风险。[0152]实施方案89是实施方案87或88所述的方法,所述方法还包括将所述测试受试者的癌症复发评分与预定的癌症复发阈值进行比较,并且在所述癌症复发评分高于所述癌症复发阈值时,所述测试受试者被分类为随后癌症治疗的候选者,或者在所述癌症复发评分低于所述癌症复发阈值时,所述测试受试者不被分类为随后癌症治疗的候选者。[0153]实施方案90是一种确定测试受试者中癌症复发风险的方法,所述方法包括:[0154](a)在对所述测试受试者进行一次或更多次先前的癌症治疗之后的一个或更多个预选时间点,从被诊断为患有癌症的测试受试者收集起源于或衍生自肿瘤细胞的DNA;[0155](b)从所述DNA捕获多于一个靶区组,其中所述多于一个靶区组包括序列可变靶区[0156](c)对捕获的DNA分子进行测序,其中所述序列可变靶区组的捕获的DNA分子被测序至比所述表观遗传靶区组的捕获的DNA分子更深的测序深度,从而产生序列信息组;[0157](d)使用所述序列信息组检测起源于或衍生自肿瘤细胞的DNA在预选时间点的存[0158](e)确定癌症复发评分,所述癌症复发评分指示起源于或衍生自所述测试受试者的肿瘤细胞的DNA的存在或不存在,其中在所述癌症复发评分被确定为处于或高于预定阈值时,所述测试受试者的癌症复发状态被确定为处于癌症复发风险,或者在所述癌症复发评分低于所述预定阈值时,所述测试受试者的癌症复发状态被确定为处于较低的癌症复发[0159]实施方案91是一种将测试受试者分类为随后癌症治疗候选者的方法,所述方法包[0160](a)在对所述测试受试者进行一次或更多次先前的癌症治疗之后的一个或更多个预选时间点,从被诊断为患有癌症的测试受试者收集起源于或衍生自肿瘤细胞的DNA;[0161](b)从所述DNA捕获多于一个靶区组,其中所述多于一个靶区组包括序列可变靶区[0162](c)对来自所述DNA分子组的多于一个捕获的DNA分子进行测序,其中所述序列可变靶区组的捕获的DNA分子被测序至比所述表观遗传靶区组的捕获的DNA分子更深的测序[0163](d)使用所述序列信息组检测起源于或衍生自肿瘤细胞的DNA在一个或更多个预选时间点的存在或不存在,[0164](e)确定癌症复发评分,所述癌症复发评分指示起源于或衍生自所述肿瘤细胞的[0165](f)将所述测试受试者的癌症复发评分与预定的癌症复发阈值进行比较,从而在所述癌症复发评分高于所述癌症复发阈值时,将所述测试受试者分类为随后癌症治疗的候选者,或者在所述癌症复发评分低于所述癌症复发阈值时,不将所述测试受试者分类为疗法的候选者。[0166]实施方案92是实施方案88-90所述的方法,其中所述测试受试者处于癌症复发的风险,并且被分类为随后癌症治疗的候选者。[0167]实施方案93是实施方案89、91或92中任一项所述的方法,其中所述随后癌症治疗包括化学疗法或施用治疗性组合物。[0168]实施方案94是实施方案90-93中任一项所述的方法,其中起源于或衍生自肿瘤细[0169]实施方案95是实施方案90-93中任一项所述的方法,其中起源于或衍生自肿瘤细[0170]实施方案96是实施方案87-95中任一项所述的方法,所述方法还包括基于所述癌症复发评分确定所述测试受试者的无病生存期(DFS)时间段。年或10年。[0172]实施方案98是实施方案84-97中任一项所述的方法,其中所述序列信息组包括序列可变靶区序列,并且确定所述癌症复发评分包括确定指示序列可变靶区序列中存在的突变数量足以使第一分项评分产生分类为癌症复发阳性的癌症复发评分,任选地其中所述[0174]实施方案100是实施方案84-99中任一项所述的方法,其中所述序列信息组包括表观遗传靶区序列,并且确定所述癌症复发评分包括确定指示所述表观遗传靶区序列中异常序列读段的量的第二分项评分。[0175]实施方案101是实施方案100所述的方法,其中异常序列读段包括指示超甲基化可变靶序列的甲基化的读段和/或指示片段化可变靶区中异常片段化的读段。[0176]实施方案102是实施方案101所述的方法,其中大于或等于0.001%-10%范围内的值的指示超甲基化可变靶区组中的超甲基化和/或片段化可变靶区组中的异常片段化的对应于超甲基化可变靶区组和/或片段化可变靶区组的读段的比例足以将第二分项评分分类为癌症复发阳性。[0177]实施方案103是实施方案102所述的方法,其中所[0178]实施方案104是实施方案102所述的方法,其中所述范围是0.01%-5%或0.01%-[0179]实施方案105是实施方案102所述的方法,其中所述范围是0.01%-1%。[0180]实施方案106是实施方案84-105中任一项所述的方法,所述方法还包括从所述序列信息组中指示一个或更多个指示起源于肿瘤细胞的特征的读段分数(fraction)中确定肿瘤DNA的分数。[0181]实施方案107是实施方案106所述的方法,其中指示起源于肿瘤细胞的一个或更多个特征包括序列可变靶区的改变、超甲基化可变靶区的超甲基化和片段化可变靶区的异常片段化中的一个或更多个。[0182]实施方案108是实施方案106或107所述的方法,所述方法还包括至少部分地基于肿瘤DNA的分数来确定癌症复发评分,其中大于或等于10⁻¹¹至1或10⁻¹⁰至1范围内的预定值的肿瘤DNA的分数足以将所述癌症复发评分分类为癌症复发阳性。[0183]实施方案109是实施方案108所述的方法,其中大于或等10⁻⁸至10⁻⁷、10⁻⁷至10⁻⁶、10⁻⁶至10⁻⁵、10⁻至10⁻4、10⁻⁴至10⁻³、10⁻³至10⁻²或10⁻²至10⁻¹范围内的预定值的肿瘤DNA的分数足以将所述癌症复发评分分类为癌症复发阳性。[0184]实施方案110是实施方案108或109所述的方法,其中所述预定值在10⁻至10⁶的范围内或者是10⁻⁷。[0185]实施方案111是实施方案107-110中任一项所述的方法,其中如果所述肿瘤DNA的则所述肿瘤DNA的分数被确定为大于或等于预定值。[0186]实施方案112是实施方案111所述的方法,其中所述累积概率是至少0.95。[0187]实施方案113是实施方案111所述的方法,其中所述累积概率在0.98-0.995的范围内或者是0.99。[0188]实施方案114是实施方案84-113中任一项所述的方法,其中所述序列信息组包括序列可变靶区序列和表观遗传靶区序列,并且确定所述癌症复发评分包括确定指示序列可变靶区序列中存在的SNV、插入/缺失、CNV和/或融合体的量的第一分项评分和确定指示表观遗传靶区序列中异常序列读段的量的第二分项评分,并且将所述第一分项评分和所述第二分项评分组合以提供所述癌症复发评分。[0189]实施方案115是实施方案114所述的方法,其中将所述第一分项评分和所述第二分项评分组合包括对每个分项评分独立地应用阈值(例如,在序列可变靶区中大于预定数量的突变(例如,>1),并且在表观遗传靶区中大于预定分数的异常(例如,肿瘤)读段),或者训练机器学习分类器以基于多于一个阳性和阴性训练样品来确定状态。[0190]实施方案116是实施方案115所述的方法,其中-4至2或-3至1范围内的组合评分的值足以将癌症复发评分分类为癌症复发阳性。[0191]实施方案117是实施方案83-116中任一项所述的方法,其中一个或更多个预选时间点选自由以下组成的组:施用一种或更多种先前的癌症治疗之后的1个月、2个月、3个月、[0192]实施方案118是实施方案83-117中任一项所述的方法,其中所述癌症是结肠直肠癌。[0193]实施方案119是实施方案83-118中任一项所述的方法,其中一种或更多种先前的癌症治疗包括手术。[0194]实施方案120是实施方案83-119中任一项所述的方法,其中一种或更多种先前的癌症治疗包括施用治疗性组合物。[0195]实施方案121是实施方案83-120中任一项所述的方法,其中一种或更多种先前的癌症治疗包括化学疗法。[0196]本文公开的方法的各步骤,或由本文公开的系统进行的步骤,可以在相同时间或不同的时间和/或在同一地理位置或不同的地理位置例如国家进行。本文公开的方法的各步骤可以由同一人员或不同的人员进行。附图说明[0197]并入本说明书并构成其一部分的附图示出了某些实施方案,并与书面描述一起用于解释本文公开的方法、计算机可读介质和系统的某些原理。当结合附图阅读时,本文提供的描述被更好地理解,附图以实例的方式而非限制的方式被包括在内。应当理解,除非上下文另有说明,否则在所有附图中,相同的附图标记表有附图可以是出于说明目的的示意图,并不一定描绘所示元件的实际相对尺寸或位置。[0198]图1示出了分区方法的概述。[0199]图2是适用于本公开内容的一些实施方案的系统实例的示意图。[0200]图3示出了在如实施例ii中描述的液体活检测试中使用表观遗传靶区和序列可变靶区中的一个或两个来检测不同阶段的癌症的灵敏度。[0201]图4示出了如实施例iii中描述被检测到或未被检测到ctDNA的受试者随时间的无复发生存期。具体实施方式[0202]现在将详细述及本发明的某些实施方案。虽然将结合这些实施方案描述本发明,但是应当理解,它们并不意图使本发明受限于这些实施方案。相反,意图本发明覆盖所有替代、修改和等同方案,它们可以被包括在如由所附权利要求书定义的本发明内。[0203]在详细描述本教导之前,应当理解,本公开内容不限于特定的组合物或工艺步骤,因为这些可以变化。应该注意的是,除非上下文另外明确规定,否则如本说明书和所附的权及“核酸(anucleicacid)”包括多于一个核酸,提及“细胞(acell)”包括多于一个细胞,[0204]数值范围包括限定该范围的数字。考虑到有效数字和与测量相关联的误差,测量般描述和详细描述二者仅是示例性的和说明性的,而不是限制本教导。[0205]除非在以上说明书中特别指出,否则说明书中叙述“包含(comprising)”各种组分利要求中这些术语的使用)。[0206]本文使用的章节标题用于组织目的,并且不被解释为以任何方式限制所公开的主题。如果通过引用并入的任何文件或其他材料与本说明书的任何明确内容(包括定义)相矛[0208]“无细胞DNA(Cell-freeDNA)”、“cfDNA分子”或简称为“cfDNA”包括以细胞外形式(例如,在血液、血清、血浆或其他体液诸如淋巴、脑脊液、尿液或痰中)存在于受试者中的DNA分子,并且包括不包含在细胞内或不以其他方式与细胞结合的DNA。虽然DNA最初存在于大型复杂生物的生物体(例如,哺乳动物)的一个或更多个细胞中,但DNA已经经历从一个或更多个细胞释放到存在于生物体中的流体中。通常,可以通过获得流体样品获得cfDNA,而无需进行体外细胞裂解步骤,并且还包括去除流体中存在的细胞(例如,离心血液以去除细胞)。[0209]探针集合对于给定靶区组的“捕获产量”是指在典型条件下集合捕获的对应于靶区组的核酸的量(例如,相对于另一靶区组的量或绝对量)。示例性典型捕获条件是样品核酸和探针在包含严格杂交缓冲液的小反应体积(约20μL)中于65℃孵育10-18小时。捕获产量可以以绝对性术语表示,或者对于多于一个探针集合,可以以相对性术语表示。在比较对于多于一个靶区组的捕获产量时,将它们针对靶区组的足迹尺寸(例如,基于每千碱基)进行归一化。因此,例如,如果第一靶区和第二靶区的足迹尺寸分别是50kb和500kb(给出0.1的归一化因子),则在对应于第一靶区组的捕获的DNA的质量/体积浓度多于对应于第二靶区组的捕获的DNA的质量/体积浓度的0.1倍时,对应于第一靶区组的DNA以比对应于第二靶区组的DNA高的产量被捕获。作为另外的实例,使用相同的足迹尺寸,如果对应于第一靶区组的捕获的DNA具有的质量/体积浓度为对应于第二靶区组的捕获的DNA的质量/体积浓度的0.2倍,则对应于第一靶区组的DNA以比对应于第二靶区组的DNA高两倍的捕获产量被捕获。[0210]“捕获”或“富集”一种或更多种靶核酸是指优先将一种或更多种靶核酸与非靶核酸分离(isolating)或分开(separating)。[0212]“靶区组(target-regionset)”或“靶区组(setoftargetregions)”或“靶区”是指被靶向用于捕获和/或被探针组靶向(例如,通过序列互补性)的多于一个基因组基因座或多于一个基因组区。[0213]“对应于靶区组”意指核酸,诸如cfDNA,起源于靶区组中的基因座或一种或更多种探针特异性结合靶区组。[0214]在探针或其他寡核苷酸和靶序列的上下文中,“特异性结合”意指在适当的杂交条件下,寡核苷酸或探针与其靶序列或其复制品杂交,以形成稳定的探针:靶杂交体,同时稳定的探针:非靶杂交体的形成被最小化。因此,探针与靶序列或其复制品以比与非靶序列大得多的程度杂交,从而能够捕获或检测靶序列。适当的杂交条件是本领域熟知的,可以基于序列组成进行预测,或者可以通过使用常规测试方法来确定(参见,例如,Sambrook等人,MolecularCloning,ALaboratoryManual,第2版(ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY,1989)在SS1.90-1.91、7.37-7.57、9.47-9.51和11.47-11.57,特别是SS9.50-9.51、11.12-11.13、11.45-11.47和11.55-11.57,通过引用并入本[0215]“序列可变靶区组”是指在赘生性细胞(例如,肿瘤细胞和癌细胞)中可能表现出序[0216]“表观遗传靶区组”是指在赘生性细胞(例如,肿瘤细胞和癌细胞)和非肿瘤细胞(例如,免疫细胞、来自肿瘤微环境的细胞)中可能表现出非序列修饰的靶区组。这些修饰不转录起始位点、调节蛋白结合区和任何其他可能与DNA结合的蛋白的改变(增加或减少)。出于本发明的目的,对赘生物、肿瘤或癌症相关的聚焦扩增和/或基因融合敏感的基因座也可以被包括在表观遗传靶区组中,因为通过测序或映射至参考基因组中多于一个基因座的融合序列对拷贝数改变的检测倾向于更类似于对以上讨论的示例性表观遗传改变的检测,而不是对核苷酸取代、插入或缺失的检测,例如,因为聚焦扩增和/或基因融合可以在相对浅的测序深度处被检测到,这是因为它们的检测不依赖于一个或若干单独位置处碱基调用的准确度。例如,表观遗传靶区组可以包括用于分析片段长度或片段终点位置分布的靶区组。[0217]循环肿瘤DNA或ctDNA是起源于肿瘤细胞或癌细胞的cfDNA组分。在一些实施方案于肿瘤的赘生性细胞,不管它们是保持在肿瘤中还是变成与肿瘤分开(如,例如在转移性癌细胞和循环肿瘤细胞的情况下)。[0218]术语“超甲基化”是指核酸分子群体(例如样品)内一种或更多种核酸分子相对于其他核酸分子的甲基化水平或程度增加。在一些实施方案中,超甲基化DNA可以包括包含至少1个甲基化残基、至少2个甲基化残基、至少3个甲基化残基、至少5个甲基化残基、至少10个甲基化残基、至少20个甲基化残基、至少25个甲基化残基或至少30个甲基化残基的DNA分[0219]术语“低甲基化”是指核酸分子群体(例如样品)内一种或更多种核酸分子相对于其他核酸分子的甲基化水平或程度减少。在一些实施方案中,低甲基化DNA包括非甲基化基、至多2个甲基化残基、至多3个甲基化残基、至多4个甲基化残基或至多5个甲基化残基的[0220]如本文使用的术语“或其组合(acombinationthereof)”和“或其组合从上下文另外显然,否则本领域技术人员将理解,通常不存在对任何组合中的项目或术语的数目限制。[0222]II.示例性方法[0223]本文提供了分离无细胞DNA(cfDNA)和/或鉴定由肿瘤(或赘生性细胞或癌细胞)产[0224]在一些实施方案中,该方法包括针对多于一个靶区组捕获从测试受试者获得的cfDNA。靶区包括表观遗传靶区,根据表观遗传靶区是起源于肿瘤还是来自健康细胞,它们可以显示甲基化水平和/或片段化模式的差异。靶区还包括序列可变靶区,根据序列可变靶区是起源于肿瘤还是来自健康细胞,它们可以显示出序列上的差异。捕获步骤产生捕获的cfDNA分子组,并且在捕获的cfDNA分子组中对应于序列可变靶区组的cfDNA分子以比对应于表观遗传靶区组的cfDNA分子更高的捕获产量被捕获。[0225]在一些实施方案中,该方法包括使从测试受试者获得的cfDNA与靶特异性探针组接触,其中靶特异性探针组被配置为以比对应于表观遗传靶区组的cfDNA更高的捕获产量捕获对应于序列可变靶区组的cfDNA。[0226]以比对应于表观遗传靶区组的cfDNA更高的捕获产量捕获对应于序列可变靶区组的cfDNA可以是有益的,因为以足够的置信度或准确度分析序列可变靶区可能需要比分析表观遗传靶区更深的测序深度。测序的更深的深度可以导致每个DNA分子更多的读段,并且可以通过每个区域捕获更多独特的分子来促进测序。确定片段化模式(例如,测试转录起始位点或CTCF结合位点的扰动)或片段丰度(例如,在高甲基化和低甲基化分区中)所需的数据量通常少于确定癌症相关序列突变的存在或不存在所需的数据量。以不同的产量捕获靶区组可以促进在同一测序运行中(例如,使用汇集的混合物和/或在同一测序池中)将靶区测序至不同的测序深度。[0227]在多种实施方案中,该方法还包括,例如,对于表观遗传靶区组和序列可变靶区[0229]在一些实施方案中,本文公开的方法包括捕获DNA诸如cfDNA的一个或更多个靶区组的步骤。可以使用本领域已知的任何合适的方法来进行捕获。[0230]在一些实施方案中,捕获包括使待捕获的DNA与靶特异性探针组接触。靶特异性探针组可以具有本文针对靶特异性探针组(setsoftarget-specificprobes)描述的任何特征,包括但不限于以上阐释的实施方案和下文与探针相关联的部分。[0231]捕获步骤可以使用适于特异性核酸杂交的条件进行,这通常在某种程度上取决于探针的特征,诸如长度、碱基组成等。本领域技术人员将熟悉本领域已知的关于核酸杂交的[0232]在一些实施方案中,将靶特异性探针和DNA的复合物与未与靶特异性探针结合的DNA分开。例如,在靶特异性探针与固体支持物共价或非共价结合的情况下,可以使用洗涤或抽吸步骤来分开未结合的物质。可选地,在复合物具有不同于未结合材料的层析特性的情况下(例如,在探针包含结合层析树脂的配体的情况下),可以使用层析。[0233]如本文别处详细讨论的,靶特异性探针组可以包括多于一组,诸如用于序列可变靶区组的探针和用于表观遗传靶区组的探针。在一些这样的实施方案中,捕获步骤用用于序列可变靶区组的探针和用于表观遗传靶区组的探针同时在同一容器中进行,例如,用于序列可变靶区组的探针和用于表观遗传靶区组的探针处于同一组合物中。这种方法提供了相对简化的工作流程。在一些实施方案中,用于序列可变靶区组的探针浓度大于用于表观遗传靶区组的探针浓度。[0234]可选地,捕获步骤用第一容器中的序列可变靶区探针组和用第二容器中的表观遗传靶区探针组进行,或者接触步骤用在第一时间和第一容器的序列可变靶区探针组和在第一时间之前或之后的第二时间的表观遗传靶区探针组进行。这种方法允许制备单独的第一组合物和第二组合物,所述第一组合物和第二组合物包含对应于序列可变靶区组的捕获的别处描述基于甲基化进行分级分离)并以适当的比例重组,以提供用于进一步处理和分析诸如测序的材料。接子序列而在3‘末端具有随机碱基的随机引物。通常存在6个随机碱基,但长度可以在4个与9个碱基之间。这种方法适用于低输入/单细胞扩增和/或亚硫酸氢盐测序。过在引物的5‘部分提供衔接子与扩增程序同时进行。可选地,可以通过其他方法诸如连接添加衔接子。[0237]在一些实施方案中,标签(其可以是或包括条形码)被包括在DNA中。标签可以促进鉴定核酸的来源。例如,条形码可以用于允许在汇集多于一个样品进行并行测序之后,鉴定分提供条形码与扩增程序同时进行。在一些实施方案中,衔接子和标签/条形码由相同的引物或引物组提供。例如,条形码可以位于衔接子的3‘侧和引物的靶杂交部分的5‘侧。可选地,条形码可以通过其他方法,诸如连接,任选地与衔接子一起在同一连接底物中添加。[0238]关于扩增、标签和条形码的另外的细节在下文的“方法的一般特征”部分中讨论,其可以在可行的程度上与任何前述实施方案和在简介和概述部分中阐述的实施方案组合。在如本文描述的捕获和/或分离步骤之后,可以提供捕获的DNA组。捕获的组可以包括对应于序列可变靶区组和表观遗传靶区组的DNA。在一些实施方案中,在针对靶向区域的尺寸(足迹尺寸)的差异进行归一化时,捕获的序列可变靶区DNA的量大于捕获的表观遗传靶区[0241]可选地,可以提供分别包括对应于序列可变靶区组的DNA和对应于表观遗传靶区组的DNA的第一捕获的组和第二捕获的组。第一捕获的组和第二捕获的组可以被组合以提供组合的捕获的组。[0242]在包括对应于序列可变靶区组和表观遗传靶区组的DNA的捕获的组(包括如以上讨论的组合的捕获的组)中,对应于序列可变靶区组的DNA可以以比对应于表观遗传靶区组1.6倍的浓度、高1.6倍至1.8倍的浓度、高12.2倍至2.4倍的浓度、高2.4倍至2.6倍的浓度、高2.6倍至2.8倍的浓度、高2.8倍至3.0倍的浓度、高3.0倍至3.5倍的浓度、高3.5倍至4.0的浓度、高4.0倍至4.5倍的浓度、高4.5倍至5.0倍的浓度、高5.0倍至5.5倍的浓度、高5.5倍至6.0倍的浓度、6.5倍至7.0倍的浓度、高7.0倍至7.5倍的浓度、高7.5倍至8.0倍的浓度、8.0倍至8.5倍的浓度、8.5倍至9.0倍的浓度、高9.0倍至9.5倍的浓度、高9.5倍至10.0倍的浓的浓度、高11倍至12倍的浓度、高12倍至13倍的浓度、高13倍至14倍的浓度、高14倍至15倍的浓度、高15倍至16倍的浓度、高16倍至17倍的浓度、高17倍至18倍的浓度、18倍至19倍的浓度或高19倍至20倍的浓度。浓度的差异程度说明了针对靶区足迹尺寸的归一化,如定义部分讨论的。[0243]a.表观遗传靶区组[0244]表观遗传靶区组可以包括一种或更多种类型的靶区,这些靶区可能将来自赘生性(例如,肿瘤或癌症)细胞的DNA与来自健康细胞(例如,非赘生性循环细胞)的DNA区分开。这里详细讨论了这样的区域的示例性类型。在一些实施方案中,根据本公开内容的方法包括确定对应于表观遗传靶区组的cfDNA分子是否包含或指示癌症相关的表观遗传修饰(例如,在一个或更多个超甲基化可变靶区中的超甲基化;CTCF结合的一个或更多个扰动;和/或转录起始位点的一个或更多个扰动)和/或拷贝数变化(例如,聚焦扩增)。表观遗传靶区组也可以包括例如,如本文描述的一个或更多个对照区。[0245]在一些实施方案中,表观遗传靶区组具有至少100kb,例如,至少200kb、至少300kb或至少400kb的足迹。在一些实施方案中,表观遗传靶区组具有在以下范围内的足迹:100-800kb、800-900kb和900-1,000kb。[0246]i.超甲基化可变靶区[0247]在一些实施方案中,表观遗传靶区组包括一个或更多个超甲基化可变靶区。通常,超甲基化可变靶区是指观察到的甲基化水平的增加指示样品(例如,cfDNA样品)包含由赘生性细胞(诸如,肿瘤或癌细胞)产生的DNA的可能性增加的区域。例如,已经重复观察到肿中引用的参考文献。[0248]对结肠直肠癌中甲基化可变靶区的广泛讨论提供于以下中:Lam等人,Biochim基于结肠直肠癌(CRC)研究的基因或其部分的示例性超甲基化可变靶区组提供于表1中。这些基因中的许多可能与结肠直肠癌以外的癌症相关联;例如,TP53被广泛认为是至关重要的肿瘤抑制因子,并且这种基因基于超甲基化的失活可能是常见的致癌机制。[0249]表1.基于CRC研究的示例性超甲基化靶区(基因或其部分)。另外的基因[0251]在一些实施方案中,超甲基化可变靶区包含表1中列出的多于一个基因或其部分,例如表1中列出的基因或其部分的至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。例如,对于作为靶区包括的每个基因座,可能存在一种或更多种探针,该一种或更多种探针具有在基因的转录起始位点与终止密码子(选择性剪接的基因的最后终止密码子)之间结合的杂交位点。在一些实施方案中,一种或更多种探针在表1中列出的基因或其部分的上游和/或下游300bp内,例如,在200bp或100bp内结合。[0252]在各种类型的肺癌中的甲基化可变靶区被详细讨论于以下中:例如,Ooki等人,Clin.CancerRes.23:7141-52(2017);Belinksy,Annu.Rev.Physiol.77:453-74(2015);5(5):492-504(2016);SkvortClin.CancerRes.11:[0253]包含基于肺癌研究的基因或其部分的示例性超甲基化可变靶区组提供于表2中。这些基因中的许多可能与肺癌以外的癌症相关联;例如,Casp8(胱天蛋白酶8)是程序性细胞死亡的关键酶,并且这种基因基于超甲基化的失活可能是不限于肺癌的常见的致癌机[0254]表2.基于肺癌研究的示例性超甲基化靶区(基因或其部分)基因名称染色体E-钙粘蛋白H-钙粘蛋白以上描述实施方案组合。在一些实施方案中,超甲基化可变靶区包含表1或表2中列出的多于一个基因或其部分,例如表1或表2中列出的基因或其部分的至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。[0257]另外的超甲基化靶区可以从例如癌症基因组图谱中获得。Kang等人,Genome定位器(CancerLocator)的概率方法的构建。在一些实施方案中,超甲基化靶区可以对一种或更多种类型的癌症是特异性的。因此,在一些实施方案中,超甲基化靶区包括一个、两[0258]ii.低甲基化可变靶区[0259]整体低甲基化是各种癌症中通常观察到的现象。参见,例如,Hon等人,GenomeRes.22:246-258(2012年)(乳腺癌);Ehrlich,Epigenomics1:239-259(2009)(综述文章注在健康细胞中通常甲基化的区域,诸如重复元件,例如LINE1元件、Alu元件、着丝粒串联重复序列、着丝粒周围串联重复序列和卫星DNA以及基因间区域,可能在肿瘤细胞中显示甲基化降低。因此,在一些实施方案中,表观遗传靶区组包括低甲基化可变靶区,其中观察到的甲基化水平的减少指示样品(例如,cfDNA样品)包含由赘生性细胞(例如,肿瘤或癌细胞)产[0260]在一些实施方案中,低甲基化可变靶区包括重复元件和/或基因间区域。在一些实施方案中,重复元件包括LINE1元件、Alu元件、着丝粒串联重复序列、着丝粒周围串联重复[0261]例如,根据hg19或hg38人类基因组构建体,显示癌症相关低甲基化的示例性特定基因组区域包括人类染色体1的核苷酸8403565-8953708和151104701-151106035。在一些实施方案中,低甲基化可变靶区与这些区域中的一个或两个重叠或包含这些区域中的一个或两个。[0263]CTCF是对染色质组织有贡献的DNA结合蛋白,并且通常与黏连蛋白共定位。CTCF结合位点的扰动已经在多种不同的癌症中被报道。参见,例如,2015年6月8日在线发布的(2018)CTCF结合在cfDNA中产生可以通过测序,例如通过片段长度分析检测的可识别的模式。例如,关于基于测序的片段长度分析的细节提

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论