WO2025140181A1 同时分析遗传信息和表观遗传信息的方法 (厦门艾德生物医药科技股份有限公司)_第1页
WO2025140181A1 同时分析遗传信息和表观遗传信息的方法 (厦门艾德生物医药科技股份有限公司)_第2页
WO2025140181A1 同时分析遗传信息和表观遗传信息的方法 (厦门艾德生物医药科技股份有限公司)_第3页
WO2025140181A1 同时分析遗传信息和表观遗传信息的方法 (厦门艾德生物医药科技股份有限公司)_第4页
WO2025140181A1 同时分析遗传信息和表观遗传信息的方法 (厦门艾德生物医药科技股份有限公司)_第5页
已阅读5页,还剩126页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(19)世界知识产权组织(43)国际公布日(51)国际专利分类号:C12Q1/6806(2018.01)C40B50/06(2006.01)C12Q1/6869(2018.01)C(21)国际申请号:PCT/CN2024/1(22)国际申请日:2024年12月24日(24.12.2024)(25)申请语言:中文(26)公布语言:中文(30)优先权:(71)申请人:厦门艾德生物医药科技股份有限公路138号3幢202室201100(CN)。(72)发明人:余佶彦(YU,Jiyan);中国上海市闵行区新(YANG,Chunhe);中国上海市闵行区新骏环路138号3幢202室201100(CN)。朱新涛(ZHU,Xintao);(CN)。杨爽(YANG,Shuang);中国上海市闵行区新骏环路138号3幢202室201100(CN)。郑方鼎山路39号361027(CN)。罗捷敏(LUO,Jiemin);中国福建省厦门市海沧区鼎山路39号361027(CN)。郑立谋(ZHENG,Limou);中国福建省厦门市海沧区鼎山路39号361027(CN)。OFFICE);中国北京市西城区复兴门内大街158号远洋大厦F10层100031(CN)。(81)指定国(除另有指明,要求每一种可提供的国家BH,BN,BR,BW,BY,BZ,CA,CH,CL,CN,CCV,CZ,DE,DJ,DK,DM,DO,DZ,EC,EGB,GD,GE,GH,GM,GT,HN,HR,HU,IDIR,IS,IT,JM,JO,JP,KE,KG,KH,KN,KP,KLA,LC,LK,LR,LS,LU,LY,MA,MD,MGMU,MW,MX,MY,MZ,NA,NG,NI,NO,NZ,PE,PG,PH,PL,PT,QA,RO,RS,RU,RW,SASE,SG,SK,SL,ST,SV,SY,TH,TJUA,UG,US,UZ,VC,VN,WS,ZA,ZM(84)指定国(除另有指明,要求每一种可提供的地区NA,RW,SC,SD,SL,ST,SZ,TZ,UG,ZM,ZW),欧亚(AM,AZ,BY,KG,KZ,RU,TJ,TM),欧洲(AL,AT,BE,BG,CH,CY,CZ,DE,DK,EE,ES,FI,FR,GBHU,IE,IS,IT,LT,LU,LV,MC,ME,MK,MTPL,PT,RO,RS,SE,SI,SK,SM,TR),OAPI(BFCG,CI,CM,GA,GN,GQ,GW,KM,ML本国际公布:一包括国际检索报告(条约第21条(3))。一包括说明书序列表部分(细则5.2(a))。(54)发明名称:同时分析遗传信息和表观遗传信息的方法(57)摘要:本发明涉及一种制备双链核酸分子的方法,一种制备DNA文库的方法,以及一种分析表观遗传信息和/或遗传信息的方法。此外,本发明还涉及由所述方法分别制备的双链核酸分子和DNA文库。1WO2025/140181同时分析遗传信息和表观遗传信息的方法本申请要求2023年12月28日提交的中国专利申请202311842967.X的优先权,这些5专利申请的全部内容以引用的方式整体并入本文。技术领域本发明涉及一种制备双链核酸分子的方法,一种制备DNA文库的方法,以及一种分析表观遗传信息和/或遗传信息的方法。此外,本发明还涉及由所述方法分别制备的双链背景技术基因突变是指DNA序列发生变化,包括点突变、插入、缺失等。基因突变是一种重要的遗传变异形式,对于生物体的生长、发育和疾病发生等方面都具有重要的作用。基15因突变检测对于研究疾病发生机理、诊断疾病、制定个体化治疗方案等方面具有重要的意义。例如,在肿瘤研究中,基因突变检测可以用于筛选肿瘤相关基因的突变,评估肿瘤的发生和发展过程,并针对不同的突变类型制定个体化治疗方案。在遗传病研究中,基因突变检测可以用于确定遗传病的致病基因和突变类型,为家族遗传性疾病的预防和治疗提供重要的依据。现代基因突变检测技术包括Sanger测序、PCR扩增测序、Ne20GenerationSequencing(NGS)等方法,这些技术具有高度的灵敏度和特异性,可以同时检测多个基因的突变,并且可以快速、准确地诊断疾病。基因甲基化是一种表观遗传学修饰,是指DNA分子上的甲基基团(CH3)与胞嘧啶环上的5位碳原子发生共价键结合的过程。基因甲基化在基因表达、细胞分化、发育和疾病等方面都具有重要的作用。尤其对于了解基因调控机制、研究疾病发生机理、评估疾25病风险和制定个体化治疗方案等方面具有重要的意义。目前基因突变和基因甲基化检测广泛应用于肿瘤早期诊断、肿瘤分型、预后评估和治疗效果监测等方面并带来显著的临床增益。基因甲基化因其良好的诊断性能和组织溯源性能得到越来越多的重视。但是当前市场上检测产品主要分为两大类,一类是基于qPCR、Sanger与NGS的技术检测基因突变信息,一类是基于以上技术检测基因甲基化30信息,鲜少有基于荧光定量PCR方法学的产品能同时进行基因突变和基因甲基化检测分25WO2025/140181PCT/CN2024/141792析。导致以上问题的主要原因是现有的检测技术无法实现一份样本同时检测基因突变和基因甲基化。目前比较常规的做法是基因突变和甲基化分管进行检测,该过程会消耗大量的模板DNA,同时操作复杂性和检测成本显著增加,在临床上往往难以应用推广。目前,同时进行基因甲基化和基因突变检测需要分别构建甲基化和突变文库,需要使用更多原始投入的DNA样本,同时需要甲基化文库构建和突变文库构建两个湿实验流程。但是血浆游离DNA、FFPE小样本DNA、单细胞DNA等特殊应用场景中,样本来源的DNA往往非常有限,无法满足分别建库的需求。因此,提供一种能够通过一份样本/一个流程,实现同时检测遗传信息和表观遗传信本申请的发明人经过大量的研究,获得了能够利用同一靶核酸同时收集遗传信息和表观遗传信息的方法,进一步的还获得了利用同一靶核酸同时进行基因组测序和甲基化组测序的方法。该方法能够显著的降低基因组测序结果中出现的假阳性事件概率,大大(a-1)提供至少一种单链靶核酸,以及包含腺嘌呤(A)、胞嘧啶(C)、鸟嘌(b-1)在允许合成所述单链靶核酸的互补链的条件下,使所述单链靶核酸与所述核在本发明的方法中,在允许合成所述单链靶核酸的互补链的条件下,单链靶核酸与所述核苷酸混合物接触后,将以单链靶核酸(即,第一链)为模板,合成单链靶核酸的互补链(即,第二链)。进一步,由于核苷酸混合物中的胞嘧啶包含或由丙炔基修饰的胞嘧啶组成,所以单链靶核酸的互补链(即,第二链)中包含丙炔基修饰的胞嘧啶。而所述单链靶核酸(即,第一链)中包含的胞嘧啶是不带有修饰的胞嘧啶。因此,在某些实施方案中,所述核酸分子的互补链(即,第二链)的部分或全部胞嘧啶对胞嘧啶转化WO2025/1401813具有抗性。即,在胞嘧啶转化过程中,核酸分子的互补链(即,第二链)中的丙炔基修如本文中所使用的,表述“允许合成所述单链靶核术人员通常理解的含义,其是指,允许核酸聚合酶(例如DNA聚合酶)以一条核酸链5(即,所述单链靶核酸)为模板合成另一条核酸链,并形成双链体的条件。此类条件是本领域技术人员熟知的,并且可涉及下列因素:温度,杂交缓冲液的pH值、成分、浓度和离子强度等。可通过常规方法来确定合适的条件(参见例如JosephSambrook,etal.,MolecularCloning,ALaboratoryManual,ColdSpringHarborLaborator10条件”优选地为核酸聚合酶(例如DNA聚合酶)的工作条件。在某些实施方案中,所述胞嘧啶还包含其他(例如,甲基,羟甲基,羧基,卤代)在某些实施方案中,所述丙炔基修饰的胞嘧啶还具有一种或多种其他(例如,甲基,15羟甲基,羧基,卤代)修饰。20在某些实施方案中,所述胞嘧啶包含或由修饰的胞嘧啶组成,其中,所述修饰的胞嘧啶中包含至少10%(例如,至少10%,至少20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,至少95%,至少99%)的5-丙炔基胞嘧在某些实施方案中,所述修饰的胞嘧啶中包含至少50%,60%,70%,80%,90%,2595%或99%的5-丙炔基胞嘧啶。WO2025/140181PCT/CN2024/1417924靶核酸在某些实施方案中,所述靶核酸是DNA(例如,基因组DNA,cfDNA)和/或RNA。在某些实施方案中,所述单链靶核酸是天然存在的单链核酸,或者源自双链核酸中5在某些实施方案中,所述方法还包括:从样品中获得单链靶核酸,或从样品中获得从细胞或从由细胞构成的生物组织中提取和/或纯化核酸(例如,基因组DNA)的方法是本领域公知的,技术人员能够根据生物组织来选用合适的方法或商业试剂盒。在一些实施方案中,从组织中提取核酸(例如,基因组DNA)需要进行细胞破碎或10细胞裂解。在此类实施方案中,可以通过化学和物理方法,例如混合、研磨或超声处理组织样品;也可以通过添加用于细胞裂解的洗涤剂或表面活性剂去除膜脂质,例如通过添加蛋白酶去除蛋白质;例如通过添加RNase,去除RNA。核酸(例如,基因组DNA)在某些实施方案中,所述样品或靶核酸获自原核生物,真核生物(例如原生动物,寄生虫,真菌,酵母,植物,动物包括哺乳动物和人类)或病毒(例如Herpes病毒,HIV,流感病毒,EB病毒,肝炎病毒,脊髓灰质炎病毒等)或类病毒。20在某些实施方案中,所述样品选自全血,血清,血浆,脑脊液,痰,粪便,尿液,唾液,汗液,泪液,耳流出物,淋巴液,灌洗液,骨髓悬液,阴道流出物,经宫颈灌洗液,腹水,乳液,呼吸道,肠道和泌尿生殖道的分泌物,羊水,或其任意组合。在某些实施方案中,样品是通过非侵入性方法可容易获得的样品,例如全血、血浆、血清、汗液、泪液、痰、尿液、耳流出物、唾液或排泄物。在某些实施方案中,样品25是外周血样品、或外周血样品的血浆和/或血清级分。在某些实施方案中,样品是拭子或涂片、活检样本或细胞培养物。在某些实施方案中,样品是两种或更多种样品的混合物,例如样品可以包含生物流体样品、组织样品和细胞培养物样品中的两种或更多似地,在样品取自活检、拭子、涂片等的情况下,“样品”明确涵盖来源于活检、拭子、30涂片等的经处理的级分或部分。WO2025/1401815虽然样品通常取自受试者(例如,患者),但也可以获自任何哺乳动物(包括但不限于犬、猫、马、山羊、绵羊、牛、猪等),以及混合群体(如来自野外的微生物群体或来样品可以从生物来源获得后直接使用,或者经过预处理以改变样品的特性后使用。5例如,此类预处理可以包括血液制备血浆、稀释粘性流体等。预处理的方法还可以包括但不限于过滤、沉淀、稀释、蒸馏、混合、离心、冷冻、冻干、浓缩、扩增、核酸片段化、干扰组分的灭活、试剂的添加、裂解等。如果对于样品采用此类预处理方法,则此类预处理方法通常使得靶核酸保留在测试样品中。在某些实施方案中,所述方法在步骤(b-1)之前还包括:(a-2)在本发明的方法中,在允许核酸连接的条件下,使所述单链靶核酸与所述接头和连在某些实施方案中,所述连接酶选自T4DNA连接酶,T3DNA连接酶,T7DNA连在某些实施方案中,所述接头的3'-末端是封闭的;例如,通过在单链接头的最后一个核苷酸的3'-OH上添加化学部分(例如,生物素或烷基),通过将探针的最后一个核苷酸的3'-OH去除,或者将所述最后一个核苷酸替换为双脱氧核苷酸,从而封闭接头的单链接头在某些实施方案中,所述单链接头包含:第一互补序列,以及与所述第一互补序列6WO2025/140181在某些实施方案中,所述接头还包含:连接所述第一互补序列和第二互补序列的连在某些实施方案中,所述连接序列位于所述第一互补序列的下游。在某些实施方案中,所述第二互补序列位于所述连接序列的下游。5在某些实施方案中,在允许核酸杂交或退火的条件下,所述接头呈茎环状。在某些实施方案中,所述接头含有1个或多个(例如,2个,3个,4个,5个)在某些实施方案中,所述1个或多个Spacer位于接头的连接序列中。在某些实施方案中,所述单链接头还包含1个或多个(例如,2个,3个,4个,5个)15如本文所用的,术语“可切割部分”是指核酸中包含的任何可切割或可切除的部分。例如,可切割部分可以包含尿嘧啶、核糖核苷酸或其他可以使用核酸切割剂(例如,在某些实施方案中,所述核酸切割剂能够对接头中的可切割部分进行切割。在某些实施方案中,所述核酸切割剂选自尿嘧啶DNA糖基化20呤核酸内切酶(APE)、核酸内切酶(例如,核酸内切酶VIII(EndoVIII)或V(EndoV))、尿嘧啶特异性切除试剂(USER)酶、甲酰胺嘧啶DNA糖基化酶(Fpg)、8-氧代鸟嘌呤糖基可以理解,当所述接头中包含不同的可切割部分,可以选取多对应的核酸切割剂进25在某些实施方案中,当所述可切割部分包含核糖核苷酸(例如,胸腺嘧啶核糖核酸),所述核酸切割剂包含RNA酶(例如,核糖核酸酶H(RNaseH))。在某些实施方案中,当所述可切割部分包含尿嘧啶脱氧核糖核酸,所述核酸切割剂包含UDG或USER酶。在某些实施方案中,所述第二互补序列中包含至少1个可切割部分,或者,第二互补30序列的3'端与至少1个可切割部分连接。WO2025/1401817在某些实施方案中,所述第二互补序列的3'端与尿嘧啶脱氧核糖核酸或核糖核苷酸在某些实施方案中,所述连接序列中还包含1个或多个(例如,2个,3个,4个,5个)可切割部分。在某些实施方案中,所述连接序列中包含2个可切割部分,所述2个可切割部分分别邻接于Spacer的两侧。核酸的一个或多个核苷酸序列,其可用于将不同的核苷酸序列彼此区分开来。使用UMI在某些实施方案中,所述UMI选自随机UMI,非随机UMI,或其任意组合。在某些实施方案中,所述随机UMI包含4-28bp(例如,4-10bp,10-16bp,16-22包含多种(例如,4,8,16,32,64,96,或更多种)4-28bp(例如,4-10bp,10-16bp,16-22bp,22-28bp)的特定序列。在某些实施方案中,每个非随机UMI与其它非随机UMI在其相应序列位置上相差至少1个(例如,1个,2个,3个,4个)核苷酸。20在某些实施方案中,所述单链接头包含4-10bp(例如,4bp,5bp,6bp,7bp,8bp,在某些实施方案中,所述连接序列中不包含可切割部分。在某些实施方案中,所述30在某些实施方案中,所述连接序列中包含可切割部分。在某些实施方案中,所述单WO2025/1401818双链接头在某些实施方案中,所述双链接头包含:第一寡核苷酸链,和第二寡核苷酸链;其5中,所述第一寡核苷酸链包含第一杂交序列,以及第一模板序列;第二寡核苷酸链包含第二杂交序列,以及第二模板序列;其中,所述第二杂交序列与所述第一杂交序列部分或全部互补;所述第二模板序列与所述第一模板序列部分或全部不互补。在某些实施方案中,第一寡核苷酸链中,所述第一模板序列位于所述第一杂交序列的下游;优选地,所述第一模板序列为游离的3'单链臂。10在某些实施方案中,所述3'单链臂的末端是封闭的;例如,通过在单链接头的最后一个核苷酸的3'-OH上添加化学部分(例如,生物素或烷基),通过将探针的最后一个核苷酸的3'-OH去除,或者将所述最后一个核苷酸替换为双脱氧核苷酸,从而封闭接头的3'-末端。在某些实施方案中,第二寡核苷酸链中,所述第二杂交序列位于所述第二模板序列在某些实施方案中,所述5’单链臂的末端是封闭的;例如,通过在单链接头的最后一个核苷酸的3'-OH上添加化学部分(例如,生物素或烷基),通过将探针的最后一个核苷酸的3'-OH去除,或者将所述最后一个核苷酸替换为双脱氧核苷酸,从而封闭接头的3'-末端。20在某些实施方案中,所述双链接头还包含如前所述的可切割部分。在某些实施方案中,所述双链接头还包含如前所述的UMI。在某些实施方案中,所述双链接头的第一寡核苷酸链从5’至3杂交序列,第一模板序列,其中,所述第一模板序列为游离的3'单链臂。在某些实施方案中,所述双链接头的第二寡核苷酸链从5’至325模板序列,第二杂交序列,可切割部分,UMI,其中,所述第二模板序列为游离的5’单在某些实施方案中,所述第二寡核苷酸链的3’末端是封闭的;例如,通过在单链接头的最后一个核苷酸的3'-OH上添加化学部分(例如,生物素或烷基),通过将探针的最后一个核苷酸的3'-OH去除,或者将所述最后一个核苷酸替换为双脱氧核苷酸,从而WO2025/1401819在某些实施方案中,所述双链接头具有如SEQIDNO:9和10所示的序列。因此,在某些实施方案中,所述方法还包括:(a-3)提供核酸切割剂,使所述核酸5在某些实施方案中,将所述核酸切割剂与(a-2)的产物接触后,所述核酸切割剂能在本发明的方法中,所述核酸切割剂对接头中的可切割部分进行切割后,接头在可10在此类实施方案中,切割后,接头的断裂处由于不存在封闭的3’末端,在与核苷酸混合物接触后,将以单链靶核酸(即,第一链)为模板,在断裂处向下合成单链靶核酸的互补链(即,第二链)。在某些实施方案中,所述方法是通过下述步骤(1)至步骤(4)实现的:(1)提供单链靶核酸;任选地,所述单链靶核酸的5'端不具有游离的磷酸基团;15(2)提供一种或多种所述接头以及连接酶,在允许核酸连接的条件下,使所述单链(3)提供所述核酸切割剂,在允许核酸切割剂切割核酸的条件下,使步骤(2)的(4)提供所述核苷酸混合物,在允许合成所述单链靶核酸的互补链的条件下,使所20述单链靶核酸与所述核苷酸混合物接触。在某些实施方案中,在步骤(1)中,通过碱性磷酸酶与所述单链靶核酸接触,以使核酸分子或其扩增产物25在第二方面,本申请提供了一种核酸分子或其扩增产物,其由第一方面所述的方法在某些实施方案中,所述扩增产物是核酸分子的第一链的扩增产物,所述第一链具在某些实施方案中,所述扩增产物是核酸分子的第二链的扩增产物,所述第二链具WO2025/140181在某些实施方案中,所述扩增产物是核酸分子的第一链与第二链的扩增产物,其中,所述第一链具有与所述单链靶核酸序列相同的序列,所述第二链具有与所述单链靶核酸5核酸分子或其扩增产物的用途在第三方面,本申请提供了第二方面所述的核酸分子或其扩增产物用于胞嘧啶转化。在某些实施方案中,第二方面所述的核酸分子或其扩增产物用于表观遗传信息(例如,DNA甲基化,DNA突变)分析。在某些实施方案中,第二方面所述的核酸分子或其扩增产物用于遗传信息(例如,10基因组)分析。制备DNA文库的方法在某些实施方案中,所述DNA文库选自基因组文库,在某些实施方案中,所述方法用于同时分别制备基因组文库和甲基化组文库。在一些实施方案中,上述方法还包括:将核酸分子或其扩增产物片段化。本领域技段化,以生成对于DNA文库而言合适的和/或足够的长度的片段。在本文中,可以使用标准实验流程或市售试剂盒进行胞嘧啶转化。在某些实施方案中,使用NaOH使核酸分子或其扩增产物变性。在核酸分子或其扩增产物变性后,可以25用亚硫酸氢钠或偏亚硫酸氢钠以例如2M的最终浓度(pH在约5和6之间)在55℃处理4-16小时。所述步骤用亚硫酸盐共价修饰不具有修饰的胞嘧啶。转化后,将核酸分子或其扩增产物脱盐,然后通过在碱性pH和室温下培养核酸分子或其扩增产物进行脱磺酸作用,其导致脱氨基-并转化为尿嘧啶。在一个实施例中,市售试剂盒如EZDNAMethylation-Gold、EZDNAMethylation-Direct或EZDNAMethylation-Lightning试剂盒(购自ZymoWO2025/140181PCT/CN2024/141792在某些实施方案中,还可以通过不使用亚硫酸氢根离子的方法将胞嘧啶转化为尿嘧啶。例如,利用胞苷脱氨酶分别催化胞苷和脱氧胞苷为尿苷和脱氧尿苷的不可逆水解脱氨作用。在一些实施例中,不带有修饰的胞嘧啶转化为尿嘧啶是通过酶促反应完成。在一些实施例中,将核酸分子与胞苷脱氨酶一起培育。在一些实施例中,胞苷脱氨酶包括5活化诱导的胞苷脱氨酶(AID)在一些实施例中,APOBEC酶选自人类APOBEC家族,其由以下群组所组成:20130244237)。在一些实施例中,转化使用市售试剂盒。在一个实例中,使用诸如增产物接触。15在某些实施方案中,在步骤(ii)之后,分离核酸分子或其扩增产物中的第一链与第在某些实施方案中,所述方法还包括:提供测序引物,在允许核酸连接的条件下,在某些实施方案中,所述测序引物包含第一寡核苷酸链,和第二寡核苷酸链;其中,25所述第一寡核苷酸链包含第一杂交序列,以及第一模板序列;第二寡核苷酸链包含第二杂交序列,以及第二模板序列;其中,所述第二杂交序列与所述第一杂交序列部分或全在某些实施方案中,第一寡核苷酸链中,所述第一模板序列位于所述第一杂交序列30所述第一寡核苷酸链的杂交序列与核酸分子或其扩增产物中的第一链相连接。WO2025/140181在某些实施方案中,第二寡核苷酸链中,所述第二杂交序列位于所述第二模板序列的上游。在某些实施方案中,所述第二模板序列为游离的3'单链臂;在某些实施方案中,所述第二寡核苷酸链的杂交序列与核酸分子或其扩增产物中的第二链相连接。在某些实施方案中,所述测序引物中的胞嘧啶包含或由修饰的胞嘧啶组成。在某些5实施方案中,所述修饰的胞嘧啶选自5-丙炔5-羧基嘧啶、5-羟基胞嘧啶、5-氟胞嘧啶、5-氯胞嘧啶、5-溴胞嘧啶、5-碘胞嘧啶,或其在某些实施方案中,所述测序引物中的胞嘧啶包含或由5-丙炔基胞嘧啶组成。在某些实施方案中,所述测序引物的具体序列根据测序平台(例如,BGI,Illumina)在某些实施方案中,所述测序引物具有如SEQIDNO:11和12所示的序列。在某些实施方案中,所述测序引物的第一寡核苷酸链和/或第二寡核苷酸链中还包含在某些实施方案中,所述UMI位于第一杂交序列的3'端。在某些实施方案中,所述20第二寡核苷酸链的UMI与核酸分子或其扩增产物在某些实施方案中,所述UMI选自随机UMI,非随机UMI,或其任意组合。在某些实施方案中,所述随机UMI包含4-28bp(例如,4-10bp,10-16bp,16-22bp,22-28bp)的N碱基,其中,N为A,25在某些实施方案中,所述随机UMI包含10-16bp(例如,10bp,11bp,12bp,13bp,在某些实施方案中,所述非随机UMI包含多种(例如,2-4条,4-8条,8-16条,16-32条,32-64条,64-96条,或更多种)4-28bp(例如,4-10bp,10-16bp,16-22bp,22-30在某些实施方案中,所述非随机UMI包含2-8条(例如,2条,3条,4条,5条,6WO2025/140181条,7条,8条)4-10bp(例如,4bp,5bp,6bp,7bp,8bp,9bp,10bp)的特定序列。在某些实施方案中,非随机UMI中包含的多种特定序列中,每个特定序列与其它特定序列在其相应核苷酸位置上具有至少1个(例如,1个,2个,3个,4个,5个,6个,7个,8个,9个,10个)核苷酸的差异。5在某些实施方案中,所述非随机UMI的特定序列如SEQIDNO:13-16任一项所示。在某些实施方案中,所述测序引物的第一寡核苷酸链和/或第二寡核苷酸链中还包含定位标签,其中,所述定位标签包含至少1种(例如,1种,2种,3种,4种,5种,6种,7种,8种)特定序列,所述特定序列由3-8个(例如,3个,4个,5个,6个,7个,108个)碱基组成。在某些实施方案中,所述碱基选自A,T,C,G。在某些实施方案中,所述特定序列由3-8个相同或不同在某些实施方案中,所述定位标签包含4种特定序列,所述4种特定序列均由相同或不同的碱基组成。在某些实施方案中,所述4种特定序列彼此之间的长度不相同(例如,15相差1个碱基,相差2个碱基,相差3个碱基)。在某些实施方案中,所述定位标签包含由3个相同或不同的碱基组成的第一特定序列、由4个相同或不同的碱基组成的第二特定序列、由5个相同或不同的碱基组成的第三特定序列,以及由6个相同或不同的碱基组成的第四特定序列。在某些实施方案中,所述定位标签在特定序列的5’端25方案中,所述定位标签包含如SEQIDNO:在某些实施方案中,所述定位标签位于第一寡核苷酸链和/或第二寡核苷酸链的杂交30序列中,或者,所述定位标签位于第一寡核苷酸链和/或第二寡核苷酸链的杂交序列的末WO2025/140181PCT/CN2024/141792在某些实施方案中,所述定位标签位于第一杂交序列的3'端。在某些实施方案中,所述第一寡核苷酸链的定位标签与核酸分子或其扩增产物中的第一链相连接。在某些实施方案中,所述定位标签位于第二杂交序列的5’端。在某些实施方案中,5所述第二寡核苷酸链的定位标签与核酸分子或其扩增产物中的第二链相连接。DNA文库在另一方面,本申请提供一种DNA文库,其由权利要求如前所述的方法构建而成。在某些实施方案中,所述DNA文库选自基因组文库,甲基化组文库,或其任10在某些实施方案中,由如前所述的方法同时分别制备基因组文库和甲基化组文库。在某些实施方案中,所述基因组文库包含或由核酸分子或其扩增产物中的第二链组在某些实施方案中,所述甲基化组文库包含或由核酸分子或其扩增产物中的第一链组成。在另一方面,本申请提供一种分析表观遗传信息和/或遗传信息的方法,所述方法包在某些实施方案中,对所述核酸分子或其扩增产物中的第一链和第二链分别进行检在某些实施方案中,所述检测为测序。在某些实施方案中,所述测序选自下一代测在某些实施方案中,所述检测选自微阵列,定量PCR(qPCR),数字微滴PCR在某些实施方案中,所述分析为生物信息学分析。在某些实施方案中,生物信息学30分析包括但不限于:生物信息学分析选自序列比对,基因组分析,转录组分析,单核苷WO2025/140181PCT/CN2024/141792在某些实施方案中,生物信息学分析可用于量化DNA文库(例如,cfDNA)中分析的基因组当量数目,或者用于检测靶基因座的遗传状态,或者用于检测靶基因座中的遗5在某些实施方案中,可以将测序获得的序列读段(reads)与一种或多种参考DNA序列(例如,人基因组序列)之间进行序列比对。在具体实施方案中,测序比对可用于检测靶基因座中的遗传病变,包括但不限于检测核苷酸转换或颠换、核苷酸插入或缺失、基因组重排、拷贝数变化或基因融合。在某些实施方案中,所述表观遗传信息为区分第一链(甲基化信息)/第二链(基因组信息)的方法在某些实施方案中,对所述核酸分子或其扩增产物进行测序,并获得包含第一链和在某些实施方案中,当测序引物的第一寡核苷酸链中包含UMI,第二寡核苷酸链中不包含UMI,则通过鉴定核酸分子或其扩增产物的测序数据中是否存在UMI序列,以区在某些实施方案中,当测序引物的第二寡核苷酸链中包含UMI,第一寡核苷酸链中在某些实施方案中,当测序引物的第一寡核苷酸链中包含UMI,第二寡核苷酸链中以区分第一链和第二链的测序数据。WO2025/140181在某些实施方案中,通过分别鉴定第一寡核苷酸链和第二寡核苷酸链中UMI的胞嘧啶是否发生胞嘧啶转化,以区分第一链和第二链的测序数据。5在某些实施方案中,UMI中的胞嘧啶经过了转化(例如,转化为尿嘧啶)的测序数在某些实施方案中,UMI中的胞嘧啶未经过胞嘧啶转化(例如,保持为胞嘧啶)的10在某些实施方案中,当测序引物的第一寡核苷酸链中包含定位标签,第二寡核苷酸链中不包含定位标签,则通过鉴定核酸分子或其扩增产物的测序数据中是否存在定位标在某些实施方案中,鉴定到定位标签的测序数据为第一链的测序数据。在某些实施方案中,未鉴定到定位标签的测序数据为第二链的测序数据。在某些实施方案中,当测序引物的第二寡核苷酸链中包含定位标签,第一寡核苷酸链中不包含定位标签,则通过鉴定测序数据中是否存在定位标签序列,以区分第一链和在某些实施方案中,鉴定到定位标签的测序数据为第二链的测序数据。在某些实施20方案中,未鉴定到定位标签的测序数据为第一链的测序数据。在某些实施方案中,当测序引物的第一寡核苷酸链中包含定位标签,第二寡核苷酸链中也包含定位标签,则通过鉴定测序数据中定位标签更靠近于测序引物的5’单链臂还是3'单链臂,以区分第一链和第二链的测序数据。25在某些实施方案中,,鉴定到定位标签更靠近5’单链臂的测序数据为第一链的测序数据。在某些实施方案中,鉴定到定位标签更靠近3'单链臂的测序数据为第二链的测序在某些实施方案中,通过分别鉴定第一寡核苷酸链和第二寡核苷酸链中定位标签的30序列是否发生变化,以区分第一链和第二链的测序数据。WO2025/140181在某些实施方案中,定位标签中的鸟嘌呤(G)转化成腺嘌呤(A)的测序数据为第一链的在某些实施方案中,定位标签中的鸟嘌呤(G)未经过转化的测序数据为第二链的测序5在某些实施方案中,所述第一链的测序数据用于靶核酸的甲基化信息的分析。在某些实施方案中,所述第二链的测序数据用于靶核酸的基因组信息的分析。DNA文库的用途在另一方面,本申请提供了如前所述的DNA文库用于分析表观遗传信息和/或遗传信在某些实施方案中,所述表观遗传信息为DNA甲基化信息。试剂盒的用途在某些实施方案中,所述疾病导致受试者的表观遗传信息和/或遗传信息发生变化20(例如,核苷酸转换或颠换、核苷酸插入或缺失、基因组重排、拷贝数变化或基因融在某些实施方案中,所述试剂盒用于:(1)检测受试者是否患有癌症;25(2)检测受试者是否癌症复发;(3)检测患有疾病的受试者对所接受的针对所述疾病的疗法和/或药物的响应性;(4)检测受试者是否患有遗传疾病。因此,在某些实施例中,所述试剂盒的检测对象可以是接受了化学疗法、放射疗法或免疫疗法的受试者。在某些实施例中,所述试剂盒的检测对象可以是进行过癌症治疗30的失败或成功后的癌症复发的受试者。WO2025/140181PCT/CN2024/141792在某些实施方案中,所述癌症选自肝癌、肝细胞癌、黑素瘤、胰腺癌、肺癌、肾癌、胃癌、食道癌、结肠癌、乳腺癌、卵巢癌、子宫颈癌胞淋巴瘤、扩散性大B细胞淋巴瘤、滤泡性淋巴瘤、被套区细胞淋巴瘤、小淋巴细胞淋巴瘤、脾边缘区B细胞淋巴瘤、结外边缘区粘膜相关淋巴组织B细胞淋巴瘤,淋巴结边5缘区B细胞淋巴瘤、淋巴浆细胞淋巴瘤、原发性积液淋巴瘤、伯身型)、外周T细胞淋巴瘤、血管免疫母细胞性T细胞淋巴瘤、成人T细胞淋巴瘤/白血病(人类T细胞淋巴细胞病毒I型阳性)、结外NK/T细胞淋巴瘤(鼻型),肠病相关T细胞淋巴瘤、gamma/delta肝脾T细胞淋巴瘤、皮下脂膜炎样T细胞淋巴瘤、多发性骨髓瘤、在某些实施方案中,所述遗传疾病选自阿尔茨海默病(APOE1)、腓骨肌萎缩症、15白)、苯丙酮尿症(PAH,苯丙氨酸水解酶)、家族性高胆固醇血症(LDLR,低密度脂蛋白强直性营养不良(DM,薏仁米)、结节性硬化症(TSC1,马铃薯球蛋白)、软骨发育不全试剂盒(1)丙炔基修饰的胞嘧啶;(2)胞嘧啶转化试剂(例如,亚硫酸氢盐,胞苷脱氨25酶和/或TET);和(3)如前所述的单链接头和/或双链接头。在某些实施方案中,所述试剂盒还包含:(4)用于建库的试剂。在某些实施方案中,所述用于建库的试剂选自酶,用于DNA末端修复的试剂,RNase-free水,或其任意组合。在某些实施方案中,所述酶选自T4DNA连接酶,T3DNA连接酶,T7DNA连接30酶,大肠杆菌DNA连接酶,HIFITaqDNA连接酶,T4RNA连接酶,RTCWO2025/140181环连接酶,热稳定的DNA连接酶,或其任意组合。术语定义在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术5人员所通常理解的含义。并且,本文中所用的病毒学、生物化学、免疫学实验室操作步骤均为相应领域内广泛使用的常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。类似指称物在描述本发明的上下文中(尤其在以下权利要求的上下文中)应被解释成覆盖单数和复数。“核酸”和“核酸分子”是指任何长度的核苷酸的聚合物形式,诸如脱氧核糖核苷酸15(dNTP)或核糖核苷酸(rNTP)或其类似物,并且可以互换使用。寡核苷酸通常由四种核苷酸碱基的特定序列构成:腺嘌呤(A);胞嘧啶(C);鸟嘌呤(G);和胸腺嘧啶(T)(当多核苷酸是RNA时,胸腺嘧啶(T)为尿嘧啶(U))。核酸的非限制性实例包括DNA、RNA、DNA/RNA、基因或基因片段的编码或非编码区、根据连锁分析定义的基因座、外显子、20内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微RNA(miRNA)、核酶、互补DNA(cDNA)、重组核酸、分支核酸、质粒、载体、任何序列的分离DNA、任何序列的分离RNA、核酸探针和引物。核酸可以包含一个或多个具有修饰的核苷酸,诸如甲基化核苷酸和核苷酸类似物。如本文所用的,术语“扩增”一般是指产生核酸分子的一个或多个拷贝或者延伸产25物(例如,核酸分子上的引物延伸反应的产物)。核酸分子的扩增可以产生与核酸分子杂交的单链或者核酸分子或其互补序列的多个拷贝。扩增产物可以是通过扩增程序从起始模板核酸分子生成的单链或双链核酸分子。“扩增产物”可以包含其中至少一部分可能与起始模板的至少一部分基本上相同或基本上互补的核酸链。在起始模板是双链核酸分子的情况下,扩增产物可以包含与一条链的至少一部分基本上相同并且与任一条30链的至少一部分基本上互补的核酸链。在某些实施方案中,扩增产物可以是单链的或WO2025/140181双链的。扩增反应可以是例如聚合酶链反应(PCR),诸如乳液聚合酶链反应(ePCR;例如,在微反应器诸如孔或液滴内进行的PCR)。如本文中所使用的,术语“互补”意指,两条核酸序列能够根据碱基配对原则(Waston-Crick原则)在彼此之间形成氢键,并由此形成双链体。在本申请中,术语一条核酸序列中的每一个碱基都能够与另一条核酸链中的碱基配对,而不存在错配或缺口。如本文中所使用的,术语“实质上互补”意指,一条核酸序列中的大部分碱基都能够与另一条核酸链中的碱基配对,其允许存在错配或缺口(例如,一个或数个核苷酸的错配或缺口)。通常,在允许核酸杂交、退火或扩增的条件下,“互补”(例如实10质上互补或完全互补)的两条核酸序列将选择性地/特异性地发生杂交或退火,并形成双链体。相应地,术语“不互补”意指,两条核酸序列在允许核酸杂交、退火或扩增的条件下不能发生杂交或退火,无法形成双链体。如本文中所使用的,术语“不完全互补”意指,一条核酸序列中的碱基不能够与另一条核酸链中的碱基完全配对,至少存在一个错配或缺口。15如本文所用的,术语“无修饰的核苷酸”包括天然存在的核苷酸,诸如包含腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)、尿嘧啶(U)或鸟嘌呤(G)的核苷酸。如本文所用的,术语“修饰的核苷酸”包括但不限于衍生自天然存在的核苷酸的类似物,或与天然存在的核苷酸的结构具有相似性但包含一个或多个差异的核苷酸。在某些实施方案中,修饰的核苷酸包括肌苷、二氨基嘌呤、5-氟尿嘧啶、5-溴尿嘧啶、5-20氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、脱氮黄嘌呤、脱氮鸟嘌呤、异胞嘧啶、异鸟嘌呤、4-乙酰基胞嘧啶、5-(羧基羟甲基)尿嘧啶、5-羧基甲基氨基甲基-2-硫代尿苷、5-羧基甲基氨基甲基尿嘧啶、二氢尿嘧啶、β-D-半乳糖基Q核苷(galactosylqueosine)、N6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基(mannosylqueosine)、5'-甲氧基羧基甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲基硫代-D46-异戊烯基腺嘌呤、尿嘧啶-5-氧乙酸(v)、怀丁苷(wybutoxosine)、假尿嘧啶、Q核苷(queosine)、2-硫代胞嘧啶、5-甲基-2-硫代尿嘧啶、2-硫代尿嘧啶、4-硫代尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-氧乙酸甲酯、尿嘧30氨基-3-N-2-羧基丙基)尿嘧啶、(acp3)w、2,6-二氨基嘌呤、乙炔基核苷酸碱基、1-丙炔WO2025/140181基核苷酸碱基、叠氮基核苷酸碱基、硒代磷酸酯核酸及其修饰型式(例如,通过氧化、还原、和/或添加取代基,诸如烷基、羟烷基、羟基或卤素部分)。如本文所用的,术语“测序引物”一般是指通过与靶核酸相互作用以促进测序(例如,下一代测序(NGS))的分子(例如,多核苷酸)。在测序引物的存在下,靶核酸能够通过5测序仪完成测序。在某些实施方案中,测序引物可以包含与捕获靶核酸杂交或结合的核苷酸序列,捕获靶核酸连接至测序系统的固体支撑物,诸如珠子或流动池。在某些实施方案中,测序引物可以包含与靶核酸杂交或结合以生成发夹环的核苷酸序列,从而允许靶核酸通过测序系统进行测序。在某些实施方案中,测序引物可以包含测序仪基序,其可以是与另一分子(例如,多核苷酸)的流动池序列互补的核苷酸序列并且可由10测序系统用来对靶核酸进行测序。如本文中所使用的,术语“下一代测序(NGS)”是指允许克隆扩增的分子和单个核酸分子大量并行测序的测序方法。NGS的非限制性例子包括使用可逆染料终止子的合成测序和连接测序。如本文中所使用的,术语“Spacer”是指间臂类修饰。将spacer15通常是为了在寡核苷酸之间或寡核苷酸与其他官能团之间建立一段距离,以起到避免空间位阻、减少基团之间不利的相互作用、增加柔性等作用。或者,在不需要寡核苷酸做延伸的情况中,spacer可以作为封闭基团使用。不同spacer的原子数量不同,可以通过调节所插入spacer的数量与种类达到需要的空间距离。Spacer的种类包括但不限于,有疏水性的SpacerC3、C6、C12,亲水性的Spacer9、Spacer18、dSpacer、如本文所用的,术语“UMI”或“独特分子标识符”是指可以用于识别一个或多个特定核酸的一个或多个核苷酸序列,其可用于将不同的核苷酸序列彼此区分开来。使用UMI可以包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、2518、19、20个或更多个核苷酸(例如,连续核苷酸)。使用下一代测序技术对多个样品进行高通量分析中,使用UMI可以对样品进行区分。在某些实施方案中,UMI可以随机生成(即,随机UMI)或非随机生成(即,非随机UMI)。如本文所用的,术语“可切割部分”是指核酸中包含的任何可切割或可切除的部分。例如,可切割部分可以包含尿嘧啶、核糖核苷酸或其他可以使用酶(例如,UDG、RNA30酶、内切核酸酶等)切除或切割的修饰的核苷酸。可切割部分可以包含间隔区,例如C3或其组合或类似物。可切割部分可以包含修饰的核苷酸,例如甲基化核苷酸。修饰的应当理解,可切割部分可以连接到核酸分子的任何位置中互补序列与UMI之间连接有可切割部分(例如,尿嘧啶脱氧核糖核酸)。因此,可切割部分(例如,尿嘧啶、核糖核苷酸、间隔区、无碱基位点、酶特异诸如甲基化核苷酸等)及其任何组合,可以连接于核酸分子的任何片10端处。相似地,在核酸分子是双链的情况下,可切割部分可以设置在不同的链上。例含疑似具有表观遗传信息变异(例如,甲基化修饰)和/或遗传信息变异(例如但不限于WO2025/140181附图说明图1为单链靶核酸的单链接头MMssAdapter1TU的结构示意图,其中,所述单链接头从5’至3’方向依次包含:第一互补序列,连接所述第一互补序列和第二互补序列的5连接序列,与所述第一互补序列部分或全部互补的第二互补序列,可切割部分(例如,尿嘧啶脱氧核糖核酸)和UMI(例如,随机UMI);其中,所述连接序列中包含Spacer,图2为MMLib0710_18文库的片段化分析结果。图3为MMLib0803_11文库的片段化分析结果。10图4为单链靶核酸的单链接头MMssAdapter1TU-4U的结构示意图,其中,所述单链接头从5’至3’方向依次包含:第一互补序列,连接所述第一互补序列和第二互补序列的连接序列,与所述第一互补序列部分或全部互补的第二互补序列,可切割部分(例如,尿嘧啶脱氧核糖核酸)和UMI(例如,随机UMI);其中,所述连接序列中包含Spacer,且包含2个可切割部分,并且,所述2个可切割部分分别邻接于Spacer的两侧;其中,图5为MMLib0726_2文库的片段化分析结果。图6为单链靶核酸的单链接头MMssAdapter1rTrT的结构示意图,其中,所述单链接头从5’至3’方向依次包含:第一互补序列,连接所述第一互补序列和第二互补序列的连接序列,与所述第一互补序列部分或全部互补的第二互补序列,可切割部分(例如,20胸腺嘧啶核糖核酸)和UMI(例如,随机UMI);其中,所述连接序列中包含Spacer,图7为MMLib0824_5文库的片段化分析结果。图8为单链靶核酸的双链接头MMssAdapter1TU10的结构示意图;其中,所述双链接头包含:第一寡核苷酸链,和第二寡核苷酸链;其中,所述第一寡核苷酸链包含第25一杂交序列,以及第一模板序列;第二寡核苷酸链包含第二杂交序列,以及第二模板序列;其中,所述第二杂交序列与所述第一杂交序列部分或全部互补;所述第二模板序列其中,所述双链接头的第一寡核苷酸链从5’至3'方向依次包含:第一杂交序列,第一模板序列,其中,所述第一模板序列为游离的3'单链臂;所述3’单链臂的末端是封闭WO2025/140181PCT/CN2024/141792其中,所述双链接头的第二寡核苷酸链从5’至3'方向依次包含:第二模板序列,第二杂交序列,可切割部分(例如,尿嘧啶脱氧核糖核酸)和UMI(例如,随机UMI),图9为MMLib1009_3文库的片段化分析结果。5图10为MMLib0906_3文库的片段化分析结果。图11为第一测序引物与靶核酸连接后的结构示意图,其中,所述第一测序引物包含第一寡核苷酸链,和第二寡核苷酸链;其中,所述第一寡核苷酸链包含第一杂交序列,以及第一模板序列;第二寡核苷酸链包含第二杂交序列,以及第二模板序列;其中,所述第二杂交序列与所述第一杂交序列部分或全部互补;所述第二模板序列与所述第一模其中,所述第一寡核苷酸链从5’至3’方向依次包含:模板序列,杂交序列,随机图12为第二测序接头与靶核酸连接后的结构示意图,其中,所述第二测序引物包含15第一寡核苷酸链,和第二寡核苷酸链;其中,所述第一寡核苷酸链包含第一杂交序列,以及第一模板序列;第二寡核苷酸链包含第二杂交序列,以及第二模板序列;其中,所述第二杂交序列与所述第一杂交序列部分或全部互补;所述第二模板序列与所述第一模图13为第三测序接头与靶核酸连接后的结构示意图,其中,所述第三测序引物包含第一寡核苷酸链,和第二寡核苷酸链;其中,所述第一寡核苷酸链包含第一杂交序列,以及第一模板序列;第二寡核苷酸链包含第二杂交序列,以及第二模板序列;其中,所述第二杂交序列与所述第一杂交序列部分或全部互补;所述第二模板序列与所述第一模其中,所述第一寡核苷酸链从5’至3’方向依次包含:模板序列,杂交序列,随机WO2025/140181本申请涉及的序列的描述提供于下表中。表1:序列信息序列123459789CTACACGACGCTCTTCCGAUCUNNNNNNN-blocker-3’WO2025/140181现参照下列意在举例说明本发明(而非限定本发明)的实施例来描述本发明。除非特别指明,本发明中所使用的分子生物学实验方法,基本上参照J.Sambrook5等人,分子克隆:实验室手册,第2版,冷泉港实验室出版社,1989,以及F.M.Ausubel等人,精编分子生物学实验指南,第3版,JohnWiley&Sons,Inc.,1995中所述的方法进行;限制性内切酶的使用依照产品制造商推荐的条件。本领域技术人员知晓,实施例以举例方式描述本发明,且不意欲限制本发明所要求保护的范围。10实施例1.5py-dCTP与5m-dCTP的对比设计并合成如SEQIDNO:1所示的单链DNA连接接头MMssAdapter1TU(结构如图1所示)。带定位标签和UMI的双链接头设计和制备按照专利“一种改进的二代测序用随机标签15接头制作方法”CN107190067B中描述的内容(其全部内容引用至本申请中),并由生工接头引物P5的序列如SEQIDNO:2所示。接头引物P7-A为FFFFF(Spacer)EEEEEJJJJJNNNNNNNNNNNN连接在SEQID20EEEEEKKKKKNNNNNNNNNNNN连接在SEQIDNO:2的5'端所得;接头引物P7-C为FFFFF(Spacer)EEEEELLLLLNNNNNNNNNNNN连接在SEQIDNO:2的5'端所SEQIDNO:2和SEQIDNO:3中的所有胞嘧啶均进行了5号位碳原子的甲基化修饰。WO2025/140181PCT/CN2024/141792文库构建使用打断后的HCT116细胞系DNA30ng混入完全甲基化的pUC190.005ng总体积时间55编号总体积连接1的反应程序如下:时间此后往反应孔中添加160μl本司自行配制的片段分选磁珠,进WO2025/140181磁珠洗脱。总体积时间此后往反应孔中添加60μl本司自行配制的片段分选磁珠,进行纯化以后使用6.5μl磁62222222时间WO2025/140181PCT/CN2024/141792连接缓冲液(NEB)连接增强子(NEB)总体积时间55体积(ul)时间WO2025/140181PCT/CN2024/1417921使用Qsep进行文库的片段化分析,结果如图2所示。5数据分析时通过UMI在文库数据的R1端还是R2端来区分全甲基化组数据和全基因pUC19中10按照1.1中所述的单链DNA连接接头,1.1中所述的建库方式进行共检测文库的构建,622222WO2025/1401812获得MMLib0803_11混合文库,混合文库使用QubitHSdsDNAKit进行定量,结果使用Qsep进行文库的片段化分析,结果如图3所示。数据分析时通过UMI在文库数据的R1端还是R2端来区分全甲基化组数据和全基因pUC19中DNA转化的C>T突变综上,通过本申请的方法,在合成第二链时(即,连接二)使用5py-dCTP,能够显著的降低基因组C>T突变事件的错误率,且降低了两个数量级!因此,对于同时进行的10基因组测序和甲基化组测序来说,本申请的方法能够显著的降低基因组测序结果中出现实施例2.不同胞嘧啶衍生物的对比本实施例使用商品化的xGenPrismLibraryPrepKit试剂盒(IDT,Cat.10009821)。15具体实验操作如说明书中所描述的进行,只是在接头部分做了相对应的修饰和修改。简使用试剂盒中的末端修复模块对样本DNA进行末端修复,使用试剂盒中连接一的模WO2025/140181PCT/CN2024/141792块进行第一步连接,其中,将试剂盒中连接一使用到的接头进行适当改造,具体将接头中UMI部分以外的胞嘧啶替换为甲基化修饰的胞嘧啶,并由生工合成改造后的接头。随后使用连接二体系对于连接一产物进行第二步连接,其中,将试剂盒中连接二使用到的接头进行适当改造,具体将接头中UMI部分以外的胞嘧啶替换为甲基化修饰的胞嘧啶,5并由生工合成改造后的接头。连接二完成以后进行纯化,纯化产物进行保护链的合成。其中,在合成第二链时(即,连接二),本申请分别使用了不同的胞嘧啶衍生物555111工111111工工11/工11工/11//11//222222221111WO2025/140181PCT/CN2024/14179214EnzymaticMethyl-seqConvers增,其后进行了测序,测序结果中能够明确的看到不同胞嘧啶衍生物带来的检测准确率MMPR1007_15同时作为标准对照的WGS检测中WGS层面出现的假阳性事件概率为0.04%,和使因组层面有大约7亿个胞嘧啶,因此如此高的错误率,对于突变的检出是不能接受的,不综上,与其他胞嘧啶衍生物相比,在合成第二链时(即,连接二)使用5py-dCTP,实施例3.不同结构的单链接头的探索设计并合成如SEQIDNO:7所示的单链DNA连接接头MMssAdapter1TU-4U(结构如图4所示)。15按照实施例1中1.1所述的建库方式进行共检测文库的构建,在第一步连接过程中修编号WO2025/1401815616总体积获得MMLib0726_2混合文库,混合文库使用QubitHSdsDNAKit进行定量,结果使用Qsep进行文库的片段化分析,结果如图5。数据分析时通过UMI在文库数据的R1端还是R2端来区分全甲基化组数据和全基因化的化的中C%综上,使用本申请提供的单链接头,能够实现同时进行基因组测序和甲基化组测序,实施例4.不同结构的单链接头的探索本实施例的单链DNA连接接头MMssAdapter1rTrT的区别在于且使用胸腺嘧啶核糖核酸代替尿嘧啶脱氧核糖核酸,具体如SEQIDNO:8所示,(结构如图6所示)。WO2025/140181PCT/CN2024/141792具体过程与实施例1的1.1基本相同,不同之处在于:总体积温度时间获得MMLib0824_5混合文库,混合文库使用QubitHSdsDNAKit进行定量,结果使用Qsep进行文库的片段化分析,结果如图7所示。数据分析时通过UMI在文库数据的R1端还是R2端来区分全甲基化组数据和全基因pUC19中DNA转化的C>T突变综上,使用本申请提供的单链接头,能够实现同时进行基因组测序和甲基化组测序,WO2025/140181实施例5.双链接头的探索本实施例的双链接头MMssAdapter1TU10,具体来说,使用互补配对的Y型接头代5替环状接头作为第一步连接所用的接头,接头的两条链如SEQIDNO:9和10所示,结构如图8所示。具体过程与实施例1的1.1基本相同,不同之处在于:10文库构建使用打断后的HCT116细胞系DNA30ng混入完全甲基化的p总体积时间按照实施例1中1.1所述的建库方式进行共检测文库的构建,在第一步连接过程中修WO2025/140181PCT/CN2024/141792总体积获得MMLib1009_3混合文库,混合文库使用QubitHSdsDNAKit进行定量,结果使用Qsep进行文库的片段化分析,结果如9所示。5数据分析时通过UMI在文库数据的R1端还是R2端来区分全甲基化组数据和全基因pUC19中综上,使用本申请提供的双链接头,能够实现同时进行基因组测序和甲基化组测序,实施例6.测序接头的探索具体过程与实施例1的1.1基本相同。区别在于连接2中使用普通二代测序通用的Y接头中的胞嘧啶均为甲基化修饰的胞嘧啶,Y型接头的两条链M-AdaptorU和M-15AdaptorB的序列分别如SEQIDNO:11和12所示。WO2025/140181PCT/CN2024/141792连接缓冲液(NEB)连接增强子(NEB)总体积连接2反应程序不改变。获得MMLib0906_3混合文库,混合文库使用QubitHSdsDNAKit进行定量,结果使用Qsep进行文库的片段化分析,结果如图10所示。5数据分析时通过UMI在文库数据的R1端还是R2端来区分全甲基化组数据和全基因pUC19中综上,使用普通二代测序通用的Y型接头,本申请的方法能够实现同实施例7.测序接头的探索具体过程与实施例1的1.1基本相同。区别在于连接2中使用独特设计的测序接头,测序接头中包含随机UMI,并通过定位WO2025/140181将测序接头与靶核酸连接后的结构示意图如图11所示,构建基因组和甲基化组的混UMI为12个随机碱基NNNNNNNNNNNN,定位标签为JJJ,KKKK,LLLLL,EEEEEE,所有C均进行了5号位碳原子的甲基化修饰。测序接头包含上述四种定位标5签中的任意一种,其中,定位标签包含非随机的碱基,例如,JJJ是指三个特定碱基的任意组合(在本实施例中为ACT,SEQIDNO:17),KKKK是指四个特定碱基的任意组合(在本实施例中为GACT,SEQIDNO:18),LLLLL是指五个特定碱基的任意组合(在本实施例中为TGACT,SEQIDNO:19),EEEEEE是指六个特定碱基的任意组合 (在本实施例中为CTGACT,SEQIDNO:20)。10对所得文库进行测序,下机数据按照基于UMI位置的方法区分基因组和甲基化组,质控后的数据分别于R1和R2距起始位置12个碱基处匹配定位标签,匹配到JJJ,15对所有数据的匹配结果进行分类:R1和R2均匹配到定位标签,仅R1总序列拆分后的甲基化组数据和基因组数据分别比对到参考基因组上并进行后续分析,甲20综上,本实施例证实了本申请独特设计的测序接头和方法能够准确的区分甲基化组实施例8.测序接头的探索具体过程与实施例1的1.1基本相同。区别在于连接2中使用独特设计的测序接头,WO2025/140181测序接头中包含非随机UMI,并通过UMI的序列以区分基因组和甲基化组。将测序接头与靶核酸连接后的结构示意图如图12所示,构建基因组和甲基化组的混UMI为8个碱基长度的4组固定序列ATCGAGTC,CCGTGGAA,ATCATGCG,质控后的数据截取序列前8个碱基作为UMI序列。10将提取的UMI与设计的4组UMI进行序列比对,提取UMI与设计UMI一致,即提取UMI为ATCGAGTC,CCG

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论