版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2020.08.11PCT/NL2018/0508312018.12.11WO2019/117714EN2019.06.20US2010069263A1,2010.03.18US2016376647A1,2016.12.29本发明涉及用于制备用于测序的双链靶DNA端和39端的双链主链DNA分子,所述59端和39端提供为:与所述靶DNA的59端和39端为连接兼容所述靶DNA提供59端和39端,以使所述5端为防止自连接的形式,并且与所述主链DNA的在连接酶和切割所述第一限制酶识别位点的第一限制酶的情况下,将所述靶DNA连接至所述主链DNA,从而产生包括主链DNA分子和靶DNA分子后通过滚环扩增产生包括所述至少一个DNA环的2述序列不被切割通过主链的自连接形成的所述限制酶位点的所述限制酶识别或切-所述主链DNA分子具有200至600个核苷酸的长度,并且具有10或更高的分数的柔性,其中所述主链DNA分子具有30-60%的GC含量和1.5Sh或更高的香农熵值,并且其中所述连7.根据权利要求1至6中任一项所述的方法,其中8.一种用于评估主链DNA分子的靶DNA捕获效率的方法,包括权利要求1中的步骤并且进一步包括比较不同主链DNA分子之间的靶DNA分9.一种长度为200至600个核苷酸的线性双链主链DNA分子的集合,所述DNA分子包括5’3和-所述连接体的所述序列不具有由少于10个核苷酸隔开的多于6个核苷酸的自互补基12.根据权利要求10所述的主链DNA分子的集合,其中所述连接体包括30至900个核苷13.根据权利要求9至12中任一项所述的主链DNA分子的集合,进一步包括在所述第一14.根据权利要求9至12中任一项所述的主链DNA分子的集合,包括捕获的核酸分子的其中所述靶DNA分子与所述主链DNA分子以1:5至5:从而产生包括主链DNA分子和靶DNA分子4-所述连接体的所述序列不具有由少于10个核苷酸隔开的多于6个核苷酸的自互补基18.根据权利要求17所述的试剂盒,进一步包括具有高持续合成能力的聚合酶和任选20.根据权利要求18所述的试剂盒,进一步5用的下一代测序(NGS)方法代替。最近,这些方法已在文献(Goodwin等2016;Nature突变和测序较长的靶DNA(也可利用短读取方法测序)中的错误。这通常通过对可被对齐的的平台是PacificBiosciences系统(RSII和Sequel)和OxfordNanopore系统(MK1MinION[0009]-如果还不存在,则为所述靶DNA提供作为防止自连接的形式并且与所述主链DNA[0011]-在存在连接酶和切割所述第一限制酶识别位点的第一限制酶的情况下,将所述6[0014]-通过滚环扩增产生包括所述至少一个DNA环的拷贝的有序阵列的多连体DNA分[0016]还提供了长度在50至1000个核苷酸的DNA分子(主链)的集合,所述DNA分子包7[0046]本文所述的手段和方法可多次确定相同靶DNA分子的序列。这可被用作改正错误[0047]靶核酸通常为双链DNA。需要确定序列的单链DNA或RNA可通过本领域已知的方法容易地转化成双链DNA。这种方法包括但不限于cDNA合成、逆转录酶(RT)聚合酶链反应3’端为连接兼容的。连接兼容的是指末端的彼此连接产生具有正确配对的核苷酸的双链[0051]双链靶DNA分子包括待确定序列的核酸分子的序列。待确定序列的核酸分子可已8接头具有不被切割通过主链的自连接形成的(第一)限制酶位点的限制酶识别/切割的序[0058]防止自连接和/或防止连接至其他靶DNA分子并不一定是绝对的。过程可/将在某93’5’[0078]连接兼容的末端的连接能够产生限制酶切位点。如果末端和侧翼序列(如果有的[0081]突出端与EcoRI限制酶产生的突出端相同。连接只在一些情况下产生限制酶切位[0087]靶DNA的末端的序列因此确定通过兼容末端的连接形成的连接接头是否能被切割化和滚环扩增(RCA)的产物形成。主链的插入捕获效率可通过可形成的多聚体的数量来估5’-AATTC..的末端时,与主链的连接接头为可被EcoRI酶切的。与其他序列的接头不被EcoRI酶切。通过选择产生很少或不产生突出端的酶和通过选择在识别位点需要更多特异链的末端可阻碍通过该主链捕获靶核酸。通过第一限制酶的存在可抵制主链末端的连接。明的方法特别适于产生具有一个主链和一个靶核酸在去除线性DNA之后进行滚环扩增通常产生主链和靶DNA列对产生较长核酸分子的相同环状DNA进行重复拷贝。用于滚环扩增的现有技术使得产生个、四千个或更多的核苷酸而不与DNA模板分开。具有高持续合成能力的聚合酶在文献能力和链置换能力的比如phi29聚合酶的聚合酶能够产生非常高的分子量的多连体。该聚合酶可聚合10kb或更多。所以优选的高持续合成能力的聚合酶是聚合10kb或更多而不与[0099]具有双链环状DNA的优势在于其中一条链可被用作滚环扩增的模板。例如通过使[0100]对获得链特异性序列的进一步优化可涉及使用(或另外使nanoporetechnology)中[0102]自由循环的或与血液或其他体液样品中细胞颗粒结合的DNA通常小于400个核苷现有平台为太平洋生物科学(PacificBiosciences)系统(RSII和Sequel)和牛津纳米孔序方法为单分子实时(SMRT)测序方法。产生的多连体具有至少一个所述DNA环的拷贝的有或标识符为序列可在主链之间不同的核酸的延伸。条形码可被用于对特异性DNA环的测序合中的相同条形码的数量是低的时候。一组DNA环的序列的测序结果可被用于过滤掉比如主链优选的包括至少两个具有唯一标识符的中的主链的长度优选地为90至16000个核苷酸,优选地为200至12000个核苷酸,优选地为[0109]GGGCATGCACAGATGTACACGTACGATCATGTACGTCACGCGAGTGCACGTCGTCATAGCTGTCGAGTACTGTACTGACTGTCTCGAGCCTCAGCGAGTATTTAAATCTACGTAGAGTACGACTGCGCAGATGTGATCAGTGACTACGTGACACTGTACATCAGCACGATCGATGACTAGATGCTGCATGACATAG[0111]GGGCATGCACAGATGTACACGTACGATCATGTACGTCACGCGAGTGCACGTCGTCATAGCTGTCGAGTACTGTACTGACTGTCTCGAGCCTCAGCGAGTATTTAAATCTACGTCACCGGGTCTTCGAGAAGACCTGTTTAGAGTACGACTGCAAATGGCTCTAGAGGTACCCGTTACATAACTTACGCAGATGTGATCAGTGACTACGTGACACTGTACATCAGCACGATCGATGACTAGATGCTGCATGACATAG[0113]GGGCATGCACAGATGTACACGTACGATCATGTACGTCACGCGAGTGCACGTCGTCATAGCTGTCGAGTACTGTACTGACTGTCTCGAGCCTCAGCGAGTATTTAAATCTACGTCACCATATATATGGATATATATATGGATATATATATATATGGATATATGGATATATATATATATATATGGATATGTATGGATATATATATATATGGATATGGATGTTTAGAGTACGACTGCAAATGGCTCTAGAGGTACCCGTTACATAACTTACGCAGATGTGATCAGTGACTACGTGACAC[0115]GGGCATGCACAGATGTACACGAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGGTCTTCGAGAAGACCTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTTTTAGCGCGTGCGCCAATTCTGCAGACAAATGGCTCTAGAGGTACCCGTTACATAACTTATAGATGCTGCATGAC[0117]GGGCATGCACAGATGTACACGATTCCCAACACACCGTGCGGGCCATCGACCTATGCATACCGTACATATCATATATAAATCACATAATTTATTATACGTATGTCGCGCGGGTGGCTGTGGGTAGATGCTGCATG[0119]GGGCATGCACAGATGTACACGCACTACATGCCAATGCCCAAGCAGTGCGCATATCACGTATCATATCTAATATATTATAATATTATGATAATGAGTATTTATTTAATTTGTTTGTGTGAGGTAGATGCTGCATGACATA[0121]GGGCATGCACAGATGTACACGCATTGGCCGTCTGTGCTGTCCATGGATCGTCTGATTGATATGATATCATATATTATAATTATACAGTAAGGTGATTGGGTATTGAGGGTTGTGTGGTTGGTAGATGCTGCATGA[0123]GGGCATGCACAGATGTACACGGTAGACATGCGAAGCGTGCGATGACAATCGATGTGGACATCATGCATATATATGTTGTATAATTAAACAAATATGTGTAGTGTGTGAGGTGGGTGTAGGAAGTAGATGCTGCATGA[0125]GGGCATGCACAGATGTACACGTTGTCATGGGAATTTGTGGTTATGAAATGAGTATGCGACGAATATGTATACATATATATTAAATTATAGAGTGATGTATGAGTTTGTGATGTGTGGTGTATAGATGCTGCATGA[0127]GGGCATGCACAGATGTACACGGCGGCGCAAGATGATGTGCCGAACCTGACATGGCATCGACTGGTATGGATCAATACTGATGCGATATCGATACCGGATAAATCATATATGCATAATATCACATTATATTAATTATAATACATCGGCGTACATATACACGTACGCATCATTTCACTATCTATCGGTACTATACGTAGTGCCGGTCTGTTGGCCGGGCGACATA[0129]GGGCATGCACAGATGTACACGTGACGCAACGATGATGTTAGCTATTTGTTCAATGACAAATCTGGTATGATCAATACCGATGCGATATTGATATCTGATAACTCATATATGTAGAATATCACATTATATTTATTATAATACATCGTCGAACATATACACAATGCATCTTATCTATACGTATCGGGATAGCGTTGGCATAGCACTGGATGGCATGACCCTCATT[0131]GGGCATGCACAGATGTACACGAGACCGCAAGATGATGTTCATTCTTGAACATGAGATCGGATGGGTATGGATCAATACCGATGCGATATGATAACTGATAAATCATATATCTATAATATCACATTATATTAATTATAATACAGGATCGTTACATGCATACACAATGTATACTATACGTATTCGGTAGTTAGTGTACGGTCGGAATGGAGGTGGTGGCGGTGAT[0133]GGGCATGCACAGATGTACACGAATCCCGAAGATGTTGTCCATTCATTGAATATGAGATCTCATGGTATGATCAATATCGGATGCGATATTGATACTGATAAATCATATATGCATAATCTCACATTATATTTATTATAATAAATCATCGTAGATATACACAATGTGAATTGTATACAATGGATAGTATAACTATCCAATTTCTTTGAGCATTGGCCTTGGTGTA[0135]GGGCATGCACAGATGTACACGAATCCGTGAGATGACTATCTTATTTGTGACATTCATCGATCTGGATATGATCAATACCATGCGATATTGATTACTGATAAATCATATATGTAGAATATCACATTATATTAATTATAATAAATCGTCGTACATATACATCCACAATTAGCTATGTATACTATCTATAGAGATGGTGCATCATCGTACTCCACCATTCCCACTA[0137]GGGCATGCACAGATGTACACGCATAAGACCACAGGGTGCAAATCTGGATTGCGGCATGGATGATTCATCATCGTGGCATATTCGCTATGGATATATCCATCATAATACATTGATACGTCATGCGTATAATCGCATTATATGTCGATATTGGTCATAGGGATACATCCGTGTATACTATCGTATATGCGTGCAATGTAGCCATGTTAATCATGCTATAACCATAACATAAATATAATATATACAGATGGTGTATCTCTACTTATGTATGCTTGTATAGTAATGTCGATACTGATGGGTCTCCGGCCCACTACACCACCTGGCCGCTCTAGATGCTGCATGACATA[0139]GGGCATGCACAGATGTACACGGGCAATCCGCCAGGGTTCAAATATGGATATGTGATGATCGATTCAACATGCACATATGCACGATATCATATATTACTCCAGATGTCATCATCGTCGTGCGTATATGAGATATGTATTTATGCATATAATCCACCATACATGGTAGCGATATTATAGTGCGATTATGTGTATATGACTATCATGGCTATTGTTAATATATAAATCATAACCATACCACTTCCACGCCTGGTATGGCGTATAGTATAGAGATATTGTGTGATGCCCTATGTCGACCATGATGTGCCGTTGTACTGCCAATCCTAGATGCTGCATGAC[0141]GGGCATGCACAGATGTACACGTATCCATGCAGCTTATTGTAACTAGCGCATGCACGTGGTGATTCATCACATCTATATATACGATATGATATATTACACATATTTGCATAGTATCATCCGGTGTGATATCATCCGATATGCTCATACTTATTCATTGGTAGCATTGCATTGATGGATCAATAGTTATTATGACATCATGGCATGTACAATTATAAATAATACAACATACATAAATATACTATACACATCGTGTATGTGTTATACAGATCTGTGTGATGTATGATAATGTAATGGCGTCGAACACCACAAGGCAGTCCTATAATAGATGCTGCATGACATA[0143]GGGCATGCACAGATGTACACGGTCCATTACAATCGAATCTATATCCCAATGTGTATCGATTATCACCACAATGACATAATACGATATCATATATTACTCCATATGCCTTACGTCAGATCGTTATATGAGATATGTATTCATGCATATGATATCCCACAGTACACGTCGTCTAATGCCATCATGAATGTATGACATATCTAGTCGATTATACATAATATAACATACCAATATAACAATATCTATACACATTTGATGGCGTATAGTATAAAGATATTGTGGCAATGCCCATACACCACTGACTGTCGCCGATCATTCCTACCACTAGATGCTGCATGACATA[0145]GGGCATGCACAGATGTACACGACCGACCGTGAAAGTGATTCAGAATGATGTGCATGAATGTTATCATGACATGATTTATGATGCACTGATATATGCATATTATAATATTGTACAATGTCGTATATACGACATATCTATACTATGAATTATGGCATCATGGACAATAGATGGTAAGGTATAGTACGATCTATATAGCATGTTGAAATGGGATATAAATTATCATAAACATACATACTTAACTAATATCAAGATGATATGTGTATGACATCAGAATGATAGTAGTAATGAGTATTGTCAGATGTATGTACGAATATCACACGATTAGATGCTGCATGACATA[0148]GGGCATGCACAGATGTACACGAATCCCGAAGATGTTGTCCATTCATTGAATATGAGATCTCATGGTATGATCAATATCGGATGCGATATTGATACTGATAAATCATATATGCATAATCTCACATTATATTTATTATAATAAATCATCGTAGATATACACAATGTGAATTGTATACAATGGATAGTATAACTATCCAATTTCTTTGAGCATTGGCCTTGGTGTA[0149]固定长度的主链的柔性可通过定制主链的序列来调节。[0150]每个碱基对的游离能值(Breslauer等1986)和扭转角的偏差(度)(Sarai等1989)[0152]TwistFlex算法(http://margalit.huji.ac.il/TwistFlex/)(Menconi等2015)的python实现可被用于计算输入序列的扭转角处的DNA柔性。基于下面的角度表计算每个单[0156]字符串的香农(Shannon)熵被定义为编码该字符串所需的每个符号的最小平均比[0165]主链核心序列优选地不具有8个或更多个在相同条链中自互补的连续碱基。例外异性序列对主链的柔性和复杂度分数的影响可以[0169]连接体优选地具有一个或多个下述特征:(i)连接体序列的总体复杂度优选地为高的。上述的香农熵公式为用于确定给定序列的复杂度的值的方法;(ii)长于5个碱基的其中基序多于6个连续碱基);(iii)连接体优选地不包括两个以上,优选地不包括一个以[0170]主链优选地包括的GC含量为30%-60优选地为40%-60优选地为40%-50优选地为45%-55%。环状DNA的顺序连接。主链优选地包括使区分原始捕获的核酸和其随后的测序读取长度的列。[0177]本发明的方法优选地产生与由靶核酸-主链拷贝组成的多个单元形成的线性dsDNA一样长(>10Kb)的多连体。这种单元的多连体化/多聚化有利于从测序错误中区分真[0178]主链包括编码第一限制酶识别位点(限制酶位点)的一部分的3’序列和编码第一来标记每个单一主链分子的唯一分子条形码序列。被所述第一限制酶切割的有效性。主链优选地进一步包括为I型或II型限制酶位点的第二[0190]-在存在连接酶的情况下将所述靶DNA连接至所述主链,从而产生包括主链和靶隔开,并且其中所述进一步的限制酶切位点为所述主链中的所述限制酶的唯一识别位点。[0204]靶位点特异性重组酶为基因重组酶。靶位点特异性DNA重组酶广泛用于多细胞生的酪氨酸重组酶。该酶使用拓扑异构酶I相似机制来进行位点特异性重组事件。该酶(38kDa)是位点特异性重组酶的整合酶族的成员,并且已知它催化两个DNA识别位点(LoxP位点)之间的位点特异性重组事件。该34碱基对(bp)loxP识别位点由两个13bp的回文序列自λ噬菌体的Redα/Redβ,在不需要限制酶位点或连接酶的情况下帮助DNA片段的克隆或亚克隆进入载体。RecE/RecT、Redα/Redβ和其他类似的蛋白质对在本文中进一步称为RecE/在一个载体中被命名为Red/ET重组,并且该方法的基本原理是在线性片段、双链断裂[0207]同源区域(HRs)的插入通常是通过将它们包括在用于产物的扩增的寡核苷酸中来过使用质粒或适配体(adaptor)的传统限制/一种特异性的限制酶可以在其识别位点或附近的某个位置内切割两个核苷酸之间的序列。化可以使用一些磷酸酶中的任意一种完成,这种磷酸酶包括快速脱磷酸化试剂盒(NEB#[0219]在许多现代分子生物学工作流程中DNA连接是中心步骤。DNA连接酶催化邻近DNA或粘性末端的dsDNA片段以形成重组DNA质粒,在下一代测序和许多其他应用中为片段化DNA添加条形码化的适配体。来自T4噬菌体的DNA连接酶是最常用的连接酶。它可以连接DNA、寡核苷酸、以及RNA和RNA-DNA杂交体的粘性或粘着末端。它也可以高效地连接平端ssDNA合成环状ssDNA分子时非常有用。环状ssDNA分子可被用作滚环复制或环状转录的底可以理解的是本发明的范围可包括具有所述特征的全部或部分B)使用短读取长度和没有主链的测序反应和使用主链的长读取[0226](2)为用于切口酶BbvCI的限制酶切位点。任意其他切口位点也可以,然而使用能想使用切口的DNA而不是DNA引物来融合基因DNA,并且有两个阴影指示来自一个基因的部分和来自另一个基因的部分。很明合结果的cDNA的序列。RCA产物。(B)用(A)中所指示的样品作为输入的MinIONR9.4试验而产生的纳米孔读取长度链与插入的比例进行连接。蓝色柱表示在不添加SrfI和HMGB1的情况下BB2和BB3与相同插[0243]图15、使用各种DNA模板的RCA产物。使用来源于各种来源的环状DNA模板来进行RCA。(A)使用主链BB2环化的细胞游离DNA;(B)质粒pX_Zeo;(C)使用Circ连接酶II使用长范围的1Kb序列梯。序列梯的较高条带为10Kb长,RCA产物估计在20kb和100kb长之[0247]图19、(A)与TP53突示了非参考等位基因的高分数,并且这些含有带有期望的chr17:7578265的插入,A->T突点的适配体连接至插入DNA或通过扩增带有引物的插入,该引物包括编码所述位点A和B的间DNA包括整个主链所特有的限制酶切位点。箭头指示插入和主链首先通过添加重组酶重[0251]图23、来源于通过BB200系列的主链的连接形成的RCA产物的测序读取中的数量参考序列的模式化后的纳米孔信号和来源于实验序列的信号之间的距离(平均匹配分数)。[0259]本文所描述的方法是通过对核酸分子(DNA)库中的核酸序列进行测序以允许基因[0263]2)用于DNA切口酶的识别位点,该DNA切口酶用于产生用于滚环扩增的“单链模[0278]在定制的演变算法的帮助下设计出柔性DNA延伸,演变算法利用以下中的各种选[0285]下面的方案是为制备适合于RCA反应的模板制备的。任意环状DNA都是合适的模[0311]基于从人细胞中提取的RNA,我们开发了使用环化和滚圈扩增的方案以检测融合[0325]我们使用Invitrogen的SuperScriptII试剂盒,任意其他的cDNA转录试剂盒都[0338]我们加入这一步是为了降低游离Mg2+的浓度,会抑制下一个反应中所使用的[0380]为了使得对任意双链DNA分子的超精确靶向测序,我们基于现有分子反转探针[0383]1.阵列提取的MIP前体寡核苷酸(从Agilent获得的100-mers混合物)在pH为8和0.1%之间的Tris-EDTA缓冲液中溶22 [0386]它在0.2mlPCR试管中被分为8x50μl的反应。一次PCR制备产生约1.5μg的扩增[0394]4.按照厂家说明,使用QIAquickPCR[0396]6.在6%TBEPAGE凝胶(Invitr[0404]1.对酶切探针混合物中可用MIP22[0424]2.将捕获反应的温度降至37℃,并在加入4μl的外切酶混合物之前至少孵育1分[0439]GGGCATGCACAGATGTACACGTACGATCATGTACGTCACGCGAGTGCACGTCGTCATAGCTGTCGAGTACTGTACTGACTGTCTCGAGCCTCAGCGAGTATTTAAATCTACGTAGAGTACGACTGCGCAGATGTGATCAGTGACTACGTGACACTGTACATCAGCACGATCGATGACTAGATGCTGCATG[0441]GGGCATGCACAGATGTACACGTACGATCATGTACGTCACGCGAGTGCACGTCGTCATAGCTGTCGAGTACTGTACTGACTGTCTCGAGCCTCAGCGAGTATTTAAATCTACGTCACCGGGTCTTCGAGAAGACCTGTTTAGAGTACGACTGCAAATGGCTCTAGAGGTACCCGTTACATAACTTACGCAGATGTGATCAGTGACTACGTGACACTGTACATCAGCACGATCGATGACTAGATGCTGCATGAC[0443]GGGCATGCACAGATGTACACGTACGATCATGTACGTCACGCGAGTGCACGTCGTCATAGCTGTCGAGTACTGTACTGACTGTCTCGAGCCTCAGCGAGTATTTAAATCTACGTCACCATATATATGGATATATATATGGATATATATATATATGGATATATGGATATATATATATATATATGGATATGTATGGATATATATATATATGGATATGGATGTTTAGAGTACGACTGCAAATGGCTCTAGAGGTACCCGTTACATAACTTACGCAGATGTGATCAGTGACTACGTGACACTGTACATCAGCACGATCGATGACTAGATGCTGCATGACATA[0445]AACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGGTCTTCGAGAAGACCTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTTTTAGCGCGTGCGCCAATTCTGCAGACAAATGGCTCTAGAGGTACCCGTTAC[0447]GGGCATGCACAGATGTACACGAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGGTCTTCGAGAAGACCTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTTTTAGCGCGTGCGCCAATTCTGCAGACAAATGGCTCTAGAGGTACCCGTTACATAACTTATAGATGCTGCATGACATA中获得的100bp长的DNA延伸组成的插入(见第7节),并且为了克隆目的,在最末端添加了[0452]CACCATATATATGGATATATATATGGATATATATATATATGGATATATGGATATATATATATATATATGGATATGTATGGATATATATATATATGGATATGG[0454]CACCATATATATGGATATATATATGGATATATATATATATGGATATATGGATATATATATATATATATGGATATGTATGGATATATATATATATGGAT[0456]AAACATCCATATCCATATATATATATATCCATACATATCCATATATATATATATATATCCATATATCCATATATATATATATCCATATATATATCC[0457]BBpX2是通过在PCR扩增子最末端添加SrfI-一半-位点(GGGC)和其余通用引物序[0469]TAACTGCACCCTTGGTCTCCTCCACCGCTTCTTGTCCTGCTTGCTTACCTCGCTTAGTGCTCCCTGGGGGCAGCTCGTGGTGAGGCTCCCCTTTCTTGCGGAGATTCTCTTCCTCTGTGCGCCGGTCTCTCCCAGGACAGGCACAA[0471]CAGTTGCAAACCAGACCTCAGGCGGCTCATAGGGCACCACCACACTATGTCGAAAAGTGTTTCTGTCATCCAAATACTCCACACGCAAATTTCCTTCCACTCGGATAAGATGCTGAGGAGGGGCCAGACCTAAGAGCAATCAGTGAGGAATCAGAGGCCTGGGGACCCTGGGCAACCAGCCCTGTCGTCTCTCCAGCCCCAGCTGCTCACCATCGCTATCTGA[0482]使用TwistFlex算法的python实现(http://margalit.huji.ac.il/TwistFlex/)[0486]字符串的香农(Shannon)熵被定义为编码该字符串所需的每个符号的最小平均比[0497]较新主链由柔性DNA和末端处的一对固定序列(第6段中所描述的通用SrfI-BBF/R)组成,这些固定序列作为用于主链PCR扩增的引物退火位点、且用于添加半限制酶切位行评分和选择。然后将选中的序列用作生成新序列(子序列(children))的输入(父序列被用作父序列使用配对操作符生成子序列。为了计算序列柔性,对现有代码(Menconi等[0504]使用引物17.2-F(CAGTTGCAAACCAGACCTCA)和17.2-R(ATGAGCGCTGCTCAGATAG)来进得的反应混合物在30℃孵育3小时,然后在65℃孵育10分钟。扩增的高分子量DNA使用Ampure珠(Agencourt)进行纯化,然后制备1D纳米孔库(OxfordnanoporeTechnologies,[0507]琼脂凝胶密度测定法是一种通过比较1)序列梯和感兴趣条带之间或2)输入条带和产物条带之间的像素亮度进行的凝胶条带的图像分[0509]给定含有已知量的DNA序列梯的琼脂凝胶的图片,我们可使用ImageJ软件来估计为了创建参考水平,还计算了每幅图像中对应于400个碱基对的条带在50bpDNA序列梯[0512]测量和比较黄色矩形内条带的亮度(输入DNA在左边条带上和未反应的DNA在右边[0516]Thomas.1996.EvolutionaryAlgorithmsinEvolutionStrategies,EvolutionaryProgramming,GeneticAlgorithms.Oxford[0517]CoelloCoello,CarlosA.,andGaryB.Lamont.2004.ApplicationsofMulti-ObjectiveEvolutionaryAlgorithms.WorldScientific.[0518]Hwang,Gi-Hyun,andWon-TaeJang.2008.“AnAdaptiveEvolutionaryAlgorithmCombiningEvolutionStrategyandGeneticAlgorithm(ApplicationofSettinginEvolutionaryAlgorithms.SpringerScience[0520]Menconi,Giulia,AndreaBedini,RobertoBarale,andIsabellaSbrana.2015.“GlobalMappingofDNAConformationalFlexibilityon下来,我们使用phi29聚合酶和随机六聚使用LAST(kietbasa等2011年),纳米孔/MinION测序读取被映射到人类参考基因组(GRCh37,利用pJET序列放大的)。检测大于10kb的2083个读取的子集,以确定替换主链(pJET)和插入(TP53片段)的配置(被称为BI),该配置可能期望来自作为输入的环化模板。DNA分子的多个拷贝的纳米孔测序获得准确的共有序列读取的概念(Li等2016)。在下一步[0527]作为优化短DNA分子捕获和环化的第一步,我们测试了介导该过程的主链序列的第2节中所强调的一般原理设计的。设计这些主链的目的是将其作为我们可以改进的基本不同的连接条件(见下文)。我们还通过添加SrfI位点生成了BB3的修改版本,从而产生了用这种延伸来提高主链的柔性。在主链2(BB2)的序列中间加入一个100bp长的柔性序列来个反应混合物能够观察到PlasmidSafe消化后的弱条带,指示正确的环化产物由BB2和插潜在地改善环化的DNA弯曲蛋白(Belgrano等2013)。我们观[0544]分子条形码是一种标记单个DNA分子的策略,为了对DNA分子的测序结果进行分两个不相关的序列获得相同条形码的几率。UMI可用于获得单个序列的绝对定量(Kivioja概述了UMI在ctDNA突变检测中的优等应用。且可以放置在主链序列的任何位置,前提是它们不影响主链的柔性(从而影响连接效率)。[0549]通过主链和插入的环化反应得到的环状DNA产物可以作为经由滚环扩增(RCA)产序特异性基因而不是整个基因组的情况下有用。目前实现该方法的方式是通过PCR富集感单个扩增错误都可能导致最终结果偏差(Diaz-Cano2001;Quach,Goodman,和Shibata[0552]为了测试我们是否可以在不使用PCR的情况下获得一个靶区域的位点-特异性富SrfI的存在下混合在一起。混合物在室温下放置1到4小时,然后在70℃下对酶热灭活30分物,并且通过加热反应到98℃并持续5分钟来进行快速退火步骤。待混合物在室温下冷却于映射到参考基因组的LAST分解-读取,长读取被分为主链序列和目标序列(kietbasa等学方法,该突变的频率可变(1914%),如之前所评估的使用短读取靶向IonTorrent取,这通过与LAST(kietbasa等2011年)的映射和用于共有序列调用的自定义算法来处理“ArtifactualMutationsResultingfromDNALesionsLimitDetectionLevelsinforRapidPublicationofReportsonGAcidicTailofHighMobilityGroupProteinB1(HMGB1)inProteinStabilityandVariationDiscoveryandGenotypingUsingnext-GenerationDNASequencing[0567]-Diaz-Cano,SalvadorJ.2001.“ArePCRArtifactsinMicrodissected[0568]-Dowthwaite,Gary,andJoPickford.2015.“PCR-BasedDNAEnrichment[0570]-———.2004b.“MUSCLE:AMultipleSequenceAlignmentMethodwithandTranscriptomicPlasticityinTreatment-NaiveOvarianCancer.”GenomeC.Frith.2011.“AdaptiveSeedsTameGenomicSequenceComparison.”Genome[0573]-Kivioja,Teemu,Annavih⃞iEnge,StenLinnarsson,andJussiTaipale.2011.“CountingAbsoluteNumbersofShifangZhang,andShihongLi.2016.“BenefitsandChallengeswithApplyingUniqueMolecularIdentifiersinNextGenerationSequencingtoDetectLow[0575]-Li,Chenhao,KernReiChng,EstherJiaHuiBoey,AmandaHuiQiNg,SuppressionforImprovedDetectionofCirculatingTumorDNA.”Nature[0577]-Quach,Nancy,MyronF.Goodman,andDarrylShibata.2004.“InVitroMutationArtifactsafterFormalinFixationandErrorProneTranslesion[0578]-Sarai,A.,J.Mazur,R.NubyCovalentClosureofShortFragmentsintoCircles.”Proceedingsofthe产物或合成的DNA双链(T4多核苷酸激酶)的[0602]在50mol/l的反应中,建议在该反应中使用的最大DNA量(同时考虑到I和BB)是[0627]下面的过程允许粗略估计RCA产物中BB-I和仅BB的单体的量。利用主链中存在的制成的多连体时,我们期望400bp左右的条带,而如果多连体只有BB,产生的条带应该在[0650]>BB100_1(len:143mean_f[0651]GGGCATGCACAGATGTACACGATTCCCAACACACCGTGCGGGCCATCGACCTATGCATACCGTACATATCATATATAAATCACATAATTTATTATACGTATGTCGCGCGGGTGGCTGTGGGTAGATGCTGCATG[0652]>BB100_2(len:143mean_fl[0653]GGGCATGCACAGATGTACACGCACTACATGCCAATGCCCAAGCAGTGCGCATATCACGTATCATATCTAATATATTATAATATTATGATAATGAGTATTTATTTAATTTGTTTGTGTGAGGTAGATGCTGCATGACATA[0654]>BB100_3(len:143mean_f[0655]GGGCATGCACAGATGTACACGCATTGGCCGTCTGTGCTGTCCATGGATCGTCTGATTGATATGATATCATATATTATAATTATACAGTAAGGTGATTGGGTATTGAGGGTTGTGTGGTTGGTAGATGCTGCATGA[0656]>BB100_4(len:145mean_fl[0657]GGGCATGCACAGATGTACACGGTAGACATGCGAAGCGTGCGATGACAATCGATGTGGACATCATGCATATATATGTTGTATAATTAAACAAATATGTGTAGTGTGTGAGGTGGGTGTAGGAAGTAGATGCTGCATGA[0658]>BB100_5(len:143mean_f[0659]GGGCATGCACAGATGTACACGTTGTCATGGGAATTTGTGGTTATGAAATGAGTATGCGACGAATATGTATACATATATATTAAATTATAGAGTGATGTATGAGTTTGTGATGTGTGGTGTATAGATGCTGCATGA[0660]>BB200_1(len:243mean_[0661]GGGCATGCACAGATGTACACGGCGGCGCAAGATGATGTGCCGAACCTGACATGGCATCGACTGGTATGGATCAATACTGATGCGATATCGATACCGGATAAATCATATATGCATAATATCACATTATATTAATTATAATACATCGGCGTACATATACACGTACGCATCATTTCACTATCTATCGGTACTATACGTAGTGCCGGTCTGTTGGCCGGGCGACATA[0662]>BB200_2(len:244mean_fl[0663]GGGCATGCACAGATGTACACGTGACGCAACGATGATGTTAGCTATTTGTTCAATGACAAATCTGGTATGATCAATACCGATGCGATATTGATATCTGATAACTCATATATGTAGAATATCACATTATATTTATTATAATACATCGTCGAACATATACACAATGCATCTTATCTATACGTATCGGGATAGCGTTGGCATAGCACTGGATGGCATGACCCTCATT[0664]>BB200_3(len:244mean_f[0665]GGGCATGCACAGATGTACACGAGACCGCAAGATGATGTTCATTCTTGAACATGAGATCGGATGGGTATGGATCAATACCGATGCGATATGATAACTGATAAATCATATATCTATAATATCACATTATATTAATTATAATACAGGATCGTTACATGCATACACAATGTATACTATACGTATTCGGTAGTTAGTGTACGGTCGGAATGGAGGTGGTGGCGGTGAT[0666]>BB200_4(len:243mean_fl[0667]GGGCATGCACAGATGTACACGAATCCCGAAGATGTTGTCCATTCATTGAATATGAGATCTCATGGTATGATCAATATCGGATGCGATATTGATACTGATAAATCATATATGCATAATCTCACATTATATTTATTATAATAAATCATCGTAGATATACACAATGTGAATTGTATACAATGGATAGTATAACTATCCAATTTCTTTGAGCATTGGCCTTGGTGTA[0668]>BB200_5(len:243mean_flex:13[0669]GGGCATGCACAGATGTACACGAATCCGTGAGATGACTATCTTATTTGTGACATTCATCGATCTGGATATGATCAATACCATGCGATATTGATTACTGATAAATCATATATGTAGAATATCACATTATATTAATTATAATAAATCGTCGTACATATACATCCACAATTAGCTATGTATACTATCTATAGAGATGGTGCATCATCGTACTCCACCATTCCCACTA[0670]>BB300_1(len:348mean_fl[0671]GGGCATGCACAGATGTACACGCATAAGACCACAGGGTGCAAATCTGGATTGCGGCATGGATGATTCATCATCGTGGCATATTCGCTATGGATATATCCATCATAATACATTGATACGTCATGCGTATAATCGCATTATATGTCGATATTGGTCATAGGGATACATCCGTGTATACTATCGTATATGCGTGCAATGTAGCCATGTTAATCATGCTATAACCATAACATAAATATAATATATACAGATGGTGTATCTCTACTTATGTATGCTTGTATAGTAATGTCGATACTGATGGGTCTCCGGCCCACTACACCACCTGGCCGCTCTAGATGCTGCATGACATA[0672]>BB300_2(len:343mean_fl[0673]GGGCATGCACAGATGTACACGGGCAATCCGCCAGGGTTCAAATATGGATATGTGATGATCGATTCAACATGCACATATGCACGATATCATATATTACTCCAGATGTCATCATCGTCGTGCGTATATGAGATATGTATTTATGCATATAATCCACCATACATGGTAGCGATATTATAGTGCGATTATGTGTATATGACTATCATGGCTATTGTTAATATATAAATCATAACCATACCACTTCCACGCCTGGTATGGCGTATAGTATAGAGATATTGTGTGATGCCCTATGTCGACCATGATGTGCCGTTGTACTGCCAATCCTAGATGCTGCATGAC[0674]>BB300_3(len:344mean_f[0675]GGGCATGCACAGATGTACACGTATCCATGCAGCTTATTGTAACTAGCGCATGCACGTGGTGATTCATCACATCTATATATACGATATGATATATTACACATATTTGCATAGTATCATCCGGTGTGATATCATCCGATATGCTCATACTTATTCATTGGTAGCATTGCATTGATGGATCAATAGTTATTATGACATCATGGCATGTACAATTATAAATAATACAACATACATAAATATACTATACACATCGTGTATGTGTTATACAGATCTGTGTGATGTATGATAATGTAATGGCGTCGAACACCACAAGGCAGTCCTATAATAGATGCTGCATGACATA[0676]>BB300_4(len:344mean_flex:13[0677]GGGCATGCACAGATGTACACGGTCCATTACAATCGAATCTATATCCCAATGTGTATCGATTATCACCACAATGACATAATACGATATCATATATTACTCCATATGCCTTACGTCAGATCGTTATATGAGATATGTATTCATGCATATGATATCCCACAGTACACGTCGTCTAATGCCATCATGAATGTATGACATATCTAGTCGATTATACATAATATAACATACCAATATAACAATATCTATACACATTTGATGGCGTATAGTATAAAGATATTGTGGCAATGCCCATACACCACTGACTGTCGCCGATCATTCCTACCACTAGATGCTGCATGACATA[0678]>BB300_5(len:344mean_fl[0679]GGGCATGCACAGATGTACACGACCGACCGTGAAAGTGATTCAGAATGATGTGCATGAATGTTATCATGACATGATTTATGATGCACTGATATATGCATATTATAATATTGTACA
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026湖南省兵器工业集团股份有限公司市场化招聘1人备考题库附答案详解(考试直接用)
- 2026贵州安顺市消防救援支队招聘政府专职消防员13人备考题库(第二批)及答案详解(必刷)
- 2026浙江中外运有限公司温州分公司招聘2人备考题库含答案详解(培优b卷)
- 2026甘肃庆阳市市本级新开发城镇公益性岗位备考题库参考答案详解
- 2026江西联合股权交易中心社会招聘6人备考题库参考答案详解
- 2026河北传媒学院高层次人才招聘备考题库及答案详解1套
- 旅游导游服务规范与知识手册
- 铁路运输安全与事故处理手册
- 航空运输安全与操作手册-1
- 品牌管理与渠道开发手册
- 《埋地给水钢管道水泥砂浆衬里技术标准》
- 精神疾病医疗证明模板大全
- 2025年承包商入场安全教育试卷(含答案)
- 公交站整体吊装施工方案
- 水性漆喷涂工艺流程图
- 实施指南(2025)《CB4205-2012 重大件吊装作业安全要求》
- 水文站职工安全培训内容课件
- 气动工具安全培训课件
- 客户开发与客户维护课件
- 【《履带消防机器人的参数校核计算案例》2100字】
- 奔驰GL350GL450GL550中文版说明书
评论
0/150
提交评论