版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2020.11.20PCT/US2019/0233562019.03.21WO2019/183346EN2019.09.26WO2009155443A2,2009.12.23GenomeRewiringduringMouseErezLieberman-Aidenetal..ComprehensiveMappingofLo用于分析染色质相互作用数据的方法和设备使用二叉搜索树将基因组元件触点或读段编译归一化方法应用于具有可变大小和/或形状的所述箱对的相互作用频率以生成每个箱对的经归相互作用频率来识别具有富集的触点和贫化的2CalebWeinrebetal..Identiofhierarchicalchromatindomains.GalipGürkanYardımcıetal..3由所述一个或多个处理器生成n×m个箱对的矩阵,其中n对应于所述第一组所述多个由所述一个或多个处理器对所述相互作用频率中的每个相互作用频率进行归一化以由所述一个或多个处理器确定所述一组成对触点的密度随基因组距离的变化以生成由所述一个或多个处理器对所述箱对的区域上的密度函数进行积分以确定所述箱对由所述一个或多个处理器通过使用泊松统计分布执行统计分析来将所述箱对内的成由所述一个或多个处理器将用于多重比较控制的错误发现率应用于所确定的似然度由所述一个或多个处理器使用泊松分布执行统计分析以确定所述箱对的所述实际密度小于所述箱对的所述预期密度的量明显显著的第由所述一个或多个处理器将用于多重比较控制的错误发现率应用于所确定的第二似3.根据权利要求2所述的方法,其中所述统计分析包含用于确定所述箱对的所述实际由所述一个或多个处理器将用于多重比较控制的错误发现率应用于所确定的第三似4其中所述成对触点中的至少一些成对触点是顺式触点,使得所其中所述成对触点中的至少一些成对触点是反式触点,使得所由所述一个或多个处理器识别DNA序列中与一种或多种分子表型相关或以因果关系相由所述一个或多个处理器将含有所述单个基因座的所述箱的所述染色质相互作用数由所述一个或多个处理器基于染色质相互作用的所述映射生成染色体结构的3D或4D9.根据权利要求1所述的方法,其中识别每个箱对内的成对触点的所述子集包含使用其中每个箱对应于包含以下至少一种的脱氧核糖核酸(DNA)序列的连续片段:拓扑关12.根据权利要求11所述的方法,其中识别第一组所述多个箱和第二组所述多个箱包对于所述箱对中的一个或多个箱对,由所述一个或多个处理器将来自第一统或生理条件的所述箱对的实际密度与来自第二生物细胞系统或生理条件的所述箱对的5非暂时性计算机可读存储器,所述非暂时性计算机可读存储器耦处理器并且在其上存储指令,所述指令当由所述一个或多个处理器执行时使所述计算装生成n×m个箱对的矩阵,其中n对应于所述第一组所述多个箱,并对所述相互作用频率中的每个相互作用频率进行归一化以生成每个箱对的经归一化经由所述通信网络提供染色质相互作用的映射以在用户界面确定所述一组成对触点的密度随基因组距离的对所述箱对的区域上的密度函数进行积分以确定所述箱对的预通过使用泊松统计分布执行统计分析来将所述箱对内的成对触点的所述子集与所述将用于多重比较控制的错误发现率应用于所确定的似然度以确定经过调整的似然度;其中所述密度函数由经验数据产生,并且所述密度函将含有所述单个基因座的所述箱的所述染色质相互作用数据与另一个生物细胞系统17.根据权利要求14所述的计算装置,其中使用二叉搜索树来识别每个箱对内的成对618.根据权利要求17所述的计算装置,其中为了识别第一组所述多个箱和第二组所述7[0002]本申请要求于2018年3月22日提交的标题为“染色质相互作用数据分析的方法和末端读段编译成表示基因组位置对在空间上相互作用的频正方形基因组的任何给定部分中的接触频率将与同一TAD对中的更远序列部分比跨越TAD[0008]最近的工作已经开始解决固定箱的缺点。SHAMAN包省去8座分成两半以检测由功能元件介导的长程顺式和反如,基因座并将所述一组元件分割成不同大小的箱。可以将箱选择为在同一个箱中包含相关的基因组元件并防止将基因组元件分成两半。例如,每个箱可以对应于脱氧核糖核酸体1的第一组箱和对应于染色体8的第二组箱并将其放用例如二叉搜索树识别与成对末端读段对应的位置对或具有可能含有所述位置对的箱对的其它在空间上相互作用的位置(即其中所述箱中的一个箱含有所述基因座中的一个基因外,根据每个箱对内的成对触点的密度随基因组距离的变化来对相互作用频率进行归一分布p值(例如可以向其应用Benjamini错相互作用系统然后可以提供用于在用户界面上显示对具有例如富集或贫化的触点的箱对用预测受试者的分子表型。富集或贫化的触点也可以用于对染色体的3D和4D结构进行建9或贫化的触点可以用于定位功能性TAD的反式和远侧顺式结合配偶体,并构建空间触点网述箱对中的每个箱对内的成对触点的子集,确定所述箱对中的每个箱对的相互作用频率,对所述相互作用频率中的每个相互作用频率进行归一化以生成每个箱对的经归一化的相[0016]在另一个实施例中,提供了一种用于分析染色质的空间和时间组织的计算装[0017]图1A展示了根据当前描述的实施例的示例性染色质相互作用系统可以在其上操[0018]图1B是根据当前描述的实施例的可以在图1A的系统中操作的示例性染色质相互[0019]图1C是根据当前描述的实施例的可以在图1A的系统中操作的示例性客户端装置[0020]图2描绘了根据当前描述的实施例的一组示例箱,每个箱对应于染色体中基因座[0022]图4描绘了根据当前描述的实施例的箱对和相应的经归一化的相互作用频率的示[0023]图5描绘了根据当前描述的实施例的示例密度函数,每个密度函数表示成对触点[0024]图6是表示用于从受试者的生物样品中生成染色质相互作用数据的示例性过程的[0025]图7A描述了根据当前描述的实施例的富集的触点和对应的基因座和/或与分子表[0026]图7B描绘了根据当前描述的实施例的从空间相互作用数据生成的示例染色质相[0027]图8展示了根据当前描述的实施例的表示用于分析染色质空间组织的示例性方法[0028]图9展示了对描述由染色质相互作用系统识别的触点数量和由替代系统识别的触个单元的基因组内的DNA序列的连续片段。这种箱可以根据特定分析针对各种目的进行选1010,Chr8:15000分配给箱对Chr1:1000-2000*Chr8:10000-20000,因为这一读段对位于函数可以针对特定箱序列中的GC序列百分比、Hi-C测序数据集中特定箱序列的序列覆盖相互作用服务器可以向客户端装置提供对箱对的指示和对其相应的经归一化相互作用频通过例如单独比较来自每个数据集的富集和贫化触点来确定例如一对触点组之间的一组[0042]参考图1A,示例染色质相互作用系统100识别选定的一组读段对和箱的箱对内的互作用以及其它形式的临床和/或全景信息使用别处描述的其它方法来进行。富集或贫化于确定特定组织或细胞系中的一对基因座是否相[0043]染色质相互作用系统100包含染色质相互作用服务器102和可以通过网络130通信客户端装置106-116可以在通信网络130上通过无线信号120进行通信,所述通信网络可以置也可以与染色质相互作用服务器102进行通信。[0046]染色质相互作用服务器102也可以通信地连接到读段对和箱[0047]存储器150可以是有形的非暂时性存储器,并且可以包含任何类型的合适的存储装置106-116、染色质相互作用服务器102或染色质相互作用服务器102与客户端装置106-一组读段对和多组箱。空间组织模块160然后可以使用每组而变化的密度函数将箱对中读段对的实际密度与预期密度进行比较来识别每个箱对的经是否具有富集的触点。空间组织模块160可以对提供箱对的指示和对相应的经归一化的相[0049]染色质相互作用服务器102可以通过网络130与客户端装置106-116进行通信。数器224还可以包含数据库239,或以其它方式通信连接到所述数据库或其它数据存储机制通过网络130与用户交互所需的其它数据。数据库239可以包含与上面参考图1A描述的数据库154相似的数据。电路。控制器224可以将一个或多个RAM230和/或程序存储器226实施为例如半导体存储箱对的经归一化相互作用频率,并向医疗保健专业人员或研究人员的客户端装置106-116提供对箱对的指示和对归一化相互作用频率的指示。服务器应用238可以是单个模块238,[0053]尽管在图1B中将服务器应用238描绘为包含两个模块238A和238B,但是服务器应数据、多个例程268的例程数据等数据和/或通过数字网络130与染色质相互作用服务器102交互所必需的其它数据。在一些实施例中,控制器242还可以包含驻留在膝上型计算机114或以其它方式通信连接到所述其它数据存储机制。当理解的是,尽管图1C仅描绘了一个微处理器248,但是控制器242可以包含多个微处理器[0056]除其它软件应用之外,一个或多个处理器248可以适于并被配置成执行驻留在程序存储器246中的多个软件应用264中的任何一个或多个和/或多个软件例程268中的任何显示信息和/或从膝上型计算机发送信息相[0057]多个应用264中的一个应用可以是本地应用和/或网络浏览器270(如Apple'sSafari®、GoogleChrome-、MicrosoftInternetExplorer®和MozillaFirefox®),所示来自染色质相互作用服务器102的网页信息,同时还从如医疗保健专业人员或研究人员[0058]多个例程中的一个可以包含空间组织显示例程272,其获得对箱对的指示和对经储器可以存储能够在处理器142上执行的用于空间组织模块[0061]图2展示了一组示例箱200,每个箱表示说明性地标记为染色体A的染色体的连续座308到基因座396,第五箱为从基因座396到基因座472,第六箱为从基因座478到基因座从以前的研究中确定,可以是数据库154中预先存储的箱,或者可以以任何合适的方式选在任何情况下,医疗保健专业人员或研究人员可以通过客户端装置106-116选择要用作矩是为了便于说明的一个实例。箱组可以对应于人类或其它生物体基因组中任何合适的DNA个轴的箱对应的矩阵的矩形区域可以被称为箱对。例如,箱对302对应于ChrA:478-672*读段对可以从数据库154获得,可以由研究人员或医疗保健专业人员通过客户端装置106-[0066]染色质相互作用服务器102然后可以识别与每个箱对对应的读段对的子集。对于向研究人员或医疗保健专业人员的客户端装置106提供对箱对的指示和对经归一化相互作示了可以在客户端装置106上呈现的示例空间相互作用图400或箱对的热图和相应的经归用图400中,箱对的经归一化相互作用频率用颜色等级表示,以产生染色质组织的二维映间相互作用图400上沿着从左上方到右下方的对角线的箱对被以空间相互作用图400中的[0068]空间相互作用图400和/或此类触点的其它表示可以用于生成的特定组合。例如,启动子通常带有标记H3K4me3和H3K27ac,并且增强子通常带有标记[0071]对于特定的箱对,空间组织模块160可以对跨由箱对占据的矩形区域的选定密度织模块160可以使用各种统计方法将箱对的预期密度与实际密度进行比较,以确定预期密密度。空间组织模块160可以根据泊松分布或使用单尾测试的任何其它合适的分布将预期160可以根据泊松分布或使用单尾测试的任何其它合适的分布将预期密度与实际密度进行块160可以根据泊松分布或使用双尾测试的任何其它合适的分布将预期密度与实际密度进或贫化的触点可以用于确定一对基因座在特定组织或细胞系中是否和/或在多大程度上相生物等并向染色质相互作用服务器提供通过分析生物样品获得的实验室结果。[0078]在图6中示出了用于从受试者的生物样品中生成染色质相互作用数据的示例过程[0079]此外,DNA序列的单个基因座可以被识别为与特定的分子表型相关联或以因果关析时,可以对与特定的一组分子表型相关联或以因果关系相关联的基因座的iPSC进行分果方式相关联的基因座的箱组中包含读段对,染色质相互作用服务器102可以预测受试者受检分子表型组相关或以因果关系相关的染色组织的表型和表观基因组特性。[0083]在一些实施例中,空间组织模块160然后可以向研究人员或医疗保健专业人员的客户端装置106提供对箱对的指示和对经归一化相互作用频率的指示。图7A展示了可以在客户端装置106上呈现的富集的触点和对应的基因座以及与分子表型相关联的SNP的示例分子表型的变体的集合或者特定受试者的关注基因座的集[0084]示例显示700包含染色体(例如,17号染色体)、基因座(例如,33720000-物的CYP基因,似乎具有最多的触点。显示700还包含与富集的触点相关联的SNP(例如,[0085]在又其它实施例中,客户端装置106可以显示从空间触点数据生成的染色质相互作用网络。图7B展示了根据参考图7A描述的空间触点数据生成的染色质相互作用网络750[0089]图8描绘了表示用于分析染色质的空间组织的示例性方法800的流程图。方法800性计算机可读存储器上并可在染色质相互作用服务器102上的一个或多个处理器上执行的选择特定的一组读段对,并通过客户端装置106将所选择的组提供给染色质相互作用服务器102。在另一个实例中,测序仪107可以产生提供给染色质相互作用服务器102的序列数后选择多个对,其中所述对中的两个读段在任一个读段中都存在小于阈值概率(例如,或医疗保健专业人员可以选择其中每个箱表示304的箱对所占据的矩形区域跨度为从ChrA:478-672*ChrB:1-320。这意味着任何在478与672之间具有染色体A基因座和在1与320之间具有染色体B基因座的读段对都在箱对内。[0095]然后,空间组织模块160可以将特定箱对的预期密度与特定箱对的实际密度进行度。空间组织模块160可以根据泊松分布或任何其它合适的分布将预期密度与实际密度进的差异性相互作用频率的概率的p值,然后可以用错误发现率或其它方法来校正这一[0097]在框818,空间组织模块160可以向研究人员或医疗保健专业人员的客户端装置106提供对箱对的指示和对经归一化相互作用频率的指示。这些指示可以包含经归一化的永久地配置成执行某些操作的专用电路或逻辑(例如,专用处理器,如场可编程门阵列用处理器在不同时间可以被配置成相应的不同硬件模块。因此,软件可以配置处理器例如以在一个时刻构成特定的硬件模块并且在不同时刻构成不同的硬件模块。[0109]如本文所用,术语“包括(comprises/comprising)”、“包含(includes/便起见并给出一般性描述。此描述和所附的权利要求书应被理解为包含一个或至少一个,[0113]1.一种用于分析染色质的空间使用泊松统计分布执行统计分析来将所述箱对内的成对触点的所述子集与所述箱对的所处理器使用泊松分布执行统计分析以确定所述箱对的所述实际密度小于所述箱对的所述的第二似然度小于阈值似然度时,由所述一个或多个处理器确定所述箱对具有贫化的触[0116]4.根据前述方面中任一方面所述一个或多个处理器将用于多重比较控制的错误发现率应用于所确定的第三似然度以个或多个处理器确定所述箱对具有富集的或贫[0117]5.根据前述方面中任一方面所述的些成对触点中的每个成对触点中的两个基因组元件对且所述密度函数的至少一部分随着基因组距离器识别DNA序列中与一种或多种分子表型相关或以因果关系相关的单个基因座;由所述一个或多个处理器基于所述比较预测所述受试者的器基于染色质相互作用的所述映射生成染色体结构的3[0122]10.根据前述方面中任一方面所述的述子集包含使用二
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- HJT电池技术难点分析
- 《短视频制作》课件 项目五 制作技能短视频
- 2026年高职(市场营销学)市场调研分析预测综合测试题及答案
- 2026年高职(市场营销)网络推广文案撰写试题及答案
- 2026八年级道德与法治上册 社会成功感受
- 就业信息获取与解读指南
- 农业水利:挑战与创新-实现优化管理提升农作物产量
- 农科技进阶:破局与革新-驱动农业新时代的科技筛选
- 人教版八年级上册数学课件:123三角形全等的判定SAS(共17张)
- 2026一年级上《20以内进位加法》同步练习
- YS/T 433-2016银精矿
- GB/T 6074-2006板式链、连接环和槽轮尺寸、测量力和抗拉强度
- GB 29415-2013耐火电缆槽盒
- 2022年天津市河西区中考数学一模试题及答案解析
- GA/T 1444-2017法庭科学笔迹检验样本提取规范
- 2022年大理白族自治州大理财政局系统事业单位招聘笔试试题及答案解析
- 诺和龙诺和龙在糖尿病心脑血管方面的作用专家讲座
- 阿片类药物中毒的急救处理课件
- 种业现状及发展思考课件
- 某大型化工集团公司导入WCM世界级制造策划资料课件
- DBJ∕T13-354-2021 既有房屋结构安全隐患排查技术标准
评论
0/150
提交评论