Denovo技术介绍.ppt_第1页
Denovo技术介绍.ppt_第2页
Denovo技术介绍.ppt_第3页
Denovo技术介绍.ppt_第4页
Denovo技术介绍.ppt_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Denovo技术介绍 目录 什么是Denovo 也叫从头测序 是指对基因组序列未知或没有近源物种基因组信息的某个物种 对其不同长度基因组DNA片段的文库进行序列测定 然后用生物信息学方法进行拼接 组装和注释 从而获得该物种完整的基因组序列图谱 主要产品 人类基因组测序 动植物基因组测序 细菌基因组测序 真菌基因组测序 宏基因组测序 目录 纯二代测序组装技术 建库流程 小片段建库流程 大片段建库流程 纯二代测序组装技术 纯二代测序组装技术 组装步骤图 目录 Pacbio测序组装技术 三代测序技术 又被为 SingleMoleculeRealTime SMRT DNASequencing 单分子实时DNA测序技术 该方法基于纳米孔的单分子读取技术 不需要扩增即可快速读取序列 主要代表是 PacificBioscience的SMRT技术 BioNano光学图谱技术 Nanopore PacificBio测序原理1 4种荧光分别标记4种dNTP 2 SMRTCell含有15 000个纳米级的零模波导孔 zero modewaveguides ZMWs 每个ZMW都能够包含一个DNA聚合酶及一条DNA样品链进行单分子测序 并实时检测插入碱基的荧光信号 3 测序时 荧光dNTP与酶 DNA模板行成复合物 激光照射 发出荧光 文库制备过程 将基因组DNA打断破碎成大片段 通常是20kb左右 之后经过末端修复 接头连接 片段筛选 杂交测序引物和DNA聚合酶绑定 Pacbio测序组装技术 PacificBio测序优势 1 超长的测序读长 平均测序读长达到10 15kb 最长可超过40kb 2 超高的准确度 测序深度达到30 时 准确度达到99 999 Q50 3 均一的覆盖度 无PCR扩增偏好性和GC偏好性 4 可直接检测碱基修饰 在进行基因组测序同时直接检测碱基修饰 当模板上有甲基化的A C等碱基 测序速度明显变慢 光谱特征会发生改变 从而确定该位置上的DNA被甲基化了PacificBio测序缺点错误率高达12 5 每读8个碱基 就有一个是读错的 错误类型多为 插入 即会多读一个碱基 测序错误是随机的 可以通过测序深度的提高来校正 Pacbio测序组装技术 目录 BioNano光学图谱技术 技术原理BioNano光学物理图谱技术 简而言之是利用单链酶切技术在DNA上做荧光标记 再通过纳米孔道对长达几百kb的长链DNA单分子线性化 经过高分辨率光学系统进行拍照 在较短时间获得更完整的基因图谱 在辅助基因组组装和结构变异 structuralvariants SV 检测等方面有广泛的应用 BioNano光学图谱技术 工作流程 1 酶切模拟 提供参考序列进行信息分析模拟选择合适的酶 2 DNA提取 琼脂糖包埋法 DNA分子在250Kb以上 3 实验酶切 引入荧光标记 4 DNA分子拉直并过纳米通道 5 提取片段及荧光位置信息 6 通过片段的荧光位置及距离等信息将多条有overlap的荧光片段组装成一致性片段 得到光学图谱 7 辅助组装 reference的scaffold锚定回光学图谱 构建超长superscaffold 达到延伸scaffold的目的 SV检测 通过与reference的比对检测大的结构变异 BioNano光学图谱技术 利用光学图谱有效提升组装指标 技术优势1 超长距离检测 为基因组组装提供大尺度下的远程信息 跨越重复片段和一些包含复杂元件的区域 可以用于辅助基因组复杂区域的组装 2 兼容二代测序或三代测序平台 能很好的与现有技术相结合 3 单分子检测 无任何杂信号干扰 反映最真实的DNA信息 4 无PCR过程 无片段化操作 保持DNA最原始最完整的信息 目录 Nanopore技术 技术原理Nanopore测序仪的核心是一个由4组512个纳米孔组成 由专用集成电路控制的flowcell 如图A所示 待测物流经纳米孔会导致电流发生变化 nanopore则是通过检测这些电流变化并通过分析来得到待测序列的 Nanopore技术 这三款测序仪的区别在于 MinION 只含有一个流动槽 适用于临时实验室或极端野外环境的即时采样提取测序GrodIONX5 含有五个流动槽 可单独使用或协同使用流动槽适用于大型基因组学项目或多样本项目的测序PromethION 含有四十八个流动槽 国内目前还没有此机型 Nanopore技术 1D测序的建库过程则是如图所示 1 超大分子量的DNA序列先经过打断 此步骤是为了加大接头连接的效率 2 修复及末端修复后加上一个y接头 y接头处的橙黄色圆点代表的是马达蛋白 这个蛋白的作用是1 控制DNA序列通过纳米孔的速度 目前的速度为450bp s 2 使得DNA分子解链让其单链通过纳米孔 3 最后再加上Tether 在图中以绿色圆点表示 这个的作用是引导DNA链到有纳米孔的膜上 并与膜结合从而使马达蛋白与纳米孔结合进行测序 Nanopore技术 NanoporeVSPacBio 目录 Hi C技术 Hi C技术 一种高通量染色体构象捕获技术 High throughputchromosomeconformationcapture 可以实现单个样本辅助基因组组装 使基因组达到染色体水平Hi C辅助基因组组装是指在已有二代或三代或光学图谱辅助组装的Draftgenome序列和已知染色体数目的前提下 利用Hi C测序数据将Draftgenome序列进行染色体群组的划分 并确定各序列在染色体上的顺序和方向 使基因组组装组水平提升到染色体水平的技术Hi C辅助基因组装原理A 同一条染色体内的基因互作 顺式互作 远高于不同染色体间的互作 反式互作 B 同一条染色体内部 两点间距离越远 互作概率越低 Hi C技术通过特殊的实验技术获得空间上相连的DNA片段即物理位置上较远的DNA片段之间的相互作用信息 Hi C技术 根据染色体内部的互作概率显著高于染色体之间的互作概率 将不同的contig或者scaffold分成不同的染色体 根据在同一条染色体上 互作概率随着互作距离的增加而减少将同条染色体的contig或者scaffold进行排序和定向 Hi C技术 组装流程利用染色体内互作概率高于染色体间互作这一特征 将contigs分组 分配到不同的染色体中 然后利用染色体内部距离越近互作概率越高这一特征 将contigs排序并进一步确定方向 影响Hi C组装的因素基因组片段越大 N50越大 组装效果越好 基于相同的N50时 数据量越高 组装效果越好 Hi C技术实验流程 1 使用多聚甲醛处理细胞 将DNA与蛋白交联 固定DNA的构象 甲醛交联 固定细胞核内染色质构想 2 裂解细胞后 用限制性内切酶处理交联的DNA 产生粘性末端 酶切 3 末端补平修复 并同时引入生物素 标记寡核苷酸末端 生物素标记 4 使用DNA连接酶连接临近的DNA片段 成环 5 蛋白酶消化解除与DNA的交联状态 纯化DNA并打断至长度为300 500bp的片段 打断 6 亲和素磁珠捕获标记的DNA 进行二代建库测序 钓取带有生物素标记的酶切片段 Hi C技术 应用 1 测序基因组的进一步完善 对于初步组装的基因组可以进一步完善 达到染色体水平 2 高度杂合的植物基因组从头组装和完善 由于每条染色体占据独特的疆域 即使同源染色体仍然是这样 对于区分杂合染色体具有重要的作用 3 多倍体物种基因组的进一步完善 有报道小麦基因组已应用Hi C辅助基因组组装此外与第三代测序技术和光学图谱相结合 获取高质量的长片段scaffolds 是Hi C技术发展的重要方向 1 2013年 发表在naturebiotechnology上人 小鼠 果蝇基因组在仅使用二代数据组装了Draftgenome序列前提下 然后加入Hi C成功实现了将Draftgenome序列挂到了染色体 其中人与小鼠染色体挂载率超过了98 准确性超过99 2 2015年发表在MolecularPlant上的拟南芥 拟南芥变种Landsbergerecta 基因组利用Hi C成功将99 10 的Draftgenome序列挂载到染色体 DeNovoPlantGenomeAssemblyBasedonChromatinInteractions ACaseStudyofArabidopsisthaliana J MolecularPlant 3 山羊基因组山羊基因组结合了三代 光学与Hi C技术成功实现了将基因组挂载到了31条染色体上 ContigNG50达到了18 7023Mb Single moleculesequencingandconformationalcaptureenabledenovomammalianreferencegenomes 4 多倍体小麦 AnchoringandOrderingWheatGenomeAssembliesbyChromosome ConformationCapture 没找到文章 需再找一下 5 埃及伊蚊基因组联合已有的埃及伊蚊基因组contigs数据 对其进行升级产生染色体级别的scaffold 最终得到3个scaffolds分别对应到3条染色体 DenovoassemblyoftheAedesaegyptigenomeusingHi Cyieldschromosome lengthscaffolds 6 榴莲基因组 7 2017年大麦 nature Hi C技术 目录 10XGenomicsLinkedReads 10XGenomics公司通过在序列中引入barcode序列 能够得到跨度在50 100Kb的linkedreads信息 与二代测序数据相结合 在Scaffold的组装上能够得到媲美三代测序的组装结果 10XGenomicsLinkedReads 10XGenomics公司的linkedreads技术本质上是将barcode序列引入长序列片段 通过将长片段分配到不同的油滴微粒中 利用GemCode平台对长片段序列进行扩增引入barcode序列以及测序接头引物 然后将序列打断成适合测序大小的片段进行测序 图1 通过barcode序列信息追踪来自每个大片段DNA模板的多个Reads 从而获得大片段的遗传信息 通过linkedreads结合常规二代测序组装得到的Scaffold 可搭建准确度更长的Scaffold 图2 10XGenomicsLinkedReads 技术优势 1 微量样本 仅需1ng基因组DNA即可进行长片段建库 2 精确分区 由于拥有众多的barcode和Partions 可对DNA进行精确分区 表1 3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论