




全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于二代高通量测序的环境微生物多样性分析基于二代高通量测序的环境微生物多样性分析 一般认为土壤 海洋 肠道等生态系统中的微生物数量繁多 种类多样 传统的培养方法只限于对环境样品中极少部分 0 1 1 可培养的微生物类 群的研究 而变性梯度凝胶电泳 DGGE 克隆文库等常规的分子生物学方法 也因操作复杂 成本高 痕量菌发现困难等因素无法达到深入分析环境微生物 多样性的目的 高通量测序技术的出现 极大的促进了对环境中不可培养微生 物以及痕量菌的研究 为环境微生物多样性的研究开启了新的研究热潮 微生物群落中物种的多样性依然是目前研究的重点 对群落结构的研究 将有助于了解种群结构的稳定性 进而了解种群内物种间的相互依赖 相互制 约的内在联系 为将来构建功能性种群服务 鉴于微生物群落是一个多物种的 集合体 其中高达 95 以上的微生物物种无法分离也不能独立培养 拼装出每 个独立个体的基因组现在也无法实现 细菌 16S 或真菌 ITS 测序分析依然是现 阶段微生物群落多样性和多态性分析的基石 一 高通量测序背景介绍一 高通量测序背景介绍 高通量测序技术 可以一次对几十万到几百万条 DNA 分子进行序列测定 使 得对 PCR 扩增产物直接进行序列测定成为可能 极大的促进了对环境中不可培 养微生物以及痕量菌的研究 为环境微生物多样性的研究开启了新的研究热潮 目前高通量测序的主要平台代表有 Illumina 公司的 Solexa 基因组分析仪 Illumina Genome Analyzer 罗氏公司 Roche 的 454 测序仪 Roch GS FLX sequencer 和 ABI 的 SOLiD 测序仪 ABI SOLiD sequencer 微生物多样性分 析中 以 Illumina 及 454 测序平台应用最为广泛 二 工作流程二 工作流程 1 PCR 引物的设计 2 PCR 扩增条件摸索 3 琼脂糖凝胶电泳检测结果 4 全部样品进行 PCR 5 PCR 产物的凝胶回收及检测 6 PCR 产物精确定量 Qubit 2 0 将纯化后的 PCR 产物采用微量荧光核酸定量仪进行精确定量 精确到 0 1ng ul 7 将定量后混匀的 DNA 样本再次进行磁珠法纯化后 进行高通量测序 三 可分析项目三 可分析项目 1 有效序列数据统计有效序列数据统计 在测序实验中 通常采用多个样品平行测序的方法 即多个样品混合测序 为 了能区分样品 各样品中的序列均引入了一段标示其样本来源信息的 barcode 标签序列 若所测序列中不含有 barcode 标签序列 则无法确定其样本来源 进而导致后续生物信息错误或意义不明 因此 仅当原始序列中含有完整的 barcode 标签序列时 该条序列才被认可为有效序列 2 优化序列数据统计 优化序列数据统计 通常情况下 有效序列可以直接用于后续生物信息学分析 在实验过程中 测 序产物可能含有非特异性扩增片段 利用特异性引物信息可以将其去除 序列 中可能含有模糊碱基 ambiguous 单碱基高重复区 homologous 以 长 度过短的序列 序列长度小于 200bp 及 PCR 过程中产生的一些嵌合体 将这 些序列纳入分析范围会降低分析质量 因此修剪 去除 trim 此部分序列 可得到供精准分析的优化序列 在数据去除 trim 时 把 maxambig 0 axhomop 8 maxlength 200 及其嵌合体序列去掉 并对数据进 行统计 得到优化序列的百分率 3 OTU 生成生成 根据序列的相似性 将序列归为多个 OTU 操作分类单元 以便后续分析 OTU Operational Taxonomic Units 是在系统发生学研究或群体遗传学研究中 为了便于进行分析 人为给某一个分类单元 品系 种 属 分组等 设置的 同一标志 在生物信息分析中 一般来说 测序得到的每一条序列来自一个菌 要了解一个样品测序结果中的菌种 菌属等数目信息 就需要对序列进行归类 操作 cluster 通过归类操作 将序列按照彼此的相似性分归为许多小组 一 个小组就是一个 OTU 根据客户指定的相似度 96 97 或者 98 对所有 序列进行 OTU 划分并进行生物信息统计分析 OTU 分析主要步骤 1 提取非重复序列 碱基完全一致序列为重复序列 2 与 silva 库中的 aligned 16S 18S SSU 核糖体序列比对 3 Chimeric 序列检测与去除 4 距离计算与 OTU 聚类 4 多样性分析多样性分析 Alpha diversity 计算菌群丰度 Community richness 的指数有 1 Chao 是用 chao1 算法估计群落中含 OTU 数目的指数 chao1 在生态学 中常用来估计物种总数 由 Chao 1984 最早提出 2 Ace 用来估计群落中含有 OTU 数目的指数 由 Chao 提出 是生态学 中估计物种总数的常用指数之一 与 Chao I 的算法不同 计算菌群多样性 Community diversity 的指数有 1 Simpson 用来估算样品中微生物的多样性指数之一 由 Edward Hugh Simpson 1949 提出 在生态学中常用来定量的描述一个区域的生物多样性 Simpson 指数值越大 说明群落多样性越低 2 Shannon 用来估算样品中微生物的多样性指数之一 它与 Simpson 多样 性指数均为常用的反映 alpha 多样性的指数 Shannon 值越大 说明群落多样 性越高 测序深度指数有 Coverage 是指各样品文库的覆盖率 其数值越高 则样本中序列没有被测出 的概率越低 该指数实际反映了本次测序结果是否代表样本的真实情况 使用软件 mothur 及 BioLinker 自编程序 5 稀释性曲线 稀释性曲线 Rarefaction curve 稀释性曲线 一般是从样本中随机抽取一定数量的个体 统计出这些个体所代 表物种数目 并以个体数与物种数来构建曲线 它可以用来比较测序数量不同 的样本物种的丰富度 也可以用来说明样本的取样大小是否合理 分析采用对 优化序列进行随机抽样的方法 以抽到的序列数与它们所能代表 OTU 的数目构 建稀释性曲线 稀释性曲线图中 当曲线趋向平坦时 说明取样的数量合理 更多的取样只会产生少量新的 OTU 反之则表明继续取样还可能产生较多新的 OTU 因此 通过作稀释性曲线 可以得出样品的取样深度情况 稀释性曲线分析结果默认是在 97 相似性水平下划分 OUT 并制作各样品的稀 疏曲线 6 分类学分析 分类学分析 Taxonomy 在之前的分析步骤中 已经将序列按照其自身的碱基组成的相似性 分归到各 OTU 中 在进行分类学分析时 首先 将每一条优质序列都与 SILVA 最新 版 数据库进行比对 找出其最相近且可信度达 80 以上的种属信息 之后 将每一个 OTU 中的所有序列进行类比 找出同一 OTU 中的不同序列的最近 祖先的种属信息 最后 将得到的结果记录在表格文件中 这样做 可以在保 留最可能多的信息量的情况下 确保得出信息的准确性 7 样本间比较样本间比较 各样品群落结构分析柱状图或者饼状图 在某一分类地位上根据各样品中的微生物组成绘制饼图或者柱状图 8 全样品相似度分析树状图全样品相似度分析树状图 比较多个样品中 OTU 组成的差异及各 OTU 中含有序列的丰度 计算这些样品 的相似性 并绘制相似性图谱 9 样品样品 OTU 分布比较分布比较 VENN 图图 统计多个样品中所共有的 OTU 数目可以反映环境样品的相似性及重叠情况 10 Heatmap 热图分析热图分析 Heatmap 可以用颜色变化来反映二维矩阵或表格中的数据信息 它可以直观地 将数据值的大小以定义的颜色深浅表示出来 常根据需要将数据进行聚类 将 聚类后的数据表示在 heatmap 的相似性和差异性 如在属水平上对样品和 OTU 类型 样品所含菌属 进行聚类 依据是不同样品中各 OTU 所含序列数越相 近 即所含菌属数量越相近 样品间相似性越高 对聚类后各样品中不同 OTU 不同菌属 所含序列的丰度作 heatmap 图 能够反映出在菌属水平上各 样品菌落结构的相似性和差异性 将指定种属水平上的分类信息分别按照样品 和分类进行聚类后作出 Heatmap 图 能够反映出所有样品在各分类水平上表 现的相似性或者差异性 11 组间显著性差异分析 组间显著性差异分析 metastats 分析 分析 分析多个样品时 如果这些样品分属于两个组 则可以进行 Metastats 分析 该 分析通过对比两组条件下的多个样品 找出两组中具有显著差异的微生物类型 结果如下表所示 12 PCA 分析分析 Principal Component Analysis PCA 分析 即主成分分析 是一种对数据进行简化分析的技术 这种方法可以 有效的找出数据中最 主要 的元素和结构 去除噪音和冗余 将原有的复杂 数据降维 揭示隐藏在复杂数据背后的简单结构 它的优点是简单 而且无参 数限制 可以方便的应用于各个场合 我们可以用 PCA 来分析不同样品 OTU 组成的差异 通过方差分解 将多组数据的差异反映在二维坐标图上 坐标轴 取能够最大反映方差值的两个特征值 如样品组成越相似 反映在 PCA 图中的 距离越近 不同环境间的样品可能表现出分散分布 PCA 分析可以用来反映不 同样品中微生物群落组成的相似性以及影响微生物多样性的主要因素 一般情 况下是用来对假设进行验证 如 PCA 可以用来做以下分析 确定环境中的样品是否具有显著不同的微生物群落 将环境间的差异以图的形 式表现出来等 13 RDA 分析分析 利用冗余分析 RDA 可以反映在 OTU 的水平或者某生物学分类水平上各样 品中菌群与环境因子之间关系 14 UniFrac 分析分析 选取一个组的多个样品或者不同组的样品 进行 Weighted unifrac PCoA 分析或 者 unweighted unifrac PCoA 分析 可以在 OTU 的水平上反映各样品间或者不同 组间微生物群
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 物资搬迁协议合同书模板
- 班班通安装劳务合同范本
- 精准扶贫房改造合同范本
- 销售店集体买车合同范本
- 牛肉面合作协议合同范本
- 物业消防水维修合同范本
- 燃气供货合同协议书模板
- 苗木移栽合同协议书样本
- 网签合同撤销协议书范本
- 甲状旁腺切除手术协议书
- GB/T 15370.3-2012农业拖拉机通用技术条件第3部分:130kW以上轮式拖拉机
- IATF16949-2016变更控制程序
- 药物竹罐临床应用课件整理
- 母乳喂养自我效能量表(BSES) (1)附有答案
- (品管圈)良肢位摆放演示教学课件
- 保姆级别CDH安装运维手册
- 园林绿化及广场施工方案
- 可下载打印的公司章程
- 129平米全包装修报价明细表
- --水库除险加固工程下闸蓄水验收建设管理工作报告
- 五十铃、丰田全球化研究
评论
0/150
提交评论