


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、扩增子 SCI 套路-2 组间差异分析本文转载自“态昌基因”,已获授权。差异分析一直是高 通量测序数据分析的核心部分。在上期的系列文章中,小昌 与大家分享了确定微生物群落组间是否存在差异的常见分 析手段,有 PCA 、Pcoa 、NMDS 等,在实际的微生物群落 研究中,我们常常需要进一步找出是哪些菌(群)引起了群 落的差异。只有找出核心影响菌(群) ,我们才能更明确下 一步研究方向。那么,要找到具体的差异菌(群) ,主要有哪些方法呢? 1. 统计差异分析统计差异分析最常用的就是 Wilcox 秩和检 验( Wilcoxon rank-sum test ),也叫曼 -惠特尼 U 检验(Mann
2、 -Whitney U test ),是两组独立样本非参数检验的一 种方法。其原假设为两组独立样本总体分布无显著差异,通 过对两组样本平均秩的研究来实现判断两组总体的分布是 否存在差异。根据 p 值筛出组间差异显著的物种 (一般在门、 属和 OTU 三个水平较常见) ,随后可用柱状图、盒状图或热 图直观展示差异菌群的丰度变化 。也可直接在 Windows 中 用 STAMP 软件进行差异统计分析和直观展示。分析步骤如 下: a. 根据物种丰度,通过 wilcox 秩和检验来计算每个物 种在门(phylum)、属(genus)、OTU(species)上组间的 p-value ; b. 用 FD
3、R(false discovery rate ,错误发现率 )方法校正后得到 q-value ; c. 根据 q-value 筛选出在两组间显著差异的物种。一般会得到统计表格:说明: mean 分别为两组样品物 种的平均相对丰度, sd 分别是两组样本物种相对丰度的标准 差。P值为对两组检验原假设为真的概率值,p2. 机器学习分类器机器学习分类器最常用的是随机森林 (Random Forest )的方法。随机森林方法可筛选出对分组 效果贡献最高的 OTU 或物种列表。 一般筛选出 OTU 或物种 列表后,可进一步作图展示,如柱状图,热图等。分析步骤 如下: a. 去除测序量过低的样本以及低丰度
4、 OTUs 或物种; b. 用随机森林算法计算,得出对分组效果有贡献度的 OTU 或物种及其得分值列表; c. 选取得分值高(如大于 0.001 ) 的 OTU 或物种。部分结果如下:说明:一般地,选取 Mean_decrease_in_accuracy 值大于 0.05 的 OTU ,作进一 步分析;对于组间差异较小的样本,该值可能会降至 0.03 。 需要注意的是 Wilcox 检验强调统计学上的差异, 随机森林强 调对分组准确率的贡献,二者有较高的一致性,但结果还是 存在一定的差异,尤其是重要性排序:统计差异分析检验结 果是按照差异程度( p 值)依次排序,随机森林是按照对分 组贡献重要
5、性依次排序。下面我们看看常见的差异分析的作 图吧。 1)通过 Wilcox 秩和检验分析得到的三组样本间差异 物种( Streptococcus ),以盒状图展示。 2)通过 Wilcox 秩 和检验分析得到的两组样本间差异物种,并以柱形图展示。3)通过 Stamp 软件中的 Welch ' s-test 分析得出的两组样本 间的显著性差异物种, 以及该物种在不同组的分布情况。 4) 使用随机森林算法或 Wilcoxon 秩和检验分析挑取各组样本 中存在显著差异 OTU。 根据挑选出来的差异 OTU ,根据其 在每个样品中的丰度信息,对物种进行聚类,绘制成热图。 说明:图中越接近蓝色表
6、示物种丰度越低,越接近橙红色表 示丰度越高。左边的聚类树是根据各物种间的 spearman 相 关性距离进行聚类;上边的聚类树是采用样本间距离算法中 最常用的 Bray-Curtis 算法进行聚类。图中可按样本分组标 上不同的颜色,也可根据样本顺序作图而不画出聚类树。 3. LEfSe 分析 LEfSe 分析即 LDA Effect Size 分析,综合了统 计学上的差异分析和该差异物种对分组结果的影响力得分 值,考量面比较全,在文章中出现频率也比较高,一般在属 以上水平做分析和展示。更多相关统计细节请阅读 LEfSe 分析,你真的懂了么 。分析步骤如下: a. 使用 non-parametr
7、ic factorial Kruskal-Wallis(KW) sum-rank test( 非参数因子克鲁斯卡尔 -沃利斯秩和检验 )检测具有显著 丰度差异特征, 并找到与丰度有显著性差异的类群; b. 采用 线性判别分析 (LDA) 来估算每个组分 (物种 )丰度对差异效果 影响的大小; c. 找出对样品分组产生显著性差异影响的群落 或物种。说明:左边的图为统计两个组别当中有显著作用的 微生物类群通过 LDA 分析(线性回归分析)后获得的 LDA 分值。右边的图为聚类树,节点大小表示丰度,默认从门到 属依次向外排列。红色区域和绿色区域表示不同分组,树枝 中红色节点表示在红色组别中起到重要作
8、用的微生物类群, 绿色节点表示在绿色组别中起到重要作用的微生物类群,黄 色节点表示的是在两组中均没有起到重要作用的微生物类 群。图中英文字母表示的物种名称在右侧图例中进行展示。 在结果 lefse_LDA.xls 表中:第一列为物种名称;第二列为 Abundance 丰度值,为丰度较高组的丰度; 第三列为 Group , 展示差异组名;第四列为 LDA 值,第五列为 P 值。默认 LDA 值大于 2,P 值小于 0.05 ,该物种为差异物种,差异 组即两组中 (或多组中) 丰度高的一组。 若 Group 、 LDA 、 P 值均为空,则表示该物种在组间无差异。了解了怎么判断 样本组间微生物群落是否存在差异,知道了如何寻找差异菌 群,就万事大吉了吗?当然不是,我们
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学校母婴室管理制度
- 学校类设备管理制度
- 学校锅炉工管理制度
- 学生手卫生管理制度
- 安培训教学管理制度
- 安装小班组管理制度
- 官方自媒体管理制度
- 实施不闭环管理制度
- 实验室控制管理制度
- 客服全流程管理制度
- 贵州贵安发展集团有限公司笔试
- DG∕TJ 08-53-2016 行道树栽植技术规程
- 供应链管理在电网企业物资管理中的应用
- 2025版特种金属矿山股权收购与转让合同2篇
- 《螺栓连接多层全装配式混凝土墙板结构技术规程》
- 【MOOC】《电工技术》(北京科技大学)中国大学MOOC慕课答案
- 输血科内部审核检查表
- 《绿色低碳铝评价导则及追溯指南》T CNIA 0245-2024
- 冶金员工安全培训
- 腹股沟疝护理新进展
- 食品标准操作规程
评论
0/150
提交评论