Minitab单因素方差分析.ppt_第1页
Minitab单因素方差分析.ppt_第2页
Minitab单因素方差分析.ppt_第3页
Minitab单因素方差分析.ppt_第4页
Minitab单因素方差分析.ppt_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

方差分析 方差分析 实际工作中这样的问题 几种不同的原料对产品质量有无显著影响这里考察的对象 原料称为因素把因素所对应的状态称为水平当考察的因素只有一个时 称为单因素问题 Minitab 方差分析 analysisofvariance简称ANOVA 方差分析 例考察温度对某一化工产品的得率的影响 选了五种不同的温度 同一温度作了三次试验 测得的结果如下 Minitab 要分析不同的温度对得率的影响 考虑如下的问题 同一温度下的得率不一样 差异原因称为试验误差 温度的不同引起的得率的差异称为条件误差 方差分析 Minitab 当我们要问温度对得率到底有无确切的影响时 由于上述多种误差原因的存在 就不能随意回答 方差分析 Minitab 方差分析的功能 分析实验数据中不同来源的变异对总变异的贡献大小 确定实验中的自变量是否对因变量有重要影响 方差分析的方法 检验各总体的均值是否相等来判断分类型自变量 因素 对数值型因变量是否有影响 方差分析 Minitab 方差分析 方差分析与回归分析的区别 当研究的是两个数值型变量的关系时是回归分析 回归分析沿水平轴的自变量是数值型变量 而方差分析中是分类变量 Minitab 方差分析 在因素只有一个时不一定要采用方差分析 可以采用t 检验和z 检验t 检验和z 检验不能用于多于2个样本的数据 此时就要采方差分析 方差分析有单因素与多因素的区分 Minitab 单因素方差分析理论基础 单因素方差分析单因子试验的一般概述 记号 在一个试验中只考察一个因子A及其r个水平A1 A2 Ar 在水平Ai下重复mi次试验 总试验次数n m1 m2 mr 记yij是第i个水平下的第j次重复试验的结果 这里i 水平号 j 重复号 经过随机化后 所得的n个试验结果列于下表 单因子试验的数据 Minitab 单因素方差分析单因子试验的三项基本假定 A1 正态性 在水平 i下的数据yi1 yi2 yimi是来自正态总体的一个样本 i 1 2 r A2 方差齐性 r个正态总体的方差相等 即 A3 随机性 所有数据yij都相互独立 单因子试验所涉及的多个正态总体 Minitab 单因素方差分析单因子试验的统计模型 其中是因子A的第i个水平下第j次试验结果 是因子A的第i个水平的均值 是待估参数 是因子A的第i个水平下第j次试验误差 它们是相互独立同分布的随机变量 由此可知 单因子试验的三项基本假定用到试验数据yij上去 可得到如下统计模型 Minitab 单因子方差分析 Minitab 单因子方差分析总平方和的分解公式 Minitab 单因子方差分析 Minitab 单因子方差分析总平方和的分解公式 Minitab 单因子方差分析均方和 Minitab 单因子方差分析F检验 Minitab 单因素方差分析方差分析表 Minitab 例2 茶是一种饮料 它含有叶酸 folacin 这是一种维他命B 如今要比较各种茶叶中的叶酸含量 现选定绿茶 这是一个因子 用A表示 又选定四个产地的绿茶 记为A1 A2 A3 A4 它是因子A的四个水平 为测定试验误差 需要重复 我们选用水平重复数不等的不平衡设计 即A1 A2 A3 A4分别制作了7 5 6 6个样品 共有24个样品等待测试 单因素方差分析 Minitab 单因素方差分析 采用随机化试验方法 填写试验结果 Minitab 四个产地绿茶叶酸含量的打点图 dotplot 图上 表示叶酸含量 线表示样本均值 下述一些直观的印象是重要 图中每种绿茶的叶酸含量有高有低 从样本均值看 A1与A2的叶酸含量偏高一些 从样本极差看 A1 A2 A3的极差接近 A4的略小一点 单因素方差分析 Minitab 单因素方差分析 Minitab 单因素方差分析诸均值的参数估计 Minitab 单因素方差分析小结 Minitab 多重比较 多重比较 r个水平均值是否彼此相等 用方差分析方法 假如r个均值不全相等 哪些均值间的差异是重要的 用多重比较 Minitab 多重比较 Minitab 多重比较重复数相等情况的多重比较 T法 Minitab 多重比较重复数相等情况的多重比较 T法 Minitab 多重比较重复数不等情况的多重比较 S法 Minitab 多重比较重复数不等情况的多重比较 S法 Minitab 多重比较的Minitab参数设置 个别误差率与全族误差率 显著性水平 与多重比较关联的类型I误差率 假设检验第I类错误的概率 通常用于确定方差分析中的特定因子水平之间的显著差异 Minitab 个别误差率单一比较错误地断定实测差异与原假设显著不同的最大概率 此概率等于为假设检验选择的显著性水平 全族误差率由多个比较组成的过程错误地断定至少有一个实测差异与原假设显著不同的最大概率 全族误差率基于个别误差率和比较次数 对于单一比较 全族误差率等于个别误差率 但是 每个附加比较都会导致全族误差率不断增加 Minitab 多重比较的误差率 示例查看五个不同钢铁厂的钢强度 在每个工厂中使用25个样本 可以运行单因子方差分析 方差分析产生的p值小于0 05 断定至少有一个工厂的平均值不同于其他工厂的平均值 查看五个工厂之间所有的10个比较 以明确确定哪些平均值是不同的 Minitab 多重比较的误差率 如果为10个比较中的每一个指定的Alpha均为0 05 个别误差率 则Minitab将针对由10个比较组成的一组计算全族误差率 即0 28 但是 如果要让整个一组比较的全族误差率为0 05 则Minitab为每个单个比较指定的Alpha均为0 007 Minitab 多重比较的误差率 许氏与最佳值的多重比较 MCB 专门用于确定最佳因子水平 与最佳值稍有差异的因子水平 以及与最佳值有显著差异的因子水平的多重比较方法 可以将 最佳值 定义为最高平均值或最低平均值 许氏MCB将为每个水平均值与其余水平均值的最佳值之间的差异创建置信区间 Minitab Minitab多重比较方法 具体地说 最高为最佳最低为最佳置信区间包含零无差异无差异置信区间整个大于零明显更好明显更差置信区间整个小于零明显更差明显更好 Minitab Minitab多重比较方法 Fisher最低显著性差异 LSD 法将个别误差率控制到指定水平的同时 为因子水平均值之间的配对差异创建置信区间 Fisher法随后使用个别误差率和比较次数为所有置信区间计算同时置信水平 此同时置信水平是所有置信区间包含实际差值的概率 Minitab Minitab多重比较方法 Minitab 例 测量内存芯片的响应时间 从五个不同的制造商处抽取25个芯片作为样本 方差分析产生的p值为0 01 至少有一个制造商的平均值不同于其他制造商 查看五个工厂之间所有的10个比较 以明确确定哪些平均值是不同的 使用Fisher法 可以指定每个比较的个别误差率都应为0 05 等效于95 置信水平 Minitab将创建这十个95 置信区间 并计算出这一组置信区间的71 79 同时置信水平 Minitab多重比较方法 多重比较的Dunnett法用于为每个因子水平的平均值与控制组平均值之间的差异创建置信区间 为所有比较指定全族误差率 Dunnett法针对每个单个比较相应地确定置信水平 Minitab Minitab多重比较方法 Tukey 全族误差率 选中此项可通过使用Tukey方法 在不平衡情况下也称为Tukey Kramer 获得水平平均值之间的所有配对差异 然后输入介于0 5和0 001之间的全族误差率 大于等于1 0的值解释为百分比 默认误差率为0 05 Minitab Minitab多重比较方法 Fisher 个别误差率 选中此项可通过使用Fisher的LSD过程获得水平平均值之间的所有配对差异 然后输入介于0 5和0 001之间的个别误差率 Minitab Minitab多重比较方法 Dunnett 全族误差率 选中此项可为每个处理平均值和控制平均值之间的差异提供双侧置信区间 然后输入介于0 5和0 001之间的全族误差率 对照组水平 输入用于对照组因子水平的值 Minitab Minitab多重比较方法 许氏MCB 全族误差率 选中此项将获得每个水平平均值与其他水平均值中的最佳值之间的差异的置信区间 最佳 有两种选择 如果将最小平均值视为最佳 则设置K 1 如果将最大平均值视为最佳 则设置K 1 最大为最佳 选择此项会将最大平均值视为最佳 最小为最佳 选择此项会将最小平均值视为最佳 Minitab多重比较方法 残差检验 残差是否正态分布 正态概率图 直方图残差是否序列相关 残差与顺序图残差是否异方差 残差与拟合值图 残差概率图 Minitab 残差概率图 Minitab 方差齐性检验 Minitab 某项研究对三类公路上有行驶经验以及无行驶经验的驾驶员进行比较 这两个因子是 驾驶经验 在此次研究中 分别采用了8名无经验和8名有经验的驾驶员 经验具有两个水平 其代码分别为有经验 1 无经验 0 道路类型 每位驾驶员在三种道路的其中一种上驾驶 三个水平分别编码为一级公路 1 二级公路 2 土路 3 检验人员记录了每位驾驶员在每种公路上所做的控制校正次数 响应变量为 校正 下面给出了数据集 道路类型经验12304231618152782123101314162204615138871217数据 驾车 MTW 95 标准差Bonferroni置信区间道路类型经验N下限标准差上限1042 803845 8878440 49901141 844353 8729826 64002042 267214 7609532 74782141 982614 1633328 63713042 883596 0553041 65093142 428205 0990235 0732解释对于驾车数据 第一个因子为经验 第二个因子为道路类型 在六个因子水平组合的每一单元中有四个观测值 s的第一个值5 88784与道路类型 1和经验 0对应 区间 2 80384 40 4990 估计道路类型 1和经验 0的总体标准差 根据此区间 s介于2 80384和40 4990之间 标准差的最大值6 05530与道路类型 3和经验 0对应 输出示例 Bartlett检验 正态分布 检验统计量 0 85 p值 0 974Levene检验 任何连续分布 检验统计量 0 42 p值 0 830解释如果检验的p值较高 0 974和0 830 则表明方差之间不存在差异 输出示例 输出示例 等方差检验图形 对于驾车数据 置信区间图表明 在所有道路类型的控制校正次数中 经验越少的驾驶员具有更大的变动性 调查员比较了四种不同配方的油漆的硬度 将每种油漆配方取六份样品涂到一小块金属上 然后待其凝固 测量其硬度 此外 还记录每份样品的凝固温度以及涂油漆的人 操作员 的编号 数据 油漆硬度 MTW 输出示例来源自由度SSMSFP油漆3281 793 96 020 004误差20312 115 6合计23593 8S 3 950R Sq 47 44 R Sq 调整 39 56 解释油漆硬度方差分析得到的p值是0 004 因此 假设选择常用的a水平0 05进行检验 则将断定油漆配方之间的硬度存在显著差异 对于油漆数据 S为3 950 R为47 44 调整的R为39 56 方差分析输出第一部分 方差分析表 S R和调整的R是模型对数据的拟合优度的度量 这些值有助于您选择具有最佳拟合的模型 S表示数据值与拟合值的标准距离 对于给定研究 模型预测响应的效果越好 S越小 R R平方 描述在观测的响应值中由预测变量解释的变异量 R始终随预测变量的增加而增大 例如 最佳的五预测变量模型的R始终比最佳的四预测变量模型的高 因此 比较相同大小的模型时R最有效 调整的R表示已根据模型中的项数调整的修正R 如果包括了不必要的项 R会人为地变得很高 与R不同 调整的R在您向模型中添加项时可能变小 使用调整的R比较预测变量数不同的各个模型 使用单个统计量的表评定数据的以下属性 N 因子每个水平所包括的观测值数 均值 每个水平观测值的均值 这些样本均值是对每个水平总体均值的估计值 标准差 每个水平的样本标准差 方差分析假定所有水平的总体标准差相等 因此 如果样本标准差差异很大 则可能需要使用等方差检验命令来检验数据的方差相等性 合并标准差 合并标准差是对所有水平公共标准差的估计值 方差分析输出第二部分 个体值估计及置信区间 输出示例均值 基于合并标准差 的单组95 置信区间水平N均值标准差 混料1614 7333 363 混料268 5675 500 混料3612 9833 730 混料4618 0672 636 5 010 015 020 0合并标准差 3 950解释油漆硬度分析的结果表明 配方2的硬度均值最低 8 567 配方4的最高 18 067 不同配方的标准差之间的差异还不足以引起关注 合并标准差为3 950 输出示例均值 基于合并标准差 的单组95 置信区间水平N均值标准差 混料1614 7333 363 混料268 5675 500 混料3612 9833 730 混料4618 0672 636 5 010 015 020 0合并标准差 3 950解释在油漆硬度的结果中 配方2和配方4均值的区间不重叠 这表明这些水平的总体均值不同 Minitab为因子的每个水平都提供95 的置信区间 当方差分析表中的p值表明因子水平均值之间有差异时 可以使用单个置信区间的表来研究差异 每个星号都表示样本均值 每对圆括号都表示总体均值的95 的置信区间 每个水平的总体均值位于相应区间内的可信度为95 如果两个均值的区间不重叠 则表明总体均值不同 使用Tukey法对信息进行分组油漆N均值分组混料4618 067A混料1614 733AB混料3612 983AB混料268 567B不共享字母的均值之间具有显著差异 方差分析输出第三部分 多重比较 Tukey比较 Tukey95 整体置信区间油漆水平间的所有配对比较单组置信水平 98 89 解释油漆硬度数据的分组信息显示组A包含混料1 3和4 而组B包含混料1 2和3 这两个组都包含混料1和3 组内的因子水平之间并不存在显著差异 因为混料2和4并不共享同一个字母 混料4具有一个比混料2显著高很多的均值 置信区间显示所有均值差异的可能范围 配方2和配方4的均值之间差异的置信区间为 3 114 15 886 此范围不包括0 表明这些均值之间差异显著 其余均值对的置信区间都包括0 表明这些均值之间差异不显著 多重比较 Fisher最低显著性差异 LSD 输出示例使用Fisher方法对信息进行分组油漆N均值分组混料4618 067A混料1614 733AB混料3612 983BC混料268 567C不共享字母的均值之间具有显著差异 Fisher95 两水平差值置信区间油漆水平间的所有配对比较同时置信水平 80 83 解释油漆硬度数据的分组信息显示组A包含混料1和4 组B包含混料1和3 而组C包含混料2和3 混料1和3分别位于两个组中 组内的因子水平之间并不存在显著差异 因为下列因子水平组合不共享同一个字母 所以它们的均值存在显著差异 混料1和2 混料2和4 混料3和4置信区间显示所有均值差异的可能范围 配方1和配方2的均值之间差异的置信区间为 10 924 1 409 此范围不包括0 表明这些均值之间差异显著 类似地 配方2和配方4之间差异的置信区间 4 743 14 257 以及配方3和配方4之间差异的置信区间 0 326 9 841 也不包括0 表明这些差异也显著 其余均值对的置信区间都包括0 表明这些均值之间差异不显著 多重比较 许氏与最佳值的多重比较 MCB 输出示例许氏MCB 与最佳值的多重比较 全族误差率 0 05临界值 2 19 解释对于油漆硬度分析 将最大均值指定为最佳 因此 配方1的均值 14 733 配方2的均值 8 567 和配方3的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论