方差分析PPT课件.ppt_第1页
方差分析PPT课件.ppt_第2页
方差分析PPT课件.ppt_第3页
方差分析PPT课件.ppt_第4页
方差分析PPT课件.ppt_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

方差分析 ANOVA 学习目标 从双样本t检验过渡到更一般的情况 即比较2组以上数据的均值 单因素方差分析 one wayANOVA 如果各组均值存在显著差异 能指出是哪些组的均值与众不同 多重比较 multiplecomparisons 检验2个或2个以上因素在不同水平时的效应 双因素或多因素方差分析 two wayorhigherANOVA 用方差分析法来分析总波动中各个因素的波动组成 从而得出方差分量 variancecomponents 的估计值 单因素方差分析与双样本t检验 双样本T检验 如何比较更多的方法 问 两种方法的均值是否有差异 问 各种方法的均值是否有差异 如存在差异 究竟是哪些方法与众不同 是否存在差异 输出 因素A是指线路板焊接过程中的预热温度 图中横坐标表示预热温度的三个水平设置 纵坐标输出表示每块线路板上的平均焊接缺陷数 问 因素A的不同水平是否对输出有影响 为什么 要做出正确判断还需什么信息 方差分析 现在你的结论如何 因素A是否会产生输出差异 为什么 A 单因素方差分析 单因素方差分析是一种比较2组以上数据均值的统计方法检验假设 简而言之 ANOVA只检验均值是否存在差异 但并不能指出哪些均值与众不同 要回答这一问题 需用多重比较法 为什么不用t检验两两比较 举例 一高尔夫设计人员需从四种凹陷形式中选取一种 他想了解不同的凹陷形式是否对球的射程有影响 现有4种凹陷形式的高尔夫球共24个 输入变量是凹陷形式 输出变量是射程 实验采用美国高尔夫协会采用的标准测试器 实验用球随机抽取 为什么 golf mtw ANOVA涉及的问题 各种凹陷形式的平均射程是否相同 即4组样本是否来自同一总体 4组均值是否确实有差异 方差分析 ANOVA考察三种波动来源 总体 所有观察值的总体波动组间 各组均值之间的波动 因素 组内 各组内部的随机波动 噪声 统计误差 Total between within 子组之间波动 子组内部波动 与控制图比较 ANOVA基础 平方和 i 第j组的第i个观察值j 第j组g 总组数 SS Tot 总平方和 单值 总均值 SS Factor 组间平方和 因素平方和 组均值 总均值 SS Error 组内平方和 误差平方和 单值 组均值 方差分析表 HypothesisTest 为决定是否接受零假设 我们将利用方差分析表计算检验统计量F 为何称组内波动为误差或噪声 F值有何意义 F值大意味什么 方差分析表标准形式 误差的共同方差 SOURCE SS df MS SS df F MS Factor MS Error BETWEEN SS Factor g 1 SS Factor g 1 MS Factor MS Error WITHIN SS Error SS Error TOTAL SS Total n j j g 1 1 用Minitab进行方差分析 打开文件golf mtwMinitab通过统计法和图表法进行方差分析 图表法主效应图区间图统计法方差分析表稍后我们会学习如何确定哪些组对之间存在差异 多重比较 图表法 主效应图 要产生主效应图 首先需将各组数据堆栈 命令如下 Manip Stack Unstack Stack数据堆栈后 用下列命令产生主效应图 Stat ANOVA MainEffectsPlots 说明主效应图的意义 ChooseGraph Boxplot 图表法 区间图 产生区间图命令如下 Stat ANOVA IntervalPlot选取StandardError选取ConfidenceInterval 区间图有何意义 你能否判断不同的凹陷形式是否有差异 为什么 方差分析表 用如下命令产生方差分析表 Stat ANOVA One Way Unstacked OK One WayAnalysisofVarianceAnalysisofVarianceonDistanceTraveled 方差分析表说明 One WayAnalysisofVarianceAnalysisofVarianceonResponseSourceDFSSMSFpPattern34 6261542 013 760 000Error202 242112 1Total236 868 4 2 4 2 3 2 2 2 1 2 s s s s s Pooled F值接近1时 说明各组均值很相近 本例中F值很大 如P值小于5 说明至少有一组均值与众不同 本例中 我们拒绝各组均值相同的原假设 即至少有一种凹陷形式的组均值与其它组不同 本例中F值对应的发生概率小于万分之一 当各组样本数相同时 本例样本数不同 所以是加权平均值 F分布说明 下面我们来解释F分布及F检验量 下图显示的是如果所有方法产生的均值相同时F值的分布 注意本例中计算出的F值在分布图形的尾部 10 点表示如果不同凹陷形式的均值相同 F值大于2的概率是10 多重比较 我们已经找出凹陷形式之间存在着显著的差异 下一步是什么 哪种形式是最佳的 哪组均值显著不同 我们采用多重比较来解决上述问题 多重比较 按命令Stat ANOVA Oneway 选择Comparisons项 屏幕显示如下选择项 Tukey sFisher sDunnett sHsu sMCB究竟采用哪一种多重比较方法 通常我们推荐使用Fisher多重比较法 Fisher多重比较法将控制各比较检验的显著性水平 通常p 05 然后得出总体误差率 Tukey多重比较法提高各个比较检验的显著性水平 p 05 从而将总体误差率控制为p 05 Fisher多重比较法 图示矩阵显示的是均值两两比较的结果 每单元的二个数值表示对应均值差的95 的置信区间 如这二个数值同为正或同为负 说明均值之间存在差异 如这二个数值包含0 说明均值相同 Fisher spairwisecomparisonsFamilyerrorrate 0 192Individualerrorrate 0 0500Criticalvalue 2 086Intervalsfor columnlevelmean rowlevelmean 1232 36 67 8 163 45 84 21 92 17 333 594 13 5310 4919 6513 5334 3543 51 答案 类型1的均值与类型2和3不同 同类型4相同 类型2的均值与类型1和4不同 同类型3相同 类型3的均值与类型1和4不同 同类型2相同 类型4的均值与类型2和3不同 同类型1相同 类型1423均值272 25272 25294 67303 83 同一线包含的均值无显著差异 课堂练习 有3台机器 用于粘结铭牌 我们改进了其中二台 并想知道改进后的机器是否显著提高了粘结强度 实验数据见下表 其中方法2和3代表改进后的机器 请作出判断 双因子方差分析 为了调查毒药的效应 选择了3种毒药 4种医疗处理 每一组合选择4个动物做实验 数据格式及生存时间如下表 Poison mtw 组内波动与组间波动 我们同时对毒药及医序处理因素感兴趣 还包括互作用 不过 首先让我们预览一下数据 并比较一下组内波动与组间波动 即用单因子方差分析来比较3 4 12组数据 AnalysisofVarianceforSurvivalSourceDFSSMSFPGroup112 20440 20049 010 000Error360 80070 0222Total473 0051 我们可以发现组间波动是组内波动的9倍 EnterthedataintoMinitabsuchthatthereare4columns PoisonTreatmentGroupSurvival1110 311110 451110 461110 432120 362120 292120 40 需了解的内容 组间波动是组内波动的9倍 说明至少有一个因素或互交作用在起作用 我们用什么样的模型来分析 各因素的自由度是多少 3poisons 4treatments 4animals 48observations3poisons 2d f 4treatments 3d f poisons与treatments的交互作用自由度 3 2 6d f 组间波动的自由度 2 3 6 11d f 组内波动的自由度 48 11 1 36d f 什么是自由度 ANOVA中 自由度如下 dftotal N 1 ofobservations 1dffactor L 1 oflevels 1dfinteraction dffactorAXdffactorBdferror dftotal dfeverythingelse 每收集到一个数据 我们就挣得一个自由度 每估计一个参数 我们就花掉一个自由度 生存时间双因子方差分析 AnalysisofVariance BalancedDesigns FactorTypeLevelsValuesPoisonfixed3123Treatmenfixed41234AnalysisofVarianceforSurvivalSourceDFSSMSFPPoison21 033010 5165123 220 000Treatmen30 921210 3070713 810 000Poison Treatmen60 250140 041691 870 112Error360 800720 02224Total473 00508 Stat ANOVA BalancedANOVASurvival PoisonTreatmentPoison Treatment OK 因素效应显著 而互作用则不显著 结论 基于前述分析 我们得出如下结论 毒药和医序处理是重要因素 而互交作用不是 p 0 11 如何检查模型的完备性 模型假设成立的前提 方差齐次性残差相互独立残差呈正态分布均值为零标准差由组内波动估计 模型是可被加的 检查模型符合性 残差看上去不呈正态分布 喇叭口 方差稳定化 用Box Cox变化可以确定正确的变化参数从而保证残差正态性与方差齐次性 子组数为4 Stat ControlCharts Box CoxTransformation Survival 4 OK 看来应取倒数 生存时间的倒数是何意义 对死亡率进行方差分析 AnalysisofVariance BalancedDesigns FactorTypeLevelsValuesPoisonfixed3123Treatmenfixed41234AnalysisofVarianceforDyingSourceDFSSMSFPPoison234 877117 438672 630 000Treatmen320 41436 804828 340 000Poison Treatmen61 57080 26181 090 387Error368 64310 2401Total4765 5053 互作用波动与组内波动一致 对死亡率再进行残差分析 变化后数据表明残差方差稳定 残差正态性良好结论 1 死亡率 Survival 1作为输出响应应更合适 2 毒药和医序处理都是重要的显著因素 注意 我们的记录指标对实验分析来说不一定是最佳的 ANOVA与方差分量 COV 前述例子是 双因素方差分析 毒药 和 医序处理 两个因素固定效应 我们选择的两个因素的水平是固定的 而不能从 毒药 总体或 医序处理 总体中随机选取 毒药 和 处理 这两个因素是交叉的 实验单元是 动物 这是随机变量 套在Poison和Treatment组合中 动物变量波动组合成实验误差或噪声误差 2因素套设计方差分析 数据见右图 双因素 小时 和 零件 小时 和 零件 是随机因素 这里 小时 代表从大量的小时集合中的随机样本 零件 代表一小时内生产的零件中随机选择的样本 零件 套在 小时 内 因第一小时内选取的2个零件并不是第二小时内选取的2个零件 实验单元是测量值 这是一随机变量 套在 零件 内 而 零件 又套在 小时 内 Nested Parts mtw 图表分析 零件测量值均值 Stat ControlCharts Xbar R Subgroupsize Part 3measurements 代表什么 答案 图表分析 每小时均值 极差图反映每小时内零件测量值均值的变化代表什么 回答 图表分析 每小时均值的波动 移动极差图是根据相邻每小时均值的变化量绘制的代表什么 答案 控制图计算总结 现在我们用Minitab进行分析 Stat ANOVA FullyNestedANOVA 注意 方差分量估计时 需减去一部分对应的下级分量方差 有时当某一方差分量很小时 计算结果会出现负数 由于方差不可能为负 我们就将其设为0 Minitab 套设计方差分析 Minitab结果 FullyNestedAnalysisofVarianceAnalysisofVarianceforYSourceDFSSMSFPHour42 26840 56710 1720 944 不显著Part516 49673 299364 2770 000 非常显著Measurem201 02660 0513Total2919 7917VarianceComponentsSourceVarComp ofTo

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论