![第二十二节 方差分析[1].ppt_第1页](http://file1.renrendoc.com/fileroot_temp2/2020-3/22/4fe619d8-dd27-4086-a484-1ee00d33f94b/4fe619d8-dd27-4086-a484-1ee00d33f94b1.gif)
![第二十二节 方差分析[1].ppt_第2页](http://file1.renrendoc.com/fileroot_temp2/2020-3/22/4fe619d8-dd27-4086-a484-1ee00d33f94b/4fe619d8-dd27-4086-a484-1ee00d33f94b2.gif)
![第二十二节 方差分析[1].ppt_第3页](http://file1.renrendoc.com/fileroot_temp2/2020-3/22/4fe619d8-dd27-4086-a484-1ee00d33f94b/4fe619d8-dd27-4086-a484-1ee00d33f94b3.gif)
![第二十二节 方差分析[1].ppt_第4页](http://file1.renrendoc.com/fileroot_temp2/2020-3/22/4fe619d8-dd27-4086-a484-1ee00d33f94b/4fe619d8-dd27-4086-a484-1ee00d33f94b4.gif)
![第二十二节 方差分析[1].ppt_第5页](http://file1.renrendoc.com/fileroot_temp2/2020-3/22/4fe619d8-dd27-4086-a484-1ee00d33f94b/4fe619d8-dd27-4086-a484-1ee00d33f94b5.gif)
已阅读5页,还剩48页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二十二节方差分析 教学目的 使学员掌握单因子及二因子 包括无交互作用有交互作用的情形 方差分析的推断法 并能将其应用于科研和生产各领域 一门科学只有在成功的运用数学时 才算达到了真正完善的地步 马克思 一 方差分析的基本原理 在工农业生产及科学研究中 影响产品质量与产量 或研究结果 的因素一般较多 例如影响农作物产量的因素就有种子品种 肥料 雨水等 影响儿童识记效果的因素有教学材料 教学法等 为了找出影响结果 效果 最显著的因素 并指出它们在什么状态下对结果最有利 就要先做些试验 然后对测试的数据进行统计推断 方差分析就是对实测数据进行统计推断的一种方法 例2 1 1 现在甲 乙 丙三个工厂生产同一种零件 为了解不同工厂的零件的强度有无明显的差异 现分别从每一个工厂随机抽取4个零件测定其强度 数据如表2 1 1所示 试问这三个工厂的零件的平均强度是否相同 表2 1 1三个工厂的零件强度 在这一问题中 我们遇到需要比较3个总体均值的问题 如果每一个总体的分布都服从正态分布 并且各个总体的方差相等 那么比较各个总体均值是否一致的问题可以用方差分析方法来解决 一 几个概念 称上述从每一个工厂随机抽取4个零件测定其强度为试验 在试验中考察的指标是零件的强度 不同工厂的零件强度不同 因此可以将工厂看成影响指标的一个因素 不同的工厂便是该因素的不同状态 为了方便起见 将在试验中会改变状态的因素称为因子 常用大写字母A B C 等表示 在 2 1 1 中 工厂便是一个因子 用字母A表示 因子所处的状态称为因子的水平 用因子的字母加下标来表示 譬如因子A的水平用A1 A2 等表示 在 2 1 1 中因子A有3个水平 分别记为A1 A2 A3 试验中所考察的指标通常用Y表示 它是一个随机变量 如果一个试验中所考察的因子只有一个 那么这是单因子试验问题 一般对数据做以下一些假定 假定因子A有r个水平 在每个水平下指标的全体都构成一个总体 因此共有r个总体 假定第i个总体服从均值为 i 方差为的正态分布 从该总体获得一个样本量为m的样本为yil yi2 其观测值便是我们观测到的数据 i 1 2 r 最后假定各样本是相互独立的 数据分析主要是要检验如下假设 H0 1 2 rH1 1 2 r不全相等检验这一对假设的统计技术便是方差分析 当H0不真时 表示不同水平下的指标的均值是有显著差异 此时称因子A是显著 否则称因子A不显著 图2 1 1两种说法的示意图 综上所述 方差分析是在相同方差假定下检验多个正态均值是否相等的一种统计分析方法 具体地说 该问题的基本假定是 1 在水平Ai下 指标服从正态分布 2 在不同水平下 方差相等 3 数据yij相互独立 方差分析就是在这些基本假定下对上述一对假设 H0对H1 进行检验的一种统计方法 如果在一个试验中所要考察的影响指标的因子有2个 则是一个两因子试验的问题 它的数据分析可以采用两因子方差分析方法 如果在一个试验中所要考察的影响指标的因子更多 那么试验往往要事先进行设计 以便用尽可能少的试验去获得数据 再对数据进行分析 这一问题将在第三节中进行讨论 二 单因子方差分析 设在一个试验中考察一个因子A 它有r个水平 在每一水平下进行m次重复试验 其结果用yil yi2 yim表示 i 1 2 r 常常把全部数据列成如表2 1 2的形式 表2 1 2单因子试验数据表 其中yij表示因子A第i个水平下的第j次重复试验结果 Ti 分别表示第i水平下的数据和与数据均值 此时共有n r m个数据 这n个数据不全相同 若用表示n个数据的总平均 那么这n个数据的差异可以用总离差平方和ST 表示 离差平方和以后在不会发生混淆情况下也简称为平方和 引起数据差异的原因不外如下两个 一是由于因子A的水平不同 当假设Ho不真时 各个水平下指标的均值不同 这必然会使试验结果不同 我们可以用组间平方和来表示 也称因子A的平方和 这里乘以m是因为在每一水平下进行了m次试验 二是由于存在随机误差 即使在同一水平下获得的数据间也有差异 这是除了因子A的水平外的其他所有原因引起的 我们将它们归结为随机误差 可以和组内平方和表示 Se也称为误差平方和 可以证明有如下平方和分解式 ST SA Se 可以设想 当H0不真时 因子A水平不同引起的波动相对于误差来讲是比较大的 而当假设H0为真时 两者都可以看成都是由随机波动引起的 它们都可以作为误差方差的某种估计 由于两者所包含的误差的量有差别 所以为了进行比较 还需要将每个平方和除以各自的自由度 下面给出自由度的计算公式 ST SA Se的自由度分别用fT fA fe表示 他们也有分解式 fT fA fe其中 fT n 1 rm 1 fA r 1 fe fT fA r m 1 因子或误差平方和与相应的自由度之比 也即按自由度平均的平方和称为均方 并分别记为 MSA SA fA MSe Se fe 当MSA与MSe相差不大时 认为因子A不显著 而当MSA相对于MSe大得多时 认为A是显著的 这一比较可以用两者的比表示 称为F比 记为 F MSA MSe 当F F1 fA fe 时认为因子A在显著性水平a上是显著的 其中F1 fA fe 是自由度为fA fe的F分布的1 分位数 F分布的分位数表见附表 以上求F比值的过程往往列成一张方差分析表 见表2 1 3 表2 1 3单因子方差分析表 在以上计算中 关键是计算各个 离差 平方和 在计算时运用以下的等式是很有帮助的 Se ST SA 其中Ti 是第i个水平数据的和 T 表示所有n rm个数据的总和 综上 方差分析的一般步骤如下 1 计算因子A的每一水平下数据的和T1 T2 Tr及总和T 2 计算各类数据的平方和 3 依次计算ST SA Se 4 计算各均方及F比值并列出方差分析表 5 对于给定的显著性水平 将求得和F比与F分布表中F1 fA fe 比较 当F F1 fA fe 时认为因子A是显著的 否则认为因子A是不显著的 下面对 例2 1 1 的数据进行分析 1 计算各类数据和 每一水平下的数据和依次为 T1 412 T2 444 T3 344数据的总和为T 1200 2 计算各类数据的平方和 所有原始数据的平方和为 yij2 121492各水平下数据和的平方和为 Ti2 485216 3 计算各离差平方和 ST 121492 12002 12 1492 fT 3 4 1 11SA 485216 4 12002 12 1304 fA 3 1 2Se 1492 1304 188 fe 11 2 9 4 列方差分析表 表2 1 4 例2 1 1 的方差分析表 5 结论 如果给定 0 05 则1 0 95 从F分布表查得F0 95 2 9 4 26 由于F 4 26 所以在 0 05水平上我们的结论是因子A显著 实际上 由于F也大于F0 99 2 9 8 02 因此在 0 01水平上 因子A也是显著的 这表明不同的工厂生产的零件平均强度有明显的差异 当因子A显著时 还可以给出每一水平下指标均值的估计 以便找出最好的水平 在单因子试验的场合 第i个水平指标均值的估计为 在本例中 3个工厂生产的零件的平均强度的估计分别为 图2 1 2是各水平平均强度估计的直观表示 由此可见 乙厂生产的零件的强度的均值最大 如果我们需要强度大的零件 那么购买乙厂的为好 而从工厂来讲 甲厂与丙厂应该设法提高零件的强度 图2 1 2各水平均值图 前面提到 即使是同一个工厂 生产的零件强度也是有波动的 若波动用方差度量 则通过数据分析还可以给出误差方差的估计 这里方差的估计是MSe 在本例中的估计是MSe 20 9 而标准差的估计是 如果没有给出各原始数据yij 仅给出了各水平下的试验次数 数据的均值与标准差 那么我们可以将前面的公式稍作变化后作方差分析 下面看一个例子 例2 1 2 为测定一个大型化工厂对周围环境的污染 选了四个观察点A1 A2 A3 A4 在每一观察点上各测定4次空气中SO2的含量 现得到每一观察点上四次观察的平均值及4次观察的样本标准差Si i 1 2 3 4 数据如下表2 1 5所示 表2 1 5均值与标准差 假定每一观察点上SO2的含量从正态分布 且方差相等 试问在显著性水平 0 05上各观察点空气中SO2的平均含量有无显著差异 1 求数据的总和这里观察点数即为水平数 故r 4 每一水平下的重复次数为m 4 因此可以求得数据的总和T 4 0 031 0 100 0 079 0 058 1 072 2 计算因子A的平方和由于第i水平的数据和Ti m 3 计算误差平方和由于第i个样本标准差 因此 3 0 0092 0 0142 0 0102 0 0112 0 001494其自由度为fe r m 1 12 4 列出方差分析表表2 1 6方差分析表 结论是 1 在显著性水平 0 05上 F0 95 3 12 3 49 F 3 49 所在在显著性水平 0 05上各观察点空气中SO2的平均含量有显著差异 2 从各观察点空气中SO2的平均含量可知A2的污染最严重 A1的污染最轻 3 空气中SO2含量的标准差的估计为 三 重复数不等的情况 若在每一水平下重复试验次数不同 假定在Ai水平下进行了mi次试验 那么方差分析仍可进行 只是在计算中有两个主要改动 一是此时n mi 二是SA的计算公式改为 例2 1 3 某型号化油器原小喉管的结构使油耗较大 为节约能源 设想了两种改进方案以降低油耗 油耗的多少用比油耗进行度量 现在对用各种结构的中小喉管制造的化油器分别测定其比油耗 数据如表2 1 7所列 试问中小喉管的结构 记为因子A 对平均比油耗的影响是否显著 这里假定每一种结构下的比油耗服从等方差的正态分布 表2 1 7 例子2 1 3 的试验结果 现在对这批数据作方差分析 为简化计算起见 这里所有数据均减去220 这不影响离差平方和 均方以及F比的计算结果 因此也不会影响最后因子的显著性 1 各水平下的试验的重复次数及数据和分别为 A1 m1 8 T1 69 5A2 m2 4 T2 6 0A3 m3 4 T3 15 4 总的试验次数n 16 数据的总和为 T 90 9 2 计算数据的各类平方和 3 计算各离差平方和 ST 757 41 516 43 240 98 fT 16 1 15SA 672 07 516 43 155 64 fA 3 1 2Se 240 98 155 64 85 34 fe 15 2 13 4 列方差分析表 表2 1 8 例2 1 3 的方差分析表 5 结论 设a 0 05 从F分布表查得F0 95 2 13 3 81 由于求得的F 3 8
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小班线上领域课件
- 课件功勋人物介绍
- 黏土瓶子怪兽课件
- 少儿绘画教学课件
- 培训机构结业汇报
- 企业培训结业总结
- 岗前医院感染培训
- 章鱼创意画课件
- 课件显示未注册问题
- 理论科考试题及答案
- 幽门螺杆菌检测报告
- 农业经理人(中级)技能理论考试复习题库(含答案)
- 义务教育阶段中小学学生转学申请表
- 高速公路工程电子招标标准施工招标文件(2022年试行版)
- 云南省临沧县富康河铜矿勘探项目环评报告
- 公司档案分类方案
- 茶学概论-第一章-茶的起源与传播(2学时)课件
- 网络空间安全导论-西北工业大学中国大学mooc课后章节答案期末考试题库2023年
- 宋小宝小品《碰瓷》完整台词
- 破产管理人考试题库及答案
- 中国建筑史PPT(东南大学)完整全套教学课件
评论
0/150
提交评论