版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章方差分析在上一章的假设检验中,我们研究了一个样本的平均数或比例与假设的总体均值或比例的差异是否显著的问题。我们也研究了两个样本的平均值和比例差异是否显著的问题。但是如果需要检验两个以上总体的均值是否相等,上一章所介绍的方法就不再适用了。这需要用方差分析的方法来解决。方差分析主要用来检验两个以上样本的平均值差异的显著程度,由此判断样本究竟是否抽自具有同一均值的总体。方差分析对于比较不同生产工艺或设备条件下产量、质量的差异,分析不同计划方案效果的好坏和比较不同地区、不同人员有关的数量指标差异是否显著时,是非常有用的。第一节单因素方差分析一、问题的提出例5-1。为了比较三种不同材料对产品寿命的
2、影响,试验人员分别对三种不同材料所制造的一组产品的寿命进行了测试,所得结果如表5-1所示(为简化计算,以各取4个样本为例)。表5-1:某种材料使用寿命的抽样统计表材料种类实验1实验2实验3实验4A 115 116 98 83B103 107 118 116C 73 89 85 97 现要求根据上述试验结果,显著性水平为的条件下,检验所选用的材料对最终产品的使用寿命的影响是否显著。从统计的角度看,就是要检验三种不同的材料所生产的最终产品的使用寿命的均值是否一致。通常,在方差分析中,我们把对试验结果发生影响和起作用的自变量称为因素。如果方差分析研究的是一个因素对于试验结果的影响和作用,就称为单因素
3、方差分析。在本例中,因素就是可能影响产品使用寿命的材料。因素的不同选择方案称之为因素的水平。上例中材料有三种不同的选择就说因素有三个水平。因素的水平实际上就是因素的取值或者是因素的分组,例如,可以在包装、质量、价格和销售区域等方面取不同的值或分为不同的组,就表示因素选了不同的水平。方差分析要检验的问题就是当因素选不同的水平时,对结果有无显著的影响。若无显著影响,则随便选择哪一种材料都无所谓。否则就要选择最终产品寿命最长的一种材料。一般地,我们假定所检验的结果受某一因素A的影响,它可以取K个不同的水平:1,2,3,K。对于因素的每一个水平i都进行n次试验,结果分别为,我们把这一组样本记作,假定,
4、即对于因素的每一个水平,所得到的结果都服从正态分布,且方差相等。用统计的语言来表达,要检验的假设就是:不是所有的都相等()由此可见,方差分析是研究一个或多个可分组的变量(称为自变量)与一个连续变量(因变量)之间的统计关系,并测定自变量在取各种不同水平时对因变量的影响和作用的一种统计分析方法。方差分析通过比较和检验在因素的不同水平下均值之间是否存在显著的统计差异的方法来测定因素的不同水平对因变量的影响和作用的差异。二、方差分析的基本原理和步骤方差分析的基本思路是一方面确定因素的不同水平下均值之间的方差,把它作为对由所有试验数据所组成的全部总体的方差的一个估计值。另一方面,再考虑在同一水平下不同试
5、验数据对于这一水平的均值的方差。由此,计算出对由所有试验数据所组成的全部数据的总体方差的第二个估计值;最后,比较上述两个估计值。如果这两个方差的估计值比较接近就说明因素的不同水平下的均值间的差异并不大,就接受零假设。否则,就说明因素的不同水平下的均值间的差异比较大,就接受备择假设。根据上述思路我们可以得到方差分析的方法和步骤。1、提出假设即因素的不同水平对试验结果无显著影响,不是所有的都相等(),即因素的不同水平对试验结果有显著影响。 2、方差分解我们先定义总离差平方和为各样本观察值与总均值的离差平方和。记作 SST=其中:是样本总均值,即=为样本观察值总数。将总离差平方和分解为两部分: SS
6、T= = =+其中:是第I个样本的平均值,即=记 SSE=表示同一样本组内,由于随机因素影响所产生的离差平方和,简称为组内平方和。记 SSR=表示不同的样本组之间,由于变异因素的不同水平影响所产生的离差平方和,简称为组间平方和。由此可以得到 SST=SSR+SSE对应于SST,SSR和SSE的自由度分别为: N-1, K-1, N-K相应的自由度之间的关系也有: N-1=(K-1)+(N-K) 3、F检验将SSR和SSE分别除以其自由度,即得各自的均方差:组间均方差MSR=SSR/(K-1)组内的均方差MSE=SSE/(N-K)统计上可以证明 E(MSE)= E(MSR)=+由此可见,如果原假
7、设成立,则E(MSE)= E(MSR)=;否则 E(MSR)>。根据F分布,如果原假设成立,那么MSR和MSE均是的无偏估计,因而MSR/MSE就服从自由度为(K-1)和(N-K)的F分布。检验统计量如上所述,当原假设成立时,E(MSE)= E(MSR)=。此时MSR较小,F值也较小。反之不成立时,MSR较大,F值也较大。对于给定的显著性水平查F分布表得到。如果,则原假设不成立,即K个组的总体均值之间有显著的差异,就拒绝。若,则原假设成立,即K个组的总体均值之间没有显著的差异,就接受。4、方差分析表上述方差分析的方法可以用一张标准形式的表格来实现,这种表格称为方差分析表。它将方差分析的计
8、算方法以简洁的形式进行总结。表格分为五列,第一列表示方差的来源,第二列表示方差的离差的平方和,第三列表示自由度,第四列为均方差,第五列为统计检验量F。表格又分为三行。第一行是组间的方差SSR和均方差MSR,表示因素的不同水平的影响所产生的方差,其值作为计算统计检验量F时的分子;第二行是组内方差SSE和均方差MSE,表示随机误差所引起的方差,其值作为计算统计检验量F的分母,第三行是检验行,表示总的方差SST。由于方差分析表概括了方差分析的中统计量之间的关系,我们在进行方差分析时就可以直接按照方差分析表来逐行,逐列地计算出有关的统计量,最后得到检验量F的值,并把这一F值与查表所得到的一定显著性水平
9、下的F检验的临界值进行比较,以得出接受或拒绝原假设的结论。单因素方差分析表方差来源离差平方和自由度均方差统计检验量F 组间SSR K-1 MSR 组内SSE N-K MSE总方差 SST N-1对于本节开头的例5-1,我们可计算得到方差分析表如下:单因素方差分析表方差来源离差平方和自由度均方差统计检验量F 不同材料间1304 2 652 4.92同种材料间1192 9 132.4 总方差 2496 11现假设原问题规定检验的显著性水平=0.05,查表得到。因为F=4.92>所以拒绝,即我们有95%的把握认为三种材料所制造的机器的寿命有显著的差异。第二节双因素方差分析前面所研究的是试验结果
10、仅受一个因素影响的情形。要求检验的是当因素取不同水平时对结果所产生的影响是否显著。但在实践中,某种试验结果往往受到两个或两个以上因素的影响。例如,产品的合格率可能与所用的设备以及操作人员有关,企业的利润可能与市场的潜力、产品的式样和所投入的广告费用有关等等有关。如果我们研究的是两个因素的不同水平对试验结果的影响是否显著的问题就称作双因素方差分析。双因素方差分析中两个因素的影响既可能是相互联系、相互影响的,也可能是相互独立的。因此,在分析的方法和步骤上要比单因素时来得复杂一些。双因素方差分析的基本思想与单因素方差分析基本相同。首先分别计算出总变差、各个因素的变差以及随机误差的变差。其次根据各变差
11、相应的自由度求出均方差,最后计算出F值并作F检验。双因素方差分析根据两个因素相互之间是否有交互影响而分为无交互影响的和有交互影响的两种情形。我们首先研究两因素无交互影响时的情形。一、无交互影响的双因素方差分析如果某一试验结果受到A和B两个因素的影响。这两个因素分别可取K和M个水平,则双因素方差分析实际上就是要比较因素A的K个水平的均值之间是否存在显著差异,因素B的M个水平的均值之间是否存在显著差异。目的是要检验试验中这两个因素所起的作用有多大,是仅仅一个因素在起作用,还是两个因素起作用或者是两个因素的作用都不显著。在假定两个因素无交互影响的情形,通常采用不重复试验,即对于两个因素每一种水平的组
12、合只进行一次试验,这样总共就进行K*M次试验。假定试验的结果如表5-3所示。表5-3:双因素分析的试验结果观察值因素B的水平 1 2 3 m 行总和因素 1 A的 2 水平 k 列总和其中:是因素A为水平I,因素B为水平J时的观察值,是因素A在i水平下的所有观察值的总和,是因素B在j水平下的所有观察值的总和因素A在i水平下的平均值;因素B在j水平下的平均值;是所有观察值的总和,是所有观察值的平均值,是所有观测值的总数。双因素的方差分析问题实际上也是一个假设检验问题。对于无交互影响的双因素方差分析其方法和步骤如下: 1、形成假设由于两因素相互独立,因此可以分别对每一个因素进行检验。对于因素A:因
13、素A的各个水平的影响无显著差异:因素A的各种水平的影响有显著差异对于因素B:因素B的各种水平的影响无显著差异,因素B的各种水平的影响有显著差异 2、进行离差平方和的分解=上式展开式中三个二倍乘积项均为零。我们令于是就有: SST=SSA+SSB+SSE SST的自由度为(N-1),SSA和SSB的自由度分别为(K-1)和(M-1),而SSE的自由度为(N-1)-(K-1)-(M-1)=N-K-M-1=(K-1)(M-1) 3、编制方差分析表,进行F检验从方差分解式所得到的SSA、SSB和SSE除以各自的自由度,就得到各自相应的均方差,然后与单因素方差分析时一样,我们可以得到无交互影响时双因素方
14、差分析表如下:双因素无交互影响时的方差分析表方差来源离差平方和自由度均方差统计检验量F 因素ASSA K-1 因素BSSB M-1 误差E SSE (K-1)(M-1) 总方差 SST N-1根据方差分析表计算得到和以后,根据问题的显著性水平,查表得到。于是我们可以分别检验因素A和B的影响是否显著。对于因素A而言,若>,我们就拒绝关于因素A的原假设,说明因素A对结果有显著的影响。否则,就接受原假设,说明因素A对结果没有显著的影响。对于因素B而言,若>,我们就拒绝关于因素B的原假设,说明因素B对结果有显著的影响。否则,就接受原假设,说明因素B对结果没有显著的影响。二、有交互作用的两因
15、素方差分析前面假定因素A与因素B之间相互独立,不存在相互影响,但有时两个因素会产生交互作用,从而使因素A的某些水平与因素B的另一些水平相结合时对结果产生更大的影响。对于有交互作用的两因素之间方差分析的步骤几乎与前一种情形一样,不同的是当两因素之间存在交互作用时情形,先要剔除交互作用的影响,因此比较复杂。同时在有交互作用的影响时对于每一种试验条件要进行多次重复试验以便将因素间交互作用的平方和从误差平方和中分离出来。由于重复试验数据量就大大增加了。有交互作用的两因素方差分析的方法和步骤同前面一样,关键是对总离差平方和进行分解时必须考虑两因素的交互作用。设因素A有个水平,因素B有个水平,试验的重复次
16、数记作。记为在因素A的第i个水平,因素B的第j个水平下进行第k次试验时的观察值。记为在因素A的第I个水平,因素B的第j个水平下进行各次重复试验的所有观察值的总和。记为在因素A的第I个水平,因素B的第j个水平下进行各次重复试验的所有观察值的平均值。记是所有观察值的平均值,其中:是所有观测值的总数。利用上面所引入的符号,我们可以得到有交互作用的两因素方差分析的步骤如下: 1、形成假设由于两因素有交互影响,因此除了分别检验两因素单独对试验结果的影响外,还必须检验两因素交互影响的作用是否显著。对于因素A:因素A的各个水平的影响无显著差异,:因素A的各个水平的影响有显著差异。对于因素B:因素B的各个水平
17、的影响无显著差异,因素B的各个水平的影响有显著差异。对于因素AB的交互作用:因素AB的各个水平的交互作用无显著影响,:因素AB的各个水平的交互作用有显著影响。 2、进行离差平方和的分解有交互作用的两因素方差分析的这时总离差平方和可以分解为四项:+总离差平方和的自由度为。分别记为因素A的离差平方和,自由度为。为因素B的离差平方和,自由度为。表示随机误差的离差平方和,自由度为。表示因素间交互作用的离差平方和,自由度为。 3、编制方差分析表,进行F检验从方差分解式所得到的SSA、SSB、SSAB和SSE除以各自的自由度,就得到各自相应的均方差,然后我们对因素A、因素B和因素AB的交互作用分别作F检验
18、。与前面所讨论的情形一样的,这一过程也可以用表格来表示,就得到无交互影响时双因素方差分析表如下:有交互影响的双因素方差分析表方差来源离差平方和自由度均方差统计检验量F 因素ASSA因素BSSB交互作用 SSAB误差E SSE 总方差 SST 与前面所讨论过的一样,根据方差分析表计算得到、和以后,根据问题的显著性水平,查表分别得到、和。于是我们可以分别检验因素A和B的影响,以及两因素的交互作用的影响是否显著。对于因素A而言,若>,我们就拒绝关于因素A的原假设,说明因素A对结果有显著的影响。否则,就接受原假设,说明因素A对结果没有显著的影响。对于因素B而言,若>,我们就拒绝关于因素B的原假设,说明因素B对结果有显著的影响。否则,就接受原假设,说明因素B对结果没有显著的影响。对于两因素的交互作用,若>,我们就拒绝关于两因素交互作用的原假设,说明因素A和因素B对结果有显著交互影响。否则,就接受原假设,说明两因素对结果没有显著的交互影响。练习题5-1 把学生随机地分为三组,一组采用程序
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教版(PEP)四年级下册期中测试卷(解析版)
- 2026福建大武夷研学产业发展有限公司招聘2人考试模拟试题及答案解析
- 2026年沧州市辅警招聘考试备考试题及答案详解
- 2026年4月扬州市江都区卫生健康系统事业单位公开招聘专业技术人员57人考试备考题库及答案解析
- 2026年安徽中医学院第二附属医院医护人员招聘笔试备考试题及答案解析
- 2026年保定市粮食和物资储备系统事业单位人员招聘考试备考试题及答案详解
- 2026年1,6-己二醇行业分析报告及未来发展趋势报告
- 2026年文件架行业分析报告及未来发展趋势报告
- 2026年电子元器件配件行业分析报告及未来发展趋势报告
- 2026年蚌埠市辅警招聘考试备考试题及答案详解
- 智能制造产业园项目可行性研究报告(仅供参考)
- 危险化学品装卸车要求
- 2024-2025学年人教版(2024)七年级英语下册Unit 5 Here and now Section A 1a ~ pronunciation 教案
- 2025年中央纪委国家监委驻中国国家铁路集团有限公司招聘笔试参考题库附带答案详解
- 《公路波纹钢结构涵洞标准图集》(征求意见稿)
- 企业并购的机遇与挑战分析
- 射线检测专业知识考试题库(含答案)
- 2024年全国统一高考数学试卷(理科)甲卷含答案
- 湖北省襄阳市2023-2024学年小升初语文试卷(含答案)
- 黑龙江省建筑工程施工质量验收标准(建筑地面工程)
- 第八课 良师相伴 亦师亦友
评论
0/150
提交评论