第六章 方差分析.doc_第1页
第六章 方差分析.doc_第2页
第六章 方差分析.doc_第3页
第六章 方差分析.doc_第4页
第六章 方差分析.doc_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章 方差分析第二节 单因素方差分析1一、单因素条件下离差平方和的分解1二、因素作用显著性的检验2三、单因素方差分析中的几个问题4第三节 双因素方差分析5一、无交互作用下的方差分析5二、有交互作用的方差分析7第四节 EXCEL在方差分析中的运用11一、单因素方差分析11二、无交互作用下的双因素方差分析11三、有交互作用的双因素方差分析12本章小结14第二节 单因素方差分析一、单因素条件下离差平方和的分解单因素指的是因子唯一。为了检验该因子的不同水平下的总体均值是否有显著差异,我们可针对因子的不同水平进行试验或抽样;把因子处在不同水平上抽得的样本看作是来自不同总体的样本,然后检验这些不同总体的均值是否相等。设下表是在因子A的不同水平下抽样的结果:表62 样本 因素水平12n合计均值合计表中的是在水平上,第j个样本单位的数据。另外: (i=1,2,r)即是在因素水平上的平均数,是样本总平均。 总离差平方和记为SST(Sum of Squares for Total),则: (6.4)它反映了样本数据总的波动程度。按前面的平方和分解思路,我们有: 以上式中,交叉项之和为零,即:进一步记: (6.5) (6.6)SSA(Sum of Squares Among Groups)表示的是组间方差总和,是由各组均值差异引起的;SSE(Sum of Squares for Error)表示的是组内方差部分,由随机误差产生。因此,我们得到离差平方和的分解式: SST=SSE+SSA (6.7)二、因素作用显著性的检验前面已指出,检验因子作用的显著性,实质上就是检验以下的假设: (6.8)。 (6.9)原假设是否为真,关键是看SSA与SSE两者间的相对比较;在两者比较时,我们要剔除引起各种方差的“独立变量个数”自由度的影响。SST是由于的波动引起的方差,但是,这里所有的nr个变量并不独立,它们必须满足的一个约束条件是:,真正独立的变量只有nr-1个,自由度是nr-1。SSA是因子在不同水平上的均值变化而产生的方差。但是,r个均值并不是独立的,它们必须满足约束条件:,因此也丢失一个自由度,它的自由度是r-1。SSE是由所有的在各因素水平上的围绕均值波动产生,但是它们必须满足的约束条件是:(i=1,2,,r),一共r个,失去了r个自由度,所以SSE的自由度是nr-r。SST、SSA和SSE的自由度满足如下关系:nr-1=(r-1)+(nr-r) (6.10)将各方差除以各自的自由度,就得到相应的均方差,即: ; (6.11)MSA与MSE分别是SSA与SSE的均方差。有了均方差,我们就可以构造F统计量来检验原假设(6.8)是否为真: (6.12)F值越大,越说明总的方差波动中,组间方差是主要部分,有利于拒绝原假设接受备选假设;反之,F值越小,越说明随机方差是主要的方差来源,有利于接受原假设,有充分证据说明待检验的因素对总体波动有显著影响。因此,检验的拒绝域安排在右侧。对于给出的显著性水平,查F分布表得临界值,当时,拒绝原假设,接受备选假设,认为所检验因素对总体有显著影响;当时,接受原假设,认为没有证据说明所检验的因素对总体的显著影响。如下图所示: 接受域 拒绝域图6-2 F检验示意图 现在,我们回头去解决例6-1中提出的问题。通过Excel得到方差分析的计算结果如下表(参见本章第四节): 表63 Excel输出的方差分析表差异源SSdfMSFP-valueF crit组间4.13333322.0666670.4696970.6362153.88529组内52.8124.4总计56.9333314由上表可得:SST=56.93,SSA=4.13,SSE=52.8,MSA=2.067,MSE=4.4,样本的统计量F=2.067/4.4=0.4697 , 分析表给出了临界值是=3.885。(显著性水平=0.05),F0.05,结论也是接受原假设。注意:这里的P-值是通过F统计量计算的。三、单因素方差分析中的几个问题使用单因素方差分析时,应注意的问题有: (一)方差分析需满足的假设条件。方差分析实质上是对各总体均值相等假设进行检验,为了得到检验统计量的精确分布,要求满足的前提条件是: (1)样本是独立的随机样本; (2)各样本皆来自正态总体;(3)总体方差具有齐性,即各总体方差相等。满足以上的条件,(6.12)才满足第一个自由度为r-1,第二个自由度为nr-r的F分布。一般情况下,我们总认为以上的假定条件都是满足的或近似满足的。这一点对多因素分析也有效。(二)在前面的数据结构中,因素各水平下的样本容量都相等,是为了公式推导的方便。在实际问题中,各总体的样本容量可以相等也可以不等,分析过程和结论都不受影响。在用Excel进行方差分析时,计算机也能自动判断各样本的容量大小。(三)方差分析将所有样本结合在一起,使数据数量增多,提高了分析结果的稳定性(robustness)。但是,方差分析也存在自己的不足之处,比如:当检验结果是拒绝原假设时,我们认为各总体的均值不等,至于哪个总体均值大,哪个总体均值小,方差分析本身不能立即得出结论。如果要得到各总体均值大小的排序信息,还需要借助“多重比较”法,限于篇幅,这里不作介绍,有兴趣的读者可参考其它资料。1 参见王明华现代应用统计分析方法(中国统计出版社,1999),61-70页。1第三节 双因素方差分析一、无交互作用下的方差分析设A与B是可能对试验结果有影响的两个因素,相互独立,无交互作用。设在双因素各种水平的组合下进行试验或抽样,得数据结构如下表: 表64因素B均值因素A均值表中每行的均值(i=1,2,r)是在因素A的各个水平上试验结果的平均数;每列的均值(j=1,2,n)是在因素B的各种水平上试验的平均数。以上数据的离差平方和分解形式为:SST=SSA+SSB+SSE (6.13)上式中: (6.14) (6.15) (6.16) (6.17)SSA表示的是因素A的组间方差总和,SSB是因素B的组间方差总和,都是各因素在不同水平下各自均值差异引起的;SSE仍是组内方差部分,由随机误差产生。各个方差的自由度是:SST的自由度为nr-1,SSA的自由度为r-1,SSB的自由度为n-1,SSE的自由度为nr-r-n-1=(r-1)(n-1)。各个方差对应的均方差是:对因素A而言: (6.18)对因素B而言: (6.19)对随机误差项而言: (6.20)我们得到检验因素A与B影响是否显著的统计量分别是: (6.21) (6.22)【例6-2】某企业有三台不同型号的设备,生产同一产品,现有五名工人轮流在此三台设备上操作,记录下他们的日产量如下表。试根据方差分析说明这三台设备之间和五名工人之间对日产量的影响是否显著?(=0.05)。 表65工人一工人二工人三工人四工人五设备A6472638178设备B7566617380设备C7867806971解:检验的假设有二个,第一个假设是针对设备(设为A因素)的:三台设备对日产量没有显著影响;:三台设备对日产量有显著影响。第二个假设是针对人员(设为B因素)的:工人技术对日产量没有显著影响;:工人技术对日产量有显著影响。 将以上数据输入Excel表格中,进行“无重复双因素分析”,Excel输出的方差分析表如下:表66 Excel输出的方差分析表差异源SSdfMSFP-valueF crit行(A因素)10.5333325.2666670.0923710.912734.458968列(B因素)161.0667440.266670.7062260.609693.837854误差456.1333857.01667总计627.733314从上表可知:=0 .092 =4.46 , 接受,没有证据证明三台设备对日产量有显著影响;=0.706=3.84,也接受,也没有证据证明五名工人的技术对日产量有显著影响。二、有交互作用的方差分析为了研究两个因素是否独立,有无交互作用,我们需要在各个因素水平组合下,进行重复试验;因此,有交互作用时,方差分析的数据结构不同于无交互作用。设因素A与因素B每一对水平搭配下重复试验的次数都是m,得到试验数据结构如表67。表67因素B因素A表中的表示的是在因素水平组合(,)下第l次试验的结果。在此组合下试验结果的平均值为: (6.23)进一步记: (6.24) (6.25) (6.26)则我们类似地有以下的离差平方和分解形式:SST=SSA+SSB+SSAB+SSE (6.27)式中: (6.28) (6.29) (6.30) (6.31) (6.32)与无交互作用的双因素方差分解相比,这里多出了一项SSAB,它刚好反映了两个因素交互作用的结果。离差平方和SST、SSA、SSB、SSAB和SSE的自由度分别是rnm-1、r-1、n-1、(r-1)(n-1)和rn(m-1)。我们得到如下的均方差: (6.33) (6.34) (6.35) (6.36) 则检验因素A与B影响是否显著的统计量分别是: (6.37) (6.38) 检验交互影响是否显著的统计量度是: (6.39)【例6-3】为了分析光照因素A与噪音因素B对工人生产有无影响,光照效应与噪音效应有交互作用,在此两因素不同的水平组合下做试验,结果如表6-8(表中数据为产量):表68因素B因素A151517191916161821171717151515192222151716181716181818182020151617171717解:检验的假设有三个:光照因素A对产量没有显著影响;:光照因素A对产量有显著影响。:噪音因素B对产量没有显著影响;:噪音因素B对产量有显著影响。:光照效应与噪音效应没有交互作用;:光照效应与噪音效应有交互作用。 将以上数据输入Excel表格中,进行“有重复双因素分析”,Excel输出的方差分析表如下:表69方差分析表差异源SSDfMSFP-valueF crit样本(B因素)28.388889214.19449.462960.000933.40283列(A因素)2.083333330.694440.462960.710773.00879交互63.833333610.63897.092590.00022.50819内部36241.5总计130.3055635从上表可知:=0.46296 =3.40283,拒绝,有充分证据说明噪音对产量有显著影响;=7.09259=2.50819,拒绝,有充分证据说明光照与噪音存在交互作用并由此对产量产生显著影响。第四节 EXCEL在方差分析中的运用一、单因素方差分析在Excel中,可以使用方差分析:单因素方差分析工具来完成单因素方差分析。【例6-4】本章例6-1的Excel统计分析步骤如下。1输入数据。如图6-3所示。图6-32调出方差分析:单因素方差分析对话框,其主要选项含义如下。输入区域:在此输入待分析数据区域的单元格引用。该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。本例为“$B$1:$D$6”。分组方式:如果需要指出输入区域中的数据是按行还是按列排列,请单击行或列。本例分组方式为“列”。标志位于第一行/列:如果输入区域的第一行中包含标志项,请选中标志位于第一行复选框;如果输入区域的第一列中包含标志项,请选中标志位于第一列复选框;如果输入区域没有标志项,则该复选框不会被选中,Excel将在输出表中生成适宜的数据标志。:在此输入计算 F 统计临界值的置信度。本例为0.05。本例对话框的填写如图6-3所示。图中分组方式为“列”方式,因为三家分店的日营业额是按列排列的,即分别排在B、C、D列。3单击确定按钮,可得方差分析表(结果已在本章第二节的表63中给出)。二、无交互作用下的双因素方差分析该项工作可利用方差分析:无重复双因素方差分析工具来完成。【例6-5】本章例6-2的Excel统计分析步骤如下。1输入数据。如图6-4所示。2调出方差分析:无重复双因素分析对话框,填写如图6-4所示。该工具对话框设置与单因素方差分析类似。要注意,本例中标志复选框被选中,输入区域必须包括A因素与B因素的水平标志(如“工人一”、“工人四”、“设备B”等)所在的单元格区域,也即输入区域为“$M$1:$R$4”,而不是只包括数据的单元格区域“$N$2:$R$4”。图6-43单击确定按钮。得到方差分析表。(结果已在本章第三节表66中给出)。三、有交互作用的双因素方差分析该项工作可以使用方差分析:可重复双因素方差分析工具来完成。【例6-6】本章例6-3的Excel统计分析步骤如下。1输入数据,如图6-5所示。其中,B2:B4单元格存放的是在“A1”与“B1”因素水平共同作用下,进行3次试验所得的结果;D5:D7单元格存放的是在“A3”与“B2”因素水平共同作用下,进行3次试验所得的结果,其余类推。图6-52调出方差分析:可重复双因素分析对话框,其填写如图6-6所示。该分析工具对话框与单因素方差分析对话框基本相同,只是多了一个每一样本的行数编辑框,其中输入包含在每个样本中的行数。本例中,在每种不同因素水平组合下,分别进行了3次试验,因此每一样本的行数为“3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论