单因素方差分析PPT课件_第1页
单因素方差分析PPT课件_第2页
单因素方差分析PPT课件_第3页
单因素方差分析PPT课件_第4页
单因素方差分析PPT课件_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章方差分析,教学目的:本章阐述方差分析的理论与方法,要求学生学会方差分析的基本方法。教学重点及难点:教学重点:单因素与双因素方差分析。教学难点:方差分析表及其分析。主要教学内容及要求:1、了解方差分析的基本原理;2、掌握单因素与双因素方差分析法;3、理解掌握方差分析表;4、能够运用excel/spss软件进行相方差分析分析。,章节安排,第一节方差分析原理第二节F检验第三节单因素方差分析第四节双因素方差分析,第一节方差分析原理,一、方差分析常用概念,(一)应用方差分析的原因1.检验过程繁琐2.无统一的试验误差,误差估计的精确性和检验的灵敏性低3.推断的可靠性低,检验的I型错误率大由于上述原因,多个平均数的差异显著性检验不宜用t检验法,必须采用方差分析法。,(二)概念及术语,方差分析(AnalysisofVariance)是由英国统计学家R.A.Fisher于1923年提出的。这种方法是将k个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。方差分析实质上是关于观测值变异原因的数量分析,它在科学研究中应用十分广泛。,常用术语,1.因素因素是指所要研究的变量,它可能对因变量产生影响。2.水平水平指各个因素的具体表现。3.指标为衡量研究结果或处理效应的好坏,在研究中具体测定的性状或观测项目称为指标。4.交互作用如果一个因素的效应大小在另一个因素不同水平下明显不同,则称为两因素间存在交互作用。当存在交互作用时,单纯研究某个因素的作用是没有意义的,必须在另一个因素的不同水平下研究该因素的作用大小。,二、方差分析的基本思想,方差分析就是通过对水平之间的方差和水平内部的方差的比较,做出拒绝还是不能拒绝原假设的判断。,怎样解决下面的问题?,来自不同地区的大学生每个月的平均生活费支出是否不同呢?家电的品牌对它们的销售量是否有显著影响呢?不同的路段和不同的时段对行车时间有影响吗?超市的位置和它的销售额有关系吗?不同的小麦品种产量有差异吗?,【例】研究员想挑选出能使小麦亩产量最大的化肥,选了三个品牌的化肥:A,B和C。,因子,水平,研究分类自变量(因子factor)对数值因变量(观测结果)的影响例如:“化肥品牌”是一个分类自变量两个或多个水平(level)或分类。例如:3个化肥品牌一个数值型因变量,产量分析三个品牌的化肥的产量是否有显著差异,也就是要判断“品牌”对“产量”是否有显著影响作出这种判断最终被归结为检验这三个品牌的产量的均值是否相等若它们的均值相等,则意味着“品牌”对产量是没有影响的;若均值不全相等,则意味着“品牌”对产量是有影响的。,方差分析基本原理,从散点图上可以看出不同品牌的产量是有明显差异的同一个品牌,不同地块的产量也明显不同B较高,C较低品牌与产量之间有一定的关系如果品牌与产量之间没有关系,那么它们的产量应该差不多相同,在散点图上所呈现的模式也就应该很接近,方差分析的基本思想和原理(图形分析),方差分析的基本原理,为了更容易的找出各化肥品牌的小麦平均产量的不同,我们对每个化肥品牌做一个箱线图。,仅从散点图上观察还不能提供充分的证据证明化肥品牌与小麦产量之间有显著差异这种差异也可能是由于抽样的随机性所造成的需要有更准确的方法来检验这种差异是否显著,也就是进行方差分析所以叫方差分析,因为虽然我们感兴趣的是均值,但在判断均值之间是否有差异时则需要借助于方差这个名字也表示:它是通过对数据误差来源的分析判断不同总体的均值是否相等。因此,进行方差分析时,需要考察数据误差的来源,方差分析的基本思想和原理,三、方差分析的前提和基本步骤,(一)方差分析的基本前提1.样本是独立的随机样本。2.各样本皆来自正态总体。3.总体方差具有齐性,即各总体方差相等。(二)方差分析的基本步骤1.计算各项平方和与自由度。2.列出方差分析表,进行F检验。3.做出判断。,第二节误差分解与F检验,一、误差分解,组内误差(withingroups)样本数据内部各观察值之间的差异比如,同一位置下不同超市之间销售额的差异的差异反映随机因素的影响,称为随机误差组间误差(betweengroups)不同样本之间观察值的差异比如,不同位置超市之间销售额的差异可能是随机误差,也可能是超市位置本身所造成的系统性系统误差总误差(total)全部观测数据的误差大小,误差平方和的分解及其关系,总误差,总平方和(SST),随机误差,处理误差,组内平方和(SSE),组间平方和(SSA),=,=,+,+,误差度量(均方MS),用均方(meansquare)表示误差大小,以消除观测数据的多少对平方和的影响用平方和除以相应的自由度均方也称方差(variance)组间均方也称组间方差(between-groupsvariance),反映各因子间误差的大小MSA=SSA自由度(因子个数-1)组内均方也称组内方差(within-groupsvariance),反映随机误差的大小MSE=SSE自由度(数据个数-因子个数)总平方和(SST)的自由度为n-1,二、F分布与拒绝域,如果均值相等,F=MSA/MSE1,a,F分布,F(k-1,n-k),0,拒绝H0,不拒绝H0,F,三、F-检验,将组间均方与组内均方进行比较,分析差异是否显著F=(MSAMSE)F(因子自由度,残差自由度)用F分布作出决策,给定的显著性水平若FF(或P),则拒绝原假设H0,表明均值之间的差异显著,因素对观察值有显著影响,设1为化肥品牌A下产量的均值,2为化肥品牌B下产量的均值,3为化肥品牌C下产量的提出的假设为H0:123H1:1,2,3不全相等计算检验统计量计算P值,作出决策,第三节单因素方差分析,例题分析,单因素方差分析表(基本结构),由SPSS可以得到方差分析表:,该表说明我们要拒绝零假设,各化肥品牌导致的小麦产量之间有显著不同.,单因素方差分析,用Excel进行方差分析(Excel检验步骤),第1步:选择“工具”下拉菜单第2步:选择“数据分析”选项第3步:在分析工具中选择“单因素方差分析”,然后选择“确定”第4步:当对话框出现时在“输入区域”方框内键入数据单元格区域在方框内键入0.05(可根据需要确定)在“输出选项”中选择输出区域,用SPSS进行方差分析(单因素方差分析),用SPSS进行方差分析,第1步:选择【Analyze】【CompareMeans】【One-Way-ANOVA】进入主对话框第2步:在主对话框中将因变量(产量)选入【DependentList】,将自变量(品牌)选入【Factor)】第3步(需要多重比较时)点击【Post-Hoc】从中选择一种方法,如LSD;(需要均值图时)在【Options】下选中【Meansplot】,(需要相关统计量时)选择【Descriptive】,点击【Continue】回到主对话框。点击【OK】,第四节双因素方差分析,在小麦产量的例子中,我们将总效应分为两类:化肥变量的效应和残差变量的效应。换句话说,我们只考虑了效应的两个来源,即来自化肥变量和随机误差。但是影响小麦产量的因素除了所用化肥的品牌,可能还有土壤、天气等等因素的影响。考虑其他因素的好处是降低残差的效应,即降低F统计量的分母,F值会变大,使我们拒绝均值相等的零假设,或者说我们可以解释更多的效应,从而减少误差。本节讨论双因素方差分析(Two-WayANOVA),其分析方法可以很容易地被推广到多因素方差分析(Multi-WayANOVA)。,一、双因素方差分析的种类(two-wayanalysisofvariance),分析两个因素(行因素Row和列因素Column)对试验结果的影响如果两个因素对试验结果的影响是相互独立的,分别判断行因素和列因素对试验数据的影响,这时的双因素方差分析称为无交互作用的双因素方差分析或无重复双因素方差分析(Two-factorwithoutreplication)如果除了行因素和列因素对试验数据的单独影响外,两个因素的搭配还会对结果产生一种新的影响,这时的双因素方差分析称为有交互作用的双因素方差分析或可重复双因素方差分析(Two-factorwithreplication),例题分析,【例】个地区的交通管理局正准备扩大从郊区到商业中心的公车服务,考虑四条路线:1号线、2号线、3号线、4号线。交管局想进行检验判断四条路线的平均行驶时间是否存在差异。因为可能存在不同司机,检验时让每一名司机都分别行驶四条路线。在0.05的显著性水平下,四条路线的行驶时间的均值是否有差异?,实际上p-值0.225远大于0.05,所以不能拒绝零假设。交管局得出结论四条路线的平均行驶时间无差异,没有某条路线行驶速度快而被选择的理由。,如果不考虑司机因素单因素分析,二、无交互效应的双因素方差分析,如果上例中我们只考虑路线引起的效应而将其余的都归为随机效应,那么我们没有必要让五名司机分别行驶四条路线。如果我们考虑不同司机的影响,我们就能减少残差平方和,从而得到更大的F值。我们把本例中的司机因素称为区组因素(blockingvariable),即在方差分析中能减少残差平方和的第二个处理因素。在本例中将司机作为区组因素,从残差平方和中提取出司机的影响能够影响处理的F比值。这里介绍无交互作用的双因素方差分析。,无交互效应的双因素方差分析,因为我们考虑不同司机行使时间的差异,所以要对区组做假设检验。两组假设分别为:1不同路线均值都相等各路线均值不全相等2区组均值都相等各区组均值不全相等两因素方差分析表的格式与单因素方差分析的格式一致,唯一的区别是加了一行区组变差。,无交互效应的双因素方差分析,从该表可以看出,关于对司机的零假设的p-值是0.002,对路线的零假设的p-值是0.024。可以得知在0.05的显著性水平下,路线和区组的零假设都被拒绝。因此,路线和司机这两个因素都对行驶时间有显著作用,也就是说这两个因素的不同水平的确造成了行驶时间的不同。这表明司机这个因素的引进,使得路线对行驶时间从没有影响变成有显著影响。,无交互效应的双因素方差分析,例题分析线路因素和司机因素合起来总共解释了行车时间差异的78.45%其他因素(残差变量)只解释了销售量差异的21.55%,无交互效应的双因素方差分析,三、有交互效应的双因素方差分析,值得注意的是,对于上面的例子,我们仅仅分析了路线和司机这两个因素分别对行驶时间的影响。也就是说因为司机变化所带来的行驶时间的变化是同行驶的路线是无关的。这显然是值得斟酌的。对于一个实际问题,仅考虑因素各自的作用是不是合理?能不能回答我们关心的问题?那就得视具体问题而论了。因此,我们接下来简单介绍带交互作用的双因素方差分析。要说明的是,如果每一种因素水平的组合只有一个观测值,那么由于数据量不够会导致无法判断是否有交互作用。这时即使有交互作用,也混在误差项中而无法分离出来。,例7.3该地区的交管局还想研究司机变化所带来的行驶时间的变化与行驶的路线是否有关?因此,我们假设对这个地区的交管局进行了2次测试。获得数据如下表所示,有交互效应的双因素方差分析,m为样本的行数,有交互效应的双因素方差分析,有交互效应的双因素方差分析,从中可以看到,与无交互的双因素方差分析结果一样,路线和司机因素的p-值都小于0.05,检验是高度显著的。交互项“司机*路线”反映的是司机因素和路线因素联合产生的对行驶时间的附加效应。由于p-值0.025小于0.05,因此,检验高度显著,这表明司机因素和路线因素联合产生的交互作用对行驶时间有显著影响。换句话说,也就是不同路线的行驶时间差异会因为所使用的司机的不同而不同,或者说不同司机的行驶时间差异会因为所经过的路线不同而不同。,有交互效应的双因素方差分析,交互作用的模型可以从点图中直观看出。图7.4中的五条折现分别表示了每名司机行驶不同路线所需的平均时间。如果在有交互作用的模型中,这样五条线还是平行的,那就说明司机因素和路线因素之间没有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论