




已阅读5页,还剩78页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2020/5/20,版权所有BY统计学课程组,1,第七章,方差分析AnalysisofVariance(ANOVA),2020/5/20,版权所有BY统计学课程组,2,学习目标,掌握方差分析中的基本概念;掌握方差分析的基本思想和原理;掌握单因素方差分析的方法及应用;初步了解多重比较方法的应用;了解双因素方差分析的方法及应用。,2020/5/20,版权所有BY统计学课程组,3,学习内容,第一节方差分析简介常用术语基本假定第二节单因素方差分析分析模型基本思想分析步骤多重比较第三节双因素方差分析无交互作用双因素方差分析有交互作用双因素方差分析,2020/5/20,版权所有BY统计学课程组,4,7.1方差分析简介,7.1.1方差分析中的基本概念7.1.2方差分析中的基本假设与检验,2020/5/20,版权所有BY统计学课程组,5,失业保险案例:为什么要进行方差分析?,为了减小失业保险支出、促进就业,政府试图为失业者提供再就业奖励:如果失业者可以在限定的时间内重新就业,他将可以获得一定数额的奖金。政策会有效吗?,2020/5/20,版权所有BY统计学课程组,6,试验数据,2020/5/20,版权所有BY统计学课程组,7,要研究的问题,总体1,1(奖金=1),总体2,2(奖金=2),总体3,3(奖金=3),总体4,4(奖金=4),2020/5/20,版权所有BY统计学课程组,8,各个总体的均值相等吗?,2020/5/20,版权所有BY统计学课程组,9,失业保险案例:实验结果,1=无奖金2=低奖金3=中奖金4=高奖金。根据实验结果,可以认为各总体的平均失业时间相同吗?,2020/5/20,版权所有BY统计学课程组,10,研究方法:两样本的t检验?,如果采用t检验法对多个总体均值进行差异显著性检验,会出现如下问题:全部检验过程烦琐,做法不经济无统一的总体方差估计,检验的精度降低犯第一类错误的概率增大,检验的可靠性降低,2020/5/20,版权所有BY统计学课程组,11,方差分析可以用来比较多个均值,方差分析(Analysisofvariance,ANOVA)的主要目的是通过对方差的比较来同时检验多个均值之间差异的显著性。可以看作t检验的扩展,只比较两个均值时与t检验等价。20世纪20年代由英国统计学家费喧(R.A.Fisher)最早提出的,开始应用于生物和农业田间试验,以后在许多学科中得到了广泛应用。,2020/5/20,版权所有BY统计学课程组,12,ANOVA(analysisofvariance),由于方差分析法是通过比较有关方差的大小而得到结论的,所以在统计中,常常把运用方差分析法的活动称为方差分析。方差分析的内容很广泛,既涉及到实验设计的模式,又关乎数据分析模型中因素效应的性质。本章在完全随机试验设计下,讨论固定效应模型方差分析的基本原理与方法,重点介绍单因素方差分析及两因素方差分析的内容。,2020/5/20,版权所有BY统计学课程组,13,7.1.1方差分析中的几个基本概念,因变量:我们实际测量的、作为结果的变量,例如失业持续时间。因变量也称试验指标,其不同的取值常称为观察值或试验数据。自变量:作为原因的、把观测结果分成几个组以进行比较的变量例如奖金水平。在方差分析中,自变量也被称为因素(factor)。因素的不同表现,即每个自变量的不同取值称为因素的水平。,2020/5/20,版权所有BY统计学课程组,14,7.1.1方差分析中的几个基本概念,方差分析主要用来研究一个定量因变量与一个或多个定性自变量的关系只有一个自变量的方差分析称为单因素方差分析。研究多个因素对因变量的影响的方差分析称为多因素方差分析,其中最简单的情况是双因素方差分析。,2020/5/20,版权所有BY统计学课程组,15,为便于理解,在单因素方差分析中,将因素的任何一个水平(处理)看作是一个总体,该水平(处理)下试验得到的数据可看成是从总体中抽出的一个样本,处理的重复数即为样本容量。,7.1.1:固定效应与随机效应模型,2020/5/20,版权所有BY统计学课程组,16,若因素的每一个水平(处理)均做试验,相当于对该因素进行了全面调查。此种情形下,方差分析目的在于:对比较寻优,即确定因素的显著影响水平,且该显著影响水平仅在中有效,在外无效,一句话,试验数据不能对因素做推断,这属于固定效应模型方差分析范畴。固定效应模型:因素的所有水平都是由实验者审慎安排而不是随机选择的。,7.1.1:固定效应模型,2020/5/20,版权所有BY统计学课程组,17,若只对因素的部分水平(处理)做试验,相当于对进行了抽样调查,此种情形下,方差分析目的在于:对因素的总体变量所服从的分布进行差异性检验和参数估计,即样本推断总体,这属于随机效应模型方差分析范畴。随机效应模型:因素的水平是从多个可能的水平中随机选择的。固定效应和随机效应模型在假设的设置和参数估计上有所差异,本章研究的都是固定效应模型。,7.1.1:随机效应模型,2020/5/20,版权所有BY统计学课程组,18,方差分析与回归分析的联系*,回归分析主要用来研究定量自变量和定量因变量之间的关系(第八章学习)。回归分析中方差分析常常用来检验回归方程的整体显著性。回归模型中也可以包含定性自变量。这时回归模型与方差分析模型是等价的。,2020/5/20,版权所有BY统计学课程组,19,7.1.2:方差分析中的基本假设,(1)在各个总体中因变量都服从正态分布;(2)在各个总体中因变量的方差都相等;(3)各个观测值之间是相互独立的。,2020/5/20,版权所有BY统计学课程组,20,(1)正态性的检验,各组数据的直方图Q-Q图,K-S检验*,2020/5/20,版权所有BY统计学课程组,21,(2)等方差性的检验,经验方法:计算各组数据的标准差,如果最大值与最小值的比例小于2:1,则可认为是同方差的。本例中,最大值和最小值的比例等于1.833.32,p-值=0.00020.05,因此检验的结论是采伐对林木数量有显著影响。,2020/5/20,版权所有BY统计学课程组,54,7.2.4方差分析中的多重比较,在方差分析中,不拒绝零假设H0,表示拒绝总体均数相等的证据不足,分析终止;当零假设H0被拒绝时,我们可以确定至少有两个总体的均值有显著差异。但要进一步检验哪些均值之间有显著差异还需要采用多重比较的方法进行分析。这在方差分析中称为事后检验(PostHoctest)。多重比较是同时对各个总体均值进行的两两比较。方法很多,如Fisher最小显著差异(LeastSignificantDifference,LSD)方法、Tukey的诚实显著差异(HSD)方法或Bonferroni的方法等。这里我们只介绍最小显著差异方法。,2020/5/20,版权所有BY统计学课程组,55,用LSD法进行多重比较的步骤,1、提出假设H0:mi=mjH1:mimj2、计算检验的统计量3a、如果或则拒绝H0。3b、计算的置信区间:如果0包含在该置信区间内则不能拒绝H0,否则拒绝H0。,2020/5/20,版权所有BY统计学课程组,56,实例:失业保险实验,根据第一个总体和第四个总体计算的t统计量利用统计软件可以计算出t检验的临界值由于,因此我们有证据表明无奖金组与高奖金组的再就业时间有显著差异。其他奖金水平效应之间差异的显著性也可以用类似的方法计算。,2020/5/20,版权所有BY统计学课程组,57,实例:热带雨林采伐,很多统计软件都可以直接进行多重比较。下表是SPSS对热带雨林例子的输出结果。置信区间5.3114.03,3.2612.68不包括0,差异显著。置信区间-6.043.02包括了0,差异不显著。,2020/5/20,版权所有BY统计学课程组,58,7.3双因素方差分析,7.3.1无交互作用的双因素方差分析7.3.2有交互作用的双因素方差分析7.3.3双因素方差分析的步骤7.3.4贡献率分析,2020/5/20,版权所有BY统计学课程组,59,交互作用,交互作用即一个因素对因变量的影响程度受另一个因素的影响的情况。假设学生分两类:在校和在职。把两类学生随机分成两组,分别采用课堂讲授和交互式教学方法,考试结果如下表。可见课堂讲授的方式更适合于在校生,交互式教学方式更适合于在职生。在这种情况下我们说两个因素之间存在着交互作用。,2020/5/20,版权所有BY统计学课程组,60,交互作用示意图,2020/5/20,版权所有BY统计学课程组,61,交互作用级,因子间的交互作用会随着因子个数的增加而增加。如四个因子A,B,C,D间的交互作用有以下几类:(1)二级交互作用有6个:AB,AC,AD,BC,BD,CD;(2)三级交互作用有4个:ABC,ABD,ACD,BCD;(3)四级交互作用有1个:ABCD。交互作用共有11个,比因子个数还多。实践经验表明,多数交互作用是不存在或者很小以至可以忽略不计的,一般我们主要考虑部分二级交互作用,但考察哪些二级交互作用由具体情况来决定。,2020/5/20,版权所有BY统计学课程组,62,双因素方差分析的类型和基本假设,双因素方差分析中因素A和B对结果的影响相互独立时称为无交互作用的双因素方差分析。如果除了A和B对结果的单独影响外还存在交互作用,这时的双因素方差分析称为有交互作用的双因素方差分析。双因素方差分析中的基本假设是各个子总体都服从正态分布,有相同的方差,并且各个观测值之间相互独立(与单因素时相同)。,2020/5/20,版权所有BY统计学课程组,63,7.3.1无交互作用双因素方差分析数据结构,2020/5/20,版权所有BY统计学课程组,64,7.3.1无交互作用的双因素方差分析模型,在无交互作用的双因素方差分析模型中因变量的取值受四个因素的影响:总体的平均值;因素A导致的差异;因素B导致的差异;以及误差项。写成模型的形式就是:,2020/5/20,版权所有BY统计学课程组,65,无交互作用的双因素方差分析模型,2020/5/20,版权所有BY统计学课程组,66,离差平方和的分解,2020/5/20,版权所有BY统计学课程组,67,无交互作用的双因素方差分析表,2020/5/20,版权所有BY统计学课程组,68,7.3.2有交互作用的双因素方差分析数据结构,2020/5/20,版权所有BY统计学课程组,69,7.3.2有交互作用的双因素方差分析模型,在有交互作用的双因素方差分析模型中因变量的取值受五个因素的影响:总体的平均值;因素A导致的差异;因素B导致的差异;由因素A和因素B的交互作用导致的差异;以及误差项。写成模型的形式就是:,2020/5/20,版权所有BY统计学课程组,70,7.3.2有交互作用的双因素方差分析模型,2020/5/20,版权所有BY统计学课程组,71,离差平方和的分解,2020/5/20,版权所有BY统计学课程组,72,有交互作用的双因素方差分析表,2020/5/20,版权所有BY统计学课程组,73,7.3.3双因素方差分析的步骤(1),双因素方差分析的步骤与单因素分析类似,主要包括以下步骤:1.分析所研究数据能否满足方差分析要求的假设条件,需要的话进行必要的检验。如果假设条件不满足需要先对数据进行变换。,2020/5/20,版权所有BY统计学课程组,74,7.3.3双因素方差分析的步骤(2),2、提出零假设和备择假设。双因素方差分析可以同时检验两组或三组零假设和备择假设。要说明因素A有无显著影响,就是检验如下假设:要说明因素B有无显著影响,就是检验如下假设:在有交互作用的双因素方差中,要说明两个因素的交互作用是否显著还要检验第三组零假设和备择假设:,2020/5/20,版权所有BY统计学课程组,75,7.3.3双因素方差分析的步骤(3),3、计算F检验值。4、根据实际值与临界值的比较,或者p-值与的比较得出检验结论。与单因素方差分析的情况类似,对FA、FB和FAB,当F的计算值大于临界值F(或者p-值)时拒绝零假设H0。,2020/5/20,版权所有BY统计学课程组,76,双因素方差分析:失业保险的例子(1),同时考虑奖金和年龄因素,二者对失业时间有显著影响吗?,2020/5/20,版权所有BY统计学课程组,77,双因素方差分析:失业保险的例子(2),1、同时考虑奖金水平和年龄因素时,每种实验条件下的数据只有3个,不适合直接进行正态性和等方差性检验。假设这些条件成立。2、提出假设(有交互作用的方差分析模型):对奖金因素:对年龄因素:对交互作用:,2020/5/20,版权所有BY统计学课程组,78,双因素方差分析:失业保险的例子(3),3、方差分析表(Excel)4、结论:在5%的显著性水平下奖金水平对就业时间影响显著;年龄对就业时间有显著影响;奖金水平与年龄的交互作用的影响不显著,2020/5/20,版权所有BY统计学课程组,79,双因素方差分析:失业保险的例子(4),用无交互作用的模型分析时(SPSS):结论:在5%的显著性水平下奖金水平对就业时间影响显著;年龄对就业时间有显著影响。,2020/5/20,版权所有BY统计学课程组,80,7.3.4贡献率分析,当试验指标不服从正态分布时,进行方差分析的依据就不充足,此时可以通过比较各因子的“贡献率”来衡量因子作用的大小。,2020/5/20,版权所有BY统计学课程组,81,表7-27贡献率分析表,2020/5/20,版权所有BY统计学课程组,82,小结(1),1、方差分析(ANOVA),一般用来分析一个定量因变量与一个或几个定性自变量(因素)之间的关系,它可以同时对多个总体的均值是否相等进行整体检验。2、根据研究所涉及的因素的多少,方
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论