第八章方差分析_第1页
第八章方差分析_第2页
第八章方差分析_第3页
第八章方差分析_第4页
第八章方差分析_第5页
已阅读5页,还剩97页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章第八章 方差分析方差分析v第一节第一节 方差分析的基本问题方差分析的基本问题 v第二节第二节 单因素方差分析单因素方差分析v第三节第三节 双因素方差分析双因素方差分析学习目标学习目标1.1.解释方差分析的概念解释方差分析的概念2.2.解释方差分析的基本思想和原理解释方差分析的基本思想和原理3 3、掌握单因素方差分析的方法及应用、掌握单因素方差分析的方法及应用4 4、掌握双因素方差分析的方法及应用、掌握双因素方差分析的方法及应用第一节第一节 方差分析的基本问题方差分析的基本问题v一一. . 方差分析的内容方差分析的内容v二二. . 方差分析的原理方差分析的原理v三三. . F F 分布分布

2、什么是方差分析?什么是方差分析? ANOVA ANOVA 由英国统由英国统计学家计学家R.A.FisherR.A.Fisher首首创,为纪念创,为纪念FisherFisher,以以F F命名,故方差分析命名,故方差分析又称又称 F F 检验检验 (F F testtest)。用于推断)。用于推断多多个总体均数个总体均数有无差异有无差异 什么是方差分析什么是方差分析? ? 表表8-1 8-1 该饮料在五家超市的销售情况该饮料在五家超市的销售情况超市超市无色无色粉色粉色橘黄色橘黄色绿色绿色1 12 23 34 45 526.526.528.728.725.125.129.129.127.227.2

3、31.231.228.328.330.830.827.927.929.629.627.927.925.125.128.528.524.224.226.526.530.829.632.431.732.8某饮料生产企业研制出一种新型饮料。饮料的颜色共有某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。这四种四种,分别为橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收

4、集了前一时期该饮料的销售情况,见五家超级市场上收集了前一时期该饮料的销售情况,见表表8-18-1。试分析饮料的颜色是否对销售量产生影响。试分析饮料的颜色是否对销售量产生影响。什么是方差分析什么是方差分析? ?1.1.检验饮料的颜色对销售量是否有影响,也就是检验饮料的颜色对销售量是否有影响,也就是检验四种颜色饮料的平均销售量是否相同检验四种颜色饮料的平均销售量是否相同2.2.设设 1 1为无色饮料的平均销售量,为无色饮料的平均销售量, 2 2粉色饮料的粉色饮料的平均销售量,平均销售量, 3 3为橘黄色饮料的平均销售量,为橘黄色饮料的平均销售量, 4 4为绿色饮料的平均销售量,为绿色饮料的平均销售

5、量,也就是检验下面也就是检验下面的假设的假设H H0 0: : 1 1 2 2 3 3 4 4 H H1 1: : 1 1 , , 2 2 , , 3 3 , , 4 4 不全相等不全相等3.3.检验上述假设所采用的方法就是方差分析检验上述假设所采用的方法就是方差分析什么是方差分析什么是方差分析? ?1 1、方差分析的实质:检验多个总体均值是否、方差分析的实质:检验多个总体均值是否相等相等 。通过对样本各观察数据差异来源的分。通过对样本各观察数据差异来源的分析判断多个总体均值的差异是否具有统计学上析判断多个总体均值的差异是否具有统计学上的意义。的意义。2.2.变量构成:定类变量构成:定类- -

6、定距(比例)定距(比例)3.3.用于分析完全随机化试验设计用于分析完全随机化试验设计方差分析正是从观测变量的方差入手,方差分析正是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。对观测变测变量有显著影响的变量。对观测变量有显著影响的各个控制变量及其不量有显著影响的各个控制变量及其不同水平以及各个水平的交互搭配是如同水平以及各个水平的交互搭配是如何影响观测变量的。何影响观测变量的。方差分析的方差分析的几个基本概念几个基本概念1.1.因素或因子因素或因子所要检验的对象称为因子。所要检验的对象称为因子。要分析饮料的颜色对销售量是否有影响,

7、颜色要分析饮料的颜色对销售量是否有影响,颜色是要检验的因素或因子。是要检验的因素或因子。2.2.水平水平因素的具体表现称为水平。因素的具体表现称为水平。A A1 1、A A2 2、A A3 3、 A A4 4四种颜色就是因素的水平。四种颜色就是因素的水平。3.3.观察值观察值在每个因素水平下得到的样本值。在每个因素水平下得到的样本值。每种颜色饮料的销售量就是观察值。每种颜色饮料的销售量就是观察值。4 4、试验、试验这里只涉及一个因素,因此称为单因素四水平这里只涉及一个因素,因此称为单因素四水平的试验。的试验。5 5、总体、总体因素的每一个水平可以看作是一个总体。因素的每一个水平可以看作是一个总

8、体。比如比如A A1 1、A A2 2、A A3 3、 A A4 4四种颜色可以看作是四个四种颜色可以看作是四个总体。总体。6 6、样本数据、样本数据上面的数据可以看作是从这四个总体中抽取的上面的数据可以看作是从这四个总体中抽取的样本数据。样本数据。方差分析的基本方差分析的基本思想和原理思想和原理方差分析的基本假设前提方差分析的基本假设前提v1 1、观测变量各总体应服从正态分布。、观测变量各总体应服从正态分布。v2 2、观测变量各总体的方差应相同、观测变量各总体的方差应相同( (方差齐性方差齐性) )。v3 3、随机抽样。、随机抽样。v为什么必须进行方差齐性检验?为什么必须进行方差齐性检验?v

9、方差分析的前提假设是该因素在各组之间的方差相同方差分析的前提假设是该因素在各组之间的方差相同, ,所以所以才可以构造才可以构造F F统计量统计量. .否则无法证明残差否则无法证明残差SeSe和组内平方和和组内平方和SrSr分分别服从自由度是别服从自由度是r r和和n-rn-r的卡方分布的卡方分布, ,也就无法检验也就无法检验 方差分析的基本思想和原理方差分析的基本思想和原理v方差分析认为导致观测值变化的因素有两类:方差分析认为导致观测值变化的因素有两类:(一)控制因素不同水平以及不同控制因素(一)控制因素不同水平以及不同控制因素交互作用所产生的影响;(组间变异)交互作用所产生的影响;(组间变异

10、) ( (二二) )随机因素所产生的影响。(组内变异)随机因素所产生的影响。(组内变异)v将所有测量值间的总变异按照其变异的来源分解为多个部份,将所有测量值间的总变异按照其变异的来源分解为多个部份,然后进行比较,评价由某种因素所引起的变异是否具有统计然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。学意义。方差分析的基本思想和原理方差分析的基本思想和原理组间变异组间变异总变异总变异组内变异组内变异单因素方差分析单因素方差分析v单因素方差分析的数学模型单因素方差分析的数学模型: :方差分析的基本思想和原理方差分析的基本思想和原理v总变异总变异(Total variationTotal

11、variation):全部测量值):全部测量值Y Yijij与总均数与总均数 间的差异间的差异 v组间变异组间变异( between group variation between group variation ):):各组的均数各组的均数 与总均数与总均数 间的差异间的差异v组内变异组内变异(within group variation )within group variation ):每组:每组的每个测量值的每个测量值Yij与该组均数与该组均数 的差异的差异YYiYiY方差分析的基本思想和原理方差分析的基本思想和原理v组间变异组间变异 SSSSA A反映了各组均数反映了各组均数 的变异

12、程度的变异程度v组间变异随机误差组间变异随机误差+ +处理因素效应处理因素效应vdfdf组间组间=k-1(k=k-1(k为变量水平数为变量水平数) )v组内变异组内变异 SSESSE用各组内各测量值用各组内各测量值X Xijij与其所在组的与其所在组的均数差值的平方和来表示,反映随机误差的影响。均数差值的平方和来表示,反映随机误差的影响。vdfdf组内组内=N-k=N-k(N N为样本总数)为样本总数)v总变异总变异 SSTSSTvdfdf总总= df= df组间组间+ df+ df组内组内=N-1=N-1三种三种“变异变异”之间的关系之间的关系v给变异起个新名字给变异起个新名字 方差方差v总

13、变异总变异 总方差总方差v组间变异组间变异 组间方差组间方差v组内变异组内变异 组内方差组内方差方差分析的基本思想和原理方差分析的基本思想和原理( (计算均方计算均方MSMS) )1.1.各方差的大小与观察值的多少有关,为了消除各方差的大小与观察值的多少有关,为了消除观察值多少对方差大小的影响,需要将其平均,观察值多少对方差大小的影响,需要将其平均,这就是均方这就是均方2.2.计算方法是用方差除以相应的自由度计算方法是用方差除以相应的自由度3.3.三个平方和的自由度分别是:三个平方和的自由度分别是:SST SST 的自由度为的自由度为n n-1-1,其中,其中n n为全部观察值的个数为全部观察

14、值的个数SSASSA的自由度为的自由度为k k-1-1,其中,其中k k为因素水平的个数为因素水平的个数SSE SSE 的自由度为的自由度为n n- -k k方差分析的基本思想和原理方差分析的基本思想和原理( (计算均方计算均方差差MSMS) )1. SSA的均方也称组间均方差组间均方差,记为MSA,计算公式为SSESSE的均方也称组内均方差,记为的均方也称组内均方差,记为MSEMSE,计算公式为计算公式为方差分析的基本思想和原理方差分析的基本思想和原理( (计算检验的统计量计算检验的统计量 F F ) )将将MSAMSA和和MSEMSE进行对进行对比,即得到所需要比,即得到所需要的检验统计量

15、的检验统计量F F, ,F F 服从分子自由度服从分子自由度为为k k-1-1、分母自由度、分母自由度为为 n n- -k k 的的 F F 分布分布,方差分析的基本思想和原理方差分析的基本思想和原理1.1.如果不同颜色如果不同颜色( (水平水平) )对销售量对销售量( (结果结果) )没有影响,没有影响,那么在组间方差中只包含有随机差异,而没有系那么在组间方差中只包含有随机差异,而没有系统差异。这时,组间方差与组内方差就应该很接统差异。这时,组间方差与组内方差就应该很接近,两个方差的比值就会接近近,两个方差的比值就会接近1.1.2.2.如果不同的水平对结果有影响,在组间方差中如果不同的水平对

16、结果有影响,在组间方差中除了包含随机差异外,还会包含有系统差异,这除了包含随机差异外,还会包含有系统差异,这时组间方差就会大于组内方差,组间方差与组内时组间方差就会大于组内方差,组间方差与组内方差的比值就会大于方差的比值就会大于1.1.3.3.当这个比值大到某种程度时,就可以说不同水当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异平之间存在着显著差异. .单因素方差分析的步骤单因素方差分析的步骤(一)提出假设(一)提出假设(二)构造检验统计量(二)构造检验统计量(三)计算(三)计算F F值值(四)统计决策(四)统计决策(一)提出假设(一)提出假设1.1.一般提法一般提法H0: 1

17、= 2 = k (因素有因素有k个水平)个水平)H1: 1 , 2 , , k不全相等不全相等2.2.对前面的例子对前面的例子H0: 1 = 2 = 3 = 4颜色对销售量没有影响颜色对销售量没有影响H1: 1 , 2 , 3, 4不全相等不全相等颜色对销售量有影响颜色对销售量有影响v如果虚无假设成立,如果虚无假设成立,即即v H0: 1 = 2 = 3 = 4四种颜色饮料销售的均值都相等,没有系统差异四种颜色饮料销售的均值都相等,没有系统差异v如果研究假设成立,即:如果研究假设成立,即:v H1: i (i=1,2,3,4)不全相等不全相等 至少有一个总体的均值是不同的,有系统差异。至少有一

18、个总体的均值是不同的,有系统差异。 单因素方差分析的数据结构单因素方差分析的数据结构 观察对象观察对象( j )因素因素(A) i 水平水平A1 水平水平A2 水平水平Ak12:n x11 x12 x1k x21 x22 x2k : : : : : : : : xn1 xn2 xnk(二)构造检验的统计量(二)构造检验的统计量 为检验为检验H H0 0是否成立,需要计算是否成立,需要计算1 1、各水平的均值、各水平的均值2 2、全部观察值的总均值、全部观察值的总均值3 3、方差、方差4 4、均方、均方( ( MS MS ) ) 1 1、计算各水平的均值、计算各水平的均值 计算 x xi i 公

19、式为: 式中:式中: n ni i为第为第 i i 个总体的样本观察值个数个总体的样本观察值个数 x xijij为第为第 i i 个总体的第个总体的第 j j 个观察值个观察值 2 2、计算全部观察值的总均值、计算全部观察值的总均值计算公式为:计算公式为: 表表8-2 8-2 四种颜色饮料的销售量及均值四种颜色饮料的销售量及均值超市超市( ( j j ) )水平水平A A ( ( i i ) )无色无色( (A A1 1) )粉色粉色( (A A2 2) )橘黄橘黄( (A A3 3) )绿色绿色( (A A4 4) )1 12 23 34 45 526.526.528.728.725.125

20、.129.129.127.227.231.231.228.328.330.830.827.927.929.629.627.927.925.125.128.528.524.224.226.526.530.830.829.629.632.432.431.731.732.832.8合计合计136.6136.6147.8147.8132.2132.2157.3157.3573.9573.9水平均值水平均值观察值个数观察值个数 x x1 1 =27.32=27.32n n1 1=5=5x x2 2=29.56=29.56n n2 2=5=5x x3 3=26.44=26.44n n3 3=5=5x x4

21、 4=31.46=31.46n n4 4=5=5总均值总均值X X = 28.7 = 28.7 3 3(1 1)计算总方差计算总方差 SSTSST全部观察全部观察值值 与总与总平均值平均值 的方差的方差计算公式为:计算公式为: 前例的计算结果:前例的计算结果:3 3(2 2)计算误差项平方和)计算误差项平方和 SSESSE计算组内方差,反映的是随机误差的大小。计算组内方差,反映的是随机误差的大小。计算公式为计算公式为 前例的计算结果:前例的计算结果:SSE SSE = 39.084= 39.0843 3(3 3)计算水平项平方和)计算水平项平方和 SSASSA各组各组平均值平均值 与总平均值与

22、总平均值 的方的方差差。计算公式为:计算公式为: 前例的计算结果:前例的计算结果:SSA = 76.84554 4、计算均方计算均方 MSMS1.1.MSAMSA计算公式为计算公式为: :2.2. MSEMSE计算公式为计算公式为: :(三)计算检验的统计量(三)计算检验的统计量 F F 将将MSAMSA和和MSEMSE进行对比,即得到所需要的检验进行对比,即得到所需要的检验统计量统计量F F计算公式为:计算公式为:F F分布与拒绝域分布与拒绝域如果均值相等,如果均值相等,F F= =MSAMSA/ /MSEMSE1 1 不同自由度不同自由度dfdf1 1和和dfdf2 2的的F F 分布曲线

23、如图分布曲线如图F(8,)F(8,50)F(8,10)F(8,4)F(df1,df2 )统计决策统计决策 将统计量的值将统计量的值F F与给定的显著性水平与给定的显著性水平 的临界的临界值值F F 进行比较,作出接受或拒绝原假设进行比较,作出接受或拒绝原假设H H0 0的决的决策策根据给定的显著性水平根据给定的显著性水平 ,在在F F分布表中查找分布表中查找与第一自由度与第一自由度dfdf1 1k k-1-1、第二自由度、第二自由度dfdf2 2= =n n- -k k 相应的临界值相应的临界值 F 若若FF ,则拒绝原假设则拒绝原假设H H0 0 ,表明均值之间的差异,表明均值之间的差异是显

24、著的,所检验的因素是显著的,所检验的因素( (A A) )对观察值有显著影响对观察值有显著影响若若F F ,则不能拒绝原假设则不能拒绝原假设H H0 0 ,表明所检验的因,表明所检验的因素素( (A A) )对观察值没有显著影响对观察值没有显著影响 单因素方差分析表单因素方差分析表( (基本结构基本结构) )方差来源方差来源平方和平方和SSSS自由度自由度dfdf均方均方MSMSF F 值值组间组间( (因素影响因素影响) ) 组内组内( (误差误差) ) 总和总和SSASSASSESSESSTSSTk k-1-1n n- -k kn n-1-1MSAMSAMSEMSEMSAMSA例题:方差分

25、析(广告城市与销售额)例题:方差分析(广告城市与销售额)v某企业在制定商品广告策略时,对不同广告某企业在制定商品广告策略时,对不同广告形式(报纸、广播、宣传品、体验)的广告形式(报纸、广播、宣传品、体验)的广告效果(销售额)进行了评估。这里,以商品效果(销售额)进行了评估。这里,以商品销售额为观测变量,广告形式为控制变量,销售额为观测变量,广告形式为控制变量,通过单因素方差分析方法就广告形式对销售通过单因素方差分析方法就广告形式对销售额的影响进行分析。额的影响进行分析。v单因素方差分析的零假设分别为:单因素方差分析的零假设分别为:v不同广告形式没有对销售额产生显著影响。不同广告形式没有对销售额

26、产生显著影响。从该表可以看到,销售额的离差平方总和为从该表可以看到,销售额的离差平方总和为26169.30626169.306,如果仅考虑广告形式单个因素的影响,则销售额总变差如果仅考虑广告形式单个因素的影响,则销售额总变差中,不同广告形式可解释的变差为中,不同广告形式可解释的变差为5866.0835866.083,抽样误差,抽样误差引起的变差为引起的变差为20303.22220303.222,它们均方差分别为,它们均方差分别为1955.3611955.361和和145.023145.023,相除所得的,相除所得的F F统计量统计量的观测值为的观测值为13.48313.483,对,对应的概率应

27、的概率P P值近似为值近似为0.0.如果显著度水平为如果显著度水平为0.050.05,由于概,由于概率值率值P P小于小于0.050.05,应拒绝零假设,认为不同广告形式对,应拒绝零假设,认为不同广告形式对销售产生了显著影响,它对销售额的影响效应不全为销售产生了显著影响,它对销售额的影响效应不全为0.0.单因素方差分析单因素方差分析的进一步分析:的进一步分析:方差齐性检验方差齐性检验与与多重比较检验多重比较检验(一)方差齐性检验(一)方差齐性检验v前面提到,控制变量不同水平下观测变量总前面提到,控制变量不同水平下观测变量总体方差无显著差异是方差分析的前提要求。体方差无显著差异是方差分析的前提要

28、求。方差齐性检验是对控制变量不同水平下各观方差齐性检验是对控制变量不同水平下各观测变量总体方差是否相等进行检验。测变量总体方差是否相等进行检验。vSPSSSPSS单因素方差分析中,方差齐性检验采用单因素方差分析中,方差齐性检验采用方差同质性(方差同质性(Homogeneity of VarianceHomogeneity of Variance)检)检验方法。其零假设是各水平下观测变量的总验方法。其零假设是各水平下观测变量的总体方差无显著性差异,实现思路如同体方差无显著性差异,实现思路如同SPSSSPSS两两独立样本独立样本t t检验中的方差分析。检验中的方差分析。vOptionOption选

29、项选项用来对方差分析的前提条件进用来对方差分析的前提条件进行检验,并可输出其他相关统计量和对缺失行检验,并可输出其他相关统计量和对缺失值数据进行处理。值数据进行处理。vHomogeneity of variance testHomogeneity of variance test选项实现方选项实现方差齐性检验;差齐性检验;vDescriptiveDescriptive选项输出观测变量的基本描述统选项输出观测变量的基本描述统计量;计量;vMean Plot Mean Plot 选项输出各水平下观测变量均值选项输出各水平下观测变量均值的折线图;的折线图;vMissing ValueMissing

30、Value框中提供了两种缺失数据的处框中提供了两种缺失数据的处理方式。理方式。该表表明,不同广告形式下销售额的方差齐该表表明,不同广告形式下销售额的方差齐性检验值为性检验值为0.7650.765,概率,概率P P值为值为0.515.0.515.如果显如果显著性水平为著性水平为0.050.05,由于概率,由于概率P P值大于值大于0.050.05,不应拒绝零假设,认为不同广告形式下的销不应拒绝零假设,认为不同广告形式下的销售额的总体方差无显著差异,满足方差分析售额的总体方差无显著差异,满足方差分析的前提要求。的前提要求。(二)多重比较(二)多重比较检验检验方差分析中的多重比较方差分析中的多重比较

31、单因素方差分析的基本分析只能判断控制变量单因素方差分析的基本分析只能判断控制变量是否对观测变量产生了显著影响。如果控制是否对观测变量产生了显著影响。如果控制变量确实对观测变量产生了显著影响,进一变量确实对观测变量产生了显著影响,进一步还应确定,控制变量的不同水平对观测变步还应确定,控制变量的不同水平对观测变量的影响程度如何。其中哪个水平的作用明量的影响程度如何。其中哪个水平的作用明显不同于其他水平,哪个水平的作用是不显显不同于其他水平,哪个水平的作用是不显著的等。著的等。这个问题可用两独立样本这个问题可用两独立样本t t检验来解决,但两两检验来解决,但两两逐对检验需进行很多次,最终才能得到分析

32、逐对检验需进行很多次,最终才能得到分析结论。这样不可避免会累积误差。结论。这样不可避免会累积误差。多重检验利用全部观测变量值,在避免误差累多重检验利用全部观测变量值,在避免误差累积的前提下,非常巧妙地实现对各个水平下积的前提下,非常巧妙地实现对各个水平下的观察变量总体均值的逐对比较。的观察变量总体均值的逐对比较。多重比较检验问题也是假设检验问题,遵循假多重比较检验问题也是假设检验问题,遵循假设检验的基本步骤。设检验的基本步骤。多重比较检验的零假设多重比较检验的零假设H H0 0是,相应水平下观测是,相应水平下观测变量的均值间不存在显著差异。变量的均值间不存在显著差异。SPSSSPSS提供多种多

33、重比较检验方法,分别适用于提供多种多重比较检验方法,分别适用于一些特殊的条件。一些特殊的条件。vPost HocPost Hoc选项选项用来实现多重比较检验。其中用来实现多重比较检验。其中Equal Variance AssumedEqual Variance Assumed框中的方法适用于各框中的方法适用于各水平方差齐性的情况;水平方差齐性的情况; Equal Variance not Assumed Equal Variance not Assumed框中的方法适用框中的方法适用于各水平方差不齐的情况;于各水平方差不齐的情况; 多重比较中,多重比较中,SPSSSPSS默认的显著性水平为默认

34、的显著性水平为0.050.05,可以根据实际情况修改可以根据实际情况修改significant level significant level 后后面的数值进行调整。面的数值进行调整。LSDLSD方法(最小显著差异法)方法(最小显著差异法):检验敏感性高,:检验敏感性高,水平间的均值只要存在细微差异就可能被检水平间的均值只要存在细微差异就可能被检验出来。适用于各总体方差相等的情况,但验出来。适用于各总体方差相等的情况,但没对犯第一类错误的概率问题进行有效控制。没对犯第一类错误的概率问题进行有效控制。BonferroniBonferroni方法:方法:与与LSDLSD方法基本相同,不同方法基本相

35、同,不同点在于对犯第一类错误的概率问题进行有效点在于对犯第一类错误的概率问题进行有效控制。控制。vTukeyTukey方法:方法:与与LSDLSD方法使用方法使用t t统计量不同,统计量不同, TukeyTukey方法使用方法使用q q统计量统计量. Tukey. Tukey方法仅适用于方法仅适用于各水平下观测值个数相等的条件,该方法对犯各水平下观测值个数相等的条件,该方法对犯第一类错误的概率也给予了较为有效的处理。第一类错误的概率也给予了较为有效的处理。vS-N-KS-N-K方法:方法:是一种有效划分相似性子集的方是一种有效划分相似性子集的方法。该方法适用于各水平观测值个数相等的情法。该方法

36、适用于各水平观测值个数相等的情况。况。该表表明,以该表表明,以0.050.05为显著度水平,在为显著度水平,在LSDLSD方法方法中,报纸广告和广播广告的效果没有显著差异中,报纸广告和广播广告的效果没有显著差异(概率(概率P P值为值为0.4120.412),与宣传品和体验均有显),与宣传品和体验均有显著差异(概率值分别为著差异(概率值分别为0.000.00和和0.0210.021)。广播)。广播与宣传品有显著差异(概率与宣传品有显著差异(概率P P值为值为0.000.00);广);广播与体验没有显著差异(概率播与体验没有显著差异(概率P P值为值为0.1340.134)。)。宣传品与体验有显

37、著差异(概率宣传品与体验有显著差异(概率P P值为值为0.0010.001)S-N-KS-N-K法划分相似子集法划分相似子集v均值为均值为56.555656.5556的组(宣传品组)与其他三组的组(宣传品组)与其他三组的均值有显著不同(其相似的可能性小于的均值有显著不同(其相似的可能性小于0.050.05显著度水平),被划分出来,形成两个显著度水平),被划分出来,形成两个相似性子集。相似性子集。v总之,如果从获得高销售额的角度选择广告总之,如果从获得高销售额的角度选择广告形式,不应采用宣传品的形式,可考虑在报形式,不应采用宣传品的形式,可考虑在报纸、广播和体验中选择一种低成本或操作性纸、广播和

38、体验中选择一种低成本或操作性强的广告。强的广告。多因素方差分析多因素方差分析 多因素方差分析多因素方差分析一一. . 双因素方差分析的基本问题双因素方差分析的基本问题二二. . 双因素方差分析的数据结构双因素方差分析的数据结构三、双因素方差分析的步骤三、双因素方差分析的步骤四、一个应用实例四、一个应用实例多因素方差分析多因素方差分析v两个以上控制变量对观测变量是否产生显著影响;两个以上控制变量对观测变量是否产生显著影响;v不仅能够分析多个因素对观测变量的独立影响,更能够不仅能够分析多个因素对观测变量的独立影响,更能够分析多个控制因素的交互作用能否对观测变量的分布产分析多个控制因素的交互作用能否

39、对观测变量的分布产生显著影响,进而最终找到利于观测变量的最优组合。生显著影响,进而最终找到利于观测变量的最优组合。v两个控制变量的饱和模型两个控制变量的饱和模型vSST=SSA+SSB+SSAB+SSESST=SSA+SSB+SSAB+SSEv三个控制变量的饱和模型三个控制变量的饱和模型vSST=SSA+SSB+SSC+SSAB+SSAC+SSBC+SSABC+SSESST=SSA+SSB+SSC+SSAB+SSAC+SSBC+SSABC+SSE双因素方差分析双因素方差分析v双因素方差分析的数学模型双因素方差分析的数学模型v设控制变量设控制变量A A有有m m个水平,个水平,B B有有n n个

40、水平,每个水平,每个交叉水平下均有个交叉水平下均有L L个样本(个样本(L L次试验)。次试验)。那么,在控制变量那么,在控制变量A A的水平的水平AiAi和控制变量和控制变量B B的水平的水平BjBj下的下的k k个样本值个样本值 可以定义为:可以定义为:双因素方差分析双因素方差分析1.1.分析两个因素分析两个因素( (因素因素A A和因素和因素B B) )对试验结果的影对试验结果的影响响 2.2.分别对两个因素进行检验,分析是一个因素在分别对两个因素进行检验,分析是一个因素在起作用,还是两个因素都起作用,还是两个因素起作用,还是两个因素都起作用,还是两个因素都不起作用都不起作用3.3.如果

41、如果A A和和B B对试验结果的影响是相互独立的,分对试验结果的影响是相互独立的,分别判断因素别判断因素A A和因素和因素B B对试验指标的影响,这时的对试验指标的影响,这时的双因素方差分析称为无交互作用的双因素方差分双因素方差分析称为无交互作用的双因素方差分析析4 4、如果除了、如果除了A A和和B B对试验结果的单独影响外,对试验结果的单独影响外,因素因素A A和因素和因素B B的搭配还会对销售量产生一种新的搭配还会对销售量产生一种新的影响,这时的双因素方差分析称为有交互作的影响,这时的双因素方差分析称为有交互作用的双因素方差分析用的双因素方差分析 5 5、对于无交互作用的双因素方差分析,

42、其结、对于无交互作用的双因素方差分析,其结果与对每个因素分别进行单因素方差分析的结果与对每个因素分别进行单因素方差分析的结果相同果相同双因素方差分析的基本假定双因素方差分析的基本假定1.1.每个总体都服从正态分布每个总体都服从正态分布2.2.各个总体的方差必须相同各个总体的方差必须相同3.3.观察值是独立的观察值是独立的任意一个观察对象的数据结构任意一个观察对象的数据结构 因素因素A(i) 因素因素(B) j 平均值平均值 B1 B2 BnA1A2:Am x11 x12 x1n x21 x22 x2n : : : : : : : : xm1 xm2 xmn : :平均值平均值 双因素方差分析的

43、数据结构双因素方差分析的数据结构 是因素是因素A A的第的第i i个水平下各观察值的平均值个水平下各观察值的平均值是因素是因素B B的第的第j j个水平下的各观察值的均值个水平下的各观察值的均值是全部是全部 krkr 个样本数据的总平均值个样本数据的总平均值v其中其中L Lijij为因素为因素A A第第i i个水平和因素个水平和因素B B第第j j个水平个水平下样本观察对象的个数。下样本观察对象的个数。 SSAB=SST-SSA-SSB-SSESSAB=SST-SSA-SSB-SSE计算均方计算均方 MSMS1.1.各方差的大小与观察值的多少有关,为消除观察值各方差的大小与观察值的多少有关,为

44、消除观察值多少对方差大小的影响,需要将其平均,这就是多少对方差大小的影响,需要将其平均,这就是均均方方,也称为均方差,也称为均方差2.2.计算方法是用方差除以相应的自由度计算方法是用方差除以相应的自由度3.3.三个平方和的自由度分别是三个平方和的自由度分别是SSTSST的自由度为的自由度为 mnmn-1-1SSASSA的自由度为的自由度为 m m-1-1SSBSSB的自由度为的自由度为 n n-1-1SSABSSAB的自由度为的自由度为 ( (m m-1)(-1)(n n-1)-1)SSESSE的自由度为的自由度为mn(L-1)mn(L-1) 构造检验的统计量构造检验的统计量( (计算均方计算

45、均方 MSMS) )1.1.因素因素A A的均方差的均方差: :2.2.因素因素B B的均方差:的均方差:3.3.随机误差项的均方差:随机误差项的均方差:4 4、交互项的均方差:、交互项的均方差:多因素方差分析的基本步骤多因素方差分析的基本步骤v1 1,成立零假设,成立零假设va a1 1= =a a2 2=a am m=0; =0; vb b1 1= =b b2 2=b bn n=0=0v( (abab) )1111=(=(abab) )1212=(=(abab) )mnmn=0=0多因素方差分析的基本步骤多因素方差分析的基本步骤v2,2,选择检验统计量选择检验统计量多因素方差分析的基本步骤

46、多因素方差分析的基本步骤v3,3,计算检验统计量观测值和概率计算检验统计量观测值和概率p p值值v4 4,给出显著度水平,给出显著度水平,并作出决策并作出决策例题例题某企业对不同广告形式在不同地区的广告效果(某企业对不同广告形式在不同地区的广告效果(销售额)及进行评估,通过多因素方差分析对销售额)及进行评估,通过多因素方差分析对广告形式、地区、广告形式和地区的交互作用广告形式、地区、广告形式和地区的交互作用给销售额的影响进行分析,进而为制定广告和给销售额的影响进行分析,进而为制定广告和地区的最优组合方案提供依据。地区的最优组合方案提供依据。这里,以广告形式和地区为控制变量,销售额为这里,以广告

47、形式和地区为控制变量,销售额为观测变量,建立固定效应的饱和模型。零假设观测变量,建立固定效应的饱和模型。零假设为,不同广告形式没有对销售额产生显著影响为,不同广告形式没有对销售额产生显著影响;不同地区的销售额没有显著影响;广告形式;不同地区的销售额没有显著影响;广告形式和地区对销售额没有产生显著的交互影响。和地区对销售额没有产生显著的交互影响。v由该由该“广告形式广告形式- -地区地区”交互分类表可知交互分类表可知L=2L=2(L L为某一广告形式与地区交叉点上的个案的数量)为某一广告形式与地区交叉点上的个案的数量)表中第一列是对观测变量总方差分解的说明;表中第一列是对观测变量总方差分解的说明

48、;第二列是观测变量方差分解的结果;第三列是第二列是观测变量方差分解的结果;第三列是自由度;第四列是均方;第五列是自由度;第四列是均方;第五列是F F检验统计量检验统计量的观测值;第六列是检验统计量的概率的观测值;第六列是检验统计量的概率P P值。值。可以看到变量的总变差(可以看到变量的总变差(Corrected TotalCorrected Total)SSTSST为为26169.306.26169.306.它被分解为四个部分,分别它被分解为四个部分,分别是:由广告形式(是:由广告形式(X1X1)不同引起的变差()不同引起的变差(5866.0835866.083),由地区(),由地区(X2X2

49、)差异引起的变差)差异引起的变差(9265.3069265.306),由广告形式和地区交互作用),由广告形式和地区交互作用(X1X1* *X2X2)引起的变差()引起的变差(4962.9174962.917),由随机),由随机因素引起的变差(因素引起的变差(Error 6075.000Error 6075.000). .这些变这些变差除以各自的自由度后,得到各自的均方,差除以各自的自由度后,得到各自的均方,并可计算出各并可计算出各F F检验统计量的观测值和在一定检验统计量的观测值和在一定自由度下的概率自由度下的概率P P值。值。v表中表中Corrected ModelCorrected Mod

50、el对应的变差(对应的变差(20094.36020094.360)是)是X1X1、X2X2、X1X1* *X2X2对应变差相加的结果,是线对应变差相加的结果,是线性模型整体对观测变量变差解释的部分,其对性模型整体对观测变量变差解释的部分,其对应的应的F F检验统计量和概率检验统计量和概率P P值说明,观测变量变值说明,观测变量变动主要是由控制变量总体的不同水平引起的,动主要是由控制变量总体的不同水平引起的,控制变量能够较好地反映观测变量的变动,模控制变量能够较好地反映观测变量的变动,模型对观测变量有一定的解释能力;型对观测变量有一定的解释能力;InterceptIntercept对对应的总变差

51、(应的总变差(642936.694642936.694)是观测变量与)是观测变量与0 0的总的总离差平方和与离差平方和与SSTSST的差。它与的差。它与SSTSST的和是的和是TotalTotal对对应的总变差(应的总变差(642936.694+26169.306=669106.00642936.694+26169.306=669106.00)。在实际分析中不必引用。在实际分析中不必引用。v表中的表中的R R2 2 (R square:0.768R square:0.768)和调整后的)和调整后的R R2 2 (Adjusted R square:0.539 Adjusted R square

52、:0.539 )反映的是多)反映的是多因素方差模型对观测变量数据的总体拟合程因素方差模型对观测变量数据的总体拟合程度,它们越接近于度,它们越接近于1 1说明对数据的拟合程度越说明对数据的拟合程度越高。高。第三节第三节 协方差分析协方差分析v在方差分析中,控制变量的各个水平都可以在方差分析中,控制变量的各个水平都可以人为控制,但在实际问题中,有些控制因素人为控制,但在实际问题中,有些控制因素很难人为控制,但它们的不同水平确实对观很难人为控制,但它们的不同水平确实对观察变量产生较为显著的影响。在方差分析中,察变量产生较为显著的影响。在方差分析中,如果忽略这些因素的存在而单纯分析其他因如果忽略这些因素的存在而单纯分析其他因素对观测变量的影响,往往会夸大或缩小其素对观测变量的影响,往往会夸大或缩小其他因素的影响作用,使分析结论不准确。他因素的影响作用,使分析结论不准确。v如:如: 研究农作物产量:化肥、品种研究农作物产量:化肥、品

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论