第6章SPSS方差分析_第1页
第6章SPSS方差分析_第2页
第6章SPSS方差分析_第3页
第6章SPSS方差分析_第4页
第6章SPSS方差分析_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.第六章第六章SPSS方差分析方差分析复习:均值比较复习:均值比较统计分析常常采取抽样研究的方法,即从总体中随机抽取一定数量的样统计分析常常采取抽样研究的方法,即从总体中随机抽取一定数量的样本进行研究来推断总体的特性。本进行研究来推断总体的特性。 (1)抽样方面:由于总体中的每个个体间均存在差异,即使严格遵)抽样方面:由于总体中的每个个体间均存在差异,即使严格遵守随机抽样原则也会由于多抽到一些数值较大或较小的个体致使样本统守随机抽样原则也会由于多抽到一些数值较大或较小的个体致使样本统计量与总体参数之间有所不同。计量与总体参数之间有所不同。 (2)测量方面:)测量方面: 实验者测量技术的差别或测

2、量仪器精确程度的差别实验者测量技术的差别或测量仪器精确程度的差别等等也会造成一定的偏差,使样本统计量与总体参数之间存在差异。等等也会造成一定的偏差,使样本统计量与总体参数之间存在差异。 由此,均值不相等的两组样本不一定来自均值不同的总体。由此,均值不相等的两组样本不一定来自均值不同的总体。n能否用样本均值估计总体均值?能否用样本均值估计总体均值?n两个均值接近的样本是否来自均值相同的总体?两个均值接近的样本是否来自均值相同的总体?n两组样本某变量均值不同,其差异是否具有统计意义?两组样本某变量均值不同,其差异是否具有统计意义?n能否说明总体具有显著性差异?能否说明总体具有显著性差异? 这就要进

3、行均值比较。这就要进行均值比较。方差分析袁隆平袁隆平的超级稻的超级稻(好的品种、好的种植栽培方法和优质耕地)(好的品种、好的种植栽培方法和优质耕地)艾滋病的艾滋病的鸡尾酒疗法鸡尾酒疗法(通过三种或三种以上的抗病毒药物联合(通过三种或三种以上的抗病毒药物联合使用来治疗艾滋病)使用来治疗艾滋病)引起胃及十二指肠溃疡与胃癌的幽门螺旋杆菌的治疗方法(引起胃及十二指肠溃疡与胃癌的幽门螺旋杆菌的治疗方法(三三联,四联疗法)联,四联疗法)肯德基肯德基45天速成鸡天速成鸡(一只鸡从雏鸡到出栏,大约需(一只鸡从雏鸡到出栏,大约需 要要10斤饲斤饲料,饲料又分料,饲料又分1期、期、2期和期和3期)期).本章内容6

4、.1 方差分析概述方差分析概述6.2 单因素方差分析单因素方差分析6.3 多因素方差分析多因素方差分析6.4 协方差分析协方差分析6.1方差分析概述6.1.16.1.1方差分析的作用方差分析的作用 在诸多领域的数量分析研究中,找到在诸多领域的数量分析研究中,找到众多影响因素众多影响因素中重要的中重要的影响因素影响因素是非常重要的。比如:在农业生产中,我们总是希望在尽量少的投入成本是非常重要的。比如:在农业生产中,我们总是希望在尽量少的投入成本下得到较高的农作物产量。这就需要首先分析农作物的产量究竟受到哪些下得到较高的农作物产量。这就需要首先分析农作物的产量究竟受到哪些因素的影响。有许多因素会影

5、响农作物的产量,如因素的影响。有许多因素会影响农作物的产量,如种子的品种、施肥量、种子的品种、施肥量、气候、地域气候、地域等,他们都会给农作物的产量带来或多或少的影响。如果我们等,他们都会给农作物的产量带来或多或少的影响。如果我们能够掌握在众多的影响因素中,能够掌握在众多的影响因素中,哪些因素哪些因素对农作物的产量起到了主要的、对农作物的产量起到了主要的、关键性的作用,我们就可以根据实际情况对这些关键性的作用,我们就可以根据实际情况对这些关键因素关键因素加以控制。加以控制。 进一步,在掌握关键影响因素,如品种、施肥量因素等之后,我们还进一步,在掌握关键影响因素,如品种、施肥量因素等之后,我们还

6、要对不同的品种、不同的施肥量条件下的产量进行对比分析,研究究竟哪要对不同的品种、不同的施肥量条件下的产量进行对比分析,研究究竟哪个品种的产量高,施肥量究竟多少最合适,哪种品种与哪种施肥量搭配最个品种的产量高,施肥量究竟多少最合适,哪种品种与哪种施肥量搭配最优,等等。在这些分析研究的基础上,我们就可以计算出各个组合方案的优,等等。在这些分析研究的基础上,我们就可以计算出各个组合方案的成本和收益,并选择成本和收益,并选择最合理的种植方案最合理的种植方案,主动的在农作物种植过程中对各,主动的在农作物种植过程中对各种影响因素加以准确控制,进而获得最理想的效果。种影响因素加以准确控制,进而获得最理想的效

7、果。6.1.2相关概念相关概念1 1、影响因素的分类影响因素的分类:在所有的影响因素中根据是否可以人为控制划分为:在所有的影响因素中根据是否可以人为控制划分为两类,一类是人为可以控制的因素,称为两类,一类是人为可以控制的因素,称为控制因素或控制变量控制因素或控制变量,如种子品,如种子品种的选定,施肥量的多少;另一类因素是认为很难控制的因素,称为种的选定,施肥量的多少;另一类因素是认为很难控制的因素,称为随机随机因素或随机变量因素或随机变量,如气候和地域等影响因素。在很多情况下随机因素指的,如气候和地域等影响因素。在很多情况下随机因素指的是实验过程中的抽样误差。是实验过程中的抽样误差。2 2、控

8、制变量的不同水平控制变量的不同水平:控制变量的不同取值或水平。如甲品种、乙品:控制变量的不同取值或水平。如甲品种、乙品种;种;1010公斤化肥、公斤化肥、2020公斤化肥、公斤化肥、3030公斤化肥等。公斤化肥等。3 3、观测变量观测变量:受控制变量和随机变量影响的变量称为:受控制变量和随机变量影响的变量称为观测变量观测变量,如农作,如农作物的产量等。物的产量等。方差分析就是从观测变量的方差入手,研究诸多控制变量中哪些变量是方差分析就是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量以及对观测变量有显著影响的各个控制变量对观测变量有显著影响的变量以及对观测变量有显著

9、影响的各个控制变量其不同水平以及各水平的交互搭配是如何影响观测变量的一种分析方法。其不同水平以及各水平的交互搭配是如何影响观测变量的一种分析方法。 方差分析认为方差分析认为,如果,如果控制变量控制变量的不同水平对的不同水平对观测变量观测变量产生了显著影响产生了显著影响,那么它和,那么它和随机变量随机变量共同作用必然使得共同作用必然使得观测变量观测变量值显著变动;反之,如值显著变动;反之,如果果控制变量控制变量的不同水平没有对的不同水平没有对观测变量观测变量产生显著影响,那么产生显著影响,那么观测变量观测变量值值的变动就不明显,其变动可以归结为的变动就不明显,其变动可以归结为随机变量随机变量影响

10、造成的。影响造成的。 建立在观测变量建立在观测变量各总体服从各总体服从正态分布和同方差正态分布和同方差的假设之上,方差的假设之上,方差分析的问题就转化为在分析的问题就转化为在控制变量控制变量不同水平上的不同水平上的观测变量观测变量均值是否存在显均值是否存在显著差异的推断问题了。著差异的推断问题了。 综上所述综上所述,方差分析从对,方差分析从对观测变量观测变量的方差分解入手,通过推断的方差分解入手,通过推断控控制变量制变量各水平下各各水平下各观测变量观测变量的均值是否存在显著差异,分析的均值是否存在显著差异,分析控制变量控制变量是是否给否给观测变量观测变量带来了显著影响,进而再对带来了显著影响,

11、进而再对控制变量控制变量各个水平对各个水平对观测变量观测变量影响的程度进行剖析。影响的程度进行剖析。 根据控制变量根据控制变量的个数可将方差分析分为的个数可将方差分析分为单因素方差分析单因素方差分析、多因素多因素方差分析方差分析;根据;根据观测变量观测变量的个数可将方差分析分为的个数可将方差分析分为一元方差分析一元方差分析(单因(单因变量方差分析)和变量方差分析)和多元方差分析多元方差分析(多因变量方差分析)。(多因变量方差分析)。6.1.3方差分析的原理方差分析的原理6.2 单因素方差分析单因素方差分析6.2.16.2.1单因素方差分析的基本思想单因素方差分析的基本思想 1 1、定义:单因素

12、方差分析用来研究一个控制变量的不同水平是否对观测、定义:单因素方差分析用来研究一个控制变量的不同水平是否对观测变量产生了变量产生了显著影响显著影响。例如:分析不同施肥量是否给农作物的产量产生显。例如:分析不同施肥量是否给农作物的产量产生显著影响;研究不同学历是否对工资收入产生显著影响等。著影响;研究不同学历是否对工资收入产生显著影响等。2 2、观测变量方差的分解、观测变量方差的分解 将观测变量将观测变量总的离差平方和总的离差平方和分解为分解为组间离差平方和组间离差平方和和和组内离差平方和组内离差平方和两部分,分别表示为:两部分,分别表示为: 其中,其中,SSTSST为为观测变量的总离差平方和观

13、测变量的总离差平方和;SSASSA为为组间离差平方和组间离差平方和,是由,是由控制变量不同水平造成的控制变量不同水平造成的观测变量观测变量的变差;的变差;SSESSE为为组内离差平方和组内离差平方和,是由,是由抽样误差引起的抽样误差引起的观测变量观测变量的变差。的变差。SSESSASST其中:其中:kinjijixxSST112)(kikiiinjixxnxxSSAi11212)()(kinjiijixxSSE112)(各离差平方和的计算公式各离差平方和的计算公式各离差平方和的计算各离差平方和的计算-例题例题职称11122223基本工资101410441014984859989889866职称

14、33333444基本工资8488279388878878248248241024.00930.25875.50824.00907.38基本工资Mean高级工程师Mean工程师Mean助理工程师Mean无技术职称职称MeanTotal在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则说在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由于控制变量引起的,可以主要由控制变量来明观测变量的变动主要是由于控制变量引起的,可以主要由控制变量来解释,即控制变量给观测变量带来了显著影响。解释,即控制变量给观测变量带来了显著影响。这里我们用这里我们用F F统计量来表

15、示这种比例关系,如果控制变量的不同水平对观统计量来表示这种比例关系,如果控制变量的不同水平对观测变量造成了显著影响,那么观测变量总变差中控制变量所占的比例较测变量造成了显著影响,那么观测变量总变差中控制变量所占的比例较大,则大,则F F值就比较大;反之,如果控制变量的不同水平对观测变量没有造值就比较大;反之,如果控制变量的不同水平对观测变量没有造成显著影响,那么观测变量总变差中控制变量所占的比例较小,则成显著影响,那么观测变量总变差中控制变量所占的比例较小,则F F值就值就比较小。比较小。 SST=SSA+SSE), 1()/() 1/(knkFMSEMSAknSSEkSSAF3、比较观测变量

16、总离差平方和各部分的比例、比较观测变量总离差平方和各部分的比例l提出原假设:控制变量不同水平下观测变量各总体的均提出原假设:控制变量不同水平下观测变量各总体的均值无显著差异值无显著差异l计算检验统计量和概率计算检验统计量和概率P P值值 l给定显著性水平与给定显著性水平与p p值做比较:如果值做比较:如果p p值小于显著性水平值小于显著性水平,则应该拒绝原假设,反之就不能拒绝原假设。,则应该拒绝原假设,反之就不能拒绝原假设。 MSEMSAknSSEkSSAF)/() 1/(6.2.2 单因素方差分析的基本步骤单因素方差分析的基本步骤 在利用在利用SPSS进行单因素方差分析时,应注意数据的进行单

17、因素方差分析时,应注意数据的组织形式。组织形式。SPSS要求定义两个变量分别存放观测变量值和要求定义两个变量分别存放观测变量值和控制变量的水平值。基本操作步骤如下:控制变量的水平值。基本操作步骤如下:1、选择菜单、选择菜单AnalyzeCompare meansOne-Way ANOVA,出现窗口,出现窗口6.2.3 单因素方差分析的基本操作步骤单因素方差分析的基本操作步骤2、将观测变量选择到、将观测变量选择到Dependent List框。框。3、将控制变量选择到、将控制变量选择到Factor框。控制变量有几个不框。控制变量有几个不同的取值表示控制变量有几个水平。同的取值表示控制变量有几个水

18、平。 至此,至此,SPSS便自动分解观测变量的方差,计便自动分解观测变量的方差,计算组间方差、组内方差、算组间方差、组内方差、F统计量以及对应的概率统计量以及对应的概率p值,完成单因素方差分析的相关计算,并将结果值,完成单因素方差分析的相关计算,并将结果显示到输出窗口中。显示到输出窗口中。 某企业在制订某商品的广告策略时,对不同广某企业在制订某商品的广告策略时,对不同广告形式在不同地区的广告效果(销售额)进行了告形式在不同地区的广告效果(销售额)进行了评估。这里以商品销售额为观测变量,广告形式评估。这里以商品销售额为观测变量,广告形式和地区为控制变量,通过单因素方差分析方法分和地区为控制变量,

19、通过单因素方差分析方法分别对广告形式、地区对销售额的影响进行方差分别对广告形式、地区对销售额的影响进行方差分析。析。6.2.4 单因素方差分析的应用举例单因素方差分析的应用举例 1、方差齐性检验、方差齐性检验 由于方差分析的前提是各水平下的总体服从正态分布并由于方差分析的前提是各水平下的总体服从正态分布并且方差相等,因此有必要对方差齐性进行检验,即对控制变且方差相等,因此有必要对方差齐性进行检验,即对控制变量不同水平下各观测变量不同总体方差是否相等进行分析。量不同水平下各观测变量不同总体方差是否相等进行分析。 SPSS单因素方差分析中,方差齐性检验采用了方差同单因素方差分析中,方差齐性检验采用

20、了方差同质性(质性(Homogeneity of Variance)的检验方法,其零)的检验方法,其零假设是各水平下观测变量总体方差无显著性差异,实现思路假设是各水平下观测变量总体方差无显著性差异,实现思路同同SPSS两独立样本两独立样本t检验中的方差齐性检验。检验中的方差齐性检验。 6.2.5 单因素方差分析的进一步分析单因素方差分析的进一步分析 上面的基本分析可以判断控制变量是否对观测变量产生了上面的基本分析可以判断控制变量是否对观测变量产生了显著影响。如果控制变量确实对观测变量产生了显著影响,显著影响。如果控制变量确实对观测变量产生了显著影响,进一步还应确定,控制变量的不同水平对观测变量

21、的影响程进一步还应确定,控制变量的不同水平对观测变量的影响程度如何,其中哪个水平的作用明显大于其它水平,哪些水平度如何,其中哪个水平的作用明显大于其它水平,哪些水平的作用是不显著的。例如已经确定不同施肥量会对农作物的的作用是不显著的。例如已经确定不同施肥量会对农作物的产量产生显著影响,便希望进一步了解究竟是产量产生显著影响,便希望进一步了解究竟是10公斤、公斤、20公斤还是公斤还是30公斤施肥量最有利于提高产量,哪种施肥量对农公斤施肥量最有利于提高产量,哪种施肥量对农作物产量没有显著影响。掌握了这些信息,我们就能够制定作物产量没有显著影响。掌握了这些信息,我们就能够制定合理的施肥方案。合理的施

22、肥方案。 多重比较检验就是分别对每个水平下的观测变量均值进多重比较检验就是分别对每个水平下的观测变量均值进行逐对比较,判断两均值之间是否存在显著差异。其零假设行逐对比较,判断两均值之间是否存在显著差异。其零假设是相应组的均值之间无显著差异。是相应组的均值之间无显著差异。 2、多重比较检验、多重比较检验 SPSS提供的多重比较检验的方法比较多,有些方法适提供的多重比较检验的方法比较多,有些方法适用在各总体方差相等的条件下,有些适用在方差不相等的条用在各总体方差相等的条件下,有些适用在方差不相等的条件下。件下。 其中其中LSD方法适用于各总体方差相等的情况,特点是比方法适用于各总体方差相等的情况,

23、特点是比较灵敏;较灵敏;Tukey方法和方法和S-N-K方法适用于各水平下观测变方法适用于各水平下观测变量个数相等的情况;量个数相等的情况;Scheffe方法比方法比Tukey方法不灵敏。方法不灵敏。(1)先验对比检验)先验对比检验 如果发现某些水平与另一些水平的均值差距显著,就可如果发现某些水平与另一些水平的均值差距显著,就可以进一步比较这两组总的均值是否存在显著差异。在检验中以进一步比较这两组总的均值是否存在显著差异。在检验中,SPSS根据用户确定的各均值的系数,再对其线性组合进根据用户确定的各均值的系数,再对其线性组合进行检验,来判断各相似性子集间均值的差异程度。行检验,来判断各相似性子

24、集间均值的差异程度。(2)趋势检验)趋势检验 当控制变量为定序变量时,趋势检验能够分析随着控制当控制变量为定序变量时,趋势检验能够分析随着控制变量水平的变化,观测变量值变化的总体趋势是怎样的。变量水平的变化,观测变量值变化的总体趋势是怎样的。 3、其他检验、其他检验(1)Option选项选项 Option选项用来对方差分析的前提条件进行检验选项用来对方差分析的前提条件进行检验,并可输出其他相关统计量和对缺失数据进行处理。,并可输出其他相关统计量和对缺失数据进行处理。 Homogeneity of variance test选项实现方差齐选项实现方差齐性检验;性检验;Descriptive选项输

25、出观测变量的基本描述统选项输出观测变量的基本描述统计量;计量;Brown-Forsythe、Welch选项可计算其统计量选项可计算其统计量以检验各组均值的相等性,当方差齐性不成立时应选择以检验各组均值的相等性,当方差齐性不成立时应选择使用这两个统计量而不是使用这两个统计量而不是F统计量统计量。Means Plot选项输选项输出各水平下观测变量均值的折线图;出各水平下观测变量均值的折线图;Missing Values框中提供了两种缺失数据的处理方式。框中提供了两种缺失数据的处理方式。4、单因素方差分析进一步分析的操作、单因素方差分析进一步分析的操作 Post Hoc选项用来实现多重比较检验。选项

26、用来实现多重比较检验。 提供了提供了18种多重比较检验的方法。其中种多重比较检验的方法。其中Equal Variances Assumed框中的方法适用于各水平方差齐性框中的方法适用于各水平方差齐性的情况。在方差分析中,由于其前提所限,应用中多采用的情况。在方差分析中,由于其前提所限,应用中多采用Equal Variances Assumed框中的方法。多重比较检验框中的方法。多重比较检验中,中,SPSS默认的显著性水平为默认的显著性水平为0.05,可以根据实际情况,可以根据实际情况修改修改Significance level后面的数值以进行调整。后面的数值以进行调整。(2)Post Hoc选

27、项选项 Contrasts选项用来实现先验对比检验和趋势检验。选项用来实现先验对比检验和趋势检验。 如果进行趋势检验,则应选择如果进行趋势检验,则应选择Polynomial选项,然后选项,然后在后面的下拉框中选择趋势检验的方法。其中在后面的下拉框中选择趋势检验的方法。其中Linear表示线表示线性趋势检验;性趋势检验;Quadratic表示进行二次多项式检验;表示进行二次多项式检验;Cubic表示进行三次多项式检验,表示进行三次多项式检验,4th和和5th表示进行四次和五次多表示进行四次和五次多项式检验。项式检验。 如果进行先验对比检验,则应在如果进行先验对比检验,则应在Coefficient

28、s后依次输后依次输入系数入系数ci,并确保,并确保ci0。应注意系数输入的顺序,它将分。应注意系数输入的顺序,它将分别与控制变量的水平值相对应。别与控制变量的水平值相对应。(3)Contrasts选项选项 前面例子中已经利用单因素方差分析分别对广告形式、地前面例子中已经利用单因素方差分析分别对广告形式、地区对销售额的影响进行了分析。分析的结论是不同的广告形式区对销售额的影响进行了分析。分析的结论是不同的广告形式、不同的地区对销售额有显著影响,下面可作进一步的分析。、不同的地区对销售额有显著影响,下面可作进一步的分析。1、方差齐性检验、方差齐性检验 不同广告形式、不同地区下销售额总体方差是否相同

29、,是不同广告形式、不同地区下销售额总体方差是否相同,是否满足单因素方差分析的前提要求,是应首先检验的问题。否满足单因素方差分析的前提要求,是应首先检验的问题。2、多重比较检验、多重比较检验 总体上讲,不同广告形式对产品的销售额有显著影响,那总体上讲,不同广告形式对产品的销售额有显著影响,那么究竟哪种广告形式的作用较明显哪种不明显,这些问题可通么究竟哪种广告形式的作用较明显哪种不明显,这些问题可通过多重比较检验实现。同理,可对商品在不同地区的销售额情过多重比较检验实现。同理,可对商品在不同地区的销售额情况进行分析。(采用况进行分析。(采用LSD,Bonferroni,Tukey,Scheffe,

30、S-N-K五种方法)五种方法)6.2.6 单因素方差分析进一步分析应用举例单因素方差分析进一步分析应用举例3、趋势检验、趋势检验 通过上面的分析,可以清楚地掌握不同地区的销售情况通过上面的分析,可以清楚地掌握不同地区的销售情况。这里,如果假定不同地区的差异表现在人口密度方面(地。这里,如果假定不同地区的差异表现在人口密度方面(地区编号小的人口密度高,地区编号大的人口密度低),那么区编号小的人口密度高,地区编号大的人口密度低),那么进一步可分析不同地区销售额总体上是否会随着地区人口密进一步可分析不同地区销售额总体上是否会随着地区人口密度的减少而呈现出某种趋势性的变化规律,进而为市场细分度的减少而

31、呈现出某种趋势性的变化规律,进而为市场细分提供依据。提供依据。4、先验对比检验、先验对比检验 通过对不同广告形式的多重比较分析可知,在四种广告通过对不同广告形式的多重比较分析可知,在四种广告形式中,宣传品广告的效果是最差的,而其余三种略有差异形式中,宣传品广告的效果是最差的,而其余三种略有差异。这里,可采用先验对比检验方法,进一步对报纸广告的效。这里,可采用先验对比检验方法,进一步对报纸广告的效果与广播和体验的整体效果进行对比分析。果与广播和体验的整体效果进行对比分析。6.3 多因素方差分析多因素方差分析6.3.16.3.1多因素方差分析的基本思想多因素方差分析的基本思想 1 1、定义:多因素

32、方差分析用来研究两个及两个以上控制变量的不同水平、定义:多因素方差分析用来研究两个及两个以上控制变量的不同水平是否对观测变量产生了显著影响。多因素方差分析不仅能够分析多个因素是否对观测变量产生了显著影响。多因素方差分析不仅能够分析多个因素对观测变量的独立影响,还能够分析多个控制变量的交互作用能否对观测对观测变量的独立影响,还能够分析多个控制变量的交互作用能否对观测变量产生显著影响。例如:分析不同品种、不同施肥量是否给农作物的产变量产生显著影响。例如:分析不同品种、不同施肥量是否给农作物的产量产生显著影响,并进一步研究哪种品种和哪种施肥量是提高农作物产量量产生显著影响,并进一步研究哪种品种和哪种

33、施肥量是提高农作物产量的最优组合。的最优组合。2 2、观测变量方差的分解、观测变量方差的分解 将观测变量总的离差平方和分解为:将观测变量总的离差平方和分解为: 其中,其中,SSTSST为观测变量的总离差平方和;为观测变量的总离差平方和;SSASSA、SSBSSB分别为控制变量分别为控制变量A A、B B独立作用引起的变差;独立作用引起的变差;SSABSSAB为控制变量为控制变量A A、B B两两交互作用引起的变差;两两交互作用引起的变差;SSESSE为随机因素引起的变差。为随机因素引起的变差。SSESSABSSBSSASST其中:其中:kirjnkijkijxxSST1112)(kirjAii

34、jxxnSSA112)(kirjnkABijijkijxxSSE1112)(rikjBiijxxnSSB112)(SSESSBSSASSTSSAB多因素方差分析离差平方和的分解多因素方差分析离差平方和的分解-例题例题性别职称基本工资11101411101411104412889129842285912989138481382713866139381388713887248242482424824性别 男职工1024.00954.00875.50.932.25基本工资Mean高级工程师Mean工程师Mean助理工程师Mean无技术职称职称MeanTotal性别 女职工.859.00.824.00

35、832.75基本工资Mean高级工程师Mean工程师Mean助理工程师Mean无技术职称职称MeanTotalTotal1024.00930.25875.50824.00907.38基本工资Mean高级工程师Mean工程师Mean助理工程师Mean无技术职称职称MeanTotalA1A2B125B2710A1A2B125B273交互作用的理解交互作用的理解 在观测变量总离差平方和中,如果在观测变量总离差平方和中,如果SSASSA所占比例较大,则说明控制变所占比例较大,则说明控制变量量A A是引起观测变量的变动主要因素之一,观测变量的变动可以部分的由是引起观测变量的变动主要因素之一,观测变量的变

36、动可以部分的由控制变量控制变量A A来解释,即控制变量来解释,即控制变量A A给观测变量带来了显著影响。对给观测变量带来了显著影响。对SSBSSB、SSABSSAB同理。同理。)1(, 1() 1(/) 1/(lkrkFMSEMSAlklSSEkSSAFA)1(),1)(1() 1(/) 1)(1/(lkrrkFMSEMSABlkrSSERkSSABFAB)1(, 1() 1(/) 1/(lkrrFMSEMSBlkrSSErSSBFB3 3、比较观测变量总离差平方和各部分的比例、比较观测变量总离差平方和各部分的比例提出原假设:各控制变量不同水平下观测变量各总体的均值提出原假设:各控制变量不同水

37、平下观测变量各总体的均值无显著差异,控制变量交互作用对观测变量无显著影响。无显著差异,控制变量交互作用对观测变量无显著影响。计算检验统计量和概率计算检验统计量和概率P P值值l给定显著性水平与给定显著性水平与p p值做比较:如果值做比较:如果p p值小于显著性水平,则值小于显著性水平,则应该拒绝原假设,反之就不能拒绝原假设。应该拒绝原假设,反之就不能拒绝原假设。 6.3.2 多因素方差分析的基本步骤多因素方差分析的基本步骤 在利用在利用SPSS进行多因素方差分析时,应首先将各个进行多因素方差分析时,应首先将各个控制变量以及观测变量分别定义成多个控制变量以及观测变量分别定义成多个SPSS变量,并

38、组变量,并组织好数据再进行分析。织好数据再进行分析。1、选择菜单、选择菜单AnalyzeGeneral Linear ModelUnivariate,出现主窗口。,出现主窗口。2、把观测变量指定到、把观测变量指定到Dependent Variable框中。框中。3、把固定效应的控制变量指定到、把固定效应的控制变量指定到Fixed Factor(s)框中,把框中,把随机效应的控制变量指定到随机效应的控制变量指定到Random Factor(s)框中。框中。 至此,至此,SPSS将自动建立多因素方差分析的饱和模型将自动建立多因素方差分析的饱和模型,并计算各检验统计量的观测值和对应的概率,并计算各检

39、验统计量的观测值和对应的概率p值,并将值,并将结果显示到输出窗口中。结果显示到输出窗口中。6.3.3 多因素方差分析的基本操作步骤多因素方差分析的基本操作步骤 利用某企业不同广告形式在不同地区的广告效果(销利用某企业不同广告形式在不同地区的广告效果(销售额)进行评估的数据,通过多因素方差分析方法对广告售额)进行评估的数据,通过多因素方差分析方法对广告形式、地区、广告形式和地区的交互作用给销售额的影响形式、地区、广告形式和地区的交互作用给销售额的影响进行分析,进而为制订广告和地区的最优宣传组合方案提进行分析,进而为制订广告和地区的最优宣传组合方案提供依据。供依据。 这里,以广告形式和地区为控制变

40、量,销售额为观测这里,以广告形式和地区为控制变量,销售额为观测变量,建立固定效应的饱和模型。零假设为:不同广告形变量,建立固定效应的饱和模型。零假设为:不同广告形式没有对销售额产生显著影响;不同地区的销售额没有显式没有对销售额产生显著影响;不同地区的销售额没有显著差异;广告形式和地区对销售额没有产生显著的交互影著差异;广告形式和地区对销售额没有产生显著的交互影响。响。6.3.4 多因素方差分析应用举例多因素方差分析应用举例1、多因素方差分析的非饱和模型、多因素方差分析的非饱和模型 在饱和模型中,观测变量总的变差被分解为在饱和模型中,观测变量总的变差被分解为控制变量独立作用、控制变量交互作用及随

41、机误控制变量独立作用、控制变量交互作用及随机误差三部分(例:差三部分(例:SST=SSA+SSB+SSAB+SSE) 。如果研究。如果研究发现,控制变量的某阶交互作用没有给观测变量发现,控制变量的某阶交互作用没有给观测变量产生显著影响,那么可以尝试建立非饱和模型。产生显著影响,那么可以尝试建立非饱和模型。区别在于将饱和模型中某些部分合并到区别在于将饱和模型中某些部分合并到SSE中,中,例如两因素非饱和模型为:例如两因素非饱和模型为: SST=SSA+SSB+SSE6.3.5 多因素方差分析的进一步分析多因素方差分析的进一步分析 在在SPSS中,利用多因素方差分析功能还能中,利用多因素方差分析功

42、能还能够对各个控制变量不同水平下的均值是否存在显够对各个控制变量不同水平下的均值是否存在显著差异进行比较,实现方式有两种:多重比较检著差异进行比较,实现方式有两种:多重比较检验(验(Post Hoc)和对比检验()和对比检验(Contrast)。)。多重比较检验的方法与单因素方差分析类似,不多重比较检验的方法与单因素方差分析类似,不再重复。对比检验采用的是单样本再重复。对比检验采用的是单样本t检验的方法检验的方法。2、均值检验、均值检验检验值可以指定一下几种:检验值可以指定一下几种: None:SPSS默认。不做对比分析;默认。不做对比分析; Deviation:表示以观测变量的总体均值为标准

43、,比较各水:表示以观测变量的总体均值为标准,比较各水平上观测变量的均值是否有显著差异;平上观测变量的均值是否有显著差异; Simple:表示以第一水平或最后一个水平上的观测变量均:表示以第一水平或最后一个水平上的观测变量均值为标准,比较各水平上的观测变量均值是否有显著差异;值为标准,比较各水平上的观测变量均值是否有显著差异; Diffeence:表示将各水平上观测变量均值与其前一个水平:表示将各水平上观测变量均值与其前一个水平上的观测变量均值做比较;上的观测变量均值做比较; Helmert:表示将各水平上观测变量均值与其后一个水平:表示将各水平上观测变量均值与其后一个水平上的观测变量均值做比较

44、。上的观测变量均值做比较。3、控制变量交互作用的图形分析、控制变量交互作用的图形分析 控制变量的交互作用可以通过图形直观分析。如果控控制变量的交互作用可以通过图形直观分析。如果控制变量之间无交互作用,各水平对应的直线是近于平行制变量之间无交互作用,各水平对应的直线是近于平行的;如果控制变量间存在交互作用,各水平对应的直线的;如果控制变量间存在交互作用,各水平对应的直线会相互交叉。会相互交叉。4、模型分析、模型分析 这里模型分析的主要任务有三个:第一,利用多因素这里模型分析的主要任务有三个:第一,利用多因素方差分析模型计算观测变量预测值;第二,计算各种残方差分析模型计算观测变量预测值;第二,计算

45、各种残差值,评价模型对数据的拟合程度;第三,对数据中的差值,评价模型对数据的拟合程度;第三,对数据中的异常点进行诊断。异常点进行诊断。1、建立非饱和模型的操作、建立非饱和模型的操作 SPSS多因素方差分析中默认建立的是饱和模型。如果多因素方差分析中默认建立的是饱和模型。如果希望建立非饱和模型,则应在主窗口中单击希望建立非饱和模型,则应在主窗口中单击Model按钮,出按钮,出现窗口:现窗口:6.3.6 多因素方差分析中进一步分析的操作步骤多因素方差分析中进一步分析的操作步骤 默认的选项是默认的选项是Full factorial,表示饱和模型,表示饱和模型。此时。此时Factors & C

46、ovariates框、框、Model框以及框以及Build Term(s)下拉框均呈不可用状态;如果选择下拉框均呈不可用状态;如果选择Custom项,则表示建立非饱和模型,且项,则表示建立非饱和模型,且Factors & Covariates框、框、Model框以及框以及Build Term(s)下拉框均变为可用状态。此时便下拉框均变为可用状态。此时便可自定义非饱和模型中的数据项。其中可自定义非饱和模型中的数据项。其中Interaction为交互作用;为交互作用;Main effects为主为主效应;效应;All 2-way、All 3-way等表示二阶、三等表示二阶、三阶或更高阶交互

47、作用。阶或更高阶交互作用。 如果通过多因素方差分析得知某控制变量的不同水平对如果通过多因素方差分析得知某控制变量的不同水平对观测变量产生显著影响,进一步可对各水平间的均值进行比观测变量产生显著影响,进一步可对各水平间的均值进行比较。如果采用多重比较检验方法,则单击较。如果采用多重比较检验方法,则单击Post Hoc按钮,选按钮,选择合适的多重比较检验方法。择合适的多重比较检验方法。2、均值比较的操作、均值比较的操作 如果采用对比检验方法,则单击如果采用对比检验方法,则单击Contrasts按钮,默认按钮,默认是不进行对比检验(显示如是不进行对比检验(显示如x1(None);如果进行对比);如果

48、进行对比检验,可展开检验,可展开Contrast后的下拉框,指定对比检验的检验后的下拉框,指定对比检验的检验值,并单击值,并单击Change按钮完成指定。按钮完成指定。如果希望通过图形直观判断控制变量间是否存在交互作用如果希望通过图形直观判断控制变量间是否存在交互作用,则应在主窗口单击,则应在主窗口单击Plots按钮。按钮。n首先选择一个控制变量作为交互图形中的横轴,并将其选择到首先选择一个控制变量作为交互图形中的横轴,并将其选择到Horizontal Axis框中;框中;n其次,指定在交互图中各直线代表的是哪个控制变量的不同水平其次,指定在交互图中各直线代表的是哪个控制变量的不同水平,并将其

49、选择到,并将其选择到Separated Lines框中;框中;n最后,如果控制变量有三个,由于交互作用图只能反映两控制变最后,如果控制变量有三个,由于交互作用图只能反映两控制变量的交互情况,此时第三个变量只能选入量的交互情况,此时第三个变量只能选入Separate Plots框中框中,第三个变量有几个水平便绘制出几张交互图,第三个变量有几个水平便绘制出几张交互图。3、控制变量交互作用图形分析的操作、控制变量交互作用图形分析的操作SPSS多因素方差模型建立完成后,可以在主窗口中单击多因素方差模型建立完成后,可以在主窗口中单击Save按钮按钮对模型进行分析,并将分析结果以变量的形式存入对模型进行分

50、析,并将分析结果以变量的形式存入SPSS数据编辑数据编辑窗口中。其中,窗口中。其中,Predicted Values框中的选项用来计算模型的预测框中的选项用来计算模型的预测值;值;Residuals框中的各选项用来计算各种残差;框中的各选项用来计算各种残差;Diagnostics框实框实现异常值的诊断。各选项具体含义同回归分析。现异常值的诊断。各选项具体含义同回归分析。4、模型分析的操作、模型分析的操作 在前面的应用举例中对广告形式、地区对销售额的影在前面的应用举例中对广告形式、地区对销售额的影响进行了多因素方差分析,建立了饱和模型。分析可知,响进行了多因素方差分析,建立了饱和模型。分析可知,

51、广告形式和地区的交互作用不显著,可以进一步尝试建立广告形式和地区的交互作用不显著,可以进一步尝试建立非饱和模型,并进行均值比较分析、交互作用图形分析。非饱和模型,并进行均值比较分析、交互作用图形分析。6.3.7 多因素方差分析进一步分析应用举例多因素方差分析进一步分析应用举例6.4 协方差分析协方差分析6.4.16.4.1协方差分析的基本思想协方差分析的基本思想 无论是单因素方差分析还是多因素方差分析,控制变量是可以控制的无论是单因素方差分析还是多因素方差分析,控制变量是可以控制的,其各个水平可以通过人为努力得到控制和确定。但是在实际问题中,有,其各个水平可以通过人为努力得到控制和确定。但是在

52、实际问题中,有些控制变量很难人为控制,但他们的不同水平确实对观测变量产生较为显些控制变量很难人为控制,但他们的不同水平确实对观测变量产生较为显著的影响。比如:不同地块对农作物产量的影响。在方差分析中,如果忽著的影响。比如:不同地块对农作物产量的影响。在方差分析中,如果忽略这些因素的存在而单纯去分析其他因素对观测变量的影响,往往会夸大略这些因素的存在而单纯去分析其他因素对观测变量的影响,往往会夸大或缩小其他因素对观测变量的影响,使分析结论不准确。因此,为了更加或缩小其他因素对观测变量的影响,使分析结论不准确。因此,为了更加准确的研究控制变量不同水平对观测变量的影响,应尽量排除其他因素对准确的研究

53、控制变量不同水平对观测变量的影响,应尽量排除其他因素对分析结论的影响。分析结论的影响。1 1、定义:协方差分析就是将那些很难人为控制的因素作为协变量,并在、定义:协方差分析就是将那些很难人为控制的因素作为协变量,并在排除协变量对观测变量影响的条件下,分析控制变量对观测变量的影响,排除协变量对观测变量影响的条件下,分析控制变量对观测变量的影响,从而更加准确的对控制变量进行分析。从而更加准确的对控制变量进行分析。 方差分析中的控制变量都是定性变量(包括定类和定序变方差分析中的控制变量都是定性变量(包括定类和定序变量),线性回归分析中的解释变量(自变量)都是定量变量。量),线性回归分析中的解释变量(

54、自变量)都是定量变量。而协方差分析中的控制变量是定性变量,而协变量一般是定量而协方差分析中的控制变量是定性变量,而协变量一般是定量变量。所以说协方差分析是一种介于方差分析和线性回归分析变量。所以说协方差分析是一种介于方差分析和线性回归分析之间的分析方法。例如:在研究生猪的饲养问题的协方差分析之间的分析方法。例如:在研究生猪的饲养问题的协方差分析中,饲料是控制变量,生猪的初始体重是协变量。中,饲料是控制变量,生猪的初始体重是协变量。 协方差分析中要求多个协变量之间无交互作用,且观测变协方差分析中要求多个协变量之间无交互作用,且观测变量与协变量之间有显著的线性关系。量与协变量之间有显著的线性关系。2、协方差分析的特点、协方差分析的特点 在协方差分析中,将观测变量的总离差平方和分解为由在协方差分析中,将观测变量的总离差平方和分解为由控制变量独立作用引起的、由控制变量交互作用引起的、由控制变量独立作用引起的、由控制变量交互作用引起的、由协变量引起的和随机变量引起的。以单因素协方差分析为例协变量引起的和随机变量引起的。以单因素协方差分析为例,观测变量的总变差可以分解为:,观测变量的总变差可以分解为:SSESSASSXSSTSSESSXSSASST3、离差平方和的分解、离差平方和的分解 在观测变量总离差平方和中,如果在观测变量总离差平方和中,如

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论