版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第六章第六章 SPSS方差分析方差分析 2 本章内容 6.1 方差分析概述方差分析概述 6.2 单因素方差分析单因素方差分析 6.3 多因素方差分析多因素方差分析 6.4 协方差分析协方差分析 3 6.1方差分析概述 6.1.16.1.1方差分析的作用方差分析的作用 在诸多领域的数量分析研究中,找到众多影响因素中重要的影响因素在诸多领域的数量分析研究中,找到众多影响因素中重要的影响因素 是非常重要的。比如:在农业生产中,我们总是希望在尽量少的投入成本是非常重要的。比如:在农业生产中,我们总是希望在尽量少的投入成本 下得到较高的农作物产量。这就需要首先分析农作物的产量究竟受到哪些下得到较高的农作
2、物产量。这就需要首先分析农作物的产量究竟受到哪些 因素的影响。有许多因素会影响农作物的产量,如种子的品种、施肥量、因素的影响。有许多因素会影响农作物的产量,如种子的品种、施肥量、 气候、地域等,他们都会给农作物的产量带来或多或少的影响。如果我们气候、地域等,他们都会给农作物的产量带来或多或少的影响。如果我们 能够掌握在众多的影响因素中,哪些因素对农作物的产量起到了主要的、能够掌握在众多的影响因素中,哪些因素对农作物的产量起到了主要的、 关键性的作用,我们就可以根据实际情况对这些关键因素加以控制。关键性的作用,我们就可以根据实际情况对这些关键因素加以控制。 进一步,在掌握关键影响因素,如品种、施
3、肥量因素等之后,我们还进一步,在掌握关键影响因素,如品种、施肥量因素等之后,我们还 要对不同的品种、不同的施肥量条件下的产量进行对比分析,研究究竟哪要对不同的品种、不同的施肥量条件下的产量进行对比分析,研究究竟哪 个品种的产量高,施肥量究竟多少最合适,哪种品种与哪种施肥量搭配最个品种的产量高,施肥量究竟多少最合适,哪种品种与哪种施肥量搭配最 优,等等。在这些分析研究的基础上,我们就可以计算出各个组合方案的优,等等。在这些分析研究的基础上,我们就可以计算出各个组合方案的 成本和收益,并选择最合理的种植方案,主动的在农作物种植过程中对各成本和收益,并选择最合理的种植方案,主动的在农作物种植过程中对
4、各 种影响因素加以准确控制,进而获得最理想的效果。种影响因素加以准确控制,进而获得最理想的效果。 4 6.1.26.1.2相关概念相关概念 1 1、影响因素的分类:在所有的影响因素中根据是否可以人为控制可以分为、影响因素的分类:在所有的影响因素中根据是否可以人为控制可以分为 两类,一类是人为可以控制的因素,称为控制因素或控制变量,如种子品两类,一类是人为可以控制的因素,称为控制因素或控制变量,如种子品 种的选定,施肥量的多少;另一类因素是认为很难控制的因素,称为随机种的选定,施肥量的多少;另一类因素是认为很难控制的因素,称为随机 因素或随机变量,如气候和地域等影响因素。在很多情况下随机因素指的
5、因素或随机变量,如气候和地域等影响因素。在很多情况下随机因素指的 是实验过程中的抽样误差。是实验过程中的抽样误差。 2 2、控制变量的不同水平:控制变量的不同取值或水平,称为控制变量的不、控制变量的不同水平:控制变量的不同取值或水平,称为控制变量的不 同水平。如甲品种、乙品种;同水平。如甲品种、乙品种;1010公斤化肥、公斤化肥、2020公斤化肥、公斤化肥、3030公斤化肥等。公斤化肥等。 3 3、观测变量:受控制变量和随机变量影响的变量称为观测变量,如农作物、观测变量:受控制变量和随机变量影响的变量称为观测变量,如农作物 的产量等。的产量等。 方差分析就是从观测变量的方差入手,研究诸多控制变
6、量中哪些变量方差分析就是从观测变量的方差入手,研究诸多控制变量中哪些变量 是对观测变量有显著影响的变量以及对观测变量有显著影响的各个控制变是对观测变量有显著影响的变量以及对观测变量有显著影响的各个控制变 量其不同水平以及各水平的交互搭配是如何影响观测变量的一种分析方法量其不同水平以及各水平的交互搭配是如何影响观测变量的一种分析方法 。 5 6.1.3方差分析的原理方差分析的原理 方差分析认为,如果控制变量的不同水平对观测变量产生了显著影方差分析认为,如果控制变量的不同水平对观测变量产生了显著影 响,那么它和随机变量共同作用必然使得观测变量值显著变动;反之,响,那么它和随机变量共同作用必然使得观
7、测变量值显著变动;反之, 如果控制变量的不同水平没有对观测变量产生显著影响,那么观测变量如果控制变量的不同水平没有对观测变量产生显著影响,那么观测变量 值的变动就不明显,其变动可以归结为随机变量影响造成的。值的变动就不明显,其变动可以归结为随机变量影响造成的。 建立在观测变量各总体服从正态分布和同方差的假设之上,方差建立在观测变量各总体服从正态分布和同方差的假设之上,方差 分析的问题就转化为在控制变量不同水平上的观测变量均值是否存在显分析的问题就转化为在控制变量不同水平上的观测变量均值是否存在显 著差异的推断问题了。著差异的推断问题了。 综上所述,方差分析从对观测变量的方差分解入手,通过推断控
8、综上所述,方差分析从对观测变量的方差分解入手,通过推断控 制变量各水平下各观测变量的均值是否存在显著差异,分析控制变量是制变量各水平下各观测变量的均值是否存在显著差异,分析控制变量是 否给观测变量带来了显著影响,进而再对控制变量各个水平对观测变量否给观测变量带来了显著影响,进而再对控制变量各个水平对观测变量 影响的程度进行剖析。影响的程度进行剖析。 根据控制变量的个数可将方差分析分为单因素方差分析、多因素根据控制变量的个数可将方差分析分为单因素方差分析、多因素 方差分析;根据观测变量的个数可将方差分析分为一元方差分析(单因方差分析;根据观测变量的个数可将方差分析分为一元方差分析(单因 变量方差
9、分析)和多元方差分析(多因变量方差分析)。变量方差分析)和多元方差分析(多因变量方差分析)。 6 6.2 单因素方差分析 6.2.16.2.1单因素方差分析的基本思想单因素方差分析的基本思想 1 1、定义:单因素方差分析用来研究一个控制变量的不同水平是否对观测、定义:单因素方差分析用来研究一个控制变量的不同水平是否对观测 变量产生了显著影响。例如:分析不同施肥量是否给农作物的产量产生显变量产生了显著影响。例如:分析不同施肥量是否给农作物的产量产生显 著影响;研究不同学历是否对工资收入产生显著影响等。著影响;研究不同学历是否对工资收入产生显著影响等。 2 2、观测变量方差的分解、观测变量方差的分
10、解 将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和 两部分,分别表示为:两部分,分别表示为: 其中,其中,SSTSST为观测变量的总离差平方和;为观测变量的总离差平方和;SSASSA为组间离差平方和,是由为组间离差平方和,是由 控制变量不同水平造成的观测变量的变差;控制变量不同水平造成的观测变量的变差;SSESSE为组内平方和,是由抽样为组内平方和,是由抽样 误差引起的观测变量的变差。误差引起的观测变量的变差。 SSESSASST 7 其中:其中: k i n j ij i xxSST 11 2 )( k i k i i
11、i n j i xxnxxSSA i 11 2 1 2 )()( k i n j iij i xxSSE 11 2 )( 8 3 3、比较观测变量总离差平方和各部分的比例、比较观测变量总离差平方和各部分的比例 在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则 说明观测变量的变动主要是由于控制变量引起的,可以主要由控制变量来说明观测变量的变动主要是由于控制变量引起的,可以主要由控制变量来 解释,即控制变量给观测变量带来了显著影响。解释,即控制变量给观测变量带来了显著影响。 这里我们用这里我们用F F统计量来表示这种比例关系,
12、如果控制变量的不同水平对统计量来表示这种比例关系,如果控制变量的不同水平对 观测变量造成了显著影响,那么观测变量总变差中控制变量所占的比例较观测变量造成了显著影响,那么观测变量总变差中控制变量所占的比例较 大,则大,则F F值就比较大;反之,如果控制变量的不同水平对观测变量没有造成值就比较大;反之,如果控制变量的不同水平对观测变量没有造成 显著影响,那么观测变量总变差中控制变量所占的比例较小,则显著影响,那么观测变量总变差中控制变量所占的比例较小,则F F值就比较值就比较 小。小。 ), 1( )/( ) 1/( knkF MSE MSA knSSE kSSA F 9 6.2.2 6.2.2
13、单因素方差分析的数学模型单因素方差分析的数学模型 假设:控制变量假设:控制变量A A有有k k个水平,每个水平均有个水平,每个水平均有r r个样。那么在水平个样。那么在水平 下的第下的第j j 次试验的样本值次试验的样本值 可以定义为可以定义为 式(式(1 1)中,)中, 为观测变量在水平为观测变量在水平 下的期望值;下的期望值; 为抽样误差,是服为抽样误差,是服 从正态分布从正态分布 的独立随机变量。如果令的独立随机变量。如果令 式(式(2 2)中,)中, 为观测变量总的期望值,且有为观测变量总的期望值,且有 式(式(3 3)中,)中, 是控制变量水平是控制变量水平 对试验结果产生的附加影响
14、,称为水对试验结果产生的附加影响,称为水 平平 对观测变量产生的效应,且对观测变量产生的效应,且 (1,2, ;1,2, ) (1) ijiij xik jr 1 1 (2) k i i k - (1,2, ) (3) ii aik 2 N(0,) i A ij x i u i A ij i a i A i A 1 0 k i i a 10 式(式(2 2)和式()和式(3 3)代入式()代入式(1 1)中,则有)中,则有 式(式(4 4)是单因素方差分析的数学模型。可以看到它是一个线性模型。其)是单因素方差分析的数学模型。可以看到它是一个线性模型。其 中中 的无偏估计的无偏估计 。 的无偏估
15、计的无偏估计 如果控制变量如果控制变量A A对观测变量没有影响,则各水平的效应对观测变量没有影响,则各水平的效应 应全部为应全部为0 0 ,否则应不全为,否则应不全为0.0.单因素方差分析正是要对控制变量单因素方差分析正是要对控制变量A A的所有效应是否的所有效应是否 同时为同时为0 0进行推断。进行推断。 + (1,2, ;j=1,2,r) (4) ijiij xaik i a ii axx i a 11 6.2.2 6.2.2 单因素方差分析的基本步骤单因素方差分析的基本步骤 提出原假设:控制变量不同水平下观测变量各总体的均提出原假设:控制变量不同水平下观测变量各总体的均 值无显著差异值无
16、显著差异, , 控制变量不同水平下的效应同时为控制变量不同水平下的效应同时为0 0,记,记 为为 ,意味着控制变量不同水平,意味着控制变量不同水平 的变化没有对观测变量产生显著影响。的变化没有对观测变量产生显著影响。 计算检验统计量和概率计算检验统计量和概率P P值值 l给定显著性水平与给定显著性水平与p p值做比较:如果值做比较:如果p p值小于显著性水平值小于显著性水平 ,则应该拒绝原假设,反之就不能拒绝原假设。,则应该拒绝原假设,反之就不能拒绝原假设。 MSE MSA knSSE kSSA F )/( ) 1/( 012 :0 k Haaa 12 6.2.3 单因素方差分析的基本操作步骤
17、单因素方差分析的基本操作步骤 在利用在利用SPSS进行单因素方差分析时,应注意数据的组织形式。进行单因素方差分析时,应注意数据的组织形式。 SPSS要求定义两个变量分别存放观测变量值和控制变量的水平值。基本要求定义两个变量分别存放观测变量值和控制变量的水平值。基本 操作步骤如下:操作步骤如下: 1、选择菜单、选择菜单AnalyzeCompare meansOne-Way ANOVA,出现窗口,出现窗口 13 2、将观测变量选择到、将观测变量选择到Dependent List框。框。 3、将控制变量选择到、将控制变量选择到Factor框。控制变量有几个不同的取值框。控制变量有几个不同的取值 表示
18、控制变量有几个水平。表示控制变量有几个水平。 至此,至此,SPSS便自动分解观测变量的方差,计算组间方便自动分解观测变量的方差,计算组间方 差、组内方差、差、组内方差、F统计量以及对应的概率统计量以及对应的概率p值,完成单因素值,完成单因素 方差分析的相关计算,并将结果显示到输出窗口中。方差分析的相关计算,并将结果显示到输出窗口中。 14 6.2.4 单因素方差分析的应用举例单因素方差分析的应用举例1 某企业在制订某商品的广告策略时,对不同广某企业在制订某商品的广告策略时,对不同广 告形式在不同地区的广告效果(销售额)进行了评告形式在不同地区的广告效果(销售额)进行了评 估。这里以商品销售额为
19、观测变量,广告形式和地估。这里以商品销售额为观测变量,广告形式和地 区为控制变量,通过单因素方差分析方法分别对广区为控制变量,通过单因素方差分析方法分别对广 告形式、地区对销售额的影响进行方差分析。告形式、地区对销售额的影响进行方差分析。 15 6.2.4 单因素方差分析的应用举例单因素方差分析的应用举例2 为了寻求适应本地区的高产油菜品种,今选了五种为了寻求适应本地区的高产油菜品种,今选了五种 不同品种进行试验,每一品种在四块试验田上试种不同品种进行试验,每一品种在四块试验田上试种 ,得到在每一块田上的亩产量见数据,请分析不同,得到在每一块田上的亩产量见数据,请分析不同 品种的平均亩产量是否
20、有显著差异。品种的平均亩产量是否有显著差异。 我们这里以亩产量为观测变量,品种为控制变我们这里以亩产量为观测变量,品种为控制变 量,通过单因素方差分析方法分析品种选择对亩产量,通过单因素方差分析方法分析品种选择对亩产 量的影响进行单方差分析量的影响进行单方差分析 16 6.2.5 单因素方差分析的进一步分析单因素方差分析的进一步分析 1、方差齐性检验、方差齐性检验 由于方差分析的前提是各水平下的总体服从正态分布并由于方差分析的前提是各水平下的总体服从正态分布并 且方差相等,因此有必要对方差齐性进行检验,即对控制变且方差相等,因此有必要对方差齐性进行检验,即对控制变 量不同水平下各观测变量不同总
21、体方差是否相等进行分析。量不同水平下各观测变量不同总体方差是否相等进行分析。 SPSS单因素方差分析中,方差齐性检验采用了方差同单因素方差分析中,方差齐性检验采用了方差同 质性(质性(Homogeneity of Variance)的检验方法,其零)的检验方法,其零 假设是各水平下观测变量总体方差无显著性差异,实现思路假设是各水平下观测变量总体方差无显著性差异,实现思路 同同SPSS两独立样本两独立样本t检验中的方差齐性检验。检验中的方差齐性检验。 17 2、多重比较检验、多重比较检验 上面的基本分析可以判断控制变量是否对观测变量产生了上面的基本分析可以判断控制变量是否对观测变量产生了 显著影
22、响。如果控制变量确实对观测变量产生了显著影响,显著影响。如果控制变量确实对观测变量产生了显著影响, 进一步还应确定,控制变量的不同水平对观测变量的影响程进一步还应确定,控制变量的不同水平对观测变量的影响程 度如何,其中哪个水平的作用明显大于其它水平,哪些水平度如何,其中哪个水平的作用明显大于其它水平,哪些水平 的作用是不显著的。例如已经确定不同施肥量会对农作物的的作用是不显著的。例如已经确定不同施肥量会对农作物的 产量产生显著影响,便希望进一步了解究竟是产量产生显著影响,便希望进一步了解究竟是10公斤、公斤、20 公斤还是公斤还是30公斤施肥量最有利于提高产量,哪种施肥量对农公斤施肥量最有利于
23、提高产量,哪种施肥量对农 作物产量没有显著影响。掌握了这些信息,我们就能够制定作物产量没有显著影响。掌握了这些信息,我们就能够制定 合理的施肥方案。合理的施肥方案。 多重比较检验就是分别对每个水平下的观测变量均值进多重比较检验就是分别对每个水平下的观测变量均值进 行逐对比较,判断两均值之间是否存在显著差异。其零假设行逐对比较,判断两均值之间是否存在显著差异。其零假设 是相应组的均值之间无显著差异。是相应组的均值之间无显著差异。 18 SPSS提供的多重比较检验的方法比较多,有些方法适提供的多重比较检验的方法比较多,有些方法适 用在各总体方差相等的条件下,有些适用在方差不相等的条用在各总体方差相
24、等的条件下,有些适用在方差不相等的条 件下。件下。 其中其中LSD方法适用于各总体方差相等的情况,特点是比方法适用于各总体方差相等的情况,特点是比 较灵敏;较灵敏;Tukey方法和方法和S-N-K方法适用于各水平下观测变方法适用于各水平下观测变 量个数相等的情况;量个数相等的情况;Scheffe方法比方法比Tukey方法不灵敏。方法不灵敏。 19 3、其他检验、其他检验 (1)先验对比检验)先验对比检验 如果发现某些水平与另一些水平的均值差距显著,就可如果发现某些水平与另一些水平的均值差距显著,就可 以进一步比较这两组总的均值是否存在显著差异。在检验中以进一步比较这两组总的均值是否存在显著差异
25、。在检验中 ,SPSS根据用户确定的各均值的系数,再对其线性组合进根据用户确定的各均值的系数,再对其线性组合进 行检验,来判断各相似性子集间均值的差异程度。行检验,来判断各相似性子集间均值的差异程度。 (2)趋势检验)趋势检验 当控制变量为定序变量时,趋势检验能够分析随着控制当控制变量为定序变量时,趋势检验能够分析随着控制 变量水平的变化,观测变量值变化的总体趋势是怎样的。变量水平的变化,观测变量值变化的总体趋势是怎样的。 20 4、单因素方差分析进一步分析的操作、单因素方差分析进一步分析的操作 (1)Option选项选项 Option选项用来对方差分析的前提条件进行检验选项用来对方差分析的前
26、提条件进行检验 ,并可输出其他相关统计量和对缺失数据进行处理。,并可输出其他相关统计量和对缺失数据进行处理。 Homogeneity of variance test选项实现方差齐选项实现方差齐 性检验;性检验;Descriptive选项输出观测变量的基本描述统选项输出观测变量的基本描述统 计量;计量;Brown-Forsythe、Welch选项可计算其统计量选项可计算其统计量 以检验各组均值的相等性,当方差齐性不成立时应选择以检验各组均值的相等性,当方差齐性不成立时应选择 使用这两个统计量而不是使用这两个统计量而不是F统计量统计量。Means Plot选项输选项输 出各水平下观测变量均值的折
27、线图;出各水平下观测变量均值的折线图;Missing Values 框中提供了两种缺失数据的处理方式。框中提供了两种缺失数据的处理方式。 21 22 (2)Post Hoc选项选项 Post Hoc选项用来实现多重比较检验。选项用来实现多重比较检验。 提供了提供了18种多重比较检验的方法。其中种多重比较检验的方法。其中Equal Variances Assumed框中的方法适用于各水平方差齐性框中的方法适用于各水平方差齐性 的情况。在方差分析中,由于其前提所限,应用中多采用的情况。在方差分析中,由于其前提所限,应用中多采用 Equal Variances Not Assumed框中的方法。多重
28、比较框中的方法。多重比较 检验中,检验中,SPSS默认的显著性水平为默认的显著性水平为0.05,可以根据实际,可以根据实际 情况修改情况修改Significance level后面的数值以进行调整。后面的数值以进行调整。 23 24 (3)Contrasts选项选项 Contrasts选项用来实现先验对比检验和趋势检验。选项用来实现先验对比检验和趋势检验。 如果进行趋势检验,则应选择如果进行趋势检验,则应选择Polynomial选项,然后选项,然后 在后面的下拉框中选择趋势检验的方法。其中在后面的下拉框中选择趋势检验的方法。其中Linear表示线表示线 性趋势检验;性趋势检验;Quadrati
29、c表示进行二次多项式检验;表示进行二次多项式检验;Cubic 表示进行三次多项式检验,表示进行三次多项式检验,4th和和5th表示进行四次和五次多表示进行四次和五次多 项式检验。项式检验。 如果进行先验对比检验,则应在如果进行先验对比检验,则应在Coefficients后依次输后依次输 入系数入系数ci,并确保,并确保ci0。应注意系数输入的顺序,它将分。应注意系数输入的顺序,它将分 别与控制变量的水平值相对应。别与控制变量的水平值相对应。 25 26 6.2.6 单因素方差分析进一步分析应用举例单因素方差分析进一步分析应用举例 前面例子中已经利用单因素方差分析分别对广告形式、地前面例子中已经
30、利用单因素方差分析分别对广告形式、地 区对销售额的影响进行了分析。分析的结论是不同的广告形式区对销售额的影响进行了分析。分析的结论是不同的广告形式 、不同的地区对销售额有显著影响,下面可作进一步的分析。、不同的地区对销售额有显著影响,下面可作进一步的分析。 1、方差齐性检验、方差齐性检验 不同广告形式、不同地区下销售额总体方差是否相同,是不同广告形式、不同地区下销售额总体方差是否相同,是 否满足单因素方差分析的前提要求,是应首先检验的问题。否满足单因素方差分析的前提要求,是应首先检验的问题。 2、多重比较检验、多重比较检验 总体上讲,不同广告形式对产品的销售额有显著影响,那总体上讲,不同广告形
31、式对产品的销售额有显著影响,那 么究竟哪种广告形式的作用较明显哪种不明显,这些问题可通么究竟哪种广告形式的作用较明显哪种不明显,这些问题可通 过多重比较检验实现。同理,可对商品在不同地区的销售额情过多重比较检验实现。同理,可对商品在不同地区的销售额情 况进行分析。(采用况进行分析。(采用LSD,Bonferroni,Tukey, Scheffe,S-N-K五种方法)五种方法) 27 3、趋势检验、趋势检验 通过上面的分析,可以清楚地掌握不同地区的销售情况通过上面的分析,可以清楚地掌握不同地区的销售情况 。这里,如果假定不同地区的差异表现在人口密度方面(地。这里,如果假定不同地区的差异表现在人口
32、密度方面(地 区编号小的人口密度高,地区编号大的人口密度低),那么区编号小的人口密度高,地区编号大的人口密度低),那么 进一步可分析不同地区销售额总体上是否会随着地区人口密进一步可分析不同地区销售额总体上是否会随着地区人口密 度的减少而呈现出某种趋势性的变化规律,进而为市场细分度的减少而呈现出某种趋势性的变化规律,进而为市场细分 提供依据。提供依据。 4、先验对比检验、先验对比检验 通过对不同广告形式的多重比较分析可知,在四种广告通过对不同广告形式的多重比较分析可知,在四种广告 形式中,宣传品广告的效果是最差的,而其余三种略有差异形式中,宣传品广告的效果是最差的,而其余三种略有差异 。这里,可
33、采用先验对比检验方法,进一步对报纸广告的效。这里,可采用先验对比检验方法,进一步对报纸广告的效 果与广播和体验的整体效果进行对比分析。果与广播和体验的整体效果进行对比分析。 28 6.3 多因素方差分析 6.3.16.3.1多因素方差分析的基本思想多因素方差分析的基本思想 1 1、定义:多因素方差分析用来研究两个及两个以上控制变量的不同水平、定义:多因素方差分析用来研究两个及两个以上控制变量的不同水平 是否对观测变量产生了显著影响。多因素方差分析不仅能够分析多个因素是否对观测变量产生了显著影响。多因素方差分析不仅能够分析多个因素 对观测变量的独立影响,还能够分析多个控制变量的交互作用能否对观测
34、对观测变量的独立影响,还能够分析多个控制变量的交互作用能否对观测 变量产生显著影响。例如:分析不同品种、不同施肥量是否给农作物的产变量产生显著影响。例如:分析不同品种、不同施肥量是否给农作物的产 量产生显著影响,并进一步研究哪种品种和哪种施肥量是提高农作物产量量产生显著影响,并进一步研究哪种品种和哪种施肥量是提高农作物产量 的最优组合。的最优组合。 2 2、观测变量方差的分解、观测变量方差的分解 将观测变量总的离差平方和分解为:将观测变量总的离差平方和分解为: 其中,其中,SSTSST为观测变量的总离差平方和;为观测变量的总离差平方和;SSASSA、SSBSSB分别为控制变量分别为控制变量A
35、A 、B B独立作用引起的变差;独立作用引起的变差;SSABSSAB为控制变量为控制变量A A、B B两两交互作用引起的变差两两交互作用引起的变差 ;SSESSE为随机因素引起的变差。为随机因素引起的变差。 SSESSABSSBSSASST 29 其中:其中: k i r j n k ijk ij xxSST 111 2 )( k i r j A iij xxnSSA 11 2 )( k i r j n k AB ijijk ij xxSSE 111 2 )( r i k j B iij xxnSSB 11 2 )( SSESSBSSASSTSSAB 30 交互作用的理解交互作用的理解 31
36、3 3、比较观测变量总离差平方和各部分的比例、比较观测变量总离差平方和各部分的比例 在观测变量总离差平方和中,如果在观测变量总离差平方和中,如果SSASSA所占比例较大,则说明控制变所占比例较大,则说明控制变 量量A A是引起观测变量的变动主要因素之一,观测变量的变动可以部分的由是引起观测变量的变动主要因素之一,观测变量的变动可以部分的由 控制变量控制变量A A来解释,即控制变量来解释,即控制变量A A给观测变量带来了显著影响。对给观测变量带来了显著影响。对SSBSSB、 SSABSSAB同理。同理。 )1(, 1( ) 1(/ ) 1/( lkrkF MSE MSA lklSSE kSSA
37、FA )1(),1)(1( ) 1(/ ) 1)(1/( lkrrkF MSE MSAB lkrSSE RkSSAB FAB )1(, 1( ) 1(/ ) 1/( lkrrF MSE MSB lkrSSE rSSB FB 32 6.3.26.3.2多因素方差分析的数学模型多因素方差分析的数学模型 假设:控制变量假设:控制变量A A有有k k个水平,个水平,B B有有r r个水平。每个交叉个水平。每个交叉 水平下均有水平下均有l l个样本。那么在控制变量个样本。那么在控制变量A A的水平的水平 下下 和控制变量和控制变量B B的水平的水平 下的第下的第k k个样本值为个样本值为 式中式中 为抽
38、样误差,是服从正态分布为抽样误差,是服从正态分布 的的 独立随机变量。上式为多因素方差分析的饱和模型独立随机变量。上式为多因素方差分析的饱和模型 ,它是一个线性模型。,它是一个线性模型。 () (1,2, ;1,2, ,1,2,3, ) ijkijijijk xababik jr kl 2 N(0,) i A ijk j B 33 6.3.2 6.3.2 多因素方差分析的基本步骤多因素方差分析的基本步骤 提出原假设:各控制变量不同水平下观测变量各总体的均值提出原假设:各控制变量不同水平下观测变量各总体的均值 无显著差异,控制变量交互作用对观测变量无显著影响。无显著差异,控制变量交互作用对观测变
39、量无显著影响。 计算检验统计量和概率计算检验统计量和概率P P值值 l给定显著性水平与给定显著性水平与p p值做比较:如果值做比较:如果p p值小于显著性水平,则值小于显著性水平,则 应该拒绝原假设,反之就不能拒绝原假设。应该拒绝原假设,反之就不能拒绝原假设。 34 6.3.4 多因素方差分析的基本操作步骤多因素方差分析的基本操作步骤 在利用在利用SPSS进行多因素方差分析时,应首先将各个进行多因素方差分析时,应首先将各个 控制变量以及观测变量分别定义成多个控制变量以及观测变量分别定义成多个SPSS变量,并组变量,并组 织好数据再进行分析。织好数据再进行分析。 1、选择菜单、选择菜单Analy
40、zeGeneral Linear Model Univariate,出现主窗口。,出现主窗口。 2、把观测变量指定到、把观测变量指定到Dependent Variable框中。框中。 3、把固定效应的控制变量指定到、把固定效应的控制变量指定到Fixed Factor(s)框中,把框中,把 随机效应的控制变量指定到随机效应的控制变量指定到Random Factor(s)框中。框中。 至此,至此,SPSS将自动建立多因素方差分析的饱和模型将自动建立多因素方差分析的饱和模型 ,并计算各检验统计量的观测值和对应的概率,并计算各检验统计量的观测值和对应的概率p值,并将值,并将 结果显示到输出窗口中。结果
41、显示到输出窗口中。 35 36 6.3.4 多因素方差分析应用举例多因素方差分析应用举例 利用某企业不同广告形式在不同地区的广告效果(销利用某企业不同广告形式在不同地区的广告效果(销 售额)进行评估的数据,通过多因素方差分析方法对广告售额)进行评估的数据,通过多因素方差分析方法对广告 形式、地区、广告形式和地区的交互作用给销售额的影响形式、地区、广告形式和地区的交互作用给销售额的影响 进行分析,进而为制订广告和地区的最优宣传组合方案提进行分析,进而为制订广告和地区的最优宣传组合方案提 供依据。供依据。 这里,以广告形式和地区为控制变量,销售额为观测这里,以广告形式和地区为控制变量,销售额为观测
42、 变量,建立固定效应的饱和模型。零假设为:不同广告形变量,建立固定效应的饱和模型。零假设为:不同广告形 式没有对销售额产生显著影响;不同地区的销售额没有显式没有对销售额产生显著影响;不同地区的销售额没有显 著差异;广告形式和地区对销售额没有产生显著的交互影著差异;广告形式和地区对销售额没有产生显著的交互影 响。响。 37 6.3.5 多因素方差分析的进一步分析多因素方差分析的进一步分析 1、多因素方差分析的非饱和模型、多因素方差分析的非饱和模型 在饱和模型中,观测变量总的变差被分解为在饱和模型中,观测变量总的变差被分解为 控制变量独立作用、控制变量交互作用及随机误控制变量独立作用、控制变量交互
43、作用及随机误 差三部分(例:差三部分(例: SST=SSA+SSB+SSAB+SSE) 。如果研究。如果研究 发现,控制变量的某阶交互作用没有给观测变量发现,控制变量的某阶交互作用没有给观测变量 产生显著影响,那么可以尝试建立非饱和模型。产生显著影响,那么可以尝试建立非饱和模型。 区别在于将饱和模型中某些部分合并到区别在于将饱和模型中某些部分合并到SSE中,中, 例如两因素非饱和模型为:例如两因素非饱和模型为: SST=SSA+SSB+SSE 38 2、均值检验、均值检验 在在SPSS中,利用多因素方差分析功能还能够中,利用多因素方差分析功能还能够 对各个控制变量不同水平下的均值是否存在显著差
44、对各个控制变量不同水平下的均值是否存在显著差 异进行比较,实现方式有两种:多重比较检验(异进行比较,实现方式有两种:多重比较检验( Post Hoc)和对比检验()和对比检验(Contrast)。多重比)。多重比 较检验的方法与单因素方差分析类似,不再重复。较检验的方法与单因素方差分析类似,不再重复。 对比检验采用的是单样本对比检验采用的是单样本t检验的方法。检验的方法。 39 检验值可以指定一下几种:检验值可以指定一下几种: None:SPSS默认。不做对比分析;默认。不做对比分析; Deviation:表示以观测变量的总体均值为标准,比较各水:表示以观测变量的总体均值为标准,比较各水 平上
45、观测变量的均值是否有显著差异;平上观测变量的均值是否有显著差异; Simple:表示以第一水平或最后一个水平上的观测变量均:表示以第一水平或最后一个水平上的观测变量均 值为标准,比较各水平上的观测变量均值是否有显著差异;值为标准,比较各水平上的观测变量均值是否有显著差异; Diffeence:表示将各水平上观测变量均值与其前一个水平:表示将各水平上观测变量均值与其前一个水平 上的观测变量均值做比较;上的观测变量均值做比较; Helmert:表示将各水平上观测变量均值与其后一个水平:表示将各水平上观测变量均值与其后一个水平 上的观测变量均值做比较。上的观测变量均值做比较。 40 3、控制变量交互
46、作用的图形分析、控制变量交互作用的图形分析 控制变量的交互作用可以通过图形直观分析。如果控制变量的交互作用可以通过图形直观分析。如果 控制变量之间无交互作用,各水平对应的直线是近于平控制变量之间无交互作用,各水平对应的直线是近于平 行的;如果控制变量间存在交互作用,各水平对应的直行的;如果控制变量间存在交互作用,各水平对应的直 线会相互交叉。线会相互交叉。 4、模型分析、模型分析 这里模型分析的主要任务有三个:第一,利用多因这里模型分析的主要任务有三个:第一,利用多因 素方差分析模型计算观测变量预测值;第二,计算各种素方差分析模型计算观测变量预测值;第二,计算各种 残差值,评价模型对数据的拟合
47、程度;第三,对数据中残差值,评价模型对数据的拟合程度;第三,对数据中 的异常点进行诊断。的异常点进行诊断。 41 6.3.6 多因素方差分析中进一步分析的操作步骤多因素方差分析中进一步分析的操作步骤 1、建立非饱和模型的操作、建立非饱和模型的操作 SPSS多因素方差分析中默认建立的是饱和模型。如果希望建立非多因素方差分析中默认建立的是饱和模型。如果希望建立非 饱和模型,则应在主窗口中单击饱和模型,则应在主窗口中单击Model按钮,出现窗口:按钮,出现窗口: 42 默认的选项是默认的选项是Full factorial,表示饱和模型。此时,表示饱和模型。此时 Factors & Covariate
48、s框、框、Model框以及框以及Build Term(s) 下拉框均呈不可用状态;如果选择下拉框均呈不可用状态;如果选择Custom项,则表示建项,则表示建 立非饱和模型,且立非饱和模型,且Factors & Covariates框、框、Model 框以及框以及Build Term(s)下拉框均变为可用状态。此时便下拉框均变为可用状态。此时便 可自定义非饱和模型中的数据项。其中可自定义非饱和模型中的数据项。其中Interaction为交为交 互作用;互作用;Main effects为主效应;为主效应;All 2-way、All 3- way等表示二阶、三阶或更高阶交互作用。等表示二阶、三阶或更
49、高阶交互作用。 43 2、均值比较的操作、均值比较的操作 如果通过多因素方差分析得知某控制变量的不同水平对观测变量产如果通过多因素方差分析得知某控制变量的不同水平对观测变量产 生显著影响,进一步可对各水平间的均值进行比较。如果采用多重比较生显著影响,进一步可对各水平间的均值进行比较。如果采用多重比较 检验方法,则单击检验方法,则单击Post Hoc按钮,选择合适的多重比较检验方法。按钮,选择合适的多重比较检验方法。 44 如果采用对比检验方法,则单击如果采用对比检验方法,则单击Contrasts按钮,默认按钮,默认 是不进行对比检验(显示如是不进行对比检验(显示如x1(None);如果进行对比
50、);如果进行对比 检验,可展开检验,可展开Contrast后的下拉框,指定对比检验的检验后的下拉框,指定对比检验的检验 值,并单击值,并单击Change按钮完成指定。按钮完成指定。 45 3、控制变量交互作用图形分析的操作、控制变量交互作用图形分析的操作 如果希望通过图形直观判断控制变量间是否存在交互如果希望通过图形直观判断控制变量间是否存在交互 作用,则应在主窗口单击作用,则应在主窗口单击Plots按钮。首先选择一个控制按钮。首先选择一个控制 变量作为交互图形中的横轴,并将其选择到变量作为交互图形中的横轴,并将其选择到Horizontal Axis框中;其次,指定在交互图中各直线代表的是哪个
51、控框中;其次,指定在交互图中各直线代表的是哪个控 制变量的不同水平,并将其选择到制变量的不同水平,并将其选择到Separated Lines框中框中 ;最后,如果控制变量有三个,由于交互作用图只能反映;最后,如果控制变量有三个,由于交互作用图只能反映 两控制变量的交互情况,此时第三个变量只能选入两控制变量的交互情况,此时第三个变量只能选入 Separate Plots框中,第三个变量有几个水平便绘制出框中,第三个变量有几个水平便绘制出 几张交互图。几张交互图。 46 47 4、模型分析的操作、模型分析的操作 SPSS多因素方差模型建立完成后,可以在主窗口中单击多因素方差模型建立完成后,可以在主
52、窗口中单击 Save按钮对模型进行分析,并将分析结果以变量的形式存入按钮对模型进行分析,并将分析结果以变量的形式存入SPSS 数据编辑窗口中。其中,数据编辑窗口中。其中,Predicted Values框中的选项用来计算模框中的选项用来计算模 型的预测值;型的预测值;Residuals框中的各选项用来计算各种残差;框中的各选项用来计算各种残差; Diagnostics框实现异常值的诊断。各选项具体含义同回归分析。框实现异常值的诊断。各选项具体含义同回归分析。 48 6.3.7 多因素方差分析进一步分析应用举例多因素方差分析进一步分析应用举例 在前面的应用举例中对广告形式、地区对销售额的影响在前
53、面的应用举例中对广告形式、地区对销售额的影响 进行了多因素方差分析,建立了饱和模型。分析可知,广告进行了多因素方差分析,建立了饱和模型。分析可知,广告 形式和地区的交互作用不显著,可以进一步尝试建立非饱和形式和地区的交互作用不显著,可以进一步尝试建立非饱和 模型,并进行均值比较分析、交互作用图形分析。模型,并进行均值比较分析、交互作用图形分析。 49 6.4 协方差分析 6.4.16.4.1协方差分析的基本思想协方差分析的基本思想 无论是单因素方差分析还是多因素方差分析,控制变量是可以控制的无论是单因素方差分析还是多因素方差分析,控制变量是可以控制的 ,其各个水平可以通过人为努力得到控制和确定
54、。但是在实际问题中,有,其各个水平可以通过人为努力得到控制和确定。但是在实际问题中,有 些控制变量很难人为控制,但他们的不同水平确实对观测变量产生较为显些控制变量很难人为控制,但他们的不同水平确实对观测变量产生较为显 著的影响。比如:不同地块对农作物产量的影响。在方差分析中,如果忽著的影响。比如:不同地块对农作物产量的影响。在方差分析中,如果忽 略这些因素的存在而单纯去分析其他因素对观测变量的影响,往往会夸大略这些因素的存在而单纯去分析其他因素对观测变量的影响,往往会夸大 或缩小其他因素对观测变量的影响,使分析结论不准确。因此,为了更加或缩小其他因素对观测变量的影响,使分析结论不准确。因此,为
55、了更加 准确的研究控制变量不同水平对观测变量的影响,应尽量排除其他因素对准确的研究控制变量不同水平对观测变量的影响,应尽量排除其他因素对 分析结论的影响。分析结论的影响。 1 1、定义:协方差分析就是将那些很难人为控制的因素作为协变量,并在、定义:协方差分析就是将那些很难人为控制的因素作为协变量,并在 排除协变量对观测变量影响的条件下,分析控制变量对观测变量的影响,排除协变量对观测变量影响的条件下,分析控制变量对观测变量的影响, 从而更加准确的对控制变量进行分析。从而更加准确的对控制变量进行分析。 50 2 2、协方差分析的特点、协方差分析的特点 方差分析中的控制变量都是定性变量(包括定类和定
56、序变量),线性方差分析中的控制变量都是定性变量(包括定类和定序变量),线性 回归分析中的解释变量(自变量)都是定量变量。而协方差分析中的控制回归分析中的解释变量(自变量)都是定量变量。而协方差分析中的控制 变量是定性变量,而协变量一般是定量变量。所以说协方差分析是一种介变量是定性变量,而协变量一般是定量变量。所以说协方差分析是一种介 于方差分析和线性回归分析之间的分析方法。例如:在研究生猪的饲养问于方差分析和线性回归分析之间的分析方法。例如:在研究生猪的饲养问 题的协方差分析中,饲料是控制变量,生猪的初始体重是协变量。题的协方差分析中,饲料是控制变量,生猪的初始体重是协变量。 协方差分析中要求多个协变量之间无交互作用,且观测变量与协变量协方差分析中要求多个协变量之间无交互作用,且观测变量与协变量 之间有显著的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年电梯安全知识培训内容高频考点
- 2026年安全培训内容酒店重点
- 2026年知识体系小学开学安全培训内容
- 2026年城市海绵化改造项目融资合作合同
- 2026年儿童服装厂安全培训内容完整指南
- 哈密地区巴里坤哈萨克自治县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 西宁市城西区2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 昆明市石林彝族自治县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 2026年租房合同协议书 打印核心要点
- 双鸭山市友谊县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 四川省广元市高2026届第二次高考适应性检测数学+答案
- TSG08-2026《特种设备使用管理规则》全面解读课件
- 2026广东广州市黄埔区大沙街道招聘编外聘用人员4人备考题库及参考答案详解
- 《2026年化学制药企业安全风险防控专项工作方案》解读
- 2026新疆兵团第七师胡杨河市公安机关社会招聘辅警358人笔试备考试题及答案解析
- 企业车间绩效考核制度
- 医疗服务价格项目立项指南解读辅导2026
- 2026年江西赣州市高三一模高考数学试卷试题(含答案详解)
- 中兴新云逻辑测试题
- 全过程造价咨询服务的质量、进度、保密等保证措施
- 2025年四川省眉山市中考数学试卷
评论
0/150
提交评论