第二章方差分析_第1页
第二章方差分析_第2页
第二章方差分析_第3页
第二章方差分析_第4页
第二章方差分析_第5页
已阅读5页,还剩116页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Analysis of Variance,ANOVA第一节第一节 单因素方差分析单因素方差分析 (one-factor analysis of variance)一、一、一般概念及两种不同的处理效应一般概念及两种不同的处理效应 方差分析方差分析是一类特定情况下的统计假设是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一检验,或者说是平均数差异显著性检验的一种引伸。种引伸。t 检验可以判断两组数据平均数的检验可以判断两组数据平均数的差异的显著性,差异的显著性, 而方差分析则可以同时判断而方差分析则可以同时判断多组数据平均数之间的差异的显著性。当然,多组数据平均数之间的差异的显著性。

2、当然,在多组数据的平均数之间做比较时,可以在在多组数据的平均数之间做比较时,可以在平均数的所有对之间做平均数的所有对之间做 t 检验。但这样做会检验。但这样做会提高犯提高犯型错误的概率,因而是不可取的。型错误的概率,因而是不可取的。 例如,我们打算用一对一对地比较的方例如,我们打算用一对一对地比较的方法检验法检验5个平均数之间的相等性,共需检验个平均数之间的相等性,共需检验C2510对。假设每一对检验接受零假设的概对。假设每一对检验接受零假设的概率都是率都是10.95,而且这些检验都是独立,而且这些检验都是独立的,那么的,那么10 对都接受的概率是对都接受的概率是(0.95)100.60。10

3、.600.40,犯,犯型错误的概率明显型错误的概率明显增加。增加。 用方差分析的方法做检验可以防止上用方差分析的方法做检验可以防止上述问题的出现述问题的出现。方差分析的内容很广泛,上。方差分析的内容很广泛,上面讲到的那种情况是方差分析中最简单的情面讲到的那种情况是方差分析中最简单的情况,称为单因素方差分析或者称为一种方式况,称为单因素方差分析或者称为一种方式分组的方差分析分组的方差分析(one-way classification analysis of variance)。 例例 2.1调查了调查了5个不同小麦品系的株高,个不同小麦品系的株高,结果列于表结果列于表21。 在这个例子中,只出现

4、在这个例子中,只出现“品系品系”这样一个因这样一个因素素(factor),故称单因素。共有,故称单因素。共有5 个不同的品系,个不同的品系,我们称品系这一因素共有我们称品系这一因素共有5个水平个水平(level)。5个个品系可以认为是品系可以认为是5个总体,表个总体,表 24的数据是从的数据是从5个总体中抽出的个总体中抽出的5个样本,通过比较这个样本,通过比较这5个样本,个样本,判断这判断这5个总体是否存在差异。个总体是否存在差异。表表 21 5个小麦品系株高调查结果个小麦品系株高调查结果 例例 2.2 为了探讨不同窝的动物的出生为了探讨不同窝的动物的出生重是否存在差异,随机选取重是否存在差异

5、,随机选取4窝动物,每窝窝动物,每窝中均有中均有4只幼仔,结果如下:只幼仔,结果如下: 表表22 4窝动物的出生重(克)窝动物的出生重(克) 通过对以上数据的分析,判断不同窝别动物通过对以上数据的分析,判断不同窝别动物出生重是否存在差异。出生重是否存在差异。 以上两个例子的共同点是:每个实验都以上两个例子的共同点是:每个实验都只有一个因素,该因素有只有一个因素,该因素有a个水平或称为有个水平或称为有a个处理个处理(treatment),这样的实验称为单因素,这样的实验称为单因素实验。实验。 从单因素实验的每一处理所得到的结从单因素实验的每一处理所得到的结果都是一随机变量果都是一随机变量X i。

6、对于。对于a个处理,各重个处理,各重复复n次(或者说做次(或者说做n次观察)的单因素方差分次观察)的单因素方差分析的一般化表示方法见表析的一般化表示方法见表23 。表表 23单因素方差分析的典型数据单因素方差分析的典型数据 表中的数据表中的数据xij,表示第表示第 i 次处理下的第次处理下的第j次观察值。其中的次观察值。其中的n个符号做如下说明:个符号做如下说明:xanxxxaixnxxxainjijiiniiji1), 2 , 1(1111 用用“ ”表示下标的和,使用时很方便,表示下标的和,使用时很方便,在以后会经常遇到。在以后会经常遇到。 常用如下的所谓常用如下的所谓线性统计模型线性统计

7、模型(linear statistical model)描述每一个观察值:描述每一个观察值:) 12(, 2 , 1, 2 , 1njaixijiij其中:其中:xij 是在第是在第 i 水平(处理)下的第水平(处理)下的第 j 次观次观察值。察值。是对所有观察值的一个参量,称为是对所有观察值的一个参量,称为总总平均数平均数(overall mean)。i是仅限于对第是仅限于对第 i 次处次处理的一个参量,称为第理的一个参量,称为第i次次处理效应处理效应(treatment effect)。方差分析的目的,就是要检验处理效方差分析的目的,就是要检验处理效应的大小或有无。应的大小或有无。 ij是

8、随机误差成份。是随机误差成份。 上述模型中,包括两类不同的处理效应。上述模型中,包括两类不同的处理效应。第一类处理效应称为第一类处理效应称为固定效应固定效应(fixed effect),它是由它是由固定因素固定因素(fixed factor)所引起的效应。所引起的效应。若因素的若因素的a个水平是经过特意选择的,则该个水平是经过特意选择的,则该因素称为固定因素。例如,几个不同的实验因素称为固定因素。例如,几个不同的实验温度,几个不同的化学药物或一种药物的几温度,几个不同的化学药物或一种药物的几种不同浓度,几个作物品种以及几个不同的种不同浓度,几个作物品种以及几个不同的治疗方案和治疗效果等。治疗方

9、案和治疗效果等。 在这些情况中,因素的水平是特意选择在这些情况中,因素的水平是特意选择的,所检验的是关于的,所检验的是关于ai 的假设,得到的结论的假设,得到的结论只适合与方差分析中所考虑的那几个水平,只适合与方差分析中所考虑的那几个水平,并不能将其结论扩展到未加考虑的其它类似并不能将其结论扩展到未加考虑的其它类似水平上。所以上述的那些因素:温度、药物、水平上。所以上述的那些因素:温度、药物、品种等,称为固定因素。处理这样的因素所品种等,称为固定因素。处理这样的因素所用的模型称为用的模型称为固定效应模型固定效应模型(fixed effect model)。例)。例2.1中的中的5个小麦品系是特

10、意选择个小麦品系是特意选择的,目的是从这的,目的是从这5 个品系中,选出最优者,个品系中,选出最优者,因而因而“品系品系”这个因素属于固定因素,所用的这个因素属于固定因素,所用的模型是固定效应模型。模型是固定效应模型。 第二类处理效应称为第二类处理效应称为随机效应随机效应(ran-dom effect),它是由,它是由随机因素随机因素(random factor)所引起的效应。若因素的)所引起的效应。若因素的a 个水平,个水平,是从该因素全部水平的总体中随机抽出的样是从该因素全部水平的总体中随机抽出的样本,则该因素称为随机因素。从随机因素的本,则该因素称为随机因素。从随机因素的a 个水平所得到

11、的结论,可以推广到这个因个水平所得到的结论,可以推广到这个因素的所有水平上。处理随机因素所用的模型素的所有水平上。处理随机因素所用的模型称为称为随机效应模型随机效应模型(random effect mo-del)。例)。例2.2 的动物窝别,是从动物所有可的动物窝别,是从动物所有可能的窝别中随机选出来的,实验的目的是考能的窝别中随机选出来的,实验的目的是考查在窝别之间,出生重是否存在差异,因而查在窝别之间,出生重是否存在差异,因而“窝别窝别”是随机因素。是随机因素。 有时固定因素和随机因素很难区分,除有时固定因素和随机因素很难区分,除上述所讲的原则外,还可以从另一角度鉴别。上述所讲的原则外,还

12、可以从另一角度鉴别。固定因素固定因素是指因素水平,可以严格地人为控是指因素水平,可以严格地人为控制制。在水平固定之后,它的效应值也是固定。在水平固定之后,它的效应值也是固定的。例如,研究三种温度对胰蛋白酶水解产的。例如,研究三种温度对胰蛋白酶水解产物的影响。因为温度水平是可以严格控制的,物的影响。因为温度水平是可以严格控制的,即每一温度水平,在各个重复之间都可以准即每一温度水平,在各个重复之间都可以准确地控制在一个固定值上,所以在重复该实确地控制在一个固定值上,所以在重复该实验时,水解产物的产量也是固定的。简单地验时,水解产物的产量也是固定的。简单地说,在水平(不同温度)固定以后,其效应说,在

13、水平(不同温度)固定以后,其效应值(产量)也是固定的。因此,温度是固定值(产量)也是固定的。因此,温度是固定因素。因素。 随机因素随机因素的水平的水平是不能严格地人为控制是不能严格地人为控制的的,在水平确定之后,它的效应值并不固定。,在水平确定之后,它的效应值并不固定。例如,在研究不同农家肥施用量对作物产量例如,在研究不同农家肥施用量对作物产量的影响试验中,农家肥是因素,不同施用量的影响试验中,农家肥是因素,不同施用量是该因素的不同水平,作物的产量是它的效是该因素的不同水平,作物的产量是它的效应值。由于农家肥的有效成份很复杂,不能应值。由于农家肥的有效成份很复杂,不能像控制温度那样,将农家肥的

14、有效成份严格像控制温度那样,将农家肥的有效成份严格地控制在某一个固定值上。在重复试验时即地控制在某一个固定值上。在重复试验时即使施以相同数量的肥料,也得不到一个固定使施以相同数量的肥料,也得不到一个固定的效应值。即在因素的水平(施肥量)固定的效应值。即在因素的水平(施肥量)固定之后,它的效应值(产量)并不固定,因而之后,它的效应值(产量)并不固定,因而农家肥是一随机因素。农家肥是一随机因素。 二、二、 固定效应模型固定效应模型 在固定效应模型中,在固定效应模型中, i 是处理平均数与是处理平均数与总平均数的离差,且是个常量,因而总平均数的离差,且是个常量,因而 )22(01aiia 要检验要检

15、验a个处理效应的相等性,就要个处理效应的相等性,就要 i 判判断各是否等于断各是否等于0。若各。若各 i 都等于都等于0,则各处理效,则各处理效应之间无差异。因此,零假设为:应之间无差异。因此,零假设为: 0:210aH备择假设为:备择假设为: HA: i0(至少有至少有1个个i)。)。若若接受接受H0,则不存在处理效应,每个观察值都是则不存在处理效应,每个观察值都是由平均数加上随机误差所构成。若拒绝由平均数加上随机误差所构成。若拒绝H0,则则存在处理效应,每个观察值是由总平均数、处存在处理效应,每个观察值是由总平均数、处理效应和误差三部分构成。理效应和误差三部分构成。 方差分析的基本思想方差

16、分析的基本思想,就是将总的变差,就是将总的变差分解为构成总变差的各个部分。对单因素实分解为构成总变差的各个部分。对单因素实验,可以将总平方和(验,可以将总平方和(total sum of squa-res)做如下分解:)做如下分解: ainjainjainjiiiijiijainjiiijainjijxxxxxxxxxxxxxx111111221121122对于每个固定的对于每个固定的 xi , 01111njiijaiiainjiiijxxxxxxxx因此,因此, )32(11122112aiainjiijiainjijxxxxnxx(23)式表示度量全部数据变差的总平方和,可)式表示度量全

17、部数据变差的总平方和,可以分解为处理平均数与总平均数之间离差的平方以分解为处理平均数与总平均数之间离差的平方和,处理内部观察值与处理平均数之间离差的平和,处理内部观察值与处理平均数之间离差的平方和两部分。处理平均数与总平均数之间的离差,方和两部分。处理平均数与总平均数之间的离差,度量了处理之间的差异;而处理内部观察值与处度量了处理之间的差异;而处理内部观察值与处理平均数之间的离差,度量了随机误差的大小。理平均数之间的离差,度量了随机误差的大小。用用SST表示表示总平方和总平方和, )42(112ainjijTxxSS用用SSA表示(表示(23)等号右边第一项,称为)等号右边第一项,称为处理平处

18、理平方和方和(treatments sum of squares)或称为或称为处处理间平方和理间平方和(sum of squares between treatments)。)。)52(12aiiAxxnSS 用用SSe表示(表示(23)等号右边第二项,称为)等号右边第二项,称为误误差平方和差平方和(error sum of squares)或称为)或称为处理内平方和处理内平方和(sum of squares within treatments)。因此:)。因此: )62( eATSSSSSS自由度自由度可以做同样的分割:可以做同样的分割:SST具具an1自由度自由度dfTan1;A因素工有因

19、素工有a 水平,因而水平,因而SSA有有a1自由度自由度dfAa1;SSe有有ana自由度,这自由度,这是因为每一处理均有是因为每一处理均有n1自由度,共有自由度,共有a个处个处理,因而理,因而SS e的自由度为的自由度为ana,dfeana。为了估计为了估计s s2,用用SS e除以相应的自由度除以相应的自由度 MS e称为称为误差均方误差均方(error mean square)。)。 用类似的方法,可以求出处理均方用类似的方法,可以求出处理均方MSA(treatments mean square) )72( aanSSMSee)82(1aSSMSAA 用用MSA与与MS e比较,就可以反

20、映出比较,就可以反映出a i的大的大小。若小。若MSA与与MS e相差不大,就可以认为各相差不大,就可以认为各a i与与0的差异不大,或者说各的差异不大,或者说各m i之间差异不大。之间差异不大。若若MSA与与MS e超出很多,则认为各超出很多,则认为各 m i之间差异之间差异是显著的。为此,用是显著的。为此,用F单侧检验,具单侧检验,具dfA,dfe自自由度。由度。 当当FFa时,则可以认为时,则可以认为MSA与与MSe差异不差异不大,产生的变差是由随机误差造成的;接受零大,产生的变差是由随机误差造成的;接受零假设,处理平均数之间差异不显著。当假设,处理平均数之间差异不显著。当FFa时,拒绝

21、零假设,处理平均数间差异显著。时,拒绝零假设,处理平均数间差异显著。 以上所述可以归纳成方差分析表(以上所述可以归纳成方差分析表(table of variance analysis),见表),见表24。 )92( eASSMSF表表24 单因素固定效应模型方差分析表单因素固定效应模型方差分析表 其中的(其中的(x2n a)通常称为)通常称为校正项校正项(correc-tion),用),用C表示。表示。 )122(2naxC)112(1)102(122121111222aiiaiiAainjainjijijTnaxxnxxnSSnaxxxxSS在实际计算时,通常将在实际计算时,通常将SST和和

22、SSA写成下列形式:写成下列形式:误差平方和可由(误差平方和可由(213)式求出,)式求出, )132( ATeSSSSSS 现在用以上各式计算例现在用以上各式计算例2.1。在方差分析中,。在方差分析中,为了简化计算同样可以用编码法。方差分析的为了简化计算同样可以用编码法。方差分析的编码,必须将全部数据均减去同一个共同的数。编码,必须将全部数据均减去同一个共同的数。在例在例2.1中,每一个中,每一个xij都减去都减去65,列成下表,先,列成下表,先计算校正项计算校正项C 96.129555722naxC再计算再计算32.14796.12928.2771122112CxnaxxSSainjija

23、injijT58.1574.13132.14774.13196.129550.1308112ATeaiiASSSSSSCxnSS将以上结果列成方差分析表将以上结果列成方差分析表(见表见表25): 表表25 不同小麦品系株高方差分析表不同小麦品系株高方差分析表 * 0.01 当分子自由度为当分子自由度为4,分母自由度为,分母自由度为20时,时,F4,20,0.052.87,F4,20,0.014.43,FF0.01。因此,不同小麦品因此,不同小麦品系的株高差异极显著。习惯上用系的株高差异极显著。习惯上用“*”表示在表示在0.05水水平上差异显著,用平上差异显著,用“*”表示在表示在0.01水平上

24、差异显水平上差异显著,常常称为差异著,常常称为差异“极显著极显著”(highly significant)。)。 三、三、 随机效应模型随机效应模型 在实验中,经常回遇到某个因素有许多可在实验中,经常回遇到某个因素有许多可能的水平,若参加实验的能的水平,若参加实验的a个水平,是从该个水平,是从该因素的水平总体中随机选出的,那么这一因因素的水平总体中随机选出的,那么这一因素称为随机因素。其方差分析是通过随机选素称为随机因素。其方差分析是通过随机选取的取的a个水平对该因素的水平总体做推断。个水平对该因素的水平总体做推断。要求水平的总体是无暇总体,即使不是无限要求水平的总体是无暇总体,即使不是无限总

25、体,也应相当大,以至于可以认为是无限总体,也应相当大,以至于可以认为是无限总体。例总体。例2.2中动物的中动物的“窝窝”是随机因素,每一是随机因素,每一窝是一个水平,这种动物所有的窝构成一水窝是一个水平,这种动物所有的窝构成一水平总体。从该总体中随机选择平总体。从该总体中随机选择4个水平(个水平(4窝)窝)做实验,实验的目的是希望由这做实验,实验的目的是希望由这4窝动物去窝动物去推断该种动物所有不同的窝别之间幼仔出生推断该种动物所有不同的窝别之间幼仔出生重是否存在差异。重是否存在差异。 固定效应模型中固定效应模型中 i0的假设在这里不再的假设在这里不再适用。在随机模型中,对单个处理效应的检适用

26、。在随机模型中,对单个处理效应的检验是无意义的,所要检验的是关于验是无意义的,所要检验的是关于 i的变异的变异性的假设,因而,性的假设,因而, H0:s s 20HA:s s 2 0 如果接受如果接受H0:s s 20,则表示处理之间,则表示处理之间没有差异;若拒绝没有差异;若拒绝H0而接受而接受HA:s s 20,则,则表示处理之间存在差异,方差分析的做法仍表示处理之间存在差异,方差分析的做法仍然是将总平方和分解,然是将总平方和分解, )142( eATSSSSSS自由度做同样分解自由度做同样分解, eATdfdfdf 由此可得出由此可得出MSA和和MSe。然后用然后用F 单侧检验单侧检验(

27、具(具dfA ,dfe 自由度),自由度), )152( eAMSMSF 方差分析的程序与固定效应模型的方差分析方差分析的程序与固定效应模型的方差分析程序完全一样,但是结论不同。随机效应模型适程序完全一样,但是结论不同。随机效应模型适用于全部水平的总体,而固定效应模型只适用于用于全部水平的总体,而固定效应模型只适用于所选水平的总体。下面计算例所选水平的总体。下面计算例 2.2,并对结果加,并对结果加以解释。将表以解释。将表22中的每一个数值都减去中的每一个数值都减去30,列,列成下表,成下表, 945.118575.5852.177575.5884. 7466.265152.17784. 73

28、6.18584. 7162 .111211222ATeaiiAainjijTSSSSSSCxnSSCxSSanxC将上述结果列成方差分析表:将上述结果列成方差分析表: 表表26 动物出生重方差分析动物出生重方差分析 查表得知,查表得知,F3,12,0.053.49,因因FF0.05,所以差异不显著。通过对所以差异不显著。通过对4窝动物出生重的调窝动物出生重的调查,可以推断不同窝别动物的出生重没有显著查,可以推断不同窝别动物的出生重没有显著差异。差异。 四、四、 多重比较(多重比较(multiple comparison) 假设对一个固定效应模型经过方差分析之假设对一个固定效应模型经过方差分析之

29、后,结论是拒绝后,结论是拒绝H0,处理之间存在差异。但,处理之间存在差异。但这并不说在每对处理之间多存在差异。为了这并不说在每对处理之间多存在差异。为了弄清究竟在哪些对之间存在显著差异,哪些弄清究竟在哪些对之间存在显著差异,哪些对之间无显著差异,必须在个处理平均数之对之间无显著差异,必须在个处理平均数之间一对一对地做比较,这就是多重比较。多间一对一对地做比较,这就是多重比较。多重比较的方法很多,这里只介绍重比较的方法很多,这里只介绍LSD法和法和Duncan法。法。 LSD称为称为最小显著差数最小显著差数(least significant difference),它的计算方法简述如下。),它

30、的计算方法简述如下。 对于任意两组数据的平均数,差数(对于任意两组数据的平均数,差数(x1x2)的差异显著性检验,可以用成组数据)的差异显著性检验,可以用成组数据 t 检验,检验, 2121211121nnMSSxxSxxtexx当当n1n2时时 nMSSexx221 其中其中MSe为误差均方,为误差均方,n为每一处理的观为每一处理的观察次数,于是察次数,于是 nMSxxte221具具anana a自由度,当自由度,当t tt t0.050.05时差异显著,当时差异显著,当 t tt t0.010.01时差异极显著。因此,当差异显著时时差异极显著。因此,当差异显著时 05. 0212tnMSx

31、xe并可得到,当并可得到,当)162(205. 021nMStxxe时差异显著。时差异显著。t0.052MSen 称为称为最小显著差数最小显著差数,记为记为 LSD。每一对平均数的差与每一对平均数的差与LSD比较,当比较,当x1x2 LSD时,差异显著;否则差异不显时,差异显著;否则差异不显著。著。 LSD是一种很有用的检验方法,计算起来很是一种很有用的检验方法,计算起来很方便,也容易比较。但是它有难以克服的缺点,方便,也容易比较。但是它有难以克服的缺点,即这种比较方法将会加大即这种比较方法将会加大型错误的概率。型错误的概率。 为了克服上述缺点,为了克服上述缺点,Duncan(1955)提出)

32、提出了了Duncan多范围检验多范围检验(Duncan multiple test)。检验方法如下:)。检验方法如下: 首先,将需要比较的首先,将需要比较的a个平均数依次排列个平均数依次排列好,使之好,使之 axxx21并将每一对并将每一对 x 之间的差(范围)列成下表之间的差(范围)列成下表 注:表中的注:表中的 x 均为均为 x Duncan检验与检验与LSD的一个明显不同是的一个明显不同是Duncan检验中,不同对平均数的差有不同的检验中,不同对平均数的差有不同的临界值临界值Rk 。 )172(, 3 , 2,akSrRxak其中其中)182( nMSSex rara(k ,df)的值可

33、以从附表)的值可以从附表“多重多重比较中的比较中的Duncan表表”中查出:表的最左边一中查出:表的最左边一列是误差自由度列是误差自由度df a(n1),最上一列),最上一列为为k值,表体为值,表体为ra (k, df )。表中的。表中的 k 值是相比值是相比较的两个平均数之间所包含的平均数的个数。较的两个平均数之间所包含的平均数的个数。如两个要比较的平均数相邻时如两个要比较的平均数相邻时k2,两个要,两个要比较的平均数中间隔一个平均数时比较的平均数中间隔一个平均数时k3,依,依此类椎。因为平均数共有此类椎。因为平均数共有a个,所以需查出个,所以需查出a一一1个个ra ,分别乘以,分别乘以S,

34、得:,得: xxaxaaxaaSdfraRSdfrRSdfarRSdfarR, 2, 3, 1,231 先从表的第一行最左边的一个差先从表的第一行最左边的一个差x1xa开始比较。开始比较。若若x1xa Ra ,则则x1与与xa的差异显著;否则差异不显著,的差异显著;否则差异不显著,然后比较下一个。若然后比较下一个。若x1xa1 R a一一1,则,则x1与与xa1差异显差异显著,否则差异不显著,著,否则差异不显著, 。第一行比较完之后用同样的。第一行比较完之后用同样的方法比较第二行。先从第二行最左边的一个差方法比较第二行。先从第二行最左边的一个差x2xa开始,开始,在在x2到到xa这个范围内共包

35、含这个范围内共包含a1个平均数,因此个平均数,因此x2xa应应与与R a1比较,若比较,若x2xaR a1 ,则差异显著,否则不显则差异显著,否则不显著,著,。第二行比较完再比较第三行,第四行,。第二行比较完再比较第三行,第四行, 。直。直到所有平均数的差均与其相应的到所有平均数的差均与其相应的R k比较完为止。对于显比较完为止。对于显著的标上著的标上“*”,极显著的标上,极显著的标上“* *”。 下面比较例下面比较例2.1中各平均数的差数。首先中各平均数的差数。首先将各平均数按次序排列好。将各平均数按次序排列好。 品系号品系号 V III I II 平均数平均数 70.8 68.6 67.3

36、 65.3 64.4 顺序号顺序号 1 2 3 4 5 再列成下表再列成下表注:表中的注:表中的 x 应是应是 x 临界值也列成表格。表临界值也列成表格。表25已给出,误已给出,误差均方差均方MSe 0.78,n5,于是,于是, 395. 0578. 0 xS对于对于k2,3,4,5,df a(n一一1)5(51)20,分别求出,分别求出r 0.05 和和r 0.01的的Rk值并列成表:值并列成表: 首先用首先用0.05水平做检验。水平做检验。x1x5与与R5 ,比较,比较x1x56.4R51.28,因此,因此x1与与x5差异是显著的,在差异是显著的,在6.4上打一个上打一个“*”。x1 xR

37、,在,在5.5上打一个上打一个“*”, 第一行全部第一行全部是显著的。然后比较第二行。是显著的。然后比较第二行。x2x54.2R41.256,第二行也都是显著的。第三,第二行也都是显著的。第三行的两对也都是显著的。只行的两对也都是显著的。只x4与与x5的差不显的差不显著。对于显著的差数再以著。对于显著的差数再以0.01的水平做检的水平做检验。除验。除x2x3之外,全都达到极其显著,对之外,全都达到极其显著,对于极其显著的标上两个于极其显著的标上两个“*”。以上全部工作。以上全部工作完成之后,便可一眼看出两两平均数之间的完成之后,便可一眼看出两两平均数之间的差异的显著程度。差异的显著程度。 五、

38、五、 方差分析应具备的条件方差分析应具备的条件 1 可加性可加性:每个处理效应与误差效应是可:每个处理效应与误差效应是可加的,加的,xijiij。为总体平均数,为总体平均数,i为为第第 i 处理效应,处理效应,ij 为误差效应。由于有这一为误差效应。由于有这一假定,不同的效应才能被分解,才能最终判假定,不同的效应才能被分解,才能最终判断处理效应是否比误差笋应更显著。断处理效应是否比误差笋应更显著。 2 正态性正态性:实验误差应当是服从正态分:实验误差应当是服从正态分布布N(0,2)的独立随机变量。若实验误差)的独立随机变量。若实验误差之间可能存在某些关联时,可以采用随机化之间可能存在某些关联时

39、,可以采用随机化的方法破坏。的方法破坏。 3 方差齐性方差齐性:各处理的误差方差应具备齐:各处理的误差方差应具备齐性,它们有一个公共的总体方差性,它们有一个公共的总体方差2,或者说,或者说各处理的总体方差必须一致。一般来说,在各处理的总体方差必须一致。一般来说,在方差分析之前,应先做方差齐性检验。方差分析之前,应先做方差齐性检验。 对于生物学数据来说,大多数都能满足对于生物学数据来说,大多数都能满足以上要求,有时也可能不能满足的。所以,以上要求,有时也可能不能满足的。所以,在方差分析前,应先做方差齐性检验。如果在方差分析前,应先做方差齐性检验。如果有些条件不能满足,就需要对数据做适当的有些条件

40、不能满足,就需要对数据做适当的变换后再分析。数据变换将在第四节中讲述。变换后再分析。数据变换将在第四节中讲述。 六、多个方差齐性的检验六、多个方差齐性的检验(test for homogeneity of several variances) 方差分析的一个重要条件,就是各处理方差分析的一个重要条件,就是各处理组的总体方差必须一致。因此在做方差分析组的总体方差必须一致。因此在做方差分析之前,首先要对以下假设做检验。之前,首先要对以下假设做检验。 H0:s s21s s22s s2a HA:至少有两个至少有两个s s2i不相等不相等 对于多个方差的齐性做检验,用得最广对于多个方差的齐性做检验,用

41、得最广泛的是泛的是Bartlett检验法。检验法。Bartlett检验法的基本检验法的基本原理是:当原理是:当a个随机样本是从独立正态总体中个随机样本是从独立正态总体中抽取时,可以计算出统计量抽取时,可以计算出统计量K2。当。当nmin ni充分大时(充分大时(n3),),K2的抽样分布非常接近的抽样分布非常接近于于a一一1自由度的自由度的2分布。检验的统计量:分布。检验的统计量: )192(3026. 22cqK其中其中aNSnSaNnacSnSaNqiaiipaiiiaiip212111212111311lg1lg S2i(i1,2, ,a)是第)是第i个总体的样本个总体的样本方差,方差,

42、N是所有测定值的个体数目,是所有测定值的个体数目,a是样本是样本数目,数目,ni是第是第i个样本的重复次数。当样本方个样本的重复次数。当样本方差差S2i变异很大时,变异很大时,q值也很大;当值也很大;当S2i相等时,相等时,q值等于值等于0。因此,当。因此,当K2值相当大,以至于值相当大,以至于 K22a一一1,a时,拒绝时,拒绝H0,接受,接受HA,方差,方差不具有齐性;不具有齐性; K22a一一1,a时,接受时,接受H0,拒绝,拒绝HA,方差,方差具有齐性。具有齐性。 已经证明,当满足正态性的假设时,已经证明,当满足正态性的假设时,Bartlett检验是很敏感的。在正态性假设不能检验是很敏

43、感的。在正态性假设不能满足时,不能使用满足时,不能使用Bartlett检验。检验。 下面用下面用Bartlett检验法,检验例检验法,检验例2.1中几个方差中几个方差的齐性。先计算每个处理的方差(的齐性。先计算每个处理的方差(S2i),得:),得:62. 21 . 125. 13026. 21 . 120145)4)(3(1125. 1)815. 0lg4565. 1lg4745. 0lg4400. 0lg4370. 0lg4(78. 0lg2078. 020)815. 0(4)565. 1 (4)745. 0(4)400. 0(4)370. 0(4815. 0,565. 1,745. 0,4

44、00. 0,370. 0222524232221KcqSSSSSSpc c24,0.059.49, K2c c20.05 。结论是不能拒绝结论是不能拒绝H0,因因而方差具有齐性。而方差具有齐性。 当各处理样本含量相同时,(当各处理样本含量相同时,(2.19)式)式可简化为可简化为) 1(311)lglg)(1(3026. 211222naaccssanKaii 经经Bartlett检验发现各处理组之间的方差检验发现各处理组之间的方差不具齐性时需经适当变换,使之满足方差齐不具齐性时需经适当变换,使之满足方差齐性这一条件,然后再做方差分析。具体变换性这一条件,然后再做方差分析。具体变换方法将在后面

45、介绍。方法将在后面介绍。第二节第二节 两因素的方差分析两因素的方差分析(two-factors analysis of variance)或两种方式分组的方或两种方式分组的方差分析差分析(two-way classification analysis of variance) 一、一、 模型的类型及交互作用的概念模型的类型及交互作用的概念 在实际工作中,经常会遇到两种或两种以上在实际工作中,经常会遇到两种或两种以上的因素,共同影响实验结果的情况。例如,一组的因素,共同影响实验结果的情况。例如,一组病人同时服用两种药物,每一种药物又有不同的病人同时服用两种药物,每一种药物又有不同的剂量(水平),

46、如剂量(水平),如A药物有药物有5个水平,个水平,B药物有药物有3个个水,共有水,共有5315个剂量水平。需要个剂量水平。需要15名病人参名病人参加实验,每人接受一种水平组合,象这样的分组加实验,每人接受一种水平组合,象这样的分组方式称为方式称为交叉交叉(cross)分组。)分组。 上面讲过,因素可分作固定因素和随机上面讲过,因素可分作固定因素和随机因素。在两因素实验中,因素。在两因素实验中,当两个因素都是固当两个因素都是固定因素时定因素时,称为,称为固定模型固定模型(fixed model););两个因素均为随机因素时两个因素均为随机因素时,称为,称为随机模型随机模型(random mode

47、l););一个因素是固定因素,一个因素是固定因素,另一个因素是随机因素时另一个因素是随机因素时,称为,称为混合模型混合模型(mixed model)。这三种模型虽然在计算)。这三种模型虽然在计算方法上没有多大不同,但在检验以及对结果方法上没有多大不同,但在检验以及对结果解释上却截然不同。尤其是在两因素之间存解释上却截然不同。尤其是在两因素之间存在交互作用时,不同类型模型的区别就更明在交互作用时,不同类型模型的区别就更明显。为了下面叙述方便,介绍主效应与交互显。为了下面叙述方便,介绍主效应与交互作用两个基本概念。作用两个基本概念。 由于因素水平的改变而造成因素效应的由于因素水平的改变而造成因素效

48、应的改变,称为该因素的主效应(改变,称为该因素的主效应(main effect)。)。例如有下面一组实验,例如有下面一组实验,A因素有两个水平,因素有两个水平,A1和和A2 ;B因素也有两个水平,因素也有两个水平,B1和和B2 。当。当A因素从第一个水平变化到第二个水平时,因素从第一个水平变化到第二个水平时,A因素的主效应为因素的主效应为A2水平的平均效应减去水平的平均效应减去A1水水平的平均效应。平的平均效应。 623818244242221112212BABABABAA同样,同样,B因素的主效应:因素的主效应: 2022418244382212112221BABABABAB若若A、B之间不

49、存在交互作用,则之间不存在交互作用,则 22212211BABABABA 有时会发现,某一因素在另一因素的不同水有时会发现,某一因素在另一因素的不同水平上所产生的效应不同。例如:平上所产生的效应不同。例如: A(在(在B1水平上)水平上)A2BA1B1281810A(在(在B2水平上)水平上)A2B2A1B222308 可以明显看出:可以明显看出:A的效应依的效应依B的水平而的水平而不同。这时我们说:在不同。这时我们说:在A和和B因素见存在交互因素见存在交互作用。交互作用的大小可用作用。交互作用的大小可用12212211BABABABA来估计。上例的来估计。上例的A、B间的交互作用:间的交互作

50、用:AB1822302818。有时交互作用相当大,因素有时交互作用相当大,因素的主效应相对来说变得相当小。在上面例子中,的主效应相对来说变得相当小。在上面例子中,A因素的主效应:因素的主效应:A(2822)2(1830)21,与交互作用的绝对值与交互作用的绝对值18相比已经相当小,相比已经相当小,这时可认为不存在主效应。这时可认为不存在主效应。 当因素间存在交互作用时,对因素间交当因素间存在交互作用时,对因素间交互作用的了解比只了解因素的主效应重要得互作用的了解比只了解因素的主效应重要得多。因此,在两因素方差分析中,分解出因多。因此,在两因素方差分析中,分解出因素的交互作用十分必要。两因素间是

51、否存在素的交互作用十分必要。两因素间是否存在交互作用,有专门的统计判断方法,一般情交互作用,有专门的统计判断方法,一般情况下,可以根据专业知识判断。另外,做图况下,可以根据专业知识判断。另外,做图法也能提供一些帮助。将上面两表的数据,法也能提供一些帮助。将上面两表的数据,可以做以下两图(图可以做以下两图(图21)。)。 B2B1A1A2B1B2A1A2a. 不存在交互作用不存在交互作用b. 存在交互作用存在交互作用图图21 因素间交互作用的图示因素间交互作用的图示 当当A、B之间不存在交互作用时,从之间不存在交互作用时,从B1变化到变化到B2是不依是不依A水平的不同而变化,所以水平的不同而变化

52、,所以B1B1,B2B2两线平行。当存在交互作用两线平行。当存在交互作用时,的效应依的水平而不同,所以时,的效应依的水平而不同,所以B1B1,B2B2两线不平行。直观图可以帮助判两线不平行。直观图可以帮助判断因素之间是否存在交互作用,但在处理数断因素之间是否存在交互作用,但在处理数据时只凭图象是不行的,需要经过严格的数据时只凭图象是不行的,需要经过严格的数据分析之后,才能最后断定。据分析之后,才能最后断定。 两因素实验的典型设计两因素实验的典型设计是:假定是:假定A因素有因素有a水平,水平,B因素有因素有b水平,则每一次重复都包水平,则每一次重复都包括括ab次实验,并设实验重复次数次实验,并设

53、实验重复次数n次,次,ijk表表示示A因素的第因素的第i水平,水平,B因素第因素第j水平和第水平和第k次重次重复的观察值。数据将以下表的形式出现。复的观察值。数据将以下表的形式出现。 表表27中中A和和B可以是固定因素,也可以可以是固定因素,也可以是随机因素,因而引出三种不同的统计模型。是随机因素,因而引出三种不同的统计模型。 表表27 两因素交互分组实验的一般格式两因素交互分组实验的一般格式 表表27中的各种符号做如下说明:中的各种符号做如下说明:c ci表示表示A因素第因素第i水平的所有观察值的和;水平的所有观察值的和;c cj表示表示B因素第因素第j水平的所有观察值的和;水平的所有观察值

54、的和;c cij表示表示A的的第第i水平和水平和B的第的第j水平的所有观察值的和;水平的所有观察值的和;c c表示所有观察值的综合。用公式表示为:表示所有观察值的综合。用公式表示为: ainkjjijkjbjnkiiijkibjanxxxxaibnxxxx1111, 2 , 1, 2 , 1,aibjnkijknkijijijkijabnxxxxbjainxxxx1111, 2 , 1, 2 , 1,二、二、 固定效应模型固定效应模型 1. 有重复实验时有重复实验时 有重复实验时,观察值可以以下线性统有重复实验时,观察值可以以下线性统计模型描述:计模型描述:)202(, 2 , 1, 2 ,

55、1, 2 , 1nkbjaixijkijjiijk其中,其中, 是总体效应;是总体效应; i是是A因素第因素第i水平的真正水平的真正效应;效应; j是是B因素第因素第j水平的真正效应;(水平的真正效应;()i j是在是在 i和和 j之间的交互作用的效应;之间的交互作用的效应; i j k是随机误是随机误差成份。当两因素均为固定因素时,各处理效应差成份。当两因素均为固定因素时,各处理效应是距总平均效应的离差。因此,是距总平均效应的离差。因此, )222(0)212(011bjjaii交互作用的效应也是固定的,交互作用的效应也是固定的, )232(011bjijaiij ij是相互独立且服从是相互

56、独立且服从N(0,s s2)的随机变量的随机变量 (224)因实验共有因实验共有n次重复,所以实验的总次数为次重复,所以实验的总次数为abn次。次。 交互分组两因素固定效应模型的方差分交互分组两因素固定效应模型的方差分析的零假设为:析的零假设为: )272(, 2 , 1, 2 , 1, 0:)262(0:)252(0:0321022101bjaiHHHijba方差分析的基本思想仍然是将总平方和分解。方差分析的基本思想仍然是将总平方和分解。 )282(1112111212211121112aibjnkijijkaiaibjjiijbjjiaibjnkijijkjiijjiaibjnnijkxx

57、xxxxnxxanxxbnxxxxxxxxxxxx 于是,总平方和可分解为:由于于是,总平方和可分解为:由于A因素因素所引起的平方和所引起的平方和SSA ,B因素所引起的平方和因素所引起的平方和SSB,A、B交互作用所引起的平方和交互作用所引起的平方和SSAB及及误差平方和误差平方和SSe 。分别是:。分别是: )322()312()302()292(111221212aibjnkijijkejiijABbjjBaiiAxxSSxxxxnSSxxanSSxxbnSS 从从(232)式可以看出,为了得到误差平式可以看出,为了得到误差平方和,至少要重复两次。有了误差平方和,方和,至少要重复两次。有

58、了误差平方和,才能把误差与交互作用分解开。才能把误差与交互作用分解开。 与每一平方和所相应的自由度为:与每一平方和所相应的自由度为: A a1 B b1 AB交互作用交互作用 (a1)()(b1) 误差误差 ab(n1) 总和总和 abn1 其中总自由度、其中总自由度、A因素自由度和因素自由度和B因素自因素自由度比较简单,分别为由度比较简单,分别为abn1,a和和b1。交互作用的自由度,是两个因素全部水平的交互作用的自由度,是两个因素全部水平的组合数减组合数减1,再减,再减A、B主效应自由度,即(主效应自由度,即(ab1)(a1)(b1)()(a1)(b1)。误差自由度在每一因素组合内是)。误

59、差自由度在每一因素组合内是 n1,共有,共有ab种组合,故为种组合,故为ab(n1)。各项)。各项的均方分别为:的均方分别为:) 1(,) 1)(1(1,1nabSSMSbaSSMSbSSMSaSSMSeeABABBBAA两因素固定模型方差分析表如下:两因素固定模型方差分析表如下:表表28 固定模型方差分析表(因素固定模型方差分析表(因素A、B固定型)固定型) 实际计算时,可按下述方式进行。实际计算时,可按下述方式进行。 )352(1)342(1)332(12212211122bjjBaiiAaibjnkijkTabnxxanSSabnxxbnSSabnxxSS其中其中c c2abn称为校正项

60、,用称为校正项,用C表示。表示。 为了得到为了得到SSAB需分两步计算。首先,由重需分两步计算。首先,由重复间的平均数,求出次总平方和(复间的平均数,求出次总平方和(subtotal sum of squares)SSST, )362(11212aibjijSTabnxxnSS这一平方和由三部分构成:这一平方和由三部分构成: ABBASTSSSSSSSS由此可以得出,由此可以得出,AB交互作用平方和交互作用平方和SSAB, )372( BASTABSSSSSSSS而而 )382( STTeSSSSSS 另一种计算交互作用平方和的方法,是通另一种计算交互作用平方和的方法,是通过计算重复间平方和得

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论