第六章方差分析PPT课件_第1页
第六章方差分析PPT课件_第2页
第六章方差分析PPT课件_第3页
第六章方差分析PPT课件_第4页
第六章方差分析PPT课件_第5页
已阅读5页,还剩97页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章第六章 方差分析方差分析 方差分析的基本原理和分析步骤方差分析的基本原理和分析步骤 系统分组资料的方差分析系统分组资料的方差分析 方差分析的数学模型与基本假定方差分析的数学模型与基本假定一、为什么要学习方差分析? 前面学习了两个样本平均数的假设前面学习了两个样本平均数的假设测验,该法只测验,该法只适用于比较两个试验处适用于比较两个试验处理的优劣理的优劣。对于多个平均数间差异显。对于多个平均数间差异显著性测验,如仍采用上章学习的方法,著性测验,如仍采用上章学习的方法,就会表现出如下一些问题:就会表现出如下一些问题: 若进行若进行5个样本平均数的差异显著性比较,则个样本平均数的差异显著性比较

2、,则需进行需进行10次两两均数差异显著性测验,次两两均数差异显著性测验,H0: 1= 2 , 1= 3 , 1= 4 , 1= 5; 2= 3 , 2= 4 , 2= 5; 3= 4 , 3= 5; 4= 5 .因此因此 当样本平均数的个数当样本平均数的个数k3时,采用上章学习的时,采用上章学习的方法进行差异显著性测验,工作量是相当大的。方法进行差异显著性测验,工作量是相当大的。1.计算麻烦计算麻烦 两个样本平均数比较采用两个样本平均数比较采用t测验,测验,=0.05时时犯第一类错误的概率为犯第一类错误的概率为0.05, 推断的可靠性为推断的可靠性为1- =0.95。 若对若对5个处理采用个处

3、理采用t测验进行比较,测验进行比较, =0.05, 需进行需进行10次两两比较,每次比较的可靠性为次两两比较,每次比较的可靠性为1- =0.95 , 要求要求10次都正确的概率为次都正确的概率为(1- )10 = 0.9510=0.5987, 因此推断的可靠性由因此推断的可靠性由0.95降降到到0.5987, 犯第一类错误的概率则由犯第一类错误的概率则由0.05上升上升到(到(1-0.5987)=0.4013.2.推断的可靠性降低推断的可靠性降低 ,犯犯 错误的概率增大错误的概率增大 采用采用t测验法,每次只能利用两组观察值测验法,每次只能利用两组观察值估计试验误差,与利用全部观察值估计的试估

4、计试验误差,与利用全部观察值估计的试验误差相比,精确性低,误差的自由度也低,验误差相比,精确性低,误差的自由度也低,从而使检验的灵敏度也降低,容易掩盖差异从而使检验的灵敏度也降低,容易掩盖差异的显著性,增大犯第二类错误的可能。的显著性,增大犯第二类错误的可能。 3.误差估计的精确性和检验的灵敏性降低误差估计的精确性和检验的灵敏性降低譬如,有譬如,有5个处理,每个处理重复个处理,每个处理重复6次,共次,共有观察值有观察值30个,若进行个,若进行t测验每次只利用测验每次只利用12个观察值,误差的自由度为个观察值,误差的自由度为2(6-1)=10,若利用若利用30个观察值估计试验误差,误差自个观察值

5、估计试验误差,误差自由度为由度为5(6-1)=25。自由度越小,标准差自由度越小,标准差越大,灵敏度低;自由度越大,标准差越越大,灵敏度低;自由度越大,标准差越小,灵敏度高。小,灵敏度高。 因此对多个处理平均数进行差异显著性测验,不宜采用t测验,而需采用一种新的统计方法方差分析法。1、方差的概念:、方差的概念:2、方差分析的概念:、方差分析的概念: 变异原因的数量分析变异原因的数量分析 将试验数据的总变异分解为不同来源将试验数据的总变异分解为不同来源的变异,从而评定不同变异来源的相对重要的变异,从而评定不同变异来源的相对重要性的一种统计方法。性的一种统计方法。二、方差分析的基本原理将将k个样本

6、的观察值和平均数作为一个整体加个样本的观察值和平均数作为一个整体加以考虑,把观察值总变异的自由度和平方和分以考虑,把观察值总变异的自由度和平方和分解为度量不同变异来源的自由度与平方和,进解为度量不同变异来源的自由度与平方和,进而获得不同来源的总体方差的估计值,计算这而获得不同来源的总体方差的估计值,计算这些估计值的适当比值,并测验假设些估计值的适当比值,并测验假设H0:1= 2= k3、方差分析的基本原理:、方差分析的基本原理:三、方差分析的作用三、方差分析的作用1、在单因素试验中,可以分辨出最、在单因素试验中,可以分辨出最 优的水平。优的水平。2、在多因素试验中,可以分辨出最、在多因素试验中

7、,可以分辨出最 优的水平组合优的水平组合 6.1方差分析的基本原理 设有设有k个处理,每个处理有个处理,每个处理有n个观个观察值,则共有察值,则共有nk个观察值,其数据个观察值,其数据结构和符号如表结构和符号如表6.1。一、数据结构与变异来源的分解一、数据结构与变异来源的分解表表6.1 K个处理个处理n个观察值的符号表个观察值的符号表处理处理 1 2 i k 1 x11 x21 xi1 xk1 2 x12 x22 xi2 xk2 : : : : : j x1j x2j xij xkj : : : : : n x1n x2n xin xkn总和总和 T1 T2 Ti Tk平均平均 均方均方 1x

8、2xixkx21s22s2is2ksknxxTxTijiij每一个观察值可以用如下数学式表示:每一个观察值可以用如下数学式表示:ijiijetxx处理间变异处理间变异i=(i- )处理内变异处理内变异ij=( xij- i) 由此可推知由此可推知 : nk个观察值的总变异可分解个观察值的总变异可分解为处理间的变异和处理内的变异两部分。为处理间的变异和处理内的变异两部分。ijiijx总体符号总体符号样本符号样本符号二、自由度与平方和的分解二、自由度与平方和的分解 1、总平方和 由表由表6.1可以看出,可以看出,nk个观察值的变异个观察值的变异构成了整个资料的总变异,构成了整个资料的总变异,总变异

9、的平方总变异的平方和和等于各个观察值与总平均数的离差平方等于各个观察值与总平均数的离差平方和,即和,即nkTxxxssijijT222)((一)(一)平方和的分解平方和的分解(6.2)处理间的平方和处理间的平方和乃各处理的平均数的乃各处理的平均数的变异,即变异,即nkTTnxxnssiit222)(1)(6.5)2、处理间平方和3、处理内(误差)平方和 处理内的平方和处理内的平方和乃各组的乃各组的n个观察值与其个观察值与其相应平均数的离差平方和,即相应平均数的离差平方和,即对于处理对于处理1:对于处理对于处理2:对于处理对于处理k:nTxxxssnTxxxssnTxxxsskkjkkjkjjj

10、j2222222222221212111)()()( 由于同一处理内的差异属偶然由于同一处理内的差异属偶然因素造成,因而,因素造成,因而,ss1、ss2、 、ssk都属于随机误差平方和,将其合都属于随机误差平方和,将其合并得全试验处理内的平方和:并得全试验处理内的平方和:nTxxxssssssssinkijkniijke21221121)(6.3)(二)(二) 自由度的分解自由度的分解1、总变异的自由度:、总变异的自由度:dfT=nk-12、处理间的自由度:、处理间的自由度:dft=k-13、各处理的自由度各处理的自由度 处理处理1(第(第1组):组):df1=n-1 处理处理2 (第第2 组

11、组) :df2=n-1 : 处理处理 k (第第k组):组):dfk=n-1 整个资料处理内(即误差项)自由度为: dfe=df1+df2+dfk=k(n-1) 由上述分析可知,整个资料的变异来源由上述分析可知,整个资料的变异来源可分为:可分为:处理间处理间和和处理内处理内两个部分。因此,两个部分。因此, 总平方和总平方和=处理间平方和处理间平方和+处理内平方和处理内平方和 SST = SSt+ SSe 总自由度总自由度=处理间自由度处理间自由度+处理内自由度处理内自由度 dfT = dft + dfe 于是,于是, 处理间均方:处理间均方: 处理内均方:处理内均方: 总变异均方:总变异均方:

12、TTTTeeeettttdfSSSMSdfSSSMSdfSSSMS222注意eTMSMSMSt222212kessss)(1222212kesssks 表表6.2 表表6.1资料的方差分析资料的方差分析变异来源变异来源 DF SS MS F 处理间处理间 k-1 SSt MSt MSt/MSe 处理内处理内 k(n-1) SSe MSe 总变异总变异 kn-1 SST方差分析中,通常将方差分析中,通常将T2/nk , 称为校正项,称为校正项,记为记为 : C=T2/nk 【例【例6.1】有一水稻施肥的盆栽试验,有一水稻施肥的盆栽试验,设设5个处理:个处理:和和系分别施用两种不系分别施用两种不同

13、的氨水,同的氨水,施碳酸氢铵,施碳酸氢铵,施尿素,施尿素,不施氮肥。每处理各不施氮肥。每处理各4盆(每盆纯氮盆(每盆纯氮相同)共相同)共54=20盆,随机放置于同一盆,随机放置于同一盆栽场。其稻谷产量(克盆栽场。其稻谷产量(克/盆)列于表盆)列于表6.3,试作方差分析。,试作方差分析。处处 理理 观察值(观察值(ij) Ti 氨水氨水1 24,30,28,26 108 27.0 6.67 氨水氨水2 27,24,21,26 98 24.5 7.00 碳铵碳铵 31,28,25,30 114 28.5 7.00 尿素尿素 32,33,33,28 126 31.5 5.67 不施不施 21,22,

14、16,21 80 20.0 7.33 Ti= 526 =26.3 =6.73表表.3水稻施肥盆栽试验的产量结果水稻施肥盆栽试验的产量结果ix2isx2es 变异来源处理效应和试验误差变异来源处理效应和试验误差处理数处理数k=5,每一处理观察值的个数,每一处理观察值的个数n=4 1、各变异来源的平方和的计算:、各变异来源的平方和的计算: 矫正数矫正数总变异总变异处理间变异处理间变异处理内变异处理内变异0 .1012 .3012 .4022 .3014)8098108(2 .4022130248 .13833455262222222222tTeitijTSSSSSSCCnTSSCCxSSnkTC、

15、各项变异来源的自由度的计算:、各项变异来源的自由度的计算:15) 14 ( 5) 1(4151191201nkdfkdfnkdfetT总变异总变异处理间变异处理间变异处理内变异处理内变异 如果如果20个观察值个观察值xij皆以离差的形式表示皆以离差的形式表示时,就得到以下结果:时,就得到以下结果: 总效应: xxij 处理效应:xxi误差效应:iijxx -2.3 3.7 1.7 -0.30.7 -2.3 -5.3 -0.34.7 1.7 -1.3 3.75.7 6.7 6.7 1.7-5.3 -4.3 -10.3 -5.30.7 0.7 0.7 0.7-1.8 -1.8 -1.8 -1.8

16、2.2 2.2 2.2 2.2 5.2 5.2 5.2 5.2 -6.3 -6.3 -6.3 -6.3-3 3 1 -12.5 -0.5 -3.5 1.52.5 -0.5 -3.5 1.50.5 1.5 1.5 -3.51 2 -4 1SST=402.2dft=19SSt=301.2dft=4SSe=101.0dfe=15总变异总变异处理间变异处理间变异处理内变异处理内变异73.6150 .10130.7542 .30116.21192 .402222eeeettttTTTTdfSSSMSdfSSSMSdfSSSMS以上处理内均方以上处理内均方.73系五种处理内变异系五种处理内变异的合并均方,

17、它是表的合并均方,它是表.3资料的试验误差的资料的试验误差的估计;处理间均方估计;处理间均方75.30则是试验误差加上不则是试验误差加上不同施肥方法对产量的效应。同施肥方法对产量的效应。、各变异来源的方差:、各变异来源的方差:三、三、F分布与分布与F测验测验1 1、F F测验的基本原理测验的基本原理 由前面的分析可知,表由前面的分析可知,表6.1中中nk个观察值的大小不尽相同,它们之个观察值的大小不尽相同,它们之间的变异构成了整个数据的总变异,间的变异构成了整个数据的总变异,其总变异又可分为其总变异又可分为处理间变异处理间变异和和处处理内变异理内变异。 同一处理内的各个观察值不完全相同一处理内

18、的各个观察值不完全相同,这是因为它们都会受到偶然性同,这是因为它们都会受到偶然性因素的影响,影响的大小是随机效因素的影响,影响的大小是随机效应,这些随机效应即为随机变异。应,这些随机效应即为随机变异。各个处理内的随机变异之和就构成各个处理内的随机变异之和就构成了整个资料的误差项变异。了整个资料的误差项变异。处理内变异处理内变异从上述分析可知,各处理平均数之间有从上述分析可知,各处理平均数之间有不同程度的差异,引起差异的原因有二:不同程度的差异,引起差异的原因有二:其一是其一是处理的不同处理的不同;其二是;其二是不同处理受不同处理受偶然因素影响的程度不同偶然因素影响的程度不同。由第二种原。由第二

19、种原因引起的变异,其性质与处理内变异因引起的变异,其性质与处理内变异(即误差变异)性质相同,而且在一般(即误差变异)性质相同,而且在一般情况下,可以认为其效应相等。情况下,可以认为其效应相等。 处理间变异当处理间真实差异当处理间真实差异=0时,时,处理间变异处理间变异=处理内变异处理内变异当处理间真实差异当处理间真实差异0时,时,处理间变异处理内变异处理间变异处理内变异因此因此:处理间变异处理间变异=处理间真实差异处理间真实差异+处理内变异处理内变异 利用这种关系,将处理间变异与处理内变异的利用这种关系,将处理间变异与处理内变异的比值定义为比值定义为F值,值, 处理内变异处理间变异F 如果如果

20、F大小与大小与“1”相差不多,说明处理间变异相差不多,说明处理间变异与处理内变异相似,表明各处理效应在本质上相同,与处理内变异相似,表明各处理效应在本质上相同,即处理间差异不显著。即处理间差异不显著。 如果如果F比比“1”大得多,超出了通常偶然因素所大得多,超出了通常偶然因素所能解释的范围,那就说明各处理效应有本质差异。能解释的范围,那就说明各处理效应有本质差异。 方差方差用来表示样本的变异程度,在数学分用来表示样本的变异程度,在数学分析上有许多优点,所以通常采用方差作为变异析上有许多优点,所以通常采用方差作为变异的度量值,即的度量值,即22etssF处理内方差处理间方差 关于关于F值的大小,

21、如何判断是否超过了用误差解值的大小,如何判断是否超过了用误差解释的范围?必须借助释的范围?必须借助F测验。测验。对于例对于例6.1,已算得处理间均方,已算得处理间均方MSt=75.30, 处理处理内均方内均方Mse=6.73, F=MSt/Mse=75.30/6.73=11.18, 这这个值比大,但它是否已经超出了用误差解释的个值比大,但它是否已经超出了用误差解释的范围呢?则必须借助测验来回答这些具体问题。范围呢?则必须借助测验来回答这些具体问题。2、F分布与分布与F测验测验 F分布 有一个平均数为有一个平均数为 ,方差为,方差为 的正态总体,的正态总体,从中随机抽取两个样本,其容量分别为从中

22、随机抽取两个样本,其容量分别为n1 和和n2,则其自由度分别为则其自由度分别为df1 =n1-1和和df2=n2-1,方差,方差为为 ,令两个方差之比为,令两个方差之比为F,即,即 22221ss 和2221ssF 在给定的在给定的 样本容量样本容量n1 和和n2下,从该总体下,从该总体进行一系列的抽样,则可获得一系列进行一系列的抽样,则可获得一系列F值,各个值,各个F值所具有的概率构成一种分值所具有的概率构成一种分布,这一分布称为布,这一分布称为F分布分布。Ff(F)df1=2 df2=5df1=5 df2=4df1=1 df2=5图6.1 几种自由度下的F分布F分布的平均数分布的平均数 F

23、分布的取值范围为分布的取值范围为0, 故故F分布只有一尾概率(即右尾概率),分布只有一尾概率(即右尾概率),进行的进行的F测验仅为一尾测验。测验仅为一尾测验。 1F F分布是随自由度分布是随自由度df1 和和df2的改变而改的改变而改变的一组偏态曲线,只有当变的一组偏态曲线,只有当df1和和df2都趋向都趋向于于时,时,F分布趋于对称分布。因此,分布趋于对称分布。因此, F分分布某一特定曲线的形状取决于参数布某一特定曲线的形状取决于参数df1和和df2。例如,当例如,当df1=4(n1=5) , df2=5(n2=6)时,从时,从附表附表5查得查得F0.05=5.19, F0.01=11.39

24、, 这就表这就表明如以明如以n1=5, n2=6在一正态总体中进行连在一正态总体中进行连续抽样,则所得续抽样,则所得F值大于值大于5.19的仅有的仅有5%,大于大于11.39的仅有的仅有1%。 F分布下一定区间的概率可以从已制成分布下一定区间的概率可以从已制成的统计表(附表的统计表(附表5)中查出。)中查出。 F测验测验 测验某项变异因素的效应是否真实存在。测验某项变异因素的效应是否真实存在。若各处理的均数相等或者差异不显著,可以若各处理的均数相等或者差异不显著,可以推断处理间不存在真实差异;推断处理间不存在真实差异; 若各处理的均数不等且差异显著,可以推断若各处理的均数不等且差异显著,可以推

25、断处理间有真实差异。处理间有真实差异。 在计算在计算F值时,通常将值时,通常将被测验的那一被测验的那一项变异因素的方差作分子项变异因素的方差作分子,而以另,而以另一项变异因素的方差作分母。一项变异因素的方差作分母。F测验的步骤:测验的步骤:第一第一:提出假设:提出假设数)个处理所在总体的平均分别代表(不全相等。、:KHHkkAko212121第二第二:计算:计算F值值 第三第三:查附表:查附表 5, 由由dft,dfedft,dfedft,dfe可查得可查得 临界值临界值 etMSMSF处理内方差处理间方差),(etdfdfF第四第四:比较比较F与与 作出统计推断作出统计推断 1.若若FF0.

26、05, 则则P0.05 否定否定H0, 接受接受HA, 记为记为“*” F F0.01, 则则P 0.01 否定否定H0, 接受接受HA, 记为记为“*” 2.若若F0.05 接受接受H0, 否定否定HA),(etdfdfF对于例对于例6.1,以处理间均方,以处理间均方75.30为分子,为分子,处理内均方处理内均方6.73为分母,算得为分母,算得11.18,当当dft=4, dfe=15时查附表,时查附表,F.05=3.06, F0.01=4.89,实得,实得F=11.18F0.01=4.89,故,故推断该试验的处理平均数间有极显著的推断该试验的处理平均数间有极显著的差异。差异。 . 多重比较

27、 要明确各个处理平均数彼此间的差要明确各个处理平均数彼此间的差异显著性,还必须对各个平均数作相互异显著性,还必须对各个平均数作相互比较,这种比较称为比较,这种比较称为多重比较多重比较。常用的。常用的有以下几种:有以下几种:一、最小显著差数法(一、最小显著差数法(LSDLSD)最小显著差数法的实质是两个平均数最小显著差数法的实质是两个平均数相比较的相比较的t测验测验。第一第一:计算平均数差数的标准误计算平均数差数的标准误nMSnMSnMSseeed2其中,其中,sd为平均数的差数标准误;为平均数的差数标准误; MSe为方差分析的误差项均方;为方差分析的误差项均方; n为样本容量(每一处理内观察值

28、的个数);为样本容量(每一处理内观察值的个数);具体方法如下:具体方法如下:第三第三:将任意两个处理平均数的差与将任意两个处理平均数的差与LSD相比较相比较 若若表示差异不显著表示差异极显著表示差异显著dddstxxstxxstxx05. 02101. 02105. 021第二第二:计算出显著水平下的最小显著差数计算出显著水平下的最小显著差数LSDdStLSDdSxxt21【例【例6.2】试以法测验例试以法测验例6.1各处理各处理平均数与对照的差异显著性。平均数与对照的差异显著性。由前面的分析可知:由前面的分析可知:MSe=6.73 n=4盆)克(834. 14)73. 62(2nMSeSd查

29、附表查附表3,当,当dfe=15时,时, t0.05,15=2.131 , t0.01,15=2.947 故:故:LSD0.05=2.1311.834=3.90(克克) LSD0.01=2.947 1.834=5.40(克克)处理处理 平均产量(克平均产量(克/盆)盆) 差数(克)差数(克)施尿素施尿素 31.5 11.5*施碳铵施碳铵 28.5 8.5*施氨水施氨水1 27.0 7.0*施氨水施氨水2 24.5 4.5*不施氮肥不施氮肥 20.0 -注:注:*表示在表示在0.05水平上显著;水平上显著;*表示在表示在0.01水平上显著水平上显著。表表6.5施肥效果的差异显著性(施肥效果的差异

30、显著性(LSD) 推断:施氨水2显著高于不施氮肥;施碳铵、尿素、氨水1均极显著高于不施氮肥。二、最小显著极差法(二、最小显著极差法(LSRLSR)不同平均数间的比较采用不同的显著尺度不同平均数间的比较采用不同的显著尺度 1、新复极差测验法(SSR) 步骤:步骤:第一:第一:计算平均数的标准误计算平均数的标准误nMSsex第二:第二:查查SSR表,计算最小显著极差值表,计算最小显著极差值LSR xSSSRLSR其中,其中, 是在是在F测验中分母项对应的自由度测验中分母项对应的自由度下,由附表查得下,由附表查得k=2,3, ,K时的时的SSR的值的值SSR k 为某两个极差间所包含的平均数个数为某

31、两个极差间所包含的平均数个数第三第三:以各个:以各个k值下的值下的LSR为显著尺度,测验为显著尺度,测验各平均数两极差的显著性。各平均数两极差的显著性。水平上不显著。,两极差在则接受水平上显著,两极差在则否定021021HLSRxxHLSRxx【例例6.】试以法测验例】试以法测验例6.1五个处五个处理平均数的差异显著性。理平均数的差异显著性。由前面的分析可知:由前面的分析可知:MSe=6.73, n=4故故297. 1473. 6nMSesx 当当当当当当dfdfdfe e e=15=15=15时时时时时时,由附表,由附表6查出查出k=2,3,4,5的的SSR0.05和和SSR0.01的值,并

32、由的值,并由 LSRSSR 计算出相应的最小显著极差计算出相应的最小显著极差LSR于表于表6.6。xs K 2 3 4 5 SSR0.05 3.01 3.16 3.25 3.31 SSR0.01 4.17 4.35 4.46 4.55 LSR0.05 3.90 4.10 4.22 4.29 LSR0.01 5.41 5.64 5.78 5.90q0.05 3.01 3.67 4.08 4.37 q0.01 4.17 4.83 5.25 5.56LSR0.05 3.90 4.76 5.29 5.67 LSR0.01 5.41 6.26 6.81 7.21 表表6.6 表表6.3资料多重比较时资料

33、多重比较时LSR值的计算值的计算 多重比较结果多重比较结果(SSR或或q测验)的表示方法测验)的表示方法标记字母法标记字母法将全部平均数从大到小依次排列;将全部平均数从大到小依次排列; 在最大的平均数上标上字母在最大的平均数上标上字母a;将该平均数与以下各平均数相比,凡将该平均数与以下各平均数相比,凡 相差不相差不显著的,显著的, 都标上字母都标上字母a,直至某一个与之相差显,直至某一个与之相差显著的平均数,则标以字母著的平均数,则标以字母b;以标有以标有b的平均数为标准,与上方各个比它大的平均数为标准,与上方各个比它大的平均数相比,凡不显著的一律标以字母的平均数相比,凡不显著的一律标以字母b

34、; 再以标有字母再以标有字母b的最大平均数为标准,与的最大平均数为标准,与以下各个以下各个 未标记的平均数相比,凡不显著的未标记的平均数相比,凡不显著的继续标以字母继续标以字母b,直至某一个与之相差显著,直至某一个与之相差显著的平均数则标以字母的平均数则标以字母c。如此重复进行下去,直至最小的一个平均如此重复进行下去,直至最小的一个平均数有了标记字母为止。数有了标记字母为止。 判断标准:判断标准:各平均数间,凡有一个相同各平均数间,凡有一个相同标记字母的即为差异不显著,凡具不同标记标记字母的即为差异不显著,凡具不同标记字母的即为差异显著。字母的即为差异显著。 处处 理理 平均产量(克平均产量(

35、克/盆)盆) 差异显著性差异显著性 0.05 0.01施尿素施尿素 31.5 a A施碳铵施碳铵 28.5 ab AB施氨水施氨水1 27.0 b AB施氨水施氨水2 24.5 b BC不施氮肥不施氮肥 20.0 c C表表6.7 施肥效果的差异显著性(施肥效果的差异显著性(SSR) 1. 施尿素、碳铵、氨水施尿素、碳铵、氨水1、氨水、氨水2显著显著 高于不施氮肥;高于不施氮肥; 2. 施尿素施尿素极显著高于施氨水极显著高于施氨水2; 3. 施碳铵、氨水施碳铵、氨水1、氨水、氨水2之间的差异之间的差异 不显著不显著。 推断推断:2、q 测验法测验法 xSqLSR与与SSR法相比,法相比,q测验

36、的显著尺度标准更高,测验的显著尺度标准更高,因此,由因此,由q测验法推断的结果更严格。测验法推断的结果更严格。其中,其中,q 为在为在F测验中分母项相应自由测验中分母项相应自由度下显著水平为度下显著水平为 时的时的q值。值。三、多重比较方法的选择三、多重比较方法的选择 LSD或或SSR犯犯错误的风险错误的风险较大;犯较大;犯错误错误的风险小的风险小犯犯错误的风险错误的风险较大;犯较大;犯错误错误的风险小的风险小q测验测验 在农业和生物学上,由于试验工在农业和生物学上,由于试验工作者通常都寄希望于作者通常都寄希望于否定否定H0,所以,所以LSD和和SSR得到较为广泛的应用。如得到较为广泛的应用。

37、如果试验是几个处理都与一个对照相果试验是几个处理都与一个对照相比,则可选用比,则可选用LSD法;如果试验是法;如果试验是每两个处理都要进行相互比较,则每两个处理都要进行相互比较,则宜选用宜选用SSR法。法。6.3 系统分组资料的方差分析系统分组资料的方差分析 如果试验资料分为如果试验资料分为l 个组,每个组个组,每个组内又分为内又分为 m个亚组,每个亚组又再个亚组,每个亚组又再分为若干个小亚组。如此分下去,分为若干个小亚组。如此分下去,直至最后一个小亚组具有直至最后一个小亚组具有n个观察值,个观察值,这种分组资料称为这种分组资料称为系统分组资料系统分组资料。 设一系统分组资料共有设一系统分组资

38、料共有l组,每组组,每组内又分内又分m个亚组,每一亚组内有个亚组,每一亚组内有n个观察值,则该资料共有个观察值,则该资料共有lmn个个观察值。其数据模式如表观察值。其数据模式如表.10。二级系统分组资料且每组观察值数目相等二级系统分组资料且每组观察值数目相等一、数学结构与变异来源分解一、数学结构与变异来源分解对于表对于表6.10资料中任一观察值,其数学模型资料中任一观察值,其数学模型为:为: 总体平均数总体平均数i=(i )组效应)组效应ij=( ij i )亚组效应)亚组效应ijk=(xijk-ij)随机误差)随机误差ijkjiijix上式表明,任一观察值的总变异可分解为:上式表明,任一观察

39、值的总变异可分解为:用样本符号可表示为用样本符号可表示为), 2 , 1;, 2 , 1;, 2 , 1(nkmjliedtxxijkijiijk组间变异;组间变异;同一组内亚组间变异;同一组内亚组间变异;同一亚组内各观察值的变异(试验误差)同一亚组内各观察值的变异(试验误差). 总变异总变异 : 自由度自由度 平方和平方和 lmnTCCxxxSSlmndflmnTT2122)(12. 组间变异:组间变异: 自由度自由度 平方和平方和CmnTxxmnSSldfilitt221)(1二、自由度与平方和的分解二、自由度与平方和的分解3.同一组内亚组间的变异同一组内亚组间的变异自由度自由度平方和平方

40、和mnTnTxxnSSmldfiijilmijdd22211)()1(4. 亚组内的变异(误差):亚组内的变异(误差):自由度自由度平方和平方和nTxxxSSnlmdfijijkijlmnijkee222111)() 1(SSt, SSd, Sse分别代表组间、组内亚组间和误差平方和。 当测验组间平均数的差异时,用当测验组间平均数的差异时,用组内亚组间的均方作分母,即组内亚组间的均方作分母,即dtMSMSF 当测验组内亚组间平均数的差异当测验组内亚组间平均数的差异时,以误差均方作分母,即时,以误差均方作分母,即edMSMSF 三、三、F 测验测验二级系统分组资料的方差分析二级系统分组资料的方差

41、分析变异来源变异来源 DF SS MS F组组 间间 组内亚组间组内亚组间误误 差差总变异总变异1) 1() 1(1lmnnlmmll2222)()()()(xxSSxxSSxxnSSxxmnSSTijeiijditedtMSMSMSeddtMSMSMSMS【例【例6.5】用种不同浓度的农用保水】用种不同浓度的农用保水剂蘸根,剂蘸根, 每种浓度的处理各种盆,每种浓度的处理各种盆,一星期后每盆测定株的发根数,其一星期后每盆测定株的发根数,其结果如表结果如表6.12,试做方差分析。,试做方差分析。表表 6.3 3种浓度的保水剂蘸根的发芽数种浓度的保水剂蘸根的发芽数ijX1、自由度与平方和的分解、自

42、由度与平方和的分解591543160.3164784 .6365543618222222lmndfCCxSSlmnTCTTl=3 , m=4 , n=5213120.251542542101542222ldfCCmnTSStit总变异总变异组间变异组间变异9) 14(3) 1(00. 354254210154565393722222222mldfmnTnTSSdiijd组内亚组间变异组内亚组间变异48) 15(43) 1(40.6200. 320.25160.316nlmdfSSSSSSSSedtTe误差变异(亚组内变异)误差变异(亚组内变异)2、方差分析与、方差分析与F测验测验变异来源变异来

43、源 DF SS MS F F0.05 F0.01 保水剂浓度间保水剂浓度间 2 251.20 125.60 96.615* 4.26 8.02浓度内盆间浓度内盆间 9 3.00 0.33 1 2.08 2.80误差误差 48 62.40 1.30总变异总变异 59 316.60 表表6.12资料的方差分析资料的方差分析 Ft=MSt/MSdFd=MSd/MSe 以上结果表明,不同浓度蘸根以上结果表明,不同浓度蘸根对栽后发根有极显著的影响;而同对栽后发根有极显著的影响;而同一浓度不同盆间无显著差异。一浓度不同盆间无显著差异。为什么对不同变异来源的测验为什么对不同变异来源的测验其其F临界值的大小不

44、同?临界值的大小不同?3、多重比较(、多重比较(SSR)根1285. 05433. 0mnMSSdx 各浓度平均数的比较各浓度平均数的比较由前面的方差分析可知,由前面的方差分析可知,MSd=0.33当当dfd=9时,由附表时,由附表6查得查得k=2,3的的SSR0.05和和SSR0.01的值,的值,LSR0.05=SSR0.05LSR0.01=SSR0.01xxSS求出相应的求出相应的LSR0.05和和LSR0.01的值。的值。 表表6.13-a 各浓度平均数比较的各浓度平均数比较的LSR值值LSR0.05 0.41 0.43LSR0.01 0.59 0.62K 2 3 SSR0.05 3.2

45、0 3.34 SSR0.01 4.60 4.86表表6.13-b 不同浓度保水剂蘸根的差异显著性(不同浓度保水剂蘸根的差异显著性(SSR)处理处理 平均发根数平均发根数(根根) 差异显著性差异显著性 0.05 0.01A3 12.7 A2 10.5 A1 7.7推断:三种处理相互之间的差异均达推断:三种处理相互之间的差异均达极显著水平。极显著水平。 a b c ABC6.4 组内观测次数不同的方差分析 例6.3 园艺研究所调查了3个品种草莓的维生素C含量,测定结果列于下表。试分析不同草莓品种之间维生素C含量含量是否有显著差异。维生素C含量处理12345678910I117 99107 112

46、113 106II81777976858774697280III80827884897386886.5 方差分析的数学模型与基本假定方差分析的数学模型与基本假定1、方差分析的数学模型、方差分析的数学模型 指试验资料的数据结构,或者说指试验资料的数据结构,或者说指每一观察值的线性组成部分。指每一观察值的线性组成部分。一、方差分析的数学模型与期望均方一、方差分析的数学模型与期望均方方差分析是建立在一定的线性可加模型方差分析是建立在一定的线性可加模型基础上的,所谓基础上的,所谓线性可加模型线性可加模型是指每一是指每一观察值可以划分成若干个线性组成部分,观察值可以划分成若干个线性组成部分,或者说将每一

47、个观察值看作几个分量的或者说将每一个观察值看作几个分量的和,效应之间是和,效应之间是“和和”的关系,且是的关系,且是一一次方次方,故通常称为,故通常称为“线性可加模型线性可加模型”,简称线性模型。简称线性模型。进行方差分析的基础;进行方差分析的基础;自由度与平方和分解的依据。自由度与平方和分解的依据。数学模型数学模型: 设在一平均数为设在一平均数为 、方差为、方差为2 的正的正态总体中随机抽取容量为态总体中随机抽取容量为n的一组样本。的一组样本。由于随机误差,每一个由于随机误差,每一个xi都和总体平均都和总体平均数数有差别,这个差量就是有差别,这个差量就是随机误差随机误差i。iix其中,其中,

48、i iN N(0 0,2 2),),故故x因而每一个观察值都具有线性可加模型:因而每一个观察值都具有线性可加模型:)(xxeii)(1 xi 假如将上述总体分成假如将上述总体分成k个组,使每组个组,使每组成为该总体的一个亚总体,分别给予不成为该总体的一个亚总体,分别给予不同的处理,处理效应为同的处理,处理效应为i,则各个亚总,则各个亚总体的平均数为体的平均数为i=( + i )。当每个亚总。当每个亚总体中皆随机抽取容量为体中皆随机抽取容量为n的一组样本时,的一组样本时,则共得则共得k组样本,其资料模式如表组样本,其资料模式如表6.1。 任一亚总体的任一观察值任一亚总体的任一观察值xij所具有所

49、具有的线性模型为的线性模型为:式中:式中:i i=(=(i i- )- ),并满足,并满足 i i=0=0; ijij=(x=(xijij-i i) )是相互独立是相互独立, ,并具并具 有分布有分布N N(0,0,2 2)。)。ijiijxi=1,2,.,k; j=1,2,n 如果试验资料分为如果试验资料分为l个组,每组内个组,每组内又分为又分为m个亚组,每个亚组具有个亚组,每个亚组具有n个个观察值,其数据资料如表观察值,其数据资料如表6.10。则每。则每一个观察值的线性模型为:一个观察值的线性模型为:ijkijiijkx式中:式中:为总体平均数;为总体平均数; i=(i- )为组效应或处理

50、效应;为组效应或处理效应; ij=(ij- i)为亚组效应;为亚组效应; ijk=( xijk- ij)为同一亚组中个观察值的随机为同一亚组中个观察值的随机 变异即随机误差,具有变异即随机误差,具有N(0,2)。)。 2、方差分析的期望均方、方差分析的期望均方 若若A是是B的无偏估计,则称的无偏估计,则称B是是A的的数数学期望学期望。数理统计已经证明,数理统计已经证明,MSe(样本的误(样本的误差均方)是样本所在总体的误差方差差均方)是样本所在总体的误差方差2的的无偏估计值无偏估计值。于是,。于是,MSe的数学期望的数学期望为为2。因为。因为2 为均方的数学期望,故又为均方的数学期望,故又称称

51、期望均方期望均方。 MSt的期望均方不是的期望均方不是t2,因为它是,因为它是由处理平均数计算得到的,它由两个由处理平均数计算得到的,它由两个可能的部分构成:可能的部分构成: a.平均数的抽样方差平均数的抽样方差 b.处理平均数本身差异的方差,处理平均数本身差异的方差, 即处理方差即处理方差t2nx22又因每个处理的平均数由又因每个处理的平均数由n个数据得到,个数据得到,故有:故有:为为MSt的数学期望,或处理效应的期望均方的数学期望,或处理效应的期望均方。2222)(ttxnn222tetnMSMSF当当t2 =0时,时,F=1,表示处理间无差异;表示处理间无差异;当当F值很大时,表明值很大时,表明t2 0即处理间存在差异。即处理间存在差异。因为因为 作用:是正确进行作用:是正确进行F测验的基础测验的基础二、固定模型与随机模型二、固定模型与随机模型 对于处理效应,由于试验目的的对于处理效应

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论