生物统计与田间试验:第六章 方差分析_第1页
生物统计与田间试验:第六章 方差分析_第2页
生物统计与田间试验:第六章 方差分析_第3页
生物统计与田间试验:第六章 方差分析_第4页
生物统计与田间试验:第六章 方差分析_第5页
已阅读5页,还剩117页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章方差分析第一节方差分析的基本原理第二节多重比较第三节方差分析的线性模型与期望均方第四节单向分组资料的方差分析第五节两向分组资料的方差分析第六节方差分析的基本假定和数据转换第一节方差分析的基本原理

所谓方差分析(analysisofvariance),是关于k(k≥3)个样本平均数的假设测验方法,是将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。

假设测验的依据是:扣除了各种试验原因所引起的变异后的剩余变异提供了试验误差的无偏估计。

这里采用均方来度量试验处理产生的变异和误差引起的变异.方差是平方和除以自由度的商。一、自由度和平方和的分解

设有k组数据,每组皆具n个观察值,则该资料共有nk个观察值,其数据分组如表6.1。表6.1

每组具n个观察值的k组数据的符号表组别观察值(yij,i=1,2,…,k;j=1,2…,n)总和平均均方1y11y12…y1j…y1nT12y21y22…y2j…y2nT2……iyi1yi2…yij…yinTi……kyk1yk2…ykj…yknTk

在表6.1中,总变异是nk个观察值的变异,故其自由度v=nk-1,而其平方和SST则为:(6·1)其中的C称为矫正数:(6·2)对于第

i

组的变异,有从而总变异(6·1)可以剖分为:(6·3)即总平方和=组内(误差)平方和+处理平方和

组间变异由k个的变异引起,故其自由度v

=k-1,组间平方和SSt为:

组内变异为各组内观察值与组平均数的变异,故每组具有自由度v=n-1和平方和;而资料共有k组,故组内自由度

v

=k(n-1),组内平方和SSe为:(6·5)

(6·4)因此,得到表6.1类型资料的自由度分解式为:(6·6)

总自由度DFT=组间自由度DFt+组内自由度DFe

求得各变异来源的自由度和平方和后,进而可得:(6·7)[例6.1]以A、B、C、D4种药剂处理水稻种子,其中A为对照,每处理各得4个苗高观察值(cm),其结果如表6.2,试分解其自由度和平方和。表6.2

水稻不同药剂处理的苗高(cm)药剂苗高观察值总和Ti

平均A182120137218B202426229223C101517145614D2827293211629T=336=21

根据(6·6)进行总自由度的剖分:

总变异自由度DFT=(nk-1)=(4

4)-1=15

药剂间自由度DFt=(k-1)=4-1=3

药剂内自由度DFe=k(n-1)=4(4-1)=12根据(6·3)进行总平方和的剖分:或或药剂A内:

药剂B内:药剂C内:药剂D内:所以

进而可得均方:二、F分布与F测验

在一个平均数为、方差为的正态总体中,随机抽取两个独立样本,分别求得其均方s12和s22,将s12和s22

的比值定义为F:(6·8)此F值具有s12

的自由度v1和s22的自由度v2。

所谓F分布,就是在给定的v1和v2下按上述方法从正态总体中进行一系列抽样,就可得到一系列的F值而作成一个分布。F分布下一定区间的概率可从已制成的统计表查出。F分布曲线特征:(1)具有平均数=1(2)取值区间为[0,∞];(3)某一特定曲线的形状则仅决定于参数v1和v2。在v1=1或v1=2时,F分布曲线是严重倾斜成反向J型;当v1≥3时,曲线转为偏态(图6.1)。图6.1F分布曲线(随v1和v2的不同而不同)F测验需具备条件:(1)变数y遵循正态分布N(,),(2)s12和s22彼此独立。

另外,在F测验中,如果作分子的均方小于作分母的均方,则F<1;此时不必查F表即可确定P>0.05,应接受H0。[例6.2]测定东方红3号小麦的蛋白质含量10次,得均方s12=1.621;测定农大139小麦的蛋白质含量5次,得均方s22=0.135。试测验东方红3号小麦蛋白质含量的变异是否比农大139为大。

假设H0:东方红小麦总体蛋白质含量的变异和农大139一样,即

,对

显著水平=0.05,v1=9,v2=4时,F0.05=6.00。测验计算:F=1.621/0.135=12.01

此F>F0.05,即P<0.05。

推断:否定H0,接受HA,即东方红3号小麦蛋白质含量的变异大于农大139。[例6.3]在例6.1算得药剂间均方st2=168.00,药剂内均方se2=8.17,具自由度v1=3,v2=12。试测验药剂间变异是否显著大于药剂内变异?假设

显著水平=0.05,

F0.05=3.49。测验计算:F=168.00/8.17=20.56

查附表5

v1

=3,v2=12时

F0.05

=3.49,F0.01=5.95,实得F>F0.01>F0.05

推断:否定

,接受

;即药剂间变异显著地大于药剂内变异,不同药剂对水稻苗高是具有不同效应的。

例6.1和例6.3的分析结果可以归纳在一起,列出方差分析表,如表6.3所示。表6.3

水稻药剂处理苗高方差分析表变异来源DFSSMSF显著F值药剂处理间3504168.0020.56**F

0.05(3,12)=3.49

药剂处理内(误差)12988.17F

0.01(3,12)=5.95总15602第二节多重比较

所谓多重比较(multiplecomparisons)是指一个试验中k个处理平均数间可能有k(k-1)/2个比较,亦称为复式比较。

多重比较有多种方法,本节将介绍常用的三种:最小显著差数法复极差法(q法)Duncan氏新复极差法一、最小显著差数法

最小显著差数法(leastsignificantdifference,简称LSD法),

法实质上是第五章的t测验。其程序是:(1)在处理间的F测验为显著的前提下,计算出显著水平为的最小显著差数;(2)任何两个平均数的差数(),如其绝对值≥,即为在水平上差异显著;反之,则为在水平上差异不显著。

已知:若|t|≥,即为在水平上显著。因此,最小显著差数为:(6·9)当两样本的容量n相等时,

在方差分析中,上式的se2有了更精确的数值MSe(因为此自由度增大),因此(6·9)中的为:(6·10)[例6.4]试以LSD法测验表6.2资料各种药剂处理的苗高平均数间的差异显著性。由(例6.3)计算得F=20.56为显著,MSe=8.17,DFe=12,故由附表4,v=12时,t0.05=2.179,t0.01=3.055故LSD0.05=2.179×2.02=4.40(cm)

LSD0.01=3.055×2.02=6.17(cm)

然后将各种药剂处理的苗高与对照苗高相比,差数大于4.40cm为差异显著;大于6.17cm为差异极显著。二、q法

q测验是Student-Newman-Keul基于极差的抽样分布理论提出来的,或称复极差测验,有时又称SNK测验或NK测验。

q法是将一组k个平均数由大到小排列后,根据所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差值的。

q测验因是根据极差抽样分布原理的,其各个比较都可保证同一个显著水平。

q测验尺度值构成为:(6·11)(6·12)

式中2≤p≤k,p是所有比较的平均数按大到小顺序排列所计算出的两极差范围内所包含的平均数个数(称为秩次距)。

SE为平均数的标准误,可见在每一显著水平下该法有k-1个尺度值。平均数比较时,尺度值随秩次距的不同而异。[例6.5]试对表6.2资料的各平均数作q测验。

由6.1资料得:

查附表7q值表,当DF=12时,p=2,3,4的值,并由(6·11)计算出尺度值,列于表6.4。pq0.05q0.01LSR0.05LSR0.0123.084.324.406.1833.775.045.397.2144.205.506.017.87表6.4

表6.2资料值的计算(q测验)由表6.2可知,=29cm,=23cm,=18cm,

=14cm。:由此可得到----当p=2时,=6(cm)5%水平上显著;=5(cm)5%水平上显著;=4(cm)不显著。当p=3时,=11(cm)1%水平上显著;=9(cm)1%水平上显著。当p=4时,=15(cm)1%水平上显著。三、新复极差法

新复极差法是D.B.Duncan(1955)基于不同秩次距p下的最小显著极差变幅比较大而提出的,又称最短显著极差法(shortestsignificantranges,SSR)。查得后,有(6·13)

此时,在不同秩次距p下,平均数间比较的显著水平按两两比较是,但按p个秩次距则为保护水平[例6.6]试对表6.2资料的各平均数作新复极差测验。已知=29cm,=23cm,

=18cm,=14cm,

MSe=8.17,

查附表8,得值,由(6·13)算得在p=2,3,4时的值(表6.5),即为测验不同p时的平均数间极差显著性的尺度值。pSSR0.05SSR0.01LSR0.05LSR0.0123.084.324.406.1833.234.554.626.5143.334.684.766.69表6.5

表6.2资料LSR值的计算(新复极差测验)当p=2时,=6(cm)5%水平显著;

=5(cm)5%水平显著;

=4(cm)不显著。当p=3时,

=11(cm)1%水平上显著;

=9(cm)1%水平上显著。当p=4时,

=15(cm)

1%水平上显著。

结论:表6.2资料的4个处理的苗高,除处理A与C差异不显著外,其余处理间均达显著差异,本例结果与上面介绍的q测验法相同,但q法的要比新复极差法的大。四、多重比较结果的表示方法(一)列梯形表法(二)划线法(三)标记字母法

将全部平均数从大到小顺次排列,然后算出各平均数间的差数。凡达到=0.05水平的差数在右上角标一个“*”号,凡达到=0.01水平的差数在右上角标两个“*”号,凡未达到=0.05水平的差数则不予标记。若以列梯形表法表示,则成表6.6。(一)列梯形表法处理平均数()差异

-14-18

-23D2915**11**6*B239**5*A184C14表6.6

表6.2资料的差异显著性(新复极差测验)优点:十分直观,缺点:占篇幅较大,特别是处理平均数较多时。(二)划线法

将平均数按大小顺序排列,以第1个平均数为标准与以后各平均数比较,在平均数下方把差异不显著的平均数用横线连接起来,依次以第2,…,k-1个平均数为标准按上述方法进行。这种方法称划线法。下面就是表6.2资料用划线法标出0.01水平下平均数差异显著性结果(q法)。29cm(D)23cm(B)18cm(A)14cm(C)

优点:直观、简单方便,所占篇幅也较少。(三)标记字母法:

(1)将全部平均数从大到小依次排列。(2)在最大的平均数上标上字母a;将该平均数与以下各平均数相比,相差不显著的,都标上字母a,直至某一个与之相差显著的平均数则标以字母b(向下过程),(3)再以该标有b的平均数为标准,与上方各个比它大的平均数比,凡不显著的也一律标以字母b(向上过程);再以该标有b的最大平均数为标准,与以下各未标记的平均数比,凡不显著的继续标以字母b,直至某一个与之相差显著的平均数则标以字母c。……

(4)如此重复进行下去,直至最小的一个平均数有了标记字母且与以上平均数进行了比较为止。(5)这样各平均数间,凡有一个相同标记字母的即为差异不显著,凡没有相同标记字母的即为差异显著。在实际应用时,可以小写字母表示=0.05显著水平,大写字母表示=0.01显著水平。

(1)在表6.7上先将各平均数按大小顺序排列,并在行上标a。(2)由于与呈显著差异,故上标b。(3)然后以为标准与相比呈显著差异,故标c。(4)以为标准与比,无显著差异,仍标c。同理,可进行4个在1%水平上的显著性测验,结果列于表6.7。[例6.7]试对例6.6测验结果作出字母标记。表6.7

表6.2资料的差异显著性(新复极差测验)处理苗高平均数(cm)差异显著性0.050.01D29aAB23bABA18c

BCC14cC

由表6.7就可清楚地看出,该试验除A与C处理无显著差异外,D与B及A、C处理间差异显著性达到=0.05水平。处理B与A、D与B、A与C无极显著差异;D与A、C,B与C呈极显著差异。五、多重比较方法的选择多重比较方法选用原则:

(1)试验事先确定比较的标准,凡与对照相比较,或与预定要比较的对象比较,一般可选用最小显著差数法;(2)根据否定一个正确的H0和接受一个不正确的H0的相对重要性来决定。

方差分析的基本步骤是:(1)将资料总变异的自由度和平方和分解为各变异原因的自由度和平方和,并进而算得其均方;(2)计算均方比,作出F测验,以明了各变异因素的重要程度;(3)对各平均数进行多重比较。第三节方差分析的线性模型与期望均方一、方差分析的线性数学模型

方差分析的理论依据:线性可加模型,即总体每一个变量可以按其变异的原因分解成若干个线性组成部分。例如表6.1数据的线性模型可表示为:(6·14)其中,为总体平均数,为试验处理效应,为随机误差具有分布N(0,)。象表6.1类型的资料,其每一观测值都由这三个部分相加而成。在以样本符号表示时,样本的线性组成为:(6·15)其中,是的无偏估计量,是的无偏估计量,为其所属亚总体误差方差的无偏估计量。当测验H0:时,假定和,可看作是总体的无偏估计量。也是的无偏估计量。因而

对于ti部分,每一样本的平方和是,故k个样本的平方和是,而处理间方差st2为:(6·16)

因为,故估计了,或。或写为:(6·17)二、期望均方

在线性可加模型中,关于部分的假定,由于对有不同的解释产生了固定模型(Ⅰ)和随机模型(Ⅱ)。

固定模型是指各个处理的平均效应是固定的一个常量,且满足(或),但常数未知;主要是研究并估计处理效应;固定模型中所得的结论仅在于推断关于特定的处理;随机模型是指各个处理效应不是一个常量,而是从平均数为零、方差为的正态总体中得到的一个随机变量,即~N(0,)。主要是研究并估计总体变异即方差。而随机模型中试验结论则将用于推断处理的总体.(一)固定模型(fixedmodel)[例6.8]以5个水稻品种作大区比较试验,每品种作3次取样,测定其产量,所得数据为单向分组资料。本试验需明确各品种的效应,故为固定模型,其方差分析和期望均方的参数估计列于表6.8。表6.85个水稻品种产量的方差分析和期望均方表变异来源DFSSMS期望均方(EMS):固定模型品种间487.621.90品种内(试验误差)1024.02.40为固定效应的方差本例中品种内MS估计了,因而;品种间MS估计了因而固定模型的F测验

若,则F值等于1。

所以固定模型是测验假设H0:(i=1,2,…,k)对HA:,即测验H0:。因而,一般比较处理效应的试验都应当采用固定模型(二)随机模型(randommodel)[例6.9]研究籼粳稻杂交F5代系间单株干草重的遗传变异,随机抽取76个系进行试验,每系随机取2个样品测定干草重(g/株)。因这76个系是随机抽取的样本,要从这些样本来估计F5代系间单株干草重的遗传变异,故这是随机模型。其单向分组分析结果见表6.9。表6.9

籼粳杂种F5代干草重的方差分析和期望均方

变异来源DFMS期望均方(EMS):随机模型系统间7572.79系统内(试验误差)7617.77为随机效应的方差本例中系统内MS估计了,因而;系统间MS估计了,因而随机模型的F测验若假设,则F=1。因而,随机模型的假设为H0:对HA:。显然,这是测验处理效应的变异度(方差),而不是测验处理效应本身。

随机模型方差分析在数量遗传学中的应用:

如果F测验显著则表示处理间的变异是显著的。本例F=72.79/17.77=4.09>F0.05,说明是存在的。=25.71测度了系统间变异。本例中,(或记为)代表了系间遗传型的变异;代表了环境条件所致的变异(记作)。

代表了系间的表型变异,因而可求出遗传型变异占表型变异的份量,这就是数量遗传中常用的遗传率,即:(6·18)

当试验因素在2个或2个以上时,可以在固定模型和随机模型的基础上产生第三种模型:混合模型(记作模型Ⅲ)。

混合模型乃既包括有固定模型的试验因素,又包括有随机模型的试验因素的模型。这类模型凡随机因素仍用表示,固定模型用表示。混合模型中的期望均方组成因包括有不同的成份,应选择恰当的均方进行F测验。第四节单向分组资料的方差分析

单向分组资料是指观察值仅按一个方向分组的资料示。所用的试验设计为完全随机试验设计。一、组内观察值数目相等的单向分组资料的方差分析二、组内观察值数目不等的单向分组资料的方差分析三、组内又分亚组的单向分组资料的方差分析分类一、组内观察值数目相等的单向分组资料的方差分析这是在k组处理中,每处理皆含有n个供试单位的资料如表6.1。在作方差分析时,其任一观察值的线性模型皆由表示,方差分析如表6.10。表6.10

组内观察值数目相等的单向分组资料的方差分析

变异来源自由度DF平方和SS均方MSF期望均方EMS固定模型随机模型处理间k-1MStMSt/MSe误差k(n-1)MSe总变异nk-

1[例6.10]作一水稻施肥的盆栽试验,设5个处理,A和B系分别施用两种不同工艺流程的氨水,C施碳酸氢铵,D施尿素,E不施氮肥。每处理4盆(施肥处理的施肥量每盆皆为折合纯氮1.2克),共5×4=20盆,随机放置于同一网室中,其稻谷产量(克/盆)列于表6.11,试测验各处理平均数的差异显著性。表6.11

水稻施肥盆栽试验的产量结果处理观察值(yij)(克/盆)A(氨水1)2430282610827.0B(氨水2)272421269824.5C(碳酸氢铵)3128253011428.5D(尿素)3233332812631.5E(不施)212216218020.052626.3(1)自由度和平方和的分解总变异自由度DFT=nk-1=5×4-1=19

处理间自由度DFt=k-1=5-1=4

误差(处理内)自由度DFe=k(n-1)=5×(4-1)=15

矫正数(2)F测验将上述结果录入表6.12表6.12

表6.11资料的方差分析变异来源DFSSMSFF0.05F0.01

处理间4301.275.3011.19**3.064.89

处理内(试验误差)15101.06.73

总变异19402.2

假设H0:,HA:不全相等。为了测验H0,计算处理间均方对误差均方的比率,算得F=75.3/6.73=11.19

查F表当v1=4,v2=15时,F0.01=4.89,现实得F=11.19>F0.01,故否定H0,推断这个试验的处理平均数间是有极显著差异的。(3)各处理平均数的比较算得单个平均数的标准误

根据=15,查SSR表得p=2,3,4,5时的SSR0.05与SSR0.01值,将

值分别乘以SE值,即得值,列于表6.13。进而进行多重比较(表6.14)。pSSR0.05SSR0.01LSR0.05LSR0.0123.014.173.905.4133.164.374.105.6743.254.504.225.8453.314.584.295.94表6.13

多重比较时的值计算表6.14

施肥效果的显著性(SSR测验)处理平均产量(克/盆)差异显著性5%1%

尿素31.5aA

碳酸氢铵28.5abAB

氨水127.0bcAB

氨水224.0c

BC

不施20.0dC

推断:根据表6.14多重比较结果可知,施用氮肥(A、B、C和D)与不施氮肥有显著差异,且施用尿素、碳酸氢铵、氨水1与不施氮肥均有极显著差异;尿素与碳酸氢铵、碳酸氢铵与氨水1、氨水1与氨水2处理间均无显著差异。二、组内观察值数目不等的单向分组资料的方差分析

若k个处理中的观察值数目不等,分别为n1,n2,…,nk,在方差分析时有关公式因ni不相同而需作相应改变。主要区别点如下:(1)自由度和平方和的分解(6·19)(6·20)(2)多重比较平均数的标准误为:

上式的nA和nB系两个相比较的平均数的样本容量。但亦可先算得各ni的平均数n0。然后有:

或(6·22)(6·21)(6·23)(6·24)[例6.11]某病虫测报站,调查四种不同类型的水稻田28块,每块田所得稻纵卷叶螟的百丛虫口密度列于表6.15,试问不同类型稻田的虫口密度有否显著差异?表6.15

不同类型稻田纵卷叶螟的虫口密度

稻田类型编号ni12345678Ⅰ1213141515161710214.577Ⅱ1410111314117312.176Ⅲ921011121312118010.008Ⅳ1211109810127210.297T=32711.6828

该资料=7+6+8+7=28

故总变异自由度DFT=-1=28-1=27

稻田类型间自由度DFt=k-1=4-1=3

误差自由度DFe=-k=28-4=24求得:表6.16

表6.15资料的方差分析变异来源DFSSMSFF0.01稻田类型间396.1332.045.91**4.72误差24129.985.42总变异27226.11

表6.16所得F=5.91>F0.01,因而应否定H0:即4块麦田的虫口密度间有极显著差异。F测验显著,再作平均数间的比较。需进一步计算n0,并求得SE(LSR测验)或(LSD测验)。如在此可有:三、组内又分亚组的单向分组资料的方差分析

单向分组资料,如果每组又分若干个亚组,而每个亚组内又有若干个观察值,则为组内分亚组的单向分组资料,或称系统分组资料。系统分组并不限于组内仅分亚组,亚组内还可分小组,小组内还可分小亚组,……,如此一环套一环地分下去。这种试验称为巢式试验(nestedexperiment)。

设一系统分组资料共有l组,每组内又分m个亚组,每一亚组内有n观察值,则该资料共有lmn个观察值,其资料类型如表6.17。组别亚组观察值亚组总和Tij亚组均数组总和Ti组均数1…T12…T2…i1yi11yi12…yi1k…yi1nTi1Ti2yi21yi22…yi2k…yi2nTi2jyij1yij2…yijk…yijnTijmyim1yim2…yimk…yimnTim…l…Tl表6.17

二级系统分组资料个观察值的数据结构

(i=1,2,…,l;j=1,2,…,m;k=1,2,…,n)

表6.17中每一观察值的线性可加模型为:(6·25)

其中为总体平均;

为同一亚组中各观察值的随机变异,具有N(0,)。

为组效应或处理效应固定模型()随机模型~N(0,)

为同组中各亚组的效应固定模型()随机模型~N(0,)

表6.17的任一观察值的总变异可分解为3种来源的变异:(1)组间(或处理间)变异;(2)同一组内亚组间变异;(3)同一亚组内各重复观察值间的变异。其自由度和平方和的估计如下:(1)总变异自由度(6·26)(6·27)(6·28)(2)组间(处理间)变异(6·29)(3)同一组内亚组间的变异(6·30)(4)亚组内的变异(6·31)表6.18

二级系统分组资料的方差分析

变异来源DFSSMSF期望均方(EMS)混合模型随机模型组间组内亚组间亚组内总变异

为测验各亚组间有无不同效应,即测验假设H0:则(6·32)

为测验各组间有无不同效应,测验假设H0:,或H0:,即H0:,则(6·33)

在进行组间平均数的多重比较时,单个平均数的标准误为:(6·34)若进行组内亚组间平均数的多重比较,则单个平均数标准误为:(6·35)

[例6.12]在温室内以4种培养液(l=4)培养某作物,每种3盆(m=3),每盆4株(n=4),一个月后测定其株高生长量(mm),得结果于表6.19,试作方差分析。培养液ABCD总和盆号A1A2A3B1B2B3C1C2C3D1D2D3生长量503545505555856570606065553540456045607070558565403040505065908070354585354050455055856570707575盆总和Tij180140175190215220320280280220265290T=2775培养液总和Ti495625880775培养液平均41.352.173.364.6表6.194种培养液下的株高增长量(mm)(1)自由度和平方和的分解

总变异自由度DFT=lmn-1=(4

3

4)-1=47

培养液间自由度DFt=l-1=4-1=3

培养液内盆间自由度DFe1=l(m-1)=4

(3-1)=8

盆内株间自由度DFe2=lm(n-1)=4

3

(4-1)=36总变异平方和

培养液间平方和培养液内盆间平方和

盆内株间平方和(2)F测验表6.20

表6.19资料的方差分析变异来源DFSSMSFF0.05F0.01

培养液间37126.562375.5215.05**4.077.59

培养液内盆间81262.50157.811.772.223.04

盆内株间363206.2589.06

总变异4711595.31

盆间差异的F测验,假设H0:,求得:

查表得,

v1=8,v2=36时,F0.05=2.22>F,故接受H0:。

对培养液间有无不同效应作F测验,假设H0:,求得:

查表得,

v1=3,v2=8时,F0.01=7.59<F,故否定H0:,接受HA:≠0.

推断:该试验同一培养液内各盆间的生长量无显著差异;而不同培养液间的生长量有极显著的差异。故前者不需再作多重比较,后者则需进一步测验各平均数间的差异显著性。(3)各培养液平均数间的比较

根据期望均方,培养液平均数间的比较应用MSe1,求得:

按v=8,由附表7查得p=2,3,4时的SSR0.05和SSR0.01值,并算得各LSR值列于表6.21。由LSR值对4种培养液植株生长量进行差异显著性测验的结果列于表6.22。表6.21

4种培养液的LSR值(新复极差测验)PSSR0.05SSR0.01LSR0.05LSR0.0123.264.7411.8317.2133.395.0012.3118.1543.475.1412.6018.66表6.224种培养液植株生长量(mm)的差异显著性培养液平均生长量差异显著性0.050.01C73.3aAD64.6aABB52.1b

BCA41.3bC

由表6.22可见,4种培养液对生长量的效应,除C与D、B与A差异不显著外,其余对比均有显著或极显著差异。第五节两向分组资料的方差分析

两因素试验中若因素A的每个水平与因素B的每个水平均衡相遇(或称正交),则所得试验数据按两个因素交叉分组称为两向分组资料。一、组合内只有单个观察值的两向分组资料的方差分析二、组合内有重复观察值的两向分组资料的方差分析

设有A和B两个因素,A因素有a个水平,B因素有b个水平,每一处理组合仅有1个观察值,则全试验共有ab个观察值,其资料类型如表6.23。一、组合内只有单个观察值的两向分组资料的方差分析表6.23

完全随机设计的二因素试验每处理组合只有一个观察值的数据结构(i=1,2,…,a;j=1,2,…,b)A因素B因素总计Ti.平均

B1B2…BbA1y11y12…y1bT1.A2y21y22…y2bT2.Aaya1ya2yabTa.总和T.j

T.1T.2…T.bT..平均…表6.23中观察值的线性模型为:(6·36)

上式的为总体平均;和分别为A和B的效应,可以是固定模型(,)或随机模型[~N(0,),~N(0,)];相互独立的随机误差服从正态总体N(0,)。

(6·36)说明表6.23类型资料的总变异()可分解为A因素第i水平效应、B因素第j水平效应和试验误差三个部分。其各项变异来源自由度和平方和的估计及方差分析见表6.24。表6.24

表6.23类型资料自由度和平方和的分解及方差分析变异来源DFSSMSF混合模型EMS(A固定,B随机)A因素

a

-1B因素

b-1误差(a-1)(b-1)总变异

ab-1表6.24中F测验所作假设为H0:;H0:。[例6.13]采用5种生长素处理豌豆,未处理为对照,待种子发芽后,分别每盆中移植4株,每组为6盆,每盆一个处理,试验共有4组24盆,并按组排于温室中,使同组各盆的环境条件一致。当各盆见第一朵花时记录4株豌豆的总节间数,结果列于表6.25,试作方差分析。处理(A)组(B)总和Ti.

平均ⅠⅡⅢⅣ未处理(CK)6062616024360.8赤霉素6565686526365.8动力精6361616024561.3吲哚乙酸6467636125563.8硫酸腺嘌吟6265626425363.3马来酸6162626525062.5总和T.j375382377375T=1509表6.25

生长素处理豌豆的试验结果(1)自由度和平方和的分解表6.26

表6.25资料的方差分析变异来源DFSSMSFF0.05组间35.451.82<1处理间565.8713.174.562.90误差1543.302.89总变异23114.62(2)F测验上表对组间有无不同效应作F测验,假设H0:,得:对处理间有无不同效应作F测验有H0:得:

推断:组间环境条件无显著差异,不同生长素处理间有显著差异。(3)处理间比较此例有预先指定的对照,故用LSD法。求得:(节间)查得=15时,t0.05=2.131,t0.01=2.947,故:LSD0.05=1.202×2.131=2.56(节间),

LSD0.01=1.202×2.947=3.54(节间)以LSD测验各生长素处理与对照的差异显著性于表6.27。结果赤霉素的效应最强,吲哚乙酸次之,其余处理皆与对照无显著差异。表6.27

豌豆生长素处理后始花时的节间数(4株总和)处理平均数与对照的差数对照60.8-赤霉素65.85.0**动力精61.30.5吲哚乙酸63.83.0*硫酸腺嘌吟63.32.5马来酸62.51.7二、组合内有重复观察值的两向分组资料的方差分析

设有A、B两个试验因素,A因素有a个水平,B因素有b个水平,共有ab个处理组合,每一组合有n个观察值,则该资料有abn个观察值。如果试验按完全随机设计,则其资料类型如表6.28。A因素B因素总和平均B1B2…BbTi··A1y111y121…y1b1T1··y112y122…y1b2y11ny12n…y1bnA2y211y221…y2b1T2··y212y222…y2b2y21ny22n…y2bnAaya11ya21…yab1Ta··ya12ya22…yab2ya1nya2n…yabn总和T·j·T·1·T·2·…T·b·T···

平均…表6.28完全随机设计的二因素试验,每处理组合有重复观察值的数据结构

(i=1,2,…,a;j=1,2,…,b;k=1,2,…,n)表6.28中观察值的线性模型为:(6·37)

上式的为总体平均;和分别为因素A和B的效应;为A×B互作;为随机误差,遵循分布N(0,)。上式说明表6.28类型资料的总变异()可分解为A因素效应、B因素效应、A×B互作和试验误差四个部分。其各变异来源的自由度和平方和估计可见表6.29。表6.29

表6.28类型资料自由度和平方和的分解(C=T2/abn)

变异来源DFSSMS

处理组合ab-1a-1b-1(a-1)(b-1)

试验误差ab(n-1)

总变异abn-1

线性模型的假定条件随试验模型而不同。在固定模型时,满足条件:,,;对于随机模型时,满足条件:、和都是相互独立的随机变数,遵循正态分布,具平均数0并分别有方差、和。由于有两个试验因素,故在两种模型的基础上可产生第三种模型:混合模型。混合模型的假定是一因素的效应随机,另一因素的效应固定。

例如,若A的效应随机,B的效应固定,则满足条件:

,而和皆为相互独立的随机变数,遵循具平均数0,方差分别为和的正态分布。各种模型的期望均方见表6.30。表6.30

表6.28类型资料各变异来源的期望均方变异来源MS期望均方(EMS)模型Ⅰ:固定模型模型Ⅱ:随机模型混合模型(A随机,B固定)A因素B因素A×B互作试验误差

由表6.30可见,对效应和互作进行F测验的分母需因模型的不同而不同:

在固定模型时,测验H0:,H0:和H0:皆以MSe为分母;在随机模型时,测验H0:以MSe为分母,而测验H0:和H0:需以MSAB为分母;在A随机B固定的混合模型中,测验H0:和H0:以MSe为分母,而测验H0:需以MSAB为分母。[例6.14]施用A1、A2、A33种肥料于B1、B2、B33种土壤,以小麦为指示作物,每处理组合种3盆,得产量结果(g)于表6.31。试作方差分析。表6.31

3种肥料施于3种土壤的小麦产量(g)(a=3,b=3,n=3,abn=27)肥料种类(A)盆土壤种类(B)总和平均B1(油砂)B2(二合)B2(白僵)A1121.419.617.6221.218.816.6169.218.8320.116.417.562.754.851.7A2112.013.013.3214.213.714.0118.213.1312.112.013.938.338.741.2A3112.814.212.0213.813.614.6122.013.6313.713.314.040.341.140.6总和141.3134.6133.5T=409.4平均15.715.014.8(1)自由度和平方和的分解表6.32

表6.31资料的方差分析变异来源DFSSMSFF0.01

处理组合间8202.5889.6996.65**6.012179.3889.6996.65**6.0123.961.982.136.01419.244.815.18**4.58

试验误差1816.700.928

总变异26219.28(2)F测验

以固定模型作F测验。假设H0:,求得F=4.81/0.928=5.18>F0.01;假设H0:,求得F=89.69/0.928=96.65>F0.01;假设H0:,求得F=1.98/0.928=2.13<F0.05。

所以该试验肥类×土类的互作和肥类的效应间差异都是极显著的,而土类间无显著差异。(3)平均数的比较①各处理组合平均数的比较:肥类×土类的互作显著,说明各处理组合的效应不是各单因素效应的简单相加,而是肥类效应随土类而不同(或反之);所以宜进一步比较各处理组合的平均数。在此用新复极差测验,求得:根据v=18,算得各LSR0.05和LSR0.01的值于表6.33。表6.33

表6.31资料各处理组合平均数的LSR值(新复极差测验)p23456789SSR0.052.973.123.213.273.323.353.373.39SSR0.014.074.274.384.464.534.594.644.68LSR0.051.651.731.781.821.851.861.871.88LSR0.012.262.372.442.482.522.552.582.60

将表6.31的各个Tij.值除以n=3,即得各处理组合的平均数,以表6.33的显著尺度测验各平均数的差异显著性于表6.34。表6.34

表6.31资料各处理组合平均数的新复极差测验处理组合平均数(g)差异显著性0.050.01A1B120.9aAA1B218.3b

BA1B317.2b

BA2B313.7cCA3B213.7cCA3B313.5cCA3B113.4cCA2B212.9cCA2B112.8cC②各肥类平均数的比较:肥类间的F测验极显著,说明≠0。求得肥类平均数的标准误:

故有各肥类平均数的LSR值于表6.35,显著性测验结果于表6.36。表6.35

表6.31资料肥类平均数的LSR值pSSR0.05SSR0.01LSR0.05LSR0.0122.974.070.951.3033.124.271.001.37表6.36

表6.31资料各肥类平均数的新复极差测验肥料种类平均数差异显著性0.050.01A118.8aAA313.6bBA213.1bB

由表6.36可见,肥料A1与A3、A2均有极显著的差异;但A3与A2无显著差异。

综上所述,表6.31试验结果的基本信息是:肥料A1

对小麦的增产效果最好,土类间则无显著差异;但A1施于油砂土(A1B1)却比施于其他土壤上更有突出的增产效果第六节方差分析的基本假定和数据转换一、方差分析的基本假定二、数据转换一、方差分析的基本假定

方差分析是建立在线性可加模型的基础上的。所有进行方差分析的数据都可以分解成几个分量之和,以例6.13资料(样本)采用6生长素处理试验资料为例,该资料具有三类原因或效应:

(1)处理(生长素)原因或效应;

(2)环境(组)原因或效应;

(3)试验误差(这是处理内和环境内的其它非可控因素的变异)。故其线性模型为:

建立这一模型,有如下3个基本假定:(1)处理效应与环境效应等应该具有“可加性”(additivity)

以组合内只有单个观察值的两向分组资料的线性可加模型为例予以说明,如对其取离差式,则上式两边各取平方求其总和,则得平方和为:(6·38)

因为三类原因均各自独立,所以右边有三个乘积和,即、和,皆为零值。当从样本估计时,则为:或样本平方和的可加性:

对于非可加性资料,一般需作对数转换或其他转换,使其效应变为可加性,才能符合方差分析的线性模型。

有一种非可加性事例是效应表现为倍加性。将倍加性数据转换为对数尺度,则又表现为可加性模型。如表6.37假设数字(不考虑误差).表6.37

可加性模型与非可加性模型的比较处理可加性倍加性对倍加性取对数(lg10)121212A102010201.001.30B304030601.481.78(2)试验误差应该是随机的、彼此独立的,具有平均数为零

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论