第七章方差分析《试验设计与统计分析》课件_第1页
第七章方差分析《试验设计与统计分析》课件_第2页
第七章方差分析《试验设计与统计分析》课件_第3页
第七章方差分析《试验设计与统计分析》课件_第4页
第七章方差分析《试验设计与统计分析》课件_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章方差分析第一节方差分析的意义3个以上平均数间的差异进行显著性检验,若仍采用t检验法两两检验,将存在以下三方面的缺陷:其一,检验过程非常烦琐。其二,不能充分利用试验资料的全部信息,精度不高。其三,随着k的增大,犯第一类错误的概率也将增加。第二节方差分析的步骤一、自由度和平方和的分解方差是平方和除以自由度的商。因此,方差分析的第一步就是进行自由度和平方和的分解。设有k个处理,每个处理皆含有n个重复观察值的完全随机试验资料,其数据结构见表7.1。处理重复观察值(xij,i=1,2,…,k;j=1,2,…,n)总和Ti平均1x11x12…x1nT12x21x22…x2nT2…………ixi1xi2…xinTi…………kxk1xk2…xknTkT=Σxij=Σx表7.1k个处理每处理n个重复观察值的完全随机试验数据符号表表7.1nk个观察值的单向分组资料模式样本号(处理号)12……k观察值xij(i=1,2…k,j=1,2…n)x11

x12

x13┇┇┇

x1nx21

x22

x23┇┇┇

x2nxk1

xk2

xk3┇┇┇

xkn总和T1T2…Tk平均总变异平方和总变异是nk个观察值的变异,受条件的限制,自由度为nT=nk-1总变异平方和可以分解为处理内和处理间两个部分处理内(即误差)变异为各处理内观察值与处理平均数的变异,因每处理具有自由度(n–1)和平方和而资料共有k个处理,故处理内自由度为:

dfe=k(n–1)处理内平方和SSe为:处理平均数间的平方和具自由度nt=k-1,注意为了正确地进行F测验,必须使它们都估计着同一参数s2,。因而,样本间的平方和应为:总变异的=处理间的+处理内的

平方和

SST=SSt

+SSe

自由度(nk-1)=(k-1)+k(n-1)进而得:

样本间的均方样本内的均方

〔例7.1〕研究A、B、C、D、E共5个饲草品种的鲜草产量差异,E为对照,盆栽试验,每品种3盆,完全随机放置于同一网室内。以对照E孕穗期作为刈割日期,测得各品种单株鲜重(g)见表7.2,试分解其自由度和平方和。ABCDE244359112271200274453132282202267380150198190总和Ti7851192394751592T=3714平均261.7397.3131.3250.3197.3=247.6表7.2不同饲草品种单株鲜重的结果(g)解:总变异自由度dfT=nk-1=35-1=14处理(品种)间自由度dft=k-1=5-1=4品种内(误差)自由度dfe=k(n-1)=5(3-1)=10矫正数

处理(品种)间平方和品种内(误差)平方和进而可得:总变异均方品种间均方

品种内均方

二、

F检验方差分析中的F检验主要用于检验某项变异因素的效应或方差是否真实存在,是一尾F检验。因此在计算F值时,必须以要检验项变异因素的均方作分子,以另一项变异(例如试验误差项)的均方作分母。此比法与方差分析模型和各项变异来源的期望均方有关。在此类检验中,所检验的统计假设

如果作分子的均方小于作分母的均方,则F<1,可以不必查F表即可确定P>0.05,接受H0。〔例7.2〕〔例7.1〕已算得品种间均方

品种内均方

具自由度df1=4,df2=10。试检验品种间变异是否显著大于品种内(即误差)变异?解:①假设或H0:A=

B=

C=

D=

E;或HA:

A、

B、

C、μD和

E间存在差异,(

A、

B、

C、

D和

E间不“完全相等”)②显著水平分别取=0.05和=0.01。∵st2试验误差+处理效应差异

se2试验误差∴st2/se2≤1,说明无处理效应;

>1,说明可能有处理效应;

>Fa,说明处理效应显著存在。因此要测验H0,必需使F=st2/se2,③计算本例查F分布右尾临界值表(附表5):当df1=4,df2=10时,F0.05(4,10)=3.48,F0.01(4,10)=5.99,实得F>F0.01(4,10)>F0.05(4,10)。④推断:即品种间变异在0.01水平上显著大于品种内(即误差)变异,说明不同品种的单株鲜重在0.01水平上有显著差异(P=2.05×10-)5。

在统计分析过程中,一般将自由度和平方和分解及F检验结果,归纳整理成方差分析表,并在F值右上角用“*”、“**”分别标注=0.05和=0.01的显著性,如表7.3所示。表7.3不同饲草品种单株鲜重的方差分析表变异来源DFSSMSF显著标准PF0.05(4,10)F0.01(4,10)品种间4116010.329002.5728.06**3.485.992.05×10-5品种内(误差)1010335.31033.53总的14126345.6三、多重比较F检验的结果表明处理间是否存在真实差异。若F<F0.05,则方差分析告一段落;若F>F0.05,就表明各处理间的差异非试验误差所致而是实质性差异.但是F检验无法判定哪些处理间差异达到0.05或0.01显著水平,哪些处理间没有显著差异。要明确这一问题,需要进一步对处理间平均数进行两两比较——多重比较(multiplecomparisons)。1、多重比较方法的种类多重比较方法很多,下面介绍常用的FPLSD法、DLSD法、q法和SSR法。(1)FPLSD法FPLSD(Fisher’sProtectedLeastSignificantDifference)法即Fisher氏保护下的最小显著差数法,又称PLSD法。首先是在处理间的F检验为显著的前提下,确定一个最小显著尺度LSDα;若则在α水平上显著;反之,在α水平上不显著。所以,FPLSD法实质上仍是t检验。其中t,为显著水平为时,误差项自由度dfe下的t临界值。

在t检验中,为平均数差数的标准误,且当n1=n2=n时,在方差分析中,

是所有处理共同的误差方差,因此(7.9)

的可用于所有处理间的多重比较。

例7.3〕试以FPLSD法,检验表7.2资料各品种平均数间的差异显著性。解:在〔例7.2〕中,已算得F=28.06**达0.01显著水平,s2e=1033.53,dfe=15,查t分布两尾临界值表(附表4),取显著水平=0.05和=0.01,当dfe=10时,t0.05(10)=2.228,t0.01(10)=3.169故LSD0.05=2.228×26.249=58.48(g);LSD0.01=3.169×26.249=83.18(g)返回DLSD法然后,将各品种的单株鲜重进行两两比较,若相比较的两平均数的差数绝对值≥58.48g,则在0.05水平上显著;若差数绝对值≥83.18g,则在0.01水平上显著。多重比较的表示方法(列梯形法)处理平均数B397.3266.0**200.0**147.0**135.6**A261.7130.4**64.4*11.4D250.3119.0**53.0E197.366.0*C131.3结论:5个品种以品种B的单株鲜重最高,与A、D、E、C的差异均达到0.01显著水平;其次是品种A,但与品种D差异未达到0.05显著水平;品种C单株鲜重最低,且与其他品种的差异均达到0.05或0.01显著水平;对照E单株鲜重超过品种C,居第4位,除与D差异未达到0.05显著水平外,与其他品种差异均达到0.05或0.01显著水平。

处理平均数与对照(CK)的差异B397.3200.0**A261.764.4*D250.353.0E(CK)197.3-C131.366.0*(2)DLSD法DLSD(Dunnett’sLeastSignificantDifference)法即Dunnett氏最小显著差数法专供检验若干个处理平均数与共同比较标准CK平均数的差异显著性。任一平均数与CK平均数差数的绝对值≥|DLS

|时,则在水平上显著;反之,在水平上不显著。DLSD法与FPLSD法唯一不同的是:DLSD法是查Dunnett’s

Dt临界值-----Dt

FPLSD法是查t临界值-----t

:即Dunnett’s最小显著差数为:为平均数差数的标准误,计算公式同(7.9)式;为误差项自由度dfe下,处理数为k(不包括CK)时Dunnett氏临界值。〔例7.4〕试以DLSD法,检验表7.2资料各品种平均数间的差异显著性。解:在〔例7.2〕中已算得

=26.249(g)

查Dunnett’s

Dt临界值表(附表6),取显著水平α=0.05和α=0.01,当dfe=10、k=4时,Dt0.05(10,4)=2.97,Dt0.01(10,4)=3.95故DLSD0.05=2.97×26.249=77.96(g);DLSD0.01=3.95×26.249=103.68(g)对比PLSD法将各品种的单株鲜重与对照E进行比较,两样本平均数的差数≥77.96g为在0.05水平上差异显著;差数≥103.68g为在0.01水平上差异显著。结论:由表7.2可知,只有品种B与对照E平均数的差异达到0.01显著水平,其他品种与对照E的差异均未达到0.05的显著水平。处理平均数与对照(CK)的差异B397.3200.0**A261.764.4D250.353.0E(CK)197.3-C131.366.0(3)q法q法由Student-Newman-Keul于1952年提出,一般称为复极差检验法,有时又称SNK检验法或NK检验法。该方法是将一组k个平均数由大到小排列后,根据所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差(LeastSignificantRanges)值。q检验因是根据极差抽样分布原理,其各个比较都可保证同一个显著水平。其最小显著极差为:其中为平均数的标准误:为显著水平;dfe为误差项自由度;p为秩次距,是所有比较的平均数按大到小顺序排列所计算出的两极差范围内所包含的平均数个数。

即在显著水平为

、误差项自由度为dfe、秩次距为p(2≤p≤k)时的q临界值。因此,在每一显著水平下该法有k-1个尺度值。平均数比较时,尺度值随秩次距p的不同而异。当要检验的两个平均数的差数绝对值≥时,则在水平上显著;反之,在水平上不显著。〔例7.5〕试对表7.2资料的各平均数作q检验。解:〔例7.1〕已算得:s2e=1033.53,n=3。所以,查q临界值表(附表7),取显著水平α=0.05和α=0.01,当dfe=10时,p=2,3,4,5的值,并由(7.12)计算出最小显著极差,列于表7.4表7.4表7.2资料及值pq0.05q0.01LSR0.05LSR0.0123.154.4858.4683.1533.885.2772.0197.8144.335.7780.36107.0954.656.1486.30113.96多重比较的表示方法(列梯形法)处理平均数B397.3266.0**200.0**147.0**135.6**A261.7130.4**64.411.4D250.3119.0**53.0E197.366.0*C131.3结论:5个品种的单株鲜重以B品种最高、C品种最低;对照品种E居第4位,与FPLSD法检验结果不一致的是,对照E与品种A的差异未达到0.05的显著水平。(4)SSR法SSR法(ShortestSignificantRanges)又称新复极差法,或称最短显著极差法。由D.B.Duncan于1955年提出。该法与q法相似,区别仅在于计算最小显著极差LSRα时,不是查q临界值表,而是查Duncan’sSSR临界值表。即最短显著尺度为:〔例7.6〕试采用SSR法,对表7.2资料各平均数进行多重比较。解:在〔例7.5〕中已算得:

。查Duncan’sSSR临界值表(附表8),取显著水平=0.05和=0.01,当dfe=10,p=2、3、4、5时及LSRα值见表7.5。

表7.5表7.2资料SSRα及LSRα值pSSR0.05SSR0.01LSR0.05LSR0.0123.154.4858.4683.1533.304.7361.2587.7943.374.8862.5590.5753.434.9663.6692.06处理平均数B397.3266.0**200.0**147.0**135.6**A261.7130.4**64.4*11.4D250.3119.0**53.0E197.366.0*C131.3将要比较的平均数从大到小依次排列,求得它们各自的差数,与相应的LSRα值进行比较:多重比较的表示方法(列梯形法)2、多重比较方法的比较及选择测验方法显著尺度犯第一类错误的概率何种情况下使用FPLSD测验低大和对照比较或多个平均数间比较时接受H0事关重大或后果严重SSR测验多个平均数间比较时一般试验q测验多个平均数间比较时否定H0事关重大或后果严重DLSD测验高小和对照比较时综上所述,将方差分析的基本步骤可归纳如下:①计算各项变异的自由度和平方和,并进而算得其均方;②列出方差分析表,进行F检验;③若F检验不显著,方差分析告一段落;反之,需进行多重比较。多重比较的方法应根据试验设计和要求合理选择,并将最终结果用简单明晰的方式表示出来。第三节

方差分析的数学模型与期望均方一、数学模型方差分析是建立在一定数学模型基础之上的。如表7.1资料的数学模型为:xij=+i+ij为总体平均数,i为处理效应,ij为随机误差具有分布N(0,σ2)。若以样本符号表示,其线性组成为:为的无偏估计量。

ti是τi的无偏估计量。

为其所属亚总体误差方差的无偏估计量。

据此,总变异的平方和可分解为试验误差平方和与处理间平方和,即:试验误差平方和为

假设H0:

1=

2=…=

k,则

1=

2=…=

k=

;故可看成总体2的无偏估计。这样,各亚总体合并的也就是σ2的无偏估计量。

处理间平方和是

均方为:因ti

=i+ei,故估计了二、期望均方是σ2的无偏估计量,所以2为的数学期望(mathematicalexpectation),为的数学期望,并被称为期望均方,简记为EMS(expectedmeansquares)。其中,部分因性质的不同而异,分为固定模型(fixedmodel)和随机模型(randommodel)。1、固定模型固定模型是指各处理的平均效应τi=μi-μ是固定的一个常量,且满足Σi=0(或Σnii=0),但此常量未知。其研究对象是处理本身,处理效应i为固定的处理效应。固定模型的目的仅在于了解处理间的不同效应。例如,研究若干个小麦新品种的产量,或探讨某水稻品种几种密度、几种肥料、几种农药的效应等。选用固定模型时,(7.17)式中的为固定效应的方差,一般用表示,因而处理间均方估计了。在F检验中假设H0:τi=0(i=1,2,…,k),即H0:1=2=…=k;对HA:i≠0。若F>F,则表示存在,τi≠0,处理效应真实存在;若

F<F,则表示不存在,i=0,处理效应不存在。〔例7.9〕进行7个玉米品种单株籽粒产量比较试验,每品种3次重复,完全随机设计。本试验需明确各品种的效应,因此为固定模型,其方差分析和期望均方的参数估计列于表7.8。表7.87个玉米品种单株产量的方差分析和期望均方表变异来源DFSSMSFF0.05P期望均方(EMS):固定模型品种间68068.251344.715.35*2.850.0046品种内(误差)143520.66251.48总变异2011588.91品种内se2估计了σ2,因而;品种间st2估计了σ2+nκ2,因而。现F=5.35>F0.05,说明在0.05水平上τi是存在的,说明了品种效应间的变异。2、随机模型随机模型是指各处理效应τi不是常量,而是从正态总体N(0,t2)中得到的一个随机变量;总体方差是重要的研究对象,其目的是要对所研究处理所属的总体作出推论。如研究黄河流域棉区陆地棉地方品种的遗传变异,可从该地区大量地方品种中随机抽取一部分品种作为代表进行试验,以便通过这些品种的试验结果推论该地区陆地棉地方品种的总体情况,这种处理效应便是随机模型的处理效应。选用随机模型时,(7.17)式中的为随机效应的方差,一般记为st2即处理间均方估计了s2+nst2,在F检验中,假设H0:

st2=0;对HA:

st2≠0显然,这里检验的是处理效应的变异度(方差)是否存在,而不是检验处理效应本身是否存在。若F>Fα,则表示,处理间的变异真实存在;若F<Fα

,则表示,处理间的变异不存在。〔例7.10〕研究大豆对食叶性害虫感抗杂种F4代家系间单株荚数的遗传变异,随机抽取50个家系进行试验,每家系随机调查3株。因这50个家系是随机抽取的样本,要从这些样本来估计F4代家系间单株荚数的遗传变异,因此是随机模型。方差分析和期望均方的参数估计见表7.9。变异来源DFSSMSFF0.05P期望均方(EMS)随机模型家系间494376.1989.317.28*1.483.59×10-17家系内(误差)1001226.0012.26总变异1495602.19表7.9大豆对食叶性害虫感抗杂种F4代单株荚数的方差分析和期望均方表7.9的家系间均方st2估计了s2+nst2

,即

;家系内均方se2估计了s2

,即。现F=7.28>F0.05,说明在0.05水平上是存在的。因此,是系统间变异方差的估计。综上所述,固定模型和随机模型,在试验设计思路和统计推断上有明显不同。固定模型中得出的结论仅推断特定的处理;随机模型的试验结论则用于推断处理的总体。混合模型(记作模型Ⅲ)。混合模型中既包括有固定模型的试验因素,又包括有随机模型的试验因素。

第四节

方差分析的基本假定和数据转换一、基本假定1、效应的“可加性”对试验所考察性状有影响的各变异来源的效应(如环境效应)应具有“可加性”(additivity)。表7.1资料的数学模型为:xij=μ+τi+εij或xij-μ=τi+εij

。可加性实际上是方差分析时平方和分解的数学依据。当用样本估计时,对于非可加性资料,一般需进行对数转换或其他转换,使其效应变为可加性。如表7.10中,将倍加性数据用1gx转换后就表现为可加性模型了。表7.10倍加性模型与可加性模型的比较及其对数转换处理可加性倍加性倍加性的1gx组Ⅰ组Ⅱ组Ⅰ组Ⅱ组Ⅰ组ⅡA23230.3010.477B45690.7780.9542、误差的“正态性”试验误差εij应该是随机的、彼此独立的,具有平均数为零且作正态分布,即“正态性”(normality)。试验误差是否符合“正态性”,一般用Bartlett氏(1937)c2法进行检验。3、误差方差的“同质性”所有试验处理必须具有共同的误差方差,即误差方差的“同质性”(homogeneity)。当试验结果中各处理内的方差差异较大时,应采用Bartlett氏法检验其是否同质。在生产实践和科学研究中,如果误差方差不同质,可将变异特殊或方差特别大的处理从该试验中剔除,也可将试验分成几个部分,使每一部分具有比较同质的误差方差,从而作出合理的检验。二、数据转换对于不符合三个基本假定的资料,可通过数据转换来消除非可加性、非正态性和非同质性,然后再用转换后的数据进行方差分析。也可以在进行方差分析之前,先剔除某些表现“特殊”的观察值、处理或重复也可将总的误差方差分裂为几个较为同质的误差方差;或者抽取小样本求得其平均数,然后再用这些平均数作方差分析.可减小不符合基本假定因素的影响。

对于变异度很大的间断性变量,这类资料往往样本平均数与其方差有比例关系,服从poisson分布。采用平方根转换,将原观察值x转换成;若有些观察值非常小,出现0值,则宜用转换。2、对数转换(logarithmictransformation)如数据资料表现为非可加性而呈倍加性,且样本平均数与其标准差或极差成比例关系,或者已知处理效应和处理水平的变化呈比例而非可加,宜采用对数转换。一般将

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论