方差分析课件_第1页
方差分析课件_第2页
方差分析课件_第3页
方差分析课件_第4页
方差分析课件_第5页
已阅读5页,还剩155页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

t检验法适用于两样本平均数的差异检验,但需进行多个平均数间的差异显著性检验。这时若仍采用t检验法就不适宜。处理这类问题通常采用方差分析方法。

方差分析

(Analysisofvariance简称ANOVA)用于推断多个总体均数有无差异t检验法适用于两样本平均数的差异检验,但方差分析1例在饲料养鸡增肥的研究中,某饲料研究所提出三种饲料配方:

A1是以鱼粉为主的饲料,A2是以槐树粉为主的饲料,A3是以苜蓿粉为主的饲料。为比较三种饲料的效果,特选24只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量。试验结果如下表所示:例在饲料养鸡增肥的研究中,某饲料研究所提出三种饲料配方:2鸡饲料试验数据

饲料A鸡重(克)A110731009106010011002101210091028A21107109299011091090107411221001A310931029108010211022103210291048鸡饲料试验数据饲料A鸡重(克)A110731009103

本例中,我们要比较的是三种饲料对鸡的增肥作用是否相同。为此,我们把饲料称为因子,记为A,而三种不同的配方称为因子A的三个水平,记为A1,A2,A3,使用配方Ai下第j只鸡60天后的重量用yij表示,i=1,2,3,j=1,2,,10。我们的目的是比较三种饲料配方下鸡的平均重量是否相等,为此,需要做一些基本假定,把所研究的问题归结为一个统计问题,然后用方差分析的方法进行解决。本例中,我们要比较的是三种饲料对鸡的增4

方差分析又叫变异数分析,1928年由英国统计学家RonaldFisher首先提出来的,所以方差分析又叫F检验。第一节方差分析简介方差分析又叫变异数分析,1928年由英国统计学家Rona5单因素方差分析(即完全随机设计资料的方差分析)、两因素方差分析(即随机区组设计资料的方差分析)和三因素方差分析(即拉丁方设计资料的方差分析)及多个样本均数间的多重比较。方差分析主要内容单因素方差分析(即完全随机设计资料的方差分析)、方差分析主要6

方差分析的基本思想借助以下例题予以说明:

例:为研究煤矿粉尘作业环境对尘肺的影响,将18只大鼠随机分到甲、乙、丙3个组,每组6只,分别在地面办公楼、煤炭仓库和矿井下染尘,12周后测量大鼠全肺湿重(g),数据见表9—2,问不同环境下大鼠全肺湿重有无差别?

一、方差分析的基本思想

方差分析的基本思想借助以下例题予以说明:一、方差分析的基7甲组乙组丙组4.24.55.63.34.43.63.73.54.54.34.25.14.14.64.93.34.24.7

ni666甲组乙组丙组4.24.55.63.34.43.638

从以上资料可看出,三个组的数据各不相同,这种差异(总变异)可以分解成两部分:即

(1)组间变异:甲、乙、丙三个组大鼠全肺湿重各不相等(此变异反映了处理因素的作用,以及随机误差的作用)

(2)组内变异:各组内部大鼠的全肺湿重各不相等(此变异主要反映的是随机误差的作用)从以上资料可看出,三个组的数据各不相同,这种差9各部分变异的计算:

①总变异(全部试验数据间大小不等)用总离均差平方和来表示。

其中各部分变异的计算:①总变异(全部试验数据10

②组间变异(由于所接受的处理因素不同而致各组间大小不等)用组间离均差平方和来表示。

各组均数之间相差越大,它们与总均数的差值就越大,越大;反之,越小。②组间变异(由于所接受的处理因素不同而致各组间大小11③组内变异(同一处理组内部试验数据大小不等)用组内离均差平方和来表示。

③组内变异(同一处理组内部试验数据大小不等)用组内离均差平方12三个变异之间的关系:

其中:

三个变异之间的关系:其中:13离均差平方和只能反映变异的绝对大小。变异程度除与离均差平方和的大小有关外,还与其自由度有关,由于各部分自由度不相等,因此各部分离均差平方和不能直接比较,须除以相应的自由度,该比值称均方差,简称均方(MS)。

的大小就反映了各部分变异的平均大小。离均差平方和只能反映变异的绝对大小。变异14

方差分析就是通过比较组内均方和组间均方的大小关系来判断处理因素有无效应。

检验统计量:

如果各组的总体均数相等,即无处理因素的作用,则组内变异和组间变异都只反映随机误差的大小,此时组间均方和组内均方大小相当,即F值则接近1,各组均数间的差异没有统计学意义;反之,如果处理有作用,则组间变异不仅包含随机误差,还有处理因素引起的变异(组间变异主要反映处理因素的作用),此时组间均方远大于组内均方,则F值远大于1,各组均数间的差异有统计学意义。故依据F值的大小可判断各组之间有无差别。方差分析就是通过比较组内均方和组间均方15

可见,方差分析的基本思想就是

根据实验设计的类型,将全部测量值总的变异分解成两个或多个部分,每个部分的变异可由某个因素的作用(或某几个因素的作用)加以解释,通过比较各部分的均方与随机误差项均方的大小,借助

F

分布来推断各研究因素对实验结果有无影响。可见,方差分析的基本思想就是16方差分析的应用条件(1)各观测值相互独立,并且服从正态分布;(2)各组总体方差相等,即方差齐性。方差分析的应用条件(1)各观测值相互独立,并且服从正171用于两个或多个均数间的比较2分析两个或多个因素的交互作用3回归方程的假设检验4方差齐性检验方差分析的用途1用于两个或多个均数间的比较方差分析的用途18第二节单因素方差分析

完全随机设计资料的方差分析一、完全随机设计完全随机设计是采用完全随机化的分组方法,将全部试验对象分配到g个处理组,各处理组分别接受不同的处理,试验结束后比较各组均数之间差别有无统计学意义,以推断处理因素的效应。第二节单因素方差分析

完全随机设计资料的方差分析一、完全随19将衡量试验结果的标志称为试验指标。将影响试验结果的条件称为因素。因素在试验中所处的不同状态称为该因素的水平。

只考察一个影响条件即因素的试验称为单因素试验,相应的方差分析称为单因素方差分析。方差分析的基本概念将衡量试验结果的标志称为试验指标。方差分析的基本概念20二、变异分解

完全随机设计资料的方差分析表变异来源自由度SSMSF

总变异

组间

组内二、变异分解完全随机设计21单因素方差分析表方差来源离差平方和自由度均方F值临界值Fα因素A(组间)SSAk-1SSA/(k-1)Fα(k-1,n-k)误差E(组内)SSEn-kSSE/(n-k)总变量SST=SSA+SSEn-1单因素方差分析表方差来源离差平方和自由度均方F值临界值22例1试根据表2试验结果,检验三组大鼠全肺湿重的总体均数是否相同。解:(1)建立假设,并确定检验水准。

H0:

H1:

不等或不全相等

三、分析步骤例1试根据表2试验结果,检验三组大鼠全肺湿重的总体均数是否相23(2)计算F值表2三组大鼠的全肺湿重(g)

(2)计算F值表2三组大鼠的全肺湿重(g)24本例

,以上计算结果代入方差分析表,并求出相应的MS

及F

值:表9-3例9-1的方差分析表变异来源SSv

MSF

值P值组间2.52821.2644.70<0.05组内4.035150.269总6.56317本例,25(3)查F界值表,确定P值并作结论。

由附表

5

查得F0.05(2,15)=3.68,F=4.70>F0.05(2,15),故P<0.05,按=0.05水准拒绝H0,接受H1,差别有统计学意义,可认为不同粉尘环境影响大鼠的全肺湿重。当g=2时,方差分析的结果与两样本均数比较的t检验等价,且有。(3)查F界值表,确定P值并作结论。26单因子方差分析的统计模型

只考察了一个因子,称其为单因子试验。通常,在单因子试验中,记因子为A,设其有r个水平,记为A1,A2,…,Ar。在每一水平下考察的指标可以看成一个总体,因为现共有r个水平,故有r个总体,单因子方差分析的统计模型只考察了一个因子,称其为单因子试271、每一总体均为正态总体,记为N(i,

i2),

i=1,2,…,r;2、各总体的方差相同:1

2=22=…=

r2=

2;(即,具有方差齐次性)3、从每一总体中抽取的样本是相互独立的,即所有的试验结果yij都相互独立。

假定:1、每一总体均为正态总体,记为N(i,i2),28

我们要比较各水平下的均值是否相同,即要对如下的一个假设进行检验:H0

:1

=2=…=r

H1

:1,2,…,r不全相等如果检验结果为H0成立,因子A的r个水平均值相同,称因子A的r个水平间没有显著差异,简称因子A不显著反之,当H0不成立时,因子A的r个水平均值不全相同,称因子A的不同水平间有显著差异,简称因子A显著。

我们要比较各水平下的均值是否相同,29

单因子方差分析的统计模型:

模型可以改写为H0

:a1

=a2=…=ar=0单因子方差分析的统计模型:30第三节两因素方差分析

随机区组设计资料的方差分析

一、随机区组设计随机区组设计(randomizedblockdesign),又称配伍组设计,是配对设计的扩展。具体做法是:先按影响试验结果的非处理因素将受试对象配成区组(block),再将各区组内的受试对象随机分配到不同的处理组,各处理组分别接受不同的处理,试验结束后比较各组均数之间差别有无统计学意义,以推断处理因素的效应。第三节两因素方差分析

随机区组设计资料的方差分析一31该设计的特点:(1)该设计包含两个因素,一个是区组因素,一个是处理因素;(2)各区组及处理组的受试对象数相等,各处理组的受试对象生物学特性较均衡,可减少试验误差,提高假设检验的效率。此类资料的方差分析,其应用条件同前:即资料满足正态性及方差齐性的要求。该设计的特点:(1)该设计包含两个因素,一个是区组因素,一个32

因为随机区组设计可以将区组间变异从完全随机设计的组内变异中分离出来以反映不同区组对结果的影响,所以随机区组设计全部测量值总的变异相应地就分成三部分。

各种变异之间的关系是:

其中:

二、

变异分解因为随机区组设计可以将区组间变异从完全随机设计的组33(1)总变异:反映全部试验数据间大小不等的状况,(2)处理组间变异:甲、乙、丙三个组间测量值的均数大小不等,(3)区组间变异:12个区组间测量值的均数大小不等,(4)误差变异:反映随机误差产生的变异,(1)总变异:反映全部试验数据间大小不等的状况,34表9-5随机区组设计的方差分析表

变异来源自由度SSMSF

总变异处理间区组间

误差表9-5随机区组设计的方差分析表变异来源自由35二、分析步骤

结合例9-2:

例9-2研究甲、乙、丙三种营养素对小白鼠体重增加的影响,已知窝别为影响因素。拟用6窝小白鼠,每窝3只,随机地安排喂养甲、乙、丙三种营养素之一种,8周后观察小白鼠体重增加情况,数据见表9-6。问:(1)不同营养素之间小白鼠的体重增加是否不同?(2)不同窝别之间小白鼠的体重增加是否不同?二、分析步骤

结合例9-2:36表9-6三种营养素喂养小白鼠所增体重(g)

窝别号甲营养素乙营养素丙营养素164657325354593716879441463855058656424046表9-6三种营养素喂养小白鼠所增体重(g)窝别号甲营37(1)建立假设、确定检验水准。处理:H0:甲=乙=丙(三种营养素对小白鼠体重增加作用相同)H1:甲,乙,丙不全相等(三种营养素对小白鼠体重增加作用不全相同)区组:H0:1=2=…=6(窝别对小白鼠体重增加无影响)H1:1,2,…,6不全相等(窝别对小白鼠体重增加有影响)

(2)计算检验统计量F

值。计算各处理组的小计,各区组的小计,见表9-6。(1)建立假设、确定检验水准。38表9-6三种营养素喂养小白鼠所增体重(g)

窝别号甲营养素乙营养素丙营养素区组合计(Bj)164657320225354591663716879218441463812555058651736424046128处理组合计(Ti)32133136010121789118845228365957253.555.260.056.22表9-6三种营养素喂养小白鼠所增体重(g)窝别号甲营39本例,方差分析课件40表9-2例9-2方差分析表变异来源

SSV

MSFP处理组间136.778268.3894.24<0.05区组间2377.1115475.42229.49<0.01误差161.2221016.122总变异2675.11117表9-2例9-2方差分析表变异来源SS41①处理因素:查F界值表,,因,故P<0.05

。结论:按α=0.05水准,拒绝H0,接受H1,差别有统计学意义,可认为不同营养素对小白鼠体重增加有影响。②区组因素:查F界值表,

,,F>F

0.01(5,10),故P<0.05。结论:按α=0.05水准,拒绝H0,接受H1,差别有统计学意义,可认为不同窝别对小白鼠体重增加有影响。(3)查F界值表,确定P

值并作结论。①处理因素:查F界值表,42随机区组设计的优点是,从组内变异中分离出区组变异从而减少了误差均方,使处理组间的F

值更容易出现显著性,即提高了统计检验效率。当g=2时,随机区组设计方差分析与配对设计资料的t检验等价,有t2=F。随机区组设计的优点是,从组内变异中分离出区组变异从而减少了误43第四节三因素方差分析

拉丁方设计资料的方差分析

一、拉丁方设计完全随机设计只涉及到一个处理因素;随机区组设计涉及一个处理因素和一个区组因素。若实验涉及一个处理因素和两个控制因素,而且每个因素的水平数相等,此时可采用拉丁方设计来安排实验,将两个控制因素分别安排在拉丁方的行和列上。第四节三因素方差分析

拉丁方设计资料的方差分析一、拉丁44拉丁方是由g个拉丁字母排成的g×g方阵,每行或每列中每个字母都只出现一次,这样的方阵称为g阶拉丁方。拉丁方设计是在随机区组设计的基础上发展的,它可多安排一个已知的对实验结果有影响的非处理因素,提高了效率。应用时,根据水平数g来选定拉丁方大小。拉丁方是由g个拉丁字母排成的g×g方阵,每行或每列中每453×34×45×5ABCCABBCAABCDDABCCDABBCDAABCDEEABCDDEABCCDEABBCDEA3×34×45×5ABCCABBCAABCDDABCCDAB46

例9-3研究A、B、C、D四种食品,以及甲、乙、丙、丁四种加工方法对小白鼠增体重的影响。拟用4窝大鼠,每窝4只,每只小白鼠随机喂养一种食品、随机采用一种加工方法;8周后观察大鼠增体重情况。实验结果如表9-9所示。问:(1)食品种类是否影响大鼠体重增加?(2)食品加工方法是否影响大鼠增体重?(3)不同窝别的大鼠体重增加是否不同?区组号甲乙丙丁180(D)70(B)51(C)48(A)247(A)75(C)78(D)45(B)348(B)80(D)47(A)52(C)446(C)81(A)49(B)77(D)表9-9四种食品及四种加工方法喂养大鼠所增体重(g)例9-3研究A、B、C、D四种食品,以及甲、乙、丙、丁474×4ABCDDABCCDABBCDA4×4ABCDDABCCDABBCDA48二、变异分解表9-8拉丁方设计资料的方差分析表

表中C为校正数,、、分别为不同处理、行区组、列区组的合计。二、变异分解表9-8拉丁方设计资料的方差分析表表中C49三、分析步骤例9-3问:(1)食品种类是否影响大鼠体重增加?(2)食品加工方法是否影响大鼠增体重?(3)不同窝别的大鼠体重增加是否不同?表9-9四种食品及四种加工方法喂养大鼠所增体重(g)三、分析步骤表9-9四种食品及四种加工方法喂养大50解:

(1)建立检验假设,确定检验水准H处理0:A=B=C=D

即四种食品对大鼠体重增加相同

H处理1:A,B,C,D不全相等即四种食品对大鼠体重增加不全相同H行0:1=2=3=4即不同窝别大鼠体重增加相同H行1:1,2,3,4不全相等即不同窝别大鼠体重增加不全相同H列0:甲=乙=丙=丁

即不同加工方法对大鼠体重增加相同H列1:甲,乙,丙,丁不全相等即不同加工方法对大鼠体重增加不全相同

=0.05

解:51(2)计算检验统计量

=62772-59292.25=3479.75

(2232+2122+2242+3152)-59292.25=1726.25

(2492+2452+2272+2532)-59292.25=98.75(2212+3062+2252+2222)-59292.25=1304.25

=3479.75-1726.25-98.75-1304.25=350.5

(2)计算检验统计量52表9-10例9-3方差分析表变异来源

SSV

MSFP处理间1726.253575.4179.85<0.01行区组98.75332.9170.56>0.05列区组1304.253434.7507.44<0.05误差350.50658.417总3479.7515表9-10例9-3方差分析表变异来源SS53(3)确定P值,作出推断结论①对处理:以处理=3和误差=6查F界值表,F0.05(3,6)=4.76,F0.01(3,6)=9.78,得P<0.01,按=0.05水准拒绝H0,接受H1,差别有统计学意义,可认为食品种类能影响大鼠增重。②对行区组:以行=3和误差=6查F界值表,F0.05(3,6)=4.76,F0.01(3,6)=9.78,得P>0.05,按=0.05水准不拒绝H0,差别无统计学意义,尚不能认为不同窝别可影响大鼠增重。③对列区组:以列=3和误差=6查F界值表,F0.05(3,6)=4.76,F0.01(3,6)=9.78,得P<0.05,按=0.05水准拒绝H0,接受H1,差别有统计学意义,可认为食品加工方法会影响大鼠增重。(3)确定P值,作出推断结论54拉丁方设计的要求:

①一定是三因素,且三因素水平数相等;②行间、列间、处理间均无交互作用;③各行、列、处理的方差齐。拉丁方设计的优缺点:

优点是可同时研究三个因素,减少实验次数。从组内变异中不但分离出行区组变异,而且还分离出列区组变异,使误差变异进一步减小。缺点是要求处理组数与所要控制的两个因素水平数相等,一般实验不容易满足此条件,而且数据缺失会增加统计分析的难度。拉丁方设计的要求:①一定是三因素,且三因素水平数相55第五节多个均数间的两两比较

经过方差分析,若拒绝了检验假设H0,只能说明多个总体均数不等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。SNK-q检验、LSD-t检验和Dunnett-t检验。多重比较常用的方法有:第五节多个均数间的两两比较经过方差分56一、SNK-q检验

SNK(Student-Newman-Keuls)检验,亦称q

检验,适用于多个均数两两之间的全面比较。检验统计量q

的计算公式为:

一、SNK-q检验SNK(Studen57例1经F检验结论有统计学意义,试用SNK-q检验方法对三组均数进行多重比较。解:(1)建立假设,确定检验水准。

H0:(对比组总体均数相等);

H1:(对比组总体均数不等);

例1经F检验结论有统计学意义,试用SNK-q检验方法对三组58(2)计算检验统计量q值。

①计算差值的标准误:本例nA=nB=6,MS误差=MS组内=0.269

②将三个样本均数从小到大排序,并赋予秩次:均数3.8174.2334.733组别甲组乙组丙组秩次(R)123

③列表计算检验统计量q值:表9-12例9-1的3个样本均数两两比较的q检验

(2)计算检验统计量q值。表9-12例9-1的359(3)确定P值,作出推断结论 以误差=15及组数

a

q

界值表,并确定

P

值,填入表9-12。

结论:甲组与丙组(“1与3”)比较P<0.05,按=0.05水准拒绝H0,接受H1,有统计学意义,可认为甲组(办公楼)全肺湿重小于丙组(矿井);其余对比组之间比较均P>0.05,按=0.05水准不拒绝H0。因此,可认为矿井下环境会造成肺功能损害。

(3)确定P值,作出推断结论60二、Dunnett-t检验

Dunnett–t检验适用于多个实验组与一个对照组均数差别的多重比较。检验统计量为:

二、Dunnett-t检验Dunnett–t61

例2中甲组是对照组,研究目的是比较乙营养素和丙营养素是否比甲营养素多增加体重,经F检验结论有统计学意义,试用Dunnett-t检验方法对三组均数进行多重比较。解:

(1)建立假设,确定检验水准。

H0:

(所比较实验组与对照组总体均数相等)

H1:(所比较实验组与对照组总体均数不等)

(2)计算检验统计量Dunnett-t值。

①本例

nT=nC=6,MS误差=16.122,则差值的标准误为

2.318例2中甲组是对照组,研究目的是比较乙营养素和丙营养素是否62

②列表计算tD统计量,如表9-13所示。

(3)确定P值,作出推断结论。

以及处理数T=2查Dunnett-t检验界值表,并确定P值,填入表9-13。丙组与甲组比较P<0.05,按=0.05水准拒绝H0,接受H1,有统计学意义,可认为丙营养素比对照组体重增加更多。但乙组与甲组比较P>0.05,没有统计学意义,按=0.05水准不拒绝H0,尚不能认为乙营养素与对照组增加体重不同。

表9-13例9-2的2个处理组与对照组均数比较的tD检验②列表计算tD统计量,如表9-13所示。表63三、LSD-t检验

LSD-t

检验即最小显著差异t检验,适用于一对或几对在专业上有特殊意义的样本均数间的比较。检验统计量t的计算公式为:LSD-

三、LSD-t检验LSD-t检验64例3中食品种类是否影响大鼠增体重,研究目的只为比较A食品与B食品,C食品与D食品便可;多组间经F检验结论有统计学意义,试用LSD-t检验方法对这两对均数进行多重比较。 检验步骤为:

(1)建立检验假设,确定检验水准

H0:A=

B即所研究的两个对比组的总体均数相等

H1:A≠

B即所研究的两个对比组的总体均数不等

=0.05

(2)计算检验统计量

本例

nA=nB=4,MS误差=58.417,=误差=6例3中食品种类是否影响大鼠增体重,研究目的只为比较65

②计算统计量LSD-t值,如表9-14所示。

(3)确定P值,作出推断结论

以误差=6查t界值表,并确定P值,填入表9-14。由表9-14得A食品与B食品比较P>0.05,按=0.05水准,不拒绝H0,无统计学意义,还不能认为A食品和工食品增体重不同。但C食品与D食品比较P<0.01,按=0.05水准,拒绝H0,有统计学意义,可认为C食品增体重不如D食品。

表9-14例9-3的两个对子均数比较的LSD-t检验②计算统计量LSD-t值,如表9-14所示。66第五节多组样本的方差齐性检验

方差分析的一个应用条件是相互比较的各样本的总体方差相等,即具有方差齐性,这就需要在作方差分析之前,先对资料的方差齐性进行检验,特别是在样本方差相差悬殊时,应注意这个问题。本节介绍多个样本的方差齐性检验方法,Bartlett检验法和Levene检验法。第五节多组样本的方差齐性检验方差分析的一个应用67一、Bartlett检验

检验统计量为:

一、Bartlett检验68例7对例1资料,检验其是否满足方差齐性?解:

H0:

H1:

不全相等

=0.10

表15例1的方差齐性检验计算表例7对例1资料,检验其是否满足方差齐性?表15例1的69

首先计算各样本方差

Si2

和合并方差SC2,再计算

2

ν=3-1=2查

2界值表,,

2<

,P

>

0.10,按=0.10水准,不拒绝H0,差别无统计学意义,尚不能认为不同环境下大鼠全肺湿重的方差不齐。首先计算各样本方差Si2和合并方差SC2,再计算70注意事项:1.当

2值仅略大于某一临界值时可计算校正

2值,减少偏倚。计算公式为2.Bartlett检验法要求资料具有正态性。注意事项:71二、Levene检验

与Bartlett检验法比较,Levene检验法在用于多样本方差齐性检验时,所分析的资料可不具有正态性。检验统计量为

二、Levene检验72

检验过程:

1.建立假设、确定检验水准。

H0:(即三个总体方差相等);

H1:三个总体方差不等或不全相等;2.计算检验统计量W值3.查

F界值表作结论Levene法的计算量较大,一般借助于统计软件来完成。检验过程:73第七节数据变换

当数据为偏态或方差不齐时,有时可通过数据转换的方法改善。常用方法有对数变换、平方根变换、倒数变换、平方根反正弦变换等。

第七节数据变换当数据为偏态或方差不74第七节数据变换

变量变换是将原始数据做某种函数变换。其目的是:①使各组达到方差齐性;②使资料转换为正态分布,以满足方差分析和t检验的应用条件。③曲线拟合时曲线的直线化。

常用变换有:1.对数变换(logarithmictransformation)2.平方根变换(squareroottransformation)3.平方根反正弦变换4.倒数变换(reciprocaltransformation)第七节数据变换变量变换是将原始数据做某种函数变换75方差分析课件76方差分析课件77平方根变换常用于:①使服从Poisson分布的计数资料或轻度偏态的资料正态化;②使方差不齐且各样本的方差与均数间呈正相关的资料达到方差齐的要求。平方根变换常用于:78方差分析课件79当各处理标准差与其平均数的平方成比例时,可进行倒数转换;对于一些分布明显偏态的二项分布资料,进行的转换,可使x呈良好的正态分布。当各处理标准差与其平均数的平方成比例时,80t检验法适用于两样本平均数的差异检验,但需进行多个平均数间的差异显著性检验。这时若仍采用t检验法就不适宜。处理这类问题通常采用方差分析方法。

方差分析

(Analysisofvariance简称ANOVA)用于推断多个总体均数有无差异t检验法适用于两样本平均数的差异检验,但方差分析81例在饲料养鸡增肥的研究中,某饲料研究所提出三种饲料配方:

A1是以鱼粉为主的饲料,A2是以槐树粉为主的饲料,A3是以苜蓿粉为主的饲料。为比较三种饲料的效果,特选24只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量。试验结果如下表所示:例在饲料养鸡增肥的研究中,某饲料研究所提出三种饲料配方:82鸡饲料试验数据

饲料A鸡重(克)A110731009106010011002101210091028A21107109299011091090107411221001A310931029108010211022103210291048鸡饲料试验数据饲料A鸡重(克)A1107310091083

本例中,我们要比较的是三种饲料对鸡的增肥作用是否相同。为此,我们把饲料称为因子,记为A,而三种不同的配方称为因子A的三个水平,记为A1,A2,A3,使用配方Ai下第j只鸡60天后的重量用yij表示,i=1,2,3,j=1,2,,10。我们的目的是比较三种饲料配方下鸡的平均重量是否相等,为此,需要做一些基本假定,把所研究的问题归结为一个统计问题,然后用方差分析的方法进行解决。本例中,我们要比较的是三种饲料对鸡的增84

方差分析又叫变异数分析,1928年由英国统计学家RonaldFisher首先提出来的,所以方差分析又叫F检验。第一节方差分析简介方差分析又叫变异数分析,1928年由英国统计学家Rona85单因素方差分析(即完全随机设计资料的方差分析)、两因素方差分析(即随机区组设计资料的方差分析)和三因素方差分析(即拉丁方设计资料的方差分析)及多个样本均数间的多重比较。方差分析主要内容单因素方差分析(即完全随机设计资料的方差分析)、方差分析主要86

方差分析的基本思想借助以下例题予以说明:

例:为研究煤矿粉尘作业环境对尘肺的影响,将18只大鼠随机分到甲、乙、丙3个组,每组6只,分别在地面办公楼、煤炭仓库和矿井下染尘,12周后测量大鼠全肺湿重(g),数据见表9—2,问不同环境下大鼠全肺湿重有无差别?

一、方差分析的基本思想

方差分析的基本思想借助以下例题予以说明:一、方差分析的基87甲组乙组丙组4.24.55.63.34.43.63.73.54.54.34.25.14.14.64.93.34.24.7

ni666甲组乙组丙组4.24.55.63.34.43.6388

从以上资料可看出,三个组的数据各不相同,这种差异(总变异)可以分解成两部分:即

(1)组间变异:甲、乙、丙三个组大鼠全肺湿重各不相等(此变异反映了处理因素的作用,以及随机误差的作用)

(2)组内变异:各组内部大鼠的全肺湿重各不相等(此变异主要反映的是随机误差的作用)从以上资料可看出,三个组的数据各不相同,这种差89各部分变异的计算:

①总变异(全部试验数据间大小不等)用总离均差平方和来表示。

其中各部分变异的计算:①总变异(全部试验数据90

②组间变异(由于所接受的处理因素不同而致各组间大小不等)用组间离均差平方和来表示。

各组均数之间相差越大,它们与总均数的差值就越大,越大;反之,越小。②组间变异(由于所接受的处理因素不同而致各组间大小91③组内变异(同一处理组内部试验数据大小不等)用组内离均差平方和来表示。

③组内变异(同一处理组内部试验数据大小不等)用组内离均差平方92三个变异之间的关系:

其中:

三个变异之间的关系:其中:93离均差平方和只能反映变异的绝对大小。变异程度除与离均差平方和的大小有关外,还与其自由度有关,由于各部分自由度不相等,因此各部分离均差平方和不能直接比较,须除以相应的自由度,该比值称均方差,简称均方(MS)。

的大小就反映了各部分变异的平均大小。离均差平方和只能反映变异的绝对大小。变异94

方差分析就是通过比较组内均方和组间均方的大小关系来判断处理因素有无效应。

检验统计量:

如果各组的总体均数相等,即无处理因素的作用,则组内变异和组间变异都只反映随机误差的大小,此时组间均方和组内均方大小相当,即F值则接近1,各组均数间的差异没有统计学意义;反之,如果处理有作用,则组间变异不仅包含随机误差,还有处理因素引起的变异(组间变异主要反映处理因素的作用),此时组间均方远大于组内均方,则F值远大于1,各组均数间的差异有统计学意义。故依据F值的大小可判断各组之间有无差别。方差分析就是通过比较组内均方和组间均方95

可见,方差分析的基本思想就是

根据实验设计的类型,将全部测量值总的变异分解成两个或多个部分,每个部分的变异可由某个因素的作用(或某几个因素的作用)加以解释,通过比较各部分的均方与随机误差项均方的大小,借助

F

分布来推断各研究因素对实验结果有无影响。可见,方差分析的基本思想就是96方差分析的应用条件(1)各观测值相互独立,并且服从正态分布;(2)各组总体方差相等,即方差齐性。方差分析的应用条件(1)各观测值相互独立,并且服从正971用于两个或多个均数间的比较2分析两个或多个因素的交互作用3回归方程的假设检验4方差齐性检验方差分析的用途1用于两个或多个均数间的比较方差分析的用途98第二节单因素方差分析

完全随机设计资料的方差分析一、完全随机设计完全随机设计是采用完全随机化的分组方法,将全部试验对象分配到g个处理组,各处理组分别接受不同的处理,试验结束后比较各组均数之间差别有无统计学意义,以推断处理因素的效应。第二节单因素方差分析

完全随机设计资料的方差分析一、完全随99将衡量试验结果的标志称为试验指标。将影响试验结果的条件称为因素。因素在试验中所处的不同状态称为该因素的水平。

只考察一个影响条件即因素的试验称为单因素试验,相应的方差分析称为单因素方差分析。方差分析的基本概念将衡量试验结果的标志称为试验指标。方差分析的基本概念100二、变异分解

完全随机设计资料的方差分析表变异来源自由度SSMSF

总变异

组间

组内二、变异分解完全随机设计101单因素方差分析表方差来源离差平方和自由度均方F值临界值Fα因素A(组间)SSAk-1SSA/(k-1)Fα(k-1,n-k)误差E(组内)SSEn-kSSE/(n-k)总变量SST=SSA+SSEn-1单因素方差分析表方差来源离差平方和自由度均方F值临界值102例1试根据表2试验结果,检验三组大鼠全肺湿重的总体均数是否相同。解:(1)建立假设,并确定检验水准。

H0:

H1:

不等或不全相等

三、分析步骤例1试根据表2试验结果,检验三组大鼠全肺湿重的总体均数是否相103(2)计算F值表2三组大鼠的全肺湿重(g)

(2)计算F值表2三组大鼠的全肺湿重(g)104本例

,以上计算结果代入方差分析表,并求出相应的MS

及F

值:表9-3例9-1的方差分析表变异来源SSv

MSF

值P值组间2.52821.2644.70<0.05组内4.035150.269总6.56317本例,105(3)查F界值表,确定P值并作结论。

由附表

5

查得F0.05(2,15)=3.68,F=4.70>F0.05(2,15),故P<0.05,按=0.05水准拒绝H0,接受H1,差别有统计学意义,可认为不同粉尘环境影响大鼠的全肺湿重。当g=2时,方差分析的结果与两样本均数比较的t检验等价,且有。(3)查F界值表,确定P值并作结论。106单因子方差分析的统计模型

只考察了一个因子,称其为单因子试验。通常,在单因子试验中,记因子为A,设其有r个水平,记为A1,A2,…,Ar。在每一水平下考察的指标可以看成一个总体,因为现共有r个水平,故有r个总体,单因子方差分析的统计模型只考察了一个因子,称其为单因子试1071、每一总体均为正态总体,记为N(i,

i2),

i=1,2,…,r;2、各总体的方差相同:1

2=22=…=

r2=

2;(即,具有方差齐次性)3、从每一总体中抽取的样本是相互独立的,即所有的试验结果yij都相互独立。

假定:1、每一总体均为正态总体,记为N(i,i2),108

我们要比较各水平下的均值是否相同,即要对如下的一个假设进行检验:H0

:1

=2=…=r

H1

:1,2,…,r不全相等如果检验结果为H0成立,因子A的r个水平均值相同,称因子A的r个水平间没有显著差异,简称因子A不显著反之,当H0不成立时,因子A的r个水平均值不全相同,称因子A的不同水平间有显著差异,简称因子A显著。

我们要比较各水平下的均值是否相同,109

单因子方差分析的统计模型:

模型可以改写为H0

:a1

=a2=…=ar=0单因子方差分析的统计模型:110第三节两因素方差分析

随机区组设计资料的方差分析

一、随机区组设计随机区组设计(randomizedblockdesign),又称配伍组设计,是配对设计的扩展。具体做法是:先按影响试验结果的非处理因素将受试对象配成区组(block),再将各区组内的受试对象随机分配到不同的处理组,各处理组分别接受不同的处理,试验结束后比较各组均数之间差别有无统计学意义,以推断处理因素的效应。第三节两因素方差分析

随机区组设计资料的方差分析一111该设计的特点:(1)该设计包含两个因素,一个是区组因素,一个是处理因素;(2)各区组及处理组的受试对象数相等,各处理组的受试对象生物学特性较均衡,可减少试验误差,提高假设检验的效率。此类资料的方差分析,其应用条件同前:即资料满足正态性及方差齐性的要求。该设计的特点:(1)该设计包含两个因素,一个是区组因素,一个112

因为随机区组设计可以将区组间变异从完全随机设计的组内变异中分离出来以反映不同区组对结果的影响,所以随机区组设计全部测量值总的变异相应地就分成三部分。

各种变异之间的关系是:

其中:

二、

变异分解因为随机区组设计可以将区组间变异从完全随机设计的组113(1)总变异:反映全部试验数据间大小不等的状况,(2)处理组间变异:甲、乙、丙三个组间测量值的均数大小不等,(3)区组间变异:12个区组间测量值的均数大小不等,(4)误差变异:反映随机误差产生的变异,(1)总变异:反映全部试验数据间大小不等的状况,114表9-5随机区组设计的方差分析表

变异来源自由度SSMSF

总变异处理间区组间

误差表9-5随机区组设计的方差分析表变异来源自由115二、分析步骤

结合例9-2:

例9-2研究甲、乙、丙三种营养素对小白鼠体重增加的影响,已知窝别为影响因素。拟用6窝小白鼠,每窝3只,随机地安排喂养甲、乙、丙三种营养素之一种,8周后观察小白鼠体重增加情况,数据见表9-6。问:(1)不同营养素之间小白鼠的体重增加是否不同?(2)不同窝别之间小白鼠的体重增加是否不同?二、分析步骤

结合例9-2:116表9-6三种营养素喂养小白鼠所增体重(g)

窝别号甲营养素乙营养素丙营养素164657325354593716879441463855058656424046表9-6三种营养素喂养小白鼠所增体重(g)窝别号甲营117(1)建立假设、确定检验水准。处理:H0:甲=乙=丙(三种营养素对小白鼠体重增加作用相同)H1:甲,乙,丙不全相等(三种营养素对小白鼠体重增加作用不全相同)区组:H0:1=2=…=6(窝别对小白鼠体重增加无影响)H1:1,2,…,6不全相等(窝别对小白鼠体重增加有影响)

(2)计算检验统计量F

值。计算各处理组的小计,各区组的小计,见表9-6。(1)建立假设、确定检验水准。118表9-6三种营养素喂养小白鼠所增体重(g)

窝别号甲营养素乙营养素丙营养素区组合计(Bj)164657320225354591663716879218441463812555058651736424046128处理组合计(Ti)32133136010121789118845228365957253.555.260.056.22表9-6三种营养素喂养小白鼠所增体重(g)窝别号甲营119本例,方差分析课件120表9-2例9-2方差分析表变异来源

SSV

MSFP处理组间136.778268.3894.24<0.05区组间2377.1115475.42229.49<0.01误差161.2221016.122总变异2675.11117表9-2例9-2方差分析表变异来源SS121①处理因素:查F界值表,,因,故P<0.05

。结论:按α=0.05水准,拒绝H0,接受H1,差别有统计学意义,可认为不同营养素对小白鼠体重增加有影响。②区组因素:查F界值表,

,,F>F

0.01(5,10),故P<0.05。结论:按α=0.05水准,拒绝H0,接受H1,差别有统计学意义,可认为不同窝别对小白鼠体重增加有影响。(3)查F界值表,确定P

值并作结论。①处理因素:查F界值表,122随机区组设计的优点是,从组内变异中分离出区组变异从而减少了误差均方,使处理组间的F

值更容易出现显著性,即提高了统计检验效率。当g=2时,随机区组设计方差分析与配对设计资料的t检验等价,有t2=F。随机区组设计的优点是,从组内变异中分离出区组变异从而减少了误123第四节三因素方差分析

拉丁方设计资料的方差分析

一、拉丁方设计完全随机设计只涉及到一个处理因素;随机区组设计涉及一个处理因素和一个区组因素。若实验涉及一个处理因素和两个控制因素,而且每个因素的水平数相等,此时可采用拉丁方设计来安排实验,将两个控制因素分别安排在拉丁方的行和列上。第四节三因素方差分析

拉丁方设计资料的方差分析一、拉丁124拉丁方是由g个拉丁字母排成的g×g方阵,每行或每列中每个字母都只出现一次,这样的方阵称为g阶拉丁方。拉丁方设计是在随机区组设计的基础上发展的,它可多安排一个已知的对实验结果有影响的非处理因素,提高了效率。应用时,根据水平数g来选定拉丁方大小。拉丁方是由g个拉丁字母排成的g×g方阵,每行或每列中每1253×34×45×5ABCCABBCAABCDDABCCDABBCDAABCDEEABCDDEABCCDEABBCDEA3×34×45×5ABCCABBCAABCDDABCCDAB126

例9-3研究A、B、C、D四种食品,以及甲、乙、丙、丁四种加工方法对小白鼠增体重的影响。拟用4窝大鼠,每窝4只,每只小白鼠随机喂养一种食品、随机采用一种加工方法;8周后观察大鼠增体重情况。实验结果如表9-9所示。问:(1)食品种类是否影响大鼠体重增加?(2)食品加工方法是否影响大鼠增体重?(3)不同窝别的大鼠体重增加是否不同?区组号甲乙丙丁180(D)70(B)51(C)48(A)247(A)75(C)78(D)45(B)348(B)80(D)47(A)52(C)446(C)81(A)49(B)77(D)表9-9四种食品及四种加工方法喂养大鼠所增体重(g)例9-3研究A、B、C、D四种食品,以及甲、乙、丙、丁1274×4ABCDDABCCDABBCDA4×4ABCDDABCCDABBCDA128二、变异分解表9-8拉丁方设计资料的方差分析表

表中C为校正数,、、分别为不同处理、行区组、列区组的合计。二、变异分解表9-8拉丁方设计资料的方差分析表表中C129三、分析步骤例9-3问:(1)食品种类是否影响大鼠体重增加?(2)食品加工方法是否影响大鼠增体重?(3)不同窝别的大鼠体重增加是否不同?表9-9四种食品及四种加工方法喂养大鼠所增体重(g)三、分析步骤表9-9四种食品及四种加工方法喂养大130解:

(1)建立检验假设,确定检验水准H处理0:A=B=C=D

即四种食品对大鼠体重增加相同

H处理1:A,B,C,D不全相等即四种食品对大鼠体重增加不全相同H行0:1=2=3=4即不同窝别大鼠体重增加相同H行1:1,2,3,4不全相等即不同窝别大鼠体重增加不全相同H列0:甲=乙=丙=丁

即不同加工方法对大鼠体重增加相同H列1:甲,乙,丙,丁不全相等即不同加工方法对大鼠体重增加不全相同

=0.05

解:131(2)计算检验统计量

=62772-59292.25=3479.75

(2232+2122+2242+3152)-59292.25=1726.25

(2492+2452+2272+2532)-59292.25=98.75(2212+3062+2252+2222)-59292.25=1304.25

=3479.75-1726.25-98.75-1304.25=350.5

(2)计算检验统计量132表9-10例9-3方差分析表变异来源

SSV

MSFP处理间1726.253575.4179.85<0.01行区组98.75332.9170.56>0.05列区组1304.253434.7507.44<0.05误差350.50658.417总3479.7515表9-10例9-3方差分析表变异来源SS133(3)确定P值,作出推断结论①对处理:以处理=3和误差=6查F界值表,F0.05(3,6)=4.76,F0.01(3,6)=9.78,得P<0.01,按=0.05水准拒绝H0,接受H1,差别有统计学意义,可认为食品种类能影响大鼠增重。②对行区组:以行=3和误差=6查F界值表,F0.05(3,6)=4.76,F0.01(3,6)=9.78,得P>0.05,按=0.05水准不拒绝H0,差别无统计学意义,尚不能认为不同窝别可影响大鼠增重。③对列区组:以列=3和误差=6查F界值表,F0.05(3,6)=4.76,F0.01(3,6)=9.78,得P<0.05,按=0.05水准拒绝H0,接受H1,差别有统计学意义,可认为食品加工方法会影响大鼠增重。(3)确定P值,作出推断结论134拉丁方设计的要求:

①一定是三因素,且三因素水平数相等;②行间、列间、处理间均无交互作用;③各行、列、处理的方差齐。拉丁方设计的优缺点:

优点是可同时研究三个因素,减少实验次数。从组内变异中不但分离出行区组变异,而且还分离出列区组变异,使误差变异进一步减小。缺点是要求处理组数与所要控制的两个因素水平数相等,一般实验不容易满足此条件,而且数据缺失会增加统计分析的难度。拉丁方设计的要求:①一定是三因素,且三因素水平数相135第五

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论