版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
方差分析
方差分析(Analysisofvariance,ANOVA)
又叫变量分析,是英国著名统计学家R.A.Fisher于20世纪提出的。它是用以检验两个或多个均数间差异的假设检验方法。它是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引伸。方差分析的定义方差分析的基本功能对多组样本平均数差异的显著性进行检验
t检验可以判断两组数据平均数间的差异显著性,而方差分析既可以判断两组又可以判断多组数据平均数之间的差异显著性。有人说,我们可以把多组数据化成n个两组数据(化整为零),用n次t检验来完成这个多组数据差异显著性的判断。到底这种方法行不行?对多个处理进行平均数差异显著性检验时,采用t检验法的缺点:1.检验过程烦琐。试验包含4个处理t检验:C42
=6次缺点缺点2.无统一的试验误差,误差估计的精确性和检验的灵敏性低。t检验:C42
=6次需计算6个标准误误差估计不统一误差估计精确性降低缺点3.推断的可靠性低,检验时犯α错误概率大。t检验:C42
=6次H0的概率:1-α=0.956次检验相互独立6次都接受的概率(0.95)6=0.735犯α错误的概率=1-0.735=0.265犯α错误的概率明显增加例如我们用t检验的方法检验4个样本平均数之间的差异显著性试验指标(experimentalindex):为衡量试验结果的好坏和处理效应的高低,在实验中具体测定的性状或观测的项目称为试验指标。常用的试验指标有:身高、体重、日增重、酶活性、DNA含量等等。试验因素(experimentalfactor):试验中所研究的影响试验指标的因素叫试验因素。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上因素对试验指标的影响时,则称为两因素或多因素试验。因素水平(leveloffactor):
试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。如研究3个品种奶牛产奶量的高低,这3个品种就是奶牛品种这个试验因素的3个水平。试验处理(treatment):
事先设计好的实施在实验单位上的具体项目就叫试验处理。如进行饲料的比较试验时,实施在试验单位上的具体项目就是具体饲喂哪一种饲料。试验单位(experimentalunit):
在实验中能接受不同试验处理的独立的试验载体叫试验单位。一只小白鼠,一条鱼,一定面积的小麦等都可以作为实验单位。重复(repetition):
在实验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。例如,用某种饲料喂4头猪,就说这个处理(饲料)有4个重复。第一节方差分析的基本原理二、数学模型一、方差分析的基本思想、目的和用途三、平方和与df的分解四、统计假设的显著性检验五、多重比较观测值不同的原因处理效应(treatmenteffect):处理不同引起试验误差:试验过程中偶然性因素的干扰和测量误差所致。方差:又叫均方,是标准差的平方,是表示变异的量。在一个多处理试验中,可以得出一系列不同的观测值。方差分析的基本思想总变异处理效应试验误差方差分析的目的确定各种原因在总变异中所占的重要程度。处理效应试验误差相差不大,说明试验处理对指标影响不大。相差较大,即处理效应比试验误差大得多,说明试验处理影响是很大的,不可忽视。方差分析的用途1.用于多个样本平均数的比较2.分析多个因素间的交互作用3.回归方程的假设检验4.方差的同质性检验1.用于多个样本平均数的比较2.分析多个因素间的交互作用二、数学模型假定有k组观测数据,每组有n个观测值,则共有nk个观测值平均T=∑xij
Tk…Ti…T2T1总和xk1xk2…xkj…xkn………………xi1xi2…xij…xin………………x21x22…x2j…x2nx11
x12
…x1j…x1n12…j…nk…i…21
处理重复xx1
x2
xi
xk
…用线性模型(linearmodel)来描述每一观测值:xij=μ+τi+εij
(i=1,2,3…,kj=1,2,3…,n)μ
-总体平均数τi
-处理效应εij
-试验误差xij
-是在第
i次处理下的第
j
次观测值要求εij是相互独立的,且服从标准正态分布N(0,σ2)二、数学模型对于由样本估计的线性模型为:xij=x+ti+eijx
-样本平均数ti
-样本处理效应eij
-试验误差二、数学模型xij=μ+τi+εij
根据的τi不同假定,可将数学模型分为以下三种:固定模型随机模型混合模型二、数学模型(一)固定模型(fixedmodel)指各个处理的效应值τi
是固定值,各个的平均效应τi
=μi
-μ是一个常量,且∑τi
=0。就是说除去随机误差以后每个处理所产生的效应是固定的。二、数学模型实验因素的各水平是根据试验目的事先主观选定的而不是随机选定的。不同离子对木聚糖酶活性的影响(mg/ml)0.000.250.500.751.001.250.000.060.120.180.240.300.000.400.801.201.602.000.000.400.600.801.001.20固定模型Na+K+
Cu2+
Mn2+二、数学模型在固定模型中,除去随机误差之后的每个处理所产生的效应是固定的,试验重复时会得到相同的结果方差分析所得到的结论只适合于选定的那几个水平,并不能将其结论扩展到未加考虑的其它水平上。固定模型二、数学模型(二)随机模型(randommodel)指各处理的效应值τi不是固定的数值,而是由随机因素所引起的效应。这里τi
是一个随机变量,是从期望均值为0,方差为σ2的标准正态总体中得到的随机变量。得出的结论可以推广到多个随机因素的所有水平上。二、数学模型随机模型美国的黑核桃品种对不同地理条件的适应情况气候、水肥、土壤无法人为控制河南北京广州江苏新疆二、数学模型如果实验条件不能人为控制,那么这个样本对所属总体作出推断就属于随机模型。随机模型在随机模型中,水平确定之后其处理所产生的效应并不是固定的,试验重复时也很难得到相同的结果方差分析所得到的结论,可以推广到这个因素的所有水平上二、数学模型固定模型与随机模型的比较1.两者在设计思想和统计推断上有明显不同,因此进行方差分析时的公式推导也有所不同。其平方和与df的分解公式没有区别,但在进行统计推断时假设检验构成的统计数是不同的。2.模型分析的侧重点也不完全相同,方差期望值也不一样,固定模型主要侧重于效应值的估计和比较,而随机模型则侧重效应方差的估计和检验3.对于单因素方差分析来说,两者并无多大区别二、数学模型(三)混合模型(mixedmodel)指多因素试验中既有固定因素又有随机因素时所用的模型.在实际应用中,固定模型应用最多,随机模型和混合模型相对较少二、数学模型三、平方和与df的分解方差是离均差平方和除以自由度的商σ2
=∑(x-μ)2
N∑(x-x)2
s2=n-1要把一个试验的总变异依据变异来源分为相应的变异,首先要将总平方和和总df分解为各个变异来源的的相应部分。方差分析的基本思想引起观测值出现变异分解为处理效应的变异和试验误差的变异。三、平方和与df的分解……平均T=∑xij
Tk…Ti…T2T1总和xk1xk2…xkj…xkn………………xi1xi2…xij…xin………………x21x22…x2j…x2nx11
x12
…x1j…x1n12…j…nk…i…21处理重复xx1
x2
xi
xk
处理间平均数的差异是由处理效应引起的:处理内的变异是由随机误差引起:平方和(x-xi)(xi–
x)三、平方和与df的分解根据线性可加模型,则有:平方和(xi–
x)(x-x)=(x-xi)+(x-x)2
=[]2(x-xi)+(xi–
x)(xi–x)2∑(x-x)2
=∑1n1n(x-xi)2+(x-xi)(xi–
x)2∑1n+∑1n每一个处理n个观测值离均差平方和累加:=(x-xi)2+2(x-xi)(xi–
x)+(xi–x)20……平均T=∑xij
Tk…Ti…T2T1总和xk1xk2…xkj…xkn………………xi1xi2…xij…xin………………x21x22…x2j…x2nx11
x12
…x1j…x1n12…j…nk…i…21处理重复xx1
x2
xi
xk
(xi–
x)=0(x-xi)2∑1n?三、平方和与df的分解(xi–
x)(x-xi)由于=0,则:
2∑1n∑(x-x)2
=∑(xi–x)2(x-xi)2nn11+∑1n(xi–x)2(x-xi)2(x-x)2
=
∑∑1n1k∑∑1n1k+n∑1k总平方和
SST
处理内或组内平方和SSe处理间或组间平方和
SSt平方和把k个处理的离均差平方在累加,得三、平方和与df的分解平方和总平方和=处理间平方和+处理内平方和SST=
SSt+SSeSST=∑∑(x-x)21n
1k
=∑x2
-T2
kn(∑x)2
kn=∑x2-SST=∑x2-C令矫正数C=,则:T2
kn平方和三、平方和与df的分解SSt
=n∑1
k
(xi–x)2
k
=n∑(-2+)1xi2
xixx2
=n∑-+nk1
k
xi2
2n∑1
k
xxix2
=-2nk+n∑1
k
xi2
x2
nkx2
=-n∑1
k
xi2
nkx2
=-n∑1
k
Ti2
n2
nkT2(nk)2
=∑Ti2-Cn1∑1
k
xi=kxxi=Tin=Tnkx三、平方和与df的分解总平方和:SST=∑x2-C
处理间平方和:
SSt=∑Ti2-Cn1处理内平方和:SSe
=SST-SSt平方和自由度三、平方和与df的分解总自由度也可分解为处理间自由度和处理内自由度:dfT
=dft+dfe总df处理间df处理内df三、平方和与df的分解自由度dfT
=
nk-1dft=k-1dfe=dfT-
dft=nk-1-(k-1)=nk-k=k(n-1)……平均T=∑xij
Tk…Ti…T2T1总和xk1xk2…xkj…xkn………………xi1xi2…xij…xin………………x21x22…x2j…x2nx11
x12
…x1j…x1n12…j…nk…i…21处理重复xx1
x2
xi
xk
三、平方和与df的分解根据各变异部分的平方和和自由度,可求得处理间方差(st2
)和处理内方差(se2
):st2
=SStdftSSedfese2=平方和自由度方差处理间处理内总变异某猪场对4个不同品种幼猪进行4个月增重量的测定,每个品种选择体重接近的幼猪4头,测定结果列于下表,试进行方差分析。=27.227.924.125.830.9T=434.4111.496.2103.2123.6Ti27.030.829.024.622.223.026.724.324.825.726.825.931.924.031.835.91234沈花沈黑沈白大白品种重复xixk=4,n=4,nk=16例=27.227.924.125.830.9T=434.4111.496.2103.2123.6Ti27.030.829.024.622.223.026.724.324.825.726.825.931.924.031.835.91234沈花沈黑沈白大白
品种重复xix4个不同品种猪4个月的增重量(kg)(1)平方和的计算:T2
knC==434.42
16=11793.96SST=∑x2-C=31.92+24.02+…+24.62-C=213.3SSt=∑Ti2-Cn1=1/4×(123.62+103.22+…+111.42)-C=103.94SSe
=SST-SSt=213.3-103.94=109.36例(2)自由度的计算:dfT=nk-1=16-1=15dft=k-1=4-1=3dfe=k(n-1)=4×3=12(3)方差计算:st2
=SStdft=103.942
3=34.647SSedfese2==109.362
12=9.113四、统计假设的显著性检验
——F检验确定各种原因(处理效应、试验误差)在总变异中所占的重要程度。处理间的方差(st2
)可以作为处理效应方差的估计量处理内的方差(se2
)可以作为试验误差差异的估计量处理效应试验误差方差分析的目的:二者相比,如果相差不大,说明不同处理的变异在总变异中所占的位置不重要,也就是不同试验处理对结果影响不大。如果相差较大,也就是处理效应比试验误差大得多,说明试验处理的变异在总变异中占有重要的位置,不同处理对结果的影响很大,不可忽视。处理效应试验误差F检验
从第三章我们已经知道,从一正态总体(μ,σ2
)中随机抽取两个样本,其样本方差s12与s22的比值为F
:F=s12
s22
其F
分布曲线随着df1
和df2
的变化而变化。由于F
值表是一尾的(F值的区间〔0,+∞)
),一般将大方差作分子,小方差作分母,使F
值大于1,因此,表上df1的代表大方差自由度,df2
代表小方差自由度。用处理效应的方差(st2
)和实验误差的方差(se2
)比较时,我们所做的无效假设是假设处理效应的变量和实验误差的变量是来自同一正态总体的两个样本,因此处理效应的方差(st2
)和实验误差的方差(se2
)的比值就是F
值,即处理效应试验误差=方差分析F检验
在进行不同处理差异显著性的F
检验时,一般是把处理间方差作为分子,称为大方差,误差方差作为分母,称为小方差。
无效假设是把各个处理的变量假设来自同一总体,即处理间方差不存在处理效应,只有误差的影响,因而处理间的样本方差σt2与误差的样本方差σe2相等:Ho
:σt2
=
σe2HA
:σt2
≠
σe2st2无论无效假设是否为真,se2均为总体方差σ2的估计。se2只有无效假设为真时,st2(=se2)才是总体方差σ2的估计;当无效假设不真时,将st2(>se2
)是一个比σ2更大的估计值。F检验与t
检验相类似,F检验是把计算所得的F值与临界Fα值比较,判断由误差造成的概率大小,最后作出统计推断。无效假设是否成立,要看计算的F值在F分布中出现的概率。F<F0.05P>0.05
处理间差异不显著F>F0.05P<0.05
处理间差异显著F>F0.01P<0.01
处理间差异极显著否定Ho否定Ho接受Ho
我们确定显著标准水平α后,从F值表中查出在dft和dfe下的Fα值综上所述,可归纳成方差分析表(analysisofvariancetable)se2k(n-1)SSe误差或处理内nk-1SST总和st2k-1SSt处理间F均方自由度平方和变异来源F=st2se2F检验上例中,4个不同品种猪增重的F值为:F=st2
se2
=34.647
9.113=3.802dft
=3dfe
=12,查F值表得F0.05=3.49,F0.01=5.95品种间猪的增重量差异是显著的例F0.01>F>F0.050.01<P<0.05变异来源SSdfs2FF0.05F0.01品种间品种内103.94109.3631234.6479.1133.802*3.495.95总变异213.3015不同品种猪4个月增重量的方差分析表例如果处理间差异显著,在计算出的F值右上角标上“*”号;如果处理间差异极显著,在F
值的右上角标上“**”号。
为了解烫伤后不同时期大鼠肝脏ATP的变化情况,将30只大鼠随机分为三组,每组10只,A组在烫伤时,B组在烫伤后24小时(休克期),C组在烫伤后96小时(非休克期)测定其肝脏内的ATP含量,结果如右表:A组B组C组7.7611.1410.857.7111.608.588.4311.427.198.4713.859.3610.3013.539.596.6714.168.8111.736.948.225.7813.019.956.6114.1811.266.9717.728.68n101010N=308.0412.769.25
=10.02∑x80.43127.5592.49T=300.47(∑x)26468.9816269.008554.40T2=90282.22∑x2676.321696.96868.93(1)平方和的计算:T2
knC==300.472
30=3009.4074SST=∑x2-C=676.32+1696.96+868.93-C=232.8026SSt=∑Ti2-Cn1=1/3×(80.432+127.552+92.492)-C=119.8314SSe
=SST-SSt=232.8026-119.8314=112.9712(2)自由度的计算:dfT=nk-1=30-1=29dft=k-1=3-1=2dfe=k(n-1)=3×9=27变异来源SSdfs2FF0.05F0.01品种间品种内119.8314112.971222759.9164.18414.32**3.355.49总变异232.802629大鼠烫伤后ATP含量的的方差分析表五多重比较多重比较(multiplecomparisons)
要明确不同处理平均数两两间差异的显著性,每个处理的平均数都要与其他的处理进行比较,这种差异显著性的检验就叫多重比较。统计上把多个平均数两两间的相互比较称为多重比较。概念五、多重比较常用方法最小显著差数法leastsignificantdifferenceLSD法最小显著极差法leastsignificantrangesLSR法
LSD法的实质是两个平均数相比较的t检验法。
LSR法克服了LSD法的局限性,采用不同平均数间用不同的显著差数标准进行比较,它可用于平均数间的所有相互比较。(一)最小显著差数法(LSD法)1.检验的方法(1)先计算出达到差异显著的最小差数,记为LSDα
(2)用两个处理平均数的差值绝对值与LSDα比较:x1x2-(一)最小显著差数法(LSD法)1.检验的方法(1)先计算出达到差异显著的最小差数,记为LSDα
由t=得x1x2-x1x2-Sx1x2-x1x2-S=t·LSD0.05=t0.05·x1x2-SLSD0.01=t0.01·x1x2-Sx1x2-S=√s12
n1s22n2+=√1
n11n2se2(+)当n1=
n2时:x1x2-S=√2se2
n平均数差数标准误的计算公式:处理内方差1.检验的方法(2)再用两个处理平均数的差值绝对值与LSDα比较:x1x2-x1x2->LSDα
,即和在给定的α水平上差异不显著
x1x2拒绝Ho接受Ho(一)最小显著差数法(LSD法)x1x2即和在给定的α水平上差异显著x1x2-<LSDα
,变异来源SSdfs2FF0.05F0.01品种间品种内103.94109.3631234.6479.1133.802*3.495.95总变异213.3015不同品种猪4个月增重量的方差分析表例x1x2-S=√2se2
n=√2×9.113
4=2.1346查t值表,当误差自由度dfe=12时,LSD0.05=t0.05·x1x2-S=2.179×2.1346=4.6513(kg)LSD0.01=t0.01·x1x2-S=3.056×2.1346=6.5233(kg)t0.05
=2.179,t0.01
=3.0562.结果表示方法(一)最小显著差数法(LSD法)梯形法标记字母法标记字母法
首先将全部平均数从大到小依次排列。然后在最大的平均数上标字母a,将该平均数与以下各平均数相比,凡相差不显著的(<LSDα)都标上字母a,直至某个与之相差显著的则标字母b。再以该标有b的平均数为标准,与各个比它大的平均数比较,凡差数差异不显著的在字母a的右边加标字母b。然后再以标b的最大平均数为标准与以下未曾标有字母的平均数比较,凡差数差异不显著的继续标以字母b,直至差异显著的平均数标字母c,再与上面的平均数比较。如此重复进行,直至最小的平均数有了标记字母,并与上面的平均数比较后为止。(一)最小显著差数法(LSD法)标记字母法品种平均数差异显著性α=0.05α=0.01大白沈花沈白沈黑30.927.925.824.1aA例不同品种间4个月增重量差异显著表abbbAABBBxi结果表明:大白和沈黑增重量差异达到了极显著标准,大白与沈白之间的差异达到了显著标准,其他品种间差异不显著。LSD0.05=4.6513LSD0.01=6.5233标记字母法在各平均数间,凡有一个相同标记字母的即为差异不显著,凡具不同标记字母的即为差异显著。差异极显著标记方法相同,但用大写字母标记。(一)最小显著差数法(LSD法)梯形比较法又叫三角形法,是将各处理的平均数差数按梯形列于表中,并将这些差数和LSDα值比较:差数>LSD0.05差异显著*差数>LSD0.01差异极显著**差数≤LSD0.05差异不显著(一)最小显著差数法(LSD法)例梯形比较法不同品种间4个月增重量差异显著表品种平均数差异显著性大白沈花沈白沈黑30.927.925.824.16.8**3.81.75.1*2.13.0xixi-24.1xi-25.8xi-27.9LSD0.05=4.6513LSD0.01=6.5233结果表明:大白和沈黑增重量差异达到了极显著标准,大白与沈白之间的差异达到了显著标准,其他品种间差异不显著。LSD法应用的说明(一)最小显著差数法(LSD法)1.进行LSD检验时,这一对平均数的比较是检验之前已经指定的,且经F检验证实平均数间的差异已达到显著之后,才可以进行LSD检验。3.LSD
法适用于各处理组与对照组的比较,不适用于处理组间的比较。2.LSD
法实质上是t检验,但LSD
法是利用F
检验中的误差自由度dfe
查t
临界值,利用误差方差se2计算平均数差异标准误,从一定程度上缓解了t检验过程中的三个弊病,但是LSD法仍然存在提高犯α错误的概率,所以进行LSD检验必须限制其应用范围。(二)最小显著极差法(LSR法)是指不同平均数间用不同的显著差数标准进行比较,可用于平均数间的所有相互比较。新复极差法(Newmultiplerangmethod)
SSR法q
检验(q-test)新复极差法(SSR)SSR法又称Duncan法。无效假设H0为:μA–μB=0(1)按相比较的样本容量计算平均数标准误:当n1
=n2=n时√xS=se2
n(2)根据误差方差se2所具有自由度dfe和比较所含平均数个数M,查SSR值(附表8),然后算出最小显著极差值(LSR值)。LSRα=
SSRα·x1S(3)将各平均数按大小顺序排列,用各个M值的LSRα值,检验各平均数间极差的显著性。例例:n=4,se2=9.113,dfe=12√xS=se2
n√=49.113
=1.5094(kg)查附表8,当dfe
=12,M=2时,LSR0.05=1.5094×3.08=4.65LSR0.01=1.5094×4.32=6.52当M=3,M=4时,按同理计算,将结果列于下表:SSR0.05=3.08,SSR0.01=4.32不同品种4个月增重量试验LSR值(新复极差法)M234SSR0.05SSR0.01LSR0.05LSR0.013.084.324.656.523.224.504.886.793.314.625.006.97品种平均数大白沈花沈白沈黑30.927.925.824.1大白与沈黑:M=4,极差=6.8>5.00大白与沈白:M=3,极差=5.1>4.88大白与沈花:M=2,极差=3.0<4.65M=相隔数+2品种平均数差异显著性α=0.05α=0.01大白沈花沈白沈黑30.927.925.824.1aabbbAAAA结论:猪的4个品种中只有大白与沈黑,大白与沈白4个月增重量差异达到显著,其他品种间差异不显著。猪品种间4个月增重量差异显著性比较表(新复极差法)也称Newman-keuls检验,方法与新复极差法相似,其区别仅在于计算最小显著极差LSRα时不是查SSRα,而是查qα值(附表9)LSRα=
qα·x1S还对上例作q检验:x1S=1.5094,查q值表,dfe=12,M=2时q0.05
=3.08,q0.01=4.32。同理可查M=3,M=4时的qα值,算出最小显著极差LSR。q-检验法q-检验M234q0.05q0.01LSR0.05LSR0.013.084.324.656.523.775.045.697.614.205.506.348.30不同品种4个月增重量试验LSR值(q检验)品种平均数大白沈花沈白沈黑30.927.925.824.1大白与沈黑:M=4,极差=6.8>6.34大白与沈白:M=3,极差=5.1<5.69大白与沈花:M=2,极差=3.0<4.65(二)最小显著极差法(LSR法)不同品种间4个月增重量差异显著性比较表(新复极差法)品种平均数差异显著性α=0.05α=0.01大白沈花沈白沈黑30.927.925.824.1aababbAAAA结论:猪的4个品种中只有大白与沈黑4个月增重量差异达到显著,其他品种间差异不显著。LSD0.05=4.6513LSD0.01=6.5233LSD法M234q0.05q0.01LSR0.05LSR0.013.084.324.656.523.775.045.697.614.205.506.348.30M234SSR0.05SSR0.01LSR0.05LSR0.013.084.324.656.523.224.504.886.793.314.625.006.97新复极差法q检验当样本数k=2时,LSD法、LSR法和q检验法的显著性尺度是相同的。当M≥3时,三种检验的显著尺度便不相同。因此,在实际计算中:对于精度要求高的试验——q检验法一般试验——SSR检验法试验中各个处理均数皆与对照相比的试验——LSD检验法方差分析的基本步骤(1)将样本数据的总平方和与总自由度分解为各变异因素的平方和与自由度;(2)列方差分析表进行F检验,以弄清各变异因素在总变异中的重要程度;(3)对各处理平均数进行多重比较。
为了解烫伤后不同时期大鼠肝脏ATP的变化情况,将30只大鼠随机分为三组,每组10只,A组在烫伤时,B组在烫伤后24小时(休克期),C组在烫伤后96小时(非休克期)测定其肝脏内的ATP含量,结果如右表:A组B组C组7.7611.1410.857.7111.608.588.4311.427.198.4713.859.3610.3013.539.596.6714.168.8111.736.948.225.7813.019.956.6114.1811.266.9717.728.68n101010N=308.0412.769.25
=10.02∑x80.43127.5592.49T=300.47(∑x)26468.9816269.008554.40T2=90282.22∑x2676.321696.96868.93(1)平方和的计算:T2
knC==300.472
30=3009.4074SST=∑x2-C=676.32+1696.96+868.93-C=232.8026SSt=∑Ti2-Cn1=1/10×(80.432+127.552+92.492)-C=119.8314SSe
=SST-SSt=232.8026-119.8314=112.9712(2)自由度的计算:dfT
=nk-1=30-1=29dft=k-1=3-1=2dfe=k(n-1)=3×9=27变异来源SSdfs2FF0.05F0.01品种间品种内119.8314112.971222759.9164.18414.32**3.355.49总变异232.802629大鼠烫伤后ATP含量的的方差分析表组别平均数差异显著性LSDqBCA12.769.258.04aabbabb第二节单因素方差分析单因素方差分析在试验中所考虑的因素只有一个时,称为单因素实验。
单因素方差分析是最简单的一种,它适用于只研究一个试验因素的资料,目的在于正确判断该试验因素各处理的相对效果(各水平的优劣).单因素方差分析组内观测数目的不同组内观测次数相等方差分析组内观测次数不相等的方差分析组内观测次数相等的方差分析
是指在k组处理中,每一处理皆含有n个观测值,其方差分析方法前面已做介绍,这里以方差分析表的形式给出有关计算公式:se2k(n-1)SSe误差或处理内nk-1SST总和st2k-1SSt处理间F均方自由度平方和变异来源F=st2se2
测定东北、内蒙古、河北、安徽、贵州5个地区黄鼬冬季针毛的长度,每个地区随机抽取4个样本,测定的结果如表,试比较各地区黄鼬针毛长度差异显著性。地区东北内蒙古河北安徽贵州合计132.029.225.223.322.3232.827.426.125.122.5331.226.325.825.122.9430.426.726.725.523.7126.4109.6104.199.091.4530.531.6027.4026.0324.7522.8526.533997.443007.992709.982453.162089.6414258.21在这里,k=5,n=4。(1)首先计算出,及,并列于表中。(2)计算出离均差平方和与自由度:=186.7-173.71=12.99=20-1=19=5×(4-1)=15(3)计算方差:=5-1=4(4)进行F检验:查F值表,得F0.05(4,15)=3.06,F0.01(4,15)=4.89,故F>F0.01,P<0.01,说明5个地区黄鼬冬季针毛长度差异极显著。结果做成方差分析表:不同地区黄鼬冬季针毛长度方差分析表变异来源SSdfs2FF0.05F0.01地区间地区内173.7112.9941543.430.8750.15**3.064.89总变异186.7019为了确定各个地区之间的差异是否显著,需要进行多重比较。这里用最小显著差数法(LSD)进行检验。查t值表,当dfe
=15时,t0.05=2.131,t0.01=2.947,于是有:LSD0.05=2.131×0.658=1.402LSD0.01=2.947×0.658=1.939本例中各组内观测数相等,而且组内方差均为0.866,故任何两组的比较均可用LSD0.05及LSD0.01。
在进行LSD0.05及LSD0.01比较时,各组间差数>LSD0.01,说明两地间差异极显著,标以不同的大写字母;
LSD0.01>各组间差数>LSD0.05,说明两地间差异显著,标以不同的小写字母;地区平均数差异显著性α=0.05α=0.01东北内蒙古河北安徽贵州31.6027.4026.0324.7522.85abbccdABBCCDD结果表明,东北与其它地区,内蒙古与安徽、贵州,河北与贵州黄鼬冬季针毛长度差异均达到极显著水平,安徽与贵州差异达到显著水平,而内蒙古与河北、河北与安徽差异不显著。根据组内观测次数目不同组内观测次数相等的方差分析组内观测次数不相等的方差分析
有时由于试验条件的限制,不同处理的观测次数不同,k个处理的观测次数依次是n1
、n2
、…、nk的单因素分组资料,前面介绍的方差分析方法仍然可用,但由于总观测次数不是nk,而是次,在计算平方和时公式稍有改变。组内观测次数不相等的方差分析se2∑ni-1
SSe误差或处理内SST总和st2k-1处理间F方差自由度平方和变异来源F=st2se2∑ni-k
在作多重比较时,首先应计算平均数的标准误。由于各组内观测次数不等,因此应需先算得各ni的平均数n0:各个处理的样本容量用于LSR检验用于LSD检验用某种小麦种子进行切胚乳试验,实验分为三种处理:整粒小麦(I),切去一半胚乳(II),切去全部胚乳(III),同期播种与条件较一致的花盆内,出苗后每盆选留两株,成熟后进行单株考种,每株粒重结果如表,试进行方差分析。处理株号合计平均数12345678910ⅠⅡIII21202429252224252822232525292130312627242626202120424414625.524.424.3小麦切胚乳试验单株粒重(g)处理株号合计平均数12345678910ⅠⅡIII21202429252224252822232525292130312627242626202120424414625.524.424.3小麦切胚乳试验单株粒重(g)n1
=8,n2
=10,n3
=6,N=24(1)平方和的计算SST=∑x2–C=212+292+…+262-C=230.5SSe
=SST-SSt
=230.5-6.8=223.7(2)自由度的计算(3)列方差分析表变异来源SSdfs2F处理间处理内6.8233.72213.410.70.318总变异230.523由表中结果可知,F<1,表明三种处理的每株粒重无显著差异。
由于F检验不显著,不需要再作多重比较。如果F检验显著,则需要进一步计算n0
,并求得(用于LSR检验)或(用于LSD检验),即x1x2-SxS
需要指出的是,不等观测次数的试验要尽量避免,因为这样的试验数据不仅计算麻烦,而且也降低了分析的灵敏度。
需要指出的是,不等观测次数的试验要尽量避免,因为这样的试验数据不仅计算麻烦,而且也降低了分析的灵敏度。在实际工作中经常会遇到两种因素共同影响试验结果的情况每一观测值都是某一特定温度与光照条件共同作用的结果。温度光照B1B2…BcA1A1B1A1B2…A1
BcA2A2B1A2B2…A2
Bc……………ArAr
B1ArB2…ArBc第三节二因素方差分析试验指标因素水平处理效应一、相关概念一、相关概念试验指标:衡量试验结果的标准猪的日增重小麦产量酶的活性试验指标因素(factor):也叫因子,是指对试验指标有影响,在研究中加以(控制)考虑的试验条件。可控因子:在试验中可以人为地加以调控的因子浓度、温度等非控因子:不能人为调控的因素(气象、环境等)固定因素:指因素的水平是经过特意选择的随机因素:指因素的水平是从该因素水平总体中随机抽出的样本因素一、相关概念不同离子对木聚糖酶活性的影响(mg/ml)0.000.250.500.751.001.250.000.060.120.180.240.300.000.400.801.201.602.000.000.400.600.801.001.20Na+K+
Cu2+
Mn2+实验指标因素水平(level):每个因素的不同状态(从质或量方面分成不同的等级)因素是一个抽象的概念,水平则是一个较为具体的概念水平一、相关概念不同离子对木聚糖酶活性的影响(mg/ml)0.000.250.500.751.001.250.000.060.120.180.240.300.000.400.801.201.602.000.000.400.600.801.001.20Na+K+
Cu2+
Mn2+水平处理处理:指对试验对象施以不同的措施饲料种类鱼增重(3个重复)ABCD31.927.931.824.825.726.822.123.627.327.030.829.0
对单因素试验而言,水平和处理是一致的,一个水平就是一个处理4种不同配合饲料对鱼的饲养效果一、相关概念处理饲料中能量与蛋白质的水平组合protein能量高低高低高高低高高低低低对多因素试验而言,处理就是指水平与水平的组合一、相关概念固定效应(fixedeffect):由固定因素所引起的效应。随机效应(randomeffect):由随机因素引起的效应。一、相关概念效应定义:是指对试验指标同时受到两个试验因素作用的试验资料的方差分析。固定模型二因素都是固定因素随机模型二因素均为随机因素混合模型一个因素是固定因素,一个因素是随机因素二因素方差分析主效和互作主效应(maineffect):各试验因素的相对独立作用互作(interaction):某一因素在另一因素的不同水平上所产生的效应不同。因素间的交互作用显著与否关系到主效应的利用价值二因素间是否存在交互作用有专门的统计判断方法,有时也可根据专业知识判断。如果交互作用显著,则各因素的效应就不能累加,最优处理组合的选定应根据各处理组合的直接表现选定。有时交互作用相当大,甚至可以忽略主效应。如果交互作用不显著,则各因素的效应可以累加,各因素的最优水平组合起来,即为最优的处理组合。二因素方差分析无重复观测值的二因素方差分析具有重复观测值的二因素方差分析无重复观测值的二因素方差分析依据经验或专业知识,判断二因素无交互作用时,每个处理可只设一个观测值,即假定A因素有a各水平,B因素有b个水平,每个处理组合只有一个观测值。无重复观测值的二因素方差分析因素A因素B总和Ti.平均数B1B2…BbA1x11x12…x1bT1.A2x21x22…x2bT2.…………………Aaxa1xa2…xabTa.总和T.jT.1T.2…T.bT平均数…无重复观测值的二因素分组资料模式二因素方差分析的线性模型因素间不存在交互作用,所以二因素方差分析观测值的线性模型是xij
=μ+αi
+βj
+εij
αi
和βj是A因素和B因素的效应,可以是固定的,也可以是随机的,且,εij是随机误差,彼此独立且服从N(0,σ2)。i=1,2,…,a;
j=1,2,…,b(1)平方和的分解为:(2)与平方和相应的自由度的分解为(4)F值的计算:(3)各项的方差分别为
将一种生长激素配成M1,M2,M3,M4,M5五种浓度,并用H1,H2,H3三种时间浸渍某大豆品种的种子,出苗45天后的各处理每以植株的平均干物重(g)(下表)。试作方差分析与多重比较。浓度(A)时间(B)TiH1H2H3M11314144113.67M21212133712.33M333393.00M410910299.67M5254113.67T.j4043441278.08.68.88.47激素处理对大豆干物重的影响激素浓度和时间均为固定因素,适应于固定模型。(1)平均和的计算:(2)自由度的计算(3)列出方差分析表,进行F检验变异来源dfSSs2FF0.05F0.01浓度间4289.0672.27116.56**3.847.01时间间误差281.734.940.870.621.404.468.65总变异14295.73
F检验结果表明,浓度间的F值大于F0.01,时间间的F值未达到显著水平,表明不同激素浓度对大豆干物重有极显著差异。(4)进行多重比较(用SSR检验):由于只有浓度间的效应达到了极显著差异,时间间的效应未达到显著水平,只需对5种浸渍浓度进行多重比较,可计算出浓度间的平均数标准误均为
b=3是每一浓度的观测值数目,如果要比较时间间的效应,由于每一时间有a=5个观测值,其平均数的标准误应为M2345SSR0.053.263.403.483.52SSR0.014.754.945.065.14SSR0.051.481.551.581.60SSR0.012.162.252.302.34不同浓度大豆干物重多重比较SSR和LSR值查SSR值表,当dfe=8,M=2,3,4,5时的SSR值及由此计算的LSR值列于下表多重比较结果表明:5种生长激素浓度对大豆干物重的影响有着极显著的差异,除M1与M2,M5与M3之外差异不显著外,其它浓度之间的大豆干物重均达到极显著差异。5种激素浓度中,以M1和M2的处理效果较好。浓度平均数差异显著性α=0.05α=0.01M1M2M3M4M513.6712.339.673.673.00aabccAABCC无重复观测值的二因素方差分析,所估计的误差实际上是这两个因素的相互作用,这是在两个因素不存在互作,或互作很小的情况下进行估计的。但是,如果存在两个因素的互作,方差分析中就不能用互作来估计误差,必须在有重复观测值的情况下对试验误差进行估计。
定义:是指对试验指标同时受到两个试验因素作用的试验资料的方差分析。二因素都是固定因素二因素均为随机因素固定模型随机模型混合模型一个因素是固定因素,一个因素是随机因素二因素方差分析
三种模型在计算上类似,但在对待检验及结果解释时有所不同。二因素方差分析无重复观测值的二因素方差分析具有重复观测值的二因素方差分析无重复观测值的二因素方差分析依据经验或专业知识,判断二因素无交互作用时,每个处理可只设一个观测值,即假定A因素有a个水平,B因素有b个水平,每个处理组合只有一个观测值。无重复观测值的二因素方差分析因素A因素B总和Ti.平均数B1B2…BbA1x11x12…x1bT1.A2x21x22…x2bT2.…………………Aaxa1xa2…xabTa.总和T.jT.1T.2…T.bT平均数…无重复观测值的二因素分组资料模式二因素方差分析的线性模型因素间不存在交互作用,所以二因素方差分析观测值的线性模型是xij
=μ+αi
+βj
+εij
αi
和βj是A因素和B因素的效应,可以是固定的,也可以是随机的,且,εij是随机误差,彼此独立且服从标准正态分布N(0,σ2)。i=1,2,…,a;
j=1,2,…,b二因素方差分析的线性模型因素间不存在交互作用,所以二因素方差分析观测值的线性模型是xij
=μ+αi
+βj
+εij
αi
和βj是A因素和B因素的效应,可以是固定的,也可以是随机的,且,εij是随机误差,彼此独立且服从标准正态分布N(0,σ2)。i=1,2,…,a;
j=1,2,…,b(1)平方和的分解为:(2)与平方和相应的自由度的分解为(4)F值的计算:(3)各项的方差分别为无重复观测值的二因素方差分析,所估计的误差实际上是这两个因素的相互作用,这是在两个因素不存在互作,或互作很小的情况下进行估计的。但是,如果存在两个因素的互作,方差分析中就不能用互作来估计误差,必须在有重复观测值的情况下对试验误差进行估计。二因素方差分析无重复观测值的二因素方差分析具有重复观测值的二因素方差分析具有重复观测值的二因素方差分析具有重复观测值的二因素方差分析具有重复观测值的二因素试验的典型设计是:假定A因素有a水平,B因素有b水平,则每一次重复都包括ab次实验,设试验重复n次,资料模式在P98。二因素具有重复观测值的方差分析用下面线性模型来描述:xijk
=μ+αi+βj+(αβ)ij+εijkA因素第i水平,B因素第j水平和第k次重复的观测值总平均值A因素第i水平的效应B因素第j水平的效应αi
和βj的交互作用随机误差模型中εijk彼此独立且服从标准正态分布(0,σ2)因试验共有n次重复,试验的总次数为abn次。方差分析步骤和前面介绍的相类似,唯一不同的是F检验的方法。(1)平方和的分解为:A处理的样本容量B处理的样本容量A处理、B处理和A×B互作的平方和试验重复数(3)各项的方差分别为(2)自由度的分解为(4)F检验:(b)随机模型:对于随机模型,αi、βj、(αβ)ij
和εijk是相互独立的随机变量,都遵从正态分布。在F检验时,先检验A×B是否显著:(a)固定模型:在固定模型中,αi
,βj及(αβ)ij
均为固定效应。在F检验时,A因素、B因素和A×B互作项均以Se2作为分母。检验A、B时,有:(c)混合模型(以A为固定因素,B为随机因素为例):在混合模型中,A和B的效应为非可加性,αi
为固定效应,βj及(αβ)ij
为随机效应。对A作检验时同随机模型,对B和A×B作检验时同固定模型,即:在实际应用中,固定模型应用最多,随机模型和混合模型相对较少。
为了研究某种昆虫滞育期长短与环境的关系,在给定的温度和光照条件下在实验室培养,每一处理记录4只昆虫的滞育天数,结果列于表中,是对该材料进行方差分析。光照(A)温度(B)250C300C350C5h·d-1143138120107101100808389931017610h·d-1961037891796183598076616715h·d-1798396986071786467587183不同温度及光照条件下某种昆虫滞育天数由于温度和光照条件都是人为控制的,为固定因素,可依固定因素分析。将表中数字均减去80,整理得下表光照(A)标本号温度(B)250C300C350C5h·d-112346358402721200391321-4271188443910h·d-112341623-211-1-193-210-4-19-13-2648-38-3615h·d-11234-131618-20-9-2-16-13-22-93-5236-47-41272-41-38193(1)平方和的分解为:(2)自由度的分解为结果列入方差分析表变异来源dfSSs2FF0.05F0.01光照间25367.062683.5321.94**3.355.49温度间25391.062695.5322.03**3.355.49光照×温度误差427464.943303.25116.24122.340.952.734.11总变异35295.73
F检验结果表明,浓度间和时间间的F值大于F0.01,它们的差异极显著,即昆虫滞育期长短主要决定于光照和温度,而与两者之间的互作关系不大。某昆虫滞育天数方差分析表要了解各种光照时间及温度对滞育期的影响,需进行不同光照间及不同温度间的多重比较,其方法可参照前面例子进行,但平均数标准误的计算为:光照(A)间平均数标准误,温度(B)间平均数标准误A处理的样本容量B处理的样本容量在啤酒生产中,为了研究烘烤方式(A)与大麦水分(B)对糖化时间的影响,选了两种烘烤方式,4种水分共8种处理,每一处理重复三次,结果如下表。烘烤方式(A)水分(B)B1B2B3B4A112.09.516.018.013.010.015.519.014.512.514.017.0A25.013.017.515.06.514.018.516.05.515.016.017.5大麦水分是不均匀的,又不易控制,所以因素B是随机的,它的效应也是随机的,因此本题是一个混合模型的方差分析。将上表中各观测值都减去10,计算后得烘烤方式(A)标本号水分(B)B1B2B3B4A112.0-5.06.08.051.023.00.05.59.034.52.54.07.09.52.015.524.0A21-5.03.07.55.039.52-3.54.08.56.03-4.55.06.07.5-13.012.022.018.5-3.51437.542.590.5(1)平方和的分解为:(2)自由度的分解为结果列入方差分析表变异来源dfSSs2FF0.05F0.01烘烤方式A15.5105.5100.15410.1934.12水分B3228.86576.28855.482**3.245.29A×B误差316107.61522.00035.8721.37526.089**3.245.29总变异23363.99糖化时间方差分析表表中F的计算为:
F检验结果表明,水分和的A×B的F值大于F0.01,大麦中的水分及水分与烘烤方式之间的互作对糖化时间的影响达到了极显著水平,而烘烤方式对糖化时间的作用不显著。在生产上应注意大麦的含水量及根据含水量来选择合适的烘烤方式。变异来源dfSSs2FF0.05F0.01烘烤方式A15.5105.5100.15410.1934.12水分B3228.86576.28855.482**3.245.29A×B误差316107.61522.00035.8721.37526.089**3.245.29总变异23363.99第四节多因素方差分析实际工作中,往往需要考察三个或多个因素的效应。这相当于把二因素方差分析扩展到一般情况。如在一个试验中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 注册资产评估师资产评估实务2026年考试模拟卷及答案
- 2025年北京市法院系统招聘聘用制审判辅助人员笔试真题
- 双重预防机制风险辨识评估工作规程
- GFKQSSKAL-生命科学试剂-MCE
- Forsyshiyanine-A-生命科学试剂-MCE
- Flunoprost-生命科学试剂-MCE
- 2026mysql数据库dba面试题及答案
- 2026jvm经典面试题及答案
- 尺神经损伤的并发症预防与处理
- 2026年洛阳市部分事业单位招考易考易错模拟试题(共500题)试卷后附参考答案
- 2026年安全生产月安全生产知识宣讲课件
- 2025-2026年济南市“市中区”九年级中考英语二模考试试题以及含答案
- 2026年9月铜仁遴选笔试试题及答案
- (正式版)DB44∕T 2830-2026 艾滋病病毒感染者及艾滋病患者手术室管理规范
- 英语北京市西城区2026年高三年级统一测试试卷(西城高三一模)(4.7-4.10)
- (2025年)急性缺血性脑卒中静脉溶栓的护理常规考核试题及答案
- AI在教育课堂互动中的应用:场景、策略与评估
- 文件控制程序培训
- 江苏省高职单招《职测》考试题库(附答案)
- 药明康德研发生产制度
- 建筑国企合规管理培训
评论
0/150
提交评论