i第八章单因素方差分析_第1页
i第八章单因素方差分析_第2页
i第八章单因素方差分析_第3页
i第八章单因素方差分析_第4页
i第八章单因素方差分析_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(优选)i第八章单因素(Su)方差分析第一页,共六十一页。第八章单因素方差分(Fen)析One-factoranalysisofvariance第二页,共六十一页。本章内(Nei)容第一节方差分析简述第二节固定效应模型第四节多重比较第三节随机效应模型第五节方差分析应具备的条件第三页,共六十一页。方差分析(analysisofvariance,ANOVA):是同时判断多组数据平(Ping)均数之间差异显著性的统计假设检验,是两组数据平(Ping)均数差异显著性t检验的延伸。ANOVA由英国统计学家R.A.Fisher首创,用于推断多个总体均数有无差异。第一节方差分析简述一、方差分析的一般概念1、概念第四页,共六十一页。单因素方差分析(一种(Zhong)方式分组的方差分析):研究对象只包含一个因素(factor)的方差分析。单因素实验:实验只涉及一个因素,该因素有a个水平(处理),每个水平有n次实验重复,这样的实验称为单因素实验。水平(level):每个因素不同的处理(treatment)。第五页,共六十一页。方差(Cha)分析

AnalysisofVariance(ANOVA)

因素也称为处理因素(factor)(名义分类变量),每一处理因素至少有两个水平(level)(也称“处理组”)。一个因素(水平间独立)——单向方差分析(第八章)两个因素(水平间独立或相关)——双向方差分析(第九章)一个个体多个测量值——重复测量资料的方差分析

ANOVA与回归分析相结合——协方差分析

目的:用这类资料的样本信息来推断各处理组间多个总体均数的差别有无统计学意义。第六页,共六十一页。【例(Li)】随机选取4窝动物,每窝中均有4只幼仔,称量每只幼仔的出生重,结果如下。判断不同窝的动物出生重是否存在显著性差异。4窝动物的出生重单位:g32.931.425.728.0118.029.50027.123.327.826.7104.926.22533.226.028.632.3120.130.02534.733.326.231.6125.831.4501234和平均数ⅣⅢⅡⅠ窝别动物号第七页,共六十一页。2、单因素方差分析的数据(Ju)格式:…yi1yi2yi3…yij…yinYi…ya1ya2ya3…yaj…yany31y32y33…y3j…y3ny21y22y23…y2j…y2ny11y12y13…y1j…y1n123…j…n平均数YaY3Y2Y1第八页,共六十一页。二、不同处理效应(Ying)与不同模型1、方差分析中每一观测值的描述

——线性统计模型yij:在第i水平下的第j次观测值;μ:总平均数,是对所有观测值的一个参数;αi:处理效应,是仅限于对第i次处理的一个参数;εij:随机误差成分。第九页,共六十一页。2、①固定(Ding)效应:由固定(Ding)因素所引起的效应。固定因素的水平可以严格地人为控制,在水平固定之后,它的效应值也是固定的。③固定模型:处理固定因素所用的模型。在固定模型中,方差分析所得到的结论只适合于选定的那几个水平,不能将结论扩展到未加考虑的其它水平上。②固定因素:所研究因素各个水平是经过特意选择的,这样的因素称为固定因素。第十页,共六十一页。3、①随(Sui)机效应:由随(Sui)机因素所引起的效应。②随机因素:所研究因素各个水平是从该因素水平总体中随机抽出的,这样的因素称为随机因素。③随机模型:处理随机因素所用的模型。在随机模型中,方差分析所得到的结论,可以推广到这个因素的所有水平上,是对水平总体的推断。随机因素的水平是不能严格人为控制的,在水平确定之后,它的效应值并不固定。第十一页,共六十一页。第二节(Jie)固定效应模型一、线性统计模型要检验a个处理效应的相等性,就要判断各αi是否为0。H0:α1=α2

=……=αa

=0HA:αi≠0(至少有1个i)若接受H0,则不存在处理效应,每个观测值是由总平均数加上随机误差构成;若拒绝H0,则存在处理效应,每个观测值是由总平均数、处理效应及误差三部分构成。第十二页,共六十一页。处理间(组间)变异总变异误差或处理内(组内)变异总变异是测量值yij与总的均数间(Jian)的差异。处理间变异是由处理效应引起的变异。处理内变异是由随机误差引起的变异。用离均差平方和的平均(均方、方差)反映变异的大小

第十三页,共六十一页。1.

总平方和(totalsumofsquares,SST):每个测量值与总平均数(Shu)离差的平方和的总和,反应了一组数(Shu)据总的变异程度。计算公式为:校正项(校正系数,correction):dfT=N-1=an-1

二、平方和与自由度的分解第十四页,共六十一页。2.

处(Chu)理间平方和(sumofsquaresamongtreatments,SSA):各个处理组的平均数与总平均数离差的平方和,SSA反映了各处理组均数的变异程度。计算公式为:dfA=a-1处理均方(treatmentmeansquare,MSA):处理间平方和除以自由度。(含有误差成分)第十五页,共六十一页。误差平方和(errorsumofsquares,SSe)或称处理内平方和(sumofsquareswithintreatment):各处理内部观测值与相应处理平均数离差的平方和,SSe反映了各处理组内观测值的变异程度。计算公(Gong)式为:dfe=dfT-dfA=an-a误差均方(errormeansquare,MSe):误差平方和除以误差自由度。MSe反映了随机因素所造成的方差的大小。3.在同一处理组内虽然每个受试对象接受的处理相同,但观测值仍各不相同,这是由随机因素(误差)引起的。第十六页,共六十一页。三种变异之间的关(Guan)系SST=SSA+SSe

dfT=dfA+dfe

处理内变异:随机误差处理间变异:处理因素+随机误差第十七页,共六十一页。One-FactorANOVA

PartitionsofTotalVariationVariationDuetoTreatmentSSBVariationDuetoRandomSamplingSSWTotalVariationSSTCommonlyreferredtoas:SumofSquaresWithin,orSumofSquaresError,orWithinGroupsVariationCommonlyreferredtoas:SumofSquaresAmong,orSumofSquaresBetween,orSumofSquaresModel,orAmongGroupsVariation=+第十八页,共六十一页。

均方(Fang)差,均方(Fang)(meansquare,MS)第十九页,共六十一页。

三、检验统计(Ji)量F,当F<Fα时,接受零假设H0:α1=α2=……=αa=0,各处理平均数之间差异不显著,认为MSA与MSe差异不大,产生的变异是由随机误差造成的;当F>Fα时,拒绝零假设,处理平均数间差异显著,MSA显著高于MSe,产生的变异是由处理因素造成的。做F单侧上尾检验第二十页,共六十一页。

F值与F分(Fen)布,第二十一页,共六十一页。四、方差分(Fen)析表na-1SST总和MSA/MSeMSAa-1SSA处理间F均方自由度平方和变差来源单因素固定效应模型方差分析表误差或处理内SSea(n-1)MSe第二十二页,共六十一页。五(Wu)、方差分析的指导思想与基本原理方差分析的指导思想:是将所有测量值间的总变异按照其变异的来源分解为多个部分,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。第二十三页,共六十一页。方差分析的基本原理:将总平方和分解为处理平方和和误差平方和,根据(Ju)相应的自由度,得到相应的均方;处理均方反映处理因素所造成的方差的大小,误差均方反映随机因素(误差)所造成的方差的大小;处理均方除以误差均方反映处理效应的显著性。第二十四页,共六十一页。六(Liu)、单因素方差分析与成组数据t检验的异同单因素方差分析成组数据t检验相同不同平均数差异显著性检验平均数差异显著性检验两个平均数差异的检验多个平均数差异的分析利用平均数的差利用平均数的方差计算统计量t计算统计量F第二十五页,共六十一页。【例8.1】

调查了5个不同小麦品系的(De)株高,结果如下。试判断这5个品系的株高是否存在显著性差异。七、实例株号品系ⅠⅡⅢⅣⅤ12345和平均数64.665.364.866.065.8326.565.364.565.364.663.763.9322.064.467.866.367.166.868.5336.567.371.872.170.069.171.0354.070.869.268.269.868.367.5343.068.65个小麦品系株高(cm)调查结果第二十六页,共六十一页。①列(Lie)出方差分析计算表:解:序号品系ⅠⅡⅢⅣⅤ12345-0.40.3-0.21.00.81.52.251.93-0.50.3-0.4-1.3-1.1-3.09.003.42.81.32.11.83.511.5132.2529.436.87.15.04.16.029.0841.00174.464.23.24.83.32.518.0324.0068.06总和57.01308.50277.28(编码法-65)②利用公式计算各项平方和:第二十七页,共六十一页。③列出方差(Cha)分析表:④结论:F4,20,0.05=2.86624147.32总和42.2332.940.78420131.7415.58品系间误差F均方自由度平方和变差来源不同小麦品系株高方差分析表﹡α=0.05选定的5个不同小麦品系的株高差异极显著。F4,20,0.01=4.431F>F0.01﹡﹡﹡﹡α=0.01第二十八页,共六十一页。下(Xia)结论

注意:当组数为2时,完全随机设计的方差分析结果与两样本均数比较的t检验结果等价,对同一资料,有:第二十九页,共六十一页。第三(San)节随机效应模型一、随机效应模型的方差分析1、方差分析的程序与固定效应模型方差分析的程序一样。2、随机效应模型方差分析所得结论适用于水平的总体,固定效应模型方差分析所得结论只适用于所选定的a个水平。第三十页,共六十一页。【例8.2】随机选取4窝动物,每窝中均有4只幼仔,称量(Liang)每只幼仔的出生重,结果如下。判断不同窝的动物出生重是否存在显著性差异。二、实例4窝动物的出生重单位:g32.931.425.728.0118.029.50027.123.327.826.7104.926.22533.226.028.632.3120.130.02534.733.326.231.6125.831.4501234和平均数ⅣⅢⅡⅠ窝别动物号第三十一页,共六十一页。解(Jie):总和-11.2265.66185.362.91.4-4.3-2.0-2.04.0032.86-2.9-6.7-2.2-3.3-15.1228.0169.033.2-4.0-1.42.30.10.0133.494.73.3-3.81.65.833.6449.981234ⅣⅢⅡⅠ窝别序号①列出方差分析计算表(-30):②计算各项平方和:第三十二页,共六十一页。③列出(Chu)方差分析表:④结论:F3,12,0.05=3.49动物出生重方差分析表不同窝别动物的出生重没有显著差异。F<F0.0515147.32总和1.9719.5259.91231258.575118.945窝间误差F均方自由度平方和变差来源﹡α=0.05﹡﹡α=0.01第三十三页,共六十一页。三(San)、不等重复时平方和和自由度的计算dfA=a-1dfe=N-adfT=N-1第三十四页,共六十一页。第四节平均值(Zhi)之间的多重比较接受H0(F<Fα),表示各处理组均数基本相等,差异没有统计学意义。拒绝H0,接受HA(F>Fα),

表示各处理组均数不全相等,差异有统计学意义。哪两均数之间差异显著?哪两均数之间差异不显著?——方差分析终止——需要进一步做多重比较第三十五页,共六十一页。多重(Zhong)比较(multiplecomparison):经过方差分析,若结论是各处理均数差异显著(F>Fα,拒绝H0),则必须在各处理均数之间一对一对地做比较,以判断究竟在哪些对均数之间存在显著差异,哪些对之间没有显著差异,这种比较称为多重比较。第三十六页,共六十一页。累积Ⅰ类(Lei)错误的概率为α’当有k个均数需作两两比较时,比较的次数共有c==k!/(2!(k-2)!)=k(k-1)/2设每次检验所用Ⅰ类错误的概率水准为α,累积Ⅰ类错误的概率为α’,则在对同一实验资料进行c次检验时,在样本彼此独立的条件下,根据概率乘法原理,其累积Ⅰ类错误概率α’与c有下列关系:α’=1-(1-α)c(8.6)例如,设α=0.05,c=3(即k=3),其累积Ⅰ类错误的概率为α’=1-(1-0.05)3=1-(0.95)3=0.143第三十七页,共六十一页。1、最小显著差数法:把任意两组数据平均数差的绝对值与LSD

比(Bi)较,以判断不同组数据平均数差异显著性的多重比(Bi)较方法。一、最小显著差数(LeastSignificantDifference,LSD)法成组数据t检验2、LSD的公式推导:当n1=n2称为最小显著差数,记为LSD。第三十八页,共六十一页。③|dy|>与LSD比较,得出结论。当|dy|>LSD时,该对平均数差异显著;否(Fou)则差异不显著。3、LSD检验程序:①计算LSD②

列表计算每一对平均数差的绝对值|dx

|;第三十九页,共六十一页。二(Er)、Duncan多范围检验

Duncanmultiplerangetest1、Duncan多范围检验程序:①

将需要比较的a个平均数依照从大到小的次序重新排列。

原始处理组号平均数

重新排序号12…a-1ay1

y2…ya-1

ya②

计算每一对平均数间的差(大值-小值),列成表。第四十页,共六十一页。③

计算临界值(Zhi)Rk,列表。不同对平均数的差有不同的临界值Rk。rα(k,df)的值由附表9(多重比较中的Duncan表)查出。df=a(n-1),是误差项自由度。k是相比较的两个平均数间包含的平均数的个数(包括这两个平均数),计算公式是两平均数下标的差加上1。dfka(n-1)23…a-1ar0.05Rkr0.01Rkk=2,3,…,a有a个平均数,有a-1个k值,需查出a-1个rα,分别乘以Sy,得到a-1个Rk值。第四十一页,共六十一页。④

比(Bi)较每一对平均数差与相应的Rk,得出结论。若平均数差大于相应的Rk,说明这一对平均数之间差异显著或者极显著,以符号“﹡”或“﹡﹡”表示;若平均数差小于相应的Rk,说明这一对平均数之间差异不显著。第四十二页,共六十一页。【例8.1】调查了5个小麦品系的株高,结果如下。经方差分析判断这5个品系的株高存在显著性差异,试做(Zuo)多重比较分析。2、实例株号品系ⅠⅡⅢⅣⅤ12345和平均数64.665.364.866.065.8326.565.364.565.364.663.763.9322.064.467.866.367.166.868.5336.567.371.872.170.069.171.0354.070.869.268.269.868.367.5343.068.65个小麦品系株高(cm)调查结果第四十三页,共六十一页。①

排(Pai)序:解:②

求差:③

列表计算Rk:④

结论:品系号ⅣⅤⅢⅠⅡ平均数排序号70.8168.6267.3365.3464.45543212346.44.22.90.95.53.32.03.51.32.21.5881.6671.7101.7384.024.224.334.401.1651.2251.2561.2842.953.103.183.25234520Rkr0.01Rkr0.05kdf﹡﹡﹡﹡﹡﹡﹡﹡﹡﹡﹡﹡﹡﹡﹡﹡﹡品系Ⅰ和Ⅱ间株高差异不显著,品系Ⅲ和Ⅴ间株高差异显著,其余各品系间株高差异极显著。第四十四页,共六十一页。二(Er)、SNK法SNK(student-Newman-Keuls)法又称q检验,是根据q值的抽样分布作出统计推论(例8-1)。1.将各组的平均值按由大到小的顺序排列:

顺序 (1) (2) (3) (4)

平均值 28.0 18.7 18.5 14.8

原组号 B C A D 2.计算两个平均值之间的差值及组间跨度k,见表8-3第(2)、(3)两列。3.计算统计量q值4.根据计算的q值及查附表6得到的q界值(p286),作出统计推断。第四十五页,共六十一页。附(Fu)表6第四十六页,共六十一页。Bonferroni法(Fa)的适用性

当比较次数不多时,Bonferroni法的效果较好。但当比较次数较多(例如在10次以上)时,则由于其检验水准选择得过低,结论偏于保守。第四十七页,共六十一页。三(San)、Tukey法第四十八页,共六十一页。第五节方差分析应(Ying)具备的条件1、可加性:每个处理效应和误差效应是可加的;一、方差分析应满足的三个条件2、正态性:实验误差应当是服从正态分布的独立随机变量;3、方差齐性:各处理的误差方差应具备齐性。第四十九页,共六十一页。1、Bartlett检(Jian)验基本原理:

二、多个方差齐性检验

——Bartlett检验当a个随机样本是从独立正态总体中抽取时,可以计算出统计量K2。当n=minni充分大时(n>3),K2的抽样分布非常接近于a-1自由度的x2分布。第五十页,共六十一页。2、Bartlett检(Jian)验程序:①

假设:H0:σ12=σ22

=……=σa2HA:至少有两个σi2不相等②计算检验统计量K2③

结论:当K2>x2a-1,α时拒绝零假设,方差不齐,应做数据变换;否则,接受零假设,方差具有齐性。当各处理样本含量相同时第五十一页,共六十一页。3、变(Bian)换①平方根变换将每个观测值取其平方根,做方差齐性检验,若方差整齐,然后对平方根进行方差分析。属于泊松分布的数据,常常需要采取平方根变换;当观测数值很小时,如有几个数小于10时,为了矫正,可以使用观测值加上1再取平方根的变换。第五十二页,共六十一页。②平方根反(Fan)正弦变换取每个观测值平方根的反正弦值,然后做方差分析。适用于以百分数表示的二项分布数据。⑴百分数的变化范围很大时,要使用反正弦变换,变换后的数据可以从附表10中查出;⑵百分数的变化范围在0%~20%,用平方根变换;⑶百分数的变化范围在80%~100%,先用100减去各百分数,然后做平方根变换;⑷百分数的变化范围在30%~70%,可以不做变换。第五十三页,共六十一页。③

对(Dui)数变换取每个观测值对数值,然后做方差分析。⑴大范围的正整数适用于对数变换;⑵对于一些小的数值,如小于10时,每一观测值都加上1再变换。第五十四页,共六十一页。三、方差(Cha)分析总程序:1、多个方差齐性检验——Bartlett检验当K2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论