第三方差分析_第1页
第三方差分析_第2页
第三方差分析_第3页
第三方差分析_第4页
第三方差分析_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三方差分析第一节方差分析得基本原理[例3-1]第一节方差分析得基本原理不同肥料处理对苗木高度得影响[例3-2]总差异组内差异组间差异抽样误差处理误差总变异(Totalvariation):全部测量值

与总均数间得差异组间变异(betweengroupvariation):各组得均数与总均数间得差异组内变异(withingroupvariation):每组得每个测量值与该组均数得差异YijYij第一节方差分析得基本原理第一节方差分析得基本原理将所有测量值间得总变异按照其变异得来源分解为多个部分,然后进行比较,评价由某种因素所引起得变异就是否具有统计学意义。组间变异总变异组内变异第一节方差分析得基本原理

ANOVA由英国统计学家R、A、Fisher首创,为纪念Fisher,以F命名,故方差分析又称F检验(Ftest)。用于推断多个总体均数有无差异第一节方差分析得基本原理

将总变异分解为处理间变异与处理内变异,就就是要将总均方分解为处理间均方与处理内均方。总离均差平方与,简称为总平方与,剖分成处理间平方与与处理内平方与两部分;总自由度,剖分成处理间自由度与处理内自由度两部分来实现得。第一节方差分析得基本原理三种“变异”之间得关系离均差平方与分解:第一节方差分析得基本原理总平方与得剖分反映全部观测值总变异得总平方与就是各观测值xij与总平均数得离均差平方与,记为SST。即因为

其中第一节方差分析得基本原理所以(6-1)式中,为各处理平均数与总平均数得离均差平方与与重复数n得乘积,反映了重复n次得处理间变异,称为处理间平方与,记为SSA,即(6-2)式中,为各处理内离均差平方与之与,反映了各处理内得变异即误差,称为处理内平方与或误差平方与,记为SSe,即(6-3)第一节方差分析得基本原理12大家应该也有点累了,稍作休息大家有疑问的,可以询问和交流则有SST=SSa+SSe

(6-4)(6-4)就是单因素试验结果总平方与、处理间平方与、处理内平方与得关系式。这个关系式中三种平方与得简便计算公式如下:

(6-5)其中,C为矫正数。第一节方差分析得基本原理总自由度得剖分在计算总平方与时,资料中得各个观测值要受这一条件得约束,故总自由度等于资料中观测值得总个数减一,即an-1。总自由度记为dfT,即dfT=an-1。在计算处理间平方与时,各处理均数要受这一条件得约束,故处理间自由度为处理数减一,即a-1。处理间自由度记为dft,即dfA=a-1。在计算处理内平方与时,要受a个条件得约束,即(i=1,2,…,a)。故处理内自由度为资料中观测值得总个数减a,即an-a。处理内自由度记为dfe,即dfe=an-a=a(n-1)第一节方差分析得基本原理因为所以

综合以上各式得:

第一节方差分析得基本原理

均方差,均方(meansquare,MS)变异程度除与离均差平方与得大小有关外,还与其自由度有关,由于各部分自由度不相等,因此各部分离均差平方与不能直接比较,须将各部分离均差平方与除以相应自由度,其比值称为均方差,简称均方(meansquare,MS)。组间均方与组内均方得计算公式为:

总均方一般不等于处理间均方加处理内均方。MS总≠MS组间+MS组内第一节方差分析得基本原理F分布与F测验(一)F分布设想我们作这样得抽样试验,即在一正态总体N(μ,σ2)中随机抽取样本含量为n得样本a个。此时所谓得各处理没有真实差异,各处理只就是随机分得组。因此,与都就是误差方差得估计量。以为分母,为分子,求其比值。统计学上把两个均方之比值称为F值。即

F具有两个自由度第一节方差分析得基本原理若在给定得a与n得条件下,继续从该总体进行一系列抽样,则可获得一系列得F值。这些F值所具有得概率分布称为F分布(Fdistribution)。F分布密度曲线就是随自由度df1、df2得变化而变化得一簇偏态曲线,其形态随着df1、df2得增大逐渐趋于对称,如图6-1所示。第一节方差分析得基本原理附表5列出得就是不同df1与df2下,P(F≥)=0、05与P(F≥)=0、01时得F值,即右尾概率α=0、05与α=0、01时得临界F值,一般记作,。如查附表5,当df1=3,df2=18时,F0、05(3,18)=3、16,F0、01(3,18)=5、09,表示如以df1=dft=3,df2=dfe=18在同一正态总体中连续抽样,则所得F值大于3、16得仅为5%,而大于5、09得仅为1%。第一节方差分析得基本原理F检验附表5就是专门为检验代表得总体方差就是否比代表得总体方差大而设计得。若实际计算得F值大于,则F值在α=0、05得水平上显著,我们以95%得可靠性(即冒5%得风险)推断代表得总体方差大于代表得总体方差。这种用F值出现概率得大小推断两个总体方差就是否相等得方法称为F检验(F-test)。在方差分析中所进行得F检验目得在于推断处理间得差异就是否存在,检验某项变异因素得效应方差就是否为零。因此,在计算F值时总就是以被检验因素得均方作分子,以误差均方作分母。第一节方差分析得基本原理实际进行F检验时,就是将由试验资料所算得得F值与查附表5所得得临界F值,相比较作出统计推断得。若F<,各处理间差异不显著,在F值得右上方标记“ns”,或不标记符号;若≤F<,各处理间差异显著,在F值得右上方标记“*”;若F≥,各处理间差异极显著,在F值得右上方标记“**”。第一节方差分析得基本原理第一节方差分析得基本原理a:水平数n:每个处理测定重复数第一节方差分析得基本原理第一节方差分析得基本原理方差分析得基本思想根据研究目得与设计类型,将总变异中得离均差平方与SS及其自由度分别分解成相应得若干部分,然后求各相应部分得变异;再用各部分得变异与组内(或误差)变异进行比较,得出统计量F值;最后根据F值得大小确定P值,作出统计推断。第一节方差分析得基本原理整个方差分析得基本步骤(1)建立检验假设;

H0:多个样本总体均数相等。

H1:多个样本总体均数不相等或不全等。

检验水准为0、05。(2)计算检验统计量F值;(3)确定P值并作出推断结果。第一节方差分析得基本原理方差分析得检验假设H0为各样本来自均数相等得总体,H1为各总体均数不等或不全相等。

若不拒绝H0时,可认为各样本均数间得差异就是由于抽样误差所致,而不就是由于处理因素得作用所致。理论上,此时得组间变异与组内变异应相等,两者得比值即统计量F为1;由于存在抽样误差,两者往往不恰好相等,但相差不会太大,统计量F应接近于1。若拒绝H0,接受H1时,可认为各样本均数间得差异,不仅就是由抽样误差所致,还有处理因素得作用。此时得组间变异远大于组内变异,两者得比值即统计量F明显大于1。在实际应用中,当统计量F值远大于1且大于某界值时,拒绝H0,接受H1,即意味着各样本均数间得差异,不仅就是由抽样误差所致,还有处理因素得作用。第一节方差分析得基本原理欲比较毛白杨4个无性系得生长量,每个无性系随机抽查3株,结果如下表,试判断4个无性系间就是否存在差异。[例3-3]课堂练习第一节方差分析得基本原理不同肥料处理对苗木高度得影响[例3-2]第一节方差分析得基本原理1、建立检验假设

H0:4种肥料处理苗高总体均数相等。

H1:4种肥料处理得苗高均数不相等或不全等。2、计算检验统计量F值(1)自由度与平方与得分解

总变异自由度DFT=na-1=6×4-1=23

处理间自由度DFa=a-1=4-1=3

误差(处理内)自由度DFe=a(n-1)=4×(6-1)=20第一节方差分析得基本原理第一节方差分析得基本原理方差分析第一节方差分析得基本原理(2)F测验查F表当V1=3,V2=20时,F0、01=4、94,现实得F=8、46>F0、01

3、作出结论推断出这个试验得处理平均数间就是有极显著差异得。即否定H0,承认H1。第一节方差分析得基本原理作一水稻施肥得盆栽试验,设5个处理,A与B系分别施用两种不同工艺流程得氨水,C施碳酸氢铵,D施尿素,E不施氮肥。每处理4盆(施肥处理得施肥量每盆皆为折合纯氮1、2克),共5×4=20盆,随机放置于同一网室中,其稻谷产量(克/盆)列于表6、11,试测验各处理平均数得差异显著性。[例3-4]第一节方差分析得基本原理

水稻施肥盆栽试验得产量结果第一节方差分析得基本原理分析步骤:1、建立检验假设

H0:5种肥料处理水稻产量总体均数相等。

H1:5种肥料处理水稻产量均数不相等或不全等。2、计算检验统计量F值(1)自由度与平方与得分解

总变异自由度DFT=na-1=5×4-1=19

处理间自由度DFA=k-1=5-1=4

误差(处理内)自由度DFe=a(n-1)=5×(4-1)=15第一节方差分析得基本原理第一节方差分析得基本原理第一节方差分析得基本原理(2)F测验将上述结果录入上表,计算处理间均方对误差均方得比率,算得F=75、3/6、73=11、19,查F表当V1=4,V2=15时,F0、01=4、89,现实得F=11、19>F0、01

,推断这个试验得处理平均数间就是有极显著差异得。即否定H0,承认H1。第一节方差分析得基本原理

某林业研究所为了比较四种肥料对某一苗木施肥效果,选取了条件基本相同得苗木20株,随机分成四组,施用不同肥料,经五个月试验以后,各株苗木增长得结果列于下表。[例3-5]施用4种肥料对苗木高度增长量得影响第一节方差分析得基本原理这就是一个单因素试验,处理数a=4,重复数n=5。各项平方与及自由度计算如下:矫正数总平方与

处理间平方与处理内平方与第一节方差分析得基本原理总自由度处理间自由度处理内自由度用SSa、SSe分别除以dfa与dfe便得到处理间均方MSa及处理内均方MSe。第一节方差分析得基本原理因为F=MSa/MSe=38、09/5、34=7、13;根据df1=dft=3,df2=dfe=16查附表5,得F>F0、01(3,16)=5、29,

表明四种肥料对苗高得增长效果差异极显著。在方差分析中,通常将变异来源、平方与、自由度、均方与F值归纳成一张方差分析表。表中得F值应与相应得被检验因素齐行。因为经F检验差异极显著,故在F值7、13右上方标记“**”。在实际进行方差分析时,只须计算出各项平方与与自由度,各项均方得计算及F值检验可在方差分析表上进行。第一节方差分析得基本原理第三章不同肥料处理对苗木高度得影响[例3-2]第二节

单向分组资料得方差分析比较例3-2、3-6有什么不同----组内观察值数目相等得单向分组资料得方差分析不同肥料处理对苗木高度得影响(dm)第二节

单向分组资料得方差分析[例3-6]----组内观察值数目不等得单向分组资料得方差分析组内观察值数目相等得单向分组资料得方差分析在a组处理中,每处理皆含有n个供试单位得资料。n1=n2=n3=n4=…ni=n第二节

单向分组资料得方差分析组内观察值数目不等得单向分组资料得方差分析若a个处理中得观察值数目不等,分别为n1,n2,…,na,在方差分析时有关公式因ni不相同而需作相应改变。

若a个处理中得观察值数目不等,分别为n1,n2,…,na,在方差分析时有关公式因ni不相同而需作相应改变。主要区别点如下:

自由度与平方与得分解第二节

单向分组资料得方差分析

----组内观察值数目不等得单向分组资料得方差分析

总变异自由度组间变异自由度组内变异自由度第二节

单向分组资料得方差分析

----组内观察值数目不等得单向分组资料得方差分析

不同肥料处理对苗木高度得影响(dm)第二节

单向分组资料得方差分析

----组内观察值数目不等得单向分组资料得方差分析

[例3-6]建立检验假设

H0:4种肥料处理苗高总体均数相等。

H1:4种肥料处理得苗高均数不相等或不全等。第二节

单向分组资料得方差分析

----组内观察值数目不等得单向分组资料得方差分析

矫正系数总平方与处理间平方与处理间平方与组内离均差平方与第二节

单向分组资料得方差分析

----组内观察值数目不等得单向分组资料得方差分析

该资料=6+6+7+7=26

故总变异自由度DFT=Σni-1=26-1=25不同肥料处理间自由度DFa=a-1=4-1=3误差自由度DFe=Σni-k=25-3=22第二节

单向分组资料得方差分析

----组内观察值数目不等得单向分组资料得方差分析

处理间均方处理内均方方差分析表第二节

单向分组资料得方差分析

----组内观察值数目不等得单向分组资料得方差分析

标准差与标准误标准差(standarddeviation)就是随机误差得代表,就是随机误差绝对值得统计均值。标准误(standarderror)就是在抽样试验中常用到得样本平均数得标准差,也就就是样本平均数得标准误,简称为标准误。标准差:表示个体间变异大小得指标,就是衡量数据精密程度得指标。标准误:反映样本均数对总体均数得变异程度,就是度量结果精密度得指标。标准误=Excel中只有计算standdeviation得公式(=stdev()),没有计算standerror得函数。

[例3-7]

某病虫测报站,调查四种不同类型得水稻田28块,每块田所得稻纵卷叶螟得百丛虫口密度列于下表,试问不同类型稻田得虫口密度有否显著差异?不同类型稻田纵卷叶螟得虫口密度

第二节

单向分组资料得方差分析

----组内观察值数目不等得单向分组资料得方差分析

该资料=7+6+8+7=28

故总变异自由度DFT=Σni-1=28-1=27稻田类型间自由度DFa=a-1=4-1=3误差自由度DFe=Σni-k=27-3=24第二节

单向分组资料得方差分析

----组内观察值数目不等得单向分组资料得方差分析

SSaSSe=226、11-96、13=129、98第二节

单向分组资料得方差分析

----组内观察值数目不等得单向分组资料得方差分析

方差分析F=5、91>F0、01,即4块麦田得虫口密度间有极显著差异。F测验显著。4块麦田得虫口密度间就是否两两都存在差异?---多重比较第二节

单向分组资料得方差分析

----组内观察值数目不等得单向分组资料得方差分析

不拒绝H0,表示拒绝总体均数相等得证据不足

————>分析终止。拒绝H0,接受H1,表示总体均数不全相等哪两两均数之间相等?哪两两均数之间不等?

————>需要进一步作多重比较。

第三节

多重比较(Multipleparisons)

第三节

多重比较定义对有些试验来说,其目得不仅在于了解一组处理间总体上有无实质性差异,更在于了解哪些处理间存在真实差异,故需进一步做处理平均数间得比较。一个试验中a个处理平均数间可能有a(a-1)/2个比较,因而这种比较就是复式比较亦称为多重比较。最小显著差数法:leastsignificantdifference,简称LSD最小显著极差法:leastsignificantrange,简称LSR

第三节

多重比较q法SSR法

第三节

多重比较基本思路:寻找尺子,然后丈量处理间平均数得差异计算程序:计算最小显著差数标准()由所具得自由度查t值表,获得值,计算

制作多重比较表进行判断将各处理平均数按大小顺序排列,制作多重比较表。若显著;否则,则不显著。

第三节

多重比较

----最小显著差数法(LSD法)若两处理样本数相等

[例3-8]

试以LSD法测验各种药剂处理得苗高平均数间得差异显著性。不同药剂处理得苗高(cm)

第三节

多重比较

----最小显著差数法(LSD法)

第三节

多重比较

----最小显著差数法(LSD法)

第三节

多重比较

----最小显著差数法(LSD法)F=20、56为显著,MSe=8、17,dfe=12,由附表4,12时,t0、05(12)=2、179,t0、01(12)

=3、055故LSD0、05=2、179×2、02=4、40(cm);

LSD0、01=3、055×2、02=6、17(cm)

q法,也称Student-Newman-Keuls(S-N-K),就是1953年提出得,根据q值得抽样分布作出统计推论。

q测验方法就是将一组a个平均数由大到小排列后,根据所比较得两个处理平均数得差数就是几个平均数间得极差分别确定最小显著极差值。q测验因就是根据极差抽样分布原理,其各个比较都可保证同一个显著水平。第三节

多重比较

----q检验法计算程序:计算最小显著差数标准()由自由度查q值表,获得值,计算

制作多重比较表进行判断将各处理平均数按大小顺序排列,制作多重比较表。若显著;若则不显著。

第三节

多重比较

----q检验法式中2≤p≤a,p就是所有比较得平均数按大到小顺序排列所计算出得两极差范围内所包含得平均数个数(称为秩次距),SE为平均数得标准误,可见在每一显著水平下该法有a-1个尺度值。平均数比较时,尺度值随秩次距得不同而异。

第三节

多重比较

----q检验法

[例3-8]

以q法测验各种药剂处理得苗高平均数间得差异显著性不同药剂处理得苗高(cm) 第三节

多重比较

----q检验法

第三节

多重比较

----q检验法查附表7q值表,当DFe=12时,p=2,3,4得值,并计算出尺度值,列于下表。

第三节

多重比较

----q检验法值得计算(q测验)第三节

多重比较

----q检验法单位:cm将平均数由大到小排序,=29cm,=23cm,=18cm,=14cm。由此可得到:第三节

多重比较

----q检验法在平均数得差值后,标注**、*或ns就是否简便些?

不同秩次距p下得最小显著极差变幅比较大,为此,D、B、Duncan(1955)提出了新复极差法,又称最短显著极差法。该法与q法相似,其区别在于计算最小显著极差时不就是查q表而就是查SSR表,所得最小显著极差值随着k增大通常比q测验时减小。查得后,有第三节

多重比较

----SSR检验法试对[例3-8]各平均数作新复极差测验。已知=29cm,=23cm,=18cm,=14cm,MSe=8、17,n=4查附表8,得值,算得在p=2,3,4时得值,即为测验不同p时得平均数间极差显著性得尺度值。第三节

多重比较

----SSR检验法[例3-8]LSR值得计算(新复极差测验)第三节

多重比较

----SSR检验法结论:[例3-8]4个处理得苗高,除处理A与C差异不显著外,其余处理间均达显著差异,本例结果与上面介绍得q测验法相同,但q法得要比新复极差法得大。第三节

多重比较

----SSR检验法第三节

多重比较

----多重比较方法得选择a=2时,LSD、SSR、q测验得显著尺度完全相同,并且SSRa=qa。a>2时,三种方法得检验尺度不同,LSD最低,SSR居中,q最高。思考:LSD尺度与SSR、q法尺度个数使用方法有何差异?第三节

多重比较

----多重比较方法得选择各平均数经多重比较后,应以简洁明了得形式将结果表示出来。常用得表示方法有:(一)

列梯形表法将全部平均数从大到小顺次排列,然后算出各平均数间得差数。凡达到α=0、05水平得差数在右上角标一个“*”号,凡达到α=0、01水平得差数在右上角标“**”号,凡未达到α=0、05水平得差数则不予标记。若以列梯形表法表示,则成下表。第三节

多重比较

----多重比较结果表示方法[例3-7]得差异显著性(新复极差测验)该法十分直观,但占篇幅较大,特别就是处理平均数较多时。因此,在科技论文中少见。

第三节

多重比较

----多重比较结果表示方法(二)

划线法将平均数按大小顺序排列,以第1个平均数为标准与以后各平均数比较,在平均数下方把差异不显著得平均数用横线连接起来,依次以第2,…,a-1个平均数为标准按上述方法进行。这种方法称划线法。下面就就是[例5-7]用划线法标出0、01水平下平均数差异显著性结果(q法)。该法直观、简单方便,所占篇幅也较少。

第三节

多重比较

----多重比较结果表示方法(三)

标记字母法首先将全部平均数从大到小依次排列;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论