041方差分析的基本原理和F测验_第1页
041方差分析的基本原理和F测验_第2页
041方差分析的基本原理和F测验_第3页
041方差分析的基本原理和F测验_第4页
041方差分析的基本原理和F测验_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章第四章 方差分析方差分析 (analysis of variance,analysis of variance,) 上节课的统计假设测验是如何检验一个或者两个平均数的假设检验方法,用u测验或t测验。但实际工作中需要对多个(k3)样本平均数进行比较,并分析它们之间的差异,也就是多个(k3)样本平均数的假设检验方法,这时,若仍采用t检验法就不适宜了。这是因为: 第一节第一节 方差分析的意义方差分析的意义25c21xxs第四章第四章 方差分析方差分析 (analysis of variance,analysis of variance,) 方差分析是用于两个及两个以上样本均数差别的显著性检验,

2、以检验试验所得的两个及两个以上样本均数是否来自相同总体。它将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。第二节第二节 方差分析的基本原理方差分析的基本原理第四章第四章 方差分析方差分析 (analysis of variance,analysis of variance,) 由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。 方差分析的基本思想是:将全部观察着的总变异按影响试验结果的诸因素分解为若干部分变异,构造出反映各部分变异作用的统计量,之后构造假设检

3、验统计量f,实现对总体均属的推断。也就是通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。第一节第一节 方差分析的意义方差分析的意义第四章第四章 方差分析方差分析 (analysis of variance,analysis of variance,) 方差分析主要用途:均数差别的显著性检验,分离各有关因素并估计其对总变异的作用,分析因素间的交互作用,方差齐性检验。 在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同实验条件下样本均值间的差异。例如农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同化学药剂对作物害虫的杀虫

4、效果等,很多问题都可以使用方差分析方法去解决。第一节第一节 方差分析的意义方差分析的意义n一、基本原理n二、f测验n (一)f分布 n (二)f测验的思想第四章第四章 方差分析方差分析 第二节第二节 方差分析的基本原理和方差分析的基本原理和f f测验测验n一、基本原理:n看以下试验结果:有k个果树品种的品种对比试验,每个品种随机抽取n株调查单株产量,得到如下数据表 品种单株及产量123nti123k(i=1k)1xix2xkx3xx x11 11x x1212x x1313x x1n1nx x2121x x2222x x2323x x2n2nx x3131x x3232x x3333x x3n

5、3nx xk1k1x xk2k2x xk3k3x xknknt t1 1t t2 2t t3 3t tk kn上表中x11 、x12xkn是kn个变异的数值,k kn n2 2i ij j1 11 1( (x x- - x x) )k k2 2i ii=1i=1n (x -x)n (x -x)xix即处理平方和即处理平方和 sssst t= = 与总平均数与总平均数用品种的平均数用品种的平均数品种不同引起的变异,品种不同引起的变异,就是处理变异,就是处理变异,可能的原因有二:可能的原因有二: 一是品种不同;一是品种不同; 总变异总变异sssst t是是由哪些原因导致由哪些原因导致的变异组成的变

6、异组成?其变异用离均差平方和表示即其变异用离均差平方和表示即总变异总变异 sssst t= =之差的平方和之差的平方和乘以乘以n n表示表示 二是试验误差。二是试验误差。xn试验误差引起的变异n是指处理因素以外的其它偶然因素引起的变异n如土壤肥力、观察测定差异等n用误差平方和sse来表示)i ij ji i( (x x- -x x knkn2 2eijieijii=1j=1i=1j=1ss =(x-x )ss =(x-x )当然当然是是试验误差试验误差。 是品种内观测值与该品种平均值之差,是品种内观测值与该品种平均值之差,n于是,在这个试验中,有如下关系:n总变异平方和 k k n n2 2t

7、 ti ij j1 1 1 1s ss s = =( (x x - -x x) )knkn2 2ijiiji1111(x-x )(x-x )k k2 2i i1 1n (x -x)n (x -x)处理间变异处理间变异sssst t= =误差变异误差变异sse=sse=列成下面的表列成下面的表一、自由度和平方和的分解一、自由度和平方和的分解 设有设有k组数据,每组皆具组数据,每组皆具n个观察值,则该资料共有个观察值,则该资料共有nk个观个观察值,其数据分组如表察值,其数据分组如表6.1。表表6.1 每组具每组具n个观察值的个观察值的k 组数据的符号表组数据的符号表12yytij1y2yiykyy

8、21s22s2is2ks 在表在表6.1中,总变异是中,总变异是nk个观察值的变异,故其自由度个观察值的变异,故其自由度v = nk1,而其平方和,而其平方和sst则为:则为:nknkijijtcyyyss1122)((61)其中的其中的c称为矫正数:称为矫正数: nktnkyc22)(62)对于第对于第 i 组的变异,有组的变异,有212121121212)()()()(2)()()(yynyyyyyyyyyyyyyyyyinjiijnjinjiiijnjiijnjiiijnjij从而总变异从而总变异(61)可以剖分为可以剖分为: kiikinjiijkinjijtyynyyyyss1211

9、2112)()()((63) 即即 总平方和总平方和=组内组内(误差误差)平方和平方和+处理平方和处理平方和 组间变异由组间变异由k个个 的变异引起,故其自由度的变异引起,故其自由度 v =k1 , 组组间平方和间平方和 sst 为:为:iykkiitcntyynss1122)( 组内变异为各组内观察值与组平均数的变异,故每组具有组内变异为各组内观察值与组平均数的变异,故每组具有自由度自由度 v =n1和平方和和平方和 ;而资料共有;而资料共有k 组,故组组,故组内自由度内自由度 v = k (n1) ,组内平方和组内平方和 sse 为:为: niijyy12)( knttiijessssyy

10、ss112)( (65) (64) 因此,得到表因此,得到表6.1类型资料的自由度分解式为:类型资料的自由度分解式为:1)(1)(1)(nkknk(66) 总自由度总自由度dft =组间自由度组间自由度dft +组内自由度组内自由度dfe 求得各变异来源的自由度和平方和后,进而可得求得各变异来源的自由度和平方和后,进而可得:(67)()()()(1 2 1 222222nkyysmskyynsmsnkyysmsiijeeittijtt组内均方组内均方组间的均方组间的均方总的均方总的均方mse作分母去除mst,商数用f表示,即 f=mst/mset te emsmsf =f =msmsmst +

11、 mse mst + mse = =msemset te emsmsf =f =msmsf接近于接近于1。 1+1+较大的数较大的数即即 f1;方差分析的基本思路方差分析的基本思路n方差分析的基本思路:n(1)把全部数据看成从 同一 总体抽出的几组样本,求出总变异, 即sst = n(2)将总变异根据可能引起变异的原因分解成由各原因引起的变异平方和与自由度,得到各原因引起的方差;n(3)将各项方差与误差方差相除得到f值;n(4)若f1,推断处理间有显著差异,接着做多重比较;n(5)若f接近于1,推断处理间无显著差异,分析结束。 knkn2 2ijij1111(x-x)(x-x)。n基本思路图示

12、: (1 1)若)若f ff ff f,处理间有显著差处理间有显著差异异全全部部试试验验数数据据总变异总变异 sssst t处理间变异处理间变异sssst t误差变异误差变异sssse e相相除除得得f f相除得相除得msmst t处理自由度处理自由度dfdft tf f与与f f相比相比结结论论总自由总自由度度dfdft t相除得相除得msmse e结结束束误差自由度误差自由度dfdfe e判判断断多重多重比较比较 例例6.1 以以a、b、c、d 4种药剂处理水稻种子,其中种药剂处理水稻种子,其中a为对照,每处理各得为对照,每处理各得4个苗高观察值个苗高观察值(cm),其结果如表,其结果如表

13、6.2,试分解其自由度和平方和。试分解其自由度和平方和。 表表6.2 水稻不同药剂处理的苗高水稻不同药剂处理的苗高(cm)(cm)abcd18 21 20 1320 24 26 2210 15 17 1428 27 29 3272925611633618231429 =21iyy 根据根据(66)进行总自由度进行总自由度的剖分:的剖分: 总变异自由度总变异自由度dft=(nk1)=(44)1=15 药剂间自由度药剂间自由度dft=(k1)=41=3 药剂内自由度药剂内自由度dfe=k(n1)=4(41)=12根据根据(63)进行总平方和的剖分:进行总平方和的剖分:70564433622nktc

14、6023221182222ccyssijt5044)116569272()(2222122c/cntyynsskiit或或 504)2129()2114()2123()2118(42222tss98504602)(1111222ttknnkkiijiijessssntyyyss或或 药剂药剂a内:内: 药剂药剂b内:内: 药剂药剂c内:内: 药剂药剂d内:内:3847213202118222221ess2049222262420222222ess2645614171510222223ess14411632292728222224ess所以所以 kniijeyyss1129814262038)(

15、 进而可得均方:进而可得均方: 1340156022./smstt0016835042./smstt17812982./smsee3847213202118222221ess2049222262420222222ess2645614171510222223ess14411632292728222224esskniijeyyss1129814262038)(1340156022./smstt0016835042./smstt17812982./smsee n前面说 f 1,则判断处理间有显著差异。n可是究竟大到什么程度才能判断有显著差异的呢?n要ff,才判断处理有显著差异。n通过f与f相比较来测

16、验处理间差异是否显著的方法叫f测验。n由上已知n方差比的分布规律如何?我们下面进行讨论。 temsfms,是方差比。,是方差比。n(一)f分布:2211211s/s= f2 22 21 12 22 22 22 2s s/ /s s= = f f221n2nns/s= f 2 21 12 21 13 32 23 33 3s s/ /s s= = f f(1)f(1)f(0 0,+)(2)(2)f f=1=1(3)(3)分布向左偏斜分布向左偏斜f f分分布布21s22s22221212f = s /sf = s /s df df1 1= = 1 1 df df2 2= = 2 2继续以继续以 1

17、和和2为自由度成对地抽取样本,见图:为自由度成对地抽取样本,见图:将二者相除,将二者相除,此此“比比”用用f f表示,表示,即即 求得它们的均方为求得它们的均方为和和按自由度按自由度dfdf1 1= =1 1 ,df ,df2 2= =2 2抽取两个样本抽取两个样本2在在n n(, )总体中,)总体中,2n样本不同 f值不同 构成f分布。nf 连续型随机变量nf 分布的概率密度函数 1 1和和 2 2 分别为分别为 分布只与分布只与 1 1和和 2 2有关,即以有关,即以 1 1和和 2 2为参数为参数如如 1 1和和 2 2确定,则曲线就定了,而与原总体参数无关。确定,则曲线就定了,而与原总

18、体参数无关。 1 1和和 2 2不同,就得到不同的不同,就得到不同的曲线曲线 。 112121212221112212()2( )( ) ( )()22vvvv vvvff fvvvvf2 21 1s s2 22 2s s的自由度,的自由度,f f为自变量。为自变量。 和和f分布曲线特征:分布曲线特征:(1)具有平均数)具有平均数 =1(2)取值区间为)取值区间为0,;(3)某一特定曲线的形)某一特定曲线的形状则仅决定于参数状则仅决定于参数 v1和和 v2 。在在 v1=1或或 v1=2时,时,f分布分布曲线是严重倾斜成反向曲线是严重倾斜成反向j型;型;f0.51.01.52.02.53.03

19、.54.04.55.05.56.00.00.20.40.60.81.0ff(f)当当 v13时,曲线转为偏态时,曲线转为偏态(图图6.1)。4, 5215, 2215, 121图图6.1 f分布曲线分布曲线(随(随v1和和v2的不同而不同)的不同而不同)n对于任何f分布,可以用积分的方法求区间内的概率:np(ffi)=f(fi)= np(ffi) 即阴影部分的概率,外面部分的概率为 p(fi ,+)=1- p(ffi)。如图。 n应用上式求出各种自由度下f曲线不同概率相应的f值,制成f表。请看附表:5%与1%显著点的f值表。nf值表结构n第一横行 大均方自由度 = 分子自由度 = ( 处理自由

20、度)n第一纵列 小均方自由度 = 分母自由度 = (误差自由度)n表 中 f的临界值: 上行是f0.05; 下行是f0.01 f fi i0 0f f( (f f) )d df f ,n查 df1=8、df2=20 的f值,见下图。nf0.05 = 2.45 f0.01 = 3.56,n含义 f=2.45是一个分界点n此点以外曲线与横轴所夹部分(阴影部分)概率为5 % ,此点以内概率为95%。n所以f0.05 = 2.45是曲线上显著水准=0.05的临界值。图图4-2 f4-2 f0.050.05显著水显著水 准示意图准示意图n(二)f测验的思想:n df1= 1, df2= 2f f衍生总体

21、衍生总体总体总体 2 2符合符合dfdf1 1= = 1 1, df, df2 2= = 2 2的的f f分布分布 22221121111211s /s= fs /s= f22221222212222s /s= fs /s= f22221n2nn1n2nns /s= fs /s= fn从同一个总体中按 1、2 抽出的一对样本n方差比值f 有95%可能落在0f0.05间n只有5%的可能落在0f0.05外,是小概率事件。 n待测样本是来自同一总体吗?依小概率原理否认样本来依小概率原理否认样本来自同一总体自同一总体 处理间有显著差异处理间有显著差异计算计算f f 值,值,与与f f0.050.05相比相比fff ff f0.050.052 2t t2 2e es sf =f =s s,再与,再与f f相比。相比。求出求出f测验需具备条件:测验需具备条件:(1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论