第七章 方差分析基础.ppt_第1页
第七章 方差分析基础.ppt_第2页
第七章 方差分析基础.ppt_第3页
第七章 方差分析基础.ppt_第4页
第七章 方差分析基础.ppt_第5页
免费预览已结束,剩余65页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章 方差分析基础,7.1 方差分析的必要性与作用 7.2 方差分析及基本原理 7.3 多重比较 7.4 方差分析的数学模型 7.5 方差分析的基本假定与数据转换 7.6 方差分析的类型与分析步骤,7.1 方差分析的必要性与作用,一、方差分析的必要性,前面学习了两个样本平均数的假设测验,该法只适用于比较两个试验处理的优劣。用于多个平均数间差异显著性测验,就会表现出如下一些问题:,若进行5个样本平均数的差异显著性比较,则需进行10次两两均数差异显著性测验: h0: 1= 2 , 1= 3 , 1= 4 , 1= 5; 2= 3 , 2= 4 , 2= 5; 3= 4 , 3= 5; 4= 5 .,1多个处理用t测验计算麻烦,因此, 当样本平均数的个数k3时,采用上章学习的方法进行差异显著性测验,工作量是相当大的。,两个样本平均数比较采用t测验,=0.05时犯第一类错误的概率为0.05, 推断的可靠性为1- =0.95。 若对5个处理采用t测验进行比较, =0.05, 需进行10次两两比较,每次比较的可靠性为1- =0.95 , 10次推断的可靠性由0.95降到0.5987, 犯第一类错误的概率则由0.05上升0.4013.,2.推断的可靠性降低,犯错误的概率增大,采用t测验法,每次只能利用两组观察值估计试验误差,与利用全部观察值估计的试验误差相比,精确性低,误差的自由度也低,从而使检验的灵敏度也降低,容易掩盖差异的显著性,增大犯第二类错误的可能。,3.误差估计的精确性和检验的灵敏性降低,因此对多个处理平均数进行差异显著性测验,不宜采用t测验,而需采用方差分析法。,1、在单因素试验中,可以分辨出最优的水平。 2、在多因素试验中,可以分辨出最 优的水平组合。,二、方差分析的作用,解决多个处理的比较问题,充分利用资料的全部信息,提高分析的精确度。,方差分析的概念: 变异原因的数量分析 将试验数据的总变异分解为不同来源的变异,从而评定不同变异来源的相对重要性的一种统计方法。,7.2 方差分析及基本原理,设有k个处理,每个处理有n个观察值,则共有nk个观察值,其数据结构和符号如表7.1。,一、数据结构与变异来源的分解,表7.1 k个处理n个观察值的符号表,每一个观察值的线性模型为:,处理间变异i=(i- ),处理内变异ij=( xij- i),由此可推知 : nk个观察值的总变异可分解为处理间的变异和处理内的变异两部分。,总体符号,表示全试验观测值总体的平均数,二、自由度与平方和的分解,1、总平方和分解 由表7.1可以看出,nk个观察值的变异构成了整个资料的总变异,总变异的平方和即:,(7.1),记 为c(矫正数),sst分解,处理间平方和乃各处理的平均数的变异,即,处理内(误差)平方和乃各组的n个观察值与其相应平均数的离差平方和,即,2. 自由度的分解,1、总变异的自由度:dft=nk-1 2、处理间的自由度:dft=k-1 3、整个资料处理内(即误差项)自由度为: dfe=df1+df2+dfk=k(n-1),由上述分析可知,整个资料的变异来源可分为:处理间和处理内两个部分。因此, 总平方和=处理间平方和+处理内平方和 sst = sst+ sse,总自由度=处理间自由度+处理内自由度 dft = dft + dfe,于是, 处理间均方: 处理内均方: 总变异均方:,注意,表6.2 表6.1资料的方差分析,例6.1以a,b,c,d4种药剂处理水稻种子其中a为对照,处理各得4个苗高观察值(cm)其结果如表6.2,试进行方差分析。,表6.2 水稻不同处理苗高(cm),总和,平均,第一步:统计假设h0:,第二步:整理资料,计算矫正数及各种平方和,第三步:列方差分析表并进行f测验,三、f分布与f测验,由前面的分析可知,表6.1中nk个观察值的大小不尽相同,它们之间的变异构成了整个数据的总变异,其总变异又可分为处理间变异和处理内变异。,1、f测验的基本原理,同一处理内的各个观察值不完全相同,各个处理内的随机变异之和就构成了整个资料的误差项变异。,处理内变异,当处理间真实差异=0时, 处理间变异=处理内变异,当处理间真实差异0时, 处理间变异处理内变异,因此:,处理间变异=处理间真实差异+处理内变异,利用这种关系,将处理间变异与处理内变异的比值定义为f值,,如果f与“1”相差不多,表明各处理效应在本质上相同,即处理间差异不显著。 如果f比“1”大得多,超出了通常偶然因素所能解释的范围,那就说明各处理效应有本质差异。,关于f值的大小,如何判断是否超过了用误差解释的范围?必须借助f测验。,f分布 有一个平均数为 ,方差为 的正态总体,从中随机抽取两个样本,其容量分别为n1 和n2,则其自由度分别为df1 =n1-1和df2=n2-1,方差为 ,令两个方差之比为f,即,2、f分布与f测验,在给定的 样本容量n1 和n2下,从该总体进行一系列的抽样,则可获得一系列f值,各个f值所具有的概率构成一种分布,这一分布称为f分布。,f分布的平均数 f分布的取值范围为0, 故f分布只有一尾概率(即右尾概率),进行的f测验仅为一尾测验。,f分布是随自由度df1 和df2的改变而改变的一组偏态曲线,只有当df1和df2都趋向于时,f分布趋于对称分布。因此, f分布某一特定曲线的形状取决于参数df1和df2。,f分布下一定区间的概率可以从已制成的统计表(附表5)中查出。, f测验 测验某项变异因素的效应是否真实存在。 若各处理的均数相等或者差异不显著,可以推断处理间不存在真实差异; 若各处理的均数不等且差异显著,可以推断处理间有真实差异。,第三步:列方差分析表并进行f测验,f测验结论:药剂间对苗高的效应差异达极显著。,*,第四步:多重比较,首先 计算比较标准(常用三种lsd法、ssr法、q法),其次 进行均数间两两比较 列梯形表法 2、划线法 3、标记字母法,要明确各个处理平均数彼此间的差异显著性,还必须对各个平均数作相互比较,这种比较称为多重比较。常用的有以下几种:,7.3 多重比较,第一:计算平均数差数的标准误,其中, 为平均数的差数标准误; mse为方差分析的误差项均方; n为样本容量(每一处理内观察值的个数);,具体方法如下:,一、最小显著差数法(lsd),实质是两个平均数相比较的t测验。,第三:将任意两个处理平均数的差与lsd相比较 若,第二:计算出显著水平下的最小显著差数lsd,第四步:多重比较(lsd法),首先 计算比较标准,其次 进行均数间两两比较 列梯形表法,平均数 (,已算出lsd0.05=4.40 lsd0.01=6.17,划线法,已算出lsd0.05=4.40 lsd0.01=6.17,标记字母法,该试验除a与c处理无显著差异外,d与b及a、c处理间差异显著性达到,0.05水平。处理b与a、d与b、a与c无极,显著差异;d与a、c,b与c呈极显著差异。,已算出lsd0.05=4.40 lsd0.01=6.17,根据dfe , p查ssr表,计算最小显著极差值lsr,不同平均数间的比较采用不同的显著尺度 1、新复极差测验法(ssr法或duncan法),二、最小显著极差法(lsr),计算平均数的标准误,p 为某两个极差间所包含的平均数个数,根据dfe , p查 q 表,计算最小显著极差值lsr,计算平均数的标准误,p 为某两个极差间所包含的平均数个数,2、q 测验法(或tukey测验),第三步:列方差分析表并进行f测验,f测验结论:药剂间对苗高的效应差异达极显著。,*,第四步:多重比较,首先 计算比较标准(常用三种lsd法、ssr法、q法),其次 进行均数间两两比较 列梯形表法 2、划线法 3、标记字母法,上例:,表6.2资料lsr值的计算(复新极差测验或ssr法),表6.2资料,值的计算(q测验),1.列梯形表法,平均数 (,其次 进行均数间两两比较,查lsra,划线法,查lsra,标记字母法,该试验除a与c处理无显著差异外,d与b及a、c处理间差异显著性达到,0.05水平。处理b与a、d与b、a与c无极,显著差异;d与a、c,b与c呈极显著差异。,查lsra,第四步 多重比较(q法或tukey测验),lsd或ssr,犯错误的风险较大;犯错误的风险小,犯错误的风险较大;犯错误的风险小,q测验,三、多重比较方法的选择,表6.2资料lsr值的计算(复新极差测验),表6.2资料lsr值的计算(q法),ssr法与q法比较,在农业和生物学上,由于试验工作者通常都寄希望于否定h0,所以lsd和ssr得到较为广泛的应用。如果试验是几个处理都与一个对照相比,则可选用lsd法;如果试验是每两个处理都要进行相互比较,则宜选用ssr法。,1、方差分析的数学模型,指试验资料的数据结构,或者说指每一观察值的线性组成部分。,一、方差分析的数学模型与期望均方,&7.4 方差分析的数学模型,进行方差分析的基础; 自由度与平方和分解的依据。,数学模型:,设在一平均数为 、方差为2 的正态总体中随机抽取容量为n的一组样本。由于随机误差,每一个xi都和总体平均数有差别,这个差量就是随机误差i。,表7.1 k个处理n个观察值的符号表,其中,in(0,2), 故,因而每一个观察值都具有线性可加模型:,任一观察值xij所具有的线性模型为:,式中:i=(i- ),并满足 i=0; ij=(xij-i)是相互独立,并具 有分布n(0,2)。,i=1,2,k; j=1,2,n,2、方差分析的期望均方 若a是b的无偏估计,则称b是a的数学期望。 数理统计已经证明,mse(样本的误差均方)是样本所在总体的误差方差2的无偏估计值。于是,mse的数学期望为2。因为2 为均方的数学期望,故又称期望均方。, mst的期望均方不是t2,因为它是由处理平均数计算得到的,它由两个可能的部分构成: a.平均数的抽样方差 b.处理平均数本身差异的方差, 即处理方差t2,又因每个处理的平均数由n个数据得到, 故有: 为mst的数学期望,或处理效应的期望均方。,当t2 =0时,f=1,表示处理间无差异; 当f值很大时,表明t2 0即处理间存在差异。,因为,ems作用:是正确进行f测验的基础,二、固定模型与随机模型 对于处理效应,由于试验目的的不同而有不同的解释,从而产生了方差分析的两种数学模型: 固定模型和随机模型,指试验的各个处理都抽自特定的处理总体,因而处理效应是固定的,我们的目的就是研究各个处理效应,所作的推断也仅限于供试处理的范围之内。,固定模型:,一般的栽培试验,如肥料试验、农药试验、密度试验、品比试验等都属于固定模型。,特点,a.抽样方式是固定有标准的;,b.试验的目的是估计个别处理的效应,c.h0:i=0或= = = = 对 ha: i0,d.推断仅限于供试处理范围内,e. f测验后,要进行均数的多重比较,指试验中的各个处理皆抽自同一总体的一组随机样本,因而处理效应是随机的,我们的目的不在于研究供试处理本身的效应,而在于研究处理效应的变异度,所以我们的推断也不是关于某些供试处理,而是关于抽出这些处理的整个总体。,随机模型:,随机模型在遗传、育种和生态试验方面,有较广泛的应用。,特点:,a.抽样方式是随机的,没有固定的标准;,b.试验的目的是估计样本所在总体的变异;,c.,d.推断关于样本所在总体的变异;,e.f测验后,不进行均数的多重比较,而需估计方差;,形式的区别:,固定效应用 表示,随机效应用 表示,模型的不同仅与f测验分母项的选择和统计推断有关,而方差分析过程中df、ss、ms的分解和计算都是一致的。,一、方差分析的基本假定,7.5 方差分析的基本假定与数据转换,二、数据转换 常用的数据转换方法有:,原观察值,处理的成数,原观察值,非正态性、非可加性、均方的异质性,1、平方根转换: 适用于稀有现象的计数资料,2、对数转换: 适用于倍加性资料*,3、反正弦转换: 适用于成数或百分数资料,7.6 方差分析的类型与分析步骤,一、方差分析的种类: 单方面分类的方差分析 有重复但没实行局部控制的试验资料 如: 完全随机排列或大区试验取样点的资料,双方面分类的方差分析 实行单方面局部控制 如随机区组设计,sstsst+sse,sstsst+ssr+sse,三方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论