方差分析最新版本ppt课件_第1页
方差分析最新版本ppt课件_第2页
方差分析最新版本ppt课件_第3页
方差分析最新版本ppt课件_第4页
方差分析最新版本ppt课件_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.第三章方差分析,第一节单因素方差分析3。1方差分析的基本原理3.1.1方差分析的一般概念方差分析(analpeis Of vanance,ANOV)是特定情况下统计假设检验或平均差异显著性测试的一种。t检验可以判断两个数据平均之间差异的显著性,而方差分析可以同时判断多个数据平均集差异的显著性。当然,在比较多个数据集的平均值时,可以在所有平均值对之间进行t检验。但是这样做会增加犯I型错误的概率,这是不可取的。例如,如果要以一对一的比较方式检查5个平均之间的均匀性,则需要检查d=10对。假设每个检查对接受零假设的概率为1-=0.95,并且这些检查都是独立的,那么10对接受的概率为0.9510=0

2、.5987, =1-0.60=0.40,I型错误发生的概率显着增加。用方差分析方法进行检查,可以防止出现上述问题。方差分析的内容非常广泛。上述情况是方差分析中最简单的情况,称为单元素方差分析(one-factor analyss of vcriance)或按一种方法分组的方差分析(one-way class ification analysis of vanance)。表3。3单元素方差分析的典型数据x1x2x3 。Xi.xa1 x11x 12 x12 x2 x2 x2 x2 x2 x2 x2 x2 x2 x2 x2 x2 x2 x2 x2 x2 x2 x2 x2 x2 x2 x2 x2 x2

3、 x3x 3 xa 3.j x1jx2j xaj。n x11nx2 N X3n Xin Xan平均x1.x2.x3.xi.x a .表格中的资料Xij表示第I次处理下的第j次观测。3.1.2其他处理效果和其他模型常用的线性统计模型描述了每个观测。xij= I ij I=1,2, I=1,2, j=1,2,n (3.1),其中xij是I级(处理)中的第j次观测。是所有观测的一个参数,称为“总体平均值”(Overall mean)。i是只限于第I次处理的一个参数,称为第I次处理效果。方差分析的目的是测试处理效果的大小或有无。ij是随机误差成分。需要模型中的错误。ij是遵循正态分布N(0,2)的独立

4、随机变量,每个级别的方差必须为2。上述模型包括两种类型的处理效果。第一种类型的处理效果(称为固定效果)是固定元素产生的效果。如果因素的个水平被特别选择,则该因素称为固定因素。例如,实验者分别选择了多种实验温度、多种不同化学药品或一种药物的不同浓度、多种作物品种、多种不同的治疗方案和治疗效果等。在这种情况下,因素水平是人为确定的,对n的假设进行了检查,因此温度、药物、浓度、品种等被称为固定因素。通过方差分析得出的结论只适用于选定的那几个级别,而不扩展到未考虑结论的级别。用于处理固定元素的模型称为“固定效果模型”(fixed effect model)或简单的“固定模型”(fixed model)

5、。例3.1中的5条小麦线被特别选定,以便在这5条线中选出最佳对象。因此,“线”是固定因素,使用的模型是固定效果模型。第二种类型的处理效果称为随机效果,是由随机因素引起的效果。如果因素的水平是随机抽取该因素的整个水平的样品,则该因素称为随机因素。随机因素水平得出的结论可以扩展到该因素的所有水平。其中alpha I是检验alpha I可变性假设的随机变量。用于处理随机元素的模型称为随机效果模型,或者简称为随机模型。例8.2动物巢是从动物所有可能的巢中随机挑选的,这次实验的目的是调查巢中出生的重量是否有差异,因此“巢”是随机的因素。有时很难区分固定因素和随机因素,除了上述原则外,还可以从其他角度考虑

6、。固定元素意味着元素的级别可以被严格地人为控制,水平固定后,其效果值也将被固定。例如,研究三种不同温度对胰蛋白酶水解物的影响。温度水平可以严格控制,即每个温度水平在每个迭代之间精确控制一个固定值,因此重复该实验时水解物的产量也是固定的。简单地说,如果水平(其他温度)固定,其效果值(产出率)也固定。因此,温度是固定的因素。随机因素的水平不能严格人为控制,水平确定后其效果值不固定。例如,在研究农家肥对农作物产量的影响的实验中,农家肥是因素,其他肥料是因素的不同水平,作物产量是其效果值。农家肥的有效成分复杂,不能像调节温度一样严格控制农家肥的有效成分。重复实验时施用等量的肥料也没有一定的效果值。因素

7、水平(肥料量)固定时,其效果值(产量)不固定,农户肥料是随机因素。3.2固定效果模型3.2.1线性统计模型固定效果模型中,i与处理平均值和总平均值的偏差保持不变,因此 i=0 I=1,2,n (3.2)要测试alpha处理效果的均匀性,必须确定每个alpha I是否都等于0。如果alpha I全部为零,则处理效果之间没有差异。因此,假设0为ho: 1= 2=.= =0。替代方案包括:ha:接受 I 0(至少1个I) H0没有处理效果,每个观测由总平均值和随机误差组成。拒绝H0具有处理效果,每个观测包含三部分:总平均值、处理效果和误差。3.2.2平方和自由度的分解方差分析的基本思想是将总变异分解

8、为构成总变异的部分。对于单元素实验,“总平方和”(total sm of sqares)表示为:(xij-x.)2 (3.3),其中x.表示总体平均值。总平方和可以分为处理平均值和总平均之间差异的平方和和处理内部观察和处理平均之间差异的平方和两部分。处理平均值和总平均值之间的偏差测量处理之间的差异。内部观测值和处理平均值之间的偏差测量随机误差的大小。使用SST表示总平方和,SST=(xij-x.)2(3.4)=-(xij-x . I)(x . I-x).)2=(xij-x . I)2(x . I-x.=n (x.i-x.)(x.i-x.i)=0 SSA称为处理平方和(treatlnnts sm

9、 of apares)或处理之间的平方和(sm of mpares betwee treaments)。Ssa=n (Xi-x.)2 (3.5),其中Xi .表示I处理的平均值。SSe称为“误差平方和”(error sm of sqares)或“处理内平方和”(sm of sqares within treatment)。SSE=(xij-Xi .)2 (3.6)因此,SST=SSA SSe (3.7),自由度相同分割:自由度dfT=an-1;a元素都是a级,因此DFA=a-l;每个进程都有n-1自由度,总共有个处理方式,因此错误条目有 n-自由度。因此,dfe= n-。要估计2,SSe除以相

10、应的自由度,MSE=SSE/(an-a) (3.8) MSE称为误差平均平方(error mean sqare)。MSA可以通过MSA=SSA/(-1) (3.9) 3.2.3平均期望值和统计数字f来证明MSe是2的未编辑估计量。误差平均平方反映了随机因素引起的方差的大小,2的偏转估计量。对于流程,MSa假定为0 ho:1=2=.=仅当 I=0设定时,2的偏转估计。alpha I=0时,n/(-1)alpha I2项为0时,e(MSA)=2;因此,比较MSA和MSe可以反映alpha I的大小。如果MSA和MSe之间的差异不大,您可能认为alpha I和0之间的差异很小,或者处理平均值(i)的

11、差异很小。如果MSA比MSe多得多,i之间的差异被认为很重要。为此,使用f-Sami单侧检查。F=MSA/MSe,(3.10) f ,(DFA,dfe),如果f为f f 时,MSe明显高于MSe,n/(-1),但 I2项不再为零,拒绝0假设,处理平均值差异很大。以上说明可概括为表3.4中所示的分布式分析表。表3.4单元素固定效果模型方差分析表波动源平方和自由度平均平方F处理之间的SSA -1 MSA F=MSA/MSe误差SSe (n-1) MSe总和SST n-1,3.2.4分布式分析的数据分析工具任务步骤示例3.1中有5个处理,每个处理具有相同的迭代次数(可以不同,也可以执行相同的操作)。

12、操作步骤:1。在“工具”菜单上,单击“分析数据”。2 .在“分析工具”列表中,双击“单个元素方差分析”。图3.1 3 .选择每个选项,然后单击“确定”。计算结果(例如表3.5周的分组)指示重复处理的数据是否按行或列(图3.1)排序。表3.5中SS:平方和、df:自由度、MS:平均平方f:统计F的计算值P-value:概率F crit : alpha置信度和df自由度的查找表值。如表3.5所示,f=42.27866,f crit=4.430717,ff crit。因此,处理之间存在很大的差异(=0.01)。习惯上,“*”表示在=0.05级别上差异很大,“*”表示在=0.01级别上差异很大,通常称

13、为差异“非常重要”。实例3.1调查了5个不同小麦线的株高,结果见表3.1。判断这五个样本是否有差异。表3.1 5小麦线植物高度(cm)调查结果行号I ii iii iv v 1 64 . 6 64 . 5 67 . 5 67 . 8 71 . 8 69 . 2 65 . 3 65 . 3 66 . 3 72 . 1 68 . 2 3 64 . 8 64 . 6 67 . 1 70 . 1 70 . 0 69 . 0 69 .xls,例3.2为了解不同巢的动物出生体重是否有差异,随机选择4巢的动物,每个巢有4只幼崽的结果,分析了上述数据,判断了不同巢的出生体重是否有差异。巢状动物编号I ii i

14、ii iii iv 1 34 . 7 33 . 2 33 . 2 27xls,3.3随机效应模型随机模型的相关参数不同于固定模型,如果i有分布2,并且与ij无关,则观测的分布var(xij)=2 2分布2和2称为方差分量。ij是NID(0,2)变量,i是NID(0,2)变量(NID表示独立的正态分布)。i是独立随机变量,I0;H0: 2=0,ha: 2 0,统计f的计算与固定模型相似,计算步骤与固定模型相同,但固定模型的结论仅适用于选定级别,随机模型的结论适用于整体。3.4多个比较假定对一个固定效果模型进行方差分析,然后拒绝H0。也就是说,处理之间存在差异。但这并不是说各处理对之间存在差异。要确定正确的哪一对有很大的差异,哪一对没有很大的差异,每个处理平均值之间需要一对一的比较,这就是多重比较。有多种方法仅介绍了LSD方法和Duncan方法。Excel没有提供多种比较工具,仅简单介绍基本知识的附录中的SPSS说明了计算方法。,3.4.1最小凸度阶法最小凸度阶法称为LSD法,计算方法简述如下。对于任意两个数据平均差异数(x1-x2)的差异显著性测试,可以使用一组数据t测试,将每对的平均差异与LSD进行比较,ldxlLSD的差异很大。否则差异不大。LSD=(1-2)LSD=t/2(df)sx1-x2 sx1-sx2=(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论