生物统计单因素方差分析PPT课件_第1页
生物统计单因素方差分析PPT课件_第2页
生物统计单因素方差分析PPT课件_第3页
生物统计单因素方差分析PPT课件_第4页
生物统计单因素方差分析PPT课件_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2020/5/7,.,1,生物统计与CAABiostatisticsandComputerAidAnalysis,关瑞章冯建军林鹏谢钦明黄良敏郭松林,主讲教师:,2020/5/7,.,2,7.1单因素试验设计7.2方差分析的基本原理7.3固定效应模型7.4随机效应模型7.5多重比较7.6方差分析应具备的条件,第七章单因素方差分析,2020/5/7,.,3,t检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验,但在生产和科学研究中经常会遇到比较多个处理优劣的问题,即需进行多个平均数间的差异显著性检验。这时,若仍采用t检验法就不适宜了。这是因为:1、检验过程烦琐2、无统一的试验误差,误差估计的精确性和检验的灵敏性低3、推断的可靠性低,检验的I型错误率大由于上述原因,多个平均数的差异显著性检验不宜用t检验,须采用方差分析法。,第七章单因素方差分析,2020/5/7,.,4,试验考察指标(target):选定用于考察或衡量试验效果的特性值。如养殖试验常用的日增量、产卵率等。试验因素(factor):通常把影响试验考察指标的条件或要素称为试验因素,可以是单因素,也可以是多因素。如研究养殖日增重量时,品种、饲料、性别、投喂方法等等就是其影响因素。水平(level):每一个因素根据其质或量所分的等级或所处的状态。如研究饲料对养殖日增重的影响,不同的投喂量成为不同的水平。,生物试验常用术语,2020/5/7,.,5,处理(treatment):处理是指试验过程中设置的所有试验因素的所有水平,是试验的具体条件或状态。在一项试验中,同一个试验条件下的试验称为一个处理,不同条件下的试验称为不同处理。单因素试验中的“处理”与“水平”是一致的,但“处理”的含义要较“水平”更广些。区组(block):把类似的试验材料在大致相同的环境条件安排在同一组,该组就称为一个区组,如不同养殖场、水面、滩涂等。区组内分小区,一个小区进行一个水平的处理。,生物试验常用术语,2020/5/7,.,6,试验中只考虑一个因素(A)其他因素保持或控制不变或变化一致选择A(即试验因素)的a个不同水平,研究A对试验考察指标的影响,这类试验称为单因素试验把试验对象应用随机表分配到各试验组称为完全随机设计,单因素完全随机设计,2020/5/7,.,7,完全随机设计对试验条件限制少,容易实现,但试验误差偏大单因素试验必须在各水平上重复多次试验,假定重复数为n,则总共要进行an个试验,这样的设计称为单因素等重复试验。但是各水平的重复数也可以不相同,称为单因素非等重复试验。,单因素完全随机设计,2020/5/7,.,8,方差分析(analysisofvariance,ANOV)是一类特定情况下的统计假设检验,平均数差异显著性检验-成组数据t检验的一种引伸。t检验可以判断两组数据平均数间的差异显著性,而方差分析则可以同时判断多组数据平均数之间的差异显著性。当然,在多组数据的平均数之间做比较时,可以在平均数的所有对之间做t检验。但这样做会提高犯型错误的概率,因而是不可取的。,7.1方差分析的基本原理,7.1.1方差分析的一般概念,2020/5/7,.,9,例如,我们打算用一对一对比较的方法检验5个平均数之间的相等性,共需检验C52=10对。假设每一对检验接受零假设的概率都是1a=0.95,而且这些检验都是独立的,那么10对都接受的概率是(?)犯型错误的概率(?)。用方差分析的方法做检验可以防止上述问题的出现。方差分析的内容很广泛,上面讲到的那种情况是方差分析中最简单的情况,称为单因素方差分析(onefactoranalysisofvariance)或者称为一种方式分组的方差分析(onewayclassificationanalysisofvariance)。,7.1.1方差分析的一般概念,2020/5/7,.,10,例调查了5个不同小麦品系的株高,结果列于表.,7.1.1方差分析的一般概念,只出现“品系”一个因素,称单因素。有5个不同品系,称这一因素有5个水平。5个品系认为5个总体,表中数据是从5总体抽出5样本,,通过比较5样本,判断5总体是否存在差异。,2020/5/7,.,11,例为了探讨不同窝的动物出生重是否存在差异,每窝中均有四只幼仔,结果见表.,7.1.1方差分析的一般概念,这两个例子共同点:每个实验只有一个因素,该因素有a个处理,这样的实验称为单因素实验。从单因素实验的每一处理所得到的结果都是一随机变量Xi.,2020/5/7,.,12,7.1.1方差分析的一般概念,对于a个处理,各重复n次的单因素方差分析一般化表示方法如下表:xij:第i次处理的第j次观测值,第i个处理n个观测值的和,第i个处理的平均数,表示全部观测值的总平均数,2020/5/7,.,13,常用如下的所谓线性统计模型(Linearstatisticamodel)描述每一观测值:xij=+i+ij,i=1,2,j=1,2,n式中xij为第i水平(处理)下的第j次观测值。是总体平均数,i是仅限于对第i次处理的一个参数,即第i次处理效应(treatmenteffect),方差分析的目的就是要检验处理效应的大小或有无。ij是随机误差,要求模型中的误差服从N(0,2)的独立随机变量,并要求各水平的方差均为2。,7.1.2不同处理效应与不同模型,2020/5/7,.,14,固定效应:由固定因素所引起的效应。若因素的a个水平(可人为控制)是经过特意选择的,则该因素称为固定因素。处理固定因素所用的模型称为固定效应模型或简单称为固定模型。例8.1的“品系”随机效应:由随机因素所引起的效应。若因素的a个水平(不能严格人为控制)是从该因素水平总体中随机抽出的样本,则该因素称为随机因素。处理随机因素所用的模型称为随机效应模型或者简单称为随机模型。例8.2中的“窝别”,7.1.2不同处理效应与不同模型,2020/5/7,.,15,在固定效应模型中,i是处理平均数与总体平均数的离差,是个常量,故:i=0(i=1,2,n),要检验a个处理效应的相等性,就要判断各i是否都等于0。若各i都等于0,则各处理效应之间无差异。因此,零假设为:H0:1=2=a=0备择假设为:HA:i0(至少有一个i)若接受H0则不存在处理效应,每个观测值都是由总平均数加上随机误差构成。若拒绝H0则存在处理效应,每个观测值是由总平均数、处理效应及误差三部分构成。,7.2固定效应模型,7.2.1线性统计模型,2020/5/7,.,16,方差分析的基本思想就是将总的变差分解为构成总变差的各个部分。对单因素实验,可以将总平方和(totalsumofspuares)做如下分解:,7.2.2平方和与自由度的分解,因为:,2020/5/7,.,17,其中:,7.2.2平方和与自由度的分解,所以:,上式右边第一项为各处理平均数与总平均数的离均差平方和与重复数n的乘积,反映了重复n次的处理间变异,称为处理间平方和,记为SSA,即,2020/5/7,.,18,7.2.2平方和与自由度的分解,用SST表示总平方和,即,上式右边第二项为各处理内离均差平方和之和,反映了各处理内的变异即误差,称为处理内平方和或误差平方和,记为SSe,即,于是有SST=SSA+SSe,2020/5/7,.,19,7.2.2平方和与自由度的分解,总均方,自由度可以做同样的分割:总自由度dfT=an-1;A因素共有a个水平,因而dfA=a-1;误差项有an-a自由度,这是因为每一处理均有n-1自由度,共有a个处理,因而dfe=an-a。为了估计2,用SS除以相应自由度,所得MSe称为误差均方(errormeansquare),处理均方,2020/5/7,.,20,经证明误差均方MSe的数学期望等于2,,7.2.3均方期望与统计量F,经证明处理均方MSA的数学期望如右式:,误差均方反映了随机因素造成的方差的大小,是2的无偏估计量,对于处理项,只有当零假设H0:1=2=i=0成立时,MSA才是2的无偏估计量。当i=0时,EMSA右第二项=0,此时EMSA=2,因此用MSA与MSe比较,就可以反映出i的大小。,2020/5/7,.,21,若MSA与MSe相差不大,可以认为各i与0的差异不大,或者说各处理平均数(i)间差异不大。若MSA与MSe超出很多,则认为i间差异显著。为此,用F上尾单侧检验。F=MSA/MSe具dfA,dfe自由度。当FF时,MSA显著高于MSe,项不再为0,拒绝零假设,处理平均数间差异显著。,7.2.3均方期望与统计量F,2020/5/7,.,22,7.2.3均方期望与统计量F,令上式中,这时的零假设H0:i=0也可以写成H0:2=0,备择假设HA:20。以上所述可归纳成方差分析表,见下页。,则,2020/5/7,.,23,7.2.3均方期望与统计量F,2020/5/7,.,24,实际应用时,总的平方和与处理平方和一般按右式计算:,7.2.4平方和的简易计算方法,式中的被减数C通常被称为校正项(correction):,误差平方由右式算出:,用SAS软件更简便,2020/5/7,.,25,实验中经常会遇到某个因素有许多可能的水平,若参加实验的个水平是从该因素的水平总体中随机选出的,这一因素就称为随机因素。如例8.2中的“窝”是随机因素。线性统计模型如下:xij=+i+ij,i=1,2,j=1,2,n其中i和ij都是随机变量。如果i具有方差2并独立于ij,那么观测值的方差:var(xij)=2+2,2、2称为方差分量。i为NID(0,2)的变量,ij是NID(0,2)的变量。,7.3随机效应模型,7.3.1线性统计模型,2020/5/7,.,26,在随机效应模型中,对单个处理效应的检验是无意义的,所要检验的是关于i的变异性的假设。H0:2=0,HA:20如果接受H0说明处理之间没有差异,若拒绝H0说明处理之间存在差异。,7.3.1线性统计模型,2020/5/7,.,27,方法同固定模型类似,仍然将总平方和分解为处理平方和和误差平方和:SST=SSA+SSe。自由度也同样分解:dfT=dfA+dfe,并由此得到处理均方MSA和误差均方MSe。MSA的数学期望是n2+2而不是n2+2;MSe的数学期望仍是2;统计假设检验的判断依据是2是否等于零,其实可用MSA与MSe比值(F=MSA/MSe,具dfA、dfe自由度,上侧检验.)来衡量。,7.3.2均方期望与统计量F,2020/5/7,.,28,若H0成立,则分子分母均为2的无偏估计量。但在备择假设下,分子的数学期望大于分母的数学期望。因而当FFa-1,na-a,时拒绝H0。方差分析的程序与固定效应模型的完全一样,但所下的结论不一样,随机效应模型适用于水平的总体,而固定模型只适用于所选的个水平。如“5个小麦品系的株高的差异极显著”和“不同窝动物出生的增重没有显著差异”。,7.3.2均方期望与统计量,2020/5/7,.,29,上述情况,无论是固定效应模型,还是随机效应模型,各处理的观测次数都是相同的。若不同处理观测次数不同,以上的方差分析方法仍然适用,但在计算平方和时,公式要作改动。,7.3.3不等重复时平方和的计算,检验程序及结果分析同上述讨论。,2020/5/7,.,30,对一个固定效应模型经过方差分析之后,结论是拒绝H0,即处理之间存在差异。但并不是说每对处理之间存在差异。到底哪些处理之间存在差异无法得知。多重比较(multiplecomparison)就是对各处理平均数之间一对一地做比较,以找出哪些处理之间存在差异。多重比较的方法很多,这里只介绍LSD法和Duncan法。,7.4多重比较(multiplecomparison),2020/5/7,.,31,7.4.1最小显著差数法(LSD法),最小显著差数法(leastsignificantdifference)又称LSD法,计算方法如下:,对于任意两组平均数差数的显著性检验,可以用成组数据t检验。,当n1=n2时,2020/5/7,.,32,7.4.1最小显著差数法(LSD法),其中MSe为误差均方,n为每一次处理的观测次数,于是,当tt0.05时差异显著,当tt0.01时差异极显著,因此,差异显著时,具an-a自由度,并可得到,当,时差异显著,称为最小显著差数,记为LSD,每一,对平均数的差值与LSD比较,大于LSD差异显著。,2020/5/7,.,33,LSD是一种很有用的检验方法,但它有致命缺点,这种比较方法将会加大犯型错误的概率。Ducan等检验方法会克服上述缺点。Ducan检验方法如下:首先将需要比较的a个平均数依次排列好,使之,7.4.2Duncan多范围检验,2020/5/7,.,34,并将每一对平均数之间的差列成下表,7.4.2Duncan多范围检验,Duncan检验与LSD的一个明显不同是Duncan检验中,不同平均数之差有不同临界值Rk。,2020/5/7,.,35,ra(k,df)的值可以从附表9中查出。因为平均数共有a个,所以需查出a-1个ra,分别乘以,7.4.2Duncan多范围检验,将不同对平均数的差与相应的临界值Rk相比较,若平均数的差大于Rk,则差异显著,否则不显著。,2020/5/7,.,36,可加性:每个处理效应与误差效应是可加的,由于有这一假定,不同的效应才能被分解,才能最终判断处理效应是否比误差效应更显著。正态

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论