生物统计学第九章单因素方差分析.ppt_第1页
生物统计学第九章单因素方差分析.ppt_第2页
生物统计学第九章单因素方差分析.ppt_第3页
生物统计学第九章单因素方差分析.ppt_第4页
生物统计学第九章单因素方差分析.ppt_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章 单因素方差分析 One-factor analysis of variance 用6种培养液培养红苜蓿,每一种培养液做5次重复 ,测定5盆苜蓿的含氮量,结果如下表(单位:mg)。问 用6种不同培养液培养的红苜蓿含氮量差异是否显著? 盆号 培养方法 1 2 3 4 5 19.4 32.6 27.0 32.1 33.0 17.7 24.8 27.9 25.2 24.3 17.0 19.4 9.1 11.9 15.8 20.7 21.0 20.5 18.8 18.6 14.3 14.4 11.8 11.6 14.2 17.3 19.4 19.1 16.9 20.8 方差分析 analysis of varianceANOVA 由英国统计学家R.A.Fisher于1923年提出。 方差分析是一种特殊的假设检验,是用来判 断多组数据之间平均数差异显著性的。 它不同于t检验之处在于:它把所有数据放 在一起,一次比较就对所有各组间是否有差异做 出判断,如果没有显著性差异,则认为各组平均 数相同;如果发现有差异,再进一步比较是哪组 数据与其它数据不同。 方差分析中常用基本概念 (一)试验指标 experimental index 为衡量试验结果的好坏或处理效应的高低,在 试验中具体测定的性状或观测的项目。 (二)试验因素 experimental factor 试验中所研究的影响试验指标的因素叫试验 因素,常用大写字母A、B、C、等表示。 单因素试验与两因素或多因素试验。 固定因素与随机因素:是否可控制。 (三)因素水平 level of factor 试验因素所处的某些特定状态或数量等级称 为因素水平,简称水平。比如:不同的温度;溶 液不同浓度等。 (四)重复 repeat 在试验中,将一个处理实施在两个或两个以 上的试验单位上,称为处理有重复;某一处理实 施的试验单位数称为该处理的重复数。 本章主要内容 第一节 单因素方差分析的基本原理 第二节 单因素方差分析的基本步骤 教学重点: 单因素方差分析的方法 教学要求: 1. 掌握方差分析的概念、作用、基本原理与步骤 2. 掌握单因素试验资料的方差分析方法 第一节 单因素方差分析的基本原理第一节 单因素方差分析的基本原理 一、线性模型 二、固定线性模型 三、随机线性模型 四、多重比较 五、基本假定 (一)线性模型 linear statistical model 假设某单因素试验有a个处理,每个处理 有n次重复,共有na个观测值。这类试验资料 的数据模式如表9-1所示。 一、线性模型一、线性模型 表9-1 单因素方差分析的典型数据模式 合计 X1 X2 X3 Xi Xa 1 11 21 31 i1 a1 2 12 22 32 i2 a2 3 13 23 33 i3 a3 j 1j 2j 3j ij aj n 1n 2n 3n in an 合计 平均数 总体均数 处理效应 符号文字表述 a n 因素水平数 每一水平的重复数 第i水平的第j次观察值 第i水平所有观察值的 和 第i水平均值 全部观察值的和 总平均值 第i水平上的子样方差 各处理总和、 平均数、大总 和、总平均数 是计算的一级 数据,在本章 我们采用了黑 点符号体系法 表示,要注意 熟悉和掌握。 可以分解为 表示第i个处理观测值总体的平均数。为了看出各处理 的影响大小,将 再进行分解, 其中表示全试验观测值的总体平均数(overall mean) , 是第i个处理的效应(treatment effect),表示处理i对试验结 果产生的影响。 是试验误差,相互独立,且服从正态分布N(0,2)。 该式称为单因素试验的线性统计模型或数学模型 。 (二) 方差分析的基本思路 将a个处理的观测值作为一个整体看待, 把观察 值总变异的平方和及自由度分解为相应于不同变异来源 的平方和及自由度,进而获得不同变异来源的总体方差 估计值;通过计算这些估计值的适当比值,就能检验各 样本所属总体均值是否相等。 方差分析实质上是关于观测值变异原因的数量分析 。 二 固定模型fixed model 因素固定、效应也固定,反应到线性模型中即 为常数可要求 。 1. 假设 固定模型的零假设为: 备择假设为: 故an个观察值的总变异可分解为处理间的变 异和处理内的变异两部分。 全部观察值的总变异可以用总均方来度量, 处理间变异和处理内变异分别用处理间均 方和处理内均方来度量。 2. 平方和与自由度的剖分 总平方和的拆分总平方和的拆分 三种平方和的简便计算公式如下 : 等重复时: 不等重复时: 在计算总平方和时,资料中的各个观察值要受 这一条件约束,总自由度等于资料 中观察值的总个数减一,即an-1。 总自由度记为dfT,则 dfT = an-1 。 在计算处理间平方和时,各处理均数要受 这一条件的约束,故处理间自由度 为处理数减1,即a-1。 处理间自由度记为dft ,则dft= a-1。 总自由度的拆分总自由度的拆分 在计算处理内平方和时,要受a个条件的约束, 即 ,i=1,2,.a。故处理内自由度为资料 中观察值的总个数减a ,即an- a 。 处理内自由度记为dfe,则dfe= an-a= a(n-1)。 因为 na -1=(a-1)+(na-a)=(a -1)+ a(n-1) 所以 dfT= dfA+ dfe 综合以上各式得: 总均方的拆分是通过将总均方的分子称为 总离均差平方和,简称为总平方和(SST) ,剖分成 处理间平方和(SSA)与处理内平方和(SSe)两部分;将 总均方的分母称为总自由度 ,剖分成处理 间自由度 与处理内自由度 两部分来实现的。 处理间均方(处理均方,MSA ) 处理内均方(误差均方,MSe ) 各部分平方和除以各自的自由度便得到总均 方、处理间均方和处理内均方,分别记为: MST(或ST2 )、 MSA(或SA2 )和MSe(或Se2 ),即 MST= ST2 =SST/dfT; MSt= St2 =SSt /dft; MSe= Se2 =Sse /dfe 注意: 在方差分析中不涉及总均方的数值, 所以一般不必计算; 总均方一般不等于处理间 均方加处理内均方。 3. 期望均方 expected mean squares EMS 若A是B的无偏估计,则称B是A的数学期望。处 理内均方MSe是误差方差2的无偏估计值,即2称为 MSe 的数学期望。 4. 统计量 当零假设 成立时,处理 效应的方差为零,亦即各处理观察值总体均数i (i=1,2,a) 相等时,处理间均方MSA与处理 内均方一样,也是误差方差2的估计值。 方差分析就是通过MSA 与MSe的比较来推断各 处理平均数 间差异的大小 F= MSA2/ MSe2 F具有两个自由度:df1=dfA=a-1; df2=dfe=a(n-1)。 查附表7: 若F ,即P0.05,不能否定H0,可 认为各处理间差异不显著; 若 F ,即0.01P0.05, 否定H0,接受HA,认为各处理间差异显著,标记 “*” ; 若F ,即P0.01,否定H0,接受HA, 认为各处理间差异极显著,标记“*”。 【例9.1】 某试验研究不同药物对腹水癌的治疗效果,将 患腹水癌的25只小白鼠随机分为5组,每组5只。其中A1 组不用药作为对照,A2、A3为两个不同的用中药组,A4 、A5为两个不同的西药组。各组小白鼠的存活天数如表7 2所示。表92 用不同药物治疗腹水癌小白鼠的结果 药物各小鼠存活天数(xij ) 合计xi.平均 A1 15 16 15 17 18816561 =1319 A2 45 42 50 38 3921445796 =9254 A3 30 35 29 31 3516025600 =5152 A4 31 28 20 25 3013417956 =3670 A5 40 35 31 32 3016828224 =5710 合计 x=75 7 12413 7 25105 这是一个单因素试验,处理数a =5,重复数n=5。 第一步:计算一级数据(见表); 第二步:计算SS e、SSA、 dfe 、 dfA 矫正项 C=x2/an/(55)=22921.96 总平方和 处理间平方和 =248274-2291.96=1905.44 处理内平方和 SS e=SST -SSA=2183.041905.44 =277.60=20 总自由度 dfT =an-1=25-1=24=5 5-1=24 处理间自由度 dfA=a-1=5-1=4=4 处理内自由度 dfe =dfT- dfA=24-4=20 = 处理间均方 MSA=SSt /dfA = 1905.44 /4=476.36 处理内均方 MSe=SSe /dfe = 277.60 /20=13.88 第三步:提出假设 = 24零假设为: H0:各处理组小鼠存活天数差异不显著 备择假设为: HA:各处理组小鼠存活天数差异显著 第四步:计算统计量 F=MSA/MSe=476.36/13.88=34.32* 第五步:查表 根据df1=dft=4,df2=dfe=20 查附表7,得F0.01(4,20)=4.43 第六步:做出推断及生物学解释: FF0.01(4,20)=4.43,P0.01。说明五个处理小白鼠存活 天数差异极显著,用不同药物治疗小白鼠腹水癌的疗效是 不同的。 在方差分析中,通常将变异来源、平方和、自由度 、均方和F值归纳成一张方差分析表,见表9 3。 表93 表92资料的方差分析表变异来源平方和自由度均 方F 值 处理间SSA 1905.44 dfA 4MSA 476.36 34.22* 处理内SSe 277.60dfe 20MSe 13.88 总变异SST 2183.04 dfT 24 F值应与相应的被检验因素齐行; 在表的左下方注出显著水平。 三、随机模型Random model 因素随机、效应不固定 是试验误差,相互独立且服从正态分布 不再为常数,且服从正态分布 1. 假设 随机模型的零假设为: 备择假设为: 2. 总平方和与总自由度的剖分:同固定模型 3. 数学期望: 4. 统计量F: 注意:在做生物学解释时,固定模型中的结论 只适用于检查的那几个因素水平;随机模型中 的结论可推广到这一因素的各个水平。 四、多重比较 (multiple comparisons) 统计上把多个平均数两两间的相互比较称为多 重比较。 (一)为什么要进行多重比较? F值显著或极显著,否定了无效假Ho,表明试验的 总变异主要来源于处理间的变异,试验中各处理平均数 间存在显著或极显著差异。但并不意味着每两个处理平 均数间的差异都显著或极显著,也不能具体说明哪些处 理平均数间有显著或极显著差异,哪些没有显著差异。 因而,有必要进行两两处理平均数间的比较,以具 体判断两两处理平均数间的差异显著性。 (二)常用的多重比较方法 多重比较的方法甚多,常用的有最小显著差数法 和最小显著极差法。 1、最小显著差数法(LSD法,Least significant difference) 1.1 LSD法的基本原理 在处理间F检验显著的前提下, 先计算出显著水 平为的最小显著差数LSD ,然后将任意两个处理平 均数的差数的绝对值 与其比较,作出结论。 最小显著差数由下式计算: 式中 为在F检验中误差自由度下,显著水平为 的临界t 值,均数差异标准误 则下式算得。 其中MSe为F检验中的误差均方,n为各处理内 的重复数。 显著水平取0.05和0.01时,从t 值表查出 代入 ,即可求得LSD0.05和LSD0.01 1.2 LSD法多重比较步骤 列出平数的多重比较表,比较表中各处理按其 平均数从大到小自上而下排列; 计算最小显著差数LSD0.05和LSD0.01; 将平均数多重比较表中两两平均数的差数与计 算出的LSD0.05 、LSD0.01 比较,作出统计推断。 【例9.1】 dfe=20, n=5, MSe=13.88 查t值表得: t0.05(dfe)=t0.05(20)=2.086,t0.01(dfe)=t 0.01(20) =2.845 所以显著水平为0.05与0.01的最小的显著差数为: 表9-4 五个处理小鼠平均存活天数多重比较表 (LSD法) 处 理 平均数 - 16.2 -26.8 - 32.0 - 33.6 A542.826.6*16.0*10.8*9.2* A433.617.4*6.8*1.6 A332.015.8*5.2* A226.810.6* A116.2 将表9-4中的10个差数与LSD0.05 、LSD0.01比较 :小于LSD0.05者不显著;介于LSD0.05与LSD0.01之间 者显著,标记“*”;大于LSD0.01者极显著,标记 “*”。 检验结果除差数1.6不显著、5.2显著外, 其余各差数极显著。 表明所用的药物不论中西药对小白鼠腹水癌 都有一定疗效,除中药A3与西药A4的疗效差异不显 著外,其余药物间的疗效都有显著或极显著差异 。 说明:实质上就是t检验法:LSD法是将t检验中把 所求得的t的绝对值 与临界值 的比较转化为将各对均数差值的绝对值 与 最小显著差数 的比较,从而做出统计推断的 2. Duncan法 2.1 Duncan法的基本原理 把平均数的差数看成是平均数的极差,根据极差 范围内所包含的处理数(称为秩次距) k的不同而采用不 同的检验尺度(最小显著极差R(,k),如果两平均数 的极差大于或等于R(,k),则两平均数间差异显著;如 果小于R(,k)差异不显著,这种方法就称为Duncan法。 若xixj,ki-j1,因此,若有a个平均数相互比 较,就有a-1种秩次距(a,a-1,a-2,2),因而需求得a-1 个R(,k),以作为判断各秩次距(k)平均数的极差是否显 著的标准。 2.2 检验步骤: 列出平均数多重比较表; 由自由度dfe、秩次距k查“多重比较中的Duncan表 ”(附表9),计算最小显著极差R0.05,k和 R0.01,k ; 将平均数多重比较表中的各极差与相应的最小显 著极差R0.05,k和 R0.01,k比较,作出统计推断。 对于【例9.1】,已算出 =1.67,依dfe=20, k=2,3,4,5,由附表9查临界r0.05(20,k) 和 r0.01(20,k)值, 乘以 ,求得各最小显著极差。所得结果列于 表9-5。 df e 秩次距kr0.05r0.01R0.05R0.01 20 22.954.024.96.7 33.104.225.27.0 43.184.335.37.2 53.254.405.47.3 表9-5 r值与R值 处 理 平均数 - 16.2 - 26.8 - 32.0 - 33.6 A542.826.0* 16.0* 10.8*9.2* A433.617.4*6.8*1.6ns A332.015.8*5.2* A226.810.6* A116.2 表9-6 五个处理小鼠平均存活天数多重比较 表(Duncan 法) 五、基本假定 效应的可加性(additivity) 分布的正态性(normality) 方差的同质性(homogeneity) 方差分析的基本步骤 1. 计算各项平方和与自由度。 2. 列出方差分析表,进行F检验。 3. 若F 检验显著,则进行多重比较。 多重比较的方法有最小显著差数法(LSD法 )和Duncan 法。 第二节 单因素方差分析的基本步骤第二节 单因素方差分析的基本步骤 一、各处理重复数相等的方差分析 【例9.2】 为了研究小白鼠患白血病后脾组织中 DNA含量的变化,测定四组,每组各8只(即 a=4,n=8)小白鼠脾组织中DNA的含量;第1组为正 常脾,第2组为患自发性白血病的脾;第3组为患 移植性白血病 AK4的脾;第4组为患移植性白血病 9421的脾。测定结果见表97。试检验各组DNA含 量差异是否显著。 表97 四组小白鼠脾组织中DNA含量 1. 计算各项平方和与自由度 C=x2/an=398.12/(48)=4952.61 组别DNA含量(mg/g)xi.xi.2 112.3 13.2 13.7 15.2 15.8 16.9 17.3 15.4119.814.981815.9614352.04 210.8 11.6 12.3 12.7 13.5 13.5 14.8 13.6102.812.851332.2810567.84 3 9.3 10.3 11.1 11.7 11.7 12.0 12.3 12.490.811.351038.628244.64 4 9.5 10.3 10.5 10.5 10.5 10.9 11.0 11.584.710.59899.157174.09 合计x=398.1 5086.0140338.61 SSe=SST SSA=133.40-89.72=43.68 dfT=an-1=48-1=31 dfA=a-1=4-1=3 dfe=dfT-dfA=31-3=28 2. 列出方差分析表,进行F检验,见表98。 表98 四组小白鼠脾中DNA含量方差分析表 变异来源平方和自由度均 方F 值 组 间89.72329.9119.17* 组 内43.68281.56 总变异133.4031 根据df1=dfA=3,df2=dfe=28查临界F值得: F0.05(3,28)=2.95,F0.01(3,28)=4.57 因为FF0.01(3,28),即P0.01,表明处理间DNA含量的 差异达到1显著水平。 3. 多重比较 采用Duncan法。各处理平均数多重比较表,见表99 。 因为MSe=1.56,n=8,所以 根据dfe=28,秩次距k=2,3,4由附表9 查出=0.05和 =0.01的各临界r值, 各r值乘以 ,即得各最小显著极 差。所得结果列于表9-10。 表99 r值及LSR值 dfe秩次距 k r0.05r0.01R0.05R0.01 28 22.903.911.2821.728 33.044.081.34421.803 43.134.181.38331.848 组别 平均数 - 10.59 -11.35 - 12.85 114.984.39 *3.63 *2.13 * 212.852.26*1.50 * 311.350.76 410.59 表910 各组DNA含量平均数多重比较表 检验结果表明: 正常脾中DNA含量极显著高于患有各类白血病脾中 DNA含量;患自发性白血病脾中DNA含量极显著高于 患移植性白血病9421,显著高于患移植性白血病AK4; 第三组第四组之间差异不显著。四组中以正常脾DNA含 量最高,第二组次之,第三、四组最低。 也就是说各 类白血病都将导致小白鼠脾中DNA含量明显降低。 组别平均数 4 3 2 114.984.39 *3.63 *2.13 * 212.852.26*1.50 * 311.350.76 410.59 二、各处理重复数不相等的方差分析 这种情况下方差分析步骤与各处理重复数相等的 情况相同,只是在有关计算公式上略有差异。 设处理数为a;各处理重复数为n1 ,n2 ,na ;试 验观察值总数为N=ni。则 【例9.3】五个不同品种猪的育肥试验,后期30天增 重(kg)如表711所示。试比较品种间增重有无差异 。 表911 五个品种猪30天增重 品种增重(kg)nixi.xi.2 /ni B121.519.520.022.018.020.06121.02440.1720.22450.5 B216.018.517.015.520.016.06103.01768.1717.21783.5 B319.017.520.018.017.0591.51674.4518.31680.25 B421.018.519.020.0478.51540.5619.61544.25 B515.518.017.016.0466.51105.5616.61109.25 合计25460.58528.91=8567.85 此例处理数a=5,各处理重复数不等。现对此 试验结果进行方差分析: 1. 计算各项平方和及其自由度 2、列出方差分析表,进行F检验 表912 五品种育肥猪增重方差分析表 临界F值为F 0.05(4,20)=2.87,F 0.01(4,20)=4.43,因为5.99 4.43,故P0.01,表明品种间差异极显著。 3.多重比较 采用Duncan法,各处理平均数多重比较表见表912。 变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论