




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、方差分析-第1页,共104页,2022年,5月20日,1点12分,星期四第五章 方差分析第2页,共104页,2022年,5月20日,1点12分,星期四方差分析(Analysis of variance,ANOVA) 又叫变量分析,是英国著名统计学家R . A . Fisher于20世纪提出的。它是用以检验两个或多个均数间差异的假设检验方法。它是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引伸。方差分析的定义第3页,共104页,2022年,5月20日,1点12分,星期四为了研究某种昆虫滞育期长短与环境的关系,在给定的温度和光照条件下在实验室培养,每一处理记录4只昆虫的滞育天数
2、,结果列于表中,是对该材料进行方差分析。光照(A)温度(B)250C300C350C5hd-1143138120107101100808389931017610hd-1961037891796183598076616715hd-1798396986071786467587183不同温度及光照条件下某种昆虫滞育天数第4页,共104页,2022年,5月20日,1点12分,星期四试验因素( experimental factor): 试验中所研究的影响试验指标的因素叫试验因素。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上因素对试验指标的影响时,则称为两因素或多因素试验。光照
3、和温度试验指标(experimental index): 为衡量试验结果的好坏和处理效应的高低,在实验中具体测定的性状或观测的项目称为试验指标。常用的试验指标有:身高、体重、日增重、酶活性、DNA含量等等。昆虫滞育天数第5页,共104页,2022年,5月20日,1点12分,星期四因素水平(level of factor): 试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。光照:光照的三个不同时间长短 温度:三个大小不同 的温度试验处理(treatment): 事先设计好的实施在实验单位上的具体项目就叫试验处理。如进行饲料的比较试验时,实施在试验单位上的具体项目就是具体饲喂哪一种饲料
4、。二因素实验,3x3个水平组合,即3x3个处理第6页,共104页,2022年,5月20日,1点12分,星期四试验单位( experimental unit ): 在实验中能接受不同试验处理的独立的试验载体叫试验单位。一只小白鼠,一条鱼,一定面积的小麦等都可以作为实验单位。一只昆虫重复(repetition): 在实验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。4个重复。第7页,共104页,2022年,5月20日,1点12分,星期四第一节 方差分析的基本原理二、数学模型一、方差分析的基本思想和目的三、平方和与df的分解四、统计假设的显著
5、性检验 五、多重比较第8页,共104页,2022年,5月20日,1点12分,星期四方差分析的基本思想总变异处理效应试验误差一、方差分析的基本思想和目的第9页,共104页,2022年,5月20日,1点12分,星期四方差分析的目的确定各种原因在总变异中所占的重要程度。处理效应试验误差二者相差不大,说明试验处理对指标影响不大。二者相差较大,即处理效应比试验误差大得多,说明试验处理影响是很大的,不可忽视。第10页,共104页,2022年,5月20日,1点12分,星期四二、数学模型假定有k组观测数据,每组有n个观测值,则共有nk个观测值平均T=xij TkTiT2T1总和xk1xk2xkjxknxi1x
6、i2xijxinx21x22x2jx2nx11 x12 x1jx1n12jnki21 处理重复x x1 x2 xi xk 第11页,共104页,2022年,5月20日,1点12分,星期四用线性模型(linear model)来描述每一观测值:xij = + i +ij (i=1,2,3,k j=1,2,3,n) 总体平均数i 处理效应ij 试验误差xij 是在第 i 次处理下的第 j 次观测值要求ij 是相互独立的,且服从标准正态分布 N(0,2 )二、数学模型第12页,共104页,2022年,5月20日,1点12分,星期四对于由样本估计的线性模型为:xij =x + ti +eijx 样本平
7、均数ti 样本处理效应eij 试验误差二、数学模型xij = + i +ij 第13页,共104页,2022年,5月20日,1点12分,星期四第14页,共104页,2022年,5月20日,1点12分,星期四第15页,共104页,2022年,5月20日,1点12分,星期四第16页,共104页,2022年,5月20日,1点12分,星期四方差是离均差平方和除以自由度的商2 (x-)2 N(x- x )2 s2 =n-1要把一个试验的总变异依据变异来源分为相应的变异,首先要将总平方和和总df分解为各个变异来源的的相应部分。方差分析的基本思想引起观测值出现变异分解为处理效应的变异和试验误差的变异。第17
8、页,共104页,2022年,5月20日,1点12分,星期四平均T=xij TkTiT2T1总和xk1xk2xkjxknxi1xi2xijxinx21x22x2jx2nx11 x12 x1jx1n12jnki21处理重复x x1 x2 xi xk 处理间平均数的差异是由处理效应引起的:处理内的变异是由随机误差引起:平方和(x- xi )( xi x )第18页,共104页,2022年,5月20日,1点12分,星期四( xi x )2 (x- xi )2(x - x )2 1 n 1 k 1 n 1 k +n1 k 总平方和 SST 处理内或组内平方和 SSe处理间或组间平方和 SSt平方和把k
9、个处理的离均差平方再累加,得第19页,共104页,2022年,5月20日,1点12分,星期四平方和总平方和处理间平方和 + 处理内平方和SST SSt + SSeSST (x - x )21 n 1 k = x2 - T2 kn(x)2 kn x2 -SST x2 -C令矫正数C ,则:T2 kn第20页,共104页,2022年,5月20日,1点12分,星期四总平方和:SST x2 -C 处理间平方和: SSt = Ti2 - Cn1处理内平方和:SSe = SST - SSt平方和第21页,共104页,2022年,5月20日,1点12分,星期四自由度总自由度也可分解为处理间自由度和处理内自由
10、度:dfT = dft + dfe总 df处理间df处理内df第22页,共104页,2022年,5月20日,1点12分,星期四自由度dfT = nk-1dft = k-1dfe = dfT - dft= nk-1-(k-1)=nk-k= k(n-1)平均T=xij TkTiT2T1总和xk1xk2xkjxknxi1xi2xijxinx21x22x2jx2nx11 x12 x1jx1n12jnki21处理重复x x1 x2 xi xk 第23页,共104页,2022年,5月20日,1点12分,星期四根据各变异部分的平方和和自由度,可求得处理间方差( st2 )和处理内方差( se2 ):st2
11、=SStdftSSedfese2 =第24页,共104页,2022年,5月20日,1点12分,星期四平方和自由度方差处理间处理内总变异第25页,共104页,2022年,5月20日,1点12分,星期四某猪场对4个不同品种幼猪进行4个月增重量的测定,每个品种选择体重接近的幼猪4头,测定结果列于下表,试进行方差分析。 =27.227.924.125.830.9T=434.4111.496.2103.2123.6Ti27.030.829.024.622.223.026.724.324.825.726.825.931.924.031.835.91234沈花沈黑沈白大白品 种重复xixk=4,n=4,nk
12、=16第26页,共104页,2022年,5月20日,1点12分,星期四例 =27.227.924.125.830.9T=434.4111.496.2103.2123.6Ti27.030.829.024.622.223.026.724.324.825.726.825.931.924.031.835.91234沈花沈黑沈白大白 品 种重复xix4个不同品种猪4个月的增重量(kg)(1)平方和的计算:T2 knC434.42 1611793.96SST x2 -C 31.92 + 24.02 + 24.62 - C213.3SSt = Ti2 - Cn11/4(123.62 + 103.22 + +
13、 111.42 ) - C103.94SSe SST - SSt=213.3 - 103.94=109.36第27页,共104页,2022年,5月20日,1点12分,星期四例(2)自由度的计算:dfT nk-1 =16-1=15dft =k-1 = 4-1=3dfe =k(n-1) =43=12(3)方差计算:st2 =SStdft103.94334.647SSedfese2 =109.36129.113第28页,共104页,2022年,5月20日,1点12分,星期四四、统计假设的显著性检验 F 检验第29页,共104页,2022年,5月20日,1点12分,星期四确定各种原因(处理效应、试验误
14、差)在总变异中所占的重要程度。处理间的方差(st2 )可以作为处理效应方差的估计量处理内的方差(se2 )可以作为试验误差差异的估计量处理效应试验误差方差分析的目的:第30页,共104页,2022年,5月20日,1点12分,星期四二者相比,如果相差不大,说明不同处理的变异在总变异中所占的位置不重要,也就是不同试验处理对结果影响不大。如果相差较大,也就是处理效应比试验误差大得多,说明试验处理的变异在总变异中占有重要的位置,不同处理对结果的影响很大,不可忽视。处理效应试验误差第31页,共104页,2022年,5月20日,1点12分,星期四F检验 从第三章我们已经知道,从一正态总体( ,2 )中随机
15、抽取两个样本,其样本方差s12 与s22 的比值为F :Fs12 s22 其F 分布曲线随着df1 和df2 的变化而变化。一般将大方差作分子,小方差作分母,使F 值大于1,因此,表上df1 的代表大方差自由度, df2 代表小方差自由度。第32页,共104页,2022年,5月20日,1点12分,星期四F检验 在进行不同处理差异显著性的F 检验时,一般是把处理间方差作为分子,称为大方差,误差方差作为分母,称为小方差。 无效假设是把各个处理的变量假设来自同一总体,即处理间方差不存在处理效应,只有误差的影响,因而处理间的样本方差t2 与误差的样本方差e2 相等:Ho :t2 e2HA :t2 e2
16、第33页,共104页,2022年,5月20日,1点12分,星期四F F0.05 P0.05 处理间差异不显著F F0.05 P0.05 处理间差异显著F F0.01 P0.01 处理间差异极显著否定Ho否定Ho接受Ho 我们确定显著标准水平后,从F 值表中查出在dft和dfe下的F值第34页,共104页,2022年,5月20日,1点12分,星期四综上所述,可归纳成方差分析表(analysis of variance table)se2k(n-1)SSe误差或处理内nk-1SST总和st2k-1SSt处理间F均方自由度平方和变异来源Fst2se2F检验第35页,共104页,2022年,5月20日
17、,1点12分,星期四上例中,4个不同品种猪增重的F值为:Fst2 se2 34.647 9.113 3.802dft 3 dfe 12, 查F值表得F0.05 3.49, F0.015.95品种间猪的增重量差异是显著的例F0.01F F0.050.01P F0.01 ,P LSD0.01,说明两地间差异极显著,标以不同的大写字母;LSD0.01 各组间差数LSD0.05 ,说明两地间差异显著,标以不同的小写字母;第65页,共104页,2022年,5月20日,1点12分,星期四地区平均数差异显著性0.050.01东北内蒙古河北安徽贵州31.6027.4026.0324.7522.85abbccd
18、ABBCCDD结果表明,东北与其它地区,内蒙古与安徽、贵州,河北与贵州黄鼬冬季针毛长度差异均达到极显著水平,安徽与贵州差异达到显著水平,而内蒙古与河北、河北与安徽差异不显著。第66页,共104页,2022年,5月20日,1点12分,星期四在实际工作中经常会遇到两种因素共同影响试验结果的情况每一观测值都是某一特定温度与光照条件共同作用的结果。温度光照B1B2BcA1A1 B1A1B2A1 BcA2A2 B1A2B2A2 BcArAr B1ArB2Ar Bc第67页,共104页,2022年,5月20日,1点12分,星期四第三节二因素方差分析第68页,共104页,2022年,5月20日,1点12分,
19、星期四定义:是指对试验指标同时受到两个试验因素作用的试验资料的方差分析。固定模型二因素都是固定因素(在试验中可以人为加以调控)随机模型二因素均为随机因素(在试验中不易人为加以调控)混合模型一个因素是固定因素,一个因素是随机因素二因素方差分析第69页,共104页,2022年,5月20日,1点12分,星期四二因素方差分析无重复观测值的二因素方差分析具有重复观测值的二因素方差分析无重复观测值的二因素方差分析第70页,共104页,2022年,5月20日,1点12分,星期四将一种生长激素配成M1,M2,M3,M4,M5五种浓度,并用H1,H2,H3三种时间浸渍某大豆品种的种子,出苗45天后的各处理每以植
20、株的平均干物重(g)(下表)。试作方差分析与多重比较。浓度 (A)时间(B)TiH1H2H3M11314144113.67M21212133712.33M333393.00M410910299.67M5254113.67T.j4043441278.08.68.88.47激素处理对大豆干物重的影响激素浓度和时间均为固定因素,适应于固定模型。第71页,共104页,2022年,5月20日,1点12分,星期四(1)平均和的计算:第72页,共104页,2022年,5月20日,1点12分,星期四(2)自由度的计算(3)列出方差分析表,进行F 检验第73页,共104页,2022年,5月20日,1点12分,星
21、期四变异来源dfSSs2FF0.05F0.01浓度间4289.0672.27116.56*3.847.01时间间误差281.734.940.870.621.404.468.65总变异14295.73F 检验结果表明,浓度间的F 值大于F0.01,时间间的F值未达到显著水平,表明不同激素浓度对大豆干物重有极显著差异。(4)进行多重比较(用SSR检验):由于只有浓度间的效应达到了极显著差异,时间间的效应未达到显著水平,只需对5种浸渍浓度进行多重比较,可计算出浓度间的平均数标准误均为第74页,共104页,2022年,5月20日,1点12分,星期四b=3是每一浓度的观测值数目,如果要比较时间间的效应,
22、由于每一时间有a=5个观测值,其平均数的标准误应为第75页,共104页,2022年,5月20日,1点12分,星期四M2345SSR0.053.263.403.483.52SSR0.014.754.945.065.14LSR0.051.481.551.581.60LSR0.012.162.252.302.34不同浓度大豆干物重多重比较SSR和LSR值查SSR值表,当dfe=8,M=2,3,4,5时的SSR值及由此计算的LSR值列于下表第76页,共104页,2022年,5月20日,1点12分,星期四多重比较结果表明:5种生长激素浓度对大豆干物重的影响有着极显著的差异,除M1与M2,M5与M3之外差
23、异不显著外,其它浓度之间的大豆干物重均达到极显著差异。5种激素浓度中,以M1和M2的处理效果较好。浓度平均数差异显著性0.050.01M1M2M3M4M513.6712.339.673.673.00aabccAABCC第77页,共104页,2022年,5月20日,1点12分,星期四无重复观测值的二因素方差分析,所估计的误差实际上是这两个因素的相互作用,这是在两个因素不存在互作,或互作很小的情况下进行估计的。但是,如果存在两个因素的互作,方差分析中就不能用互作来估计误差,必须在有重复观测值的情况下对试验误差进行估计。第78页,共104页,2022年,5月20日,1点12分,星期四二因素方差分析无
24、重复观测值的二因素方差分析具有重复观测值的二因素方差分析具有重复观测值的二因素方差分析第79页,共104页,2022年,5月20日,1点12分,星期四具有重复观测值的二因素方差分析具有重复观测值的二因素试验的典型设计是:假定A因素有a水平,B因素有b水平,则每一次重复都包括ab次实验,设试验重复n次。第80页,共104页,2022年,5月20日,1点12分,星期四二因素具有重复观测值的方差分析用下面线性模型来描述:xijk = +i + j+()ij +ijkA因素第i 水平,B因素第j水平和第k次重复的观测值总平均值A因素第i水平的效应B因素第j水平的效应i 和 j的交互作用随机误差模型中i
25、jk彼此独立且服从标准正态分布( 0 ,2)第81页,共104页,2022年,5月20日,1点12分,星期四因试验共有n次重复,试验的总次数为abn次。方差分析步骤和前面介绍的相类似,唯一不同的是F检验的方法。(1)平方和的分解为:A处理的样本容量第82页,共104页,2022年,5月20日,1点12分,星期四B处理的样本容量A处理、B处理和AB互作的平方和试验重复数第83页,共104页,2022年,5月20日,1点12分,星期四(3)各项的方差分别为(2)自由度的分解为第84页,共104页,2022年,5月20日,1点12分,星期四(4)F检验:()随机模型:对于随机模型, i、j、()ij
26、 和ijk是相互独立的随机变量,都遵从正态分布。在F检验时,先检验AB是否显著:(a)固定模型:在固定模型中, i ,j及()ij 均为固定效应。在F检验时,A因素、B因素和AB互作项均以Se2作为分母。第85页,共104页,2022年,5月20日,1点12分,星期四检验A、B时,有:()混合模型(以A为固定因素,为随机因素为例):在混合模型中, A和B的效应为非可加性,i 为固定效应,j及()ij 为随机效应。对A作检验时同随机模型,对B和AB作检验时同固定模型,即:在实际应用中,固定模型应用最多,随机模型和混合模型相对较少。第86页,共104页,2022年,5月20日,1点12分,星期四为
27、了研究某种昆虫滞育期长短与环境的关系,在给定的温度和光照条件下在实验室培养,每一处理记录4只昆虫的滞育天数,结果列于表中,是对该材料进行方差分析。光照(A)温度(B)250C300C350C5hd-1143138120107101100808389931017610hd-1961037891796183598076616715hd-1798396986071786467587183不同温度及光照条件下某种昆虫滞育天数第87页,共104页,2022年,5月20日,1点12分,星期四由于温度和光照条件都是人为控制的,为固定因素,可依固定因素分析。将表中数字均减去80,整理得下表光照()标本号温度(
28、B)250C300C350C5hd-1123463584027212003913214271188443910hd-1123416232111193210419132648383615hd-11234131618209216132293523647412724138193第88页,共104页,2022年,5月20日,1点12分,星期四(1)平方和的分解为:第89页,共104页,2022年,5月20日,1点12分,星期四(2)自由度的分解为第90页,共104页,2022年,5月20日,1点12分,星期四结果列入方差分析表第91页,共104页,2022年,5月20日,1点12分,星期四变异来源df
29、SSs2FF0.05F0.01光照间25367.062683.5321.94*3.355.49温度间25391.062695.5322.03*3.355.49光照温度误差427464.943303.25116.24122.340.952.734.11总变异35295.73F 检验结果表明,浓度间和时间间的F 值大于F0.01,它们的差异极显著,即昆虫滞育期长短主要决定于光照和温度,而与两者之间的互作关系不大。某昆虫滞育天数方差分析表第92页,共104页,2022年,5月20日,1点12分,星期四要了解各种光照时间及温度对滞育期的影响,需进行不同光照间及不同温度间的多重比较,其方法可参照前面例子
30、进行,但平均数标准误的计算为:光照(A)间平均数标准误,温度(B)间平均数标准误A处理的样本容量B处理的样本容量第93页,共104页,2022年,5月20日,1点12分,星期四在啤酒生产中,为了研究烘烤方式(A)与大麦水分(B)对糖化时间的影响,选了两种烘烤方式,4种水分共8种处理,每一处理重复三次,结果如下表。烘烤方式(A)水分(B)B1B2B3B4A112.09.516.018.013.010.015.519.014.512.514.017.0A25.013.017.515.06.514.018.516.05.515.016.017.5大麦水分是不均匀的,又不易控制,所以因素B是随机的,它
31、的效应也是随机的,因此本题是一个混合模型的方差分析。将上表中各观测值都减去10,计算后得第94页,共104页,2022年,5月20日,1点12分,星期四烘烤方式(A)标本号水分(B)B1B2B3B4A112.0-5.06.08.051.023.00.05.59.034.52.54.07.09.52.015.524.0A21-5.03.07.55.039.52-3.54.08.56.03-4.55.06.07.5-13.012.022.018.5-3.51437.542.590.5第95页,共104页,2022年,5月20日,1点12分,星期四(1)平方和的分解为:第96页,共104页,2022年,5月20日,1点12分,星期四(2)自由度的分解为第97页,共104页,2022年,5月20日,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医疗设备质量管理体系建设探讨
- 区款链技术助力企业实现办公自动化
- 乡下耕地出售合同范例
- 嗳气的临床护理
- 厦门市2025 届高三毕业班第四次质量检测-英语+答案
- 医疗数字化与区块链数字身份认证的协同发展
- 小学社团活动总结模版
- 医疗空间中的绿色疗愈效果探索
- 医疗服务流程优化对提高患者满意度的影响研究
- 光伏公司租赁合同范例
- 2025-2030年中国电加热蓄热系统项目投资可行性研究分析报告
- 【+初中语文++】第23课蛟龙探海课件+统编版语文七年级下册
- 农村三资管理课件
- 敏捷跨文化团队协作-全面剖析
- 2025年3月29日全国事业单位联考A类《职测》真题及答案
- 八年级劳动教育测试题目及答案
- 战场救护科目考试题及答案
- 2025年新思想概论考试题及答案
- 2025年高考预测猜题 数学(新高考Ⅱ卷专用)01 含解析
- 深度学习在电子领域的应用-深度研究
- 通信施工培训课件
评论
0/150
提交评论