生物统计学第三讲方差分析_第1页
生物统计学第三讲方差分析_第2页
生物统计学第三讲方差分析_第3页
生物统计学第三讲方差分析_第4页
生物统计学第三讲方差分析_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三讲第三讲 方差分析方差分析 ANOVA (analysis of variance) 是由是由 英国统计学家英国统计学家R.A.Fisher于于1923年提出的。年提出的。 “ 方差分析法是一种在若干能相互比较的资料组中,方差分析法是一种在若干能相互比较的资料组中, 把产生变异的原因加以区分开来的方法与技术把产生变异的原因加以区分开来的方法与技术”,方差,方差 分析实质上是关于观测值变异原因的数量分析。分析实质上是关于观测值变异原因的数量分析。 又称变异数分析,它适用于正态分布(有时要求又称变异数分析,它适用于正态分布(有时要求 方差齐性)的。因为使用了方差齐性)的。因为使用了 F统计量及

2、统计量及 F 分布,故亦分布,故亦 称为称为F检验。检验。 生物统计学第三讲方差分析 方差分析应用范围很广,在推断统计方法中方差分析应用范围很广,在推断统计方法中 常用来解决单因素或多因素中每个因素多个水平常用来解决单因素或多因素中每个因素多个水平 (处理)均数间的比较(包括均数间的多重比较(处理)均数间的比较(包括均数间的多重比较 ,即两两比较)和多因素间交互作用的分析。,即两两比较)和多因素间交互作用的分析。 将将k个处理的观测值作为一个整体看待,把观个处理的观测值作为一个整体看待,把观 测值总变异的平方和及自由度分解为相应于不同变测值总变异的平方和及自由度分解为相应于不同变 异来源的平方

3、和及自由度,进而获得不同变异来源异来源的平方和及自由度,进而获得不同变异来源 总体方差估计值;通过计算这些总体方差的估计值总体方差估计值;通过计算这些总体方差的估计值 的适当比值,就能检验各样本所属总体平均数是否的适当比值,就能检验各样本所属总体平均数是否 相等。相等。 生物统计学第三讲方差分析 几个常用术语几个常用术语: 1、试验指标、试验指标(experimental index) 为衡量试验结果的好坏或处理效应的高低为衡量试验结果的好坏或处理效应的高低 ,在,在 试验中具体测定的性状或观测的项目称为试验指标。试验中具体测定的性状或观测的项目称为试验指标。 由于试验目的不同由于试验目的不同

4、 ,选择的试验指标也不相同。在,选择的试验指标也不相同。在 畜禽畜禽 、水产试验中常用的试验指标有、水产试验中常用的试验指标有 :日增重:日增重 、产、产 仔数仔数 、产奶量、产奶量 、产蛋率、瘦肉率、某些生理生化和、产蛋率、瘦肉率、某些生理生化和 体型指标体型指标(如血糖含量、体高、体重如血糖含量、体高、体重)等。等。 生物统计学第三讲方差分析 2、试验因素、试验因素(experimental factor) 试验中所研究的影响试验指标的因素叫试验因素。试验中所研究的影响试验指标的因素叫试验因素。 如研究如何提高猪的日增重时,饲料的配方、猪的品如研究如何提高猪的日增重时,饲料的配方、猪的品

5、种、饲养方式、环境温湿度等都对日增重有影响,均种、饲养方式、环境温湿度等都对日增重有影响,均 可作为试验因素来考虑。可作为试验因素来考虑。 当试验中考察的因素只有一个时,称为单因素试当试验中考察的因素只有一个时,称为单因素试 验;验; 若同时研究两个或两个以上的因素对试验指标的若同时研究两个或两个以上的因素对试验指标的 影响时,则称为两因素或多因素试验。试验因素常用影响时,则称为两因素或多因素试验。试验因素常用 大写字母大写字母A、B、C、等表示。等表示。 生物统计学第三讲方差分析 3、因素水平、因素水平(level of factor) 试验因素所处的某种特定状态或数量等级称为因试验因素所处

6、的某种特定状态或数量等级称为因 素水平,简称水平。素水平,简称水平。 如比较如比较3个品种奶牛产奶量的高低,这个品种奶牛产奶量的高低,这3个品种就个品种就 是奶牛品种这个试验因素的是奶牛品种这个试验因素的3个水平;个水平; 研究某种饲料中研究某种饲料中4种不同能量水平对肥育猪瘦肉种不同能量水平对肥育猪瘦肉 率的影响,这率的影响,这4种特定的能量水平就是饲料能量这一种特定的能量水平就是饲料能量这一 试验因素的试验因素的4个水平。个水平。 生物统计学第三讲方差分析 因素水平用代表该因素的字母加添角标因素水平用代表该因素的字母加添角标1,2, , 来表示。如来表示。如 A1 、 A2 、 , B1

7、、B2、,等。,等。 4、试验处理、试验处理(treatment) 事先设计好的实施在试验单位上的具体项目叫试事先设计好的实施在试验单位上的具体项目叫试 验处理,简称处理。验处理,简称处理。 在单因素试验中,实施在试验单位上的具体项目在单因素试验中,实施在试验单位上的具体项目 就是试验因素的某一水平。例如进行饲料的比较试验就是试验因素的某一水平。例如进行饲料的比较试验 时,实施在试验单位时,实施在试验单位(某种畜禽某种畜禽)上的具体项目就是喂上的具体项目就是喂 饲某一种饲料。所以进行单因素试验时,试验因素的饲某一种饲料。所以进行单因素试验时,试验因素的 一个水平就是一个处理。一个水平就是一个处

8、理。 生物统计学第三讲方差分析 在多因素试验中,实施在试验单位上的具体项目是在多因素试验中,实施在试验单位上的具体项目是 各因素的某一水平组合。例如进行各因素的某一水平组合。例如进行3种饲料和种饲料和3个品种个品种 对猪日增重影响的两因素试验,整个试验共有对猪日增重影响的两因素试验,整个试验共有33=9 个水平组合,实施在试验单位个水平组合,实施在试验单位(试验猪试验猪)上的具体项目上的具体项目 就是某品种与某种饲料的结合。所以,在多因素试验就是某品种与某种饲料的结合。所以,在多因素试验 时,试验因素的一个水平组合就是一个处理。时,试验因素的一个水平组合就是一个处理。 生物统计学第三讲方差分析

9、 5、试验单位、试验单位(experimental unit) 在试验中能接受不同试验处理的独立的试验载体叫在试验中能接受不同试验处理的独立的试验载体叫 试验单位。试验单位。 在畜禽、水产试验中,在畜禽、水产试验中, 一只家禽、一只家禽、 一头家畜、一一头家畜、一 只小白鼠、一尾鱼,即一个动物;或几只家禽、几头只小白鼠、一尾鱼,即一个动物;或几只家禽、几头 家畜、几只小白鼠、几尾鱼,即一组动物都可作为试家畜、几只小白鼠、几尾鱼,即一组动物都可作为试 验单位。验单位。 试验单位往往也是观测数据的单位。试验单位往往也是观测数据的单位。 生物统计学第三讲方差分析 6、重复、重复(repetition

10、) 在试验中,将一个处理实施在两个或两个以上的试在试验中,将一个处理实施在两个或两个以上的试 验单位上,称为处理有重复;一处理实施的试验单位验单位上,称为处理有重复;一处理实施的试验单位 数称为处理的重复数。数称为处理的重复数。 例如,用某种饲料喂例如,用某种饲料喂4头猪,就说这个处理头猪,就说这个处理(饲料饲料) 有有4次重复。次重复。 生物统计学第三讲方差分析 3.1 3.1 完全随机设计的单因素方差分析完全随机设计的单因素方差分析 completely randomized designcompletely randomized design 完全随机设计完全随机设计:成组设计的扩大:成

11、组设计的扩大 只能分析一个因素,故称只能分析一个因素,故称“单因素方差分析单因素方差分析” 变异和自由度的分解变异和自由度的分解 总变异总变异:各观察值之间的变异,包括处理因素:各观察值之间的变异,包括处理因素 的作用和随机误差(个体差异)。的作用和随机误差(个体差异)。 N X XXXSS k i n j ij k i n j ij ij ij i i 11 2 11 22 )( )( 总 生物统计学第三讲方差分析 完全随机设计时,可以将总变异分解成组间完全随机设计时,可以将总变异分解成组间 变异和组内变异两部分。变异和组内变异两部分。 组间变异组间变异:处理组之间的变异,包括处理:处理组之

12、间的变异,包括处理 因素的作用和随机变异。因素的作用和随机变异。 N X n X XXnSS k i n j ij k i i n j ij i k i i ii 11 2 1 1 2 2 1 )()( )( 组间组间 生物统计学第三讲方差分析 组内变异组内变异:各处理组内不同观察值之间的变:各处理组内不同观察值之间的变 异,反映随机变异。异,反映随机变异。 相应地,自由度也分解成组间自由度和组内相应地,自由度也分解成组间自由度和组内 自由度:自由度: 组组间间总总组组内内 SSSSXXSS k i n j iij i 11 2 )( 1 1 kv kNv Nv 组间组间 组内组内 总总 生物

13、统计学第三讲方差分析 显然,显然, 组间变异和组内变异的大小都与自由度组间变异和组内变异的大小都与自由度 有关,为了可以比较,我们分别计算有关,为了可以比较,我们分别计算组间组间 和组内均方和组内均方 组组内内组组间间总总 组组内内组组间间总总 vvv SSSSSS 组内组内 组内组内 组内组内 组间组间 组间组间 组间组间 v SS MS v SS MS 生物统计学第三讲方差分析 方差分析:方差分析: 如果处理因素没有作用,如果处理因素没有作用,组间均方组间均方和和组内均方组内均方应应 该相等。即使由于抽样误差的存在,两者也不应该相等。即使由于抽样误差的存在,两者也不应 相差太大。建立统计量

14、相差太大。建立统计量F F 检验时,检验时, 分布分布服从服从 组内组内组间组间 组内组内 组间组间 ),(vvFF MS MS F 因素无作用。,差别无显著性,处理,那么如果 因素有作用;,差别有显著性,处理,那么如果 p vv FF p vv FF ) 2 , 1 ( ) 2 , 1 ( 生物统计学第三讲方差分析 例例3.1 三种配合饲料对肉鸡增重效果的对比试验,增重数值为三种配合饲料对肉鸡增重效果的对比试验,增重数值为 (60天体重天体重-1000g )如下表,试检验三种配合饲料的增重效)如下表,试检验三种配合饲料的增重效 果间是否存在差异。果间是否存在差异。 该试验统计设计是将受试肉鸡

15、该试验统计设计是将受试肉鸡30只随机等分为三组,每组随只随机等分为三组,每组随 机分配一种饲料配方,形成试验方案,故称之为完全随机设计,机分配一种饲料配方,形成试验方案,故称之为完全随机设计, 也称该试验是单因素也称该试验是单因素饲料配方、三个水平处理饲料配方、三个水平处理A1A2A3、等、等 重复重复每个饲料重复饲喂每个饲料重复饲喂10只肉鸡的试验。完全随机设计中,各只肉鸡的试验。完全随机设计中,各 组也可以采用不等分的方式,但从统计设计角度要求,应尽可能组也可以采用不等分的方式,但从统计设计角度要求,应尽可能 采用各组等分的设计为好。采用各组等分的设计为好。 A1(鱼粉为主鱼粉为主) 73

16、 58 71 37 66 26 53 49 65 51 54. 9 A2(槐叶、苜蓿粉加鱼粉槐叶、苜蓿粉加鱼粉) 16 58 38 42 20 45 44 61 34 49 40. 7 A3(槐叶、苜蓿粉加药剂槐叶、苜蓿粉加药剂) 84 69 106 78 75 90 79 94 111 92 87. 8 1x 2x 3x 生物统计学第三讲方差分析 对该资料做单因素方差分析的前提是:各组数据均服从正态分布,对该资料做单因素方差分析的前提是:各组数据均服从正态分布, 且各组数据的方差具有齐性(总体且各组数据的方差具有齐性(总体21=22=2k)。)。 首先做正态性检验和方差齐性检验(具体方法从略

17、,本例直接由首先做正态性检验和方差齐性检验(具体方法从略,本例直接由 SPSS统计软件给出结果):统计软件给出结果): 三组经单样本三组经单样本K-S检验,检验, P 值分别为:值分别为:P=0.979,P=0.993, P=0.987,P 值均大于值均大于0.05,即均符合正态分布。,即均符合正态分布。 方差齐性检验,采用方差齐性检验,采用Levenes Test 法,统计量法,统计量 F= 0.034, P=0.967 P 0.05,三组方差具有齐性。,三组方差具有齐性。 再做方差分析:再做方差分析: 检验假设为检验假设为 H0:1=2=k。 本例本例H : :1=2=3 即三种饲料配方增

18、重效果相同。即三种饲料配方增重效果相同。 检验原理是,检验原理是,从分析数据的变异原因入手,找出引起数据变异的主从分析数据的变异原因入手,找出引起数据变异的主 要原因,进而做出是否拒绝假设要原因,进而做出是否拒绝假设H H0 0的结论的结论。引起数据变异的原因是:。引起数据变异的原因是: 1. 1. 肯定有客观存在的随机误差的影响;肯定有客观存在的随机误差的影响;2. 2. 可能由饲料配方的不同引可能由饲料配方的不同引 起。如果主要原因是后者,则拒绝起。如果主要原因是后者,则拒绝H H0 0;如果主要原因是前者,则不能拒;如果主要原因是前者,则不能拒 绝绝H H0 0。 生物统计学第三讲方差分

19、析 具体方法:具体方法: 分别计算代表不同变异原因的平方和、自由度、方差(亦称样本均分别计算代表不同变异原因的平方和、自由度、方差(亦称样本均 方)及方)及F统计量,公式如下表:统计量,公式如下表: 变异原因变异原因 平方和平方和SS 自由度自由度df 均方均方MS F统计量统计量 总的总的 SST= (xij- )2/ (N-1) N-1 组间组间 SS组间 组间=ni(xi- )2/(k-1) k-1 MS组间组间=SS组间组间/(k-1) F=MS组间组间/MS误差误差 组内组内 SS误差 误差= (xij- ) / (N-k) N-k MS误差 误差=SS误差误差/(N-k) =SST

20、-SS组间 组间 (误差)(误差) ix 其中,其中,ni为第为第 I 个样本的容量,个样本的容量,N 为样本数据总个数,为样本数据总个数,k 为比较的组数,为比较的组数, 为第为第 I 个样本均数,个样本均数, 为为 N 个数据的均数。个数据的均数。 F F 统计量的意义是,代表组间(不同饲料配方间)变异的方差,与统计量的意义是,代表组间(不同饲料配方间)变异的方差,与 代表客观存在的组内(随机误差)变异的方差的比值。比值越大,就越代表客观存在的组内(随机误差)变异的方差的比值。比值越大,就越 有理由拒绝有理由拒绝H H0 0。 x x x ix _ 生物统计学第三讲方差分析 本例计算结果如

21、表:本例计算结果如表: 界值界值F0. 05,( (2,27)=3. 35, ,F0. 01,( (2,27)=5. 49,因 ,因FF0. 01,( (2,27),P 0. 01 (SPSS软件给出软件给出P0. 001),即三种饲料配方增重效果间存在差异(不),即三种饲料配方增重效果间存在差异(不 都相同)。都相同)。 变异原因变异原因 SS df MS F 总总 的的 17243. 467 29 饲料间饲料间 11674. 867 2 5837. 433 28. 303 误误 差差 5568. 600 27 206. 244 生物统计学第三讲方差分析 二、均数间的两两比较二、均数间的两两

22、比较 当方差分析当方差分析F 检验不能拒绝检验不能拒绝H0时,一般情况下分析结束;当方差分时,一般情况下分析结束;当方差分 析析 F 检验拒绝检验拒绝 H0 时,通常都进一步做均数间的两两比较(亦称多重比时,通常都进一步做均数间的两两比较(亦称多重比 较)。两两比较方法有许多种,下面介绍常用的三种方法。较)。两两比较方法有许多种,下面介绍常用的三种方法。 (一)(一)LSD法(最小显著差数法法(最小显著差数法 least significant difference ) 计算计算 及其标准误差及其标准误差Sij = MS误差 误差( (1/ni+1/nj) 其中,其中,ni , nj 为为 的

23、样本容量,的样本容量,1 i j k。 可以证明当可以证明当 来自同一总体(即来自同一总体(即i=j)时,)时, t =( )/ Sij t(df误差 误差)分布 )分布 与与 t 检验相仿,可做出结论。检验相仿,可做出结论。 j ixx j ixx, j ixx, j ixx 生物统计学第三讲方差分析 上例上例3. 1经经LSD法做均数间的两两比较,由法做均数间的两两比较,由 SPSS 软件给出检验结软件给出检验结 果为:果为: 1与与 2有差别,有差别, P=0. 036 1与与 3有差别,有差别, P0. 001 2与与 3有差别,有差别, P 0. 05; 3与与 1有差别,有差别,P

24、 = 0. 000 0.05,三组方差具有齐性。,三组方差具有齐性。 方差分析,方差分析,F = 28.303,P 0.001,即三种饲料配方增重效,即三种饲料配方增重效 果不都相同。果不都相同。 两两比较两两比较 SNK 法,每两组间均存在差异,法,每两组间均存在差异,P 0.05。 有关可信区间从略。有关可信区间从略。 上述关于完全随机设计单因素方差分析的基本原理及方法,上述关于完全随机设计单因素方差分析的基本原理及方法, 可推广至其它方差分析方法,除有特殊区别之处外,不再赘述。可推广至其它方差分析方法,除有特殊区别之处外,不再赘述。 生物统计学第三讲方差分析 该试验统计设计是配对试验设计

25、的推该试验统计设计是配对试验设计的推 广,选定三个区组,要求每个区组内,土广,选定三个区组,要求每个区组内,土 壤条件尽可能一致,并分成壤条件尽可能一致,并分成 8 块,随机分块,随机分 配种植配种植 8 个品种的小麦,使得在每个区组个品种的小麦,使得在每个区组 上,上,8 个品种间均具有良好的可比性。而个品种间均具有良好的可比性。而 区组的数目即为每个品种重复试验的次数,区组的数目即为每个品种重复试验的次数, 本例重复数为本例重复数为3。 3. 2 随机区组设计方差分析随机区组设计方差分析 randomized block design 例例3. 2 8个小麦品种对比试验,在个小麦品种对比试

26、验,在3个地块上进行,记录规定面个地块上进行,记录规定面 积产量(积产量(kg)数据如下表,试检验)数据如下表,试检验8个品种产量间有无差异。个品种产量间有无差异。 A1 10. 9 11. 3 12. 2 A2 10. 8 12. 3 14. 0 A3 11. 1 12. 5 10. 5 A4 9. 1 10. 7 11. 1 A5 11. 8 13. 9 14. 8 A6 10. 1 10. 6 11. 8 A7 10. 0 11. 5 14. 1 A8 9. 3 10. 4 12. 4 区区 组组 品品 种种 B1 B2 B3 这是一个单因素这是一个单因素8水平(水平(k=8)、重复数为

27、)、重复数为3(n=3)的随机化完全区组)的随机化完全区组 设计,简称随机区组设计。设计,简称随机区组设计。 (SPSS操作中将区组也看成一个固定因素,因此选择操作中将区组也看成一个固定因素,因此选择双因素主效应分析双因素主效应分析) 生物统计学第三讲方差分析 又如三种药物对小鼠体重增加值(又如三种药物对小鼠体重增加值(g)影响的对比试验中,选)影响的对比试验中,选5窝窝 小鼠,每窝选同性别、同体重小鼠各小鼠,每窝选同性别、同体重小鼠各 3 只,并随机分配接受三种药物只,并随机分配接受三种药物 的处理,形成试验方案,如下表。这是一个单因素的处理,形成试验方案,如下表。这是一个单因素3水平(水平

28、(k=3)、重)、重 复数为复数为5(n=5)的随机区组设计。)的随机区组设计。 与完全随机设计相比,区组设计更与完全随机设计相比,区组设计更 精细,一般试验误差将因扣除区组间的精细,一般试验误差将因扣除区组间的 变异而减小,检验出可能存在的不同水变异而减小,检验出可能存在的不同水 平处理间的差异的灵敏度提高了。平处理间的差异的灵敏度提高了。 对随机区组设计资料的方差分析,对随机区组设计资料的方差分析, 1 27 32 160 2 41 47 96 3 25 36 115 4 52 65 135 5 14 39 76 区区 组组 药药 物物 A B C 包括后面介绍的其它方差分析方法,也有关于

29、正态性、方差齐性的前包括后面介绍的其它方差分析方法,也有关于正态性、方差齐性的前 前提要求,但实际分析时,一般不做这两方面的检验。前提要求,但实际分析时,一般不做这两方面的检验。 生物统计学第三讲方差分析 方差分析:假设方差分析:假设H0:1=2=k。 本例本例3.2 H : :1=2=8 即即 8 个品种小麦的产量相同。个品种小麦的产量相同。 随机区组设计资料的变异原因比完全随机设计多了一个,具体随机区组设计资料的变异原因比完全随机设计多了一个,具体 计算公式如下表:计算公式如下表: 其中,其中,k 为水平处理数,为水平处理数,n 为区组数,为区组数,N=kn。 当当H0为真时,为真时,FF

30、(df处理 处理, ,df误差 误差)分布 )分布 变异原因变异原因 SS df MS F 总的总的 SST=(xij x ) 2/(N-1) N-1 处理间处理间 SS处理 处理=n (xi -x)2 / (k-1) k -1 MS处理处理=SS处理处理/(k-1) F=MS处理处理 / MS误差误差 区组间区组间 SS区组 区组=k( (xj-x)2 / (n-1) n-1 误误 差差 SS误差 误差=SST-SS处理处理-SS区组区组 (k-1)(n-1) MS误差误差=SS误差误差/(k-1)(n-1) 生物统计学第三讲方差分析 SPSS 软件给出软件给出P=0. 009,各品种产量总

31、体均值不都相同。各品种产量总体均值不都相同。 两两比较采用两两比较采用SNK法,结果为:法,结果为: 品种品种5分别与品种分别与品种4 、 6 、 8之间存在差异,之间存在差异,P0. 05;其余;其余 各品种间差异均无显著意义(即不能说明它们的总体均值间存在差异)。各品种间差异均无显著意义(即不能说明它们的总体均值间存在差异)。 采用采用LSD法,结果为:法,结果为: 15, P=0.011; 24, P=0.01; 26, P=0.046; 28 , P=0.032; 35, P=0.009; 45, P0.001; 47, P=0.042; 56, P=0. 002; 57, P=0.0

32、35; 58, P=0.001; 其余各品种间差异无显著意义(不能说它们的总体均值间存在差异)。其余各品种间差异无显著意义(不能说它们的总体均值间存在差异)。 本例计算结果如表:本例计算结果如表: 变异原因变异原因 SS df MS F 总总 的的 52. 400 23 品种间品种间 22. 227 7 3. 175 4. 337 区组间区组间 19. 922 2 误误 差差 10. 251 14 0. 732 生物统计学第三讲方差分析 统计分析结果的报告格式为:统计分析结果的报告格式为: 经方差分析,不同品种小麦间比较经方差分析,不同品种小麦间比较F=4. 337,P=0.009, 即即 8

33、 个个 品种小麦的规定面积产量不都相同。品种小麦的规定面积产量不都相同。 两两比较两两比较SNK法,品种法,品种5分别与品种分别与品种4 、 6 、 8之间存在之间存在 差异,差异, P 均小于均小于0. 05;其余各品种间差异均无显著意义,;其余各品种间差异均无显著意义,P 均大于均大于 0. 05。 生物统计学第三讲方差分析 这是一个双因素试验,温度因素这是一个双因素试验,温度因素 有有3个水平,地区因素有个水平,地区因素有7个水平,在个水平,在 双因素试验中,水平组合为处理,这双因素试验中,水平组合为处理,这 里共里共 37=21 个不同处理,因每个处个不同处理,因每个处 理只有一个试验

34、数据,故称之为处理理只有一个试验数据,故称之为处理 无重复的设计。方差分析原理、方法无重复的设计。方差分析原理、方法 与上节随机区组设计完全相同,只是与上节随机区组设计完全相同,只是 上节中的区组在这里换成了另一个试上节中的区组在这里换成了另一个试 验因素。验因素。 3. 3 两因素处理无重复设计方差分析两因素处理无重复设计方差分析 例例3. 3 来自来自7个不同地区的战士各个不同地区的战士各1人,分别在人,分别在3种不同的气温下,种不同的气温下, 以相同速度做相等距离的行军后,测定其生理紧张指数,数据如下表。以相同速度做相等距离的行军后,测定其生理紧张指数,数据如下表。 试检验:试检验:1.

35、 不同温度下生理紧张指数有无差异;不同温度下生理紧张指数有无差异;2. 不同地区战士间生不同地区战士间生 理紧张指数有无差异。理紧张指数有无差异。 1 2. 83 3. 16 3. 40 2 1. 57 2. 11 2. 46 3 1. 98 2. 30 2. 99 4 2. 26 2. 41 3. 12 5 2. 05 2. 03 2. 84 6 1. 85 2. 52 2. 53 7 1. 33 1. 96 2. 38 温温 度度 27. 0 29. 5 31. 2 地地 区区 (SPSS操作:选择操作:选择双固定因素主效应分析双固定因素主效应分析) 生物统计学第三讲方差分析 统计分析结果

36、的报告格式为:统计分析结果的报告格式为: 不同温度下生理紧张指数总体均值不都相同,不同温度下生理紧张指数总体均值不都相同,F= 41.262, P 0. 001; 不同地区战士间生理紧张指数总体均值不都相同不同地区战士间生理紧张指数总体均值不都相同, F =16.384, P 0.001。 两两比较采用两两比较采用LSD法:法: 温度间比较:温度间比较: 12,P=0.002; 13, P0.001; 23, P0. 001。 地区间比较:地区间比较: 1分别与分别与2 7均有差异,均有均有差异,均有P0.01;23,P=0.02; 24, P=0.002; 37, P=0.003; 47,P

37、0.001; 57, P=0.012; 67, P=0.013。 有关可信区间从略。有关可信区间从略。 检验假设有两个:检验假设有两个:1. H0:1=2=3 即不同温度下生理紧张指数即不同温度下生理紧张指数 相同;相同;2. H0:1=2=7即不同地区战士间生理紧张指数相同。即不同地区战士间生理紧张指数相同。 方差分析结果如下表:方差分析结果如下表: 变异原因变异原因 SS df MS F 总总 的的 5. 733 20 温度间温度间 2. 453 2 1. 227 41. 262 地区间地区间 2. 922 6 0. 487 16. 384 误误 差差 0. 357 12 0. 02973

38、 生物统计学第三讲方差分析 用用n阶拉丁方安排试验,最多可安排三个因素阶拉丁方安排试验,最多可安排三个因素行因素、行因素、 列因素、字母因素,每个因素均为列因素、字母因素,每个因素均为n个水平。也可安排一个因个水平。也可安排一个因 素和两个区组,或安排两个因素和一个区组。素和两个区组,或安排两个因素和一个区组。 3. 4 拉丁方设计方差分析拉丁方设计方差分析 latin square design 一、一、n 阶拉丁方阶拉丁方 n 阶拉丁方是由阶拉丁方是由n个不同的拉丁字母排列成个不同的拉丁字母排列成n行行n列的方块,每列的方块,每 个字母在每行每列中都出现且只出现一次。个字母在每行每列中都出

39、现且只出现一次。 例如:例如: 5 阶拉丁方阶拉丁方 A B C D E B C D E A C D E A B D E A B C E A B C D 3 阶拉丁方阶拉丁方 A B C B C A C A B 生物统计学第三讲方差分析 该试验的统计设计是,首先由三因素的等水平数该试验的统计设计是,首先由三因素的等水平数n=5,选择一个,选择一个5 阶拉丁方,比如上面给出的拉丁方;然后将行随机调整后对应阶拉丁方,比如上面给出的拉丁方;然后将行随机调整后对应15品种;品种; 再将列随机调整后对应再将列随机调整后对应 阶段;最后将阶段;最后将5种饲料随机对应种饲料随机对应A、B、C、 D、E 5

40、个字母。形成试验方案,如表所示。试验结果产乳量记录在相个字母。形成试验方案,如表所示。试验结果产乳量记录在相 应位置上,以备做方差分析。应位置上,以备做方差分析。 二、拉丁方设计与方差分析二、拉丁方设计与方差分析 例例3. 4 用用5头不同品种奶牛,在头不同品种奶牛,在5个不同的阶段,分别饲喂个不同的阶段,分别饲喂5种不同饲种不同饲 料,记录产乳量(料,记录产乳量(kg)如下表。试检验:)如下表。试检验:1. 不同品种、不同品种、2. 不同阶段、不同阶段、3. 不不 同饲料间产乳量有无差异。同饲料间产乳量有无差异。 1 E 300 A 320 B 390 C 390 D 380 2 D 420

41、 C 390 E 280 B 370 A 270 3 B 350 E 360 D 400 A 260 C 400 4 A 280 D 400 C 390 E 280 B 370 5 C 400 B 380 A 350 D 430 E 320 品种品种 阶阶 段段 注:注:A、B、C、D、E代表代表5种饲料种饲料 (SPSS操作:选择操作:选择三个固定因素主效应分析三个固定因素主效应分析)生物统计学第三讲方差分析 方差分析:假设方差分析:假设H0:1=5,分别表示对总体平均产乳量而言:分别表示对总体平均产乳量而言: 1. 5 种饲料间效果无差异;种饲料间效果无差异;2. 5 个阶段间无差异;个阶

42、段间无差异;3. 5 个品种间无个品种间无 差异。差异。 方差分析公式及计算结果如下表:方差分析公式及计算结果如下表: 变异原因变异原因 SS df MS=SS/df F 总总 的的 SST=( )2 n -1=24 - - =63224 饲料间饲料间 SS饲料 饲料=5( )2 n-1=4 12626. 000 MS饲料饲料/ MS误差误差=20. 608 =50504 品种间品种间 SS品种 品种=5( )2 n-1=4 806. 000 MS品种品种/ MS误差误差= 1. 316 =3224 阶段间阶段间 SS阶段 阶段=5( )2 n-1=4 536. 000 MS阶段阶段/ MS误

43、差误差= 0. 875 =2144 误误 差差 SS误差 误差=SST-SS饲料饲料-SS品种品种-SS阶段阶段 612. 667 - =7352 n -3n+2=12 xx ij xxi xxj xxm 生物统计学第三讲方差分析 统计分析结果的报告格式为:统计分析结果的报告格式为: 不同饲料组总体平均产乳量不都相同,不同饲料组总体平均产乳量不都相同,F=20.608,P0.05,不同阶段间,不同阶段间F=0.875、P0.05,差,差 异均无显著意义(不能说明相应各总体平均产乳量间有差异)。异均无显著意义(不能说明相应各总体平均产乳量间有差异)。 两两比较,对不同饲料用两两比较,对不同饲料用

44、LSD法,结果为:法,结果为: AB、AC、AD,P0.001;BE ,P=0.002; CE ,P0.001;DE ,P0. 05。因水平数为。因水平数为2,不需做两两比较。,不需做两两比较。 本例不考虑交互作用,所选择的试验方案及试验结果如下表。试分本例不考虑交互作用,所选择的试验方案及试验结果如下表。试分 别检验别检验5种维生素喂与不喂间,肉鸡增重是否有差异。种维生素喂与不喂间,肉鸡增重是否有差异。 试验号试验号 A B C D 5 6 E 增重增重(g) 1 1 1 1 1 1 1 1 162 2 1 1 1 2 2 2 2 172 3 1 2 2 1 1 2 2 168 4 1 2

45、2 2 2 1 1 190 5 2 1 2 1 2 1 2 178 6 2 1 2 2 1 2 1 215 7 2 2 1 1 2 2 1 162 8 2 2 1 2 1 1 2 182 注:注:A、B、C、D、E中中1:不喂;:不喂;2. 喂喂 方差分析:假设方差分析:假设H0:1=2分别分别 表示对总体平均增重而言,每个维生表示对总体平均增重而言,每个维生 素喂与不喂均无差异。素喂与不喂均无差异。 方差分析结果如下表(由方差分析结果如下表(由SPSS软软 件计算,公式略):件计算,公式略): 变异原因变异原因 SS df MS F P 总总 的的 2173. 875 7 A 间间 253.

46、 125 1 253. 125 6. 231 0. 130 B 间间 78. 125 1 78. 125 1. 923 0. 300 C 间间 666. 125 1 666. 125 16. 397 0. 056 D 间间 990. 125 1 990. 125 24. 372 0. 039 E 间间 105. 125 1 105. 125 2. 588 0. 249 误误 差差 81. 125 2 40. 625 (SPSS操作:选择操作:选择5固定因素主效应分析固定因素主效应分析) 生物统计学第三讲方差分析 正交设计的优点是:正交设计的优点是: 1. 与析因设计相比,在多因素、多水平条件下

47、,可大大减少试与析因设计相比,在多因素、多水平条件下,可大大减少试 验处理数(试验样品数)。例如上例中验处理数(试验样品数)。例如上例中5因素各因素各2水平全部组合即处水平全部组合即处 理有理有2 =32个,正交设计只做了其中有代表性的 个,正交设计只做了其中有代表性的 8个部分试验。个部分试验。 2. m个处理中各水平搭配具有均衡性,这种均衡性保证了个处理中各水平搭配具有均衡性,这种均衡性保证了m个个 部分处理试验对全部处理试验有较好的代表性。部分处理试验对全部处理试验有较好的代表性。 生物统计学第三讲方差分析 当方差分析中试验指标变量当方差分析中试验指标变量y受到某个指标受到某个指标x的影

48、响,而的影响,而 x 的影的影 响在方差分析统计设计中又难以控制时,可将对应试验指标响在方差分析统计设计中又难以控制时,可将对应试验指标 y 的的 x 值与值与 y 相对应同时记录下来,相对应同时记录下来,x 称为协变量。对带有协变量的方差称为协变量。对带有协变量的方差 分析资料,通过协方差分析,可以扣除掉协变量分析资料,通过协方差分析,可以扣除掉协变量 x 对对 y 的影响,即的影响,即 把对应不同把对应不同 x 值的各试验指标变量值的各试验指标变量 y 的值,统一校正到假定的值,统一校正到假定 x 值相值相 同的各同的各 y 值,然后再做相应的方差分析、两两比较,并计算各水平、值,然后再做

49、相应的方差分析、两两比较,并计算各水平、 处理下的校正的均值处理下的校正的均值 等统计量,以对试验结果的真实效应做出等统计量,以对试验结果的真实效应做出 客观的评价。客观的评价。 因协方差分析的原理、公式和计算都很复杂,故从略,并直接因协方差分析的原理、公式和计算都很复杂,故从略,并直接 给出给出 SPSS 统计软件计算的结果。统计软件计算的结果。 3. 7 协方差分析协方差分析 c y 生物统计学第三讲方差分析 一、完全随机设计单因素协方差分析一、完全随机设计单因素协方差分析 例例3. 7 4 种饲料种饲料 A1、A2、A3、A4 各喂各喂10头猪,受试猪的始头猪,受试猪的始 重重 x 及日增重及日增重 y 如下表。考虑到始重的不同对增重的影响会干扰如下表。考虑到始重的不同对增重的影响会干扰 对不同饲料增重效果的比较研究,故把始重做为协变量,对不同对不同饲料增重效果的比较研究,故把始重做为协变量,对不同 饲料增重效果间的比较做协方差分析。饲料增重效果间的比较做协方差分析。 36 0.89 28 0.64 28 0.55 32 0.52 30 0.80 27 0.81 33 0.62 27 0.58 26 0.74 27 0.73 26 0.5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论