[理学]第四章方差分析.ppt_第1页
[理学]第四章方差分析.ppt_第2页
[理学]第四章方差分析.ppt_第3页
[理学]第四章方差分析.ppt_第4页
[理学]第四章方差分析.ppt_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(5)多重比较 单因素方差分析检验所有总体均数相等的假设,即: 。当ANOVA呈显著性结果,拒绝原假设后,仅仅能说“在这R个总体均数中至少有两个总体均数不相等”,并不能说“这R个总体均数的每两两均不相等”。要探讨哪些处理平均数不等,就要进行均数的多重比较。 1、LSD检验。 由R.A.Fisher提出的最小显著性差异法(least significant difference method 简称Fisher LSD)是最早用于检验所有总体均数间两两相等假设的方法。,Fisher LSD检验统计量实际上与两独立样本 t 检验的公式相似:,表4-2 4个不同品种猪4个月的增重量(kg) 品 种 大白 沈白 沈黑 沈花 1 31.9 24.8 22.2 27.0 2 24.0 25.7 23.0 30.8 3 31.8 26.8 26.7 29.0 4 35.9 25.9 24.3 24.6 123.6 103.2 96.2 111.4 30.9 25.8 24.1 27.9,例:,例 按上例4个不同品种猪4个月的增重量。,查 t 值表,当误差自由度 时, 故,多重比较结果的表示有多种方法,最常用的方法是标记字母法。这种方法首先将全部平均数以大到小依次排列,然后在最大的平均数上标字母a,将该平均数与以下各平均数相比,凡相差不显著的( LSD)都标上字母a,直至某个与之相差显著,则标以字母b。 在以该标有b的平均数为标准,与各个比它大的平均数比较,凡差异不显著的在字母a的右边加标字母b。然后再以标b的最大平均数为标准与以下未曾标有字母的平均数比较,凡差异不显著的继续标以字母b,直至差异显著的平均数标以字母c,在与上面的平均数比较,如此重复,直至最小的平均数有了标记字母,并与上面的平均数比较后为止。,表1 不同品种间4个月增重量差异显著表 平均数 差 异 显 著 性 大白 30.9 a A 沈花 27.9 ab AB 沈白 25.8 b AB 沈黑 24.1 b B,多重比较还可以用梯形比较法(见下表)。这种方法是将各处理的平均数差数按梯形列于表中,并将这些差数和LSD值比较。,表2 不同品种间4个月增重量差异显著表 平均数 差 异 显 著 性 大白 30.9 6.8* 5.1* 3.0 沈花 27.9 3.8 2.1 沈白 25.8 1.7 沈黑 24.1,注意:尽管LSD在公式的外观上与两样本 t 公式相似,但有两点本质性的区别。 (1)在计算均数差值的标准误差时,是用方差分析中获得误均方 估计,不同与两样本 t 检验仅用两组数据计算标准误;,(2)同样都利用 t 分布临界表,该检验所用的自由度为误差均方的自由度,而不是被比较的两个均数所确定的自由度。 LSD检验的特点: (1)此方法实质上是 t 检验,这样会提高犯第一类错误的概率。 (2)t 检验是适用于检验两个相互独立的样本平均数,因此各被比较的两样本平均数在实验前已经指定,比如各试验处理与对照的比较。 (3)相比其他方法,这种方法较容易发现均值间的差异。,2、最小显著极差法(LSR法) (1)Duncan法 具体步骤如下: 按相比较的样本容易计算平均数标准误: 将均数按其数值大小顺序排位,得到各均数间的跨距,由跨距和 所具有自由度 查新复极差检验 值表得到 值。 算出最小显著极差值:,本例:,表3 不同品种4个月增重量试验LSR值(Duncan) M 2 3 4 3.08 3.22 3.31 4.32 4.50 4.62 4.65 4.88 5.00 6.52 6.79 6.97,用上表的LSR值可进行不同M跨距的平均数间差异显著性的检验。 如:大白与沈黑,M=4,极差=6.85.00,P0.05 差异不显著。,(2)q检验,q检验法又称 student-Newman-Keuls (SNK)检验。 其方法与Duncan法类似,其区别仅在于计算最小显著极差 时不是查 ,而是查 值。,表4 不同品种4个月增重量试验LSR值(q法) M 2 3 4 3.08 3.77 4.20 4.32 5.04 5.50 4.65 5.69 6.34 6.52 7.61 8.30,3、三种方法的比较,表5 猪品种4个月增重量差异显著性比较表(Duncan法) 平均数 差 异 显 著 性 大白 30.9 a A 沈花 27.9 ab A 沈白 25.8 b A 沈黑 24.1 b A,表6 猪品种4个月增重量差异显著性比较表(q检验) 平均数 差 异 显 著 性 大白 30.9 a A 沈花 27.9 ab A 沈白 25.8 ab A 沈黑 24.1 b A,表7 不同品种4个月增重量差异显著表(LSD检验) 平均数 差 异 显 著 性 大白 30.9 a A 沈花 27.9 ab AB 沈白 25.8 b AB 沈黑 24.1 b B,根据上述检验计算,可以看到在跨距M=2时,LSD法,SSR法和q检验的显著尺度是相同的。当 时,三种检验的显著尺度便不相同,LSD最低,SSR法次之,q检验法最高。因此,对于精度要求高的试验应用q检验,一般试验可用SSR法。,4、Tukey HSD检验 该检验公式与Fisher LSD检验公式完全相同只是检验的临界值选择过程略有不同。整体方差分析中被比较均数的个数(k)参与该检验临界值的决定。而且所产生的临界值作为所有多重均数比较的临界值。该多重检验重于控制型误差,故有较高的类错误率( )。,Tukey HSD检验步骤如下: (1)查学生化极差临界值。(critical value of studentized range) 本例 设定,(2)计算最小显著性差异值 。,(3)用各组均数的差值 与 比较。 则i与j处理均数差异显著。,5、四种多种比较检验的临界水平与均数间跨距的关系示意。,5 4 3 2 1 0,2 3 4 5 6 7 8 9 10,临界值,均数间跨度,图1 四种多种比较检验的临界水平与均数间跨距的关系示意,均数间的多重比较,SAS系统提供了14种不同的多重比较检验的方法,各种比较检验的差别在于如何控制实验误差率(EER)。某些方法是从整体上控制实验误差率,而另一些方法只是将实验误差率控制在较小的范围内。之所以出现不同的多种比较方法,实际上是在I型错误和II型错误概率之间权衡利弊,因为控制EER越严格,显著性检验的效能越低。,不同多重比较的显著性检验方法焦点在于以下三个方面的权衡: 1)最大化的利用实际数据所提供的信息; 2)控制实验误差率; 3) 获得高的检验效能。,(二)组内观测次数不相等的方差分析 有时由于实验条件的限制,不同处理的观测次数不同,k个处理的观测次数依次是 的单因素分组资料,上面所述的方差分析方法仍然可用,但由于总观测次 数不是kn,而是 次,在计算平方和时公式稍有改变(表8)。,表8 组内观测次数不相等的方差分析 变异来源 处理间 处理内 总变异,在多重比较时,首先应计算平均数的标准误。由于各组内观测次数不等,无法直接套用式6.18和6.19,需先算得各 得平均数 :,然后有 。,例 用某种小麦种子进行切胚乳试验,试验分为三种处理:整粒小麦(),切去一半胚乳(),切去全部胚乳(),同期播种于条件较一致得花盆内,出苗后每盆选留两株,成熟后进行单株考种,每株粒重结果如表9,试进行方差分析。,表9 小麦切胚乳试验单株粒重(g) 株 号 1 2 3 4 5 6 7 8 9 10 21 29 24 22 25 30 27 26 204 25.5 20 25 25 23 29 31 24 26 20 21 244 24.4 24 22 28 25 21 26 146 24.3,方差分析步骤如下: (1)平方和计算:,(2)列方差分析表: 表10 小麦切胚乳试验方差分析表,变异来源 处理间 2 6.8 3.4 0.318 处理内 21 233.7 10.7 总变异 23 230.5,从上表结果可知,F1,表明三种处理的每株粒重无显著差异。 由于F检验不显著,不需要在作多重比较。如果F检验显著,则需要进一步计算 ,并求得 (用于 检验)或 (用于 检验),即:,最后必须指出,不等观测次数的试验要尽量避免,因为这样的试验数据不仅计算麻烦,而且也降低了分析的灵敏度。,第三节 二因素方差分析 在实际工作中经常会遇到两种因素共同影响试验结果的情况。例如,为了研究某种昆虫滞育的情况,同时选用几种温度(因素A)和光照时间(因素B)进行室内培养,每一观测值都是某一特定温度与光照条件共同作用的结果。在二因素试验中,当二因素都是固定因素时称为固定模型;二因素均为随机因素时,称为随机模型;一个因素是固定因素另一个因素是随机因素时,称为混合模型。在计算方法上三种模型类似,但在对待检验及结果解释时却不同。,一、无重复观测值的二因素方差分析 依据经验或专业知识,判断二因素无交互作用时,每个处理可只设一个观测值,即假定A因素有a个水平,B因素有b个水平,每个处理组合只有一个观测值。这种无重复观测值的二因素分组资料模式如下表1。,表1 无重复观测值的二因素方差分析,平方和的分解为:,与平方和相应的自由度分解为:,各项的方差分别为:,将以上结果及期望方差列入方差分析表2中。,表2 无重复观测值的二因素方差分析 变异来源 因素 因素 误 差 总变异,例: 将一种生长激素配成 五种浓度,并用 三种时间浸渍某大豆品种的种子,出苗45天后的各处理每一植株的平均干物种(g)(表3)。试作方差分析与多重比较。,表3 激素处理对大豆干物重的影响 时 间( ) 13 14 14 41 13.67 12 12 13 37 12.33 3 3 3 9 3.00 10 9 10 29 9.67 2 5 4 11 3.67 40 43 44 127 8.0 8.6 8.8 8.47,本例的研究目的是了解激素和时间的效应,故 和 均为固定因素,适应于固定模型。方差分析如下: (1)平方和计算:,(2)自由度计算,(3)列方差分析表(表4),并进行 检验:,表4 激素处理对大豆干物重影响的方差分析 变异来源 浓度间(A) 4 289.06 72.27 116.56* 3.84 7.01 时间间(B) 2 1.73 0.87 1.40 4.46 8.65 误 差 8 4.94 0.62 总变异 14 295.73,检验结果表明,浓度间的 值大于 ,时间间的 值未达到显著水平,表明不同激素浓度对大豆干物重有极显著差异。 (4)进行多重比较(用 检验):由于只有浓度间的效应达到了极显著差异,时间间的效应未达到显著水平,只需对5种浸渍浓度进行多重比较,可计算出浓度间的平均数标准误均为:,(这里需注意:上式的b=3使每一浓度的观测值数目,如果要比较时间间的效应,则由于每一时间有a=5个观 测值,其平均数的标准误应为 。) 查表,当 时的 值及由此计算的 值列于表5,多重比较结果列于表6中。,表5 不同浓度大豆干物重多种比较 和 值,2 3 4 5 3.26 3.40 3.48 3.52 4.75 4.94 5.06 5.14 1.48 1.55 1.58 1.60 2.16 2.25 2.30 2.34,表6 不同浓度大豆干物重平均数间差异显著性检验,平均数 差异显著性 13.67 12.33 9.67 3.67 3.00,多重比较结果表明:5种生长激素对大豆干物重的影响有着极显著的差异,除 与 、 与 只见差异不显著外,其他浓度之间的大豆干物重均达到极显著差异。5种激素浓度中,以 和 的处理效果较好。 二、具有重复观测值的二因素方差分析 以上调查资料是两个因素的作用结果,所估计的误差实际上是这两个因素的相互作用,这是在两个因素不存在互作,或者互作很小的情况下进行估计的。但是,如果存在两个因素的互作,方差分析中就不能用互作来估计误差,必须在有重复观测值的情况下对试验误差进行估计。具有重复观测值的二因素试验的典型设计是:假定A因素有a水平,B因素有b水平,则每一次重复都包括ab两次实验,设实验重复n次,资料模式如表7。,表7 具有重复观测值的二因素分组资料 因 素 B,二因素具有重复观测值的方差分析可用下面线性模型来描述: 上式中, 表示A因素第i水平,B因素第j水平和第k次重复的观测值(其中 ); 为总平均值; 是A因素第i水平的效应, 是B因素第j水平的效应, 是 和 的交互作用,且有 是 随机误差,彼此独立且 服从 。 因试验共有n次重复,试验的总次数为abn次。方差分析步骤和前面介绍得像类似,唯一不同的是F检验的方法。,平方和的分解:,自由度的分解为:,各项方差分别为:,F检验: 固定模型:在固定模型中, , 及 均为固定效应。在F检验时,A因素、B因素和AB互作项均以 作为分母。,例 为了研究某种昆虫滞育期长短与环境的关系,在给定的温度和光照条件下在实验室培养,每一处理记录4只昆虫的滞育天数,结果列于表8中,试对该资料进行方差分析。,表8 不同温度及光照条件下某种昆虫滞育天数 温 度 (B) 25 30 35 143 101 89 138 100 93 120 80 101 107 83 76 96 79 63 103 61 76 78 83 61 91 59 67 79 60 67 83 71 58 96 78 71 98 64 83,本例中,由于温度和光照条件都是人为控制的,为固定因素,可依固定模型分析。将上表数字均减去80,并整理于表9。 平方和与自由度的分解:,表9 某昆虫滞育天数方差分析计算表 温 度(B) 25 30 35 1 63 21 9 2 58 20 13 3 40 0 21 271 4 27 3 -4 188 44 39 1 16 -1 0 2 23 -19 -4 3 -2 3 -19 -26 4 11 -21 -13 48 -38 -36 1 -1 -20 -13 2 3 -9 -22 3 16 -2 -9 -52 4 18 -16 3 36 -47 -41 272 -41 -38,将以上结果列入方差分析表(表10)。从表10可以看出,不同光照和温度间的差异极显著,即昆虫滞育期长短主要决定于光照和温度,而与两者之间的互作关系不大。,表10 某昆虫滞育天数方差分析表 变异来源 光照间 2 5367.03 2683.52 21.94* * 3.35 5.49 温度间 2 5391.06 2695.53 22.03* * 3.35 5.49 关照温度 4 464.94 116.24 0.95 2.73 4.11 误 差 27 3303.25 122.34 总变异 35 14526.31,要了解各种光照时间及温度对滞育期的影响,需进行不同光照间及不同温度间的多重比较,其方法可参照前面例子进行,但平均数标准误的计算为:光照 (A)间平均数标准误 ,温度(B)间平均数 标准误 。,第四节 方差分析的基本假定和数据转换 一、方差分析的基本假定 方差分析有效性的条件 1.正态性 试验误差应当是服从正态分布的独立的随机变量。因为方差分析只能估计随即误差,顺序排列或顺序取样资料不能作方差分析。 2.可加性 处理效应与误差效应应该是可加的,并服从方差分析的数学模型,即 ,这样才能将实验的总变异分解为各种原因所引起的变异,以确定各变异在总变异中所占的比例,可加性是否显著有专门的统计方法。,3.方差同质性 所有试验的误差方差应具备同质性,也叫方差的齐性,即 。误差异质将使假设检验中某些处理效应得出不正确的结果。 二、数据转换 在生物学中有时会遇到一些样本,其所来自的总体和上面提到的方差分析基本假定相抵触。样本的非正态性、不可加性和方差的异质性通常连带出现。 (一)平方根转换 有些生物学观测数据为波松分布而非正态分布,比如一定面积上某种杂草株数或昆虫头数等,样本平均数与其方差 有比例关系,采用平方根转换可获得同质的方差。一般将原观测值转换成 ,数据较小时采用 。,例如下表,从直观上看, 、 和 、 及 间的数据相差太大,方差同质性是不成立的。,表1 燕麦田中某种杂草的株数 处 理 1 438 538 77 17 18 2 442 422 61 31 26 3 319 377 151 87 77 4 380 315 52 16 20 395 413 87 38 35,表2 燕麦田中某种杂草株数的平方根 处 理 1 20.9 23.2 8.8 4.1 4.2 2 21.0 20.5 7.8 5.6 5.1 3 17.9 19.4 12.3 9.3 8.8 4 19.5 17.7 7.2 4.0 4.5 19.8 20.2 9.0 5.8 5.7,(二)对数转换 如果已知资料中的效应成比列而不是可加的,或者标准差(或极差)与平均数大体成比例时,可以使用对数变换。,以下数据是在5次三个相继的夜里捕获昆虫的几何平均数。,表3 捕获昆虫统计及捕获数的对数值 捕蛾

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论