方差分析解读课件_第1页
方差分析解读课件_第2页
方差分析解读课件_第3页
方差分析解读课件_第4页
方差分析解读课件_第5页
已阅读5页,还剩147页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

方差分析(续)方差分析(续)1第四节两因素资料的方差分析方差分析解读课件2两因素资料的方差分析,又称为双向分组资料的方差分析很多情况下,我们需要设计两种不同的因素同时作用于供试动物或在考虑某一因素对供试动物产生影响的同时,还需要考虑不同的环境情况这样,当试验结束后,数据的分析就必须进行两因素(或称双向分类资料)的方差分析同时考虑的这两个因素,我们分别称之为因素A和因素B,他们各有a个水平和b个水平两因素资料的方差分析,又称为双向分组资料的方差分析3有时候,因素A和因素B是同等重要的有时候,因素B是为了从总变异中分剖出环境因素而特意设置的在设计时,因素A和因素B相互交叉,形成ab个组合即:A因素的每一个水平包含了B因素的所有水平B因素的每一个水平也包含了A因素的所有水平即:A因素的各个水平与B因素的各个水平相逢一次,也只相逢一次例如:A因素有5个水平,B因素有4个水平,形成5×4=20个组合有时候,因素A和因素B是同等重要的4根据每一个组合内是一个独立供试动物还是多个独立供试动物,双向分类资料又可分为组合内无重复观测值和组合内有重复观测值两种情况根据每一个组合内是一个独立供试动物还是多个独立供试动物,双向5一、组合内无重复观测值的两向分类资料的方差分析这种类型的资料结构是每一组合内仅一个独立供试动物(独立供试单位)其观测值的数学模型为:这一模型的含义是:每一个观测值包含了总体平均值,同时还受A因素第个水平的效应和B因素第个水平的效应,同时还具有一定的误差:一、组合内无重复观测值的两向分类资料的方差分析6这一模型相应的数据结构为:因素

……T

:TT

这一模型相应的数据结构为:7上页的数据结构表中,T为求和,不同因素的和的下标不同两因素无重复资料的方差分析应从A和B两个方向进行,我们可以将这种结构看成是两个单向资料的重合即:对A因素来说,有a

个组(k=a),每一组有b

个观测值(n=b)对B因素来说,有b

个组(k=b),每一个组有a个观测值(n=a)因此我们可以直接用方差分析表来表示这种分剖的结果这里,无效假设有两个:上页的数据结构表中,T为求和,不同因素的和的下标不同8A:设不全相等B:设不全相等方差分析表变异来源

A因素B因素误差

TA:设9若显著,应对A因素各水平的平均值进行多重比较,其标准误为:若显著,应对B因素各水平的平均值进行多重比较,其标准误为:下面我们以实例来说明具体分析的过程试验4种药物配伍(因素A)对鲢鱼腐皮病的治疗效果,试验在5个发病的渔场(因素B)进行,每个渔场随机抽取4个鱼池,每个鱼池随机使用其中的一种药物配伍,得如下治愈率,试比较这4种药物配伍的治疗效果若显著,应对A因素各水平的平均值进行多重比较,其标10药物渔场配伍

7682837977838992878473778072808182798587由于数据是百分率,因此应作转换:转换后的数据见下面这张表(为了分析方便,所有数据转换后都扩大100倍):药物渔11药物鱼场配伍

106113115109107115123128120116102107111101111112113109117120药物鱼场12得如下一级数据:药物渔场配伍

55060560110.03.8760272594120.45.3253256696106.44.7757165283114.24.324354564634474542255255133

得如下一级数据:13设不全相等设不全相等设14将上述数据填入方差分析表中:方差分析表变异来源药物间3542.55180.859.57**3.495.95渔场间4112.5028.1251.493.26误差12226.7018.892

T19881.75对于A因素,应否定无效假设,即不同的药物配伍其治疗鲢鱼腐皮病的疗效差异极显著(p<0.01)B因素即渔场间应接受无效假设,即场间差异不显著(p>0.05)将上述数据填入方差分析表中:15由于药物配伍间差异极显著(p<0.01),因此应对其作多重比较而鱼场间差异不显著,没有必要进行多重比较(场间差异也不是我们讨论的重点,因此即使差异显著也不必进行多重比较)

2340.050.013.083.774.20120.4aA4.325.055.50114.2bAB5.997.338.17110.0bcB8.409.8210.69106.4cB由于药物配伍间差异极显著(p<0.01),因此应对其作多重比16作平均数比较图:在作图前,应将各平均值数据转换回原百分率其反转换公式:

110.0120.4106.4114.279.4%87.1%76.4%82.7%90858075

图1不同药物配伍鲢鱼腐皮病治疗效果比较(下面的注略)作平均数比较图:17在无重复的两因素资料中,B因素往往是作为区组使用的,如渔场、鱼池、地域等,由于在水产统计学中一般不作渔场等的比较,因此,即使B因素显著或极显著,也不对其作多重比较,只有当研究场间差异时才对此作多重比较在试验和统计中设置区组,其作用是消除系统误差,即当我们怀疑不同的区组(渔场等)存在系统误差,或将一个试验有意识地分散在不同的地域、以检验试验内容是否可以适应不同的地域时一般可以设置区组:在无重复的两因素资料中,B因素往往是作为区组使用的,如渔场18一是通过区组消除系统误差二是检验试验内容是否具有广泛的适应性当B因素的F

值小于1(即表示区组基本不具有系统误差)、而A因素还未达到显著水平时,还应当将B因素的平方和、自由度合并到误差项中去,得到一个新的误差项均方,以降低误差项的均方值,同时增大误差项的自由度,使得A因素比较容易地达到显著水平这种情况由于消除了B因素,其实就变成了单因素(仅考虑A因素)资料的方差分析了一是通过区组消除系统误差19当B因素的F值稍大于1(亦表示基本没有系统误差)是否需要将其合并到误差项中去,这需要根据具体情况而定:凡能帮助A因素较易达到显著或极显著水平的,就应当合并;反之,就不合并A因素是我们所要研究的对象,B因素的设置只是为了消除系统误差,因此B因素就没有A因素来得重要,两者的地位是不等的,但在方差分析中,我们还是应当将其作为一个因素来考虑当B因素的F值稍大于1(亦表示基本没有系统误差)是20在考虑B因素的设置时,一定要注意B因素不能和A因素之间产生相互作用(简称为互作),否则这种互作就会存在于误差项中而析不出来因此B因素一般只能是地域、时间等非试验因子,而不能是可能成为试验的条件如果在试验前无法判断所设置的B因素是否会与A因素存在互作,那么就应当用下面的方式进行试验在考虑B因素的设置时,一定要注意B因素不能和A因素21二、组合内有重复观测值的两因子资料的方差分析当A、B两个因子都是试验所考察的因子,即在一个试验中同时安排了两个因子,这两个因子之间有可能存在互作,或怀疑其间存在互作,我们就应当在每个组合内安排2个或以上的独立供试单位(或独立供试动物)这样的试验所得到的数据就是组合内有重复观测值的资料设A因素有a个水平,B因素有b个水平,共有ab个组合,每一个组合内有n(n>1)个观测值,整批资料共有abn个数据二、组合内有重复观测值的两因子资料的方差分析22这种类型资料的数学模型为:数据结构见本书P104表7.3(请参看)任一观测值包含了总体效应,A因子第个水平的效应,B因子第个水平的效应,A因子和B因子第、个互作效应,及随机误差,随机误差这一类资料的方差分析表为:这种类型资料的数学模型为:23方差分析表变异自由度平方和均方F值来源

Aa-1Bb-1A×B(a-1)(b-1)eab(n-1)T

abn-1方差分析表24在这种类型资料的方差分析中,人们的注意力和兴趣往往集中于互作的检验上一般首先完成互作的F

检验,如果互作部分的F

检验显著,可不再进行A因子、B因子的检验(当然习惯上我们还是同时完成A因子、B因子的检验),而对组合进行多重比较因为互作的重要性要远大于单个因子的重要性,它所提供的信息量比单个因子要丰富得多因此,一般的试验应当同时考察两个因子在这种类型资料的方差分析中,人们的注意力和兴趣往往集中于互作25一个试验同时考察两个因子,一是可以节省时间和财力,二是可以考察因子之间的关系,这种关系在单个因子的试验中是考察不到的当互作不显著,则分别检验A因子和B因子是否显著,哪个因子显著,就对哪个因子进行多重比较两个因子都显著,两个因子都应当作多重比较一个试验同时考察两个因子,一是可以节省时间和财力,二是可以考26考察两个因子的试验中,什麽时候在组合内设置重复?一是当我们确认试验所设置的A因子和B因子间的确存在互作,我们为了检验这种互作二是当我们无法肯定A、B因子之间是否存在互作,我们为了发现这种互作,必须设置重复三是为了防止可能存在的互作混杂到误差项中去而无谓地扩大误差,因此必须设置重复下面我们用实例来说明这一类型资料的方差分析考察两个因子的试验中,什麽时候在组合内设置重复?27试验目的:作饲料增重试验,同时考察蛋白质(因子A)和磷(因子B)的影响A因子:高、中、低三种水平(a=3)::高含量:中含量:低含量B因子:二种形态(b=2)::有机磷:无机磷每个组合内有4个重复(n=4):4水箱一龄青鱼(每箱青鱼的尾数相等)观测指标:试验期内的增重量试验所得数据结构见下表试验目的:作饲料增重试验,同时考察蛋白质(因子A)和磷(因28磷蛋白质形态

9.628.686.157.864.935.599.319.977.387.056.105.46=37.58=28.44=22.0888.107.746.856.305.813.332.856.346.096.546.633.603.19=27.02=25.28=12.9765.2764.6053.7235.05=153.37

磷蛋白29这是一张二维的数据表在计算一级数据时,应从最小单位开始,即首先计算组合的和,然后计算A和B因子各水平的和,最后计算总和在逐段计算各类和的时候,不要忘记同时计算平方和、平均数做好上述准备工作后,即进行校正值、各类平方和及自由度的计算:这是一张二维的数据表30各平方和:各平方和:31各自由度:各自由度:32蛋白质A:设不全相等磷形态B:设A×B:设不全相等方差分析表变异来源蛋白质(A)55.8394227.919792.48**

磷形态(B)21.7170121.717071.93**A×B3.844421.92226.38**误差5.4343180.3019T86.835123蛋白质A:设33三个无效假设均否定,接受三个备择假设,即蛋白质的量、磷形态、蛋白质量与磷形态间的互作,差异均达极显著水平这里,仅需对互作进行多重比较即可三个无效假设均否定,接受三个备择假设,即蛋白质的量、磷形态、34多重比较:

234562.973.614.004.284.494.074.705.055.385.600.820.991.101.181.231.121.291.391.481.54(同学们先自行完成这一多重比较)多重比较:35将各组合的平均值按从大到小的次序排列:组合0.050.019.40aA7.11bB6.76bBC6.32bcBC5.52cC3.24dD

(请同学们自行完成平均数表的设置)将各组合的平均值按从大到小的次序排列:36课堂练习:今有一个试验,其数据分析为F值极显著,请对资料的6个平均值进行多重比较:

R23456LSR0.050.820.991.101.181.23LSR0.011.121.291.391.481.54平均值:1:6.482:6.323:7.954:4.505:5.526:7.11课堂练习:今有一个试验,其数据分析为F值极显著,请对资料37这里我们介绍的是组合内的数据量是一样多的情况当组合内数据量不一样多时,可采用以下两种方法进行方差分析:1、将每一组合内的数据截取为一样多例如,有的组合是5个数据,有的为7个数据,最少的为3个,则可将所有组合均截为3个数据(取每一组合的平均值周围的数据)进行方差分析2、使用最小二乘方差分析法进行目前使用的统计软件均为最小二乘方差分析法,这一方法可不考虑组合内样本量的多少,甚至某一组合内为0都可以进行方差分析这里我们介绍的是组合内的数据量是一样多的情况38第五节系统分组资料的方差分析方差分析解读课件39系统分组设计,又称为巢式设计、树状设计、多因子嵌套设计其英文名称为:nesteddesign假设有A、B两个因子,这两个因子的搭配组成不再是上一节的交叉构成,而是B因子嵌套在A因子内,即B因子为次级因子:A因子的某一个水平包含了B因子部分水平A因子的另一个水平包含了B因子的另一部分水平即:B因子的水平仅从属于A因子的一个水平而A因子的水平并不包含B因子的所有水平系统分组设计,又称为巢式设计、树状设计、多因子嵌套设计40如果有第三个因子C,则C因子嵌套在B因子内如果有第四个因子D,则D因子嵌套在C因子内以此类推其数据结构呈现树状结构如行政区划,就是典型的系统结构:国家包含若干个省(A)、一个省(A)包含若干个市(B)、一个市(B)包含若干个县(C)、一个县(C)包含若干个镇(D)、一个镇(D)包含若干个村(E)再如:畜牧生产中:一头公畜(A)交配若干头母畜、一头母畜(B)生产若干头仔畜、每头仔畜(C)有若干次生产成绩如果有第三个因子C,则C因子嵌套在B因子内41在这种数据结构中,各因子的重要性是不完全相等的,下一级因子的重要性往往低于上一级因子

A1…Ai…AaB11B12…B1bBi1Bi2…Bib…Ba1Ba2…Bab

C111C112…C11c

…Ca11Ca12…Ca1c

A因子称为一级因子,B因子称为二级因子,…因子之间是一种从属关系,而非上一节A、B因子的交叉构成中所讨论的那种平行关系在这种数据结构中,各因子的重要性是不完全相等的,下一级因子42下面我们写出两因子系统分组资料的数据结构:A因子B因子观测值B因子和A因子和T

A1B11x111x112…x11.B12x121x122…x12.…x1..A2B21x211x212…x21.B22x221x222…x22.……x2..AiBi1xi11xi12…xi1.

Bi2xi21xi22…xi2.……xi..ApBp1xp11xp12…xp1.

Bp2xp21xp22…

xp2.…xp..x…下面我们写出两因子系统分组资料的数据结构:43根据这一数据结构我们可以写出其数学模型:式中,μ为总体平均αi为A因子第i个水平的效应βij为A因子第i个水平下的B因子第j个水平的效应εijk为随机误差,且p为A因子的水平数;qi为第i个A因子水平下B因子的水平数;nij为第i个A水平中第j个B水平中的观测值根据这一数据结构我们可以写出其数学模型:44下面我们先介绍两个概念:固定因子(fixedfactor):如果一个试验中,某一因子的水平是我们有目的地挑选的,因而我们只是希望将这几个水平进行比较,也只是希望知道这几个水平的差异,并不将分析结果引申到其他水平,这样的因子就是固定因子,固定因子的水平所产生的效应就是固定效应(fixedeffect)下面我们先介绍两个概念:45随机因子(randomfactor):如果一个因子的各个水平是从这因子的所有水平中随机挑选出来的,我们的试验目的是希望通过这几个水平的差异情况了解整个因子的变异情况,即对这一因子的方差进行检验和估计,从而知道这一因子的方差组分,这样的因子就是随机因子,随机因子的各个水平所产生的效应就是随机效应(randomeffect)随机因子(randomfactor):46在数学模型中:如果A、B两个因子所产生的效应都是固定效应,这样的数学模型就是固定效应模型(简称固定模型

fixedmodel),我们的检验目的是希望比较这一因子各参与试验的水平之间的差异固定模型中,我们总假定:在数学模型47如果A、B两因子所产生的效应都是随机效应,这样的数学模型就是随机模型(randommodel),我们的检验目的是希望知道每个因子的不同水平效应的方差σα2和σβ2是否为0两因子各个水平的效应之间相互独立A因子和B因子效应之间也相互独立且:如果A、B两因子所产生的效应都是随机效应,这样的数学模型48如果两个因子,一个为固定因子(如A因子),另一个为随机因子(如B因子),由这样的两个因子组成的数学模型即为混合模型(mixedmodel),我们的检验目的是:A因子各水平之间是否存在差异B因子不同水平效应的方差σβ2是否为0这时:且不同的βij彼此独立如果两个因子,一个为固定因子(如A因子),另一个为随机因49我们在上一节讨论的两因子(A、B因子)交叉分组资料也有固定模型、随机模型、混合模型之分,但在一般情况下,这种分组资料更多的是固定模型,因此其方差分析方法是固定效应的分析而系统分组资料则三种模型都有系统分组资料常见于数量遗传学、动物育种学中此时我们往往希望通过方差组分的计算估计遗传参数,从而进行数量遗传学的研究但系统分组资料进行固定效应的估计也是常见的我们在上一节讨论的两因子(A、B因子)交叉分组资料也有固定模50下面我们给出平方和与自由度的剖分公式:每一观测值的总离均差平方为:等式两边求和(各乘积项的和均为0)

上式中,右手第二项称为A因子内B因子水平间SS

下面我们给出平方和与自由度的剖分公式:51

为A因子第

i

个水平中的观测值个数上一页的仅为推导的理论公式在实际计算时,我们使用以下公式(从理论公式如何到下面的实际计算公式,同学们应当很清楚了)校正值:总平方和:A因子平方和:B因子平方和:为A因子第i个水平中的观52A因子内B因子水平间平方和:误差平方和:相应的自由度:相应的均方:A因子内B因子水平间平方和:53根据试验的要求不同,次级及次级内观测值可分为重复数相等和不等两种情况下面我们以例题来说明具体的分析方法一、次级样本含量相等的系统分组资料例1:对鲤鱼进行选育,考察4个鲤鱼品种B,每个品种选择2个家系F,每个家系考察3尾雌性亲鱼的平均后代增重xijk,得数据如下表(数据已经过了简化)根据试验的要求不同,次级及次级内观测值可分为重复数相等和不等54BFxijkFBFSSFBB后代增重后代后代和平均和平均112.22.32.036.514.132.1722.02.12.3366.413.702.1312.92.15231.61.51.734.87.701.6041.82.01.7365.510.131.8310.31.723

52.62.52.237.317.852.43

62.42.42.2367.016.362.3314.32.38471.81.51.735.08.381.6781.51.61.4364.56.771.509.51.58242447.095.0247

BFxijk55上表中,p=4,q=2,n=3N=24校正值C=92.0417SST=(2.22+2.32+….1.42)-C=95.02-C=2.9783SSB=(12.92+…+9.52)/6-C=94.54-C=2.4983(一级样本间)SSF(B)=(6.52+…+4.52)/3-(12.92+…+9.52)/6=94.68-94.54=0.14(二级样本间)SSe=SST–SSS-SSD(S)=2.9783-2.4983-0.14=0.34上表中,p=4,q=2,n=3N=2456自由度:dfT=4×2×3–1=23dfB=4–1=3dfF(B)=4×(2-1)=4dfe=4×2×(3-1)=16将平方和及自由度填入方差分析表中,并计算各均方和F

值:自由度:57方差分析表:变异来源SSdfMSFF0.05F0.01品种间B2.498330.832823.79**6.5916.69(公猪内)家系间F0.1440.0351.643.01误差e0.34160.02125T2.978323

上述计算中,方差分析表:58即:两个不同级别的F值均由下一级的MS作为比较标准,而不再是统一由误差项均方作为比较标准而查Fα所用的自由度也应作相应的变动,即:FB的自由度分别为df1=3,df2=4FF的自由度分别为df1=4,df2=16由于不同品种间的增重差异极显著,而家系间差异不显著,因此,应对品种(一级样本)作多重比较:即:两个不同级别的F值均由下一级的MS作为比较标准,59

R234品种0.050.01q0.053.935.005.7632.38aAq0.016.518.129.1712.15aABLSR0.050.300.380.4421.72bBLSR0.010.500.620.7041.58bB如果家系间差异亦显著,则应当对家系进行多重比较,比较时的标准误以误差项均方为分子,每个家系的样本量为分母进行计算查q表时用误差项自由度本例中,我们将品种、家系均作为固定因子处理,因此其模型为固定模型R2360如果是估计遗传参数,则品种、家系均为随机因子,则模型为随机模型当然也可以将品种作为随机因子,家系作为固定因子处理,则模型为混合模型处理实际数据资料时,样本量肯定要大得多,本例仅是一个说明统计方法的例子而已如果是估计遗传参数,则品种、家系均为随机因子,则模型为随机模61二、次级样本含量不等的系统分组资料我们还以例子来说明统计方法调查3个县的渔业情况,各县抽取若干个乡镇,每个乡镇抽取若干个调查样点,得渔业产值(为了方便计算,数据已经过简化)如下,试进行分析二、次级样本含量不等的系统分组资料62县别乡别各样点观测值乡样县样乡和平方和乡平均县和县平均一级二级点数点数

AB

nijni.TijxijTixi

12119211820599196719.81216181835290417.331819201841275140918.7522618.8324161416131514688129814.751716151741065105916.2515315.3061518161715581131916.23716141715151369013601581718183145393717.722416.0363660310253603将原始数据整理成表,并计算右边的一级数据,与左边连成一个表县别乡别各样点观测值乡样县样乡和63此例中:p=3为一级样本数q1

=3,q2

=2,q3

=3为二级样本数n11

=5,n12

=3,…,n33

=3得:n1

=12,n2

=10,n3

=14

校正值C=10100.25

此例中:p=3为一级样本数64设立无效假设(此处略,该如何设立?)建立方差分析表变异来源SSdfMSFF0.05F0.01县别间A80.98240.496.33*5.7913.27乡别间B32.0056.404.51**2.563.76误差39.77281.42T152.7535其中:设立无效假设(此处略,该如何设立?)65由于县、乡两级分别为显著、极显著,因此应分别作多重比较首先对县进行多重比较,各县的样本量不等,因此先求k1:然后求SE:

R

23

q0.053.614.54

q0.015.706.97

LSR0.052.653.33

LSR0.014.185.11由于县、乡两级分别为显著、极显著,因此应分别作多重比较66县别0.050.01118.83aA316.0bA215.30bA

对乡别进行多重比较:首先求k2:然后求SE:

县别0.050.0167

R2345678

q0.052.903.493.864.134.324.484.62

q0.013.914.484.845.095.285.445.58LSR0.051.672.002.212.372.472.572.65LSR0.012.242.572.772.923.023.123.20R2368多重比较表:乡别0.050.01119.8aA318.75abAB817.67bcABC217.30bcABC516.25cdBC616.20cdBC715.00dC414.67dC请同学们自行作两个平均值表或平均值图多重比较表:69可能大家都注意到了:在上面两个例子中我们并没有用到随机因子和固定因子这两个概念,这是因为我们这里仅仅进行了普通的方差分析,而没有涉及到遗传参数的分析,因此这里的因子都是固定因子,其所涉及的数学模型就都是固定模型在第一例中如果我们需要分析公猪和母猪在后代增重这一性状方面的遗传参数,就要将其作为随机模型或混合模型,从而计算方差组分,进而估计遗传参数可能大家都注意到了:70思考与习题:1、试验不同的饼类饲料的养鱼效果,得如下数据,试作方差分析:豆饼菜饼棉饼花生饼湖泊5.44.83.74.5

水库5.55.04.14.6

河道5.14.54.24.8

鱼池5.95.74.85.0

稻田5.85.33.94.5思考与习题:712、不同给食率和不同的饲料剂型都对鱼的产量会产生影响,用莫桑比克罗非鱼作网箱养殖试验,得如下数据(试验指标:净产kg/m2),试分析

低给食率中等给食率高给食率湿团状料14.1513.2615.8015.3216.3216.8815.2315.9817.54干料15.6315.5417.2017.6519.5619.2416.0118.3218.78颗粒料15.2415.8916.7418.4520.8821.5614.5818.0121.42膨化料15.8716.5419.5520.4523.4424.1716.7120.8923.872、不同给食率和不同的饲料剂型都对鱼的产量会产生影响,用莫桑723、在草鱼饵料内添加不同百分率的尿素,使用不同的饵料加工方法,试验对草鱼的增产效果,所得日增重如下,试作分析

0%4.0%8.0%一次成型0.480.380.570.610.530.580.430.500.520.730.570.64二次成型0.390.420.640.750.700.770.470.530.730.720.850.82散料0.250.280.310.330.340.310.310.290.290.270.300.293、在草鱼饵料内添加不同百分率的尿素,使用不同的饵料加工方法734、抽样调查4个镇的水产养殖户的经济收入,每个镇抽取3个村,每村调查6户,得经济收入(万元)如下,试作分析镇别村别户收入村户数镇户数村和镇和

117.87.47.17.46.86.926.76.96.16.56.56.436.96.46.67.06.96.0248.28.46.96.67.16.857.37.86.86.27.16.567.87.17.06.06.86.2375.85.76.26.67.06.485.95.76.56.07.46.096.26.05.85.76.86.84109.47.59.99.07.37.5119.27.19.58.87.48.1127.87.78.18.18.49.04、抽样调查4个镇的水产养殖户的经济收入,每个镇抽取3745、比较4个鲤鱼品种的增重情况,每一品种观察若干个家系,每一家系抽取若干尾同龄商品鱼,得体重(kg)数据如下,试家系比较品种家系样本鱼体重111.381.231.331.401.3621.421.521.321.241.501.281.5531.541.321.501.611.42242.102.131.891.742.202.1152.252.211.922.05361.581.331.471.4571.751.561.691.351.5681.461.271.621.481.311.881.6891.611.451.521.324102.031.851.722.052.142.01112.342.201.812.402.30122.222.031.842.11

(*)

5、比较4个鲤鱼品种的增重情况,每一品种观察若干个家系,75

end

方差分析解读课件76方差分析(续)方差分析(续)77第四节两因素资料的方差分析方差分析解读课件78两因素资料的方差分析,又称为双向分组资料的方差分析很多情况下,我们需要设计两种不同的因素同时作用于供试动物或在考虑某一因素对供试动物产生影响的同时,还需要考虑不同的环境情况这样,当试验结束后,数据的分析就必须进行两因素(或称双向分类资料)的方差分析同时考虑的这两个因素,我们分别称之为因素A和因素B,他们各有a个水平和b个水平两因素资料的方差分析,又称为双向分组资料的方差分析79有时候,因素A和因素B是同等重要的有时候,因素B是为了从总变异中分剖出环境因素而特意设置的在设计时,因素A和因素B相互交叉,形成ab个组合即:A因素的每一个水平包含了B因素的所有水平B因素的每一个水平也包含了A因素的所有水平即:A因素的各个水平与B因素的各个水平相逢一次,也只相逢一次例如:A因素有5个水平,B因素有4个水平,形成5×4=20个组合有时候,因素A和因素B是同等重要的80根据每一个组合内是一个独立供试动物还是多个独立供试动物,双向分类资料又可分为组合内无重复观测值和组合内有重复观测值两种情况根据每一个组合内是一个独立供试动物还是多个独立供试动物,双向81一、组合内无重复观测值的两向分类资料的方差分析这种类型的资料结构是每一组合内仅一个独立供试动物(独立供试单位)其观测值的数学模型为:这一模型的含义是:每一个观测值包含了总体平均值,同时还受A因素第个水平的效应和B因素第个水平的效应,同时还具有一定的误差:一、组合内无重复观测值的两向分类资料的方差分析82这一模型相应的数据结构为:因素

……T

:TT

这一模型相应的数据结构为:83上页的数据结构表中,T为求和,不同因素的和的下标不同两因素无重复资料的方差分析应从A和B两个方向进行,我们可以将这种结构看成是两个单向资料的重合即:对A因素来说,有a

个组(k=a),每一组有b

个观测值(n=b)对B因素来说,有b

个组(k=b),每一个组有a个观测值(n=a)因此我们可以直接用方差分析表来表示这种分剖的结果这里,无效假设有两个:上页的数据结构表中,T为求和,不同因素的和的下标不同84A:设不全相等B:设不全相等方差分析表变异来源

A因素B因素误差

TA:设85若显著,应对A因素各水平的平均值进行多重比较,其标准误为:若显著,应对B因素各水平的平均值进行多重比较,其标准误为:下面我们以实例来说明具体分析的过程试验4种药物配伍(因素A)对鲢鱼腐皮病的治疗效果,试验在5个发病的渔场(因素B)进行,每个渔场随机抽取4个鱼池,每个鱼池随机使用其中的一种药物配伍,得如下治愈率,试比较这4种药物配伍的治疗效果若显著,应对A因素各水平的平均值进行多重比较,其标86药物渔场配伍

7682837977838992878473778072808182798587由于数据是百分率,因此应作转换:转换后的数据见下面这张表(为了分析方便,所有数据转换后都扩大100倍):药物渔87药物鱼场配伍

106113115109107115123128120116102107111101111112113109117120药物鱼场88得如下一级数据:药物渔场配伍

55060560110.03.8760272594120.45.3253256696106.44.7757165283114.24.324354564634474542255255133

得如下一级数据:89设不全相等设不全相等设90将上述数据填入方差分析表中:方差分析表变异来源药物间3542.55180.859.57**3.495.95渔场间4112.5028.1251.493.26误差12226.7018.892

T19881.75对于A因素,应否定无效假设,即不同的药物配伍其治疗鲢鱼腐皮病的疗效差异极显著(p<0.01)B因素即渔场间应接受无效假设,即场间差异不显著(p>0.05)将上述数据填入方差分析表中:91由于药物配伍间差异极显著(p<0.01),因此应对其作多重比较而鱼场间差异不显著,没有必要进行多重比较(场间差异也不是我们讨论的重点,因此即使差异显著也不必进行多重比较)

2340.050.013.083.774.20120.4aA4.325.055.50114.2bAB5.997.338.17110.0bcB8.409.8210.69106.4cB由于药物配伍间差异极显著(p<0.01),因此应对其作多重比92作平均数比较图:在作图前,应将各平均值数据转换回原百分率其反转换公式:

110.0120.4106.4114.279.4%87.1%76.4%82.7%90858075

图1不同药物配伍鲢鱼腐皮病治疗效果比较(下面的注略)作平均数比较图:93在无重复的两因素资料中,B因素往往是作为区组使用的,如渔场、鱼池、地域等,由于在水产统计学中一般不作渔场等的比较,因此,即使B因素显著或极显著,也不对其作多重比较,只有当研究场间差异时才对此作多重比较在试验和统计中设置区组,其作用是消除系统误差,即当我们怀疑不同的区组(渔场等)存在系统误差,或将一个试验有意识地分散在不同的地域、以检验试验内容是否可以适应不同的地域时一般可以设置区组:在无重复的两因素资料中,B因素往往是作为区组使用的,如渔场94一是通过区组消除系统误差二是检验试验内容是否具有广泛的适应性当B因素的F

值小于1(即表示区组基本不具有系统误差)、而A因素还未达到显著水平时,还应当将B因素的平方和、自由度合并到误差项中去,得到一个新的误差项均方,以降低误差项的均方值,同时增大误差项的自由度,使得A因素比较容易地达到显著水平这种情况由于消除了B因素,其实就变成了单因素(仅考虑A因素)资料的方差分析了一是通过区组消除系统误差95当B因素的F值稍大于1(亦表示基本没有系统误差)是否需要将其合并到误差项中去,这需要根据具体情况而定:凡能帮助A因素较易达到显著或极显著水平的,就应当合并;反之,就不合并A因素是我们所要研究的对象,B因素的设置只是为了消除系统误差,因此B因素就没有A因素来得重要,两者的地位是不等的,但在方差分析中,我们还是应当将其作为一个因素来考虑当B因素的F值稍大于1(亦表示基本没有系统误差)是96在考虑B因素的设置时,一定要注意B因素不能和A因素之间产生相互作用(简称为互作),否则这种互作就会存在于误差项中而析不出来因此B因素一般只能是地域、时间等非试验因子,而不能是可能成为试验的条件如果在试验前无法判断所设置的B因素是否会与A因素存在互作,那么就应当用下面的方式进行试验在考虑B因素的设置时,一定要注意B因素不能和A因素97二、组合内有重复观测值的两因子资料的方差分析当A、B两个因子都是试验所考察的因子,即在一个试验中同时安排了两个因子,这两个因子之间有可能存在互作,或怀疑其间存在互作,我们就应当在每个组合内安排2个或以上的独立供试单位(或独立供试动物)这样的试验所得到的数据就是组合内有重复观测值的资料设A因素有a个水平,B因素有b个水平,共有ab个组合,每一个组合内有n(n>1)个观测值,整批资料共有abn个数据二、组合内有重复观测值的两因子资料的方差分析98这种类型资料的数学模型为:数据结构见本书P104表7.3(请参看)任一观测值包含了总体效应,A因子第个水平的效应,B因子第个水平的效应,A因子和B因子第、个互作效应,及随机误差,随机误差这一类资料的方差分析表为:这种类型资料的数学模型为:99方差分析表变异自由度平方和均方F值来源

Aa-1Bb-1A×B(a-1)(b-1)eab(n-1)T

abn-1方差分析表100在这种类型资料的方差分析中,人们的注意力和兴趣往往集中于互作的检验上一般首先完成互作的F

检验,如果互作部分的F

检验显著,可不再进行A因子、B因子的检验(当然习惯上我们还是同时完成A因子、B因子的检验),而对组合进行多重比较因为互作的重要性要远大于单个因子的重要性,它所提供的信息量比单个因子要丰富得多因此,一般的试验应当同时考察两个因子在这种类型资料的方差分析中,人们的注意力和兴趣往往集中于互作101一个试验同时考察两个因子,一是可以节省时间和财力,二是可以考察因子之间的关系,这种关系在单个因子的试验中是考察不到的当互作不显著,则分别检验A因子和B因子是否显著,哪个因子显著,就对哪个因子进行多重比较两个因子都显著,两个因子都应当作多重比较一个试验同时考察两个因子,一是可以节省时间和财力,二是可以考102考察两个因子的试验中,什麽时候在组合内设置重复?一是当我们确认试验所设置的A因子和B因子间的确存在互作,我们为了检验这种互作二是当我们无法肯定A、B因子之间是否存在互作,我们为了发现这种互作,必须设置重复三是为了防止可能存在的互作混杂到误差项中去而

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论