生物统计学课件_第1页
生物统计学课件_第2页
生物统计学课件_第3页
生物统计学课件_第4页
生物统计学课件_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1第五章

方差分析25.1

方差分析的基本原理5.1.1自由度和平方和的分解5.1.2F分布与F测验3

上章介绍了一个或两个样本平均数的假设测验方法。本章将介绍k(k≥3)个样本平均数的假设测验方法,即方差分析(analysisofvariance)。这种方法的基本特点是:将所有k个样本的观察值和平均数作为一个整体加以考虑,把观察值总变异的自由度和平方和分解为不同变异来源的自由度和平方和,进而获得不同变异来源的总体方差估计值。4其中,扣除了各种试验原因所引起的变异后的剩余变异提供了试验误差的无偏估计,作为假设测验的依据。55.1.1自由度和平方和的分解

方差是平方和除以自由度的商。要将一个试验资料的总变异分解为各个变异来源的相应变异,首先必须将总自由度和总平方和分解为各个变异来源的相应部分。因此,自由度和平方和的分解是方差分析的第一步。下面我们首先用一个例子来说明这一问题。6[例5.1]以A、B、C、D4种药剂处理水稻种子,其中A为对照,每处理各得4个苗高观察值(cm),试分解其自由度和平方和。药剂苗高观察值总和Ti平均数A182120137218B202426229223C101517145614D2827293211629T=336=2171、总变异把表中的全部观察值作为一个组看待[即把4个处理(4组、每组有4个观察值)合并成一组,共有24个观察值],根据前面讲过的计算平方和的公式,可以计算出总变异的平方和和自由度8自由度DFT=nk-1=4×4-1=15。表中的每一个观察值,即包括有处理的效应(不同药剂对苗高的影响)又受到误差的影响。其中:称为矫正数,用C表示。92、误差效应表中处理内(组内)各观察值之间,若不存在误差,则各观察值应该相等,由于误差是客观存在的,因而处理内(组内)各观察值之间必然是有差异的,因此,可以用组内(处理内)的差异度量误差效应:10药剂A内:药剂B内:药剂C内:药剂D内:11从理论上讲,这4个误差平方和除以相应的自由度得的误差均方都可以作为总体误差方差的无偏估计值。但是,用它们的加权平均值来估计总体误差方差,则效果更佳。所以:每个组内(处理内)的自由度为:n-1=4-1=3,12所以误差的自由度为:DFe=k(n-1)=4(4-1)=123、处理效应如果没有处理效应,表中各个处理(组)平均数来度量处理效应。从理论上讲均应该相等,因此可以用13需要注意的是,系样本平均数的方差,为了进行正确的F测验,必须使它们都是估的估值,而则是是的估值。。因而,处理(组间)平方和计同一参数应为:1415本例中平方和:602=504+98自由度:15=3+12因此误差平方和可以采用简单的办法计算SSe=SST-SSt=602-504=98。进而可得均方:16平方和与自由度的分解归纳为下表变异来源DFSSMS处理间(组间)k-1MSt误差(组内)k(n-1)MSe总变异kn-1将上述例子推广到一般,设有k组数据,每组皆具n个观察值,则资料共有nk个观察值,其数据分组如表6.1(P99)。175.1.2F分布与F测验

一、F分布在一个平均数为μ、方差为σ2的正态总体中随机抽取两个独立样本,分别求得和,将和的比值定义为F:其均方18按上述方法从正态总体中进行一系列抽样,就可得到一系列的F值而作成一个F分布。它是具平均数μF=1和取值区间为[0,∞]的一组曲线;而某一特定曲线的形状仅决定于参数ν1和ν2。

F分布下一定区间的概率可从已制成的统计表中查出。附表5给出了各种ν1和ν2下右尾概率α=0.05和α=0.0119二、F测验在方差分析的体系中,F测验可用于检测某项变异因素的效应或方差是否存在。所以在计算F值时,总是将要测验的那一项变异因素的均方作分子,而以另一项变异(如误差项)作分母。时的临界F值。其值是专供测验的总体方是否显著大于的总体方差差而设计的(H0:对HA:>)。

≤20F测验需具备的条件:(1)变数y遵循N(μ,σ2);[例6.3]在例6.1中算得药剂间均方=168.00,药剂内均方=8.17,具有自由度ν1=3,ν2=12。试测验药剂间变异是否显著大于药剂内变异?假设H0:对HA:α=0.05和彼此独立。(2)21查附表5在ν1=3,ν2=12时

F0.05=3.49,F0.01=5.95实得F>F0.01P<0.01测验计算:22将例6.1和例6.3的分析结果归纳在一起,列出方差分析表如下:变异来源DFSSMSF显著F值药剂处理间3504168.0020.56F0.05=3.49药剂处理内(误差)12988.17F0.01=5.95总变异15602水稻药剂处理苗高方差分析表推断:否定H0:,接受HA:235.2

多重比较5.2.1最小显著差数法5.2.2q法5.2.3新复极差法5.2.4多重比较方法的选择245.2.1最小显著差数法最小显著差数法(leastsignificantdifferrence,简称LSD法)25[例6.4]试以LSD法测验各种药剂处理的苗高平均数之间的差异显著性。由附表4,ν=12时,t0.05=2.179,t

0.01=3.055故LSD0.05=2.179×2.02=4.40(cm)

LSD0.01=3.055×2.02=6.17(cm)26处理苗高平均数差异显著性0.050.01D29B23A18C14不同药剂处理水稻苗高平均数比较(LSD法)abccAABBCC275.2.2q法

q测验方法是将k个平均数由大到小排列后,根据所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差LSRα值的。28[例6.5]试以q法测验各种药剂处理的苗高平均数之间的差异显著性。查附表7,得到当DF=12时,p=2,3,4的qα值29LSRα值Pq

0.05q

0.01LSR0.05LSR0.0123.084.324.406.1833.775.045.397.2144.205.506.017.87处理苗高平均数差异显著性0.050.01D29aAB23bABA18cBCC14cC不同药剂处理水稻苗高平均数比较(q法)305.2.3新复极差法

新复极差法,又称最短显著极差法(shortestsignificantrange),与q法相似。计算LSRα值查的是SSRα值(附表8)而不是q表。LSRα值PSSR

0.05SSR

0.01LSR0.05LSR0.0123.084.324.406.1833.234.554.626.5143.334.684.766.69315.2.4多重比较方法的选择1、试验事先确定比较的标准,凡是与对照相比较,或与预定要比较的对象比较,一般可选用最小显著差数法;2、根据否定一个正确的H0和接受一个不正确的H0的相对重要性来决定。32方差分析的基本步骤:(1)分解平方和与自由度;(2)F测验;(3)平均数的多重比较。335.3

方差分析的线性模型与期望均方5.3.1方差分析的线性数学模型5.3.2期望均方345.3.1方差分析的线性数学模型

方差分析是建立在一定的线性可加模型的基础上的。所谓线性可加模型是指总体每一个变量可按其变异的原因分解成若干个线性组成部分,它是方差分析的基础。35表6.1数据的线性模型可表示为:式中,μ为总体平均数,τi为试验处理效应,εij为随机误差具有N(0,σ2)。36

在以样本符号表示时,样本的线性组成为:是μ的无偏估计值,37385.3.2期望均方

在线性可加模型中,由于对τi有不同解释产生了固定模型(I)和随机模型(II)。一、固定模型(fixedmodel)

指试验的各处理都抽自特定的处理总体,其处理效应τi=(μi-μ)是一个固定的常量,我们的目的就在于研究τi,所测验的假设是H0:τi=0或H0:μi=μ。39一般的栽培和饲养试验,如肥料试验、药效试验、密度试验、饲料试验、品种试验等均属于固定模型。[例6.8]以5个水稻品种作大区比较试验,每品种作3次取样,测定其产量,所得数据为单向分组资料。本试验需明确各品种的效应,故为固定模型,方差分析和期望均方的参数列入下表:405个水稻品种产量的方差分析与期望均方表变异来源DFSSMS期望均方(EMS):固定模型品种间品种内41087.624.021.92.40固定模型的处理效应(本例为品种效应)τi属于固定效应,固定效应的方差用表示。固定模型的F测验41二、随机模型(randommodel)

指试验中的各处理皆是抽自N(0,)的一组随机样本,因而处理效应τi是随机的,它会因试验的不同而不同;故我们的目的不在于研究τi而在于研究τi的变异度。随机模型在遗传、育种和生态的研究试验方面有较广泛的用处。42[例6.9]研究籼粳杂交F5代系间单株干草重的遗传变异,随机抽取76个系进行试验,每系随机取2个样品测定干草重(g/株)。因这76个系是随机抽取的样本,要从这些样本来估计F5代系间单株干草重的遗传变异,故这是随机模型。其方差分析的结果如下:变异来源DFMS期望均方(EMS):固定模型系统间系统内757672.7917.7743随机模型的F测验本例中系统内MS估计了σ2,因而;系统间MS估计了因而44这是测验处理效应的变异度,而不是测验处理效应本身。本例F=72.79/17.77=4.09>F0.05,说明单株干草重存在遗传变异。455.4

单向分组资料的方差分析5.4.1组内观察值数目相等的单向分组资料的方差分析5.4.2组内又分亚组的单向分组资料的方差分析465.4.1组内观察值数目相等的单向分组资料的方差分析每组具n个观察值的k组数据的符号表组别观察值(yij,i=1,2,…,k;j=1,2,…,n)总和平均均方1y11y12…y1j…y1nT12y21y22…y2j…y2nT2:::…:…::::iyi1yi2…yij…yinTi:︰︰…:…::︰︰kyk1yk2…ykj…yknTkT=∑yij=∑y47

变异来源自由度DF平方和SS均方MSF期望均方EMS固定模型随机模型处理间k-1误差k(n-1)总变异nk-1组内观察值数目相等的单向分组资料的方差分析48组内又分亚组的单向分组资料的方差分析

组别亚组观察值亚组总和Tij亚组均数组总和Ti组均数1…::T12…::T2:…::::i1yi11yi12…yi1kyi1nTi1Ti2yi21yi22…yi2kyi2nTi2:::::::︰︰jyij1yij2…yijk…yijnTij:︰︰︰︰︰︰︰︰myim1yim2︰yimk︰yimnTim:…︰︰l…Ti49

设一系统分组资料共有l组,每组内有m个亚组,每一亚组内有n个观察值,则该资料共有lmn个观察值。其观察值的线性模型为:将该线性模型变型得:50等式的左边是总效应,它是由右边的(1)组间变异;(2)同一组内亚组间变异;(3)同一亚组内各重复观察值间的变异所构成。其自由度和平方和的估计如下:1、总变异自由度DFT=lmn-1512、组间(处理间)变异自由度DFt=l-13、同一组内亚组间的变异自由度524、亚组内变异自由度53二级系统分组资料的方差分析变异来源DFSSMSF期望均方(EMS)混合模型随机模型组间l-1组内亚组间l(m-1)亚组内lm(n-1)总变异lmn-154[例6.12]在温室内以4种培养液(l=4)培养某种作物,每种3盆(m=3),每盆4株(n=4),一个月后测定其株高生长量(mm),结果如下表,试作方差分析。培养液ABCD总和盆号A1A2A3B1B2B3C1C2C3D1D2D3生长量503545505555856570606065553540456045607070558565403040505065908070354585354050455055856570707575盆总和Tij180140175190215220320280280220265290T=2725培养液总和Ti495625880775培养液平均41.352.173.364.655一、自由度和平方和分解总自由度DFT=lmn-1=(4×3×4)-1=47培养液间自由度DFt=l-1=4-1=3培养液内盆间自由度DFe1=l(m-1)=4×(3-1)=8盆内株间自由度DFe2=lm(n-1)=4×3×(4-1)=365657582、培养液间差异二、F测验1、盆间差异假设H0:,求得:F=157.81/89.06=1.77此F值小于ν1=8,ν2=36F0.05=2.22,所以接受H0假设,求得:59推断:该试验同一培养液内盆间的生长量无显著差异;而不同培养液间的生长量有极显著的差异。

F=2375.25/157.81=15.05此F值大于ν1=3,ν2=8F0.01=7.59,故否定,接受。60变异来源DFSSMSFF0.05F0.01培养液间37126.562375.5215.05﹡﹡4.077.59培养液内盆间81262.50157.811.772.223.04盆内株间363206.2589.06总变异4711595.31方差分析表61三、各培养液平均数间的比较pSSR0.05SSR0.01LSR0.05LSR0.0123.264.7411.8317.2133.395.0012.3118.1543.475.1412.6018.664种培养液的LSR值(新复极差测验)624种培养液植株生长量(mm)的差异显著性培养液平均生长量差异显著性0.050.01C73.3aAD64.6aABB52.1bBCA41.3bC635.5

两向分组资料的方差分析5.5.1组合内只有单个观察值的两向分组资料的方差分析5.5.2组合内有重复观察值的两向分组资料的方差分析645.5.1组合内只有单个观察值的两向分组资料的方差分析设有A和B两个因素,A因素有a个水平,B因素有b个水平,每一处理组合仅有一个观察值,则全试验共有ab个观察值,其资料类型如下表:A因素B因素TiB1B2…BbA1y11y12…y1bT1.A2y21y22…y2bT2.:︰︰︰︰︰︰Aaya1ya2…yabTa.T.jT.1T.2…T.bT..…65观察值的线性模型为:因此,总变异可分解成A因素效应、B因素效应和误差效应三个部分。其自由度和平方和的分解如下表:变异来源DFSSMSF混合模型EMS(A固定,B随机)A因素a-1B因素b-1误差(a-1)(b-1)总变异ab-166注意:这种类型资料,其误差项是误差与互作的混合项。因此只有AB不存在互作时,才能正确估计误差。另外,为提高试验的精确性。误差自由度不能小于12。67[例5.13]采用5种生长素处理豌豆,未处理为对照,待种子发芽后,分别每盆中移植4株,每组6盆,每盆一个处理,试验共有4组24盆,并按组排列于温室中,使同组各盆的环境条件一致。当务盆见第一朵花时记录4株豌豆的总节间数,结果见下表,试作方差分析。68处理(A)组(B)总和Ti.平均IIIIIIIV未处理(CK)6062616024360.8赤霉素6565686526365.8动力精6361616024561.3吲哚乙酸硫酸腺嘌呤马来酸64626167656263626261646525525325063.863.362.5总和T.j375382377375T=150969(1)自由度和平方和的分解70变异来源DFSSMSFF0.05F0.01组间35.451.82<1处理间565.8713.174.562.904.56误差1543.302.89总变异23114.62方差分析表(2)F测验组间效应:假设F=1.48/2.89<171推断:组间环境条件无显著差异,不同生长素处理有显著差异。处理间效应:假设F=13.17/2.89=4.56(3)处理间比较此例有预先指定的对照,故用LSD法。72查得ν=15时,t0.05=2.131,t0.01=2.947LSD0.05=1.202×2.131=2.56,LSD0.01=1.202×2.947=3.54处理平均数与对照的差数对照(CK)赤霉素动力精吲哚乙酸硫酸腺嘌呤马来酸60.865.861.363.863.362.5-5.0**0.53.0*2.51.7735.5.2组合内有重复观察值的两向分组资料的

方差分析

设有A、B两个试验因素,A因素有a个水平,B因素有b个水平,共有ab个处理组合,每个组合有n个观察值,则该资料共有abn个观察值。如果试验按完全随机设计,则其资料类型如下表:74A因素B因素总和Ti..平均B1B2…BbA1y111y121…y1b1T1..y112y122…y1b2︰︰︰︰y11ny12ny1bnTij.T11.T12.T1b.A2y211y221…y2b1T2.y212y222…y2b2︰︰︰︰y21ny22ny2bnTij.T21.T22.T2b.︰︰︰︰︰︰︰Aaya11ya21…yab1Ta.ya12ya22…yab2︰︰︰︰ya1nya2n…yabnTij.Ta1.Ta2.Tab.T.j.T.1.T.2.…T.b.T...75线性模型为:各变异来源的自由度和平方和的估计为:变异来源DFSSMS处理组合ab-1A因素a-1B因素b-1A×B互作(a-1)(b-1)试验误差ab(n-1)总变异abn-176[例6.14]施用A1、A2、A33种肥料于B1、B2、B33种土壤,以小麦为指示作物,每处理组合种3盆,得产量结果(g)如下表,试作方差分析。变异来源MS期望均方(EMS)固定模型随机模型混合模型(A随机、B固定)A因素B因素A×B互作试验误差期望均方77肥料种类(A)盆土壤种类(B)总和Ti..平均B1(油沙)B2(二合)B3(白僵)A1121.419.617.6169.218.8221.218.816.6320.116.417.5Tij.62.754.851.7A2112.013.013.3118.213.1214.213.714.0312.112.013.9Tij.38.338.741.2A3112.814.212.0122.013.6213.813.614.6313.713.314.0Tij.40.341.140.6总和T.j.141.3134.6133.5T=409.4平均15.715.014.8781、自由度和平方和的分解792、F测验将上述结果及自由度录于方差分析表中,以固定模型作F测验80变异来源DFSSMSFF0.01处理8202.5825.2227.283.71肥料间2179.3889.6996.656.01土类间23.961.982.136.01

肥料×土类419.244.815.184.58试验误差1816.700.928总变异26219.28813、平均数的比较(1)各处理组合平均数的比较p23456789SSR0.052.973.123.213.273.323.353.373.39SSR0.014.074.274.384.464.534.594.644.68LSR0.051.651.73

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论