生物统计学教案(八)_第1页
生物统计学教案(八)_第2页
生物统计学教案(八)_第3页
生物统计学教案(八)_第4页
生物统计学教案(八)_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物统计学教案第八章单因素方差分析教学时间:5学时教学方法:课堂板书讲授教学目的:重点掌握方差分析的方法步骤,掌握单因素和两因素的方差分析,了解多重比较的一些常用方法讲授难点:掌握单因素和两因素的方差分析8.1 方差分析的基本原理8.1.1 方差分析的一般概念第五章讲过两个平均数差异性的比较可用t检验,在多组数据之间作比较便需要通过方差分析来完成。在多组数据之间作比较可以在两两平均数之间比较,但会提高犯I型错误的概率。最简单的方差分析是单因素方差分析。下面举例说明。例1调查5个不同小麦品系株高,结果见下表:IIIIIIIVV164.664.567.871.869.2265.365.366.37

2、2.168.2364.864.667.170.069.8466.063.766.869.168.3565.863.968.571.067.5和326.5322.0336.5354.0343.0平均数65.364.467.370.868.6例2从每窝均有4只幼仔的初生动物中,随机选择4窝,称量每只动物的出生重,结果如下:窝别IIIIIIIV可编辑范本134.733.227.132.9233.326.023.331.4326.228.627.825.7431.632.326.728.0和125.8120.1104.9118.0平均数31.45030.02526.22529.500这两个例子都只有一

3、个因素,例1是“品系”,例2是“窝别”。在每个因素下,又有a个水平(或称为处理),例1有5个品系,例2有4个窝别。a个水平可以认为是a个总体,表中的数据是从a个总体中抽出的a个样本。方差分析的目的就是由这a个样本推断a个总体。因为上述实验都只有一个因素,对这样的数据所进行的方差分析称为“单因素方差分析”。单因素方差分析的典型数据见下表。XinX ij ,j 11Xi ni 1,2, ,aX1X2X3XiXa1X11X21X31Xi1Xa12X12X22X32Xi2Xa2311X13X23X33Xi3Xa3111X1jX2jX3jXijXaj1nX1nX2nX3nXinXan平均数X1.X2.X

4、3.Xi.Xa.表中的Xij表示第i次处理下的第j次观测值,下标中的”.”表示求和,具体说明如下an_1Xij,X-Xi1j1an可编辑范本8.1.2不同处理效应与不同模型线性统计模型:x iji ij模型中的Xj是在i水平下的第j次观测值i 1, 2, aj 1,2, nh是对所有观测值的一个参数,称为总平均数。a是仅对第i次处理的一个参数,称为第i次处理效应。耳是随机误差成分,要求误差是服从N(0,豆的独立随机变量。固定因素:因素的水平确定后,因素的效应即被确定。因素的a个水平是人为特意选择的。方差分析所得结论只适用于所选定的a个水平。固定效应模型:处理固定因素所使用的模型。随机因素:因素

5、的水平确定之后,其效应并不固定。因素的a个水平是从水平总体中随机抽取的。从随机因素的a个水平所得到的结论,可推广到该因素的所有水平上。随机效应模型:处理随机因素所使用的模型。8.2 固定效应模型8.2.1 线性统计模型1, 2, a1, 2, niY.xijiij其中a是处理平均数与总平均数的离差,因这些离差的正负值相当,因此如果不存在处理效应,各a都应当等于0,否则至少有一个a*00因此,零假设为:Ho:d=0=%=0备择假设为:Ha:aw0(至少有一个i)8.2.2 平方和与自由度的分解a nxiji 1 j 1a nxiji 1 j 12x一2xia nx xij i1 1 j 1可编辑

6、范本a n2 xij xii 1 j 1xi xxi xxii 1 j 1对于每个固定的X.,xiji 1 j 1Xii 1nx Xjj iXi因此,a nX ij i 1 j 1an Xii 1a n一2XXji 1 j 1一2Xi以SST表示总平方和,SSA表示处理平方和,SS表示误差平方和,SStXij i 1 j 1SSaa_2n Xi xSSei 1a nXij Xi i 1 j 1可编辑范本二者关系为:sst=ssa=ss自由度可做同样的分割:dfT=dfA+dfedfT=an1dfA=a1dfe=ana为了得出检验统计量,以处理平方和与误差平方和除以相应的自由度,得出相应的均方。

7、MS=SS/dfeMSA=SS/dfA。8.2.3 均方期望与统计量FMSe是(2的无偏估计量,证明如下:EMSeSSenanaESSe1anEXjnaai1j11naa1Enaa1naanana用同样的方法可以得出MSa的均方期望SSaSSaEMSaE-Aa1Xi3e3e因为E( )=0,故所有包含乘积项的数学期望都等于于是:E MSARE-2iaE-2由以上结果可以看出,误差均方 MSe是2的无偏估计量O对处理项来说,只有当=0时,MSa才是(2的无偏估计量。用MSa和MSe比较,便可以反映出a的大小。此,使用统计量F作为检验统计量,做上尾单侧检验。F=MSa/MSe,具dfA,dfe自由

8、度,当F<Fa时,接受零假设,处理平均数间不显著;当F>Fa时拒绝零假设,处理平均数间差异显著。在EMSa中,令则处理均方可表示为EMSa这时的零假设可以记为Ho:是0。备择假设记为Ha:小0变差来源平方和自由度F均方期望处理问SSa 1MSaMSa/ MSe(r+ n 2误差SSna aMSe2 (T总和SSna 1将上述结果列在方差分析表中a n 一2a n28.2.4平方和的简易计算SSTSSa令xij xi 1 j 1a -2n xi xi 12 xx iji 1 j 1na1 a2 x2 Xi 一n i 1 na2xnac称为校正项。误差平方和SSe=SSr-SK将例1中

9、的每个数据都减去65,编码后列成下表。IIIIIIIVV1一0.40.52.86.84.220.30.31.37.13.23-0.2一0.42.15.04.841.01.31.84.13.350.8-1.13.56.02.5总和xi.1.53.011.529.018.057.0xi22.259.00132.25841.00324.001308.50Ixij21.933.4029.43174.4668.06277.28品系129.965722CnaSSt2 x ij277.28 129.96 147.32SSa2xi1308.50 129.96131.74147.32 131.7415.58变差

10、来源平方和自由度均力F品系问131.74432.94*42.23误差15.58200.78总和147.3224SSeSSt将以上结果列成方差分析表:SSa*后0.01F4,20,0.05=2.87,F4,20,0.01=4.43F>F0.01。P<0.01因此,上述5个不同小麦品系株高差异极显著。习惯上以“*”表示在户0.05水平上差异显著,以“*”表示在a=0.01水平上差异显著。8.3 随机效应模型8.3.1线性统计模型xji1,2,aj1,2,n其中n为总平均数,a为服从N(0,/)的独立随机变量,导为服从N(0,(2)的独立随机变量。在随机模型中,不是检验单个处理效应的有无

11、, 因此而是检验a是否存在变异性。接受Ho表示处理间没有差异,拒绝Ho意味着处理间存在差异。8.3.2均方期望及统计量F在随机模型中, 同。M8的数学期望:因为 a是独立随机变量,因此MSa的数学期望与固定模型不E MSAE SSa_2xiX同理可证aV2i一2用检验统计量FMS做上尾单侧检验:F=MSa/M&。当F> Fa-1,an-a,a时拒绝Hoc MS的期望组成除包含误差方差外,还包含处理项方差,表明不同处理间存在差异。方差分析的程序与固定模型相同,但由于获得样本的方式不同,使之所得结果也不同。随机模型适用于水平总体,而固定模型仅适用于所选定的a个水平。以下是例2的计算结

12、果,将每一数据均减去30.4.73.22.92.93.3一4.0-6.71.43.8-1.42.2-4.31.62.3-3.3-2.0总和Xi.5.80.115.1-2.0-11.2Xi233.640.01228.014.00265.66端49.9833.4969.0332.86185.36CSStSSa2xan11.2167.84a n 2 Xij i 1 j 12XiC 185.36 7.84265.6647.84177.5258.575可编辑范本SSeSSTSSA177.5258.575118.945将上述结果列成方差分析表变差来源平方和自由度均力F窝问58.575319.5251.97

13、118.945129.912总和177.62015F3,12,0.05=3.49,F<Fo.05,P>0.05,接受H。结论是不同窝别动物出生重没有显著差8.4 多重比较8.4.1 最小显著差数法(LSD)平均数差数的显著性检验公式为:X1 X2X1 X2s X1 X2M MS11当n1 = n2时,tx1X2df an a2MSPe当差异显著时X1 X22MS eet 0.05X1 X2t0.052MS ee后边式子,大于号的右侧称为最小显著差数,记为LSD。8.4.2 Duncan检验检验程序:xa将需要比较的a个平均数依次排列好,使之:x1X2并将每一对平均数的差列成下表:1

14、XiXaXiXa '1X1X2X2Xax2Xa 1X2X33X1 X2XaXaXaXaRk r Sx , k 2,3, ,a 其中sxMS eeXa算出不同对平均数的差的临界值Rko当两个平均数相邻上式中的k是要比较的两个平均数之间所包含的平均数的个数时k=2,中间隔一个时k=3等。平均数共有a个,所以需从附表9中查出a1个r0,得至ija1个临界值Rko每两个平均数的差与相应的临界值比较,显著的打上一个星花“*”,极显著的打上两个星花下面对5个小麦品系株高平均数做duncan多重比较.首先将平均数按从高到低顺序排列好。品系号IVVIIIIII平均数70.868.667.365.364.4顺序号12345根据MSe=0.78,n=5,df=a(n1)=20,k=2,3,4,5将临界值列成表。k2345k2345S052.953.103.183.250.014.024.224.334.40Rk1.1651.2251.2561.284Rk1.5881.6671.71

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论