3.2.单因素方差分析ppt课件_第1页
3.2.单因素方差分析ppt课件_第2页
3.2.单因素方差分析ppt课件_第3页
3.2.单因素方差分析ppt课件_第4页
3.2.单因素方差分析ppt课件_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一节第一节 单因素方差分析单因素方差分析 第二节第二节 双因素方差分析双因素方差分析 方差分析方差分析(analysis of variance)就是采用数理统计方法对数就是采用数理统计方法对数据进行分析,以鉴别各种因素及因素间的交互作用对研究对象据进行分析,以鉴别各种因素及因素间的交互作用对研究对象某些试验指标的影响大小的一种有效方法某些试验指标的影响大小的一种有效方法.第一节第一节 方差分析方差分析一、问题的提出一、问题的提出注:方差分析简记为注:方差分析简记为ANOVA. 例1 检验不同饲料对鸡增重的效应。选用三种饲料:A1 以鱼粉为主,A2 以槐树粉为主,A3 以苜蓿粉为主。特选 2

2、4 只相似雏鸡随机分三组,每组各喂一种饲料,60 天后观察其重量,试验结果如下10481029103210221021108010291093A31001112210741090110999010921107A210281009101210021001106010091073A1鸡重鸡重g)饲料饲料 A几个概念:(几个概念:(1所考察的试验结果如产品质量、数所考察的试验结果如产品质量、数量、销量、成本等称为试验指标,简称指标。例中为量、销量、成本等称为试验指标,简称指标。例中为鸡的重量。鸡的重量。(2在试验中对所关心的在试验中对所关心的“指标有影响的、要加以指标有影响的、要加以考察改变状态的原

3、因称为因子考察改变状态的原因称为因子, 用用 A,B,C 等大写英等大写英文字母表示。例中为饲料。文字母表示。例中为饲料。(3因素在试验中所取的各种不同状态称为因子的水平因素在试验中所取的各种不同状态称为因子的水平. 因素因素 A 的的 r 个水平常用个水平常用 A1,A2,Ar 表示,其中表示,其中 r 称为因素称为因素 A 的水平数。例中有的水平数。例中有 1 个因素,个因素,3 个水平。个水平。(4若只考察一个因素对指标的影响,这种试验称若只考察一个因素对指标的影响,这种试验称为单因素试验,相应的方差分析就称为单因素方差分为单因素试验,相应的方差分析就称为单因素方差分析析; 例中为单因素

4、试验。例中为单因素试验。 若一个试验中同时考察两个因素,则这时对试若一个试验中同时考察两个因素,则这时对试验所作的方差分析称为双因素方差分析;因素多于两验所作的方差分析称为双因素方差分析;因素多于两个,相应的称为多因素方差分析个,相应的称为多因素方差分析. 试验中,使用配方试验中,使用配方 Ai下第下第 j 只鸡的重量记为只鸡的重量记为 yij, i=1,2,3; j =1,2,8.我们的目的是研究不同饲料对鸡增重的影响是否相同。我们的目的是研究不同饲料对鸡增重的影响是否相同。 例1(续) 对原始数据作如下变换:每个数-1000 (为了处理更加简便)4829322221802993A31122

5、7490109-1092107A2289122160973A1鸡重鸡重g)饲料饲料A(图形分析散点图)二、单因素方差分析的统计模型二、单因素方差分析的统计模型 考虑的因素记为考虑的因素记为 A,假定它有,假定它有 r 个水平,记为个水平,记为 A1,A2, , Ar . 在每一水平下考察的指标可看成一个总体在每一水平下考察的指标可看成一个总体,共有共有 r 个总体个总体. 作如下假定作如下假定:(1)每一总体服从正态分布每一总体服从正态分布 N(i , i2), i=1, 2, r ;(2)各总体同方差各总体同方差, 即即 12 =22=r2= 2;(3)从每个总体中抽取的样本是相互独立的从每

6、个总体中抽取的样本是相互独立的, 即所有试验即所有试验结果结果 yij 都独立都独立.简而言之简而言之, 每一总体独立地服从同方差的正态分布每一总体独立地服从同方差的正态分布. 且且这些假定的成立与否都可用统计方法进行验证这些假定的成立与否都可用统计方法进行验证. 单因素方差分析单因素方差分析(single factor analysis of (single factor analysis of variance)variance)是要判断因素对指标是否有显著影响,归是要判断因素对指标是否有显著影响,归结为判断不同总体是否有相同分布的问题结为判断不同总体是否有相同分布的问题. .012:rH

7、因为各总体方差相同,所以要判断因素对指标是否因为各总体方差相同,所以要判断因素对指标是否有显著影响,就化为比较各水平下的均值是否相同即有显著影响,就化为比较各水平下的均值是否相同即检验检验其备择假设为其备择假设为:,2 ,r 不全相同不全相同.(常省略不写常省略不写)对水平对水平 Ai 作了作了 m 次观察,第次观察,第 i 水平的第水平的第 j 次观察为次观察为yij ,这样可得观察资料,这样可得观察资料(若各水平观察次数不同时,略若各水平观察次数不同时,略有不同,后叙)有不同,后叙) 合计合计yr1, yr2 ,., yrmr.y21, y22 ,., y2my11, y12 ,., y1

8、m试验数据试验数据水平水平 称第称第 i 水平下的均值与总均值的差水平下的均值与总均值的差 为为因子因子 A 的第的第 i 水平的主效应水平的主效应, 简称简称 Ai 的效应的效应. 易见易见11,riir记总均值为记总均值为设设 是来自总体是来自总体 的简单随机样本的简单随机样本,则单因子方差分析的统计模型为则单因子方差分析的统计模型为2(,)iN (1,2,3,)ijyjm2,1,2,., ;1,2,.,(0,)ijiijijyir jmN各相互独立且服从其中其中ij = yij -i称为称为 随机误差随机误差ii10.rii单因子方差分析的统计模型可改写为单因子方差分析的统计模型可改写为

9、:012:rH可改写为可改写为012:0rH12,1,2,., ;1,2,.,0(0,)ijiijriiijyirjmN各相互独立且服从 方差分析是通过对误差的分析研究来检验具有相同方差分析是通过对误差的分析研究来检验具有相同方差的多个正态总体均值是否相等的一种统计方法方差的多个正态总体均值是否相等的一种统计方法.对水平对水平 Ai 作了作了 m 次观察,第次观察,第 i 水平的第水平的第 j 次观察为次观察为yij ,这样可得观察资料,这样可得观察资料(若各水平观察次数不同时,略若各水平观察次数不同时,略有不同,后叙)有不同,后叙) T合计合计Tryr1, yr2 ,., yrmr.T2y2

10、1, y22 ,., y2mT1y11, y12 ,., y1m平均和和试验数据试验数据水平水平1y2yryy记总观察次数记总观察次数 ,组平均值,组平均值 ,三三. 平方和分解平方和分解总平均值总平均值 及及nr m11miijjyym11111rmrijiijiyyynr1. 组内偏差与组间偏差组内偏差与组间偏差11miijjm11111rmrijiijinr与与(图形分析散点图) 1y 2y 3yy组间偏差组间偏差: :反映了组内数据与组反映了组内数据与组内平均的随机误差内平均的随机误差组内偏差组内偏差: :反映了随机误差和第反映了随机误差和第 i i 个水平的效应个水平的效应 () (

11、)ijiiijiiijiyy() ()iiiiiyy 那么那么2. 偏差平方和与自由度偏差平方和与自由度设有设有 k 个数据个数据 x1, x2 , .,xk ,且且 ,11kiixxk偏差平方和偏差平方和: :21()kiiQxx反映了数据的集中或分散反映了数据的集中或分散程度程度, ,即数据波动的大小即数据波动的大小自由度自由度: :平方和中独立的随机变量的个数平方和中独立的随机变量的个数. .由于由于1()0kiixx , ,所以平方和中独立的偏差个数为所以平方和中独立的偏差个数为 k-1,k-1,21()kiiQxx的自由度为的自由度为 fQ = fQ = k-1k-1因而因而均方和均

12、方和: :QQMSf反映了每个自由度上数据的离散程度反映了每个自由度上数据的离散程度, ,排除了自由度的干扰排除了自由度的干扰3. 总平方和分解公式总平方和分解公式总偏差平方和总偏差平方和: : 它反映了观测数据它反映了观测数据总的变异程度总的变异程度组间组间( (因子因子A A的的) )偏差平方和偏差平方和: : 反映因子反映因子A A的不同的不同水平效应间的差异水平效应间的差异组内组内( (误差误差) )偏偏差平方和差平方和: :反映了随机误差反映了随机误差ijij对对试验结果影响的总和试验结果影响的总和ST =SA +Se , f T = f A +f e 平方和分解公平方和分解公式式

13、211)1(,rmTiiTjjSyfyn 21211() ,()rAiiriiAifrSmyym211211(1)() ,()rmeijiijrmijiijefr mSryny 定理定理1:1:ijiijiyy iiiyy(1) Se /2 2 (n - r), 从而从而 E(Se)=(n-r)221()(1)rAiiE Srm进一步进一步, ,若若0 0成立,那么成立,那么2()(1)AE Sr定理定理2:2:(2) SA /2 2 (r-1), (3) SA 与与 Se 独立独立.对水平对水平 Ai 作了作了 m 次观察,第次观察,第 i 水平的第水平的第 j 次观察为次观察为yij ,这

14、样可得观察资料,这样可得观察资料(若各水平观察次数不同时,略若各水平观察次数不同时,略有不同,后叙)有不同,后叙) T合计合计Tryr1, yr2 ,., yrmr.T2y21, y22 ,., y2mT1y11, y12 ,., y1m平均和和试验数据试验数据水平水平1y2yryy4. 检验方法检验方法 若若SA显著地大于显著地大于Se,说明,说明 间的差异显著地大于随间的差异显著地大于随机误差,那么机误差,那么 H0 可能不成立可能不成立.iy1AAeeMSSrFMSSnr取检验统计量取检验统计量(1,)FF rnr当当 H0 成立时成立时,因此拒绝域为因此拒绝域为1(1,)WFFrn r

15、5、方差分析表、方差分析表 (analysis of variance table):f T= n - 1ST总和总和MSe=Se / fef e= n - rSe误差误差F=MSA / MSeMSA=SA / fAf A = r - 1SA因素因素比比均方和均方和自由度自由度平方和平方和方差来源方差来源注:数据复杂时,采用注:数据复杂时,采用EXCEL软件可得到分析结果,并软件可得到分析结果,并可给出检验的可给出检验的 p 值即值即 p=P(XF), 其中其中X F(r-1,n-r)1(1,),FFrnr若则认为因子A显著,各正态均值间有显著差异判断:判断:1(1,),.FFrnr0若则说明

16、因子A不显著,保留原假设H 例1(续1) 试验结果如下,试检验不同饲料对鸡增重的效应。10481029103210221021108010291093A31001112210741090110999010921107A210281009101210021001106010091073A1鸡重鸡重g)饲料饲料A解解(1)列出数据计算表对原始数据作一个线性变换列出数据计算表对原始数据作一个线性变换yij-1000)合计合计4829322221802993A311227490109-1092107A22891221609731数据原始数据数据原始数据-1000)水平水平线性变换不影响方差分析的结果线

17、性变换不影响方差分析的结果取取=0.05.得得0.95(2,21)=3.47, 而而F=3.5953.47.回绝回绝 0.故认为因子故认为因子A是显著的是显著的,即三种饲料对鸡的增重有明显即三种饲料对鸡的增重有明显差别差别.四四. 数据结构式及其参数估计数据结构式及其参数估计1. 数据结构式数据结构式,1,2,., ;1,2,.,ijiijyirjm其中其中为总体均值,为总体均值,i为第为第 i 个水平的效应个水平的效应, 且且10riiij 为试验误差为试验误差,20( ,)ijN 各各相相互互独独立立且且服服从从在上述结构式下在上述结构式下,2(,)ijiyNi=1,r, j=1, ,m

18、且独立且独立2. 点估计点估计 用最大似然估计法可求出一般平均用最大似然估计法可求出一般平均,各主效应各主效应i 和误差方差和误差方差2的估计的估计.总平均总平均的估计的估计:主效应主效应i 的估计的估计:误差方差误差方差2 的估计的估计:各水平均值各水平均值i 的估计的估计:yiiy,1,2,.,iiyyir22111()rmeMijiijSyynn由于它不是由于它不是2 的无偏估计的无偏估计, 实用中采用实用中采用:2eeeSSfnrMSe置信区间置信区间 由于由于且两者独立且两者独立, 故故故故,各水平均值各水平均值i 的的1- 置信区间为置信区间为()()/iieeeytfSfm, S

19、e /2 2 (n - r),2(,)iiyNm1/2()/ieytfm注:单因子试验的统计分析可得如下三个结果注:单因子试验的统计分析可得如下三个结果:(1) 因子因子 A 是否显著是否显著.(2) 试验的误差方差试验的误差方差 2 的估计的估计.(3)各水平均值各水平均值i 的点估计与区间估计的点估计与区间估计.(此项在因子此项在因子A不显著时无需进行不显著时无需进行)五五. 重复数不等情形下的方差分析重复数不等情形下的方差分析1. 数据略有不同数据略有不同 TTn合计合计Tryr1, yr2 ,., yrmrmrr.T2y21, y22 ,., y2m2m2T1y11, y12 ,.,

20、y1m1m1平均和和试验数据试验数据重复数重复数水平水平1y2yryy 设因素设因素 A 有有 r 个水平个水平A1,A2, , Ar . 且第且第 i 水平水平Ai下重复进下重复进行行mi 次试验次试验, i=1, ,r, 获如下数据获如下数据:2. 基本假定、平方和分解、方差分析及判断准则相同基本假定、平方和分解、方差分析及判断准则相同计算公式稍有不同。特别注意计算公式稍有不同。特别注意 SA 的计算公式!的计算公式!统计模型为统计模型为:记记12,1,2,., ;1,2,.,0(0,)ijiijiriiiijyirjmmN各相互独立且服从1iiijjmTyTyniiiTym111irri

21、jiijimTyT111 riiiriimnnm 其中其中2221111(),1iirrTijijTijimmjTSyyyfnn22211(),1 rriAAiiiiiTTSyyfrnmm211(),ireijTAeimijSyySSfnr则各平方和公式为:则各平方和公式为:例例2 茶是一种饮料,它含有叶酸茶是一种饮料,它含有叶酸folacin),这是一种维他命),这是一种维他命B。如今要比较各种茶叶中的叶酸含量。现选定绿茶,这是一个因子,如今要比较各种茶叶中的叶酸含量。现选定绿茶,这是一个因子,用用A表示。又选定四个产地的绿茶,记为表示。又选定四个产地的绿茶,记为A1, A2, A3, A4

22、,它是因,它是因子子A的四个水平。测定试验误差,需要重复。选用不平衡设计,的四个水平。测定试验误差,需要重复。选用不平衡设计,即即A1, A2, A3, A4分别制作了分别制作了7,5,6,6个样品,共有个样品,共有24个样品。试对个样品。试对之进行方差分析,从中可得到什么结果?之进行方差分析,从中可得到什么结果?0.95(3,20)3.10F0H22.09若取显著性水平若取显著性水平=0.05查表可得查表可得由于由于F3.10,故应拒绝原假设,故应拒绝原假设即认为四种绿茶的叶酸平均含量有显著差异即认为四种绿茶的叶酸平均含量有显著差异从方差分析表上还可以获得从方差分析表上还可以获得诸均值的参数

23、估计诸均值的参数估计10.9751(20)/ytm8.272.0860 1.45/78.271.14故均值故均值1的的95%的置信区间是的置信区间是7.13,9.41 考虑:考虑: 方差分析中的检验与两个独立正态总体方差分析中的检验与两个独立正态总体方差未知且相等中均值差的检验有何方差未知且相等中均值差的检验有何异同?异同?补充一:多重比较补充一:多重比较 在确认因子在确认因子 A 的的 r 个水平均值间有显著差异的情况下,进个水平均值间有显著差异的情况下,进一步要问:哪些水平均值间确有显著差异,那些水平均值间无一步要问:哪些水平均值间确有显著差异,那些水平均值间无显著差异,这就要进行多重比较

24、显著差异,这就要进行多重比较 同时比较任意两个水平间有无显著差异的问题称为多同时比较任意两个水平间有无显著差异的问题称为多重比较问题重比较问题121323012013023HHH:,:,:譬如,譬如,r=3 时,同时检验如下三个假设时,同时检验如下三个假设若若r较大,要同时检验较大,要同时检验 个假设,即个假设,即:2rC0,1ijijHijr:多重比较多重比较2(,)ijiyN 0,1ijijHijr:因此拒绝域形式:因此拒绝域形式:ijijijWyyc同时考虑同时考虑考察因子考察因子A的的r个水平,每个水平下重复数为个水平,每个水平下重复数为mi .假设诸试验数据假设诸试验数据iyi,则样

25、本均值,则样本均值应是应是的良好估计,的良好估计,若假设为真,若假设为真,ijyy0ijH 不应过大,过大就应拒绝不应过大,过大就应拒绝下面讨论临界值 cij 的确定:(分两种情况)(1)重复数相等情况的多重比较重复数相等情况的多重比较 (Tukey 法法)ijH0经计算,对给定显著性水平经计算,对给定显著性水平,1( ,)/eecqr fMSm1( ,)eqr f( ,)eq r f其中其中 是统计量是统计量 的抽样分布的的抽样分布的1- 分位数。分位数。拒绝域形式:拒绝域形式:ijijWyyc在各水平试验次数相同时,诸临界值可认为相同,记为在各水平试验次数相同时,诸临界值可认为相同,记为c0,1ijijHijr : 例第一节中例续检验不同饲料对鸡增重的例第一节中例续检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论