(方差分析)ANOVA_第1页
(方差分析)ANOVA_第2页
(方差分析)ANOVA_第3页
(方差分析)ANOVA_第4页
(方差分析)ANOVA_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、方差分析方差分析 (ANOVA) ANOVA概念概念平方和平方和ANOVA表表ANOVA盒状图盒状图, 多样比较多样比较主要效果图主要效果图主要结果图主要结果图双因素双因素 ANOVA双因素模型双因素模型均值分析均值分析残差分析残差分析等值方差检验等值方差检验ANOVA - 2学习目标学习目标概念性认识“方差分析”和“ANOVA表” 设计并实施一个“单因素”或“双因素”实验认识并解释 交叉作用充分认识 ANOVA假定模型并知道如何加以实施认识并应用多样比较为学习更复杂的设计打下坚实基础ANOVA - 3从中学到什么从中学到什么?从一个简单方法中获得经验, 了解过程知识知道如何设计并分析一个简单

2、实验提高从少量数据中获得结论的能力进一步认识图形工具在数据中应用分析多因素对一个同步反应的效果ANOVA - 4是否存在差异是否存在差异?反应反应10203040501 2 3x因素因素AxxANOVA - 5概念性概念性ANOVA现在我们有了更多一些数据因素 A,是否存在差异? 为什么或为什么不?10203040501 2 3xxx反应反应因素因素 AANOVA - 6概念性概念性 ANOVA10203040501 2 3xxx产出产出因素因素A现在你如何认为? 因素A是否存在差异? 为什么或为什么不?ANOVA - 7单因素实验单因素实验单向方差分析(ANOVA)是比较两组以上数据均值的统

3、计方法假设实验为:简单地说, ANOVA检测群体均值是否存在差异. ANOVA并不告诉我们那一个存在差异;我们要靠多重比较过程来补充ANOVA加以获得为什么不仅仅进行 t检验?different is oneleast At :Ha. :Hokk4321ANOVA - 8有关有关ANOVA的问题的问题4个群体均值是否存在差异?4321o :Hdifferent is oneleast At :Hka(至少一个 uk 是不同的)ANOVA - 9方差分析方差分析ANOVA 观察3个变动来源:n总体间总体间 所有观测之间的总体方差n之间之间 子群(因素)均值间的差异n之内之内 各个子群内的随机方差

4、(干扰,或统计误差)总体总体 = 两者间两者间 + 之内之内“子群间的方差子群间的方差”“子群内的方差子群内的方差”用控制图用控制图加以类比加以类比ANOVA - 10432170656055 FactorResponseyi,j = 个别测量y = 实验的总均值yj = 群体均值i = 代表在代表在 jth群体中的一个数据点群体中的一个数据点j = 代表代表 jth 群体群体g = 群体总数群体总数基本知识基本知识 平方和平方和ANOVA - 11平方和平方和 公式公式 (Formula)SS(总总) = 实验总平方和实验总平方和 (个别个别 - 总均值总均值)SS(因素因素) = 因素平方

5、和因素平方和 (群体均值群体均值 - 总均值总均值)SS(误差误差) = 群体中的平方和群体中的平方和 (个别(个别 - 群体均值群体均值)SS(Error) SS(Factor) SS(Total) 11112122)()()(gjnigjnijijgjjjijjjyyyynyy通过比较平方和我们能判断一个观测到的差异是确实存在的差异还是随机出现的ANOVA - 12ANOVA平方和平方和我们可以将总平方和分成两部分 (之间和之内)如果我们注意的因素在一般程度上没有影响,那么这两个估计 (多者之间和两者之间) 应完全相等,并且我们可以得出结论所有子群均来自一个大的群体当这两个估计 (多者之间

6、和两者之间) 存在显著不同时,我们将这一不同归结为子群均值的差异ANOVA - 13ANOVA 零假设零假设和和替代假设替代假设different is oneleast At :Ha :Hok4321为了判定我们应接受或否定零假设,我们须使用下一幻灯片介绍的方差分析表来计算检验数据(F比率) ANOVA - 14建立建立 “ANOVA”表表为什么来源 “同者之内”成为误差或干扰?来源来源 SS df MS (=SS/df)F =MS(Factor)/MS(Error)两者之间两者之间SS(Factor)g - 1SS (factor)/df factorMS(Factor) / MS(Err

7、or)同者之内同者之内SS(Error)SS(Error) / df error总计总计SS(Total)11gjjngjjn11ANOVA - 15ANOVA 地毯范例地毯范例一个工程师正研制更为耐用的地毯大部分的顾客意见集中在地毯的一种称为压缩变形的磨损上压缩变形是指地毯受压厚度降低这一数据集包含了4个地毯安装后30天的数据ANOVA - 16是否有一个地毯比其他耐用是否有一个地毯比其他耐用?如果可以的话,我们如何判断4个地毯中哪个最耐用?每个样本都在安装30天后加以测量.在这一实验中你还应注意到什么?耐用度的值越高越好ANOVA - 17单向单向 ANOVA输入 Response 以及

8、the FactorANOVA - 18盒状图盒状图: 你如何认为你如何认为?4321201510CarpetDurabilityBoxplots of Durabili by Carpet(means are indicated by solid circles)从中归纳出什么? 你将购买哪个地毯?将不购买哪个地毯?ANOVA - 19ANOVA 表表 Carpet磨损磨损单乡单乡 ANOVA: 耐用度与耐用度与 地毯地毯耐用度方差分析来源 DF SS MS F P地毯 3 111.6 37.2 2.60 0.101误差 12 172.0 14.3总计 15 283.6 Individual

9、 95% CIs For Mean Based on Pooled StDev水平 N 均值 StDev -+-+-+-1 4 14.483 3.157 (-*-) 2 4 9.735 3.566 (-*-) 3 4 12.808 1.506 (-*-) 4 4 17.005 5.691 (-*-) -+-+-+-Pooled StDev = 3.786 10.0 15.0 20.0从 ANOVA表中能归纳出什么?ANOVA - 20“自由度自由度”是什么是什么?在ANOVA中, 自由度表示如下:ndftotal = N-1 = # of observations - 1ndffactor =

10、 L-1 = # of levels - 1ndfinteraction = dffactorA X dffactorBndferror = dftotal - dfeverything else statisticsincurrencyfreedomofdegrees我们每收集一个数据点就获得我们每收集一个数据点就获得 一个自由度一个自由度.我们每估计一个参数就我们每估计一个参数就消耗消耗一个自由度一个自由度.ANOVA - 21“自由度自由度”是什么是什么?在ANOVA中, 自由度表示如下:ndftotal = N-1 = # of observations - 1ndffactor =

11、L-1 = # of levels - 1ndfinteraction = dffactorA X dffactorBndferror = dftotal - dfeverything else 我们对包括五个水平的因素进行检验,并对每个因素水平收集七个数据点我们要进行多少次观察? 5 个水平 x每个水平 7次观察=35 总观察数总共有多少自由度? 35 - 1 = 34有多少自由度用于估计因素效果? 5个水平 - 1 = 4有多少自由度用于估计误差? 34 总数 - 4 个水平 = 30 个自由度 ANOVA - 22单向单向ANOVA模型模型当进行单向 ANOVA时, 可建立一个线形统计模

12、型来描述对i个水平进行观察,每个水平进行j次观察模型采取如下形式:ijiijy其中yij表示第ij次观察, 是总均值, (tau)表示第I个水平效果, ij 表示随机误差ANOVA - 23单向ANOVA模型常常指的是一种混合效果模型 :在选择这一模型时应进行一定假定,并加以确定以保证我们结论的有效性在我们的统计分析中,建模起着核心作用以确保课程的平衡性. 在方差因素和简单线形回归学习中我们已经进行过建模. 在双因素ANOVA,多元回归, 实验设计以及表面设计反应中将有更多的建模工作ijiijy单向单向ANOVA模型模型ANOVA - 24主要主要ANOVA假定假定模型误差假定服从正态分布且均

13、值为零,模型误差同时假定为随机分布n残差分析有助于我们对此加以确定 对所有因素水平,假定方差值一定n对等值方差的残差分析和检验将有助于此假定样本来自正态分布的群体n还记得正态概率图吗?ANOVA - 25残差分析残差分析残差图不应表现与任何因素相关的形态,包括拟合值残差与拟合值的平均值应为零残差应接近正态分布注意: 在方差的固定效果分析中, 稍微偏离残差的正态性问题不大ANOVA - 26模型适当性模型适当性更多的好消息更多的好消息通过选择适当的样本规模并随机进行实验,你的实验将服从正态性 (记住中心极限定理)虽然一般假定需要进行确认,但在设计和操作实验时,可以采取一定的预防措施来防止一些一般

14、误差的发生从一开始应保证实验的统一性ANOVA - 27单向单向ANOVA Wrap Up在进行双向ANOVA分析时,我们通常进行模型假设的检验RECAPPING 单向ANOVA方法1. 选择完整的样本规模和因素水平2. 随机进行实验并收集数据3. 进行ANOVA分析4. 如有需要使用Pairwise 对比5. 进行残差,方差和正态假定的检验6. 建立主效果图,区间图,等等.7. 得出结论这一简要过程并不表示完整程序你可假如哪些其他项目? ANOVA - 28单向与双向单向与双向ANOVA在单向ANOVA中,我们检验单因素的不同水平如何影响一个相关变量在双向ANOVA中,我们检验双因素的不同水

15、平与其交互作用如何影响一个相关变量ANOVA - 29双向双向ANOVA 现在我们可以考虑双因素现在我们可以考虑双因素在较高水平中, 一个双向ANOVA (双因素) 可以看作双因素实验因素可以在不同水平中取得; 你不用局限于两个水平低低高高低低高高AB6965828063594442ANOVA - 30双向双向ANOVA实验常常涉及到超过一个因素的研究因素设计是很有效的方法,其中因素水平的组合是通过评估确定的设计检验由不同水平的因素及其相互作用引起的反应的效果在单向ANOVA的情况中,我们要建立一个模型并检验一些假定ANOVA - 31双因素因素设计双因素因素设计一般双因素因素实验采用如下表格

16、,在单因素ANOVA情况下,实验的随机性很重要:在实验中,因素A具有从1到a的水平,因素B具有从1到b 的水平,将1到n复制一遍通常更倾向于均衡设计 (每次操作的观察次数一致),因为这可以防止方差的一切不均等 Factor B12. . .b1Factor A2.aANOVA - 32双因素因素设计双因素因素设计双因素实验中的模型采用如下形式:ijkijjiijky)(其中: 是总均值 i 是A的第I水平的效果 (行因素) j是 B的第 j水平的效果 (列因素) ()ij 是相互作用的效果, ijk 是随机误差.ANOVA - 33ijkijjiijky)(ijkijj i ijky ) (i

17、jkijj iijky ) (ijkijjiijky ) (行效果-因素A = 0列效果-因素B = 0相互作用效果 = 0双向双向ANOVA 零假设零假设双向ANOVA中的零假设 是指上述等式中的系数为零,表示为ANOVA - 34双因素因素设计双因素因素设计如同单因素方差分析一样,总变量可以分为因素的平方和 : SST= SSA+ SSB + SSAB + SSe条件是: nSST 是总平方和, nSSA 是因素 A的平方和, nSSB是因素 B 的平方和, nSSAB 是由于A与B的作用而得到的平方和nSSe 是误差的平方和ANOVA - 35双向双向 ANOVA 自由度自由度于是SSA

18、B、dfAB可剖分为:各项平方和、自由度及均方的计算公式如下:矫正数 总平方和与自由度 水平组合平方和与自由度 A因素平方和与自由度 B因素平方和与自由度 交互作用平方和与自由度 误差平方和与自由度 BABAABBABAABdfdfdfdfSSSSSSSSabnxC/2.12abndfCxSSTijlT,112.abdfCxbSSABijAB,112.adfCxbnSSAiA,112. .bdfCxanSSBjB,) 1)(1(,badfSSSSSSSSBABAABBA) 1(,nabdfSSSSSSeABTeANOVA - 36双向双向 ANOVA 自由度自由度每个平方和都与自由度相关:So

19、urceSum of SquaresDegrees of FreedomMean SquareF0Factor ASSAa - 11aSSMSAAEAMSMSF 0Factor BSSBb - 11bSSMSBBEBMSMSF 0InteractionSSAB(a - 1)(b - 1) 1)(1(baSSMSABABEABMSMSF 0ErrorSSEab(n - 1) 1( nabSSMSEETotalSSTabn - 1ANOVA - 37双因素双因素ANOVA与浮游生物与浮游生物你作为生物学家,正研究浮游生物如何生活在两个湖里你在实验室建起十二个水箱,每六个装着一个湖里的水 将三种营养

20、物质中的一种加到每个水箱中,30天后计算每一单位体积水中的浮游生物数由于浮游生物是食物链的最底层,你要补充它在湖里的数量以保持湖里的生态ANOVA - 38浮游生物浮游生物?双向ANOVA: 浮游生物 与, 湖Zooplank方差分析来源 DF SS MS F P营养成分 2 1919 959 9.25 0.015湖 1 21 21 0.21 0.666相互作用 2 561 281 2.71 0.145误差 6 622 104总计 11 3123 Individual 95% CI营养成分 均值 -+-+-+-+-1 43.5 (-*-)2 68.3 (-*-)3 39.8 (-*-) -+-+-+-+- 30.0 45.0 60.0 75.0 Individual 95% CI湖 均值 -+-+-+-+-Denniso

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论