版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、+第八章 单因素方差分析第一节 方差分析的基本问题二、方差分析的几个概念方差分析(analysis of variance)是由英国统计学家于1923年提出的。这种方法是将a个处理的观测值作为一个整体看待,把观测值总变异的分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。“方差分析法”是一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术” ,方差分析实质上是关于观测值变异原因的数量分析。要掌握方差分析的方法,必须先了解以下几个基本概念。这几个概念在科学研究中必须用到,
2、非常重要。1、试验指标(experimental index)为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为。由于试验目的不同,选择的试验指标也不相同。如研究盐处理对玉米生长状况的影响,常用的生长指标是2、试验因素(experimental factor) 4、试验处理(treatment)对于双因素试验时,处理的个数等于两个因素的水平个数的乘积。和这两个因素对酒精产量的影响,是3×3每一个处理可以看作一个总体,每个处理得到的一组数据可以看作是从这个处理总体中抽取的一个样本的数据。:不同原料和不同酒曲对发酵酒精产量(kg/100kg)的影响酒曲种类原料种
3、类玉米高梁水稻ABC5、试验单位(experimental unit) 在试验中能接受不同试验处理的独立的试验载体叫。如植物试验中的一株玉米、一株碱蓬;在畜禽、水产试验中, 一只家禽、一只小白鼠、一位病人,即一个动物、植物或人。有时也用一组实验材料作为一个实验单位,如研究肥料对产量的影响,每种肥料选5块地,每块地是一个试验单位。试验单位是获得观测数据的单位。6、重复(repetition) 在试验中,将一个处理实施在两个或两个以上的试验单位上,称为;处理实施的称为处理的。例如,用100 mMNaCl处理了6株碱蓬,那么这个处理有6个重复;用某种饲料喂4头猪,就说这个处理(饲料)有4次重复。以上
4、几个基本概念是科学实验中几个最重要的常识之一,希望初学者认真体会。方差分析的原理看似复杂,其实很简单。Excel给我们提供了“数据分析”函数,下面要讲的所有运算过程,用Excel函数都可以快速全自动的得出,我们只需要将我们的原始数据输入Excel工作表就可以了。同样,后面要讲的相关和回归分析也完全可以自动运算。三、方差分析的数学模型(以单因素试验为例)(一)单因素试验的数据描述假设某单因素试验有a个处理,每个处理有n次重复,共有an个观测值。其单因素方差分析试验数据的表示方法见表8-4:单因素试验的典型数据表试验次数或重复数实验处理数X1X2X3XiXa1x11x21x31xi1xa12x12
5、x22x32xi2xa23x13x23x33xi3xa3jx1jx2jx3jxijxajnx1nx2nx3nxinxan总计平均值表中数据xij表示第i个处理的第j次观测值,其中的几个符号做如下说明:,表示第i个处理所有数据的和;(i=1,2,a;j1,2,n),表示第i个处理所有数据的平均值。,表示所有处理中全部数据的总和;,全部数据的总平均值;(二)观测值的描述对于上表中的每一个观测值可用线性统计模型描述:其中:xij是在第i水平(处理)下的第j次观测值;为所有观测值的总平均数;i是第i水平的处理效应,即因为此处理而引起的数据的变异;ij是随机误差,即随机抽样误差。方差分析的目的就是要检验
6、处理效应的大小或有无。(三)因素处理效应和实验模型的分类1、固定效应模型如果处理效应是由固定因素所引起的效应,就称为固定效应。固定因素是指因素的水平可以,水平固定后,它的效应值i也是固定的;实验重复时可以得到相同的结果。如表8-1的试验结果发现,盐处理显著促进了碱蓬生长,最适盐浓度为200 mM NaCl,别人重复这个试验也会得到同样的结果。再如我们调查上海、北京、广州、深圳四个城市市的居民收入,调查结果发现,四个城市的居民收入显著不同,上海>深圳>北京广州,其他人调查也会得到同样的结果。可严格人为控制的因素如:几种不同实验温度、几种不同的化学药物浓度、几个不同的小麦品种、几个城市
7、等都属于固定因素。处理固定因素所用的模型称为固定效应模型,简称为固定模型。固定模型的假设是关于xij的假设如表8-1的试验结论“盐处理显著促进碱蓬的生长”只使用于0、100、200、300、400 mM NaCl这5个浓度,不能说“任何盐浓度都可以促进碱蓬生长”。研究北京、上海、广州和深圳的居民收入,发现这四个城市的居民收入有差异,不能说“任意四个城市的居民收入都有差异”。2、随机效应模型如果处理效应是由随机因素所引起的效应,就称为随机效应。若处理随机因素所用的模型称为随机效应模型,简称为随机模型。如探讨不同窝的家兔出生重量是否存在差异,随机选取了4窝家兔,每窝家兔中均随机选了4只幼兔。窝别就
8、是随机因素,任何人都不能再得到完全相同的4窝家兔。调查结果见表8-5:这4窝幼兔中第I窝出生重最大,别人再随机选择4窝家兔,并不一定还是第I窝出生重最大。表8-5的实验结论是:不同窝别的4窝家兔的体重差异显著,别人调查任何4窝家兔也会得到同样的结论。表8-5:4窝家兔的出生重(g)再如调查山东女大学生身高,随机调查了5所大学,每所大学随机调查100名,发现山东各大学女生身高差异不显著。其他人随机调查山东5所大学的女生身高,也会得出同样的结论。从随机因素的a个水平的方差分析所得到的结论,可以推广到这个因素的所有水平上。这里i是一个随机变量,所检验的是关于i的变异性假设。i四、方差分析的原理在一个
9、多处理实验中,得到的一系列观察值数据变异的原因是多方面的。数据的变异可能是处理不同造成的,称为系统误差或处理效应;也可能是随机因素造成的,既抽样的随机性造成的,称为随机误差或试验误差。方差分析的基本思想就是将测量数据的总变异分解为处理效应和试验误差。(一)两类误差1、随机误差在因素的同一水平(同一个总体)下,样本的各观察值之间的差异,称为随机误差。比如,同一盐浓度下的不同碱蓬植株鲜重的差异就是受随机因素的影响,或者说是由于抽样的随机性所造成的。2、系统误差在因素的不同水平(不同总体)下,各观察值之间的存在差异。比如,不同盐浓度处理的碱蓬的植株鲜重不同,这种差异可能是由于抽样的随机性所造成的,也
10、可能是由于盐处理所造成的,盐处理效应所造成的误差是由系统因素造成的,称为系统误差。(二)两类方差1、处理内方差处理内方差指因素的同一水平(同一个总体)下,样本数据的方差。处理内方差只包含随机误差。2、处理间方差处理间方差指因素的不同水平(不同总体)下,各样本之间的方差。处理间方差既包括随机误差和系统误差。(三)方差的比较如果不同盐浓度对植株鲜重没有影响,那么在处理间方差中只包含有随机误差,而没有系统误差。这时,处理间方差与处理内方差就应该很接近,两种方差的比值就会接近1。如果不同的水平对结果有影响,在处理间方差中除了包含随机误差外,还会包含有系统误差,这时处理间方差就会大于处理内方差,处理间方
11、差与处理内方差的比值就会大于1。当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异。m1=m2 =m2 =m4f(X)X图8-1:方差分析原假设图示(四)方差分析的假设(以固定效应模型为例)1、原假设H0:1=2=3=i或者1=2=i=0接受H0表示每个样本都来自均值为µ,方差为2的同一正态总体,各水平间不存在处理效应,每个观测值都是由总平均数加上随机误差造成的。例如研究平均每日食物中肉类比重(0、50、100、250、500克/天)与人的智商的关系?发现吃肉多少对智商影响不大。如图8-1表示,4个总体差异不显著。2、备择假设HA: (i=1,2,3,4)不全相等或者i至少
12、有一个不等于0。如果备择假设成立,表示各水平间有系统误差,四个样本分别来自均值不同的正态总体。如图8-2所示,4个总体差异显著。例如调查上海、北京、广州、深圳四个城市市的居民收入,调查结果发现,四个城市的居民收入显著不同。如图8-2表示,4个总体差异显著。µ1¹µ2¹µ3¹µ4f(X)X图8-2:方差分析备择假设图示方差分析比较的是两类误差(随机误差和系统误差),以检验均值是否相等。比较的基础是方差比,即各部分的误差占总误差的比例。如果系统误差(处理效应)显著地不等于随机误差,则几个总体(处理)均值就是不相等的;反之,均值就
13、是相等的。方差分析的显著性检验是F检验。五、方差分析的检验程序(以单因素试验为例)(一)假设H0:1=2=3=i或者1=2=i=0HA: (i=1,2,3,4)不全相等或者i至少有一个不等于0。(二)确定显著性水平(三)计算统计量1、平方和的计算和分解三种平方和的简便计算公式总平方和,处理间平方和处理内平方和这里C称为矫正项,2、总自由度记为dfT。处理间自由度记为dfA。处理内自由度记为dfe。3、方差(均方)的计算处理间均方:处理内均方:4、显著性检验F检验检验统计量,F值具dfA、dfe自由度。方差分析的方法结合例子很容易理解,本节先对方差分析的程序进行简单介绍。方差分析在科研和社会生活
14、中非常重要。第二节 固定模型的方差分析一、固定模型的方差分析程序(一)提出固定效应模型的假设在固定模型中,i是处理平均数与总平均数的离差,是个常量,因而:。原假设H0:1=2=3=i;或者1=2=i=0备择假设HA:i至少有一个不相等;或至少有一个i不等于0(二)平方和与自由度的分解方差:离差平方和除以n-1,S2=将总变异分解为处理间变异和处理内变异,就是要将总均方分解为处理间均方和处理内均方。全部观测值xij与总平均数的离均差平方和,称为总平方和,它反映的是全部观测值的离散或变异状况,记为。其计算公式为:对于每个固定的,,所以:上式中右边第一项为各处理平均数与总平均数的离均差平方和与重复数
15、n的乘积,反映了重复n次的,称为处理间平方和或处理平方和,记为。上式中右边第二项为各处理内离均差平方和之和,反映了各处理内的变异即,称为处理内平方和或误差平方和,记为。于是有: 三种平方和的简便计算公式如下:总平方和;处理间平方和;处理内平方和这里C称为矫正项,简便公式的证明略!在方差分析中,为了简化计算,同样可以使用,即将全部数据均减去同一个数。所得的平方和不变。以表8-2试验结果为例计算三种平方和,表8-2中的数据都减去65得到下表。株号品 系总和12345先求校正项C,=129.96=277.28-129.96=147.32=147.32-131.74=15.58在计算总平方和时,资料中
16、的各个观测值要受这一条件的约束,故总自由度等于资料中观测值的总个数减1,即an-1。总自由度记为dfT,即因素共有a个水平,所以处理间自由度为处理数减1,处理间自由度记为dfA,即在计算处理内平方和时,因为每个处理均有n-1自由度,共有a个处理,所以处理内自由度为资料中观测值的总个数减a,处理内自由度记为dfe,因为:;处理间均方:;处理内均方:;(三)检验统计量,具dfA、dfe自由度。(四)拒绝域图8-3:方差分析的F值拒绝域原假设H0:1=2=3=i;备择假设HA:i至少有一个不相等;(2)方差分析将表8-2中的数据,都减去65得到表8-6。计算先求校正项C,=129.96=277.28
17、-129.96=147.32,=147.32-131.74=15.58所以,;检验统计量:(4)拒绝域:=0E(MSe)=,E(MSA)=E()=在固定模型中,i是个常量,因此0。所以,E(MSA)=令:,E(MSA)=,E(MSe)=检验统计量:当F<F时,则说明与0相差不大,或者说各处理平均数; ();表8-7:(µmol/L)病人编号病人类型正常人糖尿病患者肾衰患者肝病患者12345方差分析方法参照例1进行整理,本节略!第三节 随机效应模型观测值的描述在单因素试验中,若用于试验的a个水平是从该因素的水平总体中随机选出的,那么这一因素称为随机因素。其方差分析是通过随机选取的
18、a个水平对该因素的水平总体做推断。单因素随机效应模型中的每一个观测值的描述与固定模型相同。其中:xij是在第i水平(处理)下的第j次观测值;为所有观测值的总平均数;i是第i水平的处理效应;ij是随机误差。其中i和ij都是随机变量,且二者相互独立。如果i的方差为,xij+。因为i是独立的随机变量,所以固定效应模型中的零假设H0:1=2=i=0在随机效应模型中就不再适用。随机模型的零假设为:H0:;备择假设HA:。二、随机模型的方差分析程序若参加实验的a个水平是从该因素的水平总体中随机选出的,那么这一因素称为随机因素,如动物的窝别。其方差分析是通过随机选取的a个水平对该因素的水平总体做推断。所要检
19、验的是i的变异性。所以,随机效应得零假设H0:=0;备择假设HA:>0。接受零假设表示处理之间无差异,接受备择假设表示处理之间有显著差异。零假设H0:=0;备择假设HA:>0先求校正项C,=7.84=185.36-7.84=177.52SSe=SST-SSA=177.52-58.575=118.945;,F0.05,3,12=3.490,F<F0.05结论:不同窝别家兔出生重差异不显著表8-8:4窝家兔的出生重的方差分析表(编码后)E(MSe)=,E(MSA)=E()=因为0,令,所以E(MSA)=。固定模型中:E(MSA)=,0;检验统计量:当F<F时,则说明各处理平均数1、先计算(1)当各处理重复数n1n2n时,n各处理的重复数(2)当各处理的重复次数不同时,需先计算各ni的平均数n0:n0,a为处理数。2、;处理平均数,表示。,这里加上绝对值,用上侧检验。当n1=n2=n时 ,上式可以进一步简化为:其中(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山西省朔州市李林中学2026届数学高二上期末复习检测模拟试题含解析
- 北京丰台区北京第十二中学2026届高二数学第一学期期末综合测试模拟试题含解析
- 怒江市重点中学2026届高二上数学期末达标检测模拟试题含解析
- 厦门市重点中学2026届生物高三第一学期期末联考模拟试题含解析
- 2026届新疆昌吉二中生物高三第一学期期末达标检测试题含解析
- 2026届安徽省定远县民族中学生物高一上期末考试试题含解析
- 辽宁省阜新市阜蒙县育才高级中学2026届高二生物第一学期期末学业水平测试模拟试题含解析
- 2026届福建省泉州市十六中高一上数学期末预测试题含解析
- 云南省华宁二中2026届数学高三上期末复习检测试题含解析
- 2026届安徽省六安市舒城中学生物高三上期末监测试题含解析
- 2025 版普通高中化学课程标准对比
- 肝硬化病人的护理查房
- 2025年中华人民共和国食品安全法培训考试试题及答案
- 潜孔锤钻进技术施工方案
- (12)普通高中技术与工程课程标准日常修订版(2017年版2025年修订)
- 【正版授权】 ISO 11154:2023/Amd 1:2025 EN Road vehicles - Roof load carriers - Amendment 1
- 铁路保密知识培训讲义课件
- 海南国际商业航天发射有限公司笔试题
- 2025上海市自强社会服务总社招聘禁毒社会工作者7人考试参考题库及答案解析
- GB/T 46161.1-2025道路车辆气压制动系第1部分:管、端面密封外螺纹接头和螺纹孔
- 福建省漳州市2024-2025学年七年级上学期期末考试英语试题(A)
评论
0/150
提交评论