




已阅读5页,还剩8页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实验设计与数据处理讲义教案2方差分析(修正均值为) 第2章方差分析2.1概述方差分析(analysis ofvariance)是数理统计的基本方法之一,是分析试验数据的一种有效工具。 方差分析是在20世纪20年代初由英国统计学家费歇尔(R.A.Fisher)所创,最早用于生物学和农业实验,后在工业生产和科学研究中的许多领域广泛应用,取得良好的效果。 一、方差分析的必要性在第1章中,我们已经讨论了两个正态总体均值相等的假设检验问题。 但在实际生产中,经常遇到检验多个正态总体均值是否相等的问题。 例2-1以淀粉为原料生产葡萄糖的过程中,残留有许多糖蜜,可作为生产酱色的原料。 在生产酱色之前应尽可能彻底除杂,以保证酱色质量。 为此,对除杂方法进行选择。 在试验中选用五种不同的除杂方法,每种方法做四次试验,即重复四次,结果见表2-1。 表2-1不同除杂方法的除杂量(g/kg)除杂方法(A i)除杂量(x ij)平均(ix)A125.622.228.029.826.4A224.430.029.027.527.7A325.027.723.032.227.0A428.828.031.525.928.6A520.621.222.021.221.3本试验的目的是判断不同的除杂方法对除杂量是否有显著影响,以便确定最佳除杂方法。 我们可以认为,同一除杂方法重复试验得到的4个数据的差异是由随机误差造成的,而随机误差常常是服从正态分布的,这时除杂量应该有一个理论上的均值。 而对不同的除杂方法,除杂量应该有不同的均值。 这种均值之间的差异是由于除杂方法的不同造成的。 于是我们可以认为,五种除杂方法所得数据是五个均值不同的五个正态总体,且由于试验中其它条件相对稳定,因而可以认为每个总体的方差是相等的,即五个总体具有方差齐性。 这样,判断除杂方法对除杂效果是否有显著影响的问题,就转化为检验五个具有相同方差的正态总体均值是否相同的问题了,即检验假设H0:1=2=3=4=5对于这种多个总体样本均值的假设检验,第1章介绍的方法不再适用,须采用方差分析方法。 二、方差分析的基本思想方差分析的实质就是检验多个正态总体均值是否相等。 那么,如何检验呢?从表2-1可见,20个试验数据(除杂量)是参差不齐的。 数据波动的可能原因两个方面一是由于因素的水平(即除杂方法)不同造成的,事实上,5种除杂方法下的数据平均值i之间确实有差异;二是偶然失误造成的。 从表中数据可见,每一种除杂方法下的4个数据虽然是相同条件下的试验结果,但仍然存在差异。 这是由于试验中存在的偶然因素(如环境、原材料成分、测试技术等的微小而又随机的变化)引起的。 我们把由因素的水平变化引起的试验数据波动称为条件误差;把由随机因素引起的试验数据波动称为随机误差或试验误差。 方差分析的中心要点是把实验数据的总波动分解为两部分,一部分反映由条件误差变化引起的波动;另一部分反映由实验误差引起的波动。 即把数据的总偏差平方和TS分解为反映必然性的各个因素的偏差平方和(S A、S B)与反映偶然性的误差偏差平方和(S e),并计算它们的平均偏差平方和,再将二者进行比较,借助F检验法,检验假设H012=,从而确定因素对试验结果的影响是否显著。 换言之,找出对试验数据起决定性影响的因素(即显著性或高度显著性因素)作为进行定量分析判断的依据。 2.2单因素实验的方差分析 一、问题的提出在进行一项实验中,如果只有一个因素在改变,而其他因素保持固定不变,就被称为单因素实验。 因素变化所划分的等级(或条件)叫做水平(level),对每个水平都要进行若干次重复实验,通常当作一个样本来看待,称为一个“处理”(treatment).为了便于讨论,我们先给出单因素方差分析的一般提法设实验所考察的因素A有m个水平A1,A2,iA,A m,在每个水平上重复进行r次实验,每次实验的可能结果都是一个随机变量。 同一条件下的r次重复实验的可能结果是同一总体的一个样本。 设水平iA的第j次实验值为x ij(i1,2,m;j1,2,r),可得实验数据及计算表的模式如下表2-2单因素试验数据及计算表(水平重复数相等)水平重复试验序号x i.?ix12jr A1A2A iA m11x12xjx1rx121x22xjx2rx21ix2ixijxirx1mx2mxmjxmrx x1.x2.x i.x m.?1x?2x?ix?mx总和1?x2?xjx?rx?x?x表中(1ix,2ixirx)就是iA的一个容量为r的样本。 对应于m个总体,有m个这样的样本值。 试验之后就得到m个样本值。 问题就是要根据这m个样本值,分析试验条件的变化对所考察的指标有无显著影响。 实际上,就是要考察m个总体的数学期望有无显著差异,因而这是一个假设检验的问题。 在表2-2中,?=?=rjij ix x1,?=?=?irjij ixrxrx111?=?=mirjijmiix x x111?=?=?=mimirjij ixnxmrxmx111111mr n= 二、单因素方差分析的前提条件单因素方差分析是建立在下述假设的基础上的 1、每一水平上的实验结果是一个随机变量ijx(i为第i个水平,j为第j次试验),且服从正态分布。 (1ix,2ixirx)是第i个水平的正态总体中抽出的一个简单随机样本,样本容量为r。 2、所有m个不同水平对应的m个正态总体的方差是相等的,即具有方差齐性。 ijxN(i,2) 3、m个总体相互独立,样本与样本之间也相互独立,要检验的假设是H01=2=m若拒绝H0,则认为至少两个水平之间的差异是显著的,因素A对实验结果有显著影响;反之,若接受原假设,则认为因素A对试验结果无显著影响,试验结果在各水平之间的不同仅仅是由于随机因素引起的。 三、单因素方差分析的一般步骤1.单因素方差分析的一般步骤1.偏差平方和的分解把整个试验结果所得的每一观测值x ij对其总平均值.x的偏差进行平方并求总和,就是总的偏差平方和,用S T表示,它反映了全部观测值间的总的差异情况。 S T=?=?mirjijx x112)((2-1)将式(2-1)进行分解S T=?=?mirjijx x112)()() (2)()()()(22112?=?+?+?=?+?=?x x x x x x x xx x x xi i ij i i ijmirji i ij其中?=?mirjii ijx x x x11)()()(11?=?=?rji ij imix x x x)(111?=?=?rjrji ijimix x x x)(1?=?iiimix r x x x0)(1=?=?iiimix x x x又?=?=?=?miimirjix x rx x12112)()(S T=?=?=?+?miimirji ijx xrx x12112)()((2-2)令S A?=?miix xr12)((2-3)它表示各水平(条件)下的平均数与总平均数的偏差平方和,反映了因素A的水平变化所引起的波动,称为组间偏差平方和或因素平方和。 令?=?=mirji ijex xS112)((2-4)它表示各条件(水平)下的试验值与该条件下的平均值之偏差的平方和。 反映了随机误差引起的波动,称为组内偏差平方和或误差平方和。 S T=S A+S e(2-5)这样,我们就将总的偏差平方和分解为组间偏差平方和与组内偏差平方和之和。 2.偏差平方和的简化计算为计算方便,在实际运算中,常用下列简便算法求S T、S A和S e。 S T=?=?+?=?)2()(22112x x x x x xijijmirjij22222222221)()(22?=?=?=+?=+?=xnxnxn xxmr xxmr xmr x xx x x xijijijijijij令Q T?=mirjijx112CT=2)(1?xn则有S T=Q T-CT(2-7)式中?x数据总和CT修正项n数据总个数n=mr m水平数,r每一水平重复试验次数Q T各数据平方之和同理令Q A?=?miixr121则S A=Q ACT(2-8)一般先求出S T和S A,然后再利用S e=S TS A(2-9)求出S e。 计算可在表2-2所示得数据计算表上进行。 3.方差(平均偏差平方和)与自由度偏差平方和的大小,与参加求和的项数有关,为了比较S A与S e的大小,应消除求和项数的影响,用它们的平均值进行比较。 由理论推导可知,S A与S e的平均值,不是把S A和S e分别除以相应的参与求和的项数,而应除以它们的自由度。 S T、S A、S e的自由度分别用f T、f A和f e表示.经理论分析可知f T=mr-1=n-1f A=m-1f e=mr-m=n-m显然,有f Tf Af e(210)上式为偏差平方和自由度分解公式。 因为总自由度f T=n-1是总的数据个数减1,而组间自由度f Am1是因素的水平数减1,都很好计算。 所以一般先求出f T和f A,然后再利用f ef T(组内自由度)f A(组间自由度)(2-11)求出组内自由度f e。 偏差平方和与相应的自由度之比称为平均偏差平方和,简称为均方和或均方或方差,方差均方均方和偏差平方和/自由度=平均偏差平方和因此,组间方差V A和组内方差V e分别为组间方差V A=S A/f A(2-12)组内方差V e=S e/f e(2-13)4.用F检验法进行显著性检验若假设H0为真,即1=2=m那么全体样本可看作同一正态总体N(,2)。 此时可证明ST/f T,S A/f A和S e/f e均为总体方差2的无偏估计值,所以比值F=V A/V e应接近于1,即各平均数之间不存在条件误差,纯属试验误差或随机误差。 如果F值比1大得多,即V A显著地大于V e,就有理由认为原假设不成立,表明S A中不仅包括随机误差,而且包括因素A的水平波动引起的数据波动(称为因素误差),即因素A对试验结果影响显著。 这种比较方差大小来判断原假设H0是否成立的方法,就是“方差分析”名称的由来。 由前面的讨论可知,只要知道此值F的概率分布,就可以用它作为检验假设的统计量。 事实上,可以证明当原假设H0成立时,S A和S e分别为自由度(m-1)和(n-m)的2变量,从而统计量F服从自由度f1=m-1和f2=n-m的分布。 于是对给定的显著水平,可查F分布表求得临界值F,使P(FF)=。 若由样本值求得FF,则认为原假设H0成立,即认为条件的改变对指标无显著影响;若FF,则否定原假设H0,即认为因素A的改变对指标有显著影响。 关于值的选取,视具体情况而定,通常取0.01或0.05,从F分布表查出F0.01和F0.05。 若FF0.01,判定因素A对指标影响特别显著。 称“某因素高度显著”,在方差分析表的“显著性”栏中记“*”;若F0.05 5.制定方差分析表由以上讨论可知,方差分析的步骤基本上就是假设检验的步骤,特殊的只是检验用的统计量是由两个平均偏差平方和之比构成。 这两个偏差平方和分别表示条件误差与试验误差,它们是由总的偏差平方和分解出来的。 因此,在具体进行方差分析时,主要就是要计算这些偏差平方和。 由于计算过程较繁,一般把计算结果列成简明的方差分析表,其格式如表2-3所示。 表2-3方差分析表 四、单因素方差分析实例现在仍以例2-1的试验数据为例,说明单因素方差分析的步骤,方差偏差平方和自由度方差F值F显著性因素A(组间)误差e(组内)S A S e f Af eV AV eF=V A/V e查表F0.05F0.01总和S Tf T表2-1数据的计算表见表2-4。 例2-1五种除杂方法废糖蜜利用解1.计算偏差平方和及自由度?x=6.5232.216.255141=+=?=?i jijx85.131076.523451.)(122=xnCT(13707.85)?ix=?=41jijx,如?1x=?=411jjx=25.6+22.2+28.0+29.8=105.6Q T=?=+=+=514122272.1395424.180724.28202.216.25i jijx?S T=Q T-CT=13954.72-13707.85=246.87f T=mr-1=45-119Q A=?=?=+=mi iiix xr151222.281.13839)0.856.105(41411?S A=Q A-CT=13839.81-13707.85=131.96f A=m-1=5-1=4f e=n-m=20-5=15或f e=f T-f A=19-4=15S e=S T-S A=246.87-131.96114.912.计算方差和F值V A=S A/f A=131.96/4=32.99V e=S e/f e=114.9/15=7.66F=V A/V e=32.99/7.66=4.313.查F值FF(f A,f e)F0.05(4,15)=3.06,F0.01(4,15)=4.894.列出方差分析表表2-5方差分析表由于F0.05(4,15) 2.3双因素试验的方差分析上面讨论了单因素试验的方差分析,即考虑一个因素对试验结果是否有显著影响的问题,但在实际中,影响实验结果的因素往往不只一个而是多个,这时要分析多个因素的作用。 若同时考虑两个因素对试验结果的影响,就要对两个因素试验进行方差分析,称双因素试验的方差分析。 对于双因素试验的方差分析,其基本思想和方法与单因素试验的方差分析相似,关键在于如何把总的偏差平方和进行分解。 前提条件仍然是要满足相互独立、方差齐性和正态分布三个条件。 所不同的是,在双因素试验中,有可能出现交互作用。 一、双因素无重复试验的方差分析1.试验的方差分析1.问题的一般提法某项试验要同时考察因素A和B对试验结果的影响,因素A取A1,A2,A a共a个水平,因素B取B1,B2,B b共b个水平。 A和B两因素的每种水平搭配A iB j各进行一次独立试验,共进行abn次试验,试验数据为x ij,这n个试验数据如表2-7所示。 水平搭配共进行ab=n次试验表2-7双因素无重复试验数据及计算表方差偏差平方和自由度方差F值F显著性因素A(组间)误差e(组内)S A=131.96S e=114.91f A=4f e=15V A=32.99V e=7.664.31查表F0.05(4,15)3.06F0.01(4,15)4.89*总和S T=246.87f T=19因素A因素B B1B2B jB b x i.ix A1A2A iA a x11x12x1jx1b x21x22x2jx2bx i1x i2x ijx ibx a1x a2x ajx abx1.x2.x i.x a.1x.2x.ix.ax x.j jx.x.1x.2x.jx.b1.x2.xjx.bx.x.x表中行求和?=bjij ix x1.(i1,2,a)行平均数.1i ixbx=列求和?=aiij jx x1.(j1,2,b)列平均数j jxax.1=总数据和?=bjjaiibjijaix x x x1.1.11.总平均数.x=x./ab=x./n n=ab要求分别检验A、B两因素对试验结果有无显著影响,即检验假设H01:因素A无显著影响H02:因素B无显著影响2.双因素无重复试验方差分析步骤 (1)偏差平方和的分解为了构造检验用的统计量,与单因素方差分析一样,先对偏差平方和进行分解。 (2)() (2)() 因此,是(2-15)可简记为S T=S AS B+S e(2-16) (2)偏差平方和的简化计算S T=S A+S B+S e=?=?aibjijx x112.)(=?=aibjijx112-n1(x.)2=QT-CT(2-17)S A=b?=?aiix x12.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 入职安全规程培训课件
- 俱乐部饮水安全培训课件
- 狂犬病暴露后免疫球蛋白浸润注射护理查房
- 新质生产力光刻技术
- 绍兴流动广告管理办法
- 税收专家团队管理办法
- 2025年中医内科经络穴位定位考核答案及解析
- 2025年中央一号文件考试题及答案
- 分子云动力学-洞察及研究
- 出租车安全管理培训心得
- 跨流域生态服务权衡-洞察及研究
- 公司意识形态管理制度
- 建筑行业技术总工岗位职责
- 《茶叶加工技术》课件
- 车辆按揭押金合同协议
- 隧道运营养护管理手册上册
- JT-T 495-2025 公路交通安全设施产品质量检验抽样方法
- 通信工程施工现场组织架构及职责
- 实习协议结束正式合同
- 耳穴压豆法在临床中的应用
- 人教版小学三年级下册数学期末检测试题(含答案)共5套
评论
0/150
提交评论