版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章方差分析在第四章中,我们讨论过两个正态总体的均数比较的问题。在实际情况中还会遇到多个(三个及三个以上)正态总体的均数比较的问题。例如,某因素对试验结果的影响时,我们取该因素的k(3)个等级(水平)再比较各水平间试验结果的差异。又如,要观察两个因素,对试验结果的影响,分别取这两因素的r个与s个水平,搭配后有种情况,再比较种情况间试验结果的差异,它们分别属于k个与个正态总体的均数比较问题。方差分析是以两个方差之比为统计量,处理多个正态总体均数比较问题的统计方法。本章将要介绍单因素与双因素方差分析的原理与方法。§5-1 单因素方差分析在实验工作中,有时我们把其他一切因素都安排在固定不
2、变的状态,只就某一个因素进行实验,先确定这个因素的若干个等级,通常我们称之为水平,然后在每一个等级里做若干重复试验,以确定该因素对试验结果的影响,这种试验方法,统计学称为单因素试验。下面我们主要讨论单因素试验的方差分析。首先,我们把要考察的因素分成k个水平,而每个水平,我们做ni(i=1,2,k)次试验,假定试验都是独立的,于是就可以得到样本观测值xxj,如表5-1。我们的任务是:根据k个水平的样本观测值来检验因素的影响是否显著。为此,先确定研究这个问题的前提:(1) 对于所研究因素的某一个水平,比如第i个水平,进行试验得到的观测结果xi1,xi2,xini,看做是从正态总体N(,)中得到的容
3、量为ni的样本。(2) 对于表示k个水平的k个正态总体的方差认为是相等的,即=。(3) 从不同总体中取出的各个样本,即各xij是相互独立的。有了以上前提条件,检验因素的影响是否显著,实际上就是检验k个具有相同方差的正态总体,其均数是否相等的问题,也就是检验假设H0:1=2=k。分析一下试验数据,可以看到,由于抽样各水平内部的样本值是有差异的,这差异是相同条件下试验数据的差异,显然是试验误差,也称随机误差。另外,各水平的均数之间,也有差异,这时实验水平不同了,那么这个差异究竟只是试验误差,还是由于试验水平不同引起的差异即不同水平所引起的系统误差呢?解决这个问题的思路是对两者进行比较;若后者存在,
4、且大于前者,后者与前者的比值大到一定程度,说明各水平的总体均数之间的差异显著地大于重复试验中误差的总大小,那么,我们就认为各水平的总体均数之间差异有显著意义,否则差异没有显著意义。下面我们推导出方差分析的统计方法。表5-1实验号水 平12Ik1x11x21xi1xk12x12x22xi2xk2Jx1jx2jxijxkjNix1x2xixkx1x2xixk注:为使用方便本表没有按数学中严格的行列标号排列。5-1.1 方差分析的原理与步骤设k个相互独立的样本,分别来自k个正态总体X1,X2,,Xi,Xk,即XiN(,)(i=1,2,k)其中,i,均未知,但方差相等:=这里可以看做同一因素在k种不同
5、水平下试验得k组样本值。记xi1,xi2,xi3,xini是第i个总体水平Xi中取得的一组容量为ni个样本值。检验假设H0:1=2=k设试验总次数为N,则。设第i个总体的样本均数为,则于是,全体样本的总均数为现在,我们来考察,分析刻画全部数据离散程度的指标,即所有样本值xij与其总均数之差的平方和,称为总离差平方和SS。 (5-1)因为所以 (5-2)从上式可以看出,总离差平方和SS可以分解为两项之和, (5-3)称为组内离差平方和,它表示各个样本值对本组均数的离差平方和的总和。 (5-4)称为组间离差平方和,它表示各组均数对总均数的离差平方和的总和。由此,可以得到一个很重要的结论,可以说是方
6、差分析的理论基础,这就是,总离差平方和是组内离差平方和与组间离差平方和的总和。那么式(5-2)可以改写为 (5-5)由式可知,SSe的自由度为N-k,而由式可知,SSA的自由度为k-1,所以组内方差和组间方差分别为 (5-6)现在来讨论应采用什么统计量,以及统计量的分布。当H0:1=2=k成立时,并且由前提条件独立同方差,可知即统计量F服从自由度为(k-1,N-k)的F分布,当给定显著水平,可由F分布临界值表(附表8)查得临界值F(k-1,N-k),使PFF(k-1,N-k)=最后,根据上述的推证,可得出结论,当统计量FF(k-1,N-k)时,则拒绝假设H0,认为在显著水平下,因素各水平间差异
7、有显著意义,否则,不拒绝假设,认为水平间差异没有显著意义。5-1.2 单因素方差分析的计算依照上面的推导可以进行方差分析,但为了便于计算,我们推导出离差平方和的另一种形式以上两式只要将定义式展开即可得到利用上面两式计算SSA和SSe,可按下列顺序依次进行:(每一水平实际数据和) (所有数据总和)最后可得:将结果汇总于方差分析表内(见表5-2)表5-2方差来源离差平方和自由度方差F值拒绝域组间 (显著水平)组内总和5-1.3 方差齐性检验的步骤方差分析的前提条件一是方差齐,因此在进行方差分析前应先进行方差齐性检验。下面简单介绍检验多个方差齐性的Bartlett法。一、各样本含量相等时检验方差齐性
8、的步骤(1) ;(2) 计算: (5-7)式中:n为各样本含量,k是样本数,是各样本方差,;(3) 查表,求出临界值若,则认为方差齐。注意:利用上述公式计算得到的值略有一些偏倚(即值稍微偏高)。在值很接近地大于某一临界值时,须计算校正的值,校正公式如下:校正, 校正数二、各样本含量不等时检验方差齐性的步骤:(1) ;(2) 计算: (5-8)式中:n为各样本含量,k是样本数,是各样本方差,;(3) 查表,求出临界值若,则认为方差齐。此时,校正,校正数。有关方差齐性检验说明两点:(1)式(5-8)有等价的公式为合并方差) (5-9)(2)对方差分析前是否先进行方差齐性检验有两种不同意见,一种是方
9、差分析前先要进行方差齐性检验,如方差不齐,那么不能用方差分析法;如方差齐,则可进行方差分析。如不问是否齐性,就进行方差分析,那会得出不切实际的结果,另一种意见是Bartlett方差齐性检验法,并不十分理想,所以对方差齐性不必太苛求。我们主张前者。下面按上述步骤来分析实例。例1 为考察工艺对花粉中的氨基酸百分含量的影响,某药厂用四种不同工艺对花粉进行处理,测得氨基酸百分含量如表5-3。试判断四种不同工艺处理间的氨基酸百分含量有无显著性差异?表5-3实验号工 艺()()()()酸处理碱处理破壁水浸后醇提取14.6363.5814.6503.44924.6203.6514.7283.47434.54
10、53.5074.6043.38444.6953.5384.6973.34318.49614.27718.67913.65065.102342.102203.832348.905186.3221081.16185.53750.97087.23546.591270.333解 本题是检验四个水平的总体均数i之间差异是否有显著意义。先做方差齐性检验(如表5-4)表5-4 方差齐性检验用表(样本含量相等)样本10.003814-2.41861931120.003891-2.40993876930.002950-2.53017798440.003586-2.445389715合计0.014241-9.80
11、4125779, 即各样本方差的差别无显著意义,方差齐。(1) 检验假设H0:1=2=3=4。(2) 计算离差平方和、方差及统计量F值n1=n2=n3=n4,k=4,N=4×4=16fA=k-1=4-1=3,fe=N-k=16-4=12所以统计量(3) 在显著水平=0.05,自由度fA=3,fe=12查附表8得临界值F0.05(3,12)=3.49,在=0.01,自由度fA=3,fe=12,查附表8得临界值F0.01(3,12)=5.95。(4) 统计结论因F=502.5145.95,所以拒绝H0,P0.01,认为工艺对花粉中氨基酸百分含量影响极显著。列出方差分析如表5-5。表5-5
12、方差来源离差平方和自由度方差F值临界值结论组间SSA=5.39831.799502.5145.95FF0.01组内SSe=0.043120.00358差异有极显著意义总和SS=5.44115例2 有六种不同的中药杀虫剂,为了分析它们的杀虫效果,对其杀虫率做了如下试验,试验结果如表5-5,推断这六种杀虫剂的杀虫效果差异是否有显著意义。表5-6药物一二三四五六杀虫率87.490.556.255.092.075.285.088.562.448.299.272.380.287.395.381.394.791.5252.6361.0118.6103.2378.0228.81442.2263806.761
13、30321.014065.9610650.2414288452349.44414077.421295.832611.887052.25348.2435758.9817492.02119559.12先做方差齐性检验,见表5-7表5-7 方差齐性检验用表(样本含量不等)样本1213.440026.88001.12842.25682310.543331.63001.02303.06893119.220019.22001.28381.28384123.120023.12001.36401.36405312.660037.98001.10243.30736221.103342.20671.32442.6
14、4887合计12100.0867181.03677.225913.9295因为 P>0.05方差齐,故可做方差分析解N=3+4+2+2+4+3=18, k=6所以fA=k-1=6-1=5fe=N-k=18-6=12 =(21268.93+32580.25+7032.98+5325.12 +35721.0+17449.81)-115552.27=3825.81统计量显著水平=0.05,自由度fA=5,fe=12,查附表8得临界值F0.05(5,12)=3.11,显著水平=0.01,查附表8得临界值F0.01(5,12)=5.06,因F=50.715.06,所以拒绝H0,在显著水平0.01下
15、,六种不同杀虫剂效果的差异有极显著意义(见表5-8)。表5-8方差来源离差平方和自由度方差F值临界值结论组 间SSA=3825.8112=765.1650.71F0.01=5.06FF0.01组 内SSe=181.04512=15.09差异有极显著意义总 和SS=4006.8517§5-2 两两间多重比较的检验法上节介绍的方差分析,如果各水平间差异无显著意义,那么不需做进一步统计处理,如果是否定了假设H0,意味着1,2,k中至少有两个差异显著,但是哪些水平间的差异显著,哪些水平间的差异不显著,方差分析不能作结论。这就需要同时在多个水平均数之间两两比较哪些差异是有显著意义?这种比较称为
16、多重比较。多重比较的方法很多,下面介绍两种主要多重比较的方法。5-2.1 q检验法(HSD法)当因素取k个水平,而每个水平都做n次试验,也就是说每个样本的大小相等,其组内方差为,自由度为fe=N-k,方差分析的结果是总体均数间差异有显著意义,我们将用q检验法进行检验两两均数间是否差异显著。设有k个相互独立,等方差的正态总体XiN(i,2),i=1,2,k,若从每个总体中各独立、随机地抽取容量为n的样本,样本值的均数分别为x1,x2,xk,为组内方差,其自由度为fe,记极差随机变量服从q分布,记为qq(k,fe)。检验假设H0:1=2=k。令H0成立,采用统计量如果给定显著水平,由多重比较中的q
17、表(附表9),可查得临值q(k,fe),满足表中Pqq(k,fe)=若qq(k,fe),则以显著水平拒绝H0。为了便于作多重比较,不必机械地按上述三个步骤进行,我们不妨把否定域qq(k,fe)即写成当需要比较任意两个总体的均数h和l时,由于下式总是成立,所以只要便可以认为hl。这样,多重比较的q检验就十分简单了,归纳步骤如下:(1) 计算k个总体的样本均数x1,x2,,xk,和样本的组内方差,其自由度为fe;(2) 给定显著水平,根据k和fe从q表中查出临界值q(k,fe)。(3) 以为标准衡量所有的,凡某两个样本均数之差的绝对值超过DT者,便可以认为相应的两总体均数有显著性差异。例1 对上一
18、节例1中四个水平(工艺)下花粉的氨基酸百分含量作两两多重比较。解 题中,组内方差,查多重比较中q的表(附表9),得q0.05(4,12)=4.20,q0.01(4,12)=5.50,计算DT值。现将四个均数两两间差数的绝对值列表如下(表5-9),逐个比较,以免不漏不重:表5-9=3.569=4.670=3.412=4.6241.055*0.0461.212*=3.5691.107*0.157*=4.6701.258*打“*”的,表示相应两工艺间的差异有极显著意义(=0.01),打“*”的表示相应两工艺间差异有显著意义(=0.05),没有记号的表示相应两工艺间的差异无统计意义。5-2.2 S检验
19、法用q检验法作两两间多重比较,要求各水平的重复试验次数必须相等,才能使用,对于不同水平的试验次数不等的情况我们这里介绍一种S检验法。假设试验因素共k个水平,各水平分别作ni次试验(i=1,2,,k),经方差分析结果各水平之间差异显著,现在比较总体均数h,l(h,l=1,2,,k)之间差异是否有显著意义。检验假设 H0:1=2=k令H0成立,我们采用统计量在显著水平下,由多重比较中的S表可查得临界值S(k-1,fe),使PSS(k-1,fe)=若则以显著水平拒绝H0。类似q检验法,我们将S检验法归纳成以下几个步骤:(1) 计算k个总体的样本均数, ,,和组内方差,其自由度为;(2) 给定显著水平
20、,从S表(附表10)中查出;(3) 以衡量,如果超出Dhl者,便可以认为相应的两个总体均数有显著性差异。例2 本章§1中例2,六种杀虫剂的杀虫率,经方差分析差异有显著意义,而各杀虫剂取的样本容量不等,用检验法比较各种杀虫剂的杀虫率之间的差异。由前面计算已得:k=6,n1=3,n2=4,n3=2,n4=2,n5=4,n6=3,=84.2 =90.25 =59.3=51.6 =94.5 =76.27所以N=18,fe=12,又=15.09,Se=3.88。我们取显著水平=0.05,查多重比较的S表(附表10),得S0.05(5,12)=3.94,所以Se·S0.05(5,12)
21、=3.88×3.94=15.29,根据本题的实际情况,需计算15个Dhl:(是否需要换位置)根据上面结果有比较结果看出,第三、四两种药剂与其他药剂均有显著差异,杀虫率较差,六次之。§5-3 两因素试验的方差分析5-3.1 无重复试验进行两因素方差分析的目的,是要检验两个因素对试验结果有无影响。在试验中,对每个因素的每个等级都可以取nij个样本。这里,我们先讨论无重复试验的情况。将因素A分成r个水平,因素B分成S个水平,而对因素A、B的每一个水平的一对组合(Ai,Bj)(i=1,2,,r,j=1,2,,s),只进行一次试验(无重复试验),则得到了r×s个试验结果xi
22、j,现将试验结果列成表(表5-10):表5-10因素A因素B行和行平均B1B2BjBsTiA1x11x12x1jx1sT1A2x21x22x2jx2sT2Aixi1xi2xijxisTiArxr1xr2xrjxrsTr列 和T.1T.2T.jT.s总和T列平均总平均注:其中xij表示用因素A的第i个水平和因素B的第j个水平进行试验所得到的试验结果。根据表中情况,可得 (i=1,2,r) (j=1,2,s) 这里n=r×s我们依旧假设因素A、因素B都满足单因素方差分析中的前提条件。两因素方差分析,如果目的要判断因素A的影响是否显著,则要检验假设H0A:1j=2j=ij=rj(j=1,2
23、,,s)如果假设成立,则可以认为因素A的影响不显著。类似地,如果要判断因素B的影响是否显著,则要检验假设H0B:i1=i2=ij=is(i=1,2,,r)。与单因素方差分析的检验方法一样,首先把总的离差平方和SS进行分解,分解成三部分,即因素A、B和随机误差所产生的离差平方和,分别记为SSA,SSB,SSe,然后进行比较,得到关于假设H0A,H0B的检验方法。下面我们来讨论其方法与步骤,首先计算总离差平方和SS。在上式等号右边中,后三项均为零。当我们设则有如果H0A和H0B都成立,则有ij=,对所有的i=1,2,,r及j=1,2,,s都成立,也就是说r×s个样本来自同一个总体,与单因
24、素的分析一样,可以得到, , 而且SSe、SSA、SSB相互独立。选取统计量同理可得如果假设H0A成立,则如果假设H0B成立,则对于给定的,可以通过(附表8)查到F临界值,当时,拒绝假设H0A;当时,拒绝假设H0B;反之,皆不能否定原假设。上述步骤列表如下(表5-11):与单因素方差分析一样,为了便于计算,常采用下面一些公式:设则表5-11方差来源离差平方和自由度F的值F临界值因素Ar-1因素Bs-1误差(r-1)(s-1)总和rs-1例1 据推测,原料的粒度和水分可能影响某片剂的贮存期,现留样考察粗粒和细粒两种规格,含水5%、3%和1%三种情况,抽样测定恒温加热一小时后的剩余含量,数据如表5
25、-12,试判断这两个因素对片剂的贮存期是否有影响?表5-12含水量(%)粒 度0粗(1)细(2)586.8884.83171.7114744.263329484.324389.8685.86175.7215446.759230877.5184189.9184.83174.7415279.937030534.0676266.65255.52522.1745470.959590895.91023706.762121764.197471102.222565290.4704136392.6929解 这里r=3,s=2。根据计算公式,得列方差分析表如表5-13:表5-13方差来源离差平方和自由度F值F临
26、界值含水量ASSA=4.372FA=1.864F0.05(2,2)=19.00粒度BSSB=20.651FB=17.574F0.05(1,2)=18.51误差eSSe=2.352结论:含水量和粒度两因素在=0.05时对某片剂的贮存期都没有显著影响。5-3.2 重复试验的双因素分析前面介绍的两因素方差的分析时,认为两因素A与B之间是独立的,但在实际中,两因素通常不是独立的,而是相互起作用的,这种作用称为交互作用。如果要考察两个因素A、B之间是否存在交互作用的影响,则需要对两个因素各种水平的组合(Ai,Bj)进行重复试验,比如每个组合都重复试验t次(t1)。现将实验结果列成记录表如下(表5-12)
27、:表5-12因素A因素BB1BjBsA1x111,x11tx1j1,x1jtx1s1,x1stAixi11,xi1txij1,xijtxis1,xistArxr11,xr1txrj1,xrjtxrs1,xrstxijk表示对因素A的第i个水平,因素B的第j个水平的第k次试验结果。设, , 于是总离差平方和可以分解为由于等式右端中各交叉乘积的和为零,所以有其中它们分别表示因素A、B、A与B的交互作用以及随机误差产生的离差平方和,给定显著水平,如果考察因素A的影响,查F临界值分布表(附表8)得临界值,FA,则认为因素A影响显著,否则认为影响不显著。对因素B也类似。如果考察因素A与B的交互作用的影响,那么同样方法得临界值FI(r-1)(s-1),rs(t-1),若FIFI(r-1)(s-1),rs(t-1)则认为因素A、B交互作用显著,否则认为交互作用不显著。相应的重复试验双因素方差分析见表5-15。具体实例在第九章正交试验中给出表5-15方差来源离差平方和自由度方差F值F临界值因素Ar
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 晋中市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)附答案详解(培优b卷)
- 2026年南阳市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)含答案详解
- 2026年石家庄市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及一套完整答案详解
- 哈密地区农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)附答案详解(完整版)
- 黄南州农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)含答案详解(夺分金卷)
- 密云县农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)含答案详解
- 2025年广东省茂名市辅警考试公安基础知识考试真题库及参考答案
- 2026年天水市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)完整参考答案详解
- 2025年高血压护理的试题及答案
- 2025年高温防暑试题及答案
- 2025年金融学专升本金融市场学试卷(含答案)
- 2025广西交通职业技术学院招聘教师70人考试参考试题及答案解析
- 2025年全国新闻记者职业资格考试新闻采编实务综合能力测试题及答案
- 国寿财险总公司招聘笔试题库
- 施工现场风险评估方案
- 2025年中国聚α-烯烃(PAO)基润滑剂行业市场分析及投资价值评估前景预测报告
- 2025年文化旅游产业融合发展财务状况改善计划书
- 2024-2025学年广东省实验中学七年级(上)期中语文试卷
- 2025年广东惠州市产业投资集团有限公司公开招聘(10人)笔试题库历年考点版附带答案详解
- 包装设计考试题及答案
- 北京市2025国家体育总局事业单位招聘应届毕业生88人笔试历年参考题库附带答案详解
评论
0/150
提交评论