数理统计第九章 方差分析_第1页
数理统计第九章 方差分析_第2页
数理统计第九章 方差分析_第3页
数理统计第九章 方差分析_第4页
数理统计第九章 方差分析_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 单因子方差分析 双因子方差分析 1、非重复试验双因子方差分析 2、重复试验双因子方差分析第九章第九章 方差分析方差分析概论概论 在生产及科研工作中,人们常常需要了解哪些因素对试验结果有显著作用,哪些因素没有显著作用。 例如:施肥品种、施肥量、种子品种、下种量、土质、水份等诸因素中哪些对小麦的产量有显著影响,哪些又没有。 这类问题可通过方差分析的方法予以解决。9 91 1单因子单因子方差分析方差分析 概念及例子 数学模型 离差分解 H0的检验 ij的区间估计一、一、概念及例子概念及例子 方差分析是对试验结果的数据作分析的一种常用的统计方差分析是对试验结果的数据作分析的一种常用的统计方法。我们在

2、显著性假设检验中已讨论过两总体均值是否相方法。我们在显著性假设检验中已讨论过两总体均值是否相等的检验,这种问题可称为单因子(素)二水平的试验。等的检验,这种问题可称为单因子(素)二水平的试验。 在本小节中我们要讨论单因子(素)多水平的试验,我在本小节中我们要讨论单因子(素)多水平的试验,我们将发现它实际上是多个总体的均值是否相等的显著性检验。们将发现它实际上是多个总体的均值是否相等的显著性检验。 在正态总体和方差相等的基本假定下,这类假设检验问在正态总体和方差相等的基本假定下,这类假设检验问题称为题称为单因子方差分析单因子方差分析或或一元方差分析。一元方差分析。例例9.19.1 为了比较四种不

3、同的肥料对小麦产量的影响,为了比较四种不同的肥料对小麦产量的影响,取一片土壤肥沃程度和水利灌溉条件差不多的土取一片土壤肥沃程度和水利灌溉条件差不多的土地,分成地,分成16块。肥料品种记为块。肥料品种记为A1,A2,A3,A4,每种肥料均按比例施在四块土地上,得亩产量如每种肥料均按比例施在四块土地上,得亩产量如下:下: 亩产 品 种 田块 A1 A2 A3 A41 981 607 791 9012 964 693 642 7033 917 506 810 7924 669 358 705 883 问施肥品种对小麦亩产有无显著性影响?问施肥品种对小麦亩产有无显著性影响?例例9.29.2 某灯泡厂用

4、四种不同的配料方案制成的灯丝某灯泡厂用四种不同的配料方案制成的灯丝生产了四批灯泡,在每一批中任取若干个作寿命生产了四批灯泡,在每一批中任取若干个作寿命试验,得如下数据(单位:小时)试验,得如下数据(单位:小时) 寿命 灯 泡 灯丝 1 2 3 4 5 6 7 8 甲(A1) 1600 1610 1650 1680 1700 1720 1800 乙(A2) 1580 1640 1640 1700 1750 丙(A3) 1460 1550 1600 1620 1640 1660 1740 1820 丁(A4) 1510 1520 1530 1570 1600 1680 问灯丝的问灯丝的不同的配料方

5、案对灯泡寿命不同的配料方案对灯泡寿命有无显著影响?有无显著影响? 例9.1中的肥料品种和例9.2中的不同配料的灯丝称为因子或因素,记为A,这里都只有一个因子。各种肥料或不同配料方案称为水平。 一般地,因子A有r个水平A1,A2,Ar .二、数学模型二、数学模型 设有r个正态总体Xi,i=1,r, Xi N(i, 2),作假设 H0 : 1=2= =r 独立地从各总体中取出一个样本,列成下表:总体总体 样样 本本 样本均值样本均值rrn2r1rr1n112111XX,X,XXXX,X,XXr1 用以上r个样本检验上述假设H0是否成立。(水平为) 在应用上,上述问题等价于:因子因子A有有r个水平个

6、水平A1,A2,Ar ,设在每一种水平下试,设在每一种水平下试验结果都服从正态分布,现在各种水平作若验结果都服从正态分布,现在各种水平作若干次试验获得一些观测值,问因素干次试验获得一些观测值,问因素A的各种的各种水平对试验结果是否有显著影响?水平对试验结果是否有显著影响? 显然,检验可用t 检验法检验法:所有相邻两个总体的均值是否相等。共做r1次检验, 通常采用离差分解法离差分解法去解决这个问题。太繁琐太繁琐!三、三、离差分解离差分解将每个样本看成一个组,记组内平均为iin1jijn1jijiiXnX, r , 2 , 1i,Xn1Xii 总平均riirinjijnnXnXi1111,组内离差

7、平方和 r1i2njiije)XX(Si组间离差平方和 r1i2iiA)XX(nS四、四、H0的检验的检验离差平方和离差平方和) 1 . 9()()(112112AerinjiiijrinjijTSSXXXXXXSii令r , 2 , 1i ,n, 2 , 1j,Xiijiij 其中)., 0(N2iidij 令 iir1iii,nn1则)2 . 9(, 0111ririnjiiiin) 3 . 9(, 2 , 1, 2 , 1,rinjXiijiij令 r1in1jijn1jijiiiin1, r , 2 , 1i,n1 则 r1in1j2iijei)(S r1iiiir1ir1i2ii2i

8、iA)(n2)(nnS 221112)() 1()()(rnnESEriirinjiijei 212111222) 1()(2)(rnEnnnEnSEriiiriiiiririiiiiA故)()1(rnSErSEeA但在H0成立时,从而)5 . 9(11)1(122riiiAnrrSEr , 2 , 1i, 0i 可见,一般地说,有)()1(rnSErSEeA)4 . 9()(2rnSEe)6 . 9()()()()(2121122112112112nnnriiirinjiijrinjijrinjijrinjijiiiiAeriiirinjiijrinjijTSSnSii12112112)()

9、()(且.2112 nSSAerinjiji即定理定理9.1(柯赫伦定理(柯赫伦定理见见P166定理定理6.2.3设设,)n(XQ),1, 0(NX,X2n1i2iiidn1变量为 若Q=Q1+Qk,其中Qi为某些正态变量的平方和,这些正态变量分别是X1,Xn的线性组合,其自由度为fi ,则诸相互独立,且为.)(12nffkiii变量方差分析表方差分析表来来 源源 离差平方和离差平方和 自由度自由度 均方离差均方离差 F值值组间组间(因子因子A)组内组内(误差误差e)总总 和和eAAAriiiAQQFrSQrxnxnS11122rnSQrnSSSeeATe1nxnxSr1in1j22ijTi五

10、. ik的区间估计 由于故,给定信度1 ,可得ik的置信区间)(/1/1)(rntQnnXXTekikiki)11)(2/ekikiQnnrntXXrnSQee其中例例9.39.3 在例9.2中给定=5%,问灯丝的不同的配料方案对灯泡寿命有无显著影响? 解:已知解:已知r=4, n1=7, n2=5, n3=8, n4=6, n=26. 计算的下列计算的下列 方差分析表方差分析表 来来 源源 离差平方和离差平方和 自由度自由度 均方离差均方离差 F值值 因子因子A 44,374.6 3 14,791.5 2.17 误差误差e 149,970.8 22 6,816.8 总总 和和 194,345

11、.4 25查表知查表知FFrnrF17. 205. 3)22, 3(), 1(05. 0故,接受H0. 即认为灯丝的灯丝的不同的配料方不同的配料方案对灯泡寿命无显著影响。案对灯泡寿命无显著影响。92 双因子(二元)方差分析一、非重复试验情形 提出问题 一般模型 检验法的导出二、重复试验情形 提出问题 检验法的导出1、提出问题一、非重复试验双因子方差分析 氧化锌氧化锌B 促进剂促进剂A B1 B2 B3 B4A1 32 35 35.5 38.5A2 35.5 36.5 38 39.5A3 36 37.5 39.5 43例例9.4 在某种橡胶的配方中,考虑了三种不同的促进剂,四种不同份量的氧化锌。

12、各种配方试验一次,测得300%定强如下表所示: 此例中有此例中有A、B二个因子,因子二个因子,因子A有三个水平有三个水平A1,A2,A3;因子;因子B有四有四个水平个水平B1,B2,B3,B4 ,在各种组合,在各种组合水平水平Ai Bj上作一次试验获得一个观测上作一次试验获得一个观测值。值。问问因子因子A、B分别对试验结果分别对试验结果有无有无显著性影响显著性影响 问不同的促进剂,不同份量的氧问不同的促进剂,不同份量的氧化锌分别对定强有无显著性影响?化锌分别对定强有无显著性影响?2、一般模型 设有设有A、B二个因子,二个因子,A有有r个水平个水平A1,, Ar;因;因子子B有有s个水平个水平B

13、1, ,Bs ,在,在A、B的每一种组合水的每一种组合水平平Ai Bj上作一次试验,得结果上作一次试验,得结果Xij,(i=1, , r ;j=1, , s), 所有所有Xij都相互独立,且假定都相互独立,且假定Xij N( ij , 2 ),其中其中)7 . 9(, 1;, 1,sjrijiij)8 . 9(1, 0, 01111risjijsjjriirs而作假设)10. 9(; 0:)9 . 9(; 0:21022101srHH 如果H01成立,则ij与i无关,这表明因子A对试验结果无显著影响;同理,如果H02成立,则ij与j无关,这表明因子B对试验结果无显著影响。 另外,在式(9.7)

14、中,i称为因子A在水平Ai的效应效应,它表示水平Ai在总体平均数上引起的偏差偏差;同理, j称为因子B在水平Bj的效应效应,它表示水平Bj在总体平均数上引起的偏差偏差.3、检验法的导出、检验法的导出 导出检验H01与H02的方法与一元方差分析类似,可采用离差分解法。siXrXriXsXriijjsjiji, 2, 1,1, 2, 1,111令risjjisjriijXsXrXrsX1111111则总离差则总离差 j , i2j2j , ij , ii2jiijr1is1j2jijiijr1is1j2ijT)XX()XX()XXXX()XX()XX()XXXX()XX(S r1is1jr1is1

15、j2jiij2j2i)XXXX()XX(r)XX(s记因子记因子A引起的离差为引起的离差为)13. 9 ()(112risjjiijeXXXXS)11. 9 ()(12riiAXXsS)12. 9 ()(12sjjBXXrS记因子记因子B引起的离差为引起的离差为误差为误差为则(离差分解为))14. 9(eBATSSSS 从直观上看,SA是由因子A的效应和2引起的随机波动; SB是由因子B的效应和2引起的随机波动;Se则是由2引起的随机误差。 故可用比较SA与Se的值来检验H01是否成立;而用比较SB与Se的值来检验H02是否成立。这个所谓的“值”,当然指得是数学期望数学期望。令)15. 9(,

16、 2 , 1, 2 , 1,risjXijjiijijij其中),(2iidij0N则有r1jjjijjs1jiiijiXr1XXs1X;r1is1jjiXs1Xr1X故,) 1(122riiArsES2122) 1)(1(,) 1(srESsrESesijB令eeBBAASsrQSsQSrQ)(,1111111risjijriijjsjijirsrs11111,1,1记riiiririiiAsssS11122)(2)(则,riiArsEQ12212122,1esjjBEQsrEQ分别称为因子A、B引起的均方均方离差离差,当H01真时当H02真时称为均方误差均方误差。当H01、H02真时. s

17、 , 1j; r , 1i, 0ji 故可表为式)14. 8()11. 8(,Xijij ;,eAeAEQEQEQEQ否则否则;,eBeBEQEQEQEQ否则否则BAQQ ,eQ;)(112risjjiijeS;)(12riiAsS;)(12sjjBrSrisjijTS112)(由于21122112)(rsSSSrseBrisjAijrisjij故由分布及221122)(1rsrisjij的分解定理(柯赫伦)知,当H01、H02真时,).1)(1(),1(),1(222222srSsSrSeBA且SA、SB、Se相互独立。由F分布r.v.的构造知);1)(1( , 1() 1)(1() 1(2

18、2srrFQQsrSrSFeAeAA);1)(1( , 1() 1)(1() 1(22srsFQQsrSsSFeBeBB非重复试验非重复试验双因子方差分析检验法双因子方差分析检验法1 1、提出假设、提出假设H H0101: I I = 0; = 0; H H0202: : j j = 0= 02 2、引进统计量引进统计量);)( ,(1s1r1rFQQF01HeAA真真4、查表、计算得统计量的观测值及分位数的值、查表、计算得统计量的观测值及分位数的值5、比较大小的结论。、比较大小的结论。)( ,(1s1r1sFQQF02HeBB真真3、由显著性水平写出拒绝域形式、由显著性水平写出拒绝域形式;)

19、1)(1( , 1(srrFFPA)1)(1( , 1(srsFFPB非重复试验双因子方差分析表非重复试验双因子方差分析表来来 源源 离差平方和离差平方和 自由度自由度 均方离差均方离差 F值值因子因子A总总 和和eAAA2r1iiAQQF1rSQ1rxxsS)()()( )(1s1rSQ1s1rSSSSeeBATe1rs)xx(Sr1i2s1jijT 因子因子BeBBB2s1jjBQQF1sSQ1sxxrS)(误差误差e二、重复试验双因子方差分析1、一般模型、一般模型 设有设有A、B二个因子,各有二个因子,各有r个水平个水平A1,, Ar;和;和s个水平个水平B1, ,Bs ,现在,现在A、

20、B的每一种组合水平的每一种组合水平Ai Bj上重复试验上重复试验c(c1)次次,得试验值,得试验值 Xijk,(i=1, , r ;j=1, , s; k=1, ,c ), 将它们列表如下:将它们列表如下: 因子B因子AB1 B2 BSscsccscsccXXXXXXAXXXXXXA2122222121211211112121111111,rscrscrrcrrrXXXXXXA,1221111 假定假定Xijk N( ij , 2 ),且所有,且所有的的Xijk都相互都相互独立,则独立,则 ij可表为可表为).(,;,209s1jr1iijjiijrisjijrs111从而可得(9.20)式,

21、且可验证(9.21)式中四个等式成立。其中ijji,满足)21. 9(01111sjijriijsjjrii事实上,令,则)(ijijjiijijriijsjjijirs)(),(1),(111作假设; 0:; 0:21022101rrHH i 或j 称为因子A或因子B在水平Ai 或Bj 上的效应效应; ij 称为因子A和B在组合水平Ai Bj上的交互作用,即因子A、B组合起来在水平Ai Bj上的作用,而不是因子A或B单独影响试验的结果。2、检验法的导出、检验法的导出sjriHij, 1;, 1, 0:03 若H01成立,则表明因子A对试验结果无显著影响;否则,相反。 若H02成立,则表明因子

22、B对试验结果无显著影响;否则,相反。 若H03成立,则表明因子A、B对试验结果无显著的交互作用;否则,相反。 为了导出检验这三个假设的方法,一般也采用离差分解法。siXrXriXsXrjijjsjiji, 2 , 1,1, 2 , 1,111 令risjckijkXrscX1111sjriXcXckijkij, 1;, 1,11.则总离差则总离差 sjjBriiAXXrcSXXscS1212,)(,)( risjckijijkerisjijijIXXSXXXXcS1112112)(,)()22. 9 ()(1112eIBArisjckijkTSSSSXXS其中事实上)()()()(XXXXXX

23、XXXXXXijijijijijkijk 称SA为因子A引起的离差,称SB为因子B引起的离差, SI为因子A、B交互作用引起的离差,Se为误差。ckrisjXijkijjiijkijijk, 1;, 2 , 1;, 2 , 1,可表为ijkX其中), 0(2Niidijk代入SA 、SB 、 SI 和Se可得其期望值:期望值:,) 1(122riiArscES2122) 1(,) 1(crsESsrcESesjjB令,1sSQ1rSQBBAA2112) 1)(1(srcESrisjijI令)(,)(1crsSQ1s1rSQeeII一般有则,r1i22iA1rscEQ2es1i22jBEQ1sr

24、cEQ,r1is1j2ij2I1s1rcEQ)(,;eIeBeAEQEQEQEQEQEQ而当H0k为真时(k=1, 2, 3),它们均为等式。 当H0k为真前提下(k=1, 2, 3),可用(柯赫伦)分解定理得出SA 、SB 、 SI 和Se的分布。事实上,(8.22)式可改写为 sjjriircsc1212)()( risjckijijkrisjijijc1112112)()(risjckijkTS1112)(eIBASSSS).1(),1)(1(2222crsSsrSeI等式两边除以2后,即知:左边),1(22rscST右边各项),1(),1(2222sSrSBA且它们相互独立,故由F分布分布随机变量的构造,知);(,()()(1crs1rFQQ1crsS1r

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论