《统计学》第7章 方差分析_第1页
《统计学》第7章 方差分析_第2页
《统计学》第7章 方差分析_第3页
《统计学》第7章 方差分析_第4页
《统计学》第7章 方差分析_第5页
已阅读5页,还剩99页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2021/5/91第7章方差分析2021/5/92§7.1方差分析的基本思想2021/5/93方差分析是分析试验数据一种重要方法。一个复杂的事物,往往要受到许多因素的影响和制约。例如工业生产中的原材料,工艺条件,工人的技术水平等,它们的改变可能会影响产品的质量,如何通过统计数据,分析因素本身以及各因素之间的交互作用,找出对产品质量等特性指标有显著影响的那些因素,这是方差分析要解决的主要问题之一。

2021/5/94一、基本概念

在方差分析中,我们把所考察的试验结果,如产品的质量、数量、成本等,统称为指标,有X表示,由于试验误差的存在,故X是随机变量;称影响我们所关心的某个指标的原因为因素(或因子),常用A、B、C……来表示;称因素在试验中所处的不同状态为“水平”,因此A的m个不同水平用A1,A2,A3,…,Am来表示。2021/5/95当只考虑一个因素时,称相应的方差分析为单因素方差分析;当考虑两个因素时,称相应的方差分析为双因素方差分析;当考虑更多个因素时,称相应的方差分析为多因素方差分析。由于多因素方差分析与双因素方差分析相比并无本质上的差别,因此本章仅限于讨论前两类问题。

2021/5/96二、基本思想为了说明方差分析的基本思想,我们先看一个例子。例7.1某灯泡厂用四种不同材料的灯丝制成四批灯泡,除灯丝不同外,其他生产材料和生产工艺完全相同。今由这四批灯泡中随机地各抽取6只灯泡进行寿命试验,结果如表7-1,试根据这些数据,推断灯泡使用寿命是否与灯丝材料不同而有显著差异(取显著性水平=0.05)?2021/5/97表7-1

2021/5/98从表7-1中数据可以看出,A1的平均寿命最长,A4的平均寿命最短,A2,A3的平均寿命介于其间,我们是否由此可以得出灯泡寿命与灯丝材料不同而有显著性差异的结论呢?不能,因为在灯泡制作的过程中,除了工艺外,还有许多难以控制的随机因素的影响,因此它们之间的差异可能是随机误差所造成的。要正确地回答上述问题,在统计学上可以采取显著性检验的方法来解决。

2021/5/99在方差分析中,为了数学上便于处理,总是假定样本取自正态总体,且各个正态总体的方差都相等。我们把每一个水平看成一个总体,设对应于因素A的m个不同水平Ai有总体xi~N(1,2),即有:2021/5/910这里1=Ex1是xi的理论均值,1是随机误差,D1=

2,则方差分析所要解决的问题就变成了检验假说Ho:2021/5/911如果我们能够构造一个可以用来检验(7.2)的统计量,那么问题就好解决了。怎样来构造这样的统计量呢?由于试验数据的差异主要来自两个方面:一是试验误差,二是水平的改变(即条件变差)。因此,我们必须找出全部数据的总变差QT,并将它分解为样本随机变差QE和条件变差QA(对于QT、QA、QE具体的表达式,下面的内容将逐一给出),在这个基础之上,用QE和QA构造一个统计量来检验多个正态总体的均值是否相等。这就是方差分析的基本思想。在下面的内容中我们将具体研究方差分析的方法。

2021/5/912§7.2单因素方差分析

设单因素A有m个水平A1,A2,…,Am,每个水平对应一个总体xi~N(1,2),方差分析就是要研究这些水平对指标X的影响。记称为理想总平均,1=1-为第i个水平Ai的效应,显然,从而有数学模型:2021/5/913对每个水平做独立实验,得样本,再根据样本判断各个水平对指标X的影响,即检验假设或。当然,对每个水平做重复独立试验时,试验的重复次数可以是相同的,也可以是不相同的,从而就有等重复试验的方差分析和不等重复试验的方差分析。

2021/5/914二、单因素等重要试验的方差分析

对因素A的每个水平都做k次重复独立试验,得样本,见表7-2(其中xij,i=1,2,…,m;j=1,2,3,…,k,表示在水平A下的第j次试验结果)。2021/5/915表7-22021/5/916样本总容量n=mk。下面我们来构造检验用的统计量,对上述假设进行检验2021/5/917定理7.11.样本总平均值

2.xi的样本均值

3.总变差(总离差平方和)2021/5/9184.样本变差(组内离差平方和)

5.条件变差(组间离差平方和)

2021/5/919由于

2021/5/920这里,所以(7.4)以除(4)式的两边,得2021/5/921可以证明,当Ho为真时,并且A与E相互独立。 2021/5/922于是,由F分布的定义,我们可以得到统计量,当Ho为真时

其中分别是的自由度,这样就可以得出方差分析的步骤:2021/5/9231.建立假设:或;2.选取统计量:2021/5/9243.给定显著性水平,使,得拒绝域为:4.列方差分析表,计算F0,并作判断。

2021/5/9251)列出数据表(表7-3)表7-3数据表2021/5/9262)计算QA和QE:2021/5/927我们来证明(7.5)式:2021/5/928对于(7.6)式的证明类似,读者自己完成。2021/5/9293)列方差分析表(见表7-4)。表7-4方差分析表

2021/5/9304)判断:比较Fo与F(fA,,fE)的值,若Fo≥F,则拒绝Ho,即认为因素A对指标X的影响显著,否则,接受Ho,即认为A对X的影响不显著。在实际应用中,若Fo>F0.05,则可以认为因素A的影响显著;若Fo>F0.01,则认为因素A的影响高度显著;若Fo<F0.05,则可以认为因素A的影响不大。

2021/5/931注:当数据很大时,可作变换(a’,b’为非零常数),用新数据Yij代替xij所作的方差分析结果不变。2021/5/932例7.2求解例7.1中提出的问题解:1º建立假设:Ho:

2º取

其中

m=4,k=6,mk=24。

fA

=m-1=3,fE=mk-m=20,

fT=mk-1=232021/5/9333º由,查下分布表得所以拒绝域是。4°列方差分析表并作判断:

1)列数据表

令,得新的数据表7-5

2021/5/934表7-5表中a=11,b=3087/6,c=1655.2021/5/935

2)计算QA、QE

2021/5/936于是:3)列方差分析表(见表7-6)2021/5/937表7-62021/5/9384)判断:由于Fo<F0.05(3.20)所以接受HO,即认为灯泡使用寿命不因灯丝不同而有差异,此时,可选比较经济的确良材料作灯丝。2021/5/939三、单因素不等重复试验的方差分析

不等式重复试验方差分析的基本步骤与等重试验方差分的的步骤是一样的,仅是计算时略有不同,现将列方差分的表时,不同之处加以说明。2021/5/940

设对因素A的各水平下做的重复独立试验次数分别为n1,n2,n3,…nm,则试验总数(样本总量),记第i水平下的第j次试验结果为Xij列数据表如表7-7。2021/5/941表7-72021/5/942计算QA和QE,并求它们的自由度2021/5/943

例7.3从某地四组碳酸盐岩地层化学分析结果中,取某种化学成分,其数据(单位:PPm)如表7-8,问这四组碳酸盐岩地层的化学成分有元显著差异()?2021/5/944表7-82021/5/945解1°建立假设:

HO:M1=M2=M3=M4

2°取

其中

2021/5/9463°给定,查下分布表得F0.05(3.9)=3.86,从而得拒绝域:4°列方差分析表并作判断:1)列数据表(表7-9)令yij=100Xij-138,,其中a=1,b=263,c=2932021/5/947表7-92021/5/9482)计算QA、QE:3)列方差分析表(表-10)2021/5/949表-10

2021/5/950

4)判断:由于Fo>F0.05(3.9),故拒绝Ho,即认为四种碳酸雷岩的这种化学成分有显著性差异。2021/5/951四、未知参数的估计

方差分析的结果只作出了拒绝Ho或接受Ho的结论,常常我们还需要对模型(7.3)中的未知参数M,σ2作出估计,若拒绝Ho,就是就至少存在某个δi≠0,这时需要对δi作出估计。2021/5/952

由于,所以M和δi的无偏估计为(n为样本容量)。2021/5/953

并且可以证明QE/(n-m)是的无偏估计量,即。

在拒绝HO时,我们还可作出均值差Mi-Mk(I≠k)的区间估计2021/5/954由于2021/5/955于是有

2021/5/956

因为方差σ2未知,我们求的1-2置倍区间时,只能选取随机变量T,故置倍区间为

其中n是样本容量,m是水平数,在实际应用中,若取2021/5/957例7.4在例7.3中,试判断哪种岩层含所求化学成分最高,并求第一、第四种均值差的95%置信氏间。解:由得可见,第二组岩层含该种化学成分最高。2021/5/958又2021/5/959于是,得M1-M4的95%的置位区间为(1.40-1.32±2.6220×0.0182×0.8660)=(0.0443,0.1157)。2021/5/960§7.3双因素方差分析2021/5/961在上一节中我们讨论了单因素试验的方差分析方法,但在许我的实际问题中,更多的是双因素试验,这时的方差分析,不仅要判断各因素对指标的影响是否显著,还要考虑因素各水平之间的相互组合对指标的影响——交互效应,因此,双因素方差分析较单因素方差分析要复杂得我。本节只讨论双因素方差分析较常见的两种类型。2021/5/962一、无交互效应的双因素试验的方差分析设有两个因素A和B,因素A有m个水平,A1,A2,A3…,Am,因素B有K个水平B1,B2…,Bk,如果因素A与因素B无交互效应(或交互效应很小,可以忽略不计),这时,只需要在各种水平下各作一次试验就可以进行方差分析,共得m×k个试验结果Xij(i=1,2,3…,m,j=1,2,…k)列于表7-11中。2021/5/963表7-112021/5/964表中2021/5/965由于,试验数据要受到随机因素干扰,故可设其中Mij是组水平下Ai×Bj下的理论均值,是相应的误码差,并且mk个相互独立。2021/5/966

记2021/5/967这里M称为总平均(总体均值),Mi为Ai水平下组的总体均值,Mi为Bi水平下各组的总体均值;为Ai水平的效应,水平的效应,的交互效应,而因素A、B对指标X的影响就表现在Mij-M,这个影响可以分解为三部分:一是,它反映了因素A单独对指标的影响;二是,它反映了因素B单独对指标的影响;三是它反映了A、B联合起来对指标的影响。2021/5/968显然有关系式:如果因素A与因素B无交互效应,即,于是就得到了无交互效应的双因素方差分析的数学模型:(7.7)

2021/5/969对于模型(7.7)要检验因素A、B单独对指标的影响是非曲直否显著,等价于分别检验假设:2021/5/970

为了检验假设,我们将总离差平方和(总变差)QT进行分解:2021/5/971其中:2021/5/972在这里QA称为因素A的平方和,它表示A效应的变差,QB称为因素B的平方和,它表示B效应的变差,QE称为误差平方和,它表示除去A、B效应后,xij的随机误差。令与单因素方差分析的方法一样,可以分别构造统计量。2021/5/973可以证明,当HOA成立时,有当HOB成立时,有于是,对地给定的显著性水平,可得HOA和HOB的拒绝域,分别为2021/5/974上述结果列成方差分析表7-122021/5/975为了更简单地建立方差分析表,各平方和可按下式计算:2021/5/976其中:2021/5/977例7.5酿造厂有三个化验员担任发酵粉的颗粒检验,今由三名化验员每天从该厂所生产的发酵粉中抽样一次,共抽10天,分别化验其中所含颗粒的百分率,化验结果如表7-13,问三名化验员化验技术有元显著差异?这10天生产的发酵粉的颗粒百分率有无显著差异(?2021/5/978表7-13其中A表示化验员,B表示日期2021/5/979解1°建立假设:

(即化验员的化验技术无显著差异),(即10天生产的发酵粉的颗粒百分率无显著差异)。由数据计算得2021/5/980则2021/5/9813°列方差分析表表7-142021/5/982

4°判断:

,即三个化验员的化验技术没有显著差异。而拒绝HOB,即这10天生产的发酵粉的颗粒百分率有显著差异。

2021/5/983二、有交互效应的双因素试验的方差分析在前在的内容中我们已经知道,如果因素A和因素B没有交互效应,则只需要在各种组合水平下各作一次试验就可以进行方差分析,但是如果因素A与因素B有交互效应,这时必须在各种组合水平下作重复试验方可进行方差分析2021/5/984设对两个因素A、B各水平的组合(Ai,Bj)都重复埂行γ次,试验所作的第K次试验数据记为:根据前面所讲的内容,这时的数学模型为:

(7.8)2021/5/985其中,各相互独立,M1,和都是未知参数,且分别表示水平Ai

,Bj的效应,表示水平Ai,Bj的交互效应(即Ai

×Bj的效应),且有2021/5/986对于模型(7.8)判断因素A、B及其交互效应的影响是否显著,等价于检验假设:2021/5/987这个问题的讨论,其基本思想与前面类似,仍然是先将总离差平方和(总变差)进行分解:2021/5/988其中:2021/5/9892021/5/990记:2021/5/991于是有,

QA=a-m,QB=b-m,

QAB=c-a-b+m,

QE=d-c,QT=d-m2021/5/992可以证明QE仅依赖于随机变差,而QA,QB和QAB除依赖于外,还分别依赖

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论