数理统计:第五章第一节单因素方差分析_第1页
数理统计:第五章第一节单因素方差分析_第2页
数理统计:第五章第一节单因素方差分析_第3页
数理统计:第五章第一节单因素方差分析_第4页
数理统计:第五章第一节单因素方差分析_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、l 5.1 单因素方差分析单因素方差分析l 5.1.1 5.1.1 单因素方差分析的问题单因素方差分析的问题l 单因素方差分析用来检验根据某一个分类变量得到单因素方差分析用来检验根据某一个分类变量得到的多个分类总体的均值是否相等下面以一简例说明方的多个分类总体的均值是否相等下面以一简例说明方差分析的原理差分析的原理 第五章第五章 方方 差差 分分 析析l【例【例1】某化肥生产商要检验三种新产品的效果,在同】某化肥生产商要检验三种新产品的效果,在同一地区选取一地区选取18块大小相同,土质相近的农田中播种同块大小相同,土质相近的农田中播种同样的种子,用等量的甲乙丙化肥各施于六块农田,试验样的种子,

2、用等量的甲乙丙化肥各施于六块农田,试验结果每块农田的粮食产量如下所示结果每块农田的粮食产量如下所示l l 试根据试验数据推断甲乙丙三种化肥的肥效是否存试根据试验数据推断甲乙丙三种化肥的肥效是否存在差异在差异产量产量甲化肥甲化肥504649524848乙化肥乙化肥495047474649丙化肥丙化肥5150494650505.1.1 单因素方差分析的问题单因素方差分析的问题l 本例中,只考虑化肥这一个因素本例中,只考虑化肥这一个因素(记为记为A)对粮食产量对粮食产量的影响,三种不同的化肥称为该因素的三个不同水平的影响,三种不同的化肥称为该因素的三个不同水平(分别记为(分别记为A1,A2,A3)l

3、从表中数据看出,即使是施同一种化肥,由于随机因素从表中数据看出,即使是施同一种化肥,由于随机因素(温度,湿度等)的影响,产量也不同(温度,湿度等)的影响,产量也不同l因而有:因而有:l (1) 粮食产量是随机变量,是数值型的变量;粮食产量是随机变量,是数值型的变量;l (2) 把同一化肥把同一化肥(A的同一水平的同一水平)得到的粮食产量看作同得到的粮食产量看作同一总体抽得的样本,施用不同化肥得到的粮食产量视为一总体抽得的样本,施用不同化肥得到的粮食产量视为不同总体下抽得的样本,表中数据应看成从三个总体不同总体下抽得的样本,表中数据应看成从三个总体X1,X2,X3中分别抽了容量为中分别抽了容量为

4、6的样本的观测值的样本的观测值.l 推断甲乙丙三种化肥的肥效是否存在差异的问题,推断甲乙丙三种化肥的肥效是否存在差异的问题,就是要辨别粮食产量之间的差异主要是由随机误差造成就是要辨别粮食产量之间的差异主要是由随机误差造成的,还是由不同化肥造成的,这一问题可归结为三个总的,还是由不同化肥造成的,这一问题可归结为三个总体是否有相同分布的讨论体是否有相同分布的讨论l 由于在实际中有充分的理由认为粮食产量服从正态由于在实际中有充分的理由认为粮食产量服从正态分布分布, 且在安排试验时且在安排试验时, 除所关心的因素除所关心的因素(这里是化肥这里是化肥)外外, 其它试验条件总是尽可能做到一致其它试验条件总

5、是尽可能做到一致. l 这使我们可以认为每个总体的方差相同这使我们可以认为每个总体的方差相同l即即 XiN( i,2) i = 1, 2, 3l 因此,推断三个总体是否具有相同分布的问题就简因此,推断三个总体是否具有相同分布的问题就简化为:检验几个具有相同方差的正态总体均值是否相等化为:检验几个具有相同方差的正态总体均值是否相等的问题,即只需检验的问题,即只需检验lH0: 1 = 2 = 3l 因此,推断三个总体是否具有相同分布的问题就简因此,推断三个总体是否具有相同分布的问题就简化为:检验几个具有相同方差的正态总体均值是否相等化为:检验几个具有相同方差的正态总体均值是否相等的问题,即只需检验

6、的问题,即只需检验H0: 1 = 2 = 3l 象这类检验若干同方差的正态总体均值是否相等的象这类检验若干同方差的正态总体均值是否相等的一种统计分析方法称为一种统计分析方法称为方差分析方差分析l 当只有两个正态总体时,这类问题也可以用第八章当只有两个正态总体时,这类问题也可以用第八章讲过的两正态总体均值比较的方法来解决讲过的两正态总体均值比较的方法来解决l5.1.2 5.1.2 单因素方差分析的数学模型单因素方差分析的数学模型l 进行单因素方差分析时,需要得到如表进行单因素方差分析时,需要得到如表1所示所示的数据结构的数据结构 l表中用表中用A表示因素,表示因素,A的的m个取值称为个取值称为m

7、个水平分别用个水平分别用A1,A2,Am表示,每个水平对应一个总体表示,每个水平对应一个总体l 从不同水平(总体)中抽出的样本容量可以相同,也从不同水平(总体)中抽出的样本容量可以相同,也可以不同若不同水平抽出的样本容量相同则称为可以不同若不同水平抽出的样本容量相同则称为均衡均衡数据数据,否则称,否则称非均衡数据非均衡数据观测值(观测值(j)A因素(因素(i)A1A2Am1x11x21xm12x12x22xm2ni平均值平均值11nx22nxmmnx. 1x. 2x.mx表表1 单因素方差分析中数据结构单因素方差分析中数据结构l设设xij表示第表示第i个总体的第个总体的第j个观测值个观测值(j

8、 = 1, 2, ,ni, i = 1,2,m), 由于由于 ,i = 1, 2, , ml单因素方差分析模型常可表示为:单因素方差分析模型常可表示为:xij = i + ij ,相互独立,相互独立,1im,1jni.l其中其中 i表示第表示第i个总体的均值,个总体的均值, ij为随机误差为随机误差 ),(2 iijNxl5.1.3 5.1.3 方差分析的方法方差分析的方法l为了方便起见,可将为了方便起见,可将 i记为:记为: i = + il其中其中 称为总均值称为总均值, i = i (i = 1, 2, , m)l称为因素称为因素A的第的第i个水平的附加效应个水平的附加效应.l对不同水平

9、下均值是否相同的检验对不同水平下均值是否相同的检验l H0: 1 = 2 = = m,l H1: 1, 2, m不全相等不全相等;l就可以表示为就可以表示为:l H0: 1 = 2 = = m = 0,l H1: 1, 2, m不全为零不全为零 miim11 l下面简单介绍检验统计量及检验方法下面简单介绍检验统计量及检验方法l 以以 表示所有表示所有xij的总平值,的总平值, 表示第表示第i组数据的组内平组数据的组内平均值,即均值,即l其中其中n = n1 + n2 + + nm统计量:统计量:l称为称为总离差平方和总离差平方和,或简称,或简称总平方和总平方和. 它反映了全部试它反映了全部试验

10、数据之间的差异验数据之间的差异x. ix minjijixnx111 injijiixnx1.1 minjijixxSST112)(l另外另外l反映了每组数据均值和总平均值的误差,称为反映了每组数据均值和总平均值的误差,称为组间离差组间离差平方和平方和,简称,简称组间平方和组间平方和,或,或称因素称因素A平方和平方和l反映了组内数据和组内平均的随机误差,称为反映了组内数据和组内平均的随机误差,称为组内离差组内离差平方和平方和,或称为,或称为误差平方和误差平方和 miiiminjiAxxnxxSSMi12.112.)()( minjiijixxSSE112.)(l可以证明可以证明SST = SS

11、MA + SSEl构造检验统计量构造检验统计量l可以证明,在可以证明,在H0成立下成立下)()1(mnSSEmSSMFA ), 1()()1(mnmFmnSSEmSSMFA l当原假设成立时,各总体均值相等,各样本均值间的差当原假设成立时,各总体均值相等,各样本均值间的差异应该较小,模型平方和也应较小,异应该较小,模型平方和也应较小,F统计量取很大值统计量取很大值应该是稀有的情形应该是稀有的情形l所以对给定显著性水平所以对给定显著性水平 (0, 1),H0的拒绝域为:的拒绝域为:l 若由观测数据若由观测数据xij(j = 1, 2, , ni,i = 1, 2, , m)计算得计算得到到F的观

12、测值为的观测值为F0, 当当F0落入拒绝域时拒绝原假设落入拒绝域时拒绝原假设H0, 可可以认为因素以认为因素A对响应变量有显著影响;否则不能拒绝对响应变量有显著影响;否则不能拒绝H0,认为因素认为因素A对响应变量无显著影响对响应变量无显著影响 ), 1()()1(mnmFmnSSEmSSMFA l另外,另外,F统计量的统计量的P值为值为P=PF F0,在显著水平,在显著水平 下,若下,若P=PF F0 F组间组间SSMAm 1SSMA / (m 1)MSA / MSEP组内组内SSEn mSSE / (n m)全部全部SSMA+SSEn 1l【实验【实验1】利用】利用Excel的数据分析工具对

13、例的数据分析工具对例1作方差分作方差分析析l Excel的数据分析工具作方差分析的步骤如下:的数据分析工具作方差分析的步骤如下:l (1) 将例将例1中数据输入中数据输入Excel中,如图中,如图1所示所示l (2) 在在Excel主菜单中选择主菜单中选择“工具工具”“数据分析数据分析”,打开打开“数据分析数据分析”对话框,在对话框,在“分析工具分析工具”列表中选列表中选择择“方差分析:单因素方差分析方差分析:单因素方差分析”选项,单击选项,单击“确定确定”按钮按钮 l(3) 在打开的在打开的“方差分析:单因素方差分析方差分析:单因素方差分析”对话框中,对话框中,输入输入“输入区域输入区域”:

14、B2:D8,“分组方式分组方式”取默认的取默认的“列列”方式,选中方式,选中“标志位于第一行标志位于第一行”复选框,如图复选框,如图2所示,单击所示,单击“确定确定”按钮按钮l 得到单因素方差分析的结果如图得到单因素方差分析的结果如图3所示所示 l (4) 结果分析结果分析l 第一部分第一部分“SUMMARY”提供拟合模型的一般信息,提供拟合模型的一般信息,包括各分组的名称、观测数、和、均值和方差,如图包括各分组的名称、观测数、和、均值和方差,如图3所示所示l 第二部分为方差分析表,其中各项含义可参见表的第二部分为方差分析表,其中各项含义可参见表的说明最右边多了一列:在说明最右边多了一列:在

15、= 0.05的显著水平下,单的显著水平下,单因素方差分析因素方差分析F检验的临界值(即检验的临界值(即F统计量的上统计量的上 分位点:分位点:F ) l 从方差分析表可以看出,从方差分析表可以看出,P值大于值大于0.05(显著水平),(显著水平),所以不能拒绝原假设,没有足够的证据证明三种化肥的所以不能拒绝原假设,没有足够的证据证明三种化肥的肥效有显著差异肥效有显著差异 l【例【例2】为了对几个行业的服务质量进行评价,消费者】为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业、航空公司、家电制造业分别抽协会在零售业、旅游业、航空公司、家电制造业分别抽取了不同的企业作为样本取了不同的企

16、业作为样本l每个行业各抽取每个行业各抽取5家企业家企业, 所抽取的这些企业在服务对所抽取的这些企业在服务对象、服务内容、企业规模等方面基本上是相同的象、服务内容、企业规模等方面基本上是相同的l然后统计出最近一年中消费者对总共然后统计出最近一年中消费者对总共20家企业投诉的家企业投诉的次数次数l结果如下:结果如下:行业行业投诉次数投诉次数零售业零售业5766494044旅游业旅游业6839294556航空公司航空公司3149213440家电制造业家电制造业4451657758l通常,受到投诉的次数越多,说明服务的质量越差消通常,受到投诉的次数越多,说明服务的质量越差消费者协会想知道这几个行业之间

17、的服务质量是否有显著费者协会想知道这几个行业之间的服务质量是否有显著差异,试进行方差分析差异,试进行方差分析.l 本例采用单因素方差分析法,只考虑行业这一个因本例采用单因素方差分析法,只考虑行业这一个因素对投诉次数的影响,四个不同的行业称为该因素的四素对投诉次数的影响,四个不同的行业称为该因素的四个不同水平原假设是:不同行业对服务质量的投诉次个不同水平原假设是:不同行业对服务质量的投诉次数没有显著差异数没有显著差异 行业行业投诉次数投诉次数零售业零售业5766494044旅游业旅游业6839294556航空公司航空公司3149213440家电制造业家电制造业4451657758l【实验【实验2

18、】利用】利用Excel的数据分析工具对例的数据分析工具对例2作方差分作方差分析析l (1) 将数据输入将数据输入Excel中,中,l如图所示如图所示l (2) 在在Excel主菜单中选择主菜单中选择“工具工具”“数据分析数据分析”,打开打开“数据分析数据分析”对话框,在对话框,在“分析工具分析工具”列表中选择列表中选择“方差分析:单因素方差分析方差分析:单因素方差分析”选项,单击选项,单击“确定确定”按按钮钮 l(3) 在打开的在打开的“方差分析:单因素方差分析方差分析:单因素方差分析”对话框中,对话框中,输入输入“输入区域输入区域”:A2:D7,“分组方式分组方式”取默认的取默认的“列列”方式,选中方式,选中“标志

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论