赵娜《应用统计分析》课件-(10)第10章 方差分析_第1页
赵娜《应用统计分析》课件-(10)第10章 方差分析_第2页
赵娜《应用统计分析》课件-(10)第10章 方差分析_第3页
赵娜《应用统计分析》课件-(10)第10章 方差分析_第4页
赵娜《应用统计分析》课件-(10)第10章 方差分析_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学

STATISTICS第10章方差分析

(第六版)

统计学

作者:中国人民大学统计学院

贾俊平

10-1作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS第10章方差分析

(第六版)

10.1方差分析引论

10.2单因素方差分析

10.3双因素方差分析

10-2作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS学习目标

(第六版)

1.解释方差分析的概念

2.解释方差分析的基本思想和原理

3.掌握单因素方差分析的方法及应用

4.理解多重比较的意义

5.掌握双因素方差分析的方法及应用

10-3作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS10.1方差分析引论

(第六版)

10.1.1方差分析及其有关术语

10.1.2方差分析的基本思想和原理

10.1.3方差分析的基本假定

10.1.4问题的一般提法

10-4作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

方差分析及其有关术语

10-5作者:贾俊平,中国人民大学统计学院

统计学什么是方差分析(ANOVA)?

STATISTICS

(第六版)(analysisofvariance)

1.检验多个总体均值是否相等

§通过分析数据的误差判断各总体均值是否相等通过分析数据的误差判断各总体均值是否相等

2.研究分类型自变量对数值型因变量的影响

n一个或多个分类型自变量一个或多个分类型自变量

l两个或多个(k个)处理水平或分类

n一个数值型因变量一个数值型因变量

3.有单因素方差分析和双因素方差分析

n单因素方差分析:涉及一个分类的自变量单因素方差分析:涉及一个分类的自变量

n双因素方差分析:涉及两个分类的自变量双因素方差分析:涉及两个分类的自变量

10-6作者:贾俊平,中国人民大学统计学院

统计学什么是方差分析?

STATISTICS

(第六版)(例题分析)

【例】为了对几个行业的服务质量进行评价,消费者协会

在4个行业分别抽取了不同的企业作为样本。最近一年中消

费者对总共23家企业投诉的次数如下表

消费者对四个行业的投诉次数

行业

观测值零售业旅游业航空公司家电制造业

157683144

266394951

349292165

440453477

534564058

65351

107-744作者:贾俊平,中国人民大学统计学院

统计学什么是方差分析?

STATISTICS

(第六版)(例题分析)

1.分析4个行业之间的服务质量是否有显著差异,

也就是要判断“行业”对“投诉次数”是否

有显著影响

2.作出这种判断最终被归结为检验这四个行业

被投诉次数的均值是否相等

3.若它们的均值相等,则意味着“行业”对投

诉次数是没有影响的,即它们之间的服务质

量没有显著差异;若均值不全相等,则意味

着“行业”对投诉次数是有影响的,它们之

间的服务质量有显著差异

10-8作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS方差分析中的有关术语

(第六版)

1.因素或因子(factor)

§所要检验的对象所要检验的对象

l分析行业对投诉次数的影响,行业是要检验的因子

2.水平或处理(treatment)

§因子的不同表现因子的不同表现

l零售业、旅游业、航空公司、家电制造业

3.观察值

§在每个因素水平下得到的样本数据在每个因素水平下得到的样本数据

l每个行业被投诉的次数

10-9作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS方差分析中的有关术语

(第六版)

1.试验

§这这里里只只涉涉及及一一个个因因素素,,因因此此称称为为单单因因素素44水水平平的的

试验试验

2.总体

§因素的每一个水平可以看作是一个总体因素的每一个水平可以看作是一个总体

l零售业、旅游业、航空公司、家电制造业是4个总体

3.样本数据

§被被投投诉诉次次数数可可以以看看作作是是从从这这44个个总总体体中中抽抽取取的的样样

本数据本数据

10-10作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

方差分析的基本思想和原理

10-11作者:贾俊平,中国人民大学统计学院

统计学方差分析的基本思想和原理

STATISTICS

(第六版)(图形分析—散点图)

零售业旅游业航空公司家电制造

10-12作者:贾俊平,中国人民大学统计学院

统计学方差分析的基本思想和原理

STATISTICS

(第六版)(图形分析)

1.从散点图上可以看出

n不同行业被投诉的次数有明显差异不同行业被投诉的次数有明显差异

n同一个行业,不同企业被投诉的次数也明显不同同一个行业,不同企业被投诉的次数也明显不同

l家电制造被投诉的次数较高,航空公司被投诉的次数较

2.行业与被投诉次数之间有一定的关系

n如如果果行行业业与与被被投投诉诉次次数数之之间间没没有有关关系系,,那那么么它它们们被被

投投诉诉的的次次数数应应该该差差不不多多相相同同,,在在散散点点图图上上所所呈呈现现的的

模式也就应该很接近模式也就应该很接近

10-13作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS方差分析的基本思想和原理

(第六版)

1.散散点点图图观观察察不不能能提提供供充充分分的的证证据据证证明明不不同同行行业业被被

投诉的次数之间有显著差异投诉的次数之间有显著差异

n这种差异可能是由于抽样的随机性所造成的

2.需需要要有有更更准准确确的的方方法法来来检检验验这这种种差差异异是是否否显显著著,,

也就是进行方差分析也就是进行方差分析

n所以叫方差分析,因为虽然我们感兴趣的是均值,

但在判断均值之间是否有差异时则需要借助于方差

n这个名字也表示:它是通过对数据误差来源的分析

判断不同总体的均值是否相等。因此,进行方差分

析时,需要考察数据误差的来源

10-14作者:贾俊平,中国人民大学统计学院

统计学方差分析的基本思想和原理

STATISTICS

(第六版)(两类误差)

1.随机误差随机误差

§因素的同一水平(总体)下,样本各观察值之间的差异

l比如,同一行业下不同企业被投诉次数之间的差异

§这种差异可以看成是随机因素的影响,称为随机误差

2.系统误差系统误差

§因素的不同水平(不同总体)之间观察值的差异

l比如,不同行业之间的被投诉次数之间的差异

§这种差异可能是由于抽样的随机性所造成的,也可能

是由于行业本身所造成的,后者所形成的误差是由系

统性因素造成的,称为系统误差

10-15作者:贾俊平,中国人民大学统计学院

统计学方差分析的基本思想和原理

STATISTICS

(第六版)(误差平方和—SS)

1.数据的误差用平方和(sumofsquares)表示

2.组内平方和(withingroups)

§因素的同一水平下数据误差的平方和因素的同一水平下数据误差的平方和

l比如,零售业被投诉次数的误差平方和

§只包含只包含随机误差随机误差

3.组间平方和(betweengroups)

§因素的不同水平之间数据误差的平方和因素的不同水平之间数据误差的平方和

l比如,4个行业被投诉次数之间的误差平方和

§既包括既包括随机误差随机误差,也包括,也包括系统误差系统误差

10-16作者:贾俊平,中国人民大学统计学院

统计学方差分析的基本思想和原理

STATISTICS

(第六版)(均方—MS)

1.平方和除以相应的自由度平方和除以相应的自由度

2.若若原原假假设设成成立立,,组组间间均均方方与与组组内内均均方方的的数数值值就就应应

该很接近,它们的比值就会接近该很接近,它们的比值就会接近11

3.若若原原假假设设不不成成立立,,组组间间均均方方会会大大于于组组内内均均方方,,它它

们之间的比值就会大于们之间的比值就会大于11

4.当当这这个个比比值值大大到到某某种种程程度度时时,,就就可可以以说说不不同同水水平平

之间存在着显著差异,即自变量对因变量有影响之间存在着显著差异,即自变量对因变量有影响

§判断行业对投诉次数是否有显著影响,也就是检验被

投诉次数的差异主要是由于什么原因所引起的。如果

这种差异主要是系统误差,说明不同行业对投诉次数

有显著影响

10-17作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

方差分析的基本假定

10-18作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS方差分析的基本假定

(第六版)

1.每个总体都应服从正态分布

§对对于于因因素素的的每每一一个个水水平平,,其其观观察察值值是是来来自自服服从从正正

态分布总体的简单随机样本态分布总体的简单随机样本

§比如,每个行业被投诉的次数必须服从正态分布比如,每个行业被投诉的次数必须服从正态分布

2.各个总体的方差必须相同

§各组观察数据是从具有相同方差的总体中抽取的各组观察数据是从具有相同方差的总体中抽取的

§比如,比如,44个行业被投诉次数的方差都相等个行业被投诉次数的方差都相等

3.观察值是独立的

§比比如如,,每每个个行行业业被被投投诉诉的的次次数数与与其其他他行行业业被被投投诉诉

的次数独立的次数独立

10-19作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS方差分析中的基本假定

(第六版)

1.在上述假定条件下,判断行业对投诉次数是否

有显著影响,实际上也就是检验具有同方差的

4个正态总体的均值是否相等

2.如果4个总体的均值相等,可以期望4个样本的

均值也会很接近

§44个个样样本本的的均均值值越越接接近近,,推推断断44个个总总体体均均值值相相等等的的

证据也就越充分证据也就越充分

§样样本本均均值值越越不不同同,,推推断断总总体体均均值值不不同同的的证证据据就就越越

充分充分

10-20作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS方差分析中基本假定

(第六版)

如果原假设成立,即如果原假设成立,即HH00:11==22==33==44

n4个行业被投诉次数的均值都相等

n意味着每个样本都来自均值为、方差为2的同一

正态总体

f(X)f(X)

XX

1234

10-21作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS方差分析中基本假定

(第六版)

若备择假设成立,即若备择假设成立,即HH11:mmii((ii=1,2,3,4=1,2,3,4))不全相等不全相等

n至少有一个总体的均值是不同的

n4个样本分别来自均值不同的4个正态总体

f(X)f(X)

XX

3124

10-22作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

问题的一般提法

10-23作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS问题的一般提法

(第六版)

1.1.设设因因素素有有kk个个水水平平,,每每个个水水平平的的均均值值分分别别用用11,,22,,

,,kk表示表示

2.2.要要检检验验kk个个水水平平((总总体体))的的均均值值是是否否相相等等,,需需要要提提出出如如

下假设:下假设:

§§H0:12…k

§§H1:1,2,,k不全相等

3.3.设设11为为零零售售业业被被投投诉诉次次数数的的均均值值,,22为为旅旅游游业业被被投投诉诉

次次数数的的均均值值,,33为为航航空空公公司司被被投投诉诉次次数数的的均均值值,,44为为

家电制造业家电制造业被投诉次数的均值被投诉次数的均值,,提出的假设为提出的假设为

§§H0:1234

§§H1:1,2,3,4不全相等

10-24作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS10.2单因素方差分析

(第六版)

10.2.1数据结构

10.2.2分析步骤

10.2.3关系强度的测量

10.2.4方差分析中的多重比较

10-25作者:贾俊平,中国人民大学统计学院

统计学单因素方差分析的数据结构

STATISTICS

(第六版)(one-wayanalysisofvariance)

因素(A)i

观察值(j)

水平A1水平A2…水平Ak

1x11x21…xk1

2x12x22…xk2

:::::

:::::

nx1nx2n…xkn

10-26作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

分析步骤

•提出假设

•构造检验统计量

•统计决策

10-27作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS提出假设

(第六版)

1.一般提法

§HH00::mm11==mm22==…=…=mmkk

•自变量对因变量没有显著影响

§HH11::mm11,,mm22,,……,,mmkk不不全相等全相等

•自变量对因变量有显著影响

2.注意:拒绝原假设,只表明至少有两个总

体的均值不相等,并不意味着所有的均值

都不相等

10-28作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS构造检验的统计量

(第六版)

构造统计量需要计算

§水平的均值

§全部观察值的总均值

§误差平方和

§均方(MS)

10-29作者:贾俊平,中国人民大学统计学院

统计学构造检验的统计量

STATISTICS

(第六版)(计算水平的均值)

1.假定从第i个总体中抽取一个容量为ni的简单

随机样本,第i个总体的样本均值为该样本的

全部观察值总和除以观察值的个数

2.计算公式为

式中:nii为第i个总体的样本观察值个数

xijij为第i个总体的第j个观察值

10-30作者:贾俊平,中国人民大学统计学院

统计学构造检验的统计量

STATISTICS

(第六版)(计算全部观察值的总均值)

1.全部观察值的总和除以观察值的总个数

2.计算公式为

10-31作者:贾俊平,中国人民大学统计学院

统计学构造检验的统计量

STATISTICS

(第六版)(例题分析)

10-32作者:贾俊平,中国人民大学统计学院

统计学构造检验的统计量

STATISTICS

(第六版)(计算总误差平方和SST)

1.全部观察值与总平均值的离差平方和

2.反映全部观察值的离散状况

3.其计算公式为

§前例的计算结果前例的计算结果

SSTSST==(57-47.869565)(57-47.869565)22++…+…+(58-47.869565)(58-47.869565)22

=115.9295=115.9295

10-33作者:贾俊平,中国人民大学统计学院

统计学构造检验的统计量

STATISTICS

(第六版)(计算组间平方和SSA)

1.各各组组平平均均值值与与总总平平均均值值的的离离

差平方和差平方和

2.反映各总体的样本均值之间的差异程度反映各总体的样本均值之间的差异程度

3.该平方和既包括随机误差,也包括系统误差该平方和既包括随机误差,也包括系统误差

4.计算公式为计算公式为

§前例的计算结果前例的计算结果SSASSA==1456.6086961456.608696

10-34作者:贾俊平,中国人民大学统计学院

统计学构造检验的统计量

STATISTICS

(第六版)(计算组内平方和SSE)

1.每每个个水水平平或或组组的的各各样样本本数数据据与与其其组组平平均均值值的的离离差差

平方和平方和

2.反映每个样本各观察值的离散状况反映每个样本各观察值的离散状况

3.该平方和反映的是随机误差的大小该平方和反映的是随机误差的大小

4.计算公式为计算公式为

§前例的计算结果前例的计算结果SSESSE==27082708

10-35作者:贾俊平,中国人民大学统计学院

统计学构造检验的统计量

STATISTICS

(第六版)(三个平方和的关系)

总离差平方和(SST)、误差项离差平方和

(SSE)、水平项离差平方和(SSA)之间的关

SST=SSA+SSE

§前例的计算结果前例的计算结果

4164.608696=1456.608696+27084164.608696=1456.608696+2708

10-36作者:贾俊平,中国人民大学统计学院

统计学构造检验的统计量

STATISTICS

(第六版)(计算均方MS)

1.各误差平方和的大小与观察值的多少有关,为

消除观察值多少对误差平方和大小的影响,需

要将其平均,这就是均方,也称为方差

2.由误差平方和除以相应的自由度求得

3.三个平方和对应的自由度分别是

§SSTSST的的自由度为自由度为nn-1-1,,其中其中nn为全部观察值的个数为全部观察值的个数

§SSASSA的的自自由由度度为为kk-1-1,,其其中中kk为为因因素素水水平平((总总体体))的的

个数个数

§SSESSE的的自由度为自由度为nn--kk

10-37作者:贾俊平,中国人民大学统计学院

统计学构造检验的统计量

STATISTICS

(第六版)(计算均方MS)

1.组间方差:SSA的均方,记为MSA,计算公

式为

2.组内方差:SSE的均方,记为MSE,计算公

式为

10-38作者:贾俊平,中国人民大学统计学院

统计学构造检验的统计量

STATISTICS

(第六版)(计算检验统计量F)

1.将MSA和MSE进行对比,即得到所需要的检

验统计量F

2.当H0为真时,二者的比值服从分子自由度为k

-1、分母自由度为n-k的F分布,即

10-39作者:贾俊平,中国人民大学统计学院

统计学构造检验的统计量

STATISTICS

(第六版)(F分布与拒绝域)

如果均值相等,如果均值相等,

拒绝H

FF==MSAMSA//MSEMSE110

不能拒绝H0

0F

F(k-1,n-k)

F分布

10-40作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS统计决策

(第六版)

将统计量的值F与给定的显著性水平的临界

值F进行比较,作出对原假设H0的决策

§根根据据给给定定的的显显著著性性水水平平,,在在FF分分布布表表中中查查找找与与

第一自由度=、第二自由度相应

第一自由度dfdf11=kk-1-1、第二自由度dfdf22==nn--kk相应

的临界值的临界值FF

§若若FF>>FF,,则则拒拒绝绝原原假假设设HH00,,表表明明均均值值之之间间的的

差差异异是是显显著著的的,,所所检检验验的的因因素素对对观观察察值值有有显显著著

影响影响

§若若F<FF<F,,则则不不拒拒绝绝原原假假设设HH00,,无无证证据据表表明明所所

检验的因素对观察值有显著影响检验的因素对观察值有显著影响

10-41作者:贾俊平,中国人民大学统计学院

统计学单因素方差分析表

STATISTICS

(第六版)(基本结构)

平方和自由度均方F

误差来源F值P值

(SS)(df)(MS)临界值

组间

MSAMSA

(因素影响SSASSAk-k-11MSAMSA

MSEMSE

)

组内

SSESSEn-kn-kMSEMSE

(误差)

总和SSTSSTn-n-11

10-42作者:贾俊平,中国人民大学统计学院

统计学单因素方差分析

STATISTICS

(第六版)(例题分析)

10-43作者:贾俊平,中国人民大学统计学院

统计学用Excel进行方差分析

STATISTICS

(第六版)(Excel分析步骤)

第第11步:步:选择选择““工具工具””下拉菜单下拉菜单

第第22步:步:选择选择【【数据分析数据分析】】选项选项

第第33步:步:在分析工具中选择在分析工具中选择【【单因素方差分析单因素方差分析】】,,

然后选择然后选择【【确定确定】】

第第44步:步:当对话框出现时当对话框出现时

在【输入区域】方框内键入数据单元格区域

在【】方框内键入0.05(可根据需要确定)

在【输出选项】中选择输出区域

10-44作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

关系强度的测量

10-45作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS关系强度的测量

(第六版)

1.拒拒绝绝原原假假设设表表明明因因素素((自自变变量量))与与观观测测值值之之间间有有显显

著关系著关系

2.组组间间平平方方和和((SSASSA))度度量量了了自自变变量量((行行业业))对对因因变变量量

((投诉次数投诉次数))的影响效应的影响效应

§只要组间平方和SSA不等于0,就表明两个变量之间

有关系(只是是否显著的问题)

§当组间平方和比组内平方和(SSE)大,而且大到一定

程度时,就意味着两个变量之间的关系显著,大得越

多,表明它们之间的关系就越强。反之,就意味着两

个变量之间的关系不显著,小得越多,表明它们之间

的关系就越弱

10-46作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS关系强度的测量

(第六版)

1.变量间关系的强度用自变量平方和(SSA)占总

平方和(SST)的比例大小来反映

2.自变量平方和占总平方和的比例记为R2,即

3.其平方根R就可以用来测量两个变量之间的关

系强度

10-47作者:贾俊平,中国人民大学统计学院

统计学关系强度的测量

STATISTICS

(第六版)(例题分析)

RR==0.5914040.591404

结论结论

§行业(自变量)对投诉次数(因变量)的影响效应占总

效应的34.9759%,而残差效应则占65.0241%。即

行业对投诉次数差异解释的比例达到近35%,而其

他因素(残差变量)所解释的比例近为65%以上

§R=0.591404,表明行业与投诉次数之间有中等以

上的关系

10-48作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

方差分析中的多重比较

(multiplecomparison

procedures)

10-49作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS多重比较的意义

(第六版)

1.通过对总体均值之间的配对比较来进一步检

验到底哪些均值之间存在差异

2.可采用Fisher提出的最小显著差异方法,简

写为LSD

3.LSD方法是对检验两个总体均值是否相等的t

检验方法的总体方差估计加以修正(用MSE

来代替)而得到的

10-50作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS多重比较的步骤

(第六版)

1.提出假设提出假设

§H0:mii=mjj(第i个总体的均值等于第j个总体的均值)

§H1:miimjj(第i个总体的均值不等于第j个总体的均值

)

2.计算检计算检验的统计量验的统计量::

3.计算计算LSDLSD

4.决策:若决策:若,,拒拒绝绝HH00;;若若

10-51作者:贾俊平,中国人民大学统计学院

,,不拒不拒绝绝HH00

统计学多重比较分析

STATISTICS

(第六版)(例题分析)

第1步:提出假设

§检验1:

§检验2:

§检验3:

§检验4:

§检验5:

§检验6:

10-52作者:贾俊平,中国人民大学统计学院

统计学方差分析中的多重比较

STATISTICS

(第六版)(例题分析)

第2步:计算检验统计量

§检验1:

§检验2:

§检验3:

§检验4:

§检验5:

§检验6:

10-53作者:贾俊平,中国人民大学统计学院

统计学方差分析中的多重比较

STATISTICS

(第六版)(例题分析)

第3步:计算LSD

§检验1:

§检验2:

§检验3:

§检验4:

§检验5:

§检验6:

10-54作者:贾俊平,中国人民大学统计学院

统计学方差分析中的多重比较

STATISTICS

(第六版)(例题分析)

第4步:作出决策

不能认为零售业与旅游业均值之间有显

著差异

不能认为零售业与航空公司均值之间有

显著差异

不能认为零售业与家电业均值之间有显

著差异

不能认为旅游业与航空业均值之间有显

著差异

不能认为旅游业与家电业均值之间有显

著差异

航空业与家电业均值有显著差异

10-55作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS10.3双因素方差分析

(第六版)

10.3.1双因素方差分析及其类型

10.3.2无交互作用的双因素方差分析

10.3.3有交互作用的双因素方差分析

10-56作者:贾俊平,中国人民大学统计学院

统计学双因素方差分析

STATISTICS

(第六版)(two-wayanalysisofvariance)

1.1.分分析析两两个个因因素素((行行因因素素RowRow和和列列因因素素ColumnColumn))对对试试验验

结果的影响结果的影响

2.2.如如果果两两个个因因素素对对试试验验结结果果的的影影响响是是相相互互独独立立的的,,分分

别别判判断断行行因因素素和和列列因因素素对对试试验验数数据据的的影影响响,,这这时时的的

双双因因素素方方差差分分析析称称为为无无交交互互作作用用的的双双因因素素方方差差分分析析

或或无无重重复复双双因因素素方方差差分分析析((Two-factorTwo-factorwithoutwithout

replicationreplication))

3.3.如如果果除除了了行行因因素素和和列列因因素素对对试试验验数数据据的的单单独独影影响响外外,,

两两个个因因素素的的搭搭配配还还会会对对结结果果产产生生一一种种新新的的影影响响,,这这

时时的的双双因因素素方方差差分分析析称称为为有有交交互互作作用用的的双双因因素素方方差差

分分析析或或可可重重复复双双因因素素方方差差分分析析((Two-factorTwo-factorwithwith

replicationreplication))

10-57作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS双因素方差分析的基本假定

(第六版)

1.每个总体都服从正态分布

§对对于于因因素素的的每每一一个个水水平平,,其其观观察察值值是是来来自自正正

态分布总体的简单随机样本态分布总体的简单随机样本

2.各个总体的方差必须相同

§对对于于各各组组观观察察数数据据,,是是从从具具有有相相同同方方差差的的总总

体中抽取的体中抽取的

3.观察值是独立的

10-58作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

无交互作用的双因素方差分析

(无重复双因素分析)

10-59作者:贾俊平,中国人民大学统计学院

统计学双因素方差分析

STATISTICS

(第六版)(例题分析)

【例】有4个品牌的彩电在5个地区销售,为分析彩电的品牌

(品牌因素)和销售地区(地区因素)对销售量的影响,对每显

著个品牌在各地区的销售量取得以下数据。试分析品牌和销

售地区对彩电的销售量是否有显著影响?(=0.05)

不同品牌的彩电在5个地区的销售量数据

地区因素

品牌因素

地区1地区2地区3地区4地区5

品牌1365350343340323

品牌2345368363330333

品牌3358323353343308

品牌4288280298260298

10-60作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS数据结构

(第六版)

10-61作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS数据结构

(第六版)

是行因素的第是行因素的第ii个水平下各观察值的平均值个水平下各观察值的平均值

是列因素的第是列因素的第jj个水平下各观察值的平均值个水平下各观察值的平均值

是全部是全部krkr个样本数据的总平均值个样本数据的总平均值

10-62作者:贾俊平,中国人民大学统计学院

统计学分析步骤

STATISTICS

(第六版)(提出假设)

提出假设

n对对行因素提出的假设为行因素提出的假设为

•H0:m1=m2=…=mii=…=mk(mii为第i个水平的

均值)

•H1:mii(i=1,2,…,k)不全相等

n对对列因素提出的假设为列因素提出的假设为

•H0:m1=m2=…=mjj=…=mr(mjj为第j个水平的

均值)

•H1:mjj(j=1,2,…,r)不全相等

10-63作者:贾俊平,中国人民大学统计学院

统计学分析步骤

STATISTICS

(第六版)(构造检验的统计量)

计算平方和(SS)

n总误差平方和总误差平方和

n行因素误差平方和行因素误差平方和

n列因素误差平方和列因素误差平方和

n随机误差项平方和随机误差项平方和

10-64作者:贾俊平,中国人民大学统计学院

统计学分析步骤

STATISTICS

(第六版)(构造检验的统计量)

总误差平方和(SST)、行因素平方和(SSR)、

列因素平方和(SSC)、误差项平方和(SSE)之

间的关系

SST=SSR+SSC+SSE

10-65作者:贾俊平,中国人民大学统计学院

统计学分析步骤

STATISTICS

(第六版)(构造检验的统计量)

计算均方(MS)

§误差平方和除以相应的自由度误差平方和除以相应的自由度

§三个平方和的自由度分别是三个平方和的自由度分别是

•总误差平方和SST的自由度为kr-1

•行因素平方和SSR的自由度为k-1

•列因素平方和SSC的自由度为r-1

•误差项平方和SSE的自由度为(k-1)×(r-1)

10-66作者:贾俊平,中国人民大学统计学院

统计学分析步骤

STATISTICS

(第六版)(构造检验的统计量)

计算均方(MS)

§行因素的均方,记为MSR,计算公式为

§列因素的均方,记为MSC,计算公式为

§误差项的均方,记为MSE,计算公式为

10-67作者:贾俊平,中国人民大学统计学院

统计学分析步骤

STATISTICS

(第六版)(构造检验的统计量)

计算检验统计量(F)

§检验行因素的统计量检验行因素的统计量

§检验列因素的统计量检验列因素的统计量

10-68作者:贾俊平,中国人民大学统计学院

统计学分析步骤

STATISTICS

(第六版)(统计决策)

将将统统计计量量的的值值FF与与给给定定的的显显著著性性水水平平的的临临界界值值FF

进行比较,作出对原假设进行比较,作出对原假设HH00的决策的决策

§根根据据给给定定的的显显著著性性水水平平在在FF分分布布表表中中查查找找相相应应

的临界值的临界值FF

§若若FFRR>>FF,,拒拒绝绝原原假假设设HH00,,表表明明均均值值之之间间的的差差

异异是是显显著著的的,,即即所所检检验验的的行行因因素素对对观观察察值值有有显显著著

影响影响

§若若FFCC>>FF,,拒拒绝绝原原假假设设HH00,,表表明明均均值值之之间间有有显显

著差异,即所检验的列因素对观察值有显著影响著差异,即所检验的列因素对观察值有显著影响

10-69作者:贾俊平,中国人民大学统计学院

统计学双因素方差分析表

STATISTICS

(第六版)(基本结构)

平方和自由度均方F

误差来源F值P值

(SS)(df)(MS)临界值

MSRMSR

行因素SSRSSRk-k-11MSRMSR

MSEMSE

MSCMSC

列因素SSCSSCr-1r-1MSCMSC

MSEMSE

(k-1)(r-

误差SSE(k-1)(r-MSE

SSE1)MSE

总和SSTSSTkr-kr-11

10-70作者:贾俊平,中国人民大学统计学院

统计学双因素方差分析

STATISTICS

(第六版)(例题分析)

提出假设提出假设

n对品牌因素提出的假设为对品牌因素提出的假设为

•H0:m1=m2=m3=m4(品牌对销售量无显著影响

)

•H1:mii(i=1,2,…,4)不全相等(有显著影响)

n对地区因素提出的假设为对地区因素提出的假设为

•H0:m1=m2=m3=m4=m5(地区对销售量无显著影

响)

•H1:mjj(j=1,2,…,5)不全相等(有显著影响)

10-71作者:贾俊平,中国人民大学统计学院

统计学双因素方差分析

STATISTICS

(第六版)(例题分析)

结论:

==,拒绝原假设,说明彩

§FR=18.10777>F=3.4903,拒绝原假设H0,说明彩

电的品牌对销售量有显著影响

==,不拒绝原假设,无证

§FC=2.100846<F=3.2592,不拒绝原假设H0,无证

据表明销售地区对彩电的销售量有显著影响

10-72作者:贾俊平,中国人民大学统计学院

统计学双因素方差分析

STATISTICS

(第六版)(关系强度的测量)

1.行平方和(SSR)度量了品牌这个自变量对因变量(销售量)

的影响效应

2.列平方和(SSC)度量了地区这个自变量对因变量(销售量)

的影响效应

3.这两个平方和加在一起则度量了两个自变量对因变量的联

合效应

4.联合效应与总平方和的比值定义为R2

5.其平方根R反映了这两个自变量合起来与因变量之间的关

系强度

10-73作者:贾俊平,中国人民大学统计学院

统计学双因素方差分析

STATISTICS

(第六版)(关系强度的测量)

例题分析

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论