版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
方差分析是重要的、应用广泛的实验数据统计分析方法,其实质是检验多个变量均值的一致性.1.方差分析概述ANOVA
由英国统计学家
R.A.Fisher首创.为纪念
Fisher,方差分析又称
F
检验.方差分析的几个基本概念如原料成分、原料剂量、催化剂、反应时间、设备等.—试验中对因子的不同处理或所处的状态.试验指标—试验所考察的事项,亦称响应变量.如考察化工生产中产品的质量、数量.试验因子—影响试验指标的因素.因子水平第一页,共56页。依据实验数据,判断在因子的不同处理下响应变量是回答这一类问题的基本方法,就是比较每一种处理下响应变量的均值是否相等.方差分析的工作目标否有差异?单因子方差分析双因子方差分析多元方差分析—单指标、单因子、多因子水平的实验数据分析.—单指标、双因子、多因子水平的实验数据分析.—多指标、单因子、多因子水平的实验数据分析.常用不同的英文大写字母表示试验因子,用大写字母加下标表示该因子的不同水平.第二页,共56页。例1
一位英语教师想检查
3种不同教学方法的效果,为此随机选取
24位学生并把他们分成
3
组,相应用三种方绩如表
1.性差异?表1英语成绩表
方法学习成绩A173668982438063A28878917685848096A3687971718768597680法教学.一段时间后教师对这
24位学生进行统考,统考成试问在
0.05显著性水平下,这三种教学方法有无显著第三页,共56页。英语成绩是否有显著影响.若有影响,哪一种教学方法好?同的变量.分析
问题是判断教师所采用的不同教学方法对学生方差分析中将因子的各个水平下的试验指标看作是不响应变量
—
英语成绩.影响因子
—
教学方法,记为
A.因子水平
—
教学方法的三种处理,记为
A1,A2,A3.通常假定每一个变量服从方差相等的正态分布,并且方差分析的三个基本的理论假设是相互独立的.显然,这是一个单因子方差分析问题.如三种教学方法下的英语成绩y1,y2,y3
.第四页,共56页。
条件误差
—由因子的不同处理(三种不同的教学
随机误差
—由随机因素(不可控制或不可预知的因素,如考试时的环境、时间对学生的影响)引起的差异.异,按
Fisher的思路可以通过分析造成成绩数据差异的原判断不同的教学方法对英语成绩的影响是否有显著差方差分析的基本思路实验数据(英语成绩)差异的来源:因来得到答案.方法)引起的差异.第五页,共56页。总偏差平方和
=条件误差平方和
+随机误差平方和
在总偏差平方和中,条件误差平方和与随机误差平方和如果是条件误差平方和是决定性的,则说明因子的不同因子的不同处理对响应变量的影响是否有差异,可以用差平方和按照产生的原因进行分解,得到:方差分析中的一个最基本的关系式,就是将数据总的偏实验数据之间的差异可用
偏差平方和
的概念描述.方差分析的任务就是进一步判断:究竟哪一个是决定性的(占更大的比重)?处理对响应变量的影响是有差异的.不同处理下响应变量的均值是否相同来描述.第六页,共56页。方差分析基本任务的统计描述判断不同处理下响应变量的均值是否相同,可归结为统计推断问题,即检验假设H0
:不同处理下响应变量的均值相同;H1
:不同处理下响应变量的均值不完全相同.
当前的问题是否满足三个基本的理论假设;围绕
H0的检验,应思考并解决如下三个方面的问题:
若拒绝
H0,如何找出因子的最优处理?检验统计量的构造与分布是怎样的?如何决策?第七页,共56页。2.1单因子方差分析统计模型及检验方法单因子方差分析统计模型在单因子试验中,设因子
A有
r个水平,第
i个水平2.单因子方差分析Ai
下响应变量
yi
的均值为μi,其容量为
mi
的一个样本数于是,单因子方差分析的统计模型为:据为
检验假设数据结构式随机误差第八页,共56页。记
于是,单因子方差分析的统计模型可改写为:显然检验假设—Ai
的(主)效应—响应变量的总均值—样本总容量第九页,共56页。检验统计量的构造与分布—总偏差平方和—变量yi的均值—样本总均值记
—SST的自由度第十页,共56页。SSE反映组内数据的随机误差.—误差偏差平方和—因子偏差平方和SSA反映组间由效应不同引起的数据差异.—SSA的自由度—SSE的自由度第十一页,共56页。SST=SSA+SSE
(
SSE=
SST
–
SSA
).在单因素方差分析模型中,对上述定义的三个偏差平方和
SST,SSE,SSA,有下面的定理:⑴平方和分解定理⑵
SSE的分布定理⑶SSA的分布定理当假设
H0
为真时,有第十二页,共56页。因此,可采用统计量
F来检验假设
H0,拒绝域为拒绝假设
H0
的最小显著性概率为
SSA与
SSE相互独立
.⑷检验统计量及其分布定理当假设
H0
为真时,有显然,检验假设
H0不真时,SSA会变得偏大.
但是数附近).
因此,统计量
F的值偏大不利于
H0.无论
H0真否,SSE/(n-r)都是σ2的无偏估计(稳定在常第十三页,共56页。表2单因子方差分析表偏差来源偏差平方和自由度均方和F值p值ASSAfAVA=SSA/fA
F=
VA/VE
p=P(F≥FEST
)ESSEfEVE=SSE/fE
TSSTfT检验的步骤与结果的报告其中,计算可按下列顺序进行:第十四页,共56页。MATLAB系统的单因素方差分析函数当在因子
A的每一水平下重复试验次数相同时,即当时,可由
MATLAB系统提供的
anova1
函数进行单因素方差分析.调用方法[p,anovatab,stats]=anova1(X,group,'displayopt')输入参数说明X—
表示样本点×变量型的观测值的
m×r矩阵.第十五页,共56页。group—
是表示r个变量意义的字符串数组,可缺省.输出参数说明隐藏,有两个取值:on(显示)和off(隐藏).displayopt—
控制方差分析表图形和
Box图的显示和stats—
返回若干个相关统计量的值,可缺省.p—
返回
X的各列均值相等的最小显著性概率.anovatab—
返回单因素方差分析表.第十六页,共56页。2.2否定H0之后的延伸分析模型标准误差与因子效应的估计⑴模型标准误差的点估计定理⑵因子效应的估计定理
μi
的置信水平为
1-α
的置信区间
因子效应的点估计第十七页,共56页。因子效应的多重比较对任意两个水平均值之间有无显著差异进行多重比较,检验的统计量为即同时检验以下假设
对于给定的检验水平α
,当
时拒绝.第十八页,共56页。LSD方法
.实际应用中,多重比较的操作常采用Fisher提出的
计算水平
i和
j
均值μi
与μj的最小显著差异值
逐一比较,当时,认为均值μi
与μj不同.实际应用中,可根据多重比较和因子效应的估计筛选出因子的最优处理.第十九页,共56页。2.3方差分析前的模型适应性分析在进行方差分析之前,通常应进行模型的适应性分析,即检验当前的样本数据是否满足单因子方差分析统计模型的三个基本的理论检验.正态性检验—正态概率纸检验法还能够粗略地估计出分布的数字特征.正态概率纸是一种现场统计常用的判断变量正态性的简单工具,使用它可以很快的判断变量是否服从正态分布,第二十页,共56页。正态概率纸的构造原理:设变量
X的分布函数为
F(x),需要检验在原假设
H0
成立时,Φ(x)
是标准正态分布的分布函数,其中并且第二十一页,共56页。在标准(单位长度相等)直角坐标平面
xou上,函数的图象是一条直线,过点(μ,0)
,斜率为
1/σ.为使这条直线能够直观的解释变量的取值
x与概率P(X≤x)之间的关系,进行如下坐标刻度更新:在标准直角坐标平面
xou上,保持横轴上
x的刻度不变,而把纵轴上
u的刻度更新为y=100Φ(x)
,并规定100Φ(-∞)=0,
100Φ(+∞)=100,第二十二页,共56页。这样就将直角坐标系
xou更新为直角坐标系
xoy.由于
y轴上的刻度
0
与
100分别对应
u轴上的-∞和+∞,因此
y轴上无法标示出
0与
100,一般轴上的刻度称以
xoy为刻度体系的坐标纸为正态概率纸.根据正态概率纸的构造原理可知,在
xou直角坐标系中的
x和
u的关系在
xoy直角坐标系中的成为
x和
y的关系标示限于
0.01到
99.99之间.反之亦然.第二十三页,共56页。对于正态概率纸上的一条直线,若该直线能表示为则是一个正态分布的分布函数.所组成的集合,与全体正态分布所组成的正态分布族之间,这表明,正态概率纸上斜率存在且大于零的全体直线存在一一对应关系.第二十四页,共56页。下面介绍正态概率纸检验法及其
MATLAB实现.为了检验假设
H0
,设求出经验分布函数
Fn(x),然后在正态概率纸描出点列
当
H0为真时,在正态概率纸上该点列应该近似地否则,认为
H0
不成立,即变量
X不服从正态分布.MATLAB提供了利用正态概率纸检验变量正态性的绘在一条直线附近.图函数normplot,其调用格式为normplot(
x
)
,输入参数x
是样本数据向量.第二十五页,共56页。方差齐性检验方差齐性检验的假设为方差齐性通常采用
Bartlett检验方法.检验统计量第二十六页,共56页。在显著性水平α下,拒绝域为
第二十七页,共56页。独立性检验当样本容量较小时,没有较好的检验方法,通常根据检验法对方差齐性和独立性进行同步检验.当正态性检验获得通过,样本容量较大时,可用球性采样操作的情形对独立性进行直观判断.感兴趣的同学可参阅高惠璇编著《应用多元统计分析》第3.4节(北京大学出版社,2005).第二十八页,共56页。下面,对单因子方差分析的应用步骤小结如下:⑴模型适应性分析独立性分析⑵方差分析⑶
延伸分析多重比较模型标准误差和因子效应的估计单因子方差分析应用举例正态性检验方差齐性检验
问题
若模型适应性分析未能通过,是否不能继续后面的步骤⑵?
回答
可以继续步骤⑵.有研究表明,F统计量的稳健性强,即使⑴中三项中的或检验未能通过,只要有较好的独立性,F检验仍有较好的效力,但需要注意模型标准误差会有所提高.第二十九页,共56页。3.1无交互作用的双因子方差分析设
A与
B是对试验指标有影响的两个因子,判断因子设因子A
有
r个水平,因子
B有
s个水平,现对因子个处理.3.双因子方差分析的不同处理对试验指标的影响是否有显著差异?双因子方差分析方法的特殊效力在于分析者可以考虑两个因子之间的交互作用对试验指标的影响.A、B
的不同水平的每种组合下进行试验或抽样,共r×s
假定两个因子之间的不存在交互作用.第三十页,共56页。在因子间交互作用的情形下,可对因子水平的每个组合
(Ai,Bj)
仅安排一次试验来获取试验指标
yij的测量值.无交互作用的双因子方差分析的数据结构如下:因子
BB1B2…Bs因子AA1y11
y12
…y1s
A2y21
y22…y2s…………Aryr1
yr2…yrs数据结构第三十一页,共56页。记—Ai
的(主)效应.—Bj
的(主)效应.显然统计模型与检验假设第三十二页,共56页。检验假设于是,无交互作用的双因子方差分析的统计模型为第三十三页,共56页。检验统计量的构造思想方法类似于单因子方差分析.检验统计量的构造与分布—总偏差平方和—因子水平Ai的样本均值—样本总均值记
—SST的自由度—因子水平Bj的样本均值第三十四页,共56页。SSE反映组内数据的随机误差.—误差偏差平方和—因子
A的偏差平方和SSA和
SSB反映组间由效应不同引起的数据差异.—SSA的自由度—SSE的自由度—因子
B的偏差平方和—SSB的自由度第三十五页,共56页。⑴平方和分解定理⑵平方和分布定理在无交互作用的双因子方差分析模型中,有如下定理:第三十六页,共56页。⑶检验统计量的分布定理检验的决策准则第三十七页,共56页。通常用无交互作用的双因子方差分析表报告检验结果.检验结果的报告无交互作用的双因子方差分析表第三十八页,共56页。3.2有交互作用的双因子方差分析引例交互作用的直观解释两种不同类型的化肥,如果同时施用时,总作用等于分别施用时的作用之和,说明没有交互作用;如果总作用大于(或小于)分别施用时的作用之和,说明有正的(或负的)交互作用。例如在四块面积相同的大豆实验田上,用四种不同的方式施肥,其中
因子1:磷肥(两种水平,i=1,2)
因子2:氨肥(两种水平,j=1,2)实验数据如下表:第三十九页,共56页。施磷肥P1=0施磷肥P2=4P1P2施氨肥N1=0施氨肥N2=6400450430560450-400=50560-430=130N1N2430-400=30560-450=110560-400=160不施氨肥,单独施加磷肥增产50斤;不施磷肥,单独施加氨肥增产30斤;同时施加磷肥和氨肥总作用160,大于各自的分作用之和,所以有交互作用。
第四十页,共56页。的这种情况下,数据结构如下表:
3.2有交互作用的双因子方差分析所谓交互作用,就是因素之间的联合搭配作用对实验结果产生了影响.一般的在有重复实验的双因子方差分析第四十一页,共56页。记—Ai
的(主)效应.—Bj
的(主)效应.显然统计模型与检验假设—Ai和Bj的交互效应.第四十二页,共56页。于是,交互作用的双因子方差分析的统计模型为H03即
A与
B的交互效应对试验指标影响不显著.在给定的显著性水平α下,检验如下统计假设:第四十三页,共56页。有交互作用的双因子方差分析表第四十四页,共56页。其中第四十五页,共56页。的原假设.或者由检验的最小显著性概率
p作出决策,当p<α时当计算出
F的值大于给定α的临界值时,则拒绝相应检验准则是:拒绝相应的原假设.
第四十六页,共56页。对于双因素方差分析的问题的处理,MATLAB提供了命令anova2,其调用格式为[p,table]=anova2(X,reps,'displayopt')这个命令和anoval()类似,只是输入矩阵X的行、列各表示一个因子,不同的行(列)表示该因子不同处理下的响应变量的观测值向量.每一个“行与列的偶对”称为一个数据单元,如果各数据单元拥有多于一个的观测点,则参数reps声明每一个单元观测点的数目.第四十七页,共56页。行因子有三种不同处理,列因子有两种不同处理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论