版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章方差分析第一节方差分析的基本问题第二节单因素方差分析第三节双因素方差分析学习目标1.解释方差分析的概念2.解释方差分析的基本思想和原理3.掌握单因素方差分析的方法及应用4.掌握双因素方差分析的方法及应用第一节方差分析的基本问题一、方差分析的内容二、方差分析的原理三、F分布一、方差分析的内容(一)方差分析中的常用术语1、因素(Factor)2、水平(Level)3、单元(Cell)4、元素(Element)5、均衡(Balance)6、交互作用(Interaction)(二)用方差分析来检验假设有三个假定1、因素(Factor)
因素是指所要研究的变量,它可能对因变量产生影响。一个是因素,因素是一个独立的变量,是方差分析研究的对象。要分析不同销售方式对销售量是否有影响,所以,销售量是因变量,而销售方式是可能影响销售量的因素。2、水平(Level)因素中的内容称为水平。水平指因素的具体表现,如销售的四种方式就是因素的不同取值等级。有时水平是人为划分的,比如质量被评定为好、中、差。3、单元(Cell)单元指因素水平之间的组合。如销售方式一下有五种不同的销售业绩,就是五个单元。方差分析要求的方差齐就是指的各个单元间的方差齐性。4、元素(Element)元素指用于测量因变量的最小单位。一个单元里可以只有一个元素,也可以有多个元素。5、均衡(Balance)如果一个试验设计中任一因素各水平在所有单元格中出现的次数相同,且每个单元格内的元素数相同,则称该试验是为均衡,否则,就被称为不均衡。不均衡试验中获得的数据在分析时较为复杂。6、交互作用(Interaction)如果一个因素的效应大小在另一个因素不同水平下明显不同,则称为两因素间存在交互作用。当存在交互作用时,单纯研究某个因素的作用是没有意义的,必须分另一个因素的不同水平研究该因素的作用大小。如果所有单元格内都至多只有一个元素,则交互作用无法测出。若方差分析只针对一个因素进行,称为单因素方差分析。如果同时针对多个因素进行,称为多因素分析。在多因素方差分析中,双因素方差分析里最常见的。(二)用方差分析来检验假设有三个假定1、各个水平的观察数据必须服从正态分布:在水平Ai下的数据是来自正态总体的一个样本,i=1,2…,r。2、方差相同或者叫方差齐性:r个正态总体的方差相等,即。3、随机性:所有数据都相互独立。方差分析中的基本假定在上述假定条件下,判断行业对投诉次数是否有显著影响,实际上也就是检验具有同方差的四个正态总体的均值是否相等如果四个总体的均值相等,可以期望四个样本的均值也会很接近四个样本的均值越接近,推断四个总体均值相等的证据也就越充分样本均值越不同,推断总体均值不同的证据就越充分方差分析中基本假定
如果原假设成立,即H0:m1=m2=m3=m4四个行业被投诉次数的均值都相等意味着每个样本都来自均值为
、差为
2的同一正态总体
Xf(X)
1
2
3
4
方差分析中基本假定
若备择假设成立,即H1:mi(i=1,2,3,4)不全相等至少有一个总体的均值是不同的四个样本分别来自均值不同的四个正态总体
Xf(X)
3
1
2
4
二、方差分析的原理
方差分析的目的是要检验各个水平的均值μ1,μ2……μr
是否相等,实现这个目的的手段是通过方差的比较。如果n个总体的均值相等,然希望三个样本的均值比较接近,事实上,n个样本的均值愈接近,就愈有证据得出结论:总体均值相等,反之,若n个样本均值的差异愈大,就得出结论,总体均值不相等。样本均值变动性小→支持H0,样本均值变动性大→支持H1。三、F分布水平间方差(组间方差)和水平内方差(组内方差)之比是一个统计量,数理统计证明,这个统计量服从F分布。F=第二节单因素方差分析一、建立假设二、计算水平均值三、计算离差平方和四、计算平均平方五、方差分析表六、统计决策七、应用实例
一、建立假设方差分析的第一步是建立假设。以饮料颜色对销售量的影响为例,针对我们关心的问题提出原假设和备择假设。H0:μ1=μ2=μ3=μ4
颜色对销售量没有影响H1:μ1,μ2,μ3,μ4
不全相等,颜色对销售量有影响。注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等。二、计算水平均值令表示第j种水平的样本均值,则
=式中:xij为第j种水平下的第I个观察值;
nj第j种水平的观察值个数。计算总均值的一般表达式为:总均值:是所有观察值的总和除以观察值的总数。
(注:各个样本容量相等)三、计算离差平方和1、总离差平方和SST(SumofSquaresforTotal)2、误差项离差平方和(组内)SSE(SumofSquaresForError)3、水平项离差平方和(组间)SSA或SSb(SumofSquaresforfactorA)或(bossom)构造检验的统计量
(三个平方和的关系)
总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)之间的关系SST=SSA+SSE构造检验的统计量
(三个平方和的作用)
1.SST反映全部数据总的误差程度;SSE反映随机误差的大小;SSA反映随机误差和系统误差的大小
2.如果原假设成立,则表明没有系统误差,组间平方和SSA除以自由度后的均方与组内平方和SSE和除以自由度后的均方差异就不会太大;如果组间均方显著地大于组内均方,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差
3.判断因素的水平是否对其观察值有影响,实际上就是比较组间方差与组内方差之间差异的大小四、计算平均平方用离差平方和除以自由度即可得到平均平方SST、SSA、SSE之间的自由度也存在着如下的关系:n-r=(r-1)+(n-r)五、方差分析表F值的计算为:方差来源离差平方和自由度平均平方F值组间SSAr-1MSAMSA/MSE组内SSEn-rMSE—总差异SSTn-1——构造检验的统计量
(F分布与拒绝域)如果均值相等,F=MSA/MSE1a
F分布F
(k-1,n-k)0拒绝H0不拒绝H0F六、统计决策把F值与F
值比较:若F>F
拒绝原假设,则接受备择假设。若F<F
接受原假设。统计决策
将统计量的值F与给定的显著性水平
的临界值F
进行比较,作出对原假设H0的决策根据给定的显著性水平
,在F分布表中查找与第一自由度df1=k-1、第二自由度df2=n-k相应的临界值F
若F>F
,则拒绝原假设H0
,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响若F<F
,则不拒绝原假设H0
,不能认为所检验的因素对观察值有显著影响七、应用实例SST=(57-47.869565)2+…+(58-7.869565)2=115.9295SSA=1456.608696SSE=2708
查表得临界值为3.12显然,本题F值大于临界值所以,结论为拒绝原假设,认为四个行业至少有两个行业的利润率有显著差异。
单因素方差分析表
(基本结构)单因素方差分析
(例题分析)用Excel进行方差分析
第1步:选择“工具”下拉菜单第2步:选择“数据分析”选项第3步:在分析工具中选择“单因素方差分析”
,然后选择“确定”第4步:当对话框出现时
在“输入区域”方框内键入数据单元格区域在
方框内键入0.05(可根据需要确定)在“输出选项”中选择输出区域用Excel进行方差分析第三节双因素方差分析一、双因素方差分析的类型二、数据结构三、实例一、双因素方差分析的类型(two-wayanalysisofvariance)
分析两个因素(行因素Row和列因素Column)对试验结果的影响如果两个因素对试验结果的影响是相互独立的,分别判断行因素和列因素对试验数据的影响,这时的双因素方差分析称为无交互作用的双因素方差分析或无重复双因素方差分析(Two-factorwithoutreplication)如果除了行因素和列因素对试验数据的单独影响外,两个因素的搭配还会对结果产生一种新的影响,这时的双因素方差分析称为有交互作用的双因素方差分析或可重复双因素方差分析
(Two-factorwithreplication)二、数据结构(一)双因素方差分析的假定条件(一)数据结构(二)分析步骤(一)双因素方差分析的基本假定每个总体都服从正态分布对于因素的每一个水平,其观察值是来自正态分布总体的简单随机样本各个总体的方差必须相同对于各组观察数据,是从具有相同方差的总体中抽取的观察值是独立的(二)数据结构
数据结构
是行因素的第i个水平下各观察值的平均值
是列因素的第j个水平下的各观察值的均值
是全部kr个样本数据的总平均值(三)分析步骤(1)提出假设(2)构造检验统计量(3统计决策)分析步骤
(提出假设)提出假设对行因素提出的假设为H0:m1=m2
=
…=mi=…=
mk(mi为第i个水平的均值)H1:mi
(i=1,2,…,k)
不全相等对列因素提出的假设为H0:m1=m2
=
…=mj=…=
mr(mj为第j个水平的均值)H1:mj
(j=1,2,…,r)
不全相等分析步骤
(构造检验的统计量)计算平方和(SS)总误差平方和行因素误差平方和列因素误差平方和随机误差项平方和分析步骤
(构造检验的统计量)
总离差平方和(SST)、水平项离差平方和(SSR和SSC)、误差项离差平方和(SSE)之间的关系SST=SSR+SSC+SSE分析步骤
(构造检验的统计量)计算均方(MS)误差平方和除以相应的自由度三个平方和的自由度分别是总离差平方和SST的自由度为kr-1行因素的离差平方和SSR的自由度为k-1列因素的离差平方和SSC的自由度为r-1随机误差平方和SSE的自由度为(k-1)×(r-1)
分析步骤
(构造检验的统计量)计算均方(MS)行因素的均方,记为MSR,计算公式为列因素的均方,记为MSC
,计算公式为随机误差项的均方,记为MSE
,计算公式为分析步骤
(构造检验的统计量)
计算检验统计量(F)检验行因素的统计量检验列因素的统计量分析步骤
(统计决策)将统计量的值F与给定的显著性水平
的临界值F
进行比较,作出对原假设H0的决策根据给定的显著性水平
在F分布表中查找相应的临界值F
若FR>F
,则拒绝原假设H0
,表明均值之间的差异是显著的,即所检验的行因素对观察值有显著影响若FC>F
,则拒绝原假设H0
,表明均值之间有显著差异,即所检验的列因素对观察值有显著影响双因素方差分析表
(基本结构)表7-4无交互作用的双方差分析表方差来源离差平方和df均方MSF因素ASSAr-1MSA=SSA/(r-1)MSA/MSE因素BSSBs-1MSB=SSE/(n-r)MSB/MSE误差SSE(r-1)(s-1)MSE=SSE/(r-1)(s-1)—总方差SSTn-1——三、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 关于开展新项目合作意向的沟通函(6篇范文)
- 关于确认新员工入职培训时间表的通知函(4篇)
- 中国中免免税业务迎来新机遇免税龙头优势尽显
- 优然牧业周期底部向上业绩反转可期
- 导尿术前的患者评估与准备
- 银行业专业人员中级职业资格考试(专业实务银行管理)自测试题库及答案(山西省吕梁市2026年)
- 2026年直播电商行业研究方法论
- 2026年学术研究参考·各高校硕士研究生入学考试模拟题集(全科含解析)
- 2026年教研员面试试题及答案(含解析)
- 2026年天津天津银行业专业人员中级职业资格考试(专业实务银行管理)自测试题库及答案
- 2026年时政试题及答案(108题)
- 2026年新版七年级下册道德与法治期末素养测试卷(含答案)
- 中国血脂管理指南(2023年版)解读与实践
- 减少我们的碳排放课件2025-2026学年统编版四年级上册道德与法治
- 2024-2025学年四川省成都市石室联中教育集团七年级(下)期中数学试卷
- 建立有效护患沟通的技巧
- 2026年合理用药培训试题及答案
- 2025华为经营管理(第8版):华为干部管理
- 食道癌课件教学课件
- 钻孔钢管桩施工工艺流程
- PCB钻孔粉尘安全培训课件
评论
0/150
提交评论