




免费预览已结束,剩余39页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学教程第8章方差分析,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.1方差分析的一般问题8.1.1方差分析的基本原理8.1.2方差分析的基本假定8.2单因素方差分析8.2.1单因素方差分析的步骤8.2.2方差分析表8.2.3方差分析中的多重比较8.3双因素方差分析8.3.1无交互作用的双因素方差分析8.3.2有交互作用的双因素方差分析,第8章方差分析,8.1方差分析的一般问题,统计学教程,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.1方差分析的一般问题,8.1.1方差分析的基本原理方差分析可以用来分析和判断多个样本的特征数值之间有无显著差异。以均值为例,当多个样本为来自某一受控因素不同水平的观察数值时,若该多个样本的各自均值之间不存在显著差异,即表明这一受控因素的不同水平对变动的影响是不显著的,属于随机因素引起的随机变动;反之,若该多个样本的各自均值之间存在着显著差异,即表明这一受控因素的不同水平对变动的影响是显著的,属于受控因素引起系统性的变动。因素(Factor)是指方差分析所要检验的对象,也称为因子。水平(Level)是指方差分析因素的具体表现,也称为处理(Treatment)。观察值(ObservationalValue)是指在具体的因素水平下的样本数据。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.1方差分析的一般问题,例8.1某企业为了分析研究成品车间的产品质量控制问题,对该车间的5个班组的产品优等品率进行了一次抽查,在每个班组独立地抽取了5个优等品率数据构成了随机样本。表8.1某企业成品车间5个班组优等品率抽查情况%,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.1方差分析的一般问题,因此,方差分析是依据具体的因素水平下的观察值,对因素进行显著性假设检验的方法和过程。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.1方差分析的一般问题,在方差分析中,各样本观察值之间的差异称之为总差异,用总离差平方和来表示。总离差平方和(SumofSquares)是每一观察值与其总均值的离差的平方的总和。根据因素的不同水平,方差分析将观察值之间的差异以及总离差平方和分解为两部分。一部分是同一水平下观察值之间的差异,称之为组内离差,通常用组内离差平方和来度量(SumofSquaresWithinGroups);另一部分是不同水平观察值之间的差异,称之为组间离差,通常用组间离差平方和(SumofSquaresBetweenGroups)来度量,例如表8.1中5个班组观察值均值之间的差异,就是组内离差,采用每一班组观察值的样本均值与总均值之间离差的平方和来度量。方差分析是将具体的因素水平下观察值的差异分解为不受因素水平影响的组内离差,和受到因素水平影响的组间离差,并通过显著性假设检验,来判断所研究的因素是否具有显著的系统性变动特征的方法和过程。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.1方差分析的一般问题,8.1.2方差分析的基本假定方差分析基本假定的一般性的表述为,设因素A有个k水平,在每个具体水平下,总体分布为。注意这里个总体方差均相等,并且在每个水平下抽取一个样本,所取得的个样本相互独立。显然,以上表述规定了方差分析的3项基本假定。1每个总体均服从正态分布。对应于具体因素的每一个水平,其观测值都是来自正态总体。2每个总体具有同等方差,即方差齐性要求。对应于具体因素的每一个水平,其观测值都是来自具有同等的方差的正态总体。3观测值都是相互独立的。每一观测值都是来自具有同等方差的正态总体的独自同分布样本。,第8章方差分析,8.2单因素方差分析,统计学教程,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.2单因素方差分析,8.2.1单因素方差分析的步骤1提出假设方差分析的第一步就是建立假设。按照具体的水平,针对所检验的对象提出原假设和备择假设,当因素有个k水平时,需要提出如下假设。不全相等原假设表示在不同的下的各个总体均值相等,即不同的水平对总体均值没有显著影响;备择假设表示在不同的下的各个总体均值不全相等,至少有一个总体均值与其它总体均值不等,即该因素的不同的水平对总体均值存在显著影响。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.2单因素方差分析,2计算均值(1)水平均值水平均值(LevelMean)是指根据具体水平下的观察值的均值。一般将第项水平的水平均值记为,有计算公式为(8.1)(2)总均值总均值(TotalMean)是指全部观察值的均值,也为水平均值的均值。总均值一般记为,有(8.2),2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.2单因素方差分析,按照式(8.1),由表8.1的数据可以计算出例8.1中各组的水平均值。表8.2某企业成品车间5个班组优等品率水平均值%按照式(8.2),由表8.2的数据可以计算出例8.1的中该企业成品车间5个班组优等品率的总均值为86.04%。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.2单因素方差分析,3计算离差平方和(1)总离差平方和总离差平方和(SumofSquaresforTotal,SST)是指全部观察值与总均值的离差的平方和,反映了全部观察值离散程度的总规模。有(8.3)按照式(8.3),由表8.2的数据可以计算出例8.1的总离差平方和SST为286.96。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.2单因素方差分析,(2)水平项差平方和水平项离差平方和(SumofSquaresforFactorA,SSA)是指各项水平的水平均值与总均值的离差的平方和,反映了各项水平代表性数值各项水平均值之间离散程度的规模。有(8.4)按照式(8.4),由表8.2的数据可以计算出例8.1的水平项离差平方和SSA为183.76。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.2单因素方差分析,(3)误差项离差平方和误差项离差平方和(SumofSquaresforError,SSE)是指各项水平的观察值与其水平均值的离差的平方和之和,反映了各项水平内部观察值离散程度的总和。有(8.5)按照式(8.5),由表8.2的数据可以计算出例8.1的误差项离差平方和SSE为103.20。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.2单因素方差分析,(4)离差平方和之间的关系从方差分析的角度,在三项离差平方和中,总离差平方和SST所度量的离散程度包括了全部观察值的所有变异;水平项离差平方和SSA是对各项水平之间的差异程度进行度量的测度,即包括了随机离差,又包括了系统离差;误差项离差平方和SSE反映的是各个水平内部的离散程度,仅仅包括随机离差。这三项离差平方和存在着水平项离差平方和SSA与误差项离差平方和SSE之和等于总离差平方和SST的数量对等关系。即(8.6)因此,可以通过比较水平项离差平方和SSA与误差项离差平方和SSE数值,对所设定的因素的不同水平对总体均值没有显著影响的原假设进行检验,最终作出接受还是拒绝原假设的判断。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.2单因素方差分析,4计算均方均方(MeanSquare)是指离差平方除以其自由度的商。计算均方的关键是正确地确定各离差平方的自由度。(1)SSA的均方MSA水平项离差平方和SSA的自由度为k-1,则有其均方MSA为(8.7)按照式(8.7),可计算出例8.1的MSA为45.94。(2)SSE的均方MSE误差项离差平方和SSE的自由度为n-k,则有其均方MSE为(8.8)按照式(8.8),可计算出例8.1的MSE为5.16。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.2单因素方差分析,(3)SST的均方MST总离差离差平方和SST的自由度为n-1,则有其均方MST为(8.9)总离差平方和SST是由个观察值计算的离差平方和,并含有1个线性约束条件,所以总离差平方和SST的自由度为n-1。显然有水平项离差平方和SSA与误差项离差平方和SSE两者的自由度之和,等于总离差平方和SST的自由度,即n-1=(k-1)+(n-k)。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.2单因素方差分析,5计算F检验统计量误差项离差平方和SSE与总体方差之比服从自由度为的卡方分布,即(8.10)水平项离差平方和SSA与总体方差之比服从自由度为的卡方分布,即(8.11)有式(8.9)和式(8.10)的比值服从第一自由度为k-1,第二自由度为n-k的F分布,即(8.12)由式(8.12),可计算出例8.1的检验统计量的数值为8.9031。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.2单因素方差分析,5计算F检验统计量误差项离差平方和SSE与总体方差之比服从自由度为的卡方分布,即(8.10)水平项离差平方和SSA与总体方差之比服从自由度为的卡方分布,即(8.11)有式(8.9)和式(8.10)的比值服从第一自由度为k-1,第二自由度为n-k的F分布,即(8.12)由式(8.12),可计算出例8.1的检验统计量的数值为8.9031。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.2单因素方差分析,6统计判断在计算出F检验统计量的具体数值之后,将F检验统计值与给定的显著性水平的F分布临界数值相比较,作出接受还是拒绝原假设的统计判断。若F检验统计值落在由F分布临界数值界定的接受域内,则接受原假设;反之,便拒绝原假设。例8.1的检验统计值为8.9031,在显著性水平为0.05时,有F检验临界值为2.8661。显然,F检验统计值8.9031大于F分布的临界数值。因此,作出拒绝原假设的统计判断,认为不同的班组是该企业成品车间产品质量的显著性影响因素。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.2单因素方差分析,8.2.2方差分析表表8.3方差分析表表8.4Excel单因素方差分析表,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.2单因素方差分析,8.2.3方差分析中的多重比较当方差分析得出拒绝原假设时,不能由此推断该因素各水平两两之间都存在显著差异。在方差分析中,将解决这类问题的方法称为方差分析中的多重比较。多重比较方法(MultipleComparisonProcedures)是指通过不同水平均值之间的两两配对比较,来检验各个总体均值之间是否存在显著差异的假设检验方法和过程。最小显著性差异法是一种使用比较普遍的多重比较方法。最小显著性差异法(LeastSignificantDifference,LSD)是指在方差分析中,采用T统计量对各水平是否存在显著差异进行逐一两两配对比较的假设检验方法。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.2单因素方差分析,在第7章中,讨论了在两个服从正态分布总体的方差和为未知且相等的场合,对总体均值假之差进行假设检验时,采用统计量来进行假设检验,可以在方差分析关于方差匀性(方差相等)的前提下,引申出对于多个个总体均值的统计量假设检验方法。有(8.14)当各水平的观测值个数相等时。则式(8.14)又可简约地写为(8.15),2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.2单因素方差分析,例8.2采用例8.1中各组观测值表8.1和表8.2中各组水平均值数据,采用最小显著性差异法,检验各组总体均值之间的差异是否显著。解要求检验各组总体均值之间的差异是否显著,意味着需要进行5个水平的成对组合数进行假设检验,即进行10项假设检验。可以将此假设检验依次分为4组。在显著性水平为0.05,自由度为20的双侧检验临界值为2.08596。表8.5采用最小显著性差异法计算的例8.1检验统计量,第8章方差分析,8.3双因素方差分析,统计学教程,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.3双因素方差分析,双因素方差分析(Two-WayAnalysisofVariance)是指所要检验的对象为两个的情况下的方差分析。根据因素之间的效应是否独立,可以将双因素方差分析分为两种类型。一种是假定A因素与B因素之间是相互独立,无交互作用的双因素方差分析;另一种是假定A因素与B因素之间是有交互作用的双因素方差分析。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.3双因素方差分析,8.3.1无交互作用的双因素方差分析无交互作用的双因素方差分析也被称为无重复双因素方差分析。所谓无交互作用强调的是A因素与B因素之间相互独立的特征;所谓无重复强调的是由A因素与B因素交互构成的任一组合,仅包含一项观测值,不能进行重复观测的这一特征。在不能进行重复观测的场合,也就不能分析因素与因素之间的交互作用。1数据结构在无交互作用的双因素方差分析中,一般将一个因素安排在数据表的“行(Row)”的位置上,例如表8.6中的因素,称之为行因素,并用序号1到s表示;将另一个因素安排在数据表的“列(Column)”的位置上,例如表8.6中的因素,称之为列因素,并用序号1到k表示。行因素和列因素的每一个水平都可以构成一项观察值,一共有项观察值,通过观察值来反映这两个因素对的共同影响。双因素方差分析的数据结构如表8.6所示。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.3双因素方差分析,表8.6双因素方差分析的数据结构,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.3双因素方差分析,2.分析步骤(1)提出假设在双因素方差分析中,需要对两个因素分别提出假设。对排列在行上的因素提出假设,为不全相等同时对排列在列上的因素提出假设,为不全相等,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.3双因素方差分析,(2)构造检验统计量仍然从总离差平方和SST出发,有(8.20)式(8.20)中等号右边第一项为列因素(ColumnFactor)的水平均值与总均值的离差平方和,记为SSC。有(8.21)其自由度为k-1,则SSC的均方为MSC。有(8.22),2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.3双因素方差分析,第二项为行因素(RowFactor)的水平均值与总均值的离差平方和。记为SSR。有(8.23)其自由度为s-1,则SSR的均方为MSR。有(8.24)第三项是除掉列因素和行因素之外的剩余因素影响形成的离差平方和。记为SSE。有(8.25)其自由度为(s-1)(k-1),则SSE的均方为MSE。有(8.26),2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.3双因素方差分析,由以上三项均方MSC、MSR和MSE,可以构成两项检验统计量。其中,检验列因素是否具有显著性影响的检验统计量为(8.27)检验行因素是否具有显著性影响的检验统计量为(8.28)在无交互作用的双因素方差分析中,有总离差平方和SST的自由度仍为n-1。同时,水平项离差平方SSA和、误差项离差平方和SSE,与剩余因素影响离差平方和SSE三者的自由度之和,应等于总离差平方和SST的自由度,在这里有n=ks。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.3双因素方差分析,(3)统计判断将由式(8.27)和式(8.28)计算出来的两项F检验统计值,分别与给定的显著性水平的F分布的临界数值相比较,作出接受还是拒绝原假设的统计判断。若检验统计值楼在落在由F分布的临界数值界定的接受域内,则接受原假设;反之,则拒绝原假设。,2020年5月29日/上午6时13分,统计学教程第8章方差分析,例8.3在一次职工收入水平调查中,采集了甲、乙、丙、丁四个城市的A、B、C、D、E五类职业月收入数据。采用无交互作用的双因素方差分析方法判断城市和职业类型这两个因素对职工收入是否有显著影响。解计算出各行各列的水平均值,和全部观测值的总均值。表8.8职业月收入情况双因素方差分析数据结构表元,8.3双因素方差分析,2020年5月29日/上午6时13分,统计学教程第8章方差分析,8.3双因素方差分析,(1)提出原假设行因素(职业)列因素(城市)备择假设可以省略,不用列出。(2)计算检验统计量按照有关公式,逐一计算出各项离差平方和、自由度、均方、检验值,并将这些数据依照计算的次序列在方差分析表中。表8.9职业月收入情况双因素方差分析表,2020年5月2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 法人调解协议书
- 反担保协议书
- 2025年上海房地产买卖合同范本
- 2025租房合同协议书
- 2025综合咨询委托合同
- 赞赞协议书辅助
- 2025年临时工劳动合同
- 合作社入股协议书
- 2025家政服务居间合同范本
- 2025商场店铺租赁合同范本参考
- 2024版中国宪法课件
- 《食品厂员工绩效方案》
- 工程人员驻场服务方案
- 汽车智能技术与应用 教案全套 朱升高 项目1-10 智能网联汽车技术介绍- 车载嵌入式操作系统应用
- 产品方案设计模板
- 企业合规经营规范手册
- 骨与关节运动学基础-运动链(康复护理技术)
- 2.2中国的气候季风气候特殊天气和气象灾害课件八年级地理上学期
- GB/T 4706.74-2024家用和类似用途电器的安全第74部分:缝纫机的特殊要求
- 2024版民间借款抵押合同范本完整版
- DL 5190.5-2019 电力建设施工技术规范 第5部分:管道及系统
评论
0/150
提交评论