第13讲-方差分析-单因素模板.ppt_第1页
第13讲-方差分析-单因素模板.ppt_第2页
第13讲-方差分析-单因素模板.ppt_第3页
第13讲-方差分析-单因素模板.ppt_第4页
第13讲-方差分析-单因素模板.ppt_第5页
免费预览已结束,剩余59页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

方差分析-单因素方差分析,一、基本概念,二、单因素方差分析的数学模型,四、参数估计问题,三、单因素方差分析的假设检验,如:某种农作物的收获量受作物品种、肥料种类及数量等的影响;选择不同的品种、肥料种类及数量进行试验,看哪一个影响大?并需要知道起显著作用的因素在什么时候起最好的影响作用。,日常生活中经常发现,影响一个事物的因素很多,希望找到影响最显著的因素,方差分析就是解决这些问题的一种有效方法。,ANOVA由英国统计学家R.A.Fisher首创,为纪念Fisher,以F命名,故方差分析又称F检验(Ftest)。,1.起源,2.什么是方差分析(ANOVA)(analysisofvariance),1)、引例用上例,研究问题:各肥料品种是否有差异。,问题转化:各肥料品种是否有差异体现为各肥料品种对小麦亩产量的影响否有显著差异。,记X1为肥料A1下的小麦亩产量,m1为平均亩产量;X2为肥料A2下的小麦亩产量,m2为平均亩产量;X3为肥料A3下的小麦亩产量,m3为平均亩产量;X4为肥料A4下的小麦亩产量,m4为平均亩产量;问题转化为,H0:m1=m2=m3=m4,H1:m1m2m3m4不全等,检验多个母体平均数是否相等,2)、什么是方差分析,手段:分析数据的误差判断各母体均值是否相等,【例】为了对几个行业的服务质量进行评价,消费者协会在四个行业分别抽取了不同的企业作为样本。最近一年中消费者对总共23家企业投诉的次数如下表,3.方差分析的基本原理,(一)图形分析,子样平均值的折线,1、从散点图上可以看出不同行业被投诉的次数是有明显差异的即使是在同一个行业,不同企业被投诉的次数也明显不同家电制造被投诉的次数较高,航空公司被投诉的次数较低2、行业与被投诉次数之间有一定的关系如果行业与被投诉次数之间没有关系,那么它们被投诉的次数应该差不多相同,在散点图上所呈现的模式也就应该很接近,1、仅从散点图上观察还不能提供充分的证据证明不同行业被投诉的次数之间有显著差异这种差异也可能是由于抽样的随机性所造成的2、需要有更准确的方法来检验这种差异是否显著,也就是进行方差分析所以叫方差分析,因为虽然我们感兴趣的是均值,但在判断均值之间是否有差异时则需要借助于方差这个名字也表示:它是通过对数据误差来源的分析判断不同母体的均值是否相等。因此,进行方差分析时,需要考察数据误差的来源。,方差分析的思想,1、随机误差因素的同一水平(母体)下,子样各观察值之间的差异,对数据形成组内差。比如,同一行业下不同企业被投诉次数是不同的这种差异可以看成是随机因素的影响,称为随机误差,附:两类误差,2、系统误差因素的不同水平(不同母体)下,各观察值之间的差异,对数据形成组间差。比如,不同行业之间的被投诉次数之间的差异这种差异可能是由于抽样的随机性所造成的,也可能是由于行业本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差,附:两类误差,方差分析,已讨论了两个方差相等的正态总体对均值比较的假设检验问题对有相同方差的多个正态总体均值进行比较的假设检验问题?方差分析就是解决这类问题的有效方法,现在正是开始本节内容,单因素,两因素,一、基本概念,指标、因素、水平,1、指标:试验结果值称为指标,一般表示为,数值,用X表示。,2、因素(因子):试验中需考察的可以控制的条件。用A,B,C表示,3、水平:因素所处的状态,一般用A1、A2、A3、Ar。一般将因子控制在几个不同的状态上,每一个状态称为因素的一个水平.,单因素方差分析:众多因素中仅有一个因素的的水平有多个,其余因素只有一个水平。,多因素方差分析:多个因素有多个水平。,【例】为了比较四种肥料对小麦亩产量的影响,取一片土壤肥沃程度和水利灌溉条件差不多的土地分成16块,肥料品种A1、A2、A3、A4,每种肥料施在四块土地上,得亩产:,指标:亩产,因素:肥料,水平:品种,实例1.对某种型号的电池进行抽查,随机抽取了来自A,B,C三个工厂的产品,测得其寿命(h)见下表,设各工厂所生产的电池的寿命服从有相同方差的正态分布,问这三个工厂所生产的电池的平均寿命有无显著差异?,电池的寿命(h),试验的目的是为了考察不同厂家生产的电池平均寿命是否有显著差异。如果有显著差异,表明生产工厂这一因子对电池寿命的影响是显著的.,在此实例中,,指标:,电池的寿命;,因素:,生产电池的工厂;,水平:,工厂A1、A2、A3,在此试验中,除生产电池的工厂这一因子外,其它因子不变,这是一个单因素试验。,实例2.为了比较各个工作日进入某一商场的顾客人数,测得各工作日下午4时5时进入商场的顾客人数如下表,问各个工作日对顾客人数有无显著影响?,试验的目的是为了考察不同工作日顾客的人数是否有显著差异。如果有显著差异,表明工作日这一因子对顾客人数的影响是显著的.,在此实例中,,指标:,顾客人数;,因子:,工作日;,水平:,周一、周二、周一、周四、周五,在此试验中,除工作日这一因子外,其它因子不变,这是一个单因素试验。,二、单因素方差分析的数学模型,设在单因素试验中,影响指标的因子A有s个水平A1,A2,As将每个水平Aj下要考察的指标作为一个总体称为部分总体,仍记为Aj,则共有s个部分总体假设如下:,假设前提:,2)部分总体的方差都相等,即:,1)每个部分总体都服从正态分布,即:,3)不同的部分总体下的样本是相互独立的。,在水平Aj下进行nj次独立试验,得样本,对每个水平Aj下的样本引进统计量:,样本和:,样本均值:,将单因素试验的数据列表如下:,样本总均值:,单因素试验数据表,T.1T.2T.s,样本和T.j,X11X12X1sX21X22X2sXn11Xn22Xnss,样本值,A1A2As,部分总体,样本均值,总体均值,.,记称其为随机误差,则,由此得:,单因素方差分析的数学模型:,各个随机误差相互独立,和未知.,由前面的假设我们知道,(1)检验假设:,不全相等.,(2)求出未知参数和的估计量,单因素方差分析的任务:,根据样本提供的信息,,统计量或枢轴量,三、单因素方差分析的假设检验,单因素方差分析法是将样本总偏差的平方和分解成两个平方和,通过这两个平方和之间的比较,导出假设检验的统计量和拒绝域.,偏差平方和及其分解,总偏差平方和:,效应(组间)平方和:,说明:,SA反映了在每个水平下的样本均值与样本总均值的差异,它是由因子A取不同水平引起的,所以,称SA是因子A的效应(组间)平方和.,误差(组内)平方和:,平方和分解公式:,说明:,SE表示在每个水平下的样本值与该水平下的样本均值的差异,它是由随机误差引起的,所以,称SE是误差(组内)平方和.,证明:,又,所以,即:,总平方和=效应(组间)平方和+误差(组内)平方和,SA和SE的统计特征,在单因素方差分析的模型下,,(2)SA和SE相互独立。,定理:,(1),由定理(1),有,即,结合定理(1)(2)(3),有,(4),单因素方差分析的假设检验:,(1)提出统计假设,不全相等.,(2)取假设统计量,(3)拒绝域:,说明:如果组间差异比组内差异大得多,则说明各水平间有显著差异,H0不真。,ST,SA,SE的简便计算方法,记,化简得,单因素方差分析的假设检验的步骤:,(1)提出统计假设,不全相等.,(2)编制单因素试验数据表,(3)根据数据表计算,(4)填制单因素方差分析表,单因素方差分析表,n-1,ST,总和,SA/(s-1)SE/(n-s),s-1n-s,SASE,组间组内,临界值,F值,均方,自由度,平方和,方差来源,(5)检验,若,否则接受H0,认为因子A对指标没有显著影响.,则拒绝H0,,例1.在显著性水平=0.01下,用单因素方差分析法判断实例1中,三个工厂所生产的电池的平均寿命有无显著差异?,解:,提出统计假设,不全相等.,编制单因素试验数据表,184,46,498,267,83,89,单因素方差分析表,所以拒绝H0,,因为,认为三个工厂所生产的电池的平均寿命有显著差异.,四、参数j和方差2的估计,前面已说明:,又,所以,(3)对均值差的区间估计问题,若假设,不成立,有时需要对作,区间估计.,由,区间估计,又,独立于,于是,的置信度为,的置信区间为,故,注:单因子试验的统计分析可得如下三个结果:,(1)因子A是否显著.,(2)试验的误差方差2的估计.,(3)各水平均值i的点估计与其差的区间估计.(此项在因子A不显著时无需进行),例2.试验4种不同的农药,观察它们的杀虫率有无明显的不同,试验结果如下表所示:,1)在显著性水平=0.01下,问4种农药的杀虫率的均值是否有明显不同?2)分别求4种不同农药的杀虫率的均值和方差的估计值。,解:,编制单因素试验数据表,252.6,84.2,361,90.25,59.3,118.6,103.2,51.6,(1)提出统计假设,不全相等.,单因素方差分析表,所以拒绝H0,,因为,认为4种农药的杀虫率的均值是有明显不同的.,(2),例某公司想对新销售人员进行不同的销售培训,为了比较它们的有效性,随机选择了三组销售人员,每组五人。一组接受A课程销售训练,一组接受销售B课程销售训练,另一组C没有参与任何训练。当前两组的训练课程结束时,收集训练后两个星期内的各组销售人员的销售记录如下:,Excel实例操作,A课程,B课程,C,2058217634492517944,33392777302024373067,22282578122720441681,方差分析原始数据,本例中取,Excel第一中方法:自己编数据,F的P值,F-crit,第二种方法:直接调用,方差分析结果表中各项目的含义,SS平方和df自由度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论