方差分析与试验设计.ppt_第1页
方差分析与试验设计.ppt_第2页
方差分析与试验设计.ppt_第3页
方差分析与试验设计.ppt_第4页
方差分析与试验设计.ppt_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第10章方差分析与试验设计,10.1方差分析引论10.2单因素方差分析10.3方差分析中的多重比较10.4双因素方差分析10.5试验设计初步,10.1方差分析引论,一.方差分析及其有关术语二.方差分析的基本思想和原理三.方差分析中的基本假定四.问题的一般提法,一.方差分析及其有关术语,(1)检验多个总体均值是否相等(2)研究定性的自变量(条件)对数值型因变量(结果)的影响(3)有单因素方差分析和双因素方差分析单因素方差分析:涉及一个分类的自变量(条件)双因素方差分析:涉及两个分类的自变量(条件),例10.1,为了对几个行业的服务质量进行评价,消费者协会在四个行业分别抽取了23家不同的企业作为样本.得最近一年中消费者对企业投诉的次数如下表.,表101消费者对四个行业的投诉次数,续,(1)分析四个行业之间的服务质量是否有显著差异,也就是要判断不同“行业”的“投诉次数”是否有显著差异.可归结为检验这四个行业被投诉次数的均值是否相等.(2)如果它们的均值相等,就意味着它们之间的服务质量没有显著差异;如果均值不全相等,则表示它们之间的服务质量有显著差异.,几个基本概念,1.对投诉次数是否有影响的那些(可以控制的)条件称为因素.2.为了考察一个因素的影响,一般把他严格控制在几个不同的状态或等级上,把因素的每一个状态或等级称为一个水平.3.只考察一个因素的方差分析,称为单因素方差分析.4.同时考察两个或两个以上因素的方差分析,称为多因素方差分析.5.假定各水平的数据是来自正态分布总体的随机样本,各水平的样本互相独立,且方差相等.,二.方差分析的基本思想和原理两类误差及两类方差,(1)每个水平为一个总体(2)每个水平的一组观察值为总体的一个随机样本,同一水平下样本观察值之间的差异称为随机误差,用组内方差来表示.(3)不同水平下样本观察值之间的差异可能是由于不同水平引起的,这种误差称为系统误差,但也包含随机误差.不同水平样本观察值之间差异用组间方差来表示,即组间方差包括随机误差,也包括系统误差.,2.方差的比较,(1)如果不同水平对试验结果没有不同影响,那么组间方差中只包括随机误差.这时,组间方差与组内方差应该相近,组间方差与组内方差之比接近1.(2)如果不同水平对试验结果有不同影响,那么组间方差除了随机误差之外还包括系统误差.这时,组间方差就会大于组内方差,组间方差与组内方差之比就会大于1.(3)方差分析就是通过这种方差的比较,作出判断.,三.方差分析中的基本假定,(1)每个总体都应服从正态分布对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本.(2)各个总体的方差必须相同各组观察数据是从具有相同方差的总体中抽取的(3)样本是独立的即每个行业的样本是独立抽取的,四.问题的一般提法,(1)要检验k个水平(总体)的均值是否相等,需要提出如下假设:,不全相等,对例10.1,设为零售业被投诉次数的均值,为旅游业被投诉次数的均值,为航空公司被投诉次数的均值,为家电制造业被投诉次数的均值,则提出的假设为,不全相等,10.2单因素方差分析(one-wayanalysisofvariance),一.数据结构二.分析步骤三.关系强度的测量四.用Excel进行方差分析,一.数据结构,表10-2单因素方差分析的数据结构,二.分析步骤(一)提出假设,(二)构造检验的统计量,消费者对四个行业的投诉次数及均值,表103,3.计算误差平方和(1)总误差平方和(sumofsquaresfortotal),用SST表示总误差平均和,反映全部数据的离散情况,即,(2)水平项误差平方和(sumofsquaresforfactorA),(3)误差项平方和(sumofsquaresforerror),续,三个平方和的关系,续(三个平方和的关系),4.计算统计量,(1)各个误差平方和的大小与数据的多少有关,各个误差平方和的平均称为平均平方,也称均方或方差,用MS表示.(2)平均平方是离差平方和除以相应的自由度(3)三个平方和的自由度分别为SST的自由度为n1SSA的自由度为kSSE的自由度为,续(计算统计量),续(计算统计量),对于例10.1,求得,(三)统计决策,续(统计决策),图10-4统计量F的抽样分布,F(k-1,n-k),0,F,(四)方差分析表(analysisofvariancetable),前面这些计算结果可以列成表格的形式,称为方差分析表.,表104方差分析表,例10.1的方差分析表,表105,三.关系强度的测量,拒绝原假设则表明因素(自变量)与观测值之间有关系,而组间平方和(SSA)则度量了自变量(行业)对因变量(投诉次数)的影响大小.因此变量间关系的强度用用自变量平方和(SSA)总平方和(SST)的比例大小来反映,其平方根R就可以用来测量两个变量之间的关系强度.,(10.10),对于例10.1,得,四.用Excel进行单因素方差分析,第1步:选择【工具】下拉菜单第2步:选择【数据分析】选项第3步:在数据分析工具中选择【单因素方差分析】,然后选择【确定】第4步:当对话框出现时在【输入区域】方框内键入数据单元格区域在【】方框内键入0.05(也可根据需要确定)在【输出区域】中选择输出位置,表10-6,用Excel进行方差分析的步骤,表10-7,Excel输出的方差分析结果,10.3方差分析中的多重比较(multiplecomparisonprocedures),当方差分析拒绝,从而接受时,认为各水平均值不全相等.多重比较是通过对各均值之间的配对比较来进一步检验到底那些均值之间有显著差异.多重比较的方法有多种,这里介绍最小显著差异法.,最小显著差异法(LSD),多重比较的步骤,LSD方法,例10.1的LSD方法,例10.1的多重比较表(LSD法),表中差值右上角标者表示相应的,10.4双因素方差分析一、双因素方差分析及其类型,(1)同时分析两个因素(因素A和因素B)对试验结果的影响.(2)分别对两个因素进行检验,考察各自的作用.(3)如果因素A和因素B对试验结果的影响是相互独立的,则可以分别考察各自的影响,这种双因素方差分析称为无交互作用的双因素方差分析.(4)如果因素A和因素B除了各自对试验结果的影响外,还产生额外的新影响,这种额外的影响称为交互作用,这时的双因素方差分析则称为有交互作用的双因素方差分析.(5)无交互作用的双因素方差分析,相当于对每个因素分别进行单因素方差分析.,2019/12/12,41,可编辑,例10.3,表10-8不同品牌的彩电在各地区的销售量数据,有四个品牌的彩电在五个地区销售,为分析彩电的品牌(品牌因素)和销售地区(地区因素)对销售量是否有影响,对每个品牌在各地区的销售量取得以下数据.试分析品牌和销售地区对彩电的销售量是否有显著影响?(=0.05),二、无交互作用的双因素方差分析(一)数据结构,双因素方差分析的基本假定(1)每个水平组合的观察值,是来自正态总体的简单随机样本.(2)各正态总体的方差都相等.(3)各随机样本相互独立.,表109,双因素方差分析数据结构,各水平样本均值与样本总均值,(二)分析步骤1.提出假设,2.构造检验统计量(1)计算误差平方和,总误差平方和反映全部数据的离散情况,(10.15),续(计算误差平方和),续(计算均方),续(计算均方),构造检验统计量,3.统计决策,方差分析表,表1010双因素方差分析表,例10.4,有四个品牌的彩电在五个地区销售,为分析彩电的品牌(品牌因素)和销售地区(地区因素)对销售量是否有影响,对每个品牌在各地区的销售量取得以下数据。试分析品牌和销售地区对彩电的销售量是否有显著影响?(=0.05),用Excel进行双因素方差分析,第1步:选择【工具】下拉菜单第2步:选择【数据分析】选项第3步:在数据分析工具中选择【无重复双因素方差分析】,然后选择【确定】第4步:当对话框出现时在【输入区域】方框内键入数据单元格区域在【】方框内键入0.05(也可根据需要确定)在【输出选项】中选择输出区域,用Excel进行双因素方差分析的步骤,表10-11,Excel输出的方差分析结果,统计决策,(三)关系强度的测量,把A(行)因素的平方和SSR和B(列)因素的平方和SSC加在一起,与总平方和的比值定义为R2,即,(10-25),对于例10.4,得,三、有交互作用的双因素方差分析,例10.5城市道路交通管理部门为研究不同的路段和不同的时间段对行车时间的影响,让一名交通警察分别在两个路段和高峰期与非高峰期亲自驾车进行试验,通过试验取得共获得20个行车时间(分钟)的数据如下.试分析路段、时段以及路段和时段的交互作用对行车时间的影响.,表10-14不同时段和不同路段的行车时间单位:分钟,各水平样本均值与样本总均值,续,计算误差平方和,续,SSRC代表交互作用平方和,表1015,有交互作用的双因素方差分析表,用Excel进行有交互作用的双因素方差分析,第1步:选择【工具】下拉菜单第2步:选择【数据分析】选项第3步:在数据分析工具中选择【可重复双因素方差分析】,然后选择【确定】第4步:当对话框出现时在【输入区域】方框内键入数据单元格区域在【】方框内键入0.05(也可根据需要确定)在【每一样本的行数】方框内键入5在【输出区域】中选择输出位置,表10-16,用Excel进行双因素方差分析的步骤,表10-17,Excel输出的方差分析结果,10.5试验设计初步,一、完全随机化设计二、随机化区组设计三、因子设计,一、完全随机化设计(completelyrandomizeddesign),完全随机化设计是指因素的水平或水平组合采用随机方法安排到试验单元的一种试验设计.“处理”是指因素的各个水平或水平组合“试验单元(experimentunit)”是安排“处理”的对象或材料对单因素或双因素的完全随机化设计可采用单因素或双因素方差分析.,例10.6,一家种子开发股份公司研究出三个新的小麦品种:品种1、品种2和品种3.为研究不同品种对产量的影响,需要选择一些地块,在每个地块种上不同的品种,然后获得产量数据进行分析.这里的“小麦品种”就是试验因子或因素,而品种1、品种2、品种3就是因子的三个不同水平,称为处理.假定选取3个面积相同的地块,这里的“地块”就是试验单元.将每个品种随机地指派给其中的一个地块,这就是随机化设计.试验数据表10-18.,表10-18,完全随机化设计的数据,表10-19,例10.6的方差分析表,二、随机化区组设计(randomizedblockdesign),先将试验单元划分为若干个同质组,称为“区组”(Block).再将各种处理随机地指派给各个试验单元.比如在上面的例子中,首先根据土壤的好坏分成若干个区组.假定分成四个区组:区组1、区组2、区组3和区组4,每个区组中有三个试验单元.在每个区组内的三个试验单元以随机方法决定小麦品种.单因素随机化区组设计采用无重复双因素方差分析.,表10-20,随机化区组设计的数据,表10-21,随机化区组设计的方差分析表,三、因子

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论