方差分析(analysisofvariance,ANOVA).ppt_第1页
方差分析(analysisofvariance,ANOVA).ppt_第2页
方差分析(analysisofvariance,ANOVA).ppt_第3页
方差分析(analysisofvariance,ANOVA).ppt_第4页
方差分析(analysisofvariance,ANOVA).ppt_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十一章 方差分析 (analysis of variance, ANOVA) 第一节 几个基本问题,1. 单总体均值假设检验和双总体均值假设检验 2. 多总体均值假设检验-方差分析 在若干能够互相比较的资料组中,把产生变异的原因(条件因素和随机因素)加以明确区分的方法和技术。,一、相关术语 (1)试验指标: 把不同条件下所做的试验的结果, 用X表示; (2)试验因素: 影响试验结果的各种条件, 用A、B 、C表示; (3) 固定效应模型:人为确定试验条件下的试验模型; 随机效应模型:随机确定试验条件下的试验模型。(4) 试验水平或处理: 每一试验条件在所处的状态,或对试验条件所给定的值。用A1,A2,Ar和B1,B2, Bs表示; (4)单因素方差分析、两因素方差分析和多因素方差分析。,例11.1 国民计算机公司在国内三个不同地区生产打印机,为了解每个地区生产分厂的员工的质量意识,从各个生产厂中分别6名员工进行质量知识考核, 得到一组数据资料, 如下表:,试验条件(试验因素): 生产分厂,试验水平: 3,试验指标: 质量考核得分,单因素试验: 生产地点,例11.2 一企业为推销某种产品在五个不同地区建立了销售点, 统计的四个时期的销售量资料如下表:,试验因素:地区和时期,试验水平: 地区水平5个,时期水平4个,试验指标: 销售量,两因素试验: 地区和时期 45水平的方差分析,问:该企业在不同地区和不同时期的销售量情况是否存在显著的差异?,二、方差分析的假定条件 (1)各因素水平的观察值Xij是随机变量, 可分解为 Xij=j+ij , i =1,2,n, j=1,2,r 其中E(Xij)=j, n 为试验次数, r为因素水平数。 (2) ijN(0, 2),且相互独立; 在上述条件下,方差分析的数据模型为 XijN(i, 2),(1)在某一因素水平下的试验数据,由于试验条件基本相同,因而数据间的差异可看成是随机误差引起的; (2)在不同因素水平下的试验数据,由于试验条件的改变,其差异可看成是因试验条件不同而引起的; 每个因素j水平下的观察值可当作来自于因素j水平的总体的一个样本, 因此应该有一个均值j; 各因素影响是否显著问题转化为 检验1=2=r 是否成立, 其中随机误差可分成 各因素水平下的数据的误差- 组内误差(w2), (Sw2) , 不同条件影响的数据的误差- 组间误差(b2), (Sb2).,三、方差分析的基本思想,如果试验因素水平的变化对试验指标的影响不大, 则Sw2和Sb2结应该比较接近,其比值应该趋近于1,反之, 则Sb2明显大于Sw2,其比值应该大于1. 四、方差分析的一般提法 设因素有r个水平,每一个水平的均值分别用 1, 2, , r 表示,要检验 r个水平的均值是否相等,可提出如下假设: H0: 1=2=r(水平变化对指标没有显著影响) H1: 1,2,r不全相等(水平变化对指标有显著影响),10.2 单因素方差分析,分析中只涉及到一个因素, 对该因素在不同水平下的试验结果进行分析, 判断试验因素是否对试验结果产生显著的影响。 一、等重复的单因素方差分析 1. 单因素等重复试验方差分析的一般性提法 假设试验中只有一个因素A,共做了A1,A2,Ar个水平的观察,每个水平Ai满足AiN(i,2),其中i,2 均是未知量。 为检验H0: 1=2=r 是否成立, 对每个水平均做n次独立试验,共得到nr个数据。,数据结构模型为 Xij=j+ij, ij N(0,2), i=1,2,n j =1,2,r 其中ij相互独立, j、2为各总体Aj 的未知参数。,表11.3 单因素等重复试验数据结构,(2) 全体总体的样本观平均值为,2.总离差平方和的分解,(1) 设从第j个总体中随机抽取容量为n 的样本,则第j个总体的样本均值为:,全体样本的离差为,(3) 总离差平方和的分解,令,当H0成立时,有,则可构造检验统计量F :,表11.4 方差分析表,F1-,P值,F,例11.3 根据例11.1的数据检验不同生产厂员工的质量意识是否存在判别?,FF1- 或P , 拒绝原假设H0。即不同生产厂员工的质量意识存在显著判别。,解: 提出假设 H0: 1=2=3 H1: 1,2, 3 不全相等。,方差分析表,例11.4 在电解铜工艺中,电流强度、电解液配方和浓度、设备水平等, 对电解铜的纯度有很大影响。不了考察电流强度的作用效果,将其他因素固定不变, 分别在五种电流强度下各做5次试验,观察一小时内得到的电解铜的杂质率如下表:,试在显著性水平=0.05下对下列假设进行检验 H0:电流强度对电解铜的杂质率没有影响,解: H0:1=2=3=4=5 H1: 1,2,3, 4, 5不全相等。 方差分析表如下:,FF1- 或P, 拒绝原假设H0。 即在显著性水平=0.05下电流强度对电解铜的杂质率有显著影响。,2. 不等重复的单因素方差分析 假设试验中只有一个因素A,分成r个水平A1,A2, Ar 作观察, 每个水平 Ai 满足 AiN(i,2)。 为检验H0: 1=2=r 是否成立, 对每个水平各做nj 次独立试验, n1, n2,nr不完全相等, 试进行方差分析。,表11.3 单因素不等重复试验数据结构,不等重复因素方差分析表,例11.5 为了进一步激励销售人员热情, 努力提高产品的市场销售量, SOOMTH公司的销售主管部门正筹划实行销售人员新的分配方法, 拟定采用的做法是对新近招聘进来的销售人员实行佣金制, 对工作满五年的员工采用佣金 和固定薪金,而对工作八年以上的销售人员基本实行固定薪金方案。不知道这样的分配方案办法是否能达到促进销售的目的,为此考虑进行跟踪观察一段时间,然后才正式商定。从各个分配方案的人员中按随机原则确定一人,登记每个月的销售量(单位:万元),具体数据资料如下表:,试在显著性水平0.05的条件下检验假设: 不同分配方法对产品销售没有促进作用。,解: H0:1=2=3 (不同分配方法对产品销售没有促进作用) H1: 1,2,3不全相等 (不同分配方法对产品销售具有促进作用) 方差分析表如下:,FF1- 或P, 拒绝原假设H0。,11.3 两因素方差分析,一、无重复的双因素方差分析 1. 无重复两个因素方差分析简介 试验中考虑两个因素A、B, 其中A因素有r个水平A1,A2,Ar, B因素有s个水平B1,B2,Bs. 对Ai与Bj 的每一种搭配只作一次试验(即无重复),试验结果用Xij表示, 各Xij相互独立,且服从均值为ij,方差2的正态分布。 检验目标: 因素A与因素B对试验结果是否有显著的影响。,无重复两因素试验数据结构,数据结构模型为 Xij=ij+ij, ij N(0,2), i=1,2,r , j =1,2,s,2. 无重复双因素方差分析的检验假设,H0A: 因素A对试验结果影响不显著; H1A: 因素A对试验结果影响显著; H0B: 因素B对试验结果影响不显著; H1B: 因素B对试验结果影响显著;,3.总离差平方和的分解,全体样本的离差为,总离差平方和的分解,分别记,总离差平方和的分解,子总体均值: i., .j, 总体均值: , 总体方差: 2.,3. 总体参数的估计,其中,当原假设成立时,相应的检验统计量为,无重复双因素方差分析表,例10.3 有四个品牌的彩电在五个地区销售, 为了分析彩电的品牌和销售地区对销售量是否有影响, 对每个品牌在各地区的销售量取得以下数据。试分析品牌和销售地区是否对彩电的销售量有显著影响?(=0.05),解: 提出假设,H0A: 地区对销售量影响不显著; H1A: 地区对销售量影响显著; H0B: 品牌对销售量影响不显著; H1B: 品牌对销售量影响显著;,由于FAF1-(3,12), FBF1-(4,12), 因此 , 品牌对销售量有显著影响,而不能认为地区对销售量有显著影响。,二、等重复的双因素方差分析 1. 等重复两个因素方差分析简介 试验中考虑两个因素A、B, 其中A因素有r个水平A1,A2,Ar, B因素有s个水平B1,B2,Bs. 对Ai与Bj 的每一种搭配做l 次试验(即等重复),试验结果用Xijk表示, 各Xijk相互独立,且服从均值为ij,方差2的正态分布,共有 rsl 个试验数据。 检验目标: 因素A与因素B及其搭配对试验结果是否有显著的影响。,等重复两因素试验数据结构,数据结构模型为 Xijk=ij+ijk, ijk N(0,2), i=1,2,r , j =1,2,s,k=1,2,l,2. 等重复双因素方差分析的检验假设,H0A: 因素A对试验结果影响不显著; H1A: 因素A对试验结果影响显著; H0B: 因素B对试验结果影响不显著; H1B: 因素B对试验结果影响显著; H0AB: 因素A与B的搭配对试验结果影响不显著; H1AB: 因素A与B的搭配对试验结果影响显著;,3.总离差平方和的分解,全体样本的离差为,总离差平方和的分解,当H0成立时, 有,相应的检验统计量为,等重复双因素方差分析表的结构,例11.7 城市道路交通管理部门为研究不同的路段和不同的时间段对行车时间的影响, 让一名交通警察分别在两个路段和高峰与非高峰期亲自驾车进行试验, 通过试验取得共20个行车时间(单位: 分钟)的数据。试分析路段、时间以及路段和时间的交互作用对行车时间的影响(=0.05).,时间和路段的等重复双因素方差分析表,(1) FAF0.95=4.49, FBF0.95=4.49,应该拒绝H0A,H0B, 即不同时间和路段的行车时间之间有显著差异; (2) FABF0.95=4.49,应该接受H0AB, 即时间和路段的 交互作用对行车时间没有显著影响。,P294例11.7 GMAT是商学院用来考核申请攻读硕士学位学生学习能力的一种标准化考试, 录取参考分数一般在200800分之间,考分越高表明学生的学习能力越强。根据过去的经验, 参加GMAT考试的学生, 多数来自于商学院、工学院和社会技术学院。某考前辅导机构为使自己的考前辅导更有针对性, 也是为了对考生负责, 决定进行一次试验。首先从商学院、工学院和社会技术学院各抽取两名学生, 让他们参加不同授课方式的培训, 授课方式主要包括三种形式:3小时复习、1天课程强化和10周学习班。现在的问题是来自于不同背景的学生,参加不同授课方式, 对他们最终得分是否有影响。经过培训后的测试资料如下表。 试根据这组资料,在显著性水平0.05下检验假设假设: H0 :原来的学习背景和培训方式对学生的考分没有影响.,解: 两因素三水平的试验问题, 每个因素的搭配各做了两次观察, 属于等重复的方差分析问题。 提出假设: H0A:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论