版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、华南理工大学精品课程华南理工大学精品课程第六章第六章 方差分析与试验设计方差分析与试验设计引例引例: 饮料行业作为改革开放以来发展起来的饮料行业作为改革开放以来发展起来的新兴行业,是中国消费品中的发展热点和新新兴行业,是中国消费品中的发展热点和新增长点。饮料行业不断地发展和成熟,逐渐增长点。饮料行业不断地发展和成熟,逐渐改变了以往规模小、产品结构单一、竞争无改变了以往规模小、产品结构单一、竞争无序的局面,饮料企业的规模和集约化程度不序的局面,饮料企业的规模和集约化程度不断提高,产品结构日趋合理。就目前中国饮断提高,产品结构日趋合理。就目前中国饮料在品牌方面的发展而言,全国性品牌已有料在品牌方面
2、的发展而言,全国性品牌已有十几家,加多宝、鲜橙多、汇源、娃哈哈等十几家,加多宝、鲜橙多、汇源、娃哈哈等已为人们所熟知。已为人们所熟知。 假若某饮料公司研制出一种新型饮料,该饮料有无色透明、青绿色、茶色、淡黄色和粉色五种颜色,除颜色外,其它包装、产品广告、价格、味道、营养含量等因素全部相同。该公司为了了解这种不同颜色饮料的销售量状况,以便合理制订产品优势策略,针对性对有颜色差异的饮料进行市场推广。现从经营规模相仿的六家超市同时收集该种饮料在一个月内的销售情况。试分析这五种不同颜色饮料的销售量是否有显著差异。华南理工大学精品课程华南理工大学精品课程2 2华南理工大学精品课程华南理工大学精品课程3
3、3提出问题提出问题饮料的销售量会受到颜色的影响吗?饮料的销售量会受到颜色的影响吗?q1q2q3如何比较不同颜色饮料对销量的影响?如何比较不同颜色饮料对销量的影响?q4方差分析与试验设计有联系吗?方差分析与试验设计有联系吗?q5不同的销售区域对销量有影响吗?不同的销售区域对销量有影响吗?饮料颜色与销售区域会产生交互作用?饮料颜色与销售区域会产生交互作用?华南理工大学精品课程华南理工大学精品课程4 4学习目标学习目标p掌握方差分析的概念和基本思想掌握方差分析的概念和基本思想p掌握单因素方差分析的方法及应用掌握单因素方差分析的方法及应用p理解多重比较的意义理解多重比较的意义p掌握双因素方差分析的方法
4、及应用掌握双因素方差分析的方法及应用p了解试验设计的基本原则和常用方法了解试验设计的基本原则和常用方法华南理工大学精品课程华南理工大学精品课程5 5学习内容学习内容p方差分析的基本问题方差分析的基本问题p单因素方差分析单因素方差分析p单因素方差分析中的多重比较单因素方差分析中的多重比较p双因素方差分析双因素方差分析p试验设计试验设计华南理工大学精品课程华南理工大学精品课程6 6第一节第一节 方差分析引论方差分析引论6.16.26.36.4具体章节结构具体章节结构第二节第二节 单因素方差分析单因素方差分析第三节第三节 双因素方差分析双因素方差分析第四节第四节 试验设计试验设计华南理工大学精品课程
5、华南理工大学精品课程7 7第一节第一节 方差分析引论方差分析引论一、方差分析问题的提出一、方差分析问题的提出二、方差分析的基本概念二、方差分析的基本概念三、方差分析的基本假定三、方差分析的基本假定四、方差分析前提假定检验及破坏四、方差分析前提假定检验及破坏 五、方差分析的基本思想和原理五、方差分析的基本思想和原理六、问题的一般提法六、问题的一般提法华南理工大学精品课程华南理工大学精品课程8 8一、方差分析问题的提出一、方差分析问题的提出超市超市1 12 23 34 45 56 6无色透明无色透明313130303434323229293232青绿色青绿色32322929313130303131
6、2828茶色茶色252523232626272724242525淡黄色淡黄色252526262626282827272626粉色粉色282829292727282829293030【例【例6-16-1】 针对引例中要求针对引例中要求分析五种不同颜色饮料的销售量是否有显著差异,现从地理位置、经营规模相仿的六家从地理位置、经营规模相仿的六家超市同时收集的该饮料一个月内的销售情况如下表:超市同时收集的该饮料一个月内的销售情况如下表: 表表6-1 6-1 五种不同颜色饮料的销售量五种不同颜色饮料的销售量华南理工大学精品课程华南理工大学精品课程9 9一、方差分析问题的提出一、方差分析问题的提出 分析五种
7、不同颜色饮料的销售量是否有显著分析五种不同颜色饮料的销售量是否有显著差异,即要判断差异,即要判断“颜色颜色”对对“销售量销售量”是否是否有显著影响。有显著影响。 作出这种判断最终被归结为检验这五个颜色作出这种判断最终被归结为检验这五个颜色饮料的销售量的均值是否相等。饮料的销售量的均值是否相等。 若它们的均值全都相等,则意味着若它们的均值全都相等,则意味着“饮料颜饮料颜色色”对饮料的销售数量是没有影响的;若它对饮料的销售数量是没有影响的;若它们的均值不全相等,则意味着们的均值不全相等,则意味着“饮料颜色饮料颜色”对其销售数量是有影响的。对其销售数量是有影响的。华南理工大学精品课程华南理工大学精品
8、课程1010二、方差分析的基本概念二、方差分析的基本概念简称简称 anova (analysis of vaanova (analysis of variance)riance),该统计分析方法能一次性地检,该统计分析方法能一次性地检验多个总体均值是否存在显著差异。验多个总体均值是否存在显著差异。 012: rh112: ,rh 不全相等华南理工大学精品课程华南理工大学精品课程1111二、方差分析的基本概念二、方差分析的基本概念不同条件下所作的试验结果。如,要检验不同条件下所作的试验结果。如,要检验五种不同颜色饮料的销售量是否有显著差异,饮料的五种不同颜色饮料的销售量是否有显著差异,饮料的销售
9、量是在不同颜色下的试验结果,称为试验指标。销售量是在不同颜色下的试验结果,称为试验指标。试验中需要考察的、可以控制试验中需要考察的、可以控制的条件。如,饮料的颜色是所要考察的对象,称为因的条件。如,饮料的颜色是所要考察的对象,称为因素或因子。素或因子。因素所处的不同状态。如,无因素所处的不同状态。如,无色透明、青绿色、茶色、淡黄色和粉色是饮料颜色这色透明、青绿色、茶色、淡黄色和粉色是饮料颜色这一因子不同状态的具体表现,称为因子的水平。一因子不同状态的具体表现,称为因子的水平。华南理工大学精品课程华南理工大学精品课程1212二、方差分析的基本概念二、方差分析的基本概念每个因子水平下得到的样本数据
10、。如,在超每个因子水平下得到的样本数据。如,在超市中收集的每种颜色对应的饮料销售量的样本数据称市中收集的每种颜色对应的饮料销售量的样本数据称为观测值。为观测值。如,研究饮料的颜色对销售量是否如,研究饮料的颜色对销售量是否有影响,即饮料的颜色是自变量,它是一个分类型的有影响,即饮料的颜色是自变量,它是一个分类型的变量;销售量就是因变量,是一个数值型变量;不同变量;销售量就是因变量,是一个数值型变量;不同颜色饮料的销售量就是因变量的取值。颜色饮料的销售量就是因变量的取值。华南理工大学精品课程华南理工大学精品课程1313三、方差分析的基本假定三、方差分析的基本假定 对于因素的每一个水平,其观察值是来
11、自服从正对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本,如,饮料的每种颜态分布总体的简单随机样本,如,饮料的每种颜色的销售量必须服从正态分布。色的销售量必须服从正态分布。 各组观察数据是从具有相同方差的总体中抽取的,各组观察数据是从具有相同方差的总体中抽取的,如,五种不同颜色饮料的销售量的方差都相等。如,五种不同颜色饮料的销售量的方差都相等。 如,每种颜色饮料的销量与其它颜色的销量无关。如,每种颜色饮料的销量与其它颜色的销量无关。华南理工大学精品课程华南理工大学精品课程1414三、方差分析的基本假定三、方差分析的基本假定 在上述假定条件下,判断饮料颜色对销售量在上述假定条件
12、下,判断饮料颜色对销售量是否有显著影响,实际上也就是检验具有同是否有显著影响,实际上也就是检验具有同方差的五个正态总体的均值是否相等。方差的五个正态总体的均值是否相等。 如果五个总体的均值相等,可以期望五个样如果五个总体的均值相等,可以期望五个样本的均值也会很接近。即是五个样本的均值本的均值也会很接近。即是五个样本的均值越接近,推断五个总体均值相等的证据也就越接近,推断五个总体均值相等的证据也就越充分,样本均值越不同,推断总体均值不越充分,样本均值越不同,推断总体均值不同的证据就越充分。同的证据就越充分。华南理工大学精品课程华南理工大学精品课程1515三、方差分析的基本假定三、方差分析的基本假
13、定如果假设如果假设 成立:成立: 五种不同颜色饮料的销售量总体的均值都相等。五种不同颜色饮料的销售量总体的均值都相等。 意味着每个样本都来自均值为意味着每个样本都来自均值为 、方差为、方差为 的的同一个正态总体。同一个正态总体。0125:h2华南理工大学精品课程华南理工大学精品课程1616三、方差分析的基本假定三、方差分析的基本假定如果假设如果假设 不成立:不成立: 说明五个样本总体中至少有两个的均值是不同的。说明五个样本总体中至少有两个的均值是不同的。 假设只有样本假设只有样本3 3与其它样本是来自不同的总体,即与其它样本是来自不同的总体,即有有 但但 。0125:h131245华南理工大学
14、精品课程华南理工大学精品课程1717四、方差分析前提假定检验及破坏四、方差分析前提假定检验及破坏 随机样本是来自无限容量的总体或有放回的有限随机样本是来自无限容量的总体或有放回的有限容量的总体,观测值的独立性假定都能得到满足。容量的总体,观测值的独立性假定都能得到满足。 用粗略的样本数据分布图来判断。用粗略的样本数据分布图来判断。 cochrancochran检验、最大检验、最大f f比检验、比检验、bartlettbartlett检验等。检验等。华南理工大学精品课程华南理工大学精品课程1818四、方差分析前提假定检验及破坏四、方差分析前提假定检验及破坏 方差齐性假定检验方差齐性假定检验-ba
15、rtlett-bartlett检验检验(1 1)提出假设)提出假设 样本总体的方差是相同的样本总体的方差是相同的 不全相等不全相等 至少有两个样本总体的方差不同至少有两个样本总体的方差不同(2 2)计算方差,构造统计量)计算方差,构造统计量 222012:rh222112:,rh2211()1iniijijisxxn2211(1)()riiriiinssnnn r华南理工大学精品课程华南理工大学精品课程1919四、方差分析前提假定检验及破坏四、方差分析前提假定检验及破坏 方差齐性假定检验方差齐性假定检验-bartlett-bartlett检验检验检验统计量检验统计量b b的观测值的观测值b b
16、为:为:其中其中 : 原假设原假设 成立,满足成立,满足 。判断。判断方差是否相同的决策规则为:当方差是否相同的决策规则为:当 时,则拒时,则拒绝原假设绝原假设 ,认为至少有两个处理组数据的方差是,认为至少有两个处理组数据的方差是不相等的;否则,认为数据满足分析中方差齐性的不相等的;否则,认为数据满足分析中方差齐性的要求。要求。 2.3026qbl221()log(1)logriiiqnrsns11111()3(1)1riilrnnr 222012:rh2(1)br2(1)br0h华南理工大学精品课程华南理工大学精品课程2020五、方差分析的基本思想和原理五、方差分析的基本思想和原理 样本数据
17、波动有二个来源,一个是同一因素中的样本数据波动有二个来源,一个是同一因素中的不同水平造成的,另一个是由于抽选样本的随机不同水平造成的,另一个是由于抽选样本的随机性而产生的波动。两个方面产生的波动可以用两性而产生的波动。两个方面产生的波动可以用两个方差来计量,一个称为水平之间的方差,即个方差来计量,一个称为水平之间的方差,即;另一个称为水平内部的方差,即;另一个称为水平内部的方差,即。前者包括系统性因素,也包括随机性因素,。前者包括系统性因素,也包括随机性因素,后者仅包括随机性因素。后者仅包括随机性因素。总变异总变异组间变异组间变异组内组内变异变异华南理工大学精品课程华南理工大学精品课程2121
18、五、方差分析的基本思想和原理五、方差分析的基本思想和原理 组间方差反映出不同的因子对样本波动的影响;组组间方差反映出不同的因子对样本波动的影响;组内方差则是不考虑组间方差的纯随机影响。如果不内方差则是不考虑组间方差的纯随机影响。如果不同水平对结果没有影响,则组间方差中仅仅有随机同水平对结果没有影响,则组间方差中仅仅有随机因素的差异,而没有系统性的差异,它与水平内部因素的差异,而没有系统性的差异,它与水平内部的组内方差就应该近似,两个方差比值接近于的组内方差就应该近似,两个方差比值接近于1 1。 反之,两个方差的比值就会显著地大于反之,两个方差的比值就会显著地大于1 1,当这个,当这个比值大到某
19、个程度,或者说达到某临界点,就可以比值大到某个程度,或者说达到某临界点,就可以判断出不同水平之间存在着显著性差异。判断出不同水平之间存在着显著性差异。 小概率原理仍然是方差分析的指导思想。小概率原理仍然是方差分析的指导思想。华南理工大学精品课程华南理工大学精品课程2222五、方差分析的基本思想和原理五、方差分析的基本思想和原理 因素或因素间因素或因素间“交互作用交互作用”对观测结果的影响是否对观测结果的影响是否显著,关键要看组间方差与组内方差的比较结果。显著,关键要看组间方差与组内方差的比较结果。当然,产生方差的独立变量的个数对方差大小也有当然,产生方差的独立变量的个数对方差大小也有影响,独立
20、变量个数越多,方差就有可能越大;独影响,独立变量个数越多,方差就有可能越大;独立变量个数越少,方差就有可能越小。立变量个数越少,方差就有可能越小。 为了消除独立变量个数对方差大小的影响,用方差为了消除独立变量个数对方差大小的影响,用方差除以独立变量个数,得到除以独立变量个数,得到(mean squaremean square),),作为不同来源方差比较的基础。引起方差的独立变作为不同来源方差比较的基础。引起方差的独立变量的个数,称为量的个数,称为。华南理工大学精品课程华南理工大学精品课程2323五、方差分析的基本思想和原理五、方差分析的基本思想和原理检验因子影响是否显著通常用如下检验因子影响是
21、否显著通常用如下: f f统计量越大,越说明组间方差是主要方差来源,统计量越大,越说明组间方差是主要方差来源,因子的影响越显著。因子的影响越显著。 f f统计量越小,越说明随机方差是主要的方差来源,统计量越小,越说明随机方差是主要的方差来源,因子的影响越不显著。因子的影响越不显著。组内均方差组间均方差f华南理工大学精品课程华南理工大学精品课程2424六、问题的一般提法六、问题的一般提法 因素有因素有r r个水平,每个水平的均值分别用个水平,每个水平的均值分别用 表示表示 要检验要检验r r个水平个水平( (总体总体) )的均值是否相等,需要提出如的均值是否相等,需要提出如下假设:下假设: h
22、h0 0: h h1 1: 不全相等不全相等1, r12r12, , , r华南理工大学精品课程华南理工大学精品课程2525第二节第二节 单因素方差分析单因素方差分析一、数据结构一、数据结构二、分析步骤二、分析步骤三、应用实例分析三、应用实例分析四、关系强度的测量四、关系强度的测量五、用五、用excelexcel进行方差分析进行方差分析六、方差分析中的多重比较六、方差分析中的多重比较华南理工大学精品课程华南理工大学精品课程2626一、数据结构一、数据结构1(1,2, )inijjiixxirn1111()inrrijiirijiiixn xxnnnn其中:其中:表表6- 2 6- 2 单因素方
23、差分析试验数据的数据结构单因素方差分析试验数据的数据结构华南理工大学精品课程华南理工大学精品课程2727二、分析步骤二、分析步骤 h h0 0 : 1 1 2 2 r r 自变量对因变量没有显著影响自变量对因变量没有显著影响 h h1 1 : 1 1 , , 2 2 , ,, r r 不全相等不全相等 自变量对因变量有显著影响自变量对因变量有显著影响华南理工大学精品课程华南理工大学精品课程2828二、分析步骤二、分析步骤 总离差平方和总离差平方和sst反映了离差平方和的总体情况反映了离差平方和的总体情况 误差项离差平方和误差项离差平方和ssesse反映的是水平内部,或组内反映的是水平内部,或组
24、内观察值的离散状况观察值的离散状况1 1)计算误差平方和)计算误差平方和211()inrijijsstxx211()inrijiijssexx华南理工大学精品课程华南理工大学精品课程2929二、分析步骤二、分析步骤 水平项离差平方和水平项离差平方和ssassa反映的是组间差异反映的是组间差异 总离差平方和总离差平方和 sst=sse+ssa 21()riiissan xx华南理工大学精品课程华南理工大学精品课程3030二、分析步骤二、分析步骤sst是由所有观测值的波动引起的误差,但是,这里所有的是由所有观测值的波动引起的误差,但是,这里所有的n个变量并不独立,它们满足一个约束条件,真正独立的个
25、变量并不独立,它们满足一个约束条件,真正独立的变量只有变量只有n-1个,自由度是个,自由度是n-1。ssa是因子在不同水平上的均值变化而产生的误差。但是,是因子在不同水平上的均值变化而产生的误差。但是,r个均值并不是独立的,它们满足一个约束条件,因此也个均值并不是独立的,它们满足一个约束条件,因此也丢失一个自由度,它的自由度是丢失一个自由度,它的自由度是r-1。sse是由所有的各因素观测值围绕对应水平均值波动产生的是由所有的各因素观测值围绕对应水平均值波动产生的误差,它们满足的约束条件一共误差,它们满足的约束条件一共r个,失去了个,失去了r个自由度,个自由度,所以所以sse的自由度是的自由度是
26、n-r。sst、ssa和和sse的自由度满足如下关系:的自由度满足如下关系:n-1=(r-1)+(n-r) 2 2)自由度的确定)自由度的确定华南理工大学精品课程华南理工大学精品课程3131二、分析步骤二、分析步骤检验统计量是检验统计量是: : f f值越大,越说明总的方差波动中,组间方差是主要值越大,越说明总的方差波动中,组间方差是主要部分,有利于拒绝原假设接受备选假设。部分,有利于拒绝原假设接受备选假设。 f f值越小,越说明随机方差是主要的方差来源,有利值越小,越说明随机方差是主要的方差来源,有利于接受原假设,没有充分证据说明待检验的因素对总于接受原假设,没有充分证据说明待检验的因素对总
27、体波动有显著影响。体波动有显著影响。(1,)msaff rnrmse其中:其中:, 1ssassemsamsernr华南理工大学精品课程华南理工大学精品课程3232二、分析步骤二、分析步骤检验的拒绝域安排在右侧:检验的拒绝域安排在右侧:图图6- 3 6- 3 统计量统计量f f的抽样分布的抽样分布华南理工大学精品课程华南理工大学精品课程3333二、分析步骤二、分析步骤将统计量的值将统计量的值f与给定的显著性水平与给定的显著性水平 的临界值的临界值f 进行比较,作出对原假设进行比较,作出对原假设h0的决策:根据给定的显著的决策:根据给定的显著性水平性水平 ,在,在f分布表中查找与第一自由度分布表
28、中查找与第一自由度df1r-1、第二自由度第二自由度df2=n-r 相应的临界值相应的临界值 f 。若若ff ,则拒绝原假设,则拒绝原假设h0,表明均值之间的差,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响。异是显著的,所检验的因素对观察值有显著影响。若若f0h华南理工大学精品课程华南理工大学精品课程3838三、应用实例三、应用实例表表6- 4 6- 4 单因素应用实例方差分析表单因素应用实例方差分析表 为清楚看出例为清楚看出例6-16-1方差分析的计算过程和结果,可以方差分析的计算过程和结果,可以列成下方差分析表列成下方差分析表6- 46- 4。华南理工大学精品课程华南理工大学
29、精品课程3939四、关系强度的测量四、关系强度的测量 拒绝原假设表明因素拒绝原假设表明因素(自变量自变量)与观测值之间有关系。与观测值之间有关系。 组间平方和组间平方和(ssa)度量了自变量度量了自变量(饮料颜色饮料颜色)对因变量对因变量(销售量销售量)的影响效应:的影响效应: 只要组间平方和只要组间平方和ssassa不等于不等于0 0,就表明两个变量之,就表明两个变量之间有关系间有关系 ( (只是是否显著的问题只是是否显著的问题) )。 当组间平方和当组间平方和ssassa比组内平方和比组内平方和ssesse大,且大到一大,且大到一定程度时,就意味着两个变量之间的关系显著,大定程度时,就意味
30、着两个变量之间的关系显著,大得越多,表明它们之间的关系就越强。反之,小得得越多,表明它们之间的关系就越强。反之,小得越多,表明它们之间的关系就越弱。越多,表明它们之间的关系就越弱。华南理工大学精品课程华南理工大学精品课程4040四、关系强度的测量四、关系强度的测量变量间关系的强度用自变量平方和变量间关系的强度用自变量平方和ssassa及残差平及残差平方和方和sse sse 占总平方和占总平方和sst sst 的比例大小来反映。的比例大小来反映。自变量平方和占总平方和的比例记为自变量平方和占总平方和的比例记为r 2 2, ,即即其平方根其平方根r就可以用来测量两个变量之间的关系就可以用来测量两个
31、变量之间的关系强度强度 。2ssarsst=华南理工大学精品课程华南理工大学精品课程4141四、关系强度的测量四、关系强度的测量 饮料的颜色饮料的颜色( (自变量自变量) )对其销售量对其销售量( (因变量因变量) )的影响的影响效应占总效应的效应占总效应的77.82%77.82%,而残差效应则占,而残差效应则占22.18%22.18%。即。即饮料颜色对销量差异解释的比例达到饮料颜色对销量差异解释的比例达到77%77%以上,而其以上,而其它因素它因素( (残差变量残差变量) )所解释的比例接近为所解释的比例接近为23%23% 。 r =0.8821=0.8821例题例题6-16-1分析:计算可
32、得分析:计算可得2164.866777.82%211.8667ssarsst88.21%r 华南理工大学精品课程华南理工大学精品课程4242五、用五、用excelexcel进行方差分析进行方差分析第第1 1步步: :选择选择“工具栏工具栏”中中“数据数据”项的项的“数据分析数据分析”选项;选项;第第2 2步步: :在分析工具中选择在分析工具中选择“单因素方差分析单因素方差分析”,然后选择,然后选择 “确定确定”;第第3 3步步: :当对话框出现时当对话框出现时 在在“输入区域输入区域”方框内键入数据的单元格区域方框内键入数据的单元格区域( (本例本例 是是 b1:f7)b1:f7); 在在“分
33、组方式分组方式”选择选择“列列”(如果水平为行变量,则选(如果水平为行变量,则选 择择“行行”),勾选),勾选“标志于第一行标志于第一行”; 在在“ 方框方框”内键入内键入0.050.05(可根据需要确定);(可根据需要确定); 在在“输出选项输出选项”中选择输出区域,如图中选择输出区域,如图6-46-4示。示。华南理工大学精品课程华南理工大学精品课程4343图图6- 4 excel6- 4 excel进行单因素方差分析的步骤进行单因素方差分析的步骤五、用五、用excelexcel进行方差分析进行方差分析华南理工大学精品课程华南理工大学精品课程4444表表6- 5 单因素方差分析单因素方差分析
34、excel输出结果输出结果五、用五、用excelexcel进行方差分析进行方差分析0.0521.9238(4,25)2.76ff7.18080.05pvaluee决策判断:决策判断:拒绝原假设拒绝原假设0h华南理工大学精品课程华南理工大学精品课程4545六、六、 方差分析中的多重比较方差分析中的多重比较 通过方差分析方法可以判断各总体均值是否相通过方差分析方法可以判断各总体均值是否相等。如果不相等,那么如何进一步检验到底是等。如果不相等,那么如何进一步检验到底是哪些均值之间存在差异?哪些均值之间存在差异? 多重比较方法通过对总体均值之间的配对比较多重比较方法通过对总体均值之间的配对比较来进一步
35、检验到底是哪些均值之间存在差异。来进一步检验到底是哪些均值之间存在差异。多重比较分析方法有很多种,如多重比较分析方法有很多种,如tukeytukey检验、检验、bonbonferroni tferroni t检验、检验、sidaksidak检验法等,这里介绍最检验法等,这里介绍最常用的常用的lsdlsd检验法和检验法和lsrlsr检验法。检验法。 华南理工大学精品课程华南理工大学精品课程4646六、六、 方差分析中的多重比较方差分析中的多重比较1 1最小显著差异法(最小显著差异法( least significant differenceleast significant difference
36、) ( r.a.fisherr.a.fisher提出,简称提出,简称lsd lsd ) lsdlsd方法是对检验两个总体均值是否相等的方法是对检验两个总体均值是否相等的t t检检验方法的总体方差估计加以修正验方法的总体方差估计加以修正( (用用msemse来代替来代替) )而得到的。而得到的。华南理工大学精品课程华南理工大学精品课程4747六、六、 方差分析中的多重比较方差分析中的多重比较lsdlsd方法的步骤:方法的步骤:华南理工大学精品课程华南理工大学精品课程4848六、六、 方差分析中的多重比较方差分析中的多重比较lsdlsd方法的实例分析:方法的实例分析:华南理工大学精品课程华南理工大
37、学精品课程4949六、六、 方差分析中的多重比较方差分析中的多重比较华南理工大学精品课程华南理工大学精品课程5050六、六、 方差分析中的多重比较方差分析中的多重比较华南理工大学精品课程华南理工大学精品课程5151六、六、 方差分析中的多重比较方差分析中的多重比较华南理工大学精品课程华南理工大学精品课程5252六、六、 方差分析中的多重比较方差分析中的多重比较2 2最小显著极差值(最小显著极差值( least significant range least significant range ) ( duncanduncan提出,简称提出,简称lsr lsr ) duncanduncan多重极
38、差检验法是不同平均数间用不同的多重极差检验法是不同平均数间用不同的显著差数标准进行比较的方法,依据极差范围内显著差数标准进行比较的方法,依据极差范围内所包含的处理数据(也称为秩次距)所包含的处理数据(也称为秩次距)k k的不同而的不同而采用不同的检验尺度。采用不同的检验尺度。华南理工大学精品课程华南理工大学精品课程5353六、六、 方差分析中的多重比较方差分析中的多重比较lsrlsr方法的步骤:方法的步骤:华南理工大学精品课程华南理工大学精品课程5454第三节第三节 双因素方差分析双因素方差分析一、双因素方差分析及其类型一、双因素方差分析及其类型二、无交互作用的双因素方差分析二、无交互作用的双
39、因素方差分析三、有交互作用的双因素方差分析三、有交互作用的双因素方差分析华南理工大学精品课程华南理工大学精品课程5555一、双因素方差分析及其类型一、双因素方差分析及其类型 单因素方差分析只考虑一个分类型自变量对数值型单因素方差分析只考虑一个分类型自变量对数值型因变量的影响。在对实际问题的研究中,有时需要考因变量的影响。在对实际问题的研究中,有时需要考虑几个因素对实验结果的影响。例如,分析影响某种虑几个因素对实验结果的影响。例如,分析影响某种产品销售量的因素时,需要考虑品牌、销售地区、价产品销售量的因素时,需要考虑品牌、销售地区、价格、质量和广告策略等多个因素的影响。格、质量和广告策略等多个因
40、素的影响。 当方差分析中涉及两个分类型自变量时,称为双因当方差分析中涉及两个分类型自变量时,称为双因素方差分析素方差分析(two-way analysis of variance)(two-way analysis of variance) 在获取数据时,需要将一个因素安排在在获取数据时,需要将一个因素安排在“行行” ” (rowrow)的位置,称为行因素,另一个因素安排在)的位置,称为行因素,另一个因素安排在“列列” ” (columncolumn)的位置,称为列因素。)的位置,称为列因素。华南理工大学精品课程华南理工大学精品课程5656一、双因素方差分析及其类型一、双因素方差分析及其类型
41、双因素方差分析的分类依据:两因素之间的效应是否双因素方差分析的分类依据:两因素之间的效应是否独立独立 双因素方差分析的类型:双因素方差分析的类型: 两个因素对试验结果的影响是相互独立的。两个因素对试验结果的影响是相互独立的。 两个因素的搭配会对试验数据产生一种新的影响。两个因素的搭配会对试验数据产生一种新的影响。 如,某个地区的消费者对某种饮料颜色有特殊的如,某个地区的消费者对某种饮料颜色有特殊的偏好,即偏好,即“销售地区销售地区”和和“颜色颜色” ” 结合的效应。结合的效应。华南理工大学精品课程华南理工大学精品课程5757一、双因素方差分析及其类型一、双因素方差分析及其类型 对于因素的每一个
42、水平,其观察值是来自正对于因素的每一个水平,其观察值是来自正态分布总体的简单随机样本态分布总体的简单随机样本 对于各组观察数据,是从具有相同方差的总对于各组观察数据,是从具有相同方差的总体中抽取的体中抽取的华南理工大学精品课程华南理工大学精品课程5858二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析无交互作用的双因素方差分析数据结构无交互作用的双因素方差分析数据结构表表6- 6 6- 6 无交互作用方差分析试验数据的数据结构无交互作用方差分析试验数据的数据结构华南理工大学精品课程华南理工大学精品课程5959二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析 是行因素的第
43、是行因素的第i个水平下各观察值的平均值个水平下各观察值的平均值 是列因素的第是列因素的第j个水平下的各观察值的均值个水平下的各观察值的均值 是全部是全部 kr 个样本数据的总平均值个样本数据的总平均值.11(1,2, )kiijjxxirk.11(1,2, )rjijixxjkr. jx. ixx111rkijijxxkr华南理工大学精品课程华南理工大学精品课程6060二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析双因素方差分析分为三个步骤:双因素方差分析分为三个步骤:1.1. 提出假设提出假设2.2. 构造检验统计量构造检验统计量3.3. 统计决策统计决策华南理工大学精品课程华
44、南理工大学精品课程6161 对行因素对行因素a a提出的假设为提出的假设为 h0a0a: 1 1 = = 2 2 = = = = i = = = = r ( ( i为第为第i个水平的均值个水平的均值) ) h1a1a: i (i =1,2, , r) 不全相等不全相等 对列因素对列因素b b提出的假设为提出的假设为 h0b0b: 1 1 = = 2 2 = = = = j j = = = = k ( ( j j为第为第j个水平的均值个水平的均值) ) h1b1b: j (j =1,2,k) 不全相等不全相等二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析华南理工大学精品课程华南理工
45、大学精品课程6262二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析 1)1)计算误差平方和计算误差平方和 总误差平方和:总误差平方和: 行因素误差平方和:行因素误差平方和: 列因素误差平方和:列因素误差平方和: 随机误差项平方和随机误差项平方和:211()rkijijsstxx21()riissak xx21()kjjssbr xx211()rkijijijssexxxx华南理工大学精品课程华南理工大学精品课程6363二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析 总离差平方和总离差平方和sst、水平项离差平方和、水平项离差平方和ssa和和ssb、误差项离差平方和、
46、误差项离差平方和sse之间的关系之间的关系21122.111111 rkijijrkrkrkijijijijijijxxxxxxxxxx华南理工大学精品课程华南理工大学精品课程6464二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析2 2) 自由度的确定自由度的确定 各平方和的自由度分别是各平方和的自由度分别是总离差平方和总离差平方和sst的自由度为的自由度为 kr-1行因素的离差平方和行因素的离差平方和ssa的自由度为的自由度为 r-1列因素的离差平方和列因素的离差平方和ssb的自由度为的自由度为 k-1随机误差平方和随机误差平方和sse的自由度为的自由度为(k-1)(r-1)华
47、南理工大学精品课程华南理工大学精品课程6565二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析计算均方计算均方ms行因素的均方,记为行因素的均方,记为msa,计算公式为,计算公式为列因素的均方,记为列因素的均方,记为msb,计算公式为,计算公式为随机误差项的均方,记为随机误差项的均方,记为mse,计算公式为,计算公式为1ssamsar1ssbmsbk(1)(1)ssemsekr华南理工大学精品课程华南理工大学精品课程6666二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析计算检验统计量计算检验统计量f检验行因素的统计量检验行因素的统计量 检验列因素的统计量检验列因素的统
48、计量(1,(1)(1)amsaff rrkmse(1,(1)(1)bmsbff krkmse华南理工大学精品课程华南理工大学精品课程6767二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析 根据给定的显著性水平根据给定的显著性水平 在在f分布表中查找相应的临界分布表中查找相应的临界值值f 将统计量的值将统计量的值fa ,fb 与给定的显著性水平与给定的显著性水平 的临界值的临界值 f 进行比较,作出对原假设进行比较,作出对原假设h0的决策的决策若若faf ,则拒绝原假设,则拒绝原假设h0a,表明均值之间有显著,表明均值之间有显著差异,即所检验的行因素对观察值有显著影响差异,即所检验
49、的行因素对观察值有显著影响若若fb f ,则拒绝原假设,则拒绝原假设h0b,表明均值之间有显,表明均值之间有显著差异,即所检验的列因素对观察值有显著影响著差异,即所检验的列因素对观察值有显著影响 华南理工大学精品课程华南理工大学精品课程6868二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析表表6- 7 6- 7 无交互作用双因素方差分析表无交互作用双因素方差分析表根据上述步骤及计算的数据,列出方差分析表根据上述步骤及计算的数据,列出方差分析表6-76-7。华南理工大学精品课程华南理工大学精品课程6969二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析【例【例6-26-
50、2】继续单因素方差分析的例子,假定】继续单因素方差分析的例子,假定饮料的销售量不仅仅受到饮料的销售量不仅仅受到“颜色颜色”单个因素单个因素的影响,还涉及其销售地区的影响,但是两的影响,还涉及其销售地区的影响,但是两个因素对试验指标的影响是独立的。现在,个因素对试验指标的影响是独立的。现在,研究五种不同颜色的饮料在三个不同地区的研究五种不同颜色的饮料在三个不同地区的销售情况,对每种颜色在各地区的销售量取销售情况,对每种颜色在各地区的销售量取得如下数据,如表得如下数据,如表6-86-8所示。试分析颜色和地所示。试分析颜色和地区对饮料的销售量是否有显著的影响。区对饮料的销售量是否有显著的影响。华南理
51、工大学精品课程华南理工大学精品课程7070二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析地区地区1 1地区地区2 2地区地区3 3无色透明无色透明333335353636青绿色青绿色303032322929茶色茶色262624242323淡黄色淡黄色272727272828粉色粉色323230302929表表6- 8 56- 8 5种不同颜色饮料在种不同颜色饮料在3 3个不同地区的销售量数据个不同地区的销售量数据华南理工大学精品课程华南理工大学精品课程7171二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析华南理工大学精品课程华南理工大学精品课程7272二、无交互作用
52、的双因素方差分析二、无交互作用的双因素方差分析为清楚看出计算过程和结果,列成方差分析表为清楚看出计算过程和结果,列成方差分析表6- 96- 9。 表表6- 9 无交互作用双因素应用实例方差分析表无交互作用双因素应用实例方差分析表华南理工大学精品课程华南理工大学精品课程7373行平方和行平方和( (行行ssss) )度量了销售地区这个自变量对因变度量了销售地区这个自变量对因变量量( (销售量销售量) )的影响效应的影响效应列平方和列平方和( (列列ssss) )度量了饮料颜色这个自变量对因变度量了饮料颜色这个自变量对因变量量( (销售量销售量) )的影响效应的影响效应行列平方和加一起度量了两个自
53、变量对因变量的联行列平方和加一起度量了两个自变量对因变量的联合影响效应合影响效应联合效应与总平方和的比值定义为:联合效应与总平方和的比值定义为:其平方根其平方根r r 反映了这两个自变量合起来与因变量之反映了这两个自变量合起来与因变量之间的关系强度间的关系强度2ssassbrsst二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析华南理工大学精品课程华南理工大学精品课程7474二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析例题例题6-26-2,根据表,根据表6-96-9数据得数据得销售地区因素和饮料颜色因素合起来总共解释了销售销售地区因素和饮料颜色因素合起来总共解释了销
54、售量差异的量差异的90.82%90.82%其他因素其他因素( (残差变量残差变量) )只解释了销售量差异的只解释了销售量差异的9.18%9.18%r r=0.953=0.953,表明销售地区因素和饮料颜色两个因素合,表明销售地区因素和饮料颜色两个因素合起来与销售量之间有较强的关系起来与销售量之间有较强的关系21.2 178.266790.82%197.6ssassbrsst华南理工大学精品课程华南理工大学精品课程7575二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析第第1 1步:选择步:选择“工具栏工具栏”中中“数据数据”项的项的“数据分析数据分析” ” 选项;选项;第第2 2步
55、:在分析工具中选择步:在分析工具中选择“方差分析:方差分析:”;第第3 3步:当对话框出现时步:当对话框出现时 在在“输入区域输入区域”方框内键入数据单元格区域;方框内键入数据单元格区域; 在在“ 方框内方框内”键入键入0.050.05(可根据需要确定);(可根据需要确定); 在在“输出选项输出选项”选择输出区域。结果如表选择输出区域。结果如表6-106-10。excelexcel进行双因素方差分析:进行双因素方差分析:华南理工大学精品课程华南理工大学精品课程7676二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析表表6- 10 6- 10 无交互作用双因素方差分析无交互作用双因素
56、方差分析excelexcel输出结果输出结果华南理工大学精品课程华南理工大学精品课程7777三、有交互作用的双因素方差分析三、有交互作用的双因素方差分析 有交互作用的双因素方差分析,不仅分析两个有交互作用的双因素方差分析,不仅分析两个因素自身各个独立的效应,还对两个因素的组因素自身各个独立的效应,还对两个因素的组合所产生的交互作用进行显著性检验。合所产生的交互作用进行显著性检验。 为了进行交互作用的显著性检验,需要对两个为了进行交互作用的显著性检验,需要对两个因素的任意组合进行多次观测,获得多项观测因素的任意组合进行多次观测,获得多项观测值,因此有交互作用的双因素方差分析又称为值,因此有交互作
57、用的双因素方差分析又称为可重复双因素方差分析。可重复双因素方差分析。华南理工大学精品课程华南理工大学精品课程7878三、有交互作用的双因素方差分析三、有交互作用的双因素方差分析数据结构数据结构表表6- 11 6- 11 有交互作用方差分析试验数据的数据结构有交互作用方差分析试验数据的数据结构华南理工大学精品课程华南理工大学精品课程7979三、有交互作用的双因素方差分析三、有交互作用的双因素方差分析华南理工大学精品课程华南理工大学精品课程8080三、有交互作用的双因素方差分析三、有交互作用的双因素方差分析双因素方差分析分为三个步骤:双因素方差分析分为三个步骤:1. 提出假设提出假设2. 构造检验
58、统计量构造检验统计量3. 统计决策统计决策类似于无交互作用方差分析的讨论,这里我们对类似于无交互作用方差分析的讨论,这里我们对其理论公式的推导过程不再赘述,而仅给出方其理论公式的推导过程不再赘述,而仅给出方差分析表和各值的含义。差分析表和各值的含义。华南理工大学精品课程华南理工大学精品课程8181三、有交互作用的双因素方差分析三、有交互作用的双因素方差分析表表6- 12 6- 12 有交互作用的双因素方差分析表有交互作用的双因素方差分析表华南理工大学精品课程华南理工大学精品课程8282三、有交互作用的双因素方差分析三、有交互作用的双因素方差分析 总平方和:总平方和: 行变量平方和:行变量平方和
59、: 列变量平方和:列变量平方和: 交互作用平方和:交互作用平方和: 误差项平方和:误差项平方和:2111()rksijtijtsstxx21()riissaks xx21()kjjssbrs xx 211()rkijijijssabsxxxx 2111()rksijtijijtssexx1 1)计算误差平方和)计算误差平方和华南理工大学精品课程华南理工大学精品课程8383三、有交互作用的双因素方差分析三、有交互作用的双因素方差分析2 2)各平方和对应的均方差)各平方和对应的均方差/(1)msassar/ (1)msbssbk/ (1)(1)msabssabrk/(1)msesserk s,3
60、3)检验规则)检验规则(1,(1)aff rkr s(1,(1)bff kkr s(1)(1),(1)a bffkrkr s因素因素a a的各水平之间有显著差异;的各水平之间有显著差异;因素因素b b的各水平之间有显著差异;的各水平之间有显著差异;交互作用交互作用 是显著的。是显著的。ab华南理工大学精品课程华南理工大学精品课程8484三、有交互作用的双因素方差分析三、有交互作用的双因素方差分析【例【例6-36-3】某饮料公司为研究其产品不同颜色】某饮料公司为研究其产品不同颜色在不同地区销售量的差异,经调查知某些地在不同地区销售量的差异,经调查知某些地区对某种颜色有特殊的偏好。因此对不同地区对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 结伴旅游协议书
- 2025-2026学年安徽省马鞍山市初三化学上册期中考试试卷及答案
- 西师版四年级历史上册月考考试试题及答案
- 施工结算协议书
- 众筹开店协议书
- 2025版肝硬化症状诊断及护理保健方法
- 2025版阑尾炎诊疗与护理指南
- 口腔术前健康宣教
- 格威营销机构介绍
- 介绍一种运输方式
- 2025成人高等学校专升本招生统一考试政治试题及答案解析
- 益生菌与肝性脑病改善-洞察及研究
- 前掷实心球教学课件
- 2025年【小学】汉字听写大会竞赛题库(含答案)
- DGTJ08-2004B-2020 建筑太阳能光伏发电应用技术标准
- 麦语言培训课件
- 运动营养监管-洞察及研究
- 丘陵山地果园环境适应性强的电动除草机器人研发
- 2024年中国大唐集团有限公司招聘考试真题
- 绿色低碳建筑设计 课件 第3章 建筑空间设计
- 前置仓模式下叮咚买菜供应链管理优化策略研究
评论
0/150
提交评论