第七章方差案例.ppt_第1页
第七章方差案例.ppt_第2页
第七章方差案例.ppt_第3页
第七章方差案例.ppt_第4页
第七章方差案例.ppt_第5页
免费预览已结束,剩余128页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章方差分析,方差分析的基本原理单因素实验数据的方差分析两因素实验数据的方差分析,2020/5/1,1,现有5种治疗荨麻疹的新药,为了比较其疗效,将30个病人随机分成5组,每组6人。让同一组使用同一种新药,各病人治愈天数如7-1表所示:表7.15种治疗荨麻疹新药治愈病人天数问:5种药物的疗效是否存在显著差异?若存在显著差异,差异体现在那些药物之间?,2020/5/1,2,案例五种新药的疗效一样吗,一、方差分析的主要概念二、案例的直观分析三、统计模型与基本假定四、离差平方和与自由度的分解,2020/5/1,版权所有BY统计学课程组,3,第一节方差分析的基本原理,方差分析:是一种检验多个总体均值是否相等的统计方法。方差分析主要用来研究一个定量因变量与一个或多个定性自变量的关系。试验因素:试验的设计者希望考察的试验条件,或者说就是方差分析研究的对象,简称因素,也可称为自变量,如案例中的药物。因素水平:试验因素的某种特定状态或数量等级称为因素水平,简称水平,实际上就是因素的不同表现。如案例中的5种药物。若方差分析只针对一个因素进行,则称为单因素方差分析。若方差分析同时针对两个因素进行,则称为双因素方差分析。,2020/5/1,4,一、方差分析的主要概念,试验指标:衡量试验结果好坏程度的指标,也可称为因变量,其不同的取值常称为观察值或试验数据。在本章案例中,治愈天数就是试验指标。处理:按照因素的给定水平对实验对象所做的操作。这种操作就是对因素划类或确定数量等级,形成因素的不同水平。因素的一个水平就是一个处理。每个处理可看作一个试验条件或一个总体。试验单元接受处理的实验对象称为试验单元,简称单元。如案例中接受治疗的患者,一个患者就是一个试验单元。,2020/5/1,5,一、方差分析的主要概念,2020/5/1,版权所有BY统计学课程组,6,一、方差分析的主要概念,2020/5/1,版权所有BY统计学课程组,7,一、方差分析的主要概念,2020/5/1,版权所有BY统计学课程组,8,二、案例的直观分析,治愈天数,A1,A2,A3,A4,A5,1.从散点图上可以看出不同药物的治愈天数是有明显差异的同一个药物不同患者的治愈天数也明显不同2.药物与治愈天数之间有一定的关系如果药物与治愈天数之间没有关系,那么患者被治愈的天数应该差不多相同,在散点图上所呈现的模式也就应该很接近,不同药物的平均治愈天数就几乎应该在一条水平线上。,2020/5/1,版权所有BY统计学课程组,9,二、案例的直观分析,3.仅从散点图上观察还不能提供充分的证据证明不同药物的治愈天数之间有显著差异。4.需要有更准确的方法来检验这种差异是否显著,也就是进行方差分析。所以叫方差分析,因为虽然我们感兴趣的是均值,但在判断均值之间是否有差异时则需要借助于方差。5.不同药物的治愈天数之间的差异可能是由于抽样的随机性所造成的,也有可能是系统性影响因素造成的。6.通过对数据误差来源的分析,判断不同总体的均值是否相等。,2020/5/1,10,二、案例的直观分析,数据误差的来源分为随机误差和系统误差。1.随机误差因素的同一水平(总体)下,样本各观察值之间的差异。比如,同一药物下不同患者的治愈天数是不同的。这种差异可以看成是随机因素影响的结果,称为随机误差。2.系统误差因素的不同水平(不同总体)下,各观察值之间存在差异。比如,不同药物的治愈时间之间的差异。这种差异可能是由于抽样的随机性所造成的,也可能是由于药物本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差。,2020/5/1,11,三、数据误差的来源,2020/5/1,版权所有BY统计学课程组,12,四、统计模型与方差分析的基本假定,方差分析的数据结构(以单因素方差分析为例),:因素A的第i个处理的第j次观测值:第i个处理的n个观测值之和:全部观测值的总和:第i个处理平均数:全部观测值的总平均数,2020/5/1,版权所有BY统计学课程组,13,1.符号定义,方差分析中的统计模型,用来描述因素A的第i个处理的第j次观测值的形成机理。结合本章案例,假设在第i个处理下的第j次观测是患者张三,则张三的治愈天数应该为:张三治愈天数=张三所在处理组的平均天数+随机因素对张三治愈天数的影响(可正可负)=总平均天数+张三所在组平均天数与总平均天数之差+随机因素对治愈天数的影响,2020/5/1,版权所有BY统计学课程组,14,2.统计模型,这个差值说明了什么?,设张三所在组的平均治愈天数为,总平均治愈天数为,随机因素的影响为,张三所在组的平均治愈天数与总平均治愈天数之差为,则张三的治愈天数可表达为:,2020/5/1,15,2.统计模型,(1)每个总体都应服从正态分布对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本。(2)各个总体的方差必须相同各组观察数据是从具有相同方差的总体中抽取的(3)观察值是独立的各观测值彼此之间相互不影响在上述假定条件下,判断药物对治愈天数是否有显著影响,实际上也就是检验具有同方差的五个正态总体的均值是否相等。,2020/5/1,版权所有BY统计学课程组,16,3.方差分析的基本假定,结合本章案例,方差分析要回答的问题就是5种不同的药物对治愈天数是否有显著影响,实际上就是检验五种药物的平均治愈天数是否相等。所建立的假设为:,2020/5/1,版权所有BY统计学课程组,17,4.方差分析中假设的建立,方差分析检验多个总体的均值是否相等,或是否存在显著差异,是从对数据差异来源的分析入手的。从本章案例中可以看出,试验数据的差异存在于如下三个方面:全部观测值存在差异各水平(处理)内部观测值存在差异各水平(处理)之间观测值存在差异上述各种差异产生的原因只有两个方面,即系统性因素与随机性因素。数据差异源分析,就是通过构造反映数据差异的统计量即离差平方和,并对其进行分解,确定数据差异的原因。,2020/5/1,18,五、数据差异源分析离差平方和及其分解,总离差平方和反映全部观测值总变异的程度。总变异可能是随机因素与系统因素(试验因素)共同影响形成的。,2020/5/1,19,1.总离差平方和SST,处理内(组内)离差平方和反映各处理内观测值的变异程度。组内离差平方和是某一特定处理下试验数据的差异程度,与试验因素(系统因素)的变化无关,所以该离差平方和反映了随机因素所导致的数据差异,也称误差平方和。,2020/5/1,20,2.处理内(组内)离差平方和SSE,处理间(组间)离差平方和反映重复n次的处理间观测值的变异程度。组间离差平方和既与试验因素(系统因素)的变化有关,也与随机因素有关,所以该离差平方和反映了试验因素(系统因素)与随机因素共同所导致的数据差异。,2020/5/1,21,3.处理间(组间)离差平方和SSA,2020/5/1,22,4.三项离差平方和之间的关系,前述的各离差平方和的绝对值的大小受到处理的重复数的影响,为了消除重复数对离差平方和的影响,并实现各离差平方和之间的可比,需要将离差平方和改造为误差均方(也可称方差)。误差均方是将各离差平方和与其对应的自由度相除所得的结果。各离差平方和的自由度如下:,2020/5/1,23,5.误差均方,(1)组内均方(组内方差)(2)组间均方(组间方差)如果原假设成立,则表明没有系统误差,组间均方与组内均方差异就不会太大;如果组间均方显著地大于组内均方,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差,判断因素的水平是否对其观察值有影响,实际上就是比较组间方差与组内方差之间差异的大小。,2020/5/1,24,5.误差均方,2020/5/1,25,5.误差均方,通过比较组间均方与组内均方之间的大小,来检验多个总体均值是否相等,是方差分析的基本思想。如果组间均方显著地大于组内均方,说明各水平(总体)之间的差异不仅受随机因素,还有系统因素的影响,试验因素对试验指标有显著的影响;反之,若两者很接近,说明各水平(总体)之间的差异仅有随机因素的影响,试验因素对试验指标无显著的影响。根据这一思想,可以构造检验的统计量。,2020/5/1,26,六、检验统计量,如果因素A的不同水平对试验结果没有影响,那么在组间方差中只包含有随机误差,两个方差的比值会接近1。如果不同水平对试验结果有影响,组间方差就会大于组内方差,组间方差与组内方差的比值就会大于1。当这个比值大到某种程度时,就可以说不同水平之间存在显著差异,或者说因素A对试验结果有显著影响。,2020/5/1,27,六、检验统计量,如果,则拒绝原假设,认为各水平均值之间存在显著差异,反之,不能拒绝原假设,认为各水平均值之间没有显著差异。,2020/5/1,28,六、检验统计量,2020/5/1,29,七、方差分析表,方差分析表(单因素)一般形式,1.为什么要进行多重比较在方差分析中,不拒绝原假设,表示拒绝总体均数相等的证据不足,分析终止;当原假设被拒绝时,我们可以确定至少有两个总体的均值有显著差异。但要进一步检验哪些均值之间有显著差异还需要采用多重比较的方法进行分析。2.什么是多重比较多重比较是同时对各个总体均值进行的两两比较。方法很多,如Fisher最小显著差异(LeastSignificantDifference,LSD)方法、Tukey的诚实显著差异(HSD)方法或Bonferroni的方法等。这里我们只介绍最小显著差异方法。,2020/5/1,30,八、多重比较,2020/5/1,31,八、多重比较(最小显著差异检验法的步骤),(1)提出假设(2)计算检验的统计量(3)决策如果或则拒绝H0。,2020/5/1,32,八、多重比较(最小显著差异检验法的步骤),实际应用中,也可以按下列规则决策:首先计算检验统计量:其次计算检验临界值:最后进行统计决策:若,则拒绝原假设;反之不拒绝。,1.提出假设2.计算各离差平方和及其自由度3.计算均方和F统计量4.列方差分析表,进行F检验5.对原假设进行决策。若拒绝原假设,则进行多重比较,2020/5/1,33,九、方差分析的步骤,根据安排的试验因素的多少,方差分析分为单因素方差分析、两因素方差分析和多因素方差分析。单因素方差分析根据各处理内重复数是否相等,分为重复数相等与重复数不等的方差分析两种情况。上节讨论的是重复数相等的情况,而重复数不等的方差分析的基本原理与重复数相等时的过程是一致的,只是各离差平方和、自由度的计算,以及多重比较中标准误差的计算略有不同。,2020/5/1,34,第二节单因素方差分析,2020/5/1,35,一、各处理重复数相等的方差分析(例),根据本章案例介绍过程。1.建立假设:2.计算各均值、各离差平方和、各均方、F统计量,列方差分析表。这类计算比较麻烦,可借助相关软件完成。,2020/5/1,36,一、各处理重复数相等的方差分析(例),方差分析表,2020/5/1,37,一、各处理重复数相等的方差分析(例),3.统计决策:从临界值来看,由于,所以拒绝原假设;从P值来看,由于,所以拒绝原假设;4.进行多重比较在显著性水平时,由于所以,水平1和水平2的均值之间存在显著差异。余此类推,【例】为了对几个行业的服务质量进行评价,某市消费者协会对该地的旅游业、居民服务业、公路客运业和保险业分别抽取了不同数量的企业。每个行业中的这些企业在服务内容、服务对象、企业规模等方面基本相同。经统计,最近一年消费者对这23家企业投诉的次数资料如表7-7所示,消费者协会想知道:这几个行业之间的服务质量是否有显著差异?如果有,究竟是在哪些行业之间?如果能找出哪些行业的服务质量最差,就可以建议对消费者权益保护法中该行业的某些条款作出修正。,2020/5/1,38,二、各处理重复数不相等的方差分析,2020/5/1,39,例题数据,某地消费者对四个行业的投诉次数,3.多重比较中检验统计量:4.其余操作与单因素方差分析过程一致。,2020/5/1,版权所有BY统计学课程组,40,分析过程,2020/5/1,41,计算与决策,解:(1)建立假设H0:1=2=m;H1:1,2,m不全相等(2)计算有关均值及平方和ST=1175.913,SE=422,SA=753.913,方差分析表,(3)统计决策对于显著性水平=0.05,F0.05(3.19)=3.1274由于检验统计量F=11.315F0.05(3.19),所以拒绝原假设H0,即有95%的把握认为不同的行业之间投诉的差异显著。,2020/5/1,版权所有BY统计学课程组,42,计算与决策,(1)点击“工具”栏中的数据分析项;(2)在分析工具框中连击“单因素方差分析”;(3)在对话框的“数据区域”框中键入A3:C6;在框中保持0.05不变(也可根据需要变为0.01);在“输出选项”中键入D3;选择“确定”,输出结果如表7-9所示:,2020/5/1,版权所有BY统计学课程组,43,Excel中方差分析的计算步骤,2020/5/1,44,对四个行业的均值进行多重比较(=0.05),由题意及计算可知,k1=7,k2=6,k3=k4=5;第一步:提出假设假设1:H0:1=2;假设2:H0:1=3;假设3:H0:1=4假设4:H0:2=3;假设5:H0:2=4;假设6:H0:3=4,2020/5/1,版权所有BY统计学课程组,45,第二步:计算检验统计量的值第三步:计算LSD。,2020/5/1,版权所有BY统计学课程组,45,对四个行业的均值进行多重比较(=0.05),2020/5/1,版权所有BY统计学课程组,46,第四步:进行决策,2020/5/1,版权所有BY统计学课程组,46,由以上计算可知,检验统计量,的值分别小于LSD1、LSD2、LSD4的值,显示旅游业与居民服务业的投诉次数之间、旅游业与公路客运业投诉次数之间、居民服务业与公路客运业投诉次数之间没有显著差异;,的值分别大于LSD3、LSD5、LSD6的值,显示旅游业与保险业的投诉次数之间、公路客运业与保险业投诉次数之间有显著差异。,对四个行业的均值进行多重比较(=0.05),一、无交互作用的双因素方差分析若记一因素为因素A,另一因素为因素B,对A与B同时进行分析,就属于双因素方差分析,即判断是否有某一个或两个因素对试验指标有显著影响,两个因素结合后是否有新效应。在统计学中将各个因素的不同水平的搭配所产生的新的影响称为交互作用。我们先讨论无交互作用的双因素方差分析问题,对于有交互作用的双因素方差分析问题稍后再讨论。,2020/5/1,版权所有BY统计学课程组,47,第三节双因素方差分析,假定因素A有r个水平:A1,A2,Ar;因素B有s个水平:B1,B2,Bs。在A的r个水平与B的s个水平的每种组合下作一次试验,可得无交互作用的双因素方差分析的数据结构下表所示:,2020/5/1,版权所有BY统计学课程组,48,数据结构,判断因素A的影响是否显著等价于检验假设:H01:1.=2.=i.判断因素B的影响是否显著等价于检验假设:H02:.1=.2=.j其中,r表示A的第i个水平所构成的总体均值,s表示的B第j个水平所构成的总体均值。,2020/5/1,版权所有BY统计学课程组,49,假设建立,分解总离差平方和,与单因素情况类似,能够证明下列公式成立:,2020/5/1,版权所有BY统计学课程组,50,自由度,由数理统计可以证明:当时与单因素情况类似,可以证明ST、SA、SB和SE的自由度分别为,2020/5/1,版权所有BY统计学课程组,51,平方和分解定理,平方和分解定理:设Q服从自由度为n的分布,又Q1+Q2+Qk=Q,其中,Q(i=1,2,3,k)是秩为fi的非负二次型,则Q相互独立,并且服从自由度为fi的分布的充要条件是f1+f2+fk=n(这里不做证明,证明参见有关数理教材)。显然,ST、SA、SB和SE满足平方和分解定理条件。,2020/5/1,版权所有BY统计学课程组,52,检验统计量,由于SA反映因素A的各水平之间的差异,SB反映因素B的各水平之间的差异,SE反映在交互作用不显著时试验本身随机误差的大小。因此,可用以下统计量作为检验统计量:,2020/5/1,版权所有BY统计学课程组,53,双因素(无交互作用)方差分析表,2020/5/1,版权所有BY统计学课程组,54,【例】为提高某种产品的合格率,考察原料用量和来源地对其是否有影响。原料来源地有三个:甲、乙、丙;原料用量有三种:现有量、增加5%、增加8%。每个水平组合各作一次试验,得到的数据如表下所示。试分析原料用量和来源地对产品合格率的影响是否显著?,2020/5/1,版权所有BY统计学课程组,55,例题,例题数据,2020/5/1,版权所有BY统计学课程组,56,例题分析,解:(1)建立假设H01:1.=2.=3.H02:.1=.2=.3(2)计算相应的均值和平方和:,2020/5/1,版权所有BY统计学课程组,57,(3)列方差分析表,方差分析表,2020/5/1,版权所有BY统计学课程组,58,例题分析,(4)统计决策,对于显著性水平=0.05,查表得临界值F0.05(2,4)=6.94,因为FA=1.86F0.05(2,12)=3.89,FA*B=88.41F0.05(2,12)=3.89说明不仅冲压机的型号和垫片材料对垫片数量有显著影响,而且其交互作用也是显著的。由结构均值表可知,在冲压机中,第一种的均值较大;垫片材料中,木的均值较大,故最优方案是A1B3。,2020/5/1,版权所有BY统计学课程组,76,以例7.3为例,将数据输入到Excel工作表的区域为B2:D7,冲压机的二个水平A1、A2在第一列,垫片材料的水平B1、B2、B3在第一行。再按以下步骤进行:(1)点击“工具”栏中的数据分析项。(2)分析工具框中连击“方差分析:可重复双因素方差分析”。(3)在对话框的“数据区域”框中键入A1:D7;在“每一样本的行数”框中键入3。在框中保持=0.05不变(也可根据需要变为0.01);在“输出选项”中键入空白地方,如F2;选择“确定”,输出结果如表7-20所示:,2020/5/1,版权所有BY统计学课程组,77,有交互作用的双因素方差分析中的Excel应用,7-20有重复双因素方差分析结果,由表7-20于检验行因素冲压机A(Excel表中为“样本”)、用于检验列因素垫片材料B、用于检验冲压机A和垫片材料B交互作用A*B的p值均小于0.05,故不仅因素A和B对试验指标有显著影响,而且其交互作用也是显著的。由于A1的试验指标均值大于A2的试验指标均值,B3的试验指标均值大于B1和B2的试验指标均值,故最优方案应为A1B3,买第一种型号的冲压机、采用软木材料,这种组合的单位时间内生产的垫片最多。,2020/5/1,版权所有BY统计学课程组,79,一、试验设计的概念和设计原则试验设计有三个基本原则:重复性、随机化和区组化。(1)重复性原则:重复性是指对一项试验要在相同的条件下重复进行若干次。只有进行多次的试验,才能掌握其规律性。(2)随机化原则:随机化是指试验材料和试验地点都要随机地确定。这样进行试验得出的结论才具有客观性和普遍性,且每次进行的试验都可认为是相互独立的。(3)区组化原则:一组试验,试验者总希望在相同或近似相同的条件下进行,以便在相互比较中得出正确的结论。,2020/5/1,版权所有BY统计学课程组,80,第四节正交试验设计初步,第一、尽量减少试验误差。在试验时,要尽可能使对试验产生影响的其他因素达到理论中要求的精确程度,这样我们在对目的指标进行测算时才能达到较为客观的结果。在一项试验中误差是必然存在的,我们的目的就是要尽量减少该误差。第二、尽量减少试验次数。试验的次数越多,进行试验所耗费的人力、物力也就会相应地增多,最佳的试验就是用尽可能少的费用来获得最有效的试验结果。第三、所设计的试验要便于对指标值进行统计分析。影响一个事件的指标是多样的,在进行设计时要选择比较容易测算且对事件影响较大的指标进行计算。,2020/5/1,版权所有BY统计学课程组,81,在安排试验时需要注意三点:,在现实问题中,影响试验指标的因素通常有很多个,要考察它们就涉及多因子的试验设计问题。多因子试验中一个很困难的问题就是因子数较多,而又需要进行多次的试验。例如,有10个因子对某一指标有显著影响,而每个因子取两个水平进行比较,那么就有210=1024个不同的水平组合,即每个水平组合作一次试验,就需要进行1024次试验,耗费的人力、财力可想而知,这在实际中是不可行的。因此,需要按照一定的方法从中选择一部分进行试验。常用的试验设计方法有正交试验设计法、参数设计法、回归设计法、均匀设计法、混料设计法等。限于篇幅,这里仅介绍正交试验设计的基础知识,其他方法请读者自行阅读试验设计的有关书籍。,2020/5/1,版权所有BY统计学课程组,82,在多因子试验中,各因子又有不同的水平数,我们的目的是要从这些因子不同的水平组合中,找出一组或几组组合使所要求的指标达到最优。下面以一个二因子的例子来具体认识一下多因子试验问题。例7.4为提高合金钢的强度,同时考虑碳(C)含量(因子)及钛(Ti)与铝(AL)的含量(因子)对强度Y的影响,希望找出最佳的含量组合,使强度Y达到最大(表7-21)。,2020/5/1,版权所有BY统计学课程组,83,二、多因子试验问题,2020/5/1,版权所有BY统计学课程组,84,表7-21合金钢的试验数据,2020/5/1,版权所有BY统计学课程组,85,一个因子的水平好坏或好坏的程度受另一个因子水平制约的情况,称为因子A和B的交互作用,记作或AB。因子A和B的交互作用可以用图形较为直观地表示。,2020/5/1,版权所有BY统计学课程组,86,三、交互作用,2020/5/1,版权所有BY统计学课程组,87,因子间的交互作用会随着因子个数的增加而增加。如四个因子A,B,C,D间的交互作用有以下几类:(1)二级交互作用有6个:AB,AC,AD,BC,BD,CD;(2)三级交互作用有4个:ABC,ABD,ACD,BCD;(3)四级交互作用有1个:ABCD。交互作用共有11个,比因子个数还多。实践经验表明,多数交互作用是不存在或者很小以至可以忽略不计的,一般我们主要考虑部分二级交互作用,但具体考察哪些二级交互作用还要根据下面的方法来决定。,2020/5/1,版权所有BY统计学课程组,88,正交试验设计法是利用正交表科学地挑选试验条件,合理安排试验的方法,是研究与处理多因素试验的一种科学方法。正交设计有两个重要的特点:(1)任意一对因子(也称因素)的任一水平组合必在试验中出现,且出现的次数相同;(2)总试验次数比全面试验(所有因子的任一水平组合都进行搭配)要少许多次。例如,对7个二水平因子进行全面试验要进行27=128次,而用正交表安排试验只需要作8次。用正交表合理地安排试验,可以做到省时、省力、省钱,还能得到令人满意的检验效果,因此这种方法在改进产品质量、研究采用新工艺、试制新产品、了解设备工艺性能以及改进技术管理等方面都有广泛的应用。,2020/5/1,版权所有BY统计学课程组,89,四、正交表及其类型,正交表是正交设计的工具,是运用组合数学理论在正交拉丁方的基础上构造的一种规格化表格,符号为:其中,L为正交表符号;n为正交表的行数(试验次数,试验方案数);j为正交表中每一列因子的水平个数;i为正交表的列数(试验因子的个数)。,2020/5/1,版权所有BY统计学课程组,90,1正交表及其特性,例如,表示一张8行7列,每列有两个水平的正交表(表7-22),它表示在这个试验中,要作8次不同条件的试验,共有7个影响因素,每个因素都有两个水平,我们称这张表为两水平的正交表。,2020/5/1,版权所有BY统计学课程组,91,2020/5/1,版权所有BY统计学课程组,92,正交表具有正交性,这是指它有如下两个特征:(1)每列中不同的数字重复的次数相同。在表7.22中,每列有两个不同的数字:1,2,每一个各出现4次。(2)将任意两列的同行数字看成一个数对,那么任意可能数对重复的次数相等。在中,任意两列有4种可能数对:(1,1),(1,2),(2,1),(2,2),每一对各出现2次。,2020/5/1,版权所有BY统计学课程组,93,2020/5/1,版权所有BY统计学课程组,94,2正交表的分类,正交表安排试验的步骤如下:(1)明确试验目的,确定要考察的试验指标。(2)确定要考察的因子和因子的水平。(3)选用合格的正交表,进行表头设计。(4)根据试验号的安排进行试验,并记录试验指标的具体数据。(5)数据分析。对一个正交表形式的试验设计通常有三种分析方法:一是用极差分析各因子对指标影响程度的大小,这是一种较为简单的直观分析方法;二是用方差分析进行数据分析;三是贡献率分析法。,2020/5/1,版权所有BY统计学课程组,95,五、无交互作用情况下的设计,例7.5某化工厂生产的一种产品的收率较低,为此希望通过试验提高收率。在试验中考察如下三个因子三个水平(表7-23):表7-23因子水平表,2020/5/1,版权所有BY统计学课程组,96,解由于所考察的因子是三水平的,因此选用三水平正交表,又现在只考察三个因子,故选择安排试验。选定了正交表后把因子放在正交表的列上去,称为表头设计。在例7.5中将三个因子置于前三列,将它写成如下的表头设计形式:,2020/5/1,版权所有BY统计学课程组,97,九次试验的结果收率(%)分别是:516158726959878584(一)用极差分析各因子对指标影响程度的大小1用直观分析表对该试验进行分析为方便起见,把试验结果写在正交表的右边一列上,并分别用表示,所有计算可以在表上进行。,2020/5/1,版权所有BY统计学课程组,98,首先来看第一列,该列中的1,2,3分别表示因子的三个水平,按水平号将数据分为三组:“1”对应,“2”对应,“3”对应。在第二列,该列中的1,2,3分别表示因子B的三个水平,按水平号将数据分为三组:“1”对应,“2”对应,“3”对应。同理我们可以从图中得到第三列的情况。,2020/5/1,版权所有BY统计学课程组,99,分别对每一列每个水平的数据进行相加,得到这个水平下该因子对应指标值的和,例如,,2020/5/1,版权所有BY统计学课程组,100,同理我们可以得到对应C水平的T1,T2,T3的值,用每个水平得出的Ti的值去除以3就得到其均值。由以上计算可知,每个因子下间的差异反映了这个因子三个水平间的差异;分别对三个因子的各个水平进行数值大小比较:因子A的三个水平均值差异较大,其第三个水平的均值最大,故因子A的三水平最好。对第二、三列进行类似地分析,可知因子B的第二个水平好,因子C的第二个水平好。,2020/5/1,版权所有BY统计学课程组,101,对第四列也可以进行上述分析,按其中的1,2,3分别将数据分为三组,但三组的水平组合相同,因此该列仅反映误差。综上可知,使指标达到最佳的水平组合是,即反应温度为90度、加碱量为48公斤、选取乙类催化剂可以使转化率达到最大。,2020/5/1,版权所有BY统计学课程组,102,一个因子的极差是该因子各水平均值的最大值与最小值之差,如果该值大,则说明改变这一因子的水平会对指标造成较大的变化,所以该因子对指标的影响大,反之,则影响小。极差最大的列所对应的因子是最主要因子。当要求指标愈高愈好时,可选R行中最大者,所对应的水平为优水平;当要求指标愈低愈好时,可选R行中最小者其所对应的水平为优水平。,2020/5/1,版权所有BY统计学课程组,103,2用极差分析各因子对指标影响程度的大小,在例7.5中各个因子的极差分别是:它们被置于表7-24的最下方一行。从三个因子的极差可知因子A的影响最大,其次是C,而因子B的影响则最小,通常记为,2020/5/1,版权所有BY统计学课程组,104,2020/5/1,版权所有BY统计学课程组,105,表7-24例7.5的直观分析计算表,用方差分析方法来说明影响指标的因子的分析步骤如下:1建立统计模型要对试验进行方差分析,首先要作几点假设:(1)在同一水平组合下全部试验结果构成一个总体,且服从正态分布;(2)各正态总体的方差相同,均为;(3)各正态均值与水平组合有关;(4)不同水平组合下的试验是相互独立的。,2020/5/1,版权所有BY统计学课程组,106,(二)用方差分析法进行数据分析,2020/5/1,版权所有BY统计学课程组,107,总平方和为:,2020/5/1,版权所有BY统计学课程组,108,2进行平方和分解,(1)因子的平方和是此因子各水平均值与总均值间的离差平方和;(2)一个置于正交表第k列上的因子,其平方和,其自由度;(3)因子平方和中除了误差之外只反映此因子的效应间的差异;(4)误差平方和等于诸空白列的平方和之和,其自由度等于诸空白列的自由度之和。,2020/5/1,版权所有BY统计学课程组,109,3计算各因子的平方和,2020/5/1,版权所有BY统计学课程组,110,4方差分析表,2020/5/1,版权所有BY统计学课程组,111,(1)对显著因子应选择其最好的水平;(2)对不显著的因子可以任意选择水平,常可根据降低成本、操作方便等来选择其水平。,2020/5/1,版权所有BY统计学课程组,112,5最佳水平选择,2020/5/1,版权所有BY统计学课程组,113,6最佳水平组合均值估计,2020/5/1,版权所有BY统计学课程组,114,在实际问题中,分析所得的最佳水平组合无论是否在试验中出现,通常都需要作验证试验,对最佳水平组合进行验证。对于例7.5,根据介绍的计算公式我们得到如表7-26所示的方差分析表:,2020/5/1,版权所有BY统计学课程组,115,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论