讲师教材课件_第1页
讲师教材课件_第2页
讲师教材课件_第3页
讲师教材课件_第4页
讲师教材课件_第5页
已阅读5页,还剩153页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

17四月2024讲师教材实验设计课程大纲实验设计基本概念实验方案设计实验结果分析方差分析一、实验设计的基本概念实验设计的优点术语及定义正交实验设计原理实验设计表发展历程1920年,英国统计学家费歇尔用于农田实验;三、四十年代,英、美等国对DOE进行了进一步的研究,得以广泛应用于冶金、建筑、医药等行业;二战后,日本将其作为管理技术之一引进,经发展成田口方法;现在,6SIGMA将其作为最主要的改善工具。日本经济发展中至少有10%的DOE的作用实验方式:尝试方法:依据数据每次实验结果加入自己的专业判断,以决定下一次实验的参数组合。此方法需要很强的专业知识。单因子实验方法:一次只改变一个输入因子,以寻求该因子的最佳设定值。此方法不适合两个因子同时影响输出特性值的情况。多因子(多元配置)实验方法:所有因子排列组合,对每一种可能都进行实验,以找到最佳组合。此法只在因子数少时才使用。。正交实验方法:通过由各因子在实验中出现相同次数,以平衡各因子的影响大小。可同时解决以上两个缺点。4/17/20246。DOE

简介I任何事物都可看做一个过程。由于输入的变化、各种干扰因素的影响以及各波动源之间可能存在的交互作用,使得过程的输出变化不定。究竟是哪些因素显著的影响着输出的波动?在哪些条件下输出能够控制在理想的范围内?实验设计(DOE)可帮我们解开其中之谜!过程输入输出

干扰DOE简介IIDOE过程可分为实验方案的设计和实验结果的数据分析两部分。实验方案的设计包括确定实验指标、选取因素、确定因素水平、建立实验指标的数学模型和方案。实验结果的数据分析是应用线性代数、概率论和数理统计等数学工具对实验数据进行分析处理,包括极差分析、方差分析.DOE

的优点科学合理的安排实验,从而减少实验次数,缩短实验周期,提高经济效益从众多的影响因素中找出影响输出的主要因素分析影响因素之间交互作用影响的大小分析实验误差的影响大小,提高实验精度找出较优的参数组合,并通过对实验结果的比较、分析,找出达到最优化方案进一步实验的方向对最佳方案的输出值进行预测术语及定义实验因子和水平实验设计表输出变量因子因子:实验中,影响实验输出的要素。又称因素或输入自变量x。可控因子:实验过程中可以设置和保持在希望的水平。噪声因子:可导致实验结果发生偏差,但无法控制。水平水平:实验中各因子的不同取值。一般因素均取2-3个水平做实验。水平范围选择要考虑对结果的影响程度,选择适度。低-1高1实际影响实验影响低-1高1实际影响实验影响水平2水平:只需要考察因子对实验结果的线性影响;3水平:考察因子对实验结果的非线性影响。低-1中0高1Y低-1高1Y输出变量实验设计的输出结果;尽可能使用计量型数据;关注均值的最优化及变差的最少化。例子某公司生产DVD-ROM用激光头,经定义分析激光头与激光管的粘接力过小,要提高粘接力,需进行材料粘接实验。水平因素(因子)输出变量(实验结果)ABC粘接时间粘接温度胶牌号1(—)A1=10SB1=200555粘接力2(+)A2=8SB2=250360X3A3=5SB3=270Tu90术语及定义交互作用:因子间相互影响的程度。如粘接时间粘接温度。实验次数:各因子的水平组合数。粘接力高温低温短粘接时间长粘接时间正交实验设计表实验设计表是实验设计的工具,正交表是实验设计表的代表。L(2)43正交实验代号实验次数因子数全因子实验数水平正交实验设计表实验次数因子ABC1112212132114222正交实验设计表原理正交实验表的性质:整齐可比性:同一张表上,每个因素的每个水平出现的次数相等。均衡分散性:任意两列的水平数字配对完全相等。111122121221222211212112假设最优实验点111不在实验中,可通过相邻实验点(211,112,121)很容易找到。常用正交设计表L(2)43L(2)87L(2)1211L(2)1615L(3)94L(3)2713L(4)165L(5)256L(2*3)1817L(4*2)814L(4*2)16112二、实验方案设计实验设计方案实验设计流程实验设计的成功因素实验设计的类别和用途选择实验类别需考虑:实验目标因子和水平数每次实验的成本根据不同的目标和因子数,包括6种实验类别。实验设计类别实验类型目标可控因子数全因子实验寻找最有利于输出的因子水平建立可评估所有交互影响的数学模型4因子之内部分因子实验寻找最有利于输出的因子水平建立可评估所有交互影响的数学模型5因子以上筛选实验从大量因子中找到少数关键因子7因子以上中心复合设计优化,建立非线性影响存在时的数学模型,(响应表面方法)3因子以上可靠设计优化,当存在噪声因子变化的场合发现输出最小变异时对应的因子水平。5因子以上田口可靠设计优化,优化产品或制造过程函数,使输出对噪声因子敏感最小,对输入因子敏感性最大7因子以上实验类别的选择流程确定实验目标选定因子筛选DOE因子>7实验精度不高全/部分因子DOE优化DOE结果分析目标达成结束DOE

运作

流程确定实验目标制订实验设计计划确定实验类别实验准备验证测量系统实验及记录数据结果分析优化组合验证实验控制DOE实验计划表项目名称:日期:DOE目标:相关背景:输出特性:测量方法:规格:因子对输出的影响目前水平范围易改变性低水平高水平备注:制订实验计划的注意事项:最好选择单一输出变量;在选择因子实验时,根据经验和历史数据先筛选,以降低成本;对与无法确认实验影响程度的因子,可先通过筛选实验确定其对输出的影响;确定可能影响输出变量的噪声因子。DOE成功的关键准确衡量实验指标详细的输入因子可靠的设计方案详尽的实验计划合格的测量系统可追溯的实验条件运用DOE,优选ASIMODEL857蚀刻(ETCHING)工艺,提高印刷电路板的线路质量案例I实验方案的设计明确目的,确定指标实验目的:优选蚀刻(ETCHING)工艺,明确蚀刻温度、速度、铜厚对蚀刻效果的影响,使制程变差最小化实验指标:线宽目标值为5mil+/-1mil

制定因素水平表根据以往的蚀刻操作记录,并参阅有关资料,选取如下因素水平表,并认为因子间存在交互影响。设计实验方案本实验选用正交表L8(2/7),温度(TEMP)、速度(SPEED)、铜厚(COPPERTHK)作全因子实验,以考察因子间的交互影响。设计实验方案(MINITAB)创建因子设计方案设计实验方案(MINITAB)选择3因子2水平的全因子实验设计实验方案(MINITAB)选择全因子设计方案分区(不同人,时间,地点)选择中心点,考察非线性影响选择重复实验,考察实验误差,判断因子水平的显著影响设计实验方案(MINITAB)命名因子名称,确定因子的数据类型设计实验方案(MINITAB)随机实验设计实验方案(MINITAB)多因子的交互影响全因子实验设计方案(MINITAB)标准顺序实验顺序中心点分区蚀刻温度蚀刻速度铜厚81111(50)1(78)1(1.5)5211-1(45)-1(50)123111-1-1(1.3)64111-113511-11-17611-1111711-1-1-1481111-1。运用正交实验,优选SANMINA(ASIA)波峰焊接工艺,提高印刷电路板的焊接质量案例2。实验方案的设计明确目的,确定指标实验目的:优选波峰焊接工艺,提高印刷电路板的焊接质量实验指标:衡量波峰焊接质量的好坏,是疵点(搭丝,拉尖,漏焊,半焊,气孔等)数目的多少.据各种疵点影响整机电性能的重要程度,采用加权平均法,以加权疵点数作为实验指标.具体作法如下:。加权疵点数Y=∑αiCiY越小越好.实验指标。

制定因素水平表根据以往的波焊操作记录,并参阅有关资料,选取如下因素水平表又据专业知识,可能忽略因素间的交互作用.。设计实验方案本实验选用正交表L9(3/4),由于四个因素将四个列全部排满,因此,无法估计实验误差的大小.为此,一般的做法是,采用重复实验的方法(例如,每号方案至少做两次实验),或者选用更大的正交表(例如,选取L18(2/1*3/7)或L27(3/13).但是,这样做均会导致实验次数成倍增加.本例,在其后的方差分析中,将影响小的因素当误差看待,来检验其它因素的显著性,这也不失为一种方法.实验方案表3、实验结果分析实验结果的确定及测量极差分析方差分析回归分析影响实验结果分析精度的几个重要因素实验误差项每个实验组合中取得多个数据引起的变异样本数量样本数量大则实验误差小,样本数量不得少于3个,但要考虑成本。实验结果的评价方法对于多指标要转化为综合指标,如案例2。极差分析特点:简单,可直接手工计算,只能定性分析因子对输出变量的影响。案例2从上表可以看出,9个实验方案中,第5号方案加权缺陷数最少.因此,直接看的最好方案为第5号方案,相应的工艺条件为:A2B2C3D1.实验结果的直观分析实验结果的极差分析列表计算下列各值KA1=(42.31+35.23+25.3)/3=34.28KA2=(40.48+11.4+14.39)/3=22.09KA3=(28.1+16.67+21.58)/3=22.12KB1=36.97KB2=21.1KB3=20.42KC1=24.46KC2=32.43KC3=21.6KD1=25.1KD2=25.91KD3=27.48RA的水平极差=12.19RB的水平极差=16.55RC的水平极差=10.83RD的水平极差=2.38极差分析表K134.2836.9724.4625.1K222.0921.132.4325.91K322.1220.4221.627.48R12.1916.5510.832.38实验结果的极差分析按极差大小,判断因素的影响大小本列因素的主次关系为:主次BACD最佳工艺确定

由于Y的数值越小越好,所以比较各因素的Ti大小,可得最佳工艺为:A2B3C3D1,此方案不在已做的9个实验之中.方差分析特点:分析方法复杂;可定量地分析出各因子对输出的影响程度;能确定实验误差;可从统计上确定真正的重要因子。方差分析原理见附录单因子方差分析例子:某公司品质部想确认三个供应商供应的电阻对产品性能的影响有无差别。实验因子各取5个样品的实验结果电阻123451供应商A10121314192供应商应商C2118151216单因子方差分析结果(MINITAB)SourceDFSSMSF值P值供应商水平影响221.7310.871.290.311误差12101.208.43总和14122.93S=2.904R-Sq=17.68%R-Sq(adj)=3.96%Individual95%CIsForMeanBasedonPooledStDev水平样本MeanStDevA513.6003.362(----------*-----------)B515.8001.643(----------*-----------)C516.4003.362(-----------*----------)-------+---------+---------+---------+--12.515.017.520.0当P<0.05时表示不同供应商水平对实验结果有显著影响双因子方差分析PCBA焊接品质与焊接温度和焊锡丝的松香含量有关,根据不同水平的焊接温度和松香比重实验得出相应的焊点不良数.实验因子输出YA(温度)B(含量)111302124031355421305226562355731358321593375Two-wayANOVA:YversusA,BSourceDFSSMSFPA2138.8969.4440.200.827B21438.89719.4442.060.242Error41394.44348.611Total82972.22S=18.67R-Sq=53.08%R-Sq(adj)=6.17%双因子方差分析结果(MINITAB)当P<0.05时表示因子的不同水平对实验结果有显著影响案例2实验结果的方差分析修正项的计算CT=Square(T)/n=235.46*235.46/9=6160.16总波动平方和ST及自由度fTST=∑SquareYi-CT=(42.31*42.31+…+21.58*21.58)-6160.16=1020.08fT=n-1=8各列波动平方和以第1列为例,计算如下:S1=SA=(SquareT1+SquareT2+SquareT3)/r–CT=(102.84*102.84+66.27*66.27+66.35*66.35)/3–6160.16=296.54f1=fA=3-1=2验证公式S1+S2+S3+S4=ST实验结果的方差分析方差分析将上述计算结果整理为下面的方差分析表方差分析表明,相对于因素D而言,A,B,C三个因素的影响均是显著的.最佳工艺的确定,与前面一样,为A2B3C3D1.对影响不显著的因素可以从成本考虑选择水平实验结果的方差分析注:F=各因素均方差/误差均方差,在没有误差栏时候,用最小的方差项代替.Se=SD,fe=fD计算各因素F值查表F临界值=F

0.05(2,8)=8.65F值>F临界值,因素有显著影响.方差分析的显著性判定因子对响应平均值的影响排列LevelABCD134.2836.9624.4625.10222.0921.1032.4325.91322.1220.4221.6027.48Delta12.1916.5410.832.39Rank2134。验证实验验证实验结果表明,上述工艺条件确实是最佳的,其焊接质量大幅度改进.DOE

实验数据(只做一次实验)案例IStdOrderRunOrderCenterPtBlocks温度速度铜厚线宽81111116.75211-1-114.723111-1-15.164111-114.53511-11-17.17611-1116.31711-1-1-15.5481111-17.9实验结果分析(MINITAB)输出变量确定残值图形确定主要影响因子确定残值与变量的对比图形分析(MINITAB)由图可知,速度为影响线宽的主要因子FactorialFit:线宽versus温度,速度,铜厚EstimatedEffectsandCoefficientsfor线宽(codedunits)

TermEffect系数SECoefTPConstant5.97500.0750079.670.008温度0.15000.07500.075001.000.500速度2.05001.02500.0750013.670.046铜厚-0.8500-0.42500.07500-5.670.111温度*速度0.45000.22500.075003.000.205温度*铜厚-0.0500-0.02500.07500-0.330.795速度*铜厚-0.1500-0.07500.07500-1.000.500S=0.212132R-Sq=99.57%R-Sq(adj)=96.97%P<0.05为显著因子越接近1,回归拟合的越好回归分析(MINITAB)回归方程:线宽=5.98+0.075温度+1.02速度-0.425铜厚方差分析AnalysisofVariancefor线宽(codedunits)SourceDFSeqSSAdjSSAdjMSFPMainEffects39.89509.895003.2983373.300.0862-WayInteractions30.45500.455000.151673.370.376ResidualError10.04500.045000.04500Total710.3950P>0.05为影响不显著由图可知,残值不呈正态分布,收集的数据太少残值没有随机分布,拟合模型不好残值分析—查看拟合模型的适合性各因子水平产生的残值相等,表明水平变化不能减少输出变量的变差残值与输出变量对比分析—寻找减少变差的机会实验结果(重复实验6次)StdOrder实验顺序CenterPtBlocks温度速度铜厚线宽1211150781.36.31121145781.37.33331145501.35.51541145781.57.92651150501.34.52561145501.3556.31481150501.54.61391145501.55.346101150501.54.642111150501.34.741121145501.35.57131145781.57.7……………………第一种分析方法:与单次实验方法同回归分析(MINITAB)FactorialFit:线宽versus温度,速度,铜厚EstimatedEffectsandCoefficientsfor线宽(codedunits)TermEffect系数SECoefTPConstant5.92080.02524234.620.000温度-0.8333-0.41670.02524-16.510.000速度1.98330.99170.0252439.300.000铜厚0.13330.06670.025242.640.012温度*速度-0.2250-0.11250.02524-4.460.000温度*铜厚-0.0750-0.03750.02524-1.490.145速度*铜厚0.19170.09580.025243.800.000S=0.174840R-Sq=97.84%R-Sq(adj)=97.53%P<0.05表示有显著影响因子对输出变量的贡献方差分析(MINITAB)是否有显著影响判断拟合是否适合,P<0.05表示拟合不良AnalysisofVariancefor线宽(codedunits)SourceDFSeqSSAdjSSAdjMSFPMainEffects355.750055.750018.5833607.910.0002-WayInteractions31.11581.11580.371912.170.000ResidualError411.25331.25330.0306LackofFit10.08330.08330.08332.850.099PureError401.17001.17000.0292Total4758.1192回归方程:线宽=5.92-0.42温度+0.99速度-0.067铜厚-0.11温度*速度-0.038温度*铜厚+0.096速度*铜厚图形分析-(MINITAB)红色为显著性影响超过红线表示有显著影响主效应及交互分析(MINITAB)可以看出影响程度依次为速度,温度,铜厚当两条线有交叉趋势时表示有交互影响,即在速度大时,温度越低,线相对越宽;而随着速度减低,温度越低,线反而相对变窄残值分析—MINITAB正态分布拟和良好,残值随机分布,表示拟合好.残值与输出变量对比分析铜厚高水平比低水平,速度低水平比高水平时产生的输出变差少优化—MINITAB(只考虑平均值)优化—MINITAB(只考虑平均值)最佳预测值因子对标准差的影响分析1.计算标准差(在因子设计找到下图)因子对标准差的影响分析2.对标准差进行因子设计分析,如下图.因子对标准差的影响分析FactorialFit:标准差versus温度,速度,铜厚EstimatedEffectsandCoefficientsfor标准差(codedunits)TermEffectCoefSECoefTPConstant0.168250.00269662.400.010温度-0.02426-0.012130.002696-4.500.139速度0.036240.018120.0026966.720.094铜厚-0.01738-0.008690.002696-3.220.192温度*速度0.027040.013520.0026965.010.125温度*铜厚0.028260.014130.0026965.240.120速度*铜厚0.001480.000740.0026960.270.830S=0.00762645R-Sq=99.23%R-Sq(adj)=94.59%AnalysisofVariancefor标准差(codedunits)SourceDFSeqSSAdjSSAdjMSFPMainEffects30.00440.00440.0014725.260.1452-WayInteractions30.00300.00300.001017.560.173ResidualError10.0000.0000.000Total70.00752972因子对标准差的影响分析分析结果表明因子对标准差无显著影响;图形分析略优化—MINITAB(考虑标准差最小化)优化—MINITAB(考虑标准差最小化)优化—MINITAB(结合平均值和标准差最,使能力最大化)第二种分析方法:分别进行方差分析和回归分析方差分析(结果与前同)回归分析(结果与前同)附录:方差分析的基本概念什么是方差分析(ANOVA)?

(analysisofvariance)检验多个总体均值是否相等通过分析数据的误差判断各总体均值是否相等研究分类型自变量对数值型因变量的影响一个或多个分类尺度的自变量两个或多个(k个)处理水平或分类一个间隔或比率尺度的因变量有单因素方差分析和双因素方差分析单因素方差分析:涉及一个分类的自变量双因素方差分析:涉及两个分类的自变量什么是方差分析?(例题分析)消费者对四个行业的投诉次数行业观测值零售业旅游业航空公司家电制造业12345675766494034534468392945565131492134404451657758【例】为了对几个行业的服务质量进行评价,消费者协会在四个行业分别抽取了不同的企业作为样本。最近一年中消费者对总共23家企业投诉的次数如下表什么是方差分析?(例题分析)分析四个行业之间的服务质量是否有显著差异,也就是要判断“行业”对“投诉次数”是否有显著影响作出这种判断最终被归结为检验这四个行业被投诉次数的均值是否相等若它们的均值相等,则意味着“行业”对投诉次数是没有影响的,即它们之间的服务质量没有显著差异;若均值不全相等,则意味着“行业”对投诉次数是有影响的,它们之间的服务质量有显著差异方差分析中的有关术语因素或因子(factor)所要检验的对象要分析行业对投诉次数是否有影响,行业是要检验的因素或因子水平或处理(treatment)因子的不同表现零售业、旅游业、航空公司、家电制造业就是因子的水平观察值在每个因素水平下得到的样本数据每个行业被投诉的次数就是观察值方差分析中的有关术语实验这里只涉及一个因素,因此称为单因素四水平的实验总体因素的每一个水平可以看作是一个总体比如零售业、旅游业、航空公司、家电制造业可以看作是四个总体样本数据被投诉次数可以看作是从这四个总体中抽取的样本数据方差分析的基本思想和原理方差分析的基本思想和原理(图形分析)零售业旅游业航空公司家电制造从散点图上可以看出不同行业被投诉的次数是有明显差异的同一个行业,不同企业被投诉的次数也明显不同家电制造被投诉的次数较高,航空公司被投诉的次数较低行业与被投诉次数之间有一定的关系如果行业与被投诉次数之间没有关系,那么它们被投诉的次数应该差不多相同,在散点图上所呈现的模式也就应该很接近方差分析的基本思想和原理(图形分析)仅从散点图上观察还不能提供充分的证据证明不同行业被投诉的次数之间有显著差异这种差异也可能是由于抽样的随机性所造成的需要有更准确的方法来检验这种差异是否显著,也就是进行方差分析所以叫方差分析,因为虽然我们感兴趣的是均值,但在判断均值之间是否有差异时则需要借助于方差这个名字也表示:它是通过对数据误差来源的分析判断不同总体的均值是否相等。因此,进行方差分析时,需要考察数据误差的来源方差分析的基本思想和原理1. 比较两类误差,以检验均值是否相等2. 比较的基础是方差比3. 如果系统(处理)误差明显地不同于随机误差,则均值就是不相等的;反之,均值就是相等的4. 误差是由各部分的误差占总误差的比例来测度的方差分析的基本思想和原理方差分析的基本思想和原理(两类误差)随机误差因素的同一水平(总体)下,样本各观察值之间的差异比如,同一行业下不同企业被投诉次数是不同的这种差异可以看成是随机因素的影响,称为随机误差

系统误差因素的不同水平(不同总体)下,各观察值之间的差异比如,不同行业之间的被投诉次数之间的差异这种差异可能是由于抽样的随机性所造成的,也可能是由于行业本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差方差分析的基本思想和原理(两类方差)数据的误差用平方和(sumofsquares)表示,称为方差组内方差(withingroups)因素的同一水平(同一个总体)下样本数据的方差比如,零售业被投诉次数的方差组内方差只包含随机误差组间方差(betweengroups)因素的不同水平(不同总体)下各样本之间的方差比如,四个行业被投诉次数之间的方差组间方差既包括随机误差,也包括系统误差方差分析的基本思想和原理(方差的比较)若不同行业对投诉次数没有影响,则组间误差中只包含随机误差,没有系统误差。这时,组间误差与组内误差经过平均后的数值就应该很接近,它们的比值就会接近1若不同行业对投诉次数有影响,在组间误差中除了包含随机误差外,还会包含有系统误差,这时组间误差平均后的数值就会大于组内误差平均后的数值,它们之间的比值就会大于1当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,也就是自变量对因变量有影响判断行业对投诉次数是否有显著影响,实际上也就是检验被投诉次数的差异主要是由于什么原因所引起的。如果这种差异主要是系统误差,说明不同行业对投诉次数有显著影响方差分析的基本假定方差分析的基本假定每个总体都应服从正态分布对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本比如,每个行业被投诉的次数必需服从正态分布各个总体的方差必须相同各组观察数据是从具有相同方差的总体中抽取的比如,四个行业被投诉次数的方差都相等观察值是独立的比如,每个行业被投诉的次数与其他行业被投诉的次数独立方差分析中的基本假定在上述假定条件下,判断行业对投诉次数是否有显著影响,实际上也就是检验具有同方差的四个正态总体的均值是否相等如果四个总体的均值相等,可以期望四个样本的均值也会很接近四个样本的均值越接近,推断四个总体均值相等的证据也就越充分样本均值越不同,推断总体均值不同的证据就越充分方差分析中基本假定

如果原假设成立,即H0:

m1=m2=m3=m4四个行业被投诉次数的均值都相等意味着每个样本都来自均值为

、方差为

2的同一正态总体

Xf(X)

1

2

3

4

方差分析中基本假定

若备择假设成立,即H1:

mi(i=1,2,3,4)不全相等至少有一个总体的均值是不同的四个样本分别来自均值不同的四个正态总体

Xf(X)

3

1

2

4

问题的一般提法问题的一般提法设因素有k个水平,每个水平的均值分别用

1,

2,,

k

表示要检验k个水平(总体)的均值是否相等,需要提出如下假设:H0:

1

2

k

H1:

1,

2,,

k

不全相等设

1为零售业被投诉次数的均值,

2为旅游业被投诉次数的均值,

3为航空公司被投诉次数的均值,

4为家电制造业被投诉次数的均值,提出的假设为H0:

1

2

3

4

H1:

1,

2,

3,

4不全相等2单因素方差分析2.1数据结构2.2分析步骤2.3统计决策2.4单因素方差分析案例单因素方差分析的数据结构(one-wayanalysisofvariance)

观察值(j)因素(A)i

水平A1水平A2

…水平Ak12::n

x11

x21

xk1x12

x22

xk2::

:

:::

:

:x1n

x2n

xkn分析步骤提出假设构造检验统计量统计决策提出假设一般提法H0:m1=m2=…=

mk

自变量对因变量没有显著影响

H1:m1,m2,…,mk不全相等自变量对因变量有显著影响

注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等构造检验的统计量构造统计量需要计算水平的均值全部观察值的总均值误差平方和均方(MS)

构造检验的统计量(计算水平的均值)假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部观察值总和除以观察值的个数计算公式为式中:ni为第i个总体的样本观察值个数

xij为第i个总体的第j个观察值

构造检验的统计量(计算全部观察值的总均值)全部观察值的总和除以观察值的总个数计算公式为构造检验的统计量(例题分析)构造检验的统计量(计算总误差平方和SST)全部观察值与总平均值的离差平方和反映全部观察值的离散状况其计算公式为前例的计算结果:

SST=(57-47.869565)2+…+(58-47.869565)2=115.9295构造检验的统计量(计算水平项平方和SSA)各组平均值与总平均值的离差平方和反映各总体的样本均值之间的差异程度,又称组间平方和该平方和既包括随机误差,也包括系统误差计算公式为前例的计算结果:SSA=1456.608696构造检验的统计量(计算误差项平方和SSE)每个水平或组的各样本数据与其组平均值的离差平方和反映每个样本各观察值的离散状况,又称组内平方和该平方和反映的是随机误差的大小计算公式为前例的计算结果:SSE=2708构造检验的统计量(三个平方和的关系)

总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)之间的关系SST=SSA+SSE前例的计算结果:4164.608696=1456.608696+2708构造检验的统计量(三个平方和的作用)

SST反映全部数据总的误差程度;SSE反映随机误差的大小;SSA反映随机误差和系统误差的大小如果原假设成立,则表明没有系统误差,组间平方和SSA除以自由度后的均方与组内平方和SSE和除以自由度后的均方差异就不会太大;如果组间均方显著地大于组内均方,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差判断因素的水平是否对其观察值有影响,实际上就是比较组间方差与组内方差之间差异的大小构造检验的统计量(计算均方MS)各误差平方和的大小与观察值的多少有关,为消除观察值多少对误差平方和大小的影响,需要将其平均,这就是均方,也称为方差计算方法是用误差平方和除以相应的自由度三个平方和对应的自由度分别是SST的自由度为n-1,其中n为全部观察值的个数SSA的自由度为k-1,其中k为因素水平(总体)的个数SSE的自由度为n-k构造检验的统计量(计算均方MS)组间方差:SSA的均方,记为MSA,计算公式为组内方差:SSE的均方,记为MSE,计算公式为构造检验的统计量(计算检验统计量F)将MSA和MSE进行对比,即得到所需要的检验统计量F当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为n-k的F分布,即构造检验的统计量(F分布与拒绝域)如果均值相等,F=MSA/MSE

1a

F分布F

(k-1,n-k)0拒绝H0不能拒绝H0F统计决策

将统计量的值F与给定的显著性水平

的临界值F

进行比较,作出对原假设H0的决策根据给定的显著性水平

,在F分布表中查找与第一自由度df1=k-1、第二自由度df2=n-k相应的临界值F

若F>F

,则拒绝原假设H0,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响若F<F

,则不能拒绝原假设H0,表明所检验的因素对观察值没有显著影响单因素方差分析表(基本结构)单因素方差分析(例题分析)无交互作用的双因素方差分析

(无重复双因素分析)双因素方差分析(例题分析)不同品牌的彩电在各地区的销售量数据品牌因素地区因素地区1地区2地区3地区4地区5品牌1品牌2品牌3品牌4365345358288350368323280343363353298340330343260323333308298【例】有4个品牌的彩电在5个地区销售,为分析彩电的品牌(品牌因素)和销售地区(地区因素)对销售量是否有影响,对每种品牌在各地区的销售量取得以下数据。试分析品牌和销售地区对彩电的销售量是否有显著影响?(=0.05)数据结构

数据结构

是行因素的第i个水平下各观察值的平均值

是列因素的第j个水平下的各观察值的均值

是全部kr个样本数据的总平均值分析步骤(提出假设)

提出假设对行因素提出的假设为H0:m1=m2

=

…=mi=…=

mk(mi为第i个水平的均值)H1:mi

(i=1,2,…,k)不全相等对列因素提出的假设为H0:m1=m2

=

…=mj=…=

mr(mj为第j个水平的均值)H1:mj

(j=1,2,…,r)不全相等分析步骤(构造检验的统计量)计算平方和(SS)总误差平方和行因素误差平方和列因素误差平方和随机误差项平方和分析步骤(构造检验的统计量)

总离差平方和(SST)、水平项离差平方和(SSR和SSC)、误差项离差平方和(SSE)之间的关系SST=SSR+SSC+SSE分析步骤(构造检验的统计量)

计算均方(MS)误差平方和除以相应的自由度三个平方和的自由度分别是总离差平方和SST的自由度为kr-1行因素的离差平方和SSR的自由度为k-1列因素的离差平方和SSC的自由度为r-1随机误差平方和SSE的自由度为(k-1)×(r-1)

分析步骤(构造检验的统计量)计算均方(MS)行因素的均方,记为MSR,计算公式为列因素的均方,记为MSC,计算公式为随机误差项的均方,记为MSE,计算公式为分析步骤(构造检验的统计量)

计算检验统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论