实验九 方差分析实验_第1页
实验九 方差分析实验_第2页
实验九 方差分析实验_第3页
实验九 方差分析实验_第4页
实验九 方差分析实验_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验九方差分析实验在现实生活中,影响具体某个事物的因素往往很多,我们常常需要正确确定哪些因素的影响是显著的,方差分析(简称为ANOV)A就是解决这一问题的有效方法。该方法在现实统计分析中应用非常广泛。方差分析的方法是否正确,直接影响到统计分析的正确性和决策的科学性。因此掌握方差分析的原理及方法使非常必要的。根据观测变量的个数,可以将方差分析分为单变量方差分析和多变量方差分析;根据因素的个数,可以将方差分析分为单因三、协方差分析)、GLMUnivariate(多因素素方差分析和多因素方差分析。实验目的:实验内容:实验工具:学习利用SPSS进行单因素方差分析、多因素方差分析和协方差分析。、单因素方差分析二、多因素方差分析SPSS中One-wayANOVA(单因素单变量方差分析单变量方差分析知识准备:)和GLMMultivariate单变量方差分析知识准备:方差分析(analysisofvariance,ANOVA)由英国统计学家R.A.Fisher首先提出,以F命名其统计量,故方差分析又称F检验。其目的是通过分析样本资料各项差异的来源以检验三个或三个以上总体平均数是否相等或者是否具有显著性差异。统计上存在两类误差:随机误差和系统误差。随机误差是指在因素的同一水平(同一个总体)下,样本的各观察值之间的差异。比如:同一种颜色的饮料在不同超市上的销售量是不同的;不同超市销售量的差异可以看成是随机因素的影响,或者说是由于抽样的随机性所造成的,这类差异称为随机误差。系统误差是指在因素的不同水平(不同总体)下,各观察值之间的差异。比如:同一家超市,不同颜色饮料的销售量也是不同的;这种差异可能是由于抽样的随机性所造成的,也可能是由于颜色本身所造成的,后者所形成的误差是由系统性因素造成的,就是系统误差。通常在以下基本假设条件下进行方差分析:1)每个总体都应服从正态分布。即对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本。比如,每种颜色饮料的销售量必需服从正态分布。2)各个总体的方差必须相同。即对于各组观察数据,是从具有相同方差的总体中抽取的。比如,四种颜色饮料的销售量的方差都相同。3)观察值是独立的。比如,每个超市的销售量都与其他超市的销售量独立。方差分析通过比较两类误差,以检验均值是否相等。如果系统(处理)误差显著地不同于随机误差,则均值就是不相等的;反之,均值就是相等的;误差是由各部分的误差占总误差的比例来测度的;通过对各观察数据误差来源的分析来判断多个总体均值是否相等。方差分析将不同水平间的总离差(SS:T反映了全部数据总的误差程度)分成两部分,一是各组平均值与总平均值离差的平

方和,反应各水平之间的差异程度或不同的处理造成的差异,称为组间差异或组间平方和,简称为SSR;另一部分是每个样本数据与其组平均值离差的平方和,称为组内差异或组内平方和或残差平方和,简称为SSE。方差分析基于下面的原理:如果原假设成立,即H1=H2=…=Hk为真,则表明没有系统误差,组间平方和SSR除以自由度后的均方与组内平方和SSE和除以自由度后的均方差异就不会太大;若组间均方显著地大于组内均方,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差。判断因素的水平是否对其观察值有影响,实际上就是比较组间方差与组内方差之间差异的大小。通过构造统计量:其中:MSR等于SSR除以它的自由度(k-)1,称为组间均方差;MSE等于SSE除以它的自由度(n-),k称为组内均方差。在零假设为真时F统计量服从自由度为k-和1n-的kF分布.即:MSRF=MSRF=MSESSR/(K-1)口SSE/(n-K)F(K-1,n-K)通过这个公式计算出统计量F,查表求出对应的P值,与α进行比较,以确定是否为小概率事件。将统计量的值F与给定的显著性水平α的临界值Fα进行比较,作出接受或拒绝原假设H的决策。根据给定的显著性水平α,在F分布表中查找与第一自由度df=1k-、1第二自由度df2=相n应-的k临界值Fα:若F>αF,则拒绝原假设H0,表明均值之间的差异是显著的,所检验的因素(A对)观察值有显著影响;若F≤Fα,则不能拒绝原假设H0,表明所检验的因素(A对)观察值没有显著影响。方差分析的基本步骤①构造检验的统计量(SS、RSSE、SST。)SST=SSR②计算检验的统计量F(F=MSR/)M。SE③统计决策。将统计量的值F与给定的显著性水平α的临界值Fα进行比较,做出接受或拒绝原假设H0的决策。一单因素方差分析具体内容与方法参看实验六(均值比较分析)的第四小节(单因素方差分析)。二多因素方差分析1、多因素单变量方差分析实验背景:某食品集团公司生产A、B、C三个品牌的食品为,了解不同品牌食品的销售情况,以地区作为划分区组进行调查,具体数据见表9-。1请检验三种食品的销售是否有差别。表9-1某公司三种不同的食品的销售数据 单位:吨地区编号食品A食品B食品C150.1058.2064.50247.8048.5062.40353.1053.8058.60463.5064.2072.50571.2068.4079.30641.4045.7038.40

761.9053.0051.20842.2039.8046.20实验过程:1)激活数据管理窗口,定义变量group表示区组,food代表销售的食品,weight表示销售食品的重量,1表示食品A,表2示食品B,表3示食品C.依次输入原始数据(如图9.1。)赴多因素单变量方差分析数据TaV转推①分析图形⑥实用程序也)附加内容Q)窗口≡&Ha国■e■温园■1?⅛⅜+i曲寓事露'学@■weightfoodgroup150.1247.8[2353」13463.5[457'1.215641.4[6761.917S42.21S958.2211048.5221153.8231264.2图9.1242)选择菜单1368.425“Analyze→GeneralLnearModel→Univariate”,1553.027弹出“多因素变量方差分析对话框。在对话框左侧的变量列表中选择变量“weight”进入“DependentVariable”框,选择“food”和“group”进入“FixedFactor(s)”框(如图9.)2。

)选择建立多因素方差分析的模型。单击“Mod”e,l选中”t,o在mMod框e中l选入gro和upfoo(d如图9.)3。4)设置多因素变量的各组差异比较。单击“Contrasts”按钮,在“Contrasts”下拉框中选择Simple;单击“Change”按钮可改变多因素变量的各组差异比较类型(如图9.)4。

驾单变量:对比因子②:£oOd斶单)gr口UPI:简单)更改对比更改&)对比型):简单更改&)参考类别:G)最后一个QS)O第一个®因素9.4)设置以图形方式之间是否存在交互作用。单击“Plots”按钮,选择变量“因素9.4)设置以图形方式之间是否存在交互作用。单击“Plots”按钮,选择变量“food”进入“”a编l辑框,单击“ADD”进入“Plots”框后,选择变量“group”进入“”a编l辑框A,x单i击s“ADD”进入“Plots”框入“(如图)5。两均值的比较(如图9.)6(如图)5。两均值的比较(如图9.)6。假定方差齐性□UD(L)0S-N-K(S)IIWaller-Duncan(W)□Bonferroni8)IITukey类型1淡型II误差比率0):∣1∞J□SidakIITukeys~bGOIIDunnettCE)□Scheffe(C)IIDuncanQ))控制类别H): I最后一个V□R-E-G-W-FIIHochbergSGT2(H),检验□R-E-G-W-Q□Sabriel(G)@双侧②o<控制(Q)O>控制国)未假定方差齐性 图9.6逐单变量:观测均值的两两比较因子逐单变量:观测均值的两两比较因子(E): 两两比较检睑0):)设置输出到结果窗口的选项。单击“Options”按钮,在

I继续」取消帮助IDisplay”复选框中选择Descriptivestatistics和Homogeneitytests.单击“OK”,得到输出结果(如图9.)7。结果说明:结果说明:TestsofBetween-SubjectsEffectsDependentVariable:食品重量SourceTypeIIISumofSquaresdfMeanSquareFSig.CorrectedModel2521.294a9280.14411.517.00074359.534174359.5343056.985.000food144.917272.4592.979.084group2376.3767339.48213.956.000Error340.5431424.324Total77221.37024CorrectedTotal2861.83623a.RSquared=.881(AdjustedRSquared=.805)图9.8图9.第8一行为所用方差分析模型的检验,P小于0.0,5因此所用的模型有统计学意义;第四行是变量gro的u检p验,表明其对销售量的影响显著;第三行是变量foo的d检验,P值为0.0,大于0.0,5表明三种品牌的产品的销售情况没有差别。2、单因素多变量方差分析实验背景:甲地区为大城市,乙地区为县城,丙地区为农村。某地分别调查了上述三类地区8岁男生三项身体生长发育指标:身高、体重和胸围,数据见表9-,2问:三类地区之间男生三项身体生长发育指标的差异有无显著性?表9-2甲、乙、丙、地区8岁男生三项身体生长发育指标编号甲地区乙地区丙地区身高体重胸围身高体重胸围身高体重胸围1119.822.660.5125.12362118.320.454.42121.721.555.512721.559121.32054.33121.419.156.5125.723.461.5121.826.661.14124.421.860.5114.917.552.5124.222.156.5512021.457.7124.923.558.5123.523.260.5611720.157117.618.95712322.957.77118.118.857.1124.220.858.5134.932.3578118.82261.7117.920.361123.722.757.19124.221.358.4120.42056105.220.261.710124.92460.811519.756.5112.220.858.411124.723.360126.221.256.5118.62160.81212322.560125.122.158.511223.26013125.322.965.2114.919.756121.5246014124.219.553.8121.52257124.521.565.2

15127.422.959.51141954.5119.520.553.816128.222.360118.719.154.5122.52359.517126.122.757.4120.62055.5115.5196018128.723.560.4122.918.556122.522.556.519129.524.551119.619.559.5124.52560.520126.925.561.5112.3205812525.557.721126.52563.9121.32058117.5235722128.226.163121.221.259127.322.557.123131.427.963.1120.223.159.5122.32261.724130.826.861.5120.32159.5121.32158.425133.927.265.812022.259.5120.52260.826130.424.462.6123.320.156.5116196027131.324.459.5122.12157.5120.5206028130.22362.6123.321.561114.51965.22913626.360109.917.856.513125.553.83014131.963.7125.623.360.5122.524.559.5实验过程:)1激活数据管理窗口,定义变量are为a地区,hig为h身高,weig为h体t重,brea为s胸t围,按顺序输入相应数值,甲地区为1,乙地区为2,丙地区为3(如图9.)。9避单因素多变量方差分析款据.sav[数据集1]-SPSSStatistics数据编辑器文件(i)编辑。视图9数据转换U)分析⑥图形⑥实用程序也)阳加内容Q)窗口帮助≡&■回F--褊券B?⅛⅛+i4≡垂番’学@■]90:area13.。highweightbreastarea变量1119.822.660.512121.721.555.513121.419.156.514124.421.860.515120.021.457.716117.020.157.017118.118.S57.118118.822.061.719124.221.358.4110124.924.060.8111124.723.360.0112123.022.560.0113125.3图2.9.9 65.21选择菜“AGeneraτnearodel→nvarae。nayze15'127.422.959.51△1OSO八C∩1数据视图I变量视图1)

Levene'sTestofEqualityofErrorVariancesaFdf1df2Sig.身高.449287.640体重1.873287.160胸围.986287.377择变量high、weight、breast进入DependentVariable框;选变量area进入Factor(s)框中(如图嚣■多变量因变量也):夕身高[high]夕体重择变量high、weight、breast进入DependentVariable框;选变量area进入Factor(s)框中(如图嚣■多变量因变量也):夕身高[high]夕体重[weιght]《夕胸围[breast]固定因子里):协变量(C):p^[图9.10)点击Options,选变量Iarea进入DisplayMeansfor框;在“输出”栏内选SSCP、ErrorSSCP与Homogeneitytest项(如图1)。结果说明:Teststhenullhypothesisthattheerrorvarianceofthedependentvariableisequalacrossgroups.a.Design:+area图9.12图9.1说2明了三个变量均满足方差齐性条件。TestsofBetween-SubjectsEffectsDependentVariableTypeIIISumofSquaresdfMeanSquareCorrected身高662.461a2 331.230FSig.DependentVariableTypeIIISumofSquaresdfMeanSquareCorrected身高662.461a2 331.230FSig.12.164.000Model体重121.562b260.78110.044.000胸围68.774c234.3874.250.017身高1353577.68111353577.68149708.674.000体重44488.900144488.9007352.029.000胸围312393.8421312393.84238614.045.000area身高662.4612331.23012.164.000体重121.562260.78110.044.000胸围68.774234.3874.250.017Error身高2369.0288727.230体重526.458876.051胸围703.844878.090Total身高1356609.17090体重45136.92090胸围313166.46090Corrected身高3031.48989Total体重648.02089胸围772.61889a.RSquared=.219(AdjustedRSquared=.201)b.RSquared=.188(AdjustedRSquared=.169)c.RSquared=.089(AdjustedRSquared=.068)图9.13由图9.1的3are行a可知:三类地区之间男生三项身体生长发育指标的有显著差异。ResidualSSCPMatrix身高体重胸围Sum-of-Squares and身高2369.028835.011199.246Cross-Products 体重835.011526.458197.913胸围199.246197.913703.844Covariance 身高27.2309.5982.290体重9.5986.0512.275胸围2.2902.2758.090Correlation 身高1.000.748.154体重.7481.000.325胸围.154.3251.000

ResidualSSCPMatrix身高体重胸围Sum-of-Squares and身高2369.028835.011199.246Cross-Products 体重835.011526.458197.913胸围199.246197.913703.844Covariance 身高27.2309.5982.290体重9.5986.0512.275胸围2.2902.2758.090Correlation 身高1.000.748.154体重.7481.000.325胸围.154.3251.000BasedonTypeIIISumofSquares图9.14由图9.1可4知:身高与体重具有较高的相关关系。3、多因素多变量方差分析实验背景:表9-是3影响橡胶质量的相关数据,假设tear(抗r撕e扯s能力)、glo(s光s泽)和opac(i不t透y明度)都是反应橡胶质量的指标,请检验extr(u挤s压n)和addit(i添v加e剂)对橡胶质量的影响如何。表9-3影响橡胶质量的相关数据extrusnadditivetear_resGlossOpacity116.59.54.4116.29.96.4115.89.63.0116.59.64.1116.59.2.8126.99.15.7127.210.02.0126.99.93.9126.19.51.9

126.39.45.7216.79.12.8216.69.34.1217.28.33.8217.18.41.6216.88.53.4227.19.28.4227.08.85.2227.29.76.9227.510.12.7227.69.21.9实验过程:1)激活数据管理窗口,定义变量为1)激活数据管理窗口,定义变量为r抗e撕s扯能力、为光泽和opac为i不t透y明度,r为u挤s压n和addit为添加剂(如图9.1)。图9.15)选择菜单“Analyze→GeneralLinearModel→Univariate”。选择变量和ssopac进i入tyDependentVariable选择变量框;选变量和u进框;选变量和u进i入vFeactor(s)框中(如图)点击Options,在“输出”栏内选SSCP、ErrorSSCP与Homogeneitytest项(如图9.1)。结果说明:光泽不透明度抗撕扯能力1.676316.212结果说明:光泽不透明度抗撕扯能力1.676316.212Teststhenullhypothesisthattheerrorvarianceofthedependentvariableis

equalacrossgroups.a.Design:+extrusn+additive+extrusn*additive

图9.18图9.1说8明了三个变量均满足方差齐性条件。

EffectValueFHypothesisdfErrordfSig.Pillai'sTrace.9995950.906a3.00014.000.000Wilks'Lambda.0015950.906a3.00014.000.000Hotelling'sTrace1275.1945950.906a3.00014.000.000Roy'sLargestRoot1275.1945950.906a3.00014.000.000extrusn Pillai'sTrace.6187.554a3.00014.000.003Wilks'Lambda.3827.554a3.00014.000.003Hotelling'sTrace1.6197.554a3.00014.000.003Roy'sLargestRoot1.6197.554a3.00014.000.003additive Pillai'sTrace.4774.256a3.00014.000.025Wilks'Lambda.5234.256a3.00014.000.025Hotelling'sTrace.9124.256a3.00014.000.025Roy'sLargestRoot.9124.256a3.00014.000.025extrusn*additivePillai'sTrace.2231.339a3.00014.000.302Wilks'Lambda.7771.339a3.00014.000.302Hotelling'sTrace.2871.339a3.00014.000.302Roy'sLargestRoot.2871.339a3.00014.000.302a.Exactstatisticb.Design:+extrusn+additive+extrusn*additive图9.19由图9.1可9知:Extr和usAnddit的i交v互e作用检验不显著,即没有交互作用。ResidualSSCPMatrix抗撕扯能力光泽不透明度Sum-of-Squares and抗撕扯能力1.764.020-3.070Cross-Products 光泽.0202.628-.552不透明度-3.070-.55264.924Covariance 抗撕扯能力.110.001-.192光泽.001.164-.034不透明度-.192-.0344.058Correlation 抗撕扯能力1.000.009-.287光泽.0091.000-.042不透明度-.287-.0421.000图9.20

(s光s泽)和由图9.2可0知:tear(抗r撕e扯s能力)、(s光s泽)和TestsofBetween-SubjectsEffectsDependentTypeIIISumVariableofSquaresdfMeanSquareFSig.CorrectedModel抗撕扯能力2.501a3.8347.563.002光泽2.457b3.8194.987.012不透明度9.282c33.094.762.531抗撕扯能力920.7241920.7248351.243.000光泽1735.38511735.38510565.507.000不透明度309.6841309.68476.319.000extrusn 抗撕扯能力1.74011.74015.787.001光泽1.30111.3017.918.012不透明度.4201.420.104.752additive 抗撕扯能力.7601.7606.898.018光泽.6121.6123.729.071不透明度4.90014.9001.208.288extrusn*additive抗撕扯能力.0001.000.005.947光泽.5441.5443.315.087不透明度3.96013.960.976.338Error 抗撕扯能力1.76416.110光泽2.62816.164不透明度64.924164.058Total 抗撕扯能力924.99020光泽1740.47020不透明度383.89020CorrectedTotal 抗撕扯能力4.26519光泽5.08519不透明度74.20619a.RSquared=.586(AdjustedRSquared=.509)b.RSquared=.483(AdjustedRSquared=.386)c.RSquared=.125(AdjustedRSquared=-.039)图9.21由图9.2可1知:extr和usanddit对itveear res检i验s显著,而对其他性能检验不显著。4、重复测量的方差分析实验背景:表9-是4某高校心理调查的具体的数据,请检验anxi和etens对i实o验n结果(即trial1-)t有r无i影a响l、4四次试验间有无差异以及试验次数和两个变量有无交互作用。表9-4某高校心理调查的具体数据subjectanxietytensiontrial1trial2trial3trial411118141262111912843111410624121612104512128626121810517211610848211884192116126210221916108112216141091222161288实验过程:)1激活数据管理窗口,定义变量anxi、eteynsi和trial1-(t如r图i9a.l2)42)2选择Analyze→GeneralLinealmodel→Repeatedmeasures,定义重复测量因子为在l因,素等级数中填入(因一共测量了四次单击Ad钮d(如图9.2)。3)单击中选入框a,框e中c选t入s和ti,o单n击OK(如图9.2)。结果说明:EpsilonaWithinSubjectsEffecttrialMauchly'sW.187Approx.Chi-Square11.254df5Sig..049Greenhouse-Geisser.536Huynh-Feldt.902Lower-bound.333图9.25图9.2表5明数据服从球形分布,可以进行重复测量的方差分析。MultivariateTestsbEffectValueFHypothesisdfErrordfSig.trial Pillai'sTrace.985127.686a3.0006.000.000Wilks'Lambda.015127.686a3.0006.000.000Hotelling'sTrace63.843127.686a3.0006.000.000Roy'sLargestRoot63.843127.686a3.0006.000.000trial*anxietyPillai'sTrace.7566.183a3.0006.000.029Wilks'Lambda.2446.183a3.0006.000.029Hotelling'sTrace3.0916.183a3.0006.000.029Roy'sLargestRoot3.0916.183a3.0006.000.029trial*tensionPillai'sTrace.6393.546a3.0006.000.088Wilks'Lambda.3613.546a3.0006.000.088Hotelling'sTrace1.7733.546a3.0006.000.088Roy'sLargestRoot1.7733.546a3.0006.000.088trial*anxietyPillai'sTrace.6724.099a3.0006.000.067*tension Wilks'Lambda.3284.099a3.0006.000.067Hotelling'sTrace2.0504.099a3.0006.000.067Roy'sLargestRoot2.0504.099a3.0006.000.067a.Exactstatisticb.Design:+anxiety+tension+anxiety*tensionWithinSubjectsDesign:trial图9.26由图9.2可6知:四次实验结果检验显著(有区别),tria与的e交t互y作用显著,其他不显著。5、协方差分析研究者在进行实验设计时,总是尽可能地控制无关变量对实验结果的影响。但在有的实验中,有的变量对实验结果有明显的影响,但很难通过实验设计进行有效的控制,这时可以把该变量看作协变量,采用协方差分析方法。

协方差分析需要满足的假设:正态分布、方差齐性、独立性和斜率同质。其中斜率同质是指:协变量和因变量是线性关系,而且对于自变量的每个水平,协变量相对于因变量的斜率相同。实验背景:为研究某行业的高级工程师在不同的经济发展地区的收入是否明显不同,由于年龄和经验影响该行业的收入,考虑年龄状况,现随机抽取经济较发达地区与经济欠发达地区的两组各1个数据,其具体数据资料见下表9-。5表9-5经济发展状况与不同年龄的收入数据单位:千元经济欠发达地区经济较发达地区年龄(X1)月工资(Y1)年龄(X2)月工资(Y2)483.5587.3334.6414.7515.8718.4435.8768.8444.9495.1638.7334.9493.6546.7425.5656.4404.9396.0475.1527.5414.1456.4414.6586.8565.1679.2实验过程:)1激活数据管理窗口,定义变量gro表u示p组别、ag表e示年龄和wag表e示工资(如图9.2)7。2)首先进行预分析,了解数据是否符合协方差分析的要求,最重要的一点就是看age的影响在两组中是否相同,这可以用与e是与e是u否p存在交互作用来表示。其分析步骤为:选择Analyze→GeneralLinealmodel→Univariate,在DependentVariable框中选入wage,在FixedFactors中选入group、age。单击Model钮,选中Custom:在Model框中选入group、age和group*age(用interaction方法就可选入),在Sumofsquares列表框中选ModelI,单击OK(如图9.2、89.2)。Eilr,}ι⅛wo-HNn⅛tt⅛<toιSPSSS-tatxs-ticeWt⅞K^fifSK文”(X)*wtα)Vttt]<x)淤Ie①)+*mci)分析。)tn*(*实用理序仪)PH力n内容g>wug∙∣⅛EDCeSUIUBi∙Eh“∙HΠI血ESiIS用9c⅛∙P1wagegrou,page变量3.514824.613335.815145.814354.914468.716373.614985.514294.940IO5J147114.141124.6图9.2741整单变量

单击Option选项,在Displaymeansfor中选入group,勾选Comparemeaneffect,点Continue。其结果为:TestsofBetween-SubjectsEffects其结果为:TestsofBe

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论