SPSS统计分析参数估计与假设检验PPT课件_第1页
SPSS统计分析参数估计与假设检验PPT课件_第2页
SPSS统计分析参数估计与假设检验PPT课件_第3页
SPSS统计分析参数估计与假设检验PPT课件_第4页
SPSS统计分析参数估计与假设检验PPT课件_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

04.05.2020,.,1,第五章参数估计与假设检验,04.05.2020,.,2,主要内容,第一节单一样本T检验(One-SampleTTest)第二节独立样本T检验(Independent-SampleTTest)第三节配对样本T检验(Paired-SampleTTest),04.05.2020,.,3,均值比较与均值比较的检验过程,均值比较的概念统计分析常常采取抽样研究的方法,即从总体中随机抽取一定数量的样本进行研究来推断总体的特性。由于总体中的每个个体间均存在差异,即使严格遵守随机抽样原则也会由于多抽到一些数值较大或较小的个体致使样本统计量与总体参数之间有所不同;又由于实验者测量技术的差别或测量仪器精确程度的差别等等也会造成一定的偏差,使样本统计量与总体参数之间存在差异。由此可以得到这样的认识:均值不相等的两组样本不一定来自均值不同的总体。能否用样本均值估计总体均值?两个变量均值接近的样本是否来自均值相同的总体?换句话说,两组样本某变量均值不同,其差异是否具有统计意义?能否说明总体具有显著性差异?这是各种研究工作中经常提出的问题。这就要进行均值比较。,04.05.2020,.,4,一、简介主要用于检验单个变量的均值与假设检验值(给定的常数)之间是否存在差异,也可进行单样本的参数区间估计。二、完全窗口分析按AnalyzeCompareMeansOne-SampleTTest顺序,打开One-SampleTTest主对话框(如图5-1),第一节单一样本T检验,04.05.2020,.,5,图5-1One-SampleTTest主对话框,图5-2Options对话框,TestVariables框:用于选取需要分析的变量,TestValue:输入已知的总体均值,默认值为0,ConfidenceInterval:输入置信区间,一般取90、95、99等。,MissingValues:在检验变量中含有缺失值的观测将不被计算。在任何一个变量中含有缺失值的观测都将不被计算,04.05.2020,.,6,三、例题分析(一)05-1某校在对一项教学改革措施的评价中,随机抽取了60位学生进行态度调查,他们的10项态度7级量表的态度反应资料见下表:,试构造学生态度得分平均值的98%的置信区间。,04.05.2020,.,7,(二)以04-7的资料来说明。已知另一地区16-18岁的少年血红蛋白平均值为11.657(g%),检验这一地区16-18岁少年血红蛋白平均值是否与另一地区的平均值相等。1、操作步骤1)(打开数据文件“04-7血红蛋白.sav”。)按AnalyzeCompareMeansOneSampleTTest顺序,打开主对话框。2)将变量hb选入TestVariable框。3)在TestValue中输入11.657,后单击OK。,04.05.2020,.,8,2、结果分析,表5-1单个样本统计量,表5-1是血红蛋白值的观测量个数、均值、标准差和均值的标准误等统计量。,04.05.2020,.,9,表5-2单个样本检验,从表5-2可看出,t值为-0.592,自由度为39,显著值为0.558,样本均值与检验值的差为-0.2122,该差值95%的置信区间是-0.93790.5134。,04.05.2020,.,10,(三)为了解某村1300户农民的年收入状况,不重复抽取70户家庭进行调查,得出每户农民年平均收入为4500元,标准差为260元。试求该村每户农民年平均收入95%的置信区间。(四)某商品的零售商要求总代理增加广告费支出,认为如此每星期平均销售量可达20000箱。总代理增加广告费三个月后想了解平均销售情况,随机抽取16家零售店调查,发现每星期平均销售量只有15000箱,标准差为6000箱。假设销售量服从正态分布,试问平均销售量的下降是否因偶然因素所致(0.01)?,04.05.2020,.,11,一、简介用于检验对于两组来自独立总体的样本,其独立总体的均值或中心位置是否一样。如果两组样本彼此不独立,应使用配对T检验(Paired-SampleTTest)。如果分组不止一个,应使用One-WayANOVA过程进行单变量方差分析。如果想比较的变量是分类变量,应使用Crosstabs功能。独立样本T检验还要求总体服从正态分布,如果总体明显不服从正态分布,则应使用非参数检验过程(Nonparametrictest)。,第二节独立样本T检验,04.05.2020,两个独立样本之差的抽样分布,04.05.2020,两个总体均值之差的检验(12、22已知),1.假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布,可以用正态分布来近似(n130和n230)2.检验统计量为,04.05.2020,两个总体均值之差的检验(12、22未知,大样本),检验统计量为,04.05.2020,两个总体均值之差的检验(12、22未知但相等,小样本),检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等检验统计量,其中:,04.05.2020,两个总体均值之差的检验(12、22未知且不相等,小样本),检验具有不等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知且不相等1222检验统计量,04.05.2020,方差齐性检验(LeveneF方法):计算两组样本的均值计算各个样本与本组均值的平均离差绝对值;利用单因素方差分析推断两独立总体平均离差绝对值是否有显著差异。在对两独立样本进行T检验时,两组样本方差相等和不等时,计算t值使用的公式不同,所以首先进行方差F检验。用户需要根据F检验的结果,自己选择t检验输出中的结果,得出最后结论。如果推断两总体方差相等,则看方差相等的T检验值和P值;如果推断两总体方差不相等,则看方差不相等的T检验值和P值。,04.05.2020,.,18,图53独立样本T检验主对话框,从源变量框中选取要作检验的变量。,为分组变量,只能有一个。,二、完全窗口分析按AnalyzeCompareMeansIndependent-SampleTTest顺序,打开Independent-SampleTTest主对话框(如图5-3),04.05.2020,.,19,在检验变量中含有缺失值的观测将不被计算。在任何一个变量中含有缺失值的观测都将不被计算,输入置信区间,一般取90、95、99等。,图5-5Independent-SampleTTest的Options对话框,图54DefineGroups主对话框,分别输入分组变量的取值条件,如1为男,2为女等。输入分界点值,如体重60公斤等。,04.05.2020,.,20,三、例题分析(一)05-2某一个新的制造过程可以增加电池的使用寿命,假设电池使用寿命服从正态分布。在新电池中随机抽15个,而在旧电池中随机抽12个同时测试其使用寿命,资料如下,试求新旧两种电池平均寿命之差的95%的置信区间。新电池(日):18.2,10.4,12.6,18.0,11.7,15.0,24.0,17.6,23.6,24.8,19.3,20.5,19.8,17.1,16.3旧电池(日):12.1,7.5,8.6,13.9,7.8,15.1,17.9,10.6,13.8,14.2,15.3,11.6,04.05.2020,.,21,(二)仍以04-7的资料来说明,要求检验男生和女生血红蛋白平均含量是否相等。1、操作步骤1)打开数据文件“04-7血红蛋白.sav”。按AnalyzeCompareMeansIndependent-SampleTTest顺序,打开主对话框。2)将变量hb选入TestVariable框。3)在sex选入GroupingVariable框中作为检验变量。4)打开DefineGroups对话框,在Group1输入1,Group2输入2,单击Continue,再单击OK。,04.05.2020,.,22,2、结果分析,表5-3是血红蛋白值的观测量个数、均值、标准差和均值的标准误等统计量。,表5-3分组统计量,04.05.2020,.,23,表5-4独立样本T检验结果,从表5-4可看出,Equalvariancesassumed行是假设方差相等进行的检验,当方差相等时考察这一行的结果;Equalvariancesnotassumed行是假设方差不等进行的检验,当方差不等时考察这一行的结果。在LevenesTestforEqualityofVariance列中,P值为0.5440.05,可认为方差是相等的,所以应考察第一行的结果。可看出,P值为0.0000.05,所以认为均值是不等的。,04.05.2020,.,24,一、简介利用来自两个总体的配对样本,推断两个总体的均值是否存在显著性差异。所谓配对样本,可以是个案在“前”、“后”两种状态下某属性的两种不同特征,也可以是对某事物两个不同侧面的描述。两配对样本的样本容量应该相等,两组样本观察值的顺序一一对应,不能随意改变;样本来自的总体服从或近似服从正态分布。,第三节配对样本T检验,04.05.2020,.,25,二、两配对样本T检验的实现思路提出原假设:两总体均值不存在显著差异;选择检验统计量。两配对样本T检验是间接通过单样本T检验实现的。配对样本T检验实际上是先求出每对观测值之差值,对差值变量求平均。检验配对变量均值之间差异是否显著,实质是检验差值变量的均值与0之间差异的显著性;计算样本统计量观测值和概率P值;根据显著性水平和概率P值进行统计推断。,04.05.2020,.,26,三、配对样本的t检验1、数据形式,04.05.2020,.,27,样本差值均值,样本差值标准差,自由度dfn-1,统计量,D0:假设的差值,2、检验统计量,04.05.2020,.,28,从源变量框中选取成对变量移入。,所选变量。,同图55,图56Paired-SampleTTest对话框,四、完全窗口分析按AnalyzeCompareMeansPaired-SampleTTest顺序,打开Paired-SampleTTest主对话框(如图5-6)。,04.05.2020,.,29,五、例题分析(一)05-3为了研究吸烟有害广告对吸烟者减少吸烟量是否有作用。从某吸烟者总体中随机抽取33位吸烟者,调查他们在观看广告前后的每天吸烟量(支),数据如下表。试问影片对他们的吸烟量有无产生作用?请构造观看广告前后吸烟量之差的99%的置信区间。,表5-5广告前后吸烟量数据,04.05.2020,.,30,(二)05-4某单位研究饲料中缺乏维生素E与肝中维生素A含量的关系,将大白鼠按性别、体重等配为8对,每对中两只大白鼠分别喂给正常饲料和维生素E缺乏饲料,一段时期后测定其肝中维生素A含量(mol/L)如下,现在想知道饲料中缺乏维生素E对鼠肝中维生素A含量有无影响。,表5-6配对样本T检验数据,04.05.2020,.,31,1、操作步骤1)输入数据并定义变量名:正常饲料组测定值为x1,维生素E缺乏饲料组测定值为x2(数据文件“饲料(配对T检验).sav”。)2)按AnalyzeCompareMeansPaired-SampleTTest顺序,打开主对话框。3)单击变量x1,再单击x2,将x1,x2送入Variables框。左下方CurrentSelections框中出现Variable1、Variable24)单击OK。2、输出结果及分析,04.05.2020,.,32,表5-6配对样本T检验描述统计量,表5-6可看出,变量x1的均数、标准差、标准误分别为34.750、6.649、2.351,变量x2的均数、标准差、标准误分别为26.238、5.821、2.058。,表5-7配对样本T检验相关性,表5-7可看出,本例共有8对观测值,相关系数为0.586,相关系数的显著性检验表明P值为0.127。,04.05.2020,.,33,表5-8配对样本T检验结果,表5-8说明变量x1、x2两两相减的差值均数、标准差、差值均数的标准误差分别为8.513、5.719、2.022,95置信区间为3.731,13.292。配对检验结果表明t为4.21,自由度为7,P值为0.004,差别在统计上具有高度显著性,即饲料中缺乏维生素E对鼠肝中维生素A含量确有影响。,04.05.2020,.,34,第六章方差分析,04.05.2020,.,35,主要内容,第一节方差分析简介第二节单因素方差分析第三节多因素方差分析第四节协方差分析,04.05.2020,.,36,第一节方差分析简介方差分析是英国统计学家R.A.Fisher(1890-1962)在进行试验设计时为解释试验数据而首先引入的。方差分析是一种通过分析样本资料各项差异的来源以检验三个以上总体平均数是否相等的统计方法。目前,方差分析方法在各个领域都得到了广泛应用。方差分析的核心就是方差可分解。即将总变异分解为由随机误差造成的变异(组内SS)与由均数差异造成的变异(组间SS)两个部分。如果后者大于前者,且具有统计学意义,我们将拒绝零假设,即认为总体中均数间存在差异。,04.05.2020,.,37,一、方差分析的作用在诸多领域的数量分析研究中,找到众多影响因素中重要的影响因素是非常重要的。比如:在农业生产中,我们总是希望在尽量少的投入成本下得到较高的农作物产量。这就需要首先分析农作物的产量究竟受到哪些因素的影响。有许多因素会影响农作物的产量,如种子的品种、施肥量、气候、地域等,他们都会给农作物的产量带来或多或少的影响。如果我们能够掌握在众多的影响因素中,哪些因素对农作物的产量起到了主要的、关键性的作用,我们就可以根据实际情况对这些关键因素加以控制。进一步,在掌握关键影响因素,如品种、施肥量因素等之后,我们还要对不同的品种、不同的施肥量条件下的产量进行对比分析,研究究竟哪个品种的产量高,施肥量究竟多少最合适,哪种品种与哪种施肥量搭配最优,等等。在这些分析研究的基础上,我们就可以计算出各个组合方案的成本和收益,并选择最合理的种植方案,主动的在农作物种植过程中对各种影响因素加以准确控制,进而获得最理想的效果。,04.05.2020,.,38,二、相关概念1、影响因素的分类:在所有的影响因素中根据是否可以人为控制可以分为两类,一类是人为可以控制的因素,称为控制因素或控制变量,如种子品种的选定,施肥量的多少;另一类因素是认为很难控制的因素,称为随机因素或随机变量,如气候和地域等影响因素。在很多情况下随机因素指的是实验过程中的抽样误差。2、控制变量的不同水平:控制变量的不同取值或水平,称为控制变量的不同水平。如甲品种、乙品种;10公斤化肥、20公斤化肥、30公斤化肥等。3、观测变量:受控制变量和随机变量影响的变量称为观测变量,如农作物的产量等。方差分析就是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量以及对观测变量有显著影响的各个控制变量其不同水平以及各水平的交互搭配是如何影响观测变量的一种分析方法。,04.05.2020,.,39,三、方差分析的原理方差分析认为,如果控制变量的不同水平对观测变量产生了显著影响,那么它和随机变量共同作用必然使得观测变量值显著变动;反之,如果控制变量的不同水平没有对观测变量产生显著影响,那么观测变量值的变动就不明显,其变动可以归结为随机变量影响造成的。建立在观测变量各总体服从正态分布和同方差的假设之上,方差分析的问题就转化为在控制变量不同水平上的观测变量均值是否存在显著差异的推断问题了。综上所述,方差分析从对观测变量的方差分解入手,通过推断控制变量各水平下各观测变量的均值是否存在显著差异,分析控制变量是否给观测变量带来了显著影响,进而再对控制变量各个水平对观测变量影响的程度进行剖析。根据控制变量的个数可将方差分析分为单因素方差分析、多因素方差分析;根据观测变量的个数可将方差分析分为一元方差分析(单因变量方差分析)和多元方差分析(多因变量方差分析)。,04.05.2020,.,40,四、方差分析过程,1、One-Way过程:单因素简单方差分析过程。在CompareMeans菜单项中,可以进行单因素方差分析、均值多重比较和相对比较。2、GeneralLinearModel(简称GLM)过程:GLM过程由Analyze菜单直接调用。这些过程可以完成简单的多因素方差分析和协方差分析,不但可以分析各因素的主效应,还可以分析各因素间的交互效应。,04.05.2020,.,41,在GeneralLinearModel菜单项下有四项:Univariate:提供一个因变量与一个或多个因素变量的方差分析。Multivariate:可进行多因变量的多因素分析RepeatedMeasure:可进行重复测量方差分析VarianceComponent:可进行方差成分分析。通过计算方差估计值,可以帮助我们分析如何减小方差。,04.05.2020,.,42,第二节单因素方差分析,一、简介单因素方差分析是检验由单一因素影响的多组样本某因变量的均值是否有显著差异的问题。如果各组之间有显著差异,说明这个因素(分类变量)对因变量是有显著影响的,因素的不同水平会影响到因变量的取值。二、完全窗口分析按AnalyzeComparedMeansOne-WayAnova顺序单击。打开One-WayAnova主对话框,如图6-1。,04.05.2020,.,43,选入因变量,可有多个变量,选入分组变量,必须满足只取有限个水平的条件。,图6-1One-WayAnova主对话框,见图6-2,见图6-3,见图6-4,04.05.2020,.,44,(1)Contrasts选项Contrasts选项用来实现先验对比检验和趋势检验。如果进行趋势检验,则应选择Polynomial选项,然后在后面的下拉框中选择趋势检验的方法。其中Linear表示线性趋势检验;Quadratic表示进行二次多项式检验;Cubic表示进行三次多项式检验,4th和5th表示进行四次和五次多项式检验。如果进行先验对比检验,则应在Coefficients后依次输入系数ci,并确保ci0。应注意系数输入的顺序,它将分别与控制变量的水平值相对应。,04.05.2020,.,45,图62Contrasts对话框,对组间平方和进行多项式分解,并在其后的参数框中选定阶数。如一阶:Linear,二阶:Quadratic,三阶:Cubic.最高可达五阶,输入多项式各组均值的系数,输入一个系数单击Add按钮,系数进入下面方框,依次输入各组均值的系数。如果多项式中只包括第一与第四组的均值的系数,必须把第二、第三个系数输入为0。如果只包括第一与第二组的均值,则第三、第四个可不输入。可同时建多个多项式,输入一组后按Next按钮;如果要修改则按Previous按钮,修改后按Change按钮,删除按Remove按钮。,显示每组系数的总和。,04.05.2020,.,46,(2)PostHoc选项PostHoc选项用来实现多重比较检验。提供了18种多重比较检验的方法。其中EqualVariancesAssumed框中的方法适用于各水平方差齐性的情况。在方差分析中,由于其前提所限,应用中多采用EqualVariancesAssumed框中的方法。多重比较检验中,SPSS默认的显著性水平为0.05,可以根据实际情况修改Significancelevel后面的数值以进行调整。,04.05.2020,.,47,图63PostHoc对话框,在此对话框中选择进行多重比较的方法,1.用t检验完成组间成对均值的比较,对多重比较错误率不进行调整2.同上,但通过设置每个检验的误差率来控制整个误差率3.用t检验完成多重配对比较,为多重比较调整显著值,但比2的界限要小4.对所有可能的组合进行同步进入的均值配对比较5.用F检验进行多重比较6.在StudentizedRange分布下进行多重比较7.用StudentizedRange分布进行所有各组均值间的配对比较8.用StudentizedRange统计量进行所有组间均值的配对比较,用所有配对比较集合的误差率作为试验误差率9.同8,但其临界值是TUKEY和S-N-K的相应值的平均值10.进行配对比较时,使用的逐步顺序与Student-Newman-Keuls检验的顺序一样,但并不是给每个检验设定一个误差率,而是给所有检验的误差率设定一个临界值11.用Studentized最大系数进行比较检验和范围检验12.用Studentized最大系数进行配对比较检验13.用Studentized最大系数进行比较检验,使用贝叶斯逼近14.用t检验进行配对比较,1.用t检验进行配对比较,2.用Studentized最大系数进行配对比较检验3.同上,这种方法有时比较自由4.用StudentizedRange统计量进行配对比较检验,规定显著性水平,默认为0.05,04.05.2020,.,48,(3)Option选项Option选项用来对方差分析的前提条件进行检验,并可输出其他相关统计量和对缺失数据进行处理。Homogeneityofvariancetest选项实现方差齐性检验;Descriptive选项输出观测变量的基本描述统计量;Brown-Forsythe、Welch选项可计算其统计量以检验各组均值的相等性,当方差齐性不成立时应选择使用这两个统计量而不是F统计量。MeansPlot选项输出各水平下观测变量均值的折线图;MissingValues框中提供了两种缺失数据的处理方式。,04.05.2020,.,49,图64Options对话框,选择缺失值的处置方式:在检验变量中含有缺失值的观测将不被计算在任何一个变量中含有缺失值的观测都将不被计算,规定输出的统计量:输出描述统计量,包括观测量数目,均值,最小值,最大值,标准差,标准误差,各组中每个因变量均值的95%的置信区间用Levene检验进行方差一致性检验,输出均数分布图,三、例题分析例106-1某灯泡厂用四种不同配料方案制成的灯丝,生产了四批灯泡。每批灯泡中随机抽取若干个灯泡测其使用寿命(单位:小时),数据如表6-1,求四种灯丝的灯泡的使用寿命有无显著差异。,04.05.2020,.,50,表6-1灯泡使用寿命,在该例中,设灯泡的使用寿命为因变量,灯丝的配料为因子,四种配料方案为四水平,为单因子四水平的实验。(数据文件:06-1灯泡寿命.sav),04.05.2020,.,51,1、不使用选择项操作步骤1)定义两个变量:Filament变量,取值1、2、3、4分别代表甲、乙、丙、丁,标签为“灯丝”Hours变量其值为灯泡的使用寿命,标签为“灯泡使用寿命”2)按AnalyzeComparedMeansOne-WayAnova顺序打开“单因素分析”主对话框。3)从源变量框中选取hours进入DependentList框中;选取filament变量进入Factor框中,单击“OK”运行。4)输出结果及分析,04.05.2020,.,52,表6-2灯泡使用寿命的单因素方差分析结果,表6-2说明:第一列:方差来源;第二列:离差平方和;第三列:自由度;第四列:均方;第五列:F值;第六列:F统计量的P值。,2、使用选择项操作步骤1)定义变量和选取变量同1(第1-3步)的操作步骤,04.05.2020,.,53,2)在主对话框中单击“Contrast”,在Contrast对话框中选择多项式比较,选择一次多项式比较各组均值,共指定两组多项式系数:系数依次为1、-1、-1、1,这是检验灯丝对灯泡使用寿命的影响及甲、丁效应和与乙、丙效应和是否有显著差异系数依次为1、-1、1、-1,这是检验灯丝对灯泡使用寿命的影响及甲、丙效应和与乙、丁效应和是否有显著差异3)打开PostHocMultipleComparisons对话框,选择多重比较:在EqualVarianceAssumed栏中选择LSD和Duncan在EqualVarianceNotAssumed栏中选择TamhanesT2,04.05.2020,.,54,4)打开Options对话框,输出统计量选择项。选中Descriptive复选框,输出描述性统计量。选中Homogeneity-of-variance复选框,用Levene检验进行方差一致性检验选中Meansplot复选框,输出均数分布图。选中Excludecasesanalysisbyanalysis复选框,不计算在检验变量中含有缺失值的观测。5)单击OK,提交运行输出结果及分析,04.05.2020,.,55,表6-3描述性统计量表,表6-3为描述性统计量,表6-4方差一致性检验,表6-4为方差一致性检验结果,其显著值P大于0.05,说明各组的方差在0.05的显著水平上没有显著性差异,即方差具有一致性。,04.05.2020,.,56,表6-5单因素方差分析结构,表6-5是单因素方差分析结果。与表6-3比较,增加3行:线性未加权项、线性加权项、组间平方和与线性加权项平方和的差。,表6-6对比系数,表6-6列举了两组多项式的系数。,04.05.2020,.,57,表6-7LSD法和TamhanesT2法进行均值多重比较结果,从表可看出,各均值间没有显著差异。,04.05.2020,.,58,表6-8Duncan法进行均值多重比较结果,各列的内容:第一列:按均值由小到大的顺序列出灯丝种类。第二列:各组样本容量。第三列:在显著性水平0.05下的比较结果,同一列中均值无显著差异。由于各组样本容量不相等,计算均值用的是调和平均数的样本量6.034。表中最后一行列出P值为0.085,大于0.05,说明各组均值具有一致性。,04.05.2020,.,59,图6-5均值分布图,图6-5是均值分布图,以灯丝为横轴,以灯泡使用的平均时间为纵轴,从此图上可看出各组均值的分布。,04.05.2020,.,60,是对一个独立变量是否受多个因素或变量影响而进行的方差分析。SPSS调用Univariate过程,检验多个因素的不同水平组合之间因变量均值是否有显著差异的问题。Univariate过程可以分析每一个因素的作用(主效应),也可以分析因素之间的交互作用(交互效应)。可以进行协方差分析,以及各因素变量与协变量之间的交互作用。Univariate过程要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差相同,也可以通过方差齐次性检验选择均值比较结果。因变量和协变量必须是数值型变量,协变量与因变量彼此不独立。因素变量是分类变量,可以是数值型和字符型。固定因素变量(FixedFactor)是反应处理的因素。随机因素是随机设置的因素,是在确定模型时需要考虑会对实验有影响的因素,对实验结果影响的大小可以通过方差成分分析确定。,第三节多因素方差分析,04.05.2020,.,61,一、多因素方差分析的基本思想1、定义:多因素方差分析用来研究两个及两个以上控制变量的不同水平是否对观测变量产生了显著影响。多因素方差分析不仅能够分析多个因素对观测变量的独立影响,还能够分析多个控制变量的交互作用能否对观测变量产生显著影响。例如:分析不同品种、不同施肥量是否给农作物的产量产生显著影响,并进一步研究哪种品种和哪种施肥量是提高农作物产量的最优组合。2、观测变量方差的分解将观测变量总的离差平方和分解为:其中,SST为观测变量的总离差平方和;SSA、SSB分别为控制变量A、B独立作用引起的变差;SSAB为控制变量A、B两两交互作用引起的变差;SSE为随机因素引起的变差。,04.05.2020,.,62,其中:,04.05.2020,.,63,交互作用的理解,04.05.2020,.,64,3、比较观测变量总离差平方和各部分的比例在观测变量总离差平方和中,如果SSA所占比例较大,则说明控制变量A是引起观测变量的变动主要因素之一,观测变量的变动可以部分的由控制变量A来解释,即控制变量A给观测变量带来了显著影响。对SSB、SSAB同理。,04.05.2020,.,65,二、多因素方差分析的基本步骤1、提出原假设:各控制变量不同水平下观测变量各总体的均值无显著差异,控制变量交互作用对观测变量无显著影响。2、计算检验统计量和概率P值。3、给定显著性水平与p值做比较:如果p值小于显著性水平,则应该拒绝原假设,反之就不能拒绝原假设。,04.05.2020,.,66,三、多因素方差分析的基本操作步骤在利用SPSS进行多因素方差分析时,应首先将各个控制变量以及观测变量分别定义成多个SPSS变量,并组织好数据再进行分析。1、选择菜单AnalyzeGeneralLinearModelUnivariate,出现主窗口。2、把观测变量指定到DependentVariable框中。3、把固定效应的控制变量指定到FixedFactor(s)框中,把随机效应的控制变量指定到RandomFactor(s)框中。至此,SPSS将自动建立多因素方差分析的饱和模型,并计算各检验统计量的观测值和对应的概率p值,并将结果显示到输出窗口中。,04.05.2020,.,67,04.05.2020,.,68,四、多因素方差分析应用举例06-2利用某企业不同广告形式在不同地区的广告效果(销售额)进行评估的数据,通过多因素方差分析方法对广告形式、地区、广告形式和地区的交互作用给销售额的影响进行分析,进而为制订广告和地区的最优宣传组合方案提供依据。这里,以广告形式和地区为控制变量,销售额为观测变量,建立固定效应的饱和模型。零假设为:不同广告形式没有对销售额产生显著影响;不同地区的销售额没有显著差异;广告形式和地区对销售额没有产生显著的交互影响。,04.05.2020,.,69,五、多因素方差分析的进一步分析1、多因素方差分析的非饱和模型在饱和模型中,观测变量的总变差被分解为控制变量独立作用、控制变量交互作用及随机误差三部分(SST=SSA+SSB+SSAB+SSE)。如果研究发现,控制变量的某阶交互作用没有给观测变量产生显著影响,那么可以尝试建立非饱和模型。区别在于将饱和模型中某些部分合并到SSE中,例如两因素非饱和模型为:SST=SSA+SSB+SSE,04.05.2020,.,70,2、均值检验在SPSS中,利用多因素方差分析功能还能够对各个控制变量不同水平下的均值是否存在显著差异进行比较,实现方式有两种:多重比较检验(PostHoc)和对比检验(Contrast)。多重比较检验的方法与单因素方差分析类似,不再重复。对比检验采用的是单样本t检验的方法。,04.05.2020,.,71,检验值可以指定一下几种:None:SPSS默认,不做对比分析;Deviation:表示以观测变量的总体均值为标准,比较各水平上观测变量的均值是否有显著差异;Simple:表示以第一水平或最后一个水平上的观测变量均值为标准,比较各水平上的观测变量均值是否有显著差异;Difference:表示将各水平上观测变量均值与其前一个水平上的观测变量均值做比较;Helmert:表示将各水平上观测变量均值与其后一个水平上的观测变量均值做比较。,04.05.2020,.,72,3、控制变量交互作用的图形分析控制变量的交互作用可以通过图形直观分析。如果控制变量之间无交互作用,各水平对应的直线是近于平行的;如果控制变量间存在交互作用,各水平对应的直线会相互交叉。4、模型分析这里模型分析的主要任务有三个:第一,利用多因素方差分析模型计算观测变量预测值;第二,计算各种残差值,评价模型对数据的拟合程度;第三,对数据中的异常点进行诊断。,04.05.2020,.,73,六、多因素方差分析中进一步分析的操作步骤1、建立非饱和模型的操作SPSS多因素方差分析中默认建立的是饱和模型。如果希望建立非饱和模型,则应在主窗口中单击Model按钮,出现窗口:,04.05.2020,.,74,默认的选项是Fullfactorial,表示饱和模型,此时Factors&Covariates框、Model框以及BuildTerm(s)下拉框均呈不可用状态。如果选择Custom项,则表示建立非饱和模型,且Factors&Covariates框、Model框以及BuildTerm(s)下拉框均变为可用状态。此时便可自定义非饱和模型中的数据项。其中,Interaction为交互作用;Maineffects为主效应;All2-way、All3-way等表示二阶、三阶或更高阶交互作用。,04.05.2020,.,75,2、均值比较的操作如果通过多因素方差分析得知某控制变量的不同水平对观测变量产生显著影响,进一步可对各水平间的均值进行比较。如果采用多重比较检验方法,则单击PostHoc按钮,选择合适的多重比较检验方法。,04.05.2020,.,76,如果采用对比检验方法,则单击Contrasts按钮,默认是不进行对比检验(显示如x1(None);如果进行对比检验,可展开Contrast后的下拉框,指定对比检验的检验值,并单击Change按钮完成指定。,04.05.2020,.,77,3、控制变量交互作用图形分析的操作如果希望通过图形直观判断控制变量间是否存在交互作用,则应在主窗口单击Plots按钮。首先选择一个控制变量作为交互图形中的横轴,并将其选择到HorizontalAxis框中;其次,指定在交互图中各直线代表的是哪个控制变量的不同水平,并将其选择到SeparatedLines框中;最后,如果控制变量有三个,由于交互作用图只能反映两控制变量的交互情况,此时第三个变量只能选入SeparatePlots框中,第三个变量有几个水平便绘制出几张交互图。,04.05.2020,.,78,04.05.2020,.,79,4、模型分析的操作SPSS多因素方差模型建立完成后,可以在主窗口中单击Save按钮对模型进行分析,并将分析结果以变量的形式存入SPSS数据编辑窗口中。其中,PredictedValues框中的选项用来计算模型的预测值;Residuals框中的各选项用来计算各种残差;Diagnostics框实现异常值的诊断。各选项具体含义同回归分析。,04.05.2020,.,80,七、多因素方差分析进一步分析应用举例在前面的应用举例中对广告形式、地区对销售额的影响进行了多因素方差分析,建立了饱和模型。分析可知,广告形式和地区的交互作用不显著,可以进一步

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论