




已阅读5页,还剩70页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
单因素方差分析,(One-WayANOVA),1,1、问题与数据,有研究者认为,体力活动较多的人能更好地应对职场的压力。为了验证这一理论,某研究招募了31名受试者,测量了他们每周进行体力活动的时间(分钟),以及应对职场压力的能力。根据体力活动的时间数,受试者被分为4组:久坐组、低、中、高体力活动组,变量名为group。利用Likert量表调查的总得分来评估应对职场压力的能力,分数越高,表明应对职场压力的能力越强,变量名为coping_stress。应对职场压力的能力,可以简写为CWWS得分。研究者想知道,CWWS得分的高低是否取决于体力活动的时间,即coping_stress变量的平均得分是否随着group变量的不同而不同(部分数据如右图),2,2、对问题的分析,研究者想分析不同group间的coping_stress得分差异,可以采用单因素方差分析。单因素方差分析适用于2种类型的研究设计:1)判断3个及以上独立的组间均数是否存在差异;2)判断前后变化的差值是否存在差异。使用单因素方差分析时,需要考虑6个假设。假设1:因变量为连续变量;假设2:有一个包含2个及以上分类、且组别间相互独立的自变量;假设3:每组间和组内的观测值相互独立;假设4:每组内没有明显异常值;假设5:每组内因变量符合正态分布;假设6:进行方差齐性检验,观察每组的方差是否相等。那么,进行单因素方差分析时,如何考虑和处理这6项假设呢?,3,3、思维导图,4,5,4、对假设的判断,假设1:因变量为连续变量;假设2:有一个包含2个及以上分类、且组别间相独立的自变量;假设3:每组间及组内的观测值相互独立。和研究设计有关,需根据实际情况判断。,假设4:每组内没有明显异常值。如果某个组别中的某些因变量取值和其他值相比特别大或者特别小,则称之为异常值。异常值会影响该组的均数和标准差,因此会对最终的统计检验结果产生很大的负面影响。对于小样本研究,异常值的影响尤其显著,必须检查每组内是否存在明显异常值。以下将说明如何在SPSS中利用箱线图(Boxplots)检查是否存在异常值,以及存在异常值时的几种处理方法。,6,(1)在主菜单点击AnalyzeDescriptiveStatisticsExplore.:出现右图Explore对话框:,利用箱线图(Boxplots)检查是否存在异常值,以及存在异常值时的几种处理方法,7,(2)把因变量coping_stress送入DependentList框中,把自变量group送入FactorList框中:,(3)点击Plots.,出现Explore:Plots对话框:,8,(4)在Boxplots模块内保留系统默认选项Factorlevelstogether,在Descriptive模块内取消选择Stem-and-leaf,在下方勾选Normalityplotswithtests(执行Shapiro-Wilks检验):,点击Continue,返回Explore对话框。(5)在Display模块内点击Plots:,如果使用偏度和峰度(skewnessandkurtosis)进行正态性判断,则保留Display模块内的默认选项Both或者选择Statistics。,(6)点击OK,输出结果。,9,根据如下输出的箱线图,判断每个组别内是否存在异常值。,10,SPSS中将距离箱子边缘超过1.5倍箱身长度的数据点定义为异常值,以圆点表示;将距离箱子边缘超过3倍箱身长度的数据点定义为极端值(极端异常值),以星号(*)表示。为容易识别,在DataView窗口异常值均用其所在行数标出。本例数据箱线图无圆点或星号,因此无异常值。假如数据中存在异常值和极端异常值,其箱线图如右:,箱线图是一种比较简单和流行的异常值检验方法,当然同样存在一些更为复杂的方法,这里不过多介绍。,11,如何处理数据中存在的异常值,异常值的处理方法分为2种:(1)保留异常值:1)采用非参数Kruskal-WallisH检验;2)用非最极端的值来代替极端异常值(如用第二大的值代替);3)因变量转换成其他形式;4)将异常值纳入分析,并坚信其对结果不会产生实质影响。(2)剔除异常值:直接删除异常值很简单,但却是没有办法的办法。当我们需要删掉异常值时,应报告异常值大小及其对结果的影响,最好分别报告删除异常值前后的结果。而且,应该考虑有异常值的个体是否符合研究的纳入标准。如果其不属于合格的研究对象,应将其剔除,否则会影响结果的推论。,导致数据中存在异常值的原因有3种:(1)数据录入错误:首先应该考虑异常值是否由于数据录入错误所致。如果是,用正确值进行替换并重新进行检验;(2)测量误差:如果不是由于数据录入错误,接下来考虑是否因为测量误差导致(如仪器故障或超过量程);(3)真实的异常值:如果以上两种原因都不是,那最有可能是一种真实的异常数据。这种异常值不好处理,但也没有理由将其当作无效值看待。目前它的处理方法比较有争议,尚没有一种特别推荐的方法。需要注意的是,如果存在多个异常值,应先把最极端的异常值去掉后,重新检查异常值情况。这是因为有时最极端异常值去掉后,其他异常值可能会回归正常。,12,如果样本量较小(One-WayANOVA:,5、SPSS操作,出现One-WayANOVA对话框:,5.1单因素方差分析(ONEWAYprocedure)事后两两比较(posthoctest),15,(2)把因变量coping_stress送入DependentList框中,自变量group送入Factor框中:,(3)点击Options,出现One-WayANOVA:Options对话框:,16,(4)在Statistics模块勾选Descriptive,Homogeneityofvariancetest和Welch,同时勾选Meansplot:,(5)点击Continue,返回One-WayANOVA对话框。,17,(6)点击PostHoc,出现One-WayANOVA:PostHocMultipleComparisons对话框:,对话框根据方差齐性检验的假设是否满足,分为2个主要区域:,18,(7)在EqualVariancesAssumed模块内勾选Tukey,在EqualVariancesNotAssumed模块内勾选Games-Howell:,(8)可以在Significancelevel框中修改显著性水平的大小(系统默认为0.05,表示当PGeneralLinearModelUnivariate.,5.2一般线性模型(GLMprocedure)求效应量(偏2),20,(2)把因变量coping_stress送入DependentList框中,自变量group送入FixedFactor(s)框中,(3)点击Options.,出现Univariate:Options对话框:,21,(4)在Display模块内勾选Estimatesofeffectsize:,(6)点击OK,输出结果。,(5)点击Continue,返回Univariate对话框。,22,(1)点击AnalyzeGeneralLinearModelUnivariate.,5.3一般线性模型(GLMprocedure)自定义组间比较(customcontrasts),如果只关心特定组别间的差异,你需要知道如何进行自定义比较(customcontrasts),以及如何对多重比较结果进行调整,这就要用到SPSS软件中的SyntaxEditor窗口编写相应程序语句。当满足方差齐性条件时,推荐采用GLM程序进行自定义组间比较。,23,(2)把因变量coping_stress送入DependentList框中,自变量group送入FixedFactor(s)框中,出现Univariate对话框:,24,(3)点击Paste,出现IBMSPSSStatisticsSyntaxEditor窗口:,25,(4)在/PRINT和/CRITERIA两行中间,输入/LMATRIX=group-1100,本例中久坐组系数为-1,“低”体力活动组系数为1,其他组别均为0,则是要比较久坐组和“低”体力活动组的CWWS得分差异,看二者的平均CWWS得分差值是否为0(用“低”体力活动组得分减去久坐组得分,即系数为1的组别减去系数为-1的组别,以系数为-1的组别为参照组,系数赋值的正负与研究设计和研究假设有关)。,注:自定义比较包括了简单比较(simplecontrasts)和复合比较(complexcontrasts)。简单比较为只比较自变量某两个组别间的差异,需要建立线性比较函数(linearcontrast,)。它包含一系列系数和每个组别对应的均数,系数取值只能为1,-1,0。我们把要比较的两组的系数分别赋值为1和-1,其他不比较的组别系数赋值为0。,/LMATRIX=旨在告诉SPSS我们要做一个自定义假设;group表示将要进行比较的自变量组别;-1100表示要进行比较的系数,系数的顺序和SPSS里输入的组别顺序有关:这里从左到右(-1100)分别对应着久坐组、“低”、“中”和“高”体力活动组,表示将“低”体力活动组与久坐组进行比较。,26,(5)用/LMATRIX指令增加另外2种比较:/LMATRIX=group-11/31/31/3/LMATRIX=group-1/2-1/21/21/2,本例中,/LMATRIX=group-11/31/31/3表示“低”、“中”和“高”体力活动组的组合整体与久坐组CWWS得分差异的比较,/LMATRIX=group-1/2-1/21/21/2表示“中”和“高”体力活动组的组合与“低”体力活动组和久坐组组合的比较。,注:复合比较为比较自变量超过2个组别的组合间的差异,如比较B组与C、D两组的组合间的差异,或C、D两组间的组合与A、D两组间组合的差异。同样采用线性比较函数的方法,某组合的系数赋值为1或-1除以组合内的组数,但是要保证要比较的组间组合与另一组(组合)的所有系数加起来为0,系数赋值的正负与研究设计和研究假设有关。,27,(6)多重比较的校正,接下来,我们需要校正显著性水平(),通常也可以校正每次比较的P值和可信区间,得到调整后P值和联合可信区间(simultaneousconfidenceintervals)。我们首先采用Bonferroni方法对显著性水平进行校正,公式如下:调整后=调整前比较的次数本例中我们需要进行3次比较,则调整后=0.053=0.01667。,(7)箭头标注处为SPSS软件默认的显著性水平=0.05:/CRITERIA=ALPHA(.05),28,(8)我们将其改为调整后的显著性水平=0.1667:/CRITERIA=ALPHA(.01667),29,(9)在菜单栏点击RunAll:,30,(1)点击AnalyzeCompareMeansOne-WayANOVA:,出现One-WayANOVA对话框:,5.4单因素方差分析(ONEWAYprocedure)自定义组间比较(customcontrasts),31,(2)把因变量coping_stress送入DependentList框中,自变量group送入Factor框中:,(3)点击Contrasts,出现One-WayANOVA:Contrasts对话框:,32,(4)在Coefficients模块中输入第一组比较(如-1100)的第一个系数,点击Add:,(5)在Coefficients模块中输入第一组比较(如-1100)的其他系数,点击Add:,33,(6)点击Next,输入新的自定义比较组,此时下图中红框区域内将变为Contrast2of2:,(7)按照之前的方式输入第二个比较组(如-11/31/31/3):,注:Coefficients模块中无法输入分数,最多只能输入3位小数的数值来代替。因此本例中输入0.333代替1/3,但是由于最后总和不等于1(0.3333=0.999),因此我们将在后面的第(11)(12)步中进行调整。,34,(8)继续点击Next,输入新的自定义比较组,此时下图中红框区域内将变为Contrast3of3:,(9)按照之前的方式输入第三个比较组(如-1/2-1/21/21/2):,35,(10)点击Continue,返回One-WayANOVA对话框。,(11)点击Paste,进入IBMSPSSStatisticsSyntaxEditor窗口:,36,(12)手动增加小数位数,如把小数位数从3位改为10位(0.333改为0.3333333333):,37,(13)在菜单栏中点击RunAll:,38,6、结果解释,SPSS会给出自变量每个组别的基本情况统计表,以便对数据有个初步的了解:,6.1基本描述,各列变量含义对应如下:,基本情况统计表中每一行均代表着group(自变量)不同组别的coping_stress(因变量)统计结果。可以由此判断:1)哪两组间例数(N)相同;2)哪些组的平均得分(Mean)较高或较低;3)是否每组的变异情况相同(Std.Deviation)。,39,本例中,各组的样本量不相等(范围7-9),并且随着体力活动水平的增加(即自变量group),应对职场压力的能力有上升趋势(CWWS得分,即因变量coping_stress)。例如从“久坐组”到“高”体力活动组,平均得分从4.1513增加为7.5054,但是各组标准差明显不同(范围0.77137-1.69131)。不同体力活动组别的CWWS得分见右图:,40,单因素方差分析假设不同组别的因变量变异相等。如果不相等,则会增加犯I型错误的概率。使用Levenes方差齐性检验来检验方差齐的假设,检验结果见如下TestofHomogeneityofVariances表格:,6.2方差齐性检验结果,Sig.一列数值代表了检验的P值。如果Levenes检验的差异具有统计学意义(P0.05),则不能拒绝方差齐的假设。本例中,P=0.120,表示各组方差相等。,41,在满足方差齐性假设的前提下,单因素方差分析结果如下:,6.3满足方差齐性假设的结果,如果单因素方差分析显示差异具有统计学意义(P0.05,则表示各组间均数差异无统计学意义。本例中,P值显示为0.000,不代表P值实际为0,而是表示P0.05,差异无统计学意义。,47,我们再来解读一下标黄的“高”体力活动组和久坐组比较结果:,可以看出,“高”体力活动组的CWWS平均分比久坐组高3.35409分,P=0.001。我们可以报告:“高”体力活动组的平均CWWS得分(7.51.2)比久坐组(4.20.8)高3.4(95%CI:1.35.4),差异具有统计学意义(P=0.001)。,48,目前许多杂志要求除了列出上述结果,还要报告效应量。,因此,本例的2计算结果如下:,公式里的各指标见ANOVA表格:,计算单因素方差分析的效应量有很多方法,比较推荐的是计算2,公式如下:,49,结果显示,偏2=0.480。偏2表示控制了其他自变量后,因变量被某一自变量解释的百分比(单因素方差分析时,即自变量对因变量的解释程度),代表样本的效应量;与偏2相比,2还考虑了抽样误差,可以提供相对准确的总体效应量的估计。,同样地,我们也可以报告偏2,在TestsofBetween-SubjectsEffects表格中group一行,列名为PartialEtaSquared(已标黄):,50,当方差不齐时,必须使用校正的单因素方差分析。本例采用Welch方差分析,结果见RobustTestsofEqualityofMeans表格:,6.5不满足方差齐性假设的结果,可以报告:不同水平的体力活动组间,应对职场压力的能力(CWWS得分)差异具有统计学意义,WelchF(3,14.574)=14.821,P0.0005。当差异无统计学意义时,我们也可以报告:不同水平的体力活动组间,应对职场压力的能力(CWWS得分)差异无统计学意义,WelchF(3,12.325)=1.316,P=0.523。,51,结果叙述里的指标与RobustTestsofEqualityofMeans表格对应如下:,每部分的含义如下:,52,当方差不齐,而且关心所有组间的两两比较时,推荐采用Games-Howell检验。Games-Howell检验不仅提供了每两个组间比较的P值,也给出了均数差值的可信区间。本例结果见如下MultipleComparisons表格:,6.6Games-Howell检验,Games-Howell检验的结果解释与Tukey检验相同,这里不再赘述。大家可以参阅第4部分Tukey检验结果的解读。,53,当我们在GLM程序中的syntax编辑器输入了自定义比较的组别后,我们会得到如下ContrastResults(KMatrix)表格。此表为久坐组和“低”体力活动组比较的结果,与我们当时输入的比较顺序对应一致。,6.7当方差齐时,自定义组间比较的结果,54,首先,我们来看ContrastEstimate、LowerBound和UpperBound这三行的结果。ContrastEstimate一行结果为1.728,这是所比较的2组间的均数差值,见下图:,均数差值的95%(联合)CI为-0.0763.531。但是,我们注意到最后一行写的是98.333%CIfordifference,和我们表述的95%CI略有差异。这是因为为了使三次比较的总体CI达到95%,每次比较的CI实际会高于95%。同时,由于之前为了计算联合CI调整了显著水平,并没有调整P值,因此Sig.=0.021为未调整的P值(调整后P值=报告P值比较次数,本例为0.0213=0.063)。如果调整后P值0.05,两组差异无统计学意义。,55,第二组比较为久坐组与非久坐组(“低”、“中”、“高”体力活动组的组合)均数的比较(/LMATRIX=group-11/31/31/3),即复合比较的第一组,见下图:,相应结果见如下ContrastResults(KMatrix)表格:,ContrastEstimate一行结果为2.684,计算方法为2.684=(5.879+7.123+7.505)/3-4.151。其他结果解释和P值的调整方法与第一组相同。本次比较调整后P值=0.0004,差异具有统计学意义。,56,第三组比较为2个高水平体力活动组(“中”、“高”体力活动组的组合)与2个低体力活动组(久坐组、“低”体力活动组的组合)均数的比较(/LMATRIX=group-1/2-1/21/21/2),即复合比较的第二组,ContrastResults(KMatrix)表格结果见下图:,ContrastEstimate一行结果为2.299,计算方法为2.299=(7.123+7.505)/2-(5.879+4.151)/2=7.314-5.015。其他结果解释和P值的调整方法与之前相同。本次比较调整后P值=0.0003,差异具有统计学意义。,注:另一种校正多重比较的方法是将未调整的P值与调整后的显著性水平进行比较。本例要进行3次比较,故调整后=0.05/3=0.01667。如果未调整P值0.01667,则差异具有统计学意义。,57,当方差不齐时,我们在SPSS软件中使用ONEWAYANOVA程序来进行自定义组间比较。首先,我们看ContrastCoefficients表格:,6.8当方差不齐时,自定义组间比较的结果,该表格列出了我们之前输入的每个自定义比较组的各组别系数。,ContrastTests表格分为2部分:Assumeequalvariances(方差齐)和Doesnotassumeequalvariances(方差不齐)。我们来看方差不齐的结果,第一组比较(久坐组和“低”体力活动组)的结果,见下图标黄的第“1”行:,58,ContrastTests表格分为2部分:Assumeequalvariances(方差齐)和Doesnotassumeequalvariances(方差不齐)。我们来看方差不齐的结果,第一组比较(久坐组和“低”体力活动组)的结果,见下图标黄的第“1”行:,ValueofContrast一列结果为1.728,这是所比较的2组间的均数差值,见左图:,两组均数差值的标准误(Std.Error)为0.635,P(Sig.(2-tailed))=0.019。单独看这组自定义的比较(不考虑其他两组自定义的比较),如果P0.05,两组差异无统计学意义。,59,第二组比较为久坐组与非久坐组(“低”、“中”、“高”体力活动组的组合)均数的比较,即复合比较的第一组,结果见下图标黄的第“2”行:,ValueofContrast一列结果为2.684,这是所比较的2组间的均数差值,其标准误(Std.Error)为0.423,P(Sig.(2-tailed))0.05);经Levenes方差齐性检验,各组数据方差不齐(P=0.002)。数据以均数标准差的形式表示。CWWS得分按照从久坐组(4.20.8)、“低”体力活动组(5.91.7)、“中”体力活动组(7.11.6)、“高”体力活动组(7.51.2)的顺序增加,但是不同体力活动组间的CWWS得分差异无统计学意义,WelchF(3,12.325)=1.316,P=0.523。,7.2当方差不齐,方差分析显示组间差异无统计学意义时,63,采用单因素方差分析方法,判断不同水平体力活动组间的应对职场压力的能力(CWWS得分)是否有差异。受试者被分为4组:久坐组(7人)、“低”体力活动组(9人)、“中”体力活动组(8人)、“高”体力活动组(7人)。经箱线图判断,数据无异常值;经Shapiro-Wilk检验,各组
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《航空电气设备维修》试卷1及答案
- 初二数学月考试卷及答案
- 包头东河中考试卷及答案
- 新质生产力的核心资源有哪些
- 新质生产力公考解读
- 构建和谐医患关系论文
- 媒体视角的新质生产力解读
- 有关元旦晚会活动策划方案模板
- 学校老师个人年度教学工作方案怎么写
- 2025年医学信息学技术应用能力检测答案及解析
- 【灼鼎咨询】2024年自动驾驶行业知识报告(智能驾驶、新能源汽车、NOA)
- 检维修管理制度
- 服务业绿色低碳发展
- 教材研讨问题参考答案(课件)四年级上册科学教科版
- 2024年企业现场管理5S培训课件
- 综合测试01 识记默写(高考背诵课内分篇训练)高考语文一轮复习考点帮(北京专用)
- 北京导游资格考试外语口试题四
- 高中数学必修一第一、二章综合测试卷(含解析)
- 1.3集合的基本运算(第1课时)课件高一上学期数学人教A版
- 《学前儿童卫生与保健》高职全套教学课件
- 第4课 中国历代变法和改革 学案
评论
0/150
提交评论