二语习得实证研究第9章_第1页
二语习得实证研究第9章_第2页
二语习得实证研究第9章_第3页
二语习得实证研究第9章_第4页
二语习得实证研究第9章_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Chapter9t-检验与方差分析(t-TestandVarianceAnalysis)9・1t-检验定义两组平均数的差异检验。两个样本的平均数差异检验;单一样本与总体的平均数差异检验t分布t分布与正态分布的相似之处:t分布基线上的t值从-g+°°;从平均数等于0处,左侧曲线以平均数处为最高向两侧逐渐下降,尾部无限伸延,永不与基线相接,呈单峰对称形。t分布与正态分布的区别之处:t分布随自由度(df=n-1)的变化呈一簇分布;t分布的峰狭窄尖峭,在基线上的分布范围广泛。自由度越小,分布范围越广泛。当自由度逐渐增大时,t分布逐渐接近正态分布。两个样本平均数差异显著性检验的原理首先对两个样本所对应的总体平均数之间提出没有差异的零假设(即H0:p1-p2=0)和备择假设(H1:p1-p2工0),然后以两个样本平均数差的抽样分布(即以两个总体平均数之差等于零为中心的一切可能样本平均数之差的概率分布)为理论依据,来考察两个样本平均数之差是否来自于两个总体平均数之差为零的总体,也就是要看样本平均数之差在其抽样分布上出现的概率如何。当样本平均数之差较大,大到在其抽样分布上出现的概率足够小时,就可以作为从实际可能性上否定零假设的理由。这就意味着,两样本平均数之差不是来自于两个总体平均数之差为零的总体,两个总体平均数之间确实有本质差异,两个样本平均数之差是由两个相应总体平均数不同所致。如果两样本平均数之差较小,在其抽样分布上出现的概率较大,那么,应保留零假设而拒绝备择假设。这意味着,两样本平均数之差是来自两个总体平均数之差为零的总体,也可以说,两个样本平均数是来自同一个总体或来自平均数相同的两个总体,样本平均数之差是由于抽样误差所致。t-检验的假设前提(AssumptionsUnderlyingthetTest)抽取样本的总体呈正态分布。(Thepopulation(orpopulations)thesampledataaredrawnfromisnormallydistributed.)数据随机从一个总体中通过样本抽取。(Thedataarerandomlysampledfromalargerpopulation.Thesampledataareusedtogeneralizebacktoapopulationoforigin.)因变量必须是连续性数据,即定距变量或定比变量(Thedependentmeasuresinvolvedmustbecontinuous,i.e.theymustbebasedoneitherintervalorratioscales.)。t-检验的三种形式(Threevariationsofthettest)单一样本t-检验(Single-orone-samplettest)两独立样本t-检验(Thettestforindependentgroups)两配对样本t-检验(Thettestforpair-samples)单一样本t-检验定义:SPSS单样本t-检验是检验某个变量的总体均值和某指定值之间是否存在显著差异,统计的前提是样本总体服从正态分布。也就是说单样本本身无法比较,进行的是其均数与已知总体均数间的比较。SPSS实现过程(ProcedureofASingle-SampletTestonSPSS)两独立样本t-检验定义:独立样本是指两个样本之间彼此没有任何关联,两个独立样本各自接受相同的测量。主要目的是了解两个样本之间是否有显著差异存在。这个检验的前提除服从t-检验的整体要求外,还另有如下前提:(1)两个样本互相独立,即从一总体中抽取一批样本对从另一总体中抽取一批样本没有任何影响,两个样本个案数目可以不同,个案顺序可以随意调整。方差齐性与方差不齐性有不同的自由度和t值(2)样本来自的两个总体应该呈正态分布。两独立样本t检验例1两独立样本t-检验例2两配对样本t-检验定义:两配对样本t-检验是根据样本数据对样本来自的两配对总体的均值是否有显著性差异进行推断。一般用于研究同一研究对象(或两配对对象)分别给予两种不同处理的效果比较,以及同一研究对象(或两配对对象)处理前后的效果比较。前者推断两种效果有无差别,后者推断某种处理是否有效。除服从t-检验的整体前提外,两配对样本t-检验还有如下要求:两个样本应是配对的。两个样本的观察数目相同。两样本的顺序不能随意改变。两配对样本t-检验(paired-samplesttest)例9.1.5t-检验显著性检验的效应幅度指数t-检验不能回答的一个问题是:两样本差异的效果强度。我们也许认为,差异越显著,p值就越低,因而差异效应幅度就越强。但这是不正确的。显著性只是部分地由平均数差异决定,另一部分由样本容量决定。当样本量很大时,即使平均数差异较小,也会有统计上的显著差异。所以我们既要进行t-检验,也要计算效应幅度指数。遗憾的是,SPSS没有在t-检验运算结果中提供差异的效应幅度指数值。计算效应幅度指数的方法很多,在t-检验中,我们使用Cohen‘sd公式计算。t-检验效应幅度指数值(effectsize)0一0.2aweakeffect效果弱0.21-0.5amodesteffect效果弱强(尚可)0.51一1.00amoderateeffect效果中强>1.00astrongeffect效果强练习题1用SPSS进行t-检验操作练习检验“练习用数据”中男女生的英语测试总分有无显著差异,写作成绩有无显著差异。如果该地区英语测试平均分为56.23分,检验样本的平均分是否与总体平均分差异显著且效应幅度如何。检验练习数据中家庭文化程度为本科及本科以上的学生和家庭文化程度为大专及大专以下的学生的英语成绩有无显著差异且效应幅度如何。检验阅读前测成绩与阅读后测成绩有无显著差异且效应幅度如何。检验练习数据中英语成绩为70分以上和70分以下学生的家庭在英语有偿教育投资金额上有无显著差异且效应幅度如何。检验练习数据中学生使用管理策略和监控策略有无显著差异且效应幅度如何。练习题2回答问题,并说明理由1•当做t-检验时,结果栏展示了两个显著性水平(Sig.),我们应该选用哪一个呢?显著性水平小于0.05是什么意思?为什么要计算这个数值?如果显著性水平小于0.05,我们就可以认为总体也有真正的差异,对不对?如果显著性水平小于0.05,而且满足了t-检验的全部前提条件,我们就可以认为总体真正不同了,对不对?A和B各自改进了英语阅读教学的方法,实施一段时间后用t-检验对比各自实验组和对照组的阅读成绩。如果A得到的显著性水平为0.01,B得到的显著性水平为0.045,这是不是说明A的方法更好呢?方差分析的基本原理t-检验是对两个平均数的比较。在实际工作中,往往还需要对两个以上的平均数进行比较。如果仍用每对平均数差异显著性检验,就会使检验的效率降低。例如,在比较4组平均数时,如果逐对进行平均数比较,需要作6次可能组合的检验。若每次都在0.95的可靠度上检验,那么,6次检验的可靠度将降低为0.956=0.735。因此,在比较多组平均数的时候,人们常用方差分析综合地确定几个平均数差异的显著性。方差分析的逻辑举例说明。从小学一年级三个班中,随机各抽取4个学生,向他们呈现一组英语词汇,然后将他们识记词汇成绩记录下来。这个成绩可以分别是(1)或(2)或其它的结果:(2+3+1+6)宁4=3;(3+7+2+4)宁4=4;(3+6+7+4)宁4=5(2+3+3+4)宁4=3;(10+7+9+6)宁4=8;(9+11+10+10)宁4=10观察两次测试成绩,可以看到,成绩(1)三个小组间的平均数差异小(3,4,5),但各个小组内部的分数差异较大。而成绩(2)三个小组间的平均数差异较大(3,8,10),而各个小组内部的分数差异较小。我们把各组平均数之间的差异称为组间差异,把各小组内部分数之间的差异称为组内差异。通过对组间差异与组内差异比值的分析,来判断几个相应平均数差异的显著,这就是方差分析的逻辑。F检验方差分析以F检验来推断几个平均数差异的显著性。组间差异用组间方差MSb表示,组内差异用组内方差MSw表示。由于组间与组内方差互为独立,bw故可用F检验来检验组间与组内方差是否相等。如果组间与组内方差相等,即F比值等于或接近1,表明各组平均数无显著差异;如果F值很大,大到超过F抽样分布上某种显著性水平的临界值,则就拒绝组间与组内方差无显著性差异的零假设,而接受组间与组内方差有显著性差异的备择假设。这一结论是说,分组所依据的因素对实验结果有重要影响。或者说,实验者所操纵的实验因素的作用较大。FDistributionF分布是形态随F比值分子和分母中的自由度的变化而形成的一簇正偏态分布。如右图所示。组间方差与组间自由度组间方差MSb等于组间平方和SSb除以组间自由度dfb,即右边公式:bbb组间自由度:dfb=K-1(即组数减1)b组内方差与组内自由度组内方差MS等于组内平方和SS除以组内自由度df,即右边公式:www组内自由度:df=(n一1)+(n一1)+•••+(n-1)=n+n+•••+n-K(即各组容量之和w12k12k减去组数)当各组容量相等时,df=K(n-1)=N-Kw以成绩(2)为例解释F检验在分析合组平均数差异原因或寻找影响差异的主要因素时,可以将每个分数与总平均数之间的差异分成两部分,并且设想这两部分差异主要是由两类不同的因素所引起的。一类是实验者操纵的已知实验因素(三个不同的班)所引起的,表现在各小组平均数的差异;另一类是由偶然因素(如受试的个别差异或实验误差)所引起表现在各组内部每个分数与小组平均数之间的差异。先求出整体平均数再求出各小组平均数组间平方和为104;组内平方和为14;总平方和为118本例组间自由度为3-1=2;本例组内自由度为12-3=9本例组间方差为52:本例组内方差为1.556:本例F比值为33.42。F检验公式9.4.4方差分析中的几个概念实验或调查中的自变量称为因素,只有一个自变量的方差分析称为单因素方差分析,用One-WayANOVA命令计算,有两个以上因素的称为多因素方差分析,用Univariate命令计算。某一个因素的不同情况称为因素的“水平”。各因素的水平之间的每个组合叫作一个“单元”(cell)。回忆本课程前半部讲过的“因子设计”,如2X3X5设计。方差分析是一种相当灵活的方法,可以完成不同的任务。首先,它可以计算出总的差异情况,用F值表示(whetherthereareanyoveralldifferencesbetweenthethreeormoregroups,indicatedwithF),其次,它可以检验每两组之间的差异显著性情况,称为,事后多重比较检验(posthoccomparisons)。方差分析常用的四种形式单因素方差分析(One-VariableAnalysisofVariance)多因素方差分析(Multi-VariableAnalysisofVariance)单因素重复测量方差分析(One-VariableRepeatedMeasuresAnalysisofVarianc)9.6.4.协方差分析(Covariance)方差分析的前提条件样本所来自的总体呈方差齐性;(Thepopulationsthesamplesweredrawnfromhaveequalvariances.)因变量数据在总体中呈正态分布。(Thedependentmeasure‘sdataarenormallydistributedintheirpopulationsoforigin.)数据由随机抽样获得。(Thedatawererandomlysampled.)⑷因变量的数据必须是区间级变量或分类不多的比率级变量(Meanscanbecalculatedfromthedata,sothedependentmeasureisbasedoneitheranintervaloraratioscale.)5.自变量必须是名称级或区间级变量(Independentvariablesallhavetobenominalorordinal)。9.6.1单因素方差分析(One-wayAnalysisofVariance)单因素方差分析检验由单一因素各水平影响的一个(或几个相互独立的)因变量各组均值之间的差异是否具有统计意义。还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析,即进行均值多重比较。单因素方差分析在SPSS中实现过程例:研究一个班3组同学(分别接受了3种不同的教学方法)在英语成绩上是否有显著差异。步骤1:在“Analyze"菜单“CompareMeans"中选择One-wayANOVA命令》把“math"添加到dependentList框中,把“group"添加到Factor框中》Continue^£•在这个对话框中可看到下方有三个功能按钮,分别是Contrasts,PostHoc和Options0)单因素方差分析在SPSS中实现过程步骤2:单击Option按钮,出现One-WayANOVA:Options对话框。选中descriptive和Homogeneityofvariancetest(方差齐次性检验)两项,也可加上Meansplot选项,其余默认。》Continue步骤3:单击PostHoc(多重比较检验)按钮,打开OneWayANOVA:PostHocMultipleComparisons对话框,在EqualVariancesAssumed和EqualVariancesNotAssumed栏下各选一项(前者常用的有:LSD(Least-significantDifference最小显著差法),Duncan(多范围检验),Tukey(显著性检验),Scheffe(差别检验法),默认值均为0.05。)》Continue^步骤4:默认Contrast即可满足基本检验要求。结果解释表格1:描述统计量结果。有个案数,均值,标准差,平均值的标准误、95%置信区间,最大值,最小值。表格2:方差齐次性检验结果。有Levene统计量,组间自由度,组内自由度,显著水平,本例表明各总体方差不齐次性。表格3:单因素方差分析结果。它提供方差分析的总体检验结果globaltest)。方差检验F值为17.681,p=.000v.05,拒绝零假设。另外还可看到,3个组的离差平方和为5250.000,其中控制变量不同水平造成的组间平方和为3686.333,随机变量造成的组内平方和为1563.667。表格4:LSD法和Tamhane‘sT2法进行均值多重比较的结果。由于方差不齐次性,我们观察Tamhane‘sT2的结果。组1和组2之间无显著差异,组1和组3之间有显著差异,组1显著高于组3;组2和组3之间也有显著差异,组2显著高于组3。均值折线图。单因素方差分析的效应幅度指数计算SPSS没有提供单因素方差检验结果的效应幅度指数,需要我们自己计算。一般用etasquared表示方差分析的效应幅度指数。0一0.1aweakeffect0.1一0.3amodesteffect0.3一0.5amoderateeffect>0.5astrongeffectetasquared的计算公式为:9.6.2多因素单因变量方差分析(univariateanalysisofvariance)这是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。在这个过程中,可以分析每一个因素的作用,也可以分析因素之间的交互作用,以及分析协方差、各因素变量与协变量之间的交互作用。使用系统默认值的多因素单因变量方差分析实例例:4个水平高考英语考试成绩的大学新生各30人,随机平均分配为3组,每组用一种教学法进行教学,一年半后,参加英语四级统考,观察英语高考成绩与教学法对学生四级统考成绩的作用。操作方法与步骤这是一个4X3的因子设计。英语四级考试成绩是研究对象、因变量、连续变量。自变量有2个:一个是教学方法,三个水平;一个是高考英语成绩,四个水平。步骤1:Analyze»GeneralLinearModel»Univariate.步骤2:四级成绩进入Dependent框。高考英语和教学方法FixedFactor(s)框。步骤3:默认Model,contrast对话框。全模型即模型中包括所有主效应和交互效应。步骤4:如果想看图形,单击Plot。让因素分别进入HorizontalAxis栏,并分别单击Add,在Plot框中出现两个因素的图形表达式。然后让因素分别进入HorizontalAxis栏和SeparateLine栏,单击Add,出现图形表达式高考成绩*教学方法。单击Continue,回到主对话框。步骤5:单击Option按钮。在Factors框中分别选择因素变量和Overall使进入DisplayMeansfor框中。步骤6:OK。结果解释分析一、表格1:因素变量表(Between-SubjectsFactors),展示进入方差分析的因素情况,有因素名称,每个因素的水平数,每个水平数据标签,每个水平下的样本数。二、表格2:方差分析检验结果(TestsofBetween-SubjectsEffects):Source列:离差的来源。分别是校正模型、截距、高考英语、教学方法、高考成绩*教学方法、误差、总和、校正后总和。TypeIIISumofSquares列:离差平方和df列:自由度。组间自由度=组数-1;组内自由度=样本数-(因素1水平数X因素2水平数);交互效应自由度=因素1组间自由度X因素2组间自由度。4。MeanSquare歹U:平均离差。各项离差平方和除以各自的自由度是相应的均方。如教学方法的离差平方各是44.717,自由度是2,它的离差均方是44.717宁2=22.358。5。F列:F检验值。各项F值为各项离差均方除以误差均方。如高考英语主效应的F(98.468)=9976.897宁101.3216。Sig.列:显著性概率,即p值。电脑自动展示。也可在统计书查F值表。EtaSquared歹U:效应幅度指数检验。在p值小于.05时观察。数值表示效应幅度指数的强弱。Etasquared=SS'宁SS,modtotal0-0.1效应幅度弱0.1-0.3效应幅度弱强0.3-0.5效应幅度中强>0.5效应幅度强8。横行CorrectedModel(校正模型),是整个模型的统计量。其总的离差平方和等于两个主效应高考成绩、教学方法和交互效应的离差平方和之和,即包含全部自变量的统计量。是条件引起的平方和。31017.892=29930.692+44.717+1042.4839。横行Intercept(截距),是组内离差平方和。10。横行主效应高考英语的离差平方和,反映的是学生高考英语水平层次不同对教学方法反应不同造成的四级成绩差异,是高考英语这一自变量的组间离差平方和。11。横行主效应教学方法的离差平方和反映的是不同教学方法造成的四级成绩差异,也是组间离差平方和。12。横行误差(error)的实验误差引起的平方和。13。横行Total是离差平方和。14。横行CorrectedTotal的离差平方和等于校正模型与误差之离差平方和之总和。15。表下方外部有R-Squared=…,表明因变量的变异有多少可以指定的模型所解释。在数值关系上是R-Square=SS(Model)FSS(total),其值应该在0〜1之间。此模型R-Square=.739,意思是该模型已经解释了总变异的73.9%。9.6.3重复测量设计的方差分析重复测量属于高级分析过程,是对同一因变量进行重复测试。可以是同一条件下进行的重复测度,目的在于研究各种处理之间是否存在显著性差异的同时,研究受试者之间的差异、受试者几次测量之间的差异以及测试者与各种处理间的交互效应。也可以是不同条件下的重复测度,目的在于研究各种处理间是否存在显著性差异的同时,研究形成重复测量条件间的差异以及这些条件与处理间的交互效应。重复测量方差分析的数据文件结构要进行重复测量方差分析,数据的组织与其他类型的方差分析有所不同。它要求对受试者的若干次测试结果作为不同因变量出现在数据文件中。一定要把每次测量作为一个变量,否则无法使用SPSSforWindows的重复测量分析功能对数据进行分析。重复测量方差分析实例研究三种英语词汇搭配正误识别的平均反应时之间差异显著性,相应的零假设为三种识别的平均反应时之间无显著性差异。在分析研究假设是否成立的同时,研究组间反应时的差异是否大于组内反应时的差异。依此确定词汇搭配正误识别的反应时实验是否可行。先看原始数据表再观察原始数据在SPSS上的排列应用SPSS操作步骤步骤1:GeneralLinearModel»RepeatedMeasures步骤2:组内因素的定义(定义的不是数据文件中的变量,而是重复测量的变量组的代号)本研究的组内因素是三种词汇搭配反应时构成的,所以组内因素命名为time,其中有三个水平。在Within-SubjectFactor框中输入time»ji在NumberofLevels框中输入因素水平数3»单击Add»Defineo步骤3:定义组内因素各水平组合与原始变量的对应关系(在Within-Subjects框中有一系列的_?_(n),表示组内变量第n个水平)。把time1,time2,time3送入该框。然后,把collocation送入Between-SubjectsFactors)框,实验设计中无协变量,不需对Covariates框进行操作)。步骤4:建立分析模型。单击Model»Custom»把time变量送入Within-SubjectsModel框中》把collocation送入Between-SubjectsModel框中》默认Sumof框中的TypeIII»Continue.步骤5:输出选择项。单击Option»把vsno*time送入DisplayMeansfor框中(目的是要求输出各单元的均数)》选DescriptiveStatistics复选项。OK.结果分析表1:组内因素基本数据信息表2:组间变量基本数据信息表3:重复测量变量与组间变量的组合单元的描述统计量。表4:多变量检验结果(multivariateTests)。包括对组内因素time的效应检验、对组间与组内因素交互效应的检验。F的显著性概率均大于0.05,可得出结论,组内效应对三种英语词汇搭配正误识别反应时的差异没有显著性意义;组间与组内的交互效应对造成三种英语词汇搭配正误识别反应时的均数没有显著意义。表5为组内效应检验结果(Mauchly‘sTestofSphericity)p>0.05,说明组内效应无显著差异。表6为组内效应方差分析结果(TestsofWithin-subjectsEffects),显示单因素F检验的Huynh-Hedlt和Greenhouse-Geisser经校正的显著性值。方差来源有主效应time,组间与组内的交互效应time*vsno和误差。概率值均大于0.05,说明组内因素time对词汇搭配反应时的差异没有显著性意义。表7为组内均数对比方差检验结果(TestsofWithin-SubjectsContrasts)。每一个来源分为线性的和二次的。从概率值来看,time本身的线性无差异,二次有差异;交互项与time的线性效果和二次效果均无差异。表8为组间效应方差分析结果(TestsofBetween-SubjectsEffects)。从显著概率值近似0可以认为因素变量Collocation各组均值之间的差异是反应时均值差异的主要来源。得出结论:否定三种搭配识别的平均反应时无显著性差异的零假设。表8给出各因变量的单元均值、标准误和95%的置信区间。综合分析可得出结论:不同搭配测得的反应时间之间差异显著;同一种搭配不同测量得到的刺激反应时之间无显著性差异。因此搭配刺激反应时的实验设计是可行的,即可以根据些实验测试每个受试者的搭配刺激反应时。9.6.4协变量方差分析协方差分析是利用线性回归方法消除混杂因素的影响后进行的方差分析。这是实际工作中经常要考虑的。协变量方差分析实例研究暴露于镉粉尘中的年数与肺活量的关系。镉作业工人按暴露于烟尘的年数分为大于等于10年和不足10年两组。两组工人的年龄未经控制(人随着年龄的增长,肺活量也会有所下降)。测量每个工人的肺活量。见数据。操作步骤:步骤1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论