平均数差异显著性检验统计检验力和效果大小的估计原理与方法 权威_第1页
平均数差异显著性检验统计检验力和效果大小的估计原理与方法 权威_第2页
平均数差异显著性检验统计检验力和效果大小的估计原理与方法 权威_第3页
平均数差异显著性检验统计检验力和效果大小的估计原理与方法 权威_第4页
平均数差异显著性检验统计检验力和效果大小的估计原理与方法 权威_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

平均数差异显著性检验统计检验力和效果大小的估计原理与方法QUOT摘要该文以平均数差异显著性检验为例对实验数据进行假设检验后继续对其统计检验力和效果大小进行估计的基本原理和方法作一介绍。关键词平均数差异显著性检验假设检验统计检验力效果大小中图分类号B8412标识码A文章编号100351842010010068061引言在数、比率或实计数等的几个样本统计量之间的差异是否显著的假设检验结果但是假设检验结果并不能有助于了解它们之间的差异到底有多大其差异显著性有多重要。因此现代心理统计学的发展要求通过计算统计检验力或效果大小来达到这些目的。当今国内外心理与科的发展目前已经明确要求研究者在投稿时需要在文章中提供有关统计力和效果大小等方面的数据。例如美国心理协会最新版第5版的写作手册一书中明确要求作者对于自己的研究假设进行检验时必须考虑采取严格的统计力STATISTICSPOWER。我们可以通过特定的ALPHA水平、效果大小和样本大小来决定统计力而这关系到正确地拒绝作者想要检验的假设的可能性为了让读者能够充分地了解到你的研究发现的重要性在你的结果段落中呈现效果大小EFFECTSIZE的索引或关系强度STRENGTHOFARELATIONSHIP是必要的。你可以使用一些一般效果大小的估计值来估计你研究结果的效果大小或关系强度包括但不是受限于COHEN的D值和K值1。在我国现有的心理或教育统计教材中比较重视如何控制ALPHA型错误的问题对于如何计算和控制BETA型错误并由此提高统计检验力问题则较少介绍25。鉴于目前较为著名的心理统计学教材69都重视统计检验力和效果大小的估计原理与估计方法文章拟以平均数差异显著性检验为例对实验数据进行假设检验后继续对其统计检验力和效果大小进行估计的基本原理和方法进行介绍。2统计检验力的含义与估计原理对平均数进行差异显著性检验时通常将检验的虚无假设设为或这是假设与在统计学意义上两个平均数之间实质上是没有显著差异的而将虚无假设的反面设为NE这是假设与0在统计学意义上两个平均数之间实质上是有显著差异的。根据假设检验的结果无论是拒绝或者不拒绝虚无假设都有可能或者犯ALPHA错误或者犯BETA错误。通常情况下ALPHA和BETA不可能同时增大或减小ALPHA和BETA的相互关系通常有如表1和图1所示。当虚无假设是时虚无假设分布NULLHYPOTHESISDISTRIBUTIONNHD是以零为中心的正态分布以对平均数的检验为例所谓虚无假设分布就是指当虚无假设为真时X或的分布。由于可以通过预先设定ALPHA水平的方式来控制当虚无假设为真时拒绝它可能会犯错误的概率。因此在此基础上得到的虚无假设差异显著性检验的Z统计量分布或T统计量分布在置信度范围内也是以零为中心的分布ACENTRALZORTDISTRIBUTION。由表1可知当虚无假设为假备择假设为真时接受就会犯BETA型错误拒绝则是做出了正确的决策其概率等于1BETA。换言之当为真即与确实有差异时与的距离即表示与的真实差异以1BETA的概率接受。1BETA反映着正确辨认真实差异的能力统计学中称之为统计检验力POWEROFTEST或效力。也可以把统计检验力1BETA定义为在虚无假设为假备择假设为真时正确拒绝的概率。如果想要知道犯BETA型错误的概率是多少就要知道备择假设的分布情况ALTERNATIVEHYPOTHESISDISTRIBUTIONAHD以对平均数差异显著性的检验为例所谓备择假设分布就是指当虚无假设为假而备择假设为真时X或的分布。遗憾的是由于与虚无假设相对立的备择假设NE是虚无假设的补集两个平均数之间不相等的值几乎是无限多的因此它们之间的差值到底是多少是不确定的。在理论上备择假设NE的分布值是一个不是以零为中心的分布ANONCENTRALZORTDISTRIBUTION它是以什么值为中心也有着无数多个选择因此一般情况下难以对BETA值或1BETA值作出准确的估计。另一方面从总体上说对统计检验力的分析是一个近似值的分析因此可以假设备择假设分布AHD是一种正态分布在此基础上得到的备择假设差异显著性检验的Z统计量分布或T统计量分布也是正态分布。如果能找到某种备择假设分布的集中值就能对BETA或1BETA值作出某种近似的估计。虽然在一般情况下由于不知道备择假设分布是怎样的而无法精确计算BETA型错误的值但在以进行平均数差异检验为目的的抽样实验中总会得到一个Z或T统计量如果备择假设分布服从正态分布那么就可以利用这个在一次性抽样中所得到的Z值来作为估计备择假设分布的中心点以此作为该次实验中备择假设分布的期望值THEEXPECTEDZVALUE或称为备择假设分布的平均值通常用希腊字母DELTA表示备择假设分布的期望Z值。并假定在备择假设的分布中大于这个Z统计量的备择假设的数量与小于这个Z统计量的备择假设的数量各占50由此来对可能犯BETA型错误的概率进行近似的估计。DELTA是表示某种特殊的备择假设分布的平均Z值因此它的计算方法也与Z值的计算方法密切关联。由于在估计DELTA值时一方面假定备择假设的分布是正态分布另一方面也用一次抽样中所获得的假设检验的Z统计量来作为DELTA值因此两个独立样本平均数差异显著性检验的DELTA值的计算方法将以下列公式1所示的计算Z统计量的公式为基础。QUOT公式1如前所述在两个独立样本平均数差异显著性检验中DELTA是表示某种特殊的备择假设分布的期望Z值在T检验中就是期望T值而样本平均数的期望值是样本平均数的期望值是与此相应计算两个独立样本平均数差异显著性检验的DELTA值的公式有如下列公式2所示。DELTA公式2例如当对两个实验分组的实验数据进行平均数差异显著性检验时如果用公式1计算的平均数差异显著性检验统计量为Z30那么就可以把Z30视为是公式2所得到的DELTA值的计算结果并且把所有可能的备择假设的分布假设为是以30为中心的正态分布这时这次抽样检验结果Z30就被视为该次实验中备择假设分布的期望值这有如图2所示。ALPHA005水平上进行双侧检验时作出接受或拒绝虚无假设的临界值是ZALPHA2196。以此为分界点通常的统计决策是当实际得到的Z值小于196时就认为没有充分理由拒绝虚无假设这时在虚无假设为假备择假设为真时有可能犯拒真的BETA型错误其可能犯BETA型错误的概率值有如图2中阴影部分所示而当实际得到的Z值大于196就会拒绝虚无假设这时在虚无假设为假时就作出了正确的决策由于在正态分布条件下与ALPHA005相应的Z值是196因此其正确拒绝虚无假设的概率值有如图2中以为分界线所示的右边部分的面积它等于1BETA。由于做出决策的临界值定为196它离备择假设分布的期望Z值DELTA30约一个标准差即30196104查正态分布表可知阴影部分的面积也就是犯BETA型错误的概率约为015统计检验力1BETA则为1015085。3两独立样本平均数差异显著性检验统计检验力的估计方法根据上述统计检验力的估计原理可以通过以下几个步骤来估计两个独立样本平均数差异显著性检验统计检验力1BETA的值步骤1根据已知条件建立需要检验的假设步骤2用相应的公式计算Z统计量步骤3确定做出统计决策的ALPHA水平及相应的临界值步骤4计算实际得到的Z值与ALPHA水平临界值的差步骤5根据Z值与ALPHA水平临界值的差查正态分布表确定可能犯的BETA型错误或统计检验力1BETA的概率。例如有研究者在甲乙两校中分别抽取100名16岁的男生进行智商测查测得甲乙两校该年龄组男生总智商的平均分分别为115分和110分。根据常模该年龄组男生总智商的标准差是15分。那么求取甲乙两校16岁男生平均智商差异显著性检验统计检验力的过程有如下述。解已知数据是步骤1建立假设NE步骤2用公式1计算检验统计量步骤3确定做出统计决策的ALPHA水平并做出决策在显著性水平ALPHA005时其临界值为ZALPHA2196由于Z189在一般情况下假设检验的过程至此已经完成。但是如果要知道假设检验结果的统计检验力是多少则还需要做以下的工作。步骤4计算实际得到的Z值与ALPHA水平临界值的差得到189196007。步骤5根据Z值与ALPHA水平临界值的差查正态分布表确定可能犯的BETA型错误或统计检验力1BETA的概率查正态分布表可知从中心点为零到右边007个标准差所占的面积是00279加上中心点左边的050的面积共有曲线下面积0500027905279约等于53如图3所示。这就是本例情况下估计出来的犯BETA型错误的概率值其拒绝错误的虚无假设接受正确备择假设的概率是1BETA这就是统计检验力在本例中它的值是1。如果用BETA来表示图3中拒绝或接受虚无假设分界点到该正态分布曲线中点的距离那么前述求取BETA或1BETA过程中的前4步也可以用下列公式3计算。ALPHA公式3在本例中假设当显著性水平为时ALPHA196代入公式3可得ALPHA115196007由此得到的BETA007与前述步骤1至步骤4得到的结果是一样的。上述计算表明根据本例中的数据对平均数差异显著性进行检验后得到的Z统计量是Z189当显著性水平为ALPHA005时Z1894两独立样本平均数差异显著性检验效果大小的估计方法效果大小EFFECTSIZE有时也被译为效应大小或效应值是反映统计检验效果大小或处理效应大小的重要指标它表示不同处理下的总体平均数之间差异的大小可以在不同研究之间进行比较。考虑到效应一词在统计学中很多使用如方差分析中的主效应各因子效应等为了不使读者产生不必要的混淆用效果大小一词来表示EFFECTSIZE的内涵。效果大小反映了两个总体受某种事物的影响后的差异程度。平均数差异显著性检验的效果大小一般用符号D表示。在两个独立样本的方差和样本容量都相等的条件下公式2可作如下推导DELTASIGMA2NSIGMA由此可得DELTASIGMAN2公式4令DSIGMA公式5DELTADN2公式6进而有DDELTAN2DELTA2N公式7由公式6可知在实际计算过程中DELTA值是D值与样本量除以2之后的算术平方根两部分的乘积。这表明在其他条件不变的情况下D值越大DELTA值也会越大而DELTA值越大则统计检验力1BETA也越大因此D值与统计检验力1BETA之间存在正相关的关系。QUOTD值与统计检验力1BETA之间有着密切关系但也要注意这两者之间的区别统计检验力1BETA受样本容量影响较大而D值则不受样本容量影响。可以通过上述公式5在不考虑样本容量的情况下来计算某个心理研究中的D值。我们也可以通过把D值视为两个总体分布的重叠量的途径来理解效果大小的内涵。图4列出了四种D值在两个总体中的重叠情形。图4表明表示效果大小的D值越大重叠程度就越小平均数差异显著性检验的效果就会越明显D值越小则相反。也可以这样来理解即不管你取哪种样本D值总是作为一种标准的平均数差异的估计它与当前样本无关。显然的推断统计量Z、T、F或值及相应的概率值P值只是说明平均数的差异如何但这种差异脱离样本推广到不同的抽样群体时差异究竟有多大则需要用反映效果大小的D值来描述。比如说一般情况下男性平均身高要比中看到男性比女性要高D值越小则在实际生活中看到男性比女性高的可能性就会小些。换言之D值更能说明在实际生活中所关心的差异而不是数据上的差异显著问题。D值能知道观测到的差异是不是事实上的差异。JCOHEN1992认为D02视为是低效果D05视为是中等程度的效果大小D08视为是高效果。上述公式5就是求效果大小的具体方法利用这一公式可以对前面求统计检验力的相应数据求该研究的效果大小D值。已知的条件是因此可以利用公式5来计算该研究的D值将数据代入公式后得DSIGMA11511115027即该研究的效果大小是D027根据JCOHEN的观点这属于较小程度的效果大小。5影响平均数差异显著性检验统计检验力的其他因素前面论述了效果大小与统计检验力的相互关系即在其他条件不变的情况下效果大小D值越大统计检验力1BETA值也越大。此外统计检验力1BETA还受ALPHA水平和样本量的大小这两个因素的影响。公式6即DELTADN2表明DELTA值是D值和样本容量除2后的算术平方根的乘积。这表明样本容量也是影响DELTA值的因素之一样本容量越大DELTA值也越大。对于另外一个即ALPHA水平因素需要作进一步的说明。正常情况下当选择ALPHA005的临界水平时在正态分布的情况下其相应的Z值为196。以此为分界点通常的统计决策是当实际得到的Z值大于196时就会拒绝虚无假设实际得到的Z值小于196时就会接受虚无假设。例如前面所举的例子中的检验结果是Z189由于小于Z的临界值因此一般是接受虚无假设认为甲乙两校男生在总智商方面没有显著差异。做出这种决策在虚无假设为假时就有可能犯BETA型错误。如图3所示犯BETA型错误的概率约等于53与此相应的统计检验力的值就是1053047。如果做出决策时把ALPHA水平从ALPHA005改为ALPHA010的水平进行双尾检验其接受或拒绝虚无假设的临界点等同于在ALPHA005水平下进行单尾检验时的临界点情况会是怎样呢我们仍然用前面所举的例子为例。通过前两个求解步骤得到的检验统计量仍为Z189。步骤3确定做出统计决策的ALPHA水平并做出决策查正态分布表可知在显著性水平ALPHA010双侧时其临界值为ZALPHA21645由于Z189GTZALPHA21645因此正常情况下做出的决策是拒绝虚无假设而接受备择假设认为甲乙两校男生在总智商方面甲校男生的总智商比乙校男生的总智商要更好。步骤4计算实际得到的Z值与ALPHA水平临界值的差得步骤5根据Z值与ALPHA水平临界值的差查正态分布表确定可能犯的BETA型错误或统计检验力1BETA的概率查正态分布表可知查正态分布表可知从中心点为零到左边0245个标准差所占的面积是00968约等于010如图5所示其阴影部分的概率值为050010040。与前述一样的检验统计量作为估计备择假设分布的中心点或期望值DELTA建构一个正态分布189左右两边各占50的面积以作为接受或拒绝假设的分界点如果实际获得的Z值小于图5左边阴影部分就接受虚无假设这时如果虚无假设为假则犯BETA型错误的概率值约为40如果实际获得的Z值大于图5右边部分就拒绝虚无假设这时如果虚无假设为假则是作出了正确的决策其正确决策的概率值是1BETA1。需要特别强调的是当用上述五个步骤的方法或公式3来计算BETA型错误率或统计检验力1BETA时一定要根据是接受还是拒绝虚无假设的假设检验结果来确定通过Z统计量与显著性水平临界值之差查Z分布表后所得到的概率值的两种不同意义。意义1当根据平均数差异显著性检验结果接受虚无假设如本文例子在ALPHA005双侧检验时在虚无假设是真时这是正确决策在虚无假设是假时就做了错误的决策犯错误的概率是BETA在本文例子中检验结果得到的Z统计量即Z189与显著性水平ALPHA005双侧检验的临界值ZALPHA2196之差为007查Z分布表可得对应于平均数到007个标准差的面积是约003如图3所示由于是接受虚无假设那么临界值ZALPHA2196左边阴影部分的面积都属于接受域图中189是这次实验中备择假设分布的期望值该点两边各占50的面积而临界点198这个值在中心点189的右边因此阴影部分的面积就应该是050003053如果虚无假设是假接受它做出错误决策的概率为。意义2当根据平均数差异显著性检验结果拒绝虚无假设如本文例子在ALPHA010双侧检验时在虚无假设是真时错误决策的概率是显著性水平ALPHA在虚无假设是假时就做了正确的决策正确决策的概率是1BETA。在本文例子中检验结果得到的Z统计量即Z189与显著性水平ALPHA010双侧检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论