7非参数检验.doc_第1页
7非参数检验.doc_第2页
7非参数检验.doc_第3页
7非参数检验.doc_第4页
7非参数检验.doc_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计实践中还遇到这样的问题:测得分数序列所属总体服从正态分布吗?对于不服从正态分布的总体,能否对相应样本进行平均数比较检验呢?本节主要介绍类似问题的解决手段及各种常用非参数检验(non-parametric test)技术。常用的非参数检验主要包括卡方检验(2 test)、Runs 检验(Runs test)、Kolmogorov-Smirnov 单样本检验(Kolmogorov-Smirnov one-sample test)、Mann-Whitney 等级和检验(Mann-Whitney rank-sum test)、符号检验(sign test)、Wilcoson 配对符号等级检验(Wilcoson matched-pairs signed-ranks test)、Fridman 单因素方差分析(Fridman one-way analysis of variance)和多样本中数检验(K-sample median test)。一、卡方检验2 检验(也叫做 Pearson Chi-Square test)是最著名的一种非参数检验手段:根据变量不同水平的观测分数的频数(observed frequency)进行配合度检验(the test of goodness of fit)和独立性检验(independence test)。所谓配合度检验是推断某变量不同取值观测分数的频数和对应的期望频数(expected frequency)是否有显著性差异。独立性检验是指对于两个水平数有限的变量,根据各变量水平的分数的频数,检验它们是否相互独立(independent)。(一)配合度检验作零假设:f0=fe。f0 和 fe 分别为变量的每个水平的观测频数和期望频数。借助于 SPSS 进行运算,如果运算结果没有达到显著性水平,那么,就不能拒绝零假设。否则,就可以认为 f0 和 fe 有显著性差异。检验结果一般表示为:2(df, N=n)=X, p=Y。自由度 df 为变量水平数-1,n 为观测频数和,X、Y、Z 为具体值。【配合度检验例】配合度检验实际上是检验某变量的不同水平值的观测分数频率的分布是否服从某种期望或者理论分布。例如,某研究者进行了一次问卷调查。调查对象是 300 名高中三年级学生;调查目的是考查学生对英语学习兴趣的自我评价:我对英语学习 兴趣很浓、 兴趣较浓、 兴趣一般、 有点兴趣和 没有兴趣。每个学生对该题目做出唯一的选择,获得原始数据如表 4-1 所示。似乎较多人认为自己对英语学习兴趣一般,较少人认为自己英语学习兴趣浓厚或没有兴趣。该研究者想证明: 对英语学习有不同兴趣的学生人数不均等和 其英语学习兴趣很浓、较浓、一般、有点和没有各等级的人数比接近 1:4:8:4:2。表 4-1 300 名学生对英语学习兴趣调查题目的反馈学生编号兴趣0012002300353003注:英语学习兴趣很浓、兴趣较浓、兴趣一般、有点兴趣和没有兴趣5个等级分别以数字 5、4、3、2 和1表示。 对英语学习有不同兴趣的学生人数不均等。表 4-1-1 300 名学生对英语学习兴趣调查题目反馈的 SPSS 表格结构操作假设兴趣各水平值的观测频数均等。造 SPSS 表格如表 4-1-1 所示,保存为 ChiSqrQStdntRspns.sav。执行 Analyze Non-parametric Tests Chi-Square,系统将弹出卡方检验主窗口(Chi-Square Test),如图 4-1 所示。点击左侧变量列表中的 ,点击 , 将出现在 下方的分析变量列表中,如图 4-1-1 所示。选中 标签下的 ,以达到检验零假设(各水平的观测频数均等)的目的,如图 4-1-1 所示。点击 。图 4-1 卡方检验设置朱主窗口 1图 4-1-1 卡方检验设置朱主窗口2结果与解释兴趣Observed NExpected NResidual很浓1860.0-42.0较浓6260.02.0一般13260.072.0有点5660.0-4.0没有3260.0-28.0Total300表兴趣体现了兴趣变量各水平值观测频数(observed N)和期望频数(expected N)及其之间的差(residual),总观测数为 300。Test Statistics兴趣Chi-Square1.292E2adf4Asymp. Sig.000a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 60.0.表 Test Statistics 显示了卡方分析结果:2 的计算值(Chi-Sqare)为 129.200,自由度(df)为4,显著性水平(Sig.)为 0.000,表明零假设不能成立,不同英语学习兴趣的学生人数不均等。结果报告配合度检验表明,不同英语学习兴趣的学生人数不均等,4, N=3002=129.200,p0.10。(二)独立性检验一般情况下,两个水平数有限的变量,其各水平值观测分数的频数以联列表(cross-tab table)的形式呈现。例如,表 4-2 是某聋校 2、4、6 年级聋生平常佩戴助听器 有助于聋人改善听觉进而提高与他人会话交际能力的工具有好几种,其中,晶体管式助听器灵巧轻便,颇受欢迎。情况调查结果。该连列表呈现了不同年级(3 个水平)和经常佩戴助听器与否(两个水平)两个变量交叉的(6 种)处理情况的出现频数。通过卡方检验,可以对各处理的频数进行运算,得出这两个变量之间是否有相关关系的推断,可以推断经常佩戴助听器与否是否随着年级的不同而不同,或者说,经常佩戴助听器与否与不同年级两个变量是否相互无关,相互独立。表 4-2 某校 2、4 和6年级聋生佩戴助听器人数调查结果经常不佩戴助听器经常佩戴助听器2 年级6234 年级30146 年级83作零假设:两个变量相互独立。借助于 SPSS 进行运算,如果运算结果没有达到显著性水平,那么,就不能拒绝零假设。否则,就可以认为两个变量不相互独立。检验结果一般表示为:2(df, N=n)=X, p=Y,=Z。自由度 df 为(N1-1)(N2-1),N1 和 N2 分别为第一个变量和第二个变量的水平数;n 为总观测频数; 为效应大小;X、Y、Z 为具体值。如果两个变量都只有2个水平,则效应大小为:=2n两个变量中如果有一个变量的水平数大于 2,则效应大小为:Cramers=2(ndfsmaller)n为总观测数,dfsmaller为水平数较小的那个变量的水平数减 。如果要在 0.05 显著性水平下达到 80% 的统计效力,那么,效应大小等级、自由度和总观测数的关系如表 4-3 所示。表 4-3 在 0.05 显著性水平下达到 80% 的统计效力的组间自由度、效应大小和总观测数的关系自由度效应大小总观测频数1小(0.10)785中(0.30)87大(0.50)262小(0.10)964中(0.30)107大(0.50)393小(0.10)1090中(0.30)121大(0.50)444小(0.10)1194中(0.30)133大(0.50)48【独立性检验例】独立性检验也叫联列表分析(cross-tabulation)。例如,如表 4-2 所示,聋生佩戴助听器情况是否随其年级不同而不同呢?表 4-2-1 某校 2、4 和6年级聋生佩戴助听器人数的 SPSS 表格结构注:“Grd”代表学生年级,其3个水平 “2”、“4”、“6”分别 以 “1”、“2”、“3”表示;“HrngAidStt”代表学生经常佩戴助听器情况,“1”表示经常不佩戴助听器,“2”表示经常佩戴助听器;“Nmbr”代表人数。操作假设聋生年级相同与否和聋生佩戴助听器与否两个变量相互独立。造 SPSS 表格如表 4-2-1 所示,保存为 ChiSqrQHrngAid.sav。首先对变量 Nmbr 进行频数加权。然后,执行 Analyze Descriptive Statistics Crosstabs,系统将弹出联列表分析主窗口(Crosstabs),如图 4-2 所示。点击左侧变量列表中的 ,点击 ,使 列在 标签下。点击左侧变量列表中的 ,点击 ,使 列在 标签下,如图 4-2-1 所示。图 4-2 联列表分析主窗口 1图 4-2-1 联列表分析主窗口 2点击 按钮,系统将弹出联列标分析统计量设定窗口,如图 4-2-2 所示,选定 和 ,如图 4-2-3 所示。如此设置,结果中将显示卡方检验函数值和效应大小。点击 ,退出统计量设定窗口。图 4-2-2 联列表分析:统计量设定子窗口 1图 4-2-3 联列表分析:统计量设定子窗口 2点击 。结果与解释Chi-Square TestsValuedfAsymp. Sig. (2-sided)Pearson Chi-Square17.907a2.000Likelihood Ratio18.7552.000Linear-by-Linear Association14.3151.000N of Valid Cases84a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 5.24.表 Chi-Square Tests 表明,2 的计算值为 17.907,自由度为 2,总观测数为84,显著性水平为 0.000,因此,零假设不成立,聋生年级相同与否和其佩戴助听器与否两个变量不相互独立。Symmetric MeasuresValueApprox. Sig.Nominal by NominalPhi.462.000Cramers V.462.000N of Valid Cases84表 Symmetic Measures 显示,效应大小 Cramers =0.462。结果报告独立性检验表明,聋生佩戴助听器情况与其所属年级情况相关,(2,N=84)2=17.907,p0.10。(二)Kolmogorov-Smirnov 单样本检验Kolmogorov-Smirnov 单样本检验用于检验一组分数是否服从正态分布,或者,其他理论分布。【Kolmogorov-Smirnov 单样本检验例】有一个分数选列:14、26、21、24、10、18、24、28、15、27、20、22、20、24、19、22、21、20、21、29、16、20、26、29、23、5、17、21、28、21、29、24、13、24、5。问该分数序列是否服从正态分布。表 4-5 分数序列的 SPSS 表格结构操作假设该分数序列服从正态分布。造 SPSS 表格如表 4-5 所示,保存为 Non-Parametric7.sav。执行 Analyze Non-parametric Tests 1-Sample K-S,系统将弹出Kolmogorov-Smirnov 单样本检验主窗口(One Samples Kolmogorov-Smirnov Test),如图 4-4 所示。在左侧变量名列表中选中 ,点击上边的 ,把 移动到 下边的检验变量列表中。在标签 下边的统计方法选项中,保持系统的默认选项 ,设定当前的目标检验分布为正态分布,如图 4-4-1 所示。点击 。图 4-4 Kolmogorov-Smirnov 单样本检验设置窗口 1图 4-4-1 Kolmogorov-Smirnov 单样本检验设置窗口 2结果与解释One-Sample Kolmogorov-Smirnov Test分数N35Normal ParametersaMean21.10Std. Deviation6.127Most Extreme DifferencesAbsolute.165Positive.081Negative-.165Kolmogorov-Smirnov Z.975Asymp. Sig. (2-tailed).298a. Test distribution is Normal.表 One-Sample Kolmogorov-Smirnov Test 列出受检验分数序列的平均数、标准差等描述性统计量。Most Extreme Difference 行中列出了使用Z分数运算的样本分数分布和预期分布在三个方面的差异情况:绝对值差异、最大正差异和最小负差异。Kolmogorov-Smirnov 分布检验结果是:Kolmogorov-SmimovZ值为 0.975,显著性水平为 0.298,因此,零假设不能被推翻。结果报告Kolmogorov-Smirnov 分布检验表明,该分数序列与正态分布没有显著性差异,K-S Z=-0.975,p0.10。(三)Mann-Whitney 等级和检验Mann-Whitney 等级和检验适应于检验两组等级分数是否有显著性差异,它相当于其总体服从正态分布分数的独立样本平均数 t 检验。【Mann-Whitney 等级和检验例1】某教师对其任课班级进行了一次课程考试。由于题目较难,全班学生的分数都比较低,但是,该教师认为考试分数反映了不同学生的相对水平,因此,他对全部同学的实际分数进行了排序,并企图从学生分数的相对高低来判断不同宿舍学生之间学习成绩是否有显著性差异。其中,甲乙两个宿舍学生在全班的分数排序情况如表 4-6 所示。问甲乙两宿舍学生之间的考试成绩是否有显著性差异。表 4-6 甲乙两宿舍学生之间的考试成绩在全班中的排名学生宿舍成绩名次甲3乙2乙15甲23表 4-6-1 甲乙两宿舍学生之间的考试成绩在全班中的排名的 SPSS 表格结构操作假设甲乙两宿舍同学之间的考试成绩在全班中的排名没有显著性差异。造 SPSS 表格如表 4-6-1 所示,保存为 Non-Parametric1.sav。执行 Analyze Non-parametric Tests 2-Independent Samples,系统将弹出等级分数两独立样本检验主窗口(Two-Independent-Samples Tests),如图 4-5 所示。和独立样本平均数 t 检验的情况类似,在左侧变量名列表中选中 ,点击上边的 ,把 移动到 下边的检验变量列表中;选中 ,点击下边的 ,把 移动到 下边的分组变量框中,如图 4-5-1 所示。图 4-5 Mann-Whitney 等级和检验设置窗口 1图 4-5-1 Mann-Whitney 等级和检验设置窗口 点击 ,系统将弹出的分数分组设置子窗口(Two-Independent-Samples Tests: Define Groups),如图 4-5-2 所示。分别在 和 右边的输入框中输入变量“学生宿舍”的两个水平值5和 6,如图 -5-3 所示。点击 ,退出该子窗口。图 4-5-2 Mann-Whitney 等级和检验分组设置子窗口 1图 4-5-3 Mann-Whitney 等级和检验分组设置子窗口 2在标签 下边的统计方法选项中,保持系统的默认选项 。点击 ,系统将先分别计算两个宿舍学生的平均名次,然后,对两个名次平均数进行比较,并最终提供如下结果。结果与解释Ranks学生宿舍NMean RankSum of Ranks成绩名次555.0025.00656.0030.00Total10表 Ranks 列出了因变量成绩名次在自变量学生宿舍的两个水平5和6上的平均名次。似乎宿舍6学生的平均名次高于宿舍5学生的平均名次。Test Statisticsb成绩名次Mann-Whitney U10.000Wilcoxon W25.000Z-.522Asymp. Sig. (2-tailed).602Exact Sig. 2*(1-tailed Sig.).690aa. Not corrected for ties.b. Grouping Variable: 学生宿舍表 Test Statistics 显示的统计分析结果:Z 值为 -0.522,显著性水平为 0.602,因此,零假设不能被推翻,两个宿舍学生成绩排名的差异不显著。结果报告Mann-Whitney 等级和检验表明,宿舍5和宿舍6的学生之间的成绩排名差异不显著,Z=-0.522,p0.10。当然,对服从正态分布的分数也可以进行 Mann-Whitney 等级和检验,只是检验结果不如独立样本平均数 t 检验精确。我们不妨对两组可以进行独立样本平均数 t 检验的分数也作 Mann-Whitney 等级和检验,比较一下这两种检验的结果。【Mann-Whitney 等级和检验例 2】甲乙两个班级同时参加同一学科考试,成绩如表 4-7 所示。问甲乙两班学生的成绩是否有显著性差异,两个班的学生成绩排名是否有显著性差异。表 4-7 甲乙两班学生的考试成绩班级分数甲63乙64乙66甲94表 4-7-1 甲乙两班学生考试成绩的 SPSS 表格结构操作独立样本平均数 t 检验。作零假设:甲乙两班学生的成绩没有显著性差异。造 SPSS 表如表 4-7-1 所示,保存为 Non-Parametric2.sav,对分数进行独立样本平均数 t 检验。结果与解释Group Statistics班级NMeanStd. DeviationStd. Error Mean分数13377.3316.1972.82023384.0910.3691.805Independent Samples TestLevenes Test for Equality of Variancest-test for Equality of MeansFSig.tdfSig. (2-tailed)Mean DifferenceStd. Error Difference95% Confidence Interval of the DifferenceLowerUpper分数Equal variances assumed3.403.070-2.01864.048-6.7583.348-13.446-.069Equal variances not assumed-2.01854.458.048-6.7583.348-13.468-.047因为方差齐次性检验的 F 值为 3.403,显著性水平为 0.070。如果按不接受方差齐次性假设,那么,t 检验结果为 t=-2.018,p=0.048,说明两个班的成绩差异显著。Mann-Whitney 等级和检验。系统将首先把所有分数从大到小排序,得到与对应的等级分数,然后,进行相应检验,获得如下结果: Ranks班级NMean RankSum of Ranks分数13329.80983.5023337.201227.50Total66Test Statisticsa分数Mann-Whitney U422.500Wilcoxon W983.500Z-1.567Asymp. Sig. (2-tailed).117a. Grouping Variable: 班级Mann-Whitney 等级和检验结果是:Z 值为 -1.567,显著性水平为 0.117,因此,零假设不能被推翻,两个班的成绩排名差异不显著。可见,对于服从正态分布的分数进行 Mann-Whitney 等级和检验的敏感性低于独立样本平均数 t 检验。(四)符号检验符号检验是对两个配对分数组A和B的分数对逐一比较。对一具体的分数对,如果来自A组的分数大于来自B组的分数,系统就对当前分数对计为正差异(positive);反之,来自A组的分数小于来自B组的分数,就计为负差异(negative);如果来自A组的分数等于来自B组的分数,就计为无差异(tie)。系统对两组分数的差异情况进行比较后,给出统计结果。【符号检验例】假若有两组配对分数,如表 4-8 所示。请通过符号检验判断这两组分数之间的差异情况。表 4-8 两组配对分数分数1分数264.036.066.037.050.069.098.094.0表 4-8-1 两组配对分数的 SPSS 表格结构操作假设这两组配对分数之间没有显著性差异。造 SPSS 表格如表 4-8-1 所示,保存为 signTest1.sav。执行 Analyze Non-parametric Tests 2-Related Samples,系统将弹出符号检验主窗口(Two-Related-Samples Tests),如图 4-6 所示。和配对样本平均数 t 检验的情况类似,在左侧变量名列表中选中 和 ,点击 ,把 和 移动到 下边的检验变量对列表中。在标签 下边的统计方法选项中,去掉的默认选项 而选中 ,如图 4-6-1 所示。点击 。图 4-6 符号检验设置窗口 1图 4-6-1 符号检验设置窗口 2结果与解释FrequenciesN分数2 - 分数1Negative Differencesa16Positive Differencesb17Tiesc0Total33a. 分数2 分数1c. 分数2 = 分数1表 Frequencies 列出了分数2的分数小于、大于和等于分数1的分数数目。Test Statisticsa分数2 - 分数1Z.000Asymp. Sig. (2-tailed)1.000a. Sign Test表 Test Statistics 显示了统计分析结果:Z值为 0.000,显著性水平为 1.000,因此,两组分数之间差异不显著。结果报告符号检验表明,两组配对分数之间的差异没有达到显著性水平,Z=0.000,p=1.000。(五)Wilcoson 配对符号等级检验和符号检验不同之处是,Wilcoson 配对符号等级检验考虑了配对分数之间的差异大小,即,对于A和B两组配对分数,先根据其差异绝对值的大小排序,计算A组中小于和大于B组对应分数的排序分数,然后进行检验分析。【Wilcoson 配对符号等级检验例】数据举例同【符号检验例】。操作假设这两组配对分数之间没有显著性差异。打开 SPSS 表格 signTest1.sav。执行 Analyze Non-parametric Tests 2-Related Samples,在两个相关样本检验主窗口中,保留标签 下边系统的默认选项 ,其它同符号检验的情况。点击 。结果与解释RanksNMean RankSum of Ranks分数2 - 分数1Negative Ranks16a21.38342.00Positive Ranks17b12.88219.00Ties0cTotal33a. 分数2 分数1c. 分数2 = 分数1除了和符号检验结果的 Frequencies 表相同之外,表 Ranks 还列出了每组分数基于总差异的排序平均数。Test Statisticsb分数2 - 分数1Z-1.106aAsymp. Sig. (2-tailed).269a. Based on positive ranks.b. Wilcoxon Signed Ranks Test表 Test Statistics 显示了统计分析结果:Z 值为 -1.106,显著性水平为 0.269,两组分数之间差异虽然没有达到显著性水平,但是,该检验结果显然比单纯的符号检验更加精确。结果报告Wilcoson 配对符号等级检验表明,两组分数之间的差异没有达到显著性水平,Z=-1.106,p0.10。(六)Fridman 单因素方差分析Fridman 单因素方差分析适应于检验三组或三组以上的相关分数之间是否存在显著性差异。与服从正态分布分数的单因素方差分析不同,Fridman 单因素方差分析基于分数的平均排序值:首先,把所有分数从大到小排序,获得关于全部分数的排序分数;然后,对每组分数求出其排序分数的平均值;最后,通过 Chi-Square 分析运算,对排序分数和期望排序分数进行比较。而且,Fridman 单因素方差分析不提供多重比较运算,只对多组不服从正态分布的分数进行总体分析。【Fridman 单因素方差分析例】一次英语考试有3道题目,每道题目满分10分。参加此次考试的某班只有10人,他们的各题得分如表 4-9 所示。问,这10个人在这3个题目上的得分是否有显著性差异。表 4-9 某班英语考试中3个大题的分数序号大题 1大题 2大题 317.09.06.027.06.09.0310.09.07.0109.08.07.0表 4-9-1 某班英语考试中3个大题的分数的 SPSS 表格结构操作假设该班3个大题的分数之间没有显著性差异。造 SPSS 表格如表 4-9-1 所示,保存为 Non-Parametric4.sav。执行 Analyze Non-parametric Tests K-Related Samples,系统将弹出多个相关样本检验主窗口(Tests for Several Related Samples),如图 4-7 所示。在左侧变量名列表中选中 、和 ,点击 ,把这三个变量名都移动到 下边的检验变量列表中。保留标签 下边系统的默认选项 ,如图 4-7-1 所示。点击 。图 4-7 Fridman 单因素方差分析设置窗口1图 4-7-1 Fridman 单因素方差分析设置窗口 2结果与解释RanksMean Rank大题12.4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论