第六课 SPSS非参数检验_第1页
第六课 SPSS非参数检验_第2页
第六课 SPSS非参数检验_第3页
第六课 SPSS非参数检验_第4页
第六课 SPSS非参数检验_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章SPSS非参数检验本章内容8.1单样本的非参数检验8.2两独立样本的非参数检验8.3多独立样本的非参数检验8.4两配对样本的非参数检验8.5多配对样本的非参数检验非参数检验非参数检验:(1)在总体分布未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。(2)推断过程中不涉及有关总体分布的参数。8.1单样本的非参数检验

1.目的:样本来自总体的分布是否与某个已知的分布相吻合?—绘制样本数据的直方图、pp图、QQ图判断—粗略—通过非参数检验—精确2.单样本非参数检验(1)对单个总体的分布形态等进行推断(2)方法:卡方检验、二项分布检验、K-S检验、变量值随机性检验等。8.1.1总体分布的卡方检验1.基本思想-吻合性检验(1)原假设:样本来自的总体分布与期望分布无显著差异。变量值落入第i个子集中的理论概率为,相应的期望频率为2.实现步骤[Analyze]-[NonparametricTests]-[Chi-Square](1)选定待检验的变量到[TestVariablelist](2)在[ExpectedRange]中确定参与分析的观测值的范围:[Getfromdata]:所有观测数据都参与分析[usespecifiedrange]:只在该取值范围内的观测数据才参与分析。(3)[Expectedvalues]给出各理论值[Allcategoriesequal]:所有子集的频数都相同[value]:依次输入值,通过[add]、[change]、[remove]进行增加、修改和删除。3.应用案例医学研究表明心脏病人猝死人数与日期的关系为:一周内,星期一猝死者较多,其他日子基本相当,各天的比例近似为:2.8:1:1:1:1:1:1根据“心脏病猝死”数据,推断总体分布是否与理论分布相吻合。分析:利用总体分布卡方检验实现。8.1.2二项分布检验1.基本思想(1)通过样本数据检验样本来自的总体是否服从指定概率p的二项分布。(2)小样本-精确检验大样本-近似检验2.实现步骤

[Analyze]-[NonparametricTests]-[Binomial](1)选定待检验的变量到[TestVariablelist](2)[definedichotomy]中指定如何分类[getfromdata]:检验变量为二值变量[cutpoint]:输入具体数值,大于等于该值的为第一组,大于该组的为第二组(3)[Testproportion]:输入二项分布的检验概率值3.应用案例利用“产品合格率”数据,推断该批产品的一级品率是否为90%分析:产品合格与否属于二值变量,可以通过二项分布检验实现。8.1.3单样本K-S检验1.基本思想(1)以俄罗斯数学家柯尔莫哥和斯米诺夫名字命名(2)利用样本数据推断样本来自的总体是否服从某一理论分布,是一种拟合优度的检验方法,适用于探索连续型随机变量的分布(3)步骤①计算各样本观测值在理论分布中出现的理论累计概率值F(x)②计算各样本观测值的实际累计概率值S(x)③计算理论累计概率值与实际累计概率值的差D(x)④计算差值序列中最大绝对差值D(4)原假设成立时:①小样本下:D~kolmogorov分布②大样本下:近似服从K(x)分布③SPSS仅给出大样本下的和对应的p值(5)决策①D统计量的p值<显著性水平,拒绝原假设,样本来自的总体与指定分布有显著差异②D统计量的p值>显著性水平,不拒绝原假设,样本来自的总体与指定分布无显著差异2.实现步骤

[Analyze]-[NonparametricTests]-[1-sampleK-S](1)选定待检验的变量到[TestVariablelist](2)[Testdistribution]:选择理论分布①[normal]:正态分布②[uniform]:均匀分布③[poisson]:泊松分布④[exponential]:指数分布3.应用案例利用“儿童身高”数据分析周岁儿童身高总体是否服从正态分布。分析:可以通过单样本K-S检验实现。8.1.4变量值随机性检验1.基本思想(1)通过对样本变量值的分析,实现对总体的变量值出现是否随机进行检验。(2)原假设:总体变量值出现是随机的。①检验依据:游程-样本序列中连续出现相同的变量值的次数。②游程数太大或太小都表明变量值存在不随机的现象(3)检验统计量(4)决策:Z统计量的p值<显著性水平,拒绝原假设,变量值的出现不是随机的。Z统计量的p值>显著性水平,不拒绝原假设,变量值的出现是随机的。2.实现步骤

[Analyze]-[NonparametricTests]-[Runs](1)选定待检验的变量到[TestVariablelist](2)[cutpoint]:计算游程数的分界值①[median]:样本中位数为分界值②[mode]:样本众数为分界值③[mean]:样本均值为分界值④[custom]:以用户输入的值为分界值,SPSS将小于该分界值的所有变量作为一组,大于或等于该分界值的所有变量作为一组,计算游程。3.应用案例利用“电缆数据”推断耐压设备的工作是否正常。分析:①若耐压数据的变动是随机的-则设备工作正常②若耐压数据的变动不是随机的-则设备工作存在不正常③可以通过变量值随机性检验实现。8.2两独立样本的非参数检验(1)独立样本:在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本。(2)推断样本来自的两个总体的分布等是否存在显著差异。(3)方法:曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验等。8.2.1两独立样本的曼-惠特尼U检验1.基本思想(1)原假设:两组独立样本来自的两总体分布无显著差异。(2)通过两组样本平均秩的研究实现推断

秩-变量值排序的名次,变量值有几个,对应的秩便有几个。(3)检验步骤①将两组样本混合并升序排列,得每个数据的秩②分别对样本X和Y的秩求平均,得平均秩和③计算样本X优于样本Y秩的个数和样本Y优于样本X秩的个数④依据和计算WilcoxonW统计量和曼-惠特尼U统计量。WilcoxonW统计量:曼-惠特尼统计量U为:大样本下,U近似服从正态分布8.2.2两独立样本的K-S检验1.基本思想(1)原假设:两组独立样本来自的两总体的分布无显著差异。(2)与单样本K-S检验的基本思路大体一致,差别在于:以变量值的秩为分析对象,而非变量值本身。(3)检验步骤①将两组样本混合并按升序排列②分别计算两组样本秩的累计频数和累计频率③计算两组累计频率的差,得秩的差值序列及D统计量④SPSS计算大样本下的和对应的p值(3)决策::拒绝原假设,两总体的分布有显著差异:不拒绝原假设,两总体的分布无显著差异

8.2.3两独立样本的游程检验1.基本思想(1)原假设:两组独立样本来自的两总体的分布无显著差异。(2)检验步骤①将两组样本混合并按升序排列,组标记值也随之重新排列②计算组标记值序列的游程数③根据游程数计算Z统计量,Z统计量近似服从正态分布(3)决策::拒绝原假设,两总体的分布有显著差异:不拒绝原假设,两总体的分布无显著差异7.2.4极端反应检验1.基本思想(1)原假设:两独立样本来自的两个总体的分布无显著差异。(2)一组样本为控制样本,一组样本为实验样本,看实验样本相对于控制样本是否出现了极端反应。(3)检验步骤①两组样本混合按升序排列②求控制样本的最小秩和最大秩③计算跨度④为了消除样本数据中的极端值,计算跨度前可按比例(通常5%)去除控制样本中靠近两端的样本值,再求跨度,得截头跨度⑤针对跨度或截头跨度计算H统计量:小样本下,H服从Hollander分布,大样本下,H近似服从正态分布(4)决策:①H统计量的p值<显著性水平,拒绝原假设,两独立样本来自的总体分布存在显著差异②H统计量的p值>显著性水平,不拒绝原假设,两独立样本来自的总体分布不存在显著差异8.2.5两独立样本非参数检验的步骤[Analyze]-[NonparametricTests]-[2independentsamples](1)选择待检验的变量到[Testvariablelist](2)[groupingvariable]:存放组标志的变量,并通过[definegroups]给出两组的标志值。(3)[testtype]:选择相应的检验方法8.2.6应用案例利用“使用寿命”数据,判断两种工艺下产品的使用寿命的分布是否存在显著差异,进而对两个工艺的优劣进行判断。分析:两个工艺产品的使用寿命可看作两独立样本,可以通过曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验实现。8.3多独立样本的非参数检验1.通过分析多组独立样本数据,推断样本来自的多个总体的中位数或分布是否存在显著差异。2.方法:中位数检验、Kruskal-Wallis检验、Jonckheere-Terpstra检验。8.3.1中位数检验1.基本思想(1)原假设:多个独立样本来自的多个总体的中位数无显著差异。(2)检验步骤①将多组样本混合升序排列,求混合样本的中位数②分别计算各组样本中大于和小于中位数的样本个数,形成列联表(p230表7-13)③利用卡方检验分析各组样本来自的总体对中位数的分布是否一致。(3)决策①卡方统计量的p值<显著性水平,拒绝原假设,多个独立样本来自的多个总体的中位数存在显著差异。②卡方统计量的p值>显著性水平,不拒绝原假设,多个独立样本来自的总体的中位数不存在显著差异。8.3.2多独立样本的Kruskal-Wallis检验1.基本思想(1)原假设:多个独立样本来自的多个总体的分布无显著差异。(2)是两独立样本曼-惠特尼U检验的推广(3)检验步骤①将多组样本数据混合并升序排列,求各变量的秩②考察各组秩的均值是否有显著差异③各组秩的差异借助方差分析:秩的变差分解为:组间差和组内差

a若秩的总变差大部分可由组间差解释,则各样本组的总体分布存在显著差异

b若秩的总变差大部分不能由组间差解释,则各样本组的总体分布无显著差异④构造K-W统计量(4)决策:SPSS自动计算K-W统计量和对应的p值

①p值<显著性水平,拒绝原假设,多个独立样本来自的多个总体分布存在显著差异。

②p值>显著性水平,不拒绝原假设,多个独立样本来自的多个总体分布无显著差异。8.3.3多独立样本的Jonckheere-Terpstra检验1.基本思想(1)原假设:多个独立样本来自的多个总体的分布无显著差异(2)J-T统计量(3)决策:SPSS自动计算J-T统计量,Z统计量和对应的p值

①p值<显著性水平,拒绝原假设,多个独立样本来自的多个总体分布存在显著差异;

②p值>显著性水平,不拒绝原假设,多个独立样本来自的多个总体分布无显著差异。8.3.4多独立样本非参数检验的步骤1.按规定的格式组织数据:设置两个变量分别存放样本值和组标记值2.菜单:[Analyze]-[NonparametricTests]-[Kindependentsamples](1)选择待检验的变量到[Testvariablelist](2)[groupingvariable]:存放组标志的变量,并通过[definegroups]给出标志值的取值范围。(3)[testtype]:选择相应的检验方法8.3.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论