




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章,SPSS非参数检验,本章内容,7.1 单样本的非参数检验 7.2 两独立样本的非参数检验 7.3 多独立样本的非参数检验 7.4 两配对样本的非参数检验 7.5 多配对样本的非参数检验,非参数检验,非参数检验: (1)在总体分布未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。 (2)推断过程中不涉及有关总体分布的参数。,7.1 单样本的非参数检验,1.目的:样本来自总体的分布是否与某个已知的分布相吻合? 绘制样本数据的直方图、pp图、QQ图判断粗略 通过非参数检验精确 2.单样本非参数检验 (1)对单个总体的分布形态等进行推断 (2)方法:卡方检验、二项分布检验、K
2、-S检验、变量值随机性检验等。,7.1.1总体分布的卡方检验,1.基本思想-吻合性检验 (1)原假设:样本来自的总体分布与期望分布无显著差异。 变量值落入第i个子集中的理论概率为 ,相应的期望频率为,2.实现步骤 Analyze-Nonparametric Tests-Chi-Square,(1)选定待检验的变量到Test Variable list (2)在Expected Range中确定参与分析的观测值的范围: Get from data:所有观测数据都参与分析 use specified range:只在该取值范围内的观测数据才参与分析。 (3)Expected values给出各理论
3、值 All categories equal:所有子集的频数都相同 value:依次输入值,通过add、change、remove进行增加、修改和删除。,3.应用案例,医学研究表明心脏病人猝死人数与日期的关系为:一周内,星期一猝死者较多,其他日子基本相当,各天的比例近似为:2.8:1:1:1:1:1:1 根据“心脏病猝死”数据,推断总体分布是否与理论分布相吻合。 分析: 利用总体分布卡方检验实现。,7.1.2二项分布检验,1.基本思想 (1)通过样本数据检验样本来自的总体是否服从指定概率p的二项分布。 (2)小样本-精确检验 大样本-近似检验,2.实现步骤,Analyze-Nonparamet
4、ric Tests-Binomial,(1)选定待检验的变量到Test Variable list (2)define dichotomy中指定如何分类 get from data:检验变量为二值变量 cut point:输入具体数值,大于等于该值的为第一组,大于该组的为第二组 (3)Test proportion:输入二项分布的检验概率值,3.应用案例,利用“产品合格率”数据,推断该批产品的一级品率是否为90% 分析: 产品合格与否属于二值变量,可以通过二项分布检验实现。,7.1.3单样本K-S检验,1.基本思想 (1)以俄罗斯数学家柯尔莫哥和斯米诺夫名字命名 (2)利用样本数据推断样本来自
5、的总体是否服从某一理论分布,是一种拟合优度的检验方法,适用于探索连续型随机变量的分布 (3)步骤 计算各样本观测值在理论分布中出现的理论累计概率值F(x) 计算各样本观测值的实际累计概率值S(x) 计算理论累计概率值与实际累计概率值的差D(x) 计算差值序列中最大绝对差值D,(4)原假设成立时: 小样本下:Dkolmogorov分布 大样本下: 近似服从K(x)分布 SPSS仅给出大样本下的 和对应的p值 (5)决策 D统计量的p值显著性水平,不拒绝原假设,样本来自的总体与指定分布无显著差异,2.实现步骤,Analyze-Nonparametric Tests-1-sample K-S,(1)
6、选定待检验的变量到Test Variable list (2)Test distribution:选择理论分布 normal:正态分布 uniform:均匀分布 poisson:泊松分布 exponential:指数分布,3.应用案例,利用“儿童身高”数据分析周岁儿童身高总体是否服从正态分布。 分析: 可以通过单样本K-S检验实现。,7.1.4 变量值随机性检验,1.基本思想 (1)通过对样本变量值的分析,实现对总体的变量值出现是否随机进行检验。 (2)原假设:总体变量值出现是随机的。 检验依据:游程-样本序列中连续出现相同的变量值的次数。 游程数太大或太小都表明变量值存在不随机的现象,(3)
7、检验统计量 (4)决策: Z统计量的p值显著性水平,不拒绝原假设,变量值的出现是随机的。,2.实现步骤,Analyze-Nonparametric Tests-Runs,(1)选定待检验的变量到Test Variable list (2)cut point:计算游程数的分界值 median:样本中位数为分界值 mode:样本众数为分界值 mean:样本均值为分界值 custom:以用户输入的值为分界值,SPSS将小于该分界值的所有变量作为一组,大于或等于该分界值的所有变量作为一组,计算游程。,3.应用案例,利用“电缆数据”推断耐压设备的工作是否正常。 分析: 若耐压数据的变动是随机的-则设备工
8、作正常 若耐压数据的变动不是随机的-则设备工作存在不正常 可以通过变量值随机性检验实现。,7.2两独立样本的非参数检验,(1)独立样本:在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本。 (2)推断样本来自的两个总体的分布等是否存在显著差异。 (3)方法:曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验等。,7.2.1两独立样本的曼-惠特尼U检验,1.基本思想 (1)原假设:两组独立样本来自的两总体分布无显著差异。 (2)通过两组样本平均秩的研究实现推断 秩-变量值排序的名次,变量值有几个,对应的秩便有几个。 (3)检验步骤 将两组样本混合并升序排列,得每个数
9、据的秩 分别对样本X和Y的秩求平均,得平均秩 和 计算样本X优于样本Y秩的个数 和样本Y优于样本X秩的个数 依据 和 计算WilcoxonW统计量和曼-惠特尼U统计量。,WilcoxonW统计量: 曼-惠特尼统计量U为: 大样本下,U近似服从正态分布,7.2.2两独立样本的K-S检验,1.基本思想 (1)原假设:两组独立样本来自的两总体的分布无显著差异。 (2)与单样本K-S检验的基本思路大体一致,差别在于:以变量值的秩为分析对象,而非变量值本身。 (3)检验步骤 将两组样本混合并按升序排列 分别计算两组样本秩的累计频数和累计频率 计算两组累计频率的差,得秩的差值序列及D统计量 SPSS计算大
10、样本下的 和对应的p值 (3)决策: :拒绝原假设,两总体的分布有显著差异 :不拒绝原假设,两总体的分布无显著差异,7.2.3两独立样本的游程检验,1.基本思想 (1)原假设:两组独立样本来自的两总体的分布无显著差异。 (2)检验步骤 将两组样本混合并按升序排列,组标记值也随之重新排列 计算组标记值序列的游程数 根据游程数计算Z统计量,Z统计量近似服从正态分布 (3)决策: :拒绝原假设,两总体的分布有显著差异 :不拒绝原假设,两总体的分布无显著差异,7.2.4极端反应检验,1.基本思想 (1)原假设:两独立样本来自的两个总体的分布无显著差异。 (2)一组样本为控制样本,一组样本为实验样本,看
11、实验样本相对于控制样本是否出现了极端反应。 (3)检验步骤 两组样本混合按升序排列 求控制样本的最小秩 和最大秩 计算跨度 为了消除样本数据中的极端值,计算跨度前可按比例(通常5%)去除控制样本中靠近两端的样本值,再求跨度,得截头跨度 针对跨度或截头跨度计算H统计量:,小样本下,H服从Hollander分布,大样本下,H近似服从正态分布,(4)决策: H统计量的p值显著性水平,不拒绝原假设,两独立样本来自的总体分布不存在显著差异,7.2.5两独立样本非参数检验的步骤,Analyze-Nonparametric Tests-2 independent samples (1)选择待检验的变量到Te
12、st variable list (2)grouping variable:存放组标志的变量,并通过define groups给出两组的标志值。 (3)test type:选择相应的检验方法,7.2.6应用案例,利用“使用寿命”数据,判断两种工艺下产品的使用寿命的分布是否存在显著差异,进而对两个工艺的优劣进行判断。 分析: 两个工艺产品的使用寿命可看作两独立样本,可以通过曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验实现。,7.3多独立样本的非参数检验,1.通过分析多组独立样本数据,推断样本来自的多个总体的中位数或分布是否存在显著差异。 2.方法:中位数检验、Kruskal-Wal
13、lis检验、Jonckheere-Terpstra检验。,7.3.1中位数检验,1.基本思想 (1)原假设:多个独立样本来自的多个总体的中位数无显著差异。 (2)检验步骤 将多组样本混合升序排列,求混合样本的中位数 分别计算各组样本中大于和小于中位数的样本个数,形成列联表(p230 表7-13) 利用卡方检验分析各组样本来自的总体对中位数的分布是否一致。,(3)决策 卡方统计量的p值显著性水平,不拒绝原假设,多个独立样本来自的总体的中位数不存在显著差异。,7.3.2多独立样本的Kruskal-Wallis检验,1.基本思想 (1)原假设:多个独立样本来自的多个总体的分布无显著差异。 (2)是两
14、独立样本曼-惠特尼U检验的推广 (3)检验步骤 将多组样本数据混合并升序排列,求各变量的秩 考察各组秩的均值是否有显著差异 各组秩的差异借助方差分析:秩的变差分解为:组间差和组内差 a若秩的总变差大部分可由组间差解释,则各样本组的总体分布存在显著差异 b若秩的总变差大部分不能由组间差解释,则各样本组的总体分布无显著差异,构造K-W统计量 (4)决策:SPSS自动计算K-W统计量和对应的p值 p值显著性水平,不拒绝原假设,多个独立样本来自的多个总体分布无显著差异。,7.3.3多独立样本的Jonckheere-Terpstra检验,1.基本思想 (1)原假设:多个独立样本来自的多个总体的分布无显著
15、差异 (2)J-T统计量,(3)决策:SPSS自动计算J-T统计量,Z统计量和对应的p值 p值显著性水平,不拒绝原假设,多个独立样本来自的多个总体分布无显著差异。,7.3.4多独立样本非参数检验的步骤,1.按规定的格式组织数据: 设置两个变量分别存放样本值和组标记值 2.菜单: Analyze-Nonparametric Tests- K independent samples (1)选择待检验的变量到Test variable list (2)grouping variable:存放组标志的变量,并通过define groups给出标志值的取值范围。 (3)test type:选择相应的检验
16、方法,7.3.5 应用案例,利用“多城市儿童身高”数据,对北京、上海、成都、广州四城市的周岁儿童身高进行比较分析,推断四城市周岁儿童身高是否存在显著差异。 分析: (1)对身高分布无确切把握,涉及多个独立样本采采用多独立样非参数检验 (2)分别用中位数检验、多独立样本的Kruskal-Wallis检验、多独立样本的Jonckheere-Terpstra检验实现。,7.4两配对样本的非参数检验,1.通过两配对样本推断样本来自的两个总体的分布是否存在显著差异。 2.方法:McNemar检验、符号检验、Wilcoxon符号秩检验。,7.4.1两配对样本的McNemar检验,1.基本思想 (1) Mc
17、Nemar检验是一种变化显著性检验,将研究对象自身作为对照者检验其“前后”的变化是否显著。 (2)原假设:两配对样本来自的两总体的分布无显著差异。 (3)分析的变量是二值变量,若不是二值变量,应现将数据转换后再使用。导致该方法的应用范围具有局限性。 (4) McNemar检验采用二项分布检验方法,小样本下计算二项分布的累计精确概率,大样本下采用修正的Z统计量。 (5)SPSS自动计算Z统计量和对应的p值 p值显著性水平,不拒绝原假设,两配对样本来自的两总体分布无显著差异,7.4.2两配对样本的符号检验,1.基本思想 (1)原假设:两配对样本来自的两总体的分布无显著差异。 (2)利用正负符号的个
18、数实现检验。 (3)检验步骤 分别用第二组样本的各观察值减第一组对应样本观察值,差值为正记为+,差值为负记为- 将+的个数与-的个数进行比较:采用二项分布检验法,对正负符号变量进行单样本二项分布检验。 小样本下计算二项分布的累计精确概率,大样本下采用修正的Z统计量 (4)SPSS自动计算Z统计量和对应的p值 p值显著性水平,不拒绝原假设,两配对样本来自的两总体分布无显著差异 (4)缺陷:两配对样本的符号检验注重对变化方向的分析,只考虑了数据变化的性质,没有考虑变化的幅度,对数据的利用不够充分。,7.4.3两配对样本Wilcoxon符号秩检验,1.基本思想 (1)原假设:两配对样本来自的两总体的
19、分布无显著差异。 (2)检验步骤 分别用第二组样本的各观察值减第一组对应样本观察值,差值为正记为+,差值为负记为-,并保持差值数据 将差值变量按升序排列,并求差值变量的秩 分别计算正号秩总和 负号秩总和 统计量,(3)决策:SPSS自动计算Z统计量和对应的p值 p值显著性水平,不拒绝原假设,两配对样本来自的两总体分布无显著差异,7.4.4两配对样本非参数检验的步骤,1.按规定的格式组织数据: 设置两个变量分别存放两组样本的样本值 2.菜单: Analyze-Nonparametric Tests- 2 related samples (1)选择待检验的两个配对变量到Test pairs lis
20、t (2)test type:选择相应的检验方法,7.4.5应用案例,1.利用“统计学习”数据,分析学生在学习“统计学”课程前后对统计学重要性的认知程度是否发生了显著改变。 分析: (1)统计学习前后,属于配对样本 (2)认知程度属二值变量 (3)可以采用两配对样本McNemar检验,2.利用“训练成绩”数据,分析新训练方法是否有助于提高跳远运动员的成绩。 分析: (1)新训练方法使用前后,属于配对样本 (2)可采用两配对样本的符号检验、两配对样本Wilcoxon符号秩检验实现。,7.5多配对样本的非参数检验,1.通过多组配对样本推断样本来自的多个总体的中位数或分布是否存在显著差异。 2.方法
21、:Friedman检验、Cochran Q检验、Kendall协同系数检验。,7.5.1多配对样本的Friedman检验,1.基本思想 (1)原假设:多个配对样本来自的多个总体的分布无显著差异。 (2)原理 利用秩,通过类似方差分析的方法实现检验 若不同样本下的秩不存在显著差异,则秩的组间差在秩的总平均变差中占较小的比例。 (3)检验步骤 以行为单位将数据升序排列,并求各变量在各自行中的秩 分别计算各组样本下的秩总和和平均秩,计算Frideman检验统计量 Frideman检验统计量与多独立样本的Kruskal-Wallis检验中的K-W统计量相似,区别在于: K-W统计量中的秩是全体数据排序后得到的,Frideman检验统计量的秩是在各区组内分别独立排序得到的。,(4)决策:SPSS自动计算Frideman统计量和对应的p值 p值显著性水平,不拒绝原假设,多配对样本来自的多个总体分布无显著差异 (5)适用于定距型数据,7.5.2多配对样本Cochran Q检验,1.基本思想 (1)原假设:多个配对样本来自的多个总体的分布无显著差异 (2)适用于对二值品质型数据进行检验。 (3) Co
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 购买店面的购买合同范本
- 装修工人做工程合同范本
- 销售员工入职培训
- 办公楼结构加固改造施工方案及技术措施
- 三四年级体育教学考核实施计划
- 前厅员工安全意识培训
- 小儿留置针健康宣教要点
- 湘教版五年级音乐上册声乐教学计划
- 教科版二年级上册科学课外辅导计划
- 八年级生物下册动物实验教学计划
- 投标货物包装、运输方案
- 抽水蓄能电站地下厂房系统开挖工程施工方案
- 国家开放大学《建筑力学》形成性作业1-4参考答案
- 流浪未成年人救助保护中心建设标准
- 2025数学步步高大一轮复习讲义人教A版复习讲义含答案
- 高中英语单词构词法(完整版)
- PLM模块业务流程图
- 数字货币概论 课件 第5章 稳定币的原理与实现
- 专题02《物态变化》压轴培优题型训练【十三大题型】(原卷版)
- 大学生科研训练与论文写作全套教学课件
- 短剧制作美学-叙事技巧与镜头语言
评论
0/150
提交评论