第七章-SPSS非参数检验.ppt_第1页
第七章-SPSS非参数检验.ppt_第2页
第七章-SPSS非参数检验.ppt_第3页
第七章-SPSS非参数检验.ppt_第4页
第七章-SPSS非参数检验.ppt_第5页
免费预览已结束,剩余61页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章 SPSS非参数检验 本章内容 7 1单样本的非参数检验7 2两独立样本的非参数检验7 3多独立样本的非参数检验7 4两配对样本的非参数检验7 5多配对样本的非参数检验 非参数检验 非参数检验 1 在总体分布未知或知道甚少的情况下 利用样本数据对总体分布形态等进行推断的方法 2 推断过程中不涉及有关总体分布的参数 7 1单样本的非参数检验 1 目的 样本来自总体的分布是否与某个已知的分布相吻合 绘制样本数据的直方图 pp图 QQ图判断 粗略 通过非参数检验 精确2 单样本非参数检验 1 对单个总体的分布形态等进行推断 2 方法 卡方检验 二项分布检验 K S检验 变量值随机性检验等 7 1 1总体分布的卡方检验 1 基本思想 吻合性检验 1 原假设 样本来自的总体分布与期望分布无显著差异 变量值落入第i个子集中的理论概率为 相应的期望频率为 2 实现步骤 Analyze NonparametricTests Chi Square 1 选定待检验的变量到 TestVariablelist 2 在 ExpectedRange 中确定参与分析的观测值的范围 Getfromdata 所有观测数据都参与分析 usespecifiedrange 只在该取值范围内的观测数据才参与分析 3 Expectedvalues 给出各理论值 Allcategoriesequal 所有子集的频数都相同 value 依次输入值 通过 add change remove 进行增加 修改和删除 3 应用案例 医学研究表明心脏病人猝死人数与日期的关系为 一周内 星期一猝死者较多 其他日子基本相当 各天的比例近似为 2 8 1 1 1 1 1 1根据 心脏病猝死 数据 推断总体分布是否与理论分布相吻合 分析 利用总体分布卡方检验实现 7 1 2二项分布检验 1 基本思想 1 通过样本数据检验样本来自的总体是否服从指定概率p的二项分布 2 小样本 精确检验大样本 近似检验 2 实现步骤 Analyze NonparametricTests Binomial 1 选定待检验的变量到 TestVariablelist 2 definedichotomy 中指定如何分类 getfromdata 检验变量为二值变量 cutpoint 输入具体数值 大于等于该值的为第一组 大于该组的为第二组 3 Testproportion 输入二项分布的检验概率值 3 应用案例 利用 产品合格率 数据 推断该批产品的一级品率是否为90 分析 产品合格与否属于二值变量 可以通过二项分布检验实现 7 1 3单样本K S检验 1 基本思想 1 以俄罗斯数学家柯尔莫哥和斯米诺夫名字命名 2 利用样本数据推断样本来自的总体是否服从某一理论分布 是一种拟合优度的检验方法 适用于探索连续型随机变量的分布 3 步骤 计算各样本观测值在理论分布中出现的理论累计概率值F x 计算各样本观测值的实际累计概率值S x 计算理论累计概率值与实际累计概率值的差D x 计算差值序列中最大绝对差值D 4 原假设成立时 小样本下 D kolmogorov分布 大样本下 近似服从K x 分布 SPSS仅给出大样本下的和对应的p值 5 决策 D统计量的p值显著性水平 不拒绝原假设 样本来自的总体与指定分布无显著差异 2 实现步骤 Analyze NonparametricTests 1 sampleK S 1 选定待检验的变量到 TestVariablelist 2 Testdistribution 选择理论分布 normal 正态分布 uniform 均匀分布 poisson 泊松分布 exponential 指数分布 3 应用案例 利用 儿童身高 数据分析周岁儿童身高总体是否服从正态分布 分析 可以通过单样本K S检验实现 7 1 4变量值随机性检验 1 基本思想 1 通过对样本变量值的分析 实现对总体的变量值出现是否随机进行检验 2 原假设 总体变量值出现是随机的 检验依据 游程 样本序列中连续出现相同的变量值的次数 游程数太大或太小都表明变量值存在不随机的现象 3 检验统计量 4 决策 Z统计量的p值显著性水平 不拒绝原假设 变量值的出现是随机的 2 实现步骤 Analyze NonparametricTests Runs 1 选定待检验的变量到 TestVariablelist 2 cutpoint 计算游程数的分界值 median 样本中位数为分界值 mode 样本众数为分界值 mean 样本均值为分界值 custom 以用户输入的值为分界值 SPSS将小于该分界值的所有变量作为一组 大于或等于该分界值的所有变量作为一组 计算游程 3 应用案例 利用 电缆数据 推断耐压设备的工作是否正常 分析 若耐压数据的变动是随机的 则设备工作正常 若耐压数据的变动不是随机的 则设备工作存在不正常 可以通过变量值随机性检验实现 7 2两独立样本的非参数检验 1 独立样本 在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本 2 推断样本来自的两个总体的分布等是否存在显著差异 3 方法 曼 惠特尼U检验 K S检验 W W游程检验 极端反应检验等 7 2 1两独立样本的曼 惠特尼U检验 1 基本思想 1 原假设 两组独立样本来自的两总体分布无显著差异 2 通过两组样本平均秩的研究实现推断秩 变量值排序的名次 变量值有几个 对应的秩便有几个 3 检验步骤 将两组样本混合并升序排列 得每个数据的秩 分别对样本X和Y的秩求平均 得平均秩和 计算样本X优于样本Y秩的个数和样本Y优于样本X秩的个数 依据和计算WilcoxonW统计量和曼 惠特尼U统计量 WilcoxonW统计量 曼 惠特尼统计量U为 大样本下 U近似服从正态分布 7 2 2两独立样本的K S检验 1 基本思想 1 原假设 两组独立样本来自的两总体的分布无显著差异 2 与单样本K S检验的基本思路大体一致 差别在于 以变量值的秩为分析对象 而非变量值本身 3 检验步骤 将两组样本混合并按升序排列 分别计算两组样本秩的累计频数和累计频率 计算两组累计频率的差 得秩的差值序列及D统计量 SPSS计算大样本下的和对应的p值 3 决策 拒绝原假设 两总体的分布有显著差异 不拒绝原假设 两总体的分布无显著差异 7 2 3两独立样本的游程检验 1 基本思想 1 原假设 两组独立样本来自的两总体的分布无显著差异 2 检验步骤 将两组样本混合并按升序排列 组标记值也随之重新排列 计算组标记值序列的游程数 根据游程数计算Z统计量 Z统计量近似服从正态分布 3 决策 拒绝原假设 两总体的分布有显著差异 不拒绝原假设 两总体的分布无显著差异 7 2 4极端反应检验 1 基本思想 1 原假设 两独立样本来自的两个总体的分布无显著差异 2 一组样本为控制样本 一组样本为实验样本 看实验样本相对于控制样本是否出现了极端反应 3 检验步骤 两组样本混合按升序排列 求控制样本的最小秩和最大秩 计算跨度 为了消除样本数据中的极端值 计算跨度前可按比例 通常5 去除控制样本中靠近两端的样本值 再求跨度 得截头跨度 针对跨度或截头跨度计算H统计量 小样本下 H服从Hollander分布 大样本下 H近似服从正态分布 4 决策 H统计量的p值显著性水平 不拒绝原假设 两独立样本来自的总体分布不存在显著差异 7 2 5两独立样本非参数检验的步骤 Analyze NonparametricTests 2independentsamples 1 选择待检验的变量到 Testvariablelist 2 groupingvariable 存放组标志的变量 并通过 definegroups 给出两组的标志值 3 testtype 选择相应的检验方法 7 2 6应用案例 利用 使用寿命 数据 判断两种工艺下产品的使用寿命的分布是否存在显著差异 进而对两个工艺的优劣进行判断 分析 两个工艺产品的使用寿命可看作两独立样本 可以通过曼 惠特尼U检验 K S检验 W W游程检验 极端反应检验实现 7 3多独立样本的非参数检验 1 通过分析多组独立样本数据 推断样本来自的多个总体的中位数或分布是否存在显著差异 2 方法 中位数检验 Kruskal Wallis检验 Jonckheere Terpstra检验 7 3 1中位数检验 1 基本思想 1 原假设 多个独立样本来自的多个总体的中位数无显著差异 2 检验步骤 将多组样本混合升序排列 求混合样本的中位数 分别计算各组样本中大于和小于中位数的样本个数 形成列联表 p230表7 13 利用卡方检验分析各组样本来自的总体对中位数的分布是否一致 3 决策 卡方统计量的p值显著性水平 不拒绝原假设 多个独立样本来自的总体的中位数不存在显著差异 7 3 2多独立样本的Kruskal Wallis检验 1 基本思想 1 原假设 多个独立样本来自的多个总体的分布无显著差异 2 是两独立样本曼 惠特尼U检验的推广 3 检验步骤 将多组样本数据混合并升序排列 求各变量的秩 考察各组秩的均值是否有显著差异 各组秩的差异借助方差分析 秩的变差分解为 组间差和组内差a若秩的总变差大部分可由组间差解释 则各样本组的总体分布存在显著差异b若秩的总变差大部分不能由组间差解释 则各样本组的总体分布无显著差异 构造K W统计量 4 决策 SPSS自动计算K W统计量和对应的p值 p值显著性水平 不拒绝原假设 多个独立样本来自的多个总体分布无显著差异 7 3 3多独立样本的Jonckheere Terpstra检验 1 基本思想 1 原假设 多个独立样本来自的多个总体的分布无显著差异 2 J T统计量 3 决策 SPSS自动计算J T统计量 Z统计量和对应的p值 p值显著性水平 不拒绝原假设 多个独立样本来自的多个总体分布无显著差异 7 3 4多独立样本非参数检验的步骤 1 按规定的格式组织数据 设置两个变量分别存放样本值和组标记值2 菜单 Analyze NonparametricTests Kindependentsamples 1 选择待检验的变量到 Testvariablelist 2 groupingvariable 存放组标志的变量 并通过 definegroups 给出标志值的取值范围 3 testtype 选择相应的检验方法 7 3 5应用案例 利用 多城市儿童身高 数据 对北京 上海 成都 广州四城市的周岁儿童身高进行比较分析 推断四城市周岁儿童身高是否存在显著差异 分析 1 对身高分布无确切把握 涉及多个独立样本采采用多独立样非参数检验 2 分别用中位数检验 多独立样本的Kruskal Wallis检验 多独立样本的Jonckheere Terpstra检验实现 7 4两配对样本的非参数检验 1 通过两配对样本推断样本来自的两个总体的分布是否存在显著差异 2 方法 McNemar检验 符号检验 Wilcoxon符号秩检验 7 4 1两配对样本的McNemar检验 1 基本思想 1 McNemar检验是一种变化显著性检验 将研究对象自身作为对照者检验其 前后 的变化是否显著 2 原假设 两配对样本来自的两总体的分布无显著差异 3 分析的变量是二值变量 若不是二值变量 应现将数据转换后再使用 导致该方法的应用范围具有局限性 4 McNemar检验采用二项分布检验方法 小样本下计算二项分布的累计精确概率 大样本下采用修正的Z统计量 5 SPSS自动计算Z统计量和对应的p值 p值显著性水平 不拒绝原假设 两配对样本来自的两总体分布无显著差异 7 4 2两配对样本的符号检验 1 基本思想 1 原假设 两配对样本来自的两总体的分布无显著差异 2 利用正负符号的个数实现检验 3 检验步骤 分别用第二组样本的各观察值减第一组对应样本观察值 差值为正记为 差值为负记为 将 的个数与 的个数进行比较 采用二项分布检验法 对正负符号变量进行单样本二项分布检验 小样本下计算二项分布的累计精确概率 大样本下采用修正的Z统计量 4 SPSS自动计算Z统计量和对应的p值 p值显著性水平 不拒绝原假设 两配对样本来自的两总体分布无显著差异 4 缺陷 两配对样本的符号检验注重对变化方向的分析 只考虑了数据变化的性质 没有考虑变化的幅度 对数据的利用不够充分 7 4 3两配对样本Wilcoxon符号秩检验 1 基本思想 1 原假设 两配对样本来自的两总体的分布无显著差异 2 检验步骤 分别用第二组样本的各观察值减第一组对应样本观察值 差值为正记为 差值为负记为 并保持差值数据 将差值变量按升序排列 并求差值变量的秩 分别计算正号秩总和负号秩总和 统计量 3 决策 SPSS自动计算Z统计量和对应的p值 p值显著性水平 不拒绝原假设 两配对样本来自的两总体分布无显著差异 7 4 4两配对样本非参数检验的步骤 1 按规定的格式组织数据 设置两个变量分别存放两组样本的样本值2 菜单 Analyze NonparametricTests 2relatedsamples 1 选择待检验的两个配对变量到 Testpairslist 2 testtype 选择相应的检验方法 7 4 5应用案例 1 利用 统计学习 数据 分析学生在学习 统计学 课程前后对统计学重要性的认知程度是否发生了显著改变 分析 1 统计学习前后 属于配对样本 2 认知程度属二值变量 3 可以采用两配对样本McNemar检验 2 利用 训练成绩 数据 分析新训练方法是否有助于提高跳远运动员的成绩 分析 1 新训练方法使用前后 属于配对样本 2 可采用两配对样本的符号检验 两配对样本Wilcoxon符号秩检验实现 7 5多配对样本的非参数检验 1 通过多组配对样本推断样本来自的多个总体的中位数或分布是否存在显著差异 2 方法 Friedman检验 CochranQ检验 Kendall协同系数检验 7 5 1多配对样本的Friedman检验 1 基本思想 1 原假设 多个配对样本来自的多个总体的分布无显著差异 2 原理 利用秩 通过类似方差分析的方法实现检验 若不同样本下的秩不存在显著差异 则秩的组间差在秩的总平均变差中占较小的比例 3 检验步骤 以行为单位将数据升序排列 并求各变量在各自行中的秩 分别计算各组样本下的秩总和和平均秩 计算Frideman检验统计量 Frideman检验统计量与多独立样本的Kruskal Wallis检验中的K W统计量相似 区别在于 K W统计量中的秩是全体数据排序后得到的 Frideman检验统计量的秩是在各区组内分别独立排序得到的 4 决策 SPSS自动计算Frideman统计量和对应的p值 p值显著性水平 不拒绝原假设 多配对样本来自的多个总体分布无显著差异 5 适用于定距型数据 7 5 2多配对样本CochranQ检验 1 基本思想 1 原假设 多个配对样本来自的多个总体的分布无显著差异 2 适用于对二值品质型数据进行检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论