SPSS第七章SPSS的非参数检验.ppt_第1页
SPSS第七章SPSS的非参数检验.ppt_第2页
SPSS第七章SPSS的非参数检验.ppt_第3页
SPSS第七章SPSS的非参数检验.ppt_第4页
SPSS第七章SPSS的非参数检验.ppt_第5页
免费预览已结束,剩余102页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

制作人 夏怡凡 第7章SPSS的非参数检验 主要内容 概述主要介绍非参数方法的思想和用途 单样本非参数检验介绍许多最基本的非参数检验方法 两独立样本的非参数检验介绍独立非参数检验方法 多独立样本的非参数检验介绍对应多独立非参数检验的方法 两配对样本和多配对样本的非参数检验介绍相应的方法 7 0非参数方法概述 非参数检验是统计检验的重要组成部分 与参数检验共同组成统计推断的基本内容非参数检验针对总体分布未知情况下 利用样本对总体分布形态进行推断 从而得出尽可能多的信息 因为不涉及总体分布的参数 因而被命名为 非参数检验 7 0非参数检验概述 非参数检验主要涉及以下几个方面单样本非参数检验 两独立样本非参数检验 两配对样本非参数检验 多独立样本非参数检验 多配对样本非参数检验 注意对比参数检验章节的概念进行学习 7 1单样本非参数检验 拿到一批数据 总是希望得到数据总体的分布情况 这时可以通过绘制直方图 P P图 Q Q图的方式来了解总体的大概分布 当然也可以用非参数的方法来实现 SPSS单样本非参数检验就是对单个总体的分布形态进行推断的方法 包括卡方检验 二项分布检验 K S检验以及变量值随机性检验 7 1 1总体分布的卡方检验 可以解决的问题 心脏病猝死的人数在一周内的分布比例是否吻合2 8 1 1 1 1 1 1 基本思想 根据数据 推断总体分布与期望分布是否存在显著差异 依据是如果总体分布与期望分布没有显著差异 那么实际频数该与期望频数没有显著的差异 如果卡方值较大 说明实际频数与期望频数差异较大 从而否定两者不存在显著差异 7 1 1 2卡方检验的基本操作 Analyze菜单 NonparametricTests Chi Square 如下窗口 1 7 1 1 2基本操作 续 ExpectedValues ExpectedRanges Lower Upper 7 1 1 2卡方检验的基本操作 续 将待检验的变量选入TestVariable框中 在ExpectedRange框中确定参与分析的样本范围 其中Getfromdata表示所有样本都参与分析 UseSpecifiedRange表示只有在取值范围内的样本才参与分析 在Expected框中给出期望的各个p值 其中AllCategoriesequal表示所有子集的p值相同 也可在Value框中输入p值 可以添加 删除和修改 7 1 1 3总体卡方检验应用举例 为研究心脏病人猝死人数与日期的关系 收集到168个观察数据 周一到周日死亡人数分别是55231811262015 现用这些样本 推断猝死人数在一周的分布是否是2 8 1 1 1 1 1 1 采用总体分布卡方检验 结果如下图 结果说明 周一到周日期望死亡频数为53 519 119 119 119 119 119 1 实际观测频数与期望频数差异为1 53 9 1 1 8 16 90 9 1 1 经计算卡方值为7 757 对应的p值为0 256 不显著 所以认为总体分布与期望分布没有显著差异 7 1 2二项分布检验 可以解决的问题 取值是二值的 通常用0和1代表这两个值 多次实验形成二项分布 基本思想 根据数据 推断总体分布是否服从指定的概率值为p的二项分布 推断两者是否显著差异 可以分为大样本和小样本事件 大样本用估计的方法 而小样本可以精确计算 7 1 2 2二项分布检验的基本操作 Analyze菜单 NonparametricTests Binomial 如下窗口 1 7 1 2 2基本操作 续 DefineDichotomy TestProportions 7 1 1 2二项分布检验的基本操作 续 将待检验的变量选入TestVariable框中 在DefineDichotomy框中指定如何分类 如果检验变量是二值变量选择Getfromdata CutPoint框中输入数可以将非二值变量分成两组 在Test框中给出待检验的p值 7 1 2 3二项分布检验应用举例 产品合格率检验 为检验产品合格率是否大于90 抽出25个样品检验并得到检测数据 其中1表示一级品 0表示非一级品 这里采用二项分布检验法 具体结果如下图 结果说明 上表表明 一级品的样本率为0 8 检验一级品概率是0 9 由于是小样本 自动计算精确概率 发现23个样本中一级品率小于0 9的概率为0 193 如果确定显著性水平为0 05 则检验不显著 所以认为一级品率与0 9没有显著差异 7 1 2 3二项分布检验应用举例 储户对未来收入看法检验 为检验储户是对未来的收入是持乐观态度还是悲观态度 我们将检验用户持乐观态度的概率是否为0 6 这里采用二项分布检验法 具体结果如下图 结果说明 上表表明 持乐观态度的储户77人 比例为0 2 持保守和悲观态度的储户为236 比例是0 9 由于是大样本 采用近似计算法 得到Z值的检验p值为0 000 如果确定显著性水平为0 05 则检验显著 所以乐观储户比例显著小于0 6 7 1 3单样本的K S检验 可以解决的问题 推断样本来自的总体是否服从一个理论分布 是一种拟合优度检验 基本思想 根据数据 推断总体分布是否服从正态分布 推断两者是否显著差异 7 1 2 2单样本K S检验的基本操作 Analyze菜单 NonparametricTests 1 SampleK S 如下窗口 1 7 1 3 2基本操作 续 TestDistribution 7 1 1 2K S检验的基本操作 续 将待检验的变量选入TestVariable框中 在TestDistribution框中选择理论分布 Normal是正态分布 Uniform是均匀分布 Poisson是泊松分布 Exponential是指数分布 7 1 2 3二项分布检验应用举例 周岁儿童身高总体的分布检验 利用搜集到的21个儿童的数据样本检验儿童的身高是否服从正态分布 结果如下图 结果说明 上表表明 数据的均值为71 854 概率p值为0 344 如果确定显著性水平为0 05 则检验不显著 所以认为儿童身高的分布和正态分布没有显著差异 7 1 2 3K S检验应用举例 储户存储金额总体的分布检验 我们将检验储蓄金额的分布是否与正态分布显著差异 这里采用K S检验法 具体结果如下图 结果说明 上表表明 储户一次存款金额的总体分布与正态分布是有显著差异的 p值接近0 可以对应看PP图和QQ图 可以更加直观看到 7 1 4变量随机性检验 可以解决的问题 对样本变量值分析 得出变量是否随机的检验 基本思想 游程的思想 游程是指样本中连续出现相同变量值的次数 也可以理解为变量值发生变化的次数再加上1 例如 10110110100110001010100000111 游程为17 游程太大或者太小都说明变量不是随机变化的 7 1 2 2游程检验的基本操作 Analyze菜单 NonparametricTests Runs 如下窗口 1 7 1 4 2基本操作 续 CutPoint 7 1 4 2游程检验的基本操作 续 将待检验的变量选入TestVariable框中 在CutPoint框中确定计算游程数的分界值 Median是用中位数分界 Mode是样本众数 Mean是样本均值分界 Custom是值用用户输入的值作为分界点 7 1 4 3游程检验应用举例 检验某耐压设备工作是否正常 记录下各工作点上设备的耐压值 用游程检验来检验其是否随机变化 结果如下图 结果说明 上表表明 分界值为中位数204 55 共有样本20个 游程数为13 检验统计量计算的值为0 689 对应的概率p值为0 491 如果确定显著性水平为0 05 则检验不显著 所以认为设备变化是随机的 因而设备正常工作 7 2两独立样本的非参数检验 两个分布未知的总体 比较他们均值的差异和位置的差异也是非参数检验的主要内容之一 两独立样本的非参数检验正是在总体分布未知的情况下 通过两组样本的分析 来推断总体的分布是否存在显著差异 例子 两种生产工艺 两种产品差别等 7 2 1两独立样本的曼 惠特尼U检验 曼 惠特尼U检验可以用于比较两总体分布有无显著差异 其基本思想是通过对两组样本平均秩的比较来实现推断 所谓秩 就是变量值的大小顺序名次 每个变量值都有一个名次 7 2 1两独立样本的曼 惠特尼U检验 曼 惠特尼U检验的基本步骤 将样本混合后排序 得到各组数据中每个值的秩 分别对每组样本求平均秩 对两个平均秩的差距进行比较 显然如果差距较大 那肯定是一组数据偏大而另一组偏小的原因 这就有理由认为两个样本来自的总体有差异了 计算秩优先的个数 然后进行比较 不能相差太大 否则认为总体有差异 7 2 1两独立样本的曼 惠特尼U检验的计算例子 产品寿命比较问题 结果如下表 7 2 2两独立样本的K S检验 K S检验不仅能检验一个总体是否服从某个理论分布 而且能够检验两个总体分布是否存在显著差异 其基本思想是与单样本的K S检验基本相同 只是研究的对象变成了变量值的秩而不是变量值本身 7 2 1两独立样本K S检验 K S检验的基本步骤 首先 将两组样本混合后排序 分别计算两组样本秩的累计频数和累计频率 然后 计算累计频率的差 得到差值序列得到D统计量 计算得到对应的p值 参考显著性水平a 作出决策 7 2 1两独立样本的K S检验计算实例 7 2 2两独立样本的游程检验 游程检验是用来检验变量值的出现是否随机 两独立样本的游程是检验两个总体分布是否存在显著差异 其游程计算法与单样本时基本相同 只是研究的对象变成了变量值的秩而不是变量值本身 7 2 1两独立样本游程检验 游程检验的基本步骤 首先 将两组样本混合后按升序排序 按组标记序列计算游程 即如果排序后出现数据组标记为1221111 则有三个游程 如果游程较少 则分布存在较大差异 如果游程较大 则是无差异后应有的结果 根据游程计算得到Z统计量 并得到对应的p值 参考显著性水平a 作出决策 7 2 1两独立样本的游程检验计算实例 7 2 2两独立样本的极端反应检验 两独立样本的极端反应检验是从另一个角度检验检验两个总体分布是否存在显著差异 其基本思想是将一组样本作为控制样本 另一组样本作为实验样本 对照控制样本看实验样本是否出现了极端反应 如果没有极端反应 则两总体无显著差异 反之则是有显著差异 7 2 1两独立样本的极端反应检验 极端反应检验的基本步骤 首先 将两组样本混合后按升序排序 求出控制样本 即第一组样本的最大最小秩 并计算跨度 为消除极端之影响 去除两头得到截头跨度 对跨度或截头跨度做分析 如果跨度较小 则认为出现了极端反应 否则没有 7 2 1两独立样本的极端反应检验计算实例 7 2 5两独立样本非参数检验的基本操作 Analyze菜单 NonparametricTests 2IndependentSamples 如下窗口 1 7 2 5 2基本操作 续 TestType 7 2 6两独立样本非参数检验的基本操作 2 将待检验变量选入TestVariablelist框中 将存放组标志的变量选入GroupingVariable框中 单击DefineGroups 定义如何分组 在TestType框中选择检验方法 点击OK SPSS会自动计算组间方差 组内方差和F以及对应的概率P的值 计算结果显示在输出窗口中 7 2 6应用举例 两种产品中随机选取若干样本 分析其寿命是否显著差异 因为对产品寿命分布未知 因此选用非参数检验的方法 样本独立 所以用两独立非参数检验 分别用四种方法检验 结果分析 可以看到概率p值小于显著水平0 05 故检验显著 认为两种工艺下生产的产品寿命分布显著差异 结果分析 可以看到概率p值小于显著水平0 05 故检验显著 认为两种工艺下生产的产品寿命分布显著差异 结果分析 可以看到概率p值大于显著水平0 05 故检验不显著 认为两种工艺下生产的产品寿命分布无显著差异 结果分析 可以看到概率p值大于显著水平0 05 故检验不显著 认为两种工艺下生产的产品寿命分布无显著差异 7 3多独立样本的非参数检验 多个独立样本的非参数检验是通过分析多组独立样本数据 推断总体的中位数或者分布是否存在明显的差异 SPSS提供的多独立样本非参数检验主要有中位数检验 Kruskal Wallis检验 Jonkheer Terpstra检验 7 3 1中位数检验 中位数检验可以通过对多独立样本的分析 检验它们来自的总体的中位数有无显著差异 其基本思想是如果各个总体中位数相同 那么每组样本中 大于中位数和小于中位数的样本个数应该大致相同 7 3 1中位数检验 中位数检验的基本步骤 将样本混合后按升序排序 得到混合样本的中位数 分别计算每组样本大于和小于这个混合中位数的样本的个数 形成列联表 利用卡方检验法分析各组样本来自的总体对于上述中位数的分布是否一致 显然 如果各组样本大于小于中位数的样本基本相同 那么就认为有相同中位数 否则就是显著差异 7 3 2多独立样本的Kruskal Wallis检验 多独立样本的Kruskal Wallis检验实质是两独立样本的曼 惠特尼U检验在多样本总体下的推广 也用于检验多个总体的分布是否存在显著差异 7 3 2多独立样本Kruskal Wallis检验 Kruskal Wallis检验的基本思想和步骤 首先 将多组样本混合后按升序排序 计算各个样本值的秩 考察各组变量秩的均值是否有显著差异 如果多组样本秩的均值没有显著差异 则可以认为是总体的分布没有显著差异 否则 就认为数据无法混合 认为总体有显著差异 7 3 3多独立样本的Jonkheer Terpstra检验 Jonkheer Terpstra检验也是用来检验多独立样本的多个总体的分布是否存在显著差异的方法 其基本思想与两独立样本的曼 惠特尼U检验类似 也是计算一组样本观测值小于其他组观测值的个数 以此来构造统计量 7 3 3多独立样本Jonkheer Terpstra检验 游程检验的基本步骤 首先 计算i组样本比j组样本小的样本个数Uij 需要对每两组样本都计算一次 构造统计量J T统计量 在J T统计量的基础上 构造服从正太分布的Z统计量 7 3 5多独立样本非参数检验的基本操作 Analyze菜单 NonparametricTests KIndependentSamples 如下窗口 1 7 3 4基本操作 续 TestType 7 3 4多独立样本非参数检验的基本操作 2 将待检验变量选入TestVariablelist框中 将存放组标志的变量选入GroupingVariable框中 单击DefineGroups 定义如何分组 在TestType框中选择检验方法 点击OK SPSS会自动计算概率P的值 计算结果显示在输出窗口中 7 3 5应用举例 四城市北京 上海 成都 广州周岁儿童的身高比较分析 随机抽取四城市若干周岁儿童 分析四城市周岁儿童的身高是否存在显著差异 由于对身高没有明确的把握 所以用多独立非参数检验 分别用三种方法检验 结果分析 可以看到概率p值小于显著水平0 05 故检验显著 认为四个城市儿童身高分布在次检验下显著差异 结果分析 可以看到概率p值小于显著水平0 05 故检验显著 认为四个城市儿童身高分布在次检验下显著差异 7 3 5应用举例 不同职业储户的存款金额分布比较 结果分析 可以看到概率p值小于显著水平0 05 故检验显著 认为各种职业下存款的分布在次检验下时显著差异的 结果分析 可以看到概率p值小于显著水平0 05 故检验显著 认为各种职业下存款的分布在次检验下时显著差异的 7 4两配对样本的非参数检验 两配对样本的非参数检验是在总体分布未知的情况下 通过分析两组配对样本数据 推断总体的分布是否存在明显的差异 SPSS提供的两配对样本非参数检验主要有McNemar检验 符号检验 Wilcoxom符号检验 7 4 1两配对样本的McNemar检验 McNemar检验是一种变化显著性检验 其基本思想是基于列联表进行分析的 分析的是一个二值变量 采用二项分布检验的办法 检验是否服从0 5为p值的二项分布 7 4 2两配对样本的符号检验 两配对样本的符号检验也是用来检验两配对样本的分布是否存在显著差

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论