spss16使用教程10.ppt_第1页
spss16使用教程10.ppt_第2页
spss16使用教程10.ppt_第3页
spss16使用教程10.ppt_第4页
spss16使用教程10.ppt_第5页
已阅读5页,还剩146页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS16实用教程 第10章非参数检验 前面已经讨论的许多统计分析方法对总体有特殊的要求 如T检验要求总体符合正态分布 F检验要求误差呈正态分布且各组方差整齐 等等 这些方法常用来估计或检验总体参数 统称为参数检验 但许多调查或实验所得的科研数据 其总体分布未知或无法确定 因为有的数据不是来自所假定分布的总体 或者数据根本不是来自一个总体 还有可能数据因为某种原因被严重污染 这样在假定分布的情况下进行推断的做法就有可能产生错误的结论 此时人们希望检验对一个总体分布形状不必作限制 这种不是针对总体参数 而是针对总体的某些一般性假设 如总体分布 的统计分析方法称非参数检验 NonparametricTests 非参数检验根据样本数目以及样本之间的关系可以分为单样本非参数检验 两独立样本非参数检验 多独立样本非参数检验 两配对样本非参数检验和多配对样本非参数检验几种 本章将介绍总体分布的卡方 Chi square 检验 二项分布 Binomial 检验 单样本K S Kolmogorov Smirnov 检验 单样本变量值随机性检验 RunsTest 两独立样本非参数检验 多独立样本非参数检验 两配对样本非参数检验 多配对样本非参数检验等8类常用的非参数检验方法 其中前4种属于单样本非参数检验 10 1总体分布的卡方 Chi square 检验 在得到一批样本数据后 人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合 这可以通过绘制样本数据直方图的方法来进行粗略的判断 如果需要进行比较准确的判断 则需要使用非参数检验的方法 其中总体分布的卡方检验 也记为 2检验 就是一种比较好的方法 10 1 1统计学上的定义和计算公式 定义 总体分布的卡方检验适用于配合度检验 是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异 它的零假设H0 样本来自的总体分布形态和期望分布或某一理论分布没有显著差异 因此 总体分布的卡方检验是一种吻合性检验 比较适用于一个因素的多项分类数据分析 总体分布的卡方检验的数据是实际收集到的样本数据 而非频数数据 研究问题某地一周内各日患忧郁症的人数分布如表10 1所示 请检验一周内各日人们忧郁数是否满足1 1 2 2 1 1 1 10 1 2SPSS中实现过程 表10 1学生的数学成绩 实现步骤 图10 1在菜单中选择 WeightCases 命令 图10 2 WeightCases 对话框 图10 3在菜单中选择 Chi Square 命令 图10 4 Chi SquareTest 对话框 图10 5 Chi SquareTest Options 对话框 1 本例输出结果中有两个表格 其中第一个表格如下 10 1 3结果和讨论 2 输出的结果文件中第二个表格如下 10 2二项分布检验 10 2 1统计学上的定义和计算公式 现实生活中有很多数据的取值只有两类 如医学中的生与死 患病的有与无 性别中的男性和女性 产品的合格与不合格等 从这种二分类总体中抽取的所有可能结果 要么是对立分类中的这一类 要么是另一类 其频数分布称为二项分布 调用SPSS中的二项分布检验 Binomial 可对样本资料进行二项分布分析 SPSS二项分布检验就是根据收集到的样本数据 推断总体分布是否服从某个指定的二项分布 其零假设是H0 样本来自的总体与所指定的某个二项分布不存在显著的差异 SPSS中的二项分布检验 在样本小于或等于30时 按照计算二项分布概率的公式进行计算 样本数大于30时 计算的是Z统计量 认为在零假设下 Z统计量服从正态分布 Z统计量的计算公式如下 SPSS将自动计算Z统计量 并给出相应的相伴概率值 如果相伴概率小于或等于用户的显著性水平 则应拒绝零假设H0 认为样本来自的总体分布形态与指定的二项分布存在显著差异 如果相伴概率值大于显著性水平 则不能拒绝零假设H0 认为样本来自的总体分布形态与指定的二项分布不存在显著差异 SPSS二项分布检验的数据是实际收集到的样本数据 而非频数数据 研究问题某地某一时期内出生35名婴儿 其中女性19名 定Sex 0 男性16名 定Sex 1 问这个地方出生婴儿的性别比例与通常的男女性比例 总体概率约为0 5 是否不同 数据如表10 2所示 10 2 2SPSS中实现过程 表10 235名婴儿的性别 实现步骤 图10 6在菜单中选择 BinomialTest 命令 图10 7 BinomialTest 对话框 图10 8 BinomialTest Options 对话框 10 2 3结果和讨论 10 3SPSS单样本变量值随机性检验 10 3 1统计学上的定义和计算公式 定义 单样本变量值的随机性检验是对某变量的取值出现是否随机进行检验 也称为游程检验 Run过程 单样本变量值的随机性检验是由Wald提出的 它的零假设为H0 总体某变量的变量值出现是随机的 单样本变量值的随机性检验通过游程 Run 数来实现 所谓游程是样本序列中连续出现的变量值的次数 在SPSS单样本变量值的随机性检验中 SPSS将利用游程构造Z统计量 并依据正态分布表给出对应的相伴概率值 如果相伴概率小于或等于用户的显著性水平 则应拒绝零假设H0 认为样本值的出现不是随机的 如果相伴概率值大于显著性水平 则不能拒绝零假设H0 认为变量值的出现是随机的 10 3 2SPSS中实现过程 研究问题某村发生一种地方病 其住户沿一条河排列 调查时对发病的住户标记为 1 对非发病的住户标记为 0 共35户 其取值如表10 3所示 表10 335名住户发病情况 实现步骤 图10 9在菜单中选择 Runs 命令 图10 10 RunsTest 对话框 图10 11 RunsTest Options 对话框 10 3 3结果和讨论 10 4 1统计学上的定义和计算公式 10 4SPSS单样本K S检验 定义 单样本K S检验是以两位前苏联数学家Kolmogorov和Smirnov命名的 也是一种拟合优度的非参数检验方法 单样本K S检验是利用样本数据推断总体是否服从某一理论分布的方法 适用于探索连续型随机变量的分布形态 单样本K S检验可以将一个变量的实际频数分布与正态分布 Normal 均匀分布 Uniform 泊松分布 Poisson 指数 Exponential 分布进行比较 其零假设H0为样本来自的总体与指定的理论分布无显著差异 SPSS实现K S检验的过程如下 1 根据样本数据和用户的指定构造出理论分布 查分布表得到相应的理论累计概率分布函数 SPSS在统计中将计算K S的Z统计量 并依据K S分布表 小样本 或正态分布表 大样本 给出对应的相伴概率值 如果相伴概率小于或等于用户的显著性水平 则应拒绝零假设H0 认为样本来自的总体与指定的分布有显著差异 如果相伴概率值大于显著性水平 则不能拒绝零假设H0 认为样本来自的总体与指定的分布无显著差异 10 4 2SPSS中实现过程 研究问题某地144个周岁儿童身高数据如表10 4所示 问该地区周岁儿童身高频数是否呈正态分布 表10 4儿童身高数据 实现步骤 图10 12在菜单中选择 1 SampleK S 命令 图10 13 One SampleKolmogorov SmirnovTest 对话框 图10 14 One SampleK S Options 对话框 10 4 3结果和讨论 1 本例输出结果如下表所示 10 5 1统计学上的定义和计算公式 10 5两独立样本非参数检验 定义 两独立样本的非参数检验是在对总体分布不很了解的情况下 通过分析样本数据 推断样本来自的两个独立总体分布是否存在显著差异 一般用来对两个独立样本的均数 中位数 离散趋势 偏度等进行差异比较检验 两个样本是否独立 主要看在一个总体中抽取样本对另外一个总体中抽取样本有无影响 如果没有影响 则可以认为两个总体是独立的 SPSS提供了4种两独立样本的非参数检验方法 1 两独立样本的Mann WhitneyU检验 两独立样本的Mann WhitneyU检验的零假设H0为样本来自的两独立总体均值没有显著差异 两独立样本的Mann WhitneyU检验主要通过对平均秩的研究来实现推断 秩简单地说就是名次 如果将数据按照升序进行排序 这时每一个具体数据都会有一个在整个数据中的位置或名次 这就是该数据的秩 数据有多少个 秩便有多少个 2 两独立样本的K S检验 两独立样本的K S检验能够对两独立样本的总体分布情况进行比较 其零假设是H0为样本来自的两独立总体分布没有显著差异 两独立样本的K S检验实现方法是 首先将两组样本数据 X1 X2 Xm 和 Y1 Y2 Yn 混合并按升序排列 m和n是两组样本的样本容量 分别计算两组样本秩的累计频率和每个点上的累计频率 最后将两个累计频率相减 得到差值序列数据 两独立样本的K S检验将关注差值序列 SPSS将自动计算K SZ统计量 并依据正态分布表给出对应的相伴概率值 如果相伴概率小于或等于用户的显著性水平 则应拒绝零假设H0 认为两个样本来自的总体分布有显著差异 如果相伴概率值大于显著性水平 则不能拒绝零假设H0 认为两个样本来自的总体分布无显著差异 3 两独立样本的游程检验 Wald WolfwitzRuns 两独立样本的游程检验用来检验样本来自的两独立总体的分布是否存在显著差异 其零假设是H0为样本来自的两独立总体分布没有显著差异 样本的游程检验中 计算游程的方法与观察值的秩有关 首先 将两组样本混合并按照升序排列 在数据排序时 两组样本的每个观察值对应的样本组标志值序列也随之重新排列 然后对标志值序列按照前面10 3节的方法求游程 如果计算出的游程数相对比较小 则说明样本来自的两总体的分布形态存在较大差距 如果得到的游程数相对比较大 则说明样本来自的两总体的分布形态不存在显著差距 SPSS将自动计算游程数得到Z统计量 并依据正态分布表给出对应的相伴概率值 如果相伴概率小于或等于用户的显著性水平 则应拒绝零假设H0 认为两个样本来自的总体分布有显著差异 如果相伴概率值大于显著性水平 则不能拒绝零假设H0 认为两个样本来自的总体分布无显著差异 4 两独立样本的极端反应检验 MosesExtremeReactions 两独立样本的极端反应检验用来检验样本来自的两独立总体的分布是否存在显著差异 其零假设H0为样本来自的两独立总体分布没有显著差异 两独立样本的极端反应检验将一个样本作为控制样本 另外一个样本作为实验样本 以控制样本作对照 检验实验样本是否存在极端反应 首先将两组样本混合并按升序排列 然后找出控制样本最低秩和最高秩之间所包含的观察值个数 即跨度 Span 为控制极端值对分析结果的影响 也可以先去掉样本两个最极端的观察值后再求跨度 这个跨度称为截头跨度 两独立样本的极端检验计算跨度和截头跨度 如果跨度或截头跨度很小 则表明两个样本数据无法充分混合 可以认为实验样本存在极端反应 SPSS自动计算跨度和截头跨度 依据分布表给出对应的相伴概率值 如果相伴概率小于或等于用户的显著性水平 则应拒绝零假设H0 认为两个样本来自的总体分布有显著差异 如果相伴概率值大于显著性水平 则不能拒绝零假设H0 认为两个样本来自的总体分布无显著差异 10 5 2SPSS中实现过程 研究问题研究两个不同厂家生产的灯泡使用寿命是否存在显著差异 随机抽取两个厂家生成的灯泡若干 实验得到使用寿命 数据如表10 5所示 表10 5两个厂家生产的灯泡使用寿命数据 实现步骤 图10 15在菜单中选择 2IndependentSamples 命令 图10 16 Two Independent Samples Test 对话框 图10 17 TwoIndependentSamples DefineGroups 对话框 图10 18 Two Independent Samples Options 对话框 10 5 3结果和讨论 1 两独立样本Mann WhitneyU检验结果如下面两表所示 2 两独立样本K S检验输出结果如下两表所示 3 两独立样本极端反应检验输出结果如下两表所示 4 两独立样本游程检验输出结果如下两表所示 10 6多独立样本非参数检验 10 6 1统计学上的定义和计算公式 定义 多独立样本非参数检验分析样本数据是推断样本来自的多个独立总体分布是否存在显著差异 SPSS多独立样本非参数检验一般推断多个独立总体的均值或中位数是否存在显著差异 多个样本之间是否独立 需要看在一个总体中抽取样本对其他总体中抽取样本是否有影响 如果没有影响 则认为这些总体之间是独立的 例如 随机抽取3个班级之间学生的学生成绩 分析3个班级总体的成绩是否存在显著的差异 由于对各个班级都是随机抽取样本 抽样没有相互影响 可以认为这三个班级学生成绩是独立的 SPSS中有3种多独立样本非参数检验方法 1 多独立样本的中位数检验 Median 多独立样本的中位数检验通过对多组数据的分析推断多个独立总体分布是否存在显著差异 多独立样本的中位数检验的零假设H0为 样本来自的多个独立总体的中位数无显著差异 2 多独立样本的K W检验 多独立样本的K W检验是Kruskal Waillis检验的缩写 是一种推广的平均秩检验 其零假设为 样本来自的多个独立总体的分布无显著差异 多独立样本的K W检验的基本方法是 首先将多组样本数混合按升序排列 并求出每个观察值的秩 然后对多组样本的秩分别求平均值 如果各组样本的平均秩大致相等 则可以认为多个独立总体的分布没有显著差异 如果各样本的平均秩相差很大 则不能认为多个独立总体的分布无显著差异 3 多独立样本的Jonkheere Terpstra检验 多独立样本的Jonkheere Terpstra检验用于分析样本来自的多个独立总体分布是否存在显著差异 其零假设是 样本来自的多个独立总体的分布无显著差异 多独立样本的Jonkheere Terpstra检验的基本方法和两独立样本的Mann WhitneyU检验比较类似 也是计算一组样本的观察值小于其他组样本观察值的个数 研究问题随机抽取3个班级的学生 得到21个学生成绩样本 如表10 7所示 问3个班级学生总体成绩是否存在显著差异 10 6 2SPSS中实现过程 表10 73个班级学生成绩 实现步骤 图10 19在菜单中选择 KIndependentSamples 命令 图10 20 TestsforSeveralIndependentSamples 对话框 图10 21 SeveralIndependentSamples DefineRange 对话框 图10 22 Two Independent Samples Options 对话框 10 6 3结果和讨论 1 多独立样本K W检验结果如下两表所示 2 多独立样本中位数检验结果如下两表所示 10 7两配对样本非参数检验 10 7 1统计学上的定义和计算公式 定义 两配对样本 2RelatedSamples 非参数检验是在对总体分布不很清楚的情况下 对样本来自的两相关配对总体分别进行检验 两配对样本非参数检验一般用于同一研究对象 或两配对对象 分别给予两种不同处理的效果比较 以及同一研究对象 或两配对对象 处理前后的效果比较 前者推断两种效果有无差别 后者推断某种处理是否有效 两配对样本非参数检验的前提要求两个样本应是配对的 在应用领域中 主要的配对资料包括 具有年龄 性别 体重 病况等非处理因素相同或相似者 首先两个样本的观察数目相同 其次两样本的观察值顺序不能随意改变 SPSS中有以下3种两配对样本非参数检验方法 1 两配对样本的McNemar变化显著性检验 McNemar变化显著性检验以研究对象自身为对照 检验其两组样本变化是否显著 其零假设为 样本来自的两配对总体分布无显著差异 McNemar变化显著性检验要求待检验的两组样本的观察值是二值数据 在实际分析中有一定的局限性 McNemar变化显著性检验基本方法采用二项分布检验 它通过对两组样本前后变化的频率 计算二项分布的概率值 2 两配对样本的符号 Sign 检验 当两配对样本的观察值不是二值数据时 无法利用前面一种检验方法 这时可以采用两配对样本的符号 Sign 检验方法 其零假设为 样本来自的两配对样本总体的分布无显著差异 两配对样本的符号检验利用正 负符号的个数多少来进行检验 首先 将第二组样本的各个观察值减去第一组样本对应的观察值 如果得到差值是一个正数 则记为正号 差值为负数 则记为负号 然后计算正号的个数和负号的个数 通过比较正号的个数和负号的个数 可以判断两组样本的分布 例如 正号的个数和负号的个数大致相当 则可以认为两配对样本数据分布差距较小 正号的个数和负号的个数相差较多 可以分为两配对样本数据分布差距较大 SPSS将自动对差值正负符合序列作单样本二项分布检验 计算出实际的概率值 如果得到的概率值小于或等于用户的显著性水平 则应拒绝零假设H0 认为两配对样本来自的总体分布有显著差异 如果概率值大于显著性水平 则不能拒绝零假设H0 认为两配对样本来自的总体分布无显著差异 3 两配对样本的Wilcoxon符号平均秩检验 两配对样本的符号检验考虑了总体数据变化的性质 但没有考虑两组样本变化的程度 两配对样本的Wilcoxon符号平均秩检验考虑了这方面的因素 其零假设为 样本来自的两配对样本总体的分布无显著差异 两配对样本的Wilcoxon符号平均秩检验首先按照符号检验的方法 将第二组样本的各个观察值减去第一组样本对应的观察值 如果得到差值是一个正数 则记为正号 差值为负数 则记为负号 同时保存差值的绝对值数据 然后将绝对差值数据按升序排序 并求出相应的秩 最后分别计算正号秩总合W 负号秩总合W 以及正号平均秩和负号平均秩 如果正号平均秩和负号平均秩大致相当 则可以认为两配对样本数据正负变化程度基本相当 分布差距较小 两配对样本的Wilcoxon符号平均秩检验按照下面的公式计算Z统计量 它近似服从正态分布 研究问题分析10个学生接受某种方法进行训练的效果 收集到这些学生在训练前 后的成绩 如表10 9所示 表格的每一行表示一个学生的4个成绩 其中第一列表示 训练前的成绩是否合格 0表示不合格 1表示合格 第二列表示训练后的成绩是否合格 0表示不合格 1表示合格 第三列表示训练前学生的具体成绩 第四列表示训练后学生的具体成绩 问训练前后学生的成绩是否存在显著差异 10 7 2SPSS中实现过程 表10 9训练前后的成绩 实现步骤 图10 23在菜单中选择 2RelatedSamples 命令 图10 24 Two Related SamplesTests 对话框 图10 25选择两个变量配对 图10 26 Two Related Samples Options 对话框 图10 27选择两个变量配对 10 7 3结果和讨论 1 描述性统计部分结果如下表所示 2 Wilcoxon检验结果如下两表所示 3 符号检验结果如下两表所示 4 McNemar检验结果如下两表所示 10 8多配对样本非参数检验 10 8 1统计学上的定义和计算公式 定义 多配对样本非参数检验是对多个匹配样本的总体分布是否存在显著性差异进行统计分析 SPSS中有以下3种多配对样本非参数检验方法 1 多配对样本的Friendman检验 多配对样本的Friendman检验是利用秩实现多个配对总体分布检验的一种方法 多配对样本的Friendman检验要求数据是定距的 其零假设为 样本来自的多个配对总体的分布无显著差异 多配对样本的Friendman检验的实现原理是 首先以样本为单位 将各个样本数据按照升序排列 求得各个样本数据在各自行中的秩 然后计算各样本的秩总和及平均秩 如果多个配对样本的分布存在显著的差异 那么数值普遍偏大的组秩和必然偏大 数值普遍偏小的组 秩和也必然偏小 各组的秩之间就会存在显著差异 如果各样本的平均秩大致相当 那么可以认为各组的总体分布没有显著差异 2 多配对样本的Kendall协同系数检验 多配对样本的Kendall协同系数检验和Friedman检验非常类似 也是一种多配对样本的非参数检验 但分析的角度不同 多配对样本的Kendall协同系数检验主要用在分析评判者的判别标准是否一致公平方面 它将每个评判对象的分数都看作是来自多个配对总体的样本 一个评判对象对不同被判定对象的分数构成一个样本 其零假设为 样本来自的多个配对总体的分布无显著差异 即评判者的评判标准不一致 Kendall协同系数检验中会计算Friedman检验方法 得到friedman统计量和相伴概率 如果相伴概率小于显著性水平 可以认为这10个节目之间没有显著差异 那么可以认为这5个评委判定标准不一致 也就是判定结果不一致 3 多配对样本的CochranQ检验 多配对样本的CochranQ检验也是对多个互相匹配样本总体分布是否存在显著性差异的统计检验 不同的是多配对样本的CochranQ检验所能处理的数据是二值的 0和1 其零假设是 样本来自的多配对总体分布无显著差异 10 8 2SPSS中实现过程 研究问题1为了试验某种减肥药的性能 测量10个人在服用该药前以及服用该药一个月后 两个月后 3个月后的体重 问在这4个时期 10个人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论