spss16使用教程10.ppt

上传人：s*** IP属地：河南上传时间：2020-02-09 格式：PPT 页数：151 大小：2.63MB 积分：20 举报 版权申诉

已阅读5页，还剩146页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

SPSS16实用教程第10章非参数检验前面已经讨论的许多统计分析方法对总体有特殊的要求如T检验要求总体符合正态分布 F检验要求误差呈正态分布且各组方差整齐等等这些方法常用来估计或检验总体参数统称为参数检验但许多调查或实验所得的科研数据其总体分布未知或无法确定因为有的数据不是来自所假定分布的总体或者数据根本不是来自一个总体还有可能数据因为某种原因被严重污染这样在假定分布的情况下进行推断的做法就有可能产生错误的结论此时人们希望检验对一个总体分布形状不必作限制这种不是针对总体参数而是针对总体的某些一般性假设如总体分布的统计分析方法称非参数检验 NonparametricTests 非参数检验根据样本数目以及样本之间的关系可以分为单样本非参数检验两独立样本非参数检验多独立样本非参数检验两配对样本非参数检验和多配对样本非参数检验几种本章将介绍总体分布的卡方 Chi square 检验二项分布 Binomial 检验单样本K S Kolmogorov Smirnov 检验单样本变量值随机性检验 RunsTest 两独立样本非参数检验多独立样本非参数检验两配对样本非参数检验多配对样本非参数检验等8类常用的非参数检验方法其中前4种属于单样本非参数检验 10 1总体分布的卡方 Chi square 检验在得到一批样本数据后人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合这可以通过绘制样本数据直方图的方法来进行粗略的判断如果需要进行比较准确的判断则需要使用非参数检验的方法其中总体分布的卡方检验也记为 2检验就是一种比较好的方法 10 1 1统计学上的定义和计算公式定义总体分布的卡方检验适用于配合度检验是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异它的零假设H0 样本来自的总体分布形态和期望分布或某一理论分布没有显著差异因此总体分布的卡方检验是一种吻合性检验比较适用于一个因素的多项分类数据分析总体分布的卡方检验的数据是实际收集到的样本数据而非频数数据研究问题某地一周内各日患忧郁症的人数分布如表10 1所示请检验一周内各日人们忧郁数是否满足1 1 2 2 1 1 1 10 1 2SPSS中实现过程表10 1学生的数学成绩实现步骤图10 1在菜单中选择 WeightCases 命令图10 2 WeightCases 对话框图10 3在菜单中选择 Chi Square 命令图10 4 Chi SquareTest 对话框图10 5 Chi SquareTest Options 对话框 1 本例输出结果中有两个表格其中第一个表格如下 10 1 3结果和讨论 2 输出的结果文件中第二个表格如下 10 2二项分布检验 10 2 1统计学上的定义和计算公式现实生活中有很多数据的取值只有两类如医学中的生与死患病的有与无性别中的男性和女性产品的合格与不合格等从这种二分类总体中抽取的所有可能结果要么是对立分类中的这一类要么是另一类其频数分布称为二项分布调用SPSS中的二项分布检验 Binomial 可对样本资料进行二项分布分析 SPSS二项分布检验就是根据收集到的样本数据推断总体分布是否服从某个指定的二项分布其零假设是H0 样本来自的总体与所指定的某个二项分布不存在显著的差异 SPSS中的二项分布检验在样本小于或等于30时按照计算二项分布概率的公式进行计算样本数大于30时计算的是Z统计量认为在零假设下 Z统计量服从正态分布 Z统计量的计算公式如下 SPSS将自动计算Z统计量并给出相应的相伴概率值如果相伴概率小于或等于用户的显著性水平则应拒绝零假设H0 认为样本来自的总体分布形态与指定的二项分布存在显著差异如果相伴概率值大于显著性水平则不能拒绝零假设H0 认为样本来自的总体分布形态与指定的二项分布不存在显著差异 SPSS二项分布检验的数据是实际收集到的样本数据而非频数数据研究问题某地某一时期内出生35名婴儿其中女性19名定Sex 0 男性16名定Sex 1 问这个地方出生婴儿的性别比例与通常的男女性比例总体概率约为0 5 是否不同数据如表10 2所示 10 2 2SPSS中实现过程表10 235名婴儿的性别实现步骤图10 6在菜单中选择 BinomialTest 命令图10 7 BinomialTest 对话框图10 8 BinomialTest Options 对话框 10 2 3结果和讨论 10 3SPSS单样本变量值随机性检验 10 3 1统计学上的定义和计算公式定义单样本变量值的随机性检验是对某变量的取值出现是否随机进行检验也称为游程检验 Run过程单样本变量值的随机性检验是由Wald提出的它的零假设为H0 总体某变量的变量值出现是随机的单样本变量值的随机性检验通过游程 Run 数来实现所谓游程是样本序列中连续出现的变量值的次数在SPSS单样本变量值的随机性检验中 SPSS将利用游程构造Z统计量并依据正态分布表给出对应的相伴概率值如果相伴概率小于或等于用户的显著性水平则应拒绝零假设H0 认为样本值的出现不是随机的如果相伴概率值大于显著性水平则不能拒绝零假设H0 认为变量值的出现是随机的 10 3 2SPSS中实现过程研究问题某村发生一种地方病其住户沿一条河排列调查时对发病的住户标记为 1 对非发病的住户标记为 0 共35户其取值如表10 3所示表10 335名住户发病情况实现步骤图10 9在菜单中选择 Runs 命令图10 10 RunsTest 对话框图10 11 RunsTest Options 对话框 10 3 3结果和讨论 10 4 1统计学上的定义和计算公式 10 4SPSS单样本K S检验定义单样本K S检验是以两位前苏联数学家Kolmogorov和Smirnov命名的也是一种拟合优度的非参数检验方法单样本K S检验是利用样本数据推断总体是否服从某一理论分布的方法适用于探索连续型随机变量的分布形态单样本K S检验可以将一个变量的实际频数分布与正态分布 Normal 均匀分布 Uniform 泊松分布 Poisson 指数 Exponential 分布进行比较其零假设H0为样本来自的总体与指定的理论分布无显著差异 SPSS实现K S检验的过程如下 1 根据样本数据和用户的指定构造出理论分布查分布表得到相应的理论累计概率分布函数 SPSS在统计中将计算K S的Z统计量并依据K S分布表小样本或正态分布表大样本给出对应的相伴概率值如果相伴概率小于或等于用户的显著性水平则应拒绝零假设H0 认为样本来自的总体与指定的分布有显著差异如果相伴概率值大于显著性水平则不能拒绝零假设H0 认为样本来自的总体与指定的分布无显著差异 10 4 2SPSS中实现过程研究问题某地144个周岁儿童身高数据如表10 4所示问该地区周岁儿童身高频数是否呈正态分布表10 4儿童身高数据实现步骤图10 12在菜单中选择 1 SampleK S 命令图10 13 One SampleKolmogorov SmirnovTest 对话框图10 14 One SampleK S Options 对话框 10 4 3结果和讨论 1 本例输出结果如下表所示 10 5 1统计学上的定义和计算公式 10 5两独立样本非参数检验定义两独立样本的非参数检验是在对总体分布不很了解的情况下通过分析样本数据推断样本来自的两个独立总体分布是否存在显著差异一般用来对两个独立样本的均数中位数离散趋势偏度等进行差异比较检验两个样本是否独立主要看在一个总体中抽取样本对另外一个总体中抽取样本有无影响如果没有影响则可以认为两个总体是独立的 SPSS提供了4种两独立样本的非参数检验方法 1 两独立样本的Mann WhitneyU检验两独立样本的Mann WhitneyU检验的零假设H0为样本来自的两独立总体均值没有显著差异两独立样本的Mann WhitneyU检验主要通过对平均秩的研究来实现推断秩简单地说就是名次如果将数据按照升序进行排序这时每一个具体数据都会有一个在整个数据中的位置或名次这就是该数据的秩数据有多少个秩便有多少个 2 两独立样本的K S检验两独立样本的K S检验能够对两独立样本的总体分布情况进行比较其零假设是H0为样本来自的两独立总体分布没有显著差异两独立样本的K S检验实现方法是首先将两组样本数据 X1 X2 Xm 和 Y1 Y2 Yn 混合并按升序排列 m和n是两组样本的样本容量分别计算两组样本秩的累计频率和每个点上的累计频率最后将两个累计频率相减得到差值序列数据两独立样本的K S检验将关注差值序列 SPSS将自动计算K SZ统计量并依据正态分布表给出对应的相伴概率值如果相伴概率小于或等于用户的显著性水平则应拒绝零假设H0 认为两个样本来自的总体分布有显著差异如果相伴概率值大于显著性水平则不能拒绝零假设H0 认为两个样本来自的总体分布无显著差异 3 两独立样本的游程检验 Wald WolfwitzRuns 两独立样本的游程检验用来检验样本来自的两独立总体的分布是否存在显著差异其零假设是H0为样本来自的两独立总体分布没有显著差异样本的游程检验中计算游程的方法与观察值的秩有关首先将两组样本混合并按照升序排列在数据排序时两组样本的每个观察值对应的样本组标志值序列也随之重新排列然后对标志值序列按照前面10 3节的方法求游程如果计算出的游程数相对比较小则说明样本来自的两总体的分布形态存在较大差距如果得到的游程数相对比较大则说明样本来自的两总体的分布形态不存在显著差距 SPSS将自动计算游程数得到Z统计量并依据正态分布表给出对应的相伴概率值如果相伴概率小于或等于用户的显著性水平则应拒绝零假设H0 认为两个样本来自的总体分布有显著差异如果相伴概率值大于显著性水平则不能拒绝零假设H0 认为两个样本来自的总体分布无显著差异 4 两独立样本的极端反应检验 MosesExtremeReactions 两独立样本的极端反应检验用来检验样本来自的两独立总体的分布是否存在显著差异其零假设H0为样本来自的两独立总体分布没有显著差异两独立样本的极端反应检验将一个样本作为控制样本另外一个样本作为实验样本以控制样本作对照检验实验样本是否存在极端反应首先将两组样本混合并按升序排列然后找出控制样本最低秩和最高秩之间所包含的观察值个数即跨度 Span 为控制极端值对分析结果的影响也可以先去掉样本两个最极端的观察值后再求跨度这个跨度称为截头跨度两独立样本的极端检验计算跨度和截头跨度如果跨度或截头跨度很小则表明两个样本数据无法充分混合可以认为实验样本存在极端反应 SPSS自动计算跨度和截头跨度依据分布表给出对应的相伴概率值如果相伴概率小于或等于用户的显著性水平则应拒绝零假设H0 认为两个样本来自的总体分布有显著差异如果相伴概率值大于显著性水平则不能拒绝零假设H0 认为两个样本来自的总体分布无显著差异 10 5 2SPSS中实现过程研究问题研究两个不同厂家生产的灯泡使用寿命是否存在显著差异随机抽取两个厂家生成的灯泡若干实验得到使用寿命数据如表10 5所示表10 5两个厂家生产的灯泡使用寿命数据实现步骤图10 15在菜单中选择 2IndependentSamples 命令图10 16 Two Independent Samples Test 对话框图10 17 TwoIndependentSamples DefineGroups 对话框图10 18 Two Independent Samples Options 对话框 10 5 3结果和讨论 1 两独立样本Mann WhitneyU检验结果如下面两表所示 2 两独立样本K S检验输出结果如下两表所示 3 两独立样本极端反应检验输出结果如下两表所示 4 两独立样本游程检验输出结果如下两表所示 10 6多独立样本非参数检验 10 6 1统计学上的定义和计算公式定义多独立样本非参数检验分析样本数据是推断样本来自的多个独立总体分布是否存在显著差异 SPSS多独立样本非参数检验一般推断多个独立总体的均值或中位数是否存在显著差异多个样本之间是否独立需要看在一个总体中抽取样本对其他总体中抽取样本是否有影响如果没有影响则认为这些总体之间是独立的例如随机抽取3个班级之间学生的学生成绩分析3个班级总体的成绩是否存在显著的差异由于对各个班级都是随机抽取样本抽样没有相互影响可以认为这三个班级学生成绩是独立的 SPSS中有3种多独立样本非参数检验方法 1 多独立样本的中位数检验 Median 多独立样本的中位数检验通过对多组数据的分析推断多个独立总体分布是否存在显著差异多独立样本的中位数检验的零假设H0为样本来自的多个独立总体的中位数无显著差异 2 多独立样本的K W检验多独立样本的K W检验是Kruskal Waillis检验的缩写是一种推广的平均秩检验其零假设为样本来自的多个独立总体的分布无显著差异多独立样本的K W检验的基本方法是首先将多组样本数混合按升序排列并求出每个观察值的秩然后对多组样本的秩分别求平均值如果各组样本的平均秩大致相等则可以认为多个独立总体的分布没有显著差异如果各样本的平均秩相差很大则不能认为多个独立总体的分布无显著差异 3 多独立样本的Jonkheere Terpstra检验多独立样本的Jonkheere Terpstra检验用于分析样本来自的多个独立总体分布是否存在显著差异其零假设是样本来自的多个独立总体的分布无显著差异多独立样本的Jonkheere Terpstra检验的基本方法和两独立样本的Mann WhitneyU检验比较类似也是计算一组样本的观察值小于其他组样本观察值的个数研究问题随机抽取3个班级的学生得到21个学生成绩样本如表10 7所示问3个班级学生总体成绩是否存在显著差异 10 6 2SPSS中实现过程表10 73个班级学生成绩实现步骤图10 19在菜单中选择 KIndependentSamples 命令图10 20 TestsforSeveralIndependentSamples 对话框图10 21 SeveralIndependentSamples DefineRange 对话框图10 22 Two Independent Samples Options 对话框 10 6 3结果和讨论 1 多独立样本K W检验结果如下两表所示 2 多独立样本中位数检验结果如下两表所示 10 7两配对样本非参数检验 10 7 1统计学上的定义和计算公式定义两配对样本 2RelatedSamples 非参数检验是在对总体分布不很清楚的情况下对样本来自的两相关配对总体分别进行检验两配对样本非参数检验一般用于同一研究对象或两配对对象分别给予两种不同处理的效果比较以及同一研究对象或两配对对象处理前后的效果比较前者推断两种效果有无差别后者推断某种处理是否有效两配对样本非参数检验的前提要求两个样本应是配对的在应用领域中主要的配对资料包括具有年龄性别体重病况等非处理因素相同或相似者首先两个样本的观察数目相同其次两样本的观察值顺序不能随意改变 SPSS中有以下3种两配对样本非参数检验方法 1 两配对样本的McNemar变化显著性检验 McNemar变化显著性检验以研究对象自身为对照检验其两组样本变化是否显著其零假设为样本来自的两配对总体分布无显著差异 McNemar变化显著性检验要求待检验的两组样本的观察值是二值数据在实际分析中有一定的局限性 McNemar变化显著性检验基本方法采用二项分布检验它通过对两组样本前后变化的频率计算二项分布的概率值 2 两配对样本的符号 Sign 检验当两配对样本的观察值不是二值数据时无法利用前面一种检验方法这时可以采用两配对样本的符号 Sign 检验方法其零假设为样本来自的两配对样本总体的分布无显著差异两配对样本的符号检验利用正负符号的个数多少来进行检验首先将第二组样本的各个观察值减去第一组样本对应的观察值如果得到差值是一个正数则记为正号差值为负数则记为负号然后计算正号的个数和负号的个数通过比较正号的个数和负号的个数可以判断两组样本的分布例如正号的个数和负号的个数大致相当则可以认为两配对样本数据分布差距较小正号的个数和负号的个数相差较多可以分为两配对样本数据分布差距较大 SPSS将自动对差值正负符合序列作单样本二项分布检验计算出实际的概率值如果得到的概率值小于或等于用户的显著性水平则应拒绝零假设H0 认为两配对样本来自的总体分布有显著差异如果概率值大于显著性水平则不能拒绝零假设H0 认为两配对样本来自的总体分布无显著差异 3 两配对样本的Wilcoxon符号平均秩检验两配对样本的符号检验考虑了总体数据变化的性质但没有考虑两组样本变化的程度两配对样本的Wilcoxon符号平均秩检验考虑了这方面的因素其零假设为样本来自的两配对样本总体的分布无显著差异两配对样本的Wilcoxon符号平均秩检验首先按照符号检验的方法将第二组样本的各个观察值减去第一组样本对应的观察值如果得到差值是一个正数则记为正号差值为负数则记为负号同时保存差值的绝对值数据然后将绝对差值数据按升序排序并求出相应的秩最后分别计算正号秩总合W 负号秩总合W 以及正号平均秩和负号平均秩如果正号平均秩和负号平均秩大致相当则可以认为两配对样本数据正负变化程度基本相当分布差距较小两配对样本的Wilcoxon符号平均秩检验按照下面的公式计算Z统计量它近似服从正态分布研究问题分析10个学生接受某种方法进行训练的效果收集到这些学生在训练前后的成绩如表10 9所示表格的每一行表示一个学生的4个成绩其中第一列表示训练前的成绩是否合格 0表示不合格 1表示合格第二列表示训练后的成绩是否合格 0表示不合格 1表示合格第三列表示训练前学生的具体成绩第四列表示训练后学生的具体成绩问训练前后学生的成绩是否存在显著差异 10 7 2SPSS中实现过程表10 9训练前后的成绩实现步骤图10 23在菜单中选择 2RelatedSamples 命令图10 24 Two Related SamplesTests 对话框图10 25选择两个变量配对图10 26 Two Related Samples Options 对话框图10 27选择两个变量配对 10 7 3结果和讨论 1 描述性统计部分结果如下表所示 2 Wilcoxon检验结果如下两表所示 3 符号检验结果如下两表所示 4 McNemar检验结果如下两表所示 10 8多配对样本非参数检验 10 8 1统计学上的定义和计算公式定义多配对样本非参数检验是对多个匹配样本的总体分布是否存在显著性差异进行统计分析 SPSS中有以下3种多配对样本非参数检验方法 1 多配对样本的Friendman检验多配对样本的Friendman检验是利用秩实现多个配对总体分布检验的一种方法多配对样本的Friendman检验要求数据是定距的其零假设为样本来自的多个配对总体的分布无显著差异多配对样本的Friendman检验的实现原理是首先以样本为单位将各个样本数据按照升序排列求得各个样本数据在各自行中的秩然后计算各样本的秩总和及平均秩如果多个配对样本的分布存在显著的差异那么数值普遍偏大的组秩和必然偏大数值普遍偏小的组秩和也必然偏小各组的秩之间就会存在显著差异如果各样本的平均秩大致相当那么可以认为各组的总体分布没有显著差异 2 多配对样本的Kendall协同系数检验多配对样本的Kendall协同系数检验和Friedman检验非常类似也是一种多配对样本的非参数检验但分析的角度不同多配对样本的Kendall协同系数检验主要用在分析评判者的判别标准是否一致公平方面它将每个评判对象的分数都看作是来自多个配对总体的样本一个评判对象对不同被判定对象的分数构成一个样本其零假设为样本来自的多个配对总体的分布无显著差异即评判者的评判标准不一致 Kendall协同系数检验中会计算Friedman检验方法得到friedman统计量和相伴概率如果相伴概率小于显著性水平可以认为这10个节目之间没有显著差异那么可以认为这5个评委判定标准不一致也就是判定结果不一致 3 多配对样本的CochranQ检验多配对样本的CochranQ检验也是对多个互相匹配样本总体分布是否存在显著性差异的统计检验不同的是多配对样本的CochranQ检验所能处理的数据是二值的 0和1 其零假设是样本来自的多配对总体分布无显著差异 10 8 2SPSS中实现过程研究问题1为了试验某种减肥药的性能测量10个人在服用该药前以及服用该药一个月后两个月后 3个月后的体重问在这4个时期 10个人

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

spss16使用教程10.ppt

文档简介

温馨提示

最新文档

评论

spss16使用教程10.ppt

文档简介

温馨提示

最新文档

评论

相关文档