研《非参数假设检验》.ppt_第1页
研《非参数假设检验》.ppt_第2页
研《非参数假设检验》.ppt_第3页
研《非参数假设检验》.ppt_第4页
研《非参数假设检验》.ppt_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

常用的统计分析 Means过程 单一样本均值的T检验 两独立样本均值差的T检验 两配对样本均值的T检验 SPSS的非参数检验与参数检验 SPSS的相关分析与回归分析 SPSS的主成分分析与因子分析 SPSS的方差分析 SPSS的聚类分析与判别分析 特点 对样本进行分组计算均值和标准差 如 Means过程 比较不同性别同学数学成绩的平均值和方差 数学成绩表 SPSS的实现过程 Analyze菜单CompareMeans项中选择Means命令 非参数假设检验 追求 一个总体分布的非参数假设检验 2 两个总体的分布未知 它们是否相同 非参数假设检验需要处理的问题 1 猜出总体的分布 假设 用另一组样本检验 两个总体分布的非参数假设检验 内容 多个总体分布的非参数假设检验 配对样本非参数检验 SPSS的非参数检验 一个总体 单样本总体分布的检验 两个总体 多个总体 独立样本非参数检验 配对样本非参数检验 独立样本非参数检验 一个总体分布的检验 检验总体的卡方分布 检验总体的二项分布 单样本变量值的随机性检验 游程检验 单样本的Kolmogorov Smirnov检验 检验总体的正态分布 P P正态概率分布图 GraphsP P Q Q正态概率单位分布图 GraphsQ Q 检验总体的正态分布的图示法 是根据变量的累计比例对所指定的理论分布累计比例绘制的图形 是根据变量分布的分位数对所指定的理论分布分位数绘制的图形 半正态分布 Half normal 伽玛分布 Gamma 指数分布 Exponential TestDistribution提供13种概率分布 贝塔分布 Beta 卡方分布 Chi square 拉普拉斯分布 Laplace 逻辑斯谛分布 Logistic 对数正态分布 Lognormal 正态分布 Normal 帕累托分布 Pareto T分布 StudentT 威布尔分布 Weibull 均匀分布 Uniform Blom s方法 使用公式 Tukey方法 使用公式 Rankit方法 使用公式 VanderWaerden方法 使用公式 n 个案的数目r 从1到n的秩次 式中 选择比率估测的公式 每次只能选择一项 若与某个概率分布的统计图一致 即被检验的数据符合所指定的分布 则代表个案的点簇在一条直线上 总体分布的卡方检验的原理 如果从一个随机变量X中随机抽取若干个观察样本 这些观察样本落在X的K个互不相交的子集中的观察频数服从一个多项分布 该多项分布当K趋于无穷时 就近似服从X的总体分布 因此 假设样本来自的总体服从某个期望分布或理论分布 同时获得样本数据各子集的实际观察频数 则可依据下面统计量作出推断 例题 检验总体的卡方分布 例题 某地一周内每日患忧郁症的人数如表所示 请检验一周内每日人们忧郁的数是否满足1 1 2 2 1 1 1 SPSS实现过程 1 定义变量 2 变量加权 3 进入Analyze菜单 用于选择计算非参数检验统计量对应的P值的方法 SPSS提供了3种计算P值的方法 Asymptoticonly 渐进性的显著性检验 适合于样本服从渐进分布或较大样本 MonteCarlo 不依赖渐进性方法估测精确显著性 这种方法在数据不满足渐进性分布 而且样本数据过大以致不能计算精确显著性时特别有效 Exact 精确计算法 即准确计算观测结果的统计概率 计算量较大 适用于小样本 练习 赛马比赛时 任一马的起点位置是起跑线上所指定的标杆位置 现有8匹马的比赛 位置1是内侧最靠近栏杆的跑道 位置8是外侧离栏杆最远的跑道 下表是某赛马在一个月内某特定圆形跑道上的纪录 并且按照起点的标杆位置分类 试检验起点标杆位置对赛马结果的影响 马在8个圆形跑道的起点标杆位置上获胜的纪录 均匀分布检验 二项分布检验的基本思想 根据搜集到的样本数据 推断总体分布是否服从某个指定的二项分布 SPSS中的二项分布检验 在样本小于等于30时 按照计算二项分布概率的公式进行计算 样本数大于30时 计算的是Z统计量 认为在零假设下 Z统计量服从正态分布 其零假设 样本来自的总体与所指定的某个二项分布不存在显著的差异 K 观察变量取值的样本个数 当K小于n 2时 取加号 p为检验概率 练习 检验总体的二项分布 练习 某地某一时期内出生35名婴儿 其中女孩儿19名 Sex 0 男孩儿16名 Sex 1 问 该地区出生婴儿的性别比例与通常的男女性别比例 总体概率约为0 5 是否不同 数据如下表所示 续 35名婴儿的性别 操作 单样本变量值的随机性检验 游程检验 依时间或其他顺序排列的有序数列中 具有相同的事件或符号的连续部分称为一个游程 调用Runs过程可进行游程检验 即用于检验序列中事件发生过程的随机性分析 单样本变量值的随机性检验是对某变量的取值出现是否随机进行检验 也称游程检验 例题 例题 某村发生一种地方病 其住户沿一条河排列 调查时对发病的住户标记为 1 对非发病的住户标记为 0 共20户 其取值如下表所示 续 35家住户的发病情况 操作 单样本的Kolmogorov Smirnov检验 单样本K S检验是一种拟合优度的非参数检验 是利用样本数据推断总体是否服从某一理论分布的方法 适用于探索连续性随机变量的分布形态 进行Kolmogorov SmirnovZ检验 是将一个变量的实际频数分布与正态分布 Normal 均匀分布 Uniform 泊松分布 Poisson 进行比较 SPSS实现K S检验的过程如下 1 根据样本数据和用户的指定构造出理论分布 查分布表得到相应的理论累计概率分布函数 2 利用样本数据计算各样本数据点的累积概率 得到检验累计概率分布函数 3 计算和在相应的变量值点X上的差 得到差值序列 单样本K S检验主要对差值序列进行研究 例题 练习 例题 某地144个周岁儿童身的高数据如下表 问该地区周岁儿童身高频数是否成正态分布 SPSS操作 练习 某报刊亭为研究每天报刊的销售量 为以后每天报刊进量提供依据 统计其在140天的销售中 某日报的日销售量的频数资料如下表 问该资料的频数是否服从正态分布 操作 两个总体独立样本的非参数检验 检验两个总体的分布是否相同 方差相同 分布函数形式相同 两个总体的分布若相同 参数相同 均值相同 2 两个总体的分布未知 它们是否相同 Wald wolfowitzRuns游程检验 检验分布是否相同的方法 Mann WhitneyU秩和检验 Kolmogorov Smirnov检验 MosesExtremeReactions极端反应检验 SPSS实现过程 零假设 样本来自的两独立总体分布无显著差异 K S检验实现的方法 将两组样本数据混合并升序排列 分别计算两组样本秩的累计频率和每个点上的累积频率 然后将两个累计频率相减 得到差值序列数据 K S检验将关注差值序列 并计算K S的Z统计量 依据正态分布表给出相应的相伴概率值 1 Kolmogorov Smirnov检验 两组样本是可以各自独立颠倒顺序的 2 Mann WhitneyU秩和检验法 检验这两组样本是否来自同一个总体 或两组样本的总体分布是否相同 问题 有两个总体的样本为 与 可能 Mann WhitneyU检验的统计量是 式中 对给定 查值表 得 若 则总体分布相同 两样本Wald wolfowitz游程检验中 计算游程的方法与观察值的秩有关 首先 将两组样本混合并升序排列 在数据排序时 两组样本的每个观察值对应的样本组标志值序列也随之重新排列 然后对标志值序列求游程 如果计算出的游程数相对比较小 则说明样本来自的两总体分布形态存在较大差距 SPSS将自动计算游程数得到Z统计量 并依据正态分布表给出对应的相伴概率值 3 Wald wolfowitz游程检验 如果跨度或截头跨度很小 说明两个样本数据无法充分混合 认为实验样本存在极端反应 两独立样本的极端反应检验 将一个样本作为控制样本 另一个样本作为实验样本 以控制样本做对照 检验实验样本是否存在极端反应 首先 将两组样本混合并升序排列 然后计算控制样本最低秩和最高秩之间的观察值个数 即 Span 跨度 为控制极端值对分析结果的影响 可先去掉样本两个最极端的观察值后 再求跨度 这个跨度称为截头跨度 零假设 样本来自的两独立总体分布没有显著差异 4 Moses极端反应检验 两组独立样本的总体分布是否相同的检验 点击进入Analyze菜单的NonparametricTests子菜单 选择2IndependentSample命令 MosesExtremeReactions 极端检验 检验两个独立样本观察值的散布范围是否有差异存在 以检验两个样本是否来自具有同一分布的总体 Mann WhitneyU 检验两个独立样本所属的总体均值是否相同 Kolmogorov SmirnovZ K S 推测两个样本是否来自具有相同分布的总体 Wald Wolfowitzruns 游程检验 考察两个独立样本是否来自具有相同分布的总体 练习 练习 研究两个不同厂家生产的灯泡使用寿命是否存在显著性差异 随机抽取两个厂家生产的灯泡 试验得到的使用寿命数据如下表 SPSS操作 两个总体配对样本的非参数检验 McNemar检验 Sign符号检验法 正负号检验法 Wilcoxon秩和检验 1 Wilcoxon秩和检验法 设有两个总体的样本为 把两组样本放在一起 按样本观察值 较多地集中在左段 w太大 说明样本较多地集中在右段 两组样本是可以各自独立颠倒顺序的 可能 与 w太小 说明样本 秩 加总起来 记为w 如果两个总体的分布相同 则样本应当是均匀混合的 即w不能太小 也不能太大 的序号 为秩 把样本个数少的这组样本 那么每个观察值就有一个序号 称 的大小重新排序 不妨设 续 显著性水平 则接受 由于 w应在某两个数字之间 可以由威尔可可逊表 依据 是由 所决定的 对于给定的 查出 若 或 则拒绝 反之 若 McNemar变化显著性检验 以研究对象自身为对照 检验其两组样本 前后 变化是否显著 该检验要求待检验的两组样本的观察值是二值数据 即该法适用于相关的二分变量数据 零假设 样本来自的两配对总体分布无显著差异 McNemar变化显著性检验基本方法 二项分布检验 例题 McNemar检验 例题 分析学生接受某种方法进行训练的效果 收集到10个学生在训练前 训练后的成绩如下表所示 问训练前后学生的成绩是否存在显著性差异 SPSS实现过程 不能各自独立地颠倒顺序 样本 发生的概率为 1 符号检验法 正负号检验法 的前提 2 复习二项分布 或 在 次重复努力试验中 事件 在 次试验中出现的次数为 则如果随机变量 的分布如下 则称 服从参数为 的二项分布 记为 且二项分布的均值为 方差为 若随机变量X 分布 则统计量 且 定理一 定理二 函数的均值 定理三 当充分大时 近似地服从均值 的正态分布 即 标准差为 3 符号检验法的思路 若两个总体的分布相同 即 则 令 则 设 式中 用容量相同的两个配对样本来检验 即 所以问题转化为 求从小到大的累积概率 4 正负号个数检验法的处理 小样本情况下 对 对 求从大到小的累积概率 即 若 则接受 是拒绝的最高界限 是拒绝的最低界限 小样本情况下 大样本情况下 S统计量 0 1分布参数的假设检验 0 1 分布 一个总体 两个总体 大样本 小样本 大样本 假设检验 某类个体占总体数量的比例问题 如高收入的比重问题等 类似于抛硬币 一个0 1分布总体的小样本比例值的参数检验 是总体中某类个体的比例 由0 1分布知 令X是比例的随机变量 则X 分布 E X 续 足够大了 用正态分布来近似它 若随机变量X 分布 则统计量 且 定理一 定理二 函数的均值 定理三 当充分大时 近似地服从均值 的正态分布 即 标准差为 按照经验 只要 同时 就可 以认为 例题 例1某公司要招聘若干名工程师 出了10道选择题 每题有4个备选答案 其中只有一个是正确的即正确的比率只有四分之一 问 应当答对几道题 才能考虑录取 注意 这是一个总体 又 统计量 的分布是二项分布 解 于是应有 计算结果如下表 00 05631 00000 056310 18770 94370 24420 28160 75600 525630 25030 44740 775940 14600 22410 921950 05840 07810 980360 01620 01970 996570 00310 00350 999680 00040 00041 000090 00000 00001 0000100 00000 00001 0000 累积概率表 正确的次数r 向下累计概率 向上累计概率 由于 500 0 15 75 25 已经足够大 故由中心极限定理 近似地服从均值为 例一个卖衬衣的邮购店从过去的经验中得知有15 的购买者说衬衣的大小不合身 要求退货 现这家邮购店改进了邮购定单的设计 结果在以后售出的500件衬衣中 有60件要求退货 问 在5 的a水平上 改进后的退货比例 母体比例 与原来的退货比例有无显著差异 的正态分布 于是 取显著性水平 方差为 解 对于显著性水平 假设 即 式中用 即 绝还是接受 所谓 大样本 就是要 检验统计量为 代替 得出拒 是否大于 判断 同时 大样本情况下 正负号个数检验法的处理 用两套问卷测量20个管理人员的素质 满分都是200分 测量结果如下表所示 问 两套问卷有无显著差异 本质是两套问卷的结果的分布是否相同 请分别用小样本和大样本来检验两套问卷有无显著差异 练习 与可从 符号检 在显著性水平之下 依据 S min 处理正负号个数检验法的S统计量方法 选统计量 记 若 则拒绝假设 认为 则接受假设 若 认为 这一检验法的重要的前提与前两个方法相同 验表 中查出 与就越接近 S越小 的差别就越大 与 即按照问题本来的属性 天然地配对 不能各自独立地颠倒顺序 或 样本 注意 S越大 例如 练习用两种激励方法 分别对同样工种的两个班组 每个班组7个人 进行激励 测得激励后业绩增长 数据如下 问 两种激励方法的效果有无显著差异 两种激励方法的总体分布是否相同 表两种激励方法分别实施于不同组工人的效果 激励法A 激励法B 多独立样本的K W检验 多独立样本的Median检验 多个总体独立样本的非参数检验 多独立样本的K T检验 SPSS实现的过程中 将多组样本数据混合并升序排列 求出混合样本数据的中位数 并假设是共同的中位数 如果多组独立样本的中位数无显著差异 则说明多组独立样本有共同的中位数 如果每组中大于该中位数的中位数大致等于每组中小于该中位数的样本数 则可以认为该多个独立总体的中位数没有显著差异 多独立样本的中位数检验 通过对多组数据的分析 推断多个独立总体分布是否存在显著差异 零假设 样本来自的多个独立总体的中位数无显著差异 多独立样本的K W检验 零假设 样本来自的多个独立总体的分布无显著差异 SPSS的实现 将多组样本数据混合并升序排列 求出求出每个观察值的秩 然后对多组样本的值分别求平均值 如果各组样本的平均秩大致相等 则认为多个独立总体的分布无显著差异 n第i组样本的观察值个数 R平均秩 例题 例题 随机抽取3个班级学生的21个成绩样本 问3个班级学生总体成绩是否存在显著差异 SPSS操作 多个总体配对样本的非参数检验 多配对样本的Fri

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论