




已阅读5页,还剩6页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
资料的正态性检验汇总资料的正态性检验汇总 作者 huaxie 来源 整理 发布时间 2009 4 22 浏览 567 访问者 58 23 96 242 摘要提示 本文汇总了通常在对资料进行正态性检验时遇到的问题 比如 Kolmogorov Smirnov 检验 简称 K S 检验 还是 Shapiro Wilk 检验 SPSS 里面用哪个过程 SAS 程序等 SPSS 和和 SAS 常用正态检验方法常用正态检验方法 如何在如何在 spss 中进行正态分布检验中进行正态分布检验 一 图示法一 图示法 1 P P 图 以样本的累计频率作为横坐标 以安装正态分布计算的相应累计概率作为纵坐标 把 样本值表现为直角坐标系中的散点 如果资料服从整体分布 则样本点应围绕第一象限的 对角线分布 2 Q Q 图 以样本的分位数作为横坐标 以按照正态分布计算的相应分位点作为纵坐标 把样本 表现为指教坐标系的散点 如果资料服从正态分布 则样本点应该呈一条围绕第一象限对 角线的直线 以上两种方法以 Q Q 图为佳 效率较高 3 直方图 判断方法 是否以钟形分布 同时可以选择输出正态性曲线 4 箱式图 判断方法 观测离群值和中位数 5 茎叶图 类似与直方图 但实质不同 二 计算法二 计算法 1 偏度系数 Skewness 和峰度系数 Kurtosis 计算公式 g1表示偏度 g2表示峰度 通过计算 g1 和 g2 及其标准误 g1及 g2然后作 U 检验 两种检验同时得出 U0 05 的结论时 才可以认为该组资料服从正态分布 由公式可见 部分文献中所说的 偏度和峰度都接近 0 可以认为 近似服从正态分布 并 不严谨 2 非参数检验方法 非参数检验方法包括 Kolmogorov Smirnov 检验 D 检验 和 Shapiro Wilk W 检验 SAS 中规定 当样本含量n 2000时 结果以 Shapiro Wilk W 检验 为准 当样本 含量n 2000 时 结果以 Kolmogorov Smirnov D 检验 为准 SPSS 中则这样规定 1 如果指定的是非整数权重 则在加权样本大小位于 3 和 50 之间时 计算 Shapiro Wilk 统计量 对于无权重或整数权重 在加权样本大小位于 3 和 5000 之间时 计算该统计量 由此可见 部分 SPSS 教材里面关于 Shapiro Wilk 适用于样 本量 3 50 之间的数据 的说法实在是理解片面 误人子弟 2 单样本 Kolmogorov Smirnov 检验可用于检验变量 例如 income 是否为正态分布 对于此两种检验 如果 P 值大于 0 05 表明资料服从正态分布 三 三 SPSS 操作示例操作示例 SPSS 中有很多操作可以进行正态检验 在此只介绍最主要和最全面最方便的操作 1 工具栏 分析 描述性统计 探索性 2 选择要分析的变量 选入因变量框内 然后点选图表 设置输出茎叶图和直方图 选择输出正态性检验图表 注意显示 Display 要选择双项 Both 3 Output 结果 1 Descriptives 描述中有峰度系数和偏度系数 根据上述判断标准 数据不符合 正态分布 Sk 0 Ku 0 时 分布呈正态 Sk 0 时 分布呈正偏态 Sk0 曲线比较陡峭 Ku 0 时 分布呈正偏态 S k 0 时 分布呈负偏态 适用条件 样本含量 应大于 200 2 用夏皮罗 用夏皮罗 威尔克威尔克 Shapiro Wilk 法检验数据正态性法检验数据正态性 即 W 检验 1965 年提出 适用于样本含量 n 50 时的正态性检验 3 用达戈斯提诺 用达戈斯提诺 D Agostino 法检验数据正态性法检验数据正态性 即 D 检验 1971 提出 正态性 D 检验该方法效率高 是比较精确的正态检验法 4 Shapiro Francia 法法 即 W 检验 于 1972 年提出 适用于 50 n 5000 结果以结果以 Kolmogorov Smirnov 为准 为准 而而 SAS 规定规定 当样本含量当样本含量 n 2000 时时 结果以结果以 Shapiro Wilk W 检验检验 为准为准 当样本含量当样本含量 n 2000 时时 结果以结果以 Kolmogorov Smirnov D 检验检验 为准为准 问 问 对照组和病例组都是 20 例 拟对某指标进行正态性检验 是用 Kolmogorov Smirnov 检验 简称 K S 检验 还是 Shapiro Wilk 检验 已用 K S 检验不能认为该指标不是正态分布 但是 Shapiro Wilk 检验 表明其为非正态分布 我该相信哪个检验结果 答 答 Kolmogorov Smirnov 检验 检验频数分布的正态性检验 适合大样本 Shapiro Wilk 检验 小样本数据的正态性检验 矩法正态性检验 不限样本 问 问 用 SPSS 中 analysze discriptive statistics explore 法和用 analyze nonparametric tests 1 sample K S 法评价正态性 结果不完 全相同 为什么 答 答 以第二个为准 第一种方法是参数检验 而第二种是非参数 检验 第一种是在知道总体分布的情况下做的 第二种是在不知道总体分布的情况进行的 检验 而且大多数的检验 我们都是不知道总体分布到底是什么才做的 K S 检验 因此在做分析的时候一般用第二种 标准的检验单样本分布的方法 不过一般推 荐用上面的 并且和 SAS 的结果比较吻合 同时样本量小的时候选 S W 的结果 至于结果的不同 应该是不同的方法算出的值不同 这很 正常 因为这几个方法的数学表达式就不一样 中间对数据的处理也 不一样 会有信息损失等原因的 在正态检验中 尤其是接近 水准 时 往往容易出现问题 所以要根据资料的性质判断用什么方法进行 检验更合适 不是把所有的方法都做一遍 对于到底 P 取多少才有意 义 说法有好多种 常用的是 0 1 吧 SPSS 自带的是 0 2 的界值 其 实还是得结合 QQ PP 图之类的来观察会好些 小样本最好不要看 Kolmogorov Smirnov 的结果 常常会有问题 Shapiro Wilk 的结果会 好些 补充 补充 如果根据国标 其偏态和峰态算法 其值为多少时符合 正态别有规定呢 K S 检验记得在资料上见过 8 n5000 结果结果 以以 Kolmogorm Smimov D 检验检验 为准 为准 SAS 规定 当样本含量规定 当样本含量 n 2000 时 结果以时 结果以 Shapim Wilk W 检验检验 为准 当样本含量为准 当样本含量 n 2000 时 结果时 结果 以以 Kolmogorov Smimov D 检验检验 为准 为准 在 SPSS 和 SAS 等统计分析软件中 通常用统计描述模块中的 Shapiro Wilk 检验 经过 Lilliefors 显著水 平修正的 Kolmogorov Smirnov 检验和非参数检验模块中的单一样本 Kolmogorov Smirnov 检验进行正 态性判定 但是这几种检验方法存在以下几方面的问题 1 在实际应用中常出现检验结果与直方图 正态性概率图不一致 甚至几种假设检验方法结果完全不同 的情况 2 Shapiro Wilk 检验 检验 和经过 Lilliefors 显著水平修正的 Kolmogorov Smirnov 检验 D 检验 是 用一个综合指标 顺序统计量 或 D 来判定资料的正态性由于两种方法都是用一个指标反映资料的正态性 所以当资料的正态峰和对称性两个特征有一个不满足正态性要求时 两种方法出现假阴性错误的机率均较 大 而且两种方法的检验统计量都是进行大小排序后得到 所以易受异常值的影响 3 Kolmogorov Smirnov 单一样本检验是根据实际的累计频数分布和理论的累计频数分布的最大差异来 检验资料的正态性 可对正态分布进行拟合优度检验 但它并非检验正态性的专用方法 因此它的检验效 率是最低的 最容易受样本量和异常值等因素的影响 没有修正的没有修正的 K S 检验的原始公式里面 检验的既是标化后的数据是否服从理论的分布 检验的原始公式里面 检验的既是标化后的数据是否服从理论的分布 正态性检验 上 2008 04 25 10 45 1 样本量较大时的结果 运用的数据是 SPSS13 0Data 里面的 diameter sub sav 样本含量是 216 对数据分别支用 SAS 和 SPSS 进行正态性检验 1 1 SAS 中用 Proc univariate normal 命令 结果如下 Tests for Normality Test Statistic p Value Shapiro Wilk W 0 993604 Pr D 0 0789 其中 SAS 中SAS 规定 当样本含量n 2000 时 结果以Shapiro Wilk W 检验 为准 当样本 含量n 2000 时 结果以Kolmogorov Smirnov D 检验 为准 1 2 SPSS 里面用 Explor 过程 Plots 选项中 Normality Plots with tests 结果如下 Tests of Normality Kolmogorov Smirnov a Shapiro Wilk StatisticdfSig StatisticdfSig AP diameter mm 058216 070 994216 476 a Lilliefors Significance Correction 对于 SPSS 结果选用哪个方法 我看的资料并不一致 在 SPSS13 0 书上以样本量 50 选 Shapiro Wilk 检验 而有文献 SPSS说样本含量3 n 5000 时 结果以Shapiro Wilk W 检 验 为准 有出入 1 3 在 SPSS13 0 中单样本的 K S 拟合优度检验讲到 可以用来检验样本的分布是否服从某 种理论分布 可以是正态 均匀等 用上述例子选 Normal 分布进行计算 结果如下 One Sample Kolmogorov Smirnov Test AP diameter
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 时空大数据融合技术-洞察及研究
- 【《S地产公司现金流管理现状及问题调研分析报告》10000字】
- 2025河南省税务局招聘84人模拟试卷及一套完整答案详解
- 2025江苏苏州国家历史文化名城保护区、苏州市姑苏区区属国资集团副总裁招聘2人考前自测高频考点模拟试题及答案详解(名校卷)
- 2025广东珠海市香洲区招聘卫生健康系统事业单位工作人员10人模拟试卷含答案详解
- 2025年渤海钻探工程有限公司春季招聘(20人)模拟试卷及参考答案详解
- 2025年甘肃医学院招聘事业编制专业技术人员13人(第一批)考前自测高频考点模拟试题及答案详解(历年真题)
- 2025年阜阳界首市“政录企用”人才引进8人模拟试卷及答案详解(名师系列)
- 2025年甘肃省张掖市(甘州区)博物馆讲解员招聘模拟试卷附答案详解(完整版)
- 2025昆明市盘龙区滇源街道中心卫生院第二次招聘(2人)模拟试卷含答案详解
- 2025年下半年拜城县招聘警务辅助人员(260人)考试模拟试题及答案解析
- 宅基地争议申请书
- 2025年杭州上城区总工会公开招聘工会社会工作者9人笔试参考题库附答案解析
- 百师联盟2026届高三上学期9月调研考试数学试卷(含答案)
- 2025年互联网+特殊教育行业研究报告及未来发展趋势预测
- 神舟十号课件
- 汽车产品安全管理制度
- 企业风险防控制度汇编与实施指南
- 2025-2026学年冀人版(2024)小学科学二年级上册(全册)教学设计(附教材目录 )
- 2025-2030年中国农机行业市场深度调研及前景趋势与投资研究报告
- 安全生产法律法规、标准和其他要求清单
评论
0/150
提交评论