已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据分析方法 非正态数据转化成正态数据 原创 东山草堂来自SPSS生活统计学 1 前言 大部分的数据分析都希望原始数据是满足正态分布的定距变量 然而 显示是残酷的 在各种研究中 常常需要面对非正态分布的定距数据 为了解决数据的正态性问题 数学家们总结了很多转化方法 但是没有万能神药 都需要对症下药 根据数据的实际分布情况 选择合适的转化方法 下面不会介绍具体的转化方法 只是帮助大家理顺正态转化的思路 明白正态转化的逻辑 不至于将正态转化看做神秘领域 高不可攀 2 正态转化四步骤 第一步 计算数据的分布状况及两个参数 偏度 Skewness 和峰度 Kurtosis 第二步 根据变量的分布形状和参数 决定是否做转换 1 对称判断看Skewness 偏差度 的取值 如果偏度为0 则是完全对称 但罕见 如果偏度为正值 则说明该变量的分布为正偏态 如果偏度为负值 则说明该变量的分布为负偏态 然而 偏度值还不能完全判断偏态的分布是否与正态分布有显著差别 所以还需要做显著性检验 如果检验结果显著 我们可能 注意是 可能 可以通过转换来达到或接近对称 3 4 2 峰度检验Kurtosis 峰度 是判断曲线陡峭和平缓的指标 如果峰度为0 说明该变量分布合适 但罕见 如果峰度为正值 说明该变量的分布陡峭 反之 如果峰度为负值 说明变量的分布平缓 峰度也需要通过显著检验来判断与正态分布是否有显著差别 我们可能可以通过转换来达到或接近正态分布 5 第三步 如果需要做正态转换 根据变量的分布形状 确定相应的转换公式 下面简单介绍3种常见的正态转换方法 1 如果是中度偏态如果偏度为其标准误差的2 3倍 可以考虑取根号值来转换 2 如果高度偏态如果偏度为其标准误差的3倍以上 则可以取对数 其中又可分为自然对数和以10为基数的对数 3 对于双峰或多峰数据秩分的正态得分的转化方法 SPSS软件中常用 请关注SPSS视频教程 第四步 再次检验转换后变量的分布形状 如果没有解决问题 或者甚至恶化 需要再从第二或第三步重新做起 然后再回到第一步的检验 直至达到比较令人满意的结果 6 数据正态化注意点 1 偏度和峰度的标准误差与样本量直接有关 具体说来 偏度的标准误差约等于6除以n后的开方 而峰度的标准误差约等于24除以n后的开方 n为样本量 由此可见 样本量越大 标准误差越小 2 数据的正态转化方法不是通用的 要根据不同的数据分布情况 选择合适的或创造合适的转化公式 转化后必须验证转化效果 最终达到转化的目的 3 不是所有的非正态分布的数据都能够通过正态转化而转化为正态分布数据 非正态分布的数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年家居定作合同(2017版)合同履行期限协议
- 2025年房地产担保合同规范书
- 2025年供用水合同(GF-1999-0501)环保设施协议
- 2025年水路货物运单(GF-91-0406)运输责任合同协议
- 2025年棉花市场分析咨询合同
- 电子产品维修服务合同2025范本模板
- 教师职业道德建设自查报告及提升计划
- 美容美发员工持股协议范本及解读
- 工地开工安全会议记录范本
- 餐饮店面采购及库存管理方案
- 2025年大型商场专业保安队伍服务外包合同
- 疲劳综合征治疗研究-洞察及研究
- 活动场地管理办法
- 国际高中入学测数学试卷
- 2025年甘肃省高考政治试题(含答案解析)
- 2025年湖南省初中生物学业水平考试(会考)真题详细解读及评析
- 视频号全套违禁词与违规行为规避指南
- 马尾综合征的护理查房
- 胎盘早剥护理病历讨论
- 铝液安全培训课件
- 混凝土基础拆除方案
评论
0/150
提交评论