




已阅读5页,还剩24页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SPSS实用统计分析 八 离群值 数学变换及其他 安徽大学生命科学学院董翔 1 数据集合中与其他数据有明显偏离的取值数值上异常偏大或偏小 或根本不会存在来源 读数 录入的错误 真实存在的极端现象离群值对统计分析的影响造成参数估计的偏离 means SD 造成对统计分布的错判影响对统计方法的选择和结果解释 方差齐性 离群值 outliers 2 依据常识和科学原理判断谬误直接剔除观察个体值偏离均值程度进行推断箱式图观察Z值观察 离群值的认定 3 箱式图推断离群值 分别以四分位数 Q3 Q1 为箱型方框的上 下边 以不超出区间 Q1 1 5 IQR Q3 1 5 IQR 的最大 最小观测值为线的上 下端 超出该区域的数据视为离群值 其中 IQR interquartilerange Q3 Q1SPSS中 Graphs Interactive boxplot 注 SPSS还定义了所谓极端值 即超出区间 Q1 3 IQR Q3 3 IQR 范围的数值 4 箱式图推断离群值 数据集 2 57 60 60 65 68 70 71 72 74 74 76 77 98 150 220 5 箱式图推断离群值 离群值 离群 极端 值 离群 极端 值 离群 极端 值 6 Z值推断离群值 以Z值区间 3 0 3 0 为标准 超过者为可能的离群值 这相当于以平均值为中心的99 9 置信区间 SPSS中 Analyze Descriptivestatistics Descriptives 7 Z值推断离群值 勾选 将标准化变量Z值视为变量存入数据列表中 8 Z值推断离群值 可以看到 哪怕是220其Z值也只为2 969 未过此标准 与箱式图比过于保守 原因与算术平均值的特点有关 9 离群值的判定 Z值法通常比箱式图法更保守一些 原因是Z值本身就受极端值影响较大 两种方法都不是硬性规定 只为参考 对于离群值的判定要慎重 宁可保守 不可贸然删除 对较小数据集 比如 100 尤其如此 10 数学变换 参数性统计分析方法通常对数据的正态性 方差齐性 变量间的线性等有着明确或潜在的要求 若违背了这些前提 可能降低方法的可靠性 甚至导致其完全失效 当数据不满足这些条件 可以尝试通过数学变换加以改善 以达到顺利使用这些统计方法的目的 11 数学变换 数学变换的使用存在争议 实践中也会给结果的解释带来困难 多数参数性方法是相当稳健的 即 对正态性 方差齐性的稍许偏离并不妨碍正常使用 可能因此损失的检验效力对常规分析仍可接受 尤其在样本量较大 n 30 的情况下 除非特别必要 慎用数学变换 12 数学变换 存在下述情况可尝试数学变换 数据极度偏态分布 J型分布或严重左 右偏组间均值与标准差之间存在中度至高度的相关性必须使用多元统计方法 但正态性和线性不满足样本含量少 n 30 且正态性 齐性不满足 13 数学变换 常见类型对数变换平方根变换反正弦变换倒数变换或上述变换的组合 适合极度偏态分布 组间呈数量级变化 适合中度偏态分布 有泊松分布特征 适合偏大或偏小的百分数资料 适合J型分布资料 14 2020 1 27 15 数学变换举例 除草剂试验 响应变量为单位面积杂草数量 均值大 标准差也大 似乎存在相关关系 16 数学变换举例 均值与标准差相关系数达到0 825 散点图也看出相关趋势 17 数学变换举例 若直接对原始数据进行annova分析 未通过方差齐性检验 说明各组间方差差异不能忽略 18 数学变换举例 对杂草数量作频数分析 可见其分布明显右偏 偏斜度curtosis 3 249 0 考虑到单位面积杂草数最有可能服从泊松分布 2 最适合平方根变换 19 数学变换举例 对响应变量取平方根 TransformComputevariable 20 数学变换举例 对响应变量取平方根 Transform Computevariable 转换后的相关系数0 693 有所改善 21 数学变换举例 做过平方根变换后 再作频数分析 可见其分布有了较大改善 更接近正态 偏斜度curtosis 0 044 22 数学变换举例 转换后的方差齐性达到要求 可以进行单因素方差分析 23 样本含量的确定 理论上讲 样本含量当然越多越好 但究竟达到什么水平就足够好 这也是试验设计中关心的问题之一 在数学上要回答这个问题相当繁难 这里只对常见分析提出简略的计算方法 1 两均值的比较2 两百分数的比较3 方差分析 24 样本含量的确定 4 获得一个有意义的相关系数r5 多元回归 所有自变量 包括哑变量 个数 106 因子分析 样本指标比至少达到5 1 最好能接近10 1 25 统计方法的选择 26 统计方法的选择 27 问题分析 1 现拟考察老年男性 女性冠心病患病率有否不同 是否随年龄改变 共收集50 89岁512名老人相关数据 用什么统计方法进行分析 2 为比较新药A与传统药B对焦虑症缓解效果 现将44名病人均分为两组 分别接受A B药治疗 测量0至5周每周的焦虑指标 连续变量 请问如何分析 3 研究投食方式对幼猴生长影响 采取总量一定 一日1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小数乘法(单元测试)-2024-2025学年五年级上册数学人教版
- 2025年事业单位工勤技能-湖南-湖南堤灌维护工四级(中级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-湖北-湖北垃圾清扫与处理工二级(技师)历年参考题库含答案解析
- 2025-2030中国纳米钛酸钡行业发展趋势及投资策略分析报告
- 2025年事业单位工勤技能-湖北-湖北保育员一级(高级技师)历年参考题库含答案解析
- 2025年绿色建筑智能系统集成为核心的节能降耗评估报告
- 2025-2030中国精炼核桃油市场营销策略及发展趋势研究报告
- 2025年事业单位工勤技能-河南-河南管道工二级(技师)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-江西-江西理疗技术员五级(初级工)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-江苏-江苏垃圾清扫与处理工三级(高级工)历年参考题库含答案解析(5套)
- 业务协同与合并抵销报表方案汇报v1.9
- 标准预防及安全注射
- 儿童体适能教学 课件 (20期)
- 本质安全的概念和意义
- 2025-2030年中国少儿英语培训市场发展状况及投资前景规划研究报告
- 常用公文写作规范培训
- 《玉米病虫害及防治》课件
- DB51T 2772-2021 四川省医疗护理员服务规范
- 乡镇道路清扫合同范例
- DB3209T 1232-2023 菊花病虫害绿色防控技术规程
- 员工应聘登记表(齐全版)
评论
0/150
提交评论