第2讲+描述性统计分析.ppt_第1页
第2讲+描述性统计分析.ppt_第2页
第2讲+描述性统计分析.ppt_第3页
第2讲+描述性统计分析.ppt_第4页
第2讲+描述性统计分析.ppt_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS统计分析从基础到实践 第2版 联系Email sharepub 第2讲描述性统计分析 统计分析方法必须明确三点 干什么的 怎么用 哪里才能用 结果是什么意思 2 1描述性统计分析概述 描述集中趋势的统计量 描述离散程度统计量 描述变量分布情况统计量 DescriptiveStatistics 子菜单 Frequencies 产生变量值的频数分布表 并可计算常见描述性统计量和绘制相对应的统计图 Descriptives 计算一般的描述性统计量 Explore 探索性分析 使用户能够从大量的分析结果之中挖掘到所需要的统计信息 Crosstabs 对分类变量进行统计推断 包括卡方检验 确切概率等 是SPSS重要的过程 Ratio 计算两个变量相对比的统计量特征 P PPlots 绘制P P图 检验数据服从的分布情况 Q QPlots 绘制Q Q图 检验数据服从的分布情况 2 2频数分析 Frequencies 频数分析简介频数分析表是描述性统计中最常用的方法之一 它主要包括以下几点功能 1 产生详细的频数表2 按要求给出某个分位点3 绘制常用的条图 饼图等统计图适用范围 更适用于对分类变量以及不服从正态分布的连续性变量进行描述 学生身高频数表 已知有某地120名12岁男童身高数据 编制其传统的简易频数表 执行 Analyze DescriptiveStatistics Frequencies 命令 弹出如下所示对话框 结果解读1 频数表 2 描述性统计量3 直方图 问题 以上3个结果分别用来说明什么问题 2 3基础统计分析 Descriptive Descriptive简介Descriptive过程是连续资料统计描述应用最多的一个过程 对变量进行描述性统计分析 计算并列出一系列相应的统计指标 这与其它过程相比并无不同 这个过程有一个特殊的功能 可将原始数据转换成标准正态分布评分值 并以变量形势存入数据库供以后分析 学生身高频数表执行 Analyze DescriptiveStatistics Explore 命令 弹出如下对话框 结果解读1 描述性分析表 2 标准正态分布变化Z变换 标准正态变换 其中表变量的均值 S表变量的标准差 如果选择该项 则数据文件中将自动生成一列名为 Z 原变量名 的新变量 变换前变换后 问题 标准正态分布变化后的数据有什么作用 2 4探索性分析 Explore 与前面介绍的两个过程相比 Explore 过程更加强大 它除了可以计算常见描述性统计量之外 还可以给出一些简单的检验结果和图形 有助于用户进一步地分析数据 适用范围 对资料的性质 分布特点等完全不清楚的时候 补充 假设检验 定义 假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法 它是根据原资料作出一个总体指标是否等于某一个数值 某一随机变量是否服从某种概率分布的假设 然后利用样本资料采用一定的统计方法计算出有关检验的统计量 依据一定的概率原则 以较小的风险来判断估计数值与总体数值 或者估计分布与实际分布 是否存在显著差异 是否应当接受原假设选择的一种检验方法 基本思想 概率反证法 1 为了检验一个零假设 即虚拟假设 是否成立 先假定它是成立的 然后看接受这个假设之后 是否会导致不合理结果 如果结果是合理的 就接受它 如不合理 则否定原假设 2 所谓导致不合理结果 就是看是否在一次观察中 出现小概率事件 通常把出现小概率事件的概率记为0 01或者0 05 即显著性水平 问题 能否通过直观的描述假设检验的基本思想 一般步骤 1 根据问题的需要对所研究的总体作某种假设 记作H0 2 选取合适的统计量 这个统计量的选取要使得在假设H0成立时 其分布为已知 3 由实测的样本 计算出统计量的值 4 计算并根据预先给定的显著性水平进行检验 作出拒绝或接受假设H0的判断 学生身高的探索性分析执行 Analyze DescriptiveStatistics Explore 命令 弹出如图所示对话框 结果解读1 描述性统计分析表其中 5 TrimmedMean 去掉5 极端数之后的均值 2 M 均值估计 检验异常数据 3 分位点表其中Tukey sHinges表示的是绘制箱图时所用的分位点数据 它的计算方法和一般的百分位数略有不同 4 极值表5 正态性检验 6 方差齐次性检验 7 茎叶图茎叶图包括频数 Frequency 茎 Stem 和叶 Leaf 3部分 8 QQ图和QQ去势图 问题 各种图形是用来做什么的 正态性检验和方差齐次性检验方法的作用分别是什么 2 5列联表分析 Crosstabs 1 四格卡方检验的基本思想在分类资料统计分析中我们常会遇到这样的资料 如两组大白鼠在不同致癌剂作用下的发癌率如下表 问两组发癌率有无差别 处理发癌数未发癌数合计发癌率 甲组52197173 24乙组3934292 86 合计912211380 33 卡方检验的统计量是卡方值 它是每个格子实际频数A与理论频数T差值平方与理论频数之比的累计和 每个格子中的理论频数T是在假定两组的发癌率相等 均等于两组合计的发癌率 的情况下计算出来的 如第一行第一列的理论频数为71 91 113 57 18 故卡方值越大 说明实际频数与理论频数的差别越明显 两组发癌率不同的可能性越大 2 卡方检验方法的适用条件 吸烟习惯与患病率的关系调查339名50岁以上吸烟习惯与患慢性气管炎病的关系 如上表所示 试问吸烟者与不吸烟者慢性气管炎患病率是否有所不同 数据的预处理 WEIGHTCASE 执行 Analyze DescriptiveStatistics Crosstabs 命令 弹出如图所示对话框 结果解读1 列联表2 卡方检验结果 3 条图 2 6相对比描述 Ratio 在实际问题中 研究者有时除了希望了解变量自身的统计特征 还希望得到两个变量相对比之间的统计描述 法一 通过对两个变量作除法形成一个新变量 然后分析新变量的统计特征来得到 法二 直接通过 Ratio 过程来分析两个变量之间的相对比关系 并且可以得到多于第一种方法的信息 各地区城乡居民消费水平比较已知有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论