第章SPSS基本统计量的描述PPT课件.ppt_第1页
第章SPSS基本统计量的描述PPT课件.ppt_第2页
第章SPSS基本统计量的描述PPT课件.ppt_第3页
第章SPSS基本统计量的描述PPT课件.ppt_第4页
第章SPSS基本统计量的描述PPT课件.ppt_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章SPSS基本统计分析 频数分析计算基本描述统计量探索性数据分析交叉分组下的频数分析 卡方检验 多选项分析比率分析 1 涉及的统计过程 描述统计 的全部 比较均值 的均值过程 多重响应 过程用途 主要用来描述一个或多个变量的描述性统计量以及分布特征 分析变量间的关系 2 统计基础 随机变量与概率分布 随机变量 有些变量在观察前事先不能确定数值 但其取值又有一定规律性 概率 probability 描述随机事件发生的规律性 可能性 取值界于0和1之间 离散性随机变量 如击中次数 常用概率分布列表示具体取值的概率 连续性随机变量 如身高 体重等变量 常用概率分布密度函数表示某取值范围的概率 3 概率分布密度函数 4 常见的概率分布曲线 5 描述数据分布形状的特征量 偏度g1 分布形状的左右对称性 g1 0 正偏态 g10 尖峭峰 g2 0 平阔峰正态性检验 6 一 频数分析 目的 粗略把握数据的分布特征功能 编制频数分布表 频数 百分比 累计百分比绘制频数分析中常用统计图 条图 饼图 直方图计算基本描述统计量 7 基本操作 分析 描述统计 频率选项按钮 统计 选择输出统计量 集中 离散趋势 分布特征 百分位数 图标 选择绘制的图形 条图 饼图 直方图 仅用于定量变量 格式 定义频数表输出格式 8 分析 描述统计 频率界面 9 统计选项 计算分位数计算常用描述统计量 10 频数分布表格式定义 11 频数分析应用举例 储户的户口 职业 分类数据 使用频数 百分比描述 累计百分比无太大意义 储户收入水平 定序数据 除使用频数 百分比外 还有累计百分比 取款目的排名 频数分布表输出按频数降序输出频数 格式 降序个数数据中若存在缺失值 使用有效百分比 12 取款金额 定量数据 的分析不显示频数分析表统计图表 直方图不同户口 城镇 农村 的人群取款目的分析 首先做数据拆分 再进行频数分析 13 条图 饼图 直方图 14 二 计算基本描述统计量 目的 精确把握变量的总体分布状况 基本操作 描述统计 频率过程 统计描述统计 描述过程描述统计 探索过程均值比较 均值过程 分组显示 用途 计算变量的集中趋势 离散趋势 偏度 峰度等指标 绘制统计图 15 几个过程的基本描述统计量比较 16 17 探索 过程可计算分组或不分组的描述性统计量 18 几个过程的其他功能 19 描述统计 描述过程的独有功能 例 你能很快找到取款数目异常 3 的储户吗 标准化变换 20 均值比较 均值过程的独有功能 分层输出结果 分组输出结果 21 22 三 探索性数据分析 基本操作 分析 描述统计 探索过程目的 对数据进行初步考察用途 计算整体或分组数据的描述性统计指标输出描述性统计图 茎叶图 直方图 箱式图正态性检验 方差齐性检验检查数据的错误 辨认奇异值 23 24 选项 缺失值处理1 某观测在所选择的变量中有缺失值时 该观测不参与全部分析2 仅在与该变量有关的分析中视为缺失值3 缺失值做为一个组别输出 25 绘制 1 输出图形 箱式图 茎叶图 直方图2 正态性检验及图示3 Levene方差齐性检验 26 例 居民储蓄调查 描述城乡居民存取款金额的差别检查存取款金额的奇异点和极端值对存取款金额进行正态性检验和方差齐性检验 以便进一步选择分析方法 27 28 29 30 31 32 33 34 箱式图是在剔除了变量的极端值 奇异点后计算统计量并绘制的 中间的黑粗线为中位数 红框为四分位间距的范围 上下两个细线为最大 最小值 35 四 交叉分组下的频数分析 目的 掌握多变量的联合分布特征 分析变量间的关系 功能 产生描述多变量联合分布的列联表比较两个 或以上 样本率或比例差异 卡方检验 变量间的关联度分析 36 2020 2 9 37 1 变量关系概述 变量间的关系 有关与无关 有关 如果一个变量的取值发生变化 另外一个变量的取值也相应发生变化无关 如果一个变量的变化不引起另一个变量的变化 38 性别与四级英语考试通过率的相关统计 表述 结果显示 当性别取值不同时 通过率变量的取值并未发生变化 因此性别与考试通过率无关 自变量的不同取值在因变量上无差异 两变量无关 自变量的不同取值在因变量上有差异 两变量有关 39 表述 统计结果显示 当性别取值不同时 收入变量的取值发生了变化 因此性别与月收入有关 40 2 双变量关系的统计类型 41 列联表的格式 42 列联分析 行列变量间的关系 两变量是否相互独立 两变量是否有共变趋势 一变量的变化多大程度上能由另一变量的变化来解释 43 卡方测量的原理 卡方测量用来考察两变量是否独立 无关 其原理是根据这一概率定理 若两变量无关 则两变量中联合事件发生的概率应等于各自独立发生的概率乘积 在列联表中 这一定理就具体转化为 若两变量无关 则两变量中条件概率应等于各自边缘概率的乘积 反之 则两变量有关 或两变量不独立 44 由此可见 期望值与观察值的差距越大 说明两变量越不独立 也就越相关 因此 Pearson卡方的表达式如下 当为四格表时 卡方的取值在0 之间 卡方值越大 行列变量的关联性越强 45 列联表的产生 分析 描述统计 交叉表 46 界面说明 行 用于选择行 列表中的行变量 列 用于选择行 列表中的列变量 层 层变量 显示复式条形图 显示复式条图 取消表格 不输出行 列表 精确 针对2 2以上的行 列表设定计算确切概率的方法 注 安装SPSS时除非特别选定 否则 精确 模块一般不安装 47 列联表所研究的问题 城镇和农村的储户收入水平状况相同吗 行变量 户口列变量 收入水平不同班级的患病情况一致吗 行变量 班级列变量 患病城乡储户认为存钱合算的比例是否相同 行变量 户口列变量 什么合算 48 回答不同班级患病是否相同的问题 需要引入卡方检验 49 1 卡方检验步骤 提出假设H0 行 列变量独立 对立假设为 计算检验统计量 卡方统计量服从 r 1 c 1 个自由度的卡方分布 确定检验水平与界值结果判断 查界值表 看P值大小 50 卡方检验操作 统计量选项 51 单元格 用于定义列联表单元格中需要计算的指标 计数 是否输出实际观察数和理论数 百分比 是否输出行百分数 列百分数以及合计百分数 残差 选择残差的显示方式 格式 用于选择行变量是升序还是降序排列 52 结果 城乡储户的收入水平没有明显差异 53 Pearson卡方值的影响因素 实际频数与期望频数之差期望频数的大小列联表的单元格子数样本量大小 54 2 卡方检验的校正 自由度为1时 期望频数均大于5 连续性校正20 的单元格期望频数小于5 似然比卡方检验T 5andn 40或T 1时 确切概率法 55 3 行列变量的关联度分析 该关联度类似于参数检验中相关系数的含义 取值多在 1 1 区间可描述行列变量的关联强度 多数是对Pearson卡方测量值进行的修正 为两变量相关研究中的非参数方法 卡方检验中的关联度分析不太常用 56 3 1 两定类变量的关联度 列联系数 取值0 1 其取值随着行列数的增加而增大Phi系数 取值 1 1 适用于四格表 对样本量进行了修正V系数 取值0 1 对样本量和行列数进行修正 四格表时 等于Phi系数 57 3 2 两定序变量的关联度 同序对数 P 异序对数 Q 当一个变量为升序排列时 另一变量序列中有后面的一个变量值大于前面的一个变量值 则记为一个同序对 否则为异序对 Kendall stau b 行列数相等时Kendall stau c 任意列联表Gamma系数 四格表检验 58 3 3 其他关联度 一个定类变量 一个定距变量的关联度 Eta系数 类似方差分析的非参数检验两定距变量 或定序变量 的关联度 相关 Correlations 计算Pearson和Spearman相关系数 59 4 配对计数资料的卡方检验 例子 海尔公司的市场调查数据 对每个消费者调查两个问题 1 是否购买过海尔冰箱 是 否 2 是否购买过海尔洗衣机 是 否 问1 海尔冰箱和洗衣机的购买率是否有差别 问2 每位消费者对海尔冰箱和洗衣机的购买一致性程度如何 60 4 配对计数资料的卡方检验 McNemar 配对计数资料的卡方检验 零假设为两变量的阳性率无差别Kappa一致性检验 系数取值 1 1 测量同一观测对象在两变量 两变量服从二项分布 上取值的一致性程度 其绝对值越接近1 说明一致性程度越高 一般来说 系数 0 7 一致性程度较高 0 4 0 7 一致性程度一般 0 4 一致性较弱 61 五 多选项分析 目的 解决问卷设计中的多选项问题的分析多选项分析步骤 先将多选项问题分解 分解方法 是否丢失信息 是否易于分析 二分法 把每个选项均转为二分类变量有序分类法 把该问题按顺序转为多个问题再进行频数分析 62 例子 高考志愿调查 请按顺序选择你想报考的三所大学北大清华人大北师大北京理工大学北外第一第二第三 63 二分法分解 你报考北大吗 1 是2 否你报考清华吗 1 是2 否你报考北师大吗 1 是2 否你报考北外吗 1 是2 否你报考人大吗 1 是2 否你报考北理工吗 1 是2 否 64 有序分类法分解 志愿一 1 6志愿二 1 6志愿三 1 6 有序分类法较优 另一个例子 您有过下列症状吗 可多选 A 失眠 B 多梦 C 情绪低落 D 记忆力减退如何分解 65 SPSS的多选项分析 基本操作 分析 多重响应 定义变量集 定义多选项 66 多选项频数分析 基本操作 分析 多重响应 频率 多选项频数分析例 对居民储蓄调查数据 指定目的一 目的二 目的三为多选项变量集后 选择频数分析后 SPSS自动汇总各种目的的频数表如对不同年龄段的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论