




已阅读5页,还剩23页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章SPSS数据的预处理 1 第三章SPSS数据的预处理 数据的排序查找重复个案变量计算数据选取 抽样 变量值 计数分类汇总数据分组 变量重新赋值 数据预处理的其它功能 转置 加权 数据拆分 缺失值处理等菜单选项 数据 转换 2 数据的排序 数据的排序 将所有个案按照用户指定的某一个或多个变量的变量值进行升序或降序重新排列 排序的作用 方便了解数据的取值分布状况 特别是有助于发现数据的异常值 注意 1 排序的次序 升序 降序 2 多重排序时 指定排序变量的次序很关键 3 数据排序是对个案排序 而不只是对变量排序 3 数据的排序 菜单选项 数据 排序个案例 职工数据 sav 主排序变量 职称 降序 第二排序变量 基本工资 升序 第三排序变量 年龄 升序 4 查找重复个案 重复个案 关键变量相同的个案查找重复个案的方法 先按指定的关键变量对所有个案排序 再确定重复个案中哪个个案是应保留下来的 菜单选项 数据 标识重复个案例 职工数据 纵向合并 sav 5 变量计算 含义 根据用户给出的SPSS算术表达式及函数 对所有或部分满足条件的个案进行加工 目的 产生新变量或对原变量进行必要的转换注意 1 变量计算是针对个案的 每个个案都有相应的计算结果 2 变量计算的结果应保存到一个指定变量中 三个概念 SPSS算术表达式 SPSS条件表达式和SPSS函数 6 SPSS算术表达式 SPSS算术表达式是由常量 变量 算术运算符 圆括号 函数等组成的式子 字符串型常量应当用引号括起来 变量是指那些已存在于数据编辑窗口中的变量 算术运算符主要包括 乘方 在同一算术表达式中的常量及变量 数据类型应该一致 否则无法计算 7 SPSS条件表达式 条件表达式通常用于指定满足某个条件的个案 条件表达式是一个对条件进行判断的式子 其结果有两种取值 如果判断条件成立 则结果为真 如果判断条件不成立 则结果为假 条件表达式包括简单条件表达式和复合条件表达式 8 SPSS条件表达式 简单条件表达式 由关系运算符 常量 变量以及算术表达式等组成的式子 关系运算符包括 32 sr32 andnot sr 900 9 SPSS函数 算术函数 完成特定的算术计算 统计函数 计算基本的描述统计量 与分布有关的函数 随机函数 分布函数及其反函数 概率密度函数等 查找函数 用于查找判断 字符串函数 对字符型数据进行处理 日期函数 对日期进行处理 缺失值函数 用于判断缺失值 其他函数 一些辅助函数 10 变量计算 菜单选项 转换 计算变量例1 大学生职业生涯规划 sav 问题 对每个个案计算Q61 Q64的总得分 称为对专业和职业的认知得分 例2 生成10个服从N 0 1 分布的随机变量 11 数据选取 数据选取 根据分析的需要 从已收集到的大批量数据 总体 中按照一定的规则抽取部分数据 样本 参与分析的过程 通常也称为抽样 目的 1 提高数据分析效率 2 可选取部分数据参与建模 剩余的数据用于检验模型 菜单选项 数据 选择个案 12 数据选取 方法 按指定条件选取 只选取符合条件的数据随机选取 抽样选取某一范围内的样本 用于时间序列数据使用筛选器变量 选定一个变量 取值为非0或非系统缺失值的个案被选中 用于排除包含系统缺失值的个案注意 应根据不同的分析要求采用不同的选取方法 13 数据选取 例 大学生职业生涯规划 sav 问题 1 仅对大四学生进行分析 2 随机选取100个个案 注意 完成数据选取后 之后的分析将只针对被选中的个案 取消个案选取的方法 删除SPSS产生的中间变量 filter 在选择个案窗口中选择 全部个案 14 2020 3 19 15 计数 计数 对所有个案或满足某条件的部分个案 计算其若干变量中有几个变量的值落在指定的区间内 并将计数结果存入一个新变量中的过程 例如 对大学毕业班学生的成绩进行综合测评时 可以依次计算每个学生的若干门课程中有几门课程为优 有几门课程为良 有几门课程不及格 步骤 指定参与计数的变量 指定计数区间菜单选项 转换 对个案内的值计数 16 计数 例 大学生职业生涯规划 sav 问题 分析有多大比例的学生对问卷中的量表问题感觉不好回答 量表得分为0 分析 先计算Q61 Q616中取值为0的变量个数 再计算其中个数为非0的学生数所占的百分比 17 分类汇总 分类汇总 按照指定的分类变量值对所有个案进行分类 从而可以分析各分组下样本的统计特征 SPSS实现分类汇总涉及两个主要方面 1 按照哪个 或多个 变量进行分类 2 对哪个变量进行汇总 并指定对汇总变量计算哪些统计量 例如 分析不同学历职工的基本工资是否有差距 菜单选项 数据 分类汇总 18 分类汇总 例 大学生职业生涯规划 sav 问题 为评价不同专业类别学生对本专业和未来职业的喜爱及了解程度 对专业和职业认知得分按专业类别分别计算平均得分 分类变量 专业分类汇总变量 专业和职业认知得分统计量 平均值 19 数据拆分 数据拆分 是将数据按一个或几个指定的变量进行分组 后续进行的统计分析将按照分组进行 菜单选项 数据 拆分文件注意 数据拆分后 在状态栏会显示 拆分条件 取消拆分方法 重新执行数据拆分 选择 分析所有个案 不创建组 例 职工数据 sav 按职称变量分组比较组 分组统计结果输出在同一张表格中按组织输出 分组统计结果分别输出在不同的表格 20 数据分组 数据分组就是根据统计分析的需要 将数据按照某种标准重新划分为不同的组别 在数据分组的基础上进行的频数分析更能够概括和体现数据的分布特征 21 组距分组 在变量值较多的情况下 数据分组通常采用组距分组 组距分组是将全部变量值依次划分为若干区间 并将同一区间的变量值作为一组 1 全距 最大值与最小值之差 2 组数 组数的多少以分组后能清楚反映数据内部的分布特征和规律为原则 可按Sturges经验公式确定组数 3 组距 全距 组数 2 组距的确定 22 变量重新赋值 组距分组的实现是对变量重新赋值的一种 变量的重新赋值赋值到同一变量 转换 重新编码为相同变量赋值到不同变量 转换 重新编码为不同变量例 大学生职业生涯规划 sav 问题 对专业和职业认知得分变量 以5为组距进行分组 23 数据转置 SPSS的数据转置 将数据编辑窗口中数据的行列互换菜单选项 数据 转置例 职工数据 sav 注意 转置后 数据结构的信息会丢失 24 加权个案 加权个案 给个案加以不同的权重 通过复制 可计算加权平均注意 对于使用计数数据的组织方式录入的数据 即相同个案只录入一次 另加一个计数变量记录该个案出现的次数 在分析前 应把计数变量作为加权变量 进行数据加权 即还原为原始数据 25 加权个案 菜单选项 数据 加权个案加权后 数据编辑器窗口中的数据没有变化 但在状态栏中会显示 加权范围 一旦执行加权操作后 对以后的分析会一直有效
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年秋七年级生物上册 4.2 绿色植物的光合作用说课稿2 北京课改版
- 品酒师操作考核试卷及答案
- 见面时的礼节教学设计-2025-2026学年中职专业课-旅游服务礼仪-旅游类-旅游大类
- 甲基硅氧烷生产工入职考核试卷及答案
- 解决社会问题的营销方案
- 7.3 拟定保护生态环境的计划(说课稿)2023-2024学年七年级生物下册同步教学(人教版河北专版)
- 金属材丝拉拔工技能比武考核试卷及答案
- 电池制液工安全规范考核试卷及答案
- 安全咨询公司盈利方案
- 第三节 摩擦力说课稿-2025-2026学年高中物理粤教版2019必修 第一册-粤教版2019
- 软件系统维护合同范本
- 桥架购销合同范本4篇
- 2025年江西省高考物理试卷真题(含答案)
- 2025年政策影响诊断人工智能在体育产业应用政策导向与市场趋势分析方案
- 涉旅安全培训讲话课件
- 2025年大麻酚油(CBD油)行业研究报告及未来行业发展趋势预测
- 白皮书政策解读-2025年国防科技与国家安全政策趋势分析方案
- GB/T 20716.2-2025道路车辆牵引车和挂车之间的电连接器(7芯)第2部分:12 V标称电压车辆的制动系统和行走系的连接
- (新教材)2025年秋期人教版一年级上册数学全册核心素养教案(教学反思无内容+二次备课版)
- 2025广西公需科目真题续集(附答案)
- 学校“1530”安全教育记录表(2024年秋季全学期)
评论
0/150
提交评论