spss数据的录入与管理PPT课件.pptx_第1页
spss数据的录入与管理PPT课件.pptx_第2页
spss数据的录入与管理PPT课件.pptx_第3页
spss数据的录入与管理PPT课件.pptx_第4页
spss数据的录入与管理PPT课件.pptx_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据的录入与管理 报告人 2020 1 27 1 第二章数据录入与数据获取第三章变量级别的数据管理第四章文件级别的数据管理 2020 1 27 2 第二章数据录入与数据获取 数据的直接录入非电子化的原始数据资料 需要直接将调查问卷中的数据录入进SPSS软件中 建立数据文件 外部数据的获取已经被录入为其他数据格式的资料 需要将其内容直接读入SPSS中 2020 1 27 3 2 2数据格式 原则 1 不同个案的数据不能再同一条记录中出现 即同一个案的数据应当独占一行 2 每一个测量指标 影响因素只能占据一列的位置 即同一指标的测量数值都应当录入到同一个变量中去 2020 1 27 4 数据录入三部曲 1 定义各变量名 即给每个指标起个名字 2 指定每个变量的各种属性 即对每个指标的一些统计特性做出指定 3 录入数据 即把每个被访者各指标取值录入为电子格式 2020 1 27 5 变量属性 1 变量的存储类型数值型字符串日期型 1 数值型 Numeric 最常用是由0 9的阿拉伯数字和其他特殊符号 如美元符号 逗号或圆点组成的 工资 年龄 成绩等 标准数值型逗号数值型 每3位用逗号分隔圆点数值型 每3位用圆点分隔科学计数型美元数值型 显示时带美元符号用户自定义型 2020 1 27 6 2 字符型 String 较常用默认显示宽度为8个字符位 区分大小写字母 并且不能进行数学运算 用一对引号引起来 3 日期型 Date 表示日期或时间mm dd yy或类似的两位数年份记录方式 2020 1 27 7 2 变量的测量尺度定类尺度定序尺度定距尺度定比尺度 1 定类尺度是对事物的类别或属性的一种测量 按照事物的某种属性对其进行分类或分组 其值仅代表了事物的类别和属性 仅能测定类别差 不能比较各类之间的大小 所以各类之间没有顺序或等级 只能计算频数和频率 S0城市 2020 1 27 8 2 定序尺度对事物之间等级或顺序差类别的一种测度 可以比较优劣或排序 但无法测出类别之间的准确差值 可以计算频率 累计频率 S4学历 3 定距尺度对事物类别或次序之间间距的测度 不仅能将事物区分为不同类型并进行排序 而且可以准确指出类别之间差距是多少 温度 4 定比尺度能够测量两个测量值之间的比值 零点 温度与重量 2020 1 27 9 3 变量名与变量值标签变量值标签是对变量取值含义的解释说明信息 4 缺失值系统缺失值 空字符串自定义缺失值 缺失值属性对话框 5 角色 1 输入 2 目标 3 两者 4 无 5 分区 6 拆分 2020 1 27 10 2 3数据的直接录入 1 开放题的录入 ID 数值型开放题 姓名 字符型开放题2 单选题的录入 性别 字符直接录入字符代码 值标签数值代码 值标签3 半开放题的录入 其他 请指出 选项两个变量 1 选项 2 独立的开放题 第一个变量名直接加 a 2020 1 27 11 5 多选题的录入称为 多重响应 数据录入后需定义多选题集 多重二分法 多重分类法 1 多重二分法指在编码时 对应每一个选项都要定义一个变量 有几个选项就有几个变量 这些变量分别代表对其中一个选项的选择结果 一般均为二分类 而其中必然有一个类别代表选中了这一选项 2020 1 27 12 2 多重分类法利用多个变量来对一个多选题的答案进行定义 应该用多少个变量由被访者实际可能给出的最多答案数而定 而且 这些变量必须为数值型变量 利用值标签将答案标出 所有变量采用一套值标签 之所以称为多重分类法 是因为每个变量都是多分类的 每个变量代表被访者的一次选择 设定多选题变量集Tables模块和多重响应菜单 分析多重响应定义变量集 2020 1 27 13 6 半开放多选题与半开放单选题非常相似 2020 1 27 14 2 4外部数据的获取 SPSS格式 文件 打开 数据 非SPSS格式 直接打开 Excel格式 利用文本向导读入文本数据 文本数据 利用数据库ODBC接口读取 Access数据 2020 1 27 15 1 读取电子表格数据文件 文件 打开 数据 或Demo xls事先打开了解文件结构 1 包含几个数据表 2 若只需读入部分 了解精确位置 3 第1行是否为变量名 2020 1 27 16 2 读取文本数据文件 文件 打开文本数据 文件 打开 数据 demo txt 2020 1 27 17 3 用ODBC接口读取各种数据库文件demo mdb 文件 打开数据库 新建查询 2020 1 27 18 2 5数据的保存 1 保存为SAV格式2 保存为其他数据格式 2020 1 27 19 第三章变量级别的数据管理 变量级别的数据管理 转换 文件级别的数据管理 数据 2020 1 27 20 2020 1 27 21 转换 1 计算新变量 最为常用和重要的过程2 变量转换 从菜单第2项开始的多个计数过程 重编码过程和离散化过程 实际上可以看成是 计算变量 过程某一方面的强化和打包 3 时间序列模型专用过程 时间和日期向导 创建时间序列 替换缺失值 4 自动数据准备5 其他 随机数字生成器 第5章 运行挂起的转换 2020 1 27 22 3 1变量赋值 变量赋值就是指在原有数据的基础上 根据用户的要求 使用SPSS算术表达式及函数 对所有记录或满足SPSS条件表达式的某些记录进行四则运算 并将结果存入一个用户指定的变量中 该指定变量可以是一个新变量 也可以是一个已经存在的变量 1 算术表达式 由常量 SPSS变量名 SPSS算术运算符 圆括号等组成的式子 数据类型和结果均为数值型 2 函数 函数名 参数 8类函数3 条件表达式与逻辑表达式 用来指定对哪些记录进行计算 2020 1 27 23 计算变量 转换 计算变量 目标变量 文本框 用于输入需要赋值的变量名 候选变量列表 数字表达式 文本框 用于给目标变量赋值 函数组 列表框 函数和特殊变量 列表框 函数解释文字文本框 2020 1 27 24 2020 1 27 25 3 2已有变量值的分组合并 将连续变量转换为等级变量或将分类变量不同的变量等级进行合并 重新编码为相同变量 对原始变量的取值直接进行重编码 重新编码为不同变量 根据原始变量的取值生成一个新变量来记录重编码的结果 2020 1 27 26 对连续性变量进行分组合并 两种方法 重编码可视化分段过程重编码 转换 重新编码为不同变量 分类变量类别的合并 2020 1 27 27 连续性变量的离散化 可视化离散化过程 用于在可视界面下将连续变量进行分段 该过程可以使用百分位数 标准差范围或者等间距方式将连续变量划分为若干组段 并采用图形化操作的方式 非常直观好用 最优离散化过程 是对前述可视化离散过程的进一步自动化 根据某些作为 关键指示变量 的分类变量 将原有的一个或多个连续性变量按照该分类变量类间差异最大化的优化原则离散化为分类变量 然后就可以使用离散后变量而非原始数据值进行后续的分析了 2020 1 27 28 3 4转换菜单的其他功能 变量的自动重编码 用于将字符变量转换为数值变量变量值的移动 某变量值的前移或后移指定数值的查找和计数 对某个个案进行计数变量的编秩 根据某变量的数值大小来排出次序 然后将次序结果存储到一个新变量中去自动准备建模数据随机数字生成器 2020 1 27 29 第四章文件级别的数据管理 1 简单命令 插入变量 插入个案 到达某条个案 复制数据集等 2 常用简单过程 排序 拆分文件 个案筛选和个案加权 必须掌握 3 数据重组向导 用于进行数据转置 或者对重复测量数据进行长型 宽型记录格式间的转换 4 文件合并向导 将几个数据文件合并为一个大的SPSS数据文件 含横向合并和纵向合并两种情况 5 数据字典相关向导 包括定义变量属性 复制变量属性 以及新建设定属性三个向导界面 6 与数据准备有关的功能 用于复杂数据项目 用于简化数据管理工作 7 与统计模型密切相关过程 正交设计过程 8 其他过程 定义多重响应集 数据汇总过程等 2020 1 27 30 4 1几个常用的过程 1 排序个案数据编辑窗口中的记录的前后次序在默认情况下由录入时的先后顺序决定 1 单变量排序 变量名处右击 升序排列 降序排列 2 多变量排序 使用 排序个案 对话框2 分割文件 SplitFile 3 选择个案 用于只分析部分数据4 加权个案 1 以频数格式录入的数据 2 案例数据抽样权重的调整5 分类汇总 按指定的分类变量对个案进行分组 并按分组对变量求指定的描述统计量 2020 1 27 31 4 3数据文件的重组与转置 1 数据的长型与宽型格式指的是重复测量数据的两种不同的排列方式 长型格式 在重复测量数据中 每一次测量被单独记录为一个个案 anxiety sav 宽型格式 在重复测量数据中 每一个个体被记录为一个个案 他的所有测量被记录在不同的变量中 anxiety2 sav 2020 1 27 32 2 长型格式转换为宽型格式3 宽型格式转换为长型格式4 数据转置 2020 1 27 33 4 3多个数据文件的合并 1 纵向拼接指的是几个数据集中的数据纵向相连 组成一个新的数据集 新数据集中的记录数是原来几个数据集中记录数的总和 其实质就是将两个数据文件的变量按照各个变量名的含义一一对应进行首尾相接 a和b 2 横向合并指的是按照记录的次序 或者某个关键变量的数值 将不同数据集中的不同变量拼接为一个数据集 新数据集中的变量数是所有原数据集中不重名变量的总和 实质就是将两个数据文件的记录按照某种对应关系一一进行左右对接 a和c 2020 1 27 34 4 4与数据字典有关的功能 如果有事先定义的数据字典格式 则可以先生成一个没有记录的空数据文件 将全部的数据字典设定好 将来在数据录入完毕后使用复制文件属性向导套用一下字典即可 如果没有事先定义的数据字典格式 则可以在录入工作进行了一段时间以后先使用变量属性定义向导完成数据字典的设定工作 然后随着录入工作的进行经常扫描数据的情况 以及时更新字典 最后在录入工作完毕后使用复制文件属性向导应用字典的最终版本 如果数据管理任务不太复杂 也可以直接在数据字典中录入数据 或者直接在变量视图中修改属性 或者直接在SPSS中录入 导入数据 然后利用设置未知测量级别向导来快速设定数据字典 2020 1 27 35 1 定义变量属性2 复制变量属性3 新建自定义属性4 设置未知测量属性 2020 1 27 36 4 5与数据准备有关的功能 1 数据验证模块2 自动数据准备过程3 标识重复个案过程4 标识异常个案过程5 最优离散化过程6 缺失值分析 2020 1 27 37 数据验证模块 数据验证模块用于实现数据核查功能 用户通过自行定义数据验证规则 以确定个案取值是否有效 A单变量规则 单变量规则包含一组应用于单个变量的数值检查规则 例如 范围外值的检查 对于单变量规则 有效值可以表示一个范围 也可以表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论