spss数据的录入与管理PPT课件.pptx

上传人：优*** IP属地：广东上传时间：2020-01-27 格式：PPTX 页数：41 大小：1.05MB 积分：35 举报 版权申诉

已阅读5页，还剩36页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

数据的录入与管理报告人 2020 1 27 1 第二章数据录入与数据获取第三章变量级别的数据管理第四章文件级别的数据管理 2020 1 27 2 第二章数据录入与数据获取数据的直接录入非电子化的原始数据资料需要直接将调查问卷中的数据录入进SPSS软件中建立数据文件外部数据的获取已经被录入为其他数据格式的资料需要将其内容直接读入SPSS中 2020 1 27 3 2 2数据格式原则 1 不同个案的数据不能再同一条记录中出现即同一个案的数据应当独占一行 2 每一个测量指标影响因素只能占据一列的位置即同一指标的测量数值都应当录入到同一个变量中去 2020 1 27 4 数据录入三部曲 1 定义各变量名即给每个指标起个名字 2 指定每个变量的各种属性即对每个指标的一些统计特性做出指定 3 录入数据即把每个被访者各指标取值录入为电子格式 2020 1 27 5 变量属性 1 变量的存储类型数值型字符串日期型 1 数值型 Numeric 最常用是由0 9的阿拉伯数字和其他特殊符号如美元符号逗号或圆点组成的工资年龄成绩等标准数值型逗号数值型每3位用逗号分隔圆点数值型每3位用圆点分隔科学计数型美元数值型显示时带美元符号用户自定义型 2020 1 27 6 2 字符型 String 较常用默认显示宽度为8个字符位区分大小写字母并且不能进行数学运算用一对引号引起来 3 日期型 Date 表示日期或时间mm dd yy或类似的两位数年份记录方式 2020 1 27 7 2 变量的测量尺度定类尺度定序尺度定距尺度定比尺度 1 定类尺度是对事物的类别或属性的一种测量按照事物的某种属性对其进行分类或分组其值仅代表了事物的类别和属性仅能测定类别差不能比较各类之间的大小所以各类之间没有顺序或等级只能计算频数和频率 S0城市 2020 1 27 8 2 定序尺度对事物之间等级或顺序差类别的一种测度可以比较优劣或排序但无法测出类别之间的准确差值可以计算频率累计频率 S4学历 3 定距尺度对事物类别或次序之间间距的测度不仅能将事物区分为不同类型并进行排序而且可以准确指出类别之间差距是多少温度 4 定比尺度能够测量两个测量值之间的比值零点温度与重量 2020 1 27 9 3 变量名与变量值标签变量值标签是对变量取值含义的解释说明信息 4 缺失值系统缺失值空字符串自定义缺失值缺失值属性对话框 5 角色 1 输入 2 目标 3 两者 4 无 5 分区 6 拆分 2020 1 27 10 2 3数据的直接录入 1 开放题的录入 ID 数值型开放题姓名字符型开放题2 单选题的录入性别字符直接录入字符代码值标签数值代码值标签3 半开放题的录入其他请指出选项两个变量 1 选项 2 独立的开放题第一个变量名直接加 a 2020 1 27 11 5 多选题的录入称为多重响应数据录入后需定义多选题集多重二分法多重分类法 1 多重二分法指在编码时对应每一个选项都要定义一个变量有几个选项就有几个变量这些变量分别代表对其中一个选项的选择结果一般均为二分类而其中必然有一个类别代表选中了这一选项 2020 1 27 12 2 多重分类法利用多个变量来对一个多选题的答案进行定义应该用多少个变量由被访者实际可能给出的最多答案数而定而且这些变量必须为数值型变量利用值标签将答案标出所有变量采用一套值标签之所以称为多重分类法是因为每个变量都是多分类的每个变量代表被访者的一次选择设定多选题变量集Tables模块和多重响应菜单分析多重响应定义变量集 2020 1 27 13 6 半开放多选题与半开放单选题非常相似 2020 1 27 14 2 4外部数据的获取 SPSS格式文件打开数据非SPSS格式直接打开 Excel格式利用文本向导读入文本数据文本数据利用数据库ODBC接口读取 Access数据 2020 1 27 15 1 读取电子表格数据文件文件打开数据或Demo xls事先打开了解文件结构 1 包含几个数据表 2 若只需读入部分了解精确位置 3 第1行是否为变量名 2020 1 27 16 2 读取文本数据文件文件打开文本数据文件打开数据 demo txt 2020 1 27 17 3 用ODBC接口读取各种数据库文件demo mdb 文件打开数据库新建查询 2020 1 27 18 2 5数据的保存 1 保存为SAV格式2 保存为其他数据格式 2020 1 27 19 第三章变量级别的数据管理变量级别的数据管理转换文件级别的数据管理数据 2020 1 27 20 2020 1 27 21 转换 1 计算新变量最为常用和重要的过程2 变量转换从菜单第2项开始的多个计数过程重编码过程和离散化过程实际上可以看成是计算变量过程某一方面的强化和打包 3 时间序列模型专用过程时间和日期向导创建时间序列替换缺失值 4 自动数据准备5 其他随机数字生成器第5章运行挂起的转换 2020 1 27 22 3 1变量赋值变量赋值就是指在原有数据的基础上根据用户的要求使用SPSS算术表达式及函数对所有记录或满足SPSS条件表达式的某些记录进行四则运算并将结果存入一个用户指定的变量中该指定变量可以是一个新变量也可以是一个已经存在的变量 1 算术表达式由常量 SPSS变量名 SPSS算术运算符圆括号等组成的式子数据类型和结果均为数值型 2 函数函数名参数 8类函数3 条件表达式与逻辑表达式用来指定对哪些记录进行计算 2020 1 27 23 计算变量转换计算变量目标变量文本框用于输入需要赋值的变量名候选变量列表数字表达式文本框用于给目标变量赋值函数组列表框函数和特殊变量列表框函数解释文字文本框 2020 1 27 24 2020 1 27 25 3 2已有变量值的分组合并将连续变量转换为等级变量或将分类变量不同的变量等级进行合并重新编码为相同变量对原始变量的取值直接进行重编码重新编码为不同变量根据原始变量的取值生成一个新变量来记录重编码的结果 2020 1 27 26 对连续性变量进行分组合并两种方法重编码可视化分段过程重编码转换重新编码为不同变量分类变量类别的合并 2020 1 27 27 连续性变量的离散化可视化离散化过程用于在可视界面下将连续变量进行分段该过程可以使用百分位数标准差范围或者等间距方式将连续变量划分为若干组段并采用图形化操作的方式非常直观好用最优离散化过程是对前述可视化离散过程的进一步自动化根据某些作为关键指示变量的分类变量将原有的一个或多个连续性变量按照该分类变量类间差异最大化的优化原则离散化为分类变量然后就可以使用离散后变量而非原始数据值进行后续的分析了 2020 1 27 28 3 4转换菜单的其他功能变量的自动重编码用于将字符变量转换为数值变量变量值的移动某变量值的前移或后移指定数值的查找和计数对某个个案进行计数变量的编秩根据某变量的数值大小来排出次序然后将次序结果存储到一个新变量中去自动准备建模数据随机数字生成器 2020 1 27 29 第四章文件级别的数据管理 1 简单命令插入变量插入个案到达某条个案复制数据集等 2 常用简单过程排序拆分文件个案筛选和个案加权必须掌握 3 数据重组向导用于进行数据转置或者对重复测量数据进行长型宽型记录格式间的转换 4 文件合并向导将几个数据文件合并为一个大的SPSS数据文件含横向合并和纵向合并两种情况 5 数据字典相关向导包括定义变量属性复制变量属性以及新建设定属性三个向导界面 6 与数据准备有关的功能用于复杂数据项目用于简化数据管理工作 7 与统计模型密切相关过程正交设计过程 8 其他过程定义多重响应集数据汇总过程等 2020 1 27 30 4 1几个常用的过程 1 排序个案数据编辑窗口中的记录的前后次序在默认情况下由录入时的先后顺序决定 1 单变量排序变量名处右击升序排列降序排列 2 多变量排序使用排序个案对话框2 分割文件 SplitFile 3 选择个案用于只分析部分数据4 加权个案 1 以频数格式录入的数据 2 案例数据抽样权重的调整5 分类汇总按指定的分类变量对个案进行分组并按分组对变量求指定的描述统计量 2020 1 27 31 4 3数据文件的重组与转置 1 数据的长型与宽型格式指的是重复测量数据的两种不同的排列方式长型格式在重复测量数据中每一次测量被单独记录为一个个案 anxiety sav 宽型格式在重复测量数据中每一个个体被记录为一个个案他的所有测量被记录在不同的变量中 anxiety2 sav 2020 1 27 32 2 长型格式转换为宽型格式3 宽型格式转换为长型格式4 数据转置 2020 1 27 33 4 3多个数据文件的合并 1 纵向拼接指的是几个数据集中的数据纵向相连组成一个新的数据集新数据集中的记录数是原来几个数据集中记录数的总和其实质就是将两个数据文件的变量按照各个变量名的含义一一对应进行首尾相接 a和b 2 横向合并指的是按照记录的次序或者某个关键变量的数值将不同数据集中的不同变量拼接为一个数据集新数据集中的变量数是所有原数据集中不重名变量的总和实质就是将两个数据文件的记录按照某种对应关系一一进行左右对接 a和c 2020 1 27 34 4 4与数据字典有关的功能如果有事先定义的数据字典格式则可以先生成一个没有记录的空数据文件将全部的数据字典设定好将来在数据录入完毕后使用复制文件属性向导套用一下字典即可如果没有事先定义的数据字典格式则可以在录入工作进行了一段时间以后先使用变量属性定义向导完成数据字典的设定工作然后随着录入工作的进行经常扫描数据的情况以及时更新字典最后在录入工作完毕后使用复制文件属性向导应用字典的最终版本如果数据管理任务不太复杂也可以直接在数据字典中录入数据或者直接在变量视图中修改属性或者直接在SPSS中录入导入数据然后利用设置未知测量级别向导来快速设定数据字典 2020 1 27 35 1 定义变量属性2 复制变量属性3 新建自定义属性4 设置未知测量属性 2020 1 27 36 4 5与数据准备有关的功能 1 数据验证模块2 自动数据准备过程3 标识重复个案过程4 标识异常个案过程5 最优离散化过程6 缺失值分析 2020 1 27 37 数据验证模块数据验证模块用于实现数据核查功能用户通过自行定义数据验证规则以确定个案取值是否有效 A单变量规则单变量规则包含一组应用于单个变量的数值检查规则例如范围外值的检查对于单变量规则有效值可以表示一个范围也可以表

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

spss数据的录入与管理PPT课件.pptx

文档简介

温馨提示

最新文档

评论

spss数据的录入与管理PPT课件.pptx

文档简介

温馨提示

最新文档

评论

相关文档