SPSS数据文件的建立和预处理PPT课件.ppt_第1页
SPSS数据文件的建立和预处理PPT课件.ppt_第2页
SPSS数据文件的建立和预处理PPT课件.ppt_第3页
SPSS数据文件的建立和预处理PPT课件.ppt_第4页
SPSS数据文件的建立和预处理PPT课件.ppt_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2020 1 27 可编辑 1 SPSS软件简介 SPSS软件是由多个窗口组成 其中最基本的两个窗口是 数据编辑窗口和结果输出窗口 1 2020 1 27 可编辑 1 1数据窗口 dataeditor 1 功能 对数据文件进行定义 录入 修改 管理等基本操作 2 窗口组成 标题栏 菜单栏 工具栏 二维表格 状态栏3 spss各统计分析功能是针对当前数据窗口中文件进行的 数据文件的扩展名是 sav 2 2020 1 27 可编辑 窗口主菜单 工具栏 系统状态栏 3 2020 1 27 可编辑 窗口主菜单1 File文件操作菜单 对SPSS相关文件进行基本管理 如 新建 打开 保存 打印等 4 2020 1 27 可编辑 窗口主菜单2 Edit数据编辑操作菜单 对数据编辑窗口中的数据进行基本编辑 如 撤销 恢复 剪切 复制 粘贴等 并实现数据查找 软件参数设置等功能 5 2020 1 27 可编辑 窗口主菜单3 View窗口外观状态操作菜单 对SPSS窗口外观等进行设置 如 状态栏 表格线 变量值标签等是否显示 字体设置等 6 2020 1 27 可编辑 窗口主菜单4 Data数据的操作和管理操作菜单 对数据编辑窗口中的数据进行加工整理 如 数据的排序 转置 选取 分类汇总 加权等 7 2020 1 27 可编辑 窗口主菜单5 Transform数据基本处理操作菜单 对数据编辑窗口中的数据进行基本处理 如 生成新变量 计数 分组等 8 2020 1 27 可编辑 窗口主菜单6 Analyze数据分析操作菜单 Analyze统计分析对数据编辑窗口中的数据进行统计分析和建模 如 基本统计分析 均值比较 相关分析 回归分析 非参数检验等 9 2020 1 27 可编辑 窗口主菜单7 Graphs制作统计图形操作菜单 对数据编辑窗口的数据生成各种统计图形 如 条形图 直方图 饼图 线图 散点图等 10 2020 1 27 可编辑 窗口主菜单8 Utilities实用程序操作菜单 SPSS其他辅助管理 如 显示变量信息 定义变量集 菜单编辑器等 11 2020 1 27 可编辑 窗口主菜单9 Window窗口管理操作菜单 对SPSS中的多个窗口进行管理 如 窗口切换 最小化窗口等 12 2020 1 27 可编辑 窗口主菜单10 Help帮助操作菜单 实现SPSS的联机帮助 如语句检索 统计教练等 13 2020 1 27 可编辑 1 2结果输出窗口 output 14 2020 1 27 可编辑 1 3SPSS数据分析的一般步骤 15 2020 1 27 可编辑 2 SPSS数据文件的建立 建立方式之一 直接录入 即利用SPSS数据编辑窗口定义SPSS数据的结构并输入数据 建立方式之二 其他数据格式导入方式 即直接读取其他格式的数据文件并将其转为SPSS格式数据 16 2020 1 27 可编辑 熟悉数据窗口中的两个重要按钮 数据视图和变量视图 对变量进行名称 类型 长度 标签小数点位等进行设置录入数据 在值与标签之间进行转换保存数据到指定文件夹 2 1SPSS数据的直接录入 17 2020 1 27 可编辑 1 熟悉数据视图和变量视图按钮 数据录入窗口 变量设置窗口 18 2020 1 27 可编辑 2 变量设置 变量的默认设置 变量为数值型 numeric 小数点2位 decimals 变量名宽度8字符 width 数字右对齐 right 变量为连续型 scale 其余自定义 变量名 数据类型 数据宽度 小数位数 变量名标签 变量值标签 缺失值定义 列显示宽度 度量尺度定义 显示位置定义 19 2020 1 27 可编辑 A 变量名 name 变量名的字符个数不多于8个 首字符应以英文字母开头 后面可以跟除了 之外的字母或数字 下划线 圆点不能为变量名的最后一个字符变量名不区分大小写字母SPSS有默认的变量名 以 VAR 开题 后面补足5位数字 如 VAR00001等 20 2020 1 27 可编辑 B 变量类型 type 定义每个变量取值的类型 数值型 numeric 默认宽度为8 小数位为2 逗号型 comma 整数部分从各位开始每3位以一个逗号分隔 如 1 234 56科学计数型 scientificnotation 120用科学计数法表示为1 2E 02日期型 美元符号型 字符型等 21 2020 1 27 可编辑 C 变量宽度 width 变量可显示的最大字符位数D 小数位数 decimals E 变量名标签 label 对变量名含义的进一步解释说明 可增强变量名的可视性和统计结果的可读性 22 2020 1 27 可编辑 F 变量值标签 value SPSS变量的数据类型大多应定义为数值型 这样有利于以后的数据分析 变量值标签对于品质型数据尤为重要 可实现该类型变量的数值化 同时也对变量取值含义进行解释说明 例如 性别变量 可用1表示男性 2表示女性 23 2020 1 27 可编辑 G 缺失值 missing A无缺失值 系统默认 B离散缺失值 最多定义3个 C连续缺失值或多于3个的离散缺失值 输入上下限定义 但不能包含合法值 系统默认的缺失值用圆点表示 24 2020 1 27 可编辑 H 列宽度 columns 数据编辑窗口中每列数据显示的字符位数I 对齐 Align 数据显示位置的定义 靠左 靠右 居中J 度量标准 Measure 将数据划分为定距型数据 scale 定序型数据 ordinal 定类型数据 Nominal 等 25 2020 1 27 可编辑 定距型数据 scale 通常是指如身高 体重 收入等的连续型数据 也包括诸如人数 商品件数等离散型数据 即可加减乘除的数据 定序型数据 ordinal 具有固有大小或高低顺序的数据 一般可以用数值或字符表示 如 职称 满意度定类型数据 Nominal 没有内在固有大小或高低顺序 一般以数值或字符表示的分类数据 26 2020 1 27 可编辑 a 文件 File 保存 Save 或另存为 Saveas b 选择存放数据文件的目录路径和文件名 并根据需要选择数据文件的格式 3 数据的录入 4 数据的保存 将数据保存为Excel文件格式时 将变量名写入表格 呈可用状态 可指定是否将变量名写入Excel的第一行上 27 2020 1 27 可编辑 1 选择菜单 文件 File 打开 open 数据 data 2 选择数据文件的类型 并输入数据文件名 2 2读取其他格式的数据文件 28 2020 1 27 可编辑 若打开的是文本数据 txt 会打开文本数据导入向导 第一步 观察该窗口 确认SPSS是否已经正确地识别和分隔了数据 29 2020 1 27 可编辑 选择 固定宽度 和 否 第二步 若第一步未能正确识别 进入该步回答 数据项间如何分隔 数据文件的第一行上是否有变量名 30 2020 1 27 可编辑 第三步 选择 数据从文本文档的第几行开始 导入 多少行表示一个个案 数据是全部导入还是部分导入 第四步 数据项间分隔符 的选择 字符型数据分隔符 的选择 31 2020 1 27 可编辑 第五步 对数据预览中的变量进行规范 通常忽略进入下一步 第六步 点击 完成 即可 32 2020 1 27 可编辑 数据预处理的意义 1 对数据进行补充 修正 删除等工作 以保证数据的准确 完整 2 对数据进行排序 加权 选择 合并等工作以满足分析要求 3 对数据进行转换或再计算 产生含有更丰富信息的新数据 以保证分析条件及目的的实现 3 SPSS数据的预处理 主要内容 1 数据的编辑 插入变量 个案 查找 替换等等 2 数据的处理 合并 拆分 选择 加权等等 33 2020 1 27 可编辑 插入变量 insertvariable 插入个案 insertcase 查找替换 fide replace 转至个案 gotocase 转向变量 gotovariable 变量的删除 复制和移动 cut copy等 3 1SPSS数据的编辑 Edit 34 2020 1 27 可编辑 数据操作管理主要完成有关数据的排序 转置 合并 拆分 加权 选择 分类汇总等 3 2SPSS数据操作管理 data 35 2020 1 27 可编辑 3 2 1数据的排序 数据 排序个案 排序的作用 1 数据排序便于数据的浏览 有助于了解数据的取值状况 缺失值数量的多少 2 通过排序能够快捷找到数据的最大值和最小值 初步把握和比较数据的离散度 3 通过数据排序能够快捷地发现数据异常值和输入错误等 4 排序为进一步统计分析提供基础 单值排序 排序变量只有一个 多重排序 排序变量有多个 可依次指定各变量的排序规则 36 2020 1 27 37 2020 1 27 可编辑 SPSS的数据转置 就是实现数据文件的行列互换 即变量转化为个案 而个案转化为变量 操作步骤 1 选择菜单 数据 data 转置 transpose 2 指定数据转置后应保留哪些变量 将其选入 变量 name 框中 3 指定转置后数据文件中各变量如何取名 应取一个取值唯一的变量作为标记变量放到 名称变量 namevariable 3 2 2数据的转置 数据 转置 案例 数据加工 职工数据 sav 38 2020 1 27 可编辑 39 2020 1 27 可编辑 纵向合并数据文件 即是增加个案 就是将数据编辑窗口中的数据与另一个SPSS数据文件的数据进行首尾对接 操作步骤 数据 data 合并文件 mergefiles 添加个案 addcases 注意事项 1 为方便数据文件的纵向合并 一般情况下 两个文件应具有相同的变量 2 若变量不同可以人为强迫不同变量配对 但要求有相同的数据类型 3 可强行加入 不过会出现很多缺失值 3 2 3数据合并 mergefiles 主要有 纵向合并 横向合并 40 2020 1 27 可编辑 合并后新数据文件中的变量 是两个数据文件的同名有相同含义的变量 不放入合并后的新数据文件中的变量 是两个数据文件不同名不同含义的变量 表示当前文件中变量 为指定文件中变量 如果名称不同但含义相同需进入合并文件中 咋办 一是可以选择其中的两个变量名并点击 对 pair 指定配对后进入 二是可以对某变量单击 重命名 rename 后再指定配对 三是单击 不经匹配强行进入 41 2020 1 27 可编辑 在数据加工 职工数据 sav 的基础上纵向合并数据加工 纵向合并职工数据 sav 案例说明 42 2020 1 27 可编辑 横向合并数据文件 即 增加变量 就是价格数据编辑窗口中的数据与另一SPSS数据文件的数据左右对接 操作步骤 数据 data 合并文件 mergefiles 添加变量 addvariables 注意事项 1 两个数据文件必须至少有一个名称相同的变量 该变量是两个数据文件拼接的依据 称为关键变量 2 两个数据文件都必须实现按关键变量进行升序排序 若未排序则需选 关键变量 以其id号为依据进行合并 3 为方便数据文件的横向合并 不同数据文件中数据含义不相同的数据项 变量名不应相同 43 2020 1 27 可编辑 由两个数据文件的个案共同组成合并后的数据文件 在第二个数据文件基础上合并 合并后文件中的个案仅是第二数据文件中的个案 在当前数据文件基础上将第二文件的变量合并过来 即合并后文件中的个案仅是当前数据文件的个案 44 2020 1 27 可编辑 案例说明 在数据加工 职工数据 sav 的基础上纵向合并数据加工 横向合并职工数据 sav 45 2020 1 27 可编辑 数据拆分 与数据排序很相似 不同的是 数据拆分不仅是按指定变量进行简单排序 更重要的是根据变量对数据进行分组 即按指定变量把文件劈成几部分 为以后进行的分组统计分析提供便利 操作步骤 1 选择菜单 数据 data 拆分文件 splitfiles 2 选择拆分依据变量进入 分组方式 Groupbasedon 3 拆分后会出现 一是将分组结果输出在同一张表格中 以便于不同组之间的比较 二是将分组统计结果分别输出在不同的表格中 3 2 4数据拆分 splitfile 对数据进行多重拆分类似于数据的多重排序 拆分的次序决定于选择拆分变量的前后次序 46 2020 1 27 可编辑 47 2020 1 27 可编辑 数据选取 是根据分析需要 从已搜集的大批量数据中按照一定的规则抽取部分数据参与分析的过程 也成为样本抽样 作用 提高数据分析的效率 只是要确保抽取的样本应具有总体代表性 检验模型的需要 为了验证模型 一般依据一定的抽样方法只选取部分样本参与数据建模 剩余数据用于模型检验 操作步骤 1 选择菜单 数据 data 选择个案 selectfiles 2 根据需要选择数据选取方式 3 2 5数据选取 selectfile 注意 selectcases过程也是一个预处理过程 一旦选择了某些数据 再调用其他程序分析时 只分析选中数据 48 2020 1 27 可编辑 指定过滤变量 依据取值进行样本选取 变量值为非0或非系统缺失值的个案将把选中 指定范围内的所有个案 通常适用于时间序列数据 49 2020 1 27 可编辑 50 2020 1 27 可编辑 数据加权的过程本质是数据复制 使用指定变量对其他变量进行加权 该过程适用于计算加权描述统计 列联分析 卡方检验等 操作步骤 1 选择菜单 数据 data 加权个案 weightfiles 2 选择 加权个案 选项 并将某变量作为加权变量选入 频率变量 中 3 2 6数据的加权 weightcase 注意 一旦指定了加权变量 那以后的分析处理中加权是一直有效的 直到取消加权为止 51 2020 1 27 可编辑 52 2020 1 27 可编辑 什么时候进行加权 1 变量中某个选项的比例过高 2 数据中存在表明相同的变量值出现的频数的变量时 需对频数加权例 希望掌握某菜市场某天蔬菜销售的平均价格 应考虑销售量对平均价格的影响 需以蔬菜的销售量为权数计算各种蔬菜销售单价的加权平均数 能较准确地反应平均价格水平 例 两化疗组的缓解率比较 判断化疗对于缓解症状是否有效 53 2020 1 27 可编辑 54 2020 1 27 可编辑 分类汇总 根据指定变量进行分类 在分类后计算各组各变量的描述统计量 操作步骤 1 选择菜单 数据 data 分类汇总 aggregate 2 选择 分组变量 以及 汇总变量 3 单击 函数 按钮 指定对汇总变量计算哪些统计量 SPSS默认计算均值 4 指定将分类汇总结果保存到何处 3 2 7数据的分类汇总 注意 分类汇总变量可以是多个 即多重分类汇总 类似于数据的排序 分类变量的先后次序决定了分类汇总的先后次序 55 2020 1 27 可编辑 案例1 饮料销售 sav案例2 居民储蓄调查数据 sav 56 2020 1 27 可编辑 案例分析 居民储蓄调查数据 目标一 按照户口类型对存取款金额进行分类汇总 了解城镇储户和农村储户的存取款状况 由上表可看出 城镇储户的一次平均存取款金额高于农村储户 农村储户的一次存取款金额的平均差异程度高于城镇储户 57 2020 1 27 可编辑 数据的基本处理 转换主要包括 对数据进行四则运算 产生新变量 对数据进行重新编码 建立新的分类变量 给数据赋予等级 由等距以上数据转化为等级数据 其它一些功能 如缺失值替换 生成随机数据表 计数等 3 3数据的基本处理 转换 transform 58 2020 1 27 可编辑 3 3 1变量计算 computevariable SPSS变量计算 是在原有数据的基础之上 根据用户给出的SPSS算术表达式以及函数 对所有个案或满足条件的部分个案 计算产生一系列的新变量 作用 计算产生一些含有更丰富信息的新数据 利用变量计算对原有数据的分布进行转换以满足建模需要 操作步骤 1 选择菜单 转换 transform 计算 compute 2 选择 目标变量 以及 算术表达式或函数 3 如果仅是对符合一定条件的个案进行变量计算 则单击 如果 按钮进行设定 59 2020 1 27 可编辑 表达式形成规则 1 字符串必须用单引号或双引号引住 若字符串中有了单引号 则必须用双引号引住 2 若调用函数 则自变量必须放在函数后的括号中 3 每个关系表达式必须单独定义 表达式间若用符号隔开 必须用英文字符 60 2020 1 27 可编辑 61 2020 1 27 可编辑 3 3 2个案计数 count SPSS的计数是对所有个案或满足某条件的部分个案 计算若干变量中有几个变量的值落在指定的区间内 并将计数结果存入一个新变量的过程 操作步骤 1 选择菜单 转换 transform 对个案内数值计数 compute 2 将参与计数的变量选到 数字变量 框中 3 在 目标变量 框中输入存放计数结果的变量 并在 目标标签 输入相应的变量名标签 4 单击 定义值 按钮定义计数区间 通过按钮 添加 修改 删除 完成计数区间的相应操作 5 如果仅是对符合一定条件的个案进行计数 则单击 如果 按钮进行设定 62 2020 1 27 可编辑 案例 居民储蓄调查数据 sav 63 2020 1 27 可编辑 案例分析 居民储蓄调查数据 目标一 利用SPSS对今年 收入情况 和 未来收入情况均 为增加的个案进行计数 目标二 计算今年 收入情况 和 未来收入情况均 为增加的个案数占总个案数的百分比 64 2020 1 27 可编辑 计数结果会保存入

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论