spss之统计挖掘第2章数据管理1_第1页
spss之统计挖掘第2章数据管理1_第2页
spss之统计挖掘第2章数据管理1_第3页
spss之统计挖掘第2章数据管理1_第4页
spss之统计挖掘第2章数据管理1_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、IBM-SPSS 第第2章章 数据管理数据管理 在我们的科学研究过程中,都离不开对数据 的分析,一切统计分析都是以数据为基础的, 对数据进行良好的管理,从而在数据分析过程 ,达到事半功倍的效果。 IBM-SPSS 2.1 数据的打开数据的打开 数据类型数据类型 采用SPSS软件将原始资料录入,建立 而成的数据文件。 采用其他软件录入,保存为其他数据格 式的资料,如.xls、txt、sys等 SPSS数据文件类型数据文件类型 数据文件数据文件文件扩展名文件扩展名对应窗口对应窗口 数据文件.sav数据编辑窗口 语法文件.sps语法编辑窗口 输出文件.spv结果管理窗口 脚本文件.sbs脚本窗口 模

2、块解读模块解读 1运行运行SPSS 2. 打开数据 SPSS可以直接打开的数据类型可以直接打开的数据类型 实例讲解实例讲解 例2.1:打开.sav文件 实例讲解实例讲解 例2.2:打开.xlsx文件 实例讲解实例讲解 例2.3:打开.txt文件 IBM-SPSS 2.2 数据的保存数据的保存 数据保存类型 模块解读模块解读 数据保存 实例讲解实例讲解 例2.4:将打开的.sav数据存为.txt格式。 IBM-SPSS 2.3 数据的整理数据的整理 数据合并数据合并 当数据量很大时,经常需要将 一份大的数据分成几个小部分,将 这些若干个小的数据文件合并成一 个大的数据文件,是进行各种统计 分析的

3、前提。 合并类型合并类型 纵向合并:是几个数据集中的数据纵向相加,组成一个 新的数据集,新数据集中的记录数是原来几个数据集中记 录数的总和,实质就是将两个数据文件的变量列,按照各 个变量名的含义,一一对应进行首尾连接合并,两个数据 文件的变量相同,合并的目的是增加分析个案。 合并条件: 两个待合并的SPSS数据文件,其内容合 并是有实际意义的; 为方便SPSS数据文件的合并,在 不同数据文件中,数据含义相同的列,最好起相同的名字 ,变量类型和变量长度也要尽量相同 合并类型合并类型 横向合并:按照记录的次序,或者某个关键变量的数值,将不同数据 集中的不同变量合并为一个数据集,新数据集中的变量数是

4、所有原数据集 中不重名变量的总和,实质就是将两个数据文件的记录,按照记录对应, 一一进行左右对接,合并的两个数据文件的变量不同,但具有相同个案例 数。 合并条件: 如果不是按照记录号对应的规则进行合并,则两个数据文 件必须至少有一个变量名相同的公共变量,这个变量是两个数据文件横向 对应合并的依据,称为关键变量。如学号、贵宾卡号等,关键变量可以是 多个;如果是使用关键变量进行合并的对应,则两个数据文件都必须事 先按关键变量进行升序排列;为方便SPSS数据文件的合并,在不同数据 文件中,数据含义不相同的列,变量名不应取相同的名称。 模板解读模板解读 添加合并个案文件 模板解读模板解读 纵向合并变量

5、选择 模板解读模板解读 横向合并变量选择 实例解析实例解析 例2.5 将“2-4 未标题4 数据保存”与“2-5 未标 题”数据进行合并。 实例解析实例解析 例2.6 将“2-4 未标题4 数据保存”与“2-6 Untitled 2” 数据进行合并。 数据个案的拆分数据个案的拆分 在进行统计分析时,只需要对具有某种特性的 数据进行分析,那么就涉及到分组分析,则可以通 过拆分数据集来加以实现,它能使数据分析过程按 照分组变量进行分组分析,得到各个组的结果。 模块解读模块解读 分割文件 模块解读模块解读 拆分后的数据编辑窗口 实例讲解实例讲解 例2.7:将职员的按性别、年龄进行拆分, 见 “2-7

6、 拆分数据.sav”数据。 数据个案的排序数据个案的排序 数据编辑窗口中个案的前后次序是随机的,其 先后顺序由录入时决定。在做数据统计分析时中, 有时希望按某种顺序来观察一批数据,以便于更好 的了解数据信息。 1)定义 个案排序:就是将数据编辑窗口中的数据, 按照指定的某一个或多个变量值的升序或降 序重新排列,所指定的变量称为排序变量。 排序分类:排序分类: 单值排序:排序变量只有一个; 多重排序:排序变量有多个,多重排序的第一个排 序变量称为主排序变量,其他排序变量依次称为第二 排序变量、第三排序变量等。 模板解读模板解读 排序个案 模板解读模板解读 排序后数据 实例解析实例解析 例2.8

7、将职员的工资按职工号和职称,见“2-8 排 序数据.sav”。 要求:职工号按升序、职称要降序。 数据的分类汇总数据的分类汇总 分类汇总:按指定的分类变量对观测值进行分 组,对每组记录的各变量求指定的描述统计量,结 果将保存为SPSS数据文件,可以存入新数据文件 ,也可以替换当前数据文件。 模块解读模块解读 汇总数据 模块解读模块解读 汇总函数 模块解读模块解读 分类汇总结果输出窗口 实例讲解实例讲解 例2.9:以性别作为分组变量,对职员的工资和 年龄的均值进行汇总。见数据“2-9汇总数据 .sav”15-4.sav。 数据的加权数据的加权 定性分类数据,在系统默认情况下,每一行就 是一个记录

8、。但对于定量区间数据,一般采用频数 格式录入数据,即相同取值的观测值只录入一次, 另加一个频数变量用于记录该数值共出现了多少次。 为了在统计分析时让计算机知道每一个分类或者每 一个区间组段的频数,需要定义权重变量。 权重变量权重变量通常表示每个分类或者每一个区间组段的 频数,它是数值变量,且必须取正值才有意义。 模板解读模板解读 加权个案 加权标识 实例解析实例解析 例2.10 将人数进行加权,例见“2-10加权数据 .sav” 重复数据的查找重复数据的查找 SPSS系统具有查找重复数据的功能,可 以迅速的定位重复观察个体。该功能适用于 数据双录入后的数据检查。 模板解读模板解读 标识重复个案

9、 模板解读模板解读 重复数据编辑窗口结果 模板解读模板解读 重复数据输出结果统计表 实例讲解实例讲解 例2.11:查找2-11重复数据.sav中的重复数据。 个案的选择:个案的选择: 在数据分析过程中,根据不同的要求,需要 从SPSS中的所有个案中筛选出特定的个案进行分 析。这可以通过给数据表设置选择条件或者过滤条 件,来满足这一要求。 选择类型选择类型 按条件选择按条件选择:给出一个SPSS条件表达式,选取符 合该表达式的个案。 按数据范围选择按数据范围选择:选择一定的数据范围内的全部个 案,要求给出数据范围的上、下界的个案编号。 随机选择随机选择:对数据编辑窗口中的所有个案进行随机 筛选

10、过滤变量选择过滤变量选择:选择指定的一个已存在的变量作为 个案选取的标准 模块解读模块解读 选择个案 模块解读模块解读 按条件选择 模块解读模块解读 随机选择 实例讲解实例讲解 例2.12:选择工资大于1800元人员进行分析; 见例2-12.sav。 计算新变量计算新变量 使用SPSS算术表达式及函数,对所有记录或满 足SPSS条件表达式的记录,计算出一个新结果 ,并将结果存入一个指定的变量中。 通过使用SPSS算术表达式、SPSS函数、 SPSS条件表达式进行实现。 模块解读模块解读 计算变量对话框 模块解读模块解读 计算变量“如果”按钮 实例讲解实例讲解 例2.13:计算某班男生,每位同学

11、的平均成绩, 见2-13计算新变量.sav。 变量值的重新编码变量值的重新编码 数据分析中,将连续变量转换为等级变量,或 者将分类变量不同的变量等级进行合并是常见的工 作。比如知道班级每位同学的平均成绩,但是需要 将这些同学的成绩分为优秀、良好、中等、差4个等 级,那么如何通过SPSS功能来完成这一任务呢? 重新编码过程可以很好地完成这一类任务。 重新编码: u重新编码为相同相同变量:对原始变量的取值进行 修改,用新编码直接取代原变量的取值; u重新编码为不同不同变量:将新编码存入新的变量 ,根据原始变量的取值生成一个新变量来表示 分组情况。 模块解读模块解读 重现编码到相同的变量 模块解读模块解读 重现编码到不同的变量 模块解读模块解读 旧值和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论