spss之统计挖掘第2章数据管理1

上传人：洞*** IP属地：北京上传时间：2021-07-16 格式：PPTX 页数：64 大小：2.16MB 积分：14 举报 版权申诉

已阅读5页，还剩59页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、IBM-SPSS 第第2章章数据管理数据管理在我们的科学研究过程中，都离不开对数据的分析，一切统计分析都是以数据为基础的，对数据进行良好的管理，从而在数据分析过程，达到事半功倍的效果。 IBM-SPSS 2.1 数据的打开数据的打开数据类型数据类型采用SPSS软件将原始资料录入，建立而成的数据文件。采用其他软件录入，保存为其他数据格式的资料，如.xls、txt、sys等 SPSS数据文件类型数据文件类型数据文件数据文件文件扩展名文件扩展名对应窗口对应窗口数据文件.sav数据编辑窗口语法文件.sps语法编辑窗口输出文件.spv结果管理窗口脚本文件.sbs脚本窗口模

2、块解读模块解读 1运行运行SPSS 2. 打开数据 SPSS可以直接打开的数据类型可以直接打开的数据类型实例讲解实例讲解例2.1：打开.sav文件实例讲解实例讲解例2.2：打开.xlsx文件实例讲解实例讲解例2.3：打开.txt文件 IBM-SPSS 2.2 数据的保存数据的保存数据保存类型模块解读模块解读数据保存实例讲解实例讲解例2.4：将打开的.sav数据存为.txt格式。 IBM-SPSS 2.3 数据的整理数据的整理数据合并数据合并当数据量很大时，经常需要将一份大的数据分成几个小部分，将这些若干个小的数据文件合并成一个大的数据文件，是进行各种统计分析的

3、前提。合并类型合并类型纵向合并：是几个数据集中的数据纵向相加，组成一个新的数据集，新数据集中的记录数是原来几个数据集中记录数的总和，实质就是将两个数据文件的变量列，按照各个变量名的含义，一一对应进行首尾连接合并，两个数据文件的变量相同，合并的目的是增加分析个案。合并条件：两个待合并的SPSS数据文件，其内容合并是有实际意义的；为方便SPSS数据文件的合并，在不同数据文件中，数据含义相同的列，最好起相同的名字，变量类型和变量长度也要尽量相同合并类型合并类型横向合并：按照记录的次序，或者某个关键变量的数值，将不同数据集中的不同变量合并为一个数据集，新数据集中的变量数是

4、所有原数据集中不重名变量的总和，实质就是将两个数据文件的记录，按照记录对应，一一进行左右对接，合并的两个数据文件的变量不同，但具有相同个案例数。合并条件：如果不是按照记录号对应的规则进行合并，则两个数据文件必须至少有一个变量名相同的公共变量，这个变量是两个数据文件横向对应合并的依据，称为关键变量。如学号、贵宾卡号等，关键变量可以是多个；如果是使用关键变量进行合并的对应，则两个数据文件都必须事先按关键变量进行升序排列；为方便SPSS数据文件的合并，在不同数据文件中，数据含义不相同的列，变量名不应取相同的名称。模板解读模板解读添加合并个案文件模板解读模板解读纵向合并变量

5、选择模板解读模板解读横向合并变量选择实例解析实例解析例2.5 将“2-4 未标题4 数据保存”与“2-5 未标题”数据进行合并。实例解析实例解析例2.6 将“2-4 未标题4 数据保存”与“2-6 Untitled 2” 数据进行合并。数据个案的拆分数据个案的拆分在进行统计分析时，只需要对具有某种特性的数据进行分析，那么就涉及到分组分析，则可以通过拆分数据集来加以实现，它能使数据分析过程按照分组变量进行分组分析，得到各个组的结果。模块解读模块解读分割文件模块解读模块解读拆分后的数据编辑窗口实例讲解实例讲解例2.7：将职员的按性别、年龄进行拆分，见 “2-7

6、拆分数据.sav”数据。数据个案的排序数据个案的排序数据编辑窗口中个案的前后次序是随机的，其先后顺序由录入时决定。在做数据统计分析时中，有时希望按某种顺序来观察一批数据，以便于更好的了解数据信息。 1）定义个案排序：就是将数据编辑窗口中的数据，按照指定的某一个或多个变量值的升序或降序重新排列，所指定的变量称为排序变量。排序分类：排序分类：单值排序：排序变量只有一个；多重排序：排序变量有多个，多重排序的第一个排序变量称为主排序变量，其他排序变量依次称为第二排序变量、第三排序变量等。模板解读模板解读排序个案模板解读模板解读排序后数据实例解析实例解析例2.8

7、将职员的工资按职工号和职称，见“2-8 排序数据.sav”。要求:职工号按升序、职称要降序。数据的分类汇总数据的分类汇总分类汇总：按指定的分类变量对观测值进行分组，对每组记录的各变量求指定的描述统计量，结果将保存为SPSS数据文件，可以存入新数据文件，也可以替换当前数据文件。模块解读模块解读汇总数据模块解读模块解读汇总函数模块解读模块解读分类汇总结果输出窗口实例讲解实例讲解例2.9：以性别作为分组变量，对职员的工资和年龄的均值进行汇总。见数据“2-9汇总数据 .sav”15-4.sav。数据的加权数据的加权定性分类数据，在系统默认情况下，每一行就是一个记录

8、。但对于定量区间数据，一般采用频数格式录入数据，即相同取值的观测值只录入一次，另加一个频数变量用于记录该数值共出现了多少次。为了在统计分析时让计算机知道每一个分类或者每一个区间组段的频数，需要定义权重变量。权重变量权重变量通常表示每个分类或者每一个区间组段的频数，它是数值变量，且必须取正值才有意义。模板解读模板解读加权个案加权标识实例解析实例解析例2.10 将人数进行加权，例见“2-10加权数据 .sav” 重复数据的查找重复数据的查找 SPSS系统具有查找重复数据的功能，可以迅速的定位重复观察个体。该功能适用于数据双录入后的数据检查。模板解读模板解读标识重复个案

9、模板解读模板解读重复数据编辑窗口结果模板解读模板解读重复数据输出结果统计表实例讲解实例讲解例2.11：查找2-11重复数据.sav中的重复数据。个案的选择：个案的选择：在数据分析过程中，根据不同的要求，需要从SPSS中的所有个案中筛选出特定的个案进行分析。这可以通过给数据表设置选择条件或者过滤条件，来满足这一要求。选择类型选择类型按条件选择按条件选择：给出一个SPSS条件表达式，选取符合该表达式的个案。按数据范围选择按数据范围选择：选择一定的数据范围内的全部个案，要求给出数据范围的上、下界的个案编号。随机选择随机选择：对数据编辑窗口中的所有个案进行随机筛选

10、过滤变量选择过滤变量选择：选择指定的一个已存在的变量作为个案选取的标准模块解读模块解读选择个案模块解读模块解读按条件选择模块解读模块解读随机选择实例讲解实例讲解例2.12：选择工资大于1800元人员进行分析；见例2-12.sav。计算新变量计算新变量使用SPSS算术表达式及函数，对所有记录或满足SPSS条件表达式的记录，计算出一个新结果，并将结果存入一个指定的变量中。通过使用SPSS算术表达式、SPSS函数、 SPSS条件表达式进行实现。模块解读模块解读计算变量对话框模块解读模块解读计算变量“如果”按钮实例讲解实例讲解例2.13：计算某班男生，每位同学

11、的平均成绩，见2-13计算新变量.sav。变量值的重新编码变量值的重新编码数据分析中，将连续变量转换为等级变量，或者将分类变量不同的变量等级进行合并是常见的工作。比如知道班级每位同学的平均成绩，但是需要将这些同学的成绩分为优秀、良好、中等、差4个等级，那么如何通过SPSS功能来完成这一任务呢？重新编码过程可以很好地完成这一类任务。重新编码： u重新编码为相同相同变量：对原始变量的取值进行修改，用新编码直接取代原变量的取值； u重新编码为不同不同变量：将新编码存入新的变量，根据原始变量的取值生成一个新变量来表示分组情况。模块解读模块解读重现编码到相同的变量模块解读模块解读重现编码到不同的变量模块解读模块解读旧值和

人人文库> 全部分类> 应用文书

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

spss之统计挖掘第2章数据管理1

文档简介

温馨提示

最新文档

评论

spss之统计挖掘第2章数据管理1

文档简介

温馨提示

最新文档

评论

相关文档