第二章+数据文件的处理.ppt_第1页
第二章+数据文件的处理.ppt_第2页
第二章+数据文件的处理.ppt_第3页
第二章+数据文件的处理.ppt_第4页
第二章+数据文件的处理.ppt_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章 数据文件的处理,数据文件的处理是指把科研、教学工作过程中的各种信息、数据(Data)以某种方式存入到计算机的磁盘中,并进行随时存取、修改、统计分析的全过程。一般来说,它包括数据编码、建立数据文件的框架结构、数据录入、选定数据文件名及保存数据等几个步骤。,第二章 数据文件的处理,数据编码 定义变量 数据录入 数据编辑,数据编码: 根据一定的规则将研究资料转换为可进行统计分析的数码资料的过程。,问题025:您认为打工的外地人对北京市的社会秩序是否有影响?(单选) 1有很大影响 2有较大影响 3没有影响 4不好说,4,编码,答案,编码的步骤: 1)确定变量;,变量: 用来反映文意概念的量化形

2、式。在统计中往往指最小的分析单位。编码就是对变量进行编码。变量由两个部分构成:变量名和变量值。要注意区分何为变量,何为变量值。在调查问卷中还要注意区分问题和变量。,问题009:您有几个儿子?几个女儿? 1儿子_人 2女儿_人,2,3,问题,变量1,变量2,变量1的值,变量2的值,2)制作编码表,变量名: 一个数据文件中, 一个变量只能有一个唯一名称。,码位:某一变量在 数据文件中占据的栏位,码数: 某一变量由几位数组成。,该变量是数值型(Numeric)如定距、定比, 还是字串型(String),如定类、定序。 前者在统计中可以做高级运算,后者则不可以。,不适于被访人回答的问题的编码。 一般采

3、用7,97,997等。,被访人回答不知道时的编码。 一般采用8,98,998等。,被访人拒绝回答某变量时的编码。 一般采用9,99,999等。,问卷中出现漏答时的处理编码。 一般采用9,99,999等。,2,3,100011,3)编码: 根据编码表对问卷进行编码,而后将编码结果记录在问卷上或编码纸上。,定义变量: 即定义变量名、变量类型、变量长度、变量名标签、变量值标签和缺失值等。,定义变量名(Name)的要求: 变量名不能超过8个字符; 变量名不能以数字开头; 变量名中不能包含,/、?、等运算和逻辑符号。 变量名必须唯一,系统中不区分变量名中的大小写字符。,定义变量类型(Type),变量名标

4、签定义命令:Variable labels 该命令是给变量名一个说明标注。,命令格式: Variable labels 变量1名 标签 /变量2名 标签 /变量3名 标签 /变量n名 标签 .,示例: Variable Labels num 编号 /W01 性别 /W01a 出生年 /W02 婚姻状况 /W03 文化程度 .,或: Variable Labels num 编号 /W01 性别 /W01a 出生年 /W02 婚姻状况 /W03 文化程度 .,或: Variable Labels num 编号 W01 性别 W01a 出生年 W02 婚姻状况 W03 文化程度 .,要求: 变量名要

5、和已定义过的名称相一致; 标签用中、西文均可,但长度不要超过120个字符,即60个汉字。,变量值标签定义命令:Value labels 该命令是给变量的每一取值加一个说明标注。,格式: Value Labels 变量名 值1 标签 值2 标签 值3 标签 /变量名 值1 标签 值2 标签 值3 标签 .,数据录入,采用DOS、WPS、CCED等软件,按ASCII码方式录入成文本文件(*.dat;*.txt)。这种录入方式的特点是,数据之间没有间隔,录完一个数码后自动后移,录入速度较快。缺点是容易错位。,采用SPSS数据编辑器(SPSS Data Editor)录入。其优点是不容易错位,缺点是不

6、能自动后移,录入速度慢,数据错误不容易修改。,数据编辑命令,数据搜索 按指定观察量序号搜索:Data Go to Case 搜索指定数据:Edit Find 数据排序:Data Sort Cases(对观察量进行排序) 数据行列互换: Data Transpose,数据编辑命令,数据子集的选择:Data Select Cases All cases:选择所有的观察量,该选项可以用于解除先前的选择。 If condition is satisfied:按指定条件选择。 Random sample of cases:对观察单位进行随机抽样。 Based on time or case range:

7、顺序抽样。 Use filter variable:用指定的变量做过滤器。,数据编辑命令,数据的分类汇总: Data Aggregate 数据次数的确定: Transform Rank Cases 数据重新编码: Transform Recode,数据编辑命令,产生计数变量:Transform Count 产生分组变量: Transform Categorize Variables 数据文件的拆分:Data Split File 数据文件的合并: Add Cases(纵向合并) Data Merge File Add Variables (横向合并),练习,表1是10个学生的资料,要求: (1)定义变量,录入数据并将文件存储位SPSS类型的文件; (2)搜索高考分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论