




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章 数据文件的处理,数据文件的处理是指把科研、教学工作过程中的各种信息、数据(Data)以某种方式存入到计算机的磁盘中,并进行随时存取、修改、统计分析的全过程。一般来说,它包括数据编码、建立数据文件的框架结构、数据录入、选定数据文件名及保存数据等几个步骤。,第二章 数据文件的处理,数据编码 定义变量 数据录入 数据编辑,数据编码: 根据一定的规则将研究资料转换为可进行统计分析的数码资料的过程。,问题025:您认为打工的外地人对北京市的社会秩序是否有影响?(单选) 1有很大影响 2有较大影响 3没有影响 4不好说,4,编码,答案,编码的步骤: 1)确定变量;,变量: 用来反映文意概念的量化形
2、式。在统计中往往指最小的分析单位。编码就是对变量进行编码。变量由两个部分构成:变量名和变量值。要注意区分何为变量,何为变量值。在调查问卷中还要注意区分问题和变量。,问题009:您有几个儿子?几个女儿? 1儿子_人 2女儿_人,2,3,问题,变量1,变量2,变量1的值,变量2的值,2)制作编码表,变量名: 一个数据文件中, 一个变量只能有一个唯一名称。,码位:某一变量在 数据文件中占据的栏位,码数: 某一变量由几位数组成。,该变量是数值型(Numeric)如定距、定比, 还是字串型(String),如定类、定序。 前者在统计中可以做高级运算,后者则不可以。,不适于被访人回答的问题的编码。 一般采
3、用7,97,997等。,被访人回答不知道时的编码。 一般采用8,98,998等。,被访人拒绝回答某变量时的编码。 一般采用9,99,999等。,问卷中出现漏答时的处理编码。 一般采用9,99,999等。,2,3,100011,3)编码: 根据编码表对问卷进行编码,而后将编码结果记录在问卷上或编码纸上。,定义变量: 即定义变量名、变量类型、变量长度、变量名标签、变量值标签和缺失值等。,定义变量名(Name)的要求: 变量名不能超过8个字符; 变量名不能以数字开头; 变量名中不能包含,/、?、等运算和逻辑符号。 变量名必须唯一,系统中不区分变量名中的大小写字符。,定义变量类型(Type),变量名标
4、签定义命令:Variable labels 该命令是给变量名一个说明标注。,命令格式: Variable labels 变量1名 标签 /变量2名 标签 /变量3名 标签 /变量n名 标签 .,示例: Variable Labels num 编号 /W01 性别 /W01a 出生年 /W02 婚姻状况 /W03 文化程度 .,或: Variable Labels num 编号 /W01 性别 /W01a 出生年 /W02 婚姻状况 /W03 文化程度 .,或: Variable Labels num 编号 W01 性别 W01a 出生年 W02 婚姻状况 W03 文化程度 .,要求: 变量名要
5、和已定义过的名称相一致; 标签用中、西文均可,但长度不要超过120个字符,即60个汉字。,变量值标签定义命令:Value labels 该命令是给变量的每一取值加一个说明标注。,格式: Value Labels 变量名 值1 标签 值2 标签 值3 标签 /变量名 值1 标签 值2 标签 值3 标签 .,数据录入,采用DOS、WPS、CCED等软件,按ASCII码方式录入成文本文件(*.dat;*.txt)。这种录入方式的特点是,数据之间没有间隔,录完一个数码后自动后移,录入速度较快。缺点是容易错位。,采用SPSS数据编辑器(SPSS Data Editor)录入。其优点是不容易错位,缺点是不
6、能自动后移,录入速度慢,数据错误不容易修改。,数据编辑命令,数据搜索 按指定观察量序号搜索:Data Go to Case 搜索指定数据:Edit Find 数据排序:Data Sort Cases(对观察量进行排序) 数据行列互换: Data Transpose,数据编辑命令,数据子集的选择:Data Select Cases All cases:选择所有的观察量,该选项可以用于解除先前的选择。 If condition is satisfied:按指定条件选择。 Random sample of cases:对观察单位进行随机抽样。 Based on time or case range:
7、顺序抽样。 Use filter variable:用指定的变量做过滤器。,数据编辑命令,数据的分类汇总: Data Aggregate 数据次数的确定: Transform Rank Cases 数据重新编码: Transform Recode,数据编辑命令,产生计数变量:Transform Count 产生分组变量: Transform Categorize Variables 数据文件的拆分:Data Split File 数据文件的合并: Add Cases(纵向合并) Data Merge File Add Variables (横向合并),练习,表1是10个学生的资料,要求: (1)定义变量,录入数据并将文件存储位SPSS类型的文件; (2)搜索高考分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 古筝课件教学计划
- 2020-2025年期货从业资格之期货法律法规全真模拟考试试卷B卷含答案
- 【深圳】2025年4月广东深圳光明区政务服务和数据管理局招聘一般类岗位专干5人笔试历年典型考题及考点剖析附带答案详解
- 电位滴定法仪器分析测试技术系列32课件
- Brand KPIs for milk:a2 in the United States-英文培训课件2025
- 2025年临床医学概论试题及答案
- 工业互联网平台微服务架构性能测试报告:2025年边缘计算安全性与稳定性分析
- 2025年主题公园沉浸式体验项目在旅游目的地旅游服务体系建设中的应用报告
- 零售电商行业智能仓储物流系统在效率提升中的应用报告
- 云阳生猪屠宰管理办法
- 2025年广东省深圳市中考历史试卷(含解析)
- 百万销售日常管理办法
- 天津市南开区2024-2025学年七年级下学期期末考试数学试卷及答案
- 安全培训-重大事故隐患判定标准-专家版
- 2025年数据科学与大数据技术试题及答案
- 土木工程结构力学课件
- 【课件】《科学记数法》说课课件2024-2025学年人教版数学七年级上册
- 消防检测和消防评估服务方案
- 旧钢板桩买卖合同范本
- 安卓课程设计开发指南
- 健康服务合作协议书
评论
0/150
提交评论