




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
资料处理目录任务一原始资料的审核复查与问卷编码A任务二数据录入B任务三数据清理C任务四数据转化D任务一原始资料的审核复查与问卷编码
本任务主要学习原始资料的审核、复查、问卷编码方法。通过学习,掌握编码手册的制作方法,学会对问卷进行编码。一、原始资料的审核与复查方法实地审核及时,效果较好;但要求调查员个人处理各种情况的能力要比较强。系统审核调查工作便于统一安排和管理;审核的标准比较一致;但周期较长。原始资料的审核,就是指研究者对调查所收集回的原始问卷资料进行初步的审查与核实,校正错填、误填的答案,并乱填、空白和严重缺答的问卷剔除出来,作为废卷处理。原始资料的复查是指研究者按照一定的方法,从所回收的调查资料中随机抽取一定比例(一般为5%~15%)的个案资料,并由研究者自己或委派另外的调查员对个案资料进行第二次调查。原始资料的审核二、问卷编码方法编码,就是给每个问题及其答案分配数字作为其代码。编码手册,就是把编码规则用一定的方式呈现出来,以方便编码员在进行问卷编码时随时查阅,按照统一的规则进行编码,减少资料转换过程中的人为误差,提高资料转换工作的质量。编码手册的构成:一般由提问项目、变量名、变量名标签、宽度、栏码、答案赋值、未填写及个别特殊值赋值等七项内容构成。编码手册的表头如下:编码分类预编码后编码提问项目变量名【名称】变量名标签【标签】宽度【宽度】【窗口录入时用】栏码【程序录入时用】答案赋值【值】未填写【值】特殊值赋值【值】1.变量取名规则与变量名标签(1)在SPSS12.0之前,SPSS变量名长度不能超过8个字符;从SPSS12.0开始,变量名长度最多可达64个字符。(2)首字符不能是数字,其后可以字母、数字,或除“?”、“-”、“!”和“*”以外的字符。但“.”不能作为变量名的最后一个字符。(3)变量名不能与SPSS的保留字相同。SPSS的保留字有ALL、AND、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH。(4)系统不区分变量名中的大小写字符。例如,变量ABC和变量abc会被系统认为是同一个变量。(5)变量名中不能有空格。变量名标签最多可用120个字符。2.问题宽度和栏码确定规则问题宽度是指某一具体问题的答案代码的位数。问题栏码则是指某个具体问题的答案代码在计算机数据文件中所处的位置。栏码的确定规则是从第一个项目(通常是问卷编号)开始,根据问题顺序及其宽度依次确定其在整个数据排列中所处的位置。举例:QN1-3W014W025-6
001168302321205042410010023456023.答案编码规则根据问卷中问题形式的不同,答案代码的赋值形式也略有不同。(1)填空式问题:直接用回答者所填写的数字作为答案的代码值。(2)单项选择式问题:直接用问卷设计时对每一答案的预编码作为它们的代码值。如果预编码所用代号是A、B、C、D等,而非数字时,应先将A、B、C、D等符号转换为1、2、3、4等数字,再用数字作为相应答案的代码值。(3)多项选择式问题:在对多项选择式问题的答案进行编码时,一般应先将多项选择式问题转化为若干个单项选择式问题。如果是多项任选式问题,那么有多少个选项就转化成多少个问题。答案赋值方法有二:一是仍用原来的选项及编号作为答案的代码值,未选中的用0表示;二是将每个选项转换成二项选择式问题,然后用单项选择式问题的编码规则进行编码。如,用1表示“选中”,用0表示“未选中”。如果是多项限选式问题,那么限选几项就可以转化成几个单项选择式问题,并用原来的答案编号作为答案的代码值。比如,限选项三项的问题,就转换成三个小问题,三个变量名分别如下:
第一个变量:第一选
第二个变量:第二选
第三个变量:第三选
(4)矩阵式或表格式问题
矩阵或表格中包含多少个小问题,就转化为多少个变量。对备选答案进行后编码,用后编码作为答案的代码值。例如,12.你和知心好友一起从事下列活动的情况怎样?(请在每一行合适的格中打√)经常有时很少从未有过1.学习2.娱乐3.聊天4.运动5.旅游例如,12.你和知心好友一起从事下列活动的情况怎样?(请在每一行适当的方框内打√)经常有时很少从未有过①学习
□
□
□
□②娱乐
□
□
□
□③聊天
□
□
□
□④运动
□
□
□
□⑤旅游
□
□
□
□12.1.你和知心好友一起学习的情况怎样?
①经常②有时③很少④从未有过12.2.你和知心好友一起娱乐的情况怎样?
①经常②有时③很少④从未有过12.3.你和知心好友一起聊天的情况怎样?
①经常②有时③很少④从未有过12.4.你和知心好友一起运动的情况怎样?
①经常②有时③很少④从未有过12.5.你和知心好友一起旅游的情况怎样?
①经常②有时③很少④从未有过(5)未填写及特殊值处理习惯上,用0作为未填写问题答案的代码;用9作为特殊值的代码。比如,研究者把“月收入”这一变量的答案数码确定为四位数码,可某份问卷上所填写的收入是15000元,这时可以设定用9999表示月收入超过1万的情况,即把月收入1万元以上的当作特殊值来处理。请注意:具体某个问题要用多少个0或9来表示,要视问题的宽度而定。【实作训练】对给定问卷进行编码。给问卷制作编码手册,请看制作好的编码手册(节选):多项任选式问题的另一种编码方式:不常用
仍用原来的选项及编号作为答案的代码值,未选中的用0表示。变量名变量名标签宽度栏码答案赋值未选中W11_1日常交往的主要对象1201‘亲戚’2‘朋友’3‘邻居’4‘同事’5‘很少交往’6‘其他人’0W11_2日常交往的主要对象1210W11_3日常交往的主要对象1220W11_4日常交往的主要对象1230W11_5日常交往的主要对象1240W11_6日常交往的主要对象1250(二)根据编码手册进行问卷编码三、注意事项问卷编码工作关系资料处理质量的高低和数据的有效性,编码时应认真细致,尽可能降低出错的概率。高质量的编码工作应当满足如下两个要求:第一,最大限度的利用问卷资料;第二,在不损失问卷原有信息的前提下,尽可能对问卷信息进行简化处理,以减少后续工作中的数据录入量。编码时,代码值是研究者自己设定的,不同研究者虽然可以根据自己的偏好做不同的赋值。但在赋值时应当遵循公认的习惯作法。未填写问卷的答案以及特殊答案的赋值应当选用答案赋值中不容易出现的数字。任务二数据录入
本任务主要学习数据录入方法,包括从SPSS数据编辑窗口录入数据的方法和利用SPSS程序录入数据的方法。通过学习,学会从SPSS数据编辑窗口中录入数据,能够编制SPSS程序。【相关知识】一、SPSS入门知识
SPSS是英文StatisticalPackageforSocialScience的简称,意即社会科学统计软件包。SPSS是世界著名的统计分析软件之一,被广泛运用于经济、财政、金融、营销、会计、管理及人文社会科学等领域。SPSS的三个重要窗口:数据编辑窗口、输出窗口和语句窗口。数据编辑窗口输出窗口语句窗口输出窗口即查看器,是用于显示与管理SPSS统计分析结果、报表和图形的窗口。语句窗口即语法编辑器,用于编制SPSS程序。语句窗口界面从上至下依次是标题栏、菜单栏、工具栏、语句编辑区和状态栏。变量视窗:用于编辑变量。数据视窗:用于编辑数据。注意:在数据视窗中输入数据之前应当先在变量视窗中定义变量。启动SPSS的方法主要有3种:
一是使用程序菜单打开SPSS,单击“开始”按钮,找到并单击“所有程序”,找到并单击“SPSSStatistics”,单击“SPSSStatistics”。二是找到并双击桌面上的SPSS快捷图标。三是双击SPSS文件(假定用户已创建过SPSS文件),或者将鼠标置于SPSS文件上,单击鼠标右键,弹出快捷菜单,再用左键单击“打开”命令。退出SPSS,可以使用以下3种方法:一是直接单击SPSS窗口右上角的“关闭”按钮。二是单击SPSS窗口标题栏上的图标,在弹出的快捷菜单中选择“关闭”命令。三是在桌面状态栏上,用鼠标右键单击SPSS文件最小化图标,在弹出的快捷菜单中选择“关闭”命令。二、数据录入方法数据录入的两种主要方式直接录入:直接从问卷上将已编好的数码输入到计算机。
转录录入,即先将问卷上已编好的数码誊抄到专门的登录表上,再从登录表上将数码输入到计算机。从SPSS软件中直接录入数据的方法方法一:直接从SPSS数据编辑窗口中录入数据。此时,需要先在变量视窗中对变量的名称、类型、宽度、小数位、变量标签、变量值标签、缺失值、显示列宽、对齐方式以及测量尺度等项目进行定义,然后再在数据视窗中录入数据。方法二:在SPSS程序中录入数据。SPSS数据录入程序主要由datalist、variablelabel(variablelabels)、valuelabel(valuelabels)、missingvalue(missingvalues)、begindata、enddata等基本命令语句构成。【实作训练】
在SPSS中创建1个名为“昆明市低保制度实施状况调查(居民)问卷”的数据文件,并在此数据文件中直接录入任务一中已经编好码的问卷信息。操作过程:(一)启动SPSS从程序菜单中启动SPSS,如右图所示。(二)在SPSS数据编辑窗口中创建数据文件1.定义变量点击变量视图,依据《昆明市低保制度实施状况调查(居民)问卷编码手册(节选)》,在变量视图对变量逐个进行定义。2.录入数据切换到“数据视图”。在第一行中录入第一份问卷的数字信息(指已编好的代码);在第二行中录入第二份问卷的数字信息;依次类推,直接把所有的问卷信息都输入完毕。(三)利用SPSS程序创建数据文件三、数据录入过程中的常见错误1.没有在英文(半角)状态下输入。2.一个内容录入后没有打空格,就像录入多个英语单词时,一个单词录入后不打空格一样,SPSS程序会不认识。3.整个命令的全部内容录入后,没有命令结束符(即没打英文输入状态下的句号)。4.变量名不正确。例如,变量名前后不一致,在前面是W01,后面却变成了Wo1;又如,变量名中出现了空格。5.物理断行不正确。要断行时应选择在变量与下一个变量之间,不能将变量与其定义内容分开。6.将斜杠“/”与变量名分开了。“/”后面应紧跟变量名,不能分开。四、运行错误分析与纠错方法
逐条执行命令,以便锁定错误范围。
首先执行第1条命令,看看有无错误,有错则改正;无错误了,则执行第1-2条命令,有错则在第2条命令中找错误并改正;无错误了,则执行第1-3条命令,依次类推。错误分析举例运行内容:title社区青少年调查运行结果:错误#1.命令名:title社区青少年调查行中第一个单词未被识别为anSPSSStatistics命令。停止执行该命令。修正:在title与标签之间加一个空格,或者用英文输入状态下的引号把文字括起来,最后加命令结束符。title社区青少年调查.title‘社区青少年调查’.运行内容:title
社区青少年调查.
DATA
LIST/QN1-3
W01
4
W02
5
W03
6
W04
7
W05
8
W06
9
W07
10-12
W08
10-15
W09
16
W10
17
W11
18-20运行结果:错误#6045,位于列14。文本:-3在范围指定中指定的起始列无效。停止执行该命令。修正如下:(注意划线的地方)DATALIST/QN1-3W014W025W036W047W058W069W0710-12W0810-15W0916W1017W1118-20.运行内容:title社区青少年调查.DATALIST/QN1-3W014W025W036W047W058W069W0710-12W0810-15W0916W1017W1118-20.variablelabelQN‘问卷调查’/W01‘性别’/W02‘年龄’/W03'社区环境'/W04'举办青少年活动'/W05'交通'/W06'寻求社区帮助'/W07'课外活动内容'/W08'你所期待的社区的模样'/W09'晚间活动时长'/W10'夜间活动会是否会打扰'/W11'开展怎样的活动利于青少年'运行结果:variablelabelQN‘问卷调查’/W01‘性别’/W02‘年龄’/W03'社区环境'/W04'举办青少年活动'警告#4461,位于列16。文本:QN‘问卷调查’在VARLABELS命令中指定了未知的变量名。将忽略此名称及标签。警告#4461,位于列31。文本:W01‘性别’在VARLABELS命令中指定了未知的变量名。将忽略此名称及标签。警告#4461,位于列43。文本:W02‘年龄’在VARLABELS命令中指定了未知的变量名。将忽略此名称及标签。/W05'交通'/W06'寻求社区帮助'/W07'课外活动内容'/W08'你所期待的社区的模样'/W09'晚间活动时长'/W10'夜间活动会是否会打扰'/W11'开展怎样的活动利于青少年'.修正方法:在变量名与标签之间加一个空格,或者用英文输入状态下的引号把标签文字括起来。将/与W09放在同一行。修正如下:variablelabelQN问卷调查/W01性别/W02年龄/W03社区环境/W04举办青少年活动/W05交通/W06寻求社区帮助/W07课外活动内容/W08你所期待的社区的模样/W09晚间活动时长/W10夜间活动会是否会打扰/W11开展怎样的活动利于青少年.运行内容:title社区青少年调查.DATALIST/QN1-3W014W025W036W047W058W069W0710-12W0810-15W0916W1017W1118-20.variablelabelQN问卷调查/W01性别/W02年龄/W03社区环境/W04举办青少年活动/W05交通/W06寻求社区帮助/W07课外活动内容/W08你所期待的社区的模样/W09晚间活动时长
/W10夜间活动会是否会打扰
/W11开展怎样的活动利于青少年.valuelabelW011‘男’,2‘女’/W021‘12岁以下’2‘13~18岁’3‘19~24岁’/W031‘很好’2‘还行’3‘一般’4‘很差’/W041‘经常性’2‘偶尔’3‘没有过’/W051‘方便’2‘没有固定路线’/W061‘不会’2‘会’3‘看情况’/WO91‘一小时’2‘二至三小时’3‘看情况’/W101‘会’2‘还好’3‘不会’运行结果:(注意变量值标签的引号格式)valuelabelW011‘男’,2‘女’/W021‘12岁以下’2‘13~18岁’3‘19~24岁’/W031‘很好’2‘还行’3‘一般’4‘很差’/W041‘经常性’2‘偶尔’3‘没有过’/W051‘方便’2‘没有固定路线’/W061‘不会’2‘会’3‘看情况’/WO91‘一小时’2‘二至三小时’3‘看情况’/W101‘会’2‘还好’3‘不会’.警告#4474.命令名:valuelabel(ADD)VALUELABELS命令指定了未知的变量名。将忽略此名称。Theerrorisassociatedwith'WO9'修正如下:valuelabelW011'男'2'女'/W021'12岁以下'2'13~18岁'3'19~24岁'/W031'很好'2'还行'3'一般'4'很差'/W041'经常性'2'偶尔'3'没有过'/W051'方便'2'没有固定路线'/W061'不会'2'会'3'看情况'/W091'一小时'2'二至三小时'3'看情况'/W101'会'2'还好'3'不会'.五、注意事项SPSS23.0可以同时打开多个数据编辑窗口、输出窗口和语句窗口。如果当前打开了多个数据编辑窗口、输出窗口或语句窗口,可以直接单击某个窗口的标题栏或最小化图标来激活它。“列”为显示列宽,是和数据显示状态相关的,与“宽度”(变量答案代码的位数)是两个不同的概念。但如果要使变量值完整地显示出来,那么显示列宽一般要大于或等于变量宽度,同时还要大于或等于变量名的长度。SPSS23.0变量有3种基本类型:数字型(SPSS17.0写的是数值型)、日期型和字符串型。数字型变量又分为标准数字型、带逗点的数字型、圆点数字型、科学记数法和带美元符号的数字型变量等。定类测量、定序测量的结果为字符串,但变量类型依然可以选数字型,此时输入的数字只是选项内容的代码,没有数字本身的含义;当把变量类型设定为字符串型时,在数据视图中不仅可以输入数字,也可以输入字母、文字、符号等非数字内容,但编码时一般用数字。定距测量和定比测量的结果为数字型(数值型),此时数字代表数字本身。为了防止突然断电等意外情况导致的数据丢失,在输入过程中应随时保存数据。任务三数据清理
本任务主要学习数据有效范围和逻辑一致性清理的方法。通过学习,学会数据的有效范围清理和逻辑一致性清理。【相关知识】一、数据有效范围清理数据有效范围:是指变量的取值都有一定的范围,其编码值就在这个范围内。比如,“性别”这一变量的取值有3种种情况:1=“男”,2=“女”,0=“未填写”,相应地,其编码值就只有0、1、2这3个数字,也即0、1、2是“性别”这一变量的有效范围。在SPSS中,数据有效范围清理的具体方法
通过执行变量的频率分布统计命令,该命令位于菜单栏“分析”菜单的“描述统计”命令中,获得变量的频数频率分布表。
观察表中的有效值一列,看看是否有超出有效范围的数字出现。
如果有,则应当返回到数据视图中,将光标置于待查找变量一列的任何单元格中,在“编辑”菜单中选择“查找”命令,将超出有效范围的数字找出来,再看看该数字所在行对应的问卷编号,最后找到相应的原始问卷,根据原始问卷的信息对计算机文件中数字进行纠正。二、数据逻辑一致性清理数据逻辑一致性清理:是指利用变量与变量之间内在的逻辑关系,对前后数据的合理性进行检验。其前提条件就是要弄清问卷中不同变量之间的关系。数据逻辑一致性清理的前提条件:就是要弄清问卷中不同变量之间的关系。数据逻辑一致性清理的方法:
在SPSS中,对于相倚问题,可以直接用“交叉表分析”命令,获得两个相倚变量的交叉表,以观察表是否有不应当出现的统计数字。
如果有,则使用菜单栏“数据”菜单中的“选择个案”命令,选出不需要回答后续性问题的个案,并在其中查找不应该出现的数字,最后与原始问卷进行核对并修正。
对于存在数量关系的两个或多个变量,可以通过创建新变量的方法检查其逻辑一致性。【实作训练】
利用《昆明市低保制度实施状况调查》SPSS数据文件(截取了232个个案的信息),练习数据的有效范围清理和逻辑一致性清理。操作过程:(一)预备工作:改变w01、w42的编码值,创设仿真情境。(二)数据的有效范围清理第一步:依次点击:分析(A)→描述统计→频率(F)…,对w01[性别]作频率统计。第二步:将光标置于w01所在列的任意一个单元格。第三步:点击菜单栏“编辑”菜单中的“查找”命令,查找到超出有效范围的数字。(三)数据的逻辑一致性清理第一步:依次点击:分析(A)→描述统计→交叉表(C)…,做w42与w44交叉表。第二步:依次点击如下2个命令:数据(D)→选择个案…,在弹出的“选择个案”对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2031年中国程控交换机式紧急电话行业投资前景及策略咨询研究报告
- 新疆新源县达标名校2024-2025学年初三考前全真模拟密卷英语试题试卷(5)含答案
- 信阳市固始县2025年三年级数学第二学期期末综合测试试题含解析
- 甘肃省渭源县重点中学2023-2024学年中考数学考试模拟冲刺卷含解析
- 广东省广州市石井新市学片2023-2024学年中考试题猜想数学试卷含解析
- 2025公司项目负责人安全培训考试试题及参考答案AB卷
- 2024-2025公司厂级安全培训考试试题附参考答案【培优B卷】
- 2024-2025项目部安全培训考试试题及参考答案【基础题】
- 2024-2025企业员工岗前安全培训考试试题附答案【考试直接用】
- 2025年新进厂员工安全培训考试试题及完整答案1套
- 班主任工作坊活动方案
- FZ/T 52019-2011莱赛尔短纤维
- 国开电大 管理概论 形考任务一(画组织结构图)
- 三自由度并联机器人结构设计
- 仓储装卸服务合同
- 式双钩五点安全带培训课件
- 名片设计 课件
- 钳工实操评分表(凹凸配合)
- 社会组织管理概论全套ppt课件(完整版)
- 陕西省城市规划管理技术规定(定稿)
- 部编版七年级下册历史复习提纲(重点考察知识点)
评论
0/150
提交评论