




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第八章 调查资料的处理 调查资料的整理的主要内容调查资料的整理的主要内容 原始资料的审核和复查 1 数据清理 3 统计表与统计图 4 资料转化与录入 2 第一节第一节 原始资料的审核与复查 1、资料的审核 定义:它是指研究者对调查所收集回的原始资料 (主要是问卷)进行初步的审查和核实,校正错 填、误填的答案,剔除乱填、空白和严重缺答的 废卷 目的:使得原始资料具有较好的准确性、完整性和 真实性,从而为后续资料整理录入与统计分析工 作打下较好的基础。 检查出文件资料中存在的问题 重新向被调查者核实 资 料 的 审 核 工 作 资料审核有两种不同的做法: 一种是实地审核; 另一种是系统审核或集中审
2、核 实地审核:在调查的过程中进行,即边调查 边审核 ?优点:特别及时,且效果较好; ?缺点:要求调查工作的组织和安排要特别 仔细,调查员个人处理各种情况的能力要比 较强 ?集中审核:先将调查资料全部收集回来,然 后再集中时间进行审核 ?优点:调查工作便于统一组织安排和管理, 审核工作也可以统一在研究者的指导下进行, 审核的标准比较一致,检查的质量也相对好一 些; ?缺点:整个调查工作的周期则会相对拉长, 少数个案的重新询问和核实工作有时因时间相 隔较长或调查地点较远而无法落实。 2、资料的复查 定义:指的是研究者在调查资料收回后,又由其他 人对所调查的样本中的一部分个案进行第二次调 查,以检查
3、和核实第一次调查的质量 基本做法:从原来的调查员所调查过的样本中,随 机抽取5%-15%的个案重新进行调查 调查内容:一方面核实原来的调查员是否真的对个 案进行过调查;另一方面可将两次调查的结果进 行对比,以检查第一次调查的质量 通过审核和复查,研究者可以发现并纠正原 始资料中所存在的一些错误,可以剔除一些 无法进行再调查但又有明显错误的问卷,还 可以普遍了解整个资料收集工作的质量,从 而对资料的真实性和准确性具有更大的信心。 第二节 资料转换与录入 1、问卷资料转换 编码手册:为了减少资料转换工作中的误差, 保证数据的质量,研究者需要编制一份编码手 册(也称编码簿)发给从事问卷资料转换工作
4、的人员,以便他们按编码手册的要求,统一进 行资料转换工作 在编码手册中,研究者要将需要编码的项目 和问题一一列出,逐一规定它们的代码、宽 度、栏码、简要名称、答案赋值方式及其他 特殊规定等等。整个编码手册的格式要规范 统一,指示要明确,且容易理解,便于操作。 “项目名称”所列的是问卷中的问题或有关项目; “变量名”则是调查问卷中所实际测量的一个变量; “含义”是简要地指出该变量的内涵,它往往是变 量的核心内容的反映; “答案赋值”一项十分关键,它可以说是编码手册 的真正内容。在这一栏中,研究者要详细地标明每 一种答案的赋值安排,以及某些特殊形式的答案赋 值方法 2、数据录入 经过前述的资料转换
5、处理,调查所收回的问 卷中的一个个具体答案都已成功地、系统地 转换成了由0-9这10个阿拉伯数字构成的数码, 接下来的任务就是将这些数码输入计算机内, 以便进行统计分析了。这就是数据录入的工 作 数据录入的方式主要有两种: 一种是直接从问卷上将编好码的数据输入计 算机; 另一种是先将问卷上编好码的数据转录到专 门的登录表上,然后再从登录表上将数据输 入计算机。登录表的横栏为问题及变量名, 且都有给定的栏码,纵栏为不同的个案记录 数据 目前运用较普遍的统计分析软件主要有 SPSS,SAS等,尤其是SPSS应用更为广泛。 从目前情况看,研究者主要采用两种方法来 输入数据。一种方法是直接在SPSS软
6、件上输 入数据。另一类是采用比较专门的数据库管 理软件,如FOXBASE,Excel等,两种方法各有 特点 在SPSS中输入比较直观,打开SPSS后,显示 的是一个数据录入窗口,每一个纵栏表示一 个变量,每一横行代表一个个案。 输入前需要定义变量,做法是先用鼠标点击 表下面的Variable view,进入到到变量定义 窗口(横行上面分别为变量名、变量类型、 变量宽度、小数点位数、变量标签等、纵栏 的1、2、3等表示个案)再用鼠标点击表下方 Data view,返回数据录入窗口。 这时就可以第一行开始,直接将每一个个案 的数据逐行一个一个地敲到方格中,数据录 完后存盘。然后就可以随时调用作分析
7、了。 但是,直接输入有时候很容易出错,且输入 时也不容易发现; 而另一类专门性的数据库管理软件则往往更 能保证输入的正确性,更能减少输入数据时 产生的差错 由于一项问卷调查的数据总量(每份问卷的 栏码总数乘以全部问卷,即为输入数码或字 符总数)往往是很大的,故实践中常常是有 多人共同输入来完成的。 因此,研究者必须对数据的输入工作进行精 心组织和安排。具体说来,他要做好以下几 方面工作: 挑选和培训输入人员。数据输入人员应该 是熟悉计算机操作,熟悉调查问卷的人,通 常可从大学生调查员中挑选。对选出的录入 人员要进行一定的培训,熟悉输入方式和具 体软件,并合理分工和加强管理。 统一规定数据输入格
8、式和数据文件名。由 于多人输入,每个输入人员应采取统一的输 入格式,并各自规定自己存放数据的文件名, 以防与他人输入的数据格式不同或发生混淆 和丢失。尤其是输入格式一旦确定,每个输 入人员都必须严格遵守执行,否则以后很难 处理,这一点十分关键。 每个输入人员独立完成各自所输的那一部 分问卷,不同输入人员的问卷相互之间,以 及同一个输入人员已输和未输的问卷之间, 千万不要混淆搞乱,以免造成漏输或重复输 入,影响数据质量。 在每个输入人员完成各自所负责的问卷输 入任务后,由研究者把他们的数据合起来形 成一个总的数据文件,以供统计分析时调用。 第三节 数据清理 1 1、有效范围清理 对于问卷中的任何
9、一个变量来说,它的有效 的编码值往往都有某种范围,而当数据中的 数字超出了这一范围时,可以肯定这个数字 一定是错误的 当然,这种错误数字的出现可以发生在资料处 理的每一个阶段。 首先,发生在原始问卷中的回答上; 其次,发生在编码员对问卷的编码结果上; 第三,发生在计算机录入员输入数据的过程中。 要检查出所有不符合要求的超出有效范围的 编码值,我们只需在计算机上用SPSSSPSS软件 (或其他软件)执行一条统计各变量频数分 布的命令,计算机很快就给出下列形式的结 果: 找有问题的个案的方法同样离不开计算机及 SPSS软件的运用。在SPSS软件中,我们先打 开数据文件,然后执行“查找数据”命令。
10、选择数据中的A5栏,让计算机逐个查找在这 一变量栏中编码值为6的那9个个案。再根据 这9个个案的编号找出原始问卷,进行核对 如果原始问卷上的回答是如果原始问卷上的回答是2,而编码为,而编码为6,则 是编码员的错误,将数据中的这个6改为2即 可; 如果原始问卷上是2,编码也是2,则是录入 员的错误,也直接将数据改正即可;员的错误,也直接将数据改正即可; 如果核对时,发现是原始问卷中的填答错误, 则只能将该个案在这一变量上的回答记为0 (即无回答),作为缺省值处理 2、逻辑一致性清理 其基本思路是依据问卷中的问题相互之间所 存在的某种内在的逻辑联系,来检查前后数 据之间的合理性。 比如,一项对青年
11、夫妇进行的社会调查中,有这样 一对相倚问题。其过滤性问题是: “你们有孩子 吗?”答案为“有(编码为 1”和“没有(编码为 2 。而后续性问题是: “请问你们的孩子今年多大 了?”那么,对于那些在前一问题中的回答“没有” 的人(即编码为2的人),在后一问题中的回答应该 是空白(即为缺省值 ,用0表示 )。如果在这些人中, 有的人的第二个答案上出现了 4、6等数字,则这些 个案的数据就可能有毛病 3、数据质量抽查 采用随机抽样的方法,从样本的全部个案中, 抽取一部分个案,进行校对工作。用这一部 分个案校对的结果,来估计和评价全部数据 的质量。根据样本中个案数目的多少,以及 每份问卷中变量数和总字
12、符数的多少,研究 者往往抽取2%-5%的个案进行校对 一项调查样本规模为一项调查样本规模为1000个个案,一份问卷个个案,一份问卷 的字符数(数据的个数)为200。研究者从中 随机抽取随机抽取3%的个案(即30份问卷)进行对照份问卷)进行对照 检查,结果发现有2个字符输入错误,这样可 知错误率在0.03%左右。也就是说在总共左右。也就是说在总共20万万 个数据中,大约有60个左右的错误。 第四节 统计表与统计图 1、统计表的构成与制作 (1)统计表的构成 从统计表的结构上看,通常都由表号、总标 题、横行标题、纵栏标题、数字注释和资料 来源等要素所构成 表号:表的序号,位于表顶端左角。其作用 是
13、便于指示和查找 总标题:是表的名称,它位于表的顶端,紧 接在表号后面。 横行标题:是横行的名称,又称横标目。它 位于表的左侧,对于频数统计表来说,横行 标题一般用来统计所要说明的主题;而对于 交互分类统计表来说,则表示其中一个变量 类别 纵栏标题:是纵栏的名称,又称纵标目,位纵栏标题:是纵栏的名称,又称纵标目,位 于表的最上一格。对于一般的频数统计表, 它指示调查指标或统计指标的名称;而对于它指示调查指标或统计指标的名称;而对于 交互分类表来说,它也是表示其中的一个变 量的类别量的类别 数字:是统计表的实质性内容,是对调查资 料进行统计汇总、整理和计算的结果体现。 它位于由横行标题与纵栏标题所
14、包围的范围 中。 注释或资料来源是对表中资料的一种说明,注释或资料来源是对表中资料的一种说明, 位于表的下端。位于表的下端。 (2)统计表的制作)统计表的制作 统计表制作原则是:科学、规范、简明、实 用、美观。具地说,在制作统计表时,应注用、美观。具地说,在制作统计表时,应注 意以下几个方面: 首先,表的标题要简短明了,首先,表的标题要简短明了, 其次,表的纵栏标题与横行标题要准确反映 变量取值的含义, 第三,表中的数据资料必须注明计量单位,第三,表中的数据资料必须注明计量单位, 第四,对于一般频数分布表,则应列出合计 栏,以便获得整体情况的资料。总计或合计 栏往往放在表的最下一格;对于交互分
15、类表, 则将各种专门的统计量放在表的最下面一格 最后,各种表格均应以横线为主,能够不用最后,各种表格均应以横线为主,能够不用 竖线则尽量不用。即便需要用竖线的表格, 也应是开口式的,即表的左右两端不划竖线也应是开口式的,即表的左右两端不划竖线 在不致混淆的情况下,也可将其竖线去掉, 成为以下形式成为以下形式 而交互分类表则可制成以下表而交互分类表则可制成以下表8-7形式形式 除表的最上面一条横线与最下面一条横线用除表的最上面一条横线与最下面一条横线用 粗线外,其余横线均用细线粗线外,其余横线均用细线 2、统计图 统计图具有直观、形象、一目了然、通俗易 懂的特点,它主要用于调查资料初级统计结 果的描述,特别适合于对调查总体的内部构 成进行描述,对不同现象的分布进行比较以 及对现象变化的趋势进行展示等。 统计图主要有条形图、圆形图和折线图三种 (1)条形图)条形图 条形图又称矩形图,它是以宽度相等、长度 不等的长条来表示不同的统计数字,如表示不等的长条来表示不同的统计数字,如表示 频数或百分比的多少等等 简单条形图 复杂条形图:复杂条形图: (2)圆形图)圆形图 又称扇形图,它是以圆内不同扇形面积的大 小来表示总
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年海南海洋招聘考试笔试试题(含答案)
- 自动驾驶接驳车服务创新创业项目商业计划书
- 翻译管理中的敏捷实践创新创业项目商业计划书
- 社交交友平台创新创业项目商业计划书
- 水产品的发酵工艺创新创业项目商业计划书
- 2025年电商平台供应链金融创新案例研究及风险预警报告001
- 2025年生态循环农业技术创新与经济效益长期影响评价报告
- 辽宁省重点高中联合体2024-2025学年高一下学期7月期末测试 历史试卷
- 2026届山东省青岛市黄岛区开发区致远中学化学高三上期末学业质量监测试题含解析
- 现代营销基础知识培训课件
- 销售公司红线管理制度
- 创新园管理制度
- 阿尔兹海默症康复护理
- 小学一年级第一学期数学兴趣小组计划
- DB51T 2245-2016 四川省专用地震监测台网建设技术规范
- 《年产15万吨苯酚的工艺流程设计》21000字
- 土地信息系统试题及答案
- 名人传课件完整版本
- 能源管理体系内审员培训课程
- 人力管理咨询合同范本
- 排水防涝设施功能提升施工组织与管理方案
评论
0/150
提交评论