版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第第 十十 三三 章章 数数 据据 处处 理理 与与 分分 析析 本章学习内容本章学习内容v13.1 确认v13.2 编辑整理v13.3 编码v13.4 数据录入v13.5 计量v课后习题本章学习目的本章学习目的v能够对收集的信息进行数据处理与分析,具体包括:v确认问卷是否有效v对问卷进行编辑整理v对问卷进行编码v能够熟练地利用软件进行数据录入v能够利用SPSS等统计软件进行数据的统计与分析本章学习重点与难点本章学习重点与难点v对开放式问题的编码v能够利用SPSS等统计软件对数据进行统计分析v数据收集阶段完成以后,在调研者面前堆放的是大量问卷。如何把包含在大量问卷中的有用信息转化为进行具体分析
2、所必需的总结性图表示本章要解决的问题。这一问题的解决步骤包含五个过程:v1 确认与编辑v2 编码v3 数据录入v4 数据自动清理v5 制表与统计分析13.1 确认确认v目的:确保每份调查问卷都是有效问卷,即调查是按要求正确无误进行的。研究人员必须确信用以要提出建议的调查结果真实反映了目标顾客的回答。v方式:现场确认,根据调查问卷中记录被调查者的姓名、地址及电话号码等事后“确认”-通常电话确认。v适当比率的复查,通常为10%20。v确认内容:v(1)确认此人是否真正接受了调查?v(2)被调查者是否符合条件?v(3)确认调查是否按要求的方式进行的? v(4)确认调查是否完整。v(5)最后,确认过程
3、中还应检查其他方面的问题。例如,访问员是否彬彬有礼?访问员是否明确介绍了委托人的身份或调查的目的?访问员是否衣冠整齐?被访者对访问员或调查过程有什么意见?13.2 编辑整理编辑整理v编辑是对访问员和应答者的错误进行检查。v通常数据录入前,问卷至少应经过两次编辑整理。首先,由执行实际调查的现场服务企业进行编辑,然后再由雇佣这些现场服务企业的市场调研公司做编辑整理。包括一系列问题的查验:v(1)确定访问员是否没有问某些问题或者没有记录某些问题的答案。v(2)核实问卷,以保证遵循了规定的跳跃模式。v(3)检查开放式问题的答案。v开放式问题要求访谈员逐字记录答案,不以任何方式重新释义、表达或插入自己的
4、语言,同时也要求他们对回答进行进一步的探查。示例:开放式问题记录示例:开放式问题记录v问题:你为什么在众多的快捷/方便的餐馆中选择经常去汉堡王?v记录A:顾客似乎觉得汉堡王有更加美味的食物和一流的服务环境。访谈员记录不当访谈员记录不当v记录B:因为我喜欢它。访谈员没有进一步探访谈员没有进一步探查回答。查回答。v记录C:因为我喜欢它。(P)我喜欢它并经常去那里,因为那是离我工作的地方最近的餐馆。(AE)没有。适当的记录和探查适当的记录和探查v注:P probe 探查;AE anything else 其他13.3 编码编码 编码是指对一个问题的不同回答进行分组和确定数字代码的过程。封闭式问题都预
5、先编码。此阶段主要是对开放式问题进行编码v编码过程v1列出答案v2合并答案v3设置编码v4输入编码v(1)读取每组问题中每个开放式问题的回答。v(2)找出与按步骤2得到的合并类别相符的回答。v(3)把每个具体回答的数字编码填入相应的类别中。v(4)在调查表的适当地方,注明每个问题回答的数字编码。为什么您喜欢喝这个牌子的啤酒啤酒v因为它口味好v它具有最好的味道v我喜欢它的口味v我不喜欢其他啤酒太重的口味v它最便宜v我买任何打折的啤酒,它大部时间都打折v它不象其它牌子的啤酒使我的胃不舒服v其它牌子的啤酒使头痛,而这个牌子不会v我总是选这个牌子v我已经喝了20多年了v它是大多数同事喝的品牌v我的所有
6、朋友都喝它v这是我妻子在食品店中购买的牌子v我没有想过v不知道v没有特别的原因回答类别 回答 分配的编码口味好/喜欢味道/ 1,2,3,4 1 低/较低价格 5,6 2长时间喝,习惯 9,10 3 13.4 数据录入数据录入v指将信息从计算机不可识别的形式转换成为计算机能够识别的形式的过程。v数据录入方式v智能录入:是指经过编程的数据录入装置或与之相连的计算机对输入的信息进行逻辑检查。数据录入系统能通过编程避免录入时出现某些类型的错误:录入无效或太广的编码以及违背跳答模式。v光学扫描仪:是一种能够“阅读”问卷表上答案的数据处理装置。v处理录入差错的方法:v1、审核方法。在录入工作刚开始时,研究
7、人员最好在场,使录入人员得以提问。一般来说录入人员对计算机比较熟练,而对问卷中问题的逻辑关系则可能不太熟悉。录入结束后由审核人员将数据库中的记录与问卷资料进行核对,确定差错的比例。v2、双机录入。将同一份问卷上的内容在计算机中录入两次,两次使用不同的录入人员。13.5数据的审核与数据自动清理数据的审核与数据自动清理v审核是应用各种检查规则来辨别缺失、无效或不一致等造成数据记录的潜在错误。v审核分为三类:有效性审核、一致性审核和分布审核。有效性、一致性审核是针对单张问卷进行的;分布审核是对全部问卷或部分问卷的数据一起进行的审核。v有效性审核是检查被调查者回答的语句语法是否正确,检查包括是否在该填
8、数字的地方填上了非数字以及问卷中的回答是否有缺失等错误。v一致性审核检查不同问卷之间的关系是否正确。一致性审核是基于不同问题或同一问题的不同部分之间的结构关系、逻辑性和合法性进行。如出生年月与婚姻状况之间就存在合法性关系。v分布审核试图通过数据的分布来识别记录是否远远脱离分布的正常范围,即有些数据是否为离群值。v全面的审核会花费很多的时间和精力,因此在大多数时候可以采用选择性审核的方法。如:自上而下法、聚集法、画图法、问卷打分法。v利用计算机进行审核是一种重要的审核方法。数据自动清理(machine cleaning data)是对数据进行最终的计算机化的错误检查。v有两种途径可以完成这一任务
9、:v错误检查程序 (error-checking routines):就是从用户那里接受指令来对数据中的逻辑错误进行检查的计算机程序。v边际报告(marginal report):就是由计算机列出的一张关于每一问题答案的频次表。13.6 制表和统计分析制表和统计分析v至此,调查结果已经存储于计算机文件中了,并且没有了逻辑录入错误与访谈员记录错误。现在的任务就是将调查结果图表化。v统计表示用于显示统计数据的基本工具。一些原始数据往往是杂乱无章的,一旦加以整理列在一张统计表内,就会使这些数据变得一目了然,清晰易懂。v统计图可以直观的显示数据,它能集中强调数据的相对模式,反映数据的分布形状、结构和数
10、量的级别等。课程要介绍的主要图表类型v单向频数表单向频数表 frequency tablev交叉分析表交叉分析表 cross tablev柱形图柱形图 histogram chartv曲线图曲线图 curve chartv饼形图饼形图 pie chart单向频数表Frequency tablev单向频数表显示了对每一问题做出每种可能回答的单向频数表显示了对每一问题做出每种可能回答的人的数量。人的数量。v例:如果将来您或您的家人需要住院治疗,并且只能例:如果将来您或您的家人需要住院治疗,并且只能在福特沃斯或达拉斯的医院,您会选择哪一个地方?在福特沃斯或达拉斯的医院,您会选择哪一个地方?总数 总数
11、300 (100%)去福特沃斯的医院144 (48%)去达拉斯的医院146 (48.7%)不知道/未回答10 (3.3)里根总统选举里根总统选举新闻机构NewsweekABC newsusa today被调查人数446695850里根 Reagan433944蒙代尔 Mondale403627泰Tie142521其它308合计100100100关于百分比基数v全部被调查者人数v需要回答具体问题的人数v做出回答的人数复选问题的频数复选问题的频数v具有多种回答的问题v答案的数量会超过被调查者人数v在市场调研中,一般以被调查者的人数为基数计算百分比v因为我们对给出某一答案的人数比例更感兴趣交叉分析表
12、交叉分析表 (列联表)(列联表)v列联表(列联表(cross tabulations)是用来描述两个或两)是用来描述两个或两个以上变量的联合分布的统计表。个以上变量的联合分布的统计表。 v在营销研究中它常用来观察不同变量之间的关系,在营销研究中它常用来观察不同变量之间的关系,例如:例如: v品牌忠诚度与性别之间的关系?v 对新产品的态度与年龄、文化程度之间的关系? v家庭规模与拥有的汽车种类、档次之间的关系? 二维表二维表v两个变量间关系可以用二维表(双变量列联两个变量间关系可以用二维表(双变量列联表)表示。表)表示。v 绝对频数表绝对频数表v相对频数表相对频数表性别和互联网使用状况性别和互联
13、网使用状况性别互联网使用率男性女性行总计少量5(33.3)10 (66.7)15(100)频繁10(66.7)5 (33.3)15(100)列总计15(100)15(100)加入第三个变量加入第三个变量引入第三个变量常有助于:引入第三个变量常有助于: 提炼二元关系提炼二元关系辨识虚假关系辨识虚假关系显示隐藏关系显示隐藏关系婚姻状况与时装购买时装购买率目前婚姻状况已婚未婚高3152低6948列合计100100调查对象人数700300婚姻状况和性别与时装购买时装购买率性 别男性婚姻状况女性婚姻状况已婚未婚已婚未婚高35402560低65607540列合计100100100100调查对象人数4001
14、20300180线形图线形图 v线形图或许是所有图形中最简单的一种,尤其适用于显示在不同试点上进行的测量。一般情况下通常把时间作为解释变量,放在横轴上,按相等的间距取值,纵轴表示应变量。v第十三章图形数据.xls中国彩电发展趋势中国彩电发展趋势饼形图饼形图 pie chartpie chartv一般用于表明现象的结构一般用于表明现象的结构v常用于市场细分常用于市场细分v第十三章图形数据第十三章图形数据.xls香烟消费口味特征混合型20%烤烟型63%外香型17%柱形图柱形图v柱形图是一种非常灵活的形式。任何可以在线形图、饼状图中表现的数据结果均可在柱状图中表达。v第十三章图形数据.xls0%10
15、%20%30%40%50%60%70%80%混合型烤烟型外香型城市农村0%10%20%30%40%50%60%1元以下1.1-1.9元2-2.9元3-5.9元6-9.9元10元以上全省城市农村13.7 描述统计描述统计描述统计测定指标数据分布性质数据分布性质集中趋势集中趋势离中趋势离中趋势分布形态分布形态峰度峰度平均数概念平均数概念平均数是将总体中所有个体的数量平均数是将总体中所有个体的数量标志标志差异抽象化差异抽象化,用以反映现象在一定时间、,用以反映现象在一定时间、地点条件下的一般水平或代表性水平地点条件下的一般水平或代表性水平总体分布的集中趋势Histogram (STAT1.STA 2
16、6v*50c) y = 246130 * 2 * normal (x, 14.801613, 3.0953757)VAR1No of obs0460692121381818424230302763632242368484145446060506665527259878644846909073696 24集中趋势总体分布的集中趋势: -1000 -1000 发炮弹落点发炮弹落点2121981921641551211339894总体现象共性特征:捷达轿车捷达轿车: 1: 1没有奖品没有奖品:99999:99999集中趋势集中趋势: :没有奖品没有奖品明天下雨的可能性是:80%明天不下雨的可能性:2
17、0%集中趋势是:明天下雨平均数种类F算术平均数算术平均数F加权平均数加权平均数F中位数中位数F众数众数平均数不会说谎平均数不会说谎, ,但说谎者会用平均数但说谎者会用平均数在调查一家工厂的工资水平时,这家工厂的年薪为2700镑的工厂主回答说:“我厂的工资水平是每年934934镑镑。”代表该厂工人的工会负责人说,工资水平是每年800镑,而税务检查人员说,工资水平是每年850镑。这三种不同答复的根据都是下表中的数据。那么哪一个对呢?年薪(X)镑人数2700120001150021000390018800237002合计50平均数的局限性平均数的局限性-一个身高180的不会游泳的人想涉水过河,已知河
18、的平均深度为1米,此人是否过河?为什么?平均数的局限性平均数的局限性-某人想购买一台冰箱,现有如下信息:-冰箱品牌 A B-平均使用年限 10 10-最多使用年限 20 12-最少使用年限 2 8标志变异指标是测定总体中各个个体单位标志值差异标志值差异的变动范围或差异程度的指标。差异需要测定吗?差异需要测定吗?集中趋势平均数相同,但差异不同差异需要测定吗?差异需要测定吗?ABC平均数相同,差异水平不同,所以代表性不同v离散程度的计量:v方差v标准差v全距v四分位数偏态偏态理想的分布形态是对称的,但在现实生活中,现象之分布并不完全对称,而是或多或少地不同程度地存在着非对称情况,在统计上将这个非对称分布称为偏态。140120100806040200偏态偏态偏态偏态v如果偏度如果偏度=0=0,则表明此,则表明此分布为对称分布;分布为对称分布;v如果偏度如果偏度00,则表明此,则表
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 静脉血栓栓塞症防治指南及护理新进展试题及答案
- 2026黑龙江黑河市康宁医院长期招聘工作人员2人考试备考题库及答案解析
- 四川中烟工业有限责任公司2026年度高层次人才招聘1人考试备考题库及答案解析
- 2026上海中医药大学附属曙光医院招录25人(第一批)考试备考题库及答案解析
- 2026贵州黔西南州安龙栖凤街道养老服务中心招聘办公室文员、护理员5人考试参考题库及答案解析
- 未来五年新形势下内河水运行业顺势崛起战略制定与实施分析研究报告
- 未来五年低脂冰淇淋行业市场营销创新战略制定与实施分析研究报告
- 未来五年特种砂浆市场需求变化趋势与商业创新机遇分析研究报告
- 物流服务中水资源节约利用制度
- 未来五年逆向物流行业市场营销创新战略制定与实施分析研究报告
- 2026年浙江高考物理试卷附答案
- Zippo2024美版年册完整版
- 全域废弃矿山生态修复项目可行性研究报告
- 2026年宜春职业技术学院单招职业适应性测试必刷测试卷及答案1套
- 申论“人工智能+”热点卷
- 2026年山东城市服务职业学院单招职业适应性测试题库附答案
- 2025年全国高校港澳台大学生中华文化知识大赛备赛考试题库-上(单选题、多选题)
- 减轻企业负担政策解读
- 标定锁定作业安全培训课件
- 焊接缺陷修复及返修技术措施总结
- 重症5C培训历年真题(含答案)
评论
0/150
提交评论