




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、市场调查与预测(第三版) 第7章 市场调查资料的处理与分析7.1 市场调查资料的处理7.2 单变量数据的描述性统计分析7.3 双变量及多变量数据的描述分析7.4 交叉列表和多选题分析实例知识点1数据处理的基本过程。2数据编辑中关于缺失值的处理。3数据编码的含义及类型。4多选题编码及两种编码方式的比较。5多选题编码方式之间的转换。6排序题的编码方式。7单变量数据的描述性统计分析方法。8双变量交叉列表分析技术。9多变量交叉列表分析技术技能点1掌握不同数据类型的编码。2掌握单变量数据的描述性统计分析方法。3掌握多变量描述性统计分析方法。引导案例 中国电子银行调查报告7.1 市场调查资料的处理7.1.
2、1问卷检查市场调查资料处理的第一步是检查问卷填写的完整性和数据质量,目的是确定哪些问卷可以接受,哪些问卷要作废。一般来说,出现以下几种情况的调查问卷是不可以接受的:1虚假的采访2错误的信息 3不一致性 4不充分的回答 5不相关的回答 7.1 市场调查资料的处理 7.1.2数据编辑数据编辑是为了提高问卷数据的准确性和精确性而进行再检查,目的是筛选出问卷中看不清楚、不完整或不一致的答案。 如果无法把问卷返回调查现场,编辑人员也可以考虑插补不合格问卷的缺失值。这种方法适用于以下情况:1有缺失值的问卷数较少;2每份有缺失值的问卷中的缺失值所占的比例较小;3关键变量没有缺失值。插补值要尽量与实际可能值相
3、近,通常采用逻辑判断、均值替代、模型计算等方法。7.1 市场调查资料的处理 7.1.2数据编辑丢弃不合格问卷是一种更为简单的处理方法,只要将有较多缺失值和不合格问卷丢弃即可,但在应用时要注意使用条件。该方法适用于以下几种情况:1不合格问卷比例较小(不超过10%);2每份不合格问卷中不合格答案占的比例较大;3关键变量的值缺失。7.1 市场调查资料的处理7.1.3数据编码数据编码就是将问卷信息(包括调查问题和答案)转化为统一设计的计算机可以识别的代码,以便于对其进行数据整理与分析。1编码设计的内容与分类 (1)编码设计的内容。编码设计的具体内容包括:问卷的代码、变量的定义(名称、类型、位数、对应问
4、题等)以及取值的定义(范围、对应含义等)。 7.1 市场调查资料的处理7.1.3数据编码1编码设计的内容与分类 (2)编码设计的分类根据问卷结构的不同,可分为结构式问卷编码设计和非结构式问卷编码设计。根据问卷中问题类型的不同,可分为封闭题、半封闭题和开放题编码设计。根据编码设计的时间与方法不同,可分为前设计编码和后设计编码两种。 7.1 市场调查资料的处理7.1.3数据编码 2前设计编码前设计编码要求事先已知问题的答案类别,主要应用于结构式问卷中的封闭题和数字型开放题,下面将按不同题型进行阐述。(1)封闭题单选题多选题顺序题7.1 市场调查资料的处理【例7-1】:请问您的性别是: 男 女 对上
5、题设计编码时定义变量名为SEX,属于数字型变量,变量所占字节数为1,变量取值范围为1、2或0。其中1表示性别男,2表示性别女,0表示该题无回答。 7.1 市场调查资料的处理【例7-2】:请问您在何处购买护肤产品? A.商场专柜 B.超市 C.专卖店 D.美容院 E.其他地方 对上题设计编码时定义变量名为place,属于数字型变量,变量所占字节数为1,变量取值范围为1、2、3、4、5或0,其中1表示商场专柜,2表示超市,3表示专卖店,4表示美容院,5表示其他地方,0表示无回答。7.1 市场调查资料的处理【例7-3】:请问您选择本次航班的原因是什么?(可以选择多项)安全有保障 航班时间合适 机型好
6、 服务好 持常旅客卡 航班正点 折扣票 旅行社安排 无其他航班 其他 请详细说明 7.1 市场调查资料的处理7.1 市场调查资料的处理 7.1 市场调查资料的处理7.1 市场调查资料的处理 7.1 市场调查资料的处理 7.1 市场调查资料的处理 7.1 市场调查资料的处理7.1.3数据编码 2.前设计编码 3.后设计编码 7.1.4数据的录入 7.2 单变量数据的描述性统计分析 7.2.1 数据分类/分组与频数分布 1类别或顺序数据的分类与频数分布类别或顺序数据的频数分布展示一个变量各个类别的频率,即落在这一类别中的观测数。类别或顺序数据的频数分布,通常通过频数分布表、累积频数分布表、条形图、
7、柱状图、饼图及环形图等图表工具展示出来。返回目录7.2 单变量数据的描述性统计分析 【例7-6】7.2 单变量数据的描述性统计分析 频数百分比有效百分比累积百分比非常不满意12.02.02.0不满意510.010.012.0有些不满意1836.036.048.0满意2550.050.098.0非常满意12.02.0100.0合计50100.0100.0表7-6 消费者对储物柜满意程度频数分布表 (一)基本项目1性别2年龄3文化程度4职业5所属行业6家庭人口7就业人口8年人均收入9居住城区(二)空调拥有状况10拥有量 11品牌 12机型 13功率 14购买时间15购买地点16购买因素17信息渠道
8、18价格 (三)满意度项目19制冷效果20制热效果21耗电水平22噪声大小23外观设计24组件质量25价格水平26送货安装27维修服务(四)需求项目28需求数量29需求时间30品牌选择31机型选择32功率选择33价位选择34购点选择35关注要素36由谁决定【例7-7】某市组织了一次样本量为2 000户的居民家庭空调满意度和购买行为的市场调查,设计的项目有36个,其中基本项目9个,主体项目27个。7.2 单变量数据的描述性统计分析【例7-8】从某地区抽取24名互联网用户,得知其月均上网费用(单位:元)如下:34,47,34,47,55,42,71,68,46,83,51,53,59,60,63,
9、65,74,57,57,54,67,55,73,49,54,77。试对上述数据用直方图和折线图进行展示。 7.2 单变量数据的描述性统计分析【例7-8】 7.2 单变量数据的描述性统计分析 7.2 单变量数据的描述性统计分析 7.2.1 数据分类/分组与频数分布 2数值型数据的分组与频数分布 (1)单变量值分组。 (2)组距式分组。确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按 Sturges 提出的经验公式来确定组数K 确定各组的组距:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距(最大值最小值)组数 根据各组的频数整
10、理成频数分布表。 7.2 单变量数据的描述性统计分析 7.2 单变量数据的描述性统计分析 7.2 单变量数据的描述性统计分析7.2 单变量数据的描述性统计分析 7.2.2 集中趋势分析与离散程度分析1数据的集中趋势分析均值(各类平均数)中位数众数7.2 单变量数据的描述性统计分析 7.2.2 集中趋势分析与离散程度分析2数据的离散程度分析极差平均差 (3)“三公”原则标准差离散系数方差7.2 单变量数据的描述性统计分析 7.2.2 集中趋势分析与离散程度分析 3偏度及其峰度偏度又叫偏态或斜度,它表示数据分布的不对称方向和程度。峰度表示数据分布与正态曲线相比的尖峭程度或扁平程度。7.3 双变量及
11、多变量数据的描述分析 7.3.1 双变量交叉列表分析法1交叉列表分析的含义 交叉列表分析是同时将两个或两个以上具有相互联系的变量及其变量值,按照一定顺序对应排列在一张表中,从中分析变量之间的相关关系,得出科学结论的技术。变量之间的分项必须交叉对应,从而使交叉表中每个节点的值反映不同变量的某一特征。7.3 双变量及多变量数据的描述分析【例7-9】 7.3 双变量及多变量数据的描述分析7.3.1 双变量交叉列表分析法 2交叉列表分析中变量的选择和确定 7.3 双变量及多变量数据的描述分析【例7-10】 事故类型百分比从未在驾驶中出过事故62%在驾驶中至少出过一次事故38%总计100%被调查人数合计
12、14 030事故类型男性女性从未在驾驶中出过事故5662在驾驶中至少出过一次事故4438总计100100被调查人数合计7 0806 950表7-9 某保险公司交通事故调查表表7-10 交通事故与性别关系调查表7.3 双变量及多变量数据的描述分析【例7-10】7.3 双变量及多变量数据的描述分析7.3.1 双变量交叉列表分析法 3双变量交叉列表分析法双变量交叉列表分析法是最基本的交叉列表分析法。通常交叉列表中两变量对应的结点应该使用相对频数,也就是使用百分比的数据,这样能够使两变量之间关系得到更好的体现。使用相对频数编制交叉列表,应注意解决究竟按照什么方向来计算相对频数。7.3 双变量及多变量数
13、据的描述分析7.3.2 多变量交叉列表分析法7.3 双变量及多变量数据的描述分析 7.3.2 多变量交叉列表分析法1更精确地反映原有两个变量之间的关系 2显示原有两个变量的联系是虚假的 3显示原先被隐含的关系 4原有的变量关系不变7.3 双变量及多变量数据的描述分析【例7-11】 假设进行一次样本容量为1 000人的消费者抽样调查,研究时装购买情况和婚姻状态之间的关系。对收集来的资料首先将婚姻状态(分为已婚和未婚)和购买时装情况(分为高低两档)作为两个变量进行交叉列表分析,详情如表7-14所示:时装购买现状已婚未婚高31%52%低69%48%列总计100%100%被调查者数(人)700300表
14、7-14 婚姻状态与时装购买情况的关系7.3 双变量及多变量数据的描述分析【例7-12】 国外曾经有一项研究价格昂贵的小汽车拥有者情况的抽样调查,样本容量是1 000人,最初以被调查者受教育程度和拥有昂贵小汽车两个变量进行交叉列表分析,结果如表7-16所示。7.3 双变量及多变量数据的描述分析【例7-13】:假设抽取样本容量为1 000人的消费者进行调查,研究年龄与出国旅游愿望之间的关系,以两个变量年龄和出国旅游原因进行交叉列表分析,详情如表7-18所示。7.3 双变量及多变量数据的描述分析 7.3.2 多变量交叉列表分析法1更精确地反映原有两个变量之间的关系 2显示原有两个变量的联系是虚假的
15、 3显示原先被隐含的关系 4原有的变量关系不变 7.4 交叉列表和多选题分析实例 7.4.1 交叉列表分析实例1收集数据2分析处理3分析结果 7.4 交叉列表和多选题分析实例 7.4.1 交叉列表分析实例1收集数据 姓 名性 别年 龄教 育 年 限李 云男2010蒋 小男2513李 四男4517王 二男5018倪 平女4613书 云男2613静 思女2716刘 大男3016李 平男3516祝 清女2813王 梅女2913 7.4 交叉列表和多选题分析实例 7.4.1 交叉列表分析实例2分析处理 (1)将表中的数据输入或复制到SPSS数据文件中 7.4 交叉列表和多选题分析实例 7.4.1 交叉
16、列表分析实例2分析处理(2)执行分析/描述性统计/交叉表命令 7.4 交叉列表和多选题分析实例 7.4.1 交叉列表分析实例2分析处理(3)在该窗口中将“年龄”添加到行框中,将“教育年限”添加到列框中, 7.4 交叉列表和多选题分析实例 7.4.1 交叉列表分析实例3分析结果 7.4 交叉列表和多选题分析实例 7.4.2 多选项分析实例1.收集收据 7.4 交叉列表和多选题分析实例 7.4.2 多选项分析实例2分析处理(1)打开“报考志愿调查”数据文件 7.4 交叉列表和多选题分析实例 7.4.2 多选项分析实例2分析处理(2)执行分析/多重响应/定义变量集命令,弹出如图7-17所示的多选项变量集定义窗口。 7.4 交叉列表和多选题分析实例 7.4.2 多选项分析实例2分析处理(3)在该窗口中,将多选项所有变量添加到集合中的变量列表框中,然后再按照指定的变量编码方法进行分解。 7.4 交叉列表和多选题分析实例 7.4.2 多选项分析实例2分析处理(4)单击关闭按钮,完成多选项变量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025简易住宅抵押贷款合同协议
- 陕西省cet4英语试卷及答案
- 石灰在汽车尾气净化中的应用考核试卷
- 植物油的非食品应用前景考核试卷
- 生物化工产品制备考核试卷
- 肥料产品在农业生产中的应用效果考核试卷
- 特种印刷技术在包装装潢中的应用考核试卷
- 2025年中国贴身美体内衣市场调查研究报告
- 妇幼保健院患者满意度调查考核试卷
- 航空旅游航拍影视制作考核试卷
- 我的家乡烟台课件
- 二级板式换热器热网疏水回收的优势
- 2021届高考英语887核心词(打印、词频、出处、例句、背诵)
- 国外几家气压盘式制动器的比较
- GB/T 20647.9-2006社区服务指南第9部分:物业服务
- 培养初中学生的数学阅读理解能力
- 卒中相关肺炎的指南解读
- 六下统编版复习2形近字
- 硒知识科普手册
- 起重吊装作业审批表
- 新版冀教版科学四年级下册全册教案(双面打印)
评论
0/150
提交评论