(8.7)-第15讲 市场调查数据整理与分析-修1_第1页
(8.7)-第15讲 市场调查数据整理与分析-修1_第2页
(8.7)-第15讲 市场调查数据整理与分析-修1_第3页
(8.7)-第15讲 市场调查数据整理与分析-修1_第4页
(8.7)-第15讲 市场调查数据整理与分析-修1_第5页
已阅读5页,还剩69页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第15讲市场调查数据整理与分析——《市场调查与预测》授课流程课前自主学习情况测试01分小组问题反馈02核心知识讲解03小组合作完成调查数据的整理与分析04PART01课前自主学习情况测试TEST1.数据整理的程序正确的是数据审核、设计并编制数据整理方案、数据编码、数据录入、数据分组数据审核、数据编码、设计并编制数据整理方案、数据录入、数据分组数据审核、数据编码、数据录入、设计并编制数据整理方案、数据分组设计并编制数据整理方案、数据审核、数据编码、数据录入、数据分组ABCD提交单选题1分2.数据审核的内容有真实性审核完整性审核一致性审核及时性审核ABCD提交多选题1分3.数据审核的方法有逻辑审核计算审核抽样审核统计审核ABCD提交多选题1分4.根据调查中收集到的数据类型不同,数据编码可分为名称码定量码定性码结构码ABCD提交多选题1分5.如何对录入数据的准确性进行审核?二次录入,进行比较逻辑查错逐个核对抽查核对ABCD提交多选题1分6.对数据进行统计分组的作用有划分现象的类型,便于分类研究解释现象的内部结构,能够体现各类现象在总体中的占比和地位便于分析现象之间的依存关系增加数据整理的工作量ABCD提交多选题1分7.有两个或两个以上属性的变量分布属于单变量频数分布多变量频数分布累计频数分布ABC提交单选题1分8.以下指标用于反映数据的集中趋势的有平均值众数中位数平均差ABCD提交标准差E多选题1分9.以下指标用于反映数据的离散趋势的有全距众数中位数平均差ABCD提交标准差E多选题1分10.不同总体的两个同类指标进行对比的比值是结构相对指标比较相对指标比例相对指标强度相对指标ABCD提交单选题1分11.数据的多变量分析方法有相关分析聚类分析辨别分析因子分析ABCD提交多选题1分12.数据图形分析技术中常用的图形有柱形图折线图饼状图散点图ABCD提交多选题1分PART02分小组问题反馈PROBLEMFEEDBACK我代表

小组。针对课前自主学习,我想问:

(每组至少提出一个问题,组长组员均可回答)作答主观题10分PART03核心知识讲解EXPLANATION01数据整理02数据分析要求1:能够根据数据整理的程序,对已有数据进行审核、分组、编码、录入并编制统计表。要求2:能够对整理后的数据进行分析,包括集中与离散趋势分析、相对程度分析、多变量分析。目录与要求定义数据整理就是根据调查目的,对调查所得的各种原始资料进行审核、编码、录入、分类和汇总,并借助各种综合指标,对调查对象的相互联系、总体特征及发展规律做出概括性的说明。程序1数据整理问卷整理程序审

核编码数据处理图表制作录入分组1.1数据审核数据审核是指:对已经收集到的资料进行审查与核实,检查资料是否齐全、是否有差错,以决定是否采用此份调查资料的过程。数据审核作用主要是:确保信息质量,避免出现逻辑错误,遗漏问题及时补充,错误信息及时纠正;避免重复劳动(数据录入),提高效率、降低成本。1.1数据审核审核分为两个层面

实地审核

一般方式:

复查和回访

资料审核

主要内容包括:资料的时效性—准资料的完整性—缺资料的正确性—误审核的主要内容:检查审核问卷或调查表填答的项目是否完整。如大面积的无回答,个别问题无回答,有相当多的调查问卷对同一问题无回答等情况。检查问卷或调查表中的项目是否存在填答错误。如逻辑性错误,答非所问的答案,乏兴回答的错误(所有问题都选择同一固定编号答案或一笔带过若干个问题)。主要是对调查表或问卷的真实性进行检验,评价访问员是否存在伪造问卷或调查表的行为。一般采用抽样检查的方法进行核实。完备性完整性准确性真伪性1.1数据审核时效性主要是对调查问卷或调查表的访问时间、有关数据的时间属性进行检查,以评价调查数据是否符合时效性的要求。检查收回的问卷或调查表的份数是否齐全,是否达到了调查方案设计的样本量的要求。审核的主要办法:经验判断法

例如:如果被调查者年龄填写为132岁,根据经验判断,其填写肯定有误。逻辑检查法例如:某消费者在前面说“不知道”某调味品,后面却说“每天都在使用”,显然前后矛盾。计算审核法例如:在家庭收支结构中,家庭总收入远小于总支出和储蓄之和,那肯定有错。1.1数据审核审核的重要性:错误的数据不如没有数据

国内一家知名的电视机生产企业,2014年初设立了20多人的市场研究部门,开展了同样的调研问卷,完全相同结构的抽样,两组数据结论却差异巨大。正是因为这次调查,部门被注销、人员被全部裁减。调查问题:列举您会选择的电视机品牌?其中一组的结论是:有15%的消费者选择本企业的电视机;另一组的得出的结论却是:36%的消费者表示本企业的产品将成为其购买的首选。巨大的差异让公司高层非常恼火,为什么完全相同的调查抽样,会有如此矛盾的结果呢?公司决定聘请专业的调研公司来进行调研诊断,找出问题的真相。1.1数据审核审核的重要性:错误的数据不如没有数据

普瑞辛格的执行小组受聘和参与调查执行的访问员进行交流,并很快提交了简短的诊断结论:第二组在进行调查执行过程中存在误导行为。调研期间,第二组的成员佩带了公司统一发放的领带,而在领带上有本公司的标志,其标志足以让被访问者猜测出调研的主办方;其次,第二组在调查过程中,把选项的记录板(无提示问题)向被访问者出示,而本企业的名字处在侯选题板的第一位。以上两个细节,向被访问者泄露了调研的主办方信息,影响了消费者的客观选择。

这家企业的老总训斥调研部门的主管:“如果按照你的数据,我要增加一倍的生产计划,最后的损失恐怕不止千万。”1.1数据审核审核的重要性:错误的数据不如没有数据

本案例对你有何启示?

1.1数据审核

市场调查是直接指导营销实践的大事,对错是非可以得到市场验证,只是人们往往忽视了市场调查本身带来的风险。一句“错误的数据不如没有数据”,包含了众多中国企业家对数据的恐慌和无奈。缺失数据的处理:

无效问卷:回答不完全:调查对象不符合要求;答案选择高度一致;截止日期后收回的问卷。不满意的问卷:模糊不清;前后不一致或有明显错误的;模棱两可;不符合作答要求。

1.1数据审核弃用(1)重新调查(2)填充:①找一个中间值代替②用一个逻辑答案代替③删除处理(3)空缺1.2数据分组

文字资料

分组

数字资料1.2数据分组——文字资料对于调研问卷中的开放式问题,很多回答都是文字资料,对于这些文字资料我们需要根据其资料的性质、内容或特征把相异的资料挑出来,把相同或相近的资料归为一类,这样才能进行后期的数据分析。(1)穷举原则。穷举即不遗漏,就是说分类时每一条资料都要有归属。分类的结果必须将所有的总类全部包括进去,没有遗漏。(2)相斥原则。相斥即不重复,就是说在一种分组中每一条资料只能归属为一类中,而不能既归于这类又归于那类,以至于在不同类别中重复出现。即类与类要相互排斥。1.2数据分组——文字资料开放式问题答案的整理程序:1.集中所有同一个开放式问题的全部文字性答案,通过阅读、思考和分析,把握被调查者的思想认识。2.将被调查者的全部文字性答案,按照其思想认识不同归纳为若干类型,并计算各种类型出现的频数后,制成全部答案分布表。3.对全部答案分布表中的答案进行挑选归并,确定可以接受的分组数。一般来说,在符合调研项目的前提下,保留频数多的答案,然后把频数很少的答案尽可能归并成含义相近的几组,应根据调研的目的和答案类型的多少而确定,一般来说应控制在10组之内。4.为确定的分组,选择正式的描述词汇或短语。不同组别的描述词汇或短语应体现质的差别,力求中肯、精炼、概括。5.根据分类归纳的结果,制成正式的答案分布表。1.2数据分组——文字资料例如:在一项关于居民空调购买行为的调研问卷中,设置了“你对静音空调这个产品概念有何看法?”的开放式问项,通过对被调查者的回答分类归纳如下:1.2数据分组——数字资料对于问卷中的数字资料大多数在设计问卷时已经分好组了,如问卷中的封闭式问题。但是,开放式问题如“您购买的小灵通价格是()元”,那么,我们在问卷调查完之后就还要对数字资料进行分组。数字资料的分组需要按照一定的步骤进行。1.2数据分组——数字资料第一步:选择分组标志(分组的关键)分组标志是说明总体特征的名称,可以分为品质标志和数量标志。定性:品质标志表示事物的质的特征,是不能用数值直接表示的属性,如人的性别、民族等。定量:数量标志表示事物的量的特征,是可以用数值直接表示的,如人的年龄、收入等。分组标志就是分组的依据或标准,分组标志一经选定,各组的性质界限和数量界限也就确定了。1.2数据分组——数字资料第二步:组数和组距的确定调查的数据资料最大值减去最小值,就是全距。(1)组数和组距如何确定。当全距确定时,组距大则组数小,组距小则组数多。如果分组过多,组距必小,则不易观察数列分布的规律性。如果分组过少,组距必大,会使组中值缺乏代表性。各组组中值应对本组有良好的代表性。组距的确定一般可以请专家或以经验法确定。组数一般常分为10~15组。

组距=全距÷组数1.2数据分组——数字资料第二步:组数和组距的确定确定组距应遵循下列3个原则:①必须把原始资料全部变量值都包括在所分组内,不能有任何遗漏;②组距尽可能取整数,不要小数;③各组的组距尽可能相等,少用不等距分组,因为等距分组便于后阶段的分析。1.2数据分组——数字资料第二步:组数和组距的确定按照经验确定组数观测值数目组数少于504-750-2007-9200-5009-10500-100010-111000-500011-135000-5000013-17多于5000017-201.2数据分组——数字资料第二步:组数和组距的确定(2)组距应否相等。为了便于分析研究原则上各组的组距应相等,即尽量编制等距数列。(3)组距的位置如何确定。为便于分析研究,一般采用整齐而惯用的数字为组限。特别是习惯于采用5或10的倍数表示组限。每组的最大值为组的上限,每组的最小值为组的下限。划分组限时,各组频数的计量不能重复,每一总体单位只能计数1次。恰好重叠在组限上的变量值一般归入下限的1组,即遵循“上限不在内”原则。1.2数据分组——数字资料第二步:组数和组距的确定(4)组限如何表示。组限的表示应以变量值本身的性质而定。如果是间断数列,且数值变动范围小,则可以把每个变量值为一组,叫单项式分组,见表5-1。如果是连续数列,且数值变动范围较大,可将变量值划分为几个区间,每个区间为一组,叫组距式分组,见表5-2。表5-11.3数据编码编码就是将问卷信息(包括调查问题和答案)转化为统一设计的计算机可识别的数值代码的过程,以便于数据录入和做进一步的处理与分析。即给每一个问答题的每一个可能的答案分配一个代号,通常是一个数字。编码可在问卷设计时进行,也可在数据收集结束后进行,分别称为事前编码和事后编码。事前编码是在问卷设计时,事先给大多数问题的每一个可能答案分配一个数字代号,常用在结构性问卷中;事后编码是给某个没有事先编码的答案分配数字代号,常用于封闭式问题中的其他和开放式问答题。1.3数据编码事前编码:1.3数据编码事后编码:如:1.3数据编码Q:为什么您喜欢喝这个牌子的啤酒?

事后编码16.无特殊原因1.4数据录入将问卷中每一问题的被选答案的代码读入或录入磁盘的工作。可以键盘录入,也可以智能录入(如数据录入软件系统Epidata、光学扫描录入)减少录入错误的方法有:对录入人员培训;双机录入;抽样检查(25%)数据审核:进行一致性与准确性检查,对错误的或不合理的数据进行处理。如:1.5数据处理与图表制作问卷中多数问题都需要频数表交互分析表常用于年龄、性别、收入、职业、受教育程度与其它问题作交互(交叉)分析。通过频数分布、表列、图表对整理后的调查资料进行一些基本的数据分析,使之能清晰明了地反映调查总体属性的分布态势和相互关系,有助于后续分析和预测。2数据分析调查有关单个变量的信息了解对一个变量选择不同取值的调查对象的数量不同取值的出现频率以百分比形式展现如:2.1数据分析--频数分布3.您通常喝什么类型的酒?白酒【】葡萄酒【】香槟酒【】啤酒【】其他【】2.1数据分析--频数分布通常饮用酒类的频数分度变量值标签变量值频数百分比有效百分比累计百分比白酒11020.020.820.8葡萄酒2816.016.737.5香槟酒324.04.241.7啤酒42754.056.297.9其他512.02.1100缺省924.0缺省合计50100100表示频数分布的指标有:集中趋势指标差异性指标分布形态指标2.1数据分析--频数分布①集中趋势指标用于描述分布的中心。包括:均值(平均数)中位数众数均值即平均数,是最常用的统计量数据应具有一定的集中趋势,大部分答案应分布在均值附近算术平均:加权平均:均值出现最频繁的数值,表示分布中的高峰众数2.1数据分析--频数分布①集中趋势指标用于描述分布的中心。包括:均值(平均数)中位数众数所有数据按升序或降序排列后位置居中的数值若样本数为偶数,则中位数为居中的两个数值的均值中位数是定序数据的集中趋势指标中位数中位数比平均数更能反映大众的真实情况【小笑话】如果比尔·盖茨和十几个穷光蛋在一个房间里,这个房间里十几个人的平均收入就都超过亿元。这是因为比尔·盖茨和穷光蛋的收入差距过大,导致平均数值缺乏实际参考意义。但如果用中位数来衡量,中位数为0,就知道这房间里起码有一半人是穷光蛋。2.1数据分析--频数分布②差异性指标用于描述样本值偏离分布中心的趋势。包括:极差(全距)方差或标准差变异系数反映数据的分散程度,即样本最大值与最小值之差可结合中位数评价样本值的代表性,受奇异值影响公式:全距=Xmax-Xmin极差2.1数据分析--频数分布②差异性指标离差:样本值和均值之差方差:离均差平方的均值标准差:方差的平方根方差或标准差越大,说明数据点分布越分散,数据间差异越大方差和标准差标准差与平均数的比值如果两组数据的度量单位和平均数相同,可用标准差来比较两组数据的离散程度;如果度量单位和平均数不同,就只能用变异系数比较变异系数2.1数据分析--频数分布③分布形状指标用于了解数据分布的形态。包括:偏度峰度数据分布可能是对称的,也可能不对称对称分布中,位于中心两侧的数据值一样多,均值、中位数、众数相等,对于均值的正负偏差相等;非对称分布则不等偏度指中心一侧的均值偏差趋势比另一侧大偏度测量频数分布曲线相对平滑或突起程度的指标正态分布峰度为0,峰度为正,曲线比正态分布突出,反之平缓峰度2.2数据分析--列表单向表列交叉表列只计数一个变量的不同数值出现次数的,称为单向表列离散型变量,或变量数值较少、变动幅度不大且总体单位数不多的情况适合编制单向表列同时计数两个或多个变量的不同数值联合出现次数的,称为交叉表列综合分析相互联系的多个变量之间的变动关系市场调查中最频繁、最广泛的方法之一2.2数据分析--列表①双向交叉表列复杂交叉表列的基础,描述当有两个变量同时产生影响作用时,频数分布的状况,也称列联表。经营年限与业务增长之间的关系表业务增长经营年限行总计小于5年5~10年10年以上速度慢453455134速度快525327132列总计978782266经营年限小于5年和5~10年之间的企业经营业务的增长速度快于经营年限超过10年的企业2.2数据分析--列表①双向交叉表列按经营年限计算的经营业务增长速度业务增长经营年限小于5年5~10年10年以上速度慢46.4%39.1%67.1%速度快53.6%60.9%32.9%列总计100%100%100%经营年限小于5年的企业中的53.6%和经营年限在5~10年的企业中的60.9%增长速度快,而10年以上的企业中只有32.9%增长速度快,说明当经营年限超过一定界限时,经营业务的增长速度反而可能下降。计算百分数可以按列计算,也可以按行计算原则:以自变量为基准计算百分数上表中经营年限为自变量,增长速度为因变量,以自变量为基准就是按列计算2.2数据分析--列表①双向交叉表列如果按行计算,可得下表。表中显示,增长速度慢的企业中有33.6%经营少于5年,25.4%经营了5~10年,41.0%经营了10年以上,说明增长慢使企业经营了很长时间,这种结果没有实际意义。按经营业务增长速度计算的经营年限业务增长经营年限行总计小于5年5~10年10年以上速度慢33.6%25.4%41.0%100%速度快39.4%40.1%20.5%100%2.2数据分析--列表②三向交叉表列在双向交叉表列中添加第三个变量婚姻状态与时装购买状况婚姻现状已婚未婚时装购买状况高31%52%低69%48%列总计100%100%被调查总数700300自变量:婚姻状况因变量:时装购买状况结

论:未婚者比已婚者购买更多的时装2.2数据分析--列表②三向交叉表列自变量:性别、婚姻状况因变量:时装购买状况结

论:婚姻状况对时装购买的作用更多的表现在女性身上,男性中已婚和未婚者购买时装的差异不大婚姻状态、性别与时装购买状况性别男性女性婚姻现状已婚未婚已婚未婚时装购买状况高35%40%25%60%低65%60%75%40%列总计100%100%100%100%被调查总数4001203001802.2数据分析--列表②三向交叉表列加入第三个变量后,原双向交叉表列分析的结果可能会:更精确地反映原有两个变量之间的联系可能发现原双向表列显示的两者之间的关系是假的可能使原双变量之间不相关的结论变为存在某些关系可能显示原有联系没有改变性别与驾车事故比率调查事项男性女性从未出过事故56%68%至少有一次事故44%32%被调查总数70806950男性比女性更容易出事故?2.2数据分析--列表②三向交叉表列性别、驾驶里程与驾车事故比率调查事项男性驾驶英里数女性驾驶英里数大于10000小于10000大于10000小于10000从未出过事故48%75%48%75%至少有一次事故52%25%52%25%被调查总数5010207019155035事故发生率多少与驾驶里程有关,与性别无关,前一张表中之所以男性事故比率高于女性,是因为男性的驾驶里程普遍多余女性2.3数据分析--图表统计图以圆点的多少、直线的长短、曲线的起伏、条形长短、柱状高低、圆饼面积等图形来展示调研数据统计图的制作:手工制作和计算机制作统计图的种类:折线图、条形图、直方图、圆面图、饼图、环行图、动态曲线图、散点图等。2.3数据分析--图表①折线图2.3数据分析--图表②直方图2.3数据分析--图表③条形图2.3数据分析--图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论