调查资料的处理及分析_第1页
调查资料的处理及分析_第2页
调查资料的处理及分析_第3页
调查资料的处理及分析_第4页
调查资料的处理及分析_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第七章 调查资料的处理与分析2一、 调查资料的处理与分析3(一一)资料处理与分析的基本意资料处理与分析的基本意义原则义原则资料处理与分析的概念:资料处理与分析的概念: 是指将收集到的各类信息资料,按照一定的程序和方法,进行分类、计算、分析和选择等使之成为适用的信息资料的过程。41、资料处理的基本原则、资料处理的基本原则及时及时 在处理与分析过程中要强调时间性,提高处理速度。因为信息资料都有一定的时效性。准确准确 这是资料工作的生命。即一要真实,二要准确。真实,是定性要求,即处理的是真的情报、信息。准确是定量的要求,适量减少误差和模糊度。系统系统 即在处理与分析过程中必须强调全面客观地反映市场

2、的变化和特征,形成系统化的信息资料。可使资料具有更多的价值,更利于使用。 5适用适用 一是采用的处理与分析方法要适当,二是处理与分析后,形成的信息资料要符合实际需要。经济经济 以较少的费用,形成尽可能多的有用的信息资料。2、 基本要求基本要求 要有正确的观点要有正确的观点: 现代信息观念、实事求是的观念 、时间观念、市场观念、服务观念、效率效益的观念。 要有专职的称职的信息处理与分析人员要有专职的称职的信息处理与分析人员。 要有严格的制度要有严格的制度。 要有科学合理的标准要有科学合理的标准。 要有科学、认真、高效的工作态度要有科学、认真、高效的工作态度。 63、资料处理与分析的意义、资料处理

3、与分析的意义 首先,通过处理与分析,使信息资料统一化、系统化、适用化。 其次,可以提高市场调查资料的价值。 再次,可以产生新的信息。 最后,可以发现并纠正市场调查过程中的不足。7(二二)资料处理与分析过程及其内容资料处理与分析过程及其内容 1、一般过程:(1)现场控制 (2)逻辑处理鉴别 分类 编码 合并 比较 筛选(3)数学处理数学处理统计分析建模与解模(4)系统研究 (5)编 写8二、资料处理与分析的若干方法二、资料处理与分析的若干方法 (一一)鉴别的方法鉴别的方法1、不真实的信息资料的几种形式、不真实的信息资料的几种形式 误传、虚构、添加、拼凑、混淆、夸张、偏颇、孤证(仅凭几个孤立的现象

4、进行推理判断)、回避、捉影(事出似有因,细查却无实据)、假象(以表面现象甚至假象掩盖了事实本质)。2、鉴别的方法、鉴别的方法:分析判断法、核对法(与客观事物或权威资料相核对)、比较法、作证法(调查收集能验证原信息资料真实性、准确性、适用性的佐证,来鉴定初始信息的质量)。9(二二)编码的方法编码的方法1、基本原则:基本原则: 编码应与分类相适应、编码时应预留足够的位置、代码要系统化、尽量使编码具有兼客性和通用性2、常见的编码方法:常见的编码方法: 第一种:顺序编码法(系列编码法)只用一个标准分类,并按一定的顺序用连续的数字或字母进行编码此方式短而简单,易于管理,但不适合进行分组处理。 10顺序编

5、码法(系列编码法)顺序编码法(系列编码法) 如,一项调查家庭收入的项目把不同收入家庭分为五个档次,顺序编码时可用15分别代表从低到高的五个档次: 1) 小于8000元 2) 8001元15000元 3) 15001元24000元 4) 24001元35000元 5) 大于35000元11第二种第二种 分组编码法(区间编码法)分组编码法(区间编码法)根据事物的特性和信息资料分类及其处理的要求,把具有一定位数的代码单元分成若干个组(区间),每一组(区间)的数字均代表一定的意义,所有项目都有同样的数码个数。 比如,对消费者使用信用卡的意向调查相关的信息,包括性别、职业、月收入、意向四项,可用分组编码

6、法则进行编码(见下表)。此法使用相当广泛,易记忆,处理较方便,但有时位数过多,造成系统维护上的困难。 12分组编码法(区间编码法)分组编码法(区间编码法)性别 :1男性 、2女性 职业 :1经理人员、2销售人员、3机关人员、 4职工 、5教师 、 6工程技术人员 7私营业主、8学生 、9其他 月收入 :01 400元以下、02 401500元 、 03 501600元、 04 601700元 05401500元、06 701800元 07 801900元、08901 1000元 091000以上意向: 1已有卡 、 2准备用、 3不准备用、4无意向1593:男教师,不准备用 13 第三种:信息

7、组码编码法第三种:信息组码编码法把信息资料区分为一定的组,每一组给予一定的组码进行编码。如:对市场商品调查的分类编码可用此法,(见下表)组别 名称码百货组 0030食品组 3160五金组 6180纺织组 81100 这种方法能以较少的位数分组,但一旦编码体系确定,遇到某些组内资料增加,处理起来困难。14第四种:表意文字编码法(记忆编码法)第四种:表意文字编码法(记忆编码法)用数字、文字、符号等表明编码对象的原理,并按此进行信息资料编码。如:用20TVC表示20英寸彩色电视机,其中:“20”表示规格,TV表示电视机。C代表彩色。直观,易理解,便记忆。第五种:缩写编号法第五种:缩写编号法把惯用的缩

8、写字直接用作代码进行编码。如: LB KG YD CM 磅 千克 码 厘米15(三)定性市场信息资料的简明加法定性市场信息资料的简明加法定性市场信息资料是指那些以文字来描述事物的特征的非数量化的信息资料。1、汇集法、汇集法。把许多原始信息资料按一定的目的汇集在一起,以集中反映某些事物的概况和问题。此法要求相关信息的量要多一点,反映的面要宽一点;要围绕一定的主题进行资料汇集;要避免把许多资料简单堆砌,而要把相关的信息资料有机地汇集起来。162、归纳法:、归纳法:将反映某一主题的市场信息资料集中在一起,加以系统的综合归纳,以准确全面,概要地说明该主题。3、纵深法:、纵深法:按事物发展纵的方向,即按

9、时间顺序或逻辑次序,把有关的资料进行综合深入的研究。4、连横法:连横法:把彼此相关的若干个不同的方面或不同时期的资料,有机地横向连接起来,作出比较分析和相关分析。5、推理法:、推理法:在占有并详细分析研究大量的资料前提下,依事物内在联系和发展规律,进行科学的判断,推理。17(四四)定量市场信息资料的简明加工法定量市场信息资料的简明加工法定量市场信息资料是指那些反映事物的量的数量化的信息资料。通过简明加工,使大量的数据资料更加有序、更加鲜明、更加容易被人理解和接受。1、对比法:、对比法:把某些定量资料同其他相关资料进行对比(纵比,横比,各部与全部比,先进与落后比,同行业之比,等等)。对比可形成强

10、烈的反差,增加鲜明性,也能反映事物发展变化。182、化小法:、化小法:将某些数值很大,人们不易理解的数据,通过成比例化小为人们容易理解的数值较小的数据。比如:1987年底,居民储蓄总余额3075亿元,居民手持现金1200亿元,合计4275亿元。 对此数据,许多人并不十分明确,如化小为:人均达400元,则给人清晰的印象。 3替代法:替代法:把表示某一事物的数据不直接表现出来,而是用人们熟悉的数量概念或数量关系的事物来代替表示。比如,某项绿色工程的施工效益,相当于增加良田50万亩。194、转换法、转换法:把人们比较生疏、不易理解的数字转换成人们所熟悉的数字。如:解放日报88年4月13日一篇文章中写

11、道:全国社会商品零售总额一年时4000亿元,商业系统销售是3000亿元,全国10亿人口,差不多每人每天手里拿着一元钱同商业部门打交道,加上银行存款,就变成每人每天手里拿着一元钱,兜里放着一元钱,盯着商品的门。这里,既用了转换法,又用了化小法。经原数据变成通俗,形象,便于理解记忆。5、图表法、图表法20三、三、 数据分析技术数据分析技术 数据分析是这对市场调查和预测过程中收集到的各种原始数据进行适当的处理,使其显示一定的含义,进而反映不同数据之间以及新数据与原数据之间的联系,并通过分析,得出某些结论。 数据分析主要采用的一些统计分析技术21(一一)交叉列表分析技术交叉列表分析技术1.概念 交叉列

12、表分析技术,是同时将两个或两个以上具有有限类目数据和确切值的变量按一定顺序排列在一张表中,从中分析变量之间的相关关系,得出科学结论的技术。 变量之间的分类必须交叉对应,从而使交叉表中每一个节点的值反映不同变量的某一特征。 交叉列表分析简便易行,其技术与结果易为一般调查人员接受。交叉列表的变量取决于客户的要求和调研人员的分析判断。 变量因素的确定应在资料之前。因为只有掌握足够的数据资料,相依的交叉列表分析才能实际操作。 22例如, 国外曾对城市居民居住期限长短同对该地区百货公司熟悉与否之间的相关联系进行过一次研究。所有被调查居民的居住年限分为小于13年,13-30年,30年以上三档。对百货商店的

13、熟悉情况分为熟悉与不熟悉两种。见下表(表4-1):熟悉情况 居住时间 合计 小于13 年1330年 30年以上 熟悉 52 53 27 132不熟悉 45 34 55 134列总计 97 87 82 266232. 交叉列表分析中变量的选择和确定运用交叉列表分析时,变量的选择和确定是关系到分析结果是否正确有效的关键性因素之一。见下例:(交叉列表运用不当,产生错误的结论)见下例:(交叉列表运用不当,产生错误的结论)国外某保险公司关于交通事故调查的最初纪录显示,该公司保户中,有62%从未在开车时出过事故,如下:从未在开车时出过事故 62% 至少出过一次事故 38% 被调查总人数 14030人24对

14、上述数据进行分性别确定事故比率,以了解性别同事故的多少是否有某种联系。如下: 男性% 女性%从未在开车时出过事故 56 68至少出过一次事故 44 32 100 100被调查总人数 7080人 6950人以上说明,男性事故比率高于女性以上说明,男性事故比率高于女性 25有人(尤其是男人)怀疑调查的正确性,觉得应把其他因素加入进去一并观察。一个可能的解释是:男性开车开得多,所以事故也多。于是把“驾驶里程”也作为第三变量加入进行研究。如下: 男性开车里程 女性开车里程 大于大于10000英里小于英里小于10000英里大于英里大于10000英里小于英里小于10000英里英里至少出过 一次事故 52%

15、 25% 50% 25%被调查总人数 5010 2070 1915 5035说明,事故发生率高低与驾驶里程有关系,而不是性别说明,事故发生率高低与驾驶里程有关系,而不是性别。263双变量交叉分析列表法双变量交叉分析列表法通常,把双变量交叉列表中各项绝对数转换成以百分数,能更清楚地显示相关关系。虽然百分比可以按列或按行进行,但并非两种计算结果都要有实际意义。如:表4-1所进行的分析就是一个实例。对表4-1,居住时间看作是自变量,对百货公司的熟悉程度是因变量,按自变量为基准,既按列进行计算百分比。如下表:27从下表看出,居住时间长的居民对本地区购物环境反而不太熟悉。可能是因为在一个地区居住时期太长

16、反而变得不太活跃,也可能还有第三个因素起作用。因此有必要进一步调查。(下表:表4-2) 熟悉情况 居住时间 合计 小于13 年1330年 30年以上 熟悉 53. 6 % 60.9% 32.9%不熟悉 46.4% 39.1% 67.1%列总计 100% 100% 100%28如果对表4-2按行进行计算百分比,有下表(表4-3)。表4-3显示,按行计算实际上是以因变量为基础的计算,其结果没有意义,因为它说明由于对百货公司不熟悉,影响了居民在该地区住了很长时间。这违背逻辑。熟悉情况 居住时间 行合计 小于13 年1330年 30年以上 熟悉 33. 6 % 25.4% 41.0%100%不熟悉39

17、.4% 40.1% 20.5%100%294、 三变量交叉列表分析法三变量交叉列表分析法在双变量交叉列表分析的基础上,加入第三变量作进一步分析,分析结果可能出现四种可能:更精确地反映双变量之间的联系;原有双变量之间不相关;使在双变量条件下的不相关结论变为相关;可能显示原有的联系没有改变;30以上情况可用下图反映: 原有二变量 两变量间有某种联系 两变量间无联系 引入第三变量 引入第三变量 更精确地显示 原二变量 无变化 原二变量间原二变量的联系 间不相关 有某些联系 31更精确显示原有联系。更精确显示原有联系。例如:研究时装购买和婚姻状况之间联系。时装购买分为高低两状况;婚姻分为已婚,未婚。对

18、1000消费者样本调查资料,以双变量交叉列表分析,见下表(表4-4):结论是未婚者比已婚者购买更多的时装结论是未婚者比已婚者购买更多的时装 时装购买状况 婚姻状况 已婚 未婚 高31%52%低69%48%列总计100%100%被调查数70030032当将购买者性别作为第三变量引入后,得到三变量交叉列表分析结果,原结论得到原结论得到更准确的反映。更准确的反映。见下表(表4-5) 时装购买情况 性别 男 女未婚已婚未婚已婚 高 35% 40% 25% 60% 低 65% 60% 75% 40% 列总计 100% 100% 100% 100%被调查数 400 120 300 18033显示原有联系是

19、虚假的显示原有联系是虚假的例:研究价格昂贵的小说与拥有者情况。用受教育程度和拥有昂贵小说数两个变量进行分析,见下表(表4-6)是否拥有 受教育程度 大学 低于大学 是 32% 21% 否 68% 79% 列总计 100% 100%被调查者 250 75034再把收入水平作为第三变量列入,见下表(表4-7),证明:收入水平是影响因素,证明:收入水平是影响因素,而非受教育程度,而非受教育程度,原先二变量交叉列表分析结论是虚假的是否拥有 收入水平 高 低大学低于大学大学低于大学 是 20% 20% 40% 40% 否 80% 80% 60% 60% 列总计 100% 100% 100% 100%被调

20、查数 100 700 150 5035显示出原先被隐含的联系。例:年龄与出国旅游的愿望的关系。见下表(表4-8)。结论:结论:年龄不是影响年龄不是影响因素。因素。 出国旅游愿望 年龄小于45岁45岁以上 有 50% 50% 无 50% 50% 列总计 100% 100% 被调查数 500 50036再把性别引入作为第三变量。见下表(表4-9)结论:年龄与出国旅游愿望相关结论:年龄与出国旅游愿望相关。 出国旅游愿望 年龄 男 女小于45岁45岁以上小于45岁45岁以上 有 60% 40% 35% 65% 无 40% 60% 65% 35%列总计 100% 100% 100% 100%被调查数 3

21、00 300 200 20037不改变原先反映出的联系。例:调查家庭规模与外出吃快餐的联系。见下表(表4-10)。经常外出吃快餐 家庭规模 大 小 是 65% 65% 否 35% 35% 列总计 100% 100% 被调查数 500 50038再把收入水平引入,见下表(表4-11)。结论:还是没关系。结论:还是没关系。 经常外出吃快餐 收入水平 高 低家庭规模大家庭规模小家庭规模大家庭规模小 是 65% 65% 65% 65% 否 35% 35% 35% 35%列总计 100% 100% 100% 100% 被调查数 250 250 250 25039(二二) 数据资料的概括技术数据资料的概括

22、技术 概括技术是一种十分常用的数据资料的分析技术。它用于对单个变量的数据资料进行概括,属单变量分析。 单变量总体中的所有单位的资料分布有集中趋势和离中趋势之分,数据概括技术也包括这两方面。1. 集中趋势(集中趋势(Central Tendency)的概括技术)的概括技术 次数分布的集中趋势,指次数分布趋向集中于一个分布的中心。其表现是,次数分布中心附近的变量值的次数较多,而相距次数分布中心较远的变量值次较少 40例:对236名消费者进行的月均生活费开支调查。见下页表4-12:显示:301350元附近各组的消费者人数较多,这里是次数分布的中心区域,次数集中趋向于变量值为301350元这一组。41

23、月均生活费开支(元)(变量值) 消费者数(人)次数 各组人数比重()(频率) 100-150 11 4.67151-200 20 8.48201-250 37 15.68251-300 46 19.49301-350 52 22.2351-400 42 17.8401-450 21 8.9451-500 7 2.97 合计 236 100.042显然,集中趋向数据的特征是,总体中各单位的次数分布既有差异性,又有趋中性。它反映了社会经济现象的特征,即社会经济现象总体的数量特征存在着差异性,但客观上存在一个具有实际经济意义的能够反应总体各单位数量的一般水平的值。概括技术就是找出这一数值所采用的方法

24、。最常用的反映总体各单位数值的一般水平的数值有众数,中位数和平均数众数,中位数和平均数。43众数众数 众数。众数是总体中各单位在某一标志上出现次数最多的变量值。如:对大学生上电影院看电影的调查显示,大多数大学生每月看电影4次,这一数字就是众数。所以众数的确定较容易。44中位数中位数中位数是总体中各单位按其在某一标志上数值的大小顺序排列时,居于中间位置的变量值。计算方式: n+1 中位数位置中位数位置 2 式中:n为标志值的项数(n为偶数时,取数列中间两项值的算术平均数为中位数)例如:有一列数值:0,0,0,0,1,1,1,1,1,2,2,2,3,7,9,则,中间数位置1518 , 中位数为1。

25、 245平均数平均数平均数是总体中各单位数值的和除以标志值项数得到的值。有算术平均数,加权平均数,调和平均数,几何平均数。462、离中趋势(、离中趋势(Dispersion)的概括技术)的概括技术 次数分布的离中趋势,是指次数分布呈集中趋势的状态下,同时也存在偏离次数分布中心的趋势。例如:表4-12所示资料中,消费者月均消费开支在100500之间这一范围内,尽管大多数消费者开支在250400之间,但也有少数消费者的开支偏高或偏低,而使次数分布呈离中趋势。47 在市场调查中,对集中趋对集中趋势进行概括,反映事实的势进行概括,反映事实的一般水平;对离中趋势进一般水平;对离中趋势进行概括,则反映各单

26、位标行概括,则反映各单位标志值之间的差异程度。志值之间的差异程度。48全距和平均差全距和平均差 全距全距全距最大标志值最小标志值全距不能确切地反映标志值的真实的变异程度,它只是一个较粗略的测量离中趋势的标志。在运用中,当经济现象的离散程度比较稳定时,可以使用。49全距和平均差全距和平均差 平均差(平均离差平均差(平均离差A.D.)是将离差数值的总和除以离差的项数的结果。公式为:平均差平均差 (A.D) X-X n式中:X:标志值;X:平均指标;X- X :离差;n:离差项数平均差的数值意义:平均差越大,则表示用众数中位数平均数测算的数值代表性越小;反之,代表性越大50平均差系数平均差系数 平均

27、差系数平均差系数是用平均差除以相应的平均指标得到的数值。公式为: A.D. 平均差平均差系数 X 平均指数51平均差系数平均差系数 由于平均差是各个标志值与总体平均指标的平均差额,它同时受到标志值的变异程度和总体平均指标两个因素的共同影响。因此,当对比两个总体的变异程度时,如果它们的平均指标水平不同,就不能简单地将两个平均差进行对比。此外,平均差具有与平均指标相同的计量单位,所以,计量单位不同的总体的平均差也不能直接比较52平均差系数平均差系数 平均差系数是一个相对数,从而能用以比较平均指标水平不同或经济现象(计量单位)不同的总体的标志变异程度。53平均差系数平均差系数 例如:A,B两组各含有

28、五个企业某月的销售收入(万元)资料:A组:161,163,165,167,169B组:73, 74, 75, 76, 77A组的平均差比B组大,但平均差系数比B组小。正确的结论是:A组各企业间销售收入的差异程度较小,而且A组的平均指标的代表性较大。54平均差和平均差系数计算结果见下表(表4-13):企业 平均销售收入(万元)X 平均差(万元)A.D. 平均差系数V A.D.A.D. X A组 1652.41.45B组 751.21.655标准差标准差. (X-XA)2 S.D = N 例如:A,B两组各有8个消费者年消费支出(百元)资料:A组:26,29,33,37,41,44,49,53B组

29、:35,36,37,38,40,41,42,43见下表(表4-14):两组平均数均为两组平均数均为39(百(百元),且计量单位相同故可将两组比较。结论:元),且计量单位相同故可将两组比较。结论:A组的平均指标的代表性比组的平均指标的代表性比B组小,组小,56A组(平均数39)B组(平均数39)开支 离差 差方支出 离差 差方2613 169 354 162910 100 363 933636 372 43724 381141 2 440 1 144 525 41 244910 100 42 3 953 14 19643 4 16合计合计312 0 634312 0 6057标准差系数标准差系数是标准差与相应的平均指标对比而得到的平均数值。与平均差一样,标准差也反映标志变异程度的绝对指标,它受标志值的差异程度和平均指标两个因素影响。对于标志值平均水平不同,或不同现象,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论