第9章-调查资料的统计分析_第1页
第9章-调查资料的统计分析_第2页
第9章-调查资料的统计分析_第3页
第9章-调查资料的统计分析_第4页
第9章-调查资料的统计分析_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第九章 调查资料的统计分析 市场调研市场调研 教学目的 了解各种资料分析方法的基本原理,了解各种资料分析方法的基本原理,能针对具体调查项目和资料要求选择恰当能针对具体调查项目和资料要求选择恰当的分析方法,掌握初级统计分析方法和假的分析方法,掌握初级统计分析方法和假设检验的基本运用,对高级统计研究方法设检验的基本运用,对高级统计研究方法有一定了解。有一定了解。 2 市场调研市场调研 第一节第一节 统计分析概述统计分析概述第一节第一节 统计分析概统计分析概述述资料的统计分析资料的统计分析 运用数理统计方法,对调查所得数据资料运用数理统计方法,对调查所得数据资料进行定量分析,以揭示事物内在的数量关

2、系、进行定量分析,以揭示事物内在的数量关系、规律和发展趋势。规律和发展趋势。3 市场调研市场调研 第一节第一节 统计分析概述统计分析概述一、统计分析的作用一、统计分析的作用统计分析是进行科学预测未来的重要方法。统计分析是进行科学预测未来的重要方法。对变量关系进行深入分析,通过样本推论总体。对变量关系进行深入分析,通过样本推论总体。统计分析为研究提供一种清晰精确的形式化语统计分析为研究提供一种清晰精确的形式化语言,对原始资料进行简化和描述。言,对原始资料进行简化和描述。例:例:Y=4.38-0.16X4 市场调研市场调研 第一节第一节 统计分析概述统计分析概述二、统计分析类型二、统计分析类型类型

3、类型说明说明举例举例统计方法统计方法数据压缩数据压缩描述典型的被访问者,描述典型的被访问者,描述回答类似程度描述回答类似程度均值、中值、众均值、中值、众值、频率、标准值、频率、标准差、交叉列表差、交叉列表推断推断决定总体参数,决定总体参数,检验假设检验假设估计总体值估计总体值标准误差、零假标准误差、零假设设差别差别确定组与组之间确定组与组之间是否存在差异是否存在差异估计一个样本中两组均估计一个样本中两组均值差异值差异差别的差别的 t 检验、检验、方差分析方差分析相关相关确定联系确定联系确定两个变量是否在确定两个变量是否在系统状态下相关系统状态下相关相关分析相关分析预测预测以统计模型为以统计模型

4、为基础的预测基础的预测给出给出X的数量,估计的数量,估计Y的水平的水平时间序列、回归时间序列、回归分析分析描述描述5 市场调研市场调研 第一节第一节 统计分析概述统计分析概述1 1、描述统计:、描述统计:能够直接统计出数据结果,在分析过程的早能够直接统计出数据结果,在分析过程的早期经常用到,是后续分析的基础;期经常用到,是后续分析的基础;2 2、推断统计:、推断统计:在样本信息的基础上估计总体值;在样本信息的基础上估计总体值;3 3、差别统计:、差别统计:确定总体中真实存在的总的差异程度;确定总体中真实存在的总的差异程度;4 4、相关分析:、相关分析:审查两个(自)变量是否相关和如何相关;审查

5、两个(自)变量是否相关和如何相关;5 5、预测分析:、预测分析:帮助研究者对未来事件进行预测。帮助研究者对未来事件进行预测。6 市场调研市场调研 第一节第一节 统计分析概述统计分析概述三、统计方法的选择三、统计方法的选择1 1、研究问题的性质、研究问题的性质单变量分析:单变量分析:对单一事物状况的分析。常采用频率对单一事物状况的分析。常采用频率分析、均值。分析、均值。双变量分析:双变量分析:对两个变量之间有无关系,以及关系对两个变量之间有无关系,以及关系程度的分析,分为相关关系和因果关系。常采用交程度的分析,分为相关关系和因果关系。常采用交叉列表、相关分析、方差分析或回归分析。叉列表、相关分析

6、、方差分析或回归分析。7 市场调研市场调研 第一节第一节 统计分析概述统计分析概述2 2、数据资料的性质、数据资料的性质定性资料:定性资料:本身不具有可以测量的数值单位,仅根据本身不具有可以测量的数值单位,仅根据一项或几项所描述的特质加以区分的资料。一般采取一项或几项所描述的特质加以区分的资料。一般采取频率分析。频率分析。定量资料:定量资料:本身具有可以测量的数值单位,可以根据本身具有可以测量的数值单位,可以根据变量值连续排列的资料。可采用描述统计、相关分析、变量值连续排列的资料。可采用描述统计、相关分析、回归分析、因子分析、方差分析等所有统计方法。回归分析、因子分析、方差分析等所有统计方法。

7、8第二节第二节 描述统计分析描述统计分析 市场调研市场调研 第二节第二节 描述统计分析描述统计分析1、频数分布:、频数分布:将变量的值按照一定的类别、顺序和将变量的值按照一定的类别、顺序和距离划分成若干组,然后各组出现的次数记录下来,距离划分成若干组,然后各组出现的次数记录下来,构成频数分布。构成频数分布。地点地点1超市超市2百货店百货店3专卖店专卖店4其他其他频数频数2432524641总计总计555一、数据的集中趋势分析一、数据的集中趋势分析9 市场调研市场调研 第二节第二节 描述统计分析描述统计分析2、众数:、众数:在众多数值中,出现次数最多的一个数值。在众多数值中,出现次数最多的一个数

8、值。常用于取值较多的类别变量。常用于取值较多的类别变量。例:例:2,3,5,5,5,6,6,7,9,2,5,5,5,6在上面的数字中,出现次数最多的数是:在上面的数字中,出现次数最多的数是:5例:例:食品(食品(40%),日用品(),日用品(25%)化妆品(化妆品(15%),服装(),服装(20%)众数是:食品众数是:食品10 市场调研市场调研 第二节第二节 描述统计分析描述统计分析3、中位数:、中位数:按大小顺序排列,处在一群数据中央位置按大小顺序排列,处在一群数据中央位置的数值。的数值。常用于顺序变量。常用于顺序变量。例:例:47,42,50,92,68,112,71,83,108中央位置

9、是:中央位置是:(N+1)/2例:例:47,42,50,92, 68, 112,83,108先作大小排列,求出中央位置:先作大小排列,求出中央位置:N/2, (N/2) +1所对应的那两个数的平均数即为中位数所对应的那两个数的平均数即为中位数11 市场调研市场调研 第二节第二节 描述统计分析描述统计分析4、平均数:、平均数:也称均值。一群数值的总和除以个体数也称均值。一群数值的总和除以个体数目所得的结果。目所得的结果。常用于等距变量和等比变量。常用于等距变量和等比变量。 平均数的资料利用率比较高,被认为是最佳集中平均数的资料利用率比较高,被认为是最佳集中趋势度量值。但非常敏感。趋势度量值。但非

10、常敏感。12 市场调研市场调研 第二节第二节 描述统计分析描述统计分析例如:例如:甲组:甲组:80,80,80,80,80。 X=80乙组:乙组:40,40,80,120,120。X=80丙组:丙组:2,18,25,96,259。X=80离散程度:离散程度:表示变量不同取值的差异情况,测量的表示变量不同取值的差异情况,测量的是数值的离散趋势。是数值的离散趋势。二、数据的离散程度分析二、数据的离散程度分析13 市场调研市场调研 第二节第二节 描述统计分析描述统计分析1、异众比率:、异众比率:非众值次数与全部个体总数的比率。非众值次数与全部个体总数的比率。常用于类别量表。常用于类别量表。例例来源来

11、源城市城市农村农村郊区郊区生物系生物系化学系化学系50135295总数总数480110152288550异众比率异众比率 (50+135)/480 (110+152)/55014 市场调研市场调研 第二节第二节 描述统计分析描述统计分析2、极差或四分位差:、极差或四分位差:最大数值与最小数值之差。最大数值与最小数值之差。常用于等距量表和等比量表。常用于等距量表和等比量表。30 54 63 86 110极差极差 = 110-30= 110-30四分位差四分位差 = 86-54= 86-5415 市场调研市场调研 第二节第二节 描述统计分析描述统计分析3、标准差:、标准差:一组数值与其平均数之差的

12、平方和,一组数值与其平均数之差的平方和,除以数值个数所得的平方根。除以数值个数所得的平方根。常用于等距量表和等常用于等距量表和等比量表。比量表。63,50,46,37,34,28,25,22。平均值平均值=41,则标准差,则标准差=?16 市场调研市场调研 第二节第二节 描述统计分析描述统计分析三、数据的频率分布分析三、数据的频率分布分析家庭汽车数量家庭汽车数量家庭数家庭数12375232合计合计100(一)单因素列表分析(一)单因素列表分析17 市场调研市场调研 第二节第二节 描述统计分析描述统计分析家庭拥有车辆数家庭拥有车辆数频数频数汽车保有量汽车保有量1237523275466合计合计1

13、0012718 市场调研市场调研 第二节第二节 描述统计分析描述统计分析收入(百美圆)收入(百美圆)家庭数家庭数家庭数比率(家庭数比率(%)135以下以下135-155155-17532328合计合计100100175-195195-215215-235235-255255-275275-295295-554554以上以上1474662613232814746626119 市场调研市场调研 第二节第二节 描述统计分析描述统计分析同时有两个变量参加交叉分组的频数分布表。同时有两个变量参加交叉分组的频数分布表。(二)双因素列表分析(二)双因素列表分析汽车保有量汽车保有量一辆以内一辆以内家庭收入与汽

14、车保有量交叉分组频数家庭收入与汽车保有量交叉分组频数低收入低收入高收入高收入合计合计一辆以上一辆以上合计合计家庭收入家庭收入7525544610020 市场调研市场调研 第二节第二节 描述统计分析描述统计分析低收入低收入高收入高收入合计合计一辆以内一辆以内一辆以上一辆以上合计合计家庭收入家庭收入汽车保有量汽车保有量4875255446100家庭收入与汽车保有量交叉分组频数家庭收入与汽车保有量交叉分组频数同时有两个变量参加交叉分组的频数分布表。同时有两个变量参加交叉分组的频数分布表。21 市场调研市场调研 第二节第二节 描述统计分析描述统计分析一辆以内一辆以内家庭收入与汽车保有量交叉分组频数家庭

15、收入与汽车保有量交叉分组频数低收入低收入高收入高收入合计合计一辆以上一辆以上合计合计家庭收入家庭收入75255446100同时有两个变量参加交叉分组的频数分布表。同时有两个变量参加交叉分组的频数分布表。622 市场调研市场调研 第二节第二节 描述统计分析描述统计分析同时有两个变量参加交叉分组的频数分布表。同时有两个变量参加交叉分组的频数分布表。一辆以内一辆以内家庭收入与汽车保有量交叉分组频数家庭收入与汽车保有量交叉分组频数低收入低收入高收入高收入合计合计一辆以上一辆以上合计合计家庭收入家庭收入752554461002723 市场调研市场调研 第二节第二节 描述统计分析描述统计分析同时有两个变量

16、参加交叉分组的频数分布表。同时有两个变量参加交叉分组的频数分布表。一辆以内一辆以内家庭收入与汽车保有量交叉分组频数家庭收入与汽车保有量交叉分组频数低收入低收入高收入高收入合计合计一辆以上一辆以上合计合计家庭收入家庭收入752554461001924 市场调研市场调研 第二节第二节 描述统计分析描述统计分析同时有两个变量参加交叉分组的频数分布表。同时有两个变量参加交叉分组的频数分布表。一辆以内一辆以内家庭收入与汽车保有量交叉分组频数家庭收入与汽车保有量交叉分组频数低收入低收入高收入高收入合计合计一辆以上一辆以上合计合计家庭收入家庭收入75255446100482761925 市场调研市场调研 第

17、二节第二节 描述统计分析描述统计分析低收入低收入高收入高收入一辆以内一辆以内一辆以上一辆以上合计合计家庭收入家庭收入汽车保有量汽车保有量89%59%11%41%100%100%个案数个案数5446家庭收入与汽车保有量交叉分组家庭收入与汽车保有量交叉分组行行百分比百分比低收入低收入高收入高收入一辆以内一辆以内一辆以上一辆以上家庭收入家庭收入汽车保有量汽车保有量64%36%24%76% 家庭收入与汽车保有量交叉分组家庭收入与汽车保有量交叉分组列列百分比百分比合计合计个案数个案数100%100%752526 市场调研市场调研 第二节第二节 描述统计分析描述统计分析 将其中一个自变量稳定在一个取值上,

18、对另一个自变量将其中一个自变量稳定在一个取值上,对另一个自变量和因变量作双向交叉分组;再将第一个自变量稳定在下一个和因变量作双向交叉分组;再将第一个自变量稳定在下一个取值上,作另外两个变量的交叉分组,依次类推,直至穷尽取值上,作另外两个变量的交叉分组,依次类推,直至穷尽第一个变量的所有取值。第一个变量的所有取值。家庭规模四口以内四口以上全部家庭一辆以内一辆以上合计一辆以内一辆以上合计一辆以内一辆以上合计低高收入水平4426264632合计708784141381451722482761954467525100家庭收入、家庭规模与汽车保有量交叉分组频数家庭收入、家庭规模与汽车保有量交叉分组频数(

19、三)三因素列表分析(三)三因素列表分析27 市场调研市场调研 第二节第二节 描述统计分析描述统计分析 将其中一个自变量稳定在一个取值上,对另一个自变量将其中一个自变量稳定在一个取值上,对另一个自变量和因变量作双向交叉分组;再将第一个自变量稳定在下一个和因变量作双向交叉分组;再将第一个自变量稳定在下一个取值上,作另外两个变量的交叉分组,依次类推,直至穷尽取值上,作另外两个变量的交叉分组,依次类推,直至穷尽第一个变量的所有取值。第一个变量的所有取值。家庭规模四口以内四口以上全部家庭一辆以内一辆以上合计一辆以内一辆以上合计低高收入水平4141381451722482761954467525100家庭

20、收入、家庭规模与汽车保有量交叉分组频数家庭收入、家庭规模与汽车保有量交叉分组频数(三)三因素列表分析(三)三因素列表分析合计一辆以内一辆以上合计44262646327087828 市场调研市场调研 第二节第二节 描述统计分析描述统计分析 将其中一个自变量稳定在一个取值上,对另一个自变量将其中一个自变量稳定在一个取值上,对另一个自变量和因变量作双向交叉分组;再将第一个自变量稳定在下一个和因变量作双向交叉分组;再将第一个自变量稳定在下一个取值上,作另外两个变量的交叉分组,依次类推,直至穷尽取值上,作另外两个变量的交叉分组,依次类推,直至穷尽第一个变量的所有取值。第一个变量的所有取值。家庭规模四口以

21、内四口以上全部家庭一辆以内一辆以上合计一辆以内一辆以上合计低高收入水平442626463270878482761954467525100家庭收入、家庭规模与汽车保有量交叉分组频数家庭收入、家庭规模与汽车保有量交叉分组频数(三)三因素列表分析(三)三因素列表分析合计一辆以内一辆以上合计414138145172229 市场调研市场调研 第二节第二节 描述统计分析描述统计分析 将其中一个自变量稳定在一个取值上,对另一个自变量将其中一个自变量稳定在一个取值上,对另一个自变量和因变量作双向交叉分组;再将第一个自变量稳定在下一个和因变量作双向交叉分组;再将第一个自变量稳定在下一个取值上,作另外两个变量的交

22、叉分组,依次类推,直至穷尽取值上,作另外两个变量的交叉分组,依次类推,直至穷尽第一个变量的所有取值。第一个变量的所有取值。家庭规模四口以内四口以上全部家庭一辆以内一辆以上合计一辆以内一辆以上合计低高收入水平4426264632708784141381451722482761954467525家庭收入、家庭规模与汽车保有量交叉分组频数家庭收入、家庭规模与汽车保有量交叉分组频数(三)三因素列表分析(三)三因素列表分析一辆以内一辆以上合计合计10030 市场调研市场调研 第二节第二节 描述统计分析描述统计分析 将其中一个自变量稳定在一个取值上,对另一个自变量将其中一个自变量稳定在一个取值上,对另一个

23、自变量和因变量作双向交叉分组;再将第一个自变量稳定在下一个和因变量作双向交叉分组;再将第一个自变量稳定在下一个取值上,作另外两个变量的交叉分组,依次类推,直至穷尽取值上,作另外两个变量的交叉分组,依次类推,直至穷尽第一个变量的所有取值。第一个变量的所有取值。(三)三因素列表分析(三)三因素列表分析家庭规模四口以内四口以上全部家庭低高收入水平414131451722482761954467525家庭收入、家庭规模与汽车保有量交叉分组频数家庭收入、家庭规模与汽车保有量交叉分组频数一辆一辆以内以内一辆一辆以上以上合计合计4426264632合计合计70878一辆一辆以内以内一辆一辆以上以上合计合计一

24、辆一辆以内以内一辆一辆以上以上合计合计100831 市场调研市场调研 第二节第二节 描述统计分析描述统计分析结论:在收入水平相同的情况下,家庭规模对汽车保有结论:在收入水平相同的情况下,家庭规模对汽车保有量有不同的影响。量有不同的影响。家庭规模家庭规模四口以内四口以内四口以上四口以上全部家庭全部家庭一辆一辆以内以内一辆一辆以上以上合计合计一辆一辆以内以内一辆一辆以上以上合计合计一辆一辆以内以内一辆一辆以上以上合计合计96%81%家庭收入、家庭规模与汽车保有量交叉分组百分比家庭收入、家庭规模与汽车保有量交叉分组百分比4%19%100%100%(46)(32)50%7%50%93%100%100%

25、(8)(14)89%59%11%41%100%100%(46)32 市场调研市场调研 第二节第二节 描述统计分析描述统计分析家庭收入、家庭规模与汽车保有量交叉分组百分比家庭收入、家庭规模与汽车保有量交叉分组百分比家庭规模家庭规模四口以内四口以内四口以上四口以上全部家庭全部家庭一辆一辆以内以内一辆一辆以上以上合计合计一辆一辆以内以内一辆一辆以上以上合计合计一辆一辆以内以内一辆一辆以上以上合计合计低低高高收收入入水水平平96%4%4%19%100%100%(46)(32)50%7%50%93%100%100%(8)(14)89%11%11%41%100%100%(54)(46)结论:在家庭规模相同

26、的情况下,收入对汽车保有量有结论:在家庭规模相同的情况下,收入对汽车保有量有不同的影响。不同的影响。33 市场调研市场调研 第二节第二节 描述统计分析描述统计分析四口以内(四口以内(78)四口以上(四口以上(22)家庭收入家庭收入家庭规模家庭规模4%19%50%93%合计合计11%41%简表:按家庭收入与家庭规模交叉分组的简表:按家庭收入与家庭规模交叉分组的拥有拥有1辆以上辆以上汽车的家庭百分比汽车的家庭百分比结论:对不同规模的家庭综合起来考虑,收入水平的提升结论:对不同规模的家庭综合起来考虑,收入水平的提升将使某户拥有一辆以上汽车的机会增加将使某户拥有一辆以上汽车的机会增加21%(0.15*

27、78+0.43*22)/(78+22)= 0.21低收入(低收入(54)高收入(高收入(46)34 市场调研市场调研 第二节第二节 描述统计分析描述统计分析低收入(低收入(54)高收入(高收入(46)四口以内(四口以内(78)四口以上(四口以上(22)家庭收入家庭收入家庭规模家庭规模4%19%50%93%合计合计11%41%简表:按家庭收入与家庭规模交叉分组的简表:按家庭收入与家庭规模交叉分组的拥有拥有1辆以上辆以上汽车的家庭百分比汽车的家庭百分比结论:对不同的收入水平综合起来考虑,家庭规模的扩结论:对不同的收入水平综合起来考虑,家庭规模的扩大将使某户拥有一辆以上汽车的机会增加大将使某户拥有一

28、辆以上汽车的机会增加59%(0.46*54+0.74*46)/(54+46)= 0.5935 市场调研市场调研 第二节第二节 描述统计分析描述统计分析例一:例一:家庭规模家庭规模介入家庭收入与拥有一辆以上汽车的关系介入家庭收入与拥有一辆以上汽车的关系低收入(低收入(54)高收入(高收入(46)四口以内(四口以内(78)四口以上(四口以上(22)家庭收入家庭收入家庭规模家庭规模4%19%50%93%合计合计11%41%按家庭收入与按家庭收入与家庭规模家庭规模交叉分组的交叉分组的拥有拥有1辆以上汽车的家庭百分比辆以上汽车的家庭百分比结论:引入第三变量后,原结论得到加强(或减弱)结论:引入第三变量后

29、,原结论得到加强(或减弱)(四)变量关系详析(四)变量关系详析36 市场调研市场调研 第二节第二节 描述统计分析描述统计分析例二:例二:居住区域居住区域介入价值取向与拥有旅行车之间的关系介入价值取向与拥有旅行车之间的关系自由主义自由主义是是否否价值取向价值取向是否拥有旅行车是否拥有旅行车9(16%)合计合计价值取向与旅行车拥有状况价值取向与旅行车拥有状况保守主义保守主义11(24%)46(84%)34(76%)55(100%)45(100%)自由主义自由主义北方北方南方南方价值取向价值取向居住区域居住区域5%全体全体价值取向、价值取向、居住区域居住区域与旅行车拥有状况与旅行车拥有状况保守主义保

30、守主义5%41%43%16%24%37 市场调研市场调研 第二节第二节 描述统计分析描述统计分析价值取向、价值取向、居住区域居住区域与旅行车拥有状况与旅行车拥有状况结论:对不同的价值取向综合起来考虑,居住区域的改变将结论:对不同的价值取向综合起来考虑,居住区域的改变将使某户拥有旅行车的机会增加使某户拥有旅行车的机会增加37%。(0.36*55+0.38*45)/(45+55)= 0.37结论:居住区域与旅行车拥有状况有关系,而价值取结论:居住区域与旅行车拥有状况有关系,而价值取向与之无关系。向与之无关系。例二:居住区域介入价值取向与拥有旅行车之间的关系例二:居住区域介入价值取向与拥有旅行车之间

31、的关系自由主义(自由主义(55)北方(北方(61)南方(南方(39)价值取向价值取向居住区域居住区域5%全体全体保守主义(保守主义(45)5%41%43%16%24%38 市场调研市场调研 第二节第二节 描述统计分析描述统计分析价值取向、价值取向、居住区域居住区域与旅行车拥有状况与旅行车拥有状况例二:例二:居住区域居住区域介入价值取向与拥有旅行车之间的关系介入价值取向与拥有旅行车之间的关系自由主义(自由主义(55)北方(北方(61)南方(南方(39)价值取向价值取向居住区域居住区域5%全体全体保守主义(保守主义(45)5%41%43%16%24%结论:引入第三变量后,证明原来的关系是虚假的。结

32、论:引入第三变量后,证明原来的关系是虚假的。南方人倾向保守主义南方人倾向保守主义南方人拥有旅行车多南方人拥有旅行车多保守主义拥有旅行车多保守主义拥有旅行车多39 市场调研市场调研 第二节第二节 描述统计分析描述统计分析四口以内四口以内是是否否家庭规模家庭规模是否拥有外国经济车是否拥有外国经济车6(8%)合计合计家庭规模与外国经济车拥有状况家庭规模与外国经济车拥有状况四口以上四口以上6(27%)72(92%)16(73%)78(100%)22(100%)例三:例三:汽车保有量汽车保有量介入家庭规模与拥有外国经济车之间的关系介入家庭规模与拥有外国经济车之间的关系四口以内四口以内一辆以内一辆以内一辆

33、以上一辆以上家庭规模家庭规模汽车保有量汽车保有量6%全体全体家庭规模、家庭规模、汽车保有量汽车保有量与外国经济车拥有状况与外国经济车拥有状况四口以上四口以上0%25%35%8%27%40 市场调研市场调研 第二节第二节 描述统计分析描述统计分析四口以内(四口以内(78)一辆以内一辆以内一辆以上一辆以上家庭规模家庭规模汽车保有量汽车保有量6%全体全体家庭规模、家庭规模、汽车保有量汽车保有量与外国经济车拥有状况与外国经济车拥有状况四口以上(四口以上(22)0%25%35%8%27%结论:大家庭结论:大家庭必须拥有一辆以上的汽车时,必须拥有一辆以上的汽车时,才比小家庭更可才比小家庭更可能拥有外国经济

34、车。能拥有外国经济车。结论:引入第三变量后,原来的结论受到一个条件的限结论:引入第三变量后,原来的结论受到一个条件的限制。制。例三:例三:汽车保有量汽车保有量介入家庭规模与拥有外国经济车之间的关系介入家庭规模与拥有外国经济车之间的关系41 市场调研市场调研 第二节第二节 描述统计分析描述统计分析四口以内四口以内是是否否家庭规模家庭规模是否拥有客货两用车是否拥有客货两用车3(4%)合计合计家庭规模与客货两用车拥有状况家庭规模与客货两用车拥有状况四口以上四口以上15(68%)75(96%)7(32%)例四:例四:收入水平收入水平介入家庭规模与拥有客货两用车之间的关系介入家庭规模与拥有客货两用车之间

35、的关系四口以内四口以内低低高高家庭规模家庭规模收入水平收入水平4%全体全体家庭规模、家庭规模、收入水平收入水平与客货两用车拥有状况与客货两用车拥有状况四口以上四口以上63%3%71%4%68%42 市场调研市场调研 第二节第二节 描述统计分析描述统计分析例四:例四:收入水平收入水平介入家庭规模与拥有客货两用车之间的关系介入家庭规模与拥有客货两用车之间的关系四口以内(四口以内(78)低低高高家庭规模家庭规模收入水平收入水平4%全体全体家庭规模、家庭规模、收入水平收入水平与客货两用车拥有状况与客货两用车拥有状况四口以上(四口以上(22)63%3%71%4%68%结论:大家庭倾向于拥有客货两用车;而

36、且随着收入水平结论:大家庭倾向于拥有客货两用车;而且随着收入水平的提升,高收入的大家庭更倾向于拥有客货两用车。的提升,高收入的大家庭更倾向于拥有客货两用车。结论:引入收入水平(第三变量)后,原来的结论得到结论:引入收入水平(第三变量)后,原来的结论得到继续支持。继续支持。43 市场调研市场调研 第二节第二节 描述统计分析描述统计分析总结:总结: 初始结论认为自变量与因变量之间存在某种初始结论认为自变量与因变量之间存在某种关系,引入第三变量后,可能导致以下几种结论:关系,引入第三变量后,可能导致以下几种结论: 继续支持初始结论继续支持初始结论完全或基本相同,如例四完全或基本相同,如例四 初始结论

37、提出的关系减弱(或加强)初始结论提出的关系减弱(或加强)普遍有所普遍有所变化,如例一变化,如例一 初始结论被认为是有条件的关系存在初始结论被认为是有条件的关系存在有部分变有部分变化,如例三化,如例三 初始结论被认为是虚假关系初始结论被认为是虚假关系完全不同,如例二完全不同,如例二44 市场调研市场调研 第二节第二节 描述统计分析描述统计分析例五:例五:收入水平收入水平介入户主受教育程度与是否使用信贷购车之介入户主受教育程度与是否使用信贷购车之间的关系间的关系高中以下高中以下是是否否户主受教户主受教育程度育程度是否使用信贷购车是否使用信贷购车24(30%)合计合计户主受教育程度与使用信贷购车状况

38、户主受教育程度与使用信贷购车状况大专以上大专以上6(30%)56(70%)14(70%)80(100%)20(100%)低低高高收入水平收入水平12%全体全体户主受教育程度、户主受教育程度、收入水平收入水平与使用信贷购车状况与使用信贷购车状况40%58%27%30%30%高中以下高中以下户主受教户主受教育程度育程度大专以上大专以上45 市场调研市场调研 第二节第二节 描述统计分析描述统计分析低低高高收入水平收入水平12%全体全体户主受教育程度、户主受教育程度、收入水平收入水平与使用信贷购车状况与使用信贷购车状况40%58%27%30%30%户主受教户主受教育程度育程度大专以上大专以上结论:结论

39、:低学历高收入低学历高收入和和高学历低收入高学历低收入倾向于使用信贷购车。倾向于使用信贷购车。高中以下高中以下结论:引入第三变量后,原来没有关系的受教育程度与结论:引入第三变量后,原来没有关系的受教育程度与使用信贷购车之间,变得存在相当程度的关系。使用信贷购车之间,变得存在相当程度的关系。例五:例五:收入水平收入水平介入户主受教育程度与是否使用信贷购车之间的关系介入户主受教育程度与是否使用信贷购车之间的关系46 市场调研市场调研 第二节第二节 描述统计分析描述统计分析北方北方是是否否居住区域居住区域是否拥有客货两用车是否拥有客货两用车11(18%)合计合计居住区域与客货两用车拥有状况居住区域与

40、客货两用车拥有状况南方南方7(18%)49(82%)33(82%)60(100%)40(100%)四口以内四口以内四口以上四口以上4%全体全体居住区域、居住区域、家庭规模家庭规模与拥有客货两用车状况与拥有客货两用车状况3%69%67%18%18%北方北方居住区域居住区域南方南方家庭规模家庭规模例六:例六:家庭规模家庭规模介入居住区域与客货两用车拥有状况之间的关系介入居住区域与客货两用车拥有状况之间的关系47 市场调研市场调研 第二节第二节 描述统计分析描述统计分析四口以内四口以内四口以上四口以上4%全体全体3%69%67%18%18%北方北方居住区域居住区域南方南方家庭规模家庭规模结论:居住区

41、域对拥有客货两用车没有影响,起作用的是家庭结论:居住区域对拥有客货两用车没有影响,起作用的是家庭规模这个因素。规模这个因素。结论:引入家庭规模(第三变量)后,再次肯定了初始结论:引入家庭规模(第三变量)后,再次肯定了初始结论。结论。居住区域、居住区域、家庭规模家庭规模与拥有客货两用车状况与拥有客货两用车状况例六:例六:家庭规模家庭规模介入居住区域与客货两用车拥有状况之间的关系介入居住区域与客货两用车拥有状况之间的关系48 市场调研市场调研 第二节第二节 描述统计分析描述统计分析总结:总结: 初始结论认为两变量之间没有关系,引入初始结论认为两变量之间没有关系,引入第三变量后,可能导致以下几种结论

42、:第三变量后,可能导致以下几种结论: 继续支持初始结论继续支持初始结论完全相同,如例六完全相同,如例六 揭示了全面关系的存在揭示了全面关系的存在完全不同,如例五完全不同,如例五 揭示了有条件的关系存在揭示了有条件的关系存在部分不同部分不同49 市场调研市场调研 第三节第三节 推论统计分析推论统计分析第三节第三节 推论统计分析推论统计分析一、推论统计的概念一、推论统计的概念 所谓推论统计,是指通过样本统计值来估计总体参数所谓推论统计,是指通过样本统计值来估计总体参数值的统计分析技术。值的统计分析技术。 推论统计主要包括参数估计和假设检验两大类。推论统计主要包括参数估计和假设检验两大类。50 市场

43、调研市场调研 第三节第三节 推论统计分析推论统计分析二、参数估计二、参数估计 所谓参数估计,就是根据一个随机样本的统计值来所谓参数估计,就是根据一个随机样本的统计值来估计总体参数值是多少。有点估计和区间估计两种方法。估计总体参数值是多少。有点估计和区间估计两种方法。1 1、点估计、点估计 就是以一个最恰当的样本统计值来代表总体的参数值。例: 我们要想知道某地区青年人的收入水平,可以从该地区抽取一个由若干青年人组成的样本,并计算全部样本月收入的均值是1500元/月。我们可以据此推知,该地区青年人的月收入水平就是1500元。51 市场调研市场调研 第三节第三节 推论统计分析推论统计分析2 2、区间

44、估计、区间估计 就是以两个数值之间的间距(置信区间)来估计总体的参就是以两个数值之间的间距(置信区间)来估计总体的参数值。置信区间的大小与置信度成正比,与显著性水平成反比。数值。置信区间的大小与置信度成正比,与显著性水平成反比。均值区间估计的计算公式:均值区间估计的计算公式:比例区间估计的计算公式:比例区间估计的计算公式: ()SXZn(1)PPPZn52 市场调研市场调研 第三节第三节 推论统计分析推论统计分析例例1: 我们在某地区抽取了由青年人构成的样本,样本量为我们在某地区抽取了由青年人构成的样本,样本量为225人,均值为人,均值为1500元,标准差为元,标准差为105元。在置信度为元。

45、在置信度为95%的水平下,请对该地区青年人的收入水平进行估计。的水平下,请对该地区青年人的收入水平进行估计。即,我们的估计是:该地区青年人的平均收入水平是介于即,我们的估计是:该地区青年人的平均收入水平是介于1486.28和和1513.72元元/月之间。这个估计的可信度为月之间。这个估计的可信度为95%,即,即只有只有5%的犯错可能性。的犯错可能性。 1051500 1.96()2251486.281513.72X53 市场调研市场调研 第三节第三节 推论统计分析推论统计分析例例2: 我们要估计某城镇有多少家庭是夫妻不和的。从一个我们要估计某城镇有多少家庭是夫妻不和的。从一个随机样本(随机样本

46、(n=100)中知道有)中知道有20%的家庭不和。在置信度为的家庭不和。在置信度为95%的水平下,请对该城镇家庭进行估计。的水平下,请对该城镇家庭进行估计。即,我们的估计是:该城镇夫妻不和的比例介于即,我们的估计是:该城镇夫妻不和的比例介于12%和和28%之间。这个估计的可信度为之间。这个估计的可信度为95%,即只有,即只有5%的犯错可的犯错可能性。能性。 0.2 (1 0.2)0.2 1.961000.120.28P54 市场调研市场调研 第三节第三节 推论统计分析推论统计分析三、假设检验三、假设检验 所谓假设检验,就是对未知总体先做出某种假设,所谓假设检验,就是对未知总体先做出某种假设,选

47、取适当样本,根据样本观察到的数据来检验原假设是选取适当样本,根据样本观察到的数据来检验原假设是否正确,以决定是接受还是拒绝原假设的的统计分析技否正确,以决定是接受还是拒绝原假设的的统计分析技术。假设检验分为参数假设检验和非参数假设检验。术。假设检验分为参数假设检验和非参数假设检验。 55 市场调研市场调研 第三节第三节 推论统计分析推论统计分析1 1、假设检验的基本概念、假设检验的基本概念(1)零假设与研究假设 研究假设是研究者根据抽样调查资料而做出的尚待证实的假设,用H1表示;零假设是与研究假设相对立的假设,用H0表示 。(2)显著性水平 所谓显著性水平是指两个群体或变量之间的任何差异不是由

48、于处理因素或需要检验的因素引起的,而是由于偶然因素所导致的概率,用 表示。(3)一端检验与两端检验 在检验零假设时,如果否定域在抽样分布的一端称为一端检验;如果否定域在两端称为两端检验。决定选用一端检验还是两端检验取决于假设检验的方向。56 市场调研市场调研 第三节第三节 推论统计分析推论统计分析2 2、平均数的检验、平均数的检验(1)Z检验法例: 某商店对最近完成了对200名顾客的满意度调查,其中一个问题是“请您认为我们店的服务评分”。对该问题答案很好,比较好,一般,比较差,很差的编码分别是5,4,3,2,1。计算本次调查的平均得分为3.4,样本标准差1.9。在显著性水平为0.05的情况下,

49、该商店的经理能否认定该商店的服务水平高于中等水平? 00XXuXuZSSn57 市场调研市场调研 第三节第三节 推论统计分析推论统计分析计算步骤: (1)建立假设; (2)确定显著性水平; (3)计算检验统计量; (4)查表,比较实际值与临界值,并得出结论; 0010:HXuHXu0.053.433.071.9200ZZ1.65Z3.07Z临界临界实际 该商店经理有95%的把握认为该商店服务水平高于中等水平。58 市场调研市场调研 第三节第三节 推论统计分析推论统计分析(2)t检验法例: 某商店上半年测量的顾客流量为4312人/天,10月份从16天构成的随机样本测量的顾客流量为4396人/天,

50、标准差为210人/天。问能否据此认定10月份的顾客流量较上半年为高? 001XXuXuZSSn59 市场调研市场调研 第三节第三节 推论统计分析推论统计分析计算步骤: (1)建立假设; (2)确定显著性水平; (3)计算检验统计量; (4)查表,比较实际值与临界值,并得出结论; 0010:HXuHXu0.05439643121.5521016 1Zt1.753t1.55Z临界临界实际 在0.05的显著性水平下,结果不显著。因此不能认为10月份的顾客流量较上半年高。60 市场调研市场调研 第三节第三节 推论统计分析推论统计分析(3)两个平均数的检验例: 某大学对500名已毕业4年的校友月收入进行

51、调查,其中男校友448人,月平均收入1786元,标准差为29元。女校友52人,月平均收入为1630元,标准差为26元。问在显著性水平为0.05的条件下,能否认为男校友月收入比女校友高? 1212221212()()XXuuZSSnn61 市场调研市场调研 第三节第三节 推论统计分析推论统计分析计算步骤: (1)建立假设; (2)确定显著性水平; (3)计算检验统计量; (4)查表,比较实际值与临界值,并得出结论; 012112:HXXHXX0.05t1.65t40.4Z临界临界实际22(1786 1630)040.4292644852Z 因此我们有95%的把握认为男校友的平均月收入高于女校友。

52、62 市场调研市场调研 第三节第三节 推论统计分析推论统计分析3 3、比例数的检验、比例数的检验(1)Z检验法例: 某地区进行晚婚情况调查,随机抽取初婚女子105人,测得其中42人为达到晚婚年龄后初婚的女子。在0.05的显著性水平下,是否与4年前(晚婚率32%)发生了显著变化? 0000(1)PPPPPZSPPn63 市场调研市场调研 第三节第三节 推论统计分析推论统计分析计算步骤: (1)建立假设; (2)确定显著性水平; (3)计算检验统计量; (4)查表,比较实际值与临界值,并得出结论; 0010:HPPHPP0.05420.31051.760.32 (1 0.32)105ZZ1.96Z

53、1.76Z临界临界实际 我们有95%的把握认为该地区晚婚率与4年前未发生显著变化。64 市场调研市场调研 第三节第三节 推论统计分析推论统计分析(2)两个比例数的检验例: 某企业对拟开发的新产品做了市场调查,样本为1000人,其中300名高收入家庭的人中有16%表示愿意购买,700名来自低收入家庭的人中有14%表示愿意购买。问在0.05的显著性水平下,是否可以认为高收入家庭更愿意购买该新产品? 12112212(1)(1)PPZPPPPnn65 市场调研市场调研 第三节第三节 推论统计分析推论统计分析计算步骤: (1)建立假设; (2)确定显著性水平; (3)计算检验统计量; (4)查表,比较实际值与临界值,并得出结论; 012112:HPPHPP0.05t1.65t0.8Z临界临界实际16% 14%0.816% (1 16%)14% (1 14%)300700Z 因此我们有95%的把握认为家庭收入对人们购买该新产品的意愿没有影响。66 市场调研市场调研 第三节第三节 推论统计分析推论统计分析4 4、相关系数检验、相关系数检验例: 某商店对顾客流量与销售额之间的关系进行研究,并随

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论