市场营销调研第十一讲-描述统计.ppt_第1页
市场营销调研第十一讲-描述统计.ppt_第2页
市场营销调研第十一讲-描述统计.ppt_第3页
市场营销调研第十一讲-描述统计.ppt_第4页
市场营销调研第十一讲-描述统计.ppt_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第12讲 资料的处理与初步分析 数据的处理 数据的描述统计,12.1 数据处理与分析过程,调研数据收集上来之后,调研人员需要做的工作有: 调查数据的编辑 调查数据的编码 调查数据的录入 调查数据的分析 根据分析所得信息回答经营管理问题,12.1 数据的编辑,编辑(数据的审核及净化) 实地编辑 现场编辑:在调查实地,或调查刚刚结束的实话展开的数据审核和净化 主要以复查和追访的方式为主 办公室编辑 后期编辑:对资料中存在的各种问题进行处理 主要是对查出的问题进行处理,12.1数据的编辑,编辑中可能发现的问题 不可能的答案 相互矛盾的答案 不规范或者不符合问卷要求 不完整答案,编辑技巧,无效问卷的剔除 空白卷和缺损问卷 同类卷 不符合要求的人填写 前后有明显的矛盾存在 对关键问题回答缺失,编辑技巧,编辑顺序错乱的回答 编辑“不知道”的回答 将所有“不知道”归为一类,独立记录在一个目录下; 将所有“不知道”答案从统计数据中剔除; 将所有“不知道”按照不同比例分配在其它答案的统计数据中去。 编辑的标注 用不同颜色的笔来编辑,12.2数据的编码,定义:编码就是将数字标度或者其它符号分配给不同答案的过程。 例:相比相同行业的其它公司而言,您的公司是: A)其中规模最大的公司之一; B)属于平均规模; C)规模很小,12.2数据的编码,编码工作的主要内容: 确定变量:对问卷中的每个问题用一个或者几个变量来对应,从而使信息得以识别。 确定变量的值:,12.2数据的编码,编码的基本原则: 首先,编码的类型是应该穷尽的。 其次,编码的类型之间应该是不相关的,相互独立的。,固定选项问题的编码,固定选项问题的编码(封闭性问题) 单选封闭式问题:略 多选封闭式问题: 方法一:设立的变量个数与问题的选项个数一样多,每个变量值取1或者0 方法二:设立变量个数为最多可选的个数 等级顺序量表:与多选问题类似 方法一:变量个数与问题选项个数一样 方法二:设立变量个数上限 注:设计问卷的同时,要考虑到问题的编码,开放式问题的编码,使用开放式问题的原因:调研者对答案可出现的情况并不十分了解 开放式问题的编码步骤: Step1:列出答案(若数据过大,可以抽取一部分); Step2:列出频数分布表; Step3:将频数小的答案尽可能的合并; Step4:为所确定分组选择正式的描述词汇; Step5:对所有问卷中开放式问题进行编码。,12.3数据的插补,插补:解决在审核(编辑)过程中辨别出来的数据缺失、无效、不一致等问题。 插补的具体工作:要改变一些回答,并对审核过程中所发现的缺失信息的记录进行补充或者代替。 插补方法: 推理插补 均值插补:利用平均值来替代 回归插补:利用回归模型 Y=aX+b 热平台插补: 使用当前调查的供者 冷平台插补: 使用其它资料中的供者,描述统计,12.4统计学基本概念 12.5 基本描述统计量 12.6 频数分析 12.7 描述统计,12.4 统计学基本概念,基本概念 总体:要进行统计推断的研究对象的全体。 样本:按照一定方式从总体中抽出一部分个体作为推断依据,这一部分个体就构成样本。 参数:总体所具有的统计数字特征,总体的参数往往未知。 统计量:根据样本观测值得到的统计数字特征,一般用样本统计量估计总体的参数。,12.5 基本描述统计量,功能 反映数据的基本统计特征 分类 描述集中趋势的基本统计量 均值 中位数 众数 总和,12.5 基本描述统计量,分类 描述离散程度的基本统计量 方差 标准差 最小值 最大值 全距,12.5 基本描述统计量,分类 描述分布形态的基本统计量 峰度 偏度,12.5.1 均值Mean,含义 表示某变量所有取值的集中趋势或平均水平; 易受极端值的影响。 数学定义,12.5.2 中位数Median,含义 将一组数据按数值大小依次排序后,处于中间位置上的变量值。 不受极端值的影响。 一般用于描述定序及定序以上测量尺度的变量的集中趋势,对定类变量通常无意义。 数学定义 数据个数为奇数,处于中间位置的那个数。 数据个数为偶数,处于中间位置的那两个数的均值。,12.5.3 众数Mode,含义 一组数据中出现频数最多的变量值。 不受极端值的影响。 适用于任何测量尺度的变量。 可以直接从变量的频数分布表得到。,12.5.4 总和Sum,含义 反映某变量的总体取值。 数学定义,12.5.5 方差Variance,含义 表示某变量所有取值的离散程度,即关于均值的平均离散程度; 易受极端值的影响。 方差越小,观测值越向均值集中。 方差越大,观测值与均值越分散。 数学定义,12.5.6 标准差Std.deviation,含义 表示某变量所有取值的离散程度,即关于均值的平均离散程度。 易受极端值的影响。 标准差越小,观测值越向均值集中。 标准差越大,观测值与均值越分散。 数学定义,12.5.7 最小值、最大值,含义 最小值、最大值可以反映某变量的取值范围。 易受极端值的影响。 符号 最小值:Minimum 最大值:Maximum,12.5.8 全距Range,含义 也称“级差”,是数据的最大值与最小值之间的绝对差; 反映某变量所有取值的离散程度。 易受极端值的影响。 数学定义 Range = Maximum - Minimum,12.5.9 均值标准误差S.E. mean,含义 描述样本均值与总体均值之间的平均差异程度。 符号 S.E. mean:Standard Error of Mean 其他误差统计量 峰度标准误差S.E. of Kurtosis 偏度标准误差S.E. of Skewness,12.5.10 偏度Skewness,含义 刻画数据分布形态; 描述某变量所有取值分布形态的对称性; 绝对值越大,分布形态的偏斜程度越大。 符号 Skewness Skewness = 0: 偏度类似正态分布 Skewness 0: 右偏 Skewness 0: 左偏,12.5.11 峰度Kurtosis,含义 刻画数据分布形态; 描述某变量所有取值分布形态陡缓程度。 符号 Kurtosis Kurtosis =0: 陡缓程度类似正态分布 Kurtosis 0: 比正态分布高峰更陡峭,为尖顶峰 Kurtosis 0: 比正态分布高峰要平坦,为平顶峰,12.6 频数分析,频数分析 描述变量取值的分布特征,通常通过频数分布表来完成。 描述方法 频数(绝对数) 也称频次,变量的每个取值出现的次数。 分位值 频数统计变量在个案的不同百分位点上的取值。 Quartiles四分位数(25、50、75) 自定义n等份 自定义百分点,12.6 频数分析,例:在某城市调查居民当月在外就餐的费用,向1000户家庭发放了问卷,回收了768份问卷。统计结果如下表:,12.6 频数分析,描述方法 百分比(相对数) 频数占总个案数的比例。 有效百分比 频数占有效个案数(不包括缺失值)的比例。 累计百分比 将有效百分比从上到下、依次逐行累加而得到。,12.6 频数分析,描述方法 反映频数分布的统计图 饼形图 多用于描述定类变量的分布 条形图(矩形高度代表频数) 多用于描述定类变量和定序变量的分布 直方图(矩形面积代表频数) 多用于描述定距变量的分布,12.6 频数分析,频数分析过程 打开频数分析对话框 AnalyzeDescriptive StatisticsFrequencies 确定进行频数分析的变量 选择统计分析结果 确定生成图形 确定输出格式 输出频数分布表,12.6 频数分析,实例 对“休闲调查1”中的“文化程度”进行频数分析并输出直方图。,12.7 描述统计,功能 将描述统计的各个统计量作为分析结果输出。 操作过程 打开描述统计对话框 AnalyzeDescriptive StatisticsDescriptives 选择进行描述统计的变量 选择描述统计的内容 输出描述统计表,12.7 描述统计,实例 对“休闲调查1”中的“年龄”、“住房面积”、“家用收入”进行描述统计。,上机实践,主题:单变量的描述统计分析 熟练掌握使用SPSS进行统计分析的操作方法。 练习 SPSS电子教材案例 小组期末社会调研项目 补充练习(下课前提交) 小组项目中期汇报(下次课交流) 主要汇报项目进展情况及阶段性成果,补充练习,某地25例健康男子的血清总胆固醇值测定结果如下。 4.40 4.55

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论