数据分析ppt课件.ppt_第1页
数据分析ppt课件.ppt_第2页
数据分析ppt课件.ppt_第3页
数据分析ppt课件.ppt_第4页
数据分析ppt课件.ppt_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十三章数据分析 1 数据分析概述 2 含义 调查数据分析 也称为数据处理 是利用各种数量分析方法特别是统计分析方法对调查数据进行加工处理 从而挖掘出数量中所包含的事物本身的特性及规律性的过程 3 为什么要进行数据分析 2008年10月我公司光明牌洗衣粉的市场占有率为12 这个牌子的洗衣粉市场占有率是高还是低 它是增长了还是衰退了 和其他牌子相比如何 营销经理 4 为什么要进行数据分析 营销经理 要进行科学的决策我们需要知道 买这种牌子洗衣粉的人群具有什么特征 该洗衣粉与去年相比 市场占有率显著提高了吗 我们的促销手段是否对市场占有率的提升有效果 描述问题 比较问题 分析问题 5 数据分析的基本方法 描述性统计分析 指对被调查总体所有单位的有关数据作搜集 整理和计算综合指标等加工处理 用来描述总体特征的统计分析方法 指对数据变量之间的关系进行分析 主要方法有 统计推断 假设检验 方差分析 相关分析 因子分析等 解析性统计分析 6 数据分析方法的选择 考虑三个方面的问题 一次要分析几个变量 是进行描述性分析还是解析性分析 分析涉及变量都是什么性质的量表测量的 7 描述统计分析 8 内容 集中趋势分析 离散趋势分析 集中趋势 是指一组数据向某一中心值靠拢的倾向 计算刻画集中趋势的描述统计量正是要寻找到能够反映数据一般水平的 代表值 或 中心值 常用统计量 均值 中位数 众数 离散趋势 是指一组数据远离其 中心值 的程度 常用统计量 标准差 方差 全距 四分位数 分布形态 分布形态 考察数据的分布是否对称 常用统计量 偏度 峰度 9 运用SPSS进行描述性分析 内容编制单个变量的频数分布表计算单个变量的描述统计量以及不同分组下的描述统计量编制多变量的交叉频数分布表 并以此分析变量之间的关系数据的多选项分析 10 运用SPSS进行描述性分析 方法数值计算 即计算常见的基本统计量的值 通过数值来准确反映数据的基本统计特征 反映变量统计特征上的差异 图形绘制 即绘制常见的基本统计图形 通过图形来直观展现数据的分析特点 比较数据分析的异同 11 单变量频数分析 目的 了解变量的取值状况 能够在一定程度上反映是否具有总体代表性 抽样是否存在系统偏差等 并以此证明以后相关问题分析的代表性和可性性 方法 构造频数分布表 频数 百分数 有效百分数 累计百分数常用统计图 条形图 饼图 直方图SPSS命令 Analyze DescriptiveStatistics Frequencies 12 描述统计量的计算 目的 进一步准确把握数据的集中趋势和离散趋势等特征 方法 计算平均数 众数 中位数 标准差 方差 全距 四分位数 偏度 峰度等SPSS命令 Analyze DescriptiveStatistics Frequencies 13 交差分组下的频数分析 目的 通过频数分析能够掌握单个变量的数据分布情况 实际分析中 不仅要了解单变量的分布特征 还要分析多变量不同取值下的分布 掌握多变量的联合分布特征 进而分析变量之间的相互影响和关系方法 利用样本数据产生交叉列联表变量是否存在一定的相关性分析SPSS命令 Analyze DescriptiveStatistics Crosstabs 14 多选项问题分析 目的 把握多选项问题的数据特征 方法 多选项二分法多选项分类法SPSS命令 Analyze Multipleresponse案例 电视机品牌满意度调查 15 研究问题某商场对6种品牌的电视机进行消费者满意度调查 让消费者选出最满意的3个电视机品牌 收集到的数据如下表 问题 哪个品牌的满意度最高 性别对电视机品牌的满意度有影响吗 16 解析性统计分析 17 统计推断 统计推断 即用样本推断总体 实质上就是凭借概率理论用观察到的部分随机变量资料来推断总体随机变量的概率分布或数字特征 如期望值和方差等 并且作出具有一定可靠程度的估计和判断 统计推断 参数估计 假设检验 点估计区间估计 参数检验非参数检验 18 参数估计 点估计 是指以样本指标直接替代总体指标的估计值 不考虑误差及可靠程度 对总体指标准确性要求也不高 这种估计方法简单 只要样本代表性大 则点估计的准确性也高 如某地秋收前夕 对水稻亩产进行抽样试割 以样本平均亩产量直接代替该地全部水稻平均亩产 以此估计该地水稻的总产量 19 区间估计 参数估计 根据样本指标和抽样误差去推断总体指标的可能范围 并说明估计总体指标的准确程度和可靠性 SPSS命令 Analyze DescriptiveStatistics Explore 20 假设检验 假设检验是指先对总体提出某项假设 然后利用从总体中抽样所得的样本值来检验所提出的假设是否正确 从而做出接受或拒绝的决策 例 如某冰箱厂 其产品质量一直比较稳定 标准反修率为1 1 但近一段时间却不断听到消费者抱怨其质量下降 为了解冰箱质量问题 随机对其国内36家专卖店及大中型商场专卖柜台的冰箱进行了返修率的调查 得到样本均值为1 14 冰箱质量有问题吗 21 假设检验 假设检验步骤根据实际情况提出原假设H0和备择假设H1选择合适的检验统计量根据样本观察值计算出检验统计量的观察值选定显著水平a 并根据相应统计量的统计分析查出相应的临界值根据统计观察值和临界值 作出接受或拒绝H0的假设 22 假设检验 检验方法 参数检验 非参数检验 T检验Z检验 卡方检验K S检验 假设检验方法 23 目的 是检验某个变量的总体均值和某指定值之间是否存在显著差异 方法 1 提出零假设2 计算检验统计量观察值和相伴概率p3 给出显著水平a并作出决策p a接受零假设 总体均值与指定检验值无差异 反之则反 SPSS命令 Analyze CompareMeans one sampleTtest 单样本T检验 24 两个独立样本T检验 目的 了解两个独立样本之间是否存在显著差异 方法 1 提出零假设2 计算检验统计量观察值和相伴概率p3 给出显著水平a并作出决策第一步 两总体方差是否相等的F检验第二步 两总体均值的检验SPSS命令 Analyze CompareMeans Independent sampleTtest 25 两个配对样本T检验 目的 一般有对于同一研究对象分别给予两种不同处理的效果比较 以及同一研究对象处理前后的效果比较 前者推断两种效果有无差异 后者推断某种处理是否有效 方法 1 提出零假设2 计算检验统计量观察值和相伴概率p3 给出显著水平a并作出决策SPSS命令 Analyze CompareMeans Paired sampleTtest 26 卡方检验 目的 根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异 方法 1 提出零假设2 计算检验统计量观察值和相伴概率p3 给出显著水平a并作出决策SPSS命令 Analyze NonparametricTests Chi square 27 K S检验 目的 根据样本数据的实际频数推断总体分布是否服从某一理分布 正态分布 均匀分布 泊松分布 指数分布等 的方法 方法 1 提出零假设2 计算检验统计量观察值和相伴概率p3 给出显著水平a并作出决策SPSS命令 Analyze NonparametricTests 1 SampleTest 28 方差分析 方差分析是比较若干总体均值是否相同时最常的统计方法 在市场研究中 经常需要考虑某些影响消费者行为的因素 如消费者的年龄 学历 职业 收入水平 消费偏好等 在这些因素中 有的因素影响大些 有的因素影响小些 在现实生活中 往往需要分析哪几种因素对决策起显著性影响 并需知道起显著作用的因素在什么时候发挥最好的作用 方差分析就是解决这类问题的一种有效方法 29 方差分析原理 各总体之间的差异可分为随机误差和系统误差计算三个统计量总误差组间离差平方和 系统误差 组内离差平方和 随机误差 方差分析的实质是将总误差中的随机误差和系统误差加以分离 赋于它们数量表示 并将二者在一定的条件下加以比较 如差异不大则认为系统误差对指标的影响不大 反之 如系统误差较随机误差大得多 则说明所考察的因素影响大得多 30 单因素方差分析 目的 单因素方差分析测试某一个控制变量的不同水平是否给观察变量造成了显著差异和变动 方法 1 计算相关统计量2 进行有效性检验 F检验 3 计算检验统计量观察值和相伴概率p4 给出显著水平a并作出决策SPSS命令 Analyze CompareMeans One WayANOVA 31 问题 某服装公司拟通过市场研究了解不同年龄的消费者对该公司生产的T牌休闲服购买量有无显著性差异 以决定是否细分市场 方法 将调查对象按年龄因素分为老 中 青三个水平 随机调查该公司下辖的五个专卖店在某一时间内不同年龄消费者的购买情况 得资料如下 举例 32 相关分析与回归分析 相关分析和回归分析都是分析客观事物之间关系的数量分析方法 关系 函数关系 指两事物之间的一种一一对应的关系 即当一变量x取一定值时 另一个变量y可依确定的函数取惟一确定的值 如销售额与销售量 统计关系 指两事物之间的一种非一一对应的关系 即当一变量x取一定值时 另一个变量y无法依确定的函数取惟一确定的值 如家庭收入与支出 33 34 相关分析方法散点图相关系数r相关系数r的取值在 1与 1之间 r 0正的线性相关关系 r 0负的线性相关关系 r 1完全正相关 r 1完全负相关 即函数关系 r 0不存在线性相关关系 相关程度 r的绝对值大于0 8时高度相关 在0 5与0 8之间时中度相关 在0 3与0 5之间时低度相关 小于0 3视为不相关 35 回归分析步骤 确定回归方程的解释变量和被解释变量 确定回归模型建立回归方程对回归方程进行各检验利用回归方程进行预测 36 回归分析回归方程的统计检验 拟合优度检验是检验样本数据点聚集在回归线周围的密集程度 从而评价回归方程对样本数据的代表程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论