“五度”数据分析(之二).doc_第1页
“五度”数据分析(之二).doc_第2页
“五度”数据分析(之二).doc_第3页
“五度”数据分析(之二).doc_第4页
“五度”数据分析(之二).doc_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

“五度”数据分析(之二)欲善其事,必先利其器。数据分析要成为企业利器需要满足“五度”:深度、效度、信度、难度、通度。在前面的博文中,我们谈了“深度”和“效度”。这里,我们再来聊聊“信度”、“难度”和“通度”。第三度:信度 信度是指分析结果的可靠程度。信度是判断分析方法好坏的第三个标准。要加强分析的信度,需要做到以下几点:1、对比要可比在我们身边,充斥着大量的不具有可比性的对比分析。而这个问题严重影响了分析结果的可信度。数据化管理曾经举过这样一个例子。在美国和西班牙交战期间,美国海军的死亡率是千分之九,而同时期纽约居民的死亡率是千分之十六。后来海军征兵人员就用这些数据来证明参军更安全。你认为这个结论正确吗?当然不正确,这两个数字的对比是不具有可比性的,当兵的都是身强力壮的年轻人,而居民的死亡率是包括老弱病残的数据,这些人相对来说,死亡率是高的(需要说明的是16估计是不含自然死亡)。所以正常应该是用同年龄段的海军数据和纽约居民来对比。2、差异要显著 在做精细化营销时,往往需要借助数据来理解不同用户的偏好差异。那么,数据相差多大才显示不同用户的偏好存在差异呢? 例如, 在左下图中,不同收入的用户对A卖场品类的态度有差异吗?别急,需要先做显著性检验。因为满意度得分上的差异来自两个方面:组间差异和组内差异。组间差异(控制变量)是由于收入水平的不同,三组用户间的满意度差异组内差异(随机变量)是由于随机因素,同样收入水平下的用户的满意度差异 只有当满意度得分上的差异主要来自于收入水平(即组间差异),而不是其他(如随机抽样),才可以说:不同收入的用户具有不同的偏好。 基于以上思考,我们做方差分析。从方差分析的结果看(见右下图) 首先:方差齐性检验中的相伴概率值0.435显著性水平0.05,可认为各水平下总体方差相等,通过了检验,所以可以使用方差分析。 其次,方差分析的结果显示组内平方和(即组内差异为90.396)远远大于组间平方和(即组间差异为8.379),F值的相伴概率值0.05,未通过检验。也就是说对A卖场品类态度上的差异主要来自于同样收入水平下的用户,不同收入者对A卖场的品类的态度不存在显著差异。 如何理解这个检验结果呢?从满意度得分来看,似乎不同收入者在品类方面的差异蛮大咧(见左下图)。我们看不同收入者的满意度分布就比较好理解了(见右下图)。 从右下图可以看到三类收入者内部波动很强烈,组内的差异水平甚至高出组间差异。这说明收入并不是区隔用户品类满意度的显著因素,即不同收入者的满意度水平不存在显著差异。 3、描述要全面为什么当统计局把在岗职工的平均工资公布后,很多网友嗤之以鼻,讥之为“真实的谎言”者有之,认为“工资不涨反降”者有之,质疑“是不是又在放卫星”者亦有之呢? 因为平均工资的描述不能全面刻画工资的分布特点。它只能反映工资的集中趋势(一般水平),却没有考虑工资水平之间的离散趋势(波动程度)。 第四度:难度 是否用复杂的方法,取决于的问题的难度。问题难度升级,则方法的复杂程度也要升级。 以市场细分为例。若单一维度细分效果不佳,则需要增加分类维度。例如,我之前做过一个彩电项目,用收入作维度进行细分市场。发现高收入者和低收入者买高档彩电的比例相差无几。仔细想想,高收入并不是买高档彩电的充要条件:高收入不一定就买高档彩电;低收入也不一定买低档彩电。高强度的工作可能会是使一个月薪过万的白领不买电视,因为根本没时间看;严重的攀比心理可能会使入不敷出的人家借钱买最贵的彩电。因此,买什么价位的彩电,不仅和收入有关,还可能会和消费者的价值观、生活形态、对彩电的需求程度、年龄、职业等多种因素有关。到底和哪些因素有关,需要不断假设、探索,验证、比较、推翻,然后再重新开始,直到找到最合适的细分方案。1、分类维度多聚类分析+因子分析既然要增加分类维度,此时拖透视表不管用了,就要考虑更复杂些的分类方法了,比如聚类分析。下图用的是系统聚类分析法,用人均GDP、人口数、价格增长指数等5个维度来对省份进行分析。用于分类的维度较少,并且相互独立是最好的。但大多数的情况是,我们想出了一大堆维度,其中很多维度之间由存在一定的相关关系,也就是存在多重共线性的问题。此时,直接做聚类分析显然不合适,需要在聚类之前作因子分析。例如,对网民进行细分,以17个生活形态语句做细分的维度,会发现维度又多又共线,比如“喜欢热闹和聚会”、“经常户外度假”、“下班后尽快回家”、“即使有钱也要工作”反映了生活的态度和状态。通过因子分析,我们最终将这17个生活形态的语句综合为“享受奢侈”、“外向运动”、“居家节约”、“独立自信”四个因子(见下图)。2、选择标准多层次分析法市场细分的目的是为了从各类细分市场中选择目标市场。如何选择呢?如果标准单一,直接用这个标准比较各个细分市场就好了。但如果标准较多并具有一定的结构性,则要考虑更复杂些的方法层次分析法。层次分析法的第一步是建立层次结构模型。只要你想清楚要对哪些细分市场进行选择,选择的标准都有哪些,之间存在什么关系,层次结构模型就建立起来了(见下图)。层次分析法的后四步分别是构造判断矩阵、单层排序、一致性检验和选择决策。具体的操作步骤大家可以看我的博文谁是你的白马王子? 第五度:通度数据分析前期要详细了解企业需求;后期要向企业呈现研究成果,虽然信息流方向不同,但同样需要沟通。沟通的顺畅度就是通度,通度的高低,直接影响数据价值的发挥水平。那么,如何提高数据分析的通度?我总结有“三用三不用”原则:1、能用图表就不用数据假设我要描述大学生对手机功能的使用情况。若用数据,平淡如水,让人产生恹恹欲睡之感;若用图表,栩栩如生,让人迅速抓住关键信息(见下图)。 2、能用图片就不用文字与文字相比,图片色调化,更能让人们产生视觉冲击;图片故事化,更能使人们产生移情和共鸣。例如,用一张图片,来展示人与狗亲密接触的瞬间,要比千言万语更能打动读者。因为图片中的温馨与快乐的情感有移情效应,会强烈感染读者。3、能用动态呈现就不用静态展示在表达事物随着时间的动态变化时,动态呈现能还原真实,无

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论