《数据会说话》讲师手册_第1页
《数据会说话》讲师手册_第2页
《数据会说话》讲师手册_第3页
《数据会说话》讲师手册_第4页
《数据会说话》讲师手册_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国移动广东公司品牌课程系列 数数 据据 会会 说说 话话 讲讲 师师 手手 册册 品牌课程T品牌课程品牌课程2007 年年 11 月月 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 2 页 共 23 页 目录 PPT2 引言:啤酒和尿布的故事 . 4 PPT2 移动数据应用现状 . 4 PPT3 合理应用数据,是移动市场运营精细化管理的需要 . 5 PPT4 情景案例:背景 . 5 PPT6-7 情景案例: Action 1. 5 PPT8 情景案例: Action 1(续) . 6 PPT9 总结:不要企图数据会自动说话 . 6 PPT10定义和理解商业问题的能力 . 6 PPT11如何提高定义和理解商业问题的能力 . 7 PPT12共同参与 . 7 PPT13-14商业问题分类 . 7 PPT15练习 1. 8 PPT16思维导图工具 . 8 PPT17思维导图的应用遵循“相互独立 /完全穷尽 /逻辑一致” 的结构化思维 . 8 PPT18课堂练习 2. 9 PPT19需求分析标准结构 . 9 PPT20课堂练习 3. 9 PPT21无题 . 10 PPT22-23. 10 PPT24市场分析怎么做? . 10 PPT25根据定位,采取相应的客户细分方法 .11 PPT26方法举例: ARPU 法 . 12 PPT27方法举例: 消费心理法 . 12 PPT28 . 12 PPT29情景案例: Action 3. 13 PPT30案例:太浅的图和难懂的图 . 13 PPT31数据表达及呈现能力 . 13 PPT32图表是表达数据和信息的最直观呈现 . 13 PPT33目前较常用的三类图表 . 14 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 3 页 共 23 页 PPT34饼图 延伸应用 . 14 PPT35/柱状图 延伸应用 . 15 PPT36其他较常用的图表形式 . 15 PPT37举例:收入变化分析和预测 . 16 PPT38举例:各品牌 ARPU-ARPM 对应关系分析 . 16 PPT39举例:各 ARPU 水平客户对收入贡献程度 . 16 PPT40举例:练习 1 . 16 PPT41举例:练习 2 . 17 PPT42情景案例: Action 4. 17 PPT43数据挖掘能力和数据应用能力 . 17 PPT44从 “数据分析 ” 到 “数据挖掘 ” . 18 PPT45数据挖掘技术最典型地应用于下列问题 . 18 PPT46数据挖掘技术已被已经被广泛应用于以下五个主题 . 20 PPT47-50总结篇 . 21 PPT51-54跨越数字陷阱 . 22 PPT55结束语 . 23 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 4 页 共 23 页 PPT2引言: 啤酒和尿布的故事 授课 关键点: 以 趣味 式讲述为主 ,目的是吸引学员的听课热情,引出学员对数据探索的兴趣。可以由讲师再找其他相关案例自由发挥。 时间控制在 5 分钟内 内容参考: 啤酒与尿布,两个丝毫不想关系的东西(当然,你别和我较真,根据研究显示,世界上任何两个不相关联的事物,经过最多 18 次的关联,一定能建立关联),却引出了一段神奇的故事。 一家超市的老板在无意中发现,店里的啤酒与尿布这两个商品的销售量曲线总是惊人的相似。很奇怪的现象,难道他们之间有什么关系?比如,啤酒喝多了,就要尿尿,但是又喝多了,总是尿在自己 的裤子上,于是很麻烦,为了省事,买块尿布垫上?醒了把尿布一撕,搞定,裤子不湿,挺好! 以上是扯淡,根本不是这样。经过老板细心观察,原来是这样:一般年轻的父亲在出来给孩子买尿布的时候,总是喜欢捎带着买上两瓶啤酒。哈,原来是这样,于是,超市老板就把啤酒与尿布这两个风马牛不相及的商品摆放在一起。这样极大的方便了顾客,同时也促进了啤酒的销量。 这个故事的主角,现在已经成为美国第一大零售商,它就是沃尔马公司。 这个故事说明了什么?在海量的数据中,总是隐藏着各种各样的信息。而随着时间的推移以及信息爆炸,我们已经很难不借助 其他的外力去从海量的数据中发觉信息,即使能发觉,根据现在信息的发布速度,这样也是毫无实际意义的。数据里蕴藏这许多肉眼所看不见的东西,如何从庞大的数据海洋中发掘有效信息,已经成为信息时代所急待解决的问题。 PPT2移动数据应用现状 授课关键点: 关键是点出“移动 目前在 数据库 支持上已经足够,数据信息可谓海量, 如何让数据应用发挥更大的作用呢? ” 这篇主要为了引出后面的那个主题案例, 讲师可以稍作自由发挥,介绍一下自己工作中碰到的实际案例。 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 5 页 共 23 页 时间控制在 2 分钟内 PPT3 合理应用数据,是移动市场运营精细化管理的需要 授课关键点: 承接上篇, 以 ppt 里写的 内容 讲述 为主, 点出数据管理的重要性,再次间接点出本课程的重要性。 时间控制在 2 分钟内 PPT4情景案例:背景 授课关键点: 在这篇开始之前,要给学员说明 :“ 整 个课程会以一个大的案例贯穿不同的场景做分解分析和大量的演练,看似简单的不同场景里都包含着一些引人深思的内容,课程结束后会要求学员代表做总体总结,” 目的是要求学员 高度专注,不要错过任何一个场景的分析。 时间控制在 3 分钟内 PPT6-7情景案例: Action 1 授课关键点: 以讲故事的形式把情景做一个描述 , 语气不要太快 。 情景描述完以后 抛出 讨论问题模板, 思考 三 分钟后,开始讨论 讨论控制在 10 分钟之内,听完各组学员的分析后不用下结论,然后做简单梳理,将思考分析的逻辑思路过一遍,转下页 PPT 注意:根据时间安排,讨论可以分角色进行,可分为 A 组(分析者)和 U组(应用者) 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 6 页 共 23 页 PPT8情景案例: Action 1(续) 在做完讨论后,将小刘提交的报告打开,继续开展讨论,控制在 5分钟以内。 讨论后,讲师进行点评。 点评参考:小刘更侧重于对之前采取过的营销方案进行分析点评,且不说深入否,他的分析是在现有几个营销活动中找相对 最好的,立足之前和现在;而李总更想知道的是这几种营销活动为什么没有取得效果的原因分析,想挖掘可能地更有效营销方案,立足于未来。李总和小刘之间在最初的界定问题上就存在了一定的偏差。 继而引出下篇。 注意:这篇的讨论以提问的方式进行。 PPT9总结:不要企图数据会自动说话 授课关键点: 对前面一个情景案例的总结, 关键是点明: 数据是不会自动说话的, 数据本身是客观存在的, 我们与数据也会有着千丝万缕的联系, 但如何挖掘数据背后的信息,如何让数据能够告诉你更多,才是 由我们自身的分析能力决定的,要善于建立思考问题的能力 ,让学员明确: 在 “ 数据会说话 ” 之前, 建立一种系统而缜密的共同语言系统是非常关键的 。 3 分钟左右 PPT10定义和理解商业问题的能力 授课关键点: 点出 建立共同语言系统的关键就是具备 商业问题理解和定义商业问题的能力 。而在上面的案例中, 小刘 对商业问题理解并不到位,而 李总 同样并没有很好定义商业问题,两者都存在问题 。 李总认为小刘应该理解他想要的,但也没有具体说清楚要什么?什么目的?要分析 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 7 页 共 23 页 到什么程度?而小刘 只能揣摩李总想要什么?根据自己的能力分析问题,经常是分析的内容和深度完全由分析人员的素质和能力决定,不确定性 大。 最后总结: Action1 和 Action2 都是为了点出“商业问题定义和理解”的重要性,Action1通过实战练习让大家认识,而 Action2通过实际的案例和点评让大家清楚。 PPT11如何提高 定义和理解商业问题的能力 授课关键点: 能力是比较抽象的东西,因此在此讲师要突出一点,就是我们总结和提炼了一些方法论、工具和技能,从而把能力具体化。 以下根据 PPT讲解定义和理解商业问题的 4个环节。 时间控制在 5 分钟左右 PPT12共同参与 授课关键点: 根据 PPT讲授。讲师需要突出一点,就是“ 明晰商业问题的 过程本身就是一个对问题解答的过程 ”。正因为很多数据应用者并不对问题解决进行深入思考,而只把模糊的问题抛给分析者,不参与分析结构的讨论, 所以商业问题定义和理解就会存在这样那样的问题。 时间控制在 2 分钟左右 。 PPT13-14商业问题分类 授课关键点: 我们将移动的商业问题进行分类,按照 运作效率、客户渗透、客户保留、和市场渗透四个方面 进行思考: 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 8 页 共 23 页 运作效率 问题 包括: 投入产出比(广告投放、渠道布点) 等 客户渗透 问题 包括 :资费及套餐设计 、 新产品投放 等 客户保留 问题 包括:客户流失分析 、 客户忠诚计划 等 市场渗透 问题 包括 : 竞争对手分析、区域市场分析 等 注意:移动商业问题模型是通过几个核心 KPI 串起来的。 首先, PPT15练习 1 授课关键点: 在课上练习时也可设计不同的讨论方式,可设计成小组抽签形式也可设计为点名形式。 讲师需要说明一点,在问题分解练习中,不用进行细目分析(留在思维导图练习上) 除了讲义中的练习外,讲师也可以根据自身工作实践安排其他练习。 讲义练习的答案可参照 22页。 PPT16思维导图工具 授课关键点: 介绍思维导图工具 ,讲师需要提前熟悉如何操作。 简单叙述,对于任何一个商业问题的理解可以从两个层面出发 :问题导向和现象导向,无论何种导向 对思维的层层分解是关键,这需要在日常的工作中培养一种习惯。 PPT17思维导图的应用遵循“相互独立 /完全穷尽 /逻辑一致” 的结构化思维 授课关键点: 上页 介绍思维导图工具 ,这页主要讲述 思维导图仅是一种软件,关键在于要有一种 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 9 页 共 23 页 结构化思维 。 相对独立,是指所述的事情互不包容。例如水果和猪肉,例如梨子和苹果。而苹果和水果显然不是相对独立的。 完全穷尽,是指 处于每一层次的观点都是下一层次观点的概述 , 且下一层次观点是解释上一层次观点的全部可能性 。简单来说,是指把所有的可能性都完全呈 现。例如季节包括春夏秋冬等。 逻辑一致, 是指 同一个编组中的见解从逻辑上讲应该是相同的,一个简单的检验方法是看这一组见解能否被一个复数名词所概括 。 PPT18课堂练习 2 授课关键点: 在课上练习时也可设计不同的讨论方式,可设计成小组抽签形式也可设计为点名形式。 除了讲义中的练习外,讲师也可以根据自身工作实践安排其他练习。 讲义练习的答案可参照 23页。 PPT19需求分析标准结构 授课关键点: PPT上呈现了“需求分析表格”工具。讲师重点讲述在进行需求分析时,数据应用者需与分析者就 分析主题(属于哪类商业问题 ) 、 分析的细目 、 分析结果的应用 , 分析应用主要针对的 KPI进行讨论,并达成一致。 PPT20课堂练习 3 授课关键点: 在课上练习时也可设计不同的讨论方式,可设计成小组抽签形式也可设计为点名形式。 注意:让学员重点讨论 应用性说明 和 KPI。 除了讲义中的练习外,讲师也可以根据自身工作实践安排其他练习。 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 10 页 共 23 页 讲义练习的答案可参照 28页。 PPT21无题 授课关键点: 这页是承上启下。可以总结前面介绍的“四步跨栏法”,总结一下前面案例中的问题,然后重新介绍一下,如果小刘学了我们的“四步跨栏法”,他将会怎么做? 在介绍 下一页前,也可以让大家讨论一下。 PPT22-23 授课关键点: 回顾:练习 1 和练习 2的答案。 PPT24市场分析怎么做? 授课关键点: 这是讲师列举 思维导图中形成分析细目后,如何再进行“客户细分” 的思路。 给需要简单介绍产品 -客户矩阵,重点阐述交叉销售、市场拓展、升级销售和市场渗透的区别 ( PPT 图形里有简单说明) ,点出对于新产品其营销策略无外乎考虑交叉销售和市场拓展两种情况,不同的策略对于目标客户的选择范围是不一样的,在做后面的分析前必须首先将策略定位清晰。 时间控制在 5 分钟左右 内容参考: 交叉 销售( Cross-selling) 通常是发现一位现有顾客的多种需求,并通过满足其需求而实现销售多种相关的服务或产品的营销方式。 简单地理解,说服现有的顾客去购买另一种产品,也是根据客人的多种需求,在满足其需求的基础上实现销售多种相关的服务或产品的营销方式。 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 11 页 共 23 页 交叉销售的策略:找对人、说对话、做对事 企业与现有客户的交易信息储存在数据库中,企业可以借助数据挖掘工具进行关联规则分析,建立相关模型,高效地挖掘出客户的潜在相关需求,实现交叉销售。通过移动通信的例子可以说明上述三步策略。 第一步:“找对人”。 通过分析客户通信服务产品的使用特征,运用通话频率、时长、联络广度、长途通话等因素可以将几百客户聚积成组内特征相似、组间特征各异的组群,由此,便可寻找出针对不同用户群的产品销售机会。有实例证明:进行用户群特征研究并建立了相应的模型后的市场活动响应率,是无模型时的响应率提高了 5.34 倍。可见,找对人可以提高营销活动的命中率,减少活动经费。 第二步:“说对话”。 也就是要选择客户偏好的媒介对目标客户开展产品的宣传活动。以运营商做 WAP 推广为例,首先在“找 对人”的基础上,选取小样本的目标客户利用不同的促销方式开展宣传,如短信 PUSH、机场传单、帐单夹寄广告等,通过收集响应的客户数据,确定有效的促销渠道。 第三步:“做对事”。 指向客户推销他们期望的产品。移动运营商所拥有的数据库其实就是体现客户消费需求差异的外在表现因素。通过数据挖掘,寻找产品与产品之间的关联规则,可有效帮助运营商找到产品组合销售的机会。在移动通信领域,可对彩信、全球呼、 GPRS、 IP、手机银行、移动秘书等业务的使用情况进行关联分析,据此发现互补和替代性,以最优组合向客户进行捆绑销售。 PPT25根据定位,采取相应的客户细分方法 授课关键点: 按照 ppt 内容标题简单介绍,时间控制在 5分钟之内 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 12 页 共 23 页 PPT26方法举例: ARPU 法 授课关键点: 简单介绍按照 ARPU法的客户分类案例,这更多地是针对 老客户 进行的分析。 根据对已有客户的消费活动数据分析(如 ARPU值和对任何新产品的响应时间判断),可有将选定的客户群体(客户样本根据情况选择,或是整个市公司,或是某一个地区)进一步细分为不同的客户类别 PPT27方法举例: 消费心理法 授课关键点: 简单 介绍 在 消费心理法 的客户分类案例,这更对地针对地是对所有客户群(尤其是新客户 )的分析, 通过问卷调研,确定 哪类人群对彩信的响应度会比较高 ,以及 如何对消费心理相似的用户群进行合理归类,缩小目标客户 。 PPT28 授课关键点: 回顾:练习 3 的答案。 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 13 页 共 23 页 PPT29情景案例: Action 3 授课关键点: 进入案例的第三个情景 以讲故事的形式把 案例 情景做一个 述说,语气不要太快 。 讨论控制在 2 分钟之内 PPT30案例:太浅的图和难懂的图 授课关键点: 随后抛出情景讨论问题: 1为什么李总会觉得左图浅? 2右图 问大家谁读懂了? 3 在这个环节上,小刘和李总出现了什么问题? 注意:讲师在过程中需要和学员进行右图的解释,并强调这张图信息量很大,对决策很有帮助,而且实际上画起来并不复杂。 所以左图太浅是小刘的问题,而右图看不懂则是李总的问题大些。 注:右图可以通过“插入图表 -柱状图 -子图表类型 ”进行 选择。 然后引出下篇。 PPT31数据表达及呈现能力 授课关键点: 在上个案例讨论过后,点出 :小刘在数据的图表化能力和李总的读图能力均存在问题。过渡篇,不用太多叙述,转为下一篇 PPT32图表是表达数据和信息的 最直观呈现 授课关键点: 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 14 页 共 23 页 讲述图表是数据化问题呈现的最直观表达, 图表具有较好的视觉效果,可方便用户查看数据的差异、图案和预测趋势 。 目前常见的图表类型和典型应用 (参考 PPT内容) 。 这里不用太详细的讲,过 渡 到后一个一个重点讲。 PPT33目前较常用的三类图表 授课关键点: 点出目前在移动内部最常用的三类图表为:饼图、柱状图和线性图。简单说明各类图的典型应用。 内容参考: 饼图 : 整体中的各部分比例分布构成 。 显示组成数据系列的项目在项目总和中所占的比例。饼图通常只显示一个数据系列,当您希望强调数据中的某个重 要元素时可以采用饼图。 柱状图: 柱形图显示一段时间内数据的变化,或者显示不同项目之间的对比。 折线图: 折线图按照相同间隔显示数据的趋势 , 不同分析对象在不同时间段的不同数值表现 。 PPT34饼图 延伸应用 授课关键点: 讲述除了简单我们常用的饼图外还有很多饼图的延伸应用可以更好地表现数据 。 如果时间允许,可以让大家讨论:日常工作中还有哪些情况可以用到延伸饼图。 注:右上图可以通过“插入图表 -饼图 -子图表类型”进行选择。 内容参考: 复合饼图: 饼图可以用来将数据点显示为数据总额的百分比。但是,当多个 数据点的数据值都小于饼图的 5% 时,区分各个扇区将十分困难。为了使较小的扇区在饼图中更容易区分, 可以使用 复合饼图和复合条饼图子图表类 来表现 。这两种子图表类型都可以将较小的扇区从主饼图中分开,以另外的饼图或堆积条形图显示这些较小的扇区, 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 15 页 共 23 页 PPT35/柱状图 延伸应用 授课关键点: 讲述除了简单我们常用的柱状 图外还有很多 柱状 图的延伸应用可以更好地表现数据 。 如果时间允许,可以让大家讨论:日常工作中还有哪些情况可以用到延伸饼图。 注:右图可以通过“插入图表 -柱状图 -子图表类型”进行选择。 内容参考: 堆积柱形图 : 这种图表类型显示各个项目与整体之间的关系,从而比较各类别的值在总和中的分布情况。 百分比堆积柱形图 : 这种图表类型以百分比形式比较各类别的值在总和中的分布情况。 PPT36其他较常用的图表形式 授课关键点: 介绍其他数据描绘的常用图形表现形式。 内容参考: 梯度结构 图: 常用于收入、利润、成本、份额的直观分解,在提供宏观决策依据中经常使用。 气泡图: 气泡图与 XY 散点图类似,但是它们对成组的三个数值而非两个数值进行比较。第三个数值确定气泡数据点的大小。 通常用于群体类别的不同 纬度 比 较。 雷达图: 雷达图比较若干 数据系列 (数据系列:在图表中绘制的相关数据点,这些数据源自数据表的行或列。图表中的每个数据系列具有唯一的颜色或图案并且在图表的图例中表示。可以在图表中绘制一个或多个数据系列。饼图只有一个数据系列。) 的聚合值。 函数图: 常用于不同指标的对应关系,反映贡献度的一种图示方法 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 16 页 共 23 页 PPT37举例:收入变化分析和预测 授课关键点: 按照 PPT 说明理解 注:本图 可以通过“插入图表 -柱状图 -子图表类型 -把下面的柱状选择颜色 无色”完成。 PPT38举例:各品牌 ARPU-ARPM 对应关系分析 授课关键点: 按照 PPT 说明理解 注:右图可以通过“插入图表 -气泡图”进行选择。 PPT39举例:各 ARPU水平客户对收入贡献程度 授课关键点: 按照 PPT 说明理解 。这是两个图的叠加,这两个图反映了 20/80原则。 注:右图可以通过“插入图表 -散点图”进行选择。 PPT40举例:练习 1 授课关键点: 尽量课堂练习,主要目的一是:让学员掌握看数反应图形的能力,二是说明数据 有 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 17 页 共 23 页 时候也会说“谎话”的问题,因为给出的这个例子说明要分析主题问题,仅有下面的数据是不够的,还应该纵向和横向对比收集和分析数据。 解答可参看 练习 .xls 练习 题目 可动态更换。 PPT41举例:练习 2 授课关键点: 尽量课堂练习,主要目的是:让学员掌握各种图表的呈现特点,应用一些延伸图表的功能。 这里主要能运用到的图表有:饼图(复合饼图)、柱状图、折线图等 解答可参看 练习 .xls 练习 题目 可动态更换。 PPT42情景案例: Action 4 授课关键点: 进入案例的第四个情景 以讲故事的形式把 案例 情景做一个 述说,语气不要太快 。 随后抛出情景讨论问题: PPT43数据挖掘能力和数据应用能力 授课关键点: 讲师要讲明,经过前面几个案例, 我们已经介绍了如何理解和定义商业问题、如何表达和识别图表 ,如果要更好应用数据,让数据说话,那么还需要掌握数据挖掘和应用能力, 这是进阶篇要介绍的内容。 下面简单的介绍数据挖掘的内容。 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 18 页 共 23 页 PPT44从 “数据分析 ” 到 “数据挖掘 ” 授课关键点: 重点让大家澄清概念:“数据分析”和“数据挖掘”的区别。 数据分析:强调理性(收集相关数据,支撑已有的假设和结论),以呈现问题为主 数据挖 掘:强调建设性(基于工作目标,应用数据挖掘,提出所未知的思路、建议和结论),以解决问题为主 不用过多阐述。 内容参考: 数据分析更多地做些描述性地统计性分析,数据挖掘更多地组合应用分类、聚类、时间序列分析、 相关、预测等挖掘分析工具 PPT45 数据挖掘技术最典型地应用于下列问题 授课关键点: 按照 PPT的内容一个一个说明在数据挖掘里最常用的分类、聚类、相关和预测问题经常用于解决移动行业里的哪类问题。 不用过多阐述。 内容参考: 分类问题 属于预测性的问题,但是它跟普通预测问题的区别在 于其预测的结果是类别(如 A、 B、 C三类)而不是一个具体的数值(如 55、 65、 75 )。 举个例子,你和朋友在路上走着,迎面走来一个人,你对朋友说:我猜这个人是个上海人,那么这个问题就属于分类问题;如果你对朋友说:我猜这个人的年龄在 30 岁左右,那么这个问题就属于后面要说到的预测问题。 商业案例中,分类问题可谓是最多的:给你一个客户的相关信息,预测一下他未来一段时间是否会离网?信用度是好 /一般 /差?是否会使用你的某个产品?将来会成为你的高 /中 /低价值的客户?是否会响应你的某个促销活动? 。 有一种很特殊的分 类问题,那就是 “ 二分 ” 问题,显而易见, “ 二分 ” 问题意味着 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 19 页 共 23 页 预测的分类结果只有两个类:如是 /否;好 /坏;高 /低 。这类问题也称为 0/1 问题。之所以说它很特殊,主要是因为解决这类问题时,我们只需关注预测属于其中一类的概率即可,因为两个类的概率可以互相推导。如预测 X=1 的概率为 P( X=1),那么 X=0 的概率 P( X=0) =1-P( X=1)。这一点是非常重要的。 可能很多人已经在关心数据挖掘方法是怎么预测 P( X=1)这个问题的了,其实并不难。解决这类问题的一个大前提就是通过历史数据的收集,已经明确知道了某些用户的分类 结果,如已经收集到了 10000 个用户的分类结果,其中 7000 个是属于 “1” 这类;3000 个属于 “0” 这类。伴随着收集到分类结果的同时,还收集了这 10000个用户的若干特征(指标、变量)。这样的数据集一般在数据挖掘中被称为训练集,顾名思义,分类预测的规则就是通过这个数据集训练出来的。训练的大概思路是这样的:对所有已经收集到的特征 /变量分别进行分析,寻找与目标 0/1 变量相关的特征 /变量,然后归纳出P( X=1)与筛选出来的相关特征 /变量之间的关系(不同方法归纳出来的关系的表达方式是各不相同的,如回归的方法是通过函 数关系式,决策树方法是通过规则集)。 聚类问题 不属于预测性的问题,它主要解决的是把一群对象划分成若干个组的问题。划分的依据是聚类问题的核心。所谓 “ 物以类聚,人以群分 ” ,故得名聚类。 聚类问题容易与分类问题混淆,主要是语言表达的原因,因为我们常说这样的话:“ 根据客户的消费行为,我们把客户分成三个类,第一个类的主要特征是 ” ,实际上这是一个聚类问题,但是在表达上容易让我们误解为这是个分类问题。分类问题与聚类问题是有本质区别的:分类问题是预测一个未知类别的用户属于哪个类别(相当于做单选题),而聚类问题是根据选 定的指标,对一群用户进行划分(相当于做开放式的论述题),它不属于预测问题。 聚类问题在商业案例中也是一个非常常见的,例如需要选择若干个指标(如价值、成本、使用的产品等)对已有的用户群进行划分:特征相似的用户聚为一类,特征不同的用户分属于不同的类。 聚类的方法层出不穷,基于用户间彼此距离的长短来对用户进行聚类划分的方法依然是当前最流行的方法。大致的思路是这样的:首先确定选择哪些指标对用户进行聚类;然后在选择的指标上计算用户彼此间的距离,距离的计算公式很多,最常用的就是直线距离(把选择的指标当作维度、用户在每个 指标下都有相应的取值,可以看作多维空间中的一个点,用户彼此间的距离就可理解为两者之间的直线距离。);最后聚类方法把彼此距离比较短的用户聚为一类,类与类之间的距离相对比较长。 说起关联问题,可能要 再提起之前 “ 啤酒和尿布 ” 的故事了 了。有人说啤酒和尿布是沃尔玛超市的一个经典案例,也有人说,是为了宣传数据挖掘 /数据仓库而编造出来的虚构的 “ 托 ” 。不管如何, “ 啤酒和尿布 ” 给了我们一个启示:世界上的万事万物都有着千丝万缕的联系,我们要善于发现这种关联。 关联分析要解决的主要问题是:一群用户购买了很多产品之后,哪些产品同 时购买 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 20 页 共 23 页 的几率比较高?买了 A产品的同时买哪个产品的几率比较高?可能是由于最初关联分析主要是在超市应用比较广泛,所以又叫 “ 购物篮分析 ” ,英文简称为 MBA,当然此 MBA非彼 MBA,意为 Market Basket Analysis。 如果在研究的问题中,一个用户购买的所有产品假定是同时一次性购买的,分析的重点就是所有用户购买的产品之间关联性;如果假定一个用户购买的产品的时间是不同的,而且分析时需要突出时间先后上的关联,如先买了什么,然后后买什么?那么这类问题称之为序列问题,它是关联问题的一种特殊情况。从某种意义上来 说,序列问题也可以按照关联问题来操作。 此处说的 预测问题 指的是狭义的预测,并不包含前面阐述的分类问题,因为分类问题也属于预测。一般来说我们谈预测问题主要指预测变量的取值为连续数值型的情况。 例如天气预报预测明天的气温、国家预测下一年度的 GDP增长率、 电信运营商预测下一年的收入、用户数等? 预测问题的解决更多的是采用统计学的技术,例如回归分析和时间序列分析 。回归分析是一种非常古典而且影响深远的统计方法,最早是由达尔文的表弟高尔顿在研究生物统计中提出来的方法,它的主要目的是研究目标变量与影响它的若干相关变量之 间的关系,通过拟和类似 Y=aX1+bX2+ 的关系式来揭示变量之间的关系。通过这个关系式,在给定一组 X1、 X2 的取值之后就可以预测未知的 Y值。 相对来说,用于预测问题的回归分析在商业中的应用要远远少于在医学、心理学、自然科学中的应用。最主要的原因是后者是更偏向于自然科学的理论研究,需要有理论支持的实证分析,而在商业统计分析中,更多的使用描述性统计和报表去揭示过去发生了什么,或者是应用性更强的分类、聚类问题。 PPT46 数据挖掘技术已被已经被广泛应用于以下五个主题 授课关键点: 目前,在移动行业中, 数据挖掘技术已被已经被广泛应用 的 五个主题 。介绍为主不用占太长时间。 内容参考: 客户行为分析 利用分类分析法和聚类分析法对客户通话行为进行分析,从而得出客户在消费习 中国移动集团公司广东有限公司品牌课程系列之数据会说话 讲师手册 第 21 页 共 23 页 惯、生活方式、社会联系等方面的特征。对客户行为分析的根本目的是为了按不同特征划分客户群,针对不同客户群的特征,运营商可以进行不同的市场营销活动和客户服务。在客户群划分中典型的应用就是针对某一客户群的消费特征进行某种移动业务的营销。 优惠策略仿真预测 优惠是市场营销中十分重要的一部分,优惠策略的不恰当,常常会得到适得其反的市场效果。优惠 策略仿真预测就是通过已建立的客户行为模型仿真客户对优惠策略的反应,从而预测优惠策略实施的效果。通过对优惠策略的仿真,可以预测优惠策略的成功与否,从而进行相应的调整和优化。 客户忠诚度分析 客户忠诚度分析主要通过对客户消费金额和帐务支付的分析建立客户价值模型,从而获得客户价值和离网倾向。客户是运营商价值之所在,通过对客户忠诚度分析,有针对性的对高价值客户进行优质服务,对有离网倾向的客户及时进行挽留活动对提高运营商市场占有率,降低营销成本是十分有用的。 反 欺诈分析 目前,移动运营商面临的一个最严重的问题是欠 费问题,其中很大一部分是欺诈消费,因此反欺诈消费已经成为移动通信发展的关键。通过对客户数据的多维分析、聚类分析和孤立点分析可以建立客户欺诈消费模型,从而可以有效的对客户消费行为进行监控,对满足欺诈消费模型的消费行为进行告警。 竞争对手分析 成熟的市场必然是一个竞争比较充分的市场。不同运营商客户之间的互联互通是最基本的前提,因此通过对客户与竞争对手客户之间通话的行为分析,可以建立有关竞争对手经营和客户服务的模型,比如竞争对手客户发展模型,通过对这些模型的使用,可以制定有效的市场应对策略。 PPT4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论