第一讲数据挖掘与数据分析.doc_第1页
第一讲数据挖掘与数据分析.doc_第2页
第一讲数据挖掘与数据分析.doc_第3页
第一讲数据挖掘与数据分析.doc_第4页
免费预览已结束,剩余2页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、趣味数学课程单元教学设计(教案)一数据挖掘与数据分析一、教案头T口冃 调 朱H时 学 2ITH50-教学口标O 数用任务及案教学重点教学准备二、数据挖掘与数据分析教学设计步骤教学内容教 学 方 法教 学 手 段学 生 活 动时 间 分 配告知(教 学内容、 目的)简述本单元教学内容:1、利用大数据后,农夫山泉会发生管理变革吗?2、大数据可以给阿迪达斯带来利润吗?3、中国能制作岀类纸牌屋的电视剧吗?4、网易数据工程师可以当媒婆”? 简述本单元教学目的:初步了解数据挖掘与数据分析技术的概念以及应用。讲 授 启 导用 多 媒 体 教 学听 课3引入(项 目)数据挖掘(Data Mining)旨在从大

2、量的、不完全的、有噪声的、模 糊的、随机的数据中,提取隐含在苴中的、人们事先不知道的、但又是 潜在有用的信息和知识。还有很多和这一术语相近似的术语,如从数据 库中发现知识(KDD)、数据分析、数据融合(DataFusion)以及决策支持 等。讲 授用 多 媒 体 教 学听 课7任务1、 农夫山 泉用大 数据卖 矿泉水1. 问题冰怎样摆放水堆更能促进销售?冰 什么年龄的消费者在水堆前停留更久,他们一次购买的疑多大?冰气温的变化让购买行为发生了哪些改变?冰竞争对手的新包装对销售产生了怎样的影响?冰“大自然的搬运工”,如何控制物流成本?2. 数据冰业务员每天拍摄10张照片:水怎么摆放、位置有什么变化

3、、高 度如何去15个点,下班之前150张照片就被传回了杭州总部(10M)冰10000个业务员,这样每天的数据就是100G,每月为3TB冰 运输环境数据场景:髙速公路的收费、道路等级、天气、配送 中心辐射半径、季节性变化、不同市场的售价、不同渠道的费 用、各地的人力成本、甚至突发性的需求(比如某城市召开一 次大型运动会)。3. 大数据获取解决三个顽症:冰首先是解决生产和销售的不平衡,准确获知该产多少,送多少: 冰 其次,让400家办事处、30个配送中心能够纳入到体系中来, 形成一个动态网状结构,而非简单的树状结构;冰最后,让退货、残次等问题与生产基地能够实时连接起来。4. 结论冰可以做到实时计算

4、结果,不可能的事情变为可能:冰决策者们依靠数据来验证以往的决策是否正确:冰对已出现的问题作出纠正,并预测未来。有了强大的数据分析能力做支持后,农夫山泉近年以30%-40%的年 增长率,在饮用水方而快速超越了原先的三甲:娃哈哈、乐百氏和 可口可乐。根据国家统计局公布的数据,饮用水领域的市场份额, 农夫山泉、康师傅、娃哈哈、可口可乐的冰露,分別为34. 8%. 16. 1%. 14.3%、4.7%,农夫山泉几乎是另外三家之和。讲 授用 多 媒 体 教 学听 课20任务2: 阿迪达 斯的“黃 金罗盘”在最初降价、打折等淸库存的“应急措施”结朿后,基于外部环境、 消费者调研和门店销售数据的收集、分析,

5、成为了将阿迪达斯和叶向阳 们引向正轨的“黄金罗盘”。每天都会收集门店的销售数据,并将它们上传至阿迪达斯。收到数 据后,阿迪达斯对数据做整合、分析,再用于指导经销商卖货。研究这 些数据,让阿迪达斯和经销商们可以更准确了解当地消费者对商品颜 色、款式、功能的偏好,同时知道什么价位的产品更容易被接受。1. 对比过去,而对展厅里各式各样的产品,经销商很容易按个人偏好下订 单。现在,阿迪达斯会用数拯说话,帮助经销商选择最适合的产品。首先,从宏观上看,一、二线城市的消费者对品牌和时尚更为敏感, 可以重点投放采用前沿科技的产品、运动经典系列的服装以及设计师合 作产品系列。在低线城市,消费者更关注产品的价值与

6、功能,诸如纯棉 制品这样高性价比的产品,在这些市场会更受欢迎。苴次,阿迪达斯会参照经销商的终端数据,给予更具体的产品订购 建议。比如,阿迪达斯可能会告诉某低线市场的经销商,在其辖区,普 通跑步鞋比添加了减丧设备的跑鞋更好卖:至于颜色,比起红色,当地 消费者更偏爱蓝色。一起商世卖哪些产品、什么产品又会热卖。这样,将来就不会再遇 到库存问题。”2. 挖掘大数据,让阿迪达斯有了许多有趣的发现。同在中国南部,那里部分城市受香港风尚影响非常大:而另一些地 方,消费者更愿意追随韩国潮流。同为一线城市,北京和上海消费趋势不同,气候是主要的原因。高线城市消费者的消费品位和习惯更为成熟,当地消费者需要不同 的服

7、装以应对不同场合的需要,上班、吃饭、喝咖啡、去夜店,需要不 同风格的多套衣服,但在低线城市,一位女性往往只要有应对上班、休 闲、宴请的三种不同风格的服饰就可以。两相对比,高线城市,显然为 阿迪达斯提供了更多细分市场的选择。实际上,对大数据的运用,也顺应了阿迪达斯大中华区战略转型的 需要。库存危机后,阿迪达斯从批发型”公司转为“零售驱动型”公 司,它从过去只关注把产品卖给经销商,变成了将产品卖到终端消费者 手中的有力推动者。而数拯收集分析,恰恰能让其更好地帮助经销商提 高售罄率。与经销商伙伴展开了更加紧密的合作,以统il到更为确切可靠的终 端消费数拯,有效帮助重新定义了产品供给组合,从而在适当的

8、时机, 将符合消费者口味的产品投放到相应的区域市场。一方而降低了他们的 库存,另一方面增加了单店销售率。卖得更多,售罄率更高,也意味着 更高的利润。讲 授用 多 媒 体 教 学听 课20任务3: 中国能 制作出 类纸牌 屋的电 视剧吗?凭借一部片子咸鱼翻身,这样的桥段在当下热播美剧纸牌屋身 上重演,反转剧主角是美国一家视频公司Netflix,它的武器则是大数据。首次进军原创剧就走红,Netflix不仅成为娱乐圈里的谈资,亦成为 数据革命的代表。纸牌屋不仅是Netflix网站上有史以来观看量最高的剧集,也 在美国及40多个国家大热。Netflix产品创新副总裁托徳耶林(Todd Yelin)称,

9、其表现甚至“比我们最大胆的梦想都要好。事实是,美国“白宫甄娥传、导演大卫芬奇(David Fincher)和老 戏计凯文史派西(Kevin Spacey),这些噱头只是用以吸引眼球的皮毛。 最抓人的是,Netflix根据数据技术推导岀纸牌屋的关键要素,喜欢 BBC剧、大卫芬奇和凯文史派西的用户存在交集,这是多么酷的一件 事。中国的乐视网一直关注Netflix的发展路径。“值得研究的是Netflix 如何从后端数据推导岀前台生产。“乐视网副总裁何凤玄说。这种做法 与旧传统是背道而驰的,以美国著爼的有线电视网络媒体公司HBO为 例,它对导演强烈的个性抱以完全的信任,全权委任导演去制片、编剧、 挑选

10、演员。而在中国,几大视频网站在自制剧时都有自己的选片团队, 由他们为观众选择与确定导演,挑选剧本。多年前,依赖于种种技术,Nciflix对数据的记忆能力已经炉火纯青。 当一位用户通过浏览器登录Netflix账号,Netflix后台技术将用户位置 数据、设备数据悄悄地记录下来。这些记忆代码还包括用户收看过程中 所做的收藏、推荐到社交网络等动作。在Netflix看来,暂停、回放、 快进、停1匕等动作都是一个行为,每天用户在Netflix上将产生高达3000 多万个行为,此外Netflix的订阅用户每天还会给岀400万个评分,300 万次搜索请求,询问剧集播放时间和设备。没错,这些都被Netflix

11、转 化成代码,当作内容生产的元素记录下来。其首席内容官泰徳表示,所 有这些数据意味着,Netflix公司已经拥有“可寻址的观众“。早年间,Netflix利用上述数据提供一项推荐引擎业务。比如说,数 千万用户能在一个个性化网页上对影片做岀1一5的评级,这些评级构 成了一个巨大数据池,如今这个数据池容量已超过近百亿条。根据数据 池,Netflix使用推荐算法来识别具有相似品味的观众,然后对这一群体 做出相关内容的精准推荐。法国电影不要告诉任何人在美国的票房收入惨淡,只有600 万美元。可Netflix的工程师并不相信这个数字,他们通过上述数据挖 掘技术,找到了不易察觉的点击量,而这些才是被隐藏的事

12、实。2011 年时,Netflix决左播放不要告诉任何人。如Netflix预测的一样, 这部电影在播放后立即在最受嘱目的节目中排到第四位。里徳哈斯廷斯决泄用事实告诉资本市场,数拯不是花架子,而是 地道的生产力。Netflix利用数据挖掘能力计算岀可以贏的办法,1亿美 元买下一部早在1990年就播岀的BBC电视剧纸牌屋的版权,请来 导演大卫芬奇(David Fincher),并由老戏计凯文史派(Kevin Spacey) 担当男主角。1亿美元买下的纸牌屋总共2季26集,计算下来单集成本约 为400万美元,远远高于美国一般电视剧的单集制作成本150万至 200万美元,也只有广告狂人、斯巴达克斯这类

13、热播美剧才能 达到200万美元左右。算下来,对于Netflix而言,只有新增100万一 年期合约付费用户才能收回上述成本。Netflix并非没有汁算过豪赌的回报,这样做不仅可以带来新增用 户,更为重要的是它为Nciflix开拓了上游市场,走上了自制剧之路。讲 授用 多 媒 体 教 学听 课20在纸牌屋之后,还将有四部自制剧在2013年登陆Netflixo这意味 着,Netflix可以逐步降低对版权费用日趋高涨的好莱坞剧的依赖。关键是如何制作自制剧?国内视频网站意识到数据的重要性,也积 累了大量数据。比如乐视网通过分析用户收看时间,在今年推出午间自 制剧场。“但真正细致到使用数据来决泄导演、演员

14、,中国还没有哪家 公司敢说他们能做到这点。“何凤云说。此外,即便是有了数据,中国的流媒体公司还不敢像Netflix那样 将宝押在一部剧上,因为中国的付费市场尚未成熟,目前还主要依赖广 告盈利,无法完全将用户需求作为中心。除此以外,一位视频行业的人士指出,在中国基于用户数据做出分 析的同时,还要考虑广电审核的要素,一些领域与题材类型都要稍微收 拢,“不是没法依赖数据,而是不能完全依赖数据,我们选择数据时也 一定要结合中国国情。”任务4:网易数 据工程 师可以 当媒 婆” ?2012年底,网易旗下全新婚恋交友网站“花田”上线。花田以免费 沟通为卖点,主打一二线城市中髙端市场。摒弃了传统婚恋网站的“

15、人 工红娘”,花田不提供任何人工服务,从推荐到搜索全由系统自动完成。 而业内的龙头老大世纪佳缘(Nasdaq:DATE),也在换帅之后摩挙擦掌, 试图用大数据的精准化运营,为在海量异性资料中疲于搜索的用户“指 一条明路。年前婚恋网站最爱喊“实名制“。通过对用户身份证或手机号码进 行验证,网站可获得用户真实姓餌、年龄、性别、地区等身份证数据, 对防止诈骗有一肚作用。但如今各家都有,这种传统打法就过气了。毕 竞有身份证的人,不一左是有身份的人。婚恋网站已将条条框框的碾指 标罗列齐全,使人几乎怀疑进入的是淘宝人肉市场。当身高、体重、年 龄、学历等等都一一框泄,一看还有2000个姑娘(小伙)符合要求,

16、 是时候让理性回归感性了。而这感性,又是建立在理性的数据分析之上。花田界而淸新简洁,采用类似微博的信息流展示形式。首页是异性 用户最近更新的图片、内心独白和文字传情,展示其生活方式、个人品 味等软性资料。系统会自动推荐那些相对活跃、最近有信息流更新的人, 这就促使用户拿岀更新微博的劲头来更新花出,为花出积累了大量可供 分析的软性数据。从用户的“内心独白”中提取出现频率较髙的关键词:再将这些关键 词分类,如感性词汇或理性词汇;最后,通过文本分析、语义分析,从 中挖掘出用户的性格是内向.外向、理想化还是现实派等等。花田团队在对海量软硬数据进行分析的基础上,总结出一些人物特 征,建立出一左数量的人物模型。再分析具体用户,将其分门别类套入 各种模型。这样,用户心仪其中某一个人,便可向英推荐这一类人。这种模型不仅是性格模型,还包括外貌模型。更令人感兴趣的是,如果花出能够跨产品平台,结合网易门户、邮 箱、游戏等英它网易资源进行大数据分析,是否就能向用户推荐与自身 阅读习惯、工作习惯、娱乐习惯都匹配的对象呢?真正的大数据必然是 跨平台

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论