大数据时代最新课件_第1页
大数据时代最新课件_第2页
大数据时代最新课件_第3页
大数据时代最新课件_第4页
大数据时代最新课件_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

12提纲

大数据的概念及技术

大数据时代的思维和变革

大数据在企业中的应用案例

大数据所带来的机遇和挑战

3一天之间,互联网上要发生多少事

?每天有2940亿封电子邮件发生,如果这些是纸质信件,在美国需要花费两年时间处理。

?每天有200万篇博客在网上发布,这些文章相当于《时代》杂志刊发770年的总量。

?每天有2.5亿张照片上传至社交网站Facebook,如果都打印出来,摞在一起能有80个埃菲尔铁塔那么高。

?每天有86.4万小时视频被上传至视频网站Youtube,相当于不间断播放视频98年。

?每天有1.87亿个小时的音乐会在流媒体音乐网站Pandora上播放,如果一台电脑从公元元年就开始播放这些音乐会,到现在还没完没了地接着放。

4

5

6“大数据”时代的爆炸增长

?地球上至今总共的数据量:

?在2006年,个人用户才刚刚迈进TB时代,全球一共新产生了约180EB的数据;

?在2011年,这个数字达到了1.8ZB。

?而有市场研究机构预测:

?到2020年,整个世界的数据总量将会增长44倍,达到35.2ZB(1ZB=10亿TB)!

想驾驭这庞大的数据,我们必须了解大数据的特征。

9什么是“大数据”?

大数据(bigdata),巨量数据集合

是指无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合。

10“大数据”特征

11大数据存放在哪?如何分析?

Hadoop是基于Google有关大数据的论文实现的开源项目,最初的框架由DougCutting在2005年提出,目前是由Apache维护的开源项目。从初创到现在,Hadoop体系在几年中开发完成了一系列重要的子项目,已经形成了一个涵盖数据存储、管理和分析功能的较为完整的大数据生态系统,成为大数据存储与处理领域地位最重要、应用最广泛的开源框架。

12大数据存放在哪?如何分析?

Hadoop是运行在大量通用计算单位上提供海量数据存储与并行计算的平台框架。

?基于X86集群水平可扩展

?基于MapReduce的并行计算能力

?设计规模:PB级的数据量,数千台计算节点

13提纲

大数据的概念及技术

大数据时代的思维和变革

大数据在企业中的应用案例

大数据所带来的机遇和挑战

14大数据思维

?量化思维——一切皆可量化

?决策思维——让数据驱动

?全样思维——样本=总体

?关联思维——追求相关关系

?……

151.量化思维:一切皆可量化

?StephenBeck?每一天,我们的身后都拖着一条由个人信息组成的长长的“尾巴”,这只是因为我们生活在一个现代化的世界。我们——

?◎点击网页

?◎切换电视频道

?◎驾车穿过自动收费站

?◎用信用卡购物

?◎使用手机

?而雅虎、Google这样的公司,正在以平均每人、每月2500条信息的速度,捕获我们的详细数据。

16数据,从最不可能的地方提取

?数据是指存储在某种介质上能够识别的物理符号,是对客观事物性质和状态的描述。

?先有数据再说应用。

17数据,从最不可能的地方提取

?量化坐姿

?日本先进工业技术研究所(Japan'sAdvancedInstituteofIndustrialTechnology)的教授越水重

臣(ShigeomiKoshimizu)所做的研究就是关于一个人的坐姿。很少有人会认为一个人的坐姿能

表现什么信息,但是它真的可以。当一个人坐着的时候,他的身形、姿势和重量分布都可以量

化和数据化。越水重臣和他的工程师团队通过在汽车座椅下部安装总共360个压力传感器以测量

人对椅子施加压力的方式。把人体屁股特征转化成了数据,并且用从0~256这个数值范围对其进

行量化,这样就会产生独属于每个乘坐者的精确数据资料。

?

在这个实验中,这个系统能根据人体对座位的压力差异识别出乘坐者的身份,准确率高达98%。

18数据,从最不可能的地方提取

?这项技术可以作为汽车防盗系统安装在汽车上。有了这个系统之后,

汽车就能识别出驾驶者是不是车主;如果不是,系统就会要求司机输入密码;如果司机无法准

确输入密码,汽车就会自动熄火。

?通过汇集这些数据,我们可以利用事故发生之

前的姿势变化情况,分析出坐姿和行驶安全之间的关系。这个系统同样可以在司机疲劳驾驶的

时候发出警示或者自动刹车。同时,这个系统不但可以发现车辆被盗,而且可以通过收集到的

数据识别出盗贼的身份。

19数据,从最不可能的地方提取

?苹果在2008年申请的“耳机、耳塞或耳麦的运动检测系统”专利。

?这种包含各种传感器的耳机可以检测各项生理指标,包括体温、心率和排汗水平。

?根据专利文件,健身检测系统被隐藏在耳机中,用户通常在运动时戴着耳机听音乐。通过将耳机放在耳朵里或附近,嵌入的运动传感器可以获得体温、排汗和心率方面的数据。除了基于皮肤的检测功能,耳机内部还可以集成加速度传感器,这样可以收集准确的运动数据。

202.决策思维:让数据驱动

21未来的世界由数据驱动

?2015年的3月15日,马云在德国的汉诺威IT博览会上的主题演讲:

?“一家互联网公司要想活得长久,必须找到一个方式让互联网经济和实体经济相结合,这个方式就是数据。”

?“未来的世界,我们将不再由石油驱动,而是由数据驱动。”

22数据驱动的工业4.023数据驱动的人生

243.要全部数据,不要抽样!

?模型不再那么重要,让数据说话。

?在小数据时代,随机采样就是利用最少的数据获得更多的信息。而且采样分析的精确性随着采样随机性的增加而大幅度的增加,与样本数量的增加关系不大。

?在大数据时代,随着收集数据的便捷性,以及数据处理速度加快,我们可以分析到更多的数据,甚至是可以处理和某个特别现象相关的所有数据,而不是依赖于随机采样。

25利用所有数据,而不是一小部分采样数据

?2011年发布的lytro相机就是一款具有“大数据”的相机。传统的相机只可以记录一束光的不同,而lytro相机可以收录这个光场所有的光,达到1100万束左右。具体生成什么样的照片则可以在拍摄之后再根据需要做决定。

26利用所有数据,而不是一小部分采样数据

?因为大数据是建立在掌握所有数据,至少是尽可能多的数据基础上,所以我们就可以正确的考察细节并进行新的分析。生活中真正有趣的事情经常隐匿在细节之中,而采样分析法却无法捕捉到这些细节。

4.“关联”思维

?强调数据之间的关联也很有用,而不去追求数据之间的因果关系。

?因果关系是最深刻的一类联系,但是我们很多时候并不能获得。

2728是什么,而不是为什么

?相关关系通过识别有用的关联物来帮助我们分析一个现象,而不是通过提示其内部的动作机制。但相关关系没有绝对,只有可能。

?蛋挞与飓风用品

?沃尔玛是世界上最大的零售商,掌握了大量的零售数据。通过分析,沃尔玛发现,每当季节性飓风来临之前,不仅手电筒销售量增加了,而且蛋挞的销量也增加了。因此,当季节性暴风来临时,沃尔玛会把库存的蛋挞放在靠近飓风用品的位置,以方便顾客。

?观察的范围包括:每一个顾客购物清单以及消费额、购物篮中的物品、具体的购买时间甚至是购买当日的天气。

29是什么,而不是为什么

?在以前人们需要有了想法,然后再去收集数据去测试这个想法的可行性。而现在我们有了更多

的数据以及更好的工具之后,要找到相关关系就变得更快,更容易了。

?大多数据情况下,一旦我们完成了对大数据的相关分析,而又不再满足于仅仅知道“是什么”时,我们就会继续向更深层研究因果关系,找出背后的“为什么”。

30提纲

大数据的概念及技术

大数据时代的思维和变革

大数据在企业中的应用案例

大数据所带来的机遇和挑战

31大数据在企业中的应用之一

预测

32大数据提升预测准确性

33世界杯大数据预测火了百度

34百度如何做到

通过爬虫等方法取得

35百度预测

36大数据在企业中的应用之二

营销:精准营销、整合营销、联合营销

37

38电商巨头阿里大数据生态圈已经建立

39零售业ZARA通过大数据创造独特竞争力

40零售业ZARA通过大数据创造独特竞争力

41传统制造企业耐克公司大数据战略

?

耐克凭借一种名为Nike+的新产品变身为大数据营销的创新公司。所谓Nike+,是一种以“Nike跑鞋或腕带+传感器”的产品,只要运动者穿着Nike+的跑鞋运动,iPod就可以存储并显示运动日期,时间、距离、热量消耗值等数据。用户上传数据到耐克社区,就能和同好分享讨论。

?

凭借运动者上传的数据,耐克公司已经成功建立了全球最大的运动网上社区,超过1000万活跃的用户,每天不停地上传数据,耐克借此与消费者建立前所未有的牢固关系。

42大数据能为Nike带来什么

Nike+:硬件、软件、社区的大平台

43大数据带给Nike的是利润

44大数据在企业中的应用之三

智慧城市

45什么是智慧城市

?由商业公司IBM在2010年提出概念:

?城市由六个核心系统组成:组织(人)、业务/政务、交通、通讯、水和能源。这些系统不是零散的,而是以一种协作方式相互衔接。而城市本身,则是由这些系统所组成的宏观系统

?

“智慧城市”的建设是个系统工程

?将集成整个城市所涉及的社会综合管理与公共服务资源,通过物联化、互联化、智能化方式,促进各种城市功能彼此协调运作,以实现更全面的互联互通、更深入的智能化

?无真正意义上的智慧城市范例可供参考

?但智能化、便捷的生活方式是可以预想的构成要素。

?最终让每个普通市民的日常生活因此受惠,提升生活品质。

46智慧城市的发展状况

?我国智慧城市建设从2012年第一批试点开始,目前已有290个市县区列入智慧城市试点,还有一些没被列入试点的城市也开始建设智慧城市。据不完全统计,在我国已有500多个城市进行了智慧城市建设。

?银川虽然是第二批列入智慧城市试点的城市,但银川与中兴通讯合作,紧抓时代机遇,迅速落地并成为全国首个高标准、全功能的智慧城市样板。

?目前,智慧银川已经与乌镇互联网、贵阳大数据并列为我国信息领域里产政结合三大热点之一。

47银川

?截至目前,银川已部署智能快递柜、智能垃圾桶、免费WIFI、人脸识别门禁、大气与噪音监测系统、直饮水改造、智慧医疗系统等11项智能化设备配套的小区数量达到20个,预期到今年年底数量将增加到100个以上。

?同时,在智慧城市建设上,银川在智慧政务、智慧交通、智慧环保等10大重点领域13个模块建设上独显特色,形成了可复制、可推广的智慧城市“银川模式”。

48智慧城市实例——无锡大数据中心

49智慧城市实例——无锡大数据中心

50智慧城市实例——无锡大数据中心

51大数据在企业中的应用之四

中国移动大数据

52中国移动的大数据

53内部的应用之精准营销

54内部的应用之洞察客户

55对外部的应用

?景点舒适指数据预测

?根据位置信令来分析景区用户数量,帮助旅游景区了解游客来源、分布等信息

?客流量分析

?帮助一些大的零售商分析顾客来源和各商铺、展位的人流情况。

56北京市旅游局景点舒适度预报

57提纲

大数据的概念及技术

大数据时代的思维和变革

大数据在企业中的应用案例

大数据所带来的机遇和挑战

大数据时代的机遇和挑战

5859大数据技术促进国家和社会发展

?当前,我国正处在全面建成小康社会征程中,工业化、信息化、城镇化、农业现代化任务很重,建设下一代信息基础设施,发展现代信息技术产业体系,健全信息安全保障体系,推进信息网络技术广泛运用,是实现四化同步发展的保证。大数据分析对我们深刻领会世情和国情,把握规律,实现科学发展,做出科学决策具有重要意义,我们必须重新认识数据的重要价值。

60大数据蓝海成为企业竞争的新焦点

?大数据所能带来的巨大商业价值,被认为将引领一场足以与20世纪计算机革命匹敌的巨大变革。大数据正在对每个领域都造成影响,包括商业、经济等领域。大数据正在保重新的蓝海,催生新的经济增长点,正在成为企业竞争的新焦点。

61大数据时代呼唤新型人才

?盖特纳咨询公司预测大数据将为全球带来440万个IT新岗位和上千万个非IT岗位。麦肯锡公司预测美国到2018年需要深度数据分析人才44万-49万,缺口14万-19万;需要既熟悉本单位需求又了解大数据技术与应用的管理者150万,这方面的人才缺口更大。中国是人才大国,但能理解与应用大数据创新人才更是稀缺资源。

大数据时代的新的就业岗位:

?大数据分析师

?数据管理专家

?大数据算法工程师

?数据产品经理

?等

62挑战一:业务部门没有清晰的大数据需求

?很多企业业务部门不了解大数据,也不了解大数据的应用场景和价值,因此难以提出大数据的准确需求。由于业务部门需求不清晰,大数据部门又是非盈利部门,企业决策层担心投入比较多的成本,导致了很多企业在搭建大数据部门时犹豫不决,或者很多企业都处于观望尝试的态度,从根本上影响了企业在大数据方向的发展,也阻碍了企业积累和挖掘自身的数据资产,甚至由于数据没有应用场景,删除很多有价值历史数据,导致企业数据资产流失。因此,这方面需要大数据从业者和专家一起,推动和分享大数据应用场景,让更多的业务人员了解大数据的价值。

63挑战二:企业内部数据孤岛严重

?企业启动大数据最重要的挑战是数据的碎片化。在很多企业中尤其是大型的企业,数据常常散落在不同部门,而且这些数据存在不同的数据仓库中,不同部门的数据技术也有可能不一样,这导致企业内部自己的数据都没法打通。如果不打通这些数据,大数据的价值则非常难挖掘。大数据需要不同数据的关联和整合才能更好的发挥理解客户和理解业务的优势。如何将不同部门的数据打通,并且实现技术和工具共享,才能更好的发挥企业大数据的价值。

64挑战三:数据可用性低,数据质量差

?很多中型以及大型企业,每时每刻也都在产生大量的数据,但很多企业在大数据的预处理阶段很不重视,导致数据处理很不规范。大数据预处理阶段需要抽取数据把数据转化为方便处理的数据类型,对数据进行清洗和去噪,以提取有效的数据等操作。甚至很多企业在数据的上报就出现很多不规范不合理的情况。以上种种原因,导致企业的数据的可用性差,数据质量差,数据不准确。而大数据的意义不仅仅是要收集规模庞大的数据信息,还有对收集到的数据进行很好的预处理处理,才有可能让数据分析和数据挖掘人员从可用性高的大数据中提取有价值的信息。Sybase的数据表明,高质量的数据的数据应用可以显著提升企业的商业表现,数据可用性提高10%,企业的业绩至少提升在10%以上。

65挑战四:数据安全

?网络化

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论