




已阅读5页,还剩21页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据时代,ERP班组2012.11,平均每一分钟中国互联网上发生了什么?,百度搜索查询,48.7万次,5万条,微博,465名,新用户,1.37亿人,同时QQ在线,556篇,博客文章,83名,新博客,4944条,心情更新,6597篇,日志发布,13.9万张,照片上传,3125条,状态更新发布,417篇,日记更新,97个,视频上传到优酷,内容总计14个小时,5.6万人,淘宝在线,交易额,230万元,80篇,新帖子发布,新回复,1200篇,大数据时代的到来,一切都在被记录,一切都在数据化,大数据时代的到来,大数据起源:1980年,家阿尔文托夫勒的第三次浪潮,大数据时代的到来,目录,一、什么大数据,“大数据”或称巨量数据、海量数据、大资料,指的是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。,一、什么是大数据,大数据的定义:,数据的存储单位有:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、NB、DB,它们按照进率1024(2的十次方)来计算:1Byte=8bit1KB=1,024Bytes1MB=1,024KB=1,048,576Bytes1GB=1,024MB=1,048,576KB1TB=1,024GB=1,048,576MB1PB=1,024TB=1,048,576GB1EB=1,024PB=1,048,576TB1ZB=1,024EB=1,048,576PB1YB=1,024ZB=1,048,576EB1NB=1,024YB=1,048,576ZB1DB=1,024NB=1,048,576YB,二、大数据的特征,数据量巨大,二、大数据的特征,数据类型多样,价值密度低,高速,如今的数据类型早已不是单一的文本形式,订单、日志、音频结构化数据(20%)、半结构化数据和非结构化数据(80%),犹如沙里淘金,实时获取需要的信息,大数据与传统数据的区别,一、什么是大数据,VS,大数据其实是人们根据电脑的优势,找出了一个全新的数据分析、挖掘方式,与传统的方式完全不同,二、大数据在企业中的运用,Target,一家比父亲更早知道女儿怀孕的超市曾经有一位男性顾客到一家塔吉特超市店中投诉,商店竟然给他还在读书的女儿寄婴儿用品的优惠券。这家全美第二大零售商,会搞出如此大的乌龙?但经过这位父亲与女儿进一步沟通,才发现自己女儿真的已经怀孕了。,未卜先知怀孕案例,如何比更早发现潜在的客户?,二、大数据在企业中的运用,Target公司是如何做到的呢?,1、数据信息记录,2、数据模型建立,3、数据实时监控,4、精准营销,根据大数据模型,Target制订了全新的广告营销方案,结果Target的孕期用品销售呈现了爆炸性的增长。公司大数据分析技术从孕妇这个细分顾客群开始向其他各种细分客户群推广,Target的销售额也因此从每年的440亿美元增长到了670亿美元。,二、大数据在企业中的运用,2019/12/14,13,可编辑,*,通过用户行为分析实现精准营销是大数据的典型应用,大数据在各行各业特别是公共服务领域同样具有广阔的应用前景,消费行业,金融服务,食品安全,医疗卫生,军事,交通环保,电子商务,气象,二、大数据在企业中的运用,5)利用大数据找到新的商业机会,开发产品,4)了解同行经营情况,针对性提升自己的业绩,3)为精准营销提供支持,2)真正实时的了解客户,1)给予上下游产业链者市场预判,大数据的价值,二、大数据在企业中的运用,1、手握大数据,但是没有利用好,2、没有数据,有大数据思维及技术,3、既有数据,又有大数据思维及技术,金融机构,电信行业,政府机构等,IT咨询和服务企业,比如,埃森哲,IBM等,Google,Amazon,BAT三巨头等,按大数据价值链分,分为三类,二、大数据在企业中的运用,三、大数据如何开展工作,有技术,有大数据思维,有数据,大数据部岗位总概述:建立更多的数据收集渠道去积累更多的数据,利用相关技术进行整理、分析,将数据转化为企业的资产!,一、数据从哪里来?,二、如何利用它?,企业运营大数据的三要数,三、大数据如何开展工作,2、数据在哪里,3、怎么获取,1、需要什么数据,三、大数据如何开展工作,一、数据从哪里来?,3、怎么获取数据的拥有者是我们数据的提供者和受益者。,三、大数据如何开展工作,一、数据从哪里来?,自我采集:,合作与购买:,基于大数据4V特征,要开发利用大数据,需要特殊的技术。关键技术一般包括:大数据采集、大数据统计分析、大数据挖掘、大数据展现和应用等技术,三、大数据如何开展工作,二、如何利用它?,1、大数据采集技术:利用多种轻型数据库来接收发自客户端的数据,并且用户可以通过这些数据库来进行简单的查询和处理工作。使用的产品:MySQL,Oracle,HBase,Redis和MongoDB等,2、大数据统计分析:海量的来自前端的数据快速导入到一个集中的大型分布式数据库或者分布式存储集群,利用分布式技术来对存储于其内的集中的海量数据进行普通的查询和分类汇总等,以此满足大多数常见的分析需求。使用的产品:Hadoop(Pig和Hive),YunTable,SAPHana和OracleExadata,基于大数据4V特征,要开发利用大数据,需要特殊的技术。关键技术一般包括:大数据采集、大数据统计分析、大数据挖掘、大数据展现和应用等技术,三、大数据如何开展工作,二、如何利用它?,3、大数据挖掘技术:基于前面的查询数据进行数据挖掘,来满足高级别的数据分析需求。使用的产品:HadoopMahout,4、大数据统展现与应用:可视化工具及大数据产品使用的产品:大数据魔镜(国内)、googlecharts,三、大数据如何开展工作,Hadoop主要功能,HBase,MapReduce,Hive,HDFS,快速的数据读取,大数据存储统计,复杂计算并行处理,HDFS:分布式文件系统有较强的容错性可在x86平台上运行,减少总体成本可扩展,能构建大规模的应用HBase:非结构化NoSQl分布式数据库基于分布式文件系统HDFS,保证数据安全列式存储,节省存储空间提供大数据量的高速读写操作Hive:分布式关系型数据库数据可保存在HDFS,可提供海量的数据存储类SQL的查询语句,提供大数据的统计和分析操作,适合海量数据的批处理通过MapReduce实现大规划并行计算MapReduce:大规划并行计算引擎可将任务分布并行运行在一个集群服务器中,四、公司大数据平台建设规划,购买VS自建,摩尔定律,大数据平台的建设,公司应分三个阶段,大数据平台建设初步阶段采集大数据,形成“入口”能力(12年时间),大数据平台建设中期阶段应用“入口”大数据,服务产品化(23年时间),大数据平台建设成熟期垂直整合,“入口”能力释放(持续发展),开发能采集用户大数据的智能产品、完善运营大数据的采集能力形成大数据采集、存储和管理的技术平台内外部数据梳理和整合,形成统一的用户大数据和运营大数据整合数据挖掘资源和能力,应用内外大数据支撑产品领先和消费体验领先战略发展,大数据技术平台成熟基于用户的大数据内生和应用平台形成形成12个领先型大数据产品拥有强
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 财产抵押延期还款合同3篇
- 马鞍山市铁塔维护合同4篇
- 新解读《GB-T 30985-2014光纤制造用石英玻璃把持棒》
- 建渣运输合同范本
- 食堂雇佣员工合同范本
- 出售农村车库合同范本
- f封窗合同范本
- 福特金融租赁合同范本
- 红酒劳动合同范本
- 电力塔征地合同范本
- 铁路专项病害课件
- 开学安全教育课件
- 桥梁养护应急知识培训课件
- 2025年学历类自考专业(学前教育)学前儿童发展-学前教育原理参考题库含答案解析(5套)
- 2025-2026学年人教版(2024)初中化学九年级上册教学计划及进度表
- 日本设备销售合同范本
- (2024)大学生宪法知识竞赛题库及答案
- 2025山西阳泉平定县从社区专职网格员中选聘社区专职工作人员考试备考试题及答案解析
- 2025云南昭通昭阳区住房和城乡建设局招聘编外工作人员5人笔试备考题库及答案解析
- 新高一数学暑假检测卷(学生版)-2025年新高一数学暑假衔接讲练 (人教A版)
- 电工与电子技术的发展
评论
0/150
提交评论