企业大数据解决方案.ppt_第1页
企业大数据解决方案.ppt_第2页
企业大数据解决方案.ppt_第3页
企业大数据解决方案.ppt_第4页
企业大数据解决方案.ppt_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,大数据时代,泽佳助力企业发展,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第2页,什么是大数据,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第3页,数据无处不在,任何时间,任何地点,任何事情,任何人?Anytime,anywhere,anything,anyone?,休息中,随意刷微博,爬山时,记录每一瞬间,旅途中,处理公司事件,工作时,实时掌握市场动态,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第4页,大数据时代已经来到,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第5页,互联网中的大数据,Web3.0时代,社交媒体网站数据出现井喷式激增,截至2013年3月底,新浪微博注册用户数增长到5.36亿,日均活跃用户数达到4980万,每日新增微博约2亿。企业在大数据时代,面临文化、战略、组织、流程、信息化、公共公关系、人才培养方方面面的挑战,同时也迎来重大的转型机遇和飞跃契机。,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第6页,互联网中的大数据,大数据在消费IT领域的作用更加明显。只要你用PC上网或手机浏览信息,你便在网络上处处留照了,性别、年龄、爱好、踪迹、信用等等便被大数据刻画的一览无余,恭喜你已经成为数字透明人了!可能你都不知道自己下一步要干什么,产品经销商借助搜索引擎、电子商务平台、旅游网站的数据根据你的浏览行为已经在为你张罗生日、餐饮、旅游、结婚、生子、购房、购车了,特价机票、婚纱、尿不湿、奶粉、海景房等广告已经为你编排好了。大数据在消费IT领域的作用更加明显。只要你用PC上网或手机浏览信息,你便在网络上处处留照了,性别、年龄、爱好、踪迹、信用等等便被大数据刻画的一览无余,恭喜你已经成为数字透明人了!可能你都不知道自己下一步要干什么,产品经销商借助搜索引擎、电子商务平台、旅游网站的数据根据你的浏览行为已经在为你张罗生日、餐饮、旅游、结婚、生子、购房、购车了,特价机票、婚纱、尿不湿、奶粉、海景房等广告已经为你编排好了。,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第7页,企业IT进入2.0时代,随着公司业务的增长,大量和流程、规则相关的非结构化数据也爆发式增长。比如:1、业务系统现在平均每天存储20万张图片,磁盘空间每天消耗100G;2、平均每天产生签约视频文件6000个,每个平均250M,磁盘空间每天消耗1T;,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第8页,大数据的特性,68%,31%,来源多;格式多:大数据包括结构化数据和非结构化数据,邮件,Word,图片,音频信息,视频信息。,最新研究报告,到2020年,全球数据使用量预计暴增44倍,达到35.2ZB。,价值密度低,犹如沙里淘金,海量业务中寻找价值。,1秒定律,实时获取所需要的数据,为决策提供依据。,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第9页,企业大数据的挑战,业务数据的映射,提取大数据价值,大数据隐私,大数据分析,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第10页,泽佳建议企业大数据解决方案,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第11页,大数据基础架构要求,可预测的低延迟高事务参数灵活的数据结构,获取,组织,分析,决策,高吞吐量就地准备所有数据源和结构,深度分析敏捷开发高度可伸缩性,实时流数据运营影响,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第12页,泽佳大数据解决方案,以数据融合、综合处理为方向,大交易数据,大交互数据,大交易融合,大数据处理,企业,供应链,消费者,SNS,互联网,物联网,移动终端,OLTP实时交易处理,OLAP实时分析处理,SOCIALMEDIADATA,OTHERINTERACTIONDATA,Machine/DeviceSensors/meters/RFIDtagsCDR/mobile,SD,MM,PP,SD,FICO。,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第13页,泽佳大数据解决方案整体架构,企业内外部协同(供应商+企业内部+客户+银行+税务+政府+社区+),外部信息(社交+电商+移动+视音频+),开放式API和协议,通用的设计和模型环境,通用数据管理环境,交易数据管理,社交数据管理,移动数据管理,主数据管理,内存数据管理,企业数据仓库管理,数据存储,数据获取,数据组织,数据分析,数据展现,无线数据管理,信息管理和实时数据迁移,联合访问,实时大数据平台,门户,数据分析,电子邮件,办公软件,大屏幕,电脑桌面,移动终端,企业级报告工具,Adhoc即时查询,例外分析,非结构化数据探索,预测与挖掘,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第14页,泽佳大数据解决方案体系,数据多样性,模式,动态模式,HDFS分布式文件系统,Hbase分布式列存储系统,SybaseESP事件流处理器,HdoopMapReduce,BigDataConnectors,YounghongBI,获取,组织,分析,决策,复杂场景处理,实时决策,ETL,EDW,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第15页,一般企业数据处理平台的基础架构,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第16页,泽佳大数据解决方案基础架构,门户,泽佳大数据平台,快速、可靠,大屏幕,电脑桌面,电子邮件,SCM,CRM,ERP,数据分析人员,办公软件,移动终端,安全,部署,管理,灵活体系,MES,PDM,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第17页,泽佳建议企业大数据解决方案基础架构图,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第18页,应用层数据分析,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第19页,视频存储,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第20页,离线日志分析,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第21页,在线数据分析,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第22页,大数据解决方案特点,泽佳大数据解决方案提供高速、低速两种互联解决方案,在节点间能够建立起40Gb的互联通路,彻底消除系统节点间通信的瓶颈。,高性能,高可扩展性,高可靠,相比较传统的数据库集群,泽佳大数据解决方案具有良好的可扩展性,随着数据节点的增加,系统整体性能接近线性增加。同时数据节点可以在系统运行中动态添加,对系统不会造成任何影响。因此企业可以根据自身业务需要,动态添加数据节点,当业务量较小时,配置较少的数据节点,随着业务量的逐渐增多,添加相应的数据节点,从而满足自身业务量增长的需求。,泽佳大数据解决方案能自动地维护数据的多份复制,并且在任务失败后能自动地重新部署(redeploy)计算任务。同时消除系统单点故障,系统中任意一个部分出现故障,系统将自动进行切换,保证用户应用的无缝连接,具有较高的稳定性和可靠性。,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第23页,大数据应用技术,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第24页,大数据的技术领域占位图,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第25页,泽佳大数据应用主要技术Hadoop,据IDC的预测,全球大数据市场2015年将达170亿美元规模,市场发展前景很大。而Hadoop作为新一代的架构和技术,因为有利于并行分布处理“大数据”而备受重视。ApacheHadoop是一个用java语言实现的软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算,它可以让应用程序支持上千个节点和PB级别的数据。Hadoop是项目的总称,主要是由分布式存储(HDFS)、分布式计算(MapReduce)等组成。,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第26页,Hadoop体系架构,MapReduce,HDFS,HBase,Pig,ChuKwa,Hive,ZooKeeper,Pig是一个基于Hadoop的大规模数据分析平台,Pig为复杂的海量数据并行计算提供了一个简易的操作和编程接口。Chukwa是基于Hadoop的集群监控系统,由yahoo贡献。Hive是基于Hadoop的一个工具,提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。ZooKeeper:高效的,可扩展的协调系统,存储和协调关键共享状态。HBase是一个开源的,基于列存储模型的分布式数据库。HDFS是一个分布式文件系统。有着高容错性的特点,并且设计用来部署在低廉的硬件上,适合那些有着超大数据集的应用程序。MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第27页,Hadoop核心设计,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第28页,HDFS文件读流程,HDFS是一个分布式文件系统。有着高容错性的特点,并且设计用来部署在低廉的硬件上,适合那些有着超大数据集的应用程序。Client向NameNode发起文件读取的请求。NameNode返回文件存储的DataNode的信息。Client读取文件信息。,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第29页,HDFS文件写流程,Client向NameNode发起文件写入的请求。NameNode根据文件大小和文件块配置情况,返回给Client它所管理部分DataNode的信息。Client将文件划分为多个Block,根据DataNode的地址信息,按顺序写入到每一个DataNode块中。,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第30页,MapReduce映射、化简编程模型,输入数据-Map分解任务-执行并返回结果-Reduce汇总结果-输出结果,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第31页,Hbase分布式数据存储系统,Client:使用HBaseRPC机制与HMaster和HRegionServer进行通信Zookeeper:协同服务管理,HMaster通过Zookeepe可以随时感知各个HRegionServer的健康状况HMaster:管理用户对表的增删改查操作HRegionServer:HBase中最核心的模块,主要负责响应用户I/O请求,向HDFS文件系统中读写数据HRegion:Hbase中分布式存储的最小单元,可以理解成一个TableHStore:HBase存储的核心。由MemStore和StoreFile组成。HLog:每次用户操作写入Memstore的同时,也会写一份数据到HLog文件,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第32页,大数据未来发展瓶颈,通过对大数据产业链的分析,我们可以看到,在大数据产业链的各个生产环节中,各大公司都已开占位,随着高性能计算机、海量数据的存储和管理的流程的不断优化,技术能够解决的问题终将不会成为问题。我们认为,真正会制约或者成为大数据发展和应用瓶颈的有三个环节:数据收集和提取的合法性,数据隐私的保护和数据隐私应用之间的权衡。大数据发挥协同效应需要产业链各个环节的企业达成竞争与合作的平衡。大数据结论的解读和应用。,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第33页,NoSQL产品,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第34页,大数据应用案例,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第35页,大数据行业应用分析,应用可能性,电信,政府(公共事业),交通,金融,医疗,教育,能源(电力/石油),纵轴契合度:表示该用户的IT应用特点与大数据特性的契合程度;横轴应用可能性:表示该用户出于主客观因素在短期内投资大数据的可能性;注:该位置为分析师访谈的综合印象,为定性分析,图中位置不代表具体数值,High,Mid,Low,Low,Mid,High,优先关注行业用户,应用特点与大数据技术有较高的契合度,在主客观条件上也有较高的应用可能性。,值得关注行业用户应有特点与大数据的契合度及应用可能性综合较高,适当关注行业用户两个维度暂时都不具备优势,可适当给予关注,互联网(电子商务),契合度,流通,零售,制造,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第36页,互联网行业大数据需求分析,互联网行业拥抱大数据的关键因素,互联网大数据技术的应用,会首先带动社会化媒体、电子商务的快速发展,其他的互联网分支也会紧追其后,整个行业在大数据的推动下将会蓬勃发展。,互联网行业对数据实时分析要求较高,例如广告监测、B2C业务,往往要求在数秒内返回上亿行数据的分析,从而达到不影响用户体验和快速准确营销的目的。目前互联网企业面对大数据,会普遍感觉到实时分析能力差、海量数据处理效率低、缺少分析方法、分析软件能力差等问题。,互联网行业大数据分析面临的主要问题,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第37页,腾讯基于Hadoop的大数据架构图,2013北京泽佳公司版权所有,Copyright2013ZejiaConsultingCorporation,第38页,腾讯大数据现状,从业务角

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论