大数据基本信息_第1页
大数据基本信息_第2页
大数据基本信息_第3页
大数据基本信息_第4页
大数据基本信息_第5页
已阅读5页,还剩33页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、大数据(shj)尹航 2022 10月 成都Big Data第一页,共三十八页。大数据(shj)什么是大数据大数据原理和构成大数据应用大数据价值Big Data目录第二页,共三十八页。什么(shn me)是大数据第三页,共三十八页。Big Data什么是大数据HadoopIBM英特尔HP数据(shj)商业智能数据库服务器SAP HANANoSQLSQLHDFS预测(yc)数据流运算(yn sun)节点机器学习并行计算磁盘阵列甲骨文AMD内存计算GoogleMap reduce 可视化GbPbTbZb第四页,共三十八页。Big Data什么是大数据由多个软件、硬件部分组成的一个数据系统一个执行体

2、系有别于传统企业数据中心,用来应对现代海量数据化的生活,商业环境。不是一个行业,而是一种新的数据处理方法是关于数据的运输和处理,以及最后有效使用的体系与云计算一样 都是一种新的生产组织形式Web 2.0时代的解决方案大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为(chngwi)帮助企业经营决策更积极目的的资讯第五页,共三十八页。Big Data什么是大数据大数据(shj)的目的原始(yunsh)数据的处理和分类存储将存储的数据(shj)调取并分析最终提供决策依据 归类数据类型有效分析组合大数据的特点

3、4V海量高速多样精确第六页,共三十八页。Big Data什么是大数据1 KB = 1024字节(z ji)存储(cn ch)单位1 MB = 1024 KB1 GB = 1024MB1 TB = 1024GB 1 PB = 1024TB = 1,048,576 GB1 EB = 1024PB = 1,073,741,824 GB 1 ZB = 1024EB = 1,099,511,627,776 GB100万 G10亿 G1万亿 G22亿台215万台2100台500G硬盘电脑(dinno)15寸电脑排成行可以往返一次月球第七页,共三十八页。Big Data什么是大数据Volume 海量(hil

4、ing)1 PB = 1024TB = 1,048,576 GB1 EB = 1024PB = 1,073,741,824 GB 1 ZB = 1024EB = 1,099,511,627,776 GBIntel:人类文明开始到2021年 地球共产生(chnshng)了5EB数据.2022年全年(qun nin),全球产生数据2.7ZB 是 2021年以前的500倍2022年,全球估计产生数据8ZB,等于1800万个美国国会图书馆44%35 ZB2000年 数字信息占全球数据量的25% 75%都在报纸 胶片 磁带等媒介2022年 数字信息 98% 非数字信息 2%第八页,共三十八页。Big D

5、ata什么是大数据商业数据(shj)现状Twitter2022年 5000条微博更新(gngxn)/天2022年 30万条微博更新/天2022年 250万条微博更新/天2022年 3500万条微博更新/天2022年 2亿条微博更新/天2022年 4亿条微博更新/天2022年 上传时长12年的视频(shpn)/天2022年 用户分享25亿条信息/天我国一个一线城市的健康档案数据 5PB/年我国一个智慧城市的数据 800 PB/年 一个单数据表几亿-几百亿条记录下线商品14亿件,在线商品8亿件淘宝数据库存了20PB数据平均每月增加1.5PB智能移动终端设备的巨量增长第九页,共三十八页。Big Da

6、ta什么是大数据Velocity 高速(o s)6000万用户登录/天20亿次 页面访问/天每天1.2亿次网站访问 响应(xingyng)时间小于100毫秒大数据的惊人不止是在数量上,同时数据还是巨量具有动态分析价值的数据。访问响应时间的加快,数据库读写速度的加快,对电商企业来说就等于多成交。对于很多情况下,动态的数据价值远大于静态数据,比如气象(qxing)预测,灾难预测,快消行业等。由于输入速度加快,所以要求输出速度也要加快第十页,共三十八页。Big Data什么是大数据Variety 多样(du yn)数据(shj):结构化数据半结构化数据非结构化数据指关系(gun x)型数据表指关系结

7、构与内容混合在一起的数据类型文档、视频、音频、图片20% 结构化 80非结构化企业数据2022年互联网产生的数据25% 结构化 75非结构化50%-70%源于人与人的互动第十一页,共三十八页。9、 人的价值,在招收诱惑的一瞬间被决定。2022/9/12022/9/1Thursday, September 1, 202210、低头要有勇气,抬头要有低气。2022/9/12022/9/12022/9/19/1/2022 10:27:20 PM11、人总是珍惜为得到。2022/9/12022/9/12022/9/1Sep-2201-Sep-2212、人乱于心,不宽余请。2022/9/12022/9/

8、12022/9/1Thursday, September 1, 202213、生气是拿别人做错的事来惩罚自己。2022/9/12022/9/12022/9/12022/9/19/1/202214、抱最大的希望,作最大的努力。01 九月 20222022/9/12022/9/12022/9/115、一个人炫耀什么,说明他内心缺少(qusho)什么。九月 222022/9/12022/9/12022/9/19/1/202216、业余生活要有意义,不要越轨。2022/9/12022/9/101 September 202217、一个人即使已登上顶峰,也仍要自强不息。2022/9/12022/9/12

9、022/9/12022/9/1第十二页,共三十八页。Big Data什么是大数据Veracity 准确(zhnqu)大数据(shj)的核心思想之一准确源自于对全部(qunb)数据的处理分析基础数据的真实准确性,才能保证结果的有效性。第十三页,共三十八页。Big Data什么是大数据大数据(shj) VS 云计算两者都是生产方式改变(gibin)为主,生产资料改变(gibin)为辅,提高生产效率。云计算是将计算和存储(cn ch),由本地转移到了云端。大数据则是提供了一套新的计算和存储工作原理。二者有本质的不同,但却是一个完整的体系。大数据可以是云计算的心脏,云计算是大数据服务的通路。第十四页,

10、共三十八页。Big Data什么是大数据大数据(shj) VS 物联网物联网(lin wn)是大数据的流程中的第一层采集(cij)层物联网网关以上就进入了大数据工作范畴。局部域内的物联网应用解决方案等同于这个域内的大数据系统第十五页,共三十八页。大数据(shj)原理和构成第十六页,共三十八页。大数据(shj)的核心工作思路大数据系统颠覆(dinf)了传统数据中心的工作逻辑传统数据系统工作(gngzu)逻辑:运算系统调动数据库的数据,数据的移动。大数据系统工作逻辑:运算系统直接部署至数据处,数据仅架构内移动。Big Data大数据原理和构成第十七页,共三十八页。Big Data大数据原理和构成传

11、统(chuntng)数据系统工作原理客户(k h)客户(k h)客户客户客户客户互联网路由器访问请求负载均衡服务器集群DBDBDBDB数据库集群数据调用请求数据移动结果反馈第十八页,共三十八页。Big Data大数据原理和构成Hadoop 软件(run jin)框架大数据系统核心(hxn)组件 MapreduceHBaseHDFSHadoop核心(hxn)子项目第十九页,共三十八页。Big Data大数据原理和构成Hadoop系统工作(gngzu)原理第二十页,共三十八页。Big Data大数据原理和构成Hadoop系统(xtng)构架第二十一页,共三十八页。Big Data大数据原理和构成存

12、储(cn ch)与数据库的比较传统(chuntng)数据中心HadoopJOBD RAID存储系统HDFS容错性扩展性某已分配任务出错,该计算(j sun)必须重新执行节点灵活调整节点相对固定,扩展时会造成无法访问在任务执行中任何时候可任意添加节点SQLNoSQL数据类型平行计算系统Map Reduce RAID出现坏盘后,重建阵列需要十多个小时,这在大数据时代是无法接受的第二十二页,共三十八页。Big Data大数据原理和构成SAP HANAHadoop 的升级(shng j)内存计算技术 真正的海量数据瞬间(shn jin)分析内存数据库 实现任何地点、任何时候、可以查看实时的动态数据,任

13、何时候都可以知道正在发生着什么(shn me)。并且做出应对。利用高性能的大数据一体机服务器,将数据库直接植入大容量内存中进行实时处理。Hadoop Mapreduce HDFSHBase第二十三页,共三十八页。Big Data大数据原理和构成大数据(shj)的硬件32颗处理器、每颗处理器12核 = 384核 X 96个线程32TB的内存 很多中型企业的数据库也只不过几TB.可以完美(wnmi)运行内存计算数据库大数据(shj)一体机服务器+存储+网络 = 融合基础架构SeaMicro SM1500064颗处理器、每颗处理器8核 = 512核心4TB的内存 5PB本地存储10U的空间万兆以太网

14、System x3650 M4机架式 2U2颗处理器 8核心内存最大 768GB本地存储9TB2.6万换算成10U的空间80核心 第二十四页,共三十八页。大数据(shj)的软件数据(shj)存储管理数据处理数据分析Hadoop 数据库软件(run jin) Big Data大数据原理和构成提取 转换 归类可视化 BI商业智能大数据的核心价值高附加值阶段第二十五页,共三十八页。大数据(shj)应用第二十六页,共三十八页。Big Data大数据应用大数据(shj)应用的意义巨量(j lin)数据的产生对所有复杂数据格式的归类管理(gunl)分析20%结构化数据的分析利用 80%非结构化的没有发挥作

15、用,商业洞察力的资源浪费。找出最优解决方案应用的核心大数据分析第二十七页,共三十八页。Big Data大数据应用数据(shj)质量和数据(shj)管理可视化分析(fnx)语义引擎(ynqng)数据挖掘算法预测性分析能力大数据应用的分析方法高质量的数据处理和管理是输出高质量结果的前提深入数据内部,用机器去做人工做不到的数据价值发现从非结构化数据中提取信息的方式展示数据分析结果,供使用者决策根据可视化和数据挖掘的结果做出预测第二十八页,共三十八页。Big Data大数据应用大数据应用的分析(fnx)逻辑DescriptivePredictivePrescriptive发生(fshng)了什么?为什

16、么?还会发生(fshng)什么?还会发生什么?,如果发生了,如何应对?第二十九页,共三十八页。Big Data大数据应用大数据应用(yngyng)的假想一给某总办公室、汽车、家里装上烟感。发现某总在办公室的抽烟数量最大,在车里和在家基本不抽。那么就可以知道,某总在工作期间香烟以及与香烟有关的产品消费多。那在家期间的消费习惯又是什么,根据人的行为习惯,不抽烟但需要其他事情分散注意力。吃东西?看电视?看书?。这样就可以深入了解一个人的消费行为习惯,从而提前(tqin)做出应对或者积极的主动应对。第三十页,共三十八页。Big Data大数据应用大数据应用(yngyng)的假想二通过对某人淘宝购物的跟

17、踪分析,挖掘出他的消费趋势。某男,在电子商务网站上长期买衣服,内衣等商品。 通过消费记录可以预知其单身。用百度联盟,把世纪佳缘,花田等交友网站的广告推送给他。某男开始买女士消费品了比如衣服,鞋帽等。 则说明该男找到女朋友了。通过信用卡记录可以分析出其关系进展情况。发现其买房,装修了。则该男快结婚了。之后就是(jish)孕婴用品的推荐。第三十一页,共三十八页。Big Data大数据应用大数据(shj)的大应用城市智能交通智能电力照明能源管理系统智能健康(jinkng)医疗体系政府财政管理综合信息系统工商企业信息系统。第三十二页,共三十八页。大数据(shj)价值第三十三页,共三十八页。Big Da

18、ta大数据价值大数据市场(shchng)价值IDC预测 中国(zhn u)的大数据服务市场 2022年 7760万美元 增长到 2022年 6亿美元IDC预测 2022年全球市场(shchng)规模238亿美元 31.7%服务器市场 21.1% 存储市场53.4%基础设备40%趋势增值服务软件第三十四页,共三十八页。Big Data大数据价值大数据市场(shchng)价值第三十五页,共三十八页。谢谢(xi xie)第三十六页,共三十八页。9、 人的价值(jizh),在招收诱惑的一瞬间被决定。2022/9/12022/9/1Thursday, September 1, 202210、低头要有勇气,抬头要有低气。2022/9/12022/9/12022/9/19/1/2022 10:27:20 PM11、人总是珍惜为得到。2022/9/12022/9/1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论