




已阅读5页,还剩18页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据技术发展趋势 1 目录 CONTENTS 交易 对账 社交 订票 统计报表用户行为分析 智能推荐营销 预测性维护 数据管理系统 三明治理论 应用 硬件 对数据进行存储 管理 加工支持上层的应用 3 数据管理系统发展历史 数据管理系统在发展过程中分化为面向事务处理的OLTP数据库和面向分析决策的OLAP数据库摩尔定律促使CPU和内存的性能不断提升 价格不断下降 近期CPU的摩尔定律失效 内存还在继续 推动了数据管理系统从高端服务器向x86架构的迁移互联网业务推动下 数据爆发式增长 使得单机无法承受 系统必须向分布式架构转移 4 数据管理系统的分化 在线事务与在线分析 5 目录 CONTENTS 大分析 分析架构的变化 Teradata一体机IBMnetteza一体机 银行的报表 谷歌的互联网广告用户行为分析和用户画像推荐系统 GFS MapReduce Bigtable 部署在X86服务器上Greenplum Vertica等MPP数据库 Hadoop Spark等开源技术 部署在X86服务器上Greenplum在2016年进行开源 金融 电信 公安 交通 政务 能源等行业报表 精准营销 风控 舆情 预测性维护等应用 互联网业务推动下 数据爆发式增长 使得单机无法承受 系统必须向分布式架构转移从互联网公司发动的分析架构的革命 借助开源民众化的思想 迅速扩展 经过10年的发展影响到了各个行业大数据分析架构的另外一个主要特点 在线 7 2003 谷歌发布DFS的论文 DougCutting与MikeCafarella一起基于谷歌论文实现了Hadoop的代码 2004 谷歌发布MapReduce的论文 2006 2006 谷歌发布了Bigtable的论文 2007 Powerset基于Bigtable研发了HBase 2008 雅虎在生产环境中使用Hadoop集群 Hadoop渐渐成为互联网企业的数据仓库 2009 Ucberkley的AMPlab研发出Spark 第一个SQLonHadoop引擎Hive诞生 2009 2012 Hadoop成为企业级的成熟产品 Spark成为下一代计算引擎 2014 2016 谷歌开源深度学习框架Tensorflow 大分析 大数据分析技术发展 当代数据架构师面临挑战主要来自扩展性和多种异构硬件 由单核向多核的扩展演变为多种类型的GPU FPGA ASIC等存储中的变量在于NVRAM有可能替换DRAM成为主存 8 大分析 趋势 混搭 企业像搭积木一样使用开源的大数据技术融合 以SQL为牵引力的在线分析和在线事务会趋向融合架构分离 大数据平台和深度学习平台一段时间将持续分割状态 直到迎来下一次融合 反馈 分析本身将经历四个阶段 9 大分析 信通院和数促会开展大数据产品标准化与评测 从2015到2017年启动Hadoop和MPP两项评测 共31家企业的33个产品通过评测 其中26款Hadoop产品 7款MPP数据库产品 总测试项目达52个 致力于推动大数据产品和工具的成熟 统一标准 输出经验 10 目录 CONTENTS 大资产 大数据意味着每个行业都将从数据贫农过渡到数据大户 交通 电信 医疗 社交网络 移动互联网 能源 12 大资产 数据资产管理的变迁 13 大资产 数据资产管理实施路径 有哪些数据 分散在哪里 规模多大 产生的频率多高 定义数据标准 建立大数据平台 进行数据汇集 根据应用需要 引入外部数据 规范化内部外数据标准对数据的质量进行整治了解数据的分布和血缘关系 划分数据安全等级 和数据权限 构建数据应用 对数据使用活性 成本 应用的价值进行评估 14 大资产 趋势与挑战 趋势 挑战 15 维度 大资产 信通院和数促会开展数据资产管理研究 开展区块链等新技术在数据流通中的应用研究 启动数据价值评估等研究 发布数据资产管理白皮书 大数据服务规范与评测 16 目录 CONTENTS 大事务 事务数据发展对比 银行核心交易系统 互联网的交易系统 CPU的摩尔定律失效业务量逐年增加 双11 秒杀 单机数据库的性能到瓶颈 需要换条车道国家安全考虑 18 大事务 分布式数据库发展历程 商业数据库 Oracle DB2等商业数据库开始兴起 关系型模型 完整的事务 开源数据库标题 在此录入上述图表的描述说明 在此录入上述图表的描述说明 在此录入上述图表的描述说明 在此录入上述图表的描述说明 NoSQL数据库和数据库中间件 在此录入上述图表的描述说明 在此录入上述图表的描述说明 在此录入上述图表的描述说明 NewSQL 在此录入上述图表的描述说明 在此录入上述图表的描述说明 在此录入上述图表的描述说明 在此录入上述图表的描述说明 1995年后出现了开源数据库MySQL和PostgreSQL数据库本身对单机性能不断的优化 和遵循摩尔定律的硬件性能提升 BigTable 弥补了分布式文件系统对小对象的插入 更新 随机读请求的缺陷 解决了扩展性的问题 HBase是BigTable的开源实现 MongoDB Redis Cassandra等一系列优秀NoSQL数据库兴起关系数据库中间件和分库分表方案 谷歌Spanner和F1实现了关系型模型和流畅扩展性的融合 支持分布式事务 全球分布国内在2013 2014年开始探索分布式数据库 蚂蚁金服Oceanbase PingCAPTidb 19 大事务 趋势 20 大事务 迁移的挑战 21 总结 业务的爆炸发展 数据的指数级增长 成也摩尔定律 败也摩尔定律 遵循摩尔定律硬件快速发展 以及近期的CPU摩尔定律失
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- Lesson 9说课稿-2025-2026学年小学英语五年级下册清华大学版
- 1.1等腰三角形(第二课时)说课稿2024-2025学年北师大版数学 八年级下册
- 2.2.2.2两栖动物和爬行动物说课稿-2024-2025学年人教版七年级生物上册
- 2024-2025学年高中地理上学期第十周《气压带和风带》说课稿 新人教版必修1
- 湖南省茶陵县高中英语 Unit 3 Tomorrows World Task说课稿 牛津译林版必修4
- 2025《临时物业服务合同》
- 2025高级管理人员停薪留职合同模板
- 2025年合同终止劳动合同的情形解析
- 机械厂证照管理制度
- 人教版高中历史必修2第二单元第6课 殖民扩张与世界市场的拓展 教学设计
- 【知识解析】分析生态脆弱区成因的基本思路
- 学前教育专业钢琴弹唱PPT全套教学课件
- 清华大学风景介绍
- SB/T 11004-2013电子提单(物权凭证)使用规范
- GB/T 16294-2010医药工业洁净室(区)沉降菌的测试方法
- GB/T 14486-2008塑料模塑件尺寸公差
- 《国际公法》全册配套完整课件
- 第三单元名著导读《朝花夕拾-二十四孝图》课件(15张PPT) 部编版语文七年级上册
- 特种设备管理台帐(5个台账)
- l领导干部心理健康知识讲座课件
- 经口鼻吸痰技术新版
评论
0/150
提交评论