《大规模分布式计算》PPT课件.ppt_第1页
《大规模分布式计算》PPT课件.ppt_第2页
《大规模分布式计算》PPT课件.ppt_第3页
《大规模分布式计算》PPT课件.ppt_第4页
《大规模分布式计算》PPT课件.ppt_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大规模分布式计算 MapReduce和Hadoop 数据平台与产品部少杰 变化正在进行 Agenda 分布式计算 需求 大规模数据 为什么使用分布式 分布式计算 需求 成本 为什么使用分布式 分布式计算 并行化的尝试在硬件工艺 技术不变的前提下 提升计算能力更强大的硬件对称多处理器SMP分布式共享内存DSM分布式系统SharediskSharenothing Abriefhistory 分布式计算 互联网应用的特殊性I O操作强于计算操作复杂异构的机器环境变化的业务逻辑 新需求 分布式计算 MapReduce分布式编程模型互联网应用的大规模数据计算解决方案 MapReduce 分布式计算 MapReduce的优势简单一致性模型本地I O优化扩展性 WhyMapReducewins 分布式计算 应用现状数据分析 报表索引商业智能服务规模淘宝 现状 分布式计算 总结 总结 分布式计算 BREAK MapReduce编程模型 游戏什么是MapReduce 分布式编程模型 WhatisMapReduce MapReduce编程模型 MapReduce语义Map 映射 空间变换Reduce 汇总 规约 MapReducemethodology MapReduce编程模型 MapReduce数据结构map in key in value list out key intermediate value reduce out key list intermediate value list out value 分布式算法的核心内容 MapReducemethodology MapReduce编程模型 系统视图系统考量容灾扩展性并行能力 Master slave结构 Asystematicview MapReduce编程模型 系统视图计算消耗网络I O磁盘I O排序Map Reduce计算 Asystematicview MapReduce编程模型 系统视图并行能力子任务间并行M R任务间并行作业间并行 Asystematicview MapReduce编程模型 范例web点击日志统计 PV UV词频统计海量数据排序表Join Discuss MapReduce编程模型 MapReduce能做 日志分析商业智能分析客户营销大规模索引 MapReduce不能 在线应用复杂依赖逻辑 循环 递归 MapReduce的数据倾斜问题 WhatMapReducecando can tdo MapReduce编程模型 总结 总结 MapReduce编程模型 Break Hadoop 开源分布式系统实现系统栈 Whatis Hadoop Hadoop的历史2003Google发表有关MapReduce论文2005Nutch迁移到MapReduce实现2006 1DougCutting加入Yahoo 2006 2Yahoo从Nutch中剥离出MapReduce并开始使用Hadoop2007 1Yahoo组建1000 节点的Hadoop集群2008 1Hadoop成为ApacheTLP Hadoop abriefhistory Hadoop HDFS 分布式文件系统设计原则硬件错误是常态而不是异常流式数据访问大规模数据集简单的一致性模型 移动计算比移动数据更划算 异构软硬件平台间的可移植性 HDFS Hadoop HDFS特性大容量高容错性高吞吐量HDFS数据模型包块文件 HDFS Hadoop MapReduce 分布式计算框架语言支持JavaC throughpipes scriptlanguages throughstreaming 调度模型tasksjobsgroups MapReduce Hadoop 编写MapReduce逻辑Javamapper reducer comb

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论