




已阅读5页,还剩25页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大规模分布式计算 MapReduce和Hadoop 数据平台与产品部少杰 变化正在进行 Agenda 分布式计算 需求 大规模数据 为什么使用分布式 分布式计算 需求 成本 为什么使用分布式 分布式计算 并行化的尝试在硬件工艺 技术不变的前提下 提升计算能力更强大的硬件对称多处理器SMP分布式共享内存DSM分布式系统SharediskSharenothing Abriefhistory 分布式计算 互联网应用的特殊性I O操作强于计算操作复杂异构的机器环境变化的业务逻辑 新需求 分布式计算 MapReduce分布式编程模型互联网应用的大规模数据计算解决方案 MapReduce 分布式计算 MapReduce的优势简单一致性模型本地I O优化扩展性 WhyMapReducewins 分布式计算 应用现状数据分析 报表索引商业智能服务规模淘宝 现状 分布式计算 总结 总结 分布式计算 BREAK MapReduce编程模型 游戏什么是MapReduce 分布式编程模型 WhatisMapReduce MapReduce编程模型 MapReduce语义Map 映射 空间变换Reduce 汇总 规约 MapReducemethodology MapReduce编程模型 MapReduce数据结构map in key in value list out key intermediate value reduce out key list intermediate value list out value 分布式算法的核心内容 MapReducemethodology MapReduce编程模型 系统视图系统考量容灾扩展性并行能力 Master slave结构 Asystematicview MapReduce编程模型 系统视图计算消耗网络I O磁盘I O排序Map Reduce计算 Asystematicview MapReduce编程模型 系统视图并行能力子任务间并行M R任务间并行作业间并行 Asystematicview MapReduce编程模型 范例web点击日志统计 PV UV词频统计海量数据排序表Join Discuss MapReduce编程模型 MapReduce能做 日志分析商业智能分析客户营销大规模索引 MapReduce不能 在线应用复杂依赖逻辑 循环 递归 MapReduce的数据倾斜问题 WhatMapReducecando can tdo MapReduce编程模型 总结 总结 MapReduce编程模型 Break Hadoop 开源分布式系统实现系统栈 Whatis Hadoop Hadoop的历史2003Google发表有关MapReduce论文2005Nutch迁移到MapReduce实现2006 1DougCutting加入Yahoo 2006 2Yahoo从Nutch中剥离出MapReduce并开始使用Hadoop2007 1Yahoo组建1000 节点的Hadoop集群2008 1Hadoop成为ApacheTLP Hadoop abriefhistory Hadoop HDFS 分布式文件系统设计原则硬件错误是常态而不是异常流式数据访问大规模数据集简单的一致性模型 移动计算比移动数据更划算 异构软硬件平台间的可移植性 HDFS Hadoop HDFS特性大容量高容错性高吞吐量HDFS数据模型包块文件 HDFS Hadoop MapReduce 分布式计算框架语言支持JavaC throughpipes scriptlanguages throughstreaming 调度模型tasksjobsgroups MapReduce Hadoop 编写MapReduce逻辑Javamapper reducer comb
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建设工程施工造价协议
- 守秘协议数据声明承诺书(4篇)
- 绿色10万吨年有机垃圾处理及资源化利用可行性研究报告
- 可持续1000亩生态农业园建设规模及核心技术可行性研究报告
- 绿色节能1000吨日餐厨垃圾处理核心技术及运营模式可行性研究报告
- 可持续绿色1000套绿色住宅小区绿色家居运营模式可行性研究报告
- 可持续绿色建筑群节能改造建设形态可行性研究报告
- 绿色交通1000辆电动环卫车可行性研究报告
- 跨境电商海外营销中心2025年市场细分与目标客户分析报告
- 组织企业参加活动方案
- 社区工作-徐永祥-高教出版社-全要点课件
- 肉制品工艺学-香肠类制品-课件
- 敬畏规则行有所止生命教育主题班会
- 哮病(支气管哮喘急性发作)中医护理方案
- 中小企业员工离职原因分析与对策研究
- GB/T 9728-2007化学试剂硫酸盐测定通用方法
- GB/T 2992.1-2011耐火砖形状尺寸第1部分:通用砖
- 神经系统的分级调节课件 【知识精讲+备课精研+高效课堂】 高二上学期生物人教版选择性必修1
- 三年级上册数学试卷-第一单元 混合运算 北师大版 (含答案)
- 教学课件-英语学术论文写作(第二版)
- 实习证明模板(两种格式)
评论
0/150
提交评论