并行计算 云计算 MapReduce.doc_第1页
并行计算 云计算 MapReduce.doc_第2页
并行计算 云计算 MapReduce.doc_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

并行计算论文:改进型MapReduce框架的研究与设计【中文摘要】随着云计算迎来了蓬勃的发展,Hadoop作为开源云计算平台,得到了国内外很多公司和高校的青睐。相应的,作为Hadoop的子项目和分布式并行处理框架的MapReduce,目前基于它的应用越来越多,特别是在大数据量处理方面,通过将应用任务并行化,使应用系统的处理性能有了很大的提升。但随着应用的广泛性和多样性,针对具体应用,其暴露出来的不足和需要改进之处越来越多,Hadoop还没有到达1.0版本。本文主要对MapReduce框架做以下几方面的探讨:(1)简要介绍了并行计算、分布式计算、云计算三种计算模型的定义及其相关概念,通过分析总结出MapReduce框架是符合三种计算模型的。引入Hadoop和MapReduce框架处理流程和机制,为下文提出改进方案奠定基础(2)通过剖析具体应用以及深入分析框架处理流程和相关源代码实现,总结实际应用中出现的一些影响执行效率的问题,如数据倾斜问题、规约任务不均衡问题和规约调度问题等(3)提供了针对出现问题的改进方案,主要实现了针对中间结果进行切割的切分函数、启动新规约任务的机制以及相应的调度机制,给出了改进后的方案设计架构和实现(4)经过多次.【英文摘要】As the cloud computing has a rapid development, Hadoop an open source cloud computing platform has been adopted by domestic and foreign companies. Accordingly, as a sub-project of Hadoop and a distributed parallel processing framework, there are more and more applications based on MapReduce. Along with the breadth and diversity of the application, it exposes many places need to be improved.In this paper, we do some research on MapReduce framework as following:(1) The concept of parallel computing, d.【关键词】并行计算 云计算 MapReduce【英文关键词】parallel computing cloud computing MapReduce【索购全文】联系Q1:138113721 Q2:139938848【目录】改进型MapReduce框架的研究与设计摘要4-5ABSTRACT5第一章 绪论9-111.1 研究背景91.2 研究内容9-101.3 论文组织结构10-11第二章 相关概念和工作11-312.1 并行计算11-132.1.1 并行计算定义112.1.2 并行计算编程模型11-132.1.3 并行编程与MapReduce的关系132.2 分布式计算13-142.2.1 分布式计算定义13-142.2.2 分布式计算与MapReduce关系142.3 云计算14-192.3.1 云计算概述14-152.3.2 云计算的类型152.3.3 云计算的关键技术15-172.3.4 云计算与MapReduce关系17-192.4 MapReduce相关概念19-292.4.1 MapReduce概述192.4.2 Hadoop分布式文件系统19-222.4.3 MapReduce框架的内部概念22-252.4.4 Hadoop工作流程25-272.4.5 MapReduce具体内部流程27-292.5 MapReduce相关改进29-302.5.1 MapReduce Online292.5.2 数据流并行化29-302.6 小结30-31第三章 改进型的MapReduce框架设计31-403.1 MapReduce框架处理流程可能造成的问题31-323.1.1 中间结果不均衡31-323.1.2 数据倾斜和任务不均衡323.2 系统架构32-333.3 改进方案33-403.3.1 判断机制343.3.2 大数据块的切分函数34-363.3.3 任务调度36-383.3.4 系统主要类图38-393.3.5 结论39-40第四章 试验验证40-644.1 硬件环境404.2 软件环境40-644.2.1 操作系统版本404.2.2 核心应用软件版本40

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论