实验结果分析三PPT课件_第1页
实验结果分析三PPT课件_第2页
实验结果分析三PPT课件_第3页
实验结果分析三PPT课件_第4页
实验结果分析三PPT课件_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,1,面向一种云计算平台的调度技术研究,学生:李丽英指导老师:李仁发教授唐卓讲师时间:2011年5月28日,2,主要内容,研究背景及意义,目前存在的问题,研究内容及成果,总结及展望,3,研究背景及意义,云计算是把集成化的基础设施动态的分配给内部或者外部使用,这种充分利用现有资源并对资源进行整合形成资源池后,再按需分配给用户的服务提供方式受到了商业化应用的极大推荐。,1、应用背景,4,研究背景及意义,2、云计算特点,3、云计算调度技术特点与发展现状,Perfect?,应该具备的特征,发展现状,可扩展性动态性服务等级区分性,云技术调度技术研究处于刚起步的阶段存在不同的云计算平台,基于具体平台的调度技术甚少,5,主要内容,研究背景及意义,Hadoop调度技术目前存在的问题,研究内容及成果,总结及展望,6,Hadoop平台调度技术目前存在的问题,存在不足,1、Hadoop是典型的处理数据密集型任务的分布式云计算平台。调度算法需要考虑数据的读取问题,2、Hadoop自带的任务推测执行算法会导致过多的任务备份执行,2、Hadoop的数据存储方式以及任务处理模式导致数据局部性问题异常突出,3、数据局部性问题会严重影响Hadoop云计算平台的性能,1、Hadoop云平台同时可能处理成千上万的任务,备份任务推测执行调度算法还处于不完善的阶段,3、备份任务推测执行调度算法也需要考虑数据局部性优化问题,信息隐蔽技术,备份任务推测执行,数据局部性问题,7,主要内容,研究背景及意义,目前存在的问题,研究内容及成果,总结及展望,8,研究内容及成果,本文从两方面分析Hadoop云计算平台中备份任务推测执行调度性能:,在考虑数据局部性优化问题的同时,利用概率论原理权衡数据局部性优化问题和因其反而影响平台调度性能的问题,基于数据局部性改进LATE备份任务推测执行调度算法,分机架考虑备份任务推测执行的调度,方面一,方面二,9,基于数据局部性对LATE算法的改进策略,Hadoop系统架构,10,Hadoop集群部署,Hadoop集群按数据中心、机架、节点三层架构部署集群,11,学习过程之一社保基础知识,改进算法的详细设计,SpeculationCap,同一时刻Hadoop系统中的备份任务执行数阈值,判断任务是否需要备份执行阈值,SlowTaskThreshold,判断节点处理任务快慢的阈值,SlowNodeThreshold,改进算法中三个基本参数说明,t是任务已经执行了的时间ProgresScore进程分Progressrate是进程速率T是最终要得到的任务完成还需要的时间,判断为慢任务的计算公式:,12,改进算法的详细设计,如果有一个节点请求新的任务,并且整个Hadoop集群中备份任务执行数量小于SpeculationCap,则往下执行:,第一步:判断节点的快慢,如果低于SlowNodeThreshold,则忽略这个请求,结束整个算法,否则继续执行。,第二步:根据请求任务节点所在的机架,对该机架上正在执行的任务,首先根据SlowTaskThreshold的值判定是否为慢任务,如果是则计算完成还需要多少时间,并放入一个队列中,对这个队列按照时间长短从低到高进行排序,同时对于还没有标记且已经开始等待推测执行的任务进行标记。如果队列不为空,则执行第三步,否则执行第四步。,13,改进算法的详细设计,第三步:在该队列中查找是否有数据存储在请求节点的任务,如果没有则查找队列中是否有等待时间大于T1的任务,否则从该队列中选择排在首位的任务推测执行。,第四步:对其它机架上正在执行的任务判断是否为慢任务,如果是则放进另外一个队列中,计算完成任务还需要多少时间后从低到高进行排序,同时对于还没有标记且已经开始等待推测执行的任务进行标记,首先选择队列中等待时间大于T2的任务,没有则选择排在队列中最前的任务推测执行。,14,改进算法的详细设计T1、T2值设定,采用一个简单的数学模式来评估任务等待本地节/机架处理时给任务响应时间带来的影响,由于在大规模集群中,请求任务处理的节点刚好是任务队列中首个任务需要这个节点数据的情况,服从概率论当中的稀有事件发生概率模型,即每t秒之内有这种事件发生。因此事件的发生概率服从泊松分布:,t:代表每t秒之内有这种稀有事件发生t1:代表每个任务在非节点/机架处理比在本节点/机架处理需要花的时间多t1秒t2:任务等待在本节点/机架处理的时间为t2秒,T1、T2值的设定,15,改进算法在云计算仿真平台Cloudsim中的仿真实验性能分析,仿真平台环境配置:CloudSim仿真工具软件包Windows操作系统或linux操作系统1.86GHz以上处理器JDK1.6以上版本Eclipse开发平台扩展工具ant1.7.1,模拟的Hadoop集群配置:机架里的主机数,虚拟机数都尽量参照了EC2部署Hadoop集群的方式,模拟两个实验场景:第一个实验场景:没有故障的节点,但是节点之间有性能差异第二个实验场景:设置集群中有故障节点的情况,16,实验结果分析一:工作响应时间,根据Hadoop集群中一个数据块的大小,处理任务的时间,以及部署集群时网络资源的性能等,设置了不同的T1、T2值验证工作响应时间,从上图可以分析出当T1=15秒、T2=20秒的情况下任务的响应时间最佳。,17,实验结果分析一:工作响应时间,对两个场景分别进行了模拟实验,分析证明在没有故障节点的第一个场景下,改进的算法平均工作响应时间依然略高于其它两个算法;在第二个场景中,Hadoop没有采用备份任务推测执行调度算法的工作响应时间会明显大于推测执行算法。,18,实验结果分析一:工作响应时间,不同Sort工作大小在三种算法下任务响应时间对比,不同Grep工作大小在三种算法下任务响应时间对比,响应时间的减少率从30GB的约20%降到了90GB的15%,三个算法之间的性能差异随着工作的增大会越来越小。,19,实验结果分析一:工作响应时间,Sort工作在三种算法下的响应时间,Grep工作在三种算法下的响应时间,1、最优性能:基于数据局部性改进的LATE算法高于其它两种算法2、最差性能:改进的算法跟LATE算法相差不大3、平均性能:改进的算法有着比较明显的优势4、不同的工作类型在性能表现上的差异:Sort工作使用改进后的推测执行算法在性能上会比其它两种算法会有更大程度的改善,20,实验结果分析二:任务本地化处理率分析,为了验证基于数据局部性的改进算法对提高本地化处理任务的作用,设置了大小不同的工作,输入数据:640MB、3200MB、6400MB。即Map任务的个数分别是10、50、100,集群中机架数分别设置为4个和10个。,10个Map任务时本节点/机架处理率,4个机架时本节点/机架处理率,10个机架时本节点/机架处理率,21,实验结果分析二:任务本地化处理率分析,50个Map任务时本节点/机架处理率,4个机架时本节点/机架处理率,10个机架时本节点/机架处理率,100个Map任务时本节点/机架处理率,4个机架时本节点/机架处理率,10个机架时本节点/机架处理率,22,结论,实验结果分析二:任务本地化处理率分析,纵向比较,改进的LATE算法相对LATE算法任务的本地节点/机架处理率提高了6%9%,但相对Hadoop自带的算法优势并不是很明显。而对于较大的工作,数据局部性改进算法的处理优势没有小的工作增加的明显,当机架数少于等于4个时,基本上数据块在不同的机架存有其副本,任务本节点/本机架处理的概率会很高,就算没有基于数据局部性的改进算法,任务推测执行本地化处理的性能也会比较理想,横向比较,按照集群从小到大的顺序,LATE算法任务本节点/机架处理率依次减小,从上述三组图中可以分析出以下结论:,23,实验结果分析三:系统吞吐率分析,从上图可以分析出基于数据局部性的改进算法无论在什么工作类型的情形下都能提高系统的吞吐率性能在绝大部分备份执行任务都在本节点/机架上处理时,系统吞吐率提高了近150%,多个Sort工作系统吞吐率对比,多个Grep工作系统吞吐率对比,不同的工作类型系统吞吐率对比,24,主要内容,研究背景及意义,目前存在的问题,研究内容及成果,总结及展望,25,总结,根据Hadoop数据的存储特性,提出了基于数据局部性对LATE算法的改进策略,在Hadoop平台中分机架考虑任务推测执行的调度问题,选择备份任务推测执行时,优先选择数据存储在请求处理的节点或者机架上的任务推测执行;如果没有数据存储在本节点或者本机架的任务需要推测执行,再考虑在其它机架上查找需要推测执行的任务,利用统计学概率论解决任务等待时间过长影响工作响应时间的情况。根据泊松分布,综合考虑数据局部性优化和任务等待本节点或者本机架处理时间过长反而影响任务响应时间的问题,本文研究的主要贡献,26,展望,改进的算法选择备份任务执行时,要对整个系统进行两次排序:一次是本机架内部的任务,一次是跨机架的任务,这样会消耗一部分时间,并且有可能会因为跨机架的原因跳过最需要备份执行的任务,如果能考虑对其它机架上的任务由于跨机架读取数据的原因而设定一个权值,然后在参考该权值的基础上引入排队论的原理对整个机架上所有的任务统一进行一次加权排序,这样性能估计会有更大程度上的提高,只是这个权值比较难以取舍,需要一些理论依据,希望以后能从这方面加以改进,由于实验条件的限制,只能在仿真平台中搭建模拟的环境进行仿真测试,跟实际系统上测试的性能会有所差别,所以希望能在实际的Hadoop平台中进行进一步的性能测试分析,ONE,TWO,27,论文发表情况,李丽英,唐卓,李仁发基于LATE的Hadoop

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论