课件yarn支持的计算框架_第1页
课件yarn支持的计算框架_第2页
课件yarn支持的计算框架_第3页
课件yarn支持的计算框架_第4页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Hadoop大数据解决方案进阶应用Hadoop讲师:迪伦(北风网 )YARN支持的计算框架(3) Storm On YARN服务 Apache Tez介绍 Tez实现原理课程目标YARN-Storm ApplicationMasterStorm ApplicationMaster初始化时,将在同一个Container中启动Storm Nimbus和Storm Web UI两个服务根据待启动的Supervisor数目向ResourceManager申请资源ApplicationMaster将请求一个节点上所有资源然后启动Supervisor服务也就是说,当前Supervisor将独占节点而不会与

2、其他服务共享节点资源,这种情况下可避免其他服务对Storm集群的干扰Storm ApplicationMaster还会启动一个Thrift Server以处理来自YARN-Storm Client端的各种请求当前Storm On YARN存在的问题难以将所有Storm服务运行在相邻的节点上,比如同一个机架上由于Nimbus服务运行在ApplicationMaster上,而一旦ApplicationMaster失败后,YARN会将它运行在另外一个节点上YARN需要提供一个ApplicationMaster或Nimbus位置获取服务,客户端直接通过该服务获取Nimbus位置即可NodeManage

3、r本身无法支持动态升级Apache Tez是什么Tez是Apache开源的支持DAG作业的计算框架直接源于MapReduce框架,核心思想是将Map和Reduce两个操作进一步拆分Map被拆分成Input、Processor、Sort、Merge和Output Reduce被拆分成Input、Shuffle、Sort、Merge、Processor和Output分解后的元操作可以任意灵活组合,产生新的操作,这些操作经过一些控制程序组装后,可形成一个大的DAG作业天生融入Hadoop 2.0中的资源管理平台YARNTez主要由两部分组成数据处理引擎DAGAppMaster传统的MR运行过程包括H

4、ive,Pig和直接编写MR程序采用Tez的运行过程使用MapReduce和Tez解决WordCount问题Tez特点与MapReduce兼容,继承了MapReduce的各种优点(比如良好的扩展性和容错性)运行在YARN之上适用于DAG(有向图)应用Apache当前有顶级项目Oozie用于DAG作业设计,但Oozie是比较高层(作业层面)的Tez在更底层提供了DAG编程接口,用户编写程序时直接采用这些接口进行程序设计,这种更底层的编程方式会带来更高的效率Tez数据处理引擎Tez提供了6中可编程组件,实现了一些常见的算法和组件Input:对输入数据源的抽象,类似于MR模型中的InputFormat,它解析输入数据格式,并吐出一个个Key/valueOutput:对输出数据源的抽象,类似于MR模型中的OutputFormat,它将用户程序产生的Key/value写入文件系统Partitioner:对数据进行分片,类似于MR中的PartitionerProcessor:对计算单元的抽象,它从一个Input中获取数据,经用户定义的逻辑处理后,通过Output输出到文件系统Task:对任务的抽象,每

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论