新一代大数据任务调度DolphinScheduler_第1页
新一代大数据任务调度DolphinScheduler_第2页
新一代大数据任务调度DolphinScheduler_第3页
新一代大数据任务调度DolphinScheduler_第4页
新一代大数据任务调度DolphinScheduler_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2020.11开源加速器新一代大数据任务调度ApacheDolphinScheduler代立冬DolphinScheduler

PPMC

&

Committer(incubator)介绍&

Roadmap目录DolphinScheduler介绍

1.3.3新版本发布近期Roadmap参与开源12345

DolphinScheduler应用案例01DolphinScheduler介绍ApacheDolphinScheduler大数据任务调度Apache

DolphinScheduler于17年在易观立项,19年3月开源,8月进入Apache孵化器,已累计有400+公司在生产上使用。DolphinScheduler致力于“解决大数据任务之间错综复杂的依赖关系,使整个数据处理过程可直观感知”。DolphinScheduler以DAG的方式将Task组装起来,可实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及Kill任务等操作DolphinScheduler要解决?可视化DAG依赖调用高可用任务日志/告警机制流程可容错能力0102030405简单易操作实时查看运行状态每天数万任务运行失败重试、回滚、转移简单可维护任务自依赖流程依赖等便于排错、提醒丰富的任务类型跨语言自定义插件机制补数06重刷历史数据DolphinScheduler社区建设情况多点头条易观腾讯京东平安华为陌陌观远阿里趣加小米滴滴中移动荔枝贡献者公司分布360同程快手代码贡献者文档贡献者部分用户案例(排名不分先后)DolphinScheduler特点

高可靠性

丰富的使用场景高扩展性去中心化的多Master和多Worker,自身支持HA功能,采用任务队列来避免过载,不会造成机器卡死DAG

监控界面,所有流程定义都是可视化,通过拖拽任务定制DAG,通过API方式与第三方系统对接,一键部署支持暂停恢复操作.支持多租户,更好的应对大数据的使用场景.支持更多的任务类型,如spark,hive,mr,python,sub_process,shell支持自定义任务类型,调度器使用分布式调度,调度能力随集群线性增长,Master和Worker支持动态上下线

简单易用DolphinScheduler主要能力支持每日十万数据量级任务稳定运行工作流可定时、依赖、手动、暂停/停止/恢复Task以DAG形式关联,实时监控任务的状态。去中心化设计确保系统的稳定、高可用。支持Shell、MR、Spark、SQL、依赖等10多种任务类型。支持补数、多租户、日志在线查看及资源在线管理完善的系统服务监控,任务超时告警/失败。工作流优先级、任务优先级,全局参数及局部自定义参数工作流流程可视化拖曳式配置可视化拖曳快速建立流程,大大提高数据导入任务创建效率。支持多种数据加工任务类型,包括Shell、数据源、Spark、Flink、MR、Python、Http,子流程、以及任务依赖。子流程支持可以让数据解析、数据导入等子流程复用,如数据格式解析、结果数据入库,避免重复配置,多种类型任务确保不同量级数据导入的效率工作流运行过程可视化任务支持重跑、重试且可以查看任务执行情况工作流流程支持多策略启动、优先级、告警配置任务流程多策略支持确保ETL过程可管理:支持任务失败策略选择,失败继续或结束支持多种通知策略

失败发送通知

成功发送通知

全部通知

全部不发通知支持优先级设定,确保高优先级流程优先执行支持选定节点执行ETL任务流支持串行与并行两种执行方式全方位系统监控,确保运行稳定安全中心1.3.x架构数据库减压,减少极端情况下的可能造成的调度延时Worker去DB操作,职责更单一Master和Worker直接通信,降低延时Master多种策略分发任务

-

Worker节点负载均衡策略:随机、循环及CPU和内存的线性加权负载均衡1.3.x

工作流程活动图02应用案例DolphinScheduler在易观千帆中的应用易观千帆是一款App对标分析产品。千帆是每天需要处理数百亿条数据,月活6.2亿,6.8

PB的大数据集群经过每天上万个任务ETL处理加工而产生的SaaS服务应用。2018年开始使用DolphinScheduler来调度整个ETL过程。右图是其中一条工作流DolphinScheduler在宝信的应用宝信对调度系统的需求DolphinScheduler在宝信的应用宝信对调度系统的需求宝信实现的功能扩展:插件类型任务资源缓存SQL功能扩展消息触发调度多数据源接入工作流并发控制操作审计

告警优化配置管理权限控制运行数据归档DolphinScheduler在奇安信的应用321678459资源文件的在线上传,管理jar包不怕丢实现集群高可用集群去中心化支持多租户咱俩不能用一个账号权限管理我只能访问授权的项目和资源各种复杂调度定时调度、依赖调度、手动调度丰富的任务类型可视化分布式易扩展无单点问题资源不够了要扩容sparkshellMRHIVE

python…拖拽生成DAG工作流任务失败重试/告警你想重试几次每次间隔多久失败要不要发邮件告诉你?Why

DolphinScheduler?031.3.3新版发布1.3.3重要修复[worker]由于已完成任务执行但未释放文件句柄,因此将打开太多文件。[api]删除流程实例级联删除任务日志时,log

client没有close现象:Too

many

open

files原因:#3618解决:/apache/incubator-dolphinscheduler/pull/3075/apache/incubator-dolphinscheduler/pull/39711.3.3重要修复现象:原因:当worker向master发送执行结果的时候,master刚好被挂掉,重启master后,工作流及任务状态一直为进行中,且工作流无法停止

master和worker异步交互,通信流程中遇到极端情况出现任务状态丢失问题/apache/incubator-dolphinscheduler/pull/3748解决:改为同步1.3.3重要修复现象:某些网络情况下,mastersubmittask时,无法进行netty通信,task信息发送不到worker,等待很长时间之后,出现timeout的异常,然后过一段儿时间就又会出现这种现象。#3789解决:

添加master和worker之间的心跳检测PR

#39131.3.3

small

fixbug:资源中心当上传同名文件时,原文件没有被覆盖#3702fix04近期Roadmap近期Roadmap1、官方Docker版本发版2、云原生支持优点:弹性伸缩充分利用服务器资源环境隔离缺点:

K8S运维经验

近期Roadmap

-

架构再升级1、邮件告警SPI化,新增短信告警、脚本回调告警实现(doing)2、注册中心SPI化,支持Etcd、Zookeeper等注册中心3、资源存储SPI化,HDFS、各种云等存储4、全局队列SPI化,支持Redis、Zookeeper等充当任务队列5、任务插件SPI化,支持扩展任务类型6、日志存储SPI化(优先级低)SPI优点1、SPI设计保持简洁2、不依赖过多第三方JAR3、各个插件保持独立缺点可能会存在些冗余代码的存在Service

Provide

Interface,

简称SPI

可扩展性–

SPI化近期Roadmap

-

架构再升级高性能1、Master重构减少数据库轮询减少线程使用2、度量参数近期Roadmap功能规划任务结果参数传递任务并发数控制有个任务队列设置的页面,这个页面可以设置多个队列,每个队列里可以设置任务并发数,每个任务可以指定他所属的队列列表依赖页面爆炸只关注自己相关的任务工作流版本管理(done)DolphinScheduler

SloganSUCCESS工具选的好调度用的对半夜安心睡下班回家早zzzzzz05参与开源DolphinScheduler资源在线DEMO:

94:8888/官网:仓库地址:

/apache/incubator-dolphinscheduler文档github地址:/apache/incubator-dolphinscheduler-website公众号:

海豚调度获得帮助:

Submitanissue

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论