hadoop实战案例57-Flume日志收集系统.ppt_第1页
hadoop实战案例57-Flume日志收集系统.ppt_第2页
hadoop实战案例57-Flume日志收集系统.ppt_第3页
hadoop实战案例57-Flume日志收集系统.ppt_第4页
hadoop实战案例57-Flume日志收集系统.ppt_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Hadoop大数据解决方案进阶应用,Hadoop,讲师:迪伦(北风网版权所有),Flume日志收集系统 (1),Flume的基本概念 Flume OG架构,课程目标,Flume是什么,由Cloudera公司开源 分布式、可靠、高可用的海量日志采集系统 数据源可定制,可扩展 数据存储系统可定制,可扩展 中间件:屏蔽了数据源和数据存储系统的异构性,Flume OG和NG两个版本,Flume OG OG:“Original Generation” 0.9.x或cdh3以及更早版本 由agent、collector、master等组件构成 Flume NG NG:“Next/New Generatio

2、n” 1.x或cdh4以及之后的版本 由Agent、Client等组件构成 为什么要推出NG版本 精简代码 架构简化,Flume OG基本架构,Flume使用两个组件:Master和Node,Agent,用于采集数据,将数据源的数据发送给collector 通常由source和sink两部分组成 Source用于获取数据,可从文本文件,syslog,HTTP等获取数据; Sink将Source获得的数据进一步传输给后面的Collector。 syslogTcp(5140) | agentSink(localhost,35853) tail(/etc/services) | agentSink(

3、localhost,35853) Flume自带了直接可用的数据源(source) text(filename) tail(filename) fsyslogTcp(5140),Agent,Flume提供了很多Sink console(format) text(“txtfile”) dfs(“dfsfile”) syslogTcp(“host”,port) agentSink(machine,port) agentDFOSink(machine ,port) agentBESink(machine,port) agentE2EChain,Collector,汇总多个Agent结果 将汇总结果导

4、入后端存储系统,比如HDFS,Hbase Flume提供了collector的source collectorSource(port) autoCollectorSource logicalSource Flume提供了collector的sink collectorSink( fsdir,fsfileprefix,rollmillis) customdfs(hdfspath, format) 例子collectorSource(35853) | consolecollectorSource(35853) | collectorSink(file:/tmp/flume/collected, syslog);collectorSource(35853) |

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论