版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于案例讲解Storm实时计算目录Storm的应用场景举例Storm简介Storm的主要特点Storm组件Storm编程模型Storm安装Storm实例讲解Storm的应用场景举例淘宝双十一实时销售额统计车辆7*24小时监控电信行业重大节假日实时保障监控电商实时推荐1.
Storm是一个分布式的、容错的实时计算系统,它采用Clojure编写的2.Storm可被用于“流处理”之中,实时处理消息并更新数据库3.Storm可以进行连续查询并把结果即时反馈给客户,比如将Twitter上的热门话题发送到客户端4.Storm可以用来并行处理密集查询,Storm的拓扑结构是一个等待调用信息的分布函数,当它收到一条调用信息后,会对查询进行计算,并返回查询结果。Storm简介Storm的主要特点1.简单的编程模型。类似于MapReduce降低了并行批处理复杂性,Storm降低了进行实时处理的复杂性。2.可以使用各种编程语言。你可以在Storm之上使用各种编程语言。默认支持Clojure、Java、Ruby和Python。3.水平扩展。计算是在多个线程、进程和服务器之间并行进行的。4.可靠的消息处理。Storm保证每个消息至少能得到一次完整处理。任务失败时,它会负责从消息源重试消息。5.快速。系统的设计保证了消息能得到快速的处理,使用ZeroMQ作为其底层消息队列。6.本地模式。Storm有一个“本地模式”,可以在处理过程中完全模拟Storm集群。这让你可以快速进行开发和单元测试。Storm组件首先我们通过一个storm和hadoop的对比来了解storm中的基本概念。hadoopstorm系统角色JobtrackerNimbusTasktrackerSupervisorChildWorker应用名称JobTopology组件接口M/RSpout/Bolt运行状态数据处理完就结束一旦运行,根本停不下来。。。Nimbus:负责资源分配和任务调度。Supervisor:负责接受nimbus分配的任务,启动和停止属于自己管理的worker进程。Worker:运行具体处理组件逻辑的进程。Task:worker中每一个spout/bolt的线程称为一个task.在storm0.8之后,task不再与物理线程对应,同一个spout/bolt的task可能会共享一个物理线程,该线程称为executor。Storm组件下面这个图描述了以上几个角色之间的关系。NimbuszookeeperzookeeperzookeeperSupervisorSupervisorSupervisorSupervisorSupervisorSupervisorWorkerWorkerWorker主控节点,用于提交任务,分配集群任务,监控集群状态协调,存放集群的公共数据(心跳,集群状态,配置信息),Nimbus分配给Supervisor的任务接受Nimbus分配的任务,管理自己的Worker进程具体的处理逻辑组件Storm组件在storm中,应用程序的实现实时处理的逻辑被封装在Topology中一个Topology是由Spout组件(数据源)和Bolt组件(数据操作)通过StreamGroupings进行连接的TopologySpout数据源是否在高速上在高速上,速度是否>120<=120>120存入超速数据库不在高速上,速度是否>80>80<=80实时监控超速车辆Storm组件简而言之,Spout从来源处读取数据并放入topology。Spout分成可靠和不可靠两种;当Storm接收失败时,可靠的Spout会对tuple(元组,数据项组成的列表)进行重发;而不可靠的Spout不会考虑接收成功与否只发射一次。而Spout中最主要的方法就是nextTuple(),该方法会发射一个新的tuple到topology,如果没有新tuple发射则会简单的返回一个Topology是由Spout组件(数据源)和Bolt组件(数据操作)通过StreamTopology中所有的处理都由Bolt完成。Bolt可以完成任何事,比如:连接的过滤、聚合、访问文件/数据库、等等。Bolt从Spout中接收数据并进行处理,如果遇到复杂流的处理也可能将tuple发送给另一个Bolt进行处理。而Bolt中最重要的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年监控工程(监控安装)考题及答案
- 2025年大学三年级(口腔医学)口腔颌面外科学试题及答案
- 2025年高职体育保健与康复(运动康复训练)试题及答案
- 2025年高职中草药栽培与加工技术(中药炮制基础)试题及答案
- 2025年高职粮油储藏与检测技术(粮油储藏检测)试题及答案
- 2025年个体诊所医疗器械自查报告范文
- 深度解析(2026)GBT 18310.4-2001纤维光学互连器件和无源器件 基本试验和测量程序 第2-4部分试验 光纤光缆保持力
- 深度解析(2026)《GBT 18223-2000木工机床 升降台 术语》(2026年)深度解析
- 深度解析(2026)《GBT 18104-2000魔芋精粉》
- 深度解析(2026)《GBT 17980.91-2004农药 田间药效试验准则(二) 第91部分杀菌剂防治烟草赤星病》
- 河南省青桐鸣大联考2024-2025学年高二上学期12月月考试题生物含解析
- 地震波速反演方法-洞察及研究
- 2025安徽宣城宁国市面向社会招聘社区工作者25人笔试考试参考试题及答案解析
- 应急救援电源
- 电力行业电力工程设计师岗位招聘考试试卷及答案
- 2026年出租汽车驾驶员(区域科目)自测试题及答案
- 球队战术讲解课件
- 2025年6月四级真题
- 2026年锦州师范高等专科学校单招职业适应性测试题库必考题
- 2025急性高甘油三酯血症胰腺炎康复期多学科管理共识解读
- 汽车清洁度检测方法
评论
0/150
提交评论