




已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Hadoop以及在大数据应用,马健馨北京语言大学,大纲,Hadoop简介,Hadoop就是一个实现了Google云计算系统的开源系统,包括并行计算模型Map/Reduce,分布式文件系统HDFS,以及分布式数据库Hbase,同时Hadoop的相关项目也很丰富,包括ZooKeeper,Pig,Chukwa,Hive,Hbase,Mahout,flume等.,Hadoop处理流程,编程接口-streaming,管道传输数据任何可以操作标准输入输出的语言都可以写streaming并行处理程序。,hive数据仓库,Hive是为提供简单的数据操作而设计的下一代分布式数据仓库。它提供了简单的类似SQL的语法的HiveQL语言进行数据查询。同时,HiveQL语言能力不足时,它也能允许使用Map/reduce并行计算模型进行复杂数据分析。HIVE可以将存储在Hadoop中的数据文件映射为一张数据库表,并提供了一套查询语言HQL。HQL以SQL为基础,自动转换为MapReduce任务进行运行,使用起来非常方便。,Hive架构,Hive特点以及典型应用,1.特点不能保证处理的低迟延(lowlatency)问题。批处理大规模数据2.典型应用ETL处理OLAP系统BI系统日志分析,Hive日志分析架构,Hive支持的数据类型以及操作,数据类型:简单类型:INT,STRING,boolean复杂类型:Struct、Map和Array操作:SELECTDISTINCT,JOINS,WHERE,GROUPBY,Hive程序开发,Java:hive-JDBCClientC/C+:ODBCclientPython,ThriftHivephp,流程,Hive序列化反序列化,HIVE里面的数据及其结构以类的形式储存,并提供了串行器和反串行器来实现HIVE内部的类和普通编程语言的类之间的转换。有了串行器和反串行器,我们就能在HIVE中对输入文
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025嘉兴市众业供电服务有限公司招聘74人考前自测高频考点模拟试题及答案详解(网校专用)
- 2025广东省高校毕业生三支一扶计划招募3000人考前自测高频考点模拟试题附答案详解(完整版)
- 2025年潍坊护理职业学院公开招聘高层次(高技能)人才(10人)模拟试卷及答案详解(名师系列)
- 安全培训教学竞赛课件
- 2025河北保定市雄安新区雄县事业单位招聘89人模拟试卷及完整答案详解一套
- 河北省【中职专业高考】2025年中职高考对口升学(理论考试)真题卷【旅游大类】模拟练习
- 居间协议打印版本5篇
- 广播体操课件铃声
- 2025安徽安庆职业技术学院招聘33人模拟试卷及完整答案详解一套
- 2025年医疗康复器材项目合作计划书
- 平台运营中心管理制度
- 彩钢板房安装合同范本
- 竞选卫生委员演讲稿
- 2025-2030年中国课外辅导行业市场现状供需分析及投资评估规划分析研究报告
- 2025年中国钢包烘烤器市场现状分析及前景预测报告
- 《直肠造口护理》课件
- 网络安全现状
- 全球公共卫生事件的国际协作与应对
- 伤口造口护理指南版
- 《轨道交通自动门系统用行星齿轮减速器》编制说明
- 《设计中的艺术》课件
评论
0/150
提交评论