第一部分、cm下cdh4.1集群高级管理一教程大纲_第1页
第一部分、cm下cdh4.1集群高级管理一教程大纲_第2页
第一部分、cm下cdh4.1集群高级管理一教程大纲_第3页
全文预览已结束

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、名称Cloudera Hadoop 4 系列实战课程(业日志流量分析项目)课程讲师:Cloudy课程分类:Java涉及项目:业日志流量分析项目用到技术:Sqoop 使用、Cloudera Hadoop 4、Hive其他特性:Hbase涵盖内容:、代码、ppt数量:40目前 Hadoop 的应用越来越广泛,很多企业都开始采用,Hadoop也很稀缺和抢手,待遇和远比 Java、.Net 开发好。本系列课讲解目前主流的 Hadoop 版本 Cloudera Hadoop 4(这里采用cdh4.1),该版本相比 0.20.x,性能和稳定性上提高很多。cdh4 环境搭建相比旧版本也复杂很多,但可以用 c

2、loudera-manager 对集群进行管理和配置。CDH4 默认集成了常用的所有组件如 Hive、Sqoop、HBase、Hue、Pig、Flume、Mahout、Zookeeper等,从而形成能强大的分布式。本课会一些本人所在团队自研的适用于企业级开发和应用的框架和工具,这些有效提高了开发效率,大大降低了成本,这些正是多年实战的结晶。每节课约 35 分钟第一章(9 讲)cloudera manager 介绍和安装chd4.1 介绍chd4.1 安装chd4.1 集群环境搭建、相关组件安装cloudera manager 管理集群cloudera manager 下集群高级管理第二章(约

3、10 讲)Hive 原理Hive 元数据管理Hive 数据表和数据Hive 的 Java 扩展开发Hive UDF 和 UDAF 开发Hive JDBC 连接Hive 常见场景,实战练习Hive -f 传参框架开发由于 hive 自带命令 hive -f 无法传参数,导致 hive 跨文件的使用基本瘫痪, 无法大量推广。该框架可以任意传参,让 hive 企业级应用开发更高效和简洁。第三章(约 5 讲)Sqoop 原理Sqoop 使用详解用 Sqoop 实现 HDFS/Hive 与关系数据库的数据交互用 Sqoop 实现 HBase 与关系数据库的数据交互第四章(约 8 讲)Hbase 原理Hbase 系统架构Hbase机制Hbase 基本使用Hbase 表设计思路和方案常见应用场景和 Hive 交互Java、WEB 开发第五章 项目实战(约 8 讲)业日志流量分析项目,互联网企业对海量日志的分析是 Hadoop 应用的一个重要用途,也是对网站流量、客户行为分析的重要途径。该项目整合 Hive、Hbase、Sqoop 等常用组件,涉及从理到前台呈现的每一个技术环节。包括:业务需求介绍

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论