大数据分析培训机构学习路线_第1页
大数据分析培训机构学习路线_第2页
大数据分析培训机构学习路线_第3页
大数据分析培训机构学习路线_第4页
大数据分析培训机构学习路线_第5页
已阅读5页,还剩30页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

课程主题课程内容课程目标

第一阶段(Java根底高级)

静态导入、自动封箱拆箱、

Java语言的可变参数、增强for、枚举、

掌握Java语言的高级特性

高级特性类加载器、反射、内省、泛

型、注解、动态代理回

掌握Java线程池技术,掌握

多线程加强、线程池、

Java多线程线程的Join、notify.

ThreadLocal

notifyAII等机制

Dom解析、Sax解析、Pull

XML解析基于Xml的解析与维护

Schema

掌握简单的Html,Css3s

WebHtml,Css,Js

的编写

实训工程一:易买网工程

第二阶段(Web阶段,易买网工程贯穿)

JAVAWEB工程介绍、工程开发流程了解真实工程开发流程

前端技术HtmkCSS.JS掌握前端开发根本技术

课程主题课程内容课程目标

Tomcat.HTTP协议、

ServletJsp,EL、JSTL、

掌握JAVAWEB根底知识

JAVAWEB自定义标签

深入理解软件分层思想

根底技术MVC、JAVAWEB三层架构

AJAX实现异步刷新

软件分层、耦合、解耦

AJAX

过滤器、监听器及常见应用

Filter.Listener

JAVAWEB场景

文件上传、下载

高级技术文件上传、下载

在线支付

在线支付功能实现aa

JAVA高级特性

面向切面编程

JAVAWEB熟悉常见设计模式

通过注解控制事务

框架加强通过模拟实现框架功能,为

java根底加强、框架加强

后续学习SSH打根底

实训工程二:国际物流工程

第三阶段(Struts,Hibernate,Spring,SSH工程贯穿)

分析Servlet缺点,进行重构掌握Struts2在工程开发时

Struts.xml配置文件用到的各种知识点,能够应

Struts2

ValueStack用

Ognl表达式该框架熟练的开发

课程主题课程内容课程目标

属性驱动、模型驱动、拦截

器、文件上传、token机制

ORM的概念、CRUD的完

熟练掌握利用Hibernate框

成、Hibernate常用的配

架完成工程的开发,深入理

Hibernate置、API详细的分析、对象

解ORMapping的概念,深

的三种状态、关联关系、检

入理解缓存机制

素、优化、缓存机制

深入理解SpringlOC、DI在

软件架构中的作用,深入理

解SpringAOP的实现机制和

IOC、DI、动态代理模式、

应用场景;Struts2的量)级特

AOP、基于Spring的数据库

性(对象工厂、静态注入、插

Spring编程、Spring的声明式事务

件机制、ThreadLocal针对

处理,Struts2与Hibernate

ActionContext的封装、

与Spring的整合

Struts2的核心流程、结果集

架构)、深入理解SSH整合的

原理

JQueryJQuery常见选择器的应用利用JQuery控制Web界面

课程主题课程内容课程目标

熟练应用工作流Activiti5实

现货运管理流程控制。

实训工程三:易买电商工程

第四阶段(SpringMVC,Mybaties,SSM工程贯穿)

模拟SpringMVC的核心部

件写一个例子、核心分发熟练掌握SpringMVC的各

器、处理器映射、适配器、个组件,理解SpringMVC

SpringMVC

控制器、注解开发实例、标的架构原理,利用

签机制、拦截器机制、AJAXSpringMVC开发工程

与JSON调用

CRUD操作、

SqISessionFactory对象、

熟练掌握SpringMVC的各

SqISession又寸象、集合参

个组件,理角军SpringMVC

MyBaties数、动态SQL语句、代码优

的架构原理,利用

化、Mapper的接口、关联

SpringMVC开发工程

关系、缓存机制、拦截器、

MyEdipse插件的使用

工程需求讲解、环境的搭了解电商工程的需求分析,

SSM工程(易

建、后台系统实现、刖台系掌握用pom.xml文件构建工

买电商)

统搭建、内容管理实现、程,实现电商工程的前台的

课程主题课程内容课程目标

Redis缓存解决前台访问性内容管理、菜单管理、购物

能问题、单点登录、异步订等。掌握Redis缓存如何提

单系统处理、Lucene与供性能、利用Solor做全文

Solor实现文件的检索、检索、利用ActivityMQ的

ActivityMQ实现消息的异步异步机制把缓存中的改动同

通信、MySQL的数据库的读步到各个环节、掌握MySQL

写别离、分布式环境的部署的主从复制和读写别离。利

和实施用Ivs,keepalived,

nginx,tomcat搭建高并发

的web环境

实训工程四:电信工程

第五阶段(分布式、高并发、集群、电信工程贯穿)

Socket.Io、Nio、Mina、把电信工程的局部环节利用

网络编程

RPC技术、多线程、线程池mina、RPC技术实现

数据仓库根底知识

ETL

掌握数据仓库的知识内容,

数据仓库MySQL的导入工具、分表,

这是大数据分析的根底

分区、读写别离、存储过程

级多维分析

课程主题课程内容课程目标

学习MemoryCache与掌握两种缓存的原理、以及

分布式缓存

Redis两种缓存操作

Zookeeper的选举、数据的了解Zookeeper的选举算

Zookeeper同步、Zookeeper的部署、法、同步机制、掌握

Follow与LeaderZookeeper的集群的搭建

Keepalived的

利用Lvs、Keepalived.

Loadblancing机制、

集群Nginx、Tomcat搭建局并

Nginex反向代理效劳器、

发、分布式的Web效劳器

Tomcat集君羊、Lvs

Rest风格的效劳架构、基十

Rest风格的WebService的利用效劳性框架使得系统的

SOA

使用、dubb。效劳框架的使耦合性更弱,扩展性更强

云计算的概念、laas、

云计算Paas,Saas的理解、虚拟化理解云计算

的概念

把上面所学的知识点全部结通过工程掌握MySQL的集

电信工程合起来做电信行业的日志分群、读写别离、优化、掌握

析系统Mina框架的通信机制、掌握

课程主题课程内容课程目标

Zookeeper的高可用机制、

利用MySql掌握数据仓库的

概念、利用分布式缓存提高

系统的性能

实训工程五:电信工程

第六阶段(Hadoop,Spark,电信工程贯穿)

HDFS的概念、HDFS的API

Hadoop伪分布式的搭建、

的应用、NameNode与

利用HDFS的API对分布式

SecondaryNameNode与

Hadoop的文件系统进行操作、掌握

DataNode的原理与通信机

分布式文件NameNode与

制、数据块Block的概念、

系统HDFSSecondaryNameNode的通

NameNode的文档目录树、

信原理、掌握NameNode

NameNode与DataNode

与DataNode的通信原理

的关联

熟练M叩、Reducer、

利用M叩Reducer的计算框

Sort、Partition的编程、深

Hadoop的架实现电信日志的分析、深

入理解Shuffle机制、深入

计算框架入理解Shuffle机制、

理解OutPutFormat与

MapReduceFileOutPutFormat.

InputFormat.基于

FilelnPutFormat

Hadoop的对象序列化机制

课程主题课程内容课程目标

深入理解MapReducer的通

信机制:利用Yarn的资源管

Hadoop的深入理解Yarn的资源管理与

理和资源调度机制。理解进

资源管理与资源调度机制。掌握整个

程ResourceManager,

资源调度M叩Reducer的计算流程和

NodeManager,

Yarn框架资源调度流程

ApplicationMaster等进程

的作用

搭建NOSQL数据库HBase

HBase的集群、利用Zookeeper做掌握HBase的集群的的搭建

HBase的HA机制

数据仓库根底知识、Hive定

义、Hive体系结构简介、

Hive集群、客户端简介、

HiveQL定义、HiveQL与

SQL的比拟、数据类型、外

HIVE利用HIVE做日志分析的查询

部表和分区表、表的操作与

CLI客户端演小、数据导入与

CLI客户端演示、查询数据与

CLI客户端演示、数据的连

接与CLI客户端演示、用户

课程主题课程内容课程目标

自定义函数〔UDF〕的开发

与演示

Spark介绍:Spark应用场

景、Scala编程语言、Scala利用Spark流式编程做日志

Spark

高级编程、Spark集群部署的分析

熟练应用Hadoop的

把第四阶段的电信工程用

电信工程M叩Reducer,Hive与

Hadoop与Spark实现

Spark

走心课程全面覆盖实力熬炼技

术骨干

8大授课阶段全力培养未来高端大数据人才

课程详阊

•第一阶段

Java语言根底

•第二阶段

HTML、CSSJavaScript

.第三阶段

JavaWeb和数据库

•第四阶段

Linux根底

•第五阶段

Hadoop生态体系

•第六阶段

Spark生态体系

•第七阶段

Storm实时开发

•第八阶段

工程案例

01

第一阶段Java语言根底

OlJava开发介绍

-Java的开展历史

-Java的应用领域

-Java语言的特性

-Java面向对象

-Java性能分类

-搭建Java环境

-Java工作原理

02熟悉Eclipse开发工具

-Eclipse简介与下载

-安装Eclipse的中文语言包

-Eclipse的配置与启动

-Eclipse工作台与视图

-"包资源管理器〃视图

-使用Eclipse

-使用编辑器编写程序代码

03Java语言根底

-Java主类结构

-根本数据类型

-变量与常量

-Java运算符

-数据类型转换

-代码注释与编码标准

-Java帮助文档

04Java流程控制

-复合语句

-条件语句

-if条件语句

-switch多分支语句

-while循环语句

-do...while循环语句

-for循环语句

05Java字符串

-String类

-连接字符串

-获取字符串信息

-字符串操作

-格式化字符串

-使用正则表达式

-字符串生成器

06Java数组与类和对象

-数组概述

-一维数组的创立及使用

-二维数组的创立及使用

-数组的根本操作

-数组排序算法

-Java的类和构造方法

■Java的对象、属性和行为

07数字处理类与核心技术

-数字格式化与运算

-随机数与大数据运算

-类的继承与Object类

■对象类型的转换

-使用instanceof操作符判断对象类型

-方法的重载与多态

-抽象类与接口

081/0与反射、多线程

-流概述与File类

-文件输入/输出流

-缓存输入/输出流

-Class类与Java反射

-Annotation功能类型信息

-枚举类型与泛型

-创立、操作线程与战程平安

09Swing程序与集合类

-常用窗体

・标签组件与图标

-常用布局管理器与面板

-按钮组件与列表组件

-常用事件监听器

-集合类概述

-Set集合与Map集合及接口

02

第二阶段HTML、CSS与JavaScript

01PC端网站布局

-HTML根底,CSS根底,CSS核心属性

-CSS样式层叠,继承,盒模型

-容器,溢出及元素类型

-浏览器兼容与宽高自适应

-定位,锚点与透明

-图片整合

-表格,CSS属性与谑镜

-CSS优化

02HTML5+CSS3根底

-HTML5新增的元素与属性

-CSS3选择器

-文字字体相关样式

-CSS3位移与变形处理

-CSS32D、3D转换与动画

-弹性盒模型

-媒体查询

-响应式设计

03WebApp页面布局

-移动端页面设计标准

-移动端切图

-文字流式/控件弹性/图片等比例/特殊设计的布局

-等比缩放布局

-viewport/meta

-rem/vw的使用

-flexbox详解

-移动web特别样式处理

04原生JavaScript交互功能开发

-什么是JavaScript

■JavaScript使用及运作原理

-JavaScript根本语法

-JavaScript内置对象

-事件,事件原理

-JavaScript根本特效制作

-cookie存储

-正则表达式

05Ajax异步交互

-Ajax概述与特征

-Ajax工作原理

-XMLHttpRequest对象

-同步与异步

-Ajax异步交互

-Ajax跨域问题

-Ajax数据的处理

-基于WebSocket和推送的实时交百

|06JQuery应用

-各选择器使用,及应用优化

-Dom节点的各种操作

-事件处理、封装、应用

-jQuery中的各类动画使用

-可用性表单的开发

-jQueryAjax、函数、缓存;

-jQuery编写插件、扩展、应用

-理解模块式开发及应用

03

第三阶段JavaWeb和数据库

01数据库

-Mysql数据库

JDBC开发

-连接池和DBUtils

-Oracle介绍

-MongoDB数据库介绍

-叩ache效劳器/Nginx效劳器

-Memcached内存对象缓存系统

02JavaWeb开发核心

-XML

-HTTP及Tomcat

-Servlet工作原理解析

-深入理解Session与Cookie

-Tomcat的系统架构与设计模式

-JSP语法与内置对象

-JDBC技术

-大浏览量系统的静态化架构设计

03JavaWeb开发内幕

-深入理解Web请求过程

-JavaI/O的工作机制

-JavaWeb中文编码

-Javac编译原理

-class文件结构

-ClassLoader工作机制

-JVM体系结构与工作方式

-JVM内存管理

04

第四阶段Linux根底

OlLinux安装与配置

-Linux常见版本及VMware

-安装Linux至硬盘及虚拟机安装Linux系统

-虚拟机网络配置UP地址、主机名、防火墙J

-超级用户root

-关于硬件驱动程序

-进阶:配置Grub

-CSS预处理器LESS框架使用

-CSS组件框架编写

02系统管理与目录管理

-Shell根本命令

-使用命令行补全和通配符

-find命令、locate命令

-查找特定程序:whereis

-Linux文件系统的架构

-移动、复制和删除

-文件和目录的权限

-文件类型与输入输出

03用户与用户组管理

-软件包管理

-磁盘根本管理命令〔df、du、fdisk.mount]

-高级硬盘管理RAID和LVM

-进阶:备份你的工作和系统

-用户与用户组管理

-内存使用监控命令〔top、free等)

-软件安装方式〔rpm、tar、yum)

-进程管理

04Shell编程

-Shell脚本编程概述

-正则表达式

-字符集和单词、字符类

-Shell脚本编程

-脚本执行命令和控制语句

-Shell定制

-个性化设置:修改.bashrc文件

-Shell脚本调试

05效劳器配置

-系统引导

-管理守护进程

-通过xinetd启动SSH效劳

-配置inetd

-Apache根底

-设置Apache效劳器

■PHP根底

-配置DHCP效劳器

06Vi编辑器与Emacs编辑器

-VI中的常用命令

-VI中的字符与文件操作

-VI中的窗口操作

-emacs概述

-emacs文本编辑

-emacs缓冲区和窗口

-emacs的扩展工具

05

第五阶段Hadoop生态体系

OlHadoop起源与安装

-大数据概论

Google与Hadoop模块

-Hadoop生态系统

-Hadoop常用工程介绍

-Hadoop环境安装配置

-Hadoop安装模式

-Hadoop配置文件

02MapReduce快速入门

-WordCount准备开发环境

-MapReduce编程接口体系结构

-MapReduce通信t办议

-导入Hadoop的JAR文件

-MapReduce代码的实现

-打包、部署和运行

-打包成JAR文件

03Hadoop分布式文件系统

-认识HDFS及其HDFS架构

-Hadoop的RPC机制

-HDFS的HA机制

-HDFS的Federation机制

-Hadoop文件系统的访问

-JavaAPI接口与维护HDFS

-HDFS权限管理

04Hadoop文件I/O详解

-Hadoop文件的数据结构

-HDFS数据完整性

-文件序列化

-Hadoop的Writable类型

-Hadoop支持的压缩格式

-Hadoop中编码器和解码器

-gzip、LZO和Snappy比拟

05MapReduce工作原理

-M叩Reduce函数式编程概念

-MapReduce框架结构

-MapReduce运行原理

-Shuffle阶段和Sort阶段

-任务的执行与作业调度器

-自定义Hadoop调度器

-YARN架构及其工作流程

06MapReduce编程开发

-WordCount案例分析

-输入格式与输出格式

-压缩格式与M叩Reduce优化

-辅助类与Streaming接口

-MapReduce二次排序

-MapReduce中的Join算法

-从MySQL读写数据

-Hadoop系统调优

07Hive数据仓库工具

•Hive工作原理、类型及特点

■Hive操作及Hive复合类型

-Hive的JOIN详解

-Hive优化策略

-Hive内置操作符与函数

-Hive用户自定义函数接口

-Hive的权限控制

08开源数据库HBase

-HBase的特点

-HBase访问接口

-HBase存储结构与格式

-HBase设计

-关键算法和流程

-HBase的Shell操作

-HBase客户端

09Sqoop与Oozie

-安装部署Sqoop

-Sqoop数据迁移

-Sqoop使用案例

-Oozie简介

-Oozie与Hive

-AzkabanT作流

06

第六阶段Spark生态体系

OlSpark简介

■什么是Spark

-Spark大数据处理框架

-Spark的特点与应用场景

-SparkSQL原理和实践

-SparkStreaming原理和实践

-GraphXSparkR入门

-Spark的监控和调优

02Spark吾B署和运彳亍

-部署准备与下载

-Spark生态和安装部署

-LocalYARN模式部署

-Local模式运行

-SparkStandaloneHA安装

-YARN模式运行Spark

-Spark应用程序部署工具spark-submit

03Spark程序开发

-启动SparkShell

-加载text文件

-RDD操作及其应用

-RDD缓存

■构建Eclipse开发环境

-构建IntelliJIDEA开发环境

-仓I」立SparkContext又搀

-编写编译并提交应用程序

04Spark编程模型

•RDD特征与依赖

-集合〔数组〕创立RDD

-存储创立RDD

-RDD转换执行控制操作

-播送变量

-累加器

05作业执行解析

-Spark组件

-RDD视图与DAG图

-基于Standalone模式的Spark架构

-基于YARN模式的Spark架构

-作业事件流和调度分析

-构建应用程序运行时环境

-应用程序转换成DAG

06SparkSQL与DataFrame

-SparkSQL架构特性

-DataFrame和RDD的区别

-创立操作DataFrame

-RDD转化为DataFrame

-加载保存操作与Hive表

-Parquet文件JSON数据集

-分布式的SQLEngine

-性能调优数据类型

07深入SparkStreaming

-SparkStreaming工作原理

-DStream编程模型

-InputDStream

-DStream转换状态输出

-优化运行时间及内存使用

-文件输入源

-基于Receiver的输入源

-输出操作

08SparkMLlib与机器学习

-机器学习分类级算法

-SparkMLlib库

-MLlib数据类型

-MLlib的算法库与实例

-ML库主要概念

-算法库与实例

09GraphX与SparkR

-SparkGraphX架构

・Gr叩hX编程与常用图算法

-GraphX应用场景

-SparkR的工作原理

-R语言与其他语言的通信

-SparkR的运行与应用

-R的DataFrame操作方法

-SparkR的DataFrame

lOspark工程实战

-大数据分析系统

-系统资源分析平台

-在Spark上训练LR模型

-获取二级邻居关系图

llscala编程

-scala编程介绍

-Scala根本语法

-Scala开发环境搭建

-Scala开发Spark应用程序

12Python编程

-Python编程介绍

-Python的根本语法

-Python开发环境搭建

-Pyhton开发Spark应用程序

07

第七阶段Storm实时开发

Olstorm简介与根本知识

-storm的诞生诞生与成长

storm的优势与应用

-storm根本知识概念和配置

-序列化与容错机制

-可靠性机制一保证消息处理

-storm开发环境与生产环境

-storm拓扑的并行度

-storm命令行客户端

02拓扑详解与组件详解

一流分组和拓扑运行

-拓扑的常见模式

-本地模式与stormsub的比照

-使用非jvm语言操作storm

-hook组件根本接口

-根本抽象类

-事务接口

-组件之间的相互关系

03Hadoop分布式系统

-认识HDFS及其HDFS架构

-Hadoop的RPC机制

-HDFS的HA机制

-HDFS的Federation机制

-Hadoop文件系统的访问

-JavaAPI接口与维护HDFS

-HDFS权限管理

04spout详解与bolt详解

-spout获取数据的方式

-靠用的spout

-学习编写spout类

-bolt概述

-可靠的与不可靠的bolt

-复合流与复合anchoring

-使用其他语言定义bolt

-学习编写bolt类

05zookeeper详解

-zookeeper简介

-zookeeper的下载和部署

-zookeeper的配置与运

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论