付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
4/4大数据技术原理与应用教学大纲大数据技术原理与应用教学大纲
课程概述
入门级大数据课程,适合初学者,完备的课程在线服务体系,可以帮助初学者实现“零基础”学习大数据课程。课程采用厦门大学林子雨老师编著的国内高校第一本系统性介绍大数据知识专业教材《大数据技术原理与应用》。课程紧紧围绕“构建知识体系、阐明基本原理、引导初级实践、了解相关应用”的指导思想,对大数据知识体系进行系统梳理,做到“有序组织、去粗取精、由浅入深、渐次展开”。课程由国内高校知名大数据教师厦门大学林子雨副教授主讲。
授课目标
课程的定位是入门级课程,本课程的目标是为学生搭建起通向“大数据知识空间”的桥梁和纽带。本课程将系统梳理总结大数据相关技术,介绍大数据技术的基本原理和大数据主要应用,帮助学生形成对大数据知识体系及其应用领域的轮廓性认识,为学生在大数据领域“深耕细作”奠定基础、指明方向。
课程大纲
第1讲大数据概述
1.1大数据时代
1.2大数据概念和影响
1.3大数据的应用
1.4大数据的关键技术
1.5大数据与云计算、物联网
本讲配套讲义PPT-第1讲-大数据概述
第1讲大数据概述章节单元测验
第2讲大数据处理架构Hadoop
本讲实验答疑-第2讲-大数据处理架构Hadoop
2.1概述
2.2Hadoop项目结构
2.3Hadoop的安装与使用
2.4Hadoop集群的部署和使用
本讲配套讲义PPT-第2讲-大数据处理架构Hadoop大数据处理架构Hadoop单元测验
第3讲分布式文件系统HDFS
3.1分布式文件系统HDFS简介
3.2HDFS相关概念
3.3HDFS体系结构
3.4HDFS存储原理
3.5HDFS数据读写过程
3.6HDFS编程实践
本讲配套讲义PPT-第3讲-分布式文件系统HDFS分布式文件系统HDFS单元测验
第4讲分布式数据库HBase
4.1HBase简介
4.2HBase数据模型
4.3HBase的实现原理
4.4HBase运行机制
4.5HBase应用方案
4.6HBase安装配置和常用Shell命令
4.7HBase常用JavaAPI及应用实例
本讲配套讲义PPT-第4讲-分布式数据库HBase分布式数据库HBase单元测验
第5讲NoSQL数据库
5.1NoSQL概述
5.2NoSQL与关系数据库的比较
5.3NoSQL的四大类型
5.4NoSQL的三大基石
5.5从NoSQL到NewSQL数据库
5.6文档数据库MongoDB
本讲配套讲义PPT-第5讲-NoSQL数据库NoSQL数据库单元测验
第6讲云数据库
6.1云数据库概述
6.2云数据库产品
6.3云数据库系统架构
6.4AmazonAWS和云数据库
6.5微软云数据库SQLAzure
6.6云数据库实践
本讲配套讲义PPT-第6讲-云数据库
云数据库单元测验
第7讲MapReduce
7.1MapReduce概述
7.2MapReduce的体系结构
7.3MapReduce工作流程
7.4Shuffle过程原理
7.5MapReduce应用程序执行过程
7.6实例分析:WordCount
7.7MapReduce的具体应用
7.8MapReduce编程实践
本讲配套讲义PPT-第7讲-MapReduceMapReduce单元测验
第8讲Hadoop再探讨
8.1Hadoop的优化与发展
8.2HDFS2.0的新特性
8.3新一代资源管理调度框架YARN
8.4Hadoop生态系统中具有代表性的功能组件本讲配套讲义PPT-第9讲-Hadoop再探讨Hadoop再探讨单元测验
第9讲数据仓库Hive
9.1数据仓库概念
9.2Hive简介
9.3SQL转换成MapReduce作业的原理
9.4Impala
9.5Hive编程实践
本讲配套讲义PPT-第9讲-数据仓库Hive
数据仓库Hive单元测验
第10讲Spark
10.1Spark概述
10.2Spark生态系统
10.3Spark运行架构
10.4SparkSQL
10.5Spark的部署和应用方式
10.6Spark编程实践
本讲配套讲义PPT-第10讲-Spark
Spark单元测验
第11讲流计算
11.1流计算概述
11.2流计算处理流程
11.3流计算的应用
11.4开源流计算框架Storm
11.5SparkStreaming、Samza以及三种流计算框架的比较11.6Storm编程实践
本讲配套讲义PPT-第11讲-流计算
流计算单元测验
第12讲Flink
12.1Flink简介
12.2为什么选择Flink
12.3Flink应用场景
12.4Flink技术栈、体系架构和编程模型
12.5Flink的安装与编程实践
本讲配套讲义PPT-第12讲-Flink
Flink单元测验
第13讲图计算
13.1图计算简介
13.2Pregel简介
13.3Pregel图计算模型
13.4Pregel的C++API
13.5Pregel的体系结构
13.6Pregel的应用实例——单源最短路径
13.7Hama的安装和使用
本讲配套讲义PPT-第13讲-图计算
图计算单元测验
第14讲大数据在不同领域的应用
14.1大数据应用概览
14.2推荐系统
14.3大数据在智能医疗和智能物流领域运用
本讲配套讲义PPT-第14讲-大数据在不同领域的应用
大数据在不同领域的应用单元测验
预备知识
面向对象编程(比如Java)、数据库、操作系统
参考资料
林子雨.大数据技术原理与应用(第3版),人民邮电出版社,2020年9月
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商洛地区柞水县2025-2026学年第二学期四年级语文期末考试卷(部编版含答案)
- 宝鸡市金台区2025-2026学年第二学期四年级语文第八单元测试卷(部编版含答案)
- 水下钻井设备操作工岗前技能掌握考核试卷含答案
- 诊断试剂生产工安全管理模拟考核试卷含答案
- 斫琴师安全实践测试考核试卷含答案
- 2026年能效提升项目验收标准:节能量核定方法
- 六安市舒城县2025-2026学年第二学期四年级语文第七单元测试卷(部编版含答案)
- 宜宾市兴文县2025-2026学年第二学期五年级语文第八单元测试卷(部编版含答案)
- 巴彦淖尔盟杭锦后旗2025-2026学年第二学期三年级语文期末考试卷(部编版含答案)
- 许昌市鄢陵县2025-2026学年第二学期五年级语文期末考试卷(部编版含答案)
- 2025年4月自考00015英语(二)试题
- 《医学免疫学》习题集题库+答案
- 2025年土壤环境科学与治理考试题及答案
- 认识水课件-科学一年级下册冀人版
- 口腔材料学 第六章 树脂基复合材料学习课件
- 江苏省南京市(2024年-2025年小学六年级语文)部编版质量测试(下学期)试卷及答案
- DB45T 2329-2021 溶洞旅游接待服务规范
- (高清版)WST 418-2024 受委托医学实验室选择指南
- 清廉学校建设工作清单表格
- 幼儿园幼儿园小班社会《兔奶奶生病了》
- (新版)老年人能力评估师理论考试复习题库(含答案)
评论
0/150
提交评论