版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据技术入门 Hadoop+Spark教学大纲1课程基本信息课程中文名称:课程代码:课程类别:考核性质:先修课程:适用专业:开课单位:课程团队负责人:2教学目标2.1课程教学目标大数据技术入门-Hadoop+Spark专业基础课
考试Java语言课程英文名称:学时/学分:课程性质:后续课程:开课学期:成员:教学目标1:掌握大数据的基本概念,BigDataTechnologyand
Practice了解大数据技术发展历程、技术体系及应用领域。教学目标2:理解大数据存储的基本原理,掌握大数据存储的基本技术,能够应用常用的大数据存储系统进行数据存取及管理。教学目标3:理解大数据处理的基本原理,掌握大数据处理的基本编程模型并能够进行初级实践。教学目标4:了解大数据技术的发展趋势,认识到大数据技术的发展及应用对社会发展的影响。教学目标5:理解大数据应用需求及技术环境的多样性,认识到自我学习的必要性。2.2课程教学目标与毕业要求的关系矩阵课程教学目标与毕业要求的关系矩阵见表1。表1课程教学目标与毕业要求的关系矩阵业要求\相关度教学目毕业要求指标点6-2了解计算机应用领域新知识、新技术及发展趋势,能够客观评价计算机科学与技术的发展及应用对社会、健康、安全、法律以及文化的影响。毕业要求指标点12-1对于自我探索和学习的必要性有止确的认识,理解技术环境的多样化、技术应用发展和技术进步对于知识和能力的影响和要求。目标1•目标2•目标3•目标4•目标5•注:•相关程度大;O表示有相关。3课程基本内容和学时安排教学单元1:大数据概述教学单元1-1研究背景和意义教学单元1-2数据定义及其技术持点教学单元1-3大数据处理的主要技术特点与难点教学单元1-4研究大数据的意义重点:数据定义及其技术持点难点:3大数据处理的主要技术特点与难点教学单元2:Hadoop简介及安装部署教学单元2-1Hadoop简介及生态体系教学单元2-1Hadoop集群架构教学单元2-1Hadoop集群运行环境搭建重点:Hadoop简介及生态体系难点:Hadoop集群运行环境搭建3教学单元3:HDFS分布式文件系统教学单元3-1相关基本概念教学单元3-2HDFS存储架构教学单元3-3HDFS的特点教学单元3-4HDFS常用Shell命令教学单元3-5HDFS的JavaAPI重点:HDFS存储架构难点:HDFS常用Shell命令、HDFS的JavaAPI3.4教学单元4:MapReduce计算框架教学单元4-1MapReduce核心思想教学单元4-2MapReduce的工作原理教学单元4-3M叩Reduce的运行机制教学单元4-4MapReduce数据本地化教学单元4-5MapReduce编程教学单元4-6MapReduce编程示例重点:MapReduce核心思想难点:MapReduce的工作原理、运行机制5教学单元5:Hive数据仓库教学单元5-1Hive概述教学单元5-2Hive安装教学单元5-3Hive数据库相关操作重点:Hive安装难点:Hive数据库相关操作3.6教学单元6:HBase分布式数据库教学单元5-1HBase的概述教学单元5-2HBase安装教学单元5-3HBase数据模型教学单元5-4HBase的Shell操作教学单元5-5Hbase常用JavaAPI及示例程序重点:HBase安装难点:HBase的Shell操作7教学单元7:Spark基础教学单元7-1Spark概述教学单元7-2Spark的安装教学单元7-3Spark运行架构与原理教学单元7-4Spark运行基本流程重点:Spark运行架构与原理难点:Spark运行基本流程3.8教学单元8:SparkRDD弹性分布式数据集教学单元8-1RDD的设计与运行原理教学单元8-2RDD创建教学单元8-3RDD操作教学单元8-4程序示例:倒排索引重点:RDD的设计与运行原理难点:RDD操作9教学单元9:sparkSQL教学单元9-1sparkSQL概述教学单元9-2DataFrame教学单元9-3Dataset教学单元9-4SparkSQL编程重点:DataFrame难点:SparkSQL编程10教学单元10:SparkStreaming实时计算框架教学单元10-1SparkStreaming概述教学单元10-2DStream编程模型教学单元10-3DStream编程模型示例重点:DStream编程模型难点:DStream编程模型示例11教学单元11:SparkStreaming与Flume、Kafka的整合教学单元11-1Flume简介及安装教学单元11-2kafka简介及其安装教学单元11-3Flume>Kafka区别和侧重点教学单元11-4SparkStreaming与Flume>Kafka整合与开发重点:Flume、Kafka区别和侧重点难点:SparkStreaming与Flume>Kafka整合与开发3.12教学单元12:SparkMLlib机器学习教学单元12-1机器学习概念教学单元12-2MLlib的简介教学单元12-3SparkMLlib数据类型教学单元12-4SparkMLlib机器学习示例重点:SparkMLlib数据类型难点:SparkMLlib机器学习示例3.13实战案例-分布式优惠券后台应用系统教学单元13-1系统简介教学单元13-1系统整体架构教学单元13-1表结构设计教学单元13-1系统实现教学单元13-1系统运行测试重点:系统整体架构难点:系统实现、运行测试4学时分配学时分配本课程共64学时,其中课堂讲授38学时,上机实验26学时,具体的学时分配见表2。表2课程学时分配表教学内容学时课堂教学学时自主学习讲授实验作业报告资料收集教学单元122教学单元242211教学单元36421.50.51教学单元464211教学单元542211教学单元66421.50.51教学单元742211教学单元86421.50.51
教学单元94221.50.51教学单元1084411教学单元1142211教学单元1264211教学单元1342211学时合计64382614212实践性教学内容课内实验内容及要求见表3。表3课内实验内容及要求序号项目编号项目名称实验类型学时实验内容及基本要求1XM07YZ001熟悉常用的Linux操作和Hadoop操作验证21、米用虚拟机或双系统方式女装Linux后安装Hadoop,测试是否安装成功;2、进行伪分布式配置,运行相同测试程序,比较单机环境与伪分布式环境的差异,认识分布式环境;3、练习常用的Linux操作,练习常用的Hadoop操作,了解Hadoop处理架构的基本构成。2XM07ZH002熟悉常用的HDFS操作综合性21、利用Hadoop提供的Shell命令完成文件下载、文件输出、追加文件内容等一些列指定任务,掌握分布式文件系统HDFS的基本存取方法;2、利用HDFS提供JavaAPI编程实现文件的读取与管理3XM07ZH003MapReduce编程初级实践综合性21、编程实现文件合并和去重操作:对于两个输入文件,即文件A和文件B,编写M叩Reduce程序,对两个文件进行合并,并剔除其中重复的内容,得到一个新的输出文件C。2、编写程序实现对输入文件的排序:现在有多个输入文件,每个文件中的每行内容均为一个整数。要求读取所有文件中的整数,进行升序排序后,输出到一个新的文件中,输出的数据格式为每行两个整数,第一个数字为第二个整数的排序位次,第二个整数为原待排列的整数。4XM07Z11004Hive的安装及操作验证2Hive安装及建表,查询,导入数据等操作5XM07ZH005熟悉常用的HBase操作综合性21、安装Hbase并完成配置;2、用Hadoop提供的HBaseShell命令完成数据管理任务:3、使用Hbase提供的JavaAPI完成一系列指定编程任务,实现应用程序对数据的管理及存取。6XM07ZH006Spark的安装验证2Spark的安装7XM07ZH007SparkRDD弹性分布式数据集API操作综合性2利用SparkRDD实现倒排索引8XM07ZH008SparkSQL编程综合性2DataFrame操作、SparkSQL读写MySQL数据库、SparkSQL读写Hive9XM07ZH009DStream编程示例综合性4DStream编程基本步骤-文件流、无状态转换操作、有状态转换操作、输出操作10XM07ZH010SparkStreaming与Flume>Kafka的整合综合性2SparkStreaming与Flume、Kafka的整合步骤及开发11XM07ZH011SparkMLlib机器学习综合性2特征抽取—TF-IDF,分类与回归—线性回归、分类与回归一逻辑回归12XM07ZH012综合案例-分布式优惠券后台应用系统综合性2商户投放子系统、用户消费子系统及系统测试5教学方式方法5.1教学方法本课程是一门64学时的专业必修课,课堂教学38学时,上机实验26学时。根据课程目标,设计课程教学方法如下:1、课堂讲授:以问题导入的方式,通过介绍当前应用环境的变化和需求引入大数据技术,概括介绍大数据知识体系,使学生对课程有一个初步的认识,进而详细介绍大数据存储和大数据处理两大核心技术。采用多媒体与板书相结合的方式进行讲授,对于各章节的重点及难点,基于案例进行详细讲解,帮助学生理解和掌握。每次开始授课之前,以提问的方式,帮助学生回顾课程内容、抓住知识重点。每章结束进行章节总结,帮助学生梳理知识体系。授课过程中,以启发学生思维为核心,注重师生互动,调动学生的学习主动性和积极性。2、课内实验:采用课内实验辅助学生理解和掌握大数据技术的原理及应用方法,实验内容主要围绕大数据存储及大数据处理两大核心技术。实验指导书在每次实验之前提前发布,以便学生预习。实验课上由教师布置实验任务并进行简单讲解,不宜讲解过细,应注重培养学生自我探索的能力。学生针对实验问题进行分析、设计并完成上机实验、撰写实验报告。实验报告中除记录实验过程外,还要记录实验中遇到的问题、解决办法,以及实验心得,以促进学生的思考与总结。3、自主学习:为了充分调动学生的学习主动性和积极性,除课堂教学及实验教学外,加入11学时的自主学习,通过作业帮助学生理解并掌握各章节的重点内容;通过报告中的案例调研分析及课程总结展望,培养自主学习和终身学习的意识,以及客观评价大数据技术的能力。5.2教学手段及措施采取课堂讲授、实验、应用实例讲解等形式,结合课后自学进行教学。采用电子教案和板书相结合的方式,提高讲课效果。在教学过程中,教师应对大数据的基本概念、技术体系、基本存储原理以及基本计算模型进行详细讲解,并指出各教学内容的重点和难点部分。讲授中应以学生为中心,注重理论联系实际,以及先进教学方法的使用C6考核方式考核方式说明采用平时、实验,作业相结合的考核方式
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026黑龙江大庆市肇源县医疗卫生专项人才引进22人备考题库(巩固)附答案详解
- 2026上半年四川成都市大邑县医疗卫生事业单位考核招聘高层次人才23人备考题库附参考答案详解(完整版)
- 2026河南郑州市郑东新区春华学校、郑州市郑东思贤学校招聘备考题库及答案详解(网校专用)
- 2026广东广州市海珠区消防安全委员会办公室招聘街道微型消防站队员26人备考题库及答案详解【典优】
- 2026贵州贵阳贵安招聘中小学(幼儿园)教师819人备考题库及参考答案详解(培优b卷)
- 2026广西百色市右江区城东社区卫生服务中心招聘公益性岗位2人备考题库附参考答案详解【巩固】
- 2026浙江招聘衢州市乡村振兴发展有限公司劳务外包工作人员6人备考题库(综合题)附答案详解
- 2026江苏宿迁市泗洪县招聘合同制和公益性岗位人员15人备考题库及完整答案详解(网校专用)
- 2026新疆兵团第一师八团医院招聘3人备考题库附答案详解(a卷)
- 校长任期目标责任制度
- 主管护师《专业知识》考试真题及答案(2025年新版)
- 2025年海关总署公务员面试模拟题集及答案解析
- 物业采购需求论证方案(3篇)
- 2024苏州工业职业技术学院单招《语文》高分题库附参考答案详解【B卷】
- 四川圆豆豆食品有限公司圆豆豆食品豆制品加工项目环评报告
- 买房指南课程讲解
- 2025至2030中国硅酸钙行业市场发展现状及竞争格局与投资价值报告
- 牛肝菌产研一体化生产基地项目可行性研究报告模板-立项备案
- 深圳市龙岗区产服集团招聘笔试真题2024
- 快乐手工制作课件
- GB/T 45789-2025植物保护机械雾化器雾滴谱测量与分级
评论
0/150
提交评论