版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
打造基于产教融合的就业育人综合服务平台打造基于产教融合的就业育人综合服务平台项目1搭建Spark集群——Spark概述教案课程名称:Spark大数据技术与应用课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论36学时,实验28学时)总学分:4.0学分本章学时:4学时材料清单《Spark大数据技术与应用》教材。项目1配套PPT、数据和代码。搭建Spark集群所需基础环境和安装包。引导性提问。探究性问题。拓展性问题。教学目标与基本要求教学目标主要介绍Spark的特点、Spark的生态圈和Spark的应用场景,并介绍Spark的架构、Spark作业的运行流程、Spark的核心数据集RDD和核心原理,最后介绍Spark的环境配置,包括搭建单机版环境、单机伪分布式环境和完全分布式环境。基本要求了解Spark的特点、生态圈和应用场景。了解Spark的运行架构与原理。掌握不同模式的Spark环境的搭建配置。问题引导性提问引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。你知道哪些Apache基金会的产品?你是否能够独立搭建配置Hadoop完全分布式集群?你听说或了解过Spark吗?探究性问题探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课文中又是重要的问题加以设问。Spark有哪些特点?Spark的作业运行流程是怎么样的?RDD是什么?Spark有哪些部署模式,有什么区别?拓展性问题拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问题。搭建Hadoop完全分布式集群时可以采用高可用模式,搭建Spark完全分布式集群时是否也可以采用高可用模式?若想在已搭建好的Spark完全分布式集群上增加1个子节点,应如何配置?主要知识点、重点与难点主要知识点Spark的特点。Spark的生态圈。Spark的应用场景。Spark架构与作业运行流程。Spark核心数据集RDD和核心原理。搭建配置不同模式Spark环境。重点Spark架构与作业运行流程。Spark核心数据集RDD和核心原理。搭建配置Spark完全分布式集群。难点Spark运行架构与原理。搭建配置Spark完全分布式集群。教学过程设计理论教学过程了解Spark简介。了解Spark运行架构与原理。搭建Spark单机版环境和单机伪分布式集群。实验教学过程搭建Spark单机版环境。搭建Spark单机伪分布式集群。搭建Spark完全分布式集群。教材与参考资料教材肖芳,张良均.Spark大数据技术与应用(第3版)(微课版)[M].北京:人民邮电出版社.2026.参考资料[1] 肖芳,张良均.Spark大数据技术与应用(第2版)(微课版)[M].北京:人民邮电出版社.2022.[2] 王哲,张良均.Hadoop与大数据挖掘(第2版)[M].北京:机械工业出版社.2022.[3] 张军,张良均.Hadoop大数据开发基础(第3版)(微课版)[M].北京:人民邮电出版社.2025.项目2查询手机号码信息——Scala基础教案课程名称:Spark大数据技术与应用课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论36学时,实验28学时)总学分:4.0学分本章学时:8学时材料清单《Spark大数据技术与应用》教材。项目2配套PPT、数据和代码。引导性提问。探究性问题。拓展性问题。教学目标与基本要求教学目标Scala语言是Spark平台常用的一种语言,为了学习Spark,需要先学习Scala。本项目首先介绍了Scala的特性及安装过程,接着详细介绍了Scala的基本语法、控制结构、集合类型和面向对象编程模型,最后结合实际数据使学生对Scala编程有更加深刻的理解,进一步体会到Scala函数式编程的便捷、简单。基本要求了解Scala基本特性并掌握Scala的安装运行。掌握定义Scala的常量、变量、数组及函数的方法。掌握Scala的if判断和for循环。掌握Scala的集合操作。掌握Scala的样例类与模式匹配。了解Scala类及读写文件。问题引导性提问引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。你之前接触过的编程语言都有哪些?结合Spark的特点,你觉得Scala可能具备哪些特性?你知道的数据类型有哪些?探究性问题探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课文中又是重要的问题加以设问。Scala中有哪些集合类型?Scala的数组中有哪些常用的操作方法?Scala中有哪些常用的函数组合器?拓展性问题拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问题。Scala中运算符的使用与Java中运算符的使用是否有区别?Scala的数组与元组有何区别?主要知识点、重点与难点主要知识点Scala简介。Scala特性。Scala的环境设置及安装方法。Scala数据类型、函数、表达式的应用。Scalaif判断和for循环。Scala集合应用。Scala类的定义和运行方法。重点了解Scala的基础内容及特性。掌握Scala的安装。掌握Scala函数式编程。难点Scala的集合操作。Scala的类定义。Scala的模式匹配。教学过程设计理论教学过程Scala简介与安装。函数式编程特点。Scala编程学习。实验教学过程安装Scala编程环境。识别号码类型。统计广州号码段数量。根据归属地对手机号码段分组。编写手机号码归属地查询程序。教材与参考资料教材肖芳,张良均.Spark大数据技术与应用(第3版)(微课版)[M].北京:人民邮电出版社.2026.参考资料[1] 肖芳,张良均.Spark大数据技术与应用(第2版)(微课版)[M].北京:人民邮电出版社.2022.[2] 王哲,张良均.Hadoop与大数据挖掘(第2版)[M].北京:机械工业出版社.2022.[3] 张军,张良均.Hadoop大数据开发基础(第3版)(微课版)[M].北京:人民邮电出版社.2025.项目3查询和统计员工薪资数据——SparkShell编程教案课程名称:Spark大数据技术与应用课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论36学时,实验28学时)总学分:4.0学分本章学时:8学时材料清单《Spark大数据技术与应用》教材。项目3配套PPT、数据和代码文件。引导性提问。探究性问题。拓展性问题。教学目标与基本要求教学目标主要介绍Spark的基础操作,包括Spark的基本的核心数据集RDD的转换操作和行动操作,以及Spark中不同格式文件的读取和存储方法,并结合员工薪资数据进行查询统计,进一步巩固实操能力。通过本项目学习,能够帮助学生掌握Spark的操作方法以及SparkShell命令行的使用,为后面的高级操作和组件学习奠定基础。基本要求掌握如何创建RDD。掌握Spark基本转换操作。掌握Spark基本行动操作。了解如何读取不同格式文件数据。了解如何存储数据为不同格式文件。问题引导性提问引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。Spark适用于什么类型的计算?Spark计算有什么特点?Spark中的RDD是什么?探究性问题探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课文中又是重要的问题加以设问。创建RDD有哪些方法?RDD的转换操作和行动操作有什么区别?什么是键值对RDD,有哪些特点?RDD的连接操作和合并操作有什么区别?拓展性问题拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问题。CSV文件通过读取文本文件的方法读取和通过CSV读取器读取有什么区别?在通过join()方法连接RDD时,连接方式应如何选择?主要知识点、重点与难点主要知识点从内存中已有数据创建RDD。从外部存储创建RDD。RDD转化操作和行动操作方法。RDD键值对操作。文件读取与存储。重点创建RDD的方法。RDD的转化操作和行动操作。键值对RDD的基本操作。难点如何创建键值对类型的RDD。操作键值对类型RDD的方法。教学过程设计理论教学过程创建RDD的方法。RDD基础操作。RDD进阶操作键值对RDD操作。RDD连接操作。RDD文件读写操作。实验教学过程读取员工薪资数据创建RDD。查询上半年实际薪资排名前3的员工信息。输出上半年或下半年实际薪资大于20万元的员工姓名。统计每位员工2023年的总实际薪资。查询每位员工2023年的月均实际薪资。将汇总后的员工薪资存储为文本文件。教材与参考资料教材肖芳,张良均.Spark大数据技术与应用(第3版)(微课版)[M].北京:人民邮电出版社.2026.参考资料[1] 肖芳,张良均.Spark大数据技术与应用(第2版)(微课版)[M].北京:人民邮电出版社.2022.[2] 王哲,张良均.Hadoop与大数据挖掘(第2版)[M].北京:机械工业出版社.2022.[3] 张军,张良均.Hadoop大数据开发基础(第3版)(微课版)[M].北京:人民邮电出版社.2025.项目4统计分析竞赛网站用户访问日志数据——SparkIDE编程教案课程名称:Spark大数据技术与应用课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论36学时,实验28学时)总学分:4.0学分本章学时:5学时材料清单《Spark大数据技术与应用》教材。项目4配套PPT、数据和代码文件。引导性提问。探究性问题。拓展性问题。教学目标与基本要求教学目标主要介绍如何使用IntelliJIDEA搭建Spark开发环境,以及如何在开发环境中编程和运行程序。运行程序主要介绍两种方法:一种是在IntelliJIDEA中设置masterURL运行,一种是打包程序在集群中运行。对提交集群运行的方法着重描述,并且分析常用的参数设置。为了提高运行效率,介绍数据持久化以及数据分区方法。最后再以竞赛网站用户访问日志数据为例,对所学知识进行实践操作。基本要求掌握在IDEA中配置Spark开发环境的方法。熟悉Spark工程的创建过程。掌握AI智能编程插件的安装与使用方法。掌握运行Spark程序的方法。了解数据分区与持久化的方法。问题引导性提问引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。在spark-shell中直接进行编程有何利弊?之前使用过哪些IDE编程工具?日常学习中借助过哪些AI辅助工具进行学习?什么是数据持久化?探究性问题探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课文中又是重要的问题加以设问。在IDEA中搭建Spark编程环境有哪些需要配置的内容?如何打包IDEA中编写好的程序并提交到Spark集群中运行?提交程序至集群运行时可以设置哪些参数进行优化?持久化RDD的方法有哪些?拓展性问题拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问题。在IDEA中搭建Spark环境时需要设置SDK环境与相关Jar包依赖,若相关Jar包版本为Spark3.5.1,应如何查看其支持的SDK环境版本?repartition()方法重设分区与自定义分区之间有何异同?在运行Spark程序时,程序代码中设置的运行模式、集群配置参数中设置的运行模式、以及提交程序时设置的运行模式参数,这三者的优先级是怎么样的?主要知识点、重点与难点主要知识点下载与安装IntelliJIDEA。Scala插件安装与使用。AI智能编程插件:安装与使用。配置Spark运行环境的方法。运行Spark程序的方法。持久化方法。数据分区方法。重点配置Spark运行环境。运行Spark程序的方式。持久化(缓存)实现。数据分区。难点自定义数据分区。打包Spark工程并提交至集群运行。spark-submit提交程序的命令及参数设置。教学过程设计理论教学过程搭建Spark开发环境。AI智能编程插件安装与使用。编写Spark程序并运行。设置RDD持久化。设置数据分区。实验教学过程搭建Spark开发环境。计算竞赛网站每月的访问量。自定义分区保存统计结果。教材与参考资料教材肖芳,张良均.Spark大数据技术与应用(第3版)(微课版)[M].北京:人民邮电出版社.2026.参考资料[1] 肖芳,张良均.Spark大数据技术与应用(第2版)(微课版)[M].北京:人民邮电出版社.2022.[2] 王哲,张良均.Hadoop与大数据挖掘(第2版)[M].北京:机械工业出版社.2022.[3] 张军,张良均.Hadoop大数据开发基础(第3版)(微课版)[M].北京:人民邮电出版社.2025.项目5分析水稻品种审定数据——SparkSQL结构化数据文件处理教案课程名称:Spark大数据技术与应用课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论36学时,实验28学时)总学分:4.0学分本章学时:8学时材料清单《Spark大数据技术与应用》教材。项目5配套PPT、数据和代码。引导性提问。探究性问题。拓展性问题。教学目标与基本要求教学目标主要介绍Spark四大组件之一SparkSQL,首先对SparkSQL的基本概念进行简要概述,并且讲解如何配置SparkSQL以及SparkSQL与Shell的交互,接着详细介绍SparkSQL的核心抽象编程模型DataFrame,包括创建DataFrame对象、DataFrame上的Action操作、DataFrame对象上的查询操作以及DataFrame对象上的输出操作,最后使用SparkSQL对水稻信息数据进行探索分析。基本要求了解SparkSQL的基本概念。掌握SparkSQL与Shell的交互。掌握创建DataFrame对象的方法。掌握DataFrame查看数据的方法。掌握DataFrame的查询及输出操作。问题引导性提问引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。MySQL和HiveQL在基本语法上有何异同?是否了解DataFrame数据类型及其基本操作方法?RDD中常用的转换操作和行动操作都有哪些?探究性问题探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课文中又是重要的问题加以设问。在spark-shell中系统自定义的“sc”和“spark”变量有何区别?在Spark中DataFrame与RDD有何区别?在Spark中创建DataFrame可以通过哪些方法?在SparkSQL中如何注册一个临时表?拓展性问题拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问题。RDD是一个数据存放在多个分区的集合,DataFrame是否也是相同的存储方式?SparkSQL支持自定义函数吗?你认为SparkSQL能否完全取代Hive技术?主要知识点、重点与难点主要知识点SparkSQL简介。SparkSQL配置。SparkSQL与Shell的交互实现。DataFrame基础操作方法。重点SparkSQL与Shell的交互实现。创建DataFrame对象的方法。DataFrame查看数据的方法。DataFrame的查询及输出操作。难点创建DataFrame对象的方法。DataFrame查询数据操作。教学过程设计理论教学过程SparkSQL基本概念。SparkSQL与Shell交互的实现。DataFrame基础操作方法。实验教学过程配置SparkSQL。掌握DataFrame基础操作。分析水稻信息数据情况。教材与参考资料教材肖芳,张良均.Spark大数据技术与应用(第3版)(微课版)[M].北京:人民邮电出版社.2026.参考资料[1] 肖芳,张良均.Spark大数据技术与应用(第2版)(微课版)[M].北京:人民邮电出版社.2022.[2] 王哲,张良均.Hadoop与大数据挖掘(第2版)[M].北京:机械工业出版社.2022.[3] 张军,张良均.Hadoop大数据开发基础(第3版)(微课版)[M].北京:人民邮电出版社.2025.项目6实时计算书籍热度——SparkStreaming实时计算框架教案课程名称:Spark大数据技术与应用课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论36学时,实验28学时)总学分:4.0学分本章学时:7学时材料清单《Spark大数据技术与应用》教材。项目6配套PPT、数据和代码。引导性提问。探究性问题。拓展性问题。教学目标与基本要求教学目标首先介绍SparkStreaming的基本概念及运行原理,然后初步讲解SparkStreaming的用法,为后面的编程打下基础。接着介绍DStream编程模型,重点讲解DStream转换操作、窗口操作及输出操作。最后结合实时计算书籍热度的案例加深对SparkStreaming的理解及使用。基本要求了解SparkStreaming的基本概念及运行原理。掌握Dstream的转换操作。掌握Dstream的窗口操作。掌握Dstream的输出操作。问题引导性提问引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问题,提问,从而达到理解、掌握知识,发展各种能力和提高大数据技能的目的。Spark除了SparkSQL之外,还有哪些分支?你是否了解过数据流处理?探究性问题探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课文中又是重要的问题加以设问。SparkStreaming的数据源有哪些?DStream和DataFrame、RDD有何区别?DStream窗口操作的常用方法有哪些?拓展性问题拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问题。SparkStreaming可以与SparkSQL一起使用吗?RDD的转换操作在运行行动操作的时候才会被真正触发,DStream的转换操作是否同样如此,DStream的行动操作有哪些?SparkStreaming如何与Kafka结合?主要知识点、重点与难点主要知识点SparkStreaming的框架运行原理。SparkStreaming使用方法。DStream基础操作。重点SparkStreaming的框架及运行原理。DStream的转换操作。DStream的窗口操作。DStream的输出操作。难点DStream的转换操作。DStream的窗口操作。DStream的输出操作。教学过程设计理论教学过程SparkStreaming框架。SparkStreaming运行原理。DStream编程模型。DStream转换操作。DStream窗口操作。DStream输出操作。实验教学过程初步使用SparkStreaming。获取输入数据源。计算用户评分次数及平均评分。计算书籍被评分次数及平均评分。实时计算书籍热度。教材与参考资料教材肖芳,张良均.Spark大数据技术与应用(第3版)(微课版)[M].北京:人民邮电出版社.2026.参考资料[1] 肖芳,张良均.Spark大数据技术与应用(第2版)(微课版)[M].北京:人民邮电出版社.2022.[2] 王哲,张良均.Hadoop与大数据挖掘(第2版)[M].北京:机械工业出版社.2022.[3] 张军,张良均.Hadoop大数据开发基础(第3版)(微课版)[M].北京:人民邮电出版社.2025.项目7统计得分排名前10的网页——SparkGraphX图计算框架教案课程名称:Spark大数据技术与应用课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论36学时,实验28学时)总学分:4.0学分本章学时:8学时材料清单《Spark大数据技术与应用》教材。项目7配套PPT、数据和代码。引导性提问。探究性问题。拓展性问题。教学目标与基本要求教学目标主要介绍图计算的应用,从图的基本概念和图计算的应用讲起,了解SparkGraphX的概念、发展、基本操作命令等,学习SparkGraphX的基本使用,最后通过统计网页价值排名Top10的案例,帮助学生巩固对SparkGraphX的基本使用。基本要求了解图与的基本概念与图计算的应用。了解GraphX的基础概念与发展。掌握GraphX图的创建方法。掌握GraphX图的查询与转换操作。掌握GraphX图的转换数据结构与关联聚合数据操作。问题引导性提问引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。图是一种怎样的数据结构?你知道的图类型有哪些?图计算主要用于哪些应用场景?探究性问题探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课文中又是重要的问题加以设问。创建图的方法有哪些,分别有什么不同?图的缓存和释放缓存的方法有哪些?图的操作大致可分成哪些类型?如何查看图的视图?拓展性问题拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问题。Spark中的图缓存与数据持久化是否相等?图结构的转换和图数据的关联聚合主要用于哪些应用场景?主要知识点、重点与难点主要知识点图的基本概念与图计算的应用。GraphX的基础概念。图的创建与缓存。查询与转换图数据。图的数据结构转换与关联聚合操作。重点图的创建与缓存。查询与转换图数据。图的数据结构转换与关联聚合操作。难点图的创建与缓存。查询与转换图数据。图的数据结构转换与关联聚合操作。教学过程设计理论教学过程图的基本概念。图计算的应用。GraphX的基础概念。GraphX的发展。图的创建与存储。查询与转换图数据。图的数据结构转换与关联聚合操作。实验教学过程构建网页结构图。计算网页得分。找出得分排名前10的网页。教材与参考资料教材肖芳,张良均.Spark大数据技术与应用(第3版)(微课版)[M].北京:人民邮电出版社.2026.参考资料[1] 肖芳,张良均.Spark大数据技术与应用(第2版)(微课版)[M].北京:人民邮电出版社.2022.[2] 王哲,张良均.Hadoop与大数据挖掘(第2版)[M].北京:机械工业出版社.2022.[3] 张军,张良均.Hadoop大数据开发基础(第3版)(微课版)[M].北京:人民邮电出版社.2025.项目8饮用水源合格性预测——SparkMLlib机器学习算法库教案课程名称:Spark大数据技术与应用课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论36学时,实验28学时)总学分:4.0学分本章学时:8学时材料清单《Spark大数据技术与应用》教材。项目8配套PPT、数据和代码。引导性提问。探究性问题。拓展性问题。教学目标与基本要求教学目标从机器学习的简单概念入手,先讲述机器学习的概念以及机器学习的常用算法。接着根据常用算法引向SparkMLlib算法库,简单了解SparkMLlib及SparkML库基本情况,然后对MLlib中的算法以及算法包都做了基本介绍。最后通过饮用水源营养状态数据分析案例进一步巩固学生对算法的理解,对算法所需要的数据类型、算法的调用、算法的模型建立以及算法的评估都做了一个详细的分析。基本要求了解机器学习的基本概念和算法分类。了解MLlib的概念以及发展。掌握MLlib算法的基本调用。掌握MLlib模型评价方法。问题引导性提问引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。什么是机器学习?机器学习算法有哪些?什么是监督学习,什么是非监督学习吗?探究性问题探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课文中又是重要的问题加以设问。数据标准化和数据归一化有何区别?回归算法的特点是什么,有哪些常用的回归算法?分类算法与聚类算法的区别是什么?拓展性问题拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问题。MLlib是基于RDD的算法库,ML是基于DataFrame的算法库,结合项目5的内容,分析一下这两个库的优点?协同过滤算法有基于内容和基于用户两个方面,分别适用于哪些场景?主要知识点、重点与难点主要知识点机器学习概念与算法分类。MLlib介绍与发展历史。MLlib算法包介绍与调用。重点MLlib算法包介绍与调用。随机森林算法实现饮用水源合格性预测。难点特征处理和提取常用方法。FP算法调用。ALS算法调用。教学过程设计理论教学过程机器学习相关概念与算法简介。MLlib简介与发展历史。MLlib算法包介绍与调用。实验教学过程读取饮用水源数据。探索性数据分析。数据标准化。基于随机森林实现饮用水源合格性预测。教材与参考资料教材肖芳,张良均.Spark大数据技术与应用(第3版)(微课版)[M].北京:人民邮电出版社.2026.参考资料[1] 肖芳,张良均.Spark大数据技术与应用(第2版)(微课版)[M].北京:人民邮电出版社.2022.[2] 王哲,张良均.Hadoop与大数据挖掘(第2版)[M].北京:机械工业出版社.2022.[3] 张军,张良均.Hadoop大数据开发基础(第3版)(微课版)[M].北京:人民邮电出版社.2025.项目9广告检测的流量作弊识别——Spark综合实战教案课程名称:Spark大数据技术与应用课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论36学时,实验28学时)总学分:4.0学分本章学时:8学时材料清
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 淄博辅警招聘考试试题及答案
- 辅警公共知识考试真题及答案解析
- 河南省驻马店市2025-2026学年高二历史下学期3月内部练试题
- 七年级历史下册全册高频考点梳理汇-总(空白+答案)
- 初中语文必背古诗文通假字、易错字梳理
- 四川省宜宾县2026届中考冲刺卷物理试题含解析
- 2026届河北省泊头市教研室重点达标名校中考物理模拟预测试卷含解析
- 2026届眉山市重点中学中考联考物理试题含解析
- 水果供应链与产地直采
- 2025年建筑施工AR远程协助资源调配系统功能
- 2025年人教版高中生物必修二默写(学生版)
- 2025年公务员考试行测逻辑推理试题库及答案(共200题)
- 高级财务会计(第4版)习题答案-周华
- 甲状腺眼病的生物制剂治疗专家共识(2025)解读
- 商飞在线测评题库
- 宫颈后装放疗相关知识
- 《重点新材料首批次应用示范指导目录(2024年版)》
- 《公路建设项目文件管理规程》
- 抖音运营拍摄合作合同范本2024年
- VRAR技术在教育领域的应用与创新实践
- 江苏省无锡市2020年中考英语试题(原卷版)
评论
0/150
提交评论