版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1章数据挖掘基础
教案
课程名称:Pyihon数据分析与挖掘实战
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论28学时,实验36学时)
总学分:4.0学分
本章学时:1学时
一、材料清单
(1)《Python数据分析与挖掘实战》教材。
(2)配套PPT。
(3)引导性提问。
(4)探究性问题。
(5)拓展性问题。
二、教学目标与基本要求
1.教学目标
从数据挖掘的发展史出发,引出数据挖掘的概念、基本任务、建模过程及常用工具,从
而对数据挖掘的概念、基本任务、建模过程及常用工具做简单的介绍。让学生感悟到数据挖
掘的非凡魅力。
2.基本要求
(1)了解数据挖掘的基本任务。
(2)熟悉数据挖掘的通用流程。
(3)了解常用的数据挖掘工具。
(4)掌握Python数据挖掘环境的配置方法。
三、问题
1.引导性提问
引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问
题,提问,从而达到理解•、掌握知识,发展各种能力和提高思想觉悟的目的。
(1)数据挖掘能够做什么?
(2)现实生活中存在哪些数据挖掘工具?
2.探究性问题
探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的
基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课
文中又是重要的问题加以设问。
(1)数据挖掘的基本任务是什么?
(2)数据挖掘建模的过程是怎样的?
3.拓展性问题
拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提
出切实可行的关乎'更际的可操作问题C亦可以提供拓屐资料供学生研习探讨.完成拓展性问
题。
(1)数据挖掘是不是万能的?
(2)模型评价的方法有什么?
四、主要知识点、重点与难点
1.主要知识点
(1)数据挖掘的概念。
(2)数据挖掘的基本任务。
(3)数据挖掘的通用流程。
(4)常用数据挖掘工具。
(5)数据挖掘环境配置。
2.重点
数据挖掘的通用流程,
3.难点
数据挖掘的通用流程,
五、教学过程设计
1.理论教学过程
(1)数据挖掘的发展史。
(2)数据挖掘的基本任务。
(3)数据挖掘的通用流程。
(4)常用数据挖掘工具。
(5)数据挖掘环境配置。
六、教材
1.教材
翟世臣,张良均.Pyihon数据分析与挖掘实战[M].北京:人民邮电出版社.2022.
第2章Python数据挖掘编程基础
教案
课程名称:Python数据分析与挖掘实战
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论28学时,实验36学时)
总学分:4.0学分
本章学时:3学时
七、材料清单
(6)《Python数据分析与挖掘实战》教材。
(7)配套PFT,
(8)引导性提问。
(9)探究性问题。
(10)拓展性问题。
八、教学目标与基本要求
3.教学目标
本章主要对Python进行简单介绍。首先,介绍Python的运行方式、基本命令、数据结
构以及库的导入与添加。然后,简单介绍NumPy、pandas、Matplotlib、scikit-learn>TensorFlow、
KerassPytorchsPaddlePaddle、Caffe>PyMySQL、SciPy、StatsmodelssXGBoost等库。
4.基本要求
(5)掌握Pylhon基本命令的使用方法。
(6)掌握Python数据结构的各类型的使用方法.
(7)掌握库的导入与添加的方法。
(8)了解Python数据分析预处理的常用库。
(9)了解Python数据挖掘建模的常用库。
九、问题
5.引导性提问
引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问
题,提问,从而达到理解•、掌握知识,发展各种能力和提高思想觉悟的目的。
(3)如何运行Python代码?
(4)Python中怎么导入与添加库呢?
6.探究性问题
探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的
基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课
文中又是重要的问题加以设问。
(3)Python有哪些内建的数据结构?
(4)Python中是否可以对库名重命名?
(5)使用pandas库的时候的需要注意什么?
7.拓展性问题
拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提
出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问
(3)Python中除了Matplotlib库,还有什么绘图库?
(4)还有什么方式可以构建SVM模型?
十、主要知识点、重点与难点
8.主要知识点
(6)Pylhon的基本运算、数据结构以及库的导入与添加。
(7)Python中NumPy、pandas»Matplotlib,scikit-leam,TensorFlow,Keras»Pytorch.
PaddlePaddle、Caffe>PyMySQL、SciPy、Statsmodels^XGBoost等库的简单介绍。
9.重点
(1)Python的基本运算。
(2)Python的数据结。
(3)Python库的导入与添加。
10.难点
(1)Python的基本运算。
(2)Python的数据结。
(3)Python库的导入与添加。
十一、教学过程设计
11.理论教学过程
(1)Pylhon的基本运算。
(2)Python的数据结构。
(3)Pylhon数据分析预处理的常用库。
(4)Pylhon数据挖掘建模的常用库。
12.实验教学过程
(1)运行Python基本命令的程序。
(2)使用Python各数据结构。
(3)导入库。
(4)添加第三方库,
十二、教材
13.教材
翟世臣,张良均.Python数据分析与挖掘实战[M].北京:人民邮电出版社.2022.
14.参考资料
11]黄红梅,张良均.Python数据分析与应用[M].北京:人民邮电出版社.2018.
[2]张良均,谭立云.Python数据分析与挖掘实战(第2版)[M].北京:机械工业出
版社.2019.
[3]张健,张良均.Python编程基础[M].北京:人民邮电出版社.2018.
第3章数据探索
教案
课程名称:Python数据分析与挖掘实战
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论28学时,实验36学时)
总学分:4.0学分
本章学时:4学时
十三、材料清单
(II)《Python数据分析与挖掘实战》教材。
(12)配套PPT。
(13)引导性提问。
(14)探究性问题。
(15)拓展性问题。
十四、教学目标与基本要求
15.教学目标
本章从应用的角度出发,从数据质量分析和数据特征分析两个方面对数据进行探索分析。
数据质量分析要求拿到数据后要先检测是否存在不一致性、缺失值和异常值;数据特征分析
要求在数据挖掘建模前,通过描述性统计分析、分布分析、对比分析、周期分析、贡献度分
析、相关性分析等方法,对采集的样本数据的特征规律进行分析,以了解数据的规律和趋势,
为数据挖掘的后续环节提供支持。
16.基本要求
(10)了解数据不一致的概念和一致性校验的常用方法。
(11)掌握缺失值校验和异常值分析的常用方法。
(12)掌握数据特征分析的方法。
十五、问题
17.引导性提问
引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问
题,提问,从而达到理解•、掌握知识,发展各种能力和提高思想觉悟的目的。
(5)为什么要进行数据探索?
(6)Python中的数据探索函数有哪些?
18.探究性问题
探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的
基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课
文中又是重要的问题加以设问。
(6)数据校验的主要任务是什么?
(7)有什么手段可以进行数据特征分析?
(8)周期性分析有什么意义?
19.拓展性问题
拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提
出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问
(5)如何处理数据校验中发现的缺失值和异常值数据?
(6)处理不一致数据的方法有什么?
十六、主要知识点、重点与难点
20.主要知识点
(8)数据校验。
(9)数据特征分析,
21.重点
(4)数据校验。
(5)数据特征分析。
22.难点
(1)数据校验。
(2)数据特征分析,
十七、教学过程设计
23.理论教学过程
(5)一致性分析的方法。
(6)缺失值分析的方法。
(7)异常值分析的方法。
(8)描述性统II分析。
(9)分布分析的方法。
(10)对比分析的方法。
(II)周期性分析的方法。
(12)贡献度分析的方法。
(13)相关性分析的方法。
24.实验教学过程
(5)使用Python进行数据校验。
(6)使用Python进行数据特征分析。
十八、教材
25.教材
翟世臣,张良均.Pyihon数据分析与挖掘实战[M].北京:人民邮电出版社.2022.
26.参考资料
[1]黄红梅,张良均.Python数据分析与应用[M].北京:人民邮电出版社.2018.
12]张良均,谭立云,Python数据分析与挖掘实战(第2版)[M].北京:机械工业出
版社.2019.
[3]张健,张良均.Pylhon编程基础[M].北京:人民邮电出版社.2018.
第4章数据预处理
教案
课程名称:Python数据分析与挖掘实战
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论28学时,实验36学时)
总学分:4.0学分
本章学时:6学时
十九、材料清单
(16)《Python数据分析与挖掘实战》教材。
(17)配套PPT。
(18)引导性提问。
(19)探究性问题。
(20)拓展性问题。
二十、教学目标与基本要求
27.教学目标
介绍数据分析的数据预处理过程,即数据清洗、数据变换和数据合并。数据清洗介绍对
重复值、缺失值和异常值的处理。数据变换介绍了如何从不同的应用角度对已有属性进行函
数变换、数据标准化、数据离散化、独热编码:数据合并介绍将多个数据源中的数据合并存
放到一个数据存储的过程,以及分组聚合。
28.基本要求
(13)掌握Python中数据清洗的方法.
(14)掌握Python中数据变换的方法。
(15)掌握Python中数据合并的方法。
(16)了解Python主要数据预处理函数。
二H^一、问题
29.引导性提问
引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问
题,提问,从而达到理解•、掌握知识,发展各种能力和提高思想觉悟的目的。
(7)数据质量不高的情况下如何提高数据质量?
(8)数据预处理包含哪些内容?
30.探究性问题
探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的
基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课
文中又是重要的问题加以设问。
(9)数据预处理各个步骤是否有先后?
(10)数据变换的目的是什么?
31.拓展性问题
拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提
出切实可行的关乎'更际的可操作问题C亦可以提供拓屐资料供学生研习探讨.完成拓展性问
题。
(7)数据清洗除了块失值处理和异常值处理外,还能有什么操作?
(8)能否将数据预处理当中的方法写成自定义函数?
二十二、主要知识点、重点与难点
32.主要知识点
(10)数据清洗的方法。
di)数据变换的方法。
(12)数据合并的方法。
(13)主要的数据预处理函数。
33.重点
(6)数据清洗的方法。
(7)数据变换的方法。
(8)数据合并的方法。
34.难点
(3)数据清洗的方法。
(4)数据变换的方法。
(5)数据合并的方法。
二十三、教学过程设计
35.理论教学过程
(14)重复值、缺失值、异常值处理方法。
(15)常见的函数变换。
(16)数据规范化和离散化的方法。
(17)独热编码的方法。
(18)多表合并的方法。
(19)分组聚合的方法。
(20)Python主要数据预处理函数。
36.实验教学过程
(7)使用Python进行数据清洗。
(8)使用Python进行数据变换。
(9)使用Python进行数据合并。
二十四、教材
37.教材
翟世臣,张良均.Python数据分析与挖掘实战[M].北京:人民邮电出版社.2022.
38.参考资料
11]黄红梅,张良均.Python数据分析与应用[M].北京:人民邮电出版社.2018.
12]张良均,谭立云.Python数据分析与挖掘实战(第2版)[M].北京:机械工业出
版社.2019.
[3]张健,张良均.Python编程基础[M].北京:人民邮电出版社.2018.
第5章数据挖掘算法基础
教案
课程名称:Python数据分析与挖掘实战
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论28学时,实验36学时)
总学分:4.0学分
本章学时:15学时
二十五、材料清单
(21)《Python数据分析与挖掘实战》教材。
(22)配套PPT。
(23)引导性提问。
(24)探究性问题。
(25)拓展性问题。
二十六、教学目标与基本要求
39.教学目标
根据数据挖掘技术的基本任务,即分类与回归、聚类、关联规则、智能推荐、时序模式
5个方面,介绍了对应的数据挖掘建模方法及实现过程。分类与回归主要介绍线性模型、决
策树、最近邻分类、支持向量机、神经网络和集成算法:聚类主要介绍K-Means聚类、密
度聚类和层次聚类;关联规则主要介绍Apriori算法和FP-Growth算法:智能推荐主要介绍
协同过滤推荐算法和基于流行度的推荐算法;时序模式从序列的平稳性和非平稳型出发,对
平稳时间序列主要介绍AR模型、MA模型、ARMA模型,对差分平稳序列建立ARIMA模
型。
40.基本要求
(17)掌握Python中分类与回归的方法。
(18)掌握Python中聚类分析的方法。
(19)掌握Python中关联规则分析的方法。
(20)掌握Python中智能推荐的方法。
(21)掌握Python中时序模式的分析方法。
二十七、问题
41.引导性提问
引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问
题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。
(9)常见的模型算法使用场景有哪些?
(10)关联规则算法有哪些?
42.探究性问题
探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的
基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课
文中又是重要的问题加以设问。
di)回归模型有兀种,它们各自适用于怎样的条件?
(12)聚类和分类的区别是什么?
43.拓展性问题
拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提
出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问
题。
(9)不同的算法,可解释性不同,能否挑选一种H解释件强的算法对算法结果进行解
释?
(10)聚类算法的评价指标还有哪些?
二十八、主要知识点、重点与难点
44.主要知识点
(14)常用的分类与回归算法。
(15)分类与回归的模型评价方法。
(16)分类与回归算法基本原理及实现过程。
(17)常用的聚类分析算法。
(18)聚类模型的评价方法。
(19)聚类分析算法简介及基本原理。
(20)聚类分析算法实现过程及评价。
(21)常用关联规则算法。
(22)Apriori算法的原理与实现过程。
(23)FP-Growth算法的原理与实现过程。
(24)常见的智能推荐算法八
(25)智能推荐模型的评价方法。
(26)协同过滤推荐算法的原理与实现过程。
(27)基于流行度的推荐算法的原理与实现过程。
(28)常见的时间序列模型。
(29)时间序列的预处理。
(30)平稳时间序列分析。
(31)非平稳时间序列分析。
45.重点
(9)分类与回归算法基本原理及实现过程。
(10)聚类分析算法简介及基本原理。
(11)聚类分析算法实现过程及评价。
(12)Apriori算法的原理与实现过程。
(13)协同过滤推卷算法的原理与实现过程。
(14)基于流行度的推荐算法的原理与实现过程
(15)时间序列的预处理。
(16)平稳时间序列分析。
(17)非平稳时间序列分析。
46.难点
(6)分类与回归算法基本原理及实现过程。
(7)聚类分析算法简介及基本原理。
(8)Apriori算法的原理与实现过程。
(9)协同过滤推荐算法的原理与实现过程。
(10)基于流行度的推荐算法的原理与实现过程
(11)平稳时间序列分析。
(12)非平稳时间序列分析。
二十九、教学过程设计
47.理论教学过程
(21)常用的分类与回归算法。
(22)分类与回归算法的评价方法。
(23)线性模型的原理。
(24)决策树的原理。
(25)最近邻分类的原理。
(26)支持向量机的原理。
(27)神经网络的原理。
(28)集成算法的原理。
(29)常用聚类分析算法。
(30)聚类分析算法的评价方法
(31)K-Means聚类算法的原理。
(32)密度聚类算法的原理。
(33)层次聚类算法的原理。
(34)常见关联规则算法。
(35)Apriori算法的原理。
(36)FP-Growth算法的原理。
(37)常见智能推荐算法。
(38)智能推荐算法的评价方法
(39)协同过滤推卷算法的原理。
(40)常用的时间序列算法。
(41)时间序列预史理的方法。
(42)平稳时间序列分析。
(43)非平稳时间序列分析。
48.实验教学过程
(10)使用线性回归算法进行回归预测。
(ID使用逻辑回归算法进行分类预测。
(12)使用决策树算法进行分类预测。
(13)使用最近邻分类算法进行分类预测。
(14)使用支持向量机算法进行分类预测。
(15)使用神经网络算法进行分类预测。
(16)使用集成算法进行分类预测。
(17)使用K-Mcans进行聚类分析。
(18)使用密度聚类算法进行聚类分析。
(19)使用层次聚类算法进行聚类分析。
(20)使用Apriori算法进行关联分析。
(21)使用FP-Growth算法进行关联分析。
(22)使用协同过滤推荐算法进行智能推荐。
(23)使用基于流行度的推荐算法进行智能推荐。
(24)使用ARIMA模型进行时间序列分析。
三十、教材
49.教材
翟世臣,张良均.Pyihon数据分析与挖掘实战[M].北京:人民邮电出版社.2022.
50.参考资料
[1]黄红梅,张良均.Python数据分析与应用[M].北京:人民邮电出版社.2018.
[2]张良均,谭立云.Python数据分析与挖掘实战(第2版)[M].北京:机械工业出
版社.2019.
[3]张健,张良均.Python编程基础[M].北京:人民邮电出版社.2018.
第6章信用卡高风险客户识别
教案
课程名称:Python数据分析与挖掘实战
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论28学时,实验36学时)
总学分:4.0学分
本章学时:7学时
三十一、材料清单
(26)《Python数据分析与挖掘实战》教材。
(27)配套PPT。
(28)引导性提问。
(29)探究性问题。
(30)拓展性问题。
三十二、教学目标与基本要求
51.教学目标
结合出信用卡客户风险级别的项目,重点介绍了数据探索、属性规约、属性构造,并建
立客户风险K-Means聚类模型,分析了每一类客户的特征,最后分析目前银行的信用卡客
户结构,并提出了风险控制相关的建议。
52.基本要求
(1)熟悉信用卡高风险客户识别的步骤与流程.
(2)掌握探索整体数据分布和不同属性之间的美系的方法.
(3)掌握用K-Means聚类算法对根据信用卡客户数据进行客户分群。
(4)掌握对聚类结果进行特征分析的方法。
三十三、问题
53.引导性提问
引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问
题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。
(1)影响信用卡客户风险的相关因素有哪些?
(2)信用卡高风险客户识别的意义在哪里?
54.探究性问题
探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的
基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课
文中又是重要的问题加以设问。
(1)描述性统计分析的指标有哪些?
(2)数据探索的意义是什么?
(3)K-Means算法怎么寻求最优的参数?
(4)聚类算法的评价指标有什么?
55.拓展性问题
拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提
出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问
题。
(1)除了K-Mcans还有很多聚类算法,能否使用其他聚类算法解决该需求?
(2)除了可以对信用卡客户风险识别,现实生活中还有什么其他类似的操作呢?
三十四、主要知识点、重点与难点
56.主要知识点
(1)信用卡高风险客户识别的步骤与流程。
(2)探索整体数据分布的方法。
(3)探索不同属性之间的关系的方法。
(4)K-Means聚类算法的原理和应用。
(5)聚类算法的评价方法。
57.重点
(1)信用卡高风险客户识别的步骤与流程。
(2)K-Means聚类算法的原理和应用。
(3)聚类算法的评价方法。
58.难点
(1)K-Mcans聚类算法的原理和应用。
(2)聚类算法的评价方法。
三十五、教学过程设计
59.理论教学过程
(1)分析信用卡高风险客户识别背景和数据。
(2)熟悉信用卡高风险客户识别的步骤与流程。
(3)了解描述性统计分析。
(4)了解K-Means聚类算法。
(5)分析聚类结果,
60.实验教学过程
(1)描述性统计分析。
(2)分析客户历史信用记录。
(3)分析客户经济情况。
(4)分析客户经济风险情况。
(5)清洗数据。
(6)属性构造。
(7)构建K-Mcans聚类模型。
(8)评价K-Means聚类模型。
三十六、教材与参考资料
61.教材
翟世臣,张良均.Pylhon数据分析与挖掘实战[M].北京:人民邮电出版社.2022.
62.参考资料
[1]黄红梅,张良均,Python数据分析与应用[M].北京:人民邮电出版社.2018.
[2]张良均,谭立云,Python数据分析与挖掘实战(第2版)[M].北京:机械工业出
版社.2019.
[3]张健,张良均.Python编程基础[M].北京:人民邮电出版社.2018.
第7章餐饮企业菜品关联分析
教案
课程名称:Python数据分析与挖掘实战
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论28学时,实验36学时)
总学分:4.0学分
本章学时:6学时
三十七、材料清单
(31)《Python数据分析与挖掘实战》教材。
(32)配套PPT。
(33)引导性提问。
(34)探究性问题。
(35)拓展性问题。
三十八、教学目标与基本要求
63.教学目标
结合航空公司客户数据对原始数据进行探索性分析,分别绘制每日用餐人数和营业额折
线图、菜品热销度柱形图进行展示与分析,并针对数据中不符合建模要求的数据进行预处理,
主要进行数据清洗和属性构造。同时构建Apriori模型店餐饮企业的菜品进行关联分析并进
行模型评价,从而为企业提供菜品搭配销售意见。
64.基本要求
(6)了解案例的背景、数据说明和分析目标.
(7)掌握每日用餐人数、营业额和菜品热销度的分析方法。
(8)掌握数据清洗、属性构造的方法。
(9)掌握构建Apriori模型的方法。
(10)掌握模型评价方法。
三十九、问题
65.引导性提问
引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问
题,提问,从而达到理解•、掌握知识,发展各种能力和提高思想觉悟的目的。
(1)餐饮企业如何提高服务水平、留住客户、提高利润呢?
(2)餐饮企业能够提供什么样的数据?
(3)为什么餐饮企业要做菜品关联分析?
66.探究性问题
探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的
基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课
文中又是重要的问题加以设问。
(1)分析菜品热销度时需要对数据进行怎么样的处理呢?
(2)毛利率的计算公式是怎么样的呢?
(3)Apriori算法的基本原理是什么?
67.拓展性问题
拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提
出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问
题。
(1)实现本案例的目标还能使用什么方法?
(2)菜品关联分析分析模型中,最小支持度和最个置信度设为其他值,模型的效果会
如何?
四十、主要知识点、重点与难点
68.主要知识点
(32)分析餐饮企业现状、基本数据情况。
(33)熟悉餐饮企业菜品关联分析的基本流程与步麻。
(34)分析每日用餐人数和营业额。
(35)使用统计学知识分析热销商品。
(36)了解Apriori算法的基本原理与使用方法。
(37)构建菜品的Apriori模型。
(38)根据模型结果提出菜品销售策略。
69.重点
(18)购物篮分析的基本流程与步骤。
(19)零售商品的Apriori模型。
70.难点
Apriori算法的基本原理与使用方法°
四十一、教学过程设计
71.理论教学过程
(1)分析餐饮企业菜品背景和数据。
(2)熟悉餐饮企业菜品关联分析的步骤与流程。
(3)分析每日用餐人数和营业额。
(4)分析菜品热销度。
(5)了解Apriori算法的基本原理与使用方法。
72.实验教学过程
(1)分析每日用餐人数和营业额。
(2)分析菜品热销度。
(3)清洗数据。
(4)属性构造。
(5)构建Apriori模型。
(6)评价Apriori模型。
四十二、教材与参考资料
73.教材
翟世臣,张良均.Pylhon数据分析与挖掘实战[M].北京:人民邮电出版社.2022.
74.参考资料
[1]黄红梅,张良均.Python数据分析与应用[M].北京:人民邮电出版社.2018.
I2j张良均,谭立云,Python数据分析与挖掘实战(第2版)[M].北京:机械工业出
版社.2019.
[3]张健,张良均.Pylhon编程基础[M].北京:人民邮电出版社.2018.
第8章金融服务机构资金流量预测
教案
课程名称:Python数据分析与挖掘实战
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论28学时,实验36学时)
总学分:4.0学分
本章学时:5学时
四十三、材料清单
(36)《Python数据分析与挖掘实战》教材。
(37)配套PPT。
(38)引导性提问。
(39)探究性问题。
(40)拓展性问题。
四十四、教学目标与基本要求
75.教学目标
结合蚂蚁金服资金流入预测的案例,介绍了时间序列分析法中ARIMA模型在实际案例中
的应用过程。查看原始数据观察数据的趋势规律,根据数据的时间趋势进行差分,对时间序
列的平稳性检验、白噪声检验做了详细说明,最后利用BIC准则定阶对模型进行定阶,构
建ARIMA模型对数据新型预测,根据真实值与预测值的对比结果对模型进行评级。
76.基本要求
(II)了解案例的背景、数据说明和分析目标C
(12)熟悉金融服务机构资金流量预测的步骤与流程。
(13)掌握数据平稳性的检验和处理方法,以及白噪声检验。
(14)掌握用ARIMA模型对资金流量进行预测。
(22)掌握对ARIMA模型的检验。
四十五、问题
77.引导性提问
引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问
题,提问,从而达到理解•、掌握知识,发展各种能力和提高思想觉悟的目的。
di)什么是资金流审:的预测?
(12)资金流量预测的意义是什么?
78.探究性问题
探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的
基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课
文中又是重要的问题加以设问。
(13)资金流量预测用到哪些算法?
(14)时间序列模型如何定阶?
(15)ARIMA模型的基本原理是什么?
79.拓展性问题
拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提
出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问
题。
(ID当平稳性检验和白噪声检验没有通过时需要如何处理?
(12)除了绘制真实值和预测值的对比图,还有什么评价模型效果的方法吗?
四十六、主要知识点、重点与难点
80.主要知识点
(39)分析金融服务机构资金流量背景和数据。
(40)熟悉金融服务机构斐金流量预测的基本流程弓步骤。
(41)数据构造和数据截取。
(42)数据平稳性的检验和处理。
(43)白噪声检验。
(44)ARIMA模型的原理与使用方法。
(45)ARIMA模型的评价方法。
81.重点
(20)熟悉金融服务机构资金流量预测的基本流程与步骤。
(21)ARIMA模型的原理与使用方法。
82.难点
ARIMA模型的原理与使用方法.
四十七、教学过程设计
83.理论教学过程
(44)分析金融服务机构资金流策背景和数据。
(45)熟悉金融服务机构资金流量预测的基本流程与步骤。
(46)了解平稳性检验和向噪声检验的方法。
(47)了解时间序列模型的定阶方法。
(48)了解ARIMA算法。
(49)掌握时间序列模型的评价方法。
84.实验教学过程
(1)属性构造。
(2)截取平稳部分数据。
(3)周期性差分。
(4)平稳性检验和白噪声检验。
(5)时间序列模型的定阶。
(6)评价ARIMA模型。
四十八、教材与参考资料
85.教材
翟世臣,张良均.Pyihon数据分析与挖掘实战[M].北京:人民邮电出版社.2022.
86.参考资料
[1]黄红梅,张良均.Python数据分析与应用[M].北京:人民邮电出版社.2018.
[2]张良均,谭立云.Python数据分析与挖掘实战(第2版)[M].北京:机械工业出
版社.2019.
13J张健,张良均.Python编程基础[M].北京:人民邮电出版社.2018.
第9章020优惠券使用预测
教案
课程名称:Python数据分析与挖掘实战
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论28学时,实验36学时)
总学分:4.0学分
本章学时:7学时
四十九、材料清单
(41)《Python数据分析与挖掘实战》教材。
(42)配套PPT。
(43)引导性提问。
(44)探究性问题。
(45)拓展性问题。
五十、教学目标与基本要求
87.教学目标
根据020平台中用户使用优惠券的历史记录,先对原始数据进行描述性统计和探索性
分析,主要分析优惠形式信息、用户消费行为和商户投放优惠券信息。后对数据进行数据预
处理,包括数据清洗和数据转换,以及结合用户、商户、优惠券、用户和商户交互特点构造
新指标。最后分别建立决策树分类模型、梯度提升分类模型和XGBoost分类模型,预测用
户在领取优惠券后15天以内的使用情况,并对各个模型进行模型评价。
88.基本要求
(15)了解案例的背景、数据说明和分析目标。
()6)掌握描述性统计分析方法。
(17)掌握分析优惠形式、用户消费行为、商户投放优惠券信息的方法。
(18)掌握数据清洗和数据变换的数据预处理方法。
(19)掌握构建决策树、梯度提升和XGBoost分类模型的方法。
(20)掌握模型评价方法。
五十一、问题
89.引导性提问
引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问
题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。
(3)020是什么呢?
(4)企业发放的优惠券都会被使用吗?
90.探究性问题
探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的
基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课
文中乂是重要的问题加以设问。
(5)决策树算法的优点是什么?
(6)使用三种分类模型对020优惠券使用预测的作用是什么?
91.拓展性问题
拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提
出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问
题。
(3)除了这三种模型,还可以使用什么模型呢?
(4)决策树模型的参数有哪些可以设置,如何针对数据特征进行参数择优选择7
五十二、主要知识点、重点与难点
92.主要知识点
(1)020优惠券使用预测分析方法与流程。
(2)数据探索的方法和步骤u
(3)数据预处理的方法和步骤。
(4)决策树算法的原理与使用方法。
(5)梯度提升分类算法的原理与使用方法。
(6)XGBoost分类算法的原理与使用方法。
93.重点
(4)020优惠券使用预测分析方法与流程。
(5)决策树算法的原理与使用方法。
(6)梯度提升分类算法的原理与使用方法。
(7)XGBoost分类算法的原理与使用方法。
94.难点
(1)决策树算法的原理与使用方法。
(2)梯度提升分类算法的原理与使用方法。
(1)XGBoost分类算法的原理与使用方法。
五十三、教学过程设计
95.理论教学过程
(6)分析020优惠券使用的背景和数据。
(7)熟悉020优惠券使用预测的分析步骤与流程。
(8)了解数据分析探索的方法。
(9)了解决策树算法。
(10)了解梯度提升算法。
(II)了解XGBoosi分类算法。
(12)掌握分类模型的评价方法。
96.实验教学过程
(9)描述性统计分析。
(10)分析优惠形式信息。
(H)分析用户消费行为信息。
(12)分析商户投放优惠券信息。
(13)清洗数据。
(14)变换数据。
(15)构建决策树分类模型。
(16)构建梯度提升分类模型。
(17)构建XGBoost分类模型。
(18)评价分类模型。
五十四、教材与参考资料
97.教材
翟世臣,张良均.Pylhon数据分析与挖掘实战[M].北京:人民邮电出版社.2022.
98.参考资料
[1]黄红梅,张良均.Python数据分析与应用[M].北京:人民邮电出版社.2018.
12]张良均,谭立云.Python数据分析与挖掘实战(第2版)[M].北京:机械工业出
版社.2019.
[3]张健,张良均.Python编程基础[M].北京:人民邮电出版社.2018.
第10章电视产品个性化推荐
教案
课程名称:Python数据分析与挖掘实战
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论28学时,实验36学时)
总学分:4.0学分
本章学时:7学时
五十五、材料清单
(46)《Python数据分析与挖掘实战》教材。
(47)配套PPT。
(48)引导性提问。
(49)探究性问题。
(50)拓展性问题。
五十六、教学目标与基本要求
99.教学目标
结合广电大数据营销推荐的案例,重点介绍了在数据可视化、用户画像构造的辅助下,
运用基于物品的协同过滤算法和基于流行度的推荐算法在实际案例中的应用。首先通过对用
户收视行为信息数据等数据进行分析与处理,再采用不同推荐算法对处理好的数据进彳j建模
分析,最后通过模型评价与结果分析,发现不同算法的优缺点,同时通过模型得出相关的电
视产品个性化推荐的业务建议。
100.基本要求
(1)了解电视产品个性化推荐案例的背景、数据说明和分析目标。
(2)掌握常用的数据清洗方法,对数据进行数据清洗。
(3)掌握常用的数据探索方法,对数据进行分布分析•、对比分析和贡献度分析。
(4)掌握常用的属性构造方法,构建用户画像标签。
(5)熟悉基于物品的协同过滤算法和基于流行度的推荐算法,构建推荐模型。
(6)掌握推荐系统的评价方法,对构建的推荐模型进行模型评价。
五十七、问题
101.引导性提问
引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问
题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。
(5)什么是智能推荐?
(6)生活中常见的智能推荐服务有哪些?
(7)实现智能推荐的算法有哪些?
102.探究性问题
探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的
基础上,从重点、难点问睡切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课
文中乂是重要的问题加以设问。
(7)电视产品个性化的推荐流程是怎么样的?
(8)协同过滤算法除了基于物品的算法外,还有哪些?
103.拓展性问题
拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提
出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问
题。
(5)除了协同过滤算法和流行度推荐算法外,能否使用其他算法预测熨现网站的智能
推荐?
(6)除了使用准确率和召回率评价推荐算法外,还是什么评价指标?
五十八、主要知识点、重点与难点
104.主要知识点
(7)了分析电视产品个性化推荐的背景和数据。
(8)熟悉电视产品个性化推荐的步骤与流程。
(9)根据收视行为信息数据进行数据清洗、数据探索、属性构造。
(10)基于物品的协同过滤算法的原理与使用方法。
(11)基于流行度的推荐算法的原理与使用方法。
(12)对推荐进行评价,判断推荐系统的好坏。
105.重点
(8)熟悉电视产品个性化推荐的步骤与流程。
(9)基于物品的协同过源算法的原理与使用方法。
(10)基基于流行度的推荐算法的原理与使用方法。
(11)对推荐进行评价,判断推荐系统的好坏。
106.难点
(1)基于物品的协同过滤算法的原理与使用方法。
(2)基基干流行度的推荐算法的原理与使用方法.
五十九、教学过程设计
107.理论教学过程
(13)分析电视产品个性化推荐的背景和数据。
(14)熟悉电视产品个性化推荐的步骤与流程。
(15)了解基于物品的协同过滤算法。
(16)了解基于流行度的推荐算法。
(17)掌握智能推卷算法的评价方法。
108.实验教学过程
(19)清洗数据。
(20)探索数据。
(21)构造属性。
(22)构建基于物品的协同过滤算法的推荐模型。
(23)构建基于流行度的推荐算法模型。
(24)评价智能推荐模型。
六十、教材与参考资料
109.教材
翟世臣,张良均.Python数据分析与挖掘实战[M].北京:人民邮电出版社.2022.
110.参考资料
[1]黄红梅,张良均.Pylhon数据分析与应用[M].北京:人民邮电出版社.2018.
[2]张良均,谭立云.Pylhon数据分析与挖掘实战(第2版)[M].北京:机械工业出
版社.2019.
[3]张健,张
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年惠州市第六人民医院招聘备考题库及完整答案详解1套
- 2026年三明空港物业管理有限公司招聘备考题库及答案详解1套
- 陕西省西咸新区秦汉中学2026年教师招聘备考题库及1套完整答案详解
- 2026年宁波文旅会展集团有限公司招聘备考题库及一套答案详解
- 内科学总论公共卫生知识课件
- 2026年兰溪市中医院第一批面向高校公开招聘医学类应届毕业生的备考题库及一套完整答案详解
- 2025年连江县国有企业公开招聘备考题库及参考答案详解
- 2026年北京市大兴区瀛海镇社区卫生服务中心面向社会公开招聘备考题库及答案详解(考点梳理)
- 甘肃省妇幼保健院(甘肃省中心医院)2026年度招聘188人备考题库及答案详解1套
- 2026年洛阳市三鑫投资有限公司副总经理招聘备考题库及答案详解(夺冠系列)
- 车辆机械系统检修120型控制阀结构64课件
- 【MOOC期末】《创新创业与管理基础》(东南大学)中国大学慕课答案
- 耕作学知到智慧树章节测试课后答案2024年秋中国农业大学
- 幼儿园游戏活动案例的撰写
- 数据安全重要数据风险评估报告
- 六年级上册语文补充习题及答案
- 2024湖南艺术职业学院教师招聘考试笔试试题
- 24秋国家开放大学《计算机系统与维护》实验1-13参考答案
- 2023湖南艺术职业学院教师招聘考试真题题库
- Photoshop CS6图形图像处理标准教程(微课版第2版)PPT完整全套教学课件
- 安全生产监管知识培训课件
评论
0/150
提交评论