版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1章Python概述
教案
课程名称:Python机器学习编程与实战
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论36学时,实验28学时)
总学分:4.0学分
本章学时:3学时
ー、材料清单
(1)《Python机器学习编程与实战》教材。
(2)配套PPT。
(3)引导性提问。
(4)探究性问题。
(5)拓展性问题。
二、教学目标与基本要求
1.教学目标
通过阐述Python语言的特性,说明使用Python进行机器学习的优势,并列举说明Python
与机器学习相关的常用依赖库的功能。紧接着阐述Python环境的配置方法,简要介绍Python
集成开发环境-Anaconda,实现在Windows系统下安装Anaconda环境,并同时介绍Jupyter
Notebook的使用方法。之后介绍Python的基础知识,包括固定语法、运算符、数据类型、
输入/输出操作与文件!/O。最后介绍Python中控制语句和函数的使用方法。
2.基本要求
(1)了解Python语言的特性。
(2)了解Python的常用依赖库。
(3)掌握Windows系统下Anaconda的安装。
(4)掌握JupyterNotebook的使用方法。
(5)熟悉Python的基础知识
(6)熟悉Python中的控制语句和函数的使用方法
三、问题
1.引导性提问
引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问
题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。
(1)Python语言有哪些优点与缺点?
(2)固定语法有什么作用?
2.探究性问题
探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的
基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课
文中又是重要的问题加以设问。
(1)JupyterNotebook有哪些优缺点?
(2)Python的固定语法有什么特色?
3.拓展性问题
拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提
出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问
题。
(1)Python语言用于机器学习有哪些优势?
(2)Python运算符优先级与数学中的运算符优先级有哪些不同?
四、主要知识点、重点与难点
1.主要知识点
(1)Python的语言特性、基础知识、控制语句与函数。
(2)Pylhon常用的机器学习库。
(3)Windows系统下Anaconda安装。
(4)JupyterNotebook的基本使用方法。
2.重点
(1)Python的语言特性、基础知识、控制语句与函数。
(2)JupyterNotebook的常用功能。
3.难点
(1)Python的控制语句。
(2)Python的函数。
五、教学过程设计
1.理论教学过程
(1)Python的语言特性。
(2)Python机器学习的常用依赖库。
(3)Python的Anaconda发行版。
(4)在Windows操作系统上安装Anaconda。
(5)JupyterNotebook的基础功能。
(6)Python的固定语法。
(7)Python的运算符。
(8)Python中的数据类型。
(9)PythonI/O〇
(10)Python的控制语句。
(11)Python的函数。
2.实验教学过程
(1)在Windows/Linux系统上安装Anaconda〇
(2)JupyterNotebook的常用功能。
(3)Python的基础知识。
(4)Python的控制语句。
(5)Python的函数。
六、教材与参考资料
1.教材
林耀进,张良均.Python机器学习编程与实战[MJ.北京:人民邮电出版社.2020.
2.参考资料
[1J张健,张良均.Python编程基础[M].北京:人民邮电出版社.2018.谭立云,
[2]黄红梅,张良均.Python数据分析与应用[M].北京:人民邮电出版社.2018.
[31张良均.Python数据分析与挖掘实战(第2版)[M].北京:机械工业出版社.2019.
[4]李明江,张良均,周东平,张尚佳.Python3智能数据分析快速入门[M].北京:
机械工业出版社.2016.
[5J张良均.Python与数据挖掘[M].北京:机械工业出版社.2016.
第2章NumPy数值计算
教案
课程名称:Python机器学习编程与实战
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论36学时,实验28学时)
总学分:4.0学分
本章学时:5学时
七、材料清单
(6)《Python机器学习编程与实战》教材。
(7)配套PPT。
(8)数据。
(9)代码。
(10)引导性提问。
(11)探究性问题。
(12)拓展性问题。
ハ、教学目标与基本要求
3.教学目标
主要介绍NumPy重要的基础内容,包括NumPy的“心脏”ndarray及其索引,生成随
机数,创建矩阵,使用通用函数计算,以及NumPy的常用函数,为后面学习其他库(如pandas)
打下坚实的基础。
4.基本要求
(7)掌握NumPy创建多维数组与生成随机数的方法。
(8)掌握数组的索引与转换。
(9)了解NumPy中数组矩阵的运算及通用函数的基本使用方法。
九、问题
5.引导性提问
引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问
题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。
(3)NumPy从这个库的名字理解,这个库的作用是什么?
(4)数组内部存放的数据是否可以为字符串?
(5)怎样取出数组内部的某个元素?
(6)数组和矩阵是否可以转换?
6.探究性问题
探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的
基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课
文中又是重要的问题加以设问。
(3)数组和矩阵的异同点?
(4)数组和矩阵能否互相转换?
(5)能否自定义ufunc?
7.拓展性问题
拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提
出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问
题。
(3)使用NumPy能否进行本班人员的基本信息?
(4)如何将统计分析方法做成一个ufunc?
十、主要知识点、重点与难点
8.主要知识点
(5)NumPy创建多维数组与生成随机数的方法。
(6)数组的索引与转换。
(7)NumPy中数组矩阵的运算及通用函数的基本使用方法。
(8)NumPy统计分析的函数。
9.重点
(3)ndarray对象的创建与生成随机数的方法。
(4)数组的索引与变换。
(5)矩阵的运算及通用函数的基本使用方法。
10.难点
(1)ndarray对象的创建与生成随机数的方法。
(2)数组的索引与变换。
十ー、教学过程设计
11.理论教学过程
(12)创建数组对象。
(13)生成随机数。
(14)通过索引访问数组。
(15)变换数组的形态。
(16)创建NumPy矩阵。
(17)ufunc函数。
(18)使用数组进行简单的统计分析。
12.实验教学过程
(6)创建NumPy数组对象ndairay。
(7)查看ndarray的常用属性。
(8)花式索引ndarray〇
(9)变换ndarray的形态。
(10)创建NumPy矩阵并使用。
(11)使用常见ufunc。
十二、教材与参考资料
13.教材
林耀进,张良均.Python机器学习编程与实战[M].北京:人民邮电出版社.2020.
14.参考资料
[1I张健,张良均.Python编程基础[M].北京:人民邮电出版社.2018.谭立云,
12J黄红梅,张良均.Python数据分析与应用[M].北京:人民邮电出版社.2018.
[3I张良均.Python数据分析与挖掘实战(第2版)[M].北京:机械工业出版社.2019.
[4]李明江,张良均,周东平,张尚佳.Python3智能数据分析快速入门[M].北京:
机械工业出版社.2016.
L5J张良均.Python与数据挖掘[MJ.北京:机械工业出版社.2016.
第3章pandas基础
教案
课程名称:Python机器学习编程与实战
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论36学时,实验28学时)
总学分:4.0学分
本章学时:6学时
十三、材料清单
(13)《Python机器学习编程与实战》教材。
(14)配套PPT。
(15)数据。
(16)代码。
(17)引导性提问。
(18)探究性问题。
(19)拓展性问题。
十四、教学目标与基本要求
15.教学目标
阐述Series、DataFrame和Index的常用属性与方法。介绍DataFrame的索引、排序和
合并操作。介绍时间数据的转换,信息提取与算术运算。介绍文本数据的操作和索引方法。
介绍category分类型数据的创建和操作方法。通过本章的学习,能够对pandas库的基础内
容有一个整体了解。
16.基本要求
(10)掌握Series常用属性与方法。
(11)掌握DataFrame常用属性与方法。
(12)掌握Index常用属性与方法。
(13)掌握DataFrame的常用索引方法。
(14)掌握DataFrame的常用排序方法。
(15)掌握DataFrame的常用合并方法。
(16)掌握基础时间数据处理方法。
(17)掌握文本数据的基本操作和索引方法。
(18)掌握category分类型数据的基本操作方法。
十五、问题
17.引导性提问
引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问
题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。
(7)DataFrame和数组有什么相似之处?
(8)DataFrame的索引方式和Excel有什么相似和不同之处?
18.探究性问题
探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的
基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课
文中又是重要的问题加以设问。
(6)Series与Index有什么不同之处?
(7)时间数据中存在哪些信息?
(8)loc和iloc方法有什么区别?
19.拓展性问题
拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提
出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问
题。
(5)横向、纵向和主键堆叠分别适合哪些场景使用?
(6)为什么索引的时候有loc和iloc,设计者的意何在?
十六、主要知识点、重点与难点
20.主要知识点
(9)Series常用属性与方法。
(10)DataFrame常用属性与方法。
(11)Index常用属性与方法。
(12)DataFrame的常用索引、排序和合并方法。
(13)基础时间数据处理方法。
(14)文本数据的基本操作和索引方法。
(15)category分类型数据的基本操作方法
21.重点
(1)Series常用属性与方法。
(2)DataFrame常用属性与方法。
(3)Index常用属性与方法。
(4)DataFrame的常用索引、排序和合并方法。
22.难点
(1)基础时间数据处理方法。
(2)文本数据的基本操作和索引方法。
十七、教学过程设计
23.理论教学过程
(19)介绍Series常用属性。
(20)介绍Series查改增删方法。
(21)介绍DataFrame常用属性。
(22)介绍DataFrame查改增删方法。
(23)介绍Index常用属性。
(24)介绍!ndex查改增删方法。
(25)介绍DataFrame的常用索引方法。
(26)介绍DataFrame的常用排序方法〇
(27)介绍DataFrame的常用合并方法。
(28)介绍基础时间数据处理方法。
(29)介绍文本数据的处理方法。
(30)介绍category分类型数据的处理方法。
24.实验教学过程
(12)创建Series对象〇
(13)查看Series对象的常用属性。
(14)查改增删Series对象。
(15)创建DataFrame对象。
(16)查看DataFrame对象的常用属性。
(17)查改增删DataFrame对象。
(18)创建Index对象。
(19)查看Index对象的常用属性。
(20)查改增删Index对象。
(21)访问DataFrame中的单列、单列多行和多列多行数据。
(22)使用loc和iloc对DataFrame中的数据进行索引。
(23)对DataFrame中的数据进行排序。
(24)将DataFrame中的数据横向堆叠、纵向堆叠和主键合并。
(25)转换字符串时间为标准时间。
(26)提取时间序列数据信息。
(27)加减时间数据。
(28)替换指定位置的文本内容。
(29)创建category并进行查改增删。
十八、教材与参考资料
25.教材
林耀进,张良均.Python机器学习编程与实战[MJ.北京:人民邮电出版社.2020.
26.参考资料
[I!张健,张良均.Python编程基础[M].北京:人民邮电出版社.2018.谭立云,
[2]黄红梅,张良均.Python数据分析与应用[M].北京:人民邮电出版社.2018.
[31张良均.Python数据分析与挖掘实战(第2版)[M].北京:机械工业出版社.2019.
[4]李明江,张良均,周东平,张尚佳.Python3智能数据分析快速入门[M].北京:
机械工业出版社.2016.
[5J张良均.Python与数据挖掘[M].北京:机械工业出版社.2016.
第4章pandas进阶
教案
课程名称:Python机器学习编程与实战
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论36学时,实验28学时)
总学分:4.0学分
本章学时:8学时
十九、材料清单
(20)《Python机器学习编程与实战》教材。
(21)配套PPT。
(22)数据
(23)代码
(24)引导性提问。
(25)探究性问题。
(26)拓展性问题。
二十、教学目标与基本要求
27.教学目标
介绍文本文件,Excel数据和数据库数据三种常用的数据读取与写入方式。介绍
DataFrame的常用描述性统计分析方法。介绍时间序列的移动窗口方法。剖析分组聚合方法
groupby的原理,用法和三种分组计算方法。展现透视表与交叉表的制作方法。介绍缺失值
与重复数据的检测和处理方法。介绍连续型数据离散化的方法和类别型数据的哑变量处理方
法。为使用pandas进行机器学习中的数据准备工作打下基础。
28.基本要求
(19)掌握常见的数据读写方式。
(20)掌握常用的描述性统计分析方法。
(21)掌握移动窗口的方法。
(22)掌握分组聚合的原理与方法。
(23)掌握透视表与交叉表的制作。
(24)掌握缺失值与重复数据的检测和处理方法。
(25)掌握连续型数据离散化的方法。
(26)掌握哑变量处理类别型数据的方法。
二十ー、问题
29.引导性提问
引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问
题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。
(9)常见的结构化数据读取方式有哪些?
(10)常见的描述性统计分析指标有哪些?
(11)Exce!透视表如何制作?
30.探究性问题
探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的
基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课
文中又是重要的问题加以设问。
(9)读取数据库数据为什么需要别的库?
(10)重复值是否一定要处理?
(11)以百万级的数据为例,Excel制作透视表和Python制作透视表哪个速度更快?
31.拓展性问题
拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提
出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问
题。
(7)能否读取word数据,该如何做?
(8)除了哑变量处理外,还有那些方法可以处理离散型特征?
(9)能否将这些方法写成自定义函数?
二十二、主要知识点、重点与难点
32.主要知识点
(16)常见的数据读写方式。
(17)常用的描述性统计分析方法。
(18)时间序列的移动窗口方法。
(19)分组聚合的原理与方法。
(20)透视表与交叉表的制作。
(21)缺失值的检测与处理。
(22)重复值的检测与处理。
(23)连续型特征离散化。
(24)类别型特征哑变量处理。
33.重点
(6)常见的数据读写方式。
(7)常用的描述性统计分析方法。
(8)分组聚合的原理与方法。
(9)透视表与交叉表的制作。
(10)缺失值的检测与处理。
(11)重复值的检测与处理。
(12)连续型特征离散化。
(13)类别型特征哑变量处理。
34.难点
(1)常见的数据读写方式。
(2)分组聚合的原理与方法。
(3)透视表与交叉表的制作。
(4)类别型特征哑变量处理。
二十三、教学过程设计
35.理论教学过程
(31)读写文本文件。
(32)读写Exce!文件。
(33)读写数据库数据。
(34)介绍DataFrame的常用描述性统计分析方法。
(35)使用rolling方法移动窗口。
(36)使用groupby方法拆分数据。
(37)使用agg方法聚合数据。
(38)使用apply方法聚合数据。
(39)使用transform方法聚合数据。
(40)使用povit_table函数创建透视表。
(41)使用crosstab函数创建交叉表。
(42)检测与处理缺失值。
(43)检测与处理重复值。
(44)离散化连续型数据。
(45)哑变量处理类别型数据。
36.实验教学过程
(30)读写文本文件。
(31)读写Excel文件。
(32)读写数据库数据。
(33)描述分析DataFrame数据。
(34)移动窗ロ时间序列。
(35)使用groupby方法拆分数据。
(36)使用agg、叩ply、transform方法聚合数据。
(37)制作透视表。
(38)制作交叉表。
(39)检测与处理重复值、缺失值。
(40)离散化连续型数据。
(41)哑变量处理类别型数据。
二十四、教材与参考资料
37.教材
林耀进,张良均.Python机器学习编程与实战[M].北京:人民邮电出版社.2020.
38.参考资料
[1J张健,张良均.Python编程基础[MJ.北京:人民邮电出版社.2018.谭立云,
[2]黄红梅,张良均.Python数据分析与应用[M].北京:人民邮电出版社.2018.
[31张良均.Python数据分析与挖掘实战(第2版)[M].北京:机械工业出版社.2019.
[4]李明江,张良均,周东平,张尚佳.Python3智能数据分析快速入门[M].北京:
机械工业出版社.2016.
[5J张良均.Python与数据挖掘[M].北京:机械工业出版社.2016.
第5章Matplotlib基础绘图
教案
课程名称:Python机器学习编程与实战
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论36学时,实验28学时)
总学分:4.0学分
本章学时:7学时
二十五、材料清单
(27)《Python机器学习编程与实战》教材。
(28)配套PPT。
(29)数据。
(30)代码。
(31)引导性提问。
(32)探究性问题。
(33)拓展性问题。
二十六、教学目标与基本要求
39.教学目标
先介绍pyplot绘图的基本语法,常用参数。介绍分析特征间相关关系的散点图,分析
特征间趋势关系的折线图,分析特征内部数据分布的直方图和饼状图,以及分析特征内部数
据分散情况的箱线图。为后续深入学习Matplotlib数据可视化打下了深厚的基础。
40.基本要求
(27)掌握pyplot常用绘图参数调节。
(28)掌握子图的绘制方法。
(29)掌握散点图和折线图的作用与绘制方法。
(30)掌握直方图和条形图的作用与绘制方法
(31)掌握饼图的作用与绘制方法。
(32)掌握箱线图的作用与绘制方法。
二十七、问题
41.引导性提问
引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问
题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。
(12)图形和文字哪ー种更容易让大脑记住?
(13)常见的统计学图形有哪些?
(14)不同的图形所表示的意义是否相同?
42.探究性问题
探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的
基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课
文中又是重要的问题加以设问。
(12)散点图,折线图的主要功能是什么,有什么异同点?
(13)饼图,直方图,条形图的主要功能是什么,有什么异同点?
(14)箱型图的主要功能是什么?
43.拓展性问题
拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提
出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问
题。
(10)能否绘制ー个雷达图,该怎么做?
(11)如何将本班同学的数据做可视化?
二十八、主要知识点、重点与难点
44.主要知识点
(25)pyplot常用绘图参数调节。
(26)子图的绘制方法。
(27)散点图和折线图的作用与绘制方法。
(28)直方图和条形图的作用与绘制方法
(29)饼图的作用与绘制方法。
(30)箱线图的作用与绘制方法。
45.重点
(14)pyplot的基础语法。
(15)散点图和折线图的作用与绘制方法。
(16)直方图、条形图、饼图和箱线图的作用与绘制方法。
46.难点
(1)子图的绘制方法。
(2)散点图和折线图的作用与绘制方法。
(3)直方图、条形图、饼图和箱线图的作用与绘制方法。
二十九、教学过程设计
47.理论教学过程
(46)pyplot的基础语法。
(47)设置pyplot的动态rc参数。
(48)绘制散点图。
(49)绘制折线图。
(50)绘制直方图。
(51)绘制条形图。
(52)绘制饼图。
(53)绘制箱线图。
48.实验教学过程
(42)设置pyplot的动态rc参数。
(43)绘制散点图;绘制折线图。
(44)绘制直方图;绘制条形图。
(45)绘制饼图。
(46)绘制箱线图。
三十、教材与参考资料
49.教材
林耀进,张良均.Python机器学习编程与实战[MJ.北京:人民邮电出版社.2020.
50.参考资料
[I]张健,张良均.Python编程基础[M].北京:人民邮电出版社.2018.谭立云,
[2]黄红梅,张良均.Python数据分析与应用[M].北京:人民邮电出版社.2018.
[3I张良均.Python数据分析与挖掘实战(第2版)[M].北京:机械工业出版社.2019.
[4]李明江,张良均,周东平,张尚佳.Python3智能数据分析快速入门[M].北京:
机械工业出版社.2016.
L5J张良均.Python与数据挖掘[MJ.北京:机械工业出版社.2016.
第6章scikit-learn
教案
课程名称:Python机器学习编程与实战
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论36学时,实验28学时)
总学分:4.0学分
本章学时:11学时
三十ー、材料清单
(34)《Python机器学习编程与实战》教材。
(35)配套PPT。
(36)数据。
(37)代码。
(38)引导性提问。
(39)探究性问题。
(40)拓展性问题。
三十二、教学目标与基本要求
51.教学目标
介绍数据标准化、归ー化和二值化。介绍独热编码和常用降维方法。重点介绍聚类、分
类和回归三类sklearn的基本任务对应的建模方法及实现过程。同时,每一类又有对应的多
种评估方法,能够评价所构建模型的性能优劣。通过这一章的学习,基本能够掌握常用的模
型构建与评估方法,可在以后的实际案例应用过程中采用适当的算法并按所介绍的步骤实现
综合应用。
52.基本要求
(33)掌握数据标准化的常用方法。
(34)掌握数据归ー化的方法。
(35)掌握数据二值化的方法。
(36)掌握独热编码的方法。
(37)使用skleam转换器进行降维。
(38)使用sklearn估计器构建分类模型。
(39)使用skleam估计器构建回归模型。
(40)使用skleam估计器构建聚类模型。
(41)掌握数据集划分的方法。
(42)掌握交叉验证和自动调参的方法。
(43)熟悉分类、回归、排序和聚类评价函数。
三十三、问题
53.引导性提问
引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问
题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。
(15)常见的模型算法使用场景有哪些?
(16)不同的场景之间有什么区别?
(17)scikit-learn名字的由来?
54.探究性问题
探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的
基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课
文中又是重要的问题加以设问。
(15)聚类和分类的区别是什么?
(16)回归和分类的区别又是什么?
55.拓展性问题
拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提
出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问
题。
(12)不同的算法,可解释性不同,能否挑选ー种可解释性强的算法对算法结果进行
解释?
(13)除了PCA降维以外,可以使用RandomForest模型进行特征的筛选,该如何做?
三十四、主要知识点、重点与难点
56.主要知识点
(31)标准化数据。
(32)归ー化数据。
(33)二值化数据。
(34)独热编码处理类别型数据。
(35)数据降维。
(36)分类模型的构建。
(37)回归模型的构建。
(38)聚类模型的构建。
(39)数据集划分。
(40)交叉验证与自动调参。
(41)分类、回归、聚类模型的评价方法。
57.重点
(17)标准化数据。
(18)独热编码处理类别型数据。
(19)数据降维。
(20)分类模型的构建。
(21)回归模型的构建。
(22)聚类模型的构建。
(23)数据集划分。
(24)分类、回归、聚类模型的评价方法。
58.难点
(1)独热编码处理类别型数据。
(2)数据降维。
(3)分类模型的构建。
(4)回归模型的构建。
(5)聚类模型的构建
(6)数据集划分。
(7)交叉验证与自动调参。
(8)分类、回归、聚类模型的评价方法。
三十五、教学过程设计
59.理论教学过程
(54)标准差、离差标准化数据。
(55)归ー化数据。
(56)二值化数据。
(57)独热编码数据。
(58)数据降维。
(59)常用分类算法。
(60)常用回归算法。
(61)常用聚类算法。
(62)数据集划分。
(63)交叉验证。
(64)自动调参。
(65)模型评价方法。
60.实验教学过程
(47)使用标准差、离差标准化数据。
(48)归ー化数据。
(49)二值化数据。
(50)将类别型数据独热编码。
(51)将数据集划分为训练集和测试集。
(52)使用PCA、ICA、LDA降维数据。
(53)构建Logistic回归、SVM、决策树、KNN、朴素贝叶斯和多层感知机模型。
(54)使用交叉验证和自动调参构建随机森林模型。
(55)评价构建的随机森林模型和其他分类模型。
(56)构建最小二乘回归、岭回归、Lasso回归模型。
(57)评价构建的回归模型。
(58)构建K-Means、层次聚类、DBSCAN和GMM聚类模型。
(59)评价构建的聚类模型。
三十六、教材与参考资料
61.教材
林耀进,张良均.Python机器学习编程与实战[M].北京:人民邮电出版社.2020.
62.参考资料
[1I张健,张良均.Python编程基础[M].北京:人民邮电出版社.2018.谭立云,
(2j黄红梅,张良均.Python数据分析与应用[M].北京:人民邮电出版社.2018.
13J张良均.Python数据分析与挖掘实战(第2版)[MJ.北京:机械工业出版社.2019.
[4]李明江,张良均,周东平,张尚佳.Python3智能数据分析快速入门[M].北京:
机械工业出版社.2016.
[5I张良均.Pylhon与数据挖掘[M].北京:机械工业出版社.2016.
第7章餐饮企业综合分析
教案
课程名称:Python机器学习编程与实战
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论36学时,实验28学时)
总学分:4.0学分
本章学时:12学时
三十七、材料清单
(41)《Python机器学习编程与实战》教材。
(42)配套PPT。
(43)数据。
(44)代码。
(45)引导性提问。
(46)探究性问题。
(47)拓展性问题。
三十八、教学目标与基本要求
63.教学目标
结合餐饮企业综合分析案例,介绍针对原始数据使用折线图进行统计分析,进行特征选
择筛选掉原始数据中相关性不强的特征、通过特征构建构造RFM特征和客户流失特征,并
重点介绍K-Means聚类算法在客户价值分析中的应用和决策树算法在客户流失预测屮的应
用。针对聚类结果,通过雷达图对不同客户群进行价值分析。针对分类预测模型,通过混淆
矩阵等评价方法评价其预测效果。
64.基本要求
(44)了解餐饮企业综合分析的背景知识,分析步骤和流程。
(45)掌握使用折线图分析趋势。
(46)掌握特征选择和特征构造的方法。
(47)掌握使用K-Means算法构建聚类模型的方法。
(48)掌握使用决策树算法构建分类模型的方法。
(49)掌握进行客户价值分析的方法。
(50)掌握评价分类模型效果的方法。
三十九、问题
65.引导性提问
引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问
题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。
(18)什么样的客户是餐饮企业的高价值客户?
(19)餐饮企业能提供什么样的数据?
(20)餐饮企业为什么要做客户价值分析与客户流失预测?
66.探究性问题
探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的
基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课
文中又是重要的问题加以设问。
(17)RFM模型对应的特征在本案例中是什么?
(18)为什么K-Means可以用作客户分类?
(19)应该依据哪些条件判断客户是否会流失?
67.拓展性问题
拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提
出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问
题。
(14)除了RFM模型外还有什么用于客户分类的模型?
(15)除了K-Means还有什么算法能够用于客户分类?
(16)除了决策树还有什么算法能用于预测客户流失?
四十、主要知识点、重点与难点
68.主要知识点
(42)餐饮企业综合分析的背景知识,分析步骤和流程。
(43)特征选择与特征构造。
(44)K-Means算法的使用方法。
(45)决策树算法的使用方法。
(46)客户价值分析的方法。
(47)分类模型的评价方法。
69.重点
(25)餐饮企业综合分析的步骤和流程。
(26)特征选择与特征构造。
(27)K-Means算法的使用方法。
(28)决策树算法的使用方法。
(29)客户价值分析的方法。
70.难点
(1)K-Means算法的使用方法。
(2)决策树算法的使用方法。
(3)客户价值分析的方法。
四十一、教学过程设计
71.理论教学过程
(66)了解餐饮企业综合分析的背景。
(67)熟悉餐饮企业综合分析的流程。
(68)掌握分析变化趋势的方法。
(69)掌握筛选相关性不强特征的方法。
(70)掌握构建RFM特征的方法。
(71)掌握构建客户流失特征的方法。
(72)掌握K-Means算法的使用方法。
(73)掌握决策树算法的使用方法。
(74)掌握客户价值分析的方法。
(75)掌握评价分类模型的方法。
72.实验教学过程
(60)绘制折线图分析变化趋势。
(61)筛选掉原始数据中部分相关性不强的特征。
(62)构建RFM特征。
(63)构建客户流失特征。
(64)使用K-Means算法构建聚类模型。
(65)使用决策树算法构建分类预测模型。
(66)针对聚类结果进行客户价值分析。
(67)评价分类预测模型的效果。
四十二、教材与参考资料
73.教材
林耀进,张良均.Python机器学习编程与实战[MJ.北京:人民邮电出版社.2020.
74.参考资料
[I]张健,张良均.Python编程基础[M].北京:人民邮电出版社.2018.谭立云,
[2]黄红梅,张良均.Python数据分析与应用[M].北京:人民邮电出版社.2018.
[3I张良均.Python数据分析与挖掘实战(第2版)[M].北京:机械工业出版社.2019.
[4]李明江,张良均,周东平,张尚佳.Pylhon3智能数据分析快速入门[M].北京:
机械工业出版社.2016.
[5I张良均.Python与数据挖掘[M].北京:机械工业出版社.2016.
第8章通信运营商客户流失分析与预测
教案
课程名称:Python机器学习编程与实战
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论36学时,实验28学时)
总学分:4.0学分
本章学时:12学时
四十三、材料清单
(48)《Python机器学习编程与实战》教材。
(49)配套PPT。
(50)数据。
(51)代码。
(52)引导性提问。
(53)探究性问题。
(54)拓展性问题。
四十四、教学目标与基本要求
75.教学目标
结合通信运营商提供的数据,介绍通信运营商客户流失分析与预测的背景、分析步骤和
流程。介绍对原始数据进行去重和降维的方法。介绍原始数据中缺失值与异常值的检测与处
理。介绍独热编码处理数据的方法。介绍合并处理后的数据和划分数据集的方法。重点介绍
使用MLP算法构建用户流失预测模型。最后介绍预测模型的评价方法。
76.基本要求
(51)了解通信运营商客户流失分析与预测的背景、分析步骤和流程。
(52)掌握数据去重的方法。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业人事管理系统框架
- 会议议程编排与执行模板
- 信息安全事故报告函(7篇)
- 产品质量检测流程标准化工具产品质量追溯系统
- IT技术支持服务台工作记录模板客户满意度跟进版
- 软件外包项目团队管理规范指南
- 安全生产与预防承诺书范文3篇
- 爱心助学活动加入承诺书(3篇)
- IT服务行业云服务平台建设与运营策略
- 农业科技人员精通作物栽培技术指导书
- 科技论文写作 第五讲课件
- 英语四级词汇加例句
- 四级翻译句子及答案
- 中学语文拟写人物短评课件
- 四川大学成人教育 《工程估价》 期末考试复习题及参考答案
- NB/T 10727-2021煤矿膏体充填开采技术规范
- GB/T 41498-2022纤维增强塑料复合材料用剪切框测定面内剪切应力/剪切应变响应和剪切模量的试验方法
- 博弈策略的生活解读 课件
- 工学操作系统安全讲稿课件
- 灌注桩低应变法参数表
- 浦发银行个人信用报告异议申请表
评论
0/150
提交评论