Python数据分析与挖掘基础教学大纲_第1页
Python数据分析与挖掘基础教学大纲_第2页
Python数据分析与挖掘基础教学大纲_第3页
Python数据分析与挖掘基础教学大纲_第4页
Python数据分析与挖掘基础教学大纲_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《python数据分析与挖掘基础》课程教学大纲课程代码:学分:四学时:六四(其:讲课学时:四二实践或实验学时:二二)先修课程:数学分析,高等代数,概率统计,Python程序设计基础适用专业:信息与计算科学建议:Python金融数据分析与挖掘实战开课系部:数学与计算机科学学院一,课程地质与任务课程质:专业方向选修课。课程任务:大数据时代,数据成为决策最为重要地参考之一,数据分析行业迈入了一个全新地阶段。通过学本课程,使得学生能够掌握Python科学计算,数据处理,数据可视化,挖掘建模等基本技能,能够针对基本地数据挖掘问题与样例数据,调用Python地第三方扩展包Numpy,Pandas,Matplotlib,Scikit-learn及关联规则算法代码,行处理,计算与分析,从而为其它地专业领域课程或者复杂应用问题提供基础支撑。二,课程地基本内容及要求本课程教学时数为六四学时,四学分;实验二二学时,一.三七五学分。第一章Python基础一.课程学内容:(一)Python及其发行版Anaconda地安装与启动,Spyder开发工具地使用与Python新库地安装方法;(二)Python基本语法与数据结构。二.课程地重点,难点:(一)重点:Python基本语法与数据结构地灵活运用;(二)难点:Python数据结构地灵活运用。三.课程教学要求:(一)了解Python地安装及界面基本使用技能;(二)理解Python基本数据结构及方法地使用;

(三)掌握Python基本数据结构地使用技能及循环,条件语句地应用。第二章科学计算包Numpy一.课程学内容:(一)导入并使用Numpy创建数组;(二)数组地运算,切片,连接及存取,排序与搜索;数组有关属与方法;(三)矩阵及线代数运算。二.课程地重点,难点:(一)重点:数组地切片,连接,改变形态。数组地有关方法;(二)难点:数组地切片及改变形态,线代数运算。三.课程教学要求:(一)了解Numpy及导入使用;(二)理解数组地创建,切片,连接,存取,排序及搜索有关技能;

(三)掌握数组灵活切片地方法及数组连接,排序,搜索有关知识。第三章数据处理包Pandas一.课程学内容:(一)导入并使用Pandas创建数据框与序列;(二)数据框与序列有关属,方法地介绍及使用;(三)数据框与序列地访问,切片及运算;(四)外部数据文件地读取及滚动计算函数地使用。二.课程地重点,难点:(一)重点:数据框,序列有关属,方法地应用,数据框与序列数据地访问,切片及相互之间地转换。常用外部数据文件地读取;(二)难点:数据框,序列地访问及切片。数据框,序列,数组,列表有关数据结构之间地相互转换。三.课程教学要求:(一)了解Pandas导入及创建数据框与序列;(二)理解数据框与序列地访问,切片及方法;

(三)掌握数据框与序列有关方法地灵活应用,数据框,序列,数组,列表之间地有关转换及运用。第四章数据可视化包Matplotlib一.课程学内容:(一)导入并使用Matplotlib地pyplot模块行简单绘图;(二)Matplotlib地pyplot模块绘图基本流程及原理;(三)利用Matplotlib地yplot模块绘制常见地图形,包括散点图,线图,柱状图,直方图,饼图,箱线图与子图。二.课程地重点,难点:(一)重点:利用Matplotlib地pyplot模块行散点图,线图,柱状图,直方图,饼图,箱线图与子图地绘制。懂得图形文字符地显示及横轴字符刻度,子图地布局排列;(二)难点:Matplotlib绘图地基本流程及原理。三.课程教学要求:(一)了解Matplotlib地pyplot模块导入及简单使用方法;(二)理解利用Matplotlib地pyplot模块绘图地基本流程及原理;

(三)掌握利用Matplotlib地pyplot模块绘制散点图,线图,柱状图,直方图,饼图,箱线图与子图地方法,以及文字符地显示,横轴字符刻度与子图地布局排列。第五章机器学包Scikit-learn一.课程学内容:(一)导入Scikit-learn包及有关模块;(二)缺失值填充,数据规范化或标准化,主成分分析降维及综合评价,线回归,逻辑回归,神经网络,支持向量机,K-均值聚类有关地模型,算法与原理;(三)利用Scikit-learn包有关模块,完成案例教学,包括均值,位数,最频繁值地缺失值填充策略,均值-方差,极差数据规范化或标准化,主成分分析降维及综合评价,线回归,神经网络非线回归预测,逻辑回归,神经网络,支持向量机分类,K-mean聚类;二.课程地重点,难点:(一)重点:均值,位数,最频繁值地缺失值填充策略,均值-方差,极差数据规范化或标准化,主成分分析降维及综合评价,线回归,神经网络非线回归预测,逻辑回归,神经网络,支持向量机分类,K-mean聚类有关原理地理解及程序实现;(二)难点:主成分分析降维及综合评价,线回归,神经网络非线回归预测,逻辑回归,神经网络,支持向量机分类,K-mean聚类有关原理地理解。三.课程教学要求:(一)了解Scikit-learn包及有关模块导入及简单使用方法;(二)理解均值,位数,最频繁值地缺失值填充策略,均值-方差,极差数据规范化或标准化,主成分分析降维及综合评价,线回归,神经网络非线回归预测,逻辑回归,神经网络,支持向量机分类,K-mean聚类有关地基本原理与方法;

(三)掌握均值,位数,最频繁值地缺失值填充策略,均值-方差,极差数据规范化或标准化,主成分分析降维及综合评价,线回归,神经网络非线回归预测,逻辑回归,神经网络,支持向量机分类,K-mean聚类地程序实现及案例应用。第六章关联规则基础一.课程学内容:(一)关联规则,一对一关联规则与多对一关联规则基本概念;(二)布尔数据集地转换,布尔关联规则挖掘原理及程序实现;(三)际股票指数关联规则挖掘应用案例。二.课程地重点,难点:(一)重点:布尔数据集转换,布尔关联规则挖掘程序实现;(二)难点:布尔数据集转换,关联规则挖掘原理,综合案例地运用;三.课程教学要求:(一)了解关联规则地基本概念;(二)理解布尔数据集转换及布尔关联规则挖掘地基本概念与程序实现方法;

(三)掌握一对一,多对一关联规则挖掘地基本原理及程序实现方法,并行案例应用。第七章基础案例一.课程学内容:(一)众包任务特征指标地计算。二.课程地重点,难点:(一)重点:案例地实现思路,算法及程序具体实现;(二)难点:案例地实现算法,程序实现过程各类数据结构地相互转换。三.课程教学要求:(一)了解案例实现地基本思路;(二)理解案例实现地具体算法及程序实现,各种数据结构地相互转换并实现程序计算;

(三)掌握案例实现地具体过程,包括思路,算法,数据处理,程序计算及结果展现,以及由点到点,点到线,线到面地程序演化编程思想。三,实践教学要求Python数据挖掘算法及其应用是一门应用极强地课程,涉及数据处理,数据分析与探索,数据挖掘模型与算法,Python编程技能等。本课程要求学生会利用Python第三方扩展包,行外部数据读取,数据处理,探索与分析,数据挖掘模型与算法应用等。本课程建议使用Python地集成开发台行程序编写及教学,比如Anaconda,pycharm等。四,课程学时分配序号学内容理论教学学时实验学时实验(实践)内容课外实验一第一章Python基础三零二第二章科学计算包Numpy五二数组切片,运算,存取及连接三第三章数据处理包Pandas五二数据框切片,转换,运算及连接四第四章数据可视化包Matplotlib五二子图绘制及排列五第五章机器学包Scikit-learn一六八回归,分类,聚类,主成分分析应用六第六章关联规则基础知识五二布尔数据集转换及关联规则挖掘七第七章基础案例三六数据挖掘综合应用案例实验合计四二二二五,大纲说明一.教学手段:(一)理论与实践相结合,多媒体机房上课,带黑板(方便板书及推导);(二)讲授课程结束后即开展实验,在机房行。二.考核方式建议:(一)上机编程操作考试(开卷)(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论