版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据挖掘与机器学习教学大纲课程性质本课程以数据挖掘和机器学习为主要内容,讲述实现数据挖掘的主要功能、 数据挖掘、机器学习算法和应用,并通过对实际数据的分析更加深入地理解常 用的数据挖掘与机器学习模型。培养学生数据分析和处理的能力。该课程的先 修课程有概率论与数理统计、数据库原理和程序设计等。IJ教学 的本课程的主要目的是培养学生的数据挖掘与机器学习的理论分析与应用实 本课程的教学,使学生掌握数据挖掘和机器学习的一般原 理和处理方法,能使用机器学习理论解决数据挖掘相关的问题。教学内容本课程全面而又系统地介绍了数据挖掘与机器学习的方法和技术,反映了 当前数据挖掘和机器学习研究的最新成果。本课程主要
2、学习的内容包括数据分析与可视化基础、认识数据、数据预处理、回归分析.关联规则挖掘、 分类与预测、聚类分析、神经网络与机器学习基础、离群点检测以及数据挖掘案例分析等内容。教学时数本课程的教学时数为 学时,理论教学 学时,实验教学 学时。第一章数据挖掘概述教学要点:1理解和掌握数据挖掘与机器学习的基本概念、数据挖掘过程、数据挖掘的主要任务 以及数据挖掘使用的主要技术。3了解数据挖掘与机器学习的应用和面临的问题。.对数据挖掘和机器学习能够解决的问题和解决问题思路有淸晰的认识。4 的开发环境。熟练应用4教学时数: 学时。考核要点:了解数拯挖掘的左义和功能,理解数据挖掘在何种数据上进行,数据挖 掘可以挖
3、掘什么类型的模式,掌握初级的数据分析方法。第二章数据分析与挖掘基础教学要点:1基础语法、内建的数据结构、数值运算基础、统 计分析基理解和掌握础.掌握图表绘制基础等数据分析和可视化方法。Matplotlib教学时数: 学时。6考核要点:掌握编程基础,数据分析与可视化方法。第三章认识数据教学要点:理解和掌握数据对象和属性类型,数据的基本统计描述,掌握度量数据相似性和相 异性的方法。了解数据可视化的方法。教学时数: 学时。3考核要点:了解数据的属性类型,理解数据的基本统汁描述,掌握度量数据相似性 和相异性的方法。第四章数据预处理教学要点:了解数据预处理的目的和意义。掌握如何对数据进行淸理。掌握如何对
4、不同数据源的数据进行合并。掌握如何对数据进行变换,使之适合建模的需要。掌握如何对数据进行消减,使得在消减后的数据集上挖掘更有效。掌握利用进行数据预处理的方法。教学时数: 学时。4考核要点:理解数据淸理、数据集成、数据规约、数据变换于数据离散化的方法,掌 握数据预处理的基本方法。第五章回归分析教学要点:掌握回归分析原理。掌握一元线性回归分析。掌握多元线性回归分析。掌握逻辑回归。了解其他回归分析。教学时数: 学时。4考核要点:掌握回归的左义的左义,各类回归的原理及实现。第六章关联规则挖掘教学要点:了解关联规则的基本思想、概念和意义。了解关联规则挖掘的应用背景:掌握常用的关联规则算法。掌握利用实现关
5、联规则分析。了解其它方法的内容、了解关联规则挖掘的研究动态。教学时数: 学时。4考核要点:了解频繁项集、闭项集和关联规则的槪念,理解模式评估方法,掌握算法和挖掘频繁项集的模式增长方法。第七章分类教学要点:了解分类及预测的基本思想、概念和意义。掌握常用的分类及预测算法(或模型)。了解分类及预测挖掘的研究动态。掌握利用实现各种分类算法的方法。教学时数: 学时。考核要点:了解分类的概念,理解评估分类器性能的度量方法,掌握决策树分类算 法、贝叶斯分类算法、模型评估与选择、组合分类及利用 实现分类的方 法。第八章聚类教学要点:了解如何汁算由各种属性和不同的类型来表示的对象之间的相异度。掌握聚类、层次聚类
6、、基于密度的聚类和英他常用方法。掌握利用实现聚类的方法。sklearn教学时数: 学时。考核要点:了解聚类的概念,掌握和 算法、层次方法和基于密度的方 法等典型算法及英的实现方法。第九東 神经网络与深度学习教学要点:了解理解神经网络与深度学习的原理。掌握感知机与 神经网络的原理。了解深度学习基础。教学时数: 学时。5考核要点:了解神经网络的概念,掌握感知机模型和 神经网络、了解深度学习算 法。第十章离群点检测教学要点:了解离群点的概念与检测方法。掌握中的异常值检测方法。sklearn教学时数: 学时。4考核要点:了解离群点的概念、类型以及离群点检测的常用方法,掌握中的异常值 检测方sklear
7、n法。第十一章数据挖掘案例教学要点:掌握数据挖掘与机器学习的分析与实现。掌握利用进行综合数据分析。教学时数: 学时。4考核要点:掌握利用进行数据挖掘与机器学习的实现过程。本课程使用教具和现代教育技术的指导性意见本课程教材力求内容新颖,应采用多样化的方式进行教学,让学生在理论与实践相结合 的基础上,对课程所要求的实际操作能力有进一步的提髙。充分利用多媒体等现代化教学手 段,整体优化教学过程和教学内容,调动学生学习积极性;布宜实际操作任务给学生上机操 作并及时指导。实验部分基本要求:实验是数据挖掘与机器学习课程教学中不可分割的重要组成部分。实验课 程设汁的思想是帮助学生理解和掌握数据挖掘的基本概念
8、、算法、技术和原理,熟练 掌握利用进行数据挖掘和机器学习的使用方法,通过适当的编程提高学生的 编程能力以及实践动手能力,提髙学生对课程的学习兴趣,加强创新精神与综合素质 的培养。实践课程课时: 学时教学进度计划表总时名称讲课实践/实验上机习题时数课程设计周学时数计划 时数4周次 课次授课内容摘要目的要求第一章数据挖掘与机器学习概 述一、 数搦挖掘简介理解和掌握数据挖掘与机 器学习的基本概念、数据挖 掘过程、数据挖掘的主要任 务以及数据挖掘使用的主 要技术。12二、 数据分析与数据挖掘三、 数据挖掘的任务四、数据挖掘的数据源1了解数据挖掘与机器学习 的应用和面临的问题。对数 据挖掘和机器学习能够
9、解 决的问题和解决问题思路 仃淸晰的认识熟五、数据挖掘使用的主要技术六、 数据挖掘的主要任务七、 数据挖掘的商用工具22八、利用进行数据挖掘J 练应用环境。的开发第二章数据分析基础理解和掌握基础诰 法、一、二、程序概述32内建的数据结构。内建的数据结构2掌握数值计算方法,主45三、四、22数值计算基础统计分析基础要包括数组和矩阵运算。掌握中的数据结 构、数据查询与编辑、分组 汇总及绘图。3MatplotlibMatplotlib数据可视 化绘五、数据可视化基 础基础掌握62Scikit-learn六、图基础,参数设置及常 用绘图。周次 课次授课内容摘要时数目的要求利用视化进行数据分析 与可72
10、实验一、数据分析与可视化实 训4理解和掌握数据对象和属 性类822il 描 第三章认识数据 数据对象与属性类型 数据的基本统计描述 数据可视化度量数据的相似性度量数据相似性和 相异性的方法:了解数据可 视化的方法。1)第四章数据预处理2) 数据预处理槪述,数了解数据预处理的目的和 意义:掌握如何对数据进行 淸理。据预处理方法93)数摒淸 洗数据淸理及方法5W学押汕何 不同数据源的 数据三、数据集成及利用数据合并进 行进行合并:掌握如何对 数据进行Z变换,使 适合建 模的需要:掌21)数据变换与离散化握如何对数据 进行消减,使得在消减后的 数据集上挖掘更有效:2)数据归约掌握 利用理的方法。进行
11、数据预处3实现 数)实验二、利用掌握利用实现数据 淸62洗、数据集成和数据变换 的方法周次 课次授课内容摘要时数目的要求第五章回归分析掌握回归分析原理:掌握一 元线性回归分析的原理与 方法。一、 回归分析概述2二、 一元线性回归分析三、 多元线性回归四、逻辑回归22掌握多元线性回归分析:掌 握逻辑回归;了解其他回归 分析五、 其他回归分析7实现典型 的实验三、利用归分析实现典型的回掌握利用回归分析方法第六章关联规则挖掘了解频繁项集、闭项集和关 联规则的概念,理解模式评 估方一、 关联规则分析槪述二、 频繁项集挖掘方法2法,掌握算 法8讣 挖应订沈;利川?:三、 频繁模式树算法实现关联规则分析;
12、 了解222四、关联规则评估方法其它方法的内容、了解 关联规则挖掘的研究动态。实验四、规则分析实现数拯的关 联掌握利用实现数据 的关联规则分析9了解分类及预测的基本思 想、概念和意义:掌握决策 树规约算法。K实K三、 近邻算法掌握了解算法原理与实现:算法及其实现。22四、支持向量机算法及其实现五、 贝叶斯分类熟悉掌握贝叶斯分类算法: 理解评估分类器性能的度六、 模型评估与选择周次 课次授课内容摘要时数目的要求量方法。七、组合分类掌握组合分类的原理:掌握 随A222组合方法概述;袋装;提升和机森林框架及实 现方法daboost随机森林用不同的算法实现给宦数 据集实验五、分类分析综合实验的分类分析
13、,掌握利用实现数据分类分析 的常用方法第八章聚类掌握聚类分析的基本原理; 熟一、 聚类概述算法的 原理及练掌握其实现二、算法算法实现三、层次聚类方法层次聚类算法及其22掌握层次聚类算法及其实 现实现四、基于密度的聚类方法掌握了解算法及其实现算法原理及其实现五、其他聚类方法算法、 算法、2算法及模算法;掌握模糊聚糊聚类算法类算法。掌握聚类评估的基本方法: 确怎簇数目的常用方法:聚类质量的测定。六、聚类评估 估计聚类趋势 确建簇数目的方法 测定聚类质量22掌握数据聚类的典型算法实验六数据的聚类分析综合实 验周次 课次授课内容摘要时数目的要求第九章神经网络与深度学习一、神经网络基础理解神经网络基本原理;掌 握感知机的原理。2神经元模型,感知机与多层网 络理解多层前馈神经网络的 原理:理解后向传播算法; 了解二、 神经网络22神经网络的应用。三、深度学习基础理解深度学习的基本原理: 了解深度学习常用的几种 模型。深度学习的基本原理和常用框 架
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年四川省资阳市雁江区临丰祥片区初三年级三月考生物试题含解析
- 2026年浙江省嘉兴市海宁市许巷初三3月一模化学试题含解析
- 2026年VERICUT五轴加工仿真环境构建方法
- 2026年适老家具颜色材料功能智能化四维选购标准手册
- 2026年玻纤增强聚氨酯节能门窗(70 80 90系列)型材断面优化设计指南
- 2026年生物类似药不溶性微粒水平与安全性相关性研究
- 2026年工业废水处理站智能巡检系统与预警指标体系搭建
- 2025年临床医学阶段测试卷
- 互联网医疗公司运营主管专业面试全解
- 订舱信息保密措施规定
- 盐城中南大有境、宝龙广场调研报告
- 医院健康教育与健康促进培训课件
- 近三年内未发生重大事故的安全生产承诺范本
- 岳阳职业技术学院单招职业技能测试参考试题库(含答案)
- 量子密码学与后量子密码学
- 部编版四年级下册语文写字表生字加拼音组词
- 威斯特年产10000吨纳米铜盐系列产品、6000吨叔丁基过氧化氢精馏及3000吨糊状过氧化二苯甲酰项目环境影响报告
- 广西-黄邵华-向量的数量积
- 1.2 国内外网络空间安全发展战略
- 2023年湖南省长沙县初中学生学科核心素养竞赛物理试题(含答案)
- 东北大学最优化方法全部课件
评论
0/150
提交评论