《数据挖掘原理与应用 第2版 》 教学大纲_第1页
《数据挖掘原理与应用 第2版 》 教学大纲_第2页
《数据挖掘原理与应用 第2版 》 教学大纲_第3页
《数据挖掘原理与应用 第2版 》 教学大纲_第4页
《数据挖掘原理与应用 第2版 》 教学大纲_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE10《数据挖掘原理与应用》课程教学大纲(DataMiningPrincipleandApplication)2025105课程说明一、课程概述20(一)课程属性及课程介绍面对日益庞大的数据资源,人们迫切需要强有力的工具来“挖掘”其中的有用信息,数据挖掘就是针对这一需求而发展起来的一门汇集统计学、机器学习、数据库、人工智能等学科内容的新兴的交叉学科,本课程深入探讨数据挖掘原理,把信息科学、计算科学和统计学对数据挖掘的贡献融合在一起,培养计算机专业高年级本科学生具备初步的科研能力和创造能力。数据挖掘是计算机科学与技术、信息管理与信息系统等专业的必修或选修课程。本课程以数据挖掘为主要内容,讲述数据挖掘的基本概念、方法和过程,其中主要对数据挖掘的各主要功能、挖掘算法和应用进行介绍和实践,通过对实际数据的分析更加深入地理解常用的数据挖掘模型的应用。(二)教学目标本课程的目标是使学生掌握数据挖掘的整个生命周期所要经历的不同环节,理解各环节的目的和任务。通过所设置的数据预处理、关联分析、分类与预测、聚类分析等内容,使学生掌握主要的数据挖掘的原理和技术,并能够灵活应用,从而培养学生数据分析、数据处理和解决问题的能力。通过本课程的学习,要求学生掌握数据挖掘的基本理论和方法,为学习后继课程开展科学研究、进行生产实践打好基础。课程思政教学目标:以习近平新时代中国特色社会主义思想为指导,坚持知识传授与价值引领相结合,运用可以培养大学生理想信念、价值取向、政治信仰、社会责任的题材与内容,全面提高大学生缘事析理、明辨是非的能力,让学生成为德才兼备、全面发展的人才。(三)适用对象计算机科学与技术专业、信息管理与信息系统专业。四年制。本科。(四)先修课程与后续课程《高级程序设计语言》、《数据结构》。后续课程:《python与数据科学》、《大数据技术原理与应用》。二、任课教师教学过程中应注意的事项通过本课程的学习,要求学生初步掌握数据挖掘的重要概念、数据挖掘的意义、数据挖掘的一般过程和任务、数据挖掘中的常用方法(算法)以及数据挖掘当前的研究动向。三、学时要求与分配(一)总学时要求共48课时,其中理论32课时,实践16课时。(二)学时分配周别授课次数授课章节与内容摘要课程思政融入点教学时数备注11课程介绍第1章绪论树立正确科学观,掌握认识论和方法论,求真务实,开拓进取;212第2章数据挖掘的过程树立良好的个人品格,在学习中积极观察,充分想象,缜密思考,理性判断,严密推理;2实验1地图平台行车轨迹绘制23第3章数据准备教学材料选择:中国元素,中国的事情,中国的政策、意识、文化;价值观追求。2实验2数据抽样34第3章数据准备发掘教学内容中所蕴含的哲学思和方法,解决技术问题;2实验5建立分类模型(线性判别分析LDA)周别授课次数授课章节与内容摘要课程思政融入点教学时数备注35第3章数据准备培养学生严谨客观的工作作风、一丝不苟的探究精神。246第4章数据探索可视化1内容:对数据进行可视化展示和描述或分析目的:掌握可视化的方法通过我国杰出科学家在科学技术257第4章数据探索可视化1可视化2内容:对数据进行可视化展示和描述或分析目的:掌握可视化的方法选择具有中国元素的素材,和当下的热点问题所涉及的数据进行分析,帮助学生了解社会动态和发展,建立爱国情怀;2实验6汽车指标可视化分析58第4章数据探索汇总统计内容:对数据进行描述性统计分析目的:复习统计分析的知识,加强对数据的感觉教学材料选择:中国元素,中国的事情,中国的政策、意识、文化;价值观追求。2实验8数据统计分析69第5章关联分析关联规则算法(Apriori目的:了解关联规则、频繁集、置信度、支持度的概念。引导学生在完成数据挖掘项目的2实验11购物篮数据关联分析(Apriori)710第5章关联分析关联规则算法(FPGrowth算法)内容:利用关联规则算法,挖掘关联知识。目的:了解条件树、条件树生成频繁集等方法。2实验12购物篮数据关联分711第6章分类预测分类的基本概念内容:分类的基本概念决策树分类的基本原理目的:了解分类的概念掌握信息熵的概念掌握决策树分类算法的基本设计框架2实验13判断是否购买计算机(决策树分类)812第6章分类预测分类算法(C4.5算法)分类算法(ID3算法)内容:程序实现ID3算法目的:掌握决策树分类模型的剪枝原理了解决策树分类模型的评估方法以针对性问题为线索,提出问题和难点,找出解决办法,挖掘并呈现解决问题过程中所涉及的价值观和思维方式等思政元素。2实验15学习(周别授课次数授课章节与内容摘要课程思政融入点教学时数备注913第6章分类预测贝叶斯方法内容:贝叶斯分类算法原理目的:掌握贝叶斯分类方法,并进行应用通过我国杰出科学家在科学技术2实验17西瓜(914第6章分类预测人工神经网络分类内容:人工神经网络分类算法原理目的:掌握人工神经网络分类方法,并进行应用在信息的认知与选择环节,务必选取权威、健康、合法的信息源;2实验19线段方向判别(人工神经网络分类)1015第6章分类预测支持向量机、基于规则的分类结合新疆棉花事件,利用百度搜索引擎检索新疆经济发展数据对比,充分体现了中国特色社会主义制度的优越性。2实验21分类模型评估(ROC+PRC)1116第6章分类预测分类模型的评估内容:分类模型的评估方法目的:掌握分类模型的评估方法用典型事件为案例,开展爱国主义教育21117第7章聚类分析聚类(K-means)内容:实现K-means算法。2实验22基于葡萄酒成分分类(KMeans聚类)1218第7章聚类分析聚类(K-means)用红色元素为案例,既进行专业知识的学习,又开展爱国主义教育21319第7章聚类分析聚类(层次聚类)内容:实现层次聚类算法。教育学会用批判性的思维去审视2实验24分析经济相近省市(层次聚类)1320第7章聚类分析聚类(DBSCAN)内容:实现DBSCAN算法。目的:了解核心点、噪声点、边界点等概念,掌握聚类算法的应用指导学生通过正规渠道合理合法地获取信息。2实验26基于密度的空间聚类(DBSCAN聚类)1421第7章聚类分析聚类(DBSCAN)和思维方式等思政元素。2周别授课次数授课章节与内容摘要课程思政融入点教学时数备注1522第8章数据回归内容:回归的概念、算法、应用目的:掌握回归预测技术的应用227(分析)1523第8章数据回归第9章数据挖掘的工具通过我国杰出科学家在科学技术2实验28西瓜成熟判别(Logistic回归分析)1624第10章WEKA数据挖掘应用复习结合贸易战事件,利用搜索引擎检索数据对比,充分体现了竞争的残酷性。2实验29WEKA应用四、实践教学内容与要求(一)一览表

实践教学项目一览表序号实践名称每组人数实践时数实践类型验证/综合/设计必做∕选做1实验1地图平台行车轨迹绘制12综合必做2实验2数据抽样12设计必做3实验3打分评级12设计选做4实验4数据变换12综合选做5实验5建立分类模型(线性判别分析LDA)12设计必做6实验6汽车指标可视化分析12设计必做7实验7数据分布可视化12设计选做8实验8数据统计分析12设计必做9实验9相关性分析12设计选做10实验10维规约(主成分分析)12分析选做11实验11购物篮数据关联分析(Apriori)12综合必做12实验12购物篮数据关联分析(FPGrowth)12综合必做13实验13判断是否购买计算机(决策树分类)12设计必做14实验14患者诊视处置(决策树分类)12综合选做15实验15学习成效分析(决策树分类)12设计必做16实验16NBA球员薪金评估(决策树分类)12综合选做17实验17西瓜成熟判别(贝叶斯分类)12综合必做18实验18手写数字识别应用(人工神经网络分类)12综合学习19实验19线段方向判别(人工神经网络分类)12综合必做20实验20建立分类模型(支持向量机SVC)12综合学习21实验21分类模型评估(ROC+PRC)12综合必做22实验22基于葡萄酒成分分类(KMeans聚类)12综合必做23实验23设备位置标注(KMeans聚类)12综合选做24实验24分析经济相近省市(层次聚类)12综合必做25实验26基于密度的空间聚类(DBSCAN聚类)12综合必做26实验27手机客户流失情况分析(线性回归分析)12综合必做27实验28西瓜成熟判别(Logistic回归分析)12综合必做28实验29WEKA应用12综合必做(二)课程实践项目说明实验1地图平台行车轨迹绘制(第3章)【实验目的】掌握数据清理的方法【实验内容】对数据进行识别、探究和清理【实验方法、步骤与要求】见本课程的实验指导书相关章节的内容。【实验环境与工具】机房,计算机,excel【参考资料】本课程的实验指导书。【考核与评价】按要求完成规定内容,的满分;否则酌情扣分。实验2数据抽样(第3章)【实验目的】掌握数据抽样的概念、方法和应用;【实内】行找适的式的据完以下同式抽任:1) 简单随抽;2) 系统样;3)整群样;4)分层样;【实验方法、步骤与要求】见本课程的实验指导书相关章节的内容。【实验环境与工具】机房,计算机,excel【参考资料】本课程的实验指导书。【考核与评价】按要求完成规定内容,的满分;否则酌情扣分。实验5建立分类模型(第3章)【实验目的】掌握数据变换和数据判别的方法、原理和过程;【实验内容】对数据进行变换和判别【实验方法、步骤与要求】见本课程的实验指导书相关章节的内容。【实验环境与工具】机房,计算机,excel【参考资料】本课程的实验指导书。【考核与评价】按要求完成规定内容,的满分;否则酌情扣分。实验6汽车指标可视化分析(第4章)【实验目的】掌握可视化的方法【实验内容】对数据进行可视化展示和描述或分析【实验方法、步骤与要求】见本课程的实验指导书相关章节的内容。【实验环境与工具】机房,计算机,excel【参考资料】本课程的实验指导书。【考核与评价】按要求完成规定内容,的满分;否则酌情扣分。实验8数据统计分析(第4章)【实验目的】复习统计分析的知识,加强对数据的感觉【实验内容】对数据进行描述性统计分析【实验方法、步骤与要求】见本课程的实验指导书相关章节的内容。【实验环境与工具】机房,计算机,excel【参考资料】本课程的实验指导书。【考核与评价】按要求完成规定内容,的满分;否则酌情扣分。实验10Apoi(第5章)【实验目的】了解关联规则、频繁集、置信度、支持度的概念;【实验内容】利用关联规则算法,挖掘关联知识;【实验方法、步骤与要求】见本课程的实验指导书相关章节的内容。【实验环境与工具】机房,计算机,excel【参考资料】本课程的实验指导书。【考核与评价】按要求完成规定内容,的满分;否则酌情扣分。实验11FGwh第5章)【实验目的】了解关联规则、频繁集、置信度、支持度的概念;【实验内容】利用关联规则的FPGROWTH算法,实现关联分析;【实验方法、步骤与要求】见本课程的实验指导书相关章节的内容。【实验环境与工具】机房,计算机,excel【参考资料】本课程的实验指导书。【考核与评价】按要求完成规定内容,的满分;否则酌情扣分。实验12(第6章)【实验目的】了解信息熵的概念,掌握算法的基本设计框架。【实验内容】程序实现C4.5算法;【实验方法、步骤与要求】见本课程的实验指导书相关章节的内容。【实验环境与工具】机房,计算机,excel【参考资料】本课程的实验指导书。【考核与评价】按要求完成规定内容,的满分;否则酌情扣分。实验15第6章)【实验目的】了解贝叶斯理论,掌握算法的基本方法,掌握连续变量的条件概率估计方法;【实验内容】用贝叶斯分类器完成分类归纳;【实验方法、步骤与要求】见本课程的实验指导书相关章节的内容。【实验环境与工具】机房,计算机,excel【参考资料】本课程的实验指导书。【考核与评价】按要求完成规定内容,的满分;否则酌情扣分。实验17(第6章)【实验目的】掌握人工神经网络分类方法,并进行应用【实验内容】人工神经网络分类算法原理【实验方法、步骤与要求】见本课程的实验指导书相关章节的内容。【实验环境与工具】机房,计算机,excel【参考资料】本课程的实验指导书。【考核与评价】按要求完成规定内容,的满分;否则酌情扣分。实验19CPC第6【实验目的】了解分类分析的评估方法,掌握评估算法的应用;【实验内容】完成分类分析的评估,绘制ROC曲线;【实验方法、步骤与要求】见本课程的实验指导书相关章节的内容。【实验环境与工具】机房,计算机,excel【参考资料】本课程的实验指导书。【考核与评价】按要求完成规定内容,的满分;否则酌情扣分。实验21Mens第7【实验目的】了解距离、相似度等概念,掌握聚类算法的应用;【实验内容】利用K-means聚类算法,完成聚类分析;【实验方法、步骤与要求】见本课程的实验指导书相关章节的内容。【实验环境与工具】机房,计算机,excel【参考资料】本课程的实验指导书。【考核与评价】按要求完成规定内容,的满分;否则酌情扣分。实验23(第7章)【实验目的】了解层次聚类的过程、方法、应用场景、性质、特点、进一步研究等内容;【实验内容】实现层次聚类算法;【实验方法、步骤与要求】见本课程的实验指导书相关章节的内容。【实验环境与工具】机房,计算机,excel【参考资料】本课程的实验指导书。【考核与评价】按要求完成规定内容,的满分;否则酌情扣分。实验24(SAN聚类第7章)【实验目的】了解核心点、噪声点、边界点等概念,掌握聚类算法的应用;【实验内容】实现DBSCAN算法;【实验方法、步骤与要求】见本课程的实验指导书相关章节的内容。【实验环境与工具】机房,计算机,excel【参考资料】本课程的实验指导书。【考核与评价】按要求完成规定内容,的满分;否则酌情扣分。实验25(第8章)【实验目的】掌握回归预测技术的应用;【实验内容】回归的概念、算法、应用;【实验方法、步骤与要求】见本课程的实验指导书相关章节的内容。【实验环境与工具】机房,计算机,excel【参考资料】本课程的实验指导书。【考核与评价】按要求完成规定内容,的满分;否则酌情扣分。实验27WEKA应用(第10章)【实验目的】掌握WEKA完成数据挖掘的过程和方法;【实验内容】用WEKA完成数据挖掘;【实验方法、步骤与要求】见本课程的实验指导书相关章节的内容。【实验环境与工具】机房,计算机,excel【参考资料】本课程的实验指导书。【考核与评价】按要求完成规定内容,的满分;否则酌情扣分。五、教学参考资料教材:,20204习题集:扩充阅读资料:(PrinciplesofDataMining)DavidHand/HeikkiMannila,译者:张银奎/廖丽/宋俊,机械工业出版社,2003年2008年,2004,2002OLAP2003.12002.2RichardJ.Roiger,MichaelW.Geatz2003DavidHand,HeikkiMannila,PadhraicSmyth,2003推荐网站:无课程思政资源六、课程的考核要求1.期末考试形式:开卷。计算机房考试,有理论部分和操作部分,用时比例1:1。2.平时成绩构成比例:作业65%;考勤与课堂提问35%。当本课程被确定为“笔记课程”时,为:作业45%;考勤与课堂提问35%;笔记20%。3.课程成绩构成:平时成绩50%;期末考试成绩50%。教学要求及教学要点让学生从整体上对课程的内容进行了解,知晓本课程内容在专业课程体系中所处的位置和所起的作用;大致了解数据挖掘所要完成的任务,所要得到的结果,所要采取的方法和手段;课程性质介绍;本课程内容在专业课程体系中所处的位置和所起的作用;所要讲授的内容;数据挖掘的一般过程;数据挖掘所要完成的任务和所要得到的结果以及所要采取的方法和手段;包括:一、数据挖掘介绍,二、数据挖掘过程,三、数据挖掘算法;重点在于课程内容在专业课程体系中所处的位置和所起的作用,数据挖掘的一般过程以及各个过程的要点和任务及所采取的方法和技术;难点为数据挖掘所要完成的任务,所要得到的结果,所要采取的方法和手段;第1章绪论【本章教学目的和要求】:通过介绍数据挖掘的起源、形成、发展等过程,让学生从概念上了解数据挖掘这项技术的发展的必然性,并对数据挖掘技术建立一个基本的概念性的认识。同时,能够大致了解数据挖掘所要完成的任务,所要得到的结果,所要采取的方法和手段;【教学内容】【重点、难点】无;【课程思政重点】树立正确科学观,掌握认识论和方法论,求真务实,开拓进取;勤于实践,勇于探索,不畏艰难;第2章数据挖掘的过程【本章教学目的和要求】通过对数据属性和特点的认识,进而对数据的处理和表示方法有进一步的认识;【教学内容】数据的类型的划分及其划分方法;数据质量的定义和判定方法及准则;数据预处理的步骤和过程,以及处理原则的把握;数据的相似性和相异性的度量方法和算法;【重点、难点】重点为数据预处理的步骤和过程,以及处理原则的把握,它是数据处理过程中的一个重要环节;难点是数据的相似性和相异性的度量方法和算法;【课程思政重点】树立良好的个人品格,在学习中积极观察,充分想象,缜密思考,理性判断,严密推理;第3章数据准备【本章教学目的和要求】了解数据准备这一环节的重要性;掌握数据准备的过程和方法,学会其典型方法的处理过程和处理方法;【教学内容】数据准备的概念和内容;详细分析数据收集的概念和过程,介绍基本方法;介绍数据【重点、难点】重点为数据清理的原则、方法和过程;难点为数据集成的概念和原理。【课程思政重点】发掘教学内容中所蕴含的哲学思想和元素,运用自然辩证法的思路和方法,解决技术问题;第4章数据探索【本章教学目的和要求】了解数据探索这一环节的重要性;掌握数据探索的汇总统计的方法和可视化的探索方法,学会其典型方法的处理过程和处理方法;【教学内容】数据探索的概念和内容;鸢尾花数据集;汇总统计和可视化处理;汇总统计包括频率【课程思政重点】PAGE【课程思政重点】PAGE14和众数、百分位数、均值、极差和方差、绝对平均偏差、中位数绝对偏差、四分位数极差、多元汇总统计;可视化处理包括表示-安排-选择的处理过程,以及直方图、二维直方图、盒图、饼图、累计分布图、散点图、等高线图、曲面图、低维切片、矩阵图、平行坐标系、星形图等。【重点、难点】重点为汇总统计和可视化表示;难点为汇总统计中的多元汇总统计和可视化处理的低维切片和矩阵图;【课程思政重点】在网络数据采集环节,强调数据爬取公约的法制性和道德性约束,引导学生遵守规则,敬畏规则;第5章关联分析【本章教学目的和要求】掌握关联分析的基本概念和应用场景;理解并掌握关联分析的相关概念;掌握关联分析的技术和方法,以及分析结果的表示方法和评估方法;【教学内容】【重点、难点】重点是关联分析的分析过程和方法;难点是关联分析模式的评估方法和应用;【课程思政重点】通过我国杰出科学家在科学技术上的创新进步,鼓励学生把精力放在学习上,树立正确的价值观;第6章分类预测【本章教学目的和要求】掌握分类的基本知识,以及利用决策树进行分类操作的方法和过程;掌握建立分类模型的基本方法,并了解

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论