《数据挖掘》教学大纲_第1页
《数据挖掘》教学大纲_第2页
《数据挖掘》教学大纲_第3页
《数据挖掘》教学大纲_第4页
《数据挖掘》教学大纲_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选优质文档-倾情为你奉上河北经贸大学课程水平认定数据挖掘学习大纲课程名称数据挖掘课程类型必修课总 学 时32学时学 分2学分适用专业统计学开课单位数统学院一、学习性质数据挖掘是大数据背景下现代统计数据分析不可缺少的重要工具。通过本课程的学习,培养学生的数据分析技能,熟悉和掌握大数据信息提取与结果分析,培养适应社会数据分析岗位需求的专业人才。二、学习目的本课程目的主要是让学生在学习期间掌握数据挖掘理论以及如何用数据挖掘来解决实际问题,了解某个数据挖掘解决方案对特定问题是否切实可行,学习知识发现的过程,利用基本的统计和非统计技术评估数据挖掘对话的结果等。三、学习要求重点掌握几种数据挖掘策略及每种

2、策略的适用时机;如何通过几种数据挖掘技术建立模型来解决问题。四、课程内容与学时分配课程内容与学时分配课 程 内 容学时分配自学自学研讨调研第一章 引言22第二章 数据预处理22第三章 分类和预测48第四章 复杂类型数据的挖掘44第五章 数据挖掘的应用和发展趋势22五、课程考核和成绩评定课程考核为闭卷考试。 成绩评定:考试成绩实行百分制,其中基础知识测试题的分值掌握在40分左右;综合能力测试题的分值掌握在60分左右。60分为及格。六、推荐教材和学习参考书推荐教程作者出版社及出版时间数据挖掘:概念与技术JIAWEI HANMICHELINE KAMBER机械工业出版社,2006学习参考书作者出版社

3、及出版时间数据挖掘导论范明,范红建人民邮电出版社,2006数据挖掘与应用张俊妮北京大学出版社,2009数据挖掘-概念、模型、方法和算法闪四清,陈茵,程雁清华大学出版社,2003七、学习具体内容第一章 引言一、基本要求要求学生重点了解当今世界上流行数据挖掘技术的应用范围和流程,对数据挖掘有一个总体的认识;重点掌握Clementine基本功能和操作;海量数据的选择,会正确解释软件处理的结果,尤其掌握样本信息的解释。二、授课方法自学。三、学习内容(一)什么激发了数据挖掘以及它的重要性(二)数据挖掘定义(三)在何种数据上进行数据挖掘1、关系数据库2、数据仓库3、事务数据库4、高级数据库系统和高级数据库

4、应用(四)数据挖掘功能可以挖掘什么类型的模式1、关联分析2、分类和预测3、聚类分析4、孤立点分析5、演变分析(五)数据挖掘软件Clementine的基本功能和操作四、重点难点数据挖掘的概念和基本功能五、思考与讨论1、什么是数据挖掘?2、数据挖掘的对象是什么?3、数据挖掘的主要功能有哪些?4、Clementine的基本功能和操作。第二章 数据预处理一、基本要求要求学生重点掌握数据预处理的用途,能正确解释软件处理的结果,尤其是样本信息的解释;同时要求学生阅读一定数量的文献资料,加深理解如何对数据集进行合理的数据预处理。二、授课方法自学。三、学习内容(一)数据预处理的原因(二)数据集成和变换1、数据

5、集成2、数据变换(三)缺失值处理的方法1、处理带有缺失值的记录2、处理带有缺失值的字段3、归因或填充缺失值4、用于缺失值的CLEM 函数四、重点难点数据集中缺失值的处理方法及Clementine软件实现。五、思考与讨论1、为什么进行数据预处理?2、数据预处理的主要方法和适用范围是什么?第三章 分类和预测一、基本要求要求学生理解分类、预测的各种建模方法的基本思想,掌握分类、预测建模方法的软件实现,了解分类、预测方法的基本应用。二、授课方法自学。三、学习内容(一)什么是分类,什么是预测(二)分类预测:决策树1、决策树的基本思想2、C5.0算法及软件实现3、决策树的案例及分析(三)分类预测:神经网络

6、1、神经网络的基本思想2、神经网络的软件实现3、神经网络的案例及分析(四)预测1、线性回归和多元回归2、非线性回归3、其他回归模型(五)分类预测的准确性1、评估分类法的准确率2、提高分类法的准确率3、准确率足够判定分类法吗四、重点难点分类、预测的各种建模方法、软件实现及应用五、思考与讨论1、分类预测的作用和基本思想是什么?2、决策树的基本思想和软件实现。3、神经网络的基本思想和软件实现。4、分类预测模型的评估。第四章 复杂类型数据的挖掘一、基本要求要求学生对复杂类型数据的挖掘方法有一个概括的认识,理解并掌握时间序列数据挖掘模型的构建方法及应用。二、授课方法自学。三、学习内容(一)复杂数据对象的

7、多维分析和描述性挖掘1、结构化数据的概化2、空间和多媒体数据概化中的聚集和近似计算3、对象标识符和类4、类复合层次的概化5、对象立方体的构造与挖掘6、用分而治之方法对规则数据库进行基于概化的挖掘(二)空间数据库挖掘1、空间数据立方体构造和空间OLAP2、空间关联分析3、空间聚类方法4、空间分类和空间趋势分析5、光栅数据库挖掘(三)时序数据和序列数据的挖掘1、趋势分析2、时序分析中的相似搜索3、序列模式挖掘4、周期分析四、重点难点时间序列数据挖掘模型的构建方法及应用五、思考与讨论1、什么是复杂类型数据?2、复杂类型数据的数据挖掘模型主要有哪些?3、时间序列数据挖掘模型的构建方法及软件实现。第五章 数据挖掘的应用和发展趋势一、基本要求要求学生了解数据挖掘的应用和发展趋势。二、授课方法自学。三、学习内容(一)数据挖掘的应用1、针对生物医学和DNA数据分析的数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论