数据分析与数据挖掘-教学大纲_第1页
数据分析与数据挖掘-教学大纲_第2页
数据分析与数据挖掘-教学大纲_第3页
数据分析与数据挖掘-教学大纲_第4页
数据分析与数据挖掘-教学大纲_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《数据分析与数据挖掘》教学大纲课程信息课程名称:数据分析与数据挖掘课程类别:素质选修课/专业基础课课程性质:选修/必修计划学时:64计划学分:4先修课程:无选用教材:《数据分析与数据挖掘》,姜维主编,2023年,电子工业出版社教材。适用专业:本课程可作为相关专业高年级本科生和研究生的教学课程,也可作为数据分析与数据挖掘研究人员的参考课程。课程负责人:二、课程简介该课程讲解了数据分析与数据挖掘的理论和方法,包括描述性统计、假设检验、方差分析、回归分析、关联规则、决策树、贝叶斯模型、判别分析、支持向量机、神经网络、聚类分析、离群点分析等,同时配有应用举例。三、课程教学要求序号专业毕业要求课程教学要求关联程度1工程知识描述性统计、假设检验、方差分析、回归分析、关联规则、决策树、贝叶斯模型、判别分析、支持向量机、神经网络、聚类分析、离群点分析等。L2问题分析随着大数据分析、人工智能、互联网等的快速发展,数据分析与数据挖掘理论方法的研究与应用已成为当前的热点,在多个领域已经取得有价值的研究成果。H3设计/开发解决方案大数据分析、人工智能与互联网的发展为该领域的研究提出了新的需求,本课程在阐述理论方法的同时,也注重实践,更注重知识体系结构。H4研究L5使用现代工具L6工程与社会学生能够意识到数据分析与数据挖掘的重要性,不仅要有良好的思想道德素质、科学文化素质、专业技能和健康的身体,而且要有良好的心理素质,勇于承担责任,能够承受失败与挫折等。L7环境和可持续发展L8职业规范L9个人和团队1.学会个人发展和团队合作,提高个人和团队的综合素质。2.学会与他人合作和沟通,建立良好的人际关系和团队合作氛围。H10沟通1.学会进行有效的沟通和表达,与客户、同事和上级保持良好的沟通和协作。2.学会进行跨文化沟通和合作,提高国际化视野和跨文化交流能力。M11项目管理L12终身学习1.学会进行自我学习和自我提升,不断提高自身的专业水平和创新能力。2.学会进行终身学习和职业发展规划,不断拓展职业领域和发展空间。H注:“课程教学要求”栏中内容为针对该课程适用专业的专业毕业要求与相关教学要求的具体描述。“关联程度”栏中字母表示二者关联程度。关联程度按高关联、中关联、低关联三档分别表示为“H”“M”或“L”。“课程教学要求”及“关联程度”中的空白栏表示该课程与所对应的专业毕业要求条目不相关。四、课程教学内容章节名称主要内容重难点关键词学时类型1数据分析与数据挖掘基础数据分析与数据挖掘需求数据分析与数据挖掘的工作过程数据的组织和数据的类型数据的常用描述性统计量数据的基本描述性统计分析了解并掌握数据分析和数据挖掘的需求;掌握一般数据分析和数据挖掘的主要工作过程;掌握数据的收集原则以及数据的常见分类。4理论+实操2数据抽样与推断检验随机变量概率分布抽样统计基本抽样分布常用的抽样分布与区间估计常用的参数检验常用的单样本非参数检验了解并掌握数理统计和应用统计方面的知识。5理论+实操3可视化图与分组检数据的常用可视化图分析均值比较和t检验方差齐性检验两独立样本的非参数检验两配对样本的非参数检验多样本的非参数检验了解分组数据;掌握各组相对频数统计、均值与方差等统计量的显著性差异比较、总体分布显著性差异检验等。8理论+实操4方差分析与相关性分析方差分析PostHoc检验连续属性数据的相关性分析离散属性相关性分析了解并掌握方差分析以及相关性分析。5理论+实操5数据的预处理与距离分析数据的预处理数据的常用组织方式相似度计算与距离分析KNN分类模型参数的点估计了解数据的预处理;掌握数据清理、数据集成、数据变换和数据归约。3理论+实操6回归分析一元线性回归多元线性回归常用的曲线回归最小二乘法及其应用Logistic回归了解回归分析;掌握一元线性回归、多元线性回归、常用的曲线回归、最小二乘法及其应用、Logistic回归。5理论+实操7空间降维技术主成分分析因子分析案例研究奇异值分解主成分回归与逐步回归了解并掌握空间降维技术;掌握主成分分析、因子分析与SVD奇异值分解。3理论+实操8关联规则与点对相关性频繁模式与关联规则的基本概念频繁模式挖掘频繁模式树点对相似度的典型度量信息熵及其应用与点对相关性度量了解并掌握频繁模式、关联规则、点对相关性度量和信息熵方面的知识。3理论+实操9决策树分类问题与模型训练决策树及ID3算法C4.5算法与连续属性特征分类树CART决策树决策树剪枝ROC曲线与AUC指标了解并掌握决策树;掌握ROC曲线与AUC指标。4理论+实操10贝叶斯分类连续属性贝叶斯分类器正态概率分布下的贝叶斯分类器离散属性贝叶斯分类器朴素贝叶斯文本分类和TAN贝叶斯模型贝叶斯分类器中的参数估计与非参数估计了解并掌握贝叶斯分类;掌握估计与非参数估计。4理论+实操11特征空间与判别分析特征空间特征提取与特征选择极大似然判别分析距离判别分析Fisher判别分析掌握特征空间构造、评价、变换等;掌握判别分析、距离判别分析、Fisher判别分析。3理论+实操12感知机与支持向量机线性判别函数感知机分类器感知机训练算法扩展最大间隔超平面与结构风险支持向量机了解并掌握线性判别函数、感知机分类器、感知机训练算法扩展;掌握结构风险最小化和支持向量机。5理论+实操13人工神经网络激活函数与多层感知机BP神经网络BP神经网络应用深度学习了解并掌握多层感知机、径向基网络、Hopfield网络、卷积神经网络、循环神经网络、长短期记忆网络等。5理论+实操14集成学习机器学习中的若干问题统计量重抽样技术分类器重抽样技术与组合分类器随机森林与Adaboost算法分类模型中的若干问题了解并掌握二分类器处理多分类问题、多标签分类方法、类别数据不平衡问题与单纯提高精确率与单纯提高召回率的方法。4理论+实操15聚类分析与离群点分析聚类问题与聚类类型基于划分的聚类层次聚类基于密度的聚类基于网格的聚类与基于模型的聚类离群点分析了解聚类的概念;掌握聚类方法的类型。3理论+实操五、考核要求及成绩评定序号成绩类别考核方式考核要求权重(%)备注1期末成绩期末考试考试50百分制,60分为及格2平时成绩课后作业15次40优、良、中、及格、不及格3平时表现出勤情况10两次未参加课程则无法获得学分注:此表中内容为该课程的全部考核方式及其相关信息。六、学生学习建议学习方法建议1.通过开展课堂讨论、实践活动,增强的团队交流能力,学会如何与他人合作、沟通、协调等等。2.通过思考,加深自己的兴趣,巩固知识点。3.进行练习和实践,提高自己的技能和应用能力,加深对知识的理解和记忆。学生课外阅读参考资料《数据分析与数据挖掘》,姜维主编,2023年,电子工业出版社教材。七、课程改革与建设该课程理论与实践相

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论