数据分析与挖掘课程教学大纲_第1页
数据分析与挖掘课程教学大纲_第2页
数据分析与挖掘课程教学大纲_第3页
数据分析与挖掘课程教学大纲_第4页
数据分析与挖掘课程教学大纲_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《数据分析与挖掘》课程教学大纲一、课程基本信息课程名称数据分析与挖掘DataAnalysisAndMining课程代码课程性质必修开课院部数学与计算科学学院课程负责人授课学期5学分/学时3.5/56课内学时56理论学时40实验学时实训(含上机)16实习0其他0适用专业数据科学与大数据技术授课语言中文对先修的要求具备一定的编程能力,已修《概率论与数理统计》、《python程序设计》、《多元统计分析》课程对后续的支撑学会数据分析的预处理、可视化、回归模型、预测算法等,作为在后续课程《数据分析与挖掘课程设计》必要的理论和实践基础。课程思政设计通过在教学中讲授数据科学的分析和挖掘理论和算法,培养学生要具有专业数据的敏感性,以及务实进取、爱好科学和技术的良好态度,为国家和社会的进一步发展做出贡献。创新创业教育设计在大数据时代,数据无处不在,在课程教学中,结合时代对数据分析与挖掘的人才需求,在教学中贯穿培养创新思维和创新创业能力,从具体实例中启发和教育学生的创新思维,以及结合专业技术寻找创新创业设计。课程简介课程定位:数据分析与挖掘是数据科学与大数据技术专业在学习高等数学、线性代数和概率论与数理统计等课程之后的一门学科必修课,为后续的数据分析与挖掘课程设计提供数据模型、分析理论与分析技术等能力的支撑。主要学习内容:该课程主要通过数据分析软件使用,讲授数据的收集、整理数据描述、统计图形与可视化技术、线性回归与回归模型的估计和预测等内容,让学生具备对数据进行基本分析能力,掌握必备的数据模型以及对数据进行深度挖掘的技能,达到将数学、统计知识应用到实际问题中建立合适的模型并设计合适算法解决实际问题的能力。核心学习结果:使学生获得以下能力与素养:1)用数学、统计的知识、方法来理解数据、建立数据模型;2)会借助软件调用模型、算法对数据进行挖掘分析,也能自己设计算法解决数据的建模和求解问题,提升数据分析或数据挖掘的能力和素质。主要教学方法:本课程主要采取理论与实践教学相结合,通过先讲授理论,再进行上机实验,并结合具体案例实践让学生提高分析和解决实际问题的能力。 二、课程目标及对毕业要求指标点的支撑序号课程目标支撑毕业要求指标点毕业要求1目标1:学会理解数据,学会用统计、数学的思想来分析数据,学会建立数据模型,掌握数据分析与挖掘的主要步骤和具体实现方法。3.2能够通过数据采集、数据存储、数据预处理、数据分析和数据挖掘、数据的可视化,分析、研究和解决大数据科学领域复杂问题。3.问题分析:能够应用数学、自然科学和数据科学与大数据技术的基本理论和方法,通过数据采集、数据存储、数据预处理、数据分析和数据挖掘、数据的可视化,分析、研究、解决信息科学和数据科学领域复杂问题,并通过实践来验证解决方案的准确性和合理性,获得有效结论。2目标2:使学生能设计数据分析与挖掘算法,培养学生应用理论知识解决实际问题的能力。4.3利用信息科学和数据科学的专业知识、针对实际问题的具体情况、结合文献资料对模型进行分析,采用恰当的方法、仪器设备、数据分析软件对特定问题的数据模型进行算法优化,并能够写出规范的分析报告和解决方案。4.建模与问题求解:能够设计合理有效的数据模型以满足特定问题,通过数据挖掘获得有效信息,能使用先进的仪器设备、数据分析软件并结合文献资料对信息科学和数据科学领域复杂问题进行算法优化、实践和设计新的算法模型,并能够在设计新的算法模型中体现创新意识。3目标3:具备在数据分析实践经验,对研究热点问题有敏锐性,能快速跟踪相关技术的发展方向。6.2能够针对复杂大数据工程问题,开发与使用恰当的技术、资源、现代工程工具和信息技术工具,对复杂工程问题进行预测和模拟。6.使用现代工具:能够针对大数据领域复杂的工程问题,开发或选择适当的技术、资源、现代仪器设备和信息技术工具,并能使用现代的仪器设备和数据分析软件对复杂工程问题进行预测及模拟,并能够理解其局限性。三、教学内容及进度安排序号教学内容学生学习预期成果课内学时教学方式支撑课程目标1数据分析软件介绍重点:anaconda简介难点:Jupyternotebook数据分析平台的使用创新创业教育:使用专业技术设计个性化数据分析软件了解数据分析的集中常用软件,如Sas、Spss、R、Eviews、Python等,掌握JupterNotebook的基本使用方法。2讲授、自学、创新创业教育目标1、22数据的收集与整理重点:数据类型、收集、管理难点:python数据管理理解数据按尺度、时间的两种分类特点,掌握横向与纵向数据的收集方法、以及数据的管理方法。6讲授、自学、上机目标1、23Python数据分析编程重点:数值分析numpy库、数据分析pandas库难点:数据框DataFrame的使用创新创业教育:利用编程技术设计数据分析软件掌握一维、二维数组的操作语句;掌握pandas的两种数据结构:Series序列与DataFrame数据框的操作。6讲授、自学、上机、创新创业教育目标1、24数据的探索性分析、直观分析思政:鼓励学生利用好专业技术,服务民生,为国家和社会做出贡献。重点:数据的描述分析、统计绘图、分组分析;seaborn统计绘图、ggplot绘图、pyecharts动态绘图难点:ggplot绘图创新创业教育:根据数据特点设计可视化方法学会计数数据、计量数据、描述性的汇总统计;会使用matplotlib、pandas的常用绘图;能进行groupby分组分析及绘图6课程思政、讲授、自学、上机、创新创业教育目标2、35统计分析及可视化重点:随机变量及分布图、统计量及分布图、统计推断方法难点:参数的估计方法、假设检验、推断的可视化能绘制函数图、气泡图、三维散点图、三维曲面图,能使用seaborn、ggplot、pyecharts绘图,能进行统计分析的可视化6讲授、自学、上机目标2、36数据的模型分析及可视化重点:线性相关模型、线性回归模型、分组可视化模型分析难点:线性回归模型创新创业教育:使用数据框对模型结果进行显示能使用线性相关分析、回归模型、分组可视化模型对数据建模,并进行可视化8讲授、自学、上机、创新创业教育目标2、37数据的预测分析重点:动态数列的预测分析难点:时间序列数据的可视化分析能对动态数列,特别是时间序列数据进行预测分析8讲授、自学、上机目标2、38数据的决策分析重点:不确定性决策分析难点:概率型风险分析掌握三种决策分析方法:确定性分析、不确定性分析、风险分析,能应用python进行可视化分析6讲授、自学、上机目标2、39实际数据的案例分析、挖掘思政:一定要依法用数据,将数据用得好能造福大众。重点:数据的获取、分析难点:数据的分析、建模、评价、改进创新创业教育:基于数据思维,设计更专业的数据挖掘算法和人性化的结果呈现,将数据思维在行业里进行创新。学会应用获取或爬取网页数据,学会应用ARIMA模型对时间序列建模、分析;了解其他领域的数据挖掘流程8课程思政、讲授、自学、上机、创新创业教育目标2、3注:“学生学习预期成果”是描述学生在学完本课程后应具有的能力,可以用认知(定义、列举、复述、界定)、理解(解释、辨别、诠释、论证、概括)、应用(应用、实施、执行、解决、计算、展示、使用)、分析(分析、辨别、划分、比较、推断)、综合(设计、整理、组织、创造、发展)、评判(评价、批判、演绎、辩护、支持)等描述预期成果达到的程度。四、课程考核该课程采用平时成绩(含考勤、课堂表现)(20%)+上机(实验课作业、表现)(20%)+期末考试成绩(60%)的考核。序号课程目标评价依据及成绩比例(%)成绩比例(%)平时上机考试1目标1:熟悉和掌握jupyternotebook的使用。了解数据的类型,掌握相应的数据收集和整理方法,学会使用numpy、pandas库在数据分析中的常用操作。(支持毕业要求指标点3.2)51025402目标2:掌握数据的探索性分析、直观分析、统计分析、模型分析、预测分析、决策分析。(支持毕业要求指标点4.3)51025403目标3:能对实际案列进行数据分析与挖掘,具备数据分析实践经验,对研究热点问题有敏锐性,能快速跟踪相关技术的发展方向。(支持毕业要求指标点6.2)551020合计152560100五、教材及参考资料[1]python数据分析基础教程,王斌会,电子工业出版社,2021年1月,ISBN:9787121402777[2]python数据挖掘方法与应用,王斌会,电子工业出版社,2019年3月,ISBN:9787121344954主要参考书:python数据分析与数据挖掘实战,张良均等,机械工业出版社,2016年1月,ISBN:9787111521235[2]数据分析方法,梅长林,范金城,高等教育出版社,2018年10月,ISBN:9787040501247[3]数据挖掘:概念与技术(原书第2版),JiaweiHan,MichelineKamber著,范明,孟小峰译,机械工业出版社,2016年9月,ISBN:9787111391401六、教学条件需要使用多媒体教室授课,授课电脑安装了Windows7、Office2010、python3.5.1以上版本的正版软件;需要安装了授课系统及Windows7、Office2010、Anaconda软件的电脑进行上机实训。附录:各类考核评分标准表上机评分标准教学目标要求评分标准权重(%)90-10080-8960-790-59目标1:熟悉和掌握jupyternotebook的使用。了解数据的类型,掌握相应的数据收集和整理方法,学会使用numpy、pandas库在数据分析中的常用操作。(支持毕业要求指标点3.2)能熟练、正确使用数据分析的常用库,按时或者提前完成任务能使用数据分析的常用库,不够熟练,能按时完成上机任务。能使用数据分析的常用库,需要延时完成上机任务。使用数据分析各种库和编程时,不正确、不合理或者不能解决数据分析问题。不能按时完上机任务。10目标2:掌握数据的探索性分析、直观分析、统计分析、模型分析、预测分析、决策分析。(支持毕业要求指标点4.3)能熟练、正确使用数据分析的各种模型和方法,按时或者提前完成任务能使用数据分析的各种模型和方法,不够熟练,能按时完成上机任务。能使用数据分析的各种模型和方法,需要延时完成上机任务。使用数据分析各种模型和方法时,不正确、不合理或者不能解决数据分析问题。不能按时完上机任务。10目标3:能对实际案列进行数据分析与挖掘,具备数据分析实践经验,对研究热点问题有敏锐性,能快速跟踪相关技术的发展方向。(支持毕业要求指标点6.2)能熟练、正确进行数据挖掘,按时或者提前完成任务能进行数据挖掘,不够熟练,能按时完成上机任务。能进行数据挖掘,需要延时完成上机任务。进行数据挖掘时,不正确、不合理或者不能解决数据分析问题。不能按时完上机任务。5考试评分标准教学目标要求评分标准权重(%)90-10080-8960-790-59目标1:熟悉和掌握jupyternotebook的使用。了解数据的类型,掌握相应的数据收集和整理方法,学会使用numpy、pandas库在数据分析中的常用操作。(支持毕业要求3)熟悉python的numpy、pandas、pyecharts、matplotlib库、statsmodel库、seaborn库、ggplots库的常用命令,熟练掌握了数据分析的基本命令,几乎没有错误。比较熟悉python的numpy、pandas、pyecharts、matplotlib库、statsmodel库、seaborn库、ggplots库的常用命令,掌握了大部分数据分析的基本命令。基本熟悉python的numpy、pandas、pyecharts、matplotlib库、statsmodel库、seaborn库、ggplots库的常用命令,掌握数据分析的基本命令,熟练程度一般。不熟悉python的numpy、pandas、pyecharts、matplotlib库、statsmodel库、seaborn库、ggplots库的常用命令,不熟悉数据分析的基本命令,有较多错误。25目标2:掌握数据的探索性分析、直观分析、统计分析、模型分析、预测分析、决策分析。(支持毕业要求4)熟悉数据的探索性分析、直观分析、统计分析、模型分析、预测分析、决策分析等的常用方法和命令,对分析结果能很好理解。能掌握数据的探索性分析、直观分析、统计分析、模型分析、预测分析、决策分析等的大部分常用方法和命令,对分析结果能理解。基本掌握数据的探索性分析、直观分析、统计分析、模型分析、预测分析、决策分析等的常用方法和命令,对分析结果有一定理解,但不能深入。不熟悉数据的探索性分析、直观分析、统计分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论