数据分析与可视化-教学大纲、授课计划_第1页
数据分析与可视化-教学大纲、授课计划_第2页
数据分析与可视化-教学大纲、授课计划_第3页
数据分析与可视化-教学大纲、授课计划_第4页
数据分析与可视化-教学大纲、授课计划_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE1《数据分析与可视化》教学大纲(202X-202X第X学期)课程名称: 数据分析与可视化(DataAnalysisandVisualization)授课教师: XX老师,教授,博士生导师答疑时间:实验课、每周二下午3:00-5:00办公室:XXXXX 邮件地址:XXXXXXXXXXXXX 联系电话:XXXXXXXX课程类别: 专业必修课/专业选修课课程班级: XXXXXX课程安排: 202X年9月7日—202X年1月15日 地点:科研实验大楼702室 时间:周三18:00–19:45 课程调整:根据学校相关节假日通知 期终考试时间:202X年底或202X年初学分总学时理论教学学时实践教学学时其他23422102课件网址:XXXXXXX教材和参考书目:指定教材:《数据分析与可视化》冯兴东、刘鑫,人民邮电出版社,2023.参考教材:GarrettGrolemundandHadleyWickham《RforDataScience》O’ReillyMedia,Inc.出版,2017预备知识本课程为数据科学与商务统计方向学生必修课程,假设学生已经完全掌握微积分、矩阵运算以及初等概率论以及部分统计建模的知识的前提条件下讲授课程。课程达成目标:《数据分析与可视化》是一门重要的基础实践课,是研究和揭示随机现象统计规律性的统计科学,是研究如何有效地收集数据,如何对数据进行推理,以便对问题进行推断或预测,从而对决策和行动提供依据和建议的学科。通过该课程的学习,学生首先应能掌握数理统计的基本概念、主要理论和方法,最主要是要培养具备统计学的基本思想和思维方式。通过训练,学生应能具有一定的创造性思维能力、推理分析能力和较强的动手能力,并能运用所学的统计方法分析研究现实生活中的一些随机现象,并解决实际问题。同时,为进一步学习后继专业课程和深造打好良好的基础。课程设置知识要求: 本课程为统计学、数据科学及商科相关专业的学科共同课程之一,假设要求学生已经完全掌握微积分、矩阵运算以及初等概率论及部分统计建模知识的前提下学习此课程。本课程以Python框架为基础,系统地介绍数据分析与可视化的理念、工作流程、常见的可视化工具及其在统计建模方法上的应用和展示,并针对特定类型的数据、特定的应用场景展示详尽的实际案例,辅以对应章节的教学课件、习题和代码,可以让读者由浅入深地进行数据分析和可视化。各章主要内容如下。第1章主要介绍数据、信息、知识之间的差异,如何收集、处理和组织数据,数据可视化的简单发展史,以及如何通过对数据的可视化展示来帮助决策。第2章介绍如何生动地对数据进行可视化展示,介绍一些最佳的可视化实践和基本的统计学术语、Python中的可视化工具,以及交互式可视化的理念等。第3章介绍PythonIDE工具,如何利用Anaconda进行可视化展示,以及常见的交互式可视化的程序包,如Bokeh、VisPy等。第4章介绍常见的基于Python的数值计算和交互式绘图的程序包,如NumPy、SciPy等;介绍如何定义标量和切片检索,常见的数据结构,如堆栈、元组、队列等,以及matplotlib可视化程序包等内容。第5章介绍常见的机器学习方法和预测模型,如回归方法、KNN算法、逻辑回归、支持向量机、主成分分析等,并针对这些常见的机器学习方法进行可视化展示和分析,使得这些常见的机器学习方法可以更加生动地进行展示等。第6章介绍常见的金融数据结构及其对应的统计模型,同时针对这些常见的模型,进行可视化的展示,并对统计学方法进行简单的介绍等。第7章主要介绍生物网络数据的可视化,包括对带有图结构的数据进行统计建模以及可视化展示,并针对该类数据的检验给出生动的可视化解释等。第8章主要介绍如何实现统计模拟、其他基于Python的常用的统计学函数、信号处理等内容,并对比其他平台的可视化工具,如R语言等。课程设置能力要求: 作为统计学专业的最重要的基础理论课程,本课程主要通过教师理论讲解、学生解题训练,辅以小组讨论的形式。通过教师理论讲解,使学生掌握数理统计的基本概念、主要理论和方法,最主要是要培养具备统计学的基本思想和思维方式。通过训练,学生应能具有一定的创造性思维能力、推理分析能力和较强的动手能力,并能运用所学的统计方法分析研究现实生活中的一些随机现象,解决一些实际问题。考核形式期末考试采用开卷上机/期末论文方式,学生的最后的总分计算方法如下:平时成绩(考勤+作业)≤40%(考勤10%,作业30%)期末考试≥60%试卷结构期末将以上机考试形式为主,内容包含程序和分析题。或者期末论文形式,具体要求详见相关说明。学术诚实涉及学生的学术不诚实问题主要包括考试作弊;抄袭;伪造或不当使用在校学习成绩;未经老师允许获取、利用考试材料。对于学术不诚实的最低惩罚是考试给予0分。其它的惩罚包括报告学校相关部门并按照有关规定进行处理。

数据可视化教学要点教学大纲(书页编号以教材为准)第1章数据可视化概述 11.1数据、信息和知识理解 11.1.1数据和信息 21.1.2知识理解 21.2知识的提取流程 31.2.1从数据中提取信息 31.2.2从信息中提取知识和理解 41.3数据可视化与统计图表 41.4如何利用可视化帮助决策 51.5总结 5本章习题 6第2章数据可视化 72.1利用数据创造有趣的故事 72.2可视化的一些最佳实践 92.3Python中的可视化工具 142.4交互式可视化和布局 152.5总结 18本章习题 18第3章常见PythonIDE 203.1PythonIDE 203.1.1Python3.x与Python2.7 203.1.2不同类型的交互式工具 213.1.3不同类型的PythonIDE 233.2利用Anaconda进行可视化 323.2.1绘制3D曲面图 333.2.2绘制方形树状图 353.3交互式可视化的库 403.3.1Bokeh 403.3.2VisPy 413.4总结 42本章习题 42第4章数值计算与交互式绘图 444.1NumPy、SciPy和MKL函数 444.1.1NumPy介绍 444.1.2SciPy介绍 504.1.3MKL函数介绍 554.2标量选择、切片与索引 564.2.1标量选择 564.2.2切片 564.2.3数组索引 574.3数据结构 594.3.1堆栈 594.3.2元组 604.3.3集合 614.3.4队列 624.3.5字典 634.3.6矩阵表示的字典 644.3.7字典树 694.4使用matplotlib进行可视化 724.5总结 79本章习题 79第5章统计学与机器学习 815.1分类方法 815.1.1理解线性回归 825.1.2线性回归 855.1.3决策树 885.1.4贝叶斯定理 925.1.5朴素贝叶斯分类器 945.2KNN算法 955.3逻辑回归 995.4支持向量机 1045.5主成分分析 1065.6k-means聚类 1105.7总结 113本章习题 114第6章金融和统计模型 1156.1回报率模型和确定性模型 1156.2随机模型 1246.2.1蒙特卡罗模拟 1246.2.2投资组合估值 1436.2.3模拟模型 1456.2.4几何布朗运动模拟 1456.2.5基于扩散的模拟 1496.3阈值模型 1526.4总结 155本章习题 156第7章图结构数据和网络模型 1587.1有向图和多重图 1587.1.1存储图数据 1597.1.2图形展示 1617.2图的聚集系数 1697.3社交网络分析 1727.4可平面图的检验 1757.5有向无环图的检验 1767.6最大流 1787.7随机块模型 1807.8总结 183本章习题 184第8章高级可视化 1868.1文本数据可视化 1868.1.1利用TextBlob构造朴素贝叶斯分类器 1868.1.2利用词云了解电影影评 1928.2空间数据可视化 1958.3计算机模拟 1978.3.1Python随机相关的程序包 1978.3.2SciPy中的随机函数 1988.3.3模拟示例 1998.3.4信号处理 2028.3.5动画 2058.4绘制交互图 2078.5总结 211本章习题 212202X-202X学年第X学期教学进度表XXXXXXXX专业XXXXX年级XXXXXXX班课程名称数据分析与可视化总课时34本学期安排课时数34(其中讲课29课时,课堂练习、实验15课时)课程代码XXXXXX课程序号XXXXX讲课教师XXXXXXXX周次月/日~月/日讲课课堂练习、讨论及课外作业时数内容时数内容1-2(共计4课时)1第一章介绍数据、信息、知识之间的差异,如何收集、处理和组织数据,数据可视化的简单发展史,以及如何通过对数据的可视化展示来帮助决策1第二章介绍如何生动地对数据进行可视化展示,介绍一些最佳的可视化实践和基本的统计学术语、Python中的可视化工具,以及交互式可视化的理念等2实验13-4(共计4课时)2第三章介绍Python常见IDE工具,如何利用Anaconda进行可视化展示,以及常见的交互式可视化的程序包,如Bokeh、VisPy2实验25-6(共计4课时)2第四章介绍常见的基于Python的数值计算和交互式绘图的程序包,如NumPy、SciPy等;介绍如何定义标量和切片检索,常见的数据结构,如堆栈、元组、队列等,以及matplotlib可视化程序包等内容2实验37-9(共计5课时)3第五章常见的机器学习方法和预测模型,如回归方法、KNN算法、逻辑回归、支持向量机、主成分分析等,并针对这些常见的机器学习方法进行可视化展示和分析,使得这些常见的机器学习方法可以更加生动地进行展示等。2实验49-11(共计5课时)3第六章常见的金融数据结构及其对应的统计模型,针对这些常见的模型,进行可视化的展示,并对统计学方法进行介绍。2实验512

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论