《数据分析基础》课程建设与教学实践探索_第1页
《数据分析基础》课程建设与教学实践探索_第2页
《数据分析基础》课程建设与教学实践探索_第3页
《数据分析基础》课程建设与教学实践探索_第4页
《数据分析基础》课程建设与教学实践探索_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 数据分析基础课程建设与教学实践探索张程伟摘要:数据分析基础课程是数据科学与大数据专业的一门专业基础课程。本文主要介绍了浙大城市学院数据分析基础课程的建设思路,并总结了 2022 年教学实践情况。一、引言数据分析基础是我校大数据专业的必修课程。张彩伢等1提到在大数据专业人才培养模式中要构建多层次的实践教学体系:基础实验层、综合设计层和应用创新层。数据分析基础就是基础实验层的实践类课程。周黎鸣等2分析了工科背景下数据分析的课程设计,侧重于可视化的实现,而我校数据分析课程是在理科背景下,侧重于采用统计方法进行数据分析,主要教授 R 语言和 Python 语言的数据分析编程方法。朝乐门等3指出数据科

2、学课程的一大难点就是理论基础的跨学科性,数据分析实践就是统计学、机器学习及可视化的一个重要接合点,无论对学生的学习还是对老师的教学都充满着挑战。我校该课程主要介绍 R 语言以及 Python 语言的编程基础以及数据分析相关理论方法。该课程的教学可以让学生熟悉数据分析相关的工具 R 以及 Python 的编程环境和编程技术,同时培养学生能够使用 R 以及 Python进行数据分析处理的能力,最终使学生掌握数据可视化以及基本数据分析的相关理论方法和具备使用 R 以及 Python 编程工具进行编程实现的能力。学生通过该课程的学习,提高动过手能力和独立思考能力,能够更好更轻松地将后续学习中关于数据处

3、理的理论模型知识应用到实处。二、浙大城市学院统计软件课程教学探索历程 2022 年开始面向统计专业开设了实用统计软件,培养学生实用计算机软件进行统计建模分析的能力。课程教学内容从使用 SPSS 进行统计分析到使用 SAS 进行统计分析的编程实现,从菜单式数据分析的计算机应用到统计建模的编程实现。2022 年开始面向统计专业开设统计软件基础(双语),为了跟上学科发展的潮流,更好地开拓学生的统计建模实现能力,课程内容转为使用 R 语言进行统计建模分析。2022 年开始,我校新开设数据科学与大数据技术专业,为了使学生在未来的学习和研究中拥有足够的数据处理和计算编程能力,开设数据分析基础,重点介绍统计

4、建模的 R 语言以及成熟的用于数据分析的Python 语言的编程基础以及数据分析相关理论方法和计算机编程实现。三、课程建设本课程建设的重点主要放在案例的设计和课堂教学形式的优化。本课程作为一门新开课程,建立在历史开设的几门相关课程的基础之上,拥有一些教学案例的积累。教学内容包括:R 编程环境的熟悉、R 语言数据结构、基本统计分析及绘图的 R 实现以及 Python 语言的基本语法、numpy 科学计算库、pandas 数据分析处理库和利用 Matplotlib 库进行数据可视化。数据分析基础这门课程的特色在于培养学生熟悉使用相关计算机编程语言的同时还要熟悉数据分析的相关理论基础的同时,将二者结

5、合起来,达到能够使用 R 或者 Python 进行具体的数据处理和分析。改革的创新点也在于和通过大量具体的数据分析案例入手,进行案例教学,在课堂上培养学生能够针对不同数据案例给出相应的分析建模方法, 然后利用计算机进行編程实现,而不是单纯割裂地进行 R 语言或者Python 语言的编程教学或者是数据分析理论的教学。教学形式上增加学生的动手参与的机会,改革课程考核的方式,注重考查教学过程中学生的参与程度与效果。课程成绩的评定将包括:平时成绩(考勤+作业)以及期末考查,期末考查的形式以上机完成一次综合的数据分析实训为主,不唯考,重过程,看成效。作为首开课程,在未来的教学过程中,将会首先将课程体系建

6、设完善,完善教学的内容和教学的案例以及考核内容。然后调研大数据专业后续专业课程任课老师的教学需要,调整优化本课程的教学内容,使本课程融入专业课程建设的需要,提升学生的专业能力,更好地为其在后续的专业学习和研究服务。(一)课程教学内容及课时安排:1.Python 语言基础(8 学时)2.Numpy 基础(8 学时)3.Pandas 入门(8 学时)4.Python 绘图与可视化(8 学时)5.Python 数据分析初步(4 学时)6.R 语言基础知识(8 学时)7.R 数据结构(8 学时)8.R 数据转换(4 学时)9.R 数据可视化(4 学时) 10.R 描述性统计分析及随机模拟(4 学时)(

7、二)考核重点:熟悉 Python 的使用环境和编程方法,能够使用Python 进行基本的数据处理与分析任务。熟悉 R 语言的语法结构与数据处理方法,能够使用 R 进行基本的数据处理与分析任务。(三)必须掌握的基本知识点:Python 的运行编译环境;Python 语言基础,序列函数的使用,循环语句以及分支控制语句的应用;内建的数据结构以及函数的定义与使用;numpy 多维数组及逐元素通用函数;pandas 数据结构及其基本操作;数据的转换;数据可视化方法;数据的分组、聚合。熟悉 R 中的内容显示;变量、向量的生成、管理与运算;函数的定义;程序包的装载与使用;数据的输入、输出与管理;矩阵、数据框

8、的定义与管理;数据的转换;字符串与日期类数据;统计相关基础运用(数据汇总,描述性统计分析,样本均值 t 检验,正态性检验等);R 绘图及图形控制;其他一些关于 R 编程的有用方法。考核内容为平时十二次实验作业每次提交,期中进行一次 Python 数据分析技能的上机考核,期末进行一次 R 数据分析技能的上机考核。(四)考核的评定(评分)标准:(1)课程要求学生全程参与并签到,不得无故缺勤。考勤总分为 10 分,无故缺勤一次减 2 分,无故缺勤次数达到 3 次,取消该课程的考核资格。(2)平时作业每次满分 10 分,按照解答的准确性以及态度进行评分,最后总合按 30 分折算加入期末总评。(3)期中及期末考核按照完成任务的质量和数量进行评分,各满分100 分。(4)期末总评=平时作业成绩(30 分)+考勤(10 分)+期中考核(30%)+期末考核(30%)四、教学实践 以上课程体系,经过一轮针对 2022 级学生的教学,学生成绩如下表所示:参与考核的总人数为 63 人,及格率为 97%,优秀率为 62%

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论