版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据统计分析与R语言教学大纲
适用范围:2019版本科人才培养方案
课程代码:08150431
课程性质:方业选修课
学分:4学分
学时:64学时(其中:理论48学时,实验16学时)
先修课程:高等数学,线性代数,概率论与数理统计
后续课程:
适用专业:数据科学与大数据技术等专业
教材:沈刚编著,R语言基础与数据科学应用,人民邮电出版社,2018
开课单位:计算机科学与技术学院
一、课程的性质与任务
课程性质:本课程是数据科学与大数据技术等专业的专业选修课。
课程任务:R语言,一种自由软件编程语言与操作环境,主要用于统计分析、绘图、数
据挖掘.R语言除了在统计研究领域具有很高的应用外,也越来越受到其他面向数据的工作
者的欢迎,其强大的绘图和图表功能更是“无与伦比二R占用内存少,运算速度快,而且
开源,因此它现已成为大数据时代数据分析的•项必备技能。本课程的开设正是为了满足同
学们处理和分析各种复杂数据的需求,除了重点介绍R语言的基本编程规则和方法外,在
简明扼要地阐述统计和数据挖掘方法的基础上,讲述与之相对应的R包的实现,并通过生
动的实例练习加强R语言的应用。本课程可作为需要进行数据处理和分析的各专业学生的
选修课,目的在于让学生熟练掌握R语言的基本编程方法,并在此基础上使用R包来预处
理、可视化和分析数据,使得学生掌握用现代前沿的统计和数据挖掘方法处理各种复杂数据
提供必备的编程技能。
二、课程的基本内容及要求
(-)引言
1.课程教学内容
(1)R的起源和发展;
(2)安装与运行R系统;
(3)安装与使用包:
(4)工作空间管理;
(5)R语言的集成开发环境RStudi。。
2.课程重点难点
重点:熟悉R语言的集成开发环境RStudi。。
难点:工作空间管理的理解和应用。
3.课程教学要求
(1)了解R语言的基本特点和应用场景;
(2)掌握R语言开发环境的安装和配置;
(-)数据与运算
1.课程教学内容
(1)基础知识;
(2)数据类型与数据表示;
(3)基本运算;
2.课程重点难点
重点:数据类型与数据表示;
难点:R语言基本运算。
3.课程教学要求
(1)了解并熟悉R语言数据表示方法;
(2)掌握R语言基本运算方法。
(三)程序设计基础
1.课程教学内容
(1)控制流;
(2)函数设计;
(3)编程规范与性能优化。
2.课程重点难点
重点:控制流;
难点:函数设计。
3.课程教学要求
(1)理解并熟练掌握控制流;
(2)掌握函数设计方法。
(四)类与对象
1.课程教学内容
(1)面向对象程序设计方法;
(2)S3s4类:
(3)引用类;
(4)继承。
2.课程重点难点
重点:理解并运用继承。
难点:掌握引用类.
3.课程教学要求
(1)了解R语言面向对象设计方法;
(2)理解并掌握类的构建。
(五)数据结构与数据处理
1.课程教学内容
(1)向量;
(2)矩阵与数组;
(3)数据框;
(4)因子列表;
(5)数据导入和导出;
(6)数据清洗。
2.课程重点难点
重点:向量和矩阵的表示及运算。
难点:数据框的应用。
3.课程教学要求
(1)理解向量和矩g的表示及运算;
(2)掌握数据框的应用。
(六)绘图与数据可视化
1.课程教学内容
(1)基本图形与绘图函数;
(2)调整绘图参数:
(3)其他自定义元素;
(4)描述性统计图。
2.课程重点难点
重点:基本图形与绘图函数。
难点:绘图参数及自定义元素。
3.课程教学要求
(1)了解基本图形与绘图函数;
(2)掌握绘图参数和自定义元素的设定。
(七)统计与回归分析
1.课程教学内容
(1)定性数据与定量数据;
(2)数据的数值度量;
(3)概率分布与假设检验;
(4)回归分析。
2.课程重点难点
重点:回归分析。
难点:概率分布与假设检睑。
3.课程教学要求
(1)了解概率分布与假设检验;
(2)掌握基于R语言的回归分析函数和调用参数。
(八)统计机器学习
1.课程教学内容
(1)特征空间与距离;
(2)聚类算法;
(3)分类算法;
(4)集成学习
2.课程重点难点
重点:聚类和分类算法。
难点:集成学习。
3.课程教学要求
(1)理解并掌握R语言的聚类和分类算法;
(2)掌握集成学习方法。
(九)神经网络与深度学习
1.课程教学内容
(1)基本原理;
(2)感知器模型;
(3)深度神经网络:
2.课程重点难点
重点:神经网络基本原理。
难点:深度神经网络。
3.课程教学要求
(1)掌握神经网络基本原理;
(2)了解深度神经网络。
三、课程学时分配
教学章节理论实践(验)讨论、习题
一、引言2
二、数据与运算4
三、程序设计基础4
四、类与对象6
五、数据结构与数据处理64
六、绘图与数据可视化84
七、统计与回归分析84
八、统计机器学习64
九、神经网络与深度学习4
总计4816
四、课程考核与权重比例
考核方式:本课程采用过程化考核手段,主要以作业评价、课程视频、课堂表现、课内
实验、平时测试、上机考试等方式对学生进行考核评价。
考核基本要求:考核总成绩由作业评价、课程视频、课堂表现、课内实验、平时测试、
上机考试等过程性评价成绩组成。其中:作业评价、课程视频、课堂表现、课内实验、平时
测试等过程性评价成绩为100分(占评价权重的40%),期末上机考试成绩为100分(占评
价权重的60%)。课程教学章节对应考核权重、分值分配如下表所示。
课时分配与考核权重、分值一览表
过程性评价成绩(权重
期末考试(权重0%)
序号教学章节课时数100%)
评价方法考核分值考核分值
课堂表现、作
1一、引言10分10分
2业评价
课堂表现、作
业评价、实验分分
2二、数据与运算41010
报告
课堂表现、作
业评价、实验分分
3三、程序设计基础42020
报告
课堂表现、作
410分10分
四、类与对象6业评价
5五、数据结构与数据处理10课堂表现、作10分10分
业评价
课堂表现、作
业评价、实验
6六、绘图与数据可视化1210分10分
报告
课堂表现、作
业评价、实验
7七、统计与回归分析1210分10分
报告
课堂表现、作
8八、统计机器学习10业评价、实验10分10分
报告
课堂表现、作
910分10分
九、神经网络与深度学习4业评价
合计64100分100分
五、课程资源库
1.Peter,Dalgaard编著,《R语言统计入门》,人民邮电出版社,2014年05月
2.卡巴科弗(Robert!.Kabacoff)著,《R语言实战》,人民邮电出版社,2016年5月
3.王国胤编著,《大数据挖掘及应用》,清华大学出版社,2017年6月
4.吕云翔编著,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- VR培训系统开发合同(2026年培训机构)
- VR内容制作合作合同(2026版)
- 老年人特殊饮食喂食实操
- 大棚黄瓜低温弱光管理对策
- 2026年应急指挥中心运行管理制度
- 2026年老年人经络拍打保健操教学讲座
- 有机茶园认证现场检查技术标准
- 鸭瘟疫情应急处置防控预案
- 蔬菜耐储运保鲜技术操作指引
- 2026年口腔诊所数字化设备采购指南
- 2026年江西金融租赁股份有限公司社会招聘14人笔试备考题库及答案解析
- 2026上海药品审评核查中心招聘辅助人员17人考试备考试题及答案解析
- 2026山西晋城市城区城市建设投资经营有限公司招聘15人备考题库含答案详解(考试直接用)
- 2025南京溧水区招聘社保员2人(公共基础知识)测试题附答案解析
- 生物药剂学与药物动力学复习重点总结
- 清华大学数学实验0课件
- 广东省惠州市惠城区2022-2023学年六年级下学期期末数学试卷
- 如何做好一台完美的初次髋关节置换
- 热玛吉培训资料培训课件
- 马克思主义异化观课件
- 分子设计育种课件
评论
0/150
提交评论