《数据分析》课程教学大纲_第1页
《数据分析》课程教学大纲_第2页
《数据分析》课程教学大纲_第3页
《数据分析》课程教学大纲_第4页
《数据分析》课程教学大纲_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用统计学专业《数据分析》课程教学大纲(课程代码:06122170)本课程教学大纲由数学与统计学院统计系讨论制订,数学与统计学院教学工作委员会审定,教务处审核批准。一、课程基本信息课程名称:数据分析课程代码:06122170课程类别:专业拓展课程适用专业:应用统计学课程修读性质:选修先修课程:概率论、数理统计学分:2学分学时:32学时二、课程目标本课程支撑专业毕业要求2、毕业要求3、毕业要求4、毕业要求5、毕业要求6,通过本课程的学习,使学生达到以下目标:目标1:理解数据分析的相关方法,包括对数据分析算法、计算机编程等的理解与应用、对数据预处理的理解及统计软件的应用。目标2:掌握数据分析的基本处理方法和研究方法,了解数据处理技术的应用前景、以及数据分析行业最新进展与发展动态,认识数据分析行业中的岗位要求。目标3:掌握数据分析的基本算法、基本操作,具有文本挖掘、数据处理、统计软件应用等能力;熟悉数据分析的调研报告、研究方案设计及论文撰写规范。目标4:具有一定的创新意识和从事数据分析领域科学研究的初步能力,有获取数据分析最新技术知识和信息的基本能力。目标5:能应用数据分析的基本理论和方法,并对所获得的数据进行处理与分析,具备常用统计软件(如Python、R等)的操作能力、数据分析计算能力和定量分析能力。课程目标与专业毕业要求的关系:课程目标支撑的毕业要求支撑的毕业要求指标点课程目标12.基础能力(H)2.1接受系统的数学思维训练,具有良好的抽象思维、空间想象、数学演算和数学建模能力,具有扎实的数学基础;2.2具有良好的演绎推理能力,准确计算能力,分析归纳能力及一定的科学研究能力。2.3能够严谨推导复杂统计模型问题,验证统计模型的合理性,并能正确分析、求解模型。课程目标23.知识能力(H)3.1具有一定的统计思维能力,善于从数据中发现问题、提出问题;3.2具有一定的数据处理能力,了解数据处理技术的应用前景;3.3了解统计学理论与方法的发展动态及其应用前景。课程目标34.专业能力(H)4.1能够运用统计学知识的基本原理对复杂数据问题进行建模。4.2能够运用模型、图表和文字等准确有效地处理社会问题中复杂数据的预处理、建模、分析和展示等。4.3能够通过撰写报告、陈述发言、撰写文稿、答辩等方式准确而有效地表达专业见解,具有良好的文字与口头表达能力。课程目标45.创新意识(M)5.1具有一定的创新意识和批判意识,善于发现、提出问题;5.2具有初步的统计研究能力,具有一定的科学研究和实际工作能力;5.3具备发现问题和系统表述问题、分析问题的能力。课程目标56.实践能力(H)6.1掌握统计学的基本理论、基本知识、基本方法;具有采集、处理、分析数据的基本能力;6.2具有统计调查、统计数据处理、统计分析与写作、统计软件应用等能力;6.3掌握分析复杂统计模型问题的原理和算法,具备应用统计软件计算模型解,并进行数值分析的能力;6.4能够利用常用统计软件MATLAB、SPSS、Excel、R等进行数据处理和分析。三、课程学习内容(一)理论学习内容及要求序号课程模块学习内容课程目标学习重点难点教学方法学时1引言1.作为科学的统计课程目标1重点:1.数据分析的实践2.数据的形式及可能用到的模型难点:3.数据可能用到的模型4.统计概念中的某些误区讲授法22.数据分析的实践课程目标13.数据的形式及可能用到的模型课程目标54.统计概念中的某些误区课程目标22横截面数据回归:经典方法1.简单线性模型中的指数变换课程目标1重点:1.生存分析数据的Cox回归模型2.岭回归、lasso回归、适应性回归、偏最小回归难点:3.生存分析数据的Cox回归模型讲授法、案例教学、专题研讨82.生存分析数据的Cox回归模型课程目标33.数据出现多重共线性情况:岭回归、lasso回归、适应性回归、偏最小回归课程目标43横截面数据回归:机器学习方法1.机器学习回归方法课程目标1重点:1.机器学习回归方法2.机器学习回归方法的实践难点:3.机器学习回归方法的原理算法讲授法、案例教学、专题研讨82.决策树回归、boosting回归课程目标23.bagging回归、随机森林回归课程目标54.支持向量机回归、人工神经网络课程目标54横截面数据分类:经典方法1.logistic回归和probit回归课程目标2重点:1.logistic回归和probit回归2.经典判别分析难点:3.经典判别分析讲授法、案例教学、专题研讨62.经典判别分析课程目标35横截面数据分类:机器学习方法1.机器学习分类方法课程目标1重点:1.决策树分类(分类树)2.adaboost分类、bagging分类3.随机森林分类难点:4.机器学习算法原理讲授法、案例教学、专题研讨82.决策树分类(分类树)课程目标43.adaboost分类、bagging分类课程目标54.随机森林分类、支持向量机分类课程目标55.最近邻方法分类课程目标56.神经网络分类课程目标3根据课程目标以及课程教学内容理论性、抽象性强等特点,本课程教学以采用讲授法为主,综合运用案例教学、讨论教学、专题研讨等方法。各种教学方法要根据教学内容和特点而定,不能千篇一律更不能附会使用。(一)讲授法是教师通过口头语言向学生描绘情境、叙述事实、解释概念、论证原理和阐明规律的教学方法。其优点在于信息量大,能使学生通过教师的说明、分析、论证、描述、设疑、解疑等教学语言,短时间内获得大量的系统的学科知识。运用时应注意充分贯彻启发式教学原则,讲中有导,突出重点,留有余地,给学生思考、消化、融会贯通的时间,避免成为注入式、填鸭式教学。(二)讨论教学法是学生在教师的指导下围绕某个主题而进行探讨、辨明是非真伪以获取知识的方法。其优点在于能更好的发挥学生的主动性、积极性,有利于培养学生独立思维能力、口头表达能力,促进学生灵活地运用知识。运用时应注意讨论的主题要有吸引力、要善于启发引导学生、讨论结束时要进行小结。(三)案例教学法是一种以案例为基础的教学法,其关键是提出一种课题情境,而教师在教学中扮演着设计者和激励者的角色,鼓励学生积极参与讨论。其优点在于能够充分调动学生学习主动性,发展其分析判断能力,有利于实现教学相长。运用时应注意案例的真实性、典型性以及与教学内容的相关性,注意教学过程的方向掌控与引导。(四)问题引导教学法是将课程的知识点以问题的形式呈现给学生,引导学生在探索解决问题的思维活动中掌握知识、训练思维、发展智力,进而培养学生自己发现问题解决问题能力的方法。其优点在于使学生在问题及其解决中感受理论的价值和魅力,并在以“问题”为主线的教学活动中,学会思考、学会学习、学会创造,促进学生创造性思维的发展。在实施过程中,教师应注意根据教学目的和内容精心设计并提出难易适度、逻辑合理的问题。四、课程考核(一)考核内容与考核方式课程目标考核内容所属学习模块/项目考核占比考核方式课程目标11.数据分析中的基本概念引言5%课堂表现、课程论文2.简单线性模型中的指数变换横截面数据回归:经典方法3.机器学习回归方法横截面数据回归:机器学习方法4.机器学习分类方法横截面数据分类:机器学习方法课程目标21.决策树回归横截面数据回归:机器学习方法20%课程论文2.boosting回归横截面数据回归:机器学习方法3.logistic回归和probit回归横截面数据分类:经典方法课程目标31.生存分析数据的Cox回归模型横截面数据回归:经典方法30%课程论文2.经典判别分析横截面数据分类:经典方法3.神经网络分类横截面数据分类:机器学习方法课程目标41.数据出现多重共线性情况:岭回归、lasso回归、适应性回归、偏最小回归横截面数据回归:经典方法15%课程论文2.决策树分类(分类树)横截面数据分类:机器学习方法课程目标51.数据的形式及可能用到的模型引言30%课程论文2.bagging回归、随机森林回归横截面数据回归:机器学习方法3.支持向量机回归、人工神经网络横截面数据回归:机器学习方法4.adaboost分类、bagging分类横截面数据分类:机器学习方法5.随机森林分类、支持向量机分类横截面数据分类:机器学习方法6.最近邻方法分类横截面数据分类:机器学习方法评分依据:考核方式为课程论文,课程论文的内容与课程目标的达成度须达到70%.课程论文评定标准:1.不及格(60分以下):(1)文章的内容与题目完全偏离;离题或大段抄袭别人的文章,并弄虚作假;(2)态度非常不认真,内容空洞,逻辑混乱,表达不清,语句不通。2.及格(60分):(1)文章基本上按要求书写,方法基本符合要求,基本独立完成,但内容不充实;(2)文章基本有条理,但结构有缺陷;方法能基本说明问题,能对数据作出一般分析,但较单薄,对材料的挖掘缺乏应有的深度,不够全面;(3)文字表达基本清楚,文字基本通顺;3.中等(70分):(1)文章能够联系数据实际情况,内容较充实,具有一定的科学性;(2)独立完成,论点正确,但论据不充足或说理不透彻,对数据的本质挖掘不够深入;(3)材料较具体,文章结构合理,层次比较清晰,有逻辑性,表达能力也较好;(4)基本符合正规学术论文格式要求,排版基本整齐、准确。4.良好(80分):(1)文章能运用所学方法的理论知识联系实际,并能提出问题,分析问题。对所论述的问题有较强的代表性,有一定的个人见解,并有一定的理论深度;(2)数据来源具体。对数据的分析较充分,有说服力,联系数据背景实际情况,但不够透彻;(3)文章结构严谨,层次清晰,行文规范,条理清楚,文字通顺,书写工整,图表正确、清楚,数字准确;(4)合正规学术论文格式要求,排版整齐、准确。5.优秀(90分):(1)文章能运用所学的理论知识联系实际,并能提出问题,分析问题。对所论述的问题有很强的代表性,有深刻的挖掘成果和理论深度;(2)数据来源真实具体,有社会意义。对数据的分析充分,有说服力,联系实际情况,论述透彻;(3)文章结构严谨,层次清晰,行文规范,条理清楚,文字通顺,书写工整,图表正确、清楚,数字准确。(二)成绩评定1.平时成绩评定:(1)课堂表现(5分):通过学生在课堂上的表现情况、发言与提问情况,来评价学生相关的能力。(2)作业完成情况(10分):围绕课程的学习目标进行作业的设计。如让学生简述对知识的认识,考核学生对于概念的理解情况,帮助学生将定义转化为自己的理解。(3)实验报告(15分):如通过课堂实验设计、操作技能展示与汇报,训练学生的软件实践能力,使学生真正明确软件操作技能在实际数据分析中的应用,形成自己实际数据分析能力。(4)课堂考勤(10分)2.期末成绩评定期末成绩以课程论文的方式进行考核。课终考核主要考察学生对基本概念、操作程序和具体方法的理解与运用等。方式为课程论文。要求学生掌握基本概念、操作程序,运用数据分析的具体方法解决实际问题。3.总成绩评定总成绩应由平时考核成绩和期末考核成绩构成,其构成比例应科学合理。总成绩(100%)=平时成绩(40%)+期末成绩(60%)。五、其它说明(一)教材选用复杂数据统计方法-基于R的应用(第三版),吴喜之编著,中国人民大学出版社,2015.(二)主要参考书[1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论