基于R语言的学生成绩分析_第1页
基于R语言的学生成绩分析_第2页
基于R语言的学生成绩分析_第3页
基于R语言的学生成绩分析_第4页
基于R语言的学生成绩分析_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于5语言的学生成绩分析摘 要:学生考试成绩是检验教师教学效果的重要指标,客观准确地分析学生成绩是每一个教师的职 责.依据R语言特点及数据处理过程,运用R语言对沈阳市某小学四年级学生期末成绩进行描述性、相 关性和差异性分析,并根据教学实际需要将数据生成箱形图和直方图,由图形分析考试成绩是否两级分 化,在某一成绩段是否集中;同一学生不同科目的成绩是否相关,是否偏科等等.实践表明,采用R语言 分析学生成绩能够显示其隐藏的问题,为教师提高学生成绩提供参考依据,从而达到提高教学效果的目 的关键词:R语言;成绩分析;箱形图;直方图;星图;pairs图0引言学生成绩作为检验教师教学效果的产物,直接反映学生

2、对知识的掌握情况及教师的教学水 平.近些年,有关教学的探索更多关注于新的教学手段,针对教学效果的分析,尤其是有关分析 方法的研究较少.随着人工智能和大数据时代的到来,为教师利用数据统计分析手段,从大量的 学生成绩中提取重要数据,发现成绩中隐藏的问题,提高学生成绩,提供了新的思路.本文中尝 试引入R语言对学生成绩进行统计分析M ,为教学人员探索新的统计方法提供参考.R语言特点数据分析是指采用合适方法对从海量数据中收集的大量数据进行分析、整理、归纳,抽取有 价值的信息的过程.R语言作为一种强大的编程语言,不仅可提供大量多样的数据统计分析方 式,还可生成图例,其主要特点有: 开源免费的软件可从官网下

3、载,安装简单快捷,而且其强大的R语言包均可根据需要 从网上下载,支持多操作系统环境;具有强大可自定义样式的绘图功能,可利用函数将统计分析的计算数据生成想要的图, 并根据修改函数中的参数,自定义图样式; 操作流程简单,无需编写大量代码,用户只要了解所需函数的参数意义,即可生成对应 图例.R语言数据处理数据源是R语言进行统计分析的核心资源.考虑到大学课程成绩存在一定主观性,相比之下 小学期末考试更严格、更真实,成绩趋于客观,因此本研究选择沈阳市某小学四年级期末考试成绩作为数据源进行统计分析.2. 1 数据收集根据教学人员的需要,从众多列成绩中选取主要数据信息,包括序号(num)、姓名 (name)

4、、班级(class)、数学(math)、语文(chn)、英语(eng),将收集的数据存为.xls文件 或.csv文件.收集数据时,出现的缺失值可删除或按空缺值等方式处理.2. 2 数据读入numnameclassmathchnengchr1刘芷瑞4. 32822. 5392赵羽菲4. 398951003姜欣彤4. 39887984宋虹霏4. 39887975施依含4. 39391976贾倩雯4. 39()91997局震4. 398919()8工习鉴4. 310()SO999李泽溪4. 39688931()李彦燕4. 3958795# .with105 more rows图1 R语言生成学生成绩

5、R语言支持.xls、. csv和.txt等多种文件类型导入.导入 文件前需要加载对应的R语言包,编写代码时需将导入文件 赋值给变量,导入的变量类型以数据框形式存在.本文以导入. xls文件为例,利用R语言read _excel ()函数实现导入代码 如下:library( read_excel)scoresV 6 read_excel(scoresdata. xlsx)导入后查看数据,见图1.数据共105行,查看变量内容时R语言仅显示10行,隐 藏95行.每列除显示导入数据时填写的列名外,还显示属性 类型,其中name为字符型,其余均为数据框.2. 3 数据提取读入数据后,需对有用数据进行提取

6、运算.例如,在统计 分析成绩时,姓名、序号、班级等属性不应参加统计分析,但函数无这些属性就无法进行归类统计分析,在众多数据中提取所要数据,可应用R语言中c () 将所需数据连接在一起,通过如下代码提取数据:scores.data V6 scoresc(4 % 6)scores.data“scores &c (4% 6)表示提取scores变量中46列的数据赋值给变量scores. data.R语言成绩分析与图形绘制学生成绩是反映教学成果的客观数据.目前,大多数学校采取Excel录入、汇总、计算的方 式管理与分析学生成绩,虽能计算出需要的最终数据,但是缺乏对成绩的客观分析与直观反映.针对这一问题

7、,本文提出了基于R语言的统计分析方法以提高教学效果&466.3. 1 各科成绩描述)分析3. 1. 1 统计成绩信息Min.:25. 00Min.:16. 00Min.:24. 00lsl Qu.:78. 501st. Qu. :62. 001st. Qu.:59. 00Median:89. 00Median:74. 00Median:91.00Mean:83. 77Mean:70. 04Mean:78.643rd Qu.:94. 003rd Qu. : 84. 003rd Qu.:96. 00Max.:100. 00Max.:95. 00Max.:100. 00mathchneng图2 su

8、nmary函数生成学生成绩传统数据计算一般通过Excel表格分列对各科进 行求和、求平均值、求最大值和最小值的分类计算, 工作略显繁琐.这里以沈阳某小学四年级成绩为例, 将43名学生成绩导入R语言环境中,导入的数据变 量以数据框的形式存在.R语言可通过summary () 函数完成各科成绩的初步计算,实现代码如下summary (scores c (4 % 6)生成的计算数据见图 2.通过生成数据可直观看到,在整个四年级数学、语文和英语(科考试成绩中,除最大值、最 小值和平均值外,还计算出科目成绩的中间值(Median)、1/4位数(1st Qu.)和3/4位数(3stQu.),为分析、了解学

9、生整体情况提供了便捷的数据计算服务,提高了教学决策的准确性. 3.1.2绘制成绩箱形图为更加直观地向决策者提供数据依据,R语言boxplot ()函数可根据导入的成绩数据生成 箱形图,即根据数据的分布情况生成统计图.上述通过summary ()函数计算出各科成绩的重要 属性值,生成的箱形图如图3所示,实现运行代码如下:boxplot (math class, data = scoris)boxp l ot (ing class, data=scores)boxplot (chn class, data=scores)箱形图将计算得到的描述性统计量进行更直观地展示.图3中分别显示各班级数学、语文

10、、 英语成绩与班级的信息:长方形外部的上下两条横线分别表示该班级的最高分和最低分,长方形 的上下边框分别表示该班级成绩的1/4位数(1st Qu.)和3/4位数(3st Qu.),长方形内部黑横 线表示该班级成绩的中间数,图形中的空心白圆点表示异常数据.除箱形图规定的线形和图形含 义外,还可从图形中看到隐藏的信息,例如长方形的面积大小决定该班级本科目成绩是否在某成 绩段集中,如果面积过大表示成绩涉及范围较大.3. 1. 3绘制成绩直方图hist (math, freq = FALSE)lines (density (math) , col=blum)rug (jitter (math)R语言的

11、强大不仅体现在便捷的数据计算,还体现在可依据频数生成可视的直方图逍.根据 导入的数学、语文和英语成绩,利用R语言的hist ()函数、lmes ()函数和rug ()函数生成 整体成绩直方图,如图4所示,运行代码如下:(a)数学成绩整体点.方图(b)语文成绩整体直方图(c)英语成绩整体点.方图图4数学、语文、英语成绩分布直方图通过成绩直方图可直观看出,横坐标为成绩段,纵坐标为密度,各科成绩图形及密度曲线由分数段人数决定.数学成绩除个别学生,大部分均已及格,并且在及格人数中很多学生的成绩集中在85分以上,90分以上偏多;语文成绩虽呈正态分布趋势,但是存在一些成绩不及格的学生,大 部分学生在659

12、0分之间,80分以上偏多;英语成绩分布呈现两极化,成绩不及格和90分以 上的均偏多,6080分之间学生较少.3. 2 成绩相关性分析成绩是检验教学成果的重要指标.有效利用技术手段从大量的成绩中发现科目之间的关联! 挖掘隐藏信息,是提升成绩、提高教学效果的重要方式. 数据中发现科目之间的相关性,为决策者提供分析依据.cor (scores ,subjects) 生成的相关性数据见图5.通常认为,数学成绩好的小学生语文和英语的成绩 都不会很差.通过R语言各科成绩的相关性分析看出, 数学与语文、数学与英语的相关系数均超过了 0. 6,根 据统计学的规定,相关系数区域0.60.8属于有很强 的相关性,

13、说明在该年级中数学学得好的学生,其数学 成绩与语文成绩、英语成绩存在一定的相关性.通过R 语言生成的成绩相关性如图6所示,运行代码如下:pairs (scores ,subjects )3. 3 成绩差异分析利用starts ()函数可根据学生的成绩生成星图,教学人员通过星图可直观了解学生是否偏 科、是否优秀.本文中生成的星图如图7所示,运行代码如下:利用R语言cor ()函数,可从导入的 运行代码如下:chn mathengchn 1.0000000 0. 7221382math 0.7221382 1.0000000eng 0.5870535 0. 6940769 图50. 58705350. 69407691. 0000000cor函数计算学生绩相关性分析stars ( scores)星图一般表示多个相互独立的变量个体,每个连接角与中心点的轴线越长,数值就越大,生 成的星图就越大,各科成绩分别对着数据的维度.图7中,第一排第二个学生、第二排第二个学

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论