大数据背景下高校教育数据的分析与应用研究_第1页
大数据背景下高校教育数据的分析与应用研究_第2页
大数据背景下高校教育数据的分析与应用研究_第3页
大数据背景下高校教育数据的分析与应用研究_第4页
大数据背景下高校教育数据的分析与应用研究_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、    大数据背景下高校教育数据的分析与应用研究    (二)数据预处理1.学生数据。将本科生数据和研究生数据进行合并,保留“学号”“姓名”“性别”等关键信息字段,去除非关键信息字段,增加“学生类别”字段以区分本科生和研究生。合并后的学生数据记录总数为本科生和研究生学生数据记录之总和。2.成绩数据。为准确衡量每个学生的综合学习质量,引入gpa(grade point average,平均绩点)进行成绩评定。经过计算平均绩点,每个学生只保留1条成绩数据记录,成绩数据量大大减少。为便于更好地进行数据分析,采用等宽分箱法进一步对成绩数据进行离散化处理。平均绩点

2、在区间0,1的记录记为jd1,平均绩点在区间1,2的记录记为jd2,平均绩点在区间2,3的记录记为jd3,平均绩点在区间3,4的记为jd4。这样就把成绩数据分成了四类,反映了学生课程学习质量的四个层次。3.消费数据。首先利用数据库分组查询汇总得到每个学生的消费总金额。这样处理后得到的消费数据汇总记录就会小于学生数据记录总数(客观上存在部分学生一个月都不在校内消费的情况,对这部分学生按缺省值0进行填充),然后对消费金额进行离散化处理。消费金额为0的分为一组,记为je1。对消费金额大于0的记录采用等频分箱法进行分组,即按照消费金额从小到大的顺序进行排列,根据人数等分为若干部分,每部分为一组。消费金

3、额在区间0,164的记录记为je2,消费金额在区间164,274.5的记录记为je3,消费金额在区间274.5,1161.4的记录记为je4,其中1 161.4为最大消费金额。4.门禁数据。首先利用分组查询汇总得到每个学生的门禁刷卡次数,然后对没有门禁刷卡记录的学生按缺省值0进行填充,再对门禁刷卡次数进行离散化处理。门禁刷卡次数为0记录的分为一组,记为mj1。门禁刷卡次数特征明显,可根据经验值将门禁刷卡次数大于0的记录分为2组:门禁刷卡次数为1次到3次的为“偶尔晚归”,记为mj2;门禁刷卡次数大于3次的为“经常晚归”,记为mj3。(三)数据可视化分析数据可视化分析是指将数据分析结果以图形、图像

4、等形式予以展现,并进一步揭示其中所隐含信息的过程。使用tableau对经过数据预处理的学生数据、成绩数据、消费数据和门禁数据进行可视化数据分析,可得到4张统计图表(如图2所示)。图2 tableau数据分析图表从图2可以直观地看出:(1)与本科生相比,研究生jd3和jd4所占的比例较高,研究生课程学习质量较好。(2)与男生相比,女生jd3和jd4所占的比例较高,女生的课程学习质量较好。(3)本科生和研究生中都存在不少整月不在校消费的学生(即je1对应的学生)。(4)与本科生相比,研究生中高消费学生(je4)的比例较低。(5)与女生相比,男生中高消费学生(je4)的比例较高,尤其是本科生男生。(

5、6)本科生和研究生中都存在不少“经常晚归”的学生,即mj3对应的学生;(7)与本科生相比,研究生中晚归学生(mj3)的比例较低;(8)与男生相比,女生中晚归学生(mj3)比例较低。将数据统计分析结果应用于管理,可以得出以下结论及建议:(1)无论是学习上还是生活上,研究生总体上比本科生更为成熟,这与研究生年龄较大、阅历较多有关。女生总体上比男生生活更有序,学习成绩更好,这与女生能够更好地安排大学学习生活有关。因此,应重点关注本科生男生的在校学习和生活,有针对性地制定相应的管理措施。(2)je1对应的学生整月不在校消费,属于异常情况,是请假离校还是未经请假擅自离校,应通过院系管理人员进一步了解原因

6、。(3)mj3对应的学生“经常晚归”,也属于异常情况,是因为学习原因还是存在违纪情况,需要进一步跟踪了解,并根据具体情况作进一步的处理,以减少晚归现象。(四)聚类分析采用微软ssas对本科生群体的平均绩点、消费金额和门禁次数进行聚类分析。以经过离散化处理的数据为数据源,设置算法的运行参数:聚类算法为k-means算法,聚类数为3,训练集为全部样本6725条记录。完成聚类分析后,可得到聚类分析结果(如表1所示)。表1 聚类分析结果从表1可以看出,分析结果把本科生划为三类:第一类学生人数最多,超过总体的60%,主要特征是学习成绩较好、消费较高、晚归现象较少。这类学生虽然生活条件较好,但能够认真学习

7、,较好地遵守学校纪律。第二类学生人数也较多,主要特征为学习成绩较好、消费较低、几乎没有晚归现象。这类学生生活节俭,学习认真,严格遵守纪律。第三类学生人数较少,接近总体的10%。这类学生大部分成绩较差,晚归现象较为严重,消费主要分为两种情况:不在校消费或消费较高。这类学生学习不认真,纪律意识淡薄,有长时间离校、消费大手大脚、经常晚归或夜不归宿等多种不良表现。但第三类中也存在少部分成绩较好的学生,其经常晚归的原因包括参加科研或准备各类竞赛。根据聚类分析结果,可以得出以下结论及建议:(1)消费高低与学习成绩优劣没有必然的联系,但长时间不在校消费反映了学生长期离校会影响学习成绩的问题,因此应对长时间不

8、在校消费的学生进行重点关注。(2)遵守学校纪律是学习成绩较好的必要条件,晚归次数较多的学生大部分成绩较差,因此加强公寓管理、减少晚归现象,以保证学生的整体学习质量。(3)第一类和第二类学生都能够合理安排好大学学习生活,第三类中大部分学生的纪律意识和学习自觉性较差,应该成为教育管理的重点,应通过多种方式督促其遵守学校纪律、认真学习。五、结论大数据是教育发展的未来,教育大数据是教育信息化的最新发展趋势。在大数据时代,对教育数据进行采集、分析和利用的条件已经完全成熟。教育数据分析可以得到教育数据中的隐含信息,在教育数据分析的支撑下,高校教育教学和教育管理工作将更有针对性,也更有效果,将会使因材施教和

9、个性化教育的教育理想成为现实。笔者提出了教育数据分析模型,并举例进行了数据分析与挖掘,得到了数据中蕴含的一些有意义的信息,这些信息有助于高校教育管理工作的改进。教育数据及教育数据分析的价值远不止于此,有待进一步深入研究和挖掘,以便更好地为教育教学和教育管理服务。参考文献:1促进大数据发展行动纲要eb/ol. 2国家中长期教育改革和发展规划纲要(2010-2020年)eb/ol. 3教育部关于印发教育信息化十年发展规划(2011-2020年)的通知eb/ol.4先晓兵,陈凤,王继元等.基于大数据的高校学生管理工作研究与实践j.中国教育信息化,2015(5):6-10.56杨现民,王榴卉,唐斯斯.

10、教育大数据的应用模式与政策建议j.电化教育研究,2015(9):54-61.7李婷,傅钢善.国内外教育数据挖掘研究现状及趋势分析j.现代教育技术,2010(10):21-25.8葛道凯,张少刚,魏顺平,教育数据挖掘:方法与应用m.北京:教育科学出版社,2012.9educational data mining db/ol. 10胡德维.大数据“革命”教育n.光明日报,2013-10-19(5).11bienkowski m, feng m, means b. enhancing teaching and learning through educational data mining and learning analytics: an issue brief r. washington: u. s. department

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论