【《基于学生在学习平台上的学生行为数据实现成绩评估的系统设计》11000字】_第1页
【《基于学生在学习平台上的学生行为数据实现成绩评估的系统设计》11000字】_第2页
【《基于学生在学习平台上的学生行为数据实现成绩评估的系统设计》11000字】_第3页
【《基于学生在学习平台上的学生行为数据实现成绩评估的系统设计》11000字】_第4页
【《基于学生在学习平台上的学生行为数据实现成绩评估的系统设计》11000字】_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

[10]。可以在其中记录代码,运行代码,查看结果,可视化数据,方便应用于数据处理,统计建模,构建和训练机器学习模型,可视化数据等许多其他用途。4.3基于Adaboost的成绩预测4.3.1Adaboost的算法原理Adaboost是一种基于基本分类器,对弱分类器多次学习,计算分类样本的权值,然后通过错误率或者迭代次数来集成强分类器的一个算法。Adaboost的实现过程:首先对学生学习的行为样本进行训练得到第一个分类器,第二步是将前一步错分的样本和随机生成新的样本数据一起构成训练数据进行下一个分类器的学习,以此类推,都是将前面错分的样本与随机生成的新样本数据构成新的训练数据,进行下一个分类器的学习,直至样本被正确分类或者达到最大的学习次数,停止迭代,最终集成一个强学习器。4.3.2Adaboost的成绩预测模型根据Adaboost原理,在使用该算法时需要选择一个算法作为它的弱分类算法,然后才能进行Adaboost构建模型的多次迭代学习。在这里选择默认的经典决策树分类算法作为Adaboost算法的基本分类算法进行建模。经过特征工程对数据进行前期的处理,满足对输入的要求。使用sklearn库中AdaBoostClassifier算法进行分类模型的建立,设置弱分类器为DecisionTreeClassifier算法,基于数据的信息熵来进行分类,每个子节点最少包含5个训练样本,以10为间隔,可视化展示每个弱分类器的预测准确分数。图21弱分类器个数变化的模型得分分布图从上图可以看出以经典决策树为弱分类器的Adaboost算法,在弱分类器为5个之后,训练分数得到最好的拟合效果,相对于测试集而言,弱分类器的个数达到20个以上预测得分趋于平缓,避免模型过拟合,设置Adaboost模型弱分类器的个数为50,然后进行模型训练,得到样本训练的各样指标。图22模型指标图从上图我们可以看到50个弱分类器的权重值,在弱分类器在50个以内,权重值范围在2.9-6之间,存在一定的欠拟合和过拟合情况。50个分类器时测试集的错误预测率为12.048%,因为训练集和测试集的分割点是随机的,所以模型的每次拟合效果有一定的差别,但是预测错误率始终在10%-15%之间,达到我们预期的效果。4.3.3Adaboost预测模型评估使用Adaboost算法最终生成的模型本质上依然是一个分类模型,我们使用sklearn库里的classification_report函数生成类指标的文本报告,在报告中显示每个类的精确度,召回率,F1值等信息。图23模型指标的文本报告图24模型指标的混淆矩阵我们可以从类文本报告和混淆矩阵中发现,测试样本中成绩为A类的错分2个样本为B类,成绩为B类的错分3个样本为C类,成绩为C类的样本都有错分在其它三个成绩中,说明模型在对成绩分类预测中,70分到90分之间的学生成绩容易被错分,在这个区间的学生行为数据的较为接近的,相似度较大分类不是很明显,所以容易错分,说明我们构建的模型对于这个区间的学生成绩预测准确率有待较强,后续需要更高的预测准确度可以从这方面下手调整参数或者数据集。整个样本中预测的精确度为87.95%,说明数据特征值与标签值之间具有较强的关联性,以及模型在一定程度上实现了对特征的区分。4.4总结与展望基于学生在LSN平台上的学生行为数据实现成绩评估是具有可行性的,而学生学习行为中比较能够反映成绩的主要特征是学生课程的各种作业和测验的提交得分以及实验机的操作。当然,对于整个成绩预测建模过程还必须正视的是,虽然只是使用了一种算法来构建模型,没有从广度多研究比较各算法在成绩预测分类的效果,但是Adaboost成绩预测模型的效果也是比较优化的,不足的是在数据预处理阶段没能很好的发现与挖掘更多与成绩相关的属性,这在一定程度上限制了对成绩预测的准确度。由于我的知识缺陷以及经验过少,所以对于学习行为预测的模型实现,只能说是完成实验的最基础阶段,有机会的话希望我能深入研究,学习更多的数据挖掘知识,探索更多未知的领域。参考文献:刘譞.基于学生行为的成绩预测模型的研究与应用[D].电子科技大学,2017.张林红,刘红梅.基于一卡通数据分析的学生早餐习惯与成绩关联规则挖掘[J].阜阳师范学院学报(自然科学版),2014,(04):92-95+105.贺超凯,吴蒙.edX平台教育大数据的学习行为分析与预测[J].中国远程教育,2016(06):54-59.张英杰.基于Blackboard平台的在线学习行为分析与预测[D].内蒙古师范大学,2017.郁晨.投资者情绪理论、度量及应用研究综述[D].金融评论,2017.范明,孟小峰.数据挖掘:概念与技术[M].机械工业出版社,2007.菅志刚,金旭.数据挖掘中数据预处理的研究与实现[J].计算机应用研究,2004,(07):117-118+157.刘宇主编;倪问尹副主编;边耐政主审.中国网络文化发展二十年(1994-201

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论