【基于BP神级网络的学生学习质量评价体系构建研究16000字】_第1页
【基于BP神级网络的学生学习质量评价体系构建研究16000字】_第2页
【基于BP神级网络的学生学习质量评价体系构建研究16000字】_第3页
【基于BP神级网络的学生学习质量评价体系构建研究16000字】_第4页
【基于BP神级网络的学生学习质量评价体系构建研究16000字】_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于BP神级网络的学生学习质量评价体系构建研究摘要本文围绕学生学习质量评价体系,研究分析了相关的参考文献,进行调研目前对学生学习质量评价的依据以及存在的问题,提出了一套基于高斯过程的机器学习算法[1]的学习质量评价模型。首先,基于高斯过程算法估计的期望与方差,建立置信区间计算公式,进一步评价算法的可靠性[2]。然后,引入BP神经网络、支持向量机模型分别在学生学习质量评价中的应用研究,通过基于案例对比分析,基于高斯过程的机器学习算法在学生学习质量评价中,评价结果精度相对较高,可靠性较强。关键词:学习质量评价;高斯过程;机器学习;BP神经网络;支持向量机目录TOC\o"1-3"\h\u155711绪论 绪论1.1研究背景与现状目前,学生学习质量是教育领域内研究的重点之一,以往学习质量评价主要集中在学习成绩和学校资源、学校的老师自身的实际教学水平等主观性的因素,从而导致这种评价方法过于主观,评价的结果与学习质量真实情况存在很大的差异[3]。本文分析采用高斯计算过程中的机器专业学习算法主要是从在校学生的专业学习发展情况、自身能力因素等多方面因素入手进行数据分析,对在校学生专业学习质量以及对专业知识点的准确掌握情况及时进行把握监控,进一步深入了解在校学生的专业学习情况。(1)国外研究现状以美国来看,对于大学生学习质量综合评价中的研究是比较少的,美国对大学生学习质量的综合评价,都是用专业学习研究的好坏来进行评价的。甚至有些地方也会将学生正在学习的学术成果用以评价高校的实际教学状况的重要指标。在经过调查之后发现,目前美国许多地区开始通过综合评价学生自主学习成果,来提高高等学校的教学水平,促进学生自主学习并获得全面发展。除此之外,美国当前并未直接对大学生群体们的学习质量进行综合评价的专题研究,然而却有对其学习成果进行评价的研究,而这些研究也是可以通过侧面反映出学生的学习质量[4],通过对学生的评价反映出学生的学习成果,对大学生学习的评价也是通过各方面的考评进行数据分析,最终得出更加合理有效的评价结论。在经过调查之后发现美国当前有关于大学生群体们综合学习水平的评价,集中体现在以下四个方面:第一,对学生怎样做出需不需要使用批判性创新思维的学习评价;第二,如果学生碰到一些问题怎样查找具体的改善措施的评价水平,针对大学生来讲,这是尤为关键的一项评价标准;第三,书面的语言交流能力,但是从性质上来讲这种能力也是能够有助于大学生可以在一定程度上把本身的真实学习体验运用恰当的方式表达出来,这也可以有利于人际交流;第四,逻辑思维也是大学生群体们在日常学习过程当中一项极为重要的推理性思维,好的逻辑思维水平可以使大学生在分析某一具体问题时,能够更为投入所得出的推理结果也更为全面,进而帮助大学生们更加全面的了解所要推理的事物,进而从整体上提高自己的学习速度和学习质量。现阶段,国外许多国家对于大学生群体们的专业评价,主要是参考他们的专业和学习成绩来进行评价的。在此,我们以美国为例来展开研究,则可以从中发现,目前美国主要是通过不同的专业评价,对某一研究生所接受的教育课程,来展开全方位的评价。而除此之外,研究生自身的职业教育评价主要是从社会、政府以及高校这三个方面来进行多元化评价的[5],可以说,美国是最早开始对研究生群体们进行教育评价的一个国家,所以美国对于研究生们的教育评价,目前已经形成了较为系统的研究体系。目前,社会上有关于各类评价指标及评价方法比较多元化,同时所有评价指标和各种评价方都是以所需评价的研究对象为基础而建立起来的。另外,对于某一大学生在日常的学习过程当中是否了解一些质量指标的问卷研究,以及通过对在校大学生在日常实习时的实际经验结果进行问卷调查之后,可以从中发现:当下影响大学生个体在实践期间学习的非决定性质量指标以及进一定量化的指标。在经过查阅相关资料之后,从中发现当前国内外除了对某些特别方面的主观评价研究之外,还有一些对学生特殊心理状况进行客观评价的研究文献。在这些研究文献当中,也包含了一些对某个学生自身心理素质的客观衡量评价。尤其是伴随着互联网技术的迅速普及,学生们通过互联网渠道也可以获得所需技能,所以在此次研究中可以借助于设置调查问卷和进行因素分析等方式,构建起一个同大学生群体们自身学习素养相对应的指标,以对大学生群体们的学习质量进行研究。当前国外在综合评价指标体系这方面的文献研究成果层出不穷,并且在不同行业或者不同问题上都进行了较为深入的论述与分析,并建立了许多的评价指标方法。例如,有关于周边环境的综合评价,在经过多方面的研究之后,现已经打造出了一套完善的评价机制[6]。评价方法也比较多,必须要使格局在实际生活当中具有的问题来进行建模处理。例如,在进行风险评估的时候,可以采取模糊综合评价。当然,机器学习等一些其他的评价方法,也应当得到较为广泛的普及。按照所要评价的对象去选择最为合适的评价形式,并结合具体的问题,而采取恰当的评价形式。(2)国内研究现状目前,我国对于教育的质量问题很十分重视,提出了“提高学习质量”的重点教育内容,对于高校学生来说,学习教育质量是否好坏基本就是一个学校教育人才培养工作质量的最终直接体现。我国现在也有相关的专家学者对于我国大学生课外学习质量下降中的主要影响因素有着一系列的实际相关问题研究,并且也已经取得了初步的研究成果。当然,国外也已经有一些类似的研究机构也做着相关调查,与此同时,重点在于这些人是站在美国NSSE的角度上去解读该问题,我国的相关学者同样站在NSSE的观点出发,来详细分析一下全国近年大学生学习质量大幅下降的主要影响原因,得到的具体结论如下是:首先,外界环境的影响。其次,学生学习目标不明确。这些研究人员大多是内地的高校中的研究对象,很少会涉及边疆地区,也并不会对此进行全面的考虑和调查,最终的结果也并没有有说服力的结论,结果较为笼统。所以在这些研究的结果中,最终的建议策略往往是对高校教师以及其他个体而言的,可操作性相对较差。而直接影响在校学生的专业因素当然有很多,比如人文地理、经济、学习生活理念,以及专业办学机构地址和专业教学评估等,这些因素都会对在校学生的专业学习生活质量发展产生一定影响。而一个教师的教学质量也往往会通过一个学生学习质量进行反馈表现出问题,影响一个学生学习质量的因素也往往会通过社会环境因素、家庭环境因素、学校环境因素等以及宏观心理因素,个体因素、年龄因素、心里因素等环境因素很多方面反馈出来。我国在2010年1月颁布了《国家中长期教育改革和发展规划纲要(2010-2020年)》,其中提出:这次的教育的重要工作内容就是针对当前的高等教育的发展而言的,即我国若想在高等教育方面达到世界强国就必须做到以下几点,首要的就是去综合考虑高等教育的教学质量,从以下两个主要方面上来进行综合考虑:一是学校的实际教学管理与实际教学实施一线的教育实施活动情况,二是学生在学校课堂上的积极自主开展学习情况、合作开展学习情况以及实际社会学习时间的利用情况。而国家,在2016年组织也并且实施了对于全国高等院校的本科学习质量的评估工作,也对工作的内容做出了详细的了解。就目前的实际情况分析来看,学生在这所学校的专业学习质量到底是什么样的情况,也是需要通过专业的工具进行实地调研后进行分析的。学习质量在目前来看,是一个必须进行研究的重要课题和现实问题,美国的高等教育领域在上个世纪六七十年代就已经开始做专题研究了,并对此开展了大学生学习参与情况的调查分析。在中国,也有一些学者在本世纪初就对大学生的学习等方面进行了研究,也有学者与通过引进美国的NSSE问卷进行了对比分析。对于国内来说,对西方教育领域的样本数据分析少之又少,而在此次的课题,为了研究结果具有说服力,我们也应该进行深入的数据研究。1.2研究目的与意义由于高等教育的主要对象面向的是广大的学生群体所以高等教育今后的实际发展状况,也可以通过大学生群体们的实际学习情况而体现出来。由此我们可以从中发现对大学生群体们实施学习质量方面的评价,可以从“输出结果”而体现出当下高等教育的实际情况。现阶段,在对大学生学习质量进行评价的过程当中,尚未形成极具权威性,且较为统一的评价体系。所以,目前有关于大学生群体们的学习质量评价,应当紧密结合具体的情况而构建起相应的评价指标,并选用最为科学的办法来对它展开评价。当下社会是一个科技发展日新月异的社会,所以在这种发展背景之下,各个用人企业也对于大学生的专业知识积累储备量、技能娴熟度、以及心理健康程度进行严格要求。因此,要对学生学习质量可以实施较为合理的评价,这样可以有效保证当前国内各大高校向社会各行各业输送高质量的综合性人才,进而满足我国各行业及用人单位对于综合性、高素质人才的招聘需求。只有这样才能够促进我国社会、高等学校乃至大学生自身的和谐发展,所以本篇文章的研究有着重要的指导意义。对学生学习质量状况进行合理的评价,使高校对学生培养更加具有针对性,从而在学生学习过程中也就可以在大学生群体们学习的过程当中,提高他们的综合学习质量,进而促使当前国内高等教育朝着更好的方面去改进。从大学生群体们的角度上来讲,对学生学习状况进行合理的评价,也能够使他们更为明确自己今后的发展目标,并选择科学合理的学习方法,实现自身的全面发展。除此之外,这种综合评价就业指标对于大学生群体们自身的职业学习生涯,也能够起到良好的导向性作用,使他们更为明确自己在踏入工作岗位之后所应当具备的基本专业技能,尤其是在哪些地方需要提高并在实际的就业岗位上应当达到何种标准,进而帮助大学生群体们做出更好的职业发展规划。最后,好的专业指导对于大学生群体们日后的发展,也能够起到有效的指引作用,使大学生群体们能够对自身的努力方向有了更为明确的认识并做好下一步的学习安排。从我国当前高等教育事业的实际发展状况来讲,我们可以从中发现行之有效的实施学生整体学习水平指标的评价,可以在最大程度上提升现阶段我国高等教育的水平,提高其教学质量。针对社会来说,每年的优秀大学生,肯定可以达到他们所要求面对的一些工作。高效率按时完成各项业务工作,推动我国经济朝着更好的方向去发展。本文从模型训练、测试、置信区间的设置等方法,科学合理的来对大学生的学习质量展开评价,有着极为重要的参考意义和实际应用价值。1.3研究内容与方法本文主要研究内容与方法如下:第一,构建国内大学生的学习质量评价指标体系。通过对相关学术文献的深入研究,再结合当下的实际工作情况,对大学生学习质量的指标评价工作实际情况进行发展现状调查分析。通过多种评价方法而从中掌握当前我们国家大学生学习评价方法,并从这些学习评价方法当中发现,所存在的指标设置不全面、评价方法落后、效率低等问题。并充分结合当前国际社会各界对于国内大学生学习质量方面的要求,从而构建出更加科学、有效的大学生专业学习质量评价体系,确保这一评价指标体系能够与大学生的实际学习状况相适应结合,明确最终评价指标的重要作用。第二,机器学习算法的使用方面,针对研究的对象做出评价的同时,站在机器学习的方向上去探讨相关问题。并在此基础之上将这些具体的问题总结出来,同时还应当选取可以使用在这种评价机器学习模型。例如,高斯过程机器学习算法、支持向量机算法,BP神经网络逻辑回归等。最终,通过对以上三种算法的研究,带入基础数据,找到大学生学习质量评价中表现最好的那个算法,并对这个算法进行性能方面的验证。在此次论文的设计过程当中,主要使用的是高斯过程机器学习算法,这样能够从整体上提高评价性能,最终确保实验结果实现最优。第三,对数据进行实时采集和分析处理。对此,仅需从学生信息系统中直接进行一些数据的分析采集,搜集一些相关的教学研究文件以及相关学生的考试成绩,首先需要对我们搜集到出来的这些数据样本进行定量预处理,然后根据教学研究及其应用学习中得到数据的定量标注分析方法对这些数据样本进行定量分析比对,最终将这些数据转化成为对于教学算法的性能测试和基本训练相对应的数据即可。第四,进行实验验证。对此,可以先创建其相应的积极学习评价模型,进而再在该评价模型的基础之上建立起相应的置信区间,最后对模型进行综合性的测试与训练。

2相关理论知识研究2.1高斯过程算法目前,高斯过程理论得到了不断的完善与发展,并且对于高斯随机学习过程与贝叶斯知识学习方法理论的相关性结合后,所提出的新型现代机器知识学习理论[7]。在高斯随机运算的过程当中,其也是一项非常大的具有重要概率分析意义的核线性学习机,相较于算法来说,算法也常常可以说是同时的用来获取不同计算机的预测结果以及不具确定性的随机数据。所以,算法在分类、模式识别等问题中也得到了比较好的应用。高斯概率分布又名正态概率分布,是现代统计学理论中的一种重要的概率分布。在理论应用方面,高斯中的分布函数具有很多的良好的数学性质。在科学应用推广方面,是自然与社会生活中普遍存在的许多的随机变量现象都可以是通过服从或者近似服从高斯分布,也是这些新的特点,能够认为是他得到更加广泛的科学研究,并最终使他得到了用在数学以及粒子物理等各个基础科学研究领域中,更直观的意义来看,高斯分布过程往往可以算是对于随机变量在密度函数三维空间上的一种有效性的推广。2.2支持向量机算法支持向量机经过在样本空间里面找出一个样品平面,被称为超平面。使每个样本中的数据在样本空间内,根据所属不同样本类别的所有样本,被真正做出分类处理。寻找超平面依然还是必须对模型训练里面的参数研究、依照最后的模型训练分析数据特征方可以获取最后的线性子空间,得到线性子空间之后,可以对全部样品参数重新做出分类处理,接着再按照存在差异的样品参数各自的特征,重新确定在样品参数里面在线性子空间里面的定位,进行重新确认应当去测试的样品和他们的种类。超平面属于一种较为理想的数据状态,但实际的生活过程当中,会有很多线性数据,无法被完美地划分成为不同的数据类别。此处在问题可以接受的范围之内,适当引入一些“松弛变量”,允许出现有少量点无法被完全正确分类的情况,所以我们应当找到比较优秀的超平面。2.3BP神经网络算法通常情况下,BP神经网络算法是一个应用多种BP网络算法设计组成的针对信息前向进行反馈、误差反向反馈传播的信息网络[8]。除此之外,在本文中对于神经网络开始计算输出值和实际值之际,通常也会不可避免地存在一定误差,而倘若这个误差比较大的话,则会由输出层向输入层的传播来调整最终的权值和阀值,并通过这种方式来降低误差,最终结束当前所进行的一系列工作[9]。最后,由于BP神经网络传播主要采用的是误差逆传播算法,倘若此时误差在无法接受的范围当中的话,则需要对误差做出进一步的逆传播处理工作。然后,再对神经网络的权值做好相应的修订工作,并输出最终值[10]。2.4算法的对比和选择对于神经网络来讲,倘若在模拟数据量较大时,它的工作精度较高。然而,此处还需要庞大的预处理器和模拟数据库来进行工作。但是,倘若其数据量少的话,将会使得模拟合成出现问题。除此之外,有关于神经元数量的选择,通常有还未达成统一标准。当然,神经元的数量选择方式也极有可能会影响到最终的实验结果。即使BP神经网络有着较为很多的优势,然而BP神经网络自身所存在的问题往往也不能忽略。在经过研究与总结之后,特将BP神经网络自身所存在的具体问题概括如下:收敛耗时较长、经常出现局部最小值、网络最佳结构很难确定、学习步长难以有效确定几方面。对于一个完全支持函数向量机来说,支持向量机协方差函数的基本特征函数空间,是由每个协方差均值函数的唯一性属性明确地分别予以确定的,当协方差采用了每个均值函数取值的基本函数为零时,高斯过程也由协方差的每个均值和函数唯一性的属性明确地分别给出予以确定,而从本质上意义看,协方差的每个均值和函数被认为就是一种一个核均值函数。因此,它们从各个基本根源上都可以认为是一种完全属于这个核数的方法[11]。但是由于样本空间数据支持二次性的向量规划,计算机对于新的样本空间数据难以直接进行快速的分析实施,并且对于SVM的样本空间数据消耗需求,也是主要的数据存储用来训练样本和支持核矩阵。但是,由于SVM也是通过直接借助二次向量规划技术来进行求解和存储支持二次向量的,而想要求解二次向量规划将仍然需要涉及使用到对于m阶核矩阵的数据计算,当对于m的样本数值很大时,该二阶的核矩阵的样本数据对于存储和支持向量的数据计算也将需要花费大量的计算时间。支持项式向量机的类型分类,还可以有助于解决更多用过的多项式向量分类系统中的支持向量分类问题的困难,对参数和核函数等选择敏感问题也有效。高斯过程理论是通过应用统计学中最基础的统计原理和贝叶斯过程理论相互结合进而发展的一种基于机器的深度学习计算方法,对于高概率维度、小规模样本和非线性等机器负责的大型回归计算问题来说则是比较受用的,泛化计算能力强,但是与人类神经网络、支持类的向量机器等相比,高斯过程往往因为存在更容易进行实现、超线性参数的自动相适应数据获取以及非线性参数机的推断灵活、输出参数具有较大概率计算意义等诸多优点。当然,支持自动向量机和高斯过程的模型中也是同样建立在不同的假设逻辑上的,这其中包含有很多相同模型特点的设计方法,支持向量机的一些优点往往在高斯过程中是完全没有的[12]。但是由于高斯论证过程中的模型输出是直接建立在基于概率的各种论证形式框架基础中的,所以他的概率预测模型输出都必须是通过各种概率的论证形式进行分布的,这也是我们所要对概率预测模型输出的数据可靠性问题进行的一个解释,另外,模型分析中的概率边缘分析提供了我们可以直接有效可以利用过程训练中的数据进行选择其他超概率参数的一种有效途径。因此,本文选择了高斯过程机器学习算法作为学习质量评价的模型。3数据采集和处理3.1评价数据采集评价试验数据使用2016级、2017级、2018级计算机科学与技术专业的三级学生数据来展开评价实验,并从以下几个方面获取相应的专业学生在高校接受教育期间所产生的各类数据,进而在此基础之上获得相应指标的原始数据。第一,在校期间大学生群体们的各科成绩包含选修新课程的成绩,此部分数据通过自动读取之后,便会存在教务管理系统当中相应的数据库文件中,所以需要在该数据库文件当中对于相关数据进行获取。第二,学生对于相关网络知识的实际掌握状况,用在校学生目前阅读的书籍数量来对其进行综合评价,考察学生在校期间是否阅读过相关书籍以及相应阅读者的数量,此部分图书数据可以通过图书信息管理服务系统当中的相关数据资料而得到。第三,对高校学生思想方面的指标进行数据的收集,首先是通过学校老师对于大学生课题的评价以及大学生群体之间的相互评价结果而计算出。最后,将教师与学生的评价结果有机联系到一起,作为大学生个体在该指标上的最终得分。第四,应当根据大学生个体参加创业或者通过参加比赛的实际情况来做出相应的统计数据,并从高校创业评审报告当中收集相应的资料来进行整理,对学生们的创业能力进行相应的评估。然后,再将评估结果纳入到大学生个体完成相应能力指标的平均分值中。最后,比赛需根据不同的学生类别来进行区分,对学生所获得的比赛分数实施级别化的划分,以便结合不同比赛的成绩级别而分出相对应的比赛分数。3.2数据预处理3.2.1原始数据通过学生成绩查询、读书情况调查以及学生评价、教师评价等方式获取了900条学生的原始数据,作为训练集,来对模型进行训练。训练集数据,如图3-1所示。图3-1训练集部分数据获取2016级计算机科学专业的学生在第一学年第一学期的学生成绩、教师评价读书情况、比赛成绩等200条数据作为测试集,如图3-2所示。图3-22016级计科专业学生部分数据为了实验的准确性,获取2017级计科专业的学生成绩、教师评价读书情况、比赛成绩等200条数据作为测试集作为对比实验,如图3-3所示。图3-32017级计科专业学生部分数据同样,获取2018级计科专业的学生成绩、教师评价读书情况、比赛成绩等200条数据作为测试集作为对比实验,如图3-4所示。图3-42018级计科专业学生部分数据3.2.2数据处理(1)评价指标的引入对于学生的学习质量评价指标的引入来说,由于影响因素有很多,所以我们需要一定的方法选择出最关键的指标作为评价指标[13]。根据评价指标,并结合学生学习质量的实际,制定出快捷、合理的指标评价体系,导致针对学生学习质量的评价分析能够有序的开展,鉴于此,经由对学习评价的精确性与合理性进行强化。评价指标体系正常情况下分成塔型结构和直线型结构两类。而在我们对学生学习质量的评价研究中,我们一般是采用塔型结构,先将需要评价的指标分成若干个一级指标,然后再根据具体的情况在一级指标的基础上再将指标分成若干个二级指标,以此类推,最终根据具体的问题要求,分成若干层级,在进行详细分析。学生学习质量评价的体系,如表3-3所示。表3-3学生学习质量评价体系一级指标二级指标学生学习成绩各科成绩学生对于相应知识的掌握情况阅读书籍数学生的思想素质教师对于学生的评价优秀率学生之间互评优秀率学生在校期间参加比赛比赛结果优秀率本文在采取学习评价期间经由分析分成了5个评分要求,同时会评价结果也划分为5个不同的等级,所有等级都分别对应一定的取值范围,如表3-4所示。表3-4学生学习质量评价等级标准对应表评价等级取值范围优秀90-100良80-90中等70-80合格60-70不合格60以下将获得的原始数据经行审核,判断数据的准确性。(4)预测数据归一化,对训练数据集进行归一化,得到的数据,如图3-5所示(以2016级计科专业学生的部分数据为例)。图3-52016级计科专业学生部分归一化数据

4学习质量评价模型的构建4.1高斯过程模型构建高斯过程机器学习算法对学习质量实施评价实验的环节如下所示,数据的收集与预处理,得到样品参数,选取模型的数据,进行模型训练和测试,保存高斯过程评价模型,做出学习质量评价。其流程如图4-1所示。图4-1高斯过程模型构建流程图(1)搭建一个训练数据集。设训练数据集{xi,ti},i=1^m,数据集当中是第i个样品的由于d个指标的数值,亦为高斯过程模型的输入。而除此之外,ti通常为与之对应的学习质量评价结果,也被当作高斯过程的模型输出,m是训练数据的集样品数[14]。(2)预测数据归一化,对训练数据集进行归一化,归一化公式(4-1)如下所示。(4-1)这其中分别代表着数据归一化前后的值,分别代表着样品参数里面的最小、最大值[15]。以95%置信度的置信区间为例当学习质量评价结果理论值落在高斯过程估计的置信区间内,证实高斯过程的最终结果可靠性高[16],公式(4-2)如下所示。(4-2)为了能够更为全面的测量出高斯过程模型的具体精度,通过支持向量机算法或者是BP神经网络而建立起相应的学习质量评价方法,并做出精度方面的比较。4.2BP神经网络模型构建BP网络是一种给予神经网络模型中比较完备的模型,它属于多层的前传网络。除此之外,在每个输入、输出层间皆可对隐含层进行设置,可以设置一个或者多个,而从这个信号来看,都是向前传播的,并不会带有反馈的曾内部互相联系的结构,当然,在进行参数调整的时候,算法则是对含有错误的偏移后并且将反向传播的过程也包含了进去[17]。通常情况下,用BP神经网络来对一个动态系统进行描述,指的即是直接让该模型系统当中的动态模型添加进来到一个机器深度学习中。对应用BP网络控制结构的分析评价结果图表及典型应用BP控制网络主要结构有三层控制结构,其具体如下:一是,输入控制层;二是,输出控制层;三是,隐藏控制层[18]。而BP基于网络的机器学习信息发展进化期间重点是从正向数据传输和反向的多媒体数据传输这两个部分共同组合而成。它的算法如下所示:采取随机数(正常情况下都是在0~1当中)初始化与,这里面的是神经元i至神经元j的连接权值,是神经元j的阈值。把已经进行提前处理的训练样本集与对应的期望输出集,这里面的p代表的是样本数,l则代表的是输入向量数[19]。第一步,计算各层神经元的输出针对输出层神经元,二者完全一样,即,其中为第p个样本的第i个值。第二步,计算各层神经元的误差信号输出层公式(4-3)如下所示。(4-3)隐含层公式(4-4)如下所示。(4-4)修正权重公式(4-5)如下所示。(4-5)第三步,计算误差,公式(4-6)如下所示。(4-6)倘若Er在给定拟合误差的范围当中,则网络训练结束。否则,应当继续转回至第二层,重新进行训练。第四步,评价指标的标准化由于在评价指标机制当中,是目前已有的定性指标还存在定量指标,这将会使得全部指标在该系统当中存在可比性,所以需要对该指标进行标准化的处理[20]。第五步,定量指标由于此处的衡量单位有所差异,他们的极差也是有大有小的,其趋势也不是也别稳定,故而应该对定量指标做出一定的处理工作,使其更加稳定并趋于一致[21],处理方法如下:当目标越大评价越好时,公式(4-7)如下所示。(4-7)当目标越小评价越好时,公式(4-8)如下所示。(4-8)当中,为目标值;为标准化值;j是评价指标的数量;、是预先确定出来的,分别是第j个指标的最小值和最大值[22]。第六步,定性指标结合定性指标可将其量化处理,此处的针量化方法相对来说比较多,平时经常会采取的是专家评分法,为了可以把定量指标间具有相对的可比性,应当把它做好标准化工作,处理的形式和其他形式存在一定的共通之处[23]。4.3支持向量机算法模型构建评价模型能够体现出评价X和Y当中的联系,但是由于学习质量中的评价要素和评价目标往往存在着相对复杂的关系,容易导致在我们根据学习质量的特点和学习质量评价的可操作性来看,评价的目标和要素之间都是采用多元线性关系来进行对应表示的。另一方面,在学习质量评价时,无论是评价要素的向量还是评价目标的值,都是通过测量得到的最终数据,由于我们的受评主体是学生,就会受到客观因素的影响,但是往往还是会存在着或多或少的差异。所以,为了尽可能的在建模过程中消除测量的随机误差带来的影响,我们则一般都是采用最小二乘法的原理来建议建立评价目标Y与评价要素向量X之间的多元线性关系模型。假设评价目标Y与评价要素X之间的多元线性回归模型,公式(4-9)如下所示。(4-9)其中,和是第i组测量的评价目标和评价要素。而参数集则是评价目标、要素的关系。表示第i组残差。因此,只要计算出参数集就可以得到教学质量的评价模型,根据最小二乘法原理,使残差平方达到最小,公式(4-10)如下所示。(4-10)根据方程组公式(4-10)定义矩阵,公式(4-11)如下所示。,,(4-11)(公式4-10)可以用矩阵表示成只要样本的数量足够多,一般大于60,就可以保证为非奇异矩阵,因此,参数集为公式(4-12)如下所示。(4-12)这样就可以得到学习质量评价模型:

5实验流程5.1实验设计Matlab是美国MathWork开发的以矩阵计算为基础的科学和工程计算软件,它具有方便绘图、计算功能强、编程效率高、使用简单方便、易于扩充等特点,使用Matlab减少训练程序工作量,有效的提高工作效率,所以本实验使用了Matlab作为实验环境。首先,根据第三章数据指标的设计得到原始数据,再将原始数据进行归一化处理,设置高斯过程的置信区间,训练算法函数设定学习速率、学习次数和误差精度,开始进行高斯过程训练,当得到的误差满足要求或者训练次数达到最大时,停止训练并生成相应的神经网络模型,然后读取测试数据,对测试数据进行仿真计算。5.2实验过程及结果5.2.1高斯过程模型实验过程及结果Matlab软件自身所带的高斯过程的工具箱已经十分完善,我们可以根据我们自身的需要来通过自己的数据得到相应的模型,可以根据我们的需要来更改相应的核函数等参数,也可以设置自动优化超参数来得到模型最优的超参数,在实际的使用过程中十分便捷。可由以下的几个步骤来得到相应的结果:(1)数据的获取:可以将已有的数据划分为训练集和测试集,并将训练集与三级同专业学生所组成的测试集的输入输出表示出来。可通过Matlab的读取数据以及数值矩阵操作来得到相应的结果。(2)高斯过程模型的建立:可通过Fitrgp函数来训练得到相应的高斯过程模型,根据训练样本的输入P和输出T来获得。对于超参数的选取Fitrgp函数默认使用贝叶斯优化来得到最优超参数。(3)模型测试:通过函数Predict函数来实现。对三个不同测试集分别使用Predict函数,来得到预测的学习质量值。(4)误差比较:计算三个不同的测试集的MSE误差,并且计算出每个测试集样本的绝对值误差。高斯过程的实现过程为首先从Excel数据中获取我们需要的900个训练数据,并再获取三个同专业不同级学生的测试集数据。通过高斯过程模型获取预测值。部分主要的代码如下所示:data=xlsread('data.xls'); (获取训练数据)testdata1=xlsread('2016.xls'); (获取2016级学生测试数据)testdata2=xlsread('2017.xls');(获取2017级学生测试数据)testdata3=xlsread('2018.xls');(获取2018级学生测试数据)P=data(1:900,2:13);T=data(1:900,14);test1_P=testdata1(:,2:13);test1_T=testdata1(:,14);test2_P=testdata2(:,2:13);test2_T=testdata2(:,14);test3_P=testdata3(:,2:13);test3_T=testdata3(:,14);gprMdl=fitrgp(P,T);(利用训练集训练高斯过程模型)[ypred1,delta1,yint1]=predict(gprMdl,test1_P);(预测2016级学生数据)[ypred2,delta2,yint2]=predict(gprMdl,test2_P);(预测2017级学生数据)[ypred3,delta3,yint3]=predict(gprMdl,test3_P);(预测2018级学生数据)result1=[delta1,yint1];disp('test1方差test1置信区间')disp(result1)result2=[delta2,yint2];disp('test2方差test2置信区间')disp(result2)result3=[delta3,yint3];disp('test3方差test3置信区间')disp(result3)figure (绘制2016级预测对比曲线)plot(test1_T,'r.');holdonplot(ypred1,'b');figure (绘制2017级预测对比曲线)plot(test2_T,'r.');holdonplot(ypred2,'b');figure(绘制2018级预测对比曲线)plot(test3_T,'r.');holdonplot(ypred3,'b');E1=abs(test1_T-ypred1);(2016级测试集绝对值误差)E2=abs(test2_T-ypred2);(2017级测试集绝对值误差)E3=abs(test3_T-ypred3);(2018级测试集绝对值误差)MSE1=mse(E1);disp(MSE1)(2016级测试集的MSE误差)MSE2=mse(E2);disp(MSE2)(2017级测试集的MSE误差)MSE3=mse(E3);disp(MSE3)(2018级测试集的MSE误差)figureplot(E1,'r','LineWidth',0.5);(绘制2016级误差曲线)plot(E2,'b','LineWidth',0.5);(绘制2017级误差曲线)plot(E3,'k','LineWidth',0.5);(绘制2018级误差曲线)通过以上实验过程,得到的2016级计科专业学生成绩预测结果,如图5-1所示,从图中可以看出期望值和预测值基本一致,初步证实模型的可靠性。图5-12016级学生高斯过程测试图同样的,根据上述实验过程,得到2017级计科专业学生成绩预测结果,如图5-2所示,从图中也可以看出期望值与预测值基本一致,进一步证实了模型的可靠性。图5-22017级学生高斯过程测试图根据上述实验过程,得到2018级计科专业学生成绩预测结果,如图5-3所示,从图中也可以看出期望值与预测值基本一致,证实了模型的可靠性。图5-32018级学生高斯过程测试图2016级、2017级、2018级计科专业的学生各个方面成绩组成的测试集的绝对值误差,如图5-4所示:图5-4高斯过程绝对值误差图并且通过程序可得MSE值为:2016级计科专业的MSE:4.4301e-07;2017级计科专业的MSE:9.6298;2018级计科专业的MSE:1.5106e-06。通过上述实验结果可知,高斯过程模型预测的准确率较高,基本与真实值相吻合。为了对比高斯过程模型的效果,现使用另外两种机器学习模型来对同样的训练集与测试集做计算,对比预测的效果与误差。5.2.2支持向量机模型实验过程及结果先使用SVM支持向量机模型来测试预测的效果,对于本文的数据回归问题,使用Matlab来实现支持向量机的回归计算。可通过Matlab自带的工具箱函数来实现,部分主要代码如下所示:data=xlsread('data.xls');(读取训练集数据)testdata1=xlsread('2016.xls');(获取2016级学生测试数据)testdata2=xlsread('2017.xls');(获取2017级学生测试数据)testdata3=xlsread('2018.xls');(获取2018级学生测试数据)P=data(1:900,2:13);T=data(1:900,14);test1_P=testdata1(:,2:13);test1_T=testdata1(:,14);test2_P=testdata2(:,2:13);test2_T=testdata2(:,14);test3_P=testdata3(:,2:13);test3_T=testdata3(:,14);Mdl=fitrsvm(P,T);(训练SVM模型)ypred1=predict(Mdl,test1_P);(预测2016级学生学习质量)ypred2=predict(Mdl,test2_P);(预测2017级学生学习质量)ypred3=predict(Mdl,test3_P);(预测2018级学生学习质量)figureplot(test1_T,'r.');holdon;plot(ypred1,'b');(绘制2016级预测对比曲线)figureplot(test2_T,'r.');holdon;plot(ypred2,'b');(绘制2017级预测对比曲线)figureplot(test3_T,'r.');holdon;plot(ypred3,'b');(绘制2018级预测对比曲线)E1=abs(test1_T-ypred1);(计算2016级绝对值误差)E2=abs(test2_T-ypred2);(计算2017级绝对值误差)E3=abs(test3_T-ypred3);(计算2018级绝对值误差)MSE1=mse(E1);MSE2=mse(E2);MSE3=mse(E3);(计算三个测试集MSE误差)figureplot(E1,'r','LineWidth',);(绘制2016级误差图像)holdon;plot(E2,'b','LineWidth',0.6);(绘制2017级误差图像)holdon;plot(E3,'k','LineWidth',0.6);(绘制2018级误差图像)由以上过程可以得到的2016级计科专业学生学习质量的预测结果,如图5-5所示,从图中可以看出,该模型的实验存在一定的误差。图5-52016级学生SVM预测图同样的,由以上过程可以得到的2017级计科专业学生学习质量的预测结果,如图5-6所示,由图可以看出,该模型存在明显误差。图5-62017级学生SVM预测图由以上实验过程也可以得到的2018级计科专业学生学习质量的预测结果,如图5-7所示,由图可以看出,该模型存在明显误差。图5-72018级学生SVM预测图3个测试集的SVM模型绝对值误差,如图5-8所示,从图中可以看出支持向量机模型的误差值比较大。图5-8SVM绝对值误差图程序输出的MSE误差结果为:2016级MSE:0.0605,2017级MSE:0.0372,2018级MSE:0.0396。通过与高斯过程的结果作对比,我们发现SVM的预测结果虽然与真实值的吻合度较高,但有少数点明显未与真实值项重合。通过绝对值误差图可以看出,高斯过程的预测精度更高,高斯过程模型的样本的绝对值误差在10-4以下,而SVM模型在0到0.8之间。SVM模型MSE误差值也远远高于高斯过程模型的MSE值,高斯过程模型两个测试集在10-7,而SVM模型的MSE值为0.05左右。5.2.3BP神经网络模型实验过程及结果现使用BP神经网络来计算预测值。BP神经网络在回归预测中表现出强大的学习能力以及较为广泛的使用人群。Matlab提供了BP神经网络的建立函数以及训练函数。Bp神经网络部分主要代码如下所示:data=xlsread('data.xls');(读取训练集数据)testdata1=xlsread('2016.xls');(获取2016级学生测试集数据)testdata2=xlsread('2017.xls');(获取2017级学生测试集数据)testdata3=xlsread('2018.xls');(获取2018级学生测试集数据)P=data(1:900,2:13)';T=data(1:900,14)';test1_P=testdata1(:,2:13)';test1_T=testdata1(:,14)';test2_P=testdata2(:,2:13)';test2_T=testdata2(:,14)';test3_P=testdata3(:,2:13)';test3_T=testdata3(:,14)';hiddennum=5;(设置神经网络隐藏层层数)net=newff(P,T,hiddennum,{'tansig','purelin'},'trainlm');(创建BP神经网络)W1=net.iw{1,1};(输入层到中间层的权值)B1=net.b{1};(中间各层神经元阈值)W2=net.lw{2,1};(中间层到输出层的权值)B2=net.b{2};(输出层各神经元阈值)net.trainParam.epochs=1000;(训练次数,这里设置为1000次)net.trainParam.lr=0.01;(学习速率,这里设置为0.01)net.trainParam.goal=0.00000001;(训练目标最小误差)[nettr]=train(net,P,T);(训练BP神经网络模型)figure(1)plotperform(tr);(绘制迭代误差图)ypred1=sim(net,test1_P);(2016级学生预测值)ypred2=sim(net,test2_P);(2017级学生预测值)ypred3=sim(net,test3_P);(2018级学生预测值)figureplot(test1_T,'r.');holdon;plot(ypred1,'b');(绘制2016级预测对比图)figureplot(test2_T,'r.');holdon;plot(ypred2,'b');(绘制2017级预测对比图)figureplot(test3_T,'r.');holdon;plot(ypred3,'b');(绘制2018级预测对比图)E1=abs(test1_T-ypred1);(2016级绝对值误差)E2=abs(test2_T-ypred2);(2017级绝对值误差)E3=abs(test3_T-ypred3);(2018级绝对值误差)MSE1=mse(E1);(2016级MSE误差)MSE2=mse(E2);(2017级MSE误差)MSE3=mse(E3);(2018级MSE误差)figureplot(E1,'r','LineWidth',0.5);holdon(绘制2016级误差图)plot(E2,'b','LineWidth',0.5);holdon(绘制2017级误差图)plot(E3,'k','LineWidth',0.5);(绘制2018级误差图)由以上实验过程可以得到的2016级计科专业学生学习质量的预测结果,如图5-9所示,由图可以看出,该模型存在明显误差。图5-92016级学生BP神经网络预测图同样的,由以上实验过程可以得到的2018级计科专业学生学习质量的预测结果,如图5-10所示,由图可以看出,该模型存在明显误差。图5-102017级学生BP神经网络预测图由以上实验过程可以得到的2018级计科专业学生学习质量的预测结果,如图5-11所示,由图可以看出,该模型存在明显误差。图5-112018级学生BP神经网络预测图由实验可以得出神经网络迭代误差,如图5-12所示。图5-12BP神经网络迭代误差图可以看出随着迭代次数的增加,模型本身的误差在降低。BP神经网络绝对值误差,如图5-13所示。图5-13BP神经网络绝对值误差图三个测试集的MSE误差为:2016级MSE:0.0300,2017级MSE:0.3090,2018级MSE:0.0067。可以通过三个测试集的预测值看出除了极少数的点外,大部分的样本预测值与真实值相吻合。通过直接比较三个模型的预测误差来看,高斯过程表现最佳,MSE误差远远小于SVM模型与BP神经网络模型。也验证了高斯过程模型在学习质量评价模型中的优越性。5.3实验分析根据以上步骤,最后可以得出高斯过程、BP神经网络、支持向量机模型对学习质量进行评价的误差,其中对2016级计科专业学生学习质量评价的误差,如图5-14所示,由图可以看出高斯过程误差更小,更适合本次实验。图5-142016级实验结果误差图将模型误差生成折线图,可以明显的看出高斯过程的误差比BP神经网络、支持向量机更小,如图5-15所示,蓝色表示高斯过程模型误差,橙色表示支持向量机模型的误差,绿色表示神经网络模型的误差。图5-152016级实验结果误差折线图同时,对2017级计科专业学生学习质量经由高斯过程、BP神经网络、支持向量机模型的评价得到的误差结果,如图5-16所示,从图中也可以看出高斯过程模型的误差更小。图5-162017级实验结果误差图将模型误差生成折线图,也可以明显的看出高斯过程的误差比BP神经网络、支持向量机更小,如图5-17所示,同样,蓝色表示高斯过程模型误差,橙色表示支持向量机模型的误差,绿色表示神经网络模型的误差。图5-172017级实验结果误差折线图对2018级计科专业学生学习质量经由高斯过程、BP神经网络、支持向量机模型的评价得到的误差结果,如图5-18所示,进一步证实了高斯过程更适合本实验,可靠性更强。图5-182018级实验结果误差图将模型误差生成折线图,也可以明显的看出高斯过程的误差比BP神经网络、支持向量机更小,如图5-19所示,同样,蓝色表示高斯过程模型误差,橙色表示支持向量机模型的误差,绿色表示神经网络模型的误差。图5-192018级实验结果误差折线图综上所述,我们可以得出由于高斯过程模型稳定性强、误差小、精度高等优点,所以它更适合用于学生的学习质量评价实验当中,其结果稳定性更高,更能反映出学生的学习质量。

6总结与展望6.1总结 总而言之,高斯过程同时间序列相比较而言,其对于序列的拟合效果往往要更好一些。因此,所得出的预测

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论