学生成绩综合评价模型(数学建模).doc_第1页
学生成绩综合评价模型(数学建模).doc_第2页
学生成绩综合评价模型(数学建模).doc_第3页
学生成绩综合评价模型(数学建模).doc_第4页
学生成绩综合评价模型(数学建模).doc_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学生学习状况评价与预测摘要随着社会办学规模的不断扩大,教学质量的保证和提高问题日益凸显,各种教学研究和教学实践层出不穷,但是学生学习状况的评价作为提高教学质量和激励学生努力学习的重要手段,却没有得到应有的重视,传统的评价方法忽略了学生基础条件的差异,并不能对学生的学习状况进行全面、客观、合理的评价,因而,建立一种科学的评价方法势在必行。本文首先通过分析附件中的612名学生四个学期综合成绩,发现成绩会根据试题的不同导致分布状态的变化,利用SK 法,Q-Q图检验为负偏态分布。所以首先利用转化函数将所给的成绩进行标准化使得标准化后的成绩能够满足统一的正态分布曲线,去除了试卷难度对于学生的影响。然后在对学生学习状况的评估中,建立了模糊综合评价模型、基于层次化分析的模糊评价的改进模型、数据包络分析法(DEA),这三个评价模型进行评价。基于层次化的模糊评价模型是模糊分类模型的改进,通过层次分析的方法能够得到可行科学的评估权值,利用标准化的成绩能够得到每个学生的评估总分,并不是模糊分类模型中量子化的得分。而DEA法主要注重的是成绩的稳定上升,是对于前两种模型的补充。在预测过程中我们运用了线性回归预测模型、模糊分析预测模型、GM(1,1)成绩预测模型、ARIMA(0,1,1)成绩预测模型,通过预测结果我们发现,在假设学生学习状况不变的情况下模糊分析预测模型的预测结果良好,可以很好的反映学生的动态的进步情况,而GM(1,1)的预测结果很差,不推荐使用。如果考虑实际学生成绩波动和季节性变化的影响,则需要使用ARIMA(0,1,1),实际中这个模型的预测结果最好。 预测成绩表学生序号 1 2 3 4 5 6 7 8 9 10第5学期 74.64 81.18 66.64 77.48 78.72 76.34 67.78 59.03 67.43 70.71第6学期 77.97 78.96 69.71 76.67 77.82 75.61 68.37 60.06 71.92 70.11 最后,我们对我们所建立的模型进行了客观的比较,并对其应用前景进行了展望。关键字: 标准化 模糊综合评价模型 层次分析 DEA 线性回归预测模型 模糊分析预测模型 GM(1,1) ARIMA(0,1,1)2 问题的重述正确地、科学的评价学生的学习状况对于学校的教学工作至关重要,它是学生认识自己的前提条件,是激励学生努力学习不断进步的动力,同时也是教师培养学生的参照基础。然而,现行的评价方式单纯的根据“绝对分数”评价学生的学习状况,忽略了基础条件的差异;只对基础条件较好的学生起到促进作用,对基础条件相对薄弱的学生很难起到鼓励作用。在本题中,附件给出了名学生连续四个学期的综合成绩。要求我们做到以下三点:1.根据附件数据,对这些学生的整体情况进行分析说明;2.根据附件数据,采用两种及以上方法,全面、客观、合理的评价这些学生的学习状况;3.根据不同的评价方法,预测这些学生后两个学期的学习情况。2 问题的分析 1、首先我们通过原始数据可以做出其基本的统计量和直方图。考虑到在学生成绩评价中会收到试卷难度等因素的影响。所以必须得构造转化函数将所给的成绩进行标准化使得标准化后的成绩能够满足统一的正态分布曲线,去除了试卷难度对于学生的影响。 2、在学生整体成绩评估中,我们可以分析学生成绩平均值和稳定度的关系、分析学生成绩段人数、分析学生整体进步度、分析基础成绩对于总成绩的影响。3、对于构造模型对学生学习状况进行合理有效的评估,我们可以利用模糊综合评价模型、层次化分析法、数据包络分析法(DEA)这三个评价模型进行评价。4、对于成绩的预测,我们可以想到基本的几个预测模型:线性回归预测模型、模糊分析预测模型、GM(1,1)成绩预测模型、ARIMA(0,1,1)成绩预测模型,每个模型的着重点都不一样,这样对于从不同方面解决问题有着很大的帮助。3模型的假设1、假设每个学期的综合成绩的满分为100分2、假设每个同学的学习能力基本不变3、假设附件数据中的两个零是由特殊情况所致4、假设每个学生处于相同的考试环境中5、假设附件中所给数据为学生真实考试成绩,不存在作弊问题的影响6、以后两个学期与前面四个学期采用同样的记分方式7、在模糊预测模型中我们假设两个学期学生的学习状况是不变的4符号的说明 : 学期 : 学生序号D: 总评价得分: 第i个学生的第j学期的原始成绩。: 第个决策单元: 因素集 : 评语集 其他主要符号将在模型建立的时候详细说明。5 模型的建立5.1 数据标准化 为了避免现行评价方式中仅根据“绝对分数”评价学生学习状况,设计出一种新型的发展性目标分析法,必须考虑到户律基础条件的差异,学生原有的学习基础,也注意到学生学习的进步因素。 首先注意到题干中所给出的数据为学生四个学期的分数,由于在实际中,如果单单注意绝对分数的话,由于试卷的难度的不同,会导致单纯通过题干给出的数据信息进行分析肯定是不准确的。 根据教育学与统计学的理论,一次难度适中信度可靠的考试,学生的成绩应接近正态分布。也就是说,当学生的成绩接近于正态分布时,说明此次考试基本达到了教学要求。判断成绩是否接近正态分布最直观,最有效的方法就是将成绩分布曲线与均值和方差相同的正态分布曲线加以比较。 如果是负偏态分布,则说明试题总体难度偏高。如果是正偏态分布,则说明试题总体难度偏低。如果是陡峭型分布,则说明试卷中难度中等的度量占比重太大。 这样首先做出所给数据中四个学期成绩的直方图和原始成绩的统计分析,其中实线表示正态分布的曲线,直观的说明所给成绩为偏正态分布。这样我们的目标就变为构造一种变换使学生每个学期的成绩符合相同的正态分布曲线,这样也就能将试卷难度等影响消去,才能对所给的每个学期的成绩相互之间进行比较。 其次对原始数据进行SK检验得:第一学期第二学期第三学期第四学期Sk-1.236-1.919-1.944-2.928Ku2.57.0438,14214.479这样通过以上的分析,我们可以发现,直方图在标准正态分布曲线的右边,且Sk0,则都属于负偏态分布,说明试题的总体难度是偏低的。而且根据Ku值渐渐变大可以发现试题中中等难度的题目越来越多了。根据其平均值和方差可知:学生在第四学期的平均成绩最高,其次是第二学期,第一学期和第三学期的平均成绩略低一些;但是从方差来看,第一、三学期低于第二、四学期,这从上图中也可以明显看出,第一、三学期学生的成绩分布要比第二四学期学生的成绩分布要集中。那么下面我们构造一种方法使得每个学期学生转化后的成绩符合相同的正态分布曲线。定义:(i=1,2n)为n个学生的某一学期的原始成绩。,这样就可以将一个偏正态分布转变成了满足的正态分布,由于该函数单调递减函数,原始成绩高的反而变得成绩低了,为和传统保证一致,进行以下变换。这样就能得到一个满足标准正态分布的数据了。下面通过坐标的偏移拉伸使得其满足相同分布的正态分布。的方差为:,得到,这样均值就偏移到了x=0处,且标准差为1。作出的直方图如下:利用Q-Q图检验其正态性得:说明其具有良好的正态性,那么数据的标准化和检验均告完成,这样就去除了试卷难度等客观因素导致成绩分布不合理产生的误差。下面就可以根据已得到的标准化数据对于学生成绩进行评估。5.2学生整体状况的分析(1)分析学生成绩平均值和稳定度的关系根据已经标准化的成立,利用平均成绩与方差所联合做成的散点图,我们可以看出,大体的情况是,多数同学的成绩还是比较稳定的,就是个别同学,成绩起伏很大,并且大致趋势为,成绩越好的同学波动越小,相反,成绩不好的同学波动就很大。(2)学生成绩段人数分析由于这里要进行学生成绩段的分析,就不能使用已经标准化的成绩了,显然如果使用标准化后的数据,则数据基本满足标准正态分布,这样进行成绩的分段研究也就失去了意义。对原始数据进行成绩的分段分析得:成绩人数学期123490分以上0210 8090分1382041291947080分2752463032876070分14011014410560分以下59503526 通过以上分析我们了解到:第二学期和第四学期80以上的学生要明显高于第一学期和第三学期,而70分以下的学生数量要低于第一学期和第三学期,这就使得第二、四学期学生的平均成绩要高于第一、三学期。而且不及格人数约来越少,成绩分布约来越集中,这正好和5.1中SK分析得到的结果一致,也就是陡峭度越来越大。从饼状图中还可以看出,成绩的分布渐渐朝着高分发展,这与SK分析中Sk值渐渐减小也是相一致的。显然在这一步的分析中,造成这个结果的产生,可能因为试卷的原因,也可能是学生们通过学习进步的结果。(3)学生整体进步度分析首先对标准后数据进行差分处理,计算出差分后的平均值,即平均进步率。作出其平均分数和平均进步率的散点图,如下:由图可见,在平均值为0处,即成绩中等的同学中,会出现进步和退步较快的同学,而在成绩较好的同学部分,成绩进步不大,在成绩较差的部分,退步的同学相比进步的同学较多。 (4)基础成绩对于总成绩的影响分析将第一学期的成绩看作是学生的基础成绩,作出基础成绩和总成绩的散点图:我们可以看出数据点大致看来成线性,所以,入学基础对大学读书影响还是比较大的。5.3评价学生的学习状况(1)模糊分类综合评价模型根据5.2中我们发现评定学生学习状况的依据有,学生的平均分,学习波动度,进步度。下面从三个方面对学生进行综合评定。设:第i个同学的因素集=平均分,学习波动度(标准差),平均进步率,评语集=优,良,中,差对于每名学生基于其四个学期成绩及成绩变化做单因素评价:首先我们确定优良中差的比例固定为1:4:4:1,这样就能使学生评价处于平均,增强学生的学习动力。1、对于平均分因为不同基础的同学对某一得分同学的评价不同,所以当一名学生得 60 分时,得分大于80 分的同学会认为其基础差。所以对学生的分数进行优良中差的比例分类: 评者被评者1.122.5001.12-1.070-3.65-1.071.122.50良0.1优0.4优0.4优0.101.12中0.1良0.4优0.4优0.1-1.070差0.1中0.4良0.4优0.1-3.65-1.07差0.1差0.4中0.4良0.1得到的单因素评价向量为:,分别为优良中差的权重2、 对于标准差得: 评者被评者00.2060.2060.4130.4130.7500.7502.00000.206良0.1优0.4优0.4优0.10.2060.413中0.1良0.4优0.4优0.10.4130.750差0.1中0.4良0.4优0.10.7502.000差0.1差0.4中0.4良0.1得到的单因素评价向量为:,分别为优良中差的权重3、 对于平均进步率得: 评者被评者0.3170.90.0090.317-0.3170.009-1.14-0.3170.3170.9良0.1优0.4优0.4优0.10.0090.317中0.1良0.4优0.4优0.1-0.3170.009差0.1中0.4良0.4优0.1-1.14-0.317差0.1差0.4中0.4良0.1得到的单因素评价向量为:,分别为优良中差的权重这样得到单因素评价矩阵: 考虑到对于差生的鼓励作用,我们认为平均进步率和平均成绩甚至比平均成绩更加重要,这样我们将三个因素分配权重为: C=(0.4, 0.1, 0.5)做模糊变换: 这样就能得到特定同学的评价向量了。在对其总分进行加权分析得:学生总评价分由于总评价分是在区间0,3上的,所以可以划分为4类:9/4,3,3/2,9/4,3/4,3/2,0,3/4分别为优良中差。下面计算前10名同学的评价向量和总评价分:数据为:可以得到第一名学生的这样=(0.3, 0.4, 0.25, 0.05) =1.95 所以第一名学生的评价应该为良利用Matlab通过以上方法对所有数据进行求解得:(仅列出前10名同学的数据)学号前十的学生的综合评价排名为:我们可以发现,由于构造加权系数的时候,我们在学生的优良中差的比例设置中将良和中的比例设置的比较高,这样导致了我们得出的分类评价中良和中比例比较高。这样也符合教师评价学生的一般规律。(2) 基于层次化分析的模糊评价的改进模型 在5.3.1中我们发现上述的模型建立会出现如下问题:1、 在5.3.1中,对于数据的结果我们发现,虽然我们求出了学生总评价分,但是是一个类似量子化得值,这是由于我们在模型建立的第一步就已经将各种成绩的数据进行了分类。这样由于的值的影响,我们会发现很多通过已给的成绩可以比较相互之间差异的同学,我们通过的值发现两者的学习状况是一样的,这显然是有问题的。那么我们可以很容易的想到直接利用所得到的标准化的成绩进行分析。2、 在5.3.1中我们了解到所给的权值都是我们自己预设的,这样的科学根据显然是不精确的,这样我们想到了利用层次分析法对权值进行估计。3、 在5.3.1中,我们对于每个学期成绩的影响视为完全相同的,这显然是不精确的,在实际问题中,对于当前学生学习成绩的评估,最近一次的成绩当然是更加重要的。 这样我们可以得到分析所用的层次图:首先对数据进行处理,由于评分的原因,不论是哪一学期的成绩还是进步度,抑或标准差,他们的单位首先是要统一的,我们将每组数据都除以改组数据的最大值,这样就能将他们的数据的满分设为1,这样总体评价分的满分也设置为1了。得到处理后的数据为:下面根据层次分析法进行权值分析:设第i名学生的j个学期的成绩为,第k次成绩进步度为,标准差为首先是第一层:同样是为了鼓励学生,我们设学生进步情况比学生成绩情况稍强,设为2;学生成绩情况比成绩波动性明强,设为5,学生进步情况比成绩波动性设为6;这样可得到比例矩阵为; 这样通过matlab可得最大特征根 max = 3.0291得到第一层权值向量为W1=(0.3420 0.5769 0.0811)通过检验得: CR=CI/RI=0.010420.1 检验正确可行其次对第二层进行分析:设每学期对于学生总体成绩评价的影响度逐步提升,得到:同样可得:最大特征根 max = 4.0310得到第二层成绩权值向量为W2=( 0.0954 0.1601 0.2772 0.4673)检验可行性成立同样成绩进步度对于成绩进步情况的影响逐步提升,得到:同样可得:最大特征根 max = 3.0092得到第二层成绩权值向量为W3=(0.1634 0.2969 0.5396)检验可行性成立综上所述:准则层成绩进步程度基础单排序0.34200.57690.0811子准则层成绩1成绩2成绩3成绩4进步1进步2进步3单排序0.09540.16010.27720.46730.16340.29690.5396设612位同学的成绩向量,进步向量,波动性向量分别为:总成绩评价为:得到评价如下表,通5.3.1的流量中差比例为1:4:4:1进行分类得到:学号总体评价分类学号总体评价分类学号总体评价分类10.0426良11-0.0925中21-0.0152中20.0013中12-0.1179中220.1865良3-0.0693中130.1696良230.0115中40.0996良14-0.0229中24-0.0146中50.1499良150.0802中250.1056中60.0141中160.1909良26-0.2125差7-0.106中170.0417中27-0.1062中8-0.4667差18-0.131中28-0.2144差9-0.0492中19-0.0283中29-0.0879中10-0.0654中20-0.028中30-0.0864中得到学号前十的同学的排名为:并发现学号为539的学生学习情况最好,调出其原始数据:学生序号学期1成绩学期2成绩学期3成绩学期4成绩53986.583 82.741 79.553 89.625 可以发现其平均成绩较好,而且在第四学期成绩有了很好的提升,这使得其在综合评价的过程中,由于第四学期的成绩和进步的权重较高,这样该生的学习状况非常好。与5.3.1中的模型结果加以比较,可以发现:两者的分类情况基本是一致的,对比前10名同学的情况,发现2,3,6,7,9,10的同学,在评价时其分类由良变成了中,这是由于其第四学期的成绩不理想造成的,而在这个动态评价模型中,第四学期的权重是相当高的,这样才导致了这些同学的综合评价的下降。(3) DEA方法评价模型DEA评价模型是数据包络分析方法,它的功能是“评价”,特别是进行多个同类样本的“相对优劣性”的评价,它根据一组关于多输入多输出的观察值来评估有效性。DEA评价方法的原理:设有n个同类决策单元,每个决策单元都有种类型的输入(表示对资源的耗费)以及种类型的输出(表示消耗了“资源”之后表明成效的信息量)。其中第个决策单元的投入向量为,产出向量,为的生产活动。为对第种类型输入的投入总量,;为对第r种类型输出的产出总量,本文采用DEA的线性规则形式、对决策单元的规模有效性和技术有效性同时评价的DEA模型。基于输入的DEA方法模型。对决策单元的模型可以表示为: 其中分别为元素均为的维向量和维向量,表示阿基米德无穷小量,是松驰变量。设以上线性规划的最优解为,则有:1) 若的分量存在非零值,则为有效()。表示的生产活动同时为技术有效和规模有效,各种资源得到充分利用;如果某个的分量大于,则表示某种输出指标还有增大的可能。2) 若则为DEA有效()。表示的生产活动同时为技术有效和规模有效,各种资源得到充分利用,取得了最大的输出效果。3) ,则为无效()。表示的生产活动既不是技术有效也不是规模有效,生产活动的输入规模过大,产出水平没有达到最佳规模。4) 若,则的规模效益不变,表示生产规模最佳。5) 若,则的规模效益递增,表示输出增量的相对百分比大于输入增量的相对百分比。6) 若,则的规模效益递减,表示输入增量的相对百分比大于输出增量的相对百分比。7) 设,,则()相对于原来的个是有效的。同样我们选取了前十个学生的学习状况作为研究的对象,并对其进行了计算评价,而后面的学生根据我们给出的评价原理可以依次进行评价。在我们建立的这个评价模型中,我们把前两学期的学习成绩作为学生的学习基础,即输入因子;把后两学期的学习成绩作为学生成绩的预测评价值,即输出结果,通过软件进行计算推导,得出每个学生的评价值,即可判断后两学期的学习情况。研究学生成绩时,将每一名学生看作一个,因此我们可以得到下表:DMU输入因子输出因子DMU1 0.65246-0.14519-0.019690.04971DMU20.19651-0.293750.89342-0.20989DMU3-1.1522-1.45022-0.67912-0.83416DMU41.254250.949480.273130.59153DMU50.256720.935370.424350.98828DMU60.54862-1.013560.20926-0.47184DMU70.28566-0.07246-1.16356-1.04802DMU8 -1.24528-1.51459-1.772-3.72172DMU9-0.524190.02465-0.4046-0.34685DMU100.14055-0.66180.11531-0.70687 序号12345678910效率值0.8740.91810.86210.9810.7430.8430.9520.907这样利用DEAP软件对于上述DEA模型进行求解,得到前十名同学的效率值为:如上表所示学号为3,5的同学效率值较高,用此方法排序为: 这样我们发现了一个问题,就是这种模型中效率的排序和上述模糊算法得到的结果有较大的差异。这是两个模型的着重点不同造成的。在模糊算法中,我们注重看重的是学生的进步,而在此模型中,我盟看重的是输入因子和输出因子的符合情况,也就是说看重的是学生成绩上升的平稳度是否良好,如果一个学生其成绩能够按照模型的轨迹既定平稳的上升,则认为其学习状况良好,这是这两个模型的侧重点不同造成的结果上的差异,但实际运用中,教师可以选择不同的参考点,对学生进行多方位的评价。5.4成绩预测模型 在成绩预测中,我们所要得到的是预测学生实际成绩,那么应该利用原始数据还是利用标准化之后的数据呢?由于在实际情况中,试卷会沿袭以往的情况出现负偏态分布,这样我们可以通过利用标准化的数据得到预测结果,再将成绩转化成负偏态分布。但是显然通过标准化和逆标准化转化是繁琐的没有必要的。所以我们采用原始数据进行预测,这样既减小了两次转化所带来的误差,也考虑到了试卷难度变化的影响,而且减少了计算的繁杂性。(1)线性回归预测模型通过speaman等级相关系数显著性检验分析得到下表,相关系数均大于0.5,说明不同学期之间的成绩具有高相关度。表明可以进行线性回归预测。由可知,当j=4时,利用前三个学期的成绩线性加权求得第四个学期成绩的预测值,通过最小二乘拟合求解系数a,b,c,d。如下图:得到方程为:通过此方程对于学生第5,6学期的成绩进行预测得到:学生序号学期1学期2学期3学期4学期5学期617974.82574.2976.9877.748878.8281275.62573.40357180.59127574.84577.533678.3788362.1203159.21428668.501886868.86570.551872.0101482.7583.20392976.506603880.8781.103682.0175576.183.11607177.575471783.29583.010683.8704678.27565.29464376.0472.4974.770675.8661776.32575.49285763.43566.50568.22869.7906860.9558.23214355.900943416.531.474333.6982969.1576.35714371.054952873.6474.789576.0048作出预测结果的直方图:从以上图表可以发现:1、 观察预测的第五学期和第六学期的数据可以发现,成绩总是向上增长的,这是线性回归模型所决定的,但是实际上并不是这种情况。在实际中我们发现,学生第二,第四学期的成绩较高,也就是说学生的成绩应该是波动的,这是这个模型中所存在的问题。2、 观察直方图我们发现,其满足负偏态分布,而且和前四个学期的分布曲线相似,这也是由于模型本身所决定的,在这个模型中由于各项成绩线性变化,显然分布曲线相似。在这一点上模型的符合是良好的。(2)模糊分析预测模型 基于5.3.2中层次化模糊评价模型,如果我们假设学生的学习状况能够保持一致不变,这样如果学习状况良好的同学显然在后面的学期中能够保持良好的增长态势,而学习状况不好的同学成绩会有回落的发生。 利用原始数据做出学生学习状况的评价表: 还是利用公式,这里考虑到标准差这个因素的影响较小可以忽略,将原式简化为:,其中W1=(0.4231 0.5769)但这里面的M,S向量均用原始数据代替得:学生序号总体评价学生序号总体评价学生序号总体评价学生序号总体评价132.54251127.55472131.84293132.2726231.50761229.13492235.97123229.0862329.59811335.06912332.60483331.8641434.19231431.42932427.73123431.938535.76161533.84872534.92423531.6261630.34481635.61012621.74723629.1808727.59531733.13962729.58563727.051583.30241827.57252823.66973830.3513931.43271931.66962929.18993934.39611029.31792030.09853028.05114031.1692现在总体评价向量D已知,我们利用D对第五,第六学期的成绩进行预测:假设第i个学生第j学期的成绩为,第j学期的成绩向量为,得:求解上述方程可得:从而可得第五,第六学期预测值为:学生序号学期1成绩学期2成绩学期3成绩学期4成绩学期5成绩学期6成绩17974.82574.2976.9876.64977876.6276206275.62573.403571480.5912874.84574.48617775.126194362.1203159.214285768.5018968.86568.74418469.7289972482.7583.203928676.506680.8780.99236180.3684222576.183.116071477.5754783.29584.19381983.7518247678.27565.294642976.0472.4971.15468372.1680959776.32575.492857163.43566.50566.33540365.1070934860.9558.232142955.9009416.514.41356613.3526969.1576.357142971.0549573.6474.42355373.94430441075.17569.526785775.3367970.1969.4699769.9589503做出预测后成绩的浮动图:从浮动图中我们发现:学生成绩浮动基本与上一学期的增长斜率相吻合,这很好的满足了该模型求解的原理。从浮动图中我们看到了第八名学生的成绩浮动比较不同,观察原始数据我们看到,第8名学生的成绩第四学期为16.5,由于本模型是根据前一学期的学习状况不变为首要条件求解的,在图上的反映为,第五第六学习该生的成绩仍然是下降的。再观察其他学生我们发现其预测成绩的波动基本沿着前一学期的学习状况进行的,这样也很好的符合了该模型的求解。但是我们发现最终的式子中,前三学期的成绩所占用的权值是十分小的,且浮动图中得到的预测成绩虽然有浮动,但是浮动也比较小,这样我们想到了灰色预测模型,GM(1,1)模型。(3)GM(1,1)成绩预测模型设学生前n学期的数据向量为:,作累加,生成数列,微分方程是1阶1个变量的微分方程模型,记为GM(1,1).为了辨识模型参数,在区间上,令=,=,则上式化为离散模型:记,一般可用最小二乘法求出的估计值,可以证明,当可逆时,有这样就得到了参数,带入微分方程:这样利用就能得到预测的结果了。利用matlab求解得到的预测结果和直方图如下:学生序号学期1成绩学期2成绩学期3成绩学期4成绩学期5成绩学期6成绩17974.82574.2976.9877.30378.148275.62573.4035714380.59127574.84586.81891.821362.120312559.2142857168.5018867968.86589.20792.95482.7583.2039285776.5066037780.8770.20366.343576.183.1160714377.575471783.29575.19272.725678.27565.2946428676.0472.4995.42108.34776.32575.4928571463.43566.50547.83741.113860.9558.2321428655.900943416.518.112.303969.1576.3571428671.0549528373.6464.84461.411075.17569.5267857175.3367924570.1979.48783.12从数据中我们发现,虽然GM(1,1)模型是根据前4学期的成绩来进行的预测,但是预测结果是很不正确的,比如:成绩中等学生的预测较为准确,但是对于成绩较差的学生,由于是利用最小二乘法求解,在求解的过程中出现了奇异矩阵,对于进步很明显的同学,预测的分数则可能超过了100分。在由直方图可以看出,其直方图的分布情况也不能满足前四个学期的负偏态分布,所以我们得到以下结论:对于GM(1,1)模型对于求解中等成绩学生的预测是准确的,但是对于有很大波动的学生,或者进步退步很快的学生的成绩预测会产生很大的误差,所以在这里不推荐使用GM(1,1)模型对学生成绩做以预测。上述两种模型都是根据前面的成绩对于后两学期进行预测,在本质上都考虑了学生的当前学习状况。但实际中我们发现,学生的学习状况是有波动的,正如原始数据揭示的那样,第1,3学期的成绩较差,第2,4学期的成绩较好,学生的成绩是根据季节性变化的,那么也就是说在此模型的假设中,假设根据前一学期学生的学习状况求后一学期的成绩并不是十分的准确,下面根据以上分析利用ARIMA(0,1,1)模型进行求解。(4)ARIMA(0,1,1)成绩预测模型AR模型:当序列中和有线性相关时,类似于y和x的线性相关,我们可以用线性回归方程表示和之间的关系:这样把分成了两个部分:一部分由过去值表示,另一部分独立于的随机剩余项表示,服从。这样建立了和自己过去的线性回归,称为自回归模型。如果为p阶自回归模型:,记为:MA模型:是移动平均模型。q阶MA模型,记为MA(q),观测值被描述为过去误差的线性回归:,记为。ARIMA模型,求和自回归-移动平均模型。记做,如果d阶差分,其中为的d阶差分,记做:ARIMA(p,d,q)。利用SPSS中自带的ARIMA模型,做ARIMA(0,1,1)预测:得到其数据:学生序号学期1学期2学期3学期4学期5学期617974.82574.2976.9874.641277.97623275.62573.4035714380.59127574.84581.1800378.96905362.120312559.2142857168.5018867968.86566.6452869.71355482.7583.2039285776.5066037780.8777.4830576.67274576.183.1160714377.575471783.29578.7264177.8289678.27565.2946428676.0472.4976.3496475.61883776.32575.4928571463.43566.50567.7832968.37253860.9558.2321428655.900943416.559.0303660.06752969.1576.3571428671.0549528373.6467.4385471.92371075.17569.5267857175.3367924570.1970.7097170.112在做出其浮动图和直方图得:通过上图我们发现:1、 在这个模型中,学生成绩的波动性得到了很好的体现,如波动图所示,成绩有着季节性的变化,观察第8名学生的成绩,我们发现,在第四学期,其成绩为16.5,但是预测中我们发现其成绩在第五学期并没有出现异常的情况,表明这个模型在一定程度上可以屏蔽原始数据奇异值的情况。2、 通过直方图我们发现,在这个模型中很好的吻合了负偏态分布,而且和前四个学期的分布曲线相一致。6模型的比较与应用下面我们对所给出的模型进行比较:在评估过程中我们运用了如下几个模型:(1)模糊分类综合评价模型首先利用已得到的标准化数据,求得所有学生的成绩平均值,学生的平均进步度,学生的波动度这三个影响学生学习状况的值。并对于这些数据进行优良中差的分类,接着人为的规定每个部分的权值,利用这个权值对于学生的学习状况进行模糊分类评估。优点:能够较精确的对学生的学习状况进行分类缺点:在权值的分配上是人为进行的,这是不科学的一种分配方法。 得到的总评价分由于数据在一开始就已经进行了分类处理,所以所得到的总评价分是一个量子化的值,这样就不能精确的对两两学生的学习状况进行比较。(2) 基于层次化分析的模糊评价的改进模型对于1中的缺点我们提出了基于层次化分析的模糊评价的改进模型。优点:在权值问题上

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论