阅卷评分系统的建立

上传人：为*** IP属地：中国上传时间：2020-06-02 格式：DOC 页数：14 大小：212.50KB 积分：20 举报 版权申诉

已阅读5页，还剩9页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

编号专用页论文编号：评阅记录：阅卷人评分备注阅卷评分系统的建立摘要客观评价一次考试或者考核成绩成为确定人才培养最终效果的重要依据。很多时候，我们的各项成绩确定往往需要多项指标共同确定，我们需要全方面的考虑评委的打分特点，因为每个评委都有自己的评分主观性，不可能绝对按照评分标准来评分，因此也就会产生由于评委个人原因而产生的偏差。针对问题一，我们需要建立一个随机分配模型。将所有论文随机排布，同时，我们将评委随机分为三人一组，然后将每一份试卷随机的分发给随机分的三人小组。当第一次分的所有小组都拿到试卷后，再重新随机分组，再一次随时分发给每一组一份试卷。如此类推，直到所有试卷分发完毕。针对问题二，我们采用了可视化的分数回收模型，并且同时需要建立一个规范标准分模型。先将所有试卷的三次打分成绩进行收集并且整理归类。通过一名评委的打分年数，得到每个评委的评分可信度，继而得到相应的权值。然后将每篇论文的三个评委的打分进行横向分析比较，给每个评委的评分定下一个权值，最后加权求和的结果作为一篇论文的最终成绩。针对问题三，需要建立一个修正加权模型，通过对多次最终评分和各个评委打分的情况，统计每个评委在多次评分过程中的准确评分平均数，建立合适的隶属函数。最终根据隶属函数修正每个评委评分可信度，然后再修正所有评委之前定下的权值，通过最终得到的修正后的权值进行加权求和得到分数。针对问题四，我们建立了数据积累和自动更新模型。我们提出使用标准分来充当一个相对评价量。标准分以平均分为参照点，以标准差为度量单位，将原始分化为具有同一计量单位的分数，这样更能体现评分的公证性和合理性，尽力去掉或减少评卷老师不同带来的成绩的差异和干扰和减少同一份试卷高分和低分的个人情绪干扰。关键词：随机分配、权值、隶属函数、标准分、系统自修正1 问题重述与分析1.1 问题重述信息化条件下，如何较为客观评价一次考试或者考核成绩成为确定人才培养最终效果的重要依据。很多时候，我们的各项成绩确定往往需要多项指标共同确定，以建模竞赛为例，假设有n篇论文提交，m个阅卷评委，要求每一篇论文需要被多个（以3个为例）阅卷评委审阅打分，现实的情况是，不同的阅卷评委的评分标准不尽相同，有的评委阅卷比较严格，每一分都有自己的想法；也有的评委评分比较随意，所有的分都差不多，等等。问题一：建立一个合理的分配模型，首先确定每一位阅卷评委的具体阅卷论文是哪些？问题二：建立一个可视化的分数回收模型，实时收集专家打分，如何将三个成绩规范为一个标准分？最后形成每一篇论文的最终成绩。问题三：在评分过程中，由于不同专家评分特点或是其他原因导致多个（以3个为例）成绩差异较大，此时如何修正模型？问题四：你有没有更好的评分策略，提出自己的想法并修改模型。比如在问题一中如何人工调控来让误差尽可能减小。1.2 问题分析本题研究的评分系统问题，而解决这个问题的核心在于如何制定一个准确的评分法则，更进一步来说，是确定三个评委分数的权值系数。对于一个系统来说，它的一些参数应该是由实际的数据统计得来的。因此我们可以通过一定量的数据，寻找其统计学规律，确定系统所需的参数值。这样的参数是由实际数据得来的，因此应对其进行一定的处理。我们数据一共随机选取有1200篇论文，60个评委进行具体讨论。对于问题一，为了更加公正的随机分发，因此对于所有的论文采用rand随机函数混排。对于所有的n篇论文共计n次评分次数平均分配给60个评委，同时将m个评委随机分为m/3=20个小组，将1200篇论文随机的抽取20份分发给20个小组，然后再重组20个小组，再次分发20份论文。直到全部分发完毕为止。对于问题二，在问题一的基础之上，我们已经将所有论文分发完毕。然后对于每个评委的历次评卷分数进行纵向的标准化处理，得到每个评委的评卷标准值。对于每篇论文的3个评委进行分析，确定每个评委的评分权值，加权求和的结果作为一篇论文的最终成绩。对于问题三，将每个评委的评分特点纳入评分系统考虑的范畴，统计每个评委在多次评分过程中的准确评分平均数，当评委评分与论文最终得分小于一个确定的比对偏差时，我们认定为一次准确评分，建立合适的隶属函数。最终根据隶属函数修正每个评委评分可信度，然后再修正所有评委之前定下的权值，通过最终得到的修正后的权值进行加权求和得到分数。对于问题四，对于问题三的优化，每位评卷老师所评试卷的均值和方差都不相同。单独考察一个评卷老师，他所给出的所有试卷的分数，只能代表每份试卷在他心目中的地位，或者说是他所改的试卷在他心中的一个排序，体现在分数上只表示两份试卷的差异性。但是现在的问题是，绝大多数的试卷的改卷老师都不完全相同，由于改卷老师个人喜好的差异性，用不同阅卷老师给出的原始分数来比较两份试卷的优劣，恐怕就没有多少可比性，这样来比较当然有失公允，所以要体现评分的公证性和合理性，必须考虑下面两个问题：第一，尽力去掉或减少评卷老师不同带来的成绩的差异和干扰；第二，尽力去掉或减少同一份试卷高分和低分的个人情绪干扰2 模型假设与符号说明2.1模型假设(1) 每个评委或者评卷小组评卷效率相同；(2) 假设论文评分都是以100分为满分；(3) 每篇论文评阅所需时间基本相同；2.2符号说明第i个评委的评分权重X第i个评委的评分Aij第j个老师给第i份试卷的原始分第i个评委的最终评分误差第i个评委评分可信度，-xi标准评分起评分3 模型的建立及求解3.1模型一：随机分配模型首先，我们对选定的1200篇论文编号11200，运用vc+软件，用rand函数对其进行随机排布。将60个评委三个一组随机组合，得到20个评委组合，60次分配之后，即可完成1200篇论文的随机分布。见图1（相关程序代码见附录一代码1，其中A,B,C,D,ER,S,T代表20组评委，11200的数字代表论文编号）图1 论文随机分配图3.2模型二：可视化的分数回收模型大量统计资料表明，大型选拔性竞赛，考生总体成绩合理有效的分布应该是成对称正态分布或正偏态分布。多人在一定规则约束下对一份试卷进行评定时，由于评卷教师都是长期任教，进行了严格培训与选拔，充分讨论了评分标准，模拟评卷，规范评卷行为，统一基调。由于所有阅卷人员都是独立自主按照评分标准评阅论文，那么所评成绩服从正态分布。即XN（，2）。由模型假设，设X是考生作文的评分，则应有评分的分解式： X=+因为EX=,E=0，D=那么一篇论文的评分X的数学模型：X=+N（0，）然后，我们需要对评委的历次评分进行纵向统计分析。可以看见每一名评委的评分过程如图2。图2 评委阅卷流程首先对第i个评委历次评分做标准化处理，这样可以避免起评分不同以及高低分差值不同对最终结果的影响。然后制定统一的起评分和高低分差值，利用标准化数据还原得到标准统一的数据，将所得数据与选手最终得分的数据相比较，得到每个评委的评分可信度，继而得到相应的权值。该结果跟所建立的典型情况具有很好的符合度。对于A,B,C评委，通过上述方法得到其与最终评分的误差为ABC-0.0583-0.01590.0170由于可信度与评委最终评分误差成反比。因此B评委可信度最高，C评委可信度次之，A评委可行度最差。由此求得三位评委评分权值为：（相关程序代码见附录一代码2）=（)/2=0.286=()/2=0.385=()/2=0.329若三个评委给某篇论文评分为：ABC808586该篇论文最终得分为：=83.8193.3模型三：修正加权模型因为在模型二中，我们已经得到了每位评委所有的60次打分情况。所以可以根据这六十次的结果进行进一步修正加权。首先引入隶属度区间分布函数的概念。定义如果有函数U()=()=,其中是模糊数的隶属度函数;L为 u在 - 到 x处的 Lebesque测度,则称 U()为模糊数的隶属度区间分布函数。容易得到：因此建立模糊集模型。构造两个模糊集绝对公平模糊集和绝对不公平模糊集。建立准确评分标准当评委评分与最终评分差值小于4分，记作1次准确评分。统计评委60次评分经历中准确评分占总次数的百分比，当值大于95%时，该评委完全属于绝对公平模糊集；当值小于20%时，该评委完全属于绝对不公平模糊集；取值趋于两阈值之间时将该值作为该评委的隶属度。（注：两阈值是由实际数据仿真测量得来）然后根据所选评委的隶属度不同确定不同的评分求和权值。将选择的三位评委的加权分数相加即可得到某篇论文的最终分数。3.4 模型四：标准分模型3.4.1标准分模型既然每一位老师给出的分数是体现不同的试卷在他心中的排名的差异，那么如果把分数整体平移也不会改变这种差异性。我们做如下调整，将每位评卷老师的均值平移到同一个基点。这个基点选取所有老师均值的均值（记为xi ，i=1 2，3，n）。每位老师方差的不同导致每位老师所给出的分对总分的贡献度是不同的，因此我们采用方差压缩的思想把所有老师的离散度（即方差，记为x0）调整到同一水平，这个水平我们选取所有老师方差的均值（记为i ）。然后对所有老师所给的分数进行调整。记aij为第j个老师给第i份试卷的原始分，那么经过这次调整后的分数aij为：这样调整后，所有老师的均值都相同，方差也都相同，从而去掉了不同的老师评卷的干扰。这时如果某份试卷任意换一位评卷老师，分数也不会相差太远。3.4.2 评分输入代码该模型直接将本次评分记录存入该评委的评分记录文件中计算出该评委评分新的权值，从而使得评分系统拥有了自我更新和修正功能。该模型设计了基于VC+6.0的用户操作界面可供操作使用。其操作界面截图如下：（相关程序代码见附录一代码图3评分操作界面3.4.3 模型的优点1、该系统同样需要一定数据量的积累才能够很准确的给出分数。在统计之初，该模型评分标准采用了模型二中三个评委横向分析的方法。2、该系统同样具有自修正功能。3、该模型不会受到太多评卷老师主观的影响，打出来的成绩接近真实水平，诚实可靠。4 模型的评价与修改模型一首先进行了任务的分配，采用rand随机函数的随机分配法则，其作用是有效的避免了论文评价过程中可能出现的造假现象，并且增加了论文评价过程中的公平度。并且将所有论文公平的随机分配给了所有评委，有效的完成了现实要求。模型二分配完评分任务后，我们首先着眼于每个评委，希望通过对其以往评分数据的分析，找到其评分特点，根据评委的评分特点进行了加权，然后通过加权的方法进行分数的确定，公平性和全面性得到了体现。并且合理的得出了每份论文的成绩。模型三采用了修正加权模型，很好修正了模型二的不足。因为模型二中只用阅卷的评分来做权值函数，减少评分老师经验带来的不同干扰，但忽视了评委个人主观性对分数的影响。模型三的修正，使与平均分偏差大的分数，所占权值小，修正了每个分数的权值，保证减少了因评委个人打分随意行所带来的干扰。模型四是采用标准分模型，因为每一位老师给出的分数是体现不同的试卷在他心中的排名的差异，将每位评卷老师的均值和方差平移到同一个基点，这样调整后，所有老师的均值都相同，方差也都相同，从而去掉了不同的老师评卷的干扰。这时如果某份试卷任意换一位评卷老师，分数也不会相差太远。这样就可以更加合理排除阅卷老师不同所带来的干扰。5 参考文献1徐子仪，标准分在数学教育评价和管理中的应用，黄冈师范学院学报，2001，10. 2薛毅，数学建模基础，科学出版社，20113 万中,梁文冬,卢宗娟，模糊数的隶属度区间分布函数，重庆理工大学学报，2011年1月4方开泰，实用多元统计分析，华东师范大学出版社，19865薛定宇，陈阳泉，高等应用数学问题的Matlab求解（第二版），北京：清华大学出版社，2008附录一代码1 论文随机分配的C程序分配系统程序：#include #include #include #define P 40#include #include #include #define P 40int Rand(int X,int Y)/生成随机数 int temp; if(XY) temp=X; X=Y; Y=temp; return rand()%(Y-X+1)+X; void main() int arr1200; int a6061;int i,j,k; int num=0;int r; int temp; int tP;int x1200-P;srand(unsigned)time(NULL); for(i=0;i1200;i+) arri=i+1;/将数组赋值1100 for(i=0;i1200;i+) r=Rand(0,1199); temp=arri; arri=arrr; arrr=temp; /数组乱序 for(i=0;i60;i+)ai0=i+1; for(i=0;i60;i+)for(j=0;j20;j+)aij+1=arrnum;num+;for(i=0;iP;i+)ti=arr1200-(P-i);for(i=0;i1200-P;i+)xi=arri;for(i=0;i1200-P;i+)arrP+i=xi;for(i=0;iP;i+)arri=ti;num=0;for(i=0;i60;i+)for(j=0;j20;j+)aij+1+20=arrnum;num+;for(i=0;iP;i+)ti=arr1200-(P-i);for(i=0;i1200-P;i+)xi=arri;for(i=0;i1200-P;i+)arrP+i=xi;for(i=0;iP;i+)arri=ti;num=0; for(i=0;i60;i+)for(j=0;j20;j+)aij+1+40=arrnum;num+;for(i=0;i60;i+)printf(专家编号：%dnn,ai0); printf(所批试卷编号：);for(k=0;k60;k+)printf(%5d,aik+1);printf(nn);代码2 权值计算程序clc;yy1=xlsread(D:b.xls,sheetA,A2:A61);yy2=xlsread(D:b.xls,sheetB,A2:A61);yy3=xlsread(D:b.xls,sheetC,A2:A61);yy4=xlsread(D:b.xls,sheetD,A2:A61);yy5=xlsread(D:b.xls,sheetE,A2:A61);yy6=xlsread(D:b.xls,sheetA,B2:B61);yy7=xlsread(D:b.xls,sheetB,B2:B61);yy8=xlsread(D:b.xls,sheetC,B2:B61);yy9=xlsread(D:b.xls,sheetD,B2:B61);yy10=xlsread(D:b.xls,sheetE,B2:B61);y1=(yy1-mean(yy1)./std(yy1);y2=(yy2-mean(yy2)./std(yy2);y3=(yy3-mean(yy3)./std(yy3);y4=(yy4-mean(yy4)./std(yy4);y5=(yy5-mean(yy5)./std(yy5);y6=(yy6-mean(yy6)./std(yy6);y7=(yy7-mean(yy7)./std(yy7);y8=(yy8-mean(yy8)./std(yy8);y9=(yy9-mean(yy9)./std(yy9);y10=(yy10-mean(yy10)./std(yy10);%xlswrite(D:c.xls,y1,sheet1,A2:A61);%xlswrite(D:c.xls,y2,sheet1,B2:B61);%xlswrite(D:c.xls,y3,sheet1,C2:C61);%xlswrite(D:c.xls,y4,sheet1,D2:D61);%xlswrite(D:c.xls,y5,sheet1,E2:E61);z1=75+12.5*y1;z2=75+12.5*y2;z3=75+12.5*y3;z4=75+12.5*y4;z5=75+12.5*y5;z6=75+12.5*y6;z7=75+12.5*y7;z8=75+12.5*y8;z9=75+12.5*y9;z10=75+12.5*y10;w(1)=mean(z1-z6);

人人文库> 全部分类> 应用文书 > 事务文书

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

阅卷评分系统的建立

文档简介

温馨提示

最新文档

评论

阅卷评分系统的建立

文档简介

温馨提示

最新文档

评论

相关文档