




已阅读5页,还剩11页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
高考作文网上阅卷取分函数的数学模型 田 俊 忠(西北第二民族学院信息与计算科学系,宁夏银川市,750021)摘 要:高考作文网上阅卷的核心问题之一是如何确定考生成绩的取分函数,它将直接影响作文网上阅卷的科学性与对考生的公平性。本文在2002年宁夏高考作文网上阅卷成绩的现场数据基础上,利用概率统计的数学方法,建立了取分函数的三种数学模型,并进行数据模拟和比较,给出了比较科学合理最优的取分函数模型,而且在分析数据和总结历史经验的基础上,阐述了取分函数模型的思想过程及求解算法。关键词: 作文网上阅卷 取分函数 数学建模 数据模拟1 问题的提出 作文网上阅卷是主观性试题网上阅卷难度最大的一个课题,是整个阅卷工作电子信息化与自动化技术的一个最后的瓶颈。作文网上阅卷电子信息化解决方案形成意味着各种考试,各门课程主观性试题网上阅卷的彻底解决;可是作文网上阅卷在数学上存在着两大关键性的核心问题:1:每份试卷都先由两位阅卷老师独立地按照评分标准进行评分,在什么样的情况下进行对考生的作文进行三评,能使得这种区分方法在理论上是科学合理的,对考生是公正公平的,在工作量上是现实可行的。2:面对考生的二评或三评的评分,如何计算考生的成绩等问题,使得这种成绩的取分函数在理论上是科学的,对所有的考生是公平的。2 模型假设 (1)作文试卷电子化经过电子扫描处理过的电子作文完全消去了影响试卷公平阅卷的任何外在因素,不久有关考生的个人特征信息完全消去(如:考生姓名,考号,考区),评分多少,已评还是未评,是二评还是三评,是自评还是他评等方面的信息对评卷人员完全不存在;电子化的作文还可以多次分发,可以在同一时间发给不同教师,也可以在不同时间分发给不同的教师或同一教师,在时间上,评卷人员是分离的,相互独立的。(2)试卷分发的随机化作文电子化处理之后,可以使用随机化方法进行分发,比如可以用抽签法,随机数表法或人工随机抽取等方法.其随机化的方法可以使一篇电子作文在阅卷期限内的任何时间上都有同等的概率分发到每位评卷人员上;阅卷人员在评阅同一份作文是有差异的,尽管在评卷之前进行了认真培训,讨论评分标准,模拟评阅,使阅卷评分更加趋同;但由于评卷人员在知识背景,阅历,对评分标准的理解力与个人倾向偏好等因素的存在与影响,评卷人员的差异总是存在的。随机化分发,使得这种差异对每位考生的影响是等概的,因而是公平的。(3)评阅的独立化 由于作文的电子化处理与多次分发,第一位评卷人员在任何时间上评阅一篇作文时,不受任何外在信息的干扰,保证其独立自由地认真评阅,若干评卷人员即使评阅同一篇电子作文,也无法交流各自的观点与传递信息,试卷上也无已评的任何标记,互不影响,独立自主。任何一位评卷人员对任何一篇电子作文的评分都是相互独立的。(4)评分的正态性由于评卷老师都是长期任教,多次参加高考作文阅卷,进行了严格培训与选拔,充分讨论评分标准,模拟评卷,规范评卷行为,统一基调。由于所有阅卷人员都是独立自主地按照评分标准评阅作文,那么所评成绩服从正态分布。即。其中:表示作文成绩的理论值,表示所有阅卷老师评分差异的平均水平。(宁夏高考作文网上阅卷研究报告之一支持此结论)3 模型分析 由模型假设,设是考生作文的评分,则应有评分的分解式:因为 , 那么 ,那么一篇作文的评分的数学模型为: 其中:是考生作文成绩的理论值,是评卷人员的评分与真值的偏差, 的大小反映了评卷老师阅卷水平与对评分标准的理解把握程度的好坏。对任意一篇电子作文而言,与是未知的,也是不可测的。 造成考生成绩偏差来自,所以的偏差等于考生成绩偏差。设是一篇电子作文第评的评分,(或)为了使考生的成绩更加公平,应使的偏差处在一定的范围内,为此提出区分度A当A,仅有两评的成绩与当A,则进行三评,设三评成绩为如何根据两评的成绩与或三评的成绩来计算作文的应得成绩,我们在二评时在兼顾两位老师评分的同时,也应该注意到,得高分比较难,概率也比较低,得高分的考生说明他们的素质水平高,所以要保护高分即加大其权重。当A,则进行三评,说明前两位阅卷老师中至少有一位阅卷有偏差,所以在三评时应在兼顾三位阅卷老师打分的同时,也要加重前两位阅卷老师其中一位与第三位阅卷老师分值相差不大分值的权重,同时也要减低出现误差值的权重,这样才能很好地维护考生的利益,使考生的成绩是合理的,公平的。第三位阅卷老师的打分其实就是为了验证前两位阅卷老师,前二位阅卷老师的评分:如果,则表明的评分是合理的,偏差不大,应加大其权重。如果,则表明的评分是不合理的,偏差很大,应尽可能地减低其权重,但是不能使其为零,因为它还是有一点贡献,只不过小而已。4 模型建立由上述模型假设和模型分析可知,每位阅卷老师在打分时相互独立的,互不干涉,所以之间没有相关性,是独立的,即他们在构成考生成绩是线性的。由于阅卷老师在评分时存在一定的偏差,有的影响大点,有的影响小点,而且他们分数高低不同,难度程度也不同,所以他们评分的权重是不同的,即评分系数是不同的,并设()的系数,为考生成绩。于是建立考生取分函数模型: (4.1)其中: ()是待定系数,()是已知阅卷老师的评分值。根据2002年宁夏高考网上作文阅卷数据并经统计分析,知考生得分主要集中在一定分数范围内,说明其得分的频率是不同的,而且得高低分频率远远低于得中间分数的频率,基于此我们以人数为衡量的标准用MatLab画出考生分数分布图,其轴为考生的得分值(060),轴为考生某一分数所对应的人数比例 (01),如图1所示:图1从上图可以看出考生在得分时是有差别的,处在不同的分数段有不同的难易度,所以我们根据考生成绩处在不同分值内,得分的系数是不同的。设难度系数 (4.2)其中是分数为的人数(2)式的实际意义是考生得分数前有多少人得分小于,得分小于人数多少反映了得分数人的能力的大小,比是为了归一化。现在要求,必须先求()。在求时必须给出满足的条件,从而根据这些条件构造出41 两评的取分函数模型:当时,则进行二评,于是 ,根据实验数据要求和假设分析可知,在二评时,认为二位阅卷老师的评分是符合误差范围的,所以它们的系数大小只于他的难度有关,于是得到二评满足的条件: 若越大,则越大, 若越大,则越大所以,满足条件的数学模型为: (4.3)由方程(4.3) 解得: (4.4) 那么 (4.5) 于是得两评的取分函数 (4.6)42 三评的取分函数模型:模型一:当时,则进行三评,于是,根据实验数据和模型分析可知出现三评是由于前二位阅卷老师其中一位出现偏差,三评是为了验证那一位出现偏差,并纠正其偏差,所以它们的系数大小不久与他的难度有关,而且与()大小有关,于是得到三评满足条件: (1) 若越小,则,越大 (2) 若越小,则,越大 (3) 若越大,越大(4) 若越大,越大(5) 若越大,越大 所以,得出,满足条件的数学模型为: (4.7)由方程(4.7)解,得 (4.8)于是得: (4.9)那么三评取分函数 模型二:同理根据三评模型一满足的条件可知,我们把自身影响因素转化到对方相应的对立因素即得出三评满足条件: (1) 若越大,则越大 (2) 若越大,则越大 (3) 若越大,越大(4) 若越大,越大(5) 若越大,越大 所以,得出,满足条件的数学模型为: (4.10) 由方程(4.10)解,得 (4.11)那么: (4.12)于是得三评取分函数 (4.13)模型三:并考虑到自身偏差大小还对其系数大小有一定的贡献,于是得到三评满足条件: (1) 若越小,则,越大 (2) 若越小,则,越大(3) 若越小,则,越大 (4) 若越大,越大(5) 若越大,越大(6) 若越大,越大 所以,得出,满足条件的数学模型为:(4.14)由方程(4.14)解,得 (4.15)那么: (4.16)于是得三评取分函数5 模型求解根据难度系数 并统计2002年宁夏高考网上作文阅卷数据,得到的值,如表所示分数51116181920212223242526人数646668697278798083858795难度0.0040.0040.0040.0040.0040.0050.0050.0050.0050.0050.0050.006分数272829303132333435363738人数991061161331581812232944025888451206难度0.0060.0060.007 0.0080.0100.0110.0140.0180.0250.0360.0520.074分数394041424344454647484950人数1708233131554117519464047780918810550118151296113909难度0.1040.1420.1930.2510.3170.3910.4740.5610.6440.7210.7910.849分数51525354555657585960人数14655151971565015887161071623016279163411637216384难度0.8940.9280.9550.9700.9830.9900.9930.9970.9991此表中出现一些分数没有对应的难度系数,主要是因为去年高考没有这些分数,所以认为这些分数难度系数等于它前一个分数的难度系数,零的难度系数为零,一分的难度系数等于零分的难度系数,依次类推,六十分的难度系数等于1。关于()值的计算只是在阅卷老师分数打出后,再进行简单的求绝对值,然后由()组合计算就得到考生二评、三评成绩。6 数据模拟 二评取分函数模拟:一评成绩4648304656304354二评成绩4553364348404749一评难度0.5610.7210.0080.5610.9900.0080.3170.970二评难度0.4740.9550.0360.3170.7210.1420.6440.791现评成绩4651354553394652历史成绩4651334552354552差值00201410三评取分函数模拟模型一:一评成绩3550523644535254二评成绩5338364955364040三评成绩4349484240554037一评难度0.0250.8490.9280.0360.3910.9550.9280.970二评难度0.9550.0740.0360.7910.9830.0360.1420.142三评难度0.3170.7910.7210.2510.1420.9830.1420.052现评成绩4549494445544044历史成绩5150504644544040差值61121004模型二:一评成绩3550523644535254二评成绩5338364955364040三评成绩4349484240554037一评难度0.0250.8490.9280.0360.3910.9550.9280.970二评难度0.9550.0740.0360.7910.9830.0360.1420.142三评难度0.3170.7910.7210.2510.1420.9830.1420.052现评成绩5250494848534048历史成绩5150504644544040差值10124108模型三:一评成绩3550523644535254二评成绩5338364955364040三评成绩4349484240554037一评难度0.0250.8490.9280.0360.3910.9550.9280.970二评难度0.9550.0740.0360.7910.9830.0360.1420.142三评难度0.3170.7910.7210.2510.1420.9830.1420.052现评成绩4849504647544046历史成绩5150504644544040差值31003006我们从以上数据模拟可以看出二评的现评成绩与历史成绩相差不是很大,主要因为现在所用的算法基本上符合原来两个成绩简单平均而得到的成绩,差值都是现评成绩大于历史成绩,这说明现在算法更有效地保护高分,更加具有区分度,使考生成绩更加合理化。三评取分函数数据模拟时出现一些现评成绩与历史成绩偏差很大,一些偏差不是很大,造成上述主要原因是:1:历史成绩取分函数在判断当()时,则得,没有考虑()中的影响,所以造成成绩要么偏高,要么偏低。2:现评成绩取分函数是在兼顾三位阅卷老师打分的同时,没有完全丢掉中的贡献,也起到调节考生分数的作用,不过,从差值来看如果与其他二个分数相差不大,它的调节作用不是很大,基本上和历史数据吻合,相反,则很好地体现了的贡献和调节作用,使考生的成绩具有全面性,既不是片面地夸大或偏低某一分数的影响,又不加大偏差很大成绩的影响,所以对考生成绩的计算是全面的,合理的。7 误差分析由于三评取分函数有三个模型,所以我们现在比较他们之间的误差: 模型差值模拟数据个数模型1差值模型2差值模型3差值16132101311042205143601070008486平均差值1.8752.1251.625从以上简单的比较运算,可知三个模型接近历史评分的程度不同,出现误差的大小可以说明:1:模型2取分函数成绩与历史成绩相差很大,由于模型2三评时只考虑它的难度系数,没有考虑它与的距离即阅卷老师打分偏差。2:模型1取分函数成绩与历史成绩相差不是很大,由于模型1三评时,考虑到它与打分偏差,但是没有考虑自身的偏差。3:模型3取分函数成绩与历史成绩相差比较小,由于模型3一、二评时,既考虑到它与的打分偏差,又考虑到自身的偏差,同时三评也考虑到与的偏差,出现的偏差只是说明原来算法有一定不合理性即舍弃
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 文学经典传承:古诗文教学方案
- 市场渠道合作合同规范
- 《新编商务应用文写作》教学参考汇 李奕轩 模块1-9 商务应用文写作基础-大学生实文书
- 早读课件教学课件
- 早期阅读遇见春天课件
- 纪检业务知识培训课件会
- 纪念白求恩课件文库
- 早产儿陪护知识培训内容课件
- 2025年日语J.TESTN2级试卷:日语能力考试全面训练
- 2025年美容师(美容美发)理论知识考核试卷
- 30题解决方案工程师岗位常见面试问题含HR问题考察点及参考回答
- 云计算技术的分布式计算技术
- 设备技改方案范文
- 2024年石油石化技能考试-甲醇装置操作工笔试历年真题荟萃含答案
- 肋间神经病的护理查房
- 2024年全国初中数学联赛试题及答案(修正版)
- 医药代表销售技巧培训 (2)课件
- 物业保安、保洁项目投标书
- 中国移动室分问题排查优化指导手册
- 顺丰同城管理制度
- 妊娠期阴道炎的健康宣教
评论
0/150
提交评论