版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1问题的提出上海市普通高中学业水平合格性考试(以下简称“合格考”)作为全市普通高中在籍学生均须报考的考试项目,考试成绩合格是高中学生取得毕业资格的必要条件,合格考成绩合格的考生方可报考相应科目的等级性考试(以下简称“等级考”)[1]。此外,合格考成绩是否全部合格,也是能否填报春季考试招生志愿的前置条件之一[2]。随着《普通高中化学课程标准(2017年版2020年修订)》(以下简称“新课标”)的颁布,新课标中明确提出“学业质量水平是考试评价的重要依据。学业质量水平2是高中毕业生在本学科应该达到的合格要求,是化学学业水平合格性考试的命题依据”。合格考作为一种基于标准的考试,其重要目的就是要依据考试结果对考生进行分类决策,即依据考生的分数将考生划分为不同的等第或水平,如将考生划分为合格和不合格两类[3]。目前我国各省(区市)在制定合格考合格标准时,大多采用比例划分,预先规定不合格的比例,如广西省规定不合格比例不超过当次当科考生总数的2%[4]
,陕西省规定成绩不合格的比例不超过当次当科目参加考[3」陈益,孙夕礼:从电子效应谈把握《有机化学基础》的学科内涵[J].化学教学,2016,38(5):3\~7.[4]杜宝山主编.普通高中教科书·化学选择性必修3·有机化学基础[M].北京:人民教育出版社,2020:7.[5]陈颖,王磊.凸显学科核心思想促进素养进阶发展—鲁科版高中化学新教材《有机化学基础》编写思路及使用建议[J].化学教育(中英文),2021,42(17):5\~12.试考生总数的3%[5]
。也有一些省(区市)按照卷面得分60分制定合格标准,如江苏省和北京市规定60分及以上为合格,60分以下为不合格。江西省则规定,每次考试的合格标准,依据基本教学质量要求以及当次命题和考试等情况确定[8]。上海市规定合格考的合格分数线以考试分数的标准分值划定[9]各省市合格标准的制定实践,反映了当前教育评价改革进程中的多维考量。无论是通过预设比例划定合格线,还是采用固定分数门槛,抑或是引入动态调整机制,其核心目标均在于平衡客观性与公平性。然而,标准设定的不同策略在实际操作中仍面临诸多挑战。固定比例划定标准可能会导致部分学生因“结构性淘汰”而无法充分体现其学力成长;固定分数标准则容易受年度命题波动的影响,进而影响评价的一致性和稳定性;而动态标准若缺乏清晰的参照依据和系统性调整机制,可能会削弱其公信力。在高考综合改革的背景下,合格标准的设定不仅需要统计学意义上的合理性,更应回归教育评价的本质功能一—即精准诊断学生是否达到学科学业水平的要求,并以此引导教学回归育人本位。鉴于合格考与学生毕业、升学息息相关,如何在招生考试中实现科学合理的合格标准设定,使之能够得到社会的认可,并有利于促进教考衔接,落实课程标准,进而以学业质量标准衡量教学质量,应是考试研究者需重点关注的问题。2标准设定的方法国际上标准设定的方法有很多种,常可分为两类[10.1]。一类是以考生为中心的标准设定方法。以考生为中心的标准设定方法直接关注考生,要求专家对考生熟悉,要在不了解考生测验表现的情况下,将考生置于有序的表现类别,如临界组法和对照组法。另一类是以测验为中心的标准设定方法。该方法要求专家需基于测验目的,对处于临界能力水平的考生在各测验试题能够做出正确回答的概率做出判断,并由此估计划界分数,进而判断考生是否掌握最基本的内容要求和能力要求。以测试为中心的标准设定方法主要有Angoff法、Ebel法、Nedelsky法等。其中Angoff法应用较为广泛[12]。本文即采用Angoff法和Yes/No法设定划界分数。Angoff法[13]最早是由Angoff在1970年代描述的标准设置方法,其原理为:评判专家组的每位专家需逐一审读每一道试题。在审读过程中,要求每个评判专家依据自身对考生群体的了解,针对每道试题,确定水平刚好达到某一等第的考生(即最低能力考生)做出正确应答的概率。或者说,确定每100个最低能力考生在每道试题上做出正确应答的人数比例。这一概率或比例被称为Angoff评分。把所有试题的Angoff评分相加,得到的总和即为某一水平的最低能力考生在此次考试中的得分,而这个得分也就是该等第与下一等第之间的划界分数。该方法主要可应用于0、1计分模式的选择题。对于主观题,可以采用扩展的Angoff方法,评判专家需要对多级计分的主观试题,按照自身对考生群体的了解,针对每道题目,判定水平恰好达到某一等第的考生(即最低能力考生)在该题上可以得到的分数。对于评判专家来说,运用Angoff法时,主要难点在于要估计最低能力考生在每道选择题上的得分概率[14]。这不仅要求评判专家构建“最低能力考生”这一假设概念,还得预估该假设“考生”在每道试题上的得分概率。为解决这一问题,Impara和Plake提出了Yes/N0
法[15]。在标准设置过程中,评判人员无需估计最低能力考生在每道试题上的得分概率,而是判断最低能力考生能否正确得出正确答案。若能,就在评分表上记录“Yes”或“Y”;若不能,则记录“No”或“N”。正因如此,该方法被称为Yes/No法。除了这一关键区别,Yes/No法的其他特征与操作和扩展的Angoff方法保持一致。3采用扩展的Angoff法和Yes/No法设定划界分数实例研究本文以上海市某年高中学业水平化学合格性考试为例,详细介绍如何采用扩展的Angoff法和Yes/No法进行合格标准设置。该年化学合格考试卷共6大题,均为综合题,每道综合题中含选择题、填空题、计算题、简答题等形式,满分100分,共36小题,其中选择题共46分,其他题型共54分,根据评分结果,需将考生分为合格与不合格等第。3.1组建标准设置专家组本次评判专家团队由10位化学教师组成,分别来自上海市的高校、市实验性示范性高中和区实验性示范性高中、区教研员、考试院学科秘书等。这些教师具备丰富的教学经验,长期从事化学课程的教学工作,大多教师参与了命题或审题工作,还参与了考后阅卷工作,对命题理念和试题设计有深人的理解,对考生的答题情况较为了解。3.2培训标准设置专家对参与标准设置的专家组进行培训,主要培训以下内容:(1)理解并熟悉合格等第表现标准。根据新课标,通过专家讨论,以学业质量水平2[16]
为合格标准。(2)熟悉试题知识内容、核心素养,评分标准以及难度系数。(3)掌握合格等第最低能力考生、合格等第最低能力考生得分等相关概念。合格等第最低能力考生,指能力恰好达到合格等第的考生,也就是边界位置考生;合格等第最低能力考生得分,指合格等第最低能力考生在某选择题上可能得满分或0分,在某主观题上的可能得分。(4)了解标准设置基本程序。(5)学习使用评判专家评分表。(6)模拟标准设置。以典型试题进行练习,让评判专家熟悉标准设置过程。例如,遇到模棱两可的表述时,应该考虑哪些要素,是否理解最低能力考生等概念。3.3执行标准设置由标准设置主持人主持标准设置全部工作。主持人要求评判专家依据试题考查的知识内容、核心素养、评分标准、试题难度系数,以及合格等第表现标准,逐小题审题,逐小题独立评分,对于选择题,使用Yes/No法,认为合格等第最低能力考生能正确回答,即给满分;不能正确回答,即给0分;对于主观题,使用扩展的Angoff法,认为合格等第最低能力考生能得多少分,即给多少分,并将得分录人“专家评分表”。所有试题评判结束后,将所有选择题和主观题的得分相加,即可得到每位专家的合格/不合格划界分数。在没有任何交流的情况下,专家审视自己形成合格/不合格划界分数。如果认可该划界分数,则可以递交评分表;如果不认可,则逐题检查,可调整评分。当所有专家递交评分表后,对专家的评分结果进行统计,需统计每小题平均分、中位数、标准差以及合格/不合格划界分数的平均分、中位数、标准差。10位专家的评判结果及统计数据见表1。表110位专家第一轮评判结果及统计数据(部分)由表1可见,10位评判专家对合格/不合格划界分数评判最低的是专家1、专家3、专家6,均为40分;评判分数最高的是专家9,为58分,最低分和最高分差值为18分,标准差为6.36,评判专家的评判分数差异较大。由于评判专家的评判分数差异较大,为提高分类决策的效度,缩小评判差异,降低误差,需要将评判结果反馈给评判专家,供专家参考。评判专家集体观察分数较高和较低的专家评判情况,查找造成较高或较低的原因,是所有试题都趋向较高或较低,还是个别试题较高或较低。无论哪种情况,相关专家都要在与其他专家交流沟通后,重新审读相关试题,最终决定是否调整评分。此外还要观察标准差相对较大的试题,要求评分较高或较低专家在与其他专家交流沟通后,重新审读相关试题,最终决定是否调整评分,并重新提交评分结果。如第22题,该题为:四、食品添加剂一二氧化硫食品添加剂能改善食物色香味、延长保质期、调整营养结构。我国对食品添加剂的品种、使用范围、最大用量及残留量都制定了严格的标准。SO2
是葡萄、荔枝等水果储存时常用的保鲜剂,能降低水果腐烂率,提高维生素C留存率。22.保鲜时若SO2
不慎用量过大,会使水果表面明显褪色,上述现象说明SO2A.易溶于水B.是酸性氧化物C.具有漂白作用只有专家1的评分为0分,其他专家的评分均为2分,该题的实测难度系数为0.78,区分度为0.35。其中选B的考生占21.3%,选C的考生占77.9%。该题涉及学生熟悉的常见化合物SO2
,考查的是其重要性质之一漂白性,考查的要求为学业质量水平1。经过讨论,专家1重新审视合格标准,认为合格等第最低能力考生能得满分,因此将其评分修改为2分。经过修改后,该题评分结果的标准差降为0。再如第34-1题,该题为:六、缓/控释肥料“民以食为天”,粮食安全是国家安全的重要保障。“人靠田养,苗靠肥长”,粮食增产离不开氮肥。34.尿素CO(NH2)2.是使用量最多的氮肥之一。(1)尿素属于A.铵态氮肥B.硝态氮肥C.有机氮肥D.复合肥只有专家5和专家7的评分为0分,其他专家的评分均为2分。该题的实测难度系数为0.46,区分度为0.2,其中选A的考生占42.3%,选B的考生占3.5%,选C的考生占46.4%,选D的考生占7.6%。该题涉及学生熟悉的常见含氮化合物尿素,是必修教材中的正文内容。试题要求对尿素进行分类,考查的要求为学业质量水平1。尽管得分率不高,未超过50%,但经过集体讨论,专家一致认为,合格等第最低能力考生能得满分,因此专家5和专家7将其评分修改为2分。经过修改后,该题评分结果的标准差降为0。所有专家经过修改评分,再次提交的评分结果如表2所示。表210位专家第二轮评判结果及统计数据(部分)由表2可见,经过调整评分后,平均分为48.8,中位数为49,平均分和中位数比较接近;最低分为41分,最高分为53分,差值减小为12分,标准差为3.26,10位专家的评分差异性显著减小。相比于第一轮,该评判结果作为合格/不合格的划界分数,分类决策效度较高,评判误差较小,可以作为最终结果,不需再次重新进行评判。最终我们选择采用49分为合格/不合格的划界分数。根据该划界分数,与一般采用的60分法相比,其合格/不合格率结果如表3。表3采用不同标准设定方法的合格/不合格率4结语在多种标准设定方法中,基于学业质量标准的Angoff法因其独特的逻辑起点和方法论优势,受到广泛关注。该方法通过组织专家对课程标准所规定的学生学业成就表现进行系统性研判,从而将合格标准锚定于学生核心素养水平的“绝对尺度”,而非基于群体表现的“相对排序”或经验设定的分数界限。相较于传统百分比法可能引发的竞争异化与标准波动,或60分法可能导致的应试导向与科学性质疑,Angoff法的核心价值在于重构标准、教学与评价之间的内在联系。首先,该方法以学科核心素养为参照,引导教学评价由“筛选淘汰”转向“素养培育”,促使教学实践减少低阶重复训练,更加关注学生真实能力的建构。其次,通过剥离群体表现与试卷难度对标准设定的干扰,该方法为教育评价提供了相对稳定的质量监测基准,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 四川省南充市仪陇中学2025-2026学年高一下学期5月期中考试地理试卷
- 河北省邯郸市2025-2026学年高二下学期期中监测生物试题
- 高空辐射与飞行员眼部疾病的关联分析
- 高温作业职业性健康传播
- 高温下药物代谢公共卫生策略
- 高压设备安全管理
- 幼儿园过渡环节消极等待现象治理-基于2024年一日生活流程视频分析
- 2026年西南名校联盟2026届高三下学期“3+3+3”高考备考诊断性联考(四)生物 含解析新版
- 江西省部分校2025-2026学年高三上学期高考仿真模拟检测(三)语文试题
- 2025年医院急诊科上半年工作总结
- 设备安装验收移交规范
- 2026年中国联通黑龙江省分公司校园招聘笔试备考题库及答案解析
- 2026年国际数学奥林匹克国家集训队测试试题真题(含答案详解)
- 2026年社工考试《初级社会工作综合能力》真题及答案
- 2026年长沙民政职业技术学院单招职业倾向性测试题库含答案详解(能力提升)
- 阴道炎患者护理实践指南(2025年版)
- 2026年财务管理专业综合知识竞赛试题及答案
- 一体化污水处理设备施工工艺
- 护理伦理学案例分析题
- 牙冠修复知情同意书
- 2026广州产投集团校招试题及答案
评论
0/150
提交评论