已阅读5页,还剩5页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
试卷质量标准的测量与分析摘要:对2012年云南省怒江州初中学业水平考试试卷的质量标准(难度、区分度、平均数、差异量数、相关系数等)的测量、统计分析、总结,对本次试卷给予评价,并为教育教学提供一些有用信息。关键词:试卷质量;考试成绩;差异性;相关性 考试作为测量、评价学生水平和能力的有效手段,已被整个社会认可并广泛应用。而考试自身的科学性、规范性则需要通过试卷分析来检验证明。试卷数据经过分析处理可以提供许多重要信息,对指导教学,准确评估,提高教学质量具有重要意义1。所以,本文对2012年云南省怒江州初中学业水平考试的试卷质量进行测量分析,分析过程及所得结论如下。1 统计样本统计样本数据:2012年云南省怒江州初中学业水平考试4641名中学生的各科成绩,包括语文、数学、英语、思想品德、物理、化学、历史、体育八门科目。样本选取范围:整个怒江州,共有26所中学,所有参加本次考试的学生各科成绩,共4641份。 怒江州:位于云南省西北部,全州少数民族人口比例占总人口的92.2%。 2 试卷质量各项指标的分析统计2.1 难度 所谓难度2就是测验项目的难易程度,即测验评价的适应性。难度不是测验项目制定者主观确定的,而是根据预备测验的结果客观决定的。用两端平均分定义 P=其中,分别为总数27%的高分端、低分端平均得分率,P值越高,难度越低。一般来说,P值在0. 30.7为适中,在0.10.3为较难,在0.70.9为较易。试卷过难或过易都不好,这样的话,分数必定大部分分布在低分端或高分端,分数分布的范围和分数差异也很小,这必然影响到测验的鉴别能力3。 由数据统计得:=0.635 =0.545 =0.571 =0.623 =0.554 =0.602 = 0.594 =0.862 由上面可知,语文、数学、英语、思想品德、物理、化学、历史七科的试卷难度适中,但语文和思想品德难度可稍加调整,如能控制在0.50.6之间更为理想(试卷难度应略低于学生平均水平)。体育P值为0.862,从数据上看,体育难度偏低,但符合其学科特点和考察目的。2.2 区分度所谓区分度2就是测验项目对于两端得分的鉴别程度,及测验评价的适应性。用高低区分度指数定义测验项目的区分度,适用于连续型变量数据资料。其计算公式如下 D= 其中:D为高低分组区分度指数;,分别为总数27%的高分端、低分端平均得分;为某项目的满分。区分度是反映试题区分应试者能力水平高低的指标。 表1 区分度判断Table 1 Discrimination judgment区分度指数值 0.40以上 0.300.39 0.200.29 0.19以下 判断 优良 合格尚可,需改进 应淘汰 由数据统计得:=0.351 =0.661 =0.546 =0.443 =0.549 =0.551 =0.527 =0.266 数学、英语、思想品德、物理、化学、历史六科试题区分度都非常好;语文试卷的区分度只属于合格范围,可以稍加改进;体育的区分度尚可,需改进。总体来说,本次测试试题区分度都算比较理想。 比较各科难度、区分度指数发现,难度和区分度之间有着一定的联系。各科中难度最低的两科体育(=0.862 )和语文(=0.635),分别对应的区分度是 =0.266、=0.351均未达到0.4,不属于优良范围的区分度。所以试题难度适中可使试卷的区分度达到较好的值。也就是说,难度会对试卷质量标准的其他指标造成一定影响,这里再次强调了试题难度的重要性。2.3 平均分 平均分4 =,由数据统计得: =65.397 =56.237 =56.522 =64.624 =55.892 =61.169 =61.564 =87.9482.4 差异量数极差3是一组数中最大值与最小值的差值;方差定义是离差分数平方的平均值,样本的方差4用S表示,其公式为:;标准差4是方差的算数平方根。标准差的意义5(1)表示变量值的差异(离散)程度;(2)对变量值的频数分布作出估计。 由数据统计得: 表2 各学科的差异量数Table 2 Disciplines Difference Magnitude 项目 极差 方差 标准差 项目 极差 方差 标准差 语文 95218.52 14.78 物理 100457.12 21.38 数学 99669.47 25.87 化学 100464.30 21.55 英语 99451.50 21.25 历史 100429.43 20.72 思品 99322.38 17.96 体育 100132.13 11.50 由于数学的标准差最大,说明数学成绩差异性最大,即数学成绩围绕平均分数的分布最离散,平均分的代表性最差;反之体育的标准差最小,说明体育成绩差异性最小,即体育成绩围绕平均分数的分布最密集,平均分的代表性最好。另一方面,通过方差或标准差,也可以看出试卷的区分度,方差或标准差越大,试卷区分度越高。试卷区分度由高到低,依次是、 、 、,这与上表计算出的方差或标准差由高到低的排列结果是一致的。3 成绩分布研究及各门学科相关性分析3.1 分数分布直方图与其正态分布 直方图4:所谓直方图就是图形包括一组矩形,各个矩形代表分布表上各组距中分数的频数,作矩形两边的垂线使其与特定的组限密合,用该组分数的频数表示它的高度。 正态分布6:亦称“常态分布”、“高斯分布”。随机变量及随机变量函数的一种重要的、应用最多的分布。其密度函数 ,式中e为自然对数的底,为平均值,为标准差,x为随机变量的取值。正态分布在教育测量中的重要性1可以从以下方面来理解:正态分布是自然界最常见的一种分布。用正态分布划分成绩等级的方法是依据学生的考试分数服从正态分布的内在特点总结出来的。它能在学生成绩出现普遍偏高或偏低时,客观的反映学习的真实水平。 图1 语文成绩的正态曲线与直方图 Fig.1 Language scores normal curve and histogram经过统计并对比图1,语文成绩主要集中在6080分数段,位于平均分附近。直方图与正态分布曲线符合的良好,略呈负偏态,高分相对较多,但结合语文科目特点,此属在合理范围内。正态分布曲线略显狭窄,分数相对集中,区分度较差。总体上基本反映了学生真实水平。建议:下次语文试题的难度、区分度都应该加大一些,稍微增加中、难题比例,而简单题比例减少。 图2 数学成绩的正态曲线与直方图 Fig. 2 Math normal curve and histogram 经过统计并对比图2,数学成绩主要分布在3090分数段,围绕平均分分布不够集中。直方图与正态分布曲线符合的一般,呈负偏态,高分的人数较多。正态分布曲线比较宽,分数非常分散,区分度很好。 建议:下次数学试题可在保证区分度的前提下,增加中等难度试题的比例,减少易、难题比例,使平均分附近人数分布集中一些。 图3 英语成绩的正态曲线与直方图 Fig.3 English achievement normal curve and histogram 经过统计并对比图3,英语成绩主要分布在3080分数段,围绕平均分分布较分散。直方图与正态分布曲线符合的良好,呈正偏态,低分人数偏多。反映了怒江州英语教育水平相对较低的现状。正态分布曲线比较宽,分数相对分散,区分度较好。 建议:下次英语试题可在保证区分度的前提下,稍微增加中等难度试题的比例。 图4 思想品德成绩的正态曲线与直方图 Fig. 4 Ideological and moral achievements normal curve and histogram 经过统计并对比图4,思想品德成绩主要集中在6080分数段,围绕平均分分布比较集中。直方图与正态分布曲线符合的良好,呈负偏态,高分的人数的稍多,但处于合理范围内,正态分布曲线比较宽,分数非常分散,区分度很好。 建议:下次数学试题可在保证区分度的前提下,稍加大一点试题难度更好。 图5 物理成绩的正态曲线与直方图Fig. 5 Normal curve and histogram of physical performance 经过统计并对比图5,物理成绩主要分布在4080分数段,围绕平均分分布比较集中。直方图与正态分布曲线符合的非常好,且正态分布曲线比较宽,分数非常分散,区分度很好。本次物理试卷难度、区分度都非常好,反映了学生的真实水平。 图6 化学成绩的正态曲线与直方图Fig. 6 Normal curve and histogram of the chemical results 经过统计并对比图6,物理成绩主要集中在5080分数段,围绕平均分分布比较集中。直方图与正态分布曲线符合的非常好,且正态分布曲线比较宽,分数非常分散,区分度很好。本次化学试卷难度、区分度都非常好,反映了学生的真实水平。 图7 历史成绩的正态曲线与直方图 Fig. 7 Normal curve and histogram of the historical achievements 经过统计并对比图7,历史成绩主要集中在6080分数段,围绕平均分分布比较集中。直方图与正态分布曲线符合的良好,呈负偏态,高分的人数的稍多,但处于合理范围内,正态分布曲线比较宽,分数非常分散,区分度很好。基本能反映学生真实水平。建议:下次历史试题可在保证区分度的前提下,稍加大一点试题难度更好。 图8 体育成绩的正态曲线与直方图 Fig.8 Normal curve and histogram of the historical achievements 经过统计并对比图8,体育成绩主要集中在80100分数段,直方图与正态分布曲线符合的一般,但成绩高度集中分布在高分段,区分度差。但考虑到我国开设体育课程的目的和任务,所以,体育科目的正态曲线和成绩分布符合其学科特点,也达到了其考察目的。 小结:各门科目成绩的直方图和正态曲线基本上都能符合,特别是物理和化学两个科目,正态曲线和直方图符合的十分理想。直方图和正态曲线符合的最不理想的是数学成绩,平均分附近分布不够集中,可以加以修改。本次各科试题出的比较好,正负偏态也都在合理范围内,基本上都反映了学生真实水平。3.2 各门课程的相关系数计算及相关性分析相关系数4 :二列变量之间的相互关系,叫做相关。如果一列变量变动时,另一列变量也发生变动,而且变动的方向相同,则这两列变量是正相关,如果变动的方向相反,则这两列变量是负相关。同一门学科的两次测验,或任意两门学科测验成绩,有时会有一定的相互关系,只是相关的程度不同而已。两列变量X,Y之间的相关程度,用相关系数r表示,下列公式可以看作是相关系数定义的公式。相关系数4 公式中x=(-),y=(),=成对的离差分数之积之和,n=量数的对数,分别是两个变量的标准差。 相关系数r取值范围为-1,1,从理论上讲r0就应该承认项目间存在一定的相关关系7。r越大,相关性就越强。 由数据统计得各科间的相关系数如下表所示: 表3 各学科间的相关系数 Table 3 Interdisciplinary correlation coefficient 课程语文数学英语思品物理化学历史体育语文 0.74120.71930.84610.74550.75990.77360.1491数学0.7412 0.69710.78230.86920.82650.77430.0713英语0.71930.6971 0.71270.69720.71570.66290.1473思品0.84610.78230.7127 0.79950.81330.82900.1328物理0.74550.86920.69720.7995 0.87210.79910.0656化学0.75990.82650.71570.81330.8721 0.80220.0762历史0.77360.77430.66290.82900.79910.8022 0.0762体育0.14910.07130.14730.13280.06560.07620.0762 由表中数据可以发现,相关系数最大的两个分别是物理与数学、化学,分别达到了0.8692与0.8721,可以说相关性比较高。体育与各科之间的相关系数最低,说明体育与各科之间相关性差,符合实际情况。总体上看,除体育外,本次测试的各科之间有较好的相关性,各门学科的衔接上没有太大的问题。3.3 一元线性回归Y在X上的回归:原始分数公式4 这里Y,为预测所得Y的原始分数;,分别为两变量的标准差;,分别为两变量的平均数;r为X和Y的相关系数。 各学科回归方程如下: 表4 各学科间的回归方程Table 4 Interdisciplinary regression equationY X语文数学英语思品物理化学历史体育语文 X=1.30Y-28.78X=1.04Y -11.50X=1.03Y -2.74X=1.08Y -14.74X=1.11Y-11.42X=1.08Y -9.07X=0.12Y+80.10数学Y=0.42X +41.78 X=0.57Y+24.46X=0.54Y+34.17X=0.72Y+15.40X=0.69Y+22.36X=0.62Y+26.69X=0.03Y+86.26英语Y=0.50X+37.14Y=0.85X+8.20 X=0.60Y+25.30X=0.70Y+16.33X=0.73Y+19.91X=0.64Y+25.39X=0.08Y+83.43思品Y=0.70X+20.17Y=1.12X-16.13Y=0.84X+2.24 X=0.95Y-5.50X=0.97Y-1.51X=0.96Y -0.48X=0.08Y+82.78物理Y=0.52X+36.34Y=1.05X-2.44Y=0.70X+17.40Y=0.67X+27.17 X=0.88Y+11.98X=0.78Y+17.97X=0.04Y+85.71化学Y=0.52X+33.59Y=1.00X-4.93Y=0.71X+13.09Y=0.68X+23.02Y=0.86X+3.28 X=0.77Y+14.46X=0.04Y+85.50历史Y=0.55X+31.54Y=0.96X-2.86Y=0.68X+23.66Y=0.72X+20.30Y=0.83X+4.80Y=0.83X+10.08 X=0.04Y+85.49体育Y=0.19X+48.69Y=0.16X+42.17Y=0.28X+31.84Y=0.20X+47.03Y=0.13X+44.46Y=0.15X+47.98Y=0.14X+49.25 根据以上分析,我们可以利用回归方程进行预测,即借助回归方程进行学科成绩的预测。具体方法是,把已知的变量,代入适当的回归方程式,推算出另一个变量的估计值8。4 总结和讨论以上我们对2012年云南省怒江州初中学业水平考试各科成绩进行了测量与统计,分别从难度、区分度、平均数、标准差、相关系数,成绩分布情况及回归等方面进行分析讨论。总体上本次水平考试中,各科试卷均没有出现太大问题,个别科目试题出的非常好,如化学,物理试题,各项指标均达到了很高的标准。当然也有需要改进的科目,如语文试题的区分度和数学的成绩分布不是很理想,可稍做改进。本次所讨论的各项指标都是由样本数据测量统计得出,而在测试过程中,各个个体所得分数是否真实、可靠,以及阅卷评分的客观性等等,也是值得考虑的问题。本文由于受数据限制,没有讨论试题的信度和效度,因此,以上分析讨论也存在一定的局限性。参考文献1郑均辉.试卷分析系统的研究与实现D.西安:西安电子科技大学,2010.2郭熙汉,何穗,赵东方等.教学评价与测量M.武汉:武汉大学出版社,2008,4449.3毛慰明,李星,张雄等.物理教育专业物理课程试卷分析探究J.玉溪师范学院学报,2004,12:40.4高振业,秦仲实.教育统计学M.四川:四川教育出版社,1987,74166.5李永华,邓正刚,张雄等.物理教育专业普通物理课程试卷分析与探究初探J.云南
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广西锦璐环保科技建材项目环境影响报告表
- 安全承诺书【15篇】
- 年产20万台汽车灯具技改项目可行性研究报告模板-立项备案
- 托福考试笔试题库及答案
- 2025年密云中考语文试卷及答案
- 信用减值损失试题及答案
- 坠床跌倒应急预案(3篇)
- 种业公司应急预案(3篇)
- 2025年新疆物理试卷初中及答案
- 2025年深圳中职试卷真题及答案
- 活动策划服务合同标准范文
- 新式茶饮基础知识培训课件
- 功能对等理论视角下《经济学人》新闻翻译策略与实践研究
- 环保检修措施方案(3篇)
- 《中国银行业文明服务公约》及实施细则2
- 旅行社安全生产工作会议记录
- 心脑血管疾病防治健康教育
- 企业三体系培训
- 远程心电图管理制度
- 公司党建宣传片策划方案
- 建信金科面试题及答案
评论
0/150
提交评论