地理测试命题质量分析省公开课金奖全国赛课一等奖微课获奖课件_第1页
地理测试命题质量分析省公开课金奖全国赛课一等奖微课获奖课件_第2页
地理测试命题质量分析省公开课金奖全国赛课一等奖微课获奖课件_第3页
地理测试命题质量分析省公开课金奖全国赛课一等奖微课获奖课件_第4页
地理测试命题质量分析省公开课金奖全国赛课一等奖微课获奖课件_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章地理测试命题质量分析1/88地理测试命题工作是地理教学过程中一个不可缺乏步骤。而做好地理测试命题质量分析工作,对正确认识、评价地理测试结果,为以后命题工作提供必要经验,教训等一样也含有主要意义。2/88第一节试题质量初步评价评价试题质量一条主要路径是对学生考试之后所得原始卷面分数进行必要处理、分析,转化为一个比较直观形式,以对试题质量作出一个初步判断。下面就地理测试命题质量分析实践中比较惯用几个方法结合实例作详细介绍。3/88一、测验分数分布状态描述测验分数分布状态通惯用频数直方图或频数多边图来表示。所谓频数,是指在某分数段中出现测验分数次数,经过对测验分数分布状态描述,能够从一个侧面反应出试题质量水平。其详细方法与步骤分别以下:1.用频数直方图描述测验分数分布状态第一步求全距。全距是指要处理全部测验分数中最高分与最低分差,普通用R来表示,即R=最高分数一最低分数全距主要是反应全部测验分数分布范围,而不能提供这些分数数据变异情况。4/88第二步定组数。组数普通依据全距R和测验分数个数n来确定,用I表示。R值越大,测验分数个数n越多,组数就会越多。普通用以下公式进行计算组数:

第三步定组距。组距即为全距R与组数I相除后取整,用ZR表示:

ZR=R/I5/88第四步确定组限。依据组距和全距确定每组上限和下限,通常约定每组只含下限、不含上限,即每组都是左闭右开区间。在实际计算中要取分点值比原分数有效数字多一位组实限,以防止分点值刚好是某个分数值。第五步求组中值。即求每组中点值,用M表示,其方法为:

M=组实际下限+0.5ZR第六步列频数分布表,统计落在每个组中测验分数个数,即每个组频数,将其填入频数分布表对应位置。6/88第七步依据频数分布表绘制频数直方图,其方法是:在一个直角坐标系中,以横坐标表示测验分数,从左到右标出各组分数组中值;用纵坐标表示频数,从上到下等距地标出频数数值;分别以各组组距为底边,以组中值作为底边中点,频数为高,对每组作矩形。由这一系列矩形组成图即为频数直方图。7/88

2.用频数多边图描述测验分数分布状态编制频数多边图与频数直方图在前六步是完全相同,只是在第七步进行详细绘制方法上有些区分。绘制频数多边图时,要以各组组中值为横坐标,以各组频数为纵坐标对每组分别进行描点,然后把相邻两点用直线相连即可。图形左右两侧应引至外侧一组中点,并与基线相接。8/88下面以实例说明这两种方法详细操作过程:

【例】某班级45名学生进行一次地理测验,测验原始卷面分数如表4—1。要求分别用频数直方图和频数多边图对其进行处理,以对测验命题质量作一个初步判定。9/88详细方法和步骤以下:第一步求全距R。

R=最高分数一最低分数=95-54=41第二步定组数。n=45I≈8.5对I取整,组数I=9第三步定组距。

ZR=R/I=41/9≈4.6对ZR取整,组距ZR=510/88第四步确定组限。依据约定,每一组都是左闭右开区间,所以,第一组下限为54,上限为不满58,第一组要想包含58,则实际组限为53.5~58.5;第二组下限为59,上限为不满63,实限组限为58.5~63.5。其它各组依类推,结果见表4-2中第一栏“组别”和第二栏“起止点”所表示。11/88第五步求组中值。

M=组实际下限+0.5ZR

第一组组中值为53.5+5/2=56

第二组组中值为58.5+5/2=61

第三组组中值为63.5+5/2=66

第四组组中值为68.5+5/2=71

第五组组中值为73.54+5/2=76

第六组组中值为78.5+5/2=81

第七组组中值为83.5+5/2=86

第八组组中值为88.5+5/2=91

第九组组中值为93.5+5/2=96

12/88第六步列频数分布表。依据表4一l测试分数表,对照每组组限计算出每组段所包含分数个数,并填入表4—2中第三、四栏,表4-2即为频数分布表。第七步依据频数分布表绘制频数直方图和频数多边图,如图4-1和图4-2所表示。13/883.测验分数分布状态分析原始测验分数用图表进行处理之后.能够得到各种分布曲线.经常会出现曲线形态见图4-3所表示几个情况。这些分布曲线比较直观地、形象地反应了测验分数集中趋势与离散程度.经过分析,能够对试题质量进行一个初步分析。下面分别对各曲线所反应试题质量情况作初步解释。

14/88曲线(a)表示测验分数频数呈正态分布,表明在高分段和低分段人数显著少于中间分数段人数,说明试题设计比较合理,试题难度、区分度分布正常;曲线(b)呈正偏态分布,低分段出现人数显著偏多,说明难度偏高题目多,试题难度过高;曲线(c)呈负偏态分布,高分段出现人数偏多,说明难度偏低题较多,试题难度偏低;曲线(d)呈高峰形正态分布,中间段分数出现人数尤其集中,学生之间差距没有拉开,说明中等难度题目百分比过高,试题区分度较差;曲线(e)呈平峰形正态分布,各分数段出现人数差异较小,说明试题中不一样难度题目标百分比比较靠近;曲线(f)呈双峰形分布,高分段和低分段出现人数多,而中间分数段人数偏少,说明难度过高和过低题目偏多,而中等难度题目偏少,试题难度梯度大。

15/88从图4—1和图4—2所表示例子来看,学生测验分数频数直方图和频数多边图来看,基本上呈一个负偏态分布状态,假如不考虑其它原因对学生测验分数影响,这次测验试题总体难度是偏低,中等程度学生和程度较高学生没有拉开距离。当然,以上这种分析只是一个初步判断,是以不考虑影响学生测验分数其它原因为前提。而在实际测验过程中,影响学生测验分数高低原因是多方面,并不是完全由命题质量所能决定,如出现平峰形分布曲线时,可能并不是因为易、中、难三类题目标百分比比较靠近,而是因为参加测验学生相互之间水平差异显著。所以,在实践过程中,要依据详细情况,参考其它参数对试题质量作出详细分析和解释。16/88二、平均分平均分是地理测验统计中最为惯用、方便指标之一,它是一组测验分数“代表值”,能在一定程度上反应测验分数集中趋势,也能够用来对不一样组测验分数之间进行比较。依据平均分高低能够对试题总体难度作出一个初步评判,假如平均得分比较高,试题整体难度可能偏低,若平均得分比较低,则试题整体难度可能偏高。在实际计算过程中,依据详细情况能够采取算术平均分和加权平均分。17/881.算术平均分算术平均分就是一组测验分数总和与分数个数相除所得商,假如用表示算术平均数,n表示测验分数个数,表示第i个测验分数,那么算术平均分可用下面公式来表示:

18/88【例】对表4一l所表示地理测验分数求算术平均分。依据上述计算公式,可得:

=1/45×(73+71+87+88+67+…+74+73+86+81+80)=77.7分即在这次地理测验中45名学生平均分为77.7分。19/88

2.加权平均分在同一次地理测验中,假如已经知道各个被试组测验分数算术平均分,要求计算全部考生平均分时,则需要用加权平均分来计算。其计算公式以下:

式中表示加权平均分,n表示被试组个数,代表第i个被试组测验分数算术平均分,为对应于权重系数(简称权)。20/88

【例】某学校对高一年级6个平行班进行了一次地理测验,6个班级学生数和算术平均分如表4-3所表示,求高一年级全体学生平均分。21/88三、标准差在分析试题质量时,不但要知道平均分,以了解测验分数集中趋势,而且还需要对测验分数离散程度进行描述。因为,当一组测验分数离散程度比较大时,则对应平均分代表性就比较小,反之则比较大。用来表示测验分数离散程度特征量数很多,如全距、平均差、四分差、方差、标准差等等,其中比较惯用是标准差。下面就标准差计算方法结合实例作简明说明。22/88比如,表4-4是两组学生在同一次地理测验中所得分数,要分别计算它们标准差。即第一组标准差为21.39,第二组标准差为2.40,由此可见,尽管第一组与第二组平均分近似相等,但第一组测验分数离散程度要比第二组离散程度要大多,也就是说用平均分来反应测验分数集中趋势时,第二组更含有代表性。23/88第二节试题信度

一、相关系数在地理教育测量中,经常需要考虑某两个变量之间关系或联络程度,这种关系或联络程度称为相关。假如一个变量增大(或减小)时,另一变量也会增大(或减小),则称这两个变量为正相关;反之,假如一个变量增大(或减小)时,另一个变量会减小(或增大),则称为负相关;假如两个变量之间不存在相互影响关系,则称为不相关。24/88当两个变量为相关时,而且每一对变量所确定点在直角坐标系中都分布在某一条直线上、直线附近或直线两侧.那么就称这两变量间存在线性相关。描述这两个变量之间相关程度量就是相关量数,叫做相关系数。相关系数是表明两个变量间相关程度一个指标,取值介于—1.00~1.00之间(包含一1.00和1.00在内)。25/88相关系数绝对值越大,说明变量之间相关程度越高。当两个变量呈线性相关,而且都是正态连续时,能够用积差相关系数来表示两个变量间相关系数,其详细计算公式以下:式中代表两个变量之间相关系数,x、y分别表示两个变量在改变过程中所取一系列值,n表示每个变量取值个数。26/88

【例】在其它条件都相同情况下,一次以主观性试题为主地理测验和一次以客观性试题为主地理测验中,抽取某班9位学生成绩如表4-5所表示。试分析这两种不一样题型为主地理测验成绩之间相关关系。

27/88即可求得相关系数,最终求得相关系数≈0.94这说明学生在以主观性试题为主地理测验题和以客观性试题为主地理测验题考试中所取得成绩是呈高度正相关,在不考虑其它原因影响前提下,表明主观性试题和客观性试题这两种题型都能比很好地考查学生对相关地理知识掌握情况。28/88二、信度概念信度也称“可靠性”或“测验分数稳定性”,是指测量一致性程度,表现在同一个测验在不一样时间上所得结果一致性。对信度预计或计算,通惯用相关分析方法,即计算两种变量间相关系数,以相关系数作为数据指标来衡量测验一致性程度,也称为信度系数。信度系数取值范围在0与1之间,其值越大,说明测验可信程度越高,试题“可靠性”也就越好。所以,试题信度,能够看作是试题“可靠性”,即它在多大程度上能准确地反应学生学习真实水平。试题信度是无法直接进行测量,不过能够经过考试信度系数估算来间接反应。普通来说,考试信度系数越高,说明试题“可靠性”越好,反之,试题“可靠性”则较差。29/88因为试题质量会直接影响到考试信度系数大小,这种影响主要表达在以下几方面:一是题目标数量,假如题目极少,则测验所得分数越轻易受试题取样偶然原因影响,测验信度就会降低,反之,则会提升测验信度;二是题目标难度,题目标难度会影响到测验分数分布范围,从而影响测验结果信度,如,题目难度过大,考生大部分得低分,测验分数频数分布曲线形成正偏态分布,造成分数间差异较小;三是题目标区分度,因为只有当题目有很好区分度时,才能使实际水平较高学生在测验中取得高分,实际水平较低学生得低分,这么才能确保测验结果“稳定性”和“可靠性”。30/88三、几个惯用信度意义及计算方法

依据不一样测验目标,信度能够分为两大类,即常模参考测验信度和目标参考测验信度,下面就这两大类信度意义及一些惯用计算方法作简明介绍。

1.常模参考测验信度常模参考测验主要目标是确定学生个体在群体中相对位置,测验结果一致性程度能够用每一个学生个体在群体中相对位置变动情况或用个体测验分数可能分布范围来表示。前者用信度系数(相关系数)来表示,后者用“测量标准误”来表示,它们均以测验分数变异性为前提,普通只用于常模参考测验信度测量。下面只对用信度系数估算方法进行介绍。信度系数估算方法很多,其中在中小学地理教育测量与评价中比较惯用主要有以下三种方法。31/88

(1)重测法

重测法是指用同一份试题在不一样时间对同一学生群体进行两次测验,以这两次测验分数之间相关系数作为信度系数一个方法。用重测法求得信度系数又叫重测信度或稳定性系数,它反应是两次测验分数之间一致性程度。假如两次测验分数相关性越好,说明测验信度就越高,表明试题稳定性好。32/88在用重测法估算信度系数时,要尤其注意两次测验时间间隔长短。适当时间间隔是提升估算信度准确性一个主要原因:时间过短,轻易产生练习效应;时间过长,因为被试知识背景等改变,会影响第二次测验分数。依据测验目标和性质不一样,其时间间隔能够是几天,几个月,甚至几年。在非标准化测验中极少采取这种方法来估算试题稳定系数,而在标准化测验中,采取重测法来取得试题稳定性系数不但是可能,而且稳定性系数还是衡量试题质量一个主要指标。33/88【例】假设某地理教师对某班级45位学生进行一次标准化地理测验,为评价该次测验结果稳定性,过了10周后,又用同一份试题对该班全体学生进行第二次测验,两次测验分数如表4—6所表示。试估算这次测验信度系数(为计算简便,这里仅取9位考生分数)。34/8835/88

(2)复本法

用复本法估算信度系数时,首先要编制一份在题目内容、形式、难度、区分度、评分方法、题量、分值、测验时间等方面都与原测验试题基本相同或相近复本,然后分别对同一学生群体进行测验,用考生在两次测验中所取得分数之间积差相关系数作为信度系数。用复本法求得相关系数所表示信度,叫做复本信度。它所反应是用两份等值测验试题对同一学生群体两次测验结果等值性程度。假如考生对两份测验试题都能比较顺利答对,则说明两次测验有良好等值性,可初步认为测验试题含有很好信度。所以.复本信度系数也叫等值性系数。36/88产生复本信度误差起源有:假如两次测验时间间隔过长,第二次测验分数易受被试在此期间学习、练习等影响;假如两次测验连续进行,则轻易使被试感到疲劳,测验时注意力分散,而影响测验分数。不过,复本法因使用是两次不一样测验,能够进行连续测验,从而尽可能防止因为时间间隔过长而引发被试特质成长或改变,而且被试练习效应显著低于重测法。可见,复本法略优于重测法。37/88【例】某地理教师编制了A卷和B卷两份等值试卷,为了解测验结果信度,对某班45位学生先后用A卷和B卷施测,两次测验分数如表4~7所表示。试估算复本信度。(为计算简便.这里仅取9位被试分数)38/88自己用excel生成公式算出相关系数39/88求得≈0.97,即复本信度系数为0.97,考生在两次测验中所得分数呈高度正相关,说明两份测验试卷间有很好等值性,可认为测验试卷可靠性良好。40/88

(3)折半法

折半法普通作法是:将整份测试卷全部题目分成对等两半,然后依据考生群体中每位考生在两半部分题目上得分,计算积差相关系数,最终用对应校正公式对积差相关系数加以校正,以求得测验或测验试卷整体信度系数。其关键在于怎样将测验试卷进行分半,比较惯用有三种方法:一是完全随机分半;二是奇偶题目分半,即奇数题组成一个部分,偶数题则为奇数题复本;三是测验试卷分成若干个内容块,再将各内容块题目奇偶分半,全部奇数题和全部偶数题各组成一个分测验。41/88用折半法求得测验或测验试卷整体信度,叫折半信度,其信度系数叫折半信度系数。折半信度主要反应是测验或测验试卷内部全部题目之间一致性或同质性程度。折半信度误差主要来自测验中分半过程,不一样分半方法所得分半信度是会有差异。不过,它能够防止重测法和复本法误差源,而且方便易行,含有良好可行性,是一个实际教学中最为惯用一个信度估算方法。42/88在对考生群体在两半部分题目上得分积差信度系数进行校正,以得到测验或测验试卷整体信度系数时,要依据不一样情况采取不一样校正方法:43/8844/88可见两个方差相差非常靠近,所以可用斯皮尔曼-布朗公式校正。45/88第三步校正即这次测试卷整体信度系数为0.9846/882.目标参考测验信度

目标参考测验目标不在于区分考生相互间差异性,而是检验考生是否已经到达既定教学目标。所以不能用相关系数作为衡量信度标志,而需要用另外方法来测量它信度。比较惯用方法主要有以下两种。(1)分阶段比较法分阶段比较法是对考生在前后两个阶段目标参考测验结果进行对照,以后一阶段测验结果来检验前一阶段测验信度。

经过分析能够了解测验内容与实际教学中要求掌握内容之间一致性程度,来测量试题内容质量。

假如信度高,说明试题内容反应了教学要求,试题质量较高,不然,试题质量就不高。47/88其详细步骤是:第一步,对考生进行第一次测验(前期目标预测测验),即对考生进行一次较低水平目标参考测验,确定一个决断分数,从测验中找出高出决断分数考生,并认为这些考生已具备进入下一阶段学习所需要条件。第二步,让这一部分考生进入下一阶段学习或训练。在完成学习或训练之后,对考生进行第二次测验(后期目标检测测验)。第三步,分析结果。因为这部分考生在第一次测验之后被认为已经具备进入下一阶段学习条件。所以在第二次测验中能到达目标可能性应该比较大。可见,假如在第一次测验中到达目标大部分考生在第二次测验中也能到达所要求目标,则可认为上一次测验信度是高。假如在第一次测验中到达目标许多考生在第二次测验中得分很低,没有到达所要求目标,则可认为第一次测验信度不高。48/882.复本法复本法详细做法是:用两份等值测验试卷对同一考生群体进行两次测验,事先确定一个决断分数,假如考生测验分数低于决断分数,则认为不合格,然后统计出两次测验中均合格(两次测验都合格)人数(a)和均不合格人数(b),用二者总数与参加测验总人数(n)百分比来判断测验信度。即用两次测验合格与不合格一致性百分比作为测验信度(r)。其计算公式以下:49/8850/88第三节试题效度试题信度主要反应是试题“可靠性”,能够经过考生在测验中所得分数稳定程度来反应,它是评定试题质量一个主要指标。但即使在试题“可靠性”很好情况下,也不能完全断定这是一份高质量试题。比喻说用一支温度计对同一物体进行连续屡次测量,尽管每次测量结果都高度一致,也就是说测量信度是很高,不过,假如温度计本身刻度不准确,测量结果还是无效。所以,要评定一份试题质量好坏,还要把握另一个主要指标——试题效度。51/88一、效度概念效度也称“测验有效性”,是指某次测验所能提供对某一特质所做预测理想程度,也就是测验在多大程度上测试了所要测东西,它代表是测验准确性。对地理测验来说,则表示所测验内容能否反应学生在掌握地理方面一些特质,如测验内容是否充分反应所要测量地理教学内容教学目标和要求,能否预测所要测量某种地理技能在未来某一时期发展情况等等,假如不能很好做出反应,测验自然就是无效。

52/88比如,在测试学生对地球运动这节内容掌握程度时,假如测验试题选取是一些相关地壳变动方面内容,则自然不能到达预期想要知道结果,这种测验显然是无效。依据不一样用途,效度通常能够分为内容效度、效标关联效度和构想效度。下面就这三种效度意义和估算方法做简单介绍。53/88二、几个惯用效度及预计方法

1.内容效度内容效度是指测验内容反应出考生掌握相关教学内容和实现预期能力提升程度,即测验内容能否反应所要测试目标和要求。比如在测验考生掌握“时差”这一概念程度时,用“北京位于东八区,东京位于东九区,当北京是年11月21日晚上12点整时,东京是年()月()日()点”这一题目来测试,显然要比“中国首都是(),日本首都是()”这种测验试题更含有内容代表性,即内容效度更高。54/88教学内容和教学目标是内容效度两个主要原因。在一次测验中是否含有理想内容效度,其关键自然也就在于测验试题取样是否适当,而不在于测验形式。所以,为了提升测验内容效度,在命题时,应依据地理课程标准要求要求掌握各部分地理课程内容,以及应提升各种地理技能、地理能力等等相对主要性,确定它们在测验试题中应该占有比重,并依据这个比重来命题。55/88评定内容效度时,主要是经过比较地理测验内容与地理课程标准要求一致性程度来衡量,不过当前还没有一个很好方法来统计这种一致性程度大小。现在采取比较多是先编制一份双向细目表,然后将测验内容对照双向细目表进行逻辑分析和比较方法。其详细做法是:56/88首先,依据想要测验教学内容范围编制一份双向细目表,它包含教学内容和教学目标两大维度,各维度又分为若干个小项,列出每一项相对百分比。然后,分析测验试卷每一个题目,确定它们所包括相关地理知识和技能,列出包括同一教学内容和教学目标题目,并统计它们分值及在整份测验试卷中所占百分比。最终,把测验试卷内容结构与对应双向细目表进行比较分析,计算测验内容对双向细目表范围覆盖率,从而获取衡量内容效度指标。57/88不过,这种方法只能从表面上了解地理测验内容与地理课程标准要求一致性程度,而无法真正测出双向细目表所列内容。比如,有这么一道填充题,“我国冬季气温()差异很大”,出题本意是想测试学生对我国冬季气温地域差异掌握情况,应该填“南北”,因为题意表述不明确,即使学生可能知道我国冬季气温地域差异性,但学生也可能会填“早晨和中午”,结果无法到达预期测试目标。、58/882.效标关联效度效标关联效度,指某测验对考生当前或未来某种能力、行为进行测试、预测有效性。比如,用一次地理测验来衡量学生参加地理兴趣小组所需相关地理能力,以组建地理兴趣小组。假如地理测验对学生能力预测性很差,即效标关联效度很低,则选进来学生可能就是一些并不符合参加地理兴趣小组要求学生,而那些真正符合要求学生反而没有入选。在这里,学生地理能力既是被预测内容也是检验测验效度标准,简称效标,它惯用另外一个测验结果来表示。假如测验分数和作为效标分数取得时间间隔很短,则称为同时效度;若取得时间间隔比较长,则称为预测效度。效标关联效度也就是反应测验分数与效标相关程度高低。59/88估算效标关联效度方法有各种,如相关法、团体区分统计检验法、预测表等,其中比较惯用是相关法。下面只对相关法估算方法作简单介绍。相关法,是指用统计方法求出被测测验与效标测验二者所得分数之间相关系数,作为衡量效标关联效度高低指标。假如用x、y分别表示被测测验和效标测验所得分数,、分别表示被测测验和效标测验所得分数平均分,r表示二者间相关系数,则计算公式以下:60/88r取值范围为-1≤r≤1,假如r>0,说明二者是正相关,取值越大,表明效度越高;假如,r<0,说明二者是负相关;假如r=0,说明二者不相关,效度为零。61/88相关系数计算方法还有以下两种。①用标准分数Z用ZX、Zy分别表示被测验和校标测验所得分数标准分数,学生数用n表示,则②利用原始分数62/88

3.构想效度构想效度是指测验对于被称作构想某理论概念或特质测量程度。普通认为构想效度包含内容效度和效标关联效度,而不是一个独立效度。所谓“构想某理论或特质”,是指人行为过程中表现出来一些抽象属性或心理特质,如学习地理兴趣、学习地理动机、实践操作能力、地理思维能力等。这些抽象属性或心理特质都会与某种外在可观察行为有着直接或间接联络,所以,可用后者对前者进行测量。

63/88而测量有效程度便以构想效度来表示。假如一个测验含有良好构想效度,而某考生在此测验中取得了较高成绩,则说明该考生在所测特质上有较高水平,假如测验构想效度很低,则说明测出特质并不是想要测特质,表明测验分数高考生在想要测特质上并不一定有较高水平。64/88估算构想效度方法主要有原因分析法、多元特质——多重方法矩阵研究、试验操作法,因为这些方法操作和计算过程都比较复杂,且在教学实践中用得比较少,这里就不再详细介绍了。65/88第四节项目质量评价

项目(通常称为题目)是组成试题基本单元,依据不一样测验要求能够选择不一样表现形式,如选择题、填空题、简答题等,项目质量好坏将会直接影响到试题质量高低。所以,在进行试题质量评定时,除了用试题信度、试题效度等指标对试题进行总体评价之外,还应对组成试题各个项目进行分析评定,以对试题评定愈加全方面。在评价实践中,项目标难度和项目标区分度常作为项目质量分析两个主要技术指标。66/88一、项目标难度分析项目标难度是指项目标难易程度。它能够用平均得分率(或经过率)、难度系数、极端平均得分率、难度指数等技术指标来衡量。

1.平均得分率p

在一次地理测验中,对于难度大项目,能答正确学生比较少,在这一项目上学生群体平均得分也会比较低;而当难度较小项目,能经过学生自然会增多,在这一项目标平均分也会比较高。依据这一规律,能够用参加测验学生群体对某一项目标答对率(经过率)或平均得分率作为衡量难度指标,即:

p=R/N或式中p表示平均得分率(或经过率),R表示答对该项目标考生人数,N表示考生群体总数,表示全部考生在该项目上得分平均值,S表示该项目满分分值。

67/88普通情况下,对于客观型项目(如选择题),宜采取公式p=R/N;对于主观型项目(如简答题)宜采取公式68/88

【例】某地理教师对某班45位学生进行一次地理测验,选择题第5题和简答题第3题满分分别为2分和8分,其中10位学生答题得分情况如表4一10所表示。试求这两题目标平均得分率p。表4一l0某班部分学生某次地理测验第5、3题得分学号2468101214161820第5题0220022220第3题566457687369/88因为第5题是客观型项目,用公式p=R/N比较方便,由表可知,答对第5题人数R=6,总人数N=10,将其代入公式可得即第5题平均得分率为0.6第3题是主观型项目,可用公式即第3题平均得分率为0.89。从上述两题平均得分率可知,第5题难度比较适当,而第3题难度过小。70/8871/883.极端平均得分率P和极端难度系数Q当参加测验人数较多时,能够考虑从总体中抽取一部分有代表性个体进行分析。一个比较有效抽样方法是,依据总测验成绩取考生高分组(普通取分数最高27%)和低分组(普通取分数最低27%)。然后分别求两组考生在某一项目上平均得分率(经过率),接着再求该项目标极端平均得分率:P=(PH+P1)/2式中P表示该项目标极端平均得分率,PH表示高分组在该项目上平均得分率(经过率),PL表示低分组在该项目上平均得分率(经过率)。显然,P值越大。表明该项目标难度越小。反之,则难度越大。为了增加直观性,能够把极端平均得分率P(经过率)转换为极端难度系数Q.其方法是:

Q=1-P

这么,当Q值越大时,表示项目标难度越大。当Q值越小时,表示项目标难度也越小。72/884.难度指数△用上述各种方法来估算项目难度时,只能提供不一样项目难度相对高低,而不能作绝正确比较,即它们都不具备等距性。如有三道题目,第一题、第二题、第三题难度系数分别为0.4、0.5、0.6,我们只能说第一题在三个题目中是最轻易,而第三题是最难。但不能断定第一题与第二题难度差异和第二题与第三题难度差异是相同。这主要是因为用上述方法计算难度时,原始分数并不具备等距性。假如在分析项目质量时,需要将难度表示在一个等距量表上时,则必须要对用上述方法计算所得难度值进行一定换算,其换算所得指标即为难度指数,用△来表示。因为转换难度指数时还需包括其它一些概念、指标,相对比较复杂,这里就不细讲。73/88二、项目标区分度分析项目区分度是指测验题目对其知识水平不一样考生区分程度或判别能力。假如有一道读图分析题,地理知识水平、技能、能力比较高考生得分高,而实际水平比较差考生得分要低,说明这道题有良好区分度,假如结果没有规律或刚好相反,则说明这道题区分度差。项目标区分度分析主要以效标为依据,考查考生在每个项目上反应与其在效标上表现间相关程度。在实际项目分析中,效标往往用同一次测验中取得总分来代替。其估算方法主要有以下三种。74/881.特征曲线法特征曲线法是以曲线方式来直观地描述某一项目标区分度大小。其作法是:取一直角坐标系,用横坐标代表考生在测验中取得总成绩(即效标分数),用纵坐标表示考生在某一项目中经过率(得分率),然后按照该项目标实际作答情况描绘出对应曲线,这条曲线即称为特征曲线。75/88比如对一次地理测验中某两道选择题区分度用特征曲线法进行分析,其特征曲线如图4—4所表示。从曲线中能够看出,第1题经过率(得分率)伴随总成绩(效标分数)增大而增大,说明经过率与总成绩正相关,表明总分高考生这道题经过率高,可见这道题含有良好区分度。第2题经过率随总成绩增大基本没有改变,也就是说总成绩高考生与总成绩低考生在这一题上经过率没有什么区分,表明这道题区分度很差。76/882.相关系数法相关系数法能够对项目区分度进行定量描述,其详细步骤是:第一步用公式计算相关系数:77/8878/88【例】某地理教师对某班45位学生进行一次地理测验,其中10位学生总成绩和第6道选择题得分情况如表4—12所表示(0表示答错,1表示答对)。试分析第6道选择题区分度。表4一12某班某次地理测验第6题部分学生得分情况学号135791113151719总成绩80677856817972706973第6题101010111079/88第一步,由上表可知,Xp=(80+78+81+72+70+69)/6=7580/88第二步由表可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论