华东师大数学教学测量和评估教案03数学测验的设计_第1页
华东师大数学教学测量和评估教案03数学测验的设计_第2页
华东师大数学教学测量和评估教案03数学测验的设计_第3页
华东师大数学教学测量和评估教案03数学测验的设计_第4页
华东师大数学教学测量和评估教案03数学测验的设计_第5页
已阅读5页,还剩27页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章数学测验的设计数学测验是数学教学测量的主要手段,数学测验题是这种测量的主要度量工具。随着教育测量理论、计算机科学的迅速发展,设计数学测验巳发生了显著变化,其标志就是对测验题的研究客观化,人工确定的操作和管理正在被计算机所代替。本章将探讨编制数学测验的步骤和拟造数学题的方法,并进一步研究有关数学题库的一些问题。第一节编制数学测验的步骤把数学测验目标逐级分解为指标系统,使各个指标都可以直接进行测量的量化要素就是编制数学测验。编制数学测验一般有以下主要步骤。一、明确测验目的明确测验目的就是明确测验主办者通过测验企求获得的信息。这种信息包括被试的学习状态、学习水平在被测群体中所处的位置,以及教学的效果等。测验分数是这种信息的数量表现形式。为了保证获得有效的信息,可从以下几条途径明确测验的目的。首先,通过明确测验的性质明确测验目的。测验性质是测验目的的重要体现。在实际操作中要弄清测验是常模参照测验,还是标准参照测验;是形成性测验,还是总结性测验等。其次,通过明确测验的知识容量明确测验目的。测验目的决定测验题的知识容量,测验所涉及的知识本身是揭示被试学习水平的最基本的评估要素。一般说来,要明确采用测试群体已学的所有知识中哪些是测验应涉及的。例如,学完“排列、组合、二项式定理”的测验,可以是只涉及该单元知识的测验,也可以是兼顾已学过其他单元内容的测验。第三,通过明确测验题的综合程度明确测验目的。测验题是鉴别被试达到特定目标水平的试金石,测验题的这种功能很大程度上取决于它的综合程度。一般而言,从单元测验、期中测验、期末测验到会考,其测验题的综合程度呈递增趋势。第四,明确测验目的还要明确影响获得测验信息的其他有关因素,以保证最大限度地获得有效信息。这些因素包括组织测验的形式、参加测验的人数、命题的规格、应试的情景、对被试不同的要求方式等。二、制定命题原则为了使测验达到预期的目的,提高测验的质量,命题工作一般应遵循如下原则。1.命题必须以数学教学大纲为依据,以教科书为主要参考材料。测验所涉及的数学基础知识、基本技能和能力不能超出大纲中规定的教学内容的范围和教学要求的水平层次。2.试题内容不能违背数学的概念和原理。试题的条件应恰当,试题的结论应可行,条件与结论应是和谐的。3.试题的取样应有代表性。样本要能够体现测验的内容范围与要求,有较大的覆盖面,同时也要使各部分内容各占适当的百分比,并注意考查教学内容中的重点部分。4.试题的数量要恰当。既要使大多数考生能在规定的时间内完成解答,又要使他们感到时间并不十分充裕。5.试题的难度要合适。试题的难度必须适合大多数被试的水平,要按由易到难的顺序编排试题,使按顺序的各题难度构成一个合适的坡度。6.各个试题之间应保持互相独立。不要使一个试题的解答对另一个试题的解答有暗示作用。7.试题一般应有多种解法。要使某些试题有较好的解法,让部分被试充分展示他们的创造性思维能力。8.试题的表述必须清楚明白。试题中用词不能模棱两可,文句要简明扼要,图形要正确,对解题要求的叙述必须准确、明了。9.题型应多样。要有客观性试题,也要有陈述性试题,各类题所占的百分比应恰当。10.评分标准应合理。测验题的解答过程应该是可以量化的,其量化尺度是通过评分标准给出的,命题应有利于制定清晰可辨、公平合理的评分标准。三、编制测验方案1.选定测验的知识载体分析测验题的功能和结构形式可以发现,它的本质是为评估被试的基础知识、基本技能、基本能力等教学目标水平状态提供工具,从而具有度量工具的功能,而它的结构形式是由相应的数学知识表述的,并且对同一教学目标水平的测验题可用不同的数学知识加以表述,表述测验题的数学知识称为测验题的数学知识载体。数学测验的内容确定后,选定数学测验题知识载体的途径有两种:一种是把测验所涉及的内容逐步分解到数学教学大纲所规定的知识点,然后选择适量的、重要的知识点作为测验的知识载体;另一种是对测验可能涉及的原始知识点进行聚类分析(关于聚类分析,见参考书[12])。作指标Ai与指标Aj的相似系数(相关系数)这里m为被评知识点数,xik表示第i项指标对第k个知识点的评估值,第i项指标的平均数。聚类时只要把两类之间的欧氏距离改为相似系数,先合并相似系数最大的知识点,依次进行到最后,将所有知识点归并为一类,再利用适当的阈值将测验目标分成恰当的类以确定测验的知识载体。2.预定测验的时间根据解答测验题所需的时间调整测验题和实际作答所需时间。预定测验的时间应大于实际作答时间,以便让被试有时间验算自己的解答,以提高测验的真实性。3.确定能力水平层次这里的能力,是指学生通过学习在认知行为上所达到的目标。能力水平的分层模式既要反映目标的整体要求,又要便于量化测量。至于层次划分的多少,以及记载能力层次的术语则无统一要求,选用何种能力层次划分模式可视具体情况而定。4.选取题型同一知识点和能力层次可通过不同类型的试题予以测量。若只考察解答的最终结果是否正确,则可选用填空题、是非题、选择题等客观性试题;而对于需要考察解答全过程的测验,一般宜采用陈述性试题。选择题是一种由题干和选择支两部分组成的题型。选择支是题目的备选答案,一般有4~5个,其中至少有一个是正确的。正确的选择支叫做正选支。不正确的选择支称为迷惑支,在题目中起干扰作用。在数学测验中,经常使用的是有且只有一个正选支的选择题。这样的选择题必须满足以下要求:一是,正选支应当是唯一的;二是,各选择支之间应当是平等的、协调的,不能存在包含或交叉关系;三是,题中的各个迷惑支,应当是学生在解题中可能发生的错误,以确实起到干扰作用,同时也为改进教学提供信息;四是,在一组选择题中,各正选支的代号不要过多地用某一个字母,正选支的排列应无规律可循;五是,不要滥用“以上都不对”这样的选择支,尤其是不要使它成为正选支。例1过ABCD的顶点A作SA垂直于平面AC,则直线AB、BC、CD、DA、AC、BD、SA、SB、SC、SD中每两条确定的垂直平面的组数有[](A)2;(B)3;(C)4;(D)5。本题中ABCD的性质对作出正确的选择没有影响,所涉及的知识只是面面垂直的直接判定,所设的迷惑支也起不到干扰作用,因而本题是有缺陷的。若将题中的平行四边形改为矩形,则有:过矩形ABCD的顶点A作SA垂直于平面AC,则直线AB、BC、CD、DA、AC、BD、SA、SB、SC、SD中的每两条确定的垂直平面的组数有[](A)3;(B)5;(C)6;(D)7。与原题相比,矩形ABCD的内角均为直角,将对被试正确作答产生影响。被试要6次利用面面垂直的判定定理,3次利用线面垂直的判定定理,以及运用线线垂直的判定定理,对计数的准确性也有一定的要求,所设的迷惑支均是不同程度错误计数的结果。若把矩形改为正方形,又有:过正方形ABCD的顶点A作SA垂直于平面AC,则直线AB、BC、CD、DA、AC、BD、SA、SB、SC、SD中每两条确定的垂直平面的组数有[](A)3;(B)5;(C)6;(D)7。与矩形的情形相比,正方形对角线的位置关系也将影响被试正确作答,此时除矩形的解题要求外还涉及线面垂直的性质定理。由于对角线分别所在的两个平面位置有几种情况,因而要求被试有很强的空间想象力和灵活运用所涉及的知识的能力才能判断垂直平面的组数。例2已知(a2+a-6)x2+(a2+a-6)y2+4-a2=0表示圆,则a的取值范围是[](A)a<-3,a>2,-2<a<2;(B)-2<a<2;(C)-3<a<-2;(D)a≠-3,a≠2的实数。本题四个选择支的表述差异很大,而正选支(A)的地位尤其突出,容易引起被试的猜测而选(A),为了弥补这些不足可将原题改为:已知(a2+a-6)x2+(a2+a-6)y2+4-a2=0表示圆,则a的取值范围是[](A)a<-3,a>2,-2<a<2;(B)a<-2,a>2,-3<a<2;(C)a<-3,a>2,-3<a<2;(D)a<-2,a>2,-2<a<2。新拟造的选择支,是兼顾到求a的取值范围时易出现的错误加工而成的,在保留错误性质的基础上各选择支的结构和谐一致,可减少被试猜对的可能性。(A){2};(B){-1};(C){x|x≤-1};(D)φ。本题是一道高考题,从抽取498名考生答题情况看,347人选(B),9人选(C),142人选(D),无人选(A),由此可见迷惑支(A)没有干扰力,(C)的干扰力也很差。究其原因,是(A)中的集合明显不是集合A的子集,(C)也一样,因而不借助集合B即可断定(A)、(C)都不是正选支。为了降低集合A对作答的提示作用,本题可改为:(A){3};(B){-1};(C){x|-1≤x≤3};(D)φ。新设立的选择支(A)中的集合是集合A的子集,只有借助集合B才能判定(A)是否为正选支;新设立的(C)与原题中的(C)在错验证来判明(C)是否为正选支。5.分配测验总分分配测验总分就是将测验总分分解,并赋给各试题具体分值。与分值相结合的试题的全体即构成具体获得测验目标的工具。怎样分配测验总分呢?确定试题和解答试题所涉及的知识点,同时考虑各知识点在解题中的作用和正确解答该题所需的最高能力水平,以此为依据来确定分数Sij。这样就可构造出测验方案——双向细目表。表3-1是双向细目表的一般形式。表中Sij表示能力j层次在知识点i上的得分,这里知识点的划分是相对于测验的内容范围而言的,有时也可用相对独立的知识单元作为知识点。如果所得的双向细目表不能反映测验的目的要求,则可调整试题,经过数次调整就可得到较为满意的测验方案和测验题。例如,经多次调整后,全国初中数学教学抽样调查测试方案如表3-2(见下页,测试题见附件一)。6.制定评分标准评分标准是阅卷评分应遵循的准则。它包括预先判明(估计)被试解答的评分标准和预先不能判明被试解答的评分标准两个部分。

第二节数学题的拟造由已知条件、已知条件展开的数学逻辑叙述(推理)过程,及由此得到的结论这三个要素组成完整数学意义的陈述。隐去或部分隐去真实、确定的完整数学意义陈述的构成要素,要求应答者构造完整数学意义的陈述。这种构造过程就是拟造数学题。拟题的方法有以下几种。一、改编陈题习惯上把数学教科书中的例题、习题和其他各类书刊上已有的题目等称为陈题。根据陈题拟造新题,所得的新题源于陈题,又有新意,对作答者要求的针对性较强。它是拟造新题的一种常用方法。1.变更陈题的结论拟造新题这种拟造新题的方法是保持陈题的条件不变,变更陈题的结论。怎样变更结论呢?(1)将陈题的结论特殊化拟造新题例1已知数列{an}满足其中c≠0,且c≠1,证明这个数列的通项公式是(选自高级中学课本《代数》(下册))若考察这个数列的第10项,可拟造如下的题目:已知数列{an}满足其中c≠0,且c≠1,求a10。(2)将陈题的结论作为中间结果拟造新题例2如图3-1,⊙O1和⊙O2外切于点A,BC是⊙O1和⊙O2的公切线,B、C是切点,求证AB⊥AC。(选自初级中学课本《几何》(第二册))将AB⊥AC作为进行下一步推理的条件,可拟造如下的题目:如图3-1,⊙O1和⊙O2外切于点A,BC是⊙O1和⊙O2的公切线,B、C是切点,求证:以BC为直径的圆必与线段O1O2相切于点A。(3)将陈题的结论作等价变换拟造新题例3求证:将等式的右边作等价变换,可拟造如下的题目:求证:2.变更陈题的条件拟造新题这种拟造新题的方法是保持结论不变,变更陈题的条件。变更条件有如下途径。(1)将陈题的条件作等价变换拟造新题例4设(x-3)2+(y-1)2=0(x,y为实数),求x、y。(选自初级中学课本《代数》(第四册))等价变换本题条件的表述形式,可拟造如下的题目:已知x2-6x+y2-2y+10=0(x,y为实数),求x、y。(2)寻找得到陈题条件的条件拟造新题例5已知数列{an},其中an=cosnα(0<α<π),求a1-a2+a3-a4+…+(-1)k+1ak+…-a2n+a2n+1。由an=cosnα可得an=2an-1cosα-an-2,但反之不然。为了能由an=2an-1cosα-an-2,得出an=cosnα,显然还需附加规定a1=cosα,a2=cos2α。这样可拟造如下的题目:已知数列{an},其中a1=cosα,a2=cos2α,an=2an-1·cosα-an-2(n≥3,0<α<π),求a1-a2+a3-a4+…+(-1)k+1ak+…-a2n+a2n+1。(3)将陈题的条件一般化拟造新题例6如图3-2,已知点C为线段AB上一点,△ACM与△CBN均是等边三角形,求证:AN=BM。(选自初级中学课本《几何》(第一册))该题中C点被限制在AB上。一般地,若C是任意一点,也有同样的结论,这样可拟造如下的题目:如图3-3,已知点C是任意一点,△ACM与△BCN均是等边三角形,求证:AN=BM。(4)将条件特殊化拟造新题例7已知P为定角∠XAY的平分线上的定点,过P、A两点任作一圆与AX交于点B,与AY交于点C,求证AB+AC为定值。过P、A两点任作一圆与AX交于点B,与AY交于点C,求证AB+AC为定值。3.同时变更陈题的条件和结论拟造新题同时变更陈题的条件、结论是一种较为有效的拟题方法。(1)通过类比关系拟造新题将陈题的知识背景与另一知识背景建立类比关系,从而拟造出类似的问题(新题的正确性用另外途径加以证明)。例8证明圆内接n(n≥3)边形中的面积最大者为正n边形。若已知圆的半径为R,求出这个最大面积。有x′2+b2y′2=R2,进一步可得这样把圆压缩(拉伸)为椭圆,从而圆与椭圆可进行类比。对于椭圆,可拟造类似的题目:(2)将陈题的条件和结论同时一般化拟造新题例9已知a,b∈R+,a≠b,求证a4+b4>a3b+ab3。(选自高级中学课本《代数》(下册))分别将条件和不等式左、右两边各项同时一般化,有:若ai∈R+(i=1,2,…,n),n,m,p,q均为自然数,且p+q=m,求证:当且仅当a1=a2=…=an时等号成立。(3)将陈题的条件和结论同时特殊化拟造新题例10如图3-4,AB和平面α所成的角是θ1,AC在平面α内AC和AB的射影AB′成角θ2,设∠BAC=θ。求证:cosθ1·cosθ2=cosθ。(选自高级中学课本《立体几何》(乙种本))令θ=60°,则可将该题的部分条件和结论特殊化,并拟造出如下的题目:如图3-4,AB和平面α所成的角是θ1,AC在平面α内,AC和AB的射影AB′成角θ2,若∠BAC=60°,求证:2cosθ1cosθ2-1=0。(4)交换陈题中的条件和结论拟造新题将陈题中的条件与结论全部交换,或将部分条件与部分结论交换,拟造新题。例11如果f(x)=ex,求证f(x)f(y)=f(x+y)。(选自高级中学课本《代数》(上册))将该题的部分条件和结论互换,可拟造如下的题目:已知f(x)不是常数函数且满足f(x)f(y)=f(x+y),求证f(n)=[f(1)]n(n∈N)。(5)以陈题作为解题依据拟造新题有些陈题本身是重要的命题,利用它可以拟造新题。例12如果两条曲线的方程是f1(x,y)=0,f2(x,y)=0,它们的交点是P(x0,y0),证明方程f1(x,y)+λf2(x,y)=0的曲线也经过点P(λ是任意实数)。(选自高级中学课本《平面解析几何》)利用本题作为解题依据可拟造如下的题目:求经过圆x2+y2-10x-10y=0与圆x2+y2+6x+2y-40=0的交点,且过点(4,5)的圆的方程;求证三个圆x2+y2+4x+2y+1=0,x2+y2-6x+4y+1=0,有两个公共点。二、编制新题1.利用实际问题拟造数学题通过建立数学模型,将实际问题抽象出新的数学问题。这类题的结构为:实际问题情景,数学模型化,解数学模型,从而解答这个实际问题,其目的是为了测量被试灵活运用所学数学知识分析和解决实际问题的能力,而解答这类题的关键,是从所学的数学知识中选取合适的数学知识,将实际问题数学化,因此拟出的题的本身应尽量减少暗示被试采用某种数学知识作答。例13某人想利用树影测树高。他在某—时刻测得1米长的竹竿影长为0.9米。他同时测树高时,因树靠近一幢建筑物,影子不全落在地面上,有部分影子在墙上。他测得留在地面部分的影长为2.7米,留在墙壁部分的影高为1.2米。求树高。拟造这类题时,应先选定日常生活中的事实作为背景,然后用合适的数学语言来表述它。为了便于被试者理解,必要时需对实际问题进行适当加工。2.利用数学自身问题拟造新题利用已学过的数学命题间的不同组合进行逻辑推导,是拟造新题的主要方法。(1)由给定的条件确定结论拟造新题先给出题目的已知条件,由已知条件推出其结论,然后比较其中独立结论得到的途径,以确定作为新题的结论。例14如图3-5,已知三棱锥S-ABC的侧棱SA、SB、SC两两垂直。由此可得以下结论:三个侧面两两垂直;底面△ABC是锐角三角形;顶点S在底面的射影H是△ABC的垂心;△SAB的面积是△HAB的面积和△ABC的面积的比例中项;底面积的平方等于各侧面积的平方和;三棱锥S-ABC的体积设SA=a,SB=b,SC=c,SH=h,又有:选取上面的结论与已知条件相匹配即可拟造很多题目。例如:如图3-5,已知三棱锥S-ABC的侧棱SA、SB、SC两两垂直,求证底面积的平方等于各侧面积的平方和,且其体积(2)由给定的结论确定条件拟造新题先给定结论,再寻找结论成立的充分条件,然后比较其中独立条件得到的途径以确定新题的条件。b的具体值;也可给出a2+b2与ab的值;或者给出a+b与ab的值,这样可拟造如下的题目:(3)利用基本量法拟造新题在一个系统中,如果任意一个量都可由几个量导出,而这几个量又不能相互导出,则称这几个量为该系统的基本量。利用基本量法拟造数学题的思路:弄清系统的量,确定系统基本量并给予赋值,设计条件拟造题并审定计算顺序。应该指出,一个系统的基本量不一定相同。例如与等差数列{an}相应的量有a1、n、an、Sn、公差d等,而a1、d、Sn和d、n、Sn分别可作为它的基本量。利用等差数列的基本量可拟造如下题目:在等差数列{an}中,a6+a9+a12+a15=30,求S20。(4)利用新的数学概念、运算法则拟造新题利用新规定的概念、法则等拟造数学题的主要步骤为,首先用中学数学的概念、法则等阐述新概念、法则的意义,然后用新概念、法则提出数学题。例如,用中学数学语言揭示不动点的意义后,可拟造如下的题目:如果函数f(x)的定义域为实数集,而实数c使得f(c)=c,则称c是f(x)的一个不动点。设f(x)的不动点数为有限多个,下述命题“若f(x)是奇(偶)函数,则它的不动点数目为奇(偶)数。”是否正确?若正确请给予证明,若不正确请举一个例子说明。应该指出,本题除对不动点的概念在中学数学范围内作出解释外,不动点数为有限多个的条件也极为必要,否则f(x)=x的不动点数是不可数的,当然不存在总个数的奇偶性问题。同样,f(x)=|x|的不动点数也是不可数的,也就不存在总个数的奇偶性问题。(5)以高等数学知识为背景拟造新题以高等数学的思想和知识为背景,把高等数学中的问题初等化,可以拟造新题。如(4)中不动点的定义和只有有限个不动点的条件,可看成构造这类题的例子。下面再举一例。高等几何中有一个帕斯卡(Pascal)定理:“二阶曲线内接六角形的对边交点共线”。在这个定理中,把二阶曲线特殊化为圆,内接六角形用内接六边形代替,相应的对边改为对角线,则可拟造以下的题目:已知圆的内接六边形的顶点为A(-3,4),B(0,5),C(4,3),D(4,-3),E(-3,-4),F(-5,0),求证AE与FB的交点、AD与CF的交点、BD与CE的交点在同一直线上。利用帕斯卡定理的对偶定理“二阶曲线的外切六边形的对顶点连线共点”(这个定理被称为布里安桑(Brianchon)定理),则可拟造如下的题目:已知六边形HIJKLM与圆相切于点A(-3,4),B(0,5),C(4,3),D(4,-3),E(-3,-4),F(-5,0)。求证HK、IL、JM三条直线共点。若把圆改为椭圆,显然也可得到类似的题目。(6)不完全确定条件或结论拟造新题到目前为止,我们所探讨的数学题,其条件和结论均是完全确定的。但在数学教学中,还经常使用结论或条件不完全确定的题的拟造方法。请看下面几道例题:例16设a、b是两个实数,A={(x,y)|x=n,y=na+b,n为整数},B={(x,y)|x=m,y=3m2+15,m是整数},C={(x,y)|x2+y2≤144}是平面内点的集合,讨论是否存在a和b使得A∩B≠φ,且(a,b)∈C同时成立。例17求在Acos2θ+Bcos2(ψ+θ)+Ccosθcos(ψ+θ)的值与θ无关的条件。例18设等差数列{an}的前n项和为Sn,已知a3=12,S12>0,S13<0。指出S1,S2,…,S12中,哪一个值最大,并说明理由。例19设△ABC的三边a、b、c满足an=bn+cn(n∈N,n≥2)。试判定△ABC的类型。由这几个例题可以看出,拟造这类题需对所探求的条件或结论的范围作限制,而且这个限制表现在解答过程需要对条件或结论进行讨论。还应指出的是在数学教学实践中,有时还使用由给定的条件(结论)所导出的结论(条件)难以限制的题作新题。这类题对培养学生的发散思维是有益的。例20任意一直线截ABCD,分别交BC、CD于F、G,交AB、AD的延长线于E、H,⊙EFC与⊙GHC的另一交点为Q,请写出由此条件出发可能得到的结论,并说明理由。结论1∠QEH=∠CAD;结论2∠GDH=∠GHQ+∠QEF;结论3△EQH∽△CBA,△EQH∽△ADC;结论4EQ·AC=EH·BC,EQ·AB=EH·AD;结论5∠EQC=∠GFC,∠HQC=∠FGC;结论6∠EQH+∠A=180°;结论7A、E、Q、H四点共圆;结论8∠FQA=∠EHA;结论9Q在AC上;结论10EH的移动对Q在AC上无影响。由于该题的结论数难于预控,制定评分标准困难,拟定试题时应避免此类题型。

第三节题库反映现代编制数学测验技术的题库理论和它的应用,主要涉及题库的意义、题库建设、利用题库生成数学测验题这三个方面的内容。一、题库的意义20世纪中叶,迅猛发展的世界经济迫使人们寻找编制测验的新技术,以保证客观、准确、及时地选拔人才,题库正是顺应这一时代潮流需要的产物。题库的建立使编制测验技术发生了根本性的变革。在已建立的不同级别、不同类型题库的实践中,已显示了题库的优越性。1.题库的概念题库是带有必要参数的大量题目的有机组合。按建设题库的主管单位划分,有国家级、省级、校级等题库;按其生成测验题的能力,则可分为只能生成一种测试性质的单功能题库,以及能生成两种或两种以上测试性质的多功能题库;按构成题库的学科可分为单分支学科题库和多分支学科题库;按接受测试的对象来分,则有适宜于各级、各类在校学生与适用于非在校人员的题库。容量小的题库往往只有单功能,而国家级和省级题库一般具有多种功能。题库除了能完成建库所规定的任务外,还应符合如下标准:(1)高效、经济、保密、易于管理;(2)库题的质量应是较高的,能预控,且等值可比;(3)题库应便于技术上的维修,并不断完善和增加新库题,具有根据考试水平的变化及时修改库题的参数值的能力。2.建立题库的基本条件建立题库一般应具备如下基本条件:(1)有一个成熟、稳定、明确的考试大钢。这个大纲应对不同性质、层次和目的考试的内容、能力要求,考试方式和对象作出明确说明,以便明确库题的内容、题型、权重和完成时量,避免构造无效库题。(2)有一个命题和审题的专门队伍。命题的专门队伍由职业专家和兼职人员(有关学科的教师和爱好者)组成,其任务是根据考纲拟造题目。而审题班子,则是由各种测评专家和经验丰富的教师组成的,鉴定题目能否入库的具有决定性的权威组织。(3)有科学有效地测试拟入库题指标的方法。对于一个题目,必须判明其适宜性、难度、区分度、及格要求度、信息函数值等才能决断该题能否入库。目前,用经典测验理论(CTT)建立的难度、区分度等指标法,在建设题库时仍在使用;由项目反应理论(IRT)建立的适宜性、难度、区分度、及格要求度、信息函数值等指标法,在一定场合下对确定库题也非常有效。但由于CTT对样本依赖性强,而IRT对多级评分模型又不能直接使用,所以建设题库的权宜之计是CTT与IRT并用。(4)有建立库题的分类系统。为便于管理,对库题必须进行分类。分类标准可以是知识结构,也可以是题目的指标值。整个分类系统由基本情况(名称和索引、编制和使用情况、来源和加工情况等)、内容分类、试测数据(指标状况)、答案等组成。(5)有大量的题目。校级单功能题库,一般实际考题数与库题数之比不低于1∶10,而省级、国家级的题库,按照多功能性的要求,其库题数应逾万。(6)有合理完善的保存库题的方法。无论是用题卡还是用计算机保存库题,都必须完整地记载分类细目,而且要利于检索和管理。二、题库的建设建设题库,首先必须把好题目的入库关。题目入库后,还必须建立相应的管理、维护和扩充题库的措施。1.选择库题的标准根据所建题库用于编制测验题的性质,CTT与IRT各有确定库题的标准。(1)利用CTT确定库题φ-系数法是用于CTT建立题库时的简单易行的确定库题的方法。通常规定其中PH表示成绩好的答对率,PL表示成绩差的答对率,当被测总数N>30时,计算PH、PL的人数均取27N%,而具体操作为:第一步,求出φ。根据抽取的被试样本的测试结果,利用φ-系数公式求出φ值。第二步,检验。利用大于φ0.05,就可保证肯定性判断错误的可能性不超过5%。一般地,当φ≥0.5时有较好的区分度。如图3-6,其阴影部分中的点(φ,P)所对应的题可入选为库题。φ-系数法的精确性很大程度上依赖于被抽取的测试样本,而且等值问题未能得到有效解决,对于库题的参数也未能予以充分揭示。尽管如此,在建立小型题库(如校级题库)时,它仍不失为一种可行的方法。(2)利用IRT确定库题IRT是一种关于能力测量的理论。它的理论基础是能力单维性(每题只测验一种能力),局部独立性(考生对测验各题的反应在统计上是独立的),题目特征曲线(ICC),完成时间充分性(考生完成测验题的时间是足够的)四个假设。它包括复杂程度不同的多个模型,目前被广泛使用的是下面的逻辑斯蒂(logistic)模型。三参数模型(其中难度b,区分度a,猜测因素c)二参数模型(其中难度b,区分度a)单参数模型(其中难度b)又称拉什(Rasch)模型以上三个模型中参数取值的正常范围分别为:0≤ai≤2,-3≤bi≤3,0≤ci≤1,D=1.7(D被称为调整因子,是常数)。更精确的D值可取为1.704。这里,Pij(θ)表示能力水平为θ的考生按第j种模型计算答对第i题的概率,显然有对于单参数模型表示的能力和水平,可通过公式联系起来,这里fr为具有r分数考生的能力估计值,bi为第i题的难度估计值。规定题i对测验信息函数的贡献为题i的信息函数,这里只P′i(θ)为Pi(θ)关于θ的一阶导数,Qi(θ)=1-Pi(θ)。利用IRT建设题库具有难度与样本无关、能力与题目无关的优点,便于对题目和考生作适宜性检验,及研究整卷的效度、难度。由此建立的题库易于扩充,并能根据考生水平调整库题的难度值。IRT在题库建设中有多方面的应用。第一,估计能力参数θ与题目参数a、b、c。对参数估计的研究一直是IRT研究的一个重要问题,已有的估计能力参数θ和题目参数a、b、c的方法有多种。下面用极大似然估计和近似估计方法对逻辑斯蒂三参数模型的参数进行估计,可见求参数的一般过程。先看逻辑斯蒂三参数模型参数的极大似然估计。设被试样本容量为N,其个体能力水平为θi(i=1,2,…,N),θ=(θ1,θ2,…,θn),选取M道题目测试,第j(j=1,2,…,M)道题的反应为uj,u=(u1,u2,…,um),样本对题作出的反应概率为P(u|θ),利用IRT的局部独立性假设,有L(u|θ)就是极大似然函数。利用极大似然估计可得:能力参数估计式题目参数估计式这里Qji=1-Pji,D=1.7,Pji=P(uj|θi),a=(a1,a2,…,an),b=(b1,b2,…,bn),c=(c1,c2,…,cn)。根据θ、a、b、c的初值以及上述3M+N个方程,用迭代法反复在θ和a、b、c之间进行迭代,能按预定的精确度求出θ和a、b、c的值。若将求解的过程设计成程序,可以用计算机求解。再看逻辑斯蒂三参数模型参数的近似估计。在大样本和能力参数θ服从正态分布的条件下,近似估计逻辑斯蒂三参数模型的参数有如下关系式:其中ρ′iθ是ui与θ的点二列相关系数,ρiθ是第i题与θ的点二列相关系数,πi为第i题的通过率难度,φ(t)是标准正态分布的密度第二,库题的适宜性检验。测验者对题目作出的反应是否与测量模式所期望的相符,这就是题目的适宜性。建设题库的选题是为编制测验作准备的,因而必须查明拟入库题的适宜性。规定Z2=exp[(2x-1)(f-b)]为残余值,式中f为能力值,b为难度值,答对时x=1,答错时x=0,可通过下面步骤对拟入库题作适宜性检验:第一步,按题目从易到难为行序,得分由高到低为列序构成分数矩阵。第二步,设∑Z2表示各测验者标准残余值的和,利用作t检验,其中df为自由度。第三步,以总题数-1为题目数的自由度作能力值t检验,以测验人数-1为自由度作难度值t检验,决定拟入库题是否可作为库题接受。在缺乏分布表的情况下,当t<3时可接受,t>5时应加以拒绝,当3≤t≤5时应作进一步不合适的原因分析。2.建设题库的方法建设题库的方法起初是实验性的,由此所生成的库题具有随意性,只能生成具有特定性的小规模测验题。当今,建设题库的方法已得到根本的改变和发展。建设库题可按如下步骤进行:(1)作好拟入库题的开发工作开发拟入库题可按两种形式进行:其一,组织专家从事库题的开发和研究;其二,向广大教师及有关学科爱好者征题,由此而带动开发库题的群众性活动。(2)分析等值所谓分析等值主要分析题目间的难度b、区分度a是否等值,并把它转化到一量表上。用CTT分析等值受样本的影响较大,故一般用IRT进行等值分析。在二级评分模型中,具体应用IRT理论进行等值分析的途径很多。PROX过程使能力与难度相分离,可对能力与难度进行数值比较,又易于操作,其步骤如下。第一步,整理数据。删除全答对或全答错的题,构成分数矩阵(表3-3)。第二步,根据分数构造题目难度值分布表3-4,表中fi表示能力,第三步,根据分数矩阵整理出测验者能力值的分布(表分3-5),第四步,求出离差扩张因子X,Y:第五步,用X校正能力值,用Y校正难度值,通过以上各步骤求出的fr和bi具有可比性。当bi<0时,题偏易;当bi>0时,题偏难。题库总是按br将库题分等。例如,按容易(br≤-3),比较容易(-3<bi≤-1),中等难度(-1<bi≤1),比较难(1<bi≤3),难(bi>3),可将库题分为五等。当然也可采用其他标准将库题分等。PROX过程虽容易理解,但较复杂,再加上逐一测试,工作量大,因而常用学科评估专家对拟入库题进行估计来推导有关参数值。这已成为一种可行的方法。在二级评分模型中,可以证明,用贝叶斯(Bayes)估计参数得的难度值bB与专家评估难度bη有如下关系式bB=0.613+1.333bη(相关系数为0.712,误差标准差的估计为0.7383),或(误差标准差的估计为0.70)。通过率p与bη的关系为(误差标准差的估计为0.0017)。通过率p与bB的关系为bB=3.0516-6.1244p(相关系数为0.975,误差标准差的估计为0.073)。我们认为,只要有一定数量的,并在测评题目方面有丰富经验的教师,就可用上述关系求bB。类似于分数的等值定义可给出内容难度等值的定义。如果在任一题组中(实际上取一个题目大样本)两个水平相同的专家组评定的两题的百分等级相等,则称这两题的内容难度等值。例如,取60道题构成大样本,由A、B两个专家组对其内容难度值进行评定。若题甲由A评定的内容难度值为0.6,其所在百分等级是30,而题乙由B评定的内容难度值为0.65,其所在百分等级也为30,则题甲与题乙的内容难度值相等。(3)贮存库题建设题库设置题卡是早期建设题库的主要方法,现代题卡主要由正文、答案、评分标准、使用情况、使用后记录、适宜性记录、及格要求度、各种参数(a、b、c)值、命题人、审题人和编卡时间组成。为了便于查阅,还需对题卡进行分类编号。早期的题卡没有如此详尽的记载,而且不用计算机贮存。尽管如此,当今没有计算机管理系统的单位仍采用较完备的题卡以建立题库。但是,随着题库容量大幅度增加,对题库的管理和使用提出了很高的要求,今天利用计算机技术建库已成了建库的主流和方向。利用计算机技术可把库题存于机内,也可把库题单独放在机外。前者管理起来方便,但对内存要求高;后者节省了计算机存储空间,但管理不太方便。随着计算机存储容量的提高,目前一般倾向于采用把库题存入计算机内的建库方法,并建立相应的软件对整个题库进行监控。这种软件由题目输入,题目信息管理,统计分析(库题各项指标的获得方式),试卷生成,信息输出等五个模块组成。3.题库的维护和扩充题库是一个动态的存储和管理系统,便于维护和扩充题库是当代题库建设的重要特征。(1)题库的动态维护题库的状态随情况的变化而变化,必须经常对题库的思想性、科学性,根据相关学科的教育现状和要求加以调整,及时修正库题的各种参数值。(2)题库的扩充扩充题库,充实题库中新内容,能给题库带来生机。用CTT很难实现题库的参数可公度(新旧参数值可比)扩充,IRT为扩充题库提供了如下可行的方法。设g1,g2,…,gn为题库中的n道题,其难度分别为b1,b2,…,bn,问欲新增加gn+1,gn+2,…,gn+m这m道题入库是否可行?选gi(1≤i≤n)为连接题目(在不同时期测验中总是使用的库题称为连接题目),由gi,gn+1,gn+2,…,gn+m编成测验题,测这样经重新调整后的这m+n道题的难度都在同一量表上,由此即可回答这m道题是否可入库。应该指出,这里仅选—个连接题目是为了阐述的方便,实际操作时所选的连接题目应不少于五个,而且为了保证所选连接题目合理,还应对连接题目按下面的步骤进行适宜性检验。第一步,计算标准残余值Sr=(残余值-平均值)2。第二步,计算Q=(N/12)[k/(k-1)],其中N表示参加连接测验的人数,k为被选出的连接题目数。第三步,计算x2=Q·Sr。若逐个题目检查,则x2<3.84(自由度为1)者符合要求;对整套连接题目进行评估,查自由度为k-1的表即可,若x2大于查表值,则认为是适宜的。实践中选100名测验者作样本估计值已经足够。为了保证库题难度紧凑一致,须从统计上考虑优化连接结构。其基本思想是使每个测验中的每个题目都能作为连接题目,用于其他测验,从而使所有题目组成一个互相联系的网络。三、利用题库

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论