教学测验及其分析_第1页
教学测验及其分析_第2页
教学测验及其分析_第3页
教学测验及其分析_第4页
教学测验及其分析_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、课堂教学规范化培训内容之三教学测验及其分析第一部分 测验题目类型及编制测验总是由一系列的题目构成的,测验题目可以说是测验的基本构成元素。在一个测验中,题目编制恰当与否直接关系到整个测验的质量与效果。只有正确地掌握不同类型试题的测试功能及命题方法,才能根据考试的目的和要求,正确地选择合适的题型并编制出高质量的试题,组成高质量的测验试卷。教师的工作就是进行教学,善于利用测验的教师才是更好的教师。有效的测验能改善一位教师的教学效果。测验题目基本上分为两大类:选择反应型和建构反应型。前者一般要求被试者在几个选项中选择正确的答案,如是非题、匹配题、选择题等,后者要求被试者自己提供答案,如作文题、简答题、

2、填空题等。若根据被试作答的范围和评分方法不同,又可称为主观性试题和客观性试题。客观性试题是因为客观评分而得名,在测验前就已准备好了正确答案,不同评分者的独立评分,所得结果基本上是相同的。主观性试题主要包括论述题、操作题和作文题等。它们适合于测量较高层次的教学目标,尤其是适合于测量综合、评价等目标层次的内容。一、选择反应性试题测验总是与题目有关,教师选择的题目类型一定切合他们打算做的推论,同时也要确保这些推论和教师的教育决策直接相关。编制选择反应测验题目的方法主要涉及编写选择题、判断题、多重判断题、匹配题等。这些题型可以帮助教师有效地了解学生的认知状态也就是对所教授的知识和技能的掌握情况。选择反

3、应性试题一般就是我们所说的客观性试题。从客观性试题角度来看,一般适用于测量知识的掌握、理解、应用、分析几个层次的教学目标。客观性试题的答案明确,作答简便,因而在限定的时间内测验可以包含足够数量的试题,能保证对知识内容的覆盖。 选择题选择测验题(multiple-choice test item)一直主导着各个国家的学业成就测验。选择题可以用来考查学生知识的掌握或更高层次的思维能力。客观性试题中运用最多的就是选择题。选择题是由一个“题干”和几个“选项”所组成。“题干”一般是提出问题,或是待完成的句子,“选项”是供被试选择的几个真假不明的答案,让学生从中选出正确的答案。应选的答案可以是一个,也可以

4、是多个,可以是正确答案,也可以是最优答案。尽管选择题遇到了很多人的批评,设计合理的选择题已经可以考查很多知识与技能的掌握情况,逐渐成为课堂评价中的一个有力工具。1.选择题的编写题干是选择题第一部分,备选答案称作题目的选项(item alternatives),不正确的选项一般被称作题目的干扰项(distractors)。题干直接是一个问句,或者是一个不完整的陈述,是选择题最常见的两种形式。对于低年级的学生,最好采用直接提问的方式。学生的任务是选择一个符合题干的正确选项或者最佳选项。选择题通常的做法有两种:一是直接提问,要求选出最佳的选择题;二是不完整陈述,要求选出正确项的选择题。内容较好的题干

5、应该将作答任务明确地呈现给学生,以便他们能按题目要求选择出最佳项或正确项。如果题干编得不好,学生就不得不阅读一两个选择,才能弄明白题目问的是什么。 优缺点选择题的优势在于可以将几个不同的选项包括在同一个题目里,学生需要对各选项之间的细微差别做出区分。选择题的缺点,也是所有选择反应题目共有的缺陷,就是学生只需要再认出正确的答案,而不需要自己回答出正确的答案,这可能会出现猜测的问题。选择题是所有客观性试题中最灵活的一种,其优点体现为:评分标准统一、客观,不受评分人主观因素和答卷人提出意想之外的答案等影响,并且可以利用电脑迅速评卷,从而大大提高测验的信度,提高证券的速度和自动化水平。可以加大试题容量

6、,抽取广泛有效的代表性样本,使试题覆盖的知识范围广,可以克服传统考试中主观题由于试题量少、抽样窄而造成的测量效度不高的缺点。采用大量的似真选择项使得结果易于诊断,通过对学生错误选项反应这个线索,教师便于发现、分析学生在学习学习中存在的问题,以便及时纠正。可以用来测量学生各种不同层次的学习结果,不仅可以测量学生掌握所学知识的程度,而且可以用来测量学生对所学知识的理解、分析、判断、应用和综合的能力。有利于考查被试思维的敏捷性和准确的判断力。但选择题同样也有其自身的缺点,具体表现为:编制良好的选择题较花费时间,且要有专门的命题技巧。由于选择题的数量多,每一个试题中除正确答案外,还要有足够多的干扰答案

7、,而且要求这些干扰答案与题干应有相当的逻辑联系和似真性。难以考核被试完整的推理能力、综合运用知识的能力、严密的表述、有效的总结能力和写作能力,对于被试的发散思维能力更难以考察。无法测量被试的解题过程。被试能仅凭猜测而选中正确答案,这对考试的信度有一定的影响。选择题的优点使其受到人们日益重视,但它的缺点又使我们必须在教育过程中以更为复杂的方法来保证选择题考查学生的有效性。 选择题类型根据不同内容和特点对选择题可以作不同分类,选择题主要可以分为以下几种类型:最佳选择题,要求被试从几个备选答案中,通过比较和分析,选择一个最佳的答案。排序选择题,将多个事物列出几种排列顺序,要求被试选出排列顺序正确的一

8、种。辨识选择题,用于辨识字词的形音义、文化常识、公式定理、名词术语等知识点。归类选择题,列出一组事我,将事物分成若干类,要求被试按一定标准选出归类正确的选项。图解选择题,将文字材料绘制成几幅分割示意图,要求被试选出符合文字材料所显示的场景或关系的示意图。填空选择题,在一句话中空缺一些字、词、句或标点,要求被试在备选答案中选出恰当填补项。承接选择题,给定一个不完整的句子,然后列出几个承接句子,要求被试选出其中衔接恰当的承接句子。阅读选择题,给出一篇短文,提供备选答案,要求被试阅读后,给出正确的选项。 编写原则为使选择题的普遍适用性和优良性能得到实现,在编制选择题时,应遵循以下原则:题干意义完整并

9、能表达一个确定的问题有不少不完全陈述式选择题的题干,直到读完全部选项才能了解其意义。品质良好的选择题,应该是在遮盖选项部分,即在没有选项的情况下,意义也是完整的。不论哪类题干下,都要向学生指明备选项中只有一个正确答案。否则,学生有可能认为这个题目有两个或者两个以上的正确答案。题干简明,选项合适题干尽量不要使用过于复杂字词与语句结构,也不要使用过长的语句。题干,陈述不要过于复杂,堆积一些不切题的材料陈述。我们一般把尽可能多的内容放在题干中,选项则较为简洁。题干里尽量不要出现否定词,这可能导致学生没有注意到,结果就会做错题目。备选项的个数可以由你自己决定,通常为四个或者五个选项。备选项越少,学生凭

10、借猜测回答正确的可能性就越大,所以除了对很小的孩子施测外,一般很少使用只有三个备选项的选择题。备选项多于五个,又会加大学生的阅读负担。所以,我自编的选择题测验中一般使用四个备选项。不过,有时候出于考查内容本身的老虎,我们也使用五个选项。题干尽量不要采用否定结构,要采用正面陈述为主过多采用否定结构,往往给被试带来阅读上的困难;同时否定结构也不利于教师了解被试到底掌握多少正确知识。当然在某种情况下,采用否定结构也能测量重要的学习结果。一般来说,对于具有潜在危险而必然注意的问题,可以采用反面叙述强调,但此时最好在否定结构下划线,以引起注意。在必须使用否定句的时候,如果可能否定词采用加粗、斜体字或者下

11、划线等方式予以突出显示,以保证学生有相同的机会回答正确。诱答项应具有似真性所有项都应与题干有一定的逻辑联系,选项中的干扰答案,又叫诱答项,应具有很高的似真性,不能错得太明显,要做到以假乱真。编制良好选择题的技术取决于有效的干扰选项的编写。选择题中的诱答项应对未具备回答该题所需知识的学生有诱惑力,区分出这部分被试,从而达到测验的目的。提高干扰项似真性的方法有:A.用学生共同的错误观念或过失作诱答项。B.以学生惯用的模糊用语叙述干扰项。C.在正确选项和诱答项中使用同样“精确的”、“重要性”等用语叙述。D.诱答项长度和措辞与正确选项相似。E.在诱答项中使用额外的线索来吸引被试的注意,如与题干有语义联

12、系的线索等。F.保持选项间同质性。诱答项只应吸引不具备这项知识的学生,不能成为将好学生引入歧途陷阱题。此外,当你编写选项时,要尽量保证所有备选项长度相近,如果做不到,也尽量让至少两个选项的长度差不多。比如,如果有四个选项,你可以让两个选项比较长,另外两个比较短。不要让正确项和其他干扰项的长度有明显的区别(或者很长或者很短)。不要对正确答案有任何无意识暗示无意提供暗示主要表现为:语法结构的不一致,正确答案语法正确,诱答项语法结构错误;选项在逻辑上不同,正确答案中加以“如”、“有时”、“通常”等修饰词,诱答项中加以“总是”、“从未”、“所有”、“绝对”等极端的修饰词,正确答案使用与题干相同的词等;

13、答案长度明显差异,正确答案叙述得详细、较长等;正确答案在选项中有一定规律等。备选项中的正确答案要在不同的位置随机呈现,以免学生看出你所偏好的位置,从而凭猜测得高分。很多教师不愿意把正确答案放在A的位置,他们觉得这样的话,学生很快就会找到正确答案,也需要克服偏见。通常,如果是四选项的选择题,那么四个位置出现正确答案的概率应接近25%。为了达到这一要求,你需要在测验编制完成之后做一些最后的调整。在测验定稿前检查一下,是不是某一个位置出现正确答案的次数过多。有时候,在编制四个(或五个)选项的选择题时,教师会用“以上都正确”或“以上都不对”这样的选项来凑数,使用这两种选项都必须经过一番仔细的考虑。每个

14、试题之间相互独立、避免互相牵连某一个课题的题干中所提供的资料,有时刚好可以帮助学生回答别的问题,此种情形只要在组合测验前仔细检查每道试题就可以避免。选择题编制不好时,会出现有时被试需要知道前一题的正确答案,才能回答下一个问题的情况,即若某被试无法回答第一题,则无法回答第二题,此种连锁题会导致被试因为一个问题连续失分的现象,因此,每道题均应成为一个独立的记分单位。选项表述简短精炼应尽可能将各项中共同的用词放在题干中,在每个选项中要避免重复的材料,这样不仅可以使题意清楚,而且可以减少学生阅读选项所需的时间。选项的长度有可能会透露出正确答案,选项中如果包含更多的内容,学生可能猜测老师对这个选项给予了

15、更多的关注,它和其他选项相比一定会有些特殊之处。尽量避免“以上皆是”或“以上皆非”的选项不可使用“以上都正确”项,当测验编制人员很难找出足够的选项时,常用“以上皆是”、“以上皆非”来作为最后一个选项。这种特殊选项的应用绝大部分场合均不恰当,不仅无法达到预期的功能,反而会降低题目的有效性。这是因为学生只要知道在选项中有两个正确的,则他就会选择“以上皆是”,比如,你编了一个五选项的选择题,而且你想让第五个选项(选项E)“以上都正确”为正确答案。这就意味着,从A到D的前四个选项都必须正确。问题在于学生只需判断出前四个选项中有两个是正确的话,就可以很肯定的选择“以上都正确”项了。因为只要有任何两项正确

16、的话,选项E就是最佳的答案;或者只要发现有一个选项是错误的,则马上就可以排除“以上皆是”项,从而提高猜测成功的机会;呷,不少学生只要看出第一个答案是正确的,他马上就会作答,不再阅读其余选项,这就会丢分,这样就会降低测验的信度。另外在“最佳答案型”的选择测验中,所有答案只是适合程度不同,而绝无一个“绝对正确”的答案,在使用“以上皆非”项时,可能会引起争论。在编制选择题的时候,千万不要使用“以上都正确”项。“以上皆非”这个选项,可以用它来增加题目的难度。只有当这种选项确实能帮助你基于测验对学生作推论的时候,你才可以使用它。比如,假设你想知道学生对数学运算的掌握情况,而且,你还想证明学生不但能够利用

17、草稿纸演算,使用计算器计算,而且也会通过“他们的脑子”思考。现在,如果你只采用四选项的选择题来测查,那么很可能有些学生虽然不会算,但凭着对答案的估计选择出一个看起来比较合理的答案。毕竟四个选项中一定会有一个是正确的答案。这时,如果增加一个“以上皆非”选项(作为第四或第五个选项),学生就不能确定上述选项中是否有正确答案了。因此,他们就不得不进行必要的运算,才能得出正确的结果。当然,如果加上了“以上皆非”这一选项,测验任务就更接近于教师想要考查的任务,而且学生猜对的可能性也会显著下降。2.是非判断题判断题(binary-choice item)给学生两个可供选择的回答,要求他选择其一,又叫做二项选

18、择题,它通常是给被试一个兔子要被试者做出正误的判断。这类试题通常用于测量被试对基本概念、性质、原理、原则的认识和判断区别事实与观点、认识事物因果关系,以及一些简单的逻辑推理能力。最常见的判断题形式是正误判断题(true-false item)。最早使用正误判断题的教育家可追溯到苏格拉底。判断题还有一些变化形式,那就是要求学生在“是非”、“正确错误”、“事实观点”等两个选项之间做出选择。判断题最大的优点就是简洁,学生可以在很短的时间内完成大量的题目。因此,一个简短的判断题测验就可以容纳大量的评价内容。不过,因为判断题只有两个选项,即使学生对正确答案一无所知,也还有50%猜对的可能,这是它最大的缺

19、点所在。但如果加大题量,这一缺陷即可得到弥补。毕竟,尽管学生可能猜对几道题目,但是要想连续猜对50道题,那就不知道需要什么样的运气了。有时候,我们可以要求被试先判断每一个陈述的真伪,然后再要求被试将错误之处加以改正。有时需要在改正部分的底下划线或加引导,以突出重点。通常有人认为是非题最容易编制,其实并非如此。因为此类试题要求被试作绝对正误的判断,所以每一个叙述必须绝对正确或完全错误。在绝大多数知识领域中,为确保绝对正确或完全错误,就需要对较重要的叙述予以特别修饰,而这种修饰却是一种很明显的猜答线索。因此,编制者通常被迫以较不重要且更具体的事实来编题,以确保试题的科学性,但这样的试题对于测量目标

20、来说是不太合适的。 优缺点编制相对较为容易,可适用各类教材。可以照教材的原句子抄下来或稍作正反改正。这种试题一般品质不良,不是答案明显,就是无法判断。编制出一些题意清楚,且能测量到重要学习结果的是非题,就需要高度的命题经验与技巧。记分客观,取样广泛。因是非题的作答时间较短,可以在短时间之内回答很多问题,所以试题有较大的覆盖面,且评分不受主观因素的影响。是非题的缺陷表现为:仅能测量知识层次中最基本的内容,无法测量高层次的学习效果。受猜测因素的影响很大。由于答案只有两种可能选择,学生纯凭猜测都有50%概率获取正确答案。由于是非题的设计很难排除无关线索,被试猜对的可能性远高于50%。即使采用其他方法

21、也难以排除猜测的影响。因此,只是用它来测量其他类型测验无法测量的学习结果。 编写原则措词严密,引发学生的慎重思考。一般来说,判断题非常简洁,但是这并不意味着学生可以轻易答对。为了让判断题发挥最大的作用,你需要在措词上下些功夫,这样学生就不会一眼看出正确答案。因此,编制正误判断题时,你应该采用那些需要琢磨一下才能做出判断的陈述。根据太显露的陈述,很难对学生的水平做出准确的推论。表述讲究了,如果学生不假思考的话,就会判断失误。这样做的目的就是为了使学生能够真正地思考这些题目,从而使教师更好地了解学生到底能够思考到什么程度。题目应是测量理解能力,而不应测验记忆性的知识,更不要直接抄录教科书中的句子,

22、以免引导被试死记硬背而不求理解。考核的内容应是最重要的知识,应有考核价值。不要为了设计试题方便而考核一些无关紧要、细枝末节的内容。在一个题目中集中考查一个概念。如果判断题的陈述中有两个概念,一个正确,一个错误,学生回答起来就会非常困难。就算这两个概念都正确或者都错误,学生还是可能会感到迷惑,这样的话我们也就很难从学生的答题情况来推断他们的真实水平。一个题目中只能有一个中心问题,或一个重要概念,避免两个以上的概念在同一题中出现。否则将会导致“半对半错”或“似是而非”的情形。试题应做到是非界限分明,用词准确,避免模棱两可的语句,不致引起对正确答案的争议。题目的要引起注意,不要在题目的长度上泄漏出答

23、案正确是否的信息。如果要判断陈述是正确还是错误,那么应该保证正确和错误的陈述在长度上都差不多。有些教师在编写正误判断题时,通常正确的陈述都有一些分句来描述,以保证它的准确性。这样正确陈述通常都会比错误陈述长,所以从句法结构上我们就可以看出长的陈述就是正确的,短的陈述就是错误的。一旦学生发现了这样的规律,他们即使没有掌握题目要求的内容也可以凭着猜测做对题目。题目陈述应简单明了,避免使用复杂的句子结构,以减少因被试的阅读能力而对测量产生的不良影响,应尽量采用正面叙述,避免用否定和双重否定的语句。正句和误句的排列要随机化,且数量应大致相等。在判断题测验中,要尽量保证正确答案为“正确”或“错误”选项的

24、两类题目数量相当。不过,没有必要保证两类题目的数量完全一致,大致相近即可。另一类与是非判断题非常接近的试题是多重选择题。多重判断题(Multiple Binary-Choice Items)是由一组题目组成,每个题目又都是一个简单的判断题。通常这些题目都与列在之前的一个或一组陈述有关。从格式上看,多重判断题有点像传统意义上的选择题。在选择题中,学生必须从几个选项中选出一个正确答案;而在多重判断题中,学生必须对一组题目中的每一个陈述做出判断。多重判断题能非常有效地反映出学生的成就水平;比其他选择形式的测验更可信;对于相似的内容,可以考查与选择题同样的技术和能力;对于学生来说比选择题稍难;学生会感

25、觉到它比选择题更难但是比较有效。编写多重判断题也必须遵守一般判断题的编写原则,此外,还要注意以下两个原则:各组题间留有间隔因为学生们对传统的选择题前有序号的形式都非常熟悉,所以一旦原来应该有编号的地方没有了数字的话,学生很可能就糊涂了。因此,必须保证在每一组题开始之处给学生一个明确的提示。你可以使用符号,比如星号、短线、方框或者用其他近似的方式来提醒学生。题目和题干相符,确保每组题中所有的题目与题干之间确实存在有意义的联系。传统的判断题主要要求学生依靠记忆信息来回答问题,多重判断题则和传统的判断题不一样。即如果材料中包含了学生没有遇到过的内容,多重判断题考查的就并非记忆能力。如果题干对于学生来

26、说是新的内容,而且如果每个判断题目都直接和上述的学生没有学过的新内容有关,那就无疑要求学生具有更高的分析判断能力。所以,如果你确定你的多重判断题材料含有新的内容,那么回答这些题目显然要比回答只凭记忆的判断题更费脑力了。多重判断题的主要优点是,在回答一个选择题的时间内,学生可以回答多重判断题的时间内,学生可以回答多重判断题的组题中的两到三个小题目。在其他条件等同的时候,学生回答的题目越多,我们对其能力所做的评价就越可信的。 匹配题匹配题(matching item)通常由两列词或短语组成,要求学生给一列中的每一条在另一列中找到合适的、对应的信息。需要从另一列中找到对应信息的条目称作前提项(pre

27、mises),从中做出选择的那部分被称作反应项(responses)。通常,匹配题要求学生根据某种特别的联系,将两列信息匹配起来。各列的同质性是匹配题的一个重要特征。这是一种变形的选择题,是在对选择题进行改良的基础上得到的。这类试题由一组题干和一组与之相配合的选项组成,要求学生从选项中为每一个题干选配一个合适的答案。在这种类型的选题中,每一个题干只能选择一个答案,而每一个答案既可以被选中一次或一次以上,也要以完全不被选中。因此题干数与选项数既可以相等,也可以不等。匹配题一组题干共用一组选项,选择题则为每一个题干都有一组选项。匹配题的一大优点是结构紧凑,只需要占用很少的试卷空间,因此便于有效地收

28、集信息。匹配题的记分也很容易,让学生在前提项前面的横线上写出相匹配的反应项的编号,我们就可以将正确答案的模板放在试卷答案旁边,进行对照了。匹配题的一个缺点和判断题相似,它有时候也鼓励学生去记忆低水平的事实性信息,因而在一定程度上其有用性受到了质疑。通常,匹配题都是教师评价题目中的一部分。但是很难想象课堂测验中所有的题目都是匹配题。当教师想测查学生个性化的想法时,匹配题就不是很适用了。这是因为匹配题需要大量符合匹配形式的条目的。1.优点 由于匹配题答案多,因而它可以用于测量对多个事物与知识的理解能力和其对其相互关系的判断力。它经常用于考查人与事件的关系、事件与时代及场所的关系、因果关系、原理与知

29、识的应用等考核目标。 匹配题的突出特点是可以在较短的时间内测量大量相关联的事实材料。另外,它在编制上较为容易。然而,编制出真正高质量的匹配题也非易事,因为其困难在于每一个题干的正确答案必须同时其他题干的“似真答案”,任何一个缺乏似真性的选项,均会给被试提供选择正确答案的线索。2.缺点仅能测量低层次的教学目标,且易提供额外的线索。较难找到一些符合教育目标和学习结果的同质材料。较重要的材料无法达到同质的要求,只好补充一些不重要的材料。3.编制原则使用同质的条目,匹配题的每一列应该由同质的条目组成。如果确实编不出同质的前提项和反应项,你就不该用匹配题。在一道题中,要求每个题干(包括选项)具有相同或相

30、近的性质,这种同质性可以保证所有的选项都能成为任何一个题干的似真答案。否则,会增加或降低试题的难度,而不能达到考核目的。即使某些知识并未掌握,也可以凭猜测答对。选项的数目要多于题干的数目,而且不限制每个选项被选择的次数,这样可以大大降低被试成功猜测的概率。否则,题干与选项一一对应,解答中最后一对就如同虚设,甚至对被试产生提醒作用,如最后一对明显不搭配时,提醒被试前面的配对可能存在问题。在题干、选项之间如果有逻辑顺序,就按逻辑顺序来安排选项。如按数目的大小、时间的远近、字母的顺序等排列。不要无意识中将反应项和前提项之间的任何联系透露给学生。要以清晰的指导语指出题干与选项之间的配合关系以及对每个选

31、项可以被选择的次数的规定。尽管在大多数匹配题中,其配合关系相当明显,在答题说明中清楚地指明还是有一定的必要。因为这样可以避免题意不清,且节省测量时间,被试可以不必读完所有题干和选项后再判断两者的配合关系。题目的指导语应该指明匹配的基础和要求,同时还应该告诉学生每个反应项可以使用几次。学生对作答要求知道得越清楚,他们的回答也就越准确,因而你根据他们的分数所作的推论也就更加有效。编写匹配题要确保反应项多于前提项。如果反应项和前提项的数量一样,那么学生只要知道80%的前提项应该如何匹配,就可以凭借排除法来找到剩下的前提项的对应项。增加一些额外的反应项就可以这种猜测的可能性。而且,这些做起来也不麻烦。

32、选项的词语要短,相对于选项而言,题干的词语应较长些。并且每一试题的配对数目不能超过10个,通常以4到7个配对数目最为合适。做好排版,防止跨页。要确保所有的前提项和反应项都在同一页内。这样不仅省去了学生反复翻试卷的麻烦,而且消除了学生忽略了第二页上正确答案的可能。争取尽量简短。从学生的角度来考虑,如果匹配题两列表中的条目较少的话,回答起来要容易得多。一般的匹配题,其条目数的上限为10。列表如果太长,结果可能找着找着,就忘记了要找什么了。同时,很长的列表肯定至少会让一部分学生感觉到难以回答,因为他们有可能会忘记搜索正确的线索。另外,为了减少阅读量,应该把较短的词或短语放在右边。换句话说,应该让反应

33、项比前提项更加简短。这样的话,当学生在反应项中搜索前提的匹配条目时,他们可以不必总是阅读那些很长的短语或句子。不论是选择反应的测验项目,还是建构反应的测验题目,都是有章可循的,按要求来编写会取得更好的效果。规范题目编制要遵守如下的要求:晦涩的指导语大部分教师在编写课堂测验时都没有仔细考虑指导语的问题。教师们花了大量的工夫来编写测验题目,自然就非常熟悉这些题目。而且,教师们不但了解题目内容,也非常清楚学生该如何作答,所以对于如何回答测验题目的指导语,他们往往不太重视。显而易见,指导语含混不清,学生在作答时就会感到迷惑,而迷惑不解时的回答显然不能准确地反映出他们的实际水平。对于学生不太熟悉的题型,

34、指导语有缺陷的问题就更为突出了。如果你要开发一个评价工具,最好先编写出指导语。而测验成型后,才花上那么一两分钟写一份指导语,而这种指导语往往模棱两可的陈述。避免模棱两可在各种课堂评价中,都应避免模棱两可、含糊不清的情况。如果你的学生不能确定你要求他们完成的任务是什么、就容易曲解你的本意,结果本来知道正确答案的学生也有答错。比如,句子中的人称代词经常指代不明。测验编成以后,教师应当以学生的眼光来重读自己编的题目,修改那些哪怕只稍微有些歧义的表达。有意识地避免无意识的失误有编题时不要无意识中透露出正确答案的线索。由于无意识中泄漏了正确答案的线索,所以即使学生没有掌握所考查的知识和技能,也能答对题目

35、。在没经验的编写者所编的选择题中,正确选项通常会比错误选项的字数多出来一倍,学生显然会选长一点的选项。判断题中的错误陈述中使用“从不”或者“总是”这样的词汇。可是即使不知道正确答案的学生也知道,这个世界上几乎没有绝对的事情,所以可以轻松判定那些陈述是错误的。无意识的线索似乎更常见于选择反应测验题目,但是在后面较为复杂的建构反应题中给学生提供背景信息时,教师也应该警惕无意中泄漏正确答案的情况。复杂的句型不应该使用那些太过于复杂冗长的句型,避免使用那些复杂的句型,而改用简单的句型。在测验中使用太多的分句只会把测验题目搞得一团糟。简单易懂在编写教育评价题目时,应该避开使人困惑的空话,选择最适合学生理

36、解的那些词汇。评价并不是一个显示自己词汇丰富的机会,评价工具中使用的词汇越生僻,你就越无法准确地了解学生的实际水平。他们会因为这些深奥的词汇而不能正确回答问题。当课堂评价中需要使用术语词汇的时候,越简单越好。选择反应测验是非常有用的。相对于建构反应题目来说,选择反应题目可以在更大的范围上考查学生对知识的掌握情况。尽管选择反应测验一般被认为只能考查较低层次的认知能力,但是善于发明创新的教师却可以通过选项,来启动学生使用更高水平的认知技能。你所掌握的评价手段越多,你就能更准确地测得你所关心的学生变量。二、建构反应性试题建构反应题目的最大优点是它们能引出学生更贴近平时生活的行为反应。当学生离开学校时

37、,实际的日常生活几乎不会要求他们从安排好的选项中做出选择。在正常生活中,很可能需要你对同事或家长做一个简短的口头报告,或者其他的简短报道等。相对于选择反应任务而言,建构反应题目无疑与非学业任务之间有更高的一致性。如果选择反应题目在性质上与建构反应题目所收集到的内容十分接近,那么你可能更希望能用选择反应的评价策略代替建构反应的评价策略,这是因为选择反应测验更易于评分。但是,有些时候选择反应测验不能有效区分学生的不同水平。 填空题填空题就是给出一个陈述,项中缺少一个或几个关键词语,要求被试将其补充上去。通常是选用对某个知识点代表性的一句描述,或者是一个概念的解释等,也可以是对某个问题的总结,要求学

38、生填写有关的概念。填空题可用来考查被试对知识的记忆和理解能力,在诊断性测验中特别适用。受被试猜测的影响小,评分比较客观。但填空题偏重于测量被试的知识记忆程度,使用过多容易养成被试死记硬背的习惯。填空题编制原则:尽量将空白放在句子的后面或中意,而不要放在句子开头。填空题的前部分出现空格,会让学生回答问题时感到迷惑。空白中所填写的应是关键词语,要和上下文有密切的关系,使被试不至于无法推理,填写困难。填空题属于封闭型的一种,题干的逻辑性要求稻高,从而使被试按照形式逻辑的思维去推理、判断。题目空白地方不能太多,以免句子变得支离破碎,不利于被试理解题意。通常一个填空题不应超过两个空白。题意要明确、限定要

39、严密,空白处填的答案是惟一的。题干的表述应使众多被试按照同一个思维路径进行趋向思维,否则被试不知道填什么或填什么都成立,从而引起争议,达不到测量目的,不利于记分。空白处的线段长度应当一致,不能随正确答案文字的多少而长短不一,以免产生暗示作用。简答题常会由于所留空格长度不同而泄漏出有关正确答案长度的信息,因为较短的空格意味着正确答案较短,较长的空格则意味着正确答案较长。这个无意识中提供给学生的线索显然应该尽量避免。为了使空格的长短没有任何提示意义,我们应该使简答题中的空白在长度上相等。当然,应该确定的是留出来的空格要足够学生回答问题。换句话说,给学生提供答题空格时不要吝啬,以免学生在很小的方密密

40、麻麻地写下教师难以辨认的答案。答案是数字的,应指明单位和数字的精确程度,不要引起学生的困惑,增加评分的困难。使用填空题形式,教师经常会从课本中找一些陈述,然后删除项中的单词或短语,就编出一道题目。为了确保简答题不会有不止一个的正确答案,出题人可以先确定一个正确答案,然后编写题目,让成绩较好的学生试做一遍,检验是否会出现确定的答案以外的正确答案。 简答题简答题(short-answer item)要求学生对一个问题或一个不完整的陈述做出一个词、一个短语或一个句子的回答。简答题要求被试对所提的问题用几个字或几句话来回答的一种类型。如果一个题目要求学生做出一个很长的反应,它就是一道作文题,而不是简答

41、题。简答题适合于评价相对简单的学习结果,比如考查学生知识的获得情况。当然,如果设计巧妙的话,简答题也可以测量更具有挑战性的学习结果。简答题的主要优点是学生需要自己产生一个正确的答案,而不仅仅是从几个选项中找出正确答案。一个学生能正确回答选择题所具备的知识水平,并不足以让学生产生简答题的正确答案。如果简答题中的答案是现成的,只需要被试自己主动提供答案,这仍然可以算作是客观性的测验题,它是供答题中最简单的一种,被试只需填上几个简短的词或句即可解答,如果答案需要被试做一个总结才能得到,这就完全是建构反应试题了,一般,我们还是将简答题归为建构反应类试题。1.特点简答题适合于测量被试对基本知识、概念和的

42、掌握情况。简答题编制较为简单、灵活,在出题时,可以从不同角度考虑,增大对知识考核的准确度和深度,这种题型不太受猜测因素的影响,但无法用来考核综合、分析、评价等高层次教学目标。评分不够客观,问题的叙述如果不够客观,问题的叙述如果不非常清楚,将会出现不同程度的正确或部分正确的答案,这将影响评分的客观性。另外,像错别字是否扣分等问题无法避免,若扣分,则被试的实际得分无法代表其获得的知识的多少,若不扣分,则又无法确定错别字是否代表正确答案,也就是被试只是写了错别字还是被试尚未具备测量所欲测的知识很难分清。在般测验中,简答题所占比例不大,考察的均为相对比较固定的一些知识。2.类型名词解释题,要求被试用简

43、单明了的词语或概念解释清楚。问答题,就是让被试对所提出的问题进行解答。列举题:就是要求被试根据要求范围列举出事或物,并略作说明。简述师,一般是对一段话进行判断或进行说明。3.编制原则问题叙述要明确,使用被试能理解的简单语言。答案应该是惟一的,并要简短具体。应注重知识应用,避免机械记忆的试题太多。考查公式应用时,不要给出太复杂计算,以免影响考试的效度。使用直接问句提问,防止被试的理解错误。简答题的主要缺点是难以对学生的反应进行评分。学生对题目做出的回答越长,教师要想准确评分就越难。不准确的评分会导致信度的降低,从而导致我们基于测验分数对学生作出推论的效度也会降低,并进而影响我们根据这些推论所作教

44、育决策的质量。教育测量就像我们的现实生活一样,经常需要做出一些利益的权衡。当老师选择建构反应测验时,他们必须牺牲评分的准确性,类似选择反应测验所能能到那种准确性,使建构反应的评价策略能更好地评价学生的行为。相对于填空形式而言,低年级的学生更熟悉直接提问的形式。因此,如果使用直接提问的形式,他们往往很少感到困惑。之所以简答题要尽量使用直接提问的形式,另外一个原因是,如果使用这种形式,出题的人必须尽量避免模棱两可的陈述。简答题的答案应该很简洁。因此,无论你想要引出的答案是一个单词或符号,还是短语或数字,在编写题目时要尽量保证学生能找到一个很简短的答案。如果教师的简答题想要引出学生的一个短语或一句话

45、的答案,你应该对每一题需要回字词数量做出限度,至少在指导语中应指出每道题目只允许用一个简短的句子来回答。如果你的简答题采用的是直接提问形式,要在问题之后,靠近试卷右侧的地方留出空白供学生写答案。简答题是建构反应题目中一种很简单的题型,但它们仍然可以帮助教师测量很重要的知识和技能。因为简答题比选择反应题目更多考查了学生的建构能力,它们可以用来测量更高层次的技能水平。虽然学生给出的简答题答案相比选择反应题目更难以评分,但实际的评分过程并不是非常困难,因为它要求学生做出的只是较简短的答案。 论述题论述题就是向被试提出一个较为复杂的问题,要求被试用自己的语言组成一份较长的、层次清楚答案的试题。论述题能

46、较好地测量出被试在组织、归纳和综合所学知识方面的能力,运用自己已经掌握的知识解决问题,探讨问题和创新的能力。这种试题的最大特点是被试回答问题时有较大的自由度,可以充分地运用自己所学的知识,可以加上自己独特见解,论述题的回答相对要求较高,考察被试知识掌握的程度较深,因此,在考试中也不能大量使用,这是测验的各种因素限制的结果。1.优点增进学生的思考、应用及解决问题的能力。可以使学生对教材内容的内在联系进行更深入的思考,对所学到的知识进行有机组织。培养学生深入分析和思考的习惯,对学习的知识是一个深化的过程。主要用来进行高层次的、复杂学习结果的测量。这类试题可用在各学科,特别适用于社会科学、人文科学等

47、。这种试题的测查是与学生对一科知识的综合有关的,里面有很多学生对知识学习后的理解与联想。试题编制较易,不受猜测因素的影响。试题往往是针对一个大的问题或领域,题目往往以一个命题的形式出现,学生在回答这一类问题时,无法猜测评价者的正确答案。当然,学生也有可能根据出题者的习惯等进行,但是试题本身并没有提供猜测的机会。增进学生写作能力。试题的答案往往都要求有一定的论点和相应的论述,这样的答案就类似于一个小品文一样,故而学生的答案组织能力对于测查分数的影响也是直接的。这样的大体过程也就训练了学生写作的能力。2.缺点论述题的命题一般都比较大,学生的回答都比较长,需要耗费大量的时间。一次考试中试题的数量不可

48、能有很多,因此试题取样范围相对比较小,且在整个学习的领域内不均匀,试卷无法有效地代表学科的全部主要内容,学生的回答受自己学习兴趣的影响非常大,所测结果也就无法真正代表被试的学习成就而影响测验的效度。评分主观性过强。论述题也可以预先制定标准答案和评分标准,当然这种答案不可能是非常确定的,否则就限制了学生作答。测验中也沉淀会有许多令命题者意想不到的情况和答案出现。不同的试卷评阅者,由于看法不同,对同一份试卷所给的成绩会有很大的不同。同一评阅者对等值的试卷所给的成绩也会出现偏离较大的现象,测量结果的信度比较低。被试回答较自由,答案指向不同,重点容易失控。这种题型中由于存在被试的自由联想回答,对题目的

49、理解可能会有多种,故而试题纺织者的初衷不一定能实现,回答的结果也就出现各种可能,考查知识的重点也就易于觅食。作答、评分较麻烦。被试的作答涉及的方面很多,需要通盘考虑。另外,测验的目的就是要给出被试一个明确的结果,对论述题进行精确的评分比较困难,每个被试的回答都是使用自己的语言组织的,细化的评分规则中也会存在很多的漏洞。3.编制原则试题主要是测量较高层次的教学目标,像综合、评价等目标层次的内容,仅限于那些客观题不能测量的学习成就和思想内容。明确而系统地陈述问题,则被试能清楚地了解题目要求,不要产生误解。题目中必须对试提出明确任务,每道题都应当能真实反映被试的实际能力,使被试不受阅读、理解题目错误

50、等因素的干扰。试题要尽量采用答案有统一定论的内容,减少评分者误差,提高信度。对于有争议的问题,在命题时一般要对被试的作答范围、观点等作一定的限制。题目的内容陈述一定要清晰,不要认为被试理所当然的知道试题测试意图。一般不允许被试选择问题回答。因为不同的论述题之间很难做到等值,如果让被试选择题目回答,被试得分之间就无法进行比较,被试又倾向于选择他自己较熟悉的试题,这样就很难反映其真实水平。题目中应当给以一定的提示。这是为了避免被试将时间集中在某一个他所不会做的题目上,这样会影响对被试对其他题目的回答,进而影响考试成绩的真实性。论述题的一个困难是它们想着容易写起来难。编制一个论述题必须经历一个深思熟

51、虑的过程,需要花费很长的时间。论述题面临的最严重问题是教师难以对学生的回答做出稳定且可靠的评分。比如,你想用五道论述题来测量学生在社会中的问题解决能力,将所有学生的回答都是打印出来的,给所有这些答卷进行两次评分,实验结果显示,当老师们给学生的论述题评分的时候,几乎所有的教师都不能给出十分稳定可靠的结果。教师在对作文进行评分的时候需要尽力去增加信度,这样你基于学生回答情况所作推论的效度也就不会受到评分的影响。教师可以编写不同要求的论述题,对学生的回答进行限定。比如设置问题可以要求学生只是比简答题深入一点点,或对某一问题分析透彻,答案要求非常长。这就出现了两种形式的论述题,分别反映教师对学生回答的

52、展开程度的不同要求,一是限制回答题,一是扩展回答题。限制回答题(restricted response item)限制学生回答的形式和内容。扩展回答题(extended-response item)则要求学生做出较长的回答。作文考试中,教师常常限定试卷上或者答题纸上回答问题的空白面积,以便限定学生回答的答案长度。但是这种说法明显不利于写字较大、习惯写连体字的学生。这些学生只能在一页纸上定出不多的内容,然而那些写字很小、很紧凑的学生则有可能在同样的一张纸上写出更多的内容。编写论述题时,你必须仔细考虑你所关心的问题需要多长的回答。在一个测验中,较多的论述题要求较短的回答,只有少数论述题需要展开来回

53、答。确定每个题目的回答长度以后,你还需要清楚地向学生说明每个题目需要的展开程度。论述题最主要的部分是描述评价任务(assessment task),它指导学生如何组织自己的回答。显然,如果教师没有清楚地描述评价任务,学生就可能答偏,所以教师一定要让学生确实明白什么是要考查的内容。如果学生不清楚任务是什么,肯定难以回答该问题。而且,学生在不清楚题意的情况下做出的回答,会导致教师对他们的能力水平做出错误的推论。 作文题作文题(essay item)是建构反应题目中最为常用的一种题型。当教师要求学生根据其对某个课题的了解写一两段文字,或者写一篇作文描述某个事务时,教师就要使用作文题。作文题沉淀用来考

54、查学生的综合、评价及写作能力。大多数教师在课堂评价中使用的作文题都不相同。作文题的一个特殊形式是写作样本(writing sample),教师为了评估学生的写作技能,要求学生写一篇作文,写作样本题目的编写和评分过程同其他作文题都差不多。作文题实际上是一种论述题,它是语言测量中不可缺少的一部分。作文是对人的逻辑思维、形象思维、书面表达等多种能力的一种综合考查。1.分类作文试题有很多不同的分类。这里介绍常见的三种分类方法。命题作文和供料作文(或称条件作文)。这是根据提供题目或提供材料的角度进行的分类。命题作文只提供题目,不涉及任何材料,不作任何解释和说明,要求被试写一篇文章。供料作文包含供料命题作

55、文和供料自由作文两种。它一般会提供一些材料,如一篇文章、故事、一幅画等,要求被试根据某个给定的思路,或根据指定题目,或自选某一角度、自拟题目等来写作。记叙文、议作文、说明文、应用文等。这是根据文体进行的区分。根据对试题提供材料的处理方式可以区分:改写型,要求被试按要求改变原文结构和文体样式,变换中心人物、选材角度或立意,对原材料取舍或补充;缩写型,要求被试理解材料中心思想,弄清结构,择其要点,浓缩连缀成文;撮写型,要求被试围绕中心,摘取材料的要点,组成一片新的文章;扩写型,要求被试将给出的“主干”材料扩充成内容丰富的文章,中心意思不变;填空型,要求被试根据上下文将原材料中缺失部分进行补充,成为

56、文章的有机组成部分;续写型,要求被试根据原文的内容和思路加以想象和延伸,使续写部分与原文构成完整的整体。2.编制原则作文题测验的目标就是要测量被试真实的写作能力。这种测量属于根据特定要求进行书面表达能力的全面综合测试,命题的质量直接影响到测量结果的信度和效度。为了充分发挥被试的写作水平,一般要注意以下几点:要根据被试的特点确定选材范围与写作意图,不能超越被试实际的认知水平。在确定选材和写作意图时,要考虑对所有被试都要做到公平,不能带有任何偏见。试题应符合被试的心理特征,使被试对作文有较高的接受性。考试作文的文体要根据考试的目的和需要来确定,但也可以给出一定的选择科地。作文的限定条件要较为宽泛,

57、给被试留以发挥的余地,否则可以采用其他试题类型考试。作文题应当尽量根据社会的需要、现实生活和学生的实际设计命题,是学生更易接受和理解。要评价某种类型的复杂的学习结果,作文题显然是最合适的。它可以清楚地反映出你想考查的学生写作能力。不过,作文题也有很多缺点,如果你想在课堂评价中使用作文题的话,你不仅应该了解它的优点,更应该了解它的不足。作文题和论述题的测验目标是引发学生创伤,只要教师使用了这类测验,他就必须清楚地向学生说明评价任务是什么。教师可以把自己假设成为班级学生中的一员,具备和学生相当的知识水平,然后从学生的角度来看是否能够理解题目的评价任务。当教师编写一个作文题或论述题测验的时候,通常应

58、该清楚地知道哪些问题需要学生花更多的时间来完成,但是学生不可能完全了解教师的心思。所以有些学生在老师认为一般难度的题目上浪费了大量的时间和精力,却只用很短的时间完成那些非常重要的问题。同样,有时候教师认为某些题目比其他的更加重要,于是给这些题目赋予了更多的分值。如果学生并不知道哪些题目的分值多,他们也许会费尽心思只回答了一个分值很低的题目,以至于没有足够的时间去完成高分值的题目。这两种情况都会导致学生的回答成绩不好。要避免这些问题,最直接的方法莫过于让学生知道一套测验中的题目的分值或者需要花费的时间不一样,应该在指导语中或者在每个题目后面附加说明。这样学生才能够按照编制者所期望的方式答题。教师们在实际使用这类测验时,经常给学生提供一定数量的题目,让学生从中挑选一部分回答。比如,教师可能告诉学生“挑选下面几个题目中的一个来写作

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论