石大教育测量与评价教案03教育测验的编制与实施_第1页
石大教育测量与评价教案03教育测验的编制与实施_第2页
石大教育测量与评价教案03教育测验的编制与实施_第3页
石大教育测量与评价教案03教育测验的编制与实施_第4页
石大教育测量与评价教案03教育测验的编制与实施_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章教育测验的编制与实施第一节测验目标的确定一、目标分类研究测验目标的确定是以教育目标分类理论为基础的。自20世纪50年代以来,许多学者提出了各种不同的教育目标分类理论。影响较大的主要有美国布卢姆、加涅、梅里尔,日本梶田叡一等人。其中,以布卢姆的教育目标分类理论是开创性的,在国际上影响最大。(一)布卢姆等人的教育目标分类法美国布卢姆于1948年开始致力于教育目标的分类研究,1956年公布了认知领域的目标分类体系,他把教育目标分为认知领域、情感领域和运动技能领域。评估6.2依据外部证据6.1依据内在证据评估6.2依据外部证据6.1依据内在证据认知领域认知领域综合5.3推导抽象关系综合5.3推导抽象关系5.2制订计划或操作程序5.1进行独特的交流4.3组织原理的分析4.2关系分析4.3组织原理的分析4.2关系分析4.1要素分析分析应用3.1利用事实和概念解决新问题应用3.1利用事实和概念解决新问题2.3推断(预测趋势和结果)2.3推断(预测趋势和结果)2.2解释(说明、概括资料)2.1转化(用不同词汇表达、符号体系与其他体系转化、翻译)领会领会1.3学科领域中的普遍原理和抽象概念的知识(原理和概念、理论和结构)1.2处理具体事物方式方法的知识(惯例、趋势和顺序、分类与类别、准则、方法论)1.3学科领域中的普遍原理和抽象概念的知识(原理和概念、理论和结构)1.2处理具体事物方式方法的知识(惯例、趋势和顺序、分类与类别、准则、方法论)1.1具体的知识(术语的知识、具体事实的知识)知识这六个层次每层次内部又有若干级层次;层次之间有连续性,高层次目标是低层次目标的发展和延伸,高层次目标是在低层次目标的基础上发展起来的。教育的任务就在于帮助学生不断实现更高层次的认知目标。2、情感领域的教育目标分类继认知领域的教育目标分类问世之后,克拉斯沃尔、布卢姆和马西亚于1964年完成了情感领域的教育目标分类。每个层次内部也分为若干层;五个层次之间具有连续性,由简单、具体的行为目标开始,逐步发展到较复杂、较抽象的行为目标,并通过价值的不断内化过程,最后形成性格。性格化5.2特征性格化5.1一般性定向性格化5.2特征性格化5.1一般性定向情感领域组织估价4.2价值观念系统的组织4.1价值的观念化3.3承诺感情感领域组织估价4.2价值观念系统的组织4.1价值的观念化3.3承诺感3.2偏爱某种价值观念3.1接受某种价值观念反应接受2.3反应中的满意感2.2反应的意愿反应接受2.3反应中的满意感2.2反应的意愿2.1反应中的默许1.3有控制或选择地接受1.2愿意接受1.1觉察3、动作技能领域的教育目标分类动作技能的发展和认知与情感的发展有密切关系。一方面,认知和情感的发展可以促进动作技能的发展;另一方面,动作技能的发展对认知和情感领域的发展也有一定影响。哈罗、辛普森和基布勒等学者进行了深入研究,于1970年提出了动作技能领域的四级目标。非语言交流动作细微的协调动作肢体动作4.4声音和手势协调4.3声音投射4.2音和词的结合4.1声音的产生3.3身体动作3.2手势非语言交流动作细微的协调动作肢体动作4.4声音和手势协调4.3声音投射4.2音和词的结合4.1声音的产生3.3身体动作3.2手势3.1面部表情2.5手足眼耳的结合动作2.4手足协调2.3手耳协调2.2手眼协调2.1手和手指协调1.3两个或两个以上肢体的运动1.2下肢运动1.1上肢运动言语行为动作技能领域动作技能领域(二)加涅的教育目标分类法美国当代著名教育心理学家加涅于1977年在《学习的条件》一书的第三版中,把认知领域分为言语信息、智力技能和认知策略三类,其中智力技能再分为辨别、概念、规则、高级规则四类;对技能领域不再分解;将态度领域再分为情感因素、认知因素和行为后果三类。他认为学习的结果,或者教学活动所追求的目标,就是形成学生的五种能力:智力技能、认知策略、言语信息、运动技能和态度。(三)梶田叡一的教育目标分类法日本大阪大学的教授梶田叡一提出了具有东方色彩的教育目标分类理论。他于1983年在《教育评价》一书中,较系统地阐述了他的思想。他提出三分类到达目标理论。包含三大目标:一是基础目标(达成目标),要求学生真正掌握规定的、具体的知识和能力;二是提高目标(向上目标),要求学生向一定目标提高和发展;三是体验目标,通过学生的某种行为变化,了解学生中産的某种切身体验。三类目标中都包含认知、情感和精神运动领域的一系列目标,并有具体到达度要求。这三类分类法的比较见P63。我国测验目标的分类较多借鉴布卢姆的教育目标分类。但必须指出,布卢姆的教育目标分为六类,并不是完美无缺的,也有实验证明布氏的六个类别中“分析”、“综合”是处于同一层次水平的类别。一些专家认为,布氏的“知识”“理解”“应用”的信度和效度都比较高,而“分析”“综合”“评估”三个层次的信度和效度都不明显。我国教育工作者在吸收布卢姆目标分类法合理部分的基础上创用的认知领域目标有五分法(知识、理解、应用、分析综合、创造)和四分法(识记、理解、简单应用、综合运用)。二、确定测验目标应注意的问题(一)深入分析课程教学目标确定测验目标时,应在深入研究并弄清楚课程教学目标的基础上进行,做到测验的目标与教学目标或学习目标相一致。教学目标是指教学活动所预期达到的标准,它是进一步具体化的教育目的。教学目标是一个多层次的目标体系,各门课程可设计出总的教学目标(课程目标),根据课程教学目标,可设计出单元教学目标,根据单元教学目标,又可设计出课时教学目标,根据课时教学目标还可设计出知识点教学目标。行为目标是教学设计中一种更具体的、可观察的教学目标,亦称学习目标。“是对学习者通过教学以后将能做什么的一种明确的、具体的表述。”主要描述学生通过学习以后预期产生的行为变化。美国泰勒是当今行为目标之父。1932年,他指出:通过对课程内容的分析,可以确定以行为描述的目标,在行为目标的基础上编写试题是重要的。他也曾认为,一份好的测验,应该以一定的教育目标为指导,所以要首先找出课程目标,然后以行为将目标表达出来,即制订一系列预期达到的大目标,在每一大目标下又有可测量的行为目标。50年代中期,美国兴起程序教学运动。程序教材序列化过程,实际上就是在进行学习目标的分析工作。通过程序教材的设计,行为目标得到了较广泛的运用。1962年,马杰出版了《程序教学目标编写》一书,以程序教学课本的形式,系统地提出了使用行为术语陈述教学目标的理论和方法。至此以后,美国的行为目标教育大面积铺开。但当时存在两个问题,一是尽管教师掌握了编写的基本技巧,但不知道编写的内容是什么;二是当教师编写好行为目标以后,不知道行为目标的作用何在。产生这两个问题的主要原因是当时尚未形成一个完整的目标教学设计模式。行为目标是目标教学系统的一个有机组成部分,不能脱离目标教学系统的整体,孤立地编写行为目标。行为目标的陈述是十分具体明确的,它具有可观察、可测量的性质。它令师生都清楚地知道通过教与学所要达到的行为上的变化,要说明产生行为的条件,指出评定行为的标准。一般情况下,行为目标应该包括:行为(如“能将文章中阐明事实与发表议论的句子进行分类”)、条件(如“提供一篇报纸上的文章”)、标准(如“至少85%的句子分得正确”)、对象(如“学生”)。(二)正确选择目标领域及其类目这个问题实质上是对不同学科应确立什么样的测验目标的问题。是否所有学科的测验目标都包括认知、技能、态度三个目标领域和相同的目标类目?我们认为,应根据社会要求和学科课程的性质去确定,学科性质不同,着眼点也不同。学科课程,如语文、英语、数学等,应以认知领域为主,因为他们是人类为了将这些学科知识代代相传下去并发展后一代的心智才开设的,学习这些课程应达到掌握知识、强化记忆、发展思维力和想像力等认知方面的目的。但体育、舞蹈、劳作、技艺(手工)、家政等课程则应以动作技能领域为主,因为这些课程的基本内容是动作技能。任何社会对人的发展都有“态度”上的要求,学生学习任何学科都需要借助于情感、动机、意志等非认知因素,即“态度”因素,它们对学生的知识掌握、技能形成、智力和能力发展,都起着“催化”作用,所以无论哪一学科的测验都应重视态度领域的目标。类目数的确定,常与最高测验目标的确定以及目标分类的粗细有关。测验目标要求越高,分类越细,类目就越多。反之,就越少。但一般以3—6类为宜。此外,还应根据课程教学大纲中确定的教学目标的内涵来确定测验目标领域和目标类层。教学目标内涵反映什么目标领域,我们就测验什么领域。即测验目标领域及其类层的高低,取决于教学大纲中教学目标内涵的规定性。由此可见,根据教学大纲中的教学目标去选择测验领域和设计类目层次,关键在于测验编制者对教学目标内涵理解的准确程度和透彻程度。(三)正确理解各类目标之间的关系当我们在某一目标领域进行分类时,要充分考虑各类目标之间的叠层性或序层性。什么是叠层性?我们认为,在各类目标中,起基础作用的因素,由单一到多元,重叠递进,形成一定类别层次,这就是目标类目的叠层性。所谓基础因素,是指实现某一目标起基础作用的条件。如“理解”的“基础”因素是“知识”,“应用”的基础因素则是“知识”和“理解”。由于基础因素不同,于是形成“知识”“理解”“应用”等不同的目标层次。布卢姆认为,教育目标分类,下一层是上一层的基础,上一层目标包含了下一层目标。因此,我们可以把分类表述为这么一种形式:属于A式的行为形成一类,属于AB式的行为形成另一类,而属于ABC式的行为又可以形成一类。所谓序层性,指各类目标按一定的逻辑顺序排列,形成一定的类别层次。序层性与叠层性共同之处是:(1)前一类目标是后一类目标的基础,而后一类目标是前一类目标的必然发展和高层;(2)前一类目标较容易达到而后一类目标较难达到。区别是:序层性强调的是前一类目标内容对后一类目标“正迁移”作用,而后一类目标内容是前一类目标内容作用下的必然发展结果,往往显示一种的质的跳进;而叠层性强调的是,后一类目标的基础因素是前一类目标的基础因素的重复、累积和扩展,往往显示出量的叠加,是在某一种基础因素累积的同时还增加某些新的因素,在此基础上发生变化,从而形成新的更高一级的“类”。一般说来,叠层性包含着序层性的特点,序层性则不一定具有叠层性的性质。第二节测验题型的确定测验的编制是在确定测验目标、选定测验题型和分析测验内容的基础上进行的。测验题型的确定是测验编制的重要环节。一、题型的分类题型可分为两大类,一类是封闭式,一类是开放式。封闭式题型的答案是固定的,十分明确,评分客观、可靠。又可分为选择型和提供型。选择型的要求略低于提供型,前者只要求确认,而后者要求再现。选择型又包括是非题、配对题、选择题等,其中选择题又包括单项选择和多项选择。单项选择又分为正误式和比较式。提供型包括填空题、改错题、名词解释题、简答题。开放式题型正确答案的自由度比较大,由评卷者掌握,不能用机器阅卷。包括计算题、证明题、论述题、写作题、设计题、翻译题等。题型体系如图P71页所示。二、较通用题型(一)是非题由一个陈述句构成,要求学生判断真或假,是或非,对或错等,答案只有两种可能。主要功能是测量学生判断陈述句子的正确性的能力。这些陈述句子包括事实、术语的定义、原理的表述等。是非题的优点是容易编写,适用于各学科测验,记分客观,取样范围大,但它不适合于测量较高层次的学习结果,学生答题猜测因素较大。(二)配对题这实际上是一种改选的选择题,是把一系列题干列成一列,把配备的选项列在另一列,即数个题干共同使用相同的几个选项,要求所有选项构成为每一题干的似真项。主要功能是测量学生对字词、事件、人物、地点、公式、原理等关系的识记能力和联结能力。常用于测量和判断某些术语的意义,某些事件发生的时间、地点,人物所取得的成就,化学元素符号等记忆性知识。配对题在极短时间内能够测量大量相互关联的知识,也容易编制,但不适宜测量高层次认知水平。(三)选择题是由一个“题干”和几个“选项”所组成的试题,其功能是迷惑那些无法确定正确答案的考生,测量学生对问题的理解、再认、比较与辨别能力,以及思维的敏捷性和准确的判断力。一般又分为单项选择题和多项选择题。单项选择题是一道试题中有几个可供选择的答案,要求考生只能从中选择一个答案。又分为正误式和比较式两种。正误式指一道试题中有几个答案,其中只有一个是正确的,其余都是错误的。比较式指一道试题中有几个答案,要求考生通过比较而作出最佳答案的选择。多项选择题是一道试题有几个答案,要求考生作两项或两项以上的正确答案的选择。全选对才满分,否则不给分。选择题适合测试的内容较广,其组题方式灵活多变,可从不同角度对其进行分类,最常见的有8类:(1)辨识选择,常用于辨识字词的形音义、文化常识、公式定理、名词术语等;(2)阅读选择,前面给一段文字,后面提供备选答案,要求考生读后选出正确答案;(3)最佳选择,要求从几个备选答案中,通过比较,选择出最佳答案来;(4)图解选择,将文字材料画成几幅示意图,要求选出符合文字材料所显示的情景或关系的示意图;(5)归类选择:列出一组事物,并将事物分类,要求按一定标准选出归类正确的项;(6)承接选择:给定一个或几个待续的句子然后列出几个承接句子,要求选出其中衔接恰当的承接句子。(7)排序选择:将几个事物列出几种排列顺序,要求选出排列顺序正确的项;(8)填空选择:在一句话中空缺一些字、词、句或标点,要求在备选几种答案中选出恰当的填补项。选择题评分客观、准确、省时。但编制费时较多,不大适宜测量学生的组织知识能力和表达能力。(四)填空题填空题的一般形式是提供一个留有空隙的不完整的陈述句子,要求考生将空缺的字、词、句补填上去。其主要功能是测量学生的记忆能力。常见的有:(1)补省填空,列出句子,要求将省略部分字词补出。(2)默写填空,只写出开头和结尾句,留下中间部分,要求默写出来,或只以文字说明,指定默写的内容。(3)表格填空,将有关知识内容列成表格,要求按表格规定的项目关系填空。(4)排序填空,在一段课文中抽出若干句子,打乱次序,编上序号,要求将这些句子序号按顺序填在答案空格中。(5)语境填空,在一段文字中,空缺某些字句,要求根据上下文情境把空缺部分填写出来。填空题取样广泛,可提高效度,可避免学生乱猜,也容易编写,但容易造成学生死记硬背。(五)改错题指提供有错误的陈述句子,要求考生在句子错误部分的下面划线,并将正确答案写在线下面。主要功能是测量学生的判断能力、记忆能力和理解能力,试题容易编制,可避免学生乱猜,但如果没有对考生的改错做出必要的限定,则会造成正确答案没有统一的情况。(六)名词解释题即提供重要的名词或概念,要求考生作出正确的解释。这种试题主要功能是测量学生对一些重要术语、概念的掌握情况。命题简单,但易造成死记硬背。(七)简答题是提供问题,要求考生对考题作出简要回答,常由一个直接问句或“不完全叙述句”构成。主要功能是测量考生对重要知识的记忆程度。适用于对一般知识层次学习结果的测量,有时也可测量考生解决问题的能力。优点是编写试题容易,不受猜测影响。缺点是不能测量较复杂学习结果和较高层次的知识水平。(八)计算题是在试题中提供计算条件,提出计算要求,要求考生计算结果,有时还要求作出解答。通常所求值、求解或化简作为目标,而且解答过程以计算为主。这种试题的主要功能是测量考生解决问题的思维能力以及对运算技巧的掌握程度。评分客观准确,但编制较难。(九)论述题是向考生提出较为复杂的问题,要求作出分析、说明、解释、论证,或作出结论,或提出自己的观点和见解。其主要功能是测量考生组织知识、表达思维和分析问题、解决问题的能力。使考生有较多的独立思考,自由发挥的机会,但评分主观因素较多。第三节命题设计当确定了测验的目标与测验的题型以后,接着便是命题设计。一、命题双向细目表命题双向细目表是设计试卷的蓝图。它使命题工作避免盲目性而具有计划性,使命题者明确测验的目标,把握试题的比例与份量,提高命题的效率和质量,同时对于审查试题的效度也有重要指导意义。命题双向细目表一般的包括两个维度表格。较常见的有:(1)反映测验内容与测验目标关系的双向细目表。(2)反映测验内容与测验目标、题型之间关系的双向细目表。(3)反映题型与难度、测验内容之间关系的双向细目表。(4)反映题型与难度、测验目标之间关系的双向细目表。具体详见教材P78—80页。二、命题设计的改革探索近10年来,我国教育界为了提高测验命题的科学化、规范化水平,较普遍采用“命题双向细目表”去设计。但单纯采用“双向细目表”不足以解决试题的效度问题。首先,“双向细目表”中测验内容一般只反映教科书的知识点,而只以知识点作为测验内容,是不全面的,因为它不能代表全部教学内容。从理论上说,学科测验内容应代表或反映学科教学的全部内容,然而根据教学大纲的要求,学科教学内容并不完全等同于教科书的知识。如学科教学内容中的技能训练、思想品德培养、情感智商(简称“EQ”)的培育等方面,教科书的知识就不能完全涵盖,虽然,在教学过程中,教师发挥主导作用,学生萌发主观能动性,均以教科书为依据,但并不限于教科书知识。可见教学内容具有超越教科书知识点的的特征。单纯从学生掌握教科书知识点的水平去衡量教学目标的达到程度,显然有局限性。其次,“双向细目表”设计的测验目标类层与学科教学大纲规定的教学目标类层不一致,即两者存在脱节现象。许多教育工作者在设计测验目标类层时,指导思想模糊,随意性大,常抛开既定教学目标,以为教学目标是一回事而测验目标是另外一回事,没有认识到要将教学目标与测验目标有机统一起来,也不懂得如何统一起来。本世纪60年代以来,为更好提高教学效果,国外流行教学设计技术。教学设计是在系统论思想的指导下去设计教学过程及操作程序的一门教学技术。强调对教学目标、教学对象、教学内容进行深入细致的分析,在此基础上进行教学策略之设计,最后对教学效果进行测量与评价;同时它以教学目标为中心和出发点,去设计教学程序,又以教学目标为基准去评价教学效果。因而要求教学目标具体、明确、类别清楚。将教学设计这些原理和方法运用于命题设计,是提高命题效度的重大举措。命题设计涉及认知、思想情感、动作技能三大目标领域,但认知领域是基础,是最主要的领域,在学科测验中,这一领域占主导地位,同时,目前国内外对认知领域目标分类法的研究较为成熟。因此,这里通过论述认知领域命题设计方法来阐明解决这一领域的命题效度问题。认知领域命题设计方法,主要包括内容类测验目标模型之构建,内容点测验目标表之确定,命题方案表之设计三个环节。(一)内容类测验目标模型之构建内容类测验目标模型(以下简称“内容类模型”)由三部分组成:内容类维、目标层次维、两维之交合。“内容类”指将测验内容分成若干不同特质的类型,一般分为3—5类。如分为“事实”“概念”“技能”“原理”“问题”等,不同学科,分类可能不同。分类是以学科教学内容的性质的分析为基础,按各类内容所确定的最高目标从低到高由左至右排列。“目标层次”是指测验目标的高低层次。一般以布卢姆的教育目标分类法为基础,分3—6类。我国近年来除用布氏六分法外,还有五分法、四分法等。将测验目标分成什么类别,定为多少层级,应以教学大纲中确定的教学目标为依据。“两维之交合”是指内容类与目标层次的纵横交接处,它表明各类测验内容(教学内容)应达到的测验目标(教学目标)层次。根据布卢姆的意见,高层次目标已包含低层次目标,因此,如何设计两维之交合,关键是准确地确定各类测验内容应达到的最高目标层次,这要根据教学大纲所规定的教学目标去确定。例如,教学大纲中目标是“使学生理解本课程基本概念”“培养学生分析和解决问题的能力”,据此规定我们可以确定“概念”类内容的最高层次测验目标是“理解”,这类内容的测验目标包括“知识”“理解”共两层。“问题”类内容的最高层次测验目标是“创造”,因为解决问题的能力是一种创造能力,因此它包括“知识”“理解”“应用”“分析与评价”“创造”共五层。根据以上论述,不同学科不同教学目标,所构建的内容类模型是允许有差异的,假定我们根据某一学科教学内容(测验内容)和教学目标,构建出如下内容类模型。见P84页图及解释。内容类模型是测验命题设计的重要工具,它的科学设计和构建是提高试题效度的第一步工作。(二)内容点测验目标表之确定内容点测验目标表(简称“内容点表”)由教学内容(测验内容)和测验目标两个系列构成。测验目标系列类层的设计应与内容类模型一致。教学内容的设计应以教学内容的分析为基础。教学内容主要指教科书的内容,此外,还包括与学科课程有关的其它内容。教学内容是教师借以发展学生认知能力、思想感情、动作技能的“中介”和“媒体”。以教学内容为中介和媒体去命题,可以有效测量学生认知领域、情感领域、动作技能领域的各个目标层次。1、教科书知识2、其它内容为了便于设计和测量,可将教学内容总体分成内容块,然后再分解为内容点。如图所示。1、教科书知识2、其它内容若干内容点若干内容块教学内容总体若干内容点若干内容块教学内容总体图中,无论是内容总体、内容块,还是内容点,都包含着教科书知识,内容块不等于知识块,内容点不等于知识点。教学内容主要是教科书知识,但又超越教科书知识,它具有更有效地测量各类层教学目标之功能,因此,我们主张在测验命题时设计表格中,采用“内容块”和“内容点”系列取代现在流行的用“知识块”和“知识点”系列。另外上图还反映了教学内容整体与部分之间的关系。首先是将教学内容总体分解成内容块,可用教学内容的章节作为分解的基本依据,将每章或每节转换成一个内容块;也可用知识单元作为内容块。要尽可能使每个内容块成为一个相对独立的小整体。其次,是将内容块分成内容点,内容点不能太琐碎,每个内容点尽可能保持相对完整。有时一个内容点仅仅属于某类特质的知识,如某个教学内容点纯属“概念”类;但有时在一个教学内容点中包含着“事实”“原理”“问题”等三类。正因为如此,根据“内容类模型”,一个内容点可能只设计一个层次的测验目标,也可能设计几个层次的测验目标。这要在分析内容点内涵特质的基础上去确定。那么,应如何设计内容系列的测验目标呢?我们认为,设计时必须依据教学大纲、内容类模型和学生实际。之所以要依据教学大纲,是因为教学大纲是命题的出发点,是根本依据。内容点表的设计是以教学大纲为轴心的。总的来说,内容点表应是教学大纲中教学内容与目标的具体反映或有效转换(将“大纲”转换成“细目”)。之所以要依据内容类模型,是因为内容类模型是教学大纲与内容点表之间的中介,它是抽象概括的教学内容和目标转化为具体细致的内容点表的桥梁。具体说来,它将教学内容过渡到测验内容,将宏观的类层界线过渡到微观的类层界线,将模糊的教学目的和目标,过渡到精确的测验目标。之所以要依据学生实际,是因为教学大纲转化为“内容点表”并不意味着将教学大纲中设定的教学内容全盘照搬或机械转运到内容表中。教学目标是通过教学效果来体现的,教学的良好效果,表现在教学内容给学生的增益,若一项内容未能给学生任何增益,则说明该项内容没有什么教学效果,因而教学目标实现程度无法测量。教学内容总体总是会对学生产生增益值的,因此人们可以根据学科内容体系来确定总的测验目标,然而,当教学内容总体被分解成若干内容块,而又细分为若干内容点以后,未必所有内容点都会对学生产生增益值。只有对学生产生增益值(不管大小)的那些内容点,才可能测量到教学目标的实现程度;对学生不能产生增益值的内容点,则不具备测量教学目标之功能,即使测验结果发现学生已经掌握了这些内容点并已达到目标层次,但这不是由教学所产生的效果,而是在教学之前学生对这些内容点的掌握已达到了教学大纲确定的目标了。在教学过程中这些内容点实际上没有给学生产生增益值,象这样的内容点是无法测量教学目标的实现程度的。因而在设计内容点表时可以忽略教学大纲中预先规定的这些内容,即不把这些内容作为内容点表中的内容点。所以,应从学生实际出发,在充分分析学生原有水平的基础上去确定测验内容点及其目标层次。具体应用可以参见P87页表3.7及其解释。必须指出的是,在设计程序上,要首先从学生实际出发(原有水平),分析哪些内容点该确定测验目标,哪些内容点该忽略。只有对学生产生增益值的内容点,才按上述办法设计测验目标层次。同时,根据教学内容的性质类别按内容类模型的设计去确定的测验目标,有时不一定与教学大纲中规定要达到的目标相一致,因为教学大纲制订者在确定教学总目标及教学内容时,存在着误差,教学内容可能不完全为教学目标服务,因此,我们不能机械地使用内容类模型。内容点测验目标层次的确定,首先依据的应是教学大纲中规定的教学目的和任务,然后才灵活地使用内容类模型,当初步拟定各内容点的测验目标后,应将各内容点测验目标综合起来,整体上分析评价所拟定的测验目标与教学大纲规定的教学目标和任务是否一致,若不一致,则应根据内容类模型与考生情况进行适当调整,经反复调整,最后才将每个内容点的测验目标确定下来。(三)命题方案表之设计内容点表的设计,已令教学内容总体分解成具体的测验内容,并令综合概括的教学目标转化为具有明确类层的测验目标,显然,在操作程序上已沿着由抽象到具体的路向跨进了一步。这是提高命题效度关键性的一步。但是这一步只是从定性分析和主观判断上去寻求测验内容与教学内容的一致性,以及测验目标与教学目标的一致性。然而,试卷总是以一定的量化形式出现的,如分值、题量等。因此,测验内容与教学内容的一致性,测验目标与教学目标的一致性,还应以一定的量化形式反映出来。命题方案表的设计就试图解决这一问题。命题方案表是内容表点的继续。应结合内容类模型和内容点表,依次设计出如下两种命题方案表:(1)反映测验内容与测验目标关系的设计细目表;(2)反映测验内容与题型、目标关系的设计细目表。测验内容(内容块)测验目标知识理解应用分析与综合创造合计平面235515空间两直线3334215空间直线和平面28913335空间两个平面24915535合计918263710100上表是模拟设计的反映测验内容与测验目标的设计表。表中,纵横标目由表3.7而得。比例确定的方法有两种,一种是计算法,一种是判断法。计算法指根据在测验内容系列上或测验目标层次上各项所用的教学时数确定各项的比例。各项测验比例的计算方法,是分别把各项内容块(或章节)实际教学时数除以总教学时数,再乘以100后取整数,即可得到表中最后一列的数值。也可根据教学大纲规定的各项内容块(或章节)所用的教学时数来计算。一般来说,学校平时测验或形成性测验的命题设计可采用实际教学时数来计算,而统考或总结性测验的命题设计则应采用教学大纲规定的教学时数来计算。测验目标系列上各层次的比例计算方法,是参考预先设计的内容点表(如表3.7)对相应的内容块中各内容点所设定的测验目标,结合教学设计时对达标所安排的教学时数来计算,即分别将表3.7中各内容点在同一目标层次上所用教学时数之和,除以总教学时数,再乘以100后取整数,则可得到上表中最后一行的数值。判断法根据对内容系列上各项在整体上的相对重要性的判断,来确定各项测验内容的比例。这种主观判断法,是在对双向项目重要性的分析判断基础上来进行比例分配的,因而要求命题设计者不但要熟悉教学大纲,深入研究教材和测验目标,而且要有丰富的命题经验。当确定了横标目与纵标目的合计数(即比例)后,接着是确定表身的数据。若用计算法,方法是,将每块内容在不同目标层次上的教学时间分别除以这块内容的教学总时间,再乘以横合计数,取整数,即为“内容”与“目标”交合点的数据。初步计算出表身数据后,还要将数据作适当调整,令各行或各列的数量之和等于表中的横或纵的合计数。若用综合判断法,方法是根据内容点所设计的各内容点测验目标层次,综合分析判断,把行、列合计数适当地分配表表身上去,令各行或各列的数量之和等于先前确定的行、列合计数。根据“反映测验内容与测验目标关系的设计表”,还可以进一步设计出“反映测验内容与题型、目标关系的设计表”。其思路是一样的。具体例子见P90-91页的分析。以上命题方法,以提高试题效度为核心,演绎递进,思路清晰,具体明确,而且从定性分析到定量设计,系统周密,可操作性强,比较适用于学科教学测验命题。但设计过程繁琐,花费时间多,有待于进一步探索和改进。第四节试题的编制试题的编制是整个测验编制工作的关键环节。一、试题编制的质量要求(一)明确测验目标要根据教学大纲的要求去确定测验目标,应以测验学生的基本知识、基本理论和基本技能为主,注重学生分析问题和解决问题的能力,以及理论知识的应用能力和科学创造能力。整份试题的结构要有合理的目标层次。一份试卷中,试题一般应包括三个至五个层次水平。一般分为知识、理解、简单运用、综合运用、创见五个。(二)题量尽可能大,试题覆盖面尽量宽一般而言,题数多一点比题数少一点好。这样能够确保测验题目的代表性,提高测验的内容效度,要扩大考查面,各章、节,各方面的知识都要兼顾到。同时,还要突出重点,加大重点内容题量和覆盖密度,做到试题的测验重点与课程教学的重点相一致。(三)掌握好试题的区分度和难度试题的区分度尽可能大,应把不同水平的考生在相同知识点上掌握程度的差异区分出来。难度的掌握,大体上可分较易、适中、较难、最难四等,一般情况下,较易占20%左右,适中和较难各占30%左右,最难的约占20%左右。(四)注意改进题型一套试题型一般不应少于四种,分值比例要适当,客观题约占60%左右,主观题约占40%左右,题型尽可能灵活。一道题既可以只测验一个知识点,也可以测验不同章节的几个知识点;对于同一测验知识点,也可以从不同角度用不同题型去编制试题。(五)每道试题的编写要讲究科学性试题的内容要正确,不能出现知识性错误。有争议的问题不要编入试题;文字表达明确、简练、规范、通顺,标点符号要正确;图表清晰,计算条件充分;不能出现语法上或用词上的错误;试题的分值要合理;各题必须彼此独立,不出现相同或近似的试题,不要有相互暗示或相互启发现象。(六)制订好标准答案、评分标准和评卷的具体要求标准答案应具体明确,正确无误,答案各层次的分值要标明。试题赋分通常采用难度赋分法和时间赋分法,即难度较大,花费时间较多的题,分值应大一点,反之则小一些。对答案的评分要求要加以说明。(七)拼卷和检核拼卷一般以题型为顺序,由易到难,由客观题到主观题,由短答案题到长答案题排列。检核的内容主要是(1)试题能否测到命题双向细目表中的各项目标和内容;(2)试题的表述是否明确科学,分值是否合理;(3)试题的题型和编排是否合理;(4)难易程度是否适合;(5)试卷的长度与作答时间是否相符;(6)试题的标准答案是否正确明确。二、试题编制的组织管理命题的组织管理是确保测验质量的重要环节。命题工作要严密组织、严格管理,注重命题工作的科学化、标准化和管理手段的现代化。(一)组织领导与命题人员如果是大规模的统考命题,要成立专门的命题领导机构,对命题工作进行总体规划,统一领导。命题人员由测验领导机构聘任。命题人员的主要职责是:学习有关命题文件,起草课程测验大纲,设计试卷蓝图,提出命题实施意见;实施命题;对试卷的质量和题库负责;参与课程试卷的质量分析。如果是学校一般测验命题,则应在主管教学副校长领导下,由教务处(科)全面负责,制订有关规定,对测验的全过程实行规范化管理。课程测验命题在有关教研室(组)主任(组长)的领导下进行,由任课教师命题或教研室约请有经验的教师命题,教研室(组)主任(组长)审定,凡使用统一教学大纲在不同班级开设同一门课程的测验,应由开出课程的室(组)指定有经验的教师组成命题小组进行命题,制定统一的评分标准,并统一组织评卷。(二)命题过程的组织管理如果是大规模的统考命题,要抓好如下六个环节:(1)组织命题人员学习、培训,明确命题目的,统一命题指导思想,并组织试命题。(2)制订命题大纲,命题实施方案,命题教师分工表,样题等。这些文件主要内容包括:总的要求,题型及其比例,试题层次及难易度,总题量和各题型的题量,分数分布,样题,命题人员及分工,完成任务日期,保密措施等。(3)按照命题大纲、命题方案和有关要求编制试题。(4)审定试题,将审定合格的试题分类储人题库。(5)按照命题大纲的规定组配试卷。(6)试卷的印制和保管。试卷的印制要求做到清晰、准确,因而要认真校对,避免出错漏。同时,要妥善保管并注意保密。如果是学校教师自编测验,命题要抓好如下四个环节:(1)命题教师深入钻研测验课程的教学大纲,明确测验的目标和要求。(2)制订命题双向细目表,做出试卷蓝图。’(3)根据教学大纲、教材和双向细目表,结合教学实际和学生实际,编制试题。每门课程必须同时出两套试题,一套用于正考(一般称A卷),一套用于补考(一般称B卷)。两套试题的形式和水平基本相等(即“同质”),一般不应有重复。每套试题须附有参考答案和评分标准。(4)试卷的印制与保管。试题的打印、誊写、复制应做到字迹清晰、准确,因而要认真进行核对,避免出现错漏。还要妥善保管,注意保密。第五节测验实施命题是为实施服务的,科学的命题必须配以严格的实施,质量才得以保证。测验实施要抓好如下工作。(一)指定专人做好考务工作指定专人做好命题、印制及保管试卷;具体编排测验科目、时间、考场,确定监考人员,检查考场执行测验纪律的情况;做好评卷、成绩登记及公布、测验分析及总结等各项工作。(二)确定测验形式和审查学生澍验资格测验可用闭卷笔试、开卷笔试、口试或口笔试结合、答辩、操作表演等形式。主讲教师要根据课程特点和测验目的要求恰当选择测验形式。符合该课程测验条件和规定者,才能参加该课程测验。学生因故不能参加测验者,需由本人在测验前提出缓考申请并附上有关证件,经领导批准后方可缓考。否则作旷考论。(三)考场的组织飞1.考场布置如果是统考,不但测验时间要

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论