




已阅读5页,还剩17页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
课程与教学评价 指导教师:钱旭升 组员:姚夏婷 张尧 车伟燕 雷睿 贾娜 目录一、课程与教学评价的概述11. 课程与教学评价的定义12. 课程与教学评价的对象13. 课程与教学评价中的价值与判断24. 课程与教学评价的方法35. 课程评价与课程开发、课程研究45.1课程评价与课程开发45.2 课程评价与课程研究4二、课程与教学评价的类型51. 形成性评价与总结性评价52. 目标本位评价与目标游离评价63. 效果评价与内在评价64. 内部人员评价和外部人员评价65. 伪评价、准评价、真评价75.1 伪评价75.2 准评价85.3 真评价8三、课程与教学评价的基本模式91. 课程与教学评价的模式92. 几种典型的课程与教学评价模式102.1 泰勒模式102.2 cipp模式102.3 差别模式112.4 外貌模式112.5 回应模式13四、课程与教学评价的方法131. 测验法141.1 测验法的含义141.2 良好测验的指标141.3 测验试题的种类及编制原则152. 档案袋评价法163. 表现性评价法183.1 强调任务的实际性、真实性183.2 重视评价学生的实际操作与解决问题能力183.3 重视学生学习的个性183.4 促进学生自我决策、自我负责183.5 评价主体多元193.6 强化沟通与合作学习的能力193.7 对学习结果和学习过程的并重19课程与教学评价 评价是人类有意识活动的一个表征。评价的实质在于促使人类活动日趋完善,是人类行为自觉性与反思性的体现。实际上,评价广泛渗透于人类所有有意识的活动之中,构成活动的一个有机组成部分。课程与教学评价同样是如此,其根本目的在于保证课程开发与教学设计的合理性。正规的课程与教学评价发端于20世纪初的课程开发与教育实践,兴盛于21世纪50、60年代,70年代后越来越受到人们的重视,逐渐发展成为一个专门的、跨学科的研究领域。一、 课程与教学评价的概述1. 课程与教学评价的定义课程与教学评价的定义是一个颇有争议的问题。这主要与评价发展的不同时期人们对评价的理解不同有关。例如,有人把评价与测验等同理解,有人则以为二者有本质的区别。有“课程评价之父”之美誉的泰勒把课程与教学评价看作是对课程与教学目标实际达成程度的描述,而其后的评价专家们则大多认为评价还应是作出价值判断的过程,美国“教育评价标准联合委员会”1981年给评价下的定义就是:对某一对象(方案、设计或者内容)的价值或优点所作的系统探查。此外,还有人提出“评价即研究”的命题。对这些不同的定义,我们在讨论课程与教学评价的历史发展时,还将作详细的探讨。就当前情况看,提到“评价”,人们大都把它与“判断”、“价值”等概念联系起来。这样,如果从字面意义看,所谓“课程与教学评价”,就是以一定的方法、途径对课程与教学的计划、活动以及结果等有关问题的价值或特点作出判断的过程。这个定义大抵描述了课程评价的一般性质,但要想准确把握其涵义,还要结合几个具体的问题,其中包括:(1)关于课程与教学的计划、活动以及结果,即评价对象的问题;(2)关于对价值或特点的理解问题,这涉及评价的标准;(3)关于评价的方法、途径问题。这几个问题既是理解评价定义所要搞清的,也是评价领域中的重大问题。2. 课程与教学评价的对象上述定义中,课程与教学评价的对象表述为“课程与教学的计划、活动以及结果等有关问题”,但事实上,评价绝大多数都是针对学生的学习特别是学习的结果进行的。我国直至目前仍处于这种状况,国外直到20世纪60年代中期也极少有针对其他问题的评价。以后,随着教育系统内外各项事业的进展,课程与教学评价的对象逐渐扩展到课程与教学的计划、内容、目标等,从而逐渐明确了课程与教学评价不应局限于学生的学习,评价对象由此不断丰富起来。 国外有人认为,施瓦布提出的四个课程要素,即教师、学习者、教材以及环境,可作为课程与教学评价的对象。1 see marsh,cwillis,g.(1995),cwrriculum:alternatise approoches,ongoing issues,a simon company.p.258尽管这四个要素在评价中都是必要的,但在不同的评价中,它们受重视的程度不同,有关要素的信息来源也有很大不同。例如,关于学校所处的社会环境的信息,也许来自学校与学生、教师和行政人员的晤谈,或来自学校与父母、雇主及团体中其他成员的晤谈;关于学校中教材、教学的信息,可能来自学校行政人员、校外的教材专家、出版者、督导员及家长。资料来源的范围及选择,与评价的目的、规模、时间及使用的资金也有关。评价的主题一经确定,就有可能计划如何获得需要的信息。例如,评价者决定,关于学习者的信息应该既包括学业成绩,也包括学习者在课堂上与教师和其他学生的互动。这其中,可能包括课程实施之前手机的诊断性资料、课程实施过程中收集的形成性资料以及学生完成某一学习过程之后手机的总结性资料。与评价对象相关的另一个问题是“评价”一词的使用。目前,评价领域常用的三个英语词汇是:“evaluation”、“assessment”。“ evaluation”一般译为“评价”,“measurement”一般译为“测量”。尽管在很多评价人员的观念中,这三个词汇常常可以通用,但从他们的原意来看,“评价”的对象更多地是指课程、教学计划或与之相关的问题;“评定”的对象则是指向人,如对学生学习成绩的评定,对教师能力的评定等;而“测量”是指用于评价或评定的一种方法、手段,是使用某种测验(test)对上述有关对象赋予一定数量值,作为评价或评定的依据。2 参见许建钺等编译:简明国际教育百科全书 教育测量与评价,教育科学出版社1992年版,第1415页。统一规定设置的,因此一直是只有“教学检查”而无“课程评价”。20世纪80年代来,随着各种教育观念的变化,特别是课程开发权利开始逐渐由中央下放到地方,课程评价显得愈益重要,且在概念的使用上逐渐与西方趋同。本章所使用的“课程与教学评价”一词,相当于西方的“课程评价”概念,在内涵上大大超出了传统教学论框架中的“教学评价”概念。3. 课程与教学评价中的价值与判断价值与判断是评价领域的基本问题,也是一个相当棘手的问题,因为这一问题的确定直接关系到对其他问题的理解,甚至整个评价观。“价值”问题在评价领域凸显出来,是20世纪60年代以后的事情。在这之前,评价并不是直接涉及价值问题,如泰勒对评价的定义就是,“评价过程实质上市一个确定课程与教学计划实际达到教育目标的程度的过程”,在这里,评价就不直接涉及价值问题,它只是就课程与教学活动的结果与预订教育目标符合的程度进行描述,而标准就是预定的、详细说明的课程目标,其相关的价值取向问题则是评价获的考虑之外。20世纪60年代以后,随着社会批判思潮兴起,这种状况发生了转变。人们提出,评价不是一个纯技术性的问题,不是对现象的客观描述。事实上,纯粹价值中立的描述是不存在的,评价要对被评价对象的价值或特点作出判断。由此,价值问题在评价领域凸现出来,人们开始把评价的重点放在价值问题上。例如,评价开始考虑:课程或教学计划代表什么样的价值观(如,是社会适应论还是超越论)?这种价值观为谁所拥有(如,是政府还是某一社会阶层)?这种价值观是否符合学生的需要?应如何看待评价中的价值问题?等等。由于这张种转变,评价的定义遂发生变化。但这种变化并不是用后面的定义取代了前面的定义,事实上,前一种评价至今仍在课程与教学领域发挥作用。我国至今仍是以这种评价为主。 20世纪80年代以来,随着质性评价逐渐兴起,评价领域出现了价值多元化的趋势。评价标准的确立不再依赖于某一团体或阶层的价值观,而是在评价有关各方的交往互动中,在多种价值观的碰撞融通中,寻求多方面都能接受的多元性标准,正因如此,再以“优点”、“长处”这样的概念用于评价,显然是不妥当的。事实上,英语“merit”一词,本来就含有“功效”、“功绩”的意思,据上述斯克瑞文的分析,它也含有“实现了预订目标”这样的意义。如此说来,“merit”一词是适合目标模式的评价使用的,这里所谓的“优”、“长”,只是相对于某种特定的价值取向而言。多元价值观的出现,使这个词在评价领域中的应用显得捉襟见肘。因此,在上述的评价定义中,我们使用了“特点”一词,其含义是把被评方案或活动作为一个整体,全面分析并揭示其与众不同之处,其中当然也包括价值特点。4. 课程与教学评价的方法课程与教学评价的方法大体可分为两类,即量化评价方法与质性评价方法。使用不同的评价方法体现了不同的评价观念。所谓量化评价方法,就是力图把复杂的教育现象简化为数量,进而从数量的分析与比较中推断某一评价对象的成效。量化评价方法的认识论基础是科学实证主义,它认为,只有定量的研究、量化的数据才是科学的,才能得出客观可信的结论。课程与教学评价从产生之日起,就是与整个教育对科学化的追求联系在一起的,以量化形式表征事物的性质被认为是科学化的特征之一。因此,量化评价方法一直占据评价领域的主导地位。量化评价方法如果使用恰当,确实能揭示教育现象和教育问题,提供具有说服力的证据。所谓质性评价方法,就是力图通过自然的调查,全面充分地揭示和描述评价对象的各种特质,以彰显其中的意义,促进理解。质性评价方法也被称为自然主义评价方法。它在认识论上反对科学实证主义的基本观点,反对把复杂的教育现象简化为数字,认为这种做法只能提供歪曲的教育信息,且有可能丢失重要信息。它主张评价应全面反映教育现象的真实情况,为改进教育实践提供真实可靠的依据。质性评价方法是20世纪60、70年代以来,随着评价领域对传统的以量化为特征的评价方法的反思批判而发展起来的,它也是科学研究中的质性研究方法在评价领域渗透的结果。虽然量化评价方法与质性评价方法出现在评价发展的不同时期,代表着不同的认识理念,但作为具体的评价方法,二者各自具有不同的特点,分别适用于不同的评价目标和对象。比如,量化评价方法具有简单、单纯的教育现象;质性评价方法具有全面、深刻的特点,在某种程度上,它是评价者对教育现象的某种解读,更适用于评价复杂的教育现象。因此,从实践出发的教育评价应该把二者有效地结合起来,按照评价目的与评价对象的不同特点,选择适当的评价方法,以获得全面、准确的评价信息。5. 课程评价与课程开发、课程研究 课程开发、课程研究与课程评价,是课程领域中最常用的几个词汇。它们既有着各自不同的内涵,又不可分割地联系在一起。5.1课程评价与课程开发教育活动一般都由目标、内容、方法以及具体的教育实践这几个因素构成。课程评价就是依据对这些活动的调查分析,揭示教育程序所具有的价值与效果,为课程开发提供有效的信息。在传统的概念中,课程评价是课程设计的一个组成部分,这源于博比特、泰勒等人的贡献,他们认为,课程编制的第一个关键步骤,即:(1)学校应该追求哪些教育目标?(2)如何选择可能有助于达成这些教育目标的学习经验?(3)如何组织学习经验才能使教学更有成效?(4)评价学习活动达成教育目标的程度。塔巴等人在“泰勒原理”的基础上,立足于对社会与文化、学习者与学习过程、知识的特点等的科学分析,提出课程构成的原则与方法,进一步明确了课程编制的步骤或框架,即:(1)诊断各种教育需要(2)确定目标(3)选择内容(4)组织内容(5)选择学习经验(6)学习经验的系统化(7)评价事项与方法的系统化(8)检查平衡性和顺序性。塔巴系统地把握了教育目标的确定、与目标相应的内容及其排列、实施结果与效果的测定以及评价这一系列课程编制的步骤,从而使评价的概念及其方法更趋精密化和结构化。20世纪60年代以后,在各国大规模的教育现代化进程中,课程编制逐渐成为一项由课程计划、实施、评估以及修订组成的具有连续性和开发性的工作。早先所用的“课程编制”、“课程设计”等词汇,也被“课程开发”一词所替代,这标志着课程概念的扩大。与此同时,课程评价的概念也有所扩大和强调。例如,经济合作与开发课程不仅是有意识、有计划地编制的教育内容,而且包括儿童从人际关系中学到的东西(隐性课程)以及与学习活动有关的一切方面的极其广泛的内容。这种见解强调,课程要一以贯之地、系统地把握教育过程中的目标、内容、方法;强调课程不仅要有国家一级的开发,而且要有扎根于学校的以学校为本位的开发,即后来被广泛接受的校本课程开发。这样,课程开发强调了课程概念的扩大和学校教师自编课程的积极作用,促进了课程开发系统的整顿与确立,课程评价的概念从而也不再局限于对既定目标达成程度的描述,而更多地强调为改进课程,即课程的不断开发提供有效的信息。课程评价与课程开发形成一种开放的良性循环关系。5.2 课程评价与课程研究 应该指出,课程评价与课程研究都是处于不断发展中的概念。就课程研究来看,它的定义存在很多歧见。许多学者指出,课程研究的范围是很难界定的。3 参见李子健、黄显华:课程:范式、取向和设计,香港中文大学出版社1996年版,第406页。首先,研究具有不同的取向,因此,对什么才算是研究已有难有定论。其次,“课程”一词具有不同的定义和范式。因此,学者们往往建议“课程研究”的定义应采用谢福勒所谓的“约定式”定义和“规划式”定义。前者是指学者自行界定课程研究的范围,后者是指课程研究蕴含的行动建议。但是,从总体上看,以20世纪70年代为分界线,课程研究表现出两种不同的取向。在这之前,以“泰勒原理”为典范的课程研究的特征是为课程开发服务,课程研究的成果是一些“原则”和“程序”。但从70年代开始,以“概念重建主义”课程研究范式为先导,课程研究转向主要研究“如何理解课程”。这种研究取向把课程视为“符合表征”,课程研究的目的是“理解”“课程”“符号”所负载的价值观。此后,这种研究理念被广泛接受和发展。由此,课程变成了一种“文本”,对这种“文本”的不同角度的解读,形成了丰富多彩的“课程话语”。当今的课程研究已经不再局限于关于课程开发的程序的论争,而是将课程置于广泛的社会、政治、经济、文化、种族等背景上来理解,联系个人深层的精神世界和生活体验来寻找课程的意义。无独有偶,在课程评价领域,自20世纪70年代也发生了一种取向的转向。如果说在这之前,课程评价重视的是对预订目标、计划的达成程度,那么之后则逐渐转向对课程的一种整体理解。1967年,美国著名评价专家斯太克发表教育评价的外貌一文,提出课程评价不应局限于预定的目标和计划,而应该对课程所涉及的各个方面和全过程进行描述和判断,评价资料的收集也不应只局限于量化方法,而应代之以包含量化方法及质性方法在内的所有适当的方法。这为评价的转向奠定了必要的基础。进入70年代,随着帕勒特和汉米尔顿的解释模式、斯太克的回应模式以及其他许多评价模式和方法的提出,评价的转向得以完成。课程评价不再只是评价专家的事情,与课程有关的各方人士,其价值观在评价中都应有所反应;评价的方法也从以量化方法为主转向以质性方法为主,各种历史的、人种志的、美学的等方法都被作为获取评价资料的恰当方法而加以运用;评价的目的不再是总结性的,而是为课程的修订提供依据。课程评价与课程开发之间建立起一种循环往复的关系。正是在上述基础上,课程评价与课程研究之间正呈现出逐渐融合的趋势。就自身而言,它们都追求一种把课程作为“文本”来解读。二、课程与教学评价的类型依据不同的标准可以对课程与教学评价进行不同的分类。常见的分类有:根据评价的作用和性质,把评价分为形成性评价与总结性评价;根据评价与预定目标的关系,把评价分为目标本位评价和目标游离评价;根据评价关注的焦点,把评价分为效果评价与内在评价;根据评价人员的身份,把评价分为内部人员评价与外部人员评价;根据评价的目标、宗旨,把评价分为伪评价、准评价、真评价;等等。以下择其要着加以介绍。1. 形成性评价与总结性评价形成性评价(formative evaluation)与总结性评价(summative evaluation)是美国课程评价专家斯克瑞文1967年提出的两种评价类型。形成性评价是在课程开发或课程实施尚处于发展或完善阶段时所进行的评价,其主要目的在于搜集课程开发或实施过程中各个局部的优缺点的资料,作为进一步修订和完善的依据。总结性评价则是在课程开发或课程实施完成之后所实施的评价,其主要目的在于搜索资料,对课程计划的成效作出整体判断,作为推广采用或不同课程计划之间比较的依据。与形成性评价和总结性评价相关的还有一种评价类型,即诊断性评价。诊断性评价是在课程计划或活动开始之前,对需要或准备状态的一种评价,其目的在于使计划或活动的安排具有针对性。布卢姆的评价体系曾把诊断性评价、形成性评价、总结性评价作为达成预定教育目标的序列手段,在学生学习的不同时段施行,以促进预定行为目标的达成。这种评价体系曾在我国许多地方推行。2. 目标本位评价与目标游离评价目标本位评价(goal-based evaluation)即以课程或教学计划的预定目标为依据而进行的评价。目标本位评价通常要判断的是目标实现的程度,因此,这类评价往往要求精心描述可以辨别的目标。这种评价最典型的代表是泰勒的评价模式,布卢姆的评价体系也属于这类评价。目标游离评价(goal-free)要求脱离预定目标,以课程设计或活动的全部实际结果为评价对象,尽可能全面客观地展示这些结果。3. 效果评价与内在评价效果评价(pay-off evaluation)与内在评价(intrinsic evaluation)也是由斯克瑞文提出的,这两种评价分别代表了两种不同的思想取向。效果评价是对课程或教学设计实际效用的评价,它注重课程实施前后学生或教师所产生的变化,至于课程运作的具体状况、变化产生的原因等,则被置之度外。因此,效果评价往往是通过对前测与后测之间、实验组与控制组之间的差异作出判断。这种评价因而也被称为“暗箱式评价”只关注输入与输出之间的不同,忽略中间的过程。内在评价则是对课程计划本身的评价,而不涉及课程计划可能有的效果。比如,评价可以之久课程计划设计的学生经验的类型、课程内容的性质和组织等,来对课程计划作出判断。至于计划的效果,则在评价关注的范围之外。或者说,在内在评价的提倡者看来,只要有好的课程计划,就一定能取得好的教学效果。效果评价与内在评价,一个关注结果,一个关注过程,二者具有互补性。理想的课程评价体系的建构应当善于把这两种评价结合起来。4. 内部人员评价和外部人员评价内部人员评价(insider evaluation)是指评价由课程设计者或使用者自己实施。外部人员评价(outsider evaluation)是指评价由课程设计者或使用者以外的其他人(包括没有参与设计的评价专家)来实施。上述两种评价各有利弊。内部人员评价长期在于评价者了解课程设计方案的内在精神和技术处理技巧,评价的结果亦可进一步用于课程方案的修订和完善。其缺点是,评价者有可能局限于自己的设计思想,不了解其他人对课程设计的需要,只是评价缺乏应有的客观性。外部人员评价则正好相反,他们虽然对计划的内在精神不甚了解,但却有更为开阔的评价思路,可能取得具有客观性和令人信服的结论。因此,二者应互相借鉴,也就是说,一项完备的评价应用同时吸收内部人员和外部人员参加。5. 伪评价、准评价、真评价对这种评价类型的区分,是美国评价专家斯塔弗毕姆和辛克菲尔德在1985年出版的系统评价一书中提出的。5.1 伪评价 伪评价pseudoevaluation是指为了某种政治或商业目的,有意识地提出引导评价的问题,有选择地公布所搜集的各种课程信息中的个别部分,或有意掩盖某种部分,甚至伪造研究信息,使人们对评价对象的价值或特点产生某种扭曲的认识。斯塔弗毕姆等人列举了美国教育评价中的两类伪评价。一是斯氏等人所称的“秘密调查”。他们举例说,美国一个最大学区的一位学区视导长曾经透露,他搜集了学区内全部学校的各种有用的秘密信息,包括:学生成就资料、教师资格、教师与学生的种族资料、每个学生的平均费用、学生的社会特征、学校教师的平均任期等。这些资料显示这是一个高度种族隔离的学区。该视导长认为,他这样做是必须的,因为社区中的某些人、学校教育委员会的委员以及社区中一些特殊利益团体,很有可能会利用这些信息来损害学区或影响他的任期。为此,视导长派一位特别助理随时注意资料的更新,视导长将资料秘密地锁在他的办公桌内,以免仅此一份的宝贵资料流传出去。在这个例子中,视导长的行为就是一种秘密调查。他还有选择性地公布一些对他有利的资料,而不是完全公开事实真相。显然,这是一种伪评价。第二个例证,斯氏等人称之为“公共关系-授意的研究”,即评价研究的目的是为了获得宣传所需要的信息,帮助委托人或当事人为某一机构、计划或活动梳理优良形象。例如,某学区视导长进行一项社会调查,公开声明希望通过调查获取对学区表现的积极性报告,因为这种积极性报告是使学区内民众对学区产生信赖所必须的。这种评价报告是有偏见的,它的企图很明显,就是希望学区内民众对学区产生积极性认识,而不顾学区真是的教育质量如何。伪评价这一概念的提出,对于我们清醒地认识评价活动的实质是很有帮助的。事实上,由于各种各样的原因,我国的教育评价中也存在类似的问题,比如学校为了应付上级检查而进行的评估,不时见诸媒体的个别地方教育馆员为了让子女升学而偷改学生成绩档案等,都属于伪评价之列。应该指出的是,伪评价固然可以因不正当的目的而产生,但在一些正常的评价活动中,也有可能因某些人为的因素而导致对评价对象的误解,造成所谓的伪评价。对此,评价人员应特别谨慎。5.2 准评价 准评价是指虽然具有正当的评价目的和评价途径,但因关注的问题过于集中或狭隘而不能深入有效地探讨评价对象的价值和特点的评价。准评价主要以某些特定问题为主要关注对象,然后以适当的方法来解答这些问题。至于这些问题是否反映了评价对象的价值与特点,则处于关注的焦点之外。斯氏等人举出泰勒的目标本为评价及萨奇曼的实验定向评价作为准评价的典型例证。目标本位评价(goal-based evaluation)的特点在于评价者要描述一项计划的目标达成度。这样,评价的指标往往是根据目标设定的,从而忽略了目标以外的价值和特点问题。正是由于这一缺陷,尽管目标本位评价曾一度在评价领域独占鳌头,但终究招致批评,逐渐为其他评价模式所代替。实验定向评价的过程类似于一项实验研究,主要步骤包括问题的叙述、评价研究假设及研究问题。倡导者萨奇曼是一位研究方法专家,他坚信科学证据是一切立论的依据,评价也应当遵循科学方法的逻辑。这种评价的目的在于证明某一自变量与各因变量间的因果关系。例如,一种教学方法与学习表现或测验分数间的关系它常问的问题是,若给予某一个干扰变量,它会对特定的结果产量产生何种影响?值得特别注意的是,这类评价中,问题的来源常常是评价者、课程计划开发者以及一些杂志编辑人员,而不是一般选民、实际工作者或财务赞助者。或者可以说,这是一种理论定向的评价。因此,它往往脱离实际的教育情景,难以真是全面地反映评价对象的价值与特点。5.3 真评价 真评价是指全面反映评价对象的价值与特点的评价。它强调真正的评价工作,反对具有偏见的调查。一般而言,20世纪60年代后期以来产生的一些评价模式都属于真评价,如决策定向的评价、消费者定向的评价等。决策定向的评价强调,评价的作用在于协助改进一项计划,同时判断该计划的价值。消费者定向的评价的主要目的在于对一些具有可选择性的事物及服务的相对价值做出判断,协助纳税人及从业者对教育服务做出明智的选择。总之,上述各种分类所使用的标准不同,一种分类方式并不一定能涵盖所有的评价形式,各类型之间并非相互排斥,而是可以彼此相容的。即使是某种分类内部,也并非十分严格,而只是一种典型的概括。因此,评价分类研究的目的并非为了对号入座,而是为了便于理解和把握各类评价的特点。分类本省不是目的,它只是为人们更好地把握和选择评价方式提供了一条便捷的途径。三、课程与教学评价的基本模式1. 课程与教学评价的模式 作为一种理论研究方法,模式,意指一种小的模型或体系,它内含一定的思想取向和结构,并表现为一定的操作规则和方法、步骤。课程的评价模式是评价人员或研究者依据某种教育理念、课程思想或特定的评价目的,选取一种或几种评价途径所建立起的相对完整的评价体系,它对评价的实施作了基本的说明。因此,一种评价模式通常具有一以贯之的教育或课程理念,这是一种模式区别于其他模式的根本所在。 由于20世纪60年代的课程改革活动带动了评价的发展,评价领域日渐繁荣,各种各样的评价思想、目的、方法、途径层出不穷。但这种理论上的繁荣容易给实践中的选择带来困惑,人们日益意识到对评价的系统化以及为一些在实践中发展起来的评价方法和途径寻求理论辩护的需要。因此,在20世纪70年代开始,一些评价理论家纷纷转向对评价模式的探究,即以一种系统整体化的观点看待评价问题,并对不同的评价模式进行比较与结合,试图揭示不同模式彼此间异同的根本所在,也为开发新的评价模式提供依据。模式化的研究途径由此盛行。斯太克认为(1976),对评价模式的分类要考虑如下八个维度:形成性总结性;正规非正规;个案分立推广;结果过程;描述性判断性;预订式反应式;整体性分析性;内在的外在的。舒伯特(1986)按照评价的不同取向,把评价模式列述为:目标为本的评价、目标游离评价、自然主义的评价、批判的评价、教师作为研究者的评价、理论化的评价、回应性的评价以及从其他专业中引申出的评价模式等。麦克尼尔(1985)则根据评价是以技术为取向还是以自我实现或社会重建为取向,把评价分为共识模式和多元模式两大类。前者包括泰勒的目标为本评价及斯塔弗尔比姆的cipp评价;后者包括斯太克的外貌模式、艾斯纳的鉴赏模式以及批判性探究评价等。阿尔金等依据评价的性质与用途,把评价分为指令性模式与说明性模式。指令性模式包括一系列规则、规定,以及说明什么是好的、恰当的评价和怎样进行评价等指导性文件,这种模式通常被作为评价活动的范本,如政府有关教育督导和教育评价部门颁发的评价文件;说明性模式是关于评价的一些说明或概述性论述,是对评价活动的描述、预测和解释,这类模式是为提供经验性理论而设计的,通常是从某种角度出发对有关评价对象的一种研究、一种理论模型,因此,有些学者认为评价与研究的含义越来越接近。评价的模式化研究为人们提供了如何实施一个特定评价的一般轮廓。但是,模式不是一种问题清单,评价的实施并非亦步亦趋的遵循模式提出的步骤而不顾学校的具体情况。学校对某一评价模式的运用,应当使参与评价的有关方面都感到满意,且能对模式的一般价值取向达成共识。在这点上,国外目前的趋势是特别重视被评价者的观点和态度,如前述古巴和林肯的第四代评价就是一例。对于所采用的模式,学校应该准备予以修正,甚至在理由正当的情况下完全放弃。这样做也许会导致重新考虑采用新的模式,甚或创造新模式,但事实上,这往往是产生良好的课程计划的关键。2. 几种典型的课程与教学评价模式根据斯塔弗尔比姆1981年的统计,80年代伊始已经出现了40多种评价模式,它们大都描述或说明了如何计划和实施评价活动。最近,在原来的基础上,又开发出许多新的评价模式。下面我们选取在评价史上有重要影响且在今天的评价领域仍发挥主要作用的几种评价模式予以评介。2.1 泰勒模式 教学评价的泰勒模式也就是目标达成模式。它的运行机制是:课程或教学目标课程实施或教学教学评价课程或教学目标它是一种围绕教学目标(达成)而建构起来的教学评价模式。基本程序包括如下步骤:1、构建目的和目标;2、将目标分成较为细小的类目;3、以行为名词表达目标,包括界定和修订所使用的行为名词;4、确定能够表现目标达成程度的具体场景;5、选择和发展评价所运用的测量技术;6、搜集有关学生表现的资料;7、将集到的资料与行为目标进行比较。2.2 cipp模式该模式也称决策类型模式,由美国学者斯塔弗尔比姆(d.l.stufflebeam)于1966年提出。它事实上由四种评价组合而成:背景评价、输入评价、过程评价、成果评价。1、背景评价:它是根据对象(比如学生、家庭和社区)的需要对教学目标本身进行判断,它的一个重要任务是“考察现存的目的与重点是否与使用者的需要相一致” ,“背景评价的结果都应为调节现存的目、优先顺序所需要的变革提供坚实的基础”。它应该是周期性的。2、输入评价:是在明确了决策目标之后,对达到目标所需要的并且可以得到的条件所作的评价。它所讨论的问题有很多:目标实现的可能性、各种课程或教学方案的潜在成本、方案的优势和劣势、方案的合法性与道德性、各种人员的利用和对外界资源的需要等。3、过程评价:是针对方案计划实施情况的连续不断的检查。它所需要考虑的问题也很多,譬如:有关活动是否按照预定的计划加以实施,是否以一种有效的方式利用了现有的资源。而且,在这种过程评价中,可能会发现最初的决策是有缺陷的,因此,过程评价就为计划的修改提供了必要的指导。4、成果评价:是测量、解释和判断教育教学成果,确证人们的需要是否被满足以及被满足的程度的教学评价。它仍然是教学质量控制的一种手段,而且与泰勒模式一样,都比较重视定量的教学目标。毫无疑问,cipp模式突破了泰勒模式的框架,拓宽了教学评价的范围和内容,但课程或教学目标仍然是它的一个重要概念。2.3 差别模式差别模式是由美国学者普洛沃斯(m.provus)于1969年提出。它是一个以课程开发和管理为目的而建构起来的教学评价模式,其要旨在于比较课程表现与设计标准之间的差异,以作为改进课程与教学的依据。它主要由四个部分和五个阶段所构成。四个部分是:1、 确定课程标准;2、 确定课程表现;3、 对标准与表现进行比较;4、 确定差别是否存在。 五个阶段如下:1、 设计阶段:确定并详细叙述课程标准;2、 装置评价阶段:评价具体课程计划内的各种活动资源分配与上述设计之间是否存在差别;3、 过程评价阶段:检讨课程实施过程中的各种活动是否与标准存在差别;4、 成果评价阶段:评价课程的活动结果是否与预订标准存在差别;5、 成本效益评价阶段:从整体上评价该课程设计与其他类似设计在效益上的异同。上述5个阶段中,依据评价的结果,评价人员在每一个阶段都可做出下述决定中的一种决定:(1)进行下一阶段的工作;(2)重复原先阶段的工作,直到标准与表现间没有差别;(3)回到第一阶段的工作;(4)终止整个课程设计工作。教学评价的差别模式不仅吸收了泰勒模式的优点,而且它在目标管理的技术性上更进一步,是系统管理理论在课程与教学领域中的应用。2.4 外貌模式教学评价的外貌模式由美国教育评价专家斯太克于1967年提出。该模式继承了关于评价是确定目标达成程度的观念,并在分析、批判泰勒模式的缺点基础上提出了“先在因素” 、“实施因素” 、“结果因素”等概念,并由此建构起教学评价的外貌模式。所谓先在因素就是教学的前提条件,是指“教学之前业已存在的某种条件” 。例如:教学前学生的态度,即学生的能力倾向、已有经验、兴趣、积极性等;一般的教育目标及材料等。实施因素是指教学中学生与有关人员和事务之间的际遇。例如:师生之间、学生之间的交流,电影教材的提示,班级讨论,练习、测验的管理等。结果因素是指教学所产生的全部影响,主要包括学生从教学过程中获得的能力、成绩、态度和积极性等,还包括教学对于教师、管理人员、辅导员的影响的测定,以及资料的消耗、教学环境的效益、费用等的数据。斯太克认为,在评价过程中,应当区分描述和判断,但二者都是评价所必须的。在判断之前,先要对这三种因素进行充分的描述,这是评价的基础。在进行描述时,斯太克认为,目标模式把描述的焦点放在目标达成程度上,这大大缩小了描述的范围。评价人员应该拓展关于成就的观念,评价的途径也应该更为丰富,应发展能反应完整性、复杂性和整个计划的重要性的评价方法。斯太克提出,评价人员一方面要搜集“意图”资料(即计划的资料),另一方面要搜集“观察”资料(即实际发生的现象)。对“意图”资料,评价人员分析三类因素的逻辑关联性;对“观察”资料,评价人员分析三类因素的实证关联性。在此基础上,评价人员还要分析“观察”资料与“意图”资料相符合的程度。这样就构成斯太克所谓的“描述钜阵” 。在斯太克看来,判断是完整的评价所不可缺少的。判断由谁来做?斯太克采取了一种折中调和的方案:虽然评价人员不一定能够或者应该作为最后的判断者,但他们至少是唯一有资格客观地搜集及处理他人意见和判断的人。斯太克认为,对于学校课程方案的评价,应该能够反映一些重要的团体所持的价值观。而所谓重要团体,斯太克认为应该包括这样五类人士:社会权威人士、课程教材专家、教师、家长和学生。至于判断的方式,斯太克提出,即可采用相对比较的方式,也可采用绝对比较的方式。前者是把需评价的课程方案与其他方案比较,后者是将评价的方案与既定标准比较。但在形式上,仍要根据上述三种要素来进行判断。这样,依据标准对方案的判断即构成斯太克所谓的“判断矩阵” 。 此外,为了完整把握课程的意图,评价人员还需了解该方案的哲学主张和理论基础。 以上所述,即构成斯太克的外貌模式。 教学评价的外貌模式示意图 如图所示,斯太克的外貌模式实质上是关于课程评价的一个组织框架。其中,评价者的任务是为两个矩阵(即描述矩阵和判断矩阵)搜集资料,其中每一个矩阵又细分成先在因素、实施因素、结果因素三个方面。 斯太克的外貌模式是在泰勒评价基础上发展起来的。他对三个因素的分析提醒人们注意到影响教学结果的其他因素,拓宽了评价的视野,也使人认识到影响课程开发的先在因素,这点雨斯克瑞文的见解颇为相似。他的描述矩阵和判断矩阵使得判断建立在充分占有资料的基础上,且两种判断标准也使得评价能更清晰地判断课程计划各部分的价值。这些都是外貌模式相对于目标达成模式的优越之处。 但是,正如古巴和林肯所指出的,外貌模式仍是目标取向的一种评价途径。直到70年代,斯太克才从目标取向中解脱出来,更多地提倡自然的和非正规的评价技术,开发出评价的回应模式,试图为课程编制者提供他们实际需要的信息,而不再仅仅是提供评价者认为课程编制者需要的信息。因此,一些评价专家把外貌模式看作是从目标模式向回应模式过度的桥梁。2.5 回应模式众所周知,有些教育教学的价值是扩散的、潜伏的,是长期作用的,而这样的教育教学价值显然是不可能由即时的评价所能反应的。而这些价值正是教学评价的回应模式所关注的。该模式由美国教育评价专家斯太克与1973年提出。如果一项教学评价满足:1、牺牲某些测量上的准确性以换取对评价听取人的有用性;2、更关心方案的活动而不是方案的意图;3、更注意反应与方案有关的各方面人员的意志而不仅仅是其中一部分人的意志,那么,这种教学评价就是回应模式的教学评价。它由以下一些步骤组成:(1)评价者与一切和评价对象(譬如,课程方案)有关的人员进行接触,以获取他们对评价对象的看法;(2)根据获取的信息确定评价的范围;(3)评价者亲自对方案的实施作实地观察;(4)通过观察,评价者对方案希望达到的目标与实际取得的成果进行比较;(5)评价者对评价应该回应的问题进行理论上的修正。(6)在此基础上,评价者设计评价方案;(7)根据不同的需要,选择不同的搜集信息的方法;(8)对搜集来的信息资料进行加工处理;(9)将处理过的信息按需要回答的问题进行分类;(10)把分类评价结果写成评价报告,分发给有关人员;(11)在分类评价报告的基础上对方案做出全面的判断。重视教学为价为当事人服务意识,重视实际的活动过程和反映多种价值观对课程计划或教学计划的关照是回应模式最为显著的三个特征。回应模式被认为是教学评价模式的发展趋势。因为这种模式不再仅仅从理论出发,而是从评价结果的听取人需要出发,而且它还回答了所有其他模式希望回答的问题(包括目标的达成程度、决策和判断等)。所以,它更适合于我们这样一个多元、复杂、丰富、客观的教育教学世界的现实和处于不同地位、持有不同信念和不同观念的评价听取人的需要。回应模式的评价结果具有非常大的弹性和应变能力。四、课程与教学评价的方法实施过程中,评价方法有很多。其中,测验法、档案袋评价法和表现性评价法运用最广泛。测验法是一种比较传统但运用很广泛的评价方法。我国新课程改革强调要加强评价的发展性、关注学生的个性、积极发挥学生的主动性等,档案袋评价法和表现性评价法顺应了我国新课程改革的潮流,且又是在实践中非常有效的评价方法。1. 测验法1.1 测验法的含义测验法是课程与教学评价中运用得比较广泛且久远的一种评价方法,所谓测验就是指对一定的仪器或试题等测量工具引起的被评价者的行为样本进行测量的系统程序。测验法历史悠久,运用范围也很广泛,如我国古代的科举制就是一种很正规的测验,自20世纪以来,随着现代科学技术的高速发展,注重客观、量化的标准化测验和常模参照测验在世界范围内盛行,各国在评定学生学业成就时经常使用这种方法。 谈及测验,我们必然会联想起平常教育教学工作中的考试。需要说明的是,两者既有区分,又有一定的联系。考试是由主试者根据一定的目的要求,采取一定的方式方法,对应试者的知识、技能、品行等方面进行测评的活动。从使用的范围来讲,考试的使用范围相对较窄,它一般发生在比较正式的场合,如我们学生平时的期末考试、毕业升学考试等,考试内容也比较倾向于选取比较正规的知识、技能等的测量。而测验不仅可以运用于正式的场合,还可以运用于非正式场合的评价,如教学进程中教师用来考查学生学习情况的小测验、民意问卷测验等。另外,在评价内容上,测验不仅测量学生的知识、技能,还用于评价学生的智力、人格、个性等。也就是说,测验比考试的概念更为宽泛,测验包含了考试,在对学生进行正式的学业成绩评价时,考试与测验常常是同义的,学业成就测验就是我们常说的考试。1.2 良好测验的指标 界定一个良好的测验,至少要包含测验的信度、效度、区分度、难度等方面的指标。一般来说,一个良好的教育测验应具有较好的信度、效度、较高的区分度及适当的难度等特征。 (1)测验的信度。测验的信度主要用来度量测验的可靠性和稳定性,它是鉴定测验是否有效的必要条件。影响测验信度的因素有很多,如测验题目的多少、测验时间的长短、学生的身心状态、测验的指导语是否清晰、评分标准是否一致等等都是影响测验信度的重要因素。如在一次考试中,因为试卷中题意不清,因而学生在回答问题时出现因不明题意而出错的情况,就说明这份试卷的信度不高。(2)测验的效度。测验效度是指测验的结果是否能真正反映出测验的目标和意图。测验效度与测验目标紧密相关,一个对某个目标有效的测验,对其他目标不一定有效。如在评价学生知识掌握的情况时,客观性测验比较有效,而在评价学生的综合能力时,主观试题则更为合宜。在编制试题时,就应根据其评价的目的合理编制试题的类型,以增加测验的效度。不过一般来说,一份试题通常都包含了主观试题和客观试题两种类型,测验的目标一般也都会注重评价被评价者的知识、技能、能力等多方面。 (3)测验的难度与区分度。测验难度指的是测验试题的难易程度。测验的区分度是指测验区分学生不同水平的程度。区分度与难度有关,试题过易或过难都不能准确测验出学生的真实成绩,也就不能区分出学生的不同水平。一套试卷只有难度适中,包含难度水平不同的题型,才能使水平不同的学生在测试中合理地拉开差距,表现出不一样的水平。 (4)测验内容的代表性。一个良好的测验,其选取的测验内容也必须具有一定的代表性,太偏或过于集中于某一或某几个学习内容而忽略其他学习内容的测验都不是一个良好的测验。因此,在选取测验内容时,测验内容要达到一定的覆盖率,通过测验,应能真实反映学生的学习情况。1.3 测验试题的种类及编制原则在课程与教学领域,测验常用来对学生的学业成就进行评价,而编制测验试题则是其中重要的一环。测验试题从大的范围来分可以分为主观类试题和客观类试题两类。 (1)主观类试题的种类及编制原则。主观性试题是指应试者在解答问题时,可以在题目要求范围内自由组织答案,评分者在对试卷评价时,主要借助主观判断,不同评价者在确定给分标准时,一般不会完全一致。基于在评价时受主观性影响程度的不同,主观性试题又可以分为自由应答型试题和部分限制性试题两类。自由应答型试题包括论述题、材料分析题、作文题、实验题、计算题等题型。部分限制型试题包括简答题、填空题和改错题等题型。主观试题基于学科特点的不同因而题型的选择也有所不同。在文科课程领域,主观试题的常用题型是解释、简答和论述题、作文等,在理科课程领域,主观试题的常用题型是计算题、应用题、实验等类型。部分限制型试题既能考查学生的高层次的认知目标,也评价学生认知内容的记忆情况,尤其是简答题和填空题,因此,这部分试题在编制时应重点选取课程与教学内容中必须识记掌握的内容。另外,部分限制型试题通常又受一定的限制,答案一般是固定的,尤其是填空和改错,应只能有一个正确的答案。因此,这类题型在设计时应明确答案范围,避免模棱两可或出现一题多解的情况。自由应答性试题主要考查学生的高层次的认知目标,因此在编制这一类型的题目时,试题的编制应注重考查学生的综合应用能力,而不能把重心放在考查学生的识记、背诵上。如在文科课程的学习评价中,我们常以材料分析题的形式考查学生的综合应用能力及高层次认知目标。这类试题在编制时,既可以单纯文字叙述,也可以是图、表及漫画、插图等多种形式来呈现题目。(2)客观类试题的种类及编制原则。客观性试题是那些有固定的标准答案,评价结果不受评价者主观因素影响的试题类型,客观性试题一般包含选择题(单项选择、多项选择等)、是非判断题、匹配题等。这类试题可以评价各种层次的认知目标能力,多可以利用计算机阅卷。 选择题的结构由题干和选项两部分组成,题干一般由一个直接疑问句或不完整陈述句构成,而选项一般以a、b、c、d的形式或1、2、3、4等依次列出。选择题的编制一般应遵循如下原则:第一,每题所列的答案数目应该一致,在所供选择的答案数目上,一般为4或5个为宜。第二,正确答案在形式或内容性质上不可特别突出,以免让被评价者很容易识别出来。第三,错误答案与题干应有相当的逻辑性和似真性,起到一定的混淆评价者的作用。第四,正确答案出现的位置应随机排列,且其次数要大致相当,以避免猜测因素的影响。是非题主要用来评价学生对一些原理、概念等的理解和掌握程度,是非题由三部分构成,一是题目要求即题目指导语;二是题干,题干部分常是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 入职导入教育培训课件
- 振动筛设计研究
- 健康教育知识培训班课件
- 倪吉昌课件医院
- 伶官传序课件
- 2025生殖健康咨询师考试综合练习含完整答案详解(历年真题)
- 企业管理干部安全培训课件
- 甘肃收费后续管理办法
- 疫情公司公章管理办法
- 税务局专管员管理办法
- GB/T 27818-2011化学品皮肤吸收体外试验方法
- GB/T 22512.2-2008石油天然气工业旋转钻井设备第2部分:旋转台肩式螺纹连接的加工与测量
- GB/T 19137-2003农药低温稳定性测定方法
- 通过测试-失效测试-老化测试-三者有何区别
- 动漫人物欣赏课件
- DBJ53-T-40-2011 云南省城镇园林工程施工质量验收规程
- 让主动问好成为一种习惯(优秀主题班会)
- DB15T 2412-2021 蒙餐 蒙式牛肉丁
- ACLS-PC-SA课前自我测试试题及答案
- GB∕T 15089-2001 机动车辆及挂车分类
- OTN技术概述PPT课件
评论
0/150
提交评论