第三章 学业成就的替代性评价_第1页
第三章 学业成就的替代性评价_第2页
第三章 学业成就的替代性评价_第3页
第三章 学业成就的替代性评价_第4页
第三章 学业成就的替代性评价_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章第三章 学业成就的替代性评价学业成就的替代性评价 传统意义上的血液成就评价一般是指标准化测验评价。事实上,在学业成就的课堂教 学评价中,除了标准化测验评价外,还经常用到替代性测验评价,简称替代性评价。替代 性评价是标准化测验评价发展到一定阶段后,针对标准化测验评价的不足而兴起的,主要 有表现性评价、成长记录袋评价等,其中表现性评价在实际中运用得非常广泛 第一节 概述 一、什么是替代性评价 (一)替代性评价产生的背景(一)替代性评价产生的背景 替代性评价最初是针对传统纸笔标准化测验评价方式的不足而提出的。传统的评价方式发展到标准 化的阶段,从试题类型到测验操作都已经非常成熟,在教育领域内被广泛应用,为教育事业的发展做出了 卓越的贡献。但同时,人们也发现了传统测验和评价的许多不足:(1)传统的教育评价主要通过标准化 的考试、写论文等方式进行,内容基本局限在课本内部,从中反映出的学生的知识和技能比较单一,对学 生综合应用知识的能力、解决问题的能力、课外作业能力及批判性思维能力等则难以测量;(2)传统评 价重视对掌握知识和技能的结果的测量,却无法很好地测量和评价学生掌握知识的过程;(3)传统测验 基本上是教条式的统一答案,在很大程度上限制了学生能力的发挥,不利于培养学生的创造性;(4)传 统的测验工具本身也存在一定的缺陷,即使是在对学生掌握的知识、技能的评价中也存在一些有待改进的 地方,如做选择题,学生就可以猜测;(5)传统测验基本上只针对学生个体的知识和能力,不利于培养 学生的合作能力,甚至容易造成学生间的敌对情绪等。正是由于以上不足,人们认识到传统的标准化测验 并不能对学生的学业成就进行全面、系统的评价,而替代性评价就是在这种背景下诞生的。 (二)替代性评价的含义(二)替代性评价的含义 针对传统标准化测验评价而提出的教育评价改革中出现了多个新的评价方式的名称,如“操作性评 价”“真实性评价”“表现性评价”和“替代性评价”等。对于这些评价方式概念的内涵虽有不同的看法, 但大家普遍认为它们是构成新的评价体系的基础。本书采用“替代性评价”这一名称,意指任何不同于传 统的标准化纸笔测验的评价方法与技术。运用到课堂教学,则指所有非传统标准化纸笔测验的学生学业评 价方法。 关于替代性评价的含义,至今没有定论。本书综合有关替代性评价的研究,将其概括为以下几点: (1)替代性评价不是以单一的书面标准化试题为基础的,而是基于学生的行为表现(或操作),如表演、 展示、口头演说、让学生完成作品或任务等,通过观察、记录等方式对学生进行的评价;(2)替代性评 价不是从单一的考试背景,而是从广泛的背景(从教室到家庭到社会生活)中收集信息;(3)收集到的 信息不是单一的对标准化试题的反应信息,而是在多种智力活动如言语、数理逻辑、视觉空间、身体动作、 音乐等方面显现出来的各方面的表现信息;(4)替代性评价不仅仅注重学生学习结果的评价,更关注学 生学习过程的评价;(5)替代性评价的目的不是单纯地给学生一个评价分数或等级,而主要是为了促进 学生的学习和发展。 根据以上对替代性评价的内涵总结,本书将替代性评价定义如下:基于学生在形式和内容上都区别 于传统标准化测验的测验任务上的表现,以促进学生发展和提高为目的的评价,都可以叫作替代性评价。 本书中给了替代性评价一个非常宽泛的界定,因此只要是符合定义的,都应该算是替代性评价。 有关本章内容,这里先作几点说明。(1)替代性评价不是传统评价方式的替代品,两种类型的评价 方式各有其优缺点。(2)替代性评价的种类,目前仍没有统一的划分。就学业成就的评价来说,本书主 要介绍表现性评价和成长记录袋评价,概念图评价虽属于表现性评价思想的具体运用,但因其特殊性,本 书将单独予以介绍。(3)本书不是将课堂教学方面的替代性评价全部囊括,而是重点介绍目前已经得到 认可并被广泛应用的替代性评价方法和思路。(4)本章最后一节还特别介绍了几种评价工具,以供参考。 二、替代性评价的特点 (一)它是发展性评价(一)它是发展性评价 发展性教学评价思想是 20 世纪 80 年代以来发展起来的一种关于教学评价的理念。它是针对以分等 奖惩为目的的终结性评价的弊端而提出的,主张面向未来、以促进学生全面发展为主要宗旨的教学评价。 其理论基础是人的全面发展、多元智力理论和建构论。发展性教学评价着力于人内在动力的激发,重视评 价对象的自我完善,强调个体间的差异,主张用定性评价去统整和取代定量评价,致力于促进人的完美和 自我完善。替代性评价在上述思想上和发展性评价是一致的,因此说替代性评价本质上也是发展性评价, 后面本书将详细介绍有关情况,这里不再赘述。 (二)它是主体性评价(二)它是主体性评价 替代性评价强调自我教育,主张被评价者主动参与,使“评价”这一外因通过被评价者的自我监控 这一内因起作用,以达到个体完善和发展的目的。在这一点上,与主体性评价倡导的“主体自我评估”基 本一致。“主体自我评估”是针对传统教育评价中的“他评”而言的,它强调尊重多元价值标准,提倡被 评价者主动参与,主张自我监控,其核心为自我教育、自我发展。而这些方面也正是替代性评价所强调的, 因此,本书认为“主体性评价”是替代性评价的另一特点。 (三)它具有真实性(三)它具有真实性 “真实性评价”的原意是学生在完成现实生活中的真实或模拟的任务时会有真实的、原创性的表现, 通过对学生的这些“真实表现”进行评价,学生会逐渐取得真实的进步。课堂教学评价中的替代性评价不 可能完全设置一种真实的环境来评价学生,但评价者一般会力图模拟生活中的任务,在学生完成这些任务 时,学生的表现一般是真实或基本是真实的、原创性的表现。虽然从广义上说,任何不同于传统标准化纸 笔测验的评价方法都是替代性评价,但采用现实任务、模拟真实情境来对学生进行评价却是其发展的重要 方向,因此,从这个角度上说,替代性评价是具有真实性的。 (四)它是过程性评价(四)它是过程性评价 替代性评价区别于传统评价的一个重要特点就是不仅仅关心结果,还关注整个评价过程,而且评价 的重点之一就是过程。传统评价强调根据测量结果给学生下一个结论,而替代性评价则强调学习过程本身 的价值,通过评价学生完成整个任务的过程,促进学生解决问题的思维技能、个性品质等的发展和完善。 这与“过程性评价”关注的不仅要对学生有“终极”的关怀、又要有“现实”的关怀完全一致,所以本书 认为替代性评价也是过程性评价。 三、运用替代性评价的意义 (一)提高课堂教学的质量(一)提高课堂教学的质量 从前面的介绍中我们可以看出,与传统评价方法不同,替代性评价方法尊重学生的主体性,强调从 评价的过程中学习,调动了作为学习主体的学生的积极性,在对学生评价的同时,也可以对教师进行评价, 整个评价同时关注了教师和学生两个方面。师生两方面积极性的调动,无疑会提高课堂教学的质量。 (二)引起对教学效果看法的改变(二)引起对教学效果看法的改变 传统教学评价多是对学生作一个笼统的终结性结论,替代性评价则采取多元取向,在承认学生差异的 前提下,提供条件,允许学生发挥各自所长,评价最后反馈给学生的不仅仅是一个数字,还包括学生进步 与否、在哪一方面进步、如何进步等具体分析。更重要的是,替代性评价注重对整个学习的过程进行评价, 这不仅将使人们对学生的学习有一个全面、系统的了解,而且能够改变人们对教学效果这个单一指标的依 赖。 (三)促进对教育评价的研究(三)促进对教育评价的研究 替代性评价方法的产生是教育评价领域内的一次改革,从评价的思想到具体的形式都与传统评价大相 径庭。替代性评价自诞生以来,一直受到人们的欢迎和关注,不仅促进了对课堂教学评价的研究,也促进 了对整个教育领域内的评价研究。直到现在,对替代性评价有关问题的研究仍然方兴未艾,这次教育评价 领域内的改革所产生的影响将继续下去,并将进一步引起人们对评价的关注及兴趣。(四)促进相应教育 教学理论的研究 替代性评价产生的理论基础是一些新兴的教育教学理论,如人的全面发展理论、多元智力理论及学 习的建构论等。替代性评价的发展,也引起了人们对相应的教育教学理论的反思和研究。随着替代性评价 的继续发展,对相应的教育教学理论的研究也会进一步深入和完善。 小结小结 替代性评价是针对传统标准化测验评价的不足而提出的,凡在形式、内容或目的上区别于传统标准 化测验的评价都可以叫做替代性评价。替代性评价具有强调学生发展、着眼学生主体性、注重评价过程、 重视评价任务的真实性等特点,能够引起一系列有关课堂教学观念、理论的变化,是一种方兴未艾的重要 的课堂教学评价思想或方式。 第二节 表现性评价 一、什么是表现性评价 (一)表现性评价的含义(一)表现性评价的含义 目前,对课堂教学的表现性评价看法不一。有人认为,通过学生自己给出的问题答案和展示的作品 来判断学生所获得的知识和技能的评价是表现性评价;(李永珺等:新课程评价中的表现性评定, 载 教育发展研究,2002(12)。)也有人认为,表现性评价是指通过观察学生在完成实际任务时的表现 来评价学生已取得的发展成就的评价。(李金亏:语文学习评价研究,35 页,西北师范大学硕士学位 论文,2003。)现在,一般将斯廷金斯(RStiggins)关于表现性评价的定义视为权威定义,即“表现性评 价为测量学习者运用先前所获得的知识解决新异问题或完成特定任务能力的一系列尝试”。(李金亏: 语文学习评价研究,35 页,西北师范大学硕士学位论文,2003。) 以上定义各有不同,但从中可以看出有两个共同点:一是评价中涉及的任务是实际的,不是远离社 会真实情境的;二是学生在处理实际任务时必须运用已有的知识、技能,其表现能够反映其真实水平,不 是靠猜测得来的。这两点其实也正是表现性评价之所以产生并受到欢迎的原因。综合以上看法,本书认为 学业成就的表现性评价是通过完成一些实际的任务,诱导出学生的真实表现,以此评价学生掌握和运用知 识和能力的方法。具体来说,就是运用真实的任务或模拟的练习来引发学生真实的反应,由教师或高水平 评定者按照一定标准进行直接的观察、评判。表现性评价的形式可以有多种,主要有反应题、书面报告、 作文、演说、操作、实验、资料收集、作品展示等。 (二)表现性评价的原理(二)表现性评价的原理 面对真实或模拟的任务时,被评价者必须运用已有的知识和技能产生一定程度的创造性方案来解决 问题,即建构一种原创性反应,因此,被评价者在这一过程中的表现是真实的或接近真实的,对这一过程 的评价也就是评价被评价者真正掌握或运用知识、技能的能力,表现性评价即是运用的这一原理。在表现 性评价中,学生要完成的一般是比较复杂的现实或接近现实的任务,往往需要他们综合运用多种知识和技 能才能解决,因此解决问题时被评价者依靠猜测或答题技巧的成分较少,所以,运用表现性评价往往能够 测评被评价者实际掌握和运用知识、技能的能力。 二、表现性评价的类型和特点 (一)表现性评价的类型(一)表现性评价的类型 按照不同的标准,可以将表现性评价分为不同的类别。目前比较常见的是将表现性评价分为限制型 和扩展型两种。表 31(美R.L.Linn 内容清单; 知识与技能的鉴定;学生作品的代表性样本;所有项目的日期;使用过的评估标准(或者评分说明); 学生对所有项目的自我反省(评估型成长记录袋无此项)。 这里只是列出了成长记录袋的一般内容,具体使用时,教师可以根据需要添加一些其他的内容。 (5)确定评估标准。成长记录袋的评估是一个主观性很强的过程,因此,要保证评估的公正、一致, 评估标准的制订就是一个复杂而且非常重要的过程。但不同的成长记录袋内容不同,评估的标准也会有很 大差异,所以,下面列举出制订成长记录袋评估标准的几条原则。 评估指标必须独立。评估指标指的是能够评价所要测量的智力技能的标准。在所确定的评价目的 中,虽然对要评估的智力技能已经有很具体的描述,但对这些智力技能进行评价的指标必须是相互独立的, 尤其是对那些主要的技能。如果评估指标混乱或较差,评估就很容易出现偏差,学生也很难据此评估他们 的努力和进步。 必须有清楚、明确的描述和具体的使用说明。这里指既有对评估指标的解释,且解释必须清楚、 明确、具体、易懂。另外,对评估指标的使用要有具体的描述说明,能够使人一目了然。 让学生参与进来。可以尝试先让学生制订,然后教师修改。这样可以吸收学生对评估标准的有意 义见解,也能使学生更好地了解评分标准,评分标准也更容易为学生所接受。 要有对成长记录袋作品样本的评估标准和对成长记录袋整体评估的标准。成长记录袋的整体分数 可以由各个作品样本的分数合并而来,后面我们将详细介绍。但除了分数外,还要对成长记录袋的整体情 况有一个定性的评价,这就要求有对成长记录袋整体进行评估的标准,其标准的制订过程与作品样本的制 订过程相同。 具体制订评估标准时,还可以参考如下步骤。 列出成长记录袋所有作品样本的评估指标,这些指标要能够反映所要评估的智力技能。在过程型 成长记录袋中有反映学生进步的多次修改的作品样本,制订评估标准时要把初稿、中间稿及修改稿都考虑 进去,如表 35。 表表 3 35 5 一个教师要评价学生论文的指标一个教师要评价学生论文的指标 评价指标所测智力技能 常规要求如标点、语法、句子结构 表达情况 考查学生基础知识的掌握情况 测量语言的组织及运用 构思 修改后文章质量 自我反省 考查学生的思维创新能力 学生思维的灵活性及自我提高能力 考查元认知能力 选择评价工具或方法。成长记录袋评价主观性很强,一般选择等级评定量表、核查表或者两者的 结合比较多。在本章的第四节要介绍一些具体评价学业成就的工具和方法,教师可在运用时根据内容进行 选择。此外,教师还可以自己选择一些合适的或在原有方法基础上加以创新,设计出一些新的工具或方法。 构建一个评价量表。清楚、明确地描述每一指标上学业成就表现的范围,构成一个完整的评估标 准,也有人将其叫做量规。在这一阶段,评估标准中一些比较具体的东西必须确定下来,如,选择的评价 工具是等级评定量表,那么在评分过程中使用几个等级(3 个、5 个或 7 个)、每个等级是否要赋予分数 等事项都要明确下来,具体可以根据需要确定。如下例。(美G.D.Borich & M.L.Tombari:中小学 教育评价, 222224 页,北京,中国轻工业出版社, 2004。) 成长记录袋论文作品样本评估量表成长记录袋论文作品样本评估量表 学生姓名:_ 从中选择一个 _第一稿 _第二稿(或中间其他稿) _终稿 以下由学生填写。 1.交论文的时间: 2.简要地写一写你在论文中说了些什么。 3.你认为这篇论文最成功的地方是什么? 4.你认为这篇论文有哪些需要改进的地方? 以下由教师完成(在合适的等级上画圈)。 1.反省质量 等级 描述 5 非常清楚地说明自己论文的优点和不足,并提出十分具体的修改意见。 4 比较清楚地说明自己论文的优点和不足,并提出比较具体的修改意见。 3 明白自己论文的优点和不足,但说得不够清楚。提出了一些修改意见。 2 对自己论文优点和不足的认识比较模糊。修改的意见很少。 1 没有对自己论文进行任何反省的证据。 2.常规要求 等级 描述 5 写作常规要求完成得十分好。在拼写、标点、语法、句子结构等方面没有出现什么错误。 4 较好地符合写作常规要求。在拼写、标点、语法、句子结构等方面只出现了个别小错误。 3 基本上符合写作常规的要求。虽然在拼写、标点、语法、句子结构等方面出现了一些错 误,但不影响意义的表达。 2 在拼写、标点、语法、句子结构等方面出现了不少错误,且影响了意义的表达。 1 多数常规要求方面的错误使要表达的意义很模糊。缺乏对拼写、标点、语法、句子结构 等方面基本要求的了解。 3.表达情况 等级 描述 5 十分清楚 4 比较清楚 3 大部分比较清楚 2 努力了,但还是不清楚 1 不清楚 4.构思(只适用于第一稿) 等级 描述 5 十分清楚受众是谁。目标十分明确。有整体的论文构思。 4 考虑到了受众的问题。文章经过构思,写作目标比较清楚。 3 整个论文的构思基本清楚,受众基本明确,有写作目标但是有些模糊。 2 不清楚论文是写给谁看的。写作目标不清楚。 1 没有经过构思。 5.修改质量(只适用于修改稿和终稿) 等级 描述 5 考虑各方提出的修改意见,比上一稿有明显的进步。 4 采用了很多修改意见,比上一稿有一些进步。 3 采用了一些修改意见,比上一稿有点儿进步。 2 多数修改意见都未采纳,与上一稿相比没有什么进步。 1 没有认真修改。 评价等级总分:_平均评价等级:_ 最后还可以把教师的意见和建议装进成长记录袋。 (二)成长记录袋运用中的相关问题(二)成长记录袋运用中的相关问题 成长记录袋的内容、目的不同,其创建、使用过程也大相径庭。所以,本书只介绍运用过程中的相 关问题。 1.成长记录袋评分的合并 如果在制订的评估标准中,每个等级都赋予了一定的分值,那么按照这些评估标准,就可以得到每 份作品样本的分数,但是教师并不能得到成长记录袋中的每一类作品样本的分数。如,对于进步型成长记 录袋,作品样本可能还要包括学生的草稿和最终产品,如作文等。这样,按照评估标准,从草稿到终稿都 会有一个分数,所以教师需要将这些分数进行合并,最后每类作品样本都只有一个分数。如何将这些分数 合并,这里介绍几种方法。一种方法是计算所有分数的平均值,这种方法计算出来的草稿、中间稿、终稿 在最后评分中的权重是相等的。另一种方法是给每一稿不同的权重,其中终稿权重最大,第一稿的权重最 小。这就需要对分数的权重进行确定,怎样确定权重,权重多大,可以征询学生和家长的意见。具体计算 如下例。 用百分数来决定权重。例如,第一稿占最后分数的 20,第二稿占 30,终稿占 50。必须保证所 有的百分数加起来是 100。 用每一产品的平均分乘权重。如上例中假如论文第一稿为 15 分,第二稿为 20 分,终稿为 20 分。 第一稿:150.203 第二稿:200.306 终稿: 250.5012.5 这些分数加起来,就是这个作品样本的总分。这些方法对每一个领域的作品样本都适用。 各个作品样本的分数都出来了,就可以将这些分数作为基础,确定成长记录袋整体的分数或等级。 而成长记录袋的整体分数,同样可以参考上面用百分数赋予权重的方法,给予每类作品样本不同的权重, 按上述方法计算出整体分数。 2.要求学生不断对其成长记录作品进行评估 成长记录袋评价的一个主要目的就是提高学生的自我评估能力,并由此促进学习。在使用过程中, 除了教师要及时地对成长记录袋进行评估外,还必须确保学生能依据既定的标准评估自己的作品,这既是 保证成长记录袋评价质量的需要,也是促进学生自我评估的需要。学生可以在教师的指导下,对成长记录 袋进行整体或分项评估自己的作品,教师要力争使这些事情成为每个学生的日常工作。学生的评估可以采 取一些具体的形式,如,指导学生将自我评估意见写在一个小纸片上,记录内容主要是优点、不足、如何 改进的设想等,并要求学生自己签署上日期。最后,每一张自我评估表必须与相应的作品订在一起存放入 记录袋。 3.安排和举行成长记录袋会议 除了教师评估和学生评估外,另外一种评估成长记录袋的形式是举行成长记录袋会议。成长记录袋 会议是教师与学生之间关于学生作品的交流,这种会议不仅要评估学生的作品,还要帮助学生提高自我评 估能力。在成长记录袋会议上,学生之间、教师和学生之间可以任意地交流看法。一般让学生在会前做好 有关准备,分小组进行。会议上有人做记录,教师可以在各个小组之间进行指导,最后把记录放进成长记 录袋。成长记录袋会议对发挥成长记录袋评价的潜在功能具有十分重要的作用。教师要尽量多地举行这种 会议,争取每学期能够进行 34 次。 4.成长记录袋的管理问题 在使用过程中,教师还要考虑一些细致的管理问题。 (1)时间问题。这里说的时间问题有两个。一个是成长记录袋的使用时间问题,即成长记录袋的持 续时间为多长的问题。有人说以 1 年最好,我们认为,课堂教学的成长记录袋使用的时限应根据需要由教 师计划的范围所决定。一般来说,对低年级学生而言,短时间内成长记录袋能够提供的评价信息及发挥的 作用是比较小的;而对中年级以上的学生而言,持续时间相对可以短一些,但最少也应该保持在 6 周左右。 另外一个就是成长记录袋创建过程中的时间安排问题,要让学生明确地知道交作品样本的时间。这一方面 有助于成长记录袋的创建与教学进度的协调,另一方面还会使学生加强教学与成长记录袋之间的结合意识。 这里面要考虑周全,如作品样本的难度、与其他学科时间的冲突与否等,以免学生没有足够的时间完成作 品样本,不能按时交上去。 (2)作品样本的存放问题。成长记录袋的作品样本收集起来后,要放进一个合适的容器里,如档案 袋、文件夹、光盘等。具体选择哪种容器,教师可以根据评价目的和收集作品样本的性质以及经济条件等 情况来决定。如,教师更加关注学生同类作品的比较,那么放在光盘或软盘上就更合适一些,这样,教师 就可以在电脑上方便地进行比较。还有一个是全部学生的成长记录袋的存放问题,要将学生的成长记录袋 放在一个比较安全的地方,如柜子、箱子、柜橱等,最好编号,以便查找和统一管理。 (3)成长记录袋的查阅问题。成长记录袋一般是统一管理,这就牵涉到了查阅问题。教师及学生本 人都可以查阅,那么其他教师、学生、家长及行政管理人员是否可以查阅,这个问题同评价的目的、所涉 及的学科内容等问题,需要教师与学生共同商讨来做出决定,有必要时,也可以与行政管理人员一起商讨。 (4)怎样给学生反馈意见的问题。除了给学生的成长记录袋评判、打分、评定等级外,还应该与学 生交流一下,对哪些类型的作品需要给予更细致的反馈,哪些仅需要提供简单一些的反馈,对此进行区分 以提高评价的效率和质量。细致的反馈除了有“高级”“正确”“不完全”等外,还要告诉学生究竟如何 做可以改进他们的成长记录袋,怎样去改进某一作品,他们应该从错误中吸取怎样的教训,并保证经常而 灵活地反馈。 (5)交作品和返还意见的方式。关于作品提交方式,有的教师采取“作品篮”和“返还篮”的方式, 也就是一个适当容器,每个人可以自由地把作品放进去,但只能由特定的人员才可以打开。在规定的时间 把作业或反馈意见放进“篮子”里,由指定的管理员把作品放进记录袋里或转发给学生。另外,对迟交的 作业如何处理,缺席的学生如何交作业等,教师可以根据具体情况灵活处理。 小结小结 成长记录袋评价是一种以呈现学生的发展进步来促进教和学的评价方式,评价过程中强调自我反思 和自我教育,一般分为展示型评价、进步型评价和评估型评价三种。成长记录袋的设计是成长记录袋评价 的关键环节,一般包括确定成长记录袋的设计者、确定评价的目的、确定成长记录袋的作品样本和样本数 量、确定成长记录袋所要收集的全部内容和确定评估标准等几个步骤。另外,在成长记录袋的运用中,还 要注意成长记录袋评分的合并、要求学生不断对其成长记录作品进行评估、安排和举行成长记录袋会议及 成长记录袋的管理等问题。 第四节 其他替代性的评价工具 一、概念图 (一)含义(一)含义 概念图是一种用节点代表概念、连线表示概念间关系的图示(如图 31)。(吴晓郁:概念图及其 应用,上海教育科学研究院,参见 /worldwide/assessment/assessment02_htm。)它通常包括节点(又称结点)、 连线和连接词三个部分。节点就是置于圆圈或方框中的概念,如图中的“生产者”。连线表示两个概念之 间的意义联系,连接可以没有方向,也可以是单向或双向,位于上层的概念通常可以引出好几个分支。不 同知识领域或分支概念间的连线就是交叉连接(又称横向联系),如图 31 中的“废物”和“分解”之 间的连接。连接词是置于连线上的两个概念之间形成命题的联系词。另外,概念图还常常涉及命题和层级 结构两个概念。命题是两个概念之间通过某个连接词而形成的意义关系,如图 31 中,光合作用产生了 氧气。层级结构是概念的展现方式,通常来说,一般的、最概括的概念置于概念图的最上层,从属的概念 安排在下面。概念图概念(concepts)、命题(propositions)、交叉连接(crosslinks)和层级结构 (hierarchical frameworks)构成了概念图的四个图表特征。 图 31 概念图之实例 概念图是表示概念和概念之间相互关系的空间网络结构图,是用来组织和表征知识的工具。从学生 所列出的概念图中,教师可以清楚地看出学生对概念的掌握及对概念间关系的理解。概念图评价就是以概 念图为工具对学生掌握知识的情况进行评价的一种方法。具体地说,就是让学生用概念图将头脑中所掌握 的知识显示出来,教师通过观察概念图来测量学生掌握知识程度的评价方法。 (二)概念图评价的原理 概念图的理论基础是奥苏伯尔的学习理论。奥苏伯尔认为学习就是建立一个概念网络,学习过程就 是不断地向这个网络增添新内容。新知识能否被掌握取决于新旧知识能否达到意义的同化,即新知识能否 被纳入旧知识的网络。学习者必须深刻理解新旧知识的本质,才能正确地把新旧知识联系起来,也才真正 地掌握了新知识。 课堂教学的概念图评价就是通过让学生绘制概念图,以考查学生对学科知识及其间关系的理解、掌 握情况。实质上,在绘制概念图的过程中,不仅涉及知识的重新建构,还能够反映出学生的深层理解能力。 (三)适用范围 概念图的绘制反映的是学生头脑中所掌握知识的再现,概念图的系统、严密程度也反映了学生理解、 掌握知识本质及其间关系的程度,尤其是陈述性知识的掌握情况,但也可以在一定程度上用于评价程序性 知识的掌握情况。因此,概念图一般用来评价学生的深层理解能力、知识组织能力等。这就是说,作为一 种评价工具,概念图一般不适合用于操作技能、社会技能和个性品质的测查,概念图的适用范围是智力技 能。 (四)特点 1.评价的过程中突出了学生的学习 这是概念图评价的最大特点。诺瓦克(Novak) 研究概念图的初衷就是用来帮助学习的。在概念图 评价中,学生绘制概念图之前,头脑中的知识往往是零散的、不成体系的,并且会有理解模糊的地方,绘 制一幅概念图好比经历一次头脑风暴,学生等于在头脑中把学过的知识按照一定规则重新建构了一遍。概 念图完成后,以上的问题往往也就自动解决了。通过绘制概念图,学生清楚地了解了知识间的结构联系, 加深了对知识的理解和掌握,促进了新旧知识之间的整合。经过绘制概念图的知识,学生往往理解得准确 而深刻,经久不忘,这一点是其他评价方法难以做到的。所以说,进行概念图评价的过程也是学生学习的 过程。 2.评价过程中含有创造性的因素 在评价过程中产生原创性的反映,并不是概念图评价独有的,但在概念图评价中,教师对任务没有 结构性的要求,这给学生提供了创造的条件和环境,使得学生有机会创造性地解决问题。绘制概念图过程 中,学生为解决问题会进行多次的尝试错误直至最后达到问题的解决。在这些问题解决的头脑风暴过程中, 随着概念图的绘制,具体的解决办法会更加清晰,也往往会引发新的念头,产生意想不到的创造性成果。 另外,概念图中的交叉连接需要学习者的横向思维,也是发现和形成概念间新关系、产生新知识的重要一 环,所以说构建概念图也是一项极好的创造性工作。 3.评价过程也可以作为交流的过程 在概念图评价中,为了保证概念图的质量,教师往往会采取小组的形式,让学生集体绘制概念图, 或者让学生把各自绘制的概念图拿出来和其他学生进行交流。交流过程中,学生会不断发现自己或他人的 正确和错误,也会不断修正自己的思路和方法,最终绘制出正确的概念图。因此说,概念图就评价过程而 言也是一个交流的过程。 4.具有很强的诊断功能 学生对知识的理解常常是不完全或者有缺陷的,这些不足又是通过常规的方式难以确切诊断的,但 概念图能够准确地表达学生对概念正确的或错误的理解。因此,通过概念图,教师可以清楚地了解学生知 识上的欠缺,这种清楚、准确的诊断功能也是其他评价方法所难以达到的。 (五)概念图的设计和在评价中的运用(五)概念图的设计和在评价中的运用 1.概念图的设计 要通过概念图对学生掌握知识的情况进行测量,就必须让学生设计概念图。设计概念图的方式灵活 多样,本书认为一般分为以下五个步骤。 第一步,要选取一个学生熟悉的知识领域。概念图评价考查的是学生对知识本质的理解和掌握情况, 因此,制作概念图必须选取一个学生熟悉的知识领域,否则学生很难成功地绘制概念图。 第二步,要尽可能地列出全部概念。列出全部概念,可以使学生对概念的整个结构有个大致的了解, 也为下一步选取关键的概念奠定基础。有人认为可以把概念写在卡片上,便于移动,这对构建概念图很有 帮助。 第三步,先把含义最广、最有包容性的关键概念放在图的顶端,然后移动活动卡片,从上到下将概 念按从含义最广、最有包容性到最特殊、最具体的粗糙顺序进行排列,最后确立一个大致的概念层级分布。 在这个过程中,学生可以自由移动卡片,随时调整概念等级。确定顶端的关键概念往往会有些难度,可以 指导学生按上下顺序浏览一下概念,必要时进行更换。在这一步,还可以随时增补新的概念进去。 第四步,寻找概念图中不同概念之间的联系,用线条把概念连接起来,并用连接词语说明两个概念 之间的关系,这种说明语可视为一种陈述句,即上面所提到的命题。连接线可以是单向、双向或无方向的。 概念之间的联系可以分为同一知识领域的连接和不同知识领域的连接,后者即交叉连接。交叉连接是发现 和形成概念间新关系、产生新知识的重要环节,也是判断一个概念图好坏的重要标准之一。对同一组概念 可以画出许多不同形式的概念图,所以,概念图的画法不止一种。随着对概念之间关系理解的变化,概念 图也会发生变化。 第五步,当概念比较抽象而不易理解时,可以把说明概念的具体例子写在概念旁边。当然这一步不 是每一个概念图所必需的,可以根据需要决定取舍。 以上只是设计概念图的一般步骤,教师具体运用时可以灵活变动。 2.概念图的评分 概念图设计完成后,如何运用概念图对学生的课堂学习进行评价,就牵涉到了一个非常重要的问题, 即概念图如何评分的问题。下面先讨论一下概念图的分析记分法。(吴晓郁:概念图及其应用,上海 教育科学研究院,参见 /worldwide/assessment/assessment02_htm。) 诺瓦克和古温(Gowin)根据概念图的四个图表特征提出了概念图分析记分的四条标准:命题 (每 个有效命题记 1 分),层级(每个有效层级记 5 分),交叉连接(每个有效的、有重要意义的交叉连接记 10 分;虽然有效,但不反映命题或相关概念组之间的综合则记 2 分),例子(概念图有效的例子记 1 分) 。 克莱尔(Cleare)在研究中采用的标准与上述标准相同,只是在分数的分配上有些差别。后来华莱 士(Wallace)和明茨斯(Mintzes)的研究在上述四条标准的基础上又增加了一个标准分支,并建议 每个分支记 1 分。 马克翰姆(Markham)、明茨斯和琼斯(Jones)认为,分支的记分应根据形成分支的层级来定:第 一层级上的分支记 1 分,以后每个层级上的分支记 3 分。 由以上分析记分法可见,记分会因对概念图各组成部分的权重的看法不同而有所不同。另外,在分 析记分法中,评分者通常对概念图的有效性、精确性或各个组成部分的重要性看法不同,结果使同一概念 图的得分因评分者不同会有较大差别,最终导致概念图评分信度不是很高。我们认为,在评价具体概念或 结构化比较强的任务时,概念图比较简单、明确,分析记分法是比较适用的。但是,用它来评价开放性任 务,评分者主观性对分数影响较大,缺陷就比较明显。所以,评价概念图尤其是开放性任务的概念图时, 引用上述的标准设计的一个评分表作为评价工具,可以运用整体分析评分的方法。评分等级一般按 4(如 最完全、有效、很好)0(缺失、无效、很不好)五个等级记分,具体记分可以参考下面要介绍的等级评 定量表。在这里只列出以下几个标准及其定义供参考:(1) 命题,即概念之间建立起的有意义的联系, 可以由连线间的连接词看出;(2) 层级,即从最高层的概念是否分解出了若干有效的层级,可从概念图 直观地看出;(3)分支,即是否从最高层的概念逐步分解出了有效的下一层概念;(4)交叉连接,即不 同分支中的下一层概念之间的联系是否是正确、有效的;(5)例子,即列举的例子是否正确科学;(6) 概念化程度,即由概念图对学生的抽象概括能力做一个总体的判断。 二、等级评定量表 (一)含义(一)含义 等级评定量表,顾名思义就是将所要评价的事物或现象的特质表现分成一定的等级,每一等级分配 给相应的分数而编制成的一个量表。用在学业成就评价中,具体来说就是将要评价的学生表现分成合适的 等级,每一等级有详细的说明,需要时赋予每一等级相应的分数,将这几个部分以一定的格式组织起来编 制成一个量表,用以评价学生,这就是等级评定量表。 (二)适用范围(二)适用范围 作为一种评价工具,等级评定量表不是基于特定内容而产生的,所以没有严格的原理和思想要求, 同样对评价领域也没有特殊要求。也正因为如此,等级评定量表的用途非常广泛,可用于评价学生多方面 的学习和发展情况:既可以用于学生作品分析(如作文),也可以用于评价过程或程序(如显微镜操作), 还可以评价学生的个性品质(如态度、动机)。所以,等级评定量表广泛适用于智力技能、操作技能、社 会技能及个性品质的评价。在学业成就评价中,一般多用于传统标准化测验难以测量的知识或技能。 (三)特点(三)特点 1.准确性高 等级评定量表在结构上一般由任务(指导语)、评定量表两部分组成,主体部分是评定量表。它的 结构性很强,简单、明了,评价时的操作十分简便。所以,只要评估标准选择得比较合适,用等级评定量 表进行评价时,来自工具的误差就很小。同样原因,来自人为的误差也很小,所以说用等级评定量表进行 评价的准确性较高。 2.应用广泛 等级评定量表的另一个特点就是应用广泛。因为受评价内容的约束很小,等级评定量表可以用来评 定学生多方面的行为特征或表现,在实际运用中教师可以根据评价内容和目的灵活设计,适用范围非常广 泛。 3.使用简便 一个完善的等级评定量表为评价学生的一系列表现特征提供了一个共同的框架,在使用时一般不需 要过多考虑个别差异等,只需要在量表上画圈或作记号即可。另外,等级评定量表每一等级的分值固定, 记分简单,运算方便,操作起来非常方便,这也是等级评定量表可以大规模应用的原因。 (四)等级评定量表的类型(四)等级评定量表的类型 等级评定量表通常包含不同的水平等级(如优秀、好、一般、差)或频率等级(如总是、经常、有 时、从不),等级量表的类型也有许多,但大多都可以划归为数字型、描述型或图表型等级量表。 1.数字型等级评定量表 数字型等级量表是最简单的等级量表。量表中每个数字代表一个等级,每一个数字都给予一个固定 的言语描述;在任何一个评价的维度上,这些数字与相应的描述都是一 一对应的关系。一般是最大的数 字表示最高等级,1 表示最低等级,其他数字代表中间等级,但也可以根据需要反过来。操作时,在每一 评价维度上选取一个等级画圈或打钩即可。 数字型等级量表使用很方便。在被评价的指标不多,并且在每一评价维度上数字所代表的等级没有 歧义时,可以采用这种方法。具体见下面例子。(美R .L .Linn & N.E .Gronlund:教学中的测验 与评价, 189 页,北京,中国轻工业出版社,2003。) 例例 圈出一个适当的数字,代表在一组问题解决任务中的表现。数字的含义如下:4非常恰当而有效; 3适当而且有效;2需要改进,有点与主题脱离;1不满意(引起了混乱或跑题)。另外,也 可以用这些数字直接代表学生的得分。 (1)学生参加小组讨论的程度如何? 1 2 3 4 (2)在讨论中学生的议论在多大程度上与主题相关? 1 2 3 4 2.图表型等级评定量表 顾名思义,图表型等级评定量表就是增加了一些图表,使得量表更清晰、直观。最简单的图表型等 级评定量表就是在数字型等级量表的每个评价维度后面都增加一条水平线,在这条线上明确地列出了一系 列评价等级,需要的话还可以在相应等级处标明分数。评价者可以通过判断,选择学生在某一评价维度上 的等级,并按要求标示出来即可。图表型等级评定量表中,每一评价维度的不同评价指标可以随之变化, 但如果要记分的话,各个指标变化等级对应的分数应该是相等的。如下例。 例例 指导语:通过在每一题目下面水平线上的某一地方画圈,对学生在一组问题解决任务中的表现进行 评价。 (1)学生参加讨论的程度如何? 从不 很少 偶尔 经常 总是 (2)在讨论中学生的议论在多大程度上与主题相关? 从不 很少 偶尔 经常 总是 (3)在讨论中学生的整体表现如何? 优秀 很好 中等 一般 差 图表型等级评定量表比数字型等级评定量表更为直观、详细,在各评价维度上等级分数等争议不大、 不需要对各个等级做详细说明时都可以使用。 3.描述型等级评定量表 相对于图表型等级评定量表,描述型等级评定量表对不同评价维度上的不同等级给予了不同的简单 描述,教师同样可以根据需要将相应分数在各个等级上注明。如下例。(美R.L.Linn & N.E.Gronlund:教学中的测验与评价,190 页,北京,中国轻工业出版社, 2003。) 例例 指导语:通过在每一题目下面水平线上的某一位置上作“”标记,对学生的表现进行评价。在后 边的“其他意见”栏目中,你可以写上你的意见,用以进一步澄清你的评价。 (1)学生参与小组讨论的程度如何? 从不参与非常被动 和小组成员有同样的参与程度 比小组其他成员参与得都多(2)在讨论中 学生的议论在多大程度上与主题相关? 意见杂乱跑题 意见通常是切题的但偶尔跑题 意见一直与主题有关 其他意见: 描述型等级评定量表给出了每一等级的简单解释,可以为教师提供大量清楚、详细的反馈信息,而 且操作起来非常方便。 上面介绍的只是描述型等级评定量表的最简单的形式,在实际应用的时候,可以变换不同的形式, 如,可以把上例中的横线省去,在各个等级前面标上 1、2、3 这些数字;还可以设计成更为详细、也更为 复杂的表格,并给予一定的分数,也就是后面要谈到的量规形式。 (五)等级评定量表的制订(五)等级评定量表的制订 等级评定量表的制订大体上需要经历以下几个步骤。 第一步,先选定用来评价的内容,并详细地列出所评价内容的各种要素,这些要素要能够准确、全 面地反映教师所要测量的认知技能、个性品质等。如上例中,要测量学生在问题解决讨论中的表现,就列 出学生的参与程度及与主题的相关程度两个要素。 第二步,根据需要选择量表形式。在选择时,可以考虑各种量表的形式特点、需要和实际情况,然 后确定各个等级的分值。 第三步,确定明确的指导语。如果是数字式等级量表,在指导语中要有明确的说明。如果是图表型 或描述型等级量表,则要在这一步将各个等级的分值明确给出。 第四步,将要评价的这些要素形成问题并表达出来(如上例)。在问题下面列出所有的等级,也可 以将各个等级的分数在每个等级的相应位置标出来。如果在指导语里已清楚地说明各等级分值,在各个等 级上一般不再作标注,这样看起来也更整洁。 上面只是制订等级评定量表的一般步骤和要求,在具体的制订过程中,可以加以灵活变动:如果评 价指标较多,则可以用编号代替图表;各个评价维度上的等级排列也可以不同,可以根据需要或题目的不 同从高到低或从低到高排列。 (六)等级评定量表中的新类型(六)等级评定量表中的新类型量规量规 1.什么是量规 量规是指从评价目标出发详细规定了多个评价标准,并且在这些标准上有不同水平的评价工具,是 一种有清楚界定的结构化的定量评价工具。具体到学业成就评价,就是将衡量学生学业成就的目标分成若 干个指标,并详细描述学生在这些指标上所达到的不同水平(等级)的评价工具。量规常常被设计成表格, 因此也被称为量规表(见表 36)。 表表 3 36 6 量规表量规表(闫寒冰:面向信息化教育的 CAI 评价,载外语电化教学, 2001(4)。) 评价得分 评价指标说明 优良差 内容 电子书本的内容与学生的年龄相适应, 并与学习内容相关; 内容有趣,引人入胜。 48603647035 组织 允许学习者与故事的文本积极互动; 允许学习者控制阅读的节奏; 为学习生字、生词、发音和理解提供 多种选择。 16201215011 效果 以高质量的图片和动画激发学习者的 兴趣; 音频文本的效果清晰、发音标准、易 于理解。 16201215011 活动(加分)展示或提供不同类型的网上课外活动; 110 通过不同的在线或离线活动引发学习 者的思考。 总分 量规一般包括评价指标和评价等级两部分,这是量规的基本部分,具体运用时可以根据情况需要灵 活变动,如表 36 中各个指标上分配以不同的分值,也可以没有分数。更详细的量规表在每一等级上都 有详细的规定说明,这样的量规很常见,如表 37。 表表 3 37 7 学生研究性学习主题的评价学生研究性学习主题的评价 评价内容 协作成员 评价 教师 评价 加分 (教师审核) 合计 研究主题新颖、有创造性(2 分) 特别新颖的主题,教师决定是否再加 2 分 222 查阅资料(2 分);长时间查阅很多 资料,加 2 分 202 找到了合适的协作者(2 分);不同 班加 1 分,不同年级加 2 分 202 12 分 (其中,10 分 以上为合格; 1215 分为良 好;15 分以上 为优秀) 2.量规的特点 作为评价工具,量规与等级评定量表都是对事物或现象的等级评定,本质相同,但比较而言它又具 有如下特点。 (1)形式灵活。量规形式十分灵活:它可以根据需要作很大变动;各个等级的说明可以有也可以没 有;各等级可以有分数也可以没有分数,各个等级的分数权重可以相差很大。虽然由此带来了记分麻烦、 一次评价的被试不能太多等局限,但由于在实际应用中大规模的测量评价并不是太多,因此,许多时候量 规仍是人们的首选。所以,“形式灵活多变”仍不失为量规的一大特点和优点。 (2)更为详细。与等级评定量表相比,量规结构性要求不高,因此,往往可以制订得更加明确、详 细。一个量规表一般一次只评价一个或少数几个主题,针对性很强,如果需要,甚至可以对各个评价指标 作详尽的描述,如表 37。 (3)使用范围更广泛。由于量规制订得较为详细,相对于等级评定量表而言,学生得到的反馈信息 也就更为充足。在实际的应用中,等级量表一般更适合于终结性评价,给出最后的等级或分数;量规则给 出了某一方向上不同发展水平的详细描述,不仅可以用于终结性评价,还可以用于被评价者发展过程中的 鼓励、促进,尤其在课堂教学评价中。 以上这些特点只是相对而言的,量规和等级评定量表在本质上是相同的,都具有操作

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论