版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物学教学评价
陈秉初著
浙江师范大学生物学教育硕士讲稿
目录
第一章绪论
第一节教学评价的基本问题
一、教学评价的含义
二、教学评价相关概念辨析
第二节教学评价的发展历史
一、科举制度和考试制度的形成
二、教学测量学科的诞生
三、教学评价理论的发展
第三节教学评价的地位和作用
一、在教育科学研究中的地位
二、教育改革对教学评价的要求
三、教学评价与教师素质的提高
四、教学评价与教学质量的提高
第二章教学评价的类型与功能
第一节教学评价的类型
一、按评价的运用次序分类
二、按评价结果的参照分类
三、按评价的内容分类
四、其他分类
第二节教学评价的功能
一、促进教学判断功能
二、促进教师教学功能
三、促进学生学习功能
四、促进教学管理功能
五、促进教学改革功能
第三章教学评价的质与量
第一节教学评价的信度
一、信度的含义
二、信度的估计方法
三、信度分析
四、信度的误差
五、评价者的信度
第二节教学评价的效度
一、效度的含义
二、效度的统计方法
三、内容效度的逻辑分析
四、内容效度的量化分析
五、信度与效度的关系
第三节教学评价的难度
一、难度系数的计算
二、恰当难度与恰当难度分布
第四节评价中的区分度
一、区分度的意义
二、区分度的计算
三、区分度伪相关的校正
第四章生物学教学评价的一般原理与过程
第一节生物学教学评价的一般原则
一、教学目标控制原则
二、评价的客观性原则
三、评价的科学性原则
四、评价的可操作性原则
第二节评价目标的制定
一、教学目标是评价目标的依据
二、评价目标的制定
三、对评价目标的评价
第三节评价方案的制定
一、评价类型的确定
二、评价方案的编制
三、评价方案的反馈与修正
第四节评价方案的实施
一、信息收集与整理
二、数据的处理
三、数据的分析
四、评价初步结果的得出
第五节评价初步结果的修正
一、初步结果的反馈
二、对反馈意见的分析
三、对评价初步结果的修正
第六节评价结果的应用
一、评价结果的反馈
二、评价结果的应用
三、对评价的评价
第五章生物学教学评价中数据处理的方法
第一节评价单位的确定
一、百分制
二、归1制
三、定性描述
第二节平均数与方差
一、平均数
二、方差
三、置信区间
第三节常用的几种方法
一、成绩分布
二、Z-检验
三、综合达标度分析
第四节应答曲线
一、应答曲线的含义
二、应答曲线的绘制
三、应答曲线的分析
第五节S-P表分析
一、S-P表的含义
二、S-P表的绘制
三、S-P表的分析
第六章学生课业发展的评价
第一节对课业考评的认识
一、课业考评的作用
二、课业考评中的主要问题
三、课业考评的改革
第二节学生课业发展的内容
一、学生课业发展的主要内容
二、学生课业发展的参照体系
第三节促进学生课业发展的主要评价方法
一、客观题评价法与主观题评价法
二、表现性测验评价法
三、评定量表评价法
四、同伴评定和事件记录评价法
五、档案袋评价
六、动态评价法
七、学习能力平面图
第四节成绩评定等级制的原理和应用
一、绝对评级等级制
二、相对评价等级制
第七章学生智能发展评价
第一节认知过程基本能力发展的评价
一、观察能力发展的评价
二、记忆能力发展的评价
三、思维能力发展的评价
四、想象能力发展的评价
第二节智力发展的评价
一、智力的经典定义
二、经典智力发展的评价方法
三、智力测验史
第三节创新能力的评价
一、创新的内涵
二、创新能力的评价
第四节能力倾向发展的评价
一、学习能力倾向的测验
二、职业能力倾向的测验
第五节多元智能发展的评价
一、多元智能理论的基本观点
二、发展多元智能的生物学教学改革
三、多元智能的评价
第八章学生人格心理发展的评价
第一节人格心理评价的意义
一、人格的定义
二、人格的基本内容
三、健康人格的基本特征
第二节生物学教学与学生人格
一、人格心理评价的方法
二、生物学教学与学生人格的发展
第九章教学评价的发展趋势
第一节经典评价理论的特点
一、经典评价理论的优点
二、经典评价理论的确局限性
第二节现代评价理论的优势
第三节教学评价的发展
第一章绪论
教育与教学评价是当今世界教育科学研究的三大领域之一。在整个教育科学
体系中占有重要的地位,在教育教学实践中也有重要而广泛的应用价值。在学科
教学中教学评价同样显示出十分重要的作用。因此,在我国新一轮课程改革中,
教学评价成为改革的突破口,也是课程改革的支撑点。编制生物学教学评价教材,
其目的就是要配合新课程改革,试图通过教学过程对相关问题有进一步的认识,
并为研究配合新课程改革的生物学教学评价方法和体系打下基础,为一线教学工
作者提供较好的参考,从而提高生物学教学质量。
第一节教学评价的基本问题
一、教学评价的含义
“评价”(evaluation)一词在日常生活和工作中也经常用到,事实上,人们经
常进行着有意或无意的各种各样的评价,如评价某人为人处世,评价居住的环境,
评价人们的生活质量…,可见“评价”与我们每一个人都有着密切的关系。评价
是指衡量、判断人物和事物的价值的活动。
教学评价(instructionalevaluation)是指按照一定的价值标准和教学目标,
利用测量和非测量的种种方法,系统地收集资料,对学生的发展变化及其影响学
生发展变化的各种要素进行价值分析和判断,并为教学策略提供依据的过程。
对于教学评价的定义至今教育界仍然存在着各种界定,较为典型的解释有:
(1)格兰郎德(N.E.Gronlund)认为,教学评价是为确定学生达到教学目
标的程度,收集、分析和解释信息的(课堂)系统过程;评价包括对学生的定量
描述和定性描述两部分。
评价=测量(定量描述)+非测量(定性描述)+价值判断
(2)斯塔费尔比姆(L.D.Stufflebeam)认为,评价是一种划定、获取和提
供叙述性或判断性信息的过程。这些信息涉及教学活动的目标、设计、实施和影
响的价值及优缺点,以便指导如何决策、满足教学效能核定的需要,并增加对评
价对象的了解。因此,他认为评价最重要的意图不时为了证明,而是为了改进。
这种观点很大程度上和新课程改革中的评价观点类同。
(3)美国教育评价委员会的定义:教学评价是对某些现象的价值如优缺点
的系统调查,为教学策略提供依据的过程。
(4)泰勒(R.W.tyler)提出:评价过程在本质上是确定课程和教学大纲在实
际上实现教学目标的程度的过程。
(5)德雷斯(P.Dressed)认为,教学评价就是决定教学活动、目标及程序的
价值的过程。
(6)桥本重治认为,评价是与教学目标和价值有明确关系的概念,是按教
学目标和价值对学生的学习成果及教学计划的效果进行测量的过程。评价的重点
在于以教学目标为标准的价值判断。
(7)布卢姆(BSBloom)作了两种解释,一是针对教育评价的,评价是系
统收集证据用以确定学习者实际是否发生了某些变化,确定学生个体变化的数量
和程度。二是针对教育目标分类的,他在将教育目标分为认知、情感和动作技能
三大领域,并把认知领域的教学目标分为知识、领会、应用、分析、综合、评价
六个学习水平的基础上,把教学评价定义为:为了某个目的而进行的,对各种想
法、作品、解答、方法、资料等的价值判断的活动。评价涉及应用准则和规格来
估量各种具体事物的准确性、有效性、经济性和令人满意的程度。判断可以是定
量的,也可以是定性的;标准可以有学生决定,也可以向他们规定。
以上定义所各种描述的教学评价有以下一些共同点:
(1)强调以教学目标为标准进行价值判断。
(2)强调有多种方法(测量和非测量)系统收集资料和信息。
(3)教学评价的内容既可以是教学计划,也可以是课程,既可以是学生的
学习结果,也可以是某种教学现象、教学活动、教学目的和程序;既可以是教学
的全过程,也可以是教学活动的部分。
(4)强调为学生发展服务,为教学策略服务。
二、教学评价相关概念辨析
在教学实践中,教学评价的概念常常与教学测量、教学测验、教学考试、教
学评估等概念混淆,交叉使用,并存在一些误解。有必要澄清模糊认识,弄清他
们之间的关系。
1>教学测量和教学评价
教学测量是指针对教学效果和学生各方面的发展予以测量和描述的过程;旨
在获得有说服力的数量事实,是一种以量化为主要特征的事实判断。教学评价是
根据一定的标准,对教学事实或现象进行系统的调查,在获取足够的资料事实(定
性或定量)基础上,作出价值分析和价值判断。
两者的关系是:教学测量可以为教学评价提供价值判断的基本数据事实,是
教学评价的基础;教学评价是教学测量的延伸I,是对教学测量结果的解释和应用。
教学评价比教学测量所包含的内容更广、更综合。
2、教学评估和教学评价
教学评估(instructionalassessment)是对教学活动进行质量、价值、程度、
数值等的估测判断。就教学评估和教学评价的区别而言,前者注重与对教学活动
的质性的判断,后者注重与对教学活动的数量上的价值判断。当教学评估也进行
价值判断时,两者就是同一回事。
根据美国国家评估委员会的定义:评估是有一个组织机构对一所学校或科学
是否符合某一事先确定的质量标准作出鉴定的过程。所以教学评估往往用于实验
室评估、办学水平评估、课堂教学水平评估、认得心理评估等。
教学评价、教学评估和教学测量三个概念两两之间既有联系,又有区别,既
有交叉,又有相对独立的关系。
3、教学测验和考试
测验(test)是测量的工具,教学测验是教学测量的工具,在教学评价或教
学评估的过程中,常被用来收集资料(如有关态度、民意测验、科学成就测验),
是一个较为具体的评价活动中的部分。
第二节教学评价的发展历史
一、科举制度的形成
我国是考试的故乡,是考试制度的发源地。《孟子》中就论述学校要衡量士
子的学习成绩和文化知识水平,需要考试。西周时期就建立了''考校”与“选考”
制度,是我国考试制度的萌生阶段。西汉时期,我国的考试制度正式建立。汉代
的“察举制”就是一种承前启后的任官制,就是察其贤能,举以授官,出现了''对
策”和“射策”两种考试方法,一般以“上书言事”和“口试、答辩”相结合。
两汉时期多数官办学校设有各种考试科目,考得好的可以“补官”,考不好的“留
级”,还有“补考”。科举制度始于隋炀帝大业二年(606),终止于清光绪二十九
年(1903),在我国历史上纷纷扬扬、断断续续绵延近1300年。
我国的科举考试制度对世界教育、政治、文化,尤其是考试制度的产生过重
大的影响。法国大革命时期的资产阶级启蒙思想家伏尔泰(Voltaire)对中国的
考试制度倍加赞扬“人类精神,肯定想象不出比这样的政府更好的政府。在这个
政府里,重要的衙门彼此统属,任何事情都在那里决定,而其成员,都是先经过
几场严格的考试”。欧美各国采用的考试办法选拔官吏,是18世纪末从我国学去
的。
二、教学测量学科的诞生
欧美国家早期的学校教育的考试,大多采用口试,1720年剑桥大学才有笔
试,比我国迟了一千多年。1840年美国波士顿在全市范围的学校中进行书面考
试,对以后的教育测量科学的诞生打下了基础。欧美国家的一些学者为追求学校
成绩评定的客观性和标准化而开展的理论研究和实践探索,使得教育测量科学的
诞生。
1864年费舍(GFisher)为收集和选择有代表性的学生作业样本,将收集来
的作业按优劣分,形成《作业量表集》,作为教师以后评定学生各科成绩的参照
标准。美国学者赖斯(J.M.Rice)主张用统一的测验去考查、比较、评定各校学
生的成绩。他(1894)先后编制了算术、拼写、语言等测验,曾有数万名学生接
受过他的测验。1904年,美国心理学家桑代克(E.L.Thomdike)出版了举世闻
名的论著《精神与社会测量导论》,首次系统地介绍教育统计的方法及编辑测验
的基本原理。此书是公认的教育统计学、教育测量学、教育评价学等科学的第一
本书,它标记着以科学理论(包括统计学、教育学、心理学、哲学)为指导的教
育测量学的诞生。
桑代克的著名假说:“无论什么东西,总存在于数量之中"(Whateverexistence
atallexistsinsomeamount.),教育测验专家麦柯尔(W.A.Mecall)接着说:“任何
东西,存在于数量中的,都可以被测量"(Anythingthatexistsinamountcanbe
measured.),人们将“凡存在的东西必有数量;凡有数量的东西都可测量”作为
构成一切测验与量化评价的公理。
三、教学评价理论的发展
1.泰勒模式
在30年代,泰勒向当时美国教育测验的权威人士伍德(Wood,B.)的思想提
出挑战。伍德认为,测验只要能测量学生对事实和知识的回忆和认识就可以了。
而泰勒证明,对高级智慧技能的测量和对知识的测量不是一回事。如果高级智慧
技能是教育目标的话,这些技能必须直接加以测量。同时泰勒认为,起源于智力
测验的常模参照测验是以区分考生为目的的,它对了解学生学习的进展并无多大
价值。而与此相对应的目标参照测验,则可以判明学生学业的进展提供很多有用
的帮助。目标参照测验至今在学业成就评价中占有重要的地位。
泰勒方案评价原则规定的评价步骤包括下列几方面:
(1)确定教育方案的目标
(2)根据行为和内容对每一个目标加以定义
(3)确定应用目标的情景
(4)设计给出应用目标情景的途径
(5)设计取得记录的途径
(6)决定评价方式
(7)决定获取代表性样本的方法。
不足:如果评价以目标为中心、为依据,那么,目标的合理性又根据什么判
断;
教育活动除了达到预期目标外,还会产生各种非预期的效应效果,它们也应加
以评价。
教育乃是个人自我实现的过程,用统一的目标模式去统一一个人的自由发展,
去评价教育、教学的确结果,从根本上说是不可接受的。
2.CIPP模式
1957年到1972年称为泰勒模式的批判期,1966年斯塔弗尔比姆
(Stufflebeam,D.L.)首创CIPP模式。它由背景(context)评价、输入(input)评价、
过程(process)评价和成果(product)评价组成的综合评价模式。
他发现,学生们的需要是各种各样的,而且根本不可能找到一套共同的目标。
所以作为评价中心和依据的目标本身是需要评价的。所以方案评价的第一步应
该是背景评价,背景评价应是周期性的,其一个重要任务是“考察现存的目的
与重点是否与使用者的需要相一致”,“背景评价的结果都应为调整现存的目的
优先顺序所需的变革提供坚实的基础”。
输入评价的本质是可以理解为方案、计划可行性的评价。它涉及的问题包
括:实现目标的可能性,各种方案的潜在成本,它的优势和劣势,它的合法性
与道德性,各种人员的利用以及对外界资源的需要等等。
过程评价是对计划实施情况的不断检查,有关活动是否按预定计划加以实
施,是否以一种有效的方式利用现有资源,最初的决定在以后是否被证明有缺
陷,为修改计划提供指导。
成果评价测量、解释和判断教育的成就,证明人们的需要被满足的程度。
CIPP和泰勒模式的共同点是重视定量的目标。
3.CSE模式
美国加利福尼亚州州立大学评价研究中心(CenterforStudyofEvaluation)
的简称。自60年代后期该中心在研究、实践和推广该模式上倾注了大量的心血。
CSE包括需要评定、方案计划、形成性评价、总结性评价四个方面。
i.需要评定就是调查人们有何种需要。它的核心问题是确定教
育的目标。
ii.方案计划是对各种备择方案在达到目标方面成功的可能性
作出评价,包括对教学内容与教学目标一致性方面的分析以
及设备、资金和人员配置方面情况的研究。
iii.形成性评价的重点在于发现教育过程的成功和失败之处,在
于修正教学活动中某些偏离预期目标的地方,从而保证教育
目标的实现。
iv.总结性评价是在一个阶段之后对教育质量的全面调查和判
断
4.反对者(Adversary)模式
Owens,T.等人在70年代中叶提出的,该模式十分重视听取关于教育方案
和教育活动的争议意见,尤其是反对者的意见。其特点是充分反映了各类人员“多
元的”价值认识,是依靠人们直觉与经验的评价。
反对者模式的另一种形式是瓦尔夫(Woff)在1973年提出的司法模式。
印地安那大学用它来评价师范教育课程,效果较好。司法模式由下述四个阶段组
成:
(1)争论提出。这一阶段主要是确定需要加以评价的问题;
(2)争论选择。这一阶段主要是从需要加以评价的问题中选择最重
要的的问题。
(3)辩论准备。由两组评价人员准备对各自的观点进行辩论,并为
之收集信息;
(4)听证。听证官员听取双方的辩论。
赞成这一模式的人人为,反对者模式有助于决策者获得较为广泛的信息和
各方面的意见,有助于克服各种偏见,澄清各种潜在的冲突意见。批评者认为,
这种评价的结果有时易为辩论者的技巧所左右,而且评价费用很高。
5、应答(Responsive)模式
由斯塔克(StakeR.E.)首先提出后由他人进一步发展而形成的。他认为,
要使评价结果真正产生效用,评价人必须关心活动的决策者与实施者所关心的问
题。具体的说,应答评价通过评价者与同教育活动有关的各种人员接触,了解他
们的愿望,然后把它的实际活动进行比较,对教育决策或方案作出修改,对大多
数人的愿望作出应答,以使教育能满足各种人的需要。于泰勒模式相比,应答模
式强调了“多元现实性”和价值观念的发散性。方法上注重与科学主义相对的自
然主义方法,强调了非正式的观察、交往及描述性的定性分析方法。
6.消费者导向模式(Consumer—orientedevaluation)
由斯克里文提出,消费者可以是教育活动的参与者或受教育者。评价者必
须从消费者的观点来确认真正的成果,以及这一成果的价值。他认为,泰勒模式
在于决定目标是否达成,这在根本上是有缺陷的,从本质上来讲,价值是中立的,
因为方案编制提出者的目标可能是不道德的、不切实际的、不足以代表消费者的
需要的,或者因目标过于狭隘,以至不能预示可能的重要效应。这种评价模式和
泰勒、CIPP模式的最大区别就在于:它作出评价结论的依据不是方案制定者的
目标,而是活动参与者的意图。西方的评论家认为,这是一种更为大民主性的评
价模式。
止匕外,在西方现代教育评价的理论中还有医疗模式、费用一效果分析、教育
鉴赏和驾驭评论评价模式、元评价模式等等。教育评价注重评价结果的认同和进
一步强调“质的分析”,提出评价标准的多元化,重视对评价方案效用的分析和评价
方案本身的评价,重视评价过程多方人员的沟通、理解、互动、建构与合作。教
育评价活动已经和教育评估、教育督导、教育调查等概念联系在一起,除了课程、
教学、教师、学生进行评价外,涉及到对学校办学的各个层面,涉及到所有影响
学生发展变化的因素,为教育决策提供可靠的依据。
第三节教学评价的地位和作用
一、在教育科学研究中的地位
20世纪教育科学得到迅速发展,形成了一个庞大的教育科学体系,并形
成了研究对象相对明确、研究内容相对独立、研究方法各有特色、研究成果相对
完整的学科分支。如教育学、教学论、课程论、教育心理学、教育哲学、教育史、
比较教育学、教育经济学、教育科学研究方法、教育实验设计、教育技术学、教
育评估与监督、教育生态学等等。在这些教育学科中,教育与教学评价有着其重
要的地位,综观世界各国的教育研究情况和发展趋势,教育和教学评价已经和教
育基本理论、教育发展理论研究一起成为当今教育科学研究的三大领域。究其原
因,我们人为主要是由于教育评价是众多教育研究的有利工具,任何一种教育理
论和教育技术都需要评价来加以论证,并在评价的基础上加以修正与完善。
从美国对教育评价的研究情况,我们不难发现其在教育科学研究中的地
位。1、创办了大量有关教育评价的杂志,如《教育测量研究》、《教育测量评论》、
《评价研究》、《教育评价和政策分析》、《评价与方案计划》、《评价信息》、《教育
评价新趋势》、《教育测量理论模型研究》等,表明相关研究十分活跃。2、出版
了大量相关的学术著作和教科书,如《教育测量》、《心理测量》、《心理与教育测
量年鉴》、《教育评价》、《教育方案、计划评价》、《测验统计理论》、《教育目标分
类》等著名的书籍。3、众多的教育和教学评价、评估机构,如全国教育测量委
员会、全国教育进展评估中心、全国教育评价联合会等,其中有美国教师联合会、
美国教育研究协会、美国全国教育测量学会、美国学校行政人员协会等12个全
国性的专业组织与1981年组成的美国教育评价联合会最具有权威。这些组织每
年都要开展各种学术会议,推动教育和教学评价、评估研究工作。
1975年在瑞士日内瓦成立的国际教育评估协会(InternationalAssociation
forEducationalAssessment,IAEA)是教育评价的性组织。还有国际教育成就评价
协会(InternationalAssociationfortheEvaluationofEducationalAchievement,IEA)
等组织,帮助世界各地的教育机构通过发展和应用评价技术来提高教育质量和促
进教育机会均等。我国于1984年加入IEA。
我国有关教育评价的杂志有《中国考试》、《中国高校招生考试》、《考试、
目标、评价》、《教育评价》、《中国高等教育评估》、《教育督导与评估》、《教育统
计与测验》、《考试报》《自学考试杂志》等。促进了我国教育和教学评估、评价
的理论和实践研究。
二、教育改革对教学评价的要求
教育和教学改革是教育事业的永恒的主题,是推动教育事业进步的内动力。
在进行教育和教学改革的时候,对改革的新思想、新观念、新内容、新方法、新
技术的有效性、以及现实或潜在的价值,都要进行一系列的科学验证过程,在这
些验证过程中,教育和教学评价理论、技术、方法都会起到决定性的作用。不可
想象,一项新的教改措施不经过评价就对其作用加以肯定,并进行推广。
回顾我国教育改革的历程,可以清楚地看到,凡是经过认真而科学的评价,
并被证实是有效的改革措施的推行,对教育事业所起的推动作用就十分明显。新
近高校的面向21世纪的课程体系和教学内容改革,基础教育的“九年制义务教
育”等,都证明了这一观点。但是,我们也可以清楚的看到,在我国地方性的教
育和教学改革中,普遍存在着对教育评价的重视度不够,对教育评价缺乏相应的
规范,对教育改革措施和推广缺乏科学的论证的现象。长官意志、照搬照抄、留
于形式的现象十分严重。''上面布置的"、“别人这样做的”、“国外就是这样的”
等成为没有科学评价的有效借口。20世纪90年代,以信息技术为基础的现代教
育技术在我国教育战线的推行中,不少学校就存在这样的怪论:现代教育技术在
国外或我国其他地方被证明是很好的教学手段,我校(或我)用了现代教育技术,
因此我校的教育质量是高的,我的课是高水平的。以至于使现代教学技术的使用
与否成为衡量教育和教学质量的指标,而根本没有对具体的学校或具体的课程中
使用现代教育技术的有效性进行科学的评价,也没有和不可能根据学校、课程、
教师、学生、教学内容的具体情况,来选择合适的教学技术和方法,使得现代教
学技术流于形式,处于一种低效率的使用和推广状态之中。
我们讨论教育改革与教育评价的关系,以及经验教训,是由于我国的教育改
革轰轰烈烈,以课程体系和教学内容改革为中心的基础教育改革已经在全国推
开。在这种背景下,讨论教育评价在教育改革中的地位就显得更加有意义。例如,
就探究性学习的思想、方法的推行而言,在高清楚探究性学习的真实思想和内涵
的前提下,当我们积极地投入到这一工作中去的时候,一定要注意对探究性学习
在我校、本课程中应用的有效性。这一方面要求我们重视有教学评价的方法和手
段去检验我们所进行的探究性学习的有效性,和所得到的价值;另一方面,要求
我们开展探究性学习的评价方法和体系的科学研究,为对探究性评价提供具体的
方法。如果还是沿用现代教育技术应用时的思维模式,认为探究性学习在美国普
遍推广、在我国正在大力推广,是一件时髦的事情,所以我(们)也就这样做。
而根本没有根据具体的情况,结合本校、本课程的特色来开展工作,不仅会影响
我们的教育改革的实施,而且这种改革成功的可能性也不会大。
三、教学评价与教师素质的提高
教学评价是每一个教师的基本素质。教师要教好书,要实现帮助学生得到全
面的、最有效的发展,就必须学会教学评价,学会正确有效地评价学生的发展。
对学生的情感、能力、成就、态度、兴趣、潜能及发展的全面了解,并且作出一
系列的正确判断和决策,就需要采用教学评价的多种方法,以弥补教师非正式观
察的不足。
应该承认,现在我们的教师对教学活动的评价是在经常性地进行的,我们这
里将教学评价与教师的素质联系在一起进行讨论,是因为对教学活动进行评价的
时候,有一个科学性、有效性、可操作性的问题。如果对教学活动的评价仅仅停
留在不断地对学生的考试,不断地检查学生对某些知识记住了没有,能不能背,
不断地对学生进行分等级派名次的评价水平上,而不能对学生的发展和潜能进行
系统的调查和评价,发现学生的优点和长处,指出学生的缺点和不足,鼓励学生
的自主性学习和个性化发展,我们的评价就会显得惨白无力,教学评价就会成为
可有可无的摆设,教学评价就会失去其应有的作用。
真正确立以促进学生发展为中心,应有现代教学评价的思想方法,选择并合
理使用科学的、实事求是的、可操作性强的教学评价方法和手段,并通过对教学
活动的评价,不断地改进教学方法、调整教学策略、提高教学效果,从而促进学
生的发展。是衡量教师基本素质的一个重要指标。
四、教学评价与教学质量的提高
教学质量的高低是以学生发展的程度,以教学目标的实现来衡量的。要了解
学生的发展变化程度和教学目标的实现程度,就必须对教学活动作出相应的、科
学的评价。通过教学评价活动,找到教学活动的正是效果,发现教学中的优点和
缺陷,从而及时调整教学策略,改进教学方法和手段,找到适应教学实际的最有
效的教学方法和策略,达到提高教学质量的目的。
教学评价促进教学质量的提高,还表现在科学的、合理的教学评价活动,能
够促进学生的学习积极性,从源头上解决学生自主性学习的问题。通过教学评价,
帮助和鼓励学生的学习活动,不管对哪一个学习水平的学生,都可以通过一定评
价活动,使他们的学习得到鼓励。值得指出的是,要到达鼓励学生学习,促进学
生学习内动力的提高,科学合理的评价方法的选择,灵活多样的评价机制的建立
是十分重要的,是促进教学质量提高的前提。就评价和教学质量的关系而言,正
确的说法应该是,教学评价能够改变学生的学习状态,从而影响教学质量,因为
这种影响是双向的,可以是促进,也可以是无效和反作用的。这就是为什么新课
程改革中特别强调加强教学评价方法和机制的研究的原因,也是以往我们的教学
中在评价这个问题上反应出的主要问题所在。那种靠不断地对学生进行考试,不
断地进行分等级排名次的评价方法,对学生的全面发展是不利的,也是这次教育
改革重点要进行改进的地方。这也正是我们今天反复强调教学评价的意义之所
在。
教学评价与教学质量的关系还表现在评价对教学管理的影响上,教学评价不
仅仅是评价学生的学和教师的教,同时也应该评价教学的管理体系和管理效益。
有效的教学管理是能够促进教学质量提高的,反之亦然。因此在进行教学评价的
理论和方法研究中心,在教学评价的实际操作过程中都应该包含对教学管理的评
价或评估。从这层意思上讲,教学评价决不是面向教师和学生,而面向整个教育
界的所有活动的。
第二章教学评价的类型与功能
第一节教学评价的类型
对于教学评价的分类,国内外的教育专家们有这样和那样的分类标准和方
法,格朗兰德在《教学测量和评价》一书中指出,根据测量性质,可以将测量和
评价分为最大成就和典型行为两大类;从课堂教学中运用的角度,可分为安置性
测验(评价)、形成性测验(评价)、诊断性测验(评价)、和终结性测验(评价);
根据怎样解释测验和评价结果,可将测验和评价分为常模参照和标准参照两类。
一、按评价的运用次序分类
按评价在教学活动中运用的次序来分,常常分为形成性评价、诊断性评价、
和终结性评价3类。
1、形成性评价
形成性评价是指评价活动在教学过程中实施,相当于单元测验。其目的是
教师获得教学过程中连续性的反馈,了解学生的学习效果,学习历程、学习特点、
学习困难等信息,作为今后修改教学策略的参考;同时使学生能够及时的了解自
己的学习和同学们的学习效果,了解自己学习中的优点和存在的问题,明确今后
学习的目标,修正自己的学习方式方法。
2、诊断性评价
诊断性评价是对经常表现出学习困难的学生所做的测量和评价,它的目的
是对个人问题行为及其原因进行诊断。诊断性评价常在形成性评价之后实施,在
形成性评价后发现学生有学习困难的情形,进行个别分析和辅导,在辅导中帮助
学生改善学习方法和学习习惯,克服学习困难,并跟上班级教学进度。这种评价
有时是学习方法和习惯问题,有时可能是学习心理问题。
3、终结性评价
终结性评价是在整个教学活动结束后所进行的教学评价,相当于期末考试,
其目的是为了检验整个教学活动的效果,这种评价结果往往作为学生的学习总成
绩,并反馈给家长和相关部门。因而,终结性评价常常存在着明显的甄别和选拔
的功能。
二、按评价结果的参照分类
按对评价结果的参照点来分,有常模参照评价、标准参照评价和潜能参照评
价。
1、常模参照评价
常模参照评价是将别试水平与测验常模相比较,以评价被试在团体中的相对
地位的一种评价类型。其对学生的学习成就的评价和解释,是采用相对的观点的。
如在某次考试中,一位学生的成绩是80分,这为同学的学习效果怎样,要一整
个应试团体的水平做参照。如果全班的平均成绩是65分,那么他的学习效果是
显著的,成绩是优秀的;如果全班的平均成绩是85分,那么他的学习效果是不
显著的,成绩是较差的。以应试团体为参照的常模评价,普遍存在于现今的应试
教育当中。以学生的考试成绩分等级排名次就是基于这种评价方法之上的。
2、标准参照评价
标准参照评价是将被试的表现与既定的教学目标或行为标准进行比较,以评
价被试在多大程度上达到了教学目标,故又称为目标参照评价。学校的教学评价
主要是检验学生达到教学目标的程度,因此这种评价已经被广泛的使用,在基础
教育改革中,标准参照评价的使用程度将会进一步提高。
3、潜力参照评价
潜力参照评价是将被试的实际水平与其自身的潜在水平进行比较的评价类
型。如同班同学中一人考了65分,另一人考了80分,老师表扬了考65分的同
学,却批评了考察80分的同学,原因是老师是根据这两位学生的潜力来进行评
价的。对考65分的同学而言,其当前的实际成绩已经达到或接近该生的“最近
发展区”,而另一为同学则低于他的“最近发展区”。这种强调人性化、动态化、
个别话教学评价理念,正是当前基础教育改革中大力提倡的。因为,这种评价对
于激发学生的学习潜能,提高学习的兴趣,使每一位学生都能够得到最大程度的
发展。
三、按评价的内容分类
1、智力评价
智力评价的目的是测量被试的智力水平,并对其智力发展水平和特点作出评
价。用于智力评价的标准量具有:''斯坦福一比纳智力量表“、”韦克斯勒智力量
表”等
2、能力倾向评价
能力倾向评价是为了测量和评价个人的潜在能力,预测个人的能力发展倾
向。可分为一般能力倾向评价和特殊能力倾向评价。后着如音乐能力、技巧能力、
空间思维能力等。
3、人格评价
人格评价又称为个性评价,其目的是为了评价被试的人格心理特征,如气质、
性格、兴趣、态度、价值观、动机适应性等。其涉及的内容十分广泛而丰富多彩。
开展好人格评价,对进行“因材施教”十分有利。
四、其他分类
另外,根据被试的行为表现的性质可分为:最佳行为评价和典型行为评价;
按测量的对象可分为:个别评价和团体评价;按测量的材料可分为:文字评价和
非文字评价等等。
第二节教学评价的功能
在论述教学评价的地位是,我们实际上已经涉及到一些有关教学评价的功
能,因为要论述评价的地位就必须从其能够起的功能来入手。为了更好地明确教
学评价的功能,我们还是将其单独立出进行论述。
一、促进教学判断功能
教学评价的最基本、最原始、最现实、最普遍的功能就是对教学活动效果的
判断。它包括以客观地评定学生的学习成绩,或为了给应试者的行为表现评定一
个成绩(分数、等级)为目的的测量评定功能:利用测量和非测量的种种方法,
系统收集资料,并在此基础上对被试的某种属性、行为表现等作出判断的教学判
断功能;把事实判断的结果与外界的某种价值体系或价值标准联系在一起,对事
物或人的属性做出价值分析、价值判断和价值描述的价值判断功能;以考试等手
段,大量收集资料,经过对资料的分析,发现教学活动中存在的问题和不足,从
而找到解决问题的策略的问题诊断功能;利用精心设计的、有一定客观性和科学
性的教学测量和评价方案,选拔和区分人才的区分选拔功能等。
二、促进教师教学功能
教学评价对教师教学的促进主要表现在:口]有利于教师了解学生的起点行
为。通过教学评价,教师能够比较容易的了解学生的学习和发展的情况,有利于
教师进行因材施教,找到和使用适合学生学习和发展的教学策略。[2]有利于教
师及时了解自己的教学策略的有效性。经过一段时间的教学活动,教师有必要了
解自己的教学策略和方法的效果,判断自己教学过程中的优点和存在的问题,以
便即使改进工作,提高教学质量。[3]能够让教师对教学活动中的缺陷进行及时
补救。采用特殊的评价方法,如S-P表分析等,能够让教师容易地发现教学中的
缺陷,并进行有的放矢的补救。[4]能够确保教学目标的实现。通过综合达标度
分析等教学评价,教师能够及时了解学生学习是否达到了教学目标,如果没有达
标,还有多少差距,问题在什么地方,从而保证教学目标的有效实现。
三、促进学生学习功能
教学评价对学生学习的促进功能主要表现在:[1]通过评价激励学生的学习
动机。一次有效的测验和评价,特别是标准参照评价和学生潜力评价等类型,能
够较有效的激励各类学生的学习动机,为学生提供各自的短期学习目标,是他们
明确所要学习的内容,提供相关的学习信息反馈,是他们具有正确的学习动机。
⑵帮助学生的记忆和促进迁移。教学评价能够引导学生朝教学目标努力,因而
帮助学生的学习记忆和迁移。特别是是对较高层次的教学目标,教学评价就更能
够引导学生关注这些较复杂和深奥的学习内容,弥补教学期望的效果。[3]能够
促进学生的自我评价。元认知理论认为,学生对自己的学习上的优点和缺点的认
识程度,将很大程度上影响和决定着学生的未来学习效果。因此,让学生学会自
我评价,是他们学会正确的选择适合自己的学习策略和方法,从而起到事半功倍
的学习效果。
四、促进教学管理功能
由于教学评价的方案的设计是根据教育政策、教育法规、教育文件、教育目
标等具体的要求来制定的,因此通过教学评价就能够较好体现国家、社会和教育
管理者的意愿,使之具有控制、指挥、导向、计划、检查、考核、评估和监督的
作用。
对教师的管理。评价能够对教师资格的评定,保证教师达到基本的教学水平
要求;能够对教师的教学艺术水平进行评定,保证教师的教学能力;能够对教师
的管理水平的评定,保证教师对教学活动的有效管理;能够对教师的个性进行评
定,保证有效地激励教师的教学积极性。
对目标的管理教学评价是根据教学目标进行的,通过对现状和目标之间的差
距的判断,能有效地促进评价的对象接近教学目标,保证办学和学科教学的目标
的实现。
对教学过程的管理。利用教学评价,能够全面及时地掌握教学的各种情况,
以及这些情况的发展趋势,及时找到教学活动过程中存在的某些问题和不足,并
及时提出改进的措施,从而保证教学活动沿着正确的途径进行。
五、促进教学改革功能
通过教学评价活动,能够及时的发现教学中与国家、社会和学校的具体教学
改革的要求的差距,是教学活动的组织者和参与者能够及时改进教学策略,促进
教学改革。同时,通过教学评价能够检验当前所进行的教学改革的有效性,从而
保证我们的教学改革是科学的、符合实际的、有成效的。
第三章教学评价的质与量
第一节教学评价的信度
一、信度的含义
信度(reliability)是指测量和评价结果的稳定性程度,或者说,用同一测
量工具或评价方法反复测量和评价同一种特质对象,其多次测量和评价的结果间
的一致性程度。
测量的工具和评价的方法不同,其结果会产生差异;而同一测量工具或评
价方法,反复测量和评价同一特质对象,多次结果之间的差异是由测量工具或评
价方法的稳定性所决定的。就教学评价而言,教学测量工具和测试环境、教学评
价方法、评价者的心理(如不同的评价目的、与评价结果的相关性)和生理状况,
都会影响评价的信度,但影响最大和最直接的则是评价对象的心理和生理因素。
评价对象的心理和生理状况的多变性、不稳定性决定了教学评价的信度相对较
低,也就是说,教学评价中的评价误差较大、不可避免。
正是由于教学评价的信度较低,影响评价结果的因素多、变数大,我们研
究教学评价中的信度才有意义。信度的追求就是对这种无系统的随机误差的控
制,尽可能地减少这种误差,提高教学评价的信度。
二、信度的估计方法
1、重测信度(test-retestreliability)
重测信度是指用同一个量表(测验或评价表)对同一组被试施测两次所得
结果的一致性程度,其大小等于同一组被试在两次测验中所得分数的相关系数。
重测是建立在某测验所要测量的潜在特质在短期内不会随时间推移而改
变的基本假设之上的。因此,重测信度的用途也在于估计测验结果经过一段时间
后是否维持稳定、一致的特性,所以又称稳定系数(coefficientofstability)o
但是,教学评价中的重测信度由于人类有些潜在特质会随时间而改变,重
测信度的高低与两次测量时间的间隔长短有密切关系。一般说来,时间间隔越长,
由于被试的身心发展、遗忘、施测情景改变等因素,而容易使信度减低;时间间
隔越短,被试的练习与记忆、施测环境未发生改变等因素,使信度提高。从理论
上讲,间隔时间内被试遗忘和练习的效果基本相互抵消,这样的时间间隔是合适
的。而实际测验中,没有一个固定的标准,应视测验结果的用途、测验种类、被
试的年龄等因素而定。
重测信度适用于异质性测验,即测验包括几个不同的部分,这几个部分分
别测量几个不同的心理特质,他们之间可能并不存在相关或相关较低。重测信度
适用速度测验而不是难度测验,也就是说,测验的题量很多,而且有一定的时间
限制,被试很难记住前一次测验的内容,因此第二次测验较少受记忆的影响,第
一次测验后,不做试题分析或无法做试题分析。重测信度还适用于运动技能或实
验技能的测验,其测验成绩较少受到重复测验的影响。
2、复本信度(alternate-formsreliability,equivalentformsreliability,parallel
formsreliability)
复本信度是指在试题格式、题数、难度、指导语说明、施测要求等方面都
相当,并且都用来测验相同潜在特质或属性,但试题又是不同的测验的稳定程度。
所以复本信度又叫平行测验信度。
复本信度在教学实践中应用较多,通常有两种方式:一是在同一时间内连
续施测,另一种是间隔一段时间后施测。前者主要反映出测验内容造成的误差的
多少,也就是说可以反映两个测验是否真正的平行测验,所以这种复本信度称等
值性系数(coefficientofequivalence);后者不仅反映测验内容的抽样误差,也反
映被试本身状况的改变,这种同时兼顾试题抽样与时间影响的信度称等值稳定性
系数(coefficientofstabilityandequivalence)o复本信度不仅适用于难度测验,也
是估计速度测验信度的好方法。在作追踪研究某些因素影响测验成绩时,大多使
用复本信度分析。
3、同质性信度(homogeneityreliability)
同质性信度也叫内部一致性信度(internalconsistencyreliability),是指测
验内部所有题目间的一致性程度。题目的一致性包括所有题目测的是同一种心理
特质;所有题目得分之间都具有较高的正相关。同质性信度基于的假设是:当一
个测验具有较高的同质性信度时,说明测验主要测的是某一个心理特质,由于众
多的题目测试了同一心理特质,那么实测结果就是该特质水平的反映。
在教学评价中,当我们要使用试题库测试来检验某些因素对测试成绩的影
响时,对试题库中的题目的可信程度分析就是同质性信度分析。有分半信度分析、
库德-理查逊信度分析、克龙巴赫a系数分析等。分半信度分析就是将题目按题
号的奇偶分半、按题目的难度分半、按题目的内容分半进行测验,分析两次测验
成绩的相关性。实际应用中,由于题目一般按难度大小排列,采用奇偶分半也反
映难度分半的结果,因此常被采用。
三、标准参照测验的信度分析
标准参照测验就是通常的达标测验,其测验结果的真实性往往是教育工作
者所关心的。在教育事业得到适度的发展的前提下,标准参照测验将越来越普遍。
标准参照测验的信读分析有百分比一致性分析(percentagreement)、k—•致性系
数分析(Kappacoefficientagreement)和k2指数分析。
1、百分比一致性分析
百分比一致性(PA)分析是指同一测验或两平行测验先后两次施测,其对
被试的分类结果一致的比例。
后测
掌握未掌握合计
掌握60a5b65a+b
前测
未掌握15c20d35c+d
合计75a+c25b+d100N
a+d60+20
PA=------=-----------=0.80
N100
2、k一致性系数
k一致性系数是指实际被评定为一致的百分比与在理论上被评定为一致
的最大可能次数百分比的比率。
PA-PCa+ba+cc+db+d
K=---------Pc=(------x-------)+(-------x-------)
1-PcNNNN
式中,PA为百分比一致性指标,Pc为理论上可能被评定为一致的百分比期
望值,用上表的资料可以求得:
65753525
Pc=(——X------)+((--X--——--)=0.58
100100100100
0.80-0.58
k=-------------二0.52
1—0.58
Pc=0.58的意义是指在这个被试团体中,可能被评为一致的百分比期望值,
它在整个k系数计算公式中被当成是一种理论上的校正值,经过校正后,k一致
性系数为排除被试团体的能力分配的预期影响,而单独贡献52%的分类一致性。
四、测量的误差
测量的误差是指测验中所得测值偏离真分数的程度(SE)是反应测量结果
精确性和可靠性的一个指标,也是人们正确解释测量分数的科学依据。假如我们
计算的SE值为2.68,那么当被试的分数为70分时,就意味着其真分数有95%
的可能性落在[67.32〜72.68]的区间内。
五、评价者的信度
1、评价者信度的含义
评价者信度(scorerreliability)是指多个评分者给同一批人的答卷进行评分
的一致性程度。在教学评价中,对客观题的评分差异是很小的,但对主观题的平
分差异可能会很大。如生物学中对应用某种理论解释某种生命现象,或用某种理
论解决某些社会或生产实际中的问题等类似的问答题、论述题,由于评分者的主
观意愿、生活经验、心理或生理状态等因素的影响,评分的差异可能会很大。
2、评价者信度的计算
当平分者人数为两人时,评价者信度等于两个评分者个同一批被试的试卷所
评分数的相关系数。当评分者人数多于两人时,评价者信度可用肯德尔和谐系数
进行计算。肯德尔和谐系数(Kendallcoefficientofconcordance)是表示多列等级
变量相关程度的一种方法。让K个平分者对N个被试的试卷进行等级评定,每
个评分者都能对N份试卷排出一个等级顺序,得到K列等级顺序变量。其计算
公式为:
S
W=----------------------
—K2(N3-N
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 药物应用护理与患者教育
- 前交叉韧带损伤的长期护理
- 心灵的守护者:心理护理的使命
- 高血压中医护理的并发症预防
- 骨科护理课程目标设定
- 警院警务硕士试题及答案
- 瓦斯防突工岗位实操掌握考核试卷含答案
- 室内木装修工核心实操强化考核试卷含答案
- 碳五石油树脂装置操作工成果竞赛考核试卷含答案
- 饲料加工中控工创新实践模拟考核试卷含答案
- 钢管合作协议合同范本
- 塑料注射成型多段射胶技术资料
- 2025年公安机关人民警察基本级执法资格考试试题(初级)附答案
- 超星尔雅学习通《通识写作怎样进行学术表达(复旦大学)》章节测试答案
- 邮政寄递事业部课件
- 四川省凉山州2025年中考物理真题附同步解析
- 心理健康课题中期报告范文
- DB32T 5124.3-2025 临床护理技术规范 第3部分:成人危重症患者有创动脉血压监测
- T-FDSCX 002-2024 福鼎白茶标准
- 中外航海文化知到课后答案智慧树章节测试答案2025年春中国人民解放军海军大连舰艇学院
- 【高考真题(含答案)】安徽省新高考2024年化学试卷(含答案)
评论
0/150
提交评论