版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、生物学教学评价陈秉初著浙江师范大学生物学教育硕士讲稿目录论绪节一、一、一节一、一、一一一、一一、一、一一一、一小节一、二三第第第八第第第二三四节一二三四五节一二三四五节一二三四五节一二节二:二三四第章第第第第一一第教学评价的基本问题教学评价的含义教学评价相关概念辨析教学评价的发展历史科举制度和考试制度的形成教学测量学科的诞生教学评价理论的发展教学评价的地位和作用在教育科学研究中的地位教育改革对教学评价的要求教学评价与教师素质的提高教学评价与教学质量的提高教学评价的类型与功能教学评价的类型按评价的运用次序分类按评价结果的参照分类按评价的内容分类其他分类教学评价的功能促进教学判断功能促进教师教学功
2、能促进学生学习功能促进教学管理功能促进教学改革功能教学评价的质与量教学评价的信度信度的含义信度的估计方法信度分析信度的误差评价者的信度教学评价的效度效度的含义效度的统计方法内容效度的逻辑分析内容效度的量化分析信度与效度的关系教学评价的难度难度系数的计算恰当难度与恰当难度分布评价中的区分度一、区分度的意义二、区分度的计算三、区分度伪相关的校正第四章生物学教学评价的一股原理与过程第一节生物学教学评价的一般原则一、教学目标控制原则二、评价的客观性原则三、评价的科学性原则四、评价的可操作性原则第二节评价目标的制定一、教学目标是评价目标的依据二、评价目标的制定三、对评价目标的评价第三节评价方案的制定一、
3、评价类型的确定二、评价方案的编制三、评价方案的反馈与修正第四节评价方案的实施一、信息收集与整理二、数据的处理三、数据的分析四、评价初步结果的得出第五节评价初步结果的修正1、 初步结果的反馈2、 对反馈意见的分析三、对评价初步结果的修正第六节评价结果的应用一、评价结果的反馈二、评价结果的应用三、对评价的评价第五章生物学教学评价中数据处理的方法第一节评价单位的确定一、百分制二、归1制三、定性描述第二节平均数与方差1、 平均数2、 方差三、置信区间第三节常用的几种方法1、 成绩分布2、 Z-检验三、综合达标度分析第四节应答曲线一、应答曲线的含义二、应答曲线的绘制三、应答曲线的分析第五节S-P表分析一
4、、S-P表的含义二、S-P表的绘制三、S-P表的分析第六章学生课业发展的评价第一节对课业考评的认识一、课业考评的作用二、课业考评中的主要问题三、课业考评的改革第二节学生课业发展的内容一、学生课业发展的主要内容二、学生课业发展的参照体系第三节促进学生课业发展的主要评价方法一、客观题评价法与主观题评价法二、表现性测验评价法三、评定量表评价法四、同伴评定和事件记录评价法五、档案袋评价六、动态评价法七、学习能力平面图第四节成绩评定等级制的原理和应用一、绝对评级等级制二、相对评价等级制第七章学生智能发展评价第一节认知过程基本能力发展的评价一、观察能力发展的评价二、记忆能力发展的评价三、思维能力发展的评价
5、四、想象能力发展的评价第二节智力发展的评价一、智力的经典定义二、经典智力发展的评价方法三、智力测验史第三节创新能力的评价一、创新的内涵二、创新能力的评价第四节能力倾向发展的评价一、学习能力倾向的测验二、职业能力倾向的测验第五节多元智能发展的评价一、多元智能理论的基本观点二、发展多元智能的生物学教学改革三、多元智能的评价第八章学生人格心理发展的评价第一节人格心理评价的意义一、人格的定义二、人格的基本内容三、健康人格的基本特征第二节生物学教学与学生人格一、人格心理评价的方法二、生物学教学与学生人格的发展第九章教学评价的发展趋势第一节经典评价理论的特点1、 经典评价理论的优点2、 经典评价理论的确局
6、限性第二节现代评价理论的优势第三节教学评价的发展第一章绪论教育与教学评价是当今世界教育科学研究的三大领域之一。在整个教育科学体系中占有重要的地位,在教育教学实践中也有重要而广泛的应用价值。在学科教学中教学评价同样显示出十分重要的作用。因此,在我国新一轮课程改革中,教学评价成为改革的突破口,也是课程改革的支撑点。编制生物学教学评价教材,其目的就是要配合新课程改革,试图通过教学过程对相关问题有进一步的认识,并为研究配合新课程改革的生物学教学评价方法和体系打下基础,为一线教学工作者提供较好的参考,从而提高生物学教学质量。第一节教学评价的基本问题一、教学评价的含义“评价”(evaluation)一词在
7、日常生活和工作中也经常用到,事实上,人们经常进行着有意或无意的各种各样的评价,如评价某人为人处世,评价居住的环境,评价人们的生活质量,可见“评价”与我们每一个人都有着密切的关系。评价是指衡量、判断人物和事物的价值的活动。教学评价(instructionalevaluation)是指按照一定的价值标准和教学目标,利用测量和非测量的种种方法,系统地收集资料,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和判断,并为教学策略提供依据的过程。对于教学评价的定义至今教育界仍然存在着各种界定,较为典型的解释有:(1)格兰郎德(N.E.Gronlund)认为,教学评价是为确定学生达到教学目标的程
8、度,收集、分析和解释信息的(课堂)系统过程;评价包括对学生的定量描述和定性描述两部分。评价=测量(定量描述)+非测量(定性描述)+价值判断(2)斯塔费尔比姆(L.D.Stufflebeam)认为,评价是一种划定、获取和提供叙述性或判断性信息的过程。这些信息涉及教学活动的目标、设计、实施和影响的价值及优缺点,以便指导如何决策、满足教学效能核定的需要,并增加对评价对象的了解。因此,他认为评价最重要的意图不时为了证明,而是为了改进。这种观点很大程度上和新课程改革中的评价观点类同。(3)美国教育评价委员会的定义:教学评价是对某些现象的价值如优缺点的系统调查,为教学策略提供依据的过程。(4)泰勒(R.W
9、.tyler)提出:评价过程在本质上是确定课程和教学大纲在实际上实现教学目标的程度的过程。(5)德雷斯(P.Dresse必为,教学评价就是决定教学活动、目标及程序的价值的过程。(6)桥本重治认为,评价是与教学目标和价值有明确关系的概念,是按教学目标和价值对学生的学习成果及教学计划的效果进行测量的过程。评价的重点在于以教学目标为标准的价值判断。(7)布卢姆(B.S.Bloom)作了两种解释,一是针对教育评价的,评价是系统收集证据用以确定学习者实际是否发生了某些变化,确定学生个体变化的数量和程度。二是针对教育目标分类的,他在将教育目标分为认知、情感和动作技能三大领域,并把认知领域的教学目标分为知识
10、、领会、应用、分析、综合、评价六个学习水平的基础上,把教学评价定义为:为了某个目的而进行的,对各种想法、作品、解答、方法、资料等的价值判断的活动。评价涉及应用准则和规格来估量各种具体事物的准确性、有效性、经济性和令人满意的程度。判断可以是定量的,也可以是定性的;标准可以有学生决定,也可以向他们规定。以上定义所各种描述的教学评价有以下一些共同点:(1)强调以教学目标为标准进行价值判断。(2)强调有多种方法(测量和非测量)系统收集资料和信息。(3)教学评价的内容既可以是教学计划,也可以是课程,既可以是学生的学习结果,也可以是某种教学现象、教学活动、教学目的和程序;既可以是教学的全过程,也可以是教学
11、活动的部分。(4)强调为学生发展服务,为教学策略服务。二、教学评价相关概念辨析在教学实践中,教学评价的概念常常与教学测量、教学测验、教学考试、教学评估等概念混淆,交叉使用,并存在一些误解。有必要澄清模糊认识,弄清他们之间的关系。1、教学测量和教学评价教学测量是指针对教学效果和学生各方面的发展予以测量和描述的过程;旨在获得有说服力的数量事实,是一种以量化为主要特征的事实判断。教学评价是根据一定的标准,对教学事实或现象进行系统的调查,在获取足够的资料事实(定性或定量)基础上,作出价值分析和价值判断。两者的关系是:教学测量可以为教学评价提供价值判断的基本数据事实,是教学评价的基础;教学评价是教学测量
12、的延伸,是对教学测量结果的解释和应用。教学评价比教学测量所包含的内容更广、更综合。2、教学评估和教学评价教学评估(instructionalassessment是对教学活动进行质量、价值、程度、数值等的估测判断。就教学评估和教学评价的区别而言,前者注重与对教学活动的质性的判断,后者注重与对教学活动的数量上的价值判断。当教学评估也进行价值判断时,两者就是同一回事。根据美国国家评估委员会的定义:评估是有一个组织机构对一所学校或科学是否符合某一事先确定的质量标准作出鉴定的过程。所以教学评估往往用于实验室评估、办学水平评估、课堂教学水平评估、认得心理评估等。教学评价、教学评估和教学测量三个概念两两之间
13、既有联系,又有区别,既有交叉,又有相对独立的关系。3、教学测验和考试测验(test)是测量的工具,教学测验是教学测量的工具,在教学评价或教学评估的过程中,常被用来收集资料(如有关态度、民意测验、科学成就测验),是一个较为具体的评价活动中的部分。第二节教学评价的发展历史科举制度的形成我国是考试的故乡,是考试制度的发源地。孟子中就论述学校要衡量土子的学习成绩和文化知识水平,需要考试。西周时期就建立了“考校”与“选考”制度,是我国考试制度的萌生阶段。西汉时期,我国的考试制度正式建立。汉代的“察举制”就是一种承前启后的任官制,就是察其贤能,举以授官,出现了“对策”和“射策”两种考试方法,一般以“上书言
14、事”和“口试、答辩”相结合。两汉时期多数官办学校设有各种考试科目,考得好的可以“补官”,考不好的“留级”,还有“补考”。科举制度始于隋炀帝大业二年(606),终止于清光绪二十九年(1903),在我国历史上纷纷扬扬、断断续续绵延近1300年。我国的科举考试制度对世界教育、政治、文化,尤其是考试制度的产生过重大的影响。法国大革命时期的资产阶级启蒙思想家伏尔泰(Voltaire)对中国的考试制度倍加赞扬“人类精神,肯定想象不出比这样的政府更好的政府。在这个政府里,重要的衙门彼此统属,任何事情都在那里决定,而其成员,都是先经过几场严格的考试”。欧美各国采用的考试办法选拔官吏,是18世纪末从我国学去的。
15、二、教学测量学科的诞生欧美国家早期的学校教育的考试,大多采用口试,1720年剑桥大学才有笔试,比我国迟了一千多年。1840年美国波士顿在全市范围的学校中进行书面考试,对以后的教育测量科学的诞生打下了基础。欧美国家的一些学者为追求学校成绩评定的客观性和标准化而开展的理论研究和实践探索,使得教育测量科学的诞生。1864年费舍(G.Fisher)为收集和选择有代表性的学生作业样本,将收集来的作业按优劣分,形成作业量表集,作为教师以后评定学生各科成绩的参照标准。美国学者赖斯(J.M.Rice)主张用统一的测验去考查、比较、评定各校学生的成绩。他(1894)先后编制了算术、拼写、语言等测验,曾有数万名学
16、生接受过他的测验。1904年,美国心理学家桑代克(E.L.Thorndike)出版了举世闻名的论著精神与社会测量导论,首次系统地介绍教育统计的方法及编辑测验的基本原理。此书是公认的教育统计学、教育测量学、教育评价学等科学的第一本书,它标记着以科学理论(包括统计学、教育学、心理学、哲学)为指导的教育测量学的诞生。桑代克的著名假说:“无论什么东西,总存在于数量之中"(Whateverexistenceatallexistsinsomeamount),教育测验专家麦柯尔(W.A.Mecall)接着说:“任何东西,存在于数量中的,都可以被测量"(Anythingthatexists
17、inamountcanbemeasured),人们将“凡存在的东西必有数量;凡有数量的东西都可测量”作为构成一切测验与量化评价的公理。三、教学评价理论的发展1.泰勒模式在30年代,泰勒向当时美国教育测验的权威人士伍德(Wood,B.)的思想提出挑战。伍德认为,测验只要能测量学生对事实和知识的回忆和认识就可以了。而泰勒证明,对高级智慧技能的测量和对知识的测量不是一回事。如果高级智慧技能是教育目标的话,这些技能必须直接加以测量。同时泰勒认为,起源于智力测验的常模参照测验是以区分考生为目的的,它对了解学生学习的进展并无多大价值。而与此相对应的目标参照测验,则可以判明学生学业的进展提供很多有用的帮助。
18、目标参照测验至今在学业成就评价中占有重要的地位。泰勒方案评价原则规定的评价步骤包括下列几方面:(1)确定教育方案的目标(2)根据行为和内容对每一个目标加以定义(3)确定应用目标的情景(4)设计给出应用目标情景的途径(5)设计取得记录的途径(6)决定评价方式(7)决定获取代表性样本的方法。不足:如果评价以目标为中心、为依据,那么,目标的合理性又根据什么判断;教育活动除了达到预期目标外,还会产生各种非预期的效应效果,它们也应加以评价。教育乃是个人自我实现的过程,用统一的目标模式去统一一个人的自由发展,去评价教育、教学的确结果,从根本上说是不可接受的。2 .CIPP模式1957年到1972年称为泰勒
19、模式的批判期,1966年斯塔弗尔比姆(Stufflebeam,D.L.)首创CIPP模式。它由背景(context)评价、输入(input)评价、过程(process评价和成果(product)评价组成的综合评价模式。他发现,学生们的需要是各种各样的,而且根本不可能找到一套共同的目标。所以作为评价中心和依据的目标本身是需要评价的。所以方案评价的第一步应该是背景评价,背景评价应是周期性的,具一个重要任务是“考察现存的目的与重点是否与使用者的需要相一致”,“背景评价的结果都应为调整现存的目的优先顺序所需的变革提供坚实的基础”。输入评价的本质是可以理解为方案、计划可行性的评价。它涉及的问题包括:实现
20、目标的可能性,各种方案的潜在成本,它的优势和劣势,它的合法性与道德性,各种人员的利用以及对外界资源的需要等等。过程评价是对计划实施情况的不断检查,有关活动是否按预定计划加以实施,是否以一种有效的方式利用现有资源,最初的决定在以后是否被证明有缺陷,为修改计划提供指导。成果评价测量、解释和判断教育的成就,证明人们的需要被满足的程度。CIPP和泰勒模式的共同点是重视定量的目标。3 .CSE模式美国加利福尼亚州州立大学评价研究中心(CenterforStudyofEvaluation)的简称。自60年代后期该中心在研究、实践和推广该模式上倾注了大量的心血。CSE包括需要评定、方案计划、形成性评价、总结
21、性评价四个方面。i. 需要评定就是调查人们有何种需要。它的核心问题是确定教育的目标。ii. 方案计划是对各种备择方案在达到目标方面成功的可能性作出评价,包括对教学内容与教学目标一致性方面的分析以及设备、资金和人员配置方面情况的研究。iii. 形成性评价的重点在于发现教育过程的成功和失败之处,在于修正教学活动中某些偏离预期目标的地方,从而保证教育目标的实现。iv. 总结性评价是在一个阶段之后对教育质量的全面调查和判断v. 反对者(Adversary)模式Owens,T等人在70年代中叶提出的,该模式十分重视听取关于教育方案和教育活动的争议意见,尤其是反对者的意见。其特点是充分反映了各类人员“多元
22、的”价值认识,是依靠人们直觉与经验的评价。反对者模式的另一种形式是瓦尔夫(Woff)在1973年提出的司法模式。印地安那大学用它来评价师范教育课程,效果较好。司法模式由下述四个阶段组成:(1)争论提出。这一阶段主要是确定需要加以评价的问题;(2)争论选择。这一阶段主要是从需要加以评价的问题中选择最重要的的问题。(3)辩论准备。由两组评价人员准备对各自的观点进行辩论,并为之收集信息;(4)听证。听证官员听取双方的辩论。赞成这一模式的人人为,反对者模式有助于决策者获得较为广泛的信息和各方面的意见,有助于克服各种偏见,澄清各种潜在的冲突意见。批评者认为,这种评价的结果有时易为辩论者的技巧所左右,而且
23、评价费用很高。5、应答(ResponsivR模式由斯塔克(Stake,R.E)首先提出后由他人进一步发展而形成的。他认为,要使评价结果真正产生效用,评价人必须关心活动的决策者与实施者所关心的问题。具体的说,应答评价通过评价者与同教育活动有关的各种人员接触,了解他们的愿望,然后把它的实际活动进行比较,对教育决策或方案作出修改,对大多数人的愿望作出应答,以使教育能满足各种人的需要。于泰勒模式相比,应答模式强调了“多元现实性”和价值观念的发散性。方法上注重与科学主义相对的自然主义方法,强调了非正式的观察、交往及描述性的定性分析方法。6.消费者导向模式(Consumerorientedevaluati
24、on)由斯克里文提出,消费者可以是教育活动的参与者或受教育者。评价者必须从消费者的观点来确认真正的成果,以及这一成果的价值。他认为,泰勒模式在于决定目标是否达成,这在根本上是有缺陷的,从本质上来讲,价值是中立的,因为方案编制提出者的目标可能是不道德的、不切实际的、不足以代表消费者的需要的,或者因目标过于狭隘,以至不能预示可能的重要效应。这种评价模式和泰勒、CIPP模式的最大区别就在于:它作出评价结论的依据不是方案制定者的目标,而是活动参与者的意图。西方的评论家认为,这是一种更为大民主性的评价模式。止匕外,在西方现代教育评价的理论中还有医疗模式、费用一效果分析、教育鉴赏和驾驭评论评价模式、元评价
25、模式等等。教育评价注重评价结果的认同和进一步强调“质的分析”,提出评价标准的多元化,重视对评价方案效用的分析和评价方案本身的评价,重视评价过程多方人员的沟通、理解、互动、建构与合作。教育评价活动已经和教育评估、教育督导、教育调查等概念联系在一起,除了课程、教学、教师、学生进行评价外,涉及到对学校办学的各个层面,涉及到所有影响学生发展变化的因素,为教育决策提供可靠的依据。第三节教学评价的地位和作用一、在教育科学研究中的地位20世纪教育科学得到迅速发展,形成了一个庞大的教育科学体系,并形成了研究对象相对明确、研究内容相对独立、研究方法各有特色、研究成果相对完整的学科分支。如教育学、教学论、课程论、
26、教育心理学、教育哲学、教育史、比较教育学、教育经济学、教育科学研究方法、教育实验设计、教育技术学、教育评估与监督、教育生态学等等。在这些教育学科中,教育与教学评价有着其重要的地位,综观世界各国的教育研究情况和发展趋势,教育和教学评价已经和教育基本理论、教育发展理论研究一起成为当今教育科学研究的三大领域。究其原因,我们人为主要是由于教育评价是众多教育研究的有利工具,任何一种教育理论和教育技术都需要评价来加以论证,并在评价的基础上加以修正与完善。从美国对教育评价的研究情况,我们不难发现其在教育科学研究中的地位。1、创办了大量有关教育评价的杂志,如教育测量研究、教育测量评论、评价研究、教育评价和政策
27、分析、评价与方案计划、评价信息、教育评价新趋势、教育测量理论模型研究等,表明相关研究十分活跃。2、出版了大量相关的学术著作和教科书,如教育测量、心理测量、心理与教育测量年鉴、教育评价、教育方案、计划评价、测验统计理论、教育目标分类等著名的书籍。3、众多的教育和教学评价、评估机构,如全国教育测量委员会、全国教育进展评估中心、全国教育评价联合会等,其中有美国教师联合会、美国教育研究协会、美国全国教育测量学会、美国学校行政人员协会等12个全国性的专业组织与1981年组成的美国教育评价联合会最具有权威。这些组织每年都要开展各种学术会议,推动教育和教学评价、评估研究工作。1975年在瑞士日内瓦成立的国际
28、教育评估协会(InternationalAssociationforEducationalAssessment,IAEA)是教育评价的性组织。还有国际教育成就评价协会(InternationalAssociationfortheEvaluationofEducationalAchievement,IEA)等组织,帮助世界各地的教育机构通过发展和应用评价技术来提高教育质量和促进教育机会均等。我国于1984年加入IEA。我国有关教育评价的杂志有中国考试、中国高校招生考试、考试、目标、评价、教育评价、中国高等教育评估、教育督导与评估、教育统计与测验、考试报自学考试杂志等。促进了我国教育和教学评估、评
29、价的理论和实践研究。二、教育改革对教学评价的要求教育和教学改革是教育事业的永恒的主题,是推动教育事业进步的内动力。在进行教育和教学改革的时候,对改革的新思想、新观念、新内容、新方法、新技术的有效性、以及现实或潜在的价值,都要进行一系列的科学验证过程,在这些验证过程中,教育和教学评价理论、技术、方法都会起到决定性的作用。不可想象,一项新的教改措施不经过评价就对其作用加以肯定,并进行推广。回顾我国教育改革的历程,可以清楚地看到,凡是经过认真而科学的评价,并被证实是有效的改革措施的推行,对教育事业所起的推动作用就十分明显。新近高校的面向21世纪的课程体系和教学内容改革,基础教育的“九年制义务教育”等
30、,都证明了这一观点。但是,我们也可以清楚的看到,在我国地方性的教育和教学改革中,普遍存在着对教育评价的重视度不够,对教育评价缺乏相应的规范,对教育改革措施和推广缺乏科学的论证的现象。长官意志、照搬照抄、留于形式的现象十分严重。“上面布置的"、“别人这样做的”、“国外就是这样的”等成为没有科学评价的有效借口。20世纪90年代,以信息技术为基础的现代教育技术在我国教育战线的推行中,不少学校就存在这样的怪论:现代教育技术在国外或我国其他地方被证明是很好的教学手段,我校(或我)用了现代教育技术,因此我校的教育质量是高的,我的课是高水平的。以至于使现代教学技术的使用与否成为衡量教育和教学质量的
31、指标,而根本没有对具体的学校或具体的课程中使用现代教育技术的有效性进行科学的评价,也没有和不可能根据学校、课程、教师、学生、教学内容的具体情况,来选择合适的教学技术和方法,使得现代教学技术流于形式,处于一种低效率的使用和推广状态之中。我们讨论教育改革与教育评价的关系,以及经验教训,是由于我国的教育改革轰轰烈烈,以课程体系和教学内容改革为中心的基础教育改革已经在全国推开。在这种背景下,讨论教育评价在教育改革中的地位就显得更加有意义。例如,就探究性学习的思想、方法的推行而言,在高清楚探究性学习的真实思想和内涵的前提下,当我们积极地投入到这一工作中去的时候,一定要注意对探究性学习在我校、本课程中应用
32、的有效性。这一方面要求我们重视有教学评价的方法和手段去检验我们所进行的探究性学习的有效性,和所得到的价值;另一方面,要求我们开展探究性学习的评价方法和体系的科学研究,为对探究性评价提供具体的方法。如果还是沿用现代教育技术应用时的思维模式,认为探究性学习在美国普遍推广、在我国正在大力推广,是一件时髦的事情,所以我(们)也就这样做。而根本没有根据具体的情况,结合本校、本课程的特色来开展工作,不仅会影响我们的教育改革的实施,而且这种改革成功的可能性也不会大。三、教学评价与教师素质的提高教学评价是每一个教师的基本素质。教师要教好书,要实现帮助学生得到全面的、最有效的发展,就必须学会教学评价,学会正确有
33、效地评价学生的发展。对学生的情感、能力、成就、态度、兴趣、潜能及发展的全面了解,并且作出一系列的正确判断和决策,就需要采用教学评价的多种方法,以弥补教师非正式观察的不足。应该承认,现在我们的教师对教学活动的评价是在经常性地进行的,我们这里将教学评价与教师的素质联系在一起进行讨论,是因为对教学活动进行评价的时候,有一个科学性、有效性、可操作性的问题。如果对教学活动的评价仅仅停留在不断地对学生的考试,不断地检查学生对某些知识记住了没有,能不能背,不断地对学生进行分等级派名次的评价水平上,而不能对学生的发展和潜能进行系统的调查和评价,发现学生的优点和长处,指出学生的缺点和不足,鼓励学生的自主性学习和
34、个性化发展,我们的评价就会显得惨白无力,教学评价就会成为可有可无的摆设,教学评价就会失去其应有的作用。真正确立以促进学生发展为中心,应有现代教学评价的思想方法,选择并合理使用科学的、实事求是的、可操作性强的教学评价方法和手段,并通过对教学活动的评价,不断地改进教学方法、调整教学策略、提高教学效果,从而促进学生的发展。是衡量教师基本素质的一个重要指标。四、教学评价与教学质量的提高教学质量的高低是以学生发展的程度,以教学目标的实现来衡量的。要了解学生的发展变化程度和教学目标的实现程度,就必须对教学活动作出相应的、科学的评价。通过教学评价活动,找到教学活动的正是效果,发现教学中的优点和缺陷,从而及时
35、调整教学策略,改进教学方法和手段,找到适应教学实际的最有效的教学方法和策略,达到提高教学质量的目的。教学评价促进教学质量的提高,还表现在科学的、合理的教学评价活动,能够促进学生的学习积极性,从源头上解决学生自主性学习的问题。通过教学评价,帮助和鼓励学生的学习活动,不管对哪一个学习水平的学生,都可以通过一定评价活动,使他们的学习得到鼓励。值得指出的是,要到达鼓励学生学习,促进学生学习内动力的提高,科学合理的评价方法的选择,灵活多样的评价机制的建立是十分重要的,是促进教学质量提高的前提。就评价和教学质量的关系而言,正确的说法应该是,教学评价能够改变学生的学习状态,从而影响教学质量,因为这种影响是双
36、向的,可以是促进,也可以是无效和反作用的。这就是为什么新课程改革中特别强调加强教学评价方法和机制的研究的原因,也是以往我们的教学中在评价这个问题上反应出的主要问题所在。那种靠不断地对学生进行考试,不断地进行分等级排名次的评价方法,对学生的全面发展是不利的,也是这次教育改革重点要进行改进的地方。这也正是我们今天反复强调教学评价的意义之所在。教学评价与教学质量的关系还表现在评价对教学管理的影响上,教学评价不仅仅是评价学生的学和教师的教,同时也应该评价教学的管理体系和管理效益。有效的教学管理是能够促进教学质量提高的,反之亦然。因此在进行教学评价的理论和方法研究中心,在教学评价的实际操作过程中都应该包
37、含对教学管理的评价或评估。从这层意思上讲,教学评价决不是面向教师和学生,而面向整个教育界的所有活动的。第二章教学评价的类型与功能第一节教学评价的类型对于教学评价的分类,国内外的教育专家们有这样和那样的分类标准和方法,格朗兰德在教学测量和评价一书中指出,根据测量性质,可以将测量和评价分为最大成就和典型行为两大类;从课堂教学中运用的角度,可分为安置性测验(评价)、形成性测验(评价)、诊断性测验(评价)、和终结性测验(评价);根据怎样解释测验和评价结果,可将测验和评价分为常模参照和标准参照两类。一、按评价的运用次序分类按评价在教学活动中运用的次序来分,常常分为形成性评价、诊断性评价、和终结性评价3类
38、。1、形成性评价形成性评价是指评价活动在教学过程中实施,相当于单元测验。其目的是教师获得教学过程中连续性的反馈,了解学生的学习效果,学习历程、学习特点、学习困难等信息,作为今后修改教学策略的参考;同时使学生能够及时的了解自己的学习和同学们的学习效果,了解自己学习中的优点和存在的问题,明确今后学习的目标,修正自己的学习方式方法。2、诊断性评价诊断性评价是对经常表现出学习困难的学生所做的测量和评价,它的目的是对个人问题行为及其原因进行诊断。诊断性评价常在形成性评价之后实施,在形成性评价后发现学生有学习困难的情形,进行个别分析和辅导,在辅导中帮助学生改善学习方法和学习习惯,克服学习困难,并跟上班级教
39、学进度。这种评价有时是学习方法和习惯问题,有时可能是学习心理问题。3、终结性评价终结性评价是在整个教学活动结束后所进行的教学评价,相当于期末考试,其目的是为了检验整个教学活动的效果,这种评价结果往往作为学生的学习总成绩,并反馈给家长和相关部门。因而,终结性评价常常存在着明显的甄别和选拔的功能。二、按评价结果的参照分类按对评价结果的参照点来分,有常模参照评价、标准参照评价和潜能参照评价。1、常模参照评价常模参照评价是将别试水平与测验常模相比较,以评价被试在团体中的相对地位的一种评价类型。其对学生的学习成就的评价和解释,是采用相对的观点的。如在某次考试中,一位学生的成绩是80分,这为同学的学习效果
40、怎样,要一整个应试团体的水平做参照。如果全班的平均成绩是65分,那么他的学习效果是显著的,成绩是优秀的;如果全班的平均成绩是85分,那么他的学习效果是不显著的,成绩是较差的。以应试团体为参照的常模评价,普遍存在于现今的应试教育当中。以学生的考试成绩分等级排名次就是基于这种评价方法之上的。2、标准参照评价标准参照评价是将被试的表现与既定的教学目标或行为标准进行比较,以评价被试在多大程度上达到了教学目标,故又称为目标参照评价。学校的教学评价主要是检验学生达到教学目标的程度,因此这种评价已经被广泛的使用,在基础教育改革中,标准参照评价的使用程度将会进一步提高。3、潜力参照评价潜力参照评价是将被试的实
41、际水平与其自身的潜在水平进行比较的评价类型。如同班同学中一人考了65分,另一人考了80分,老师表扬了考65分的同学,却批评了考察80分的同学,原因是老师是根据这两位学生的潜力来进行评价的。对考65分的同学而言,其当前的实际成绩已经达到或接近该生的“最近发展区”,而另一为同学则低于他的“最近发展区”。这种强调人性化、动态化、个别话教学评价理念,正是当前基础教育改革中大力提倡的。因为,这种评价对于激发学生的学习潜能,提高学习的兴趣,使每一位学生都能够得到最大程度的发展。三、按评价的内容分类1、智力评价智力评价的目的是测量被试的智力水平,并对其智力发展水平和特点作出评价。用于智力评价的标准量具有:“
42、斯坦福一比纳智力量表“、”韦克斯勒智力量表”等2、能力倾向评价能力倾向评价是为了测量和评价个人的潜在能力,预测个人的能力发展倾向。可分为一般能力倾向评价和特殊能力倾向评价。后着如音乐能力、技巧能力、空间思维能力等。3、人格评价人格评价又称为个性评价,其目的是为了评价被试的人格心理特征,如气质、性格、兴趣、态度、价值观、动机适应性等。其涉及的内容十分广泛而丰富多彩。开展好人格评价,对进行“因材施教”十分有利。四、其他分类另外,根据被试的行为表现的性质可分为:最佳行为评价和典型行为评价;按测量的对象可分为:个别评价和团体评价;按测量的材料可分为:文字评价和非文字评价等等。第二节教学评价的功能在论述
43、教学评价的地位是,我们实际上已经涉及到一些有关教学评价的功能,因为要论述评价的地位就必须从其能够起的功能来入手。为了更好地明确教学评价的功能,我们还是将其单独立出进行论述。一、促进教学判断功能教学评价的最基本、最原始、最现实、最普遍的功能就是对教学活动效果的判断。它包括以客观地评定学生的学习成绩,或为了给应试者的行为表现评定一个成绩(分数、等级)为目的的测量评定功能:利用测量和非测量的种种方法,系统收集资料,并在此基础上对被试的某种属性、行为表现等作出判断的教学判断功能;把事实判断的结果与外界的某种价值体系或价值标准联系在一起,对事物或人的属性做出价值分析、价值判断和价值描述的价值判断功能;以
44、考试等手段,大量收集资料,经过对资料的分析,发现教学活动中存在的问题和不足,从而找到解决问题的策略的问题诊断功能;利用精心设计的、有一定客观性和科学性的教学测量和评价方案,选拔和区分人才的区分选拔功能等。二、促进教师教学功能教学评价对教师教学的促进主要表现在:1有利于教师了解学生的起点行为。通过教学评价,教师能够比较容易的了解学生的学习和发展的情况,有利于教师进行因材施教,找到和使用适合学生学习和发展的教学策略。2有利于教师及时了解自己的教学策略的有效性。经过一段时间的教学活动,教师有必要了解自己的教学策略和方法的效果,判断自己教学过程中的优点和存在的问题,以便即使改进工作,提高教学质量。3能
45、够让教师对教学活动中的缺陷进行及时补救。采用特殊的评价方法,如S-P表分析等,能够让教师容易地发现教学中的缺陷,并进行有的放矢的补救。4能够确保教学目标的实现。通过综合达标度分析等教学评价,教师能够及时了解学生学习是否达到了教学目标,如果没有达标,还有多少差距,问题在什么地方,从而保证教学目标的有效实现。三、促进学生学习功能教学评价对学生学习的促进功能主要表现在:1通过评价激励学生的学习动机。一次有效的测验和评价,特别是标准参照评价和学生潜力评价等类型,能够较有效的激励各类学生的学习动机,为学生提供各自的短期学习目标,是他们明确所要学习的内容,提供相关的学习信息反馈,是他们具有正确的学习动机。
46、2帮助学生的记忆和促进迁移。教学评价能够引导学生朝教学目标努力,因而帮助学生的学习记忆和迁移。特别是是对较高层次的教学目标,教学评价就更能够引导学生关注这些较复杂和深奥的学习内容,弥补教学期望的效果。3能够促进学生的自我评价。元认知理论认为,学生对自己的学习上的优点和缺点的认识程度,将很大程度上影响和决定着学生的未来学习效果。因此,让学生学会自我评价,是他们学会正确的选择适合自己的学习策略和方法,从而起到事半功倍的学习效果。四、促进教学管理功能由于教学评价的方案的设计是根据教育政策、教育法规、教育文件、教育目标等具体的要求来制定的,因此通过教学评价就能够较好体现国家、社会和教育管理者的意愿,使
47、之具有控制、指挥、导向、计划、检查、考核、评估和监督的作用。对教师的管理。评价能够对教师资格的评定,保证教师达到基本的教学水平要求;能够对教师的教学艺术水平进行评定,保证教师的教学能力;能够对教师的管理水平的评定,保证教师对教学活动的有效管理;能够对教师的个性进行评定,保证有效地激励教师的教学积极性。对目标的管理教学评价是根据教学目标进行的,通过对现状和目标之间的差距的判断,能有效地促进评价的对象接近教学目标,保证办学和学科教学的目标的实现。对教学过程的管理。利用教学评价,能够全面及时地掌握教学的各种情况,以及这些情况的发展趋势,及时找到教学活动过程中存在的某些问题和不足,并及时提出改进的措施
48、,从而保证教学活动沿着正确的途径进行。五、促进教学改革功能通过教学评价活动,能够及时的发现教学中与国家、社会和学校的具体教学改革的要求的差距,是教学活动的组织者和参与者能够及时改进教学策略,促进教学改革。同时,通过教学评价能够检验当前所进行的教学改革的有效性,从而保证我们的教学改革是科学的、符合实际的、有成效的。第三章教学评价的质与量第一节教学评价的信度一、信度的含义信度(reliabiMy)是指测量和评价结果的稳定性程度,或者说,用同一测量工具或评价方法反复测量和评价同一种特质对象,具多次测量和评价的结果问的一致性程度。测量的工具和评价的方法不同,其结果会产生差异;而同一测量工具或评价方法,
49、反复测量和评价同一特质对象,多次结果之间的差异是由测量工具或评价方法的稳定性所决定的。就教学评价而言,教学测量工具和测试环境、教学评价方法、评价者的心理(如不同的评价目的、与评价结果的相关性)和生理状况,都会影响评价的信度,但影响最大和最直接的则是评价对象的心理和生理因素。评价对象的心理和生理状况的多变性、不稳定性决定了教学评价的信度相对较低,也就是说,教学评价中的评价误差较大、不可避免。正是由于教学评价的信度较低,影响评价结果的因素多、变数大,我们研究教学评价中的信度才有意义。信度的追求就是对这种无系统的随机误差的控制,尽可能地减少这种误差,提高教学评价的信度。二、信度的估计方法1、重测信度
50、(test-retestreliability)重测信度是指用同一个量表(测验或评价表)对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验中所得分数的相关系数。重测是建立在某测验所要测量的潜在特质在短期内不会随时间推移而改变的基本假设之上的。因此,重测信度的用途也在于估计测验结果经过一段时间后是否维持稳定、一致的特性,所以又称稳定系数(coefficientofstability)0但是,教学评价中的重测信度由于人类有些潜在特质会随时间而改变,重测信度的高低与两次测量时间的间隔长短有密切关系。一般说来,时间问隔越长,由于被试的身心发展、遗忘、施测情景改变等因素,而容易使信
51、度减低;时间问隔越短,被试的练习与记忆、施测环境未发生改变等因素,使信度提高。从理论上讲,间隔时间内被试遗忘和练习的效果基本相互抵消,这样的时间间隔是合适的。而实际测验中,没有一个固定的标准,应视测验结果的用途、测验种类、被试的年龄等因素而定。重测信度适用于异质性测验,即测验包括几个不同的部分,这几个部分分别测量几个不同的心理特质,他们之间可能并不存在相关或相关较低。重测信度适用速度测验而不是难度测验,也就是说,测验的题量很多,而且有一定的时间限制,被试很难记住前一次测验的内容,因此第二次测验较少受记忆的影响,第一次测验后,不做试题分析或无法做试题分析。重测信度还适用于运动技能或实验技能的测验
52、,其测验成绩较少受到重复测验的影响。2、复本信度(alternate-formsreliability,equivalentformsreliability,parallelformsreliability)复本信度是指在试题格式、题数、难度、指导语说明、施测要求等方面都相当,并且都用来测验相同潜在特质或属性,但试题又是不同的测验的稳定程度。所以复本信度又叫平行测验信度。复本信度在教学实践中应用较多,通常有两种方式:一是在同一时间内连续施测,另一种是间隔一段时间后施测。前者主要反映出测验内容造成的误差的多少,也就是说可以反映两个测验是否真正的平行测验,所以这种复本信度称等值性系数(coeffi
53、cientofequivalence);后者不仅反映测验内容的抽样误差,也反映被试本身状况的改变,这种同时兼顾试题抽样与时间影响的信度称等值稳定性系数(coefficientofstabilityandequivalence)0复本信度不仅适用于难度测验,也是估计速度测验信度的好方法。在作追踪研究某些因素影响测验成绩时,大多使用复本信度分析。3、同质性信度(homogeneityreliability)同质性信度也叫内部一致性信度(internalconsistencyreliability),是指测验内部所有题目间的一致性程度。题目的一致性包括所有题目测的是同一种心理特质;所有题目得分之间都
54、具有较高的正相关。同质性信度基于的假设是:当一个测验具有较高的同质性信度时,说明测验主要测的是某一个心理特质,由于众多的题目测试了同一心理特质,那么实测结果就是该特质水平的反映。在教学评价中,当我们要使用试题库测试来检验某些因素对测试成绩的影响时,对试题库中的题目的可信程度分析就是同质性信度分析。有分半信度分析、库德-理查逊信度分析、克龙巴赫a系数分析等。分半信度分析就是将题目按题号的奇偶分半、按题目的难度分半、按题目的内容分半进行测验,分析两次测验成绩的相关性。实际应用中,由于题目一般按难度大小排列,采用奇偶分半也反映难度分半的结果,因此常被采用。三、标准参照测验的信度分析标准参照测验就是通
55、常的达标测验,其测验结果的真实性往往是教育工作者所关心的。在教育事业得到适度的发展的前提下,标准参照测验将越来越普遍。标准参照测验的信读分析有百分比一致性分析(percentagreement、k一致性系数分析(Kappacoefficientagreementt和k2指数分析。1、百分比一致性分析百分比一致性(Pa)分析是指同一测验或两平行测验先后两次施测,其对被试的分类结果一致的比例。后测掌握未掌握合计掌握60a5b65a+b前测未掌握15c20d35c+d合计75a+c25b+d100Na+d60+20Pa=-0.80N1002、k一致性系数k一致性系数是指实际被评定为一致的百分比与在理
56、论上被评定为一致的最大可能次数百分比的比率。PaPca+ba+cc+db+dK=Pc=(X)+(X)1-PcNNNN式中,Pa为百分比一致性指标,Pc为理论上可能被评定为一致的百分比期望值,用上表的资料可以求得:65753525Pc=(X)+(X)=0.581001001001000.800.58k=(=0.5210.58一Pc=0.58的意义是指在这个被试团体中,可能被评为一致的百分比期望值,它在整个k系数计算公式中被当成是一种理论上的校正值,经过校正后,k一致性系数为排除被试团体的能力分配的预期影响,而单独贡献52%的分类一致性。四、测量的误差测量的误差是指测验中所得测值偏离真分数的程度(SE)是反应测量结果精确性和可靠性的一个指标,也是人们正确解释测量分数的科学依据。假如我们计算的SE值为2.68,那么当被试的分数为70分时,就意味着其真分数有95%的可能性落在67.3272.68的区间内。五、评价者的信度1、评价者信度的含义评价者彳S度(scorerreliability)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026心源性休克护理业务学习
- 成人烧伤患者经创面动静脉置管护理专家共识解读课件
- 北京大学《高等数学》课件-第1章函数
- 2026年EML行业分析报告及未来发展趋势报告
- 2026年玻璃纤维和玻璃纤维增强塑料制品制造行业分析报告及未来发展趋势报告
- 2026年养老产业行业分析报告及未来发展趋势报告
- 非HIV重症耶氏肺孢子菌肺炎的诊治总结2026
- 2026年聊天机器人行业分析报告及未来发展趋势报告
- 2026年中小型农具行业分析报告及未来发展趋势报告
- 2026年电动胀管机行业分析报告及未来发展趋势报告
- 2026年滁州凤阳大明旅游发展(集团)有限公司招聘导游员(讲解员)15名笔试备考题库及答案详解
- T∕SZSSIA 019-2026 反恐怖防范管理规范 总则
- 24J113-1 内隔墙-轻质条板(一)
- 药食同源食品管理办法实施细则
- 律师事务所内部惩戒制度
- 政治监督培训课件模板
- 桥架培训课件
- 形势与政策课论文题目
- 无线电频谱管理现状与发展趋势
- 《青春之光》教学课件【大单元教学】
- 湖北大数据集团有限公司招聘笔试题库2025
评论
0/150
提交评论