版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
教学测评在教学过程的所有环节中,教师运用各种手段或方法搜集教学信息,描述,分析和判断学生学习状况,这些活动被称为教育测评。一个完整的测评过程包括测量(measurment)和评价两方面。测量主要是搜集资料数据的过程,评价主要是指对测量结果的解释。测量这一概念在教育情景中,常以测验代替。测量就其广义来讲,是按照法则给事物指派数字,在教育心理学中就是根据一定的心理学理论,使用一定的操作程序,针对学生的学习与行为确定出一种数量化的价值。测量这一概念的含义包括三个要点:一是事物及其属性,这不仅包括可直接测量的事物及其属性(如长度),也包括一些可间接测量的心理现象(如智力);二是法则,即测量者对事物指派数字时所采用的依据;三是数字或符号,其所代表的含义直接标示所欲测量的内容,反映了被试的表现或者代表了“他(她)能做到多少”的解释。教师常用的测量方法有测验、等级评定、观察、面谈等。测验是运用一系列问题来鉴别能力、性格、学业成就等个体特质的工具,以心理测验学的角度,测验实质上是“对行为样组的客观标准化测量”。也就是说,测验测量的是人们在完成测验时表现的行为,而且只能选取一个具有代表性的行为样本。测验具有客观性,其客观性要求其标准化,就是要求测验在编制、施测、评分、解释等方面必须遵循一套系统的程序,以减少误差。测验要具有一定的信度和效度。按照角度的不同,测验分为标准化测验和非标准化测验,常模参照测验和标准参照测验,成就测验、能力测验和人格测验,指定性测验和预测性测验,个别测验和团体测验,速度和难度测验,文字测验和非文字测验,等等。评价是指系统地收集有关学生学习行为的资料,在对之加以分析处理以后,再根据预定的教学目标给予价值判断的过程。学生学习行为的资料既可以是在测验中得到的结果,也可以是教师在平时观察到的现象;既可以是在测量过程中得到的数据,也可以是对学生某种品质的描述。下图体现了评价的全面性以测量和非测量手段在评价过程中的作用。
评价的过程根具在教学工作中的作用,评价可分为:(1)诊断性评价(DiagnosticEvaluation),一般用于教学活动开始之前,了解学生的现有水平和个体差异;(2)形成性评价(FormativeEvaluation),通常用于教学过程中了解学生学习进展情况;(3)总结性评价(summativeEvaluation),通常在教学活动后进行,以了解学生最终学习效果。根据资料处理方式,评价可分为:(1)常模参照评价(Norm-referenceEvaluation),评价时把学生的成绩与其所在团体或常模团体进行比较,根据个体所处相对位置来确定评价结果;(2)标准参照评价(Criterion--referenceEvaluation),根据某一不随测验适用对象的变化而变化的固定标准来评定学生的学习行为。二、有效测评的必要条件
有效测评的常用指标有以下几种:效度(validity)、信度(reliability)、难度和鉴别力。(一)效度(validity)
效度指一个测验所测出的东西与其所要测出的东西相符的程度,也就是测量的正确性。效度的种类主要有以下几种:1、内容效度(contentvalidity),指一个测验对其所要测量的知识或技能的实际测量的程度,也就是指测试题能否真正代表或推测所希望测量的目标或能力。教学内容和测试内容一致性越高,测试的内容效度越高。2、构想效度(constructvalidity),指一个测验对某种心理学理论所涉及的抽象概念或心理特质测量得如何。如气质测验对粘液类型的气质的反映程度。3、预测效度(predictivevalidity),指一个测验对受测者处于特定情境的行为进行预测时的有效性,如智力测验对学业成绩的预测程度。(二)信度(reliability)信度指所测量的属性或特征前后一致的程度。效度反映的是测验的准确性程度,而信度反映的是测验的可靠性。在心理和教育测量中常用的信度主要有以下几种:1、再测信度(test-retestreliability),指使用同一测验在不同时间对同一组受测者施测两次,根据两次测验分数计算出的相关系数。2、复本信度(alternate-formsreliability),使用两个等值但题目不同的测验来测量同一组受测者,然后计算出两次测验分数的相关系数就是复本信度系数。3、分半信度(split-halfreliability),把测验题目分成对等的两半,根据受测者在这两半测题中所得的分数所计算出的相关系数就是分半信度系数。4、评分者信度(interraterreliability),其最简单的估计方法是随机抽取若干份测题,由两位评分者独立地按评分规则给分,再计算每份测题两个分数的相关系数,就是评分者信度系数。(三)难度和鉴别力难度是表示测验项目的难易程度的一个指标。测验项目的难度水平多高才适合,取决于测验目的、项目形式以及测验的性质等。在学校教育中,如果测验目的是考察学生掌握知识或技能的程度,测验项目的难度可较低;如果测验目的是对学生做区分,可适当提高难度。鉴别力,指测验项目对所测量属性或品质的区分程度或鉴别能力,也就是项目的效度,通常以不同水平的受测者通过每个项目的百分比之差来计算。如果一个项目的鉴别力水平高,则水平高或能力高的受测者得分高,水平低或能力低的受测者得分低。第二节学校教育中的测验一、实施测验的基本环节
1、设计测验在设计测验时,首先要确定测验的目的,确保测验与教学目标和课堂教学相一致。在实际的教育工作中,这是一项比较困难的工作。因此,在设计测验时。教师除了确定测验目的外,还要仔细考虑测验要考察的学习结果,这可以通过列一些双向细目表来完成,具体形式如下面(表中数字为题数)表15.1是根据以下步骤编制的:(1)表头列出一般的教学目标。(2)在表中最左边的一列填上主要的内容。(3)确定每个目标和每项内容上的题目比例。细目表的其他例子:2、帮助学生准备测验为了使学生在进行测验时焦虑程度最低,教师可以帮助他们准备测验。这一工作主要从帮助学生了解测验过程、测验形式和内容以及帮助他们掌握应试策略和技巧几方面入手。3、实施测验在实施测验的过程中,首先,教师要安排好适当的测验环境。其次,在测验进行前要向学生详细说明测验的内容、形式以及答题要求,还要说明交卷的要求。最后,在测验进行过程中,教师要做好监督工作,既要督促学生集中精力完成测验,也要防止学生作弊。4、分析结果测验完成后,教师要及时进行评分,还可以与其他教师讨论结果,之后及时向学生提供反馈。这一过程有助于学生及时了解自己的学业成绩,并激发他们的学习动机。二、对认知目标的测量1、编制测验的基本原则和步骤对课堂教学中的认知目标的测量一般采用学业成就测验(achievementtest),即自编测验(teacher-made/developedtest)来测量和评价学生的学业情况。这种测验的目的在于检验学生的学习结果是否达到预定的教学目标。从测验本身的角度来看,编制测验的基本原则有:(1)测验的内容符合评价的目的。教学评价有多种形式,如诊断性评价的测验内容只能包括开展新的教学活动之前学生应掌握的学习内容,形成性评价的测验内容只能包括新近学习的内容,总结性评价的测验内容则包括一学期的学习内容。(2)测验编制的科学性。一份测验要有适宜的效度、信度、难度和鉴别力等。(3)测验的使用必须具备一定效果。教师自编的测验既要有助于教学,也要能促进学生的学习。所以测验结束后,教师一定要及时向学生提供反馈。从测题的角度来看,编制测验的原则有(1)测题要与测验的目的、内容一致。测题要反映教学目标和教过的主要知识。(2)测题要具有代表性。测题要代表教材中的重要知识点;测题的难度要适宜,应是大部分学生能完成的。教师在编制测题的过程中可通过列双向细目表来帮助达到这一要求。(3)测题形式要与测验目的一致。根据不同的测验目的,如考察理解能力、分辨能力、记忆能力、分析能力等等,教师可从是非题、填空题、选择题等不同的测题形式中选择适宜的题型来编制测验。基于以上基本原则,教师编制测验可遵循以下步骤:(1)确定测验目的。测验是用于诊断性目标还是用于形成性目标,抑或是用于总结性目标,不同的目标决定了测验的长度及测题的取样,也会影响测题的构成。因此,在正式编制测验之前必须明确测验的目的。(2)选择测验材料。注意材料的目的性、代表性、普遍性、适宜性,既包括要考察的内容,又不偏向某类学生。(3)编制测题。根据测验的目的,选择适宜的测题形式。要注意其代表性,难度适中,各试题彼此独立,等等。以上为教师编制测验的一般步骤。根据不同的测验目的,教师在编制测验时可以略过一些步骤,但大多要经过前三步。(4)预试和测题分析。预试即将初步编制的题目向一组学生施测的过程。在预试过程中应注意,所选出的一组学生要具有代表性,预试过程应正规化,预试时间长度适宜,记录下学生的所有反应。试题分析包括:预试前,对测题内容、形式、取材的适宜性和编制测题的技术等进行分析;预试后,根据学生答题的实际情况,分析测题的效度、信度、难度和鉴别力等。(5)试卷的编辑,即测题的选择、编排和标准化。(6)鉴定测验的基本特征,即测验的效度、信度、难度鉴别力等。2、不同的测题形式在教师自编的测验中,测题的形式大体可分为客观题和主观题。客观题(objectivetest)客观题因其评分客观而得名。其特点是出题明确,答案唯一,评分客观,不同评分者对其的评定结果相同。这类测题包括选择题、完形填空、匹配题和是非题等,其形式见表15.4。(1)选择题具体来说,选择题是针对一个问题,要求学生从几个可能答案中选择一个或多个答案的试题形式。它由题干和两个或更多的选择支构成。题干可以是直接提问或以不完整的句子的形式出现;选择支提供若干项供选择的答案,其中一个或多个为正确选项。根据正确选择项的个数,选择题可以分为单选题(一个正确)和多选题(多个正确)。优点:选择题是所有客观题中最灵活的一种:①可用于测量学生不同层次的学习结果。例如,可以测量学生对知识掌握的程度,也可测量学生对知识的理解、应用、分析、综合和评价的能力。②评分标准客观、统一,不受评卷人主观因素和答卷人提出意料之外的答案等影响,而且易于记分。可以通过运用电脑评卷的方式来提高评卷速度、测验的信度。③可加大试题容量,抽取广泛有代表性样本,能够在一个测验里尽可能多地从课本内容中取样,使其覆盖的知识范围广,从而克服主观题由于试题量少、抽样范围狭窄而造成的效度不高的缺点。④有利于考察学生思维的敏捷性和准确的判断力。⑤采用大量的似真选择项使结果易于诊断。通过对学生错误选项的选择反应的分析,教师便于发现学生在学习中存在的问题,并进行及时纠正。缺点:①由于选择题的数量多,每一试题中除了正确答案之外,而且要有足够多的干扰答案,而且要求这些干扰答案应与题干有相当的逻辑联系和似真性,以便能有效地证明差生确实对所学知识点掌握得不够,即,干扰答案很难区分出差生和优生。所以,要编制良好的选择题比较花费时间,而且要求编制者有专门的命题技巧。②很难编写出好的选择题来测查学生的高级认知技能,如,推理能力、综合运用所学知识的能力、有效的总结能力、严密的表达能力和写作能力,对于发散思维能力更是如此。③无法测量学生的思维(解题)过程。④学生仅凭猜测就有可能选中正确答案。例如,在有4个备选答案的选择题中,仅凭猜测的成功率就达到25%,这对考试的信度有一定的影响。·编写原则①题干意义完整并能表达一个确定的问题。有许多陈述式选择题的题干,直到读完全部选项才能了解其意义。品质良好的选择题,应该是在遮盖选项部分,即在没有选项的情况下,也是意义完整的。【例题】(不妥试题)一个双向细目表:A、可以提供一个内容更平衡的内容取样B、指出一个测验如何用来促进学习C、确定一个所使用的记分方法D、必须按照教学目标重要的顺序来排列本题的题干意义不清楚,应将试题修改为以下形式:【例题】(较妥试题)当拟定一个成就测验的编制计划时,使用细目表的主要目的是:A.减少所需的时间B.使试题编制更容易C.改进内容的取样D.增加测验的客观性②题干简明题干不应包括摸棱两可、难以理解的字词和语句结构,不要使用生僻的文字,也不要使用过长的语句。【例题】(不妥试题)当缺乏与中心观念有关联的似真但非正确的选项时,则在编制下述哪一类型的试题时会遇到困难?A、是非题B、简答题C、论述题D、选择题此题的题干,陈述过于复杂,堆积一些不切题的材料陈述,若改为下述形式,则较为合理。【例题】(较妥试题)编制哪类试题时,如果缺乏似真而非正确的选项时,会遇到最大的困难?A、是非题B、简答题C、论述题D、选择题③题干不要滥用否定结构,要尽可能地采用正面陈述。过多采用否定结构,往往会给学生带来阅读上的困难;同时,否定结构也不利于教师了解学生到底掌握多少正确知识。另外,肯定结构比否定结构从某种程度上来说更富有教育意义。【例题】(不妥试题)在耳的下列结构中,哪种与听力无关?A、鼓膜B、卵形窗C、半规管D、耳蜗修改后的试题,则更能直接地测量教师想要测的知识。【例题】(较妥试题)在耳的下列结构中,哪种有助于保持平衡?A、鼓膜B、卵形窗C、半规管D、耳蜗当然在某种情况下,采用否定结构也能测量重要的学习结果。但此时最好在否定词下划线,以引起注意。④干扰答案应具有似真性。所有选项都应与题干有一定的逻辑联系,选项中的干扰答案应具有很高的似真性或似乎合理性,不能错得太明显。【例题】(不妥试题)在下列元素中,哪一种元素存在于蛋白质中,而不存在于碳水化合物或脂肪中?A、二氧化碳B、氧C、水D、氮此题的A与C两选项都是化合物,而不是元素,很容易被剔除。选择题中的干扰答案应该对未具备回答该题所需知识的学生有疑惑力,吸引这部分学生选择,从而达到测验的目的。编制良好的选择题的技术取决于有效的干扰选项的编写。
增加干扰选项的似真性的具体方法有:
使用学生共同的错误观念或过失来作为干扰现选项;以学生关惯用的模糊性用语叙述干扰选项;在正确选项和干扰选项中使用同样“精确的”、“重要性”等堂皇的用语来叙述;干扰选项的长度和措辞的复杂性与正确选项相似;在干扰选项中使用额外的线索。如固定的用词,具有科学味道的答案,以及和题干有语义上的联系等;保持选项之间的同质性。但,应注意,干扰选项只应吸引不具备这项知识的学生,不能使之成为把好学生引入歧途的陷阱题。⑤不能对正确答案有任何暗示。无意提供暗示主要表现为以下几方面:语法结构上的不一致,如正确答案语法正确,干扰答案语法错误等;各选项在逻辑上不同,如正确答案加以“如”、“有时”、“通常”等修饰词,干扰选项中加以“总是”、“从未”、“所有”、“绝对”、“准”等修饰词,或正确答案使用与题干相同的词;答案的长度有明显差异,如正确答案叙述得特别详细,比干扰选项要长得多;各题正确答案在选项中有一定的规律等。⑥同一测题中每一个测验试题之间应该相互独立,避免牵连。有时,某一试题的题干中所提供的资料,刚好可以帮助学生回答别的问题,这种情形只要在着测验前仔细检查每道试题就可以避免。⑦选项的文字表述力求简短精炼。应尽可能将各项中共同的用词(字)放在题干中,在每个选项中要避免重复的材料,这样不仅可以使题意清楚,而且可以减少学生阅读选项所需的时间。【例题】(不妥试题)两条异面直线的概念是()A、指在空间中相交的两条直线B、指在空间中不在同一平面上的两条直线C、指在空间中位于两个不同平面上的两条直线D、指在空间中某一平面与这一平面外的两条直线本例中的有关字句如“指在空间……两条直线”放在题干中,则更为妥当。⑧应当尽量避免“以上皆是”、“以上皆非”的选项。(2)是非题是非题是要求学生对一个或多个命题进行是非判断的一种试题形式。·优点:①编制容易,可以适用于各种教材。②记分客观,取样广泛。·缺点:①仅能测量知识层次中最基本的结果,无法测量高层次的学习结果。②受猜测因素的影响很大。只有两种可能的选择,学生凭猜测都有50%的机会获取正确答案。编写原则:①考核的内容应是重要的知识,应有考核价值。②多应测量理解能力,而不应测量记忆性的知识,更不要直接抄录教材中的句子。③一个题目只能有一个中心问题,或一个重要概念。④试题应做到是非界限分明,用词准确,避免模棱两可的词语。⑤题目陈述应简单明了,避免使用复杂的句子结构,避免学生因阅读困难而对测量产生不良影响;尽量采用正面叙述,避免用否定或双重否定的语句。⑥正句和误句的排列要随机化,而且数量应大致相等。(3)匹配题匹配题是要求学生从两组或多组选项中寻求意义相互配合的一种试题形式。·优点:①可以用于测量对多个事物与知识的理解能力和对其相互关系的能力。②可以在较短时间内测量大量相关联系的事实材料。匹配题在编制上也较为容易。·缺点:①仅能测量低层次的教学目标,而且易提供额外的线索。②较难找到一些符合教育目标和学习结果的同质材料。编写原则:①在一道题中,要求各个题干(包括选项)具有相同或相近的性质,这种同质性可以保证所有的选项都能成为任何一个题干的似真答案。否则,会增加或降低试题的难度,而不能达到考核目的。【例题】(不妥试题)我国最长的河流是()A、孙中山我国最大的城市是()B、1949年我国近代革命的先行者是()C、长江中华人民共和国成立的时间是()D、上海在上题中,题干和选项均分别是城市名称、河流名称、年份、人物,具有完全不同的性质,造成各选项对题干来说,都缺乏似真性,即使这些知识并未掌握,也可以凭猜测答对。②为了大大降低学生成功猜测的概率,选项的数目应多于题干的数目,而且不限制每个选项被选择的次数。③题干和选项之间如果有逻辑顺序,就按逻辑顺序来安排选项。④以清晰的指导语指出题干与选项之间的匹配关系以及对每个选项可以被选择的次数的规定。⑤选择的词语要短,相对于选项而言,题干的词语应较长些。并且每一试题的配对数目不能超过10个,通常以4到7个配对数目最为合适。⑥一个试题的所有部分应该安排在试卷的同一页上。(4)填空题填空题的常用形式是,呈现给学生一句或一段不完整的话,或是直接提问,要求学生简单做答,它主要测量的是学生的记忆能力。·特点:可以用来考察学生对知识的记忆和理解能力。受学生猜测的影响小,评分比较客观。但填空题偏重于测量学生的知识记忆程度,使用过多容易养成学生死记硬背的习惯。编制原则:①题意明确、限定严密,空白处应填的答案是唯一的。【例题】(不妥试题)只有___________________,才能学好英语。本题的限定不严密,所填的答案不唯一,学生也不知道到底是考核哪些方面的知识。②空白中所填写的应是关键词语,并且要和上下文有密切的关系,使学生不至于填写困难。【例题】(不妥试题)2002年我国科技界有_________________新发明。③题目中空白的地方不能太多,以免句子变得支离破碎,不利于学生理解题意。【例题】(不妥试题)连接_______市与_______的是_______河。这样的试题容易导致题意不完整,无法填写,即使勉强填上,也难于判断对与错,无法评分。通常一个填空题不应超过两个空白。④尽量将空白放在句子的后面或中间,而不要放在句子开头。因为按照人们的思维过程,应该是先提供充分的证据,然后再要求学生做什么或这么做。【例题】(不妥试题)_____________发明了蒸汽机。本题应改为“发明蒸汽机的是_____________。”⑤所有空白处的线段长度应当一致,不能随正确答案文字的多少而长短不一,以免产生暗示作用。⑥若答案是数字,应指明单位和数字的精确程度。主观题(subjectivetests)
主观题要求学生自己组织材料,并采用合适的方式表达陈述出来。这类测题包括论文题,论文题又分为限制反应题和自由发挥题,具体形式见表15.5。限制反应题要求学生在题干所限制的范围内发表意见。与限制反应题相比,自由发挥
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 艾灸疗法的护理要点与操作规范
- 吉林省长春市第104中学2025-2026学年初三第五次月考数学试题文试题含解析
- 辽宁省营口市大石桥市石佛中学2026届初三物理试题(新课标)第二轮复习测试卷含解析
- 江苏省南通市第一中学2026年初三下学期第二次阶段考试数学试题含解析
- 正德职业技术学院《高等物理有机化学》2024-2025学年第二学期期末试卷
- 四川宜宾县横江片区2025-2026学年初三下学期期末质量检测试题(一模)数学试题含解析
- 陕西省西安市周至县重点达标名校2026届中考预测卷(全国Ⅱ卷)数学试题试卷含解析
- 护理质量控制与跨学科合作
- 脊椎骨折的预防措施与健康教育
- 智研咨询发布-2026年中国太阳能熔盐行业市场运行态势及发展趋势预测报告
- 消防酒店应急预案
- 2025及未来5年中国高压真空开关市场调查、数据监测研究报告
- 公墓管理员岗位操作规程考核试卷及答案
- 水利建设项目“六项机制”建设制度汇编
- 内蒙古房屋市政工程施工现场安全资料管理规程
- 钢结构构件运输与吊装方案
- 月嫂岗前培训课件班
- 旋挖钻孔灌注桩全护筒跟进施工工艺主要施工方法及技术措施
- 第四单元应用文写作《说明书》(教学设计)-【中职专用】高二语文上(高教版2023职业模块)
- 急救中心建设标准
- 矿安益学习题库
评论
0/150
提交评论