教育测量与评价复习资料.doc_第1页
教育测量与评价复习资料.doc_第2页
教育测量与评价复习资料.doc_第3页
教育测量与评价复习资料.doc_第4页
教育测量与评价复习资料.doc_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章 教育测量与评价的学科发展1.测量的三要素:量具、测量的单位、测量的参照点。2.教育测量是为了了解学生的发展,尤其是为评价学习成绩而进行的测量活动。这是教育测量活动最原始的动机,也是教育测量学科发展最早的立足点。3.教育测量的特点:间接性和推断性、测量对象的模糊性和测量误差的不可避免性、量表具有多样性以及结果具有相对抽象性。4.史蒂文斯根据测量的精确度将量表分为:称名量表、顺序量表、等距量表和比率量表四种水平。称名量表是用来对事物活人的心理现象进行分类,指派的数值没有数量意义,只是表明事物的类别和性质不同;顺序量表也用于对事物活人的心理现象进行分类,这种分类基于所测属性在数量大小基础上进行的有序得分类,四等级评分法和五分法都是顺序量表;等距量表不但能在一个连续体上表示事物量的大小,而且具有形同的测量单位,但她的零点是相对的,是人为规定的;比率量表是最高水平的量表,除了具有量的大小和相同的单位,还具有绝对的零点。5.教育评价的概念: 格兰朗德:评价是为了确定学生达到教学目标的程度,收集、分析和解释信息的系统过程,评价=测量(定量描述)+非测量(定性描述)+价值判断 斯塔费尔比姆:评价是一种划定、获取和提供叙述性和判断性信息的过程,评价最重要的不是为了证明,而是为了改进。 泰勒:评价过程本质上是确定课程和教学大纲在实际上实现教育目标的程度的过程。 日本桥本重治:评价师与教育的目标和价值有明确关系的概念,是按照教育目标和价值观对学生学习成果及教育计划的效果等进行测量的过程。因此,评价的概念重点在于以教育目标为标准的价值判断。 布鲁姆:评价是为了某个目的而进行的,对各种想法、作品、解答、方法、资料等的价值作出判断的活动。所谓教育评价,是指按照一定的价值标准和教育目标,利用测量和非测量的各种方法系统的收集资料信息,对学生的发展变化和影响学生发展变化的各种要素进行价值分析和价值判断,并未教育决策提供依据的过程。6.桑代克在精神与社会测量导论中提到:无论什么东西,只要存在的,总存在与数量之中。7.八年研究的四条基本原则:应当帮助学生学习什么;为了帮助学生达到学习目标,应当提供什么学习经验;怎么组织学习经验一是这些经验的积累效果最大;怎么评价方案效果,即随后采取什么步骤,以便检查期望的学习活动所发生的变化。8.八年研究中泰勒提出了以全面发展的教育目标为核心和依据的两条原理:课程编制原理和评价活动原理。9.教育测量与评价理论的发展:统计模型提供强有力的支持,20世纪60年代以来:经典测量理论(CTT),项目反应理论(IRT)和概化理论(GT)。第二章 教育测量与评价的类型和功能1.教育测量与评价的主要类型:1)按运用时机分:形成性测量与评价,在教学过程中经常实施的,相当于中小学单元测验;诊断性测量与评价,是对经常表现出学习困难学生所做的测量与评价,目的是对个人的问题行为及其原因进行诊断;终结性测量与评价,用于教学结束后,相当于期末考试,目的有二:一是在教学目标下,检查学生一学期的学业达到了什么程度,从而判断教学效果的得失;二是根据终结性测量与评价的结果评定学生的学业成就,并将评定结果通知学生家长或记入档案。2)按解释测量结果或评价结果时的参照点分类:常模参照测量与评价,是将被试水平与测量常模相比较,以评价被试在团体中相对低位的一种测量与评价类型;标准参照测量与评价,是将被试的表现与既定的教育目标或行为标准相比较,以评价被试在多大程度上达到标准。3)按测量与评价被试行为表现的性质分类:最佳行为测量与评价,以被试的最佳行为表现为目的;典型行为测量与评价,不在测量与评价被试能力的高低,而是测量与评价其是否具备某种(或某些)典型行为。4)按量表的标准化程度可分为标准化测验和非标准化测验,标准化测验是只由测量专家严格按照标志程序而编成的一种测验2.教育测量与评价的主要功能:1)实现教育目标的功能:测量评定功能、事实判断功能、价值判断功能、问题诊断功能、区分选拔功能2)改进教师教学的功能:了解学生的起点行为、作为改进教学的参考、作为补救教与学的依据、确保教学目标的达到。3)促进学生学习的功能:激励学生的学习动机、帮助学生的记忆和促进迁移、促进学生自我评价。4)形势教育管理的功能:对教师的管理、对目标的管理、对过程的管理第三章 教育测量与评价的质量特性1.信度:指的是测量结果的稳定性,记为 。也就是说,如果用同一测量工具反复测量同一种特质对象,则多次测量的结果间的一致性就叫信度。2.重测信度:指的是同一个量表对同一组被试施测两侧所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。3.复本信度:是指在试题格式、题数、难度、指导语说明、施测要求等方面都相当,并且用来测量相同潜在特质或特质,但试题又是不相同的测验,也叫做平行测验。4.效度:就是一次测验的有效程度,严格的说,效度是指一个测验或量表实际能测出其所要测量的特性的程度。应注意以下几点:1)效度始终是针对一定测量目的而言的;2)效度只有程度上的差异;3)效度是针对测量结果而言的;4)评价一个测量是否有效要多角度、多方面地收集证据5.结构效度验证的四个步骤:第一,提出有关理论结构的说明,并据此设计测量用的试题;第二,提出可以验证该理论结构是存在的假设说明;第三,采用各种方法收集实际的资料,以验证第二步提出的假设的正确性;第四,收集其他类型的辅助证据,淘汰与理论结构相反的试题,或是修正理论,并重复第二步和第三步,直到上述的假设得到验证,及验证的结构效度获得支持为止。6.结构效度的验证方法:1)测验内部寻找证据法:是通过研究测验内部结构来验证测验的结构效度,包括内容效度、作答过程分析、测验的同质性和因素分析法四个方面。2)测验之间寻找证据法:是同时考察两个或多个测压间的相互关系,从而来验证测验的结构效度,包括相容效度、聚合效度、区分效度和“多种特质多种方法矩阵法”。3)考察测验的实证效度法:主要有差异被试比较法和先后测试分析法。7.效标关联效度含义:是指一个测验对于处于特定情境中的个体行为进行预测时的有效性。分为同时效度和预测效度两种:测验的分数与校标资料的取得约在同一个时间内连续完成,计算这两种资料的相关系数即代表测验的同时效度;在测验分数去的一段时间后才获取校标资料,计算这两种资料间的相关系数即代表测验的预测效度。8.难度系数的计算方法: 1)以全体被实得分率为难度系数难度大,则得高分的可能性小,难度系数在本质上是正确作答人数的比例,也叫通过率。公式为: 2)以全体被试失分率为难度系数,取值范围在0和1之间,P值越大试题越容易,反之越难(失分率),公式:q=1p 3)以两端被试者得分率的均值为难度系数,分别计算稿分组和低分数的得分率,然后求取二者的均值,从高分往下找,找出高分组;从低分往上找,找出低分组,两组人数个占总人数的27%。公式为:P=9.区分度的计算:高低分组法,高分组在特定题目上的得分率和低分组在相同题目上的得分率之差作为题目区分度的指标(高、低分组各占总人数的27%)计算公式:D=,式中,P代表项目鉴别度系数,分别代表高低分组在该题目上的得分率。还可采用公式:D=,式中,D代表题目鉴别度系数,代表高分组在特定题目上的平均得分,代表低分组在该题目上的平均得分,F代表该题目的满分值。10.教育测量方案的可用性是指方案质量性能可靠稳定,针对性强,对于所有被测量与评价的对象是客观公正的,同时在操作上有可行性、易用性、经济性的特点。第四章 编制教育测验的一般原理和方法 1.选择题的优缺点 1)优点:a可以用来测量学生各种不同层次的学习结果,不仅可以测量学生掌握所学知识的程度,而且可以用来测量学生对所学知识的理解、分析、判断、应用和综合的能力。这种类型试题的应用最广泛;b评分标准统一、客观,不受评分人主观因素和答卷人提出意想之外的答案等的影响,并且可以利用电脑迅速评卷,从而大大提高测验的信度,提高评卷的速度和自动化水平;c可以加大试题容量,抽取广泛有效的代表性样本,使试题覆盖的知识范围广,可以克服传统考试中主观题由于试题少、抽样窄而造成的测验效度不高的缺点;d有利于被试思维的敏捷性和准确的判断力;e采用大量的似真选择项使得结果已于诊断,通过对学生错误选项的选择反映这个线索,教师便于发现、分析学生在学习中存在的问题,以便及时纠正。 2)缺点:a由于选择题的数量多,每一个试题中除正确答案外,还要有足够多的干扰答案,而且要求干扰答案与题干应有相当的逻辑关系和似真性,所以编制良好地选择题较花费时间,且要有专门的命题技巧;b难以考核被试完全的推理能力、综合运用所学知识的能力、有效地总结能力、严密的表达能力和写作能力,对于被试的发散思维(或求异)能力则更是如此;c无法测量被试的思维过程;d被试能仅凭猜测选中正确答案。2.选择题的编写原则:为使选择题的普遍适用性和优良性能得到实现,在编制选择题时,应循序: 1)题干意义完整并能表达一个确定的问题;2)题干简明;3)题干不要滥用否定结构,要尽可能地采取正面陈述;4)诱答项(干扰项)应具有似真性;5)不能对正确答案有任何暗示;6)统一测验中每一个测验试题之间应相互独立避免牵连;7)选项的文字表达,力求简短精炼;8)尽量避免“以上皆是”“以上皆非”的选项3.填空题的编制原则:1)题意要明确、限定要严密,使空白处应填的答案是唯一的;2)空白处所填写的应是关键词语,并且要和上下文有密切的关系,使被试不至于填写困难;3)题目中空白地方不能太多,以免句子变得支离破碎,不利于被试理解题意;4)尽量将空白放在句子的后面或中间,而不要放在句子开头;5)所有空白处的线段长度应当一致,不能随正确答案文字的多少而长短不一,以免产生暗示作用;6)若答案是数字,应指明单位和数字的精确程度。4.简答题的编制原则:1)问题的叙述要明确,要确实能使被试用简单的语言来回答;2)问题的答案应该只有一个,并且答案要简短具体;3)避免只考机械记忆的题,应注重知识的应用;4)在考查某公式的应用时,不要给太多太复杂的数字,以避免给计算带来麻烦;5)尽可能使用直接问句来提出问题。5.教育目标表述:表述得当的教育目标通常是一个表达学生行为的陈述句,一般包括主谓宾三部分,应符合以下要求:1)以学生为行为主体;2)表述明确具体;3)反映学习结果的层次性;4)表达教育工作者的意图6.布鲁姆的教育目标分类:认知、情感和动作技能三个领域。 1)认知领域:六个类别,按照由低到高的难易程度形成一种递进的等级关系,前一类别是后一类别的基础,后一类别又覆盖了前一类别,包括知识、领会、运用、分析、综合和评价。 2)情感领域分为接受、反应、价值评价、组织和由价值或价值复合体组成的性格化五部分,也是从简单到复杂,由低级到高级依次排列组成层次结构。 3)动作技能领域:知觉、准备、指导反应、机械化、复杂反应、适应性和独创性。7.确定测验目标应注意的问题:1)深入分析课程目标,教育目标是测验目标的依据,因此,在确定测验目标时,应深入研究并弄清楚课程教学目标,做到测验的与教学目标或学习目标相一致;2)正确选择目标领域和类别,在选择测验目标时,应根据社会的要求和学科的特点,并非所有的测验都包括认知、情感和动作技能三个领域和领域中的全部类别;3)正确选择各类目标之间的关系,应考虑到目标的层次性和涵盖性,既类别是由简单到复杂的排列,并且前一类别是后一类别的基础,后一类别又涵盖了前一类别,较复杂的行为目标中含有较简单的行为目标。8.设计测验的基本考虑:1)确定测验目的,因为测验是一种手段,无论谁举行一次测验,总有一定的目的和要求。2)确定测验的属性,测验时学科测验还是智力测验,亦或是人格测验;3)明确测验的性质和用途,性质不同,题目所要求的难度水平及具体的编制要求有所不同;4)明确测验对象,应考虑被试的年龄特征、教育水平和文化社会背景等因素;5)分析测验目标,首先要选定测验所欲达到测量的教学目标,其次要使陈述目标的方式适合于测验的编制,使阐述教育目标必须能够测量、适合于测量。9.测验的编制与组织:1)选定测验的材料;2)编制测验命题;3)试测与题目分析;4)合成测验;5)编制副本;6)编写测验手册第五章 制定教育评价表的一般方法和步骤1.制定教育评价表的原则:1)科学性与导向性原则;2)完备性与独立性原则;3)发展性与整体性原则;4)操作性与可测性原则;5)可行性与可比性原则;6)超前性与持续性原则。2.教育评价表的构成要素:1)评价指标,指标是综合反映社会现象某一方面情况的绝对数、相对数和平均数,它是社会经济统计中的术语。所谓评价指标就是根据评价的目标,由评价指标的设计者分解出来的,能够反映评价对象某方面本质特征的具体化、行为化的主要因素,它是对评价对象进行价值判断的依据;2)指标权重,不同的评价指标在判断评价对象达到预定目标的程度的所起作用是不同的。所谓指标权重就是表示每项评价指标在指标体系中所占的重要性程度,并赋予相应的值,这个数值就叫做对应指标的权数,它能较客观的反映各项指标在达到目标中所起作用的大小;3)评价标准,是衡量评价对象达到评价指标要求的尺度,是由强度和频率、标号、标度三个要素构成的。3.制定教育评价表的方法:制定教育评价表是一项政策性和技术性强、涉及面光的工作,为保证评价表编制过程有条不紊,使指标和标准的内容都达到较为理想的程度,除必须遵守以上的基本原则外,还必须采用一定的科学程序与技术进行操作:1)确定教育评价的对象和目标,是通过评价达到的目的,是编制评价表要解决的首要问题,没有评价目标就没有编制评价表的依据,就无法设计评价指标,不同的评价目标对评价表有不同的要求;2)初拟评价指标,方法主要由以下几种:a头脑风暴法,利用头脑积极思维,进行智力碰撞,激发智慧灵感,从而提出评价指标的一种常用方法;b因素分解法,是一种将评价指标按评价对象本身的逻辑结构逐级进行分解,把分解出来的主要因素作为评价指标的方法;c理论推演法,根据有关学科的理论推演出评价指标的方法;4)典型研究法,这是一种通过对少数典型事例进行研究而设计评价指标的方法,使用时要注意:选择的事例必须具有典型性和代表性、要与类推法相结合;3)筛选评价指标,方法如下:a经验法,是凭设计者的学识修养和工作经验进行筛选的一种简便实用的方法,可以掌握以下几个要点:理由是否充分或必要、取主舍次、从各指标的关系上进行比较、去难存易,删繁就简;b调查统计法,这是在调查或的资料的基础上进行的统计方法;c模糊聚类法;4)确定评价指标权重,方法有:a关键特征调查法,是先请被试者从所提供的备择指标中找出最关键、最有特征的指标,再对指标进行筛选并求出其权重的方法;b两两比较法,可对指标进行逐对进行比较计分,再除以所有指标得分之和;c专家评判平均法,分别请专家评判其权重,以专家评判结果的平均数作为各指标的权重;d倍数比较法,以每一级指标中重要性程度最小的指标为基础,然后将其他指标与其相比,作出重要性程度是他多少倍的判断,再经归一化处理,激活的各指标的权重;e :Q分类法,是一种确定指标优先顺序及其权重的方法;5)设计教育评价标准这是建立教育评价表的又一项重要工作,方法是:a分解教育评价表中指标包含的主要内容;b确定标度;c确定等级数量;第六章 教育测验的常模及其建立方法1.常模是指一个有代表性的样组在某种测验上的表现情况,或者说,是一个与被试同类的团体在相同的测验上得分的分布状况与结构模式2.测验常模的主要类型:可分为两类,一是发展常模,二是组内常模。发展常模有年级常模和年龄常模之别,组内常模有百分等级常模和标准分数常模两种。 1)年龄常模,有两种方法:取平均值作为指标、用一组题目作为指标;2)年级常模:就是不同年级学生在某种测验上的正常的一般的表现水平;3)百分等级常模,是一个地位量数,能够反映某个测验分数在一个次数据中的相对地位,它是把学生的原始分数放在该学生所在群体的成绩中进行比较,以确定该学生在群体中的相对地位之高低;4)标准分数常模,指出学生在团体中的相对地位、解释测验分数在组内的相对水平的一种方法。3.标准分数相关的几个公式: 1)教育与心理测验中的T分数:T=50+10Z 2)韦氏智力量表中葛粉测验的量表分:T=10+3Z 韦氏智力量表智商(离差智商):IQ=100+15Z 3)美国大学入学考试报告分数:CEEB=500+100Z第七章 教育测验的“标准”及其建立的方法1.标准参照测验的定性标准测验内容领域的规范:编写测验内容领域规范的几种不同的模式: 1)汉布莱顿模式:他认为内容领域规范可以分为四个部分:a说明对能力所包括的内容和行为做简明的描述;b实例指导与题目样本一个测验指导的例子和一个测验能力的典型例题;c内容范围一个对能力测量范围中的内容和行为的详细说明以及一个关于题库的结构和内容的详细说明;d答案范围必须预先准备好备择的不正确答案的说明 2)美国IOX模式:IOX是美国全国性教育目标交流所的简称,这种模式实际上是题目领域编写格式的变式包括四或五个部分:a一般描述,是对所测量的领域进行一般性的、简明扼要的描述;b样本题目,给出一个带有指导性与限制性的测验题目的具体例子,既有利于测验设计者了解题目的格式,也有利于被试了解题目的式样;c刺激的界定,是对题目的内容、素材、难度、广度等因素做出更为明确的规定,以便使测验的编写既不会被限死而僵化,也不会模糊不清而出乎意料;d反映的界定,是对被试如何作答题目的方式,包括正确答案与错误答案的区分标准等方面作出规定;e其他补充说明,有必要时,对界定测验的内容领域所涉及的行馆问题作出交代或补充说明。第八章 学生课业发展的测量与评价1.课业考评的主要作用:所谓课业考评是对学生的课程学业所取得的发展进步进行考核评价,对促进学生发展起着重要的作用,作用如下:首先,合理的课业考评制度为学生发展提供较明确的目标和努力的方向;其次,合理的课业考评制度将有助于评价学生的发展进步,从而对教与学双方活动起着重要的控制、调节和促进等作用;再次,课业考评为学生心理发展和学习进步创造必要的背景和空间,诱发学生的学习动机和自主发展的动力;最后,课业考评在中小学生个体社会化进程中起着控制、调节、促进和加速的作用。课业考评在学生发展中起着重要作用,而这种作用能否充分达到,取决于我们是否建立一套适应于不同教育阶段的课业考评制度与方法。2.课业考评中存在的问题:首先,课业考评指导思想与学校教育理念、目标不相适应,在考试设计及考试结果的使用过程中过分强调区分和选拔功能;其次,课业考评方法单一,把考试的教育功能简单化,考试的评定功能绝对化;再次,课业考评抽象化和表征化。3.评价学生课业发展的参照点体系:无论是相对评价还是绝对评价,要使其结构更有意义,就需要为学生课业发展评价寻找一个参照点,课业考评过程中常见的参照点的主要类型有个人发展参照、教育目标参照和教育常模参照三大类,其中每一类又可以分为若干不同的方法,这些方法有其不同的适用对象和范围。 1)个人发展参照法:在评价学生课业发展进步的过程中,为了不伤害儿童的自尊心以及为了尽量减少考试分数对师生双方教学带来的负面影响,教育人员对学生的课业发展进步采用个别化的评价,可以个人发展为参照,尽可能体现儿童的学习进步,参照个人发展进行课业评价时,常用的有下面三种方法:个人发展纵向参照、个人发展横向参照、个人潜力发展参照 2)教育目标参照法:学校教育教学有着较明确的教育目标,它是评价学生课业发展的参照点,可选择的方法有:专题内容领域参照、课程目标参照、素质教育阶段目标参照 3)教育常模参照法。就是具有代表性的学生团体在通常的教育环境下世纪所达到的成绩水平。可以采用年纪常模参照、年龄常模参照、百分等级常模参照、分等评定常模参照、标准分数常模参照等。4.表现性测验评价法:指的是客观测验以外的一类以行动、作品、表演、展示、操作、写作、制作档案资料等更真实的表现来展示学生口头表达力、文字表达力、思维思考力、随机应变力、想象力、创造力、实践能力及学习成果与过程的测验。表现性测验在学生课业考评过程中常用以下一些测验题型与方法:1)口头测验;2)论辩或辩论;3)短文题考试;4)写作测验;5)过程反应题;6)实验技能教学考试评价5.档案袋评价法:教师依据教学目标与计划,请学生持续一段时间主动收集、组织与省思学习成果的档案,以评定其努力、进步、成长情形的一种评价方法。用档案袋评价方法来了解学生的成长历程与发展进步,其思想方法源自于艺术家的作品档案袋。 1)档案袋的类型:用于班级学生评价的档案袋可分为三种:成果型档案袋、过程型档案袋的评价型档案袋;依据档案袋的内容结构性可进一步分成:结构型档案袋、半结构型档案袋和无结构型档案袋;就一般教学情境下运用的档案袋评价而言可分成:终结性评价、形成性评价、诊断性评价、最高行为评价、典型行为评价和个人独特性评价 2)优点:兼顾学习结果与历程;兼顾认知、情感、动作技能的整体目标;可以评估学生的元认知和反思能力;可以呈现多元资料,获得关于学生发展的更真实的表现和成果;可以用整合、动态、实作的方法激发学生的学习兴趣;可以培养学生主动积极、自我成长、自我评价、自我负责的精神及价值观;可以增进师生互动、同学沟通、合作精神等; 3)局限:档案袋评价的技术投入运作需要教师有较系统的教育评价理论修养,尤其对档案袋评价技术的基本了解和掌握,国内中小学教师从整体看,普遍缺乏这方面的专业素养;档案袋评价需要学生和教师付出比传统纸笔测验多的多的时间和精力,开展个体化的档案袋评价是行不通的;档案袋评价德州标准化与客观化程度较低,因而带来评价的信度和效度有时难以保证,所以只能是多元评价方法之一,不能取代其他评价技术;档案袋评价技术的运用,往往需要有一定的经费投入,这可能给学校经费预算以及学生家庭经济带来一定的困难。 4)为更好地发挥档案袋评价的优点,应注意以下原则:其一,档案袋评价必须与教学相结合;其二,档案袋评价应与其他评价方法并存使用;其三,档案袋评价应采取渐进式、引导式、循序渐进;气死,档案袋评价应实施多次、阶段性的反思与协助;其五,档案袋评价应顾及学生的承受力和可利用的资源。6.动态评价法:有两层含义:其一,是跨越多个时间点观察评估学生的进步与改变情形,了解学生动态认知的历程与认知能力变化的特点和潜能;其二,是评价者与被试者之间产生大量的互动,强调评价与教学相结合,实施个体化的诊断评价与教学补救。前者是教师连续运用“前测验教学介入后测验”的程序,后者则经过充分的沟通与互动,持续评价学生教学反映与学习历程,了解学生的教学前后认知能力的发展和改变,了解学生远近不同的学习迁移,进而提供促进学生最佳发展和改变的教学介入与教育干预。所以动态评价能够统整教学与评价、兼顾历程与结果,可以评估与预测学生最佳的发展水准,颇具现代教育理念。 1)动态评价的常用模式:坎佩恩布朗渐进提示评价模式,这一模式根据俄国著名心理学家维果茨基的社会发展认知理论,把其中有关学习与发展的观点、最近发展区、鹰架概念、社会中介概念等用于教学评价过程,他们认为,动态评价不仅可以测量与评价学生过去已有的知识、经验与技能,而且可以在渐进提示的学习过程中评估学生的成长、认知改变的可能和学习迁移的距离。这种模式以数学、阅读、逻辑推理、结构复杂问题解决的作业为题材,事先建构一套“从一般、抽象到特定、具体”的提示系统为鹰架结构,再采用“千测学习或训练迁移后测”四个阶段的基本程序来了解学生的学习、保留、迁移能力。在计分与评价方面通常最简单的方法是以提示量的多少来核算,提示量越多,表示学生能力越低下,反之,学生的学习能力越高。 2)坎佩恩布朗渐进提示评价模式的评价:优点是评分客观、易于实施与推广、精确评估迁移能力、强调与学科领域结合;缺点是此模式若用之于复杂度甚高的学科,会因解题与思考历程过于复杂与多元,以至于不易建立工作分析、认知分析与提示系统。 3)动态评价技术的变式:教师可根据教学与评价的实际,灵活的运用或创造出更简易性的互动评价技术,常见的包括临床晤谈、后设认知晤谈、放声思考、错误类型分析等方法。 4)动态评价技术的优点:兼重学习结果与学习历程、兼重回溯性评价与前瞻性评价、兼重认知潜能与学习迁移能力、兼重教学与评价的整合、兼重社会文化介入与个别差异、兼重静态与动态、兼重鉴定与诊断和处方、兼重师生双向沟通与互动关系。不仅适用于正常发展的学生,而且特别适用于学习障碍者。经由教学介入和引导,可扩增学习障碍儿童的认知发展领域,激发其潜在发展水准。 5)动态评价技术的缺点:动态评价专业性强、评价设计较难、不宜推广、实施个别化评价成本与费用较高、信度与效度常常证据不足、前侧的信息没能充分发掘与利用、中间的教学介入内容缺乏明确的理论依据等。 积极研究和引进动态评价很有必要,但不能用动态评价取代静态评价,也不能固守静态评价,对动态评价技术置之度外。第九章 学生智能发展的测量与评价一、根据智力的定义和结构谈对智力的认识:1.智力的定义:智力一词由于法国的比纳和英国的斯皮尔曼对智力测验所进行富有成效的研究而广泛流传并逐渐普及使用起来。具有代表性的观点有:1)智力是抽象思维的能力 ,比纳:智力是一种判断的能力、创造的能力、适应环境的能力,善于判断、善于理解、善于推理是智力的三要素;2)智力是适应能力或智力是学习的能力,这种观点认为,认为智力是适应环境的能力的人认为智力愈高的人适应新环境的能力愈强,桑代克:智力的本质就是适应,它使得个体与环境取得不断的平衡,而儿童对客观世界的认识发展便是在个体与环境相互作用中逐步逼近与完善化的。认为智力是学习的能力的人认为智力高的人能够学习较难的资料,学起来极容易又迅速,且成绩优良,“智力就是一种学习能力”;3)智力是多种能力的综合,是一种全面能力。韦克斯勒“智力是一个人有目的的行动、合理地思维和有效地处理其周围世界的全面能力”。斯达德“智力是从事艰难、复杂、抽象、敏捷和创造性活动以及集中精力保持情绪稳定的能力”2.智力的结构理论:智力结构理论是解释智力、开发智力、测量智力的思想基础。 1)斯皮尔曼的G因素说:他创设了一种称为四项差异的方法,并解释说不同测验之间之所以会有程度不同的相关,是由于完成作业或测验过程中需要一些共同的一般的能力因素,他成为一般因素G;一个测验之所以区别于另一个测验,并且呈现不完全相关,是因为完成作业过程中出了具备一般的能力因素外,还要有特定测验内容的能力因素,他称之为特殊因素S;所以他认为,人的能力有一般因素G和特殊因为S 两部分构成;一般因素G是笼统的综合的抽象能力,为完成所有测验等。因此,代表个人智力者,实际上指的是G因素。实际上,许多采用单一测度或单一IQ分数的智力测验通常都是测查斯皮尔曼这里的G因素。 2)桑代克的特殊因素说:桑代克是治理结构多因素论的先驱,他否认G因素的存在,他指出智力的因素是:抽象性智力,即有效地运用概念和符号的能力;社会性能力,即了解他人、与他人相处的能力;机械性能力,即处理具体事物或情境的能力;他认为智力具有层次(高度)、距离(广度)、敏捷(速度)三个维度,因此,智力测验应包含测量高度的、广度的和速度的三个方面。他早期设计的CAVD测验,其内容包括完成句子C、算数推理A、词汇V和领会指示D共四项。但是,他的智力测验没有包含社会性智力。 3)赛斯顿的群因素说:它采用因素分析法,根据56个测验和自建的相关系数矩阵,抽取出其中首要的独立性较强的公,因素,它们分别是:空间知觉因素S、计算因素N、言语理解因素V、词的流畅性因素W、记忆因素M、知觉速度P、推理因素R、根据上述七种能力他编成成套的“基本心理能力测验”,他认为,个体的这其中基本能力之间是相对自律的,但研究表明,他们之间存在着某种程度的正相关。 4)弗农的层次结构模型:该模型可以用逻辑树加以表示,他把斯皮尔曼的的G因素放在最高层;第二层是两大因素群,包括“,言语教育因素”和“空间机械因素”这两个第二层次的主因素又包括多种小因素群,他们便构成第三层次,例如“言语教育因素”又可进一步分解成语词流畅、数字能力等因素;“空间机械因素”可再分为机械知识、空间能力、动作协调等次级因素。每个第三层级德尔小因素按照弗农的观点有可再分为更小的特殊因素,它们构成层次结构模型结构中的第四层次。他的智力层次结构不仅可看成是对斯皮尔曼和赛斯两种智力结构观点的整合与协调,又可以认为是对斯皮尔曼二因素理论的巧妙发展。 5)吉尔福特的智力三维结构模型:美国心理学家SOI模型,他用操作、内容和产品三个变项构成立体式模型,用以描述智力结构。其中操作变项是指个体对于原始材料刺激物的处理方式,它包括认知、记忆、发散思维、辐合思维和评价五种。第二维度是内容它是指因其个体心智活动的各种刺激物,有图形的、符号的、语义的和行为的四种。第三个维度是活动的成果,即产品,它包括单元、门类、关系、系统、转换和含蓄六种。因而三个变项可组成4*5*6=120种较单独的智力因素,并分别用英文字母三位编码来表示。 6)卡特尔的流体智力和晶体智力理论:流体智力是洞察复杂关系的能力,在不同的环境和条件下都要显示出来的一般的普遍的能力;晶体智力是获得的知识与技能的有效结合之能力。前者更多的用在适应新环境的情形下,后者用于完成某种固定的任务。卡特尔认为流体智力更多地依赖与遗传,而晶体智力更多地依赖与环境的作用,流体智力要用类似于文化公平的测量工具来测量,晶体智力要靠语言测量。 7)加德纳的智力结构理论:他认为所谓智力就是人类在解决难题与创造产品的或城中所表现出来的,为一种或树种文化环境所珍视的哪些能力,包括八种智能:语言之力、数理逻辑智力、空间智力、身体动觉智力、音乐智力、人际智力、内省智力和自然智力。 8)斯滕伯格的成功智力理论:a“三重智力理论”:他认为无论是基于结构还是给予过程的单一智力理论都不能对智力进行清晰完整的描述,站在信息加工的倾向性立场,试图结合心里计量学和信息加工学派各自的长处并克服彼此的缺陷,注重并刻画一类心里操作的过程。提出了“三重智力理论”,包括成分亚理论、情境亚理论和经验亚理论,认为只有从智力活动发生的情境(外部世界)、主体智力行为的经验(联结内外世界的经验世界)和主体的内部心理加工(内部世界)三方面加以综合考察,对智力的把我才可能是可靠的;b“成功智力理论”:他认为成功智力就是用以达成人生中主要目标的智力,它能导致个体以目标为导向并采取相应的行动,这是对现实生活真正起到举足轻重影响的智力。包括分析性智力、创造性智力和实践性智力,这三方面构成一个有机的整体,只有在分析、创造和实践能力协调与平衡时才最有效。二、学生能力倾向发展: 1.能力倾向:是指一个人获得新的知识、能力和技能的内在潜力。具有相对广泛性、相对稳定性和潜在可能性。 2.能力倾向测验:是一种旨在预测未来成功可能性的一种测验,是一种关于个人潜能的探测性测验。 3.学习能力倾向测验:旨在测量一般的学习能力和潜能,即是否具备良好的学习与研究的潜在能力,而不是已经在学校中学到了多少知识。最典型的是美国的大学学习能力倾向测验SAT,其成绩是美国多数高校招生中作为入学的依据之一,在美国每年举行5次左右,以适应考生的需要,成为名符其实的全国性考试,是最有影响的一种大学入学考试,作为一种能力测验并为高校招生决策服务,既区别于平时的教育成就测验,又有别于一般的智力测验。首先,主要用来预测大学阶段的学习,而不是检查中学阶段课程学习情况;其次,特并没有依据特定的课程内容或教材,且把涉及到的知识内容和水平降低到绝大部分考生都熟悉的标准上;第三,它所测量的语言能力和数学能力主要是学生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论