




已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
课堂教学评价结果的解释 目前关于课堂教学评价结果解释类型的划分几乎没有专门的研究 但就课堂教 学评价结果的解释来说 在实际应用中常习惯性地将测验分为传统的标准化测 验和非标准化测验 非标准化测验即是前面章节提到的替代性评价测验 因此 在这里照应前面章节 对课堂教学评价结果的解释就从标准化测验和替代性评 价测验的角度进行阐述 一 课堂教学中标准化测验结果的解释 在课堂教学中 目前已经出现了一些非标准化的测验方式 替代性评价测验 但标准化测验仍然是主要的测验方式 应用仍然十分广泛 因此 仍有必要在 这里对课堂教学评价中标准化测验结果的解释进行介绍 一 标准化测验和标准化测验结果解释的概念 一 标准化测验和标准化测验结果解释的概念 标准化测验是指对一个既定小组内的所有成员在相同条件下以相同方式进行的 考试 美 G D Borich M L Tombari 中小学教育评价 242 页 北京 中国轻工业出版社 2004 具体到课堂教学 就是在相同条件下 以 相同的题目同时对所有学生进行测试 并以同一标准对学生在测试中的反应作 出评估的测验 可以看出 标准化 强调整个测验过程内在的 一致性 是个理想化的概念 事实上做到完全的一致是不可能的 如 每个学生的主观 状态在测验时就不一样 但在实际的测验中 在排除无关条件的情况下 测验 的各种因素是接近一致的 同时这种假定的一致性也为对标准化测验结果解释 时进行内部 外部比较提供了基础 下面就阐述什么是标准化测验结果的解释 对标准化测验评估时 一般是依据统一的标准对学生的反应进行评估 最后得 到一个分数 通常叫原始分数 一般来说 原始分数所能反映出的信息很少 要深入 全面地了解所测量的学生的实际情况 就要对这个 分数 进一步进 行阐释 因此 对标准化测验所得到的原始分数进行阐释的过程就是标准化测 验结果的解释 二 标准化测验与常模 二 标准化测验与常模 常模经常用于社会心理学领域 对其含义界定的说法很多 社会心理学研究者 在使用 常模 一词的时候 指的是统管小组成员行为的一组标准行为 美 G D Borich M L Tombari 中小学教育评价 241 页 242 页 北京 中国轻工业出版社 2004 在课堂教学评价领域 可以界定为作为样 本的小组成员在所要测量的特质上的标准的反应或行为 也就是说 常模代表 的是在某一个环境下所应该作出的反应 是评价其他对象在同样环境下的表现 时所依据的标准 如 在参加学校组织的大型活动时 学校规定应该穿什么衣 服 坐在什么位置 说普通话还是方言等 就可以看作是评价参加活动人员行 为的常模 前面阐述过 标准化测验突出的特点就是强调一致性 这就为参照常模来解释 标准化测验提供了理论上的可能 事实上 标准化测验通常都是参照常模来进 行解释的 虽然并不是所有参照常模进行解释的测验都是标准化测验 但大多 数标准化测验都是常模参照型的 美 查尔斯 杰克逊 了解心理测验过 程 64 页 北京 北京大学出版社 2000 有人甚至认为所有的标准 化测验都是常模参照测验 美 G D Borich M L Tombari 中小学教育 评价 241 页 242 页 北京 中国轻工业出版社 2004 参照常模解 释结果的测验 传统的课堂教学评价测验中都含有标准化测验的精神 在对测 验结果解释时 一般来说也都是参照常模来进行的 所以这里就重点从参照常 模解释的角度对标准化测验结果的解释作出阐述 三 标准化测验结果解释的方式 三 标准化测验结果解释的方式 目前 标准化测验的结果一般来说仍然是一个分数 就是前面所说的原始分数 对测验分数进行解释时 常模不同 对分数的含义所作的阐述也就不同 常见 的对标准化测验分数的解释有以下几种 1 以平均成绩为常模的解释 这是实际的课堂教学评价中最常见的解释方式 在实际的课堂教学评价中 在 对原始分数进行解释时 教师常常将单个学生的测验结果与团体的平均表现进 行比较来解释 即把所有参与考试学生的平均分数作为常模 将单个学生的考 试分数与总体平均分数加以比较 再对每个学生考试分数的含义进行阐述 如 下例 口语测验中 某学生得了 92 分 从这个原始分数我们并不能看出什么意义 因 为我们不知道其他学生的成绩怎样 没有参照标准 就不能说 92 分是个很高的 成绩 如果现在知道了这次口语测验的班级平均成绩为 80 分 那么教师就可以 作出这样的解释 该生的成绩在平均分之上 也就是说该生的口语水平在班级 里应该是中等以上水平 到目前为止 以整体平均成绩为常模对测验结果进行解释的方法仍常用于学业 成就的评价测验 但教师可以在实际中尝试着运用其他方面的评价测验 2 百分位 1 百分位及百分位对测验结果的解释 在现实生活中 当学生向家长汇报测 验成绩时 家长常常会问 有多少学生比你考得好 差 这就用到了另一 种测验结果的解释 百分位 又叫百分等级 即一种相对位置量数 通俗地 讲 百分位就是被试测验分数在团体中所占的位置 百分位数越大 位置就越 高 说明被试的水平就越好 应用到标准化课堂教学评价测验中 就某一个学 生来说 百分位数能反映出在一次测验中有多大比例学生的成绩比该生差 好 如下例 在一次问题解决能力测验中 50 名学生中有 40 人的测验成绩低于 45 分 占全 部人数的 80 因此 45 这个分数就可称为处于第 80 百分位的分数 凡是原 始分数为 45 者 其百分位数就是 80 如果有学生得了 45 分 则有 80 的学生 在这次测验中的成绩比该生差 在实际应用中 教师可以为了方便 使用自己编制的百分位分数常模 如每年 固定的学绩测验中 就可以编制百分位分数常模 百分位分数常模使用起来十 分方便 对照常模表 马上就可以确定学生成绩所对应的百分位 具体制定百 分位分数常模的方法 过程可以参考有关教育 心理测量书籍 表 7 1 美 查尔斯 杰克逊 了解心理测验过程 66 页 北京 北京大学出版社 2000 是一个学龄儿童百分位分数的假设样本 常模 从表中可以很容易 地看出与某一原始分数相对应的百分位分数 表表 7 7 1 1 百分位分数表 假设的范例 百分位分数表 假设的范例 百分位 原始分数 男孩 原始分数 女孩 原始分数 总体 99 63 分以上 73 分以上 66 分以上 95 58 62 分 62 69 分 60 65 分 90 85 80 1 5 分或 5 分以下 10 分或 10 分以下 8 分或 8 分以下 2 几个特殊的百分位 百分位数是连续的相对位置量数 在应用中 有几个 特殊的百分位数常常被用到 下面就对这几个特殊的百分位数进行逐一介绍 中数 中数就是在百分等级中处于中间点的百分位 即第 50 百分位 处于这 个位置的成员 有一半的人分数比他差 在课堂教学评价结果的解释中 中数 很少单独使用 也很少用来对某个学生的测验结果进行解释 一般是和四分位 数一起用于描述整个测验成绩的分布 下面就介绍四分位数 四分位数 第 25 百分位和第 75 百分位称为四分位数 四分位数的中间范围 是第 25 百分点与第 75 百分点之间的原始分之差异 常常与中数一起用于测量 分数的分布 如果中数所对应分数较高 四分位数之间段所对应的分数也普遍 较高而且分布比较均匀 那么就说明这次测验学生整体成绩较好 如一次测验 中的中数及四分位数之间段所对应的分数比历年同期同样测验所对应的分数高 那么就说明这次学生整体考得比较好 3 百分位的使用范围 在课堂教学评价结果的解释中 百分位对单个学生成 绩的解释意义并不十分大 但在需要对整体测验成绩作简单的描述时常常可以 用到 另外 百分位在描述整体分数分布时有广泛的使用范围 不仅能用于学 业测验 还可以用于非学业成就测验中问题解决的评价测验 情感态度评价测 验等 4 百分位的优缺点 优点 第一 计算简便 常模的制定不难 使用起来非常方便 对照常模表 马上就可以查到学生的百分位 第二 对原始分数的分布要求不高 即使学生 的成绩不是按照正态分布 也可以用百分位进行解释 缺点 第一 不容易作进一步的统计分析 要在百分位基础上对总体成绩作 进一步的分析 整理和描述很不容易 因为百分位不能用于四则运算 第二 用百分位解释原始分数时 只是给出了某一分数水平在总体中的位置 并未给 出关于分数的实际差异信息 如第 70 百分位和第 80 百分位的学生实际分数差 异是多少 在百分位分数常模表中很难看出 第三 从统计学上来讲 用百分 位解释原始分数 实际上是低估了总体分数中两极分数的差异而高估了中间段 分数的差异 就是说第 95 98 百分位和第 55 58 百分位之间同样都是差 3 个 百分位 但前者之间所对应的分数差异比后者所对应的分数差异大 3 标准分数 1 一般标准分数 标准分数是以测验分数的平均数为参照点 以标准差为单 位来衡量各原始分数在其常模团体中位置高低的一种评定量表 丁秀峰 心 理测量学 126 页 开封 河南大学出版社 2001 又常被叫做 Z 分数 在课堂教学评价结果的解释中 Z 分数的意义有以下几点 第一 由于标准分 数是以 0 平均数为参照点 教师根据 Z 分数的正负就可以判断某一原始分数在 总体分数中的大致位置 正值说明在平均数之上 负值在平均数之下 第二 可以通过 Z 分数来比较两个以上的测验分数 假如某学生语文成绩为 92 分 数学成绩为 85 分 教师不能说该学生的语文就 比数学学得好 因为有可能语文试题简单 整体分数都偏高 但通过 Z 分数 教师就可以直接用两个 Z 分数值来进行比较 Z 分数高者 在总体成绩中的位 置就高 可以说学得更好些 Z 分数应用广泛 教师可以尝试在学业成就 情感 态度各个方面的评价测验 中使用 Z 分数 具体使用时可以参考有关的测量书籍 2 转换的标准分数 在实际使用 Z 分数时 因为会有小数或负数出现 常常 显得很不方便 为了避免负数和小数 就制订了许多其他的标准分数 标准 分数系统 常见的有 T 分数 离差智商 标准九等 就课堂教学评价来讲 离 差智商的用处不大 本章就不再介绍 这里主要阐述 T 分数和标准九在课堂教 学评价中的应用 T 分数 T 分数最初由麦克尔 Michael 于 1922 年为纪念推孟和桑代克而提 出 表达式可写为 T a bZ 其中的 Z 即是上述的方法所计算出的可能会有小数 点或负数出现的标准分数 在课堂教学评价结果的解释中 T 分数除了具有 Z 分数的一般功能外 主要优 点是避免了负数和小数点 更加直观方便 如直接比较 T 分数的大小 就可以 确定相应原始分数在总体分数中的位置 十分明了 T 分数最初是被用于 12 岁儿童心理测验的常模团体 现在已经广泛用于其他常 模团体 这里作一个简单介绍 具体原理可以参见教育 心理测量类书籍 在 课堂教学评价结果解释方面 教师可以尝试运用于情感 态度 学业自我等各 个方面 标准九 标准九意思是说标准化九级分制 最初由美国选拔飞行员所用 分 数从 1 到 9 将整体分为九段 是标准分数系统中的一种 标准九在课堂教学评价中的应用与 T 分数相似 避免了小数和分数 可以用于 对分数的整体情况的解释 它的独特之处就是提供了一个一位数的分数系统 简单明了 使用起来也很方便 标准九原理也与 T 分数相似 最初用于选拔 课堂教学中 教师可以尝试用于 各种测验结果的解释 另外 有分数解释中提到标准十 其原理 用途与标准 九相似 3 标准分数与百分位的综合使用 如上所述 在解释标准化测验结果时 标 准分数更适合于对分数整体作出解释 百分位则更适于对单一分数的解释 因 此 在具体使用过程中教师可以将二者结合起来 列出对照表 如表 7 2 丁秀峰 心理测量学 132 页 开封 河南大学出版社 2001 表表 7 7 2 2 标准十与百分等级范围对应表标准十与百分等级范围对应表 标准十 分 10987654321 百分 99 10 0 94 9885 9370 8451 6932 5017 31 8 163 71 2 等级 范围 所占个 案 百分比 25915191915952 从表 7 2 中 教师就可以一目了然地看出某一百分位 百分等级 范围所对应 的标准分数和某一分数段所占的人数比例 既可以用于整体分数的描述 也可 以用于单一成绩的解释 使用起来非常方便 当然 在具体使用时 教师完全 可以依据需要制订百分位与标准分的对照表 并附上原始分数 具体的制订可 以参见教育 心理测量书籍 这里不再赘述 4 标准分数的优缺点 优点 第一 标准分数的差异与原始分的差异成比例 所以依据标准分数可 以描述原始分数的整体情况 而且 经过转换后的标准分数往往更加直观 明 了 使用起来也更方便 第二 因为标准分数是等距的 可以用来作四则运算 在对分数作进一步的统计处理时 得出的结果和原始分数一致 而且标准分数 更方便 很适合对数据作一些深层的处理 如用来计算平均数或相关系数等 缺点 第一 因为牵涉到统计知识 对于非专业人员理解上会有困难 对于 非专业人员来说 没有一定程度的统计学原理知识 理解标准分数很困难 这 也是在课堂教学评价中不常用标准分数直接向学生 家长等反馈的原因 第二 如果原始分数不是正态分布 不宜使用标准分数 如前所述 使用标准分数的 一个前提就是原始分数要呈正态分布 这是标准分数使用的必要条件 所以 尽管标准分数有不少优点 但如果不满足分数呈正态分布这一条件 也不宜使 用标准分数 4 其他分数系统 除了上面所述的几种参照常模的解释方法外 还有几种常用于解释学业评价测 验 或分数 的方法 1 年级当量 年级当量是把学生的测验成绩与各年级学生的平均成绩比较 看 它相当于几年级的水平 这里所说的各年级学生的平均成绩事实上指的是 年 级常模 各年级学生在测验中所得分数的平均数和分数的分布情况 也就 是说 首先制订某学科学业成绩在各个年级上的常模 然后将学生在该学科上 的测验成绩与年级常模比较 如果达到了某年级常模的平均成绩 就说明学生 具有相当于这一年级的学业水平 也就确定了年级当量 如下面的例子 对一个学生进行语文测验 其得分与常模上三年级的平均分数相同 那么 他 在语文测验上的年级当量就是 3 从上例可以看出 年级当量也是参照常模解释的测验分数 常用于解释学业测 验 使用起来十分方便 但与其他参照常模的解释不同的是 年级当量一般只 用于解释同一学科的测验 而且只有当几个年级同时开设某门课程 课程内容 的广度和深度是有系统地发生改变时 才适宜用年级当量来解释被试的测验分 数 不同学科之间是不能用年级当量来解释测验分数的 教师在使用时需要注 意这一点 2 教育年龄 教育年龄 educational age 是模仿智力年龄提出的 是指某 年龄学生的平均教育成就 与年级当量类似 拿一个学生的教育年龄与常模相 比较 就可以确定一个学生的教育年龄 另外 教育年龄并不涉及实际年龄 这可以用下面的例子来说明 一个学生的教育年龄是 9 岁 就是说这个学生的教育成就与一般 9 岁儿童的教 育成就相等 与他本身的实际年龄无关 在学业成就课堂教学评价结果的解释中 还常用到学科教育年龄 学科教育年 龄即按学科类别将教育年龄划分为语文年龄 数学年龄等 具体可以理解为对 某一学科 用标准化测验对同年龄学生团体施测后所得的平均成绩 教师在使 用时可以灵活掌握 四 对标准化测验结果进行解释时需要注意的问题 四 对标准化测验结果进行解释时需要注意的问题 1 选用恰当的常模 多数对标准化测验结果的解释都是参照常模的解释 选取或制订的常模不同 对测验分数的解释会有很大不同 如 用优秀学生常模来解释差生问题解决能 力的测验结果就肯定不行 所以选取适当的常模非常重要 在选取或制订常模 时 一般来说常模团体的代表性越强越好 容量大的更好 教师在选取或自己 制订时一定要注意这两点 否则会出现较大的误差 2 考虑测验本身的信度和效度 在对测验结果进行解释时 除了整个解释的过程要尽量科学严密外 还要考虑 一下测验本身的信度 效度 因为如果测验本身存在问题 即使测验结果的解 释非常客观科学 也会有误差出现 所以 教师在对测验结果进行解释时 尤 其是觉得有较大问题时 要适当考虑一下测验本身的信度和效度 3 从发展的角度考虑测验结果的解释 一般来说 标准化测验的结果都是一个分数 因为是参照常模解释 从某种意 义上说 分数对学生是一种终结性的评定 而对于学生的发展进步情况以及努 力情况却不容易反映出来 但这些对于学生以后的进步却是很重要的 所以 教师在对标准化测验结果进行解释时 要尽量去平衡这些不足 全面考虑 选 择恰当的用语 从发展的角度去解释测验分数 二 课堂教学中替代性评价测验结果的解释 前面阐述了课堂教学中标准化测验结果的解释 下面介绍非标准化测验结果的 解释 一 替代性评价测验和替代性评价测验结果解释的概念 一 替代性评价测验和替代性评价测验结果解释的概念 所谓替代性测验 是指除标准化测验外的所有课堂教学评价测验 这里也简称 为替代性测验 如表现性评价测验等 关于替代性评价测验的具体含义 特点 等 本书在 学业成就的替代性评价 一章有详细介绍 这里不再重复 只是 前面是针对学业成就的评价而阐述的 在这里把替代性评价测验的内涵扩大到 所有课堂教学评价测验 包括本书所涉及的所有非标准化的评价测验 替代性评价测验的结果一般是 一个分数 或者 一个等级附带一个分数 替代性评价测验结果的解释就是对测验后这个分数或等级 加分数 的解释 前面介绍过 替代性测验与标准化测验有很大不同 它强调个体差异 突出学 生主体性 不要求一致性 另外 除了试题测试外 替代性测验中更多的是任 务完成测验 学生在完成任务过程中会有不同程度的原创性反应 因此 替代 性评价测验中学生表现不一 多数测验任务没有固定答案 很显然 一般情况 下替代性测验的结果不适合参照常模来解释 所以在这里就介绍另外一种解释 测验结果的方法 参照 标准 的解释 很多人把参照 标准 解释的测验 叫做标准参照测验 二 替代性评价测验结果的解释 标准参照测验 二 替代性评价测验结果的解释 标准参照测验 1 什么是标准参照测验 标准参照测验是指在和一组规定明确的能力标准对比之下 对被试的测验成绩 作出解释而制订的测验 丁秀峰 心理测量学 133 页 开封 河南大 学出版社 2001 可以这样理解 在标准参照测验中 对测验评估的指标不 只有一个 而是有很多个 在每个指标上可以有一个分数 或等级 也可以 有多个衡量分数 或等级 以这样的评估标准来记分 解释的测验就是标准 参照测验 下面给出了一个例子 某教师在评估学生的手工设计时 选取了外型的新颖性 技术含量 做工精致 程度几个指标 在每个指标上 教师制订了三个等级并在每个等级上都赋予了 分数 外型新颖性方面 外型非常新颖 从没见到过 3 分 外型一般 在别 的基础上加工而来 2 分 外型普通 很常见 1 分 技术含量方面 技术 含量高 3 分 技术含量一般 2 分 没有什么技术含量 1 分 做工精致程度 做工非常精致 3 分 做工一般 2 分 做工较差 1 分 这就制订了一个系统 的评估标准 教师在对手工测验进行评价时 就依据这个标准来进行 从上面所给出的 标准参照测验 的例子中可以看出 对 手工设计 的评估 其实就是等级评定 事实上 实际应用替代性测验进行评估时 由于学生的反 应各异 不能够像常模参照那样对学生作出比较 很多都是界定一系列的指标 对学生的表现进行等级评定 其本质上就是参照 标准 的评估 这在前面 学业成就的替代性评价 一章有详细的陈述 所以也可以说在参照 标准 对替代性测验进行评估解释时 替代性测验就是标准参照测验 这里并不是说 替代性评价测验都是参照 标准 来解释的测验 也可以参照常模来解释 但 目前替代性测验的解释主要是参照 标准 来进行 所以本章主要从标准参照 测验的角度对替代性评价测验结果的解释进行介绍 需要补充的是 上述例子对 手工设计 的评估中 在每个等级上都赋予了一 个分值 这是较为常见的等级评定 在实际应用中 等级评定还可以有另外一 层含义 就是在每个指标上只给出一个最高分数如 10 分 但在具体进行评估时 教师可以根据学生表现 在这个分值范围内给学生打分 如 5 分或 8 分 这在 学业成就测验中很常见 如教师对论述题的打分 以上所述的只是两种赋予分 值的方式 虽有所不同 但实质上都是参照标准的评估 这里单独加以补充 以免教师在使用时局限于其中的一种 2 标准参照测验的特点 这里所说的标准参照测验结果解释的特点是相对于常模参照测验而言的 相对 常模参照的结果来说 标准参照测验的结果解释主要有以下两个特点 1 标准参照测验的目的 参照常模对测验进行解释一般是为了在全部被试之 间作出比较 从而判明被试在总体中的位置 而参照标准解释测验则是为了将 被试的成绩与既定的标准作比较 看看被试是否达到要求或达到了什么样的水 平 不在被试之间作比较 如 看看学生是否掌握了实验的操作技术 是否达 到了要求 并不需要在学生之间作出比较 这是二者根本的区别 并且由此导 致了其他方面的不同 2 标准参照测验的分数解释 常模参照测验主要使用百分等级 标准分数等 相对位置量数 并且一般不适合对分数作进一步的推断 而标准参照测验的分 数则不同 可以作一定的推断 如用大学生的入学成绩预测其在大学一年级的 成绩 其实这里所说的是 结果参照测验 分数解释的内容 如果需要 教师 可以查阅相关的测量书籍 三 标准参照测验结果的解释 分数线的确定 三 标准参照测验结果的解释 分数线的确定 1 合格分数线的确定 前面阐述过 对替代性评价测验结果解释的目的不是在学生之间进行比较 而 是看学生是否达到了要求或者是达到了什么样的水平 那么在实际应用中 要 衡量学生在测验中的水平是否达到要求或者达到了什么样的水平 最简单也比 较实用的方法就是确定一个合适的分数线 凡是达到这个分数线的 就说明该 学生在这个测验上合格了 达到了要求或基本达到了要求 如果低于这个分数 线 则说明学生还没有掌握应该掌握的知识和技能 没有达到基本要求 下面 就来看一下在不同测验中 怎样确定合格分数线 1 根据 双基度 确定合格分数线 双基指 基本知识 基本技能 具体 到课堂教学中 指的是学科的教学要求 具体地说就是在整个知识传授的过程 中 教师要着重 双基 内容的讲解和示范 学生要着重 双基 内容的掌握 凡是能体现 基本知识 基本技能 的教学内容都是学生要重点掌握的内容 那么反映到测验上 越能反映学科 双基 要求的试题或任务 就越能说明该 试题或任务就是特定学科最基本 最核心的知识要求 其 双基度 也就越高 从这里可以看出 双基度 和平时所说的试题难度没有必然的联系 难度高 的题目其 双基度 不一定高 难度低的题目其 双基度 也不一定低 所以 这里认为在考查学科内容掌握的测验中 根据 双基度 来确定合格分数线比 简单地按照 60 分来确定更合理 根据 双基度 确定合格分数线的原理和步骤 教师可以查阅相关的测量书籍 下面给出一个根据 双基度 确定合格分数线的例子 丁秀峰 心理测量学 141 页 开封 河南大学出版社 2001 以供参考 某市中学高三学生进行期末数学考试 有 40 个试题 前 35 题每题 2 分 后 5 题每题 6 分 经五位教师评估 各试题平均 双基度 指标如下 双基度 0 90 80 70 50 40 30 1 合计 题分值 2222266 题数 10107533240 则期末数学考试的合格分数线为 E 10 0 9 10 0 8 7 0 7 5 0 5 3 0 4 2 3 0 3 2 0 1 6 57 8 根据 双基度 确定测验的合格分数线常用于考查学科内容掌握的测验 也常 见于标准化测验 在实际使用时 教师不必拘泥于惯例 完全可以在替代性测 验以及非学科内容测验中尝试使用 2 据 任务难度 和需要测量的 能力目标 确定合格分数线 通过一个测 验 教师有时想要了解的是学生对特定内容的掌握程度或者某种能力上所达到 的水平 而不是特定内容的掌握与否 上面已经介绍了用 双基度 来确定学 科内容掌握与否的测验的合格分数线 而对于在某种能力上所达到的水平或特 定内容的掌握程度上 就可以根据测验所用任务的难度和所要测量的能力目标 两个维度来确定合格分数线 就课堂教学评价结果的解释来说 根据 任务难 度 和需要测量的 能力目标 确定合格分数线的意思是指 首先将一个测验 中的任务或试题按照所要考查的能力目标 认知目标 分类 然后将分类后的 试题按照难 中 易分组 最后由有经验的教师或专家估算出答对每类试题所 应达到的最低要求 从而得出该测验的合格分数线 具体的计算方法涉及矩阵 的计算 教师可以查阅有关书籍 与用 双基度 来确定合格分数线的方法比较 根据 任务难度 和要测量的 能力目标 确定合格分数线有以下优点 因为不涉及试题 或任务 之间所 占权重的比较 避免了用 双基度 来确定合格分数线中难度和双基度的矛盾 另外 一些难度大的题目一般包含较高教学要求和能力水平 在对学科知识的 掌握测验中 常常受到限制 而在根据 任务难度 和需要测量的 能力目标 确定合格分数线的方法中则不受这个限制 可以将注意力集中在学生能力水平 的考查上 因此 根据 任务难度 和需要测量的 能力目标 确定合格分数 线的方法 除了可以用于学科内容的掌握测验外 还适合用于要求学生构建原 创性反应的替代性评价测验 3 根据 效标 来确定合格分数线 这种方法主要用于那些作为 预测 用 的测验 效标 就是被预测的行为 根据 效标 来确定合格分数线就是根据 所要预测的行为的要求来确定合格分数线 用于预测的课堂教学评价测验 就 是说教师实施一个测验的目的不是了解学生对特定知识的掌握或某一能力的水 平 而是要通过这个测验来预测学生将来的某种行为表现 那么这个测验的合 格分数线就要由所预测的行为表现的要求来确定 下面用一个例子来说明 用期中模拟试题的成绩来预测学生的期末考试成绩 如果要求学生在期末考试 中要达到 90 分 那么在期中考试中就至少要达到 80 分 如果要在期末考试中 达到 70 分 期中成绩就要达到 60 分 上面的 期末考试成绩 就是一个效标 效标的要求高 那么测验的合格分数 线也就高 测验合格分数线是由效标的要求来决定的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中考科学试卷试题及答案
- 2025年法官遴选考试题及答案
- 2025年煤矿安全生产标准化考试试题及答案
- 2025年健康知识试题(附答案)
- 2025年公职人员考试时事政治考试题库(附解析答案)
- 民法知识点竞赛题及答案
- 2025版混凝土企业试验员上岗培训试题(含答案)
- 2025年标准保健品销售协议范例版B版
- 2025年海外医药项目提案报告模稿
- 2025年二级建造师实务模拟题答案
- 前端Vue3项目实战教程
- 2025年建筑水电安装工程师执业资格考试试题及答案解析
- 智算中心高性能计算系统设计方案
- 散装柴油管理制度
- 12S522混凝土模块式排水检查井图集
- 2025年茅台酒厂考试试题及答案
- (20250731)房屋市政工程基孔肯雅热、登革热防控检查(自查)表
- 生物性资产管理办法
- 体重控制健康宣教
- 2025年浙江省人事考试工作(4月26日事业单位笔试)笔试历年典型考题及考点剖析附带答案详解
- 机械加工工艺与工具知识测试试卷
评论
0/150
提交评论