教育测量评价重点(修改版)_第1页
教育测量评价重点(修改版)_第2页
教育测量评价重点(修改版)_第3页
教育测量评价重点(修改版)_第4页
教育测量评价重点(修改版)_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 第一章第一章 1 1 测量的基本要素 测量的基本要素 知道要素知道要素 1 合适的量具或制定科学测量方案 2 测量的参照点 是测量的起点 绝对参照点 以绝对的零点作为测量的起点 相对参照点 以人为确定的零点为参照点 零并不代表真正的无 3 测量的单位 确定的意义和相等的单位 2 2 教育测量概念 掌握 教育测量概念 掌握 就是针对学校教育影响下学生各方面的发展 侧重从量的规定 性上予以确定和描述的过程 3 3 教育测量的特点 点需要展开 教育测量的特点 点需要展开 间接性和推断性 测量对象的模糊性和测量误差的不可避免性 量表具有多样性 结果具有相对抽象性 4 4 教育评价概念 掌握 教育评价概念 掌握 教育评价是指按照一定的价值标准和教育目标 利用测量和非测量的种种方法系统地收集 资料信息 对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断 并为教育决策提供依据的过程 5 5 教育测量与教育评价关系 掌握关系 教育测量与教育评价关系 掌握关系 教育测量是教育评价的基础 而教育评价往往是教育测量过程的延续 是对测量结果的解 释与应用 并朝着价值判断与释放教育功能的方向拓展 P7 第二章第二章 1 1 按解释测量结果或评价结果时的参照点分类 按解释测量结果或评价结果时的参照点分类 常模参照概念 常模参照测量与评价是将被试水平与测验常模相比较 以评价被试在团 体中的相对地位的一种测量与评价类型 标准参照概念 标准参照测量与评价是将被试的表现与既定的教育目标或行为标准相比 较 以评价被试在多在大程度上达到该标准 潜力参照测量与评价是将被试实际水平与其自身潜在水平 潜力 相比较 以评论被试有 无充分发挥自身潜力为目的 了解 2 2 按测量与评价被试行为表现的性质分类 看到填空会填 看到选择会选 按测量与评价被试行为表现的性质分类 看到填空会填 看到选择会选 最佳行为测量与评价概念 最佳行为测量与评价是以测量被试的最佳行为表现为目的 典型行为测量与评价概念 最佳行为测量与评价目的不在于测量与评价被试能力的高低 而是测量与评价是否具备某种典型行为 比如人数多的用团体测验 哪一类属于最佳行为测验 智力测验 跨文化研究 非文字测验 3 3 按测量与评价在教学中运用的时机分类 分类 了解 按测量与评价在教学中运用的时机分类 分类 了解 形成性测量与评价是在教学过程中经常实施的 在性质上大致相当于现在的中小学单元 测验 形成性测量与评价的目和 对教师而言是藉此获得教学过程中连续性的反馈 作为随时修 正自己教学的参考 同时对学生的学习 也可提供反馈信息 学生根据反馈的结果获知自 己学习后的表现情况 从而肯定或修正自己以后的学习方式 2 诊断性测量与评价是对经常表现出学习困难的学生所做的测量与评价 它的目的是对个 人的问题行为及其原因进行诊断 诊断性测量与评价多半是在形成性测量与评价之后实施 终结性测量与评价是用于教学结束后 在性质上相当于现在学校中所举行的期末考试 4 4 按测量与评价的内容分类 按测量与评价的内容分类 1 智力测量与评价 智力测量与评价的目的在于测量被试的智力并对被试的智力发展水平和特点作出评 价 2 能力倾向测量与评价 能力测量与评价目的在于测量并评价个人的潜在的才能 预测个人的能力发展倾向 3 成就测量与评价 成就测量与评价目的在于测量并评价个人在接受教育或训练后的成就 4 人格测量与评价 人格测量与评价目的在于测量并评价被试的人格心理特征 5 5 教育测量与评价的其他分类 教育测量与评价的其他分类 1 按测量对象可分为个别教育测量与评价与团体教育测量与评价 2 按测量材料可分为文字教育测验与非文字教育测验 3 按量具的标准化程度可分为标准化测验与非标准化测验 6 6 教育测量功能 教育测量功能 P40P40 简单了解黑体字部分 简单了解黑体字部分 实现教育判断的功能 改进教师教学的功能 促进学生学习的功能 行使教育管理的功能 第三章 计算题第三章 计算题 P50P50 1 1 信度 信度是指测验结果的可靠性或一致性 亦即多次测验分数的稳定 一致程度 CTT X 观察分数 T E T 是真分数 E 是测量误差 T V I V 是与测量分数有关的误差 I 是系统误差 2 2 重测信度 概念掌握 会出计算题 重测信度 概念掌握 会出计算题 1 含义 用同一个量表对同一组被试施测两次所得结果的一致性程度 2 公式 3 使用前提条件 1 所测量的心理特质必须稳定 2 遗忘和练习的效果基本上相互抵消 3 两次施测的间隔内 被试在所测的心理特质方面没有获得更多的学习和训练 3 3 复本信度 复本信度 1 含义 两个平行的测验测量同一批被试所得结果的一致性程度 2 公式 3 使用前提条件 构造出两份或两份以上真正平行的测验 题目内容 测验结果 的平均值和标准差都相同 被试有条件接受两次测验 4 4 同质性信度 同质性信度 1 含义 测验内部所有题目间的一致性程度 3 2 公式 克龙巴赫系数 P52 分半信度的校正公式 r x y 2rhh 1 rhh 很重要 斯库公式斯 布通式 r n n n r 11 1 r 11 n 1 r 11 是长度已知测验的信度 r nn 是长度未知测验的信度 n 是倍数 当 n 增大 即测验长度增加时 测验的信度会增加 注意两点 1 新增项目必须与试卷中原有的项目同质 2 新增项目数量必须适度 例题 某一个测验有 10 个项目 信度是 0 60 问测验应增加多少项目 才能使信度达到 0 90 n 6 评分者信度概念要掌握 1 含义 多个评分者给同一批的答卷进行评分的一致性程度 2 公式 肯德耳和谐系数 P55 要掌握 5 5 效度概念 效度概念 效度越高表示该测验结果所能代表要测量行为的真实度越高 能够达到所要测量的 目的 心理测验的效度是衡量心理测验好坏的重要指标 效度是一次测量的有效程度 反映的是准确性 6 6 效度与信度的关系 效度与信度的关系 信度高是效度高的必要而非充分的条件 效度高 那么信度一定会高 测验的效度受它的信度制约 7 7 分类 分类 内容效度内容效度 结构效度结构效度 实证效度实证效度 内容效度内容效度是指一个测验实际测到的内容与所要测量的内容之间的吻合程度 包括欲 测的知识范围 以及该范围内各知识点所要求掌握的程度两个方面 1 内容效度主要应用于成就测验 2 内容效度也适合于某些用于选拔和分类的职业测验 内容效度不适合用于能力倾向测验和人格测验 此外 在使用内容效度时 要避免 与表面效度相混淆 其实 表面效度不能算是一种效度 它不反映测验实际测量的 东西 它是外行人结某个测验从表面上看好像是测某种心理特质的一种现象 一般 来说 最佳行为测验往往表面效度高 其他测验则希望表面效度低 结构效度结构效度是指一个测验实际测到所要测量的理论结构和特质的程度 或者说它是指测验 分数能够说明心理学理论的某种结构或特质的程度 结构效度的确定方法 提出理论假设 并把这一假设分解成一些细小的纲目 以解释被试在测验上的 表现 依据理论框架 推演出有关测验成绩的假设 用逻辑的和实证的方法来验证 假设 结构效度的估计可以有以下一些方法 1 测验内部寻找证据法 掌握 P61 2 测验之间寻找证据法 3 考察测验的实证效度法 不需要 4 多种特质 多种方法矩阵法 实证效度实证效度是指一个测验对处于特定情境中的个体的行为进行估计的有效性 包含同 时效度和预测效度 4 估计方法 P63 相关法 积矩相关 二列相关 2 区分法 3 命中率 4 显著差异法 8 8 难度计算公式 难度计算公式 P65 难度是指测验项目的难易程度 一 二分法记分项目的难度 1 通过率 以答对或通过该项目的人数的百分比来表示 P R N 2 极端分组法 27 P PH PL 2 二 非二分法记分项目的难度 P X Xmax X 为所有被试在该项目上的平均得分 Xmax 为该项目的满分 大体而言 难度为 0 50 时最理想 此时项目具有最大的鉴别力 各个项目的难度在 0 50 0 20 之间变化 9 9 区分度概念 了解 区分度概念 了解 公式看看公式看看 区分度 discrimination 是指测验项目对被试心理品质水平差异的区分能力或鉴 别能力 项目的区分度是测验是否有效的 指示器 二 区分度的计算 一 项目鉴别指数法 1 鉴别指数 D 的计算 D PH PL 取值范围 1 1 0 19 以下 差 必须淘汰 第四章第四章 1 1 客观性试题的类型 客观性试题的类型 判断题 选择题 匹配题 填空题 简答题 比如选择题属于 2 2 主观性试题的类型 主观性试题的类型 主观性试题主述题 作文题 操作题等 3 3 客观题优缺点 客观题优缺点 出题容易 应用范围广 适用于测量知识的掌握 理解应用分析几个层次的教学目标 答案明确 作答简便 因而可以在限定的时间内测验可以包含足够多的试题 能保证对 知识内容的覆盖 4 4 主观题优缺点 主观题优缺点 适用于较高层次的教学目标 尤其是适合于综合测量 评价等 鼓励被试积极地组织所 学资料 表达自己的观点 被试在作答时 耗费的时间较长 在限定的时间内 试题量数不可能太多 对知识的覆 5 盖面小 由于没有明确统一的目标答案 评分易受评阅着的主观因素影响 因而 误差较 大 5 5 设计测验的基本考虑 设计测验的基本考虑 P103P103 程序要知道 程序要知道 确定测验的目的 确定测验的属性 明确测验的性质和用途 明确测验的对象 分析测验的目标 6 6 设计测验的蓝图 设计测验的蓝图 确定测验内容要目 确定科目要考查的目标层次 确定测验内容要目下的权重 形成命题双向细目表 7 7 测验的编制与组织 测验的编制与组织 无论采取何种途径和方法收集测验材料 都必须注意以下几点 测验材料要适合测验目的 选择材料时必须依据测验的母的 以提高测验的正确性 选 材要具有代表性和广泛性 以全面性为准 测验材料要能够代表该科教材的全部内容 测验的内容愈广其效度愈高 但由于时间所 限 只能采用一部分教材内容作为测验材料 因此 这一部分材料必须是该教科材料全部 内容的一个良好的代表性样本 必须有足够的覆盖面 能突出基本内容和重点内容 各部 分材料的比重与测验蓝图设计的比重相吻合 测验材料要有普遍性 要以统一的课程标准或教学大纲和统编教材为选材依据 应该是 大多数至全部被试都已学过的内容 从而对全体被试具有公平性 8 8 试测与题目分析 试测与题目分析 试测时应注意以下几点 考点 试测时应注意以下几点 考点 试测对象应取自将来正式测验准备施用的群体 例如 对于一个学业成就测验 参加预 备测验的学生必须和以后正式施测的学生属于同一年级 并且具有相同的课程背景 虽然 试测人数不必太多 但取样应注意其代表性 试测应力求按正规的要求进行 使其与将来正式测验的情境一致 试测的实施 应使被试有足够完成作业的时间 以便搜集充分的反应资料使得统计分析 结果可靠 试测的实施 应使被试的反应情况随时加以记录 如一般的被试完成试测所花费的时间 题意有哪些不清之处 被试对哪些测验题目产生误解 长时间的停顿等 这些都要一一加 以记录 以便修改题目时参考 9 9 题目编排的两种方式 题目编排的两种方式 并列直进式 螺旋式 混合式 第五章第五章 1 1 订制教育评价表的基本原则 订制教育评价表的基本原则 书本上是 教育规律性和导向性原则 科学性和可操作性原则 超前性和发展性原则 PPT 是 1 科学性与导向性原则 2 完备性与独立性原则 3 发展性与整体性原则 6 4 操作性与可测性原则 5 可行性与可比性原则 6 超前性与持续性原则 2 2 教育评价表的构成要素 概念很重要 考名词解释 教育评价表的构成要素 概念很重要 考名词解释 评价指标 指标权重 评价标准 会考名词解释 评价指标 就是根据评价的目标 由评价指标的设计者分解出来的 能够反映评价对象 某方面本质特征的具体化 行为化的主要因素 它是对评价对象进行价值判断的依据 指标权重 就是表示每项评价指标在指标体系中所占的重要性程度 并赋予相应的值 这个数值就叫做对应指标的权数 评价标准 是针对每个评价指标的分类做出的具体规定 提出具体要求和说明 3 3 制定教育评价表的方法 制定教育评价表的方法 大点掌握 小点要知道懂得大点掌握 小点要知道懂得 1 确定教育评价的对象和目标 2 初拟评价指标 可采用头脑风暴法 因素分解 3 法 理论推演法和典型研究法等 3 筛选评价指标 多采用经验法 调查法 模糊聚类法等方法 4 确定评价指标权重 采用关键特征调查 两两比较法 专家评判平均法 倍数比较法 Q 分类法等 5 设计教育标准 6 修改与完善教育评价表 第六章第六章 1 1 常模 常模 常模指一个有代表性的样组在某种测验上的表现情况 或者说 是一个与被试同 类的团体在相同测验上得分的分布状况与结构模式 要具有代表性 2 2 常模团体 常模团体 是由具有某种共同特征的人所组成的一个群体或该群体的一个样本 3 3 确定常模团体的注意事项 确定常模团体的注意事项 了解 1 群体构成的界限必须明确 2 常模团体必须是所测群体的一个代表性样本 3 取样的过程必须明确且有详尽的描述 4 样本大小在适当 5 常模团体必须是近时 6 注意一般常模与特殊常模的结合 4 4 常模的类型 常模的类型 发展常模 包括年龄常模 年级常模 组内常模 包括百分等级常模和 标准分数常模 比率智商 智力年龄 实足年龄 智力商数 5 5 百分等级概念 考点 百分等级概念 考点 一个原始分数的百分等级是指在一个群体的测验分数中 得分 低于这个分数的人数的百分比 百分等级常模对于了解某一个体在其同类团体中的相对地位具有重要的作用 因此 在智 力发展评价和一些选拔性考试中 使用了百分等级常模 百分等级是一个地位量数 能够反映某个测验分数在一个次数分布中的相对地位 百分等级常模就是基于某个常模团体 为了某种测验的原始分数与百分等级之间建立起对 应关系的组内常模类型 百分等级建立方法 很重要 未归类数据 PR 归类数据 7 6 6 标准分数特点 标准分数特点 P138P138 只要看看只要看看 第七章第七章 1 1 标准参照测验分数含义 标准参照测验分数含义 标准参照测量与评价是将被试的表现与既定的教育目标或行为 标准相比较 以评价被试在多大程度上达到该标准 2 2 标准参照测验分数类型 了解 标准参照测验分数类型 了解 正确百分数 掌握分数 内容等级分数 测验的标准包括定性标准和定量标准 定性标准是指测验的内容领域规范 这是主要的 定量标准则概括地反映到切断分数点上 合格分数线是定量标准 第八章第八章 1 1 课业考评作用 很重要 课业考评作用 很重要 1 为学生发展提纲比较明确的目标和努力的方向 2 有助于评价学生的进步发展 从而对教与学起能够重要的控制 调节和促进作用 3 诱发学生的学习动机和自主发展的动力 4 在学生个体社会化过程中起控制 调节 促进和加速作用 2 2 课业考评存在的主要问题 课业考评存在的主要问题 课业考评思想与学校教育理念 目标不相适应 课业考评方法单一 课业考评抽象化和表征化 3 3 国外经验 看看 国外经验 看看 P171P171 4 4 课业考评改革的主要目标 看看 了解 课业考评改革的主要目标 看看 了解 要实现考试向发展性评价观转变 要努力实现从重视 掌握性结果 的评价转变到既重视 掌握性结果 又重视 发展性 结果 的评价 内容从认知领域转变到憨盖学习结果的更广泛的教育目标领域上来 要努力实现从表征性分数机制到实质性内容机制的转变 5 5 学生课业发展的主要内容 学生课业发展的主要内容

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论