第六章 物理教学测量与评价_第1页
第六章 物理教学测量与评价_第2页
第六章 物理教学测量与评价_第3页
第六章 物理教学测量与评价_第4页
第六章 物理教学测量与评价_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章物理教学测量与评价 物理教学测量与评价 是运用各种手段和统计方法对学生学习的成绩 教师完成教学目标的程度 给予数量或等级的描述 并做出科学的判断 它不仅具有检查教学效果 鉴定物理教学质量的功能 调整和改进教师的教学工作 控制和激发学生学习行为的功能 而且具有导向的功能 2000年4月8日1 本章主要内容 6 2常用的教学测量方法 6 3物理测量的编制 6 4数理统计的几个基本概念 6 5物理测量的评价 6 6物理课堂教学质量的评价 2000年4月8日2 6 1物理的概念和教学测量的特点 1 测量 测量就是根据一定的法则 用数字对事物的某种性质或程度加以确定 2 测量的基本要素 参照点 单位3 测量的种类 直接测量 用规定好的标准与被测量者进行比较 6 1物理的概念和教学测量的特点 2000年4月8日3 间接测量通过一定的规律进行运算或推理而得出结果 4 教学测量 对教学过程中教师和学生的行为表现进行测量 5 教学测量的特点 教学测量是一种间接测量 测量工具具有不可消除的系统误差 教学测量过程中存在许多偶然因素 因而具有不可避免的随机误差 2000年4月8日4 6 效度 反映测量准确性的重要指标 既反映不受系统误差干扰的程度 系统误差是指由测量取样本身造成的误差 7 信度 反映测量的可靠性的一个重要指标 表示可信程度 反映不受偶然随机误差干扰的程度 2000年4月8日5 6 2常用的教学测量方法 一 观察法 二 问卷法 三 测验法 2000年4月8日6 观察法 例如 用观察法测量学生个人的实验操作水平 可以设计一份 实验操作兴趣行为表现观察记录表 如图所示 在表现栏中1 10所对应的表现情况打 观察法是以观察学生的某种行为表现 如实地做好记录 由此判断学生达到某种等级水平的方法 2000年4月8日7 实验中学生表现行为1 无精打采 应付操作2 激动 兴奋 随意摸摸动动3 看别人操作 记录结果4 按规定步骤 方法操作5 遇到困难时 求助他人6 遇到困难时 自己想想 试试7 遇到困难时 放弃操作8 自愿地重复做一 二遍9 积极思考 寻找新问题10 自己想办法 提出改进操作方案 2000年4月8日8 问卷法 问卷法试通过书面提出问题 调查所要了解的情况 从而取得资料和数据 判断某种行为的等级水平 问卷法可以同时对很多学生进行 并且在较短时间内可以获得大量的资料和数据 与观察学生外部行为表现相配合 可以提高测量的准确性的可能性 例如 用问卷法测量学生实验操作兴趣水平 可以设计一份问卷调查表 如表6 2所示 2000年4月9日10 学生完成实验操作状况调查表表6 2学校名称 班级 姓名 2000年4月9日11 表中 完成情况 栏 填写下列情况之一 1 没有想过 也没有做过 2 想了想该怎么办 没有亲自动手做 3 没有做完 或没有做成功 4 做成功了 表中 在哪完成的 栏 没有做的不填 填写下列情况之一 1 在课内做的 2 在课外有组织地做的 3 完成作业时做的 4 课外自愿做的 表中 困难程度 栏 填写下列符号之一 1 容易 2 一般 3 比较难 4 很难 2000年4月9日12 测验法 测验法是通过选择具有代表性的一组试题对学生施测 然后根据解答结果评定分数确定等级水平的方法 测量对象的分类 学业成绩测验 智力测验 技能测验 创造力测验 测量功能分类 难度测验 速度测验 诊断性测验 形成性测验 终结性测验 测量参照标准不同分类 目标参照测验 常模参照测验 2000年4月9日13 目标参照测验的分数分布曲线呈正态分布 但最大百分数不一定与平均分数对应 可呈偏态分布 2000年4月9日14 常模参照测验 以学生团体的平均分为参照物 所谓常模 简单说 就是在一次测验中得到的平均水平 常模与目标不同 目标是教学目的 要求 是学生应该达到的程度 常模是学生们实际上达到的平均水平 人数 图6 2 2000年4月10日15 6 3物理测验得编制 一 确定测验矛盾和目标 二 确定试题得形式 三 制定编题计划 四 编选题目 五 集合成测验试卷 六 将测验科学化 标准化 2000年4月10日16 一 确定测验目的和目标 编制测验 必须明确测验的目的 试属于目标参照测验 还是常模参照测验 要确定测验内容的取样范围 还必须确定测验的行为目标 即测量目标 2000年4月10日17 制定测量的行为目标应满足的原则1 对应性测量目标应当与教学大纲中规定的教学要求相对应 制定测量目标应以教学大纲或考试大纲为依据 应满足其中的规定和要求 2 可测性各项测量目标都应当用形式行为予与说明和解释 并能根据它教学命题 2000年4月10日18 3 排它性测量目标可以多项 但各项之间必须有明确的界线 易于区分 4 可行性具体的测量目标 必须便于教师掌握 不仅要简易 切实可行 而且要满足有效和可靠这两个基本指标 物理测验的测量目标及其含义 见表6 3所示 2000年4月10日19 认知行为目标及其含义表6 3 2000年4月12日20 认知行为目标 了解 理解 简单应用 综合应用 含义 能正确回忆学过的知识 知道知识的要点或大意 反映记忆力和简单模仿 识别的能力 能初步领会所学知识 包括实验原理 的主要特征及条件 明确它的确切含义及其表述 反映观察能力 分析概括能力 和判断能力 嫩能够直接运用所学知识说明 解释现象 计算简单问题或解决实验中的技术问题 反映分析 解决问题的能力 能够从许多个别判断归纳出一般的规律 能够从已知的一般规律演绎出个别的规律 反映归纳推理和演绎推理的能力 能在涉及两类以上知识内容的复杂情境中分析和解决问题 反映综合分析能力和灵活运用本领 二 确定试题的形式 试题种类 客观型试题 主观型试题1 客观型试题 填空题特点 填空题通常以一句话 略去其中的用一些词语或数字 留出一处或几处空白 让学生把空白处填补起来 答到文章完整 用途 填空题属于再生式客观题 侧重于知识记忆的考查 也可以考察知识的理解和简单应用 2000年4月12日21 例如 利用单摆测定重力加速度的试验所根据的原理公式是 在该实验中需要直接测量的物理量是 有大小分别为4 9 11牛顿的三个共点力 它们的之间的夹角可以变化 则它们的合力的最大值是 牛顿 最小值是 牛顿 注意 编写填空题时 必须使学生明确和理解题意 空白不可太多 填空的词语 符号 数字等答案应尽量简单 且符合唯一性原则 2000年4月12日22 选择题特点 选择题通常是由一个问题与几个备选答案构成 让学生根据要求选择其中正确的一个或几个答案 用途 选择题属于再认式客观试题 适用于考查的理解和简单应用 2000年4月12日23 例如 如图6 3所示的电路 合上电键K后 A 电流表读数变大 电压表读数变大 B 电流表读数变小 电压表读数变小 C 电流表读数变小 电压表读数变大 D 电流表读数变大 电压表读数变小 答案 2000年4月12日 在6 4图所示的电路中 当合上电键K后 发现两个小灯泡 均标有 3V 1W 均不发亮 用电压表测得UAC Ubd 6V 如果各段导线及接线处均无问题 这说明 K A 灯泡L1的灯丝断了 B 灯泡L2的灯丝断了 C 可变电阻器的电阻是丝断 D 电键K未接通 答 2000年4月13日25 设计选择题时 在内容方面要求备选的答案应有似真性 逻辑性 在文字叙述方面要求避免有所暗示 总之 客观型试题的答案简短 评分客观 每题的内容单一 但题量可多 内容覆盖面广 有助于提高测验的信度和效度 主要缺点是学生对选择题可以任意猜测 特别是不能考察学生较高层次的能力 如学生的独立见解和创造力 以及综合性的灵活应用 2000年4月13日26 2 主观型试题在物理测验中常用的有推理论证题 综合应用题 含实验设计方面的设计题 计算题 这种题目的正确答案并不是唯一的 几种答案都可以是正确的 可见主观型试题的答案是由学生提供 学生可以表述自己的观点和创见 能考察学生较高层次的能力 其主要缺点是评分比较困难 带有主观性 从而影响测量的效度和信度 2000年4月13日27 一次完整的物理测验 应当包括以上几种形式这对全面考查学生的认知行为是有益的 试题的形式与其考查的认知行为 通常如表6 4所示 试题的形式 表6 4 考查的认知行为 填空题 选择题 推理论证题 设计性题 计算题 记忆 理解 简单应用 判断 理解 简单应用 理解 综合应用 理解 简单应用 综合应用 理解 简单应用 综合应用 2000年4月13日28 三 制定编题计划 1 取样范围 2 行为目标 3 试题形式和难易程度 2000年4月13日29 1 取样范围 它说明在什么知识内容范围内取样 2 行为目标 它说明考察什么认知行为为目标 2000年4月13日30 3 试题形式和难易程度 1 表示不同类型题的符号选择题 A 填空题 B 计算题 C 2 表示试题的难易程度符号难题 D 中等题 M 容易题 E 3 难 中 易的比例标准一般常模参照测验 2 5 3为宜 一般答标测验 1 5 2 5 6为宜 2000年4月13日31 2000年4月13日32 1 编选题目的数量 要答于所需题量的2 3倍具体题目可自编或从题库中选择 2 试用和估计难度 题目编制后 最好经过试用 至少要试做 除了按编题计划 双向细目表 进行分析外 还要对每题的难度进行估计 3 难度估计表示 如果估计能通过的认数占总人数的80 则难度可定为0 80 2000年4月14日33 四 编选题目 1 编题顺序要合理 要由易到难 减少被测者的精神压力 提高测验的可靠性 2 编制测验试卷 应有正题 副题 补考题等 几份试卷应等价 3 将经过试做和分析合格的题目按范围 项目 难度排队 并标上1 2 3 的顺序 4 将入选的题目分三份 分配如下表 2000年4月14日34 五 集合成测验试卷 一套好的题目 只是一次好的测验的一个先决条件 并不一定是一次合格的 良好的测验 必须要控制无关因素对测验目的的影响 这控制过程叫做科学化 标准化 要求是 1 在内容上 必须对受试者施测相同的或等价的题目 2000年4月14日35 六 将测验科学化 标准化 2 施测时 要求测验条件 物理环境相同 要有统一的时间限制 无论对被测者 还是监测者 必须要有统一的指导语 防止任何启发 提示的动作 3 评分上 尽量做到客观评分 排除主观因素的干扰 为此 要编出试题的标准答案或几种可能解答的参考答案 并标明评分标准 做好上面六项工作 就完成了无论测验的编制工作写成书面材料 编写说明书 交付使用 2000年4月14日36 6 4数理统计的几个基本概念 要客观地评价测验的质量 必须对测验本身 对测验所取得的数据进行统计 分析 数理统计所研究的问题就是如何搜集 整理 分析由实验或调查 或测验所得到的数字资料 以及根据这些资料所传递的信息进行科学推论 这是从事教育科学研究所不可缺少的一种工具 2000年4月16日37 本节的几个基本概念 1 分数分布表 2 平均数 3 差异量数 4 相关 2000年4月16日38 1 分数分布表 用途 用于直观的 形象的描述被测群体的平均水平和差异情况及分布特点 构成 对于一组大小不同的数据 先划分出区间 即等距离的组距 然后 将数据填入相当的组内 即出现一个简明的 形象的 直观的 表式 2000年4月16日39 例如 一次物理测验结果的分数分布表 分数区间 0 9 10 19 20 29 30 39 40 49 50 59 60 69 70 79 80 89 90 100 中值XC 人数f 占总人数的百分比 4 5 14 5 24 5 34 5 44 5 54 5 64 5 74 5 84 5 95 0 0 2 5 10 16 22 18 12 6 1 2 2 1 1 13 0 6 5 5 4 10 9 17 4 23 9 19 6 40 将分数分布表用图表示 41 2 平均数 平均数是用来描述被测团体水平的集中量数 设 被测人数为N 每人的成绩分数分别为X1 X2 X3 XN 则平均数为 42 如果被测的人数很多 即N很大时 可用分数分布表来计算平均数 方法如下 由n个分数段的中值充当各分数段中原分数的代表值 即以各分数段的中值来代表实际得 注意 只有当N 30时 这种统计观点才是可行的 若每组人数为f1 f2 f3 fn得 43 根据上表中所列的数据 可得知 44 3 差异量数 测量成绩有高有低 每个团体 或团体中每个人的得分一般是不同的 也就是说存在有差异 例如 有三个小组 每组有6个人 他们在一次测验中的成绩如下 A组 404050506060B组 203040607080C组 102040608090三个组的平均分都是50 即 2000年4月17日45 但是 三个组内得分的差异情况 或离散程度 是不同的 可见 只用平均数不能表示各种的差异情况 用来描述各组数据中差异情况 离散程度 的量数叫做差异量数 常用的差异量数有 1 全距全距表示一组数据中的最大数与最小数之差 用符号R表示 在上述的三个小组数据中 A组 B组 C组 46 这是表示差异的一种方式 其优点是计算简便 但由于中间数据未完全起作用 从而结论不能说明过多的问题 只能反映差异的大致情况 2 平均数每个变量 例如每个人的分数 与平均数的差 叫做离均差 用符号x表示 即各个变量的离均差的绝对值的平均值 叫做平均差 用符号AD表示 即 47 例如 在上述三个小组情况下 A组 B组 C组 48 3 标准差 计算平均差 由于需要取离均差的绝对值 因而不符合代数运算法则 为了便于运用统计分布计算 可先将各个离均差自乘以取消负号 在将各个离均差的平方取平均值 最后再开方 所得数值叫做标准差 用符号S表示 即 49 利用上式计算标准差 必须先求出平均数 如果直接利用原始分数计算也是可以的 将此式代到标准差S的定义式中 得到 50 利用标准差来表示差异情况 应用极为广泛 目前 有一种记分方法 以标准差为单位 表示一个分数在团体中所处位置的相对位置 叫做标准分数 用符号Z表示 也称为Z分数 即标准分数反映了一个学生的成绩在全体学生中所占的地位 标准分数可得正值 也可得负值 负值表示该学生的成绩在全班平均成绩以下 51 4 相关 二列变量之间的相互关系 叫做相关 如果一列变量变动时 另一列变量也发生变动 而且变动的方向相同 则这两列变量是正相关 例如 两次测验 组内成员得分情况如下 可见 两次测验成绩属于正相关 如果一列量变动时 另一列变量也发生变动 而且变动的方向相反 则着两列变量是负相关 52 例如 身体健康状况与发病率 就属于负相关 再如 如果两次物理测验的的成绩如下表所示 则这两次物理测验是负相关 它说明了测验结果的稳定性极差 它们不能反映学生的真实水平 因而测验是完全不可相信的 即信度极低 以上两个方面的例子 是属于两个极端情况 实际上 同一学科的两次测验 或任意两门学科的测验成绩 总是有相互关系的 只是相关的程度不同而已 53 两列变量X Y之间的相关程度 用相关系数r表示 相关系数的计算公式为式中 54 如果用原始分数来表示 上式亦可写成 55 例如 12学生的物理考试成绩和数学考试成绩如下表 求它们相关系数 根据相关公式 得这里 应当指出 相关系数的计算 N在数值一般也应在30以上 才有意义 下表举例只是为了说明计算方法 自然 N较大时 手工计算是很蘩锁的 可用计算机计算 56 57 6 5物理测验的评价 科学的评价考试质量 主要反映在四项指标上一 信度二 效度三 难度四 区分度 58 一 信度 1 定义信度是测验的可靠性指标 它反映测量的稳定性程度 具体地讲 是指两次测量关联的程度 2 信度的计算 1 将一次考试的卷纸 等值分成两半 相当于两次考试的卷纸 前一半的分数用X表示 后一半的分数用Y表示 2 根据相关系数r计算 59 3 信度公式Spearnan和Brown1901年同时发现的经验公式信度公式可以写为 4 影响信度的主要因素 评分的随意性 题量 即提目的数量 在教育测量学中叫做测量的长度 rxx的数值就是信度的数值 信度值在0 8以上为基本合格 60 看来 要克服评分的随意性 就要尽量排除主观随机因素 再是适当地增加作题地数量 如果测验的题目较少 信度降低 那么应增加多少题量才能达到要求的信度呢 设增加后的总题量与原题量的比值为K 则有例如某次测验的信度值为0 64 要达到0 80如果原题数为12个题 则应增加到27个题 61 二 效度 1 定义效度是测验的准确性指标 一般来说 主要分析内容效度 2 效度的分析根据双向细目表进行分析 试卷内容的覆盖面任何 各级行为目标所占分数比例是否恰当 各个题目的内容是否合理 是否与要求相符 62 三 难度 1 定义难度是指每个试题的难易程度 2 选择题难度值的计算 对于选择题来说 以测者答对 或通过 某个题目的人数与总人数的比值 作为该题目的难度数值 设N为被测的总人数 R为答对 通过 的人数 则难度为 1 63 1 2 这里应当指出 P值越大 说明难度越小 为了与习惯上统一 也可以用另一种表示 设难度为H 定义为 2 这样定义以后 H值越大 难度就越大 3 一般非选择型题目的难度计算可用某个题目所得的平均分数与该题满分的比值 来计算难度的数值 即 或 64 一般说来 难度H值在0 3 0 7为宜 H值在0 7 0 9范围内为较难 在0 3 0 1范围内为较易 所以常模参考测验题目的难度平均值 应在0 5左右为宜 四 区分度 1 定义区分度是指每个试题对考生的水平 或能力 区分开来的程度 区分能力越大 区分度越高 2 计算区分度的方法特征曲线法 相关法 鉴别指数法3 区分度的计算公式将被测者的试卷 按总成绩的高低依次排列 取出27 高分的试卷 作

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论