




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第八章中学数学教育测量和评价第八章中学数学教育测量和评价 v8.1 教育测量和评价的一般概念教育测量和评价的一般概念 v8.2 中学数学考试命题中学数学考试命题 v8.3 数学标准化考试数学标准化考试 v8.4 评价试题质量的主要指标评价试题质量的主要指标 v8.5 中学数学教育的评价中学数学教育的评价 8.1 8.1 教育测量和评价的一般概念教育测量和评价的一般概念 l一、教育测量和评价的涵义一、教育测量和评价的涵义 l教育测量,是指把教育行为与事先设计的标教育测量,是指把教育行为与事先设计的标 准行为进行系统化比较,然后赋以数值的整准行为进行系统化比较,然后赋以数值的整 个过程。个过程。
2、l教育评价,是指运用系统的方法或教育行为教育评价,是指运用系统的方法或教育行为 的价值、效果做出科学判断的过程。的价值、效果做出科学判断的过程。 中学数学的教育测量,中学数学的教育测量,就是把中学数学就是把中学数学 的教育行为与事先设计的标准行为进行的教育行为与事先设计的标准行为进行 系统化比较,然后赋以数值的整个过程系统化比较,然后赋以数值的整个过程 。中学数学的教育评价中学数学的教育评价,就是运用系统,就是运用系统 的方法对中学数学的教育活动或教育行的方法对中学数学的教育活动或教育行 为的价值、效果作出科学判断的全过程为的价值、效果作出科学判断的全过程 。 l二、教育测量与和评价的由来与发
3、展二、教育测量与和评价的由来与发展 国外教育界都认为:教学测试评价,实起源于国外教育界都认为:教学测试评价,实起源于 魏国古代的科举制度魏国古代的科举制度,只是由于我国长期封建,只是由于我国长期封建 制度的束缚,未能使这门学科得到应有的发展制度的束缚,未能使这门学科得到应有的发展 。 “教育测量教育测量”这一名词,最早是由美国心理学这一名词,最早是由美国心理学 家家桑代克桑代克在在19041904年所著的年所著的心理与社会测量学心理与社会测量学 导论导论一书中提出来的。一书中提出来的。 l三、深入研究教育测试与评价的意义三、深入研究教育测试与评价的意义 深入开展中学数学教育测量和评价的学习研究
4、,这既是深入开展中学数学教育测量和评价的学习研究,这既是 科学、合理、准确地评定学习成绩的需要,也是教育过科学、合理、准确地评定学习成绩的需要,也是教育过 程本身的迫切需要。因为它能提供正确的反馈信息,有程本身的迫切需要。因为它能提供正确的反馈信息,有 利于教师针对性地改进教学,有利于学生改进学习方法利于教师针对性地改进教学,有利于学生改进学习方法 ;同时,它还能为教育行政部门、修订课程与教材、调;同时,它还能为教育行政部门、修订课程与教材、调 整教学要求等提供决策依据。因此,学习和研究中学数整教学要求等提供决策依据。因此,学习和研究中学数 学教育测试和评价的有关知识,使中学数学教育测试和学教
5、育测试和评价的有关知识,使中学数学教育测试和 评价科学化、现代化,对当前指导中学数学教学实践,评价科学化、现代化,对当前指导中学数学教学实践, 推动中学数学教学改革,加速数学教育科学的建设,提推动中学数学教学改革,加速数学教育科学的建设,提 高中学数学教学的质量,培养和选拔人才,都有十分重高中学数学教学的质量,培养和选拔人才,都有十分重 要的意义。要的意义。 8.2 8.2 中学数学考试命题中学数学考试命题 中学数学的成绩考核主要有中学数学的成绩考核主要有考查考查与与考试考试两种基两种基 本类型。考查是通过课堂提问、板演、检查书本类型。考查是通过课堂提问、板演、检查书 面作业以及单元测验,及时
6、了解学生的学习情面作业以及单元测验,及时了解学生的学习情 况,从而决定教学的起点与进度、教学内容的况,从而决定教学的起点与进度、教学内容的 深度与广度。考试包括期中考试、期末考试和深度与广度。考试包括期中考试、期末考试和 毕业考试,是对学生学习情况全面、总结性的毕业考试,是对学生学习情况全面、总结性的 检查,是评定学生学习成绩的主要依据。检查,是评定学生学习成绩的主要依据。 考试可分为口试、笔试、实践操作三种,笔试考试可分为口试、笔试、实践操作三种,笔试 又可分为开卷与闭卷考试两种方式又可分为开卷与闭卷考试两种方式 一、中学数学试题的类型一、中学数学试题的类型 1 1、客观型试题、客观型试题
7、是指正确答案唯一,不论由谁评卷都只能给出同一是指正确答案唯一,不论由谁评卷都只能给出同一 个分数的试题。包括是非题、选择题、填空题、配个分数的试题。包括是非题、选择题、填空题、配 对题、分类题等。这类试题拟定也比较方便,但有对题、分类题等。这类试题拟定也比较方便,但有 的往往仅能测量机械性记忆的知识,有的又往往会的往往仅能测量机械性记忆的知识,有的又往往会 出现某种暗示,不够客观。其中选择题发展成为标出现某种暗示,不够客观。其中选择题发展成为标 准化试题准化试题, ,它具有容量大、覆盖面广、评分统一、客它具有容量大、覆盖面广、评分统一、客 观、标准的优点。但命题需要有一定的技术,不易观、标准的
8、优点。但命题需要有一定的技术,不易 测量学生完整的推理论证能力、知识的综合运用能测量学生完整的推理论证能力、知识的综合运用能 力,以及良好的文字表达能力等。力,以及良好的文字表达能力等。 2 2、主观型试题、主观型试题 是指正确答案可用多种方式表述,评卷教师凭是指正确答案可用多种方式表述,评卷教师凭 主观经验给分的试题。包括问答题、改错题、主观经验给分的试题。包括问答题、改错题、 计算题、应用题、作图题、证明题、阅读题等计算题、应用题、作图题、证明题、阅读题等 。 一、中学数学试题的类型一、中学数学试题的类型 二、数学命题的步骤二、数学命题的步骤 v2 2、明确考试的具体要求明确考试的具体要求
9、 不同学科、不同年级、不同类型学校以及不同的班不同学科、不同年级、不同类型学校以及不同的班 级等都有不同的教学要求。只有明确考试的具体要级等都有不同的教学要求。只有明确考试的具体要 求,命题才能有所依据。求,命题才能有所依据。 v1 1、确定考试的目的确定考试的目的 通常在教学开始阶段仃预测性测验通常在教学开始阶段仃预测性测验( (即摸底测验即摸底测验) ), 在教学期间有形成性测验和诊断性测验(即单元测在教学期间有形成性测验和诊断性测验(即单元测 验或阶段测验验或阶段测验) ),在结束阶段有总结性测验,在结束阶段有总结性测验( (即期中即期中 测验、毕业测试测验、毕业测试) )等不同类型的考
10、试,其目的各异,等不同类型的考试,其目的各异, 命题的方式和要求也不相同。命题的方式和要求也不相同。 二、数学命题的步骤二、数学命题的步骤 v3 3、编制命题计划表编制命题计划表 根据考试的目的与要求所编制的命题计划表。是根据考试的目的与要求所编制的命题计划表。是 设计试卷的蓝图。通常是一张双向细目表,指出设计试卷的蓝图。通常是一张双向细目表,指出 试卷所要测试的知识与能力,以及它们各自在整试卷所要测试的知识与能力,以及它们各自在整 个测试中所占的比例,所采用的题型、题量等。个测试中所占的比例,所采用的题型、题量等。 所谓知识,就是指某一学科所要测试的知识点;所谓知识,就是指某一学科所要测试的
11、知识点; 所谓能力,就是指通过教学在认知行为上所要达所谓能力,就是指通过教学在认知行为上所要达 到的目的。只有将命题计划编制得尽可能全面、到的目的。只有将命题计划编制得尽可能全面、 周到、准确,才能编制出一份好的试卷。周到、准确,才能编制出一份好的试卷。 二、数学命题的步骤二、数学命题的步骤 4 4、具体拟定试题具体拟定试题 拟定试题的依据是命题计划表以及命题的原则与标准拟定试题的依据是命题计划表以及命题的原则与标准 、拟题前要做好资料搜集工作,使资料尽可能齐全,、拟题前要做好资料搜集工作,使资料尽可能齐全, 尽可能具有普遍性,编拟时并要注意以下几点:尽可能具有普遍性,编拟时并要注意以下几点:
12、 (1)(1)试题的内容范围要与事先编制的双向细目表一致;试题的内容范围要与事先编制的双向细目表一致; (2)(2)题目的数量要比所需的试题多,以便进行筛选;题目的数量要比所需的试题多,以便进行筛选; (3)(3)难度、区分度必须符合考试的需要;难度、区分度必须符合考试的需要; (4)(4)试题排列必须先易后难,有一定的梯度;试题排列必须先易后难,有一定的梯度; (5)(5)题目的说明必须清楚明白,简明扼要,不致引起学题目的说明必须清楚明白,简明扼要,不致引起学 生理解上的误会。生理解上的误会。 二、数学命题的步骤二、数学命题的步骤 5 5、 编制标准答案,给出评分标准编制标准答案,给出评分标
13、准 试题拟定后,教师必须亲自进行试答,对考生试题拟定后,教师必须亲自进行试答,对考生 答卷的时间、速度,答卷十所出现的困难以及答卷的时间、速度,答卷十所出现的困难以及 多种解法等作出较准确的估计,并根据具体情多种解法等作出较准确的估计,并根据具体情 况作必要的调整,在此基础上再给出标准答案况作必要的调整,在此基础上再给出标准答案 和评分标准。以上工作应与拟题一并完成,以和评分标准。以上工作应与拟题一并完成,以 防止今后评分时过多地渗入人为的因素,从而防止今后评分时过多地渗入人为的因素,从而 影响考试的信度。影响考试的信度。 8.2 8.2 中学数学考试命题中学数学考试命题 v1、准确性原则准确
14、性原则 三方面含义:题目的叙述必须清楚、准确,不能模三方面含义:题目的叙述必须清楚、准确,不能模 棱两可;题中所涉及的过年或记号必须是教材中已棱两可;题中所涉及的过年或记号必须是教材中已 被定义的或已被规定的,如需使用教材以外的过年、被定义的或已被规定的,如需使用教材以外的过年、 记号,必须在题目中加以阐明;题中的已知数据和记号,必须在题目中加以阐明;题中的已知数据和 结论数据必须合乎实际情形,不能脱离实际故弄玄结论数据必须合乎实际情形,不能脱离实际故弄玄 虚。虚。 三、中学数学命题的原则三、中学数学命题的原则 三、中学数学命题的原则三、中学数学命题的原则 v2、相容性原则相容性原则 指题目中
15、的条件与条件之间不能互相矛盾,条件与指题目中的条件与条件之间不能互相矛盾,条件与 结论之间不能互相矛盾,条件与定义、公理、定理结论之间不能互相矛盾,条件与定义、公理、定理 之间不能互相矛盾。之间不能互相矛盾。 v3 3、完备性原则完备性原则 指题目中的条件必须充分,在给定的知识范围内足指题目中的条件必须充分,在给定的知识范围内足 以保证结论成立或问题可解。以保证结论成立或问题可解。 v4 4、独立性原则、独立性原则 指题目中的条件不能互相推出,也不能含有多余的条指题目中的条件不能互相推出,也不能含有多余的条 件。件。 四、学数学命题的方法四、学数学命题的方法 1 1、根据系统的基本量设计数学题
16、、根据系统的基本量设计数学题 2 2、利用演绎推理设计数学题、利用演绎推理设计数学题 3 3、通过改造成题设计数学题、通过改造成题设计数学题 (1 1)等价变形)等价变形 (2 2)正逆变形)正逆变形 (3 3)纵向变形)纵向变形 (4 4)横向变形)横向变形 4 4、利用合情推理设计数学题、利用合情推理设计数学题 8.3 8.3 数学标准化考试数学标准化考试 v一、命题标准化一、命题标准化 v二、测试标准化二、测试标准化 v三、评分设计标准化三、评分设计标准化 v四、分数解释标准化四、分数解释标准化 8.4 8.4 评价试题质量的主要指标评价试题质量的主要指标 v1、试题试题的难度的难度 v
17、(1)二分法记分二分法记分的试题(记分只有的试题(记分只有“对对”和和“错错” 两种情况)的难度计算公式:两种情况)的难度计算公式: 一、难度一、难度 难度是反映试题或试卷难易程度的指标。难度是反映试题或试卷难易程度的指标。 %100 N n p 式中表示难度,为全体考生数,为答对该题的考生数式中表示难度,为全体考生数,为答对该题的考生数 。 8.4 8.4 评价试题质量的主要指标评价试题质量的主要指标 (2)非二分法记分非二分法记分的试题的试题 %100 x x p 式中表示难度,表示该试题的满分分数,式中表示难度,表示该试题的满分分数, 表示全表示全 体考生解答该题所得的平均分。体考生解答
18、该题所得的平均分。 x 这里定义的试题难度,实际上就是试题的答对率。也这里定义的试题难度,实际上就是试题的答对率。也 就是说,难度的值越大,表明试题越容易;的值越小就是说,难度的值越大,表明试题越容易;的值越小 ,表明试题越难。,表明试题越难。 8.4 8.4 评价试题质量的主要指标评价试题质量的主要指标 v2、试卷试卷的难度的难度 将每一试题的局部难度组将每一试题的局部难度组 合起来就得到试卷的整体难度。试卷的整体合起来就得到试卷的整体难度。试卷的整体 难度可用试题的平均难度来近似表示。教学难度可用试题的平均难度来近似表示。教学 经验和心理学实验表明,难度适当的试卷,经验和心理学实验表明,难
19、度适当的试卷, 其成绩分布应当近似正态分布,即高分和低其成绩分布应当近似正态分布,即高分和低 分的人数比较少,考中等分数的人是大多数。分的人数比较少,考中等分数的人是大多数。 v 难度的选取与考试的目的密切相关。一般难度的选取与考试的目的密切相关。一般 说来,用于教学检查性考试的试题,难度不说来,用于教学检查性考试的试题,难度不 宜过大,以宜过大,以0.6-0.8为宜;用于选拔性考试的为宜;用于选拔性考试的 试题,以试题,以0.4-0.6为好。为好。 8.4 8.4 评价试题质量的主要指标评价试题质量的主要指标 v二、区分度二、区分度 区分度区分度是反映试题对于一组学生实际学习水平的区分是反映
20、试题对于一组学生实际学习水平的区分 能力的指标。描述区分度的常用方法有相关系数法和能力的指标。描述区分度的常用方法有相关系数法和 两端分组法。两端分组法。 1 1、相关系数法相关系数法 适用于二分法记分试题,即每一题均以答对或答错表适用于二分法记分试题,即每一题均以答对或答错表 示,而效标是连续变数的情况,其计算公式是示,而效标是连续变数的情况,其计算公式是 pq S xx r qp pq 式中代表相关系数,式中代表相关系数, 与与 分别代分别代 表答对和答错的受试者在效标上的平均表答对和答错的受试者在效标上的平均 得分,与分别代表答对和答错某一题的得分,与分别代表答对和答错某一题的 人数与受
21、试者总数之比,人数与受试者总数之比,S S代表全部受试代表全部受试 者在在效标上得分的标准差。者在在效标上得分的标准差。 pxqx 二、区分度二、区分度 三、信度三、信度 信度是反映考试结果稳定性和可靠性的指标。它包含信度是反映考试结果稳定性和可靠性的指标。它包含 两层意思:当我们用同样的方式进行重复测验时,能两层意思:当我们用同样的方式进行重复测验时,能 否得到相同的结果,保持测量的稳定性;能否减少随否得到相同的结果,保持测量的稳定性;能否减少随 机误差的影响,以保持测量的精确性。在实用上,信机误差的影响,以保持测量的精确性。在实用上,信 度可定义为同一批考生在同一种测验前后两次测量分度可定
22、义为同一批考生在同一种测验前后两次测量分 数的相关系数,或一次测验奇偶题组的相关系数。即数的相关系数,或一次测验奇偶题组的相关系数。即 2 2、两端分组法两端分组法 两端分组法应用比较普遍,计算也较方便,其计算公两端分组法应用比较普遍,计算也较方便,其计算公 式是式是D=PH-PLD=PH-PL, 2222 )(.)( iiii jiji yynxxn yxyxn r 式中为第个考生第一次测验的实得分数;为第个考生第二次式中为第个考生第一次测验的实得分数;为第个考生第二次 测验的实得分数,为考生总数。测验的实得分数,为考生总数。 最常用的计算信度方法是:将一次考试的试题由难到易排列,最常用的计
23、算信度方法是:将一次考试的试题由难到易排列, 按序号为奇数或偶数分成两半,应用上述公式按序号为奇数或偶数分成两半,应用上述公式, ,计算考生在两半计算考生在两半 试题中所得分数的相关系数,称为半信度系数,则整个试卷的信试题中所得分数的相关系数,称为半信度系数,则整个试卷的信 度计算公式是,度计算公式是, ,其中是两半分数的相关系数(半信度系数),其中是两半分数的相关系数(半信度系数) ,是整个试卷的信度系数。,是整个试卷的信度系数。 一般要求信度在一般要求信度在0.9 0.9 以上。在控制试题的难度和区分度的条件以上。在控制试题的难度和区分度的条件 下,如能注意适当增加题目数量,扩大试题的覆盖
24、面,尽量消下,如能注意适当增加题目数量,扩大试题的覆盖面,尽量消 除考试中的干扰因素,严格掌握评分标准等,就可能提高测验除考试中的干扰因素,严格掌握评分标准等,就可能提高测验 的信度。的信度。 v四、效度四、效度 效度是反映一次考试能否达到需要测量的功能程度的指标。它效度是反映一次考试能否达到需要测量的功能程度的指标。它 体现了考试的准确程度,包括两层意思:一是效度具有特殊性,体现了考试的准确程度,包括两层意思:一是效度具有特殊性, 即任何一种测量只对某种特殊目的有效;二是效度具有相对性,即任何一种测量只对某种特殊目的有效;二是效度具有相对性, 即任何一种测量仅是对要测量的特性作间接的判断,只
25、能达到某即任何一种测量仅是对要测量的特性作间接的判断,只能达到某 种程度的准确性。实用上,效度可以定义为考试成绩与效资料(种程度的准确性。实用上,效度可以定义为考试成绩与效资料( 例如考生以前的成绩)的相关系数。即例如考生以前的成绩)的相关系数。即 其中为考生总数,与分别为第个考生的考试分数与效标资料的其中为考生总数,与分别为第个考生的考试分数与效标资料的 分数。效度一般要求在分数。效度一般要求在0.800.80以上。影响效度的因素很多,其中以上。影响效度的因素很多,其中 试题是否恰当尤为重要。信度是效度的必要条件,一个测验如试题是否恰当尤为重要。信度是效度的必要条件,一个测验如 无信度则必无
26、效度,但有信度,未必有效度。无信度则必无效度,但有信度,未必有效度。 2222 )(.)( iiii jiji yynxxn yxyxn r Z Z分数分数:即通过公式进行转换所得的分数,式中为原始分数,:即通过公式进行转换所得的分数,式中为原始分数, 为原始分数的平均值,为原始分数的平均值,S S为标准差。当为标准差。当Z Z值为正时,说明该分数值为正时,说明该分数 在平均成绩之上;当在平均成绩之上;当Z Z值为负数时,说明该分数在平均成绩之值为负数时,说明该分数在平均成绩之 下。标准分数的取值范围通常在下。标准分数的取值范围通常在-4 -4 与与4 4 之间。之间。 v五、标准分数五、标准
27、分数 试卷通过评分所得的分数,通常称为原始分数。前述原始分试卷通过评分所得的分数,通常称为原始分数。前述原始分 数有时不能科学地反映学生的学习情况。这就需要将原始分数有时不能科学地反映学生的学习情况。这就需要将原始分 数转换为标准分数。常用的转换方法有数转换为标准分数。常用的转换方法有Z Z分数分数和和T T分数分数两种。两种。 T T分数分数:即通过公式:即通过公式T=10Z+50T=10Z+50,进行转换所得的分数。,进行转换所得的分数。 一般说来,原始分数(通常为百分制分数)可用来表示学生掌一般说来,原始分数(通常为百分制分数)可用来表示学生掌 握知识和能力的多少及其质量水平,检查教学质
28、量的测验宜使握知识和能力的多少及其质量水平,检查教学质量的测验宜使 用这种分数。用这种分数。Z Z分数和分数和T T分数可用来表示学生在全体考生中所处分数可用来表示学生在全体考生中所处 的相对位置,因此,选拔性考试宜使用这种分数。的相对位置,因此,选拔性考试宜使用这种分数。 8.5 8.5 中学数学教育的评价中学数学教育的评价 2、形成性评价形成性评价 这是在教学过程中进行的评价。其目的在于了解学这是在教学过程中进行的评价。其目的在于了解学 生的学习过程,并发现存在的问题,向师生反馈必生的学习过程,并发现存在的问题,向师生反馈必 要的信息,以便随时修正和调节教学和学习活动,要的信息,以便随时修正和调节教学和学习活动, 使全体学生都能达到教学目标。使全体学生都能达到教学目标。 一、评价的类型一、评价的类型 1 1、测定性评价测定性评价 这是在教学前进行的评价。它的主要功能是了解学生这是在教学前进行的评价。它的主要功能是了解学生 学习的准备状态,确定学生是否具备了学习新知识的学习的准备状态,确定学生是否具
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年精神科分级诊疗试题
- 社区女性健康宣教
- 2025浙江苍南县劳动保障事务所招聘银行劳务外包财务人员笔试历年参考题库附带答案详解
- 呼吸机相关性肺炎防治指南
- 地面除尘培训课件
- 2025届宁夏银川市银川一中物理高一第二学期期末学业质量监测模拟试题含解析
- 互联网医疗平台2025年在线问诊平台与疾病预防控制服务融合报告
- 云南省建水县2025届物理高二下期末达标检测模拟试题含解析
- 河南省林州一中分校2025年物理高一第二学期期末达标检测模拟试题含解析
- 9.《念奴娇·赤壁怀古》《京口北固亭怀古》课件 【知识精研】统编版高一语文必修上册
- 转让小饭桌合同范例
- 建设工程造价案例分析-形成性考核2(占形考总分25%)-国开(SC)-参考资料
- 2.4四等水准测量(教案)-高一《建筑工程测量》(高教版第2版)
- DB32T 1661-2010 足球场草坪建植与养护技术规程
- 医院领导层带班制度
- 皮肤科进修汇报
- 中耳炎健康教育课件
- 失眠导致的并发症
- 2024年质量知识竞赛考试题库500题(含答案)
- DB61-T 5093-2024 展览和体育建筑设计防火技术标准
- 医疗综合服务平台解决方案
评论
0/150
提交评论