高中数学教学论文 如何进行有效的试卷分析.pdf_第1页
高中数学教学论文 如何进行有效的试卷分析.pdf_第2页
高中数学教学论文 如何进行有效的试卷分析.pdf_第3页
高中数学教学论文 如何进行有效的试卷分析.pdf_第4页
高中数学教学论文 如何进行有效的试卷分析.pdf_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

如何进行试卷分析如何进行试卷分析 考试作为教学过程控制的重要环节 在学校教学工作中应受到足够的重视 并且发挥积极的教学评价与工作导向作用 我们从每次的考试分数中能获得许多 信息 如学生的学习兴趣 学术水平 教师的教学水平与教学中的薄弱环节等等 而仅限于单科结业成绩上报是远远不够的 传统的考试统计学方法只能对学生集 体水平给出总结性评价 对学生个体的差异没有引起足够重视 而个体差异的确 存在 且对学生的学习和心理品质的形成有重要影响 因此 在对学生集体水平 进行分析评价的同时注重学生的个体差异将是今后试卷分析工作的重点 随着教育信息技术的发展 现代教育手段和技术也为试卷分析工作提供了更 为广阔的发展平台 考试统计学势必要跟上信息化的步伐 突破传统理论和技术 的弊端 不断完善和创新 一 研究课题的提出一 研究课题的提出 一 传统考试统计理论的不足 一 传统考试统计理论的不足 个体差异的普遍存在使 因材施教 成为教育学的理想教育原则 虽然在现 实中我们很容易 把表达思想不清楚的天才与表达思想清楚的白痴区分开来 表现为前者通过运算和结论 显示出对科学的深刻体会 但不大能够 说出 它是怎样的 后者看上去充满恰当的词汇 却没有相应能力去利用这些词汇所 代表的观念 亦即好的教育工作者凭籍其多年教学经验很快会对学生的天赋和潜 能做出判断 但借助于正式的测验却往往很难达到应有的效果 因为当今的学绩 测验及智力测量主要是以再认或再现方式测量学生能够有意识提取的外显记忆 知识以及对这种知识的运用能力 而对学生的内隐学习与内隐记忆等无意识加工 能力则很难测出 但这种内隐加工能力却又确实存在 且对学生的学习及其基本 心理品质的形成具有重大影响 对这种加工能力的测量将有助于对学生的全面理 解与因材施教 因为测评的目的不是为了给学生贴上优劣的标签 而是为了将儿 童置于合适的教育环境中 尽可能帮助学生扬长避短 在加强外显记忆能力训练 的同时注意开发其内隐心理潜能 多方位 多侧面地进行综合培养 经典的测验理论在整个测验的水平上分析测验结果 忽视了个体差异以及不 同的项目反应模式 混淆了相同测验分数所包含的不同性质的特征 有研究表明 相同数目的正确反应很可能是由于不同反应模式的结果 而这种反应模式的差异 恰恰反映出真正的心理特征或某种心理定势 现代测量理论中的潜特征理论及其 发展即项目反应理论则力图克服这一缺点 在一定程度上确定了测量结果与那些 不可直接观察测定的心理特征之间的关系 二 专门化统计分析工具的缺乏 二 专门化统计分析工具的缺乏 用心 爱心 专心 1 由于考试统计学是一门集教育学 数理统计学 计算机科学于一身的综合性 交叉学科 而目前市场上的统计分析软件面向各行各业 单用于教育统计有很多 的功能浪费及功能不足 且分析结果过于抽象 不能深入浅出的阐明给使用者 因此 设计出专门化的考试统计分析工具 就成了提高考试质量的当务之急 三 项目反应理论的崛起提供了数据分析的新工具 三 项目反应理论的崛起提供了数据分析的新工具 70 80 年代 在测量理论中 最显著的进步是项目反应理论的应用 它是继 经典测量理论之后的一个重要的测量里程碑 项目反应理论之所以优于经典测量 理论 在于它克服了后者分析数据对 考分 能力 的局限 而将能力看作是一 个潜在的变量 又将项目的难度 区分度等重要参数看作是项目本身的固有特性 独立于被试团体 目前该理论主要应用于客观性考试 试题库的建立 不同团体 被试在不同测验中能力反应的等值化 跨文化比较等多种测量领域 在发达国家 的人才测评数据分析中 项目反应理论已经成为一种常规的分析工具 二 研究目标及意义 二 研究目标及意义 首先介绍从宏观层面运用传统教育统计方法分析试卷 将试卷质量及学生整 体水平的反馈信息提供给教学管理者 帮助其改进教学工作与决策 其次 针对 传统教育统计方法的弊端 从微观层面进行试卷分析 运用项目反应理论 重视 学生内隐学习和内隐记忆 通过项目反应模式的差异突破 考试 能力 的局限 反映出学生真正的心理特征或某种心理定势 对试卷分析结果进行形成性评价 形成性评价 与总结性评价相比 形成性评价能提供更多的有关日常教学情况的 信息 的目的不仅在于要诊断和评价学生的学习状况 还要审查 评价教学内容 和教学方法 试卷的宏观分析试卷的宏观分析 一 试卷宏观分析的需求分析一 试卷宏观分析的需求分析 测试可以在短时间内 省时省力地获得有关教学的大量信息 有助于教学管 理者作出改进教学工作的决策 通过对试卷的分析获得反馈信息 了解教师和学 生在教学中存在的问题 有计划的通过考试对教学措施进行检查和研究 是管理 者改善教学管理的重要依据 也是管理者掌握教师教学情况 进行具体帮助 指 导和控制的重要依据之一 教学管理者与学科教师通过对试卷的宏观分析 可以把握学生集体知识水 平 集体走向等重要信息 及时调整教学策略与方法 二 试卷宏观分析案例二 试卷宏观分析案例 本层面统计分析的主要内容为 试卷分数的总体分布形态 平均值 总体难 度 差异系数 偏态量数 标准差及其频数与频率分布 试卷难度及区分度分布 用心 爱心 专心 2 试卷总体构成差异 试卷信度 试卷结构效度 内容效度等 本案例对上海市复旦中学高一 2 班第二学期期末成绩 SPSS Statistics Package for Social Science 用进行了全距 标准差 中位数 频数分布 试卷难 度 试卷信度 试卷区分度的分析 分析结果如下 一 全距 一 全距 全距是一群数据中最大值与最小值之差 它指的是两个极端值间的全部差 距 常用符号 R 表示 minmax XXR 2 1 用全距可以用来表示数据的离散程度或差异程度 如果全距 R 比较大 说 明考生的考分差异较大 如果 R 比较小 则说明考生的考分比较集中 在这样 的状况下 如果能够再就试题的平均得分进行对比 就能很容易地了解全体考生 该知识点掌握的水平高低 由表中数据 数学试卷的全距为 77 可见学生该科目考试成绩差距较大 而数学平均分为 70 2708 说明总体水平较好但差生过差 要提起注意 而语文 历史和政治的全距较小 平均分也较高 说明总体水平较好 学生间差异不大 这也体现了理科与文科的差异 二 标准差 二 标准差 表示变量值与其平均值离散的程度 是反映事物发展变化平均状况的数字指 标 在考试中可以用来衡量学生成绩的差异程度 3 以便来对此次考试的区分程 度有大概的了解 计算公式为 n xx S i 2 2 2 用心 爱心 专心 3 式中 S 为标准差 为各观测值 i xx为平均数 N 为观测值的个数 一般情况 下每次考试的标准差控制在 9 15 分之间比较恰当 如果标准差小于 8 分 说明 成绩分布较为集中 试卷区分度太小 中等难度的题目偏多 标准差如果大于 16 分 则说明成绩过于分散 考试的标准差控制在9 15分之间比较恰当 因此数学和外语考试的成绩分 布正常 而政治 语文 物理 化学 历史的成绩过于集中 说明试题的区分度 不够好 三 中位数 三 中位数 中学的成绩通常采用百分制 因此考试成绩分布并不会有明显的集中趋势 所以一般不采用众数这一统计量 而采用中位数计量 其公式为 中位数位置 2 1 n 2 3 以数学试卷为例 众数为60 中位数为71 说明考分出现最多的是60分 处于中间位置的分数为71 这表明试卷难度适中 稍偏低 而外语试卷中位数 为56 5 说明试卷偏难 学生普遍成绩较低 历史试卷中位数为90 相对简单 学生普遍分数较高 四 频数分布 四 频数分布 一般情况下 考试分数接近正态分布 但在实际考试中 考试成绩有以下四 用心 爱心 专心 4 种分布形态 如图所示 反映出试题质量信息各自不同 图 2 1 频数分布图 其中 A图反映出试题难度分布正常 B图中 正态分布反映出低分人数较多 平均分较低 说明难度大的试题占分比例较大 负偏态分布说明高分人数较多 平均分较高 难度小的试题占分比例较大 C图中 高峰形频数分布表明学生分 数集中在平均分周围 中难试题占分比例较大 平峰形频数分布表明学生分数差 异较大 易 中 难三类试题占分比例接近 D图反映出高低两类分数集中 试 题难度梯度大 中难试题占分比例较小 以数学试卷为例 全班48人的分数频数分布图如下 由图可知 数学试卷考生分数频数分布为负偏态分布 说明高分人数较多 平均分较高 难度小的试题占分比例较大 绝大部分考生分数在60 80之间 从 10 20到40 50有断层 即没有考生成绩在20 40分 说明差生过差 应特别提 起注意 五 试卷难度分析 五 试卷难度分析 试卷总体难度的计算公式为 max X X p 2 4 用心 爱心 专心 5 试卷难度的评价标准为 难度 大于 0 55 0 45 0 55 小于 0 45 标准 交易 适中 较难 分析本次考试试卷难度得出 政治 语文 数学 外语 物理 化学 历史 p 0 8350 0 7500 0 70270 56500 82000 8650 0 9000 难度系数 0 55 认为试卷难度较易 可见七门学科试卷难度偏易 外语相对 较难而历史相对过于简单 但因为此次期末考试为知识水平测试 不是选拔性考 试 所以认为试卷难度仍属正常 六 信度分析 六 信度分析 信度指标是测试结果可靠性的测评指标 它反映试题或试卷测试结果是否代 表了考生的真实水平 信度高的试题很少受偶然因素的影响 对任何学生的多次 测定 都会产生比较稳定的 前后一致的结果 我们采用库德 里查逊 Kuder Richardson 公式作为客观试题信度指标的度量 称为信度系数 记作rit 客观试题信度系数的计算公式 1 1 2 S pq K K rit 2 5 式中 K 测试题目数 p 答对率 q 答错率 p q 1 S2 被试各 题得分之和的方差 信度计算结果的参照标准如下 信度指标 0 60以上 0 40 0 59 0 39以下 评价标准 可靠 一般 较差 以数学试卷为例 r 0 63 我们认为 r 0 6 信度可靠 因此该数学试卷可信 试卷的微观分析试卷的微观分析 一 试卷微观分析的需求分析一 试卷微观分析的需求分析 学科教师通过对试卷的微观分析 可以针对学生个体差异进行个别化教学 帮助学生找到其问题之所在 学生通过对试卷的分析 可以正确地估计自己的成绩 判定自己以往学习的 优劣和活动方式 方法的优劣 并进而制定出较适合自己具体学习情况的学习方 案 在今后的 教 学 活动中 选择最佳的学习方法 消除和避开不利因素 发挥自己的优势 并努力配合教师的 教 以取得更好的学习效果 另外 从 教学相长的角度说 学生全面 深刻 细致的试卷分析也可以帮助教师认识学生 和做好自己的试卷分析工作 用心 爱心 专心 6 二 相关理论综述二 相关理论综述 一 项目反应模式 一 项目反应模式 所谓项目反应模式项目反应模式 简单来说 就是指测验中被试对项目所作反应的正误组 合形式 4 不同的项目反应模式对应着不同的能力水平 反映了不同被试对学习内容的 掌握程度 特别是 在异常反应模式中 包含了很多重要的诊断 评价信息 因 此 仅仅将测验总分作为教学评价的依据 我们将失去很多有用信息 只有综合 总分与项目反应模式的分析结果 才能达到诊断学生学习状况和调整教学计划的 双重目的 日本学者佐藤隆博等人开发的S P表分析法 则是一种把每一个学生 的答对 答错模式与团体的反应模式进行对照分析 从而获得所需要的信息的方 法 二 教学模式识别 二 教学模式识别 模式识别的功能结构如图所示 结 果 输 出 分 类 识 别 特 征 提 取 预 处 理 信 息 采 集 信 息 输 入 图 2 模式识别的功能结构 在课堂教学信息处理中 教学信息的采集 通过各种测验获得学生的得分和反应时间 预处理 统计每个学生答对的每个项目和每个项目正答人数 然后进行排序 特征提取 根据原始数据和预处理的结果作进一步的分析与综合 以取得有 关教与学的各种特征参量值 作为分类识别的依据 最后进行模式分类 并对各种教学模式之优劣作出判断 三 形成性评价 三 形成性评价 形成性评价形成性评价是指在教育活动进行过程中评价活动本身的效果 用以调解活动 过程 保证教育目标实现而进行的价值判断 形成性评价这一概念是1967年由 美国哈佛大学的斯克里芬 M Scriven 在课程研究中提出的 在具体的教学过 程中 形成性评价就是为了测定评价对象某一具体教学内容的掌握程度 并指出 还没有掌握的那部分任务或者在学习过程中存在的问题和不足 其目的不是给学 生评定成绩或作学业的证明 而是既帮助学生也帮助教师把注意力集中到要达到 的掌握知识的程度上 当然 在教学过程中 教师要对学生进行形成性评价 教 师也可以对自己的整个教学工作进行形成性评价 以促进教师教学水平的提高 相比较而言 总结性评价侧重于对已完成的教学效果进行确定 属于 回顾 用心 爱心 专心 7 式 评价 而形成性评价侧重于教学的改进和不断完善 属于 前瞻式 评价 四 四 S P 表分析法表分析法 所谓S P表 是把考题的测验分数变成1 答对 或0 答错 的数据 并 按一定规则排列的每人每题得分表 排表规则为 学生顺序按得分多少由上到下 排列 考题顺序按答对人数的多少由左到右排列 并画出学生的分曲线 称 S Student 线 画出考题答对人数曲线 称P Problem 线 这就是所谓S P表 对于第I个学生回答第j个问题的得分 用来表示 ij x 对于客观性试题 规定 答错 答对 0 1 ij x 对于主观性试题 规定 该题分值的 得分 该题分值的 得分 600 601 ij x S线是学生得分分布线 它是这样画出的 对于第I个学生 使该线左方的 数字个数等于该学生的得分总数 一般用实线表示 呈阶梯状 i x P线是问题正答分布线 它是这样画出的 对于第j个问题 使该线上方的 数字个数等于被正答题的总数 一般用虚线表示 呈阶梯状 j y 通过观察S曲线 每个学生的到达度 全班学生的到达度分布以及平均水平 一目了然 P曲线给出的是全部测验项目的答对率分布情况 在教学实践中 我 们认为用S P表评价法评价考试成绩不失为一种很好的选择 该方法的最大优点 是简单易行 直观形象 信息量大 它的主要评价功能有 1 测量学生总体的 学习倾向 测评学生群体的总水平 判断学生有无两极分化 了解学生的优势部 分和劣势部分等 2 评价学生个体的学习情况 如学习中的漏洞异常以及学生 在集体中所处的位置等 3 评价所出题目的难度 稳定性及信度和效度 5 三 试卷微观分析案例三 试卷微观分析案例 本案例引用长安大学工程机械学院设9910班的两次 理论力学 的考试成 绩绘制的s p表进行微观层面的分析 用心 爱心 专心 8 一 试题难度与信度 一 试题难度与信度 在用S P表分析法时 应首先对实体的难度和信度进行评价 如果试题的难 度和信度不正常则对学生学习情况的分析与评价就毫无意义 线幅反映了学生对试题的正答区间 反映了试题难易程度的差别 P曲线中 间如出现较长的竖直部分 则说明试题难度出现两极分化现象 这将影响试题的 效度 P线上方 1 的个数越多 表明该题应答稳定性越好 试题难度 1 平均正答率 试题信度 1 差异系数 一般来说 试题难度在0 5以内而信度在0 6以上较为合适 从表1可以看 出 本次试题难度与信度正常 二 总平均答对率 二 总平均答对率 观察S P表时 首先注意到的是S曲线与P曲线所在的位置 S曲线左侧的 面积或P曲线上侧的面积占S P表总面积的比例 表示学生团体在该测验中的平 均答对率 因此 在S P表中 S曲线越偏右 或P曲线越偏下 学生团体的平 均答对率就越高 用心 爱心 专心 9 NnpxPYS n X N Y 11 3 1 其中 n j N i ij y Nn p 11 1 为S P表的总平均答对率 N Y YS 1 表示S曲线与X和Y轴在其左上方所谓的面积 n X xP 1 表示P曲线与X和Y轴在其左上方所谓的面积 Nn表示S P表的总面积 利用公式 3 1 得表1的学生总平均答对率 x1 0 69 认为可以接受 三 三 S P 曲线的偏离度曲线的偏离度 S曲线与P曲线之间的偏离程度的量化指标是差异系数 3 2 N为学生数 n为问题数 p为总平均答对率 利用公式 3 2 得 D1 0 10 本次考试的D值在0 1 0 2之间 该班的整体稳定性比较好 从S P曲线形状可以看出 S线幅的大小是学生得分范围的大小 它反映了学生之间的差别程度 从表 1可以看出在S线中间部分的水平部分其长度均没有超过S线幅长的1 3以上 因此可以认为S线没有出现断层 表明该班学生成绩优劣不悬殊 群体中没有出 现两极分化现象 S线左右两边 1 和 0 的个数的多少反映了学生个体应答的稳定性 学 习稳定的学生 其 1 值应基本在S线左边 例如表1中序号为1 2号的稳定 性较好 其次是3 4号学生 而27 28号学生稳定性较差 四 注意指数 四 注意指数 1 学生注意指数 学生注意指数 用心 爱心 专心 10 3 3 在S P表中 异质反应模式的异质程度 实际上是根据全体学生的反应倾向 即S P表中所有的 1 和 0 的分布状况来确定的 当大部分学生的答对和答 错的模式相同或相似时 S P表中S曲线左侧和P曲线上侧的 0 以及S曲线 右侧和P曲线下侧的 1 就少 S曲线与P曲线之间的偏离也小 然而 异质 反应模式的 0 1 分布 一般与整体分布状况明显不同 例如表1中序号为30和31的学生 尽管这两人的测验分数都是5分 但他 们的反应模式却大不相同 将这两个学生的反应模式与P曲线 项目的答对率分 布 进行对照 就可以看出 序号为30的学生答对的是团体中大部分学生都答 对了的项目 而答错的都是答对率低 难度大的项目 这种项目反应模式意味着 序号为30学生的学习情况较为正常 然而 序号为31的学生答对的多是团体中 多数学生答错了的 难度大的项目 而对大部分学生答对了的项目却总是答错 这种项目反应模式是异质的 它意味着序号为31的学生学习欠稳定 一般认为 C S 0为完全正常 C S0 5需引起注意 而 C S 0 75且正答率 0 85需引起特别注意 再以表1中序号为29的学生为例 由 公式 3 3 得其注意指数为C S 0 89 正答率0 55 需引起特别注意 由于学生注意指数所反映的是学生个体与整体应答倾向之间的偏离程度 因 此 学生是否被警告 不是取决于他个人成绩的好坏 而是取决于他的正答题目 是否与大多数人正答题目相一致 6 例如表1中序号为1的学生与序号为33的 学生其成绩相差很大 但他们注意指数都为0 均不需警告 但表1中序号为15 的学生 他的成绩并不差 但他的注意指数为0 83 且正答率小于0 85 需引起 特别注意 而序号为30的学生成绩并不好 但他的注意指数仅为0 29 反而不 需警告 因此从这个意义上说 注意指数对于学习成绩中等偏上的学生是一种督 促 促使其知识掌握得更全面 更牢固 还需要指出的是 学生注意指数是一个 可以大于1的数 2 问题注意指数 问题注意指数 3 4 6 樊丽俭 冯振宇 科学评价考试成绩 努力提高教学质量 交通高教研究 2001 年第 4 期 用心 爱心 专心 11 观察S P表 根据P曲线我们可以发现 有些问题的难度偏大 如表1第七 题 团体中只有个别学生能正确回答 另外还有这样一类题目 其答对率与其 他试题大致相同 但团体中许多成绩居于上位的学生却做错了 对于这种问题 在S P表的上方可以看到许多 0 造成这种项目得分排列模式的原因通常有测 验内容异质以及描述和说明不清楚等 它们极易导致学生看错题 理解错误 作 出错误的回答 使得测验分数不能正确地反映学生的学业水平 以表1中第六大题为例 由公式 3 4 得C P 0 该题无需引起注意 说明 该题的难度 区分度良好 在分析学习到达度测验以及操练 练习等形成性测验的数据时 为了能对每 一个学生的学习作出正确诊断 重点要把握的是 大部分学生都答对了的问题是 哪些 和 多数学生答错的问题是哪些 对大部分学生都答对了的问题 需要把注意力集中在对答错了该问题的少数学生的异质反应模式的分析上 而对 于多数学生答错了的问题 应该重点检查问题本身以及与之相关的学习内容 教 学方法是否适当 即进行题目的反应模式分析 可见 在S P表分析法中 学生 与问题的反应模式分析应该结合起来进行 也只有这样 才能对学生的学习情况 和测验项目的质量做出正确地分析 四 对案例分析结果的进一步思考四 对案例分析结果的进一步思考 一般来说 如果教学内容和教学方法不恰当 学生的学习不充分 理解不深 入 学生的学习积极性较差 测验内容与教学内容不一致 或出题方法不佳 那 么两曲线之间的偏离程度就比较大 例如 在学习到达度测验或操练 练习题的S P表中 如果S曲线与P曲线 偏离过大 就说明其中可能存在问题 当偏离异常时 应

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论