



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 试卷的难度 区分度 信度和效度试卷的难度 区分度 信度和效度 一 试卷的难度 一 什么是难度 一 什么是难度 难度是指试卷的难易程度 是评价考试的一个非常重要的一个指标 一个 题目 如果大部分考生都能答对 那么这个题目的难度就小 如果大部分考生 都不能答对 那么这个题目的难度就大 客观题难度计算公式 P 难度指数 试卷答对人数 考生人数 主观题 难度计算公式 P 试卷平均得分 试卷满分 试卷难度计算公式 P 为平均分 K 为试卷满分值 易 中 难的标准为 易 P 0 7 中 0 4 P 0 69 难 P 0 39 P 值越大 难度越低 P 值越小 难度越高 一般来说 难度值平均 在 0 5 最佳 难度值过高或过低 都会降低测验的信度 二 难度的计算 二 难度的计算 1 客观性试卷难度 P 这时也称通过率 计算公式 P k N k 为答对该题的人数 N 为参加测验的总人数 2 主观性试卷难度 P 计算公式 P X M X 为试卷平均得分 M 为试卷满分 3 适用于主 客观试卷的计算公式 P PH PL 2 PH PL分别为试卷针对高分组和低分组考生的难度值 步骤为 将考生的总分由高至低排列 从最高分开始向下取全部试卷的 27 作为高分组 从最低分开始向上取全部试卷的 27 作为低分组 计算 三 试卷难度的一般要求 三 试卷难度的一般要求 就高考来说 难度以适中为宜 单个试卷的难度以 0 3 0 7 之间为好 整 卷以 0 5 0 6 之间为最佳 一般将难度值大于和等于 0 7 的试卷定为容易题 大于 0 4 和小于 0 7 的定为中档题 小于和等于 0 4 的试卷定为难题 命题时 难度一般要按一定比例分配 如 3 6 1 或 3 5 2 二 试卷的区分度 一 什么是区分度 一 什么是区分度 区分度是指考试卷目对考生心理特征的区分能力 区分度高的试卷能将不 同水平的考生区分开来 水平高的考生得高分 水平低的考生得低分 区分度 2 高的考试 优秀 一般 差三个层次的学生都有一定比例 如果某一分数区间 学生相对集中 高分太多或不及格太多的考试 区分度则低 二 区分度的计算 二 区分度的计算 1 1 单个选择题目区分度的计算单个选择题目区分度的计算 将全体考生总分从高到低排列 将总分最高的 27 考生定为高分组 总分 最低的 27 考生定为低分组 分别计算两组考生在某道题目上的通过率 两个 通过率之差就是这道题的区分度 又叫鉴别指数 计算公式为 D PH PL PH和 PL分别为高分组和低分组的通过率 2 2 整个试卷的区分度计算 常用 整个试卷的区分度计算 常用 计算公式为 D 2 XH XL W 其中 D 为试卷区分度 XH 为 27 高分组平 均分 XL 为 27 低分组平均分 W 为试卷总分 一般也将全体考生总分从高到低排列 将总分最高的 27 的考生定为高分 组 总分最低的 27 考生定为低分组 再分别计算各组的平均分 三 试卷区分度的一般要求 三 试卷区分度的一般要求 区分度 D 的取值范围介于 1 00 至 1 00 之间 通常 D 为正值 称为积 极区分 D 为负值称为消极区分 D 值为 0 称为无区分作用 具有积极区分作用 的试卷 其 D 值越大 区分的效果越好 试卷的区分度在 0 4 以上表明此题的区分度很好 0 3 0 39 表明此题的 区分度较好 0 2 0 29 表明此题的区分度不太好需要修改 0 19 以下表明此 题的区分度不好应淘汰 高考的区分度一般要求在 0 3 以上 三 试卷的信度 信度是指使用同一试卷对考生重复测验时 或两个平行试卷对考生测验时 所得测验分数的一致性和稳定性程度 信度除了要说明成绩的真实性之外 还 要说明题目涉及的内容与教学的相关程度 信度系数愈高即表示该测验的结果愈一致 稳定与可靠 系统误差对信度 没什么影响 因为系统误差总是以相同的方式影响测量值的 因此不会造成不 一致性 反之 随机误差可能导致不致性 从而降低信度 信度可以定义为随 机误差 R 影响测量值的程度 如果 R 0 就认为测量是完全可信的 信度最高 3 信度主要是指测量结果的可靠性 一致性和稳定性 即测验结果是否反映 了被测者的稳定的 一贯性的真实特征 和信度相关的一个概念是效度 信度 是效度的前提条件 信度只受随机误差的影响 随机误差越大 信度越低 因此 信度可以视 为测试结果受随机误差影响的程度 系统误差产生恒定效应 不影响信度 四 试卷的效度 效度是指考试有效性或正确性的质量指标 即是否考了要考的内容 试卷 难度 区分度是否适宜 考试最终是否达到了它的预定目的等 测试效度 test validity 亦称测试的有效性 指一套测试对应该测试的内 容所测的程度 也就是说 一套测试是否达到了它预定的目的以及是否测量了 它要测量的内容 测试的效度一般可分为以下几类 1 表面效度 face validity 指测试应达到的卷面标准 即一套测试 卷从表面看来是否是合适的 例如 若一次阅读理解力的测试包括许多受试者 没有学过的方言词汇 则可认为这次测试缺乏表面效度 表面效度是测试出受 试者正常水平的一种保证因素 2 内容效度 content validity 指测试卷是否测试了应该测试的内容 或者说所测试的内容是否反映了测试的要求 即测试的代表性和覆盖面的程度 3 编制效度 construct validity 指测试卷的诸项目对编制该测试所 依据的理论的各个基本方面的反映程度 4 经验效度 empirical validity 经验效度是一种衡量测试有效性的 量度 通过把一次测试与一个或多个标准尺度相对照而得出 一般来说 对某次测试的效度进行检验时 除了要根据教学大纲的要求和 观念有效性的理论对试卷的内容进行考查以外 还须采用计算相关系数的定量 方法 即计算出本次试卷与另一份已被确定能正确反映受试者水平的试卷之间 的相关系数 系数高则有效性大 课堂测试的效度应在 0 4 0 7 之间 规模较 大的测试其效度应在 0 7 以上 五 高考题的信度 效度 难度和区分度 高考的性质最主要的在两个方面 首先 高考是一种选拔性考试 高考成 绩是高等学校录取
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 手术间参观人员管理方案
- 2025至2030中国全球板球和曲棍球行业产业运行态势及投资规划深度研究报告
- 中风患者康复期饮食护理
- 私立幼儿园教育信息化建设与股权投资协议
- 济南房产交易合同:物业管理权移交协议
- 创新性离婚协议样本:共同财产与债务分担方案解析
- 砂石料回收再利用合同范本与资源循环利用策略
- 传染性单核细胞增多症护理
- 婚姻解除房产分割及子女抚养权明确协议书
- 血液净化科年终总结
- 铁路工程设计防火规范
- 外贸客户验收设备报告工厂测试FATSAT
- 国开电大外国文学形考
- 函数的概念学习任务单-高一上学期数学人教A版(2019)必修第一册
- 产品技术规格书模板
- 《绿色建筑评价标准》解读
- 颈脊髓损伤患者护理查房PPT
- 小学数学 北师大版 六年级上册 第二单元第1课时《分数混合运算(一)》 课件
- 浙大中控DCS图形化编程(“模块”)共248张课件
- 自采商品管理流程
- 建设工程文件收集整编系统
评论
0/150
提交评论