考试成绩分布的一般方法.pdf_第1页
考试成绩分布的一般方法.pdf_第2页
考试成绩分布的一般方法.pdf_第3页
考试成绩分布的一般方法.pdf_第4页
考试成绩分布的一般方法.pdf_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4卷第3期 2005年6月 江 南 大 学 学 报 自 然 科 学 版 journal of southern yangtze university natural science edition vol 4 no 3 jun 2005 文章编号 1671 7147 2005 03 0310 06 收稿日期 2004 06 29 修订日期 2004 10 12 基金项目 江南大学教改项目资助课题 作者简介 张荷观 1949 男 江苏吴江人 教授 主要从事抽样理论与经济计量研究 考试成绩分布的一般方法 张荷观 江南大学 商学院 江苏 无锡214064 摘 要 以试题得分为基础 提出了确定考试成绩分布的一般方法 通过对考试成绩的分析 给出 了考试成绩近似服从正态分布的条件 关键词 考试成绩 分布 检验 预测 中图分类号 o 212文献标识码 a study on examination records distribution zhan g he2guan school of business southern yangtze university wuxi 214064 china abstract this paper presents a general method of determining examination records distribution and obtains the condition that examination records distribution will be approximately normal distribution key words examination records distribution testing forecasting 考试成绩分布是评价试卷质量的基础 目前普 遍认为考试成绩服从正态分布 更有不少学校与教 学管理部门要求考试成绩服从正态分布 1 3 作者 以试题得分为基础 提出了确定考试成绩分布的一 般方法 通过对考试成绩的分析 给出了考试成绩 近似服从正态分布的条件 讨论了考试成绩分布的 检验与预测 1 考试成绩的分布 由于考试成绩 即试卷得分是试卷各试题得分 之和 因此试卷得分的分布依赖于各试题得分的 分布 假定一份试卷共有k题 第i题分配mi分 m i为 正整数 记 k i 1 mi m 1 式中 m为试卷的满分分数 为便于讨论 规定各试 题的扣分 或得分 只取整数 设第i题的得分yi i 1 2 k 的分布列为 p yi si pi s i si 0 1 mi 2 则 i e yi mi si 0 sipi s i 3 为第i题的得分均值 记 y k i 1 yi e y k i 1 i 4 式中 y与 分别是试卷得分与试卷得分的均值 为了使考试成绩能正确地全面反映学生的真 实学习状况 各试题得分应相互独立 然而 实际的 1994 2006 china academic journal electronic publishing house all rights reserved 考试成绩通常却表现出各试题得分为正相关 这是 由于每个学生对一门课程各部分内容的理解和掌 握程度上会存在较高的正相关现象 因此使各试题 得分存在相同的变化趋势 这就是说 当把一个班 级或一个年级的学生按学习成绩高低分成若干组 时 同一组学生的各试题得分往往是不相关的 但 由于各试题得分的相同变化趋势 则使一个班级或 一个年级的各试题得分表现为正相关 例如 一份试卷共有5题 每题20分 采用随机 模拟方法得35名学生的考试成绩见表1 各试题得 分相互独立 模拟考试成绩时把学生按成绩划分为 较好 中等和较差3类 并规定各类学生的试题得分 如下 较好学生的各试题得分范围 15 20分 8人 编号1 8 中等学生的各试题得分范围 10 18 分 20人 编号9 28 较差学生的各试题得分范 围 0 15分 7人 编号29 35 表1 35名学生的考试成绩 tab 1 the examination records of 35 students 编号y1y2y3y4y5y编号y1y2y3y4y5y 117172018168819111411141262 218171919168920141613151068 316161915158121171513101570 415181816198622161112161065 520191815168823171614131575 619192019199624171212181877 715181518178325101317141771 815181618188526121810121365 918181716107927131816121776 1016111410146528101812121769 1110111212135829651521442 12131713181273301531114649 131616181615813177771240 1414121416157132810511135 1511131318157033108814747 16101011101657347142101548 171112111016603561031323 18161614111673 根据表1的模拟数据 分别求得较好 中等和 较差学生各试题得分的相关系数矩阵 对称部分未 写出 为 r 1 r 1 11 r 1 21r 1 22 r 1 31r 1 32r 1 33 r 1 41r 1 42r 1 43r 1 44 r 1 51r 1 52r 1 53r 1 54r 1 55 1 01405 01 01569 7 01210 01 01010 901124 001035 51 01192 901639 0 01156 801339 71 r 2 r 2 11 r 2 21r 2 22 r 2 31r 2 32r 2 33 r 2 41r 2 42r 2 43r 2 44 r 2 51r 2 52r 2 53r 2 54r 2 55 1 01187 01 01385 101298 71 01197 801083 801239 41 01207 1 01108 801085 8 01277 21 113 第3期张荷观 考试成绩分布的一般方法 1994 2006 china academic journal electronic publishing house all rights reserved r 3 r 3 11 r 3 21r 3 22 r 3 31r 3 32r 3 33 r 3 41r 3 42r 3 43r 3 44 r 3 51r 3 52r 3 53r 3 54r 3 55 1 01196 81 01337 6 01223 21 01774 401371 801011 41 01545 8 01039 1 01096 0 01651 81 计算结果表明 较好 中等和较差3部分学生的各试 题得分的相关性都不显著 0101 全部学生各 试题得分的相关系数矩阵为 r r11 r21r22 r31r32r33 r41r42r43r44 r51r52r53r54r55 1 01603 91 01728 701629 01 01682 701630 201589 21 01294 401488 201492 801194 71 这表明 虽然每一部分学生的各试题得分不相关 但把较好 中等和较差3部分学生作为一个整体时 由于各部分学生的得分范围不同 使各试题得分相 关显著 除第1题与第5题和第4题与第5题外 0101 由于第i题的得分yi和第j题的得分yj共同 受到其余各试题得分之和yt的影响 因此 在yt不 变时yi和yj的偏相关能更好地反映第i题得分和第 j题得分的线性相关程度 按公式 4 5 rij t rij ritrjt 1 r2it1 r2jt yt l i j yl 计算偏相关系数得 r12 t 01129 0 r13 t 01475 5 r14 t 01482 2 r15 t 01118 1 r23 t 01111 1 r24 t 01365 9 r25 t 01332 1 r34 t 01206 0 r35 t 01338 0 r45 t 01265 8 计算结果表明 第1题与第3题和第1题与第4题的 偏相关显著 这个例子说明 在各试题得分相互独 立时 实际数据却表现出相关现象 所以这只是一 种 假相关 令 u s 1 s2 sk k i 1 si u 根据上述讨论 一般可假定各试题得分yi i 1 2 k 相互独立 于是试卷得分y的分布列为 p y u s 1 s2 sk u k i 1 p yi si 5 即试卷得分的分布由各试题得分的分布完全决定 换言之 只要各试题得分的分布给定 就可以得到 试卷得分的分布 例1 设一份试卷共有5题 k 5 m i 20 i 1 2 5 m 100 为便于讨论 设各试题的可能得 分si只取0 5 10 15 20这5种得分值 各试题得分 的分布对称 见表2 表2 各试题得分的分布 tab 2 the distribution of each examination question scores i si 05101520 100 20 30 30 2 20 10 20 40 20 1 300 10 40 40 1 4000 20 60 2 50000 50 5 根据表1数据 按式 3 4 得 1 12 5 2 10 3 12 5 4 15 5 17 5 67 5 根据式 5 求得试卷得分 或考试成绩 的分布见 表3 并且 试卷得分的分布也对称 表3 试卷得分的分布 tab 3 the examination records distribution up y u up y u 350 000 2700 200 1 400 002 3750 154 7 450 012 1800 091 0 500 039 6850 039 6 550 091 0900 012 1 600 154 7950 002 3 650 200 11000 000 2 例2 同样设一份试卷共有5题 k 5 mi 20 i 1 2 5 m 100 但各题得分的分布 见表 4 不对称 且都为左偏 负偏 根据表4数据 按式 3 4 得 1 15 5 2 15 3 13 4 17 5 18 213 江 南 大 学 学 报 自 然 科 学 版 第4卷 1994 2006 china academic journal electronic publishing house all rights reserved 78 5 表4 各试题得分的分布 tab 4 the distribution of each examination question scores i si 05101520 100 10 20 20 5 200 10 20 30 4 30 10 10 10 50 2 4000 10 40 5 5000 10 20 7 因此 例2中各试题得分的均值及试卷得分的 均值都大于例1 同样可得试卷得分 或考试成绩 的分布 见表5 且试卷得分的分布也为左偏 表5 试卷得分的分布 tab 5 the examination records distribution up y u up y u 350 000 11700 121 01 400 000 64750 162 69 450 002 59800 185 14 500 008 01850 171 49 550 020 10900 127 53 600 042 70950 066 30 650 077 681000 014 00 2 考试成绩近似服从正态分布的 条件 根据式 2 各试题得分的前四阶中心矩为 mri e yi i r mi si 0 s i i rp i s i r 2 3 4 i 1 2 k 6 式中 m2i 2 i为各试题得分的方差 由于假定各试 题得分相互独立 根据式 4 则试卷得分的相应各 阶中心矩为 m2 2 e y 2 k i 1 e yi i 2 k i 1 2 i m3 e y 3 k i 1 e yi i 3 k i 1 m3i m4 e y 4 k i 1 e yi i 4 3 k i j e yi i 2 e yj j 2 k i 1 m4i 3 k i j 2 i 2 j k i 1 m4i 3 k i 1 2 i 2 3 k i 1 2 i 2 7 记 3 m3 m 3 2 2 k i 1 m3i k i 1 2 i 3 2 4 m4 m22 3 k i 1 m4i 3 k i 1 2 i 2 k i 1 2 i 2 8 式中 3 和 4分别称为考试成绩分布的偏斜系数和 峰态系数 根据例1 见表2 的数据 按式 6 得 2 1 26125 2 2 30 2 3 16125 2 4 10 2 5 6125 m3i 0 i 1 2 5 m41 1 2891062 5 m42 2 250 m43 6641062 5 m44 250 m45 391062 5 由于各试题得分的分布为对称 则考试成绩的分布 也为对称 按式 7 则得 2 88175 m3 0 m4 22 1451312 5 容易验证 这与直接按表2数据所得的计算结果相 同 再由式 8 求得例1的考试成绩分布的偏斜系数 和峰态系数为 3 0 4 01188 对例2同样可得 2 1 27125 2 2 25 2 3 36 2 4 11 2 5 11 m31 10315 m32 75 m33 201 m34 24 m35 51 m41 1 6031562 5 m42 1 375 m43 3 762 m44 287 m45 437 由于各试题得分都为左偏 使考试成绩也为左偏 因此 2 110125 m3 45415 m4 35 2131062 5 3 01393 4 01103 理论上已证明 如果一个分布的 3和 4都为 0 则这个分布的性质与正态分布非常接近 从实用 的观点 可以近似地认为这个分布就是正态分 布 6 所以 3 4 0是考试成绩的分布近似为正 态分布的充分必要条件 又因为只有当 3 0 即 m3 0时 考试成绩才可能近似地服从正态分布 而m3 k i 1 m3i 表明要使m3 0 则各试题得分的 分布必须都为对称 或各试题得分的分布虽不对 称 但各试题得分的正偏与负偏恰好抵消 因此 3 0 或m3 0 就是考试成绩的分布近似为正态 分布的必要条件 对于例1 由于 3 0 4 01188 即考试成 绩的分布为对称 但峰态系数偏小 因而比正态分 313 第3期张荷观 考试成绩分布的一般方法 1994 2006 china academic journal electronic publishing house all rights reserved 布更为平坦 而对于例2 由于 3 01393 4 01103 即考试成绩的分布不对称 为左偏 负 偏 且比例1的峰态系数稍大一点 3 考试成绩分布的检验 当一份试卷得到了n名学生的考试成绩时 那 么根据n名学生成绩的样本数据 可以对考试成绩 的分布是否服从某一分布进行分布拟合检验 特 别 利用偏斜系数和峰态系数的估计值可以检验考 试成绩分布是否为正态分布 设n名学生的考试成绩为y1 y2 yn 记 y 1 n n i 1 yi s 1 n n i 1 y i y 2 m3 1 n n i 1 y i y 3 m4 1 n n i 1 y i y 4 3 m3 s3 4 m4 s4 3 9 式中 3和 4分别是偏斜系数 3和峰态系数 4的估 计值 称为样本偏斜系数和峰态系数 当总体为正 态分布 n又较大时 则 3和 4应近似为零 若 3和 4中至少有一个与零的偏差较大时 可以认为考试 成绩分布不是正态分布 6 7 进一步 可查偏斜系数 和峰态系数的专用检验表 对考试成绩分布的正态 性进行检验 8 10 例3 设由例1的试卷 得n 100时考试成绩的样 本数据见表6 试根据样本频数分布检验考试成绩 是否为正态分布 表6 考试成绩的频数分布 tab 6 frequency distribution of the examination records 成绩yi频数fi成绩yi频数fi 902 根据表6求得 y 6715 s 91604 7 m3 0 m4 23 1141062 5 3 0 4 01284 对 0110 查表得 8 3 0130 2144 4 3 3152 从而在 0110水平下 根据偏斜系数和峰态系数 检验 认为考试成绩服从正态分布 例4 设由例2的试卷 得n 100时考试成绩的样 本数据 见表7 试根据样本频数分布检验考试成 绩是否为正态分布 表7 考试成绩的频数分布 tab 7 frequency distribution of the examination records 成绩yi频数fi成绩yi频数fi 0130 2144 4 3 3152 从而在 0110水平下 根据偏斜系数和峰态系数 检验 不能认为考试成绩为正态分布 4 考试成绩与考试成绩分布的预测 设一份试卷共有k题 第i题分配mi分 试卷的 满分分数为m k i 1 mi 若根据经验或积累的资料 能给出各试题的频率分布 那么就可以对试卷得分 的均值 和考试成绩的分布进行预测 根据样本量为n的简单随机样本 设第i题的得 分yi的频率分布为 yij012 mi fij n fi0 n fi1 n fi2 n fimi n 其中yij j 0 1 mi 表示第i题的各得分值 而 fij n 则表示相应的频率 于是可用 i mi j 0 yij fij n 10 作为第i题的得分均值 i的估计 用 k i 1 i 11 作为试卷得分的均值 的估计 而把式 5 中的概 率用频率代替 即得考试成绩的频率分布 这个频 率分布就可以作为考试成绩分布的预测 例5 设一份试卷共有5题 mi 20 i 1 2 5 m 100 根据积累的资料 可给出各试题得分的 413 江 南 大 学 学 报 自 然 科 学 版 第4卷 1994 2006 china academic journal electronic publishing house all rights reserved 频率分布 见表8 试预测这份试卷得分的均值和 考试成绩的分布 表8 各试题得分的频率分布 tab 8 frequency distribution of each examination question scores i si 05101520 100 10 20 30 4 20 10 20 30 20 2 300 10 20 50 2 4000 10 60 3 50000 40 6 根据表8的数据 按式 10 求得各试题得分均 值的估计为 1 15 2 11 3 14 4 16 5 18 按式 11 求得试卷得分均值的估计为 74 并把式 5 中各试题的概率用相应的频率代替 得 考试成绩的频率分布见表9 表9 考试成绩的频率分布 tab 9 frequency distribution of the examination records yifi nyifi n 350 000 04700 176 88 400 000 54750 195 16 450 003 208001171 50 5001012 368501118 00 550 034 809001060 84 600 075 169501019 92 650 128 7210001002 88 根据这个预测的考试成绩分布 还可作进一步 的分析 例如 可得考试成绩达到60分以上的人数 比例为94 91 或考试成绩在70分至80分之间 的人数比例为54 35 5 结 语 假如有a b c 3个班使用同一份试卷 若a 班学生每题取得高分的机会较大 见例2 而b班 学生每题取得低分的机会较大 c班学生取得高分 与低分的可能相等 见例1 那么 a b班的考试成 绩分别为左偏和右偏 而c班的考试成绩为对称 从而 当多个班使用同一份试卷时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论