基于项目反应理论的试题参数估计方法_第1页
基于项目反应理论的试题参数估计方法_第2页
基于项目反应理论的试题参数估计方法_第3页
基于项目反应理论的试题参数估计方法_第4页
基于项目反应理论的试题参数估计方法_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选优质文档-倾情为你奉上第 5卷 第 1期 贵阳学院学报 (自然科学版 (季刊 Vol . 5 No . 1JOURNAL OF G U I Y ANG COLLEGE2010年 3月 Natural Sciences (Quarterly Mar . 2010基于项目反应理论的试题参数估计方法薛宝山(山东胜利职业学院 , 山东 东营 摘 要 :探讨了几种常用的基于项目反应理论 (I RT 的试题参数估计方法 , 并分析了每一种估计方法的优 缺点及各自的适用领域 , 为构建基于 I RT 的试题库系统提供理论参考 。 关键词 :项目反应理论 ; 试题库 ; 参数估计 ; 遗传算法中图分类号

2、:TP 文献标识码 :A 文章编号 :1673-6125(2010 01-03I RT 2ba sed Param eter Eva on s(Shandong , China Abstract:The p l ores several common I RT -based evaluati on methods of test questi ons and analyses ad 2vantages and of each method and its suitable app licati on range, which p r ovides the theoretical referen

3、ce t o constructing I RT -based test questi on bank syste m.Key words:I RT; test questi on bank; para meter evaluati on; genetic algorith m;1 引言在互联网技术迅速发展的今天 , 基于网络技术 的考试系统得到了广泛的应用 , 网络考试系统拓展了考试的灵活性 , 显著降低了教育成本 。 作为网络 考试系统中的重要环节 , 试题库及其理论的研究和 应用也越来越广泛 。试题库是严格遵循教育测量理论 , 在计算机系 统中实现的某个学科题目的集合 , 是在精确的数学

4、 模型基础上建立起来的教育测量工具 。试题库系 统是进行计算机辅助教学的一种有利工具 , 是计算 机科学 、 教育测量理论相结合的产物 , 是未来计算 机辅助教学系统的一个重要的发展方向 。2 理论基础211 项目反应理论 (I RT 项目反应理论是一种以试题参数为前提的理 论 , 它以被试个体潜能通过试题作答反应的可测 性 , 被试个体潜能与其试题上可见反应函数关系的 基本一致性 , 以及试题参数线性变换下的不变性为 理论假设 , 进而建立种种以被试个体在既定试题上 的作答反应参数来推断其潜在特性的数学模型 , 以 一定的数学模型来确定被试个体试题反应概率与 其潜在能力之间的函数关系 。项目

5、反应理论的质量指标即项目参数的估计 值与样本选择无关 , 对被试者能力水平的估计值与 测试试题无关 , 是一种建立于一套假定之上的能力 测量理论 。 考生的能力估计值除了测量误差外 , 不 会受所使用的测试种类的影响 , 它是试题独立 (I 2te m -independent 的能力估计值 , 其次 , 从不同群 体的考生估计得到的试题参数估计值 , 不受参与测 试的考生群体的影响 , 也就是说它是样本独立87 3收稿日期 :2009-12-30作者简介 :薛宝山 (19 - , 男 , 山东胜利职业学院 , 讲师 , 本科 , 研究方向 :软件工程。 (Sa mp le -independ

6、ent 的试题参数估计值 。项目 反应理论还提供其测量的估计标准差 (Standard err ors 和试题的信息函数 (Ite m inf or mati on func 2 ti on , 它可以用来作为评价能力估计值之精确度的 指标 , 优于经典测试理论中的 “ 信度 ” (Reliability 。 212 试题参数的估计任何项目反应模型都可以统一描述成 P j(Q =F (Q, a, b, c 的形式 。公式中中包含两类参数 , 一类是被试者的能力参数 , 用 Q 来表示 , 只与被试 者有关 , 与题目参数无关 ; 另一类是项目的质量参 数 , 用 a 、 b 、 c 标识 ,

7、分别称为区分度参数 、 难度参数 和猜测参数 , 这些参数值都不能由直接测量得到 , 而必须通过被试者的反应数据进行估计来求出 。 在项目反应理论模型的研究过程中 , 人们提出 了多种理论模型 , 可以分为两大类 :静态模型与动 态模型 。 静态模型描述被测试者某一时刻的素质 、 能力水平不随时间变化 ; 动态模型则用来描述被试 者的内在素质 、 能力水平随时间变化的情况 。 比较成熟的是静态模型 ,状分为正态卵型和逻辑斯蒂型等多种 。213 逻辑斯蒂克模型 (Logistic Model 目前应用较广的是逻辑斯蒂克模型 (Logistic Model 。 在逻辑斯蒂克模型中 , 根据参数的不

8、同 , 特 征函数可分为单参数、 双参数和三参数三种模式 :单参数模式 :p (1+e -D (-b 双参数模式 :p (1+e -D a (-b 三参数模式 :p ( =c +(1-c 1+e -D d (-b 其中 , D =11702为量表因子常数 ; 为受测者 能力值 。 P ( 表示能力为 的人答对此题目的概 率 ; a 为题目的区分度 , 即特征曲线的斜率 , 它的值 越大说明题目对受测者的区分程度越高 ; b 表示题 目的难度 , 即特征曲线在横坐标上的投影 ; c 表示 题目的猜测系数 , 即特征曲线的截距 , c 的值越大 , 说明不论受测者能力高低 , 都容易猜对本道题目

9、。 当 c =0为双参数模式 , 当 c =0且 a =1时为 单参数模式 。 通常 、 a 、 b 、 c 都是未知的 , 要根据被 试对项目的作答反应对 、 a 、 b 、 c 进行估计 , 一般采 用双参数 Logistic 的 0-1评分模型进行比较 。根 据具体问题 , 可出现几种情况 :第一是各项目参数 已知 , 估计被试能力 ; 第二是被试能力已知 , 估计项 目参数 ; 第三是同时估计被试能力和项目参数 。3 试题参数的估计方法311 极大似然估计法在测试过程中 , 对测试样本进行如下统计 :假 设第 j 道试题的区分度为 a (j , 难度系数为 b (j , 猜测系数为 c

10、 (j , 应试者在该试题的反应函数 :U j =1:答对情况 ; 0:答错情况 。该应试者参与了 n 道测试后 , 其能力计算的极大似然方程为 : L ( =L (U , a, b, c =nj =1exp (uj 3 1n p j 3exp (1-u j 31n (1-p j 其中 为应试者的能力值 , Pj 为该应试者对第 j 道 题目的三参数 Logistic , Pj 为在该应试者能L 两边求对数有 : =nj =1(uj 31n p j +nj =1(1-uj31n (1-pj令 F ( =ln L ( , 则 :d 1n L ( =F ( =D 3nj =1a j 3(u j -

11、p j (p j -c j /p j 3(1-c j 通过解方程 F ( =0可求得能力参数 的 极大似然估计值 。 根据此模型计算可以得知 , 如果 受测者答错了 , 能力的估计值就会降低 ; 如果受测 者答对了 , 能力的估计值就会提高 。为了避免出现能力测试失败 , 提高计算方法的 收敛速度 , 使能力估计值快速趋于稳定 , 可以通过 两种算法对此极大似然方程进行求解 。一种是常 用 Ne wt on -Raphs on 迭代法 , 又称切线法 , 切线法 存在如下不足 :(1 方程的可行解中不能出现导数 为零的点 (不收敛点 ; (2 方程的收敛速度较慢 , 特别是当 (t +1 值趋

12、近于方程的解时 , 收敛明显 减慢 ; (3 方程的解法中当不存在解时 , 缺少对实 际能力值的调整 ; (4 当方程出现多解时 , 缺少相 应的处理 。第二种方法是中值法 , 可以解决切线法中存在 的收敛问题 , 中值法满足条件的可能性相对切线法 来说是较为容易 , 采用中值计算法 , 收敛速度快 , 出 现特殊情况时进行简单的调整 , 这在一定程度上保 证了最终的能力估计值曲线的平衡性 。 9 7 312 基于神经网络的参数估计方法运用神经网络进行参数估计的方法 , 通过将所 有考生在项目上的反应作为网络输入 , 将项目的 I RT 参数值作为网络输出 , 进行网络建模 , 并通过 锚题测

13、验设计 , 提供训练样本以及训练网络 ; 训练 好的网络就可以对小样本和连续记分的 I RT 参数 进行估计 , 该方法可以得到较好的估计精度 。 在基 于 I RT 的题库建设中 , 连续记分模型已经不再采 用 , 取而代之的是更为实用的基于二值记分的三参 数 Logistic 模型 (3P L M 。所谓二值记分 , 即指考 生在项目上的作答要么正确 , 基于神经网络项目参 数估计方法也适用于二值记分方式 。GRNN 是由 Specht 提出的一种前馈式监督型 神经网络 。 该网络的结构设计比较简单 , 它具有一 个径向基隐层和一个线性输出层 , 只有一个网络参 数需要调节 , 具有学习速

14、度快 、 拟合能力强等优点 , 常用于解决回归问题 , 尤其非常成功地应用在函数 拟合中 。 Matlab网络设计函数为 ne wgrnn (P, T, SP ,样本 , T 为输出期望 , SP度 。 其中 ,练样本数 , , 且该 层网络输入函数和传递函数分别为 Euclidean 距离 函数和 Gaussian 函数 。线性层权值为训练样本的 输出期望值 , 该层的网络输入函数和传递函数分别 规则化为点积函数和线性函数 。在区分度和猜测系数上 , 神经网络方法比数理 统计方法的估计误差要小 , 但在难度上 , 神经网络 方法的误差较大 ; 在一些情况下 , 神经网络方法的 优势并不明显

15、, 但是当去掉对项目参数的先验概率 分布的限制后 , 基于神经网络的参数方法才体现出 一定的优势 。 特别是在小样本测验情况下 , 去掉对 项目参数的先验概率分布的限制后 , 神经网络方法 的优势更加明显 。313 基于遗传算法的参数估计方法遗传算法 (Genetic A lgorithm , G A 是近些年发 展起来的基于生物自然选择和自然遗传理论的随 机化全局优化算法 。与其它方法相比 , 遗传算法 具有其它算法所没有的自适应性 、 全局优化性和隐 含并行性 , 在解决问题时具有很强的稳健性 。遗传算法通过“ 优胜劣汰 ” 选择个体 , 通过遗 传算子操作可产生新的优良结构的个体 , 采

16、用与适 应值成比例的选择策略 , 可以使适应值高的个体具 有更多的生存机会 , 但也因此可能导致算法过早的 不成熟收敛等 。为了实现算法的自适应性与避免 早熟现象 , 可以用自适应的惩罚函数的方式调整适 应度函数 。 根据连续 k 代具有高适应度的个体满 足约束条件的情况调整惩罚因子 , 进而调整适应 函数为 :=3(1-3(1+传统遗传算法采用的是二进制编码 , 现在应 用较多的是基于实数编码的遗传算法 (Real cod 2 ing Genetic A lgorithm , RG A 。这种遗传算法的过 程为 :在种群规模为 L 的父代种群基础上分别通 、 , 再 、 选择 、 杂交 , 如此反复 , 直到满足条件为止 。显然 , 改 进后的 RG A 实际搜索范围广 , 得到全局最优点的 机会也大 。采用实数编码进行 I RT 的 3P LM 参数估计 , 是连续参数优化问题的自然描述 , 取消了编码 、 解码的过程 , 提高了算法的速度和精度 , 优点非 常明显 。4 结束语本文探讨了几种

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论