(应用数学专业论文)项目反应理论的发展综述及其在教育测量学中的应用.pdf_第1页
(应用数学专业论文)项目反应理论的发展综述及其在教育测量学中的应用.pdf_第2页
(应用数学专业论文)项目反应理论的发展综述及其在教育测量学中的应用.pdf_第3页
(应用数学专业论文)项目反应理论的发展综述及其在教育测量学中的应用.pdf_第4页
(应用数学专业论文)项目反应理论的发展综述及其在教育测量学中的应用.pdf_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 当前,考试的指导理论主要有两种:一是以真分数理论为代表的经典测试理论 ( c c t ) ,二是项目反应理论( i t e mr e s p o n s et h e o r y ,i r t ) 。经典测量理论以分数的真 值理论为基础,发展了信度、效度、难度以及区分度等概念系统,用以衡量一个测量工 具或考试题目的质量。随着教育测量学的迅猛发展,自2 0 世纪6 0 - 7 0 年代以来,以项 目反应理论为核心的现代测量理论成为教育测量学研究的主要内容,受到越来越多的研 究人员和教育工作者关注。相对于经典测量理论,项目反应理论具有明显的优势,它所 采用的项目参数是不会受样本影响的指标,这些参数的获得不会因为接受测验的被试样 本的变化而改变,同时对被试能力的估计也不会因为试题的不同而不同正是因为它 的这些优点,使其在心理及教育测量中有更为广泛的应用。 本文主要介绍了项目反应理论的历史发展,以三参数逻辑斯蒂模型为典型代表论述 了项目反应理论模型的基本理论,它与经典测试理论的比较,多维项目反应理论的历史 背景、早期的发展、及其与因子分析法的比较,多维项目反应理论模型,多维项目反应 理论的展望,最后用e m 算法介绍了项目反应理论的参数估计的实现过程,并根据辽宁 省鞍山市三所初中2 0 0 名学生的期末成绩数据估计出项目参数,并对结果加以分析。成 果为根据得到的项目参数,评价题目的质量,分析学生的学习和掌握情况,以期对教学 和考试具有一定的指导作用。 关键词:项目分析;项目反应理论;多维项目反应理论;多级记分;项目参数;肼 算法 a b s t r a c t a tp 把s e 吨吐l 船a 砖脚。鹊讨e 也酬e sf - 0 fe x a 蠲o i sd 嬲s i c a l 髋tm e o 巧( c c r ,如e o m e ri si t e mr e s p o n s e1 1 1 c 0 巧( c c ti sb 勰e do nm et t l e o r yo f 恤仃u mv 山e l e o r yo f s c 0 血l g ,柚dc o n c e p ts y s t e m 硒鼬i h 呗v a l i d i 坝d i 伍c u 姆趾dd i s c r i n 删o n i sr a i s e d 锄d d e v e l o p e d i ti su s e dt 0m e 勰u r eat e s tt 0 0 i 讲m eq u a l :i t yo fat c s t w i 吐lt l l ef 弧td c v e i o p m e n t o f 出a t i o nm e 勰m 明n e n t ,m o ( 1 锄m e a s u r i n gm e o r y w i 吐ln l ec o r co fi t c mr e s p o n s em e o 嘞 1 l 弱b 啪t l l ei n a i no b j e c to ft l l es t i l d yo fc d _ u c a n o nm e a s u r e 加e n t i th 髂猢s e dm o r ea n d m o r ea t b e n t i o n0 ft h e 陀s e a r c h e 璐a n de d u c a t o r s c o m p a r e dt 0o c t 耐h 勰d b v i o u s a d v 柚t a g e 1 h e 沁mp 娥蝴i t 池sw m n o tb ei n 】e n c e db ys a l p l e s ,a n dt h ea c q u i s i t i 叩 o f t h ep 嬲豳r e t 璐w 进珏o t6 h 褪g eb e c a :l l s eo f 出ec h a n g eo f 出es a m p l e s 砌c hw e f et a :k e 珏淞 t e s 血gi t e m s m e 锄w b i l e ,t l l ee s t i i m t eo f t h et c s t c 寸sa b i h 哆w i l ln o tc h 锄g e 嘶t l ld i f j f ;i 釉t t e s t q u e s t i 0 j u s tb e c a u s e0 fm e s ea d v a n t a g e s ,i ti sw i d e l yu s c di np s y c h o l o g y 弛d 耐u c a l i o n 皿旧嬲删陀n 屺n t s 1 l l 吐l i sn l e s i s ,也e 卸也0 ri n 帆e dm ed 州e 1 0 p i n gl l i s t o r yo f 琅卫t h r - p 觚柚1 c l 职 l 0 西s t i cm o d e li st a l 【雠勰a 帅i c a lm o d e lt 0s h o wt l l eb 弱i c 吐l c o 巧o fi r tm o d c l i ti s c o m p 积w i n lc ( 丑狐l dt h el l i s t o r i c a lb a c k g r o u n 山e a d y 出i v e l o p m e n t t h ec o o p e 础叽 b b t w e e nf a 锄di r r 皿删崎d i 屺璐i o n a li t e m 淞p o n s et l l e o r ym o d l e la n di :t so u n 0 0 ka r ea u i n c l u d e d 选也i s 出e s i s ,a tl 舔0 也ea u t k i ri j l 忒i d b er 姚砸。珏o f 出ee s 斑凇伦o f 玎 p 聪哑c t t 弱t h r 伽曲e ma l g 嘶m m 勋1 a le x 觚血a d o ns 嘴s o f2 0 0s t i l d e 赡劬m l l 优j u n i o r m i d d l es c h o o l si i la n s h a nb d p e dt l l ew o d 【0 u to fm ep 缸鲫嘲卸dm er e s l l l tw 勰a n a l y z e d 砸坞咒剐d t9 0 t 饷mt h e 【p e r i n 赡n tc 0 l l l dw o r kt 0t e ut h ee 姗i 吣,t 0a n a l y z et h es t i l d e n t s s t u d i c s ,卸dw mb e 刚f b rt e 觚城n g 锄de x 舡n i 姐t i o 璐 k e yw o r d s :i t e ma m l y s i s ;嬲; m u l t i 曲玳n s i o n a li t c mr e s p o n s et h e 0 巧;m u l t i l e v e l s c o r i n g ;i t 啪p 嬲衄e t e r ;e m 触g 甜m m 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究 成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经 发表或撰写过的研究成果,也不包含为获得东北师范大学或其他教育机构的学位或证 书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了 明确的说明并表示谢意。 学位论文作者签名:趁l 趑。日期:丝丛:笪:型 学位论文版权使用授权书 本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即:东 北师范大学有权保留并向国家有关部门或机构送交学位论文的复印件和磁盘,允许论 文被查阅和借阅。本人授权东北师范大学可以将学位论文的全部或部分内容编入有关 数据库进行检索,可以采用影印、缩印或其它复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:邀丛 日期:趔塑:坚:够 学位论文作者毕业后去向: 指导教师签名:盟 日 电话: 邮编: 东北师范大学硕士学位论文 暑i吉 丁i嗣 人类的决策过程总是包含着测量、测验和评价的某种形式。科学化的考试对学生的 发展有许多积极作用,使用考试手段能够检测教育质量,规范和引导教师的教学行为, 促进学生积极努力地学习,而且对培养学生分析问题、解决问题等综合素质能力可以发 挥非常重要的鞭策作用。如何客观、科学地反映和评价每一位学生的专业理论水平和实 际应用能力,定量化比较不同学校、不同教师、不同教学模式的教学质量和效果,在检 测标准上与国际接轨,充分发挥考试对改进教学的反馈功能以及考试对教学的作用,为 社会培养高质量人才,是我国各级各类教育必须解决的一个重要课题。n 1 早在公元前2 2 0 0 年,中国人首先编制了正式的口头知识测验。在十九世纪末,技术 的进步使教育和心理测量得到繁荣发展,教育测量学是在二十世纪二三十年代兴起,在 二十世纪的后半叶,我们至少已经看到了两种主要理论的发展:标准参照测验和项目反 应理论。项目反应理论是一种先进的测量理论,是针对经典测量理论的不足而提出来的。 自项目反应理论出现以来,倍受国内外广大学者的关注,对于促进我国教育考试评价方 式的改革和发展具有很大的指导意义。同时它也是自适应考试的重要理论基础,因此项 目反应理论以其不可比拟的优点越来越广泛的被应用于教育与心理测量之中。 东北师范大学硕士学位论文 第一章单维项目反应理论 项目反应理论也称潜在特质理论或潜在特质模型,是一种现代心理测量理论,其意 义在于可以指导项目筛选和测验编制。项目反应理论假设被试有一种“潜在特质”,潜 在特质是在观察分析被试测验反应基础上提出的一种统计构想,在测验中,潜在特质一 般是指潜在的能力,并经常用测验总分作为这种潜力的估算。项目反应理论认为被试在 测验项目的反应和成绩与他们的潜在特质有特殊的关系。通过项目反应理论建立的项目 参数具有恒久性的特点,意味着不同测量量表的分数可以统一。项目反应理论通过项目 反应曲线综合各种项目分析的资料,使我们综合直观地看出项目难度、鉴别度等项目分 析的特征,从而起到指导项目筛选、编制测验和比较分数等作用。 一、项目反应理论的几个基本理念 ( 一) 项目反应理论的概念:项目反应理论将学习者对测试项目的反应( 应答) 以表示测试项目特性的项目参数和表示被测试者能力参数及其组合的统计概率模型所 表示。 ( 二) 项目反应理论的基本思想 假定被试对于测验项目的反应受某种心理特质的支配,那么首先就要对这种特质进 行界定,然后估计出该被试这种特质的分数,并根据该分数的高低来预测和揭示被试对 于项目或测验的反应。它主要研究被试在测验项目上的反应与测验所测特质之间的关 系。项目反应理论的基本原理是通过建立合适的数学模型来解释被试特质水平与其在项 目作答表现之间的关系。 ( 三) 项目反应理论的核心 项目反应理论是以项目特征曲线和潜在特质等概念为理论架构,依据强势假设来发 展其理论模型。它的核心是项目特征曲线,它描绘了被试的某一能力水平与它可能正确 回答项目的概率之间的关系。1 ( 四) 项目反应理论的基本假设 1 局部独立性:所谓局部独立性是指能力参数吕一定时,被试对各个项目的应答 是统计上的独立。即对一个问题的回答不影响对另一个问题的回答。设z j 表示对项目 应答的二值变量,即当被试的应答是正确时,工,= l ,若是错误的,_ = o 。这时, 局部独立性的假设可由下式所表示。 尸( x = 1 i 口) = p ( x ,= l p ,- ,x _ l ,x “,x 。) 2 东北师范大学硕士学位论文 2 潜在特质空间的单维性:即测试出来的能力变量是处在单维空间中,可在一个 量表中表示,不同的被试之间可以相互比较。潜在特质空间维度,又称能力维度,是指 被测量的测验成绩是由若干种能力岛,岛,只。所决定的,这一,z 维空间称为潜在空间。 假设潜在空间是一维的,就是说被测量的测验结果只取决于一种能力,其它能力的影 响都可以忽略,这就是所谓的能力单维性。珏当测试满足局部独立性假设时,该测试是 一种单维的测试,即测试是一种仅由乡这种单因子决定的一维测试。反之,测试在9 一 定时,是一种多维性的测试。它表示在测试过程中,不仅被试的能力参数影响其应答的 结果,还存在着除乡以外的其他能力和因子影响被试的应答。这种情况下,等式( 1 1 ) 不成立。4 3 3 单调性h 3 :即被试对题目正确反应的概率随其能力水平的增加而单调递增。 二、项目反应理论的模型 项目反应理论是新近发展起来的一种先进测验理论,基于这一理论的测验模型称 为i r t 模型。项目反应理论模型是一种数学模型,它的特点是以概率来解释被试对项目 的反应和其潜在能力特质之间的关系。 项目反应理论的基本思想起源于上世纪3 0 年代末和4 0 年代初,1 9 4 6 年,塔克 ( t u k e r ) 正式提出“项目特征曲线 概念。所谓项目特征曲线,就是表征被试的能力 或特质水平与其对一个测验项目的正确反应概率之间关系的二维曲线图。不同的项目特 征曲线假设对应着不同项目反应模型,项目反应理论的模型不下2 0 余种,可根据实际 情况选择适当的模型h 1 ,目前应用最广的项目反应模型是二级评分的单维非线性模型, 以伯恩鲍姆提出的逻辑斯蒂模型为代表。本文仅介绍其中的正态卵形模型和逻辑斯蒂模 型嘲。 ( 一) 正态卵形模型: 1 9 5 2 年,美国心理和教育测量学家洛德提出的著名的正态卵形模型,其项目反应 函数是正态卵形函数,其表达式为: 即一艄叫r 击e 冲( 一孚户 式中:口为区分度; 6 为难度; c 为猜测参数: 占为被试潜在特质水平。 尸( 臼) 为被试对某一测验项目的正确反应概率。 ( 1 2 ) ( 二) 逻辑斯蒂模型: 1 9 5 7 年,伯恩鲍姆提出了逻辑斯蒂模型( l o g i s t i c 模型) 。根据参数个数的不同, 逻辑斯蒂模型分为单参数、双参数( 2p a r a m e t e r sl o g i s t i cm o d e l ,2 p l m ) 、三参数及 3 东北师范大学硕士学位论文 四参数l o g is t i c 模型( 4 p l m ) 。 1 单参数l o g i s t i c 模型 p ( p ) = i j = - 苫三b 而 式中:9 为被试潜在特质水平: 6 为难度; ( 1 3 ) 被试答对项目的概率是口的函数,记为p ( 矽) ,称之为项目反应函数。 难度6 随项目变化,若第f 个被试的潜在特质水平用只表示,项目的难度用6 j 表 示,第f 个被试正确回答项目的概率用e ( 只) 表示,此时式( 1 3 ) 可写为 弓( 只) =l + p d ( 岛一6 ,) 一 2 双参数l o g i s t i c 模型 即) = 南 ( 1 4 ) 式中口表示试题的区分度。 3 三参数l o g i s t i c 模型 即) = c + 未南 ( 1 5 ) ( 1 6 ) 式中p 表示猜测参数,c ( 0 ,1 ) 4 四参数l o g i s t i c 模型 实际上,有不少试题即使是高水平的被试也难以绝对完善地作答,项目反应在项目 特征曲线上就是曲线尾部不以1 o o 为极限,而是略低于1 0 0 。因此有人提出了第四个参 数,由此得到四参数l o g i s t i c 模型,其表达式如下: 即) - c + 若南 ( 1 7 ) 上述( 1 3 ) 、( 1 5 ) 、( 1 6 ) 、( 1 7 ) 式中,d 为常数因子,通常取1 7 左右( 或 更精确些取d = 1 7 0 4 ) 。 5 四种模型之间的关系: ( 1 ) 当四参数模型中的参数,= 1 时,即为三参数模型( 1 6 ) : ( 2 ) 对于选择题和是非题猜测参数是必须考虑的,而其他类型的试题一般不用考 虑猜测参数,可令c = 0 ,此时即为双参数模型( 1 5 ) : ( 3 ) 如果不含有猜测参数,且测验中各个试题又有大致相同的区分度,此时可令口 取某一定值,如令口= 1 ,此时即为单参数模型( 1 3 ) 。 前三者都己在实际应用中广泛采用,其中又以三参数的l o g i s t i c 模型( 3 p l m ) 最为 常用,不难推测,就三参数l o g i s t i c 模型而言,对于任意给定的试题,能力值低的被 4 东北师范大学硕士学位论文 试的正确反应概率低( 接近猜测参数值c ) ,能力值高的被试的正确反应概率高( 接近确 定值1 ) 。由于计算机和网络技术的发展,对考试的准确性的要求也越来越高,对三参 数的l o g i s t i c 模型的研究也比较成熟,现在逐步趋向使用三参数模型。而四参数模型 目前主要还是理论研究阶段。 ( 三) 项目特征曲线 伯恩鲍姆所假定的项目特征曲线描述的是被试测验得分与被试潜在特质、能力水平 之间的关系。一定能力或特质水平的被试对某一测验项目的正确反应概率只与该项目的 质量有关。被试的答对概率与其特质水平之间的关系是非线性的,即当特质水平分大或 小到一定的程度以后,答对概率p ( 秒) 随之变大或变小的速度显著变小。研究表明,这种 曲线的形状,是一条以其拐点为对称中心的s 形曲线。 根据三参数特征函数可画出项目的特征曲线( i t e mc h a r a c t e r i s t i cc u r v e ,i c c ) 。 图1 为典型的三参数模型的特征曲线。 从图1 可以看出,项目特征曲线下部 的渐近线离坐标轴的零点有一定的距 离。这是由于存在猜铡因素,也就是 说,即使是能力或特质水平很低的被试 仍有可能答对。该项目的猜测参数值, 一般用c 来表示,它是凭猜测答对该 题的概率。项目特征曲线是一条以拐点 为中心的曲线,因而其拐点在纵轴上 的投影正好落在c 与l 的中点上,即拐 1j _ “ 点的纵坐标为兰。这表明特质水平 p p ) 图l 三参数逻辑斯蒂模型 为6 ( 拐点在横轴上的投影) 的被试答对与答错该项目的概率,若猜测因素不计,恰好 彼此相等,所以6 通常被定义为项目的难度参数。项目特征曲线拐点处的斜率刻了曲线 的陡峭程度,这与项目区分被试特质水平的能力有关。很显然,曲线越陡峭,答对概率 尸( 9 ) 对特质水平护的变化就越敏感,即项目区分被试水平的能力就越强。因此,曲线拐 点处的斜率被称为项目的区分度参数,一般用口来表示。 实际上,洛德提出的正态卵形模型与逻辑斯蒂模型相比,在计算结果上并无大的 区别,所绘制的曲线也大体相同,然而在实际应用中大多采用后者。其中主要有以下两 个方面的原因:首先是它形式上的简洁,更具数学模型的特点;其次是它便于运用对数 进行计算,因而模型的项目质量参数和能力参数估计起来较为方便。 三、项目反应理论与经典测试理论的比较 经典测试理论从2 0 世纪初发展起来,经典测试理论是最早的测验理论,是建立在 东北师范大学硕士学位论文 真实分数理论基础上的,依据弱势假设而来。真实分数理论是指任何测试测量值是由两 部分组成,一个是实际代表某个潜在特质的“真实分数”,另一个是观察不到也不被潜 在特质所解释的“误差分数 ,且这两部分之间是相互独立的。它包含了多种测量模型, 对于试题和试卷的评价说明方法很多,其理论的发展也较成熟,对建立试卷、考分转换 与等值处理等均有一套较为完整的方法,经典测试理论建立了一系列试题分析的公式。 在这一理论模型中,用通过率来定义难度,用题目分数和效标分数的相关系数来代表区 分度,用真实分数的方差与实测分数的方差之比来表示信度等。所采用的公式简单明了, 浅显易懂,适用于大多数的教育与心理测量数据,是目前测试学界应用最为广泛的理论。 但是,经典测试理论存在着许多不足之处,经典测试理论所采用的指标都是一种样 本依赖的指标,即其统计量受样本的抽样影响很大;它以一个相同的测量标准误差作为 每位被试的测量误差指标,这种作法并没有考虑被试能力的个体差异;被试的分数依赖 于项目的难度,这就使得参加不同测验的被试难以相互比较;它对于非复本但功能相同 的测验所测得的分数间,无法提供有意义的比较,有意义的比较仅局限于相同测验的前 后测分数或复本测验分数之间;它只适用于常模参照测验而不适用于目标参照测验,如: 在目标参照测验中,如果被全部不能通过测验,难度和区分度就无从计算了;它对信度 的假设是建市j 午复本测量的概念假设上,但是这种假设往往不存在于实际测验情境里: 认为原始得分相同的被试其能力必定一样,从而忽视了被试的试题反应组型。 项目反应理论是针对经典测量理论的不足提出来的,其理论基础是潜在特质理论。 项目反应理论建立了深刻地、综合地反映被试作答反应与题目质量及能力水平间关系的 非线性模型,估计出的能力水平不依赖于特定的施测题目样本,而且能明确算出信息 量即测量精度。 与经典测试理论相比,项目反应理论有以下优点:l 、试题参数确定更为准确。脚 这一点已被许多研究和事实所证明。就三参数模型而言,它还能从实际资料出发,具体 地估出一个猜测参数值来渤:2 、项目反应理论在估计被试能力或潜在特质时,同时考 虑被试的反应组型,因此对于原始得分相同但反应组型不同的个体,提供不同的能力估 计值;3 、项目反应理论能全面地解决测验等值问题,它既能实现被试测验总分等值, 又能实现试题参数等值。而经典测验理论的等值方法,实际上仅局限于被试测验总分等 值这一方面阳3 ;4 、项目反应理论可以针对每个被试提出其能力估计值的测量误差指标, 而不是以一个统一的标准误差来代表测量误差,能够比较精确地断定每个被试能力估计 值的误差范围;5 、项目反应理论既适用于常模参照性测验又适用于标准参照性测验。 i r t 的难度值可直接用被试特质水平值来表达,区分度是特征曲线拐点处的斜率,这就 从根本上解决了经典测试理论所面临的困难,能完全运用于标准参照性测验;6 、项目 反应理论具有参数不变性等优点,即它所采用的项目参数不依赖于被试样本也不依赖于 试题库,因此可编制“因人施测 的自适应测验等新型测验:7 、项目反应理论提出的 项目信息函数和测验信息函数的概念可以作为评定个别项目或整份测验的测量误差的 指标,完全可以取代经典测试理论中的“信度 的概念。 6 东北师范大学硕士学位论文 四、项目反应理论的发展方向 近年来有关项目反应理论的研究,可以看出项目反应理论在理论研究上的着力点 主要表现在三个方面:一是多维项目反应理论的研究,二是非参数项目反应理论的研 究,三是认知诊断理论的研究。 ( 一) 多维项目反应理论 虽然项目反应理论具有经典考试理论所不可比拟的优势,但是它也存在着一些明显 的问题。项目反应理论的问题除了该理论本身要求研究者具有很高的统计学背景之外, 其问题主要源于该理论的三个基本假设,即单一维度、局部独立性和单调性。 在大规模教育考试中被试的行为一般受到多种潜质控制,如在数学考试中,被试 的行为既取决于被试对数学知识的掌握程度,又取决于被试逻辑推理能力。又如被试在 英语阅读考试中的表现既受到被试词汇量和阅读内容类型的影响,又受到被试的许多 微技能的影响,如理解事实性内容的能力、理解话语隐含意思的能力、理解文章主旨大 意能力等。这个事实决定了大规模教育考试往往是多维的h 1 。因此项目反应理论对一维 性假设的条件实际应用时常常不能得到满足,而简单用单一维度模型模拟多维度数据会 增大测量误差,对学生的能力水平做出不正确的推论。 ( 二) 非参数项目反应理论哺3 尽管参数型项目反应理论( p a r 鲫e t r i ci r t ,p i r t ) 得到了广泛的研究与应用,近 年来关于非参数项目反应理论( n o n p a r 锄e t r i ci r t ,n i r t ) 的研究也同样得到了广泛的 关注。之所以出现这种趋势,主要是由于以下方面的原因。首先,非参数项目反应理论 提供了非常有价值的补充。其次,n i r t 为p i r t 适用的局限性提出更有弹性的框架。其三, 为短测验或小样本数据,在此情况下采用p i r t 模型所估计的参数存在很大的误差,而 n i r t 则可以很好地适用于小样本数据。随着新的算法,如核平滑技术、期望一极大化算 法、m c m c 方法等不断发展,n i r t 将会得到更大的发展,可以减少了人们对正态或 l o g i s t i c 项目反应模型以及关于所测查潜在特质的正态分布架设的依赖。 ( 三) 认知诊断理论 认知诊断理论以项目反应理论为基础,结合认知科学对学习理论的研究与发现,运 用更尖端的理论模型,着重探索以下内容:被试在特定测验中采用的认知过程和知识结 构,这些认知过程和知识结构在测验中的运用机理,以及能力不同的被试在测验中的表 现差异。通过这种对知识结构及其运用过程的“识别 ,了解学生在测试中成功或失误 的原因,“诊断 出学生学习和教师教学中所欠缺的信息,进而为“如何学习”、“学 会学习 提供改进或补救策略。这种新的理论模式超越了c t t 、g t 、i r t 等传统测量理论 以统计概念描述行为特质或能力水平的缺陷,深入特质或能力表现的心理实质,探测学 生在测量作答过程中的心理机制。不仅考察学生的学习结果,而且追寻这个结果获得的 过程,查找学生学习困难的原因,从而将测量的内涵从量化描述与确定学生发展状况拓 7 东北师范大学硕士学位论文 展深化至为学生的学习提供强有力的诊断和干预。 东北师范大学硕士学位论文 第二章多维项目反应理论的发展及展望 基于教育学和心理学的背景,多维项目反应理论既被看作是因予分析法的一种特殊 情况,也可以看作是一维项目反应理论在维度上的扩展。本章分别从两个方面观点阐述 了多维项目反应理论的理论基础,突出分析了观点的区别,为当前的多维项目反应理论 的应用提供了一个简明的总结,并且预测了在未来的研究领域中多维项目反应理论的发 展方向。 两个心理测量的研究领域为多维项目反应理论的发展提供了理论基础,一个是历史 悠久的因子分析法( f a ) ;另一个对多维项目反应理论有明确影响的教育心理测量领域 是一维的项目反应理论。 一、多维项目反应理论的理论来源 ( 一)多维项目反应理论来源于因子分析法 1 因子分析法 ( 1 ) 因子分析法的基本概念 因子分析法是为了要证实对于研究者所设计的测验确实存在某一潜在特质,并明确 分析潜在特质的内在结构,能够从一群具有共同特性的测量分数中抽离出背后潜在特质 的统计分析技术。简单地说,所谓因子分析法,是指在某一指标受多种因子综合作用的 情况下,为测定各因子变动对该指标变动的影响程度所使用的一种方法。嘲 因子分析是一种多变量统计方法,它能够将描述某一对象的多个变量缩减为少数几 个潜在变量。被缩减的变量其来源可以是心理学观察、心理学实验或心理测验,总之是 可以观察和测量的,所以称之为观察变量。概括出来的变量是不可直接观察和测量的, 但又是实际存在的潜在变量,在因子分析中称为公共因子。 ( 2 ) 因子分析法的基本原理 因子分析就是将错综复杂的实测变量归结为少数几个因子的多元统计分析方法。其 目的是揭示变量之间的内在关联性,简化数据,便于发现规律或本质。 因子分析的基本原理是根据相关性大小把变量分组,使得同组变量之间的相关性较 高,不同组变量之间的相关性较低。每组变量代表一个基本结构,这个结构用公共因子 来进行解释。 ( 3 ) 抽取公共因子的方法 在因子分析的公共因子抽取中,应最先抽取特征值最大的公共因子,其次是次大者, 最后抽取公共因子的特征值最小的,通常会接近于o 。 ( 4 ) 因子分析的目的 使因子结构简单化希望是以最少的公共因子对总变异量做出最大的解释,因而抽 取的因子愈少愈好,但希望抽取因子的累积解释的变异量愈大愈好。 9 东北师范大学硕士学位论文 2 来自于因子分析法的多维项目反应理论 任何回顾因子分析法和多维项目反应理论的数学方法的人都会注意到二者在方法 上有很多相似的地方。两种方法都试图定义能用于可以用作进一步分析处理数据的假定 量表。二者都定义了有专属来源和测量单位的量表。多维项目反应理论与大多数的因子 分析法不同之处在于输入变量( 项目) 的特征变化被认为是重要的,值得研究的。因子 分析法认为输入变量的特征的区别( 例如:均值,标准差,信度等) 是可去除的。由于 对这种变量特征的缺失,大多数因子分析的研究开始于分析相关矩阵,而相关矩阵的数 据都是来自于所有被忽略掉均值和标准差的变量。 例如,h a r m a n ( 1 9 7 6 ) 描述因子分析的目的如下:因子分析主要关心的是一个带有 少量因子的项目的一套线性变量分析的解决方案,这个方案能通过分析变量间的相互作 用来完成的。 相关矩阵作为分析数据的主要来源,输入变量的个体特征( 如:难度,区分度) 未 被考虑,同样猜测也未被作为一个可估计的参数与项目关联起来,它们都被当作应该通 过一个相关修正量来去除的可去变量( c a r r 0 1 l ,1 9 4 5 ) 。 随着不懈的研究,一些因子分析领域的专家有了不同的看法。几位因子分析法的研 究人员用非传统的观点论及了如何确认数据的假设变量的问题。其中以下几位专家被认 为在从因子分析方法中引入多维项目反应理论方面有特殊的贡献。 ( 1 ) h o r s t 嘲早期预见多维项目理论发展的是因子分析领域的专家r a u lh o r s t 在他的论文数据矩阵的因子分析( 1 9 6 5 ) 中他建议从一套假定变量中产生的数据矩 阵而不是相关矩阵。他提出:不应该从因子分析的处理方法开始,而应从考虑x 矩阵( 被 观察分数矩阵) 本身和决定u ( 真实分数矩阵) 开始,这些处理通常开始于从x 矩阵中 获得的相关矩阵。由于这种分析方法的依据是相关矩阵这就意味着相关矩阵比数据矩阵 x 包含有更多的信息,所以会导致很多的误解,不能很好的反映实际的情况。由于这个 原因,我们应该在考虑因子分析的问题和技术时首先注意数据矩阵。 在观察分数矩阵的工作中,h o r s t 必须处理与变量的特征有关的问题,在文中他讨 论了问题的提出,测量单位和因子分析结果变革的作用,更重要的是关于多维项目反应 理论的讨论。在关于因子分析的二进制矩阵的研究中,他反对将二进制变量标准化,相 反,他建议应重视项目难度变化的作用,他称之为“项目优先权的分散,这在概念上 相似于估计项目的难度参数及将这些估计应用于数据建模上。 虽然在h o r s t 的工作和当前的多维项目反应理论之间存在着许多相似之处,但是他 并没有给出估计项目参数的实际步骤或者是正确反应概率的公式,另外他讨论的重点仍 然在因子上而不是在项目和被试的特征上。 ( 2 ) c h r i s t o f f e r s s o n 们c h r i s t o f f e r s s o n ( 1 9 7 5 ) 比h o r s t 更直接地提出了项 目反应和人为因素之间关系的概率模型。他用了一个正态拱型模型去估计项目变量的临 界值,它类似于多维项目理论模型的难度参数。 c h r i s t o f f e r 8 8 0 n ( 1 9 7 5 ) 提出模型: p = p + 1 0 ( 2 1 ) 东北9 币范大学硕士学位论文 尸+ 由下列公式给出: 肛m 一,= i 赤唧出 式中:尸:项目正确反应概率; 啊:项目f 的临界值水平变量,f _ l ,2 ,z ; :因子相关矩阵; 占:随机误差分量; ) ,。:被试对项目f 的反应。 文中c h r i s t o f f e r 8 s o n ( 1 9 7 5 ) 介绍了因子载荷和临界值估计。 c h r i s t o f f e r s s o n ( 1 9 7 5 ) 的模型与多维项目反应理论的主要区别是:( 1 ) 他关注于塑造 假定连续的项目特征而不是正确反应的概率:( 2 ) 正确反应概率未作为一个项目变量或 个体特征因子,而是被塑造成样本容量的统计。 ( 3 ) m u t h e n n m u t h e n ( 1 9 7 8 ) 提出了比c h r i s t o f f e r s s o n ( 1 9 7 5 ) 更接近于当前多 维项目反应理论的模型,他也是用正态拱型模型去估计项目变量的临界值,提出了一个 关于被试正确反应概率的m 维向量p 的模型: 尸= 厂( 口) + s 其中护被分成两部分lq ,幺l ,b 是临界值的m 维向量,岛是总体四项相关矩阵 的对角线的元素向量,因此给出了正确反应概率,但是它并不取决于个体特征的向量。 c h r i s t o f f e r s s o n ( 1 9 7 5 ,) 和m u t h e n ( 1 9 7 8 ) 的想法都非常接近于当前的多维项目 反应理论,但是他们的模型中缺少的是将每个项目正确反应概率表示为一个在9 空间中 个体潜在特质的函数。 ( 4 ) m c d o n a l d m c d o n a l d ( 1 9 6 7 ) 提出了非线性的因子分析方法,这可能是与当 前的多维项目反应理论构想最为接近的因子分析法。m c d o n a l d 指出了关于因子分析中变 量的二级记分( 0 或1 ) 的问题,他表明如果被观察数据的回归允许是非线性的,那么 对二分数据的分析中难度因子的关系就能较容易的处理。 对于二分数据矩阵的因子分析问题,m c d o n a l d 清楚详细地说明了作为测试项目分析 依据的有关局部独立性的重要概念。 局部独立性的一般形式是: 厅纠缈) = 兀啊“陟) 一( 2 4 ) ,1 1 式中,) ,:被试反应向量; 缈:潜在特质向量; 矗妙) :潜在特质下被试反应向量的条件密度函数。 m c d o n a l d 还提出项目反应函数的基本形式可作为特征空间上的回归并简要陈述了 东北师范大学硕士学位论文 正确反应的条件概率的回归函数: a f = e 0 f l 缈)其中a 是项目,的正确反应概率一 ( 2 5 ) 在m c d o n a l d ( 1 9 6 7 ) 与当前多维项目反应理论之间的区别在于他使用了一个能导致 二分变量的取值超出 o ,1 区间的模型,并且他没有提供任何关于项目变量特征的解释。 讨论的焦点仅限于估计因子,而不是了解变量特征或者被试与项目之间的相互作用。 m c d o n a l d ( 1 9 8 5 ) 建立了因子分析和多维项目反应理论之间更为清晰的关系,实际上 m c d o n a l d 指出因子分析是项目反应理论的一种特殊情况。他曾指出:这里采取的观点是 公共因子分析是潜在特质理论的一个特殊情况,是以局部独立原则为基础的。 ( 5 ) b o c k 和a i t k i n u 2 。出于实用的目的,b o c k 和a i t k i n ( 1 9 8 1 ) 提出了将因子分 析与项目反应理论汇合的方法,并由此导出了多维项目反应理论。他们为一个多维特征 空闻构建了一个正态拱形模型,其中包括了月因子分析和项目反应理论表示的项目特 征。至此对于完整的多维项目理论唯一缺少的是对于测量被试和项目之间相互作用的项 目参数的解释,此时这个项目参数仍然被定义为因子分析中的因子。 b o c k 和a i t k i n ( 1 9 8 1 ) 提出了属于多维项目反应理论的项目特征参数化的一个关于 两参数正态拱形模型的二维引申,其模型表示为: 尸k 刮) = 去骆x p ( 一旁 ,开2 一 式中:_ ,晚) = 西+ 口,l 舅t + q 2 幺2 口是区分度参数: d 是难度参数: 口是特征向量 ( 2 6 ) 虽然b o c k 和a i t k i n ( 1 9 8 1 ) 提出的模型根本上与多维项目反应理论模型相同,但 它的主要作用同b o c k ,g i b b o n s 和m u r a k i ( 1 9 8 8 ) 所提出的因子分析模型一样,讨论的重 点仍然是定义因子而不是探究被试与项目的相互作用。 :( 二)多维项目反应理论来源于一维项目反应理论 项目反应理论讨论的焦点与因子分析的有很大的区别,项目反应理论是针对经典测 量理论提出来的,项目反应理论并不设法确定项目反应矩阵中数据的最小值是多少,项 目反应理论构建了被试和测试项目之间的关系。l o r d ( 1 9 8 0 ) 阐述项目反应理论的目标 为:我们需要用项目参数描述项目,用被试参数描述被试,我们可以预测任何被试对任 何项目反应的概率,甚至对于相似的被试以前从未参加过的类似项目。 项目反应理论的早期工作只是在一个维度上假定描述被试变化的参数( l o r d 和 n o vi c k ,1 9 6 8 :r a s c h ,1 9 6 0 ) ,但是很快这个假定不成立就表现出来了,而且经过进一步 广泛研究之后确定了假定的不合理性( c a m i l l i ,w a n g 和f e s q ,1 9 9 5 ) 。一些早期研究多 维项目反应理论的构想是在对项目反应理论和因子分析相比较之后提出来的。鉴于一维 1 2 东北师范大学硕士学位论文 项目反应理论以上的不足之处,研究者从不同角度将单一维度项目反应理论推广为多维 度项目反应理论。多维度项目反应理论为测验中所涉及的每个技能维度引入能力和题目 区分度参数,进而模拟测验题目和被试之间的交互作用。多维度项目反应模型是一个非 线性的用来表征题目参数、被试的潜在能力和其正确回答题目的概率之间的关系的数学 函数,通过这个模型可以使我们对测试者的多个特质进行分别的推断。 1 r a s c h 早期r a s c h ( 1 9 6 0 ) 仅研究了一维的项目反应理论模型,然而在1 9 6 2 年,他对自己 早期建立的模型进行了归纳,其中包括了可以用向量而不是标量来表示的被试特征,这 个概括的模型的数学表达式是: 尸q ) = 豳e x p 陆) ,g + 缈“吼+ g z g h + 以) 弦7 , 其中,矽,缈,z ,p 是项目得分的函数。 j 是可观察的被试和项目参数的充分统计量; 仃是项目参数向量: y ( ) 是保证项目反应函数值域为 o ,1 的正态函数。 虽然在r a s c h 的概括模型中被试的特征水平由参数族组成的一个向量指定,但是当 一直保持r a s c h 模型的概率时,对向量元素的估计受到质疑,为了保持r a s c h 模型的统 计充分性,允许独立估计被试参数和项目参数,妒,妙,z 分数向量的元紊必须己知,不能 从项目反应数据中估计。对于一维的案例,这个分数产生的项目特征的结果可能是0 也 可能是l ,同样的结果,正确反应的分数是一个护的充分统计量。 假设对于一套项目反应数据有二分的口维度( b ,吼) ,分数指定给维度l 的一 个项目的正确反应,分数甜,对应维度2 ,那么充分统计量只是对分数正确反应玎次, 即行蜥,同样充分统计量允为甩,然而由于甜。,留:为常数,每一个维度的分数仅仅是力 的函数,因此两个p 的估计是完全相关的,这时模型仍是一维的。 为了解决这个问题,研究人员在二级评分项目的处理过程中创造了多级记分项目, 例如r e c k a s e ( 1 9 7 2 ) 提出的多级记分测试项目,或者通过对该项目的分析 ( k e l d e r m a n 。1 9 9 4 ) ,允许更复杂的记分函数,:或者为每个项目提供不同的记分函数。 因为确定分数函数的准确性的过程和关系都非常复杂,使得r a s c h 模型多维形式的实用 性大打折扣。 2 l o r d 和n o v i c k n 耵 多维项目反应理论模型的最基本要求是由l 0 r d 和n o v i c k ( 1 9 6 8 ) 提出来的,其中 包括了完全潜在空间的定义和局部独立性的设想,但是他们并未给出一个完整的多维项 目反应理论的模型。 这里的局部独立性是指任何被试小组的所有特征可以用同样的值品,岛,吼表示, 项目分数的分布彼此间是完全独立的,其中七是维数,乡是完全潜在空间。 l o r d 和n o v i c k ( 1 9 6 8 ) 还分析了一维项目反应理论的正态拱形模型与公共因子模 东北师范大学硕士学位论文 型之问的关系,值得注意的是文章的主要部分是关于项目变量意义的讨论及其对解决实 际的测试问题的作用,他们关注的焦点已不再是来自于公共因子分析模型的结果的解 释。 3 s a m e ji m a 1 钉 s a m e j i m a ( 1 9 7 4 ) 给出了多维项目反应理论的另一个介绍。由于项目反应理论的公 式的典型假设为二级或多级记分反应是分割一个连续的反应变量的结果,他开发了一个 关于项目的多维反应模型,它有一个连续的反应变量_ z ,s a m e j i i l l a 模型的数学表达式是: 删= 去肚冲( 一譬卜 2 万2 、一 虽然s 鲫e j i m a 模型是第一个关于多维项目反应理论模型的正式介绍,但是除了 b e j a r ( 1 9 7 7 ) 之外,这个模型基本上没有被运用过,这可能是因为在心理和教育测试 中项目反应的连续性是很罕见的。相信随着评估性能及用途等的不断增加,s a 胚e j i m a 模型会有更广泛的应用。 ( 三)因子分析法与项目反应理论的比较 对于二级记分项目反应理论来说,因子分析法和多维项目反应理论的方法几乎是相 同的,如比较由b o c k 和a i t k i n ( 1 9 8 1 ) ,s 锄e j i m a ( 1 9 7 4 ) 和m c d o n a l d ( 1 9 6 7 ) 提出 的模型,为因子分析方法提供的软件既能用于因子分析法也能应用于多维项目反应理 论。进一步,m c k i n l e y ( 1 9 8 9 ) 开发的一个多维项目反应分析程序也有一些因子分析的 特点。 如果统计过程差不多相同,那么这两种方法之间的区别是什么呢? 首先,探索性因子分析是利用假设变量的相对少量的数据解释来自观察变量的大量 数据间的关系。而多维项目反应理论的核心是塑造被试和项目之间的相互作用关系的准 确模型,这种相互关系的表示法是值得注意的,它的目标是获得对影响被试和项目特征 的相互作用关系的因素的认识。r e c k a s 和h i r s c h

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论