(基础心理学专业论文)logistic模型c、γ参数对被试作答的拟合能力.pdf_第1页
(基础心理学专业论文)logistic模型c、γ参数对被试作答的拟合能力.pdf_第2页
(基础心理学专业论文)logistic模型c、γ参数对被试作答的拟合能力.pdf_第3页
(基础心理学专业论文)logistic模型c、γ参数对被试作答的拟合能力.pdf_第4页
(基础心理学专业论文)logistic模型c、γ参数对被试作答的拟合能力.pdf_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

g i ! ! i ! 搓型! ! y 叁塑盟蕉这佳簦曲型盒丝左 中文摘要 摘要:设计一个理想测验和一批理想的被试作答模式,使用极大似然估计方法 ( m i 甩) 编写程序对被试能力进行估计:从能力估计的角度,分析c 参数、y 参 数对理想被试对各种作答情况的拟合能力。( 1 ) 设计这批被试分别做对或做错一 道b 值不同的试题,用l o 埘s t i c 单、双参数模型对被试进行能力估计时,发现被 试能力估计存在着两类失拟现象;( 2 ) 在双参数模型基础上增加c 参数,对被试 进行能力估计,发现c 参数能有效纠正第一失拟现象,然而仍然存在第二失拟现 象,同时还存在第三失拟现象;( 3 ) 在双参数模型基础上增加y 参数,再对被试 进行能力估计,发现y 参数能有效纠正第二失拟现象,而仍然存在第一失拟现象, 同时还存在第四失拟现象;( 4 ) 同时增加c 、丫参数形成l o 西s t i c 四参数模型,再 对被试进行能力估计,这时该模型对各类失拟现象,包括第一、第二、第三、第 ,、 四失拟现象都具有良好拟合能力。( 5 ) 最后笔者指定被试能力分布呼,矿,使用 被试能力估计其它两种方法即最大后验估计( m a p e ) 和期望后验估讨( e a p e ) , 对被试能力进行估计,分析c 、y 参数对被试作答的拟合能力。研究结果表明:使 用m a p e 、e a p e 方法,可以得到与使用m l e 方法进行被试能力估计时相一致 的结论。 关键词:i r t ,l o g is t i c 模型,能力条件估计,失拟现象 ! ! 豇! ! 搓型:y 叁鍪盟蕉这往置艘赵盒碰盔 !。 a b s t l 。a c t a b s t r a c t :a n e rd e s i 2 n i n 2a nj d e a lt e s ia n dam o d e lo fi d e a lr e s p o n d e n c ef r o ms o m e s u b i e c t s ,t h ef h e s i sm e a n st oc o m p i l eap r o g r a mf o re s l i m a c i n gt h ea b i l i t j e so fl h e s u b i e c i sb vt h eu s eo fm a x i m u ml i k e l i h o o de s t i m a t i o n ( m l e ) 1 t t r i e st oa n a l y z et h e i n f l u e n c e so fcp a r a m e t e ra n dyp a r a m e t e ro nt h ef i to fv a r i o u sr e s p o n d e n c e sf r o mt h e s u b j e c f sf f o mt l l ep e f s p e c t j v eo fa b j l j t ye s t i m a t i 彻( 1 ) f i r s tm a k et h es u b j c c f sg i v e e i t h e rr k h to rw r o n gr e s p o n s e st ot h es a m eq u e s t i o nw “hd i f :e e r e n tbv a i u e w h e n e s t i m a t i n gt h ea b i l i t i e so ft h es u b j e c t sw i t ht h eu s eo fo n e p a r 锄e t e ro rt w o p a r a m e t e r l o g i s t i cm o d e i ,“i sf o u n dt h a tt h c r ee x i s t st w ok i n d so fu n f i t s ( 2 ) e s t i m a t em e a b i l i l i e so ft h es u b i e c t sa f t e ri n t r o d u c i n gcp a 姗e t e ro nt h eb a s i so ft h et w o p a r a m e t e r m o d d t b e 丘璐fu n 矗fc a nb 8f c c l j f j e d h o w c 张lm es e n dh n 成s 删c x j s | sa n dl b e t h i r du n f jc a p p e a r s ( 3 ) t h e ne s t i m a t ea g a i na f t e ri n t m d u c i n g rp a r a m e t e l i ti s d i s c o v e r e dt h a l h es e c o n du n f j ti sr e c j f j e d ,b u t h ef i r s tu n f i ts t i l le x i s t sa n dt h ef o u i f h u n f i ta p p e a r s ( 4 ) f o r ml o g i s t i cf o u 卜p a r a m e t e rm o d e lb yi n t r o d u c i n gcp a r a m e t e ra n d 丫p a r a m e t e ra tt h es a m et i m ea n de s t i m a t eo n em o r et i m e t h i sm o d e lm d k e sa nk i n d s o fu n e t s ,j n d u d i n gt h ef j r s i ,s e c o n d ,t h j r da 玎df b u n hu n f j t s ,i e c t j f i e d ( 5 ) f j n a l l y ,伽 i h ea s s u m p t i o nt h a tt h es u b i e c ta b i l i t yd i s t r i b u t i o ni sk o w n ,e s t i m a t et h ea b i l j t j e so f t h es u 场e c t sw i t ht h eo t h e rt w om e t h o d s ,t h a ti s ,m a x i m u map o s t e r i o re s t i m a t i o n ( m a p 日a n de x p e c t e 0ap o s t e r i o re s t i m a t i o n ( e a p 勘w ec a nc o m et ot h e c o n c l u s i o nt h a tt h es a m er e s u l t se a nb eg a i n e dw h e ne s t i m a t i n zt h ea b j l i t i e sw i t ht h e u s eo f t h e m e t h o d o f m l e k e yw o r d s :i r t l o 西s t i em o d e l ,a b 谢y 船i i m a t i 咖,u n m 2 l 蛆i ! i 搓型! ! i 叁塾型蕉达在簦曲拟盒篮盘 l o g i s t i c 模型c 、丫参数对被试作答的拟合能力 1 研究背景与目的 美籍华人学者张华华在一篇论文【1 】中提及,目前在美国c a = r ( 计算机自适应 测验) 测试中,当机考成绩差的考生再参加纸笔考试时却获得商分。而且美国高 等教育年鉴报道( c a r l s o n ,2 0 0 0 ) :2 0 0 0 年e t s 曾允许大约o 5 的g r e 考生自 愿免费重考,原因是他们的机考成绩不可信,却没有对这些学生的考分作任何评 价。张华华认为很可能是这些考生机考成绩太低而不可信。张华华从能力估计的 算法和选题策略的角度对此提出了相应解决的方案。笔者也赞成张华华的观点, 若是机考成绩太高,考生就不可能自愿重考。在本文中将从c 、y 参数对被试作 答的拟合能力角度,论述为何会出现机考成绩太低的问题,并进一步探讨如何解 决。心理科学中一论文【2 】中论述到在l d 画s t i c 三参数模型下,被试答错一道 容易的项目,特别是存在作答偶然性时,则使其能力估计值后退幅度较大;而 l 0 9 i s t i c 四参数模型对被试答错容易的项目,特别是存在偶然性时有良好的拟合 作用。h g i s t i c 单、双参数模型的项目特征曲线都存在上渐近线为1 ,下渐近线 为0 ,即存在天花板现象和地板现象。而l o 西s t i c 四参数模型的c 参数的函数意 义反映的是低分被试在在测验项目上存在猜测现象,即在项目特征曲线上的下渐 进线不是0 ,而是比0 要略大一些,我们一般把这种现象定义为猜测现象或高地 板现象。l 0 9 i s t i c 四参数模型的y 参数的函数意义是反映高分被试在测验项目上 存在一定答错的概率,即在项目特征曲线上的上渐进线不是1 ,而是比1 要略小 一些。笔者把这种上渐近线小于1 的现象定义低天花板现象。 y 参数反映的是高分被试在测验项目上存在一定答错概率,即在项目特征曲 线上存在低天花板现象。在实际测验中是否存在低天花板现象? 在叶佩华先生主 译的心理测验分数的统计理论一书中在解释第1 6 章的“题目一测验间的回 归”时提供了一些测验项目的资料,其中题目一测验间的回归图【3 】显示,这些项 目存在低天花板现象。笔者又分析了浙江台州市某县中的一批高三化学模拟考试 数掘( 该次测验的前面3 5 选择题) ,该批数掘共计6 8 2 名被试。把这些被试按原 始得分由高到低分为1 0 类,对3 5 道试题进行分析,得到各类被试的通过率与总 分分类回归的曲线图,发现这些试题都不同程度存在低天花板现象和高地板现 象,笔者分析了这些项目与总分分类回归的曲线图( 见图1 和图2 1 。 目前i r t 理论研究和c a r 实际应用中,主要使用的数学模型是l o g j s t j c 模型。 而在c a t 实际应用中使用较早、使用较多的是l o g i s i i c 单参数模型。l d g i s t i c 4 l 蛆i ! l i g 撞型! ! y 釜塾越遮这往签丝垫盒鳇左 图1 第3 题的项目与总分分类的曲线图 p ( 通过率) 总分分兴 ,皇分分亨咚 图2 第1 7 题的项目与总分分类的曲线图 三参数模型在实际中应用较晚,目前在美国的g r e 和s a l l 的巴虹中就是以 功画s t j c 三参数模型作为其测验的基础。当然l d g i s t i c 三参数模型应用较晚是有 其原因的,一方面是c 参数往往定义为猜测率,其实际意义不明确;另一方面是 c 参数难于估计,三个项目参数( a 、b 、c 参数) 放在一起估计比较繁杂。而对 于l d g i s t i c 四参数模型偶尔有学者f 4 】提到了并只是作了简略的介绍,并认为 “l o g j s i i c 四参数模型只有理论意义,在实际中很少使用”。目前笔者在国外的各 类期刊上,都没有找到对l o g i s t i c 四参数模型进行研究的相关论文和资料。目前 用于参数估计的国外软件b i l o g3 0 、m i s c r oo 坷和国内自行研发的测量通用 程序( a n o t e 软件) 中,都只有功叠i s t i c 单、双、三参数模型的参数估计( 在 软件b i l ,o g3 0 中其默认推荐l o 画s t i c 双参数模型) 。 在本文中设计一个理想测验和一批理想的被试作答模式,通过比较不同模型 下对理想被试不同作答情况的拟合情况,柬分析c 、y 参数对被试作答的拟合能 力,从而推动i r t 基础数学模型研究方而的进展。 l 篮i i 搓型! 芏壹塾越越达往签鲍塑金钱左 2 研究设计 2 1 模型介绍: 在本文中主要使用单维能力1 ,0 计分的l o g i s t i c 模型。研究中将使用的 模型有l 0g i s t i c 单、双、三、四参数模型,分别为: 一是含参数b 的l d g i s t i c 单参数模型( r a s c h 模型) ,即 p 一1 ( 1 + e x p ( 一1 7 + ( e - b i ) ) ) ; 二是含参数a ,b 的l o g i s t i c 双参数模型,即 p i = 1 ( 1 + e 】叩( 一1 7 + a i + ( e _ b i ) ) ) ; 三是含参数a ,b ,c 的l o g i s t i c 三参数模型( 以下简称为功g i s t i c 三参数模 型( c 型) ) ,即 p i = c i + ( 1 - c i ) ( 1 + e x p ( 一1 7 + a i + ( e - b j ) ) ) ; 四是含参数a ,b ,t 的h g i s t i c 三参数模型( 以下简称为l d g i s t i c 三参数模 型( y 型) ) ,即 p i :吖i ( 1 + e x p ( - 1 7 + a i + ( o b j ) ) ) ; 五是含参数a ,b ,c ,丫的l 0 9 i s c i c 四参数模型,即 p i = c i + “i c i ) ( 1 + e x p ( 一1 7 + a i + ( 0 b i ) ) ) 。 通过比较五个l o g i s t i c 模型对理想被试作答的拟合情况来研究c 、y 参数对 被试作答的拟合能力。 ( 1 ) 用l d g i s t i c 单、双参数模型来拟合理想被试的不同作答现象,分析 h g i s i i c 单、双参数模型对理想被试作答的拟合情况。 ( 2 ) 在l 0 鲥s t j c 双参数模型的基础上加上c 参数,估计理想被试的能力值, 得到l o 幽t i c 三参数模型( c 型) 对理想被试的拟合情况,分析c 参数对被试答 的拟合能力。 ( 3 ) 在l 0 9 i s t i c 双参数模型的基础上加上丫参数,估计理想被试的能力值, 得到h g i s t i c 三参数模型( t 型) 对理想被试的拟合情况,从而分析t 参数对被 试作答的拟合能力。 ( 4 ) 在l o 画s t i c 双参数模型基础上同时加上c 参数、t 参数,估计理想被 试的能力值,得到c 参数、t 参数对理想被试的联合拟合情况,分析c 参数、丫 参数对被试作答的拟合能力。 2 2 数据设计: 2 2 1 测验设计:首先设计了一个理想化的测验( 见表1 ) ,该测验共有3 5 道试题。这些项目难度b 值取值情况如下:第1 题b 值为3 0 ,从1 至1 0 题的难度依 次递增,递增幅度为0 3 ,第1 0 题b 值为o 3 ;第1 1 0 0 题的b 值都为o 0 ;第3 1 题b 6 l 鲣i ! i ! 堪型! ! y 叁熬盟熊达侄鳖鲍塑盒鳇左 值为o 3 ,从3 1 5 题的难度依次递增,递增幅度为0 3 ,第3 5 题b 值为1 5 。 表l测验项目 题号l 1234567891 01 1 3 03 13 23 33 43 5 b 值i 一3 o 2 7 2 4 2 1 1 8 1 5 1 2 o 9 o 6 一o 3 o oo 3o 6o 91 21 5 a 值l 1 2 i 1 01 。2 2 2 2 被试作答设计:假设有3 5 个被试在上述理想测验的3 5 道试题上有相 同的作答模式( 见表2 ) ,即第1 1 0 题都做对了,第1 1 以0 题b = 0 o 的试题上做 对了1 1 道题,第3 1 3 5 题都做错了。然后让第1 号被试终止测验,其能力估计 值作为第2 至3 5 号被试的参照值:2 至3 5 号被试继续进行第3 6 题的测试。此 时这3 4 位被试将被给予不同的项目进行测试,并且分为答对和答错两类作答情 况:( 1 ) 2 至1 8 号被试分别被给予难度不同的试题,且难度是逐渐递增的,2 号 被试所给。弘项目难度为3 2 ,3 号被试为2 8 ,递增的幅度为0 4 ,依次类推,1 8 号被试所给予项目难度为3 2 ;而且这1 7 位被试都答对了。( 2 ) 1 9 至3 5 号被试 也分别被给予难度不同的试题,且难度是逐渐递增的,1 9 号被试所给予项目难 度为- 3 2 ,2 0 号被试为一2 8 ,递增的幅度为0 4 ,依次类推,3 5 号被试所给予项目 难度为3 2 ,但1 9 3 5 号被试都答错了。我们被试这些作答差异中的一部分定义 为作答偶然性。不考虑c 参数的情况下,根掘被试做对该题的概率p 即 p = 1 “1 + e x p ( _ 1 7 + a + ( o - b ) ) 柬定义:当被试做对b 0 的试题的概率p 小于0 0 5 ,而 被试却做对了的时候,则定义为作答偶然性:当被试做对b 0 的项耳,特别是被试作答存在偶然性【6 】时,在双参数模型下进行能力估计,双 参数模型不能够很好的拟合这种情况,笔者将这种不拟合的情况定义为第一失拟 现象。本文对“失拟现象”的定义是指在被试能力估计时,被试所得的步长大小 与被试所作答项目的项目信息量大小不相符的现象。 ( 2 ) 第二类被试( 1 9 3 5 号) 答错了第3 6 题,发现随着被试答错试题的b 值增大i 其所得负步长的绝对值在逐步减小。先看2 7 3 5 号被试所得的步长,这 些被试的负步长的绝对值的大小,随着该被试所答错项目的信息量( 见表3 的“项 目信息量”一列) 减小而减小,基本上是良好拟合的。本文对“良好拟合”的定 义是指在被试能力估计时,依据项目信息量的大小来给予被试相应大小的步长, 且被试答对给予正步长,答错给予负步长。但对于1 9 2 6 号被试,这些被试所答 错了第3 6 题,其项目的b 值小于其能力值,除了被试有可能是能力不足之外, 也有可能被试有其它独特的见解或疏忽大意,导致答错了本来有很大概率答对的 1 0 k q g i ! i 槿型13 叁塾盟越达佳签鲢越盒s 左 被试 表3 双参数模型下被试能力估计值前后变化的步长 薏登:? 孽项目信息量 的项目b 值圳日佰思里1 答对或答错不同蹶数的步长 2345 3 2 2 8 2 4 2 1 6 1 2 o 8 o 4 0 0 4 o 8 1 2 1 6 2 2 4 2 8 3 2 0 0 1 2 6 0 0 2 4 6 0 ,0 4 7 8 0 0 9 1 4 0 1 6 9 5 0 2 9 7 2 o 4 7 3 2 o 6 4 7 7 0 7 2 2 5 0 6 4 2 3 0 4 6 6 2 0 2 9 1 4 0 1 6 5 7 0 0 8 9 2 o 0 4 6 7 0 0 2 4 0 o 0 1 2 4 o 加2 2 0 2 0 4 2 - 0 3 0 7 0 - 0 4 1 1 7 一o 5 1 9 3 o 1 0 2 0 0 2 0 3 7 0 3 0 6 1- 0 4 1 0 2 0 5 1 6 9 o 1 0 1 5 o 2 0 2 6 0 3 0 4 1 - 0 4 0 6 9 0 5 1 1 7 0 1 0 0 6 0 2 0 0 3 0 2 9 9 8 0 3 9 9 8 o 5 0 0 6 o 0 9 8 5 0 1 9 5 3 o 2 9 0 8 0 3 8 5 2 - 0 4 7 8 6 0 0 9 4 1一o ,1 8 5 1- 0 2 7 3 0- 0 3 5 8 0- o 4 3 9 7 - o 0 8 5 7一o 1 6 6 5- 0 2 4 2 4- 0 3 1 3 7o 3 8 0 5 0 0 7 1 8 o 1 3 7 6 - o 1 9 7 9 0 2 5 3 3 - 0 3 0 4 5 _ o 0 5 3 2 0 1 0 1 2 ,0 1 4 4 9 0 1 8 4 9 - o 2 2 1 7 o 0 3 4 0 0 0 6 5 1 0 0 9 3 7 一o 1 2 0 2 o 1 4 5 0 o 0 1 8 90 0 3 6 7o 0 5 3 50 0 6 9 4- 0 0 8 4 6 o 0 0 9 50 0 1 8 70 0 2 7 50 0 3 6 1 - 0 0 4 4 4 o 0 0 4 40 0 0 8 8o 0 1 3 20 0 1 7 4o 0 2 1 6 0 0 0 2 0 0 0 0 4 0 - 0 0 0 6 0 一o 0 0 8 0 - o 0 1 0 0 0 0 0 0 9 0 0 0 1 8 - 0 0 0 2 7 0 0 0 3 6 o 0 0 4 5 0 0 0 0 4 0 0 0 0 8 - 0 0 0 1 2 - 0 0 0 1 6 0 0 0 2 0 - o 0 0 0 2 o 0 0 0 3 0 0 0 0 5 - 0 0 0 0 7 - o o 0 0 9 注秆:表中字体加粗的数字,表示该数值为“项目信息晕”一列的最大值。本文中以下 的各表中“项目信息龟”加粗字体的注秆与此同。 1 l ”加n规驺m笛拍打勰凹如n让孙 第二类被试答错v 地b i ! i 摸型:芏叁数盟整黛缝签魈垫盒丝左 项目,这时就应该给予相对较轻的“惩罚”。然而我们看到1 9 号被试答错了最 容易的一道试题,其答对该题的概率p 值为o 9 8 6 ,可见此题答错存在作答偶然 性现象l ”,然而该被试所得负步长的绝对值却是最大的。因此被试在答错b 值小 于o 的项目,特别是存在作答偶然性时,双参数模型不能够良好拟合这种情况, 笔者将这种不能拟合的情况定义为第二失拟现象。 ( 3 ) 以上探讨了被试答对或答错一道b 值不同的项目时,b g i s t i c 双参数模 型对其能力估计拟合情况。当被试答对或答错多道试题b 值不同的项目时, l 0 西s t i c 双参数模型的拟合情况会是怎么样呢? 表3 中同时列出了这些被试在答 对或答错1 至5 道试题后所得步长的情况。我们由表中数掘分析可得,作答多题 后与作答一题后的良好拟合与失拟现象是一样的:随着该被试对该项目相同 作答情况数量增多,当被试答对某一项目且该项目b o 时,k g i s c i c 双参数模型在其能力估计时仍然能够良好拟合。 与此同时,当被试答对某一项目且该项目b o ,或被试答错某一项目且该项目b c o ,l 0 百s t i c 双参数模型不能够良好拟合,且这些被试不能够拟合程度随着对该 题相同作答情况的数量增多而呈现算术累加。 ( 4 ) 在以上各个研究过程把双参数模型换用单参数模型来对理想被试的作 答情况进行拟合分析,发现单参数模型对被试的良好拟合情况和失拟现象,与双 参数模型的情况是一样的,可以得到同样的结论。 3 1 4 结论:当被试答对某一项目且该项目b 0 时,k g i s t i c 单、双参数模型在其能力估计时能够良好拟合。然而也 存在两类不能良好拟合的情况:当被试答对某一项目且该项目b e 时,或当被试 答错某一项目且该项目b 0 时,l o g i s t i c 单、双参数模型在其能力估计时不能够 良好拟合,本文中分别定义为第一失拟现象和第二失拟现象。 在接下柬部分,笔者就在h g i s t i c 双参数模型基础上增加c 参数,或丫参数, 或同时增加c 和t 参数,来讨论c 参数、丫参数对理想被试不同作答情况的拟合 能力。 3 2 c 参数对理想被试不同作答情况的拟合能力 3 2 1 研究目的:在l o g i s t j c 双参数模型基础上增加c 参数,研究l o g i s t i c 三参数模型( c 型) 对被试能力估计值有什么影响,及c 参数对理想被试作答情 况的拟合能力。 3 2 2 研究方法:设定理想测验的所有项目都用l 0 西s t i c 三参数模型( c 型) 来描述,即前3 5 题在双参数的基础上增加c 参数属性,且令c 参数为0 1 0 。1 3 5 号被试完成前3 5 题,使用能力估计程序m l e 3 1 ,估计出其能力估计值0 为 - o 0 0 7 5 ,把o 作为2 3 5 号被试完成第3 6 题后能力估计值变化的参照值。2 5 g i ! i ! 槿型! ! i 叁垫越熊达佳簦鲍型盒丝友 号被试完成第3 6 题后的能力估计值减去参照值,即为该被试作答第3 6 题后所得 的步长。由以往的研究报告和项目参数估计软件的参数估计结果可知:c 参数的 变化范围一般为o 1 0 至o 3 0 之间。为了全面研究c 参数在不同水平上的情况, 在本文中让被试所作答的第3 6 题的c 参数的大小在0 至0 5 0 之间变化,进而比 较模型在c 参数的不同水平上所估计的被试能力值和步长情况。 3 2 3 研究结果:使用能力估计程序m l e 3 1 估计出被试的能力值,并减去 参照值o ,得到被试所得的步长,在表4 中的各列数据列出了被试在第3 6 题的c 参数不同水平值上的步长情况。当这些被试所答的第3 6 题的c 参数为0 时的步 长,见表4 的最后一列。我们看到这些被试能力估计的步长变化趋势与双参数模 型时的情况相同,存在前面所论述的两类失拟现象。 我们再来探讨当c 参数不为0 时,两类失拟现象在l o g i s t i c 三参数模型( c 型) 下的改进情况。先看第一类被试( 2 ,1 8 号) ,在表4 中以c = o 1 0 时为例进 行分析,这时被试的步长开始出现两头小,中间大的现象。1 8 号被试所得的正 步长不再为最大了,而是1 2 1 8 号被试的正步长随着所答对项目的项目信息量 ( 表4 中的第3 列) 同步变化,可见l o g i s t i c 三参数模型( c 型) 使得第一失拟 现象得到了较好纠正。( 2 ) 我们再横向比较,当c 参数水平由o 1 0 逐步减小时, 被试在c 参数各水平上的正步长的峰值的位置发生了细微的变化,由c = o 1 0 这 一列的1 2 号被试( 做对项目b = o 8 ) ,逐步转移到了c = 0 0 0 0 1 这一列的1 7 号被 试的能力估计值上( 做对项目b = 2 8 ,直至c = 0 这一列峰值在被试做对b = 3 2 的 试题上。这说明随着c 参数的减小至o ,c 参数的拟合能力逐步在减小,直至c = 0 时没有拟合能力,回到双参数的失拟情况,即存在第一失拟现象。换个方向, c 参数由o 1 0 变化到0 5 0 这个过程来看,c 参数增大,c 参数对被试拟合能力仍 然存在;但第一类被试答对不同难度试题后所获得步长的绝对差距都在减小,即 被试答对不同项目所获得的能力步长都很小,答对这些试题对被试区分力在减 弱。由表4 可知,c 参数在o 1 0 至0 3 0 这个区间时第一类被试能力峰值与项目的 信息量的变化比较一致,是比较理想的拟合,即既对被试能力估计拟合能力的力 度大,同时又对被试具有很强的区分性。当然一个项目的c 参数是由项目本身属 性决定的,c 参数的数值不同,该项目的拟合能力就不同;而c 参数的数值是在 项目参数估计时确定的,我们不能随意的增大或减小某个项目的c 参数的大小。 一般来说,在项目参数估计软件如b i l o g 3 o 中,c 参数的估计值范围一般都在 0 1 0 至0 3 0 之间,这时c 参数既对被试能力估计拟合能力的力度大,同时又对被 丝直l i 搓型! 芏叁熟型熊达缝签笪型盒篚左 表4 三参数模型( c 型) 下被试在c 参数各个水平上的步长 被项目 信息量 c 参数的水平值 试b 值( c = 0 1 时) 5 04 03 02 01 00 10 0 10 0 0 10 0 0 1 1 3 1 2 3 2 1 2 3 2 一1 2 3 2 1 2 3 2 1 2 3 2 一1 2 3 2 - 1 2 3 2 - 1 2 3 2 1 2 3 2 0 0 2 2 21 2 2 9一1 2 2 9 1 2 2 9一1 2 2 91 2 2 9一1 2 2 91 2 2 9一1 2 2 9 - 1 2 2 9 o 0 4 3 0 1 2 2 2 1 2 2 2 1 2 2 2 1 2 2 2 1 2 2 2 - 1 2 2 2 一1 2 2 2 一1 2 2 2 - 1 2 2 2 0 0 8 2 0 1 2 0 7 ,1 2 0 7 1 2 0 7 - 1 2 0 7 1 2 0 7一1 2 0 7 一1 2 0 7 一1 2 0 7 - 1 2 0 7 o 1 5 1 5、1 1 7 51 1 7 5 儿7 5- 1 1 7 51 1 7 5一1 1 7 5- 1 1 7 5- 1 1 7 5 一1 1 7 5 o 2 6 4 01 1 0 91 1 0 9 1 1 0 9一1 1 0 9一1 1 0 9- 1 1 0 91 1 0 9 1 1 0 9 1 1 0 9 0 4 1 5 1 0 9 8 9 0 9 8 9 0 9 8 9 0 9 8 90 9 8 90 9 8 9- 0 9 8 90 9 8 9 0 9 8 9 0 5 5 4 50 8 0 1一0 8 0 1 0 8 0 1- 0 8 0 1 ,0 8 0 1一0 8 0 1- 0 8 0 l- 0 8 0 1 - 0 8 0 1 o 5 9 0 4 0 5 7 0 一0 5 7 0 一0 5 7 0 一0 5 7 0 一0 5 7 0 一0 5 7 0 一0 5 7 0 一0 5 7 0 - 0 5 7 0 0 4 8 1 80 3 5 1一0 3 5 1 0 3 5 10 3 5 10 3 5 1一0 3 5 10 3 5 1- 0 3 5 l - 0 3 5 1 0 3 0 0 80 1 9 00 1 9 0 0 1 9 0 一0 1 9 00 1 9 0- 0 1 9 00 1 9 00 1 9 0 - 0 1 9 0 0 1 4 7 4 0 0 9 4 0 0 9 4 0 0 9 4 0 0 9 4 0 0 9 4 - 0 0 9 4 - 0 0 9 4 0 0 9 4 一0 0 9 4 0 0 5 8 8 0 0 4 4 0 0 4 4 0 0 4 4 一0 0 4 4 0 0 4 4 - 0 0 4 4 - 0 0 4 4 - 0 0 4 4 - 0 0 “ 0 0 1 9 9 0 0 2 0 0 0 2 0 0 0 2 0 0 0 2 0 0 0 2 0 - 0 0 2 0 - 0 0 2 0 - 0 0 2 0 一0 0 2 0 0 0 0 6 0 0 0 0 9 0 0 0 9 0 0 0 9 0 0 0 9 0 0 0 9 加0 0 9 册0 9 一0 0 0 9 - 0 0 0 9 o 0 0 1 7 0 0 0 4 一0 0 0 4 0 0 0 4 - 0 0 0 4 - 0 0 0 4 - 0 0 0 4 0 0 0 4 一0 0 0 4 一0 0 0 4 o 0 0 0 5 0 0 0 2 0 0 0 2 0 0 0 2 一o 0 0 2 一0 0 0 2 一0 0 0 2 一0 0 0 2 一0 0 0 2 - o 0 0 2 注释:表中字体加粗的数字,表示该数值为该列的该类被试正步长的展大值( 或负步匠 的晟小值) ,本文中以f 的荐表中加扭字体的注秆与此同。 1 4 抛椰“也=;们舢州o吣n拍2“弘 弛拶加玎砣m巧拍”鹅凹孔弛站斛弱 第二类被试答错v l ! g i ! ! i 撞型g :芏壹熬盟披达佳签曲型盒能左 试具有很强的区分性。 对于第二类被试( 1 9 3 5 号) 的情况,仍以c = o 1 0 这一列为例,发现随着 1 9 至2 6 号被试,仍然存在答错bc o 试题,其所得负步长的绝对值却相对较大的 情况,即仍然存在第二失拟现象。可见l 0 2 i s t i c 三参数模型( c 型) 仍然不能较 好纠正第二失拟现象。再横向观察表4 ,c 参数水平逐步增大时,发现第二类被 试在c 参数各水平上( 包括c 参数为o ) 的步长都是一个值。也就是说,同一被 试( 即1 号被试) 分别答错了a 参数和b 参数相同、c 参数不同的项目,分 别对该被试进行能力估计,则其能力估计值是一样的。c 参数不同,项目的特征 属性就不同,这时项目信息量也不同,对被试能力估计的精度影响应该不一样, 可见l 0 西s t i c 三参数模型( c 型) 不能区分这种情况,在本文中把这种失拟情况 定义为第三失拟现象。 ( 3 ) 以上是探讨被试答对或答错一道b 值不同的项目时,l o g i s t i c 三参数模 型( c 型) 拟合情况。当被试答对或答错多道b 值不同的项目时,l o g i s t i c 三参 数模型( c 型) 对理想被试作答的拟合情况会是怎么样呢? 表5 列出了在这些被 试答对或答错多道试题后所得的步长,我们由表5 分析可以得到:被试作答多题 时的良好拟合和失拟情况与被试作答一题时的情况相一致,即能够较好纠正第一 失拟现象,不能较好纠正第二失拟现象;同时我们还可以得到另一个结论,就是 随着被试答错b 0 的现象,并能良好的拟合这一现象。 这是用数学模型来反映并拟合客观现象,具有一定测量意义和价值。c 参数能够 拟合被试答对不同b 值的项目作答情况,因而笔者将c 参数定义为正答拟合参数。 3 3 丫参数对理想被试作答情况的拟合能力 3 3 1 研究目的:l 0 9 i s t i c 双参数模型的基础上,加入c 参数就能够较好的纠 正第一失拟现象。笔者就猜想应该存在另外一个参数能够较好纠正第二失拟现 象,于是笔者就在l d g i s t i c 双参数模型的基础上加入y 参数,分析跏百s t i c 三参 数模型( t 型) 对被试作答情况的拟合能力。在被试答对或答错不同b 值的项目 1 5 k g i ! i ! 槿型! ! y 叁塑盟超彗挂簦鲍熬盒鳇盘 被试 情况 表s 三参数模型c 型被试的步长( 答对或答错多道试题) 第3 6 4 0 题项目信息量 答对或答错多道试题的题数 的项目b 值 ( c 2 0 1 0 ) t 了r r 1 - 3 2 2 8 - 2 4 2 1 6 1 2 0 8 o 4 o o ,4 0 8 1 2 1 6 2 2 4 2 8 3 2 0 0 1 1 3- 0 1 2 3 2 - 0 2 5 3 6 - o 3 9 6 8 o 5 6 3 4 0 7 8 1 2 o 0 2 2 20 1 2 2 9 - 0 2 5 2 80 3 9 4 9- 0 5 5 9 20 7 6 9 5 0 0 4 3 0 0 1 2 2 2 o 2 5 0 9 0 3 9 0 8 - o 5 5 0 0 o 7 4 6 4 0 0 8 2 0 - o 1 2 0 7 - o 2 4 6 8 - 0 _ 3 8 1 9 0 5 3 1 5 加7 0 5 1 0 1 5 1 5- o 1 1 7 5- 0 2 3 8 2 o 3 6 4 2 一o 4 9 7 6 0 6 4 0 8 o 2 6 4 0 - 0 1 1 0 9 0 2 2 1 6 o 3 3 2 5 o “3 5 0 5 5 4 1 o 4 1 5 1 - 0 0 9 8 9 - o 1 9 3 5 田2 8 3 9 0 3 6 9 9 0 4 5 1 4 0 。5 5 4 5 一o 0 8 0 1o 1 5 3 8o 2 2 1 80 2 8 4 50 3 4 2 6 0 5 9 0 4 o 0 5 7 0 - o 1 0 8 6 ,o 1 5 5 6 0 1 9 8 8 加2 3 8 7 0 4 8 1 8 - o 0 3 5 1 - 0 0 6 7 3 0 0 9 7 0 0 1 2 4 7 - 0 1 5 0 5 0 r 3 0 0 8 _ 0 0 1 9 0 0 0 3 6 9 - 0 0 5 3 8 o 0 7 0 0 0 0 8 5 4 0 1 4 7 4 0 0 0 9 4o 0 1 8 4o 0 2 7 20 0 3 5 70 0 4 4 0 0 0 5 8 80 0 0 4 4 - 0 0 0 8 7 0 0 1 2 9 0 0 1 7 0 0 0 2 1 l 0 0 1 9 9 一o 0 0 2 0 _ o 0 0 4 0 0 0 0 5 9 _ 0 0 0 7 8 o 0 0 9 7 0 0 】6 0一o 0 0 0 9- o 0 0 1 8- 0 0 0 2 7- 0 0 0 3 5 0 0 0 4 4 0 0 0 1 7o o 0 0 4- o 0 0 0 8_ 0 0 叭2- 0 0 0 1 6- 0 0 0 2 0 0 ,o 0 0 5 一o 0 0 0 2 0 0 0 0 4 - o 0 0 0 5- 0 0 0 0 7 _ o ,0 0 1 6 坶加h毖幻m巧拍卯勰凹m弛船舛箝 第二类被试答错v ! 篮i ! ! i ! 撞型! 芏叁堑盟越这佳筌笪塑盒鳇左 下,研究l 0 9 i s t i c 三参数模型( 丫型) 对被试能力估计有什么影响,及该模型对 理想被试不同作答情况的拟合能力。 3 3 2 研究方法:设定理想测验的所有项目都用h 百s t i c 三参数模型( y 型) 束描述,即前3 5 题在双参数基础上增加丫参数属性,且令7 参数为0 9 5 。1 3 5 号被试完成前3 5 题,使用能力估计程序m u 玛2 ,估计出其能力估计值o 为 o 1 5 1 6 ,作为2 3 5 号被试完成第3 6 题后能力估计值变化的参照值。2 码5 号被试 完成第3 6 题后的能力估计值减去参照值,即为该被试的步长。笔者使用 m m ! e m 方法编写了h 百s i i c 三参数模型( y 型) 项目参数估计估计程序,使 用该程序对多批模拟数据和实测数掘进行了参数估计,由结果可得出y 参数的变 化范围为o 8 5 至o 9 9 之间。为了全面研究y 参数在不同水平上的情况,在本论 文中让被试所作答的第3 6 题的y 参数的大小变化在0 7 0 至0 9 9 9 9 之问,进而比 较y 参数在不同水平上的被试能力估计值和被试所得到的步长情况。 3 3 3 研究结果:使用程序m l e 3 2 估计出被试的能力值,并减去参照值o , 得到被试在1 r 参数各个水平上的步长,见表6 。当第3 6 题的t = 1 时( 见表6 最后 一列) ,我们看到这些被试的步长情况与双参数模型时的情景相同,存在第一失 拟现象、第二失拟现象。 我们再来探讨当丫参数不为1 时,在k g i s t i c 三参数模( t 型) 下对两类失 拟现象的拟合情况。( 1 ) 对于第一类被试,纵向观察表6 的y = o 9 0 一列数据( 2 至1 8 号被试部分) ,发现随着被试答对试题的b 值增大,其所得正步长的在逐步 增大,出现了第一失拟现象,可见l o g i s t i c 三参数模( t 型) 不能够较好纠正第 一失拟现象。( 2 ) 横向观察表6 ,当丫参数水平减小时,发现第一类被试在t 参 数各水平上的步长都是一个值。也就是说,同一被试( 例如1 号被试) 分别答对 了a 参数和b 参数相同、y 参数不同的项目,分别对该被试进行能力估计,则其 能力估计值是一样的。y 参数不同,项目的特征属性就不同,其项目信息量也不 同,剐被试能力估计的精度影响应该不一样,可见h 百s t i c 三参数模型( t 型) 不能区分这种情况,在本文中把这种失拟情况定义为第四失拟现象。 再看丫参数对第二类被试( 1 9 3 5 号) 的拟合情况。( 1 ) 先看到t = 0 9 0 这一 列时,1 9 3 5 号被试的负步长的绝对值丌始出现两头小,中间大的现象。1 9 号被 试所得的负步长的绝对值不是最大的了,而是1 9 至2 6 号被试的负步长的绝对值 随着所答对项目的项目信息量增大而增大,可见l d g i s t i c 三参数模型( y 型) 良 好的拟合了第二失拟现象。( 2 ) 横向观察表6 ,当t 参数水平由0 9 0 逐步

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论