




已阅读5页,还剩63页未读, 继续免费阅读
(计算机软件与理论专业论文)rsm改进及多级评分ahm的开发研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 无论是观察分数还是能力分数,它们只是对被试一个笼统的大概描述。 这种传统测验对具有相同分数或相同能力的被试,却有不同知识状态或不同 认知结构这一现象无法做出合理解释;而认知诊断测验能对被试在完成测验 项目时的认知过程或心理加工过程进行诊断和评估。t a t s u o k a 的规则空间模 型( r s m ) 是较早提出且最有影响的认知诊断模型之一,她认为测验评估能 够且应该提供被试的具体认知结构,并用它来指导对被试作出补救决策。属 性层次方法( a 删) 是其中一种变体,该方法假设测验项目是由一组具有层 次结构的属性来表征的,然后根据被试的作答反应把被试归类到相应的知识 状态中。 一方面,本研究对r s m 中一些错误理论进行改进。r s m 分成两大部分, 第一部分是q 矩阵理论,第二部分是模式识别。本文从理论和实例两方面揭 示r s m 中q 矩阵理论的缺陷和错误,这些失误使得r s m 中用布尔描述函数 ( b d f ) 计算被试理想项目反应模式( 时) 的方法缺乏理论依据,于是提 出了几种更简便的计算理想项目反应模式的方法。接着介绍了一种由可达阵 推导出简化q 阵的方法,且指出构造认知诊断测验中可达阵的重要性。还有, r s m 的分类方法较复杂,本文把几种度量距离和相似性的方法( k l 、k f 、 l l 、s q r t 、c o s ) 作为模式识别准则,并用蒙特卡洛模拟实验方法比较这 些分类法与规则空间方法的优劣。结果表明,l l 方法分类效果最好。 另一方面,本研究主要把o 1 评分模型的a h m 扩展成多级评分模型的 a h m 。本文提出确定多级评分模型a h m 的期望项目反应模式全集的方法, 并把在o 一1 评分模型中具有最高归准率的分类法一对数似然比( l l ) 也推 广到多级评分模型,同时也提出了把相似度作为归类准则的几种分类法( s 1 、 s 2 、s l l 、$ 2 1 ) 。用蒙特卡洛模拟实验比较这几种分类法基于等级评分模型 的优劣,用属性模式归准率和单个属性的归准率作为评价指标。结果发现, 在各种情况下属性模式归准率比相应的单个属性归准率低。l l 与方法a 的 l 归类效果最好,其次是s 2 和$ 2 1 ,最后是s 1 、s l l 和方法b 。一般来说,随 着s l i p 的提高,它们的归准率相应下降,并且对于不同的属性层次结构,变化 的规律是一致的,而s 2 、s l l 和$ 2 1 在线型和合流型的变化规律则有稍微差 异。在归类精度和简单性方面,多级评分a h m 比b o l t 等提出的多级评分融 合模型( f u s i o nm o d e l ) 更有优势。 关键词:认知诊断;规则空间模型;属性层次方法;多级评分模型 u a b s t r a c t t h et r u es c o r es c a l ei nc :t to rt h el a t e n tt r a i ts c a l ei ni r tp r o v i d e ss p e c i f i c i n f o r m a t i o na b o u ts t u d e n t s l o c a t i o no nac o n t i n u u m h o w e v e r , i tf a i l st op r o v i d e s p e c i f i c i n f o r m a t i o na b o u ts t u d e n t s c o g n i t i v es t r e n g t h sa n dw e a k n e s s e s d i a g n o s t i ca s s e s s m e n t se n a b l er e s e a r c h e r sa n de d u c a t o r st om a k ei n f e r e n c e s a b o u tc o g n i t i v ep r o c e s s e sa n dk n o w l e d g ew h i c hs t u d e n t su s ew h e ns o l v i n gt e s t i t e m s t h ev a l u eo fd i a g n o s t i ca s s e s s m e n tl i e si ni t sa b i l i t yt or e v e a le a c h s t u d e n t ss p e c i f i cc o g n i t i v es t r e n g t h sa n dw e a k n e s s e sa n df u r t h e rh e l pd e s i g n e f f e c t i v ei n t e r v e n t i o n sf o ri n d i v i d u a ls t u d e n t s t a t s u o k a sg r o u n d b r e a k i n gw o r k s o nt h er u l e s p a c em o d e l ( r s m ) ,p u b l i s h e do v e rap e r i o do fm o r et h a nt w e n t y - f i v e y e a r s ,s e r v e sa so n eo ft h ef i r s tp s y c h o m e t r i c a l l y - b a s e dm e t h o d sf o rd i a g n o s i n g c o g n i t i v ea t t r i b u t e s t a t s u o k ab e l i e v e dt h a ta s s e s s m e n t sc o u l da n ds h o u l dy i e l d s p e c i f i ci n f o r m a t i o na b o u te x a m i n e e s c o g n i t i v es k i l l sa n dg u i d ei n s t r u c t i o n a l d e c i s i o n s t h ea t t r i b u t eh i e r a r c h ym e t h o de v o l v e df r o mt h er u l e - s p a c ea p p r o a c h , i su s e dt oc l a s s i f ye x a m i n e e s t e s ti t e mr e s p o n s e si n t oas e to fs t r u c t u r e da t t r i b u t e p a t t e r n sa s s o c i a t e dw i t hd i f f e r e n tc o m p o n e n t sf r o mah i e r a r c h i c a lc o g n i t i v e m o d e lo ft a s kp e r f o r m a n c e i nt h i ss t u d y , s o m ef l a w so fr s ma r ed i s c u s s e da n di m p r o v e d t h ef i r s tp a r t o fr s mi sqm a t r i xt h e o r y , t h es e c o n dp a r ti sp a t t e r nr e c o g n i t i o n t h e r ea r es o m e e r r o r sa b o u tt h eqm a t r i xt h e o r yp r o p o s e db yt a t s u o k a s o m er e m e d i a lm e a s u r e s a n d s i m p l e rm e t h o d so fg e n e r a t i n gi d e a li t e m - r e s p o n s ep a n e r a sa r ep r o p o s e d i n a d d i t i o n ,t h em e t h o dt ot h ec l a s s i f i c a t i o ni nr s mi sc o m p l i c a t e d t h u ss e v e r a l m e t h o d sf o rt h ec l a s s i f i c a t i o no fc o g n i t i v ec o m p e t e n c i e sw e r ep r o p o s e d m o n t e c a r l os i m u l a t i o nw a su s e dt oc o m p a r et h ef o l l o w i n gm e t h o d sf o rc l a s s i f i c a t i o n : a p p r o a c h e sw h i c h w a su s e di nr s m ,s o m em e t h o d sr e p r e s e n td i s t a n c ei n c l u d i n g k u l l b a c k l i e b l e re n t r o p y ( k l ) ,c h i s q u a r ed i s t a n c e ( k f ) ,s q u a r er o o t ( s q r ) , l o g a r i t h mo fl i k e l i h o o d ( l l ) a n dc o s i n e ( c o s ) w h i c hr e p r e s e n t ss i m i l a r i t y b e t w e e nt w op a t t e r n s s i m u l a t i o nr e s u l t ss h o w e dl li st h eb e s tf o rc l a s s i f i c a t i o n ; k l ,k f , s q r , c o sh a v et h es a m er e s u l ta st h a ti nr s m ,b u tt h ec o m p u t a t i o no f t h e s em e t h o d si ss i m p l e r i nt h i sp a p e r , a ne x t e n s i o no ft h ea h mf o rp o l y t o m o u s l y - s c o r e di t e m s ( h e r e a f t e rr e f e r r e dt oa st h ep o l y - a h m ) i sp r o p o s e d ,a n dc l a s s i f i c a t i o nm e t h o d l o g a r i t h m o fl i k e l i h o o dr a t i o ( l l ) w h i c hp e r f o r mb e s ti nr s mf o rt h e i i i c l a s s i f i c a t i o ni su s e di np o l y - a h m i na d d i t i o n ,t h em e t h o dt h a te x p e c t e d r e s p o n s ep a t t e r n sb a s e do np o l ”o m o u sm o d e ld e r i v e df r o mt h er e d u c e di n c i d e n c e m a t r i xq ri si n t r o d u c e d as e r i e so f n e wc l a s s i f i c a t i o nm e t h o d s ( s 1 ,s 2 ,s 1 l ,s 2 1 ) a r ep r o p o s e dw h i c hi sb a s e do ne s t a b l i s h i n gas e r i e so fi n d i c e so ft h es i m i l a r i t y b e t w e e nt h ee x p e c t e d r e s p o n s ep a t t e r na n dt h eo b s e r v e dr e s p o n s ep a t t e r n s i m u l a t e dr e s p o n s ev e c t o r sw e l eu s e dt oe v a l u a t et h ep e r f o r m a n c eo ft h e c l a s s i f i c a t i o nm e t h o d s ( l l ,s1 ,s 2 ,sll ,$ 21 ,m e t h o daa n dm e t h o db ) b a s e do n g r a d e dr e s p o n s em o d e lf o r t h ea h m t h ep e r f o r m a n c e so ft h e s ec l a s s i f i c a t i o n m e t h o d sw e r ee v a l u a t e da tt h ea t t r i b u t ep a t t e r nl e v e la n dt h ei n d i v i d u a la t t r i b u t e l e v e l ,r e s p e c t i v e l y a tb o t ht h ea t t r i b u t ep a t t e r na n dt h ei n d i v i d u a la t t r i b u t el e v e l , t h er e s u l t so fs i m u l a t i o ns h o w e dt h a tl la n dm e t h o da p e r f o r m e db e s ta m o n ga l l t h ec l a s s i f i c a t i o nm e t h o d s ,s 2a n d $ 21o u t p e r f o r m e dsi ,si1a n dm e t h o db t h e s em e t h o d sp e r f o r m e dc o n s i d e r a b l yh i g h e ra tt h ei n d i v i d u a la t t r i b u t el e v e l t h a na tt h ea t t r i b u t ep a t t e r nl e v e l m o r e o v e r , t h et r e n d so ft h ec l a s s i f i c a t i o nr a t e v a r i e dw i t ht h es l i pa r ec o n s i s t e n ta ta l lk i n d so fa t t r i b u t eh i e r a r c h i e s , w h i l es 2 , s1 1 $ 21p e r f o r m e di n c o n s t a n t l ya tt h ea t t r i b m eh i e r a r c h i e so fl i n e a ra n d c o n v e r g e n t i na d d i t i o n , p o l y - a h mi sb e t t e rt h a nt h ep o l y t o m o u se x t e n s i o no f t h ef u s i o nm o d e lp r o p o s e db yb o l te ta 1 i nt e r m so ft h ec l a s s i f i c a t i o na c c u r a c y a n ds i m p l i c i t y k e yw o r d s :c o g n i t i v ed i a g n o s i s ;r u l es p a c em o d e l ;a t t r i b u t eh i e r a r c h ym e t h o d ; p o l y t o m o u ss c o r i n gm o d e l i v 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得或其他教育机构的学位或证书而使用过的材料。与我一同工作 的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表 示谢意。 学位论文作者签名:签字日期:年 月 日 学位论文版权使用授权书 本学位论文作者完全了解江西师范大学研究生院有关保留、使用 学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印 件和磁盘,允许论文被查阅和借阅。本人授权江西师范大学研究生院 可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采 用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名: 签字日期:年月 日 导师签名: 签字日期:年 月 日 r s m 改进及多级评分f i l m 的开发研究 第1 章引言 1 1 研究目的和意义 无论是观察分数还是能力分数只是对被试一个笼统的大概描述,它们对具有 相同分数或相同能力的被试却有不同知识状态及不同认知结构这一现象无法做 出合理解释;传统测验对相同分数的个体间差异无法区分,被试掌握了什么知识, 未掌握什么知识等信息无法获取;而认知诊断能诊断和评估被试在完成测验项目 时认知过程或心理加工过程中存在的优缺点,并且认知诊断有利于教研部门超越 个人经验、结合诊断结果进行有针对性的研究与指导,从而改进教学过程、提高 学生学业质量。 随着社会的发展、教育的普及,教育已经逐步由“精英教育 转化为“普及 教育 ,教育者不但关注教育结果,而且更关注教育过程。在强调测验选拔功能 的同时,教育测验的辅助教学与诊断功能逐步受到重视。因此,测验应该加强诊 断的功能,为教师、被试提供有关被试掌握知识的情况,从而教师就可以有针对 性地进行编制测试题、补救教学,被试也可以有针对性地进行学习,从而提高学 习效率。及时准确地对被试进行认知诊断( c o g n i t i v ed i a g n o s i s ,c d ) 是教学过程 中不可或缺的重要环节,也是智能教学系统研究的主要内容之一。被试的知识状 态是不可直接观察的,如何准确地对被试进行诊断评价引起国内外教育、心理和 人工智能等专家的兴趣,美国政府甚至通过立法要求教师提供认知诊断。 1 2 本研究领域的国内外现状 在教育测量学界,学者们提出了不少诊断测验模型,这些模型通过被试在试 题上的作答反应推测被试的知识状态或心理特质。t a t s u o k a 的规则空间模型( r u l e s p a c em o d e l ,r s m ) m2 , 3 a , 5 , 6 1 是较早提出且最有影响的认知诊断模型之一,它从 被试的反应作答入手,推测出被试内部知识结构,从错误反应中得知被试的知识 缺陷,但它的q 阵理论【5 j 和求理想项目反应模式的理论存在不足:规则空间模型 的分类方法较复杂,是否有其他既简便、分类效果又更好的分类方法呢,这很值 r s m 改进及多级评分a h m 的开发研究 得探讨。另外,迄今为止,未见过r s m 诊断准确率的模拟实验,而实证研究是 有缺陷的,比如,前测( p r e t e s t ) ,后测( p o s t t e s t ) 【3 】之间时间间隔长、且影响因 素较多等,实证研究的“真值 是不知道的,这样就不能判定诊断结果的正确性。 该模型自从二十世纪八十年代开始研究,模型不断完善,后来有好几种认知诊断 模型都是应用了它的一些概念而发展起来的,如联合( 统一) 模型( u n i f i e d m o d e l ) 1 7 、融合模型( f u s i o nm o d e l ) 【钔、d i n a 模型( d e t e r m i n i s t i ci n p u t ,n o i s y a n d g a t e m o d e l ) 9 1n d a 模型( n o i s yi n p u t ,d e t e r m i n i s t i c “a n d g a t em o d e l ) 等。l e i g h t o n 等人的属性层次方法( a t t r i b u t eh i e r a r c h ym e t h o d ,a h m ) 1 0 川,1 2 1 是r s m 的一种变 体,该模型将认知心理学和心理测量学相结合,便于开发和分析教育与心理测验。 a h m 给出了不同于规则空间模型分类法,包括i r t 分类方法( 方法a 、方法b ) 和非i r t 分类方法( 人工神经网络法) 1 3 , 1 4 】。 l e i g h t o n 等人提出的o _ 1 评分a h m 有一个基本假设,即当且仅当被试掌握了 该项目所涉及的所有属性,该被试才能答对该项目。这样,掌握一个属性的被试 和只差一个属性没掌握的被试在该项目的得分都是0 分。这种评分方式容易造成 诊断信息的损失,而多级评分可克服这一缺陷。b o l t 和f u 认为精确的认知诊断 要求具有更丰富的有关被试在项目上作答反应的信息【l 研。 迄今为止,a h m 的研究都是基于阻1 评分模型,这也与我国测验中某些项目 ( 如证明题,计算题) 的多级评分现状不相适应。实际上,其他诊断模型对多级 评分的研究也不多,尽管b o l t 和f u 开发了多级评分的融合模型( f u s i o nm o d e l ) 【1 5 l ,但是融合模型中未知参数估计特别复杂,且b o l t 和f u - 报导的诊断准确率也 不高。 1 3 研究的内容及所要解决的问题 t a t s u o k a 技术报告【4 】中介绍确定理想项目反应模式全集的理论基础是利用格 和布尔代数的一些性质,但理论是有点问题的,我们将用她自己的例子来说明其 错误,并给以纠正。t a t s u o k a 根据已有题目得出q 阵,提出求理想项目反应模式 全集的方法【5 1 ,该方法得到的全集并不能测试到所涉及的所有属性,我们将给出 具体的例子加以说明。l e i g h t o n 和g i e r l 等人也认为r s m 中提出q 阵的方法不合 2 r s m 改进及多级评分a 删的开发研究 逻辑,并据此在r s m 基础上提出属性层次方法( 删) 。从而我们将在a h m 的 基础上对r s m 进行修正,也提出了几种更简单的计算理想反应模式全集的方法。 由于规则空间分类法比较复杂,所以本研究提出几种分类方法:卡方距离、 对称k u l l b a c k 1 2 i b l e r 偏离、c o s 方法、对数似然比以及s q r t ,并且进行选拔、 淘汰;为此要制定选拔、淘汰的指标和方法,即进行模型或方法的评价。用m o n t e c a r l o 模拟实验进行比较规则空间分类法、a h m 的方法a 和方法b 以及我们自己 提出来的分类方法,研究何种分类方法更有利于提高归准率。 因a h m 是规则空间模型的发展,故本文把o 1 评分模型的h m 扩展为多级 评分模型的a h m 进行认知诊断研究,并把在0 1 评分模型中具有较高归准率的 归类法也推广到多级评分模型,同时也提出了把相似度作为归类准则的几种分类 法( s 1 、s 2 、s ll 、$ 2 1 ) 。本研究通过模拟手段研究基于等级反应模型a h m 的 行为表现。 总之,本研究的主要内容有两个:第一,对o - l 评分模型规则空间模型进行 改进,包括q 阵理论的改进和分类方法的改进;第二,结合规则空间的优点,把 o 1 评分模型属性层次方法扩展成多级评分模型属性层次方法。 1 4 论文主要创新点 一、指出q 阵理论的错误,并进行修正; 二v 指出t a t s u o k a 求理想项目反应模式全集是错误的,并提出了3 种确定期 望项目反应模式全集的方法; 三、对0 1 评分模型r s m 和多级评分模型a h m 都提出了新分类法; 四、通过模拟手段,用规则空间模型进行认知诊断; 五、把o 1 评分模型的属性层次方法( a h m ) 扩展成多级评分模型的属性层次 方法。 1 5 论文组织结构 本文的章节安排如下: 第l 章为引言,简述认知诊断的研究背景和意义,对国内外有关认知诊断已 3 r s m 改进及多级评分a i - i m 的开发研究 有研究的述评,以及本研究的主要内容和所要解决的问题。 第2 章介绍了本研究相关的理论基础,包括项目反应理论、认知诊断和模式 识别的基本概念,以及研究用到的i r t 模型、认知诊断模型和模式识别方法。 第3 章指出了0 1 评分模型的r s m 和a h m 的一些错误,并对错误作了修改, 同时对这两模型进行了改进。最后进行总结与讨论。 第4 章引进多级评分a h m 模型及详细介绍具体诊断步骤。介绍了实验设计, 列出了实验结果,对结果进行分析比较;然后进行总结,并提出了今后需要进一 步研究的问题。 4 r s m 改进及多级评分a h m 的开发研究 第2 章理论基础综述 2 1 项目反应理论( i i 玎) 2 1 1 项目反应理论基本概念 项目反应理论( r c = i :nr e s p o m et h e e o r y , i r t ) 16 1 ,亦称作为潜在特质理论( l a t e n t t r a i tt h e o r y ) ,从六十年代提出以来得到了很大的发展。随着计算机技术的发展, i r t 得以迅速推广和应用。一些传统的智力测验如比奈测验、韦氏智力测验、瑞 文测验等,以及一些诊断模型如规则空间模型、属性层次模型也使用i r t 作为分 析的理论依据。 2 1 2i r t 基础模型 项目反应理论的发展首先建立在潜在特质理论的基础之上,其主要内容就是 揭示被试在测验项目上的反应行为与测验所测的被试潜在特质之间的关系,这种 关系的形象描写就是项目特征曲纠1 6 】。项目反应理论的模型,就是给项目特征曲 线( i c c ) 配上的函数解析式。m t 的基础模型主要有正态肩形曲线模型( n o r m a l o g i v em o d e l ) 、拉希模型( r a s c hm o d e l ) 和逻辑斯蒂克模型( l o g i s t i cm o d e l ) , 本文采用的都是逻辑斯蒂克模型。 1 0 1 评分模型 0 - 1 评分模型的三参数逻辑斯蒂克模型( 3 p l m ) ,其数学公式如下: 只( 秒) = q + t :i 夏;f 1 :- - 西:c 天i 而,公式2 1 其中d 为量表因子,通常取为1 或1 7 ,当d = i 7 时与正态肩形曲线模型很接近, a ,为项目i 的区分度参数,缸为项目i 的难度参数,q 为项目i 的猜测系数,只( p ) 表 示能力为0 的被试答对项目i 的概率。当猜测系数a - - 0 时,该模型为双参数 l o g i s t i c 模型( 2 p l m ) ;当猜测系数q = o 且区分度a ,= 1 时,该模型为单参数 l o g i s t i c 模型( 1 p l m ) ,又称为r a s c h 模型。 2 多级评分模型 等级反应模型( t h eg r a d e dr e s p o m em o d e l ,简称g r m ) 美国日裔学者s a m e j i m a l 9 6 9 年创造出了一套研究多级反应模型的方法【”】,突 r s m 改进及多级评分a h m 的开发研究 破了过去项目反应模型只能用于二值评分i 贞目的限制,为建立多值评分的项目反 应模型开了一个先例。其原理是: 设项目j 的满分值为乃( 乃1 ) ,项目j 可评为乃+ 1 个分值,即o ,1 ,乃。用 p 二。表示能力值为见的被试在第j 题上得分不低于r 分的概率,于是p = l , p 二, f j + 1 = 0 。用如t 表示该被试在第j 题上恰得,分的概率,则: 一 屹t = t 一,t + l ,( f = 0 , i ,) 公式2 2 其中, 戍。= l + e x p 卜啊( 吃一) 】) ,( f = o ,l ,f j ) 公式2 3 其中,d = i 7 ,口,为第,题的区分度,6 ,r 是在第_ ,题上的得,分的难度值【1 6 ,1 8 】 在第歹题上各难度等级是单调递增的,即6 j l 6 _ ,2 必须重视教育评价在教育影响价 值中的作用,尤其应当为被试本人提供有效的诊断信息; 2 3 2 认知诊断模型述评 认知诊断是根据一定的认知诊断模型进行的,用于测验的诊断模型有很多 种,据不完全统计,国外约开发3 4 0 多个认知诊断模型1 3 1 , 3 2 j 并被应用于认知诊断。 就已开发应用的这些模型看,可以对认知诊断模型作一个简单的归类。认知诊断 的测量学模型有两个基础性的模型,一种是f i s c h e r 1 0 l 提出的线性逻辑斯谛克 特质模型( 1 i n e a rl o g i s t i ct r a i tm o d e l ) ;另一种是t a t s u o k a 等人提出的规则空间模 型( r u l es p a c em e t h o d o l o g y ) 。前一个模型是潜在特质模型的扩展,目的是剖析观 察分数下被试的潜在特质。后一个模型是潜在分类模型的扩展,目的是按被试在 潜在特质上质的差异将被试进行分类。以线性逻辑斯谛克特质模型为基础发展出 的模型有多成分潜在特质模型( m u l t i c o m p o n e n tt r a i tm o d e l ) p 3 j 、线性指数模型 ( 1 i n e a re x p o n e n t i a lm o d e l ) 3 4 1 等十余种。联合( 统一) 模型和融合模型都利用了规 则空间模型中的q 矩阵。限于篇幅,我们将只简单介绍与本研究有关的诊断模型。 1 、规则空间模型( r u l es p a c em o d e l ,r s m ) ( 1 ) 模型简介 在已往的测量理论当中,不论是经典测验理论还是项目反应理论,都把被试 的错误作答看成是随机的或是“噪音 ,但是这与实际的情况相差甚异。实际上, 在测验中我们常常看到,被试在某一批同类试题上都是错误的,即被试在试题上 的错误作答并不是相互无关或是随机的,而是被试认知上的缺陷或是运用某个错 误规则导致的,因此,被试的错误作答中还有很多的信息未被挖掘。t a t s u o k a 提 出的规则空间模型正是从这一点着手的。 规则空间模型假设被试在测验作答中完全使用同一个规则,不论该规则正确 与否。正确的规则能在所有试题中得到正确结果,而错误的规则也有可能在某些 1 2 r s m 改进及多级评分删的开发研究 试题上得到正确结果。例如在带符号整数减法运算当中,假设被试建立的规则是 “用绝对值大的数减去绝对值小的数,符号取绝对值大的数的符号 ,这个规则 用到如“一1 5 一( 一9 ) 的试题中能得到正确结果,用在“5 一( 一1 2 ) 一的试题中就 会得到错误结果。如果测验试题编制得好,则所有重要的、可预见的常见错误都 可以通过这些试题上的l 、0 作答模式来表现。如果被试正确运用某个规则,那 么在使用了该规则的项目,他的得分就为“l ,否则就为“0 。t a t s u o k a 认为作 答模式包括了两方面的信息量的信息和质的信息。作答模式量的信息可以通 过能力口来表示,而对于能够反映一组被试非典型或不恰当的作答模式的质的信 息,即被试偏离理想作答模式所对应的值时,也即所谓的“异常反应行为的程度 , 她提出了该模型的拟合度指标f 【3 】,所有的规则都可以用p 和f 的有序对来表示。 模型的一个基本假设是测验项目可以用特定的认知技能( 又称属性) 描述, 属性包括被试正确求解测验项目必须具备的各方面的能力,如技能、策略、加工 过程或知识点等。被试的知识状态可用一组通常无法直接观察的认知属性掌握模 式来表征,因此把它转化为与之相对应的可观察的理想项目反应模式,这样把观 察反应模式归类到理想反应模式( i d e a lr e s p o n s ep a t t e m ) 3 l 中就能诊断出被试的知 识状态,这里“理想 是指始终一贯地使用同一规则( 不论正确与否) 的情况下 的项目得分模式。由于猜测或失误,被试的反应模式会偏离理想反应模式, t a t s u o k a 给出了这些反应模式的统计分布【z 】。 规则空间模型包括两大部分,第一部分是q 矩阵理论【5 】,第二部分是模式识 别。q 矩阵理论引入q 矩阵,q 矩阵表达属性和项目之间的关联,q 阵的元素非 0 即l ,它的第所j :第_ 列元素q 盯若为1 ,则表示项目,具有属性f ,反之则gi 为0 。t a t s u o k a 用布尔代数相关性质,把q 矩阵中表示的被试属性掌握模式转化为 被试在既不猜测也不失误的情况下的理想项目反应模式,即将不可观察的属性掌 握模式转化为可
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高速信号分析仪行业跨境出海项目商业计划书
- 脉动前行引领未来脉冲变压器在商业领域的升级探索
- 2025年盘园儿钢项目发展计划
- 花卉种植的可持续发展路径
- 远程客服的技巧与实战经验分享
- 幼儿园混龄教育实践研究
- 职场未来发展与创新人才培养研究
- 老年人常见慢性病的综合管理与保健
- 财务报表的深度解读企业运营的智慧
- 透析中心安全稳定运营的应急预案设计
- 101二元一次方程组的概念【9个必考点】(必考点分类集训)(人教版2024)(原卷版)
- 大型心血管造影系统及其DSA质量控制
- (高清版)DB33∕T 386-2013 内河航道工程质量检验规范
- 铝加工深井铸造培训
- 国家中小学智慧教育平台应用指南
- 2024-2025学年人教版七年级(下)期中数学试卷(考试范围:第7~9章) (含解析)
- 无人机喷洒系统设计-全面剖析
- 人工智能安全监控系统开发协议
- 非遗档案资源管理系统建设与实施研究
- 工伤赔偿私了协议书范本
- 急性心梗诊疗(2025 )
评论
0/150
提交评论