(计算机应用技术专业论文)自适应策略在多媒体教学系统的设计与实现.pdf_第1页
(计算机应用技术专业论文)自适应策略在多媒体教学系统的设计与实现.pdf_第2页
(计算机应用技术专业论文)自适应策略在多媒体教学系统的设计与实现.pdf_第3页
(计算机应用技术专业论文)自适应策略在多媒体教学系统的设计与实现.pdf_第4页
(计算机应用技术专业论文)自适应策略在多媒体教学系统的设计与实现.pdf_第5页
已阅读5页,还剩58页未读 继续免费阅读

(计算机应用技术专业论文)自适应策略在多媒体教学系统的设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 1 1 lllllljj li l l l 舢 y 1 7 5 9 坩若 独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中 不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或 其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所 做的任何贡献均已在论文中作了明确的说明并表示了谢意。 申请 本人 学位论文与资料若有不实之处,本人承担一切相关责任。 签名:童! 立! 鱼!日期: 凼l q :墨:! ! 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权 保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅 和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印 或其它复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密 论文注释:本学位论文不属于保密范围,适用本授权书。 本人签名:童! ! 查堡 日期: 堡! ! 旦:3 :! ! 导师签名:二望i 盅 日期: 坠12 :;:! 二 北京邮电大学硕士论文摘要 自适应策略在多媒体教学系统的设计与实现 摘要 随着计算机技术、多媒体技术、网络通信技术的发展,网络教 育以其特有的教学模式、丰富的教学内容与方法得到越来越多教师 与学生的欢迎。 计算机测试系统是网络教育发展中的一个应用,这种测试的主 要目的是如何客观公正地评价每个被测试者的真正水平。也就是说 如何通过各种难度及区分度的试题,结合考试的答题正确率考察考 生的能力。 本文以多媒体教学系统为背景,分析了系统中练习模块的出题 策略。即通过教师人为预设策略,指定好一套练习的题目总数、练 习时间、练习知识点范围,系统通过遗传算法得到最适合条件的题 目,组成一套练习。由于练习的目的在于通过各种知识点增强学生 的能力,原有出题策略的缺点是并不能针对每个学生的能力分别出 题,导致所出题目难度相对某些学生难度较大,最终导致学生学习 兴趣下降。 为解决该问题,本文以练习模块为例,在原有出题流程的基础 上,增加了自适应策略。即系统可以根据学生能力值范围自动选择 与学生能力相当的题目,然后根据学生的答题情况来估算学生的能 力值,最终达到动态调整学生所做试题的效果。在估算学生能力时 采用了牛顿迭代法求解学生能力值,同时加入附加策略,弥补了牛 顿迭代不能求解边界值的缺陷。 本文的另外一个创新点是把自适应策略用在了背单词模块中, 可以根据学生已掌握的单词的难度,运用自适应的方法来推荐相似 难度的词,以帮助学生学习更多的单词,同时不会造成很大的学习 难度,使其学习单词的难度,随着答题情况进行动态调整,即学习 曲线是渐变的,而不是突变的。 关键词自适应策略项目反应理论参数估计牛顿迭代 北京邮电大学 d e s i a d a p r n v et e s ti nt h em u 珊m e d i at e a c h i n g s y s t e m a b s t r a c t w i t ht h ef a s td e v e l o p m e n to fc o m p u t e rt e c h n o l o g y , m u l t i m e d i at e c h n o l o g ya n d n e t w o r kc o m m u n i c a t i o nt e c h n o l o g y , n e t w o r ke d u c a t i o nb e c o m e sm o r ea n dm o r e p o p u l a rt ot e a c h e r sa n ds t u d e n t sw i t hi t ss p e c i a le d u c a t i o nm o d e la n dr i c he d u c a t i o n c o n t e n t sa n dm e t h o d s c o m p u t e rt e s t i n gs y s t e m i sav e r y i m p o r t a n ta p p l i c a t i o nd u r i n g t h e d e v e l o p m e n to fn e t w o r ke d u c a t i o n i t sa i m sa tj u s t i f ye v e r yt e s t e r s r e a ll e v e l o b j e c t i v e l y t h a ti s a l s ot os a y , i tc a ni n v e s t i g a t et h et e s t e r s a b i l i t i e st h r o u g h d i s t i n g u i s h i n gt h ed i f f i c u l t i e sa m o n gt e s tq u e s t i o n sa n dc o m b i n gt h er a t eo fr i g h t a n s w e r si nt h ee x a m i n a t i o n s b a s e do nt h em u l t i m e d i at e a c h i n gs y s t e m ,t h i sp a p e ra n a l y z e dt h es t r a t e g yo f # v i n go u tt e s t e r sq u e s t i o n si nt h ep r a c t i c em o d u l e t e a c h e r sc a np r e v i o u s l yd e s i g n t h ed e v i c em a n u a l l y ,i ti n c l u d e st h et o t a ln u m b e ro fq u e s t i o n si no n ee x e r c i s ee x a m , t i m et h a tt e s t e rw i l lt a k ea n dr a n g eo fk n o w l e d g e t h em u l t i m e d i at e a c h i n gs y s t e m c a nf i n do u tt h em o s ts u i t a b l eq u e s t i o n st h r o u g ht h eg e n e t i ca l g o r i t h ma n dm a k eu p o n ep a p e re x a m t h ea i mo ft a k i n ge x e r c i s e si st os t r e n g t h e nt e s t e r sa b i l i t yb yd o i n g l o t so f k n o w l e d g e se x e r c i s e t h eo r i g i n a ls t r a t e g yc a n n o tg i v eo u tt a s t e r s q u e s t i o n s b a s e dt h e i r sa b i l i t y s os o m eo ft h eq u e s t i o n sa r eh a r dt ot e s t e r sa n dm a k et h e ml o s e i n t e r e s t s t os o l v et h i sp r o b l e m ,t h i sp a p e rt a k e se x a m p l e so fp r a c t i c em o d u l e a d d s a d a p t i v es t r a t e g yt ot h es y s t e mo nt h eb a s eo fs t r u c t u r e t h e r e f o r e ,t h es y s t e mc 锄 g i v es t u d e n t sd i f f e r e n ts u b j e c t s ,a n dt h e s es u b j e c t sa r ef i tf o rt h e i ra b i l i t y t h e n e s t i m a t e st h es t u d e n t sa b i l i t i e sa g a i nt h r o u g ht h e i ra n s w e r sa n da tl a s ta c c o m p l i s h t h er e s u l t st h a t a c t i v e l ya d j u s t s t u d e n t s q u e s t i o n a d a p tt h en e w t o n - r a p h s o n m e t h o dt oe s t i m a t es t u d e n t sa b i l i t y a tt h es a m et i m ea d dt h ea d d i t i o n a ls t r a t e g yt o c a t c hu po nb o u n d a r yv a l u et h a tn e w t o n - r a p h s o nm e t h o dc a n n o ts o l v e 北京邮电大学硕士论文 a b s t r a c t o n eh i g h l i g h to fi n n o v a t i o ni nt h i sp a p e ri sa p p l y i n gt h ea d a p t i v es t r a t e g yt ot h e m e m o r i z ew o r d sm o d u l e i tc a nr e c o m m e n ds t u d e n tl e a r nm o r ew o r d st h r o u g hf i n g e r o u tt h ed i f f i c u l t yt h a ts t u d e n t sh a v em a s t e r e d ,u s i n gt h ea d a p t i v es t r a t e g ym e t h o d a t t h es a m et i m e ,i tw o u l dn o tm a k em u c hd i f f i c u l t yf o rs t u d e n tt ol e a r nw o r d s w i t h t h ef e e d b a c k so fs t u d e n t s ,a d a p t i v es t r a t e g yc a na d j u s tt h es u b j e c t s s ot h el e a r n i n g c u r v ei sg r a d u a ls h i f t e d ,n o ts u d d e n l yc h a n g e d k e yw o r d s :a d a p t i v es t r a t e g yi t e mr e s p o n s et h e o r y p a r a m e t e re s t i m a t i o n s n e w t o n - r a p h s o n i i i 1 2 1 国外研究现状2 1 2 2 国内研究现状3 1 3 研究内容与实现4 1 4 论文的组织结构4 第二章自适应相关理论与系统架构6 2 1 经典测量理论( c t t ) 概述6 2 1 1c i t 概述6 2 1 2c t t 的假设以优缺点6 2 2 项目反应理论( ir t ) 7 2 2 1lr t 的发展概况7 2 2 2ir t 的基本原理8 2 3 典型的ir t 模型1 0 2 4 模块架构及开发环境简介。1 2 2 4 1j 2 e e 技术简介1 2 2 4 2s t r u t s + s p r ;n g + hib e r n a t e 框架1 3 2 4 3t o m c a t 服务器。1 5 2 4 4m y s q l 数据库1 5 2 4 5e ci ip s e 开发环境1 6 2 5 本章小结1 6 第三章练习模块抽题策略的比较1 7 3 1 系统中原有练习策略1 7 3 1 1 概述1 7 3 1 2 遗传算法1 7 3 1 3 遗传算法的优缺点1 8 3 2 自适应策略1 8 3 3 两种策略的比较1 9 3 4 本章小结。2 1 第四章自适应策略在练习模块的设计 4 1 能力参数的建立2 2 4 1 1 能力初始参数确定2 2 4 1 2 能力值0 的估计2 2 4 2 试题参数的确定。2 5 4 3 做练习流程对比2 6 i v 北京邮电大学硕士论文目录 4 4 抽题原则设计3 0 4 5 抽题预抽取策略设计3 0 4 6 本章小结3 1 第五章自适应策略在练习模块的实现3 2 5 1 自适应生成练习题组详细过程实现3 2 5 1 1 启动自适应功能3 2 5 1 2 自适应题组抽取过程3 2 5 1 3 缓存中记录自适应题目3 3 5 1 4 计算抽题时间3 3 5 2 自适应策略统计学生能力过程3 4 5 3 牛顿迭代法解方程的正确性验证3 5 5 3 1 求x “2 = 0 的解。3 5 5 3 2 求x 3 - 2 7 = 0 的解3 6 5 3 3 求x 9 + x 8 + x 7 + x “6 + x “5 + x 4 + x 3 + x 2 + x = o 的解3 7 5 4 牛顿迭代解自适应最大似然方程过程3 9 5 5 功能实现4 3 5 6 本章小结4 4 第六章自适应策略在英语背单词应用中的研究4 5 6 1 自适应背单词功能概述。4 5 6 2 自适应背单词功能设计4 6 6 2 1 背单词流程4 6 6 2 2 数据库设计4 7 6 2 3 背单词功能扩展4 8 6 3 本章小结4 8 第七章总结与展望4 9 7 。1 全文总结4 9 7 2 进一步展望5 0 参考文献5 1 致谢5 3 攻读硕士期间发表的学术论文目录及参与科研硕目5 4 v 北京邮电大学硕士论文第一章绪论 1 1 论文背景 第一章绪论 伴随着网络技术和计算机技术以及教育测量理论的发展,近年来,以项目 反应理论( i t e mr e s p o n s et h e o r y ,简称i r r ) 为基础的计算机化自适应测试 ( c o m p u t e ra d a p t i v et e s t ,简称c a t ) 的应用也越来越广泛。 传统的考试,对于每个考生而言,题目中只有一部分是真正符合考生能力 的,其余的题目要么非常简单,要么非常难。而自适应考试的题目是根据对被 试者的能力水平进行测试而确定的。 c a t 是一种根据被试者能力水平自动选择相应难度题目的个性化测试。目 前广泛采用的是基于经典测量理论( c l a s s i c a lt e s tt h e o r y ,简称e r r ) 的传统笔 试,这是一种试题固定的考试方式,所有的应试者面对的是相同题量、相同难 度的试题,这在一定程度上体现了考试的公平性,但在对应试者能力以及对知 识的掌握程度测试的准确性和有效性上存在着很大的不足。 对测试者而言,太难或太容易的题目对评估、判断被测试者的能力都是无 效的。与之相比较,自适应测试的每一试题不是对被试能力水平消极的度量, 而是有两种作用,一是考核学生对该试题所代表的知识点掌握的程度:二是决 定下一道试题的挑选。自适应测试根据每一道题目的回答情况通过计算得出应 试者的相应能力估计值,并进行匹配运算,如果此题回答正确,则下一试题将 在此题基础上增加难度;如果此题回答错误,则下一试题将在此题基础上降低 难度。挑选出最符合应试者能力值的题目作为下一道题。因而被试者做的每一 道题都与被试者的能力水平相适应。这样,能力水平高的考生能够避免做层次 较低、难度较低的题目。而能力水平较低的考生则避免做超出其能力范围的试 题。 使用多媒体教学系统做练习的用户多是远程教育的学生,有了网络信息的 支持,学习将不再局限于课堂,学生将有更多的学习自主权,在学生有了更多 学习主动权的同时,也带来了一些问题,由于没有教师的及时指导帮助,学生 只能凭自己的个人经验选择学习的内容和方式,同时也没有评价自己学习效果 的考试手段。利用练习模块做练习时,只能看到回答的对错,不知道自己的真 实能力,为了达到系统能够准确的测量学生的学习效果并提供适合学生当前水 平的练习题目,我们研究了自适应策略。 自适应策略是考试系统向应试学生出一部分中等难度的试题,供学生作答 北京邮电大学硕士论文第一章绪论 并对学生答题情况进行判断,根据学生答题情况,估计出学生的真实能力,再 从题库中选择最适合于测量学生能力的题目,通过这种方式,使试题与考生的 能力水平相符合。供他们作答的题目,既不太容易,也不太难,可以据此估测 出学生的真实能力并据此为学生提供最大的信息量。 1 2 国内外研究现状 1 2 1 国外研究现状 自适应学习系统和考试系统的开发与研究,在国外已经有相当长的时间。 1 9 5 2 年,美国心理和教育测量学家洛德( l o r d ) 提出了著名的正态卵形模型 以及该模型的参数估计方法,并成功地将他的模型应用于实际测验。随后,在 1 9 5 7 年,伯恩鲍姆提出了易于处理的逻辑斯蒂( l o g i s t i c ) 模型以及相应的统计处 理方法,取代了洛德的正态卵形模型,进一步推动了项目反应理论的发展【。 自上个世纪7 0 年代以来,项目反应理论在测验设计、能力估计、测验等同 化、自适应测验等方面,都取得了相当大的进展。 职业能力倾向测验( a s v a b ) 是美军职业选拔的主要测试工具之一,自1 9 7 6 年正式应用以来多次进行修订。在1 9 8 4 年美国军方实验室应用了另一个计算机 自适应考试系统,这是第一个全国范围的c a t 。1 9 9 1 年,在美国的信息产业中, n o v e l l 公司成功地应用了c a t 进行认证考试,使参加自适应考试的人数超过了 1 0 0 0 0 0 0 人次。美国国家标准与技术协会高技术研究项目( n a t i o n a li n s t i t u t e s t a n d a r d sa n dt e c h n o l o g ya d v a n c e dt e c h n o l o g yp r o g r a m ) 1 9 9 8 年资助研究的主题 就是“适应性学习系统 ( a d a p t i v el e a r n i n gs y s t e m ) ,共资助十几个相关研究, 投入研究资金数千万美元,该项目研究的主要目标是:加速部署以网络为中心, 基于w e b 的学习系统,加快建设全国性的学习基础设施,使得教育与培训既 能得以最为广泛的普及,又能精确地满足个别教育者与学习者的需求1 2 1 。 2 0 0 0 年,微软公司也在其国际认证考试:m c s e 、m c s d 考试中全面使用 c a t 考试。2 0 0 2 年以来,a s v a b 已经开发出4 个版本纸笔测验,以及c a t 可 对不同人群进行施测。 目前在美国,c a t 己经在教育测验、职业测量、人事评测等领域中应用相 当广泛,如美国研究生入学考试( g r a d u a t er e c o r de x a m i n a t i o n ) 、工商管理类研 究生入学考试以及全美护士国家委员会资格考试等都已经采用了c a t 考试方 式。 2 的考试方式;江西师大小学数学c a t 研究、华南理工大的“数据结构 的自适 应测试系统的研究也取得了一定的效果。 东软的凯思英语考试是我国应用比较成熟的c a t 的计算机软件,每道试题 都有题目的难度、区分度、猜测系数的统计,凯思英语考试主要运用在各高校 新生的分班考试、大学英语期末考试,它最终题库中的题目参数是在2 0 万人次 的测试后最终确定的,它最大的优点是可以将在其考试系统中测试得到的分数 等值到其他考试中。另外,全国大学英语四、六级考试委员会一直致力于项目 反应理论的研究和开发。目前项目反应理论已成功的用于c e t 分数等值处理过 程中,不过,目前在国内自适应测验没有很成熟的软件1 3 j 。 对于国内自适应考试方式的研究,还有一些典型的应用成果: 1 、中国汉语水平考试( h a n y us h u i p i n gk a o s h i ,h s k ) 汉语水平考试( h s k ) 是为测试母语非汉语者( 包括外国人、华侨和中国国内 少数民族人员) 的汉语水平而设立的国家级标准化考试。目前h s k 考试已达到 较高的科学化水平,实现了命题、施测、阅卷评分和分数解释的标准化。实现 了预测统计分析、试题等值、考试报名、评分和成绩报告等的计算机化1 4 】。 经过了h s k 等值研究,目前,我国已经形成了一个初具规模的h s k 题库 和试卷计算机自动生成系统。以此为依托,将推出计算机化自适应性h s k 考试, 这种考试将更有针对性的测试受测者的能力。为了验证由计算机从题库中自动 生成的试卷能否保持难度的相对稳定以及根据i r t 进行的等值误差范围的大 小。北京语言文化大学的谢小庆和任杰以共同组等值【5 j 作为标准,对基于i r t 的共同题等值误差进行了测验。测验中,采取一定措施保证了考生能力的真实 性。结果显示,i r t 等值的矫正方向都是正确的。 2 、短语境阅读测试法( s h o r tc o n t e x tt e c h n i q u e ) 长期以来,在中国测试阅读的方式主要是要求考生读一篇文章,然后回答 4 个问题,通常是单项选择题,这种传统的阅读测试方法已受到越来越多语言 测试专家的质疑。短语境阅读测试法1 6 j 是一种行之有效的阅读测试法,在许多 方面超过了传统的阅读测试方法。将短语境阅读测试法应用于c a t 考试,不仅 提高了阅读理解测试的效率,同时也提高了测试的准确度。其优点得到了充分 的展示。 3 、c 程序设计非标准化试题c a t 模型 3 北京邮电人学硕士论文第一章绪论 c 语言是一种计算机程序设计语言。它既具有高级语言的特点,又具有汇 编语言的特点。它可以作为工作系统设计语言,编写系统应用程序,也可以作 为应用程序设计语言,编写不依赖计算机硬件的应用程序。因而,它的应用范 围非常广泛,不仅为计算机专业工作者所使用,而且为广大计算机应用人员所 喜爱和使用。许多高校都开设了c 语言课程。 全国计算机等级考试( n a t i o n a lc o m p u t e rr a n ke x a m i n a t i o n ,简称n c r e ) 和 全国计算机应用技术证书考试( n i t ) 等许多大型的全国考试都将c 语言列入考 试范围。在远程教育和网络教育中,标准化试题的考核程序设计能力的c a t 系 统,应有利于保证诸类考试的公平、公正,真实地考核出考生的计算机操作水 平和编程能力。对于计算机语言与程序设计课程尤为重要。c 程序设计非标准 化试题c a t 模型是对远程c a t 考试中采用非标准化试题的一种尝试【| 丌。 1 3 研究内容与实现 本文首先对经典测量理论( c l a s s i c a lt e s tt h e o r y ,简称a 厂r ) 和项目反应 理论( i t e mr e s p o n s et h e o r y ,简称i r t ) 做了对比分析,由于c t r 有其局限性不 能运用在自适应测试中,因而重点研究了i r t 理论在教学系统中的应用。接着 分析了原有系统练习策略与自适应策略在本教学系统中的优劣势,通过以项目 反应理论为基础,对自适应策略中的三种参数模型进行了比较。 结合本系统练习模块的策略需求,在原有出题流程的基础上,增加了自适 应策略功能。即系统可以根据学生能力值范围自动选择与学生能力相当的题目, 然后根据学生的答题情况来估算学生的能力值,最终达到动态调整学生所做试 题的效果,减小了学习难度,提高了学生的学习兴趣。在其估算能力的过程中, 采用了牛顿迭代法求解l o g i s t i c 模型对应的似然函数方程,通过三个指数函数 验证牛顿迭代法程序求解方程的正确性,通过附加求解策略弥补了牛顿迭代不 能求解边界条件的局限。 本文的另外一个创新点是把自适应策略用在了背单词模块中,可以根据学 生已掌握的单词的难度,运用自适应的方法来推荐相似难度的词,以帮助学生 学习更多的单词,同时不会造成很大的学习难度,使其学习单词的难度,随着 答题情况进行动态调整,即学习曲线是渐变的,而不是突变的。 1 4 论文的组织结构 本论文共分为七章: 4 北京邮电大学硕士论文第一章绪论 第一章简述了论文的研究背景,国内外对自适应的研究现状,研究内容 与实现。 第二章首先介绍了经典测量理论( c 丌) ,然后重点介绍了项目反应原 理和典型的数学模型,并重点分析了典型的数学模型l o g i s t i c 的几种不 同的情况,另外介绍了模块开发的技术架构。 第三章练习模块中对原有练习策略和自适应策略做了比较。 第四章介绍了自适应策略在练习模块的设计,包括参数初始化,做练习 流程,能力值的估计,抽题原则的设计等。 第五章自适应策略在练习模块的实现,包括详细的实现过程、答题后的 反馈以及测试结果等。 第六章自适应策略在英语背单词应用中的研究,包括功能的概述和设计 这是本论文的创新点之一。 第七章对本文所做的工作进行总结,并对下一步的工作进行展望。 5 北京邮电大学硕士论文第二章自适应相关理论与系统架构 第二章自适应相关理论与系统架构 2 1 经典测量理论( c t t ) 概述 2 1 1 c t t 概述 经典测量理论( c l a s s i c a lt e s tt h e o r y ,简称c t t ) 也称为真分数理论 ( t r u es c o r et h e o r y ) ,是一种以考试实际得分为前提的理论。它从十九世纪末 开始兴起,二十世纪3 0 年代形成比较完整的体系而渐趋成熟。 5 0 年代格里克森的著作使其具有完备的数学理论形式,而1 9 6 8 年洛德和 诺维克的心理测验分数的统计理论一书,将经典真分数理论发展至巅峰状 态,并实现了向现代测量理论的转换【踟。 与c r r 比较相似的还有一种称为概化理论【9 ( g e n e r a l i z a b i l i t yt h e o r y ,简称 g t ) ,g t 理论的基本思想是,任何测量都处在一定的情境关系之中,应该从测 量的情境关系中具体地考察测量工作,提出了多种真分数与多种不同的信度系 数的观念,并设计了一套方法去系统辩明与实验性研究多种误差方差的来源。 概化理论是对c t i 的扩展和改进,理论基础仍然和c t i 一致。 c i t 的基本思想【1 0 】是:以真分数和平行复本为基本概念。基本假设是观测 分数x 由真分数t 和随机误差e 构成,即x = t + e ;这是一个线性模型,它表 示在观察分数和真分数之间存在总线性关系【n 】。误差e 的平均数等于零;误差 e 与正分数t 之间的相关为零,在这一理论的基本框架内,建立起测验题目的 计量学指标,如测验的信度,效度,题目的难度,区分度等,并以此来筛选题 目,建立题库,构制测验等。a r r 最大的不足就是把所有的误差都归为一类, 而没能区分测验当中的各种误差。 2 1 2c t t 的假设以优缺点 c r r 的理论基础是真分数理论,它对试题的难度、区分度都采用了直接测 算的方法,主要根据受测者的实际作答情况来估计受测者的能力水平。它从2 0 世纪初开始发展起来,到5 0 年代而趋于完善。 它建立在三个基本假设【1 2 l 之上: 1 、受测者的能力水平即真分数与误差分数之间的关系是线性的; 2 、受测者在大量测验中的误差分数统计平均值为0 ; 6 北京邮电大学硕士论文第二章自适应相关理论与系统架构 3 、任意两次测验的误差相互独立。假定误差分数和真分数相互独立,在多 次重复时呈现正态分布。 近年来,虽然有很多的适应性理论问世,c i t 依然有很好的应用地位。原 因是c t r 有以下很多优点: 1 、建立在很简单的数学模型之上,容易被人理解和接受,另外,计算非常 简便,容易得到推广; 2 、理论的假设只有三条非常弱的假设,对实施条件要求不严格,适用性很 广; 3 、通常情况下,可以得到很好的应用,因为c 】r r 是足够精确的。 虽然a r r 有很长的历史并取得了不错的成果,但是它存在着许多无法克服 的技术问题。它以随机抽样理论为基础,建立了简单的数学模型,近年来,在 考试中广泛采用的都是c t r 。随着c t r 应用的发展,它也暴露出一些难以克服 的局限性: 1 、无法根据受测者的实际水平进行动态测试; 2 、对单个的受测者而言,试题只有一部分是符合其真实能力水平,其他的 要么简单,要么非常难。测试的有效程度很低; 3 、它的题目参数严重依赖样本,并且无法直观的建立得分与题目参数之间 的函数关系。 一 4 、对测验等值、适应性测验、标准参照性测验的编制等问题都没有给出合 理的解决办法。 针对c t r 暴露出的许多不足,提出了i r t 理论。它是通过建立一定的项目 反应模型来描述这种关系的。 2 。2 项目反应理论( ir t ) 2 2 1 i i t 的发展概况 i r t 起源于上世纪3 0 年代末4 0 年代初,其发展历程【1 3 】大致可分为三个阶 段: 第一阶段:i r t 的提出( 上世纪3 0 年代末4 0 年代) 1 9 4 6 年,塔克( t u c k e 0 提出“项目反应曲线 概念( 能力水平与正答概率之 间的关系曲线) 。 第二阶段:i r t 的发展阶段( 上世纪5 0 6 0 年代) 1 9 5 2 年,洛德( l o r d ) 提出了正态卵形模型及其参数估计方法,并成功地用 于实际测验;1 9 5 7 年,伯恩鲍姆( b i m b a u m ) 提出了易于处理的l o g i s t i c 模型 7 北京邮电大学硕士论文第一二章自适应相关理论与系统架构 及相应的统计处理方法;1 9 6 0 年,拉什( r a s c h ) 提出了拉什模型,后经赖特( w r i g h t ) 等人的发展,1 9 6 9 年推出了拉什模型参数估计的计算机程序b i c a l ;1 9 6 9 年, 赛麦吉玛( s a m e j i m a ) 提出了可用于二级评分测验,多级评分测验和连续评分测 验的项目反应模型,并对这些模型进行了应用研究。 第三阶段:i r t 的推广应用阶段( 上世纪7 0 年代至今) 有效的参数估计方法及相应的实用计算机程序的开发是这阶段的研究重 点。上世纪7 0 年代以后,i r t 得到广泛应用,如测验设计,能力估计,测验等 同化,自适应测验等。 目前,在理论方面,i r t 的研究主要是在连续变量测验资料和多维条件下 的数学模型的探索上;在实际应用方面主要集中在测验编制,题库建设,测验 参数等值等实际问题上。 2 2 2ir t 的基本原理 项目反应理论( i t e mr e s p o n s et h e o r y ,简称i r t ) t 8 1 是宰- 1 - x 寸a r r 的不足而提 出来的,其理论基础是潜在特质理论即它通过建立一定的项目反应模型来描述 这种非线性关系的。 通常情况下,考生对测验的反应是受某种心理特质所支配的,因为这种特 质是无法直接测量的,故称作潜在特质,在i r t 中,一般把它称为能力,用希 腊字母0 表示。在i r t 中,“能力的含义,往往和“潜在特质”的涵义相同, 因此常常和“特质”这个词交替使用,它可以表示成就水平、能力倾向、人格、 态度等任何一个维度的心理变量,其量值的大小用“能力分数 表示。如果考 生对于测验的反应受到一组潜在特质的影响,那么某个考生在第i 维特质上的 位置或量值通常就记作呸,该考生在k 维潜在特质空间的位置就可以用一个矢 量来表示,记作( 只,岛,0 3 ,o o ) 【加1 i r t 的基本思想就是确定考生的心理特质和他们对于项目的反应之间的关 系,这种关系的数学形式就是“项目反应模型”。但这种模型并不是确定性模型, 而是概率性模型,其原因是考生对于测试项目的反应除了受到自己本身能力的 控制外,还受到许多其他因素的影响,如焦虑、动机、考试技能等。 i r t 理论是一种关于能力测量的理论。它建立于一套假定之上。其中最主 要的基本假设1 1 4 l 有三条: 1 、单维性假设 单维性假设是指测验只测量被试者的某一种能力,而可以忽略其他能力对 测试结果的影响。也就是说,被试者对测验项目的反应只受一种能力水平的支 配而不受其他能力水平的束缚。因此,以i r t 为理论基础的一份试卷,只能测 8 北京邮电大学硕士论文 量单项能力,如语法能力 2 、局部独立性假设 所谓局部独立性假设 的反应在统计上是独立的 他测验项目反应情况的影 份试卷中试题之间在内容上相互联系,但这种联系并不影响考生对各道试题的 反应。 3 、项目特性曲线( i t e mc h a r a c t e r i s t i cc u r v e ,简称i c c ) i c c 是由塔克于1 9 4 6 年首次提出的。塔克把考生的某些维度( 如:能力、 年龄) 看作是自变量,考生对于某个测验项目的反应看作是因变量,在直角坐标 系中做点图,然后用一条光滑的曲线去拟合这些数据,这样得到的曲线就称为 i c c 。 在自适应测试中项目特性曲线是指,被试者对项目所作的反应概率遵循一 定的函数关系,即以一定的数学模型来确定被试个体试题反应概率与其潜在能 力之间的函数关系,这种函数关系通常由一条试题特性曲线来反映。 与c t t 相比i r t 具有的优点【1 5 】,主要表现在以下几点: 1 、项目参数估计的不变性。即项目参数的估计与所使用的被试样本无关。 2 、能力参数估计的不变性。即被试能力参数的估计与所使用的测验中包含 哪些测验项目无关。 3 、能够根据该测量理论选择与被试能力相适应的测验项目。 4 、不要求测量误差及其方差对所有被试者都相等。 5 、不要求通过严格的平行测验来评价测验的精确度。 i r t 的理论体系构建于更复杂的数学模型之上,其概念和理论推导更加严 谨,但i r t 也并不是完美的,其也有一些不足的地方【1 6 l 【1 7 1 ,不足之处表现在以 下几方面: 1 、单维性假定难以满足。这是i r t 受到攻击的最主要原因。单维性是指测 验测量单一潜在特质,但严格的单维性是难以满足的。目前的现实问题是,单 维性需达到什么程度才能应用i r t ,但这一标准的确定尚缺乏充分的理论依据; 2 、目前i r t 的应用仍以两级记分模型为主,且局限于单维反应模型,更高 级的i r t 模型尚处于理论上的探索阶段; 3 、i r t 建立在更复杂的数学模型之上,依赖更强的假设,计算复杂,不易 被人掌握; 4 、i r t 对测验条件要求较严格,样本容量要大,被试的能力分布范围要广, 需要测试题目的数量要多,这些条件不满足就会影响其精确性; 9 北京邮电大学硕士论文 第二章自适应相关理论与系统架构 5 、对a 盯的一些研究领域,如测验效度问题等,i r t 并没有提出独到的 见解。 2 3 典型的ir t 模型 不同的i c c 假设对应着不同的项目反应模型,目前应用最广的项目反应模 型是逻辑斯蒂( l o 舀s t i c ) 模型【1 8 】,该模型是1 9 5 7 年至1 9 5 8 年,由伯恩鲍姆 ( a b l m b a u m ) 将洛德的正态肩形曲线模型改换而成的。根据参数个数不同,分为 单参数l o g i s t i c 模型、双参数l o g i s t i c 模型和三参数l o g i s t i c 模型三种。 1 、单参数模型( 1 p a r a m e t e rl o g i s t i cm o d e l ) 单参数模型的公式如下: 1 p ,( 9 ) = i 南 加_ 1 ) 其中,b 表示项目的难度系数,理论上b e ( ,+ ) ,但实际应用上通常 只取( 2 ,2 ) d 是量化因子,通常令其= 1 7 0 2 , a p ) 表示具有水平0 的考生能够正确回答一个具有难度b 的问题的概率 0 表示能力值,表示个体的某个潜在特质,通常用测验项目的个体反应来 估计 1 m 饥8 8 、- , 山 o 4 o 2 饥o 寸- 2- 10123 0 图2 - 1 单参数l o g i s t i c 模型项目特征曲线 图中的曲线称之为项目特征曲线( i c c ) ,反映了个体的某一潜在特质与其在 某个项目上j 下确反应的概率,这种潜在特质的程度越高,其在某个项目上的正 确反应的概率就越大。 1 0 北京邮电大学硕士论文第二章自适应相关理论与系统架构 上图是根据此公式对3 个不同难度的题目计算所得的曲线图。交叉点称为 拐点。我们分别取试题难度b 为1 ,0 ,1 时,从特征曲线可以看出, 当0 一b 时( 能力值和试题难度值相等) ,考生答对某试题的几率为5 0 ; 当0 b ,( 能力值大于试题难度值时) ,考生答对某试题的几率高于5 0 ; 以上3 条特征曲线中形状一致,位置不同,而影响位置的参数只有难度值 b ,即在单参数模式下,l o g i s t i c s 模型只受难度参数的影响,故参数b 也被称为 1 p l m 的位置参数( l o c a t i o np a r a m e t e r ) 。 2 、双参数模型( 2 p a r a m e t e r l o g i s t i c m o d e l ) 双参数模型的公式为: 以秽) = 南 削2 _ 2 ) 从上式我们可以看出,和单参数模型的公式相比,多了一个参数a ,其余 参数定义相同。a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论