




已阅读5页,还剩61页未读, 继续免费阅读
(计算机软件与理论专业论文)基于贝叶斯网络的学生模型在测试系统的应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
周清:基于贝叶斯网络的学生模型在测试系统的应用研究 基于贝叶斯网络的学生模型在测试系统的应用研究 专业名称:计算机软件与理论 申请者:周清 导师:林拉 摘要 由于网络技术的迅猛发展,我国网络教育得到了快速发展。虚拟课堂是远程网 络教育的一种教学形式,也是重要的教学手段之一。因此,在网络教育或教学系 统中,构建一个理想的虚拟课堂具有十分重要的研究意义和实用价值。一个理想 的虚拟课堂不可或缺的组成部分在线测试系统,在检测学生的学习效果上发 挥着重要作用。近年来,对它的研究应用已经成为教育科研人员关注的热点。 目前流行的在线测试系统大多数是将一些固定的试卷放在w e b 上,由学生自主选 择试卷进行测试,欠缺根据学生的学习情况自动选题以及变换试题的功能,灵活 性较差,难以实现因人施测,而且测试结果一般只是简单地给出一个分数,并不 能给出学生对知识项的具体掌握情况。显然,这样的在线测试系统不能达到人们 预期的效果。 贝叶斯网络是一种表达不确定性知识的有效工具,目前,在许多领域都得到 了广泛的应用。本文将贝叶斯网络应用到在线测试系统中,以实现对学生的有效 测试。 本文首先介绍了计算机自适应测试的相关概念及其工作原理;比较分析了目 前常用的学生模型构建技术;在两种常见的贝叶斯网络学生模型的基础上,提出 了基于知识关系的覆盖型贝叶斯网络学生模型,通过量化各个知识项之间的不确 定相关性,使该学生模型能够较好地反映学生在特定领域内的知识结构。最后, 结合贝叶斯网络的推理机制,设计了自适应选题算法,以确定适合学生知识水平 的测试试题。在研究中,将基于知识关系的覆盖型贝叶斯网络学生模型应用于在 线测试系统中( 应用于华南师范大学求实工程软件工程网络课程网站) 。实验 结果表明:该模型的应用,在一定程度上提高了系统测试结果的客观性和准确性。 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 系统不仅实现了因人施测,而且在测试过程中具有一定的预测能力及排除学生猜 对试题答案的能力;测试结果给出了学生对各个知识项的具体掌握情况,基本符 合学生的实际情况。 关键词:贝叶斯网络,学生模型,在线测试,虚拟课堂 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 s t u d e n tm o d e lb a s e do nb a y e sla nn e t w o r k a b s t r a c t i no n - l l n et e s ts y s t e m m a j o r :c o m p u t e rs o f t w a r ea n dt h e o r y n a m e :z h o uq i n g s u p e r v i s o r :l i nl a a l o n gw i t ht h er a p i dd e v e l o p m e n to fn e t w o r kt e c h n o l o g y ,n e t w o r kt e a c h i n g i m p r o v e sf a s ti nr e c e n ty e a r s v i r t u a lc l a s s r o o m ,w h i c hi sat y p i c a lf o r mo fd i s t a n c e e d u c a t i o n ,i sa ni m p o r t a n tm e a n so ft e a c h i n g t h e r e f o r e ,i m p l e m e n t a t i o no fa ni d e a l v i r t u a lc l a s s r o o mi nd i s t a n c el e a r n i n gs y s t e mi so fg r e a ts i g n i f i c a n c ea n dp r a c t i c a l v a l u e o n - l i n et e s t s y s t e mw h i c hi sa ni n t e g r a lp a r to fa ni d e a lv i r t u a lc l a s s r o o m p l a y sa ni m p o r t a n tr o l ei ne v a l u a t i n gs t u d e n t sm a s t e r yl e v e lo fk n o w l e d g e ,i t s r e s e a r c ha n da p p l i c a t i o nb e c o m ef o c u si nr e c e n ty e a r s i nm o s tc o m m o no n - l i n et e s ts y s t e m s ,s t u d e n t sc h o o s ep a p e r so nw e bt oh a v e p e r s o n a lt e s t s ,w h i c hl a c ko ft h ef u n c t i o nt oc h a n g eq u e s t i o n sa u t o m a t i c a l l ya c c o r d i n g t os t u d e n t sl e v e lo fk n o w l e d g e ,i t sd i f f i c u l tt oa c h i e v e v a r i o u st e s to nv a r i o u s s t u d e n t s ”,a n da l s ot h et e s tr e s u l ti sj u s tam a r kw h i c hc a n ti n d i c a t et h em a s t e r yl e v e l o fe a c hk n o w l e d g ei t e m i tc a nn o ts a t i s f yt h ee x p e c t a t i o n b a y e s i a nn e t w o r k i sav e r ye f f e c t i v et o o lt oe x p r e s su n c e r t a i nk n o w l e d g ea n di s u s e di nm a n yr e s e a r c hf i e l d sw i d e l y i no u rr e s e a r c h ,b a y e s i a nn e t w o r ki su s e di n o n l i n et e s t s y s t e mi no r d e rt oe v a l u a t es t u d e n t sm a s t e r yl e v e lo fk n o w l e d g e p r e c i s e l y f i r s t l y ,t h ec o n c e p t sa n dp r i n c i p l e so fc o m p u t e ra d a p t i v et e s ta r ei n t r o d u c e d t e c h n o l o g i e sc o m m o n l yu s e dt ob u i l ds t u d e n tm o d e la r ea l s oc o m p a r e da n da n a l y z e d s e c o n d l y , b a s e do nt w oc o m m o nb a y e s i a nn e t w o r ks t u d e n tm o d e l s ,a ne f f e c t i v e o v e r l a ys t u d e n tm o d e lb a s e do nk n o w l e d g er e l a t i o n s h i pi sp r o p o s e d ,w h i c hr e f l e c t s t h ed o m a i n s p e c i f i ck n o w l e d g e s t r u c t u r e t h r o u g hq u a n t i f y i n g t h eu n c e r t a i n i i i 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 r e l a t i o n s h i pb e t w e e nk n o w l e d g ei t e m s f i n a l l y , w i t hb a y e s i a nr e a s o n i n gm e c h a n i s m , t h ea d a p t i v ea l g o r i t h mo fs e l e c t i n gt e s ti t e m si sp r o p o s e dt oc h o o s et h et e s tq u e s t i o n s a c c o r d i n g t ot h es t u d e n t sk n o w l e d g el e v e l i no u rr e s e a r c h ,t h es t u d e n tm o d e lp r o p o s e di sa p p l i e dt ot h eo n - l i n et e s ts y s t e m e x p e r i m e n ts h o w st h a tt h et e s tr e s u l t so b j e c t i v i t ya n da c c u r a c yo ft h eo n - l i n et e s t s y s t e mh a v eb e e ni n c r e a s e dt oac e r t a i ne x t e n ta n d v a r i o u st e s to nv a r i o u ss t u d e n t s i sa l s or e a l i z e d t h es y s t e mh a sa b i l i t yt op r e d i c t ,a sw e l la st oe x c l u d es t u d e n t s g u e s s i n gt h eq u e s t i o n s t e s tr e s u l t sp r e s e n ts t u d e n t sm a s t e r yl e v e lo fe a c hk n o w l e d g e i t e m k e y w o r d s :b a y e s i a nn e t w o r k ,s t u d e n tm o d e l ,o n - l i n e t e s ts y s t e m ,v i r t u a l c l a s s r o o m i v 华南师范大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论 文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文 的研究做出重要贡献的个人和集体,均已在文中以明确的方式标明。 本人完全意识到此声明的法律结果由本人承担。 论文作者签名: ) 跫准 日期:脚年矿月夥日 学位论文使用授权声明 本人完全了解华南师范大学有关收集、保留和使用学位论文的规 定,一即:研究生在校攻读学位期间论文工作的知识产权单位属华南师 范大学。学校有权保留并向国家主管部门或其指定机构送交论文的电 子版和纸质版,允许学位论文被检索、查阅和借阅。学校可以公布学 位论文的全部或部分内容,可以允许采用影印、缩印、数字化或其他 复制手段保存、汇编学位论文。( 保密的论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密范围,在年后解密适用 本授权二转。非保密论文注释:本学位论文不属于保密范围,适用本授权 书。 论文作者签名:氮嘱 日期:? 秽略,年迭月2 弓日 翩虢林扭翩签名:林扭 日期:伽辑妒月哆日 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 1 1 课题研究背景 第一章绪论 由于网络技术的迅猛发展,我国网络教育得到了迅猛发展。虚拟课堂是进行 网络教育的重要教学形式和手段之一。 本文根据华南师范大学求实工程项目的优质示范课程软件工程网络课程 目标之一构建一个虚拟课堂,通过该虚拟课堂,学生能够在协作的学习环境 下开展小组讨论、协商,以进一步深化对知识的理解。在虚拟课堂开发的过程中, 发现了这方面的需求学生对学习效果的检测,即对已学知识掌握程度的评 估。学生只有确切地了解了自己对各个知识项的掌握程度,才能灵活地调整学习 计划。目前,在虚拟课堂中,该评估是通过在线测试进行的,目前流行的在线测 试系统大多数是将一些固定的试卷放在w e b 上,由学生自主选择试卷进行测试, 欠缺根据学生的需求和学习情况自动选题以及变换试题,灵活性较差,难以实现 因人施测,而且测试结果一般只是简单地给出一个分数,并不能给出学生对知识 项的具体掌握情况,显然,这样的在线测试系统不能达到人们预期的效果。 计算机自适应测试是计算机先通过一些试探性试题来估计学生的能力,再根 据选题算法从题库中选择与学生能力相近的试题继续测试,每测试一题都要重新 估计学生的能力,并重复这一过程。随着学生所做试题的增多,计算机对其能力 的估计精度也越来越来高,最后其估计值收敛于一点,该点就是学生能力较精确 的估计值。这种自适应性的测试方式始终围绕学生的能力进行,学生所做的试题 都是根据学生的能力从题库中自动选择的,试题针对性强,更加突出了学生的主 体地位和个性化需求,即能够做到因人施测。 在计算机辅助教学系统中,把记录学生基本信息与学习状况的数据结构称为 学生模型。学生模型构建的质量决定了对学生知识掌握水平评估的客观性和准确 性。因此,如何建立一个准确、高效的学生模型至关重要。 本文虚拟课堂的在线测试采用计算机自适应测试方式,自适应测试的核心是 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 学生模型。目前,有许多构建学生模型的技术,本文就现有的技术进行了详细分 析和比较,在两种常见的贝叶斯网络学生模型的基础上,提出了一个基于知识关 系的贝叶斯网络学生模型,通过量化各个知识项之间的不确定相关性,使该学生 模型能够较好地反映学生在特定领域内的知识结构。同时,结合贝叶斯网络的推 理机制,设计了白适应选题算法,并通过实验进行了有效性验证。 1 2 国内研究外概述 计算机自适应测试基本思想是:计算机先通过一些试探性试题来估计学生 的能力,再根据选题算法从题库中选择与学生能力相近的试题继续测试,每测试 一题都要重新估计学生的能力,并重复这一过程。随着学生所做试题的增多,计 算机对其能力的估计精度也越来越来高,最后其估计值收敛于一点,该点就是学 生能力较精确的估计值。这种自适应性的测试方式始终围绕学生的能力进行,学 生所做的试题都是根据学生的能力从题库中自动选择的,试题针对性强,更加突 出了学生的主体地位和个性化需求,即能够做到因人施测。 计算机自适应测试是由适应性测验( t a i l o r i n gt e s t ) 发展而来的。适应性测验 是w i l l i a mw t u mb u l l 于1 9 5 1 年提出的。上个世纪5 0 到6 0 年代有许多教育测 量学家对适应性测验的理论作了大量的深入研究,为日后的基于计算机的自适应 测试奠定了坚实的理论基础。2 0 世纪7 0 年代以后,计算机科学技术的发展对全 社会各行各业都带来了巨大变革。同样也促使适应性测验的研究迈上了一个新的 台阶。1 9 7 1 年,美国的教育测量学家劳德( l o r d ) 依据当时计算机技术的发展, 在前人对适应性测验理论研究的基础上深入研究,首先提出了计算机自适应测试 ( c o m p u t e ra d a p t i v et e s t c a t ) 这一概念。美国军方从上世纪7 0 年代初起就在适 用于军队选员的美国陆军职业性向测验组( a s v a b ) 中采用了计算机自适应测 试,在1 9 8 4 年美国军方实验室应用了另一个计算机自适应测试系统c a s t ( t h e c o m p u t e r i z e d a d a p t i v es c r e e n t e s t ) ,这是第一个全国范围的c a t ;在信息产业中, 美国n o v e l l 公司于1 9 9 1 年成功地应用了c a t 进行认证测试,使参加n o v e l l 自 适应测试的人数超过了1 0 0 0 0 0 0 人次。如今在美国,c a t 已经在教育测验、职业 测量、人事评测等领域中大显身手,如美国研究生入学考试( g r a d u a t e r e c o r d 2 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 e x a m i n a t i o n ) 、工商管理类研究生入学考试( g r a d u a t ef o rm a n a g e m e n t a n d a d m i n i s t r a t i o nt e s t ) 以及全美护士国家委员会资格考试( n u r s en a t i o n a l c o m m i t t e el i c e n s et e s t ) 等都已经采用了c a t 测试方式乜1 。在日本,凯思国际职 业英语计算机测评系统( c a s e c ,c o m p u t e r i z e da s s e s s m e n ts y s t e mf o re n g l i s h c o m m u n i c a t i o n ) 己广泛应用于企业、学校和政府,成为日本职业英语能力评估 的标准。根据测定,c a s e c 考试只要2 5 个题就可以使考试成绩的可信度达到 9 6 ,从而使考生做很少的题就达到考试的目的,节省了测评时间口 。 在我国,高校中己经出现了一些应用型的研究,自行编制了一些c a t 测验, 并取得了实际应用效果,上海电大在上海市计算机应用能力的考试项目“v b 6 0 程序设计中”采用c a t 的测试方式。江西师大小学数学c a t 研究也取得了一定 的成果。国内一些大规模的考试如微软认证考试m c s e 、东软在线凯思英语考试 等都已经成功采用c a t 方式h 1 。 目前,构建学生模型所采用的技术主要包括产生式系统、模糊逻辑、神经网 络、知识约束方法、模型跟踪、贝叶斯网络等。产生式系统,其结构相对比较简 单,应用也比较成熟,应用在许多智能计算机辅助系统中,但知识获取的“瓶颈” 和逻辑推理理论的不完善,在一定程度上影响了系统的推理能力;神经网络通过 模拟人脑的微观工作过程来实现推理功能,因此能够产生质量较高的推理结果, 但是实现复杂,并且其推理过程一般不能被打断,推理系统与人的交互能力也比 较差;模型跟踪实现容易,但是推理能力很弱。 贝叶斯网络是人工智能领域中一种将图论和概率论相结合的图形模型,它现 在已经在几个研究领域( 如模式识别、分类、医学诊断等) 中得到了广泛的应用瞄1 。 目前贝叶斯网络被认为是构建学生模型最理想的工具田1 之一,这是因为贝叶斯网 络能够很好地模拟现实世界中的事物问的因果关系,在学生建模中,贝叶斯网络 对先验知识和后验数据具有很好的结合能力,能够编码学生知识项之间的因果关 系,通过不断加入信息,即时更新对学生认知能力( 学生对知识项的掌握情况) 的评测和把握。贝叶斯网络强大的推理功能和预测功能都有严谨而充分的概率论 作为理论基础畸1 ,从而保证了推理结果的可信度。目前国际上有两种典型的贝叶 斯网络学生模型。第一种是考虑子知识项会对父知识项产生一种因果影响,第二 种是考虑父知识项会对其子知识项产生因果影响。国际上对这两种模型都有应 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 用,a n d e s ( c o n a t ie ta 1 ,1 9 9 7 ;v a nl e h n ,1 9 9 6 ) m 1 与a r i e s ( c o l l i n s ,1 9 9 6 ) 5 1 使用了第一种,h y d r v e ( m i s l e v ya n dg i t o m e r , 1 9 9 6 ) 暗1 则采用了第二种。本文采 用第一种贝叶斯网络学生模型,并对其稍作修改,应用于在线测试系统中,使系 统能够比较准确地评估学生对各个知识项的掌握情况。 1 3 课题研究的意义 知识型课程是基于知识项( k i k n o w l e d g ei t e m ) 组织的,知识项之间的关系 主要有两种,组织关系和依赖关系。 目前,有两种常见的贝叶斯网络学生模型呻3 ,第一种是考虑子知识项会对父 知识项产生一种因果影响,第二种是考虑父知识项会对其子知识项产生因果影 响。这两个模型都体现了知识项之间的组织关系,即子知识项和父知识项之间的 影响关系。第一种模型没有体现知识项之间依赖关系,第二种模型虽然问接体现 了知识项之间依赖关系,但是无法明确表示出知识项之间的依赖关系大小。为了 能够准确地表示出知识项之间的两种关系,需要对以上两种模型进行改进。 本文对第一种模型稍作修改,即在该模型的基础上增加有向边来体现依赖关 系,使该学生模型更加接近领域知识。将修改之后的贝叶斯网络学生模型应用于 在线测试系统中,经实验证明,系统不仅能够因人施测,而且能够比较客观、准 确地评估学生对各个知识项的掌握情况。该实验结果为适应性网络学习系统提供 了很好的支持,也为构造一个理想的虚拟课堂提供了良好的实用和参考价值。 4 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 第二章计算机自适应测试基本理论 在传统测试中,对于每个学生而言,题目中只有一部分是符合自己真正水平 的,其余的题目要么简单,要么太难,这样对学生真正知识水平的评估也就不够 客观和准确。计算机自适应测试是指在以项目反应理论为基础建立的题库之上, 不断地根据题目的各方面信息和学生的答题情况估计学生的能力,然后从题库中 选取符合学生能力的题目进行测试,直到达到预定的测试精度要求,即可结束测 试。这样比较客观和准确地评估了学生的能力。 本章将对项目反应理论及计算机自适应测试的各个环节加以详细描述。 2 1 项目反应理论i r t 项目反应理论( i t e mr e s p o n s et h e o r y ,i r t ) 是当前国际上最先进的教育和心 理测量理论之一。它是为了克服经典测量理论( c l a s s i c a lt e s tt h e o r y ,c t t ) 中项 目参数等指标的变异性而发展起来的一种新兴的教育和心理测量理论n 引。项目反 应理论研究应试者的某种心理特质和他们对项目的反应( 正确作答的概率) 之间 存在的关系,并以数学函数的形式表示出来。潜在特质一般是不可见的。i r t 提 供了各种反应与潜在变量之间的关系,其意图在于用已观察到的行为( 通常是对 许多项目的反应) 来估计一个人的潜在特质水平,然后个体的潜在特质水平可用 来预测其他行为,或者作出某种决策。 2 2 项目反应模型 基于项目反应理论的测验模型称为项目反应模型,即i r t 模型。i r t 模型 是一种数学模型,它的特点是以概率的概念来解释应试者对试题的反应和其潜 在能力特质之间的关系。目前,专家学者们提出过多种i r t 模型。现在应用比较 广泛的是逻辑斯蒂( l o g i s t i c ) 模型。该模型是1 9 5 7 年至1 9 5 8 年,由伯恩鲍姆( a b i m b a u m ) 将洛德( l o r d ) 的正态肩形曲线模型改换而成的。根据参数个数不同, 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 分为单参数l o g i s t i c 模型、双参数l o g i s t i c 模型和三参数l o g i s t i c 模型三种1 。 一单参数l o g i s t i c 模型 单参数l o g i s t i c 模型最初是由丹麦数学家拉希( r a s c h ) 在1 9 6 0 年提出的,其数 学模型如下所示: p r 0 、: !( 2 1 ) k o 户青高 喵1 0 :能力值,表示个体的某个潜在特质,通常用测验项目的个体反应来估计。 b :项e l 的难度系数,理论上b ( - o o ,+ ) ,但实际应用上通常只取b ( 一2 , + 2 ) 。 p ( 0 ) :能力值为0 的个体对项目作出正面反应的概率。 一双参数l o g i s t i c 模型 双参数l o g i s t i c 模型的数学模型如下所示: p ( 。) 2 再丽1 ( 2 2 ) 0 :能力值,表示个体的某个潜在特质,通常用测验项目的个体反应来估计。 a :项目的区分度,用来描述项日所具有的区分能力的大小。 b :项目的难度系数,理论上b ( - o o ,+ ) ,但实际应用上通常只取b ( 一2 , + 2 ) 。 p ( 0 ) :能力值为0 的个体对项目作出正面反应的概率。 一三参数l o g i s t i c 模型 三参数l o g i s t i c 模型是目前应用最多的模型,其数学模型如下所示: p ( 0 ) = c + ( 1 - c ) l + e 1 7 a ( 0 - b ) ( 2 - 3 ) 0 :能力值,表示个体的某个潜在特质,通常用测验项目的个体反应来估计。 c :项目的猜测系数,表示由于推论、猜测等偶然因素对项目作出正面反应的 概率。 a :项目的区分度,用来描述项目所具有的区分能力的大小。 b :项目的难度系数,理论上b ( - o o ,+ ) ,但实际应用上通常只取b ( 一2 , + 2 ) 。 p ( o ) :能力值为0 的个体对项目作出j 下面反应的概率。 6 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 正 面 反 应 的 概 率 勺 口 o 乃 :0 1 5 e 210 23456 7891 0 能力值0 图2 - 1 三参数l o g i s t i c 模型的项目特征曲线图 图2 1 是在a = 1 2 ,b = 3 ,c = 0 2 5 情况下所获得的曲线。该曲线称之为项目特征曲 线,反映了个体的某一潜在特质与其在某个项目上j 下确反应的概率,这种潜在特 质的程度越高越强,其在某个项目上的正确反应的概率就越大。 2 3 计算机自适应测试原理( c a t ) 2 3 1 计算机自适应测试原理 计算机自适应测试臼1 是指在以项目反应理论为基础建立的题库之上,不断地 根据题目的各方面信息和学生的答题情况估计学生的能力,然后从题库中选取符 合学生能力的题目进行测试,直到达到预定的测试精度要求,即可结束测试。由 此可以知道,它是由计算机控制的测试过程,它可以依据学生的做题反应来决定 选择下一题,以及动态地决定测试的长度。k i n g s b u r y 、w e i s s ( 1 9 8 3 ) 、w a i n e r ( 1 9 9 0 ) 对计算机自适应测试系统的进行了讨论,他们认为其最大的优点就是在同等的或 者更加好的评估学生能力情况下,明显减少了测试长度。如图2 2 是计算机自适 应测试的测试过程。 7 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 图2 2 计算机臼适应测试流程 从本质上说,计算机自适应测试是一个迭代的过程。首先,对学生的能力值 进行初始估计,然后按以下步骤对学生能力值不断修正。 ( 1 ) 根据学生当前的能力值,由系统选择一个对决定学生的真实能力极有用的 试题。系统选择试题时通常采用“信息最大项目选择法”。 ( 2 ) 系统呈现试题,学生回答。 ( 3 ) 系统根据学生对试题的回答,重新估计学生的能力值。 ( 4 ) 还要呈现新试题吗? 这是自适应测试的终止准则问题。 ( 5 ) 如果还要呈现新试题,再回到步骤( 1 ) ,否则,本次测试结束。 2 3 2 实施方案 实现计算机自适应测试主要解决的问题是: ( 1 ) 建立题库 8 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 题库是进行测试的基础,c a t 题库不是试题的简单聚集,而是一些经过特殊 处理的具有较大信息量的试题的科学组合,它不仅要包含测试试题,还应包含必 要的参数信息,以保证能力评估的准确性。高质量的题库应具有优质、量大、等 值、动态可扩充等特点。c a t 题库的建立由以下几个活动组成: _ 选择模型。首先选择合适的i r t 模型,本文选择三参数l o g i s t i c 模型,并 在此模型的基础上,建立题库中试题的标准规格。 试题的开发。试题的开发应按题库命题的规格标准进行,注重不同知识内 容与能力层次,不同难度结合,对进入题库的试题要组织审查,确保试题质 量。 一试题参数的确定。主要是对试题i r t 各参数值的确定,一般有两种途径: 经测试后统计分析;由专家进行评估后,再采用统计方法确定参数。 本文采用后一种方法。 一 题库的动态维护。基于i r t 的题库由于i r t 理论具有参数不变性等优点, 题库的扩充变得更为容易,只需安排一些旧试题与新试题相混合进行测试, 就可以将新试题的参数与旧试题的参数统一到一张量表中来。 ( 2 ) 参数初始化 参数的初始化是指在学生进行测试之前,对学生的能力值进行初始估计,一 般有以下几种方法: 选择中等难度的试题,即假定学生的能力为中等,在题库中随机抽取难度 为中等的试题,作为测试的开始点。 根据历史记录确定学生的初始能力值,学生可能参加过测试,可以根据以 前的测试记录决定此次的开始试题,或根据以前其他学生的测试记录决定 开始试题。 学生自行选择,由学生自行决定自己的能力程度,选择测试起始试题。 ( 3 ) 评估学生能力值。 正确估计学生的能力是自适应测试顺利进行的前提( 将在第四章介绍) 。 ( 4 ) 选择试题。 不断抽取和学生能力相适应的题目是自适应测试的基本原则( 将在第四章介 绍) 。 9 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 第三章学生模型及贝叶斯网络相关理论 自适应测试的核心是学生模型,学生模型构建的质量决定了对学生知识掌握 水平评估的客观性和准确性。 本章介绍了学生模型的概念以及分类,重点分析了目前构建学生模型的主要 技术以及各自的特点;同时阐述了贝叶斯网络相关理论,并提出了基于知识关系 的贝叶斯网络学生模型。 3 1 学生模型概念 学生模型是学生的认知状态表示。学生模型反映了学生的学习进度、知识的 熟练程度、存在的误解以及与期望目标之间的差距。分析和表示学生模型的过程 称为学生建模n2 l 。学生模型的概念如下: _ 学生模型表示学生对学习内容的掌握程度 b a n e t a l ,1 9 8 2 :a 1 h a n d b o o k ; 一全部有关学生的行为和知识都可以称为学生模型 w e n g e r ,1 9 8 7 ; 学生模型可以表示为一个四元组 ,其中p 代表对知识的学习 过程( p r o c e d u r a lk n o w l e d g e ) ;c 代表概念知识( c o n c e p t u a lk n o w l e d g e ) ;t 代 表个人信息( t r a i t so fi n d i v i d u a l ) ;h 代表历史数( h i s t o r yd a t a ) s e l f , 19 8 8 。 学生模型是虚拟课堂的一个非常重要的概念,它是课堂中学生的抽象表示, 也是课堂中学生知识状况的描述,对于获得学生对知识内容的理解状态非常重 要。一个理想的学生模型应该包括学生过去与学习相关的所有要素、课程学习中 的进步状态、学习类型、以及其它所有与学生相关的信息。实现这样的学生模型 存在诸多困难,因此目前很多系统都是根据学科内容的陈述来模拟学生。 3 2 学生模型分类 目前根据学生知识表示方法的不同,可将学生模型分为三种。 ( 1 ) 覆盖学生模型口3 h 儿惜1 1 0 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 覆盖学生模型是最早的基于人工智能的学生模型,在s c h o l a r 系统 ( c a r b o n e l l ,1 9 7 0 ) 、w e s t 系统( b u r t o na n db r o w n ,1 9 7 6 ) 以及w u s o r 系统( c a r r a n dg o l d s t e i n ,1 9 7 7 ) 中,就采用了覆盖学生模型。覆盖学生模型是将学生拥有 的知识看成专家知识的子集( 理想状态是二者重合) ,如图3 - 1 所示。在覆盖学生 模型中,学生模型是通过将学生的行为同专家相比较而建立的。专家知识通常可 以被分解为各个模块或不同粒度层次的知识,比较精确的覆盖学生模型能够描述 学生对各不同粒度层次知识的掌握程度,即在专家知识模型中的每个知识点上附 加一个权值来表示学生对该知识点的掌握程度,因此该学生模型是序偶对( 知识 点,权值( 掌握水平) ) 的集合,该权值可以通过对学生的评估得到。 覆盖学生模型描述的是一种相对简单 的推理机制,它支持关于学生认知状态同理 想的领域专家相关的推理,可以很好地适用 于将知识由专家传授给学生的一类系统。其 优点是可以作为大量知识项的课程测试中 的学生模型,能很清楚的表示先验知识。目 前在很多智能教学系统都有应用。 ( 2 ) 偏差学生模型n 町 偏差学生模型是一种扩展的覆盖学生 模型,在原有的覆盖学生模型中扩展了知识 集,包含学生可能有的错误概念( 如3 2 图 示) 。偏差学生模型不是把学生知识看成专 家知识的一个子集,而是把学生当前的知识 分为正确与错误的单元子知识,并根据对专 图3 1 覆盖学生模型 图3 2 偏差学生模型 家知识及学生的表现深入分析建立错误特征库( 许多研究者( b r o w na n db u r t o n , 1 9 7 8 ;b u r t o n 1 9 8 2 ;b r o w na n dv a n l e h n ,1 9 8 0 ;s l e e m a na n ds m i t h ,1 9 8 1 ) 一直 将研究集中在构造错误特征库上) 。错误特征库包含了学生对相应知识的正确理 解、可能的错误认识、引起这些错误的可能原因( 概念错误、记忆错误、计算错 误、操作错误、陌生内容等) 以及纠正相应错误的举措信息。 使用偏差模型的系统不仅能指出学生的错误,告诉学生正确的是什么,而且 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 还能发现导致错误的原因,在学习过程可以有效地对学生的错误进行更正。但是 困难在于很难将全部的错误认识及引起这些错误的原因找出,而且即使找出,计 算机也难以完全实现,即建立错误特征库比较困难。 ( 3 ) 认知学生模型n 6 1 认知学生模型是基于美国著名心理学家布卢姆的认知理论建立起来的学生 模型,它既能反映学生的认识水平,又能反映学生认知能力及心理因素的模型。 前两种模型主要注重学生学习能力和知识水平的考察和评测。而认知模型则注重 学生认知风格,认识心理方面的研究,更加符合认知主义学习理论的要求,模型 中主要包括认知能力、学习风格、心理特征等。在建构学生模型的过程中,首先 制定认知能力的数据描述标准并利用它对认知能力进行定量评估与测量,然后根 据各个问题的认知标准,不断对学生模型进行更新,同时根据从模型获得的学生 认知能力来作出评论。 3 3 构建学生模型的技术比较 目前,构建学生模型的技术主要有产生式系统、模糊逻辑、神经网络、贝 叶斯网络等。 ( 1 ) 产生式系统 产生式系统是智能教学系统智能的源泉,其构建的学生模型中,知识表示明 确,推理规则简单,应用也比较成熟。产生式系统是认知心理学研究人类心理活 动中信息加工过程的基础,用产生式系统求解问题的过程和人类求解问题的思维 过程很相似,故可用来模拟人类求解问题的思维过程n 7 1 8 1 。但是产生式系统存在 的固有缺陷,即知识获取的“瓶颈 和逻辑推理理论的不完善,在一定程度上影 响了系统的推理能力,并且无法处理学生模型中的不确定性信息,所以构建出来 的学生模型无法令人满意。 ( 2 ) 模糊逻辑 目前国内智能教学系统中构建学生模型比较普遍的方法就是利用模糊逻辑。 模糊逻辑的推理能够处理具有不确定性的问题,它由成员函数和规则对数据进行 推理,以模糊成员函数( 模糊子集) 和规则代替布尔逻辑,对数值进行推理n 。 1 2 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 s h e r l o c k i i n 町就是使用模糊逻辑理论来构建偏差学生模型的典型例子,它的主要 应用领域是复杂电力系统的故障排除。模糊逻辑方法建立的学生模型过程简单、 实现容易而且代价较低,但是由于其推理能力的薄弱,导致推理结果的精确度并 不高。 ( 3 ) 神经网络 神经网络的工作原理和功能特点接近于人脑,它是一种优秀的解决不确定性 问题的方法,在逻辑严谨的数学理论支持下,神经网络能够对大多数的不确定性 信息进行处理口7 1 。这种推理技术通过模拟人脑的微观工作过程来实现推理功能, 能够产生质量较高的推理结果。因此有许多研究者提出使用神经网络来构建学生 模型乜们乜u ,但是,由于神经网络的知识表现性很差,推理过程一般不能被打断, 推理系统与人的交互能力也很差。一旦网络的结构和网络参数确定下来,网络的 结构和网络中各层节点间的权重就很难更改,网络再学习的代价也很高。 ( 4 ) 贝叶斯网络 贝叶斯网络是人工智能领域中一种将图论和概率论相结合的图形模型,目前 贝叶斯网络被国外研究者们认为是构建学生模型最理想的技术之一,因为贝叶斯 网络能够很好地模拟现实世界中的事物间的因果关系,在学生建模中,贝叶斯网 络对先验信息和后验信息具有很好的结合能力,能够编码学生知识项间的因果关 系,通过不断加入新信息,即时地更新对学生能力的评估和把握。贝叶斯网络学 生模型不仅能够推导出学生的当前状态,还可以预测学生未来的表现。贝叶斯网 络强大的推理和预测功能都有严谨而充分的概率论作为理论基础口驯,从而保证了 推理结果的可信度。 a n d e s 田2 2 1 和h y d r i v e 陆3 就是贝叶斯网络学生模型的两个典型实例。 a n d e s 是一个智能导学系统,它是一个大学物理系一年级学生的家庭作业助手, a n d e s 能够帮助学生在解决物理试题的过程中不断地自测和评估。它将学生解 题的过程转换成贝叶斯网络。h y d r i v e 是一个用于f - 1 5 战机的水力系统故障 诊断的评估导学系统,它模拟了f - 1 5 战机飞行时水力系统故障诊断的重要属性 之问的关系。 a n d e s 学生模型和h y d r i v e 学生模型分别如图3 - 3 、3 - 4 所示。 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 图3 - 3a n d e s 学生模型图 畿甚 图3 4h y d r i v e 学生模型图 基于上述四种构建学生模型技术特点的讨论,本文采用贝叶斯网络来构建覆 盖学生模型,旨在利用贝叶斯网络对于先验知识和后验数据的结合能力,将学生 所学知识项之间的因果关系进行编码,并通过不断加入后验数据以实现对学生能 力的评估和把握的不断更新,从而提高对学生能力评估的准确度。 1 4 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 3 4 贝叶斯网络理论 建立学生模型时,可以利用先验信息,也可以利用后验数据建模,一种理想 的方法是同时利用先验信息和后验数据来建模。贝叶斯网络,又称为信任网络、 知识图、概率因果网络等,是图形模型的一种,它可以将先验信息和后验数据很 好的结合起来,表示出变量间的概率关系和潜藏在环境中起作用的因果机制。利 用贝叶斯网络的这种特性可以构造新的学生模型。 3 4 1 贝叶斯网络的发展历史 贝叶斯理论瞳3 儿2 4 1 是由1 8 世纪数学家和神学家r e v t h o m a sb a b e s 在1 7 6 3 年 第一次发表的。数学描述如下: ( 3 - 1 ) 该等式表示给定背景先验知识c 和额外的证据e ,就可以更新对于假设h 的信任 度。左边的p ( h i e ,c ) 是后验概率,是在考虑了e 加在c 上的效果后h 的概率。p ( h i c ) 是只给定c 下,h 的先验概率。p ( e i h ,c ) 称为似然度,是在假设h 和背景知识c 为真的情况下证据e 的概率。p ( e i c ) 是独立于h 的,可认为是一个规范化的比例 因子。 1 9 8 2 年,p e a r l 注意到有向无环图可用作一种计算结构,并因此可以作为一 种认知行为模型。他通过一个分布式方案示范了一个树状网络的概率更新,进而 对阅读理解的分布处理进行建模。其中,自上而下和自下而上的推理被结合起来 以形成一致的解释。这种双重推理模型是贝叶斯网络更新的核心内容,也是 r e v e r e n db a y e s 在1 7 6 3 年提出贝叶斯理论的中心思想。 后来贝叶斯网络在逻辑和认知领域没有引起进一步注意,却在专家系统上大 受重视。这种协调双向推理的技术填补了专家系统在7 0 年代后期的空白,因此 贝叶斯网络在这一领域真正繁荣起来。目前贝叶斯网络己经在故障诊断、预测、 军事决策、智能机器人、医学上的病理诊断、商业上的金融市场分析、信息融合、 信息智能检索、基于因果关系的数据挖掘等领域得到了广泛应用。 周清:基于贝叶斯网络的学生模型在测试系统的应用研究 3 4 2 贝叶斯网络的概念 1 、贝叶斯网络的定义乜5 1 贝叶斯网络b n ( b a y e s i a nn e t w o r k ) 又叫信度网( b e l i e fn e t w o r k ) ,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农业银行2025资阳市笔试英文行测高频题含答案
- 交通银行2025本溪市秋招笔试专业知识题专练及答案
- 建设银行2025九江市秋招无领导模拟题角色攻略
- 工商银行2025周口市秋招英文面试题库及高分回答
- 交通银行2025渭南市秋招笔试价值观测评题专练及答案
- 邮储银行2025乌兰察布市秋招无领导小组面试案例题库
- 建设银行2025黄南藏族自治州信息科技岗笔试题及答案
- 农业银行2025合肥市秋招笔试热点题型专练及答案
- 班组建安全和培训课件
- 中国银行2025松原市秋招笔试创新题型专练及答案
- 绿化部门车辆管理制度
- 孤独症相关培训课件
- xx公司风险管理制度
- 2025年导游证考试试题
- 延长劳动合同期限协议书
- 生态农业规划生态农业规划农业生态园规划方案
- 汽车贴膜合同协议书
- 大学生学习投入程度测量与评估方法研究
- 学前教育自然科学课程
- 2024年5月12日河北省省直事业单位招聘(综合类)工作人员《职业能力测验》试题真题试卷答案解析
- 2025年注安道路运输安全实务真题卷(附解析)
评论
0/150
提交评论