(教育技术学专业论文)基于诊断性练习系统题库的试题关联研究.pdf_第1页
(教育技术学专业论文)基于诊断性练习系统题库的试题关联研究.pdf_第2页
(教育技术学专业论文)基于诊断性练习系统题库的试题关联研究.pdf_第3页
(教育技术学专业论文)基于诊断性练习系统题库的试题关联研究.pdf_第4页
(教育技术学专业论文)基于诊断性练习系统题库的试题关联研究.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(教育技术学专业论文)基于诊断性练习系统题库的试题关联研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

u n i v e r s i t yo fs c i e n c ea n dt e c h n o l o g yo fc h i n aadi s s e r t a t i o nf o rm a s t e r sd e gr e et h es t u d yo nt h ec o r r e l a t i o no ft h ei t e mb a nko fd i a gn o s t i ce x e r c i s es y s t e ma u t h o r sn a m e :s p e c i a l i t y :y e j u nj i a n ge d u c a t i o n a lt e c h n o l o g ys u p e r v i s o r :p r o f m i nw ue n g i n e e rm i n y o n gs h a of i n i s h e dt i m e :j u n e ,2 012m 7叭叭9帆5吣2叭12叭y中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除己特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均己在论文中作了明确的说明。作者签名:彳必签字日期:趋丝立丛一中国科学技术大学学位论文授权使用声明作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。口公开口保密( 年)作者签名:蕴盗签字日期:鲨! 至! 墨! d导师签名摘要摘要现有的英语练习网站或系统缺乏交互性和诊断性,从而导致学习者的学习效率较低。为此,希望能根据大学英语四级知识体系建构一个具备诊断评测功能的英语练习系统。大学英语四级知识体系中知识点划分颗粒的大小,对准确诊断学习者的薄弱知识点水平十分重要。同时,目前本项目组的诊断性练习系统采用的组卷算法,忽略了试题实际知识考察点之间的关系。所以本文研究的目的就是进一步细分和完善大学英语四级知识体系和建立试题之间的关联,并提出基于试题考察点关联度的组卷算法。为了实现上述目的,本文首先针对基于诊断性评测的大学英语四级知识分类体系在实际应用中存在的问题,对该体系进行细化。其次,本文对诊断性练习系统题库进行了分析和预处理,提出试题关联的算法,并建立试题关联的数据表,将关联的试题储存在数据表中。最后,为了提高试题推荐的针对性,需要根据关联数据表提出一种基于关联度的组卷算法。本文对大学英语四级知识分类体系进行了细化,在一定程度上完善了大学英语四级知识体系。同时,提出相应的试题关联算法,并使用c h 语言和q t 框架实现上述算法。经过实验表明,该算法所建立的试题关联效果良好。此外,本文提出基于试题关联的组卷算法,为诊断性练习系统的组卷方式做了新的尝试。关键词:诊断性练习试题库关联组卷摘要a b s t r a c ta b s t r a c tb yr e a s o no ft h el a c ko fi n t e r a c t i v i t ya n dd i a g n o s t i co ft h ee x i s t i n ge n g l i s he x e r c i s ew e b s i t eo rs y s t e mw h i c hc o u l dl e a dt ot h ei n e f f i c i e n c yo fl e a r n i n g ,i ti se x p e c t e dt ob u i l dan e wo n ew i t ht h ef u n c t i o no fd i a g n o s t i ca n de v a l u a t i o ni na c c o r d a n c ew i t ht h ef r a m e w o r ko ft h ek n o w l e d g ep o i n t si nc e t4 i ti sk n o w nt h a tt h ep a r t i t i o ng r a n u l a r i t yo ft h i sk n o w l e d g es y s t e mp l a y sav e r yi m p o r t a n tr o l ei nd i a g n o s i n gp r e c i s e l yt h es t u d e n t s m a s t e r yo fw e a kk n o w l e d g ep o i n t s i nt h em e a n l i m e ,t h ep a p e rg e n e r a t i n ga l g o r i t h mi nw h i c ht h eq u e s t i o n sa r er e c o m m e n d e di nc o n s i d e r a t i o no ft h ew e a kk n o w l e d g ep o i n t sb yt h es y s t e mi sa d o p t e di nt h ed i a g n o s t i ce x e r c i s es y s t e mo ft h i sp r o g r a mg r o u p h o w e v e r , t h er e l a t i o nw i t ht h ea c t u a le x a m i n a t i o np o i n t si sn e g l e c t e db yu s i n gt h i sa l g o r i t h m t h a ti sw h yt h ep u r p o s eo ft h i st h e s i si sf o c u s e do nt h em o r ed e t a i l e ds u b d i v i s i o na n dp e r f e c t i o no ft h ef r a m e w o r ko ft h ek n o w l e d g ep o i n t so fc e t4i no r d e rt op u tf o r w a r dap a p e rg e n e r a t i n ga l g o r i t h mb a s e do nt h er e l a t i o n a ld e g r e eo fe x a m i n a t i o np o i n t s f o ra c h i e v i n gt h ea b o v ep u r p o s e ,f i r s t l y , t h ef r a m e w o r ko ft h ek n o w l e d g ep o i n t si nc e t4w i t ht h ef u n c t i o no fd i a g n o s t i ca n de v a l u a t i o ni ss u b d i v i d e dd u et ot h ep r o b l e m si np r a c t i c a la p p l i c a t i o n ;s e c o n d l y , t h ep r e p r o c e s s i n ga n da n a l y z i n go ft h ed i a g n o s t i ce x e r c i s es y s t e mi t e mb a n ka r ec a r r i e do u tb e f o r et h ep r o p o s i t i o no ft h ea l g o r i t h mo fc r e a t i n gt h er e l a t i o no fq u e s t i o n sa n db u i l d i n gt h ed a t a s h e e ti nw h i c ht h er e l a t e dq u e s t i o n sa r es t o r e d ;f i n a l l y , t h ep a p e rg e n e r a t i n ga l g o r i t h mb a s e do nt h er e l a t i o n a ld e g r e es h o u l db ep r o p o s e di nr e f e r e n c et ot h ed a t a s h e e tf o ri m p r o v i n gt h ep r e c i s i o no fr e c o m m e n d i n gq u e s t i o n s i nt h et h e s i s ,t h ef r a m e w o r ko ft h ek n o w l e d g ep o i n t si nc e t4h a sb e e np e r f e c t e dt oac e r t a i ne x t e n ta r e rt h es u b d i v i s i o n , m e a n w h i l e ,r e l e v a n ta l g o r i t h mo fc r e a t i n gt h er e l a t i o no fq u e s t i o n si sp u tf o r w a r da n dt h e nr e a l i z e db yc + + l a n g u a g ea n dq tf r a m e w o r k t h ee x p e r i m e n th a sp r o v e dt h a tt h er e l a t i o no fq u e s t i o n sc r e a t e db yt h i sa l g o r i t h mh a sag o o de f f e c t i na d d i t i o n , an e wp a p e rg e n e r a t i n ga l g o r i t h mi sa l s op u tf o r w a r do nt h eb a s i so ft h ed a t a s h e e tc o n c e r n i n gt h er e l a t i o no fq u e s t i o n sa n di tm a k e san e wa t t e m p tt ot h ep a p e rg e n e r a t i n go fd i a g n o s t i ce x e r c i s es y s t e m k e y w o r d s :d i a g n o s t i ce x e r c i s e ,i t e mb a n k ,c o r r e l a t i o n , a u t o g e n e r a t i n ge x a m - p a p e ra b s t r a c ti v目录目录摘要i第1 章绪论11 1问题的提出11 2 相关研究的现状分析21 3 主要研究内容41 4 研究方法和技术路线51 5 论文的逻辑结构5第2 章相关理论与试题库的分析72 1相关学习理论和专业术语概述72 1 1联想学习72 1 2w o r d n e t 语义词典82 1 3l e v e n s h t e i nd i s t a n c e 92 1 4语料库92 2 诊断性练习系统试题库的分析与概述1 02 2 1c e d t s _ p a p e r 1 02 2 2c e d t s _ a s s c s s m e n t i t c m :1 12 2 3c e d t s _ q u e s t i o n 。112 2 4c e d t s _ k n o w l e d g e p o i n t s 1 22 2 5c 印髑- q u e s t i o n k n o w l e d g e 1 22 2 6c e d t s _ i t e m t y p e 1 32 3小结1 3第3 章大学英语四级知识体系的细化1 5v目录3 1知识体系在试题库的应用情况以及分析1 53 1 1知识点编码1 53 1 2试题题库知识点赋值情况1 63 1 3知识点赋值情况分析1 73 1 4知识点选项组卷中知识点练习次数1 83 2知识体系调整部分二级知识点细化1 93 2 1知识体系的不足。1 93 2 2知识体系的细化。1 93 3小结。2 0第4 章试题库关联分析与预处理2 14 1词义理解题的处理2 l4 1 1词义理解处理算法2 14 1 2词义理解试题处理的实现2 44 2固定短语应用试题的处理。2 74 2 1固定短语试题处理的算法思想2 74 2 2固定短语题实现2 84 3动词搭配题和名词搭配题2 94 3 1词语搭配的抽取3 l4 3 2词语搭配关联度模型3 44 3 3试题关联预处理的实现3 54 4 试题关联度实验验证3 84 4 1实验目的和方法:3 84 4 2实验组成员选择及实验数据选择情况:3 84 4 3实验步骤3 94 4 4实验结果和分析4 0第5 章组卷算法研究4 35 1知识点选项组卷模式的组卷算法4 35 2知识点弱项组卷算法的修正算法4 45 3小结:4 5第6 章总结和展望4 7目录6 1主要工作和研究成果4 76 2 后继工作与改进4 76 3前景展望4 8参考文献4 9附录51附录1 试题关联度权重评价标准5 1致谢5 3在读期间发表的学术论文与取得的研究成果5 5v 目录目录表目录表2 1c e d t sp a p e r ( 试卷表) 1 0表2 2c e d t sa s s e s s m e n t i t e m ( 试题表) 1 1表2 3c e d t s _ q u e s t i o n ( 小题表) 1 2表2 4c e d t sk n o w l e d g e p o i n t s ( 知识点存储表) 1 2表2 5c e d t s _ q u e s t i o n k n o w l e d g e ( 试题知识点表) 13表2 6c e d t si t e m t y p e ( 题型描述表) 1 3表3 1 知识点编码表16表3 2 知识点赋值情况1 1 7表3 3 知识点赋值情况2 17表4 1 词义理解关联表2 4表4 2 固定短语试题关联表2 8表4 3 动词搭配类型分类3 0表4 4 名词搭配类型分类3 0表4 5 词语搭配试题关联表3 4表4 6 实验成员的情况表3 8表4 7 实验数据评价3 9表4 8 学生用的评价试题关联表3 9i x目录表4 9 计算机和人工对所有试题赋值的秩4 0表4 1 0 计算机和人工对所有试题关联度赋值的检验数据4 0x目录图目录图1 1 百英英语诊断性词汇学习系统系统流程图3图2 1w o r d n e t 语义网络8图3 1 试题库知识点分布数量图1 8图4 1w o r d n e t 层次树结构2 3目录x 第1 章绪论1 1 问题的提出第1 章绪论进入新世纪以来,随着计算机以及互联网技术的快速发展,信息技术正从各个领域影响着人类的生活。而在英语教育领域,如何提高大学习者英语教学水平成了广大师生普遍关注的问题。目前,学习者对网络的使用越来越熟练,他们越来越多的倾向于选择资源更丰富、查找更快捷的网络资源来学习。同时,传统教育以教师教学为主的模式也逐渐被网络教育以学习者自主学习为主的模式所改变。在这种新的教学模式下,学习者根据自己的实际学习情况,选择适合自己的学习内容,来制定相应的学习计划。由于目前英语四、六级在毕业生求职中仍然具有重要的作用,越来越多的学生对四、六级的考试有着迫切的需求。虽然有许多出版社推出了大量的纸质练习材料,但由于纸质练习材料的固定性、单一性以及不能针对学习者提供诊断功能,使其远远不能满足学习者希望对自己学习情况进行诊断,针对性训练的内容缺乏个性化,不能提供针对性的练习的需求。而由于网络的教学资源丰富,并且不像纸质资料的固定局限性,在线英语四、六级系统是个很好的选择,可以满足一些用户的需要,另一方面互联网在国内的普及程度的提高,英语评价测试系统大量出现,而这些英语评价测试系统没有对学习内容进行知识点分类,仅仅就是将纸质练习照搬到网上练习。基于此本文提出建立大学英语四级诊断性练习系统( 以下简称诊断性练习系统) ,诊断性学习源于布鲁姆的诊断性学习评价【1 1 ,该学习评价重点强调在对学习者进行教学活动之前对学习者的知识进行预测,通过预测可以了解学习的知识基础和准备状况,为实现因材施教提供依据。本文通过对学习内容的知识点的分类,评价学习者掌握英语知识要点的程度,进而针对其薄弱环节给出相应的练习的建议,提高其对此类知识点的掌握水平,学习者在系统中自主地学习,不断的获取系统的反馈信息,了解自己的学习倾向和知识与能力的掌握情况,选择最适合自己的学习安排,及时的调整学习策略,以达到适应自己的学习目标 2 1 。此系统是面向广大英语学习者的在线练习,通过对学习者的在线练习和自测,以诊断学习者所掌握的英语知识点、能力水平,从而针对性地进行后续学习,实现个性化学习,提高学习效率,更好地备考英语四、六级考试。该系统具有丰富的英语学习资源,可以最大化的满足学习者对学第1 章绪论习资源的需求。同时,系统考虑到了每个学习者自身学习能力和认知结构的差异等学习者的个性化特征,为学习者提供相应的个性化学习。这样,学习者就可以找到适合自己学习能力和学习风格的教育内容,系统对学习者在学习过程出现的错误进行诊断,学习者在学习过程中可以得到及时、准确、快速的反馈和评价。基于这些应用广大英语学习者更能有效的利用时间来学习英语,并取得事半功倍的效果,可以快速使学习者的英语水平得到提高。诊断性练习系统能诊断出学习者对大学英语四级考察的各类知识点掌握情况的前提是建构一个包含四级考察的各类知识点的知识体系,为此,本项目组成员在前期做了大量细致的研究,制定了基于诊断性评测的大学英语四级知识体系【3 】( 下文简称为大学英语四级知识体系) ,大学英语四级知识体系包括了大学英语四级考试中客观题所涉及的知识面。根据该分类体系,可以对英语四级考试中的客观题所属的知识点进行明确的分类。然而该体系在实际的应用于诊断性练习系统时也出现了一些问题,主要问题如下:( 1 ) 大学英语四级知识体系中知识点颗粒的大小对学习者薄弱知识点诊断的精度影响很大,现有的分类体系由于前期工作量的原因导致一些知识点颗粒较大,对学习者某些薄弱知识点诊断精确度较低,不利于学习者的个性化学习。( 2 ) 诊断性练习系统的题库中具有大量的题目,这些题目已经按照大学英语四级知识体系进行知识点分类,系统目前所采用的组卷算法忽略了实际知识考察点之间的关系,如考点是否为同义词,近义词,相同的核心词等情况,这种组卷算法推荐题目与学习者薄弱的考察点的匹配度不是很高,不利于实现学习者的个性化学习。为了解决上述两个问题,本文在大学英语四级知识体系基础上对大学英语四级知识体系的某些知识点进行细化,并按照细化后的知识体系对系统题库中的部分知识点试题进行关联预分析处理,在大量试题中有针对性地抽取相关题目进行关联。针对用户的个性化需求,构建出更加符合用户的需求的题目,从而使系统在对学习者薄弱知识点诊断更为精确,系统出题与学习者薄弱知识点的相关性程度越高,更加有利于实现学习者的个性化学习,满足用户个性化的练习需求。1 2 相关研究的现状分析诊断性学习系统的研究正处于热潮之中,美国国家标准与技术协会高技术研究项目在1 9 8 8 年投入数千万的研究资金来资助关于“自适应学习系统”的项目研究,该项目研究的目标就是:基于w e b 的学习系统,最广泛的普及教育和培训,又能精确地的满足学习者的需求。2第1 章绪论目前,国内诊断性学习相关的系统也得到了很大的发展。国内有关机构和公司都在致力于研究诊断性研究。比较有代表性的有全国大学英语四、六级考试委员会的“计算机自适应测验”的研究【4 】、英语诊断性练习系统以及百英英语诊断性词汇学习系统。全国大学英语四、六级考试委员会一直致力于项目反应理论“计算机自适应测验”的研究和开发,该项目致力于建立具有符合中国学习者的大学英语测试体系。英语诊断性练习系统则是针对四六级考试中存在的各个知识点诊断出学习者知识点的不足,并提供针对性的练习方式,提高学习者的学习成绩。百英英语诊断性词汇学习系统就是国内诊断性学习较为成功的英语单词学习软件。系统具有可以为学习者量身定做属于学习者自己的个人单词表和具有强大的诊断与辅导功能的特色。该词汇学习软件首先对新学习者的词汇量水平进行初测,确定学习者初始化水平,并为学习者制定个人单词表。其次针对老用户的英语词汇特点,计算出最适合用户学习的一套英语词汇,并为学习者制定学习计划,并将学习者练习结果反馈给系统。通过对该软件的调研发现,该软件对提高学习者的词汇水平效率要高于普通的英语词汇软件。该系统流程图如下所图1 1 所示。图1 1 百英英语诊断性词汇学习系统系统流程图通过对目前市面上自适应诊断性练习系统和一些普通在线考试系统的对比分析,并通过国内外相关文献的调研,发现自适应诊断性练习系统较普通在线考第1 章绪论试系统的优点如下:1 、诊断性练习系统题型较为丰富,可以支持听力、阅读、语法、理解等大部分题型。2 、诊断性练习系统具有诊断与评价功能模块,可以对学习者知识掌握能力和水平进行诊断。3 、诊断性练习系统对提高学习者的学习水平的效率要高于普通在线学习系统。同时,目前市面上的一些自适应诊断性系统也不完善的地方,具体如下:1 、部分系统缺少相应的知识体系,题目的知识点赋值并没有标准,知识点的赋值完全是按照赋值工作人员的感觉来进行赋值,导致对学习者的薄弱知识点诊断精度不高,推荐的试题没有针对性。2 、部分系统是按照题型组卷,有些四、六级练习系统没有提供自动组卷功能,并基本上仅仅提供是四、六级真题进行测试。3 、系统题库中题目没有根据所考察的知识点没有建立起联系,在系统组卷时没有考虑到题目之间实际考点存在的联系。1 3 主要研究内容本文的研究目的是在已有的大学英语四级知识体系的基础上,根据题库中题目实际的赋值的统计情况,结合英语语言学以及英语教学专家的意见,对某些颗粒较大的二级知识点做进一步的细分,建立更为精确的三级知识点,需要指出的是细化后的大学英语四级知识体系并不是为诊断系统的知识点赋值准备的,细化后的新体系主要是为针对诊断性练习系统题库中的题目如何建立关联表提供一个关联的标准。以细化后的大学英语四级知识体系为指导,对诊断性练习系统中的题库进行研究,针对现有已经赋值的题库的题目进行抽取、分析,按照题目考点关联程度的紧密程度来进行关联,从而使系统在知识点诊断和试题推荐时更加精确。本文的研究内容具体如下:( 1 ) 根据赋值人员对其中大约1 0 0 0 0 题目的赋值统计情况和赋值人员对赋值过程中的反馈情况,通过统计方法发现颗粒较大的二级知识点,结合英语语言学知识和英语教学专家的意见对大学英语四级知识体系中的部分二级知识点做进行进一步的细分,把相应的知识点划分为三级,使得知识点更为细致。( 2 ) 根据细化后的知识体系为指导对部分知识点题进行处理,利用考点单词的词义相似度、词形相似度以及词组搭配相似度,提出了一个建立试题关联的4第1 章绪论算法,并建立试题关联的数据表,数据表的字段分别为小题的标识,相关题目的标识,以及两者之间的关联权重,将有关联的试题储存在数据表中。( 3 ) 通过不断深入的研究发现,除了可以对部分知识点可以进一步细化外,还可以利用采用知识点关联来修正目前诊断性练习系统组卷算法。本文根据已经建立的试题关联表,分别针对系统的两者练习模式基于知识点弱项和基于知识点选项的练习模式提出相应的修正组卷算法和基于考察点的组卷算法,提高了推荐试题与学习者薄弱的知识点的关联度。1 4 研究方法和技术路线本研究主要采用文献调研法、数据分析法、专家访谈法、实践法等研究方法。本文对诊断性练习系统的试题库的知识点赋值情况进行调研,了解大学英语四级知识体系在实际赋值时的实际情况中各个知识点所占的比例,然后为解决这些问题进行理论调研并结合专家的意见对大学英语四级知识体系的部分知识点进行细化,使其对学习者的知识点诊断更为精确。同时,根据细化后的知识体系对诊断性练 - - - j 系统题库进行分析处理,提出相应的题目关联算法,并采用c + + 和q t来实现相应的算法,使系统出题的题目与学习者的知识点缺陷更为契合。1 5 论文的逻辑结构本论文共分为五章,分别为绪论、相关理论与试题库的分析、大学英语四级知识体系的细化、试题库的关联分析与预处理、组卷算法研究、总结与展望。各章的内容简述如下:一、绪论:主要介绍本研究的背景以及相关的研究现状、主要的研究方法与技术路线以及研究的实际意义。二、相关理论与试题库的分析:主要介绍本研究所涉及的相关理论和诊断性练习系统题库组织结构。三、大学英语四级知识体系的细化:本章首先分析大学四级知识体系在诊断性练习中的实际应用情况,然后通过详细的数据分析得到大学英语四级知识体系的不足,结合英语语言学知识以及综合专家意见对知识体系的进行细分。四、试题库的关联分析与预处理:分别介绍了词义理解、固定短语、动词搭配和名词搭配题建立关联的方法以及其实现,并且根据其得到的数据对其所建立关联的关联度信度进行验证,统计实验数据,分析出实验结果。五、组卷算法研究:根据建立的关联数据表,对现有的组卷算法进行改进,第1 章绪论提出相应的修正组卷算法,同时针对知识点选项练习方式提出基于考察点组卷的算法。六、总结和展望:对本文的研究成果进行总结,并指出研究中尚存在的几个问题,以便在以后的研究中进一步的完善。第2 章相关理论与试题库的分析第2 章相关理论与试题库的分析本文主要研究的是大学英语四级知识体系的细化、试题库关联预处理以及基于试题关联的组卷算法的研究。知识点细化研究中涉及了联想学习理论等相关学习理论,而且对试题库部分知识点试题进行关联预处理中使用了w o r d n e t 语义网络、语料库以及试题库的相关知识,为此本章做个简要的概述。2 1 相关学习理论和专业术语概述2 1 1 联想学习构建关联试题表的理论基础就联想学习,试题推荐时要推荐一些和学习者薄弱知识点有关联的试题,由一道试题关联到另一道试题,所以了解联想学习内涵是构建关联试题库的必要过程。联想是由感知或思考的事物想起有关的另一事物。心理学认为,联想反映了客观事物之间的联系,对促进人的记忆具有重要的作用,它成为学习的一种方法,经常地形成联想和运用联想,可以增强学习效率。联想学习【5 卅是指由两种或两种以上刺激所引起的脑内两个以上的中枢兴奋之间,形成的联结而实现的学习过程。环境条件中那些变化着的因素在时间和空间上的接近性,造成脑内两个或多个中枢兴奋性的同时变化。联想式学习包含着外部动因问的联结、刺激反应联结和脑内中枢间的联结。例如,当学习者学习学习单词时,获得大量的诸如“m e n d ”或者“r e p a i r ”之类的转化反应,这就是配对联想,这种学习方式能够有效的提高学习效率。普雷斯利、勒文和德莱尼( p r e s s l e y ,m ,l e v i n ,j r & d e l a n e y , h d ,1 9 8 2 ) 在回顾了外语词汇学习时归纳出以下最佳方法中的一些步骤:首先,学习者必须获得一种外语生词与熟悉的英语单词之间的稳定联系。其次,学习者将外语单词的意义与关键词进行关联。由此可见,当学习者使用诊断性练习系统时采用知识点强化训练时,对于词义理解知识点和固定短语知识点题型时,采用联想学习的方式,按照词义理解中考察词的同义词、近义词、易混淆词和固定短语的核心词是否相同的关系将关系程度较大的题目组成一个关联的数据表。由于联想学习对促进人的记忆,可以增强学习效率具有重要作用,对试题库第2 章相关理论与试题库的分析中的试题进行关联预处理有利于帮助学习者运用联想学习,提高学习者的学习效率。2 1 2w o r d n e t 语义词典w o r d n e t t t l 是一种传统的词典信息结合心理语言学以及现代计算机技术的研究产物,由普林斯顿大学的心理学家、语言学家以及计算机科学家在1 9 8 5 年开始设计的基于认知的英语词典,它并不是仅仅像传统字典一样按照字母的顺序来组织词语的信息而且按照单词的语义组成一个“单词的网络”,如图所示。w m 一一w 携s i m i l a t s y舳t o n y m y图2 1w o r d n e t 语义网络w o r d n e t 是一个大的英语词汇数据库,它将词汇分为五个大类动词、名词、形容词、副词和虚词,但事实上w o r d n e t 仅包含动词、名词、形容词和副词,虚词常作为语言句法成分的一部分。w o r d n e t 按照单词的意义组成一个“单词的网络”,采用语义网络作为词汇本体的基本表示形式。利用w o r d n e t 查询不同概念和同义词集合的之间的语义关系【8 _ 9 1 ,在w o r d n e t 中语义关系可以分同义( s y n o n y m y ) 反义关系( a n t o n y m y ) 、上下位关系( h y p e r m y m y & h y p o n y m y ) 、部分,整体关系( m e m n y m y ) 、继承关系( h y p o n y m y ) 、蕴含关系( e n t a i l m e n t ) 等关系。在本文的研究中,涉及到的主要为同义( s y n o n y m y ) 、反义关系( a n t o n y m )和上下位关系( h y p e r m y m y & h y p o n y m y ) ,同义关系是w o r d n e t 所定义的基本关系,每个同义词集合中的单词都可以看成同义关系。反义关系也是一种常用的关系,但是它相对来说是比较难定义的,一般情况反义关系是以形容词和副词为中心组织的。其主要结构如下图所示,本文所采用的w o r d n e t 版本为w o r d n e t 2 1 ,它是2 0 0 5 年3 月基于w i n d o w s 平台的发布版本。w o r d n e t 2 1 有1 1 7 5 9 7 个同义第2 章相关理论与试题库的分析词集合,2 0 7 0 1 6 个词形词义对,1 5 5 3 3 2 7 个独立词形,其庞大的数据量已经基本涵盖了常用的英语词汇。2 1 3l e v e n s h t e i nd i s t a n c el e v e n s h t e i nd i s t a n c e s 是最常用的编辑距离算法,由俄国科学家v l a d i m i rl e v e n s h t e i n 在1 9 6 5 年提出【l0 1 ,指的是两个字符串之间有一个转化为另外一个字符串所需的最小编辑操作次数,这里的合法编辑操作包括替换一个字符、插入一个字符、删除一个字符。例如例如将k i t t e n 一字转成s i t t i n g 的l e v e n s h t e i nd i s t a n c e为三,其操作步骤如下:s i r e n ( k - - - s ) ( 将k 替换为s )s i t t i n ( e _ i ) ( 将e 替换为i )s i t t i n g ( 一g ) ( 在单词末尾插入g )计算两字符串的l e v e n s h t e i nd i s t a n c e 的有效算法为动态规划算法【l l 】,该算法是r o b e r ta w a g n e ra n dm i c h a e lj f i s c h e r 在19 7 4 年提出。动态规划算法是应用表驱动的方法,结合各个子问题的求解来求解整个问题。使用动态规划算法来计算l e v e n s h t e i nd i s t a n c e 时,需建立一个矩阵,两个字符串的每个字符分别放在矩阵的行和列上。每个l e v e n s h t e i nd i s t a n c e 单元【i ,j 】表示目标字符串前i 个字符和源字符串前j 个字符之间的l e v e m h t e i nd i s t a n c e 。l e v e n s h t e i nd i s t a n c e 可以用来表示两个字符串的相似程度,l e v e n s h t e i nd i s t a n c e 越小,说明两个字符串相似度越高,在本文中l e v e n s h t e i nd i s t a n c e s 被用来计算两个单词的词形相似度,即易混淆的程度,l e v e n s h t e i nd i s t a n c e s 越小,两个单词之间越容易混淆。2 1 4 语料库语料库是经过整理,具有标记和既定格式的大文本。语料库通常被用来在这个特定的体系中进行统计分析和假设检验,以及检测一致性或验证语言规则【1 2 】。现代的语料库一般具有如下三个特征 1 3 】:1 ) 收入语料库的语言材料应当是实际使用的真实文本,并且其所收录的语言材料应该具有代表性,可以满足其应用的目标。2 ) 语料库应是机器可读的,是运用计算机技术获取、编码、存储和组织的,并支持基于计算机技术的分析和处理。3 ) 收入语料库的语言材料经过适当的标注和加工处理,例如经过词类标注第2 章相关理论与试题库的分析或者词语切分处理。本文通过对语料库的进行概率和统计研究,提取出每个考察词可能会出现的词语搭配,在结合试题的题干抽取试题考察的词语搭配,进而建立词语搭配题目之间的关联关系。2 2 诊断性练习系统试题库的分析与概述本研究对试题库进行试题关联预处理,其中涉及诊断性练习系统中试题库的相关内容,现在对诊断性练习系统试题库做相应的介绍。诊断性练习系统使用关系数据库来进行数据存储,根据数据库设计范式来进行规范设计。在设计数据库时按照规范化流程,以更好的设计数据库的表结构,减少冗余的数据,借此可以提高数据库的数据完整性和扩展性以及存储效率【1 4 1 。诊断性练习系统的表主要大致可以分为试题库信息表、系统用户信息表等表。其中试题库信息表包括c e d t s _ p a p e r、c e d t s a s s e s s m e n t l t e m、c e d t s _ q u e s t i o n、c e d t s _ k n o w l e d g e p o i n t s 、c e d t s _ q u e s t i o n k n o w l e d g e 、c e d t s i t e m t y p e 等,各表的详细情况如下。2 2 - 1c e d t s p a p e rc e d t s _ p a p e r 表主要描述题库的试卷的情况,包括p a p e r l d 、t i t l e 、t y p e 、p a p e r c o n t e n t 、d u r a t i o n ,d i f f c u l t ,s c o r e ,d e s c r i p t i o n 、c r e a t et i m e ,u s e r l d 、u p d a t e t i m e 、s t a t e 等字段。具体描述如表2 1 所示:表2 一c e d t s p a p e r ( 试卷表)p a p e r i d试卷的标识是t i t l e试卷的名称否t y p e此试卷所属类型否p a p e r c o n t e n t试卷内容否d u r a t i o n作答试卷否d i f f c u l t试卷难度否s c o r e分数否d e s c r i p t i o n试卷描述否第2 章相关理论与试题库的分析c r e a t et i m e创建试卷否u s e r i d用户标记否u p d a t e t i m e试卷更新试卷否s t a t e状态否2 2 2c e d t sa s s e s s m e n t l t e mc e d t sa s s e s s m e n f l t e m 表主要描述题库试题的情况,包括a s s e s s m e n t i t e m i d ,i t e m t y p e i d ,d e s c r i p t i o n ,d u r a t i o n ,s a v e t i m e ,d i f f c u l t 、s c o r e ,c o u n t ,c o n t e n t ,q u o s t i o n c o u n t ,u p d a t e t i m e ,c o u r s e ,u n i t ,i n t e r v a l ,s o u n d f i l e 等字段。如表2 2 所示:表2 2c e d t s a s s e s s m e n t l t e m ( 试题表)a s s e s s m e n t i t e m l d试题的标识是i t e m t y p e i d试题所属类型的标识否d e s c r i p t i o n此题的具体描述否d u r a t i o n建议作答时间否s a v e t i m e试题保存时间否d i f f c u l t试题难度否s c o r e分数否c o n t e n t ,试题的内容否q u e s t i o n c o u n t ,试题中小题的数量否u p d a t e t i m e上次更新时间否c o u r s e所属课本否u i l i t所属单元否i n t e r v a l时间间隔否s o u n d f i l e音频来源否第2 章相关理论与试题库的分析表2 3c e d t sq u e s t i o n ( 小题表)一一一豳黼暖目积龋圜臻掰罄曩曩麓强墨鞠圜融嚣臻q u e s t i o n l d小题的标识是a s s e s s m e n t i t e m x d所属大题的标识日疋s c o r e分数不口d i f f i c u l t试题难度系数否d u r a t i o n作答时间否q u e s s t i o n c o n t e n t问题内容7 r口c h o o s e a选项a否c h o o s e b选项b否c h o o s e c选项c否c h o o s e d选项d否a n s w e r答案不口a n a l y z e分析否o r d e r在大题中所在的顺序否s o u n d音频来源否i n t e r v a l音频长度否2 2 。4c e d t s _ k n o w l e d g e p o i n t sc e d t s _ k n o w l e d g e p o i n t s 主要描述的为知识体系中的各个知识点,包括:k n o w l e d g e p o i n t s l d 、t i t l e 、d e s c r i b e 、u p e r k n o w l e d g e l d 、l e v e l 等字段。具体如表2 4 所示:表2 4c e d t s _ k n o w l e d g e p o i n t s ( 知识点存储表)k n o w l e d g e p o i n t s l d知识点标记是t i t i e知识点名称否d e s c r i b e知识点的定义与内涵否u p e r k n o w l e d g e l d上一级知识点标记否l e v e l属于第几级知识点否2 2 5c e d t s _ q u e s t i o n k n o w l e d g ec e d t s _ h e s t i o n k n o w l e d g e 描述的是各个小题的属于那些知识点,该表主要包括q u e s t i o n k n o w l e d g e i d 、q u e s t i o n l d 、k n o w l e d g e p o n i n t i d 、w e i g h t 等字段。具体描述如表2 5 所示:1 2第2 章相关理论与试题库的分析麓豳q u e s f i o n _ k n o w l e d g e i d标识是q u e s t i o n l d小题的标识是k n o w l e d g e p o n i n t l d知识点的标识是w e i g h t权重否2 2 6c e d t s _ i t e m t y p ec e d t si t e m t y p e 描述的为各个答题的具体题型,包括:i t e m t y p e i d 、t y p e n a m e 、t y p e n a m e _ c n 、d e s c r i b e 、p a r t t y p e l d 等字段,如下表2 6 所示:i t e m t y p e l d题型标识是t y p e n a m e题型的英语名称否t y p e n a m e _ c n题型的中文名称否d e s c r i b e描述否p a r t t y p e i d属于试卷的哪个部分否第2 章相关理论与试题库的分析1 4第3 章大学英语四级知识体系的细化第3 章大学英语四级知识体系的细化本章详细论述大学英语四级分类体系初步细化的过程,首先,根据题库中大约8 0 0 0 道题目中各个知识点在所赋值题目的统计情况和系统中知识点选项练习模式各个知识点被选为目标知识点的次数,确定知识体系颗粒较大知识点以及确定学习者最重要和最薄弱的知识点。其次,在此基础上通过对相关知识分类的理论的研究,结合英语语言学知识对大学英语四级分类体系中颗粒较大的知识点做出细化。根据细化后的英语知识体系为标准对试题库中的试题建立关联,以提高诊断性练习系统的诊断精度和系统推荐试题的针对性。3 1 知识体系在试题库的应用情况

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论