




已阅读5页,还剩64页未读, 继续免费阅读
(计算机软件与理论专业论文)基于本体的协同学习关键技术研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于本体的协同学习关键技术研究与实现摘要计算机支持的协同学习是指多个学习者通过网络协同完成某项学习任务。随着互联网的日益普及,协同学习逐渐成为人们的主要学习方式之一。协同学习包含协同编著和协同查阅。本文针对协同编著中的语义冲突问题和协同查阅的相关技术进行了比较深入的研究,所做的主要工作如下:1 采用w o r d n e t 作为本体数据源,根据其特点对o i l 语言进行了修改和扩展,设计了一种新的本体描述语言一s q 0 0 i l ( s e m a n t i cq u e r yo r i e n t e d0 i l ) ,并且使用s q 0 0 i l 描述了w o r d n e t 中的本体数据从而构建了本体库,较好的满足了协同编著和协同查阅对本体的应用需求。2 在协同编著中引入本体,对传统协同编著进行重新构建提出一种混合式p e e r - p e e r 结构的语义协同编著。在语义协同编著中设计了语义一致性算法并以此来解决确定性单词级语义一致性问题和维护用户行文意愿问题。实验证明语义协同编著不仅客户端占用空间小,而且客户端的个性库使大部分编著操作在本地执行,有效地减少了网络通信量,提高了协同编著的性能。3 在语义协同编著中设计了基于文档类型的词频累加算法并以此来解决非确定性单词级语义一致性问题。实验证明,基于文档类型的词频累加算法与其它算法相比不仅可以适用于所有词性的英文单词,而且识别正确率较高( 7 2 ) ,并且具有系统开销小等优点。4 对协同查阅的两种技术进行了比较深入的研究,提出了基于本体的关键字查询和基于知识点的协同学习。通过这两种协同查阅技术,不同知识领域的学习者可以进行跨领域的知识共享和学习交流,从而提高了协同学习的效率。关键词:本体,协同学习,协同编著,协同查阅,语义冲突,w o r d n e t基于本体的协同学习关键技术研究与实现a b s t r a c tc o l l a b o r a t i v el e a r n i n gi st h a tp e o p l ec o m p l e t eas t u d ym i s s i o nb yn e t w o r k w i 血t h ed e v e l o p m e n to fi n t e m e t ,c o l l a b o r a t i v el e a r n i n gh a sb e c o m em o r ea n dm o r ei m p o r t a n tt op e o p l e c o l l a b o r a t i v el e a r n i n gi n c l u d e sc o l l a b o r a t i v ee d i t i n ga n dc o i l a b o r a t i v ec o n s u l t i nt h i sp a p e rw er e s e a r c ht h es e m a n t i cc o n f l i c t si nc o l l a b o r a t i v ee d i t i n ga n ds o m et e c h n o l o g i e si nc o l l a b o r a t i v ec o n s u l t o u rm a i na c h i e v e m e n ti sa sf o l l o w :1 w eu s ew o r d n e ta so n t o l o g yd a t a b a s ea n de x t e n do i lt ow o r ko u tan e wo n t o l o g yd e s c r i p t i o nl a n g u a g e - s q o o i l ( s e m a n t i cq u e r yo r i e n t e do i l )w h i c hw eu s et od e s c r i b et h eo n t o l o g yi nw o r d n e t b yt h i sm e a n sw ec o n s t r u c ta no n t o l o g yd a t a b a s ea n dm e e tt h en e e do fc o l l a b o r a t i v ee d i t i n ga n dc o l l a b o r a t i v ec o n s u l t 2 w eu s eo n t o l o g yi nc o l l a b o r a t i v ee d i t i n ga n dr e c o n s t r u c tt h et r a d i t i o n a lc o l l a b o r a t i v ee d i t i n gt ob r i n go u tan e ws e m a n t i cc o l l a b o r a t i v ee d i t i n gw h o s ea r c h i t e c t u r ei sc o m p o s i t ep e e r - p e e r t h e nw ew o r ko u tt h es e m a n t i cc o n s i s t e n c ea r i t h m e t i ct os o l v et h ed e c i d e dw o r d ss e m a n t i cc o n s i s t e n c ep r o b l e ma n dt h em a i n t e m a n c eo fu s e r s e d i t i n gd e s i r ep r o b l e m e x p e r i m e n t sp r o v et h a ts e m a n t i cc o l l a b o r a t i v ee d i t i n gn o to n l yh a ss m a l lc l i e n t sb u ta l s or e d u c e st h en e t w o r kc o m m u n i c a t i o nl o a dt oi m p r o v et h ep e r f o r m a n c eo fc o l l a b o r a t i v ee d i t i n g 3 w eb r i n go u tt h ew o r df r e q u e n c ys a mb a s e do nd o c u m e n t s t y p ea r i t h m e t i ct os o l v et h eu n d e c i d e dw o r d ss e m a n t i cc o n s i s t e n c ep r o b l e m e x p e r i m e n t sp r o v et h a tc o m p a r e dw i t ho t h e ra r i t h m e t i c st h i sa r i t h m e t i ci sn o to n l yu s e f u lt oa l le n g l i s hw o r d sb u ta l s oh a sc o m p a r a t i v e l yh i g hi d e n t i f i c a t i o nc o r r e c t n e s s m o r e o v e rt h i sa r i t h m e t i cc a ni m p r o v et h es y s t e m se f f i c i e n c y 4 w er e s e a r c ht h et e c h n o l o g yi nc o l l a b o r a t i v ec o n s u l ta n db r i n go u tt h ek e y w o r dq u e r yb a s e d0 1 1o n t o l o g ya n dc o l l a b o r a t i v el e a r n i n gb a s e do nk n o w l e d g e b yt h e s et w ot e c h n o l o g i e sp e o p l ei nd i f f e r e n ta r e a sc a ns h a r ek n o w l e d g ea n de x p e r i e n c e se f f i c i e n t l yw h i c hi m p r o v e st h ee f f i c i e n c yo fc o l l a b o r a t i v el e a r n i n g 4基于本体的协同学习关键技术研究与实现k e y w o r d s :o n t o l o g y , c o l l a b o r a t i v el e a r n i n g ,c o l l a b o r a t i v ee d i t n g ,c o l l a b o r a t i v ec o n s u l t ,s e m a n t i cc o n f l i c t ,w o r d n e t5基于本体的协同学习关键技术研究与实现第一节背景介绍第一章绪论随着计算机网络的发展,计算机支持的协同学习将成为未来教育的发展方向。近年来,人们对于协同学习的研究也日益重视。如何改善协同学习的效率和性能,一直是协同学习研究的难点。这取决于一些协同学习关键技术的研究进展,如协同编著、协同查阅等。本体由于其良好的领域知识描述能力,同样引起了学术界的重视。然而,研究人员却很少将本体应用于与领域知识密切相关的协同学习的研究中。实际上,借助本体在领域知识描述方面的能力可以加深对协同学习中一些关键技术的研究。本文致力于研究本体描述语言和协同学习的若干关键技术,如协同编著、协同查阅等。本章简略地介绍协同学习的研究背景、本文的工作和结构安排。1 、协同学习由于各种历史的、社会的、经济的以及体制等方面的原因,教育资源的分布不均及受限访问是一种客观存在的社会现象。如何将优秀的教育资源共享,供更多的人按更为方便的方式进行访问,是信息时代知识经济条件下人们知识结构不断更新与充实、知识面不断扩展的客观需要。鉴于这一客观需要,远程教育出现了。远程教育借助于各种类型的信息网络,实现远程交互式授课、交互式讨论、交互式辅导等,一方面使得人们可以不受地域与时间的限制使用那些优秀的教学资源:另一方面使得这些资源能够创造更好的社会与经济效益。这种以网络技术为依托的远程教育,尤其是基于i n t e m e t 的远程教育将成为未来教育的发展方向。计算机网络的发展和应用,给我们提出了计算机支持的协同工作( ( c o m p u t e rs u p p o r t e dc o o p e r a t i v ew o r k ,简写为c s c w ) i 、 题。所谓的计算机支持的协同工作指的是,一个群体中的多个成员,同时使用分布式网络系统上的多台计算机协同工作,共同完成某项任务。由于这一思想体现了信息时代人们工作方式的群体性、交互性、分布性和协同性的客观要求,充分发挥了计算机网络作为通信媒体的潜在能力和优越性,因而正受到目益广泛的重视。将计算机支持的协同工作应用到教学领域,称之为计算机支持的扔同学习( c o m p u t e rs u p p o r t e dc o o p e r a t i v el e a r n i n g ,简写为c s c l ) 06基于本体的协同学习关键技术研究与实现计算机支持协同学习的思想逐渐被引入计算机网络远程教育的应用中,它打破了“背靠背”网络教学模式引发的交流障碍,在充分继承和发扬网络教学优势的基础上,更加强调老师和学生之间、学生和学生之间各种教学信息的实时交互性和学习的协同性,从而将传统课堂教学与网络教学的优势充分地结合起来。协同学习是将来人们工作和学习的一种重要的方式和手段。随着协同学习的重要性日益凸现,对于协同学习的研究也逐渐深入和广泛起来。在现有计算机支持的协同学习( c s c l ) 中,大部分是异步协作系统。这主要有两方面原因:一是计算机支持的异步协作方式和我们日常的异步工作模式比较接近,例如,电子邮件和普通邮政信件在运作方式上没有本质的区别。二是目前的i n t e m e t 从性能上还不足以满足同步协作的要求,数据传输延时较大,对于多媒体数据来说,带宽也很低。虽然目前同步协作系统的应用较少,但是,在协同学习中,对计算机支持的同步协作的需求越来越大,这类系统必将是今后的重点发展方向。i n t e m e t 技术的发展,网络的速度和可靠性不断提高,也将为同步协作创造良好的发展条件。另外,同步协作的发展将赋予异步协作新的内涵,即同步协作的过程可以被“录制”以便异步地“回放”。在远程教育的领域中,异步协同学习,尤其是以w e b 为基础的课件异步学习已经有了很大发展,但同时应用也对同步协同学习提出了越来越高的需求。随着协同学习中对于同步协作的需求越来越高、越来越广泛。对于同步协同学习的研究也进入到了一个新的层次。如无特别说明,本文所提到的协同学习即指同步协同学习。2 、协同编著学习主要有“写”、“读”两方面,协同学习也是如此。在协同学习中,“写”的方面即指协同编著。研究表明,从事脑力劳动的人们平均花费4 4 的时间从事某种形式的写作,而在这些写作活动中,有8 7 是一个成员和他人合作,即进行协作。由此可见,协同编著对于协同学习来说是非常重要的。协同编著是指多个用户在网络环境中协同处理共享文档【l 】。英文文献中,c o l l a b o r a t i v ee d i t i n g 、c o o p e r a t i v ea u t h o r i n g 、c o l l a b o r a t i v ea u t h o r i n g 、c o l l a b o r a t i v ew r i t i n g 、g r o u pe d i t o r等都是指协同编著这个概念。根据e d e 和l u n s f o r d 2 的研究指出,在协同编著中存在如下7 种组织模式:1 1 整个小组一起规划编著任务,然后每个作者负责文档某个部分的编著,最后将各个部分汇集起来,根据需要修改整个文档。2 1 整个小组一起规划编著任务,然后某个成员准备一个草稿,最后由小组一起修改这个草稿。基于本体的协同学习关键技术研究与实现3 ) 组内菜个成员规化编著任务并撰写一个草稿,然后由小组一起修改草稿。4 ) 某个作者提交一个草稿,然后一个或多个其他成员不与作者交互修改这个草稿。5 ) 整个小组规划编著任务并撰写一个草稿,然后一个或多个成员不与原作者交互修改这个草稿。6 ) 一人规划和分配编著任务,每个成员完成各自部分,然后由某个成员编辑并修改文档。7 ) 某人口述,另一个人记录,然后编著成文档。随着计算机网络技术的发展,i n t e m e t - i n t r a n e f f e x t r a n e t 的迅速普及,在2 1 世纪,计算机网络将成为应用系统的通用平台。在这种情况下,人们将会通过计算机网络进行协作编著,即协同编著。因此,如何使计算机网络更好的支持分布在不同地点的人们协同编著? 对这一问题的研究己成为必要。如无特殊说明,本文所指的协同编著即指计算机支持的协同编著。计算机支持的协同编著c s c e ( c o m p m e rs u p p o r t e dc o o p e r a t i v ee d i t i n g ) 是c s c w 一个重要的研究方向。自2 0 世纪8 0 年代中期提出计算机支持协同工作这一概念以来,c s c e 就受到研究和开发人员的重视,各种支持协同编著的群件产品也被开发出来,具有代表性的原型系统有g r o u p s k e t c h ( g r e e n b e r ga n db o h n e t 1 9 9 1 ) 、g r o v e ( e l l i s ,g i b b s ,a n dr e i n ,1 9 9 1 ) 、s h r e d i t ( m c g u f f ma n do l s o n ,1 9 9 2 ) 、d i s t e d i t ( k n i s t e r a n d p r a k a s h ,1 9 9 0 ) 、c a s c a d e ( b o r l i n ,1 9 9 7 ) 等等 3 】。3 、协同查阅在协同学习中,“读”的方面即指协同查阅。在协同学习中通过查阅资料来进行学习也是一种十分重要的学习手段。协同查阅的技术和方式有很多,本文主要研究如下两种协同查阅技术:1 1 关键字查询。随着h t e m e t 的迅速普及,知识共享变得越来越普遍。人们面对通过计算机网络收集来的巨量信息,需要在其中高效的找到对自己学习有用的资料( 论文、技术文档等) 。如果依靠个人逐篇去阅读来得到自己需要的学习资料,那是不现实的。因此,如何通过关键字查询得到自己需要的学习资料这个问题变得非常重要了。对于关键字查询,主要有两点要求:快速和全面。快速,即指通过较短的查询等待时间就可以获得自己需要的学习资料。随着计算机硬件的发展和现代计算机搜索技术的迅速发展,这一点已经得到较为满意的解决;全面,即指通过输入查询关键字人们可以得到与自己学习目标相关的全面的查询结果。如人们输入“计算机”这个查询关键字,他们不仅需要得到与“计算机”相关的学习瓷料,基于本体的协同学习关键技术研究与实现还希望得到与“电脑”、“p c ”、“c o m p u t e r ”相关的学习资料,如何满足这一需求目前正在研究中,本文使用本体来研究这一技术。2 1 基于知识点的协同查阅人们在阅读学习资料时,经常需要查阅与该学习资料相关的文档,如在阅读论文时经常需要查阅参考文献。如何查找到与该学习资料相关的文档也是协同学习中值得研究的问题。如果可以提供给学习者比较全面,相关度比较高的参考文献,那么对于学习者的学习效率是一个极大的提升。本文借助本体来研究这一问题。以上两种协同查阅技术是目前使用比较多的协同查阅技术,他们的性能改善可以较好的改进协同学习的效率。关于协同查阅,本文主要研究这两种查阅技术。第二节本文的工作本文的工作主要集中在三个方面:1 对现有的本体描述方法,进行深入探讨,结合协同学习的特点提出一种本体描述语言- s q o o i l 。对w o r d n e t 进行了深入的研究,使用本体描述语言s q o o w l 对w o r d n e t 中的本体信息进行重新描述,为协同编著、协同查询中本体的使用做好准备。2 深入研究了传统的协同编著,在协同编著中引入用s q 0 0 w l 所描述的全局本体库和个性库,对传统的协同编著体系结构进行重新构建,提出一种混合式p e e r p e e r 结构的语义协同编著,并且对于经常带来语义冲突的插入操作给出了新的算法,高效地解决了对学习文档进行协同编著时存在的语义一致性问题;通过在个性库中加入用户的个性化语义信息,为用户提供了个性化服务,从而成功的维护了用户的行文意愿。最后用实验证明了这种新结构的语义协同编著的性能优良。3 结合本体研究,使用s 0 0 0 w l 语言对与协同学习相关的领域知识进行描述,对协同查阅的两种技术( 关键字查询、基于知识点的协同查阅) 进行了深入的研究:为学习者提供了全面而高效的关键字查询服务;实现了基于知识点的协同查阅,通过这种学习方式各个知识领域的学习者可以进行知识共享和知识交流从而达到协同学习的目的,这很大程度上提高了学习者的学习效率。最后,将以上两种技术在基于本体的论文管理系统( p i s b o o ) 中加以实现,并且简单介绍了p m s b 0 0 系统。9基于本体的协同学习关键技术研究与实现第三节本文的结构本文共分为六个章节。第一章,即本章,介绍了问题提出的背景知识和本文的研究工作内容,最后介绍了本文的章节安排。第二章介绍了与本文相关的一些领域的研究现状。其中第一节介绍了本体的研究现状;第二节介绍了协同学习的研究现状,包括协同编著、协同查阅等。第三章对本体的基本理论进行了详尽的介绍和分析,是本文的理论根基。第四章结合本体研究了协同编著中的语义冲突问题,给出了解决方案,最后用实验和分析证明了该解决方案的效率。第五章结合本体研究了协同查阅中的两种重要技术:关键字查询、基于本体的协同查阅,最后简单介绍了基于本体的论文管理系统。第六章对本文做了总结,并介绍了下一步的工作展望。l o基于本体的协同学习关键技术研究与实现第二章研究现状第一节本体研究的现状随着哲学中的本体概念被引入了计算机领域,其在哲学思想的基础上就被赋予了新的涵义。计算机领域中,最早引入本体的是人工智能,它使用本体描述知识的内容。在人工智能界,最早给出本体定义的是e c h e s 等人,他们将本体定义为“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义” 4 。1 9 9 3 年,g r u b e r 给出了本体的一个最为流行的定义:本体是一个概念体系某些方面的显示说明或表示 6 。本体是采用某种语言l 对概念体系的描述,因此本体依赖于所采用的语言l ,即本体描述语言。按照表示和描述的形式化程度不同,本体描述语言可以分为:非形式化、半非形式化、半形式化、形式化语言 8 。形式化程度越高,越有利于计算机进行自动处理。k i f ( k n o w l e d g ei n t e r c h a n g ef o r m a t ) 1 0 本体描述语言的出现为不同的计算机系统( 这里的不同是指由不同的程序员在不同的时间使用不同的语言开发等) 之间交换知识提供了标准。随着o n t o l i n g u a 1 1 、c y c l 1 2 、l o o m 1 3 的出现,我们描述本体的能力有了实质性的突破,这些本体描述语言是与具体系统相关,基本只在具体项目中使用,但这些本体描述语言阅读起来比较困难,并且与w 3 c 的标准不匹配,不适合应用到w w w 上。而随着w w w 的普及,怎样把本体应用到w e b 上,以便更好地利用w e b 这个媒介传播知识 1 5 、1 6 ,成为需要认真考虑的问题 1 7 。为了适应w w w 这种新载体,出现了r d f 和r d f s 2 0 、o i l 2 1 、d a m l 2 2 、s h o e 2 6 、x o l 2 3 等本体描述语言。其中,o i l ( o n t o l o g yi n f e r e n c el a y e r ) n t o l o g yi n t e r c h a n g el a n g u a g e )是种针对本体的基于互联网的表现和推理层,o i l 综合了基于框架的系统、描述逻辑、互联网标准这三方面的内容,提供了一种通用的语义互联网的标记语言。o i l 的使用比较广泛,支持o i l 的工具也很多,最著名的有o i l e d 1 8 ,是一个基于o i l 的本体编辑器。其它一些工具,比如o n t o e d i t 、t h ef a c ts y s t e m 1 9 等也都支持o i l 。然而,o i l 并不适合协同学习的环境,因为这些语言也和o n t o l i n g u a 、c y c l 、l o o m 一样,只适合于机读,而不利于用户理解和阅读。协同学习直接面对学习基于本体的协同学习关键技术研究与实现者,学习者协同学习时,需要对概念体系中的领域知识有良好的、一致的理解,需要系统提供友好的界面浏览、使用本体。只有本体的描述更为简单、精确,本体才容易使用与维护,才能满足协同编著的要求。因此,开发一种适合于这种要求的本体描述语言是我们研究协同学习关键技术之前必须解决的问题。第二节协同学习研究的现状1 、协同学习简介近年来随着计算机支持的协同工作技术的发展,在其支持下出现了计算机支持的协同学习c s c l ( c o m p u t e rs u p p o r t e dc o o p e r a t i v el e a r n i n g ) ,又称为教育群件系统( e d u c a t i o n a lg r o u p w a r es y s t e m ) 。本文中所指的协同学习就是计算机支持的协同学习。在协同学习中,在计算机技术尤其是计算机网络技术支持下学习者可以突破地域和时间上的限制,进行相互交流、信息共享和协同性学习。协同学习可以说是c s c w 在教育中的具体应用。一般来说,协同学习以计算机网络为平台,为学习者提供同步或异步的多媒体信息服务和共享学校空间。根据学习的方式,协同学习包含协同编著和协同查阅二方面:协同编著是协同学习中“写”的方面,主要研究学习参与者之间进行协同写作的问题;协同查阅是协同学习中“读”的方面,主要研究学习参与者之间进行协同查阅的问题,关于协同查阅,本文主要研究其中两种技术:关键字查询、基于知识点的协同查阅。2 、协同编著的研究现状计算机支持的协同编著( c o m p u t e rs u p p o r t e dc o o p e r a t i v ee d i t i n g ) 是指多个用户在网络环境中协同处理共享文档,它是c s c w 一个重要的研究方向。计算机支持的协同编著分为两种:同步协同编著和异步协同编著。鉴于同步环境下的协同编著更加难于实现,如无特别说明,本文中的协同编著就是指同步环境下的计算机支持的协同编著。协同编著按照体系结构可以分为如下三种类型:1 ) 集中式体系结构这种系统采用c s 结构( 图2 一l ( a ) ) 。系统中有台服务器,其重要功能是管理协同编著的共享文档和编著参与者。每个编著参与者在开始编著时作为客户1 2基于本体的协同学习关键技术研究与实现连接到服务器上。协同编著的共享文档统一存放在服务器上,每个编著参与者对于共享文档的修改都实时地传送到服务器中。2 ) 分布式体系结构在分布式协同编著中,当多个用户同步对一篇共享文档进行编著时,每个用户的客户端都会保存一份该文档的副本,这些副本实时的保持数据一致( 图2 1 ( b ) ) 。每个客户端都可以接收用户操作,并将操作执行的结果广播给其他客户端。3 ) 混合式体系结构集中式结构和分布式结构分剁具有各自优缺点,单纯的采用某种结构都不能很好的实现一个协同编著系统。在已经开发的协同编著系统中,大多数是将集中式结构和分布式结构结合在一起,采用混合式体系结构,如图2 - i ( c ) 所示。本文所提出的语义协同编著就是一种新的混合式结构的协同编著。( a ) 集中式结构( b ) 分布式结构( c ) 混合式结构图2 - 1 协同编著的三种体系结构在协同编著中,多个用户经常会同时修改文档的同一部分,这就可能造成不可预测的结果,因此我们必须采取一定的措盍缸控制用户对文档的并发访问,这就时协同编著中的并发控制问题,这是协同编著的难点。协同编著中的并发控制包括操作一致性控制、语义一致性控制等e 2 8 。目前,协同编著中并发控制有许多解决方法,如加锁机制 2 9 ,锁分为悲观锁、准乐观锁和乐观锁。根据需要设定不同级别的锁,如果一个协同编著用户需要对共享文档进行操作,就必须在操作执行前申请相应的锁。在悲观锁机制中,每一个编著操作都有相应的锁,用户在对共享文档进行编著前必须先申请获得该操作相应的锁,然后再对该共享文档进行需要的操作,其他没有得到该锁的用户只有等待,这个用户在自行完相应的操作后立即释放所占有的锁,这种加锁机制由于是基于“先加锁后执行”的策略,当用户操作比较多时,就会形成很多用户等待的情况,并行性较差,系统响应时间较长;在乐观锁机制里,用户对共享文档进行编著操作也是先申请锁,但不需要等待获得所申请的锁之后再执行编著操作,可以先执行相应的编著操作,如果事后系统得知该用户没有获得相应的锁,那么该用户之前所做的一切编著操作就基于本体的协同学习关键技术研究与实现被撤销,以此来维护系统数据的一致性。这种加锁机制系统重做开销较大,效率较低,实际上也降低了系统的响应性。准乐观加锁机制介于前两种加锁机制之间。总之,加锁机制无法满足协同编著的高响应性要求。除了加锁机制以外,还有通过串行化、操作变换 3 0 、r e d u c e 3 1 等方法来解决同步协同编著中的并发控制问题。串行化方法就是调整编著操作之间的执行顺序达到结果一致性,一般采用分布式操作系统和数据库系统中的一些并发控制策略,来维护复制对象间的一致性;e l l i s 等人在研究协同编辑系统g r o v e 时提出了“操作变换”的方法,其基本思想是:操作执行前对操作的各参数形式进行调整,以补偿由于执行了其他并发操作而引起的文档变化。操作变换方法着眼于操作本身,试图通过变换操作的参数形式来实现并发控制;c s u n 博士等人在“操作变换”的基础上继续深入研究,基于操作变换算法提出了改进算法一r e d u c e( r e a l t i m ed i s t r i b u t e du n c o n s t r a i n e dc o o p e r a t i v ee d i t i n g ) 来解决并发控制中的操作意愿维护闯题。以上这些协同编著中的并发控制机制只在语法层上解决了并发控制问题,然而对于语义层上的并发控制问题这些方法就不适用了。协同编著的文档中存在大量的语义操作,因此存在着大量的语义冲突,这是语义层上的并发控制问题。关于协同编著中语义冲突问题的研究目前还在探索中,还没有好的研究成果。本文着眼于协同编著中语义层上的并发控制问题,即语义冲突问题,着重对语义方面的协同编著进行研究。3 、协同查阅的研究现状作为协同学习中“读”的方面,协同查阅对于协同学习效率的提高有着非常重要的作用。协同查阅是指在计算机协同技术的支持下学习者对学习资料进行查询和阅读,从而达到知识共享的目的。协同查阅的技术很多,本文着重研究两方面的内容:1 ) 关键字查询作为协同学习中的查询技术,鉴于海量的查询资料,查询速度就变得非常重要了。随着计算机技术的发展,查询技术也在迅速发展,速度已经不是问题。如g o o g l e 搜索引擎 3 2 ,对于每个用户查询请求,需要查找4 0 多亿张网页,面对如此巨量的查找资料,g o o g l c 也可以迅速给出查询结果。因此,在现在计算机查询技术的帮助下,查询速度已经不再是问题了。然而,在查询速度得到满足的同时,学习者需要更高的查询质量。考虑这些情况:不同的研究领域所研究的内容不同,有着不同的学术术语,一个领域的研究人员往往只掌握本领域的学术术语,当他需要查询自己研究领域之外的文献资料时,由于对所要查询的领域不了解,对该领域的学术术语不知道,因此常常会无从下手,从而导致无法查询到所基于本体的协同学习关键技术研究与实现需要的文献资料;还有一种情况,网络的学习资料往往有着不同的学术术语,即同一个的现象、问题、定理在不同的学习资料中有着不同的名称【3 3 】。如“计算机”,在有的学习资料中又称为“电脑”、“个人电脑”、“微机”等,再如“c o m p u t e r ”,在有的学习资料中称为“p c ”、“”d a t a p r o c e s s o r 、“i n f o r m 撕o n p r o c e s s i n g s y s t e m ”。作为一个学习者,他不可能知道关于一个术语的所有称谓,往往只知道其中的一种,当他需要进行资料查询时,就会以他所知道的那个术语称谓作为关键字进行查询。如上例,如果用户只知道计算机,那么他就会用计算机作为关键字进行查询,只能得到与“计算机”相关的学习资料,而无法得到与关键字“电脑”、“个人电脑”、“微机”相关的学习资料,这样就无法得到全面的查询结果,影响了关键字查询的质量。上面两种情况就需要在进行关键字查询之前进行相应的关键字查询扩展,用扩展后的关键字进行查询。能否进行高质量的关键字查询扩展决定了关键字查询的质量优劣。本文使用本体对关键字查询扩展进行研究。2 ) 基于知识点的协同查阅学习者在阅读学习资料时,往往会撰写一些类似读后感之内的附件文章,本文称为知识点。一篇学习资料的知识点可以有学习者对该资料的理解、自己对该问题提出的新想法、自己所知道的与该学习资料相关的学习资源等。因此,知识点也具有很高的学习价值,它有助于加深对该篇学习资料的理解和对该问题的深入了解。如何充分利用这些知识点是一个必须解决的问题。高效的使用这些知识点可以加强学习者之间的知识交流,从而提高协同学习的效率。学习者在阅读一篇知识点时,如果可以查阅到与之相关的知识点,那么就可以充分利用其他学习者者所撰写的知识点,从而提高协同学习的效率。基于本体的协同学习关键技术研究与实现第三章本体领域知识的建立和w o r d n e t第一节本体理论本体是概念化的明确的规范说明( a no n t o l o g yi sa ne x p l i c i ts p e c i f i c a t i o no f ac o n c e p t u a l i z a t i o n ) 【3 8 ,3 9 】。本文这里也采用这种本体定义。p e r e z 等人认为本体可以按分类法来组织,他归纳出本体包含五个基本的部分,即建模元语( m o d e l i n gp r i m i t i v e ) 。这些元语分别为:类( c l a s s e s ) ,关系( r e l a t i o n s ) ,函数( f u n c t i o n s ) ,公理( a x i o m s ) 和实例( i n s t a n c e s ) 。有些文献中把类也称为概念( c o n c e p t ) 。本文中也采用这样的做法。目前被广泛使用的本体有如下五个:w o r d n e t 4 0 、f r a m e n e t 4 1 、s e n s u s 4 2 、g i n 4 3 、h o w n e t ( 知网) 4 4 。其中w o r d n e t 、f r a m e n e t 、s e n s u s 、g u m 是关于英语形式的本体,而h o w n e t 是具有中英文两种形式的本体。w o r d n e t是基于心理语言规则的英文词典,它以s y n s e t s 为单位组织信息。本文就采用w o r d n e t 作为本体资源,具体细节将在下一节讨论。本体在协同学习中的作用主要体现在两个方面:1 ) 它是学习资料中知识获取的起点本体能够提供以一种面向对象的方式描述复杂的语义结构,适合于描述异构的、分布式的和半结构化的信息源,如w e b 信息源。将w e b 信息源与本体关联,是学习资源中知识获取的起点。2 ) 促进人与系统间的互操作由于本体提供了对一个领域中概念的共享和共同的理解,这一理解促进了人和协同学习应用系统间的通信。除了引导用户来为w e b 页面定义其所属概念体系的位置外,用户的个人访问信息和特性信息( 如个性化语义信息等) 作为领域本体的新的属性一值对加入到领域本体中,从而形成一个对用户的知识。这个知识就可以用于辅助协同学习系统( 尤其是协同编著系统) 对用户提供个性化的服务( 如个性化语义服务等) 。第二节w o r d n e t 简介本文采用w o r d n e t 作为本体数据源。w o r d n e t 是按分类学组织起来的一种概1 6基于本体的协同学习关键技术研究与实现念语义网络,它可以描述概念体系中各种概念的内涵和外延联系,是一个庞大的本体信息库 4 6 。w o r d n e t 首先用于心理学语言领域,其后应用在自然语言理解的各个领域。为了适用于各个应用领域,w o r d n e t 已经发展得相当复杂了 4 7 。1 、w o r d n e t 2 0w o r d n e t 支持英文形式的本体数据,将本体分为名词( n o u n ) 、动词( v e r b ) 、形容词( a d j e c t i v e ) 、副词( a d v e r b ) 四大类,这些本体以相似词集合( s y n o n y m )为单位组织起来。w o r d n e t 目前推出了w o r d n e t 2 0 版本 4 8 ,其中单词总数为:词性单词数形容词2 1 4 3 6副词4 6 6 0名词1 1 4 6 4 8动词1 1 3 0 6总计1 5 2 0 5 0表3 - 1w o r d n e t 2 0 中的单词数量不同的单词根据词性的不同、语义的不同分别属于不同的相似词集合,每个相似词集合内根据词性和语义的相同拥有若干单词,根据本文的统计,在w o r d n e t 2 0 中,相似词集合的数量可以参见表3 2 。词性相似词数形容词1 8 5 6 3副词3 6 6 4名词7 9 6 8 9动词1 3 5 0 8总计1 1 5 4 2 4表3 _ 2w o r d n e t 2 0 中的相似词数量2 、w o r d n e t 中的语义关系w o r d n e t 中有许多语义关系,这些语义关系将其中的相似词集合像网一样联系在一起,这些语义关系见下表:l语义关系词性例词i同义关系( s y n o n y m y )n ,v ,a j ,a vp i p e ,t u b e ,r is e ,a s c e n d ,s a d ,基于本体的协同学习关键技术研究与实现u n h a p p y ,r a p i d l y ,s p e e d i l y反义关系( a n t o n y m y )a j ,a v ,( n ,v )w e t ,d r y ,p o w e r f u l ,p o w e r l e s s ,f r ie n d l y ,u n f r ie n d l y ,r a p id l y ,s l o w l y名词的从属关系ns u g a rm a p l e ,m a p l e ,m a p l e ,( h y p o n y m y h y p e r n y m y )t r e e ,t r e e ,p l a n t部分关系nb r i m ,h a t ,g i n ,m a r t i n i ,s h i p ,( m e r o n y m y h 0 1 0 n y m s )f l e e t动词的从属关系vm a r c h ,w a l k ,w h i s p e r ,s p e a k( t r o p o n o m y )继承关系( e n t a ii m e n t )vd r i v e ,r i d e ,d i v o r c e ,m a r r y表3 3w o r d n e t 2 0 中的语义关系其中n 表示名词,a j 表示形容词,v 表示动词,a v 表示副词。在以上六种语义关系中,a n t o n y m y 和t r o p o n o m y 其实是同一种语义关系,只不过面对的词性不同而已,而继承关系很少使用到,这样主要就成了四种语义关系:1 ) 同义关系w o r d n e t 最重要的关系是单词的同义关系( s y n o n y m y ) 。按照一个词的定义,如果它在一个句子中被另一个词替代而不改变句子的意义,那么这两种表达是同义的。按照这种说法,真正的同义词就算有也很少。现在弱化这种定义方式,使同义关系与上下文相关:如果两种表达方式在文档中相互替代而不改变其意义,则这两种表达就是同义的。例如,单词“d o c u m e n t ”是一个多义词,根据其语义的不同拥有不同的同义关系词集合;作为“w r i t t e nm a t e r i a l ”来说,同义关系单词有“w r i t t e nd o c u m e n t ”、“p a p e r s ”;作为“ac o m p u t e rf i l et h a tc o n t a i n st e x t ”来说,同义关系单词有“t e x tf i l e ”。2 ) 反义关系在w o r d n e t 2 0 中反义词关系很普遍。对于一个多义词来说,根据语义的不同会拥有多个不同的反义词,比如单词“b i g ”是一个反义词,根据它词性、语义的不同拥有不同的反义词:作为“a b o v ea v e r a g ei ns i z eo rn u m b e ro rq u a n t i t yo rm a g n i t u d eo re x t e n t ”来说,反义词为“s m a l l ”;作为“i m p o r t a n t ”来说,反义词为“u n i m p o r t a n t ”:作为“c o n s p i c u o u si np o s i t i o no ri m p o r t a n c e ”来说,反义词为“i n v i s i b l e ”;作为“v e r yi n t e n s e ”来说,反义词为“m i l d ”等。3 ) 从属关系从属关系按照词性的不同分为两种:1 8基于本体的协同学习关键技术研究与实现a ) 名词的从属关系称为h y p o n y m y h y p e r n y m y ,其中单词a 是单词b 的h y p o n y m y 当且仅当a 是b 的一种,多义词根据词义的不同拥有不同的h y p o n y m y ,例如单词“d o c u m e n t ”,作为“w r i t t e nd o c u m e n t ”时,h y p o n y m y 是“b a l l o t ”、“b r e v e t ”、“c e r t i f i c a t e ”、“c h a r t e r ”、“c o n f e s s i o n ”、“c o p y r i g h t ”、“e n c l o s u r e ”、of o r m ”、“l e g a ld o c u m e n t ”、“p a p y r u s ”、“p a t s n t ”、“s o l t l ”等。作为“ac o m p u t e rf i l e t h a tc o n t a i
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年四氢苯酐合作协议书
- 2025年计划生育技术服务合作协议书
- 2025年悬挂式离子风机合作协议书
- 2025年秸种腐熟剂合作协议书
- 养殖业饲料供应及回收协议
- 跨境金融服务外包协议
- 2025年焦作考运安驾驶员考试答案危险品运输
- 商业照明设计及安装维护合作协议
- 公司债权转股合同书
- 企业信息化系统集成项目合作协议
- 工业机器人22手部设计-23腕部设计课件
- DLT-969-2023年变电站运行导则
- 人教版小学三年级数学下册面积练习
- 2023年湖南省长沙市中考语文真题试卷【含答案】
- 2022北京西城区初一期末(下)道法试卷及答案
- 2023年被告民事诉讼答辩状
- (2020)中国儿童阻塞性睡眠呼吸暂停诊断与治疗指南
- 监狱围栏施工组织设计方案范本
- SB/T 10029-2012新鲜蔬菜分类与代码
- GB/T 6075.3-2001在非旋转部件上测量和评价机器的机械振动第3部分:额定功率大于15kW额定转速在120r/min至15000r/min之间的在现场测量的工业机器
- GB/T 2410-2008透明塑料透光率和雾度的测定
评论
0/150
提交评论