已阅读5页,还剩60页未读, 继续免费阅读
(计算机软件与理论专业论文)基于本体的教学知识库研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
河海大学硕士研究生论文 摘要 摘要 知识库的知识建模是智能化系统必须首要解决的问题之一。由于传统智能教学系统 的资源缺少统一的知识描述结构,导致学习资源在各教学系统间难以交互操作和共享: 目前智能教学系统中基于关键字的知识信息检索方式,在语义和语用的揭示上有很大的 局限性,难以满足用户的实际需求。因此研究知识库的知识建模问题,具有很强的理论 和实际意义。 本文将本体引入教学知识库的建模过程,通过研究取得了下列结果: ( 1 ) 从智能教学系统的知识建模方法入手,用本体建模提供共享概念模型,促进知 识库术语描述和实体属性的规范化,建立概念语义空间,提供知识共享和语义互操作: ( 2 ) 本体知识库建模阶段,针对现有本体建模方法存在的问题和不足,结合软件工 程学,设计基于c r u p 的本体建模方法和过程,依据其构建了基于o w l 描述的数据结 构课程本体知识库,并对所建本体知识库进行正确性检查; ( 3 ) 以所建的本体知识库为基础,开发语义检索原型系统,研究其构建原理、工作 流程和开发方法,通过系统运行分析,语义检索实验系统比传统的基于关键字的查询方 法具有更高的查全率和查准率。 将本体引入智能教学系统的知识库建模,提供概念共享模型促进机器理解,不仅可 以解决知识共享及互操作问题,同时在基于本体知识库的智能教学系统中,易于实现基 于知识的语义检索技术,这将有利于提高系统的检索效率。 关键词本体,知识表示,教学知识库,o w l ,语义检索 基于卒体的教学知识库研究 a b s t r a c t t h ek i l o w l e d g er e p r e s e n t a t i o no fk n o w l e d g eb a s ei so n eo ft h ef i r s ti i i l p o n 习m tp r o m e m s 1 a tm u s tb es e m e di l li i l t c l l e c t u a l i z e ds y s t e m b e c a u s et h et r a d i t i o n a li n t e l l i g e n c et e a c l l i n g s y s t e mr e s o u r c e sl a c k st h e 砌南r mk n o w k d g er e p r e s e n t a t i o n 如眦e w o r k ,a l lt h el e 姗i n g r e s o u r c e sa r ed i 伍c u ht oo p e r a t ea 1 1 ds h a r ee a c ho t l l e ri nv 撕o u st e a c h i n gs y s t e m a tp r e s e n t t h ek e y w o r d 七a s e dk n o w l e d g ei n f b 册a t i o nr e 仃i e v a lm o d co fi t s ,b e i n gv e r yl i m i t e di n r c v e a l i r i gs e m a n t i c sa r i dp r a 鲫a t i c s ,i sd i 伍c u l tt 0s a t i s 旬t h eu s e 鹅a c t u a ld e m a i l d s s o “i s v e r yl l s e 伽t 0r e s e a r c ht 量l ek n o w l e d g er e p r e s e n 诅t i o no f k n o w l e d g cb a s e t h i sd i s s e r c a t i o ng a i n st h ef o l l o w i n gr e s i l l t sb yi n t r o d u c i n go t o l o g yt om em o d e l i n g p r o c e s so f t e a c h m gk b : f i r s t ,s t a n i i l gw i mt h eh o w l e d g er e l ) r e s e n t a t i o no fi t s ,m ed i s s e n a t i o no 舵r sm o d e lo f s h a r ec o n c e p tb a s e do no n t o l o 野t h j sp r o m o t e s 廿l es t a n d a r d i z a t i o no fe n t “i e sp r o p e r 眵a n d g l o s s a r ye x p r e s s i nk b s i m 瑚t a n e i 吼“c a no 脓 k n o w l e d g e s h a r ea 1 1 ds 锄眦i c m u t u a l - o p e m t i o nb ye s t a b l i s h i n gas p a c eo f s e m 枷cc o n c 印t s e c o n d ,a tt 1 1 ep r o c e d u r eo fm o d e l i n go n t 0 1 0 9 y b a s e dk b ,、v ed e s i g na 1 1o n t o l o g y 啪d e l i n gm 劬0 da i l dp r o c e s sb a s c do nc r u p b yc o m b i n i n g 龀o n t o l o g ym o d e l i l l gm 曲o d s i ne x i s t e n c ea i l dt l l et e c l l i l o l o g yo fs o f h a r ee n g i n e e r i n g t h e nw ec o n s 廿l l c tm eo n t o l o g yo f d 口幻”“咖糟b a s e do no w lr e p r e s e n t a t i o na i l dp r o b ei t oi t sv a l i d i t ya c c o r d i n gt oo u r c r u p _ b a s e dm e t l l o d t h i r d ,w ed e v e l o pap m t o t y p es y s t e mo fs e m a m i cs e a r c hb a s e do no u rc o n s t m c t e d 0 n t o l o g y b a s e dk b w es t u d yi t sp r i n c j p l eo fc o l l s t r u c t i o n ,w o r k i i l gf l o wa f l dm e t h o d so f d e v e l o p m e n t t h e nb ya n a l y z m gc i r c u l a t i o no fs y s t e m ,w e 也i i l _ kt h a tt h es e a r c h j n gs y s t e m b a s e do ns e m a n t i ci sm o r cr o u i 】da 【l de x a c tt h a n 廿l es e a r c h i n gm c t h o db a s e do nk e y w o r do f 缸a d i t i o n a l 、v a y i no r d e rt op r o v i d et h em o d e l i n go fs h a r i n gc o i l c 印t sa n ds e m a n 【i cc o n c e p t s ,o n t o l o g yi s i n t r o d u c e dt o 也ek bm o d e l i n go fi t s 1 1 1 i sn o to n l ys o l v e st h ep r o b l e mo fk t l o w i e d g e s h a r i n ga i l do p e r a t i n ga r de a s i l yr e a l i z e s 也ei n q u i r y 丘m c t i o nb a s e do ns e m 枷cs e a r c h ,b u t a l s or e a l i z e ss e m a t l t i cs e a r c hb a s e do nc o n c 印t i o ne a s i l yt h i sc a l lm i s e dt h ep r e c i s i o na n d r e c a l lo fi n f 0 肋a t i o ns e a r c hs y s t c m k e y w o r d so n t o i o 趴妯o w l e d g er 印r e s e n t a t i o n ,t e a c h i n gk b ,o w l ,s e m a n t i cs e a r c h 学位论文独创性声明: 本人所里交的学位论文是我个人在导师指导下进行约研究工作及取癌 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文牛 不包含其他人已经发表或撰写过的研究成果。与我一同工作的同事对本硼 究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。如不实, 本人负全部责任。 论文作者( 签名) :兰堑! 坚枷( 年6 月,- f 自 学位论文使用授权说明 河海大学、中国科学技术信息研究所、国家图书馆、中国学术期刊( 兆 盘版) 电子杂志社有权保留本人所送交学位论文的复印件或电子文档,可掣 采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论 文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅。 论文全部或部分内容的公布( 包括刊登) 授权河海大学研究生院办理。 论文作者( 签名) :! 殓! 塑 上6 年月f r 日 河海大学硕士研究生论文 第一章绪论 第一章绪论 1 1 研究背景及问题提出 基于知识的教学系统( k n o w l e d g e b a s e dt u t o r i n gs y s t e m ,k b t s ) ,即智能教学 系统( i n t e l l i g e n tt u t o r i n gs y s t e m ,i t s ) 是计算机辅助教育与人工智能学科的重要 研究领域,也是教育信息建设的重要组成部分。经过近4 0 年的发展,智能教学系统已 成为计算机应用于教育领域的主要形式,并逐渐形成了自己独有的理论研究和开发应用 范畴,产生了一套专门的概念、教学模式、工作方法和常用技术。智能教学系统改变了 传统教学模式和教学环境,具有交互性、多样性和灵活性等特点,加大了知识传授量, 改变了人们获取知识的手段和方法。因此,它的兴起和蓬勃发展标志着教育领域中一场 深刻变化的开始,日益受到人们的重视,并正在成为2 l 世纪人类社会数字化教育发展 的必然方向。 然而目前智能教学系统的资源共享,基本是在简单的w e b 页和其他常用文件共享的 基础上,缺少统一的知识表示结构,课件重复开发严重,资源管理共享难度大,学习资 源在各教学系统问难以交互操作。归纳起来,现有的智能教学系统主要存在着以下问题: ( 1 ) 语义互操作不强。高度的语义互操作对于w e b 上不同教育应用平台之间的交流 是必需的,由于教学知识库的描述标准不,在知识的结构、类型及属性上各自定义, 而且知识表示方式不同,所以导致知识难以得到交流和共享; ( 2 ) 检索效率不高。由于教学知识内容多而广,传统的基于关键字的搜索技术不能 满足需要,目前实用化的教学信息检索系统对海量信息资源的揭示效率不高、深度有限, 一方面会导致检索到大量无关的学习材料,另一方面也会丢失相关的重要学习材料。 如何解决好诸如信息组织、知识表示、机器理解与人机交互等问题,对于提高智能 教学中教学资源利用的效率,是非常重要和迫切的。要解决以上的这些实际问题,满足 智能教学系统的特点和需求,发挥其应用能力,必须使用合适的本体来描述教学知识库, 并构建一个基于本体知识库的体系结构 1 。起源于哲学领域的本体论主要用于知识表 达、共享及重用,本体提供一套概念和术语来描述特定领域,并且获取该领域的本质的 概念结构及概念之间关系,然后知识库就可以运用这些术语去表达现实或者虚拟世界中 的正确知识。 1 2 研究现状 1 9 7 0 年c a r b o n e l l 为南美洲地理研制了s c h 0 1 a r 系统,是对智能教学系统的最 基于本体的教学知识库研究 早探索。该系统的知识库采用了由事实、概念和过程组成的语义网络形式,使用了苏格 拉底对话方式进行教学,通过推理机( 教师模块) 产生问题让学习者应答并作出评价, 系统中具备诊断学习者的错误和纠正错误的功能。1 9 7 5 年由b r o w n lb u r t i n 和b e l l 研 制了电子仪器故障检测系统( s o p h i e ) ,用来帮助和指导学生检查电路故障及其产生原 因。该系统把领域知识和用于回答学生问题的启发式策略结合在一起,与此同时,对学 生的不正确学习路径提出建议,并提供另外的供选择的路径。1 9 8 2 年c 1 a n c e y 开发了 g u i d o 系统,用于就医疗诊断知识的问题求解,它采取了“双向互动对话”方式进行教 学的过程。进入9 0 年代,由于计算机技术、人工智能理论和方法、建构主义理论等的 发展,智能教学系统的研究集中在协作教学模式、建构学生模型和智能超媒体c a i 系统 研究等方面。 近年来,本体已被计算机领域所采用,用于知识表达、共享及重用。本体的最终目 标是“精确地表示那些隐含( 或不明确的) 信息” 2 。目前国外很多研究机构及大学都 积极地对本体进行研究。c y c 是位于美国德州奥斯汀的m c c ( m i c r o e l e c t r o n i c sa n d c o m p u t e rt e c h n o l o g yc o r p o r a t i o n ) 公司的研究项目 3 ,其目的是通过本体开发为常 识推理提供基础。t o v e 项目是多伦多大学e i l 实验室( e n t e r p r i s ei n t e g r a t i o n l a b o r a t o r y ) 的一个项目 4 ,它的目标是建立一套为商业和公共企业建模的集成本体, 并且已经建成了相关本体。k a c t u s 是欧洲e s p r i t 项目 5 ,其目的是开发出技术系统全 生命周期的知识复用方法,以便在设计、诊断、操作、维护、再没计和培训时使用同一 知识库。g u a r i n o 是意大利帕多大学l a d s e b c n r ( i n s t i t u ef o rs y s t e m st h e o r ya n d b i o m e d i c a le n g i n e e r i n g ) 的高级研究员,他分析总结了本体及相关概念的含义 6 ,提 出了“本体层”的概念 7 ,研究了表示本体的本体约定,并探索了本体在物理对象、 s t e p 语义方面的应用 8 ,具有重要的参考价值。s t a n f o r d 大学知识系统实验室进行了 关于知识本体的研究,包括研究知识的本质特征和基本属性,提出了一种称为知识交换 格式( k n o w l e d g ei n t e r c h a n g ef o r m a t ,简称k i f ) 的知识描述语言 9 。国内关于本体的 研究也比较广泛,相关应用研究也较多。主要有本体与信息检索 1 0 一1 7 、本体论与 数字图书馆 1 8 2 2 、本体论与信息管理 2 3 ,2 4 ,此外还包括知识库系统 2 5 、数 据挖掘 2 6 、电子商务 2 7 、机器翻译 2 8 、需求分析 2 9 ,3 0 等。 i t s 中知识库的建立,其实质是研究领域知识中的基本概念及其关系。若将本体引 入知识库的建立,可以提供共享概念模型,建立概念语义空间,这样不仅会促进知识库 的实体属性和术语表达的规范化,解决知识共享和重用、增强知识库的智能推理能力, 河海大学硕士研究生论文第一章绪论 而且将比传统数据库所使用的语言在语义、语法上更加丰富;同时在基于本体知识库的 i t s 中,易于实现基于描述逻辑( d l ) 的推理查询功能,这将比传统的基于关键字的查询 方法具有更高的查全率和查准率。 1 3 研究工作 将本体引入智能教学系统的知识库建模过程,用本体提供的一套概念和术语来描述 教学领域知识库,获取该领域的本质的概念结构及概念之间的关系。采用w 3 c 推荐的标 准本体语言o w l ,对领域知识的概念和相互之间的关系进行较为精确的定义,一方面促 进机器理解,另一方面可以从根本上解决知识共享和互操作问题。同时在基于本体知识 库的系统中易于实现语义检索功能,从而提高系统的查全率和查准率。总之在本体提供 的规范的共享概念及关系的支持下进行知识共享、知识检索的效率将大大提高,具体研 究如下: ( 1 ) 将本体引入教学知识库的建模中,利用领域知识与本体语言建立领域知识库本 体模型,建立概念共享模型提供概念语义空间,并用标准本体定义语言o w l 进行描述。 从而解决i t s 的知识表示、共享及重用问题: ( 2 ) 在建模时首先用o w l 语言建立起树型的分类结构模式,然后用该模式去描述资 源实例,最后由资源描述文档建立起o w l 文档库,并与具体资源建立起映射关系:针对 现有本体建模方法存在的问题,结合软件工程技术,设计一种基于定制r u p ( c r u p ) 的本 体建模方法,并探讨其具体的建模过程; ( 3 ) 设计基于语义的知识检索原型系统,利用c r u p 建模方法所建立的教学知识库 ( o w l 文档库) ,开发一个基于本体的语义检索原型系统,研究系统的结构、流程,以及 语义分析、基于本体的各种检索策略和方法。 1 4 论文组织 具体章节安排如下: 第一章为绪论,主要介绍本文的研究背景,论述知识库系统的相关技术及其重要性, 并分析将本体引入知识库系统的建模优势。然后综述国际国内与本体相关的研究现状, 提出论文研究计划,最后介绍本文研究内容以及论文的章节安排。 第二章是知识库与本体研究综述,包括知识库和本体的基本概念、研究热点、本体 描述语言、建设方法和工具,最后通过分析对比,给出本文所使用的本体描述语言和建 模工具,并对建模方法进行总结评价。 第三章基于c r u p 的本体建模方法设计。本体开发也可以看作是软件产品开发,通 基于本体的教学知识库研究 过分析现有的五种本体建模方法存在的问题,研究其解决办法。通过分析论证,结合软 件工程学,设计一种基于c r u p 的本体建模方法和过程,并研究其具体的设计方案和过 程。 第四章是c r u p 建模方法在教学知识库中的应用,采用第三章设计的基于c r u p 的本 体建模方法,构建数据结构课程的本体知识库模型,深入探讨了领域本体建设的具 体过程,同时就本体知识库正确性的重要性和正确性检查作出分析,并给出具体的本体 正确性检查的操作方法。 第五章基于本体知识库的语义检索系统实现,进一步探讨基于本体的数据结构 知识检索系统模型的构建,一方面是为了验证采用c r u p 本体建模方法设计的本体知识 库的有效性和可行性,另一方面是为了解决i t s 中传统的基于关键字匹配检索方式的不 足。主要内容包括知识检索系统模型、基于本体的各种检索策略和方法,并进行实验分 析。 第六章是总结与展望,对本文的主要研究成果及创新进行总结,并指出工作上进一 步研究的内容和方向。 河海大学顿:匕研究生论文 第二章知识库与本体研究综述 第二章知识库与本体研究综述 本章主要研究知识库及基于本体的知识库相关技术,从本体概念入手分析本体在知 识库中的应用。然后分析本体描述语言和建模工具,经过研究对比,本体描述语言采用 w 3 c 的标准本体语言o w l ,建模工具使用s t a n f o r d 大学开发的p r o t 6 9 6 。最后探讨现有 的本体建模方法,并进行分析评价。 2 1 知识库技术分析 知识库是合理组织的关于某一特定领域的陈述型知识和过程型知识的集合。知识库 和传统数据库的区别在于它不但包含了大量的简单事实,而且包含了规则和过程型知 识。建立知识库涉及到如下几个方面的问题:一是关于知识的表示:二是关于知识库的 构造;三是关于知识库的管理( 包括知识的获取) 。下面来探讨知识库的知识类型及知识 表示等问题。 2 1 1 知识及知识类型 知识是信息经过加工整理、解释、挑选和改造而成的,信息的作用有时间和范围限 制,为了使信息在较长时间内有效,必须进行一系列内部处理,这个过程叫做综合。一 般来说,所谓知识,就是人们在改造客观世界的实践中所获得的基本概念、认识、经验 和规律,它是人类进行智能活动的基础。从计算机科学的观点来看,知识是信息综合处 理的结果,在综合过程中,信息通过相互比较,结合成有意义的链接。数据、信息和知 识具有层次关系,如图2 1 所示。 墨丞 - 分析、, ,_ 么茎塑 图2 1 数据、信息和知识的层次关系 知识的类型可以分为如下几种: ( 1 ) 事实型知识。一般采用直接表示形式。如果事实性知识是批量的、有规律的, 则往往以表格、图册,甚至数据库等形式出现;对某些事实型知识表现为规则的形式( 尽 管有时事实和规则分开处理) ; 基于本体的教学知识库研究 ( 2 ) 过程型知识。描述做某事的过程,使人或计算机照此去做: ( 3 ) 行为型知识。不直接给出事实本身,只给出它在某方面的行为。从某种意义上 说,行为型知识是描述事物的内涵,而非外延; ( 4 ) 实例型知识。只给出一些实例,关于事物的知识就隐藏在这些实例中。实例型 知识和事实型知识的主要区别是:人们感兴趣的一般不是这些实例本身,而是在大批实 例后面隐藏的规律性知识; ( 5 ) 类比型知识。既不给出外延,也不给出内涵,只给出它与其它事物的某些相似 之处。类比型知识般不能完整地刻划事物,有时会以偏概全,但它可以启发人们在不 同领域的知识问架起桥梁,利用一个领域的知识去解决另一个领域的问题; ( 6 ) 元知识。关于知识的知识,元知识经常以控制知识的形式出现。 2 1 2 知识的形式化表示 知识库的知识必须以某种一致化的结构存储和组织,以实现计算机自动知识处理和 问题求解。这就是所谓的知识的形式化表示。我们主要讨论如下的形式化知识表示方法: ( 1 ) 基于逻辑的知识表示。逻辑具有严格的形式化和坚实的数学理论基础,是计算 机最早采用的知识表示方法。最常用的表示知识的逻辑语言有命题逻辑和一阶逻辑。为 了克服上述逻辑语言表示能力有限的问题,近年来在所谓的非经典逻辑研究方面取得了 重要进展,如模态逻辑、时序逻辑和非单调逻辑等。 ( 2 ) 基于关系的知识表示。同逻辑一样,关系方法具有严密的数学基础,关系方法 特别适用于表示简单事实和陈述型知识。关系数据库仍是当前数据库的主流。 ( 3 ) 面向对象的知识表示。面向对象的基本观点认为,世界( 研究领域) 是由各种对 象组成,任何实体都是对象。复杂的对象可以由某些相对简单的对象以某种方法组成。 因此,面向对象的知识表示方法把整个世界表示为一个最复杂的对象,它由各种相对简 单的对象组成,经过层层组合,最后都由最基本的元对象组成。 ( 4 ) 基于规则的知识表示。基于规划的知识表示使用:“i fc o n d i t i o nt h e na c t i o n ” 形式的产生式规则表示知识,是目前应用最广泛的知识表示方法之一,除了其具有良好 模块性外,最重要的原因是领域专家习惯于把自己的知识表示为i f t h e n 的形式。 ( 5 ) 语义网络。语义网络是用有向图表示领域知识的一种技术。在语义网络中,结点 表示领域的实体( 对象或概念) ,弧代表实体之间的关系,弧上的标注说明该二元关系的 类型。语义网络最早用于自然语言理解的研究,现在已发展为一般的知识表示方法。 ( 6 ) 基于模型的知识表示。基于模型的知识表示方法认为知识库是外部世界特定领 河海大学硕:l 研究生论文第二章知识库与本体研究综述 域的一个模型。在该模型中,领域世界的结构和功能表示为一组事实、事实间的相互联 系和彼此间的相互因果关系。通常对外部世界的模拟有两个层次,即“深层模拟”和“浅 层模拟”。在这两个层次间并没有明显的分水岭,一个有效的方案是根据问题的性质, 有机地结合这两种模型。 ( 7 ) 基于本体的知识表示。基于本体的知识表示方法是近年来的研究热点之一。这 种观点认为:任何复杂的知识都由最基本的概念构成,这些最基本的概念称为本体;本 体是基本概念的详细说明。本体的重要性体现在它在知识的可重用和共享性上的重要作 用。 2 2 本体与知识库 2 2 1 本体概念 在人工智能界最早给出本体定义的是n e c h e s 等人,他们将本体定义为“给出构成 相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的 规则的定义” 3 1 。后来在信息系统、知识系统等领域,越来越多的人研究本体,并给 出了许多不同的定义。 其中最著名并被引用最广泛的定义是g r u b e r 的“本体是概念化的明确的规范说明” 3 2 ,3 3 。w mb o r s t 对该定义也进行了引申“本体是共享的概念模型的形式化的规 范说明” 3 4 。f e n s e l 定义“本体是对一个特定领域中重要概念的共享的形式化的描述” 3 5 。f e n s e l 对这个定义进行分析后认为本体的概念包括四个主要方面 3 6 : 概念化( c o n c e p t u a l i z a t i o n ) :通过抽象出客观世界中一些现象的相关概念而得到 的模型,其表示的含义独立于具体的环境状态; 明确( e x p l i c i t ) :所使用的概念及它们之问联系和约束都被精确定义; 形式化( f o r 皿a 1 ) :精确的数学描述,从而使得本体对于计算机是可读的; 共享( s h a r e ) :本体中体现的是共同认可的知识,反映的是相关领域中公认的概念 集,它所针对的是团体而不是个体。 s w a r t o u t 将本体定义为:“本体是一个为描述某个领域而按继承关系组织起来作为 一个知识库的骨架的一系列术语” 3 7 ,他的定义强调了本体中术语“e r m s ) 的重要性。 n o yf n 认为“本体是对某个领域中的概念的形式化的明确的表示,每个概念的特性描 述了概念的各个方面及其约束的特征和属性” 3 8 。f o n s e c a 定义“本体是以某一观点 用详细明确的词汇表描述实体、概念、特性和相关功能的理论” 3 9 。 尽管本体的定义方式多种多样,通过研究比较,我们可以看出他们对本体的认识基 基于本体的教学知识库研究 本是统一的,都把本体当作是领域内部不同主体之间进行交流的一种语义基础,即由本 体提供一种明确定义的共识,本体提供的这种共识是为机器服务的。我们之所以在知识 工程、自然语言处理、信息检索系统、智能信息集成和知识管理、信息交换和软件工程 等领域研究和发展本体,是因为本体有以下突出的特点 4 0 : ( 1 ) 本体可以在不同的建模方法、范式、语言和软件工具之间进行翻译和映射,以 实现不同系统之间的互操作和继承。 ( 2 ) 从功能上来讲,本体和数据库有些相似。但是本体比数据库表达的知识丰富得 多。首先,定义本体的语言,在词法和语义上都比数据库所能表示的信息丰富得多。最 重要的,本体提供的是一个领域严谨丰富的理论,而不单单是一个存放数据的结构。 ( 3 ) 本体是领域内重要实体、属性、过程及其相互关系形式化描述的基础。这种形 式化的描述可成为软件系统中可重用和共享的组件。 ( 4 ) 本体可以为知识库的构建提供一个结构。以描述对象的类型而言:有简单事实 及抽象概念,这些可以描述成一个本体的静态实体部分,它们主要描述的是事物或概念 的各个组成部分以及这组成部分之间的静态联系可以描述事物或概念的运动和变化。应 用本体,知识库就可以运用这类结构去表达现实世界中浩如烟海的知识和常识,这点在 中科院数学所陆汝钤研究员建立的p a n g u 知识库中得到了很好的体现 4 1 。 ( 5 ) 对于知识管理系统来说,本体就是一个正式的词汇表。本体可以将对象知识的 概念和相互之间的关系进行较为精确的定义。在这样一系列概念的支持下,进行知识搜 索、知识积累和知识共享的效率将大大提高。 ( 6 ) 本体适合表示抽象的描述。企业模型是人们对企业或者企业的某些模型的抽象 描述,因此在企业逻辑建模中,本体的使用可以帮助我们清楚地理解企业特定领域的相 关元素、关系和概念,让知识表达更加准确便捷,帮助人们进行更好的企业决策 4 2 。 2 2 2 领域本体知识库 从知识表示角度考虑,本体和知识库有类似之处,都是对一个具体或是抽象领域中 包含的知识的定义、表示和组织。其主要区别是知识库包含了特定领域抽象或特定的知 识,而本体是概念层次上对概念化的清楚描述,更注重概念层次上术语及术语间关系的 表述。从功能上来讲,本体和数据库有些相似,但是本体比数据库表达的知识丰富得多。 首先,定义本体的语言,在词法和语义上都比数据库表示的信息丰富得多;更重要的是 本体提供一个领域严谨丰富的理论,而不单单是一个存放数据的结构。本体是领域内重 要实体、属性、过程及其相互关系形式化描述的基础。这种形式化的描述可成为软件系 河海大学颂:卜研究生论文第二章知识库与本体研究综述 统中可重用和共享的组件。 知识库系统的实现涉及到两个关键问题:知识表示和知识推理。知识的表示形式是 知识库系统首要解决的问题,它应当用计算机可以“理解”的方式对知识进行表示,同 时咀一种人类能够理解的方式将处理结果告知用户。本体可以为知识的构建提供个基 本的结构,本体可以将领域知识的概念和相互之间的关系进行较为精确的定义,从而解 决机器理解问题。在这样系统概念的支持下进行知识检索、知识共享的效率将大大提 高,真正意义上的知识重用和共享也能成为现实。 将本体引入知识库的知识建模,建立领域本体知识库,可以用术语或概念对知识进 行表示,同时揭示这些知识之问内在的关系。领域本体知识库中的知识,不仅通过纵向 类属分类,而且通过本体的联想( 语义关联) 进行组织和关联,推理机再利用这些知识进 行推理,从而能大大提高用户检索的查全率和查准率。 2 3 基于本体的知识库应用 本体在信息共享、系统集成、基于知识的软件开发等方面具有重要的作用和广阔的 应用前景,关于本体的研究主要体现在三个方面:( 1 ) 理论深化研究,包括概念及其分 类、本体上的代数等;( 2 ) 信息系统中的应用,主要包括处理信息组织、信息检索和异 构信息系统互操作问题;( 3 ) 本体作为一种能在知识层提供知识共享和重用的工作在语 义w e b 中的应用。 下面着重探讨本体在信息检索系统中的应用。目前基于全文检索技术的搜索引擎在 检索时,由于参与匹配的只是关键词的外在表现形式,而非它们所表达的概念,所以经 常返回大量的无关信息。另外用户很难简单地用关键词或关键词串来准确地表达真正需 要检索的内容,有时对同一概念不同的用户可能使用不同的关键词来查询,检索效果不 尽如人意。 因此需要增强搜索引擎的概念分析理解能力,结合本体应用的智能搜索引擎可以把 信息检索从目前基于关键词层面提高到基于概念层面,从概念意义上来认识和处理检索 用户的请求,从而实现概念检索。实现概念检索的前提是建立人工编制或计算机自动生 成的语义词典,对检索输入进行语义扩展。本体作为可以共享的、完备的领域概念集合, 完全符合语义词典的各项要求,无可挑剔地成为本体语义词典的最佳候选。所以将本体 与概念检索技术相结合,将使概念检索发挥更加强大的检索功能,具有很好的发展前景。 l 语义检索的具体实现方法并不唯一,根据基于概念词典的语义检索的实现思路并结 l 合相关具体技术和工具,通常基于本体的语义检索的实现方法如图2 2 所示 4 3 。 基于本体的教学知识库研究 图2 2 基于本体的语义检索的实现机理 图2 2 主要包括下列组成部分: ( 1 ) 领域本体的构建 使用p r o t 6 舀等工具软件在领域专家的协助下手工创建用于实现语义检索的领域本 体实体,并以r d f 、r d fs c h e m a 或者o 忆等格式输出。在选择实体描述语言时,尽可能 使用标准语言如o w l 。 ( 2 ) 信息资源的本体元数据标注 对于各种信息资源如w e b 网页、图、p d f 文档等,应根据已建立的领域本体实体进 行本体元数据标注。可以使用r d f 或o w l 。语言对信息资源进行语义层面表示和描述,然 后将其按一定的格式存储在元数据库中。如果系统存储的是少量数据,则可直接用0 w l 等文件形式存储;如果要存储大量的事实数据,则考虑到可扩展性、查询方式、效率等 诸多因素,以关系数据库存储将是一种比较好的选择,如何将本体数据不失语义的存储 在关系数据库中,以及本体查询语言如何转换到s q l 是必须解决的关键问题。 ( 3 ) 设计和实现内部语义检索引擎 内部语义检索引擎的检索是一种智能检索,它需要在理解用户检索需求的基础止, 根据接收到的概念,基于本体实体通过语义相关性推理,借助于j e n a 等解析推理正具 进行概念分析和扩展,并对已进行本体元数据标注的信息资源库进行检索,然后争g 检索 结果反馈给用户界面。目前,这个实现过程还有许多问题需要研究和解决,例如准体实 体的自动创建问题,本体的存储和描述资源库的存储问题,利用j e n a 等辅助开发包对 本体和描述资源信息进行解析和推理的实现问题,对用户输入自然语言的解析问题,检 河海太学顶士研究生论文 第二章知识库与本体研究综述 索结果的显示和与用户交互的问题等。 ( 4 ) 用户界面 接受用户的检索输入并进行概念提取,将分析结果传递给内部的语义检索引擎,把 检索结果显示给用户。 本文研究的切入点就是如何使用本体来对知识库进行建模,从而解决知识共享和语 义互操作问题,下面首先来探讨与本体相关的建模语言、建模工具以及建模方法等技术。 2 4 本体相关技术分析 在计算机领域讨论本体,就要讨论本体究竟是如何表达共识的,即概念的形式化问 题,这需要首先分析本体的描述语言。 2 4 1 本体描述语言 本体描述语言主要是为领域模型编写清晰的、形式化的概念描述,目前已诞生了许 多种本体描述语言,自上个世纪9 0 年代以来,一些基于a i 的本体实现语言陆续被提出, 如k i f 、o n t o h n g u a 、c y c l 、l o o m 、o c 虬和f l o g i c 。随着w e b 的发展,又出现了基于 w e b 标准的本体描述语言如s h o e ( s i m p l eh t m lo n t o l o g ye x t e n s i o n ) 、x o l ( ) ( m l _ b a s e d o n t 0 1 0 9 y e x c h a n g el a n g u a g e ) 4 4 、r d f 、r d f - s 、o i l 、d a m l 、d a m l + o i l 和o w l 。本文 着重研究基于w e b 的本体描述语言。 ( 1 ) s h o e s h o e ( s i m p l eh t m l0 n t o l o g ye x t e ! s i o n s ) 作为h t m l 的扩展,是马里兰大学开发的, 它是基于框架和规则的 4 5 。它使用不同于h t m l 的一些标记,使得可以在h t m l 文档中 插入本体。当x m l 产生并成为w e b 上交换信息的标准后,s h o e 的语法被修改为基于x m l 。 目前,马里兰大学已经停止研究s m e ,他们有关本体的研究项目开始使用o w l 和 d a m l + o i l 作为本体的描述语言。 ( 2 ) x o l x o l ( 0 n t o l o g ye x c h a n g el a n g u a g e ) 是s r ii n t e r n a t i o n a l 的人工智能中心( a i c ) 开发的,它是一种简单通用的定义本体的方法。其目的是在不同的数据库、本体开发工 具、或者其他应用程序之间交换本体。x o l 设计之初是为生物信息学领域本体的交换, 但是它可以应用于各种领域。 ( 3 ) r d f ,r d f s r d f ( 资源描述框架,r e s o u r c ed e s c r i p t i o nf r a m e w o r k ) 4 6 、r d f s ( r d fs c h e m a ) , 是w 3 c 在) ( m l 的基础上推荐的一种标准,用于表示任何的资源信息 4 7 。r d f 提出了一 基于本体的教学知识库研究 个简单的模型用来表示任意类型的数据。这个数据类型由节点和节点之问带有标记的连 接弧组成。节点用来表示w e b 上的资源,弧用来表示这些资源的属性。因此,这个数据 模型可以方便的描述对象( 或者资源) 以及它们之间的关系。r d f 的数据模型实质上是一 种二元关系的表达,由于任何复杂的关系都可以分解为多个简单的二元关系,因此r d f 的数据模型可以作为其他任何复杂关系模型的基础模型。r d fs c h e m a 为r d f 资源的属性 和类型提供定义良好的词汇表,w 3 c 推荐以r d f r d f s 标准来解决x m l 的语义局限。 ( 4 ) 0 i l 0 i l ( 本体推理层本体交换语言,0 n t o l o g yi n f e r e n c el a y e r o n t 0 1 0 9 yi n t e r c h a n g e l a n g u a g e ) 是在欧洲的i s t 项目0 n t o k n o w l e d g e 中开发的 4 8 。o i l 以r d fs c h e m a 为 起点,用更为丰富的o n t 0 1 0 9 y 建模原语对r d fs c h e i l a 进行扩充。o i l 将框架系统、描 述逻辑和w e b 标准( x m l 和r d f ) 这三个不同领域的优点结合起来,提供了一种通用的语 义w e b 的标记语言。其中,基于框架的语言在a i 中有很长的历史,它们的中心建模元 语是类( 称为框架) 和属性( 称为槽) 。描述逻辑( d l ) 通过概念( 对应于类或者框架) 和角色 ( 对应于槽) 描述知识,具有良好的语义和有效的推理。 o i l 的使用比较广泛,支持0 i l 的工具也很多,最著名的有o i l e d ,是一个基于0 i l 的本体编辑器。其他一些工具比如o n t o e d i t 、t h ef a c t ( f a s tc 1 a s s i f i c a t i o no f t e r m i n o l o g i e s ) s y s t e m 等也都支持o i l 。 ( 5 ) d a m l d a m l ( d a r p aa g e n tm a r k u pl a n g u a g e ) 是d a r p a 计划第一阶段所创建的一种语言 4 9 。d a r p a ( a g e n tm a r k u pl a n g u a g e ) 项目始于2 0 0 0 年8 月,由美国政府支持,目标 是开发一种语言和一组工具,为语义w e b 提供支持。m a r kg r e a v e s 是该项目的领导者。 d a m l 形成于d a m lo n t ( 一种本体语言) 和d a m l l o g i c ( 一种表达公理和规则的语言) 。 d a m l 扩展了r d f ,增加了更多更复杂的类、属性等定义。它一度很流行,成为网上 很多本体的描述语言,直到d a m l 的研究者和o i l 的研究者开始合作,推出了d a m l + 0 i l 语言,成为w 3 c 研究语义w e b 中本体描述语言o w l 的起点,并成为标准。 ( 6 ) o w l o w l ( w e b 本体语言,w e bo n t o l o g yl a n g u a g e ) 是w 3 c 推荐的本体描述语言的标准, 它是为了在w w w 上发布和共享本体而提供的语义标记语言 5 0 。o w l 是在d a m l + o i l 的基 础上发展起来的,作为r d f ( s ) 的扩展,目的是提供更多的元语以支持更加丰富的语义表 达,并更好的支持推理。o w l 提供大量的基于描述逻辑的语义原语来描述和构建各种本 河海大学硕士研究生论文 第二章知识库与本体研究综述 体,例如类型之间的不相交性( d i s j o i n t n e s s ) ,基数( c a r d i n a l i t y ) ,等价性,属性特 征( 如对称性s y m m e t r y ) ,以及枚举类型( e n u m e r a t e dc l a s s e s ) 等。o w l 相对x m l 、r d f 和r d fs c h e 腿拥有更多的机制来表达语义,从而o w l 超越了) 【m l 、r d f 和r d fs c h e m a 仅仅能够表达网上机器可读的文档内容的能力。针对不同的需求o w l 有三
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年舟山辅警协警招聘考试备考题库含答案详解(满分必刷)
- 2025年青岛辅警协警招聘考试备考题库含答案详解(培优)
- 2025年养羊销售合同范本
- 2025吨食品包装袋订购合同
- 2025年鄂尔多斯辅警招聘考试真题附答案详解(综合卷)
- 2025年西安辅警协警招聘考试备考题库含答案详解(新)
- 2025年铜仁辅警招聘考试题库及一套参考答案详解
- 2025年锡林郭勒盟辅警招聘考试真题及答案详解一套
- 2025年鄂尔多斯辅警协警招聘考试备考题库附答案详解(精练)
- 2025年石家庄辅警协警招聘考试真题含答案详解(考试直接用)
- 水文课件资料
- 数据安全介绍培训课件
- 《多元统计分析》(第6版) 课件 第3章 聚类分析
- 心理学视角下的人际冲突及沟通技巧指导分析和解决预案
- 高素质农民素养培训课件
- 开腹广泛全子宫切除课件
- 公司租海外仓库合同范本
- 攀枝花法院2025年公开招聘聘用制书记员(100人)笔试模拟试题及答案解析
- 长春工程学院《计算机网络》2024-2025学年第一学期期末试卷
- 医院甲乳外科专科介绍
- 医院院企合作模式探索与实践
评论
0/150
提交评论