(计算机科学与技术专业论文)本体知识库的封闭世界假设研究.pdf_第1页
(计算机科学与技术专业论文)本体知识库的封闭世界假设研究.pdf_第2页
(计算机科学与技术专业论文)本体知识库的封闭世界假设研究.pdf_第3页
(计算机科学与技术专业论文)本体知识库的封闭世界假设研究.pdf_第4页
(计算机科学与技术专业论文)本体知识库的封闭世界假设研究.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

(计算机科学与技术专业论文)本体知识库的封闭世界假设研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 提供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。 同意学校向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名: 碡歹 签字日期:切挥莎月尹日 翮繇础龋 期:冲等如尹 中图分类号:t p 3 0 1 2 u d c :0 0 4 4 学校代码:1 0 0 0 4 密级:公开 北京交通大学 硕士学位论文 本体知识库的封闭世界假设研究 r e s e a r c ho no n t o l o g i c a lk n o w l e d g e b a s e su s i n gc l o s e dw o r l da s s u m p t i o n 作者姓名:李罗 导师姓名:吴尽昭 学位类别:工学 学科专业:计算机科学与技术 学号:0 8 1 2 0 5 5 8 职称:教授 学位级别:硕士 研究方向:计算机软件与理论 北京交通大学 2 0 1 0 年6 月 致谢 本论文的工作是在我的导师吴尽昭教授的悉心指导下完成的,吴老师严谨的 治学态度和科学的工作方法给了我极大的帮助和影响,悉心指导我们完成了实验 室的科研工作,在学习上和生活上都给予了我很大的关心和帮助,对于我的科研 工作和论文都提出了许多的宝贵意见,在此衷心感谢两年来吴老师对我的关心和 指导,向吴老师表示衷心的谢意。 在实验室工作及撰写论文期间,尹景磊、杜晶等同学对我论文中的本体知识 库的构造和增广研究工作给予了热情帮助,在此向他们表达我的感激之情。 另外也感谢我的父母,他们的理解和支持使我能够在学校专心完成我的学业。 中文摘要 摘要:随着计算机科学和逻辑学的发展,出现了以描述逻辑为基础的本体模型的 概念和建立在此模型之上的本体知识库。知识库是在计算机科学中的数据库的启 发下诞生的,目的是把海量的知识以数据信息的方式储存于其中,完成知识查询 和知识推理的功能。知识推理是为了获取更多的知识,以便更好地完成查询的功 能,具备推理功能也是知识库与普通数据库的根本不同之处。对本体知识库进行 知识的推理扩展可以采用多种不同的方法和途径,是一个值得探讨的话题。考虑 到知识扩展对于人类社会发展的重要性,提供知识扩展的方法和探讨知识库的知 识推理过程无疑具有非常重要的意义。封闭世界假设作为谓词逻辑子句集进行增 广完备的一种方法,也是完全可以引入本体知识库进行知识信息的增广完备的。 本文将把封闭世界假设引入到本体知识库当中,通过实例演算,探讨知识增广的 算法步骤和实际过程,探究其可行性,并揭示其重要意义。把封闭世界假设引入 到本体知识库进行研究是一个全新的尝试,本文作为一个起点,实例规模不大, 主要在数学演算层面进行描述,希望为日后该领域的研究与发展提供参考。 关键词:描述逻辑;本体模型;本体知识库;t b o x ;a b o x ;封闭世界假设;增广; 否定文字 a b s t r a c t a b s t r a c t :a st h ed e v e l o p i n go ft h ec o m p u t e rs c i e n c ea n dt h el o g i c s ,t h ec o n c e p to f o n t o l o g i c a lm o d e lb a s e do nd e s c r i p t i o nl o g i c sa n dt h eo n t o l o g i c a lk n o w l e d g eb a s e s b a s e do nt h i sm o d e la p p e a r s t h ek n o w l e d g eb a s e s ,w h i c ha l ei n s p i r e db yt h ed a t a b a s e o ft h ec o m p u t e rs c i e n c e ,c a ns t o r ev a s ta m o u n t so fk n o w l e d g ea sd a t a , a n dh a v et h e a b i l i t i e so ff i n i s h i n gk n o w l e d g ei n q u i r i e sa n dd o i n gk n o w l e d g er e a s o n i n g k n o w l e d g e r e a s o n i n gi s f o rg a i n i n gm o r ek n o w l e d g ei no r d e rt ob e t t e rf u l f i l lt h ef u n c t i o n so f i n q u i r i e s ,t h ei n f e r e n c ea b i l i t yi st h em a i nd i f f e r e n c eb e t w e e nk n o w l e d g eb a s e sa n d d a t a b a s e s t h e r ea r em a n yd i f f e r e n tw a y sw h i c hc a nb eu s e do nt h ee x t e n s i o no f k n o w l e d g ei no n t o l o g i c a lk n o w l e d g eb a s e s ,a n dt h i s i sat o p i cw o r t he x p l o r i n g c o n s i d e r i n gt h ei m p o r t a n c eo ft h ek n o w l e d g ee x p a n s i o nf o rt h ed e v e l o p m e n to fh u m a n s o c i e t y , p r o v i d i n gm e t h o d s o fe x p a n d i n gk n o w l e d g ea n d e x p l o r i n g k n o w l e d g e r e a s o n i n gp r o c e s si su n d o u b t e d l yv e r yi m p o r t a n t c l o s e dw o r l da s s u m p t i o nu s e di n e x p a n d i n gt h ep r e d i c a t el o g i cc l a u s e sc a na l s ob et a k e ni n t ot h eo n t o l o g i c a lk n o w l e d g e b a s e st of i n i s ht h ek n o w l e d g ee x p a n s i o nt h e r e t h i sa r t i c l ew i l lt r yt od ot h i sj o b ,a n d o f f e rt h ea l g o r i t h ma n ds t e p so ft h ep r o c e s sb yc a l c u l a t i n ge x a m p l e s ,a n dr e v e a l si t s s i g n i f i c a n c e i n t r o d u c i n gt h ec l o s e dw o r l da s s u m p t i o ni n t ot h eo n t o l o g i c a lk n o w l e d g e b a s e si sa ne n t i r e l yn e w e x p e r i e n c e ,t h i sa r t i c l ep r o v i d e sas t a r t i n gp o i n t ,u s e so n l ys m a l l e x a m p l e s ,m a i n l yf o c u so nt h em a t h e m a t i c sl e v e l ,h o p e f u l l yi tc a nb eau s e f u lm a t e r i a l f o rf u t u r er e s e a r c h e sa n dd e v e l o p m e n ti nt h i sf i e l df o rr e f e r e n c e k e y w o r d s :d e s c r i p t i o nl o g i c s ;o n t o l o g i c a lm o d e l ;o n t o l o g i c a lk n o w l e d g eb a s e s ; t b o x ;a b o x ;c l o s e dw o r l da s s u m p t i o n ;e x p a n s i o n ;n a g e t i v eg r o u n da t o m 韭塞銮逼盔堂亟堂焦途塞目 丞 目录 中文摘要。i i i a b s t r a c t ji 、, 1 绪论:1 1 1知识描述1 1 2知识库l 1 3 描述逻辑简介一2 1 4研究目的2 1 5本文结构3 2 描述逻辑与本体知识库:_ 4 2 1描述逻辑。4 2 1 1 描述逻辑的理论发展:4 2 1 2 描述逻辑的基本体系5 2 1 3 描述语言6 2 1 4t b o x 介绍。j 7 2 1 5a b o x 介绍8 2 2本体模型与本体知识库1 1 2 2 1 本体1 l 2 2 2 本体模型概念1 2 2 2 3 本体模型的意义和本体知识库:1 2 3封闭世界假设方法:1 4 3 1 产生背景:1 4 3 1 1 单调谓词逻辑与归结推理1 4 3 1 2 非单调逻辑与两大实现原则1 4 3 2 封闭世界假设1 5 3 2 1 方法阐述15 3 2 2 特点16 3 2 3 使用范例1 6 3 2 4 一致性讨论18 3 2 5 特定谓词增广1 9 3 3 改进的封闭世界假设2 0 3 3 1 理论发展2 0 v 3 3 2g c w a 简j 态2 1 4本体知识库环境下的封闭世界假设2 2 4 1范围约定2 2 4 2代换定义。2 2 4 3增广一致性约束条件讨论j 2 5 4 4 增广一致性约束条件的证明2 7 4 5特别说明2 8 5本体知识库的封闭世界假设增广方法2 9 5 1参考范例2 9 5 2两步法求解增广集2 9 5 2 1 算法描述3 0 5 2 2 实例求解3 0 5 3一步法求解增广集4 0 5 3 1 算法描述4 0 5 3 2 实例求解4 l 5 4方法比较。4 6 6应用举例4 7 6 1问题描述4 7 6 2问题求解4 8 7 结论j 5 0 参考文献51 作者简历:5 2 独创性声明:5 3 学位论文数据集:5 4 1 绪论 1 1 知识描述 知识是人类文明赖以存在和发展的根本源动力,可以讲人类社会的一切发展 和创新成果都是靠人类对知识的不断获取获得的。从古至今,人类所掌握的知识 在不断地多样化、复杂化。人类对知识的掌握经历了和正在经历着从无到有、从 少量到大量以及从浅显到深刻的过程。 人类早期的时候,采用母语表述知识,互相传递知识,人类的自然语言就成 为了知识最早的也是最天然的载体。随后,人们建立了不同的学科,把知识分门 别类,在各个学科中为了简洁化和统一化创造了很多形式化的语言来描述知识, 比如在数学学科中利用约定的数学符号、变量和公式等表述数学知识。在近代, 数学这门科学获得高度发展,也使得形式化语言更加深入人心。终于,在它的启 迪之下诞生了逻辑学。逻辑学的诞生是形式化描述语言的一次巨大进步,不仅仅 是对知识描述的贡献,还为知识推理过程提供了巨大的工具支持。此后它经历了 从命题逻辑向一阶谓词逻辑并向高阶谓词逻辑、模态逻辑等等方面的逐步扩展, 为本文所涉及的本体知识库的理论基础即描述逻辑的产生铺平了道路。 进入二十世纪后,随着伟大的发明计算机的诞生,对知识的表述方式势必再 次会发生革命性的变化。 1 2 知识库 在冯诺依曼的计算机模型中存储器始终是计算机重要的一个组成部件。早期 的计算机就已经拥有了存储数据信息的能力。之后随着计算机上更高效地存储和 管理数据的工具数据库的诞生,把现实世界的超大规模知识形式化为计算机可识 别数据信息并存储于计算机之上的呼声和想法开始出现,最终导致了知识库的诞 生。 知识库诞生的需求还和另外一个新领域密切相关,就是人工智能。人工智能 是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的 - - i 新的技术科学。它是计算机科学的一个分支,它企图了解智能的实质,并生 产出一种新的能以人类智能相似的方式做出反应的智能机器。对人类智能的模拟 势必需要对知识认知和推理功能的模拟,而人工智能的一个重要研究领域专家系 统也和知识库有着诸多的关联与相似之处。 知识库是数据库技术高度发展和人工智能领域研究需求二者共同的产物,需 要注意的是一个理想的知识库不仅能通过对一切现存知识的表述和存储准确模拟 不断变化的现实世界,更能完成一定的知识推理和创造过程,显然知识库是基于 逻辑语言之上的。知识库的建立面临的第一个问题是如何对知识进行抽象化和数 字化,也就是如何将其描述为形式化语言并最终转化为存储数据的问题,针对这 个问题在此我们选择最切合知识库构建需求的逻辑学中一个新兴的分支,那就是 描述逻辑。 1 3 描述逻辑简介 描述逻辑【1 】( d e s c r i p t i o nl o g i c ) 是知识表示的一种形式化语言【2 1 。由于适合表 示关于概念和概念层次结构的知识,因此也可以叫做概念表示语言和术语逻辑。 描述逻辑给出一种形式化的、基于逻辑的语义,基本构件是概念、关系和个体。 概念描述了一个个体集合的共同属性,并且可将概念解释为对象集的一元谓词, 将关系解释为对象之间的二元关系【l 】。描述逻辑的特点在于,将大量的构造符作用 到简单概念上,从而可以建立更多复杂的概念。 描述逻辑将推理作为中心服务,即从知识库中显式包含的知识推导出隐含表 示的知识【3 】。它注重关键推理服务的可判定性,并且提供了可靠的、完备的推理算 法。其主要的推理有分类、可满足性问题、包含关系以及实例检测等。分类是对 一个基于包含关系的概念层次结构的计算,即判断一个术语表中不同概念之间的 包含关系。实例检测是判断一个个体是否是某个概念中的实例【4 】。 1 4 研究目的 本体模型是基于描述逻辑而提出的。它是一种非常实用的模型,非常适合于 对知识的描述和知识库的构建。用这种本体模型结构来建立的知识库称为本体知 识库。 本文的研究侧重点就是把一些好的逻辑世界中的方法引入到本体知识库的信 息推理和扩展任务之中,论证这些方法的可行性,提出这些方法在本体知识库任 务中的具体操作步骤,并对其进行完善和改进以加强实用性。我们选择的所引入 的方法就是1 9 7 8 年首次由r e i t e r 提出并在其后不断被完善的封闭世界假设【5 】 ( c l o s e dw o r l da s s u m p t i o n ) 。 2 j e塞 交通态堂亟堂焦i 金 塞 绪论 1 5 本文结构 在第二章内容中,将进一步对描述逻辑和本体知识库作出详细和全面的介绍; 第三章中,将介绍封闭世界假设和该方法在简单的命题逻辑上与一阶谓词逻辑上 的应用;第四章和第五章是论文核心内容,第四章把封闭世界假设方法引入本体 知识库,对涉及到的一系列问题做理论上的探讨和证明,第五章给出封闭世界假 设对本体知识库进行知识增广的具体实施步骤和算法,并利用它完成对一些特定 实例的求解;第六章会以第五章中提出的可行性方法进行具体应用方面的举例和 探讨;第七章是全文总结。 j e 塞交适太堂亟堂僮诠塞描述逻罄生奎佳翅迟崖 2 描述逻辑与本体知识库 2 1 描述逻辑 描述逻辑是基于对象的知识表示的形式化,它吸取了k l - o n e 的主要思想, 是一阶谓词逻辑的一个可判定子集 1 】。它与一阶谓词逻辑不同的是,描述逻辑系统 能提供可判定的推理服务。除了知识表示以外,描述逻辑还用在其它许多领域, 它被认为是以对象为中心的表示语言的最为重要的归一形式。描述逻辑的重要特 征是很强的表达能力和可判定性,它能保证推理算法总能停止,并返回正确的结 果。在众多知识表示的形式化方法中,描述逻辑在十多年来受到人们的特别关注 的主要原因在于:它们有清晰的模型理论机制;很适合于通过概念分类学来表示 应用领域;并提供了很多有用的推理服务。 2 1 1 描述逻辑的理论发展 描述逻辑最开始只是用来表示静态知识的。为了考虑在时间上的变化,或者 在一定动作下的变化,以及保持其语言的相对简单性,很自然地需要通过相应的 模态算子来扩展它,以保留其命题模态状态。众所周知,即使只是对简单的模态 系统的综合,也可能会导致很复杂的系统。s c h i l d ,s c h m i e d e l 等人最初所构造的 时序描述逻辑和认知逻辑要么就是因为表达能力太强而导致不可判定性,要么就 是太弱( 时态算子仅仅对公式或者概念是可用的) 。b a a d e r 和l a u x 则进行了折中, 将描述逻辑a l c 与多态k 相结合,允许将模态算子使用到公式和概念上,并证明 在扩展领域模型中的结果语言的满足性问题是可判定的。w o l t e r 等对具有模态算 子的描述逻辑进行了深入系统的调查分析,并证明在恒定的领域假设下多种认知 和时序描述逻辑是可判定的。他将将描述逻辑和命题动态逻辑p d l 相结合,提出 了动态描述逻辑。 为了对动作和规划能在统一的框架下进行表示和推理,a a r t a l e 和e f r a n c o n i ( 1 9 9 8 ) 提出了一个知识表示系统,用时间约束的方法将状态、动作和规划的表 示统一起来【6 】。为了能使该表示方法进行有效的推理和具有明确的语义,它又和描 述逻辑结合起来,从而形成了一个很好的知识表示方法。它具有以下优点:其一, 能用统一的方法表示状态、动作和规划,这一点与情景演算不同;其二,能进行 高效的推理,该框架下的可满足性问题和包含检测问题等都是多项式时间;其三, 4 有明确的语义;其四,能自动进行规划识别。 可满足性问题是描述逻辑推理中的核心问题,因为其它许多问题( 如包含检 测、一致性问题等) 都可化为可满足性问题。为了能用计算机自动判断描述逻辑 中可满足性问题,s c h m i d t - s c h a u b 和s m o l k a 首先建立了基于描述逻辑a l c 7 】的 t a b l e a u 算法,该算法能在多项式时间内判断描述逻辑a l c 概念的可满足性问题。 目前,t a b l e a u 算法已用于各种描述逻辑中( 如a l c n 、a l c q 等) ,并且t a b l e a u 算法也可用于判断实例检测等问题。现在主要研究各种描述逻辑中t a b l e a u 算法的 扩展、复杂性及优化策略等。 为了能让描述逻辑处理模态词,e b a a d e r 将模态操作引入描述逻辑。证明了该 描述逻辑公式的可满足性问题是可判定的。结合可能世界语义和可达关系,引入 时间依赖和信念等模态操作,提出了多维描述逻辑框架,该描述逻辑较好的刻画 了多主体系统模型。目前,主要研究工作集中在建立合理的模态公理及多维描述 逻辑。在描述逻辑中第一个整合时间的方法是由a s c h m i e d e l 提出来的。他使用了 两个时间运算符来扩展描述逻辑,提出了在时间段上受限的全称和存在量词。 s c h i l d 提出了一种简单的时序扩张,利用时态逻辑( t e n s e l o g i c ) 中在时间点“自从 s i n c e 和“直到 u n t i l 上的时序运算符来讨论a l c 逻辑。 2 1 2 描述逻辑的基本体系 图2 1 基于描述逻辑的知识表示系统架构 图2 1 清楚显示了基于描述逻辑所构建的知识表示系统的架构。这个知识表述 系统通常包含两个部分:t b o x 和a b o x i 。其中,t b o x 是有关概念和关系的蕴涵 断言集合,描述概念和关系的一般属性;a b o x 是有关个体的实例断言集合,断言 一个个体是某个概念的实例,或者两个个体之间存在某种关系【4 1 。 描述逻辑系统有四个基本的组成部分:用于概念和关系表达式中的构造算子 集合;容许在t b o x 中出现的公理类型;容许在a b o x 中出现的断言类型;在t b o x 和a b o x 上进行推理的推理机制4 1 。 , 2 1 3 描述语言 描述语言当中基本的描述包括了原子概念和原子角色,其中原子概念一般是 一个一元谓词,表示某对象是否满足一个概念,而原子角色一般是一个二元谓词, 表示两个对象是否成立一种关系。通过使用概念构造器,复杂描述可以在基本描 述的基础上归纳性地构建。不同的描述语言的区别在于它们所提供的基础构造器 不同,所谓基础构造器就是一系列的语法规则。在描述语言中,a l ( 定语) 语言 几乎是最为经典的一种描述语言,而且也是a l 语言族系中有使用价值的基础构造 器最为精简的语言。它的构造器如下: c ,d - a ti 上i 1 a cnd vr ci ( 原子概念) ( 全局概念) ( 底层概念) ( 原子否定) ( 交集) ( 值束缚) 了r t( 有限制存在变量) 规则中a 、c 、d 都表示原子概念,r 表示原子角色。在a l 语言中,全局概 念表示一个抽象的全集,底层概念表示一个抽象的空集,否定操作符只能用在原 子概念之前,允许在原子概念之间作交集,有类似于逻辑中的两个量词的操作符, 但存在量词只能用在全局概念关系上,所以称为有限制存在变量。 例如假设有p e r s o n 和m a l e 两个概念,而且都是原子概念,则p e r s o nom a l e 和1 m a l e 就是符合a l 语言规则的新概念。再比如h a s c h i l d 是一个原子角色,可 以使用概念p e r s o nojh a s c h i l d t 和p e r s o nnvh a s c h i l d f e m a l e 表示那些有一个孩 子的入,以及那些所有的孩子都是女孩的人。使用底层概念,也可以用p e r s o nn vh a s c h i l d 上描述那些没有孩子的人。 在a l 语言族系当中,比较经典的几种语言都是在a l 语言构造器的基础上适 当添加规则而形成的。 在保留a l 所有规则的情况下,如果添加一条新的规则:c u d ,就是允许概 念的合并构成一个新的概念,则构成了a l u 语言,意思是在a l 语言基础上添加 6 j 哀交道太堂亟堂僮途塞描述逻担皇查佳翅迟痊 了u 规则。如果添加j r c 规则,称为完全的存在变量,也称规则,则构成a l e 】 语言。同样地,数量限制规则m r ( 至少的限制) 和n r ( 至多的限制) 称为n 规则,非原子概念的否定规则 c ( 设c 不是一个原子概念) 称为c 规则。以上 所提出的四条规则和a l 原有规则集任意组合,可以构成多种语言,采纳以上所有 四条规则的a l 语言就是a l u n c 语言。 在后面的论述中,默认使用的是a l u 】 】 n c 】描述语言。 2 1 4t b o x 介绍 描述逻辑的t b o x 1 】是有关概念和关系的蕴含断言集合。描述逻辑的t b o x 由 所谓的术语( t e r m i n o l o g i e s ) 构成,术语包括蕴含( 或称包含) 和断言( 或称等价) 两种形式,运算符分别为“冬 和“三 。 在这里先不讨论包含关系。下面是一个由若干条断言术语构成的一个概念定 义表,也是一个小型化的t b o x 。 w o m a n 兰p e r s o nnf e m a l e m a n 兰p e r s o nnm a l e m a l e 三一f e m a l e m o t h e r 三w o m a nn 了h a s c h i l d p e r s o n f a t h e r 三m a nnjh a s c h i l d p e r s o n p a r e n t 三f a t h e r1 3m o t h e r w i f e 兰w o m a nnjh a s h u s b a n d m a n g r a n d m o t h e r 三m o t h e rn 了h a s c h i l d p a r e n t m o t h e r w i t h o u t s o n 兰m o t h e rnvh a s c h i l d m a n m o t h e r w i t h m a n y c h i l d r e n 三m o t h e rn 一3 h a s c h i l d 在这个定义表中,出现在断言符号左部的都是唯一的一个词汇,就是所谓新 提出的概念,右部是由若干原子概念、原子角色、其它的新提出概念以及描述语 言规则运算符组成,它们有机的组合构成了对左部概念的描述。定义的集合必须 是明确的,一个明确和有限的定义集合才能称为一个t b o x 。在t b o x 中,符号化 的名字不允许被多次定义,但定义是可能存在循环的。比如有样一条断言:h u m a n 兰a n i m a lnv h a s p a r e n t h u m a n ,即被描述概念的名字同时出现在了描述它的右部, 则构成一个循环定义,显然这个循环定义可以无限自代入分解下去而没有终点。 对于这种无终点扩展t b o x 称为不可定义的。 上面提到了代入分解断言式的情况,事实上这涉及到了t b o x 的一大特性,那 就是它的可扩展性。所谓扩展就是根据一个t b o x 中现有的定义情况作适当的代入 7 j 邕塞变通太堂亟堂焦i 佥塞描述逻担当奎佳翅迟廛 和变换,如果得到了一个新的定义集合,它符合t b o x 的要求,并且它的样子看上 去和原有t b o x 是不同的,于是就得到了一个t b o x 的扩展。一般情况下,在定义 集合中存在一定的循环定义和交错型可代入定义是t b o x 可扩展的先决条件。其中 交错型可代入定义是两条或两条以上的定义可以相互代入的情况,例如a 三b 和c 三d 中c 存在于b 的式子中的情况。所有的可扩展t b o x 和它的若干扩展t b o x 是 等价的。对于存在循环定义的t b o x ,一般它的扩展也是不唯一的,而且一般它和 它的扩展都可以称为是不可定义的。 如果不断地对一个可扩展t b o x 进行扩展,最终得到的一个多次扩展后的t b o x 中不存在循环定义,不存在交错可代入的情况,而且它的定义表中所有定义的右 部名词都是原子概念和原子角色,则t b o x 扩展到了终点,称这个最终的扩展t b o x 是原始t b o x 的最终扩展。在t b o x 的推理研究中,从一个原始t b o x 如何得到它 的最终扩展是其中非常重要的一个内容。 2 1 5a b o x 介绍 a b o x 1 】将是本文研究和探讨的主要内容。它在t b o x 的概念规则和现实世界 的对象中构筑桥梁,所以也相当于是对一个世界的描述。 设所用的对象集合为 m a r y ,p e t e r ,p a u l ,h a r r y ,下面的例子就是一个 微型的a b o x 的实例。 m o t h e r w i t h o u t d a u g h t e r ( m a r y ) f a t h e r ( p e t e r ) h a s c h i l d ( m a r y ,p e t e r ) h a s c h i l d ( p e t e r ,h a r r y ) h a s c h i l d ( m a r y ,p a u l ) 显然,从简单的角度看a b o x ,它只是一个拥有一元关系和二元关系的数据库 实例。但是实际上,它和数据库有着本质的不同。 在经典的数据库系统中,采用的是一个“封闭的语义世界 。也就是说数据 库中所有表项和条目中储存的数据都是明确可知的,要么是一个确定的数据,要 么用一个n u l l 值来表示该数据的无意义或不存在。这里的无意义或不存在是绝 对的和确定的,确定数据库一个位置的值无意义或不存在也相当于一种赋值行为。 而对于知识表示系统情况是截然不同的。 在t b o x 中提出x 条一元概念、y 条二元关系和给出一个全局所有对象实例的 集合( 假设有z 个) 之后,所有给定的概念、关系和对象实例之间如果进行映射 显然可以建立x x z + y z ( z 1 心个映射配对,而对于这么多种配对,在没有任何 j e 立交逼盍堂亟堂焦途塞撞述逻担曼奎佳翅迟廛 已有知识的情况下,每一种都存在肯定( “是 ) 和否定( “不是) 两种可能, 是不确定的。上例中的5 条规则相当于确定了其中5 条配对是肯定的。这5 条己 知的配对,构成了这个a b o x 当中已经具备的确定的知识。从这些已具备知识当中 或许可以进行推理,得到更多的关于其它配对以及这些配对以规定运算符组成的 命题式是肯定还是否定的答案,也就是获得新的知识,但总而言之,其中还有大 量无法确定的部分。这样的一个环境称为“开放的语义世界 。 所有未确定的知识都可以作肯定和否定两种解释,所有已知知识只能作相应 的肯定或否定其中一种解释。如果把所有解释有机结合在一起,把对全局的一个 完备的解释集称为一个模型,那么显然在一个封闭语义世界当中,模型是唯一的, 而在一个开放的语义世界当中,模型一定是多样的。在数据库当中的查询不是推 理,而只是对已知模型的一个模型检测,它的数据缺失表示确定的不知道或者无 意义,而知识表示系统中数据的缺失代表知识缺乏和未开发。 对于一个所有知识完全确定的环境只需要用数据库去表示它即可,这是因为 实际功能需求只是对它进行查询,而不是利用它来推理得到新的未知知识。而对 于知识表示系统,一定是应用在一个不能确定领域内所有知识的环境中,因为在 这样的环境中具备推理功能的知识表示系统或者知识库才有其存在的意义。对于 知识表示系统a b o x 部分,推理是其中一项重要内容和组成部分,也是本文所研究 的核心问题。 结合上述例子描述一下推理的过程。 从上面的例子中可以直观地得到一个新的知识,那就是m a r y 是一个祖母, 这个过程就是一个h b o x 上的推理过程,只不过主要步骤通过人脑完成了。这个推 理的过程可以这样理解:要确定的新知识是概念当中的g r a n d m o t h e r 和对象集当中 m a r y 之间的配对是肯定还是否定。在a b o x 现有的内容中,m a r y 有一个孩子 p e t e r ,而p e t e r 是一个f a t h e r ,根据t b o x 中g r m d m o 崎的概念,p a r e n t 是 f a t h e r 与m o t h e r 的并集,满足其一就是一个p a r e n t ,则p e t e r 是一个p a r e n t ,满 足有一个孩子并且这个孩子是个p a r e n t 就满足一个g r a n d m o t h e r 的概念,于是 m a r y 是满足的,我们把m a r y 是一个g r a i l d m o t h e r 这个新的肯定配对加入到了 a b o x 之中,作为已知知识。每当用推理或用其他渠道得到新的确定知识时,原来 一些成立的模型就被否定了,准确的说是其中的一半模型就被否定了。 下面的例子将加深对于a b o x 概念及其推理过程的理解。 h a s c h i l d ( i o k a s t e ,o e d 口u s ) h a s c h i l d ( i o k a s t e ,p o l y n e i k e s ) h a s c h i l d ( o e d i p u s ,p o l y n e i k e s ) h a s c h i l d ( p o l y n e i k e s ,t h e r s a n d r o s ) 9 k i l l e d h i s f a t h e r ( o e d i p u s ) - - , k i l l e d h i s f a t h e r ( t h e r s a n d r o s ) 已知o e d i p u s 本来是i o k a s t e 的孩子,但是他杀死了自己的父亲并与母亲 i o k a s t e 生下男孩p o l y n e i k e s ,p o l y n e i k e s 又生下男孩t h e r s a n d r o s , 但t h e r s a n d r o s 并没有像他的爷爷那样杀死自己的父亲。 现在需要根据上面a b o x 找出是否存在一个i o k a s t e 的儿子,他自己是杀父 者但他的孩子不是杀父者。 也许我们会主观地作出这样的判断:i o k a s t e 有两个儿子,一个是o e d i p u s , 他是个杀父者,另一个是p o l y n e i k e s ,他也是o e d i p u s 的儿子,由于没有任 何证据说明p o l y n e i k e s 是杀父者,所以o e d i p u s 不是我们要找的那个人,而 p o l y n e i k e s 呢? 他唯一的儿子已经确定不是一个杀父者,但他自己并不确定是 个杀父者,所以他也不是我们要找的。 上述判断中的缺陷是明显的,那就是我们主观的考虑并没有覆盖所有满足 a b o x 的模型。a b o x 中针对p o l y n e i k e s 是杀父者和不是杀父者存在两类模型, 显然我们在思考中总是忽略了其中的一类。 正确的判断应该是:当p o l y n e i k e s 不是一个杀父者的情况下,我们判断 o e d i p u s 就是要找的人,当p o l y n e i k e s 是一个杀父者的情况下,o e d i p u s 不 满足我们要找的人的条件,但p o l y n e i k e s 由于是i o k a s t e 的儿子,自己是杀 父者,自己唯一的儿子不是杀父者,正好满足了条件,此种情况下p o l y n e i k e s 是我们要找的人。也就是说在两类模型中可以判断出都存在我们要找的人,所以 “总是存在一个i o k a s t e 的儿子,他自己是杀父者但他的孩子不是杀父者 这个 命题总是肯定的。 对a b o x 进行推理和知识扩展,可以采用上面详细描述过的通过现有知识进行 推理的办法,也可以采用直接把假设加入到a b o x 中验证一致性的办法。需要特别 说明的是在第二种办法当中,如果经过逻辑验证在加入了新假设之后a b o x 变为不 一致,那么所加入的知识一定是错误的,可以把该假设的否定面作为确定无误的 知识加入a b o x 扩展知识,如果加入了假设之后仍然是一致的,则无法给出确定的 说法关于假设是否是确定知识,这是因为错误的知识也许和现有知识暂时也是不 存在矛盾的。 在实际的应用当中,a b o x 的推理和扩展是并用上面两种方法的,后面将要引 入的封闭世界假设方法,与这里所说的第二种知识扩展办法也是有着重要联系的。 1 0 2 2 本体模型与本体知识库 2 2 1 本体 首先来说说本体( o n t o l o g y ) 的概念。 本体的概念最初起源于哲学领域,可以追溯到公元前古希腊哲学家亚里士多 德( 3 8 4 3 2 2b c ) 。它在哲学中的定义为“对世界上客观存在物的系统地描述,即 存在论”,是客观存在的一个系统的解释或说明,关心的是客观现实的抽象本质。 总的来说就是关于存在及其规律的学说。 后来随着人工智能领域的诞生,哲学的本体概念被引入,特指对概念化的一 个显式的规格说吲8 】【9 】,并应用在智能体间的通信、异构信息源的集成【1 0 1 、语义 w e b t l l l 、信息检索 1 2 】以及知识系统的重用【1 3 】 1 4 】【1 5 1 等领域【1 6 1 。在人工智能界,最 早给出本体定义的是n e c h e s 等人,他们将o n t o l o g y 定义为“给出构成相关 领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇 外延的规则的定义”。n e c h e s 认为:“本体定义了组成主题领域的词汇表的基 本术语及其关系,以及结合这些术语和关系来定义词汇表外延的规则。 后来在信息系统、知识系统等领域,越来越多的人研究本体,并给出了 许多不同的定义。其中最著名并被引用得最为广泛的定义是由g r u b e r 提出的: “本体是概念化的明确的规范说明 ,和这个定义类似的有n g u a r i n oa n dp g i a r e t t a ( 1 9 9 5 ) “本体是概念化的明确的部分的说明或本体是一种逻辑语言 的模型 。 w n b o r s t 对该定义也进行了引申:“本体是共享的概念模型的形式化 的规范说明。 f e n s e l 对这个定义进行分析后认为本体的概念包括四个主要方面: 1 概念化( c o n c e p t u a l i z a t i o n ) :客观世界的现象的抽象模型; 2 明确( e x p l i c i t ) :概念及它们之间联系都被精确定义; 3 形式化( f o r m a l ) :精确的数学描述; 4 共享( s h a r e ) :本体中反映的知识是其使用者共同认可的。 其它的一些本体的定义、解释和说明还有“本体是一个为描述某个领域而按 继承关系组织起来作为一个知识库的骨架的一系列术语”、“本体是对一个特 定领域中重要概念的共享的形式化的描述 、“本体是对某个领域中的概念的 形式化的明确的表示,每个概念的特性描述了概念的各个方面及其约束的特 征和属性、“本体必需包括所使用术语的规范说明、决定这些术语含义的协 议、以及术语之间的联系,来表达概念 、“本体是以某一观点用详细明确的 词汇表描述实体、概念、特性和相关功能的理论 等。 2 2 2 本体模型概念 基于上述若干的观点和概念,特别是基于描述逻辑这种重要的形式化方法, 学术界提出了本体模型【1 6 】的概念和结构,且已获得广泛认同。本体模型以及它的 检验问题一直是人工智能领域的热点。在此给出本体模型的定义与结构。 本体模型的定义:给定术语构造符集,本体模型是一个4 元组,记作o = 。 解释一下这个概念,其中,t 是术语集,t 中的术语又被称为原子术语,包括 原子类术语c ( 简称原子类) 与原子属性术语p ( 简称原子属性)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论