（计算机科学与技术专业论文）本体知识库的封闭世界假设研究.pdf

上传人：扣*** IP属地：宁夏上传时间：2019-12-15 格式：PDF 页数：61 大小：2.30MB 积分：0 举报 版权申诉

已阅读5页，还剩56页未读，继续免费阅读

（计算机科学与技术专业论文）本体知识库的封闭世界假设研究.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

学位论文版权使用授权书本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索，提供阅览服务，并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名：碡歹签字日期：切挥莎月尹日翮繇础龋期：冲等如尹中图分类号：t p 3 0 1 2 u d c ：0 0 4 4 学校代码：1 0 0 0 4 密级：公开北京交通大学硕士学位论文本体知识库的封闭世界假设研究 r e s e a r c ho no n t o l o g i c a lk n o w l e d g e b a s e su s i n gc l o s e dw o r l da s s u m p t i o n 作者姓名：李罗导师姓名：吴尽昭学位类别：工学学科专业：计算机科学与技术学号：0 8 1 2 0 5 5 8 职称：教授学位级别：硕士研究方向：计算机软件与理论北京交通大学 2 0 1 0 年6 月致谢本论文的工作是在我的导师吴尽昭教授的悉心指导下完成的，吴老师严谨的治学态度和科学的工作方法给了我极大的帮助和影响，悉心指导我们完成了实验室的科研工作，在学习上和生活上都给予了我很大的关心和帮助，对于我的科研工作和论文都提出了许多的宝贵意见，在此衷心感谢两年来吴老师对我的关心和指导，向吴老师表示衷心的谢意。在实验室工作及撰写论文期间，尹景磊、杜晶等同学对我论文中的本体知识库的构造和增广研究工作给予了热情帮助，在此向他们表达我的感激之情。另外也感谢我的父母，他们的理解和支持使我能够在学校专心完成我的学业。中文摘要摘要：随着计算机科学和逻辑学的发展，出现了以描述逻辑为基础的本体模型的概念和建立在此模型之上的本体知识库。知识库是在计算机科学中的数据库的启发下诞生的，目的是把海量的知识以数据信息的方式储存于其中，完成知识查询和知识推理的功能。知识推理是为了获取更多的知识，以便更好地完成查询的功能，具备推理功能也是知识库与普通数据库的根本不同之处。对本体知识库进行知识的推理扩展可以采用多种不同的方法和途径，是一个值得探讨的话题。考虑到知识扩展对于人类社会发展的重要性，提供知识扩展的方法和探讨知识库的知识推理过程无疑具有非常重要的意义。封闭世界假设作为谓词逻辑子句集进行增广完备的一种方法，也是完全可以引入本体知识库进行知识信息的增广完备的。本文将把封闭世界假设引入到本体知识库当中，通过实例演算，探讨知识增广的算法步骤和实际过程，探究其可行性，并揭示其重要意义。把封闭世界假设引入到本体知识库进行研究是一个全新的尝试，本文作为一个起点，实例规模不大，主要在数学演算层面进行描述，希望为日后该领域的研究与发展提供参考。关键词：描述逻辑；本体模型；本体知识库；t b o x ；a b o x ；封闭世界假设；增广；否定文字 a b s t r a c t a b s t r a c t ：a st h ed e v e l o p i n go ft h ec o m p u t e rs c i e n c ea n dt h el o g i c s ，t h ec o n c e p to f o n t o l o g i c a lm o d e lb a s e do nd e s c r i p t i o nl o g i c sa n dt h eo n t o l o g i c a lk n o w l e d g eb a s e s b a s e do nt h i sm o d e la p p e a r s t h ek n o w l e d g eb a s e s ，w h i c ha l ei n s p i r e db yt h ed a t a b a s e o ft h ec o m p u t e rs c i e n c e ，c a ns t o r ev a s ta m o u n t so fk n o w l e d g ea sd a t a , a n dh a v et h e a b i l i t i e so ff i n i s h i n gk n o w l e d g ei n q u i r i e sa n dd o i n gk n o w l e d g er e a s o n i n g k n o w l e d g e r e a s o n i n gi s f o rg a i n i n gm o r ek n o w l e d g ei no r d e rt ob e t t e rf u l f i l lt h ef u n c t i o n so f i n q u i r i e s ，t h ei n f e r e n c ea b i l i t yi st h em a i nd i f f e r e n c eb e t w e e nk n o w l e d g eb a s e sa n d d a t a b a s e s t h e r ea r em a n yd i f f e r e n tw a y sw h i c hc a nb eu s e do nt h ee x t e n s i o no f k n o w l e d g ei no n t o l o g i c a lk n o w l e d g eb a s e s ，a n dt h i s i sat o p i cw o r t he x p l o r i n g c o n s i d e r i n gt h ei m p o r t a n c eo ft h ek n o w l e d g ee x p a n s i o nf o rt h ed e v e l o p m e n to fh u m a n s o c i e t y , p r o v i d i n gm e t h o d s o fe x p a n d i n gk n o w l e d g ea n d e x p l o r i n g k n o w l e d g e r e a s o n i n gp r o c e s si su n d o u b t e d l yv e r yi m p o r t a n t c l o s e dw o r l da s s u m p t i o nu s e di n e x p a n d i n gt h ep r e d i c a t el o g i cc l a u s e sc a na l s ob et a k e ni n t ot h eo n t o l o g i c a lk n o w l e d g e b a s e st of i n i s ht h ek n o w l e d g ee x p a n s i o nt h e r e t h i sa r t i c l ew i l lt r yt od ot h i sj o b ，a n d o f f e rt h ea l g o r i t h ma n ds t e p so ft h ep r o c e s sb yc a l c u l a t i n ge x a m p l e s ，a n dr e v e a l si t s s i g n i f i c a n c e i n t r o d u c i n gt h ec l o s e dw o r l da s s u m p t i o ni n t ot h eo n t o l o g i c a lk n o w l e d g e b a s e si sa ne n t i r e l yn e w e x p e r i e n c e ，t h i sa r t i c l ep r o v i d e sas t a r t i n gp o i n t ，u s e so n l ys m a l l e x a m p l e s ，m a i n l yf o c u so nt h em a t h e m a t i c sl e v e l ，h o p e f u l l yi tc a nb eau s e f u lm a t e r i a l f o rf u t u r er e s e a r c h e sa n dd e v e l o p m e n ti nt h i sf i e l df o rr e f e r e n c e k e y w o r d s ：d e s c r i p t i o nl o g i c s ；o n t o l o g i c a lm o d e l ；o n t o l o g i c a lk n o w l e d g eb a s e s ； t b o x ；a b o x ；c l o s e dw o r l da s s u m p t i o n ；e x p a n s i o n ；n a g e t i v eg r o u n da t o m 韭塞銮逼盔堂亟堂焦途塞目丞目录中文摘要。i i i a b s t r a c t ji 、， 1 绪论：1 1 1知识描述1 1 2知识库l 1 3 描述逻辑简介一2 1 4研究目的2 1 5本文结构3 2 描述逻辑与本体知识库：_ 4 2 1描述逻辑。4 2 1 1 描述逻辑的理论发展：4 2 1 2 描述逻辑的基本体系5 2 1 3 描述语言6 2 1 4t b o x 介绍。j 7 2 1 5a b o x 介绍8 2 2本体模型与本体知识库1 1 2 2 1 本体1 l 2 2 2 本体模型概念1 2 2 2 3 本体模型的意义和本体知识库：1 2 3封闭世界假设方法：1 4 3 1 产生背景：1 4 3 1 1 单调谓词逻辑与归结推理1 4 3 1 2 非单调逻辑与两大实现原则1 4 3 2 封闭世界假设1 5 3 2 1 方法阐述15 3 2 2 特点16 3 2 3 使用范例1 6 3 2 4 一致性讨论18 3 2 5 特定谓词增广1 9 3 3 改进的封闭世界假设2 0 3 3 1 理论发展2 0 v 3 3 2g c w a 简j 态2 1 4本体知识库环境下的封闭世界假设2 2 4 1范围约定2 2 4 2代换定义。2 2 4 3增广一致性约束条件讨论j 2 5 4 4 增广一致性约束条件的证明2 7 4 5特别说明2 8 5本体知识库的封闭世界假设增广方法2 9 5 1参考范例2 9 5 2两步法求解增广集2 9 5 2 1 算法描述3 0 5 2 2 实例求解3 0 5 3一步法求解增广集4 0 5 3 1 算法描述4 0 5 3 2 实例求解4 l 5 4方法比较。4 6 6应用举例4 7 6 1问题描述4 7 6 2问题求解4 8 7 结论j 5 0 参考文献51 作者简历：5 2 独创性声明：5 3 学位论文数据集：5 4 1 绪论 1 1 知识描述知识是人类文明赖以存在和发展的根本源动力，可以讲人类社会的一切发展和创新成果都是靠人类对知识的不断获取获得的。从古至今，人类所掌握的知识在不断地多样化、复杂化。人类对知识的掌握经历了和正在经历着从无到有、从少量到大量以及从浅显到深刻的过程。人类早期的时候，采用母语表述知识，互相传递知识，人类的自然语言就成为了知识最早的也是最天然的载体。随后，人们建立了不同的学科，把知识分门别类，在各个学科中为了简洁化和统一化创造了很多形式化的语言来描述知识，比如在数学学科中利用约定的数学符号、变量和公式等表述数学知识。在近代，数学这门科学获得高度发展，也使得形式化语言更加深入人心。终于，在它的启迪之下诞生了逻辑学。逻辑学的诞生是形式化描述语言的一次巨大进步，不仅仅是对知识描述的贡献，还为知识推理过程提供了巨大的工具支持。此后它经历了从命题逻辑向一阶谓词逻辑并向高阶谓词逻辑、模态逻辑等等方面的逐步扩展，为本文所涉及的本体知识库的理论基础即描述逻辑的产生铺平了道路。进入二十世纪后，随着伟大的发明计算机的诞生，对知识的表述方式势必再次会发生革命性的变化。 1 2 知识库在冯诺依曼的计算机模型中存储器始终是计算机重要的一个组成部件。早期的计算机就已经拥有了存储数据信息的能力。之后随着计算机上更高效地存储和管理数据的工具数据库的诞生，把现实世界的超大规模知识形式化为计算机可识别数据信息并存储于计算机之上的呼声和想法开始出现，最终导致了知识库的诞生。知识库诞生的需求还和另外一个新领域密切相关，就是人工智能。人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的 - - i 新的技术科学。它是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。对人类智能的模拟势必需要对知识认知和推理功能的模拟，而人工智能的一个重要研究领域专家系统也和知识库有着诸多的关联与相似之处。知识库是数据库技术高度发展和人工智能领域研究需求二者共同的产物，需要注意的是一个理想的知识库不仅能通过对一切现存知识的表述和存储准确模拟不断变化的现实世界，更能完成一定的知识推理和创造过程，显然知识库是基于逻辑语言之上的。知识库的建立面临的第一个问题是如何对知识进行抽象化和数字化，也就是如何将其描述为形式化语言并最终转化为存储数据的问题，针对这个问题在此我们选择最切合知识库构建需求的逻辑学中一个新兴的分支，那就是描述逻辑。 1 3 描述逻辑简介描述逻辑【1 】( d e s c r i p t i o nl o g i c ) 是知识表示的一种形式化语言【2 1 。由于适合表示关于概念和概念层次结构的知识，因此也可以叫做概念表示语言和术语逻辑。描述逻辑给出一种形式化的、基于逻辑的语义，基本构件是概念、关系和个体。概念描述了一个个体集合的共同属性，并且可将概念解释为对象集的一元谓词，将关系解释为对象之间的二元关系【l 】。描述逻辑的特点在于，将大量的构造符作用到简单概念上，从而可以建立更多复杂的概念。描述逻辑将推理作为中心服务，即从知识库中显式包含的知识推导出隐含表示的知识【3 】。它注重关键推理服务的可判定性，并且提供了可靠的、完备的推理算法。其主要的推理有分类、可满足性问题、包含关系以及实例检测等。分类是对一个基于包含关系的概念层次结构的计算，即判断一个术语表中不同概念之间的包含关系。实例检测是判断一个个体是否是某个概念中的实例【4 】。 1 4 研究目的本体模型是基于描述逻辑而提出的。它是一种非常实用的模型，非常适合于对知识的描述和知识库的构建。用这种本体模型结构来建立的知识库称为本体知识库。本文的研究侧重点就是把一些好的逻辑世界中的方法引入到本体知识库的信息推理和扩展任务之中，论证这些方法的可行性，提出这些方法在本体知识库任务中的具体操作步骤，并对其进行完善和改进以加强实用性。我们选择的所引入的方法就是1 9 7 8 年首次由r e i t e r 提出并在其后不断被完善的封闭世界假设【5 】 ( c l o s e dw o r l da s s u m p t i o n ) 。 2 j e塞交通态堂亟堂焦i 金塞绪论 1 5 本文结构在第二章内容中，将进一步对描述逻辑和本体知识库作出详细和全面的介绍；第三章中，将介绍封闭世界假设和该方法在简单的命题逻辑上与一阶谓词逻辑上的应用；第四章和第五章是论文核心内容，第四章把封闭世界假设方法引入本体知识库，对涉及到的一系列问题做理论上的探讨和证明，第五章给出封闭世界假设对本体知识库进行知识增广的具体实施步骤和算法，并利用它完成对一些特定实例的求解；第六章会以第五章中提出的可行性方法进行具体应用方面的举例和探讨；第七章是全文总结。 j e 塞交适太堂亟堂僮诠塞描述逻罄生奎佳翅迟崖 2 描述逻辑与本体知识库 2 1 描述逻辑描述逻辑是基于对象的知识表示的形式化，它吸取了k l - o n e 的主要思想，是一阶谓词逻辑的一个可判定子集 1 】。它与一阶谓词逻辑不同的是，描述逻辑系统能提供可判定的推理服务。除了知识表示以外，描述逻辑还用在其它许多领域，它被认为是以对象为中心的表示语言的最为重要的归一形式。描述逻辑的重要特征是很强的表达能力和可判定性，它能保证推理算法总能停止，并返回正确的结果。在众多知识表示的形式化方法中，描述逻辑在十多年来受到人们的特别关注的主要原因在于：它们有清晰的模型理论机制；很适合于通过概念分类学来表示应用领域；并提供了很多有用的推理服务。 2 1 1 描述逻辑的理论发展描述逻辑最开始只是用来表示静态知识的。为了考虑在时间上的变化，或者在一定动作下的变化，以及保持其语言的相对简单性，很自然地需要通过相应的模态算子来扩展它，以保留其命题模态状态。众所周知，即使只是对简单的模态系统的综合，也可能会导致很复杂的系统。s c h i l d ，s c h m i e d e l 等人最初所构造的时序描述逻辑和认知逻辑要么就是因为表达能力太强而导致不可判定性，要么就是太弱( 时态算子仅仅对公式或者概念是可用的) 。b a a d e r 和l a u x 则进行了折中，将描述逻辑a l c 与多态k 相结合，允许将模态算子使用到公式和概念上，并证明在扩展领域模型中的结果语言的满足性问题是可判定的。w o l t e r 等对具有模态算子的描述逻辑进行了深入系统的调查分析，并证明在恒定的领域假设下多种认知和时序描述逻辑是可判定的。他将将描述逻辑和命题动态逻辑p d l 相结合，提出了动态描述逻辑。为了对动作和规划能在统一的框架下进行表示和推理，a a r t a l e 和e f r a n c o n i ( 1 9 9 8 ) 提出了一个知识表示系统，用时间约束的方法将状态、动作和规划的表示统一起来【6 】。为了能使该表示方法进行有效的推理和具有明确的语义，它又和描述逻辑结合起来，从而形成了一个很好的知识表示方法。它具有以下优点：其一，能用统一的方法表示状态、动作和规划，这一点与情景演算不同；其二，能进行高效的推理，该框架下的可满足性问题和包含检测问题等都是多项式时间；其三， 4 有明确的语义；其四，能自动进行规划识别。可满足性问题是描述逻辑推理中的核心问题，因为其它许多问题( 如包含检测、一致性问题等) 都可化为可满足性问题。为了能用计算机自动判断描述逻辑中可满足性问题，s c h m i d t - s c h a u b 和s m o l k a 首先建立了基于描述逻辑a l c 7 】的 t a b l e a u 算法，该算法能在多项式时间内判断描述逻辑a l c 概念的可满足性问题。目前，t a b l e a u 算法已用于各种描述逻辑中( 如a l c n 、a l c q 等) ，并且t a b l e a u 算法也可用于判断实例检测等问题。现在主要研究各种描述逻辑中t a b l e a u 算法的扩展、复杂性及优化策略等。为了能让描述逻辑处理模态词，e b a a d e r 将模态操作引入描述逻辑。证明了该描述逻辑公式的可满足性问题是可判定的。结合可能世界语义和可达关系，引入时间依赖和信念等模态操作，提出了多维描述逻辑框架，该描述逻辑较好的刻画了多主体系统模型。目前，主要研究工作集中在建立合理的模态公理及多维描述逻辑。在描述逻辑中第一个整合时间的方法是由a s c h m i e d e l 提出来的。他使用了两个时间运算符来扩展描述逻辑，提出了在时间段上受限的全称和存在量词。 s c h i l d 提出了一种简单的时序扩张，利用时态逻辑( t e n s e l o g i c ) 中在时间点“自从 s i n c e 和“直到 u n t i l 上的时序运算符来讨论a l c 逻辑。 2 1 2 描述逻辑的基本体系图2 1 基于描述逻辑的知识表示系统架构图2 1 清楚显示了基于描述逻辑所构建的知识表示系统的架构。这个知识表述系统通常包含两个部分：t b o x 和a b o x i 。其中，t b o x 是有关概念和关系的蕴涵断言集合，描述概念和关系的一般属性；a b o x 是有关个体的实例断言集合，断言一个个体是某个概念的实例，或者两个个体之间存在某种关系【4 1 。描述逻辑系统有四个基本的组成部分：用于概念和关系表达式中的构造算子集合；容许在t b o x 中出现的公理类型；容许在a b o x 中出现的断言类型；在t b o x 和a b o x 上进行推理的推理机制4 1 。， 2 1 3 描述语言描述语言当中基本的描述包括了原子概念和原子角色，其中原子概念一般是一个一元谓词，表示某对象是否满足一个概念，而原子角色一般是一个二元谓词，表示两个对象是否成立一种关系。通过使用概念构造器，复杂描述可以在基本描述的基础上归纳性地构建。不同的描述语言的区别在于它们所提供的基础构造器不同，所谓基础构造器就是一系列的语法规则。在描述语言中，a l ( 定语) 语言几乎是最为经典的一种描述语言，而且也是a l 语言族系中有使用价值的基础构造器最为精简的语言。它的构造器如下： c ，d - a ti 上i 1 a cnd vr ci ( 原子概念) ( 全局概念) ( 底层概念) ( 原子否定) ( 交集) ( 值束缚) 了r t( 有限制存在变量) 规则中a 、c 、d 都表示原子概念，r 表示原子角色。在a l 语言中，全局概念表示一个抽象的全集，底层概念表示一个抽象的空集，否定操作符只能用在原子概念之前，允许在原子概念之间作交集，有类似于逻辑中的两个量词的操作符，但存在量词只能用在全局概念关系上，所以称为有限制存在变量。例如假设有p e r s o n 和m a l e 两个概念，而且都是原子概念，则p e r s o nom a l e 和1 m a l e 就是符合a l 语言规则的新概念。再比如h a s c h i l d 是一个原子角色，可以使用概念p e r s o nojh a s c h i l d t 和p e r s o nnvh a s c h i l d f e m a l e 表示那些有一个孩子的入，以及那些所有的孩子都是女孩的人。使用底层概念，也可以用p e r s o nn vh a s c h i l d 上描述那些没有孩子的人。在a l 语言族系当中，比较经典的几种语言都是在a l 语言构造器的基础上适当添加规则而形成的。在保留a l 所有规则的情况下，如果添加一条新的规则：c u d ，就是允许概念的合并构成一个新的概念，则构成了a l u 语言，意思是在a l 语言基础上添加 6 j 哀交道太堂亟堂僮途塞描述逻担皇查佳翅迟痊了u 规则。如果添加j r c 规则，称为完全的存在变量，也称规则，则构成a l e 】语言。同样地，数量限制规则m r ( 至少的限制) 和n r ( 至多的限制) 称为n 规则，非原子概念的否定规则 c ( 设c 不是一个原子概念) 称为c 规则。以上所提出的四条规则和a l 原有规则集任意组合，可以构成多种语言，采纳以上所有四条规则的a l 语言就是a l u n c 语言。在后面的论述中，默认使用的是a l u 】】 n c 】描述语言。 2 1 4t b o x 介绍描述逻辑的t b o x 1 】是有关概念和关系的蕴含断言集合。描述逻辑的t b o x 由所谓的术语( t e r m i n o l o g i e s ) 构成，术语包括蕴含( 或称包含) 和断言( 或称等价) 两种形式，运算符分别为“冬和“三。在这里先不讨论包含关系。下面是一个由若干条断言术语构成的一个概念定义表，也是一个小型化的t b o x 。 w o m a n 兰p e r s o nnf e m a l e m a n 兰p e r s o nnm a l e m a l e 三一f e m a l e m o t h e r 三w o m a nn 了h a s c h i l d p e r s o n f a t h e r 三m a nnjh a s c h i l d p e r s o n p a r e n t 三f a t h e r1 3m o t h e r w i f e 兰w o m a nnjh a s h u s b a n d m a n g r a n d m o t h e r 三m o t h e rn 了h a s c h i l d p a r e n t m o t h e r w i t h o u t s o n 兰m o t h e rnvh a s c h i l d m a n m o t h e r w i t h m a n y c h i l d r e n 三m o t h e rn 一3 h a s c h i l d 在这个定义表中，出现在断言符号左部的都是唯一的一个词汇，就是所谓新提出的概念，右部是由若干原子概念、原子角色、其它的新提出概念以及描述语言规则运算符组成，它们有机的组合构成了对左部概念的描述。定义的集合必须是明确的，一个明确和有限的定义集合才能称为一个t b o x 。在t b o x 中，符号化的名字不允许被多次定义，但定义是可能存在循环的。比如有样一条断言：h u m a n 兰a n i m a lnv h a s p a r e n t h u m a n ，即被描述概念的名字同时出现在了描述它的右部，则构成一个循环定义，显然这个循环定义可以无限自代入分解下去而没有终点。对于这种无终点扩展t b o x 称为不可定义的。上面提到了代入分解断言式的情况，事实上这涉及到了t b o x 的一大特性，那就是它的可扩展性。所谓扩展就是根据一个t b o x 中现有的定义情况作适当的代入 7 j 邕塞变通太堂亟堂焦i 佥塞描述逻担当奎佳翅迟廛和变换，如果得到了一个新的定义集合，它符合t b o x 的要求，并且它的样子看上去和原有t b o x 是不同的，于是就得到了一个t b o x 的扩展。一般情况下，在定义集合中存在一定的循环定义和交错型可代入定义是t b o x 可扩展的先决条件。其中交错型可代入定义是两条或两条以上的定义可以相互代入的情况，例如a 三b 和c 三d 中c 存在于b 的式子中的情况。所有的可扩展t b o x 和它的若干扩展t b o x 是等价的。对于存在循环定义的t b o x ，一般它的扩展也是不唯一的，而且一般它和它的扩展都可以称为是不可定义的。如果不断地对一个可扩展t b o x 进行扩展，最终得到的一个多次扩展后的t b o x 中不存在循环定义，不存在交错可代入的情况，而且它的定义表中所有定义的右部名词都是原子概念和原子角色，则t b o x 扩展到了终点，称这个最终的扩展t b o x 是原始t b o x 的最终扩展。在t b o x 的推理研究中，从一个原始t b o x 如何得到它的最终扩展是其中非常重要的一个内容。 2 1 5a b o x 介绍 a b o x 1 】将是本文研究和探讨的主要内容。它在t b o x 的概念规则和现实世界的对象中构筑桥梁，所以也相当于是对一个世界的描述。设所用的对象集合为 m a r y ，p e t e r ，p a u l ，h a r r y ，下面的例子就是一个微型的a b o x 的实例。 m o t h e r w i t h o u t d a u g h t e r ( m a r y ) f a t h e r ( p e t e r ) h a s c h i l d ( m a r y ，p e t e r ) h a s c h i l d ( p e t e r ，h a r r y ) h a s c h i l d ( m a r y ，p a u l ) 显然，从简单的角度看a b o x ，它只是一个拥有一元关系和二元关系的数据库实例。但是实际上，它和数据库有着本质的不同。在经典的数据库系统中，采用的是一个“封闭的语义世界。也就是说数据库中所有表项和条目中储存的数据都是明确可知的，要么是一个确定的数据，要么用一个n u l l 值来表示该数据的无意义或不存在。这里的无意义或不存在是绝对的和确定的，确定数据库一个位置的值无意义或不存在也相当于一种赋值行为。而对于知识表示系统情况是截然不同的。在t b o x 中提出x 条一元概念、y 条二元关系和给出一个全局所有对象实例的集合( 假设有z 个) 之后，所有给定的概念、关系和对象实例之间如果进行映射显然可以建立x x z + y z ( z 1 心个映射配对，而对于这么多种配对，在没有任何 j e 立交逼盍堂亟堂焦途塞撞述逻担曼奎佳翅迟廛已有知识的情况下，每一种都存在肯定( “是 ) 和否定( “不是) 两种可能，是不确定的。上例中的5 条规则相当于确定了其中5 条配对是肯定的。这5 条己知的配对，构成了这个a b o x 当中已经具备的确定的知识。从这些已具备知识当中或许可以进行推理，得到更多的关于其它配对以及这些配对以规定运算符组成的命题式是肯定还是否定的答案，也就是获得新的知识，但总而言之，其中还有大量无法确定的部分。这样的一个环境称为“开放的语义世界。所有未确定的知识都可以作肯定和否定两种解释，所有已知知识只能作相应的肯定或否定其中一种解释。如果把所有解释有机结合在一起，把对全局的一个完备的解释集称为一个模型，那么显然在一个封闭语义世界当中，模型是唯一的，而在一个开放的语义世界当中，模型一定是多样的。在数据库当中的查询不是推理，而只是对已知模型的一个模型检测，它的数据缺失表示确定的不知道或者无意义，而知识表示系统中数据的缺失代表知识缺乏和未开发。对于一个所有知识完全确定的环境只需要用数据库去表示它即可，这是因为实际功能需求只是对它进行查询，而不是利用它来推理得到新的未知知识。而对于知识表示系统，一定是应用在一个不能确定领域内所有知识的环境中，因为在这样的环境中具备推理功能的知识表示系统或者知识库才有其存在的意义。对于知识表示系统a b o x 部分，推理是其中一项重要内容和组成部分，也是本文所研究的核心问题。结合上述例子描述一下推理的过程。从上面的例子中可以直观地得到一个新的知识，那就是m a r y 是一个祖母，这个过程就是一个h b o x 上的推理过程，只不过主要步骤通过人脑完成了。这个推理的过程可以这样理解：要确定的新知识是概念当中的g r a n d m o t h e r 和对象集当中 m a r y 之间的配对是肯定还是否定。在a b o x 现有的内容中，m a r y 有一个孩子 p e t e r ，而p e t e r 是一个f a t h e r ，根据t b o x 中g r m d m o 崎的概念，p a r e n t 是 f a t h e r 与m o t h e r 的并集，满足其一就是一个p a r e n t ，则p e t e r 是一个p a r e n t ，满足有一个孩子并且这个孩子是个p a r e n t 就满足一个g r a n d m o t h e r 的概念，于是 m a r y 是满足的，我们把m a r y 是一个g r a i l d m o t h e r 这个新的肯定配对加入到了 a b o x 之中，作为已知知识。每当用推理或用其他渠道得到新的确定知识时，原来一些成立的模型就被否定了，准确的说是其中的一半模型就被否定了。下面的例子将加深对于a b o x 概念及其推理过程的理解。 h a s c h i l d ( i o k a s t e ，o e d 口u s ) h a s c h i l d ( i o k a s t e ，p o l y n e i k e s ) h a s c h i l d ( o e d i p u s ，p o l y n e i k e s ) h a s c h i l d ( p o l y n e i k e s ，t h e r s a n d r o s ) 9 k i l l e d h i s f a t h e r ( o e d i p u s ) - - , k i l l e d h i s f a t h e r ( t h e r s a n d r o s ) 已知o e d i p u s 本来是i o k a s t e 的孩子，但是他杀死了自己的父亲并与母亲 i o k a s t e 生下男孩p o l y n e i k e s ，p o l y n e i k e s 又生下男孩t h e r s a n d r o s ，但t h e r s a n d r o s 并没有像他的爷爷那样杀死自己的父亲。现在需要根据上面a b o x 找出是否存在一个i o k a s t e 的儿子，他自己是杀父者但他的孩子不是杀父者。也许我们会主观地作出这样的判断：i o k a s t e 有两个儿子，一个是o e d i p u s ，他是个杀父者，另一个是p o l y n e i k e s ，他也是o e d i p u s 的儿子，由于没有任何证据说明p o l y n e i k e s 是杀父者，所以o e d i p u s 不是我们要找的那个人，而 p o l y n e i k e s 呢? 他唯一的儿子已经确定不是一个杀父者，但他自己并不确定是个杀父者，所以他也不是我们要找的。上述判断中的缺陷是明显的，那就是我们主观的考虑并没有覆盖所有满足 a b o x 的模型。a b o x 中针对p o l y n e i k e s 是杀父者和不是杀父者存在两类模型，显然我们在思考中总是忽略了其中的一类。正确的判断应该是：当p o l y n e i k e s 不是一个杀父者的情况下，我们判断 o e d i p u s 就是要找的人，当p o l y n e i k e s 是一个杀父者的情况下，o e d i p u s 不满足我们要找的人的条件，但p o l y n e i k e s 由于是i o k a s t e 的儿子，自己是杀父者，自己唯一的儿子不是杀父者，正好满足了条件，此种情况下p o l y n e i k e s 是我们要找的人。也就是说在两类模型中可以判断出都存在我们要找的人，所以 “总是存在一个i o k a s t e 的儿子，他自己是杀父者但他的孩子不是杀父者这个命题总是肯定的。对a b o x 进行推理和知识扩展，可以采用上面详细描述过的通过现有知识进行推理的办法，也可以采用直接把假设加入到a b o x 中验证一致性的办法。需要特别说明的是在第二种办法当中，如果经过逻辑验证在加入了新假设之后a b o x 变为不一致，那么所加入的知识一定是错误的，可以把该假设的否定面作为确定无误的知识加入a b o x 扩展知识，如果加入了假设之后仍然是一致的，则无法给出确定的说法关于假设是否是确定知识，这是因为错误的知识也许和现有知识暂时也是不存在矛盾的。在实际的应用当中，a b o x 的推理和扩展是并用上面两种方法的，后面将要引入的封闭世界假设方法，与这里所说的第二种知识扩展办法也是有着重要联系的。 1 0 2 2 本体模型与本体知识库 2 2 1 本体首先来说说本体( o n t o l o g y ) 的概念。本体的概念最初起源于哲学领域，可以追溯到公元前古希腊哲学家亚里士多德( 3 8 4 3 2 2b c ) 。它在哲学中的定义为“对世界上客观存在物的系统地描述，即存在论”，是客观存在的一个系统的解释或说明，关心的是客观现实的抽象本质。总的来说就是关于存在及其规律的学说。后来随着人工智能领域的诞生，哲学的本体概念被引入，特指对概念化的一个显式的规格说吲8 】【9 】，并应用在智能体间的通信、异构信息源的集成【1 0 1 、语义 w e b t l l l 、信息检索 1 2 】以及知识系统的重用【1 3 】 1 4 】【1 5 1 等领域【1 6 1 。在人工智能界，最早给出本体定义的是n e c h e s 等人，他们将o n t o l o g y 定义为“给出构成相关领域词汇的基本术语和关系，以及利用这些术语和关系构成的规定这些词汇外延的规则的定义”。n e c h e s 认为：“本体定义了组成主题领域的词汇表的基本术语及其关系，以及结合这些术语和关系来定义词汇表外延的规则。后来在信息系统、知识系统等领域，越来越多的人研究本体，并给出了许多不同的定义。其中最著名并被引用得最为广泛的定义是由g r u b e r 提出的： “本体是概念化的明确的规范说明，和这个定义类似的有n g u a r i n oa n dp g i a r e t t a ( 1 9 9 5 ) “本体是概念化的明确的部分的说明或本体是一种逻辑语言的模型。 w n b o r s t 对该定义也进行了引申：“本体是共享的概念模型的形式化的规范说明。 f e n s e l 对这个定义进行分析后认为本体的概念包括四个主要方面： 1 概念化( c o n c e p t u a l i z a t i o n ) ：客观世界的现象的抽象模型； 2 明确( e x p l i c i t ) ：概念及它们之间联系都被精确定义； 3 形式化( f o r m a l ) ：精确的数学描述； 4 共享( s h a r e ) ：本体中反映的知识是其使用者共同认可的。其它的一些本体的定义、解释和说明还有“本体是一个为描述某个领域而按继承关系组织起来作为一个知识库的骨架的一系列术语”、“本体是对一个特定领域中重要概念的共享的形式化的描述、“本体是对某个领域中的概念的形式化的明确的表示，每个概念的特性描述了概念的各个方面及其约束的特征和属性、“本体必需包括所使用术语的规范说明、决定这些术语含义的协议、以及术语之间的联系，来表达概念、“本体是以某一观点用详细明确的词汇表描述实体、概念、特性和相关功能的理论等。 2 2 2 本体模型概念基于上述若干的观点和概念，特别是基于描述逻辑这种重要的形式化方法，学术界提出了本体模型【1 6 】的概念和结构，且已获得广泛认同。本体模型以及它的检验问题一直是人工智能领域的热点。在此给出本体模型的定义与结构。本体模型的定义：给定术语构造符集，本体模型是一个4 元组，记作o = 。解释一下这个概念，其中，t 是术语集，t 中的术语又被称为原子术语，包括原子类术语c ( 简称原子类) 与原子属性术语p ( 简称原子属性)

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（计算机科学与技术专业论文）本体知识库的封闭世界假设研究.pdf

文档简介

温馨提示

最新文档

评论

（计算机科学与技术专业论文）本体知识库的封闭世界假设研究.pdf

文档简介

温馨提示

最新文档

评论

相关文档