本体理论与领域本体的构建_第1页
本体理论与领域本体的构建_第2页
本体理论与领域本体的构建_第3页
本体理论与领域本体的构建_第4页
本体理论与领域本体的构建_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章 本体理论与领域本体的构建2.1本体理论2.1.1 本体的基本概念本体论(Ontology)的概念最初起源于哲学领域,是形而上学理论研究的一 个分支,与认识论相对。认识论研究人类知识的本质和来源,即研究主观认知, 而本体论研究的则是客观存在。Ontology 一方面研究存在的本质,另一方面研究 客体对象的理论定义,即整个现实世界的基本特征。现在哲学领域较多翻译为本 体论”经过多年的演进,到今天,经过人们对本体”这一概念的重新理解和定位,本体的理论与方法早已被信息领域采用,用于知识的组织、表示、共享和重 用。本体在计算机学科的使用可以追溯到上个世纪80年代,Alxenader在1986年发

2、表的文章被视为本体在计算机领域获得不同于哲学领域的新的研究的起点。 随后Ontolgoy在人工智能领域界获得稳步的发展,并被逐渐赋予了新的含义8-9。 1991年,在人工智能领域,Neches等人最早给出Ontology定义,Neches认为10“ An ontology defines the basic terms and relations comprising the vocabulary of a topic area,as well as the rules for combining termsand relations to define extensions to the v

3、ocabulary.即一个本体给出构成相关领域词汇的基本术语和关系,以及利用 这些术语和关系构成的规则定义这些词汇的外延规则。”本体定义了组成主题领域的词汇表的基本术语及其关系,以及结合这些术语和关系来定义词汇表外延的 规则11 。 1993年美国斯坦福大学知识系统实验室(Knowledge System Laborary, 简称KSL)的Gruber给出了本体在信息科学领域被广泛接受的定义:“An ontologyis an explicit specification of a conceptualization 12。即 本体是概念化的明确的规 范化说明”这也是最著名并被引用最为广泛的定

4、义。1995年Guarino和Giaretta 将本体定义为13本体是概念化的明确部分的说明一种逻辑语言的模型。”这个定义与Gruber的理解有异曲同工之妙。随后在1997年W.N.Borst对Gruber的定 义进行了引申,提出了 本体是共享概念模型的形式化规范说明 ”以及1998年 J.Studer的 本体是共享概念模型的明确的形式化的规范说明”本体的定义随着时间的推移也在进行着不断的变化发展,为明确起见,现将 本体发展史中较有代表性的定义列表如下:表2.1本体发展史中的定义列表时间/提出人定义1991/Neches一个本体给出构成相关领域词汇的基本术语 和关系,以及利用这些术语和关系构成

5、的规© 1 *>4-2010 Chirui Academic Journal Ekctronic PuKlijihing House. All rights reserved, http:/'/wavi. Jidt则定义这些词汇的外延规则1993/Gruber本体是概念化的明确的规范化说明1995/Guarino 和 Giaretta本体是概念化的明确部分的说明一种逻辑语言的模型1996/ Bernaras 等本体提供了一种用来显式地描述概念化的方式1997/W.N.Borst本体是共享概念模型的形式化规范说明1997/ Swartout本体是一个为描述某个领域而按继承

6、关系组织起来作为一个知识库骨架的一系列术语1998/J.Studer本体是共享概念模型的明确的形式化的规范说明2000/ Fen sel本体是对一个特定领域中重要概念的共享形式化的描述2001/ Noy F.N.本体是对某个领域中的概念形式化的明确表示,每个概念的特性描述了这个概念的各个方面及其约束的特征和属性2002/Fonseca本体是以某一观点用详细明确的词汇表描述 实体,概念,特性和相关功能的理论2003/Starlab本体必需包括所使用术语的规范说明,决定 这些术语含义的协议,以及术语之间的联系, 来表达概念由上述列表可见,人们对本体的定义和理解是有一个逐步认识的过程的。尽 管本体的

7、定义有很多不同的方式和不同的侧重点,但从内涵上来讲,本体的概念有下面四层含义:概念化(conceputalization):通过抽象出客观世界中一些现象(phenomenon的相 关概念而得到的模型,其表示的含义独立于具体的环境状态。 明确(explicit):概念与概念之间的联系及使用这些概念的约束都被明确定义。(3) 形式化(formal):有精确的数学描述,是计算机可读的。共享(Share):本体中体现的是共同认可的知识,反映的是相关领域中公认的 概念集,它所针对的是团体而不是个体14。可见这些不同的研究者虽然各执己见,但对本体的内涵却认识一致,都把本 体当作某个领域内不同主体(人、代理

8、、机器等)之间进行交流(对话、互操作、 共享等)的语义基础。其实,本体就是通过对于概念、术语及其相互关系的规范 化描述,勾画出某一领域的基本知识和描述语言,是一个已经得到公认的形式化 的知识表示体系,包含词表(或名称表/术语表),词表中的术语全是与某一专业领7© 1 *>4-2010 China Academic Journal Electronic Publijihing House. All rights reserved,http:/'/ki.iidt域相关的,而逻辑声明全部用来描述术语的含义及关系。2.1.2本体的分类1、按照领域依赖程度:(1)顶层

9、(top-level)本体:描述的是最普通的概念及概念之间的关系,如空 间、时间、事件、行为等,完全独立于特定的问题和领域,其他本体都是该类本 体的特例。(2)领域(domain)本体:描述的是特定领域(医学、地理等)中的概念及概念 之间的关系。(3)任务(task)本体:描述的是特定任务或行为中的概念及概念之间的关 系。(4)应用(application)本体:描述的是依赖于特定领域和任务的概念及概念 之间的关系。在这个分类当中,领域本体和任务本体是处于同一个研发层次的,它们都能应用顶层本体中定义的词汇来描述自己的词汇。应用本体既能应用领域本体中的概念,也能引用任务本体中的词汇。2、按照细化

10、程度Guari no从两种不同的维度对本体进行划分。除了依据对领域的依赖程度分 类,还提出了以详细程度分类。详细程度是相对的、模糊的一个概念,是描述或 刻画建模对象的程度。参考(refere nee本体:详细程度高。共享(shareable本体:详细程度低。3、按照形式化程度(1)高度非形式化:用自然语言松散表示。(2)结构非形式化:用限制的结构化的自然语言表示。(3)半形式记:用半形式化(人工定义的)语言表示。(4) 严格形式化:所有术语都具有形式化的语义,能在某种程度上证明完 全性和合理性。4、按照是否具备推理功能(1)轻量级本体(Lightweight ontology):轻量级本体不具

11、备逻辑推理功能, 例如叙词表和WordNet。(2)中级本体(Middle ontology):中级本体具有简单的逻辑推理功能,系统 可以识别一阶谓词逻辑的表达式。(3)重量级本体(Heavyweight。ntology):重量级本体具有复杂的逻辑推理功能,系统可以识别更加复杂的二阶谓词逻辑的表达式,并为更加复杂的推理功能的实现预留了接口,女口 Cyc本体系统I9】。8© 1 *>4-2010 Chirui Academic Journal Elec Iran ic PuKlijihing House. Al rights reserved, http: /'/wav

12、.cnk i. iidt5、按本体描述对象的不同,Uschold把本体分为特殊领域本体(如医药、地 理、金融等)、一般世界知识本体、问题求解本体和知识表示语言本体等。6按不同的研究主题15:(1) 知识表示本体(Knowledge Representation ontologies)如 Frame Ontology和斯坦福大学知识系统实验室提出的知识描述语言KIF(K nowledge In tercha ngeFormat)。(2) 通用或常识本体(General/Common ontologies,女口 Cyc本体系统。到 2000年为止,Cyc的常识库已有了 1,600,000条知识和几

13、百个微理论 (micro-theory)。(3) 领域本体(Domain ontologies),如基因本体 GO(Gene ontologies)爱丁 堡大学企业本体。(4) 语言学本体(linguistic ontologies),关于语言、词汇等的本体,典型实 例有 GUM(Generalized Upper Model),WordNet 和 MindNet 等。(5) 任务本体(Task ontologies),主要研究如 Chandrasekaran等人的关于任 务和问题求解方法本体的研究。除了上述几种分类方法外,1999年,Perez和Benjamins在分析和研究了各 种本体分类

14、法的基础上,归纳出10种本体:知识表示本体、常识本体、顶级本体、元(核心)本体、领域本体、语一言本体、任务本体、领域一任务本体、方法 本体和应用本体。这种分类法是对 Guarino提出的分类方法的扩充和细化,但是 这10种本体之间存在交叉,层次不够清晰。2.1.3本体的功能与作用1、本体为人和主体之间的沟通和交流提供了共享的基础,也方便了不同领 域的系统开发人员和研究人员之间的沟通,它是人机在语义上交互的最好的基 础。而开发领域本体的主要目的之一就是在人们和软件智能之间对信息结构的理 解提供一种可共享的、共同的理解机制。2、本体支持对于知识的重用。本体提供了独立于应用的描述方法使之可在 不同系

15、统间重用。例如在基于构件的软件开发过程中,开发知识系统时知识工程 师可以将本体论概念引入知识工程,详细说明模型中的概念、实例、关系和公理 等实体,并以此建立领域本体。然后针对属性提出本体建模概念化分析的形式化 方法,解决知识共享中的问题。此举有效的提高了工作效率,促进了来自不同领 域的研究人员和组织间的交流。3、本体提供了一种结构化的表示领域知识的形式化方法。在本体中,明确说明了领域概念及概念之间的关系,并且支持对领域规则的描述,是领域知识的形式化表示。4、知识本体可以明确领域假设,使领域公理得到明确描述从而达成共知。9© 1 *>4-2010 China Academic J

16、ournal ElBttranic PuKlijihing House. Al rights reserved, http:5、本体有助于知识的标准化。本体为人们描述目标世界提供了一组通用词 汇,而这种通用的词汇正是实现知识系统化的基础。 通用词汇和知识的系统化有 利于实现知识的标准化。2.1.4本体的应用目前本体已经广泛应用于人工智能、知识工程及其相关领域。本体的功能及 其应用领域大致可以概括为三类:作为知识表示方法,应用于知识工程和知识管 理;作为系统分析方法,应用于信息建模、面向对象分析和数据库设计;作为信 息语义的形式化表示方法,应用于异构信息集成、多智能体系统、语义Web等。具体来说

17、可以分为以下几个方面:1、信息检索本体具有的良好的概念层次结构和对逻辑推理的支持,因而在信息检索,特 别是在基于知识的检索中得到了广泛的应用。基于本体的信息检索的基本设计思 想可以总结如下:(1)在领域专家的帮助下,建立相关领域的本体;(2)收集信息源中的数据,并参照已建立的本体把收集来的数据按规定格式存 储在元数据库(RDB(关系数据库),KDB(知识数据库)等)中;(3)对用户检索界面获取的查询请求,查询转换器按照本体把查询请求转换成规定的格式,在本体的帮助下从元数据库中匹配出符合条件的数据集合,检索的结果经过定制处理返回给用户。表2.2本体应用于信息检索的项目项目说明2(Onto) Ag

18、e nt帮助用户检索所要的 www上已有的Ontology,主要采用参照 Ontology, 即以www上已有的Ontology为对象建立起来的 Ontology,保存各类Ontology的元数据。On tobroker面向www上的网页资源,目的是帮助用户检索所需的网页,这些网页含有用户关心的内容。SKC解决信息系统语义异构问题,实现异构自治系统间的互操作,通过在Ontology上的一个代数系统来实现Ontology之间的互操作,实现异构系统之间的互操作。2、电子商务电子商务的出现,为来自不同领域、不同地区甚至不同国家的商业伙伴之间 进行交易提供了更为方便快捷的商务平台,因此受到了企业和商家

19、越来越多的重 视。但由此而来的电子商务交易方的大量产品描述、目录和文档,以及亟待解决的异构问题成为B2B电子商务发展的瓶颈所在。10© 1 *>4-2010 Chirui Academic Journal Ekctronic PuKlijihing House. All rights reserved, http:/'/wavi. Jidt本体在B2B的通信中可以起到信息集成的作用,它将信息的表示分为三个 层次:语法层、数据模型层和本体层,其中语法层与使用XML序列化表示的文档实例相对应;数据模型层将语法层中的差异抽取出来进行统一表示,并用对象-属性-值的形式对产品进行

20、描述;而本体层则定义不同产品和文档标准提供的 各种信息的术语,有效地帮助其完成 Web数据的语义处理和管理。3、数字图书馆数字图书馆是社会信息基础结构中信息资源管理、 存储和传输的基本组织形 式,拥有丰富的超容量多媒体介质的数字化信息资源,依托网络为信息需求者提 供快捷高效的数字化图书馆信息服务。但各类信息常在具体系统条件限制下用专 门语言定义组织为内部结构和格式, 难以有效进行机器支持的检索、 解析、处理 和交换,更不要说进行跨文献单元、数据类型、数据层次和系统范围的信息挖掘、 抽取、综合分析描述、转换了。本体的出现就极大的解决了语义知识缺乏的问题, 为XML与RDF等技术提供语义支持。在进

21、行信息资源整合时,本体可以灵活 处理各类信息资源,有效识别信息资源的类型,提供资源库领域知识的规范描述, 提供元数据映射方案,为智能代理与信息环境之间提供基于语义的理解机制,此外还可作为跨平台、跨系统之间的通信中介存在,为揭示知识间的语义关系提供 了清晰的描述,为数字图书馆提供了一个统一框架、 规范模型,利用概念、属性、 属性与属性之间的映射关系等对语义进行描述,为语义理解与交流的可行性大大 加分。4、知识服务知识服务,即以信息知识的搜寻、组织、分析的知识和能力为基础,根据用 户的问题和环境,融入用户解决问题的过程之中,提供能有效支持知识应用和知 识创新的服务。目前,数字图书馆知识服务需要一个

22、新型的技术基础,支持数据挖掘、知识发现、知识析取、知识应用和智能化服务(智能Web服务)。无疑,本体技术仰仗其丰富的语义和广泛的关系, 是实现以上目标的最佳手段,将本体 建设和相应的代理引擎设计相结合即可解决问题。用DAML-S在服务模型基础上定义流程模型本体,综合人工智能规划和工作流程研究成果,定义Web服务中的流程类型和流程控制等信息,可以较好的表示Web服务自动集成中的流程分类、合成、控制和时间约束等细节。5、自然语言理解本体是对世界知识概念化描述,它作为系统中的知识库,是由概念集合以及 概念之间的关系所组成的计算实体。我们可以利用本体中所蕴涵的世界知识中的 约束,结合语言知识可以进行消

23、歧和推理。在系统中,歧义的产生主要源于两方面:句法分析产生多种可能的句法分 析树,即结构歧义;词汇对应多个语义概念,即由多义词产生的词汇歧义。消11© 1 *>4-2010 China Academic Journal ElBttranic PuKlijihing House. Al rights reserved, http:歧就是在多个可能的意义中选择最适合的意义,利用本体中的概念以及概念之间的约束关系进行语义分歧的消除。 一般来说消歧可以有以下几种手段:第一,利用句法信息,在分析及生成句法树的同时检查结构是否符合词汇的句法限制。第二,利用语义片断组合过程来检查语义限制。第

24、三,利用本体的结构定义权重, 用语义描述的权值来消歧。由此可知,本体在自然语言理解领域中的作用:首先, 领域知识在释疑中往往起到极为重要的作用,而领域本体则为领域知识的表示提 供了基础;其次,领域本体有助于识别不明确的语义分类,在此处本体又担当起了概念词典的作用。2.1.5本体的集成本体集成的问题由欧洲委员会于2001年启动的 SWAP(Semantic Web andPeer-to-peer项目16发现。该项目需要一种能够在每个终端构建各自的本体之后 生成一个大本体的工具,因而发现了将多个不同团队构建的多个小本体集成为一 个大本体时的本体映射和本体合并的问题 17。另外,由欧洲委员会资助的另

25、外 一个项目 SEKT(Semantically Enabled Knowledge technologies严也发现了本质上 相同的问题,他们需要为使用多个不同本体的应用找出这些本体之间的关系,实现本体之间的交互,以达成基于这些本体的数据间的重用和互操作19,称其为本 体调解”(ontology mediation)在本体集成的研究过程中,美国斯坦福大学、德国 卡尔斯鲁厄大学等一批顶尖本体研究机构与知识网”(KnowledgeWeb, KW)2°等项目取得了大量的研究成果,处于国际领先水平。而在国内,本体集成还是一个 相对较新的研究领域,相关研究刚刚起步。其中,对于本体构建工程的研

26、究集中 于本体的自动构建,也就是本体学习(ontology learning),孔敬21、杜小勇等人22 进行了较为全面的综述。本体维护工程,也就是本体生成之后使用过程中对本体 进行修改使其进化的工程,由于这一方面的研究在国际上也还没有展开,所以马文峰等人23只是简单的介绍了本体进化的概念和研究前景。而对于本体集成工 程,目前还未见有研究综述出现。1、本体集成的基本原则通过国内外本体集成方法和过程的研究,本体集成应该遵循以下四条基本原则:(1) 完备性原则。主要指语义完备性和约束完备性,待集成本体中如果有 语义或约束应用需求,则该语义或约束一定要在目标本体中有所体现。(2) 进化原则。本体集成

27、同本体构建一样,是一个动态过程,集成后的本 体一定要具有可复用性及二次开发的空间和能力。(3) 广度与深度兼顾原则。即覆盖程度和细化程度要求两者兼顾。(4) 实用性原则。所谓实用性原则就是一方面要尽量减少人的工作量,另 一方面要考虑集成的复杂程度,当将多个本体进行集成所花费的工作量及耗费比12© 1 *>4-2010 Chirui Academic Journal Elec Iran ic PuKlijihing House. Al rights reserved, http: /'/wav .cnk i. iidt重新构建一个新本体还要大的时候,就已经无所谓集成了24

28、。2、本体集成的分类广义上所说的本体集成,即本体融合(On tology Rec on ciliati on),指的是把多 个本体汇聚到一起使用,此时所涉及到的情况很多,本体集成也可广义的分为如 下两类:本体串联(Ontology Aligning)和本体集成(Ontology Integrating)。本体串 联是把两个本体串在一起,建立相互之间的映射,但各自本体仍然独立并且没有 被改变。本体集成则是把两个本体Oi和。2有机地结合在一起,产生新的一个本 体O和从实体Oi和O2到实体O的映射A*。狭义来讲,按照集成程度的不同,本体集成可以分为本体映射(on tologymapping)、本体结

29、盟(ontology alignment)和本体合并(ontology merging)。上述 3 种形式的集成程度依次增强,体现了从松散集成、封装集成到紧密集成的过渡关 系25。按照本体语言的不同,本体集成可以分为本体概念层集成和本体语言层集 成。当有两个或多个本体库描述的领域有交集时,要对这些本体库进行集成,就必须解决概念层描述的差异。而当语法存在差异以及表达能力上存在差异时,即 需进行本体语言层的集成26。2.2领域本体构建研究根据前文所述,本体作为一种通用的知识共享模式,为特定领域的人和应用 系统的交流提供极大的便利,也因为如此,本体的研究和应用迅速延伸到知识工 程、自然语言处理、信息

30、检索系统、智能信息集成和知识管理、信息交换和软件 工程等领域,而如何对这些不同领域内的知识进行抽取和描述并构建出合适的领 域本体已成为目前的研究热点之一。所谓的领域本体(domain-specific ontology)就是对学科概念的一种描述,包 括学科中的概念、概念的属性、概念间的关系以及属性和关系的约束27。由于知识具有显著的领域特性,所以领域本体能够更为合理而有效的进行知识的表 示。领域本体可以表示某一特定领域范围内的特定知识。 这里的 领域”是根据本 体构建者的需求来确立的,它可以是一个学科领域,可以是某几个领域的一种结 合,也可以是一个领域中的一个小范围。2.2.1领域本体的模型及

31、建模原语下面是一个用于领域知识表示的本体模型:领域本体是一个四元组O=C,l,R,Ax。其中:C是本体中的类集,I是类集C中的实例集,R是类集C上 的关系集合,类的继承关系(is a)是最常见的类间关系,而 Ax是类间公理集合, 给出类集C的类之间属性和关系的严格约束。13© 1 *>4-2010 Chirui Academic Journal Elec Iran ic PuKlijihing House. Al rights reserved, http: /'/wav .cnk i. iidt如果再把关系R详细划分为关系和函数,就有了 Perez等人用分类法组织的

32、五元组本体:0=(C, R,F,A,I),其中C、R、F、A和I分别是本体中概念、 关系、函数、公理和实例的集合,这五点也可以被称为五个基本的建模原语。1、类(classes或概念(con cepts)概念(Concept)是一类对象的集合的抽象描述:C= O1,O2O n,其中Oi是领域中的对象。概念的含义很广,可以表示任务、功能、行为、策略和推理过程等等。在实践中,本体中的概念往往可以和类(Class)、类I(Category)、种类(Type) 通用。但是本体中的类与面向对象编程中的类是有区别的, 两者的重心不同,前 者关心类的结构特征,而后者则关心类的操作特征。2、关系(Relatio

33、n)描述n个概念所含对象之间的联系:0, C2Cn间的n元关系Rn:C1 x(c xxC是n个概念的笛卡儿乘积的任意子集。关系描述领域概念间的相互作用,基本的二元关系有4种:part-of,表示概念之间部分与整体的关系;kind-of,表示概念之间的继承关系;instance-of表示 概念的实例与概念之间的关系;attribute-of示某个概念是另一个概念的属性。在 实际建模中,概念之间的关系不限于这4种,可以根据领域的具体情况定义相应 的关系,例如connect-to。在实践中,本体中的关系往往可以和性质(Property)、属性(Attribute)、角色(Role),槽(Slot)通

34、用,例如在描述逻辑中称为Role,而在基于框架的表示中称为 Slot。3、函数(Fu nctio n)F: C1XCcX-X£-1Cn,函数是一类特殊的关系,其前 n-1个元素可以唯一 的确定第n个元素,如Mother-of就是一个函数,mother-of(x,y)表示y是x的母 亲。4、公理(Axiom)公理是无需证明的永真断言。公理在本体中有两个作用:严格定义概念和在 本体所表达的知识范围内回答问题。5、实例(In sta nce 或 In dividual)实例表示元素,即概念对应的对象。一般认为,类C是具有类似性质的所有个体的抽象。在领域本体中,实例I和类C紧密相关,是本体中

35、最基本最具体的对象,个体从属于某个类就成为这 个类的一个实例。类有外延和内涵两个侧面。外延指类所代表的个体的范围,可 以认为是类的所有实例构成的集合;内涵则是类的实例共同具有的所有性质。某个个体是类的实例,当且仅当它具有内涵中规定的所有性质;某种性质在类的内14© 1 *>4-2010 China Academic Journal ElBttranic PuKlijihing House. Al rights reserved, http:涵中,当且仅当类的所有实例都具有这种性质。 本体中所有类和实例构成本体的 论域。另外,在基于描述逻辑的本体中,公理A可以分为两类:术语公理和

36、实例公理,实例公理对一个本体而言并非必需的,而术语公理则可以看成一类关系, 在实践中往往定义为本体表示语言的描述符。 函数F和实例I不是必需的,可视 本体建模的详尽程度而进行取舍。222本体建模语言目前有很多种本体语言,但归结起来大体可以分为两大类型:基于AI的本体实现语言和基于 Web的本体标记语言,以下我们将分别简要介绍。一、基于AI的本体描述语言1、KIFKIF ( Knowledge Interchange Forma)是由斯坦福大学开发的。斯坦福(Sta nford)大学知识系统实验室进行了关于知识本体的研究,包括研究知识的 本质特征和基本属性。在这项研究中,D. Bobrow, R

37、. Brachman和V. Lifschitz等AI专家提出了这种称为知识交换格式(knowledge interchange format,简称 KIF)的知识描述语言,它的研究重点是语言的表达能力。它不同于KR系统间交换知识的格式,是一种基于一阶逻辑的语言,特点是:它有公开的语义,不再 需要专门的解释器;在逻辑上是全面的,可以对任意的逻辑语句进行表达; 可以 提供对元知识的表现。KIF和其它知识表示语言之间的区别在于它必须是和应用完全无关的,另 外必须具有足够的表达能力使得所有其它的知识表示语言都有转换成KIF标准格式的可能2、OntolinguaOn toli ngua 是一种基于 KI

38、F( Kn owledge in tercha nge format),提供统一的规 范格式来构建本体的语言。它可以用来定义对象、函数和关系。KIF拥有明确的语义,它是基于一阶谓词逻辑运算的,并带有注释性的前缀。KIF还可以提供元知识的表示和非单调性的推理规则。KIF作为一种交互格式,从本质上对本体进 行了规定。但这种用KIF写出来的有关本体的规范说明相当乏味难懂。在Ontolingua中,定义本体是一种形式化和描述性的表示。它包含一个主体领域中 涉及到的词汇(术语)以及描述这些词汇是什么,之间如何相关和能否彼此相互 关联的逻辑化的断言。该语言支持 3种本体定义方式:(1)采用KIF表示;(2

39、)仅仅使用frame ontology的词汇库定义本体;(3)同时使用上述两种表示 方式。Ontolingua包含KIF分析器、本体分析工具和一组 Ontolingua转换器, 且独立于特定表示系统的本体定义机制。其特点是:为构造和维护本体,提供了统一的、计算机可读的方式;由其构造的本体可以方便的转换到各种知识表示和15© 1 *>4-2010 Chirui Academic Journal Elec Iran ic PuKlijihing House. Al rights reserved, http: /'/wav .cnk i. iidt推理系统(Prolog、C

40、ORBA 的 IDL、CLIPS、LOOM、Epikit、Algernon 和 KIF), 从而将本体的维护与使用它的目标系统分离;主要用于本体服务器(on tologyserver)。3、CycLCycL是Cyc系统的描述语言,本质上是一阶谓词逻辑(FOPC)的一种扩展。 它可以处理等词、缺省推理、skolem化和其它一些二阶特性,具有多种推理机 制(通用推理机制和特殊推理机制),命名唯一,且使用谓词来表达概念之间的 关系,目前最多处理五元关系。CycL的特点是:在一阶谓词演算的基础上扩充了等价推理、缺省推理等功 能;具备二阶谓词演算的能力;其语言环境中配有功能很强的可进行推理的推理 机。4

41、、LoomLoom是一种基于一阶谓词逻辑的知识表示语言,由美国南加洲大学信息科 学学院设计并实现。特点是:提供表达能力强、声明性的规范说明语言;提供强 大的演绎推理能力,能供多种编程风格和知识库服务。该语言后来发展成为 PowerLoom语言。PowerLoom是KIF的变体,它是基于逻辑的,可以提供表达 能力强、声明性的规范说明语言,也可以提供强大的演绎推理能力,采用前规则(backward and forward chaine)作为推理机制。5、FlogicFlogic(Frame Logic)由卡尔斯鲁厄大学开发,可以表示概念、概念分类、二 元关系、函数、实例、公理和规则。与上述几种语言

42、相比,它是唯一没有采用LISP 语法的语言。其推理引擎 OntoBr可以用来进行约束检查和演绎新知识。Flogic拥有一套模式理论的语义(A Model-theoretic Semantics)和一套完备的基于问题解 决方案的证明理论(Proof Theory)o FLogic软件平台从面向对象的演绎型数据库 (Deductive Databases发展成为本体,它可以融合其他的专门逻辑(如高阶逻辑 HiLog、事务逻辑Transaction Logic。),并以此来改善本体中利用信息进行推理 的功能。6描述逻辑描述逻辑(Description Logic)是基于对象的形式化知识表示方式,它吸

43、取了KL-ONE的主要思想,是一阶谓词逻辑的一个可判定子集。描述逻辑中的 描述”是指对一个领域知识采用描述的方式表达,即利用概念和规则构造符将原子概念 (一元谓词)和原子规则(二元谓词)构建出描述表达式;逻辑”是指DL采用了正规 的基于逻辑的语义,这与语义网络及框架等知识表示机制是不同的四。与一阶谓词逻辑所不同的是,描述逻辑系统能提供可判定的推理服务。在众多知识表示的形式化方法中,描述逻辑在近年来颇受人们的关注,主要原因也在于强大的表16© 1 *>4-2010 China Academic Journal ElBttranic PuKlijihing House. Al ri

44、ghts reserved, http:达能力和清晰的模型理论机制,另外描述逻辑提供了很多推理服务,成为众多流 行化本体描述语言的基础。描述逻辑的知识库 K=<T, A>由Tbox(术语)和Abox(断言(Assertoin)两个部 分组成,其中Tbox是一个关于包含断言的有限集合,有如下形式: C D,这里 C和D为概念。通常我们用CO作为C D和D C的缩写。ABox是实例断言 的有限集合,形式为c(a),其中c是一个概念,a是一个个体,或者形为P(a, b), 其中P为一个原始关系,a和b为两个个体。一般地,描述逻辑依据提供的构造 符,在简单的概念和关系上构造出复杂的概念和关

45、系。通常描述逻辑至少包含以 下构造符:交(G)、并(U)、非()、存在量词()和全称量词(口),这种最基本的 描述的基础上再添加不同的构造符,则构成不同的表达能力更强的描述逻辑。(1)描述逻辑的语法和语义表2.3中列出了描述逻辑的一般的语法和语义29:表2.3描述逻辑的一般语法及语义构造苻的名称构造曲的语捷构造符的不体縱释TT通用类TJ =出丄空淇丄鼻0-.C原子否术舍取VAD図性值的束(VP.DY =aw M T0 w D,3ATWft存注妁康(3P.T)7|站"胡疋 严DJE-(nu£y 二 mur非限定性存在约束(3P.D)J 壬 W & I 站”扪 E 尸J

46、<nP 巔小数目灼束=口&|创3上比严艺町N廿(=nP)1 = <? e Ar | (tr,e F; J = «SnP最大皈目的束E“刊二佃e出|讪血时WD(2) 描述逻辑的推理功能描述逻辑的推理功能主要集中在以下两个方面:包含(subsumption):即判断一个概念是否为另一个概念的子集,主要用于概念的 自动分类;可满足性(satisfiability ):即判断一个概念与己有的概念集(本体)是否相容,主要用 于概念集合的一致性检测。(3) 描述逻辑的特征描述逻辑具有有很强的表达能力和可判定性,能够保证算法在合适的地方准 确的停止,且返回结果正确无误,并可提供

47、有效的推理服务。描述逻辑的优点17© 1*4-2010 China Academic Journal Electronic Publishing House. Al rigilts reserved.定义良好的语义和表达能力,清晰的模型一理论机制;具有很强的表达能力和可判定性;基于逻辑的推理能力,且提供了有效的推理算法,如著名的Tableaux的算法;推理工具的支持,如优化的推理工具 FaCT、RACER等30。二、基于Web的本体描述语言1、RDF 和 RDF(S)RDF(资源描述框架,Resource Description Framework) RDF-S(RDF Schema

48、), 是W3C在XML的基础上推荐的一种标准,用于表示任何的资源信息。RDF模型的基础要素是三种类型的对象:(1)资源(resources,标识实际的以网络 为基础的资源,比如网页和网络应用程序。统一资源标识符(URI)可用来标识资源,每一个URI指向一个特定的网页或网络应用程序。(2)属性(properties), 指定特定资源的属性或特性。(3)声明(stateme nts是资源和属性的下一级延伸, 其作用是在一项特定的资源中为属性分配属性值。每个RDF声明都用XML来表述。RDF的数据模型实质上是一种二元关系的表达,由于任何复杂的关系都 可以分解为多个简单的二元关系,因此 RDF的数据模

49、型可以作为其它任何复杂 关系模型的基础模型。RDF具有通用性,并不限定于某个领域的网络资源定义, 而它所描述的网络资源也可以是任意格式的,既可以是XML格式的,也可以不是。总之,RDF是W3C提出的一种知识表示模型,它希望支持网络上的知识共 享(sharing)与知识交换(Exchange)。RDF Schema则为RDF资源的属性和类型提供定义良好的词汇表。RDFS是一种用于定义 RDF schemas的声明语言(Declarative Language)b RDFS的数据模 型(DM Data Model)是基于框架的(Frames-based)它为定义属性与资源之间 的关系提供了机制,核

50、心的概念/类(Core classes是类、资源和属性。RDF Schema 定义了一个类型系统(Type System),它与其他类型系统的区别在于对 类”的定 义,其他系统通过类的属性来定义类,而RDF Schema通过从属于哪些类的资源 来定义属性。2、OILOIL是一种针对ontology的基于互联网的表现和推理层。OIL以RDF Schema 为起点,用更为丰富的本体建模原语对 RDF Schema进行扩充,把基于框架表示 的方法应用于建模基元,实现了由描述逻辑来刻画形式化的语义并以此为系统提 供有效的推理支持。OIL将框架系统、描述逻辑和 Web标准(XML和RDF)这 三个不同领

51、域的优点结合起来,这三个领域的工作分别是:(1)基于框架的系统:基于框架的语言的中心建模原语是类(称作框架)和属性(称为槽)。(2)描述逻辑(DL):描述逻辑通过概念(对应于类或者框架)和角色(对应于槽) 描述知识。DL的一个重要特征是它们具有良好的理解理论性质,并且在DL中18 © 1 *>4-2010 China Academic Journal ElBttranic PuKlijihing House. Al rights reserved, http:任何表达的含义都可以通过数学的精确的方式描述, 而OIL就是从DL中继承了 形式化语义和有效的推理支持。(3)互联网标准

52、:这里指的是 XML和RDF, OIL标记语言的语法均源自 W3C的这些标准。一个OIL 本体用关键字begin-ontology 和end-ontology来描述,其中包 括on tology con tai ner和实际的本体定义两大部分构成。von tology>:=beg in-on tology<container>vdefi niti ons>end-on tology3、SHOESHOE (简单HTML本体扩展)是一种可以内嵌入 web页面的基于本体的 知识表示语言。SHOE语言的简单性是它的长处,SHOE本体可以让大众在 web 页面上定位它们,可以建立

53、/扩展本体,而本体交互所能达到的程度是:可共享 同一祖先本体。如前所述,SHOE是基于HTML的Web上的知识表示语言,具 有XML兼容性。SHOE实际上是HTML的扩展集。它的开发首要是为了扩展 HTML,然后是在HTML或者其它Web文档中合并机器可读的语义知识。 最近, 研究人员又对SHOE进行了调整,使之更适应于 XML。SHOE的目的在于使代 理可以收集网页上、文档中的有用信息,改进搜索机制和知识收集。SHOE有三种类型的推理子从句:分类、关系和比较。它通过建立逻辑,将数据和本体分离开来,允许本体在数据层面上提供不同视图。通过映射SHOE到这个逻辑可展示一个本体修订的不同类型是怎样影

54、响已存在的数据源的。另外要注意的是增加分类或关系的修订不会产生什么影响,而修改规则的修订会改变查询结果以及删除分类或关系的修订可能消除确定的答案。4、XOLXOL(Ontology Exchange Language)是 SRI International 的人工智能中心(AIC)开发的。它是一种简单通用的定义本体的方法, 以Ontolingua和XML(本 体标记语言)为基础,融合了 OKBC的高层表达方式和OML语法。其目的是在 不同的数据库、本体开发工具、或者其它应用程序之间交换本体。XOL设计之初是为生物信息学领域本体的交换,但是它可以应用于各种领域。目前没有支持 XOL本体开发的工具

55、,但由于它采用 XML语法,所以可以采用XML编辑器创 建XOL文件。XOL基本上不用于本体开发,但是可以在不同的数据库系统间、 不同的本体开发工具间或应用程序间作为本体传递的中介语言。5、OWL19© 1 *>4-2010 Chirui Academic Journal Elec Iran ic PuKlijihing House. Al rights reserved, http: /'/wav .cnk i. iidtOWL (Web Ontology Language)位于 W3C 绘制的 ontology 语言栈的栈顶,应用中不仅仅需要提供给用户可读的文档内容

56、,而且希望处理文档内容信息。OWL能够被用于清晰地表达词汇表中的词条(term)的含义以及这些词条之间 的关系。由于OWL拥有更多的机制来表达语义,从而超越了 XML、RDF和RDF Schema仅能表达网上机器可读的文档内容的能力。图2.1 ontology语言栈(1)OWL子语言OWL提供了三种表达能力递增的子语言 OWL Lite、OWL DL和OWL Full, 分别用于特定的用户群体。OWL Lite用于提供给那些只需要一个分类层次和简单约束的用户。例如, 虽然OWL Lite支持基数限制,但只允许基数为0或1。提供支持OWL Lite的工 具应该比支持其他表达能力更强的 OWL子语

57、言更简单,并且从辞典(thesuari)和 分类系统(taxonomy)转换到OWLLite更为迅速。相比 OWL DL,OWL Lite还具 有更低的形式复杂度。OWL DL用于支持强表达能力的同时需要保持计算的完备性(computati noalcompleteness,即所有的结论都能够确保被计算出来)和可判定性(decidbaility,即 所有的计算都能在有限的时间内完成)的知识表示。OWL DL包括了 OWL语言 的所有语言成分,但使用时必须符合一定的约束,例如,一个类可以是多个类的 子类,但它不能同时是另外一个类的实例。OWL DL的命名起因于它对应于描述 逻辑,这是一个研究作为 OWL形式基础的逻辑的研究领域。OWL Full支持最

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论