(计算机软件与理论专业论文)一种面向应用的本体构建方法.pdf_第1页
(计算机软件与理论专业论文)一种面向应用的本体构建方法.pdf_第2页
(计算机软件与理论专业论文)一种面向应用的本体构建方法.pdf_第3页
(计算机软件与理论专业论文)一种面向应用的本体构建方法.pdf_第4页
(计算机软件与理论专业论文)一种面向应用的本体构建方法.pdf_第5页
已阅读5页,还剩58页未读 继续免费阅读

(计算机软件与理论专业论文)一种面向应用的本体构建方法.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中山大学硕士学位论文摘要 论文题目:一种面向应用的本体构建方法 专业:计算机软件与理论 硕士生:李轶洲 指导教师:王若梅教授 摘要 随着计算机技术的广泛应用,对应用的需求不断增强,同时也带来了相应的 问题,例如在人工智能、知识管理等多个领域,一个主要问题就是如何通过对具 体领域中的概念进行一种通用的描述,从而来实现浚领域知识的共享与重用。本 体( o n t o l o g y ) 是一种能在语义和知识层次上描述领域相关问题的概念模型的框 架,能够很好的解决领域知识的共享与重用,因而在计算机的很多领域得到了广 泛应用。但在本体的研究与发展的过程中,关于本体的构建方法,没有一个统一 的、通用的、标准的方法,而且构建出来的本体应用性较差,也就是本体应用不 能充分发挥本体的优点,很难真正的实际应用。因此,对本体的构建方法和本体 的实际应用进行研究具有非常重要的意义。 本文通过对本体构建理论方法的研究,结合具体的本体应用问题,提出了一 种面向本体应用的本体构建方法,解决了传统构建的本体的应用性差的问题。该 方法主要特点是在对应用详细分析的基础上,利用本体应用中的规则,将其抽取 过程融入到本体的构建过程中,从而构建出良好的本体。在构建过程中,首先综 合原有的本体构建方法,应用软件工程领域的理论对本体应用进行详细的需求分 析,以此作为后续构建的基础;然后根据该需求分析进行本体中概念和属性的抽 取及定义。在这个过程中,同时进行本体应用中的规则抽取,并通过规则迸一步 完善本体的构建;重复这个过程并最终构建出合理而有效的本体。 本文通过具体领域的应用要求,对该方法进行具体领域的构建与应用的实例 验证。验证结果表明本文提出的面向应用的本体构建方法能够有效的支持具体领 域的应用。 关键字:本体,构建方法,规则 中山大学硕士学位论文a b s t r a c t t i t l e :a na p p l i c a t i o n o r i e n t e dm e t h o df o rb u i l d i n go n t o l o g y m a j o r :c o m p u t e rs o f t w a r ea n dt h e o r y n a m e :y i z h o ul i s u p e r v i s o r :p r o f e s s o rr u o m e iw a n g a b s t r a c t w i t ht h ed e v e l o p m e n to f c o m p u t e rs c i e n c e ,t h e r ea r em a n yp r o b l e m si nt h ef i e m s o r a l ( a r t i f i c i a li n t e l l i g e n c e ) a n dk n o w l e d g em a n a g e m e n t o n em a i np r o b l e mi sh o w t od e s c r i b et h eg l o s s a r ys e ta sau n i v e r s a lc o n c e p ts e t ,i no r d e rt o c a r r yo u tt h e c o m m u n i c a t i o na n dr e u s e a sac o n c e p tm o d e lf r a m e w o r ko fk n o w l e d g ea n d i n f o r m a t i o ni nt h es e m a n t i c sa n dt h ek n o w l e d g el e v e l ,o n t o l o g yc a nb eu s e dt os o l v e t h i sp r o b l e mw e l l ,a n di th a sac r u c i a lr o l et op l a yi ne n a b l i n gc o n t e n t b a s e da c c e s s , i n t e r o p e r a b i l i t y , a n dc o m m u n i c a t i o n s i nt h ep r o c e s so fo n t o l o g yr e s e a r c h ,t h e r ei sn o t au n i f i e da n du n i v e r s a lm e t h o da b o u tb u i l d i n go n t o l o g i e s ,a n dt h eo n t o l o g i e sw h i c h a r eb u i ru s i n gt h e s em e t h o d sc o u l dn o tb ea p p l i e dw e l l i na d d i t i o n ,b u i l d i n ga k n o w l e d g eb a s ea n do n t o l o g yi ss oc o s t l ya n dt i m e c o n s u m i n g ,s ot h er e s e a r c ho ft h e m e t h o d o l o g yf o rb u i l d i n go n t o l o g yi sv e r yi m p o r t a n ta n ds i g n i f i c a n t b a s eo nt h e t h e o r ya n a l y s i s a n dr e s e a r c ho f o n t o l o g ya p p l i c a t i o n s , a n a p p l i c a t i o n o r i e n t e dm e t h o df o rb u i l d i n go n t o l o g yi sp r e s e n t e di nt h i sp a p e r ;i tc a l lb e a p p l i e dm o r ee a s i l yt h i sm e t h o di n t r o d u c e sr u l et oh e l pb u i l d i n go n t o l o g y , i no t h e r w o r d s ,t h i sm e t h o di n d u c e sn e wo n t o l o g i c a lc o n c e p t sa n dr e l a t i o n s h i p sr e l e v a n tt ot h e r u l eb ya n a l y z i n gc u r r e n tc o n c e p t sa n d r e l a t i o n s h i p s ,r e p e a t i n gt h i sc y c l eu n t i lan i c e o n t o l o g yi sb u i l t i na d d i t i o n ,t h i sm e t h o de m p h a s i z e st h ef o n d a m e n t a l i t yo fd e m a n d a n a l y s i s u s i n gt h i sm e t h o d ,a nf r o ( f u n c t i o nt e x t i l eo n t o l o g y ) i sb u i l ti nt h i sp a p e r t h e r e s u l t ss h o wt h a tt h i sm e t h o dh a sg o o dp e r f o r m a n c ef o ra p p l i c a t i o n k e y w o r d :o n t o l o g y , m e t h o d o l o g y , r u l e 中山大学硕士学位论文引言 引言 随着计算机技术的广泛应用,对应用的需求不断增强,同时也带来了相应的 问题,例如在人工智能、知识管理等多个领域也出现了种种问题,其中一个主要 问题是:信息、知识的表示、组织、重用等。特别是由于计算机网络相关技术的 快速发展,面对着大量的信息、知识,如何对它们进行表示、组织、管理和维护 的问题就更加突出,对该问题的解决也显得越来越迫切。为了解决这样的问题, 本体( o n t o l o g y ) 的概念被引入到这些领域中。本体作为一种能在语义和知识层 次上描述领域相关问题的概念模型的框架,从二十世纪九十年代开始逐渐成为关 于知识管理与应用的重点研究方向。 在计算机科学技术领域,本体是随着人工智能和信息处理等领域的发展而逐 步发展起来的。在人工智能领域,为通过共享构建出更大、更好的知识库,因此 需要考虑如何在具体领域区分可复用与共享的知识,并获取和描述这些知识,从 而实现描述性的知识、问题解决方法以及推理服务的系统问共享;在信息处理领 域,为实现信息检索等智能化的发展,必须考虑如何使信息具有语义、检索结果 可以共享和重用等问题;另外,随着面向对象技术的兴起,在软件工程领域,软 件变得日益庞大和复杂,所以也必须考虑对程序的维护和重用性的问题。综上所 述,这些领域的发展都涉及到了同一个类似问题,即需要对某个领域进行通用概 念上的描述,而这也正是本体所研究和期望解决的内容。本体是表达对特定领域 有关问题的共同认识的一个术语,被用来作为一种统一框架,这种框架以一定的 方式来解决前面所述的问题。因此,本体已经在计算机的许多领域得到了迅速的 发展和广泛的应用,应用领域包括知识工程、数字图书馆、软件复用、电子商务、 信息检索和网络上的异构信息的处理、语义网等。 在本体的研究与应用过程中,本体的构建可以说是本体的各项研究中的一个 重要的环节。如何构建出合理而有效的本体,来提供给某一领域共享的知识,并 在此基础上开发出更好的本体应用具有重要的意义。而目前主要的本体构建方法 多数只是从构建的整体框架上给出一些分析和建议,很少对构建过程中的细节问 题进行分析讨论,这些方法的整体性和完整性上具有一定的欠缺,另外,这些方 中山大学顿士学位沦文引言 法通常是比较注重通用性,而相对忽视了应用性。因此为了更好的构建本体,开 发本体应用,本文提出了一种面向应用的本体构建方法,该方法更细节具体,在 不失其通用和共享的情况下更具有应用的针对性。 本文可以分为如下五个章节: 第一章绪论包括了本文的研究领域的研究现状,本文的研究内容、意义、特 点等。介绍并分析了目前本体构建方法的研究现状,针对该研究领域所存在的问 题,提出了本文的研究内容,并介绍了本文的研究意义和研究特点。 第二章是本体的相关技术研究的综述。介绍了语义网,对本体在语义网中的 位置和作用进行了分析,着重介绍了本体的起源、概念、分类及其应用,分析了 本体目前存在的一些缺点,最后对本体构建的相关技术本体的构建工具和本 体的描述语言进行了详细介绍和分析比较。 第三章是对本体的构建方法进行分析,根据分析提出本文的研究目的和研究 内容。在介绍并分析比较了目前比较流行的本体构建方法后,针对比较结果,提 出本文研究的重点,即:一种面向应用的本体构建方法,详细介绍了方法的步骤 和特点。 第四章是在前面两章的基础上,对本文第三章中提出的面向应用的本体构建 方法技术的应用与验证。介绍了本体应用实例的框架结构、流程、原理及等。并 对新方法与传统方法构建出的不同本体进行比较分析。 第五章是对论文全文的一个总结和展望。其中提出并分析了本文提出的方法 尚不完善的部分。另外,对本体构建方法的将来发展的下一步研究工作的重点进 行了展望。 中山大学硕士学位论文第l 章绪论 1 1研究的现状 第1 章绪论 本体( o n t o l o g y ) 最早是从哲学领域的研究中发展而来的一个概念,它的含 义是研究客观事物存在的本质和组成,即:是对世界上任何领域内的真实存在所 做出的客观描述。哲学领域中,本体是关于世界某个领域的一种特定的分类体系。 近年来,随着信息科学的迅速发展和计算机与网络的普遍应用,本体也随之逐渐 用于人工智能和知识工程等领域。但在计算机等研究领域对本体的概念与哲学领 域是不同的,本体是对概念体系的明确的、形式化、可共享的规范说明i l j 。 近十多年来,本体的研究日益广泛,逐渐成熟,尤其本体在网络上的应用是 导致语义网这个概念出现的重要一个原因,通过本体来解决网络中信息共享中的 语义等问题,使得网络具有更远大的发展空间。 本体在语义网和其它很多领域都有着广泛的应用。本体的突出特点是它可以 将某个或多个特定领域的概念和术语规范化,为该领域或领域之间实现共享的概 念体系,并最终帮助实现这些领域的实际应用。 对本体论的研究主要集中在:建立本体的方法、本体的形式化描述、本体的 工程化工具、本体维护和评估的方法和本体的应用研究。 本体的构建方法到目前为止仍处于相对不成熟的阶段,有很多不同的构建方 法。但本体构建方法论还没有一种统一的、标准的、成熟的本体方法论,而且仍 然是在领域专家的辅助下,以手工或半手工构建为主,这也是本体的构建方法论 多样性的一个原因。因此,目前只有在领域专家的支持下,综合现有的各种方法 论的优点,结合具体领域的应用,才能形成一种良好本体构建方法,构建出好的 本体。 本体的形式化描述发展也是相当迅速,随着语义网的发展也诞生了很多的本 体描述语言,目前形成标准的是基于描述逻辑( d e s c r i p t i o nl o g i c ) 的o w l 等语 言,但这些语言仍然在其推理能力和表达能力上不能够很好的取得一种更好的平 衡。, 另外,对于本体的半自动构建,本体映射,本体维护和本体评估的方法学也 l i 山大学硕士学位论文 第l 章绪沦 有了初步的探索与研究,也相继开发出了一些本体的构建工具,推理工具,评价 工具,以及一些用于支持不同表示语言互操作的本体语义转换工具等。 本体论的研究和应用总体上还处于一个不成熟的迅速发展的阶段,仍然存在 着如:本体的形式化不够完善;本体的构建缺乏统一的标准化的方法论;本体的 维护和评价缺乏统一的标准化的方法论:本体的缺少好的获取方法等突出问题, 需要人们更多的进一步的深入研究。 1 2本文的研究意义 一般情况下,构建本体在一定程度上来说并不难,可以通过对具体领域中知 识和概念的分析,确定它们之问的关系和可能的约束与规则,选择一定的知识本 体构建方法与构建工具,形成该领域中的知识本体。所以,可以说构建本体不是 难点,难点在于如何构建合理有效的知识本体,并把这些知识本体应用到具体的 应用领域中。从大的方面说,就是知识工程和知识本体工程方面的问题;从小的 方面说,就是知识本体的构建和应用问题。从目前的情况看,该问题仍然只能通 过不断的摸索,实践和总结逐步解决。 本文就是在分析已有的本体构建方法的基础上,充分利用它们的优点,在本 体工程化构建的主体思想下,基于规范化的构建步骤,通过对本体构建方法的核 心进行改进,使得构建出来的本体更能合理有效的应用到具体领域中。 1 3 本文的研究内容和特点 1 3 1本文的研究内容 1 详细分析了本体构建相关的技术,提出了一种面向应用的本体构建方法, 将应用中的规则引入到本体构建过程中,对本体构建方法进行改善; 2 用j a v a 开发语言,利用r a c e r 和j e n a 等a p i ,开发出简单的本体的信 息检索的应用,展示新方法的应用效果; 3 以p r o t 6 9 6 【2 1 和r a c e r l 3 1 软件作为本体构建工具,构建了功能性纺织材料 的本体,并对传统方法和新方法构建的本体进行比较分析; 4 在构建本体和应用本体实例的基础上,并对尚待解决的问题提出了相关 中山大学硕士学位论文 第l 章绪论 建议和方法。 1 3 2本文的研究特点 本文通过对本体的构建方法和本体在特定领域的应用的研究,提出了一种面 向应用的本体构建方法。该方法规范了本体构建方法的步骤,改善了构建出的本 体的合理性,解决了本体与本体应用脱节等问题。 本文提出的方法首先对本体应用进行详细的需求分析,并将本体应用中的规 则引入到本体的构建过程中,在抽取概念和属性的同时,利用概念集和属性集循 环抽取规则,并利用所获得的规则根据具体情况进一步辅助抽取与定义概念及其 属性,重复这个过程,最终构建出合理有效的本体。 本文的研究具有以下特点: 综合了已有的传统本体构建方法,采用本体的工程化构建的思想,详细 定义了本体的构建步骤,使得每个步骤更具体更规范; 提出了一种面向应用的本体构建方法,将本体应用中的关键规则引 入到本体的构建过程中,一方面便于非领域专家构建本体,另一方面提 高本体的完整性、应用的针对性,使得本体更加合理有效; 通过简单而具体的本体构建和应用实例,对新方法进行演示和验证。 中山大学硕士学位论文 第2 章本体研究的综述 2 1 语义网 第2 章本体研究的综述 2 1 1 语义网概述 万维网己经渐渐改变了人们相互交流、沟通的方式,也在引导着一种从知识 经济到知识社会的变革。网络的发展与变化也使人们重新认识了计算机,使它从 用于数学计算到应用于信息处理、文本处理和游戏等。 目前万维网中的内容都是以人为中心,为人提供服务的,典型的应用如:信 息的查找与获取,人们相互之问的交流联系,电子商务等。但是这些应用并没有 很好的软件工具来支持( 除了利用超链接而发展起来的搜索引擎) 。虽然目前广 泛使用的基于关键字的搜索引擎使得网络取得了很大的成功,但是它自身仍然存 在着很多问题,如:返回的数据量大且准确性不够或者返回的结果极少;返回的 结果与关键字关联性较大,准确性差;返回的结果是多个单一一网页;通过搜索获 得信息没有很好的辅助手段,造成搜索是一个比较耗时的过程等。另外,随着网 络上内容与信息量的不断增多,增长速度远远超过了网络相关技术的发展,从而 造成了诸多问题。 归结起来,问题的本质在于:目前的网络不是机器可读、可处理的。尽管目 前存在着相关技术与工具,如:分词技术,拼写检查等,但是对于长旬的解释和 抽取有用信息等仍然存在着局限。 所以,一种可选的办法就是使得当前的网络内容采取机器可读、可处理的方 式进行表示,并通过智能技术来充分利用这种表示的优势。这也就是语义网出现 的晟初原因。语义网不是一种新的信息网络,而是对现有网络进行发展,进化而 成的。 万维网的创始人t i mb e r n e r s l e e 将万维网的演化分为两个阶段,在第一阶 段,万维网应该是一个有利于人们进行信息交换和相互合作的强大工具。万维网 在最初十年的发展里,基本上实现了这个目标,它以h t m l 页面的方式向人们 提供了大量可阅读的信息;在第二阶段,这种合作应该延伸到机器。也就是说, 6 中山大学硕士学位论文 第2 章本体研究的综述 连接到万维网上的机器也应该能够分析万维网上的所有数据包括内容、链接 等,并提供人与机器之间更好的交互。 因此,t i mb e r n e r s l e e 于1 9 9 8 年提出了有关下一代万维网的构想,也就是 语义网,语义网可以说是这样的一个概念【“1 ,即:语义网上的信息具有定义良 好的含义或概念,使得计算机以及人们之间能够更好的彼此合作,关键之处也就 是一种机器可以理解网络上内容和数据含义的万维网。 语义网建立的基础是知识的概念化和形式化以及相应的逻辑推理,这都和语 义网的起源与人工智能等领域的关联有很大的关系。 2 1 2语义网的结构 t i mb e r n e r s l e e 在x m l 2 0 0 0 大会上描述了语义网的基本体系结构【4 】,如图 2 - 1 所示: 图2 - 1 语义网层次结构图 u r i 和u n i c o d e ( 编码层) 网络的应用中通信的基础也就是相互间如何发送机器可读的信息。为了在网 络中对这些资源信息进行明确的描述,语义网中采用统一资源标识符u r i ( u n i f o r mr e s o u r c ei d e n t i f i e r s ) 来标识资源和它的属性。另外,语义网中采用统 一编码u n i c o d e 作为字符的编码方案,这样便于对世界上各种语言和文字等信息 7 小山大学硕士学位论文第2 章本体研究的综述 资源的编码。所以,这一层是整个语义网的基础,它成功地解决了现有网络上资 源的标识和字符编码等标准化的问题。 x m l 、n a m e s p a c e 和x m ls c h e m a ( 语法层) x m l 是一种可扩展标记语言,它可以允许人根据它自身所提供的规则,去 针对需要而制定各种各样的标记语言,并可以通过数据类型定义( d t d ,d a t a t y p e d e f i n i t i o n ) 或x m ls c h e m a 来对其组织结构进行约束。所以这一层主要 是通过x m l 和它的相关技术来定义数据交换的一种格式,它只是从信息资源的 结构等语法上进行处理,并没有解决信息资源中的相关联系等问题,对定义的信 息资源的具体含义的定义和互操作都交给上层去解决。 r d f 和r d f s c h e m a ( 元数据层) r d f ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ) 是关于规定网络上相关资源的语义 描述框架,也就是一种丌放的元数掘描述框架,是属于语义网中的元数据层。 r d fs c h e m a 是进一步定义了与具体应用领域相关的建模原语,能为特定目标的 应用提供个共同的基础。通过r d f 和r d fs c h e m a ,解决了语义网中描述资 源对象的二义性的问题,使得描述的资源的元数据信息成为机器可理解的信息, 并解决与实现了元数据的互操作能力。但它们描述语义的功能还是非常有限的, 所以仍需要进一步的扩展。 o n t o l o g yv o c a b u l a r y ( 词汇层) 由于下层的r d f 和r d fs c h e m a 对具体应用领域的信息资源的描述能力比 较弱,需要进一步扩展,所以就有了这一层词汇层o n t o l o g y 层。 这一层可以说是语义网七层结构中的核心层,为上面各层提供服务。本体通 过它的良好定义的应用领域的概念结构,对领域中的概念和属性进行描述,从而 在很多不同的应用之间形成共享。也就是在提供语义的同时,提供了语义交换的 方式,使得在不同的智能体之间达成具体领域的概念的共识,这也是语义网的构 建过程中的重中之重。 l o g i c 、p r o o f t r u s t ( 逻辑层) 尽管利用前面两层可以对网络上的信息资源内容进行描述,但对于语义网的 实现还是不够的,语义网上的应用要求能够根据特定的规则从这些描述完整、定 义准确的知识中进行推理。而语义网中的逻辑层( l o g i c ) 就是提供这样的一种 中山大学硕士学位论文 第2 章本体研究的综述 规则描述方法,所谓的逻辑也是通过计算机自动推理的规则集合来体现出来,而 这些规则是通过计算机可识别的逻辑描述语言进行描述表示。 目前语义网中的研究主要集中于前三层,也就是对网络上的信息资源的规范 描述,对最上面的两层p r o o f 和t r u s t 这两层的概念目前还没有一个成熟的说法。 但有一点可以肯定的是这两层是语义网的实现中的重要组成部分p r o o f 层是对 计算机推理过的结论给出一个自动的合理的解释。而t r u s t 层则是对资源信息及 推理的可信程度提供一种有效的衡量和评价。 语义网中的应用是在某种事实的基础上,通过应用逻辑推理得出某种结论。 推理的过程就是对结论命题的证明,并且这个推理过程是可信和可重现的。 2 1 3本体在语义网中的作用 随着语义网概念的提出和进一步深入研究,目前出现了许多基于语义网的应 用,比较多的是在智能信息检索、知识管理和语义网服务等应用。由于网络的迅 速发展,信息资源的急剧膨胀,使得传统的信息检索出现了种种问题,而问题根 源在于传统网络中的信息表示方法存在有语义的问题,所以可以利用本体对网络 中的大量信息提供语义信息,结合自然语言处理、模式识别和机器学习等相关技 术,实现智能的信息检索。另外,网络通过提供各种网络服务( w e bs e r v i c e ) , 使得网络已经在人们的工作,生活中越来越重要,但现在网络服务中的x m l 等技 术对服务的描述能力很有限,且缺少一定的灵活性,所以可以充分利用本体来提 供更标准的方式来对服务进行描述,目前已提出o w l s 等基于本体的网络服务描 述语言,并以此提出了语义网服务( s e m a n t i cw e bs e r v i c e ) 。 从上述语义网应用的描述中可以看出本体在语义网中的重要性。而且本体在 语义网的七层结构中是位于中间层,起着“承下启上”的作用,只有在通过本体 层以及其下面三层结构对各种所需信息进行良好定义,并赋予足够合理的语义的 基础上,才能使网络中上层的应用以及服务得以最终实现。由此也可以看出,本 体的合理构建对整个语义网来说是非常重要的。 9 i _ _ l 山大学硕士学位论文第2 章本体研究的综述 2 2 本体技术的研究 2 2 1本体的概念与分类 1 本体的概念 由于计算机网络相关技术的快速发展,面对着大量的信息、知识,如何对它 们进行表示、组织、管理和维护的问题就更加突出,对该问题的解决也显得越来 越迫切。归结起来,问题的根本在于缺少对某个领域进行通用概念上的描述,而 本体( o n t o l o g y ) 作为一种能在语义和知识层次上描述信息系统的概念模型建模 工具,可以很好的解决这些问题。 本体( o n t o l o g y ) 在其发展过程中有很多含义n 从哲学上来说是“对于存 在的研究或科学”。上世纪9 0 年代,本体( o n t o l o g y ) 逐渐被引入人工智能和知 识工程等领域,这时人们通常引用g r u b e r 在1 9 9 3 年的定义【8 】:“一个概念体系 的明确规范”。1 9 9 8 年s t u d e r 等人在这个定义的基础上针对本体的特点给出了一 个更为明确的解释【1j :“本体是对概念体系的明确的、形式化、可共享的规范说 明”。从这个概念中可以看出本体的四个重要方面,分别是: 概念化:对客观世界中一些现象的相关概念及其属性进行抽象,概念化 的术语体系表现出的含义具有一定的独立性,领域相关性程度降低; 明确性:对概念化形成的概念及这些概念的属性等约束进行种确定含 义的定义: 形式化:对本体中的概念和属性等进行形式化是使得本体能够是计算机 可读的( 即能被计算机自动处理) ; 共享:本体中体现的是某个或某些特定领域所达成的共同的认可的知识, 反映的是该领域中公认的概念集合,所以,也可以说本体是相对于这些 领域中团体而非个体的一种共识。 2 本体的分类 从目前有关本体的研究与应用成果【7 】中可以看出,从总体上说应用本体都是 为了使系统获得某种方式的复用( r e u s i n g ) ,一部分研究主要将本体看作是构造 知识庠的种途径,一部分将本体看作是知识库的组成部分,此外还有将本体视 为应用相关的交互工具以及企业本体。 1 0 中山大学硕士学位论文 第2 章本体研究的综述 所以,一般来说关于本体的分类有多种。根据应用的领域规模和目的的不同, 本体可以分为一下几类: 上层本体( g e n e r a l u p p e r o n t o l o g y ) :对世界上的通用知识,即普遍存 在的知识( 这些知识不依赖某个特定问题或学科领域) 进行定义,表述 的本体。所以,在这类本体中被定义的知识是可以跨不同学科被应用的, 一般包括与事物、事件、时问、空间相关的词、概念,它们相对来说是 属于抽象的范畴; 描述性或元本体( r e p r e s e n t a t i o no n t o l o g y 或m e t a o n t o l o g y ) :在一 个给定的知识表达系统中,捕获用于将知识规范化的元概念; 领域本体( d o m a i no n t o l o g y ) :是更为专业性的本体。在这类本体中被 表述的知识是针对特定学科领域的,专注于解决领域知识的抽象,较为 具体,容易形式化和共享,它们一般提供了关于某个学科领域中术语的 概念集合以及它们之间的关系等; 应用本体( a p p l i c a t i o no n t o l o g y ) :描述既依赖于某个特定领域又依赖 于某种特定应用的部分知识。它们与解决问题的方法等相关联,一个应 用本体中的概念是解决问题的方法的组成部分。它们明确显示出在给定 的解决问题的方法中专业领域的概念所起的作用。 上述的分类方法可以说在本体领域中得到最普遍的认同,但仍有其它的分类 方法。如:m i z o g u c h i 等在1 9 9 5 年建议按照本体的内容划分类别。在此情况下, 只考虑y - 类本体:d o m a i no n t o l o g y 、g e n e r a lo n t o l o g y 、t a s ko n t o l o g y 。其中 的t a s ko n t o l o g y 提供了用于解决与特定任务相关的问题的术语,也有称之为 p r o b l e m s o l v e do n t o l o g y a p p l i c a t i o n0 n t o l o g y 。 2 2 2本体的特点与应用 1 本体的特点 本体的特点可以从它的定义中体现出来,也就是它可以将某个或多个特定领 域的概念和术语通过形式化的描述来实现规范化,使本体为该领域或多个领域之 间的实际应用提供帮助。具体的说,本体的主要特点如下: 本体可以在不同的建模方法、范式、语言和软件工具之间进行翻译和映 小山大学硕二匕学位硷文 第2 章本体研究的综述 射,以实现不同系统之间的互操作和继承; 本体在结构上和功能上与数据库类似,但它却可以表示更多丰富的信息, 提供一个严谨且丰富的领域相关的理论; 本体是领域内重要实体、属性、过程及其相互关系形式化描述的基础。 这种形式化的描述可成为软件系统中可重用和共享的组件: 本体可以为多个领域的应用提供很好的帮助。如:知识管理系统中,可 以提供更好的知识共享和知识定义,从而提高以此为基础的知识搜索等: 利用本体的良好的抽象的描述的特点,可以应用在企业逻辑建模中,提 供人们更好的企业决策的支持。 2 本体的应用 在本体的发展过程中,有许多基于本体的应用,可以按本体沦的起源和概念 简单地归结为以下三类1 9 ”】: ( 1 ) 人与组织之间的信息交流:本体的核心概念是知识共享,利用本体的一 致性与明确性来减少概念和术语上的歧义,通过本体描述为某个组织或多个组织 提供了一个统一框架或是共同的规范化标准化的模型,使得来自不同背景,持不 同观点和目的的人员之删的理解和交流成为可能,并保持语义上的致性,从而 达成共识; ( 2 ) 软件工程:在需求分析中,本体论通过对问题和任务的理解描述,提高 明确性,减小分析代价。同时,本体可进一步作为软件设计的基础,以( 半) 自 动方式检查需求和设计的一致性,提高软件可靠性。本体还可以通过对系统内部 各个功能模块和它们之间的联系的详细描述提高软件的重用性: ( 3 ) 系统之间的互操作:本体可以在完全不同的建模方法、范例、语言及软 件工具之间进行翻译和转换,从而实现不同系统之间的相互操作和集成。为提高 互用性,本体能作为中间语言,用来支持不同语言与表示之间的转换。也就是应 用程序使用本体可以实现异构系统之间的互操作,即不同系统或是: 具之间的数 据传输。 其中,本体在信息系统的集成上的应用最为典型,也最为普遍,可以进一步 细分为以下3 种: ( 1 ) 基于本体共享的信息访问。不同的应用程序开发人员在共享本体上达成 一致,即定义了一个可以双向转换的数据传输的格式; 中山大学硕士学位论文 第2 章本体研究的综述 ( 2 ) 基于本体映射的信息访问。与前一种应用不同的是,不同的应用程序之 间拥有自己独立的本体,而不存在一个共享的本体,因此它们之间的信息共享或 者数据交换只能通过不同的独立本体之间的映射( m a p p i n g ) ; ( 3 ) 基于本体的信息检索。本体在信息检索中应用的基本思路是利用本体对 信息的描述来检索知识库,从而提高检索的效率和精确度。信息检索的需求主要 是三方面:信息的完整性,信息的准确性,检索的效率。 2 2 3本体的存在的缺点 ( 1 ) 本体的形式化不够完善。尽管目前有多种形式化描述语言,也可以尽可 能详尽的描述本体,但仍存在有很大不足,如:语义网中的标准本体描述语。言 o w l , 其中的o w lf u l l 虽然可以用来描述本体,但其描述的本体很难进行推理等操作, 所以在形式化程度与推理能力存在着平衡与制约关系,也就是形式化程度越高, 它的可推理能力越弱,反之亦然,所以本体的形式化尚待进一步完善; ( 2 ) 本体的构建缺乏统一的标准化的方法论。当前对构造本体的方法和方法 的性能评估还没有一套成熟的方法论。近些年来,很多方法通过借鉴工程化方法 理论来帮助本体的构建,取得了比较好的效果,但这些仍是处于探索与研究阶段, 一套统一而标准的构建方法是必需的。另外,由于本体的构建过程中还是需要领 域专家的参与,所以使得本体的构建方法有更多的不可预见之处; ( 3 ) 本体的维护和评价缺乏统一的标准化的方法论。一方面,从本体的构建 工具上来说,目前主要的本体构建工具,如:p r o t 6 9 6 等,可以提供本体的重用 和维护提供了一些辅助,但仍是不够完善的 另一方面,在本体开发后,如何对 本体进行管理、维护、评价没有统一而标准的方法,从而很难对本体有一个客观 而合理的评价; ( 4 ) 本体的构建缺少好的获取方法。目前本体的构建多数是采取手工方式, 在领域专家的帮助下,手工获取本体中的概念、属性等词汇,这个过程是耗时而 困难的过程,而且同时也会造成本体缺少完备性。虽然近些年来对本体的自动、 半自动获取的研究取得了一些进展,如:通过知识、数据挖掘等手段实现本体的 自动构建等,。但仍需进一步的研究; ( 5 ) 本体应用不够广泛。目前已经构建出来的本体有很多,但其中也有一部 巾山大学硕十学位论文第2 章本体研究的综述 分并不能真正的应用起来,造成一种为建本体而建本体,不是为应用而建本体。 另外,即使实现了本体的应用,而应用却并没有真的体现出本体的自身优势,从 而提高应用效果,所以这一状况也需改善。 2 3 本体的描述语言比较 2 3 1本体描述语言的概述 本体描述语言”】是让用户可以对某个或某些领域进行清晰的、形式化的概 念性描述,因此它应该满足以下要求【1 3 l : 良好定义的语法( aw e l 卜d e f i n e ds y n t a x ) 良好定义的语义( aw e l 卜d e f i n e ds e m a n t i c s ) 有效的推理支持( e f f ic i e n tr e a s o n i n gs u p p o r t ) 充分的表达能力( s u f f i c i e n te x p r e s s i v ep o w e r ) 表达的方便性( c o n v e n i e n c eo fe x p r e s s i o n ) 在具体的应用中,本体的描述方式可以多种多样,主要可分为4 大类【9 1 :非形 式化、半非形式化、半形式化、形式化语言。可以用自然语言来描述本体,也可 以用框架、语义网络或逻辑语言等来描述本体。虽然具体描述本体的方法很多, 但是目前使用最普遍的方法是l o o m ,c y c l ,o w l 等。 本体描述语言的发展也是随着本体的发展而发展着,最早起源于人工智能领 域对知识表示的研究,主要有以下语言:k i f 和o n t o l i n g u a ,o k b c ( o p e nk n o w l e d g e b a s ec o n n e c t i v i t y ) ,o e m l ( o p e r a t i o n a lc o n c e p t u a lm o d e l i n gl a n g u a g e ) , f r a m el o g i c ,l o o m 等。具体结构如图2 - 2 所示,其中灰色背景的部分是这些描 述语言的基础。 中山大学硕士学位沦文 第2 章本体研究的综述 图2 - 2 基于应用的本体描述语言 近年来,网络技术为全球信息共享提供了更为方便的手段,以共享为特征的 本体论最终与网络技术相结合。因此,基于网络标准的本体描述语言正成为本体 论和应用的热点研究对象,主要有以下语言:s h o e ( s i m p l eh t m lo n t o l o g y e x t e n s i o n ) ,o m l ( o n t o l o g ym a r k u pl a n g u a g e ) ,x o l ( o n t o l o g ye x c h a n g e l a n g u a g e ) ,r d f ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ) 等。 然而在本体描述语言的发展过程中,出现了急需解决的问题,如:对推理的 有效支持( 包括计算复杂性和可判定性等) ,正规和充足的语义表示机制,以及 标准化问题。这也促进了基于描述逻辑的本体语言的发展。 描述逻辑( d e s c r i p t i o nl o g i c s ) 1 1 4 1 是近2 0 多年来人工智能领域研究和开发 的一个相当重要的知识表示语言,现在更多地作为本体描述语言的基础。描述逻 辑具有很多优点,如: 定义良好的语义和表示能力; 基于逻辑的推理能力; 保证计算复杂性和可判定性; 明确的推理算法,如:基于t a b l e a u x 的算法; 现有工具的有力支持,如高度优化的推理机f a c t ,r a c e r 等。 利用描述逻辑的这些优点可以很好的解决基于网络的本体描述语言的发展, 山大学硕士学位论文 第2 章本体研究的综述 c k m l ,o i l ( o n t o l o g yi n f e r e n c el a y e r o n t o l o g yi n t e r c h a n g el a n g u a g e ) , d a m l + o i l 以及己成为w 3 c 国际标准的o w l ( o n t o l o g yw e bl a n g u a g e ) 就是建立 在描述逻辑的基础上。主要的基于网络的描述语言具体如幽2 - 3 所示,其中灰色 背景的部分是目前s e m a n t i cw e b 的标准语言,较为流行。 图2 - 3 基于网络的描述语言结构图 2 3 2本体描述语言的比较 表2 - 1 是对以上这些主要的本体描述语言f 1 5 ,16 1 的比较 十 p 础 础 删 娜 i一汁球鱼斗昧高甬h 拉*诗窨牵越墨蒋薛 姗n1卅煳嚣抖寄蒜爵吾叫害再!i;受 i ,山大学硕士学位论文第2 章本体研究的综述 从比较中可以看到: ( 1 ) 描述语言的表达能力和推理能力之间有很强的相互依赖性,也就是说一 个描述语言的表达能力常常因为要保证一定的推理能力而不得不变弱: ( 2 ) 描述语言一般仅包含概念、二元的关系、实例,但在表达概念的分类上 有些不同,如:o n t o l i n g u a 、l o o m 、o c m l 、o i l 、d a m l + o i la n do w l 允许 建立互不相干的子类; ( 3 ) 多数描述语言不能表达多元关系,只能通过分解的方法,利用二元关系 来表达; ( 4 ) 多数描述语言不支持规则( r u l e ) 的定义; ( 5 ) 多数描述语言的推理机制仅是用来进行一致性检查等。 2 4本体的构建工具比较 从知识表示的角度来看,本体的构建工具可以分为两大类,一类是女h o i l e d 等基于描述逻辑的工具;另一类是遵循基于框架和一阶逻辑的混合方法来表示知 识的工具。此外,还有其它诸如p r o t 6 9 6 等工具。 表2 - 2 是对主要的几个本体构建工具进行比较: i=l_i汁锥疑=:i_:昧高高h 斟k辟*赛毫盈s蒋藩 滩2”卅煳吕抖辞茸j耋h枷3爵交 = 1 - 山大学硕士学位论文第2 章本体研究的综述 从比较中可以看到: ( 1 ) 这些工具均不包括项目管理功能和本体维护等功能,而只是提供了简单 的本体评价支持; ( 2 ) 这些工具虽然具有推理( 包括工具内置的推理和外联的推理) 、约束和 一致性检验机制、自动分类等功能,但没有关于异常处理的功能; ( 3 ) 本体构建工具在帮助系统、编辑和可视化等有关的可用性进一步完善; ( 4 ) 本体构建工具存在互操作的问题,即当要把本体集成到由不同知识本体 工具组成的知识库中时,或者用本体合并工具来合并由不同的工具和语言构建的 两个知识本体时所引起严重的问题; ( 5 ) 本体构建工具不能涵盖知识本体开发生命周期中的所有活动。 中山大学硕士学位论文 第3 章本体的构建方法 第3 章本体的构建方法 目前已有很多本体【7 1 出于对各自领域和具体工程的考虑,构造本体的方法 和过程也是不尽相同的。由于没有一个标准的本体构造方法,不少研究人员为帮 助和指导人们构造本体,根据实际经验,提出了不少有益于构造本体的标准,其 中最有影响的是g r u b c r 在1 9 9 5 年在文献【8 】中提出的5 条规则: 明确性和客观性:即本体应该用自然语言对所定义术语给出明确的、客 观的语义定义; 完全性:即对本体中概念等的定义必须是完整的,能够完全表达所描述 术语的含义; 一致性:即由本体推理出的结论与有关术语的含义是一致的,不会产生 矛盾;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论