已阅读5页,还剩65页未读, 继续免费阅读
(计算机软件与理论专业论文)本体理论在web服务中的应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本体理论在w e b 服务中的应用 摘要 本体( o n t o l o g y ) 的概念起源于哲学领域。自2 0 世纪9 0 年代以来,国际计算机 界举行了多次关于本体的专题研讨会,如今本体技术已经发展成为知识表示、 知识管理、知识共享、知识复用中的主流技术之一,正成为自然语言处理、w 曲 信息检索、数据库和知识库管理、异构数据集成、数字图书馆、g i s 、语义w e b 等研究领域共同关心的一个核心课题。 如今w e b 服务已经成为电子商务的常用手段。然而随着w e b 服务应用的发 展,w e b 服务面临着开发成本高、组合易出错、维护代价高、低效率性、低及 时性等问题。同时w e b 应用也面临着自动化及语义保持等问题。语义w e b 服务 是w e b 服务和语义w e b 的结合,是解决上述问题的最佳方案。本体论研究包括 语义w e b 的研究和w e b 服务的研究。在语义w e b 多层框架中,本体层位于文档 描述层和知识推理层中间,因而本体的研究、表示、构建是实现语义w e b 和w e b 服务的关键基础。 本论文在调研了国内外大量文献和网页的基础上,全面研究探索了本体的 理论与方法。在这些理论的指导下,本文的主要研究工作: ( 1 ) 传统工作流模型往往是一种静态模型,很难适应现代企业的业务流程需 要,是动态工作流模型提出的动机所在。本论文提出了基于半结构化的工作流 本体,并在此基础上建立b a w sw f m s 动态工作流模型,全面阐述了 b a w sw f m s 体系结构及组成部分的功能,分析语义匹配过程中几种情况,以 及组合规则。 ( 2 ) 基于b a w sw f m s 体系结构,在w e b 服务发布、发现、组合整个过程 中服务发现是非常关键的一个环节,考虑服务发现过程中语法相似性、操作相 似性、语义相似性,以及w e b 服务发现的高效性、低代价性,提出了d d c 算法, 并且分析了其性能及特点。 ( 3 ) d d c 算法的提出,主要解决了现有算法两个方面的不足:通过语义映 射,避免盲目匹配,提高了匹配是否成功的效率通过语义映射,确定目标服 务是单个服务还是非平凡服务,提高了发现目标服务的效率。通过实例验证、 证明了算法的可行性、正确性和有效性。 关键词:本体;w e b 服务;领域;工作流;算法 a p p l i c a t i o no fo n t o l o g yt h e o r yi nw e b s e r v i c e s a b s t r a c t o n t o l o g yo r i g i n a t e di np h i l o s o p h y s i n c e19 9 0 s ,s o m ew o r k s h o p s o no n t o l o g y h a v eb e e nh e l di nt h ei n t e r n a t i o n a lc o m p u t e rc o m m u n i t y o n t o l o t yh a sb e c o m eo n e o ft h em a i nt e c h n o l o g i e so fk n o w l e d g er e p r e s e n t a t i o n ,k n o w l e d g em a n a g e m e n t , k n o w l e d g es h a r i n ga n dk n o w l e d g er e u s eb yn o w i ti s a l s ob e c o m i n gac o m m o n d i v o t a ls u b j e c ta m o n gt h er e s e a r c hf i e l d ss u c ha sn l p ,w e bi n f o r m a t i o nr e t r i e v a l , d a t a b a s em a n a g e m e n t ,k n o w l e d g em a n a g e m e n t ,h e t e r o g e n e o u sd a t ai n t e g r a t i o n , d i g i t a ll i b r a r i e s ,g i s ,s e m a n t i cw e b ,e t c t o d a yw e bs e r v i c e sh a v eb e c o m eac o m m o n m e a n so fe - c o m m e r c e h o w e v e r , w i t ht h ed e v e l o p m e n to fw e bs e r v i c e sa p p l i c a t i o n s ,w e bs e r v i c e sf a c ew i t ht h e h i g hc o s to fd e v e l o p m e n t ,c o m p o s i t i o ne r r o r p r o n e ,h i g hm a i n t e n a n c ec o s t s ,l o w e f f i c i e n c y 1 0 wt i m e l i n e s ss u c hi s s u e s a tt h es a m et i m ew e ba p p l i c a t i o n l sa l s o f a c i n gw i t ha u t o m a t i o na n ds e m a n t i ci s s u e ss u c ha sm a i n t a i n i n g s e m a n t i cw e b s e r v i c e sa r et h ec o m b i n a t i o no fw e bs e r v i c e sa n ds e m a n t i cw e b ,w h i c hi s t h eb e s t s o l u t i o nt ot h ea b o v ep r o b l e m o n t o l o g i c a lt h e o r yr e s e a r c h ,i n c l u d i n gs e m a n t i c w e br e s e a r c ha n dw e bs e r v i c e sr e s e a r c h ,i nm u l t i s t o r e yf r a m e w o r ko fs e m a n t i c w e b o n t o l o g yl a y e rl o c a t e sb e t w e e nd o c u m e n t sd e s c r i b e dl a y e ra n dk n o w l e d g e r e a s o n i n gl a y e r s oo n t o l o g yr e s e a r c h ,d e s c r i p t i o n ,c o n s t r u c t i o n a r et h ek e yt o a c h i e v es e m a n t i cw e ba n dw e bs e r v i c e s u n d e rt h eg u i d a n c eo ft h e s et h e o r i e s ,t h e m a i nr e s e a r c hw o r k si nt h i s d i s s e r t a t i o n : ( 1 ) t r a d i t i o n a lw o r k f l o wm o d e li s o f t e nas t a t i cm o d e l ,i sd i f f i c u l tt oa d a p tt o t h em o d e me n t e r p r i s eb u s i n e s sp r o c e s s e sn e e d ,w h i c hi s t h em o t i v a t i o no ft h e d y n a m i cm o d e lp r o p o s e d t h i sd i s s e r t a t i o np r o p o s e sas e m i 。s t r u c t u r e db a s e dt h e w o r kf l o wo n t o l o g y ,a n de s t a b l i s h e sad y n a m i cf l o wm o d e lb a w s w f m so nt h e b a s i so ft h i s e l a b o r a t e sa r c h i t e c t u r eo fb a w s _ w f m sa n df u n c t i o n so fc o m p o n e n t , a n a l y z e s s e v e r a lc a s e sd u r i n gs e m a n t i cm a t c h i n gp r o c e s s ,a s w e l la st h e c o m p o s i t i o nr u l e s ( 2 ) b a s e do nt h ea r c h i t e c t u r eo fb a w s _ w f m s ,w e bs e r v i c e sd i s c o v e r yi s a v e r yc r i t i c a lc o n n e c t i o nd u r i n gw e b s e r v i c e sd e p l o y m e n t 、d i s c o v e r y 、c o m p o s i t i o n p r o c e s s t h i s d i s s e r t a t i o n p r o p o s e s ad d ca l g o r i t h m ,c o n s i d e r i n gs y n t a x s i m i l a r i t y 、o p e r a t i o ns i m i l a r i t y 、s e m a n t e m es i m i l a r i t yd u r i n gt h e w e bs e r v i c e s d i s c o v e r yp r o c e s s ,a sw e l l a st h eh i g he f f i c i e n c y 、l o wc o s t ,a n da n a l y z e s i t s l i p e r f o r m a n c ea n dc h a r a c t e r i s t i c s ( 3 ) d d ca l g o r i t h mp r o p o s e ds o l v e sm a i n l yt w oa r e a si n a d e q u a t eo ft h ee x i s t e d a l g o r i t h m :t h r o u g h s e m a n t i c m a p p i n g ,a v o i d s b l i n dm a t c h i n g ,i n c r e a s e s e f f i c i e n c yt ot h es u c c e s so ft h em a t c h t h r o u g hs e m a n t i cm a p p i n g ,i d e n t i f i e st h e t a r g e ts e r v i c ei sas i n g l es e r v i c eo rn o n t r i v i a ls e r v i c e s ,a n de n h a n c e st h ee f f i c i e n c y o fd i s c o v e r yo fat a r g e t s e r v i c e t h r o u g he x a m p l e sw ed e m o n s t r a t et h a tt h e f e a s i b i l i t yo ft h ea l g o r i t h m ,a c c u r a c ya n de f f e c t i v e n e s s k e y w o r d s :o n t o l o g y ; w e bs e r v i c e s ;d o m a i n ;w o r k f l o w ;a l g o r i t h m 1 i i 图1 - 1 图2 - 1 图2 2 图2 - 3 图2 4 表2 1 表2 - 2 表2 - 3 图2 - 5 表2 4 表2 - 5 图3 1 图3 - 2 图3 - 3 图4 1 图4 - 2 图4 - 3 图4 4 图5 - 1 图5 - 2 图表清单 本体研究和开发的层次关系图4 t o v e 流程图8 骨架法流程图:9 s e n u s 术语构造图1 0 a nr d f 实例1 5 r d f s 的核心类1 7 r d f s 的核心属性1 7 r d f s 的核心限制1 8 o i l 与r d f s 的关体系结构2 2 o i l 中的类定义、属性定义和公理定义2 4 o w l 的三个子语言描述2 5 w e b 服务架构图2 8 w e b 服务体系结构堆栈2 9 语义w e b 层次图3 7 o w l s 顶层服务本体4 5 半结构化工作流本体4 6 病人就医流程4 8 b a w s w f m s 体系结构4 8 流程图5 4 服务组合d a g 图5 6 v h 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所 知,除了文中特别加以标志和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果。 也不包含为获得金匿些太堂 或其他教育机构的学位或证书而使用过的材料。与我一同工作 的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签字:昊乃鑫 签字日期:力僻争月乡佣 学位论文版权使用授权书 本学位论文作者完全了解佥旦曼互些太堂有关保留、使用学位论文的规定,有权保留并向 国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅或借阅。本人授权金起互些太 堂可以将学位论文的全部或部分论文内容编入有关数据库进行检索,可以采用影印、缩印或扫 描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文者签名:足乃佥 导师签名受( , 签字日期:z 刃髀牛月扣日签字日期:跏8 年月岁6 目 学位论文作者毕业后去向: 工作单位: 通讯地址: 电话: 邮编: 致谢 终于写到了这一页,这意味着学位论文写作结束的一页,也意味着三年研 究生生活即将结束的一页。此时此刻的心情是非常复杂的,有着论文写作过程 即将完成的欣慰,有着面临答辩的忐忑,有着走上工作岗位的憧憬,也有着即 将离开校园的失落,然而最多的,还是心里充满了太多的感谢与感激之情,觉 得自己要感谢的人太多了。 感谢我的导师吴国风副教授三年来的谆谆教诲,您的博学、严谨、不辞辛 劳和精益求精不仅让我学到了应该学得的知识,更给了我今后一生为人处事的 准则。除了学习上严格要求之外,您在课题研究、生活等各方面给予我悉心的 指导和帮助。在此,我衷心祝愿吴老师身体健康、阖家欢乐! 感谢合肥工业大学计算机与信息学院的王浩副院长、曹航老师、徐静老师 和王新生老师在日常事物中提供的帮助。 感谢合肥工业大学给了我良好的学习和生活环境,让我在她广阔的胸怀里 快乐的生活、学习了三年。 感谢我的父母,我所迈出的每一步,都凝聚着您们的心血和汗水,是您们 的支持、理解和帮助让我克服了困难、不断地进取。您们始终如一的支持和关 爱,是我一直勇敢向前的力量之源,您们深深的关爱和牵挂让我有了对生命的 激情和前进的动力。感谢我的哥哥姐姐,在我学习期间的关心和支持,特别要 感谢我的哥哥吴乃忠在我人生迷茫之时,给我指明了方向和支持的动力! 感谢我的爱人王赞小姐,在我读研期间很少陪她,很少与其团聚,她深深 的爱和默默的支持,我甚是由衷地感激! 感谢我的岳父、岳母,他们在生活上 的帮助使我能有更多的时间、更多的精力来学习、研究。感谢合肥工业大学化 学工程学院张兴法教授在学习、生活方面给予的指导和帮助。 我还要感谢朝夕相处的朋友们,是你们给我的学习生活带来了快乐,增添 了色彩,我将永远记得你们伴我走过的每一个日子,谢谢你们的情谊和帮助。 最后,衷心地感谢评阅、评审、出席论文答辩会的各位专家在百忙中给予 悉心的指导! 感激与感谢之情,无法用言语来表达清楚。感谢所有关心、帮助过我的所 有人,在你们激励的目光中,我将继续奋力前行! i v 作者:吴乃鑫 2 0 0 8 年4 月 1 1 本体概述 第一章绪论 “本体论”( o n t o l o g y ) 原是哲学上的概念,在西方哲学史和中国哲学史中 分别具有各自的含义。在西方哲学史中,本体论是指关于存在及其本质和规律 的学说,1 7 世纪初就已经被提出了,那时主要用于避免“形而上学 中的一些 二义性问题;1 8 世纪初被哲学界广泛采用;2 0 世纪的分析哲学中本体论正式 成为研究实体存在性和存在本质等方面的通用理论。在中国古代哲学中,本体 论又叫做“本根论 ,指探究天地万物产生、存在、发展变化的根本原因和根 本依据的学说。 2 0 世纪9 0 年代初期,国际计算机界举行了多次关于本体的专题研讨会, 本体已经成为包括知识工程、自然语言处理和知识表示在内的诸多人工智能研 究团体的热门课题,其主要原因在于本体使人与人、人与机器、机器与机器之 间的交流建立在对所交流领域的共识基础上。本体在知识库系统开发中较多应 用于开发领域模型,它提供了建模所需的基本词汇并说明了它们之间的关系。 建立大型知识库的第一步就是设计相应的本体,这对于整个知识库的组织至关 重要。 1 2 本体的定义 在计算机界,尤其是知识工程界,人们对本体的认识和定义经历了一个不 断深化的过程。不同于哲学中的本体论概念,计算机科学中的本体有自己特定 的含义。下面,我们给出目前比较有代表性的几种定义。 1 9 9 1 年n e c h e s 3 8 】等人指出:“一个本体定义了组成主题领域的词汇的基本 术语和关系,以及用于组合术语和关系以定义词汇的外延的规则”。然而这个 定义仅仅给出了知识工程中的本体的一个基本指南,即:要建立本体,首先要 识别所面对领域的基本术语和这些术语之间的关系,然后要识别组合这些术语 和关系的规则,并提供这些术语和关系的定义。 g r u b e r 3 9 , 4 0 】在1 9 9 3 年给出的定义是:“本体是概念化的明确的规范说明 。 w n b o r s t 4 1 】对这个定义稍微作了修改:“本体是共享的概念模型的形式化的 规范说明 。g r u b e r 和b o r s t 的本体定义都强调了给出形式解释的可能性,缺点 是没有对其中的“概念化 给出明确的解释。s t u d e r 4 2 】在1 9 9 8 年给出的定义是: “共享概念模型的明确的形式化规范说明”,这一句话体现了本体四层含义, 概念模型( c o n c e p t u a l i z a t i o n ) :通过抽象出客观世界中一些现象的相关概念而得 到的模型,其表示的含义独立于具体的环境状态。明确( e x p l i c i t ) :所使用的概 念及使用这些概念的约束都有明确的定义。形式化( f o r m a l ) :o n t o l o g y 是计算 机读的。共享( s h a r e ) :o n t o l o g y 中体现的是共同认可的知识,反映的是相关领 域中公认的概念体,它所针对的是团体而不是个体。 目前被大部分人公认的定义是g m b e r 【3 9 , 4 0 1 在1 9 9 4 年提出的:“本体是关于 共享概念的一致约定。共享概念包括用来对领域知识进行建模的概念框架、需 要互操作的主体之间用于交互的与内容相关的协议,以及用于表示特定领域的 理论的共同约定。在知识共享的情况下,本体的形式化为具有代表性的词汇的 定义。一种最简单的形式是一种层次结构,用来详细描述类和它们之间的包含 关系。关系数据库的框架( s c h e m a t a ) 也是种本体,它用来描述能共享的数据 库之间的关系和集成这些数据库需遵循的约束”。 1 3 本体的分类 对于本体的分类可以从多个角度考虑,本文从本体主题、本体表示的形式 化程度、描述对象等方面分别讨论本体的分类。 按照本体研究的主题,当前常见的本体还可以分为如下5 种类型: l 、知识表示本体。典型的关于知识表示系统是斯坦福大学知识系统实验 室( k n o w l e d g es y s t e ml a b o r a t o r y ,简称k s l ) t 4 3 】从事的关于知识本体的研究, 包括研究知识的本质特征和基本属性。k s l 提出了k i f ( k n o w l e d g ei n t e r c h a n g e f o r m a t ) 知识描述语言 k i f 。在k i f 的基础上,k s l 在1 9 9 5 年2 月建立了全球 第一个本体服务器,通过i n t e r n e t 供全球使用。 2 、通用或常识本体。主要研究如c y c 工程和s u m o 等。1 9 8 4 年由l e n a t 教授主持,它的主要目的是建立一个庞大的人类常识知识库,用于解决计算机 软件的脆弱性问题( s o f t w a r eb r i t t l e n e s s ) 。到2 0 0 0 年为止,c y c 的常识库已有了 1 ,6 0 0 ,0 0 0 条知识,几百个微理论( m i c r o t h e o r y ) 。s u m o ( s u g g e s t e du p p e rm e r g e d o n t o l o g y ) 是i e e e 的s u o 研究小组( i e e es t a n d a r du p p e ro n t o l o g yw o r k i n g g r o u p ) 建立的顶层本体,它从抽象和具体两个方面出发对概念进行分类,目前 大约包含几千个概念。另外,中科院数学所目前正在进行的“常识知识的应用 研究也属于通用知识本体的研究范畴,s o w a 也对通用本体进行了研究。 3 、领域本体。领域本体在一个特定的领域中可以重用,它提供该特定领 域的概念定义和概念之间的关系,提供该领域中发生的活动以及该领域的主要 理论和基本原理等。对特定领域的本体研究和开发目前已涉及许多领域,如医 学概念本体、生物学知识库。在企业本体研究方面比较系统的工作包括爱丁堡 大学企业项目( e n t e r p r i s ep r o j e c t ) 和多伦多大学的虚拟企业本体( v i r t u a l e n t e r p r i s e ) 。 4 、语言学本体。关于语言、词汇等的本体。典型实例有g u m ( g e n e r a l i z e d u p p e rm o d e l ) 4 4 】,w o r d n e t 4 5 1 和m i n d n e t 4 6 3 等。w o r d n e t 是由p r i n c e t o n 大学开 发的一个庞大的语言知识库系统,其核心是词汇源文件,每个源文件包含一组 2 “s y n s e t s 的单元,每个“s y n s e t s ”单元由一组同义词、一组关系指针以及其 他信息组成,其中关系指针所表示的关系包含反义和继承等。m i n d n e t 是 v a n d e r v e n d e 和r i c h a r d s o n 在博士生研究工作期间开展的自动从在线词典中获 取语言知识的一项重要工作,现在由微软研究院继续进行。它设计了一种自然 语言的广域分析器,并利用此分析器从朗文当代英语词典和美国传统词典( 第三 版) 中的词汇解释或例句中自动获取语言概念知识。 5 、任务本体。任务本体是本体研究中的另外一个分支,与上述本体不同 的是:任务本体主要涉及动态知识,而不是静态知识。任务本体主要研究可共 享的问题求解方法,这里的推理与领域无关,具体的研究主题包括:通用任务、 与任务相关的体系结构、任务方法结构、推理结构和任务结构等。主要研究如 c h a n d r a s e k a r a n 等人的关于任务和问题求解方法本体的研究。 按照本体表示的形式化程度,可以把现有本体分成以下四类: 1 、高度非形式化本体:完全采用自然语言形式表示的本体。如:爱丁堡 大学的e n t e r p r i s eo n t o l o g y 自然语言版本。 2 、半非形式化本体:本体采用受限的或结构化的自然语言表示,以减少 二义性。如爱丁堡大学的e n t e r p r i s eo n t o l o g y 的文本版本。 3 、半形式化本体:本体用一种人工定义的形式化语言表示。 4 、形式化本体:本体的所有术语都具有形式化的语义,并能在某种程度 上证明包括一致性和完整性等方面的属性。如多伦多大学的t o v e 。 根据本体的描述对象不同,可以把本体分为特殊领域本体( 如医药本体、地 理本体、金融本体等) 、一般世界知识本体、问题求解本体和知识表示语言本体 等。 1 4 本体的基本特性 我们从以下几个方面来说明本体的特点: 1 、详尽性( e x h a u s t i v i t y ) :本体描述的广度。即,论域内所有的概念和关系 是否都能被本体所涵盖。 2 、专业性( s p e c i f i c i t y ) :本体描述的深度。即,概念和关系从专业角度被 精确定义的程度。 3 、描述粒度( g r a n u l a r i t y ) :本体中的概念定义的详细程度。即,用词汇对 概念和关系进行精确描述的程度。 4 、形式化:u s c h o l d 和g r u n i n g e r 认为,本体的形式化程度有四个级别: 高度非形式化( 自然语言形式) 、半非形式化( 受限的结构化自然语言形式) 、半形 式化( 人工的、形式定义的语言形式) 、严格形式化( 形式化的语义、定理和证明) 。 当然还有民族以及文化、语言特性。具体的本体总是要由特定语言的词汇 和术语来表达,不同的语言与不同的文化看待本体的角度不同,可能会得出不 3 同的结果。 当然本体的民族及文化特性、语言相关性与本体的反映事物本质的目标并 不矛盾。在哲学上,本体是指客观事物的本质,事物的本质是客观存在的,不 受语言、文化以及人们的认识影响。知识工程中的本体是一个人造物,反映了 人们对客观事物本质的认识,随着人们对事物认识的不断深入,它也将越来越 接近事物真正的本质。 1 5 本体研究内容 金芝对本体论研究层次图进行了修改见图1 1 ,说明了当前在本体论方面 研究与开发的不同层次上的工作。其中,顶层本体( 又称为通用本体) 主要研究 通用的概念,如时间、空间、事物、事件、对象、行为等。它们完全独立于特 定的问题或领域。第二层的领域本体则研究与一个特定领域有关的术语或者词 汇,如医学、生物等。同在第二层上的任务本体定义通用任务或推理活动,如 诊断、设计等,它们都可以引用项层本体中定义的词汇来描述自己的词汇。第 三层次上的应用本体描述特定的应用,它既可以引用涉及特定的领域本体中的 概念,又可以引用出现在任务本体中的概念。第四个层次是本体表示语言,它 为上面的本体提供表示、开发的基础。 图1 - 1 本体研究和开发的层次关系图 1 6 本体研究的意义 从上述讨论可以看出,本体己经成为知识工程中一种重要的工具,在知识 的获取、表示、分析和应用等方面具有重要的意义: 1 、本体研究促进知识工程中对本质知识的获取。知识工程的研究方向主 要包含知识获取、表示和推理方法等,其研究目标是挖掘和抽取人类知识,用 一种特定形式表示这些知识,使之成为计算机可操作的对象,从而使计算机“具 有 一定的智能,方便人与计算机之间的交互。 4 2 、本体研究促使我们显式地表示出领域知识和领域假设。领域知识包括 领域概念、概念的性质,概念之间的关系、概念之间的一般规律等。领域本体 的研究要求我们根据概念之间的类属关系显式地建立概念之问的联系,明确定 义概念所具有的属性、属性的取值约束、处理过程、概念之间的关系等。领域 本体还要求明确定义出概念内部或者概念之间的公理,以表示领域内的一般假 设或者规律。领域本体的研究使得在人看来一目了然的概念和概念之间的关系 都形式化地加以描述,使概念之间的各种规律、联系和假设等都被显式地描述 出来,这有利于全面地获取和分析并利用知识。 3 、本体研究使知识共享和知识重用成为可能。知识工程中的知识是泛指 的,包括不同领域的知识,如医学的、农业的、军事的等等;有不同性质的, 如常识的、经验性的、规律性的知识等等:有不同目的的,如用于诊断的、用 于决策的、用于规划的等等。为了操作和使用这些不同领域、不同性质或用于 不同目的的知识。人们提出各种各样的知识表示和推理方法,开发出各种不同 的知识系统。由于采用不同的表示和推理机制,这些系统之间的知识难以相互 共享,系统之间难以进行互操作。即使在同一领域内,因为领域知识包括都包 括概念、概念的性质、概念之间的各种关系、概念之间的一般规律等。这些概 念、性质、关系错综复杂,如果没有良好的组织形式,知识也很难被理解、共 享和应用。 本体研究概念所表示事物的独立于任何表示语言而存在的本质,通过研究 确立概念之间的本质联系和隶属关系,建立领域概念的完整体系,澄清了领域 知识的结构,从而能为各种不同或者相同的知识系统之间的知识共享、互操作 和重用提供手段。例如,在开发一个新的本体工程时,如果其他站点有相同的 本体,则可以直接重用这些本体,以避免重复的工作。由于所要讨论的事物的 本质是一致的,且描述的形式规范化,所以可以直接应用这些已有的工作成果。 4 、本体研究有助于知识分析。人类的知识千差万别,数量巨大。信息技 术和网络技术的发展更使人类日常所接触到的知识飞速膨胀。人们通过知识工 程、数据挖掘、知识挖掘等研究总结了多种知识获取方法,并获取了大量的知 识。如何判断这些知识是正确的、一致的、有效的是一个必然要解决的问题。 但由于知识的数量巨大、知识本身的模糊性和二义性、表示形式的多样性等, 知识分析变得非常困难。 本体论研究事物的本质,建立概念之间的结构关系,形式地表示概念、概 念的性质及概念与概念的性质之间的各种约束和公理,根据这些约束和公理可 以对知识的一致性、正确性和完备性等进行有效的检查。其次,形式化表示的 知识也有助于实现计算机的自动检测、评价。另外,本体等价的判断和本体的 转换等操作有助于从整体上对知识进行分析,以确保知识的一致性和正确性。 概括地说,知识工程中的本体主要用于分析一个论域中的类、关系以及它 们所满足的限制,构造本体的目的就是为了实现某种程度的知识共享和重用。 首先本体澄清了领域知识的结构,从而为知识获取和表示奠定了基础,可以避 免重复的领域知识分析:其次,本体统一的术语和概念使知识共享成为可能。 目前,虽然人们在知识工程领域对本体己经进行了大量研究,但这些研究 还刚刚起步。还存在着许多问题。如c y c 要建立常识知识库,但符合常识的知 识不一定是正确的知识;m i n d n e t 期望能完全自动地获取知识,但能获取的知 识种类有限;b k b 是不完全的专业知识,由于一些概念没有明确的定义,所以 共享性不好;随着对该领域理解的逐步深入,许多越来越困难的问题正一个个 呈现在人们面前。正是这些问题的难度和所具有的挑战性使人们相信,对于本 体论的研究将成为今后的一个更加活跃的研究领域。 除知识工程外,本体的研究对其他应用研究也具有重要的意义,这里主要 说明两个方面的意义: 1 、软件工程。软件工程的实践告诉我们,软件开发失败的原因往往在于 需求分析没有做好。而需求分析没有做好的原因又往往在于软件使用者和软件 开发者之间缺乏良好的交流,使得软件开发者不能快速地获取和准确地表达软 件用户的需求。应用领域和软件需求领域的领域本体提供软件使用者和软件开 发者对软件应用领域和软件需求领域的共同理解,使软件使用者和软件开发者 达成对目标系统的共识,并利用这些领域本体指导和规范整个软件生命周期, 帮助人们很好地解决问题。 2 、语义网。本体是w e b 信息在语义层次上共享和交换的基础,可以大大 加强w e b 的功能。因为网页上使用的名词或x m l 代码,能够通过由页面指向 的o n t o l o g y 给出明确的语义定义。即使有些本体把相同的概念用不同的词汇表 示,例如本体d 1 :中用词汇“电脑”表达与本体0 2 中词汇“计算机”相同的含 义,也可以通过本体之间的映射机制说明二者之间的等价性。这样本体就为语 义网提供了一套共享的术语和信息,多数据源上的异构信息通过共享的术语和 信息成为同构的信息,从而使语义网上的通讯和互操作称为可能。 总之,o n t o l o g y 技术己经发展成为知识表示、知识管理、知识共享、知识 复用的主流技术之一,正成为自然语言处理、w e b 信息检索、数据库和知识库 的管理、异构数据集成、数字图书馆、g i s 、语义w e b 等研究领域共同关心的 一个核心课题。 1 7 本章小结 本章主要介绍了与本体相关的知识,本体的起源、本体的定义,举例说明 了代表性的几个定义、从多种角度来探讨本体的分类、作为一个本体应该具有 的基本特征,最后探讨研究本体有哪些内容以及研究本体有什么重要的意义。 6 第二章本体的主要技术方法 在这一章中,我们将深入探讨本体的构建方法、本体表示语言技术,并对 它们进行了分析和比较,分析其中每个构建方法、本体语言的特点。 2 1 本体的主要构建方法 本体构建的方法是研究本体的一个热点问题。由于构建的本体多是面向特 定领域即领域本体,如果没有好的方法路线指导,就难以在不同领域本体的构 建中保持一致,也不利于本体的规模化和规范化建设。因此,关于本体构建方 法的研究对于本体的应用具有至关重要的作用。 现行的本体构建方法都不是经权威标准化机构认证的方法。m u s e h o l d 试 图制定出一套构建本体的方法,他并不是要给出一套规范性的指南,只是要表 示这种方法在他们的研究环境下能很好地发挥作用 1 0 , 1 1 1 。k m a h e s h 和b a t e m a n 都给出各自的本体构建原则【1 2 , 1 3 。这些原则都是研究人员在各自的系统开发经 验之上提出的。 出于对各自学科领域和具体工程的不同考虑,构建本体的过程各不相同。 目前尚没有一套标准的本体构建方法。一般认为,g r u b e r 在1 9 9 5 年提出的5 条规则是比较有影响的【1 4 】:,包括以下5 个方面的内容。 ( 1 ) 明确性和客观性:本体应该用自然语言对术语给出明确、客观的语义定 义。 ( 2 ) 完整性:所给出的定义是完整的,能表达特定术语的含义。 ( 3 ) 一致性:知识推理产生的结论与术语本身的含义不会产生矛盾。 ( 4 ) 最大单向可扩展性:向本体中添加通用或专用的术语时,通常不需要修 改己有的内容。 ( 5 ) 最少约束:对待建模对象应该尽可能少列出限定约束条件。 同时本文作者认为,特别是在构建领域本体的过程中,需要领域专家的参 与和协调,因为领域本体的构建是建立在不同学科基础之上的。 下面介绍几种常见的本体构建方法论。 2 1 1t o v e 法 t o v e 法,又称g r u n i n g e r & f o x “评价法 。t o v e 是指多伦多虚拟企业 ( t o r o n t ov i r t u a le n t e r p r i s e ) ,专用于构建t o v e 本体( 是关于企业建模过程本 体) ,由多伦多大学企业集成实验室( e n t e r p r i s ei n t e g r a t i o nl a b ) 研制,使用一阶 谓词逻辑进行集成。t o v e 本体包括企业设计本体、工程本体、计划本体和服 务本体。 15 , 1 6 t o v e 流程见图2 1 。 7 图2 - 1t o v e 流程图1 7 1 ( 1 ) 定义直接可能的应用和所有解决方案。提供潜在的非形式化的对象和 关系的语义表示。 ( 2 ) 将系统“能够回答的 问题作为约束条件,包括系统能解决什么问题 和如何解决。这里的问题用术语表示,答案用公理和形式化定义回答,由于是 在本体没有形式化之前进行的,所以又被称为非形式化的系统能力问题。 ( 3 ) 术语的形式化:从非形式化系统能力问题中提取非形式化的术语,然后 用本体形式化语言进行定义。 ( 4 ) 形式化的系统能力问题:一旦本体内的概念得到了定义,系统能力问题 就脱离了非形式化,演变为形式化的能力问题。 ( 5 ) 将规则形式化为公理:术语定义所遵循的公理用一阶谓词逻辑表示,包 括定义的语义或解释。 ( 6 ) 调整问题的解决方案,从而使本体趋于完备。 2 1 2m e t h o n t o l o g y 法 m e t h o n t o l o g y 法,专用于构建化学本体( 有关化学元素周期表的本 体) ,该方法已被马德里大学理工分校人工智能图书馆采用。它的流程包括:【1 8 , 1 9 】 ( 1 ) 管理阶段:这一阶段的系统规划包括任务的进展情况、需要的资源、如 何保证质量等问题。 ( 2 ) 开发阶段:分为规范说明、概念化、形式化、执行以及维护五个步骤。 ( 3 ) 维护阶段:包括知识获取、系统集成、评价、文档说明、配置管理五个 步骤。 目前,用这种方法开发的本体有:( o n t o ) 2 a g e n t :是基于本体的w e b 代理, 是使用参考本体作为知识源,在一定的约束条件下进行新知识获取的工具:【5 叫 化学本体( c h e m i c a lo n t o l o g y ) :是基于本体的化学教育代理,允许学生在学习的 基础上自测本身在该专业领域内所达到的水平。 8 2 1 3 骨架法 骨架法,称e n t e r p r i s e 法( 企业法) ,专门用来构建企业本体 ( e n t e r p r i s eo n t o l o g y ,是有关企业建模过程的本体) 【2 0 1 。 建立企业本体它是建立在相关商业企业间术语和定义的集合之上,该方法 只提供开发企业本体的指导方针。目前企业本体项目由爱丁堡大学人工智能研 究所( a i a i t h ea r t i f i c i a li n t e l l i g e n c ea p p l i c a t i o n si n s t i t u t e ) 及合作伙伴一一 i b m ,l l o y d sr e g i s t e r ,l o g i c au kl i m i t e d 和u n i l e v e r 共同承担。 “骨架法” 流程见图2 2 。 图2 2 骨架法流程图【1 7 】 ( 1 ) 确定本体应用的目的和范围:根据所研究的领域或任务,建立相应的领 域本体或过程本体,领域越大,所建本体越大,因此需要限制本体的领域范围。 ( 2 ) 本体分析:定义本体内所有术语的意义及术语之间的关系,该步骤需学 科专家的共同参与,对该领域了解得越多,所建本体就越完善。 ( 3 ) 本体表示:一般用语义模型表示本体。 ( 4 ) 本体的评价:建立本体的评价标准是清晰性、一致性、完整性、可扩展 性。清晰性就是本体中的术语应被无歧义的定义。一致性是指术语之间关系逻 辑上应一致。完整性,本体中的概念及关系应是完整的,应包括该领域内所有 概念,虽然很难达到,但应不断完善之中。可扩展性,本体应用能够扩展,在 该领域发展过程中能加入新的概念。 ( 5 ) 本体的建立:对所有本体按( 4 ) 中的标准进行检验,符合要求的以文件的 形式存放,否则转回( 2 ) ,如此循环往复,直至对所有步骤的检验结果均达到要 求为i 匕。 2 1 4s e n s u s 法 s e n s u s 法是开发用于自然语言处理的s e n s u s 语言本体的方法路线,由 美国u s c i s i 研制开发。i s i 自然语言研究小组旨在为机器翻译提供广泛的概 念结构。s e n s u s 为机器翻译提供概念结构,用该方法开发的s e n s u s 本体系 统用于自然语言程序,目前s e n s u s 语言本体共包括电子科学领域的7 万多个 9 概念。为了能在s e n s u s 基础上构造特定领域的本体,必须把不相关的术语从 中剪除。s e n s u s 本体的术语构造流程见图2 3 。 构建s e n s u s 本体的方法路线如下【2 l 】: ( 1 ) 定义“叶子”术语( 暂时还不属于s e n s u s 本体的术语) 。 ( 2 ) 用手工方法把叶子术语和s e n s u s 术语相连。 (
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年湘西土家族苗族自治州辅警协警招聘考试真题附答案详解(研优卷)
- 2025试用合同范本
- 2025年黄南州辅警招聘考试真题及完整答案详解
- 2025年锡林郭勒盟辅警招聘考试真题含答案详解(培优)
- 2025年石嘴山辅警协警招聘考试备考题库完整参考答案详解
- 2025年淮南辅警招聘考试题库含答案详解(夺分金卷)
- 2025年綦江县辅警协警招聘考试备考题库附答案详解(培优)
- 2025年遂宁辅警协警招聘考试备考题库带答案详解
- 2025年通辽辅警招聘考试真题及1套参考答案详解
- 2025年黔西南州辅警协警招聘考试备考题库含答案详解(完整版)
- 风力发电机自动消防系统
- 老年骨科患者围手术期风险因素评估
- 2025医院财务管理制度
- 难点解析山东省邹城市7年级上册期中测试卷专题测试试卷(解析版)
- 屋顶分布式光伏发电项目施工组织设计
- 《氢燃料电池货车碳减排项目方法学(JXPHCER-03-004-V01)》
- 医院传染病预防培训体系
- 脓毒症相关炎症标志物急诊应用专家共识解读课件
- 内燃机在用润滑油品质现场检验法编制说明
- 隧道消防培训课件
- 2025至2030国内抗氧化食品行业项目调研及市场前景预测评估报告
评论
0/150
提交评论