




已阅读5页,还剩56页未读, 继续免费阅读
(计算机软件与理论专业论文)本体演化方法与机制研究及应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
硕士学位论文 m a s t e r s t h e s i s 摘要 互联网已成为人们获取信息最重要的途径,互联网上的绝大多数信息是以人们 理解的格式来表示的,而作为智能软件代理并不理解和处理这些信息,互联网的潜 力还远远没有挖掘出来。为了解决这个问题,w e b 创始人r n m b e m e f s 。k e 提出了下 一代语义互联网的构想。它是当前w e b 的扩展,为当前的互联网展示了美好的前景, 它的目的是使w e b 信息更为有序,让计算机更好的与人们协同工作。语义w e b 采用 多层次的表示框架,在语义w e b 上,信息是以结构化的形式表示的,而本体则描述 了其中的语义,本体位于由文档描述到知识推理转折的层次,在语义w e b 中起着关 键的作用,它可以实现不同系统之间的翻译和映射,达到系统之间的互操作;实现 知识的共享与重用;支持形式化的描述与支持推理等,本体在语义w e b 上和其它许 多领域都有着广泛的应用。因此,对本体及其相关问题的研究对语义w e b 的发展起 着非常重要的作用。 然而本体的开发与维护是一个工程性的,复杂的过程,同样也是一个动态的复 杂的过程,在本体应用的过程中会发生各种变化,如应用环境的变化,概念的变化, 共享模型的变化等,都会导致本体出现冲突与不一致,影响本体所表示信息的有效 性,为了实现本体的共享和重用,必须根据各种变化对本体作适应性的变更,即对 本体的演化过程进行研究,从而达到本体的有效性和一致性,本文试着从版本管理 方面着手来研究本体演化的相关问题。 文章首先介绍提出该问题的背景知识,及其深入研究此问题有如何的研究意 义,概述语义w e b 与o n t o l o g y 的相关知识,对o n t o l o g y 进行一个全面的介绍,包括 起源,o n t o l o g y 描述语言,编辑工具以及与语义w e b 的关系等,重点介绍它在表达 语义互联网及其它涉及语义表达方面的支撑作用;分析了k a o n 原型系统并对其本 体的演化功能进行了描述;从整体的角度讨论了本体的系统演化框架和一般的演化 过程。对本体演化原因的分析,提出了本体演化过程中的版本管理框架;结合实际 应用,对基于本体的个性化出版物系统中本体的演化与版本管理进行分析与设计。 最后对全文进行了总结,给出了进一步的研究展望。 关键词:语义w e b ;本体;本体演化;版本管理;本体版本机制;个性化出版物 硕士学住论文 m a s t e r st h e s i s a b s t l ? a c t i n t e m e ti s b e c o m i i l gt h em o s ti m p o r t a j l tm e 赫sw h i c hp e o p l ea c q i i i f ek n o w l e d g e , m o s to ft h ei l l f b 衄a t i o ni s e x p r e s s e di nt h ef o 珊o fp e o p l e su n d e r s t 柚d i n gw h i l e i n t e l l i g e n ta g e n ts o f t w a r ec 蛆n o t 岫d e f s t 蛐d 柚dc o p e 、i t l lt h e s ei f o n n a t i o n t h e p o t c n t i a lo f t h eh t e m e ti sf a rf r o mw h a ti ti s f o ri t ,mb c m e 巧- k e ,t h ci l l t e m e t s i n i t i a t o lt h i n k0 ft h es 锄a n t i cw e bi d e ao fn e x tg e n e m t i o no ft h ei n t e m e t n st h ee x t e n t o ft h ec u r r e n tw e b ,a n di t b r i n 擎ab r i 庐tf u t u r ef o rt h em t e m e t i t sa i mi st om a k e i n f o 肌a t i o no r d e lm a k ec o m p u t e ru n d e r s t a n di n f o n n a t i o n 卸dc o p ew i t h p e o p l e h 删o i l i o u s l y s e m a n t i cw e b sf r a m e w o f ki sc o m p o s e do fm u l t i p l eh y e r s ,o nt h e s e m 柚t i cw e b ,i n | o 皿a t i o ni se x p r c s s e di l ts t m 咖r a lf o 皿强do t o l o g ye x p 咒s s c st h e s e m 锄t i cf o 珊o n t o l o g yi sa l s ol o c a t e di nl a y e rw h ic :hb e t w c e nd o c u m e n td e s a i p t i o n a n dl 【n o w l e d g er e a s o n i n g a l l di ti so f “t a li m p o n 柚c ef o rs c m a l l t i cw e b i tc a nb eu s e d t oi n t e l p r e ta i l dm 印b e t 、e e ns y s t e m sa n dr e a l i z et h ei n t e r 叩e f a b i l i t y s h 缸ea i l dr e u s et h e k n o w i e d g e ,s u p p o r tt h ef o m a ld e s c r i p t i o na n dr e a s o n i n ga n de t c i nt h em e a n t i m e , o n t o l o g y i s w i d e l yu s e di nm a i l yf i e l d s ,s u c h a si o r n l a t i o ns y s t e m ,k n o w l e d g e m 柚a g e m e n t s oi ti so fv e r yi m p o r t a 王l ts i g n i f i c 蛆c cf o rt h es e m a n t i cw c b sd c v d o p m e m t od or e s e a r c ho no n “o g y 蛐dr e l a t e dp m b l e m s w h i l ej ti sa v e r yc o m p l i c a t e dp r o b l e mt od e v e l o pa n dm a i n t a i no n t o l o g y “i sa l s oa d y n a m j cp 玎) c e s s t h e r ea r en l a n yc h a n g e sd u r i n gt h ea p p l i c a t i o no fo n t o l o g y ,s u c ha s a p p l i c a t i o ne n v i r o n m e n t sc h a i l g c ,c o n c c p t i o nc h 卸g e ,s h a r em o d e lc h a g ec t c t h e ya l l c a u s et h ec o n f l i c t sa n di n c o n s i s t e n t ,i n f l u e n c ct h ev a l i do fo t o l o g y i no r d e r t os h a r ea n d r c u s et h eo n t o l o g y ,w es h o u i dm a k ec o e s p o n d i n gc h a n g ca c c o r d i n gt oa i jk i n d so f c h a n g e s ,t h a ti s t od or e s e a r c ho no n t o l o g yc v o l u “o np r o c c s s ,r e a l i z et h ev a l i da i i d c o n s i s t e n to fo n t o l o g y t h i sp a p e rt r y st od os o m er c s e a r c ho no n t o l o g ye v 0 1 u i i o nf r o m t h ev i e wo fo n t o l o g yv e r s i o l l i n gm 卸a g c m e n t t h i sp a p e ri n t r o d u c e s 也eb a c k g r o u n do ft h ep m b l e mf i r s t l y ,a i l dt h es i g n i f i c a n c eo f s t u d y i n gt h ep t o b l e md e e p ly ,s u m m a r i z e st h er e l e v a n tk n o w l e d g ea b o u to n t o l o g y ,g i v e sa c o m p r e h e n s i v e i n t r o d u c t i o no f o n t o l o g y ,i n c l u d i l l go r i g i l l a l ,o n t o l o g yd e s c r i p t j o n l a n g i l a g e s ,e d i tt o o l sa i l dt h er e l a t i o t os e m 柚t i cw e b i te m p h a s i z e so n 也es e m a i l t i c e x p r e s s i o no ns e m a n t i cw e bo ro t h e rs e m a n t i cp r o b l e m s ,a n a l y z e st l l ek a o np r o t o t y p e s y s t e ma n dd e s c r i b et h eo n t 0 1 0 9 ye v o l u t i o nf u n c i i o n ,d i s c u s s e st h ec o m m o np m c e s sa n d c v o l u t i o n 仃a m e w o r ko fo n t o l o g ye v o l u t i o p r o b l c m s ,b r i n 萨f b n v a r dt h eo n t o l o g y v e r s i o n 抽gm a n a g e m e n th 珊e w o r k ,丘d mt h ep o 血to fa p p l i c a t i o n ,a n a l ) r z e st h eo n t 0 1 0 9 y e v o l u “o n 孤do n t o l o g yv e r s i o n i n gm a n a g e m e n t0 fi n d i v i d u a t i o np u b l i c a t i o nb a s e do n o n t o j o g y - i ts u m m a r i z c st h e w h 0 1 ep a p e fa n d 酉v e saf a r t h e rr e s e a f c hp t o s p c c t sl a s t l y k e y w o r d s :s e m a i l t j cw e b ;o n t o l o g y ;0 n t o l o g ye v o l u t i o n ;v c r s i o nm 趾a g e m e n t ; 0 n t o l o g yv e r s i o n i n g ;i n d i v i d u a t i o np u b l i c a t i 0 华中师范大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作 所取得的研究成果。除文中已经标明引用的内容外,本论文不包含任何其他个人或 集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在 文中以明确方式标明。本声明的法律结果由本人承担。 作者签名: 了尝 日期:h6 年f 月- 7 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权 保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借 阅。本人授权华中师范大学可以将本学位论文的全部或部分内容编入有关数据库进 行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 作者签名:可兴 日期:k b 年6 月7 日 导师签名:在起 、, 日期:渤年月护日 本人已经认真阅读“c a l i s 高校学位论文全文数据库发布章程”,同意将本人的 学位论文提交“c a l i s 高校学位论文全文数据库”中全文发布,并可按“章程”中的 规定享受相关权益。回童迨塞堡童后进卮;旦圭生;旦二生;旦三生筮壶! 作者签名: 刁尝 日期:撕6 年6 月 7 日 导师签名:再超l导师签名:肛琴! 日期:沙厶年6 月8 日 硕士学位论文 m a s t e r s t h e s l s 1 1 问题提出的背景 第一章绪论 本体是构成语义互联网1 1j 的基础,是现在研究的一个热点问题。随着语义万维 网概念的提出和相关研究的进展,出现了许多基于本体为核心的语义网技术的应 用。特别是在知识的共享,知识管理系统,信息检索,企业间数据交换及w 曲s e i c e 等方面的应用。在这些应用中,本体是信息的载体,是信息的表现形式,它随着领 域,时间,应用环境等的变化而不断发生着变化和演变。不同的本体之间互相动态 的共享和交换信息,同一本体在演化过程中会出现各种版本。如果不能有效的解决 这些动态变化所带来的本体的一致性和兼容性,那么这些用本体所表示的信息将会 出现错误或者是失效,将无法实现本体的继续共享和重用。因此,如何有效的表达 这些本体的动态变化,描述不同的本体版本之间的差异,建立同一本体的不同版本 之间的关联等将是非常重要的一些问题。 1 2 问题研究的目的与意义 在本体工程领域中,大部分的问题都集中在本体的构建问题上。某个领域的知 识用本体来表示,它没有考虑到本体随时间的动态变化。在一个开放的动态的环境 中,领域中的这些知识本体是在不断的变化着的,例如:应用环境的改变;用户需 求的变化;以及内部过程的改变等。本体的开发是一个动态的过程,从一个粗糙的 本体经过不断的修正和提炼的适应性变更。因此,为了实现本体的共享和重用,必 须对本体的演化过程进行研究,从而达到本体的有效性和一致性,本文从版本管理 的角度来着手研究本体演化的相关问题。 1 3 文章的主要研究内容 文章首先介绍提出该问题的背景知识,及其深入研究此问题有如何的研究意 义,概述语义w e b 与o n t 0 1 0 9 y 的相关知识,对彻t o l o g y 进行一个全面的介绍,包括 起源,o n t o l o g y 描述语言,编辑工具以及与语义w e b 的关系等,重点介绍它在表达 语义互联网及其它涉及语义表达方面的支撑作用;分析了k a o n 原型系统并对其 本体的演化功能进行了描述:从本体工程的角度讨论了本体的系统演化框架和一般 的演化过程。对本体演化原因的分析,提出了本体演化过程中的版本管理框架:给 硕士学位论文 m a s t e r st h e s i s 出一个本体演化的实例,对个性化出版物系统中本体的演化与版本管理进行分析与 设计。最后对全文进行了总结,给出了进一步的研究展望。 1 4 论文的组织 正文主要分为三个部分:第一部分( 1 章) 阐述了论文研究的背景、研究目的 与意义和主要的研究内容。第二部分( 2 ,3 ,4 ,5 章) 全面研究了本体论的相关理 论与应用研究、概述了本体演化中的若干问题,介绍了原型系统,同时从版本管理 的角度提出了基于本体的版本管理框架,并给出了个性化出版物系统应用中本体的 演化与版本管理。第三部分( 6 章) 对全文的研究工作进行了总结,并对未来研究 方向和发展前景进行展望。 硕士学位论文 m a s t e r s t h e s i s 第二章本体论研究 本体论( o n l o l o g y ) 起源于哲学,现今受到广泛的关注,其重要性也己在许多 方面表现出来并得到广泛认同,尤其本体论在传统w c b 上的应用导致了语义w e b 的诞生,在w 3 c 的主导下有望解决w e b 信息共享时的语义问题,从而实现世界范 围内的知识共享和智能信息集成。 本章将对本体作一个全面的综述性介绍,包括本体论的起源、定义、描述语言、 建构方法论、本体论与语义w e b 的关系,以及本体论的研究与应用等。 2 1 本体论的起源和定义 本体最初起源于哲学,这个词早在1 7 世纪就已诞生,它是一个哲学术语,是 一门有关存在及其本质和规律的科学。本体论是指关于世界某个方面的特定的分类 体系,这个系统不依赖于任何特定的描述语言。如同本体论的诞生与哲学早期发展 密切相关一样,在过去的数十年中,本体论在计算机科学领域的发展也与人工智能 和信息技术的起步和发展密不可分。 在人工智能领域,经历了2 0 世纪6 0 年代通用问题求解方法研究的困境,学者 们开始通过专门领域的知识表达来支持自动推理。 定义:关于本体的定义,各个领域的定义都不一样关于本体的定义,在文献【2 】【3 】 中给出了对本体定义的详尽解释和介绍。在人工智能界,最早给出本体定义的 n e c h e s 等人,他们将本体定义为:给出构成相关领域词汇的基本术语和关系,以及 利用这些术语和关系构成的规定这些词汇外延的规则的定义。 后来在信息系统、知识管理等领域,越来越多的人研究本体,并给出了许多不 同的定义,其中最著名并引用最为广泛的定义是g m b e r 提出的,认为:本体是概念 模型的明确的规范说明,它包含四个方面: 概念化( c o n c e p t u a l i z a t i o n ) :客观世界中现象的抽象模型; 明确( e x p l i c i t ) :概念及它们之间联系都被精确定义; 形式化( f 0 n a l ) :精确的形式化方法描述; 共享( s h a r c ) :本体中反映的知识是其使用者共同认可的; 虽然不同研究者对本体有不同的描述,但是从内涵上来看,他们对本体的认识 是一致的,都是把本体当作某个领域内不同主体( 比如,人,代理,机器等) 之间 硕士学位论文 m a s t e r st h e s i s 进行交流( 对话,互操作,共享等) 的一种语义基础,即由本体提供明确定义的词 汇表,描述概念和概念之间的关系,作为使用者之间达成的共识。因此,本体被用 来交流,共享,互操作,重用等等。目前,本体已经被广泛应用于知识工程,自然 语言处理,数字图书馆,信息检索和w 曲异构信息的处理、语义w e b 等领域。 2 2 本体描述语言 本体描述语言是用来描述本体的,是对领域模型概念的形式化描述,它让用户 可以为领域模型编写清晰、形式化的概念描述。一个良好的本体描述语言应该满足 以下的要求: 良好定义的语法( aw e l l d e f i n e ds y n t a x ) 良好定义的语义( aw e l l 一d e f i n e ds e m a n t i c s ) 有效的推理支持( e f f i c i e n tr e a s o n i n gs u p p o r t ) 充分的表达能力( s u f f i c i e n te x p r e s s i o np o w e r ) 表达的方便性( c o n v e n i e n c eo fe x p r e s s i o n ) 到目前为止,可以把本体描述语言分为两大类:基于a i 的本体描述语言,典 型的有:k i f 川,o n t 0 1 i n g u a 5 ,c y c l 【5 ,l 0 0 m ,o c m l ef l o g i c 等,这类语言是 在人工智能领域被陆续提出的,是基于谓词逻辑的推理性语言。 另一类是基于w e b 的本体描述语言,典型的有:s h o e “”,x 0 l n l l ,r d f n 2 1 ,r d f s n 3 1 , o i l 1 ,d a m l + o i l m l ,o w l n 6 1 等,它们被称为本体标记语言,是随着w e b 的发展,相 继被提出的一系列基于w e b 的本体语言。 k i f ( k n o w l e d g ei n t e r c h a n g ef o r m a t ) 是由斯坦福大学开发的,它是一种在 不同k r 系统间交换知识的格式,目的是用它来进行知识表示形式不同的计算机之 间的知识交换。在这个意义上,k i f 被誉为第一个知识共享的桥梁。从这个需求出 发,k i f 和其它知识表示语言之间的区别在于,首先它必须是和应用完全无关的; 其次,它必须由足够的表达能力使得所有其它的知识表示语言都有转换成k i f 标准 格式的可能。 它是基于一阶逻辑的语言,有3 个基本的概念类为对象、函数和关系、采用模 型论语义。其基本本体包含数、集合和序列表等,提供了函数和关系定义操作符, 支持函数和关系的属性表示,支持元知识表示,也支持单调和非单调推理规则的表 不。 4 硕士学位论文 m a s t e r s t h e s i s 0 n t o l in g u a o n t o l i n g u a 是一种基于k i f 为核心的语言,提供统一的规范格式来构建 o n t 0 1 0 9 y ,它定义本体是以一种形式化和描述性的表示。它包含一个主体领域中涉 及到的术语以及描述这些术语是什么,以及它们之间的关联和能否彼此相互关联的 逻辑化的断言。它定义框架本体作为知识表示的基础,都包含3 个部分:定义头部 分,用自然语言描述的非形式化定义部分以及用k i f 或框架本体的词汇描述的形式 化定义部分。 它的特点是:为构造和维护o n t 0 1 0 9 y 提供了统一的、计算机可读的方式:由 其构造的o n t 0 1 0 9 y 可以方便地转换到各种知识表示和推理系统( 如p r o l o g 、1 0 0 m 、 k i f 等) ,从而将o n t 0 1 0 9 y 的维护与使用它的目标系统分离。 l o o m l o o m 由美国南加洲大学信息科学学院涉及并实现,是一种基于一阶谓词逻辑的 高级编程语言,属于描述逻辑体系。它的描述性知识包括定义、规则、事实和缺省 规则等,它利用向前推理。其特点是:提供表达能力强、声明性的规范说明语言; 提供强大的演绎推理能力;提供多种语言编程风格和知识库服务。 c y c l c y c l 是c y c 系统的描述语言,一种体系庞大而非常灵活的知识描述语言。c y c 是位于美国德州奥斯汀的m c c 公司的研究项目,它包含1 6 0 0 0 0 0 多条知识和几百个 微理论的常识知识库,其目的是通过本体开发为常识推理提供基础。其特点有:在 一阶谓词演算的基础上扩充了等价推理、缺省推理等功能:具备一些二阶谓词演算 的能力;其语言环境种配有功能很强的可进行推理的推理机。 s h o e s h o e ( s i m p l eh t m lo n t o l o g ye x t e n s i o n s ) 作为h t m l 的扩展,是马里兰大学 开发的。它是基于框架和规则的。它使用不同与h t m l 的一些标记,使得可以在h t m l 文档种插入本体。当) ( m l 产生并成为w e b 上交换信息的标准后,s h o e 的语法被修改 为基于x m l 。s h o e 支持概念文档的定义,但不能定义概念的划分。对于属性,s h o e 并不区分类属性和实例属性,它只支持实例属性和局部属性。s h o e 它不支持全局属 性,不能定义一个没有范围的属性或者二元关系,所以必须为每一个概念定义属性 或者在一个概念中定义某一属性,其它所有的分类概念通过继承来得到该属性。 s h o e 只支持基本上所有语言都支持的属性类型约束以及属性文档的定义,并不能定 义属性的默认值和对取值范围进行限制。 5 硕士学住论文 m a s t e r st h e s i s x o l x o l ( o n t 0 1 0 9 ye x c h a n g el a n g u a g e ) 是s r ii n t e r n a t i o n a l 的人工智能中心 开发的,它是一种简单并通同的定义本体的方法,是基于删l 的本体交换语言。最 初是为生物信息学领域本体的交换而设计的。 r d f r d f ( r e s o u r c ed e s c r i p r i o nf r a m e w o r k ) 是由w 3 c 开发的专门用于描述w e b 资源的框架,它可以标准化和可互操作的方式提供了基于x 儿数据的语义的详细说 明,r d f 提出了一个简单的模型用来表示任意类型的数据。这个数据类型由节点和 节点之间带有标记的连接弧组成,节点表示w e b 上的资源,弧用来表示这些资源额 属性。因此,该模型可以方便的描述资源以及她们之间的关系。它的数据模型就是 一种二元关系的表达,因为任何复杂的关系都可以分解为多个简单的二元关系,因 此r d f 的数据模型可以作为其它任何复杂关系模型的基础模型。 o i l 0 i l ( 本体推理层) 是在欧洲的i s t 项目o n t o k n o w l e d g e 中开发的,它以r d f s c h e m a 为起点,用更为丰富的0 n t o l o g y 建模原语对r d fs c h e 眦进行扩充。它将框 架系统、描述逻辑和w e b 标准( x m l 和r d f ) 这三个不同领域的优点结合起来,提 供了一种通用的语义w e b 的标记语言,逐渐发展成为应用于多个领域,被人们认可 的一种网络本体表示规范。o i l 为一个标准化的本体语言提供了层次化的表示方法。 在底层向高层扩展的过程中,功能和复杂性都是逐级加强的。 d a m l + 0 i l 它是美国国防部高级研究项目代理发布的d a r p a 代理标记语言( d a m l 。d a r p a a g e n tm a r k u pl a n g u a g e ) ,同时包括美国和欧洲的商业公司、大学和像w 3 c 这样的 国际组织也致力于支持d a m l 的发展和布置。d a m l + 0 i l 是一个以w 3 c 的语义w e b 的 本体语言为出发点的提议,构建于r d f ( s ) 的基础上,下图显示了用于语义w e b 中的 本体语言的层次结构: 图2 一l 语义w e b 中本体语言的层次结构图 硕士学位论文 m a s t e r l st h e s i s u w l o w l ( w e b 本体语言,w e bo n t o l o g yl a n g u a g e ) 是w 3 c 推荐的本体描述语言的 标准,位于w 3 c 绘制的本体语言栈的栈顶,它是为了在w w w 上发布和共享本体而提 供的语义标记语言。o w l 是在d a h i l + 0 i l 的基础上发展起来的,作为r d f ( s ) 的扩展, 目的是提供更多的原语以支持更加丰富的语言表达,并更好的支持推理。它有三个 子语言,根据不同的需求各有偏重,o w ll i t e 、o w ld l 和o w lf u l l 。如图所示为 w 3 c 的本体语言栈: x o l t 0 p i c m a p s s m ! i lr d f h n 讧x m l + n a m es p a c e + x m l s c h e m a lu n i c o d e 2 3 本体建构方法论 图2 2w 3 c 的本体语言栈图 本体建设的现状可以和软件工程发展的初期类比,还处于个人或者小团体的手 工作坊阶段。从本体的概念来看,它的本质要求包括概念化,明确,形式化,共享, 重用等特征,可以说本体的建设具有天然的工程性。在软件开发领域,人们提出的 软件工程思想对软件产业的形成和发展起到了决定性的推动作用,因此,人们也试 图提出了本体工程的概念,用工程的思想来指导本体的构建,本体工程也成为本体 研究中的一个热点问题。即如何做到大规模的构建本体? 如何集成现有的不同本 7 硕士学住论文 m a s t e r l st h e s i s 体? 如何维护本体等。 本体没有一个标准的构造方法,不少研究人员处于指导人们构建本体的需要, 从实际出发,提出了许多指导人们构建本体的标准,其中影响很大的是t o mg r u b e r 于1 9 9 5 年文献 1 7 中提出的5 条规则: ( 1 ) 明确性和客观性:即本体应该用自然语言对所定义术语给出明确的、可 观的语义定义 ( 2 ) 完全性:即所给出的定义是完整的,完全能够表达所描述术语的含义。 ( 3 ) 一致性:即由术语得出的推论于术语本身的含义是不相容的,不会产生 矛盾。 ( 4 ) 最大单调可扩展性:即向本体中添加通用或是专用的术语时,不需要修 改其已有的内容。 ( 5 ) 最小承诺:即对待建模对象给出尽可能少的约束。 本体构建中常用的方法有:i d e f 一5 方法,骨架法,企业建模法,m e t h o n t o l o g y 方法,循环获取法等。这些方法都被应用在具体的本体建设项目中,并且取得了相 应的成果。但至今没有一个通用的标准和方法来指导本体的构建开发,下面是一些 利用上述构建方法已经开发出的典型本体。 w o r d n e t “”:基于心理语言规则的英文词典,以s y n s e t s ( 在特定的上下文环境 中可互换的同义词的集合) 为单位组织信息。 f r a m e n e t “:英文词典,采用称为f r a m es e m a n t i c s 的描述框架,提供很强的 语义分析能力。 g u m 。:面向自然语言处理,支持多语种处理,包括基本概念及独立于各种具 体语言的概念组织方式。 s e n s u s “”:面向自然语言处理,为机器翻译提供概念结构,包括7 万多个概念。 另外,文献 2 2 综述了一些以前的本体开发方法论,认为: ( 1 ) 许多本体构建都以一个具体任务为起点,这样易于知识的获取和本体功 能的描述: ( 2 ) 本体构建大致可划分为阶段法( 如u s c h 0 1 d k i n g ) 和原型演化法( 如 m e t h o nt o l o g y ) 。 ( 3 ) 在构建过程中可分为“非形式化描述本体”和用正规描述语言“形式化 描述本体”前后两个阶段; 硕士学住论文 m a s t e r st h e s i s ( 4 ) 希望通过累积的方法来构建本体,即先构建一个基本本体,然后作进一 步开发; ( 5 ) 本体构建还没有一套作为科学或工程过程的完整方法论,成功很大程度 上依赖于具体工程。 文献 2 3 指出目前的本体构建方法还未能像软件工程那样成为一种成熟的工 程方法论,作者根据i e e e 软件生命周期过程开发标准1 对上述大部分本体构建方 法做了分析比较,得出的基本结论是: ( 1 ) 与i e e e 标准相比,没有一种方法论是完全成熟的。 ( 2 ) 没有提出统一的方法论,只有适合自身工程项目的方法。 ( 3 ) 存在几乎完全与众不同的方法论如s e n s u s ,说明构建方法论的标准并不 是唯一的。 ( 4 ) 对于由同一个基础本体( 如s e n s u s ) 构建出的领域本体,由于高层概念 的共享,本体系统之间具有互操作能力。 ( 5 ) 分析总结现有的各种方法论可作为发展标准方法论的起点;传统软件开 发标准可作为指导方针来参考使用。 2 4 本体开发工具 目前出现了许多本体编辑工具,有p r e t e g e 2 0 0 0 嘲,o n t o e d i t 乜毗,o i l e d 2 ”, 0 n t o v i e w 嘲,0 n t o m a n a g e r ,t e x t t 0 0 n t o 啪3 等。下面就概要介绍其中的几个。更 多的详细工具介绍如文献 3 1 。 ( 1 )p r o t 6 9 62 0 0 0 p r o t e 9 62 0 0 0 是由斯坦福大学的s t a n f o r dm e d i c a li n f o r m a t i c s 开发的一个 开放源码的本体编辑器,它是用j a v a 编写的。p r o t e 9 62 0 0 0 界面风格与普通 w i n d o w s 应用程序风格一致,用户比较容易学习使用。本体结构以树形的层次目录 结构显示,用户可以通过点击相应的项目来增加或编辑类、子类、属性、实例等, 使用户在概念层次上设计领域模型,所以本体工程师不需要了解具体的本体表示语 言。 p r o t 6 9 62 0 0 0 支持多重继承,并对新数据进行一致性检查,并且具有很强的可 扩展性,主要表现在如下几点: 1 ) p r o t 6 9 62 0 0 0 是一个可扩展的知识模型。用户可以重新定义系统使用的表 示原语。 2 ) 文件输出格式可以定制。可以将p r o t 6 醇2 0 0 0 的内部表示转换成多种形式 硕士学住论文 m a s t e r s t h e s i s 的文本表示格式,包括x m l 、r d f ( s ) 、o i l 、d a m l 、d a m l + 0 i l 、o w l 等系列语言。 3 ) 用户接口可以定制。提供可扩展的a p i 接口,用户可以更换p r o t 魄62 0 0 0 的用户接口的显示和数据获取模块来适应新的语言。 4 ) 有可以与其他应用结合的可扩展的体系结构。用户可以将其与外部语义模 块( 例如针对新语言的推理引擎) 直接相连。 5 ) 后台支持数据库存储,使用j d b c 和j d b c o d b c 桥访问数据库。 由于p r o t 6 9 62 0 0 0 开放源代码,提供了本体建设的基本功能,使用简单方便, 有详细友好的帮助文档,模块划分清晰,提供完全的a p i 接口,因此,它基本上成 为国内外众多本体研究机构的首选工具。但是,它基本上没有提供合作开发方面的 支持,在实际应用中存在很多限制。 ( 2 ) o n t o e d i t 0 n t o e d i t 是由卡尔斯鲁厄大学开发的。它使用图形方法支持本体的开发和维 护。它将本体开发方法论( 骨架法) 与合作开发和推理的能力相结合,关注本体开 发的三个步骤:收集需求阶段、提炼阶段、评估阶段。o n t o e d i t 支持r d f ( s ) 、d a m l + o i l 和f l o g i c 。o n t o e d i t 提供对于本体的并发操作。0 n t o e d i t 不开放源代码,已经产 品化。它可以作为l ( a o n ( k a r l s r u h eo n t o l o g ya n ds e m a n t i cw e bt 0 0 1 ) 的客户端 软件。k a o n 是o n t o e d i t 的后继版本。 ( 3 ) o i l e d 0 il e d 是一个由曼彻斯特大学计算机科学系信息管理组构建的基于0 i l 的本体 编辑工具,它允许用户使用d a m l + o i l 构建本体。它的基本设计受到类似工具( 如 p r o t 6 9 e 系列、o n t o e d i t ) 的很大影响,它的新颖之处在于:对框架编辑器范例进 行扩展,使之能处理表达能力强的语言;使用优化的描述逻辑推理引擎,支持可跟 踪的推理服务。o i l e d 更多的作为这些工具的原型测试和描述一些新方法,它不提 供合作开发的能力,不支持大规模本体的开发、不支持本体的移植和合并、本体的 版本控制、以及本体建设期间本体工程师之间的讨论。o i l e d 中的中心组件是描述 框架,它由父类的集合组成。o i l e d 描述框架与其他框架不同之处在于它允许使用 匿名框架描述和高复杂性。o i l e d 提供源代码。 o i l e d 能使用推理检查类的一致性,推断出包含的关系。推理服务由f a c t 提供, f a c t 为两类描述逻辑s h f 和s h i q 提供推理服务。f a c t o i l e d 并不为它的推理提供 解释。 o i l e d 也可以将本体导出为其他格式,如:s i m p l er d f s 、s h i q 、s h o q ( d ) 、h t m l 、 d o t t y 、d i g 和图形格式。 1 0 硕士学位论文 m a s t e r st h e s i s 2 5 本体论与语义w e b 当前对语义w e b 的概念还没有形成统一的定义,对语义w e b 的理解表述不一。 文献 3 2 是这样表述:语义w e b 是第三代w e b ,其目标是实现机器自动处理信息, 它提供诸如信息代理、搜索代理、信息过滤等智能服务。文献 3 3 表述为:语义w e b 不同于现存的万维网,其数据主要供人类使用,新一代w 胛中将提供也能为计算机 所处理的数据,这将使得大量的智能服务成为可能。文献 3 4 表述为:语义w e b 研 究活动的目标是开发一系列计算机可理解和处理的表达语义信息的语言和技术,以 支持网络环境下广泛有效的自动推理。而语义w e b 的创始人t i mb e r n e r s l e e 对语 义w e b 的定义如下:语义w e b 是一个网,它包含了文档或文档的一部分,描述了事 物问的明显关系,且包含语义信息,以利于机器的自动处理”“。尽管对语义w e b 的 理解于描述不同,但仍能从这些描述与理解中看出语义w e b 的一些基本特征:( 1 ) 它是区别于现在的w 啊,是现有w w 的扩展和延伸:( 2 ) 现有w w w 是面向文档而语义 w e b 则是面向文档所表示的数据;( 3 ) 语义w e b 将更利于计算机理解与处理,并将具 有一定的判断、推理能力。 语义w e b 研究的主要目的就是要扩展当前的万维网,使得网络中尽可能多的信 息都是具有语义的,是计算机能够理解和处理的,便于人和计算机之间的交互。因 此,有效的把信息表示为计算机能够理解和处理的形式,即带有语义。并在此之上 构建本体和逻辑推理规则,以实现基于语义的知识表示和推理,从而能够为计算机 所理解和处理。b e r n e r s _ l e e 为未来发展提出的基于语义的体系结构语义w e b 体 系结构如图所示 t i u s t p m o f 口 k g i c 鲁 o n t o i o g yv o c a b u l a r y 互 哩 r d f + r d fs c h e m a 彗 京 ix m l + n s + x m l s c h e m a u n i c o d ou r l 图2 3 语义w e b 体系结构图 下面对语义w e b 的七层模型进行简要说明: 1 l 硕士学住论文 m a s t e r st h e s i s ( 1 ) u n i c o d e 和u r l 该层是语义w e b 的最底层,u n i c o d e 是一个字符编码系统标准,支持世界所有 主要语言文本的混合,可以保证我们使用国际化、通用化的字符集,避免不同类型 字符集之间由于编码不同而造成的存储、传递和使用上的混乱,同时也可以实现多 国语言的混合存储和使用。u r l 是i n t e r n e t 资源的一种识别方法,在语义w e b 中, 任何可以被描述的事物都可以称为资源,每一个资源都由唯一一个u r l 所标识,不 同的资源拥有不同的u r l ,通过指定的u r l 可以确定互联网中唯一一个资源。 ( 2 ) ) 【m l + n s + x m ls c h e 眦 x m l 是一种允许自定义标记的通用、结构化描述语言,已经成为描述w e b 文档和数据的 标准化语言。 n s ( n 锄es p a c e ) 命名空间为x m l 文档中的结构化标记提供了上下文环境,一 方面为文档中的每一个标记都赋予了确定的含义,另一方面将不同于上下文环境中 相同名称的标记区分开来,从而避免了语义上的歧义。 ) ( m ls c h e m a 在标记的使用和文档结构上,为x m l 文档提供了明确的语义限制, 最终确保每一个x m l 文档都是语义合法、结构完整、内容有效的。 ( 3 )r d f r d fs c h e m a r d f ( r e s o u r c ed e s c r i b i n gf r 锄e w o r k ) 资源描述框架定义了一种用以描述资 源及其相互关系的简单模型,是实现语义w e b 的关
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025北京地铁技术创新研究院招聘1人笔试题库历年考点版附带答案详解
- 2025年遗传医学基因检测报告解读模拟考试答案及解析
- 2025年生物科技行业创新应用与投资方向研究报告
- 2025年智慧城市行业智能交通应用与城市规划研究报告
- 2025年急诊室常见危重病例救治技能考核模拟试卷答案及解析
- 2025年全球电动车市场发展态势及投资机会研究报告
- 2025年未来出行行业智能出行与交通网络研究报告
- 曹刿论战预习课件
- 民航安全技术检查考试题及答案
- 2025年全科医生常见病诊疗模拟考试卷答案及解析
- 高速公路改扩建工程监理投标方案(技术方案)
- 突发性耳聋的中医辩证及护理方案
- T-SZEIA 001-2024 温室气体产品碳足迹量化方法与要求 变电站电气设备
- 2025年湖南省安全员-B证考试题库及答案
- 北师大版六年级下册数学全册同步分层作业设计含答案解析
- 简易钢结构雨棚施工承包合同范本
- 苏州市前期物业管理委托合同范本
- 2022年冀教版七年级上册数学第一次月考试卷
- 《气管支架临床应用》课件
- 8·12天津滨海新区爆炸事故调查报告分析及反思
- 2024新指南:中国阿尔茨海默病早期预防指南解读课件
评论
0/150
提交评论