(计算机软件与理论专业论文)一个基于本体演化的学科分类系统的设计与实现.pdf_第1页
(计算机软件与理论专业论文)一个基于本体演化的学科分类系统的设计与实现.pdf_第2页
(计算机软件与理论专业论文)一个基于本体演化的学科分类系统的设计与实现.pdf_第3页
(计算机软件与理论专业论文)一个基于本体演化的学科分类系统的设计与实现.pdf_第4页
(计算机软件与理论专业论文)一个基于本体演化的学科分类系统的设计与实现.pdf_第5页
已阅读5页,还剩54页未读 继续免费阅读

(计算机软件与理论专业论文)一个基于本体演化的学科分类系统的设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录 摘要 学科分类体系可以揭示科学发展的规律,并能在一定程度上预测学科进一步发展的趋 势,有助于科研管理工作者制定政策。随着科学知识迅猛增长,学科分类体系动态性日益明 显。如何构建具有动态特性的学科分类系统已成为一个急需解决的问题。本体与学科分类体 系具有相似性,而本体演化技术已有不少研究成果。本文主要工作就是探讨本体演化技术在 学科分类系统中的应用,其工作对建立科学的学科分类体系具有意义,同时对基于本体演化 的应用系统的建立具有参考价值。 本文首先分析了本体演化的研究现状及主要特点;并在此基础上,借攀已有本体演化的 应用系统框架设计,提出了结合版本和日志技术的本体演化框架v l o g o n t o e v o ;然后,基丁 v l o g o n t o e v o 框架设计并实现了一个能够综合国家标准g b t1 3 7 4 5 9 2 学科分类与代码、 中国图书馆分类法、国家自然科学基金申请项目分类目录及代码三个学科分类体系的学科分 类原型系统,该系统包含学科查询、学科本体变化、版本比较和变化追踪三个主要功能子系 统,实现工具是j e n a 。 本文的主要成果包括:提出了结合版本和日志技术的本体演化框架v l o g o n t o e v o ;设计 并实现了一个基于v l o g o n t o e v o 框架的学科分类原型系统:引入变化操作本体,将版本和 日志有机结合,为系统提供了版本比较和变化追踪的能力。 关键词本体本体演化学科分类版本比较变化追踪 东南大学硕士论文 a b s t r a c t d i s c i p l i n ec l a s s i f i c a t i o nc a ns h o wt h er e g u l a t i o no ft h es c i e n t i f i cr e s e a r c ha n dc a np r e d i c tt h e f u r t h e rr e s e a r c ht r e n dt os o m ee x t e n t i tc 0 1 1c o n t r i b u t et oc o n s t i t u t ep o l i c yf o rt h em a n a g e r so f s c i e n t i f i cr e s e a r c h w i t ht h er a p i dg r o w t ho fs c i e n t i f i ck n o w l e d g e t h ed y n a m i cc h a r a c t e r i s t i co f t h ed i s c i r i l i n ec l a s s i f i c a t i o nb e c o m e si n c r e a s i n g l yo b v i o u sh o w 协e s t a b l i s ha d i s c i p l i n e c l a s s i f i c a t i o ns y s t e mw i t ht h ed y n a m i cc h a r a c t e r i s t i ch a sb e c o m ea i lu r g e n ti s s u e o n t o l o g yi s s i m i l a rt od i s c i p l i n ec l a s s i f i c a t i o n ,a n dr e c e n t l yt h e r ea r em a n yr e s u l t si nr e s e a r c ho no n t o l o g y e v o l u t i o n s o ,i ti se x p l o r e dh o wt o u s et h eo n t o l o g ye v o l u t i o nt e c h n o l o g yi nt h ed i s c i p l i n e c l a s s i f i c a t i o ns y s t e mi nt h i sp a p e r t h ew o r ki sm e a n i n g f u lf o rt h ee s t a b l i s h m e n to fas c i e n t i f i c d i s c i p l i n ec l a s s i f i c a t i o n ,m e a n w h i l e ,i ti sh e l p f u lt ob u i l dt h ea p p l i c a t i o ns y s t e mb a s e d o no n t o l o g y e v o l t u t i o n f i r s t l y ,t h ec u n e n tr e s e a r c hd e v e l o p m e n to fo n t o l o g ye v o l u t i o na n di t sm a i nc h a r a c t e r i s t i c sa r e a n m y z e d s e c o n d l y ,b a s e do nt h ea n a l y s i so fo t h e ro n t o l o g ye v o l u t i o na p p l i c a t i o nf r a m e w o r k sa n d p r e v i o u s l yr e l e v a n tw o r k ,a no n t o l o g ye v o l u t i o nf r a m e w o r kn a m e dv l o g o n t o e v ow h i c hc o m b i n e s v e r s i o n i n ga n dl o g g i n gi sp r o p o s e d t h i r d l y ,b a s e do nv l o g o n t o e v of r a m e w o r k ,ad i s c i p l i n e c l a s s i f i c a t i o np r o t o t y p es y s t e mi sd e s i g n e da n di m p l e m e n t e d t h es y s t e mi sc o m p o s e do ft h r e e m a i nf u n c t i o n a ls u b s y s t e m s - - d i s c i p l i n ei n q u i r y ,d i s c i p l i n eo n t o l o g yc h a n g i n g ,v e r s i o n c o m p a r i n g a n dc h a n g e - t r a c k i n g i ti sd e v e l o p e dw i t ht h et o o ln a m e dj e n a t h em a i nr e s e a r c hc o n t r i b u t e si n t h i sp a p e ri n c l u d e :t h eo n t o l o g ye v o l u t i o nf r a m e w o r kn a m e d v l o g o n t o e v ow h i c hc o m b i n e sv e r s i o n i n ga n dl o g g i n g ;t h ed e s i g na n di m p l e m e n t a t i o no ft h e d i s c i p l i n e c l a s s i f i c a t i o n p r o t o t y p es y s t e m b a s e d o n v l o g o n t o e v of r a m e w o r k ; a v e r s i o n - - c o m p a r i n ga n dc h a n g e - - t r a c k i n gm e c h a n i s mu s i n ga l lo n t o l o g yo fc h a n g eo p e r a t i o n si nt h e s y s t e m k e yw o r d s : o n t o l o g y , o n t o l o g ye v o l u t i o n ,d i s c i p l i n ec l a s s i f i c a t i o n ,v e r s i o n - c o m p a r i n g ,c h a n g e - t r a c k i n g i i 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我 所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成 果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同 志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。 研究生张糌日期:率玎 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和 电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内 容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布( 包括刊登) 论文的 全部或部分内容。论文的公布( 包括刊登) 授权东南大学研究生院办理。 研究生躲社新虢堡虹日期呷呼纩 第一章绪论 1 1 研究背景 第一章绪论 学科分类学是在一定条件下,依据某些原则划分各门学科的对象和领域,确定各门学科 在整个科学知识体系中的位置,并阐明各学科之间相互关系框架的科学【l j 。正确的学科分类 可以揭示科学发展的规律,并能在一定程度上预测各门学科进一步发展的趋势,有助于科研 管理工作者制定政策。目前主要有三种不同用途的学科分类体系。一是以科研统计和科研管 理为目的的学科分类体系,如国家自然科学基金申请项目分类目录及代码等。二是以文 献图书分类为目的的分类体系,如中国图书馆图书分类法、中国科学院图书馆图书分类 法等。三是以百科全书辞目分类所反映的学科分类情况建立的学科分类体系,如 大不列 颠百科全书辞目等。学科分类体系具有发展性。必须反映学科的运动特征。 科学的学科分类体系的基本要求就是能够反映学科发展的动态。当今社会,随着科学知 识迅猛增长,促使人们对学科分类体系不断深入研究,以能形成科学的学科分类体系。如何 形成能够反映学科发展动态的学科分类体系,是一个难题。其研究对科研管理和学术研究方 向引导具有意义。 在传统情况下,学科分类体系的建立都由专家通过手工完成。随着现代科技发展,学科 分类体系的动态特性愈加明显,手工方式越来越具有局限性,从而需要通过软件系统辅助生 成能够反映学科发展动态的学科分类体系。能够反映学科发展动态的学科分类体系的关键问 题是:如何参考其他分类体系的成果? 如何抓住学科的变化? 如何在学科分类体系中体现变 化,并保持体系的一致性l z j ? 如何追踪学科分类体系的变化,并尽可能地展现学科分类体系 变化的原因与过程? 面对这些问题,本文根据学科分类体系与本体的相似性,利用本体演化技术,设计与实 现了一个基于本体演化框架、能够解决学科分类体系关键问题的学科分类系统,其中,通过 引入多个本体,提供多种学科分类体系作为参考,以帮助构建能够反映学科发展动态的学科 分类体系,并且结合日志和版本技术,对学科分类的变化进行追踪与解释。 1 2 研究现状 目前的学科分类体系的建立都是通过一个或多个权威机构或部门组织,通过专家们的 讨论和协商,由手工方式完成的,通过各种学科分类导航系统应用建立的学科分类体系。随 着现代科技发展,学科分类体系的动态特性愈加明显,这种方式的局限性也愈加明显,因此, 本文设计与实现了一个基于本体演化的学科分类系统,以帮助建立和维护一个具有动态特性 的学科分类体系。 本体演化是本体工程的重要组成部分,其基本思想是本体为适应所在领域的变化进行必 要的变化,同时保持本体及其附属产物的一致性。随着本体应用的推广,本体演化的重要性 日益明显。同时随着对本体演化的研究日渐深入,本体编辑工具也渐渐支持本体演化。对现 有的本体编辑工具功能的分析,可以直观地了解它们所支持本体演化技术对学科分类场景的 帮助与不足。 本体编辑工具能够使用户以图形界面的方式操作本体,主要辅助用户建立和修改本体。 东南大学硕士论文 目前可用的本体编辑工具数量较多,这里选择四个使用广泛的本体编辑工具,通过比较研究 它们对本体演化的支持程度。 p r o l 女 9 6 是s t a n f o r d 大学的s t a n f o r dm e d i c a ll n f o r m a t i c sg r o u p ( s m l ) 开发的本体设计环境。 它基于组件的架构能够以p l u g i n 方式扩展功能。p r o t 6 9 6 - o w l 插件使p r o t 6 西成为基于o w l 语言的本体编辑工具p j 。 o n t o e d i t 是一个支持本体的开发和维护的本体工程环境。它采用的是图方法,在本体生 命周期的各个不同阶段,它采用了许多图的观点和方法 4 1 。 o i l e d 是m a n e s t e r 大学开发的一个免费的本体编辑工具,它支持o i l 和o w l 语言。 它的一致性检测使用f a c t p l 推理器1 6 】。 k a o n t 7 1 ( t h ek a d s r u h eo n t o l o g ya n ds e m a n t i cw e bi n f r a s t r u c t u r e ) 是德国k a r l s r u h e 大学 的一个科研项目。它钎对基于本体的上层商业应用的需求提供了一个开放的本体管理软件, 为本体的存储、创建和标识提供了一个全面的支撑平台,对本体演化进行了较多的支持和投 入【 。 工具p m t 6 9 亡o n t o e d n o i i e dl n o n ,功能 变化处理支持功能 简单的 + 复杂的 支持语言的通用性 可逆性 可核查性 可用性 界面友好度 + 正确性验证 版本支持 版本比较 表卜l 一些典型的本体编辑工具对本体演化的支持 ( “一”表示不支持;“表示部分支持;“+ ”表示完全支持) 在表1 - 1 中,提出了一些典型的演化需求,并分析了各个工具对它们的满足情况。 功能部分分为对简单变化的处理支持和对复杂变化的处理支持,简单变化包括增加、删 除等,复杂变化包括合并、分裂等,四个工具都支持简单变化,在复杂变化上都有不足。 支持语言的通用性需求就是工具是否支持本体通用语言,比如o w l ,在这个方面。 k a o n 由于使用了自己开发的o i m o d e l ,不支持o w l ,其他工具均支持标准本体语言。 在可逆性需求上,p r o t 6 9 6 、o n t o e d i t 都有u n d o 操作,但是它们都只是把晟近的一些变 化存在内存中,当工具关闭时这些变化就丢失了,k a o n 有日志可以在任何时间恢复,但 必须从最终状态开始向前恢复,没有版本概念,效率不高。 在可核查性方面,o i l e d 有活动日志k a o n 也有日志但是它们都只记录基本变化,通 过日志对一条条基本变化进行审核,复杂度非常高,使用起来很困难,。 可用性是各个本体编辑工具最注重的方面,以上四个工具对工具界面的友好度做得都很 出色。在正确性上,对逻辑上的冲突也都有一定检测的能力。 由于学科分类体系一般以不同的版本对外发布,在这里需要加入对版本支持和版本比较 的要求,目前基于版本的本体演化研究也是一个研究热点,不过在这方面以上四种工具均没 2 第一章绪论 有支持。 从以上的比较中可以看出目前的本体编辑工具对本体演化的支持主要集中在两个方面, 邸简单变化的实现以及友好的用户界面的提供,其他只是部分或是没有提供相关的功能,尤 其是在版本支持和版本比较上没有一个支持这两项功能,但是这又是学科分类系统所需要 的。因此,本文提出了一个结合版本和日志技术的本体演化框架来满足学科分类系统的需求。 1 3 研究目标与内容 本文的研究目标是通过设计并实现一个学科分类系统,探讨本体演化技术在学科分类场 景中的应用。 本文的研究内容包括: 1 本体的建立。包括多种学科分类本体的建立和变化操作本体的建立。其中,变化操 作本体的建立是本文的研究重点之一,变化操作本体包括各种简单的本体变化和复杂的本体 变化。由该本体规范各个学科分类本体的修改,并指导变化日志的形成。 2 基于舨本和日志技术的本体演化框架( v l o g o n t o e v o ) 。现有的本体演化框架侧重点 不同,为了更好地应用于学科分类系统中,本文将日志和版本技术相结合,在变化操作本体 的指导下建立日志,使日志更加易于理解和使用,版本的变化描述得更加清晰。 3 基于v l o g o n t o e v o 框架的学科分类原型系统的设计与实现。本文基于建立的本体和 提出的本体演化框架,设计与实现了一个学科分类系统;在该系统中进行学科分类演化时, 多种学科分类对学科的定位可相互借鉴,对同一学科分类不同时期的版本可进行比较,并通 过变化操作本体指导下的日志进行说明。 本文的重点是基于版本和日志技术的本体演化框架( v l o g o n t o e v o ) 的提出,以及基于 v l o g o n t o e v o 框架的学科分类原型系统的设计与实现。 1 4 研究方法及路线 本文的主要工作是根据学科分类场景的实际需求,分析现有本体演化技术。在此基础上 提出一个基于版本和日志技术的本体演化框架( v l o g o n t o e v o ) ,并研究相关原型系统的设 计与实现的方法。主要研究方法和技术路线如下: 1 参照传统本体建立方法,根据本体建立规则,以国内已有的几种学科分类体系为基 础,采用本体编辑工具p r o t 6 9 6 定义并实现学科分类本体,分析本体的各种变化,在此基础 上建立变化操作本体。 2 分析已有的本体演化技术,并根据已有技术,选择适合学科分类场景的本体演化技 术作为研究的基础,在已有的本体演化框架的基础上提出一个基于版本和日志技术的本体演 化框架( v l o g o n t o e v o ) ,解决学科分类演化中的关键问题。 3 基于v l o g o n t o e v o 框架的原型系统的设计与实现方法,利用语义w e b 开发工具j e n a 和e c l i p s e 开发基于v l o g o n t o e v o 框架的学科分类系统。原型系统的设计基于面向对象的思 想进行设计,参考成熬的设计模式,提高系统的模块性和重用性。 东南大学硕士论文 1 5 本文结构安排 本文共分为6 章:第一章绪论主要介绍本文的研究背景、现状、内容,及其技术路线; 第二章本体与本体演化,主要介绍本体及本体演化技术,以选择适合学科分类系统的本体演 化技术;第三章在分析已有本体演化框架的基础上提出了一个结合版本和日志技术的本体演 化框架( v l o g o n t o e v o ) ;第四章基于v l o g o n t o e v o 框架设计了一个学科分类系统,对该系 统的多学科分类情况下的学科查询,学科本体变化,版本比较和变化追踪这三个主要功能子 系统进行了介绍;第五章是该学科分类系统的实现;结束语中总结本文所做的研究工作,指 出将来的工作。 4 第二章本体与本体演化 第二章本体与本体演化 本体在人工智能,语义w e b 等领域被大量应用。目前大多数有关本体的研究集中于本 体的构造问题。但是,本体的演化也是一个非常重要的问题。本体并不是一个静态模型,它 必须具有捕获并反映变化的能力。 本章首先介绍本体相关概念然后对本体演化的原因,定义、过程等进行分析。 2 1 本体概述 2 1 1 本体的概念 本体的概念起源于哲学领域,即“对世界上客观存在物的系统地描述唧”。在人工智能 界,最早给出本体定义的是n e c h e s 等人,他们将本体定义为“给出构成相关领域词汇的基 本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义【lo j ”。但是 目前较为广泛接受的定义是:本体是共享概念模型的明确形式化规范说明【l ”。该定义包含4 层含义: 概念化通过抽象出客观世界中一些现象的相关概念而得到的模型,其含义独立于 具体的环境状态; 明确用的概念及使用这些概念的约束都有明确( 显式) 的定义; 形式化本体是计算机可读的; 共享本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它 所针对的是团体而不是个体。本体的目标是捕获相关的领域的知识,提供对该领域 知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给 出这些词汇( 术语) 和词汇之问相互关系的明确定义。 2 ,1 2 本体与语义w e b 在语义w e b 领域,本体作为重要组成部分也得到了迅速发展。语义w e b 是由啊mb e m e r s l e e 在1 9 9 8 年提出的万维网发展方向i l “。t i m b e m e r s l e e 认为语义w e b 是现有万维网的扩 展或者是下一代的万维网,其目标是跨越现有缺乏自动化、智能化信息处理方式的万维网与 “信息爆炸”之间的鸿沟,充分利用计算机的强大计算能力,让计算机能在“理解”w e b 中信息的“含义”的基础上与人更好地合作,为人们在万维网中进行的信息获取,访问和信 息交换活动提供更准确,更有效的支持。这里,信息的。含义”即语义( s e m a n t i c ) 一词所 表达的不是自然语言或人的推理,而是表达了对信息能进行哪些操作。由于机器并不具备智 能,语义w e b 的基本思想是在w e b 信息中加入机器可处理的表达语义的元数据,进一步能 依据元数据层次上的关系、规则、逻辑和条件进行推理,从而自动地对信息进行组织、分类 和处理。在此之后,t i mb e m e r s l e e 又提出了语义w e b 体系结构,为语义w e b 相关技术 的研究制定了可实施的技术路线图。该体系结构图如图2 - i 。 该图为t i mb e m e r sl e e 在i s w c2 0 0 5 大会上给出的经过修订的语义w e b 体系结构描述。该图与2 0 0 0 年 给出的语义w e b 体系结构图有所区别 东南大学硕士论文 图2 - 1 修订的语义w e b 体系结构描述 x m l ( e x t e n s i b l cm a r k e tl a n g u a g e ,可扩展标记语言p 3 ) 构成了语义w e b 的语法基础。 但x m l 所存在的问题是不具备语义描述能力,为此r d f ( r e s o u r c ed e s c d p t i o nf r a m e w o r k , 资源描述框架q ) 被应用来解决x m l 的语义局限,它借鉴了传统的“属性一值”对以及实 体关系图,用三元组来表达二元关系i l “,提供了机器可处理的语义的元数据框架。r d f s c h e m a ( 简记为r d f - s ) 引入了一个类似于面向对象的语言中的可扩展的类型( t y p e ) 系统 到r d f 中,提供方法定义合适的定义域和值域,以及类和子类层次,使得一些简单的推理 能得以实现。 要使计算机之间能够相互理解其处理内容,还要一套共同的标准的形式化的概念体系, 即本体( o n t o l o g y ) ,典型的w e b 本体通常包含一个分类法和一组推理规则。o w l ”j 是最新 推荐的w e b 本体描述语言,是在d a m l + o i l 的基础上发展起来的,作为r d f - s 的扩展, 它提供了更多基于描述逻辑( d e s c r i p t i o nl o g i c ,d l ) 【1 1 的原语以支持更加丰富的语义表达 和更强的推理能力。逻辑层则是在本体层定义的术语关系和推理规则之上提供功能更强大的 逻辑语言来实现推理,当逻辑层在本体描述语言之上提供图灵完全的逻辑语言后,语义w e b 就有足够的能力给出关于事物与事物间关系的断言。证明层的证明语言能对断言的真假给出 逻辑证明。最后数字签名和加密技术用来确保w e b 上信息的可信任性。目前研究较成熟的 是本体层。 虽然不同研究者对本体有不同的描述,但是从内涵上来看,他们对本体的认识是一致的, 都是把本体当作某个领域内( 可以是特定领域的,也可以是更广的范围) 不同主体( 入、代 理、机器等) 之间进行交流( 对话、互操作、共享等) 的一种语义基础,即由本体提供明确 定义的词汇表。描述概念和概念之问的关系,作为使用者之间达成的共识。因此,本体的用 途包括交流共享,互操作,重用等等f , 6 第二章本体与本体演化 2 1 3 本体表示语言 为了使本体能够在不同用户和系统闯被理解、共享与交流,就需要对本体进行描述,对 应的研究内容就是本体表示语言。现有的本体表示语言各种各样,并且形式化表达能力强弱 也不同,这就使得依据这些不同语言开发的本体得到利用的程度和语义理解的能力存在着差 异。一般来说本体的表示通常包括概念、公理、关系和实例这几个方面,不同的本体表示 语言在不同程度上提供了其中些方面的表示的支持。 总的来说,本体表示语言可以分为三类( 如图2 - 2 ) :基于描述逻辑( d e s c r i p t i o nl o g i c s , d l ) 的本体表示语言、基于x m l 的本体表示语言及基于d l 和x m l 的本体表示语言。 图2 - 2 本体表示语言的层次结构l l w 随着本体语言的不断发展,能够提供形式化语义表示和推理能力,又能适应现行的w e b 环境下的数据表示的基于d l 和x m l 的本体表示语言渐渐为大家认可,同时,本体表示语 言借鉴了x m l 和描述逻辑,出现了基于d l + x m l 的本体语言。o w l 是这类本体语言的典 型代表,它是w 3 c 推荐的本体表示语言的标准,是为在w w w 上发布和共享本体而提供的 语义标记语言 o w l 是在d a m l + o i l l 2 0 1 的基础上发展起来的,作为r d f ( s ) 的扩展,提供了更多的元 语以支持丰富的语义表达。针对不同的需求,o w l 分为三个子语言:o w ll r e ,o w ld l 和o w l f u l l 。 o w l l i 钯的表达能力最有限,推理效率高;o w l d l 在保证推理的完备性和可判定性 的前提下,有尽可能强的表达能力;o w l f u l l 有最强的表达能力,但不对推理做任何保证。 其中o w ll i t e 的形式化基础是s h i fc d ) 2 1 l ,有实用的推理算法,比如f a c l z 2 1 系统和 r a c e r 2 a 系统就都为o w ll i 钯提供了实用的优化的推理算法;o w ld l 的形式化基础是 s h o i n ( d ) j ,尚未找到实用的推理算法。 o w l l i f e 所考虑的类、数据类型、对象类型属性、数据类型属性、个体,数据值、本 体属性和注释属性是相互严格区分的,并且其所考虑的类、数据类型、对象类型属性、数据 类型属性、个体、数据值可以分别对应描述逻辑所考虑的概念,具体数据类型、抽象角色、 具体角色、个体和值。 7 东南大学硕士论文 由于语义w e b 上领域本体数量众多且规模庞大,应用这些领域本体时,需要综合考虑知 识表达能力和推理效率。 本文所建立的学科分类体系本质上就是一个本体,它所用的描述语言是o w l - d l 。 2 2 本体演化 不管是在人工智能领域还是语义w e b 领域。本体都得到了广泛的研究和应用,随着研 究的深入和应用的需求变化,本体的动态特性都日益明显,本体演化作为本体研究的一个重 要方面也越来越得到关注。 2 2 i 本体演化的原因 有多种原因会导致本体的演化。引起本体变化的原因包括以下几个方面【2 4 1 : a ) 领域的变化。领域的改变非常普遍,它们的影响与数据库模式的影响基本类似。例 如,当两个具有不同管理机构的大学里的系进行合并时,描述该领域的本体需要修改以反映 这种变化。 b ) 共享概念模型的变化。概念模型的改变是由于领域视图或使用角度的改变引起的, 即上下文的改变。当本体应用于新的任务或新的领域时,概念的表示也要相应地变化。 c ) 表示的变化。表示( r e p r e s e n t a t i o n ) 的变化是指一种转换,当本体由一种知识语言翻译 成另一种知识语言时,就会产生显式定义的改变。这些语言不仅语法各异,而且更重要的是 语义和表达也各不相同。因此,在转换过程中保持本体的语义一致非常重要。 本体演化是变化原有本体中随时间、环境等因素的改变而出现的不一致、不合适的部分。 2 2 2 本体演化的定义 目前对本体演化的定义有如下几种: 本体演化是指本体对出现的变化的适时修改及这些变化到附属产物的一致性传播1 2 ”。 本体演化( 能力) 就是通过创建和维护不同版本的本体来获得管理本体变化和变化的影 响的能力聊j 。 本体演化就是一个由旧版本体变成新版本体的过程,在这个过程中需要维护基于本体的 资源数据的完整性m 1 。 其中第一种定义由德国k a r l s r u h e 大学的l j l i j a ms t o j a n o v i c 等人在2 0 0 2 年提出,得到 广泛接受。 从这些定义中可以看出,对变化的处理和一致性的维护是本体演化的两大基本任务。 2 2 3 本体演化的过程模型 本体演化的本质是本体如何适应外部世界的变化而进行适当的调整,同时保持本体及其 附属产物的一致性。l j l i j a n as t o j a n o v i c 等人根据这个思想提出了本体演化的过程模型。过程 的划分见图2 - 3 。 8 第二章本体与本体演化 图2 - 3 本体演化过程模型口6 】 该本体演化过程模型将本体演化分为六个阶段,分别是变化的捕捉,变化的表示、变化 的语义、变化的实现、变化的传播、变化的确认。这六个阶段随着外部世界的变化不断地循 环,推动本体不断地演化。 ( 1 ) 变化的捕获:从显示的需求说明或变化发现方法的结果中捕获本体的变化: ( 2 ) 变化的表示:形式化和显式地表示本体的变化; ( 3 )变化的语义:计算为了保证本体一致性而产生的额外变化; ( 4 ) 变化的实现:以一种事务处理方式实现需求和导出的本体变化; ( 5 ) 变化的传播:更新依赖于变化的本体的数据、其它本体和应用程序,以保持一 致性; ( 6 )变化的确认:评估结果,如果需要的话,开始新一轮的本体演化。 典型的支持该过程模型的项目是k a o n 。k a o n ( t h ek a r l s r u h eo n t o l o g ya n ds e m a n t i c w e bf r a m e w o r k ) 是一个开放源代码的软件项目,其开发和维护是由k a r l s r u h e 大学的f z i 和a i f b 研究中心支持的。k a o n 项目的目的是提供一个开源的本体管理基础框架,以促进 基于本体的应用软件的发展 2 7 1 。它包括一系列使本体的管理和应用变得更为容易的工具组 件,包括本体的创建,存储,检索,维护和应用等。 图2 - 4 是k a o n 支持本体演化的体系结构图: 9 东南大学硕士论文 a p p l i c a u o n s & 8 e r v i c e s m i d d l e w a r e lo 眦咖s m o e e 岫po 协n t 州o g y 删 o t h e ru s e ri n t e d a c e lm e t a d a 协 a p p t i c a t l o n l l e n g i n e e r i n gt o o l a n ds e r v i c e s d 越a a n d r e m o t es e r v 耙e s 图2 - 4i ( a o n 支持本体演化的体系结构。” 该体系结构大致分为三层: 应用和服务层( a p p l i c a t i o n sa n ds e r v i c e sl a y e 0 :利用k a o n a p i 开发了为各种智能代理 提供的多种应用接口。 中间层( m i d d l e w a r e ) :k a o n a p i 内嵌在k a o n 的三层体系结构中,它负责典型的和业 务相关的需求,如持久性、可靠性、事务和并发支持。 数据和远程服务层( d a t aa n dr e m o t es e r v i c e s ) :该层实现数据的存储,同时提供原子事 务的并发控制与更新。 k a o na p hk a o n 最核心的模块是它的k a o na p i ,它内嵌在k a o n 的三层概念体 系结构中,它提供了许多对本体进行创建和管理的模块。提供了本体的编辑和存储机制,支 持本体的演化,本体的访问和处理程序。存储机制包括r d f 模型或关系数据库模型。 r d f a p i 提供了使用r d f 模型的程序。包括模块化、r d f 解析器( p a r s e r ) 。r d f 串行器 ( s e r i a l i z e , r ) 等处理程序。r d fa p i 允许使用r d f 知识库,它为k a o na p i 提供了最初的记 忆储藏机制,而且被r d fs e r v e r 连接使用,从而实现多用户对r d f 知识库的加工和使用。 r d fa p i 还包含一个r d f 解析器,其符合r d f 标准。 最重要的是在中间层中实现了一些与演化相关的部分,包括演化策略,变化可逆性,演 化日志。通过三部分的协作t 推动本体的演化,下面对这三部分分别进行说明。 演化策略( e v o l u t i o ns t r a t e g y ) 负责维护本体状态的一致性,禁止不合法的变更操作。 变化可逆性( c h a n g e r e v e r s i b i l i t y ) 在演化日志中记录本体的变化,以便在必要的时候按照 使用者的要求取消这些变化,使其回复到以前的状态。演化日志的核心是一个演化本体,它 记录了发生什么变化,为什么变化,何时变化,由谁改变,以及怎么变化等内容。 演化日志( e v o l u t i o nl o g g i n g ) 记录了本体发生的一系列变更,以便于根据用户的请求来傲 恢复操作,同时,它也可以用在分布式环境中的本体演化。 本文主要采用本体演化过程模型对变化进行处理,同时借鉴k a o n 体系结构中的演化 日志记录变化,实现变化的追踪。 i o 第二章本体与本体演化 2 3 本章小结 本章主要介绍了本体及本体演化的基本概念,并重点对本体演化的原因、定义和过程进 行了详细的描述。本章的最后介绍了本体演化的过程,下一章将分析基于该思想的基于本体 演化过程模型的本体演化框架,并介绍其他本体演化框架, 东南大学硕士论文 第三章一个结合版本和日志技术的本体演化框架 ( vlo g o n t o e v o ) 随着本体演化研究不断深入,本体演化框架已有不少口”。本章主要分析n a t a l y af n o y 等人提出的基于版本比较的本体演化框架及l j i u as t o j a n o v i c 等人提出的基于本体演化过 程模型的本体演化框架,在此基础上,提出一个结合版本和日志技术的本体演化框架,以作 为构建学科分类系统的工作基础。 3 1 基于版本比较的本体演化框架 s t a n f o r d u n i v e r s i t y 的n a t a l y a e n o y 与v f i j e u n i v e r s 时的m i c h e l k l e i n 合作提出的本体 演化框架是以同一本体的不同形态( 即,版本) 为研究对象,注重对同一本体的不同版本的 对比分析,为本体演化的处理提供方便。基于版本比较的本体演化框架图如图3 - 1 。 1 享1 3 - 1 基于版本比较的本体演化框架图口q 3 1 1 基于版本比较的本体演化框架主要思想 囤愚竺幽 在基于版本比较的本体演化框架中,其主要思想是对同一本体的不同版本进行比较,将 通过比较获得的本体变化以表格的方式呈现给用户,以便于用户了解两个本体之间的变化, 进而为本体演化提供帮助。 变化比较的方法是通过引入一个变化操作本体( 在这个本体中定义各种本体变化操作, 比如增加,删除、修改等,在同一实体进行删除等操作之前,必须先增加该实体) ,在变化 日志的帮助下,将同一本体的新旧版本体进行比较,产生最小转换集,通过最小转换集可以 得到同一本体中不同版本中概念之间的关系。如果变化日志不存在或无法得到,可以通过比 第四章基于v l o g o n t o e v o 框架的学科分类系统的设计 较新旧本体得到结构差异,通过结构差异得到最小转换集和不同版本中概念之间的关系。 定义( 最小转换集) :给定本体两个版本,v l 和v 2 ,转换集t ( v i ,v 2 ) 是本体变化操作的一 个集合,除了对于同一实体c r e a t e 操作优先于其它操作之外,该集合的其它元素可以是任意 次序的操作,如果该集合其中的任一元素被删除,剩下的元素操作都不可能实现v l 版本到 v 2 版本的转换,则该集合称为最小转换集。 3 1 2 基于版本比较的本体演化框架各部分说明 变化日志( c h a n g el o g ) :有很多方法可以用来表示变化信息,对于一个本体的新( n e w ) 1 日( o l d ) 两个版本,通过记录它们之间的转换操作序列日志文件,可以清晰地描述本体不同版 本的转换过程。 结构差异( s t r u c t u r a ld i f f 【”1 1 :变化日志并不总是有效,譬如在语义w e b 这个动态的分布 式的应用环境中,我们仅仅能够访问到本体的新版本或者旧版本,并不能访问到它们之间转 换的目志文件,再者,当不同的使用者同时更新一个本体的时候,更加不可能访问到它们之 间的转换过程。因此,我们可以不考虑这些变化过程,而直接来关联不同版本之间的关系。 p r o m m d i f f 算法j 提供了对同一个本体的不同版本进行相应的比较和映射,从而得出它们之 间的结构差异。 转换集( t r a n s f o r m a t i o ns e t ) :转换集提供了一个变化操作的集合,通过该集合中的操作 可以使本体从旧版本转化成新版本,该集会中的操作可以是原予操作,如添加,删除等,同 时也可以是几个原子操作的复合操作,它不同于日志文件。 概念关系( c o n c e p t u a lr e l a t i o n s h i p s ) :记录本体新旧版本中的概念之间的关系。 复杂变化( c o m p l e xc h a n g e s ) 阱l :多个如添加,删除等简单变化复合成的变化。 变化操作本体( o n t o l o g yo f c h a n g eo p e r a t i o n s ) :限定本体实体变化操作类型的本体。 模块间的交互如下: 1 变化日志专最小转换集专概念关系 当存在变化日志时,根据变化日志,可以求得最小转换集,根据最小转抉集可以得到本 体中概念模型的变化关系,提供给用户。 2 v o l d v n e w - ) 结构差异最小转换集概念关系 当变化日志不存在或无法获得时,根据同一本体的新旧两个版本v o i d 与v n e w ,用 p r o m p t d i f f 算法可以求得本体版本之间的结构差异,通过结构差异可以推导出变化过程的最 小转换集,并最终得到本体中概念模型的变化关系,结构差异本身也对得到本体中概念模型 的变化关系有帮助。 3 最小转换集复杂变化 对最小转换集中的变化,有些可以进一步提炼,复合成一个复杂变化。 本文利用该框架使用变化操作本体规范本体变化的思想,迸一步扩展变化操作本体的应 用范围,利用它指导日志的形成。使得日志具有清晰的语义,并使用变化操作本体将版本和 日志有机地结合。 3 2 基于本体演化过程模型的本体演化框架 该本体演化框架是l j i u as t o j 勰o v c 等人在k a o n 项目研发中提出的。该框架基于本体 演化的过程模型,将其中的描述变化、产生额外变化、实现变化、传播变化定为演化基本功 能部分,而将捕获变化1 3 3 】与确认变化列为扩展功能部分。而演化策略和演化日志主要功能 东南大学硕士论文 基于本体演化过程模型的本体演化框架如3 - 2 图。 扩展演化基本功能部分 扩展 图3 - 2 基于本体演化过程模型的本体演化框架简图 3 2 1 基于本体演化过程模型的本体演化框架主要思想 基于本体演化过程模型的本体演化框架其主要思想是基于本体演化的定义本体对 出现的变化的适时修改及这些变化到附属产物的一致性传播设计的,因此,将演化过程 模型分为基本功能部分和扩展部分也就更突出了本体演化的基本任务。 该框架源于本体演化的过程模型,六个主要部分分别对应于过程模型的六大阶段,实现 每个阶段需要完成的功能,具体见第二章中的本体演化的过程模型。 3 2 2 演化日志和演化策略 演化日志和演化策略辅助演化基本功能部分的完成,下面分别进行介绍。 演化日志:演化日志记录了本体发生的变化序列,以便于根据用户的请求做恢复( u n d o ) 操作,同时,可通过演化日志对本体进行更新。日志的变化,应包括简单变化和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论