(模式识别与智能系统专业论文)领域本体管理及其在电力系统中的应用.pdf_第1页
(模式识别与智能系统专业论文)领域本体管理及其在电力系统中的应用.pdf_第2页
(模式识别与智能系统专业论文)领域本体管理及其在电力系统中的应用.pdf_第3页
(模式识别与智能系统专业论文)领域本体管理及其在电力系统中的应用.pdf_第4页
(模式识别与智能系统专业论文)领域本体管理及其在电力系统中的应用.pdf_第5页
已阅读5页,还剩70页未读 继续免费阅读

(模式识别与智能系统专业论文)领域本体管理及其在电力系统中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 随着信息技术的发展,各企业、组织内部信息越来越多样化。如何使得企业、 组织有效地维护海量信息、整合分布异构数据资源并实现领域数据共享,是当前 各领域深化信息系统建设发展的重要方向。作为领域数据集成及规范核心的领域 数据项标准术语体系领域本体,是实施领域数据集成和数据共享的基础。如 何直观的构建领域本体,满足各领域专家的工程应用需求是本课题研究的重点。 本文在研究现有本体构建方法的基础上,结合课题组项目“基于数据服务匹 配的数据集成系统”的研发需求,设计并初步实现了一套可适合各领域专家使用 的领域本体管理工具,并将该工具应用于电力领域本体管理,取得了初步成果。 主要工作和贡献如下: 1 初步实现了一个操作简单、直观、可满足不同领域专家使用的领域本体管理 工具。主要使用p r o t 6 9 6 o w l a p i 进行二次开发,并增加了操作直观的树形 图本体编辑模块。目前该工具完成了整体框架搭建和核心算法调试,可以提 供基于列表与树形图的本体编辑方式,并实现了推理机检查处理、本体导入 及存储等功能。 2 深入研究了当前电力领域公用信息模型( c i m ) 和电力领域本体的构建设计 方法。提出了一种自动转化c i m 描述语言到基于描述逻辑的标准本体语言 ( o w ld l ) 的算法,并将此算法实现为一个功能模块挂接到领域本体管理 工具中。有关测试表明:通过该模块转换后的c i m 基本没有概念丢失,并 且可以很好满足机器自动推理计算要求。 3 利用本文工作已实现的领域本体管理工具,结合关于电力领域本体构建的研 究成果以及c i m 转换工具,构建了一套初步的电力领域本体知识库。 关键词:领域本体;本体语言;管理工具;电力系统;公用信息模型 a b s t r a c t a b s t r a c t w i t ht h ed e v e l o p m e n to fi n f o r m a t i o nt e c h n o l o g y , t h ei n t e r n a li n f o r m a t i o no f e n t e r p r i s e s ,o r g a n i z a t i o n sa r eb e c o m i n gm o r ea n dm o r ev a r i o u s i ti st h ei m p o r t a n t s u b j e c t sa n dd i r e c t i o n sa b o u th o w t oe n a b l et h ee n t e r p r i s e s ,o r g a n i z a t i o n sm a i n t a i n m o u n t a i n so fi n f o r m a t i o ne f f e c t i v e l yt oa c h i e v et h ea r e a so fd a t as h a r i n g d o m a i n o n t o l o g y , a st h es t a n d a r dt e r m i n o l o g ys y s t e mo fd o m a i nd a t ai n t e g r a t i o na n d c a n o n i c a lc o r e ,i st h eb a s i so ni m p l e m e n t a t i o nd a t as h a r i n ga n di n t e g r a t i o n t h ef o c u s o ft h i st h e s i si sh o wt oc o n s t r u c td o m a i no n t o l o g yi n t u i t i v e l y , t om e e tt h ed e m a n d so f n o n - c o m p u t e re x p e r t s o nt h eb a s i so fd e e p l yr e s e a r c ho nt h ep r e s e n td o m a i no n t o l o g yb u i l dm e t h o d s a n dt h ep r o je c to fo u rl a b o r a t o r y ”d a t ai n t e g r a t i o ns y s t e mb a s e do nd a t as e r v i c e m a t c h i n g ”,t h i st h e s i sd e s i g n sad o m a i no n t o l o g ym a n a g e m e n tt o o l t om e e tt h e d e m a n d so fe x p e r t si nv a r i o u sf i e l d s ,a n di n i t i a lr e s u l t sa r ea c h i e v e du s i n gi ti np o w e r s y s t e m m a j o rw o r ka n dc o n t r i b u t i o n sa r ea sf o l l o w s : 1 d e s i g n i n ga n di m p l e m e n t i n gad o m a i no n t o l o g ym a n a g e m e n tt o o l :s i m p l ea n d i n t u i t i v ef o re x p e r t si nv a r i o u sf i e l d s t h et o o li s r e p e a t e d l yd e v e l o p m e n to n p r o t 6 9 6 一o w la p i ,a n da d d st h et r e ee d i t i n gm o d u l et or a i s ei n t u i t i v eo ft h et 0 0 1 c u r r e n t l yt h eo v e r a l lf r a m e w o r ks t r u c t u r ea n dc e n t r a la l g o r i t h md e b u g g i n ga r e c o m p l e t e d t h et o o lc a np r o v i d eal o to ff u n c t i o n s ,s u c ha sav a r i e t yw a y so f o n t o l o g ye d i t i n g ,i n f e r e n c eo fm u l t i r e a s o n i n ge n g i n e e r sa n dd a t a b a s es t o r a g e 2 s t u d y i n gd e p t ho ft h ep o w e rd o m a i nc o m m o ni n f o r m a t i o nm o d e l ( c 1 1 v oa n d c o n s t r u c t i o n so fp o w e rd o m a i no n t o l o g y t h i st h e s i sp r e s e n t sa na l g o r i t h mt h a t c a nt r a n s l a t et h ec i m d e s c r i p t i o nl a n g u a g e t ot h es t a n d a r d o n t o l o g y l a n g u a g e o w ld la u t o m a t i c a l l y t h ea l g o r i t h mi si m p l e m e n t e da sad o m t s m o d u l e - “a u t o m a t i cl a n g u a g ec o n v e r s i o nm o d u l e ”t h er e l a t e de x p e r i m e n t sp r o v e t h a tt h et r a n s l a t e dc i m h a r d l yh a sa n yl o s so fc o n c e p t sa n dc a nb ei n f e r r e db y c o m p u t e r 3 u s i n gt h ed o m a i no n t o l o g ym a n a g e m e n tt o o l ,c o m b i n e dw i t ht h er e s e a r c hr e s u l t s o fp o w e rd o m a i no n t o l o g yc o n s t r u c t i o na sw e l la sc i mc o n v e r s i o nt o o l ,t h i s t h e s i sb u i l da ni n i t i a ld o m a i no n t o l o g yk n o w l e d g eb a s eo f p o w e r k e yw o r d s :d o m a i no n t o l o g y ;o n t o l o g yl a n g u a g e ;m a n a g e m e n tt o o l ;p o w e r s y s t e m ;c o m m o ni n f o r m a t i o nm o d e l ( c i m ) ; i i i 中国科学技术大学学位论文原创性声明 本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的 成果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或 撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作 了明确的说明。 作者签名:兰耀 签字日期:互垒鱼瑗一 中国科学技术大学学位论文授权使用声明 作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学 拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构 送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入中 国学位论文全文数据库等有关数据库进行检索,可以采用影印、缩印或扫描 等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内 容相一致。 保密的学位论文在解密后也遵守此规定。 呕开 口保密( 年) 作者签名:盟墨 导师签名: 签字日期: 丝坦! 笠;2 茳 签字日期:丕生! 曼! 圣星 第一章绪论 1 1 研究背景及意义 第一章绪论 随着计算机技术的迅猛发展,各企业、组织内部信息以几何级数增长,大量 信息排山倒海般涌来。如何使得企业、组织有效地维护海量信息、整合分布异构 数据资源并实现领域数据共享,是当前各领域深化信息系统建设发展的重要课题 和方向。领域本体,作为“特定领域内共享概念模型的明确的形式化规范说明” u z j ,是实施领域数据集成和数据共享的基础。 目前各个专业学科都在研究本领域的本体,以期获得本领域的共享概念模 型,达到知识共享和知识复用的目标【3 ,4 ,5 1 。但是构建领域本体是一项庞大的系统 工程,需要经历一个复杂的反复过程。本体编辑工具在一定程度上减少了本体构 建的难度,国外近几年已推出了一些可编辑处理本体的专门工具,如p r o t 6 9 6 等。 但这些工具一般都要求使用者有较深入的本体语言知识,这对非计算机领域专家 来说很不合适。设计一个界面简洁、操作直观的本体编辑工具将为非计算机专家 的领域专家构建本体节约大量的时间。 目前许多研究领域都建立了自己的标准本体,它们正在各自领域的信息组织 中发挥重要作用。电力系统是关系国计民生的重要领域,国际电气与电子工程师 协会( i e e e ) - - 直致力推动智能电网的发展,智能电网的应用在世界掀起巨大浪 潮。目前智能电网能够实现的仅仅是能源的节约及环保等问题1 6 j 。根据未来智能 电网核心特征之一自愈性【7 1 ,如果将本体技术应用于电力系统,在电厂企业 间建立一个标准的电力模型知识库,实现知识共享和复用,并引进推理等人工智 能技术应用,将可以实现多个基于本体的智能系统间的互操作,在系统范围内使 用计算机协调控制【8 】,通过分布式智能代理来恢复电力元件或局部网络的异常, 具有很强的实用意义。 1 2 相关研究现状 1 2 1 国内外领域本体构建方法与构建工具的研究现状 目前国内外有关领域本体的构建方法主要分为三种 5 , 9 , 1 0 】:一种是通过手工方 式直接对源码进行编辑处理;一种是通过一些算法自动生成本体,然后领域专家 第一章绪论 对生成的本体检查整理;最后一种则是通过借助可视化软件对领域本体进行直观 管理。对源码的处理需要领域专家通晓本体语言,而一个小型的领域本体源码也 会达到上万行,管理起来非常复杂;而半自动化构建方法一般都存在信息遗失、 处理效率低等问题,这将大大降低生成本体的质量。 比较而言,一个优秀的本体编辑工具可以使对本体的构建变得直观,当前国 内外研究机构更倾向于这种方法。迄今为止,本体编辑工具的种类已经超过9 0 种【l 。本体编辑工具种类繁多,既有商业产品又有研究课题,还有一小部分仅仅 是软件说明工具。至今国内并没有已经发布的本体编辑工具。本体编辑工具对降 低本体开发强度和加速开发过程有着重要意义。目前技术比较成熟、知名度较高 的本体编辑工具有:斯坦福大学知识系统实验室研制开发的o n t o l i n g u a u2 。、德国 k a r l s m h e 大学开发后由o n t o p r i s e 公司发布的商业软件o n t o e d i t 1 3 】、英国o p e n 大学开发的w 曲0 n t o 【1 4 】、英国m a n c h e s t e r 大学研发的o i l e d ”j 以及美国s t a n f o r d 大学开发的p r o t 6 9 6 t 1 6 j 。 这几种本体编辑工具虽然各具有自己的优越性和不可替代性,但是也或多或 少有不尽如人意之处。比如:o n t o l i n g u a 、w e b o n t o 和o i l e d 都是基于某种特定 语言。2 0 0 3 年世界万维网组织( w o r l dw i d ew e bc o n s o r t i u m ,w 3 c ) 规定网络 本体语言( w e bo n t o l o g yl a n g u a g e ,o w l ) 作为本体标准语言,o w l 语言与以 上几种语言相比较而言,具有更强的描述能力,支持更强的推理。由于奉体的不 同描述语言之间的翻译过程很复杂,现在这几种软件很少使用;o n t o e d i t 作为一 种商业软件,代码非开源在一定程度上制约了其发展速度,目前的版本只支持英 语、法语和德语,构建中文本体时会有编码障碍;p r o t 6 9 6 沿用了w i n d o w s 的界 面风格,采用了列表树形式的编辑界面,并且支持w 3 c 定义的标准本体语言 o w l ,目前在国内外研究机构中最为常用。但是由于其菜单项繁琐、面板复杂 并且要求用户熟悉相关的本体语言,对于非计算机专业的领域专家来说,使用起 来非常不便,在具体领域的实际工程应用中存在一定的约束。 1 2 2电力领域本体研究现状及存在的问题 1 9 9 4 年元月份开始、为期3 0 个月的欧盟共同资助的k a c t u s 【l7 j 工程中包 括了电力系统的本体构建工作( 1 认c t u s 是指“关于多用途复杂技术系统的知 识建模”工程,是欧洲e s p r i t 框架下的研发项目之一,属于e s p r i t - - i l l 所支 持的项目) ,主要涉及电力网络故障诊断方面做了本体构建,主要使用o n t o l i n g u a 语言描述。2 0 0 3 年起,w 3 c 定义o w l 语言作为本体的标准语言,本体语言之 间的转换非常复杂,目前的技术难以实现。因此,该本体目前来说实用意义不大。 后来,随着计算机技术和现代通信技术的发展,电力系统自动化软件业也掀 2 第一章绪论 起了网络化和组件化的浪潮。网络化使得电力系统自动化软件在分布式环境下分 工合作,这种分布式系统往往是一个由不同硬件、不同操作系统或不同厂家产品 组成的异构系统。要使其协调工作,各个部分接口必须标准化l l 引。因此国际电工 技术委员会( i e c ) 制定了一系列标准,定义组件间交互的公用信息模型和组件 接口规范来满足应用组件的即插即用。其中i e c 6 1 9 7 0 标准中定义的公用信息模 型( c o m m o ni n f o r m a t i o nm o d e l ,c i m ) 在一定程度上可以看作是电力系统的领域 本体【1 9 】,它定义了电力领域中各术语以及它们之间的简单关系【2 0 】。目前国内外 电力研究机构已经进行多次互操作实验,证明了其稳定性和工程可用性i l 引。 但是,当前发布的c i m 描述语言不支持计算机推理。自1 9 9 8 年起,美国电 力科学院控制中心a p i ( c c a p i ) 开始使用面向对象统一建模语言( u m l ) 来描 绘c i m 模型。c c a p i 采用r a t i o n a lr o s e 维护和编辑c i m ,通过图形界面可以很 方便的查看c i m 的所有内容,但它只是一个抽象模型,没有定义模型数据库的 规范和数据交换的格式,不能用于实际工程应用【2 们。后来i e c 6 1 9 7 0 定义了 c i m x m l 语言,解决了不同系统之间数据交换的问题,c i m x m l 语言是基于 c i m 的资源描述框架( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ,r d f ) 应用。构建任 何一个领域本体的最终目标都是实现推理,r d f 由于其描述的自由性,不能使 用计算机推理【5 1 。随着o w l 语言的出现,电力领域各研究机构相继研究各种语 言转换工具,以实现c i m 模型描述语言的转换。其中x p e t a l 】可以实现c i m 的 描述语言由u m l 类型到c i m x m l 类型的转化;c i m t o o l t 2 2 】则可以实现c i m 的 描述语言由u m l 类型到o w l 类型的转化。但是c i m t o o l 的转换以兼容性为主, 并没有实现c i m 模型的可推理性。只有使用满足计算机推理的c i m 模型作为知 识库,才能为实现智能电网自愈性这一特征做下铺垫。 1 3 研究内容 本文的研究主要围绕上述问题展开,具体包括以下内容: 1 深入研究和分析国内外现有领域本体管理方法和一些知名本体编辑工 具。在此基础上,设计并初步实现一套操作简单、直观、可满足不同领 域专家使用的领域本体管理工具。 2 深入研究当前电力领域公用信息模型( c i m ) 、熟悉了解基本电力领域 知识,在此基础上,提出一套可行、合理的电力领域本体初级模型构建 方法。 3 实现一个可自动转化原始c i m 文档到标准o w l d l 文档的处理程序。 4 利用本文工作将实现的领域本体管理工具,结合电力领域本体初级模型 3 第一章绪论 研究成果,构建一套初步的电力领域本体知识库。 1 4 本文结构安排 本文工作主要围绕“领域本体管理工具研究展开。论文的结构和主要章节 内容安排如下: 第一章绪论:介绍论文选题背景与意义,说明领域本体在数据集成应用中 的地位与意义;概述国内外关于领域本体构建方法与构建工具的研究现状、发展 趋势和当前存在的主要问题;给出论文工作主要内容和论文内容结构安排。 第二章本体相关理论与技术:简要介绍本文工作涉及的相关理论与技术体 系。具体内容包括:简要介绍本体定义与当前主要的分类方法,并介绍了当前使 用比较广泛的几种本体表示语言;介绍了当前几种比较常用的本体编辑工具及它 们的优缺点;介绍本文相关软件系统开发需要使用到的两个开发包,即可帮助高 效处理本体的语义w e b 应用程序开发包j e n a 及本体编辑处理支持包( p r o t 6 9 6 o w l a p i ) ,说明它们的使用和调用方法。 第三章领域本体管理工具( d o m t ) 设计与实现:基于规范的软件工程管 理方法与规范软件系统说明描述方法,对本文主要完成的目标系统“领域本体管 理上具( d o m t ) ”进行全方位描述,包括:系统总体描述;系统设计目标;系 统功能需求描述;系统功能模块结构设计描述;系统整体架构和体系结构设计描 述;系统主要功能模块设计描述;系统主要功能模块详细设计与实现描述。 第四章d o m t 在电力领域的应用:首先,简要介绍电力领域公用信息模型 c i m 在电力系统信息技术规范中的地位、意义和不足之处,说明转换c i m x m l 文档格式到o w ld l 语言标准本体文档的必要性。其次,根据c i m x m l 的语 法特点和o w ld l 的语法约束,描述转换算法设计与程序实现;最后,利用转 换结果,结合对电力领域知识、电力领域本体设计研究的相关成果,应用d o m t 完成一套初步的电力领域本体知识库,并总结d o m t 与具体领域本体构建应用 结合的方法步骤。 第五章结束语:总结全文工作,描述论文工作已完成的目标系统情况和程 度,总结说明论文主要完成工作和主要贡献,并简要说明下一步工作目标和展望。 4 第二章本体相关理论与技术 第二章本体相关理论与技术 本章主要介绍本体相关理论和技术。本体相关理论中主要包含本体定义与分 类、自上世纪9 0 年代发展至今的所有本体语言。本体相关技术中主要介绍常用 的几种本体编辑工具及使用面向对象语言构建本体时用到的底层模型接口,包括 j e n a 和p r o t 6 9 6 一o w l 的接口结构及在此基础上二次开发。 2 1本体理论 2 1 1本体定义与分类 本体( o n t o l o g y ) 这一概念最初起源于哲学领域,是形而上学理论的一个分 支,自上世纪6 0 年代以来就为计算机领域所使用【5 】。但是对于本体的理解与定 义一直缺乏统一的看法。1 9 9 3 年g r u b e r 将本体定义为“a no n t o l o g yi sa ne x p l i c i t s p e c i f i c a t i o no f ac o n c e p t u a l i z a t i o n ”1 2 3 】,即“本体是概念模型的明确的规范说明”, 这是第一个让人信服并被广泛使用的本体定义;19 9 7 年,b o r s t 在此基础上给出 了本体的另外一个定义“a no n t o l o g yi saf o r m a ls p e c i f i c a t i o no fas h a r e d c o n c e p t u a l i s a t i o n ”【2 4 】,即“本体是共享概念模型的形式化规范说明”;1 9 9 8 年, s t u d e r 等人参考上面两种定义,给出了更确切的定义:“a no n t o l o g yi saf o r m a l , e x p l i c i ts p e c i f i c a t i o no fas h a r e dc o n c e p t u a l i z a t i o n 2 s 】,即“本体是共享概念模型 的明确的形式化规范说明 ,这也是目前认可度最高的本体定义方法。 这个定义包含四层含义:共享、概念模型、形式化、明确。其中“共享 说 明本体体现的是相关领域公认的知识概念集;“概念模型”说明本体体现的是一 个概念体系;“形式化”说明本体是机器可理解的;“明确”则说明了本体内任何 概念都应被明确定义和说明。 这些文字描述对于实际应用来说,是远远不够的。因为计算机科学中的本体 是具体的,需要给出形式化的本体定义,目前还没有一种权威的形式化本体定义。 文献 2 6 1 ,p e r e z 等人给出了形式化定义本体的五元组描述,将本体元素分为: 类、关系、公理、函数、实例五种。其中类是对现实世界中个体的抽象,表示个 体的集合;关系通常包含定义域和值域两部分:公理代表领域知识的永真断言: 函数表明了概念与概念之间的特殊关系;实例则是现实世界中具体和唯一的个 体。总体来说,该形式化定义能很好的反映c r m b e r 和s t u d e r 等人对本体描述的 思想。 5 第二章本体相关理论与技术 在对本体的研究中,由于构建的本体复杂度不同,本体的形式化程度也各不 相同。l a s s i l a 和m c g u i n n e s s 根据本体形式化程度,如图2 1 所示,将本体分为 1 1 中类型【2 7 】,从最左边的简单目录到最右边的通用逻辑约束本体,形式化程度 不断增强。 图2 1 本体谱 本体的形式化定义为其实际应用做下了铺垫。在实际应用中,考虑的重点不 同,对本体分类的方法也各不相同,如图2 2 所示。m i z o g u c h i 等人建议按照本体 的内容划分类别【2 引,将本体分为三类:领域本体( d o m a i no n t o l o g y ) 、任务本体 ( t a s ko n t o l o g y ) 和通用本体( c o m m o no n t o l o g y ) 。其中领域本体是涉及特定 学科领域的本体;任务本体是涉及问题求解步骤的本体;而通用本体则是设计具 有普遍的意义的客观世界常识的本体。gv a nh e i j s t 等人认为应该按照概念体系 的主题来划分【2 9 】,这种分类方法在知识工程领域得到了广泛的认可。根据他们的 观点,将本体分为四类:领域本体( d o m a i no n t o l o g y ) 、顶级本体( g e n e r i c o n t o l o g y ) 、应用本体( a p p l i c a t i o no o t o l o g y ) 和表示本体( r e p r e s e n t a t i o n o n t o l o g y ) 。 领域本体:这类本体表示的知识是针对特定领域的。目前知识工程方法将领 域知识和领域本体做了精确的区分。但是两者又有一定的关系,领域知识描述了 特定领域的实施情况,而领域本体制约了领域知识结构和内容。 顶级本体:这类本体与领域本体类似,但是其中定义的概念是各个领域通用 的。非常典型的,顶级本体定义状态、时间、进程、动作和组件等类似概念,而 领域本体则将这些概念特殊化。一般来说,顶级本体和领域本体的界限是模糊的, 但是这种划分在直觉上说是有意义的。 应用本体:这类本体包含了某特定应用所需要建立知识模型所有定义。一般 来说,应用本体包含了特定的方法和目标任务的扩展。它们本身是不可复用的, 一般与解决问题的方法相关联。 表示本体:这类本体以知识表示的形式来说明概念体系,也就是说,它们提 供了一个表示框架,而不是对这个世界做了断言。 6 第二章本体相关理论与技术 图2 2 本体分类 2 0 0 1 年i e e e 标准上层知识本体工作小组建立了建议上层共用本体( s u m o ) , 目的在于鼓励其他特定领域的知识本体以它为基础,衍生出更多的其他特殊领域 的知识本体。由此可见,领域本体是e l 前各领域专家研究的重点,领域本体提供 了对领域内知识的共享和复用,形式化的定义领域内共同认可的知识,是可以在 各种知识系统中交换知识的共同语言。 2 1 2 本体表示语言 本体作为形式化的模型体系的建模工具,需要使用良构的语言来进行描述。 传统的本体表示语言多是基于框架、描述逻辑等人工智能知识,包括:o n t o l i n g u a 、 o k b c 、o c m l 、f l o g i c 、l o o m 等,具体介绍请见参考文献 3 0 】。本文主要介 绍在因特网背景下新兴起的各种网络本体语言,w 3 c 组织的成员协会和受邀专家 组成w o w g ( w e bo n t o l o g yw o r k i n gg r o u p ) 的宪章中明确表述【j l j :当设计w 曲本 体语言时应把d a m l + o i l 当作起始点。主要的网络本体语言包括r d f ( s ) 、 d a m l + o i l 和o w l 。本体主要语言关系图如图2 3 所示。 7 第二章本体相关理论与技术 k “ | | 、 。 :i _ 、 。 。7 图2 3 本体主要语言关系图 r d f ( s ) ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ( s c h e m a ) ) 【3 2 】 资源描述框架r d f 是一个网络资源对象和期间关系的数据模型,拥有简单的 语义,该数据模型可由x m l 语法编码。w 3 c 1 9 9 9 年公布了r d f 的推荐标准,r d f 提供了一种用于表达语义信息、并使其能在应用程序间交换而不丧失语义的通用 框架,是语义网表示语义信息的基础。r d fs c h e m a ( r d f s ) 是一个用来描述r d f 资源的属性和类型的词汇描述语言,并提供了关于这些属性和类型的语义,r d f s 本身也是用r d f 表示的,通常将r d f 和r d f s 统称为r d f ( s ) 。 r d f 数据模型由以下四种基本对象类型组成1 5 j : 资源。在w e b 上以u r i 标识的所有事物都可以称为资源。任何事物都可 以有一个唯一的u 砒引用,u 引用的扩展性允许用来表示任何实体。 文字。字符串或数据类型的值。r d f 没有自己的数据类型定义机制,而 是允许使用独立定义的数据类型,如使用x m ls c h e m a 中定义的数据类 型。 特性。用来描述资源的特征、属性和关系。每个特性都有一个特定的意 义,可定义它的许可值、描述资源类型以及和其他特性之间的关系,是 资源的一个子集。因此一个特性可以用另外一个特性描述,甚至可以被 自身描述。 声明。一个特定的资源加上特性及特性值就是一个r d f 声明,一般表示 为“主体( s u b j e c t ) 谓词( p r e d i c a t e ) 客体( o b j e c t ) ”的三元 组形式。 r d f 模型的基本结构是三元组的集合,可用具有节点和有向边的图来表示, 成为r d f 图。在r d f 图中每个三元组表示为“节点边节点”的连接,如 图2 4 所示。其中资源用椭圆节点表示,文字用方节点表示,边由谓词担当。边 的方向很重要,总是有主体指向客体。例如“j o h n s m i t h 的姓是s m i t h ”这句话可 8 四 口 第二章本体相关理论与技术 以用一个r d f - - 元组表示为:h r p :h :j o h n s m i t hh r p :h :f a m i l y n a m e “s m i t h ”。 其 h t t p :为名称空间前缀。 图2 4 一个简单的r d f 模型示例 r d f 使用x m l 作为标示语言。r d f 和x m l 相互补充:x m l 描述了数据的结 构,依赖r d f ( s ) 来提供数据语义;r d f 是一个元数据的模型,依赖x m l 来编码 和传输。与三元组表示不同,r d f ) ( m l 是书写r d f 的规范语法。 如图2 4 的r d f 模型所对应的r d f x m l 语法表示为: j o h ns m i t h j o h n s m i t h 分析以上语句,可以得到一些特征:所有的r d f 语句必须在一个r d f i r d f 元 素中,同一个主体的多个声明可以合并为一个r d f :d e s c r i p t i o n 元素,多个谓词转化 为该元素的多个子元素,客体则成为对应谓词元素的属性或内容,如上述黑体所 示。 r d f s 是一种词汇集描述语言,它定义了如何用r d f 来描述词汇集,并提供 9 第二章本体相关理论与技术 了一个用来描述r d f 词汇的词汇集。某特殊领域的用户可以根据r d f s 来定义自 己的s c h e m a 。r d f s 提供了一系列的核心词汇,用来描述其他r d f 资源,定义特 定应用的砌) f 词汇。常用的r d f s 核心词汇见表格2 1 【5 】o 表2 1 常用的r d f s 核心词汇 核心类 r d f s :r e s o u r c e 所有资源的集合 ( c l a s s e s ) r d f :p r o p e r t y 所有属性的集合属性也是一种资源 r d f s :c l a s s 所有类的集合 核心属性 r d f :t y p e 类或特性类型的特性 ( p r o p e r t i e s ) r d f s :s u b c l a s s o f子类关系特性 r d f s :s u b p r o p e r t y o f 子属性特性 r d f s :i s d e f i n e d b y 说明资源定义者的特性 r d f s :s e e a l s o 说明参照者特性 核心约束r d f s :c o n s t r a i n t r e s o u r c e提供一种检查r d f 模型一致性的能力 ( c o n s t r a i n t s ) r d f s :c o n s t r a i n t p r o p e r t y 用于描述限制的能力 r d f s :r a n g e 值域 r d f s :d o m a i n定义域 尽管r d f ( s ) 可以表示一些简单的本体,描述某些本体知识,包括子类和子 属性关系、属性的定义域和值域约束以及类的实例等。但用作一般的本体表示语 言,r d f ( s ) 的表达能力显得太弱,缺乏以下特征1 5 j : 1 对于局部值域属性的定义。r d f s :r a n g e 只能定义全局性的值域,而无法说 明该属性应用于某些具体类时具有特殊值域限制。 2 类、属性、个体的等价性。r d f ( s ) 无法声明两个资源是否等价。 3 不相交类的定义。r d f ( s ) 只能声明子类关系,如男人和女人都是人的子 类,但无法声明这两个类不相交。 4 类的布尔结合定义。通过布尔约束,如并、交、补实现对某些类的结合 而构建新类,如定义人类为男人和女人这两个类的并。 5 基数约束。对某属性值可能或必须的取值范围进行约束,如说明一门课 至少有一名教师。 6 关于属性特性的描述。即声明属性的某些特性,如传递性、函数性等。 因为r d f ( s ) 具有上述缺陷,所以需要比其描述能力更为丰富的本体语言。 之后影响比较深刻的两种本体语言是d a m l + o i l 和o w l 。 d a m l ( d a r p aa g e n tm a r k u pl a n g u a g e ) + o i l ( o n t o l o g yi n t e r c h a n g e l a n g u a g e 和o n t o l o g yi n f e r e n c el a y e r 的缩写) d a m l 圳是由美国国防部高级研究计划署( d a r p a a g e n t ) 开发研制的,目 1 0 第二章本体相关理论与技术 的是为语义w e b 奠定基础。当时研究人员认为新的本体语言应与r d f ( s ) 兼容,而 r d f ( s ) 不能提供充分的描述,因此而设计了d a m l 本体语言。d a m l 采用面向对 象和基于知识表示语言的设计思想,并且将这些思想与r d f ( s ) 紧密集成。但是 这导致在设计过程中出现诸多问题,主要有:缺乏予以规范,引起人类与机器处 理的不一致;和r d f ( s ) 类似,属性约束较弱。但它兼容r d f ( s ) 的想法被其后的 本体语言所采用。 o i l d 4 是由欧美一个研究小组( 包括斯坦福大学、阿姆斯特丹大学等多家机 构) 从2 0 0 0 年开始研发的,是第一个将描述逻辑、框架等人工智能领域的工具和 x m l 、r d f ( s ) 等w e b 标准结合起来的本体语言。o i l 语言的结构基于框架,并使 用了复合类概念。o i l 具有x m l ;f i r d f ( s ) 的语法,但本身没有采用r d f ( s ) 的语 义。 通过将d a m l 和o i l 结合起来,形成了d a m l + o i l 3 5 】。d a m l + o i l 通过描 述逻辑方式的模型理论给出形式语义。在d a m l + o i l 中保留了源于o i l 语言的描 述逻辑成分,但摒弃了框架结构,以便于和r d f ( s ) 紧密集成。d a m l + o i l 只采 用和其自身语法和模型理论一致的部分r d f ( s ) i 吾义。o w l 就是以其为主要基础 设计的。 o w l ( w e bo n t o l o g yl a n g u a g e ) 2 0 0 1 年,为了提供一种面向各种应用的语言,w 3 c 工作小组开发了o w l 语 言。o w l 结合描述逻辑( d e s c r i p t i o nl o g i c s ,d l ) 对d a m l + o i l 进行了修订。 描述逻辑是一族知识表示语言,它以结构化的和以理解的形式来表示领域知 识。描述逻辑能很好的满足本体语言在语义、表达能力以及复杂性上的要求。它 具有正式的基于逻辑的语义和很强的表达能力,是一阶谓词逻辑的可判定子集。 b a a d e r 等人指出描述逻辑可以为语义网提供必要的逻辑基础【3 6 】:一方面描述逻辑 的算法和技术发展会提升语义网的推理和查询的服务质量,另一方面,描述逻辑 语言族的扩充能够提高语义网的表达能力。 描述逻辑a l c ( a t t r i b u t el a n g u a g ec o m p l e m e n t ) 【5 】是最小的命题封闭的描述 逻辑。令川c 和川r 是可数的不相交的原子概念集和原子关系集。它的概念递归定 义如下: 幻任意原子概念a 引c 是a l c 的概念; b ) 令c 和d 是a l c 概念,r 是a l c 的原子关系,即r r ,则表达式1 c ( 补) ,c u d ( 并) ,c n d ( 交) ,r c ( 存在约束) ,v r c ( 全称 约束) 是a l c 概念。 通过对a l c 语言扩充,增加关系构造子或数量约束等,可以扩展其描述能力。 可以认为a l c 是描述逻辑的最小子集。 第二章本体相关理论与技术 2 0 0 3 年,w 3 c 发布o w l 语言为本体的标准语言。o w l 包含三种子语言p ”: o w ll i t e 、o w ld l 和o w lf u l l ,这三种语言表达能力是递增的。其中,o w lf u l l 支持最强的表达能力和完全自由的r d f 语法,但不保证可计算性和可推理性。 o w ll i t e 是o w l 语言的一个最小可用子集,具有最低的复杂度和良好的可计算 性,但其表达能力受到较严格的限制,只能提供最基本的层次分类和进行简单约 束表达。o w l d l 包括了所有的o w l 语言结构,在保证计算完整性和可判定性前 提下,具有最大表达能力。 在表达能力和推理能力上,每一种子语言都是前者的扩展。这三者之间有以 下关系垆j ,但这些关系反过来并不成立: 1 合法的o w ll i t e 本体都是合法的o w ld l 本体。 2 合法的o w ld l 本体都是合法的o w lf u l l 本体。 3 有效的o w ll i t e 结论都是有效的o w ld l 结论。 4 有效的o w ld l 结论都是有效的o w lf u l l 结论。 使用o w l 的本体开发这要考虑用哪个子语言最符合他的需求1 5 j :选择o w l l i t e 还是o w ld l 主要取决于用户在多大程度上需要o w ld l 提供的表达能力更 强的成分。选择o w l d l 还是o w lf u l l 主要取决于用户在多大程度上需要r d f ( s ) 的特殊建模机制。 o w ll i t e 的构造子如表格2 2 所示i ”j 。 表2 2o w ll i t e 的构造子 r d fs c h e m a 特征: ( i n ) e q u a l i t y : 属性特征: c l a s s ( t h i n g , e q u i v a l e n t c l a s s o b j e c t p r o p e r t y n o t h i n g ) e q u i v a l e n t p r o p e r t yd a t a t y p e p r o p e r t y r d f s :s u b c l a s s o f s a m e a s i n v e r s e o f r d f :p r o p e r t y d

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论