




已阅读5页,还剩81页未读, 继续免费阅读
硕士学位论文-本体映射及其在跨智能空间中的应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙江大学计算机科学与技术学院 硕士学位论文 本体映射及其在跨智能空间中的应用研究 姓名:李志明 申请学位级别:硕士 专业:计算机科学与技术 指导教师:李善平 20090501 浙江人学硕上学位论文摘要 摘要 本体在语义网中起着核心的作用,是语义网中语义的载体。但在很多情况下, 不同领域,对许多相同概念会定义出不同的本体,甚至同一领域,不同机构对同 一领域定义出的本体也往往各不相同。这就要求有一个高质量的自动映射方法来 建立本体之间的对应关系,进而实现用不同本体标注的数据之间的互相转换。 在类如跨智能空间的应用中,不单要求本体映射的质量要高,同时要求映射 算法有很高的效率。跨智能空间是普适计算实施的一个必经阶段。随着普适计算 技术的深入挖掘与推广,智能空间的研究与应用也将从原来的单智能空间阶段逐 步扩展到跨智能空间阶段,即无论用户处在哪个智能空间中,都可以充分享受到 计算带来的服务。在跨智能空间研究阶段,上下文共享又面临着多项理论与技术 上的困难,这是因为对于上下文共享,异构智能空间之间客观存在着语义边界、 质量边界和访问边界,其中语义边界指:每个智能空间都需要使用一套语义描述 本体,为空间内上下文的共享提供基础。不同的语义描述本体体现了开发者对上 下文的认识,而各个智能空间采取何种语义描述本体很难达成统一。因此上下文 本体映射是解决上下文本体术语失配的重要手段,也是跨越异构智能空间语义边 界的一个重要手段。 在跨智能空间的应用中,用户将动态的在各智能空间中切换。由于用户将进 入的智能空间无法事先预知,故无法在系统设计阶段完成智能空间的上下文本体 与用户的上下文本体间的映射,而只能在系统运行时进行映射。在这种即时映射 的需求下,若映射消耗的时间过长,会导致服务响应过期,上下文信息失效,严 重影响用户体验。因此,上下文本体映射的效率对于用户成功地进行跨智能空间 活动是一个至关重要的问题。 本文正是基于以上背景,开展对本体映射的研究工作,具体研究内容包括映 射质量方面的一点和映射效率方面的两点: ( 1 ) 基于概率的映射方法具有坚实的理论基础,但有时难以找到大量的本 浙江大学硕士学位论文摘要 体实例来计算概率。本文提出了一种基于概率描述逻辑p c l a s s i c 的映射方法 p d l o m ( p r o b a b i l i s t i cd e s c r i p t i o nl o g i cb a s e do n t o l o g ym a t c h e r ) ,它利用搜索引擎 的统计数据构建出实例在原始概率( p r i m i t i v ec o n c e p t s ) 上的分布贝叶斯网络, 然后对概念描述的展开形式( c a n o n i c a lf o r m ) 使用贝叶斯网络计算其概率。此研 究点在第三章中重点阐述。 ( 2 ) 本体映射效率的一个关键因素是候选匹配节点对的个数。针对跨智能 空间应用对映射效率的需求,本文提出了本体分割和本体块映射的方法来削减候 选匹配节点对,提升本体映射的运行效率。此研究点在第四章中重点阐述。 ( 3 ) 针对跨智能空间应用的服务特点,提出了按需映射方法来进一步削减 候选匹配节点对的数目,将一次服务所需的映射时间降至毫秒级,达到服务实时 响应的需求。此部分内容在第五章中重点阐述。 关键词:描述逻辑,本体映射,贝叶斯网络,跨智能空间,上下文,聚类,按 需映射 浙江人学硕士学位论文 a b s t r a c t a b s t r a c t o n t o l o g yi s t h ec o r eo fs e m a n t i cw e bb e c a u s et h e ya r et h ec a r r i e r so ft h e m e a n i n gc o n t a i n e di nt h es e m a n t i cw e b h o w e v e ri nm a n yc a s e s ,d i f f e r e n td o m a i n s d e f i n ed i f f e r e n to n t o l o g i e sc o n t a i n i n gt h es a m ec o n c e p t s e v e ni nt h es a m ed o m a i n , d i f f e r e n to r g a n i z a t i o n sc o n s t r u c td i f f e r e n to n t o l o g i e s t h e r e f o r e ,i ti sn e c e s s a r yt of i n d ah i g h q u a l i t ym a p p i n ga p p r o a c ht oe s t a b l i s hs e m a n t i cc o r r e s p o n d e n c e sb e t w e e n o n t o l o g i e sa n di m p l e m e n t t h ee x c h a n g eo fd a t aa n n o t a t e db yd i f f e r e n to n t o l o g i e s i ns o m ea p p l i c a t i o n ss u c ha si n t e r - s m a r t s p a c ec o n t e x ts h a r i n g ,n o to n l yt h e q u a l i t yo ft h em a p p i n ga p p r o a c hi sn e c e s s a r y , b u tt h ee f f i c i e n c yo ft h em a p p i n g a p p r o a c hi sa l s oi n d i s p e n s a b l e i n t e r - s m a r t - s p a c ei sak e ys t a g et oa c h i e v et h eg o a lo f p e r v a s i v ec o m p u t i n g p e r v a s i v ec o m p u t i n ge n a b l e sa c c e s st oi n f o r m a t i o na n y w h e r e , a n y t i m e ,a n dm a k e st h ec o m p u t i n gd i s a p p e a r as m a r ts p a c ei s al o c a lp e r v a s i v e c o m p u t i n ge n v i r o n m e n t ,i nw h i c hc o n t e x t - a w a r ec o m p u t i n gp l a y sa ni m p o r t a n tr o l ei n b r i n g i n gi n t e l l i g e n ti n t e r a c t i o nt ou s e r s w i t ht h ed e v e l o p m e n ta n ds p r e a do fp e r v a s i v e c o m p u t i n gt e c h n o l o g y , r e s e a r c ha n da p p l i c a t i o no fs m a r ts p a c eh a se x t e n d e df r o m i n d i v i d u a l - s m a r t s p a c es t a g et oi n t e r - s m a r t s p a c es t a g e t h i sm e a n sp e o p l ec a ne n j o y c o m p u t i n gs e r v i c e si na n ys m a r ts p a c e s h o w e v e r , i nt h i ss t a g e ,c o n t e x ts h a r i n gf a c e s s e v e r a lt h e o r e t i ca n dt e c h n i c a ld i f f i c u l t i e s ,s u c ha sm a p p i n go fc o n t e x to n t o l o g i e s b e t w e e ns m a r ts p a c e s i ni n t e r - s m a r t - s p a c ec o n t e x ts h a r i n gs c e n a r i o s ,u s e r sl e a v ea n de n t e rs m a r ts p a c e s f r e q u e n e n t l y s i n c ew h i c hs m a r ts p a c et h eu s e rw i l le n t e ri su n p r e d i c t a b l e ,t h em a p p i n g c a no n l yh a p p e na f t e rt h eu s e re n t e rt h es m a r ts p a c ei n s t e a do fi nt h es y s t e md e s i g n t i m e u n d e rt h er e q u i r e m e n to fr e a l - t i m eo n t o l o g ym a p p i n g ,al o n gt i m em a p p i n g p r o c e s sw i l ld e l a yt h er e s p o n s eo ft h es e r v i c ea n de x a c e r b a t et h ee x p e r i e n c eo f t h eu s e r s ot h ee f f i c i e n c yo ft h em a p p i n ga p p r o a c hi se s s e n t i a lt o t h ea p p l i c a t i o n s o f i n t e r - s m a r t - s p a c ec o n t e x ts h a r i n g b a s e do nt h ea b o v eb a c k g r o u n d ,t h ea u t h o r sr e s e a r c h e sf o c u so nt h ep r e c i s e n e s s a n de f f i c i e n c yo fa u t o m a t i co n t o l o g ym a p p i n gm e t h o d s ,w h i c hi n c l u d e : 浙江大学硕士学位论文 a b s t r a c t ( 1 ) i nt h i sp a p e rw ep r e s e n tt h ep r o b a b i l i s t i cd e s c r i p t i o nl o g i cb a s e do n t o l o g y m a t c h e r ( p d l o m ) f o rd i s c o v e r i n gs u c hm a p p i n g su s i n gt h ei n f e r e n c es e r v i c e p r o v i d e db yp r o b a b i l i s t i cd e s c r i p t i o nl o g i c ( p - c l a s s i c ) ,w h i c ha l l o w sf o r c o m p u t i n gt h ep r o b a b i l i t yo fac o n c e p td e s c r i p t i o n w ep r o p o s et oe x p l o i tas e a r c h e n g i n et oc o n s t r u c tt h eb a y e s i a nn e t w o r kr e q u i r e db yp r o b a b i l i s t i cd e s c r i p t i o nl o g i c ( 2 ) t h en u m b e ro fc a n d i d a t em a p p i n ge n t i t yp a i r si sc r i t i c a lt ot h ee f f i c i e n c yo f t h em a p p i n ga p p r o a c h s ow ep r o p o s eo n t o l o g yp a r t i t i o ns t r a t e g ya n db l o c km a p p i n g t or e d u c et h en u m b e ro fc a n d i d a t em a p p i n ge n t i t yp a i r sa n dp r o m o t et h ee f f i c i e n c yo f m a p p i n g ( 3 ) i ni n t e r 。s m a r t - s p a c ea p p l i c a t i o ns c e n a r i o s ,t h eo n t o l o g ym a p p i n gm u s tb e c o m p l e t e di nr e a l t i m e s ow ep r o p o s eo nd e m a n dm a p p i n gt op r o m o t et h ee f f i c i e n c y o fm a p p i n ga n dg u a r a n t e et h er e a l - t i m er e s p o n s i v e n e s so ft h es e r v i c e k e y w o r d s :d e s e r i p t i o nl o g i c s ,o n t o l o g ym a p p i n g ,b a y e s i a nn e t w o r k ,i n t e r - s m a r t s p a c e s ,c o n t e x t ,c l u s t e r , o nd e m a n dm a p p i n g 浙江大学硕十学位论文图目录 图目录 图1 1s e m a n t i cw e b 的体系结构2 图2 1 本体映射过程定义15 图2 2 本体失配情况分类l7 图2 3 本体映射方法分类17 图2 4 跨智能空间应用2 5 图2 5 映射过程图2 6 图3 1 映射基数示例2 9 图3 2 术语在w o r d n e t 中的存储示例3 2 图3 3p c l a s s i c 概率推导算法3 5 图3 4 示例的贝叶斯网络。4 0 图3 5f 质量随阈值的上升而下降4 2 图3 6f 质量的比较4 4 图3 7 平均结果的比较4 4 图4 1 本体分割减小候选匹配对4 7 图4 2 本体块映射数目随c l u s t e r s i m t h r e s h o l d 值变化5 7 图4 3 候选匹配对数目随c l u s t e r s i m t h r e s h o l d 值变化5 7 图4 4 本体块映射查全率随c l u s t e r s i m t h r e s h o l d 值变化5 8 图4 5 块映射查全率的比较5 8 图4 6 映射结果的比较5 9 图4 7 运行时间的比较6 0 图5 1 进入智能空间一6 2 图5 2 一次服务所需的本体映射6 3 图5 3 按需映射过程一6 4 图5 4 映射时间随服务次数的变化6 6 表2 1o w l 类构造符与描述逻辑语法的对应1 4 表2 2o w l 公理构造符与描述逻辑语法的对应1 4 表3 1 两个本体示例3 3 表3 2 实验数据4 l 表3 3p d l o m 的最优参数值4 3 表4 1 实验本体数据一5 6 表4 2 本体分割结果5 6 表4 3 各步骤耗时一6 0 浙江大学硕士学位论文第1 章绪论 第1 章绪论 随着互联网上来自各种信息源的信息量成指数级的急剧增长,信息的整合己 成为一个急待解决的问题。各种分布式信息集成的方案被提出来应对这一严峻的 形式,其中s e m a n t i cw e b 技术受到了最显著的关注。 在整合信息的同时,人们希望能随时随地采用一种更为智能的方式访问这些 信息,即信息自动来到人的身边,而不需要人去主动的查找这些信息,这正是普 适计算为我们描绘的远景。 g a r t n e r 的报告,将s e m a n t i cw e b 和普适计算两项技术都列于2 0 0 8 2 0 1 2 间十 大最具影响力的技术榜。 1 1s e m a n t i cw e b 下的本体映射 让计算机能够理解网络上的信息并参与信息交流,为用户提供更智能的帮 助,这就是网络创始人t i mb e r n e r s l e e 于1 9 9 8 年提出的s e m a n t i cw e b 的构想。 其思想就是利用元数据( m e t a d a t a ) 语言对w e b 信息资源的内容进行语义上的描述, 通过向数据添加机器可理解的语义和启发式信息,从而使计算机能够利用这些语 义信息对信息资源的内容进行理解和处理,并在此基础上,实现更高层的、基于 知识的智能应用,同时在一定程度上实现机器对信息的自动处理。 s e m a n t i cw e b 的基本体系结构如图1 1 所示,共包括七层,其中第四层 o n t o l o g ys u p p o r t 是在r d f ( s ) 基础上定义的概念及其关系的抽象描述,用于描述 应用领域的知识,描述各类资源及资源之间的关系,实现对词汇表的扩展。在这 一层,用户不仅可以定义概念而且可以定义概念之间丰富的关系。作为语义网中 最为核心的一层,本体层在r d f 和r d f s 进行基本的类属性描述的基础之上, 更进一步地描述了本体以及它们之间的关系。本体层提供了一套对特定领域知识 的共同认识,帮助人们在语法和语义上与机器实现准确的交流;它是对某领域的 浙江大学碗学位论文 第1 章绪论 形式化与结构化的描述,是机器、程序间知识交流的语义基础。 图11s e m a n t i c w e b 的体系结构 为实现语义信息共享,各个领域纷纷定义了相应的本体标准。由于w e b 环境 的分椎性和开放性,各个领域甚至同一领域的不同组织定义了各自的本体来描述 数据,导致在同一个领域内存在多个本体。这些本体的概念分类可能不同,概念 间的关系也可能不同,并且相同的概念可能用不同的术语来表示。另外,本体的 构造是一个非常费时费力的过程,一个用户为满足自己的不同需要而建立多个不 同的本体是不现实的。在许多场台,单个本体不能充分完成目标任务,必须联合 多个本体来完成。本体间存在着异构:两个本体中相同“意义”的元素( 元素表示 本体中的概念、关系、属性以及实例) 可能使用不同的名称:相同名称也可能被 用来表示不同“意义”的元素;另外相同领域的本体可能定义有不同的分类结构; 不同本体库中的相同实例可能使用不同的表示。 异构的本体之间不能进行互操作,这是本体共享的主要障碍。因此需要进行 本体之间的集成,实现本体之间的重用,并检测本体之间的冲突。要实现本体之 间的集成首先要建立本体之间的联系,对本体进行映射。本体映射是解决不同本 体间知识共享和重用问题的方法,它的目的是找出不同本体中实体之间的语义关 浙江大学硕士学位论文第1 章绪论 联,并且将其形式化地表达出来。e r a h m 给出了映射的定义【6 9 】:映射是一些映 射元素的集合,每一个映射元素指出本体s l 中的某些元素映射到本体s 2 的某些 元素。而且,每一个映射元素都有一个映射表达式明确s l 和s 2 中元素的关系。 目前,已有许多关于本体映射的研究,但仍然存在一些问题:相似度的计算 方法不完善,因为本体包含多种类型的信息,有些信息并未很好的被利用,如基 于实例的映射方法还在不断的发展中。因此,本体映射还需要更好的理论模型以 充分利用本体的信息进行映射发现。另一个问题是,在某些应用场景下,映射需 要实时的进行,这对映射的运行效率提供了很高的要求。 1 2 跨智能空间应用对本体映射效率的需求 普适计算的目标是在整个世界中实现计算无处不在。然而这一目标的实现是 一个漫长的过程,需要循序渐进,逐步扩展,智能空间是其比较典型的应用缩影。 所谓智能空间( s m a r ts p a c e ) 是指嵌入了计算、信息设备和多模态传感装置的工 作空间,它使用户能方便地访问工作空间中的信息,获得计算服务,从而高效地 进行独立工作或协同工作。 普适计算最大的特点之一是计算的不可见性( i n v i s i b i l i t y ) ,即用户与周围环 境中的计算设备交互时,不会有意识地弄清楚服务来自何处,怎么获得,就像我 们每天重复着开灯、关灯动作,却不会有意识地去弄清楚电来自哪个发电厂,经 过哪个变电所,再由什么样的电线输送到房间里的。为了实现这种不可见性,计 算设备和服务必须能感知用户周围的上下文( c o n t e x t ) 。普适环境中的上下文 ( c o n t e x t ) ,是指描述存在于普适计算环境中的实体的任何信息;这里的实体可 以是人,或者是与用户和应用程序交互相关的物体【1 8 】。上下文感知( c o n t e x t a w a r e n e s s ) 技术使得普适计算中的应用程序能够动态地感知程序周围的环境,调 整其策略,减少用户繁琐的输入以避免分散用户的注意力,从而体现普适计算的 智能化【6 。 文献1 4 8 】指出:普适计算系统不可能是一个全球统一的系统,而是由许多因为 管理区划、地域区划和文化区划而互相分离的,有明确边界的智能空间所组成。 浙江人学硕士学位论文第1 章绪论 现实生活中,人不会局限在单个智能空间之中生活,而是漫游于多个异构的智能 空间。 但是在分散的智能空间之间共享上下文并不简单,这是因为对于上下文共 享,异构智能空间之间客观存在着语义边界、质量边界和访问边界【5 2 】,其中语义 边界指:每个智能空间都需要使用一套上下文本体,为空间内上下文的共享提供 基础。不同的上下文本体表现了开发者对上下文的认识,而各个智能空间采取何 种上下文本体很难达成统一。因此上下文本体映射是解决上下文本体术语失配的 重要手段,也是跨越异构智能空间语义边界的一个重要手段。 目前本体映射研究的主要目标是追求达到最高的正确率和召回率,专门探讨 映射的运行效率的并不多。这和当前提出映射需求的主要应用场景有关,比如, 在典型的数据库集成中,我们需要映射工具来帮助建立起数据库s c h e m a 间的对 应关系,这些映射应该在系统部署前就应该完成,系统运行时利用映射的结果做 数据或查询的转换,也就是说,映射只是发生在系统的设计阶段,而不是实际运 行时,故映射的效率对系统的运行并没有影响。 然而,在跨智能空间的应用中,用户将动态的在各智能空间中切换,由于用 户将进入的智能空间无法事先预知,故无法在系统设计阶段完成智能空间的上下 文本体与用户的上下文本体间的映射,而只能在系统运行时进行映射。在这种即 时映射的需求下,若映射消耗的时间过长,会导致服务响应过期,上下文信息失 效,严重影响用户体验。因此,上下文本体映射的效率对于用户成功地进行跨智 能空间活动是一个至关重要的问题。针对这类需求,我们必须研究提高映射效率 的方法。 1 3 主要工作与本文结构 本论文研究工作,以及论文讨论的重点将围绕如下四个主要方面。 综述s e m a n t i cw e b 和跨智能空间中本体映射相关研究现状。该综述分为三个 方面:本体的相关研究;本体映射的研究现状;跨智能空间中本体映射需求与本 体映射效率的研究现状。在本文的第二章详细介绍综述的内容。 4 浙江大学硕上学位论文第l 章绪论 本体映射质量方面的研究。基于概率的映射方法具有坚实的理论基础,但有 时难以找到大量的本体实例来计算概率。本文提出了一种基于概率描述逻辑 p c l a s s i c 的映射方法p d l o m ( p r o b a b i l i s t i cd e s c r i p t i o nl o g i cb a s e do m o l o g y m a t c h e r ) ,它利用搜索引擎的统计数据构建出实例在原始概率( p r i m i t i v ec o n c e p t s ) 上的分布贝叶斯网络,然后对概念描述的展开形式( c a n o n i c a lf o r m ) 使用贝 叶斯网络计算其概率。此研究点在第三章中重点阐述。 本体映射效率方面的研究。本体映射效率的一个关键因素是候选匹配节点对 的个数。针对跨智能空间应用对映射效率的需求,本文提出了本体分割和本体块 映射的方法来削减候选匹配节点对,提升本体映射的运行效率。此研究点在第四 章中重点阐述。 跨智能空间中实时映射的研究。针对跨智能空间应用的服务特点,提出了按 需映射方法来进一步削减候选匹配节点对的数目,将一次服务所需的映射时间降 至毫秒级,达到服务实时响应的需求。此部分内容在第五章中重点阐述。 5 浙江人学硕士学位论文第2 章奉体映射的相关研究 第2 章本体映射的相关研究 2 1 本体 2 1 1 本体的定义 本体最早是一个哲学的范畴,是客观存在的一个系统的解释和说明,是一个 抽象本质的描述。本体论( o n t o l o g y ) 这个词早在1 7 世纪就已诞生,其派生于希 腊语的“o n t o ”( “存在”) 和“l o g i a ( “箴言录”) ,是一个哲学术语。哲学上的本体 论是对世界任何领域内的真实存在所做出的客观描述,而且这种描述不一定完全 建立在已有的知识基础上,还包括“求真”的过程。实际上,人类对“存在”问题的 探讨由来已久,也和哲学的起源分不开。哲学家亚里士多德早在公元前四世纪所 确立的重要哲学分支 m e t a p h y s i c s ”就是“关于存在的科学”,在很长时间里,本体 论也一直被看作是m e t a p h y s i c s 的同义词。后来,伴随近代科技革命的出现, m e t a p h y s i c s 逐渐包纳更多的研究领域( 如意识、事实、价值等) ,而本体论继续 承担哲学中对世界“存在”的研究,成为现代哲学体系的根基。 1 9 9 3 年g r u b e r 给出了本体的一个最为流行的定义【3 0 1 ,即“本体是概念模型的 明确的规范说明”。后来,g u a r i n o 在此基础上,给出了本体的另外一种定义【3 1 】:“本 体是共享概念模型的形式化规范说明”。s t u d e r 等对上述两个定义进行了深入的研 究,认为本体是共享概念模型的明确的形式化规范说明。 现在,第三种定义,即由s t u d e r 提出的本体概念得到了比较广泛的应用,这 包含4 层含义【8 2 】: 概念化( c o n c e p t u a l i z a t i o n ) :通过抽象出客观世界中一些现象的相关概念而 得到的模型。概念模型所表现的含义独立于具体的环境状态。 明确( e x p l i c i t ) 所使用的概念及使用这些概念的约束都有明确的定义。 形式化( f o r m a l ) :本体是计算机可读的( 即能被计算机处理) 。 共享( s h a r e ) :本体中体现的是共同认可的知识,反映的是相关领域中公认的 概念集,即本体针对的是团体而非个体的共识。 本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领 6 浙江大学硕上学位论文第2 章本体映射的相关研究 域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇( 术语) 和词汇 间相互关系的明确定义。 2 1 2 本体描述语言 本体语言用来为领域模型编写清晰的、形式化的概念描述,目前经常被使用 的本体描述语言大都以框架模型或谓词演算或两者相结合为基础。 本体描述语言起源于历史上人工智能领域对知识表示的研究,主要有以下语 言或环境为代表:k i f ( k n o w l e d g ei n t e r c h a n g ef o r m a t ) 2 7 1 ,o n t o l i n g u a 2 9 1 ,o k b c ( o p e nk n o w l e d g eb a s ec o n n e c t i v i t y ) 1 2 1 ,o c m l ( o p e r a t i o n a lc o n c e p t u a lm o d e l i n g l a n g u a g e ) 【6 2 】,f r a m el o g i c l 2 3 】,l o o m 【5 6 1 。 近年来,w e b 技术为全球信息共享提供了便捷手段,以共享为特征的本体论 与网络技术结合是必然趋势。在此背景下,基于w e b 标准的本体描述语言成为本 体论研究和应用的热点。w e b 本体语言的初步发展与w e b 语言标准本身的发展是 分不开的。从h t m l 格式到x m l 格式,从不同组织机构提出的各种语言到w 3 c 的r d f ( s ) 标准规范,w e b 本体语言经历了以下几个主要语言: s h o e 。s h o e ( s i m p l eh t m lo n t o l o g ye x t e n s i o n ) 3 6 】是一种以h t m l 为基 础的知识及本体表示语言,由美国马里兰大学开发。s h o e 对h t m l 进行了扩展, 使其能够对本体进行描述。s h o e 能够表示概念、概念的分类、n 元关系、常量 以及推理规则等。 o m l 。o m l ( o n t o l o g ym a r k u pl a n g u a g e ) 7 1 】是美国华盛顿卅i 立大学在s h o e ( l 语法) 基础上开发的一种本体描述语言。o m l 以概念图为基础,采用一 阶逻辑对概念、分类、关系以及公理进行表达。 x o l 。x o l ( x m l b a s e do n t o l o g y e x c h a n g el a n g u a g e ) 【4 j 7 】是美国s r l 人工 智能中心于1 9 9 9 年开发的一个x m l 化的本体交换语言,最初用于生物信息学 ( b i o i n f o r m a t i c s ) 领域的知识交换。x o l 是在o n t o l i n g u a 和o m l 基础上,结合 o k b c l i t e 较高的表示能力而开发的。x o l 能对概念、分类以及二元关系进行描 述,但不具备推理机制。 7 浙江大学硕上学位论文第2 章本体映射的相关研究 r d f 。r d f ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ) 5 0 】是w 3 c 于19 9 7 年开始制 定的一个建立在x m l 基础上对w e b 信息进行语义描述的语言规范,目前已成为 w 3 c 建议标准。r d f 的数据模型源于语义网,采用三种对象来描述事物,即资 源( r e s o u r c e s ) 、属性( p r o p e r t i e s ) 以及声明( s t a t e m e n t s ) 。资源可以是指任何 所描述的事物,通常采用u r i 以及i d 来指明。属性是所描述资源的特征、品质 以及关系等。而声明就是由前面所描述的资源、资源的属性以及属性的取值所组 成的集合。一个声明可看作是由三个独立部分组成:主语( s u b j e c t ) 、谓语 ( p r e d i c a t e ) 以及宾语( o b j e c t ) ,其中宾语可以是另一个资源也可以是文字说明 ( 1 i t e r a l ) 。 r d fs c h e m a 。r d f 提出了描述知识的一个基本模型,但并没有进一步描述 属性以及资源之间关系的语义机制。r d fs c h e m a 1 0 1 是w 3 c 对r d f 的进一步扩 展和规范,采用了类似框架的方式,通过添加r d f s :c l a s s 、r d f s :s u b c l a s s o f 、 r d f s :s u b p r o p e r t y o f , r d f s :d o m a i n 、r d f s :r a n g e 等原语,对类、父子类、父子属性、 以及属性的定义域和值域等进行定义和表达。这样,r d f ( s ) 就成为一个能对本体 的语义进行初步描述的标准语言。另外应当注意的是,r d fs c h e m a 是对r d f 模 型在语义上的说明和规范,并不对r d f 描述的语法外观进行约束( 这与x m l s c h e m a 和x m l 文档之间的关系是不同的) 。 o i l 。o i l ( o n t o l o g yi n f e r e n c el a y e r ) 1 2 4 】是欧洲o n t o k n o w l e d g e 项目于1 9 9 9 年开始创建的一种w e b 本体语言,它以x m l 为语法,以描述逻辑为理论和推理 基础,用丰富的语义对w 3 c 的r d f ( s ) 做了扩展。根据表示和推理能力的不同, o i l 由内到外又分为c o r eo i l 、s t a n d a r do i l 、i n s t a n c eo i l 、h e a v yo i l 等四个 子语言。 d a m l + o i l 。d a m l ( d a r p aa g e n tm a r k u pl a n g u a g e ) 【3 9 】是美国d a r p a 于 2 0 0 0 年8 月开始的为a g e n t 之间提供基于语义上的互操作能力而开发的一种语 言,它也以x m l 为语法,以描述逻辑为理论基础,并建立在已有标准r d f ( s ) 之上。2 0 0 0 年1 2 月,美国d a m l 和欧洲o i l 两个组织成立联合委员会将d a m l 和o i l 合并成一种语言,命名为d a m l + o i l ,并提交给w 3 c 讨论。 8 浙江大学硕士学位论文 第2 章本体映射的相关研究 o w l 。2 0 0 2 年7 月,w 3 c 在提交的d a m + o i l 基础上发展了o w l ( o n t o l o g y w 曲l a n g u a g e ) 1 3 3 1 语言,以使其成为国际通用的标准本体描述语言。o w l 也建 立在i ,瓜d f 等已有标准基础上,通过添加大量的语义原语来描述和构建各种 本体。截止到2 0 0 3 年4 月,o w l 语言现在已是w 3 c 的标准。o w l 根据表示和 推理能力分为三类:o w lf u l l 与r d f 保持最大程度的兼容,具有最大的表示能 力,但不能保证计算性能;o w ld l 是以描述逻辑【4 】为基础,在不失掉计算完全 性和可判定性条件下,支持最大的表示能力;o w l l i t e 则局限于对概念( 类) 的 层次分类和简单的约束等进行描述。 由于w e b 技术为全球信息共享提供了便捷手段,以共享为特征的本体论与网 络技术结合是必然趋势。在此背景下,基于w e b 标准的o w l 本体描述语言成为 本体论研究和应用的热点。 2 1 3 描述逻辑 描述逻辑( d e s c r i p t i o nl o g i c ,d l ) 是o w ld l 的形式化基础,它吸收了 k l o n e r l 的主要思想,其主要框架是一阶谓词逻辑的一个可判定子集。它是近 二十多年来人工智能领域研究和开发的一类相当重要的知识表示范式,目前作为 其它本体描述语言的基础正被积极应用于本体描述【3 0 】。描述逻辑利用概念 ( c o n c e p t ) 矛 1 色( r o l e ) 构造符,通过原子概念( 一元谓词) 和原子角色( 二元 谓词) 表达出新的概念和角色。描述逻辑具有以下主要特点: 定义良好的语义和表示能力。d l 采用了规范的基于模型理论的逻辑语义,这 与语义网络和框架系统等知识表示机制是不同的。 对概念和实例间类属关系的推理支持。描述逻辑的核心推理问题概念和 实例的分类是知识库系统组织知识的关键问题,同时概念的分类的层次结构 提供了概念间关系的重要信息,能够有效的加速他推理问题的解决。同时我 们也应该看出这种推理能力同样是人类用来构建和理解世界知识的手段。 可知可控的计算复杂性和可判定性。描述逻辑的描述能力是由其构造符决定 的,对不同构造符的支持决定了描述逻辑语言族描述能力的层次性。推理的 9 浙江人学硕士学位论文第2 章本体映射的相关研究 可判定性问题和复杂度问题与描述逻辑的描述能力是一对矛盾,不同层次的 描述逻辑语言具有不同的推理特性,描述逻辑的研究侧重于分析语言构件对 推理的影响,并对可判定性问题和复杂度问题,针对不同层次的描述逻辑都 有确切的结论。因此这些研究结果可以为描述逻辑的扩展和应用提供了理论 上的保证。 简单的描述逻辑尽管归结到谓词逻辑,但其于谓词逻辑的不同之处在于谓词 逻辑的研究侧重于计算理论上的原则性问题的研究,对知识表达和推理的实 际的层次性缺乏支持;而描述逻辑注重实际的应用,不同层次的描述逻辑具 有确定的表达和推理能力,它通过扩展语言构件以支持复杂领域的建模,可 以称为一种面向实际应用的逻辑表达范式。 作为一种知识推理与表达的范式,描述逻辑的推理研究侧重可判定部分。理 论上知识推理的许多问题都是n p 难题,但是在实际应用中明确的推理算法加可 判定性问题的优化解决可以大大增强描述逻辑的实用性,如t a b l e a u x 算法【4 】。这 点在众多的系统实现中可以得到证实。如高度优化的推理器f a c t 3 8 】、r a c e r 3 5 】 等。这些推理工具可以广泛的应用于产品的分类,构件重用,可配置的定制生产 管理中。 描述逻辑在众多的领域内得到了应用,随着w e b 和w e b 技术的不断发展, 各种以描述逻辑来进行语义定义的标注语言的出现【l l 】,使得描述逻辑得到了更多 的重视。目前w 3 c 推出的本体描述语言o w ld l 就是以描述逻辑为逻辑基础的。 2 131 描述逻辑的语法与语义解释 基本描述逻辑a l c n ,只包含以下语言表达构件:概念的布尔操作,交n 、 并u 、非1 ;全称量词v 、存在量词j ,存在量词的数目约束即简单角色担当者 数目约束。在这个的基础上添加不同的构造算子,则构成了不同表达能力的描述 逻辑。正是从之一点上,描述逻辑具有模块化的表达能力。为了方便起见,本文 用彳,b 来代表原子概念,r 代表原子关系,c ,d 表示一般概念描述。基本描 述逻辑的语法为: c ,d 专彳i 丁l 上i1 彳lc n di3 r cfc u di n r | 3 h a s f r i e n d e n g i n e e r 表2 2o w l 公理构造符与描述逻辑语法的对应 o w l 公理构造符d l ( 描述逻辑) 语法示例 s u b c l a s s o f c 1 c 2o w l d l o w l e c l u i v a l e n t c l a s sc 1 = c 2p a r e n t = ( f a t h e rum o t h e r ) d i s j o i n t w i t h c 1 垦一c 2 c a t - - d o g s a m e l n d i v i d u a l a s x ,) 三 勋 z h e ji a n gu n i v
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 义乌市道路施工方案
- 室内施工回填施工方案
- 按月还款抵押合同书6篇
- 哈尔滨市中石化2025秋招笔试模拟题含答案数智化与信息工程岗
- 国家能源黔南自治州2025秋招笔试数学运算题专练及答案
- 中国联通文山自治州2025秋招网络优化与维护类专业追问清单及参考回答
- 合肥市中石油2025秋招笔试模拟题含答案新材料与新能源岗
- 大唐电力锦州市2025秋招笔试英语能力题专练及答案
- 景德镇市中石油2025秋招面试半结构化模拟题及答案油品分析质检岗
- 长沙市中石化2025秋招笔试模拟题含答案油气储运与管道岗
- 医院安全生产检查表范本
- 神经内科质控汇报
- 安徽省2024年普通高中学业水平合格性考试地理试卷(含答案)
- 2025年吉林省时事政治考试试卷带解析及参考答案(考试直接用)
- DLT5210.1-2021电力建设施工质量验收规程第1部分-土建工程
- 新解读《CB-T 73-1999船用钢质直梯》新解读
- 幼小衔接幼师管理制度
- 《医疗质量安全核心制度落实情况监测指标(2025年版)》全面解读
- 热敏灸应用的个案护理
- T/CCAS 007-2019水泥产能核定标准
- 生鸡肉买卖合同协议书
评论
0/150
提交评论