(管理科学与工程专业论文)基于本体的交通导航数据语义查询研究.pdf_第1页
(管理科学与工程专业论文)基于本体的交通导航数据语义查询研究.pdf_第2页
(管理科学与工程专业论文)基于本体的交通导航数据语义查询研究.pdf_第3页
(管理科学与工程专业论文)基于本体的交通导航数据语义查询研究.pdf_第4页
(管理科学与工程专业论文)基于本体的交通导航数据语义查询研究.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

(管理科学与工程专业论文)基于本体的交通导航数据语义查询研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要 信息化、网络化时代的到来,为解决经济的快速发展给道路交通带来的拥堵 和环境污染等问题,提供了一个崭新的工程领域:智能交通系统( i n t e l l i g e n t t r a n s p o r t a t i o ns y s t e m s ,i t s ) 。它采用电子技术、信息技术、通信技术等高新技 术,对传统的交通运输系统及管理体制进行改造,是一种信息化、智能化、社会 化的新型现代交通系统。 交通导航是i t s 最为重要的部分,交通导航数据是指具有统一技术标准的地 理数据,为交通参与者提供出行指导,以及为智能交通系统各组成子系统提供导 航信息。在导航数据的查询反馈中,通常存在用户无法准确表达查询意图、系统 无法提供隐性信息等有效信息缺失的问题,阻碍了导航数据在智能交通系统应用 中的进步发展。 本文首先在分析了本体与交通本体研究现状的基础上,认为建立导航数据的 统一标准是解决以上问题的有效方法之一,因此引入了描述导航数据领域概念及 关系的本体技术,并建立了交通导航数据领域本体库,实现了人与应用、应用与 应用之间交流标准的统一,提高了智能交通导航数据查询的服务质量。其次,分 析常用本体查询语言s p a r q l ( s i m p l ep r o t o c o la n dr d fq u e r yl a n g u a g e ) 的不足, 结合本文交通导航数据查询的特点与需求,提出了基于s p a r q l 语义查询的两 种查询优化方法,并给出了优化方法的s p a r q l 描述。最后,在深入研究语义 查询的关键技术的基础上,本文采用h p 实验室提供的开放资源设计工具j e n a , 设计并实现了基于领域本体的交通导航数据语义查询系统。该系统提供面向智能 交通导航数据的语义查询服务,不但能够查询到语法形式上和查询条件一致的结 果,而且能查询出语义上满足检索条件的结果,和传统的基于关键字的查询方式 相比,能够有效提高查全率和查准率。 关键字:交通导航数据;领域本体;语义查询;语义网 英文摘要 a b s t r a c t w i t ht h ec o m i n go fd i g i t i z e di n f o r m a t i o na n dn e t w o r ke r a ,an e we n g i n e e r i n g f i e l di sm e r g i n g :i n t e l l i g e n tt r a n s p o r t a t i o ns y s t e m ( i t s ) ,w h i c hc a ns o l v et h et r a f f i c c o n g e s t i o na n da i rp o l l u t i o n s i t s ,am o d e mi n t e l l i g e n tt r a f f i cm a n a g e m e n ts y s t e m , r e f o r m st r a d i t i o n a lt r a f f i ci n f o r m a t i o na n dm a n a g e m e n ts y s t e mb yt e c h n o l o g i e sl i k e a d v a n c e de l e c t r o n i c s ,i n f o r m a t i o na n dc o m m u n i c a t i o nt e c h n o l o g i e s t r a f f i cn a v i g a t i o ni so n eo fi m p o r t a n tp a r t so fi t s n a v i g a t i o nd a t ar e f e r st ot h e g e o g r a p h i c a ld a t aw i t hau n i f i e dt e c h n i c a ls t a n d a r d ,w h i c hp r o v i d e sg u i d a n c ef o rt r a f f i c p a r t i c i p a n t sa n dn a v i g a t i o n i n f o r m a t i o nf o r t h e s u b s y s t e m s o ft h ei n t e l l i g e n t t r a n s p o r t a t i o ns y s t e m d u r i n gt h ei n q u i r y , i tu s u a l l yh a st h el a c k o fe f f e c t i v e i n f o r m a t i o np r o b l e m ,s u c ha s :u s e r sc a n n o te x a c t l ye x p r e s st h ei n q u i r yi n t e n t i o na n d s y s t e mi su n a b l et op r o v i d et h er e l e v a n ti n f o r m a t i o ns u c ha sw i t ht h es a n l es e m a n t e m e t h a th a m p e r sn a v i g a t i o nd a t ai ni n t e l l i g e n tt r a n s p o r t a t i o ns y s t e ma p p l i c a t i o nf u r t h e r d e v e l o p i n g f i r s t l y , t h i sp a p e ra n a l y z e st h eo n t o l o g ya n dt h et r a n s p o r t a t i o no n t o l o g y , a n dt h e n t h i n k st h a te s t a b l i s h i n gau n i f o r ms t a n d a r dn a v i g a t i o nd a t ai so n eo ft h ee f f e c t i v e m e t h o d st os o l v et h ea b o v ep r o b l e m s ot h ep a p e ri n t r o d u c e st h eo n t o l o g yt e c h n o l o g y t od e s c r i b e n a v i g a t i o n d a t af i e l d s c o n c e p ta n dr e l a t i o n s h i p ,a n de s t a b l i s h e sa n o n t o l o g yd a t a b a s eo ft h et r a n s p o r t a t i o nn a v i g a t i o nd a t af i e l d ,w h i c hc a nr e a l i z et h e u n i f o r mc o m m u n i c a t i o ns t a n d a r db e t w e e np e o p l et o a p p l i c a t i o na n da p p l i c a t i o nt o a p p l i c a t i o n ,a n dc a ni m p r o v et h es e r v i c eq u a l i t yo f t h en a v i g a t i o nd a t ar e t r i e v a l s e c o n d l y , b a s e do na n a l y z i n gt h ec o m m o no n t o l o g yq u e r yl a n g u a g es p a r q l , a n dc o m b i n i n gt h ec h a r a c t e r i s t i c sa n dd e m a n d so ft h et r a n s p o r t a t i o nn a v i g a t i o nd a t a , t h ep a p e rp u t sf o r w a r dt w ok i n d so fs e m a n t i cq u e r yo p t i m i z a t i o nm e t h o d sb a s e do nt h e s p a r q la n dd e s c r i b e st h eo p t i m i z a t i o nm e t h o d sb yt h es p a r q l f i n a l l y , t h r o u g hs t u d y i n gt h ek e yi m p l e m e n t a t i o nt e c h n o l o g i e so ft h es e m a n t i c q u e r y , t h ep a p e ru s e st h eo p e nr e s o u r c e sd e s i g nt o o l sj e a np r o v i d e db yt h eh p l a b st o d e s i g na n dr e a l i z et h et r a n s p o r t a t i o nn a v i g a t i o nd a t as e m a n t i cq u e r ys y s t e mb a s e do n t h ed o m a i no n t o l o g i e s t h i ss y s t e mp r o v i d e st h es e m a n t i cq u e r ys e r v i c ea b o u tt h e i n t e l l i g e n tt r a n s p o r t a t i o nn a v i g a t i o nd a t a t h r o u g hi t ,t h er e s u l t sw h i c hm e e tn o to n l y 英文摘要 t h eq u e r yf o r m sa n dg r a m m a rb u ta l s ot h es e m a n t i cc o n t e n tc a nb es e a r c h e d c o m p a r e d w i t ht h ef o r m e rq u e r ym e t h o db a s e do nt h ek e yw o r d ,i th a sm o r er e c a l lr a t i oa n d p r e c i s e k e yw o r d s :t r a n s p o r t a t i o nn a v i g a t i o nd a t a ;d o m a i no n o t o l o g y ;s e m a n t i c r e t r i e v a l ;t h es e m a n t i cw e b 大连海事大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:本论文是在导师的指导下,独立进行研究工作所取得的成 果,撰写成硕士学位论文:基王奎生的銮逼昱照堑堡适竖查迦硒究: 。除论文 中已经注明引用的内容外,对论文的研究做出重要贡献的个人和集体,均已在文 中以明确方式标明。本论文中不包含任何未加明确注明的其他个人或集体已经公 开发表或未公开发表的成果。本声明的法律责任由本人承担。 学位论文作者签名:墨叁丝 学位论文版权使用授权书 本学位论文作者及指导教师完全了解大连海事大学有关保留、使用研究生学 位论文的规定,即:大连海事大学有权保留并向国家有关部门或机构送交学位论 文的复印件和电子版,允许论文被查阅和借阅。本人授权大连海事大学可以将本 学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫 描等复制手段保存和汇编学位论文。同意将本学位论文收录到中国优秀博硕士 学位论文全文数据库( 中国学术期刊( 光盘版) 电子杂志社) 、中国学位论文全文 数据库( 中国科学技术信息研究所) 等数据库中,并以电子出版物形式出版发行 和提供信息服务。保密的论文在解密后遵守此规定。 本学位论文属于: 保 密口在年解密后适用本授权书。 不保密口( 请在以上方框内打“ ) :弧堑名:翟军 吼砷年占月j 7 日 基丁本体的交通导航数据语义奄询研究 第1 章绪论 1 1 研究背景与意义 国民经济的快速发展使交通运输的各种需求明显增长,随着科学技术的发展 和信息时代的到来,运用科学管理的方法来解决交通问题开始引起人们的重视并 得到了迅速的发展,这就形成了智能交通的概念。智能交通系统( i n t e l l i g e n t t r a n s p o r t a t i o ns y s t e m s ,r r s ) 可以通过提高交通系统效率来降低交通拥堵,在众 多领域中取得了广泛的应用,其中交通导航是其最为重要的部分。 在交通导航中,无论是在交通过程的前期、中期还是后期,也无论是交通过 程的参与者还是管理者,这其中的人、车、物都是在现实世界的地理空间中的。 交通参与者或管理者想要获取“某一交通事件发生的地点 、“某一地点的相关信 息”、“某一服务存在的地点”等信息,都需要地理数据的支持。图1 1 表示了地 理信息在i t s 中的作用【1 1 。 图1 1 地理空间数据在i t s 中的作用 f i g 1 1r o l eo ft h eg e o g r a p h i c a ls p a t i a ld a t ai nt h ei t s 交通导航是智能交通中最重要的应用之一,其中自动驾驶和自动导航对数据 的要求最高最全面,满足了这两项要求的数据库就能够满足大多数智能交通的应 用需求,因此一般对于支持智能交通的地理数据库的研究和开发都首先基于交通 第1 章绪论 导航的需求。因而,人们一般将支持智能交通的地理数据库叫做导航数据库 ( n a v i g a b l ed a t a b a s e ) 。本文提到的“导航数据”一般都指“导航地理数据”0 交通导航就是要在人、导航系统和信息中心之间建立一种实时通信,如果这 些实体之间无法实现信息交互,那么它们就成了一个个“信息孤岛 ,导致实时 交通动态信息无法应用于智能交通系统中。面向中心服务器的信息查询是实时信 息交互中的一个重要环节,各类部门和人员希望从查询中获取交通导航的指导信 息。由于目前使用的查询方式都是基于关键字匹配的,用户在查询关键字的选择 上可能有所偏差,使得返回的查询结果不尽人意,返回了很多无用的信息而真正 需要的信息又被丢失。 因此,本文提出了“基于本体的交通导航数据语义查询研究的课题。本课 题一方面引入本体技术,构建智能交通导航数据的领域标准解决导航数据查询中 有效信息缺失的问题:另一方面对传统的s p a r q l ( s i m p l ep r o t o c o l a n dr d f q u e r yl a n g u a g e ) 本体查询进行优化,提高查询效率。因此,本课题具有较大的 理论研究意义和实际应用价值。 1 2 国内外研究现状 1 2 1 本体的国内外研究现状 本体【2 1 由于具有精确描述概念模型的特性而被引入到各个研究领域,成为近 年来的研究热点。目前,本体的应用包括以下几方面: ( 1 ) 基于语义的信息检索【3 1 ,特别是网络搜索引擎和数字化图书馆【4 5 】; ( 2 ) 基于本体的数据集成【6 1 、机器学习等【7 】; ( 3 ) 领域本体的应用。比如,在生物信息学中已建成的g e n e o n t o l o g y t 8 1 ,尽 管只包括了p a r t o f 等简单的关系,但是对生物信息学界已经产生巨大的影响; h ) 语义w 曲服判9 】; ( 5 ) 在线元数据管理和自动信息发布。 本体本质上是领域知识的共享和复用,是一种能够在语义和知识层次上描述 信息系统的类模型的建模工具。领域本体以其标准化和形式化的特征能够为信息 基于本体的交通导航数据语义有询研究 系统之间的互操作提供良好的解决方案,在很多领域得到了广泛的应用。o n t o k n o w l e d g e l l l l 是欧洲i s t ( i n f o r m a t i o ns o c i e t yt e c h n o l o g i e s ) 计划中的一个项目,该 项目通过在信息中应用本体来提高大型分布式系统的知识管理水平。大型常识知 识库系统c y c 由美国d l e n a t 教授领导建立1 1 2 】,这是一个以建成百万级数量的断 言知识库为目标的项目,并在此知识库的基础上研究对人类活动中自然语言的理 解、学习、问题求解等。w o r d n e t 是由p r i n c e t o n 的b e r k e l e y 分校研制的以同义 词集为单位组织信息的基于心理语言学规则的英文词典f 1 3 】。阿姆斯特丹自由大 学和荷兰e l s e v i e r 出版社合作研制了一个医学文献语义检索工具d o p e ( d r u g o n t o l o g yp r o j e c tf o re l s e v i e r ) 1 1 4 】,提供各种药物本体信息。 1 2 2 交通本体的国内外研究现状 交通系统是为出行者提供服务的,必然要实现交通信息的有效利用和共享。 交通本体就是利用本体技术对交通领域知识进行规范化描述,在交通信息的提供 者和使用者之间建立沟通的桥梁,从而为交通管理者和交通参与者提供决策支 持,实现交通信息的增值服务。在这一研究领域,国内外的许多专家学者都进行 了有效的研究探索。得克萨斯大学计算机科学学院的p e t e rc l a r k 建立了b o e i n g 交通本体,把该本体设计成分层的形式,引入了一个基本的交通本体,使用图节 点作为交通地点,使用图弧线作为交通路线,并包含了所有的交通活动和外部人 员【1 5 1 。美国洛克威尔自动控制研究中心的v r b ap 和h r d o i l l 【av 定义了用于工厂 中的材料运输的材料运输本体1 1 6 l 。在国内,同济大学黄珂萍和国家高性能计算 机工程技术研究中心的蒋昌例1 7 l 建立城市交通本体,对城市交通领域知识进行 规范描述,并从领域知识中提取出类内及类间公理,建立公理库,用于领域知识 的一致性分析和知识推理。大连海事大学交通运输管理学院的翟军、陈燕、沈立 新【1 8 】在领域本体中引进模糊概念属性值,并将普通的概念关系扩展为模糊关系 与直觉模糊关系。以交通事故分析与预测系统为例,建立交通知识本体模型。 1 3 论文主要内容 本论文依托辽宁省教育厅科研项目“基于本体的智能交通系统的知识集成关 第1 章绪论 键技术研究 ( 批准文号:2 0 0 6 0 0 8 3 ) ,论文工作也是这个项目的组成部分。本论 文主要包括以下几方面的内容: ( 1 ) 介绍了研究背景,以及本体和交通本体的研究现状,并明确了本文的主 要研究内容。 ( 2 ) 对本体的概念、分类和构建规则等进行了综述,并着重介绍了 r d f ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ) 和o w l ( o n t o l o g yw e bl a n g u a g e ) 两种本体 表示语言和二者之间的关系。 ( 3 ) 对导航数据的相关概念进行了描述,同时依据这些概念进行导航数据领 域本体建模,并利用本体构建工具p r o t 6 9 6 管理o w l 语言表示的导航数据领域 本体。 ( 4 ) 在对比分析了当前流行的几种本体查询语言的基础上,选择s p a r q l 进 行语义查询,并针对该查询语言存在的不足,提出了查询优化方法。 ( 5 ) 采用h p 实验室提供的开放资源设计工具j e n a ,建立交通导航数据语义 查询原型系统,并进行模型验证。 ( 6 ) 对全文工作进行了总结,并对下一步研究工作进行了展望。 基于本体的交通导航数据语义查询研究 第2 章本体理论基础 2 1 本体的基本概念 本体的概念最初起源于哲学,定义为“对世界上客观存在物的系统地描述, 即存在论,研究物质的本性及相互关系,是客观存在的一个系统的解释或说 明,关心的是客观现实的抽象本质【1 9 l 。后来,本体论随着计算机应用领域的不 断拓展,被引入到人工智能中,此时的本体论是一些特殊词汇描述现象的人造产 物【2 0 】。 2 1 1 本体的定义 在人工智能界,最早给出本体定义的是n e c h e s 等人,他们将本体定义为 “给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规 定这些词汇外延的规则的定义 。n e c h e s 认为:“本体定义了组成主题领域的词 汇表的基本术语及其关系,以及结合这些术语和关系来定义词汇表外延的规则” 1 2 1 l o 1 9 9 3 年,g r u b e r l 2 2 1 把本体定义为“o n t o l o g y 是概念模型的明确的规范说 明 ;1 9 9 7 年,b o r s t 在此基础上,把本体定义为“o n t o l o g y 是共享概念模型的 形式化规范说明? 1 2 3 】;1 9 9 8 年,s t u d e r 在对上述两个定义进行7 n a 研究后, 提出了本体的另外一个定义,即“o n t o l o g y 是共享概念模型的明确的形式化规 范说明【2 4 1 。 在本体的定义中,体现了本体的4 层含义【2 5 1 。 ( 1 ) 概念化( c o n c e p t u a l i z a t i o n ) 指通过抽象出客观世界中一些现象的相关概念而得到的模型,其表示的含义 独立于具体的环境状态。 ( 2 ) 明确( e x p l i c i t ) 指所使用的概念及使用这些概念的约束都有明确的定义。 ( 3 ) 形式化( f o r m a l ) 指本体应是计算机可读的,也就是能被计算机所处理。 第2 章本体理论基础 ( 4 ) 共享( s h a r e ) 指本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集,即 本体所针对的是团体而非个体的共识。o n t o l o g y 的目标是捕获相关领域的知 识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层 次的形式化模式上给出这些词汇( 术语) 和词汇之间相互关系的明确定义。 尽管定义有很多不同的方式,但是从内涵上来看,不同研究者对于本体的认 识是统一的,都把本体当作是领域( 可以是特定领域的,也可以是更广的范围) 内 部不同主体( 人、机器、软件系统等) 之间进行交流( 对话、互操作、共享等) 的一 种语义基础,即由本体提供一种明确定义的共识。 2 1 2 本体的分类 近年来研究本体的机构和组织越来越多,它们在研究中也建立了各种本体, 因此就存在多种本体分类方法。使用最广泛的是以下三种分类方法: ( 1 ) 根据本体的描述对象不同,将本体分为4 类【2 6 】: 应用本体( a p p l i c a t i o no n t o l o g y ) :以某一领域中某一任务为描述对象的本 体,为某一应用构建知识定义了一些与之相关的概念。通常应用本体是将领域本 体或者一般知识本体中的概念更加具体化,因此通用性不够,但是就某一应用而 言,可以描述的更加精确。 领域本体( d o m a i no n t o l o g y ) :以某一领域为描述对象的本体,它们提供 该领域特定的概念定义和概念之间的关系,提供该领域中发生的活动以及该领域 的主要理论和基本原理等。 一般知识本体( g e n e r a lo n t o l o g y ) :定义了涵盖多个领域的基本概念和知 识。 表示本体( r e p r e s e n t a t i o no n t o l o g y ) 以知识表示语言为描述对象的本 体。在表示本体中,类、对象、关系、属性和槽等术语经过严谨的分析和定义。 ( 2 ) 根据本体表示的形式化程度,将本体分为4 类: 完全非形式化:完全用自然语言来表示本体,由于自然语言本身存在很 大的二义性,导致概念的定义比较模糊,其结构也很松散。 基于本体的交通导航数据语义查询研究 结构非形式化:用受限的或结构化的自然语言表示本体,这样可以有效 减少描述上的二义性。 半形式化:用一种人工定义的形式化语言表示本体。 完全形式化:所有属性具有形式化的语义,并能在某种程度上证明包括 一致性和完整性等方面的属性。 ( 3 ) 根据本体的研究层次,将本体分为4 类f 2 7 】: 顶层本体【2 8 】:研究的是最普通的概念及概念之间的关系,如空间、时 间、对象、事件和行为等,他们完全独立于特定的问题或领域。因此可以说顶层 本体可以在一个很大的范围内共享。 领域本体:研究特定领域( 医药、汽车等) 中的概念及概念之间的关系。 任务本体:研究特定任务或行为中的概念及概念之间的关系。 应用本体:研究的是依赖于特定领域和任务的概念及概念之间的关系。 2 1 3 本体的作用 由本体概念的内涵来看,本体为领域内部不同主体( 人、机器、软件系统等) 之间进行交流( 对话、互操作、共享等) 提供一种语义基础。从一般领域应用的角 度来理解,本体主要有以下作用【2 9 j : ( 1 ) 对于领域知识进行分析与明确说明,并使其形式化。 一旦明确说明了一个领域中的各种术语,就可对领域知识进行分析。当要重 用现有本体和扩展现有本体时,对术语的形式化的分析就体现出它的重要价值。 ( 2 ) 在人、机器( 表现为软件代理) 以及人与机器之间共享。 对于信息及结构的共同理解这是本体开发最基本的一个目标。采用术语和关 系来编码领域假设。 ( 3 ) 实现领域知识的重用。 促进领域知识的重用推动了本体的研究。例如有多个不同领域组织的模型均 需要表示时间这一概念,时间的表示包括时间间隔的概念和定义、时间指针、相 关的时间测量方法等。如果这些领域和组织中有一个组织详细开发了满足要求的 本体,其他领域和组织就可以很方便简单地把这个本体应用到自己的领域中来。 第2 章本体理论基础 2 2 本体表示语言 2 2 1 早期的本体语言 ( 1 ) k i f k i f ( k n o w l e d g ei n t e r c h a n g ef o r m a t ) 1 3 0 】是由i n t e r l i n g u a 工作组开发的,它是全 异计算机项目之间进行知识交换的正式语言,具有如下特点: 公布的语义:它不用借助解释程序便可理解知识表达式的意义。 充分的逻辑理解力:它用谓词微积分提供任意语句的表示。 元知识:允许我们清楚地表示知识,并且不需要更换语言就能引入新的 知识表示结构。 可读性:它在描述陈述性语义时是非常有用的,能够协助人类解决知识 库翻译的许多问题。 ( 2 ) f - l o g i c f - l o g i c i 3 1 1 是基于框架语言和一阶谓词逻辑的整合,它包括对象、继承、多 态类、查询方法以及封装。它能够描述以对象为导向的范例的所有方面。它的主 要功绩在于把概念模型结构整合为连贯的逻辑框架。它提供类,属性( 具有定义 域和值域) ,通过i s a 层级包含子类,并且在本体元素与实例之间提供逻辑公 理。 ( 3 ) d u b l i nc o r e d c ( d u b l i nc o r e ) 3 2 】是全球采用的最古老的语言,其目标在于方便w 曲上的 电子资源查询。该语言由1 5 个描述w e b 资源的元素集组成,其实际上是超越语 言的信息资源的世界标准。它已经被翻译成2 5 种语言。d u b l i nc o r e 是描述目录 信息的元数据元素集,它具有一定的简易性,而简易即是它的优点也是它的缺 点。 2 2 2 近期的本体语言 ( 1 ) r d f r d f ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ,资源描述框架) 是一种描述资源的语 言,适用于任何领域,是w 3 c 组织推荐的描述w w w 上元数据的标型3 3 1 。r d f 基于本体的交通导航数据语义布询研究 是处理元数据的基础,它为在应用程序之间交换机器可理解的网络数据提供了可 互操作性。在r d f 模型中,资源以资源标识符来标识,资源标识符由一个惟一 资源标识符和一个可选l 批( a n c h o r ) i d 组成。r d f 模型通过性质( p r o p e r t y ) 和值 ( v a l u e ) 来描述资源以及资源之间的关系,定义了由资源( r e s o u r c e ) ,性质 ( p r o p e r t y ) 和语句( s t a t e m e n t ) - - 种对象组成的基本模型,其中r e s o u r c e 是资源( 所 有能用r d f 表达式来表述的事物都可称之为资源) ,p r o p e r t y 可以看做是资源的 性质( 用来描述资源的某个特定的方面) ,s t a t e m e n t 是由r d f 语句中一个特定的 资源和一个指定的性质以及资源性质的取值组成。因此r e s o u r c e 和p r o p e r t y 关 系类似于e r 模型,而s t a t e m e n t 则是对该关系进行具体描述。r d f 通过这个抽 象的数据模型为定义和使用元数据建立了一个框架,元数据元素可看成其描述的 资源的性质。r d f 模型的表示方法有三种:图示法、模型和三元组。 ( 2 ) o w l o w u 3 4 1 是本体论w 曲语- 言( o n t o l o g yw 曲l a n g u a g e ) 的字母缩写,它是由 w 3 c 组织提出的一种比较完善的用于描述语义网的语言1 3 5 】,它与早期的本体语 言( 如s h o e ,s i m p l eh t m lo n t o l o g ye x t e n s i o n s ) 是一致的,并且它能够使设计 人员更强有力的表示语义。用o w l 语言设计的最终目的是提供一种可以用于各 种应用的语言,这些应用需要理解内容,从而代替只是采用人类易读的形式来表 达内容。o w l 能够被用于清晰地表达词汇表中的词条的含义以及这些词条之间 的关系。 o w l 包括三种子语言f 3 6 l :o w ll i t e 、o w ld l 以及o w lf u l l 。以上三种 语言都有其各自的优缺点。o w ll i t e 用于提供给那些只需要一个分类层次和简 单约束的用户;o w ld l 支持那些需要最强表达能力的推理系统的用户,且这 个推理系统能够保证计算的完全性( c o m p u t a t i o n a lc o m p l e t e n e s s ,即所有的结论 都能够保证被计算出来) 和可判定性( d e c i d a b i l i t y ,即所有的计算都在有限的时间 内完成) 1 3 7 1 ;o w lf u l l 支持那些需要尽管没有可计算性保证,但有最强的表达能 力和完全自由的r d f 语法的用户。 第2 章本体理论基础 乒乏三= 、o 、 。夕,夕 、:二, 在表达能力和推理能力上,每个子语言都是前面语言的扩展。 这三种子语言之间有如下关系成立,但这些关系反过来并不成立。 每个合法的o w ll i t e 本体都是一个合法的o w ld l 本体; 每个合法的o w l d l 本体都是一个合法的o w l f u l l 本体; 每个有效的o w l l i t e 结论都是一个有效的o w l d l 结论; 每个有效的o w ld l 结论都是一个有效的o w lf u l l 结论。 o w l 支持o n t o l o g y 引用、包含以及元信息描述:上面提到的三个层次的 o w l 都包含了用于指定导入的o n t o l o g y 、o n t o l o g y 版本信息和前版本信息、可 向后兼容的o n t o l o g y 信息以及不兼容的o n t o l o g y 信息等一系列信息的方法1 3 8 1 。 这三种子语言与r d f 的关系是: o w l f u l l 可以看成是r d f 的扩展; o w ll i t e 和o w lf u l l 可以看成是一个约束化的r d f 的扩展; 所有的o w l 文档( l i t e 、d l 、f u l l ) 都是一个r d f 文档; 所有的r d f 文档都是一个o w lf u l l 文档; 只有一些r d f 文档是一个合法的o w l l i t e 和o w l d l 文档。 o w l 具有较强属性特征的语义表达能力1 3 9 1 。o w l 在r d f 和 r d f s ( r e s o u r c ed e s c r i p t i o nf r a m e w o r ks c h e m a ) 基础上增加了更多建模原语来描 述类、属性,以及它们之间的关系,并有针对性地提供了更加丰富的属性描述和 限制约束。o w l 采用面向对象的方式来描述领域知识,即通过类和属性来描述 对象,并通过公理和限制来描述这些类和属性的特征和关系。o w l 作为专门 为描述网络上的本体而设计的描述逻辑语言,具有清晰的语义,具备很强的知识 基丁二本体的交通导航数据语义奄询研究 表示能力,但也还存在局限性,如属性约束表示能力不足,不能表示任何规则 等,而无论约束表示还是规则表示对本体都是非常重要的。 2 3 本体的构建方法 当前,建立本体大部分采用手工方式,建立本体还没有成为一种工程性的活 动,每个本体开发组在开发过程中有自己的原则、设计标准,缺乏共同的准则因 而目前本体的共享、重用和互操作还难以实现。 出于对各自学科领域和具体工程的不同考虑,构建本体的过程各不相同。一 般认为,g r u b e r 在1 9 9 5 年提出的5 条规则是比较有影响的【4 1 1 : ( 1 ) 明确性和客观性:本体应该用自然语言对术语给出明确、客观的语义定 义。 ( 2 ) 完整性:所给出的定义是完整的,能表达特定术语的含义。 ( 3 ) 一致性:知识推理产生的结论与术语本身的含义不会产生矛盾。 ( 4 ) 最大单向可扩展性:向本体中添加通用或专用的术语时,通常不需要修 改己有的内容。 ( 5 ) 最少约束:对待建模对象应该尽可能少列出限定约束条件。 目前常用的七种本体构建方法是:七步法、骨架法、i d e f 5 法、 m e t h o n t o l o g y 法【4 5 1 、t o v e 法、s e n s u s 法和k a c t u s 法。以下介绍几种有代 表性的本体构建方法。 ( 1 ) 七步法【4 2 】 斯坦福大学医学院开发的七步法,主要用于领域本体的构建。这七个步骤分 别是: 确定本体的专业领域和范畴。 考查复用现有本体的可能性。 列出本体中的重要术语。 定义类和类的等级体系。完善一个等级体系有几种可行的方法:自顶向 下法、自底向上法、综合法。 定义类的属性以及属性间的内在结构。 第2 章本体理论基础 定义属性的分面。一个属性可能由多个“分面”组成。一个属性的“分 面”,就是属性取值的类型、容许的取值、取值个数和有关属性取值的其它特 征。 创建实例。定义某个类的下属实例需要:确定一个类、创建该类的一个 实例、添加这个类的属性值。 ( 2 ) 骨架法1 4 3 】 骨架法,又称e n t e r p a i s e 法,专门用来构建企业本体( e n t e r p a i s e o n t o l o g y ,是有关企业建模过程的本体) 。 建立在企业本体基础之上,是相关商业企业间术语和定义的集合,该方法只 提供丌发本体的指导方针。“骨架法”流程见图2 2 。 图2 2 骨架法流程图 f i g 2 2f r a m e w o r kf l o wd r a w i n g 确定本体应用的目的和范围:根据所研究的领域或任务,建立相应的领 域本体或过程本体,领域越大,所建本体越大,因此需要限制本体的领域范围。 本体分析:定义本体内所有术语的意义及术语之间的关系,该步骤需学 科专家的参与,对该领域了解得越多,所建本体就越完善。 本体表示:一般用语义模型表示本体。 本体的评价:建立本体的评价标准是清晰性、一致性、完善性、可扩展 性。清晰性就是本体中的术语应被无歧义的定义。一致性是指术语之间关系逻辑 上应一致。完整性,本体中的概念及关系应是完整的,应包括该领域内所有概 雩 翌 基丁本体的交通导航数据语义查询研究 念,虽然很难达到,但应不断完善。可扩展性,本体应用能够扩展,在该领域发 展过程中能加入新的概念。 本体的建立:对所有本体按中的标准进行检验,符合要求的以文件的 形式存放,否则转回,如此循环往复,直至对所有步骤的检验结果均达到要求 为止。 ( 3 ) i d e f 5 法f 删 i d e f 5 是种图形化的语言,其用途是为了使学科领域专家可以表达基于本 体的最为通用的信息。i d e f 5 细节说明语言是一种结构化的文本语言,用来详细 描述本体中的元素。 i d e f 5 构建本体的5 个主要步骤,分别是:定义课题、组织队伍,收集数 据,分析数据,本体初步开发,本体优化与验证。 i d e f 5 构建本体的方法在于获取现实世界客观对象的断言( 即定义) ,以及它 们的属性和它们之间的内在联系。在本体的构建过程中,研究人员首先要对叙词 集合( 类似于数据词典) 进行编目并以此作为建立领域模型的基础。这一模型中的 概念是用叙词集合中的叙词来表示的。为了构建本体,必须要完成三项任务:对 术语进行编目、获取用这些术语描述这一领域时的限制条件、建立一个模型,当 在模型中加入一条特定的描述时,就会产生“适当的 附加说明。因此,本体酷 似一部数据词典,但又包含了语法和一个控制领域内概念关系的模型。 表2 1 本体构造方法比较 t a b 2 1c o m p a r eo fd i f f e r e n tw a y st oc o n s t r u c to n t o l o g y 第2 章本体理论基础 综合上述几种方法体系,本文从生命周期等五个方面,比较了各种本体的构 建方法,结果如表2 1 所示。 由上述的分析比较可知,目前的本体构建方法中存在需求分析不充分、构建 过程不规范、成果没有评价标准和忽视知识共享和重用等问题。本体的构建为不 同系统之间提供语义基础,所以其构建过程更强调工程性。因此,本文结合七步 法,运用进化的观点,采用如下的领域本体的构建过程: ( 1 ) 需求分析 这个阶段需要明确领域本体建设的目的、范围、用途和使用者。与软件开发 过程类似,在本体建设的初期,应该首先了解其应用的具体背景和需求。在调研 其应用的具体背景和需求之后,本体建设人员基本可以确定领域本体建设的需求 情况。为了指导后续工作并方便和他人的交流,应该编写一份领域本体建设的 “需求分析规格说明书”,以文档的形式明确需求分析的结果,作为该阶段的成 果。 ( 2 ) 制定计划 在这个阶段中,本体建设人员充分了解现有资源,针对需求说明书中的各项 要求,制定出本体建设的“项目计划书”。主要包括:建设目标、方法,任务分 配,时间要求等。“项目计划书 在实际的本体建设项目中必不可少,却往往在 研究项目中被忽略,从而导致在实施过程中需要重新计划。 ( 3 ) 本体构建 这个阶段是领域本体构建的实施阶段,采用混合法,即先建立那些显而易见 的概念,然后分别向上与向下进行泛化与细化。实施阶段可以细分为以下步骤: 知识收集及获取 首先通过收集领域信息充分了解领域知识。信息来源包括专家、书籍、网 络、甚至是其他的本体。利用这些信息获得知识的方法可以是:头脑风暴法、访 谈、文本的形式化或非形式化的分析和一些知识自动获取工具。 重点概念和关系的确定 在充分了解领域知识之后,知识工人将提炼出该领域的重要概念和主要的关 基于本体的交通导航数据语义查询研究 系,并通过准确的自然语言表达出来,在经过领域专家确认之后,将其作为领域 本体的核心概念集。 编码实现 本体的构建最终是为了让机器能理解现实社会,因此就必须用形式化的方法 对本体中的术语编码。形式化编码阶段就是采用选定的本体描述语言来编写本 体,为了提高编码效率,通常使用一些辅助工具来完成。 复用相关的现有本体 共享和重用是本体的一个主要特点,在建设本体时除了自己定义,也应该通 过调研找到该领域中现存的本体,加以重用。 ( 4 ) 评价 经过前面几步,己经建立了一个初步的核心本体。和软件开发过程的测试阶 段一样,本体也需要评价。综合现有方法论中提出的本体评价指标,基本包括: 正确性、一致性、可扩展性和有效性、本体的规模及描述能力。 ( 5 ) 进化 具体领域的知识是复杂的,并且领域的边界是模糊的,领域之间总是存在交 叉,一次性建成完善的本体是很难达到的。只有通过进化法,先建立出核心的可 用本体,在经过确认与评价之后,若有必要还需要进一步的重复上述过程,不断 扩展和进化己建立的本体,整个本体构建过程是循环进化的。 2 4 领域本体模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论