(计算机应用技术专业论文)语义门户网站本体查询技术研究.pdf_第1页
(计算机应用技术专业论文)语义门户网站本体查询技术研究.pdf_第2页
(计算机应用技术专业论文)语义门户网站本体查询技术研究.pdf_第3页
(计算机应用技术专业论文)语义门户网站本体查询技术研究.pdf_第4页
(计算机应用技术专业论文)语义门户网站本体查询技术研究.pdf_第5页
已阅读5页,还剩70页未读 继续免费阅读

(计算机应用技术专业论文)语义门户网站本体查询技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

河海大学颂二 学位论文摘要 摘要 语义门户网站是基于语义w 曲技术构建的新一代的语义增强的门户网站。本体查 询技术是语义门户网站的重要支撑技术。在语义门户网站的设计、开发和运行等各个阶 段,都需要对语义门户网站本体库中的本体提供各种必要的本体查询功能,以满足不同 类型用户的本体查询需求。然而现有语义门户网站中所提供的本体查询功能还很有限, 这主要表现在目前大多数的语义门户网站没有提供理想语义门户网站所需的各种高级 本体查询功能,如:本体浏览、本体搜索和推理驱动的查询功能,还没有充分发挥语义 门户网站作为语义w 曲技术驱动的应用的全部潜能,这些本体查询功能的研究与实现 正是当前语义门户网站需要研究界攻克的重点。 针对以上背景,本文通过对理想语义门户网站中本体查询目标功能的需求分析,研 究并给出了实现理想语义门户网站中所需的本体搜索和本体浏览等本体查询功能的方 法,包括处理流程、主要算法以及用户界面的设计等;在此基础上,设计实现了一个理 想语义门户网站的本体查询原型系统o o s 4 s w p ,提供了对语义门户网站本体库中0 w l 本体的本体搜索和本体浏览功能的支持。以上设施满足了语义门户网站设计人员和开发 人员对语义门户网站本体库中本体具体信息的查询需求,以及语义门户网站成员用户对 语义门户网站本体库中本体实例信息的访问需求。案例研究表明:o q s 4 s w p 的实现是 有效的;基于当前,千源本体a p i 实现理想语义门户网站中所需本体查询功能是可行的。 关键词:本体查询;本体;o w l 本体语言;语义门户网站:语义w 曲 河海大学硕= b 学位论文 摘要 a b s t r a c t s e m a i l t i cw e bp o r t a l sa r en e x tg e n e r a t i o no fs e m a n t i c a l l ye 1 1 1 1 a 1 1 c e dw e bp o r t a l s ,w h i c h c o n s t m c t e db a s e do ns e m a n t i cw e bt e c h n 0 1 0 9 y 0 m o l o g yq u e r yt e c h n i q u e sa r eb a c k b o n e t e c h n o l o g yf o rs e m m i cw e bp o r t a l s 1 1 1d i 疵r e n tp h a s e so fs e m a n t i cw e bp o r t a l s ,t h e y s h o u l dp r o v i d ea p p r o p r i a t eo n t o l o g yq u e r yf a c i l i t i e st om e e tt h er e q u i r e m e n t so fo n t o l o g y q u e r yf o rd i 骶r e mu s e r si ns e m a i l t i cw e bp o r t a l s h o 、v c v e rc u r r e n t l ym o s ts e m a n t i cw e b p o r t a l sh a v e n ts u p p l yt h ea d v a l l c e do n t o l o g yq u e r yf u n c t i o n sr e q u i r e di ni d e a ls e m a i l t i c p o r t a l s ,s u c ha so n t o l o g yb r o w s i n g ,o n t o l o g ys e a r c ha n di n f e r e n c e p o w e r e dq u e r y t h e y h a v e n tr e v e a l e dt h ep o t e n t i a la st h ea p p l i c a t i o n sd r i v e nb ys e m a n t i cw e bt e c l l i l o l o g y s u m c i e n t l y u n d e rt h eb a c k g r o u n ds t a t e da b o v e ,m e 印p r o a c h e so fr e a l i z i n go n t 0 1 0 9 yb r o w s i n ga n d o n t o l o g y s e a r c hi ni d e a ls e m a n t i cw e bp o r t a l sa r ep r e s e n t e di n t h i sp a p e r ,i n c l u d i n g p r o c e s s i n gn o w ,m a i na l g o r i t h ma n dt h ed e s i g ni d e a so fu s e ri n t e r f a c e s ,b yr e s e a r c h i n gt h e r e q u i r e m e n t so fo n t o l o g yq u e r yi np e r f e c ts e m a n t i cw e bp o n a l s b a s i n go nt h ea p p r o a c h e s ,a p r o t o t y p et o o lf o ro n t o l o g yq u e r yi ns e m a m i cw e b p o r t a l sc a l l e d0 q s 4 s w pi sd e s i g n e da n d i m p l e m e n t e d ,w h i c hs u p p l yt h en m c t i o n sf b ro w lo n t o l o g yh o w s i n ga n ds e a r c h ,i no r d e rt o m e e tt h er e q u i r e m e n t so fa c c e s s i n gm ei n f o m l a t i o no fo n t 0 1 0 9 yi no n t 0 1 0 9 yb a s eo fs e m a n t i c w e b p o r t a l s c a s es m d i e ss h o wt h a tt h ei m p l e m e n t a i i o no fo q s 4 s w p i se f 诧c t i v e ,a i l dt h e r e a l i z a t i o no fo n t o l o g yq u e r yf 如i l i t i e sr e q u i r e di ns e m a n t i cw e bp o r t a lb a s e do nc u e n t o p e n - s o u r c eo n f 0 1 0 9 ya p ii sf e a s i b l e k qw o r d s :o n t o l o g yq u e r y ;o n t o l o g y ;0 w l ;s e m a i l t i cw 曲p o n a l ;s e 咖n t i cw e b 学位论文独创性声明: 本人所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中 不包含其他人已经发表或撰写过的研究成果。与我一同工作的同事对本研 究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。如不实, 本人负全部责任。 论文作者( 签名) :倪只欠少矿,年占月日 学位论文使用授权说明 河海大学、中国科学技术信息研究所、国家图书馆、中国学术期刊( 光 盘版) 电子杂志社有权保留本人所送交学位论文的复印件或电子文档,可 以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质 论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅。 论文全部或部分内容的公布( 包括刊登) 授权河海大学研究生院办理。 论文作者( 签名) :“笔乙只乏2 一,年月日 河海大学硕士学位论文语义门户网站本体查询技术研究 1 1 研究背景 第一章绪论 万维网( w o r l dw i d ew e b ,简称w w w 或w 曲) 是i n t e m e t 最重要、最广泛的应用 之一,用户通过它可浏览i n t c m e t 上的信息资源。在w 曲出现的短短的十几年问里,它 在所拥有的信息和用户的增长速度等方面取得了巨大的成功。到目前为止,己经有许多 机构和团体利用当前w e b 的功能来加强团体内部和团体外部,以及个人用户之间的交 流和信息交换,出现了各种各样的门户站点( w e bp o r t a l s ) 。语义门户网站( s e m 柚t i c w 曲 p o r t a l s ) 是基于语义w e b 技术构建的新一代的语义增强的门户网站。语义w 曲技术能 够把信息表示为计算机可以理解和处理的形式,基于机器可处理的含有语义信息的数 据,自动地对信息进行处理和使用。本体口i 是包括语义门户网站在内的各种语义w e b 应用的关键使能技术。本体查询技术是语义门户网站的重要支撑技术,在语义门户网站 的设计、开发和运行等各个阶段,都需要对语义门户网站本体库中的本体提供各种必要 的本体查询功能,以满足不同类型用户的本体查询需求p j 。理想语义门户网站中需要提 供的本体查询功能包括:基于关键字的查询功能、本体浏览、本体搜索和推理驱动的查 询功能,这些查询功能是按照语义增强的程度来划分的。然而现有的基于语义w e b 技 术的门户网站中所提供的本体查询功能还很有限,主要表现在:当前大多数的语义门户 网站没有提供理想语义门户网站所需的各种高级本体查询功能,如:本体浏览( o n t o l o g y b r o w s i n g ) 、本体搜索( o n t o l o g ys e a r c h ) 和推理驱动的查询( i n f e r e n c e - p o w e r e dq u e r y ) , 与理想语义门户网站中本体查询功能需求相比还有很大差距,还没有充分发挥语义门户 网站作为语义w 曲驱动的应用的全部潜能【3 j 。因此研究理想语义门户网站本体查询功能 需求,开发相应的本体查询原型工具,对构建基于语义w 曲技术的下一代的门户网站 语义门户网站具有重要意义。 语义w 曲技术是构建语义门户网站的关键技术。语义w e b 的构想是由w 曲的创始 人t i mb e m e r s l e e 于1 9 9 8 年首次提出【4 】,他指出语义w e b 是对当前w 曲的一种扩充, 它将信息表示为计算机能够理解和处理的形式,使得人和计算机能够更好的i 办同工作【l j 。 w 3 c 对语义w e b 的定义是:语义w e b 是w e b 上数据的一种表示,它是一项由w 3 c 领 导的、众多研究人员和工业伙伴参与的协作式研究计划;语义w 曲基于资源描述框架 ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ,r d f ) 来集成以x m l 为语法、统一资源标识符 ( u n i f o h nr e s o u r c ei d e n t i f i e r u r i ) 为命名机制的各种应用。 t i mb e m e r s l e e 为语义w e b 技术提出了七层体系结构巴如图1 1 所示。第一层是 u r i 和u n i c o d e 【7 j 层,该层是整个语义w 曲的基础,其中u n i c o d e 处理资源的编码, 河海大学硕士学位论文 语义门户网站奉体查询技术硼f 究 u r j 负责标识资源。第二层是x m l 嗍和x m ls c h e m a ,用于表示数据的内容和结构,尽 管x m l 为数据提供了简单的结构,但它仍然是语法层次上的,没有含有有用的语义信 息 9 o 第三层是r d f 1 0 1 和r d fs c h e m a 【1 2 ,用于描述w e b 上的资源及其类型。第四 层用于描述各种资源之间的联系。第五层到第七层是在下面四层的基础上进行的逻辑推 理操作。 图1 1 语义w 曲基础结构 从上面对各层结构的说明可以推断,t i mb e m e r s - l e e 提出的七层结构中前四层主要 用来提供语义数据,而后三层提供推理服务,第四层本体起到了承上启下的作用,本体 是解决语义层次上w e b 信息共享和交换的基础,是语义w e b 实现的关键技术。 1 2 研究目标和内容 在语义门户网站的设计、开发和运行等不同阶段,都需要对语义门户网站本体库中 的本体提供各种必要的本体查询功能,以最大程度地满足不同类型用户的本体查询需 求。理想语义门户网站中需要提供的本体查渤功能包括:基于关键字的查询功能、本体 浏览、本体搜索和推理驱动的查询功能,这些查询功能是按照语义增强的程度来划分的。 然而现有基于语义w 曲技术的门户网站所提供的本体查询功能还很有限,当前大多数 的语义门户网站没有提供理想语义门户网站所需的各种高级本体查询功能,如:本体浏 览( o t o l o g yb r o w s i n g ) 、本体搜索( o n t o l o g ys e a r c h ) 和推理驱动的查询( i n f e r e n o e l p o w e r e d q u e r y ) ,这些本体查询功能研究与实现正是当前语义门户网站需要研究界攻克的重点。 综上所述,本文的研究目标是通过对理想语义门户网站中本体查询功能的需求分析 和研究,给出实现理想语义门户网站所需的本体搜索和本体浏览功能的方法,并在此基 础上,设计实现一个理想语义门户网站的本体查询原型工具,提供对语义门户网站本体 河海大学硕:l 学位论文语义门户刷站本体查询技术研究 库中o w l 本体的本体搜索和本体浏览等本体查询功能的支持。 主要研究内容包括: ( 1 ) 研究当前技术现状,分析理想语义门户网站中本体查询的功能需求; ( 2 ) 给出实现理想语义门户网站中所需的本体搜索和本体浏览功能的方法( 包括处理流 程、主要算法、用户界面的设计等方面) ; f 3 ) 开发理想语义门户网站的本体查询原型工具,提供对语义门户网站本体库中0 w l 本体的本体搜索和本体浏览等高级本体查询功能的支持。该工具获取语义门户网站 本体库中的o w l 本体,通过解析和可视化的处理,将本体中的具体信息以直观的 形式输出,供用户浏览。并可以根据用户对所选本体概念( c o n c e p t ,0 w l 本体中 称为类c l a s s ) 属性值的详细说明,通过执行相应的处理逻辑和算法,查询语 义门户网站本体库中本体的实例信息( i n s t a n c e ,o w l 本体中称为个体一i n d i v i d u a l ) ; ( 4 ) 通过案例研究来验证已实现的本体查询工具的有效性。 1 3 研究意义 本体查询技术是实现语义w 曲内容存取的关键技术。本体浏览功能和本体搜索功 能是理想语义门户网站中必须提供的重要的本体查询功能。在语义门户网站中实现本体 浏览和本体搜索功能方法的研究以及相关原型工具的实现,能够为构建基于语义w 曲 技术的下一代门户网站提供重要的技术支持。同时o w l 是w 3 c 推荐的标准w 曲本体 、 语言,0 w l 本体查询技术的研究,对语义w 曲技术的研究和发展也具有重要的意义。 1 4 本文组织 本文由7 章和参考文献、附录组成,正文的内容组织安排如下: 第一章绪论介绍本文的研究背景、研究目标和内容、研究意义: 第二章当前技术现状综述介绍了w 曲本体及其建模语言,对当前语义门户网站 本体查询技术进行了分析总结,指出了当前语义门户网站所提供的本体搜 索和本体浏览等本体查询功能的不足。 第三章语义门户网站本体查询需求与o q s 4 s w p 总体设计通过对理想语义门户网 站中本体查询功能需求分析与研究,提出了理想语义门户网站本体查询系 统0 q s 4 s w p ,详细论述了o q s 4 s w p 的体系结构与目标功能。 第四章语义门户网站本体搜索与本体浏览的功能与算法设计研究语义门户网站 中本体搜索和本体浏览的实现方法,详细叙述了本体搜索与本体浏览的功 河海大学硕:l 学位论文语义门户网站本体查询技术础f 究 能与算法设计,主要包括处理流程、主要算法以及用户界面设计等方面: 第五章实现技术叙述语义门户网站中本体浏览功能和本体搜索功能的具体实现 细节; 第六章案例研究通过典型案例来展示已实现的o q s 4 s w p 原型中本体搜索和本 体浏览功能,验证了o q s 4 s w p 所实现功能的有效性; 第七章总结与展望总结研究成果,展望下一步研究目标。 河海大学硕二l 学位论文语义门户嘲站本体查询技术1 i j f 究 2 1 概述 第二章当前技术现状综述 为了实现理想语义门户网站中所需的本体搜索和本体浏览等本体查询功能,本章对 当前技术现状做了分析和总结,包括w e b 本体及其建模语言以及当前语义门户网站本 体查询技术。 2 2w e b 本体及其建模语言 2 2 1 本体 本体这一词汇最早出现在哲学领域,从哲学的范畴来说,本体是客观存在的一个系 统的解释或说明,关心的是客观现实的抽象本质【1 4 i 。计算机界最早在人工智能领域中 使用,它将本体定义为“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和 关系构成的规定这些词汇外延的规则的定义”【l 。 1 9 9 3 年,g r u b e r 给出了本体的一个的定义7 】,即“本体是概念模型的明确的规范 说明”。后来,b o r s t 在此基础上,给出了本体的另外一种定【】驯:“本体是共享概念模型 的形式化规范说明”。s t u d e r 等对上述两个定义进行了深入的研究,给出了现在使用较 为广泛的一个定义,即:“本体是共享概念模型的明确的形式化规范说明”i ”j 。这包含 4 层含义:概念模型( c o n c e p t u a l i z a t i o n ) 、明确( e x p l i c i t ) 、形式化( f o r n l a l ) 和共享( s h a r e ) 。 “概念模型”指通过抽象出客观世界中一些现象( p h e n o m e n o n ) 的相关概念而得到的模 型。概念模型所表现的含义独立于具体的环境状态。“明确”指所使用的概念及使用这 些概念的约束都有明确的定义。“形式化”指本体是计算机可读的( 即能被计算机处理) 。 “共享”指本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集,即本 体针对的是团体而非个体的共识。本体的目标是捕获相关领域的知识,提供对该领域知 识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些 词汇( 术语) 和词汇间相互关系的明确定义。 2 2 2 w e b 本体 w 曲本体0 2 1 是语义w e b 的使能器,它提供了机器可处理的语义元数据( m e t ad a t a ) 河海火学坝士学位论文语义门户列站本体查询技术研究 有助于人和机器访问所需信息并在彼此之间通信,w e b 本体在实现w e b 上基于内容的 访问、互操作性和通信等方面起到关键作用。 2 2 3w e b 本体语言 本体的具体表示需要用描述语言来实现。对于w e b 上的应用程序而言,需要通用 的标准语言来表示本体,以避免在各种描述语言之间的转换。由于x m l 已被认为是 w 曲上数据表示的标准语言,因此,一些研究人员开发了基于) 洲l 语法的w e b 本体描 述语言。这些语言包括:r d f ( s ) 、d a m l + o i l 、o w l 等。r d f ( r e s o u r c ed e s c r i p l i o n f r a i l l e w o r k ) 是对象( 资源) 数据模型及其关系,这些模型可用x m l 语法表示:r d f s c h e m a 是描述r d f 资源属性和类的词汇表,这些属性和类的通用层次关系带有语义 【2 ( ) 叫。d a m l + o i l l 2 2 】支持机器可理解的本体定义和文档中词汇到本体的连接,是i u ) f 和i fs c h e m a 的扩充,能表示更多更复杂的约束,支持可操作的推理。 2 2 4o w l o w l 【23 口”( w 曲0 n t 0 1 0 9 yl a n g u a g e ) 是w 3 c 工作组在2 0 0 1 年创建的w e b 本体 语言,2 0 0 4 年2 月1 0 日起已正式成为w 3 c 推荐的标准w e b 本体语言。o w l 是r d f 语言的扩展,通过提供更多具有形式化语义的词汇,它具有比x m l 、r d f 和i u ) fs c h e m a 更强的w e b 内容表示能力。 1 10 w l 本体语言基本构造子 o w l 本体中包含类、属性、个体以及本体元数据等各种信息。o w l 本体中通过o w l 语言的各种构造子来描述类、属性和个体,以及它们之间的逻辑关系( 如:类的包含关 系、属性的等价关系、个体的类隶属关系等) 2 6 3 7 】,如表2 1 2 r 3 所示。 河海大学坝十学位论文 语义门户网站本体查询技术研究 表2 1o w l 语言类构造子及其作用描述 类( c l a s s ) 类公理 包古关系等价关系不相交关系 构造子:r d f 5 :s u b c l a s s o f 申明一个类描述的外延( 即它的个体 构造子:。w l :e q u i v a l e n t c l a s s构造子:。w l :d i s j 。i n t w i t h 申明两个类描述的外延相同申明两个娄描述的外延不相交 集) 是另一个类描述的外延之子集 类描述 匿名类 命名类 属性限制 集合操作 枚举 值约束 基约束 交 o w l :r e s t r l c t l o n + o w l :i n t e r s e c t i o n o f 定义一个娄,其外延是所 o w l :o n p r o p e r t y +o w l :r e s t r l c t l o n + o w l :a l l v a l u e s f r o m o w l :o n p r o p e r t y + 有指定类的外延的并定义个娄其所有个体 o w l :m a x c a r d l n a l l t y 均满足:指定属性的全部定义一个类,其所有个体 取值均是指定类的个体,均满足:指定属性至多柏 指定值域的数据值( 非负整数) 个不同的取 值( 个体做据值) 并:o w l :u n i o n o f 定义一个类,其外延是所o w l :r e s t r i c t i o n + 有指定类的外延的并 o w l :o n p r o p e r t y + 构造予: o w l :s o m e v a l u e s f r 0 o w l :c l a s s mo w l :r e s t r i c t i o n +构造于: 定义一个指定 定义一个类,其所有个体 o w l :o n p r o p e r t y +o w l :o n e o f 通 i d 的o w l 类 均满足:指定属性至少有 o w l :m l n c a r d i n a l l t y 过枚举奠全部 ( r d f 类的子 一个取值是指定类的个 定义一个类,其所有个体 个体( 即实例) 类) 体 旨定值域的数据值 均满足:指定属性至少有 柬定义一个类 ( 非负整数) 个不同的取 值( 个体,数据值) 补: o w l :c o m p l l e m e n t o f o w l :r e s t r i c t i on+ 定义一个类,其外延是o w l :o n p r o p e r t y + 0 w l :r e s t r i ct i o n + 个 r 定娄的外延的补 o w l :h a s v a l u eo w l :o n p r o p e r t y + 定义一个类,其所柯个体 o w l :c a r d l n a l l t y 均满足:指定属性有一个 定义个类,1 l 所有个体 取值等于指定娄的个体, 均满足:指定属性恰有v 指定值域的数据值 ( 非负整数) 个不同的取 值( 个体,数据值) 7 河海大学硕士学位沦文语义门户网站本体鸯询技术研究 表2 2o w l 语言属性构造子及其作用描述 属| 兰e ( p r o p e r t y ) 属性公理 定义域值域包含关系 构造了:构造子:构造子 r d f s :d o m a i n r d s :r a “g er d f s :s u b p r o p e r t y o f 申叫一个指定属性的定义域是申明一个属性的值域是指定类申明一个属性的外延( 即它的实 指定类描述的个体( 即属于指定描述的个体肘旨定值域的数据值例集) 是另一个属性的外延之子 类描述的外延) 集 与其他属性关系 全局基约束逻辑特征 等价:函数: 传递: o w l :e q u l v a l e n t p r o p e r t yo w l :f u n c t i o n a l p r o p e r t yo w l :t r a n s i t i v e p r o p e r t y 申叫两个属性的外延相同申明一个属性的任何实例的取申叫一个属性若主语一宾语对 逆: 值( 即宾语) 唯一 ( x ,y ) 和( m z ) 是它的两个实例,则 o w l :i n v e r s e o f 逆函数:( x ,z ) 也是它的实例 申明一个属性的定义域和值域 o w l :i n v e r s e f u n c t i o n a l 对称: j f 好是另一个属性的值域和定 p r o p e r t y o w l :s y n e t r i c p r o p e r t y 申l 州一个属性不存在两个实例, 义域 申明个属性若主语宾语对 它们的取值相同 ( x ,y ) 是它的实例,则( 弘x ) 也是它 的实例 定义 对象属性数据类型属性 构造子:。w l :o b j e c t p r o p e r t y构造予:o w l :d a t a 七y p e p r 。p e r t y 定义一个指定i d 的o w l 对象属性( r d f 属性 定义一个指定i d 的o w l 数据类型属性 的子类;数据娄型属性同) 表2 3o w l 语言属性构造子及其作用描述 个体( 工n d i v i d u a l ) 个体公理事实 个体的类隶属关系个体的属性值 个体的同一性 河海大学硕士学位论文语义门户嘲站本休查询技术研究 ( cr d f :i d = ”i ” 相同个体 申明个体工是类c 的一个 v构造子:o w l :s a m e a s 实例( 在此用交换语法) 申明两个个体是同一个体 不同个体 申明个体i 是类c 的一个实例,目它的 构造子:o w l :d i f f e r e n t f r o m 对象属性。的值是个体j ,它的数据类 申明两个个体是不周个体 型属性p 的值是矿( 具有数据类型d ) 两两不同 ( 在此用交换语法) 构造予:o w l :a l l d i f f e r e n t 申j 多个个体两两刁i 同 2 ) o w l 子语言 根据不同的应用目的和逻辑计算能力及约束的强弱0 w l 依次分为三类: o w ll i t e 易于实现,为用户提供了使用0 w l 最基本的功能子集,主要是面向工具 开发人员,满足他们一方面希望支持o w l ,另一方面希望从其相对简单的语言特性 子集,。f 始的需要: o w ld l 为用户提供具有恰当描述逻辑能力和计算能力的语言子集; o w l f u l l 为完全的o w l 语言,放宽了o w l d l 的些约束,使其描述逻辑能力更 强,而不必考虑可计算性。 3 1o w l 本体 0 w l 本体是使用o w l 语言来表示的w e b 本体。0 w l 本体中包含类、属性、个体 及本体元数据( 如本体作者、版本等) 等各种信息,这些信息通过o w l 语言所提供的 各种构造子来描述。在o w l 本体中“概念”称之为“类( c l a s s ) ”,“实例”称之为“个 体( i n d i v i d u a l ) ”。 2 3 语义门户网站本体查询技术 本体查询技术是语义门户网站的重要支撑技术。在语义门户网站的设计、开发和运 行等各个阶段,都需要对语义门户网站本体库中的本体提供各种必要的本体查询功能, 以满足不同类型用户的本体查询需求。 本体浏览功能在语义门户网站的设计和开发阶段,由于语义门户网站中包含数 量众多和规模庞大的本体,为了方便对这些本体的管理和使用,必须提供对本 体中具体信息的查询支持,以满足语义门户网站设计人员和开发人员对语义门 户网站本体库中本体具体信息的查 i 需求【3 ,这主要依靠本体浏览功能来实 现; 本体搜索功能语义门户网站的成员用户( m e m b e r s h i pu s e r ) 可以通过语义门户 9 河海大学硕= l 学位论义语义门户刚站本体查询技术研究 网站中所提供的信息项( i n f o m a t i o ni t e m ) 的创建和发布功能,创建和发布了 大量的信息。这些信息项被作为一个给定本体概念的实例归属到相应的本体中。 因此语义门户网站中必须提供对所发布的信息项,即本体库中本体实例信息的 查询支持,以满足语义门户网站成员用户对本体库中本体实例信息的访问需求 口4 1 ,这主要通过本体搜索功能来实现。 当前语义门户网站的学术努力和工业应用主要包括:m i n d s w a pp o r t a l 、s w w s p o r t a l 、e s p e m n t op o r t a l 、k a o np o n a l 、a i f bp o r t a l 、o n t o w e bp o r t a l 、v i s i o np o r t a l 、e m p o l i s k 4 2 、m o n d e c ai t m 等,如表2 4 所示。 表2 4 当前语义门户网站的学术努力和工业应用 名称研究机构人员 主页u r l m i n d s w a pp o r t a lm a r y l a n d 大学m i n d s w a p 小组h l t p :w w wm i n d s w a p o 呵 e u 资助项目s w w s ( 1 s t - 2 0 0 1 - 3 7 1 3 4 ) s w w sd o n a l h n p :s w w s s e m a n t i c w e b o r i s o c o 开发 e u 资助项目e s p e r o n t o ( i s t _ 2 0 叭一3 4 3 7 3 ) , e s p e r o n t op o r t a lh n p :w w w e s p e r o n t o n e t u p m 的本体小组开发 k a r l s r u h e 大学的a l f b 学院和信息技术研 k a o no o r t a l h t t p :m a o n s e m a n t i c w e b o 叫 究中心f z i l 研究开发 k a r l s r u h e 火学a i f b 学院,f z i 信息技术研 a i f bo o r t a i 究中心雨_ | o m o d r i s eg m b h 2 开发 h t t p :,w w w a i f b u n l - k a r l s n l h e d e e u 资助项目o n t o w e b ( i s t - 2 0 0 0 一2 9 2 4 3 ) 0 n t o w e bd o n a l h n p :w w w o n t o w c b o 吲 的一部分 v i s i o nd o r t a i e u 资助项目v i s i o nr o a d m a pp r o j e c th i t p :w w w k m v i s i o n o 唱 ( i s t - 2 0 0 2 - 3 8 5 l3 ) h t l p :w w f z i d “ 2h t 巾:w w w o n i o p “s e d e 河海大学硕士学位论文语义门户网站本体畚询技术研究 e m p o 】i sk 4 2 e m p 0 1 i s 公司开发 h n p :w w 、v _ e m p o l i s c o m m o n d e c aj t m m o n d e c a 公司开发 h t c d :w w 、m m o n d e c a c o m , 当前语义门户网站所提供的本体搜索和本体浏览等本体查询功能,与理想语义门户 网站中本体搜索和本体浏览的目标功能需求相比还有很大差距。当前语义门户网站本体 浏览和本体搜索技术的总结研究,如下表2 5 所示: 表2 5 现有语义门户网站本体浏览和本体搜索技术 本体浏览 语义门户网站 本体搜索 类信息属性信息个体信息本体元数据 浏览浏览浏览信息浏览 无 对门户网站中实例的查询仅 m i n d s w a pp o n a l提供了基于关键字的查询功 ( 只提供了对网页的r d f 标注供用户查看) 能 支持本体 s w w sd o r t a l、 中实例信 基丁关键字的搜索功能 息的浏览 根据用户对给定本体概 念属性值的详细说明查询本 体中实例信息 类层次所选类的 e s p e r o n t op o r t a l 关系浏 实例信息 、 ( 只支持对单个本体的搜 览浏览 索,而且所实现的本体搜索 功能无法正常运行,对输入 的许多查询不能提取相应的 实例) k a o nd o r t a i 基于关键字的查询功能 根据用户对给定本体概念属 支持本体性取值的说明,查询本体中 a i f bd o r t a l、 中实例信 实例信息( 限定了概念的属 息的浏览性及其取值集合,只支持本 体库中单本体的搜索) 河海人学坝:l 学位论文语义门户网站本体查询技术研究 类层次所选类的 o n c o 、v e bd o r t a l关系浏、实例信息 结合了本体搜索和基于 关键字的搜索功能 见 浏览 v i s i o nd 0 r t a i 类层次 所选类的 基于关键字的查询功能 关系浏 实例信息 见浏览 e m p 0 1 i sk 4 2类层次 、 所选类的 基于用户对信息项描述的文 关系浏实例信息本搜索( 3 4 】 览浏览 m o n d e c al t m 基于关键字的搜索3 4 i 在以上当前主要语义门户网站中,e s p e r o n t op o n a l l 、0 n f o w e b p o n a l 、e m p o l i s k 4 2 、 v i s i o nd o n a l 等语义门户网站虽然提供了本体浏览功能,但只支持对本体的类层次结构 以及本体中实例信息的浏览,并不能支持本体中属性信息以及本体元数据信息的浏览, 而且也没有提供对类的属性约束信息、不相交关系等类信息的浏览支持。 现有语义门户网站中所提供的搜索功能主要还是基于关键字的查询功能,如 m i n d s w a pp o n a l 、s w w sp o r t a i 、e m p o l i sk 4 2 等。当前大多数语义门户网站没有提供理 想语义门户网站所需的本体搜索功能,即根据用户对所选本体概念属性值的详细晚明查 询语义门户网站中所发布的信息项,即本体库中本体的实例信息。a i f bp o r t a l 和 e s p e m m op o r t a l 中虽然提供了本体搜索功能,但只能支持对单个本体中实例信息的搜索, 没有提供刘本体库中所有实例信息的查询支持,而且根据m i c h a e ls t o l l b e r g 等人在文献 3 4 】中的研究和评价,e s p e m n t op o r t a l 所提供的本体搜索功能对用户输入的许多查询不 能提取相应的实例。 2 4 现状与不足分析总结 理想语义门户网站本体查询原型工具的研究与实现,对构建基于语义w 曲技术的 下一代门户网站以及语义w e b 技术的研究和发展都具有重要的意义。根据以上对当前 语义门户网站本体搜索和本体浏览技术的分析总结,以及m i c h a e ls t 0 1 1 b e r g 等人对当前 语义门户网站的学术努力( 如:e s p e m n t op o r t a l f 2 7 】和o m o w e bp o r t a l i “j ) 和工业应用( 如: e m p o l i sk 4 2 【2 9 和m o n d e c ai t m 3 0 】) 的研究评价| :3 4 1 ,当前语义门户网站中所提供的本体 查询功能还很有限,大多数的语义门户网站没有提供理想语义门户网站所需的各种高级 本体查询功能,如:本体浏览( o n t o l o g yb r o w s i n g ) 、本体搜索( o n t o l o g ys e a r c h ) 和推 理驱动的查淘( i n f e r e n c e p o w e r e dq u e r y ) 。虽然少数语义门户网站中提供了对本体搜索 和本体浏览等本体查询功能的支持,但存在着许多不足,主要表现在:现有语义门户网 河海大学硕士学位论文语义门户咧站本体查询技术研究 站所提供的本体浏览功能仅能够支持对本体中类层次关系以及本体中实例信息的浏览, 并不能支持对本体中属性信息的浏览以及本体元数据信息的浏览;现有语义门户网站中 所提供的搜索功能主要还是基于关键字的查询功能,大多数语义门户网站没有提供理想 语义门户网站所需的本体搜索功能,即根据用户对所选本体概念属性值的详细描述,查 询语义门户网站中所发布的信息项,即语义门户网站本体库中本体的实例信息。虽然少 数语义门户网站提供了本体搜索功能,但大都只能支持对本体库中单个本体实例信息的 查询。 2 5 本章小结 本章对w e b 本体及其建模语言做了介绍,并通过对现有语义门户网站中本体查询 技术的分析和总结,指出了当前语义门户网站中所提供的本体搜索和本体浏览功能的不 足。 河海大学坝_ 。学位论文语义门户网站本体查询技术研究 第三章语义门户网站本体查询需求与0 q s 4 s w p 总体设计 3 1 概述 根掘对当前技术现状的分析与总结,现有语义门户网站所提供的本体查询功能还很 有限,对本体搜索和本体浏览等本体查询技术的支持存在许多不足。为了在语义门户网 站中提供完善的本体搜索和本体浏览等本体查询功能,需要对理想语义门户网站中本体 查询的功能需求进行分析和研究,并在此基础上,提出满足理想语义门户本体查询需求 的本体查询原型系统。 3 2 语义门户网站本体查询需求 3 2 1 理想语义门户网站 门户网站( w e bp o r t a l ) 是信息发布和交换的入口。语义w e b 技术的应用能够构建 出新一代的语义增强的门户网站语义门户网站( s e m a n t i c w e b p o n a l ) 。一个语义门 户网站的定义如下p j : 1 它是一个w e b 站点,它为有着有共同兴趣的用户群收集信息。 2 它是某个团体共享和交换信息的平台; 3 它是一个基于语义w e b 技术的门户网站。 根据m i c h a e ls t o l 【b e r g 等人2 0 0 4 年的权威综述吼当前的语义门户网站研究与开发 尚处于初级阶段,为勾画下一代语义门户网站的技术需求、评价当前语义门户网站的学 术努力和工业应用,他们从功能角度提出了一个语义门户网站的三层框架( f r a m e w o r k ) , 见图3 1 所示。 河海_ 人学硕士学位论文 语义门户网站本体查询技术研究 图3 1 语义门户网站三层框架( 功能视角) 在这个框架中; 基础技术层( g r o u n d i n gt e c h n o l o g i e s ) 包括系统技术和语义w 曲技术( 本体和语义 w e b 服务两个方面) ,是门户网站的技术构造块和底层支柱: 信息处理层( i n f o r m a t i o np r o c e s s i n g ) 是指门户网站的信息处理设施,涉及其中信 息项( i n f o r i n a t i o ni t e m ) 的五阶段处理生命周期和协作特性( c o l l a b o r a t i o nf e a t u r e s ) ( 如: 邮件、讨论论坛、信息项的多用户编辑) : 信息访问层( i n f o n n a t i o n a c c e s s ) 是用户界面,强调从用户角度来评价一个门户网 站,包括其可用性和信息质量。 在这三个层中,每一层都通过定义好的接口封装所有的功能供上层调用,上层不需 要理解下层每项功能的具体实现细节。其中本体技术是语义门户网站实现的核心部分, 本体的查询和管理是实现语义门户网站的重要支撑技术,也是保证语义门户网站长期可 用性的关键技术。 河海大学坝:卜学位沦文 语义门户网站本体查m 技

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论