(计算机软件与理论专业论文)基于owls的web服务发现框架研究.pdf_第1页
(计算机软件与理论专业论文)基于owls的web服务发现框架研究.pdf_第2页
(计算机软件与理论专业论文)基于owls的web服务发现框架研究.pdf_第3页
(计算机软件与理论专业论文)基于owls的web服务发现框架研究.pdf_第4页
(计算机软件与理论专业论文)基于owls的web服务发现框架研究.pdf_第5页
已阅读5页,还剩66页未读 继续免费阅读

(计算机软件与理论专业论文)基于owls的web服务发现框架研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

r e s e a r c ho nw e bs e r v i c ed i s c o v e r yf r a m e w o r kb a s e do n o w l s b y z h a oh a i t a o b e ( s h a a n x iu n i v e r s i t yo ft e c h n o l o g y ) 2 0 0 8 at h e s i ss u b m i t t e di np a r t i a ls a t i s f a c t i o no ft h e r e q u i r e m e n t sf o rt h ed e g r e eo f m a s t e ro fe n g i n e e r i n g c o m p u t e rs o f t w a r ea n dt h e o r y c h a n g s h au n i v e r s i t yo fs c i e n c e & t e c h n o l o g y s u p e r v i s o rp r o f e s s o r l o n gp e n g f e i m a r c h ,2 0 11 长沙理工大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究 所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包 含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出 重要贡献的个人和集体,均己在文中以明确方式标明。本人完全意识到 本声明的法律后果由本人承担。 作者签名:起靖崤 日期:沙1 1 年歹月加 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同 意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许 论文被查阅和借阅。本人授权长沙理工大学可以将本学位论文的全部或 部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制 首段保存和汇编本学位论文。 本学位论文属于 1 、保密口,在年解密后适用本授权书。 2 、不保密囤。 ( 请在以上相应方框内打t ,) 作者签名:赵圬墙日期:纱、- 够月咖日 导师签名: 日期:加f f 年r 月如 摘要 电子商务近年来的高速发展,对软件的可移植性和可集成性要求越来越高,w e b 服务作为分布式计算和w e b 应用模式的主流技术,为企业内部和企业之间异构系统之 间的互操作、互通信问题给出了有效的解决方案。但是,现有w e b 服务发现框架u d d i 是基于关键字查找的,既传统u d d i 查询不具有语义搜索能力。针对这一问题,如果将 语义网技术运用到w e b 服务中来,使w - e b 服务具有语义信息,那么在进行服务查询时 就可以利用语义推理对w e b 服务进行语义匹配。w e b 服务本体语言o w l s 是语义网和 w e b 服务相连接的桥梁,利用它可以对w e b 服务进行语义描述和推理,为服务的语义 匹配提供了条件。 本文通过对传统w e b 服务和语义网相关技术的分析,构建了以u d d i 为基础的基 于语义w e b 的服务分层匹配模型。第一层为服务领域匹配层,该层通过对服务所属的 应用领域进行匹配,淘汰不属于同一应用领域的服务:第二层是p e 匹配层,通过该层, 可以筛选掉不满足服务执行条件和执行后效果的服务;最后一层是i o 匹配层,淘汰语 义相似度低于指定阈值的服务。通过第一层和第二层筛选,减小了i o 匹配的工作量。 第三层匹配是整个匹配模型的核心,建立方法是:通过对已有的概念相似度算法的分析, 提出了一种基于几何距离和信息容量相结合的概念相似度匹配算法;为了寻找请求服务 和广告服务输入输出间的最佳匹配,将i o 匹配问题转化成指派问题,并提出了相应的 匈牙利指派算法。 最后使用m y e c l i p s e 6 0 、j d k 6 0 、一些开源的资源和软件以及德国人工智能研究中 心所开发的o w l s - - t c 2 的标准测试集,通过实验说明了本文提出的匹配算法是可行 的,能够实现比较准确的服务匹配。 关键词:w e b 服务;语义网;w e b 服务本体语言;语义w e b 服务发现框架;匹配算法 a b s t r a c t i nr e c e n ty e a r s ,晰t l lt h ed e v e l o p m e n to fe - c o m m e r c e ,t h er e q u i r e m e n to ft r a n s l a t i o n a b l e i sm o r ea n dm o r ei n t e g r a t a b l e w e bs e r v i c e sa st h em a i n s t r e a mt e c h m o l o g yo fd i s t r i b u t e d c o m p u t i n g a n dw e ba p p l i c a t i o n p r o v i d ea ne f f e c t i v es o l u t i o nf o rt h e p r o b l e m so f h e t e r o g e n e o u ss y s t e m si n t e r o p e r a b i l i t y , m u t u a lc o m m u n i c a t i o n h o w e v e r , t h ee x i s t i n gu d d i w e bs e r v i c ed i s c o v e r yf r a m e w o r ki sb a s e do nk e y w o r da r c h ,w h i c hm e a n st h a tt r a d i t i o n a l u d d iq u e r yd o e sn o th a v eas e m a n t i cs e a r c hc a p a b i l i t i e s t os o l v et h i sp r o b l e m , i fw e i n t r o d u c et h es e m a n t i cw e bt e c h n o l o g yi n t ow e bs e r v i c e s ,w h e nu s i n gt h i ss e r v i c e ,w ec o u l d u s es e m a n t i cr e a s o n i n gs e m a n t i cm a t c h i n go fw e bs e r v i c e s w e bs e r v i c e so n t o l o g yl a n g u a g e o w l - si st h eb r i d g eb e t w e e nt h es e m a n t i cw e ba n dt h ew e bs e r v i c e s o w l sc o u l dd e s c r i p e a n dr e a s o nw e bs e r v i c e s ,w h i c hp r o v i dc o n d i t i o n sf o rt h es e m a n t i cm a t c h i n g b a s e do nt h ea n a l y s i so ft h et r a d i t i o n a lw e bs e r v i c e sa n ds e m a n t i cw e b ,t h i sp a p e r c o n s t r u c t e dt h eu d d i b a s e ds e m a n t i cw b bs e r v i c e sm o d e lb a s e do nt h e h i e r a r c h i c a l m a t c h i n gm o d e l t h ef i r s tl a y e ri s s e r v i c e sm a t c h e dl a y e r , t h i s l a y e rm a t c h e st h e s e r v i c e s t h r o u g ht h ea p p l i c a t i o nf i e l d ,e l i m i n a t e st h es e r v i c e sn o tb e l o n gt ot h es a m ea p p l i c a t i o n s e r v i c e t h es e c o n dl a y e ri sp em a t c h i n gl a y e r , t h r o u g ht h i sl a y e r ,y o uc a nf i l t e ro u tt h e i m p l e m e n t a t i o nw h i c hd o e s n o tm e e tt h ec o n d i t i o n so fs e r v i c ea n di m p l e m e n t a t i o n e f f e c t i v e n e so fs e r v i c e s t h ef i n a ll a y e ri si om a t c h e dl a y e r ,w h i c hi sf i l t e rt h o s es e r v i c e s 、析t h as e m a n t i cs i m i l a r i t yb e l o wt h es p e c i f i e dv a l u eo ft h es e r v i c e t h r o u g hs c r e e n i n go ft h ef i r s t a n dt h es e c o n dl a y e r s ,r e d u c e dt h ei om a t c ht h ew o r k l o a d t h et 1 1 i r dl a y e ri st h ec o r eo ft h e m a t c h i n gm o d e l t h em e t h o do fe s t a b l i s h m e n ti s :b yt h r o u g ha n a l y s i so ft h ec o n c e p to f s i m i l a r i t ya l g o r i t h m s ,am a t c h i n ga l g o r i t h mw h i c hi sb a s e do ng e o m e t r i cd i s t a n c ea n dc o n c e p t o fi n f o r m a t i o nc o m b i n a t i o ns i m i l a r i t yi st ob ef o u n d ;t of m dt h eb e s tm a t c hb e t w e e ni n p u t a n do u t p u ti nr e q u e s t e ds e r v i c ea n da d v e r t i s i n gs e r v i c e s ,t h em a t c h i n gp r o b l e mh a sb e e n c o n v e r t e di n t ot h ei oa s s i g n m e n tp r o b l e m ,a n dp r o p o s e dt h eh u n g a r i a na s s i g n m e n t a l g o r i t h m f i n a l l y as t a n d a r dt e s t i sc o n d u c t e d b yu s i n gm y e c l i p s e 6 0 ,j d k 6 0 ,s o m e s o u r c e - o p e n i n gr e s o u r c e ss o f t w a r e sa n dt h eo w l s t c 2w h i c hi sd e v e l o p e db yt h eg e r m a n i i r e s e a r c hc e n t e rf o ra r t i f i c i a li n t e l l i g e n c e ,t h ee x p e r i m e n t si l l u s t r a t et h a tt h em a t c h i n g a l g o r i t h mi sf e a s i b l ea n d c a na c h i e v eam o r ep r e c i s em a t c h i n gs e r v i c e k e y w o r d s :w e bs e r v i c e s ;s e m a n t i cw e b ;o n t o l o g yw e bl a n g u a g ef o rs e r v i c e s ; s e m a n t i cu d d i ;m a t c h i n ga l g o r i t h m i u 目录 摘要i a b s t r a c t i i 第一章绪论 1 1 研究背景和意义1 1 2 国内外研究现状2 1 3 研究内容4 1 4 内容组织5 第二章语义w e b 服务相关技术 2 1w e b 服务概述6 2 2 语义网相关概念7 2 2 1 语义网7 2 2 2 本1 本8 2 2 3 本体描述语言o w l 概述1 0 2 3 统一描述发现和集成协议u d d i 1 3 2 4w e b 服务本体语言o w l s 15 2 5 本章总结1 6 第三章语义w e b 服务发现框架s e m u d d i 3 1 总体设计17 3 2 模块组成。l8 3 2 1 用户程序接口1 8 3 2 2 预处理模块1 9 3 2 3 服务匹配模块19 3 2 40 w l s u d d i 转换器一2 l 3 2 5 本体推理机2 3 3 3 执行流程设计2 3 3 3 1w 曲服务注册流程2 3 3 3 2w e b 服务查询流程2 3 3 4 本章总结。2 5 第四章基于匈牙利指派的w e b 服务匹配算法 4 1 概念相似度计算方法分析2 6 4 2 改进的概念相似度计算方法2 9 4 3 基于匈牙利指派的w e b 服务匹配算法3 3 4 3 1 匈牙利指派3 3 4 3 2 语义w e b 服务匹配算法3 4 4 4 本章总结。3 7 第五章语义w e b 服务发现实例研究 5 1 实验平台及工具3 8 5 2 测试实例3 8 5 3 实验结果3 9 5 4 匹配结果分析4 0 5 5 本章总结。4 2 第六章结论与展望 6 1 结 仑4 3 6 2 展望4 3 参考文献4 5 致j 射。4 8 附录a ( 攻读学位期间发表论文目录) 4 9 1 1 研究背景和意义 第一章绪论 随着电子商务近年来的高速发展,对软件的可移植性和可集成性要求越来越高,但 由于传统软件很少考虑这两方面因素,所以导致了“数据孤岛现象 即软件之间的互操 作性低,信息共享性有待提高。w | e b 服务是一种新型的远程访问标准和w e b 应用模式, 它在w e b 应用模型的基础上采用分布式计算模式很好的解决了企业之间以及企业内部 系统间的互通信和互操作问题。近年来随着软件模式的变更w e b 服务的应用也越来越广 泛,从b 2 c ( b u s i n e s st oc o n s u m e r ,商家对客户) 发展n b 2 b ( b u s i n e s st ob u s i n e s s , 企业对企业) ,由局部化发展到全球化,由集中式发展到分布式【l 】,这就要求系统支持平 台异构性和自治平等性。 w e bs e r v i c e 是一项新技术,最大的贡献在于使得不同硬件平台和不同开发工具所开 发的程序无须借助第三方硬件和软件就可以进行数据交互和集成【2 】,这一特点对企业之 间和企业内部异构系统的集成起到了很大的作用。w - e b 服务这一技术使软件开发模式由 o o p 转化为s o a ,用户直接面对的是形形色色的服务,如何对服务实施高效、准确的查 找是相当重要的,尤其在w 曲服务应用越来越广泛的趋势下,w 曲服务的数量急剧膨胀, 要得到满足用户需求的服务就如同大海捞针。在之前,w 曲服务是通过w s d l 进行描述 的,并可以直接映射到u d d i ( u n i v e r s a ld e s c r i p t i o nd i s c o v e r ya n di n t e g r a t i o n ,通用描述、 发现与集成服务) 注册中心完成服务的注册和发布。u d d i 数据结构中包含一组标准的 规范用来注册和发布w e b 服务。u d d i 的工作原理是基于关键字的查询,尽管查询方法 十分便捷,但查询结果不尽人意,在服务查准率和查全率等方面得不到满足。服务的查 询结果常常需要人工进行选择,大大降低了服务查询的自动化程度1 3 1 。u d d i 基于关键字 的查找机制存在以下缺陷: 1 ) 由于发布的广告服务缺乏语义支持,这就导致服务查询时只是基于关键字的查 询,对于服务同名异义和同义异名的情况查询准确率较低。 2 ) 对于查询结果得到的广告服务和请求服务的匹配度没有进行很好的量化,匹配 度应当在【0 ,1 1 区间连续分布的,而不应是离散的值。 目前,学术界越来越多组织和个人对w 曲服务的语义发现研究给予了极大关注,并 在服务匹配和发现方面做出了不少贡献。对用户的请求服务和服务注册中心的广告服务 和服务之间的关系通过本体进行语义标注,在此基础上采用本体描述语言o w l s 对服 务进行语义描述,应用基于本体推理和描述逻辑的相关知识从广告服务中发现满足用户 需求的服务成为当前研究支持语义w - e b 服务发布和查询机制的主要研究方向【4 】。有关语 义w r e b 服务匹配和发现研究,目前广泛采用的方法是先对w r e b 服务进行语义描述【5 】,如 使用o w l s 语言描述w 曲服务,再设计一个支持语义w 曲服务发布与查询的服务匹配机 制,将带有语义信息的广告服务发布到该机制上,通过相应匹配算法实现请求服务和广 告服务的匹配。 为了寻求一种对语义w 曲服务的注册与发布框架,目前学术界提出了两种解决方法 【6 】:一种是k i mc h r i s t e n s e n 等人认为传统u d d i 数据结构相对固定,扩展能力有限,提出 重新构建一个支持语义w 曲服务的注册中心( s e m u d d i ) 【,l ;另一种是p a o l u c c i 等提出 在传统u d d i 数据结构的基础上对其进行语义扩充【s 】。由于考虑到u d d i 通用性和与基于 关键字查询的兼容性,所以本文采纳第二种方法,对传统u d d i 数据结构进行扩展,并 提出一种基于匈牙利指派的语义w - e b 服务的服务匹配算法,以便提高w 曲服务发现的准 确率和高效性。 1 2 国内外研究现状 国内外专家和学者目前投入大量人力物力对语义w 曲服务进行研究,大力推动了语 义w e b 服务的发展。在语义w 曲服务的标准规范制定和理论实践当中作出了杰出贡献, 使w 曲服务从更加人性化的方向发展。 官方的研究组织包括: 1 ) w 3 c ( w o r l dw i d ew e bc o n s o r t i u m ,w 3 c 理事会或万维网联盟) ,该组织在语 义w e b 服务的发展过程当中一直起着至关重要的作用 9 1 ,w 3 c 专门致力于创建w e b 相关 技术标准并促进w e b 服务向更深、更广的方向发展。 2 ) d a m l ( d a p r a a g e n tm a r k u pl a n g u a g e ,美国国防高级设计研究署代理指标语 言) ,它是一种通过行为代理将智能内置在语言之内的技术,在描述对象和对象之间关 系的能力方面强于x m l ,可以作为建立语义网的一种语言和开发工具1 1 0 。 非官方的研究组织和个人有: 1 ) f r a n zb a a d e r 、l a nh o r r o c k s 和u l r i k es a t t l e r 三位来自英国曼彻斯特大学的学者提 出了在语义网本体推理过程中使用描述逻辑的思想。 2 ) 美国卡内基梅隆大学的m a s s i m op a o l u c c i 在其论文中提出种基于语义的w e b 2 服务匹配思想】,认为w r e b 服务的匹配有四种模式。为后来基于语义的w 曲服务的匹配 研究奠定了基础。 3 ) 美国纽约大学的a b r a h a mb e m s t e i n 和英国马萨诸塞州理工学院的m a r kk l e i n 禾l j 用过程本体论的思想,认为一个w 曲服务可以划分为一系列相互独立的过程,且上一个 过程的输出是下一个过程的输入,提出基于过程本体论的服务发现技术【1 2 l 。 4 ) m i k ed e w a r 和o l g ac a p r o t t i 等人运用o w l 语义规范和描述逻辑设计出了数学 w e b 服务匹配算法。它是由m o n e t 项目发展而来,使数学服务描述语言在o w l 的基础 上得以发展【1 3 1 。 发展到今天,语义w r e b 服务中本体规范主要有w s m o ( w e bs e r v i c em o d e l i n g o n t o l o g y ,w 曲服务模型本体) 、s w s o ( s e m a n t i cw e b s e r v i c e so n t o l o g y ,语义w 曲服务 本体) 、w s d l - s ( s e m a n t i cw e bs e r v i c ed e s c r i b el a n g u a g e ,语义w e b 服务描述语言) 和 o w l 。o w l s 是在o w l 基础上发展起来,它是基于w r e b 服务和语义网发展起来的, d a m l - s ( d a r p a a g e n tm a r k u pl a n g u a g ef o rs e r v i c e s ) 是它的前身,是由美国国防高 级设计研究署负责开发,其中支持的厂商有法国电信、t o s h i b a 、n o k i a 等。 目前,语义w 曲服务的研究有两方面热点,一是语义w 曲服务发现框架的研究与开 发,二是语义w r e b 服务组合算法的研究。语义万维网服务s w s i 是由d a r p a 和e u ( e u r o p e a nu n i o n ,欧盟) 资助开发的一个项目【1 4 1 ,目标是是开发一个支持语义的w e b 服务交互网络,在目前万维网中引入最新技术,使网络发挥其最大潜能,使广告服务和 请求服务的发布、注册、检索、匹配、组合等发面达到高自动化和高智能化。 在开发工具上,研究重点主要集中在本体编辑、本体库创建、w - e b 服务匹配和组合 等工具的开发。卡内基梅隆大学的软件智能实验室自主研发了一系列用于语义w r e b 服务 开发、部署和运行的工具i ”】。这些软件的核心组件是一个o w l s 虚拟机和一个w 曲服务 匹配器,前者通过对w 曲服务增加语义标注来进行语义描述,后者用来实现w 曲服务自 动语义匹配与发现。德国人工智能研究中心开发的o w l s m x 也能够实现w e b 服务的匹 配1 1 0 - 1 。另外,传统w 曲服务是w s d l 描述的而语义w 曲服务是通过o w l s 进行描述的, 所以要实现一个从w s d l 到o w l s 的转换工具,马里来大学开发的o w l sa p i 能够实现 该转换。本体编辑工具有本体编辑平台p r o t 6 9 6 、本体编辑器o w l - se d i t o r 。p r o t 6 9 6 e h 斯 坦福大学研发,o w l se d i t o r 由马耳他大学研发。 随着研究的深入,新的问题不断涌现出来,有待进一步解决的问题有: 1 ) 传统w e b 服务描述采用w s d l ,而语义w e b 服务描述目前主流语言有o w l s , 在服务发布过程中是先将o w l s 转化为w s d l 然后映射至u u d d i 还是对u d d i 进行数据 结构的扩充从o w l s 直接映射到u d d i 。 2 )由于目前w r e b 服务的三种描述与发现体系集中式模式、p 2 p 模式和混合式模式 的内部实现方式各不相同,w r e b 服务代理如何对这些体系组织和协调。 3 ) 服务匹配问题。目前语义w e b 服务匹配算法众多,但大都存在片面性的问题, 没有对本体层次树中概念相似度的影响因素进行完善考虑,计算公式缺乏严密的合理性 证明等因素,使得匹配结果不尽人意。 4 ) 服务匹配效率问题。虽然对w r e b 服务添加语义信息后,服务匹配的查准率和召 回率得到提高,但语义w 曲服务查询算法比较复杂,导致查询时间长,效率低下。 1 3 研究内容 在w e b 服务的研究过程中,服务的匹配的准确率和匹配质量直接影响着服务组合 的效率和合理性。为了解决传统u d d i 基于关键字查找的不足之处,本文利用o w l s 本体描述语言描述服务,并给出了一种在传统u d d i 注册中心基础上新建一层语义层的 s e m u d d i 服务注册架构。相比于基于关键字的服务查询来说,通过语义信息进行匹配 更能满足用户的潜在需求。 要实现语义w 曲服务注册与匹配中心,首先要考虑如何对w r e b 服务进行语义描述。 其次要考虑的问题是传统的u d d i 是基于自身的数据结构来对w e b 服务信息进行存储 的,如何在兼容传统u d d i 的前提下实现基于语义信息的服务匹配和查找这些都是本文 要重点研究的问题。 为了解决上述问题,本文进行了下述内容的研究: 1 ) 论文较全面地分析了w e b 服务及发现机制、语义w e b 和本体论的相关知识背 景,以及语义w e b 语言o w l o w l s 。探讨了语义w e b 在w e b 服务发现技术中的应用, 设计了一种基于o w l s u d d i 的语义w e b 服务发现框架,通过三层匹配结构提高了对 w | e b 服务查询效率。 2 ) 本文通过对概念相似度的研究,将i o 匹配问题转化成指派问题,提出相应的 匈牙利指派算法,寻找请求服务和广告服务输入输出间的最佳匹配,准确而高效地实现 服务匹配。最后通过具体事例说明了该算法的可行性。 4 1 4 内容组织 本文共分为五章,各章节结构和主要内容具体安排如下: 第一章绪论。主要介绍了本课题的研究背景和意义、国内外研究现状、本文所做 工作和结构安排。 第二章w e b 服务和语义网相关技术。介绍了w e b 服务的相关概念与技术,和语义 网的层次结构。对本体、传统u d d i 、w e b 服务本体描述语言o w l s 进行重点介绍。 第三章语义w e b 服务发现框架s e m u d d i 。给出了语义w e b 服务发现框架的详细 设计,对各模块技术和功能进行详细介绍。 第四章基于匈牙利指派的w e b 服务匹配算法。通过对概念相似度的研究,将w e b 服务i o 匹配转换成指派问题,给出基于匈牙利指派的i o 匹配算法。 第五章语义w e b 服务发现实例研究。通过实验证明匹配算法的可行性。 最后对本文所做工作进行总结,并指出其不足之处和下一步需要改进的地方。 第二章语义w e b 服务相关技术 2 1w e b 服务概述 w e b 服务是包含x m l 、s o a p 、w s d l 、u d d i 等一系列标准的组合,w e b 服务提 供了一个松散耦合的计算环境。如图2 1 所示,在面向服务的体系中共有服务提供者、 服务注册中心和服务请求者三个角色。 图2 1 面向服务的体系结构( s o a ) 各个角色的职能如下所示: 1 ) 服务提供者。在服务注册中心上发布自己的服务,并对服务请求进行响应。 2 ) 服务注册中心。注册已经发布的w e b 服务,并对其进行分类和查找搜索服务。 3 ) 服务请求者。通过服务注册中心查找需要的服务,然后绑定并使用服务。 三个角色之间的操作: 1 ) 发布。使得服务提供者能够向注册中心注册自己的功能和访问接口。 2 ) 查找。使得服务请求者可以在注册中心查找特定条件的服务。 3 ) 绑定。使得服务请求者能够真正使用服务提供者所提供的服务。 对于目前来说w e b 服务主要采用u d d i 来作为w e b 服务的发布和匹配框架【协一9 】, u d d i 是一组与平台无关的规范,是建立在s o a p 协议之上的。u d d i ( u n i v e r s a l d e s c r i p t i o nd i s c o v e r ya n di n t e g r a t i o n ) ,即统一描述、发布与集成协议,是一代基于互联 网的以w e b 服务为核心的电子商务技术标准。它包含一组基于w e b 的、分布式的、w e b 服务信息注册中心的实现标准,还包含一组访问协议的实现标准,使企业能够将自己提 供的w e bs e r v i c e s 注册到服务注册中心以便其他企业能够迅速的发现。u d d i 标准定义 了w e b 服务的注册发布与发现的方法,并大力提倡w e b 服务之间的互操作和互调用 2 0 l 。 6 2 2 语义网相关概念 2 2 1 语义网 语义网是对下一个网络的一个设想,它的目的是进行人机之间的智能交互,这种技 术是通过对信息赋予明确的含义使机器能对网络上的可用信息进行集成和处理。 简单地说,语义网是是一种能够使机器理解人类语言的智能网络,它不但能够解析 人类的语言,而且可以降低人与电脑之间交互的复杂度,使人和电脑之间的交互变得像 人与人之间交互一样轻松。 语义网的体系结构由b e r n e r s l e e 于2 0 0 0 年提出【:i 】,下面对此做个简单的介 绍。该体系结构由七个层次组成,从下层到上层各层功能逐渐增强。 第一层:u n i c o d e 和u r i 。u n i c o d e 是一个包含6 5 5 3 6 个字符的字符集【2 2 】,世 界上所有语言的字符基本上都包含在其中,字符表示方法采用双字节表示法。采 用u n i c o d e 作为数据格式的好处在于它几乎支持全世界的语言,有利于产品国际 化和跨语种检索。在该层中u n i c o d e 用于对资源进行编码。u r i ( u n i f o r mr e s o u r c e i d e n t i f i e r ,通用资源标识符) ,用于对网络上的一个资源或概念进行唯一性标识, 在该层中用于标识资源。该层是整个语义网七层结构的基础。 第二层:x m l + n s + x m ls c h e m a 。x m l 用于处理结构化文档信息,它集h t m l 的通用性和s g m l ( s t a n d a r dg e n e r a l i z e dm a r k u pl a n g u a g e ,标准通用标记语言) 的强大功能性于一身,它无需对结构含义进行任何说明,允许用户在文档中任意 的加入结构。命名空间n s ( n a m es p a c e ) ,通过u r i 索引确定,目的是为了避免字 符二异性,即不同命名空间下允许出下相同字符但表示含义不同。x m ls c h e m a 和d t d ( d o c u m e n tt y p ed e f i n i t i o n ,文档类型定义) 功能相同,它本身是基于x m l 的,但灵活度要比d t d 更高,且包含了更多的数据类型,能为x m l 文档提供数 据校验机制更好地支持有效的x m l 文档。x m l 本身结构灵活,n s 可以防止命名 冲突,x m ls c h e m a 提供对x m l 文档中的标记进行定义和有效性检测。通过这三 种机制能使信息的表现形式、数据结构和内容相分离。 第三层:r d f + r d fs c h e m a 。r d f 的主要作用是对w w w 上的信息资源进行 描述,并构造一个供使用不同标准描述的元数据共存的框架。该框架利用各种元 数据在不同应用领域的优势,实现w e b 数据的交换和再利用。r d f 要解决的问题 是如何通过x m l 标准语法对资源对象无二义性地描述,从而使所描述资源的元数 7 据信息能够被机器所理解。可以说x m l 提供了元数据的语法规范标准,而r d f 提供了元数据的语义规范标准。r d fs c h e m a 支持用户自定义词汇来对资源进行描 述,和r d f 的区别就像x m l 与h t m l 一样。该层的主要作用是从语义上描述 资源和资源之间的关系。 第四层:o n t o l o g yv o c a b u l a r y 。该层的作用是利用应用领域的知识对资源词汇 表进行扩展,是基于r d f ( s ) 基础上对概念及其关系进行抽象描述。用户通过该层 可以完成对概念和概念间关系的定义【2 3 1 。 第五到七层:l o g i c 、p r o o f 、t r u s t 。l o g i c 层给定了一些公理和推理规则,即 l o g i c 一旦建立,便可以利用给定的公理对资源的正确性、有效性和资源之间关系 的合理性进行推理和验证。p r o o f 层的作用是对语义网的输出结果进行可靠度和用 户满足度测试。 2 2 2 本体 o n t o l o g y 来源于哲学领域,1 9 世纪末,人工智能得到高速发展 2 4 , 2 s 】,人们将本体这 一个概念引入到人工智能界并赋予了新的含义。随着人们对本体理解的不断深入,本体 的定义也越来越完善和严密。表2 1 是几个比较有代表性的定义。 表2 1 本体定义表 领域提出的人和时间定义 不详对事物本质的抽象,并给出一个系统的解 哲学 释和说明 n e c h e s 等在1 9 9 1 年提出定义相关领域的术语和关系,利用这些术 语和关系描述领域外延 计算机 g r u b e r 在1 9 9 3 年提出 对概念模型明确而规范的说明 b o r s t 在1 9 9 7 年提出共享概念模型的形式化规范说明 s t u d e r 在1 9 9 8 年提出共享概念模型的明确的形式化规范说明 通过最后一个定义,可以看出本体的四层含义: 1 ) 概念模型。对客观世界中的事物、事物之间关系、事物所具有的属性进行抽象 所得到的模型。 2 ) 明确。概念的定义和使用都有明确的规范。 3 ) 形式化。概念是机器可理解和解释的。 8 4 ) 共享。概念所表达的信息是领域内共同认可的,是确定无异义的。从而不同角 色可以共享信息。 本体设计的目的是确定该领域内共同认可的词汇,捕获相关领域的知识,提供对该 领域知识的共同理解,并对这些词汇和词汇之间的关系给予形式化定义t 2 6 1 。对象类别以 及相互间关系的定义可以通过p e r e z 等人通过归纳得出的五个基本的建模原语来实现 【 - 2 9 ,实体问关系表达有对子类的继承及类别的赋值。 1 ) 类或概念:具有某些相同属性和行为的事物集合。一般采用框架形式来定义, 包括类名、类的描述信息和类与类之间关系的集合。其实例是对象。 2 ) 关系:类与类之间的关系采用n 维笛卡尔积子集的形式来定义,即: r :c l c 2 x c 。如语义上对象元组的集合对应于子类关系( s u b c l a s s o f ) 。 3 ) 函数:第n 个元素的值可以由给定的力一1 个输入元素唯一的确定,即 f :c lx c 2x x c 加l 专c 。如i d e n t i t y - c a r d - o f 就是一个函数,i d e m i t y c a r d o f ( x ,y ) 表示y 是x 的绿卡。 4 ) 公理:代表永真断言,如地球围着太阳转。 5 ) 实例:类型的具体化叫做实例。 如表2 2 所示,概念之间存在四种基本关系。 表2 2 本体之间关系列表 关系类型含义 p a r t - o f 概念a 是概念b 的一部分。如脑干是大脑的一部分 k i n d o f 概念a 继承于概念b 。如人继承于哺育动物 i n s t a n c e - o f 概念a 是概念b 的实例。如歼2 0 是飞机的一个实例 a t t r i b u t e o f 概念a 是概念b 的一个属性。如“排量”是汽车的一个 属性 本体的推理方法是基于分类的基础上通过一定的逻辑联系去推断出一些潜在的关 系。例如,张三是小明的爷爷,李四是小明的奶奶,那么可以推断出张三和李四是夫妻 关系。本体的设计目的是为了改善传统知识系统没有充分利用已有知识系统的缺点,实 现在不同开发平台和工具间信息的互通信和互操作,从而大量节省人力物力。 从语义网的角度讲,本体是对领域内共享信息的一个详细描述【。本体是在一个专 业领域或知识的共同理解和公认的基础上来对特定领域的术语进行专业定义,因此应用 领域之间可以通过一个共同的术语互相联系,而资源也可以被唯一的标识和描述。本体 9 一旦被定义后,服务或资源就能够使用它来做语义标注,从而为语义查找提供方便。 从应用领域讲,本体就是应用利用中的基本元素,它本身是应用领域中的一个基本 术语,可以构成其他复杂的术语和关系。从表现形式来讲,本体是应用领域中概念的表 现形式,即概念的显示表示。一个本体o 从形式上可以定义为一个五元组,o := ( v , f ,c ,h ,r o o t ) ,其中v 是一个词汇集合,c 是一个概念集合,f 为一个转换函数。f 用来实现词汇集v 到概念集c 的映射,这种映射是一个多对多的关系,即一个概念中 可以出现多个词汇,一个词汇也可以出现在多个概念中。h 是本体树中的层次关系 日c x c ,h ( c l ,c 2 ) 表示c 2 是c l 的父概念,h 是有向性、传递性、自反性、无环 性,设r o o t 是本体树的根节点,v c c ,h ( c ,r o o t ) 成立,即概念树中其它节点都 是根节点的子节点,且概念树中根节点的数目为一。 2 2 3 本体描述语言o w l 概述 o w l ( w e bo n t o l o g yl a n g u a g e ) 可以对词汇表中词汇( t e r m ) 及其关系进行无二 义性描述,利用o w l 描述的词汇可以形成可读性强和用户可处理的文档。词汇与词汇 之间的关系就叫做本体。o w l 提供了非常强大的语义表达机制,表达能力不再局限于 机器可读的网上文件,它的表达能力远远超越了x m l 、r d f 和r d f

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论