已阅读5页,还剩49页未读, 继续免费阅读
(计算机软件与理论专业论文)基于agent技术的语义web服务发现研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于a g e n t 技术的语义w e b 服务发现研究 摘要 随着w e b 服务量的急剧增长,如何从庞大的服务群中高效地找到所需功能 的w e b 服务以及如何在功能相似的w e b 服务中找到最佳服务成为了值得关心 的问题,而这些正是w e b 服务发现的任务。然而,传统的服务发现技术是建立 在语法描述的基础上,主要采用的服务发现机制是w s d l 和u d d i 规范相结合 的解决方案,通过关键词匹配来实现的。这样的w e b 服务发现技术,由于缺乏 对w e b 服务的语义信息的描述,智能化程度不高,导致查准率和查全率低下, 已经很难满足人们日益增长的需求。要得到更好的结果,需要更高效、更完善 的w e b 服务发现技术来支持。 目前,基于语义的w e b 服务发现已经成为了当前的研究热点。在此背景下, 本文所做的研究如下: ( 1 ) 论文比较全面地介绍了w e b 服务、语义w e b 、a g e n t 技术等相关知 识,以及它们的目前发展状况。 ( 2 ) 通过对传统的w e b 服务发现技术的描述、比较及分析,指出它们的 不足,在此基础上,提出引入a g e n t 技术和语义w e b ,将它们应用到w e b 服务 发现中。 ( 3 ) 结合目前的两个理论成果:智能w e b 查询引擎和p a o l u c c i 提出的 o w l s u d d im a t c h m a k e r 匹配算法,提出了一种新的w e b 服务发现模型一一 基于a g e n t 技术的w e b 服务发现模型。该模型在服务描述方面,使用语义w e b 服务标识语言( o w l s ) ,对w s d l 和u d d i 规范进行了扩充,弥补二者在语 义方面的不足;同时在实现w e b 服务查找的过程中,采用a g e n t 技术,提出用 户a g e n t ( u a ) 和语义检索a g e n t ( s p a ) ,它们能更好地理解用户,并充分 地理解并提取服务中的语义信息,最后实现w e b 服务的语义化查找。 ( 4 ) 对a s w sm a t c h m a k e r 系统进行进一步的分析、设计与实现,最后通 过实验说明,该系统不仅能提高w e b 服务发现的查准率,还能更好地满足用户 的个性化需求。 总之,本文在目前的w e b 服务发现研究的基础上,提出了基于a g e n t 技术 的w e b 服务发现模型,通过使用a g e n t 技术和语义w e b 相关的技术,使得该 模型在一定程度上很好地实现了w e b 服务发现的语义化和智能化。 算法 关键词:w e b 服务,语义w e b ,a g e n t 技术,智能w e b 查询引擎,匹配 t h e d i s c o v e r yo fs e m a n t i cw e b s e r v i c eb a s e do na g e n t t e c h n o l o g y a b s t r a c t w i t ht h ei n c r e a s i n gn u m b e ro fw e bs e r v i c e s h o wt of i n dt h er e q u i r e ds e r v i c e s e m c i e n t l yo rh o wt og a i nt h eb e s ts e r v i c ef r o mt h ev a s ts e r v i c es e t sb e c o m e sa n i m p o r t a n tp r o b l e m t h a ti st h et a s ko fw e bs e r v i c ed i s c o v e r y h o w e v e r t r a d i t i o n a l s e r v i c ed i s c o v e r yt e c h n i q u ei sb a s e do ng r a m m a rd e s c r i p t i o n ,u s e st h em e t h o do f c o m b i n i n gu d d ia n dw s d l a n df i n d st h es e r v i c eb yk e yw o r d s b e c a u s eo f l a c k i n go fs e m a n t i ci n f o r m a t i o nd e s c r i p t i o n ,t h i sw e bs e r v i c ed i s c o v e r ym a k e sf o r l o wr e c a l lr a t i oa n dp r e c i s i o nr a t i ow h i c hc a n ts a t i s f yu s e r s t oo b t a i nb e t t e rr e s u l t m o r ee f f i c i e n ta n db e t t e rw e bs e r v i c ed i s c o v e r yt e c h n i q u ei sr e q u i r e d n o wt h ew e bs e r v i c ed i s c o v e r yb a s e do ns e m a n t i ch a sb e c o m et h et o po f r e s e a r c h s ot h em a i nr e s e a r c ht h a tt h et h e s i sh a sd o n ea sf o l l o w s : f i r s t l y ,t h et h e s i si n t r o d u c e st h ek n o w l e d g ea b o u tw e bs e r v i c e ,s e m a n t i cw e b , a n da g e n tt e c h n o l o g y ,i n c l u d i n gt h e i rl a t e s tp r o g r e s s s e c o n d l y ,b yd e s c r i b i n g ,c o m p a r i n g ,a n da n a l y z i n gt h et r a d i t i o n a lw e b s e r v i c ed i s c o v e r yt e c h n i q u e ,t h ed i s a d v a n t a g eo ft r a d i t i o n a lm e t h o d si si n d i c a t e d t h e nt h et h e s i sp u t sf o r w a r dt oa p p l ya g e n tt e c h n o l o g ya n ds e m a n t i cw e bt ow e b s e r v i c ed i s c o v e r y t h i r d l y c o m b i n i n gt w op r e s e n tt h e o r i e st h a ts m a r tw e bq u e r ye n g i n ea n d o w l - s u d d im a t c h m a k e ra l g o r i t h m w ep r e s e n t sam o d e lf o rs e m a n t i cw e b s e r v i c ed i s c o v e r yb a s e do na g e n tt e c h n o l o g y t h em o d e lu s e sw e bs e r v i c e o n t o l o g yl a n g u a g e ( o w l - s 、t od e s c r i b e s e r v i c e si no r d e rt om a k eu pt h e d i s a d v a n t a g eo fw s d la n du d d i a n di ta l s ou s e sa g e n tt e c h n o l o g yt ok n o wu s e r s b e t t e r ,a n de l i c i tt h es e m a n t i ci n f o r m a t i o nf u l l yf r o ms e r v i c ed e s c r i p t i o n ,s oi tc a n i m p l e m e n tt h ew e b s e r v i c es e a r c ho ns e m a n t i c s f o u r t h l y ,d of u r t h e ra n a l y s e ,d e s i g na n di m p l e m e n tf o ra s w sm a t c h m a k e r , a n dt h ee x p e r i m e n tc a np r o v et h a tt h i sm o d e ln o to n l yi m p r o v e st h ea c c u r a c yo f w e bs e r v i c e sd i s c o v e r y b u ta l s om e e t st h ep e r s o n a l i z e dr e q u i r e m e n to fu s e r s i na l l ,o nt h eb a s i so fp r e s e n tw e bs e r v i c ed i s c o v e r yr e s e a r c h ,w eg i v et h e m o d e lf o rs e m a n t i cw e bs e r v i c ed i s c o v e r yb a s e do na g e n tt e c h n o l o g y b yu s i n g a g e n tt e c h n o l o g ya n ds e m a n t i cw e bt e c h n o l o g y t h i sm o d e lt os o m ee x t e n t a c h i e v e si n t e l l i g e n t i z ea n ds e m a n t i z a t i o no fw e bs e r v i c ed i s c o v e r y k e y w o r d s :w e bs e r v i c e ;s e m a n t i cw e b ;a g e n t ;s m a r tw e bq u e r y ; m a t c h m a k i n ga l g o r i t h m h 插图清单 图1 1w e b 服务体系结构2 图1 2w e b 服务协议栈2 图1 3 语义w e b 体系结构。4 图2 1 基于w e b 的本体描述语言的相互关系8 图2 2u m l 注释1 3 图2 3o w l - s 的上层结构1 4 图2 4 机票预订服务的顶层本体1 5 图2 5r e s e r v a t i o np r o c e s s 过程图1 6 图3 1 基于u d d i 的服务发现架构一1 9 图3 2 语义w e b 服务发现机制2 l 图3 3o w l - s 服务轮廓本体2 3 图3 4 智能w e b 查询引擎结构2 5 图3 5 语义分类树实例2 6 图3 6 匹配算法中匹配等级的描述2 6 图3 7 语义w e b 服务发现模型2 7 图3 8f i n a n c e 本体库的一部分2 9 图3 9i n v e s t m e n t s e l l i n g s e r v i c e 服务轮廓信息2 9 图4 1u a 的u m l 图3 2 图4 2f i n a n c i a li n v e s t m e n t 本体的一部分3 7 图4 3b o n d s o n l i n e s e r v i c e 服务轮廓信息的一部分3 7 图4 4 系统中使用工具的关系。3 8 图4 5f i n a n c i a li n v e s t m e n t s 本体3 9 图4 6 用户输入关键字个数。3 9 图4 7 用户输入关键字“b o n d ”。4 0 图4 8s r a 为术语“b o n d ”查找相关的本体4 0 图4 9s p a 对术语“b o n d ”语义扩展。4 l 图4 1 0b o n d s o n l i n e s e r v i e e 的输入输出信息4 2 图4 1 1 用户服务请求的输入输出信息。4 2 图4 1 2 用户输入参数的页面4 3 表3 1 传统w e b 服务发现技术比较。2 0 v l 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所 知,除了文中特别加以标志和致谢的地方外,论文中不包含其他入已经发表或撰写过的研究成果, 也不包含为获得盒日= 些太堂或其他教育机构的学位或证书而使用过的材料。与我一同工作 的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意。 学位论文作者签字:,方芳签字日期:加刁年g 月馏日 学位论文版权使用授权书 本学位论文作者完全了解盒胆工些盘堂有关保留、使用学位论文的规定,有权保留并向 国家有关部门或机构送交论文的复印件和磁盘,允许论文被杏阅或借阅。本人授权金月b 王些厶 ! l 可以将学位论文的全部或部分论文内容编入有关数据库进行检索,可以采用影印、缩印或扫 描等复制手段保存、汇编学位论文。 ( 保密的学能论文在解密后适用本授权书) 学位论文者签名 盲芳 签字日期:矽呷年月昭日 学位论文作者毕业后去向 工作单位: 通讯地址: 导师签名 签字眺。尹铷日 电话 邮编 致谢 论文是在导师王浩教授的悉心指导和亲切关怀下完成的,论文的每一阶段 都倾注了王老师的大量心血。在此,谨表示诚挚的敬意和衷心的感谢! 王老师充沛的精力、敏捷的思维、卓越的学识、严谨求实的治学态度以及 诲人不倦的工作作风,给我留下了深刻的印象及启迪。导师的循循善诱、谆谆 教导使我领略了在知识的海洋中邀游的乐趣,使我的知识和技能水平都得到了 很大提高,并将激励我、使我终生受益! 感谢计算机学院的胡学钢老师、王新生老师、徐静老师等,正是他们在这 三年的时间里对我的谆谆教诲和无私帮助,才使我得以顺利完成学业;感谢研 究生部、学科学位建设处的各位老师在办理答辩手续时所给予的帮助。 感谢实验室的每一位老师和同学,特别感谢姚宏亮老师、方宝富老师、张 以文师兄、高建清师兄,还有与我朝夕相处的同学一一甘杨兰、程涛、陈栋梁、 王君、汪洪、刘杨、王锋、俞奎等同学,感谢他们对我学业上的无私的指导和 帮助! 感谢研究生十班的每一位同学,3 年来我们共同创造了轻松、活泼的学习 环境,生活上我们互相关照。衷心希望毕业后我们依然如前,友情永存! 最后,我要向我的父母表示最深的感谢,无论我做什么选择,他们总是一 如既往的支持我! 他们殷切的目光永远是我前进最大的动力! 在此,向我的父 母致以崇高的敬意! 同时,我要感谢我的朋友戴莉,潘苗苗,叶春明,没有他 们的支持和鼓励,也就没有我今天取得的成绩。在论文顺利完成之际,希望能 和他们一起分享其中的喜悦。 衷心的感谢所有关心和帮助过我的人们。 i i 作者:方芳 2 0 0 7 年5 月 1 1 课题背景与意义 第一章绪论 随着i n t e r n e t 的发展,基于w e b 应用的数量以惊人的速度增长。然而,由 于各个组织、机构之间平台的互异性,分布式网络面临的一个重大问题是各种 平台之间的互操作性太差。w e b 服务的出现,很好地解决了这个问题。 w e bs e r v i c e s 是建立可互操作的分布式应用程序的新平台,具有良好的开 放性。随着技术走向成熟,近年来,w e bs e r v i c e s 在分布式计算、电子商务等 领域具有广泛地应用。 w e b 服务通过w w w 建立应用程序之间的松散耦合,它用x m l 语言描述 每个服务接口,并用标准x m l 信息进行通讯。当前发布和查找服务的技术 ( w s d l ,u d d i ) 主要依靠服务接口的静态描述,要求使用者在设计时找到并 绑定服务。因此,在执行w e b 服务的过程中需要人的大量参与,不能实现智能 化。随着w e b 服务的数目急剧增多,w e b 服务实现技术效率低下,它们已经不 能满足应用的需求,因而实现w e b 服务的智能化显得越来越重要。所谓的智能 化,就是实现w e b 服务的自动发现、自动调用和自动组合,也就是实现机器可 理解的w e b 服务,解决方法是需要在w e b 服务中加入语义信息。 语义w e b 服务( s w s ) 就是在此背景中提出的,它是在现有的w e b 服务 标准之上,融入语义w e b 技术,采用一种无二义性的计算机能解释的语言描述 w e b 服务的性能和内容,因而提高了现存任务的质量和健壮性。 1 2 语义w e b 服务 1 2 1w e b 服务 w e b 服务定义了应用程序如何在w e b 上实现互操作,我们可以用任何语 言,在任何平台上编写所需要的w e b 服务。 关于w e b 服务,有以下定义l lj : ( 1 ) 自包含的、模块化的应用程序,它可以在网络中被描述、发布、查找 以及调用。 ( 2 ) 基于网络的、分布式的模块化组件,它执行特定的任务,遵守具体的 技术规范,因而能与其他兼容的组件进行互操作。 ( 3 ) 由企业发布的能完成其特别业务需求的在线应用服务,其他企业和应 用软件能够通过i n t e r n e t 访问来使用这些应用服务。 w e bs e r v i c e s 体系结构基于三种角色( 即服务提供者、服务注册中心和服 务请求者) 之间的交互。交互涉及发布、查找和绑定操作,这些角色和操作一 起作用于w e bs e r v i c e s 组件,即w e bs e r v i c e s 软件模块及其描述。在典型情况 下,服务提供者可通过网络访问的软件模块,定义w e bs e r v i c e s 的服务描述并 把它发布到服务注册中心;服务请求者使用查找操作来从服务注册中心检索服 务描述,然后使用服务描述与服务提供者进行绑定并调用w e bs e r v i c e s 实现或 与它交互。图1 1 显示w e bs e r v i c e s 的体系结构一一面向服务的体系结构 ( s o a ) 。 s o a 结构中共有三种角色: ( 1 ) 服务提供者:发布自己的服务,并且对服务请求进行响应。 ( 2 ) 服务注册中心:注册已经发布的w e bs e r v i c e s ,对其进行分类,并提 供搜索服务。 ( 3 ) 服务请求者:利用服务注册中心查找所需的服务,然后使用该服务。 图1 1 w e b 服务体系结构 执行发布、发现和绑定这三个操作,必须有一个包含每一层标准的w e b s e r v i c e s 协议栈。图1 2 显示了一个概念性w e bs e r v i c e s 协议栈。 u d d i u d d l w s d l s c i a p h t r p ,f t p 。e m a i l , m q ,l l o p 等 l服务发现 l l服务发布 服务描述 基于x m l 的消息传递 网络 图i 2 w e b 服务协议栈 w e bs e r v i c e s 平台主要采用了四个技术: x m l ( 可扩展的标记语言) 是w e bs e r v i c e s 平台中表示数据的基本格式, 它解决了数据表示的问题,但它没有定义怎样扩展这套数据类型。而w 3 c 制 2 定的x m ls c h e m a 就是专门解决这个问题的一套标准,它定义了一套标准的数 据类型,并给出了一种语言来扩展这套数据类型,w e bs e r v i c e s 平台就是用x m l s c h e m a 作为其数据类型系统的。 s o a p ( 简单对象访问协议) 提供了标准的r p c 方法来调用w e bs e r v i c e s 。 s o a p 规范中定义了s o a p 消息的格式,以及怎样通过h t t p 协议来使用s o a p , s o a p 基于x m l 语言和x s d 标准,其中x m l 是s o a p 的数据编码方式。 w s d l ( w e b 服务描述语言) 是一种基于x m l 的用于描述w e bs e r v i c e s 及其操作、参数和返回值的语言。因为是基于x m l 的,所以w s d l 既是机器 可阅读的,又是人可阅读的,这是一个优点。一些最新的开发工具既能根据 w e bs e r v i c e s 来生成w s d l 文档,又能通过导入w s d l 文档,生成调用相应 w e bs e r v i c e s 的代码。 u d d i ( 统一描述、发现和集成) 是由a r i b a 、i b m 、微软等公司倡导的, 其目的是在网上自动查找w e bs e r v i c e s 。u d d i 包含白页( 地址和联系人) 、 黄页( 行业分类) 和绿页( 服务描述) 。一旦w e bs e r v i c e s 注册到u d d i ,客 户就可以很方便地查找和定位到所需要的w e bs e r v i c e s 。 1 2 2 语义w e b w w w 目前只能通过人工浏览w e b 信息才能获得相应的服务。为了在w e b 上提供自动的、智能化的服务,机器必须要能理解它所处理的数据、消息和过程 的含义。语义w e b 的提出就是使w e b 信息能被机器理解的一种构想,是对当 前w w w 的一种扩展,其中的信息被赋予明确定义的含义,使机器和人能够更 好地协同工作。有了语义w e b 技术和相关的开发工具,就可以用一种机器可处 理的方式来表达w e b 信息的含义,从而为实现智能化网络服务和应用奠定基 础。 语义w e b 是由t i mb e r n e r s - l e e 提出的,它为有逻辑内涵的w e b 内容提供 语义结构及相应的信息访问和集成机制,从而为构建一个能够按需集成各种信 息、完成特定任务的信息管理系统奠定基础。 语义w e b 不同于现在的万维网,它是现有万维网的扩展与延伸。与现有的 万维网相比,语义w e b 不是面向文档,而是面向文档所表示的数据,语义w e b 将更便于计算机“理解与处理”,并将具有一定的判断、推理能力。 t i mb e r n e r s l e e 首次给出了语义w e b 基本构架,它是一个功能逐层增强的 层次化结构1 2 j 3 1 ,下层向上层提供支持,其结构如图1 3 所示。 图1 3 语义w e b 体系结构 语义w e b 体系结构包括七层,u r i ( 统一资源标识符) 和u n i c o d e 层是标 识s e m a n t i cw e b 对象和使用国际字符集的基本手段。x m l 层以及名字空间和 s c h e m a 定义是集成s e m a n t i cw e b 定义与其它基于x m l 的标准的基础。r d f ( 资源描述框架) 和r d fs c h e m a 用来描述和定义由u r i s 引用的对象及词汇, 并指定资源和链接的类型。o n t o l o g y ( 本体) 层用来定义不同概念之间的关系, 以支持词汇的演化。规则层定义通过已有信息导出新信息的规则,逻辑框架层 为基于规则的系统提供一个描述公理的框架,证明层执行规则并做出相应的评 估,信任层为应用程序是否信任一个给定的证明提供检测机制,数字签名和加 密技术用来检测文档的改动情况,是增强w e b 信任的手段【4 j 。 在整个语义w e b 体系结构中,核心层为x m l 、r d f ( s ) 和o n t o l o g y 。r d f ( s ) 虽然能够定义对象的属性和类,并且还提供了泛化等简单语义,但它不能明确 表达描述属性或类术语的含义及术语间的关系。本体层就是要提供一个能明确 并形式化地定义术语含义及术语间关系的语言。通过本体定义语义,使机器能 够理解数据的语义,能够进行互操作,从而达到语义w e b 的数据是机器可理解 的要求。o n t o l o g y 将在下一章作详细介绍。 1 2 3 语义w e b 服务 语义w e b 技术增强了计算机对网络信息的理解能力与互操作能力,w e b 服务则能够将分布式的网络信息集合转交为分布式的服务集合。很自然地,将 二者结合起来的语义w e b 服务,既可以使网络面向服务,又可以使网络具有机 器可以理解的语义,使网络的功能大大增强。可以认为,语义w e b 服务是w e b 服务的语义扩展,同时又是语义网面向程序的扩展p 儿“。 与传统的w e b 服务体系结构相比,语义w e b 服务体系结构增加了对语义 的支持,语义主要体现在【7 j : ( 1 ) 增强的u d d i ,重新组织u d d i 的数据结构以容纳语义信息: 4 ( 2 ) 服务提供方采用注释过的w s d l 文件,它包含关于服务的语义信息; ( 3 ) 服务请求方采用服务模板,进行语义增强的发现查询( d i s c o v e r y q u e r i e s ) 在语义w e b 服务中,语义可以分为以下类型:功能语义、数据语义、q o s 服务质量语义和执行语义。这些不同类型的语义可以用来表示w e b 服务的能 力、需求、结果和执行 1 3 a g e n t 技术 a g e n t 的研究起源于人工智能领域。a g e n t 是指模拟人类行为与关系,具有 一定智能并能够自主运行和提供相应服务的程序【摹l 。 a g e n t 具有以下几种智能化特征p 】: ( i ) 自治性:a g e n t 不需要人或系统的干预就可以自主运行,能够主动地 采取行动以实现自己的目标,对自身行为和内部状态具有控制权。 ( 2 ) 感知性:a g e n t 能够感知周围环境的变化,并能依据自己的知识和决 策做出适当反应。 ( 3 ) 社会性:a g e n t 之间能够进行高层次通讯,共享所持有的知识,组成 一个有机的整体,为用户完成复杂的任务。 ( 4 ) 能动性:a g e n t 不是简单的响应环境的变化,而是能够根据知识库做 出基于目标的决策。 在语义标注w e b 服务的环境里,用户为了完成某个任务可以借助于智能 a g e n t 。这些a g e n t 可以自动识别w e b 服务,根据需要还可以动态组合w e b 服 务以完成用户的目标,所有这些工作都可以在没有用户参与的情况下完成1 1 0 。 语义w e b 服务采用基于w e b 本体语言的服务描述本体( o w l s ) 作为w e b 服务的标记模型,它为机器提供可以解释的、精确的关于w e b 服务属性和能力 的描述而提供了一系列标记符f l 。这有效地克服了在传统方式下对w e b 服务 的查找、访问和组合是用户自己来完成,且这种查找和访问是基于关键词的, 靠用户自己来理解解释服务的语义缺陷。在语义w e b 环境下,用户可以通过一 个智能a g e n t 来自动发现、自动执行其所需的w e b 服务,甚至a g e n t 可以自动 选择和提供交互服务来为用户完成复杂任务。 1 4 本文研究工作与组织结构 本文将语义w e b 和a g e n t 技术应用到w e b 服务发现中。用o w l s 对w e b 服务进行语义化的描述,在此基础上,使用a g e n t 技术执行匹配算法,实现语 义化的查找。同时,对用户的请求进行个性化的过滤,以进一步提高w e b 服务 的查准率。 本文共分为五章。 5 第一章是绪论。介绍了本文的课题来源、课题背景与意义,以及一些相关 领域知识及其研究现状,概要阐述了本文的主要工作和论文的结构。 第二章主要对本体进行阐述,包括本体的分类、本体标识语言、本体建模 方法和工具,然后给出本体构建的实例; 第三章介绍几种传统w e b 服务发现技术,针对传统w e b 服务发现技术的 不足,引出语义w e b 服务发现技术。在此基础上提出了一种新的语义w e b 服 务发现技术一一基于a g e n t 技术的语义w e b 服务发现研究模型( a s w s m a t e h m a k e r ) ; 第四章初步实现该模型,并给出实验分析与结果; 第五章总结全文,列出了本文的主要工作以及下一步的研究工作。 6 2 1 本体论 第二章语义w e b 的知识表示语言 本体( 0 n t o l o g y ) 一词起源于哲学领域,在哲学中它的基本意思是对本质 和存在的一个系统的描述。而在计算机领域中,本体可用来描述和说明某一领 域知识【i ”。本体中包括某一领域中基本概念、概念之间的关系以及概念和关系 的属性定义。由于本体可用来详细、正确地描述事务的属性,因此本体可以广 泛应用于语义搜索、概念搜索、软件代理、决策支持、自然语言处理、知识管 理、智能数据库和电子商务等领域。 由于传统的w e b 服务语义表达能力有限,而本体又可以提供丰富的语义信 息,因此,如果在w e bs e r v i c e s 中引入本体技术,就可以解决语义问题。语义 w e b 服务是以语义w e b 和本体论为基础的一个重要的应用基础研究领域。 语义w e b 中,本体是描述文档语义信息的工具,它可以定义w e b 服务的 属性、功能、执行接口、服务执行的先决条件和后置结果。这种增强w e b 应用 和智能引擎的语义信息,使得应用更加智能化,更加接近人类的概念思维。 2 1 1 本体定义 1 9 9 3 年,美国斯坦福大学知识系统实验室( k s l ) 的g r u b e r 给出了在信息 科学领域广泛接受的o n t o l o g y 正式定义 1 3 】:“a no n t o l o g yi saf o r m a l ,e x p l i c i t s p e c i f i c a t i o no fas h a r e dc o n c e p t u a l i z a t i o n ”( 本体是概念模型的明确的规范说 明。) f e n s e l 对这个定义分析,认为本体的概念包括四个主要方面i 】: ( 1 ) c o n c e p t u a l i z a t i o n ( 概念化) :客观世界中现象的抽象模型; ( 2 ) e x p l i c i t ( 明确) :概念及它们之间联系都被精确定义; ( 3 ) f o r m a l ( 形式化) :精确的数学描述; ( 4 ) s h a r e d ( 共享) :本体中反映的知识是其使用者共同认可的。 本体的目标是为了获取相关领域的知识,提供对该领域知识的共同理解, 确定该领域内共同认可的词汇,并从不同层次的形式化模型上给出这些词汇和 词汇间相互关系的明确定义。 正是如此,本体很适合于描述异种的、分布的、半结构的信息资源,例如 w e b 上的信息。为了在不同的应用程序之间共享信息和知识( 用于互操作) , 需要有一组共享的具有公共理解的术语来描述应用程序的领域,并且定义这些 术语间的关系。本体通过对概念的严格定义和概念之间的关系来确定概念的精 确含义,表示共同认可的、可共享的知识,因此在语义w e b 中,o n t o l o g y 具有 非常重要的地位,是解决语义层次上w e b 信息共享和交换的基础。 7 2 1 2 本体描述语言 在具体的应用中,为了明确指定语义,使用本体的表示语言来描述本体, 而表示语言应该能够以机器可理解的方式准确定义概念以及概念之间的关系。 在计算机领域讨论本体,首先就面临着本体究竟是如何描述的,即概念的形式 化问题。 本体描述语言起源于历史上人工智能( a i ) 领域对知识表示的研究”】。自 上个世纪9 0 年代以来,一些基于a i 的本体实现语言陆续被提出,如k i f 1 6 1 、 o n t o l i n g u a 【1 饥、l o o m t l 8 1 、o c m l 9 1 、f l o g i c 2 0 1 。后来,随着w e b 的发展,又 出现了一系列基于w e b 标准的本体描述语言,如s h o e i 2 、x o l 2 甜、r d f 2 3 1 、 r d f s 2 4 l 、o i l i 2 s 】、d a m l 、d a m l + o i l 2 们,o w l 2 7 1 。目前,基于w e b 标准 的本体描述语言成为本体论和w e b 技术研究和应用的热点。其中o w l 是w 3 c 提出并成为国际通用的标准语义w e b 语言。它和早期的本体语言的关系如图 2 1 所示: 昌 图2 1 基于w e b 的本体描述语言的相互关系 o w l ( w e bo n t o l o g yl a n g u a g e ) 是为了在w w w 上发布和共享本体而提 供的语义标记语言。o w l 源自于d a m l + o i l ,保持了d a m l + o i l 的框架和大 多数语法、语义特征,同时作为r d f ( s ) 的扩展,目的是提供更多的原语以支持 更加丰富的语义表达,并更好的支持推理。 o w l 针对其不同的应用范围( 不同的表示能力和计算能力) 做了扩充和限 制,分为三个子语言:o w lf u l l ,o w ld l 和o w ll i t e 。三个子语言的限制 由少到多,其表达能力依次下降,但可计算性( 结论可由计算机通过计算自动 得到) 依次增强。 o w lf u l l :提供最丰富的表达能力和最大的r d f 语法自由度,支持o w l 的全部语法结构,但没有可计算性保证。o w l 允许本体扩大预定义词汇的含义, 但o w lf u l l 基本上不可能完全支持计算机自动推理。 o w ll i t e :o w ll i t e 提供最小的表达能力和最强的语义约束,适用于只需 要层次式分类结构和少量约束的本体,例如词典。因为其语义较为简单,o w l l i t e 比较容易被工具支持。 o w l d l :o w l d l 得名于它的逻辑基础一一描述逻辑。o w l d l 处于o w l 8 f u l l 和o w ll i t e 之间,兼顾表达能力和可计算性。o w ld l 支持所有的o w l 语法结构,但在o w lf u l l 之上加强了语义约束,使得能够提供计算完备性 ( c o m p u t a t i o n a lc o m p l e t e n e s s ,即任何结论都能确保通过计算得到) 和可判定性 ( d e c i d a b i l i t y ,所有结论都保证在有限时间内得到) 。 2 1 3 本体建模 本体建模的核心是明确领域中的概念、概念的属性和约束条件、概念之间 的层次关系等。本体的建模原语主要有类、关系、函数、公理和实例等5 种【2 们。 ( 1 ) 类通常也称为概念。类的含义很广泛,可以指任何事物,如工作描述、 功能、行为、策略和推理过程等等。 ( 2 ) 关系指在领域中概念之间的交互作用,形式上定义为n 维笛卡儿积的 子集:r :c l c 2 c 。 ( 3 ) 函数是一类特殊的关系,这种关系中,前n 1 个元素可以惟一决定第n 个元素,形式化的定义为f :c i cn i c 。例如:m o t h e r o f 就是一个函数, m o t h e r o f ( x ,y ) 表示y 是x 的母亲。 ( 4 ) 公理表示永真子句。例如:概念乙属于概念甲的范围。 ( 5 ) 实例代表元素,是概念的具体化。从语义上讲实例表示的就是对象。 从语义上划分,基本关系有四种: ( 1 ) p a r t o f 表示概念问部分与整体的关系。 ( 2 ) k i n d o f 表示概念之间的继承关系,与面向对象方法中的父类和子类 的关系相类似。 ( 3 ) i n s t a n c e o f :表示概念的实体与概念之间的关系,类似于面向对象方 法中的对象和类的关系。 ( 4 ) a t t r i b u t e o f 表示某个概念是另一概念的属性。 本体建模语言都提供了上述5 种建模原语和概念之间的4 种关系。但在实 际建模过程中,概念之间的关系不限于上面列出的4 种基本关系,可以根据领 域的具体情况定义相应的关系1 2 9 1 。 本体的构建从本质上说是一种组织或团体意义上的决策行为。专家的知识 是语境相关且独立构建的,功能强大但难免比较片面,因此很难构建一个可以 满足所有成员使用需求的本体。对某些领域内专家行为的研究也说明了这一点, 甚至在一些良好构架的领域中,也很难达成一致的意见。然而,那些在应用中 较为成功的本体却大都来自于那些绝大多数的专家可以在术语和概念上达成共 识的领域i t s l l 2 3 】。 目前,关于本体构建的方法还不成熟,没有一套完整的统一的方法论。现 有的建模方法,一般是根据本体建模经验总结提出的,具有代表性的建模方法 主要包括以下几种【2 引: 9 ( 1 ) m u s c h o l d 等根据构造e n t e r p r i s e 本体所积累的经验,指出本体建模 主要包括4 个步骤,并提供了每个步骤的指导原则。4 个步骤分别是:明确本 体的目的和范围;通过知识获取、知识编码以及与已有的本体集成构造本体; 评估本体;建立文档。 ( 2 ) m g r u n i n g e r 认为本体建模本质上是建立本体所要指明知识的逻辑模 型。该逻辑模型并不是直接建立,首先通过一组能力问题( c o m p e t e n c y q u e s t i o n ) ,以非形式化方式描述本体应满足的条件;然后将这种非形式化描述 表示为一阶逻辑子句,建立形式化逻辑模型。 ( 3 ) a g p e r e z 等提出了在知识层构造本体的方法。其建模过程具体包括: 规划、控制、规范、知识获取、概念化、集成、实现、评估、编制文档和配置 管理等。此外,还提出了基于原型演化的生命周期,明确了本体在生命周期中 需要跨越的阶段。本体开发环境o d e ( o n t o l o g yd e v e l o p m e n te n v i r o n m e n t ) 部 分支持p e r e z 提出的建模方法。 本体的构建需要相应的建模语言和建模工具的支持。本体建模工具包括编 辑工具、标注工具和集成工具等。常用的编辑工具有o n t o e d i t 、o i l e d 和 p r o t 6 9 6 2 0 0 0 等。本体标注工具可以在w e b 页面中自动或半自动插入本体标记, 将非结构化、半结构化信息与本体联系起来,常用的标注工具有a e r o d a m l 、 o n t o a n n o t a t e 和c o h s e 等。本体集成工具用于解决同一领域内本体的融合和 集成问题,常用的有p r o m p t 、f c a m e r g e 和o d e m e r g e 等,除此以外还有本 体存储查询工具和学习工具等。本文选用p r o t 6 9 6 2 0 0 0 工具建本体实例。 下面引用一个由w 3 c 的g u u ss c h r i e b e r 开发的关于制酒行业的本体来描述 本体建模。 ( 1 ) 相关背景 对于制酒业而言,“产品地域”( p r o d u c t i o na r e a ) 是一个非常重要的特征。 根据生产地域的谷类的大小,酒的类型存在很大的变化,从一个国家到一个特 定的葡萄园。我们可以给出四种不同的产品地域: 国家( c o u n t r y ) ,例如f r a n c e ,i t a l y 区域( r e g i o n ) ,例如b o r d e a u x ,m e d o c ,t u s c a n y 城镇( t o w n ) ,例如m a r
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026天津港口医院应届毕业生招聘4人考试备考题库及答案解析
- 2026广西防城港市第一人民医院招聘44人笔试模拟试题及答案解析
- 2026海南省第二人民医院招聘19人(一)考试备考试题及答案解析
- 2026年山西信息职业技术学院单招综合素质笔试备考题库含详细答案解析
- 2026中国煤炭地质总局招聘2人考试备考题库及答案解析
- 2026中国联通普洱分公司招聘40人考试备考题库及答案解析
- 2026重庆荣昌区文化和旅游发展委员会招聘1人笔试备考题库及答案解析
- 2026河南洛阳嵩县城镇公益性岗位招聘59人笔试参考题库及答案解析
- 2026广东佛山市禅城区石湾第三小学招聘临聘教师考试备考试题及答案解析
- 2026江苏镇江市京口区年集中招聘教师15人笔试模拟试题及答案解析
- 2026年度黑龙江省交通运输厅所属事业单位公开招聘工作人员86人备考题库及参考答案详解(新)
- GB/T 32150-2025工业企业温室气体排放核算和报告通则
- 贵州省贵阳市南明区2025-2026学年度第一学期期末测评参考卷八年级历史试题(原卷版+解析版)
- 北京市石景山区2025-2026学年第一学期高三年级期末考试试卷英语试卷+答案
- 首医大外科学总论讲义第1章 绪论
- 2026年山东交通职业学院单招综合素质考试备考题库带答案解析
- 中国兽药典三部 2020年版
- 2025年中国远洋渔业行业市场全景监测及投资战略咨询报告
- 人工智能在安全监控领域的可行性报告
- 第1课 活动A《我的学习习惯·学习习惯小调查》(教学设计)-2024-2025学年二年级上册综合实践活动浙教版
- CNAS-CL01-G001:2024检测和校准实验室能力认可准则的应用要求
评论
0/150
提交评论