已阅读5页,还剩69页未读, 继续免费阅读
(计算机应用技术专业论文)基于领域本体的服务资源发现技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 基于领域本体的服务资源发现技术研究 专业名称:计算机应用技术 申请者:郭莹光 导师:陈启买 服务资源发现技术研究是理论界和业界一个热点问题,与该技术相关的服务 语义描述和服务精确匹配等研究工作,吸引着越来越多研究人员和业界人士的关 注。在学习、生活、工作和生产等领域,快速、准确定位所需服务资源( 如信息 服务、业务办理服务等) ,正变得越来越关键。 然而,目前的服务资源发现技术缺乏这方面的能力。基于语法的方法可以得 到数量较多的返回结果但精度偏低。而基于语义的方法虽然查准率高,但却具有 服务描述信息不全面、对服务的定义过程繁琐复杂等缺陷。此外,以上均是w e b 环境下的的服务发现方法,对许多非w e b 环境下的服务缺乏适用性,而在人们的 工作生活中这种服务所占的比例相当大。因此,在保证查询准确率和服务描述的 简单明了的前提下,针对一般的服务,应用基于语义的服务检索方法,是解决以 上问题的有效途径。 本文提出了一种基于领域本体的服务资源发现方法,通过定义服务描述模 型,规范服务提供者和使用者对服务的描述;同时构建领域本体,并基于该本体 对服务描述进行语义标注,从而消除服务描述的语义异构问题,让用户可以基于 语义发现服务,在不牺牲查准率和计算复杂性前提下提高服务资源发现结果的查 全率和查准率。同时通过对服务结构进行描述,利用领域本体及其推理能力,在 服务发现过程中自动进行服务整合,使发现结果更符合需求。与现有方法相比, 本文的方法综合考虑了服务的语义和服务的结构等因素,可以自动根据服务请 求,依靠领域本体知识库,实现服务的动态发现和组合,适合用于发现人们日常 生活中的服务。 本文研究课题来源于广东省教育厅科研资助的项目“多校区教学管理信 息化运作模式研究与实践 。论文在充分研究当今服务资源发现和共享使用等情 况基础上,结合数字化校园实际业务办理、服务使用的特征,给出了基于领域本 体的服务资源发现模型,并就当中涉及的服务描述、服务发布、服务整合与服务 匹配等几个部分进行了深入分析与研究,据此设计实现了一个服务资源发现原型 系统,对高校数字化校园建设与实施具有重要意义。 关键词:服务发现服务语义语义标注领域本体服务整合 t e c h n oio g ys t u die so fs e r vic e sr e s o u r c edis c o v e r y u sin gd o m aino n t oio gie s a 8 s t r a c t m a j o r : n a m e : c o m p u t e ra p p l i c a t i o nt e c h n o l o g y s u p e r v i s o r : g u oy i n gg u a n g c h e nq i m a i d i s c o v e r yo fs e r v i c e sr e s o u r c er e s e a r c hi sah o t s p o ti nt h et h e o r ya n di n d u s t r y r e s e a r c h ,t h et e c h n o l o g i e s - r e l a t e dl i k es e m a n t i cd e s c r i p t i o na n de x a c tm a t c h i n go f s e r v i c e sa r ea t t r a c t i n gm o r ea n dm o r ea t t e n t i o no fr e s e a r c h e r sa n dt e c h i n i c i a n si n r e l a t e df i e l d i ns t u d y i n g ,w o r k i n ga n dm a n yo t h e rf i e l d s ,f i n d i n gu s e f u ls e r v i c e s q u i c k l yi sb e c o m i n gm o r ea n dm o r ec r i t i c a l h o w e v e r ,c u r r e n tt e c h n o l o g i e sf o rs e r v i c e ss e a r c h i n ga r el a c ko ft h o s ec a p a c i t i e s t h ew a yb a s e do nk e y w o r d sc a np r o d u c eag r e a tm a n yr e s u l t s e ta tl o wp r e c i s i o nr a t i o a n o t h e rw a yb a s e do ns e m a n t i c st a k e sa c o m p l i c a t e dp r o c e s st od e f i n et h es e a r c h i n g o b j e c ta n dt h ed e s c r i p t i o no fs e r v i c e s b e s i d e s ,b o t hw a y sa r ew e bs e r v i c e ss e a r c h i n g o r i e n t e d b u tn o n eo ft h e mc a nb ea p p l i c a b l et ot h es e r v i c e so u t s i d et h ew e b e n v i r o n r n e n t c o n s i d e r i n gt h es t a t u st h a tm a j o r i t yo fs e r v i c e sa r ep r o v i d e do f f - l i n e ,w e n e e dt op r o p o s eaw a yt os o l v et h eo f f - l i n es e m a n t i cs e r v i c e ss e a r c h i n gm a t t e r , t h i s w a ym u s th a v eh i g ha c c u r a c y , c l a r i t ya n ds i m p l i c i t yo ft h es e r v i c e sd e s c r i p t i o n t h i s m a yb eak e yt ot h ep r o b l e m i nt h i sp a p e r , w ed i s c u s sad o m a i no n t o l o g y - b a s e ds e r v i c e sd i s c o v e r ya p p r o a c h i nt h i sa p p r o a c hw eh a v ep r o p o s e das e r v i c e d e s c r i p t i o ns t a n d a r db e t w e e np r o v i d e r s a n du s e r s i no r d e rt oe l i m i n a t et h eh e t e r o g e n e o u sp r o b l e me x i s t si nt h es e r v i c e s d e s c r i p t i o n ,w ea n n o t a t es e r v i c e sw i t hd o m a i no n t o l o g y , s ot h a tu s e r sc a ns e a r c h s e r v i c e sb a s e do ns e m a n t i c s ,w i t h o u t s a c r i f i c i n gp r e c i s i o na n dc o m p u t a t i o n a l c o m p l e x i t y , u n d e rt h ep r e m i s eo fi m p r o v i n gt h er a t eo fr e c a l la n dp r e c i s i o no ft h e r e s u l t sf o u n d o nt h eo t h e rh a n d ,i no r d e rt om a k et h ea u t o m a t i cs e r v i c ei n t e g r a t i o n c o m et r u e ,w ed e p i c tt h es t r u c t u r eo ft h es e r v i c ed e s c r i p t i o nb a s e do nd o m a i n o n t o l o g y , m a k i n gt h ei n t e g r a t i o nr e s u l t f u l f i l lt h ep e o p l e sn e e d c o m p a r e dw i t h e x i s t i n ga p p r o a c h e s ,t h em e t h o do ft h i sp a p e r , c o n s i d e r i n gt h es e r v i c es e m a n t i c sa n d s e r v i c es t r u c t u r e ,c a na u t o m a t i c a l l yd i s c o v e ra n da s s e m b l ed y n a m i cs e r v i c e sf o r p e o p l ea c c o r d i n gt o t h ed o m a i no n t o l o g yk n o w l e d g eb a s e ,i tc a l lb eu s e di nd a i l y s e r v i c e ss e a r c h i n g t h es u b j e c to ft h i sa r t i c l ec o m e sf r o mt h ee d u c a t i o n f u n d e dr e s e a r c hp r o j e c to f g u a n g d o n ge d u c a t i o n a ld e p a r t m e n t ”t h er e s e a r c ha n d p r a c t i c eo fp r o c e s sm o d ei n m u l t i c a m p u st e a c h i n gm a n a g e m e n ti n f o r m a t i o n i z a t i o n ”a f t e rs t u d y i n go ns e r v i c e d i s c o v e r ya n ds h a r i n gt e c h n o l o g yn o w a d a y s ,c o m b i n i n gw i t ht h ec h a r a c t e r i s t i c so f b u s i n e s sp r o c e s sa n ds e r v i c e su s i n gi nd i g i t a lc a m p u sp r o j e c t ,w eh a v ed e s i g n e da d o m a i no n t o l o g y - b a s e ds e r v i c ed i s c o v e r ym o d e lw h i c hi n v o l v e ss e r v i c er e l e a s e s , i n t e g r a t i o na n dm a t h t h ep r o t o t y p eo fs e r v i c ed i s c o v e r yw eh a v ep r o p o s e dm u s tb ei n a ni n d i s p e n s a b l ep o s i t i o no fd c p si m p l e m e n t a t i o n k e yw o r d s :s e r v i c ed i s c o v e r y , s e r v i c es e m a n t i c s ,s e m a n t i ca n n o t a t i o n ,d o m a i n o n t o l o g y , s e r v i c ei n t e g r a t i o n i v 华南师范大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论 文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文 的研究做出重要贡献的个人和集体,均已在文中以明确的方式标明。 本人完全意识到此声明的法律结果由本人承担。 论文作者签名:缸舀刈 讫义1 , :有,佥稻:酃猫刈 日期:如孵石月8e t 学位论文使用授权声明 本人完全了解华南师范大学有关收集、保留和使用学位论文的规 定,即:研究生在校攻读学位期间论文工作的知识产权单位属华南师 范大学。学校有权保留并向国家主管部门或其指定机构送交论文的电 子版和纸质版,允许学位论文被检索、查阅和借阅。学校可以公布学 位论文的全部或部分内容,可以允许采用影印、缩印、数字化或其他 复制手段保存、汇编学位论文。( 保密的论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密范围,在年后解密适用 本授权书。非保密论文注释:本学位论文不属于保密范围,适用本授权 书。 论文作者签名: 锯炒刷币签名:伽砸 日期:年月日 日期:1 争扣月8 日 基于领域本体的服务资源发现技术研究 1 1 研究背景 第1 章绪论 信息检索己成为获取信息主要手段。根据c n n i c 的统计数据:目前中国用户 上网的最主要目的中,信息获取以4 2 3 位居榜首;有9 8 7 的人表示通过互联网 获取信息,其中有7 1 9 的人是通过检索系统来查找相关网站以获取所需资讯【l 】。 同时,日趋发达的各种服务为人们生活带来许多便利,电子政务的推广为人们办 理各种对公业务提供了便捷途径,天气预报等各种信息服务向市民衣食住行及时 提供所需的资讯。面对汹涌而来各式各样的服务,人们亟需良好的服务组织方式, 帮助方便地定位和调用服务,因此面向服务资源的检索是网络信息检索的一个重 要发展趋势。然而一般的信息检索正面临着两个亟待解决关键问题【2 j : ( 1 ) 基于关键字的检索得到的结果相关度低,查准率不高,冗余信息太多。 纵观当前检索系统,如g o o g l e 和百度等,主要采用传统的关键词匹配算法进行查 询,这种查询依赖于编码技术,根据分类模式描述给定的信息;通过基于字符串 匹配的全文检索技术,来搜索用户提交的关键词。由于编码描述只能反映出部分 语义,因此不能保证语义匹配;检索过程是把用户查询关键词与全文中每一个词 进行比较,而不考虑查询请求与文档语义上的匹配。目前大量应用基于关键字的 信息检索系统对海量信息资源揭示效率不高、深度有限,一方面会导致检索到大 量无关的学习材料,另一方面也会丢失相关的重要学习材料。总的来说,造成了 基于关键字检索系统所出现的上述两个问题可以归结为:对用户提交的查询语 义的理解误差;对资源语义理解的误差。而这两个问题的成功解决直接关系到 信息检索的查准率和查全率。 ( 2 ) 现存的基于本体的信息检索系统为降低或避免上述传统检索系统的两类 误差提供了可行的解决方案,缺乏对服务的全面描述和领域知识的深入研究,导 致了检索结果较低的准确性,同时与服务相关的资源除了静态的文档资料外,更 多的是动态的服务信息,服务接口和服务规约等,常见的本体检索系统只能对服 务的某些元素进行描述,而不能从整体上全面对服务进行建模,从而难以进行服 务的语义检索,也不能保证检索的查全率和查准率,因此现存的基于本体的信息 基于领域本体的服务资源发现技术研究 检索系统仍无法满足服务类资源的检索需求。 为了提供有效、可行的服务资源发现,本文重点放在用户最关心的、与需求 最贴近的服务语义上,通过对服务进行语义描述,并在领域本体的指导下进行语 义标注,消除用户和服务提供者之间的语义异构等一致性问题,从而提高检索的 准确率,满足了用户迫切的服务发现需求。 1 2 国内外研究现状分析 1 2 1 服务资源发现技术研究现状 服务资源发现技术兴起于各种各样的社区。服务发现关键的问题就是服务提 供者能准确的描述自己所提供的服务,服务请求者能精确的描述自己的需求及服 务描述和需求描述间的匹配。由于服务和服务需求的多样性,传统的基于语法的 描述语言和匹配策略己不能满足当前的需求。而通过在服务发布和服务请求中加 入语义信息,有利于实现自动化的服务发现,使得服务发现技术不再拘泥于传统 分类和基于关键字查询技术,而可以进行基于语义的模糊匹配,使服务发现技术 更有效、准确【3 1 。 针对上述需求,多个组织纷纷推出了各自的服务资源发现技术。有的技术要 求每个服务对象和检索使用相同的词汇表描述,从而提高了被描述对象与检索使 用相同的字词的概率,从而尽量缩小服务与检索间的语义差异,提高查全率【4 5 】。 另一种技术是采用语义网( 例女i w o r d n e t ) 用于捕捉词语间的语义联系( 同义词、 反义词和下位词等) ,实现语义扩展,扩大查询的范围从而提高查全率【6 】,但由 于语义网仅关注语义的联系,导致这种方法可能潜在地降低查准率和局部最优化 的情况。还有c o o g l e 等的检索引擎提高包含关键字的文档的一些外部链接文档的 优先级,一定程度上提高查准率。最后大部分基于文本信息的检索引擎允许模糊 匹配( 匹配包含部分关键字的资源文档) ,提高了查全率的同时牺牲了查准率。 基于关键字的服务匹配机制只能实现语法层次上的匹配,从而导致在服务发 现过程中很多语义上匹配的服务不能被发现,使得服务发现的性能低下。此外, 基于关键字的服务匹配技术对于服务的动态发现、服务组合及监控等都缺乏必要 的支持。为了解决这些问题,需要从服务本身入手,对服务本身及其相关发现机制 进行相应扩展。基于本体的服务作为服务的语义扩展,在服务描述中添加了丰富 2 基于领域本体的服务资源发现技术研究 的语义信息( 即“形式化的自描述”以及机器可处理) 并通过对服务发现算法进行 改进以利用这些语义信息进行服务的匹配,从而克服基于关键字的服务发现机制 所存在的不足。 本体是基于语义的服务发现的基础,本体表示和推理对基于语义的服务发现 具有重要影响。o w l ( w e bo n t o l o g yl a n g u a g e ,简称o w l ) 是w 3 c 在d a m l 基础上提出 的面向w e b 的本体描述语言,是目前最常用的本体描述语言吲。基于语义的w e b h 艮 务匹配在计算服务之间的相似程度时除了要计算语法相似性以外,还需要通过逻 辑推理来计算服务之间的包含关系或语义相似性。目前有很多开源的描述逻辑推 理器,如r a c e r 、f a c t 、p e l l e t 等可以支持基于描述逻辑的推理。基于语义的服务 匹配以本体推理为基础,但一般不考虑具体的推理系统而只关注如何利用推理系 统来得到相应的逻辑结果。 基于语义的服务发现相关研究包括以下三个方面: 首先是对服务描述的研究。服务描述是服务发现的基础,目前的服务描述语 言( 如w s d l ) 缺乏完整描述服务语义的信息,不能很好地支持基于语义的服务发 现。为了支持基于语义的服务发现,同时更全面深入地描述服务,需要从用户需 求入手,在用户最关心的方面对服务进行描述。 其次是领域本体的研究。要良好地支持基于语义的服务发现,首先必须建立 全面、完整的领域本体,在本体指导下进行语义扩展和推理,基于语义的服务发 现要求一个相应的领域本体对其进行支持。 再次是在领域本体的指导下对服务描述进行标注,以便消除用户与服务提供 者对于服务描述信息的理解差异。最后是基于语义的服务匹配算法的研究。基于 语义的服务匹配算法是服务发现机制的核心。如何利用服务描述中的语义信息来 进行服务的匹配是基于语义服务发现的关键所在。 1 2 2 领域本体研究现状 领域本体( d o m a i no n t o l o g y ) s l i 匝过对特定领域内概念及概念间关系的精确 描述,成为人机之间、机器和机器之间互相理解的语义基础。 领域本体是专业性的本体,提供了某个专业学科领域中概念的词表以及概念 间的关系,或在该领域里占主导地位的理论。目前本体模型的研究已经进入实际 应用阶段。许多研究领域目前都建立了自己标准的本体,目前,w e b 上有许多可重 基于领域本体的服务资源发现技术研究 用的本体资源库,这使得诸多领域专家能够使用它们来共享和评注领域中的信 息。构建领域本体要捕获相关的领域知识,提供对该领域知识的共同理解,确定该 领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇( 术语) 和词 汇之间相互关系的明确定义。本体工程方法包括特定领域的本体开发,如金融、 化学、生物领域本体,包括通常知识的本体库【8 1 。但目前领域本体的创建还缺乏 系统的、工程化的方法。目前的一些方法都是从各案的开发过程中通过逆工程总 结出来的。随着本体应用的日益深入,领域本体的开发不能再简单视为项目开发, 而应看成是工程开发,因此就有必要对本体工程开发方法论进行系统地研究。 领域本体的目标是捕获相关的领域知识,提供对该领域知识的共同理解,确 定该领域内共同认可的概念,并给出这些概念和概念之间相互关系的明确定义, 减少了由于概念理解的歧异所产生的错误和失误,方便了基于语义的服务发现和 组合,同时还弥补了u d d i 基于关键字的查找技术的不足【9 1 。特定领域的本体形成 该领域的知识表达系统核心,利用该本体抽象的概念和术语,可以分析清楚领域 的知识结构。没有本体或者知识之上的概念,就没有描述知识的术语,因此,对 应用领域进行有效范围的本体分析,是分解出该领域有效的知识和术语的基础。 领域本体以树型层次化结构进行表示,最抽象的类位于树的根部,也就是位 于树型层次化结构的最顶端。按照领域中概念或术语的分类原则,沿着树根逐层 依次向下细化,树上的每个结点都将表示一个概念或类,结点之间的连线表示概 念间的关系,如子类、兄弟和父类关系,树的叶节点表示术语或词汇,中间节点 表示概念或类。 领域本体构造涉及到具体领域知识,计算机研究者可能并不了解具体的领域 知识,因此,领域本体设计之初应该邀请特定领域的专家来进行交流。充分掌握 相关领域的知识后,才能将领域内的信息进行归类,提取概念,并用特定的语言 进行编码和形式化描述。另外,一个本体设计很难确保一次成功,因此依然存在 一个评价、再修改和设计的多次循环和重复的过程f 8 1 。 1 3 研究目的和意义 随着社会发展和人民生活水平的提高,建立于不同时期,采用不同技术与手 段建立起来的众多公用服务和业务过程,为商业活动的高效运行和人们的生活便 利等作出了巨大的贡献。在商业方面表现为跨部门、跨行业的业务协作和服务调 4 基于领域本体的服务资源发现技术研究 用,相互调用对方的部分服务和业务流程,在生活方面则表现为向公众提供一套 可供随时随地调用的公用服务资源。显然,要做到这种无阻碍的服务调用需要具 备一个服务资源发现和定位的系统,能够根据用户需求,有针对性地发现满足用 户需求的服务:经过上文的分析,归结为建立一个基于领域本体的服务资源发现 系统,向外提供统一的服务资源查询接口,使服务能进行灵活的自描述、交流和 统一管理和使用。 面向各行各业的服务资源发现越来越受到关注,但是基于服务语义的、参照 领域本体的服务发现系统建设还停留在自主开发的阶段,没有一个公用的领域本 体供重用,而且根据对国外基于语义的服务资源发现技术分析可以看出,服务资 源发现也尚有许多问题没有解决,例如,针对服务发现的领域本体构建技术、服 务语义描述的一致性和服务发现的推理算法等,本文在研究上述技术难点研究现 状的基础上,提出了基于领域本体的服务资源发现方法,为上述问题提供了较好 的解决方案【l o l 。 本文研究课题来源于广东省教育厅科研资助项目“多校区教学管理信息 化运作模式研究与实践项目,通过对当前数字化校园中多种多样的服务资源调 查研究的基础上,构建服务资源检索系统,并研究其关键技术,以解决“一校多 区 格局下服务资源组织杂糅、定位和共享困难问题,并以学校教务处的服务发 现为例,开发原型系统,验证了基于语义的服务发现方法韵有效性。 1 4 主要研究内容 要进行基于领域本体的服务资源发现,首先要建立服务的语义描述实体库以 及在领域本体指导下生成服务描述相应的语义标注。用户通过统一的服务需求描 述接口录入描述信息,系统对信息进行语义扩展和语义标注,最后通过基于领域 本体的语义推理进行用户需求语义标注和服务语义标注之间匹配,以产生符合用 户需求的服务结果集,并以一种用户自定义方式呈现出来。系统涉及服务语义描 述、领域本体构建、基于本体语义标注和语义标注间匹配等方面关键技术。 论文研究的主要内容包括:服务初始描述以及描述模型建立、领域本体构建、 基于领域本体调用外部推理机实现语义标注和服务发现过程中语义标注的匹配 和服务的整合算法等方面内容。 5 基于领域本体的服务资源发现技术研究 1 5 研究目标 针对以上所述的研究现状和研究目的,通过在服务资源发现过程中引入领域 本体、语义标注机制,建立关于服务描述的统一模型,达到解决服务的语义匮乏 和信息不一致等弊端的目标;同时,引入服务发现推理可保证服务语义匹配的准 确度,解决基于语法等方法查准率不高问题;而引入服务整合算法,可有效应对 服务种类日益增多、服务细化程度加深背景下服务复用和服务组合等实际需要。 6 基于领域本体的服务资源发现技术研究 第2 章服务资源发现技术研究 2 1 服务资源发现应用现状 2 1 1 现状 在资讯发达的今天,各种信息服务、政务服务和公共网络服务已经悄悄进入 日常生活中,这些分门别类的服务为人们的生活、工作等带来了许多的便利【1 1 1 。 出行前需要知道天气状况,使用手机终端可以方便地发送天气预报服务请求( 服 务请求中只需附带要查询的城市信息) ,服务终端将根据请求的参数,在短时间 内向我们返回相应的服务信息;又如在办理电子政务手续时,客户通常需要提供 部分的材料,申请才能被受理,进入流程。这种材料相当于服务的入口参数,因 此服务端提供的不单单是服务过程的本身,还有服务的描述、服务的“出入口 等。 当前的服务提供方对于服务的描述还没有形成规范,可用的服务仅通过某些 特定甚至低效的方式( 人工方式) 提供给公众使用,一定程度上阻碍了服务的推 广和削弱了服务资源的公用性,对于这些分f - 另u 类、数量庞大的服务资源检索、 定位和调用存在着巨大的困难。 例如,如果想通过基于关键字的检索引擎( 如g o o g l e ) 搜索“5 年楼龄的 1 0 0 平方米广州市中心房出租的价格 的服务,输入检索关键字“广州中心区5 年楼龄1 0 0 平方米租金 ,得到6 3 ,3 0 0 个结果,其中第一个检索结果是一篇 题为“5 0 万元广卅i 市区买一手房? 难找! 的文档,阅读该文档内容发现文中并 未包括需要查询的相应租金信息,继续阅读接连的几个检索结果文档,均得出类 似的结果,与此同时这些检索结果文档都包含了所输入的全部关键字,且根据匹 配的程度降序排列。分析其原因,该检索引擎把它们作为检索结果的主要依据是 判断文档是否包含全部或大部分关键字。显然,基于关键字检索方法并不能完全 适用于面向服务资源的检索需求,而这种需求的开益膨胀,使面向服务资源的检 索成为当前检索领域研究的热点问题。 7 基于领域本体的服务资源发现技术研究 2 1 2 前景和展望 公共服务资源的公用性和共享程度亟需进一步提高,各行各业的公用服务也 可通过扩大推广范围提高服务认知度,树立服务品牌,吸纳更多用户。而当前流 行的检索系统所使用的基于关键字和本体的服务检索方法并不完全适用于面向 服务资源的检索,因此需要开发一种针对服务资源发现的系统模型,并基于领域 本体进行语义标注、推理,提供全局开放的服务检索和发现,以应对日益膨胀的 服务资源检索需求。 2 2 服务资源发现的特点和面临的问题 2 2 1 服务资源发现的特点 服务资源发现包括以下几个特点: 1 、服务资源入口和出口分别表示服务请求需要提供的参数及其类型以及服 务返回的信息类型,在服务中具有较大的区分度,对它们赋予较高的权值可以提 高检索的查准率; 2 、服务资源的过程性是指服务资源可以形式化成一个过程,过程中包含许 多子过程,在确定子过程中的关键路径( 确定过程的顺序或并行结构) 后,相应 对关键路径中的节点( 子过程) 分配权重,查询可根据关键路径中的子过程进行 匹配: 3 、服务资源中的资源是指服务过程中所使用的信息、文档和材料等,可根 据资源对于服务的专属性质,以确定资源在服务接口匹配中权重; 4 、服务资源过程的异常过程是指服务过程中不按正常的流程运行的特殊情 况,在服务发现时考虑这些特殊情况可以提高检索效率和准确性; 5 、服务过程中每个元素的实例化情况可能各不相同,要求服务发现系统能 根据过程和元素实例,在类层次中的直接父类进行匹配,使用s u b e l a s s o f 或 s i b l i n g o f 等的运算在类层次关系中进行类型匹配。 2 2 2 面临的问题 根据服务资源以上特点,结合当前关于服务发现研究现状,总结出服务资源 8 基于领域本体的服务资源发现技术研究 发现面临以下问题和挑战: 1 、服务资源自身特点决定其不适合采用基于关键字( 句法) 的检索方法, 检索必须建立在形式化描述的服务资源模型基础上。 2 、需要使用形式化方法描述的服务资源建立资源库,并提供资源库的更新、 移除等维护操作。 3 、服务资源发现是面向公众提供服务的,检索应该在保证迅速高效的同时 提供尽量高查准率和查全率。 4 、服务资源形式化描述应该做到简单、清晰,使普通用户可以实现对服务 资源描述,继而向外提供公用的服务。 2 3 已有服务资源发现解决方案 2 3 1 语法级方法 语法级( 也称句法级) 的服务发现方法,是依赖于关键字匹配的服务发现机 制,大多采用w s d l 标准描述服务,通过关键字匹配对服务描述进行搜索并返回匹 配结果。如i b m 的u d d i 系统和e b x m lr e g i s t r y 就是基于预定义分类的语法级服务 发现方法。 图2 1u d d i 架构下服务的描述结构 9 基于鞭城奉体的最务羹慧琨拄木拜兜 如图 1 所示,u d d i 架构下,服务的描述包括服务名、服务描述、服务的类 别、标识符和服务的u r l 信息等属性的信息,对基于u d d i 架构下服务的检索可以 根据需求对某属性的值进行基于关键字的检索。 语法缓方法着重定义服务接口和实现细节,而忽略了对服务功能与行为等的 语义描述,实现简单,但查全率和查准率较低,且不能有效地支持用户基于语义 的服务发现f 。 2 3 2 依赖本体基于语义推理的方法 语义级服务发现,对服务的上层描述进行基于知识库的语义分析,形成统一 的描述,从而实现服务的语义匹配或搜索,图2 2 是经典的语义级服务发现方法 的架构。 这种方法增强了对服务的语义描述,实现上主要是通过基于本体的逻辑推理 进行服务匹配,如文献。而文献【。”则在采用本体描述服务的基础上,通过计 算本体和服务的相似度,在关注本体中类之闻关系的同时,考虑了类和属性之间 的关系,提供了更高的准确率。而目前基于本体的的服务发现模型在服务匹配过 程中仅关注服务的某个方面的相似性,如c 删算法则仅关注继承关系和服务功能 语义的相似性旧,文献综述了所有可用于准确定位服务的因子,并进而提出 一个改进的服务匹配算法。 客户端l服务器端 图2 - 2 依赖本体基于推理的服务发现方法框架 但这种依赖本体基于语义推理的服务发现方法使用的服务描述语言,如 d a m l - s 或o w l - sl ,对服务的定义较为复杂,却并不全面。首先,它们对服务语 义的概要描述过于笼统、简单,文献【1 1 就简单采用具有特定语义的术语来描述服 1 0 蜡一 飘国 一 葫。高 蝴 一 雠 1 i 、一 、 一i l l j i 一 一 = 一 a _ _ f 3 _ m m = 一 l 基于领域本体的服务资源发现技术研究 务语义。其次,虽然文献【1 8 】分别通过输入( i ) 输出( 0 ) 参数、前置( p ) 后置 ( e ) 条件( 即i o p e ) 来完善对服务能力的刻画,但通常情况下,用户的服务发 现请求很难如此完整地指定服务的i o p e ,以上方法同时要求用户具备某个领域 的专业知识和服务的精确描述能力。因此这种服务发现方法的灵活性较差、匹配 效率较低,且实用性不强。 在实际应用中,用户迫切需要的是轻量级的、可以灵活有效的支持基于服务 语义服务搜索的服务发现方法。通过上述分析可以看出,目前基于本体的服务发 现方法并不能很好满足用户的实际需要。 2 3 3 基于服务功能和上下文的服务发现方法 鉴于大多数服务需求方对于领域知识了解不多,不具备精确描述服务性质的 能力,同时不能使用领域术语精确地对服务需求进行描述,文献提出了一种基 于上下文的服务语义描述框架,这种框架不仅考虑到服务的功能描述,而且考虑 到服务使用的上下文信息,通过描述如何使用服务,而不是精确地描述服务及其 接口的类型,为一般的服务需求方提供一种简易入门的服务发现框架。 图2 3 基于公共上下文知识的语用服务发现方法 参加语用服务的a g e n t 都具有公共上下文知识,也就是存在一个能够描述他 们的通用语义模型。 语用w e b ) 报务增加了对于服务提供者的服务广告和消费者的服务需求的上下 文环境的描述,使得服务发现、组合更加准确。使用本体概念对服务的语用信息 进行描述,将其划分为参与服务方a g e n t 的公共本体和私有本体。这种基于概念 理解的规划方法,解决了语用w e b h 艮务中私有本体概念之间的协调和理解问题。 这类方法虽然便于用户对服务需求进行语义描述,但同时一定程度上降低了 服务需求描述中提供的信息量,降低了对目标服务的限定,从而不能保持发现结 基于领域本体的服务资源发现技术研究 果的查准率,同时这类方法计算复杂度较高,概念协调使得服务发现时间有所增 加,发现效率较低。 2 4 基于领域本体的服务语义描述解决方案 针对以上对目前服务发现解决方案的论述,综合各方案的优缺点,本文提出 了基于领域本体的服务语义描述解决方案。该方案和已有解决方案的关系如图 2 - 4 所示: 语义羿构 h l 题 服务描述船息格式 幂黢 搬务獭述财豫臻 求;锈 钿、暇务约秽艘麓 骅 旗予辫义的秘动殿 务组台 :已有的解决方案:基于领域髻嚣黧资源发现 一i 量蕊懋亟硒獗轴 苛型罢! l 、一。习 r x 觋鳓运鲥i r 、蜒;i 丙蓊淼夏赫瑟:i 爱二二二= 二二二二j 、i r 受囊蠹巫ji i 统4 的胲务语义描述 模裂 服务雅龠解决方褰 图2 _ 4 服务发现方法i 司题与方案的关系图 由于个体的差异,即使在相同的语义描述约束下,不同的人对同一服务的语 义可能采用不同的术语来描述。本文通过建立领域知识本体,并基于该本体为服 务描述进行语义标注,这种建立在同一知识库基础上的语义标注可以有效解决语 义异构的问题。 同时根据服务提供者和用户之间缺少对服务的共同语义描述约束这一现实, 首先为了统一服务提供者和用户对服务的描述方式,消除描述方式的差异,需要 建立统一的服务语义描述模型【2 0 】。 服务的调用粒度会根据需求有较大的差异,需要在服务发现过程中,依据用 户的服务需求语义和服务的结构及语义描述,对服务进行整合,本文在参考 b p e l 4 w s 整合模型的基础上,提出了基于语义的服务整合方法。 1 2 题两渊竺鬻 基于领域本体的服务资源发现技术研究 图2 5 基于领域本体的语义描述模型 本文将基于领域本体的服务语义描述模型解决方案分为服务发布和服务发 现两个模块( 如图2 5 所示) 。发布模块主要是服务进行预处理,为服务发现进 行前期准备;发现模块则是对用户服务需求进行处理,将用户需求与服务进行匹 配,发现满足用户需要的服务,并将发现结果反馈给用户。 2 4 1 领域本体的引入 从知识表示角度考虑,本体和知识库有类似之处,都是对一个具体或是抽象 领域中包含的知识的定义、表示和组织。其主要区别是知识库包含了特定领域抽 象或特定的知识,而本体是概念层次上对概念化的清楚描述,更注重概念层次上 术语及术语间关系的表述【2 1 1 。 从功能上来讲,本体和数据库有些相似,但是本体比数据库表达的知识丰富 得多。首先,定义本体的语言,在词法和语义上都比数据库表示的信息丰富得多; 更重要的是本体提供一个领域严谨丰富的理论,而不单单是一个存放数据的结 构。本体是领域内重要实体、属性、过程及其相互关系形式化描述的基础。这种 形式化的描述可成为软件系统中可重用和共享的组件。 构建本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确 定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇( 术语) 和词汇间相互关系的明确定义【2 2 】。 领域本体的建立,其实质是研究领域知识中的基本概念及其关系。将本体引 日墨王墨口互西墨互墨固 入领域知识库的建模,可以提供共享概念模型,建立概念的语义空间,这样不仅 会促进领域知识库的实体属性和术语表达的规范化,解决知识共享和重用,增强 顿域知识库的智能推理能力,而且将比传统数据库所使用的语言在语义、语法上 更加丰富;同时在基于领域本体知识库的系统中,易于实现基于描述逻辑d l ( d e s c r i p t i o nl o g i c s ) 的推理查询功能。图2 - 6 是p r o t d 9 6 下领域本体中服务 地点概念的建立,根据本文基于领域本体的推理机制的要求,领域本体中通过广 义、相似、相关和类属等方面表达概念问的关系。 f 4 rc 1 麟 点6 咖杠。n r d q l “s ) = _ h l el 眄忑i 1i 图2 - 8p r o t d 9 6 下领域本体中服务地点概念的建立 2 4 2 服务语义描述模型与语义标注 服务提供方和服务需求方之白j 建立对服务的一致描述,通过服务描述的形式 化、规范化降低噪声数据的比例,提高信息的表达能力,同时为服务描述语义标 注的建立和服务发现过程中的语义匹配奠定基础。 服务语义描述结构的建立要求考虑以下因素: i 、包含服务发现中区分度较高的多个维度,如服务地点、服务接口等: 2 、降低用户描述的难度,使不同领域的用户均可方便地对服务进行描述: 3 、服务的描述可以全面地概括服务的内容,精确地描述服务特征。 本文的服务语义描述基于四个维度对服务进行描述其描述模型如图2 7 所 示。改模型在服务地点、服务接口、服务操作和服务对象四个维度对服务进行描 述,对用户的要求较低,降低了用户描述难度,同时该描述可以全面地概括服务 基于镇域车体舳服务赉嚣发现技术研究 的内容,可用于进行服务语义描述。 图2 - 7 服务描述的几个维度 基于服务资源某属性值的检索方法( 如基于服务名的检索) ,查准率势必会 比较低,而且查全率得不到保证。根据服务语义发现的要求,通过标注把对服务 集的管理转化为对形式化语义标注的组织和管理,是提高查询效率的有效途径。 标注是对服务资源描述信息进行特征提取和标识引导的过程,它不仅是服务 集有效组织和管理的基础,也是资源检索的前提口3 1 。本文要求建立的语义标注库 是服务提供者和用户之间共享的、用于对服务进行统一描述的语义库,对于同一 个服务,有且仅有一种语义标注集合,把对服务集的直接检索转变为对语义标注 集的检索,不仅可降低检索的工作量提高检索效率,还可提高检索的查准率。 2 4 3 基于领域本体的服务语义匹配 服务发现的实质是根据用户的服务需求,在服务库中进行基于领域本体的语 义匹配。在对服务需求进行语义抽取和标注处理后,通过对服务与用户需求两者 语义标注的匹配,发现满足用户需求的服务。 要保证语义标注问的同义和近义匹配,需要建立相关领域的语义知识库,并 基于该知识库计算标注自j 的语义匹配度,在与相应的匹配闽值比较后得出匹配结 果。本文在“基于知网的词汇语义匹配”算法思想的基础上,按照基于领域 本体语义匹配的需求,设计基于某领域的层次关系词库,并基于该词库进行语义 距离的计算,由此实现语义匹配度的计算。图28 所示为树状的义原层次结构 本文的语义标注间的匹配参考陵层次结构,在领域知识库中实现浚结构,并进而 基于锾墟奉体的服务鹰潭发琨拄术轩兜 通过计算语义标注间的语义距离得到语义匹配度。 2 4 4 服务的整合 e 嘶竹 实体 g i 万物 pp h y s m l 嗍质 卜姐i 咖* i 生物 - - 劬蛐a l i i u m 删动物 h u m 删人 oh l n 酬越 l - a n i m a l l 兽 卜l e a 酬走兽 图2 - 8 树状的义原层次结构 随着服务种类的日益增多,服务的细化程度也并将随之加深,原有的服务可 能被拆分成多个予服务的形式供外界调用,例如入学服务可以拆分为交费服务、 登记报到服务,宿舍分配服务、课本领取服务等。随着服务粒度的减小,服务的 对象、范围等都会相应地缩小,因此在小粒度服务的基础上需要考虑如何自动地 根据服务请求,进
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电商物流行业现状调查
- 毕业设计(论文)大纲(模板)范文【范本模板】
- 会计专业毕业论文选什么题目好写
- 自-衡阳师范学院本科生毕业论文(设计)规范
- 物流仓储管理毕业论文
- 硕士论文格式要求
- (开题)京东物流成本控制分析
- 社论论证特点分析报告
- 城市管理中存在的主要问题及其对策建议
- 简历的教育经历模板
- 对数运算性质说课课件
- 企业网络安全管理制度范本
- 设备运行参数管理办法
- 吹膜机操作规程
- DB11∕T 512-2024 建筑装饰工程石材应用技术规程
- 拔牙术后感染处理
- 羊水栓塞的治疗指南讲课件
- JG/T 217-2007建筑幕墙用瓷板
- 演出单位安全管理制度
- Module 9 Friendship模块话题阅读还原练习(解析版)
- T/CHES 105-2023 T/CHAS 090-2023医院节水管理规范
评论
0/150
提交评论