




已阅读5页,还剩46页未读, 继续免费阅读
(计算机应用技术专业论文)面向语义web的服务匹配技术的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 服务发现和服务组合是w e b 服务的应用,而服务匹配则是服务发现的关键技术。 由于基于关键字的语法匹配存在低查全率和低查准率等问题,研究界提出了将语义w e b 的技术应用到w e b 服务领域,为w e b 服务的描述提供语义信息,即语义w e b 服务。语 义w e b 服务技术通过为w e b 服务提供一种以x m l 为语法基础的包含语义信息的描述, 使w e b 服务之间互相理解对方的内容、功能以及属性成为可能,并且为w e b 服务的自 动发现、执行、组合、监控提供了技术基础。 本文在此基础上主要提出了选课系统总体设计及其流程并对各部分技术进行解析, 然后对o w l s 匹配引擎部分m a t c h m a k e r 进行详细设计。文中对服务匹配中的关键技术 进行了研究:介绍了语义网的概念及其关键技术;遵循本体的建库原则,创建语义匹配 的本体基础选课系统的本体;对服务语义描述模型进行再定义;设计了一种有效的 基于语义的w e b 服务匹配算法,该匹配算法采用量化的相似函数,实现了性能与语义 相结合,并通过阈值的调节,实现了模糊匹配。最后基于以上模型和算法开发了服务匹 配实验系统,并给出了部分实验结果。通过分析实验结果,初步验证了综合匹配方法的 优越性。 本文借鉴了服务功能性匹配的思想,服务匹配算法通过服务分类匹配去掉不属于请 求服务分类的注册服务,然后对服务模型中的各个参数进行匹配,用户可以根据自己对 各部分要求程度的不同来设定系数,决定各部分的比重,再利用相似函数公式计算出相 似度。然后用户可以设定期望的阈值,来选择阈值范围内的服务,最终达到模糊匹配的 目的。 关键词:语义w e b 服务匹配本体o w l - s a b s t r a c t s e r v i c e sd i s c o v e r ya n ds e r v i c e sc o m p o s i t i o na r et h ea p p l i c a t i o n so fw e bs e r v i c e s s e r v i c e sm a t c h m a k i n gi st h ek e yt e c h n o l o g yo fs e r c i c e sd i s c o v e r y b e c a u s et h e r ea r es o m e d i s a d v a n t a g e si n c l u d i n gl o w r e c a l la n dl o w p r e c i s ew h e nu s i n gk e yw o r dm a t c h m a k i n g a l g o r i t h m ,t h er e s e a r c hc o m m u n i t yb r i n g ss e m a n t i c st ow e bs e r v i c e s s e m a n t i cw e bs e r v i c e s h a v et h e i rs e m a n t i cd e s c r i p t i o n sa n dt h u sm a k ei tp o s s i b l ef o rs e r v i c e st ok n o wt h ec o n t e n t , f u n c t i o na n da t t r i b u t e so fe a c ho t h e r t h es e m a n t i cw e bs h o u l de n a b l ec l i e n t st ol o c a t e ,s e l e c t , e m p l o y , c o m p o s e ,a n dm o n i t o rw e b b a s e ds e r v i c e sa u t o m a t i c a l l y t h et e a c h i n gs y s t e mi sd e s i g n e di nt h i sd i s s e r t a t i o na n de v e r yp a r tt e c h n o l o g yo nt h i s b a s i si sa n a l y s e d ,a n dt h e nt h eo w l - sm a t c h m a k e ri sd e s i g n e di nd e t a i l t h ed i s s e r t a t i o np a y m o r ea t t e n t i o nt ot h ek e yt e c h n o l o g i e s f i r s t l y , t h ec o n c e p t so fs e m a n t i cw e ba n di t sk e y t e c h n o l o g ya r ei n t r o d u c e d s e c o n d l y , f o l l o w i n gt h ep r i n c i p l eo ft h eo n t o l o g yb u i l d i n g ,t h e o n t o l o g yb a s e ds y s t e m so ft h es e m a n t i cm a t c h i n g - - - - e l e c t i v eo n t o l o g yi s e s t a b l i s h e d t h i r d l y , t h es e m a n t i cd e s c r i p t i o nm o d e li sr e s i g n e d a n dt h e na ne f f e c t i v es e r v i c em a t c h i n g a l g o r i t h mb a s e do nt h es e m a n t i cw e bi sd e s i g n e d t h em a t c h i n ga l g o r i t h mu s e sq u a n t i f i e d s i m i l a r i t yf u n c t i o nt oa c h i e v et h ei n t e g r a t i o no fp e r f o r m a n c ea n ds e m a n t i c sa n da d j u s tt h e t h r e s h o l dv a l u et oa c h i e v et h ef u z z ym a t c h i n g a tt h el a s t ,at e s tm a t c h m a k i n g s y s t e mh a sb e e n p r o p o s e d ,a n dt h ep a r tt e s tr e s u l t sh a v eb e e ng i v e n a n dt h ea l g o r i t h mp r o p o s e di nt h ep a p e r h a sb e e np r o v e dw o r k i n gw e l lt h r o u g ht h ea n a l y s i so ft h et e s tr e s u l t s u n d e rt h ei d e ao ft h es e r v i c ef u n c t i o nm a t c h i n g , g e t t i n gr i do ft h er e 百s t r a t i o ns e r v i c e s w h i c hd o n tb e l o n gt ot h er e q u e s t i n gs e r v i c e st h r o u g hc a t e g o r i e sm a t c h i n go fs e r v i c e s ,a n d m a t c h m a k i n gv a r i o u sp a r a m e t e r so ft h es e r v i c em o d e l u s e r sc a nr e q u e s tt h e i ro w no nt h e p a r to ft h ed i f f e r e n tl e v e l st os e tc o e f f i c i e n t s ,d e c i d e dt h ep r o p o r t i o no fe v e r yp a r tt h e nu s et h e s i m i l a rf u n c t i o nt oc a l c u l a t es i m i l a r i t yd e g r e e s u s e r sc a nt h e ns e tt h ed e s i r e dt h r e s h o l dt o c h o o s ea l ls e r v i c e s ,w h i c ha c c o r dw i t ht h em a t c h m a k i n gt h r e s h o l d ,a n de v e n t u a l l ya c t u a l i z e t h ef u z z ym a t c h i n gp u r p o s e s k e yw o r d s :s e m a n t i cw e b ,s e r v i c e sm a t c h m a k i n g ,o n t o l o g y ,o w l - s 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取 得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得 天津理工大学 或 其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研 究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。 ) ,b 学位论文作者签名:2 乃乏豸辛签字日期:略年 ,月c 吕日 学位论文作者签名:在乃乞嘞彳签字日期:吩年 ,月c 苫日 学位论文版权使用授权书 本学位论文作者完全了解 天津理工大学有关保留、使用学位论文 的规定。特授权天洼理工大鲎可以将学位论文的全部或部分内容编入 有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编, 以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复本和电子 文件。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者牦磊主苟导师瓤磊俊泊 签字日期:以年f 月f 彦日 签字日期:粥年,月日 第一章绪论 1 1 技术研究的背景 第一章绪论 b e m e r s l e e2 0 0 0 1 l j 年在x m l 2 0 0 0 会议上提出了语义网的想法。语义网研究的目标 是扩展当前的w e b ,赋予w e b 中的所有信息以定义良好的语义,让计算机能够理解和 处理,从而使人和计算机能更好地协作,充分发挥w w w 这个巨大的分布式信息系统 的潜力。这场革命不单只是针对静态页面,同样地,它被运用到近年来新兴的一门w e b 技术w r e b 服务中去。w e b 服务因其可移植性、跨平台性和易部署等优点而成为目前 各主要软件供应商的新宠儿。由于w e b 服务来自传统万维网,尽管它已是一次消息格 式的改进( 用x m l 取代了h t m l ) ,但仍然不能实现w e b 服务自动发布、自动发现、 自动选择、自动调用、自动执行、自动监控、自动补偿、自动恢复等一系列问题。要解 决上述问题,研究者们就自然而然地将语义和w e b 服务联系到了一起。语义w e b 服务 是位于语义网框架结构中的w e b 服务,它是将w e b 服务的特性融入到语义网体系中去 的产物,在保证w e b 服务现存优越性的基础上能够充分弥补其不足。 本体,来自于哲学【2 l ;而在语义网和人工智能的研究中,本体是对特定领域的共享 模型的概念化的知识表示。本体论使得机器仿佛具有了人的思维,可以进行自动的推理 和认证过程,使得智能化的语义w e b 服务成为了可能。大量的研究工作者活跃在该领 域,因此诞生了多种本体描述语言,有r d f 和r d f - s 、o i l 、d a i v i l 、o w l 、o w l s 等,在本体语言的建设中引入了结构化编程和面向对象编程思想。 1 1 1w e b 服务概述 w e b 服务是在i n t e m e t 上进行分布式计算的基本构造块。开放的标准以及对用户和 应用程序之间的通信和协作的关注产生了这样的一种环境。在这种环境下,w e b 服务成 为应用程序集成的平台。应用程序是通过使用多个不同来源的w e b 服务构造而成的, 这些服务相互协同工作,而不管它们位于何处或者如何实现。 w e b 服务在原有框架下的研究领域有不同的侧重点和成果:w e b 服务中的数据集 成;w e b 服务的组合;基于分布式数据库的特征提高w e b 服务质量的有效解决方案; 语义w e b 在w e b 服务中的应用;高效的w e b 服务发现技术和架构;w e b 服务的安全和 加密策略;p 2 p 环境中w e b 服务的有效表示和执行:网格计算与w e b 服务的有机结合 植 号手。 图1 - 1 是从面向应用的角度描述了w e b 服务的基本架构1 3 j 。该构架由三个参与者和 3 个基本操作构成。3 个参与者分别是服务提供者、服务请求者和服务代理,而3 个基 本操作分别是发布( p u b l i s h ) 、查找( f i n d ) 和绑定( b i n d ) 。服务提供者将其服务发布 到服务代理的一个目录上;当服务请求者需要调用该服务时,他首先利用服务代理提供 第一章绪论 的目录去搜索该服务,得到如何调用该服务的信息;然后根据这些信息去调用服务提供 者发布的服务。当服务请求者从服务代理得到调用所需服务的信息之后,通信是在服务 请求者和提供者之间直接进行,而无需经过服务代理。w e b 服务体系使用一系列标准和 协议实现相关的功能,例如:使用w s d l 来描述服务,使用u d d ! 来发布、查找服务, 而s o a p 被用来执行服务调用【4 1 。 图1 - 1w e b 服务框架 w e b 服务是由一套协议栈构成的层次化体系结构,如图1 2 所示,其中底层传输协 议是广泛使用的因特网标准:h 1 r p ,v i p ,s m t p 等。中间部分是目前w e b 服务的相 关协议标准,包括简单对象访问协议s o a p ( s i m p l eo b j e c t a c c e s sp r o t o c 0 1 ) 、统一描述 发现集成协议u d d i ( u n i v e r s a ld e s c r i p t i o n ,d i s c o v e r ya n di n t e g r a t i o n ) ,w e b 服务描述 语言w s d l ( w e bs e r v i c ed e s c r i p t i o nl a n g u a g e ) 。s o a p 是一种基于x m l 的不依赖于传 输协议的表示层协议,用于应用程序以对象形式方便地交换数据。u d d i 是一套注册中 心的规范,所有w e b 服务注册信息都存储在u d d i 商业注册中心,以便查找。 系结构图 第一章绪论 w s d l 通过一套x m l 语法描述,将w e b 服务定义为一个能交换消息的通信端点集 合。在中间层之上,是一些支持复杂工作流和业务逻辑的工作流建模语言,如i b m 的 w e b 服务流语言w s f l ( w e bs e r v i c e sf l o wl a n g u a g e ) ,微软用于w e b 服务业务过程之 间信息交换的x l a n g 和微软、i b m 等共同提出的业务过程执行语言b p e l 4 w s 5 j ( b u s i n e s sp r o c e s se x e c u t i o nl a n g u a g ef o rw e bs e r v i c e s ) 等。右边部分是各个协议层的 公用机制,包括安全和管理的协议或机制。 w e b 服务允许在w e b 站点上放置可编程的元素,能进行基于w e b 的分布式计算和 处理,把w e b 从一个信息的集合变成一个分布的计算环境,显著增强了w e b 体系结构 的潜力,因此成为近年来软件业界研究和开发的热点。然而,目前w e b 服务的描述都 是基于半形式化的自然语言,:女u d d i ,w s d l 等,对服务的自动发现、协商、组合等 的支持还很有限。 1 1 2 语义w e b 服务 由于目前w e bs e r v i c e 在功能和语义方面的表达不足,缺乏如服务内容、服务能力 等方面的描述,因此在实际使用中查找特定功能的w e bs e r v i c e 只能以关键词匹配为主, 效率不高,需大量的人工干预。要想使分布于i n t e r n e t 上的服务器可以通过w e b 更自动 化地、更智能化地交互,就必须解决目前w e b 上广泛存在的信息格式的异构性、信息 语义的多重性以及信息关系的匮乏和非统一。语义w e b 研究的兴起为w e b 服务带来了 新的活力,结合语义w e b 技术的w e b 服务( 即语义w e b 服务【6 1 ) 将是一种更为智能的 服务,是w e b 服务未来的发展趋势。 目前研究【7 ,8 】的以服务为目标,结合带有语义的服务描述和推理,最后构建一种带语 义的服务环境,则能够很好地为用户提供丰富完善的服务。图1 - 3 给出了语义w e b 服务 的框架。 匹堕三回 图1 - 3 语义w e b 服务架构 在语义w e b 服务的工作方式下,服务的发现、执行和组合不再需要由人来完成, 第一章绪论 而是可以由a g e n t 来自动完成。由于服务的描述是基于o n t o l o g y 的,是计算机能够理解 的形式,因此服务的查找可以是基于语义的匹配,单个的服务也可以由a g e n t 自动地组 合起来,以完成用户提出的复合任务。 1 2w e b 服务组合技术的发展与研究现状 1 2 1 服务匹配类型 面向服务的架构中最实质的部分是服务的发布、查找、绑定。其中又以服务查找为 关键,即服务匹配。通常我们将执行匹配的功能模块称为m a t c h m a k e r ,其主要功能就 是根据服务请求者的要求检索出满足其需求的服务。m a t c h m a k e r 与另一个名词服 务代理( b r o k e r ) 容易混淆1 9 j ,因为服务代理也具备服务匹配功能。但是两者从本质上 来说是两个概念,服务代理完成服务匹配后仍然参与服务提供者、请求者双方的实际执 行环节。而m a t c h m a k e r 不参与。m a t c h m a k e r 仅仅将符合请求者要求的服务的地址和描 述文件传给请求者后即退出,将认证、绑定、执行等任务交给服务供需双方处理,而监 控、收费等任务留给面向服务的架构处理。以上两种模型见图1 4 。本文的模型采用前 者来构建。 2 提出请求一 服务请求者 l l a t c h m a k e r 卜3 回复请求 l 4 直接交互l1 1 登记广告j 服务提供者 图1 - 4 两种服务匹配模式 1 2 2 服务匹配的研究情况及其不足 l 登记广告3 提出请求 i 服务提供者 ( 1 ) 国外的研究 1 德国柏林工业大学( t e c h n i s c h eu n i v e r s i t a tb e r l i n ,t u b ) 的o w l - sm a t c h e r , 该项目用o w l - s 对w e b 服务进行描述,然后利用其中s e r v i c ep r o f i l e 的功能行为信息 对服务请求和服务描述进行匹配。它将匹配过程分为i n p u t 匹配、o u t p u t 匹配、p r o f i l e 匹配和用户自定义的p l u g i n 匹配。 2 美国乔治亚大学( u n i v e r s i t yo fg e o r g i a ) 的m e t e o r s 项目,该项目的主要出 发点是基于现行的w e b 服务工业标准,不同于上述的o w l - sm a t c h e r 项目在w e b 服务 上另外建模,它对w s d l 进行了扩展,加入了与w s d l 元素对应的语义本体概念,在 匹配中主要关注带有语义标注信息的w s d l 的匹配。 第一章绪论 3 美国卡内梅隆大学的m a s s i m op a o l u c c i 在其论文【1 0 】中提出了基于w 曲服务能 力的语义匹配思想,基于该思想的匹配算法主要匹配服务的输入与输出,并将服务的匹 配度分成了四个等级。它成为后来服务发现研究的核心思想。 4 英国马萨诸塞州理工学院的m a r kk l e i n 和美国纽约大学的a b r a h a mb e m s t e i n 1 1 l 提出了基于过程本体论的服务发现技术,过程本体论将每个w e b 服务分解成几个过程 的集合,前一个过程的输出是后一个过程的输入。过程本体论的运用有赖于m r r 过程 手册项目( t h em l t 。p r o c e s sh a n d b o o ke r o j e c t ) 的发展。 5 o l g ac a p r o t t i 和m i k ed e w a r 等人运用描述逻辑和o w l 语言规范设计出了数学 w e b 服务的匹配算法。它由m o n e t 项目发展而来,在o w l 语言的基础上发展了数学 服务描述语言( m a t h e m a t i c a lw 曲s e r v i c ed e s c r i p t i o n ) 。它作为语义w 曲服务在特殊领 域的应用具有十分重要的意义。 6 w s m f ( w e bs e r v i c e sm o d e l i n gf r a m e w o r k ) 是为开发和描述w ,e b 服务及复杂的 服务的组合的建模框架。主要包括本体、目标描述、原子服务和复杂服务和服务中介器, 使得基于w e b 服务的电子商务系统具有充分的灵活性和可扩展性。但没有对w s m f 中 服务定义具体的语法或者语义,文中指出可以使用d a m l - s 作为其中的一个选择。 7 s w s i ( s e m a n t i cw e bs e r v i c e si n i t i a t i v e ) 主要由d a r p a 和e u 资助的一个项目。 其目的是建立一个结合语义w e b 和w e b 服务技术的集成框架,使w e b 服务的提供者和 使用者在服务的发现、查找、匹配、调用、监控等各个方面能够达到最大可能的自动化 和动态集成1 “i 。 ( 2 ) 国内的研究 国内对于语义w e b 服务的研究起步相对较晚,缺乏领军人物。但是,也不乏佼佼 者。其中比较具有代表性的是中科院的史忠植等人【1 3 】。他们开发了多主体服务环境 m a g e ,并提出了基于描述逻辑的主体服务匹配算法。该算法最主要的特点在于将w e b 服务表示为c o n c e p t :a c t i o n ( 概念:动作) 的格式,然后运用描述逻辑对本体概念进 行分层推理,从而实现相适度匹配,如图1 5 所示。 a g e n t 核心l 弋d 懈式- l d l r m i 产 其他主体: a c l 编码器l d a t 8 - l d l 转换器 p i n g a g e n t e b u s s i n e s s 工 s p i d e r g s m i n e r 通信器l , a g e n t 少飞 a g e n t 通信通道 m a g e 主体平台 第一章绪论 ( 3 ) 国内外研究现状分析 通过对目前已有的语义w e b 服务基础构架平台和具体应用的比较,我们发现这些 平台或应用或多或少都存在一些缺陷。例如: 1 服务语义描述模型与现有模型不兼容,缺乏映射机制。当前w e b 服务主要采用 w s d l 描述,用u d d i 存储。而语义描述模型主要采用w e b 服务本体o w l - s 描述。 2 缺乏对服务质量的描述。随着w e b 服务发展,服务数量剧增。而且由于目前还 没有制定一个统一的服务质量标准,不同的服务提供者提供的功能相似的服务,其性能 可能存在着很大的差异。因此服务质量也成为选择最佳服务的一项重要指标。 3 匹配算法存在多样化、片面性的特点。虽然只存在推理和数量计算两种趋势,但 是在推理方面,不同的模型采用不同的推理机,不同的规则描述等;在数量计算方面, 不同的方法从不同的角度考虑问题,存在片面性,不能全面考虑语义相关度的影响因素, 出现了同等条件下的服务之间难以区别的情况i l 引。 1 3 本文的主要工作和内容 本文在分析现有语义服务匹配机制的基础上,融合其优点,首先建立了课程教学系 统的本体,然后提出了一个面向语义w e b 的服务匹配模型,之后定义了在该模型中要 用到的服务语义描述模型,然后根据该描述模型提出了一个服务模糊匹配算法。主要研 究内容包括: 第二章介绍语义网的相关技术,主要对语义w 曲的众多关键技术做了概要介绍, 包括r d f 和x m l 。 第三章主要介绍了语义网中的重要一层本体的相关概念及本体论和本体建模 语言o w l ,然后在理论的基础上,针对选课系统的本体进行需求分析,遵循建模原理 创建教学选课系统本体。 第四章主要介绍了o w l s 的相关概念和利用它实现w e b 服务语义化信息发布的方 法,提出了一个服务的语义描述模型。 第五章介绍了教学选课系统的总体设计及其流程并对各部分技术进行解析,然后对 o w l s 匹配引擎部分进行了详细设计。主要是设计了w e b 服务模糊匹配算法。 第六章o w l - s 匹配引擎的实现。介绍了所采用的组件,及其主要功能的函数实现, 并对本文算法的可行性进行了分析。 第七章总结与展望。 第二章语义w e b 的结构及其主要技术 第二章语义w e b 的结构及其主要技术 语义w e b 自从提出以来,在近几年获得了很大的发展。整个技术体系涵盖的内容 也越来越多,这里只介绍最基本的概念以及与本论文相关的一些内容。 2 1 概念与结构 语义网这个概念是b e r n e r s l e e 在x m l 2 0 0 0 会议上正式提出的【,给出的定义如 下:“语义网是一个网,它包含了文档或文档的一部分,描述了事物间的明显关系,且 包含语义信息,以利于机器的自动处理 。语义网不同于目前的w w w ,它是现有w w w 的扩展与延伸,是第二代w w w 。语义网的基本特征是面向文档所表示的数据,便于计 算机理解和处理。此外语义网还具有一定判断和推理能力。语义网是按照机器可理解的 词汇链接起来的网页信息的全球数据库,它能使网络在理解信息含义的基础上提供动态 的、主动的人机对话服务和协同工作。它将提供诸如信息代理、搜索代理、信息过滤等 智能服务。知识化w e b 上提供的这些智能服务应该超越目前这些服务的技术水平,克 服它们在功能上仅能独立运行、无法交互的限制。只有当交互性进一步增强时,具有机 器可处理信息内容的语义w e b 才会真正实现。语义网实现的基础是x m l ( 可扩展标记 语言) 。也就是说,利用x m l ,给网页信息的文件内容加入计算机可读的“标记 , 而且可以设置不同的标记符来定义不同的涵义,因此,它是可扩展的。一般用户可以使 用现有语义标记功能的软件编写语义网页,增加新的定义和规则。 语义网的七层体系结构如图2 - 1 所示【”j ,功能自下而上地增强。语义网由元数据 ( m e t a d a t a ) 、资源描述框架( r d f ) 和本体( o n t o l o g y ) 三个基本部分组成。元数据 是关于数据的数据,是具有“语义 可共享的数据。r d f 则描述网络资源的信息,它 是存放元数据的通用格式或语法结构的。r d f 通过x m l 可允许用户在文件中加入任 意的结构,而无需说明其含义。r d f 的每个代码由一个三元组构成,表达某物对某些 信任层 验证层 逻辑层 本体层 r d f + r d fs c h e m a 数 字 签 名 x m l + n s + x m ls c h e m a u n i c o d eu r i 图2 - 1 语义w e b 结构图 7 国一 剖 第二章语义w e b 的结构及其主要技术 值拥有某些属性。任何人只要对某一定义给定一个地址( u r i ) 新的动词。 第一层:u n i e o d e + u r i ( 国际码+ 统一资源标识) 它是整个体系结构的基础。其中u n i c o d e 是一个字符集, u r i 负责资源的标识,它使信息、情报精确检索成为可能。 ,就能定义新的概念、 负责处理资源的编码。 第二层:x m l + n s ( n a m es p a c e ) + x m ls c h e m a ( 可扩展标记语言+ 命名空间+ 可扩展标记语言大纲) 。 它负责从语法上表示数据的内容和结构。x m l 利用一套事先编好的元素对数据进 行标记,为计算机处理提供方便。命名空间能区分各数据元素的归属,以及转换不同域 名之间的同义词。 第三层:r d f + r d fs c h e m a ( 资源描述框架+ 资源描述框架大纲) 它负责提供语义模型来描述w e b 上的信息内容和结构。r d f 是一种描述w e b 上 的信息资源的语言,其目标是建立一种供多种元数据标准共存的框架。该框架能充分利 用各种元数据,进行基于w e b 的数据交换和利用。r d fs c h e m a 则使用机器可理解的 表述体系定义描述资源的词汇。 第四层:o n t o l o g yv o c a b u l a r y ( 本体词汇集) 它负责定义共享的知识,描述各种资源之间的联系。 第五层:l o g i c ( 逻辑) 它负责提供公理和逻辑推理规则,为智能服务提供基础。 第六层:p r o o f ( 验证) 它为智能代理间互相验证交换数据的签名提供支持。 第七层:t r u s t ( 信任) 它提供信任保证。 第五层到第七层以下面4 层为基础进行推理操作。 2 2x m l 和x m ls c h e m a 在语义w e b 的结构中x m l 和r d f 是两个重要技术。二者缺一不可,奠定了语义 w e b 的重要基础。而二者相对应的s c h e m a 技术则对文档的结构和类型进行了约束。 2 2 1x m l 内容介绍 s g m l 、h t m l 是x m l 的先驱。通用标识语言标准( s t a n d a r dg e n e r a l i z e dm a r k u p l a n g u a g e ,s g m l ) ,它是国际上定义电子文件结构和内容描述的标准,是一种非常复杂 的文档结构,主要用于大量高度结构化数据的防卫区和其它各种工业领域,利于分类和 索引【l 引。同x m l 相比,s g m l 定义的功能很强大,缺点是它不适用于w e b 数据描述, 而且s g m l 软件价格非常昂贵。超文本标识语言( h y p e r t e x tm a r k u pl a n g u a g e ,h t m l ) , 它的优点是比较适合w e b 页面的开发。随着网络应用越来越广泛,仅仅靠h t m l 这一 种文件类型来处理千变万化的文档和数据己经力不从心,h t m l 过于简单的语法严重地 第二章语义w e b 的结构及其土要技术 阻碍了用它来表现复杂的形式,而且语法十分不严密,严重影响网络信息的传送和共享。 尽管h t m l 推出了一个又一个新版本,已经有了脚本、表格、框架等功能,但始终满 足不了不断增长的需求,开发一种新的w e b 标记语言显得十分必要。w 3 c 建议使用一 种精简的s g m l 版本,x m l 就这样诞生了。 可扩展标识语言( e x t e n s i b l em a r k u pla n g u a g e ,x m l ) ,x m l 结合了s g m l 和 h t m l 的优点并消除其缺点。x m l 不仅可以描述文档数据对象本身,还能部分描述如 何处理这些数据,这使得它在应用集成领域可以大有作为。首先x m l 是一种元标记语 言,所谓“元标记 就是开发者可以根据自己的需要定义自己的标记,比如开发者可以 定义,任何满足x m l 命名规则的名称都可以标记,这就为不同的应用程序打开了大门。 新创建的标记可在文档类型定义( d o c u m e n tt v p ed e f i n i t i o n ,d t d )中加以描述。另 外,x m l 也是一种语义结构化语言。它描述了文档的结构和语义,用户可以很方便地 定义自己领域的专用标记,文档的结构也可以是任意的。当x m l 文档被用于不同应用 时,只需改变相应的表现形式,而不必修改文档本身【1 6 1 。 x m l 主要有三个要素:s c h e m a ( 模式) 、x s l ( 可扩展样式语言) 和x l l ( 可扩展 链接语言) 。s c h e m a 规定了x m l 文件的逻辑结构,定义了x m l 文件中的元素、元素 的属性以及元素和元素的属性之间的关系,它可以帮助x m l 的分析程序校验x m l 文 件标记的合法性;x s l 是用于规定x m l 文档样式的语言,它能在客户端使w e b 浏览器 改变文档的表示法,从而不需要再与服务器进行交互通信;x l l 将进一步扩展目前w e b 上已有的简单链接。 2 2 2x m ls c h e m a 介绍 语义网中主要用到了s c h e m a ,其主要作用就是用来描述x m l 文档合法结构、内 容和限制。每一个完整的s c h e m a 代表着一个x m la p p l i c a t i o n ,即一个x m l 应用。因 此s c h e m a 的“实例文档 常常用来表示一个与特定x m ls c h e m a 1 7 1 相一致的x m l 文 档。事实上,文档实例和s c h e m a 文档都不是必须要以文档的形式存在,它们可以在应 用之间以传递的字节流的形式存在,或者作为一个数据库记录及x m l 的“信息项”的 集合存在。然而为了简单化,我们总是把实例和模型看作文档或者文件,认为它们总以 文档实例或是模式文档的形式存在。s c h e m a 由x m l l 0 自描述,并且使用了命名空间, 有丰富的内嵌数据类型和强大的数据结构定义功能,充分地改造了并极大地扩展了 d t d s ( 传统描述x m l 文档结构和内容限制的机制) 的能力,将逐步替代d t d s ,成 为x m l 体系中正式的类型语言,同x m l 规范、n a m e s p a c e 规范一起成为x m l 体系 的坚实基础【1 剐。 2 3r d f 和r d fs c h e m a 2 3 1r d f 介绍 资源描述框架( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ,r d f ) 是w 3 c 组织推荐使用的 第二章语义w e b 的结构及其主要技术 用来描述资源及其之间关系的语言规范,具有简单、易扩展、开放性、易交换和易综合 等特点。r d f 的目标是为w e b 资源描述提供一种通用框架,它以一种机器可理解的方 式被表示出来,可以很方便的进行数据交换,r d f 提供了w e b 数据集成的元数据解决 方案。其作用正是将x m l 数据的语义信息无歧义地映射到一个模型中,这意味着在一 个r d f 应用中可以确定哪些部分具有什么样的语义信息,因此可以将r d f 看作元数据 层,即用来描述关于数据的数据层。所谓元数据,就是“描述数据的数据”或者“描述 信息的信息 【1 9 j 。r d f 的初衷就是希望能重新定义互联网上数据的组织方式,用一种 计算机可理解的方式来组织元数据,从而让计算机能自动处理存在着的海量数据。 r d f 的数据模型提供了一个抽象的概念框架来描述元数据,该框架通过命名的属性 和属性值来表示资源之间的关系和资源内部的关系。它包括如下的三个要素幽j : ( 1 ) r e s o u r c e s ( 资源) :所有通过r d f 描述的对象( o b j e c t ) 都看作是一个资源。一个 资源可能是整个网页,也可能是网页中的一部分,比如特定的文档中h t m l 或x m l 元 素;资源也可以是一些网页的集合,比如整个网站中所有的网页;资源也可能是不能直 接通过w e b 访问的对象,比如打印的书籍。通常以u r l 进行标识,u r i 的扩展性允许 表示任何可以想象的实体。 ( 2 ) p r o p e r t i e s ( 属性) :属性是用来描述资源的具体方面、特性或相互的关系等,用 来连接两个相关资源。每个属性有特定的含义,规定其允许值,定义能够描述的资源类 型以及与其它属性的关系。在r d fs c h e m a 标准中有对如何表述属性特征的详细规定。 ( 3 ) s t a t e m e n t s ( 声明) :一个资源加上一个特性以及该特性的值( v a l u e ) 就构成了一 个声明。声明对象可以是另外一个资源,也可以直接字面表示其内容,即可以是用u r i 规定的资源或是简单的一个字串或者是其它由x m l 定义的原数据类型。 基本上,r d f 的基本结构可以看作对象属性值的三元组语法形式,可见例 子如图2 2 所示,对象是网站地址,他的一个属性就是网站所有者,而属性值是张童。 一个三元组构成一个声明。其中对象代表一个资源,属性代表该资源的特性,值量化描 述了该资源的特性,同时也可以作为另一个声明的对象。从而元数据由一系列的声明构 成。图2 3 是用r d f 表示的一个语义网络。 i 等 图2 3r d f 表示的语义网络 第二章语义w e b 的结构及其主要技术 在“语义的可互操作性 方面,r d f 比x m l 有着显著的优势,因为任何一种数据 模型能很自然地用属性值的网络关系来表示;在继承性方面r d f 也能保证派生类 型能拥有父类型的属性,从而保证继承关系。但是r d f 本身没有提供声明这些属性的 机制,同时也没有定义属性与资源之间联系的机制,这些由r d fs c h e m a 完成。 通过上面的分析我们可以看到,r d f 具有较好的“语法的可互操作性”和“语义的 可互操作性等特点,因此可以较好满足语义化本体建模的需求。 2 3 2r d fs c h e m a 介绍 r d f 与x m l 之间的关系非常紧密,事实上,它们之间是互补的:r d f 的作用之一 是以一种标准化的、具有互操作性的模式为基于x m l 的数据规定语义。r d f 是一种 元数据模型,而x m l 是一种语法格式。r d f 数据模型可以用x m l 表示,也可以用其 它语法格式描述。r d fs c h e m a 则是基于x m l 对r d f 的一种实现1 2 。 r d fs c h e m a 使用一种机器可以理解的体系来定义描述资源的词汇,其功能就像一 个字典,可以将其理解为大纲或规范。r d fs c h e m a 的作用是: ( 1 ) 定义资源以及属性的类别; ( 2 ) 定义属性所应用的资源类以及属性值的类型; ( 3 ) 定义上述类别声明的语法; ( 4 ) 申明一些由其它机构或组织定义的元数据标准的属性类。 r d fs c h e m a 的定义和宣布使用了x m l n a m e s p a c e ( 命名空间) 机制。命名空间的 作用是用来避免不同元素被命名为相同的控制标记而给应用带来的困扰。在实际应用中 有些相同名称的控制标记在不同的领域和机构中的含义是不同的。而x m l 是非常注重 控制标记的语义含义的,所以当不同应用领域中使用了同名称的控制标记时,x m l 采 用了这一方法来区别。在r d fs c h e m a 中,每个r d f 资源都有一些核心类和属性。核 心类包括: ( 1 ) r d f s :r e s o u r c e 任何利用r d f 来表示、描述的事物都被称为“资源 ( r e s o u r c e ) ,是最上层的抽象根结点。 ( 2 ) r d f s :c l a s s _ 这里c l a s s 类似面向对象中“类 的概念,指的是事物的一 类。这一类中的一个具体事物叫做“实例( i n s t a n c e ) 。比如,哺乳动物和大象的关系。 ( 3 ) r d f s :p r o p e r t r 资源的属性。 核心属性有r d f s :t y p e 、r d f s :s u b c l a s s o f 、r d f s :s e e a l s o 、r d f s :d o m a i n 、r d f s :r a n g e 等1 2 2 1 。 第三章o n t o l o g y 的创建 第三章o n t o l o g y 的创建 在语义网的七层结构中,本体也是很关键的一层,并且在基于语义的服务匹配模型 中处于重要的支持地位,是该模型构建的基础。本章所要讨论的就是本体理论,并重点 阐述了怎样构建领域本体。 3 1 本体理论 3 1 1 本体论 o n t o l
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年事业单位工勤技能-河南-河南动物检疫员四级(中级工)历年参考题库典型考点含答案解析
- 2024版废品回收合同模板
- 2025年事业单位工勤技能-河北-河北下水道养护工三级(高级工)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-江苏-江苏防疫员五级(初级工)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-江苏-江苏收银员三级(高级工)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-广西-广西汽车驾驶与维修员三级(高级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-广东-广东食品检验工五级(初级工)历年参考题库含答案解析
- 2025年事业单位工勤技能-广东-广东热处理工四级(中级工)历年参考题库典型考点含答案解析
- 烹调基础知识培训课件
- 2025年驾驶证考试-客车理论考试-客车驾驶证(科目四)历年参考题库含答案解析(5套)
- “魅力之光”核电知识竞赛试题答案(二)(110道)
- 外科学课件:食管癌
- 汽机专业设备运行日常点检
- 环保与物业公司合作协议
- GB/T 2820.12-2002往复式内燃机驱动的交流发电机组第12部分:对安全装置的应急供电
- 设备基础知识-动设备课件
- GB/T 12599-2002金属覆盖层锡电镀层技术规范和试验方法
- 2023年西安陕鼓动力股份有限公司招聘笔试题库及答案解析
- 放射源辐射事故专项应急预案
- 微观经济学-范里安varian中级
- (完整)人教版高一英语必修一单词表
评论
0/150
提交评论