(计算机应用技术专业论文)基于owls的语义web服务自动发现、选择、执行及动态组合平台.pdf_第1页
(计算机应用技术专业论文)基于owls的语义web服务自动发现、选择、执行及动态组合平台.pdf_第2页
(计算机应用技术专业论文)基于owls的语义web服务自动发现、选择、执行及动态组合平台.pdf_第3页
(计算机应用技术专业论文)基于owls的语义web服务自动发现、选择、执行及动态组合平台.pdf_第4页
(计算机应用技术专业论文)基于owls的语义web服务自动发现、选择、执行及动态组合平台.pdf_第5页
已阅读5页,还剩80页未读 继续免费阅读

(计算机应用技术专业论文)基于owls的语义web服务自动发现、选择、执行及动态组合平台.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于0 l l s 的语义w e b 服务 自动发现、选择、执行及动态组合平台 中文摘要 随着w 曲服务技术的不断普及,用户在将来很可能会面对大量的同类型w e b 服务可供选择,这些同类型w 曲服务的功能是相同的,但其性能参数如服务响应时 间、服务费用、服务地域范围有可能不同,在这种情形下,要求用户手工寻找、选 择w e b 服务不是不现实的就是教率低下的,比较好的解决方案是由程序根据用户自 己的状态、要求及w 曲服务的参数实现自动寻找、选择w e b 服务并自动执行优选 出来的w e b 服务。目前尚没有研究人员明确提出这个问题并给出相应的完整解决方 案。本文给出了一个上述问题的基于o w l s 本体语言的实现方案,构建了在特定 领域上的同类w e b 服务自动发现、选择及执行平台。在服务发现过程中,本平台没 有采用常见的u dd f 机制,而是粟用了j a d e 的d f 机制,大大减低了服务响应延 迟,提高了系统效率。当然代价是平台不能太庞大一般只在某个特定领域上予以 实现。在服务选择过程中实现了基于地域本体的地域匹配功能,并为服务请求代理 提供了一个仞步的用户行为记忆功能。o w l s 所提供的语义支持,使本系统在自动 选择、匹配过程中具备了初步的智能性,能够初步体现不同用户的差异化需求,达 到了针对任何客户提供具有效率保障的晟优服务的目标。 而为使上述平台中的服务提供者能够在任何时问都能提供最优服务( 这是通过 动态组合w e b 服务来实现的) ,同时将动态组合w 曲服务的响应延迟限定在用户可 接受的范围之内,本文提出了一个w 曲服务的高效动态组合实现方案。目前已经实 现的、v e b 服务动态组合平台一般都有执行效率比较低的问题,用户很可能无法忍受 过于漫长的系统等待时间。因而,低下的系统执行效率很可能成为动态w 曲服务组 合欹得有效应用的重大障碍。通过组合w 曲服务替换过程的独立化、异步化、并行 化,本文提出了一种可以有效提高动态组合w e b 服务的执行效率的实现方案,并给 出了系统的实现平台原型。另外,为提高服务匹配的成功率,本文还提出了基于o w l 共享本体的w e b 服务自动功能匹配。 本文给出的两个平台联合起来可以在一定程度上实现在任何时间针对任何客户 都提供高效的最优w e b 服务的目标。 关键词:语义w e b 语义w e b 服务m s0 w l - s 江南大学硕士举位论文 基于o 礼 的语义w e b 服务自动发现、选择、执行及动态组台平台 - _ _ - _ _ w “_ - 一 o w l - sb a s 硪捌a | l b r 啦d a 饿。棚8 i c 埘d v e 悌s e l e c 稍o n e x 托h 髓蚰a n dc o m p 硒硼o f s e m 姐t i cw 曲s e r v i 麟 a h s t i a c t w i 啦糟p i dd # 矧o p m c n dp f o 越南f a f i o no f x 娓bs c i c e s ,u 贸f sw o 触nb e & e d w 油a1 0 to f s a m et y p eo f w 曲s e n ,i c e s t h e s es 枷e 帅e so f w 曲s e i c e $ p r o v i d es a n e 如n c “o n ,b u tt h e i ro l l e op a r a n l e t e r s ( i e s e r v i c or e s p o n s e | i l n e ,s e r v i c ec o s a n ds e r v i c e a r e a e 嗡c 勰b ed 任b f e n t 巍,sl m f e 越 鲢i c 醐di b e 羝c 百v e 童om a n h 8 h vs e l e 髓赫d 戥搬 w 曲s e w i c e s a g o o d w a y t os o l v e t b e p r 。b i c m i s t oa u t 。m a t e 曲e i c c 西o n 柏de x e 删t o n o f s 锄et y p co f w 曲s e r v i c e sa c c o r d i n gt ou s e r s s t a t i l s ( r e q u i r e m e n t s ) 舢dp a r a l 玳t e r so f w c bs e j c e s u pt o 石m e ,t 1 1 c r ca r en or e s 洲h c r sw h o b d n gu p 蛳sp r o b l 伽| 1 1 dg i v ea 枣o o ds o l 啦i o n 艟,i s p 8 p e r g i v e s as 西m i o no f 啪涟p m b l e mb a s e d o n w 曲s e r v i e e s 佣t o i o g y l 强g a g e o w l - s ,c o n s 扭j c 畦n g a p l a t f o m l o f a u 蛔m 缸i c 垂s c o v e r y s c l e c 百。n , 舳de x e c u t i o no f w e bs e r v i si nas p e c i 丘cd o ma j n 1 nw 幽s e r v i c e sd i s c o v e 阻t h i s p l a t f o 啪a d o p t sd fm e c h 拍i s mo f j a d er a t h e rt h 锄u d d lm e c h a n i s m ,w h i c hr e d u c e s m ef e s p o n s et i m eo f s e i c e s 蠲dl i f su pt h ee 塌e n c vo f l h es y s t e 臻b 眦t h ep l a t f 。r r n c a n t b e t o o b 澹;讧s u 跚a l | y 托a l i d o n as 哗强cd 。m a i n a 嘲m a t c h 翩c t i o bb 舔嚣d o n a r e ao n t 0 1 0 9 yi sr e a i i z o di nw 曲s e j c e ss e k c t i o n ,s c r v i c er e q u e s t a g e n tg i v e s8 鹏m e m b r a n c ef l l n c t i o no f u s e rb a h a v o i o r s 1 u d u g hs e m a n t i cs u p p o r tp r a v j d e db y o w l - s ,m ep l 娟鼬s h o w s 执s i ci 嘛l i g 嚣n e e 豫s e l e c t i o na n dm a t c h 嘲o f w e bs c r v c e s na l s 。e 利a p i 童ou s c sd i f 强瓣mn 姥d ,a n df u l 翻lm e 啤q i f e m e n t 西p r o v i d i n gb c s t s e r v i c e st oa n yc u s t o m e r sw t hh i g he 币c i e l l c m i no r d c rt op r o v i d eb e s ts e r v i c e s 卸yt i m e ( t h r o u g hd ”a m i cc o m p o s i t i o no f w 曲 s e r v i c e s ) ,dt b e e 8 p o n s et i m en o t 眈c e e d i n gt hr a l l 窘et h a lu 辩f sc a ns u f 俺lt h i sp a 辨r 棼w s a h i 垂狰e 愿c i 铺t d ”a m c m 芦s i t i 黼o f w 由s c w i s 髓ep l a t 翻s i z 葩 b c f o r eu s u a l l yh a v et h es b o n o o m i n go f l o we 衢e n cy - a n du s e r sc a n ts u 胞rt o oi o n g 煳p o n s e p e o d ;t h eb a de x e c u d 彻j m 历c i e n 叫c a l lb eab j go b s a c j e o f p r 。j i 妇i t i o n 。f d y l t 硼i cc 讲n p o s i t cw c bs e r v i c e s t h r o u 曲d i s t r b u t e d ,i n d e p e n d e n t ,p a l e l i e p i a c e m e n t p m c e s s 。f 瞻bs e i c e sc o m p o s 矗幽,也扭p 印e fg i v e s 赫a v 3 ;l 如km e 幽o d e t op 对m o t e t h ce 每即c yo f d y n a m i cw 曲s e i c e sc o m p o s i t i o n ,a n dap r o t o 唧ep l a t f o t ii sp 咒s e n t e d i no r d e rt op r o m o t et h ee 街c i e n c yo f s e r v i c e sm a t c h j n 岛a 1 1a l n o m j c 缸n c “o n a lm a t c h j n g o f w 曲s e r v i c e sb 踮e do no w ls h a r e do n t 0 1 0 9 yi sa l s ep 揩s o n l e d 羽嫦c o m b i n 撤i o no f t w op l 墩蠡珊sm e n t i 硼e d8 b o v ec 8 np r o ¥i d e 搬ts e f v i c e s 弦 s p e c i 6 cd o m a i na n yt i m ef o ra n yc o s o m e r sw i t hh i p 血e 衔c i o n c m k e 州o r d ss e m a l l t i cw e b s a n t i cw e bs e r v 沁e s ,m a s ,o w l s 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。尽我所知,除了文中特剐加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 本人为获得江南大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名: 日期:_ “年 月 关于论文使用授权的说明 本学位论文作者完全了解江南大学有关保留、使用学位论文的规 定:江南大学有权保留并向国家有关部门或机构送交论文的复印件和 磁盘,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编 入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、 汇编学位论文,并且本人电子文档的内容和纸质论文的内容相一致。 保密 第一章语义w 曲 第一章语义w e b 自从b c r r s k c 于1 9 8 9 年发明w n 】i f 以来,w e b 应用正在不断地进行深化与 扩展,但,现有w 曲应用的局限性在此过程中也日益暴露出来。例如,搜索引擎作 为重要的信息发现手段,现有的技术只是利用关键词匹配进行搜索,它经常给出大 量的无用匹配,使用者往往陷入数据的汪洋大海而无所适从,其根奉原因在于关键 词或字符串无法表达语义,语义只存在于使用者的大脑中。现有因特网技术的重要内 容是超文本系统,它的主要思想是通过统一资源标识符( u r d 对因特网上的信息进行 标记,使人们可以迅速地对因特网上的信息资源进行定位。然而,现有因特网技术 并未对信息的含义进行描述,计算机在处理信息时只是按照u r i 来定位信息,但对 信息的内容并不关心。而人们真正关心的是信息的内容,也就是资源所包含的意义a 可以认为,现有w 曲的一个重大缺陷就是语义的缺乏,语义w 曲对当前的w 曲 进行了扩展,对曲上的信息给出了定义良好的含义( 语义) 以利于机器( 或人类) 之间的相互协作交互【“。这样,w 曲上的数据不但可以为人类( 人类处理w e b 数据 的典型形式如:阅读、浏览网页,填写表单) 也可以为自动的程序所共享、处理。 如此,w 曲的功能才可以得到充分的发挥,可以实现诸如智能信息服务、个人化 、j l 曲站点、语义加强的搜索引擎等。 1 1 当前w e b 的缺陷及语义w e b 的提出 当前的w 曲是主要设计用来给人使用的,铀页中的信息本质上是没有含义 的,只有人阅读并赋予其含义后它才会有含义,机器是无法获得这种信息的含义的, 对机器来晚,它只是比特流而已。币mb e m e m k e 认为,当前的w 曲将来要发展为 语义w c b ,它提供机器可读的信息,并能够提供远超过当前w 曲能力的自动化的服 务。对数据、程序、w 曲页面及其它、b 资源的语义进行清晰的表示将实现一个基 于知识的w 曲,它将能够提供在质量上达到全新层次的服务。通过理解、b 的更多 的内容自动化的务将辅助人类达成其目标,这样,就可以提供信息源的更精确 的过滤、分类及搜索。这个过程最终将达到高度知识化的系统,其典型特征是各种 各样的专用推理服务。这些服务将在日常生活的各个方面给我们以支持,并将使我 们对信息的存取如同今天的电力一样普遍而深入。下面将当前的w 曲、来来的w 曲 的特点总结如表1 1 l jj 。 1 2 语义w e b 的应用 1 江南大学硕士学位论文基于o 礼一s 的语义w e b 服务自动发现、选择、执行及动态组合平台 没有什么技术在不能证明其具体的应用前景时就可以生存下来的。这里简单介 绍语义w 曲在三个重要领域的应用。 表1 1 、v e b 的不同发展阶段 伽1 + ld i 旋咖td e 州o p m e n tp e t i o do f w 曲 1 2 1 知识管理 在快速变化的市场面前,现代公司的竞争力很大程度上要依赖于他们开发、利 用、维护知识的能力。而现代电子媒体中的大部分信息的结构化程度很低( 不论是 存储于因特网还是企业内部网络上) ,这给发现、维护相关信息带来了很大的困难。 而越来越多的公司意识到,他们的企业内部网络可能是非常有价值的公司知识宝库。 然而,原始的信息自身并不能解决商业难题,如果对如何有效利用这些知识没 有很好的理解,这些信息就是没有什么用处的。如何将它们转化为有用的知识已经 成为一个很大的问题。公司的知识管理实质上是要利用公司的数据、信息来有效地 提升创新能力,提高生产效率及竞争力。因为全球化及因特网的影响许多组织在 地理上越来越分散,在组织上越来越多地采用l 临时虚拟团队的方式,这种组织需要 知识管理及相应工具来使企业员工更好地理解相互的上下文知识。 当然,并不是只有商业企业才需要知识管理,对科学家、学者、教育从业人员 及其他专家来说,知识管理也是很重要的,但,他们所面对的问题同商业公司的是 非常相似的。市场上已经有几种知识管理系统,它们设计用来处理一个特定组织或 2 第一章语义w 曲 团体内的知识生命周期相关的处理及操作,然而,这些系统还是有严重的局限,例 如: 1 2 1 1 信息搜索 在信息搜索方面,现有的基于关键词的搜索,因为术语的语义模糊,会返回大 量不相关信息,因为相似或相同的语义用不同的术语来表达,又会丢失信息。 1 2 1 2 信息抽取 目前,人们不得不进行大量的阅读、浏览( 文本及其它各种表达形式) 以获取 相关信息。软件代理并不具有我们一般意义上的必要知识来辅助进行信息抽取工作, 而且,代理也无法集成不同的信息源的知识。 1 0 1 3 结构化比较差的大规模文本库的维护 这也是个困难而耗费时间的工作。例如根据用户需求或其它相关因素对信息库 ( 如w 曲站点) 进行适应性调整及动态重新配制,其主要的实现瓶颈是文档的自动 生成,也没有获得完美的解决。 语义w 曲技术,特别是本体的使用,可以使我们在实现上述几个任务的过程中 获得更高程度的自动性及灵活性。例如,为了使结构化较差的信息内容相互协调一 致,或从半结构化的数据产生信息表示,这些信息或数据的语义就不仅仅要是机器 可存取的,而且必须要是机器可处理的,换句话说,语义必须基于正式的本体来予 以表达。 1 2 2 企业应用集成e a i ( e n t e r p r i s e a p p l i t i o ni n t e g n t i o n ) 由于一系列的原因,数据、信息、知识、过程及应用的集成正变得越来越重要: ( 1 ) 公司的合并经常要对现存r r 基础架构进行大规模的集成。 ( 2 ) 新的软件解决方案经常不得不集成遗产软件系统。 ( 3 ) 从费用及质量出发考虑,一个公司可能决定采用不同软件销售商的产品, 而这些产品要协同工作。 ( 4 ) 公司不得不适应一直在改变的r r 标准。 到目前为止,许多公司通过一些特别的专用项目来解决他们的集成需求,然而, 这种专用集成,灵活性及规模适应性很差。而通用的集成平台也要求大量的投资并 经常落后于最新的技术发展。一个成功的集成策略必须兼具专用集成与通用集成的 优点。它要由商业需要所推动并也要解决可扩展性和可重用性: 1 2 2 1 可扩展性 由于本体的使用,避免了专有集成的缺点,并且,在有了新的商业需求时,确 保可以对现有集成成果进行扩展。这样,可扩展性就有了很好的保证。 3 江南大学硕士学位论文基于0 w l - s 的语义w e b 服务自动发现、选择、执行及动态组合平台 1 0 2 2 可重用性 w 曲服务技术和本体的结合可以大大提高可重用性,以满足基于标准的进一步 的集成需要。 1 2 3 电子商务 b 2 b 并不是新名词,早在上个世纪六十年代,支持商业过程的电子数据交换就 已经存在了,为了完成某项商业事务,信息的发送者与接受者必须对公共内容格式 及事务协议达成共识。然而,总体来说,这些努力并没有达到预期目的,它仅仅局 限于预先安排好的交易方之问并只通过一种特定网络建立相互连接。而因特网及 w 曲的出现,极大地增加了数据的在线可用性及电子可交换信息的数量。基于因特 网的电子商务允许更大的开放性、灵活性及动态性。这些将在很多方面有助于改进 商业关系,例如:一个供应商可以同市场中的大量潜在客户建立连接;供应商与客 户可以在大量的商业伙伴中进行选择;他们可以在市场变化时及时更新商业关系。 简而言之,基于w 曲的电子商务可以让人们联系到非常大数量的潜在客户而又 不需要大量的传统联系活动。因此,虚拟企业( v i n l l a l 曲t e i p f i s e s ) 就可以根据市场 需要应运而生,而大企业就可以分割为小的单位。 但是,要达到上述层次的开放性及灵活性并不是一件容易的任务。不同硬件平 台和软件平台的集成以及为信息交换目的而产生的公共协议的普及相对而言可能就 不是最难于解决的问题了,问题的关键还是在于开放性、异质性及交互内容的动态 性。 没有标准,电子商务的开放性是无法达到的,这是从w 曲的成功所获得的经验, 但在电子商务中,对标准化的要求更为严格:这种标准化要扩展到实际的交互内容 的标准化,这远远超出了仅仅要求协议及格式的标准化。 电子商务的灵活性只有在多标准方法下才可以达到,在不同的垂直市场及不同 的文化背景下,不太可能只有一个标准。 电子商务的动态性要求标准就象生物体一样,产品、服务及贸易模式都在不断 的变化之中,一个电子贸易安排必须能够反映这个过程的动态特征。 为满足上述这些要求,本体及以本体为基础的语义w 曲技术最有可能提供一个 可行的解决方案i l “。 1 3 语义w e b 体系结构 2 0 0 0 年,b e m e f s k e 为未来的w 曲发展提出了语义,c b 的体系结构( 如图1 1 4 第一章语义w 曲 所示【蚓) ,得到了大多数相关研究人员的首肯。 图1 1 语义w 曲体系结构 f i g 1 1 s e m 6 cw 曲a l c h i 啾:t l l n 这个体系结构的最底层是u n l c o d e 和u r i 。u n i c o d e 提供信息编码的统 一表示,以消除不同编码系统导致的互操作性问题。u r i 作为标识符与w 曲资源 ( 文档、图象、可下载文件、服务、b m a i l 信箱及其他资源) 之间的一个映射, 提供w 曲资源的定位方法。 讧l 及讧l s c h e m a 在语义w 曲的体系结构中作为数据表示的方法。 r d f 提供了表达w 曲信息的一种框架,它用一种灵活的方式、以最小的限制 来表示信息。r d fs c h e m a 提供基本的资源类型与属性以支持概念建模。r d f s c h e m a 允许用户定义自己的资源类型与属性。 ) 洲l 和r d f 都能为所表述的资源提供一定的语义( 当然比较弱) 。但是垤l 中的标签( t a g s ) 和r d f 中的谓词( p r e d i c a t e s ) 都没有任何限制。这导致l 和r d f 在处理语义上可能存在如下问题:同一语义有多种词汇表示以及同一个词 汇有多种概念( 含义) 。这说明) 蝴l 与r d f 无法很好地解决语义问题。为实现 信息的语义互操作,语义w 曲利用本体( o n l o l o g ) r ) 来解决此问题。本体是从哲 学借用过来的术语,简略而言,本体描述客观世界中各种类型的实体以及实体间 的相互关系。它表达的是共同认可的、可共享的知识,人、数据库以及应用程序 都可以使用本体来共享特定领域的信息,例如,医学、工具制造、汽车修理等等, 从而可以成为语义层次上w r e b 信息共享和交换的基础。 o w l ( 0 n t o l o g yw e bl 鲫g u a g e ) 是种定义结构化的、基于w e b 的本体 语言,0 w l 相对于x m l 、r d f 和r d f s c h e m a 来说拥有更多的机制来表达语 义,从而o w l 超越了m l 、r d f 和r d f s c h e m a 仅仅能够表达网上机器可读 的文档内容的能力。以r d f 与r d f s c h e m a 为基础,o w l 加入一些新的词汇 来描述属性和类,例如类型之间的不相交性( d i s j o i n t n e s s ) ,基数( c a r d i n a t y ) , 5 江南大学硕士学位论文基于o i r l _ s 的语义w e b 服务自动发现、选择、执行及动态组合平台 等价性,属性的更丰富的类型,属性特征( 例如对称性,s y m m e t r y ) ,以及枚举 类型( e n u m e r a t e dc i a s s e s ) 。 语义w e b 相关的这几种重要语言之间的关系见图1 2 。 l o w l i ll 0 d a 心帆 歹弋 i 。肌il 帆l 上j l 吣i 。c r d f s c h e m ) 【0 l 1 卸缸m 3 p ss 帆 r d 亭 h t 地) 0 旺+ n a m cs p a + ) 眦s c h 锄 u n i o o d e u r i 固1 2 语义w 曲相关语言之甸的关系 f i 9 1 2 r c h 曲衄b e t w 啪j 柚印3 窖巴s o f 鲫m n 雠w 曲 1 3 1x m l 与x m ls c h e m a ) 洲诹消了l r 蹦l 的显示样式能力与布局描述能力,突出了元素结构的描述能 力,具有明确的语法结构,在语义、e b 的体系结构中作为数据表示的方法。 一个“l 文档由一系列正确嵌套的开放或封闭的标签( t a g ) 所组成,标签可 能有一些属性值对。对x m l 来说,比较关键的一点是标签的词汇表及其允许 的联合是不固定的,但可由每个“l 应用来定义,舡的基本数据模型是带有标 号的树,其中的每个标签对应于数据模型中的一个带标号节点,而每个嵌套的子标 签是其孩子。我们要特别注意的一点是:同样的语义信息可以有多个不同的) 谢l 表达形式。 ) 锄l 主要用来做下面几件事情:作为其他标记语言的序列化语法:作为w 曲 页的语义标记;作为一种统一的数据交换格式。 d 1 巾和讧l s c h e m a 都是用来定义订l 文档的语法的。 1 3 2r d f 与r d fs c h e 哟 6 第一章语义w 曲 1 3 2 1r d f 虽然v i l 有明确的语法与结构,但它没有提供语义透明性。语义透明性意味着 数据中的表达式如实表达了相应概念的含义。为解决此问题,w 3 c 提出了资源描述 框架r d f ( r e s o u r c ed e s c r i p t i o nf r a m e w o n ) 、r d fs c h e m a 以及建立在r d f 、r d f s c h e m a 之上的本体( o n t o l o 科) 语言o w l 来解决语义透明性问题,为w 曲信息提供 语义表达方法。 r d f 是个抽象模型,故而,r d f 是语法独立的,r i ) f 中有三个主要概念:资源、 属性以及属性的取值。 资源可以被认为是具有u 的任何事物,u r j 是个相当一般的标识符,许多现存 的标识符都可以用u r j 来表达,因为u l u 引用可以定义为任何事物,所以任何事物都 可以是资源。 属性是资源的某个特定的方面。每个属性都有其自己的语义。它可能只允许在 特定范围内的取值,或者这个属性只能应用在特定的资源上。但这种约束不是r d f 模型的一部分,它们是i fs c h e m a 规范的一部分。 图1 3一个r d f 声明的例子 r g1 3 a ne x a m p i eo fr d fs t a t e m e m 属性的取值有两种类型,第一种是文字( 例如字符串) ,第二种是一个新的资源 ( 这个资源有可能是匿名资源) 。 下面来看一个例子。如图1 3 所示,一个r d f 声明由椭圆形中的资源、箭头表示 的属性及矩形中的取值构成。图中的r i ) f 声明给出了这样一个事实:j o h ns l i t h ( 用 u r i :h t l p :f 胛 n 批x a m p l e c 0 咖e n 沁n 鲫o h ns m i t h 来标识) 有个朋友m a r i e rk e r r y ,这 里,属性h 鹅f f i e n d 的取值为一个字符串“m a r i e rk e i r y ”。 下面给出属性h 卸f n e n d ”取值为匿名资源的例子( 见图1 4 ) ,这个匿名资源 同时又由另外两个声明来描述,其含义为,j o h ns m i t h 有个朋友,这个朋友的名字 叫做m a r i e rk e n y ,e m a i l 地址为m a r i e r _ k e r r y c x 锄p l e c o m 。 7 江南大学硕士学位论文基于o w l - s 的语义w e b 服务自动发现、选择、执行及动态组合平台 图 4一个含有匿名资源的r d f 图 f i g1 4 a f a p hc 0 t a i n i n g 卸仰y m 伽s 脚w c e 另外,我们经常还有表达资源集合的需要,例如,要表示一个w 曲页面由多个 人创建,要列出选修某门课程的所有学生或某个软件包的所有模块。l 膜型采用 i m 瞎器结构( c o n t a i n e rs t m c t l 】r e ) 来表达资源或文字的集合。容器结构共有三种类 型,一是包( b a g ) ,包是个资源或文字的无序集合;二是序列( s e q u c n c e ) ,这是有 序的资源或文字的集合;三是任选容器( a l t e m a t i v e ) ,表达从多个资源中选取其中 一个资源。图1 5 表示参加代数课程( 用u r i :h t l p :,嘲e x a m p l e c o m , c o u r s 洲g e b f a 表达) 学习的学生包括有m a i i e r 、m i k e 、j o l l i l 、k e r r y ,这个例子里使 用了包结构。 简略而言,r d f 是一个描述事物的语法独立的方法,其数学基础是图理论,图 分为有向图与无向图,r d f 为了严格区分资源( 或说主题) 和属性值( 或说对象) , 它采用了有向图。在r d f 中,有三种类型的节点:u r l 引用、文字( 1 i t c r a l s ) 及空节 点。u r i 引用代表被表述的事物,文字基本上可以看成字符串。而图中节点间的连 线对应于资源的属性,这些连线都是有方向的,它从资源指向属性值。但r d f 没有 提供什么方法来标识资源或属性的类型( 这是r d f s c h e m a 的任务) 。 下面根据r d f 的正式发布规范给出其相关概念的正式描述。r d f 的任何表达式 8 第一章语义w 曲 的基础结构都是三元组( t r i p l e ) 。每个三元组由主题( s u b j e c t ) 、谓词( p r e d 渤t e ) ( 也叫属性h o p e n y ) 以及对象( o b j c c t ) 组成。这些三元组的集合就构成了r d f 图。 三元组可以用两个节点一个有向弧来表示,有向弧总是从主题指向对象。如图1 6 所 示【3 2 】。 图1 6r d f 三元组 f i 9 1 6 r d f “p l e r d f 三元组可以用来表示简单的事实( 一般是表达两个事物之间的关系) ,其 中谓词代表关系名,主题与对象分别代表这两个事物。 1 3 2 2 r d f 与x 札煳ls c h e 帕的关系及区别 r d f 模型定义本身根本同咀。是没有关系的,但x m l 可以作为r d f 的表示语 法,r d f 规范定义了用讧l 来编码r d f 声明的标准语法。下面从几个方面来具体比 较r d f 与x m 删ls c h e m a 的区别。 首先,r d f 模型与讧l 模型具有根本的差异。讧i 激据模型是面向文本标记的 标签树,而r d f 具有一个非常简单的由标签弧所组成的模型。虽说特定的r d f 声明 形成了一个图,这个图可以序列化为皿文档。但垤屿幢l s c h e m a 主要是设计 用来表达固定的类似树的文档,如果用它们来表达元数据,灵活性将非常差。元数 据,就其本质而言,是主观的、分布式的并可以用不同的形式来表达。r d f 模型, 虽然简单,但具有充分的灵活性来支持元数据的这些特性。 其次,r d f 与x m l s c h e m a 的资源具有根本差异。) 0 订l s c h e m a 中的节点是在一 个) 洲l 文档结构的特定位置的节点,r d f 节点不是文档自身中的节点,而是具有u r i 的任何资源。 另外,x m l s c h 锄a 与r d f 的语义也具有根本差异。订l s c h e m a 具有一个语法 解释,限制了可以生成的相应l 文档。r d f ,有个语义解释。x m ls c h e m a 用来 建模x m l ,文档,r d 硐来建模知识。 最后,它们的区别可以总结如下:咀m l s c h e m a 是个数据建模语言,而r d f 是个元数据建模语言。当元数据需要具体编码时,幢l 就是非常有用的候选格式之 一,但以纯粹的咀格式来建模元数据会严重地限制其灵活性。 1 3 2 3r d fs c h e 帕 9 江南大学硕士学位论文基于呷l s 的语义b 服务自动发现、选择、执行及动态组合平台 r d f 提供的是非常基本的建模原语,而r d fs c h e m a 规范进一步定义了更多的建 模原语。也就是说,r d fs c h e m 通过给特定的资源赋予形式上的特定语义而扩展了 ( 或者说丰富了) r d f ,例如r d 缸:s u b c l a 豁o f 、r d f s :c l a s s 等。这些语义是r d 既法表 达的,当然,如果l f 也能够表达这些语义,r d f s c h e m a 就没必要存在了。 r d fs c h e m a 与) a 恤。s c h e m a 也是完全不同的,) 湖l s c h e m a 以及d 皿s 描述一个 x m l 文档的标签的次序及联结方式。而r d fs c h e m a 提供一个r d f 数据模型中语句 的解释信息而对r d 瞄述的语法形式没有约束。 图1 7r d f s 建模原语的子类关系结构 f i g1 7s u b c l a s sr e i a i i o n so fr d f sm o d 酬j n gp r m 诖镐 下面简要地讨论一下r d f s 的总体结构及其主要建模原语【1 5 】。 根据b r i c l 【l e y 柚dg l l h a 在文科1 6 】中的建议规范,图1 7 给出了r d f s 的子类关 系结构,图1 8 给出了i f s 原语的实例关系结构。其中的“r d p 前缀指r d f 命名 空间( 也就是说,具有这个前缀的原语已经在r d f 中予以定义了) 而“i d f s ”前缀 表示这是由r d f s 定义的新原语。需要注意的是,属性r d 砖:s u b c l a 辐o f 、r d f t y p e 、 r d f s :d o m a i n 及f d f s :面g e 既用来作为r d fs c h e m a 规范的原语构造,也作为r d f 属 性的特定实例。这种双重角色可以把r d f s :s u b c l a s s o f 同其它的早前定义的或新定义 的r d f 属性一样作为r d f 属性,也可以在r d fs c h e m a 定义中引入自我引用,同 常规的模型及元建模方法相比较,这种方法相当独特。当然,这使r d fs c h e m a 规 范难以阅读及形式化i l ”。 下面详细介绍一下r d f s 中主要的类、属性及约束。 首先介绍核心类。 核心类包括r d f s r e u r c c ,f d f p i o p e n y 及r d f s :c l a s s 。由r d f 表达式所表达的任何 事物都是r d 6 :r c s o u r c c 的实例,类f d 船i o p e r t y 是所有属性的类,而f d e s :a a s s 用来定义 r d f s 中的概念,也就是说,每个概念都是r d 矗:c l a s s 的实例。 1 0 第一章语义w 曲 下面介绍核心属性。 核心属性包括f d f t y p e 、r d f s :s u b a a 蹈o f 、r d 盎:s u b p m p c n y o f 。属性关系r d f 哆p e 用来建立资源与类之间的实例关系( i n s t 卸c e m f ) ,子类关系( r d 岛:s u b a a s s o f ) 用来 建模类的包含( 层次) 等级结构并具有传递性。一个类可以是多个其它类的子类, 然而,一个类不能是其自身的子类也不可以是其子类的子类。子属性关系 ( r d 盘:锄b p m p e n y o f ) 建模属性问的包含层次结构。如果有三元组p 2 r d 缸:s u b p i o p 呻o fp 1 ,这说明p 2 是p 1 的子属性,如果资源r 具有属性p 2 ,其取值为 v ,则可以推出资源r 也具有取值为v 的属性p 1 。 圈1 8r d f s 建模原语的实例关系结构 f j g1 8i n s t c e o fr e i 酬。瞒o fr d f sm o d e l i n gp n m i t f v e s 最后介绍一下核心约束。 核心约束包括r d f s :c 0 n s h a i n 依髂o u r c e 、r d f s :c o n s t r a i n t n o p c n y 、r d 缸:瑚g c 及 r d 盘:d o m a i n ,其中,r d 矗:c o n s t r a i n t r e u r 定义了所有约束的类, r d f s :c o n s t r a _ i n t p m p e n y 是r d 蠡:c 0 n s t r a i n 限e s o 吣及r d 船1 1 0 p c n y 的子集,涵盖了用来定 义约束的所有属性,目前,它有两个实例:i d 砖:r 柚g e 及r d f s :d o 越血,一个属性不允 许表达两个或更多的啪g e 约束,而d o m a i 约束可以。 1 3 3 本体层与鹏c 的w e b 本体语言标准0 1 | | l m ) fs c h e m a 提供语义来定义词汇表、结构及约束以表达w 曲资源的元数据。 然而,r d fs c h e m a 中定义的原语的正式的语义并没有提供,并且,这些原语的表达 能力对于进行完全的本体建模及推理来说是不充分的。为完成这些任务,必须要在 r d fs c h e m a 之上加入一个额外的层次【1 卯,这就是本体层。 1 3 3 1 本体描述语言与描述逻辑 本体描述语言起源于历史上人工智能领域对知识表示的研究,主要有以下语言 1 1 江南大学硕士学位论文 基于a 叽一s 的语义w e b 服务自动发现、选择、执行及动态组合平台 或环境为代表:f 与o n t o l i n g i l a ,0 k b c ( o p e n 】m o w l e d g c b a s e 锄e c t i v i t y ) ,o c m l ( o p e m 吐o n a l 伽c 印t l l a l 肿d e h n gl 柚g i l a g e ) ,f r a m el d 如l o o m 等。 近年来,w 曲技术为全球信息共享提供了便捷手段,以共享为特征的本体论与 w 曲技术结合是必然趋势在此背景下,基于w 曲标准的本体描述语言( 以下简称为 “w 曲本体语言”) 正成为本体论研究和应用的热点,如s i i o e p 9 】( s i m p l e 删l o n t o l o g ) rc x t c 璐i o n ) ,o m l 【删( o n t o l o g ym a f h pl 卸g t i a g e ) ,x o lf 4 1 1 0 lb 鹋e d t o l o g y c x c h 柚g cl 柚g u a g e ) 等【3 l 。 描述逻辑d l ( d e s c r i p t i o nl o 画岱) 是近2 0 多年来人工智能领域研究和开发的一个 相当重要的知识表示语言,目前正被积极应用于本体描述,或者作为其他本体描述 语言的基础。例如,o w l 就是建立在讧i r d f 等已有标准基础上,通过添加大量 的基于描述逻辑的语义原语来描述和构建各种本体。这里,“描述”是指对一个领域 知识采用描述的方式表达,即利用概念和规则构造符将原子概念f 一元谓词) 和原子 规则( 二元谓词) 构建出描述表达式;“逻辑”是指d l 采用了正规的基于逻辑的语义, 这与语义网络及框架等知识表示机制是不同的,例如,用描述逻辑描述“1 个男人 与1 位医生结婚,他们至少有5 个孩子,并且这些孩子都是教授”这一语义如下: h u m 姐nf e m a l en 砌a r r i e d d o c t o rn ( 5 h 弱c l l i l d ) np h a s c h i l d p i o f c s r 1 1 们。 为什么本体描述语言如a ( m l 、o i l 、d a m l + o i l 圾o w l 都建立在描述逻辑的 基础上,这是因为描述逻辑具有下面几个对于本体语言来说非常具有吸引力的关键 特征【2 1 】: 首先是良好的表达性能,描述逻辑具有高度的表达能力,能够对领域概念进行 丰富而复杂的描述。概念可以根据其属性以及与其它概念的关系予以定义。当然, 在0 w l 中,并没有必要使用描述逻辑的所有表达能力,然而所有的本体都可以作为 简单的分类学来予以表达。 其次是自动推理能力,描述逻辑是一种逻辑,这意味着一种对于语言的形式属 性的清晰理解,这使推理器( r e 勰o n e r ) 的开发成为可能,推理器是这样一种软件, 它能够检测本体的一致性并能够推理出一个概念是另外一种类型的概念。这后一种 特征意味着概念层次结构可以基于本体的内容予以自动推理得出而不是只能由本体 构建专家手工给出。 最后是具有组合特性( m p o s i t i o n a l i t y ) ,前两个特征可以使我们用一种组合的 方法来建造本体,也就是说通过将已经定义好的概念、属性组合起来形成新的概念。 这意味着没有必要预先确定并列举所有的本体概念,从而在建造大规模本体的过程 中具有更好的可管理性及灵活性。 描述逻辑同基于框架的本体语言是不同的,这主要是因为它们在自动推理过程 第一章语义1 】l ,e b 中的可经受检验的能力。描述逻辑具有定义良好的语义,这使本体中的概念定义具 有明确的机器可处理的解释( 语义) ,其最重要的实用功能是描

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论