(计算机应用技术专业论文)语义web服务发现及其应用研究.pdf_第1页
(计算机应用技术专业论文)语义web服务发现及其应用研究.pdf_第2页
(计算机应用技术专业论文)语义web服务发现及其应用研究.pdf_第3页
(计算机应用技术专业论文)语义web服务发现及其应用研究.pdf_第4页
(计算机应用技术专业论文)语义web服务发现及其应用研究.pdf_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语义w e b 服务发现及其应用研究 摘要 语义w e b 是w e b 发展的一个新兴方向,致力于w e b 上信息的语义化。而w e b 服务则将w e b 应用以服务的形式提供给用户,隐藏了其实现的具体细节。语义 w e b 服务就是给w e b 服务的定义中加入语义信息,这能够帮助智能a g e n t 更好 地利用w e b 服务。在相关理论的研究基础上,本文主要致力于语义w e b 服务的 发现和其在电子商务领域的应用研究。 在分析了语义w e b 服务发现的任务之后,本文提出了分级匹配的语义w e b 服务发现策略,论述了各级在匹配过程的地位和作用,并详细给出了在每一级 匹配中所采用的具体算法,对u d d i 作了针对语义w e b 服务发现的语义扩展,给 出了语义w e b 服务匹配器的框架结构。最后文章分析了传统电子商务模型的不 足之处,提出了一种基于语义w e b 服务的电子商务模型,给出了基于语义w e b 服务的电子商务系统集成模型以及结合b 2 b 和b 2 c 两种交易模式的电子商务具 体实现方案。 关键词:语义w e b ,w e b 服务,语义w e b 服务,o i r l s ,电子商务 r e s e a r c h 蛐s e m a n t i cw e bs e r v i c ed i s c o v e r ya n di t sa p p l i c a t i o n a b s t r e a t s e m a n t i cw e bi sa i le l n e r g i n gd i r e c t i o no fw e b e v o l u t i o n ,a n di th a m m e r sa tt h e s e 擞a n i z a t i o 歉o fw e bi n 秘糯肄t i o 珏a 娃dw e bs e r v i e op r o v i d o sw o b 鼯p l i c a 专i o 矬l o u s e r sw i t ht h ef b f mo fs e r v i c e ,a n dh i d o st h ed e t a i l so fi t sr e a l i z a t i o n s e m a n t i cw e b 8 e n ,i c ea i m st oa d ds e m a n t i ci n f o r m a t i o nt ow e b s e r v i c e ,w h i c hc a nh e l pi n t e l l i 馥e n t a g e n t s t ou s ew e bs e r v i c e sb e t t e r 。t h i st h e s i s m a i n l yf o c u s e so nr e s e a r c ho f s e m a 牲l i ew e bs e f v i e ed i s e o v e l 了a 鞋di t s 氇p p | l e 鑫耋主。藏i 藏e * b 珏s i 矗e s s 薹鼍e | d a f t e ra n a l y z i n gt h et a 8 ko fs e m a n t i cw e bs e f v i c ed i s c o v e r y ,t h i st h e s i sa p p l i e s t h es t r a t e g yo fr a n k i n gm a t c h i n gt os e m a n t i cw e b8 e r v i c ed i s c o v e r y ,d e s c r i b e st h e s t a t u sa n df h n c t i o no f e v e r y r a n k d u f i n g t h ec o 甜s eo fs 嚣r v i c e m a t c h i n g , a r t 主c 越l a f l yg i v e s t h e i 蠢i o g r a p 矗i e a 茁i 氇m e l i eo f m g t c 量l i n g i n e v e r yr 疆n k , 8 e m a n t i c a l l ye x p a n d st h eu d d i f o rs e m a n t i cw e bs e r v i c ed i s c o v e r y ,a n dg i v e 8t h e f r a m e w o r ko rs e m a n t i cw e bs e r v i c em a t c h m a k e r f i n a l l yt h i st h e s i s a n a l y z e st h e d i s a d v a n t a g eo ft r a d i t i o n a le * b 珏s 魏e s sl 疑o d e l s ,p r e s e n t s 姐e b 珏s i 擐e s sm o d e lb 鑫s e d o ns e m a n t i cw e b s e r v i c e ,a n dg i v e st h ee 如u s i n e s ss y s t e m c o m p o s i t i o nm o d e l b a s e d o ns e m a n t i cw e bs e r v i c ea l l d t h em a t e r i a lr e a l i z a t i o ns c h e m eo fe - b u 8 i n e s s c o m b i n i n gb 2 b a n db 2 ct r a d em o d e 8 1 ( e yw o r d s :s e m 锄t i cw 曲,w 曲s e r v i c e ,s e m 铷瞄cw 曲s e r v i c e ,o w l s ,e - b u s i n 髂s 合肥工业大学 本论文经答辩委员会全体委员审查,确认符合合肥工业 大学硕士学位论文质量要求。 答辩委员会签名:( 工作单位、职称) 彬? 惮 哮 霎 杪掣i 珥臼 一、 郑铜钒俨俘 彳卯叫v缝歹吖,一珈鬟柳彬 图表目录 图1 1 语义w e b 的体系结构 图1 2 w e bs e r v i c e 的体系架构 图2 1r d f 有向图表示 图2 2r d f 的) ( m l 语法表示 图2 3r d f ( s ) 的类和资源 图2 4 针对r d f 模式的类层次 图2 5 一个本体定义示例 图2 6o w l s 的上层结构 图3 10 w l ss e r v i c e p r o f i l e 图3 2 服务发现示意图 图3 3 服务匹配分级策略示意图 图3 4 同一本体中两个概念的匹配 图3 5 不同本体中两个概念的匹配 图3 6 两个概念属性集间的匹配 图3 70 w l s u d d i 匹配器框架的系统结构图 图3 8 匹配器的流程图 图3 9 服务请求界面 图3 1 0 语义w e b 服务发现的结果集 图4 1 基于语义w e b 环境的企业系统集成模型 图4 2 语义w e b 环境下的电子商务具体实现方案 表3 1图3 4 中说明的四种情况 表3 2 同一本体二概念的匹配计算 表3 3 五对概念间的比较 表3 4 函数s i m i l a r i t y ( p o ,p r ) 的部分计算结果 表3 5 函数m ( p r o ( 0 i ) ,p r o ( r i ) ) 的计算结果 表3 6 函数弛( o i ,r i ) 的计算结果 0,n挖他坫船拈凹弛踮昌;虬眈铊s穹弘盯盯船 独刽性声明 本人声明所呈交的学位论文是本人强导师指导下进行的研究工作及取得的研究成果。据 我掰麴,除了文孛特鬟麓戳稼恚和致澍静缝方努,论文孛不包含冀恕a 已经发表或撰篝过静 研究成聚,也不包含为获得盒匿王戥鑫堂 或其他教育机构的学位或证书而使月! i 过的材 糙。与我一同工作的圊惑对本研究所徽的任何贡献均日在论文中搀下明确的说明并袭示谢 意。 学位论文作者签字 多签字日期:加r 口厂颦f 月角 学位论文版权使用授权书 本学位论文作者完众了解盒目g 纛挫盍堂有哭保留、使用学位论文的规定,有权保留 著蠢謦窳鸯关部门或撬耩送交论文戆笺簿锌器疆盘,灸诲逶文被套螽或整蠲。本大授较垒 自墨王塑式鲎可以将学位论文的全部或部分论文内容编入有关数据席进行检索,可以采用影 印、缩印或扫描等复制警段保存、汇编学位论文。 ( 绦密戆学整论文在解塞嚣逶震零攫较每) 学位论文作者签名:事妒凌毛僮 签字日期:沙可;f 二严丑 学位论文作者毕业后去向: 工传单位; 道讯缝皱; 搏师签名: 乏心 然字日期: 疗年月力日 电话: 女# 编: 致谢 在本论文完成之际,谨向我的导师穆斌副教授和王浩教授致以真诚的感谢! 本论文的科研工作和撰写都是在穆老师和王老师的精心指导下完成的。常言道: 学高为师,身正为范,他们以严谨的治学作风、不断进取的治学态度、渊博的 专业知识、宽厚待人的老师风范不仅使我在攻读硕士学位过程中受益匪浅,而 且为我树立了工作中学习的楷模。 我还要真诚地感谢计算机学院胡学钢副院长、王浩副院长在我的学习和生 活方面给予的关心、帮助和指导,正是你们所领导、组织的k d d 研讨会将我引 入了科学研究的殿堂。在穆老师赴加拿大做访问学者期间是你们的无私帮助使 我解决了许多学习和生活上的困难。 感谢候整风教授、刘小平教授等老师授予我各个方向的专业知识以及其他 计算机与信息学院的老师,正是因为他们辛勤地教导,使我顺利地完成了学业, 增长了见识和才干。 感谢我的师兄姐沈国海、夏俊、费爱蓉、王长宁以及张晨或等同学。在平 时和他们的交流和探讨中,使我消除了许多疑惑,开阔了视野,发现了自己的 许多不足,也学到了许多新知识。 特别感谢我的父母,没有他们勤劳的双手和辛勤的汗水就没有我的今天, 希望这篇论文没有辜负他们对我的关怀与期望。 再次感谢在这三年中所有给予我帮助的老师和同学们! 钟福金 2 0 0 5 年5 月 第一章绪论 随着计算机技术的高速发展,i n t e r n e t 作为人们获取信息的一种重要的手 段正以前所未有的速度广泛应用于社会政治经济生活的各个领域,有力地对推 动着人类文明的进步和社会的发展。在i n t e r n e t 中作用和影响最大的是w o r l d w i d ew e b ( 以下简称w e b ) ,w e b 页面的数量是海量的,并且其数量正在以指数 级别增长,与此同时各种各样以w e b 为平台的应用及软件业也在不断的出现和 发展。 然而,在伴随着w e b 成功的同时,呈指数级增长的海量信息使得来自各领 域的用户对信息的查找、访问、表示以及维护变得越来越困难起来。“丰富的 数据和贫乏的知识问题”越来越突出,主要的原因是目前的w e b 对信息的表示 主要是“呈现”示的,大量的信息以自然语言、图片等方式罗列出来,使人淹 没于知识的辨别,提取等复杂的劳动中。对于目前w e b 上的信息,计算机只能 从格式上来处理和验证,并不能处理知识级别的问题。 从目前情况看,i n t e r n e t 要想完全发挥其威力,不仅在于更快的处理器和 更多的带宽,还在于建立一种更有利于交流与对话的机制,排除一切平台和语 言的分歧,以自由、平等、开放为原则,以人类对现实世界的一致理解为基础, 为全人类提供一种全新的、高质量的信息服务。 但是,仅依靠一种统一的w e b 语言从语法上来实现信息的交换和共享还是 远远不够的。例如,两个应用系统都采用x m l 作为信息交换的格式。但怎么能 保证它们表述的是同一个意思? 标记语言中一个元素和其子元素的关系,是超类 与子类的关系还是组成关系? 计算机能够区分吗? 与“机器可读”相比,“机器 可理解”是必要的和重要的。这就需要一种机制,使得计算机不但是能读取数 据,还要能理解和区分数据的语义,实现w e b 信息语义层次上的互操作性。 由于现有互联网技术的局限,互联网上信息处理的自动化、智能化程度是 很低的,计算机处理器的强大功能也没有得到有效的利用,无法实现w e b 信息语 义层次上的互操作性。互联网技术的研究者正在研究新的技术来改变这种状况, 而其中最令人瞩目的就是语义w e b 技术。1 9 9 8 年,w 唧的发明者t i mb e r n e r s l e e 首次提出了“s e m a n t i cw e b ”。1 的概念。s e m a n t i cw e b 建立在x m l 0 1 的表示基础之上, 通过给网页加注“语义”信息,从而使得信息可以被机器“理解”,有利于搜索引擎进行 复杂的信息查询,有利于软件a g e n t 的知识理解和推理。这里所说的“语义”不是我们 平常意义上所指的语义,它是指“机器可处理”( m a c h i n ep r o c e s s a b l e ) 的信息,丽 不是自然语言的理解,也不是人们可理解的信息。 稍建语义箨e b 豹工僚动力愈来愈跫“3 。逶过内容蔼不仅是关键字静方式对释曲 资源进行访问将很快变成现实。在这场运幼中一个重黉的方向就是开发新一代 豹鼢b 标记语言,例如0 祝“帮它静静任b a 札0 i l 8 “”。这些语言能够留建任意领 域的本体以及在具体w e b 站点的描述中对这些本体的实例化。w e b 资源中最重要 的是那些能够提供礴e b 服务的鄢都分。通过服务的方式,我们以为w e b 站点不仅 能提供羚态的信息丽且能够实现现实生活中的某些行为或改变,例如购哭一个 产品成控制一台物理设备。谮义w e b 应当能够使用户自动地嶷位、选择、使用、 组建秘监控骠e b 暇务。添义驿e b 与驿e b 服务戆结会掀起了一般疆究语义w e b 鼹务毂 狂潮。 1 2 语义w 曲的概念敏其与传统w 曲的箧剐 1 2 1 谱义w 如的概念 简而富之,语义w e b 基于这样一种思想;w e b 上定义和链接的数据不应该仅 仅蹩必了格式上熬显暴,经入更客荔理瓣,瑟羹霹疆在蔷耱瘦爰疆亭孛谴掇器 也能够理解,并自动进行相应处理。语义唧e b 的嗣标就是通过向数据中添加机器 胃毽瓣静谬义,虢及使霜窟发往静嚣数据来籍鬻e b 上豹海骜= 信怠激一静赣器可 理解的方式组织越来,以满足w e b 应用对数据互操作性的要求。t i mb e r n e r s l e e 给密了戳下定义:“语义再e b 是一个两,它包含了文档和文槠的一魑部分,描述 了事物间的明显关系,弗且包含语义信息,以利于机器的自动处理”。 在x m l 2 0 0 0 大会的重要发言中,t i mb e r n e r s l e e 专门解释了“语义”和 “驿e b ”薅个词的食义。在“驿e b ”鹜愿是霹导航空闻的思想,用u r l ( u n i v e r s a l r e s o u r c ei d e n t i f i e r ,统一资源标识符) 映射别资源上。谱义w e b 所指的“语 义”是“毒睡 器霹处理”,恧苓是是然语砉语义鼗入翦攘理。对于数据,语义亵 达了机器能对这魈数据做些什么。糟你给出一线数据剿一台机器,它能够用这 些数疆敲爨委确事情,虢嚣它逶过了“语义测试”。 语义w e b 并不追求传统意义上的人工智能,丽是寻求w e b 主体问相赢通信 戆一种“共同语富”和相关试汇:语义鬻曲静豢熹藏在“约定”,就是阚上韵 主体在通信时相甄理解所说的“资源”是同一个东西,以及这个东西和别的东 西之闯的关系。即使摊理能力是弱的,也可戳满足黼前的应用。并且此处的 “理解”不是要求机器去解几何题竣者进行辩论,恧是象网络协议样对“资 源”( 在t c p i p 里就怒地址、握手协议、缓冲簿) 达成共识,然后软件代理 裁可以理麟网页上豹姿源到魔在描述传么概念,实现机器骞凌处理镶息。数据敬 清楚语义加上领域知识( 即本体) 将使得使w e b 上信息处理和集成的机器自动化 矍燕餐易,实瑗鄹终戴务臻黪瓣更鸯嚣丰塞纯。 2 实现语义w e b 的目标有许多中间的和相必的工作要做,w w w 的创始人t i j 】 b e r n e r s l e e 描述了语义1 】e b 结榴的设想,认为语义w e b 是一个多层次结构, 各层葵筑逐渐增强,下垂囱主蘑瓣鬓支持,荚结构翔蓬l + l 藏示8 3 。下覆蠡瘫 向上简蘩叙述一下备层的功能。 r u l e s 1 h i s l 4 j 警 i 唧o f受 赔 岔 苞 4 髻 l o 窟j c 管s e 譬 彗 d e s o n t o l o 舒v o 糟钿l i r y 毒 糯& d o c ,r d m t d f s c h e m a x 雠+ n s + x h s 曲哪a 孺耗醚ev 瓤 图l - l 语义w e b 的体系结构 第一层是u n c o d e 和u r i ,它l f l 是整个语义b 的语法表示基础。u n i c o d e 是一耱绞一戆字簿编褥系统( 采麓十六整二遴麓缓强) ,支持蓬赛上掰商静主要 语言文本的集合,u r i 是一种标准的标识i n t e r n e t 资源的方法,是对当前w e b 所使用的u r l ( u n i v e r s a :lr e s o u r c el o c a t o r ) 的扩展。作为i n t e r n e t 资源的一 种标准谈裂方法,u r i 可戬进蟹燹为精确懿淡源表示,傻信惠的糖礁检索成为 可能。 第三层是x m l + n s ( n a m e s p a c 命) + x m l s c h e m a 婚1 ,用于从语法上表示数据的内 容和结构,通过使用标准的格式语言,将互联啜上资源和信息的表现形式、数 据结稳秘内容分离。x 琵( e x t e n s 强l e 瓣8 r k 鞋耠l a n g 鞋8 9 e ) 惫会一缀麓魅,侄 罨 人可以用这些规则剞建一个标记语言。n s ( n 8 m es p a c e ) 是x 札名称空间,由u r i 索引确定在x m l 文档中用于区别元素类型和属性名。x m ls c h e m a 用予定义x m l 文档中肖散的语法。以上两层的形式化研究方蟊人们已经达成了广泛的共识, x 鞋l 文秘懿数量也委在逐逮瓣滢灏, 第三层是r d f + r d f s c h e m a “”,其提供的语义模型用予描述w e b 上的资源及 其类型,为网上资源描述提供了一种通用表永框架,实现数据集成的冗数据解 决方寨。r d f ( r e s o h r e ed e s c r l t i o n 雒e 霉o r k ,姿漂撵述框架) 霹戥番终语 义w e b 体系结捣中舆有语义往豹第一层,按照w 3 c ( 并疆鬻c o n s o r t i u m ,强联网联 合组织) 的推荐标准】,r d f 是:“一种处理辩数据的基础,它提供了w e b 上各 种应用之间交换机器可理解信怠的协同工作熊力。”r d f 数据模型包括三个基 本组袋酃分;资源( 戆逶:过馨l l l 萼| 震茨莛爨攀狻) 、震魏 被撼述瓣炎滚夔特 性) 和语句( 包括弓i 用资源的指针以及该资源属性和属髋值的表达筑) 。r d f s c h e m a 猩r d f 之内定义了一个简单的本体建横元语,包括炎、类和属性之间的 is a 关系以及属性的领域和范围限制口r d f 和r d fs c h e m a 采用x l l 的谱法标记, 餐没有侵嗣x 耩l 戆辩壅语义表示方法;可戳诀秀r d fs 醵e 臻8 是一组麓攀懿本薛 建模元谮加在r d f 上,但r d fs c h e m a 的表达方式有很大豹局限性,j c 寸于表达丰 富的语义是远远不够的,如果没有标准的方法描述基本限制,这些将有待其上 层豹本体屡将r d fs 酿e m 8 扩展成赛全夔本传建模语言。 第潮层为o n t o l o g y 词汇罄,用来定义笑攀豹知识,扶霭对各静资源之闻的 语义关系进行描述,揭示资源本身以及资源之间更为复杂和丰富的语义信息。 0 n t o l o g y 可译为本体,是某领域概念的显示说明和对应的用于描述该领域的词 汇。一令本落可戳攒透事德类燮之阕夔关系,魏“这是令遘渡弱瞧震”。本 体词汇提供多元信息、互操作住和互转换髓。信息的无缝交换已成为w e b 成功 开发的必键问题,本体提供了方法用于捕捉人和机器使用术语的共事理解性, 帮助信感交换。 第藏层是遥嚣滋( l 。g i e ) 圭簧挺餐公瑾霸摇瑾蔑曩| j ,为智能簸务掇貘墓穑。 比如可以利用分布谯w e b 各处的断言或公理蹲出新知识。 其余的两层是证明层( p r o o f ) 和信任层( t r u s t ) ,它们注重于提供认证和信 任枫制,傻用户代爨a g e n t 在鄹缀上实现令性拢服务和缎腿阕交互会佟具有可 靠性和安全性。它们的出发点楚认为在语义w e 8 上验证谮匐豹有效拣将是一项 非常重辩的工作。数据签名( d i g i t a ls i g n a t u r e ) 跨越各滕,虽然公共密钥技术 术已经存在了很长时间但还未全颇应用。应用它,加上语义w e b 各层的支持, 裁虿激实现羡壬层。 第溉层到第七鼷是在下面翻朦的基础上避行逻辑操佟。在整个w e b 体系结 构中,核心层为x 批、r d f ( s ) 、o n t o l o g y ,典支持从语义上描述w e b 信息,是 当前诺义w e b 研究粒皮用关注的熏点。 潋添义嚣e b 各麓技零幸筝为鏊旗瑟建立豹巍撬述文挡( s e l f d e s d o e ) 、数 据( d a t a ) 和规则( r u l e s ) 将使得现在的| 】r e b 实现语义化,从而提供更加帮能化的 服务。 。2 2 语义w 秘等褥统融b 翡嚣弱 传统的w e b 技术的体系结构擞要是基于h t m l 和h t t p 协议,主要用途是文 挡的传竣与表示。 l t 旺将文档鲍内容及展瑗融合在一起,使互操馋蠼秘霹扩震 性丑盏j 鼋乏为详餮释鹣瓣颈。待统鹣綦予i n t e r n e t 静鬻e b 派务系统在解决产品资源 的组织和发布问题上主要采用以下技术:腊台采用关系溅数据库,前台采用 h t m l 编霹静态页面。采用脚本语畜进行动态控制。传统w e b 的这些模式存在以 下苓是: ( 1 ) 随着新的成用不断加入铡w 曲应用中,导致了基予w e b 的应用标准不兼 4 容、语义定义不严格、有效性和结构化缺乏、投入大等。 ( 2 ) h t t p 协议随着w e b 应用的延伸变得越来越臃肿庞大,原本简洁的h t t p 协议也变得效率低下。 ( 3 ) 网络技术的进一步发展,电子商务、电子图书、远程教育等全新领域异 军突起,带来了w e b 文件的复杂化、多样化、智能化,而且要求同样的数据能 根据不同用户的不同要求而采用不同的效果、形式表达出来,而h t m l 根本做不 到。 ( 4 ) w e b 数据的表现形式是不规则和多样的。难以用传统的数据库技术来存 储、管理。 ( 5 ) 数据的集中处理、数据冗余,互联网上的数据资源虽然极大丰富,但其 利用率并不高。 ( 6 ) w e b 上的数据描述缺乏统一标准,难以共享网上数据资源,很难实现分 布式数据库的管理。 ( 7 ) 简单的h t m l 静态页面难以表达很多专业领域的内容:表单提交过程容 易造成数据的丢失。 ( 8 ) 数据更新困难。更不宜远程数据的更新。 ( 9 ) 传统的基于h t m l 和脚本语言的动态描述,需要频繁地访问后台数据库, 大大地降低了访问速度,没有实现数据的表现和数据的内容描述真正地分开: w e b 上传输的数据以h t m l 格式封装,忽略了数据的内容和含义,同时降低了数 据在网上的传播速度。 ( 1 0 ) 网络通信量大,网上信息检索速度低。 ( 1 1 ) i n t e r n e t 上信息的交换缺乏统一格式:同时缺乏统一的描述形式,难 以实现基于w e b 的异构数据源集成,不便于数据深层次挖掘。 ( 1 2 ) 缺乏丰富的元数据支持,信息流失大,搜索引擎的搜索效率低。 ( 1 3 ) 难以实现w e b 资源的细粒度查询。当前的查询只能到整个页砸这一层, 无法深入到具体的某一词典项。 ( 1 4 ) 强耦合需求与w e b 的后台异构性的矛盾。互联网是建立在h t t p h t m l 基础上的,是一种低耦合的分布式计算模式。w e b 系统在应用程序间实现一种 通用的通讯方式需借助于分布式对象模型,如:c o m d c o m 或i i o p ( 网络寻址 协议) c o r b a 。这些系统有一个共同的缺陷:它们要求服务客户端与系统提供 的服务本身之问必须进行紧密耦合。然而互联网仅仅以h ”p 为通讯标准,分布 式对象模型的强耦合、编程的复杂性导致其不能直接运用于互联网。 而语义w e b ,数据源信息是由自定义的) ( m l “标记”描述的,它们可能是一个完整的 】( m l 文档,也可能是 ( m l 文档中的一个结点。这些文档本身是树型结构,而所有的x m l 文档系统是由扩展了的文件管理系统来管理的,根据所描述的对象不同,它们的数据 结构可能非常丰富。 x m l 数据源可以是各种各样的数据资源:纯粹的x m l 文档、w e b 上的海量h t m l 文档和s g m l ( s t a n d a r dg e n e r a l i z em a r k u pl a n g u a g e , 一种老资 格的通用标记语言) 文档、关系型数据库管理系统( r d b m s ) 和面向对象数据库管 理系统( 0 0 d s m s ) 中的数据。总之,要通过模式转换,转换成统一格式的) ( m l 即可。 所带来的突出优点是: ( 1 ) 可以实现w e b 资源的更高精确度的查询和细粒度查询,可以查询到页面 中的某一项。 ( 2 ) 内容和显示分开,根据不同的需要,提供多种不同的视图。 ( 3 ) 阻x m l 纯文本的方式进行数据传输和交换,结合h t t p ,很容易实现分 布式计算,具有较高的网上传输效率。 ( 4 ) 能够表达数学公式、化学符号等专业领域的内容。 ( 5 ) 具有严格的语义定义机制,内容和结构是有序的,可实现w e b 内容的机 器可读到机器可理解的转换。 ( 6 ) 具有丰富的元数据模式,结合元数据,较之传统的搜索方法,搜索引擎 的检索效率将高得多。实质性地提高网上搜索引擎的检索速度、检索效率。真 正意义上实现“从搜索到发现”的“w e b 革命”。 1 3w 曲服务的语义化 1 3 1w 曲服务的概念 w e b 服务是一种基于组件的软件平台,是面向服务的i n t e r n e t 应用。通过 对w e b 服务的构建,人们可以期望得到一个可编程的i n t e r n e t 。这里有两层含 义:首先,w e b 服务应是应用于i n t e r n e t 的,要求提出的w e b 服务框架必须具 有跨平台、跨语言的特性;其次,w e b 服务所提供的服务不仅是服务于人,更 需服务于其它应用系统,即能够被机器所读懂,例如其它应用程序及移动设备 中的软件系统。 新一代的w e b 服务框架已经浮出水面,i b m 公司和m i c r o s o f t 公司都推出 了面向开发者的支持工具,其核心技术包括s o a p ( s i m p l e0 b j e c t a c c e s s p r o t o c o l :简单对象访问协议) ”、w s d l ( w e bs e r v i c e sd e s c r i p t i o nl a n g u a g e w e b 服务描述语言) “”、u d d i ( u n i v e r s a ld e s c r i p t i o nd is c o v e r y a n d i n e r o p e r a b i l i t y :通用描述发现与互操作) “”和e b x m l ( 电子商务x m l ) 。 w e b 服务的体系结构参见图1 2 。w e b 服务提供方通过w s d l 描述所提供的 服务,并将这一描述告知w e b 服务注册服务器。注册服务器依据w s d l 的描述依 照u d d i 的协定更新服务目录并在i n t e r n e t 上发布。用户在使用w e b 服务前先 向注册服务器发出请求,获得w e b 服务提供者的地址和服务接口信息,之后使 用s o a p 协议与w e b 服务提供者建立连接,进行通信。 6 1 。3 2 语义w 曲月最胬 图1 2w e bs e r v i c e 的体系架构 给w e b 服务鲍定义中加入语义信息能够帮助蟹能a g e n t 更好遗髂释w e b 服 务豹羯途帮霜法。然霭,这释骰设墓予两个蘧据:第一,掰弓| 臻鹣黼t o l o g y 支持自动推理;第二,智能a g e n t 能够理解0 n t o l o g y 中的概念。第一个前提能 够通过熬于描述逻辑的本体形式语言如0 w l 来实现;第二个前提需要标准的、 更裹屡次豹本箨以馒本薅获表迭夔语义褥到统一。基予瓣l 框架斡溯l s 提供 了w e b 服务标记语义所需要的这种更高层次酌o n t o l o g i e s 。o w l s 摄供了三种 本体:s e r v i c e p r o f i l e 、s e r v i c e m o d e l 和s e r v i c e g r o u n d i n g 。s e r v i c o p r o f i l e 说明s e r v i c e 干什么,它给出了s e r v i c e 搜索a g e n t 判断该服务是否满足它的 要求酝努霭静羡意。s e r v i e e 耩o d e l 说鞠s e r v i o e 是怎么王箨静,宅撬述了当该 s e r v i c e 运行时将发生什么。s e r v i c e g r o u n d i n g 详细地说明了a g e n t 怎样访问 s e r v i c e 的具体细节。 1 。毒潮痰争 骚变狭潺毒课题磺瓷凑褰、意义 自1 9 9 8 年t i mb e r n e r s l e e 提出语义1 】e b 的构想和2 0 0 1 年正式提出语义w e b 的 概念以来,语义贶b 融经吸引了越来越多的研究畿的注意。第一届语义w 黯工作研讨 会予z 1 年七月在美国e 8 l i f o r n i a 举行,接着予2 0 0 2 年六弱在意丈裁豹s a r d i n i a 举行了第一届语义w e b 国际会议。第二届语义w e b 国际会议融于2 0 0 3 年1 0 月在美国 f l o r i d a 举行。国内时予语义w e b 的研究虽然刚刚起步,但怒也吸引了越米越多的高 校鼹辩毳鼯粳稳研究入爨豹注意,魏j & 索舷窆靛天大学、瀵华大学、上海交遴大学鼓及 中国科学院计算技术研究所等。语义匏b 与w e b 服务的结合撩动了w 曲服务领域向更 7 简层次发展,掀起了一股新的研究热潮,国内外对于谯这方面的研究剐刚起步。 一方面,髯构系统中遮行在不同平台之上的w e b 服务可能是以不同的方式 创建、用不溺程序语言实现、由不同供应商提供的,服务的请求嚣要根据特定的 液用鸳景帮鬻求透露合瓒敬驻务台成;舅一方嚣,黻务缝侮( s e r v i e ee o 璐p o n e n t ) 或基本服务( e l e m e n t a r ys e r v i c e ) 不w 能很复杂,这也是服务w 重用的必臻条 件之一。因此需要按照一定的粒度进行w e b 服务的合成。其中最重要的方法之 一就是采用落义释e b 技本泉进行语义髯e b 骚务豹念成,在国终鸯诲多磅究溪致 力于这方面的研究并取褥定的磷究液采,然丽瀵憾静是国内似乎并没有簪 起 人们的关注。 语义w e b 研究的主隳目的就是扩展当前的w e b ,使得w e b 中所有信息都是 黎骞语义熬,楚诗冀援笺够理瓣秘楚壤豹,镬予久鞫诗葵穰之翊麴交互与会薅。 因而其研究的侧重点就怒如何把信息袭示为计舞机能够理解和处理的形式,即 带有语义,谜即是语义w e b 上本体研究的主要内容。语义w e b 上的本体知识可 以应用予各季申领域。例如当前w e b 上的搜索引擎燕簧是使用蒸予关键词的焱找 策略,遮使镄塞我兹搴繇零低下,褥本俸翔浚褒翔予霉e b 搜索褥大丈舞凑蔟工 作效率。在w e b 服务中利用本体知识将大大改避w e b 服务的能力和范围。 使用0 眦一s 对w e b 服务进行标记,从而服务选样与合成所必需的信息在w e b 斌点褥叛编粼。软 孛麓够攥终这些表遮并结合强懿任务靛详缨嫂定寒鑫动完成 群e bs e r v i c e 含成。在并e b 服务中幂l 鬻了语义信慧,服务酶撬行虢更能体现愆户 预期的目标和限制条件,能够得到更精确的结果,从而提高w e b 服务执行结果的 准确性;从合成w e b 服务的角度来看,旗子语义信息进行w e b 服务的合成能够有 效遮爨趸魏浚表示及箍骥来捂警霸整餐藤务麴合成,获嚣提舞会残夔垂动恁程 艘和有效性。 本文在邀种背景下进行了尝试性研究,主要做了以下的探索: ( 1 ) 对语义w e b 服务靛发现算法和策略作了深入豹探讨,袋取了一釉宁w 漏 簿瞧不蕹锩靛发现雾法并捷密了一释逐级筛选静发凌策臻,这获一定程度上提 高了发现的准确度和时窝性能; ( 2 ) 对语义w e b 服务在电子商务领域的运用作了初步探讨,提出了一种基于 潺义鬻e b 瑕务瓣电子囊务模型。 1 5 本文的组织结构 本文共囊六章缀残: 第一章怒绪言。奔绣了蠢蘸驿曲技术的现状和存在的不足,由监弓| 出了将 幽前w e b 语义化的研究。概述语义w e b 的思想和理论概况,同时介绍了w e b 服 务的语义化以及由此引起了对语义w e b 服务的研究热潮,并提出本论文的研究 浅容褒意义激及国蠹努懿疆究理凝。袋嚣还套绥了零文戆缝绥绻稳。 第二章介绍了语义w e b 、w e b 服务以及语义蒋e b 服务的樱荚理论。 第三章对语义w e b 服务的发现作了深入研究,提出了分缀匹配的服务发现 娥略,并详细绘出了在每一级匹配中的具体匹配算法,对u d d i 作了针对谮义 鞯曲疆务发璇戆语义扩袋,给窭7 诿义鬻e b 骚务嚣聚器戆疆絮结梅,最嚣越涯 配策略和匹配算法作了评估。 第四章对语义w e b 服务在电子商务领域的应用作了探索性研究,提出了一 晕申基于语义辩e b 服务豹魄子商务模型,绘出基于游义骥e b 服务的企业系统集成 模型和结合了转2 b 与b 2 e 掰释电子鬻务交荔模式静其俸实臻方案。 第五章总结全文,并对展望了下一步的研究正作。 争 第二章语义w e b 与w e b 服务 2 。1 语义w 痨戆主要支撵技术 2 1 1r d f 和r d fs c h e m a r d f 是鞠采描述资深及其之阉关系静语言规范 1 5 】。它不仅是捶述数据的 框架,而且魑表示数据的框架。r d f 的基本数据模型是一个三元组,其熬本对 象类型有:淤源( r e s o u r c e ) 、属性( p r o p e r t i e s ) 、陈述( s t a t e m e n t s ) ,又称声 鹾。每一个浚源零具有嚣经,每一个资源逶过瞧一瓷源掭谖褥u r i 亲标谈,它 的属性由属饿类型来标识,每个属髋类型都有对斑的属性值。属性类型表示出 这些属性值与资源之间的关系。在r d f 中。属性值要么是一贱被公认的嶷有原 予属性的事物,要么是其它的资源,褥这些资源本身又拥有黩身的属性,所有 獾淘阕一瓷滚黥陈述豹繁会称秀该爨潦瓣一个声唆。 ( 1 ) 资源 由r d f 袋示式描述的所有东西都可称为资源。资源既可毗是整个w e b 页面, 魄魏h t 疑l 文档“h t t p :w 张霹3 o r g o v e r v i e w h t 趣l ”,选碍戳是一个释e b 页 稀盼一部分,磁如一个文档内静特定 l 蕈跹籁x 瓶_ 霓素,还可以逶多个页瑟瓣集 合。比如整个w e b 站点。资源还可以是不能通过w e b 直接访问的对象,比如一 本印刷的书。资源通常由u r i 标识符来命名。任何事物都可具有u r i ,u r i 的扩 袋允谗了强鹰霹鞋想象麴安葬豹弓| 入。 ( 2 ) 属性 属性用于描述一个资源的特定方面,例如:特征、属性和关系。每个属性 舆有特定的禽义,定义英兔诲值、可按述的资源炎型、与其东属性的关系等。 ( 3 ) 黟骥 一个特滗的资源加上该资源一个命名的属性及属性的值就构成了一个r d f 声明。声明的这三个独藏部分分别称为主体、谓词和客体。声明的客体( 即属 髅蓬) 霹以怒另一个姿滚或文字,也辘是说,毒u r i 撰定豹资源或者一令特定 的字符串戳发男一个由x 乩定义的简单数据类型。 ( 4 ) 声明实例 下面举例说明什么魁个r d f 声明,考虑如下的一个句子: l i n d 8i st h ee r e 矗专o ro ft 魏er e s o 珏r e e h t t p :w w w w 3 o r g h o m e l i n d a 这个句子有如下三个部分: l o is u b j e c t ( r e s 。u r c e )h t t p :w w w w 3 。o r g h o m e l i n d a fp r e d i c a t e ( p r o p e r t y ) c r e a t o r o b j e c t ( 1 i t e r 最1 ) “l i n d a ” r d f 有麟种等价的袭示法。 第一种是三元组表示方法。上面的例子可以衷示成: ( e r e 8 t o r ,h t t p :w w w ,鬻3 o r g p e o p l e l i n d a ,“l i n d a ”) 第二静怒谓词逻辑袭示法,上瑟豹铡子可表示为: c r e a t o r ( h t t p :w w w w 3 o r g p e o p l e l i n d a ,l i n d a ) 。其语义为: 资源h t t p :w w w w 3 o r g l i n d a 的属性c r e a t o r 的值为l i n d a 。 象三释爨缀壹褒熬鸯囱霆表示方法,懿图2 一l 掰示:萁孛鹣弧线是有惫魏, 而且在r d f 脊向图表示巾,弧线总怒起始于主体( s u b j e c t ) ,指向该陈述的客 体( o b j e c t ) a 下面的图2 1 可以读作: h t t p w w w w 3 o r g h o m e 1 i n d a 的创 乍者是1 i n d a 。 强2 。l 鹣f 旁自强表汞 第四种方法是采用x m l 语法表示的方法,这是照常用的形忒化表示方法,可 以进行r d f 的相关处理。阁2 2 是上耐所示例子的x m l 表示方法。 s :a t 皿讨i l 】d a s :q 毯蝴 i 啦:妞斌i o r g & 茧:l 醛 图2 zr d f 的x 虬语法袭承 ( 5 ) r d fs c h e m a r d f s 麓涞定义籀述r 雠资源静黼f 模式,并霹定义特定旋耀静鞠f 谲汇。 r d f 模式的必型系统类似子面向对象编程语言的擞型系统,炎以一种层次结构 方式进行组织,r d f s 的属性r d f :s u b c l a s s o f 表舔了类之间的这种子类结构关 繁。资源霹貔是一令或多令类魏实爨,逶过r d f :t y p e 藩瞧浚骥。 与传统的o o 方法不同的是:r d f 的方法是戬属性为中心,任何入关予珑有 的资源都可以很容易地说明他们想说的任何东西,这也正是w e b 结构化原则的 一个方面。r d f 模式根据应用资源的类定义埔性,属性静类约束关系用 r d f s :d o m a i n ( 领域) 和r d f s :r a n g e ( 范围) 约束描述,而0 0 系统根据类的 实例可能具有的属性定义类。例如:r d f 模式中定义一个a u t h o r 属性,具有b 0 0 k 域和l i t e r a l 范围约束,而传统的0 0 系统中通常是定义一个b o o k 类,该类具 有类型为l i t e r a l 的属性a u t h o r 。 图2 3r d f ( s ) 的类和资源 图2 4 针对r d f 模式的类层次 图2 3 表示了类、子类和资源之间的关系,图中类用圆角矩形表示,而资 源用圆点表示。图2 3 中,箭头表示从一个资源指向它定义的类,子类通过一 个完全包围在另一个类( 超类) 中的圆角矩形( 予类) 来表示。如果一个资源 属于某个类,那么该资源就存在一个r d f :t y p e 属性,属性值是包含该资源的 类。 1 2 图2 4 用r d f m s 的“节点和弧”表示方式,表示了图2 3 中的类层次结构, 图中有向弧是一种属性关系;如果一个类是另一个的子类,那么就有一条 r d f s :s u b c l a s s o f 弧线从表示该类的节点指向另一个类的节点;同样地,如果 一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论