(系统工程专业论文)Web服务发现中概念的模糊匹配方法及实现.pdf_第1页
(系统工程专业论文)Web服务发现中概念的模糊匹配方法及实现.pdf_第2页
(系统工程专业论文)Web服务发现中概念的模糊匹配方法及实现.pdf_第3页
(系统工程专业论文)Web服务发现中概念的模糊匹配方法及实现.pdf_第4页
(系统工程专业论文)Web服务发现中概念的模糊匹配方法及实现.pdf_第5页
已阅读5页,还剩57页未读 继续免费阅读

(系统工程专业论文)Web服务发现中概念的模糊匹配方法及实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 近年来,随着网络技术的发展和w e b 服务规模的扩大,如何在w e b 所提供 的海量信息中发现有用的信息并加以有效利用,一直是人们努力研究的方向。 因此,w e b 服务发现已成为w e b 领域的一大研究热点。众所周知,w e b 服务是面 向用户的。对于普通用户来说,他们往往使用自然语言来请求、访问w e b 服务。 但目前大多数理论研究与系统实现只考虑了w e b 服务中标准化的计算机语言, 使用基于关键字匹配、目录分类等技术进行匹配,没有考虑w e b 服务中人类自 然语言的参与,因此具有一定的局限性。 针对上述问题,本文以w e b 服务发现为背景,重点研究服务发现中概念之 间的模糊匹配问题,提出解决方法并完成实现,以达到对w e b 服务的模糊匹配。 此外,论文还对服务发现架构、语义网、本体等相关知识进行了深入的研究与 实现。其中,概念的模糊匹配的具体过程是:首先从w e b 服务中抽取最能代表 该服务的概念( 关键字) ,然后根据概念之间的语义关系得出概念之间的模糊相 似度( 模糊匹配度) 。这种匹配方法不仅仅考虑概念之间的字符相似度,而且考 虑到概念之间的语义相关性。此外,论文以模糊相似性代替精确相似性,将匹 配程度量化,能够丰富、完整匹配结果,给请求者更多的自主性选择。 最后在上述理论研究的基础上,本文结合铸造业中“热电风扇罩的材料 选择”这一案例,利用e c l i p s e 、m y s q l 等根据构建了一个实现概念模糊匹配的 系统。该系统首先自定义了一个添加模糊度的、关于工程材料的语义词库网络, 然后根据前台用户的请求输入遍历自定义的词库网络,在算法的基础上完成在 该词库中材料的选择,并把最终结果反馈给请求者。作者还对该系统的测试结 果进行了统计、分析。此外,本文也对语义w e b 服务发现架构进行了深入地研 究,并在研究、开发过程中参考了经典架构的理论模式。 关键词:模糊集,服务发现,概念匹配,铸造业,算法 a b s t r a c t a b s t r a c t r e c e n t l y , 、i t l lt h ed e v e l o p m e n to ft h ew e bt e c h n o l o g ya n dt h ei n c r e m e n to ft h e w e bs e r v i c es c a l e ,t h ed i s c o v e rf o rt h ew e bs e r v i c eb e c o m er e s e a r c hf o c u si nt h e d o m a i no ft h ew e b a sw ek n o w , t h ew e bs e r v i c ei su s e r - o r i e n t e d f o rt h em o s to f t h ec o m m o nu s e r s ,t h e yu s en a t u r a ll a n g u a g et od i s c o v e ra n da c c e s st h ew e bs e r v i e h o w e v e r , s t a n d a r dc o m p u t e rl a n g u a g ei st h ef o c u so ft h en o w d a yd i c o c e rr e s e a r c h f o rw e bs e r v i c e s o ,t h er e s e a r c hi sl i m i t e d t os o l v et h ep r o b l e m , t h ep a p e rp r o p o s e dt h ef u z z ym a t c ho ft h ec o n c e p ti nt h e w e bs e r v i c ed i s c o v e r , r e s e a r c h e do ni ta n dr e a l i z e di t i na d d i t i o n , t h ep a p e ra l s o r e s e a r c h e do nt h ef r a m e w o r ko fs e r v i c ed i s c o v e r , s e m a n t i cw e b ,o n t o l o g yd e e p l yt h e p r o c e s so ft h ef u z z ym a t c hi s :f i r s tw ee k t r a g tt h ek e yc o n c e p tf r o mt h ew e bs e r v i c e w h i c hc a nr e p r e s e n t a t i v ei tm o s t , a n dt h e nc a l c u l a t et h ef i t z z ym a t c hd e g r e eb e t w e e n t h ec o n c e p t s t h i sa l g o r i t h mi n c l u d e sb o mt h es e m a n t i cc o e l a t i o na n dc h a r a c t e r s i m i l a r i t y i tc a l lg i v et h er e q u e s t e rm o r ec h a n c et oc h o o s e a tl a s t , t h ep a p e rc o n s t r u c t e das y s t e mw h i c hc a nr e a l i z et h em a t e r i a ls e l e c t i o n o ft h ef a ns h r o u di nt h ef o u n d r yi n d u s t r yt b 帕u g hs o f h v a r et o o l ss u c ha se c l i p s e , m y s q la n ds oo n f i r s t , t h es y s t e ms t m c t u l e x las e m a n t i cn e t w o r kt h e s a u r u sa d d i n g f u z z yd e g r e e ,b a s e do ne n g i n e e rm a t e r i a l t h e n , t h es y s t e mt r a v e r s a l st h et h e s a u r u s a c c o r d i n gt ot h ec l i e n tr e q u e s t ,a n dr e a l i z e t h em a t e r i a ls e l e c t i o nb a s e do nt h e a l g o r i t h m ,a n dr e t u r nt h er e s u l to ft h em a t c ht ot h er e q u e s t o r o t h e r w i s e ,t h ea u t h o r s u m m a r i z e da n da n a l y z e d t h et e s t i n gr e s u l t t h ep a p e ra l s or e s e a r c h e so nc l a s s i c f r a m e w o r kf o rt h ew e bs e r v i c ed i s c o v e r , a n dc o n s u l ti t sm o d u l ed u r i n gm yr e s e a r c h a n dr e a l i z a t i o n k e yw o r d s :f u z z ys e t ,s e r v i c ed i s c o v e r , c o n c e p tm a t c h i n g ,f o u n d r yi n d u s t r y , a l g o r i t h m 学位论文版权使用授权书 本人完全了解同济大学关于收集、保存、使用学位论文的规定, 同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版 本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、 扫描、数字化或其它手段保存论文;学校有权提供目录检索以及提供 本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有 关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前 提下,学校可以适当复制论文的部分或全部内容用于学术活动。 学位论文作者签名二弓 1 钨肘峭 同济大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行 研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文 的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的 作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集 体,均己在文中以明确方式标明。本学位论文原创性声明的法律责任 由本人承担。 学位论文作者签兰猁么夕 乡一一l 沙歹 刚邮 第1 章引言 1 1 概述 第1 章前言 随着互联网的迅速发展和广泛应用,w e b 技术逐渐产生并不断发展、成熟, 而w e b 服纠作为一种新兴的w e b 应用模式,也是w e b 技术领域的研究热点之一。 w e b 服务是独立、模块化的应用程序,能够在网络( 一般是w w w ) 上被描述、发布、 查找和调用。它可以将不同个人、组织甚至公司提供的服务无缝地进行连接和 通讯,在w e b 上建立一种松耦合的w e b 应用。在商务应用中,w e b 服务能够解决 传统电子商务应用的高维修代价和更新代价问题,成为目前应用环境中最为合 理的解决方案。w e b 服务目前比较成熟的标准包括s o a p w s d l 和u d d i 。 目前,w e b 服务因其可移植性、跨平台性和易部署等优点成为目前各主要软 件供应商的新宠儿。由于w e b 服务源于传统的万维网,尽管在信息格式上作了 改进,但仍然不能实现w e b 服务的自动发布、自动发现、自动执行等一系列操 作。 为了解决现有w e b 服务的上述问题,语义w e b 服务应运而生。早在2 0 0 1 年, t i m eb e m e r s - l e e 就正式提出了语义网( s e m a n t i cw e b ) 的想法嘲,语义网的目标 是使得w e b 上的信息具有计算机可以理解的语义,满足智能软件代理对万维网 上异构分布信息的有效访问和检索。语义网已成为现有w e b 的扩展,将赋予信 息实体丰富的语义信息。 而语义w e b 服务是语义w e b 与w e b 服务相结合得到的产物,在w e b 服务中 有效利用本体领域模型进行服务的概念建模,可以指导w e b 服务应用的设计; 在w e b 服务中有效利用语义信息,进行w e b 服务和语义w e b 的有机结合可提高 w e b 服务的质量。总之,语义w e b 服务可为w e b 服务的发现、执行、解释和组合 的自动化提供有效的支持,从而实现异构系统的互操作及无缝集成。 此外,随着w e b 服务的功能不断更新、数量和规模的与日俱增,w e b 服务已 经从最初的静态页面发展到了今天的交互式、自动的、智能的服务存储。多个 w e b 服务为应用开发者和终端用户带来了前所未有的优势。由于w e b 服务采用被 广泛接受的标准,w e b 服务应用模式简化了商业应用的开发和交互,实现了代码 第1 章引言 重用和松耦合。此外,w e b 服务还提供给终端用户直观的浏览界面,使得他们来 选择,设定和组装自己的w e b 服务。但是与此同时,面对表现形式和复杂性都 可能不相同的服务,如何正确、高校的从如此众多的w e b 服务中找到自己所需 要的服务则变得越来越具有挑战性。尤其是在现代企业的合作中,面对日新月 异的动态合作的情况,需要将分布于i n t e r n e t 上众多的服务器可以通过w e b 更 自动化地,更智能化地交互,即服务请求者能够快速、准确、全面地与所需服 务绑定。 此外,由于w e b 服务个性化的发展和人为参与活动的增加,自然语言处理 逐渐成为服务匹配研究过程中的关注焦点。而自然语言和计算机语言的差别就 在于,前者具有模糊逻辑。因此,模糊匹配已逐渐进入服务匹配的范畴,并越 来越成为w e b 技术领域的研究重点。良好的模糊匹配能够更准确、智能地理解 用户的自然语言,能够为用户提供更加丰富、完整的服务匹配方案,给用户更 多的参与机会和选择余地,使服务匹配更加个性化、人性化 1 2 国内外研究现状 目前,w e b 服务发现已成为w e b 服务领域内十分活跃的研究课题,而如何提 高w e b 服务发现技术的高效、完整等能力,并能用户有效利用也对w e b 技术的 发展有重要的意义。当前的基于w e b 的服务发现的研究主要体现如下几个方面: 扩充w e b 服务的语义信息描述,以提供对w e b 服务发现的支持: 在服务描述的基础上研究支持智能化的语义匹配,以提供对服务准确发 现; 支持基于语义的w e b 服务发现的相关研究热点,如服务择优、服务质量 ( q o s ) 评价等问题。 1 2 1 基于w e b 的服务发现的研究现状 目前,关于w e b 服务发现的研究已成为w e b 技术领域的热点问题之一。其 中,相关的国际会议有i s w c ( i n t e r n a t i o n a ls e m a n t i cw e bc o n f e r e n c e ) 、 i c w s ( i n t e r n a ti o n a lc o n f e r e n c eo nw e bs e r v i c e s ) 、c e c e e e ( i e e ej o i n t c o n f e r e n c eo ne - c o m m e r c et e c h n o l o g ya n de n t e r p r i s ec o m p u t i n g 、e - c o m m e r c e 2 第l 章引言 a n de - s e r v i c e s ) 等等:相关的研究组织有o a s i s u d d i 、w s m o 、w 3 c 、s w w s ,l s d i s 等等:从上述渠道或者g o o g l e 等搜索引擎及其它学术期刊可以查询到大量的相 关研究。 传统的w e b 服务发现机制是使用语法关键字匹配技术,。往往由于要求太高 而过多的服务匹配失败。目前w e b 服务的匹配更多的专注于w e b 服务的体系结 构、数据模型、描述语言、服务质量( q u a l i t yo fw e bs e r v i c e ,简称q o s ) 、算 法优化、量化分析,逻辑基础等方面。 w 3 c ( w e b 技术制定组织) 在语义w e b 服务的发展过程中一直起着关键性的推 动和规范化作用,其下属的“语义w e b 服务行动组进行着语义w e b 服务相关 规范的研究制定工作并发布了o w l - sv e r s i o n1 1 ( 语义w e b 月及务描述语言的 1 1 版本) ,“本体研究行动组 进行着本体语言规范的制定和推广工 作:d a m l ( d a r p aa g e n tm a r k u pl a n g u a g e ) ,这是从2 0 0 0 年8 月开始的一个项目, 其目标是为语义网建立一个便利的语言和工具,它是由美国国防部高级研究项 目机构( d e f e n s ea d v a n c e dr e s e a r c hp r o j e c t sa g e n c y ) 赞助并实施的:英国曼 彻斯特大学的i a nh o r r o c k 和f r a n zb a a d e r ,u l r i k es a t t l e r 共同提出了将描 述逻辑运用到语义网本体语言中的思想,并在其论文1 中提出将d a m l + o i l 本体 翻译为s h i q 描述逻辑语言,实现对d a m l + o i l 本体的推理。 美国卡内基梅隆大学的m a s s i m op a o l u c c i 在其论文h 1 中提出了基于w e b 服 务能力的语义匹配思想,它称为后来服务发现研究的核心思想;英国马萨诸塞 州理工学院的m a r kk l e i n 和美国纽约大学的a b r a h a mb e r n s t e i n 提出了基于过 程本体论啼1 的服务发现技术,过程本体论将每个w e b 服务分解成几个过程的集 合,前一个过程的输出是后一个过程的输入。过程本体论的运用有赖于m i t 过 程手册项目( t h em i tp r o c e s sh a n d b o o kp r o j e c t ) 的发展。这基本上反映了w e b 服务匹配的基本思想。 目前,w e b 服务匹配算法的研究又可以分为分层和量化两个方向。x i a n g 等 在文献嘲中把匹配程度分成e x a c t ,p l u g - i n ,s u b s u m e s 和f a i l 四个层次,即基 于语法的近似服务匹配算法、基于语义的近似服务匹配算法、精确服务匹配算 法和插入服务匹配算法。k e l l e r 等基于集合间的关系在文献h 1 中把匹配程度分 为e x a c t ,p l u g i n ,s u b s u m e s ,i n t e r s e c t i o n ,f a i l 五个层次。采用定量方法 研究w e b 服务描述匹配的有张钋的论文嘲和胡建强的论文咖等,他们都提出了量 化两个w e b 服务描述间相似度的方法。 3 第1 章引言 匹配算法的两个研究服务方向,体现了目前匹配算法的追求目标不再是精 益求精的完全匹配,而且力求匹配的完整性。对于不能完全匹配的服务也根据 通过相应的模糊匹配算法实现匹配情况。目前,基于模糊集的匹配算法,往往 针对某一特定领域的自然语言。 英国c o v e n t r y 大学的k u o m i n gc h a o 构建了一个w e b 服务的模糊匹配框架 n 们,该框架由模糊识别器、模糊引擎、u d d i o w l - s 以及模糊转换器组成。该框 架中,模糊识别器借由模糊规则和设定好的模糊集将w e b 服务内容概况成模糊 术语;而模糊转换器则将请求者模糊或者精确查询条件全部转换成模糊信息, 同时触发模糊匹配机制进行匹配。 印度的m u h a m a da b u l a i s h 和l i p i k ad e y 在论文中提出了一个模糊本体 框架,该模糊本体架构是对标准本体架构( o = ) 的扩展。他们所提出 的关于模糊本体的设计,概念描述符表示成一个模糊关系,用模糊集隶属函数 加强属性值。这个框架运用不同的模糊度来定义一个概念的属性值这些概念 描述可以不太准确。除了概念描述之外,根据概念的语义关系,为其赋予一个0 与1 之间的权重,比如同义关系权重为l 、上下位关系权重为o 8 、相关关系权 重为0 5 等,用以描述本体概念之间的模糊关系。 1 2 2 服务发现中自然语言处理的研究现状 国内对于语义w e b 服务的研究起步相对较晚,缺乏领军人物。但是,也不 乏佼佼者。在w e b 服务的关键技术研究中,清华大学结合基于j 2 e e + x m l 架构的 旅游电子商务平台罗盘网( 嗍1 u o p a n c o m ) ,目前己在不同程度上实现了w e b 服务,可实现行业内合作伙伴间的服务共享开发。目前,他们正在研究基于本 体w e b 服务的自动发现机制。中科院计算所分析了目前服务描述语言c d l ,s d l 和l a r k s 等存在的不足,并结合w e b 服务、语义w e b 服务和g r i d 服务等特点, 提出了一种带语义、继承以及支持协商机制的服务描述语言s d l s i n 。在s d l s i n 的基础上,研究了动态服务匹配问题,提出了四种类型的服务匹配算法,即基 于语法的近似服务匹配算法、基于语义的近似服务匹配算法、精确服务匹配算 法和插入服务匹配算法。另外,利用描述逻辑有效的推理功能,特别是它对概 念包含关系的有效判断,把它与服务管理结合起来,充分利用描述逻辑的清晰 模型和语义理论以及有效的概念分层推理等功能,提出了基于描述逻辑的服务 4 第1 章引言 匹配算法n 羽,详细研究了如何利用描述逻辑的理论和推理机制来实现自动的服 务分层及服务匹配,并提出了五种服务匹配算法,即主体服务匹配算法、强服 务匹配算法、k 一近邻服务匹配算法和m 一近邻n 7 近似服务匹配算法。这些方法 都是基于语义的服务匹配,利用服务分层机制实现了有效和高效的服务匹配。 同时,为了正确匹配到用户最满意的主体,提出了一个服务质量( q u a l i t yo f s e r v i c e ,q o s ) 模型,该模型比较客观地反映了服务非功能属性的特征,并研 究了该q o s 模型上的各种计算和评价方法。在q o s 模型的基础上,研究了一种 q o s 驱动的服务匹配算法u 朝,该算法克服了ks y c a r a ,ka r i s h a ,gjw i c k l e r 和zz h a n g 等人提出的服务匹配算法中存在的不足。 上海交通大学任煜等人在论文n 盯针对目前工程材料数据库无法表达自然语 言中模糊概念的现状,提出材料性能和模糊集合的匹配以及模糊语句向s q l 语 句转换的方法,建立了模糊查询模型。基于此开发了具有模糊查询功能的工程 材料数据库,将模糊化查询语句精确化对查询条件进行定量评判,从而完成 材料选定。并在此数据库中,以曲轴选材为实例,验证了所提方法的可行性。 云南农业大学的何汉明,李永强在论文n 目中构建了一个模糊检索所用模糊 语言的数学模型,这是模糊检索的关键所在。对于数值型属性的语言变量使用 隶属函数以及一些模糊算子,能够较准确表达模糊语言变量的含义;对于字符 型属性的数据检索,当模糊性只存在字型和字音两个方面时,建立匹配函数更 能体现模糊检索的优越性,从而帮助用户在信息模糊的情况下检索出所需信息。 北京航空航天大学的封春升、郝爱民在论文n 钔中提到了传统的模糊识别的 方法,例如对于失物招领系统的开发,把预知的物品列表、地点列表放入数据 库中,然后对输入的语言进行分析,检查输入的文本中有没有物品列表和地点 列表的内容,如果有则识别出来,没有就把他归为其他类的信息单独记录下来。 他们根据这些引入了模式匹配,不仅仅局限于传统的语法一语义分析,而且在 语法分析的基础上,结合工程应用来定义最适合自然语言识别的语言模式,然 后把模式存入到知识库中。当需要对自然语言识别时,根据已有模式来匹配句 子,从中检索出所需要的信息。 可见,国外的模糊匹配主要集中在理论框架和模糊本体方面,而国内的研 究则是针对中文具有丰富的副词、形容词这一特点而集中实现语言算子这方面 的问题。目前基于模糊信息或者模糊的匹配算法大多没有完善的体系结构,也 没有一个权威的算法实现,往往是一家之言,而我们说提出的基于模糊集的匹 5 第1 章引言 配算法就是其中之一。 1 2 3 服务发现面临的问题 w e b 服务发现,就是客户以某种方式在这些不同类型的w e b 服务中找到其想 要的服务,以执行w e b 服务请求。而w e b 服务发现离不开w e b 服务描述技术的 支持。w e b 服务的描述提供了标准性和简单性,使w e b 服务能互操作,它也是进 行w e b 服务被正确定位后的其它步骤的基础。目前在w e b 服务的描述和发现方 面,仍然存在着许多技术缺陷,制约着w e b 服务的准确、高效的发现。 当前,w e b 服务发现技术是w e b 服务技术的主要挑战之一,有效、自动地查 找和选择相关的服务对使用者( 开发者或非技术人员) 和程序( 比如说软件代理) 都是同样重要的。最近几年,基于语义的w e b 服务发现己成为语义w e b 服务领 域内十分活跃的研究课题,一些研究项目着重于用基于o w l 的语义信息或o w l - s 描述来增强当前u d d i 注册中心的查找能力。主要体现在以下一些方面: 1 ) 以语法性的语言描述的w e b 服务,主要是面向用户直接阅读的,不利于 计算机直接阅读和处理; 2 ) 不同团体对同一领域事物的认识和表示往往不同,使得来自服务提供者 与服务请求者关于同一w e b 服务的描述存在着冲突,这种认识上的差异 所产生的w e b 服务描述差异具体表现在: a ) 不同的服务描述使用多种术语或者词汇表达同一概念: b ) 同一概念在不同的服务描述中表达不同的含义; c ) 各服务描述使用不同的结构来表达相同或者相似的信息。 3 ) 以关键字匹配的方式( 川为主的检索,根据发布服务描述中是否包含请 求查询中的关键词来返回结果,由于许多不相关的服务也会在它的描述 中包含查询关键词,在检索的结果中往往会出现很多不相关的w e b 服务, 随着服务数量的增大,检索的准确率就越低。同时这种关键字匹配的方 法,查询关键词与发布服务描述中的关键词可能是语义相同但是非语法 相同的,遗漏了大量与检索概念同义或相关的内容信息,因此检索在查 全率方面不高,难以达到期望效果: 4 ) 服务的检索只是对服务功能描述的关键词匹配,无法充分反映服务所提 供服务的功能信息,造成服务检索结果不理想; 6 第l 章引言 5 ) 针对大量相似服务的发现,缺乏高效的w e b 服务择优策略以实现最佳服 务的发现。 1 3 课题的主要内容 为了更加完整地实现w e b 服务的潜能,可行的动态服务和服务组合是有必 要的。当前的匹配方法对于w e b 服务的潜在数据的抽象和分类不够充分。他们 对于w e b 服务的分类主要是基于服务、软件等的能力。本论文提出一种基于模 糊集的概念匹配算法,把w e b 服务潜在数据抽象化并分类作为模糊术语和规则, 目标是提高w e b 服务发现的效率并允许在搜索查询中不精确、模糊的词汇。 因此,本文的研究内容主要是对基于模糊集的服务匹配算法进行分析、研 究、实现。这其中包括: 1 w e b 服务匹配到概念匹配的信息抽取;传统w e b 服务匹配是有大量的w e b s e r v i c e 作为实验数据来进行分析、研究的,为了简化研究模型、实现研究目 的、节约研究成本,我们用概念匹配来代替服务匹配。这就是设计到如何从w e b s e r v i c e 的信息抽取出来,用概念来代替w e b 服务。具体的研究内容包括:文 本文档的处理,自然语言向形式语言的转换。 2 对于现有词库的添加模糊度:基于模糊集的服务匹配目前主要集中于某 一特定领域。之所以建立添加模糊度的词库模型,是为了量化相同领域内不同 概念之间的不一致性。根据概念之间的相互关系,为其赋予一个0 到1 之间的 权重值,以此来量化地表征两个节点词汇的关联程度,即模糊度。 3 匹配算法的研究和实现。程序= 数据结构+ 算法,可见算法的重要性。本 文针对自定义的词库提出适合自身词库的匹配算法,将关键词的概念匹配转换 为文本文档的匹配并反馈给请求者。 将模糊集引入到w e b 匹配中的目的,是为了使计算机能够理解人类的自然 语言,在提高w e b 服务发现效率的基础上允许在搜索查询中不精确、模糊的词 汇,为请求者提供更加丰富、完整的匹配服务。 1 4 论文的组织结构 本论文共分为六章,内容组织如下: 7 第1 章引言 第一章:前言。本章论述了论文选题的背景以及国内外相关领域的研究现 状,并简单介绍了论文的主要内容和组织结构。 第二章:语义w e b 服务发现框架。本章首先介绍了w e b 服务技术以及语义 w e b 服务发现框架的内容与其模块,并分别介绍三个模块:本体构建和推理、语 义标注、服务发现平台。本章最后由服务发现平台这一模块引出本文的重点: 服务发现中概念的模糊匹配。 第三章:基于模糊集的语义网络词库。本章简述了模糊集的基本概念以及 它的理论支持,介绍了语义词库网络的理论和实现。 第四章:基于模糊集的概念匹配算法。本章介绍了语义w e b 下的服务匹配 的概念及其相关的技术。 第五章:案例分析。结合电风扇模具材料选择的案例来验证了自定义词库 和概念模糊匹配,实现了设计的初衷。 第六章:总结与展望。对本文的研究工作进行总结并提出进一步的研究方 向。 8 第2 章语义w e b 服务发现框架 第2 章语义w e b 服务发现框架 作为本文的课题背景,“语义w e b 服务发现框架 将企业的w e b 服务和企业 本体的相关操作集成于一个框架下,这方便了企业间的业务协调与合作。 2 1 概述 2 1 1 语义w e b 技术 ( 一) w e b 技术基础 w e bs e r v i c e 是描述一系列w e b 操作的接口,通过标准化的x l l l 消息传递机 制,实现网络访问这些操作。该接口隐藏了服务实现的细节,允许通过独立于 服务实现的方式使用该服务,而不需要考虑硬件设置、软件平台和w e b 服务所 使用的编程语言,如图2 1 所示为w e b 服务框架。 图2 1w e b 服务框架 服务j z 二、 服务描述j ,? 由此可知,w e b 服务模型由3 个角色和3 个基本操作构成。 其中,w e b 服务框架中存在的三种角色: ( 1 ) 服务提供者( s e r v i c ep r o v i d e r ) :使用w s d l 文件来描述和定义w e b 服 9 第2 章语义w e b 服务发现框架 务,并在服务注册中心发布这些服务的信息,使其可以被其它应用访问:接收 和处理w e b 服务请求者的调用。 ( 2 ) 服务请求者( s e r v i c er e q u e s t o r ) :要求满足特定服务的用户。从体系 结构的角度看,它是寻找并调用服务或启动与服务交互的应用程序。 ( 3 ) 服务注册中心( s e r v i c er e g i s t r y ) :服务提供者在此发布他们的服务描 述,服务请求者发现服务并获得服务的信息。 对于w e b 服务的应用来说,必须发生以下三个功能操作: ( 1 ) 发布服务描述( p u b l i s h ) :服务提供者为了使自己的服务能够被使用, 需要向服务注册中心发布服务描述,以使服务请求者可以查找它。 ( 2 ) 发现服务描述( d i s c o v e r ) :在查找操作中,服务请求者直接检索服务注 册中心,查询满足要求的服务。 ( 3 ) 绑定服务( b i n d ) :最后需要绑定服务。在绑定操作中,用户使用服务描 述中的绑定细节来定位、联系和调用服务,从而在运行时调用或启动与服务的 交互。 根据w e b 服务模型由3 个角色和3 个基本操作可知,匹配的基本过程是:服 务提供者将它的服务发布到服务注册中心:当服务请求者需要调用该服务时,它 首先到服务注册中心去搜索该服务,得到如何调用该服务的信息,然后根据这 些信息去调用服务提供者发布的服务。在w e b 服务架构中,使用w s d l 来描述服 务,u d d i 来发布、查找服务,s o a p 则用来执行服务调用。 ( 二) 语义w e b 语义万维网并不是一个孤立的万维网,而是对当前万维网的扩展,语义万 维网上的信息具有定义良好的含义,使得计算机之间以及人类能够更好的彼此 合作。根据上面的描述,可以给语义万维网做出这样的定义:机器可以理解数 据含义的下一代万维网,称之为语义万维网,语义万维网中的语义表示计算机 对某个概念、术语或者符号可以理解的“含义 。 从语义万维网的发展起源来看,语义万维网是人工智能领域和w e b 技术相 互结合的产物。人工智能领域中的知识工程研究从孤立的知识库系统逐渐发展 到基于i n t r a n e t 、e x t r a n e t 的信息系统集成,最后扩展到整个i n t e r n e t ,在 这个研究过程中,逐渐加深了对知识表示和推理的认识,并总结出了一些新的 描述和推理方法。另一方面,万维网经过十几年的发展,积累的海量数据需要 1 0 第2 章语义w e b 服务发现框架 一种新的,机器可以自动完成的方式来处理和管理。因此,当两个领域的积累 都比较成熟,而且有了需求,就必然会走向结合。 因此可以说语义万维网建立的基础,是知识的概念化和形式化以及相应的 推理,并且它和人工智能有着深厚的渊源关系。因此,许多分析都需要从人工 智能领域的角度来考察。但是由于两者的应用环境不同,还存在着一些差异。 例如:从人工智能的逻辑学派和认知学派的观点看来,知识与概念化是人工智 能的核心。传统的人工智能系统,要求共同遵守一些公共概念的完全一致的定 义,并且一般都有它们各自狭义的,特有的用于信息推理的规则集合。尽管数 据能够从一个系统转换到另一系统,但由于系统间的推理规则通常以完全不同 的形式存在,而致使一个系统的规则不能用于其他系统。从这一点上来看,传 统的人工智能系统是一种集中、孤立( 专有) 的系统。同样,语义万维网也是以 知识的概念化表示为基础展开的。语义万维网中的知识,就是一系列对资源的 建模及描述。资源,是一个非常广泛的概念,它可以是网站、网页,甚至网页 的某一个部分的内容。这种描述采用某种形式的符号和表达式对w e b 上的与该 资源相关的其它资源,以及这些资源之间的关系进行刻画。但是,和传统的人 工智能系统不同,语义万维网的知识表示的特殊性在于,它本身要符合w e b 的 分散性和通用型。知识的表示本身可能是由众多的独立团体或个人,以各种各 样的方式来提供,而这些知识却又要求能够被各种各样的应用实现共同理解, 并且在一定的逻辑规则的指导下进行推理。所以语义w e b 上的知识具有创建上 的分散性,同时又具有应用上的通用型。这是语义w e b 和传统的人工智能系统 的一个非常重要的区别。 2 1 2 服务发现框架综述 语义w e b 服务发现框架采用o w l 作为本体描述语言,并通过s a w s d l 标准为 w e b 服务添加语义标注。技术人员首先必须获得描述w e b 服务相关业务领域的 o w l 本体文件,然后用s a w s d l 为其想要查找的w e b 服务的描述添加语义注解。 这样发现框架即可通过内置的语义搜索算法自动查找服务注册中心中的w e b 服 务,并将匹配度最高的若干w e b 服务返回给技术人员以作进一步的分析与筛选。 语义的采用可以明显提高w e b 服务查找的准确度。 第2 章语义w e b 服务发现框架 圈圈;巍短蕾五乏一= = :互:= := :二塑。二一 圃 匦蔓= 二= = := = = = 三 重e 垃0 = 氆醚 盘洵某期! 元组表而辕 共名:二j j j = 二 圜 t t j ud t 垃 9 o i 。口v 自口h :h w w w w 】o m oc o 口es 帅6 n “1 口 t n l q 口ro w l l i n 嵫 图22 语义w e b 服务发现框架界面 图22 所示为本框架的晟终实现界面,可见“语义w e b 服务芨现框架”主 要由三个模块组成:服务发现、语义注册、本体构建和推理,下面分别介绍各 个模块,并在后续章节详细介绍本文的研究重点,即服务发现模块。 w e b 服务发现主要包括服务发布和服务查询发现两方面的内容。其主要的思 想是:通过s a w s d l 标准对以w s d l 作为接口标准的w e b 服务进行语义信息添加, 使w e b 服务和后台本体库建立了数据上的映射关系,这种映射关系在w e b 服务 发布时就已经注册到服务注册中心中去。然后对w e b 服务的发现就可以通过对 服务参数相联系的本体概念进行推理得到单一服务参数匹配结果,然后对单一 第2 章语义w e b 服务发现框架 服务参数的匹配结果进行综合得到整个w e b 服务的匹配结果 如图23 所示为服务发现平台的体系结构。 。:急。p 竺竺毯瓣一一z * 一* o 强雾卜+ 臀 。_ rr 。 i ,一 l 坠l j “;旦* 图23 语义w e b 服务发现框架体系结构 根据体系结构图可知,该服务发现平台包括企业本体构建和推理、语义标 注、基于模糊的服务匹配等。 2 2 企业本体构建和推理 本体( o n t o l o g y ) 又称为实体,源自于形而上学的哲学分支,它对客观世界 的事物进行分解,发现其基本的组成部分,进而研究客观事物的抽象本质。近 年来,本体的概念被越来越多的应用于计算机知识工程领域,用于对客观世界 的存在进行系统化描述,方便知识的重用和交互。人们己经从不同的角度和方 面为本体论概念进行了定义,其中比较著名的有“本体是概念模型的明确的规 格说明”和“本体是共享概念的一个形式化的规格说明”。 在哲学上,o n t o l o g y 是有关存在的本质以及何种事物存在的理论,这是它 作为一门学科所研究的理论。人工智能和网络研究人员共同选择了这个词作为 一 一j j 、7 掣 钐冬 第2 章语义w e b 服务发现框架 其术语。 2 2 1 本体概述 o n t o l o g y 通过对概念的严格定义和概念与概念之间的关系来确定概念精确 含义,表示共同认可的、可共享的知识。在语义w e b 中,o n t o l o g y 具有非常重 要的地位,是解决语义层次上w e b 信息共享和交换的基础,同时也是语义w e b 研究中一个重要的内容。随着企业竞争日趋激烈,并且变化迅速。不同语言、不 同文化背景、不同知识表达习惯以及制造业术语本身不确定性,都给沟通和理 解制造业信息造成了困难。所以,共享的制造业信息为人、计算机和i n t e r n e t 搭建了桥梁。近年来,本体技术已经越来越注重解决知识共享问题。本体技术 的目的是为了提供理论、方法和工具,使知识的沟通和管理更加容易。 根据o n t o l o g y 的通用性级别,可以将o n t o l o g y 分为以下四种类型: ( 1 ) 领域o n t o l o g y :针对特定的应用领域抽象领域知识的结构和内容; ( 2 ) 通用或常识性的o n t o l o g y :针对获取关于世界的通用性知识,提供基本 的观念和概念; ( 3 ) 应用o n t o l o g y :针对特定应用领域知识建模的抽象定义。通常,应用 o n t o l o g y 的概念来自领域o n t o l o g y 和通用o n t o l o g y 然而,应用o n t o l o g y 可 能包括特定方法和特定任务的扩展; ( 4 ) 表示型的o n t o l o g y :主要描述在知识表示形式化背后的概念化,而不致 力任何特定的领域,它们提供的是表示框架。表示o n t o l o g y 提供的原语可以描 述领域o n t o l o g y 和通用o n t o l o g y 。 o n t o l o g y 的具体表示需要用描述语言来实现。目前有多种基于一阶逻辑的 o n t o l o g y 描述语言,如o n t o l i n g u a ,l o o m 等。一些研究人员开发了基于x m l 语 法的w e b 本体描述语言,这些语言包括:s h o e ,r d f ,r d f s ,d a m l + o i l 。 2 2 2 基于p r o t 6 9 6 的企业本体构建 p r o t d 9 6 是由斯坦福大学的s t a n f o r dm e d i c a li n f o r m a t i c s 开发的一款开 放源码的本体编辑器,它是用j a v a 编写的。p r o t d 9 6 界面风格与普通w i n d o w s 应用程序风格一致,用户比较容易学习使用。本体结构以树形的层次目录结构 1 4 第2 章语义w e b 服务发现框架 显示,用户可以通过点击相应的项目来增加或编辑类、子类、属性、实例等, 使用户在概念层次上设计领域模型,所以本体工程师不需要了解具体的本体表 示语言。 使用p r o t e g e 构建本体有如下四种方法: 1 骨架法( s k e l e t a lm e t h o d o l o g y ) ; 2 企业建模法; 3 m e t h o n t o l o g y 方法; 4 循环获取法( c y c l i ca c q u i s i t i o np r o c e s s ) : 5 基于螺旋模型的原型法。 使用以上方法,课题组构建了面向企业协同的制造业本体模型,应用于服 务发现框架之中。制造业包括一系列相互关联的活动,如生产可用材料( 产品 和服务) ,包括规划,设计,获得,生产,库存,销售,分销,销售和管理。制 造业本体是在建立在制造业领域内,包含基本概念、关系、实例、公理和函数 集合的本体,可以作为制造业信息的存储。制造业本体库的设计和建立是一件 复杂和长期的工程,复杂在于它涉及制造业的各个方面,需要领域专家的参与; 长期性在于它需要不断地进行修改和更新。本文主要以制造业中的铸造业例, 建立较为详细的本体库系统。 对于协同环境下的制造业建立四个顶层概念:组织( o r g a n i z a t i o n ) 、操作 ( o p e r a t i o n ) 、资源( r e s o u r c e ) 、协同( c o o p e r a t i o n ) 。其中o r g a n i z a t i o n 、 o p e r a t i o n 、r e s o u r c e 分别与m a r t i n 把制造业分解为r e s o u r c e 、p r o c e s s 、 p r o d u c t 所对应。 1 5 第2 章

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论