(计算机应用技术专业论文)基于语义的web服务发现研究(2).pdf_第1页
(计算机应用技术专业论文)基于语义的web服务发现研究(2).pdf_第2页
(计算机应用技术专业论文)基于语义的web服务发现研究(2).pdf_第3页
(计算机应用技术专业论文)基于语义的web服务发现研究(2).pdf_第4页
(计算机应用技术专业论文)基于语义的web服务发现研究(2).pdf_第5页
已阅读5页,还剩57页未读 继续免费阅读

(计算机应用技术专业论文)基于语义的web服务发现研究(2).pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 服务发现是指用户以某种方式在不同类型的服务中找到其需要的服务由于 基于关键字的传统发现方法存在低查全率和低查准率等问题,人们逐渐引入基于 语义的服务发现机制。但是当前的服务语义描述模型对服务质量的描述不足,基 于语义的服务匹配方法存在片面性针对以上问题,本文对服务发现中的关键技 术,包括服务语义描述模型、基于语义的服务发现模型和基于语义的服务匹配方 法进行了研究 本文将语义w e b 技术引入到服务发现中,构建了以u d d i 为基础的基于语 义的w e b 服务发现模型,并对其核心模块m a t c h m a k e r 进行了详细设计。创建了 语义匹配的本体基础科研领域本体,并定义了服务的语义描述模型,记为 s s q d ( 服务语义质量描述) ,该模型具备描述服务质量的能力,提出了一种语义、 性能相结合的w e b 服务匹配机制,并在现有算法的基础上提出了基于s s q d 的 w e b 服务相似度匹配算法,该算法结合本体的结构特点全面考虑了服务质量信 息最后基于以上模型和技术开发了基于语义的w e b 服务发现原型系统,并给 出了实验结果。通过分析实验结果,初步验证了本文所提出的相似度匹配方法的 优越性 关键词:语义w e b ,发现,匹配,本体 r e s e a r c ho ns e m a n t i c b a s e d 、bs e r v i c e d i s c o v e r y a b s t r a c t s e r v i c ed i s c o v e r ym e a n sc u s t o m e r sf i n dt h es u i t a b l es e r v i c ef r o md i f f e r e n t s e r v i c e sb ys o m ew a y s o m er e s e a r c h e r sh a si m p o r t e ds e r v i c ed i s c o v e r ym e c h a n i s m b a s e do ns e m a n t i c , 勰t h e r ea s o f t i ed i s a d v a m a g e si n c l u d i n gl o w - r e c a l la n d l o w - p r e c i s ew h e nu s i n gk e y w o r d sm a t c h m a k i n ga l g o r i t h m b u tc u r r e n ts e m a n t i c s e r v i c em o d e ll a c kt h ed e s c r i p t i o n so ft h eq u a l i t yo fs e l v i c e ,a n dt h es e m a n t i c - b a s e d s e r v i c em a t c h i n gi su n i l a t e r a l t os o l v et h ep r o b l e m s ,t h ep a p e rd o e sw o r ko i lt h ek e y t e c h n o l o g i e si n c l u d i n gs e m a n t i cd e s c r i p t i o nm o d e l , s e m a n t i c - b a s e ds e r v i c ed i s c o v e r y m o d e la n dt h em a t c h m a k i n :ga l g o r i t h m n 地p a p e ri m p o r t st h es e m a n t i cw e bt e c h n o l o g yt ot h es e r v i c ed i s c o v e r y , a n d d e s i g n sas e m a n t i c - b a s e ds e r v i c ed i s c o v e r ym o d e lb a s e do i lu d d i ,a n dd o e sm o r e d e t a i l si nt h ec o r es u b - m o d e l , n a m e dm a t c h m a k e r e s t a b l i s ht h es c i e n c ea n dr e s e a r c h d o m a i no n t o l o g y ;d e f i n et h es e m a n t i cd e s c r i p t i o nm o d e l ,n a m e ds s q d ( s e r v i c e s e m a n t i ca n dq o sd e s c r i p t i o n ) w h i c hh a v et h ea b i l i t yt od e s c r i b et h eq u a l i t yo f s e r v i c e ,a n di m p r o v et h es i m i l a r i t ym a t c h m a k i n ga l g o r i t h mw h i c hc o m b i n e st h e b - 缸u c u t n lf e a t u r e so fo n t o l o g yt oc o n s i d e rt h eq 谢i t yo fs e r v i c e a tl a s t , a s e m a n t i c - b a s e ds e r v i c ed i s c o v e r yp r o t o t y p es y s t e mh a sb e e nd e v e l o p e d , a n dt h et e s t r e s u l t sh a v eb e e ng i v e 礼a n dt h ea l g o r i t h mp r o p o s e di nt h ep a p e rh a sb e e np r o v e d w o r k i n g w e l l t h r o u g h t h ea n a l y s i s o f t h a t e s t r e s u l t s k e y w o r d s :s e m a n t i cw e b ,d i s c o v e r y ,m a t c h m a k e r , o n t o l o g y n 西北大学学位论文知识产权声明书 本人完全了解学校有关保护知识产权的规定,即:研究生在校攻 读学位期间论文工作的知识产权单位属于西北大学。学校有权保留并 向国家有关部门或机构送交论文的复印件和电子版。本人允许论文被 查阅和借阅。学校可以将本学位论文的全部或部分内容编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学 位论文。同时,本人保证,毕业后结合学位论文研究课题再撰写的文 章一律注明作者单位为西北大学。 保密论文待解密后适用本声明。 , 学位论文作者签名:墨兰 指导教师签名:始 司年b 月1 日衍年月日 ( 西北大学学位论文独创性声明 本人声明:所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,本论文不包含其他人已经发表或撰写过的研究成果,也不包含 为获得西北大学或其它教育机构的学位或证书而使用过的材料。与我 一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的 说明并表示谢意。 学位论文作者签名:写法 妇年6 月1 日 第一章绪论 本章介绍了本文研究的出发点,语义w e b 服务发现的研究现状和论文的主要 工作,最后给出了本文的结构。 1 1 研究背景 1 1 1 问题的提出 随着w e b 的发展,可供选择的候选服务数量巨大。为了有效实现服务的应 用价值,需要解决以下关键问题:如何发现满足需要的服务:如何选择最佳服务 等以上问题的解决都将为最终实现服务的商务潜能提供先进的、便利的技术基 础目前已有的技术大都采用基于关键字的服务匹配机制,存在着低查全率和低 查准率的问题。语义w e b 的出现为以上问题的解决带来了契机。语义w e b 1 1 的 概念由t u n 妯e r s l e e 于1 9 9 8 年首次提出,其研究目标是扩展当前w e b ,使 w e b 中的所有信息具有定义良好的语义,让计算机能够理解和处理,从而充分发 挥w e b 的潜力如果用语义w e b 的知识标记手段来描述服务的语义,就可使 w e b 服务成为计算机可理解的实体,从而支持服务的自动发现、匹配、执行、组 合等操作 2 1 。对于w e b 服务来说,动态、异构的w 西环境要求基于w e b 提供的 服务可以灵活的、可靠的满足用户要求,实现“按需服务”,即根据用户的需求 提供合适服务 但是现有的基于语义的服务发现存在着以下问题: ( 1 ) 服务语义描述模型与现有模型不兼容,缺乏映射机制当前w e b 服务主 要采用w s d l 描述、u d d i 存储。而语义描述模型主要采用w e b 服务本体语言 0 w l s 描述 ( 2 ) 缺乏对服务质量的描述。随着w e b 服务发展,服务数量剧增而且由于 ,目前还没有制定一个统一的服务质量标准,不同的服务提供者提供的功能相似的 服务,其性能可存在着很大的差异。因此服务质量也成为选择最佳服务的一项重 要指标。 ( 3 ) 服务匹配算法存在多样化、片面性的特点虽只存在推理和数量计算两 种趋势,但是:在推理方面,不同的模型采用不同推理机,不同的规则描述等; 在数量计算方面,不同的方法从不同的角度考虑问题,存在片面性,不能全面考 虑语义相关度的影响因素,出现了同等条件下的服务之间难以区别的情况 本论文的选题正是针对以上问题展开的本文在引进语义w e b 技术、本体 技术,分析w 曲服务特点的基础上提出了一个以u d d i 为基础的基于语义w e b 的服务发现模型,提出了基于语义的w e b 服务匹配机制,通过一系列匹配算法 从多方面进行服务请求和广告之间的相似度计算,并选择最符合用户要求的服务 结果提交给用户实验证明,该方法能在兼顾服务发现查全率的前提下提高查准 率 1 1 2 服务发现模式 面向服务的架构中最实质的部分是服务的发布、查找、绑定其中又以服务 查找为关键,即服务匹配通常我们将执行匹配的功能模块称为m a t c h m a k e r , 其主要功能就是根据服务请求者的要求检索出满足其需求的服务m a t c b m 妇 与另一个名词服务代理删容易混淆【3 1 ,因为服务代理也具备服务匹配 功能但是两者从本质上来说是两个概念,臌务代理完成服务匹配后仍然参与服 务提供者、请求者双方的实际执行环节,而m a t c h m a k e r 不参与m a t c h m a k e r 仅仅将符合请求者要求的服务的地址和描述文件传给请求者后即退出,将认证、 绑定、执行等任务交给服务供需双方处理,而监控、收费等任务留给面向服务的 架构处理以上两种模式见图1 1 本文采用m a t c h m a k e r 模式构建。 图1 1 两种服务发现模式 2 1 1 3 语义w e b 服务发现关键技术研究分析 支持语义服务发现的主要关键技术包括: ( 1 ) 服务标记语言 服务的语义信息需要通过合适的语言来标记。标记语言的语义表达能力和形 式化支持直接影响到w e b 服务匹配的自动化程度和灵活性。因此语义w e b 服务 匹配技术与语义w e b 标记语言的发展密切相关。目前除了w 3 c 的语义w e b 成 员外,世界各地的研究机构和科研人员都密切关注着语义w e b 标记语言的发展, 从理论到实践,从标准到规范,都在做着不懈的努力。目前主要的语义标记语言 分析见表1 1 ,概念表达能力以及逻辑推理分析见表1 2 和表1 3 表1 i 语义标记语言分析表 语言名称发起团体发起时间语法基础 语义基础 s h o e l 4 1 美国m a r y l a n d 大学j a m e sh e n d l c 1 9 9 5h t m l h o m 逻辑 教授及其学生 r d f s i w 3 c1 9 9 9x m l语义网络 o i l t 6 1 m a n c h e s t e r 大学、s t a n f o r d 大学、 2 0 r d f s 描述逻辑 贝尔实验室、m i t 大学 d a m l l 7 1 美国d a r p a 刀o 8r d f 描述逻辑 d a h + o d a r p a 和欧共体i s t 联合开发 2 0 0 0 1 0r d f 描述逻辑 o w l t !w 3 c o w lt 作室2 0 0 3 7x m l 描述逻辑 表1 2 概念表达能力分析表 概念 s h o er d f s0 l l d a m l + o i lo w l 分区定义 , 文档注释 , 实例属性 , 概念属性 , 局部属性 , 全局属性 ,j 默认值 xx 类型约束 , 数量约束 x, , 基于对以上语言的分析,本文在研究o w l 语言的基础之上,提出了s s q d ( s e r v i c es e m a n t i ca n dq o sd e s c r i p t i o n ,服务语义质量描述) 服务语义描述语言, s s q d 语言在对服务进行语义描述的同时,还兼顾了对服务质量的描述,对服务 发现结果集的优化起到了决定作用 3 表1 3 逻辑推理分析表 l 本体建模语言 s h o er d f so i ld a m l + o i lo 、 ,l l 具有推理功能 ,j , l 内在逻辑支持框架逻辑语义网络描述逻辑描述逻辑描述逻辑 ( 2 ) 服务的语义描述模型 有了语义w e b 标记语言的支持,还需要考虑描述服务的信息,也就是为服务 建模。完整的模型既需要能描述服务的属性,如功能信息、性能信息、物理信息 等,也需要能描述用户的需求、偏好等模型建立后需要用合适的语义w e b 标 记语言将其描述为大家可以共享的本体 d a m l 框架下的d a m l s 【9 j 是国际w e b 服务语义描述模型方面的主要研究 成果,它是b b nt e c h n o l o g i e s ,n o k i a , s r ii n t e r n a t i o n a l ,c m u ,s t a n f o r d 等联合定 义的一种描述服务的标记模型,为提供机器可理解的、精确的、关于服务属性和 能力的描述的一系列标记符它是基于d a m l 语言为描述服务而定义的一个本 体,主要通过s c r v i c c p r o f i l e ,s c r v i c c m o d c l 和s e r v i c c g r o u n d i n g 三个类来描述服 务做什么、如何傲以及如何访问服务等三方面的语义信息,从而允许服务的自动 发现、执行的监控。 随着o w l 成为w 3 c 推荐的w e b 本体语言标准,d a m i ,s 也演化为 o w l - s ! 埘o w l - s 是用o w l 语言写的本体,因此它具有定义良好的语义。可 以根据对象和它们之间的复杂关系来定义服务的词汇表,并且可以包含x m l 的 数据类型信息o w l - s 和当前的服务标准u d d i 、w s d l 等结合可以较好的支 持未来的语义w e b 服务,见图1 2 ( 3 ) 服务匹配方法 如果已经建立服务描述模型,用户也确定了其要求,则需要考虑如何根据用 户要求为其找到合适的服务,即服务的匹配方法 在服务语义描述模型出现之前,服务匹配一般都是基于关键字匹配或者模式 匹配,例如著名的u d d i 等,它基本上是一种静态匹配的方式,自动化程度不高 丽d a m l - s 和o w ls 出现后为新的匹配方法提供了可能,它们将服务看成是人 工智能中的行为,用参数、前提和结果来描述服务,可以比较自然的映射为行为 的形式化描述 4 o w l - s p n 。i 服务流组合 l o w l - sp r o c e s s o w l p r o f i i 亭& u d 引 o w i - sg r o u n d i n g & w s d l k q m i - a g l 5 0 a p h 1 t p f t p 图1 2 语义w e b 服务体系结构 目前基于语义的服务匹配方法都是基于本体或者分类体系进行计算的,主要 包括两种方法:基于推理的服务匹配和基于数量计算的服务匹配,其主要思路都 是将服务中的概念映射到本体中后再匹配所不同的是各自的匹配思想,见表 1 4 表1 4 语义匹配方法分析表 匹配方法理论基础 产生结果 优点缺点 将概念映射到本体 五种匹配等查准率较高,总能对于s u b s u m e 以 中。基于逻辑推理级le x a c t 推出结果及i n t e r s e c t i o n 匹 规则。通过推理机。 p l u g h k 配等级内部的所 基于推理推理出概念之间的 s u b s u m ( : 有服务一视同 关系( 包括概念等i n t e r s e c 嘣o n 仁。区分不够清 价、概念蕴含和概d i s j o i n t楚,实现困难, 念关联等) 1 1 1 灵活性较差 基于几何将概念映射到本体以数值表示匹配灵活,查准率未全面考虑本体 基距离l m中后。通过考虑层相关度与查全率并重。对结构对概念问语 于 基于属性次关系上的节点距服务匹配有一定义相关度的影 数 i j j 离或两个本体间的的张弛能力,不仅响。计算方法复 量基于信息并集和交集之比作能返回匹配结果,杂,处理速度较 计 容量1 1 1为语义相关度来衡还能返回相应的低 算量两个概念的语义匹配程度,为服务 距离请求者提供更有 意义的参考。 本文采用基于s s q d 的w e b 服务相似度匹配算法来计算服务请求和服务广 告之间的匹配程度,该算法通过计算服务请求和服务描述之间的l o p e 和q o s 的 5 综合语义相似度来表示请求和广告之间的相似度。 1 1 4 语义w e b 服务发现国内外研究现状分析 ( 1 ) 国外研究现状 国外关于语义w e b 服务匹配的研究成为一个热点,见表1 5 。 表1 5 国外语义w e b 服务匹配研究分析表 专家描述语言匹配机制描述 k l e i nm i 】封 本体过程逻辑推理过程本体将每个服务分解为几个过 b e r n s t e i n a 程的集合,前一个过程的输出是后 一个过程的输入详细描述服务, 依次增加服务查找的精确度和减少 计算复杂度 d a v i dt r a s t o u r 1 6 1 r d f , d a i v l l v i s i t o rp a t t e r n 算 从匹配的角度说明一个匹配系统应 c l a u d l ob a r t o l i n i 法 该具备的特征以及服务描述所应具 备的元数据并实现了匹配原型 d c h a k r a b o r t y d a m 吐 p m l o g 推理在移动商务领域,通过p r o l o g 推理 f p e r i c h l l 乃 语言实现基于服务描述内容的匹配 m o b a n d 1 s l c o m p u t e b c o v 对经典匹配算法一集合算法进行 了改进 p a y n e 【1 9 1 d a 皿一s 对a t l a s 服务匹配引擎进行改进, s y c a r ak 刚 增加了使用d a m l o s 的服务描述 s y c a r a k l a r k s 上下文、p r o f i l e 、 使用多个过滤器筛选合适的服务 c l u s c h m 相关度、约束过滤 j a v i e rc a s t m d 2 1 1d a h 缸寸o i l 描述逻辑,f a c t通过语义描述语言和推理机实现语 和r a c e r 义匹配,主要采用推理的方法 o l ac a p r o n io w l数学w e b 服务匹 由m o n e t 项目发展而来,在o w l m i k e 既稍 配算法基础上发展了数字服务描述语言, 为语义w e b 服务在特殊领域的应 用具有十分重要的意义 c a r d o s o s h e t h l 2 3 1 数量计算 定义一个服务模扳( s t ) ,其中服务 名和服务描述采用句法相似计算, 输入输出相似采用输入输出的匹 配度计算 ( 2 ) 国内研究现状 国内对语义w e b 服务的研究起步较晚,正处于学习阶段。其中较为突出是 中科院的史忠植教授及其学生,他们开发了多主体服务环境m a g e 2 4 1 ( m u l t i - a g e n te n v i r o n m e n t ) ,并提出了基于描述逻辑的主体服务匹配算法,该算 法最突出的特点是将服务表示为c o n c e p t :a c t i o n ( 概念,动作) 的格式,然后运 6 用描述逻辑对主体概念进行分层推理,实现相关度匹配,其结构图如图1 3 所示。 图1 3m a g e 结构图 ( 3 ) 国内外研究现状总体分析 通过分析可见,目前大多数基于语义的服务发现采用了基于推理的匹配机 制,基于本体概念,通过概念问关系以及规则进行推理,系统的实现及其性能很 大程度上依赖于推理机以及推理规则的完整性。虽然保证了查准率以及推出结果 的必然性,但是实现性和灵活性较差c a l d o s o 和s h e t h 提出的基于数量计算的 匹配机制,每步都需要相关度计算,不仅计算复杂,也不利于实现服务精确匹配 而且在服务描述模型方面,要么采用当前的缺乏语义支持的w e b 服务描述模型, 要么完全摒弃现有模型,定义自己的描述模型,在现有模型与语义描述模型的结 合方面并没有进行研究。本文的选题正是要对以上问题进行分析和解决,力图实 现一种简单、灵活的匹配机制 1 2 论文的主要工作 本文在分析现有服务匹配机制的基础上,融合其优点,首先定义了服务语义 描述模型,然后根据该描述模型提出了一套简单的、灵活的服务相关匹配机制, 之后提出了一个基于语义的w e b 服务匹配模型。主要研究工作包括: 、( 1 ) 构建科研管理领域本体,重点研究科研管理领域本体内部结构,抽象为 概念、概念实体以及概念间关系三种类型,对其进行分类和定义,最终形成一个 , 语义清晰的网状结构,能够支持该模型的匹配功能 ( 2 ) 通过分析和比较现有服务描述模型( 包括w s d l 和o w l s ) 各自存在的 问题,提出新的服务语义描述模型该模型融合现有模型的优点,主要针对现有 语义描述模型在服务质量描述方面的不足,对其进行扩充,表示为s s q d ,进而 通过该模型对服务进行标注。 ( 3 ) 为了实现服务相似匹配机制,针对概念匹配以及服务质量匹配给出了匹 配算法。该算法对服务请求和广告的描述文档中的概念进行匹配,其中包括服务 的i o p e 和q o s 两部分 ( 4 ) 将语义w e b 中的本体技术引进到服务中,构建基于语义w e b 的服务匹配 模型的层次结构以及功能模块结构,并对其核心模块m a t c h m a k e r 进行详细设计 ( 5 ) 构建科研管理领域本体实例,并将其应用于本论文的实验系统;开发实 验系统,对该系统中的服务匹配功能进行介绍和实例运行描述。通过比较分析实 验结果验证本论文提出的发现算法的优越性 1 3 论文的组织 本文围绕着基于语义的w e b 服务发现的方法和技术而展开,共分七章,具 体内容安排如下; 第一章绪论 介绍了本文研究的出发点,语义w e b 服务发现的研究现状和论文的主要工 作,最后给出了本文的组织结构 第二章基于o w l 的本体创建 介绍了本体的基本理论和支持语义w e b 的三种本体语言,并详细阐述了怎 样构建科研领域本体 第三章服务描述模型- s s q d 在分析现有服务描述模型的基础上定义了s s q d ,该模型强调了服务的所携 带的语义信息和对服务质量的描述 第四章基于s s q d 的w e b 服务匹配机制 服务匹配主要是通过计算服务间相似度来决定。因此相似度计算是服务匹配 8 的关键技术之一本文融合已有的服务匹配研究,在s s q d 的基础上,提出了一 种实用、便于实现的服务相似匹配机制,并给出了服务相似度的计算公式。 第五章基于s s q d 的w e b 服务发现模型设计 介绍基于s s q d 的w e b 的服务发现模型的总体架构并详细阐述了该模型的 设计结构。该模型构建于u d d i 注册中心之上,使用公用或者私用的u d d i 注册 中心作为保存服务和服务提供者信息的物理存储。其核心处理模块一匹配模块 m a t c h m a k e r ,用来分析服务请求和广告之何的服务相似程度 第六章基于语义的w e b 服务发现原型系统 主要介绍基于本体的w e b 服务发现系统( o n t o l o g y b a s e dw e bs e r v i c e d i s c o v e r ys y s t e m ,o w s d s 系统) 的开发,并对匹配过程和结果进行分析 第七章总结与展望 对本文所作的工作进行了总结,对下一步的工作进行了展望 9 第二章基于o w l 的本体创建 本体在基于语义的服务发现中处于重要的支持地位,本章所要讨论就是本体 理论,并重点阐述了怎样构建科研领域的本体。 2 1 本体 为了描述服务的功能和参数的语义信息,人们逐渐引入了本体。本体是对领 域知识概念的抽象和描述2 0 世纪9 0 年代初期,本体成为包括知识工程、自然 语言处理和知识表示在内的诸多人工智能研究团体的热门课题。其主要原因在于 本体使机器间的交流建立在对所交流领域共识的基础上本体在知识库系统开发 中较多应用于开发领域模型,它提供了建模所需的基本词汇并说明了它们之间的 关系润伫q 作为一种有效表示概念层次结构和语义的模型,本体非常适合作为语义w e b 要求的知识表示形式,本体可以通过带标记的有向图来表示,并且适合进行逻辑 推理。本体通过对概念的严格定义和概念与概念之间的关系来确定概念精确含 义,表示共同认可的可共享的知识对于本体来说,具有共同实际意义的不同标 识实际是同一个概念,因此在语义w e b 和基于语义w e b 服务的动态组合中,本 体具有非常重要的地位,是解决语义层上w e b 信息共享和交换的基础网 通过建立基于本体的语义服务描述模型,使各个服务能够以统一的描述格式 描述服务的功能和属性信息,满足服务间协作、交换信息的要求,从而为实现我 们希望的协同工作和按需计算打下坚实的基础 本体最早是一个哲学上的概念,在人工智能领域中,最早给出了本体的定义 为“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的 规定这些词汇外延的规则的定义”1 9 9 3 年,g r u b e r 给出了一个最为流行的定义 即“o n t o l o g y 是概念模型的明确的规范说明”。后来,b o r s t 在此基础上给出了另 一个定义:“o n t o l o g y 是共享概念模型的形式化规范说明”s t u d e r 等人对上述两 个定义进行了深入的研究,认为o n t o l o g y 是共享概念模型的明确的形式化规范 说明。一个本体o i - - c l ,岛 包含一组类每个类q 有一组相关属性 p f p l ,p i l i ) 每个属性有一个取值范围。本体将更特殊的类与更一般化的类关 联起来,特殊类通过继承将从这个一般化的类获得那些一般属性。这样的关联有 很多种,比如“属于”、“是的子集”、“是的成员”、“是的子类”、“是 的父类”等等这些关系用来将类按照层次或者别的某种局部顺序组织起来,我 们把它叫做分类。分类学用于把信息按照它们的一般性分级存储,并通过继承的 机制自动传递给更特殊的类嘲在这样的局部顺序中我们可以说更一般性的那 个类包含那个更特殊的类,而这个更特殊的类从它们的包含者那里继承信息。本 体中的类与面向对象编程中的类的概念非常相似嗍 本体论的重要性在很多研究领域得到了承认,如知识工程,知识表示、质量 建模、语言工程、数据库设计、面向对象分析、信息检索和提取等等o n t o l o g y 通过对概念的严格定义和概念与概念之间的关系来确定概念的精确定义,表示共 同认可的、可共享的知识因此,它们可以对信息源的语义进行明确的描述,可 以使得异类的w e b 服务的接口语义描述更加明确化,从而有利于发现和集成 2 2 面向语义w e b 的本体支持语言 2 2 1d a m l 语言介绍 d a m , ( d a r p aa g e n tm a r k u pl a n g u a g e ,代理标记语言) 嗍【3 1 】项目正式开始 于2 0 0 0 年g 月,由美国政府支持,目标是开发一种语言和一组工具,为语义互 联网提供支持。d a m l 形成于d a m l - o n t ( 一种本体语言) 和d a m l 1 0 9 i c ( 一种表 达公理和规则的语言) d a m l 提出的原因和后面将要提到的o i l 语言类似,一批支持语义w e b 的 研究者发现x m l 、r d f 作为模式语言其表达能力很有限,希望开发一种有更强 的表达能力的模式语言。尽管d a m l 最终并没有成为w 3 c 的标准,但是参与的 开发者中有很多来自w 3 c 的工作者,包括 i n nb c m e r s l e e 。 d a m l 扩展了r d f ,增加了更多的更复杂的类、属性等定义它一度很流 行,直到现在仍然是网上很多本体的首选描述语言,直到d a m l 的研究者和0 l l 的研究者开始合作,推出了d a m l + o i l 语言,成为w 3 c 研究语言互联网的本 体语言的起点。 2 2 2o i l 语言介绍 o i l ( o n t o l o g yi n t e r c h a n g el a y e r ,本体交换语言) 【3 2 j ,是欧洲的o n t o k n o w l e d g e 联盟针对基于w e b 环境进行知识工程建模提出的一种本体语言。o i l 主要的来 源是描述逻辑、基于框架的系统、基于x m l 与r d f 语法的w e b 语言标准运 用o i l 可以定义面向应用的本体,同时定义的模型可以用x m l 的d t d ,x m l s c h e m a 或r d f 数据模型进行描述。这种模型的描述可以在w e b 环境中实现透 明的交换和共享 o i l 本身也采用分层的方法定义标准的本体语言。其中上层在下一层基础上 增加了功能和复杂性,这样当本体按任何一层的语义进行描述,即使只能处理和 理解低层语义的主体c 人或机器) ,也能够部分理解高层的本体描述o i l 的各层 功能从下到上简单介绍如下 3 3 1 : 核心o i l 主要同r d f 模式一致,除了r d f 的具体化特性。这就意味着即使 简单的处理r d f 模式的主体能够处理o i l 的本体描述,并尽可能多理解o i l 本 体描述的语义;标准o i l 是用来定义必要的主流的建模原语,这些原语提供足 够的表达能力,并且可以被很好的理解,因此使得语义可以被精确定义,实现完 整的推导;实例o i l 纯粹是具体的集成,因为前一层包括了建模构件,构件允 许具体的填充器在术语定义中定义。所以实例o i l 具有一种成熟的数据库能力; 重量级o i l 在将来进行扩展,可能会具有额外的表示和推理能力 2 2 3o w l 语言介绍 o w l 全称w e bo n t o l o g yl a n g u a g e ( w e b 本体语言) ,是w 3 c 推荐的语义互 联网中本体描述语言的标准它是从欧美一些研究机构的一种结合性的描述语言 d a m l + o i l 发展起来的,结合了d a m l 和o i l 设计和应用中得到的经验教训。 o w l 通过提供一个具有形式语义的附加词汇表,使得它比由x m l ,r d f 和 r d fs c h e m a 支持的w e b 内容更具有机器可解释性o w l 采用面向对象的方式 来描述领域知识,即通过类和属性来描述对象,并通过公理来描述这些类和属性 的特征和关系 语义w e b 中信息都被赋予了明确的含义,机器能够自动的处理和集成语 1 2 义w e b 使用x m l 来定义定制的标签格式以及使用r d f 的灵活性来表达数据, 下一步就是用w e b 本体论语言( 比如o w l ) 来描述w e b 中的术语的明确含义和它 们之间的关系。 对于语义w e b 来说,并不是所有的应用都需要完备的逻辑推理,可能只用 到逻辑模型的一个子集。o w l 的设计就体现了这个思想,针对不同的需求有三 个表述能力递增的子语言,描述如下【,叼: 子语言o w ll i t e 是o w l 中相对容易实现部分的子集合,只提供了层次分 类和简单的约束功能,用于提供给那些只需要一个分类层次和简单的属性约束的 用户。 子语言o w ld l 提供了大部分o w l 词汇支持和r d f s 支持,并在语义上等 同于描述逻辑d l ( d e s c r i p t i o nl o g i c s ) 。它支持那些需要在推理系统上进行最大程 度上表达的用户,这里的推理系统能够保证计算完全性和可决定性它包括了 o w l 语言的所有约束,但是可以被仅仅置于特定的约束下 子语言o w lf u l l 描述包括所有的o w l 词汇和r d f s 提供的原语,能够提 供最大程度的知识描述能力,但是由于过于复杂,且还不成熟,因此还在不断的 更新中它支持那些需要在没有计算保证的语法自由的r d f 上进行最大程度表 达的用户它允许一个o n t o l o g y 在预定义的( r a f , o w l ) 词汇表上增加词汇,从而 任何推理软件均不支持o w lf u l l 的所有特性。 2 3 科研领域本体的构建 领域本体是特定领域内的一组术语及其关系的定义。领域本体的建立是一个 增量迭代式的开发过程,是一个不断增加新概念、修改已知概念的过程。因此一 个重要的问题就是如何在本体开发初期、开发的各个阶段和各个开发阶段之间保 持完整、一致和简洁的概念定义和描述 本文中本体构建主要包括四个步骤: ( 1 ) 科研本体的需求分析:明确科研领域本体建设的目的、范围、用途和使 用者。 ( 2 ) 建立科研领域共享概念。 ( 3 ) 本体表示:用o w l 本体描述语言,建立概念分类层次,然后定义类的属 性和创建类的实例 ( 4 ) 本体评估和改进:本体评估后,根据评估结果确定是否返回第二步重新 循环构建本体,还是成功结束构建本体 2 3 1 科研本体需求分析 根据研究的领域,建立相应的领域本体。领域越大,所建本体越大所以需 要限制研究的范围,一般可以通过以下几个方面确定本体开发的领域和范围 ( 1 ) 本体覆盖的是什么领域 本研究是科研领域。研究科研领域中的论文、文献、人员、项目的信息。 ( 2 ) 建立本体的目的是为了什么样的应用 开发科研本体是为了满足科研管理过程中服务发现的查询结果更加符合用 户要求 ( 3 ) 目标用户有哪些 不同职位人员对于本体的需求不同,所以确定合适的人员使用和维护本体是 很重要的本系统的目标用户主要有系统维护者和最终用户。 ( 4 ) 在本体信息里应该提供什么类型的信息 在这一阶段,针对所有本体需要提供的信息进行搜集该本体只用来计算服 务请求和服务广告之间的匹配程度 ( 5 ) 本体描述语言的确定 后台采用关系数据库存储本体,前端采用o w l 文档描述本体。 2 3 2 建立科研领域共享概念 本体建立者在本体的领域和范围内进行概念化的首要任务是建立领域共享 概念。收集所有有用的和潜在有用的领域概念及语义、属性和实例等建立领域 共享概念首先通过收集领域信息充分了解领域知识信息来源可以包括专家、书 籍、网络或者其他本体。很多本体建立者把叙词表当作建立共享概念的基础对 于科研领域,本文基于国家社会科学基金项目申报、评审和审批实施办法( 试 1 4 行) ( 1 9 9 6 年修订) 、国家社会科学基金项目检查、鉴定和验收实施办法、全 国教育科学规划课题管理暂行办法等有关规定和国标g b 7 7 1 3 8 7 构建,这项 标准于1 9 8 8 年1 月1 日正式实施 共享概念的建立是根据国家标准分类中对每一个涉及的分类领域进行语义 描述,主要包括以下凡项: ( 1 ) 概念名 ( 2 ) 概念同义词 ( 3 ) 概念英语名称 ( 4 ) 概念语义描述 ( 5 ) 概念包含的属性 ( 6 ) 概念所属类 2 3 3 建立概念分类层次 本节在共享概念的基础上建立概念分类层次,从而形成核心本体 在本体的构建中离不开领域专家的参与,而且较为理想的情况则是由领域 专家完成这件事,才能保证语义的正确性、一致性和完整性。但是本体建设工程 浩大,计算机需要知识的形式化的精确定义,并且需要更多的关联来进行推理, 这又离不开i t 人员的参与。而二者的合作并非易事因此在实践中常是由对两 方面知识都有了解的知识工人来做为了支持这种情况,降低领域专家的参与度, 本文先确定一些本体中的核心概念和关系,然后再逐步细化本体 为了满足概念分类层次的一致性、完整性、准确性,对知识要从以下方面进 行检验: ( 1 ) 确定领域共享概念中的概念细节的粒度和层次 ( 2 ) 没有重复或冗余的概念 ( 3 ) 所有分类层次上的概念在概念词库中有定义 在实际开发过程中,一般往往根据需要对同一领域建立多种不同的分类层 次,如在科研领域中的论文就可以有表2 1 的分类方法。: 表2 1 论文分类方法表 分类标准 分类结果 按学科的性质和功能基础学科论文、技术学科论文和应用学科论文 按论文内容所属学科、专业 数学论文、物理论文、化学论文,天文学论文、 论 机械工程技术论文、建筑工程技术论文等 按研究和写作方法理论推导型学术论文、实( 试) 验研究型学术论文、 文 观测型学术论文、设计计算型学术论文,发现发 明型学术论文,争鸣型学术论文、综述型学术论 文等 按照写作目的和发挥的作用学术性论文、技术性论文、学位论文 类是一种经过组织的结构化知识表示方法,每一个类形成一个独立的知识单 元,操作楣对独立,从而使类表示为较好的模块,便于扩充并且对于知识的描 述直观,便于理解,反映了事物间的联系。类的层次基本投则为: ( 1 ) “i s a ”关系:类层次代表一个“i s a ”关系如果b 的每个实例也是a 的实例,则b 是a 的子类例如学术性论文是论文的子类。此外,也可认为是 “k i n d - o f 关系,即学术性论文是一种论文。类之间的关系除了i s a 之外,还包 括部分与整体关系p a r t - o f , 概念实例关系h u g t a n c , c o f 和概念属性关系a t u d b u t e - o f 等三种基本关系根据这四种关系,概念类组成了一个关系网,形成了可用的语 义资源 ( 2 ) 层次关系的传递性:如果b 是a 的子类,c 是b 的子类,则c 也是a 的 子类 【3 ) 在定义类的层次结构形式时应避免出现类的循环现象如a 是b 的孑类, 同时b 也是a 的子类,这种情况下,a 和b 是等价的 ( 4 ) 如果一个类只有一个直接子类,那么这个类是不完善的,此时应将子类 与超类合并 下面以科学研究为例,说明概念分类层次的建立情况该分类根据上述类的 层次构建原则,依据国家标准建立这里只列出了主要概念和继承关系以说明问 题。图2 1 显示了科研领域中的继承关系。 1 6 科学研究 科教人员i项目成果ff 学术活动 司圜固同曰闻闻国闰 2 3 4 定义类的属性 到目h 引h 定义了类和类的结构并不能对服务发现提供有效信息,还应该描述出这些概 念的内部结构属性( p r o p e r t y ) 可以披用来说明类的共同特征以及某些实体 ( i n d i v i d u a l ) 的专有特征;为了描述概念的特征,o w l 定义了两种类型的属性, 一种是数据类型属性,如图2 2 左半部分所示,圆圈定义了属性“作者”,。作者” 的d o m a i n 指向概念“论文0 表示“论文”可以有“作者”属性,。作者”的 r a n g e 指向“字符型”,表示。作者”的取值范围是字符型另一种是对象属性, 用来描述概念之间的关系,如图2 , 2 右半部分所示,圆圈定义了对象属性“指导 教师”。表达了概念“毕业论文”和概念“教授”之间的关系,“指导教师”的 d o m a i n 指向“毕业论文”表示毕业论文有指导教师指导,“指导教师”的r a n g e 指向“教授”表明指导教师必须是一名教授 圈 圈2 2o w l 中数据类塑属性和对象属性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论