




已阅读5页,还剩59页未读, 继续免费阅读
(计算机软件与理论专业论文)本体在web服务发现中的应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 w e b 服务使得w e b 向着一个基于i n t e r n e t 的计算平台发展。然而现在的w e b 服 务标准u d d i ( u n i v e r s a ld e s c r i p t i o nd i s c o v e r ya n di n t e g r a ti o n ,统一描述、 发现和集成) 、w s d l ( w e bs e r v i c e sd e s c r i p t i o nl a n g u a g e ,w e b f l 务描述语言) 、 s o a p ( s i m p l eo b j e c ta c c e s sp r o t o c o l ,简单对象访问协议) 均缺乏对语义层面的 支持,传统的w e b 服务发现技术也大多是基于关键词匹配实现的,无法提供有效 的语义支持。 本体论是人工智能领域一门新兴的学科,能够对语义w e b 和w e b 服务提供强大 的语义支持。随着近年来对本体技术研究的不断升温,提出了许多有价值的本体 建模语言和建模方法,本体论的应用也成为当前的研究热点。 w e b 服务发现技术是w e b 服务系统架构中的一个重要部分。把本体应用于服务 发现,不仅可以实现服务发现的自动化,还可以提高服务发现的效率。 本文在特定领域中,基于d a m l s u d d i 框架,使用o w l 描述领域本体,o w l s 描述服务本体,引入概念相似度的计算,设计了o w l s u d d i 的体系结构且主要讨 论了如何利用概念相似度的计算来对输入输出这些功能参数的匹配,以及为了提 高响应时间适当的添加一些非功能参数作为过滤器来过滤掉用户不关心的服务。 所做的工作和贡献主要体现在以下几个方面: 首先,通过阅读国内外大量w e b 服务、语义w e b 、本体、语义w e b 服务的有关 文献,在论文中介绍了语义w e b 服务发现的方法和技术并提出了目前语义w e b 服务 发现存在的问题。 其次,在功能参数的匹配中引入概念相似度的计算,避免了推理过程,节省 了响应时间,并且加入了非功能参数的匹配作为过滤器,提高了查准率。 再次,给出了领域本体构建的规则、方法,及面向服务发现的本体库的构建。 最后,利用一个实例实现了以上所述的方法和技术,并提出了在语义w e b 服 务发现方面下一步的工作方向一在普遍本体库之上的语义w e b 服务发现。 关键词:o w l ,o w l s ,本体,领域本体,语义w e b 服务 a b s t r a c t w e bs e r v i c e sm a k ew e bd e v e l o pt o w a r d sac o m p u t i n gp l a t f o r mb a s e do ni n t e m e t b u tp r e s e n tw e bs e r v i c e ss t a n d a r du d d i ( u n i v e r s a ld e s c r i p t i o nd i s c o v e r ya n d i n t e g r a t i o n ) ,w s d l ( w e bs e r v i c e sd e s c r i p t i o nl a n g u a g e ) ,s o a p ( s i m p l eo b j e c t a c c e s sp r o t o c 0 1 ) a r ea l ls h o r to fs u p p o r t i n gt h es e m a n t i cm e t h o d m o s te x i s t e n tw e b s e r v i c ed i s c o v e r yt e c h n o l o g i e sa r eb a s e do nk e yw o r d sm a t c h i n ga n dc a n n o tg i v e s u p p o r tt ot h es e m a n t i cm e t h o de f f i c i e n t l y o n t o l o g yi san e wd e v e l o p i n gb r a n c ho fa r t i f i c i a li n t e l l i g e n c e i tc a no f f e rs t r o n g s u p p o r tt ot h es e m a n t i cw e ba n dw e bs e r v i c e s w i t ht h em o r ea n dm o r er e s e a r c ho n o n t o l o g y t e c h n o l o g yi n r e c e n ty e a r s ,al o to fo n t o l o g ym o d e l i n gl a n g u a g e sa n d m o d e l i n gm e t h o d sa r eb r o u g h tf o r w a r d t h ea p p l i c a t i o no fo n t o l o g yb e c o m e st h e p r e s e n tr e s e a r c hf o c u st o o w e bs e r v i c e d i s c o v e r yt e c h n o l o g y i sa ni m p o r t a n t p a r ti n w e bs e r v i c e s a r c h i t e c t u r e a p p l y i n go n t o l o g yt o t h es e r v i c e d i s c o v e r yc a nn o to n l yr e a l i z e a u t o m a t i cs e r v i c ed i s c o v e r y , b u ta l s oi m p r o v ee f f i c i e n c yi ns e r v i c ed i s c o v e r y i nt h i sp a p e r , b a s e do nt h ea r c h i t e c t u r eo fd a m l - s u d d ir e g i s t r y , as y s t e m s t r u c t u r ei sd e s i g n e d i nt h i ss y s t e m ,o w li su s e dt od e s c r i b et h ed o m a i no n t o l o g yi n t h es p e c i f i cf i e l da n do w l - st od e s c r i b et h es e r v i c eo n t o l o g y i ti n t r o d u c e st h e s e m a n t i cs i m i l a r i t yc a l c u l a t i o n ,a n d m a i n l yd i s c u s s e sh o wt ou t i l i z es e m a n t i c s i m i l a r i t y c a l c u l a t i o nt om a t c ht h e i n p u t o u t p u tp a r a m e t e r s ,a n d a d d ss o m e n o n - f i m c t i o np a r a m e t e r sa sf i l t e rt os h o r t e nt h er e s p o n s et i m e t h ep r i m a r yw o r k sa n d c o n t r i b u t i o n si nt h i st h e s i s 矗el i s t e da st h ef o l l o w s : f i r s t l y , b yr e a d i n gal a r g en u m b e ro fr e l e v a n td o c u m e n t so fd o m e s t i ca n d i n t e r n a t i o n a l ,i n c l u d i n gw e bs e r v i c e s ,s e m a n t i cw e b ,o n t o l o g ya n d s e m a n t i cw e b s e r v i c e ,t h ep r e s e n tm e t h o da n dt e c h n o l o g yo ft h es e r v i c ed i s c o v e r ya r ei n t r o d u c e di n t h ep a p e r a n dt h e i rp r o b l e m sa r ep u tf o r w a r d s e c o n d l y , t h es i m i l a r i t yc a l c u l a t i o ni nt h em a t c h i n go f t h ef u n c t i o np a r a m e t e ri s i l i n t r o d u c e d ,i ta v o i d st h er e a s o n i n gp r o c e s sa n ds a v e st h et i m eo fr e s p o n d i n g w h a t s m o r e ,i n t r o d u c e d t h en o n f u n c t i o np a r a m e t e rm a t c h i n gf i l t e r , i ti m p r o v e st h e s e a r c h i n gr a t e t h i r d l y , p a p e r p r o v i d e sr u l e s ,m e t h o d st h a tt h ed o m a i no n t o l o g yc o n s t r u c t e d ,a n d c o n s t r u c t sk n o w l e d g eb a s ew e bs e r v i c ed i s c o v e r y f i n a l l y , p a p e rm a k e su s eo fa ni n s t a n c et or e a l i z et h em e t h o da n dt e c h n o l o g y s t a t e da b o v e ,a n dh a sg o tt h en e x tw o r k i n gd i m c f i o n o fs e m a n t i cw e bs e r v i c e d i s c o v e r y :b a s e do nt h eg e n e r a lo n t o l o g yk n o w l e d g eb a s eo f t h es e m a n t i cw e bs e r v i c e d i s c o v e r y , k e y w o r d :o w l ,o w l - s ,o n t o l o g y , d o m a i no n t o l o g y , s e m a n t i cw e b s e r v i c e i l l 西北大学学位论文知识产权声明书 本人完全了解学校有关保护知识产权的规定,即:研究生在校攻 读学位期间论文工作的知识产权单位属于西北大学。学校有权保留并 向国家有关部门或机构送交论文的复印件和电子版。本人允许论文被 查阅和借阅。学校可以将本学位论文的全部或部分内容编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学 位论文。同时,本人保证,毕业后结合学位论文研究课题再撰写的文 章一律注明作者单位为西北大学。 保密论文待解密后适用本声明。 学位论文作者签名: 年月日 指导教师签名:盘垂型 伊辞其r 1b 西北大学学位论文独创性声明 本人声明:所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,本论文不包含其他人已经发表或撰写过的研究成果,也不包含 为获得西北大学或其它教育机构的学位或证书而使用过的材料。与我 一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的 说明并表示谢意。 学位论文作者签名: 年月日 1 1 研究背景 第1 章绪论 作为w e b 服务技术的关键之一,服务发现对实现w e b 服务至关重要。基于 w e b 的商务应用为客户提供了不同类型的w e b 服务,w e b 服务发现是以某种方 式在这些w e b 服务中找到其想要的服务。w e b 服务发现是w e b 服务系统架构中 的一个重要部分,u d d i “3 ( u n i v e r s a ld e s c r i v p o t i o na n di n t e g r a t i o n ,统一 描述、发现和集成协议) 是其中一种解决方案。而传统的服务发现技术是通过精 确匹配实现的,不能较好地支持基于语义约束的模糊匹配,使得服务执行的整个 过程受到影响,而且语义冲突问题( 对于同一服务在不同站点上实现了不同接口) 也没有可行的解决方案。目前主流的w e b 服务技术如w s d l u d d i 仅提供服务的 基本描述和基于框架的发现机制,显然不能满足w e b 服务自动发现的要求。而 且针对服务发现过程中的重要步骤:查询条件与服务描述的匹配,仅提供了基于 框架( f r a m e b a s e d ) 和精确匹配的方法,远不能自动准确的发现所查找的功能性。 服务发现中的另一个问题是如何将请求条件与服务描述进行匹配。技术信息 如语法,类型等的匹配很简单;更复杂的是将请求功能性描述与w e b 服务本身 的功能性对比,这直接关系到服务发现的准确与否,目前的研究集中在将功能性 的描述转换为服务的目标( 先验,结果) 、输入输出模式和结构化半结构化语义 数据,然后再进行匹配,典型的语义标记语言有r d f ( r e s o u r c ed e s c r i p t i o n f r a m e w o r k ,资源描述框架) 及其上的o w l ( o n t o l o g yw e bl a n g u a g e ) 。 总之,w e b 服务发现技术是w e b 服务体系中的重中之重,是制约w e b 服务 技术能否发展并成熟的瓶颈,在w e b 服务描述的基础上研究有效的w e b 服务发 现十分重要。 u d d i 是为了解决w e b 服务的发现问题而产生的并且已经成为工业标准。尽管 u d d i 有很多吸引人的特性,u d d i 还是存在两个重要的局限: u d d i 允许通过多种方式进行检索:通过服务名、地址、商业分类和t m o d e l 查找服务。比如,可以查找提供了w s d l 表述的服务等等。在u d d i 中可以将w e b 臣 务依据某种分类机制( 比如n a i s c ( 北美产业分类体系) ,u n s p s c ( 联合国标准产品 与服务分类代码) ) 进行描述。用户可以根据这种分类机制进行搜索,但是搜索的 精度还是不能令人满意。这是因为这些检索机制都是局限于关键词检索,不支持 任何推理或者语义上的检索。比如一个汽车销售服务描述自身为:“新车销售” ( n a i c s 中的一个分类) ,但是如果进行“汽车销售”的查询,那么就不会被查询 到。而实际上,新车销售是汽车销售的一个子类。通过使用o w l 可以解决这些语 义匹配的问题。 u d d i 检索的第二个不足是缺乏全面的检索能力。比如,当检索“汽车销售” 服务的时候,用户可能对那些没有提供分期付款和信用卡支付功能的服务不感兴 趣,但是毫无疑问,这些检索结果仍将返回给用户。为了返回更加精确地结果, 在检索的时候不仅要考虑服务的分类,而且要考虑服务的输入输出、前置条件 效果。使用基于语义的匹配和基于功能的检索将比现在的检索机制更加有效。 本体( o n t o l o g y ) 原是一个哲学上的概念,用于描述事物的本质,在近几年作 为信息抽象和知识描述的工具被计算机领域所采用,能够对语义w e b 和w e b 服务 提供强大的语义支持。关于本体很多人给出了不同的理解,其中g r u b e r 的定义得 到众多认可,他认为本体是概念模型的明确规范的描述。本体是面向特定领域, 描述特定领域的概念模型即关于该领域的一个公认的概念集,其中的概念有公认 的语义,通过概念之间的关联来体现。因此,当本体应用于w e b 服务时,限定于特 定的领域,使得服务各参与方相对比较容易达成共识并在此基础上构造公共本 体,从而可以方便实现在机器层次上的自动处理。 本体论在w e b 上的应用导致了语义w e b 的诞生,其目的是解决w e b 上信息共享 时的语义。本体为语义w e b 提供了相关领域的共同理解,确定了该领域内共同认可 的概念的明确定义,通过概念之间的关系描述了概念的语义,这使得人们之间以 及与机器之间能准确地交互,可以基于语义上而不仅仅是基于语法上的。 随着语义网技术的发展,我们拥有了一些本体描述语言( 例如o w l ) 。选择 其中具有恰当的表达能力和可计算性的部分并且将其应用到对服务的语义描述 上,将使服务提供者与服务使用者可以共享公共语义从而实现机器间的互操作, 为自动化处理提供了基础。 2 1 2 研究目的及现状 w e b 服务发现的研究目标是服务发现的高效率和自动化,在服务发现技术 中,利用语义描述和服务本体论是达到该目标的有效途径;而如何用o w l 等语 义标记语言描述服务,如何将语义w e b 、本体论和语义推理应用到w e b 服务的 查找和匹配中极具研究价值。从这个意义上说,w e b 服务发现是语义w e b 在w e b 服务中的一种应用。 自1 9 9 8 年t i mb e r n e r s l e e 提出语义w e b 的构想和2 0 0 1 年正式提出语义w e b 的 概念以来,语义w e b 已经吸引了越来越多的研究者的注意。第一届语义w e b - 作研 讨会于2 0 0 1 年七月在美国c a l i f o r n i a 举行,接着于2 0 0 2 年六月在意大利的 s a r d i n i a 举行了第一届语义w e b 国际会议。第二届语义w e b 国际会议己于2 0 0 3 年1 0 月在美国f l o r i d a 举行。国内对于语义w e b 的研究虽然刚刚起步,但是也吸引了越 来越多的高校和科研机构研究人员的注意,如北京航空航天大学、清华大学、上 海交通大学以及中国科学院计算技术研究所等。语义w e b 与w e b 服务的结合推动了 w e b 服务领域向更高层次发展,掀起了一股新的研究热潮,国内外对于在这方面 的研究刚刚起步。 语义w e b 研究的主要目的就是扩展当前的w e b ,使得w e b 中所有信息都是具有 语义的,是计算机能够理解和处理的,便于人和计算机之间的交互与合作。因而 其研究的侧重点就是如何把信息表示为计算机能够理解和处理的形式,即带有语 义,这即是语义w e b 上本体研究的主要内容。语义w e b 上的本体知识可以应用于各 种领域。例如当前w e b 上的搜索引擎主要是使用基于关键词的查找策略,这使得 查找效率非常低下,将本体知识应用于w e b 搜索将大大提高其工作效率。在w e b 服务中利用本体知识将大大改进w e b 服务的能力和范围。 使用o w l s 对w e b 服务进行标记,从而服务选择与合成所必需的信息在w e b 站 点得以编制。软件能够操作这些表达并结合目标任务的详细规定来自动完成w e b 服务合成。在w e b 服务中利用了语义信息,服务的执行就更能体现用户预期的目 标和限制条件,能够得到更精确的结果,从而提高w e b 服务执行结果的准确性: 从合成w e b 服务的角度来看,基于语义信息进行w e b 服务的合成能够有效地利用知 识表示及推理来指导和监督服务的合成,从而提高合成的自动化程度和有效性。 在过去的几年中,o w l sw e b 服务的发现在语义w e b 的范畴中已经成为一个 十分活跃的研究领域。很多项目致力于用基于o w l 的语义信息或o w l - s 描述来改 进u d d i 注册中心。以下列举了几种主要的研究方法。 1 、在u d d i 中,语义发现的一种方法已经被实现,并作为n t tu d d iu b r 的一 个扩展部分。n t tu d d iu b r 是一个公共的u d d i 注册中心,它被n t t ( t h ej a p a n e s e t e l e p h o n ec o m p a n y ) 所维护。1 。这种方法提供过滤机制,以实现在匹配过程中对 u d d i 发布的信息的筛选。在语义服务描述方面,它采用w s s p ( t h ew e bs e r v i c e s e m a n t i cp r o f i l e ) 。这种方法把由d a m l - ss e r v i c ep r o f i l e 表示的语义信息编 码到w s d l 中。w s s p 的目标是使用表示w e b 服务的性能语义去丰富w s d l 。 u d d i v 2 图卜1u d d i ,w s d l 和w s s p 之间的关系图 2 、在参考文献 4 中提出的一种实现语义u d d i 注册中心的方法是基于参考文 献 5 和参考文献 6 。它使用的匹配算法与d a m l s 一致。而且它通过集成多个外 在的匹配引擎支持多种服务描述语言,以提高u d d i 搜索机制。 3 、m e t e o r s 是美国g e o r g i a 大学的l s d i s 实验室主持的关于语义网、工作流 和w e b 服务技术的研究项目,m w s d i ( m e t e o r sw e bs e r v i c ed i s c o v e r y i n f r a s t r u c t u r e ) ”3 是m e t e o r s 项目中关于w e b 服务发布与发现的子项目。它在 u d d i 规范的基础上引入p 2 p 技术,在u d d i 服务器之间建立p 2 p 网络,从而将多个服 4 砒 e ; | 呈 | 呈 、lllr卜, 务注册中心连接起来,共享服务描述信息。同时, l f l v s d i 使用一个共享的注册本 体( r e g i s t r i e so n t o l o g y ) 对各个u d d i 服务器按知识领域( 例如,旅游、运输 等) 进行分类,每个注册中心,即u d d i 服务器必须映射到注册本体上的一个或多 个节点上。m w s d i 在处理服务实例与用户查询请求的匹配时,使用一种简单的基 于服务模板的匹配算法。该算法需要事先定义一系列的服务模板,服务描述文档 和用户查询请求都遵循某个特定的格式书写,模板中的各项都要进行相应的本体 标注。如果用户查询与服务实例使用了相同的服务模板,则进一步对服务模板中 的各项作基于本体的匹配推理。m w s d i 存在的最大缺点在于,整个p 2 p 网络共享相 同的注册本体,维护注册本体的一致性变得十分困难,从很大程度上限制t p 2 p 网络的自组织能力。它们的匹配算法扩展了参考文献 6 中的算法。 本文的研究目的是在特定领域中,根据d a m l - s u d d i 匹配器的结构,结合 o w l s 在表述方面的缺陷,提高在o w l s u 叻i 匹配器中查找服务的效率和准确性。 这样可以缩小查找的范围,缩短用户的等待时间而且尽可能的避免了无效查询结 果。 1 3 论文的主要工作 论文的主要工作体现在理论和实践两个方面: 1 、理论上,本文对原有的w s d l u d d i 结构以及现在的d a m l s u d d i 结构进行 了系统的研究。根据o w l s 的上层本体p r o f i l e 在服务发现中只利用了功能参数而 忽略了非功能参数的作用,而提出在服务发现过程中引入非功能参数。具体的工 作包括: ( 1 ) 分析w s d l u d d i 框架,指出它对目前人们使用w e b 服务的不便,提出必需 要引入语义以及如何引入语义。 ( 2 ) 熟悉d a m l s u d d i 结构,了解服务发现的整个过程。 ( 3 ) 讨论了如何构建领域本体,以及领域本体在w e b 服务发现过程中的应用 ( 4 ) 在功能参数的匹配中,根据领域本体引入概念相似度的计算。 ( 5 ) 根据o w l s 在服务发现过程中的缺陷,提出添加非功能参数。 2 、实践上,根据理论研究的成果,利用一个实例实现了以上所述的方法和 技术。 1 4 论文的组织 全文共分七章: 第一章绪论 介绍了本文研究的背景、研究的目的及现状、主要工作。 第二章语义w e b 的相关知识 介绍了语义w e b 和本体以及本体描述语言o w l 的一些知识。 第三章w e b 服务的相关知识和技术 介绍了当前w e b 服务的框架及u d d i 技术。 第四章构建面向w e b 服务发现的本体库 讲解了如何构建本体库以及面向w e b 服务发现的本体库。 第五章对语义w e b 服务发现的研究 系统的介绍了语义w e b 服务发现的框架以及经典的匹配算法,并且指出它们 的不足,然后介绍了语义相似度,及如何计算语义相似度,最后介绍了非功能参 数的匹配。 第六章系统实现 利用个实例实现了以上所述的方法和技术。 第七章总结与展望 总结本文的研究成果,指出了需要进一步开展的工作。 第2 章语义w e b 的相关知识 2 1 语义w e b 的概念 当今的万维网( w o r l dw i d ew e b ) 已经极大的改变了人们交流的方式,改变了 商务的运行模式。最初的计算机仅仅用来作为数值计算的工具,而现在,计算机 主要被用在信息处理方面比如数据库、文档处理等等。典型的w e b 应用方便人们 搜寻、利用信息,方便与他人保持联系。简而言之,语义w e b 基于这样一种思想:w e b 上定义和链接的数据不应该仅仅是为了格式上的显示,使人更容易理解,而且可 以在各种应用程序中让机器也能够理解,并自动进行相应处理。语义w e b 的目标 就是通过向数据中添加机器可理解的语义,以及使用启发性的元数据来将w e b 上 的海量信息以一种机器可理解的方式组织起来,以满足w e b 应用对数据互操作性 的要求。t i mb e r n e r s l e e 给出了以下定义:“语义w e b 是一个网,它包含了文档 和文档的一些部分,描述了事物间的明显关系,并且包含语义信息,以利于机器 的自动处理”。 在x m l 2 0 0 0 大会的重要发言中,t i m b e r n e r s - l e e 专门解释了“语义”和”w e b ” 两个词的含义。在“w e b ”背后是可导航空间的思想,用u r i ( u n i v e r s a lr e s o u r c e i d e n t i f i e r ,统一资源标识符) 映射到资源上。语义w e b 所指的“语义”是“机器 可处理”,而不是自然语言语义和人的推理。对于数据,语义表达了机器能对这 些数据做些什么。若你给出一些数据到一台机器,它能够用这些数据做出正确事 情,就称它通过了“语义测试”。 语义w e b 并不追求传统意义上的人工智能,而是寻求w e b 主体间相互通信的一 种“共同语言”和相关词汇:语义w e b 的重点放在“约定”,就是网上的主体在通 信时相互理解所说的“资源”是同一个东西,以及这个东西和别的东西之间的关 系。即使推理能力是弱的,也可以满足目前的应用。并且此处的“理解”不是 要求机器去解几何题或者进行辩论,而是象网络协议一样对“资源”( 在t c p i p 里就是地址、握手协议、缓冲等) 达成共识,然后软件代理就可以理解网页上的 资源到底在描述什么概念,实现机器自动处理信息。数据的清楚语义加上领域知 识( 即本体) 将使得使w e b 上信息处理和集成的机器自动化更加容易,实现网络服 务功能的更加丰富化。 实现语义w e b 的目标有许多中间的和相关的工作要做,w w w 的创始人t i m b e r n e r s l e e 描述了语义w e b 结构的设想,认为语义w e b 是一个多层次结构,各层 功能逐渐增强,下层向上层提供支持,其结构如下图所示。下面自底向上简要 叙述一下各层的功能。 蜀 t r u s t 曼 甘 霭 p r o o f 口 s e l f -。 耸 赢 = = 盥 l o g i c 巴 d e 暑 望 d o e o n t o l o g yv o c a b u l a r y 置 d o c 盲 r d f + r d fs c h e m a 暑 x m l 蝌s + x m ls c h e m a u n i c o d eu r i 图2 - 1 语义w e b 的体系结构图 第一层是u n i c o d e 和u r i ,它们是整个语义w e b 的语法表示基础。u n i c o d e 是一 种统一的字符编码系统( 采用十六位二进制编码) ,支持世界上所有的主要语言文 本的集合,u r i 是一种标准的标识i n t e r n e t 资源的方法,是对当前w e b 所使用的 u r l ( u n i v e r s a lr e s o u r c el o c a t o r ) 的扩展。作为i n t e r n e t 资源的一种标准识别 方法,u r i 可以进行更为精确的资源表示,使信息的精确检索成为可能。 第二层是x m l + n s ( n a m e s p a c e ) + x m ls c h e m a 9 1 ,用于从语法上表示数据的内容 和结构,通过使用标准的格式语言,将互联网上资源和信息的表现形式、数据结 构和内容分离。x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) 包含一组规则,任何人可以 用这些规则创建一个标记语言。n s ( n a m es p a c e ) 是煳l 名称空间,由u r i 索引确定, 在x m l 文档中用于区别元素类型和属性名。x m ls c h e m a 用于定义x m l 文档中有效的 语法。以上两层的形式化研究方面人们己经达成了广泛的共识,x m l 文档的数量 也正在迅速的增加。 第三层是r d f + r d fs c h e m a “,其提供的语义模型用于描述w e b 上的资源及其类 型,为网上资源描述提供了一神通用表示框架,实现数据集成的元数据解决方案。 r d f 可以看作语义w e b 体系结构中具有语义性的第一层,按照w 3 c ( w w w c o n s o r t i u m ,互联网联合组织) 的推荐标准。“,r d f 是:“一种处理元数据的基础, 它提供了w e b 上各种应用之间交换机器可理解信息的协同工作能力。”r d f 数据模 型包括三个基本组成部分:资源( 能通过u r i 引用的任何事物) 、属性( 被描述的资 源的特性) 和语句( 包括引用资源的指针以及该资源属性和属性值的表达式) 。r d f s c h e m a 在r d f 之内定义了一个简单的本体建模元语,包括类、类和属性之间的i s a 关系以及属性的领域和范围限制。r d f 和r d fs c h e m a 采用x m l 的语法标记,但没有 使用x m l 的树型语义表示方法。可以认为r d fs c h e m a 是一组简单的本体建模元语 加在r d f 上,但r d fs c h e m a 的表达方式有很大的局限性,对于表达丰富的语义是 远远不够的,如果没有标准的方法描述基本限制,这些将有待其上层的本体层将 r d fs c h e m a 扩展成齐全的本体建模语言。 第四层为o n t o l o g y 词汇层,用来定义共享的知识,从而对各种资源之间的语 义关系进行描述,揭示资源本身以及资源之间更为复杂和丰富的语义信息。 o n t o l o g y 可译为本体,是某领域概念的显示说明和对应的用于描述该领域的词 汇。一个本体可以描述事情类型之间的关系,如“这是一个过渡的性质”。本体 词汇提供多元信息、互操作性和互转换性。信息的无缝交换已成为w e b 成功开发 的关键问题,本体提供了方法用于捕捉人和机器使用术语的共享理解性,帮助信 息交换。 第五层是逻辑层( l o g i c ) 主要提供公理和推理规则,为智能服务提供基础。 比如可以利用分布在w e b 各处的断言或公理导出新知识。 其余的两层是证明层( p r o o f ) 和信任层( t r u s t ) ,它们注重于提供认证和信任 机制,使用户代理a g e n t 在网络上实现个性化服务和彼此间交互合作具有可靠性 和安全性。它们的出发点是认为在语义w e b 上验证语句的有效性将是一项非常重 要的工作。数据签名( d i g i t a ls i g n a t u r e ) 跨越各层,虽然公共密钥技术已经存 在了很长时间但还未全面应用。应用它,加上语义w e b 各层的支持,就可以实现 信任层。 第五层到第七层是在下面四层的基础上进行逻辑操作。在整个w e b 体系结构 中,核心层为x m l ,r d f ( s ) ,o n t o l o g y ,其支持从语义上描述w e b 信息,是当前语 义w e b 研究和应用关注的重点。 以语义w e b 各层技术作为基础而建立的自描述文档( s e l f d e s d o c ) 、数据 ( d a t a ) 和规则( r u l e s ) 将使得现在的w e b 实现语义化,从而提供更加智能化的服 务。 2 2 本体论( o n t o l o g y ) 2 2 1 定义 o n t o l o g y 最早是一个哲学的范畴,指客观存在的一个系统的解释和说明。后 来随着人工智能的发展,被人工智能界给予了新的定义。最初人们对o n t o l o g y 的理解并不完善,这些定义在不断的发展变化中得到完善,比较有代表性的定义 有:1 9 9 1 年n e c h e s 等将其定义为“给出构成相关领域词汇的基本术语和关系,以 及利用这些术语和关系构成的规定这些词汇外延的规则”:1 9 9 3 年g r u b e r 将其定 义为“概念模型的明确的规范说明”:1 9 9 7 年b o r s t 给出定义“共享概念模型的形 式化规范说明”:1 9 9 8 年s t u d e r 给出的定义为“共享概念模型的明确的形式化规 范说明”,本文采用参考文献 1 2 中建议的定义。 定义2 1 :一个本体是一种对共享概念模型的明确的形式化规范说明。 这个定义体现了o n t o l o g y 的四层含义: 概念模型( c o n c e p t u a l i z a t i o n ) 通过抽象客观世界中一些现象( p h e n o m e n o n ) 的相关概念而得到的模型,其表 示的含义独立于具体的环境状态。 明确( e x p l i c i t ) 所使用的概念及使用这些概念的约束都有明确的定义。 形式化( f o r m a l ) o n t o l o g y 是计算机可读的。 共享( s h a r e ) o n t o l o g y 中体现的是共同认可的知识,反映的是相关领域中公认的概念集, 它所针对的是团体而不是个体。 o n t o l o g y 的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确 定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇( 术语) 和词汇之间相互关系的明确定义人类、数据库和应用软件使用本体来共享领域 知识( 一个领域是指一个特定的学科范围或者知识范围,例如医药、设备制造、 房地产、汽车修理以及财务管理等) 。本体既包括一个领域内的知识也包括各种 领域之间的知识,使用这种方式使知识被重用。 2 2 2 本体分类 在构建一个知识库系统的时候,不同的本体扮演着不同的角色,现在对于本 体的分类法尚没有统一的标准,通常我们可以区分以下几种本体类型“: 领域本体:针对特定的应用领域抽象领域知识的结构和内容,包括各种领域 知识的类型、术语和概念,并对领域知识的结构和内容加以约束,形成描述特定 领域中具体知识的基础。 通用或常识性的本体:主要描述客观世界一般性的知识,如时间、空间、状 态和事件等,它们通常适用于几个领域。 应用型的本体:针对特定应用领域知识建模的抽象定义。如方法本体和任务 本体。它们是针对特定的任务和方法构建的本体。 表示本体:通常不限制于一个特定的领域,仅仅提供了一种表示实体的方式 但是没有规定必须表示什么。 2 2 3 建模原语 p e r e z 等人用分类法组织了o n t o l o g y ,归纳出5 个基本的本体建模元语 ( m o d e l i n gp r i m i t i v e s ) : 类( c ia s s e s ) 或概念( c o n c e p t s ) 指任何事务,如工作描述、功能、行为、策略和推理过程。从语义上讲,它 表示的是对象的集合,其定义一般采用框架( f r a m e ) 结构,包括概念的名称,与 其他概念之间的关系的集合,以及用自然语言对概念的描述。 关系( r e l a t i o n s ) 在领域中概念之间的交互作用,形式上定义为n 维笛卡几积的子集:r :c 1 c 2 x c n 。如子类关系( s u b c l a s s o f ) 。在语义上关系对应于对象元组的集合。 函数( f u n c t i o n s ) 一类特殊的关系。该关系的前n 一1 个元素可以唯一决定第n 个元素。形式化的 定义为f :c 1 x c 2 xc n 一1 斗c n 。如m o t h e r o f 就是一个函数,m o t h e r o f ( x y ) 表示y 是x 的母亲。 公理( a x i o m s ) 代表永真断言,如概念乙属于概念甲的范围。 实例( i n s t a n c e s ) 代表元素。从语义上讲实例表示的就是对象。 另外,从语义上讲,基本的关系共有4 种 关系名关系描述 p a r t o f 表达概念之间部分与整体的关系 k i n d o f 表达概念之间的继承关系,类似于面向对象中的父类与子 类之间的关系 i n s t a n c e o f 表达概念的实例与概念之间的关系,类似于面向对象中的 对象和类之间的关系 a t t r i b u t e o f 表达某个概念是另一个概念的属性 2 2 4 本体论与语义w e b 表2 - 1 语义基本关系 随着w e b 应用的迅速发展,w e b 应用面临着自动化及语义保持的问题。对 于用户提交的应用请求,如何根据语义信息执行分布在w e b 上的相关服务,并 自动地进行这些服务间的组合,是语义w e b 被提出的动机所在。使机器可存取 w e b 数据并实现处理的自动化是语义w e b 的目标。 从语义w e b 的表示方式来看,可以认为它是基于资源描述框架 ( r e s o u r c e d e s c r i p t i o nf r a m e w o r k ,简称r d f ) 和元数据( m e t a d a t a ) 对w w w 上数 据的抽象表示,是本体论领域模型的具体表示和应用实例。而本体论是一组概念 及这些概念间关联描述的集合,它描述了包括客观事物及它们之间联系的领域知 识。 基于语义w e b 的服务描述语言如d a m l s ,o w l 等建立在x m l 和r d f 的基 础上,为机器提供了读取数据以及对数据进行解释和推理的能力,使得面向人的 w e b 转换到了语义w e b 。在w e b 应用中有效利用本体论,可以实现语义w e b 信 息处理的自动化,例如,提高w e b 搜索的准确性,提高w e b 服务质量。 本体论作为一种能在知识层提供知识共享和重用的工具在语义w e b 中获得 应用,能够描述w e b 资源的概念及其相互关系,使计算机对w e b 资源的无二义 的自动处理成为可能,符合w e b 高度分散的特点,而本体论非集中式定义模式 有利于语义w e b 的快速进化。 综上,正如语义w e b 的提出者b e r n e r s l e e 指出的:语义w e b 的目标是 使得w e b 上的信息具有计算机可以理解的语义,满足智能软件代理( a g e n t ) 对 w w w 上异构和分布信息的有效访问和检索。为了实现这个目标,关键的是对w e b 资源进行语义描述,w 3 c 的x m l 和w e b 资源描述框架r d f ( s ) 虽然能表达一定 的语义,但是仍存在一定问题,例如,x m l 可以用“ t o m ”表 示tom是教师:而 “ o r a l a s s i l a ”这个r d f 片断描述了w e b 页的创建者问题。而上面的 a u t h o r 和c r e a t o r 完全可以用w r i t e r 来代替;另一个例子是:某医院和某大
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025企业石油买卖合同(月度、年度)
- 2025船舶买卖合同协议书
- 2025年卧式车床合作协议书
- 农业资源利用许可协议
- 专门学校面试题目及答案
- 主持队面试题目及答案
- 养殖场畜牧产品收购协议
- 2025合同终止协议范本模板
- 医药企业供应链优化合作协议
- 跨部门合作流程与沟通模板
- 2025年锅炉专业培训试题及答案
- 泌尿外科规培生入科宣教
- 中职信息技术第一册课件
- 高三职业生涯规划课件
- 上汽大众品牌培训课件
- 《礼仪规范教程》中职生礼仪教学全套教学课件
- 电力调度程控交换机安装施工方案
- 2025年广东省中考历史试题卷(含答案详解)
- 2025思政开学第一课观后感范文13篇
- 施工项目会议管理制度
- 声音的特性讲课件
评论
0/150
提交评论