(计算机应用技术专业论文)语义网上自治实体间本体知识路由的实现机制.pdf_第1页
(计算机应用技术专业论文)语义网上自治实体间本体知识路由的实现机制.pdf_第2页
(计算机应用技术专业论文)语义网上自治实体间本体知识路由的实现机制.pdf_第3页
(计算机应用技术专业论文)语义网上自治实体间本体知识路由的实现机制.pdf_第4页
(计算机应用技术专业论文)语义网上自治实体间本体知识路由的实现机制.pdf_第5页
已阅读5页,还剩93页未读 继续免费阅读

(计算机应用技术专业论文)语义网上自治实体间本体知识路由的实现机制.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

太原理工大学硕士研究生学位论文 语义网上自治实体间本体知识路由的实现机制 摘要 当今,我们可以从网络上获取大量的数据与服务来满足人们对知识的 需求。语义w e b 的出现为知识工程、数据工程提供了上下文环境,它帮助 我们改善了网络上的知识组织,并使用户更加方便地获取他们所需要的知 识。可是传统的搜索技术无法帮助用户准确定位他们所需的知识,或者无 法根据模糊的查询请求找到所需知识,更无法帮助用户理解他们所需知识 与他们自身所具有知识之间究竟有何关系。如何在这些海量知识中按照用 户的需求快速准确地定位目标知识便成为语义w e b 研究中迫切需要解决的 问题。 针对上述问题,本文的意图在于设计一种可以融入本体知识的p 2 p 系 统,并找到一种高效的本体知识路由机制,以帮助用户尽最大可能找到所 需知识,或所需相近的知识。知识发现正力图解决上述问题。而我们研究 的本体知识路由是在知识发现基础上的延伸。虽然知识发现理论为我们提 供了一种高效的发现知识的策略,但是这仅仅是一种策略,它无法在整体 上提出一种知识共享及传播的机制。陆汝钤院士曾说过:“知识是一种结构 化的信息”。而语义网正是一种可以应用于当今i n t e m e t ,并解决用户知识需 求的有效方案。本文的研究利用了语义网技术,并加入了人工智能与自治 系统的最新研究成果。在系统设计上,本文基于半分布式p 2 p 系统,并加 太原理工大学硕士研究生学位论文 入自治多a g e n t 系统的注册服务机制,以本体知识间的语义关系为指导, 构造节点间的逻辑连接,进而指导系统中查询消息的路由。本文提出的面 向本体知识路由系统的路由算法利用路由节点上提供的丰富的语义信息, 找寻到达知识提供者的语义线索,并记录找寻路径。它不仅为用户提供了 查询应答,还为用户提供了一条由查询者所持有的兴趣概念到他所要找寻 的目标知识之间的知识链。这种知识链可以帮助查询者理解如何根据自身 知识推理所需知识。 在上面思想的指导下,本文使用多a g e n t 技术,设计并搭建语义p 2 p 系统,并在此系统上试开发基于本体技术的e l e a r n i n g 作业指导系统s h e s ( s e m a n t i ch o m e w o r ke n l i g h t e n i n gs y s t e m ) 。 除此以外,本文的另一项主要成果是将心理学中的行为分析方法引 入到语义w e b 服务分析与建模过程中,结合描述逻辑为语义w e b 服务、服 务复合的形式化建模与逻辑验证提供一种理论方法。同时在本文的系统设 计中,将路由过程设计成为一个复合服务,因此便可以用本文中探索的理 论验证方法,对本体知识路由过程进行可靠性验证,为本体知识路由的研 究提供理论基础。 关键词:知识路由,p 2 p ,行为分析,描述逻辑,多a g e n t 技术,语义w e b 太原理工大学硕士研究生学位论文 r e a l i z a t i o no fo n t o l o g i c a lk n o w l e d g er o u t i n g a m o n ga u t o n o m i ce n t i t i e s0 ns e 【a n t i c 、入慢b a b s t r a c t t o d a y , w ec a na c q u i r eal a r g eq u a n t i t yo fd a t aa n ds e r v i c e so nw e bt o s a t i s f yo u rr e q u i r e m e n to fk n o w l e d g e t h ea p p e a r a n c eo fs e m a n t i cw e b p r o v i d e sc o n t e x tf o rd a t ae n g i n e e r i n ga n dk n o w l e d g ee n g i n e e r i n g ,w h i c hh e l p s t oi m p r o v eo r g a n i z a t i o no fk n o w l e d g eo nw e b ,a n df a c i l i t a t e su s e r st og e tw h a t t h e yw a n t h o w e v e r , t h et r a d i t i o n a ls e a r c h i n gt e c h n o l o g yc a nn o th e l pu s e r st o p o s i t i o nt h ek n o w l e d g et h e yw a n t ,o rc a nn o tf i n dt h ek n o w l e d g ea c c o r d i n gt o f u z z yq u e r y l e ta l o n eh e l p i n gu s e r st ou n d e r s t a n dt h er e l a t i o n s h i po fk n o w l e d g e b e t w e e nt h e yh o l da n dt h e yw a n t t h e r e f o r ei ti sa ne x i g e n tp r o b l e mi nt h e r e s e a r c ho fs e m a n t i cw e bh o wt oi m m e d i a t e l yf i n dt h ee x a c tt a r g e tk n o w l e d g e f o ru s e r sf r o ml a r g eq u a n t i t i e so fk n o w l e d g e a c c o r d i n gt ot h ea b o v ep r o b l e m s ,t h et h e s i sa i m st od e s i g nak i n do fp 2 p s y s t e mt h a t c a ns y n t h e s e o n t o l o g i c a lk n o w l e d g e , a n de x p l o r ea ne f f i c i e n t k n o w l e d g er o u t i n gm e c h a n i s mt ot r yi t sb e s tt of r e dt h ee x a c tk n o w l e d g eo r c l o s eo n ef o ru s e r s k n o w l e d g ed i s c o v e r yt r i e st os o l v et h o s ep r o b l e m s , k n o w l e d g er o u t i n gc a nf u r t h e rt h er e s e a r c hb a s e do ni t a l t h o u g ht h et h e o r yo f i i i 太原理工大学硕士研究生学位论文 k n o w l e d g ed i s c o v e r yp r o v i d e su sw i t hak i n do fe f f i c i e n ts t r a t e g y , i tc a nn o t b r i n gf o r w a r dt h em e c h a n i s mf o rk n o w l e d g es h a r i n ga n dp r o m u l g a t ei nw h o l e a c a d e m i a nr u q i a nl us a i d :k n o w l e d g ei sak i n do fs t r u c t u r a li n f o r m a t i o n ”b u t n i c e l ys e m a n t i cw e b i sa na p p r o a c ht h a tc a nb ef i tt or e c e n ti n t e m e ta n d ,s o l v e k n o w l e d g er e q u i r e m e n to fu s e r s r e s e a r c hi nt h et h e s i sm a k e su s eo ft h e t e c h n o l o g yo fs e m a n t i cw e b ,m e a n w h i l ec o m b i n e sn e wf r u i t so fa ia n d a u t o n o m i c s y s t e m a tt h el e v e lo fs y s t e md e s i g n ,s e m i d i s t r i b u t e dp 2 ps y s t e m i st h eb a s e a n dt h es y s t e ma d o p t ss e r v i c er e g i s t r a t i o nm e c h a n i s mo fa u t o n o m i c m u l t i a g e n ts y s t e m g u i d e db yt h e s e m a n t i cr e l a t i o n sa m o n g o n t o l o g i c a l k n o w l e d g e ,t h el o g i cl i n k so fn o d e si ns y s t e ma r em a d et ol e a dt or o u t i n go f q u e r ym e s s a g e b e s i d e s ,t h et h e s i sp r o p o s e st h es y s t e mo r i e n t e ds e m a n t i c r o u t i n ga l g o r i t h m r e l y i n g o na f f l u e n ts e m a n t i cr e l a t i o n so nn o d e s ,t h e a l g o r i t h ms e a r c h e st h es e m a n t i cc l e wt o t h ek n o w l e d g ep r o v i d e r , a sw e l la s r e c o r d i n gr o u t i n gp a t h t h er e s u l to fr o u t i n gp r o v i d e sa n s w e r st ou s e r , a n d s u g g e s t sk n o w l e d g ec h a i n s t h a tb e g i nw i t ht h ec o n c e p t su s e rh o l d sf o rt h e q u e r i s t ,e n dw i t h t h et a r g e tk n o w l e d g e t h ec h a i nc a ne n l i g h t e nu s e r st o u n d e r s t a n dh o wt or e a s o nf o rt h e i rr e q u i r e dk n o w l e d g e u n d e rt h eg u i d a n c eo fa b o v et h o u g h t s ,t h et h e s i su t i l i z e st h et e c h n o l o g yo f m u l t ia g e n ts y s t e mt od e s i g ns e m a n t i cp 2 ps y s t e m b a s e do nt h es y s t e m , s h e s ( s e m a n t i ch o m e w o r ke n l i g h t e n i n gs y s t e m ) i sd e v e l o p e d a n o t h e rm a i nf r u i to ft h et h e s i si st h a tt h em e t h o do fb e h a v i o ra n a l y s i si s i n t r o d u c e di n t ot h ec o u p eo fa n a l y z i n gs e m a n t i cw e bs e r v i c ea n di t sm o d e l i n g i v 太原理工大学硕士研究生学位论文 t o g e t h e rw i t hd l ,t h em e t h o dp r o p o s e saw a yt om o d e ls e m a n t i cw e ba n d v a l i d a t et h ep r o c e s so fs e r v i c ec o m p o s i t i o n b e c a u s eo ft h er o u t i n gp r o c e s si s d e s i g n e dt ob eak i n do fc o m p o s i t es e r v i c e ,h e n c et h e t h e o r e t i c a lm e t h o d e x p l o r e db yt h et h e s i sc a nb eu s e dt ov a l i d a t et h er e l i a b i l i t yo fr o u t i n gp r o c e s s , s op r o v i d e sf o o t s t o n ef o rt h er e s e a r c ho fo n t o l o g i c a lk n o w l e d g er o u t i n g k e y w o r d s :k n o w l e d g er o u t i n g ,p 2 p ,b e h a v i o ra n a l y s i s ,d e s c r i p t i o nl o g i c , m u l t i a g e n ts y s t e m , s e m a n t i cw e b v 声明户明 本人郑重声明:所呈交的学位论文,是本人在指导教师的指导下, 独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文 不包含其他个人或集体已经发表或撰写过的科研成果。对本文的研究 做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的 法律责任由本人承担。 论文作者签名:垂瘥 日期:2 遂:么旦 关于学位论文使用权的说明 本人完全了解太原理工大学有关保管、使用学位论文的规定,其 中包括:学校有权保管、并向有关部门送交学位论文的原件与复印 件;学校可以采用影印、缩印或其它复制手段复制并保存学位论文; 学校可允许学位论文被查阅或借阅;学校可以学术交流为:目的, 复制赠送和交换学位论文;学校可以公布学位论文的全部或部分内 容( 保密学位论文在解密后遵守此规定) 。 签名: 导师签名:毹历 日期:冬堡堡:主:鲤 日期:兰! 竺金: 多 太原理工大学硕士研究生学位论文 第一章绪论弟一早珀下匕 本章首先介绍本体知识路由及语义w e b 的服务复合的研究背景;然后介绍本文研 究内容并概括本文的主要工作;最后说明论文的整体结构。 1 1 研究背景 语义w e b ,作为当今w e b 技术发展的最新趋势,己掀起了一股从学术界到工业界 的研究热潮。自从b e m e r s l e e 于2 0 0 0 年首次提出语义w e b 的概念1 2 j 至今,语义w e b 的研究己初见端倪。语义的概念及其支撑新型应用技术的能力正不断的挑战着我们在无 止境计算研究旅程上的传统观念1 3 。我们可以毫不夸张地说,语义w e b 技术是知识及信 息工程领域的一座重要的里程碑。那么,究竟语义w e b 技术比起传统w e b 技术有何进 步之处? 语义w e b 技术为提高生产力,拓展新的技术手段做出了怎样的贡献? 这些问 题是摆在语义w e b 研究者面前应该、也是必须回答的问题。基于此初衷,本文选题从 一个方面去验证语义w e b 给我们带来的技术进步。 在入题之前,首先让我们明确一下语义w e b 的概念及其研究目标。当今,学术界 对于语义w e b 还没有一个严格的定义,t i m b e m e r s l e e 对语义w r e b 作了如下描述1 3 1 :语 义w e b 并不是一个孤立的w e b ,而是对当前w e b 的扩展,语义w e b 上的信息具有定义 良好的含义,使得计算机之间以及计算机与人类之间能更好的彼此合作。因而语义w e b 的目标是使得w e b 上的信息具有计算机可以理解的语义,满足智能软件代理( a g e n t ) 对w w w 上异构和分布信息的有效访问和检索。基于语义w e b 所提供的丰富的知识语 义信息,结合智能化的w e b 技术,我们便可以使网络具备智能【4 j ,使网络上的各实体自 治的去完成人交给的任务。 但是,由于语义w e b 上分布着大量的知识,如何实现w e b 上语义知识的发现,定 位,并获取利用这些知识,建立一种高效的本体知识路由机制就成为了亟待解决的问题。 既然我们要实现高效的本体知识路由,那么路由过程的自治化,以及服务过程的自动化 便理所当然的被纳入到闯题域中。此问题的解决涉及如下核心研究领域:语义w e b ,自 治计算,多a g e n t 系统,w 曲智能,经典与非经典数理逻辑等等。由于语义w e b 的目 太原理工大学硕士研究生学位论文 标在于使机器理解网络上数据及信息的含义,因此将自治实体构成的系统部署于语义 w e b 之上,实现网络上各实体间的自主交流与合作是检验新型网络优越性的有效方案。 w e b 服务作为w e b 上的一种重要资源,其应用也从一个侧面极大的影响了w e b 的 发展。借助语义标记手段来描述服务的语义,便构成了语义w e b 服务。因为w e b 上各 实体之间的交互行为均可被看作是一种服务行为【5 】,而服务属于一种知识,服务的实例 集属于知识集的子集,所以将研究语义w e b 服务发现,匹配,复合,变更的机制作为 研究本体知识路由的依托对象是具有重大意义的。 在研究、设计中,本题运用了行为分析的方法,意在从行为角度来分析w e b 服务, 设计系统功能算法,抽取w e b 上各实体交互的认知模型。从而实现w e b 系统的智能化。 行为分析学是一门关于人及动物行为研究的科学嘲。它意在理解,解释,描述,预测行 为,并且研究行为之间,行为与环境之间的相互关系。行为分析对于研究智能,分析并 建立智能模型有较大的指导作用。面向智能化行为的设计通过模仿智能生命的行为模 式,并分析实际系统的行为特征,将两者有机结合,有助于我们实现网络的智能化。 1 1 1 语义w e b 与语义w e b 服务概况 1 9 9 0 年,w 3 c 的创始人t i mb e m e r s k 制作了第一个网页,第一套网页浏览器( 同 时也是编辑器) ,以及第一套网页伺服器。根据他的构想,浏览网页的工具应该要同时 具备所见及所得( w y s 确吖g ) 的编辑功能。人们将可以透过全球分享讯息,共同创作。 1 9 9 8 年,t i mb e m e r s l e e 再度提出语义w e b 的概念,希望透过一个基础架构,使 资料能在个体、企业、社区间分享交换。语义w e b 提供了一个通用的框架,允许跨越 不同应用程序、企业和团体的边界共享和重用数据。语义w e b 是w 3 c 领导下的协作项 目,有大量研究人员和业界伙伴参与。语义w e b 以资源描述框架( i f ) 为基础。r d f 以x m l 作为语法、u r i 作为命名机制,将各种不同的应用集成在一起。在2 0 0 1 年美 国的语义w e b 大会上,t u nb e m e r s l e e ,j a m e sh e n d l e r , o r al a s s i l a 提出“语义w e b 是 现有w e b 的扩展,信息被赋予定义良好的含义,更便于计算机和人的协同。 语义w e b 是对未来w e b 体系结构的一个伟大构想,被定义为“由一些可以被计算 机直接或间接处理的数据组成的w e b ”。当前基于h t m l 的w e b 网页是设计给人看的, 计算机并不能理解其中信息的含义。而语义w e b 的基本思想是通过本体( o n t o l o g y ) 和 w e b 内容的语义标记,使计算机( 程序或智能a g e n t ) 能够理解并处理w 曲上的信息, 2 太原理工大学硕士研究生学位论文 从而更好地协助人们在w e b 上发现知识、处理事务。 w e b 服务技术是当今比较流行的一项主流技术,它与语义w e b 之间有着千丝万缕 的联系。但随着w e b 服务的大量涌现,如何使机器自动、准确、高效地进行服务发现、 服务匹配、服务组合、服务监控和服务调用,成为w e b 服务研究中的热点和难点问题。 而语义w e b 为这些问题的解决提供了新的途径。利用语义w e b 丰富的语义描述能力和 强大的逻辑推理能力来准确地描述w e b 服务的语义,通过这些带有语义信息的描述来 实现服务的自动发现、组合、监控和调用。因而也就产生了语义w e b 服务技术。其中 语义w e b 服务描述,语义w e b 服务匹配与语义w e b 服务组合构成了当今的研究热点。 1 1 2 多a g e n t 技术 m i n s k y 在1 9 8 6 年出版的“思维社会”中首次提出了a g e n t ,认为社会中的某些个 体经过协商可求得问题的解,这个个体即a g e n t m a s ( m u l t i a g e n ts y s t e m ) 是由多个 a g e n t 组成的a g e n t 社会,是一种分布式自主系统。m a s 的表现通过a g e n t 的交互来 实现,主要研究多个a g e n t 为了联合采取行动或求解问题,如何协调各自的知识、目标、 策略和规划。在表达实际系统时,m a s 通过各a g e n t 间的通讯、合作、协调、调度、 管理及控制来表达系统的结构、功能及行为特性r 7 】。由于在同一个m a s 中各a g e n t 可 以异构,因此多a g e n t 技术对于复杂系统具有无可比拟的表达力,它为各种实际系统提 供了一种统一的模型,从而为各种实际系统的研究提供了一种统一的框架,其应用领域 十分广阔,具有潜在的巨大市场。 面向a g e n t 的程序设计( a o p ) 是一种较新软件方法,它将人工智能的理论带入分布 式系统的主流领域。a o p 将一个应用建模为组件的集合,也就是多个a g e n t 。那么这些 组件具有自治性,前摄性和交际能力。a o p 的体系结构模型本质上来说是p 2 p 的,任 何a g e n t 都可以发起与另一个a g e n t 的会话,或者在任意时刻作为接受会话的客体。 1 1 3 行为分析与服务设计 行为分析,是一门研究动物与人行为和学习的科学,它为智能计算机系统提供了一 个强大的理论框架,此种系统具有自适应性与自治性嗍。借助行为分析技术,我们可以 对复杂任务中的行为进行建模,例如w 曲服务过程 9 1 。因为行为分析可以帮助我们实现 系统自我意识,其中包括报告自身的行为、计划、思想,并且可以实现整个系统的目 3 太原理工大学硕士研究生学位论文 标导向。因此使用这种方式设计出来的多a g e n t 系统可以知道其自身的行为,并知道其 行为完成最终目标。通过行为分析,我们可以将复杂的服务行为分解成许多简单的便于 实现的行为。 虽然我们可以将一个复杂的服务建模成一个行为,可是这个行为较难衡量与实现。 因此我们可以对复杂行为进行建模,并对其进行分解,使其变为易于分析与实现的原子 行为。不同的行为类型可分别用于建模不同的w e b 服务,这样就可以用面向行为设计 的方法来设计w e b 服务,验证推理w e b 服务的过程。 行为分析对于环境、行为的关系具有较强的针对性。这种针对性体现在行为实体如 何改变自身的行为以适应随时改变的环境要求,就如同a g e n t 所处的w e b 环境一样,当 实体学会了一种行为方式以应对环境的变化,这可以称作心理条件作用。两种基本的心 理条件作用分别是响应( r e s p o n d e n 0 与动作( o p e r a n t ) 。服务行为可归为此两类。在服务设 计时,通过对于这两种行为的分析与验证,可以推理服务的合理性与可靠性。 1 2 论文研究内容及意义 本文叙述了近期以来我们在国家自然科学基金知晓内容和环境的本体知识路由研 究项目上的研究进展。 本文的研究工作是在语义w e b 及其相关技术的基础上展开的,主要研究内容包括: 建立一种本体驱动的知识路由机制,能够根据用户的知识需求,快速有效地发 现、定位和返回目标知识; 研究如何将语义技术融入到系统设计中去,设计带有语义特性的p 2 p 系统,并作 为语义社区的基础系统; 根据系统特征,设计适应系统结构的语义路由表,建立节点间的逻辑联系,以指 导系统内消息的传递与转达; 设计适应系统特性的本体知识路由算法,指导社区内的查询消息根据语义线索, 快速、有效的找到相应的资源; 为本体知识路由的建立探寻相应的理论基础,运用描述逻辑提供的逻辑表达能 力,结合行为分析方案,通过逻辑推理与验证,证明本体知识路由的可靠性, 与路由中主要功能的可满足性; 使用多a g e n t 技术,设计并搭建语义p 2 p 系统,并在此系统上试开发语义作业 4 太原理工大学硕士研究生学位论文 指导系统s h e s ( s e m a n t i ch o m e w o r ke n l i g h t e n i n gs y s t e m ) 。 本文的研究意义在于首创了一种独特的语义p 2 p 系统,其组织方式较国外同行所设 计的系统有诸多优势。它充分利用语义网的思想组织系统中节点间的逻辑链接,改善了 用户请求在路由过程中所遇到的语义损失问题。同时,它还弥补了传统p 2 p 系统缺乏语 义的不足,尽最大努力满足用户的需求。独创的基于本体分割方法的语义路由算法实现 了路由的功能,使请求消息在路由过程中不仅找到了到达最终目标的路径,而且还记录了 一条从用户掌握的源知识到目标知识的认知推理链。但是并不是每一条请求在系统中都 可以找到最终的答案,系统只能尽最大力帮助用户寻找答案,如实在找不到,则返回一条 与用户查询请求语义近似的答案。除此之外,本文还从逻辑学角度与行为分析技术相结 合,证明复合服务的可靠性,以及验证各组成服务之间交互的可满足性,为证明本体知 识路由的可靠性提供了理论上的基础。同时这种将行为分析技术与d l 相结合的方式, 是一次有益的理论探索。 1 3 论文结构 文章组织结构如下: 第一章绪论主要介绍了本文的研究背景以及所要研究的内容; 第二章主要是与本研究相关的领域知识综述; 第三章首先介绍本体知识路由的定义与抽象层次; 第四章提出了本体知识路由的系统结构,消息模型与运行机制; 第五章详述基于本体分割的知识路由算法与路由选择; 第六章是基于描述逻辑与行为分析的本体知识路由相关逻辑验证与推理; 第七章基于语义p 2 p 和多a g e n t 系统等相关技术,重点介绍了语义作业指导系统 s h e s ( s e m a n t i ch o m e w o r ke n l i g h t e n i n gs y s t e m ) 的设计与开发: 5 太原理工大学硕士研究生学位论文 第二章相关领域研究综述 由于本文综合运用了语义w e b 与智能a g e n t 技术、本体知识路由、w e b 智能、自 治计算、行为分析、语义w e b 服务及复合和描述逻辑等技术与知识。下面就对这些概 念作进一步阐述。 2 1 语义w e b 与智能a g e n t 技术 语义w e b 技术与智能a g e n t 技术都是当今人工智能领域研究的两种热门技术,两者 的结合更是吸引了大批科研人员与工程人员参与其中,目标是综合两门技术为工业信息 自动化服务。两者的交叉研究是当今r r 界的一个热点其中以欧洲的意大利、德国、瑞 典( s m a r t m u s e u m ) 为代表,而北美在此方向上的研究还不成规模。 2 1 1 语义w e b 概述 语义w e b 的目标是使得w e b 上的信息具有计算机可以理解的语义,满足智能软件 代理( a g e n t ) 对w w w 上异构和分布信息的有效访问和检索1 0 1 。语义w 曲的研究和开发 是按层次进行的,每一层都建立在更低层次的基础上【n 1 。图2 - 1 是t i mb e m e r s l e e 为未 来w e b 发展提出的基于语义的体系结构一语义w e b 体系结构: 厂1 b 魄t al 隧i l 一| 誊j 蛹辩j 。黪攀i 基 _ 、哺j k 焉_ _ ;晒习可 图2 - 1 语义w e b 层次结构图3 f i g 2 一lt h eh i e r a r c h yo f s e m a n t i cw e b 【3 】 7 太原理工大学硕士研究生学位论文 ( 1 ) u 融和u n i c o d e w e b 环境中的应用需要相互通信,资源之间直接或间接地以机器可理解的数据格式 传递和发布信息。这些信息是对w e b 上资源的描述。因此,首先应该以明确的方式来 标识这些资源。语义w e b 采用统一资源标识符( u n i f o r mr e s o u r c ei d e n t i f i e r s ,u p , i ) 来标 识资源及其属性,u r i 是一个i n t e m e t 标准,记载于r f c 2 3 9 6 t 1 2 1 。它和w w w 常用的统 一资源定位符( u n i f o r mr e s o u r c el o c a t o r ,u r l ) 以及统一资源名称( u n i f o r mr e s o u r c e n a m e ,u r n ) 的区别在于u r i 泛指所有以字符串标识的网络资源,包含了u r l 和u r n 。 另外由于语义w e b 的最终目的是要构建一个全球信息的网络,在这个网络上应该涵盖 各种语言和文字的信息资源,所以它采用统一编码u n i c o d e 作为字符的编码方案。这一 层是这个语义w e b 的基石,它成功地解决了w w w 上资源的定位和跨地区字符编码的 标准格式的问题。 ( 2 ) x m l 、n a m e s p a c e 和x m l s c h e m a 在u r i 和u n i c o d e 之上,是x m l 及相关技术层。x m l 允许用户根据需要自定义 一些“有意义的 标签对发布的内容进行标记,并使用文档类型定义( d o c u m e n tt y p e d e f m i t i o n ,d t d ) 或x m ls c h e m a 来约束这些标签的结构。由于x m l 标签可以由用户 根据自己的需要来定制,这样不可避免地会造成标签同名的情况,为了避免这样的冲突, w 3 c 采用了n a m e s p a c e 机制。例如:用户可以制定 标签: 这样即使其他用户也自定义了 标签,只要它们的n a m e s p a c e 不同,也不会造成 冲突。因此,这一层通过x m l 的特性,实现了文档对自身结构的描述,实现了跨应用 的语法互操作层,这是传统的h t m l 语言所无法完成的。有一点值得注意, 这个标签对人来说很容易理解,但对计算机而言,x m l 标签 和h t m l 标签 没有本质的区别,因为计算机并不能真正理解x m l 标签 的含义。也就是说, x m l 是底层的数据交换格式,它只是解决了文档内容的次序,结构的问题,并没有解 决文档内容的语义、联系的问题。标签的具体含义的定义和互操作要交给上一层去解决。 ( 3 ) r d f 和r d fs c h e m a x m l 层的上一层是数据互操作层一一资源描述框架( r e s o u r c ed e s c r i p t i o n f r a m e w o r k ,r d f ) 和r d fs c h e m a 。r d f 本身并没有规定语义,但是它为每一个资源描 述体系提供了一个能够描述其特性需求的语义结构的能力。它定义了种机器可理解的 8 奎堕里三莶堂堡主堕壅生堂垡笙茎 数据语义的数据模型。该数据模型主要包含下面的三个对象类型: 资源( r e s o u r c e s ) :资源可能是整个网页,或网页的一部分:或页面的全部集合; 或者是不能通过w e b 直接访问的对象。 特性( p r o p e r t i e s ) :特性是描述某个资源特定的方面、特性、属性或关系。 声明( s t a t e m e n t s ) 一个特定的资源和特性名称加上该特性的值一起构成了一个 r d f 声明。一个声明中包含三个部分,分别称为:主体( s u b j e c 0 ,谓词( p r e d i c a t e ) 和对象( o b j e c 0 。从本质上说,r d f 定义o b j e c t - p r o p e r t y - v a l u e 三元组作为基本建 模原语并为它们引入了标准的语法。 r d f 和x m l 之间的关系一直是一个容易混淆的问题,它们之间有着明确的功能分 工:r d f 解决如何无二义性地描述资源对象的问题,使得描述的资源的元数据信息成为 机器可以理解的信息。r d f 通过基于x m l 语法的明确定义的模型来帮助建立语义协定 ( r d f s ) 和语法编码( v i l ) 之间的桥梁,并以此来实现元数据的互操作功能 1 3 1 。这部分解 决了部分通用语义的问题,但是r d f r d f s 描述语义的功能非常有限,需要进一步扩展。 ( 4 ) o n t o l o g y r d fs c h e m a 可以定义类、子类、超类,并且可以定义属性和子属性,以及它们的 约束如:领域( d o m a i n ) 和范围( r a n g e ) 等,因此在某种意义上说,r d fs c h e m a 本身就是一 种简单的本体( o n t o l o g y ) 语言。但是r d f r d f s 对特定应用领域的词汇描述能力比较弱, 需要进行扩展,我们把这个r d f r d f s 之上的扩展层称为o n t o l o g y 层。 o n t o l o g y 作为一种能在知识层提供知识共享和重用的工具在语义w e b 中获得应用, 能够描述w e b 资源的概念及其相互关系,使计算机对w e b 资源的无二义的自动处理 成为可能,符合w e b 资源高度分散的特点。 ( 5 ) l o g i c 在o n t o l o g y 层之上的l o g i c 层主要定义逻辑描述原语,为更高层的逻辑推理提供语 义上的支持。 ( 6 ) p r o o f 和t r u s t 在l o g i c 层之上的p r o o f 和t r u s t 层主要是在下面各层提供的功能基础上进行逻辑推 理、证明等操作。 9 太原理工大学硕士研究生学位论文 2 1 2 语义w e b 标记语言 在语义w e b 的发展过程中,除了w 3 c 的语义w e b 成员之外,世界各地的各个研究 机构和科研人员都在密切关注着它的发展,从理论到实践、从标准到规范,都在做着不 懈的努力。其中,语义w e b 标记语言的研究是其核心内容。 s h o e ( s i m p l eh t m lo n t o l o g ye x t e n s i o n ) 【1 4 j 1 5 1 是美国m a r y l a n d 大学j a m e s h e n d l e r 教授( 也是后来的d a m l 项目和w 3 c 语义w e b 项目的负责人之一) 和他的学 生们,从1 9 9 5 年开始研究和开发的第一个实际意义上的基于o n t o l o g y 的语义w e b 标记 语言和原型系统,从网页的语义标记语言到语义网页的爬行机器人再到基于语义的搜索 引擎,都有一个完整的展示。s h o e 的语法基于h t m l ,语义基于h o r n 逻辑。 德国k a r l s r u h e 大学a i f b 研究所的o n t o b r o k e r l l 6 1 是基于h t m l 语法和f r a m e 1 0 9 i c 的语义w e b 语言。它在很多方面与s h o e 有相似之处,整个系统包括o n t o l o g y 的定义 语言、网页的标记语言、网络爬行者、推理机和查询接口。 欧共体的o n - t o k n o w l e d g e 项副。7 】资助开发的o i l ( o n t o l o g yi n t e r c h a n g el a n g u a g e 或o n t o l o g yi n f e r e n c el a y e r ) 1 8 1 也是一种在w e b 上描述o n t o l o g y 的语言。主要的合作者 有:英国的m a n c h e s t e r 大学、荷兰a m s t e r d a m 的v r i j e 大学、美国s t a n f o r d 大学、德国 k a r l s r u h e 大学、荷兰a i d m i n i s l r a t o rn e d e r l a n d 、美国贝尔实验室、m i t 大学等。o i l 通 过扩展r d f s 标准来克服r d f s 的限制,是在r d f s 层之上增加定义的一层,基于描述 逻辑( d e s c r i p t i o nl o g i c ) 以提供形式化的语义和推理功能。 美国d a r p a 资助的d a m l ( d a r p aa g e n tm a r k u pl a n g u a g e ) f 1 9 】项目于2 0 0 0 年8 月正式启动,主要研究活动有:制定该标记语言的规范:研究和开发知识标记的工具; 构造能理解d a m l 的多a g e n t 系统等等。早期的d a m l 语言规范版本称为d a m l - o n t ( 2 0 0 0 年l o 月版) 。后来为了结合已有的工作,吸收s h o e 、o i l 等其它一些标记方法最 好的特性而定义一个统一的w e bo n t o l o g y 语言框架,2 0 0 0 年1 0 月,d a r p a 和欧共体 i s t 联合组成了u s e ua g e n tm a r k u pl a n g u a g e 特别委员会,包括了x m l 、r d f 、o i l 、 s h o e 等相关项目的核心人员。参与d a m l 研究的有s t a n f o r d 、m a n c h e s t e r 、k a r l s r u h e 、 m i t 、c m u 、y a l e 、b b n 等1 6 家科研机构和公司,还包括很多w 3 c 的成员,t u n b e m e r s - l e e 自己也参与了该项目。由于d a m l 更多地和o i l 保持了一致性,因此后来 的版本称为d a m l + o i l ( 2 0 0 0 年1 2 月版和2 0 0 1 年3 月版) 。 为了推出w e bo n t o l o g y 语言的标准,w 3 co w l ( w e bo n t o l o g yl a n g u a g e ) i 作组在 1 0 太原理工大学硕士研究生学位论文 d a m l + o i l 的基础上进行了一定的改进,于2 0 0 3 年7 月w 3 c 公布了o w l 语言的最 初工作草案。2 0 0 4 年2 月1 0 日,o w l 正式成为w 3 c 推荐的标准。 d a m l + o i l 和o w l 都是建立在r d f 和r d f s 之上,基于描述逻辑以提供形式化 的语义和推理功能,从而为语义w e b 提供了o n t o l o g y 层。o n t o l o g y 层的研究已经比较 成熟,但其之上的逻辑规则层还没有出现成熟的语言。因此,目前的语义w e b 语言能 表达的语义仅限于描述逻辑,而不能表达一般形式的规则。 2 1 3 智能a g e n t 技术 a g e n t 和多a g e n t 系统( m a s ) 是人工智能乃至计算机科学的一个新的分支,其研究 工作主要由两个相互交织的部分组成,一个是个体a g e n t 的研究,另一个是a g e n t 群体 的研究。 至今为止,计算沿着以下五个重要且相互联系的趋势发展: 普适:随着计算能力所需的代价不断下降,计算有可能进入各种各样的应用环 境。 互联:计算机之间通过网络连接成大型分布式系统,并要求能并发地处理各种 事务。 智能:实现更加智能化的系统。要求由计算机自动和委派完成的问题越来越复 杂。 代理:代理意味着把控制权交给计算机系统,对计算机代理完成任务的能力要 求越

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论