




已阅读5页,还剩64页未读, 继续免费阅读
(计算机软件与理论专业论文)语义网格portal的应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
东南大学硕士学位论文语义两格p o r t a l 的应用研究 摘要 随着科学技术特别是计算机网络与信息技术的迅猛发展,科研环境和科研过程发生了很大的变 化。由于科学研究的问题空前复杂化,科研过程中对数据和信息的获取和处理显得越来越重要。为 了更好地对研究对象进行分析、发现和预测,也要求科学家之间更加密切地进行交流和合作。 e s c i e n c e 技术正是在这一背景下诞生的。它的出现,为各种不同类型、不同角色的研究人员能够较 为有效地在浩如烟海的信息中获取和掌握所需信息、进行协作研究和资源共享、合作地使用并创造 知识,提供了有力的支持。 本文的工作基于东南大学计算机科学与工程系同生物医学工程系合作进行的d r s n p g r i d 项目, 这一项目旨在结合网格计算和语义w e b 技术为生物医学研究者构建一个e - s c i e n c e 环境,使他们能 合作地开展生物芯片试验,共享分布的数据、信息源,从中获取相关知识,并进一步指导s n p ( s i n g l e n u c l e o f i d ep o l y m o r p h i s m s ,单核苷酸多态性) 与疾病相关性的研究。 网格p o r t a l 是基于w e b 的网格使用环境,是d r s n p g f i d 系统的重要组成部分。本文作者所承担 就是d r s n p g f i dp o r t a l 的研究和开发工作,包括前期调研、总体设计、语义网格p o r t a l 中信息获取及 相应的个性化机制的研究、以及原型系统的部分实现。本文论述了作者在这些方面的工作,主要内 容如下。 本文从讨论p o r t a l 及其演化发展入手,探讨了网格环境下p o r t a l 的意义,总结了国际上网格p o r t a l 方面的研究成果及技术路线,全面研究和分析了基于p o r t l e t 面向服务的网格p o r t a l 架构,在这一架 构的基础上进行了d r s n p g r i dp o r 组l 的总体设计。 为了方便用户获取相关知识来指导s n p 的筛选及芯片试验,进而发现s n p 与疾病的相关性, d r s n p g r i d 系统将网格中异质的数据、信息资源构建成一致的本体化的知识库。就该类型知识库, 本文探讨了如何将语义w e b 技术应用到p o r t a l 系统中来,方便用户在知识库中进行浏览和查询,进 而提出了一种本体驱动的信息获取机制。对于浏览而言,我们的方法结合了本体可视化技术以及本 体查询语言,能利用本体化的知识帮助用户找到感兴趣的信息,也能使用户依据语义关联由某一信 息导航到另一信息,并且在向用户呈现信息时能考虑用户先前浏览动作的累积作用或者表现出的“隐 含意图”。对于查询而言,我们提出的图形化查询界面能让用户自由的表达查询需求,并得到正确的 查询表达式,而不必熟悉本体查询语言的语法规范和语义,同时,它还能让用户表达对于关系的查 询。这一信息获取机制也适合于一般的语义信息p o r t a l 。 个性化是p o r t a l 的基本特点之一。本文全面讨论了网格p o r t a l 中的个性化问题,设计了多样的个 性化服务来满足不同的个性化需求。特别是针对用户在知识库中获取知识时的个性化需求,提出了 一种本体驱动的个性化服务机制,这一机制能让用户浏览时能最先看到他感兴趣的内容,并且使得 返回给用户的查询结果也是根据与其偏好的密切程度排序过的。 此外,本文针对实际应用中所要考虑的基本问题,如p o r t a l 的安全管理、单点登录、访问控制 及用户管理等,进行了分析并给出针对性的解决方案。在本文的展后,对p o r t a l 原型系统的开发与 部署方面的主要工作( 包括所使用的工具、技术、方法) 进行了总结与介绍。 关键词:网格p o r t a l 、语义w e b 、p o r t l e t 、本体、信息获取、个性化 东南大学硕士学位论文 语义网格p o r t a l 的应用研究 a b s t r a c t a l o n gw i t ht h er a p i dt h ed e v e l o p m e n to fs c i e n c ea n dt e c h n o l o g y , e s p e c i a l l yt h a to fc o m p u t e rn e t w o r k a n di n f o r m a t i o nt e c h n o l o g y , t h ee n v k o n m e n ta n dp r o c e s so fs c i e n t i f i cr e s e a r c hh a v ec h a n g e dg r e a t l y d u e t ot h e u n p r e c e d e n t e dc o m p l e x i t yo fc u r r e n tr e s e a r c hp r o b l e m s ,a c q u i r i n gt h e i n f o r m a t i o nn e e d e da n d p r o c e s s i n go fd a t ai ns c i e n t i f i cr e s e a r c hb e c o m e sm o r ea n dm o r ei m p o r t a n t s c i e n t i s t s a l s on e e dt o c o m m u n i c a t ea n dc o o p e r a t em u c hc l o s e rw i t he a c ho t h e ri no r d e rt og a i nb e t t e rr e s u l t si na n a l y s i s , d i s c o v e r y , a n df o r e c a s t u n d e rt h i sb a c k g r o u n d , e - s c i e n c et e c h n o l o g ye m e r g e da n di th a sg i v e np o w e r f u l s u p p o r tf u rr e s e a r c h e r st oa c q u i r ei n f o r m a t i o nn e e d e df r o mav o l u m i n o u si n f u r m a t i o ns p a c e s ,t oa c h i e v e c o i l 曲o r a t i v e x e s e a r c h ,s h a r ek n o w l e d g ea n dr e s o n r e e ,a n dt o c r e a t ek n o w l e d g ec o l l a b o r a t e d l y t h em a l nw o r ko ft h e t h e s i si sb a s e do nd r s n p g r i dp r o j e c t , w h i c hi sc a r r i e do u tb yd e p a r t m e n to f b i o m e d i c a le n g i n e e r i n ga n dd e p a r t m e n to fc o m p u t e rs c i e n c ea n de n g i n e e r i n go fs o u t h e a s tu n i v e r s i t y t h ep r o j e c t sg o a li s , t h r o u g hc o m b i n i n gg r i dc o m p u t i n ga n ds e m a n t i cw 曲t e c h n o l o g i e st o g e t h e r , t o c o n s t r u c ta l le - s c i e n c ee n v i r o n m e n tf o rb i o m e d i c a lr e s e a r c h e r s t oe n a b l et h e mt os h a r ed i s t r i b u t e dd a t a , i n f o r m a t i o nr e s o u r c e sc o n v e n i e n t l ys ot h a tt h e yc a l la c q u i r eu s e f u lk n o w l e d g ef r o mt h e s er e s o u r c e st o d i r e c tr e s e a r c h e so nr e l a t i o n s h i p sb e t w e e ns i n g l en u c l e o t i d ep o l y m o r p h i s m s ( s n p s ) a n dd i s e a s e s ,a n dt o e n a b l et h e mt oc a r r yo u tb i o c h i p se x p e r i m e n t sc o l l a b u r a t e d l l yt ou n c o v e rt h e s er e l a t i o n s h i p sa sw e l l ag r i dp o r t a li saw 曲- b a s e du s e re n v i r o n m e n t sf o rg r i da p p l i c a t i o n s 。a n dt h ep o r t a lt a k e sa l li m p o r t a n t r o l ei nd r s n p g r i ds y s t e m 1 1 1 ea u t h o ro ft h ep a p e ru n d e r t o o kt h er e s e a r c ha n dd e v e l o p m e n tw o r k so f d r s n p g r i dp o r t a l i n c l u d i n ge a r l yi n v e s t i g a t i o n , r e s e a r c h e so ni n f o r m a t i o nr e t r i e v a lm e c h a n i s ma n d p e r s o n a l i z a t i o nm e c h n i s mf o ras e m a n t i cg r i dp o r t a l ,o v e r a l ld e s i g n , a n di m p l e m e n t a t i o no fap r o t o t y p e s y s t e m t h em a i nc o n t e n to f t h ed i s s e r t a t i o na r ea sf o l l o w s f i r s t l y , c o n c t :p t sa n de v o l v e m e n to f c o m m o np o r t a l sa r ed i s c u s s e d ,t h e nt h es i g n i f i c a t i o no f c r c i dp o r t a li s a n a l y z e d , a n dr e s e a r c hf r u i t sa n dt e c h n i c a ll i n ei na r e ao fg r i dp o r t a l si nr e c e n ty e a r sa r es u m m a r i z e d , e s p e c i a l l 5t h es e r v i c e - o r i e n t e da r c h i t e c t u r ef o rg r i dp o r t a l sc o m b i n e dw i t hp o n l a tt e c h n o l o g yi ss t u d i e d a n da n a l y z e da m p l y , o nt h eb a s eo f w h i c ht h ef r a m e w o r ko f d r s n p g r i dp o r t a li sd e s i g n e d t of a c i l i t a t eu s e r sa c q u i r i n gu s e f u lk n o w l e d g et of i l t e rs n p s ,a n dt h e nc a r r y i n go u tc o r r e s p o n d i n g b i a c h i p se x p e r i m e n t st ou n c o v e rr e l a t i o n s h i p sb e t w e e ns n p sa n dd i s e a s e s d r s n p g r i ds y s t e me x t r a c t sa n d i n t e g r a t e si n f o r m a t i o nf r o mh e t e r o g e n e o u ss o u r c e si nt h eg r i dt oc o n s t r u c ta l lo n t o l o g i c a l ,c o n s i s t e n t k n o w l e d g eb a s e ( r d 3 ) t h e r e f o r , h o w t 0a p p l ys e m a n t i cw e bt e c h n o l o g i e si n t ot h ep o r t a lt of a c i l i t a t eu s e p 3 b r o w s i n ga n dq u e r y i n g ms u c hk bb e c o m e so u rb i gr e s e a r c hi s s u e a n da l lo n t o l o g y - d r i v e ni n f o r m a t i o n r e t r i e v a lm e c h a n i s mc o n s i d e r i n gb o t hb r o w s ea n dq u e r yi sb r o u g h tf o r w a r d 0 u rb r o w s em e c h a n i s mn o t o n l ye n a b l e su s e r st ol o c a t ei n t e r e s t e di n f o r m a t i o nw i t ho n t o l o g i c a lk n o w l e d g e ,t on a v i g a t ef r o mo n ep i e c e o fi n f o r m a t i o nt oa n o t h e rb a s e do ns e m a n t i ca s s o c i a t i o n s ,b u ta l s oe n a b l e su s e r st oa c c e s si n f o r m a t i o n a c c o r d i n gt ot h ec u m u l a t i v ee f f e c t so fb r o w s eh i s t o r yb yt r a c k i n gt h ec o r r e s p o n d e dp a t h mt h ec o n c e p t u a l s p a c ea te v e r yb r o w s es t e p a n do u rq u e r ym e c h a n i s mp r o v i d e san o v e lg r a p h i c a lq u e r yi n t e r f a c et o f a c i l i t a t eu s e r sf o r m u l a t i n go n t o l o g y - b a s e dq u e r i e sw i t h o u th a v i n gt ol e a r nd e c l a r a t i v eo n t o l o g yq u e r y l a n g u a g e s i tc a l la l s oc a p t u r eu s e r s q u e r yr e q u i r e m e n t sa b o u tc o m p l e xs e m a n t i cr e l a t i o n s h i p st os o m e e x t e n t h o w e v e r , t h i sm e c h a n i s mc a nb ea p p l i e dt oc o m m o ns e m a n t i ci n f o r m a t i o np o r t a l s p e r s o n a l i z a t i o ni so n eo fb a s i cc h a r a c t e r so fp o r t a l s t h e r e f u r , t h ei s s u e so fp e r s o n a l i z a t i o ni ng r i d p o r t a l sa r ed i s c u s s e da l ls i d e d l ga n dv a r i o u sp e r s o n a l i z a t i o ns e r v i c e sa r ed e s i g n e d f o rd i f i e r e n t r e q u i r e m e n t s e s p e c i a l l y , f o ru s e r sp e r s o n a l i z a t i o nr e q u i r e m e n to fi n f o r m a t i o nr e t r i e v a l i nk b ,a n i i 东南大学硕士学位论文 语义网格p o r t a l 的应用研究 o n t o l o g y - b a s e dp e r s o n a l i z a t i o nm e c h a n i s mi sp r e s e n t e d , w h i c he n a b l eu s e bg e t w h a tt h e yp r e f e r c o m f o r t a b l l ya n dr a n kq u e r yr e s u l t sr e t u m e da c c o r d i n gt ot h ee x t e n to f t h e i rm e e t i n go s e r s p r e f e r e n c e b e s i d e s s o m eb a s i ca p p l i c a t i o np r o b l e m ss u c ha ss e c u r i t ym a n a g e m e n t , s i n g l es i g n - o n , a c c e s sc o n t r o l a n du s e rm a n a g e m e n ti np o r t a l sa r ee o m i d e r e de a r e f u u y , a n dp e r t i n e n c ys o l u t i o n sa p r o p o s e d a tl a s t , w o r k sa b o u td e v e l o p m e n ta n dd e p l o y m e n to fap r o t o t y p es y s t e m ( i n c l u d i n gt o o l s t e c l l i l o l o g i e sa n d a p p r o a c h e sa p p l i e d ) a r ei n t r o d u c e db r i e f l y k e yw o r d s :g r i dp o r t a l s ,s e m a n t i cw e b ,o n t o l o g y , p o r t l e t , i n f o r m a t i o nr e t r i e v a l ,p e r s o n a l i z a t i o n i i i 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 研究生签名:秀查垂 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位 论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人 电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论 文被查阅和借阅,可以公布( 包括刊登) 论文的全部或部分内容。论文的公布( 包 括刊登) 授权东南大学研究生院办理。 研究生签名:圣查垦导师签名:日期:沙、? ,1 7 东南大学硕士学位论文 语义网格p o r t a l 的应用研究 第一章绪论 随着人类社会的不断进步,科学研究工作面临一些新的挑战:一方面科学研究的问题空 前复杂化,科学研究的对象也大大超越了简单的孤立系统,例如以前化学就是化学,物理就 是物理,而现在跨学科、多覆盖面的科研问题摆在人们面前,这就强调科学家之间更加密切 地交流和合作,这种交流和合作可能跨单位、跨地域,也可能跨学科、跨国家;另一方面科 研过程中对数据和信息的获取和处理显得越来越重要,大规模的数据计算和仿真成为科研过 程中不可缺少的手段,如何有效地获取和掌握浩如烟海的信息在很大程度上影响着科研过程 中的分析、发现和预测。当然,科研环境也发生了很大的变化,随着计算机网络及信息技术 的迅猛发展,计算机和通信技术已成为目前科研活动的必备手段,各种不同类型、不同角色 的研究人员在此基础上进行协作研究和资源共享,合作地使用并创造知识。这些特点导致了 e s c i e n c e 技术的出现。 本文的工作是围绕东南大学计算机科学与工程系和生物医学工程系合作进行的 d r s n p g r i d 项目而展开的,这一项目以e - s c i e n c e 为背景,旨在研究开发一个语义网格平台, 帮助生物医学研究人员合作开展生物芯片试验,共享分布的数据源,并从这些异质的数据源 中获取相关信息,以进一步指导s n p ( s i n g l en u c l e o t i d ep o l y m o r p h i s m s ,单核苷酸多态性) 与疾病相关性方面的研究。以期发现人类肿瘤发病与s n p 之间的可能联系。 1 1e - s c i e n c e 的兴起与发展 e - s c i e n c e 一词由英国的j o h n t a y l o r 等人在2 0 0 0 年提出的,它被定义为“在重要科学领 域中的全球性协作技术,以及与之相适应的下一代( 信息) 基础设施,【1 i 。可以认为:e s c i e n c e 是要使得分布( 甚至在全球范围内) 的资源能方便地被共享使用,使科研人员能有效地获取 海量数据、大量计算能力等;e s c i e n c e 可以形成虚拟实验室,让相关研究团体组成虚拟组 织( v i s u a lo r g a n i z a t i o n ,v o ) j ,并提供高性能的可视化环境,来进行分布式地大规模地 合作研究;e - s c i e n c e 也要使得科研过程中与计算相关的那些部分完全透明化和简便化,使 得科学家仅仅关注科学研究本身,而不是一大堆与计算相关的问题。 e - s c i e n c e 作为刚刚兴起的技术,处在探索和发展阶段,科学家们对支撑e s c i e n c e 的体 系结构等关键技术的内涵还未有统一的定论。尽管如此,网格计算( g r i dc o m p u t i n g ) 、w e b 服务( w e bs e r v i c e ) 和语义w e b ( s e m a n t i cw e b ) 三大技术已经被看作是e s c i e n c e 的核心。 e - s c i e n c e 在国外发展的第一阶段,网格计算就被认为是e - s c i e n c e 最具代表性的技术;在很 多场合,网格( g r i d ) 几乎就是e s c i e n c e 的同义语,它满足了e - s c i e n c e 提出的整合分布在 网络上的各种异构资源的需求,提出了解决虚拟组织间协作式资源共享及相应扩展性、安全 性等问题的可行方案,可以说正是通过网格,e - s c i e n c e 才能得以实现。 近年来,随着互联网领域w e b 服务的发展,其松散的耦合结构,主流的通信协议和统 一的数据格式,吸引了很多网络和分布式计算方面研究者的注意,也逐渐为工业界所接受。 产生了大量具有广泛现实应用的标准和技术。相应地,“服务”的概念蔓延到e - s c i e n c e 领域, 也产生了面向服务( s e r v i c e - o r i e n t e d ) 的模型。这一面向服务的模型推动了网格计算同w e b 服务的融合,使得创建可互操作的、可移植的、可重用的网格组件和系统成为可能,使得网 格技术或者说e - s c i e n c e 本身变得更成熟和标准化了。 从2 0 0 4 年开始,英国的e - s c i e n c e 研究进入其发展的第二个阶段。此时,科学家们发现 东南大学硕士学位论文 语义网格p o r t a l 的应用研究 许多e - s c i e n c e 项目更多地关心异质信息的管理、共享和互操作问题,并且对e - s c i e n c e 的表 述又增加了易用性和无缝自动化的要求。于是,研究的重点由网格中间件、可持续运行的网 格服务环境、网格支持环境中心,数据维护中心等方面,向信息和知识方面倾斜1 4 j 。由于传 统的网格不能解决其中存在的信息格式异构、信息语义的多重性以及信息关系的匮乏和非统 一等问题,也不能跨越机器与人之间的语义鸿沟,这使得e - s c i e n c e 描绘的宏伟蓝图同现实 的网格技术之间存在很大差距。因此语义w e b 技术被引入到网格中来以改变此种局面,以 使计算机尽可能帮助人们进行网格上的信息处理,使得网格系统内部各个部分间能“智能” 协作,由此提出了e s c i e n c e 未来的基础架构语义网格( s e m a n t i cg r i d ) 1 5 1 1 2 网格计算与语义w e b 网格 2 1 这一术语于上个世纪9 0 年代中期被提出,被用于表述一种适用于高端科学和工 程的分布式计算体系结构。网格的概念和相关技术最初就是针对科研协作中的资源共享问 题,即网格可以看作是各类资源的整合环境,能够充分吸纳各种资源,包括计算资源( 各种 计算机、工作站等) 、存储资源、应用程序、甚至可以是科学仪器,并以一种随处可得的、 可靠的、标准的、经济的方式提供给用户,满足网格中多个机构组成的动态虚拟组织间实现 协作式资源共享和问题求解的需要。这里,虚拟组织概念是许多现代计算理论的基础,是一 种基于资源共享的协作式问题求解模式的抽象,可以看作是“基于一些共同的共享规则,由 一些个人或团体形成的集合体”p 1 ,其中的成员以高度可控的方式共享不同的资源,即资源 提供者和使用者必须对哪些资源可以被共享、谁可以共享、共享的条件有清晰的约定,同时 虚拟组织内部不存在资源节点管理和自主性的冲突,允许成员自由地退出和加入等。网格提 供了虚拟组织需要的一个普遍的资源共享框架,这是它与现今其他分布式系统的主要区别。 到目前为止,网格的发展大致经历了三个阶段i o j 。第一阶段是从2 0 世纪9 0 年代早期到 1 9 9 7 年,这是网格的萌芽阶段,重点是元计算问题,即提供高性能的计算能力。此时的应 用直接建立在互联网协议之上,从安全、可扩展性和健壮性角度考虑,只有一些有限的典型 功能,并且互操作性不是它的主要关注点。第二阶段是1 9 9 8 年至2 0 0 1 年,这段时期里l a n f o s t e r 发表文章f 2 详细描述了网格,并提出了五层沙漏结构的网格体系结构,这一体系结构 强调协议,重点针对大规模数据与计算的中间件开发问题,以解决网格平台的异构性,扩展 性和适应性问题【7 j 。这一阶段推出的开放源码的g l o b u s 工具集第二版( g t 2 ) 嗍使得g l o b u s 成为网格计算的事实标准。第三阶段从2 0 0 2 年左右到现在,网格计算先是同网络领域另一 热门技术w 曲服务逐渐融合,其体系结构从五层沙漏结构演变为开放网格服务结构 ( o p e nc r r i ds e r v i c e s a r c h i t e c t u r e ,o g s a ) 唧,由强调协议转变为面向服务,更多地关注元 数据,强调自治性。 语义w e b ”1 最早是由t i mb e m e r s l e e1 9 9 8 年提出来的,他认为语义w e b 是现有万维 网的扩展或者是下一代的万维网,其目标是跨越现有万维网在信息处理上低自动化、低智能 化与“信息爆炸”之间的鸿沟,充分利用计算机的强大能力,使得计算机在“理解”w e b 中信息的“含义”的基础上与人更好地合作,为人们在网络中的信息获取、访问和交换方面 提供更优质更高效的支持。这里,信息的“含义”即语义( s e m a n t i c ) 一词所表达的不是自 然语言或人的推理,而是表达了对信息能进行哪些操作。由于机器并不具备智能,语义w e b 的基本思想是在w e b 信息中加入机器可处理的表达语义的元数据,进一步能依据元数据层 次上的关系、规则、逻辑和条件进行推理,从而自动地对信息进行组织、分类和处理。在此 之后,t i m b e m e r s l e e 又提出了语义w e b 体系结构( 如图1 1 所示1 ) ,为语义w e b 技术的 1 这是t i mb e r n e v s l e e 2 0 0 5 年在i s w c 大会上宣讲时给出的,同其2 0 0 0 年给出的体系结构图有所不同。 2 东南大学硕士学位论文 语义网格p o r t a l 的j 茸用研究 研究制定了路线图。 匿蔫话产 图1 1 语义w e b 体系结构 x m l ( e x t e n s i b l em a r k e tl a n g u a g e ,可扩展标记语言) 的出现使得已有的不同类型的数 据互操作成为了可能,能消除w e b 上信息在语法描述上的差异。由于它实现了数据内容和 形式的分离,这就迈出了重要的一步,使得传统万维网上的信息从面向人浏览的同时转为面 向计算机自动处理成为可能,因此它构成了语义w e b 的语法基础。但x m l 所存在的问题是 不具备语义描述能力,为此r d f ( r e s o u r c ed e s c “i p t i o nf r a m e w o r k ,资源描述框架) 2 被应用 来解决x m l 的语义局限,它借鉴了传统的“属性一值”对以及实体关系图,用三元组来表 达二元关系,提供了机器可处理的语义的元数据框架。r d fs c h e m a ( 简记为r d f - s ) 引入 了一个类似于面向对象的语言中的可扩展的类型( t y p e ) 系统到r d f 中,提供方法定义合 适的定义域和值域,以及类和子类层次,使得一些简单的推理能得以实现。 要使计算机之间能够相互理解其处理内容,还要一套共同的标准的形式化的概念体系, 即本体( o n t o l o g y ) ,典型的w e b 本体通常包含一个分类法和一组推理规则。o w l 是最新 推荐的w e b 本体描述语言,是在d a m l + o i l 的基础上发展起来的,作为r d f s 的扩展, 它提供了更多基于描述逻辑( d e s c r i p t i o nl o g i c ,d l ) 的原语以支持更加丰富的语义表达和 更强的推理能力。逻辑层则是在本体层定义的术语关系和推理规则之上提供功能更强大的逻 辑语言来实现推理,当逻辑层在本体描述语言之上提供图灵完全的逻辑语言后,语义w e b 就有足够的能力给出关于事物与事物间关系的断言。证明层的证明语言能对断言的真假给出 逻辑证明。最后数字签名和加密技术用来确保w e b 上信息的可信任性。目前研究较成熟的 最高一层是本体层。 1 3 语义网格及其进展 随着e - s c i e n c e 的不断发展,网格计算领域的研究在融合了w e b 服务技术,以面向服务 2 w w w w 3 o r e d r d f 3 w w w w 3 o r g t r r d f - s c h e m a 东南大学硕士学位论文 语义网格p o r t a l 的应用研究 的方式来解决网格问题,将网格的应用由科研学术界逐渐扩展到工商业界之后。一部分研究 者又重新向e s c i e n c e 回归,从e - s c i e n c e 的目标角度来探索网格未来的发展。 e - s c i e n c e 进入其发展的第二阶段后,许多( 或者说大部分) 的e ,s c i e n c e 探索活动向有 关信息和知识方面倾斜,即更多关注异质信息的管理、共享和互操作,以及利用知识协同解 决问题并协同地产生知识方面 4 1 。例如,生命科学团体是全球分布且高度分散的,不同团体 各自开发试验工具( 如生物芯片或者进行仿真的软件) 并构建数据仓库,而这些试验工具和 数据仓库构成各自独立的系统;除一些关键资源外,很少有集中式的公共数据仓库。同时, 大部分的生物知识也存在于大量分布和异质的资源中,如出版过的( 电子) 文献和被少部分 专家掌管的专门数据库。于是,当复杂的问题和分析放在生物学家们面前时,他们需要跨越 横亘在不同团体、组织、机构之间的障碍,相互合作,交换和分享工具、数据资源,搜寻其 中蕴涵的信息,并利用知识来共同获取答案。这里,关键的一点便是要发现有用信息并将它 们“编织”在一起,构成一个与问题解决相关的知识库。实际上,在天文学、海洋学、地质 学等领域,对这种大量地多样、分布、异质和可变信息的管理、共享、发现和关联都有需要。 这样,k e i t hj e f f e r y 提出了三种不同层次的网格类型,如下图所示。数据和计算网格直 接位于网络之上,提供数据层面的连通和共享以及高性能的数据计算能力。信息网格位于数 据和计算网格之上,通过对不同形式信息的表示、存储、访问、共享和维护方式的处理,提 供对异质分布的信息的一致访问。知识网格则是信息网格之上的最高级应用,它能聚合相关 知识、从底层的数据和信息中发掘知识、处理知识、应用知识来进行复杂问题求解。 隧橇缒蹦 翱识潮痿 僚想隧诲 数铽帮t 箨耨格 图1 2 网格的一种层次分类结构 可以看到,在信息网格和知识网格层次上需要处理的问题很大程度上同语义w e b 的研 究是相关联的。语义w e b 技术就是要提高对( 万维网上) 分布和异质的信息进行访问和使 用的质量,通过使用表达语义的机器可处理元数据,信息能根据其“意义”被很好的关联起 来。同时,w e b 本体描述语言的研究是为了更好地表达共享的、显式的知识。“共享”意味 着共同的一致的知识能被表达,“显式”意味着机器能处理,这就是说分布在各处的计算机 可以协作的处理和使用知识。随着语义w e b 研究在推理方面的进展,协作式的知识发现也 将成为可能。因此,将网格计算同语义w e b 结合起来是未来实现e - s c i e n c e 的可行之路( 如 图1 3 所示) ,于是,研究者们提出了语义网格的概念,它被认为是e - s c i e n c e 未来的基础架 构啷。 我们也可以从另外一个不同的角度,即从e - s c i e n c e 关于易用性和无缝自动化的要求出 发,来看待语义网格。 网格要到达易用性和无缝自动化,必须尽可能多地实现机器可处理性和尽量减少人的介 入。目前网格在这方面做的不够的原因在于:对网格中资源的描述缺乏语义,计算机难以处 理异质资源,难以综合、再利用信息;从面向服务架构的角度看,网格中的服务难以被重用, 因为其语义是隐含的和内嵌的。 因此,网格的研究者们意识到:能表达语义的元数据必须加入到网格中来,对资源的分 类等进行清晰的定义,对服务的能力、状态等以机器可理解可处理的方式进行描述;必须要 4 东南大学硕士学位论文语义网格p o r t a l 的应用研究 有能跨越整个网格的一致的信息模型,方便机器与机器之间、机器与人之间的合作;必须将 知识引入到网格中来,指导对资源的使用,特别是让网格中间件有能力使用知识来寻找可替 换的服务,“智能地”组合服务以形成工作流,从而实现自动化【l i 】。这些都意味着需要将语 义w e b 技术融入到网格中来,但与前文中说到的情况不同,这里,语义w e b 技术渗透到了 网格体系结构的各个方面。 疽 瘳 g 梅 廿 酬 疆义w e b语义羁格 w p h瓣格 _ l 更强扮计葬能力 圈i 3w e b ,语义w e b ,网格、语义网格的关系 从这个角度,可以用语义w e b 定义类似的方式来定义语义网格,即“语义网格是现有 网格的扩展,其中的信息和服务都有了清晰明了的含义,人与计算机能够更好的合作” e l i 。 由于基于o g s a 的网格体系结构已经实现了网格和w e b 服务的融合,网格中资源的概念可 被服务取代,这种语义网格的观点实际上是基于语义网格服务的( 如图1 4 所示) 【l “。 与通常的网格服务不同,语义网格服务采用比w s d l ( w e bs e r v i c ed e s c r i p t i o nl a n g u a g e , w e b 服务描述语言) 4 更具语义描述能力的语言对服务进行描述,这些描述包括了服务的功 能、代价、质量、输入和输出、地理信息以及提供者等,由机器可处理的元数据构成,结合 服务本体,机器可以根据服务描述进行语义层次上的匹配,更加“智能化地”完成服务发现、 服务替代,并依据工作流定义自动地进行服务组合来实现工作流。目前,基于o w l s ( w e b o n t o l o g yl a n g u a g ef o rs e r v i c e ) 的语义w e b 服务研究正在积极地展开,为语义网格的实现 打下了基础。 磷叉 堡匿坚塑堕墨 - i 莹语芝嘲翅季争的同格骧舞 卜。“。1 ? 一 图1 4 网格,w e b 服务、语义w e b 和语义网格的关系 根据上面两种不同的视角: 东南大学硕士学位论文语义网格p o r t a l 的应用研究 语义网格( g r i do f s e m a n f i c s ) 是提供知识服务以协同地使用和创造知识的网格; 语义网格( g r i du s i n gs e m a n t i c s ) 是由语义网格服务所构建的网格1 4 】。 我们可以得到如图1 5 所示的一个语义网格的架构图1 1 1 。 图1 5 语义网格的架构图 目前,国际上一些语义网格的相关研究项目已经开展起来:如针对生物信息学的 e - s c i e n c e 导航项目9 g r i d 6 、面向工程设计领域的g e o d i s e 项目7 、以及为科学家们的合作提 供通用平台的c o a k t i n g 项目5 等”“j 。它们都曾经或正在为各自的领域开辟全新的天地。 ”g 咖寻求提供开源的高层网格中问件,用于形式化表达、管理以及共享生物信息试验 中的密集数据,其重点是数据集成、工作流、个性化和数据来源记录。在”g r i d 中,不同 数据库在共同的语义元数据基础上完成映射,而文本文档中的信息被抽取出来放到数据仓库 中。对于网格服务,”g r i d 使用扩展的d a m l - s 服务本体对它们进行描述,用户可以在本 体基础上发现和使用,并根据服务的输入和输出语义,将不同服务组合起来构造能自动执行 的工作流。在“y g 稍d 中,用户能对特定的数据集进行标注以形成他们个性化的视图。并且 在用户访问数据、信息时,m y g r i d 会告知用户这些它们的来源,比如来自于某个试验。 g e o d i s e 试图用网格技术、设计优化技术、知识管理技术、w e b 服务和本体技术来构建 一个知识密集型设计工具。它首次使用的知识模式之一是通过注释使工程设计流具有丰富的 语义。当一个设计流程被创建后,用d a m l + o i l 表示的问题域本体会被用来标记流程片断, 产生的结果是以r d f 格式表达的扩充内容,从而使这个流程尽可
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 化工企业咨询方案
- 线上诵读活动策划方案范文
- 下沙整合营销方案
- 邓州世尊府建筑方案设计
- 芜湖安全特种设备培训课件
- 小区电动车充电管理系统介绍
- 古风建筑方案设计说明
- 碳咨询方案是指
- 2025年公共营养师考试冲刺试卷:营养学基础与饮食指导
- 饮料包装行业市场分析与发展
- 民办非企业单位年度调查报告书
- GJB9001C质量保证大纲
- 挑战64 新疆卷(新疆近四年共30题)(解析版)-2022年中考物理真题《压轴挑战》分类汇编
- 消化道出血护理新进展
- 【浅析机械自动化技术的发展现状及发展趋势8900字(论文)】
- 新材料引领创新创造的新驱动器
- 蛋白质分离纯化及鉴定
- 2024年化粪池清理合同协议书范本
- 老年痴呆认识老年痴呆的预防和治疗
- 两位数乘一位数计算训练1000题-可直接打印
- 《测绘管理法律与法规》课件-测绘标准化
评论
0/150
提交评论