




已阅读5页,还剩93页未读, 继续免费阅读
(计算机应用技术专业论文)知识库网格模型的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙江大学硕士学位论文 摘要 摘要 语义互联网的出现将产生大量网上知识库资源。如何发现、组织、管理这些 知识库资源,并提供高可靠性的可扩展服务是一个亟待解决的问题。网格技术以 其成熟的互联网分布式计算服务体系,承诺对网络资源的广泛共享和协同使用, 为上述问题的解决提供了良好的基础技术支撑。 知识库网格d a r t g r i d k g 是一个针对语义互联网中知识库资源的共享、管理 和协同使用的网格体系,它结合了语义互联网和网格的观点,以服务的方式对外 提供了知识库管理、操作、查询等一系列接口。本文主要围绕知识库网格这个创 新性概念,对其模型进行深入研究,着重描述了知识库网格的拓扑结构以及模型 实现的若干关键技术。文章的主要工作如下: 本文探讨了知识库网格d a r t g r i d k g 的系统组成。在知识库网格中,知识服 务器是最基本的单元,它包括本体知识服务器、规则服务器、案例服务器等类型, 是知识库网格的信息、知识来源。本体论服务器用于指导知识的分类、管理和维 护。知识库目录服务器则提供了知识服务器的注册、发现、管理等功能。语义浏 览器,作为知识库网格的客户端,提供了知识浏览、查询、简单推理、节点管理 等功能。 本文定义了知识库网格的服务模型和核心协议族。d a r t g r i d k g 的服务模型 扩展于开放网格服务体系o g s a ,并增加了知识库网格特有的本体论服务、规则 推理服务、案例推理服务。本体论服务、语义注册和发现是d m r t g r i d k g 的核心, 与之对应的语义注册协议、本体论查询协议、本体论验证协议、本体论融合协议 也是文章的一个重点。 本文描述了知识库网格的实现及其在中医药研究中的应用。d a r t g r i d k g 作 为飞梭信息网格d a r t g r i d 的语义支撑,提供了资源的动态语义注册、分布式语 义查询和知识级语义浏览。目前系统已经基本实现,并在中医药研究中得到了充 分的应用。 今后的2 1 2 作重点将放在对多种本体论语言的兼容,分布式推理的完善与实 现,以及知识级通信协议的设计上。 关键词:语义互联网,知识库网格,飞梭信息网格,d a r t g r i d 瓜g 塑登坠竺兰兰竺 竺竺 a b s t r a c t t h ee m e r g e n c eo ft h es e m a n t i cw e bw i l lb r i n ga l le n o r m o u sa m o u n to fk n o w l e d g e b a s er e s o u r c e so n t ot h ew e b h o w - 韬d i s c o v e r , o r g a n i z e ,m a n a g et h e s er e s o u r c e s ,a n d p r o v i d ee x t e n s i b t e s e r v i c e sw i t hh i g hr e l i a b i i i t yi s ap r o b l e mn e e d st ob es o l v e d u r g e n t l y g r i dt e c h n o l o g i e s ,u s i n g t h e i rm a t u r ed i s t r i b u t e d c o m p u t i n g s e r v i c e a r c h i t e c t u r eo ni n t e r n e t 。a n dp r o m i s i n gt h eb r o a ds h a r i n ga n dc o o p e r a t i v eu s i n go f w e br e s o u r c e s ,b e c o m et h eb a s i ct e c h n i c a is u p p o r tt os o l v et h i sp r o b l e m k n o w l e d g eb a s eg r i dd a r t g r i d 艇gi s ag r i da r c h i t e c t u r e w h i c hf o c u s e so nt h e s h a r i n g 。m a n a g e m e n ta n dc o o p e r a t i v eu s i n go fk n o w l e d g eb a s er e s o u r c e s i nt h e s e m a n t i c 箨j 6 i tc o v e r st h ei d e ao f t h es e m a n t i cw e ba n dg r i d a n dp r o v i d e sas e r i e s o fi n t e r f a c e si ns e r v i c ef o r ma b o u t m a n a g e m e n t ,m a n i p u l a t i o n ,i n q u i r i n g o f k n o w l e d g eb a s e s i nt h i sd i s s e r t a t i o n ,d e e p r e s e a r c ho ni t sm o d e li si n t r o d u c e d s u r r o u n d i n gt h ei n n o v a t i v ec o n c e p to fk n o w l e d g eb a s eg r i d ,a n dt h et o p o l o g yo f d a r t g r i d k ga n ds o m ek e yt e c h n o l o g i e sa b o u tt h em o d e li m p l e m e n t a t i o na r em a i n l y d e s c r i b e d t h em a i na c h i e v e m e n t so f t h i sd i s s e r t a t i o na r el i s t e dh e r e i n a f t e r : t h ea r c h i t e c t u r eo fd a r t g r i 勰gi sd i s c u s s e di nt h ed i s s e r t a t i o n ,k n o w l e d g es e r v e ri s t h eb a s i ce l e m e n t o f k n o w l e d g e b a s eg r i d ,w h i c hc o n t a i n so n t o l o g yk n o w l e d g e s e r v e r , m l es e r v e ra n dc a s es e r v e r , i ti st h ei n f o n n a t i o na n dk n o w l e d g es o u r c eo f k n o w l e d g e b a s eg r i d o n t o l o g ys e r v e r g u i d e st h ek n o w l e d g ec l a s s i f i c a t i o n ,m a n a g e m e n ta n d m a i n t e n a n c e k n o w l e d g ed i r e c t o r ys e r v e r e n a b l e st h er e g i s t r a t i o n ,d i s c o v e r y , a n d m a n a g e m e n to fk n o w l e d g es e r v e r s a n da st h ec l i e n to fk n o w l e d g eb a s eg r i d ,t h e s e m a n t i cb r o w s e rp r o v i d e sk n o w l e d g eb r o w s i n g ,i n q u i r i n g ,s i m p l er e a s o n i n g ,g r i d n o d e m a n a g e m e n t ,a n d e t c t h es e r v i c em o d e la n dc o r ep r o t o c o ls u i t ea r ea l s od e f i n e di nt h i sd i s s e r t a t i o n t h e s e r v i c em o d e lo fd a r t g r i d 服oi se x t e n d e df r o m o p e n g r i ds e r v i c ea r c h i t e c t u r e a n d t h e k n o w l e d g e b a s e g r i d - s p e c i f i co n t o l o g ys e r v i c e ,r u l e i n f e r e n c es e r v i c ea n d c a s e “b a s e dr e a s o n i n gs e r v i c ea r ea d d e d i u o n t o l o g ys e r v i c e ,s e m a n t i cr e g i s t r a t i o na n d d i s c o v e r ya r et h ec o r ep a r t so fd a r t g r i d u r k g ;t h e r e f o r et h ec o r r e s p o n d i n gs e m a n t i c r e g i s t r a t i o np r o t o c o l ,o n t o l o g yq u e r yp r o t o c o l ,o n t o l o g yv e r i f y i n gp r o t o c o la n d o n t o l o g yf u s i o np r o t o c o la r ea l s ot h ee m p h a s i so f t h i sd i s s e r t a t i o n 髓e i m p l e m e n t a t i o n o fd a r t g f i d k ga n di t s a p p l i c a t i o ni n t r a d i t i o n a lc h i n e s e m e d i c i n ea r ei n t r o d u c e d a st h es e m a n t i cs u p p o r to f d a r t g r i d ,d a r t g r i d k ge n a b l e s t h ed y n a m i es e m a n t i cr e g i s t r yo f r e s o u r c e s ,d i s t r i b u t e ds e m a n t i cq u e r y a n ds e m a n t i c b r o w s i n gi nk n o w l e d g el e v e l t h es y s t e mi sa l m o s tr e a l i z e dc u r r e n t l y , a n dh a sf u l l v a p p l i e d i nt h er e s e a r c hw o r ka b o u tc h i n e s e m e d i c i n e , l e m p h a s e so ft h ef u t u r ew o r kw i l lb et h e c o m p a t i b i l i t y o fm u l t i p l eo n t o 。2 v i a n g u a g e s ,c o n s u m m a t i n ga n dr e a l i z i n go fd i s t r i b u t e dr e a s o n i n g ,a n dt h ed e s i g no f k n o w l e d g et e v e lc o m m u n i c a t i o n p r o t o c o l s k e y w o r d s :s e m a n t i cw e b ,k n o w l e d g eb a s eg r i d ,d a r t g r i d ,d a r t g r i d k g i 浙江煳女士学位做 1 1 研究背景 第一章绪论 网格作为i n t e m e t 的第三次浪潮,在世界各国引起了前所未有的关注和重视, 计算机方面的世界级大公司竞相推出了网格技术基础平台和相关的协议标准。 微软的n e t 技术宣称是超越浏览器、超越网站的具有革命性的新技术,其基 本理念是:不再关注单个网站和与i n t e m e t 连接的单个设备,而是让所有的计算 机、相关设备和服务商协同工作,提供更广泛和丰富的解决方案,使人们能够控 制信息并让它在指定的时间以指定的方式传送给自己。i b m 公司倡导的w e b s e r v i c e s 是一种较成熟的商业计算服务共享解决方案,它可以使全球范围内的采 购商、供应商和交易市场以低廉的价格共享商业服务。s u n 公司利用其在跨平台 语言方面的优势,以j a v a 为核心推出了相应的j 2 e e 平台规范。o r a c l e 在其最新 版本的应用服务器o r a c l e 9 i a s 中推出了全新的o r a c l ep o r t a l ( p o r t l e t s ) 技术。这些 都是面向信息网格的新一代技术和解决方案。 同时,支持信息网格的关键协议如x m l 、s o a p 、u d d i 、w s d l 都逐渐成 熟并成为各种平台支持的基本协议。 我国在这方面也做了大量基础性和前瞻性的研究。从1 9 9 5 年开始,中国科 学院计算所就建立了专门的网格研究队伍,开始研究与网格相关的技术,并丌发 成功了多个版本的信息一体化平台。 信息网格是要利用现有的网络基础设施、协议规范、w e b 和数据库技术、知 识库技术,为用户提供一体化的智能信息平台,其目标是创建一种架构在o s 和 w e b 之上的基于i n t e r n e t 的新一代信息平台和软件基础设施。在这个平台上,信 息的处理是分布式、协作和智能化的,用户可以通过单一入口访问所有信启、。信 息网格追求的最终目标是能够做到服务点播( s e r v i c eo nd e m a n d ) 和一步到俯 的服务( o n ec l i c k i se n o u g h ) 。 信息网格的体系结构、信息表示和元信息、信息连通和一致性、安全技术等 是目前信息网格研究的重点【1 1 。 1 体系结构 从c s 发展到b s s 是体系结构的个飞跃。为了重用业务处理逻辑和界面 表示逻辑,提高系统的伸缩性,现在的体系结构己逐渐向n 层结构发展,包括 客户端的显示、服务端的表示逻辑、服务端的处理逻辑、后台数据库系统等。支 撑信息网格的协议从顶层的统一服务互操作协议直到u d d i 、s o a p 、x m l 、 眵浙江大学硕士学位论文 绪论 一 _ 一 h t t p ,组成了一个从上至下的多层次协议栈,各层次协作服务实现了跨越w e b 的信息分布和集成应用程序逻辑。 目前,信息网格体系结构研究的重点是底层的信息存储、表示、对外发布、 呈现给用户的各层应用程序逻辑具体分层、实现和集成以及各中间层的数据存 储、接口界面、通信机制等方面。 2 信息的表示和元信息 信息的表示体现在两个方面:其一是将信息存储于数据库、知识库或其他存 储介质中的表示;其二是将其呈现给用户时的界面表示。 信息网格是应用层的软件基础设施,各行各业都有将该行业的数据信息发布 到网格上的需要,因此出现在信息网格上的信息种类是多种多样的,包括结构化、 半结构化和非结构化的数据,如何将它们映射成数据库或其他存储机制( 比如文 件系统) 的数据实体是信息网格要解决的首要问题。元信息抽象化了数据对象的 描述,使得各种信息可以通过元素屙洼与值之间的关系对来表达。我们将这种元 信息叫做数据表示的中间层。一般来说,数据的表示可以建立多个中间层,在各 个应用程序逻辑层中都有相应的数据中间层。 x m l 实现了w e b 文件的内容和数据表示形式的分离,是一种有效的数据页 面表示和描述语言。x m l 与元信息的结合将使界面表示和数据存储统一起来。 3 信息的连通性 信息的连通性是相对于信息“孤岛”而言的。信息“孤岛”是指将信息简单地堆 积在一起,要寻找它们往往只能通过搜索程序或固定的渠道:而信息的连通性是 把有一定关系( 包括语义和逻辑) 的数据从逻辑上连接在一起,在不考虑安全限 制的前提下,从一个信息源可以到达连通的其他任何信息源。虽然这些信息可能 存储在不同的位置,但对访问者来说,它们就像是存储在同一位置,访问者不必 关心它们的实际存储位置。要真正解决信息的连通性,信息网格就必须解决与信 息表示和用户个性化密切相关的信息连通性模型的定义与实现。 在信息的连通性中,语义万维网发挥了关键性的作用。简单地说,语义网是 一种能理解人类语言的智能网络,它不但能够理解人类的语言,而且还可以使人 与电脑之间的交流变得像人与人之间交流一样轻松。语义网的实现是基于x m l ( 可扩展标记语言e x t e n s i b l em a r k u pl a n g u a g e ) 语言和r d f ( 资源描述框架 r e s o u r c ed e s c r i p t i o n f r a m e w o r k ) 来完成的。x m l 是一种用于定义标记语言的工 具,其内容包括x m l 声明、用以定义语言语法的d t d ( d o c u r n e n t t y d ed e c i a r a t i o n 文档类型定义) 、描述标记的详细说明以及文档本身。而文档本身又包含有标记 和内窖。r d f 则用以表达网页的内容。以更抽象的视角来看,语义网的灵魂是 浙默学硕上学位做 绪论 本体论。本体论是一个誓学中豹壤念,表示事键瓣鼗搴质意义。语义鲻戮来奉捧 论来达至i l 对事物描述的一致性,以期能够在不同的网络、不葡的用户、不同的外 界环境中,达到统一的事物描述方法,完成意义上的统一一。 4 。信息嘲格的智能化特性 酸臻慧存薅羁震户豹溆笺鼹务,信息溺穆缀逡羹垂为溺户提供象藏一体夔方 案。它不需要程序员进行二次开发,只需要管理受傲简单的配置,就可建立服务 平台。信息网格的智能化特性关系到用户是否接受的问题,也是其生命力的体现。 智能化包括使用方便、界面一致、“主动”特性、用户输入和操作墩少、平台 的灵活性和柔性特征以及方便的个性化服务。 s 安全技术 信息闽格的目标是将i n t e r n e t 上提供信息服务的站点连接在一起,让所有用 户都可以享受这些信息服务。另方面,这些站点又可能分属于不同的组织机构, 各组织机构可以独立地管理属于自己的网络节点。在实际应用中,信息网格必须 为链点警溅誊提供访阉控制警安全管理飒铡,管瑷者可吸垂壶建决定可以共享哪 些信惑、共享给谁帮不琵共李帮些信息。当然,这萃中校陲控铡必须跫翳维护置独 立于数据源本身,同时应该在逻辑上提供不同的安全管理层次和控制粒度。 浙江大学信息网格飞梭计划基于语义的信息网格计划,包禽了以数据库 网格为主的数据库网格、知识黪网捂、网掊工作漩和网捂构终以及嬲格基礁梅架 等主要缀裁秘分翻。在飞羧诗划中,弄矮舅稳豹鼗摅痒溺捂资源达戮要联互逶, 本体论的指警起到了关键性的作角。飞梭计划中,本体论的对数据麾阏格的语义 支撑以服务的方式表现,即本体论服务,一般所指的元信息服务。本身本体论服 务本身怒知识库网格对外服务的重要组成部分。闳此,可以这么认为,在飞梭计t 划中,虽然主体是数据库网格的构架以及自治、独立的异质异构数据库之阐的通 信,毽楚俸为语义支撑酶本俗论濂务叛及其箍 共纛疑识瘁溺穆,怒英语义孩 以,。 1 2 研究内容 知识蓐阐揍在信惠网格中怒到了至关重要斡 磐掰,遣是语义支搭豹棱心力 量e 函_ 憩,关于知识瘁网穆熬毳拜究,对于丽稽投术黥发屣,戬及霹稽技术与语义 互联网的紧密结合是有相当黧袋的作用和伟大的意义。 知识库网格是在网格的蕊础上构架的一层更商层次、结合人工智能技术、更 浙江大学硕士学位论文 加贴近于应用的网格体系。我们将语义万维网中的魑概念引入到阀格中来,形 成了语义万维网与网格的缩合产物知识库网格。网格计算的宗旨是希望能够 婚全球豹所有计箕枫资源达到最大范爨的共享访阀。t l 户可以利用潮格节点上麴 计算祝资滋,包括存髓、计算、丽络、媒体等,而不盛知道这整资源的来源;丽 且用户也可以将自己的大烈机、小型机、计算集群、p c 机等的资源对外共享, 以便让位于全球各地的网格用户充分利用。而知识库网格宗旨是希望能够在网格 全球若享诗雾槐资源麴蒸綦鑫主,趣入谬义支撑,以霞够诖熏户曼老羹方便、爻秀饕 人性化的使用这些本来由计算机管理、在“0 1 ”世界中存在的资源。普遍认为, 阀格所管理的资源可以分为三个层次:计算资源( 数据资源) 、信息瓷源、知识 瀣源。这三种资源分别表示了数据的三种不疑的存在形式以及它们的商效性。知 识库霹格主要管理的是知识资源的屡次,也涉及弱信怠资源。 1 2 1 底层构架 在知识庵网格的最底屡是各种异质异构、具有不同存在形式的知识库。我们 这里所谓的知识库是指广义层次上的知识库。广义知识库有多种物理存在形式, 它可以是一个文件、若于个文件的组合、存放知识信息豹各嵇类型的数据库( 关 系数攥蓐、瑟淘对象蘩掇露、x m l 鼗掭库等) 、一个门户、一个网格节点对外掇 供的服务群等形式。这些广义知识库在物理上有不同的存在形式,而且一般情况 下,它们有各自不同的对外接口。广义知识库是知识艨网格的根基和数据、信息、 疑识来源。 1 2 2 虚拟中间层 戋瑟识蓐爨缮懿孛闻震楚箱谖疼霹椿煞统一接蜀露。知谖库瓣穗游一个重要簸 任务是将底滕异质异构的知识库资源熬合起来,充分利用各种存在形式的知识, 对外提供统一接口、一致访问形式、内容丰富的知识查询、浏览、搜索、管理等 接臼e 因此,熟识库网穆熬接口瑟是一令瘟援熟识露。在籍识瘁潮穆溪户看来, 整个知识库阏格就如同是单个知识库,它对外提供一套统一的接口、完善的服务 类型、一致的访问标准等。虚拟知识库鼷在知识库网格中起到了承上启下的作用, 是知识库网格的核心部分。 1 2 3 知识客户端 我们为皴识痒网撂开发了一个客户鲻,孬为它的嫒蹇垂次港义潮茭器。 语义灞览器够对知识瘁硒格中的各种类型的虚瓠缎织资源进行静理和访问,并 浙江大学硕士学位敝 绪论 韪对其形袋一个到表瞄 芷翅户方矮查键。对予每令鑫接爨织,语义淄楚嚣麓够 浏览其下所有的语义资源,包括本体论、推理机、嶷例等等。露前,我们的语义 浏览器主爱针对本体论进行浏览。语义浏览器能够给出本体论中所有概念的一个 层次列表,并给出每个概念的实例列表。语义浏览器支持概念( 类) 、实例、属 性以及它们之间的相关关系的浏览、查询、搜索等。 本文磅究豹是在知识痒溺掺豹撼桨过程中磁列戆一系剜瑟想、方法论上熬阀 题,以及始何将知识疼网格落实蜀应藤、在具谇成嗣中会碰到俺释类黧的问题等。 研究重点怒知识库网格的概念及其提供的本体论服务、规则推理、案例推理、开 发体系下的分布式推理,以及知识库网格服务的注册发现和语义通信协议等。 1 ,3 章苗安排 论文第章为绪论,主要描述本文的研究背景、研究重点以及论文的总体结 构。 第二礴描述了万维网( w e r l dw i d ew e b ) 的发展趋势以及网格( g r i d ) 技术、 语义互联潮( s e m a n t i cw e b ) 技术豹研究状况。 在论文翡第三章,我们蒌式撬塞了知识瘴溺豁戆穰念。懿誊 库藏襁靛楚在充 分认识了g r i d 以及s e m a n t i cw e b 的基础上得 的个新概念。知识库麟格是构 架在网格麓础平台上的,以各个分散在网格节点上的独自自治、异质辫构的知识 库为基础,利用网格基础平台形成统一的知识库访问接口,并且将知识库中的知 识运用烈网格中,指导用户对网络进行浏览、对资源进行访掏、对任务避行分勰 等工撵懿系绞平台。 文翥第四部分主要介绍了翔识库网格的拓扑缭桷。介绍知识库嗣格中的相关 概念,以及各个重要的组成部分。本章内容重点描述知识库网格的缀成,以及各 个组成部分如何相互交互,完成个小型知识库原型系统的工作。 第五潦为知识库网格的关键技术。主要包括本体论服务的实现、推理技术的 实觋、本嚣论注瑟发瑰中心瓣实凌。另努,着熏夯缓了躲蓼 蓐灏貉豹携议族,以 及它在信惑瓣捂飞筱诗裁中靛整要避位。 论文第六章,我们归纳了知识库网格的特点:透明访问、对外接口统、内 部异质异构、支持不同领域的本体充实、易移植等。 在论文的第七章,我们展示了知识库网格在实际应用中的工作情况。目前, 知识霹网掺酌主要应臻领域怒中医药共享数据平台。 论文涎装德部分包瑟结蘩港,以及鹱 ;者在攻读颟士赣闷发表论文露及参加科 研的情况。 翌塑兰查篓竺兰兰 竺竺苎兰兰璺竺竺竺竺竺 第二章网格及语义互联网的研究现状 杰深入了瓣麴识库爨,捺瓣褫念之懿,狂韵煮必要首先了瓣一下躲识痒强大朔 关技术网格计算( g r i dc o m p u t i n g ) 和语义互聪网( s e m a n t i c w e b ) 的发展历史。 对网格i t 一算和语义互联网的了解能够帮助我们更好地认识知识库嘲格出现的大 前提以及其必然性。本章我们将向读者i 介绍互联网的发展历史,从蕊引出当翦两 大熬门秘研内容网捂诗篓稠语义互联阏羧零;著且黯它 f 】遵行大麟遗予贡溅。 2 。1 互联网的发展历史 业赛公认的互联网的发震酉l 美分为三个主要的阶段。上个世纪8 0 年代,e m a i l 的出现使两个相隔万里的人之间可以方便地通信,而它最具意义的不是在于方便 人们的通信、改变了人工的邮件传递方式,将人力从中解放出来:它最伟大的意 义在子窦或了褥台p c 疆乏鬻蕊首次互酝互逶。e m a i l 靛鑫魂具畜巅时代蕊意义, 它标志着网络雏形的出现。 随后,夔国国防部先进研究计划局( d a r p a ) 于1 9 6 9 年,利用信息包传输 翻开教式黎体结蕊技术,缀建ta r p a n e t , 乍为e t h e m e t 秘瑟型,嚣恚羞互联网 的发展送入了第二个阶段p l 。e t h e m e t 的琢型是一个小型局域网,能够将局域恻 内的多台p c 机进行互联,并且可以应用多种网络捅扑结构,如凝形拓扑、网状 拓于卜、环状掇扑等,来影响各台机器之间的联接情况。e t h e m e t 之所以能够带领 互联溺戆发溪逐a 第二令除段是霆为它麓够傻每台在潮终中斡穰器共享本穰上 的资源( 仅限于存储资源) 供网络中的其他机器访问、使用;相对应的,同一网 络内的机器在权限允许的前提下也可以访问、使用其他机器共享出来的资源。它 楚i n t e m e t 静艨型,对予屠寒i n t e r n e t 豹快速发展开了先海。 互联网袋展鲍第三个阶段,也是变化最为巨大的一个除段,就是万维雕 w w w ( w o r l dw i d ew e b ) 的出现。1 9 9 0 年,蒂姆f 岛纳斯李( t i mb e m e r s l e e ) 在欧洲原予核研究中心( c e r n ) 工 乍时,为了赢能物理研究的需要发明了万缎 潮。万襞嚣瓣蠢璇,篌琢来懿数据姿源憝共享变成丰富多彩蕊各秘媒体资源逶遥 嘲络、网站对外发布实现共李;之后万维网的不断发展真正开始把人们带入了多 彩的网络世界。在随后的缀短几年间,w w w 的高滤发展,网络的内容越来越多 澎、越来越详实、越来越全蠹f 。这往芎罨入髑熬e | 豢尝三滔邦与互联爨关系密切。 随着互联黼的发展,人们对网络的饕求也越来越离。人们希望在网络上能够 传递的不仅感e m a i l ,在网络上共享的不仅是数据、媒体。而且,大型科学研究 的团队性合作也对网络掇出了更瓤、更商的要求。科研工作者展望未来的网终熊 够共享诗冀辊巍部豹鼹育资源,雹瑟数瓣资潦、存僚资源、诗冀资源等等。一言 堕鲨竺壁堂竺兰 竺竺苎兰兰兰璧竺堂翌坚 以蔽之,人们展望的未来的网络能够共享计算机内部的c p u 、内存、硬盘、网 络带宽等等切可用资源。而这正是网格计算所研究的问题。 2 2 网格计算 g r i dc o m p u t i n g ) 有观点认为,因特网和万维网技术已经接近成熟期,它们即将被更先进的技 本取代。那么,“因跨嬲霖蘧是骨么? 万缕网螽瑟是待么? 骨么怒信惠技泰熬下 一个大浪潮? ”我们必须掇瞧这些问题,思考这些问题,回答这些问题,才有希 望参与和创造信息技术的下一个大浪潮。 先是- 4 , 批人,后来怒越来越多的专客得出结论,这下一个大浪潮就是 阉格( g r i d ) 。在互联网广泛应震予毫予商务著经历渡渡起饺囱蘸不舞发展静今 天,我们注意到在与高性熊计算有关的科学合作领域,正在涌现如另一个具有划 时代的新生事物网格( g r i d ) 。它的出现,将掀起互联网继传统互联网 ( i n t e m e t ) 、万维翘( w e b ) 之惹茨第三次渡潮,_ 并将为绥息产业带来无浆亵规。 2 2 1 网格计算的概念 溺格与我们熬絮豹困聿夸瓣有耀些不溺耀? 中謇秘学浚诗算所赝长李謦杰陵 认为,网格实际上是继传统因特网和w e b 之后的第三个大浪潮,可以称之为第三 代因特网。简单地讲,传统因特网实现了计算机硬件的连通,w e b 实现了网页的 连透,瑟鄹揍试图实褒互联鹚上所有资源豹全露连避,包括诗算资源、存德舞源、 通信资源、软件资源、信怠资源、知识资源等 4 1 。 伊安福斯特( i a nf o r s t e r ) ,美阁计算网格项目的领导人之一,曾在1 9 9 8 年主编过一本书,题为t h eg r i d :an e wi n f r a s t r u c t u r ef o r2 1 s tc e n t u r y s c i e n c e ) ) 5 1o 德这释描遮藏疆: “瘸穰楚毽绞在豆联窝上秘一缀凝兴技术,荛 将高速互联闽、高性能计鲜机、大型数据库、传感器、远程设备椁融为一体,为 科技人员和酱通百姓提供挺多的资源、功能和交互憔。互联网主臻为人们提供电 子郄 牛、网页测菱等通信功辘,瑟溺格戆功毙则更多更强,它戆谴入们透骥主氇袋 角计算、存麓等其他瓷源降l 。”由此可觅,实际上传统互联网实现了计算祝矮 件的连通,w e b 实现了网页的连通,而网格试图实现互联网上所有资源的全面连 通t 它要把憋个互联网熬合成一台巨大的超级计算机,实现计算资源、存储资源、 遂蔷资源、软件姿源、痿崽瓷漂、熬识资源酌全蠹共攀。互联嚣豹第三次滚灞瀚 实质,就怒鹱将万维网( w o r l dw i d ew e b ) 升华为网格( g r e a tg l o b a lg r i d ) ” 浙江大学硕士学位做 网格驶语义互鞋闷的研究现状 2 2 2g l o b u s g 1 。b u s 楚美簪a r g o n n e 国家实验蜜懿蕊发硬强,全美有1 2 所大学魏研究机 构参与了该项嚣。g l o b u s 对资源管理、安全、信息服务及数据镑瑾等网椿计算 的关键理论进行研究,开发能在各种平台上运行的网格计算工具软件( t o o l k i t ) , 帮助规划和缒建大型的网撼试验平台,开发适合大型网格系统运行的大型应用程 序i 瓢。t o o l k i t 是g l o b u s 鼗重要夔或聚,箕第一鞭在1 9 9 9 年豢宙,最瑟敝本怒 去年推出的r e l e a s e3 0 。t o o l k i t 源码开放,任何人都可以从其网站上下载源 代码。目前,g l o b u s 的技术已在n a s a 网格( n a s a i p g ) 、欧洲数据网格( d a t ag r i d ) 、 美国国家技术隧穆( n t g ) 等8 个项强中缮到应弱。 通常,网格计算着眼予大登应用项滔,按照g l o b u s 的蕊点,大型应用项斟应 该由许多组织协同完成,它们形成一个“虚拟组织”,各组织拥有的计算资源在 虚拟组织里共事,协同完成项目。 菝g l o b u s 懿定义,所有臻予共享瓣实体都是姿涎,诗篓程、存储器、数壤、 软件等资源,分布式文件系统、缓冲池等也是资源。对于共享而言,有价值的不 是设备本身而是实体的接口或界面。 在g l o b u s 看来,现有蕊共享方案,比如互联网、b 2 b 、a s p 、s s p 、j a v a 、c o r b a 、 d c e 等,要么在共享配嚣盼灵活性上、疆么在共享资源种类上不能完全满足蕊拟 组织的需器。同时,g l o b u s 并不试图取代现有技术,而是希望在现有技术之上 建立更高层次的共享。 g l o b u s 诀为,两络环凌下懿互襟倦意曝着蒿要开袋一套逶强协议,凌它寒攥 述消息的格式和消息交换的规则。在协议之上,需嚣开发一系列服务,这与建立 在t c p i p 协议上的w e b 服务原理相同。在服务中爨定义a p i ,熬于这些a p i 瓣 穗建款待开发工具( s d k ) 。 2 2 3 网格研究现状 2 。2 。3 。i 国外的获嚣 目前,国外的网格研究主要在美国和欧洲。英国已投姿1 亿英镑用来研制“英 国n s n n ( u kn a t i o n a l g r i d ) 州”。美国政府用予网摆技术基璇研究经爨 贾l 已达5 亿荚元。美莺军方互e 规划实臆一个宏丈瓣圈格计划,e 傲“全球信恿阏 格( g l o b a li n f o r m a t i o n g r i d ) 1 0 1 ,预计在2 0 2 0 年完成。还有近年来羹 国大力发展的一项信息领域基础设施二t :程“先进计算基础设施工程”,又弥 a c i 上程( a d v a n c e d c o m p u t a t i o n a l i n f r a s t r u c t u r e ) ,它怒努存在不曩豫 “a 浙江大学礤士学位论文 硼格擞语义_ 互联鲥舶研究现状 理位置的高性能计算机、贵重仪器、数据库等资源用筒速网络连接在一起,使这 些资源看起来就像一台单映像的虚拟机器,用户邋过a c i 共享资源、建立虚拟 实验室、共剩讨论以及含 苫开展科研碗强。 最著名黪阚橇计算磅究蹩美国酌g l o b u s 项蘑。该矮鼙於主要毳薛究鹜标畜爵 个:其一是网格技术的研究:其二是相应软件的开发和标准的制定。同时,g l o b u s 项目还涉及到网格应用的开发及试验床( 佝建立。最近,g l o b u s 发布了一个跨在 完蕊麸褒在豹o l o b u s 到一个墓予嬲穆黟w e b 骚务穰念纛按寒夔燃穆系绞转交戆 开放网格服务架构”1 。g l o b u st o o l k i t 提供了构建网格应用所需的很多基本服 务,如安全、资源发现、资源管理、数据访问等。目前所有重大的网格项目都是 基予g l o b u st o o l k i t 提供躲协议与照务建设的。 乍为下一 弋i n t e r n e t 鹣关键技术,瓣格舅一类戮究的筏重点怒餐能信怠楚 理,它与网格研究的共同点是如何消除信息孤岛和知识孤岛,实现信息资源和知 识资源的智能共享。 2 2 3 。2 国内的状孺 国家高性能计算环境( n a t i o n a lh i g hp e r f o r m a n c ec o m p u t i n ge n v i r o n m e n t ,简 穆n h p c e ,亦稼国家计舞溺穆) 是酒客级寒蛙能诗冀翻售怠骚务的藏旗性基锻 设施,蠢中科院诗箕醑联合匿内十凡家科研单位,共黼承担酶“8 6 3 ”重点项鬣, 简称“织女星网格”( v e g ag r i d ) 。该项圈的目标是建立一个计算资源广域分布、 支持异构特性的计算网格示范系统,它嘏我国的8 个离性能计算中心通过i n t e m e t 连接超寒,瀵雩亍统一夔资游警理、售惠餐淫霸爱户篱疆,并在瑟蒸确土开发了多 个需要高性能计算能力的网格应用系统,己取得了一系列研究成果。 “先进计算基础设施北京上海试点工程( 简称清华a c i 系统) ”由清华 大学计算枫系承担熬。该项鹭可以实魏让薅户方便缝经塌嘉性能诗冀枧,芳暹适 在丽络上共攀资源,建立康敲实验室避黼促进跨学科、跨遗区的联合任务研究等 功能“”。清华a c i 系统怒套健全的资源管理系统、任务管理系统、用户管理 系统及安全服务与监控系统。目前,清华a c i 系统撼经形成了支持远距离联合 磺究匏试羧环浚。 飞梭信息网格( d a r t g r i d ) 是浙江大学网格计黧实验室研究开发的基于语义 的数据库网格系统,它的总研制目标是:通过定义和实现一个基于语义的虚拟组 织模型,提供整套在网椿环境下构建支终大藏模数攥库资源鲍共攀蠢管理约勰 决方案。重点支持数据库资源的露态纯的语义注瑟、分布式的语义黉询与知识缴 的语义浏览a 飞梭网格在应用层面着重针对中医药这数据密集型和知识密集型 领域,解决了海量中医药科学数掘库的基建共享问题。我们将在本文第三章对飞 梭诗翅送行详缨鼹说骥。 堡坚竖壁竺些兰 璺坚兰墨竺竺竺竺型 2 3 语义互联网( s e m a n t i c w e b ) 在万维嘲嗣盏普及约今天,入们充分体会到网络舱巨大魅力。但是万维网也 存在着很多不尽如人意的圭| 亟方,h 网页单调话澡、攘索引擎餐l 优程度低等。那 么,由此引发的一个问题是,万维网的未来又是什么样的呢? 目前的万维网的进化、扩大和完善的空间还很大,可以说万维网还没有走出 娄j l 袈。为餐万维耀透土一令鼗戆台殓,走淘戏熬黧粪正懿磐纯,1 0 年翦为 我们发明因特网超文本系统的麻省理工学院万维网协会主席t i mb e m e r s l e e ,现 在又在致力于开发新一代的万维网( 互联网) ,他为之取了一个直观的名称 ? 语义网”( s e m a n t i cw e b ) 。 2 3 1 “语义网”的概念 繇霆“添义”裁是文本熬含义。语义篱要理缮文本嚣意惑窥缨稳,瑟与显示 方式无关。语义网就是能够根据语义避行判断的网络【l ”。 目前在万维网中,网页仅仅是一个单调的内容照示,电脑只负责将一个网页 链接到另一个嗣页,网络_ 不能按照用户鹃要求自动搜寻和检索网擞,直至找到所 需要的内察。话语义网刚楚希望诗葬梳能“看谨”阏页静态容,後计算孝咒成为“餐 能”的导航工具。 简单地说,语义网是一种能理解人类语言的智能嘲络,它不但能够理解人类 的语言,露曼送可以楚入鸟迄薤之阕懿交滚交褥豫入与入之闫交滚一群轻松f 博1 。 语义网就好比一个巨型的大脑,它由数据库智能化程度极高,协调能力非常 强大的各个部分组成,可以解决各种难题。在语义网上连接的每一台计算机,都 能分享人类历史上所有科学、商业和艺术等知识。它不但能够理勰涌语和概念, 蠢置还s 够灌解它靛之闻的逻辑关系。在语义网中,潮络不仅髓够连接各个文 睾, 而且还能够识别文件里所传递的信息,也就是说,它是一种聪明的网络,可以干 人所从事的工作。 2 3 2 x m l 与r d f 语义网最然是一种更加美好的铡络,但实现起来却是一项复杂掰浩大的工瑕。 语义弼赘实浚建基予霹扩髅标记语言x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) 和资 源描述框架r d f ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ) 来完成的【1 6 1 。x m l 是一种 用于定义标记语言的工具,其内容包掇x m l 声明、用以定义语言语法的d t d 、 接述标记静详翅说臻以及文裆本身。露文档本身又鬯含畜标记翻内容。r d f 粼 堕堂兰竺鉴圭竺竺兰兰 竺丝要兰兰璧望婴竺 用以表达网页的内容。x d f 包含资源( r e s o u r c e ) 所有在w e b 上被命名、 具有u r i ( u n i f i e d r e s o u r c ei d e n t i f i e r 统资源描述符) 的事物:描述( d e s c r i p t i o n ) 对资源矮蛙( p f o p 。r t y ) 的一个陈述( s t a t e m e n t ) ,班表明资源的特性或者资 源之间的联系:框架( f r a m e w o r k ) 海被描述资源无关的通用模型,以包容 和管理资源的多样性、不致性和重复性 1 7 】。综合越来,r d f 就是定义了一种 通用的框架,即 的三元组,以不变应万变,柬搬述w 曲上的 各耱资溪。 当然,要实现语义网并非仅有x m l 和r d f 就行了。更主要f 1 勺技术难题还在 于要让计算机可以进行过雾的“思考”和“乎定断”。因此,要真正实现实用的语义闽 还有缀多工作要镦。 2 3 3 本体论( o n t o l
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 船闸及升船机运行员节假日后复工安全考核试卷含答案
- 畜禽屠宰无害化处理工节假日后复工安全考核试卷含答案
- 金属热处理工节假日后复工安全考核试卷含答案
- 生物考试重点难点解析
- 2025如何辨别“无效合同条款”
- 幼儿音乐教育生活化渗透方案
- 护理质量提升年度工作报告
- 2025年广州市全日制劳动合同范本
- 202409电子学会青少年机器人技术等级考试二级真题及答案
- 怀化市2025湖南怀化市市直企事业单位引进高层次及急需紧缺人才180人笔试历年参考题库附带答案详解
- 长阳清江画廊
- 液压泵站使用说明书
- E190飞机舱门开关
- 儿科学腹泻病
- CT介入学及CT引导下肺穿活检术课件
- GB/T 3871.9-2006农业拖拉机试验规程第9部分:牵引功率试验
- GB/T 3836.4-2021爆炸性环境第4部分:由本质安全型“i”保护的设备
- GB 17840-1999防弹玻璃
- 文学鉴赏-课件
- 小军师面试万能绝杀模板-组织管理
- midasCivil斜拉桥分析课件
评论
0/150
提交评论