




已阅读5页,还剩72页未读, 继续免费阅读
(计算机系统结构专业论文)基于中介器包装器的动态信息集成研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 摘要 随着计算机网络的飞速发展和信息化建设的大力推进,各种网络中可供利用 的信息总量正以惊人的速率增长。但这些为不同应用服务的信息都存储在许多不 同的数据源之中,其数据内容、数据格式和数据质量千差万别,且其管理系统也 各不相同。为更有效地利用这些信息,需要对多个分布、异构和自治的数据源中 的信息进行集成,向用户隐藏这些差异,提供给用户一个统一和透明的数据访问 接口,同时还需要保持数据在不同系统上的完整性和一致性。因此,在信息集成 过程中,如何有效解决这些差异是信息集成研究与应用领域所面临的一大挑战。 在充分吸收国内外信息集成领域研究成果的基础上,结合j 2 e e 平台、移动 a g e n t 技术和r d f 技术,本文建立了一种基于中介器包装器的动态信息集成系统 b m w d i i 。在建立b m w d i i 集成系统过程中,对公共数据模型与集成模式进 行了深入分析研究,构建了基于j 2 e e 与移动a g e n t 相结合的独特集成体系结构, 并对体系结构中的中介器和包装器进行了详细设计,同时还对集成系统的查询进 行了优化研究。具体来说本文的研究工作主要包括以下几个方面: 1 ) 介绍了b m w d i i 集成系统所用到的关键技术:移动a g e n t 技术与r d f 技 术,并分析了在集成系统中引入移动a g e r i t 与r d f 技术所带来的优越性。 2 ) 提出了单元数据的思想,且利用单元数据与r d f 技术能无缝匹配的特点, 构建了基于r d f 的公共数据模型l c d m ,并分析了r c d m 模型与目前主要 的几种数据模型间的映射关系。同时,结合已设计的公共数据模型,对集成模式 进行了分析研究。 3 ) 利用移动a g e n t 技术和r d f 技术,对中介器与包装器进行了详细设计。 在中介器中,专门设计了变更a g e n t 来适应各数据源数据结构的动态变化。 4 ) 针对全局连接查询是集成系统中最耗时且使用频率较高的一种数据查询, 故对其进行了基于半连接方法的查询优化研究,并设计了一个形成最优半连接执 行方案的优化算法。 最后在总结全文的基础上,结合其它与集成系统相关技术的发展趋势,提出 了若干有待进一步深入研究和探讨的问题。 关键词:中介器包装器,信息集成,公共数据模型,单元数据,全局查询优化 英文摘要 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fc o m p u t e rn e t w o r k sa n dt h es t r o n ga d v a n c eo f i n f o r m a t i o nc o n s t r u c t i o n , n o wt h ea m o u n to fi n f o r m a t i o na v a i l a b l eo n - l i n ei s p r o l i f e r a t i n ga tat r e m e n d o u sr a t e h o w e v e r , a nt h o s ei n f o r m a t i o nf o rm a n yd i f f e r e n t a p p l i c a t i o n si si n d e p e n d e n t l ys t o r e di nag r e a tv a r i e t yo fd a t as 吣鹤a n dm a n a g e db y d i f f e r e n ts y s t e m s ,a n dt h e i rc o n t e n t s ,s t r u c t u r e sa n dq u a l i t ya r ed i f f e r e n ti nt h o u s a n d s w a y s i no r d e r t ou t i l i z et h i si n f o r m a t i o nm o r ee f f e c t i v e l y , t h e r ei san e e dt oi n t e g r a t e i n f o r m a t i o nf m mm u l t i p l ed i s t r i b u t e d , h e t e r o g e n e o u sa n da u t o n o m o u ss o u r c e s ,a n d m a k ed i f f e r e n c e si n v i s i b l ea n dp r o v i d eu n i f o r ma n dt r a n s p a r e n ta c c e s st ot h ed a t af o r a l ln s e i s i na d d i t i o n , i ti sn e c e s s a r yt op r e s e r v ed a t ai n t e g r i t ya n dc o n s i s t e n c yo v e r d i f f e r e n ts y s t e m s t h u s ,h o wt or e s o l v et h o s ed i f f e r e n c e se f f i c i e n t l yi sas e v e r e c h a l l e n g ei nt h ed o m a i na b o u ta p p l i c a t i o na n dr e s e a r c ho f i n f o r m a t i o ni n t e g r a t i o n b a s e do ns u m m a r i z i n gs e r i e so fi m p o r t a n tr e s e a r c hw o r k so ni n f o r m a t i o n i n t e g r a t i o na n dc o m b i n i n gj 2 e ep l a t f o r ma n dm o b i l ea g e n ta n dr d f , t h i sd i s s e r t a t i o n h a s p r e s e n t e d a d y n a m i c i n f o r m a t i o n i n t e g r a t i o ns y s t e m b a s e do n m e d i a t o r w r a p p e r - - b m w d i i d u r i n gt h ep r o c e s so fe s t a b l i s h i n gb m w d i i t h e p a p e ra n a l y z e dc o m m o nd a t am o d e la n ds c h e m ai n t e g r a t i o nd e t a i l e d l ya n dh a s d e s i g n e dap a r t i c u l a rs t r u c t u r eo f i n t e g r a t i o nb a s e do nb a n d i n gj 2 e ea n dm o b i l ea g e n t t o g e t h e r i na d d i t i o n , m e d i a t o ra n dw r a p p e rw e r ed e s i g n e di nd e t a i l a tt h es f l l n et i m e , t h ed i s s e r t a t i o nr e s e a r c h e dg l o b a lq u e r yo p t i m i z a t i o no fi n t e g r a t i o ns y s t e m t h e p r i m a r yt a s k so f t h ep a p e ra f ea sf o l l o w s : 1 ) i n t r o d u c e dk e yt e c h n o l o g yu s e di nb m w d i is y s t e m , w h i c hw e r em o b i l e a g e n ta n dr d ft e c h n o l o g y i na d d i t i o n , a n a l y z e dw h a ta d v a n t a g em o b i l ea g e n ta n d r d fc a n b r i n g t oi n t e g r a t i o ns y s t e m 2 ) h a sp r e s e n t e dt h ei d e ao f u n i td a t a , a n dh a sb u i l tc o m m o nd a t am o d e lb a s e d o nr d f a c c o r d i n gt ot h ef e a t u r et h a tu n i td a t ac a nm a t c hr d ft e c h n o l o g ys e a m l e s s l y , a n df u r t h e r m o r e , a n a l y z e dh o wt om a ps e v e r a lm a i nd a t am o d e l su s e da tp r e s e n ti n t o r c d m a tt h es a m et i m e , w es t u d i e do ns c h e m ai n t e g r a t i o na c c o r d i n gt ot h ec o m m o n d a t am o d e ld e s i g n e di nt h ep a p e r 3 )w ed e s i g n e dm e d i a t o ra n dw r a p p e rb ym o b i l ea g e n ta n dr d fd e t a i l e d l y i n a d d i t i o n , w ed e s i g n e dc h a n g ea g e n tt oa d a p tt od y n a m i cc h a n g i n go fd a t as t r u c t u r ei n d i f f e r e n td a t a s o u r c ei np a r t i c u l a r i h 重庆大学硕士学位论文 4 ) a c c o r d i n g t ot h ef a c tt h a tg l o b a lj o i nq u e r yi st h em o s tw a s t et i m ea n dt h e m a i nq u e r yt y p e , w eo p t i m i z e di tb ys e m i j o i n , a n dd e s i g n e daf a s ta n de f f e c t i v e o p t i m i z a t i o na l g o r i t h mi no r d e rt op r o d u c eo p t i m u ms e m i j o i ne x e c u t i o np l a n i nt h ee n d , b a s e do nas u m m a r yo ft h er e s e a r c hr e s u l t sa n dd e v e l o p m e n tt r e n do f t e c h n o l o g yp e r t i n e n tt oi n f o r m a t i o ni n t e g r a t i o n , s o m ea d v i c ef o rf u r t h e rr e s e a r c ha n d e x p l o r a t i o nw a sp r o p o s e d k e y w o r d s :m e d i a t o r w r a p p e r , i n f o r m a t i o ni n t e g r a t i o n , c o m m o nd a t am o d e l , u n i td a t a , g l o b a lq u e r yo p t i m i z a t i o n i v 独创1 l 生声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取 得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文 中不包含其他人已经发表或撰写过的研究成果,也不包含为获得重迭太堂 或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本 研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:舞闭锋签字日期:年瑚尹曰 学位论文版权使用授权书 本学位论文作者完全了解 重麽太堂有关保留、使用学位论文的 规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许 论文被查阅和借阅。本人授权重废太堂可以将学位论文的全部或部 分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段 保存、汇编学位论文。 保密() ,在年解密后适用本授权书。 本学位论文属于 不保密( ) 。 ( 请只在上述一个括号内打“”) 学位论文作者签名:骞,匆荔争 签字日期:加年,声月日 导师虢哪 签字目期:年月日 1 绪论 1 绪论 1 1 研究背景 上世纪八九十年代,全球企业在信息系统上进行了巨大的投资,为企业建立 了众多的应用信息系统,以帮助企业进行内部或外部业务的处理和管理。由于企 业的传统结构是按照职能来组织各个部门,各个部门分别担负相关的职能,分别 使用不同的应用信息系统来协助他们完成规定的职能,导致众多关键的信息被封 闭在相互独立的系统中,形成一个个所谓的信息孤岛”【l 】。如何将众多的“信息孤 岛”联系起来,以便让不同的系统之间交互信息,作为一个企业需求被提了出来, 信息集成的价值和必要性也开始体现。例如,一个汽车连锁店需要能够一次性访 问所有其它汽车连锁店的库存信息,以便能准确从某个连锁店查找出本店缺货那 款汽车给客户。 同时,企业在追求效率和控制成本,或在兼并和收购过程中,对信息集成技 术提出了更高的要求。他们希望能够有效整合多个异构数据源的信息,进而形成 有用的决策信息供决策者参考,提高决策的科学性与针对性。 而且,随着近几十年的科学技术迅猛发展和信息化的推进,使得人类社会所 积累的数据量已经超过了过去5 0 0 0 年的总和,数据的采集、存储、处理和传播的 数量也与日俱增。企业实现数据共享,可以使更多的人更充分地使用已有数据资 源,减少资料收集、数据采集等重复劳动和相应费用。但是,在实施数据共享的 过程当中,由于不同用户提供的数据可能来自不同的途径,其数据内容、数据格 式和数据质量千差万别,有时甚至会遇到数据格式不能转换或数据转换格式后丢 失信息等棘手问题,严重阻碍了数据在各部门和各软件系统中的流动与共享。在 进行信息集成时,我们面对的数据格式是千差万别的,既有结构化的数据( 如各种 数据库数据等) ,也有半结构化的数据( 如h t m l x m l 文档等) ,还有无结构化的 数据( 如文本文件、图像文件等) 。产生数据差异的主要原因是各数据源数据的结 构和语义的冲突。因此,在信息集成过程中,如何有效解决这些冲突是一个非常 重要的问题。而且,随着产生信息的来源不断扩大,这种数据格式冲突会变得更 加严重。可以这样说,如何有效解决信息集成中的各种数据冲突问题,是信息集 成研究与应用领域所面临的一大挑战。 1 2 国内外研究现状 对信息集成的研究一直是数据库研究领域及其它相关领域一个非常热门的 课题,自上世纪八十年代开始,经过二十多年的发展,信息集成技术已得到了广 重庆大学硕士学位论文 泛的发展。国外的起步较早,在这方面取得的成果也比较明显。研究人员提出了 许多信息集成的体系结构和实现方案,然而这些研究主要是针对传统的异构数据 库系统。近年来i n t e m e t 技术迅速发展,网络已成为一种信息传播与交换的重要 手段,因此,如何同时获取结构化与非结构化的数据,已成为一个引起广泛关注 的研究领域。 国外的很多研究机构都有信息集成研究项目,比较著名的有t s i m m i s 、 m i n d 、v e r s a t i l e 、i m 等。国内主要有复旦大学、华中科技大学和东北大学等的 研究。 1 2 1 主要信息集成方法 目前最常用的信息集成方法有:联邦数据库,数据仓库,m e d i a t i o r 。【2 3 】 1 ) 联邦数据库。数据源是独立的,但一个数据源可以访问其他数据源以提供 信息。 2 ) 数据仓库。来自几个数据源的数据副本存储在单一数据库中,称其为数据 仓库。当从数据源拷贝数据时,可能需要以某种方式对其进行转换,以使所有的 数据都符合数据仓库的模式。 3 ) m e d i a t o r 。m e d i a t o r 是一种软件组件,它支持虚拟数据库,用户可以查询 这个虚拟数据库,就象它已物化一样。m e d i a t o r 不存储任何自己的数据,而是将 用户的查询翻译成一个或多个对数据源的查询。 1 2 2 典型的信息集成平台 nt h es t a n d f o r d - i b mm a n a g e ro f m u l t i p l ei n f o r m a t i o ns o u r c c s ( t s i m m l s ) 州 t s i m m i s 集成系统是由美国s t a n d f o r d 大学与m m 联合开发的一种数据集成 系统,主要有以下几个特点: t r a n s l a t eq u e r i e sa n di n f o r m a t i o n ( s o u r c ew r a p p e r s ) ; e x t r a c td a t af r o mw o r l dw i d ew c bs i t e s ; c o m b i n ei n f o r m a t i o nf r o ms e v c r a ls o u r c e s ( m e d i a t o r ) ; a l l o w b r o w s i n go f d a t as o u l r c 宅so v e rt h ew e b 该系统采用了自描述的对象交换模型o e m ( o b j e c te x c h a n g em o d e l ) 来表达集 成和查询【5 1 ,o e m 允许简单的对象嵌套,但o e m 并不存储信息,只是用于处理 逻辑查询,然后返回查询结果。在t s i m m i s 中,没有模式和对象类的概念,即 没有必要定义对象的结构,每个对象实例本身就已包含了它自己的模式。它的中 介器与包装器采用m s l ( m e a i a t o rs p e c i f i c a t i o nl a n g u a g e ) 描述,而且这些组件可以 通过m s l 规格说明自动生成。t s i m m i s 不提供数据的概念表示法,中间件在信 息源上计算视图。t s i m m i s 提出信息访问与集成是缠绕在一起的,在未看到样本 前,系统可能并不清楚怎么合并信息,而且碰到某个意外的数据,集成策略可能 2 1 绪论 会改变。t s i m m i s 需要较多的人工干预,自动化集成程度底。 2 1b e al i q u i dd a t a 实时数据集成 b e a l i q u i dd a t a 作为数据集成平台具有以下特点t 6 : 支持采用x m l 格式作为统一的数据交换标准,为数据访问提供简便、 统一的模式 数据转换和整合的规则可灵活定义,独立于应用集成和业务逻辑; 可实时地从来自于多个应用系统的数据源抽取和过滤信息; 采用符合规范的x q u c r y 技术,基于久经考验的应用服务器w e b l o g i e s e r v e r 实现,在性能和可靠性等诸多方面得到后者的强大支持。 3 1p a n o r a m a 系统“1 p a n o r a m a 系统采用基于c o r b a 的体系结构,在多个异构的数据库系统之上 实现了模式集成、查询处理和事务处理功能。p a n o r a m a 系统使用p a n o s q l 作为 其数据库查询语言,开发了服务器管理、模式维护、用户管理等辅助管理工具, 还提供了一个友好的交互界面p a n o q u e r y ,在异构环境中支持多用户分布操作。 在p a n o r a m a 系统中,采用了基于代理的逻辑模型框架,它主要由全局管理子层的 全局代理和局部代理子层的各局部代理合作实现。每当全局用户与m d b s 建立一 个连接时,p a n o r a m a 系统就发送一个创建的对象的消息给对象管理器,由对象管 理器创建一个全局代理对象( g a o ) ,它负责接收客户端的全局请求。在多客户的 环境下,多个g a o 并发执行,由系统保证全局可串行化。 4 1 g a l a x y 系统 东南大学研制的g a l a x y 是一个基于c o r b a 的分布式异构数据源信息系统, 使用对象集成模型( o i m ) 作为数据集成的公共模型,对象集成查询语言( o i q l ) 作 为其查询语言。o i q l 在s q l 语言的基础上增加了一些构造符,用于完成对象之 间的导航式查询以及对些集合类型对象的查询。g a l a x y 可以查询数据库、w w w 数据等信息源,但对查询优化考虑得并不多【8 】。 东北大学在基于c o r b a 的多数据库系统s c o p e c i m s 中,使用对象查询语 言作为全局查询语言,并提出了基于模式集成语义的查询处理规则和路径表达式 的查询处理方法。s c o p e c i m s 系统主要是为满足c 垤s 环境下信息集成需求而 设计的,对查询计划的生成及查询优化研究的不多1 9 】【1 0 】。 1 3 研究内容 基于m e d i a t o r w r a p p e r 的信息集成也可称为基于虚拟数据库的信息集成,它 是近些年来出现的一种较新的数据集成技术,这是计算机网络和数据库技术相交 叉应用的结果。虚拟数据库将关系数据库技术应用于i n t e m e t 上的多个数据源, 3 重庆大学硕士学位论文 实现了对分布数据源的透明访问,使i n t e r n e t 和其他外部数据源看起来就象是本 地的单个数据库一样,为用户提供了一个统一的数据查询应用视图。 与其它集成技术相比较,虚拟数据库集成技术具有以下优点:( 1 ) 因为虚拟数 据库不实际存储数据,而是根据要求动态与各个数据源通信,所以它总能获取到 最新的信息。( 2 ) 能很容易集成更多的数据源,扩展性好。可以根据以后的业务发 展需要,很容易地把其它数据源加入到集成系统。 然而,虚拟数据库技术在应用中也存在一些问题:公共数据模型的选取较困 难,它既要能表示尽可能多的数据格式,又要能表达丰富的语义;中介器在访问 数据源时,必须维持与数据源的网络连接,且需要不断传输大量的数据,一旦网 络中断,则必须重新建立连接且所有通信要重新开始;数据查询效率较低。正是 针对现有基于m e d i a t o r w r a p p e r 信息集成技术这些不足,本论文提出了基于这种 集成技术的较新的解决方案:利用j 2 e e 技术提供的服务使我们能集中处理业务 逻辑,也不要太多考虑事物并发及安全等较复杂问题;利用移动a g e n t 技术,解 决网络通信连接问题;利用r d f 作为系统数据公共格式,解决异构数据源数据结 构及语义冲突问题。 基于上述的解决方案,论文对以下方面的内容进行了研究; ( 1 ) 对论文所涉及的相关技术( 移动a g e n t 技术、r d f 技术及半连接查询) 进行 了介绍讨论。 ( 2 ) 对信息集成中的关键技术进行了深入分析,如单元数据、模式集成及公共 数据模型等。 ( 3 ) 对中介器及包装器进行了较详细研究与设计。 ( 4 ) 最后对查询优化进行了较深入的分析研究。 在论文中我们把基于m e d i a t o r w r a p p e r 的动态信息集成平台命名为 b m w d i i 。在进行b m w d i i 具体分析设计时,我们以学校学生数据为例说明研究 设计过程。 1 4 论文组织 本论文共分为七章,内容组织分配如下: 第一章是绪论。介绍了论文课题的研究背景和国内外研究现状,列举了一些 典型的集成平台,最后说明了论文的主要研究内容及其组织结构。 第二章是相关技术概述。对移动a g e n t 技术、r d f 技术及半连接查询操作的 概念及其在论文中的角色进行了简要介绍。 第三章是集成系统分析。对信息集成的关键技术原理进行了较详细分析研究, 最后提出了b m w d i i 的体系结构图并进行简单分析。 4 1 绪论 第四章是中介器系统设计。对组成中介器的主要功能模块所承担的功能作用 进行了详细分析,然后分别对各主要功能模块进行的详细设计。 第五章是包装器的设计。确定了包装器在工作过程中主要包含两个关键的数 据转换,然后详细分析了数据源的可能数据类型,并主要针对关系数据与x m l 数据这两种重要数据类型进行包装器设计。 第六章是查询优化。本章主要介绍了如何对全局查询进行优化,进而提高系 统的查询效率。在对m e d i a t o r w r a p p e r 集成系统查询特点进行详细分析的基础上, 确定了以全局连接查询为主要优化对象,提出了用半连接方法来优化连接查询, 并对半连接执行方案进行了优化算法设计。 第七章是总结与展望。介绍了本论文的主要工作及有创意之处,并简述了以 后在这方面需要继续做的工作。 5 2 相关技术概述 2 相关技术概述 2 1 引言 本章对论文所涉及的应用技术移动a g e n t 、r d f 和半连接查询进行了简 要的介绍。在开发b m w d i 系统时,为了使系统易于开发部署及更好地集成网 络上的各种资源,我们采用w e b 编程技术,而j 2 e e 是一种很好w e b 编程平台, 它具有跨平台、安全性及易用性等优点。移动a g e n t 技术是继c o r b a 、e j b 后新 一代分布处理的关键技术,它可以同时迁移其代码和运行状态,一次性把运算迁 移到目标站点,最后返回计算结果,可有效减少网络通信。r d f 对数据结构和语 义都有很好的支持,是理想的异构数据源间的通信语言。 2 2 移动a g e n t 简介 2 2 1 移动a g e n t 的概念 移动a g e n t 首先是一种a g e n t ,只是它是为易于迁移而设计的。a g e n t 的研究 起源于人工智能( a j :a r t i f i c i a li n t e l l i g e n c e ) 领域,它是人工智能技术与网络技术 发展的必然结果。m o b i l e a g e n t 的行为表现是很复杂的,但在本质上,m o b i l e a g e n t 的行为就是在目标驱动下的决策及动作。m o b i l ea g e n t 的行为能力可分为:移动 能力、反应能力、自主能力、学习能力及合作能力这五类【l l 】; 移动能力:这是m o b i l ea g e n t 的最基本能力。指m o b i l ea g e n t 能或不能 在不同的环境中移动。其中“不同的环境”是指不同的主机及各异的软件环境,“移 动”则是指a g e n t 的状态从任意点中止后能在其他环境中从该点恢复运行。 反应能力:指a g e n t 对需求能做出反应的能力。这往往是当a g e n t 没有当 前环境的有效视图,只能通过所遇到的事件来推测,判断环境时所需要的。它使 m o b i l ea g e n t 具有了广泛的适应性。 自主能力:正如 a g e n t ”这个名字所暗示的,m o b i l ea g e n t 应能在用户不 参与决策的情况下,用自身的知识逻辑自主的做出判断,最终完成用户的需求。 学习能力:指a g e n t 能通过与环境( 包括其他a g e n t ) 的交互交流活动获取 知识。从而调整自己行为及判断模式的能力。 。 合作能力:指a g e n t 能寻找、判断合适的合作伙伴,管理与合作伙伴的通 讯,并协调力求有效利用各自的资源,以期达到求解问题目的的能力。 2 2 2 移动a g e n t 系统结构 为了完整地理解移动a g e n t 技术,则必须对移动a g e n t 的系统结构有很清楚 的认识。移动a g e n t 系统由移动a g e n t 和移动a g e n t 服务设施两部分组成。移动 7 重庆大学硕士学位论文 a g e n t 服务设施基于a g e n t 传输协议( a g e n tt r a n s f e rp r o t o c 0 1 ) 实现a g e n t 在主机间 迁移,并为其分配执行环境和服务接口。a g e n t 在服务设施中执行,通过a g e n t 通信语言a c l ( a g e n tc o m m u n i c a t i o nl a n g u a g e ) 相互通信并访问服务设施提供的 服务。 移动a g e n t 体系结构可定义为以下相互关联的模块【1 2 j ;安全代理、环境交互 模块、任务求解模块、知识库、内部状态集、约束条件和路由策略。各模块间的 相互作用关系结构图如图2 1 所示: 外部环境( 服务设旌或其他a g e n t ) t 安全代理1 r 安全策 陋罕刮户 、 任务求解 一塑塑鲨查竺l 咂圃 甲, i 方法及推理规则l- 一叫路由策略l 图2 1 移动a g e n t 的结构模型 f i 9 2 1m o d e la r e h i t e c t m o f m o b i l ea g e n t 体系结构的最外层为安全代理,它是a g e n t 与外界环境通行的中介,执行a g e n t 的安全策略,阻止外界环境对a g e n t 的非法访问。a g e n t 通过环境交互模块感知外 部环境并作用于外部环境。环境交互模块实现a c l 语义,保证使用相同a c l 的 a g e n t 和服务设施之间的正确通信和协调,而通信内容的语义与a c l 无关。a g e n t 的任务求解模块包括a g e n t 的运行模块,以及与a g e n t 任务相关的推理方法和规则。 知识库是a g e n t 所感知的世界和自身模型,并保存在移动过程中获取的知识和任 务求解结构。内部状态集是a g e n t 执行过程中的当前状态,它影响a g e n t 的任务求 解过程,同时a g e n t 的任务求解又作用于内部状态。约束条件是a g e n t 创建者为保 证a g e n t 的行为和性能而作出的约束,一般只有a g e n t 创建者拥有对约束条件的修 改权限。路由决策决定a g e n t 的移动路径。服务设旄为移动a g e n t 提供基本服务( 包 括创建、传输、执行等) ,移动a g e n t 的移动和任务求解能力很大程度上决定于服 8 2 相关技术概述 务设施所提供的服务。 2 2 3 移动a g e n t 的优势 与c o r b a r 、e j b 等其它分布式计算模式相比,移动a g e n t 具有以下技术优 势: ( 1 ) 节约网络带宽、克服网络延迟:移动a g e n t 的本质是将计算移动到数据端, 直接在数据端进行本地处理,只返回最终结果,从而避免了大量中间数据在通信 两端的传输。移动a g e n t 一次可以携带多个服务请求移动到服务器端进行本地调 用,避免了多次远程调用,从而节省了每次远程调用的网络延迟。因此在处理的 数据量大、通信两端交互频繁、带宽不足的情况下,使用移动a g e n t 技术可以有 效的节省网络负载。这对复杂的异构环境信息集成系统非常有用。 ( 2 ) 支持异步自主执行:移动a g e n t 在网络上传输时,能够保存所有的属性值, 这样当移动a g e n t 移动到另一台主机后就能够继续执行,而不用重新运行。使用 移动a g e n t 技术,用户可以将整个任务而不是单个请求提交给多个独立的a g e n t 去执行,这些a g e n t 被发送到网上之后,可以独立于发送它们的程序,异步地、 自主地、协作地完成任务,它们的生命周期可以长于创建它们的程序。 ( 3 ) 具有动态适应性:移动a g e n t 通过和其运行环境进行交互,感知环境的变 化,根据自己的状态自主地、快速地做出反应,使整个系统始终保持在最优状态。 ( 4 ) 分布计算容错性:在分布计算环境中,事物的状态通常是分散在不同的数 据源之上。当其中一个客户端发出请求时,如果网络不稳定或某关键数据源出现 异常,那么客户端就很难收回状态并得到自己所期望的结果。然而移动a g e n t 可 以不需要保持持久的连接,并且它们的状态是集中在它自身上,上述问题将会很 容易处理。 总的来说,移动a g e n t 的一个最突出优点是通过其自身的智能性使分布计算 处理本地化,这样既能提高处理的性能,又能提高可靠性和灵活性。 2 2 4 移动a g e n t 平台a g l e t a g l e t 是i b m 日本公司开发一个支持移动a g e n t 的开发平台,旨在简化移动 a g e n t 的开发。a g l e t 以线程的形式产生于一台计算机上,可随时暂停正在执行的 工作,并允许把整个a g l e t 分派到另一台计算机上,再重新启动执行任务。因为 a 茁c t 是线程,所以不会消耗太多的系统资源。 ( 1 ) a g l e t 系统框架 a g l e t 系统框架如图2 2 所示12 】【1 3 1 。由图中可以看出a g l e t 的执行主要分为四 个阶段。首先当一个正在执行的a g l e t 想要将自己外送到远端时,会对a g l e t s r u n t i m e 层发出请求,然後a 西e t sr u n t i m e 层把a 百d 的状态资讯与程式码转成序 列化( s e r i a l i z e d ) 之位元组阵列( b y t ea r r a y ) ;接着若是外送的请求成功时,系统会 9 重庆大学硕士学位论文 将a g l e t 的执行动作结束,然後将位元组阵列传送至a t c i ( a g e n tt r a n s p o r ta n d c o m m u n i c a t i o ni n t e r f a c e ) 层处理,此层提供使用a t p ( a g e n tt r a n s f e rp r o t o c 0 1 ) 的介 面,其中a t p 为一个简单的应用层协定( a p p l i c a t i o n - i e v e lp i o t o c 0 1 ) ,它使得我们 不需顾虑a g l c t s 是否被派送到不同的a g e n t 系统就可以传送羽如( 也就是 a g e n t - s y s t e m - i n d e p e n d e n 0 :之后,系统会将位元组阵列附上相关的系统资讯,像 是系统名称以及a f l e t 的i d 等,并以b i ts t r e a m 透过网路传至远端工作站。 图2 2a g l e t 的系统框架 f i 9 2 2s y s t e mf r a m e w o r ka b o u t a g e r ( 2 ) a 9 1 e t 对象模型( 生命周期) 1 2 1 1 习 a g l c t 系统首先提供一个上下文环境来管理a # e t 的基本行为:如创建a g l e t 、 复制a g l e t 、分派a g e t 到远端计算机、召回远端的a g l e t 、暂停和唤醒a g l c t ,以 及清除a # e t 等,如图2 3 所示。 图2 3a g c t 的生命周期模型 f i 9 2 3l i f ec y c l em o d e lo f a g l e t 其次,a g l c t 与a # c t 之间的通信,可用消息传递的方式来传递消息对象。此 外,a g l c t 不让外界直接存取其信息,而是通过一个代理( p r o x y ) 提供相应的接口与 外界沟通,如图2 4 所示。这样做除了有较强的安全性外,还有一个好处,即a g l c t l o 2 相关技术概述 的所在位置会透明化,也就是a g l e t 要与远端的a # c t 沟通时,只要在本地主机的 上下文环境中产生对应远端a g l c t 的代理,并与此代理沟通,不必直接处理网络 连接与通信的问题。 图2 4a g l e t 基本通信模型 f i 9 2 4m o d e lo f e s s e n t i a lc o m m u n i c a t i o n sa b o u t a g l e t 2 3 r d f 简介 资源描述框架( r o d 是用来表现万维网上各类资源的信息的一种语言【1 4 1 , 已被批准为w 3 c 推荐标准( w 3 cr e c o m m e n d a t i o n ) 。r d f 基于这样的思想用w e b 标识符( 称作纺一藏缘粝谵簏u n i f o r mr e s o u r c ei d e n t i f i e r s 或u e d s ) 来标识事物, 用简单的属性( p r o p e r t y ) 及属性值来描述资源。r d f 可被用于表达关于任何可在 w e b 上被标识的事物的信息,即使有时它们不能被直接从w e b 上获取。r d f 用 于信息需要被应用程序处理而不是仅仅显示给人观看的场合,它提供了一种用于 表达这一信息、并使其能在应用程序间交换而不丧失语义的通用框架。既然是通 用框架,应用程序设计者可以利用现成的通用r d f 解析器( i m fp a r s e 0 以及通用 的处理工具。能够在不同的应用程序间交换信息意味着对于那些并非信息的最初 创建者的应用程序也是可利用这些信息。 2 3 1r d f 基本概念 r d f 是用于描述元数据的一种标准语言框架。r d f 是基于这一思想的:被描 述的事物具有一些属性,而这些属性各有其值( v a l u e s ) ;对资源的描述可以通过对 它作出指定了上述属性及值的陈述( s t a t e m e n t ) 来进行。r d f 用一套特定的术语来 表达陈述中的各个部分:在陈述中用于识别事物的那部分就叫做主体,而在陈述 中用于区分该陈述对象主体的各个不同属性的那部分就叫做谓词,在陈述中用于 区分各个属性的值的那部分叫做客体。例如我们要描述这样一个陈述: h t t p :b m w d i l o r g i n d e x h t m lh a sac n a t o rw h o s ev a l u ei sj 0 h ns m i t h ,这个陈述 里的不同部分用r d f 术语来说就是: 主体是u i 也 h t t p :b m w d i i o r g i n d e x h t m l 。 谓词是词“c r e a t o r 。 客体是短语 j o h ns m i t h 。 重庆大学硕士学位论文 r d f 的陈述可以用r d f x m l 语法来描写,以便能被机器识别处理。例如上 述英文陈述可以用r d f ) ( m l 语法表示如下图2 5 所示: ( r d f :r d fx m l n s :r d f = h t t p :m w 3 o r g 1 9 9 9 0 2 2 2 一r d f - s y n t a x n s # x m i n s :e x t e r m s :h t t p :w w w e x a m p l e o r g t e r m s e x t e r m s :c r e a t o r ) j o h ns m i t h e x t e r m s :c r e a t o r
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司每年每月团建活动方案
- 公司直播运营策划方案
- 公司节电活动方案
- 2025年药学专业技术资格考试题及答案
- 2025年医学专业考生必做试题及答案
- 2025年文化产业管理专业考试试卷及答案
- 2025年文化遗产保护技师职业资格考试试题及答案
- 2025年数字营销与品牌策略课程考试试卷及答案
- 2025年思想政治教育专业考试试题及答案
- 2025年生态文明建设与管理考试卷及答案
- 2023-2024学年河北省石家庄市高二下学期7月期末考试数学试题(解析版)
- 2025年江西省中考语文真题无答案
- 2025年上海市中考数学试卷附答案
- 关于七一活动方案
- 关于卫生院“十五五”发展规划(完整本)
- 福州市重点中学2025届英语七下期末联考试题含答案
- 2025年初中学业水平考试地理试卷(附答案)
- 大型医院巡查医院自查表
- 2025山西晋城市国有资本投资运营有限公司部分子公司招聘11人笔试参考题库附带答案详解析集合
- 期末专项复习:课内阅读(附答案)-部编版四年级语文下册
- 2024-2025 学年八年级英语下学期期末模拟卷 (扬州专用)解析卷
评论
0/150
提交评论