(计算机应用技术专业论文)基于多代理结构的数字图书馆模型研究.pdf_第1页
(计算机应用技术专业论文)基于多代理结构的数字图书馆模型研究.pdf_第2页
(计算机应用技术专业论文)基于多代理结构的数字图书馆模型研究.pdf_第3页
(计算机应用技术专业论文)基于多代理结构的数字图书馆模型研究.pdf_第4页
(计算机应用技术专业论文)基于多代理结构的数字图书馆模型研究.pdf_第5页
已阅读5页,还剩47页未读 继续免费阅读

(计算机应用技术专业论文)基于多代理结构的数字图书馆模型研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华中科技大学硕士学位论文 摘要 目f j 在数字图书馆领域存在两个难点问题:异构信息仓储的互操作;缺乏搜索 到有用信息的信息过滤方法。因此设计了基于多层代理的数字图书馆模型m a d l , 该模型完全由多个独立自治的代理组成,能较好地解决各个信息仓储间的异构性问 题,有效地操作大规模的、异构的数字化信息。 - m a d l 模型中采用了分级搜索的体系结构:查询请求由用户端的查询代理发 出,通过全局搜索代理的指派被传递到位于搜索层次中最底层的局部搜索代理;然 后由局部搜索代理完成查询指令到本地信息搜索方式的映射,并在本地信息源上执 行查询:分离的结果集由全局搜索代理整合成统一格式,最后通过表示代理向用户 显示定制后的结果集数据。模型中采用全局搜索代理使个体查询能够独立于信息源 的分布情况,同时局部搜索代理的采用能有效的屏蔽数据源的异构性问题。 厂 为了提高系统的扩展性和灵活性,在m a d l 模型中,各种代理按照其在系统 中充当的角色划分成三类:用户代理、功能代理和注册代理。允许系统维护者根据 这三种角色增添或删改系统中的代理,同时结合用户代理的组台式调度模型,能迸 一步提高数字图书馆系统的可扩展性。另外,还分析了如何充分利用代理问的相互 协作来完成复杂的任务,如用户查询结果集的共享等。最后,基于j a d e 丌发平台 仞步实现了该模型。广- m a d l 模型能够有效的完成异构数据源查询工作。同时其他设计技术的应用保 证了系统的灵活性和可扩展性,使系统能适应快速增长和变化的数据环境及应用需 求。 关键词:数字图书馆:多代理模型;层次搜索;多代理协作 华中科技大学硕士学位论文 a b s t r a c t d i g i t a ll i b r a r y i s d e s i g n e d t or e a l i z et h ee f f i c i e n tu s eo ft h e h u g ec a p a c i t y e v e r - i n c r e a s i n gi n f o r m a t i o n a n dn o w ,i t e n c o u n t e r ss o m eb o t t l e n e c k s :d i f f i c u l t yo f s e a r c h i n gi n f o n n a t i o n ,l a c ko fi n t e r o p e r a t i o no fh e t e r o g e n e o u si n f o n n a t i o nw a r e h o u s i n g w ed e s i g nam o d e lo fm u l t i l a y e r a g e n ts y s t e m f o r d i g i t a ll i b r a r y ( m a d l ) t om a k e i n t e r o p e r a t i o na v a i l a b l ef o re a c hi n f o r m a t i o nw a r e h o u s i n g i ta i m st or e a l i z et h eu n i f o r m c r o s s w a r e h o u s i n gs e a r c h ,p r o v i d eu s e r sa v i r t u a lg e n e r a li n f o r m a t i o nn e t w o r k t h em a d lm o d e li s c o m p l e t e l yc o n s i s t e d o fm a n ya u t o n o m o u sa g e n t sm a d l i n c l u d e s :u s e rq u e r ya g e n t ,g l o b a ls e a r c ha g e n t ,p r e f e r e n c em a i n t e n a n c ea g e n t ,l o c a l s e a r c ha g e n t ,r e g i s t r a t i o na g e n ta n do t h e rt a s ka g e n t a tt h es a m et i m e ,t h em a d l m o d e le m p l o y sm u l t i - l a y e rs e a r c h i n gs t r u c t u r et h es e a r c hp r o c e s sa s f o l l o w s :q u e r yi s e m i t t e db yt h eq u e r ya g e n t ;b yt h eg l o b a ls e a r c ha g e n td i s p a t c h i n g ,t h el o c a ls e a r c ha g e n t r e c e i v e st h eq u e r y ,t h e nm a p st h eq u e r yi n t oa n o t h e rf o m a a tw h i c hi s u n i q u e t ol o c a ld a t a s o u r c e ,t h er e t u r n e dr e s u l ts e t sw e r em e r g e db yt h eg l o b a ls e a r c h a g e n t ,f i n a l l y t h e r e s u l t - s e t - d i s p l a ya g e n td i s p l a y st h es e a r c h e dd a t au s i n gc u s t o m i z e df o m l a t a c c o r d i n gt ot h ec h a r a c t e ra sw h i c ht h ea g e n t si nt h em o d e la c t ,w ec l a s s i f yt h e m i n t ot h r e ec a t a l o g s :u s e ra g e n t ,f u n c t i o na g e n ta n dr e g i s t r a t i o na g e n t t h ev i n d i c a t o r s a r ea l l o w e dt oa d do rd e l e t et h e i ra g e n t si nt h e s y s t e mb e l o n g i n g t ot h e s et h r e ek i n d s ,a n d a tt h es a m et i m ec o o p e r a t ew i t ht h es c h e d u l em o d e lo ft h eu s e ra g e n t i nt h i sm o d e l ,w e m a k ef u l lu s eo ft h ec o o p e r a t i o nb e t w e e nt h ea g e n t st o a c c o m p l i s ht h ec o m p l e xt a s k s , s u c ha st h es h a r eo ft h es e a r c h i n gr e s u l t ss e to fd i f f e r e n tu s e r s ,w h i c hm a k e st h es y s t e m h a v ef a i r l yh i g hf l e x i b i l i t y m a d lh a st h ea b i l i t yt og u a r a n t e et h ei n t e r - o p e r a t i o nb e t w e e n t h eh e t e r o s t r u c t u r e d a t as o u r c ea n dt h es e a r c ho ft h ed i s t r i b u t i n gd a t as o u r c e ,a n dt h ea p p l i c a t i o n so fs o m e r e l a t i v et e c h n i q u e sc a na l s oe n h a n c et h es c a l a b i l i t yo f , i a d l k e yw o r d s :d i g i t a ll i b r a r y ;m u l t i a g e n tm o d e l ;l a y e r i n gs e a r c h ;m u l t i a g e n tc o o p e r a t i o n 华中科技大学硕士学位论文 1 1 课题背景、目的及意义 1 绪论 近年来,数字图书馆( d l i b ) 的研究和实践己成为全球性的一个热点,这是i n t e r n e t 和万维网发展的必然结果。十多年来,互联的扩展和带宽的增加一直是i n t e m e t 发 展的主旋律,用户访问的能力即随着这一主旋律的发展而不断延伸。与此同时,在 这样一个丌放的和相对缺乏控制的全球网络信息环境中,信息资源以每年1 0 倍的 数量级增长。可是,有效地利用这些信息的技术的发展步伐却远远落后于信息增长 的速度,造成了互联网的畸形发展。目前,用户获取网络信息的主要手段仍然是浏 览和简单的关键词匹配,这是对网上巨大信息资源、网络互联和带宽的种极大浪 费。d l i b 即是为解决这一问题而产生的,其主要目标就是提供i n t e m e t 上信息资源 的有效利用的服务。 数字图书馆是采用现代高新技术所支持的数字信息资源系统,是下代因特网 网上信息资源的管理模式,将从根本上改变目前因特网上信息分散不便使用的现 状。通俗地说,数字图书馆是没有时空限制的、便于使用的、超大规模的知识中心。 但与此同时,海量数字信息库也为我们带来了很多的难题,其中有两个问题特 别重要:大量不同格式和媒质数据的数字化形成了多个异构信息源,如何解决多个 信息源之间的互操作问题,有一定自治能力的代理是解决这问题的有前途的方 法;以爆炸速度增长的海量数据信息使得用户获得自己需要的有用资料越来越困 难,通常的基于关键字的搜索方法不能提供很好的搜索精度,同时有些问题也很难 只用关键字来查询,例如查找一本评价较高的j a v a 入门书籍。 基于代理的数字图书馆技术能够更好地适应分布自治的i n t e r n e t 网络环境,同 时高度自治的代理能减少系统设计的复杂度,能够将复杂的、经常改变的环境变成 一个用户容易使用的辅助系统。 我们的研究目的是设计一个基于多层代理结构的数字图书馆体系结构模型,使 设计出的模型能够较好地解决上述的第一个问题。设计的数字图书馆体系结构应可 包含多个分仿式数字资源库,整个系统在软件代理技术的基础上,实现横跨多个资 华中科技大学硕士学位论文 源库的快速查询检索。针对第二个问题,目前还没有很有效的解决方法,我们的做 法是在模型中实现一种查询代理来帮助用户更高效地进行搜索,如果将来有更好的 查询算法,可以采用替换查询代理的方式无缝地链接到我们的系统中。 1 2 国内外研究概况 1 _ 2 1 数字图书馆的概念 数字图书馆产生以来,引发了全世界许多学者对其概念的研究和探讨,这期f b j 出现了各种各样的认识和提法,但由于数字图书馆涵盖的内容相当广泛,所以至今 仍没有一个统一的、明确的定义。 美国研究图书馆学会( a r l ) 曾归纳出的数字图书馆的5 个定义要素为: ( 1 ) 数字图书馆不是一个单一实体; ( 2 ) 数字图书馆需要使用技术来连接众多资源; ( 3 ) 对最终用户而言+ ,多个数字图书馆和信息服务之间的链接是透明的; ( 4 ) 广泛地存取和信息服务是数字图书馆的一个目标; ( 5 ) 数字图书馆馆藏并不局限于替代文献,其范围扩展至不能以印刷形式表达和 分发的数字人工制品1 1 j 。 通过对多种数字图书馆定义的分析和比较,我们认为要想确定数字图书馆的概 念,首先要明确其特征: ( 1 ) 数字图书馆是一个分布式的图书馆群体( 分布式存取) ; ( 2 ) 数字图书馆是与平台无关的数字化资源的集合( 资源共享) ; ( 3 ) 数字图书馆具有强大的信息传播与发布功能( 传递网络化) ; ( 4 ) 数字图书馆是面向对象的数字化多媒体信息库2 4 1 ( 信息数字化) 。 在此基础上,我们提出一种数字图书馆的定义:以计算机可处理的、海量有序 的数字信息为基础,以网络传递、分布存取为依托,实现了不受时空限制、智能检 索、全球资源共享的多功能系统。 华中科技大学硕士学位论文 1 2 2 国内外概况 1 2 2 1 国外数字图书t 宦研究状况 数字图书馆的建设已成为当前评价一个国家信息基础水平的重要标志,近年来 许多西方国家都非常重视数字图书馆的建设早在1 9 8 7 年,美国就率先在这一领 域丌始了工程性研究,一些早期的项目包括卡内基梅隆大学的m e r c u r y 数字图书 。 馆计划( 1 9 8 7 1 9 9 3 ) ,康奈尔大学的c o r e 计划,以及当时在美国最有影响的“美国 记忆( a m e r i c a nm e m o r y ) 计划【6 j 。 1 9 9 4 年起,美国又发起了一项为期四年的数字图书馆预研工程d l i ( d i g i r a l l i b r a r yi n i t i a t i v e ) ”“j ,该工程资助了六个子项目,分别以六所科技领域及图书馆服 务较好的大学做基地实验【9 】,其主要目标是探索数字图书馆的基础构架,寻求最佳 的信息资源提供模式,研究数字图书馆之间交互操作的协议,测试最有效的用户操 作界面等。d l i 一期工程于1 9 9 8 年8 月底结束,它涵盖了大规模文献库、空间图 像库、地理图像库、声源资料库,所取得的成果引起了世界范围内各国政府和有关 社会的关注。 美国开展数字图书馆建设之后,英国、加拿大、日本、德国、意大利等国也相 继投入巨额研发资金建设本国的数字图书馆,并开始了全球性的合作项目f m j 。在众 多的国际合作型数字图书馆计划或项目中,以“g 8 数字图书馆联盟计划”和i b m 公司的数字图书馆方案最为著名】。 g 8 数字图书馆联盟计划 美、英、法、同、德、加、意、俄等8 个国家的国家图书馆组成g 8 数字图书 馆联盟,开始实施“g 8 信息社会小型实验计戈u ( g si n f o r m a t i o ns o c i e t vp i l o tp r o j e c t n 其目标是以现有的数字化项目为基础,构建一个人类知识的虚拟馆藏,通过网络为 公众取用,其内容将涵盖各国的历史、文化藏品精华及旅游资源库等,并预计在2 0 0 0 年前后以广域网为载体,推出“全球数字图书馆”m 】。 i b m 公司的数字图书馆方案 1 9 9 6 年,i b m 公司推出其数字图书馆方案的第版。它是一套可伸缩的多媒体 管理方案,能将音频、视频、图像、文本等信息转换成数字化形式,并通过因特网 向全球发行,包括内容的创建和获取、存储和管理、检索及查询、信息发布、权限 华中科技大学硕士学位论文 管理等五项功能。i b m 公司的数字图书馆方案是目前世界上唯一商品化的数字图书 馆系统,印第安纳大学图书馆、洛杉矶市立图书馆、梵蒂冈图书馆、佛罗里达州立 图书馆以及国内许多图书情报机构都采用了i b m 公司的数字图书馆方案。 除了以上介绍的这些,还有美国的“数字式图书馆联盟计划”、英国的“存取 创新”计划、同本的“关西图书馆计划”等也非常具有代表性i 。 另外,早在八十年代,k a h n 和c e r f 就提到了完全由自治实体组成的数字图书 馆,上述美国d l i 工程中密歇根大学( u n i v e r s i t yo f m i c h i g a n ) 数字图书馆的设计就 是基本上采用代理的术语来描述的【15 。” 。实际上,代理已在多个数字图书馆项目中 得到应用,比较典型的系统有u m d l i ”】、m e d o c ,以及z u n o d l 等: 密歇根大学数字图书馆( u m d l ) 是第一个运用一系列代理作为基础体系结构 的数字图书馆,它的核心技术是通过建立代理结构去合并各种分散的资源,进而提 供复杂的服务。其系统平台由一组软件代理组成,主要包括用户界面代理( u s e r i n t e r f a c ea g e n t s ) 、中间代理( m e d i a t i o na g e n t s ) 和l 资源代理( c o l l e c t i o na g e n t s ) 【1 7 jo 用 户界面代理的功能为询问用户需要的内容及内容的广度和深度,这样就使得用户可 以指定自己的偏好,系统能根据此偏好设置返回给用户一些让用户感兴趣的结果: 中间代理的功能是根据从用户界面代理得到的查询命令,合理地安排对网上资源的 查询,使得用户可以同时查询到很多家图书馆;资源代理则用于与各地的数掘库相 连接它不仅能查询各种包含文字、图像、图形、视频、声频的数据库,还能控制 内容的发布和对使用有复制权的资料进行收费。 多媒体电子文档( m e d o c ) 系统是德国的一个服务于计算机科学领域的电子图 书馆i ”j ,它也是采用代理技术实现的。然而,这些所谓的代理是“可见的”代理( 即 提供者和用户代理) ,并且m e d o c 的设计者没有将一些具体特殊的任务设计成用代 理的方式来实现。此外,m e d o c 系统的工作领域比较狭窄。 z u n 0 数字图书馆( z u n o d l ) 是一个建立在商业构架上的数字图书馆f ”1 。 z u n o d l 的体系结构仅仅以- d , 型系列代理为基础,它们描述了三种类型的角色: 7 e 产者、协调者和消费者。相比其他的数字图书馆模型,这是较简单的体系结构。 122 2 国内数字图书馆研究状况 我国从1 9 9 7 年开始跟踪国际“数字图书馆”的研究动态,对数字图书馆系统涉 华中科技大学硕士学位论文 ! = ! ! ! ! = = ! = ! ! ! ! = ! ! = ! = ! ! ! ! ! = = ! ! = = ! ! ! ! = = ! ! ! = = ! = ! = = ! ! = = ! = = ! ! ! 及的技术、管理、运营、法律等问题展开了研究;设立了“中国数字图书馆示范系 统”,从而为中国数字图书馆工程的全面实施奠定了良好的基础2 0 l 。由文化部报国 家计委立项、国内6 家公共图书馆参与的“中国试验型数字图书馆”项目的实施是 我国数字图书馆建设的一个开始标志。 中国试验型数字式图书馆 中国试验型数字式图书馆( c p d l p ) 项目的目标是建立一个多馆协作、互为补充、 联合、一致的中国试验型数字式图书馆,实现由多类型、分布式、规范化资源库组 成的一个试验型数字图书馆】。项目计划开发完成一套与国际接轨的数字式图书馆 实现技术,包括:建立以s g m l 为基础的对象描述和编辑系统,建立统一的元数据, 组织开放体系结构的数字式对象库,建立通用的库访问协议,设计并实现方便的网 络用户界面与实用的系统管理界面,数字式对象的描述方法要支持不同源的分布式 查询和检索,初步实现对超大容量数据库的快速检索,支持中英文屏幕界面,试验 建立多种类型的规范化信息库等,以使该项目在因特网上提供试用性的服务等等。 知识网络一一数字图书馆系统工程项目 该项目是1 9 9 8 年国家“8 6 3 ”攻关项目【6 】,目标是实现数字图书馆体系结构的 设计与丌发,初步建立一个中国试验型数字图书馆系统。该系统要构筑在因特网坏 境上,包含多个分布式数字资源库,采用人工智能技术,实现横跨多个资源库的快 速查询。该项目的成果将直接应用在中国数字图书馆工程建设中。 国家教育部数字图书馆攻关计划 该计划主要研究数字图书馆的结构、检索机制以及相应的标准规范:图文信息 联合导读学习系统;数字音乐图书馆雏形和一个小型的数字化视频数据库示范系 统。目前,华南理工大学已经研制成功s c u t 视频数字化图书馆,存储有近1 0 g 的 视频剪辑信息。 对于我国来说,数字图书馆的研发虽然起步较晚,但近几年也取得了不小的成 绩,然而,研究和建设数字图书馆的必要性和紧迫性依然存在2j , 2 2 j 。 华中科技大学硕士学位论文 1 2 3 主要关键技术 12 31 基于代理的体系结构 如何设计一个灵活的多代理系统模式,使之适应海量、动态变化的数字信息, 上述的几个基于代理的模式在这个方面能给我l f j 提供一些有益的借鉴眇2 ”。 设计的系统模型希望在能够满足我们想要解决的两个主要问题的基础上,同时 又具有如下功能: 整合:可从多个信息源获取资料,并同时提供给用户一个完整的结果: 保存:可保存查询过程和结果,以便于下一次查询; 更新:监视指定的对象,同时当对象更新后自动报告: 可扩展性:系统应具有良好的可扩展性,针对系统的新功能而添加的代理能 够无缝地集成到原有的模型中【2 8 。30 1 。 123 2 多代理协作 多代理的系统和集中式的系统不同,集中式的系统强调将一个复杂的问题分解 成多个子问题来解决,而基于代理的系统则强调如何让多个代理协同工作来解决复 杂的问题【3 1 1 ”】。充分利用代理间的协作特性,能让整个系统具有更高的灵活性。 在基于代理的数字图书馆系统中,代理之间如何相互通讯、相互交流,形成协 作组并联合起来完成指定的任务就显得非常重要。要形成协作组要满足两个基本条 件:第一,代理必须以互相能够理解的方式描述各自的能力;第二,各代理问需要 互相通信以协商任务”“j 。 1 2 33 系统扩展性 数字图书馆系统对用户提供的功能会随着系统的深入应用而发生变化,且这种 变化主要表现在系统增加对终端用户提供的服务数量和方式上。因此,在数字图书 馆系统的设计中,采用怎样的系统模型爿能使得系统容易维护,并能无缝集成新加 入的服务是一个需要解决的难题 3 8 - 4 1 】。 数字图书馆中的其他关键技术还包括如何准确获取用户所表达的搜索意图,同 华中科技大学硕士学位论文 时结台用户的偏好设置,过滤无关信息,缩小或精确用户查询的范围等等。 1 3课题主要研究工作 13 1 研究设想和方法 本课题主要研究基于多代理框架的数字图书馆模型,通过分析和比较多种已有 的数字图书馆系统模型,提出自己的图书馆系统的整体组织框架,同时研究多个代 理之f b j 的通讯和协作技术,并对数字图书馆中代理间的协作给出了具体的实现模 型。 1 3 2 主要工作及预期结果 主要工作有如下几点: ( 1 ) 分析比较几种具有代表性的基于代理的数字图书馆模型; ( 2 1 提出我们的基于多代理结构的数字图书馆( m a d l ) 模型方案; ( 3 ) 分析代理间的协作技术,利用协作技术进一步完善m a d l 模型: f 4 ) 采用j a d e 实现系统原型,其中包括实现多个代理原型。 1 3 3 本文的组织 本文主要是说明基于多层代理的数字图书馆模型的建立。 第二章概述了代理的性质、分类,同时对多个数字图书馆系统进行了对比研究, 并初步分析了数字图书馆的系统需求。 第三章提出m a d l 系统模型,详细描述了系统的整体结构和各个代理的主要 功能,并具体分析了两个系统实例。 第四章描述了多个代理之间进行通讯协作的方式,以及由此所采用的代理的内 部结构,最后仍然通过分析一个实例来进行说明。 第血章则详细介绍了代理的实现方式。 华中科技大学硕士学位论文 2 数字图书馆理论及模型分析 本章首先介绍了代理的概念及其性质,并对软件代理的分类体系进行了描述: 然后对代理间的协作问题做了简要的阐述;接着就数字图书馆的应用进行了初步的 需求分析;最后,介绍并比较了多种已有的数字图书馆模型。 2 1 软件代理 211 代理的概念 将任务分散到大量专门的、细粒度的模块上完成,提高了模块性、灵活性和可 扩展性:新的服务可以随时增加或撤出,而不影响整个系统,这样的模块被称为代 理( a g e l l t ) 。代理具有以下些特征1 3 6 】: ( 1 ) 自治性( a u t o n o m y ) :代理封装一种或多种严格定义的服务,完成一项专门的 任务,具有本地自治性,代理可以在没有人或其他代理直接干预的情况下运作,而 且对自己的行为和内部状态有控制能力; ( 2 ) 社会。1 2 t ( s o c i a l i t y ) :代理和其他代理可以通过代理语言进行信息交流;由于代 理是自动的、自主的,它们之间必须相互协调以互相存取资源,互相调用功能。代 理具有通用的通信界面,可以多种方式与其他代理协作; ( 3 ) 反应性( r e a c t i v i t y ) :代理能够理解周围的环境,并肘环境的变化做出实时的 响应: ( 4 ) 能动性( p r e a c t i v e n e s s ) :代理不仅简单地对其环境做出反应,也能够通过接 受某些启动信息,表现出有目标的行为。 2 1 2 代理的分类 21 2 1 代理的总体分类 软件代理按照其用途不同可细分为如图2 1 所示的几种类型。 华中科技大学硕士学位论文 图2 1 代理的类别 程序代理是系统设计者脑海中一个抽象的概念,一个程序代理相当于能够完 成所委托任务的一个自治实体。 网络代理是能充分利用网络进行通讯协作,并可在多个节点之间自由移动的 自治实体。 用户代理是面向用户为用户提供具体服务的代理,这类代理一般需要和用户 进行交互。 a信息代理:帮助用户处理没有很好组织、高度动态的信息空r b j 。在w w w 的使用中已开发出了一些信息代理原型1 2 64 2 朋j : b任务代理:帮助用户执行一些个人或组计算相关的任务,这些代理和用户 程序并发执行,观察用户的行为并自动化一些动作 4 4 , 4 5 1 : c 合成代理:通过引入类似生命体的一些特征,使与人的交互环境更人性化, 主要实施在娱乐以及学习方面【4 6 】。 值得指出的是这种分类方式只是对代理在概念上的一个区分,一个具体的代理 实例可能同时隶属于两个或两个以上的分类范畴。比如,一个用户代理可能具有网 络代理的特点能够在多个网络节点间移动,同时它还能是一个用户代理能够完成用 户指定的任务。 2 ,1 2 2 用户代理 由于数字图书馆所管理的信息具有海量、复杂和动态变化的特征,因此在这些 华中科技大学硕士学位论文 可用的信息中查找到用户需要的资源是一个比较困难的问题,一种解决方法就是采 用我们在数字图书馆模型m a d l 中引入的用户代理的概念。 依照s a n c h e z 提出的分类方法1 8 j ,我们将半自治,并且可由用户自己获得的实 体称为用户代理。以用户代理和委托为基础的是一种大有前途的人机交互界面,这 种界面被认为是对当前基于浏览和直接操作的人机界面的一种补充。在信息量非常 大的信息空间,代理能显著减小终端用户所面临的复杂性和信息过载。 用户代理还能够根据用户的指示帮助用户完成任务,能够委托给用户代理帮助 完成的任务包括: 当用户感兴趣的信息增加或更新时通知用户; 根据用户的需求或偏好过滤搜索取回的数据: 执行常规的管理任务。 用户代理应具有如下性质: 用户控制:即使用户代理趋向于以自治的方式执行任务,这些任务应该由用 户显式或隐式地发出,用户可以在任何时候指派、挂起、恢复和取消代理任务: 可观察:用户代理应该能够响应用户的指示,同时能够向用户提供任务当j u 的状态;并且代理能够提供参考意见,允许由用户作最终的决定; 适应性:用户代理应能适应动态变化的需求和用户的偏好,应该能够提供方 法表示和维护这些信息; 可恢复性:当发生系统故障时,指派给代理的任务可能会被中断,代理应能 采取适当的措施当系统正常工作后恢复被中断的任务; 交互性:数字图书馆中的代理应能感知其他活动代理的存在和角色,能有效 地和其他代理通讯,协作完成任务或减小相互干扰的可能性;同时,多个代理之问 应有一个共同的通讯协议。 2 1 3 代理之间的协作 在由代理组成的系统中,复杂的任务需要多个代理互相协作,形成协作组来共 同完成 “i 。要形成协作组,第一,代理必须以互相能够理解的方式描述各自的能力: 第二,、各代理问需互相通讯以协商任务。 代理之间的协作可以采用两种模式:分布式协作模式和集中式协作模式。分向 华中科技大学硕士学位论文 式的解决方法通常要求每个代理或每个对象实体自身维护一个f s i b ( f l l n c t i o n s e r v i c ei n f o r m m i o n b a s e ,功能服务信息库) ,该库中应有全部对象实体的功能服务信 启、。当一个对象实体加入系统时,应向所有已存在的代理或对象实体注册其功能服 务信息,相应的在退出系统时应予以注销。由于要维护大量冗余信息,系统的丌销 是惊人的,这种方法通常只适用于代理数量较少相对固定的分布式系统。 在代理集中式的协作模式中,系统维护一个统一的f s i b ,该库通常由一个独立 的公共实体b r o k e r 负责维护。当一个对象实体初次加入系统时,要向f s i b 早注册 其功能服务信息,相应的在退出系统时应予以注销。当某个代理需要其他代理协作 时,则查询b r o k e r ,由b r o k e r 给出目的代理,之后两个代理之间就能建立直接的通 讯连接。 2 2 系统需求分析 目前i n t e m e t 上信息资源利用的主要问题是: 1 互操作问题 i n t e m e t 上的信息资源是由分布在各处的各种各样大大小小的信启、仓储构成的, 小到个人的信息收减,大到一个单位的企业数据库、专业的联机检索系统、大学图 书馆,以及搜索网站都是信息仓储的实例。每个仓储都是一个相对独立的信息空间, 具有各自的信息组织方式和处理方式,以不同的查询方式提供使用,具有不同的权 限保护和收费策略。用户信息需求的满足往往需要查询多个仓储才能完成。在传统 图书馆中,用户在图书馆员的帮助下完成检索任务,而图书馆员熟悉每一个信息源 的特性。在网络信息环境下,了解每一仓储的特性并掌握其检索技术的工作转移到 了每一个用户的身上,这无疑是一个沉重的负担。如何屏蔽分布的各仓储间的差别, 提供一致的检索界面和检索技术,由系统自动执行跨仓储的检索,在仓储间不同的 信息格式、检索方式等方面进行转换,就是互操作要解决的问题。这一问题又称为 仓储的联邦。 2 查找困难 目前,网上最常用的检索手段是关键词全文查询。大多数搜索站点用搜索引擎 ( w e b c r 州l e r ) 将收集到的所有网页不加区分地进行全文索引,以此为基础提供全文 - _ _ _ _ _ _ _ ,_ - _ _ 一 华中科技大学硕士学位论文 关键词检索,对用户的一个查询常常响应以成百上千条记录。查找困难的根本原因 在于信息仓储中的数字化信息缺乏良好的组织结构,并缺乏可以根据用户所需自动 过滤搜索结果集的模型。恰如一个没有合理的分类体系、不进行严格编目控制、缺 乏统一的主题词表的图书馆,馆藏再丰富也无异于一座堆放资料的仓库。在信息的 存储地一一信息仓储中为数字化信息提供合理、有效的组织框架,并施以筛选、标 引、索引、联合等控制是为用户提供高效、准确的检索和无限漫游的基础。 2 3 多种模型的比较 23 1 信息总线| n f o b u s i n f o b u s 是一个虚拟的软“总线”结构,各异构的仓储、服务和界面如同插件 一样插入到信息总线中,集成在一起,如图2 2 所示。i n f o b u s 实际上是一个基于 c o r b a 的分布式对象系统,其间的交互协议是d l l o p 。d l i o p 组织跨仓储的访问 和查找,对新增加的用户界面和查询翻译的支持由一个元数据结构来实现。异构的 仓储封装在图书馆服务代理( l s a ) 之中,向客户程序尽量屏蔽其异构件。组建到 i n f o b u s 中的图书馆服务( l s ) 提供所需的支持功能,如查询翻译,元数掘工具和权限 管理等。 ph 7 - 镑议巩 c 馨户缕f :l s 图书馆崩务 1s t 鲁窟,史i 晕ff - sj 啬毫处迁月g 釜 幽2 2i n f o b u s 模型 华中科技大学硕士学位论文 这种模型使代理之间能够达到完全得松散耦合,新的代理只要和所要替换的代 理对外部的接口相同就能很容易地替换,在这一方面模型的可扩展性比较好。但是, 这种模型也存在一些问题,比如在模型中由于过分地强调松散耦合,所以代理之阃 是平行的关系,客户必须和单独的图书馆服务代理( l s a ) 打交道,当进行查询时, 客户接口( i c ) 必须逐个和涉及到的l s a 交互,这样就使得i c 必须掌握每个l s a 所 维护的知识,没有达到完全的独立。另外,c o r b a 中主要是基于固定的接口编程, 对于后加入的代理提供的新的存取界面,原有的客户不能访问。 23 2u m d l 模型 在u m d l 中,所有的成员都被封装在代理中,代理们互相协作以共同完成任 务。因此,在u m d l 构架中,核心的任务是找到合适的信息和服务的组合以满足 组成员的目标。例如,回答某用户的查询,找到某出版者的潜在用户,或者是执行 一系列的格式转换服务。在这些例子中,最基础的活动是以最小的代价搜索有用的 内容或服务。用户的查询在u m d l 中被处理的过程可分为三个阶段:首先,用户 的u i a 根据代理对自己的c l 描述来确定合适的搜索兴趣域,这一阶段称为兴趣域 查找;然后,u i a 与被识别的c 1 a 联系,在该收藏中搜索满足用户需求的文档,这 一阶段称为指定兴趣域查找:最后,在c o n s p e c t u s 收藏之前,还需找到对查询过程 进行筹划和协调的中介代理。 u m d l 是基于代理的数字图书馆,其体系结构的最大特点是模块性和灵活性。 整个数字图书馆的构建如同用各式各样的代理构件来搭积木,降低了系统的总体复 杂度,使得系统具有可伸缩性和可扩展性。分布式的代理结构符合数字图书馆资源 和服务分教的特点。代理具有高度的自主性,通过相互之间的协作以完成复杂的任 务,可以随时增添新的代理或撤出已有的代理,满足数字图书馆的内容和功能不断 变化的需求。 该模型是我们重点要参考的模型,其结构实现了完全的代理化,然而在这个模 型中有一点混淆代理和模块的概念,没有强调和利用代理的自主性这一代理的本质 特征,同时搜索的区域由丌始的c l 设定所限定,不能自动适应用户新增加的兴趣。 2 3 3 z u n o d l 模型 z u n o 数字图书馆是一个面向商业运转的框架,如图23 所示。整个框架仅基 华中科技大学硕士学位论文 于一小系列代理,图书馆中有三种角色:生产者,协调者和消费者。 謦一二参= j_ 一二。+ j g u 刚? 誊垄, 。j :、5 a f i 长。 l _ i 亘葫酌z ,。d l i c c 幽2 3z u n o d l 剀书馆模型 生产者:相当于信息的所有者,可以是组织也可以是个人。每个生产者都对应 两个代理,图书馆服务代理( l s a ) 和编目代理( c a ) 。 协调者:类似于经纪人,在生产者和消费者之间起协调作用。承担中闻工作的 代理有搜索代理( s a ) 。 消费者:图书馆的终端用户。通过w e b 界面使用图书馆提供的服务。主要由用 户界面代n ( u i a ) 负责处理。 该模型将图书馆中的几个角色采用代理的方式来完成,强调了代理的角色特 性e 同时,这个模型和以上两个模型有所不同,它是一个狭义上的数字图书馆,主 要针对具体的图书馆系统。 2 4 小结 本章对文中需要使用的代理的相关概念和问题进行了简要回顾,比如代理的分 类问题,其中如代理间协作的讨论详见后续章节。 在本章的后半部分,我们比较了几种已有的数字图书馆模型,分析了每种模型 1 4 华中科技大学硕士学位论文 的优缺点。值得指出的是,本章中这几种模型已经投入了实际的使用,使我们能够 了解到数字图书馆系统在实际使用中遇到的困难,借鉴这些图书馆系统设计和运行 过程中得到的经验教训,为下一章中提出我们自己的模型奠定了基础。 1 5 华中科技大学硕士学位论文 3 多代理数字图书馆模型m a d l 本章我 i f x , t 设计自己的图书馆模型给出了具体的思路,提出了一个基于多代理 结构的数字图书馆的总体框架,并依次对模型中的各个代理的角色进行了说明,最 后,我们给出模型中几个典型用例的流程。 3 1m a d l 模型设计思路 3 1 1 用户代理的组织 首先我们讨论一下用户代理的组织问题,即采用何种方式的组织形式能够使数 字图书馆模型具有较强的可扩展性。 用 户 代 理 库 l 八管理科序 jf 刖j ,代珲j1 1 第1 组代理 f 八 e l 八 ff 用户代理_ j ) 第n 组代理 ! 弋 i 第l 利i | 歧务叫 f用j 1 :第n 利服务一 图3 1 用户代理的软件框架 我们提出了用户代理库的概念,如图3 1 所示。系统的设计者可以为系统设计 多种类别和用途的用户代理,统计存放在用户代理库中。当用户来选择特定的服务 时,通过管理程序将代理库中的多个代理组合起来形成代理组,来共同完成用户指 定的服务,代理库管理程序组合代理的知识可通过脚本的形式进行定义。 这种组织方式使得系统扩展新的功能变得比较容易。如果仅是替换已有的代理, 则系统的维护者只需将用户代理库中的老代理替换处理即可:如果是添加新用途的 华中科技大学硕士学位论文 代理,则需要更新代理库维护程序的脚本,同时采用组合的方式,能够较好地重复 利用已有代理的功能,减小系统的维护成本。 3 1 2 初步分析 首先,我们来讨论一下整个模型中代理的角色和组织问题。每个代理在数字图 书馆模型中所扮演的角色是不同的,它们可分为三种类型:用户代理,功能代理和 注册代理,如图3 2 所示。用户代理一般驻留在用户的本地机上,参与和用户之问 的交互,了解用户的意图:功能代理主要充当数字图书馆系统中的一定角色,完成 系统的对外服务,或是系统内部资料的整理和维护工作:注册代理则是所有代理之 恻的结合点,通过注册代理,各代理之间能够发现并与所需功能相关的代理进行通 讯,实现代理间的合作,完成用户指定的任务。 它们之间的大致关系如图3 2 所示。采用这种角色定位的方式能够方便对系统 的设计和维护,每个代理只属于三种角色中的一种,职责分明。 32m a d l 模型 乞代仁。仁代i ou 汐: 幽3 2 代理角色分类图 根掘上文中对系统的需求分析,同时结合我们的设计思路,我们提出了1 、基 j 一多代理结构的数字图书馆总体模型。 华中科技大学硕士学位论文 用户 幽3 3 总体模型 模型结构如图3 3 所示,注意到在图的底部,一些数据源被整合到系统中。我 们把这些数据源和其相应的局部搜索代理( l s a ) 封装在一起,一个数据源和它的 l s a 一起被称为一个“信息站点”( i n f o r m a t i o ns i t e l ,这之后我们允许系统中的其他 组件对该数据源进行访问。在更高的级别上,一系列局部搜索代理又被一个全局搜 索代s 里( g s a ) 所管理。全局搜索代理是那些可以被系统中的其他全局搜索代理和用 户查询代理( u q a ) 所访问的代理。当u q a 发出一个请求时,系统首先根据用户的 需求选择一些被认为是最适合满足这些要求的g s a ,然后连接这些g s a 所管理的 l s a 以便寻找符合的文档;这些从不同数据源中找到的文档在被传送给结果表示代 t 里( r p a ) 之的,要先进行合并操作( 通过结果整合代理) ;最后由p a 选择一个最恰当 华中科技大学硕士学位论文 的表现方式将搜索结果呈现给用户。 3 3 模型框架说明 从总体结构来看,系统可以看成是由三层结构所组成:最上层是一个唯一的注 册代理( r a ) :中间层是全局搜索代理( g s a ) :最底层是局部搜索代5 望_ ( l s a ) 。从上到 下,每一层的全局性呈显递减状态。 下面我们就讨论一下m a d l 系统中各个主要代理的定义和作用,通过对模型 中多个代理的角色描述刻画系统的功能。然后我们给出几个系统用例进一步阐述系 统的运行过程。 3 3 1 系统组成 该系统主要由六个代理所组成:注册代理( r a ) ,全局搜索代理( g s a ) ,局部搜 索代理( l s a ) ,用户查询代i r 哩- ( u q a ) ,结果表示代理( r p a ) 和事件监控代理( e s a ) 。 3 3 1 1 注册代理( r e g i s t r a t i o na g e n t ) 为了方便各代理查询其他代理的相关信息,同时减轻维护这些信息的负担,我 们的图书馆模型采用统一管理的方式,设计了注册代理。注册代理负责维护一个关 于数字图书馆系统中所有代理的内容和能力的数据库,所有的代理都可与注册代理 通过a c l 协议来通信。 注册代理是唯一的,并且是系统中最先建立的服务,它基本上提供了两种类型 的操作:注册和搜寻。前一个操作用于更新系统中有用服务的记录,后一个操作允 许某个代理寻找特殊种类的其他代理。r a 的基本任务有: 为每一个服务保持一个注册记录; 监控整合模块的操作; 允许任何代理识别系统中所有其他有用的服务。 当一个新的服务被创建并整合到系统中时,它首先

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论