




已阅读5页,还剩73页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 随着信息技术的发展,数据仓库( d a t aw a r e h o u s e ) 技术己被广泛应用于现 实生活的各个领域,这不仅大大提高了信息的使用效率,而且也为实际的生活带 来了极大的便利。然而当前的数据仓库还存在着许多不足之处,它建立在传统的 数据库管理系统( d b m s ) 平台之上、采用的是c s ( c 1 l e n t s e r v e r ) 结构,这种 结构的单一性暴露出许多问题,如建立和维护成本高、系统的协调性和兼容性差、 可移植性不好、智能性不高等等。 而智能a g e n t 正是当前国内外研究的热点,本文在分析了a g e n t 的特性及众 多优势之后,结合当前盛行的w e b 技术,提出了基于a g e n t 的w e b 数据仓库思想。 这种新型的数据仓库系统弥补了传统数据仓库的不足之处,它界面友好、使用方 便,在实际应用中,可以大大减少数据传输过程中网络流量,合理实现异构数据 源的数据集成,为数据仓库的开发起到一定的抛砖引玉的作用。论文研究的主要 内容与成果包括三个方面: 第一,详尽分析了w e b 技术在数据仓库系统中的应用,在传统数据仓库系统 基础上,引入x m l 技术,通过i n t e m e t 对广泛分布的异构数据源进行整合,提 出了一种新型的w e b 数据仓库模型。并研究了该结构的基本过程和功能。 第二,讨论了在w e b 数据仓库中引入a g e n t 技术的重要性,详细探讨了将软 件a g e n t 引入到数据仓库及网络中各服务器端所实现的新型功能,以及在网络数 据仓库中多a g e n t 系统之间的协作机理。 第三,将系统应用到网上教学中加以实现,不仅提出了新型基于a g e n t 技术 的网上教学模式,而且对网上教学的协作机理和个性化评价进行了详细研究,最 后提出了教学系统中智能选题的程序实现方法及多a g e n t 之间协作的实现代码。 关键词:智能a g e n t ,x m l ,数据仓库,个性化评价,选题策略,试题库 a b s t r a c t w i t l lt h ed e v e l o p i n go f t h ei n f o r m a t i o nt e c h n o l o g y ,d a t aw a r e h o u s et e c h n o l o g y h a sb e e nw i d e l yu s e di na l lk i n d so fa s p e c t so fl i f t ,w h i c hn o to n l yi m p r o v e st h e e f f i c i e n c yo ft h ei n f o r m a t i o nu s i n gb u ta l s ob r i n g st r e m e n d o u sa d v a n t a g et ol i f i 。 t h o u g ht h e r ea r es o m es h o r t a g ei nd wa tp r e s e n t ,w h i c hi sb a s e do nt r a d i t i o n a l d b m s b ya d o p t i n gt h ec ss t r u c t u r e 。i nt h es i m p l e xs t r u c t u r e ,m u c hf l a w i se x p o s e d , s u c ha st h eh i g hc o s t 、t h eb a dh a r m o n ya n dc o m p a t i b i l i t y 、t h ee c u m e n i c a l t r a n s p l a n t a t i o na n d t h el o w i n t e l l i g e n t i z i n g 。 t h o u g ht h ei n t e l l i g e n ta g e n tt e c h n o l o g yi st h eh o t s p o ti nt h ef i e l do f c o m p u t e r 。 a f t e ra n a l y z i n gt h ec h a r a c t e ra n dt h ea d v a n t a g eo fa g e n t ,a n dc o m b i n i n gw i t h p r e v a i l i n gw e bt e c h n o l o g y ,t h i sp a p e rp r e s e n t sat h i n k i n go fw e bd a t aw a r e h o u s e s y s t e mb a s e do na g e n t 。w i t hi t sf r i e n d l yi n t e r f a c ea n dc o n v e n i e n tu s a g e ,t h en e w s y s t e mc a nr e d u c et h eq u a n t i t yo fd a t at r a n s m i s s i o ni nw e ba n dr e a l i z et h ed a t a i n t e g r a t i o no fi s o m e r o u sd a t as o u r c e 。a l lw h i c hh a sb r i n gan e wm e t h o df o rf a r t h e r d w e x p l o i t u r c 。t l l i sp a p e rp r o b e si n t ot h ea b o v ep r o b l e m s t h em a i nc o n t e n t sa n d r e s e a r c hp r o d u c t i o n si n c l u d e3a s p e c t sa sf o l l o w s : 1 d e t a i l e d l ya n a l y z et h ea p p l i c a t i o no f ,e bt e c h n o l o g i e si nd w ab a s e do n t r a d i t i o n a ld w ,b yi m p o s i n gx m la n dc o r r e l a t i v em i d d l e w a r ea n di n t e g r a t i n g i s o m e r o u ss o u r c eo fw i d e l yd i s t r i b u t i n gd a t eb ym e a n so fi n t e m e t ,p a t e rp r e s e n t sa n e w m o d e lo f w e bd w 。w h a t sm o r e ,w er e s e a r c hb a s a lp r o c e d u r ea n df u n c t i o n 。 2 d i s c u s st h ei m p o r t a n c eo fi n t e l l i g e n ta g e n ti m p o r t i n gw e bd w ,a tt h es a l n e t i m e ,d e t a i l e d l yd i s c u s st h en e w - s t y l ef u n c t i o nb r o u g h tb ys o f ta g e n ti m p o r t i n gd w a n dw e bs e v e r s ,f u r t h e r l ye x p l o r et h es y n e r g i cm e c h a n i s ma m o n gm u l t i a g e n ti nw e b d w 。 3 b ya p p l y i n gt h es y s t e mt ow e bt e a c h i n ga n dr e a l i z i n g ,p a t e rp r e s e n t sa n e w m o d e lo fw e bt e a c h i n gb a s e do na g e n ta n dr e s e a r c h st h es y n e r g i cm e c h a n i s m a n dt h ei n d i v i d u a t i o ne v a l u a t i o ni nw e bt e a c h i n gd e t a i l e d l y 。a tl a s t ,p r e s e n t st h e m e t h o da n da l g o r i t h mo fi n t e l l i g e n tc h o o s i n gp r o b l e mi nt e a c h i n gs y s t e ma n dw r i t e s o u ts o m ec o d eo f c o o p e r a t i o na m o n gm u l f i a g e n ta k e yw o r d s :i n t e l l i g e n ta g e n t ,x m l ,d w , c h o o s i n gp r o b l e m ,w a r e h o u s eo f p r o b l e m s a i i i i n d i v i d u a t i o ne v a l u a t i o n ,s t r a t e g yo f w f i r e nb y :w a n gc h e n gh u a d i r e c t e db y :p r o f l i a n gs h e nz h u o 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得南昌大学或其他教育机 构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献 均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:歹囊i 笋签字日期:吖年月厂日 学位论文版权使用授权书 本学位论文作者完全了解 壹量圭鲎 有关保留、使用学位论文的规定, 有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和 借阅。本人授权南昌大学可以将学位论文的全部或部分内容编入有关数据库进 行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:互稚宇导师签名 签字日期:弘。,年,月日签字日期: 学位论文作者毕业后去向 工作单位: 通讯地址: 馨笋均 j 呻俘善月- ) 日 电话: 邮编: 南昌大学硕士学位论文基于a g e n t 的w e b 数据仓库系统研究 1 1 背景 第一章绪论 随着信息技术的发展,许多企业已经或正在建立自己的信息系统:信息的收集 和处理水平体现了企业的管理水平以及竞争实力。数据的大量积累和少量的有效利 用致使多数企业处于“海量数据”和“信息贫乏”的不利境况。数据仓库( d w ) 技 术的出现给这一问题提供了一种较好的解决方案。目前数据仓库是建立在传统的数 据库管理系统( d b m s ) 平台之上,采用的是c s 结构,其客户端工作包括交互式查询 以及结果和报表生成,是一个“胖”客户端1 2 j ;服务器端完成各种辅助决策的s q l 查 询、复杂的计算和各种综合功能。 然而随着信息技术的发展,对数据仓库的应用提出了更高的要求。传统的两层 c s 结构已经不能适应日益增长的跨地域、跨平台的信息分析的需要,暴露出较多 的问题,主要体现在以下几个方面f 8 】口9 】: ( 1 ) 客户服务器体系结构的建立和维护成本很高,而且系统的协调性、兼容性不好; ( 2 ) 单一用户界面不足以支持众多用户的使用; ( 3 ) 随着i n t e r n e t i n t r a n e t 的发展,越来越多的人希望借助于i n t e r n e t i n t r a n e t 来访问数据仓库,获得必要的信息支持,而传统的c s 结构无法满足这一需求; ( 4 ) 对客户端的要求高。客户端需要预装许多支持软件,使得系统较依赖于客户端 平台,因此系统的可移植性、伸缩性不好。 基于这些原因,人们迫切需要克服传统c s 体系数据仓库的不足之处。而a g e n t 和e e b 。技术的飞速发展对数据仓库产生了很大影响。这两者技术的结合,融入数据 仓库系统当中,可以极大的改善数据仓库的应用环境、改变最终用户对数据仓库的 使用模式。人们不再局限于通过局域网使用数据仓库,而是可以通过w e b 远程访问数 据仓库,所得的分析结果也可以借助w e b 服务器迅速发布。同时还具用很强的智能 性。这样,企事业单位就可以构建基于a g e n t 的w e b 方式的高效数据仓库系统,从而 有效地提高企业数据利用率和信息利用能力,为企业提供更有力的决策支持。推动 企业管理决策水平的提高,大大提高企业的经济效益。因而,本课题的研究具有重 要的实际应用价值。 1 2 问题的提出 目前大部分企业建立的是单一的全局性数据仓库。这种全局性数据仓库的特点 南昌大学硕士学位论文基于a g e n t 的w e b 数据仓库系统研究 是易于维护,容易保持数据的一致性。但随着企业中数据量不断增加,数据仓库就 会越来越庞大,数据仓库若完全基于单一的数据仓库,性能将十分低下。因此,基 于传统数据仓库的单一性、技术不成熟等等原因,数据仓库自身还存在许多有待解 决的问题,本文在分析和讨论了传统数据仓库的特点及不足的基础上,提出将软件 a g e n t 及w e b 技术融入数据仓库的思想,主要在于解决以下几个问题: ( 1 ) 数据仓库的数据来源于多个数据源,这些数据格式各异,而w e b 中有文本、图 像、声音等。如何选取适当的工具,以便于建立合理的数据结构,实现各个异 构数据源数据集成,是基于w e b 数据仓库必须考虑的问题。 ( 2 ) 数据仓库与分布在各处的信息源一般是通过网络联系的,网络拥挤已成为影响 集成与下查速度的重要因素,减少网络数据传输流量是亟待解决的问题。 ( 3 ) 为了维护实试图和响应用户的下查请求,数据源也要参加相应的运算,这给本 来很繁忙的事务数据库增加了额外的负担。如何替事务数据库减负,也是我们 的一个研究重点。 1 3 研究现状 现今我国的数据仓库市场仍处于概念推广阶段,由于数据仓库必须以大量的、 日积月累的数据为基础,必须以运行的、不断更新的数据库为主要来源,因此,建 立数据仓库系统,首先需要企业具有良好的o l t p 系统,来处理企业中的日常业务, 这样才能积累大量的历史数据,但我国的信息化程度还比较低,企业管理水平也参 差不齐,很多企业缺乏良好的o l t p 系统来做基础,不少单位的数据库规模还比较小, 有些单位甚至还没有完善的数据库系统,数据仓库的应用还处于初级阶段。因此, 从应用上来讲,为企业建立合理、完善、智能化的数据仓库系统在我国具有广阔的 应用前景【j j 。 从技术上来说,数据仓库技术是一种新兴技术,其本质上是一个建立在数据库 系统之上的数据管理系统【6 j 。目前,数据仓库的研究主要集中在构建数据仓库的基本 理论和方法、数据仓库的有效维护和管理、快速收集和有效存取数据、建立和完善 元数据字典以及如何向用户提供获得数据的信息等方面,对数据仓库的有效应用研 究甚少。建立数据仓库,需要开发者综合硬件厂商、数据库管理厂商、以及系统集 成商各方面的技术力量,是一项复杂的信息系统工程。 当前,数据仓库的研究还很不成熟,因此具有广阔的研究前景。而将a g e n t 、 w e b 技术与数据仓库结合更是正处于起步阶段,虽然很多单位和企业已经意识到这种 结合是数据仓库的发展趋势,但国内这方面的研究还不多。一些学校和企业已开始 着手于基于a g e n t 的数据仓库体系结构的研究,但是总的说来,大多数都是简单的 把它们联系起来,研究很不成熟:一是对该系统的具体结构研究得不是很透彻,各有 2 南昌大学硕士学位论文基于a g e n t 的w e b 数据仓库系统研究 各的观点,但都不能准确反映该体系结构的特点:二是许多单位和组织都只是对数据 仓库本身存在的问题,如安全性问题等进行研究等。 因此,随着因特网的日益普及,a g e n t 技术在各个领域必将得到广泛的应用,数 据仓库和a g e n t 、w e b 技术的结合是大势所趋,但三者结合后的各种潜在问题将会是 国内外研究的热点。 1 4 创新工作与组织 本文在分析客户机、服务器数据仓库系统同时,将智能a g e n t 技术和x m l 技术 引入到数据仓库中,提出一种基于a g e n t 的分布式w e b 数据仓库系统模型。并详细 讨论了a g e n t 技术在此系统模型中的应用。 本文的创新性工作主要体现在以下几个方面: ( 1 ) 提出了一种新型分布式的w e b 数据仓库模型。详尽分析了w e b 技术在数据 仓库系统中的应用,将x m l 技术和相关的中间件引入数据仓库,通过 i n t e r a c t 对广泛分布的异构数据源进行整合。并对该结构的良好性能进行了 全面分析,在数据访问方面,利用j a v a 计算允许异构系统共享应用和交互 的特性,给出了w e b 数据仓库良好访问模式。 ( 2 ) 设计了一个完整的基于a g e n t 的w e b 数据仓库体系结构。讨论了在w e b 数 据仓库中引入a g e n t 技术的重要性,详细分析了将软件a g e n t 引入到数据 仓库及网络中各服务器端所实现的新型功能,同时研究了在网络数据仓库 中多a g e n t 系统之间的协作机理。 ( 3 ) 将系统应用到网上教学中加以实现。提出了新型基于a g e n t 技术的网上教 学模式,针对基于a g e n t 的网上教学特点,重点讨论了系统个性化评价及 选题策略问题,最后在必要的平台圾工具的支持下,从建立系统资源库入 手,论述了一个网上教学系统实施方案。提出了教学系统中智能选题的程 序实现方法及多a g e n t 之间协作的实现代码。 本文的组织如下: 第一章绪论:简述了数据仓库研究的意义和技术背景、论文的选题依据、研究 背景以及主要的研究内容 第二章a g e n t 技术:对智能a g e n t 技术进行了详细的介绍和分析,包括其定义、 结构和特征等,讨论了多a g e n t 的机理及协作特性,分析了多a g e n t 的逻 辑框架、多a g e n t 的通信机制和方法。 第三章数据仓库( d w ) 及其相关技术:对数据仓库技术作了全面的阐述,首先介 绍了数据仓库的定义、特征。并重点说明了数据仓库体系中与之紧密相 关的联机分析处理0 l a p 及数据挖掘d m 技术本章最后通过维表和事实表 3 南昌大学硕士学位论文基于a g e n t 的w e b 数据仓库系统研究 等概念给出了一个简单的数据仓库的设计过程。 第四章w e b 数据仓库的模式分析:本文的重点章节之一。详细讨论了w e b 技术 在数据仓库系统中的应用方案,提出了一种新型的w e b 方式的分布式数 据仓库模型。并对该结构的良好性能进行了全面分析,在数据访问方面, 利用j a v a 计算允许异构系统共享应用和交互的特性,给出了w e b 数据 仓库良好访问模式。 第五章基于a g e n t 的w e b 数据仓库系统设计:本文的重点章节之一。提出了一个 完整的基于a g e n t 的w e b 数据仓库的体系结构,同时本章分别对a g e n t 技术 在数据仓库、w e b 服务器端、应用服务器端的应用进行了详细的研究,不 仅提出了一个基于a g e n t 的w e b 页面转换结构,而且在应用服务器端也给 出了多a g e n t 的协作模式。并重点在数据仓库中,对集成多a g e n t 、同步 更新多a g e n t 及查询多a g e n t 的工作流程进行了详细探讨。 第六章系统在网上教学中的实现:本文的重点章节之一。提出了新型基于a g e n t 技术的网上教学模式,论述了一个网上教学系统实施方案。最后在必要 的平台及工具的支持下,从建立系统资源库入手,提出了教学系统中智 能选题的程序实现方法及多a g e n t 之间协作的实现代码。 第七章总结与展望:对本论文的研究进行总结,讨论了它的可取与不足之处, 展望了未来进一步的研究工作。 1 5 本章小结 本章介绍了论文的研究背景、主要的研究内容以及整体篇章结构。作为硕士学 位论文,我们在充分了解基本概念和主要技术发展状况的前提下,有选择地进行了 重点研究。这些研究包括分布式的w e b 数据仓库体系结构、基于a g e n t 的w e b 数据 仓库系统及其在网上教学中的实现等。 4 南昌大学硕士学位论文基于a g e n t 的w e b 数据仓库系统研究 第二章a g e n t 技术 对a g e n t 技术的研究近几年来己成为人工智能研究的一个热点,一些文献称 a g e n t 技术是软件领域里一个意义深远的突破。基于智能a g e n t 的思想,人们提 出了一种薪的人工智能定义【 4 j :人工智能是计算机科学的一个分支,它的目标是 构造能表现出一定智能行为的a g e n t 。美国s t a n f o r d 大学计算机科学系的 h a y s r o t h 教授在i j c a i 9 5 的特邀报告中谈到:“智能的计算机a g e n t 既是人工 智能最初的目标,也是人工智能最终的目标。” a g e n t 理论与技术研究最早源于分布式人工智能,是人工智能技术和网络 技术发展的必然结果,它融合了计算机科学领域中的多种学科的理论和技术,包 括面向对象技术、对象分布技术、可适应学习系统、人工智能、专家系统、遗传 算法、分布式计算、计算机安全技术等等【1 5 】。a g e n t 技术己经引起各界的广泛关 注,它的出现为解决复杂、动态、分布式智能应用提供了一种新的计算手段。 2 1 a g e n t 的定义及特性 a g e n t 的本意是“代理”,即一个人代表另一个人或一个组织去完成某些事 情。在计算机领域,a g e n t 可看作是被授权的“个人软件助理”,是一种在分 布式系统或协作系统中能持续自主地发挥作用的计算实体,常简称为智能体【3 ”。 目前,对a g e n t 一词的概念尚无被普遍接受的一般定义。广义的a g e n t 包括 人类、物理世界的机器人和信息世界的软件机器人。狭义的a g e n t 则专指信息世 界中的软件机器人或称软件a g e n t 【5 “,它是代表用户或其它程序,以主动服务的 方式完成一组操作的机动计算实体。一般情况下,我们所指的a g e n t 是软件 a g e n t 。 w o o l d r i g e 在文章中给出了a g e n t 的两种定义: 定义l ( 弱定义) :a g e n t 用以最一般地说明一个软硬件系统,它具有这样 的特性:自治性( a u t o n o m y ) ,a g e n t 可以在没有人或其它a g e n t 直接干预的 情况下运作,而且对自己的行为和内部状态有某种控制能力:反应性 ( r e a c t i v i t y ) ,a g e n t 能够理解周围的环境,并对环境的变化做出实时的响应; 社会性( s o c i a l a b i l i t y ) ,a g e n t 和其它a g e n t ( 也可能是人) 通过某种a g e n t 语言进行信息交流;能动性( p r e a c t i v e n e s s ) )a g e n t 不仅简单地对其环境 做出反应,也能够通过接受某些启动信息,表现出有目标的行为。 定义2 ( 强定义) :a g e n t 在定义1 的基础上,还要包括情感等人类的特性。 通常会利用某些人性化的词汇对a g e n t 加以描述,比较普遍的是使用心智词汇来 南昌大学硕士学位论文基于a g e n t 的w e b 数据仓库系统研究 描述a g e n t ,包括知识( k n o w l e d g e ) 、信念( b e l i e f ) 、意图( i n t e n t i o n ) 、责任 ( o b l i g a t i o n ) ,愿望( d e s i r a b i l i t y ) 等。 一个a g e n t 自创建之日起,就通过提供对外界的服务和自我调节、自我完 善不断地发展进化。 a g e n t 的形式化定义如下: a g e n t p r i v a t ed a t a l ,d a t a 2 ,口 k n o w l e d g e b a s er u l e l ,r u l e 2 ,口 p r o c e s s o n d o a tp r i o r i t y p r o c e s s o n d o a tp r i o r i t y i a c t i o n a c t i o n ; p r o c e s s o r e n d 其中 标识a g e n t 名;p r i v a t e 域定义a g e n t 的局部数据,p r o c e s s 域定义a g e n t 的处理过程,p r o c e s s o r 域则标识处理机的地址,a c t i o n 域定义每个 处理过程的具体处理流程:k n o w l e d g e b a s e 域定义a g e n t 的历史经验库,历史经 验库中的知识用规划的形式组织。a g e n t 的处理过程将根据需要访问历史经验库。 前面提到,w 0 0 1 d r i d g e 教授和f f e n n i n g s 教授在总结前人对a g e n t 所做的研 究经验后,给出了a g e n t 的定义。从弱定义的角度来看,a g e n t 具有自治性、反 应性、社会性和能动性。从强定义的角度来看,a g e n t 还具有人的某些特性。除 此之外,a g e n t 还具有移动性等一些特性。 下面讨论的是a g e n t 的几个显著特性: ( 1 ) 自治性( 自主性) :a g e n t 能自行控制其状态和行为,能在无人或其他 程序介入时操作和运行,对自身的内部状态和动作有一定的控制权。在 数据仓库中,与知识的组织、维护、搜索等有关的繁琐和机械的任务可 交给相关的a g e n t 去完成,在进行数据查询时由a g e n t 完成复杂的信息 检查、分析和处理工作,形成具有智能的数据仓库。 ( 2 ) 反应性:a g e n t 能感知和作用其所处环境,并能对环境发生的改变及 时做出响应,能与其他的部门之间方便的共享数据、模型、规则和方 南昌大学硕士学位论文基于a g e n t 的w e b 数据仓库系统研究 法等资源,利用这个技术来解决数据仓库中由于源信息的异质、分布 性造成的信息交互不充分、不完整的问题,更好的支持群体决策。 ( 3 ) 交互性( 社会性) : 能与其他a g e n t 进行交互,能有效的与其他a g e n t 协同工作。为了协作完成一件复杂的任务,一些a g e n t 可以形成a g e n t 群,a g e n t 之间的接口和条件可以在运行中协商,这样就减少了a g e n t 之间的藕合性。 ( 4 ) 能动性:a g e n t 是目标驱动的,一旦提交了某项服务给a g e n t ,它就会 以该项服务为目标,发挥起自主性和交互性的特点。如:在数据仓库 中用户需要根据某关键字进行信息查询,这时设计一个查询a g e n t , 它就能提交相对完整的信息。 ( 5 ) 自学性:基于历史活动的执行情况( 经验) 指导未来的行为,a g e n t 这种 对时间上的适应性称为学习性。a g e n t 通过个体学习或群体学习提高 自身的性能,从而提高整个系统的性能。 ( 6 ) 移动性【2 5 】:a g e n t 可以在分布式网络中移动,自主地从一台主机迁移 到另一台。正在运行中的a g e n t 状态可以被存储且传送到新主机上, 在那里a g e n t 程序被恢复且继续从暂停的地方开始执行。a g e n t 可以 在多个位置之问迁移的特点可在数据仓库的建立和维护方面发挥作 用。移动a g e n t 自主地在异构的网络上,按照一定的规则移动,寻找 合适的计算资源、信息资源或软件资源,利用与这些资源代表用户完 成特定的任务。 通过对a g e n t 特性的分析和研究,从软件的角度给出如下的定义【1 3 1 : a g e n t 是能为用户执行特定的任务,具有一足程度的智能,以允许自主执行 部分任务并以一种合适的方式与环境相互作用的软件程序。软件a g e n t 与程序不 同,所有的软件a g e n t 均是程序,但并非所有的程序均是软件a g e n t ,只有满足 a g e n t 弱定义中的四条最基本特征的程序才能称为软件a g e n t 。 2 2 a g e n t 的体系结构 a g e n t 的体系结构描述了组成a g e n t 的基本成分及其作用、各成分的鞋系 与交互机制、如何通过感知到的内部状态和外部环境确定a g e n t 应采取的不同 行动的算法、a g e n t 的行为对其内部状态和外部环境的影响等。 目前最常用的a g e n t 模型是b d i t 3 6 1 ( b e l i e f ,d e s i r e ,i n t e n t i o n ) 模型。 b e l i e f ( 信念) 即a g e n t 对其所处环境的认识,这种认识应尽可能全面和正确; d e s i r e ( 愿望) 或目标是a g e n t 希望到达的状态,通常是人交给a g e n t 的任务; 而i n t e n t i o n ( 意图) 是系统当前或将来某个时刻要选择执行的任务,描述了 南昌大学硕士学位论文 基于a g e n t 的w e b 数据仓库系统研究 a g e n t 为达到愿望而计划采取的动作步骤,意图在a g e n t 的动作过程中可能会由 于环境的改变而需要决定新的动作步骤。一个典型的b d ia g e n t 体系结构应该包 含如图2 1 所示的几个部分。 厩压葫 陈 l l 7 平0上 l 用 j 解释器( 推理机) l 环 接 尚尚一受 口 厂 7 【j【 一 1 图2 1b d ia g e n t 体系结构图 信知数据库存储信知和事实。目标是指系统等待实现的目标。规划数据库中 的一组规划描述特定序列的动作和测试如何实现既定目标或响应特定环境变化。 规划数据库中的规划可以分成三种:第一种存放最基本的动作;第二种存放过程 即没有被细化的行动计划;第三种存放的是高层的推理规划知识。它们完成的是 不同等级的功能,而且它们都有相应的功能描述和触发条件,只有当条件满足时 才能被执行。意图结构中存放了己经选择作为最终执行的规划:解释器负责操纵 以土组件,挑选合适的基于信知和目标的规划,放到意图结构中。 系统通过它自身的数据库与它所处的环境交互,通过传感器感知外界的变 化,获得新的信知存入数据库,并且通过受动器执行动作,完成意图。用户可以 通过用户接口查询和更新a g e n t 的信知数据库。当a g e n t 产生一个新目标,或者 获悉周围环境的一个变化时,就会触发并对自身的目标和信念进行修改,新目标 的产生或者环境的变化称为触发事件。 b d ia g e n t 系统的主要工作都是由它的解释器来完成的。解释器的主要工作 可以分为以下五个部分: ( 1 ) 感知周围环境和a g e n t 内部状态的变化,并将获悉事件加入事件序列中。 ( 2 ) 找出与触发事件相匹配的规划,产生新的愿望和意图,放入意图结构中。 南昌大学硕士学位论文基于a g e n t 的w e b 数据仓库系统研究 ( 3 ) 从意图结构中选择一个意图执行。 ( 4 ) 判断事件是否为子目标,将意图压入己经存在的意图集或新的意图集( 意 图集在这里被看作是规划的堆栈) 。 ( 5 ) 选择一个意图集,取出顶层规划( 意图) ,执行这个规划,若为动作,则执 行相应的动作:若为子目标,则将这个子目标送入事件序列中。 a g e n t 循环执行事件序列中的事件,直到事件序列没有任何事件存在或没有 可运行的意向为止。a g e n t 的职能就是感知其所在环境的变化,并根据自身的目 标,执行相应的动作,通过这些动作来改变周围环境的状态,a g e n t 是用规划作 为手段来完成目标的。 2 3 移动a g e n t 2 3 1 移动a g e n t 的属性与特征 移动a g e n t 技术【52 j 是集软件a g e n t 技术、移动代码技术、分布式对象技术 于一体的技术。从广义上来讲,移动a g e n t 是计算机网络中的程序,它能够自动 地从一个站点迁移到另一个站点,并代表其用户执行计算。从软件a g e n t 的角度 来看,移动a g e n t 是软件a g e n t 家族中的一员。移动a g e n t 在他的生命周期内, 可以在不同的网络结点之间移动。在执行过程中,移动a g e n t 可以从一个执行环 境迁移( 挂起执行线程,把自己的程序代码和执行状态传送到另一个执行环境, 并在其中恢复执行) 到另一个执行环境。 移动a g e n t 自身具有状态、实现、界面、标识和责任主体五个属性【5 6 】。 ( 1 ) 状态( s t a t e ) :在a g e n t 迁移之后,可以利用a g e n t 的状态恢复a g e n t 的执行。它反映a g e n t 执行期间任何时刻的运行状态。a g e n t 的状态可 分为执行状态和对象状态( 即对象的实例变量值) 。 ( 2 ) 实现( i m p l e m e n t a t i o n ) :a g e n t 的实现为a g e n t 的执行提供执行代码。 a g e n t 的实现代码需要满足两个条件:a 可以在目标主机上执行;b 它 的执行不对主机的安全构成威胁。脚本语言和解释性语言为执行代码提 供了平台无关性。 ( 3 ) 界面( i n t e r f a c e ) : a g e n t 向其它a g e n t 或系统提供界面以便它们对 自己进行访问。如:一组方法调用、一个消息传递界面等。 ( 4 ) 标识( i d e n t i f i e r ) :每个a g e n t 在其生命周期内都有一个不变的全局 唯一标识。有了这个标识就可以在系统中对a g e n t 进行定位和识别。 ( 5 ) 责任主体( p r i n c i p a l ) :责任主体是可以被它访问的所有系统验证的实 体。移动a g e n t 至少有两个责任主体,一个是提供者,即a g e n t 现代 南昌大学硕士学位论文 基于a g e n t 的w e b 数据仓库系统研究 码的作者;另一个是对a g e n t 的行为负责的主体。 同时,在具备软件a g e n t 特性基础上,移动a g e n t 有三个突出特点: ( 1 ) 持续性:能在网络环境中不同结点之间移动和执行,转移后执行是持续 的,在转移过程中保持自身状态。 ( 2 ) 标识:任何一个移动a g e n t 具有一个全局唯一标识。 ( 3 ) 目标任务驱动:移动a g e n t 根据自身的目标任务对环境做出反应、判 断并实施行为以达到目标。 2 3 2 移动a g e n t 的生命周期 移动a g e n t 从创建到结束形成一个完整的生命周期1 7 】,这个生命周期可以用 六个状态来表示:创建、准备、传输、阻塞、执行和结束状态,如图2 2 所示。 图2 2 移动a g e n t 的生命周期 创建状态:标志着一个移动a g e n t 正处于创建过程中,当创建者将移动 。a g e n t 放入发送队列后转入准备状态。从准备状态到传输状态的转变决定 于创建者为它制定的发送条件及与下一个目标的协商结果。如果与目的 站协商成功,则a g e n t 转入传输状态。a g e n t 在网络传输过程中处于传输 状态,成功到达目的站后转入挂起状态。a g e n t 在目的站点未获得执行权 前始终处于挂起状态,在此期间服务设施对其进行身份确认和完整性检 查,检查通过则转入运行状态:否则重新转入传输状态返回给上一站点。 运行状态:是a g e n t 生命周期中唯一具有活性的状态,在这个状态中它自 主执行,与其他a g e n t 或服务设施交互完成预定任务。任务完成后,它 可能会继续移动转入传输状态,如果确认是最后一个目标站点,则转入 结束状态。 结束状态:是a g e n t 生命周期的结束。由于a g e n t 是可以重复利用的组件, 南昌大学硕士学位论文 基于a g e n t 的w e b 数据仓库系统研究 因此它可以被再次放入发送队列,转入准备状态。这种循环的生命周期 能够无限次地进行,并且在不同生命周期内获取的知识也能够在下一个 生命周期内使用。 移动a g e n t 在其生命周期内的行为模式定义如下: w h i l ea l i v ed o b e g i n 扫描所有的处理过程p r o c e s s i i fe x i t t h e n b e g i n 创建一个与p r o c e s s i 相应的进程,并排入进程队列 e n d e n d 2 4 多a g e n t 系统( 姒s ) 2 4 i 多a g e n t 技术 多a g e n t 系统p “( m a s ,m u l t i a g e n ts y s t e m ) 是由多个可计算的a g e n t 组 成的集合,其中每个a g e n t 是一个物理的或抽象的实体,能作用于自身和环境, 并与其它智能体通讯。m a s 技术是人工智能技术的一次质的飞跃:首先,通过 a g e n t 之间的通讯,可以开发新的规划或求解方法,用以处理不完全、不确定的 知识:其次,通过a g e n t 之间的协作,不仅改善了每个a g e n t 的基本能力,而且 可从a g e n t 的交互中进一步理解社会行为;最后,可以用模块化风格来组织系统。 如果说模拟人是单a g e n t 的目标,那么模拟人类社会则是m a s 系统的最终目标。 撇s 技术具有自主性、分布性、协调性,并具有自组织能力、学习能力和推 理能力【3 2 】。采用m a s 系统解决实际应用问题,具有很强的可靠性,并具有较高 的问题求解效率。m a s 技术打破了目前知识工程领域的一个限制,即仅使用一个 专家,因而可完成大的复杂系统的作业任务。m a s 技术在表达实际系统时,通过 各a g e n t 间的通讯、合作、互解、协调、调度、管理及控制来表达系统的结构、 功能及行为特性。由于在同一个m a s 系统中各a g e n t 可以异构,因此m a s 技术对 于复杂系统具有无可比拟的表达力,它为各种实际系统提供了一种统一的模型, 从而为各种实际系统的研究提供了一种统一的框架。 2 4 2 多a g e n t 系统的逻辑框架 m a s 是由多个a g e n t 组采用集中式或者分布式组成的一个相互合作、相互作 用、完成某些复杂目标或任务的系统,如图2 3 所示。 南昌大学硕士学位论文 基于a g e n t 的w e b 数据仓库系统研究 a - 集中式m a sb - 分布式m a s 图2 3 多a g e n t 系统( m a s ) 的组织结构 最简单的多a g e n t 系统可以由一个集中式或分布式a g e n t 组组成。小型的 m a s 可以采用集中式或分布式再组织成更大规模的m a s ,即允许m a s 的嵌套,与 传统的模块化程序系统相类似,g a s 系统结构可以通过由上到下和由下到上两种 方式进行组织和实现。前一种方式是通过对一个多a g e n t 系统中某些复杂的 a g e n t 成员进行扩展或分解,由多个较为简单的a g e n t 来实现该a g e n t 成员的任 务和目标,使该成员成为由多个较为简单的a g e n t 组成的一个多a g e n t 组。而后 一种方法是通过某种方式将现有的一些相对简单和小型的个体a g e n t 或多a g e n t 系统进行联合或者集成,从而组成一个更大规模或者更强壮的g a s 。 根据g a s 的组成方式,可以将m a s 分为完全集中式、完全分布式两大类。 ( 1 ) 完全集中式g a s :所有的a g e n t 成员组成一个集中式结构,且所有的 a g e n t 成员组本身均为集中式结构。多个集中式的g a s 再通过集中方 式组成更大规模集中式的g a s 。在完全集中式的g a s 中,不同a g e n t 组或不同的管理服务机构管理a g e n t 成员之间的协作和对共享资源 访问的需要,通过各自的上级并由其共同的管理服务机构进行协调和 控制。 ( 2 ) 完全分布式的g a s :所有的a g e n t 成员组成一个分布式的结构,且所有 的a g e n t 成员组本身均为分布式的结构,多个分布式的g a s 再通过分 布方式可以组合成更大规模的分布式的m a s 。完全分布式m a s
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年山西省发展和改革委员会下属事业单位真题
- 2024年池州市公安局招聘辅警笔试真题
- 2025年中国蒸汽调节阀行业投资前景及策略咨询研究报告
- 2025年中国聚苯乙烯泡沫包角行业投资前景及策略咨询研究报告
- 2025年中国磨砂夜光PVC项绳行业市场调查、投资前景及策略咨询报告
- 2025年中国白色普通爆花玻璃行业市场调查、投资前景及策略咨询报告
- 2025年中国电动出窑车行业市场调查、投资前景及策略咨询报告
- 2025年中国焊丝结晶器铜套行业市场调查、投资前景及策略咨询报告
- 2025年中国消防车配件行业投资前景及策略咨询研究报告
- 2025年中国水泥路面灌缝机行业市场调查、投资前景及策略咨询报告
- 电子商务招生宣传
- 预算绩效评价管理机构入围投标文件(技术标)
- 珊瑚化石科普知识讲座
- 中小学德育工作指南实施手册
- (新版)职业健康综合知识竞赛题库附答案
- 人教版九年级化学下册第九单元《溶液》复习说课稿
- (新湘科版)六年级下册科学知识点
- 短视频的拍摄与剪辑
- 对应急疏散人员的培训和教育
- 四川省医学会第八次精神医学学术会议课件
- GB/T 5224-2023预应力混凝土用钢绞线
评论
0/150
提交评论