(机械电子工程专业论文)agent与mas理论及其在机器人足球赛中的应用.pdf_第1页
(机械电子工程专业论文)agent与mas理论及其在机器人足球赛中的应用.pdf_第2页
(机械电子工程专业论文)agent与mas理论及其在机器人足球赛中的应用.pdf_第3页
(机械电子工程专业论文)agent与mas理论及其在机器人足球赛中的应用.pdf_第4页
(机械电子工程专业论文)agent与mas理论及其在机器人足球赛中的应用.pdf_第5页
已阅读5页,还剩54页未读 继续免费阅读

(机械电子工程专业论文)agent与mas理论及其在机器人足球赛中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

电子科技大学硕士论文 摘要 本文研究了a g e n t 及m a s 的相关理论,提出了一个改进的结构与描述,构建 了合适的a g e n t 结构和及m a s 框架,并探讨了相关理论在全自主型机器人足球比 赛系统中的应用与初步实现,对前人研究成果进行了综合与归纳,形成了较完整 的理论系统。 智能分布式控制结构是控制系统的发展趋势,基于多个智能、自治、分布、 异构及协作的a g e n t 而形成的多a g e n t 系统( m a s ) 成为当前研究的热点。 本文中首先阐述了a g e n t 的定义、研究内容和特点,对a g e n t 的结构和描述 做了详细讨论,并提出了一个新的结构与描述。其次讨论了m a s 的研究内容、体 系结构与内部机制和应用情况。接下来在通信机制中,本文重点研究了黑板模型, a g e n t 通信语言,实现了a g e n t 路由器的初步应用。然后研究了姒s 内部的协调 机制、合作与冲突消解,以及相应的m a s 组织机构。最后,本文构建了合适的 a g e n t 结构和及h a s 框架,探讨了相关理论在全自主型机器人足球比赛系统中的 应用与初步实现,为今后进一步的研究工作奠定了基础。 关键词:a g e n t 。w a s ,通信,合作,协商,足球机器人 皇王型垫盔堂堡主笙茎 a b s t r a c t t h i st h e s i sr e s e a r c h e st h et h e o r i e so fa g e n ta n dg a s , a n dt h e i r a p p l i c a t i o n si nr o b o t s o c c e rg a m e s o nt h eb a s i so fs u m - u po ft h ep a s t r e s e a r c hf r o mo t h e rp e r s o n s ,t h i st h e i sh a do r g a n i z e dap r e t t yi n t e g r a t e d t h e o r ys y s t e m t h ei n t e l l i g e n td i s t r i b u t e dc o n t r o l l i n gs t r u c t u r ei st h et r e n do f c o n t r o ls y s t e m 。s ob a s e do nn u m b e r so fi n t e l l i g e n t , i n d e p e n d e n t , d i s t r i b u t e d ,i s o m e r o u sa g e n t ,t h em u l t ia g e n ts y s t e m ( m a s ) b e c o m e s t h eh o t s p o to ft h er e s e a r c hn o w a d a y s i nt h i st h e s i s ,f i r s tw ew i l ls e et h ed e f i n i t i o n ,r e s e a r c hc o n t e n t a n ds p e c i a l t i e so fa g e n t ,a n dt h es t r u c t u r ea n dd e s c r i p t i o no fa g e n th a v e b e e nd i s c u s s e dq u i t ep a r t i c u l a r l ya n da l lt h e s e sl e dt oai m p r o v e d s t r u c t u r ea n dd e s c r i p t i o no ft h ea g e n t n e x ti st h em e c h a n i s mo fa g e n t c o m m u n i c a t i o n t h eb l a c k b o a r dm o d e l ,t h ea g e n tc o m m u n i c a t i o nl a n g u a g e ( a c l ) a n dt h ea p p i i c a t i o n so fa g e n tr o u t e ra r et h ef o c u s e s t h e nt h e f a ll o w i n gi st h ec o o p e r a t i o na n dn e g o t i a t i o nm e c h a n i s ma n dt h e c o r r e s p o n d i n go r g a n i z a t i o no fg a s a tl a s t ,w ec h o o s et h ea p p r o p r i a t e a g e n ts t r u c t u r ea n dd e s c r i p t i o nm e t h o d ,a n dt h eg a so r g a n i z a t i o nf r a m e , t h e na p p l yt h e mt ot h et o t a l l yi n d e p e n d e n tr o b o ts o c c e rg a m es y s t e m a n d t h ee l e m e n t a r ya p p l i c a t i o n sw i i id e f i n i t e l yl a yaf o u n d a t i o nf o rt h e f u t u r em o r ed e t a i l e dr e s e a r c hw o r k s k e yw o r d s :a g e n t ,g a s ,c o m m u n i c a t i o n ,n e g o t i a t i o n ,r o b o ts o c c e r i i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名:翌盘日期:加畔年占月“曰 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:二堑导师签名:冬麴邋 日期:细忤5 、月坫日 皂至型垫盔堂堡主笙奎 一一一 第一章绪论 1 1 研究背景和意义 1 1 1 常见的控制结构 工程领域里常见的控制结构有以下三种【l 】: 1 集中式: 采取自上而下的控制方法,一般有一个中央控制器和一个中央数据库来控制 全局数据的一致性,系统中所有控制决策均由中央控制器作出,然后向下传送给 各结点设备,中央控制器与系统中各结点设备间为主从关系。其结构如图l 一1 所示。 图1 1 集中式结构 2 递阶式: 在集中式的基础上进行了改进。把集中控制结构中主控单元的功能分解为多 个层次,增加了分层控制功能。结构图中每一个结点都有唯一的上层控制单元, 并且从那里接收命令,然后将高层的命令分解为更详细的指令传递到更低一层的 各单元去,每一单元都是根据上一层的指令作出决策,传给再下一层,并从其下 一层获得反馈信息。各层间是命令一响应的关系。 递阶式控制方式采用树状结构,其结构如图l 一2 所示: 口控制器 0 设备 图1 2 递阶式结构 与集中式相比,这种方式降低了集中控制中对主控单元的坚固性、可靠性和 电子科技大学硕士论文 性能的要求。但各层次之间仍然为主从关系并且由于指令自上而下逐层发出,反 馈自下而上逐层返回,增加了信息传递和决策的延迟,尤其是当信息需要在本层 内传递时。从本质上说,递阶控制方式仍然具有集中控制的特征,各层之间为主 从关系并且存在一个总体控制单元即处于最高层的单元。 集中或递阶结构具有结构简单、容易实现等优点。 1 1 2 当前应用形式对传统控制结构的挑战: 但在当前形式下传统控制结构受到了越来越多的挑战,己经很难适,主要表 现在以下几个方面: ( 1 ) 系统的规模和复杂性急剧增加 ( 2 ) 系统内部单元的异构性增加 ( 3 ) 对系统的扩展性和修改性的要求增强了 ( 4 ) 对系统的灵活性( 可重构性) 和适应性的要求增强了 ( 5 ) 对系统的实时动态性能的要求增强了 ( 6 ) 对系统的可靠性和容错性的要求增强了 这些,对于结构简单固定,控制相对集中的传统控制结构而言,是难以有效 实现的。 1 1 3 控制结构的发展趋势一分布式控制结构 计算机技术和自动控制技术的不断发展和应用,为实现分布式的控制结构提 供了基础。分布式的控制结构由于抛弃了集中控制点和集中决策点,把控制与决 策都分散到各控制结点,因而减少了复杂的主控模块的开发费用并且会降低整个 系统的复杂性;局部的失效不会影响到整个系统,因而增强了容错性、鲁棒性、 适应性并且能够更好地发挥各单元控制器的功能和作用;控制的模块化和局部单 元化也增强了可扩充性。其结构为一种平行网状方式,如图1 3 所示。 控制器 0 设各 电子科技大学硕士论文 图1 3 分布式结构 分布式控制结构由多个分布的数据库组成,每个节点只需维护本地的世界模 型和本地数据库,克服了集中式的通信量大、严重依赖于主控制器和主知识库的 知识等弱点,能够充分发挥各单元的功能和作用,是解决传统方式的不足的一种 理想方法。 1 1 4 多a g e n t 系统及其优势 多a g e n t 系统( m u l t i a g e n ts y s t e m ,m a s ) 一是一种分布式控制结构,是 分布式人工智能( d a i ) 的一个重要发展方向,成为分布式系统的重要实现方法。 其基本思想就是: 用多个智能、自治、分布、异构及协作的a g e n t 来模型化和构造制造系统中 的各种实体单元,使系统成为一个多a g e n t 系统,每个a g e n t 都具有自己的知识、 目标和求解问题的能力( 即具有独立的个体行为) :同时,由于a g e n t 间共享同 样的通信语言和合作协议,所以系统的全局目标则可以通过这些a g e n t 间的协作 来实现,即每个a g e n t 还具有与其它a g e n t 交互和合作的能力和行为( 即社会行 为) 。 多a g e n t 系统结构具有以下优点: ( 1 ) 基于组件的平等的组织机构方式,实现了系统的可重构性和控制性 ( 2 ) 协作分布式的控制结构,决定了系统能够实现一种分布并行式的调度 方式,避免了集中控制器所带来的问题。 ( 3 ) a g e n t 的自治性保证了整个组织的分布式特征,同时多个a g e n t 的动 态实时的交互和协作又可以实现系统的目标并保证系统的总体性能。 总之,它是解决当前控制系统所面临问题的一种切实可行的方法。 1 1 5 多a g e n t 系统在当前的一些应用 m a s 现已广泛应用于诸如空中交通控制、通讯网络管理、作业调度,移动 分布计算,网络信息检索等方面。 1 2 目前本领域的研究现状与本文的内容与主要工作 m a s 的研究正在蓬勃兴起,但其在实践中的应用水平却不高,且缺乏公认的 标准的评价体系。目前研究的重点集中于a g e n t 的形式化描述,a g e n t 间的通信 与协商合作机制。 电子科技大学硕士论文 本文研究了a g e n t 原理、m a s 的组织结构、通信与合作协商等,选择和构建 了合适的a g e n t 结构和及m a s 框架,详细探讨了m a s 的通信机制与协商合作行为, 并研究了a g e n t 和m a s 理论在全自主型机器人足球比赛系统中的应用与初步实 现,为足球机器人比赛系统的开发提供一个良好的框架和平台。同时,此类应用 也可向其他分布式系统迁移。 电子科技大学硕士论文 2 1 相关概念 第二章a g e n t 及m a s 初探 2 1 1 分布式人工智能与m a s 人工智能( a r t i f i c i a li n t e l l i g e n c e ,a i ) 研究的主要目的是试图使机器 认识和模拟人类的某些智能行为;而由人工智能与分布式计算技术相结合而形成 的分布式人工智能( d i s t r i b u t e da r t i f i c i a li n t e l i g e n c e ,d a i ) 己经成为 一个重要的分支。它主要是研究多个a i 系统如何通过协作来求解问题,这多个 a i 系统在数据和控制这两方面都是非集中式的,并且在逻辑和地理上通常也是 分布的 d a i 的研究工作分为两个主要的领域【2 】:分布式问题求解( d i s t r i b u t e d p r o b l e ms o l v i n g ,d p s ) 和多a g e n t 系统( m u l t i a g e n ts y s t e m s ,m a s ) 。 d p s 研究如何分解某个特定问题,并将其分配到一组拥有分布知识并相互协 作的智能主体上进行求解。但是d p s 对智能主体的过多假定限制了d a i 更好的模 拟人类社会,也无法体现出d p s 试图建造的社会系统的特征,为此分布式人工智 能的研究逐渐演转向多a g e n t 系统研究。这时,人们习惯将分布式人工智能中的 智能节点称为a g e n t 。m a s 研究侧重于这些自治或半自治的a g e n t 为了采取联合 行动或解决各自问题,如何协调各自的知识、目标、策略和规划。由于f l a s 比d p s 更能体现人类社会智能,更能适合开放、动态的环境,因而越来越受到人 们的重视。 2 1 2 分布式控制系统与m a s 分布式控制系统( d i s t r i b u t e dc o n t r o ls y s t e m d c s ) 与m a s 有很多相似 的特点: 1 ) 都没有全局系统控制单元存在,系统中的数据、信息和控制都是非集中 式的。 2 ) 都具有异构性,常常由不同结构和种类的硬件和软件系统组成,并且目 标都是要使这种异构性对外是透明的。 3 ) 都是通过合作来扩展求解问题的能力并追求一个整体的目标。 4 ) 系统中通信及计算都具有并行性和异步性。 电子科技大学硕士论文 5 ) 都是动态的系统,都允许系统成员动态地加入和离开,即系统的组成及 状态都是动态变化的。 可以说m a s 中a g e n t 的自治性和相互的合作性本身就决定了其具有内在的分 布式系统的特点,而且在某种程度上,分布式系统也是m a s 的基础。由于分布式 的控制系统已经成为控制系统的发展方向,所以带有分布式特征的m a s 也越来越 受到了重视。 2 1 3a g e n t 与o b j e c t a g e n t 与对象有很多相似点:都代表实体、都具有内部状态、属性,都采用 基于消息的通信方式、都具有封装性、继承性和聚集性等。因此,很多学者都尝 试以对象为基础,通过扩展传统的对象概念和模型来建立a g e n t 的模型。 s h o h a m 认为a g e n t 就是一个包含了精神状态的主动对象( a c t i v eo b j e c t ) 。 l u c k 认为a g e n t 以对象为基础,它们分别代表了不同层次的实体,如图2 一l 所示: 图2 1 实体的分层 a g e n t 与对象也有很大的不同。a g e n t 封装了复杂和动态的行为方式,因此, 其内部结构和行为比对象要复杂得多。对象的行为只能由收到消息来触发即响应 消息,并且针对同样的消息总是以同样的行为方式来响应( 执行相应的方法) , 而a g e n t 的行为触发方式有两种:靠内部的时钟触发和外来消息触发,即a g e n t 可以根据自己的目标,采取不依赖于外部环境的主动行为,并且针对同样的消息, 依据精神状态的不同a g e n t 可能会采取不同的行为方式。 2 1 4a g e n t 与传统的专家系统( e s ) a g e n t 不同于传统的专家系统( e s ) ,一般来说,传统的专家系统只具有独 立的问题求解所需要的能力,如计算、规划等。而a g e n t 除具有独立的问题求解 能力外,还具有合作求解问题的能力,如消息传递、交互和协商及对话能力等。 电子科技大学硕士论文 2 1 5a g e n t 与传统的软件系统 a g e n t 不同于传统的软件系统,传统的软件系统一般是被调用才会采取行 动,有受控的关系。而a g e n t 软件则会依据自己的目标、意图主动行动,不依赖 于环境。 由此可以看出,a g e n t 区别于传统智能系统的显著特性在于它具备与其所处 环境、其它a g e n t 进行交互、协调和协作的能力,具备主动性。 2 2a g e n t 概述 2 2 1a g e n t 的定义与研究内容 ”a g e n t ”还没有一种统一和准确的定义,比较有代表性的有以下几种: r u s s e l l 认为:”a g e n t 是任何能通过传感器感知环境并通过效应器( 执行器) 对环境进行动作的东西。” p 。m a e s 认为:”a g e n t 是在复杂动态环境中能自治地感知环境并能自治地通 过动作作用于环境,从而实现其被赋予的任务或目标的计算系统。” 另外,f i s h e r ,m 定义a g e n t 为“一个带有传统的a i 能力的封装实体。” s h o h a m 从模拟人类行为的角度出发,用精神状态来描述a g e n t ,认为a g e n t 是具有信念( b e l i e f s ) 、能力( c a p a b i l i t i e s ) 、决定( d e c i s i o n ) ,承诺 ( c o m m i t m e n t ) 等属性的实体,后来很多专家学者又对精神状态作了扩充,增加 了很多属性,如:愿望( d e s i r e ) ,意图( i n t e n t i o n ) ,目标( g o a l ) ,选择( c h o i c e ) , 决策( d e c i s i o n ) ,职责( o b l i g a t i o n ) 等等。 虽然还没有一种统一的标准定义,但比较一致的看法是:a g e n t 代表了一种 具有独立的问题求解能力和与环境中其它a g e n t 合作求解问题能力的自治实体。 我们认为一个a g e n t 是具有一系列的目标、确定的能力和知识( 代表了对整 个环境的看法) ,能够推理环境( 包括推理其它a g e n t 的行为) ,生成相应的规划 并执行规划,以实现目标的功能实体。 目前a g e n t 理论的主要研究内容是a g e n t 的形式化方法( 即如何描述a g e n t ) 和a g e n t 的程序语言实现。 2 2 2a g e n t 的特点 a g e n t 具有以下特性: 电子科技大学硕士论文 ( 1 ) 自治性:一个a g e n t 应该能够解决给定的子问题,自主地选择通信和 合作策略,以特定的方式响应周围的环境,独立地对自身的行为进行规划,而不 需要人或其它a g e n t 的指令。其行为通常称为自治行为。 ( 2 ) 交互性:也称为社会性。a g e n t 与a g e n t 之间能够基于高级的通信语 言进行交互,通过交换知识、信念和规划等达成合作关系或基于协商协议通过协 商解决冲突。其行为通常称为社会行为。 ( 3 ) 分布性:在系统内各a g e n t 在功能和物理位置上都是分布的。 ( 4 ) 学习能力与适应性:a g e n t 并不是一成不变的,a g e n t 能够在运行中动 态地推理环境和搜集环境知识,发现资源,从而改变自己的知识结构,适应环境 的动态变化。 ( 5 ) 预动性:a g e n t 的行为是面向目标的、有目的的行为。 ( 6 ) 鲁棒性:能够对突发事件作出适当的反应。 2 2 3a g e n t 的体系结构 a g e n t 的体系结构可分三类:慎恩式、反应式、混合式。 ( 1 ) 慎思式: 图2 2 慎思式结构 这种体系结构是一种纵向体系结构,即从低层的环境建模到高层的表达推理 和控制,其动作不是传感器数据直接作用下的结果,而是经历了一系列从感知、 建模到规划等处理阶段之后产生的结果。这是- 9 中基于传统a i 的认知模型,适 合于已知环境下任务明确、目标给定的系统。 电子科技大学硕士论文 智能体内部维护一个对外界环境的描述,并具有更新机制,智能体根据其内 部的环境模型及感知的外部信息进行推理,产生动作。 ( 2 ) 反应式结构: 八十年代起一些人开始研究发展一种不同于慎思式智能体的新的结构通常 称为“反应式”( r e a c t i v e ) “基于行为”( b e h a v i o r b a s e d ) 智能体,其 体系结构为感知一反应的横向体系结构。此结构建立了从传感器数据直接到一系 列行为的映射,直接基于传感器的输入进行决策,在其内部不维护外界环境模型, 可以在完全陌生的环境中进行操作。一典型的反应式结构首先定义多个行为模 块,从传感器得到的数据同时传给这些模块,如果它们的条件满足,则通过算法 从它们的输出中得到被执行的动作。务件一动作规则使智能体将感知与动作连接 起来。这种结构响应快速,灵活机动,系统能力从低层次的局部规划到冲突消解 等逐步得到提高。 图2 3 反应式模型 ( 3 ) 混合式模型: 生活在一个现实或虚拟的世界中的智能体,会遇到各种不同的情况。智能体 除了要保持对紧急情况的及时反应,还要使用一定的策略对中短期的行为做出规 划,进而通过对世界和其它智能体的建模分析来预测未来的状态,以及通过通信 语言实现和其他智能体协作或协商矗哪 希望这些功能能同时存在,并行地执行, 以提供良好的实时性和规划性,因此拥有反应式和慎思式优势的混合式结构发展 起来。 混合式模型的智能体中包含感知( p e r c e p t i o n ) ,动作( a c t i o n ) ,反应 ( r e a c t i o n ) 、建模( m o d e l i n g ) 、规划( p l a n n i n g ) ,通信( c o m m u n i c a t i o n ) 、 决策( d e c i s i o nm a k i n g ) 等模块。 电子科技大学硕士论文 智能体通过感知模块来反映现实世界,并对环境信息做出一定的抽象。根据 信息的类型,感知模块将经过抽象的信息送到不同的处理模块。如果感知到的是 简单的或紧急的情况,信息则被送到反应模块。反应模块对传入的信息立即做出 决定,并将动作命令送到动作模块。动作模块则根据传入的动作命令做出相应的 动作,对世界做出影响。从感知到反应到动作的信息传递过程构成了“反射弧”。 外部世界 图2 4 混合式模型 分层结构是混合式模型的一种实现方法。对于组织功能和控制,层结构是 有效的方法,而且对于支持( 如反应、慎思、协作和适应性等) 期望特性的系统 设计,层结构是一重要工具。其主要思想是将一个智能体的功能组织进两个或更 多层次的组织层中,这些层为总体上完成智能体一致的行为,彼此间可以交互作 用;它既可在最低层进行反应式的响应,以解决某些突发事件,也可在高层进行 慎思式决策与规划。 1 垂直结构2 水平结构 3 联合结构 图2 - 5 分层结构 1 0 电子科技大学硕士论文 第一种是垂直结构,当前一个层次需要时,较高层被调用。第二种是水平结 构:所有层次同时运行,当某一层得出解决问题的方法时,就是最终的答案。第 三种是在同一结构中结合了垂直和水平的混合式的方法:前一种感知流是水平的 而动作流是垂直的。后一种是感知流垂直而动作流水平。 b r a t m a n 的b d i 理论及c o h e n l e v e s q u e 的意图理论就是近年来出现的描述 慎思式a g e n t 的一种重要理论研究成果,它从哲学的角度出发,用各种精神现象 来描述a g e n t 的内部状态( 精神状态) ,分别命名为信念( b e l i e f 代表知识) 、 愿望( d e s i r e ,代表目标) 和意图( i n t e n t i o n 代表规划) 。b d i 理论为描述a g e n t 的知识、目标和行为提供了一个清晰的概念模型。另外还有一些学者尝试用基于 逻辑的形式化描述述方法,如基于行为的逻辑理论方法和基于时态逻辑的方法 等。 基于b d i ( 信念一期望一意图) 模型的a g e n t 中,信念( b e l i e f ) 是环境模 型,期望( d e s i r e ) 是从固定目标库中选择的目标,意图( i n t e n t i o n ) 则为规 划过程( 由一系列的动作构成) 。 1 ) 描述b d ia g e n t 的墓本元素 信念:描述a g e n t 对当前环境状态以及为达到某种某种效果所可能采取的行 为路线的估计。表示a g e n t 拥有的知识和信息。 愿望;描述a g e n t 对未来世界的状况以及对可能采取的行为路线的喜好,指 a g e n t 可评估的状态。 目标:是a g e n t 从愿望中选择的子集,但还没有采取具体行动的承诺。一般 a g e n t 相信目标是可实现的。 意向:表示a g e n t 意图实现的目标,对a g e n t 以后的动作起指导作用。b r a t m a n 进一步将意向分为两种:指向未来的意向和指向现在的意向,前者指导a g e n t 的规划并约束它建立其它意向,后者是产生行动的原因。 承诺:实现从目标到意向的转换,它决定了a g e n t 对于所追求的意向的坚持 程度,并控制对意向的重新考虑。 2 ) 基于b d i 模型的a g e n t 的结构 基于b d i 模型的a g e n t 的结构如图2 6 所示。 图中的信念、规划、目标和意向结构等作为a g e n t 的内部状态,是控制器工 电子科技大学硕士论文 作的数据基础,感知器负责持续感知所在的环境信息,控制器负责对a g e n t 的各 种信息进行综合处理并形成结果信息,效应器则负责执行控制器的结果信息。 a g e n t 数据厍i l 知识域厍 ( 信念) 卜、州( 规划) 外 控 外 部 l -睹 n il 制 l i 壳虑监i 部 环环 境 器 境 目标p ,孓叫 葸向 ( 愿望) ii结构 图2 6b d ia g e n t 的结构 个典型的b d ia g e n t 通常包含4 个主要的数据结构:信念集,用于表示 a g e n t 的世界模型,其中的信息可能不完全或不正确;期望或目标( g o a l s ) 集,对应于分配给a g e n t 要执行的任务:意图集,表示。g e n t 已决定或承诺 完成的期望,a g e n t 将持续它对一个意图的承诺,直到它相信该意图已满足,或 由于某些原因该意图不再可完成规划库,包括一组预定义规划或方法,表示 a g e n t 为完成各种意图所遵循的过程性知识或程序总之,它们分别表示了。g e n t 的陈述性、选择性、决策性和过程性状态。 2 2 5a g e n t 的改良结构与描述及其内部机制 综合已有的知识,本文提出种较为理想的a g e n t 结构与描述。 a g e n t 的结构采用基于混合模型的水平分层结构,并应用b d i 概念进行刻画。 因其内部的感知流和动作流都是同时并行的,从而能达到最高效率。 其内部机制如下: 感知器获得的紧急信息或简单信息,可由直接反射产生动作指令交由执行器 执行,保证了系统的实时性要求;一般的信息送知识库存储,并提交给目标体系, 确定从微观到宏观各种层次的目标;关于外部世界的知识和目标体系一起提交至 决策规划,产生动作指令交由执行器执行:通信模块还能与其他a g e n t 进行通信, 了解彼此的环境知识、目标和决策,协调和修正自己的目标和决策,再由执行器 执行,从而达到协商合作的目的。 a g e n t 的自适应与自学习:执行器,感知器,知识库与目标体系,决策规划 形成一个闭环反馈系统。根据目标体系实现的程度,设定不同的权重因子,对决 皇王型垫奎堂堡圭笙苎一 策规划使用的规则库进行优先级调整,以实现自适应与自学习。 图2 7a g e n t 的结构与描述 2 3 多a g e n t 系统( m a s ) 2 3 1m a s 的涵义和研究内容 人类社会的组织形式对于专家学者们建立多a g e n t 系统的概念和方法起了 很大的启发作用,单个a g e n t 的知识、计算资源和求解问题能力等毕竟有限,解 决方法就是模仿人类社会的组织形式,将若干a g e n t 组织成具有一定组织结构的 多a g e n t 系统。 我们把m a s 看作是由多个分布和并行工作的a g e n t 组成的计算系统,这些 a g e n t 代表了在某种环境下的实际或虚拟的自治实体,常常具有不同的问题求解 方法、知识和能力、不同的结构( 异构性) 、不同的实现方法和不同的目标,按 照事先约定的语言和协议进行通信和合作,以扩展单个a g e n t 的能力并进行系统 的问题求解。 由于m a s 的主要功能就是合作求解,所以m a s 研究中的基本内容就是多个 a g e n t 的交互与协调合作,包括协调它们的知识、目标、能力、规划以及行为等, 以实现问题的求解。具体的说,涉及到通信机制,协调策略,合作方法等内容。 2 3 2m a s 的组织结构 m a s 是模仿人类社会的组织形式而形成的一个求解问题的团体,所以其内部 也具有一定的组织结构,组织结构决定了a g e n t 间的协调、交互与通信的关系。 电子科技大学硕士论文 m a $ 主要有三种组织结构,分别是: ( 1 ) 分层结构 组成系统的各a g e n t 间具有固定的层次关系,上层为控制a g e n ta ,中间为 协调a g e n tb ,下层为两个具有平等关系的a g e n tc 和d ,形成一种多层关系。 如下图2 8 所示: 图2 8 分层结构 ( 2 ) 联邦结构 系统由多个不同的联邦组成,每个联邦又由多个a g e n t 组成。不同联邦中的 a g e n t 间不能直接通信,而需要通过一个称作f a c i l i t a t o r 的a g e n t 来中转,即 联邦与联邦间的交互都是通过f a c i l i t a t o r 进行的,屏蔽了各联邦中的a g e n t 。 该结构可有效地减少系统中的通信开销,但增加了a g e n t 间合作过程中的中间层 次。 电子科技大学硕士论文 图2 9 联邦结构 ( 3 ) 水平式的分布自治结构: 系统中所有a g e n t 都是独立自治的,彼此间是完全平等的关系。需要时各 a g e n t 间可直接进行通信并交互和合作,形成一种水平式的分布自治结构。分布 自治结构最能体现m a s 的特点,是m a s 应用的一种最有潜力的结构形式。 但是这种结构要求各个a g e n t 自身包含有良好的通信与协调功能,从而对 a g e n t 的结构体系与内部机制提出了更高要求,而这正是本文所要努力解决的问 题。 2 3 3m a s 的应用 图2 1 0 分布自治结构 多a g e n t 系统放松了对集中式、规划、顺序控制的限制,提供了分散控制、 应急和并行处理,并且,多a g e n t 系统可以降低软件或硬件的费用,提供更快速 的问题求解。其优点包括: 1 ) 通过协作,可以解决单个a g e n t 不能解决的问题,所以具有强有力的问 题求解能力。 2 ) 快速求解,由于并行求解,所以求解效率较高。 3 ) 由于求解时有多个参与。功能上常常有冗余,所以单个的失效,其所承 担的问题求解任务可由其它代替,可靠性较好。 4 ) 可单独工作又可协同工作,具有较好的灵活性。 5 ) 模块化,每个a g e n t 都是一个独立的实体,通过标准的通信语言和合作 协议进行交互和合作。彼此之间没有控制和从属的关系。 6 ) 扩展性好,每个a g e n t 作为一个实体,可以动态地加入到已有的m a s 中, 为系统带来新的问题求解能力,同时,在其任务完成后还可以动态地退出系统, 从而带来灵活的扩展性。 7 ) m a s 的分布式特性决定了可以通过组合多个便宜的硬件来实现单个昂贵 电子科技大学硕士论文 的硬件的功能,同时a g e n t 的模块化的特点也会降低软件开发的复杂性,节省人 力和物力。 8 ) 稳定性和鲁棒性好 总之,m a s 是模型化、设计和构建分布式异构系统的有效方法,现在已经越 来越多地应用在系统建模,分布计算,组织管理等领域。尤其是在网络高度发达 地今天,系统的异构化、地理分散等特征尤其明显,更给d a s 的广泛应用提供了 广阔的舞台。 1 6 电子科技大学硕士论文 3 1 通信内容 第三章m a s 的通信机制研究 m a s 中各个a g e n t 相互通信的内容包括:通过传感器获取的关于外部环境的 知识模型,各a g e n t 自己的状态信息( 包括信念、期望目标和意图等) ;籍此以 维持系统的状态更新和精确性:为协调及合作的决策提供数据基础。 3 2 通信方法 a g e n t 间的相互通信,根据通信内容的表现形式,可以分为:无通信、消息 传递、方案传递、基于黑板的通讯、a g e n t 通信语言等。 3 2 ,1 无通信( n oc o n r n u n ;c a t i o n ) 模式 a g e n t 通过“理性”思考和推理而不以通信的方式,得到其它a g e n t 的任务 方案或计划。这种模式适用于a g e n t 目标之间没有实质性的冲突的情形。显然, 基于这种模式的a g e n t 系统是一个紧密耦合系统,各a g e n t 之间或者都是完全“透 明可见”的,或者它们需要不断地思索和推理其它a g e n t 所有的行动计划,而后 者则可能带来并发理性推理的高计算复杂度。这往往会造成系统实现困难、性能 降低、系统功能和规模不易扩展等限制和缺点。因此,这种系统基木上不具备 a g e n t 系统的优越性。 类似地,简单通信( p r i m i t i v ec o m m u n i c a t i o n ) 模式企图使用数目有限的 固定信号来完成通信,每个信号均有固定的含义和用途。该模式有利于避免 a g e n t 发生冲突,但它却限制a g e n t 的协作,因为这些数目有限的固定信号不能 表达a g e n t 的请求、命令和复杂的意图等。 3 2 2 消息传递( m e s s a g ep a s s i n g ) 模式 这是目前软件系统( 尤其是面向对象系统) 中常用的传统方法。 消息传送结构是基于s o c k e t 的通信结构。消息传送结构的基本服务模型为 基于r p c 的客户机服务器模型,即请求服务模型。其基本工作流程如图3 一i 所示。 a g e n t 使用一组事先约定的格式和规则通过消息形式相互传递计算请求和 处理结果。当特定状态出现或预先定义的事件发生( 比如a g e n t 收到其它a g e n t 发来的消息,或者a g e n t 感知到环境的某些变化) 时,这些规则就会被激活,a g e n t 电子科技大学硕士论文 于是采取相应的行动。该模式通常都以某一方a g e n t 为“服务中心”,其它a g e n t 则向该中心请求服务。其优点是高效、可支持分布式计算和移动计算:但缺点却 是不灵活、不便于扩展,以及不利于a g e n t 合作等。 麓 e s t a b l i s h :o n n e c t i o n c l i e n t s o c k e t ) r e a a o = r e e s t w , t e o w n t e oi r e s p o n s e i 培a d o 图3 1 消息传递基本工作流程 3 2 3 方案传递( p i a np a s s i n g ) 模式 在相互协作的a g e n t 之间,一方通过给对方传递其整个任务方案,相互取得 对问题的一致理解和相应的解决方案。这种模式常见于分布式计算和d a i 应用 中。尽管它可使a g e n t 的合作求解比较容易实现,但它却有许多缺点,比如:传 递方案带来的时空开销较大,传输过程易出错;不灵活,无法在状态多变、不确 定的现实环境下应用等。 3 。2 3 黑板( b l a c k b o a r d ) 模式 黑板喻指一个可供a g e n t 发布信息、公布处理结果和获取有用信息的共享区 域。黑板模型结构是为了解决分布在不同物理环境下多个实体协作完成任务的并 行和分布计算模型。该模型能够实现异构知识源的集成黑板模型可以为a g e n t 通信模型提供如下条件:a g e n t 的并发控制、a g e n t 的交互、a g e n t 的实时控制 等。黑板模型结构如下图。 电子科技大学硕士论文 图3 2 黑板模型结构图 该模式也常用与分布式问题求解。和方案传递相比,它提供了一种比较灵活、 迅速和高效的通信方式,但由于a g e n t 的个性不同,知识库及计算处理能力有异, 要求它提供灵活的公用信息表示机制;另外它的事件驱动性还要求集中控制机 构,这使得其实现和运行代价较大。 3 2 3 1a g e n t 通信单元模型 黑板模型结构是a g e n t 通信模型的基础在图3 2 所示的黑板模型结构中, 将图中不同知识源改换为a g e n t ,并且加入1 个单元( 组) 的门户a g e n t ( g g a ) , 可得到a g e n t 通信单元模型( c u ) ,如下图所示。 一共享知识交换区:2 一普通a g e n t 3 一单元门户抛卫l ;4 一通信总线 图3 3a g e n t 通信单元模型 可见,a g e n t 通信单元由普通a g e n t 、通信单元门户a g e n t 、共享知识交换 区( s k s a ) 以及若干通信总线( c o m m u n i c a t i o nb u s ,c b ) 组成。通信单元门户 a g e n t 就是组内的门户a g e n t ,它是通信单元内a g e n t 及不同通信单元问信息传 递的桥梁它与通信单元间的通信总线相连,提供单元内消息队列控制、信号控 制及单元内a g e n t 的注册等功能。 3 2 3 2m a s 内a g e n t 通信模型 m a s 内对于a g e n t 的组织不仅要满足一个智能系统需要的恰当的层次结构, 还应满足a g e n t 间的通信路由最优人们求解问题的过程实质上是把问题分解和 细化的过程,最终可以将问题分解为i 棵树如果由多个a g e n t 求解1 个问题, 树形结构的逻辑拓扑将保证求解任务的祸合度较大的a g e n t 处于一个相对紧邻 的环境之中另外,树形的通信网络结构可以根据任务的需要进行动态配置因 此,构造树形拓扑的多a g e n t 系统( t r e et o p o l o g yi v l u l t i - a g e n ts y s t e m t t m a s ) 皇至型垫查兰堡主丝苎 一一 t t m a s 通信模型如图3 - - 4 所示可见,整个通信模型呈树状拓扑结构t t m a s 中根节点是a g e n t 命名服务器该a g e n t 拥有一个全局性的共享知识交换区,负 责m a s 全局的系统服务与a g e n t 命名服务器水平直接相连的a g e n t 为m a sr i p a g e n t ,它为不同m a s 间的通信起纽带作用;树中的其他节点是区域门户a g e n t 。 i 一 社t 命名服务器:2 一m s 门户a 乎d t ; 一道信区域门户沁t d t :4 一通信区域 图3 4t t 舭s 通信模型图 图3 5 为局部通信区域图其中,每个通信单元如同一个细胞被连接在通信 总线上,而这些通信单元又共享一个知识交换区,并且在区域门户a g e n t 的调度 下形成一个自治的通信区域不同通信区域门户a g e n t 连接成一个树形拓扑的通 信网 一通信单元:2 一区域门户a g e t :3 一共享知识交换区 络 图3 5 局部通信区域图 在t t m a s 中每个节点a g e n t 都拥有自己区域的共享知识交换区,并且都能起 到通信路由的作用所以,该通信模型能够实现系统全局的通信服务 上述模型中a g e n t 通信过程主要通过黑板结构来实现黑板结构可以是一个 多线程的服务a g e n t ,该a g e n t 接收来自其他a g e n t 的消息,并通知接收消息 电子科技大学硕士论文 的a g e n t 来读取保存在信息表中的消息消息的接收a g e n t 对信息表中的消息具 有相应的读或者删除权限对信息表的共享控制通过一个消息队列来完成 基于上述模型构建的多a g e n t 组成的智能系统,在系统求解任务的过程中, a g e n t 可根据任务需要进行任意组合对于m o b i l ea g e n t 可以从一个叶节点游离 到另一个叶节点,实现a g e n t 间的协同工作,从而保证求解相似任务的a g e

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论