




已阅读5页,还剩87页未读, 继续免费阅读
(计算机软件与理论专业论文)多agent交互协作研究及系统模拟.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西北 下 业大学硕 l 学位论文 丫 摘要 本课题结合国家 8 6 3项目“ 生产计划与实时优化调度系统” 课题编号 2 0 0 2 a a 4 1 2 0 2 0 ) 进行, 任务 是研究将多a g e n t 应用到 计划调 度系统中的 有关技术 问题。 随着计算机网络、 计算机通讯等技术的发展, 特别是现实中的系统往往异常 复杂、 庞大并呈现出分布式特性, 在解决问 题时, 单a g e n t 因个体所拥有的知识、 计算资 源的限 制而力不能 及, 因 此对多a g e n t 的 研究迅 速发展,多a g e n t 系统 ( m a s )研究成为分布式人工智能研究的一个热点。 本文的主要任务是以 计划调度系统为背景, 研究应用多a g e n t 系统 ( m a s ) 的关键技术问 题。 文章首先讨论了单个a g e n t 内部的结构以 及a g e n t 群体结构, 对多a g e n t 系统规划和协作进行了研究, 并在合同网协议的基础上, 提出了一个 扩展型 协作方法。 同时 分 析了多a g e n t 系统的 通信机制的 有关 研究成果, 设计了 一 个 a g e n t 通 信原 型。 在 此 基 础上完 成了 一 个多 智 能 体问 题求 解系 统的 总 体设 计, 对关键部分进行了具体设计和实现。 最后简要讨论了 这个系统在计划调度中 的应用问题。 关键字:智能体多智能体系统智能体通信语言协作任务分配模型 西北丁业大学硕 卜 学位论文 ab s t r a c t wit h t h e d e v e l o p m e n t o f i n t e rn e t a n d c o m m u n i c a t i o n , t h e r e h a s b e e n a g r o w i n g in t e r e s t in t h e a r e a o f a g e n t a n d ma s . r e a l s y s t e m s a r e o f t e n c o m p l i c a t e d , h u g e a n d d i s tr i b u t e d w h i l e k n o w l e d g e a n d r e s o u r c e o f o n e a g e n t i s n o t e n o u g h , s o s t u d y o f m u l t i - a g e n t i s d e v e l o p i n g r a p i d l y . t h i s p a p e r s t u d i e s a r c h it e c t u r e o f m a s a n d p r e s e n t s a l g o r i t h m o f f o r m i n g a l l i a n c e a n d m u l t i - a g e n t p l a n n i n g t o r a i s e t h e w h o l e f u n c t i o n o f m a s . a l l o f t h e s e a r e p r o v e d b y t h e o r y s t u d y a n d s i m u l a t i o n e x p e r i m e n t . a r c h i t e c t u r e o f mas d e mo n s t r a t e s i n f o r ma t i o n a n d c o n t r o l r e l a t i o n b e t we e n a g e n t s a n d d i s t r i b u t i o n m o d e o f p r o b l e m r e s o l v i n g a b i l i t y . t h i s p a p e r d i s c u s s e s i n t e rn a l s t r u c t u r e o f s i n g l e a g e n t a n d in t e g r a t e s t ru c t u r e o f m u l t i - a g e n t . t h a t i s i n t e r a c t i o n fr a m e w o r k o f c o o r d in a t i o n a n d c o o p e r a t i o n b e t w e e n a g e n t s ; t h e l e v e l m o d e l i s p r e s e n t e d a c c o r d i n g t o h u m a n s o c i e t y a n d i s b u i l t i n a b s t r a c t f o r m c o o p e r a t i o n o f a g e n t s i s t h e b a s e m e n t o f w o r k i n g t o g e t h e r . t h i s p a p e r b r i n g s u p a g e n t s s t r u c t u r e , a g e n t c o m m u n i c a t i o n l a n g u a g e , a n d d e s i g n e d a s y s t e m u p o n t h i s s y s t e m. a n d s o m e r e s e a r c h h a s b e e n d o n e a b o u t t h e c o o p e r a t i o n s t r a t e g y . key w ord :a g e n t mu l t i - a g e n t s y s t e m t a s k a s s i g n m e n t mo d e l a g e n t c o m m u n i c a t i o n l a n g u a g e c o o p e r a t i o n 西北工业大学硕 上 学位论文 李 言 ,老 纷己1 1 j z】,二 下 j i r 1 . 1 论文的研究背景 随着计算机技术的不断发展以及其应用范围的不断扩大,尤其是近年来 i n t e rn e t 和i n t r a n e t 的迅速发展, 智能化、 分布式成为软件系统的设计和发展方向。 a g e n t 理论为 解决复杂、 动态、 分布式智能 应用问 题提供了 新的计 算手段。 a g e n t 的 理论、 技术, 特别是多a g e n t 的 理论、 技术 不仅为 解决 新的 应用问 题提供了 有 效的途径, 同时还提供了合理的概念模型, 在应用系统设计中有着非常重要的意 义。 对于 a g e n t 理论与技术的研究, 最早起源于分布式人工智能( d i s t r i b u t e d a r t i f i c i a l i n t e l l i g e n c e ) 。 分布式 人工智能 研究的目 标是要 创建描述自 然和社会系 统精确的 概念模型,可分为分布式a 题求解( d p s , d i s t r i b u t e d p r o b l e m s o l v i n g ) 和多a g e n t 系 统( m a s , m u l t i - a g e n t s y s te m ) l 。 从8 0 年 代开 始 , 多a g e n t 理论、技术研究逐渐从d a i 领域中拓展开来,与许多其他领域相互借鉴和融合, 在许多不同于最初 d a i 的应用领域里得到了更为广泛的应用。 多a g e n t 系统作为a g e n t 技术的一个主要发展方向, 在实际应用m受到了 广 泛的 重 视。 所 谓m a s ( m u lt i - a g e n t s y s te m ) 是 指由 多 个a g e n t 组 成的 一 个 较 为 松 散的多a g e n t 联邦, 这些a g e n t 成员 之间 相互协同, 相互服务, 共同 完 成一 个任 务。 2 1各 个a g e n t 成员 是自 治的、 独 立的 , 其自 身的目 标 和 行 为不 受 其它a g e n t 成员的限 制, m a s 通过竞争或磋商等 手段协 调和解决各成员a g e n t 在目 标和行 为间 的 矛 盾与 冲 突。 m a s 的 数 据 和资 源是 分 散的, 每个a g e n t 对于 所 要 完 成的 任务拥有不全面的信息或能力, 不存在全局的控制系统, 任务的执行和计算均是 异步 完成 的。 3 1 多a g e n t 系 统放 松了 对 集中 式、 规 划、 顺 序控 制的 限 制, 提 供了 分散控制、 应急和并行处理, 并且 多a g e n t 系统可以降低软件或硬件的费 用, 提 供更快速的问题求解。 由 于多a g e n t 系统在 控制方面的 特点, 使其在制造领域的 应用 逐渐扩 大。 生 产计划调度与控制是生产过程中问题之一,也一直是生产系统集成化、高效率、 高柔性以 及敏捷性研究中的核心问题之一。 为了适应制造业的发展, 出现了 很多 新的生产模式和生产组织方式。 生产组织和生产模式的变化, 对生产计划、 调度、 控制和决策系统提出了新的要求。 显然传统的集中式计划控制方式不再适合迅速 的改 变和变化的 需要。 而引 入多a g e n t 技术, 利用a g e n t 系统中a g e n t 间 交互协 调的思想的分布协同式制造系统将会是2 1 世 纪最其有生命力的生产模式。 i; 1 两北 业大学硕i : 学位论文 1 . 2 论文的研究内容与工作 本文结合国家8 6 3 项目“ 生产计划与实时优化调度系统” ,在对a g e n t 以 及 多a g e n t 系统基本理论全面分析的 基础上侧重研究多a g e n t 系统的协同工作机 制, 提出了 一个基于多a g e n t 系统的多智能体问题求解系统, 对如何将多a g e n t 运用于计划调度进行了探讨。 木文所做的主要工作有: 讨论了 多a g e n t 系 统的 体 系结 构,以 计 划 调度 系 统 为 应 用背景, 以 提 高多 a g e n t 系 统整 体 性能为目 标, 提出 了 扩 展型 协 作算 法。 设 计了 一 个a g e n t 通 信原 型二 在 k q ml规范的基础上实现了一种通信语言,对多智能体协作和任务分配 的常用方法进行了比较。 基于这些, 设计了一个多智能体问题求解系统。 并对如 何将这个系统应用于计划调度进行了简要描述。 1 . 3 论文的组织结构 论文首 先讨论了a g e n t 与多a g e n t 系统发展的意义, 在第二章中 介绍了 有关 a g e n t 以 及多a g e n t 系统的 基本理论, 给出了a g e n t 和m a s 的 有关 概念、 a g e n t 的结构以 及类型划分、 m a s 的典型模型, 重点介绍了m a s 中a g e n t 间的 规划方 法。 第三章内容对多智能体的协同工作方式进行了讨论。 首先给出多智能体协作 的定义, 然后分析了常用的2 种多智能体协作方式, 之后在己 有方法的基础上提 出了一种扩展型协作方法并对其进行了阐述。最后对多智能体协作的重要基础, 多智能体系统通信方式作了简要的总结,设计了一个适用于扩展型协作方法的 a g e n t 通信原型。 在第四章中提出了一个基于 m a s的问 题求解框架模型 p s m m, 给出了 p s m m的具体设计模型,模块和功能的划分。然后主要分析和实现了2 个方面: 该模型所使用的任务分配算法以及在该框架中搭建通信系统的方法。 论文第五章主要内容是对 p s mm架构所具有的优点进行分析以及对其如何 应用在构造计划调度系统中进行了描述。 最后,论文总结分析了所做的工 作并指出了卜 步工作的发展方向。 西北t业大学倾 七 学位论文 第二章 2 . 1 a g e n t 基本概念 a g e n t 理论概述 2 . 1 . 1 a g e n t 定义和a g e n t 的 特性 a g e n t 的 概念被广泛的 使用在各个领域,因 此, 很多 研究人员从自 己 的 研究 领域对其给出a g e n t 的定义。 其中, 最经典和广为接受的是由 著名a g e n t 理论研 究学者w o o l d r i d g e 博士 等人给出的“ 弱定 义” 和“ 强 定义” 。 弱定义a g e n t 指具 有自 治性、 社会性、 反应性和主动性等基本特性的 a g e n t ; 强定义a g e n t 指不仅 具有弱定义中的基本特性, 而且还具有移动性、 通信能力、协同性、 理性或其它 特 性的a g e n t . 基于 弱定义a g e n t 以 及 强 定 义a g e n t 的 概念 的 综 合, 在 这里 我 们认 为a g e n t , 是指具有一定知识、 智能、思维能力和自 治能力,并拥有某个或某几个目 标, 能 和环境 进行交互 ( 即 作用和受作用于 环境 ) ,能 和其 它a g e n t 相互协作的 软件或 硬 件实体。 a g e n t 应具备的基本特性包括: 1 ) 驻留 性: a g e n t 可以 驻留 在一定的 环境 ( 物理世界 和数字世界) 之中,能 够感知环境的输入, 例如对某些事件的发生产生反应, 通过动作和行为来影响环 境。 2 ) 反 应性: 即 对环 境的 感知和影响。 无论a g e n t 处在现实的 环 境中 还是在 虚 拟的环境中,它们都可以感知所处的环境,并且及时做出相应的反应; 3 ) 社会性; a g e n t 之间 可以 通过某 种协同 机制 来相互 合作以 完成任务或目 标, 这 是a g e n t 最重 要的 特性 之一, 也 是a g e n t 社 会 性的 具 体 表 现 ; 4 ) 主动性: a g e n t s 并非简单的针对周围环境和其它a g e n t s 的行为作出被动 反应,而是主动的与环境交互,与其它a g e n t s 进行交流进而作出 基于目 标的行 为; s ) 自 主性: a g e n t 的工作可以 不受周围的人或者其他a g e n t 的影响, 根据自 己己有的知识和内部状态进行决策,完成任务。 西北 工 业人学硕 卜 _ 学位论文 2 . 1 .2 a g e n t 理论模型5 a g e n t 的 基础理论主 要是 研究如 何构建a g e n t 的 理论 模型, 并在模型的 基础 上设计内部模块以及它们之间的关系, 从而使a g e n t 具备所需的各种基本属性。 山 于a g e n t 运 行在某种现实的 环境下, 资 源受到限 制。 作为 一 个软件或者硬件实 体的a g e n t 不可 能具 有充 分 完 备的 知 识, 无 法做 到 对 环境的 完 全的 观察, 并 且 因 为响 应时间等要求限 制a g e n t 必须在一定时间内 做出 反 应。因 此, a g e n t 的实 现 难点在于,怎样在资源有限的情况下实现a g e n t , 保证其行为的智能化。 为克 服资 源有限 的 情况, 实 现a g e n t 的智能 性, 人们提出了 各种a g e n t 的 理 论 模型, 大 致 可以 分 成 三类: 思 考型a g e n t ( 也 称理 性a g e n t ) , 反 应型a g e n t 和 混 合型a g e n t . 1 . 思 考 型a g e n t tb i 所 谓思 考型a g e n t , 就 是 指a g e n t 的 行 为 都 是 在 经过内 部“ 思 考” ( 流 程 见图 2 .1 ) 后 才决定 的。 思 考 型a g e n t 由 感知 器、 推 理 器、 规 划 器、 效 应器 等组 成。 推 理器和规划器是系统的中心,负责“ 思考” 。 这类a g e n t 的 共同特点有: 第一,都通过符号系统表达出 世界模型和目 标; 第二, 任何行为都是根据一定的日 标和当前世界的状态推理、 规划后产生的。 传感漆 六 息融合 沁 =i 环境 a g e n t 头 n 识 吃 】ka口 导, :一标一 “ 坟_ 吧 : 盛 图2 . 1思考型a g e n t 1 一 作流程图 因此, 我们可以 认为思考型 a g e n t 的 理论源于人工智能的符号主义。 这类 a g e n t 又 可以 分为 两类:面向目 标的思考型a g e n t 和面向 效用的思 考型a g e n t . ( 1 ) 面向目 标的思考型 a g e n t :这类 a g e n t s 被看成意愿系统( in te n ti o n a l 西北工业大学顾 1 1 学位论文 s y s te m ) , d e n n e t t i to i对 意 愿系 统 的 定 义 是: 如 果 某 实 体的 行 为可 以 通 过 赋予 它 信 念、 愿望 和理 性的 判断来分析、 预测, 那么该 实体就是意 愿系统。 弋e n t 作为意 愿系统 通常被赋予了 信念、 意图 、 愿望 和承诺 等心智 状态 ( m e n t a l s t a t e ) . a g e n t 的 行动是由a g e n t 的 心智状 态驱动的。 a g e n t 通过 各种逻辑运 算得到能 够实 现给 定日 标的动作序列,因此称为面向目 标的思考型a g e n t . 这类a g e n t 的 理 论中 最 有影 响 力 并 且 运 用很 广的 是b r a tm a n i i i从哲 学 角 度 提 出的b d i 理论模型。即赋予a g e n t 三种心智状态: 信念( b e l i e o 、 愿望( d e s i r e ) 和 意图 ( i n t e n t i o n ) 。 我们将在节2 . 1 . 3 对该 模型 进行 详细介绍。 面向目 标的思考型a g e n t 的优点在于: 符合人们的思维习惯, 易于理解, 能 够进行非常复杂的推理和规划。 其缺点在于:由于完全采用逻辑语言,因此难以 进行精确的量化推理;理论模型和实现结构上没有明确的映射关系,难以实现: 虽然理论上可以针对环境的变化及时地终止不合理的行动, 修正计划, 但实现起 来很困难;无法克服 “ 逻辑全知性问题” ;复杂的推理难以避免,无法保证在快 速变化的环境中作出合理及时的反应,始终是该理论最致命的缺点。 ( 2 ) 面向 效用的 思考型a g e n t : 这类理论 认为智能a g e n t 的 理 性体现在它能 够 判断各种行为的效果, 并选择效果最佳的行动方案。 这种理论的基础是效用理论 ( u t i l i t y t h e o r y ) , 对所有行为的 代价和效果进 行量 化, 通过效用函 数计算出 效用 值,其中效用值最大的为最佳。 该类a g e n t 的 优点在于: 第一,精确。 例如这种a g e n t 可以 用来选择最佳路径, 我们可以 给出时间、 距离 和耗油量三个选择标准以 及它们的权重, 这样a g e n t 可以 精确地选择最佳 路径。 第二,可以同时实现多个目标。 该类a g e n t 的 缺点在于: 第一,对所有目标制定统一的量化标准是很困难的。 第二, 效用函数难以确定, 效用函数通常基于概率, 然而对于变化的问题域, 事 先建立的概率模型往往是不适用的。 第三, 和面向目 标的思考型a g e n t 一样, 运算复杂, 效率不高。 因 此, 思 考型a g e n t 虽然在理论上 足够聪明, 但在“ 资 源有限” 情况下 始终 无法保证作出足够快的决策。 2 . 反应型a g e n t 反应型a g e n t 的理论 源于人工智能的行为主义 i 2 . ii i 与思考型a g e n t 的结构不同, 反应型a g e n t 中有 一 个或者多个模块, 每个模 块都能各自 独立地完成从感知到行动的整个过程( 见图 2 . 2 ) a整个系统没有一个 西北t业大学硕 卜 学位论文 控制中心, 各个模块之间是相互独立的, 每个模块产生的行为相互竞争, 都试图 控制系统, 最终的行为通常是由一个仲裁器协调产生的。 最为重要的是, 每个模 块从感知到行动并不需要经过推理或规划,而只是匹配一些条件/ 动作规则,当 符合某种条件则产生相应的动作, 类似于一种简单的反应过程, “ 反应型a g e n t 由此得名。 a g e n t ,l 前世界 , 环境 动作 c a .乡 材 fi 11 图2 .2 反 应型a g e n t - c 作流 程图 反 应型a g e n t 可以 分 成 两类: 一 是纯反 应型a g e n t , a g e n t 内 部只 有条 件一 动作规则, 不保存任何的 状态, 二是基于状态的反应型a g e n t , a g e n t 中 保存有 一定的状态。 纯反应型a g e n t 优点在于简单明了, 但是由 于它既没有集中的 控制和规划, 也没有保存状态, 因此它的最大缺点在于: 它的动作完全是由事件驱动的, 没有 明确的目 标, 没有i i一 划, 不知道要一千什么, 也不知道在干什么: 一种情况下只 有一种可能的行为方式,不灵活; 由于缺乏整体的规划, 所以 只能实现行为的局 部最优化; 并且不能学习。 基于状态的反应型a g e n t 由 于可不断地更新内 部状态, 因此具有一定的历史 知识, 能够有一定的目 标, 但一般不能更改。 但纯反应型a g e n t 的 其它缺点 依然 存在。 反 应型a g e n t 的 行为 产生 机 制保证了 它能 够在“ 资 源有限” 的 条件下足 够快 地作出反应。 但却不能实现足够聪明的功能。 因此, 也没有成功地克服“ 资源有 限问题” 0 3 .混合型a g e n t 山 于思 考型a g e n t 和反 应型a g e n t 各 有优缺点, 因 此 有人提出 混合型a g e n t 力 图 结 合前 两者的 优点, r u s s e ll 和s u b r a m a n ia n 提出 的 可 证明 的 有 限 最 优a g e n t 西北 r 业大学硕 卜 学位论文 可以 看成是 这 种思 想的 理论 提 升。 混 合型a g e n t 有 两 种实 现 方式: 一 种采 用层 状 结构;另一种则在规划机制内部完全融合。 层状结构的混合型系统至少有一层反应型结构和 一 层思考型结构。 一般用反 应型的机制来负责低层次的、 短期的控制, 用思考型的机制来负责长期的规划或 与 其它a g e n t 的 交流。 由 于不同 的 层有不同 的 要求, 通常不同 层的 运算机制和表 达方法都不相同。 因此, 这种结构中最关 键的问 题就是如何将瑰e n t 的各个子系 统适当地嵌入到一个控制结构框架中, 以及如何控制各层的动作, 并实现各个层 间的信息交互。 针对这个问 题n i l s s o n 提出三塔式( t r ip l e t o w e r ) 结构。 三塔包括:感知塔、 模型 塔 和动 作 塔。 侮个 塔都 具 有 层状结 构。 其中 动 作 塔是由t r ( t e l e - r e a c t iv e ) 程 序实现的。不过现在基于三塔式结构的系统还处于研究试验阶段。 第二种混合系统的代表是过程推理系统( p r s ) a p r s 是一 个b d i 结 构,内 部是由 五个 部分组成: 数据库( 存储信念和当 前 世 界 的 信息 ) 、 规 划 库、目 标 集、 解 释器 和意图 结构 15 。 其中 规 划库是由 知 识 块 ( k n o w l e d g e a r e a ) 组成。 知识 块分成三种: 第一 种存放最基本的 动作; 第二 种存 放过程, 过程也就是没有被细化的行动计划; 第三种是元级( m e t a - l e v e l ) 知识块, 存放的是高层的推理规划知识。 它们完成的是不同等级的功能。 所有三种知识块 都有相应的功能描述和触发条件, 只有当条件满足时才被执行。 因此, p r s 只有 在必要的时 候才一 会进行规划( 即 触发了 元 级知识 块 ) , 而且这种规划是基于 过程 的, 避免了对过多细节的运算, 可以大量减少运算量。 通过谨慎地设计元级知识 块的触发条件和内部的控制机制, p r s既可以实现规划功能, 又可以满足实时反 应的要求。 无论采用哪种方式实现混合型a g e n t ,都有四 个主要的 缺点: 1 现在既没有统一的理论,也没有统一的模型; 2 .控制机制非常复杂; 3 . 系统的内部抽象和结构都依赖于预先的设计, 缺乏灵活性, 更难实现“ 学 习” 4 .通常只针对非常具体的问题,因此也谈不上所谓的通用的智能。 以 _ t= 三类a g e n t 基于不同的理论, 具有不同的结构, 同时又有各自 的优缺点。 从实际 运用的 角度看, 选用哪 种a g e n t , 用哪 种结构, 在很大 程度上 取决 于a g e n t 所在环境的性质。 如果环境是开放的、 动态的、连续的, 那么就必须选用具有足 够反应能力的a g e n t ; 如果环境是封闭 的, 各 种情况 是可预知的, 也不需 要很高 的响 应速度, 这时思考型a g e n t 更加适合。 西北工业大学硕 卜 学位论文 2 . 1 .3 a g e n t 的b d i 模型 基于心理学和人类行为学等相关学科的研究而提出的信念一愿望一意图 ( b d i ) 模型, 是现今常用的一种 描述单a g e n t 的 有效手段。目 前, 关于使用b d i 模 型 来 描 述a g e n t 的 相 关 研 究 十 分 活 跃 , a n a n d r a o 和m ic h a e l g e o r g e 1 16 1 发 展 出 了一套b d i 逻辑, 对a g e n t 基于信念、 愿望、意图的 推理过程进行公理化。 在b d i 模型中, a g e n t 的内 部状态用 信念、 愿 望、 意图 三个心智分量 进行 描 述。当a g e n t 采取某个行动或作出 某种决策时, 都必须依据这三种心智状态。 信念体现a g e n t 对外部 世界 和自 身的 认识; 愿望反映a g e n t 希望实现的目 标; 意图则是 a g e n t 承诺将实现的 和正在实 现的h 标。 三种心智状态中, 意图 在 a g e n t 推理决策和行动过程中 起着十分重要的 作 用。 意图主要可分为两种: 面向 未 来的 意图 和面向当 前的 意图。 前者体现了a g e n t 将要实 现的目 标, 它驱动a g e n t 采取“ 手段 结 局” 的 推理方 法, 为实 现目 标 而制订计划; 意图应具有一定的持续性, 除非所要实现的目 标己经实现、 或者所 要实 现的目 标不可能实现、 或者实现目 标的动机己不存在, 否则a g e n t 将坚信这 一意图可以实现, 并尽其所能予以实 现。 另外, 当a g e n t 形成新的意图时, 不得 违背自己 现有的信念, 新旧 意图之间也不得有冲突, 否则需要有所抉择。 面向当 前的意图则用于触发行动的立即执行和监视正在执行的行动。 这种a g e n t 由以 下儿个部件组成: 信念库: 当 前信念是a g e n t 对环境和其它a g e n t 信息在内 部的 逻辑表示。 信 念库是a g e n t 当 前信念的 集合。 意愿库:当 前意愿是a g e n t 由当 前信念和意图决定的 认为 ( 或希望) 自己 能够 执行的动作。意愿库是当前意愿的集合。 意图 库: 意图 库是当 前意图的 集 合。 当 前 意图 表示a g e n t 对自 己 和其它a g e n t 承诺将要执行的动作。 信念产生器:接受传感器感知的外界环境和其它 a g e n t 的 信息作为 a g e n t 的输入,并结合当前信念库的内容产生新的信念。 意愿产生器:根据外界环境的内容在不违背己有承诺的前提下决定 a g e n t 能够完成的动作,也就是基于当 前信念库和意图 库的内 容产生新的当前意愿。 意图产生器: 是一个能体现a g e n t 主动性的 部件, 它根据外界 环境的内 容和 a g e n t 能 够完 成的 动 作 在不 违 背己 有 承诺 的 前 提 下 避免 意图 冲 突 ) 决 定a g e n t 承 诺的动作,即新的当前意图的产生要基于信念库、意愿库和意图库。 动作执行器:执行a g e n t 承诺 动作的部件。 西_ 七 _ 巨k 大学硕 七 学位论文 2 . 2 多a g e n t s 系统 上一节内 容主 要针对单个智能a g e n t 的 特性和理论模型, 但是对于许多复 杂的、 分布 式的问 题, 单 个智能a g e n t 并不 适合, 甚至无法胜任。 有些问 题即 便可以由 . 单 个智能a g e n t 解决, 也 可能 在 速度、 可靠性、 灵活性和可维护 性 等 方 面 受 到 制 约。 多a g e n t s 系 统 ( m a s ) 为 解 决 上 述问 题 提 供了 一 种 有 效 的 方 法。 2 .2 . 1 多a g e n t 系统( ma s ) 的定义及特点 简单来说,多a g e n t s 系统 ( m a s ) 可以 被这样定 义: m a s 是由 多 个问 题解决 者 ( a g e n t) 组 成的网 络系 统, 其中的a g e n t 相 互作 用、 相 互 合 作 从 而解 决单 个a g e n t 由于能力、 知识或资源上的不足而无法解决的问题或即使能解决而效率很低的问 题1 17 1 . n ms 的 协作 能 力 超 过 单个a g e n t , 是m a s 产 生 的 最 直 接的 原因 m a s是 a g e n t技术中一个重要的研究领域。它和分布问题求解 ( d p s - d is t r i b u t e d p r o b le m s o lv i n g ) 的 研究 都 属于 分 布 式 人 工 智能 ( d a i ) 的内 容, 是 两个不同的研究阵营。d s p 研究的主要内容是,多个问题求解器如何彼此合作, 达到一个共同的目 标, 解决一个问 题, 交互策略是系统的一部分, 预先集中在系 统中,各问题求解器共享关于问题的知识和求解方案。而ma s 研究多个软件实 体自土的合作解决多个问题,这些软件实体关于问题的知识及求解方法都不完 全,从而希望通过合作来产生比 完全由单个实体来解决问题更好的结果。m a s 一般被定义为松藕合的问题求解器, 也可以定义为由多个具有自 主或半自 主行为 的软构件构成的系统 8 1 m a s 有如下特点: 每个a g e n t 对环境和问 题具有不完全的知识及问 题解决能力; 系统没有全局控制; 数据是分布的; 各a g e n t 之间的计算是自 主的、异步的。 西北工业大学硕 卜 学位论文 2 . 2 . 2 多a g e n t 系统( ma s ) 的组织结构 对协同机制的分类源于ma s的组织结构分类,根据是否存在管理和服务机 构, m a s的 组织结构可分为分 布式、 集中 式和混合式 1 9 ,2 0 三 种,具 体结构 见图 2 .3 , 其中 集中 式与分布式的区 别就在于有没有一个中 心管理者负责 成员 a g e n t 的集中控制。 _/ 扮 一 / 西 必0 口 、 、 . 集中式 分布式 _ _ 一 / / 混合式 图2 .3 多a g e n t 系统的组织模式 集中 式结构的m a s , 将关系密切、有共同 意愿的a g e n t 集合成一组, 在保 证每个成员一定自治性的前提下, 用一个管理服务机构来负责这一组内的协同控 制。 多 个a g e n t 组 还 可以 组 成一 个高 一 级的a g e n t 组, 并 有 一 个高 层 管理a g e n t 来负责低层管理服务机构的协同, 可以 有若干个这样的层次。 管理服务机构与 成 员a g e n t 间具有一定的管理与被管理关系。 在分布式 m a s中不存在管理服务机构,而是采用中 介服务 机构来为a g e n t 成员间的协同 提供辅助和服务作用,它与成员a g e n t 间不存在管理与被管理关 系。 混合式结构则兼有分布式和集中式的特征, 既有管理服务机构, 也有中介服 务机构。 ma s的组织结构对协同机制的决定作用就体现在这两种机构的功能 r . , 它们在协同中的作用是不同的。 管 理 服务 机构负 责对所有或部分a g e n t 成员 的 行为、 协作、 任务 分配以 及共 享资 源等进行统一 的调配和管理, 建立学习系统和a g e n t 成员的 模型, 实现成员 行为 和系 统 安 全 性监 测 及 控 制 等 18 1 。 它与 成员a g e n t 之问 存 在 着 一 定的 管 理与 被 西北 1 业人学硕 l 学位论文 管理关系,但这种管理活动并不采用简单的命令方式,而是以协商的方式进行, 保证了成员 a g e n t自 治性的实现。一个可行的管理服务机构除具有系统整体目 标、当前环境等知识外,至少还应知道如下几个信息: 管辖范围内 所有的a g e n t 的 位置。 这些a g e n t 提供何种服务,有什么样的能力。 这些a g e n t 的状态。 管辖范围内的共享资源信息,包括种类、数量以及使用情况等等。 设管理服务机构为m, 所有处理应用逻辑a g e n t 组成集a g e n t = a g e n t i ,a g e n t 2 , a g e n t 3 , , a g e n t 小 在协同 过程中, a g e n t i ( i = 1 , 2 , 一 , n ) 如果能 独立完成一项任务, 就不再向m提出协商请求, 否则就向m提出合作请求: m接到请求后如果发现 该任务可由 另一个或几 个a g e n t 完成, 则可以向 这 些a g e n t 提出 合作要 求, 或者 也 可以 将这 些a g e n t 的 信息 告知a g e n t i ,由 它们自 行协 商: 收 到 合 作 要求 信息的 a g e n t 有权决定是否 接受该 合作 请求, 并给m以 反 馈, 如此数次反 复直至 达成协 议; 对于复 杂任务, 则由m分解该任务, 再 计算出 有能 力完成各 子任务的a g e n t 集合,经过协商直至达成协议。 中介服务机构用以发布、 保存和维护各a g e n t 成员的能力、 位置和状态等信 息, 并进行合作对象和服务 请求的 匹 配工 作, 它与系统内a g e n t 成员的关 系是服 务与被服务关系。 中介服务机构与管理服务机构最大的不同在于, 中介服务机构 仅 仅为a g e n t 成员 提 供中 介 服务 , 并不 像管 理 服务 机 构 那样 拥 有多 个a g e n t 成员 和系统当前环境的丰富知识, 也不对系统的共享资源进行管理, 更缺乏总体的协 同组织能力。 这样的区别是由系统规模决定的: 中介服务机构一般存在于大型的 开放的ma s中,不可能像管理服务机构那样拥有系统内所有的全局知识。常见 的中介服务机构有多种。 2 .2 .3 多a g e n t 系统( m a s ) 的 层次 模型 m a s 的强大功能是通过a g e n t 个体间的 相il 协作和相互服务实现的。 m a s 可以 由多 个智能 和能力 较 低或较 单一的a g e n t 组成, 也可以 几个 较复杂的a g e n t 成员 为基础, 结合 其他简单a g e n t 成员 共同 组 成; 多 个m a s 又 可以 组 成更为复杂 的智能系统,这也就是ma s的层次设计属性。在第n 层山多个智能体构成的组 织,在第 n + 1 层可看成单个实体。相反地,在第 n + l 层的单个实体,在第 n 层 l 可看成山多个智能体构成的组织,每两级相邻的层次上 都存在这样的关系。 西北 1 业人学硕 l 学位论文 管理关系,但这种管理活动并不采用简单的命令方式,而是以协商的方式进行, 保证了成员 a g e n t自 治性的实现。一个可行的管理服务机构除具有系统整体目 标、当前环境等知识外,至少还应知道如下几个信息: 管辖范围内 所有的a g e n t 的 位置。 这些a g e n t 提供何种服务,有什么样的能力。 这些a g e n t 的状态。 管辖范围内的共享资源信息,包括种类、数量以及使用情况等等。 设管理服务机构为m, 所有处理应用逻辑a g e n t 组成集a g e n t = a g e n t i ,a g e n t 2 , a g e n t 3 , , a g e n t 小 在协同 过程中, a g e n t i ( i = 1 , 2 , 一 , n ) 如果能 独立完成一项任务, 就不再向m提出协商请求, 否则就向m提出合作请求: m接到请求后如果发现 该任务可由 另一个或几 个a g e n t 完成, 则可以向 这 些a g e n t 提出 合作要 求, 或者 也 可以 将这 些a g e n t 的 信息 告知a g e n t i ,由 它们自 行协 商: 收 到 合 作 要求 信息的 a g e n t 有权决定是否 接受该 合作 请求, 并给m以 反 馈, 如此数次反 复直至 达成协 议; 对于复 杂任务, 则由m分解该任务, 再 计算出 有能 力完成各 子任务的a g e n t 集合,经过协商直至达成协议。 中介服务机构用以发布、 保存和维护各a g e n t 成员的能力、 位置和状态等信 息, 并进行合作对象和服务 请求的 匹 配工 作, 它与系统内a g e n t 成员的关 系是服 务与被服务关系。 中介服务机构与管理服务机构最大的不同在于, 中介服务机构 仅 仅为a g e n t 成员 提 供中 介 服务 , 并不 像管 理 服务 机 构 那样 拥 有多 个a g e n t 成员 和系统当前环境的丰富知识, 也不对系统的共享资源进行管理, 更缺乏总体的协 同组织能力。 这样的区别是由系统规模决定的: 中介服务机构一般存在于大型的 开放的ma s中,不可能像管理服务机构那样拥有系统内所有的全局知识。常见 的中介服务机构有多种。 2 .2 .3 多a g e n t 系统( m a s ) 的 层次 模型 m a s 的强大功能是通过a g e n t 个体间的 相il 协作和相互服务实现的。 m a s 可以 由多 个智能 和能力 较 低或较 单一的a g e n t 组成, 也可以 几个 较复杂的a g e n t 成员 为基础, 结合 其他简单a g e n t 成员 共同 组 成; 多 个m a s 又 可以 组 成更为复杂 的智能系统,这也就是ma s的层次设计属性。在第n 层山多个智能体构成的组 织,在第 n + 1 层可看成单个实体。相反地,在第 n + l 层的单个实体,在第 n 层 l 可看成山多个智能体构成的组织,每两级相邻的层次上 都存在这样的关系。 两_ a 七 业大学硕 卜 学位论文 2 . 3 多a g e n t 规i li a g e n t 通过规划活动提高问题求解的效率和增强系统求解的连贯性。单 a g e n t 的 规划通常是根据其目 标、 求解 技能、 资 源以 及环境 约束建 造一 个活 动序 列的 过程; 多弋e n t 系统规划不 仅要考 虑单a g e n t 规划中的 所有问 题, 而且 还要 考 虑其他a g e n t 活 动对某一a g e n t 行为 选择的 约束, 一智能 体 对其他智能体的 承 诺 约束也影响其自 身行为 选择以 及开 放系统中 环境变化的不可预测性对 a g e n t 行为选择的影响等。 在a i 领域,规划与搜索、推理一样是一种问题求解的方法。规划方法是通 过模拟人类求解复杂问题的过程而形成的一种方法。 在现实世界里, 人们为了高 效率地解决大型复杂问题, 通常要事先对问题进行细致的分析, 了解和处理相关 子问题之间的联系, 制定出可行的计划, 然后按计划解决复杂问题。 在计划实施 过程中, 往往还会出现意外的情况或新问题, 需要针对新问 题对部分计划进行调 整, 直至达到目的。 规划的问题求解方法分为两个过程:规划过程和执行过程。 其中 , 规划 过 程是 指 针 对某一 任务, 求 取完 成该 任务的 动 作序列 ( 串 行、 并 行 或 串并行) , 这一动作序列称为计划。 计划是规划过程的输出结果。 执行过程是指按计划实现问题求解, 并监控问 题求解的进行,当出现意外情况计划无法执行时, 调整行为计划或再规划, 直至 任务完成。 规划过程和执行过程并非完全分离, 有的规划问题求解中规划过程和 执行过程是交织在一起进行的。 由于多a g e n t 系统是连续动态地运行于某一环境, 因此, 多a g e n t 系统规划 比a i 学科中的 传统规划技术复杂得多, 也称为反应性规划 ( r e a c t i v e p l a n n in g
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 项目居间协议居间协议合同8篇
- 2025家居电器分销合作合同协议书
- 2025新混凝土工程合同版
- 2025家具买卖合同样本
- 2025合同依据多样化分类标准展现出多样化类型
- 物质的量在化学实验中的应用教案(以核心素养为本的教学设计案例)
- 机械厂仓库规划布局规章
- 2025年商品房与经济适用房买卖合同差异解析
- 湖北事业单位笔试真题2025
- 考试我想和你握握手(说课稿)2025-2026学年初三下学期教育主题班会
- 氧化蜡行业深度研究分析报告(2024-2030版)
- 2025-2030年中国备件制造行业市场现状供需分析及投资评估规划分析研究报告
- 数字化运营与管理 课件 第1章 数字化运营基础
- 产品尾数管理制度
- 2025至2030中国智能功率模块(IPM)行业项目调研及市场前景预测评估报告
- 安全编码规范
- 中医养生保健操课件
- 平台运营中心管理制度
- 彩钢板房安装合同范本
- 竞选卫生委员演讲稿
- 2025-2030年中国课外辅导行业市场现状供需分析及投资评估规划分析研究报告
评论
0/150
提交评论