(基础数学专业论文)基于bdi的协商公理体系多agent系统模型.pdf_第1页
(基础数学专业论文)基于bdi的协商公理体系多agent系统模型.pdf_第2页
(基础数学专业论文)基于bdi的协商公理体系多agent系统模型.pdf_第3页
(基础数学专业论文)基于bdi的协商公理体系多agent系统模型.pdf_第4页
(基础数学专业论文)基于bdi的协商公理体系多agent系统模型.pdf_第5页
已阅读5页,还剩86页未读 继续免费阅读

(基础数学专业论文)基于bdi的协商公理体系多agent系统模型.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于b d i 的协商公理体系多a g e n t 系统模型 摘要 随着计算机网络及其基于网络的分布计算技术的发展,a g e n t 以及多a g e n t 系统( m a s ) 的研究成为分布式人工智能( d a i ) 研究的一个热点单a g e n t 所拥 有的知识和能力是有限的,而现实系统往往异常复杂,并且具有开放、分布和动 态的特点,因此对m a s 的研究迅速发展在m a s 的研究中,a g e n t 之间的交互和 推理是一个重要的研究内容,a g e n t 之间的交互主要有三种形式:合作、协调、 协商其中协商是合作和协调的基础 本文针对多模态逻辑v s k 和b d i 的特点,采用形式化方法对多a g e n t 系统 和多a g e n t 系统的协商进行了研究,具体研究工作包括以下几个方面: 首先,在对v s k 逻辑和b d i 逻辑研究的基础上,结合两种模型的特点,构 建了基于b d i 的协商公理体系多a g e n t 系统模型该模型以v s k 逻辑为基础, 进一步刻画了a g e n t 的内部状态,主要涉及a g e n t 的信念( b e l i e f ) 、愿望( d e s i r e ) 和意图( i n t e n t i o n ) 等思维属性,使模型既能描述客观环境,又能描述a g e n t 的 思维状态及其变化过程,a g e n t 主要根据它的思维状态及其所处的环境进行行为 选择和协商 其次,采用符号结构的方法来描述信念、愿望和意图的语义,该方法与可能 世界语义相比,具有简单、易于理解的特点,这样的描述是直觉的、合理的、自 然的 然后,构建了基于b d i 的协商公理体系,并且给出了公理的合理性解释, 证明了公理的有效性和协商推理逻辑的可靠性、完全性及完备性 最后,通过一个实例描述了模型的应用,并且给出了进一步研究的方向 关键字:多a g e n t 系统信念愿望意图协商 m u l t i - a g e n ts y s t e mm o d e lb a s e do nn e g o t i a t i o na x i o m s y s t e mo fb d i a b s 仃a c t w i t ht h ed e v e l o p m e n to f c o m p u t e rn e t w o r ka n dd i s t r i b u t e dc o m p u t a t i o n a l t e c h n i q u eb a s e do nn e t w o r k ,t h er e s e a r c h e so fa g e n ta n dm u l t i - a g e n ts y s t e m ( m a s ) h a v eb e c o m eaf o c u si nd i s t r i b u t e da r t i f i c i a li n t e l l i g e n c e t h ek n o w l e d g ea n da b i l i t y o fs i n g l ea g e n ti sf i n i t e ,w h i l er e a f i s t i cs y s t e mi so f t e nc o m p l e x 、o p e n i n g 、d i s t r i b u t e d a n dd y n a m i c ,s ot h er e s e a r c h e ro fm a so b t a i n e dr a p i dd e v e l o p m e n t i nr e s e a r c ho f m a s ,i n t e r a c t i o na n dr e a s o n i n ga m o n ga g e n t sa r eai m p o r t a n tr e s e a r c hc o n t e n t t h e i n t e r a c t i o na m o n ga g e n t sh a st h r e em a i nf o r m s :c o o p e r a t i o n 、c o o r d i n a t i o na n d n e g o t i a t i o n ,w h i l en e g o t i a t i o ni sb a s eo fc o o p e r a t i o na n dc o o r d i n a t i o n a c c o r d i n gt ot h ec h a r a c t e r so fm u l t im o d a lv s k a n db d i l o g i c ,t h i sp a p e ra d o p t f o r m a l i z a t i o nm e t h o dt or e s e a r c hm a sa n dn e g o t i a t i o no fm a s t h er e s e a r c hw o r k c o n s i s t so ft h ef o l l o w i n gp a r t s : f i r s t l y , b a s e do nr e s e a r c h i n gv s ka n db d io fm u l t i a g e n tl o g i c ,c o m b i n i n g c h a r a c t e r so ft w ol o 百c ,w eb r o u g h tf o r w a r dm u l t i a g e n ts y s t e mm o d e lb a s e do n n e g o t i a t i o na x i o ms y s t e mo f b d i t h em o d e ld e p i c t e di n t e r i o rs t a t eo fa g e n tb a s e d o n v s k l o g i c ,m a i nd e a l i n gw i t hb e l i e f 、d e s i r ea n di n t e n t i o no fa g e n t i na d d i t i o n ,t h e m o d e ld e s c r i b en o to n l ye n v i r o n m e n tb u tt h o u g h ts t a t eo fa g e n ta n di t sc h a n g e a g e n t s e l e c ta c t i o na n dn e g o t i a t em o s t l ya c c o r d i n gt oi t st h o u g h ts t a t ea n de n v i r o n m e n t s e c o n d l y , w ea d o p ts y m b o ls t r u c t u r et od e p i c t i n gs e m a n t i co fb e l i e f 、d e s i r ea n d i n t e n t i o n c o m p a r i n gw i t hp o s s i b l ew o r l ds e m a n t i c ,t h em e t h o dh a sc h a r a c t e r so f s i m p l e n e s sa n de a s yu n d e r s t a n d t h i sd e p i c t i o ni si n s t i n c t i v e 、r e a s o n a b l ea n d n a t u r a l n e x t ,w eb r o u g h tf o r w a r dn e g o t i a t i o na x i o ms y s t e mb a s e do nb d i ,a n dg i v e nt h e r a t i o n a l e x p l a i n ,a n dp r o v e dv a l i d i t y 、s o u n d n e s s 、c o m p l e t e n e s s a n dl o g i c c o m p l e t e n e s s f i n a l l y , w ed e p i c t e da p p l i c a t i o no fm o d e lt h r o u g h ai n s t a n c ea n dg i v e nd i r e c t i o n o f n i t u r er e s e a r c h k e y w o r d :m u l t i a g e n ts y s t e m b e l i e f d e s i r ei n t e n t i o n n e g o t i a t i o n 独创性声明 y7 7 5 4 5 2 本人声明所呈交的学位论文是我个人在导师指导下进 行的研究工作及取得的研究成果。尽我所知,除文中已经标 明引用的内容外,本论文不包含任何其他个人或集体已经发 表或撰写过的研究成果。对本文的研究做出贡献的个人和集 体,均已在文中以明确方式标明。本人完全意识到本声明的 法律结果由本人承担。 学位论文作者签名:驭l 孰林 磷多月7b 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文 的规定,即:学校有权保留并向国家有关部门或机构送交论 文的复印件和电子版,允许论文被查阅和借阅。本人授权云 南师范大学可以将本学位论文的全部或部分内容编入有关 数据库进行检索,可以采用影印、缩印或扫描等复制手段保 存和汇编本学位论文。 学位论文作者签名:代圈粹 伽歹年;月7 日 指导教师签名:是助一力 z 一川矿年占月7 日 云南师范大学计算机科学与信息技术学院硕士研究生学位论文 基于b d i 的协商公理体系多a g e n t 系统模型 1 概论 a g e n t 理论与技术研究最早源于分布式人工智能( d a i ) ,但从8 0 年代末开始,a g e n t 理论、技术研究从d a i 领域中拓展开来,并与许多其他领域相互借鉴和融合,在许多不同 于最初d a i 应用的领域得到了更为广泛的应用a g e n t 的理论、技术,特别是多a g e n t 的 理论、技术,为分布开放系统的分析、设计和实现提供了一个崭新的途径,被誉为“软件 开发的又一重大突破” 随着计算机网络及其基于网络的分布计算技术的发展,智能a g e n t 技术和多a g e n t 系 统( m a s ) 已经成为人工智能领域分布式人工智能的重要研究方向自2 0 世纪9 0 年代以来, 关于a g e n t 和m a s 的研究逐渐引起重视并形成人工智能研究的热点由于表达能力强,因 此适用于动态开放环境的问题求解 m a s 的特点主要有 j e n n i n g se ta l0 0 】: 夺 每个a g e n t 拥有求解问题的不完全的信息或能力,即每个a g e n t 的知识和能力是 有限的: 夺 没有全局系统控制; 夺 数据的分散性; 夺 计算的异步性: 夺 开放性( 任务的开放性、系统的开放性、问题求解的开放性) ; 夺分布性; 夺动态适应性 m a s 中的a g e n t 除了具有a g e n t 系统中个体a g e n t 的基本特点外,还有以下特点: ( 1 ) 社会性,a g e n t 可能处于由多个a g e n t 构成的社会环境中。a g e n t 拥有其它a g e n t 的信息和知识并能通过某种a g e n t 通讯语言与其它a g e n t 实施灵活多样的交互和通讯, 实现与其它a g e n t 的合作、协同、协商、竞争等等,以完成其自身的问题求解或者帮助其 它a g e n t 完成相关的活动 ( 2 ) 自治性,在多a g e n t 系统中,一个a g e n t 发出服务请求后,其它a g e n t 只有在同 时具备提供此服务的能力与兴趣时,才能接受动作委托因此,一个a g e n t 不能强制另一 个a g e n t 提供某项服务 ( 3 ) 协作性,在多a g e n t 系统中,具有不同目标的各个a g e n t 必须相互协作、协同、 协商未完成问题的求解,通常可以进行资源共享协作、生产者,消费者关系协作、任务,子 任务关系协作等 1 1 多a g e n t 系统理论 m a s 的研究是以单a g e n t 理论研究为基础的除单a g e n t 理论研究所涉及的内容以外, 还包括一些和y t a s 有关的基本规范,主要有如下几点:m a s 的定义;姒s 中心智状态包括与 基于b d i 的协商公理体系多a g e n t 系统模型 交互有关的心智状态的选择与描述;m a s 应具有哪些特性:这些特性之间具有什么关系; 在形式上应如何描述这些特性及其关系;如何描述r c l a s 中a g e n t 之间的交互和推理等 对a g e n t 的理性的研究有基于逻辑和基于对策论两种在哲学上,认为合乎逻辑的足 理性的,为此提出了各种逻辑体系定义了公理系统和推理靓则,来证明些特定的命题 是否成立;认为一个合理静行为是可基于当前的信息合乎逻辑地推导出来的,这就是逻辑 理性目前对思维状态研究大多属于这一流派另一种方法是采用对策理论和决策理论,其 信念模型描述如果采用一个行动后将会发生什么,为每个后果都赋予概率它的愿望模型 是用实数表示那些可能状态的效用,一个合理的行动是使期望效用最优化的行动,这需要 依据信念和愿望通过概率计算得到,这就是效用理性从概念的角度来看,逻辑方法实现 了理- | 生的推理决策方法通过最优化的主观效用而实现了理性的决策从技术角度看使 用符号推理的逻辑理性无法使效用最优化,而使用数字分析的决策理论又忽视可推理环节。 因而就多a g e m 理论整体而言,需要融合两个流派的研究成果 对于m a s ,除了考虑单个a g e n t 的意识态度的表示和形式化处理等问题,还要考虑多 个a g e n t 意识态度之间的交互问题这足m a s 理论研究的重要部分之能够对环境中其 他a g e n t 的意识态度进行推理是a g e n t 间共存、竞争或协作的要求,a g e n l 之间的协同、 协商和协作行为是在其各种精神状态的支配和控制下才产生、进行和完成的与共享精神 状态相关的理论主要涉及到搪互信念、联合目标和联合意基等概念,其中以联合意图为代 表联台意图是c o h e nl e v e s q u e 的意图理论 c o h e ne ta l9 0 在联合动作上的推广把意图 定义为一种持续目标后,具有心智状态的慎思a g e n t 既不会过快地放弃意图,也不会在条 件不成立时去执行某个动作而联合意图在保持了在执行联合动作时,每个a g e n t 都具有 以上性质,并相信其它a g e n t 也是如此在多a g e n t 环境下,相互信念即是所谓的公共知 识,它与多a g e n t 通信密切相关从目前的研究现状来看对联合意图的研究不外乎以下 两种观点:( 1 ) 宏观强点,即在每个令体( a g e n t ) 之外存在一种联合意图控制整个组织或社会 ( m a s ) 的协作行为;( 2 ) 微观观点,即每个成员的意识态度导致个体动作一起完成协作目标 h a d d a d i 提出的关于联合意图的社会组织观点和个体观点 h a d d a d i9 6 即分属于上述两种 观点1 e n r t i n g s 提出的关于联合意图的承诺和公约( c o n v e n t i o n ) j e n n i n g s9 3 a 也分别对应于 上述两种观点b r a t m a n b r a t m a n9 2 nr a o r a oe ta 1 9 2 等人对联台意图的要求则只限于微 观观点,他们认为,每个团队( t e a m ) 成员都对联合行为做出承诺,联合意图是实现共事联 合目标蛉方法,成员闻要相互承诺。并及时把各包动作的成功或失败通知给其他成员与 联合意图相关的典型的形式化工作有:r a o 和g e o r g e f f 等人 r a oe ta 1 9 2 】基于单个a g e n t 系统的b d i 模型递归定义了社会a g e n t 的概念,引入了社会规划;w o o l d r i d g e 和j e n n i n g s 以承诺和公约概念为基础,用分枝时序逻辑建立了协作问题求解系统的形式化框架; h a d d a d i 基于b d i 逻辑给出了个协作系统的形式化模型,并将该模型应用于c o s y 系统 1 2 多a g e n t 系统的协商 多a g e n t 系统中每个a g e n t 都具有自主性,在问题求解过程中按照自己的目标、知识 和能力进行活动,常常会出现矛盾和冲突,在多a g e n t 系统中解决冲突的主要方法是协商 多a g e n t 系统的西商包括协商协议、协商目标和决策模型三个方面 协商协议:管理交互的规则,包括控制参与者类型( 如协商人和有关第三方) ,协商状 云南师范大学计算机科学与信息技术学院硕士研究生学位论文 况( 如:接受投标,协商结束) 、引发协商状况改变的事件( 如:更多的投标人,投标 被接受) 和在特定场合下的投标人的有效行为( 如:信息由谁传递) 协商协议的主 要研究内容是a g e n t 通信语言( a c l ) 的定义、表示、处理和语义解释m u l l e r 认为 m t l h e re ta 1 9 6 ,协商协议的最简单形式是如下一条协商通信消息:( ( 协商原语) ,( 消息 内容) ) 其中协商原语即消息类型,它的定义通常基于言语行为理论消息内容除包 含消息的发送者、接收者、消息号、发送时问等固定信息外,还要包括与协商应用的 具体领域有关的信息描述协商协议的形式化表示方法通常有3 种:巴科斯范式表示、 有限自动机表示和语义表示巴科斯范式表示具有简洁、明了的特点,是最常用的表 示方法采用纯语义表示的协商工作不多,研究者更多的是给出非形式化的语义解释 协商目标:通过协商要达到的目的,在极端的情况下,这个目标可能只包含一个问题 ( 如:价格) ,而通常可能会包括若干问题( 如:价格、质量、违约金等) ,由协商协 议规定的协定结构就是各方同意执行的动作类型简单情况下,协定的结构和内容是 固定的,参与者可以决定接受或拒绝;复杂一点的情况是协商参与者可以更改协商目 标中论题的值( 如:为了更好地保证协定符合协商目标,a g e n t 可以提出相反的建议) 更复杂的情况是参与者可以动态修改( 增加或删除) 协商目标的结构( 如轿车推销员 为了达成交易而承诺一年的免费保险) a g e n t 的决策模型:一种参与者采用的决策方法。连同协商协议一起来达到预定的目 标协议是否合适、协商目标的性质和操作类型将影响模型的复杂程度和决策范围 有关m a s 协商的典型工作有下面几个 刘大有等0 0 s y c a r a 以劳资协商为背景对非 协作类的多a g e n t 相互作用进行了研究,给出基于实例推理和多属性效用优化理论的“劝说 性辩论”模型g r o s z 等人在会谈理解研究中,给出支持人机交互通信的形式化模型 w e l l m a n 等人把面向市场方法用于设计a g e n t 间的协调过程,提出所谓基于一般平衡理论的 “面向市场程序设计”机制还有基于经济学理论、对策论和n a s h 平衡理论的多a g e n t 协商研究等 1 3 相关的研究工作 在b a r t m a n 提出b d i 概念之后,出现了大量有关的理论和逻辑工作c h o h e n 和 l e v e s q u e 在m a r t m a n d e 工作基础上,系统的研究了信念、目标、持续目标、意图和理性的 逻辑表达和演算问题,他们的工作基于线性时序逻辑在语义上则以可能世界为基础在这 些假设下,c o h e n 和l e v e s q u e 给出了一个形式模型,分层的引入并表示了时间、事件、行 为、目标、信念和意图等概念最后形式化的表达了这些概念之间的关系以及演化的规则 和约束c o h e n 和l e v e s q u e 的工作有着积极的贡献,为以后的形式化工作奠定了基础r a o 和g e o r g e f f 提出了理性a g e n t 的b d i 模型,他们采用非线性的分支时序逻辑使用了三个 基本的模态算子:信念、愿望、意图,建立了a g e n t 的b d i 模型而k o n o l i g e 和p o l l a c k 提出了他们对理性和行为意图的表达,解决了上述a g e n t 模型不能解决的副效用问题。并 使信念、目标、意图的表达非模态化s i r - g h 采用了一种主体逻辑对意图、信念、知识、指 导和通信分别进行描述,他的逻辑也是基于分支时序逻辑框架s h o m a n 在充分研究以往方 法的基础上提出了一个联系知识、行为概念的新框架,他提出时间线概念,并将行为定义 为时间线集合上进行特定选择的能力该框架在时间、行为和知识之间建立起联系 3 基于b d i 的协商公理体系多a g e m 系统模型 由于协商是个体间交互的表现形式,因此协商的研究内容必然包括交互规则、决策模 型、交互过程的研究,甚至包括为个体间交互提供底层支持的通信的研究,这些问题不是 独立的,一个通用的协商模型需要考虑协商协议对协商策略选择的影响,从而为实际应用 提供灵话的选择量前对协商酶研究往往只是单纯的研究协商协议或者研究协商簧路,为 数不多的协商模型的研究大多数是在特定的系统中针对具体协商的背景,因此通用性较差 n o r m a n 和s i e r r a 提出了一个基于权力与承诺的多a g e n t 系统形式化模型【:n o r m a ae ta l 9 8 3 在此基础上李晶结合了描述a g e n t 能力的v s k a f 逻辑、描述a g e n t 思维状态的协商 推理,形成了基于能力和思维的协商公理体系多a g e n t 系统模型建立了协商体制以解决 系统中的冲突,并引入“能力”、“权力”和“授权”的概念描述系统中a g e n t 的动作选择 策略之后尹红丽考虑了时间的因素,绘出了基于时序逻辑的协商公理体系多a g e m 系统 形式化模型在这些模型中。主要的不足在于:只考虑了环境的圜素,虽然提到了a g e n t 的思维状态,但思维状态在系统中的作用不明显,这与实际是不相符的为此。本文在以 上上作的基础上提出基tb d i 的协而公理嚣系多a a e n t 系统模型存系绮中除了考虑环 境因素外,同时考虑a g e n t 自身的思维属性( 信念、愿望和意图) ,使得对a g e n t 的描述更 为合理 4 云南师范大学计算机科学与信息技术学院硕士研究生学位论文 2 基于b d i 的协商公理体系多a g e n t 系统模型 李晶给出了基于能力与思维的协商公理体系多a g e n t 系统模型 李晶0 3 】在模型中系 统的运行可划分为“感知处理一选择动作一协商解决冲突一仲裁确定动作一执行动作”这 样矗勺运行序列,这个系统假定所有a g e n t s 是同步的,即只有一个工作单元以及a g e n t 的 权力是不随时间变化的 尹红丽考虑了时间的因素,给出了基于时序逻辑的协商公理体系多a g e n t 系统的形式 化模型 尹红丽0 4 ,把原来的一个工作单元细化为多个工作单元,允许a g e n t 的异步行为, 这样致使a g e n t 协商的开始时间、行为的开始时间可“不一样,从而就出现有些a g e m s 在 协商、有些在行为此外,考虑了行为的执行时间,同时权力随时间而变化这样系统的运 行为: 在以上的工作中没有考虑a g e n t 的思维状态对协商系统的影响,本文就是在以上工作 的基础上进一步刻画a g e n t 的内部状态,主要涉及信念( b e h e f ) 、愿望( d e s 眈) 和意图 ( i n t e n t i o n ) a g e n t 主要根据它的思维状态及其所处的环境进行行为选择和协商加入信念、 愿望、意图后多a g e n t 系统的运行可以表示为: 在感知处理阶段v s k 逻辑公理体系仍然有效,在选择动作、协商和确定动作、执行动 作阶段则使用基于b d i 的协商公理 2 1 语义框架 为描述的方便,把基于b d i 的协商系统简称为抓系统,它由外部环境、a g e n l 集合、 行为集合、协商策略集、仲裁策略集、协商过程和社会规则组成在本节的讨论中,首先 给出行为集的形式化定义,然后,用形式化方法定义环境的组成、a g e n t s 模型和协商过程t 最后,把这些与协商策略、仲裁策略、财富值、社会规则结合起来给出一个m n 系统的概 s 基于b d 的协商公理体系多a g e n t 系统模型 念 本节描述a g e n t s 及它们所处的环境的语罗模型,这令模型在_ m n 系统中豹作用柜当 于解释系统 定义2 1 1 ( 行为) 将系统中所有a g e n t s 能采取韵行为的集合记为a c t ,a c t = ( “o ( 0 , ”) ,其中奶是空动作,它不改变状态, 定义2 1 ,2 ( 协商策略) 将系统中所有a g e n t s 可以采取的协商策略的集合记为n s , n s = ( n s o ,n sl ,) 定义2 1 3 ( 仲裁策略) 将系统中的所有仲裁策略的集台记为a s ,a s = ( a s o ,a s l ,) 环境( e n v ) 由外部环境( e ) 、环境中的任务( w ) 、e 中状态划分函数( v b ;) 、环境状态转移 函数( k ) 、外部环境初始状态( e o ) 组成,其形式定义如下: , 定义2 i 4 ( 环境) 环境是一个元组e n v = ,其中: 夺e = e o ,。h e 】是外部环境: 夺w = 1 w 1 ,w 2 ,) 是任务集合: 夺v i s ,:e 梦是a 氟的环境:状态划分函数: 夺k :e a c p _ 2 8 是环境状态转移函数,a c r 表示n 个a c t 的笛卡尔集; 夺e o :e o e e 是外部环境初始状态 a g e n t s 元组( a g e n f s ) 由a g e n t 的局部状态集合( k ) 、外部环境感知函数( s e e i ) 、局部状态 转移函数( 墨) 、全局状态集( g ) 、信念函数( b ) 、愿望函数f 0 、意图函数( 珥) 、执行动作的 能力( a b i l i t y ,) 、执行动作的权力( p o w e r 6 、动作选择函数( s e l a c h ) 、协商策略集岱蹄、协商 应答选择函数( d e c i ) 、执行动作的成本收益( cr i ) 、个体财富( p o s s 0 和a g e n t 的初始局部状 态( e ) 组成其形式定义如下: 定义2 15 ( a g e m s ) a g e n t 是元组a 昌= d t ,s e e i ,g , b f , ,d ,墙,a b i l i t y l ,p o w e r i ,s e l a c t i ,n s i , d e c l ,cr ,p o s s j 其中: 夺k = 妒,f j , 是a g l 的局部状态集; 夺s e e j :v i s ,( e ) - - - p e r c 是a g 。的外部环境感知函数它是由外部环境可访问集台v i s i ( e ) 到外部环境感知集合p e r c ,的一个映射其中,外部环境感知集合由所有a g i 能感 知到的外部环境状态组成,p e r c i = p l ,p 2 , : 夺_ :l i e , p e r t 。_ k 是a 晷的局部状态转移函数,它表示a 昏根据感氮集来更颧局部 状态: 夺g = g o g l ,、岛) e l l k x k 是系统的全局状态集: 夺b :g _ 2 b 是a 爵的信念函数,它是由全局状态集g 到系统的信念集b 的幂集的 一个映射其中,b = b l ,b 2 , 是系统中所有a g e n t 盼信念的集合,矾( g ) 表示a 岳 在状态g 的信念; 夺d :g _ 2 。是a 禹的愿望函数,它是由全局状态集g 到系统的愿望集d 的幂集的 一个映射其中,d = d l ,d 二;l 是系统中所有a g e n t 的愿望的集台td ( g ) 表示a g i 在状态g 的愿望; 耷i :b f i ( g ) x d f i ( o ) - 2 1 是a g 的意图函数,它是由a g i 的信念集b ( g ) 和愿望集d f i ( g 到系统的意图集i 的幂集一个映射其中,i = 1 l ,i ! ,) 是系统中所有a g e m 的意固 的集合,i ( b 6 ( g ) ,d ( g ) ) 表示a g ,在信念b ( g ) 和愿望d ( g ) 下的意图或者在状态2 的意图: 6 云南师范大学计算机科学与信息技术学院硕士研究生学位论文 夺a b i l i t y i :a c t _ o ,1 ) 是a g i 执行动作的能力:a b i l i t y 。似) = 1 表示a g 有能力执行 动作d ,a b i l i t y i ( 0 c ) = o 表示a g i 没有能力执行动作“; 夺p o w e r :a c t _ o ,1 ) 是a g l 执行动作的权力;p o w e r i ( ) = 1 表示a g i 有权力执行动 作0 l ,p o w e a ( 0 。= 0 表示a g l 没有权力执行动作; 夺 s e l a c t i :i f i a b i l i t y i p o w e r i _ a c t 是a g i 的动作选择函数,它表示a g l 根据意图、 能力和权力选择相应的a 蟊可实施的动作: 夺n s 。:n s n s ,是a g 。的协商策略集; - 0 - d e c i :i f i x r h r e a d l j 。x n s i x s r - - a n s ,它表示a g i 在协商过程中,按照意图、协商历 史及自己的协商策略集,在社会规则约束下确定下一个协商回应;t h r e a d 。为协商 线程,s r 为社会规则,a m 为应答值的集合; 夺c r ,:c r i = c r i j l c r l j :a c t 寸才 & ,) 是a g i 执行动作的成本和收益: 夺p o s s ,:g z 是a g i 在全局状态下拥有的财富映射函数; 夺f ? 是a g ,的初始状态 协商过程元组由参与协商的a g t s 、协商主题( i s u ) 、主题范畴( 0 ) 、主题取值集合( v o ) 、 应答集合( a r t s ) 、时间集合( t i m e ) 、协商线程( t h r e a d ) : l a 协议( p r o t o c 0 1 ) 组成,其形式定义如 下: 定义2 1 6 ( 协商过程) 协商过程是元组n = , 其中: 夺a g t s _ a g l ,a 甑 是参与协商的a g e n t 的集合; 夺i s u = i s s u e 是协商主题i s s u e 集合; 夺o 是主题的范畴,是一个知识体; 夺v 。:由o 决定的主题的所有有效取值的集合: 夺a n s = v o u a c c e p t ,q u i t ,r e j e c t ,表示a g e n t 在提议中提供的协定的有效取值集合; 夺t i m e = t l ,t 2 ,k ,t i 表示时间,i q 则t i 乌: t h r e a d = t h r e a d i i 。) ,是系统中所有协商线程的集合;其中,t h r e a d i j 。表示a g i 与 a g j 之间就主题h s u e 。的协商线程一个协商线程结束( 以a c c e p t 、q u i t 、r e j e c t 结尾 或者因协商时间长度到达规定而结束) 意味着某两个a g e n t 的一次协商完成: 夺t h r e a d i j 。= ( o n ( h s u e 。,( a n s ( s l ,h i ,t 1 ) ta n s ( s 2 ,h 2 ,t 2 ) ) ) ) ,其中s k ,h k i j ,k a t i m e , a n s ( s k ,i l k ,t k ) e a n s ,w h e nk = ( m o d2 ) t h e ns k = ia n dh 囱,o t h e r w i s e ,s da n dh k = i , 是 协商双方互发的提议中协定取值的交替序列; 在协商线程t h r e a d 。参与协商的a g t s ;根据对方韵提议更新自己的信念、愿 望和意图设b u f 、d u f 、i u f 分别是信念、愿望和意图更新函数,其中: b u r :b a 1 1 s - b 表示参与协商的a g e n t 根据对方的提议更新信念: d u f :d a j l s 叶d 表示参与协商的a g e n t 根据对方的提议更新愿望: i u f :b d _ i 表示参与协商的a g e n t 根据信念和愿望更新意图: 夺p r o t o c o l ;用k q m l 定义的协商协议 在协商过程中,a g e n t 的权力可能会发生变化信念、愿望和意图不断地在更新,因 此可能会出现如下一些情况: 参与协商的某些a g e n t s 放弃了选择动作的意图,则由剩下的a g e n t 继续协商: 一 协商过程中,某些a g e n t s 获得了执行其它动作的权力而形成了选择其他动作的意 基于b d i 的协商公理体系多a g e n t 系统模型 图,则退出协商; _ 协商完成时间与其它a g e o t 选挥这个动作的时婚踊好一致,则让协商达成者执行 这个动作 一 协商过程中,又有另外的a g e n t 选择了发生冲突的动作,则加入协商: 定义2 ,1 7 艄系统模型是元组s = ,其中; 夺e n v 是外部环境; 夺a = a g i ,a 岛】是a g e n t s 集: 耷a c t 是动作集; 夺n s 是协商策略集; 夺a s 是仲裁策略集; 夺n 是协商过程: s r 是系统的社会规则 定义2 1 8 ( m n 系统类) 由所有m n 系统组成的集合称为m n 系统类,记为s 现在考虑m n 系统的行为聪环境的影响设系统初始外部环境为e o ,a g i 的翘始局部 状态为p ,每一个a 对环境进行观察产生对外部环境的感知s e e ,( v i s i ( e o ) ) ,a g i 的局部状 态转移为0 钟,s e e i ( v i s ,0 。) ) ) ,由此得到系统的初始全局状态: 9 0 2 ( p o ,( 掣,s e e l ( v i s i ( e o ) ) ) ,f ,( 卵,s e e 。( v i s 。( ) ) ) ) ,在此状态,a 岛所具有的信念、 愿望和意图分别是b t ( 勖) ,d ( 昏) ,i f i ( b f :( g o ) ,d f t ( 和) ) ,然后,每一个a 舀根据当前意图、 能力和权力选择一个动作簖= 以( 坑( 句:( 譬o ) ,助:( g o ) ) ,a b i l i t y ,p o w e r i ) ,在执行 动作的过程中,如果a g e n t 的侄务没有冲突,则执行动作使环境状态发生转移,再观察环 境如果a g e n t 的任务有冲突,则进行协商,直到达成协定,根据协商结果执行动作使环 境状态转移,再观察环境,此过程循环进行,直到解决所有问题 定义219 ( 运行r u n ) g 上的一个序列g o ,g “( 是可枚举的) 表示系统s = 的一次运行当且仅当 孛乃始状态g o = ( e 。,j 簖,s e e l ( v i s i ( f o ) ) ) ,( 等,s e e , ,( v i s ( ) ) ) ) 以及 对所有的“,如果g 。= ( e u ,f ? ,霹,0 ) 且g 。“= ( e 。,“r e + l ,f p ,“) ,那么 e 。l f j ( 气,8 :。一,搿:, , :f “= t ( 譬,s e e 。( v i s f ( e ,) ) ) , = s e i a c t i ( 玩( 彤;( g 。) ,口( g 。) ) ,a b i l i t y f ,p o w e r f ) ,它与其它a g e n t 选择的动作要么 是互不冲突的,要么通过协商确定动作的执行者 定义2 ,1 1 0 ( m n 系统的可达全局状态集g s ) 给定一个m n 系统s = ,如果g g s 当且仅当g 出现在s 的运行中,刘称g s g 为由s 产生的可达全局状 态集 2 2g n 系统协商逻辑 引入语言l 来表示多a g e n t 的信息特征 语言l 由两部分构成:在感知处理部分使用多模态v s k 逻辑l v s k ,它能够表达多a g e n t 系统中的客观现象,并且可以表示系统中a g e n t 可访润弱或可知道的信息以及感知到的信 云南师范大学计算机科学与信息技术学院硕士研究生学位论文 息,还可表示a g e n t 在系统中知道的信息在协商、选择和确定动作部分使用b ,它能 够表达多a g e n t 系统中a g e n t 的信念、愿望和意图及其在行为选择和协商中的应用,称h 为a g e n t 协商语言 该系统中引入三个模态算子:b e l ,d e s ,i n t b e l ( a g ,伞) 表示a g i 相信( 或有信念) q 如果b e l ( a g l ,【p ) 在全局状态g 为真,那么a g t 在状态g 相信母是真的( 或有信念p ) ,但并不意味着p 一定为真 d e s ( a g 。,p ) 表示a g i 有愿望( p 如果d e s ( a g j ,( p ) 在全局状态g 为真,那么a g i 在状态g 期望币是真的( 或有愿望( p ) , i n t ( a g j ,币) 表示a g l 有意图( p 如果i n t ( a g l ,甲) 在全局状态g 为真t 那么a g i 在状态g 有 意图母 用p 表示命题变量集 a 表示a g e n t 的集台:a c t 表示动作的集合;w 表示任务的集合; p r e ( 0 【) 表示对于c c e a c t ,d 被执行的前提条件集;e 蜮0 。表示对于0 l a c t o 【被执行产生的 结果集:语言l r a 、r 的其它谓词定义如下: 在下面的讨论中,若不特别说明,则a 昏,a g j e a ,a g t s a ,a e a c t ,w e w 一 定义2 2 1 谓词e x u ( a g ,o 【,w ) 表示“a g i 为了完成任务w 执行相应的动作”e x u 记 为系统中所有执行动作的集合:e x u = e x u ( a g l ,o 【,w ) 1 定义2 2 2 动作谓词元组集丌= ( e x u ( a g l ,0 【i ,w i ) ,。e x u ( a g j ,0 i ,w j ) ) l a g i ,a g j e a ,a g i a g i ; o q ,e a c t ;w “w j e w ;i j e l ,2 ,n 】l ,这里表示可能多个a g e n t s 执行动作 定义2 2 3 谓词d o n e ( a g 。0 ,w ) 表示“a g l 完成任务w 相应的动作”,用d n e 表示系统 中所有完成的动作的集合:d n e = d o n e ( a g l ,钒w ) 定义2 2 4 谓词c a p a b l e ( a g 。,伐) 表示“a 有能力执行动作o l ”:a b i l i t y i ( a ) = l 当且仅当 c a p a b l e ( a g i ,o 【) 为t r u e ;c a p 记为系统中所有a g e n t 能力的集合:c a p = c a p a b l e ( a g i ,c c ) 定义2 2 5 谓词e n t i t l e ( a g l ,a 舀,a ) 表示“a g i 向a 岛授权可以执行动作o l ”,e n t 记为系 统中所有授权的集合:e n t = e n t i t l e ( a g i ,a g j ,0 。1 定义2 2 6 谓词r i g h t ( a g 。0 。表示“a 野有权力执行动作t t , ”,p o w e r

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论