(控制理论与控制工程专业论文)多智能体编队控制研究.pdf_第1页
(控制理论与控制工程专业论文)多智能体编队控制研究.pdf_第2页
(控制理论与控制工程专业论文)多智能体编队控制研究.pdf_第3页
(控制理论与控制工程专业论文)多智能体编队控制研究.pdf_第4页
(控制理论与控制工程专业论文)多智能体编队控制研究.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

(控制理论与控制工程专业论文)多智能体编队控制研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

j , 1 a b s t r a c t w i t ht h ed e v e l o p m e n to fs c i e n t i f i ca n dt h ep r o g r e s so ft e c h n o l o g i c a l , a r t i f i c i a li n t e l l i g e n c er e s e a r c hi sd e v e l o p i n gr a p i d l y o fm u l t i - a g e n ts y s t e m s i nt h i sa r e ai san e wd e v e l o p m e n td i r e c t i o n m u l t i a g e n ts y s t e m sa r ean e w d e v e l o p m e n td i r e c t i o n i nt h i sa r e a t h i sp a p e rs t u d i e sc o n t r o l l a b i l i t y p r o b l e m s o f m u l t i - a g e n ts y s t e m s a n ds o m ec o n n e c t i o n sb e t w e e n c o n t r o l l a b i l i t ya n dc o n s e n s u s 1 t h i sp a p e rs t u d i e sad i s c r e t e t i m em o d e lo fac l a s so fm u l t i - a g e n t s y s t e m sw i t hs i n g l el e a d e ru n d e rd i r e c t e di n t e r c o n n e c t i o nt o p o l o g i e s a l s o a na p p r o a c hi sp r o p o s e dt ot r a n s f o r mak i n do fu n c o n t r o l l a b l es y s t e mt oa c o n t r o l l a b l eo n e b ya s s i g n i n gw e i g h t sb e t w e e na g e n t s 2 t h i sp a p e rs t u d i e s c o n t r o l l a b i l i t yp r o b l e m sf o r c o n t i n u o u s - t i m e m u l t i - - a g e n ts y s t e m su n d e rs i n g l e - - i n t e g r a t o rd y n a m i c sa n dd o u b l e - i n t e g r a t o r d y n a m i c s ,r e s p e c t i v e l y w er e c e i v eas p e c i a lt o p o l o g y , a n du n d e rt h i s t o p o l o g y ,t h ec o n t r o l l a b i l i t y w i l l c h a n g ew i t ht h ec h a n g eo fn u m b e ro f f o l l o w e r t h e nw eg e tt h ec o n t r o l l a b i l i t yo fm u l t i - a g e n ts y s t e m su n d e r s i n g l e i n t e g r a t o rd y n a m i c sb e i n g t h es a m ew i t ht h e o n eu n d e r d o u b l e - i n t e g r a t o rd y n a m i c s 3 t h i sp a p e rs t u d i e ss o m ec o n n e c t i o n sb e t w e e nc o n t r o l l a b i l i t ya n d c o n s e n s u s :i fam u l t i a g e n ts y s t e mw i t hs i n g l el e a d e ri sc o n t r o l l a b l e ,i t s o l v e sac o n s e n s u sp r o b l e m ;w h i l et h i sm a yn o tb et h ee a s ei ft h en u m b e ro f l e a d e r si sm o r et h a no n e ,a n ds oo n 4 a nu n c o n t r o l l a b l e m u l t i a g e n ts y s t e m c a nb et u r n e di n t oa c o n t r o l l a b l eo n eb ys e l e c t i n ga p p r o p r i a t ew e i g h t sf o rc o m m u n i c a t i o nl i n k s ; w h i l et h ec o n s e n s u sp r o p e r t yi si n v a r i a n tu n d e rd i f f e r e n tw e i g h t s i tw i l l p l a ya ni m p o r t a n tp a r ti nt h ei n d u s t r ia lc o n t r 0 1 5 s e v e r a l e x a m p l e s a r e g i v e n t oi l l u s t r a t et h ei d e a sa n dt h e c o r r e s p o n d i n gr e s u l t s k e y w o r d s : m u l t i - a g e n ts y s t e m ;c o n t r o a b i l i t y ; c o n s e n s u s ; f i x e d t o p o l o g y ;w e i g h t ilr ll-i, h 卜 p -rttlilr-l r l l【11 f p i l l:,- lljl , ,1i,i1;,i i1、11j1j!-1j1 目录 第一章引言1 1 1 研究背景1 1 2 研究现状2 1 3 研究方法和工具4 1 4 论文的主要内容5 第二章预备理论知识7 2 1 图的基本知识7 2 2 常用矩阵8 2 3 模型1 0 2 3 1 离散时间模型1 o 2 3 2 单积分连续时间模型12 2 3 3 双积分连续时间模型1 4 2 4 本章小结1 5 第三章多智能体可控性研究17 3 1 时离散模型下的可控性问题17 3 2 时连续模型下的多智能体可控性问题2 2 3 2 1 单积分模型下的可控性问题2 2 3 2 2 双积分模型下的可控性问题2 8 3 3 例子与仿真2 9 3 4 本章小结3 1 第四章可控性的相关研究3 3 4 1 可控性和一致性的联系3 3 4 2 例子与仿真3 7 4 3 本章小结4 4 结论4 5 参考文献4 7 攻读学位期间的研究成果5 1 致谢5 3 学位论文独创性声明5 5 t 青岛大学硕士学位论文 第一章引言 多智能体系统的编队控制问题是当前国际上的一个崭新的概念,在 经济学,社会学和对策论等诸多学科中都具有非常广阔的应用前景。目 前对多智能体系统编队控制的研究主要是通过研究多智能体系统的可控 性( c o n t r o l l a b i l i t y ) 来体现的。本文主要借助于对多智能体可控性的研 究以及可控性与一致性( c o n s e n s u s ) 之间的联系来研究多智能体 ( m u l t i a g e n t ) 系统的编队控制问题。 1 1 研究背景 多智能体系统是近几年来一门发展非常迅速的新兴控制科学,它涉 及的领域非常广泛,例如控制、人工智能、物理、机器人【3 卜32 1 、生物等 众多的领域,并且在这些领域里面得到了广泛的应用,例如编队控制【2 】, 无人驾驶飞行器的协作控制【3 】。近几年来,由于多智能体系统的广泛应 用以及合作与编队控制问题的深入研究,多智能体可控性问题的研究得 到了迅速发展,无论在理论上还是在应用上都取得了丰硕的成果。因此 多智能体系统得到了越来越多的专家学者的关注。 一切事物的发展和变化都是有一定的起源的,多智能体系统的研究 是人们通过自然界中的一些现象而受到启发的,例如大雁在迁徙的时候 一会儿排成“人 字,一会儿排成“一字,以及蚂蚁的觅食,蜜蜂的 采蜜,鱼群的防御天敌所表现出来的群体行为,这些生物行为就是一种 典型的群体行为,那么这些群体行为是怎样完成的呢? 生物之间又是如 何进行信息传递的呢? 是否可以把这些生物的群体行为利用到工业生活 中去呢? 多智能体编队控制正是基于这些问题的考虑而发展起来的。 通过大量的研究我们发现,群体行为能够获得比单个个体行为更大 的优势,它并不是单个个体的行为总和,而是全部个体在一定的输入信 号控制下,通过信息的传递、交换以及相互之间的协作,使得整个系统 能够处理的信息量显著增加,且系统的复杂性也明显增强。 多智能体的编队控制问题在现实生活中也得到了广泛的应用,例如 在机器鱼水球比赛中,两条或者多条鱼之间要通过信息传递、定位球和 球门的位置等把球顶入对方的球门之中。在这一比赛中我们发现即使其 中的一条或者某几条鱼不能正常工作,也不会影响其他几条鱼的正常工 作,这就充分说明了多智能体系统抗干扰性强的特点;机器人足球比赛 。1 一 第一章引言 也是近几年来多智能体系统的一个典型应用,在比赛过程中机器人之间 要进行角色的分类,不同的角色承担不同的任务,这就为研究多智能体 系统的相关问题指明了方向,同时多智能体系统的研究必将得到更加广 泛的应用。 将多智能体系统的编队控制运用到工业控制领域能够发挥更加理想 的控制效果。运用多智能体系统编队控制来解决实际问题,具有问题解 决效率高、鲁棒性和可靠性强等优点。多智能体技术应用于实际系统时, 运用该系统中各智能体之间的通讯、合作、协调、调度及控制来表达其 结构、功能及行为特性。对于实际系统来说,多智能体技术的表达力强, 能够提供一种统一的模型,因而其应用的领域十分广阔,具有巨大的潜 在市场。 多个体协调合作行为在人类社会中也是十分常见的,例如交通问 题、团队合作问题等。一个复杂任务的完成常常要求人们对该任务进行 分配,互相配合、团结合作,而通常情况下这个复杂任务对于单个人来 说是很难完成的。在科研工作中,也充分体现了团队合作的精神,科研 成果的取得离不开个人的努力,更离不开团体之间的合作。科研工作大 多具有专业性与方向性,只有充分发挥团队合作的力量,才能够更好地 取得预期成果。 1 2 研究现状 多智能体系统的可控性问题是由h g t a n n e r ( u n i v e r s i t yo fn e w m e x i c o ) 在2 0 0 4 年首次提出的。从此对多智能体系统可控性的研究变成 处理多智能体系统编队问题的一个非常有效的方法,其实质是将编队控 制问题转化成固定拓扑条件下的经典可控性问题及切换拓扑条件下的切 换可控性问题【2 4 1 。 可控性问题的研究是伴随着一致性问题的研究而产生的,在分析多 智能体系统可控性问题之前,介绍一下多智能体系统一致性问题的基本 概念。所谓一致性问题是指给定某种控制规律,使得多智能体系统中的 个体之间相互作用、相互影响,从而使每个个体的相关状态达到一致或 共享 9 1 ,即 x i ( t ) - - - t ,t 专o o ,i = 1 ,n 式中,( f ) 代表多智能体系统中每个个体的状态;t 是一个有限常数。 所谓可控性是指,在一定条件下,通过对多智能体系统内部某个或 某几个智能体施加输入,系统内部各智能体之间通过相互合作和自组织, 青岛大学硕士学位论文 可由任意给定的初始状态到达任意设定的最终状态,那么就称这样的多 智能体系统是可控的。近几年来,可控性问题的分析已经成为解决编队 控制问题的一种常用方法,现已成为多智能体系统研究领域中的一个重 要方向。在对多智能体系统一致性问题的研究中,系统中个体的地位是平 等的;而在可控性问题的研究方法中通常将系统中的个体按其发挥的作 用分为两类:领航者( 1 e a d e r ) 和跟随者( f o l l o w e r ) 。其中,领航者的状态仅 受外界控制信号的影响,而与跟随者的状态无关;跟随者的状态不但受 领航者的影响,而且与其他跟随者的状态有关。一致性研究的是领航者 和跟随者构成的系统;可控性研究的是由跟随者构成的子系统。 近几年来,对于多智能体系统的一致性和可控性的主要研究成果如 下: r e n 对系统的一致性问题进行了详细的分析,在对系统的拓扑图分 析的基础上提出了系统解决一致性问题的充要条件【l0 1 。 x i a o 考虑了在时连续系统中的有限时间状态协议问题,并且提出了 解决有限的时间平均协议问题的充分条件【1 7 】。 s u n 在对系统一致性问题的分析中提出了一个新的方法:树形变换 法。大大降低了研究的工作量【6 】。 t a n n e r 对于单一领导者,在固定拓扑的情况下进行了一系列的研究, 并且将可控性与图理论的有关知识结合到了一起,获得了系统可控的代 数充分及必要条件【2 1 ,为以后的研究奠定了基础。缺少这些条件的图形 理论【9 】描述无法直接建立可控的固定拓扑图。因此,研究如何建立可控 的拓扑图便成为以后许多学者研究的主要方向。同时他证明了拓扑图的 连通性对于系统的可控性有着负面的影响。例如一个全连通图是不可控 的,而一个连通性不是很强的图却能够可控,于是,便引出了一个这样 的问题:系统的可控性和拓扑图的连通性之间有什么样的关系? 在t a n n e r 的影响下,社会上涌现出了一批学者正在进行着多智能体 系统可控性的相关研究 2 0 - 2 3 】, 2 5 - 2 6 】, 2 8 - 3 0 】。 t j i 对于固定拓扑的情况,利用图形理论的描述,提出了多智能体系统 在单个领航者和多个领航者情况下可控的充分和必要条件4 l 。 l i u 在切换拓扑的条件下,对多智能体系统处于时连续和时离散两种 情况下的可控性进行了研究,提出了一些新的理论,并获得了系统可控 的一些充分条件【7 】。 j i 在固定拓扑和切换拓扑的条件下分别讨论了多智能体系统的可控 性问题,从代数和图形两个方面对系统的可控性进行了一些研究。并且 第一章引言 研究得到了系统可控的一个前提条件,那就是领航者跟随者连通拓扑结 构( 1 e a d e r m f o l l o w e rc o n n e c t e d ) ,这一条件的提出大大的减少了可控 性的研究的工作量,不满足l e a d e r f o l l o w e rc o n n e c t e d 这一条件的例 子,通过拓扑图就直接能看出它是不可控的,因而不需要再经过繁琐的 计算【15 1 。 w a n g 在通信存在时滞的情况下讨论了多智能体的可控性问题,给出 了系统可控的充要条件。 近年来,人们对多智能体系统编队控制的关注日益增多,主要从固 定拓扑 2 7 , 3 6 】、切换拓扑 3 8 , 4 6 】;有向图、无向图 3 3 - 3 5 】;时连续 4 0 4 l 】、时离 散【4 5 】;有时滞1 4 2 - 4 3 】 4 8 - 5 0 】、无时滞等众多方面进行研究。在多智能体系 统的研究中有很多的模型,例如b o i d 模型,此模型满足三条基本规律 m l : 碰撞规避( c o l l i s i o na v o i d a n c e ) ,即相邻个体之间互相避免碰撞:速度匹 配( v e l o c i t ym a t c h i n g ) ,即与相邻的个体速度保持一致:相互靠拢( f l o c k c e n t e r i n g ) ,即在空间上向相邻的个体靠拢。它们比较精炼地揭示了自 然界中大多数群体运动的基本特征。它们使得个体在没有集中指挥和缺 少全局信息的情况下,仅仅通过个体之间的局部信息传递、协调即可形 成特定的空间队形,并最终使速度和方向达到一致。 另外,还有一些其他的模型,例如基于逻辑学方法的b d i 模型【5 1 , v ic s e k 等人在1 9 9 5 年从统计力学的角度提出了v ics e k 模型i t 】, j o h n s 1b a r a s 等人采用分散控制的思想建立了一个势场函数的模型【4 】等。 这些模型的建立推动了多智能体系统向全方位发展。 目前,多智能体系统的一致性问题和可控性问题的研究前景十分广 阔,吸引了大批学者进行研究,研究的结果也在不断的更新,但是多智 能体可控性问题的分析大多是在无向图拓扑结构中进行的,在有向图中 的研究还不够完善,并且虽然对于一致性的研究已经趋于成熟,但是可 控性问题和一致性问题大多是单独进行研究的,它们之间究竟有什么样 的联系却很少提到,若将这些联系运用到生产生活中是否能够带来更大 的优势昵? 1 3 研究方法和工具 对于多智能体系统可控性和一致性问题的研究,采用了多种理论和 方法,概括起来主要有: ( 1 ) 图论 在一个有向图或者无向图中可以直接看出多智能体之间的拓扑关 4 青岛大学硕士学位论文 系,有时候根据图的连通程度,可以直接看出该图所表示的多智能体系 统是否可控,以及系统是否能够解决一致性问题。另外在图论的基础上 引出了生成树以及强连通和弱连通的概念,以及根据图和矩阵之间的关 系,可以直接写出图的拉普拉斯矩阵,这些概念对于我们分析多智能体 可控性问题和一致性问题是十分有用的。 ( 2 ) 矩阵理论 在多智能体系统中,可以根据系统的拓扑结构写出系统的拉普拉斯 矩阵,运用矩阵理论对拉普拉斯矩阵的相关性质进行分析,利用矩阵的 特点,将一致性和可控性的研究转换成对相关矩阵的计算。 ( 3 ) 树形变换法 树形变换法的本质是将多智能体系统的一致性问题转化成一个降阶 系统零解的稳定性问题,从而使得文献中关于时滞系统稳定性的一些理 论和方法可以被直接应用到一致性问题中【6 】。 1 4 论文的主要内容 第二章:主要提出一些预备的理论知识,包括图和矩阵的有关知识; 以及对多智能体系统的可控性问题进行了建模和问题的综述。文中首先 给出了图和矩阵的相关知识;然后对多智能体中各智能体进行角色的分 类,分别给出了固定拓扑条件下、单积分情况下时连续和时离散的系统 模型和双积分情况下时连续的系统模型,以及切换拓扑条件下的系统模 型,并且把这几种模型下的多智能体可控性问题,转化成为矩阵表达的 形式,把可控性问题的分析转化成可控性矩阵是否满秩的问题。 第三章:首先,在固定拓扑条件下的有向图中,研究时连续和时离散 单积分模型下的多智能体可控性问题,得到一些结论。从中,可以得出 某些系统的不可控性可以直接从通信拓扑图中得到,减少了繁琐的计算。 其次,又介绍了双积分情况下的多智能体可控性问题。最后,本章中还 针对一种特殊类型的不可控的多智能体系统,提出一种如何选择权重使 其变得可控的方法。另外,针对一类时连续模型下的多智能体系统提出 了一个定理,根据这一定理可以从通信拓扑图中直接得出这一类系统是 否可控。在本章的最后给出了一些例子,并通过仿真来验证结果的正确 性。 第四章:首先,给出了一些重要引理和定义,它们对后面的理论分 析起着十分重要的作用。通过这些定理,得到了在时离散模型下的多智 能体编队控制( 可控性) 跟协调控制( 一致性) 之间的联系,提出了不可 【pll llil!pl p,- ,bp, - l r r i ,- r l p l , , - 第一章引言 系统可以通过改变权重来变得可控,而不能解决一致性问题的多智 系统,则不能通过改变权重的方法来使其解决一致性问题,同时提 可以通过在图中加一条边来使系统变得可控。最后给出了一些例子, 证结论的正确性。 6 ,lllj_、11j 青岛人学硕+ 学位论文 2 1 图的基本知识 第二章预备理论知识 图是在分析多智能体系统的可控性问题中采用的一个重要工具。在 分析多智能体系统的可控性问题时,个体之间的通信拓扑关系通常用图 来表示。 有向图( 无向图) g 是由非空的顶点集y ( g ) 和边集e ( g ) 构成的,其 中矿( g 产 k ,i e l ,l = 1 ,2 ,万 ,e ( g ) c ( k ,) :f ,j 厶 ,图g 的每条边对 应着g 的无序顶点对。如果,v ,v ( g ) ,并且( h ,y ,) e ( g ) ,那么称和y , 是互为邻居,有向图( 无向图) g 的邻居集m 定义为 = v “k ,1 ,) e ( g ) ,i ) 如果( k ,1 ,) 是有向图g 的一条边,则,定义为这条边或者顶点1 的子 顶点,而 定义为这条边或者顶点v ,的父顶点,( ,1 ,) 表示个体_ ,能够收 到个体f 所传送的信息;在无向图中( k ,y ,) 和( y ,k ) 是等价的,即个体能 够收到个体f 所传送的信息,同时个体f 也能够收到个体j | 所传送的信息。 如果在有向图g 中任意两点之间都是邻近的,那么这样的图叫做强连通 图,如果,在有向图g 中的任意两点之间总存在着一条弱路径,即 ( k ,v j ) e ( g ) 或者( 1 ,v ) e ( g ) 则称有向图g 是弱连通的;在无向图e p 强连 通和弱联通统称为连通。( v ,v ) 这样的边称为自环,在本文中不考虑有自 环和两个结点之间存在大于等于两条边的情况。有向图中的一条路是一 个有限的顶点序列m 。,m :,满足( 以+ 。) e ( g ) ,s = l ,2 ,k - i 。 若有向图( 无向图) g 满足矿( g ) c 矿( g ) ,e ( g ) ce ( g ) ,则称g 为g 的 一个子图。如果子图g 满足矿( g ,) = v ( g ) ,那么g ,称为g 的生成子图;若任 意的m ,矿( g ) ,都存在( _ ,y ,) e ( g ) ( _ ,) e ( g ) ,那么就称g 为诱导 子图。有向图g 的生成树是一棵有向树,而且是有向图g 的生成子图。 若有向图的顶点集和其中的一个边子集能构成一个生成树,那么就称此 有向图具有生成树。 对于矩阵p = 岛】r ”,若矩阵p 中所有的元素都是非负数,则可以 表示为尸0 ;若矩阵尸中所有的元素都是正数,则表示为尸 0 ;若矩阵户 中的元素全都是零,表示为p = 0 。 7 第二章预备理论知识 g ( 彳) 是由一个图g 和一个非负矩阵a = 【口f ,】( 其中矩阵a y r 雕4 , f ,j = 1 ,2 ,n + i ,如果n = 1 ,则a 打是一个数) 组成的,那么就称矩阵彳为 图g 的加权邻接矩阵,口:f 为边( v ,k ) 的权( 嘞是一个数) 或权重矩阵。如 果v ,和v ,是邻近的,那么矩阵a j i 0 ,否则a j l = 0 。若矩阵a 中元素只有0 或l 构成,那么称矩阵彳为无权邻接矩阵。在无向图g 中,彳是一个对称 矩阵( 即a r i ia ) 。 2 2 常用矩阵 本文主要用到度矩阵、拉普拉斯矩阵以及边拉普拉斯矩阵,度矩阵 可分为内度矩阵( i n d e g r e em a t r i x ) 和外度矩阵( o u t d e g r e em a t r i x ) 。 在 图g 中, 由对角线元素西= 叩g 巾组成的对角矩阵为内度矩阵 d = d i a g ( a i 。) ,其中,i = 【1 ,1 ,1 】1 矩阵彳为邻接矩阵( 加权或无权邻 接矩阵) 。同样地,由对角线元素4 = 小费( g 勺组成的对角矩阵为外度 矩阵b = d i a g t j 一。) ,其中,矩阵j 4 - t l i j r 脯”满足对于任意的f j f ,如果 u 和巧是邻近的,那么矩阵嘞 o 。 在无向图中,内度矩阵与外度矩阵是 相等的,统称为度矩阵;在有向图中它们是不相等的。在代数图论中, 常用的研究工具是拉普拉斯矩阵,它能够反映出图的连通程度。图g 的 拉普拉斯矩阵三( g ) = 2 :f , 定义如下: 岛= 一a 口,i j ,j n i 勺,i = j j e n t 0 , 其他情况 2 一( 1 ) 对于图g ,拉普拉斯矩阵l = d a 。其中,d 和彳分别是内度矩阵和邻接 权矩阵。其中,若矩阵a 是无权邻接矩阵,即矩阵a 中的元素全为0 和l , 并且有矩阵b r 吖。,其中刀为图g 中点的个数,m 为图g 中边的条数, 矩阵b 中的元素为( 一1 ,0 ,1 ) ,并且满足 f + l如果i 是边眈的起始点 【b 】陆= 一l 如果f 是边坟的终点 10其他情况 青岛大学硕士学位论文 那么所对应的无向图的拉普拉斯矩阵三还可以写成l = b b r 。 图2 1 具有4 个个体的多智能体 如图2 1 所示,可以直接写出矩阵b ,并根据l = b b r ,写出矩阵工 b = 11o 1ol 01 0 00一l ,l = 21 1o 12o1 一lo1o o10l 拉普拉斯矩阵具有以下性质: ( 1 ) t ( a ) l = 0 ,即三( g ) 有一个特征值为o ,且l 是0 特征值所对应的特, 征向量,其中1 = 【1 ,1 】r ; ( 2 ) 若g 具有生成树,那么( g ) 只有一个o 特征值,其它的所有特征 值都具有正实部; ( 3 ) 当g 是一个无向图时,l ( g ) 是一个对称矩阵,满足l r 三( g ) = 0 , 并且三( g ) 是半正定的; ( 4 ) ( g ) 的特征值为 ,五oo 矗,且o = 五乃,那么五是( g ) 的第 二最小特征值,它代表着图g 的代数连通程度。 研究无向图的相关知识时还要用到另一种非常重要的矩阵,叫做边 拉普拉斯矩阵,记为乞,并且t = b 7 b ,丘酞”,其中m 为图g 中边 的条数。边拉普拉斯矩阵t 的特点【18 1 为: ( 1 ) 边拉普拉斯矩阵丘的非零特征根等于拉普拉斯矩阵三的非零特征 值。 ( 2 ) 边拉普拉斯矩阵t 和矩阵的非零特征根式矩阵b 单根的平方。 山图2 1 可以写出该图所对应的边拉普拉斯矩阵为 o 第二章预备理论知识 2 3 模型 考虑由+ ,个个体组成的多智能体系统,每一个多智能体都是一个 具有自主能力的动态个体,从1 到+ z 对它们进行编号。五拟表示每个 智能体的状态,个体的状态空间可以是任意维数的,但是必须保证该系 统中的每个个体的维数相同。为了简化计算,通常只考虑刀= 1 的情况, 那么前面所提到的矩阵a u r 棚就变成了一个数,具体应用到力维状态空 间时,可以通过矩阵的直积运算,把系统矩阵化成相应维数的高维矩阵 来进行处理。通常研究的多智能体编队控制和协调控制都是在二维空间 中进行运算的。 在多智能体系统的研究中常常根据其在整个系统中所发挥的作用进 行角色分类,一般情况下分为领航者( l e a d e r ) 和跟随者( f o ll o w e r ) 这两个概念。如果一个个体发送信息到其他个体,那么这个个体就是一 个局部的领航者,如果它收到从其他个体发来的信息,那么它又是一个 局部的跟随者。系统的整体行为是多个个体局部相互作用的结果,多智 能体系统中的全局领航者是决定该系统最终状态的个体。 在本文中,我们考虑多智能体系统中的全局领航者之间能够互相发 送信息,它们能够向全局跟随者发送信息,而接收不到来自跟随者的信 息,它们自身的运动规律依赖外界输入的控制信号及它们之间的相互作 用;全局跟随者不但可以收到领航者发来的信息,也可以收到其他跟随 者发来的信息。这样,在研究的过程中就通过更改控制信号来达到预先 设计的控制目标,即保持某一队形。本文中,领航者和跟随者遵循着同 样的动力学方程。 2 3 1 离散时间模型 考虑由n + 1 个多智能体组成的系统,其中,跟随者是编号为l ,2 ,n 的个体;领航者是编号为n + i ,n + i 的个体。 多智能体系统遵循下列动力学方程 1 0 1 0 2 l 2 o2 o l = t 青岛大学硕士学位论文 ( 后+ 1 ) = 五( 后) 一( t ( 尼) 一屯( 足) ) 一( 誓( 忌) 一( 尼) ) ,足以 2 - ( 2 ) v e n tv 垃t n t 其中,f ,z = 1 ,2 ,;五= + l ,n + l ;噬= r 肌;形= r 肌; 嘞0 ,_ ,= l ,2 ,n ,+ l ,n + i ,如果( v f ,v ,) ,则 o ( 不加权时= 1 ) , 否则w ,= 0 。彤表示该系统中所有跟随者之间的通信拓扑关系;w 表示该 系统中跟随者与领航者之间的通信拓扑关系;,。是一个离散的时间序列。 如果把所有多智能体的状态写成向量的形式,就可以将时离散系统 2 一( 2 ) 表示成矩阵的形式 x ( 七+ 1 ) = x ( 七) 一l u x ( k ) 一m ( k ) + w x o ( k ) , 2 一( 3 ) 其中,x ( 后) = 【五( 七) ,t ( 尼) ,h ( 后) 】是该系统中所有跟随者的状态向量; ( 七) = 【h + 。( 后) ,h + :( 七) ,x u + ,( 七) 】2 是所有领航者的状态向量,也是所加的外 部输入( 通过改变输入x ( 七) ,达到预期的控制目标) ; r1 尺= d i a g l m ( 办) ,比( 止) ,一,w u ( ) l 是一个对角矩阵;如r 肌表示由 l 6 坼 6 川6 川 j 个跟随者构成的子系统所对应的拉普拉斯矩阵。式2 一( 3 ) 可以进一步写 为 x ( k + 1 ) = v x ( k ) + ( 七) 2 一( 4 ) - 其中,f = i 一三一r 。 式2 ( 4 ) 是在固定拓扑条件下的得到的系统模型,所谓固定拓扑是指 系统的领航者与跟随者之间或跟随者与跟随者之间的通信通道不会随着 时间的变化而变化( 即式2 ( 4 ) 中矩阵,与矩阵是固定不变的) ;但有时 信息通道会随着时间而变化,这种随时间变化的通信拓扑关系叫做切换 拓扑,在切换拓扑条件下的多智能体切换系统可表示为 z ( 七十1 ) = c ( 女) x ( 尼) + 乃:( 女) x o ( k ) 其中, 仃( 七) : 1 ,2 ,) 寸 1 ,2 ,k ) 表示为系统设计的切换路径。 2 一( 5 ) 第二章预备理论知识 2 3 2 单积分连续时间模型 设由+ z 个多智能体构成的连续时间系统满足下列动力学方程 i = 1 ,2 ,n , j = l ,2 , 2 一( 6 ) 跟随者与领航者的编号如离散时间模型中所述,薯,f = l ,2 ,n 为跟随 者的状态,x a , 妒j = l ,2 ,是系统中领航者的状态,吩为第f 个个体的控制 输入( i = l ,2 ,n + 1 ) ,各智能体之间的通信关系是通过一定的控制输入来 实现的,本文中的控制输入满足 吩= 一w v ( x , 一x j ) , v j e n t f 1 ,2 ,n + i 其中,磁= 1w ,l r ( “m + o ( w ,0 ) 为耦合矩阵,表示系统中所有个体之 一 k7 一y 问的耦合关系。一般情况下,系统中个体之间所传送的通信信息是不同 的,即两个个体如果能够同时接收和发送来自彼此的信息,那么这两条 通信通道的所传送的信息是一般不相同,也就是系统中有向边的信息通 道所对应的权重一般不满足w ,= w 。在本文中,如果没有特殊说明,我 们认为个体之间的通信信息是相同的,即权重相等并且为1 。将系统中全 部个体的状态表达成向量的形式,那么上述协议表示的多智能体系统 2 一( 6 ) 可以表示成如下所示的矩阵形式 戈( f ) = 一l x ( t ) , 2 一( 7 ) 其中,= r 。+ 坝+ ,) 为系统所对应图g 的拉普拉斯矩阵。其定义形式下 岛= 从这一定义可以看出,如果系统的权矩阵是由o , n1 组成的,那么矩阵的 非对角线元素是由一1 或0 组成。如果系统所对应的图g 为加权图,则称 = = 毛 吖 知 ,j、【 m p l弩邓地 扛其 , 叫q 一 青岛大学硕士学位论文 矩阵为加权拉普拉斯矩阵( w e i g h t e dl a p l a c i a nm a t r i x ) 。 对于状态空间是n 维的个体,式2 一( 7 ) 可以用矩阵的直积表示为 2 ( 0 = 一( 三 i 。) 工( f ) , 其中i 。表示刀维单位矩阵。 多智能体系统的动力学方程经过代换,重新写成如下所示的方程 1 只( f ) 全薯( f ) , 【z j ( t ) 会x n + ) , i = 1 ,2 ,n , j = l ,2 , 如果将系统中的领航者g j 和跟随者y i 的状态分别表示成向量的形式 y = 【y 。,y :,y 】r 和z = k ,乞,乙】r ,那么式2 一( 7 ) 可以表示成 嘲= 一 瑚嘲忆 , 其中,矩阵f 是从一个n x n 的矩阵,它是删掉系统拉普拉斯矩阵中的最 后,行和,列元素后得到的,它表示系统中的跟随者之间的耦合关系;矩 阵是一个z ,矩阵,它是删掉系统拉普拉斯矩阵中起始的行和列元 素后得到的,它表示系统中领航者之间的耦合关系;矩阵犬是一个n x l 的矩阵,它是删掉系统的拉普拉斯矩阵中最后,行和起始列元素后得到 的,它表示系统中领航者与跟随者之间的耦合关系;另外,甜( f ) 酞7 是对 领航者所施加的外来控制信号。本文研究的是多智能系统中的跟随者在 领航者的控制下能否可控的问题,所以上述动力学方程表示的连续时间 模型下的多智能体系统可以用矩阵表示为 夕( f ) = 一f y o ) 一化( f ) 2 一( 8 ) 在连续时间模型中,领航者与跟随者之间的信息传送通道也会随着 时间的变化而变化,那么同样的可以得到在切换拓扑条件下的多智能体 系统动力学方程 夕( f ) = 一c ( ”j ,( f ) 一心( ,) z ( f ) 2 一( 9 ) rkfilrr ii r-lll【fh:,l,-l-l-,l-l l:- 第二章预备理论知识 其中,分段函数盯( f ) :r + 一u - - 1 ,2 ,k 表示系统需要被设定的切换信号。 给定一个控制信号o r ( t ) : t o ,f 专,其中切换时间序列气, ,f j 一。满足 气 f l k 和一个相应的输入u ( k ) ,使x ( ,) = 0 ,那么 式2 一( 4 ) 所表示的系统是可控的,也即所对应的可控性矩阵q 是满秩的。 定理3 - 1 :考虑由方程2 一( 4 ) 描述的有向图下的多智能体系统,如果 其中有两个或者是多个跟随者只收到来自同一个智能体的信息,那么不 管这两个跟随者有没有信息发出或者是不管其把信息发送给哪几个多智 能体,这样的多智能体系统肯定是不可控的。 证明:假设系统中有两个跟随者只收到由同一个智能体发来的信息, 那么可以得到 l = ,f = 幸 幸 o o o o 幸幸 其中,用半来替代矩阵中一些数,在该证明中不需要知道这些数的具体数 1 7 宰;拳 1 1;幸 奉;事 0 o;事 母; o l;幸 宰;奉 l 0; 第三章多智能体可控性研究 值。从矩阵,的表示中可以看出其中有两行的元素是相同的,如果这两 个跟随者收到的信息是来自于同一个领航者,那么向量矿中与这两个跟 随者对应的元素值都为l ;如果它们收到的信息是来自于同一跟随者, 那么向量缈中与这两个跟随者相对应的元素值都为0 。由式3 一( 1 ) 可知, 系统的可控性矩阵q 中也有两行是一样的,那么矩阵q 就是不满秩的, 也即这样的系统是不可控的。 如果系统中有更多的跟随者只收到来自同一个智能体信息的情况, 系统也同样是不可控的,证明方法跟上述思路是一致的,在此不加详述。 注3 1 :从定理3 1 中可以看出,如果一个多智能体系统的通信拓 扑图是由一棵有向树构成的,并且这棵树中有一些来自同一个顶点的树 枝,那么这样的系统是不可控的,所以在判断一些系统是否可控时,可 以直接从它的拓扑结构图中直接看出来。 观察自然界的树,有很多树都有来自同一个顶点的树枝,也就是说 很多有向树拓扑结构下的多智能体系统都可能是不可控的。这些不可控 的系统可以通过改变权重来使其变的可控。下面给出一种通过改变权重 来使一类不可控系统变成可控的方法。 图3 1一类具有来自同一个顶点树枝的有向树 定理3 2 :如果时离散模型下的多智能体系统的通信拓扑图如图3 1 所示,其中,编号为+ l 的个体为领航者,跟随者是编号为1 ,2 ,的个 体,并且为偶数,那么该系统是不可控的。对于图3 1 所示的通信拓 扑关系图,如果按照下列原则选择各智能体之间的权重,那么系统就会 变为可控: 选择个体+ 1 和个体l ,个体2 七+ 1 和个体2 七+ 3 之间有相同的权重, 其中,k = l ,2 ,( 一4 ) 2 ; 青岛大学硕士学位论文 除了条件中所提到的个体,其余的多智能体之间选择不同的权 重,同时,要保证与条件所描述的个体之间的权重不同。 证明:首先证明图3 1 所示的这一类系统不可控。 由图3 1 所示的通信拓扑结构可以直接写出该多智能体系统所对应 的矩阵和向量 厶= oo oo o0 oo 幸毒事宰 搴毒奉宰 ,f = lo oo o1oo 木幸书 奎拿幸 ,矽= 其中,幸代表一些具体的数值,在该证明中不需要其具体值,但是这些数 不一定是相等的。根据可控性矩阵q 与矩阵f 和向量形之间的关系,以 及矩阵,和向量形的特点,可以得到可控性矩阵q 为 q = ll ll 0o : o o 宰的相关值如前所述,可以看出矩阵q 中有两列元素是相等的,那么矩阵 q 是不可控的,即图3 1 所示的这一类系统是不可控的。 为使系统可控,按照如下方法选择权重:假设条件中所提到的多 智能体之间的权重为1 ,中个体l 和个体4 之间的权重为2 ,个体2 七+ 1 和 个体2 k + 4 之间的权重为七+ 2 ,其中,k :1 , 2 ,_ n - 4 ,个体n + 17 t * 1 个体2 么 , 之f s j 的权重为芸+ 1 ,那么可以得到 1 9 ;事 幸 毒 串;幸 第三章多智能体可控性研究 由f - - i - 厶一r 得 l = 系统的可控性矩阵为 q = oooo 00 o o 一1olo 20 o 2 0o o o o0 0 0 o n 2n 42 1 2 o 0 o f = 0 0 0 o o0 oo 1o h n u 一 2 ,形= l + 盟 2 0 0 : 0 0 oo oooo 一盟ooo oo 2 lo 2 o : oo 0o 0o ol 0o 00 00 oo o0 o1 一坐 2 0 o 0 32 + 84 o _ 2 l 3 0 n 舻 1 68 0 2厶 o 一6 o o0oo 口 0 b 0 c 其中,口= ( 譬+ 1 ) ( 一n n n + 1 ) ( 一譬) 一2 ;c = ( 譬+ 1 ) ( 一譬) 一;d = 2 ( 一1 ) ,; 2 0 : ij1 j j l : _ _ 1 j i j j l : i 2 、, 2 o 2 o g ;0 0 一2 一 一2 o之。厂;o2 o 一2 0 d o p;一2 。一2 o o o o ;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论