非线性多智能体一致性系统的研究_第1页
非线性多智能体一致性系统的研究_第2页
非线性多智能体一致性系统的研究_第3页
非线性多智能体一致性系统的研究_第4页
非线性多智能体一致性系统的研究_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

非线性多智能体一致性的研究上海电力学院本科毕业设计(论文)题 目: 非线性多智能体一致性系统的研究 院 系: 自动化工程学院 专业年级: 自动化(电站方向)2015届 学生姓名: 陆成 学号: 20111557 指导教师: 邓亮 2015年 6月11日【摘 要】近年来,随着计算机技术、 网络技术和通信技术的飞速发展,多智能体系统的分布式协调控制问题引起了科学界的广泛关注,其中,又以多智能体的一致性问题最为热门。“一致性”指的是在有限时间内,所有智能体的状态趋于相同。虽然人们在早期的探索中取得了大量的成果,但仍有许多问题值得进一步研究。本文基于前人的研究成果,讨论了多智能体系统一致性协议中的几个重要方向。例如,如何在保证系统一致的前提下,准确得出系统通信时滞的上界。如何选择相关控制律,使得系统在通信拓扑时刻切换的条件下依然能达到一致。如何设置相应参数,使得在有非线性噪声干扰的条件下,多智能体系统能达到理想的一致效果,等等。 本文研究了非线性协议下具有时变通信时延的多智能体系统的一致性问题。提出了有向通信拓扑下,智能体状态有约束的网络的非线性一致性协议。基于代数图论和Lyapunov稳定性理论,以线性矩阵不等式形式给出了保证网络中所有智能体状态达到平均一致的充分条件。在很多实际应用中,常常不可能直接控制智能体的状态信息导数。针对这种情况,本文研究了具有时变通信时延的多智能体系统的二阶一致问题。提出了有向通信拓扑下,智能体状态信息导数不便控制的二阶一致算法。基于代数图论,无源化分解方法和Lyapunov稳定性理论,以线性矩阵不等式形式给出了保证系统中所有智能体状态以及状态导数渐近收敛到一致的充分条件。另外,本文的结论能很容易地拓展到高维状态问题中。最后给出了几个数值仿真例子,证明了所给结论的有效性。最后,对全文的研究工作进行了总结,并对今后的研究重点进行了展望。关键词:多智能体系统;平均一致;二阶一致;时延;非线性协议 【Abstract】In recent years, the coordination control problems of multi-agent systems have received much attention from many researchers from various disciplines of engineering and science. This is partly due to broad applications of multi-agent systems in many areas including cooperative control of unmanned air vehicles(UAVs), formation control,flocking, swarms, distributed sensor networks, and congestion control in communication networks. The critical problem for cooperative control is to design appropriate protocols or algorithms so that the multi-agent systems can emerge to a certain desired pattern or behavior, which is so-called “consensus problems”. With the presence of potential applications of the multi-agents distributed cooperative control, consensus theory is fast developing. Under the aforementioned background, based on algebraic graph theory,matrix theory and control theory, the model construction and convergence analysis of consensus problems in multi-agent systems are studied in this thesis.In this thesis, consensus problems in directed networks of multi-agents under nonlinear protocols with time-varying communication delays are discussed. A nonlinear protocol is presented in the case of agents limited state information with directed communication topology. Based on algebraic graph theory and Lyapunov stability theory,sufficient conditions in terms of linear matrix inequality are given to guarantee that all the agents achieve average consensus asymptotically.In many important applications, it is not generally possible to directly control agentsstates information derivatives. A second-order consensus algorithm is presented in this case with directed communication topology and time-varying delays. Based on algebraic graph theory, passive decomposition method and Lyapunov stability theory, sufficient conditions in terms of linear matrix inequality are given to guarantee that all the agentsstates and derivatives converge to consensus asymptotically. Moreover, this result is easyto be extended for multi-dimentional state problem. Some simple numerical examples aregiven to demonstrate the validity of our theoretical results.Finally, a summary has been made for all the research works in this thesis. The research works in further study are presented.Keywords: Multi-agent systems; Average consensus; Second-order consensus; Time-delay; Nonlinear protocol 目录1绪论- 1 -1.1引言- 1 -1.2选题的背景和意义- 1 -1.3国内外研究现状- 3 -1.4本文的研究内容- 4 -2一致性的相关理论与结果- 5 -2.1引言- 5 -2.2一致性的相关理论与结果- 5 -2.2.1代数图论知识- 5 -2.2.2一致性协议- 6 -2.3解决一致性问题的主要框架- 9 -2.3.1固定拓扑下的一致性协议收敛性分析- 9 -2.3.2固定拓扑下的均衡状态- 10 -2.4本章小结- 11 -3非线性协议下带时延的多智能体系统的一致性- 12 -3.1引言- 12 -3.2问题的提出- 12 -3.2.1基本定义和引理- 12 -3.2.2 非线性一致性协议的提出- 14 -3.3 非线性一致协议收敛性分析- 15 -3.4仿真结果- 16 -3.5 本章小结- 20 -4具有时变时延的多智能体系统的二阶一致性- 22 -4.1引言- 22 -4.2问题的提出- 22 -4.3二阶一致协议的收敛性分析- 24 -4.4仿真结果- 25 -4.5本章小结- 28 -5总结与展望- 30 -5.1全文总结- 30 -5.2研究展望- 30 -致谢- 31 -参考文献- 32 -1绪论1.1引言奇妙的自然界孕育了千千万万的物种,不同的生物种群以他们独有的方式生存、衍化。天空中的鸟群以“人”字形或“一”字形飞行,海底的鱼群也以特定的队形游动,即使遇到障碍物时,它们也能规避冲突,保持编队。不仅如此,在飞行或游动过程中,它们的速度也惊人地匹配。因此,我们不禁要问,这些智能体之间是如何进行通信,如何调整自身状态以致整个集群系统朝同一方向演化?带着这个疑问,很多学者开始关注多智能体之间的分布式协调控制问题。所谓“分布式协调控制”,是指这些智能体通常只根据自身和邻居智能体的信息更新状态,但能共同合作完成某项任务。但它们之间的通信拓扑也会受到扰动,通信时延以及过程或传输噪声的影响。因此,如何将生物界中的这种普遍现象抽象为简单的数学模型,具有很大的挑战性。理论的发展速度是惊人的,基于代数图论的知识,学者们给出了一系列解决集群系统一致性的算法。将图中的节点表示各智能体,图中的边表示智能体之间的相互作用关系,则集群的运动特性可以由节点的动力学行为来表示。在此背景下,本文以多智能体系统为研究对象,以代数图论,矩阵论和控制理论为工具,在系统建模、一致性协议收敛性分析等方面展开了研究。1.2选题的背景和意义多智能体系统是人工智能和复杂大系统领域中的一个较新的研究方向,在生物、工业、运输、股票、军事、电力等领域有着良好的应用前景。近年来,对多智能体系统的研究在学术界得到了广泛关注,逐渐成为复杂大系统领域的热点问题。多智能体系统是由大量自治或半自治的智能体通过一定的网络拓扑构成的系统,是一类建立在系统之上的系统,其表现效果在于能够产生明显的整体同步效应。此类系统中的每一个智能体都具有一定的自主性,但单个智能体仅能与周围局部环境进行信息交互,在无集中式控制的情况下,整个系统将表现出动态稳定的行为,如同步,环状漩涡等,这一现象称为涌现(Emergence)。生物界中普遍存在涌现现象,例如:空中排成不同队形的大雁,在头雁的带领下,排成“人”字形或“ 一”字形(图1-1),不但可以高效地飞行,还可以防止成员掉队;海洋里的鱼群(图1-2),不但速度出奇地一致,而且可以灵活地躲避攻击;蚁群在寻找食物时分工明确,通过合作完成了个体难以完成的任务。在人类社会中,同样存在着涌现现象,如大会上,人们的掌声趋于一致,又如同一横梁上两个时钟钟摆,经过一定时间后,它们的运动频率也将趋于相同。这样的规模群体只是依靠个体与个体之间的信息传递,逐步的协调最终完成任务,即这些个体只具有局部感知能力,而无法掌握整个群体的全局信息,因此这个系统具有分散式,分布式的特点,而没有集中式的管理特点,近年来,如何通过局部信息传递产生全局的的系统行为已经成为研究的热点问题。上面提到的分布式系统最先应用于计算机系统,是一种计算机硬件的配置方式和相应的功能配置方式。系统采用分布式计算结构,即把原来系统内中央处理器处理的任务分散给相应的处理器,实现不同功能的各个处理器相互协调,共享系统的外设与软件,这样就加快了系统的处理速度,简化了主机的逻辑结构。分布式控制方法应用于多智能体系统的最大的优点在于:由于系统的分布分散,使得鲁棒性提高,也就是说某一个智能体的瘫痪或无故脱离网络,都不会对整个网络和控制系统造成影响,并且相对造价较高的集中式控制系统,分布式控制系统的成本大大降低了,目前,多智能体系统普遍采用分布式协调的方法进行研究。现代控制系统向复杂化、大型化以及非线性化方向发展,这对于复杂控制系统的研宄提出了新的挑战:突破任何一种原始的、单纯的范式,进而釆取多个分系统或者子系统有机综合而成的新型控制形式。多智能体系统技术的发展为复杂化、大型化以及非线性系统的智能控制提供了一条新的途径。采用多智能体系统的技术进行控制,可以按控制应用的要求,分解原来单一的,庞大的以及非线性的系统。利用多智能体系统的技术进行控制,也可以从功能上划分多个智能体,以期完成原来复杂系统的控制任务。多智能体控制系统不仅具备普通的分布式系统所具有的信息共享、易于扩展、可靠性高、灵活性好以及实时性强的特性,而且各个智能体之间能够通过相互通讯、相互协调以及相互融合在许多方面诸如机器人、计算机网络、制造业、电力系统、交通控制、社会学仿真、虚拟现实、计算机游戏、军事应用上解决复杂的控制问题。智能体本身的分布式协作能力是多智能体控制系统的基础,同时,也是整个多智能体系统智能性的体现以及发挥多智能体控制系统的优势的关键。在多智能体系统的协调控制问题中,协作所需要的信息通过一系列的方式在系统个体之间共享。例如:相对位置传感器可以使智能体建立关于其它个体的状态信息,智能体之间的信息通过无线网络进行共享,这些信息包括相同的控制算法,共同的目的过程中,应具有仍然能够应付环境的改变或者突发状况的能力。而且,随着环境的变化,需要根据个体之问的局部信息设计出针对个体的协作策略,使得个体够在某些关键信息(关键量)上达到一致或共享。所谓一致性问题(consensus or agreement problem),就是多智能体系统中的个体按照某种控制规律,通过之间的相作用、相互影响,每个个体的状态达到一致或共享一致性问题作为智能体之间作协调的基础,在多智能体系统的研究中长期占有重要的地位,并且到目前为止已形成了比较系统的理论体系。因此,对于多智能体系统的研究,尤其是多智能体系统的一致性研究,其有着极其重要要的理论意义和实际价位。图1-1大雁南飞图1-2海洋鱼群1.3国内外研究现状最近,我国林鹏等利用线性矩阵不等式方法研究了二阶智能体网络的一致性问题,基于无向拓扑的条件,分别得到定时滞和变时滞的上限。北京大学谢广明对一类动态多智能体系统展开研究,并取得了一定的成果。任伟等研究了在固定但不连通拓扑及参考状态时刻改变的情况下,系统达到一致所需的条件。虞文武研究了在有向拓扑的情况下,时滞二阶多智能系统达到一致状态的限制条件。最近,刘学良研究了多智能体系统在不统一时滞情况下达到一致的条件。2005年,Mureau提出了一种多智能体系统的模型,每个智能体会根据邻域内邻居智能体的信息,更新当前的状态。作者给出了所有的智能体状态最终收敛为一个定常值的充分必要条件,并利用系统论和图论的方法,分析该多智能体系统一致性问题的收敛性,给出了在不对称的时滞情况下多智能体系统收敛的一致性协议。以上的系统分析表明,当多智能体系统是固定拓扑结构时,一旦系统始终保持连通,智能体的状态最后会趋于一致。当多智能体系统是切换拓扑结构时,只要在有限的时间内系统始终保持连通,每个智能体状态最后会趋于一致。此外,研究;还发现,更多的通信联系并不能造成多智能体状态的快速收敛,反而可能会加剧收敛性能的损失。2007年,Tanner利用力学和势场函数方法,分析了具有固定拓扑和动态拓扑的无向网络多智能体群集运动,并利用控制论、代数图论和非光滑理论等方法针对多智能体控制系统进行了稳定性分析。1.4本文的研究内容(1)首先阐述了多智能体一致性问题的研究背景,意义和目的。接下来概述了多智能体网络的一致性的主要研究成果,国内外的研究动向以及该研究领域的一些问题。最后给出了本文的研究内容和研究意义。(2)介绍多智能体系统的一致性。包括矩阵论、图论基础和一致性问题的数学描述,并对一致性问题研究的理论重点热点和应用前景进行了综述。(3)研究了非线性协议下具有时变通信时延的多智能体网络的一致性问题。通过建模,收敛性分析,验证了所给协议的有效性。(4)研究了具有时变通信时延的多智能体系统的二阶一致问题。在已有的二阶一致算法基础上,加上了时延的因素。通过推导,得出了解决一致性问题的充分条件,并将此结论拓展到多维状态问题中。(5)对全文的工作进行了简单的回顾,并对今后的研究重点进行了展望。- 38 -2一致性的相关理论与结果2.1引言本章主要介绍具有单积分特性的多智能体系统的一致性基本协议。对固定和动态变化拓扑下的连续时间和离散时间一致性协议分别进行分析,在存在通信时延的情况下,提出了相应的改进算法保证系统状态达到一致。2.2一致性的相关理论与结果2.2.1代数图论知识令为一个阶()赋权有向图,其中为非空节点集合,为边的集合,权值邻接矩阵的邻接元素为非负值。节点指标属于一有限指标集,的边用表示。与图的边对应的邻接元素为正,例如,。另外,我们假定对所有的,。节点的邻集由表示。集合中元素的数目称作节点的出度,由表示。类似地,集合中元素的数目称作节点的入度,由表示。令表示节点的值。我们将拓扑(或信息流)为,状态值为的网络(或代数图)表示为。节点的值可能代表某些物理量,比如位置,温度,速度,姿态等等。相关的图拉普拉斯矩阵,为对角阵,其中对所有,。因此,可表示为:通过定义可知,图拉普拉斯矩阵每行的行和为零。因此,拉普拉斯矩阵总有一个关于右特征向量的零特征值。这也意味着。定义2.1 在有向图中,当且仅当图中的任意两个节点能通过边集中的有向路径连接起来,则该有向图是强连通图。对无向图来说,任意节点对之间有路径连接,则该无向图为连通图。 定义2.2 当且仅当图中所有节点的入度和出度相等时,称该图为平衡图。任意一个无向图都是平衡图。引理2.1 令为邻接矩阵的有向图,则如下的结论是等价的: (a)图是平衡的;(b)是图拉普拉斯矩阵关于零特征值的左特征向量。即。注意到无向图可被视作有向图的一个特例。有向图考虑了信息流单向传播这一更普遍的情况。2.2.2一致性协议假定所考虑的动态智能体网络包含个智能体。每个智能体被视作有向图中的一个节点。每条边对应在时刻,智能体到智能体之间的可靠信息传递。另外,每个智能体只根据自身和它邻居智能体的信息改变目前的状态值。考虑单积分器智能体动力学特性,令其中,为智能体的信息状态值,为时刻时的控制输入。当且仅当所有智能体的状态满足,时,称协议能渐渐近解决一致问题。此时,所有节点的共同状态值称为群体决策值。具有单积分特性的系统连续时间一致性的基本形式: (2-1)其中:为邻接矩阵的权值元素。根据,可以将上式改写成下面的矩阵形式: (2-2)其中:,如上文中定义,矩阵元。显然,单积分系统(2-2)的稳定性取决于图拉普拉斯矩阵特征值的位置。令连通图为无向图,则下面的性质成立:称为矩阵的第二最小特征值,也表示图的代数连通度。应用圆盘定理,能够得到了公式(2-1)解决一致性问题的充分条件:引理2.2 考虑单积分系统,其中每个节点应用公式(2-1)。假定为强连通有向图,则公式(2-1)能解决系统的全局渐近一致问题。引理2.3 当为强连通平衡图时,公式(2-1)能解决系统的全局渐近平均一致问题。即系统状态的最终一致值为。很多研究平均一致性问题的文献都会用这种分解方法,因为将描述系统一致特性的动力学模型转化为这种误差系统后,利用我们熟悉的李雅普诺夫函数方法,可以得到保证误差系统渐近稳定的充分条件,进而解决原系统的平均一致问题。 基于上述模型,作者还考虑了固定通信拓扑下一致性公式(2-1)的收敛速度:引理2.4 考虑具有固定拓扑的积分器网络为强连通图,其中每个节点应用公式(2-1)。则非一致动力学系统(2.4)以速度全局渐近稳定到零点。其中,由引理2.4可以看出,公式(2-1)的收敛速度与网络的图拉普拉斯矩阵的第二最小特征值有关。增加,可以使网络更快收敛到一致。但由于在实际通信中存在时延,这时公式(2-1)变为: (2-5)任意改变可能会影响公式(2-5)对时延的鲁棒性:引理2.5 考虑智能体网络在所有的通信链路中具有相同的通信时延。假定网络拓扑固定,无向且连通。当且仅当满足下列等价条件之一时,公式(2-5)能解决全局渐近平均一致问题。1),其中,2)的Nyquist 曲线不环绕点,。另外,当时,系统在频率处有一个全局渐近稳定的振荡解。因此,由引理2.5可以看出,一致性公式(2-5)允许的最大通信时延与图拉普拉斯矩阵的最大特征值有关。当增加时,也随之增大,系统的收敛速度提高了,但是对时延的鲁棒性却降低了。因此,要权衡系统收敛性能和鲁棒性之间的关系。在多移动智能体网络中,考虑到网络的节点是运动的,因此不难想象随着时间的演化,一些既有的通信链路由于两个智能体之间障碍物的出现而断开;相反地,当智能体出现在它的邻居智能体的探测范围之内时,它们之间创建了新的通信链路。这表现在网络拓扑中,意味着增加了某些边以及某些边从图中去除。因此,文献针对具有切换通信拓扑的网络,提出了解决其一致性问题的协议: , (2-6)其中:离散状态属于有限有向图集,满足为阶的强连通平衡有向图。这个集合可解析为:为决定图通信拓扑的切换信号,为合集的元素数目。是有限集因为一个阶图最多有条有向边。引理2.6对任意切换信号,切换系统(2-6)的解全局渐近收敛到系统状态初值的平均值。相应的收敛速度为在上述引理中,任意切换的条件太强,以至于每个子系统必须满足一致性条件,得到的结果有一定的保守性。根据离散时间一致性协议,概括为: (2-7)其中,步长,注意到当某个智能体在某个时间步长和其它 智能体没有信息交换时,很容易保持自身的信息状态。离散时间线性一致性公式(2-7)页能被改写成矩阵形式:其中为对角阵元素为正的随机矩阵。由于在本文中不涉及到离散时间一致性问题的研究,这里不作深入分析。以上讨论的都是线性一致性协议,然而在实际的物理系统中,比如在多移动机器人或无人飞行器等的姿态定位问题中,假定它们的姿态能够自由改变是不合理的。例如,执行器的输入扭矩是有界的,这意味着必须改进一致性协议以保证每个智能体的总输入是有界的。基于智能体状态有约束的考虑,得出下面的非线性一致性协议: (2-8)引理2.7 考虑带积分器节点的动态网络图,假定是连通的,所有的边作用函数是对称的,且每个节点应用协议(2-8),则网络图中每个节点能全局渐近达到一个共同的决策值然而如果仅考虑了无向图的情况,这在实际应用中有很强的局限性。因为现实生活中,双向通信并不普遍。又加上智能体通信过程中时延因素的影响,这使得非线性协议下的一致性问题大大复杂化了。在第三章中,本文将针对通信拓扑的有向性和通信时延这两方面的问题,对多智能体系统在非线性协议下的一致性问题展开研究。 2.3解决一致性问题的主要框架在本节中,我们简单概括一下解决多智能体系统一致性问题的主要框架,重点是一致性协议收敛性的分析方法和最后达到的均衡状态,这与我们后面章节的研究工作密切相关。2.3.1固定拓扑下的一致性协议收敛性分析在固定信息交换拓扑下,假定只要某个智能体在一个时刻能得到其邻居智能体的信息,那么在所有时刻它都能得到其信息。对连续时间一致性协议(2-1),可简单看出,且根据圆盘定理,图拉普拉斯矩阵的所有特征值有非负实部,这说明线性系统(2-2)是稳定的。另外,系统(2-2)的平衡点为矩阵关于零特征值的右特征向量。又因为对应于零特征值的特征空间是一维的,因此总存在,使得即特别地,当为平衡图时,注意到为强连通图,则图拉普拉斯矩阵有单特征值零。但这只是一个充分条件而非必要条件。当信息交换拓扑固定且存在通信时延时,通常处理方法是先将系统状态分解为常量与非一致向量之和,再考虑非一致动力学系统的渐近稳定性。这也是处理一致性问题的基本方法。基于坐标变换的方法将原系统无源化分解成两个解耦子系统,考察各智能体状态差量的子系统稳定性,进而得到一致性条件。在本文中,分别利用这两种方法对存在耦合通信时延的一致性问题进行了研究。2.3.2固定拓扑下的均衡状态现在我们知道在什么条件下一致性协议收敛,下一步就是确定一致性协议最终收敛到的均衡状态。在上文中我们已经给出,当且仅当图包含有向生成树时,式(2-1)才能渐近解决一致性问题。此外,当时,收敛到,其中且很自然地,我们想知道是否每个智能体的初始状态都会影响到最后的一致均衡点。我们假定本文中所考虑的信息拓扑图包含有向生成树。 观察到若在图中有某个节点没有进来的边(若图包含有向生成树则至多存在一个这样的节点),由(2-1),对应这个节点的线性更新规则为,这意味着对所有的都有,因此,其它的节点必须收敛到,也就是一般地,当且仅当图中的某个节点与其它所有的节点之间存在有向路径时,这个节点的初始状态才能对系统最终收敛到的平衡值产生影响。因而对满足这个条件的所有节点都有反之则有,作为一个特例,当且仅当有向图为强连通时,图的每个节点的初始状态都会影响到系统的最终平衡值。可以这样解释上述结论:在图中,若从节点出发,没有通信链路连接到节点, 则状态不可能受到的影响。从另一方面来讲,若存在通信链路连接节点和图中每一个其它节点,则节点的信息状态值将会影响到对于能从如下角度解释。假定对某节点,考虑的情况。我们知道将收敛于为负值。根据连续时间协议(2-1),若节点存在进来的边,则有第一种情况下,将递减,但是由于不可能递减,这意味着将收敛到一个常值,第二种情况下,将收敛到这两种情况与将收敛于负值是矛盾的,因此若则一致均衡状态为初始信息状态的平均值,称作平均一致。平均一致的概念在多智能体系统的分布式决策中有广泛的应用。在后面的章节中,将重点讨论多智能体系统在不同协议下的平均一致问题。 一致性问题的相关理论方面,还包括收敛速度的分析,动态变化拓扑下的收敛性,存在过程噪声和通信噪声以及相关信息不确定的一致性问题等。但本文着重讨论固定拓扑下,存在通信时延的多智能体网络的渐近平均一致问题,感兴趣的是设计怎样的通信协议使得所有智能体收敛到一致即可,对协议的收敛速度,抗噪性能等没有作深入的探讨。2.4本章小结在本章中,我们主要对具有单积分特性的多智能体系统的基本一致性协议作了简单的总结。先介绍了有关代数图论的基本知识,它在一致性问题的数学建模以及收敛性分析中起到了关键作用。然后我们列出了几种比较经典的一致性协议,旨在提取解决一致性问题的基本框架。根据近年来的文献,我们可以看到,大多数一致性问题可以转化为求解非一致向量动力学系统的渐近稳定问题。紧接着,我们对下面研究章节感兴趣的收敛性分析方法和最终达到的一致均衡状态做了简要说明。一致性问题需要深入探讨的方面还有很多,如影响协议收敛速度的因素,噪声影响以及模型不确定下的一致性问题等,这亟待在今后的研究工作中展开。3非线性协议下带时延的多智能体系统的一致性3.1引言在动态智能体系统(网络)中,“一致”意味着所有的智能体需要达到由它们状态决定的系统感兴趣的某些值。“一致性协议”是描述网络上某个智能体与它所有的邻居智能体交换信息的相关准则,并且能通过某种分布式处理方法使网络中的智能体达到一致。一致性问题在计算科学领域有很长的研究历史,特别是在自动机理论和分布式计算中。近来,由于多智能体系统在很多领域的广泛应用,动态智能体网络的分布式合作引起了工程和科学上很多不同学科的学者的兴趣。例如,群集和蜂拥问题,耦合振子的同步问题,等等。 直到现在,大多数文献主要考虑线性协议下,具有时变或状态依赖连接拓扑的一致性问题。然而,在实际的物理系统中,比如在多移动机器人的姿态定位问题中,假定它们的姿态能够自由改变是不合理的。因此,基于智能体状态有约束的情况,提出了非线性协议下的一致性问题。但是即使在这些文献中,网络也必须满足一个很强的假设:关联通信拓扑应该是双向连接的。而在现实应用中,单向通信也很重要。简单地举个例子,广播通信。另外,蜂拥问题中起关键作用的感知信息流明显也不是双向通信的。众所周知,反馈环节中的通信时延可能会对系统的稳定性产生影响。在多智能体系统中,因为智能体的移动,通信信道的拥塞,连接拓扑的不对称,和受传输介质物理特性限制的有限传输速率,都可能会使时延的影响更大。因此,本章将考虑非线性协议下,具有时变通信时延的有向智能体网络的一致性问题。通过应用代数图论的相关知识建模,将矩阵论和控制理论的分析方法结合起来,得到动态智能体网络在非线性协议作用下,能够达到一致的的充分条件和时延上界。3.2问题的提出3.2.1基本定义和引理用有向图表示一个动态智能体网络的信息交换拓扑。其中为非空节点集合,为边的集合,权值邻接矩阵的邻接元素为非负值。假定所考虑的动态智能体网络包含个智能体。每个智能体被视作有向图中的一个节点。每条边对应在时刻,智能体到之间的可靠信息传递。则多智能体系统的运动特性可以由节点的动力学行为来表示。对系统: ,其中为时刻 t 时的控制输入(或协议)。当且仅当所有智能体的状态满足,时,称协议能渐渐近解决一致问题。此时,所有节点的共同状态值称为群体决策值。令为维变量的某作用函数,表示系统的初始状态值。通过应用只取决于节点和其邻集状态的协议,动态图中的一致问题实际上是计算的一种分布式算法。也就是,对每个,当时,对任意,有,菜称系统的节点达到了渐近一致。特别地,当时,称系统的状态达到了渐近平均一致。平均一致的概念在多智能体系统的分布式决策中有广泛的应用。解决平均一致问题是运用动态网络(或积分器) 系统对线性函数进行分布式计算的一个例子。这比在初始状态下到达一致性更有挑战性,因为还得满足另外的条件:对所有,这说明系统的最终决策值与初始状态紧密相关。引理3.1令为给定矩阵且满足则引理3.2 对任意实微分向量函数和任意维常数矩阵下面的不等式成立:其中引理3.3假定为强连通图,则其图拉普拉斯矩阵除了一个零特征值外,其它的特征值有正实部。 引理3.4假定为强连通平衡图,则有其中:,3.2.2 非线性一致性协议的提出在实际的物理系统中,比如在多移动机器人或无人飞行器等的姿态定位问题中,假定它们的姿态能够自由改变是不合理的。例如,执行器的输入扭矩是有界的,这意味着必须改进一致性协议以保证每个智能体的总输入是有界的。基于智能体状态有约束的考虑,我使用下面的非线性一致性协议:并得到以下结果:在无向图中,若智能体之间的边作用函数连续,且满足则系统可达全局渐近平均一致。但是,在现实应用中,单向通信也很重要。简单地举个例子,广播通信。另外,蜂拥问题中起关键作用的感知信息流明显也不是双向通信的。通过研究近来文献的一些结果,通信拓扑的时延是影响多智能体系统一致收敛性的关键因素。因此,基于有向信息传递和通信时延这两点综合考虑,我们提出了下面的非线性一致性协议: (3-1)其中:边作用函数连续且严格单调递增,为时变通信时延(我们假定网络中所有通信链路的时延是统一的) ,满足:若为前面所定义的对应图的拉普拉斯矩阵,则(3-1)式可改写为: (3-2)则(3-2)式可简化成下面的形式: (3-3)3.3 非线性一致协议收敛性分析假定有向图为平衡图,注意到不管是否存在时延总是成立的。将式(3-3)两边同时左乘可以得到因此,是一个不变量。则可分解为: (3-4)其中:且满足假定连续可微,为系统(3.3)的一个平衡点,在处将线性化可得:又因为图拉普拉斯矩阵的行和为零,因所以(3.3)可最终改写成:令由于严格单调递增,因此这意味着与图拉普拉斯矩阵具有相同的性质。将代入上式中得, (3-5)定理3.1 考虑一个具有固定拓扑且存在通信时延的智能体有向网络。假定通信拓为强连通平衡图,时延若存在对称正定矩阵满足 (3-6)则(3-1)能保证该网络在平衡点处达到局部渐近平均一致。其中:边作用函数连续且严格单调递增,矩阵如引理3.4中所定义。3.4仿真结果为了验证定理3.1的有效性,我们给出几个数值仿真例子:考虑4个智能体的动态网络,其信息交换拓扑为强连通平衡图, (3-8)其中:,且图的拉普拉斯矩阵L=例1 在这个仿真里,假定非线性协议为。系统状态的初始值选作:()=。根据定理3.1,可以解出允许的最大时延情况1,在此情况下,根据定理3.1,公式(3-8)能解决该动态智能体网络的一致问题,选取时变时延,运用MATLAB中Simulink工具箱对该系统进行模块搭建,对应的仿真图形如下:图3-1,时的系统仿真模块图另仿真时间设置为15s,得到仿真后的系统状态轨迹为:图3-2,仿真时间15s时的系统状态轨迹情况2,在此情况下,函数不再是单调递增函数,k=不满足定理所需条件。依旧选取时变时延,运用MATLAB中Simulink工具箱对该系统进行模块搭建,对应的仿真图形如下:图3-3,时的系统仿真模块图将仿真时间设置为20,得到仿真后的系统状态轨迹如图3.4所示。图3-4,仿真时间20s时的系统状态轨迹显而易见,在允许的最大通信时延范围内,只有当函数为严格单调递增函数时,才能保证无论系统状态的初始值如何取值,都有,进而满足定理3.1的条件,保证系统达到渐近平均一致。例2在这个仿真里,假定非线性协议为,系统状态的初始值选作:=。假定时变时延为,运用MATLAB中Simulink工具箱对该系统进行模块搭建,得到仿真后的系统状态轨迹如图 3-5 所示。图3-5,仿真时间25s时的系统状态轨迹可以看出,当时延上届为0.35s,在该动态智能体网络中,四个智能体的状态不能达到一致,呈振荡状态。例子3在这个仿真里,假定非线性协议为系统状态的初始值选作:=则取时变时延 ,运用MATLAB中Simulink工具箱对该系统进行模块搭建,得到仿真后的系统状态轨迹:图 3-6,时的系统仿真模块图图3-7,仿真时间25s时的系统状态轨迹可以看出,即使系统的初始值不是选取在平衡点的附近,而是更大范围内的地方,公式(3-8)依然能够解决该动态智能体网络的平均一致问题。这也说明了我们结论的保守性,定理3.1不仅适用于解决平衡点附近的局部一致问题,而且也有可能解决全局一致问题。3.5本章小结在本章中,主要研究了非线性协议下具有时变通信时延的有向智能体网络的一致性问题。我们将无向图中的结果更一般化,发展到有向图中。而且,当函数为线性函数时,线性协议下的一致性问题能看作是我们模型的一个特例。基于代数图论和矩阵论我们对所给的一致性协议进行了收敛性分析,得到了以线性矩阵不等式形式给出的充分条件,保证在所给的非线性协议作用下,具有时变通信时延的智能体网络能达到渐近平均一致。最后的数值仿真结果也证明了本章结论的有效性。本章的结论也能应用在很多其它的领域包括同步,蜂拥,分布式决策以及编队控制中。例如,在编队控制中,不仅要考虑智能体某个状态值的一致,而且在智能体的前进过程中,难免受到环境约束,在此情况下多智能体系统依然要保持预定的队形。另外,通信时延的影响是在所难免的,这可能导致网络系统振荡或者发散。在这种情况下,能应用我们的结论得到保持编队的条件。又因为时变通信时延的存在,我们期望能运用线性矩阵不等式方法,找到合适的矩阵,使其导数为负。但由于原系统模型以及自身知识的局限,我只能将系统在群体决策值状态初始平均值附近线性化,得到相对保守的结果。但经过数值仿真验证,系统的初始值不仅可以选取在平衡点附近,甚至更为大范围的地方。因此,怎样将现有的结论推广到全局渐近平均一致上,是今后研究的重点。另外,目前的文献多考虑的是统一时延的情况。但在实际通信中,各智能体之间的通信时延是不一样的。因此,怎样将统一时延情况下的结论推广到更一般的非统一时延系统中,也是我们今后研究的一个方向。4具有时变时延的多智能体系统的二阶一致性4.1引言近年来,一致性研究开始应用于许多实际问题中,如编队问题、同步问题、群集问题和蜂拥问题等,人们对一致性产生了浓厚的兴趣。最初,人们把注意力集中到了一阶系统中,并针对一阶系统一致性做了许多研究。Saber和Murray在2003年提出了一阶系统平均一致性的定义,并得出了平均一致性的一些充要条件,揭示了平均一致性与拓扑图的关系。Ren和Beard则针对信息一致性,分别提出了离散时间协议和连续时间协议,并得出相关结果。Lin和Jia针对网络拓扑为随机拓扑并含时延的一阶动态系统研究了其平均一致性。而Sun和Ruan研究了带有噪声和通讯时延的一阶leader-follower系统的一致性问题。在以运动学为背景的多智能体系统中,一阶系统中控制的感兴趣的量为位置,通过智能体之间的信息交互来控制速度,目的是使得系统中所有智能体的位置信息达到一致,而在二阶系统中,控制的量是两个,即位置和速度,通过设计一致性协调控制算法来控制智能体的加速度,最终使得速度和位置都能达到一致。显然,从这一物理背景出发,二阶多智能体系统比一阶系统更符合现实背景。Yu和Chen研究了二阶多智能体系统的一致性,并得到了一致性的充要条件,揭示了二阶一致性与拉普拉斯矩阵特征值的关系。Sun和Zhao研究了Leader-Follower模型的二阶多智能体系统一致性,考虑了时变时延和噪声扰动的因素,并得到了一些充分条件。Zhang等则分别研究了带有随机切换拓扑的二阶多智能体系统和带有噪声、变时延及丢包等通讯约束的二阶多智能体系统的均方一致性。许多研究中考虑的多智能体系统模型都是线性的模型,然而在现实世界中,往往存在许多非线性因素影响着多智能体的动态行为。本章提出了一个解决双积分多智能体系统一致问题的二阶一致算法,通过无源化分解方法,将原系统分解成两个子系统:描述集群内部形状shape系统和描述质心运动的locked系统,基于shape系统的动力学行为和Lyapunov函数方法,得到了以线性矩阵不等式形式给出的时延依赖的一致性充分条件。保证该多智能体系统在允许的通信时延上界内,能渐近达到全局二阶一致。特别地,当通信拓扑为平衡图时,系统的信息状态导数能达到平均一致。4.2问题的提出与第三章类似,用有向图G=表示一个动态智能网络的信息交换拓扑。其中,权值邻接矩阵的邻接元素为非负值。节点指标属于一有限指标集。在本章中,边集不包含自闭环情况的边。对系统其中 (4-1)通过公式(4-1)原系统能改写成如下矩阵形式:考虑具有双积分特性的智能体动态模型 (4-2)其中: (4-3)其中,控制增益为各智能体状态信息导数的耦合强度。权值邻接矩阵的邻接元素如前面章节中所定义。一致性协议(4-3)的目标就是保证当时,。从式(4-3)可明显看出,二阶一致协议中交换的不止有状态信息,而且还包含状态信息的导数。因此,系统(4.2)能否达到一致,不仅与通信拓扑有关,也取决于的大小。由于现实世界中通信时延的普遍存在,在本章中,根据协议(4-3),我们将考虑存在耦合通信时延的情况下,一般的有向智能体网络中的二阶一致问题。加入通信时延后协议(4-3)变为: (4-4)继续改写可得如下矩阵形式: (4-5)为通信时延(我们假定网络中所有通信链路的时延是一样的。)若当时,我们则称双积分多智能体系统(4.5)达到全局渐近一致。4.3二阶一致协议的收敛性分析Lee和Spong提出了平衡图上多惯量智能体的二阶一致算法。通过无源分解方法,将原系统分解成两个子系统:描述集群内部形状的shape系统和描述质心运动的locked系统。然后,应用代数图论的知识分别分析这两个子系统,期望在所提算法作用下,保证惯量集群形状渐近稳定到预定队形,而且所有智能体的速度收敛到质心运动速度。首先我们定义如下坐标变换: (4-6)其中,为满秩变换矩阵定义为其中:令,则定理 4.1 考虑一个具有固定拓扑且存在通信时延的智能体有向网络。假定通信拓扑G为强连通平衡图,时延满足:。若存在对称正定矩阵 P,Q,满足 (4-7)则公式(4-4)能解决该多智能体系统的二阶一致问题,且系统状态信息的导数达到全局平均一致。其中:A,B如前所定义,注4.1从式(4-7)可以看出,具有时变通信时延的动态智能体网络的二阶一致收敛条件与矩阵 和控制增益有关。因此,公式(4-4)的收敛性取决于网络的拓扑结构,权值邻接系数和控制增益.其中网络通信拓扑满足强连通平衡条件,控制增益在本章中没有定量给出,仅通过仿真例子说明当,满足上述线性矩阵不等式条件时,可解决系统的全局渐近一致问题。注 4-2 为了分析的简便,本章中所讨论的多智能体系统状态值均为标量。但是定理 4.1 的结果能很容易地拓展到多维状态问题中。可利用定理 4.1 的推导过程分析该协议的收敛性,得到的结果与定理 4.1 相近。4.4仿真结果考虑3个智能体的动态网络,其信息交换拓扑为强连通平衡图,且图的拉普拉斯矩阵多智能体系统的初始状态值选作:,情况1,选取

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论