机器人控制技术基础:多智能体协调控制-修改_第1页
机器人控制技术基础:多智能体协调控制-修改_第2页
机器人控制技术基础:多智能体协调控制-修改_第3页
机器人控制技术基础:多智能体协调控制-修改_第4页
机器人控制技术基础:多智能体协调控制-修改_第5页
已阅读5页,还剩90页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多智能体系统协调控制

复杂系统定义:定义1:通过对一个系统的子系统的了解不能对系统的性质作出完全的解释,这样的系统称之为复杂系统。何谓复杂系统?关于复杂系统的界定关于复杂系统的基本推论对于复杂系统,我们有以下的基本假设:A1)相对于任何有限资源,在本质上,一个复杂系统的整体行为不能通过独立分析其各部分的行为而确定;A2)相对于任何有限资源,在本质上,一个复杂系统的整体行为不能预先在大范围(例如在时间或空间上)内确定。C1)应当采用整体论的观点考虑复杂系统的问题。C2)复杂系统问题一般不存在“一劳永逸”的解决方案。C3)复杂系统问题一般不存在一般意义下的最优解,更不存在唯一的最优解。定义2:通过对一个系统的子系统的了解不能对系统的性质作出完全的解释,这样的系统称之为复杂系统。复杂系统的要素1.模型:系统的模型通常用主体(agent)及其相互作用来描述,或者用演化的变结构描述。

2.目标:以系统的整体行为,如涌现(emergence)等作为主要研究目标和描述对象。

3.规律:以探讨一般的演化动力学规律为目的。例如,幂律(powerlow),遗传规则,自组织临界性(Self-OrganizedCriticality)等。

弱定义智能体是用来完成某类任务的能作用于自身和环境、有生命周期的一个物理的或抽象的计算实体。(2)强定义智能体在弱定义基础上,还要包括人类的情感特征,甚至具备诸如通信能力和理性等,而且这些特性会随着环境变化而不断地进行能动的自我更新。智能体(Agent)定义自治性(Autonomy)

在没有外界干预的情况下自主完成任务的能力。通讯能力(CommunicationCapability)

智能体必须具有与其他智能体或环境通讯以便获取信息的能力。协作能力(CapacityforCooperation)

智能体必须具有协作精神以便共同合作。任务分解能力(TaskDecomposition)

机器人个体应该能够对当前的任务做出判定(任务是大是小,是简单是复杂),并根据做出的判定,决定是单独执行任务还是同其它个体协作执行任务。智能体(Agent)特点自适应性(AdaptiveBehavior)

为了维护自治和推理能力,智能体必须能评估外部环境的当前状态并将其融入有关下一步行动的决策之中。推理能力(CapacityforReasoning)

推理能力是智能体区别于其他软件的关键所在。总而言之,智能体是设计用来完成某类任务的,能在一定环境中自主发挥作用、有生命周期的计算实体,是在带有过程性的、动态连续的进程中的发展智能。多智能体系统(MAS):多智能体系统是由多个智能体组成的具有松散耦合结构的,通过系统中智能体之间以及智能体与环境之间进行通信、协商和协作来共同完成单个智能体(Agent)由于能力、知识或资源上的不足而无法解决的问题的系统。复杂适应性系统研究对象:以智能体(agent)作为子系统的模拟对象研究内容:研究智能群体的若干类协调行为的动态特性研究目的:如何对多智能体动态合作行为进行数学建模,并将其应用于人工世界(多机器人、多无人机等的协作编队控制)1)鲁棒性(Robustness)

没有固定的中心控制,不会由于一个或某几个个体的故障影响整个群体行为。2)分散性(DecentralizedCharacteristics)

整个系统的信息,包括数据、知识和控制等,无论在逻辑上或者物理上都是分布的,不存在全局控制和数据存储单元。3)自组织(Selforganized)

个体自主演化使得群体表现出显著的整体性质,即涌现(Emergence)。多智能体系统动态行为基本特征多智能体系统的控制结构集中式

一个Agent集中控制整个系统,它是一种规划与决策的自上而下式的层次控制结构。该系统的协调性较好,但实时性、动态性较差,对环境变化响应能力差。分散式各Agent具有高度的自治能力,自行处理信息、规划与决策、执行指令,与其它Agent相互通讯以协调各自行为,而没有集中控制单元。分散式结构有较好的容错能力和扩展性,但对通讯要求较高,且多边协作效率较低,无法保证全局目标的实现。分布式分布式控制结构介于上述两种结构之间,是一种全局上各Agent等同的分层、局部集中的结构。这种结构是分散式的水平交互和集中式的垂直控制相结合的产物,既提高了协调效率,又不影响系统的实时性、动态性、容错性。多智能体系统的协作方式黑板通信黑板机制包括三个组件:黑板,知识源和控制机制。黑板是状态的表示,可以被所有知识源访问,包括传感器的输入、执行机构的反馈等。知识源包括系统中求解问题的组件,是每个智能体对环境的建模结果。知识源之间相互独立,之间的任何通信都要通过改变黑板。黑板结构的优点是模块化和全局知识共享,并且使得模块间的异步通信成为可能显式通信智能体之间根据固定的网络地址,使用相应的通信协议,进行消息的传输。其优点是可以实现任意点之间的信息交换,但当系统中Agent的数量增加时,通信的负担将使系统的运行效率下降,限制了应用范围。

多智能体系统的体系结构同构多智能体系统

系统中每个智能体的结构相同,功能相同,通常由成百上千的智能群体组成。特点:适用于大空间范围内无时间要求的重复性操作的系统。典型特征是由大量同构智能体组成群体,每个智能体的能力有限,大量的此类简单智能体协作时,通过局部的相互作用“涌现”出完整的有意义的社会行为。异构多智能体系统

系统通常由几个到几十个能执行特定任务的异构机器人组成,关键问题是如何在它们之间进行有意识的合作。主要的研究问题是具有适应性的行动选择,通信和冲突的解决,它们对系统的性能具有决定性的作用。多智能体系统的研究意义

多个智能体相互协作以完成超出它们各自能力范围的任务,使得系统整体能力大于个体能力之和,因此能够胜任比较复杂的任务。这是目前控制理论研究领域的一个热点课题,具有重要的理论和现实意义。多智能体系统的应用多智能体系统协调控制的研究热点智能群体的群集行为控制多机器人系统队形控制多智能体动态网络的一致性控制一.生物群体的群集行为(FlockingBehavior)

群集行为是指一群自主的运动个体能够保持成团队的形式向某一目标地迈进。在对个体行为建模的时候一方面需要有使得群体保持集聚在一起的能力,另一方面也要使得个体具有对环境所施于的刺激(跟踪的目标物的位置信息)做出适当反应的能力。群集行为研究的三个阶段:1.生物学家大量的研究和探索阶段(1)雁群迁徙行为排成整齐的一字形或人字形队列,有利于大雁的自我调整以避开天敌或障碍等(2)鹿群逃避行为以合理的队形统一行动,而不是作胡乱分散,某只鹿可能没有看到天敌,但其可以根据邻近的其它鹿的奔跑方向来决定自己的行动方式。(3)蜜蜂筑巢行为在没有可供参考的设计蓝图或领导者的指导的情形下,蜂群能构建具有结构强度最优的蜂巢(4)蚁群觅食行为蚁群在觅食的时候能够在巢穴与食物之间形成一条最优路线。当路上出现障碍物时,它们会设法绕过,并在不同路径中选优。此外,有些群集行为可以展示很好的流动性和均匀性。2.实验物理学家和计算机专家的仿真和实验阶段普遍采用模拟仿生的方法证明生物群集现象可以由个体的简单行为规律获得。目前由大规模的简单、同类型的个体自组织地形成某种模式、存储信息或完成联合决策所表现出来的群体涌现特性十分普遍,即使是更加简单的个体规则,个体之间非线性的交互也能导致大规模群体内部产生复杂的涌现行为。

1986年,克雷格·雷诺兹(Reynolds)做了一个模拟动物协作运动的计算机模型的开创性工作并称这种仿真的群生物为“boid”。这种基本的群模型包括了三个简单的指导规则,它们描述了一个单个的“boid”如何基于位置和邻近个体的速度进行分离、内聚和排列运动,从而首次给出了群集的形式化定义。群集运动规则(1)群中心定位(Cohesion)试图与邻近的个体保持接近;(2)避免碰撞(Separation)避免与邻近的个体发生冲突;(3)速度匹配(Alignment)试图与邻近的个体速度匹配这三个规则被称为雷诺兹聚结规则,深入研究这些规则事实上导致了第一个聚结的动物灵活性行为的创造。这种灵活性类似于鸟类的群迁。

定义:如果所有Agent取得相同的速度向量,两两之间的距离稳定并且没有碰撞发生,一组移动Agent就称为一个(渐近地)群集。雷诺兹给出的形式化定义是:1)分离性(separation):各成员之间避免碰撞。2)内聚性(cohesion):各成员朝着一个平均的位置进行聚合3)排列性(alignment):各成员沿着一个平均的方向共同运动3.群集行为动力学严格数学建模及分析阶段此阶段为群体系统研究走向量化的关键步骤,研究中可考虑综合生物领域与工程领域的研究成果,一方面使得受自然生物群体的协调行为启发而研究的工程智能群体行为能够获得自然现象中的某些特性,如群体涌现的协调性(由简单的局部个体行为产生的基于目标的全局群体行为);自适应性(即在变化的环境中能自行选择和跟踪新目标的能力);鲁棒性(不依赖于固定的“领导者”,面对扰动时能继续保持搜索目标的行为)。另一方面通过研究实际复杂工程群体系统的控制与设计工作,有可能帮助研究人员对生物群体动态行为的涌现机制产生新的理解和认识。

群集行为的基本特点个体动态+通讯拓扑

每个个体都有一定自主能力,包括一定程度的自我运动控制,局部范围内的信息传感,处理和通信能力。系统中个体通过局部信息交换相互作用,调整自身动态行为,整体动力学由每个个体动态和个体间通信拓扑所决定。由于个体自主运动和局部信息传感能力,当彼此相互或进入个体的局部通信范围时,关联特性不断变化

简单的个体行为规则和局部信息产生从自然和社会的种种群体现象来看,群体行为完全可以在简单的个体行为基础之上自组织产生,每个个体都遵循相同或相似的运动规则,这些规则通常只规定个体如何根据获得的局部信息做出相应的基本反应,而与群体运动行为或目标无直接关系。群体行为是所有个体关联合作而涌现出的自组织运动,不同的关联方式会产生不同的群体行为,如何分析和设计个体行为规则和关联耦合结构是控制理论与应用的新课题。

群集动力学建模方法欧拉法

在欧拉法中,群体集结模型是使用通量来描述的连续集模型,通量也称为某一区域的个体密度,即一个群体集结模型中的每个个体成员不作为单个实体来研究,而是通过密度概念将整个群体作为一个连续集来进行整体描述。基于欧拉法的群体集结模型就是测量单位区域内个体的数目(即群体密度分布函数),并使用欧拉连续方程(偏微分方程)来描述群体的密度分布函数。优点:无需对群体所处环境作空间离散化处理,对于描述大规模密集而没有明显不连续分布的群体集结行为非常有效。缺点:忽略了个体的特性,对于很多由有限数量的大体积或强调个体智能特性的个体成员组成的群体不太适合使用基于欧拉法的连续集模型,如鱼群、鸟群等的群体集结行为。

拉格朗日法使用基于个体的决策方法来作为控制群体运动和集结的规则。拉格朗日法建立的群体集结模型中,基本的描述就是每个个体各自的运动方程,以拉格朗日方程描述个体的受力和运动方程为:

式中Fik包括群组成员聚集或分散的力(即描述个体之间的吸引力或排斥力作用)、与邻近个体速度与方向相匹配的作用力、确定的环境影响力(如万有引力)以及由环境或其它个体行为产生的随机扰动作用力。F是所有这些作用力的总和。综上所述,拉格朗日法群体集结模型一般可以理解为群体集结行为就是在个体之间的吸引力和排斥力共同作用下的结果,而这种吸引力/排斥力函数在当个体之间的距离较长时表现为吸引力作用,当个体之间的距离较短时则表现为排斥力作用,从而在避免个体之间由于过度接近导致相互碰撞的同时保持群体的集结行为。

欧拉法和拉格朗日法的不同之处在于后者将个体的位置信息都体现在模型之中,而前者则以群体在所处物理空间中的密度分布作为建模基础。

区分原则:是以每个个体为对象研究其受到的群体中其它个体所施加的作用力影响还是研究群体在物理空间中的分布状况。欧拉模型中对群体所处物理空间的连续性假设多适合于体型较小的菌类或一些多细胞生物如昆虫、磷虾等。当分析由较大体型生物群体如鱼群、鸟群、兽群等时,“群体所处物理空间是连续集”这一假设不再满足。基于仿真的群体模型转而通过为群体中的个体建立模拟实际生物个体动态行为规则,用离散时间方程组来刻画运动。代表模型:Boid

模型,Starlogo模型(MIT),Swarm模型(SantaFeInstitute)优点:可以为个体如何完成群体行为提供一个明确的视觉过程。缺点:缺乏理论分析的手段,实际智能个体行为的复杂性在仿真中也难以复制,不能保证现实生物系统就是遵循这样的简单规则。

人工势场模型:

主要思想:构造一个人工势能场使得Agent在受到环境中目标吸引的同时也受到障碍物排斥,使Agent能够在复杂的环境中完成任务。环境中不同成员的特性共同构成了整个系统的人工势能场,相互之间的互联关系得到了体现,各Agent的行为受到整个人工势能场控制,环境中各种互联关系都影响着每个个体的行为。

优点:简单易行,各Agent的动态行为易于理解和分析,从初始位置出发沿着负梯度方向前进,避开障碍物从而到达目的地;由于势场函数建立的整个势场空间是连续的,因此避免了复杂的离散规划。对于局部势场分析方法来说不要求获得全局信息,对环境中障碍物等不要求先验知识。群集系统交互作用建模目标产生的吸引力和障碍物产生的排斥力示意图等势线分布在人工势场中,群体系统动态方程可以表示为式中,xi表示个体i的状态向量,Wij表示个体之间作用强度和权值,Va,Vr为个体之间相互作用势函数。若Wij=0表示个体i,j之间没用相互作用,通常令Wii=0,若Wij=Wji,则称个体i,j作用为对称的,矩阵W为关联/通信拓扑结构数学工具—网络化系统和代数图论群集系统是由多个个体通过某种相互作用形成的一类网络化互联系统,因此在数学上可以用图论来进行描述和研究。图论的表达方式简洁明了,是一种能够简单的将各Agent之间的互联关系清晰表达的工具。一般采用顶点代表各Agent或环境中不同因素的状态,边表示顶点之间的互联关系,边的方向表示信息的流向,这样多Agent系统各组成部分之间的关系就一目了然。

一个群集系统可以表示为G={V,E,A}:V是非空节点集合,由所有个体组成;E是边的集合,代表所有个体的相互作用关系;A称为邻接矩阵,描述图中所有节点的邻接关系和连接方式,用来刻画群集系统的关联拓扑结构。按照个体作用方式的不同,可分为有向图和无向图。一般描述Leader-following型群集系统的图是有向的,而描述各向同性的群集系统的图是无向图。此外,在研究图上的群集动力学时,描述图拓扑结构的拉普拉斯矩阵是有力的工具,其他诸如连通图,生成树,平衡图等概念和性质也具有重要的应用。群集模型的描述考虑由N个智能体组成的群集系统,其中每个智能体的动力学方程为:智能体i的三个控制项它的控制输入由三个控制项组成:

ai来源于Ri与之邻近的机器人之间的相对位置所产生的势场为Vi,它对应着群集运动的内聚性与分离特性,以使作群集运动的机器人之间相互避碰以及产生稳定的距离。

αi用于调整机器人Ri的速度与其它机器人的平均速度相匹配,相当于排列性。是另外一个势场函数,确保机器人Ri在环境中运动时,有效避免与环境中的静态障碍物碰撞。

机器人之间势场函数的选取,在邻接图中,两相邻的机器人Ri与Rj的人工势场函数Vij是一个关于距离rij的非负、可微、无界的函数,并得满足如下条件:(1)当||rij||->0时,Vij(rij)->(2)当机器人Ri与机器人Rj之间得距离rij达到一定的值时,Vij存在唯一的最小值;人工势场函数

总之,群集用一个“势场”(Potentialfield)的概念就统一了诸如奔向目标点,队形保持、避障等各个子行为,使得运动协调的过程更加接近于现实的物质世界;而对“势场”进行精确量化又使得群集成为一种可度量的运动协调模式。而与跟随领航者法相比,由于方法中期望距离与夹角关系为固定的刚性(Rigid)编队,而群内部个体之间的几何关系则显得更加灵活,其编队行为会根据系统初始状态与外界环境的变化进行实时调整。群集灵活的编队形式,使其能更适应真实环境下的任务,这与自然界中“群”行为是和谐一致的。二.多机器人系统队形控制(FormationControl)

所谓队形控制是指多个机器人在到达目的地的过程中,保持某种队形,同时又要适应环境约束(例如存在障碍物或者空间的物理限制)的控制技术。多移动机器人的编队运动,要求多个移动机器人同时运动到目标区域,并在运动过程中始终保持给定队形,能够自适应的进行队形切换安全地避开可能出现的障碍物.搜寻(foraging)任务:

在大环境中,随机分散地放一些目标,机器人群体的任务就是找到它们,并把它们带回某个特定的位置.协作搬运(objecttransport)任务:这一任务通常要求分散的几个机器人围绕对象形成某个几何形状的队形,并将其运送到一个特定的地点。应用包括觅食和搜索。遍历(grazing)任务:

要求机器人群体能够充分地遍历整个环境区域,它的潜在应用包括区域覆盖、侦察,探索等工作。多机器人系统编队的应用

编队控制是一个具有典型性和通用性的多机器人协调控制问题,是许多多机协调问题的基础。通过研究开发及实用化,该技术在农业生产、柔性制造、无人探险(海洋、太空、核环境),国防工业等均有着巨大的应用前景。多机器人系统编队的研究意义多机器人系统编队的研究方法产生式方法:基本思想:通过给定多机器人一些IF-THEN规则,使得当队形不规整的时候,使机器人很容易的调整自己的位置。优点:反应速度快,实时性好。缺点:就是人为指定的规则可能会遗漏或者冲突,而且不能适用于相对复杂的情况。领航跟随(Leader-following)法:主要思想:在多机器人群体中,某个机器人被指定为领航者,其余作为它的跟随者,跟随者以一定的距离间隔跟踪领航机器人的位姿。对该方法进行拓展,即不仅可以指定一个领航者,也可以指定多个。根据领航者与跟随机器人之间的相对位置关系,就可以形成不同的网络拓扑结构,也就是说,形成不同的队形。

优点:仅仅给定领航者的行为或轨迹就可以控制整个机器人群体的行为缺点:是系统中没有明确的队形反馈控制产生的误差有可能在信息传输的过程中被逐渐扩大。此外就是单点故障,Leader是整个结构的灵魂,它的行为决定了整个队列的行为如果领航机器人失效,那么整个队形陷入瘫痪,队形就会无法保持。解决办法:反馈线形化技术引入到编队中。该方法的主要思想是:机器人通过自定位模块获取本机器人的当前位姿信息,通过通讯模块获取相关机器人的当前位姿信息,从而计算本机器人与相关机器人的相对距离、方向等参数。在给定的队形(机器人与相关机器人相对位置的信息)下,机器人利用运动学方程来产生其需要移动的方向和速度,从而达到编队的目的。该方法中,协作是通过相关机器人位姿信息的共享实现的。虚拟结构(virtualstructure)法

主要思想:刚体在多自由度空间中运动时,刚体上各点之间的相对位置保持不变。用机器人代替刚体上的某些点,并以刚体的坐标系统作为参考坐标系。系统运动时机器人之间的相对位置也保持不变,即机器人之间可以保持一定的几何形状。这样的结构称为虚拟结构。虽然每个机器人相对于参考系统的位置不变,但它仍可以以一定的自由度来改变自己的方向。多机器人以刚体上的不同点作为各自的跟踪目标就可以形成一定的队形。

优点:容易指定机器人群体的行为(虚拟结构的行为),并可以进行队形反馈,能够取得较高精度的轨迹跟踪效果。而且机器人之间没有明确的功能划分,不涉及复杂的通信协议。缺点:要求队形在虚拟结构下运动,限制了该方法的应用范围。基于行为(Behavior-based)法主要思想:为机器人定义一些期望的基本行为,包括避碰、避障、沿墙行走、驶向目标和保持队形等。当机器人的传感器接受到外界环境刺激时,根据传感器的输入信息做出反应,并输出反应向量作为该行为的期望反应(例如,方向和运动速度)。行为选择模块通过一定的机制来综合各行为的输出,并将处理结果作为机器人对环境刺激的反应而输出

关于动作选择机制的研究,是基于行为主义的多智能体协调研究的热点和核心问题。目前的行为选择机制主要有三种:Arkin加权平均法:

将各个行为的输出向量乘以一定的权重再求出它们的矢量和(权值的大小对应相应行为的重要性),矢量和经过正则化后作为机器人的输出。

缺点:控制意义不明确,而且由于把每个子行为平等看待,所以各子行为之间相互干扰,从而影响整体的控制效果。

Brooks行为抑制法:对各个行为按一定的原则规定优先级,选择高优先级行为的输出作为机器人的输出,即高优先级的行为抑制低优先级的行为

缺点:需要一个仲裁器来判断行为优先级,或者采用投票的方法来选择行为。在每一时刻控制变量都有明确意义,由于各子行为在控制过程中不停切换,控制结果不平滑,而且完成任务所需的时间较长。模糊逻辑法:根据模糊规则综合各行为的输出,从而确定机器人的输出。其实这种方法是加权平均法的变异,它根据具体情况来确定权值大小。

总之,基于行为法的优点为每个机器人均可兼顾各种行为,同时利于实时控制。当机器人具有多个竞争性目标时,可以很容易的得出控制策略。由于机器人根据其它机器人位置进行反应,系统中有明确的队形反馈。该方法的另一个优点是可以实现分布式控制。缺点:不能明确地定义群体行为,很难对其进行数学分析,并且不能保证队形的稳定性等。另外各子行为的融合具有不可知性,且融合的方法不容易确定,随着环境复杂性的增加,融合的难度也加大。三.多智能体动态网络的一致性(Consensus)

系统科学中Consensus这个词译为群体中的成员通过与其他成员的信息交流及共同约定的简单相互作用,使群体达成共同的意向。Consensus是保留在英文中的拉丁词汇con=共同,sensus=感觉,consensus=共同的感知,共同的认识,共谋,在中文文献中译为一致。

1995年,Vicsek等提出了一个简单但引起巨大关注的多移动智能体(Agent)(即点或者粒子)模型。所有智能体以相同的速率但不同的运动方向在平面上作自主运动,每个智能体的运动方向按照它当前的运动方向与它的“近邻(Neighbors)”运动方向之和的平均值来更新。在某时刻,一个智能体的近邻集合是指位于以该智能体的当前位置为圆心,一个事先给定的值为半径的圆上或圆内的所有智能体。

Vicsek等在文中给出了一系列有趣的仿真结果。这些结果说明,尽管没有集中的协调,并且每个智能体的最近邻的集合在系统演变的过程中随时间而改变,模型所采用的“最邻近规则”却能够使所有智能体的运动方向最终趋于一致,并且通过在一个有界区域增加智能体的密度,使得多智能体网络拓扑变为连通时,可以观察到相变现象。粒子群系统的相变现象群体行为一致性的数学描述群体的动力学系统(行为)是由(大量)个体(Agent)个体间通信网络拓扑结构及控制协议确定。考虑有M个动力学个体的群体,每个个体之间通过通信网络保持某种信息交流,这种信息交换的网络拓扑结构可以用一个图来描述其中V为节点集,E为边集。定义

为边集权重矩阵,用以刻画智能体间的相互作用。若则称这个网络图是对称的,无向的否则称这个网络图是有向图。若为时间的函数,被称为动态(时变)有向图(或无向图),若为随机变量,称为随机图。记节点的邻居集合为

用表示个体的状态(这个状态可以是位置,速度等感兴趣的变量)

从宏观的角度出发,对群体而言,个体可以看成是一个简单动力学单元,在研究中往往撇开个体复杂的动力学性质,抽象其最基本的性质,用质点动力学来建模。在连续时间下,满足简单的动力学规则则下面的控制协议则连续时间下群体行为动态模型相应地,在离散时间下的群体行为动态模型可以表示成其中我们称群体趋向于一致,就是认为它们的状态渐近收敛到一个共同状态空间,也就是最终实现一致性的含义就是:任给初始状态其中与系统的动力学方程有关,也与各x的始状态有关。当系统一致的状态可以表示为其中是总体决策意向

表示节点的度,同时定义矩阵。中第个元素为。第个元素为则矩阵为图的拉普拉斯矩阵。L矩阵在研究线性一致性问题上是一个核心概念,对一个图而言,L矩阵的特征根总是非负实部的,并且至少具有一个零特征根。1.时不变网络下的群体行为一致性

在时不变网络条件下,对任何一个体它的邻居集都是固定不变的,并且权重也是固定不变的。系统可以用下面这个线性时不变系统来表示常数矩阵是对应网络图矩阵

借助于图论和矩阵分析的知识,对于固定无向拓扑网络结构下,上述群体系统,实现一致性的充分必要条件是网络具有连通的拓扑图;在有向信息通信网络下,群体系统达到一致性当且仅当交流网络拓扑图中有一个可达点,也即拓扑图的L矩阵具有单个零特征根。一般的,我们用表示L的M个特征根,并且满足则群体行为一致性的代数判别准则是:

如果群体模型用离散时间系统表示,则我们有

其中第个元素为,第个元素为那么为了实现一致性,图的连通性条件和连续系统完全一样,记的特征根为

为了实现一致性,它相应的代数判别准则是

注:当动态个体满足运动定律时,也可获得类似的结果。即只要网络图是连通的,群体行为即能实现一致性。个体的动态的性质若更复杂一些,网络的连通性不再是充分条件;实现状态一致还需要个体动态系统满足一些附加条件,当群体间通讯信息是数字网络(采样系统)时,系统为了实现一致性,除了网络的连通性,也还须需其它条件。2.时变网络下的群体行为一致性

许多群体的网络系统具有时变的性质!通讯过程中节点间连接的失败,传输过程中信息丢失等原因,都能造成网络系统具有时变的性质。特别值得关注的情况是:群体在整个活动过程中,通讯网络的连通性在过程中是无法保证的;甚至在任何时刻,系统的网络都是不连通的!对这类时变通讯网络条件下的一致性问题的研究是目前的研究的热点和难点。考虑如下离散时间系统

是一个分段常值矩阵,取决于群体在t时刻的通讯网络结构,此时该系统的动态网络图应用来描述,定义一组网络图集相应有网络图边集合定义成为联合网络图边集,如果联合网络图连通或具有一个可达点,则称网络在区间上是联合连通的(或联合具有可达点),令,于是可得如下的基本结果:若群体的网络在所有的区间上都是联合连通的,则该群体的行为可以实现一致性。3.时滞系统中群体行为一致性

当个体之间的网络通信存在时滞时,就会影响群体的整体行为。以连续时间系统为例,假设从个体个体的信息传递交流存在时滞体通常采用控制协议

假设时滞是时不变的,而且等于一个常数,那么有以下定理:

定理1:假设通讯网络是一个无向固定的连通拓扑图,并且所有的时滞那么对于任意的初始状态,协议解决群体行为一致性的充要条件是.其中

为连通拓扑图的最大特征值

若考虑时变有向通讯网络,如果个体采用控制协议,则对于任意的常数时滞,在一定条件下群体也可以解决一致性问题。假设时滞是单时变的时候常采用函数和方法探讨解决群体行为的一致性问题,当时滞为多

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论