已阅读5页,还剩83页未读, 继续免费阅读
(载运工具运用工程专业论文)多智能体系统协调控制的理论与仿真研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西南交通大学研究生硕士学位论文第1 页 摘要 在自然界中,人们经常可以观察到一种迷人的现象,大量的鸟、鱼、昆 虫等生物会形成一个规则有序的群体进行运动。由大量这样个体抽象而成的 系统被称为多智能体系统( m u l t i a g e n ts y s t e m s m a s ) ,多智能体系统的协调 问题成为了当前的一个研究热点。 本文针对多智能体系统协调运动的同步条件、多智能体系统群集控制和 多机器人系统编队控制问题进行了研究。首先,对具有位置依赖约束的v i c s e k 模型进行了仿真分析,观察到了智能体之间的信息交换拓扑图并不是系统同 步的唯一约束条件,为后续的理论证明打下了基础。其次,针对具有一阶积 分器模型的多智能体系统,利用神经网络模型和复杂网络牵引控制方法设计 了基本群集控制器、满足作动器饱和约束的群集控制器和时滞条件下的群集 拧制器,并通过理论证明和数值仿真对控制器进行了验证。最后,针对具有 二阶积分器模型的多机器人系统,利用人工势能场和虚拟领导者方法设计了 两种编队控制器,第一种控制器能够满足做动器饱和约束,第二种控制器能 够同时保证机器人达到期望间距和方位角,并通过理论证明和数值仿真验证 了控制器的有效性。 通过本文的研究工作,为多智能体系统同步条件的理论证明提供了数值 依据。首次将神经网络稳定性和复杂网络牵引控制和多智能体系统群集控制 问题相结合,改进了前人提出的多机器人编队的人工智能场函数,具有一定 的理论和工程价值。 关键词:多智能体系统;多机器人系统;群集;复杂网络;人工势能场 + 西南交通大学研究生硕士学位论文第1i 页 a b s tr a c t i nn a t u r e ,af a s c i n a t i n gp h e n o m e n o nh a su s u a l l yb e e no b s e r v e dt h a taf l o c ko f b i r d s ,as c h o o lo ff i s ha n dac o l o n yo fi n s e c t se t c f o r mar e g u l a r , o r d e r e d c o l l e c t i o nt om o v e t h e s es y s t e m sc o n s i s to fp l e n t yo fi n d i v i d u a l si sc a l l e d m u l t i - a g e n ts y s t e m ,m a sf o rs h o r t t h ec o o r d i n a t i o no fm a s h a sb e c o m eah o t t o p i ci nr e s e a r c hr e c e n t l y i nt h i sp a p e r , w ef o c u so nt h ep r o b l e m so ft h ec o o r d i n a t i o nc o n d i t i o no f m u l t i a g e n ts y s t e m s ,t h ef l o c k i n gc o n t r o lo fm u l t i a g e n ts y s t e m sa n d t h e f o r m a t i o nc o n t r o lo fm u l t i r o b o ts y s t e m s f i r s t ,w es i m u l a t et h ev i c s e km o d e l w i t ht h ec o n s t r a i n to fp o s i t i o nd e p e n d e n c e t h er e s u l t ss h o wt h a tt h ec o n n e c t e d c o n d i t i o no fi n f o r m a t i o n t o p o l o g y i sn o tt h e o n l y c o n s t r a i n to fm o d e l s y n c h r o n i z a t i o n ,w h i c hi st h en u m e r i c a lf o u n d a t i o no ff u t u r ew o r k s e c o n d ,f o r m u l t i a g e n ts y s t e m sw i t h f i r s ti n t e g r a t o rm o d e l ,u s i n gt h em o d e lo fn e u r a l n e t w o r k sa n dp i n n i n gc o n t r o lo fc o m p l e xn e t w o r k s ,w ed e s i g nt h eb a s i cf l o c k i n g c o n t r o l l e r , f l o c k i n gc o n t r o l l e rw i t hc o n s t r a i n to fa c t u a t o rs a t u r a t i o na n df l o c k i n g c o n t r o l l e rw i t ht i m e - d e l a y e di n f o r m a t i o nt o p o l o g y m o r e o v e r ,t h r o u g ht h e o r e t i c a l p r o o fa n dn u m e r i c a ls i m u l a t i o n ,t h ee f f e c t i v e n e s so fc o n t r o l l e r si s v a l i d a t e d f i n a l l y ,f o rm u l t i r o b o ts y s t e m sw i t hd o u b l ei n t e g r a t o rm o d e l ,u s i n ga r t i f i c i a l p o t e n t i a lf i e l da n dv i r t u a ll e a d e rt h e o r y , w ep r e s e n tt w ok i n d so fc o n t r o l l e r , o n eo f w h i c hc a nm e e tt h ec o n s t r a i n to fa c t u a t o rs a t u r a t i o n ,t h eo t h e ro fw h i c hc a n g u a r a n t e et h ed e s i r e dd i s t a n c ea n da n g l eb e t w e e nt w or o b o t sa tt h es a m et i m e ,a n d v e r i f yt h ec o n t r o l l e r sw i t ht h e o r i e sa n ds i m u l a t i o n s t h er e s e a r c hi nt h i sp a p e rg i v e st h en u m e r i c a lp r o o fo fc o n v e r g e n c eo f m u l t i a g e n ts y s t e m s w er e l a t et h es t a b i l i t yo fn e u r a ln e t w o r ka n dp i n n i n gc o n t r o l o fc o m p l e xn e t w o r kt ot h ef l o c k i n gc o n t r o lo fm u l t i - a g e n ts y s t e m sf o rt h ef i r s t t i m e ,a n da l s oi m p r o v et h ep r e v i o u sf u n c t i o n so fa r t i f i c i a lp o t e n t i a lf i e l df o rt h e f o r m a t i o no fm u l t i r o b o ts y s t e m s a l lt h ew o r ki np a p e rh a ss o m ev a l u ei nt h e o r y a n de n g i n e e r i n g k e y w o r d s :m u l t i a g e n ts y s t e m s ;m u l t i - r o b o ts y s t e m s ;f l o c k i n g ;c o m p l e xn e t w o r k ; a r t i f i c i a lp o t e n t i a lf i e l d 西南交通大学 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学 校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查 阅和借阅。本人授权西南交通大学可以将本论文的全部或部分内容编入有关 数据库进行检索,可以采用影印、缩印或扫描等复印于段保存和汇编本学位 论文。 本学位论文属于 1 保密口,在年解密后适用本授权书; 2 不保密酬使用本授权书。 ( 请在以上方框内打“、”) 篙簦论亭仨尹芋名彭耘卷乇 日期:。州、r 川。 指导老师签名: 日期: 季拟毛吨 7 肌圹多7 西南交通大学学位论文创新性声明 本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作 所得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或 集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体, 均已在文中作了明确的说明。本人完全意识到本声明的法律结果由本人承担。 本学位论文的主要创新点如下: 1 针对具有位置依赖条件的v i c s e k 模型同步进行数值仿真研究,仿真中 观察到了与其它学者未考虑位置依赖条件v i c s e k 模型所提出的同步条件的差 异,从数值上验证了信息交换拓扑图的连通性并不是v i c s e k 模型同步的充分 条件,为从理论上寻找v i c s e k 模型同步的条件打下基础。 2 基于复杂网络中的人工神经网络模型,为由一阶积分器模型构成的多 智能体系统设计了群集控制器,分别设计了基本控制器、满足作动器饱和约 束的控制器及具有时滞的控制器,借助分析神经网络模型稳定性的理论方法, 分析了这些控制器的稳定性,并给出了数值仿真结果。 3 基于人工势能场和虚拟领导者方法,为由二阶积分器模型构成的多机 器人系统设计了两种新的势能场函数,包括满足作动器饱和约束的势能场函 数和能够同时保证机器人达到期望的间距和方位角的势能场函数。首先,基 于有界势能场函数,设计了满足作动器饱和约束的编队控制器。其次,通过 为虚拟领导者赋予能够同时保证期望间距和期望方向角的势能场函数,为实 际机器人赋予一般的能够保证期望间距的势能场函数,设计了多机器人系统 的编队控制器。最后,进行了稳定性分析和数值仿真。 竺竺论文作掌签名渺弓 日期: 矽s 7 西南交通大学研究生硕士学位论文 第1 页 第1 章绪论 1 1 多智能体系统的研究背景及研究意义 自然界中的许多生物,例如呜、鱼、昆虫等,为了生存的需要,通常会 形成一个大规模群休来进行一驰牛命活动l ”。这蝤生物在运动能力、视觉能力 等方面部是有限的,但是通过相互之间的交互构成大规模群体,就能够将有 限的个体能力聚集起来,克服单个个体能力上的不足,高效的完成觅食、迁 徙、躲避灭敌等活动。在这样的群体系统中,由于单个个体仅具有有限的局 部感知能力,仅能够获取存自己能力范围内的局部信息,而无法获取整个群 体的全局信息,因此系统中就不存在集中式的协调控制机制,而具有分散式、 分布式系统的特点。如何通过局部信息交甄产生全局的系统行为足近年来的 一个研究热点。 懑 。鲁j 善j i 图i i 鱼群图i 2 鸟群图i 3 蝇虫群 研究者将实际中具有l 述现象的系统抽象为多智能体系统( m u l t i a g e n t s y s t e m s ,m a s ) 1 2 3 1 ,该系统具有一个千j 趣的性质:在许多由大量动态演化的 个体组成的系统中,往 :会涌现出全局协调致的行为。般而言,构成该 系统的个体并不知道整个系统的全局信息,每个个体只能根据它所拥有和感 知的局部信息f 如它所能够观察到的其它个体的行为) 柬调整自身的“为。 也就是说,整个系统是通过分布式的个体凋竹而币是集中控制力式实现全局 m 调一致行为的。具有这样性质的系统再- 宴阳、r ,是普遍存在的,除了牛物系 统会表现出伞局一致的性质,此非生物系统也会出现这种敛现象,侧如, 悬挂砬一个横梁r 的钟摆在段日j 间咀后会出现同步摆动,演出结束后观众 的掌声发生同步【,网络1 :的路由器最终会以同步的方式发送路由消息,从而 西南交通大学研究生硕士学位论文第2 页 引起的网络拥塞,以及人们通过大桥时的步伐同步,从而引起大桥的共振等。 对于这类现象的产生机理,研究者将其纳入复杂网络的范畴内进行研究,得 出这样的结论:在这些复杂系统中,每一个个体都是一个动力学系统,而诸 多的动力学个体之间存在着某种特殊的耦合关系,这些系统中的个体根据自 身能够感知的局部信息经过动态演化而达到整个系统的同步。本质上复杂 网络的同步的机理与多智能体系统协调现象是一致的。 在最近几年中,多机器人系统( m u l t i r o b o ts y s t e m s ,m r s ) 的协作控制 问题成为了系统控制领域新的研究热点【5 ,6 1 。这里所提到的多机器人系统可以 泛指各类机器人以及运行于不同条件下的交通工具,也被称为多自治无人载 运工具系统【7 i ( m u l t i a u t o n o m o u su n m a n n e dv e h i c l e ss y s t e m s ,m a u v s ) 。早 期机器人的研究的重点主要集中在单机器人的结构、运动、控制和信息处理 等方面。随着机器人应用领域的不断扩展,单个机器人解决问题的能力、运 行的鲁棒性、可靠性、任务完成效率等方面已经不能满足复杂问题的求解, 因此就迫切需要为机器人系统提出一种新的运行方式。 2 0 世纪8 0 年代到9 0 年代中期,随着分布式人工智能、复杂系统和多智 能体系统研究工作的逐渐开展,一些研究者开始着手使用多机器人系统对上 述问题进行理论研究和仿真实验,例如 8 1 0 】。这些研究将分布式人工智能、 复杂系统、多智能体系统、生物学、社会学、管理学等研究领域的成果应用 于多机器人系统中,推动了多机器人系统的发展,使得多机器人系统成为一 个独立研究的对象而被广泛研究和应用。多机器人系统协作控制问题的出现, 也来源于实际应用领域两方面的需求:一方面,由于空运、水运及地面交通 领域巨大的运输压力,以往以单个交通工具运行的方式逐渐不能满足日益增 长的运量需求,为了节约成本、增加运力、提高系统可靠性,人们开始借鉴 多智能体系统的思想构建出了多车辆系统。与单个运行的交通工具相比,多 车辆编队运行能够将多个交通工具构成一个系统统一协调运行,在运行效率、 容错性和鲁棒性方面都得到了大幅的提高。这样的系统能够完成的任务包括 飞行器编队飞行,水下、地面交通工具编队运行。 西南交通大学研究生硕士学位论文第3 页 圉i 一6 舰船编队运行 图1 7 多机器人足球赛 另一方面使用多个结构简单、成本低廉的机器人来代替巨大的、复杂 的、功能单的单个机器人,是一种降低成本、提高效率的有效方法。例如 使用多个小型机器人协作来代替单个大型机器人进行未知地区探索,仟务的 执 于效率和可靠性就有很大提高。而且这样的系统具有功能可打展、成本分 散的优点。存完成任务时,如果单个机器人出现故障,系统中的其他机器人 依然能够通过协作及重构编队来继续完成给定的任务“j 。 多机器人系统的出现,为工业机器人的应用带来了新的变革【l ”。在军事 领域,通过将不同功能的、成本低廉的多个军用机器人构成异构系统来代替 十兵,从事未知地区侦察、排雷、搜救和区域防卫等任务,降低了任务完成 的危险性和成本、提高了效率和成功率。存航天领域,使用小卫星群代替单 个大型甲星刘星体表面进行成橡的麻用电逐渐丌展起来,这种力式比起以托 单个人卫旱成像具有成像精度高,容错性好等特点。:午交通运输领域,将多 个车辆编队运行,可以有效避免交通事故,增加行j 。峦度,提高高速公路的 运输能力,减轻驾驶人员的负担等,还可以保证在雨雪、大雾等恶劣环境下 运输系统的正常运行【1 4 - 1 6 。 作为分布式人工智能研究的个主要研究方向,多智能体系统与多机器 人系统的协调悱作问题具有相同的理论基础。从组成系统的单个个体来看, 西南交通大学研究生硕士学位论文第4 页 机器人、车辆、自治交通工具等物体,它们具有一定的局部感知能力、自治 运动能力和对环境做出反应的能力,由这些个体构成的多机器人、多自治交 通工具系统的基本特点与一个多智能体系统相同,可以借助于多智能体系统 的研究方法对其进行研究。从系统运行的行为来看,多机器人系统的协调协 作需要保证系统中的机器人能够保持一定的编队位型并一致运行,需要保证 系统中的每个机器人都收敛到一致的信息状态,就可以看作与多智能体系统 的一致行为相类似。因此,本论文就针对多智能体系统和多机器人系统进行 研究,将多智能体系统的一致问题和多机器人系统的协调控制问题相结合, 互相启发互相促进,提出了一些新的控制方法。 本文所进行的研究具有两方面的意义,一方面,对于多智能体系统的研 究,可以揭示出自然界中生物群体的运动的本质,例如鸟群、鱼群和昆虫群 等群体的复杂运动。同时,多智能体系统的理论研究也为多机器人系统的协 作控制提供了理论研究基础,通过借鉴和采用多智能体系统的局部性感知和 全局一致性的特点,能够设计出高效可行的多机器人系统协作控制器,因此 具有很高的理论价值。另一方面,作为多智能体系统实验验证平台的多机器 人系统的协作运动、编队控制,在大量的实际需求的推动下,已经不再仅仅 是一种仿真工具,而作为一种工业技术显示出了巨大的应用潜力。这两个研 究方向互相验证、互相促进,因此把两者有机结合起来进行共同研究是一个 充满挑战、具有光明应用前景的研究方向,因此对于多智能体系统和多机器 人系统的研究是一项具有理论和工程意义的工作。 1 2 多智能体系统的主要研究方法和研究现状 多智能体系统的研究来源于生物界中群体运动现象的启发,例如鸟群、 鱼群、昆虫群等的群体运动。为了利用计算机来模拟出这些奇特的现象,1 9 8 6 年,c r a i gr e y n o l d s l l 7 】提出了一个著名的计算机动画仿真模型,称为b o i d 模 型( b o i dm o d e l ) 。为了使用计算机程序来模拟出更为真实的生物群集运动, r e y n o l d s 从实际观察到的生物行为中抽象出了生物体产生群集( f l o c k i n g ) 运 动的三个基本行为: ( 1 ) 避免碰撞:避免和相邻个体发生碰撞; ( 2 ) 速度匹配:与相邻个体的速度一致: ( 3 ) 中心聚集:系统中个体向中心聚集。 计算机仿真鸟群的群集运动由类似于自然界中动物群体的分布式行为模 西南交通大学研究生硕士学位论文第5 页 型产生。每个仿真鸟作为一个独立的动作者,具备上述三种基本行为,通过 对动态环境的局部感知,不断调整自身运动来实现整个鸟群协调运动,最终 的仿真结果与鸟群、鱼群和昆虫群的群体运动很接近。这篇文章的主要贡献 在于归纳出了自然界简单个体协作运动的一些基本行为,通过计算机编程仿 真的方法得到了较为真实的群体行为仿真动厕,后续的研究者在使用严格的 数学工具对这种自然现象进行建模分析时,都基本遵循了该文章提出的仿真 群集运动的碰撞避免、速度匹配和中心聚集三种基本行为。同时,该文章还 分析了仿真算法的复杂度,与自然界的群聚现象相比,仿真算法在复杂度上 还需要进行进一步改进,这为后续的研究提供了一个研究方向。但是该文章 仅从计算机动画工业的角度给出了仿真研究,没有建立严格的鸟群的数学模 型,没有使用严格的数学、力学方法对产生该现象的本质自然规律进行挖掘。 1 9 9 5 年,针对大量简单个体的共同作用而产生复杂的协作行为这种现象, v i c s e k 等人在【1 8 中,从统计力学的角度提出了一种系统模型,被后人称作 v i c s e k 模型。文章研究了自推动( s e l f - p r o p e l l e d ) 粒子系统的相移现象,这种 现象描述为:初始角度杂乱无章的大量粒子,以相同的速度运动,且系统中 存在随机扰动。当粒子系统的密度较大,且随机扰动值较小时,系统的运动 在宏观上就会出现有序性,即粒子朝着相同的方向一致运动。 从这种现象中可以看出,v i c s e k 模型是研究多智能体系统协调行为的一 种基本模型,因为该模型具备了多智能体系统一些重要的基本特征: ( 1 ) 个体状态动态进化 ( 2 ) 个体之间具有局部交互作用 ( 3 ) 相邻个体关系动态变化 在对v i c s e k 模型进行了深入的理论分析后,研究者们开始针对v i c s e k 模 型中采用的一阶积分器模型来设计实现多智能体系统协调运动的控制器。近 年来,许多研究者对多自治智能体系统的协调运动和协作控制进行的大量研 究就是围绕着集体运动( c o l l e c t i v em o t i o n ) 现象开展的。从生物学角度【1 9 l 到社会学角度【2 0 j ,从控制理论到复杂性理论 2 1 ,研究者们希望多智能体系统 在能够在没有集中式协调机制的情况下实现一致运动。 在多智能体系统中,刻画单个智能体行为的局部规则可以看作智能体的 控制器1 2 1 , 2 2 j 。如何根据局部信息设计合适的控制器使得系统达到一致运动, 是控制工程师感兴趣的问题。受到上述研究的启发,在多机器人协调协作控 制领域中,研究者使用多机器人系统作为多智能体系统理论的研究载体,为 了完成复杂任务或达成某种共同目标,多机器人系统中的每个机器人需要进 西南交通大学研究生硕士学位论文第6 页 行信息交换并达到一致,因此多机器人系统的协调控制问题可以抽象为多智 能体系统的一致问题( c o n s e n s u sp r o b l e m ) ,该问题是分散控制研究的基本问 题之一。由于多机器人协调协作控制的应用范围很广,不同领域的研究者都 会遇到不同类型的协调问题,说明了这是一个多领域交叉的研究方向,也表 明具有不同背景的研究者会对系统的不同侧重点进行研究,会采用多种不 同的研究方法,但是研究的核心思想可以归纳为: ( 1 ) 个体间存在局部信息的交换: ( 2 ) 每个个体独立进行分散式控制。 而且,智能体之间形成的信息交换网络拓扑结构对系统的同步起着非常重要 的作用,这些拓扑结构可以是固定的、变化的甚至是时滞的,这些基本思想 对多机器人协调协作控制问题有着巨大的指导作用【2 3 1 。 对于多机器人协调协作问题的研究,从系统模型方面来看可以分为两类: 系统理论方法和基于行为的方法。第一种,基于行为的方法( 有时也被称为 反应式控制) 为系统中的每个机器人赋予一定的个体行为,个体的运动依赖 于行为结构算法的使用,而不具有显式的子系统或环境模型,例如【2 4 】。第二 种,系统理论方法对机器人间以及机器人与环境交互建立系统动力学方程, 因此对模型的使用具有很强的依赖性,例如f 2 5 ,2 6 。这两种方法各自具有不 同的优缺点,没有一种方法能够为多机器人系统的编队控制设计一种通用方 法。在系统理论方法中,机器人模型多采用单轮( u n i c y c l e t y p e ) 机器人模 型,该模型具有一定的物理意义,表示了一种简单的轮式机器人的动力学模 型,并且可以通过反馈线性化方法将该模型转化为二阶积分器模型。基于行 为方法的优点是由于受到了生物系统的启发,通过将个体行为的累加得到系 统行为,具有很强的适应能力、良好的性能及鲁棒性。然而,这种方法没有 封闭形式的设计过程,有时在产生期望的运动的同时,还可能产生意想不到 和不期望的行为。系统理论方法的优点是所得结果是可证明和可预测的,以 及对于系统性能问题存在解析解。这种方法的缺点是由于需要对复杂系统动 力学方程进行近似,模型不可能完全精确。h i o a k iy a m a g u c h 在【2 7 】中对多移 动机器人协作围捕目标的问题提出了一种新的控制方法,每个机器人的摔制 采用与机器人位置有关的局部反馈,这属于基于模型的控制方法。每个机器 人具有一个被称为“队形向量”的控制向量,多机器人编队的形成就是通过控 制该向量而完成的。为了确定队形向量,采用了响应控制框架使机器人根据 自身的传感设备,启发式的响应外界环境变化,以此产生整个系统的协作围 捕行为,这属于基于行为的控制方法。根据以上两种不同的控制方法构造出 西南交通大学研究生硕士学位论文第7 页 来的控制器是分布式的,能够保证系统的渐近稳定性,该方法是将基于模型 的控制方法和基于行为的控制方法相结合的典型例子。 从多机器人系统中的个体信息交换方式来看,可将控制方法分为集中式 控制( c e n t r a l i z e dc o n t r 0 1 ) 和分散式控制( d e c e n t r a l i z e dc o n t r 0 1 ) 。c h e n 和 w a n g 在【2 8 】中从这两方面对编队控制问题进行了综述。在集中式控制方法中, 存在个协调整个系统的中心控制单元,具有简单、直观、便于实现的优点, 但需要得到系统的全局信息,存实际应用中会受到通信条件的限制,使得该 方法具有通信代价高、容错性差的缺点,应用范围受到了一定的限制。从上 述多智能体系统一致性的研究方法来看,多机器人协调协作问题的主流研究 方法是分散式控制方法,分散式结构与集中式结构相比具有一些本质上的优 点,包括容错性、并行化思想的使用、可靠性和可缩放性。对于基于多智能 体系统一致理论、复杂网络同步理论的多机器人协调协作控制,必然采用了 分散式控制的思想。当前分散式多机器人协调控制器设计的主要方法有以下 三种: ( 1 ) 领导者跟随者( l e a d e r f o l l o w e r ) 策略【2 9 3 0 】:在领导者腥艮随者控制 策略中,一些车辆被指定为领导者( l e a d e r ) ,其他被指定为跟随者( f o l l o w e r ) , 首先使领导者车辆按照预先给定的轨线进行运动,然后根据跟随者与领导者 之间的依赖关系,例如相对距离和相对转角,建立系统动力学方程,并设计 控制器,使得跟随者的状态收敛到与领导者相关的相对距离和相对转角,最 终能够跟随领导者一起运动并形成一定几何形状的编队。该方法建立的系统 模型为通常为非线性动力学方程,一般采用反馈线性化方法设计控制器,通 过分析系统的零动态的稳定性来证明系统的稳定性。 ( 2 ) 基于行为的方法( b e h a v i o r - b a s e dm e t h o d ) 1 2 4 】:基于行为的协调摔制 方法不考虑机器人的实际动力学模型,而是为每个机器人预设一些期望行为, 例如,目标跟随、队形保持、避开障碍等,最终的控制作用由每个行为加权 得到,权值的选择与行为的重要程度有关,一般通过神经网络和遗传算法来 优化权值,使得多机器人系统能够在复杂的外界环境中协调一致的运动。由 于行为的设计没有与实际动力学模型相联系,系统稳定性一般没有严格的证 明方法,仅能通过仿真分析来验证。 ( 3 ) 基于虚拟领导者结构( v i r t u a ll e a d e r s t r u c t u r e ) 的方法1 2 5 , 3 1 1 :在虚拟 领导者结构方法中,整个系统对外被看作一个单一实体,表现出类似于刚体 的运动行为,在系统内部,每个个体都具有一个预先设计好的势能场,势能 场会产生吸引排斥的交互力,方向为势能场的负梯度方向,每个个体所受到 西南交通大学研究生硕士学位论文第8 页 势场力的叠加产生期望的运动,使得系统内部每个个体之间能够保持一定的 编队几何形状。设计的势能场具有全局最小值,在该位置处,系统中的每个 个体达到期望的编队位置,形成期望的队形。 在1 3 2 中,作者使用了多智能体系统的一致性算法,首先为由二阶模型表 示的系统引入了一种基本的一致算法。然后,通过合理选择一致状态并将基 本一致算法进行改进用于解决编队控制问题。在没有中心领导者和单向信息 流情况下,基于一致性的编队控制策略也能够保证形成精确的编队性状。该 文章还说明了领导者雇艮随者策略、基于行为的方法和虚拟结构领导者方法能 够被统一到一致性框架中来。并在仿真中给出了一个多车辆系统编队控制的 实例验证了该策略的有效性。 除了上述三种主要的研究方法外,一些研究者还采用了其他方法对多机 器人系统和多车辆编队,以及对车辆编队的通信拓扑、队形切换等相关问题 进行了研究,例如,使用遗传算法和强化学习方法进行编队控制和障碍避让 p 引。模型预测控制( m o d e lp r e d i c t i v ec o n t r o l ,m p c ) 方法被用于文献 3 4 1 中, 作为局部控制规律来保证在不完整车间通信情况下的完整编队性能,不精确 的车间通信被建模成白噪声。在该框架下,分析了与编队性能有关的信息之 间的交互作用。在 3 5 1 ,采用了模糊逻辑和神经网络方法对编队进行速度控 制和障碍避让。 通过对上述前人研究成果的参考和借鉴,本文着手于一些未解决问题的 研究。自然界的生物中,例如鸟群、鱼群和昆虫群等会表现出群集运动 ( f l o c k i n g ) 这种大规模自行实体的协调现象,文献【3 6 】中将群集定义为:一 组运动智能体被称为( 渐近) 群集,当所有智能体的速度向量( 包括速度的 大小及方向) 相同,并目两个智能体之间的距离稳定。需要强调的是智能体 的群集和蜂拥及多机器人的协调协作控制是两个具有紧密联系的研究领域, 从多智能体一致问题得到的许多有用结果能够被成功的应用于多机器人协调 协作控制中。形成群集运动的要求弱于编队控制,便于进行系统分析和控制 器设计,因此受到了研究者的广泛关注。在 3 7 3 9 1 中,对于二阶积分器模型 构成的多机器人系统,考虑了存固定和切换信息交换网络结构下的群集问题。 文献 4 0 1 使用大规模分散控制技术进行稳定的多车辆编队控制,并使用向量 l y a p u n o v 函数技术证明了这些控制规律的稳定性。这些设计的方法都是在理 想的作动条件、理想传感和通信下进行的。然而,在实际应用中,控制器总 会受到一些其他因素的约束。例如,控制器产生的力受到作动器饱和的约束 【4 ,输出不能为无穷大,因此在设计控制器时就需要将这类工程问题纳入理 西南交通大学研究生硕士学位论文第9 页 论研究的范畴中。另一方面,由于控制作用的产生是通过局部信息交换而得 到的,在传感或通信时就会产生时间滞后效应,因此也需要在具有时滞的情 况下设计控制器,并能够保证系统的稳定运行。 本文首先对具有显式位置约束的v i c s e k 模型进行了仿真分析,观察系统 同步的条件。然后采用了基于系统理论方法的分散式摔制,分别针对一阶积 分器模型和二阶积分器模型做出了如下研究:对于由一阶积分器模型构成的 多智能体系统,首次提出基于神经网络模型和复杂网络理论的多智能体系统 群集控制器,针对实际应用中出现的作动器饱和约束和通信延时问题,设计 出了使多智能体达到群集的控制器。然后,针对自然界经常出现的群集运动 现象,将模型推广到具有二阶积分器模型的多机器人系统,采用了人工势能 场方法设计了的多机器人系统的编队控制器,解决了实际中出现的作动器饱 和约束问题和人工势能场不能保证多机器人系统能达到编队唯一构型的问 题,使得系统中的机器人能够同时达到期望的距离和期望的方位角,即形成 期望的编队位形。最后,对上述设计的控制器进行稳定性分析和仿真验证。 1 3 本文采用的研究内容和研究方法 本文采用理论推导和仿真分析相结合的方法对多智能体系统的群集运动 和多机器人的编队控制问题进行研究。研究内容和研究方法如下: ( 1 ) 考虑v i c s e k 模型中的位置依赖关系,并将位置约束建立在动力学模 型中。由于理论研究的困难,通过仿真分析研究分析v i c s e k 模型同步的条件; ( 2 ) 针对由一阶积分器模型构成的多智能系统,采用基于神经网络模型和 复杂网络牵引摔制的方法设计了多种群集控制器,包括基本控制器,具有作 动器饱和约束的控制器和具有时滞的控制器; ( 3 ) 利用神经网络平衡点稳定性和复杂网络牵引摔制理论,得到了采用了 上述群集控制的多智能体系统能够实现群集运动的参数条件; ( 4 ) 使用反馈线性化方法将智能体的一阶积分器模型转化为多机器人研 究中常用的二阶积分器模型; ( 5 ) 针对由二阶积分器模型构成的多机器人系统,采用人工势能场和虚拟 领导者方法设计编队控制器,包括具有作动器饱和约束的控制器和同时保证 收敛到期望间距离和方位角的控制器; ( 6 ) 采用l y a p u n o v 稳定性分析方法,得到了利用上述设计的控制器能够 使多机器人系统形成编队的条件: 西南交通大学研究生硕士学位论文 第10 页 ( 7 ) 使用m a t l a b 仿真软件编写仿真程序,验证本文提出的控制器的有 效性的,并给出了较为直观的仿真结果图。 西南交通大学研究生硕士学位论文第1 1 页 第2 章基本数学工具 本章简要介绍了本文用到的一些数学工具及基本理论,包括图论、非线 性系统的反馈线性化设计理论、复杂网络理论、人工势能场理论和稳定性理 论。 2 1 图论工具简介 在对多智能体系统和多机器人系统进行建模和稳定性分析时,图论是一 个很重要的数学工具。图可以明确的表示出智能体之间的信息交换关系,根 据图的一些特征还能够判断出多智能体系统一致性控制器的存在性和稳定性 等1 4 2 4 3 j 。构建多智能体的群集控制器和多机器人编队控制器时,需要用图来 表示智能体和机器人间信息交换网络拓扑图。下面给出本文所需理论的一些 基本概念。 一个无向图g 由一个顶点集坎q 和一个边集以g ) 组成,其中边表示图g 中的两个不同顶点构成的顶点对。如果顶点x 和顶点y 构成一条边,那么x 和y 就被称为相邻的( a d j a c e n t ) ,或称y 是x 的邻居,表示为x 叫。这样定义 的边是无方向的,即如果x 和y 是相邻的,那么y 和x 也是相邻的。从项点x 到顶点y 长度为,的路径定义为开始于顶点x ,终止于顶点y 的+ 1 个不重复 顶点的一个序列,使得这些顶点都是连续相邻的。如果图g 中的任意两个不 同顶点之间均存在一条路径,那么称图g 是连通的。顶点x 的化合价( v a l e n c e ) 表示x 相邻顶点的个数。图g 的化合价矩阵( g ) 是一个对角矩阵,其中元素 ( t f ) 是顶点f 的化合价西。图g 的邻接矩阵( a d j a c e n tm a t r i x ) 定义如下: 彳( g ) 车h 】: 1 l , j 口d j 叩鲥7 ” 1 0 o t h e r w i s e - 图g 的拉普拉斯矩阵( l a p l a c i a n ) 定义如下: l ( g ) = ( g ) 一彳( g ) 对于无向图,邻接矩阵彳( g ) 是一个对称矩阵,因此对应的拉普拉斯矩阵( g ) 是对称正半定的。 一个有向图的边集是由一些有序顶点对构成,类似的,有向路径定义为 有向边构成的路径。一个有向图被称为是强连通的( s t r o n g l yc o n n e c t e d ) ,如 - 果从任意顶点开始到其他顶点都存在一条有向路径。有向树( d i r e c t e dt r e e ) 西南交通大学研究生硕士学位论文第1 2 页 是一个有向图,除了根节点外所有节点都仅有一个父节点( p a r e n t n o d e ) 。一 个有向图的生成树( s p a n n i n gt r e e ) 是由图的边构成的有向树,这些边连接了 图的所有节点。我们称一个生成树是图的一个子集。注意,有向图具有一个 生成树等价为存在一个具有到达所有其他节点的有向路径节点的情况。对于 有向图g ,边就有指向项点和背离项点两种情况,因此顶点的化合价就应该 分别定义为节点的入度数( i n d e g r e e ) 和出度数( o u t d e g r e e ) ,如下: ll d e g 册( h ) = a ,d e g 。,( q ) = a , - i= l 对于有向图g 矿( 盯表示图中边的指向) ,关联矩阵( i n c i d e n tm a t r i x ) 定 义为如下: i l边i 指向定点i b ( g 8 ) # 【b 口】= 一l 边j 离开定点i 【0 其他 根据关联矩阵的定义,无向图g 的拉普拉斯矩阵还可以定义如下: ( g ) = b ( g 6 ) b ( g 4 ) r 。 该矩阵与边的方向无关,因此也是一个对称正半定矩阵。 拉普拉斯矩阵包含了图的许多拓扑性质,它的谱特性是分析一类经典线 性一致性算法的有效工具。根据g e r s h g o r i n 定理,在复平面上的所有特征 根都位于以+ 0 ,为圆心,= m a x ,d e 为半径的封闭圆内,其中为图的最大 化合价。拉普拉斯矩阵中零特征根的重数表示了图的连通成分的个数,对于 一个连通图来说,三具有实特征根,且零特征根的重数为一,零特征根对应的 特征向量为元素均为l 的玎维向量1 。,即1 n = o n 。其他特征根具有如下关系 0 = d ,r , o 分别表示神经元放大器 输入的电容和电阻。磊为来自外部系统的常数输入。矩阵弘= f 露1 表示神经元 之间的连接关系,是一个不可约矩阵,即网络是强连通的。函数舟q = l ,2 。珂) 是神经元的激活函数。在h o p f i e l d 的分析中,假设连接矩阵r 是对称的,函 数霸是,s i g m o i d 函数,得到了一系列关于神经网络平衡点的存在性、唯一 西南交通大学研究生硕士学位论文第16 页 性和稳定性的定理。在神经网络的硬件执行过程中,由于放大器的有限切换 速度通常会产生时滞,m a r c u s 和w e s t e r v e l t 5 1 1 最先在( 2 1 ) 式中引入了一个 简单时滞f 0 。得到了如下模型: g 警一半嚆饥( 卜呦m 扛l ,2 ,船 ( 2 - 2 ) 由于具有时滞,系统( 2 2 ) 比系统( 2 1 ) 具有更复杂的动力学行为。 g o p a l s a m y 和h e 5 2 烤虑了不同通信信道的不同时滞f 盯 0 ,得到了一种 ( 2 2 ) 式的改进模型 q 掣= 一华+ 主乃g j ( t - - t ,j ) ) + i i ,2 一,玎( 2 - 3 ) c o h e n g r o s s b e r g 神经网络模型是由c o h e n 和g r o s s b e r g 在1 9 8 3 年提出的 f 5 3 1 ,基本模型的数学表达式如下: 掣= 川础) ) i 驰) ) 一羔啪知抄j 0 川2 一, ( 2 - 4 ) “l 户t j 其中,基本符号含义同上,特别的,留( ) 是增益函数,岛( ) 是使得( 2 2 ) 的解 是有界的行为函数。对于具有时滞的c o h e n g r o s s b e r g 神经网络模型也具有常 时滞和分布式时滞两种模型,在研究中也得到了广泛关注,模型统一表示如 下: 堕磐= 一( 甜) ) l6 f ( 坼( 嘞一窆彰( 一巧) ) 4 - zi ,j = 1 ,2 ,刀 ( 2 5 ) l 卢i j 具有时滞的人工神经网络模型在实际应用中具有极其重要的意义,很多 场合都利用了神经网络在一定的条件下具有对时滞的鲁棒性,即存在时滞的 情况下,网络中每个神经元的状态依然会收敛到网络平衡点的特性。本文正 是利用了神经网络模型对时滞的鲁棒性,在智能体之间的信息交换具有分布 式延时的情况下,设计了多智能体系统的群集摔制器。 对于复杂网络的控制,始于1 9 9 0 年三位数学物理学家关于用小的反馈扰 动控制混沌的开创性工作之后。在研究混沌控制期间,对于由大量混沌振子 以某种耦合方式连接在一起而构成的时空混沌系统的控制也有不少研究,但 这些研究基本上都是针对具有规则拓扑结构的网络来讨论的,其中研究较多 的一种控制策略是牵引控制( p i n n i n gc o n t r 0 1 ) 。这种方法曾被应用到控制多 模混沌的激光系统中。牵引控制的原始基本思想,是希望能够仅对网络中的 一部分节点直接施加常数输入控制,而达到有效抑制整个网络的时空混沌行 为的目的。 西南交通大学研究生硕士学位论文第17 页 2 4 人工势能场方法的基本理论 人工势能场( a r t i f i c i a lp o t e n t i a lf i e l d ,a p f ) 方法是机器人运动规划问题 中较为常用的一种方法,该方法具有很高的反应速度和较为简单的执行方式。 人工势能场的概念首先由k h a t i b 5 4 】提出,为机械臂在工作空间的运动控制问 题提出了一种新的实时避碰算法,并成功解决了机械臂避碰问题。在该方法 中,为机器人运
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 酒楼挂账财务制度
- 建筑装修行业财务制度
- 家庭主妇管理财务制度
- 小餐饮店财务制度
- 教职工餐厅财务制度
- 创业板上市实行的制度
- 养老院老人紧急救援人员表彰制度
- 养老院老人财务委托管理制度
- 南京寺庙施工方案(3篇)
- 助跑弹跳活动方案策划(3篇)
- 2026中国电信四川公用信息产业有限责任公司社会成熟人才招聘备考题库及答案详解参考
- 精神卫生机构护理人力资源配置措施
- ORACLE-EBS-OPM标准功能培训资料-OPM配方-V1.0
- 明框玻璃幕墙施工方案
- 宠物管理法律法规课件
- 定额〔2025〕1号文-关于发布2018版电力建设工程概预算定额2024年度价格水平调整的通知
- 2024年山东省济南市3月高三模拟考试生物试题(解析版)
- 教科版九年级物理上册期末测试卷(1套)
- 内蒙古自治区通辽市霍林郭勒市2024届中考语文最后一模试卷含解析
- 复方蒲公英注射液的药代动力学研究
- 沟通技巧与情商提升
评论
0/150
提交评论