CN116009395B 一种非合作博弈中多智能体系统容错控制方法 (哈尔滨工业大学)_第1页
CN116009395B 一种非合作博弈中多智能体系统容错控制方法 (哈尔滨工业大学)_第2页
CN116009395B 一种非合作博弈中多智能体系统容错控制方法 (哈尔滨工业大学)_第3页
CN116009395B 一种非合作博弈中多智能体系统容错控制方法 (哈尔滨工业大学)_第4页
CN116009395B 一种非合作博弈中多智能体系统容错控制方法 (哈尔滨工业大学)_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

distributed_fault-toleran一种非合作博弈中多智能体系统容错控制一种非合作博弈中多智能体系统容错控制2假设N个智能体组成一个多智能体系统N=(1,2,…,N},智能体i的状态空间模型表ii所述步骤二中建立多智能体通信拓扑模型,得到邻接矩阵和拉根据智能体之间的通讯关系建立通讯拓扑模型,定义多智能体系统由邻接矩阵得到拉普拉斯矩阵C=D-A;3为了达到纳什均衡,每个智能体希望通过改变自己的输出,最大化自己的收益函数Jii-i)即:ii是智能体i对非邻居智能体的输出的估计量;所述V;的求解过程为:所述智能体i对非邻居智能体输出的估计量zi的求解使用基于分布式领导者-追随者的平均一致性估计算法来估计非相邻智能体的输出,所述控制器参数Kc,i和Kd,i的求解将第i个智能体的控制策略与步骤一中智能体的状态空间模型结合可得到智能体i的定义增广矩阵和进一步可得到智能体系统的闭环动4i5为第i个智能体的输出估计信号。Q,i为基于残差输出反馈容错控制器的输容错控制器Qi(S)要实现补偿故障的效果,即让容错控制器的输出与故障之间的差最-=(4-L,67[0003]现有的非合作博弈纳什均衡博弈控制只针对一阶、二阶[0004]本发明目的是为了解决现有非合作博弈纳什均衡博弈控[0013]本发明提出一种在非合作博弈框架下的基于平均一致性的分布式纳什均衡搜索8[0021]本发明是为了解决多智能体系统在发生执行器故障时的分布式纳什均衡搜索问器故障时全体多智能体的策略依然能收敛到纳什均衡点。具体实施方式的流程图如图1所[0029]假设N个智能体组成一个多智能体系统N={1,2,…,N},智能体i的状态空间模9[0038]若(i,j)gE,则说明智能体i与智能体j不是相邻的,则不可以进行通讯、不可以[0042]由邻接矩阵得到拉普拉斯矩阵L=D-A;g(d,,…,dw)eR"为度矩阵,是度矩阵中的对[0046]多智能体系统中的每个智能体为非合作博弈中的一个玩家,根据智能体的输出数根据智能体需要完成的任务确定,智能体需要完成某项任务需要靠智能体的输出来完成),当各个玩家为了获得更大收益而不再改变输出(行动)时即达到了纳什均衡点i-i)即:[0056]其中,Kc,i和Kd,i是需要设计i[0066]这里使用基于分布式领导者-追随者的平均一致性估计算法来估计非相邻智能体[0071]将第i个智能体的控制策略与步骤一中智能体的状态空间模型结合可得到智能体[0073]定义增广矩阵和进一步可得到智能体系统的闭环N}iQ,i的一阶导数;[0104]容错控制器Qi(S)要实现补偿故障的效果,即让容错控制

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论