CN118192224B 一种规定时间的自适应动态规划控制方法 (北京航空航天大学)_第1页
CN118192224B 一种规定时间的自适应动态规划控制方法 (北京航空航天大学)_第2页
CN118192224B 一种规定时间的自适应动态规划控制方法 (北京航空航天大学)_第3页
CN118192224B 一种规定时间的自适应动态规划控制方法 (北京航空航天大学)_第4页
CN118192224B 一种规定时间的自适应动态规划控制方法 (北京航空航天大学)_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本发明公开了一种规定时间的自适应动态2为HJB方程的残差;3证明了使用该控制方法的非线性时变系统在指定时间内τ知时变延迟,其导数满足t≤1,v(s)表示连续函数。ττττv(x,u)=x'(t)QX(t)+u"(t)RU(t),其中,QeR*",ReR*是正定对称矩阵。H(x,u)=u'RU+(f+gu)+u+x'QX,τvt=0v(x,t)/ot,以=0v(x,t)/ox;定义最优规定时间的成本函数为:求解HJB方程4得到最优解表达式为即:其中,=av*(r,t)/at,⃞=av*(x,t)/0x.想权重,并构建近似评判神经网络v(xr,t)=woc(x,to+Ti-t):近似终端约束条件设计评判神经网络权重估计误差为其中,W:为最优策略下的评判结合权重估计误差将HJB方程转化为P(t)=0等价于则HJB方程5其中γ1代表执行神经网络学习率;6[0002]规定时间控制是导弹制导、多智能体合作和智能家居管理等领域中的重要课前的方法包括采用数据驱动的方法,通过机器学习算法从历史数据中学习时变函数的模稳态性能,需要求解复杂的偏微分方程,为了解决这一问题许多学者对自适应动态规划态条件,同时确保符合终点约束条件。(iii)如何使系统同时达到最优性和规定时间稳定表示未知时变延迟,其导数满足i≤1,v(s)表示连续函数。7,H(x,u)=u'RU+(f+gu)+v+x'QX,[0021]V=0v(x,t)/at,⃞=av(x,t)/0x。定义最优规定时间的成本函数为求解HJB方程H(x,u*知项。8重向量,ve:=ae"(x,t)/0x。为了求解最优控制策略,将神经网络近似的Vx和Vt代入HJB为HJB方程的残差。D(x,t,+Tn)=oc(E(to+Tn),0),其中代表状态的估计值。Vx和Vt的近似表达形[0039]设计评判神经网络权重估计误差为其中,W:为最优策略下的结合权重估计误差可以将HJB方程转化为H(x,u,D,D)=(o:(x,to+T,-t)+x'x+通过转化为的形式实现解方程设计P(t)=0等价于则HJB方程极值求解转化为求解P(t)=9[0050]其中,⃞=(y(x)+12(x)+n2(x))x"x,连续函数μ(t)为规定时间调整时保证最优性和规定时间的稳定性;构造了一种具有时变激活函数的执行评判神经网络,ppppppH(x,u)=u'RU+(f+gu)+v+x'QX,[0083]设计近似评判神经网络来估计权重和近似成本函数,以更好地逼近最优控制策想权重,并构建近似评判神经网络D(x,t)=woc(x,to+T,-t)。近似终端约束条件为D(x,to+Tn)=o:((t,+T⃞),0)。近似Vx和Vt为:[0086]设计评判神经网络权重估计误差为其中,为最优策略下的结合权重估计误差可以将HJB方程转[0092]其中⃞=(y(x)+12(x)+n2(x))x"x,连续函数μ(t)为规定时间调整(Tp_[0095]非线性时变延迟系统最优控制策略为HJB方程的解,所构建的神经网络通过最小程设计P(t)=0等价于则HJB方程极值求解转化为求解其中γ1代表执行神经网络学习率。[0109]和是有界的;状态变量x是全局规定时间稳定[0110]L=v(x(t))+v(6(t))+B3(⃞)+u()+v5(t,t-t(t))(3)和为非负可微函数;γ3为正常数;为不确定性参数和未知时变延迟函数的常数上界;是其近似误差。若ρ(t)=ĸ>0。ll(6)若满足γ1≥1且则[0143]不等式(17)等于满足L≤-ysp(t)v(x(t))+⃞,wte[to,[0147]由于解的存在性和连续性,可以得到x(t0+Tp)=0。根据x(t0+Tp)=0和控制器0+Tp)=因[0150]为了证明基于ADP的规定时间最优控制(ADPPTC)方案的有效性,本发明将与自适出的方案在系统性能和控制成本降低方面优于其他控制方案。非线性时变时滞系统选择[0155]i(t)=0.4cos(t)≤i=0.4,v(s)=1,vse[-c,0];[0156]设Q=10I*",R=I⃞,ψ(x(t0+Tp),t0+Tp)=xT(t0+Tp)[0160]最终得到ADPPTC和APCPTC方案下系统状态和控制器的收敛性能如图2所示,不同pp的系统状态的一般尺度和对数尺度如图4所示。不同规定时间下的控制器的轨迹和自适应ppppppp的各个系统状态的变化曲线如图9所示,不同规定时间下的各个控制器的轨迹和自适应参ppp

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论