基于神经网络的直接自适应lc控制方案_第1页
基于神经网络的直接自适应lc控制方案_第2页
基于神经网络的直接自适应lc控制方案_第3页
基于神经网络的直接自适应lc控制方案_第4页
基于神经网络的直接自适应lc控制方案_第5页
已阅读5页,还剩3页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于神经网络的直接自适应lc控制方案

0动态自适应tlc控制理论空天飞机(asv)是一种需要很大发展的先进航空飞机。由于其巨大的飞行条件和飞机条件变化,控制律需要具有良好的干扰、衰减和冗余能力。轨迹线性化控制(TrajectoryLinearizationControl,TLC)是一种新颖的非线性跟踪和解耦控制方法,目前已成功运用于导弹,机器人和X33等控制系统的设计中。由于当前TLC控制器的设计过程仍然依赖被控对象的分析模型,因此ASV飞行过程中存在的不确定因素将导致TLC控制性能降低,甚至失效。为此,本文通过结合TLC方法和单隐层神经网络技术,提出了一种新的直接自适应TLC控制结构。神经网络自适应律由Lyapunov理论设计,通过权值的在线调节,其输出可以自适应的抵消系统不确定因素的影响。文章最后采用该方法为ASV设计了内外回路时标分离的飞控系统,仿真结果表明新方法大大提高了当前TLC的控制性能。1tlc控制器设计大多数控制系统的设计目的是希望被控对象的状态或输出在控制律的作用下跟踪期望的标称指令轨迹,因此TLC的设计思想是首先将这种非线性跟踪问题转化成一个线性时变(LTV)稳定问题,然后通过LTV稳定性理论,最终使得整个闭环系统沿着标称轨迹达到局部指数稳定。如图1所示,一个TLC控制器包括两个部分:(1)开环的被控对象的伪动态逆控制器,用以根据期望的系统输出值ˉη产生一个标称的控制输入ˉμ;(2)闭环的线性时变反馈调节器,用以镇定系统并使得系统具有一定的响应特性,具体分析详见。本文考虑如下非线性多输入多输出系统˙ξ(t)=f(ξ)+g1(ξ)μ+g2(ξ)dη(t)=h(ξ)(1)其中f∈Rn,g1,g2∈Rn×l,h∈Rm光滑有界,d∈Rl表示未知的建模误差和外界干扰,假设其满足匹配条件,即存在可逆的非线性函数矩阵g0(ξ)∈Rl×l使得下式成立:g1(ξ)g0(ξ)=g2(ξ)(2)那么根据TLC方法思想,标称的控制输入ˉμ将由被控对象的分析模型求得,即:˙ˉξ(t)=f(ˉξ)+g1(ˉξ)ˉμˉη(t)=h(ˉξ)(3)因此,若定义ξ=ˉξ+e,μ=ˉμ+u,则干扰条件下系统的误差跟踪动态特性为˙e=f(ξ)+g1(ξ)μ+g2(ξ)d-f(ˉξ)-g1(ˉξ)ˉμ(4)将上式中f(ξ)+g1(ξ)μ-f(ˉξ)-g1(ˉξ)ˉμ沿标称轨迹线性化,则可得˙e=A(t)e+B(t)u+o(⋅)+g2(ξ)d(5)其中A(t)=(∂f∂ξ+∂g1∂ξμ)|ˉξ,ˉμB(t)=g1(ξ)|ˉξ,ˉμo(·)为Tailor展开的高阶项。显然,不确定项d的存在有可能导致TLC性能降低甚至失效。为了提高当前TLC算法的性能,设计如图2所示的控制方案。此时μ=ˉμ+ulc-uad(6)则式(4)可重新表示为˙e=[f(ξ)+g1(ξ)(ˉμ+ulc)-f(ˉξ)-g1(ˉξ)ˉμ]-g1(ξ)uad+g2(ξ)d(7)既然式(2)成立,不失一般性,令uad=g0(ξ)ˆvad(8)则线性化式(7)可得˙e=A(t)e+B(t)ulc+o(⋅)+g2(ξ)(d-ˆvad)(9)所以新的控制系统设计过程包括(i)在假设无干扰或者干扰可测的条件下,设计TLC控制器使得系统稳定且满足性能指标的要求;(ii)利用多层神经网络的函数逼近能力,通过自适应项v^ad对消d,在保证整个闭环系统所有信号有界的前提下,达到提高系统性能的目的。2基于单隐层神经网络自适应tlc2.1vad/v2/n2的权值估计如参考文献,本文定义SHLNN的输入输出映射矩阵以及可调参数矩阵分别为:vad(W,V,x¯)=WΤΦ(VΤx¯)(10)x¯=[bv,xΤ]Τ(11)Ζ=[V00W](12)根据神经网络的逼近定理可知:对于连续不确定的非线性函数d及任意给定逼近误差上界ε¯>0,存在有限隐层神经元数n¯2和理想的权值矩阵(W*,V*),使得vad*=W*ΤΦ(V*Τx¯)=d-ε,∥ε∥≤ε¯(13)其中∀ε¯>0,n2≥n¯2,x¯∈D,D为神经网络输入信号可达域。本文中定义神经网络输入为x=[eΤ,ξ¯Τ,ξ¯˙Τ]Τ(14)权值估计误差为V˜=V*-V,W˜=W*-W,Ζ˜=Ζ*-Ζ(15)考查W*ΤΦ(V*Τx¯)-WΤΦ(VΤx¯)可得W*ΤΦ(V*Τx¯)-WΤΦ(VΤx¯)=W˜Τ[Φ-Φ′VΤx¯]+WΤΦ′V˜Τx¯+w(16)其中w=W˜ΤΦ′V*Τx¯+W*ΤΟ(V˜Τx¯)2,Φ′表示Φ的导数,O(·)2代表Tailor展开中的高阶项。若下列假设条件成立:A1标称信号有界,即∥[ξ¯Τ,ξ∸Τ]Τ∥<ξ¯cA2神经网络理想权值有界,即∥Ζ*∥≤Ζ¯则有如下界条件成立∥w∥≤c1+c2∥Ζ˜∥+c3∥Ζ˜∥e∥(17)其中‖·‖表示为Frobenius范数,ci>0,i=1,2,3是可求常数。2.2网络自适应调节律A3存在LTV状态反馈控制律ulc=K(t)e,使得式(9)中e˙=A(t)e+B(t)ulc=Ac(t)e(18)指数稳定A4式(9)中线性化高阶项有界,即‖o(·)‖≤εoA5存在标量κ,β1>0和正定矩阵Q(t),Kr0,Kr1使得不等式:Q(t)≥β1I>0,β1>ε0‖P(t)‖,κ>c2,λ¯(Κr0)>12(c1+c2+ε¯),λ¯(Κr1)>c3其中λ¯(⋅)表示最小特征值。定理1对于原系统(1),在满足假设A1~A5的条件下,设计自适应控制律v^ad=vad+vr(19)vad=WΤΦ(VΤx¯)(20)vr=Κr0r+Κr1(∥Ζ∥+Ζ¯)r∥r∥∥e∥(21)r=g2Τ(ξ)Ρ(t)e(22)若神经网络自适应调节律为W˙=Γw{(Φ-Φ′VΤx¯)rΤ-κW}V˙=Γv{x¯(rΤWΤΦ′)-κV}(23)其中Γw,Γv>0,P(t)为如下Lyapunov方程ACΤ(t)Ρ(t)+Ρ˙(t)+Ρ(t)AC(t)+Q(t)=0(24)的正定对称解,则闭环系统所有信号有界。证明:根据假设条件A3,(13)及(19),将(9)改写成e˙=Ac(t)e+o(⋅)+g2(ξ)[W*ΤΦ(V*Τx¯)+ε-WΤΦ(VΤx¯)-vr](25)将(16)代入并整理得e˙=Ac(t)e+o(⋅)+g2(ξ)[W˜Τ(Φ-Φ′VΤx¯)+WΤΦ′V˜Τx¯+w+ε-vr](26)考虑如下Lyapunov函数L=12eΤΡ(t)e+12tr(W˜ΤΓW-1W˜)+12tr(V˜ΓV-1V˜Τ)将L对t求导并代入式(26)及自适应律有L˙=12e˙ΤΡ(t)e+12eΤΡ˙(t)e+12eΤΡ(t)e˙+tr(W˜ΤΓW-1W˜˙)+tr(V˜ΓV-1V˜˙Τ)(27)L˙=12eΤ(AcΤ(t)Ρ(t)+Ρ(t)Ac(t)+Ρ˙(t))e+eΤΡ(t)o(⋅)+rΤ(t)(w+ε-vr)+κtr[Ζ˜Τ(Ζ*-Ζ˜)](28)由于不等式∥Ζ˜∥≤∥Ζ∥+Ζ¯及tr{Ζ˜Τ(Ζ*-Ζ˜)}≤∥Ζ˜∥Ζ¯-∥Ζ˜∥2≤-12∥Ζ˜∥2+12Ζ¯2成立,因此有L˙≤-12β1∥e∥2+ε0∥Ρ(t)∥∥e∥+∥r(t)∥(c1+c2∥Ζ˜∥+c3∥Ζ˜∥∥e∥+ε¯)-λ¯(Κr1)∥Ζ˜∥∥r(t)∥∥e∥-κ2∥Ζ˜∥2+κ2Ζ¯2-λ¯(Κr0)∥r(t)∥2(29)L˙≤-12(β1-ε0∥Ρ(t)∥)∥e∥2-12(2λ¯(Κr0)-c1-c2-ε)∥r(t)∥2-12(κ-c2)∥Ζ˜∥2-(λ¯(Κr1)-c3)∥Ζ˜∥∥r∥∥e∥+12ε0∥Ρ(t)∥+12(c1+ε¯)+κ2Ζ¯2(30)根据A5可知,若下列条件之一成立∥e∥>2ϒ/(β1-ε0∥Ρ(t)∥)(31)∥r∥>2ϒ/(2λ¯(Κr0)-c1-c2-ε¯)(32)∥Ζ˜∥>2ϒ/(κ-c2)(33)则有L˙<0,其中ϒ=12ε0∥Ρ(t)∥+12(c1+ε¯)+κ2Ζ¯2。因此,闭环系统所有信号保持有界。证毕。3基于tcl的asv飞控制构计3.1建模参数结果t本文的研究对象主要来自于NASALangley研究中心的高超声速飞行器仿真模型。设ASV的姿态运动学和动力学方程描述如下:Ω˙=f1+g11ω+d1(34)ω˙=f2+g21Μc+d2(35)其中Ω=[α,β,σ]T为姿态角向量,ω=[p,q,r]T为姿态角速度向量,MC=[Lctrl,Mctrl,Nctrl]T为滚转,俯仰,偏航方向上的控制力矩。f1=[fα,fβ,fσ]T,f2=[fp,fq,fr]T满足fα=-L+Μgcosγcosσ-Τxsinα+ΤzcosαΜVcosβfβ=1ΜV[Ycosβ+Μgcosγsinσ-Τxsinβcosα+Τycosβ-Τzsinβsinα]fσ=-gVcosγcosσtanβ-(Τxcosα+Τzsinα)ΜVtanγcosσsinβ+[L+(Τxsinα-Τzcosα)]ΜV(tanγsinσ+tanβ)+(Y+Τy)ΜVtanγcosσcosβfp=Ιqrpqr+Ι˙ppp+glpLaerofq=Ιprqpr+Ι˙qqq+gmqΜaerofr=Ιpqrpq+Ι˙rrr+gnrΝaerog11=[-tanβcosα1-tanβsinαsinα0-cosαsecβcosα0secβsinα]g21=[glp000gmq000gnr]Ιqrp=-(Ιzz-Ιyy)Ιxx,Ι˙pp=-glpΙ˙xx,glp=1ΙxxΙprq=-(Ιxx-Ιzz)Ιyy,Ι˙qq=-gmqΙ˙yy,gmq=1ΙyyΙpqr=-(Ιyy-Ιxx)Ιzz,Ι˙rr=-gnrΙ˙zz,gnr=1Ιzzd1=[Δ11,Δ12,Δ13]T和d2=[Δ21,Δ22,Δ23]T表示建模误差和外界干扰。M,V为飞行器质量和速度,γ为航迹倾斜角,L,Y为升力和侧力,Tx,Ty,Tz为推力沿飞行器体坐标系的分量,Laero,Maero,Naero为非气动舵面产生的气动力矩,Ixx,Ι˙xx,Iyy,Ι˙yy,Izz,Ι˙zz分别表示惯性矩和惯性矩的时变导数。式(34)(35)所需的参数详见文献。本文的设计任务为设计MC,并根据一定的分配算法映射成发动机推力指令Tc和舵面偏角指令δc使得ASV姿态角Ω在不确定和干扰的条件下,跟踪期望的制导指令Ωc。3.2c控制器的标定根据奇异摄动理论,可以采用时标分离的方法为ASV分别设计内外回路自适应TLC控制器,具体结构如图3所示。首先在无不确定的条件下设计基本的TLC控制器,那么由于外回路标称指令等于飞行器的制导指令,即Ω¯=Ωc,同时由于g11可逆,因此不难求得标称的姿态角速率ω¯为ω¯=g¯11-1(Ω∸-f¯1)(36)对于ω¯来说,它又成为内回路的标称指令,同理求得标称内回路的控制力矩如下:Μ¯c=g¯21-1(ω¯˙-f¯2)(37)为了保证系统的因果性,Ω∸,ω¯˙将由Ω¯,ω¯经过如下伪微分器求得Gi,diff=ωi,diffss+ωi,diff,i=1,2(38)3.3单元线性化矩阵为了提高TLC的控制性能,可以通过定义外回路跟踪误差的增广向量,设计出线性时变PI调节器:eΩΙ=[∫(α-α¯)dt∫(β-β¯)dt∫(σ-σ¯)dt]‚eΩΡ=[α-α¯β-β¯σ-σ¯](39)若定义eΩ=[eΩΙΤ,eΩΡΤ]T,则原外回路(34)被增广成如下形式ξ˙1=F1(ξ1)+G11(ξ1)μ1η1=[α,β,σ]Τ(40)其中ξ1=[∫αdt,∫βdt,∫σdt,α,β,σ]ΤF1=[α,β,σ,fα,fβ,fσ]Τ,G11=[Ο3g11]μ1=[p,q,r]TO3表示3×3零矩阵,I3表示3×3单位阵。首先求得e˙Ω在(Ω¯,ω¯)处的线性化矩阵为:A1=[Ο3Ι3Ο3AR1]‚B1=G¯11(41)AR1=[a111a112a113a121a122a123a131a132a133]注:AR1中所有元素的表达形式可用Matlab提供的符号计算工具方便求得,此处省略。根据文献可知期望的外回路闭环误差动态特性具有如下形式:AC1=[000100000010000001-τ11100-τ112000-τ12100-τ122000-τ13100-τ132]其中参数τ1jk,j=1,2,3,k=1,2均为时变函数,是相关的闭环二次PD特征方程系数。根据式AC1(t)=A1(t)+B1(t)Κ1(t)(42)可方便求得K1(t)。那么,外回路控制输入为ωc=ω¯+Κ1(t)eΩ(43)3.4内回路增广误差动态特性由于ωc=[pc,qc,rc]T又成为内回路的跟踪指令,类似(39)定义eωΙ=[∫(p-pc)dt∫(q-qc)dt∫(r-rc)dt]‚eωΡ=[p-pcq-qcr-rc](44)若定义eω=[eωΙΤ,eωΡΤ]T,则有:ξ˙2=F2(ξ2)+G21(ξ2)μ2η2=[p,q,r]Τ(45)其中ξ2=[∫pdt,∫qdt,∫rdt,p,q,r]ΤF2=[p,q,r,fp,fq,fr]Τ,G21=[Ο3g21]μ2=[Lctrl,Μctrl,Νctrl]Τ同理,内回路增广误差eω动态特性在(ω¯,Μ¯c)处线性化易得:A2=[Ο3Ι3Ο3AR2]‚B2=G¯21(46)AR2=[a211a212a213a221a222a223a231a232a233]若期望的内回路闭环误差动态特性为AC2=[000100000010000001-τ21100-τ212000-τ22100-τ222000-τ23100-τ232]则根据AC2(t)=A2(t)+B2(t)Κ2(t)(47)可得K2(t)的具体形式。那么内回路控制力矩为Μc=Μ¯c+Κ2(t)eω(48)3.5外内回路控制律设计当干扰和不确定存在时,可在当前TLC控制的基础上,设计神经网络补偿控制律来提高控制性能。那么在内外回路误差(39)(44)的定义下,原系统(34)(35)的增广形式分别如下:ξ˙1=F1(ξ1)+G11(ξ1)μ1+G12(ξ1)d1(49)ξ˙2=F2(ξ2)+G21(ξ2)μ2+G22(ξ2)d2(50)由于,那么显然存在可逆矩阵G10,G20使得匹配条件成立,即G10=g11-1‚G20=g21-1(51)若取外内回路的神经网络输入分别为xΩ=[eΩΤ,ΩCΤ,Ω˙CΤ]Τ(52)xω=[eωΤ,ωCΤ,ω˙CΤ]Τ(53)因此式(43)和(48)外内回路控制律最终为ωc=ω¯+Κ1(t)eΩ-G10v^ad1(54)Μc=Μ¯c+Κ2(t)eω-G20v^ad2(55)3.6外回路带宽+a期望的二阶闭环系统PD特征值为ρijk(t)=-(ξij±J1-ξij2)ωnij(t)(56)i=1,2,j=1,2,3,k=1,2,J2=-1其中ξij为常值阻尼,ωijk(t)为时变带宽,则此时矩阵AC1和AC2中的时变系数相应为:τij1(t)=ωnij2(t)τij2(t)=2ξijωnij(t)-ω˙nij(t)ωnij(t)(57)同时由于ASV飞控系统采用时标分离内外回路分别设计的方法,因此要求内回路的带宽ωn2j(t)相对于外回路带宽ωn1j(t)足够大,以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论