MRAC讲义(new2010)模型参考自适应.doc_第1页
MRAC讲义(new2010)模型参考自适应.doc_第2页
MRAC讲义(new2010)模型参考自适应.doc_第3页
MRAC讲义(new2010)模型参考自适应.doc_第4页
MRAC讲义(new2010)模型参考自适应.doc_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4部分模型参考自适应控制系统1概述1.1模型参考自适应控制(MRAC)图1.1模型参考自适应控制系统由四部分组成:u 带有未知参数的被控对象假设被控对象的结构已知。对于线性系统,这意味着系统的极点数和零点数是已知的,但它们的位置是未知的。u 参考模型(它描述控制系统的期望的输出) 应当能反映控制任务中的指定的性能; 规定的理想性态应当是自适应控制系统可以达到的,即当给定对象模型结构后,对参考模型的结构有一些特有的限制(如阶数和相对阶)。u 带有可校正参数的反馈控制律 可以得到一族控制器; 应当具有“完全的跟踪能力”,达到跟踪收敛,即当被控对象的参数精确已知时,相应的控制律应当使系统的输出与参考模型的输出相等; 现有的自适应控制设计通常要求控制器参数线性化。如果控制规律中可调整的参数是线性的,则称控制器是参数线性化的。u 校正参数的自适应机制 能保证当参数变化时系统稳定并使得跟踪误差收敛到零; 设计方法有李雅普诺夫定理,超稳定性理论,耗散理论等。例1.1.1 质量未知的模型参考自适应控制图1.2 一个非线性质量一阻尼弹簧系统图1.2中的质量一阻尼弹簧系统,其动力学方程为其中,表示非线性耗散式阻尼,而代表非线性弹簧。考查用电动机力控制一个质量为的质点在没有摩擦的表面上运动,其性态可以描述为 (1.1)假设给控制系统发出定位指令。用下面的参考模型给出受控物体对外部指令的理想响应 (1.2)其中,正常数和反映指定的性能,在理想情况下,物体应当像质量弹簧阻尼系统一样运动到指定的位置。若质量精确已知,可以用下面的控制律实现完全跟踪其中,表示跟踪误差, 是一个严格大于零的数。由这个控制器可以得到按指数收敛的误差系统 现在假设质量 不是精确已知的。可以用下面的控制律 (1.3)其中,表示可以校正的参数。将这个控制律带入对象动态中,得到闭环误差动态 (1.4)其中,是组合跟踪误差,定义为 (1.5)信号量 定义为 参数估计误差 定义为 方程(1.4)表明组合跟踪误差与参数误差通过一个稳定滤波器相关联。 的参数更新规律 (1.6)其中正常数 称为自适应增益。注:参数 的校正是基于系统的信号,自适应控制系统具有非线性本质,从而控制器(1.3)也是非线性的。 仿真分析:设物体的真实质量是 ,选择零作为 的初值,这表明预先不知道真实质量。自适应增益为 ,分别选择其他设计参数为 , , 。图1.3 跟踪性能和未知质量参数的估计,图1.4 跟踪性能和未知质量参数的估计,图1.3表示位置指令为,初始条件为 ,的仿真结果。图1.4表示期望位置是正弦函数的仿真结果。两种情形下位置跟踪误差均收敛到零,而只有后一种情形参数误差趋于零。1.2 模型参考自适应控制方法(MRAC)和自校正控制方法(STC)的关系STCMRAC更新参数是为了使得输入输出数据3.0之间的拟合误差最小更新参数是为了使得被控对象和参考模型之间的跟踪误差最小具有更高的灵活性,可以将不同的估计器和控制器耦合起来(即估计和控制分离)控制律和自适应律的选择相对复杂一般很难保证自校正控制器的稳定性和收敛性。通常要求系统的信号足够丰富,才能使得参数估计值收敛到真实值,才能保证系统的稳定性和收敛性。不管信号充足与否,系统的稳定性和跟踪误差的收敛性通常是可以保证的从随机调节问题的研究中演化而来从确定自动伺服系统的最优控制中发展起来的通常用于离散时间系统一般用于连续时间系统2 李雅普诺夫理论基础2.1 非线性系统与平衡点1非线性系统一个非线性动力系统可以用以下的非线性微分方程描述 (2.1)其中,f是一个n1的非线性向量函数,而x是一个n1的状态向量。状态数n称为系统的阶。状态向量的一个特定值对应于状态空间的一个点。方程(2.1)的一个解对应于状态空间的一条曲线,通常称为状态轨线或系统轨线。(2.1)可以表示一个无控制信号的动态系统(自由系统),也可以代表一个反馈控制系统的闭环动态。如果系统的动态方程为而设计的控制律为闭环系统的动态方程可以被改写成(2.1)的形式。一类特殊的非线性系统是线性系统。线性系统的动态方程为其中,A(t)为一个nn矩阵。2 自治系统与非自治系统定义2.1 非线性系统(2.1)称为自治的,如果f不显含t,即如果系统方程可写作 (2.2)否则,该系统称为非自治的。控制系统的非自治性可能来自模型或控制器。设有一个时不变的动力学模型为控制器是时变的,可能导致一个非自治的闭环系统,即如果u=g(x,t)。例如,简单模型,控制器是非线性非自治的(例如)。线性时不变装置的自适应控制器往往使闭环系统变为非线性和非自治的。自治系统和非自治系统的基本区别在于:自治系统的状态轨线不依赖于初始时刻,而非自治系统一般不是这样。3平衡点定义2.2 状态称为系统的一个平衡态(或平衡点),如果一旦,则此后状态永远停留在。数学上,这表明定常向量满足 (2.3)平衡点可通过解(2.3)求得。一个线性时不变系统 (2.4)当A非奇异时只有一个惟一的平衡点(原点0)。当A奇异时,它有无数平衡点,即满足Ax=0的所有解。这表明平衡点不是孤立的。例如:,x轴上所有的点都是它的平衡点。例2.1 摆图2.1摆摆的性态可用以下的非线性自治方程来描述 (2.5)这里R是摆长、M是质量、b是铰链的摩擦系数、g是重力加速度(常数),记。则相应的状态方程为 (2.6a) (2.6b)于是,平衡点满足因此,平衡点为及,从物理意义上讲,它们分别对应摆的垂直向上及垂直向下的位置。平衡点的变换设我们感兴趣的平衡点为,那么,引入新变量并将代入方程(2.2),即可得到关于变量y的方程 (2.7)当y=0时,对应于,是(2.7)的一个平衡点。因此,若要研究方程(2.2)在平衡点附近的性态,只要研究方程(2.7)在原点邻域的性态即可。2.2稳定的概念图2.2稳定的概念1稳定性与不稳定性定义2.3 一个平衡点x=0称为稳定的(也称李雅普诺夫意义下的稳定),如果任给R0,总存在r0,使当r时,R,t0。如果x=0不是稳定的,则称为不稳定平衡点。定义2.3可写成或等价地记作例2.2 范德波尔振子的不稳定性范德波尔振子方程为图2.3 范德波尔振子的不稳定原点控制系统性能要求由渐近稳定这个概念来描述。2渐近稳定性定义2.4 平衡点0称为渐近稳定的,如果它是稳定的,而且存在r0使当r时,。图2.2显示当系统轨线从球Br内出发的轨线均收敛到原点。球Br称为平衡点的一个吸引域,是指最大的一个区域,使从此区域出发的一切轨线均收敛于原点。一个李雅普诺夫稳定而又不是渐近稳定的平衡点称为临界平衡点。上述定义表征了系统的局部性态。3. 局部稳定性与全局稳定性定义2.5 如果对任何初值渐近稳定成立,则这样的平衡点称为大范围渐近稳定,也称全局渐近稳定。线性时不变系统的稳定性分三种:渐近稳定、临界稳定和不稳定。2.3李雅普诺夫直接方法李雅普诺夫直接方法的基本原理是一个基本物理现象的数学表达。可以由一个标量函数的变化来判断一个系统的稳定性。图2.4 一个非线性质量一阻尼弹簧系统图2.4中的质量一阻尼弹簧系统,其动力学方程为 (2.8)这里表示非线性耗散式阻尼,而代表非线性弹簧。系统的全部机械能是它的动能与势能之和 (2.9)机械能和前面定义的稳定性概念之间的联系 能量为0对应于平衡点。 渐近稳定意味着机械能收敛到零。 不稳定对应于机械能的增长。机械能作为一个标量以隐含形式反映着状态向量的幅值,而且系统的稳定性可以通过系统能量的变化来描述。系统运动中能量的变化率为 (2.10)由于阻尼的存在,系统的能量不断减少,一直到质点停止运动,即。2.3.1 正定函数与李雅普诺夫函数上述能量函数有两个性质:第一个性质:它除了x及均为零的点外严格正;第二个性质:当x及依动力学方程(2.8)变化时,该函数单调下降。定义2.6 一个标量连续函数V(x)称为局部正定的,如果V(0)=0,且在一个球内如果V(0)=0且上述性质在整个状态空间成立,则称V(x)为全局正定函数。例如函数它是例2.1中摆的机械能,它是局部正定的。又如非线性质量阻尼弹簧系统的机械能(2.9),它是全局正定的。注:这个系统动能不是正定的。图2.5 正定函数的典型形式类似地定义几个相关概念:函数V(x)称为局部或全局负定的,如果V(x)是局部或全局正定的;V(x)是正半定的,如果V(0)=0且对一切x0,V(x)0;V(x)是负半定的,如果V(x)是正半定的。设x为自治系统(2.2)的状态,假定V(x)是可微的,它对时间的导数可以用链式法则得到通常将这个导数称为“V沿着系统轨线的导数”。定义2.7 如果在一个球内,函数V(x)是正定的,且有连续偏导数,而且它沿系统(2.2)的任一状态轨线的导数为负半定的,即那么V(x)称为系统(2.2)的李雅普诺夫函数。图2.6 定义2.7在n=2时的描述2.3.2 平衡点定理包括局部与全局两类。局部定理描述平衡点邻域的稳定性质。1局部稳定性的李雅普诺夫定理定理2.1(局部稳定性) 如果在一个球内,存在一个标量函数V(x),它具有一阶连续偏导数,并且 V(x)正定(在球内) 负半定(在球内)那么平衡点0是稳定的,如果导数V(x)在球内是负定的,那么0是渐近稳定的。例2.3 局部稳定性带有粘性阻尼的单摆方程为考查以下标量函数 (2.11)这个函数是局部正定的。时间导数为0利用上述定理可知,原点是稳定平衡点。物理学观点,是摆消耗能量的功率。选择这个李雅普诺夫函数,还不能得到系统渐近稳定的结论,因为只是负半定的。选择适当的李雅普诺夫函数,可以得到更精确的结果考查以下标量函数(2.12)它也是系统的一个李雅普诺夫函数,因为局部地有更为有趣的是实际上是局部负定的,证明了摆的渐近稳定性。一个重要事实:李雅普诺夫分析中的所有定理都是充分性定理。例2.4 局部渐近稳定性考查下述非线性系统关于原点的稳定性给定正定函数它沿着系统轨线的导数为因此,在二维球B2内(或 2的区域内)局部负定。从而,原点是渐近稳定的。2全局稳定性的李雅普诺夫定理放大到整个状态空间。一个附加条件:V(x)必须是径向无界的,这指的是,当时(当x沿任何方向趋于无穷时),。定理2.2(全局稳定性) 假定存在状态x的标量函数V,它具有一阶连续偏导数,并且 V(x)正定 负定 ,当那么原点作为平衡点是全局渐近稳定的。例2.5 考查系统状态空间原点是它的一个平衡点。设V为正定函数V沿任一系统轨线的导数为它是负定的。因此,原点是全局渐近稳定平衡点。注意:这个全局稳定的结果也表明原点是系统惟一的平衡点。2.4 线性时不变系统的李雅普诺夫分析1对称矩阵、正定矩阵定义2.8 一个方阵M称为对称的,如果M=MT(即,如果对)定义2.9 一个nn方阵称为正定的(p. d.),如果换言之,一个矩阵M是正定的,如果二次函数是正定函数.每个正定矩阵对应一个正定函数。反之,显然不成立。判定定理:设M为对称矩阵,M正定的充要条件是其主子式(即M11,M11M12M21M22,detM)均为正数;或等价地,其特征值均为正数。正半定、负定、负半定等概念可类似定义。一个nn方阵M被称为正半定的(p.s.d.),如果2线性时不变系统的李雅普诺夫函数给定一个线性系统,考虑一个候选二次李雅普诺夫函数其中,P是一个给定的对称正定矩阵,函数沿系统轨线的导数为另一个二次形式 (2.13)这里 (2.14)因此,问题变成能否找到一个对称正定矩阵Q使它满足李雅普诺夫方程(2.14)。例2.6 考虑二阶线性系统,其A矩阵为选P=I,则得矩阵Q不是正定的。给定一个正定矩阵Q,反过来找正定矩阵P,即 选择一个正定矩阵Q。 由李雅普诺夫方程(2.14)解出P。 检验P是否正定。定理2.3 一个线性时不变系统渐近稳定的充要条件是,任给对称正定矩阵Q李雅普诺夫方程(2.14)有惟一矩阵解P,而且P是对称正定的。说明:任何正定矩阵Q都可以用来判定线性系统的稳定性。例2.7 考虑例2.6中的二阶系统,取Q=I且设这里,由于P的对称性,有,于是李雅普诺夫方程为其解为相应的矩阵为它是正定的,因此原线性系统是全局渐近稳定的。3 高级稳定性理论3.1 非自治系统的稳定性概念1 平衡点对一个形如 (3.1)的非自治系统, 称为它的一个平衡点,如果下式成立: (3.2)注意:对 此方程都成立,这意味着系统(3.1)在所有的时间内都能够停留在点。例如:线性时变系统 (3.3)当 不恒为奇异矩阵时,该系统有惟一的平衡点原点0。2 稳定性概念的扩展把自治系统的稳定性概念扩展到非自治系统,关键在于定义中要适当地包含初始时间 。定义3.1 平衡点0在 是稳定的,如果对于任意的,存在一个正数,使得 (3.4)否则,平衡点0是不稳定的。这个定义表明:状态轨线可以停留在一个半径 任意小的球内,只要它是从一个半径 充分小的球内出发。定义3.1不同于定义2.3,因为定义3.1中的初始球的半径依赖于初始时间。定义3.2 平衡点0在是渐近稳定的,如果 它是稳定的; ,使得。定义3.3 平衡点0是全局渐近稳定的,如果对有 3 稳定性概念中的一致性 定义3.4 平衡点0是局部一致稳定的,如果定义3.1中的标量可以选择为与无关,即。引入一致稳定概念的直观原因是为了排除对大的,越来越不稳定的系统。类似地,一致渐近稳定是为了限制初始时间 对状态收敛方式的影响。定义3.5 平衡点0是局部一致渐近稳定的,如果 它是一致稳定的; 存在一个半径与 无关的吸引球,使得初始状态在内的轨线关于一致收敛于0。对一致收敛是指对,使得对 有 即从球内出发的状态轨线经过与时间 无关的时间段 之后,一致收敛到一个更小的球内。一致渐近稳定总是蕴含渐近稳定,反之则不然。例3.1 考虑一阶系统它有通解 这个解渐近收敛到零,但不是一致收敛。直观上:对于更大的,此解要经过更长的时间才能接近于原点。通过用全空间替换吸引球,就可以得到全局一致渐近稳定的概念。3.2 非自治系统的李雅普诺夫直接方法1 时变正定函数和具有无穷大上界的函数定义3.6 标量时变函数 是局部正定的,如果, 且存在一个时不变正定函数,使得 (3.5)因此一个时变函数是局部正定的,如果它控制住一个时不变局部正定函数。全局正定函数可以类似的定义。用同样的方法可以定义其他局部的或者全局的相关概念。 函数是负定的,如果 是正定的; 是半正定的,如果它控制住一个时不变半正定函数; 是半负定的,如果是半正定的。定义3.7 标量函数具有无穷大上界,如果,且存在一个时不变正定函数,使得换句话说,标量函数具有无穷大上界,如果受一个时不变正定函数的控制。例3.2 一个简单的时变正定函数因为它控制住函数 。这个函数也具有无穷大上界,因为它被函数 控制住。给定一个时变标量函数,它沿着系统轨线的导数为 (3.6)2 非自治系统稳定的李雅普诺夫定理 定理3.1 (非自治系统稳定的李雅普诺夫定理) 如果在平衡点0的邻域球 内,存在一个具有连续偏导数的标量函数,使得1) 是正定的,2) 是半负定的,那么平衡点0是李雅普诺夫意义下稳定的。而且,如果3) 具有无穷大上界,那么原点是一致稳定的;如果条件2)加强为是负定的,那么平衡点是一致渐近稳定的。如果球 用全空间代替,且满足条件1),加强的条件2),条件3)和条件4) 是径向无界的,那么平衡点0是全局一致渐近稳定的。 与自治系统类似,如果在平衡点的某个邻域内,是正定的,沿着系统轨线的导数是半负定的,那么称为这个非自治系统的李雅普诺夫函数。例3.3 全局一致渐近稳定考查系统为了确定平衡点0的稳定性,选择下列标量函数这个函数是正定的,因为它能控制住一个时不变正定函数 。这个函数也具有无穷大上界,因为它能被时不变正定函数 所控制住。而且,这表明因此,是负定的。所以平衡点0是全局一致渐近稳定的。例3.4 具有无穷大上界条件的重要性 图3.1 函数令 是一个连续可微的函数,除了在峰点处为1外,其他为 。 的图形如图3.1,在取整数处为的峰点。假设在横坐标 处的峰点宽度小于 。所以 的无穷积分满足因此标量函数 (3.7)是正定的()。现在考虑一阶微分方程 (3.8)如果选择(3.7)为候选李雅普诺夫函数,发现即 是负定的。然而,(3.8)的通解为因此,原点不是渐近稳定的。3.3 用Barbalat引理作类李雅普诺夫分析问题:非自治系统的渐近稳定分析探求:的条件Barbalat引理是一个关于函数及其导数的渐近性质的纯粹的数学结果。3.3.1 函数及其导数的渐近性质给定一个关于的可微函数,有下面3个重要事实: 并不能推出当时存在极限。如。当时,存在有限极限并不意味着。如。 如果有下界且是递减的(),那么存在极限。未表明曲线的斜率是否趋于零。3.3.2 Barbalat引理引理3.1(Barbalat) 如果可微函数f(t),当时存在有限极限,且一致连续,那么当时。函数g(t)在0,)是连续的,如果0,0,0,0,R函数g在0,)是一致连续的,如果0,0,0,0,Rg是一致连续的,如果总是可以找到一个与特殊点t1无关的。可微函数一致连续的一个简单的充分条件是它的导数是有界的。Barbalat引理的一个推论:如果可微函数f(t),当时存在有限极限,存在且有界,那么当时,。引理3.2(类李雅普诺夫引理) 如果标量函数满足下面的条件 V(x,t)有下界; (x,t)是半负定的; (x,t)对时间是一致连续的。那么(x,t) 。下面考虑一个简单的自适应控制系统的渐近稳定分析。例3.5 带有一个未知参数的一阶自适应控制系统的闭环误差动力系统为其中e和是闭环动力系统的两个状态,分别表示跟踪误差和参数误差,w(t)是有界的连续函数。考查有下界函数其导数为0因此,e和是有界的。为了利用Barbalat引理,我们验证的一致连续性。的导数为这表明是有界的。因此是一致连续的。由Barbalat引理得。注意:虽然e收敛于零,但是系统不是渐近稳定的,因为这里只能保证是有界的。建立在Barbalat引理上的分析称为类李雅普诺夫分析。它与李雅普诺夫分析有两个微妙的但很重要的不同之处:1) 函数V可以仅仅是一个关于x和t有下界的函数,而不要求是正定函数;2) 第二,的导数一定是一致连续的,且为负或零。这里典型的做法是证明是有界的。3.4 正线性系统3.4.1 正实和严格正实传递函数考查以下形式的n阶单输入单输出线性系统的有理函数,假设分子和分母的多项式的系数是实数,且。分母的阶与分子的阶的差称为系统的相对阶。定义3.8 如果(3.9)则传递函数是正实的;如果对某个,则传递函数是严格正实的。例3.6 严格正实函数考查有理函数其中,相应于复变量有如果,那么,是正实的;选择,是严格正实的。定理3.2传递函数是严格正实的,当且仅当1) 是严格稳定的传递函数;2) 的实部沿着是严格正的,即(3.10)传递函数是严格正实的必要条件,即 是严格稳定的; 的Nyquist图完全在右半复平面内,在正弦曲线输入下,系统响应的相位移总是少于90; 的相对阶为0或1; 具有严格最小相位(即它的所有零点都在左半开复平面内)例3.7严格正实和非严格正实传递函数考查下列系统正实与严格正实传递函数的根本不同:正实传递函数允许在轴有极点,严格正实传递函数在轴没有极点。例3.8考查积分器的传递函数当时,例3.9 考虑传递函数判断h5是否是严格正实的。注意,h5可解释为是质量弹簧阻尼器系统当输入为作用力,输出为速度时的传递函数。h5是严格正实系统。3.4.2 Kalman-Yakubovich引理引理3.3(Kalman-Yakubovich)(正实引理)考查可控的线性时不变系统传递函数(3.11)是严格正实的,当且仅当存在正定矩阵P和Q,使得(3.12a)(3.12b)4 模型参考自适应控制设计方法4.1 如何设计自适应控制器 传统(非自适应)控制设计:首先确定的是控制器结构(即极点的位置),然后,根据已知的系统参数计算出控制器参数。自适应控制主要的不同:被控对象的参数未知,控制器参数必须由自适应律提供。自适应控制设计附加的任务:选择自适应律并证明适应性系统的稳定性。 自适应控制设计包括以下3个步骤:1) 选择含有变化参数的控制律;2) 选择校正这些参数的自适应律;3) 分析所得到的系统的收敛特性。MRAC设计:首先猜测李雅普诺夫函数,并且选择控制律和自适应律使得 下降。引理4.1 考虑两个信号和 ,它们之间有如下动态关系: (4.1)其中, 为标量输出信号, 是严正实的传递函数,是符号已知的未知常数, 是关于时间 的 维向量函数, 是可以测量的 维向量,如果向量服从如下规律: (4.2)其中 是正常数,那么 和全局有界。而且,如果 有界,那么当 时,图4.1 含有SPR传递函数的系统证明:设(4.1)状态空间描述为 (4.3a) (4.3b)因为 是严正实的,由KY引理知:对给定正定矩阵,存在正定矩阵 使得取正定函数 如下(4.4)其沿着(4.3)和(4.2)定义的系统轨线的导数为因此,(4.1)和(4.2)定义的系统是全局稳定的,和 是全局有界的。如果信号 有界,那么由(4.3a)知 也有界,故有界,意味着 一致连续。由Barbalat引理, 渐进地收敛到零。MRAC设计中: 被控对象的输出和参考模型的输出之间的跟踪误差与参数估计误差存在形式如(4.1)的关系; (4.2)给出了一种校正控制器参数且同时保证系统稳定的方法。4.2 一阶系统的自适应控制 讨论一阶系统的自适应控制。过程可以近似地表示为一阶微分方程 (4.5)其中, 是系统输出, 是输入,和 是系统参数。1 问题描述在自适应控制中,假定系统参数 和 是未知的。所期望的自适应系统的性态设为一阶参考模型 (4.6)其中, 和 是常数, 是有界的外部参考信号。参数 要求是严格正的,也选为严格正数。参考模型可以用它的传递函数 表示为其中且 是拉普拉斯变量。注意到 是严正实函数。 自适应控制的目的:寻找控制规律和自适应规律,使得模型的跟踪误差 渐近地收敛到零。需要假设参数的符号已知。2 控制律的选择图4.2 一阶模型参考自适应控制系统 选择如下控制律 (4.7)其中 和 是时变反馈增益。闭环系统为 (4.8)目标是使得系统可能实现精确模型匹配。如果被控对象参数已知,那么选择下面的控制参数 (4.9)则相应的闭环系统为它和参考模型动态相同,从而有零跟踪误差。3 自适应律的选择 记跟踪误差为 参数误差定义为自适应律提供的控制器参数与理想参数的差,即 (4.10)将(4.6)(参考模型)减去(4.8)(闭环系统)得到跟踪误差的动态 (4.11)它可以表示为参数误差和跟踪误差之间的关系式 (4.12)其中 表示拉普拉斯变量。由引理4.1,得到下面的自适应律 (4.13a) (4.13b)其中 是表示自适应增益的正常数。 决定了搜索适当控制器参数的方向。4 跟踪收敛性分析 用李雅普诺夫理论(或引理4.1)来分析系统的稳定性和收敛性质。候选李雅普诺夫函数如下 (4.14)沿系统轨线的导数为于是,自适应系统是全局稳定的,即信号 和 都有界。由Barbalat 引理保证跟踪误差 全局渐近收敛。因为和 的有界性蕴含 的有界性,从而 是一致连续的。例4.1 一阶系统设计自适应控制器控制不稳定系统假定对象参数 对于自适应控制器是未知的。参考模型选择为取自适应增益为 。两个控制器参数的初值均取为0,这表明没有先验知识。系统和参考模型的初始条件都取为零。 仿真中使用了两种不同的参考信号。 。从图4.3知跟踪误差收敛到零,但参数误差不收敛。 。从图4.4知跟踪误差和参数误差都收敛到零。图4.3跟踪性能和参数估计, 图4.4跟踪性能和参数估计,5 参数收敛性分析 推测:参考信号的性质与参数收敛性之间有某种关系,即只有当参考信号 满足一定条件时,估计参数才会收敛到理想控制器参数。 自适应机制的目标是寻找能使跟误差趋于零的参数。如果参考信号足够复杂,使得只有真实的参数向量能使跟踪误差收敛,那么参数才会收敛到真实值。 下面我们找出参数收敛的具体条件。稳定过滤器(4.12)的输出趋于零,于是必有收敛到零。当时间 相当大时, 几乎是常数,且即 (4.15)其中 参数收敛的问题简化为向量应满足什么条件使得这个方程有惟一零解。如果 是常数 ,那么对于大的时间,有其中 是参考模型的直流增益。所以方程(4.15)变为这蕴涵着估计参数收敛到参数空间中的一条直线。“持续激励”(persistent excitation)条件:持续激励是指存在严格正常数 和使得对任何,有 (4.16)直观上讲, 持续激励蕴涵对应于不同时间 的 不能总是线性相关。 剩下的问题: 与持续激励 之间的关系。对于一阶系统,如果 至少包含一个正弦部分,就可以保证 是持续激励。6 推广到非线性系统 由下面微分方程描述的一阶非线性对象 (4.17)其中 为任意的已知非线性函数。采用下面的控制规律 (4.18)其中第二项用来自适应地抵消非线性项。将控制律代入(4.17),然后减去(4.6)(参考模型),得到误差动态为其中,参数误差 定义为选择自适应律 (4.19a) (4.19b) (4.19c)类似的,可以证明跟踪误差 趋于零,且参数误差有界。 估计参数的收敛性质。对于常数参考输入 ,估计参数收敛到三维空间中的一条直线为了使参数收敛到理想值,信号向量 应当是持续激励的,即,存在正常数 和 使得对任意,有对于线性系统, 个参数的收敛估计需要在参考输入中至少有 个正弦函数。然而,对于非线性系统, 和 之间的定性关系依赖于特殊的非线性函数。 例4.2 一阶非线性对象的仿真假设非线性对象由下面的方程描述 (4.20) 使用和例4.1中相同的参考模型,初始参数和设计参数。对参考信号 ,仿真结果见图4.5。表明跟踪误差收敛到零,参数误差只是有界。对于参考信号,仿真结果见图4.6,此时跟踪误差和3个参数误差都收敛到零。 图4.5 一阶非线性系统自适应控制,图4.6一阶非线性系统自适应控制, 注释: 中单个正弦信号使得三个参数得到估计; 系统中的信号振动剧烈。原因:非线性特性通常产生更多的频率,所以 可能比 中包含更多的正弦信号。,信号向量 收敛到 其中, 为稳态响应, 为相应的函数值。其中, 和 是参考模型在 时的幅度和相差。信号向量 包含两个正弦信号, 中包含一个两倍频率的正弦信号。直观上讲,两倍频率部分是3个参数的估计收敛和估计参数振动更剧烈的原因。4.3 线性系统全状态反馈自适应控制1 问题描述 考查 阶线性系统的自适应控制 (4.21)其中,状态分量 都是可量测的。假设系数向量 是未知的,但是 符号已知。如质量弹簧阻尼系统:其位置和速度可测量。 控制的目标是使得跟踪下面稳定参考模型的响应(4.22) 其中, 是有界参考信号。2 控制律的选择 定义信号 为 (4.23)其中, 是使得 成为稳定多项式的正常数。在(4.21) (被控对象)的两边加上 并整理,将被控对象动态改写为参数已知时,选择控制律为 这表示极点配置控制器,它使得极点位置由系数 确定,所以跟踪误差 满足闭环动态参数未知时,控制律为 (4.24)其中,信号向量 ,且估计参数向量。跟踪误差 满足闭环动态 (4.25)其中 3 自适应律的选择 将闭环误差动态(4.25)改写为状态空间形式 (4.26a) (4.26b)其中 考查候选李雅普诺夫函数其中, 和 是对称正定常数矩阵,且对于给定 ,满足 计算 为因此,取自适应律为 (4.27)可得用Barbalat引理证明的收敛性。由上述控制律(4.24)和自适应律(4.27),使以及它的个导数都趋于零。参数收敛的条件是向量 的持续激励性。 4.4 线性系统输出反馈自适应控制本节我们考查只用输出量测而不是全状态反馈时线性系统的自适应控制。在控制器中需要引入动态结构。回顾一下,在传统的(无参数不确定性的)设计中,当所有的状态都可以量测时,我们将状态乘以常数增益得到的控制器可以镇定系统,然而,当只有输出量测时,必须用到观测器结构。线性定常系统可以用下面的传递函数表示 (4.28)其中Rp(p)=a0+a1p+an-1pn-1+pnZp(p)=b0+b1p+bm-1pm-1+pmkp称为高频增益。这是因为,由对象频率响应知:在高频段有即高频特性本质上决定于kp。该系统的相对阶是r=n-m。在自适应控制问题中,我们假设系数ai、bj(i=0,1,n-1;j=0,1,m-1)和高频增益都是未知的。假定所期望的系统性能由下面传递函数表示的参考模型描述 (4.29)其中,Zm和Rm分别为nm阶和mm阶首一胡尔维茨多项式;km是正数。为了能够完全跟踪,参考模型的相对阶必须大于或等于被控系统的相对阶。因此,假定nm-mmn-m。设计的目标是确定控制律和相应的自适应律,使得对象输出y渐近地趋于ym。在确定控制输入时,假定输出y是可以量测的,但不允许使用输出的微分,这是为了避免数值微分带来噪声放大。为实现这一目的,我们假定下面关于对象的先验知识: 系统的阶数已知 相对阶n-m已知 kp的符号已知 系统是最小相位的在4.4.1中,我们讨论具有相对阶为1的线性系统输出反馈自适应控制,即系统的极点数比零点数多一。这类系统的设计相对比较直接。在4.4.2中,我们讨论具有较高相对阶的系统的输出反馈设计。这种情形的自适应控制设计和实现更复杂,因为不能使用严正实函数作为参考模型。4.4.1 具有相对阶为1的线性系统当相对阶等于1,即m=n-1时,参考模型可以选择为严正实的。这在设计全局收敛自适应控制器时是关键。1控制律的选择首先必须知道,当系统参数完全知道的情况下,怎样的控制律可以实现完全跟踪。例4.3 完全跟踪控制器考查下式描述的系统 (4.30)和参考模型 (4.31)选取控制器如图4.7所示,控制律为 (4.32)图4.7 相对阶为1的模型参考控制系统其中,即z是一阶滤波器对输入u的输出,且1、1、2和k是控制器参数。如果这些参数选取如下:直接计算知从参考信号r(t)到系统输出y的传递函数为所以,用这个控制器可以达到完全跟踪,即。为什么闭环传递函数和参考模型的传递函数完全相同?我们注意到控制输入(4.32)由三部分组成。第一部分实际上使得系统的零点被参考模型的零点代替,这是因为从u1到y的传递函数为(见图4.7)第二部分把闭环系统的极点配置到参考模型极点的位置,这可以由从u0到y的传递函数看出来(见图4.7)第三部分将系统的高频增益kp用km替代。 图4.7所示的二阶系统控制器结构可以推广到任意具有相对阶为1的系统。控制器结构如图4.8所示,其中表示控制器参数,它们使得当系统参数已知时可以实现完全跟踪。图4.8 完全跟踪控制系统这种控制系统的结构可以如下描述:产生滤波信号的方块表示一个n-1阶动态可以描述为其中是一个(n-1)1的状态向量,是一个(n-1)(n-1)矩阵,是使得能控的常向量。选矩阵的极点和多项式Zm(p)的根相同,即 (4.33)产生(n-1)1阶向量的方块也有相同的动态,但是它以y作为输入,即下面讨论图4.8中的控制器参数。标量增益定义为它用来调整控制系统的高频增益。向量包含n-1个参数,它用来消去系统的零点。向量也包含n-1个参数,它和标量增益一起能将闭环系统的极点移动到参考模型极点的位置。系统中的控制输入是下面几项的线性组合:参考信号r(t)、对控制输入u进行滤波得到的向量、对输出y滤波得到的信号,以及输出信号本身。控制律可以用可校正参数和各种信号表示为 (4.34)对应于这个控制律和任意参考信号r(t),系统的输出为 (4.35)这是因为这些参数可以实现完全跟踪。在自适应控制问题中,系统的参数是未知的,并且上面描述的理想控制器参数也是未知的。我们选取下面的控制律代替(4.34) (4.36)其中,是由自适应律提供的控制器参数。2自适应律的选择记为包含所有的控制器参数的2n1维向量,为包含相应信号的2n1维向量,即于是控制律可写成如下的紧凑形式 (4.37)将的理想值记为,和之间的误差记为,估计参数可以表示为所以,控制律也可以写为为了选择使得跟踪误差e收敛到零的自适应律,我们首先必须找到跟踪误差和参数误差之间的联系。在(4.37)给出的控制律下,增益可变的控制系统可以等价地表示为图4.9,其中视为外部信号。由于理想参数使得图4.9中的系统输出由(4.35)给出,所以这里的输出必须为 (4.38)图4.9 时变增益系统的等价控制系统因为,所以跟踪误差和参数误差有下面的简单关系 (4.39)由引理4.1,可选择下面的自适应律 (4.40)其中,是表示自适应增益的正数。进一步可证明上述自适应控制系统的跟踪误差渐近地收敛到零。4.4.2 具有高相对阶的线性系统相对阶大于1的系统的自适应控制器和相对阶等于1的系统相比,控制律的选择非常相似,而自适应律的选择却很不相同。这种差别主要是由于此时参考模型不能是严正实的。1控制律的选择图4.9中的控制器部分也可用于相对阶大于l的系统,当系统参数精确已知时,该控制器能实现完全跟踪。例4.4 考查由下面传递函数描述的二阶系统以及参考模型这和例4.3很相似,但这里没有零点。考查图4.10所示的控制结构,它是将图4.7中的控制器结构作了一点修改得到的。注意到图4.7中滤波器中的bm被正数0代替。图4.10 相对阶为2的模型参考控制系统从参考信号r到系统输出y的闭环传递函数是可以选择控制器参数1、1、2和k使得(4.41)则闭环传递函数和参考模型的传递函数相同。很明显,这种参数的选择存在且惟一。 同样对于一般的相对阶大于1的系统,选择图4.11中的控制结构。图4.11 一般的相对阶大于1的模型参考控制系统控制律中滤波器的阶数仍然是n-1。然而,既然分子多项式Zm(p)的阶数小于n-1,所以不可能再选择滤波器的极点使得。这时我们选择 (4.42)其中1(p)是n-1-m阶胡尔维茨多项式。这种选择使得系统具有与参考模型相同的零点。记控制器前馈部分(u/u1)的传递函数为;反馈部分的传递函数为;其中多项式包含向量1中的参数,多项式包含0以及向量2中的参数。得到闭环传递函数为 (4.43)现在的问题是:能否选择k、0、1和2的值使得上述传递函数恰好等于,或等价为 (4.44)下面的引理给出了这个问题的答案:引理4.2:设和分别是n1阶和n2阶多项式。如果和是互质的,那么存在多项式和使得 (4.45)其中是任意多项式。将Rp看作引理中的,-kpZp看作,看作,可以得出结论:存在多项式和使得(4.44)成立。这意味着存在适当的控制器参数 使得精确模型跟随可以实现。2自适应律的选择当对象参数未知时,我们还使用形如(4.37)的控制律,即 (4.46)其中中的2n个控制器参数由自适应律提供。基于上面类似的理由,我们可以得到形如(4.38)的输出和形如(4.3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论