




已阅读5页,还剩155页未读, 继续免费阅读
(交通信息工程及控制专业论文)无模型学习自适应控制的若干问题研究及其应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
北京交通大学博上学位论文摘要 摘要 论文研究了非线性离散时间系统无模型自适应控制理论中的若干问题及应 用,丰富和完善了无模型自适应控制理论。论文主要研究内容和创新点总结如下: 一、证明了基于偏格式线性化方法的无模型自适应控制方案( p f l m f a c ) 的 输出调节问题的b i b o 稳定性和收敛性;并将相应的结果应用到永磁直线电机速度 控制和三容水箱液位控制中。 二、针对滞后非线性离散时间系统,提出了基于紧格式线性化方法的改进无模 型自适应控制方案( t f l i m f a c ) 和基于偏格式线性化方法的改进无模型自适应 控制方案( p f l i m f a c ) ,理论分析及仿真验证了t f l i m f a c 和p f l i m f a c 的有 效性。 三、针对一般非线性离散时间系统,基于迭代轴上的偏格式线性化方法和迭代 轴上的全格式线性化方法,提出了基于偏格式线性化方法的无模型自适应最优迭 代学习控制方案( p f l - m f a o i l c ) 和基于全格式线性化方法的无模型自适应最优迭 代学习控制方案( f f l m f a o i l c ) ,证明了所提出方案的稳定性和收敛性,并将相应 的结果应用到快速路入口匝道控制中。 四、针对一般非线性离散时间系统,提出了动态时变参数的迭代辨识方案,证 明了该种迭代学习辨识方案下的算法收敛性和鲁棒性,并将相应结果应用到快速 路的宏观交通流模型参数辨识中。 五、将一种基于投影算法的参数化自适应迭代学习控制方案( p d a i l c ) 应用到 快速路交通系统和永磁直线电机( p 儿m ) 控制系统中,仿真结果表明当系统的初 始条件和参考轨迹均迭代变化时,该控制方案仍能保证跟踪误差沿迭代轴的渐近 收敛性能。 关键词:非线性离散时间系统;无模型自适应控制;迭代学习控制:迭代学 习辨识;滞后;时变参数不确定性:永磁直线电机;三容水箱;快速路交通系统。 分类号:f t p 2 7 3 】 北京交通大学博士学位论文 a b s t r a c t a bs t r a c t t h i sd i s s e r t a t i o nf o c m e so ns o m ei s s u e so nt h em o d e l f r e ea d a p t i v ec o n t r o lt h e o r y a n di t sa p p l i c a t i o n sf o rn o n l i n e a rd i s c r e t e t i m es y s t e m s t h em a i nw o r ka n dk e y i n n o v a t i o n sa r es u m m a r i z e da st h ef o l l o w i n g : 1 t h es t a b i l i t ya n dc o n v e r g e n c eo ft h em o d e lf r e ea d a p t i v ec o n t r o lb a s e do np a r t i a l f o r ml i n e a r i z a t i o n ( p f l m f a c ) a l ep r o v e d ,a n dc o r r e s p o n d i n gr e s u l t sa r ea p p l i e dt o p e r m a n e n tm a g n e tl i n e a rm o t o r ( p m l m ) a n dt h r e e t a n kw a t e r 2 t h ei m p r o v e dm f a cb a s e do nt i g h tf o r ml i n e a r i z a t i o n ( t f l i m f a c ) a n d i m p r o v e dm f a cb a s e do np a r t i a lf o r ml i n e a r i z a t i o n ( p f l - i m f a c ) a r ed e v e l o p e df o ra c l a s so fl a r g el a gn o n l i n e a rd i s c r e t e - t i m es y s t e m t h e o r e t i c a la n a l y s i sa n ds i m u l a t i o n r e s u l t ss h o wt h a tt h et f l i m f a ca n dp f l i m f a ca r ee 所c i e n t 3 b a s e do nt h ep a r t i a lf o r ml i n e a r i z a t i o nm e t h o da l o n gi t e r a t i o na x i sa n dt h ef u l l f o r ml i n e a r i z a t i o nm e t h o da l o n gi t e r a t i o na x i s ,t h em o d e lf r e ea d a p t i v eo p t i m a li t e r a t i v e l e a r n i n gc o n t r o lb a s e do np f l ( p f l - m f a o i l c ) a n dt h em o d e lf r e ea d a p t i v eo p t i m a l i t e r a t i v el e a r n i n gc o n t r o lb a s e do nf f l ( f f l m f a o i l c ) a r ed e v e l o p e df o rac l a s so f s i s on o n l i n e a rd i s c r e t e - t i m es y s t e m s t h es t a b i l i t ya n dc o n v e r g e n c e o ft h e p f l - m f a o i l ca n df f l - m f a o i l ca r ep r o v e d ,a n dt h ec o r r e s p o n d i n gr e s u l t sa r e a p p l i e dt of r e e w a y t r a f f i cs y s t e m 4 a ni t e r a t i v el e a r n i n gi d e n t i f i c a t i o nm e t h o di s d e v e l o p e d t oe s t i m a t et h e p a r a m e t e r so ft h em o r eg e n e r a ln o n l i n e a rd i s c r e t e t i m es y s t e m t h es t a b i l i t y a n d c o n v e r g e n c eo ft h ei d e n t i f i c a t i o na l g o r i t h ma r ep r o v e d ,a n dt h ec o r r e s p o n d i n gr e s u l t s a l ea p p l i e dt of r e e w a yt r a f f i cs y s t e m 5 an o v e lp a r a m e t r i cd i s c r e t e - t i m ea d a p t i v ei t e r a t i v el e a r n i n gc o n t r o l ( p d a i l c ) b yc o o p e r a t i n gp r o j e c t i o na l g o r i t h mi sa p p l i e dt of r e e w a yt r a f f i cs y s t e ma n dp m l m c o n t r o ls y s t e m a n dt h e s i m u l a t i o nr e s u l t ss h o wt h a tt h ep d a i l cc a nd e a lw i t hr a n d o m i n i t i a lc o n d i t i o n sa n di t e r a t i o n - v a r y i n gr e f e r e n c et r a j e c t o r i e s ,i nt h es e q u e la c h i e v i n ga n a l m o s tp e r f e c tt r a c k i n gp e r f o r m a n c eo v e raf i n i t ei n t e r v a l k e yw o r d s :n o n l i n e a rd i s c r e t e - - t i m es y s t e m ;m o d e l f r e ea d a p t i v ec o n t r o l ;l t e r a t i v e l e a r n i n g c o n t r o l ;i t e r a t i v el e a r n i n gi d e n t i f i c a t i o n ;l a g ;t i m e - v a r y i n gp a r a m e t r i c u n c e r t a i n t i e s ;p e r m a n e n tm a g n e tl i n e a rm o t o r ;t h r e e - t a n kw a t e r ;f r e e w a yt r a m c s y s t e m c l a s s n o :【t p 2 7 3 】 i l 北京交通大学博士学位论文 独创性声明 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究 成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过 的研究成果,也不包含为获得北京交通大学或其他教育机构的学位或证书而使用过的 材料。与我一同工作的回志对本研究所做的任何贡献均已在论文中作了明确的说明并 表示了谢意。 学位论文作者签名:会1 签字日期:) 一册孵硐枷 学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国 家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位做作者躲食訇条 导师签名: 么 签字日期:少矿字年,二月j b签字日期:0 矿年t 2 月i r 日 北京交通大学博士学位论文1 绪论 1 绪论 1 1 引言 控制的根本目的是消除控制目标与对象实际行为之间的误差。在控制工程实 际中,控制目标和对象实际行为之间的误差是容易获取的,也是能够适当加以处 理的,因而基于误差来消除误差的原形p i d 控制器在工业控制实际中得到了广泛 的应用。但随着科学技术的发展,生产装置愈来愈大型化、复杂化,在生产过程 中出现了许多非线性、时变、大时滞、强耦合的环节,而且大的干扰还经常发生, 对付这样的被控对象,p i d 控制器就显得无能为力了。由此人们企图用现代控制理 论来解决这些问题,但是现代控制理论中,控制律的设计以建立数学模型或完备 的知识库和推理模式为基础。众所周知,建立实际工业过程的数学模型并不是一 件容易的事情,因为在无法深入了解被控对象过程机理的情况下,一般要先对系 统进行降阶处理,然后利用试验分析的方法来建立系统的数学模型,由于实际系 统的复杂性,又通常要用低阶线性时不变模型来代替实际的高阶非线性时变系统。 这样,势必要引入系统数学模型的不确定性,不确定性通常分为两类:一是系统外 部的不确定性,如未知干扰;二是系统内部的不确定性,如被控对象的未建模动 态等。因此,得到的数学模型一般不能描述系统的全部动态特性,如果不考虑控 制系统的未知扰动和未建模动态等,即使已被理论证明了的具有良好控制性能, 比如具有强稳定性、收敛性和鲁棒性的理论与方法,在实际应用中也可能会出现 很多的问题。 为了解决经典控制理论和现代控制理论中存在的问题,人们除了加强对生产 过程的建模、系统辨识、自适应控制、鲁棒控制等研究外,开始打破传统控制思 想的束缚,面向工业过程的特点,寻找各种对模型要求低、在线计算方便、控制 综合效果好的新的控制理论和方法。与此同时,计算机技术的飞速发展,使得高 速、大容量、低成本的计算机应用越来越广泛,也为新的控制理论和方法提供了 可实现的重要基础。基于无模型的控制技术不需要包含受控系统内部模型的任何 信息,仅需要系统的i 0 数据就能设计控制器,因此无模型控制已经成为当前控 制界研究的一个热点,经过几十年的发展,无模型控制方法在国内外色有一些标 志性的成果f l 】:无模型自适应控制理论 i - 3 2 j ( m o d e lf r e e a d a p t i v ec o n t r o l ,m f a c ) , 迭代学习控制理论3 3 。引( i t e r a t i v el e a r n i n gc o n t r o l ,i l c ) ,自抗扰控制理论【3 叫5 】 ( a u t od i s t u r b a n c er e j e c t i o nc o n t r o l l e r , a d r c ) ,迭代反馈整定控制理论1 4 j j 北京交通大学博士学位论文1 绪论 ( i t e r a t i v ef e e d b a c kt u n i n g ,i f t ) ,非伪控制理论【5 4 - 5 6 ( u n f a l s i f i e dc o n t r o l ,u c ) , 虚拟参考反馈整定控制理论5 7 侧( v i r t u a lr e f e r e n c ef e e d b a c kt u n i n g ,v r f t ) 等,并 且这些新兴的无模型控制理论在多个领域已经取得了成功应用。 综上所述,研究无模型控制方法具有重大的理论意义和巨大的应用价值。 1 2 非线性系统的无模型控制理论 1 2 1 无模型自适应控制理论 近年来,自适应控制( a d a p t i v ec o n t r o l ,a c ) 6 1 - 6 8 】取得了令人瞩目的发展, 吸引了许多控制工程与系统工程方面的学者和工程师。自适应控制是处理含有常 值或慢时变参数不确定性动态系统的最有效方法之一,能够在线调节控制增益和 控制参数,以适应外界环境变化、外界干扰等因素的影响,从而当时间趋于无穷 时,实现跟踪误差的渐近收敛。 线性系统自适应控制的收敛性、稳定性和鲁棒性研究都取得了巨大的进步1 6 。 就离散时间系统来讲,其中两种最主要的分析方法就是“关键技术引理 【6 3 】和“线 性时变方法”【6 引。八十年代中期,自适应控制的研究主要是针对存在未建模动态 和有界干扰的鲁棒性问题,提出了一些重新设计和修正的方法。例如,在控制器 设计中应用归一化方法1 6 9 】,自适应律修正中运用投影方法【矧、死区修正1 7 0 l 、s 一修 正【7 1 】和仃一修正【7 2 】等。 自适应控制系统的设计从概念上讲是很简单的,一个很自然的方法就是把待 定的参数估计算法和任何一个控制律相结合。 我们知道有一大类线性和非线性确定性动态系统的输入、输出特性可简洁地 表示成下面的模型1 6 3 j 一 ,11 、 夕( 七) = i p ( 七一1 ) 70 0 , 、l1 7 其中j ,( 七) 为标量系统在时刻七的输出:i p ( 七- 1 ) 为 y ( k - 1 ) ,y ( k - 2 ) ,) 和 u ( k - 1 ) ,u ( k 一2 ) ,) 的线性或非线性函数矢量( 已知) ;0 。为参数向量( 未知定常参 数) 。 在模型( 1 1 ) 式的基础上,我们可以利用参数估计算法,在线估计系统的未 知参数,并以此计算控制律,使其适应系统的变化。这一类算法通常称为间接自 适应控制,因为控制律是通过对系统模型的估计间接得到的。直接自适应控制则 是直接估算控制器参数以适应系统的变化。 非线性系统的自适应控制主要分为两大类l 引。一类集中于一些特殊的对参数线 2 北京交通大学博士学位论文1 绪论 性的非线性系统,例如:h a m m e r s t e i n 模型、w i n n e r 模型、双线性模型、n a p j i a x 模型等。这几种非线性系统的自适应控制,基本上都是将已有的线性系统的辨识 和自适应控制方法加以推广得到的,没有脱离线性自适应控制的框架。另一类是 针对具有较一般结构的非线性系统的自适应控制,所采用的方法主要有反馈线性 化、b a c k s t e p p i n g 方法、l y a p u n o v 方法、预测控制方法、多模型方法和神经网络 方法。然而,大多数理论成果的获得都依赖于系统精确的数学模型。 综上所述,目前大多数自适应控制的理论成果均依赖于系统精确的数学模型, 从而存在对受控系统数学模型结构的依赖性和未建模动态两个问题。但是众所周 知,建立受控系统的数学模型并不是一件容易的事情,有时甚至是不可能的,尤 其是针对非线性系统的建模问题,到目前为止仍然是一个非常困难的问题。并且, 即使受控系统的数学模型已经建立起来,未建模动态也是避免不了的,基于建立 的数学模型所设计的自适应控制系统在实际应用中就有可能出现问题。从而如何 摆脱对受控系统数学模型的依赖及未建模动态对控制系统的影响,一直是自适应 控制界的一个难点。 基于上述问题的驱动,侯忠生教授于1 9 9 4 年在其博士论文 2 中提出了无模 型自适应控制( m f a c ) ,无模型自适应控制仪用受控系统的i o 数据就可以实现 控制器的设计,可以实现受控系统的参数自适应控制和结构自适应控制,关于无 模型自适应控制的设计方法和分析手段将在第二章详细介绍。经过十几年的发展, 无模型自适应控制无论在理论上还是在实际应用上,都取得了令人鼓舞的成果, 从而进一步激发了人们对无模型自适应控制理论的研究兴趣。 在理论上,无模型自适应控制理论取得了如下成果:文献 8 给出了一系列一 般非线性离散时问系统的动态线性化方法,其中包括紧格式线性化方法( t i g h t f o r ml i n e a r i z a t i o n ,t f l ) 、偏格式线性化方法( p a r t i a lf o r ml i n e a r i z a t i o n , p f l ) 和全格式线性化方法( f u l lf o r ml i n e a r i z a t i o n ,f f l ) ,并且给出了严格 的数学证明,该方法与以往的线性化方法相比具有如下优点:首先它不需要知道 受控系统的数学模型、阶数及时滞;其二它不需要事先已知受控系统的参考轨线; 第三,它不需要受控系统的先验知识;第四,线性化后的线性模型结构简单,参 数少,且是时变增量形式;第五,对某一具体的非线性系统来说,它的动态线性 化模型具有不唯一性,即它可以有几种不同的动态线性化模型的表示形式;最后 此套方法能适用于s i s o ,m i s o ,m i m o 非线性系统中的一大类系统。同时文献 8 还提出了基于紧格式线性化方法的无模型自适应控制( t f l 崛c ) 、基于偏格式线 性化方法的无模型自适应控制( p f l - m f a c ) 和基于全格式线性化方法的无模型自 适应控制( f f l 加a c ) ,从而形成了该理论的基本框架。文献 5 8 在一些假设条 件下给出了s i s o 非线性离散时间系统的t f l - m f a c 的输出调节问题的收敛性及稳 3 北京交通大学博士学位论文1 绪论 定性的证明,文献 8 在一些假设条件下还给出了m i s o 非线性离散时间系统的 t f l - m f a c 的输出调节问题的收敛性和稳定性证明,这些工作为无模型自适应控制 理论奠定了坚实的理论基础。文献 9 - 1 0 推广了文献 5 的结果,基于紧格式线性 化方法和一个新的控制输入准则函数,提出了s i s o 非线性离散时间系统的高阶非 参数自适应控制( h i g ho r d e rn o n - p a r a m e t r i ca d a p t i v ec o n t r o lb a s e do nt f l , t f l - h o n p a c ) 算法,并通过数学分析和仿真验证了该算法的正确性和有效性。文 献 1 1 推广了文献 5 的结果,提出了s i s o 非线性离散时间系统的基于紧格式线 性化方法的自适应预测控制算法( a d a p t i v ep r e d i c t i v ec o n t r o lb a s e do nt f l , t f l - a p c ) 。文献 1 2 推广了文献 5 和文献 1 1 的结果,提出了s i s o 非线性离散 时间系统的基于偏格式线性化方法的自适应预测控制算法( p f l a p c ) ,但是文献 1 2 所给出的b i b o 稳定性证明并不完善。文献 1 3 推广了文献 5 的结果,提出 了一种s i s o 非线性离散时间系统的基于紧格式线性化方法的自适应预测函数控制 算法( a d a p t i v ep r e d i c t i v ef u n c t i o n a lc o n t r o lb a s e do nt f l ,t f l a p f c ) ,并 证明了该自适应控制系统的输出调节问题的稳定性和收敛性。 文献 1 4 - 1 5 给出 两种新的实用的与基于模型的控制理论与方法相结合的控制系统模块化设计方 案:基于m f a c 估计型控制系统设计方案和基于m f a c 嵌入型控制系统设计方案,这 两种方案能够实现m f a c 与其他控制系统的优势互补,协同工作,发挥各自长处。 文献 1 6 在文献 5 的基础上,将神经网络与无模型自适应控制相结合,提出了一 种基于递归神经网络的无模型自适应控制。文献 1 7 提出了基于紧格式线性化方 法的无模型学习自适应控制算法( t f l 一肝l a c ) ,采用粒子群优化算法来优化无模 型自适应控制器设计。文献 1 0 ,7 3 将m f a c 的基本思想和分析手段引入到迭代 学习过程中,针对有限时间内重复运行的一般非线性离散时间系统,建立了迭代 轴上的紧格式线性化模型,基于迭代轴上的紧格式线性化模型,提出了一种非参 数自适应迭代学习控制方案( n o n - p a r a m e t r i ca d a p t i v ei t e r a t i v el e a r n i n g c o n t r o l ,n p _ d a i l c ) ,给出了控制输入的迭代学习律和“拟伪偏导数”的迭代更 新律,并给出了详细的收敛性分析。为了提高控制系统的收敛性能,文献 1 0 又 提出了n p d a i l c 的高阶学习控制律形式,即高阶非参数自适应迭代学习控制( h i g h o r d e rn o n p a r a m e t r i cd a i l c ,h o n p d a i l c ) ,n p - d a i l c 克服了传统迭代学习控制 中要求系统满足相同初始条件的局限。 在应用上,无模型自适应控制理论取得了如下成果:文献【1 1 把s i s o 非线性 离散时间系统的t f l a p c 应用到电机控制中;文献 1 2 1 把s i s o 非线性离散时间系 统的p f l a p c 应用到铸模、电机等领域:文献【1 8 】把s i s o 非线性离散时间系统的 t f l m f a c 应用到永磁直线电机控制中; p f l m f a c 应用到永磁直线电机控制中; 4 文献 1 9 】把s i s o 非线性离散时间系统的 文献【2 0 】把s i s o 非线性离散时间系统的 北京交通大学博士学位论文 1 绪论 t f l - m f a c 应用到p h 值中和反应过程中;文献【2 1 2 4 把s i s o 非线性离散时间系 统的改进的t f l m f a c 方法应用到化工、温度、压力等领域:文献 2 5 】把s i s o 非线性离散时间系统的t f l a p f c 应用至i j p h 值中和反应过程中;文献1 2 6 把s i s o 非线性离散时间系统的带神经网络补偿的t f l m f a c 应用到化工过程中;文献【2 7 】 把s i s o 非线性离散时间系统的t f l m f a c 应用副快速路交通控制领域;文献1 2 8 】 把m i m o 非线性离散时间系统的t f l m f a c 应用到工程结构减震领域;文献 2 9 】 把s i s o 非线性离散时间系统的t f l m f a c 应用到板材成形领域;文献 3 0 】把 s i s o 非线性离散时间系统的t f l m f a c 应用到焊接领域;文献【3 1 】把m i m o 非 线性离散时间系统的t f l m f a c 应用到机械设计领域;文献【3 2 】把s i s o 非线性 离散时间系统的p f l m f a c 应用到锅炉汽包水位控制中。 无模型自适应控制方法已经获得了中国技术发明专利,理论证明、仿真研究 和实际应用均表明无模型自适应控制方法能够处理强非线性和时变性系统的控制 问题。然而正如文献 1 中指出的,无模型自适应控制在理论和实际应用中还有很 多问题有待于进一步研究 ( 1 ) 目前的研究只是在一些假设条件下给出了s i s o ( m i s o ) 非线性离散时间系统的 t f l m f a c 和s i s o 非线性离散时间系统的t f l h o n p a c 的b i b o 稳定性和 误差收敛性证明。但是目前仍然未见s i s o ,m i s o 和m i m o 非线性离散时间 系统的p f l m f a c 的稳定性和误差收敛性证明。 ( 2 ) 当前的无模型自适应控制理论将受控系统的数学模型作为未知处理,但在系统 信息已知的情况下,这种做法未必合理,和经典控制的效果相比可能会有差距。 尽可能利用系统信息可以提高无模型自适应控制算法的控制性能。比如针对大 滞后对象,假如滞后时问的范围已知,就可以通过采用无模型控制算法结合预 估模型进行控制的方式改善无模型自适应控制算法的控制效果。 ( 3 ) 目前的研究只是在一些假设条件下给出了基于迭代轴上的紧格式线性化方法 的无模型自适应最优迭代学习控制方案( t f l m f a o i l c ) 的收敛性证明,但 是目前仍然未见基于迭代轴上的偏格式线性化方法的无模型自适应最优迭代 学习控制方案( p f l - m f a o i l c ) 和基于迭代轴上的全格式线性化方法的无模 型自适应迭代学习控制方案( f f l m f a o i l c ) 的相关理论和收敛性证明。 针对无模型自适应控制在理论和实际应用中存在的问题,论文致力于进一步 丰富完善无模型自适应控制理论,并通过在实际系统应用过程中发现的问题改进 无模型自适应控制方法,使之更适合实际系统。 5 北京交通大学博士学位论文1 绪论 1 2 2 迭代学习控制理论 自从1 9 8 4 年文献 3 3 针对机器人系统的特点,模拟人类学习技能的过程,开 创性地提出迭代学习控制的概念以来,迭代学习控制一直是控制界研究的热点领 域之一。针对不同类型的控制对象,文献 7 4 - 9 0 提出了形式多样的学习控制算法, 文献 9 1 - 9 6 在一定的假设条件下,利用各种数学工具,得到了迭代学习控制的收 敛性条件,文献 9 7 - 1 0 1 详细综述了最近迭代学习控制研究的进展,专著 3 3 - 3 8 则更全面、系统地介绍了迭代学习控制的近期研究成果。 随着迭代学习控制理论的不断发展和完善,迭代学习控制方法在实际控制工 程问题中也得到了广泛的应用,其中一个主要应用领域就是机器人控制盼1 0 6 j 。迭 代学习控制同时也被广泛应用于过程控制领域【1 0 7 川3 1 和交通控制领圳1 1 禾1 1 9 1 等。迭 代学习控制的这些应用背景,必然促使人们进行对其完整理论体系的探讨。 传统的迭代学习控制的学习律大多都是输出误差的p 型、p d 型或p i d 型控制 算法。该类算法对被控对象有许多限制性的约束,如要求非线性项满足全局 l i p s c h i t z 连续性等,并且学习控制过程依赖于实际上是未知的理想输入u d ( ,) 。 当被控对象含有时变参数时,传统的迭代学习控制方法因为其固定的学习律形式 而不能很好地适应系统的变化以及外界的干扰,自适应迭代学习控制( a d a p t i v e i t e r a t i v el e a r n i n gc o n t r o l ,a i l c ) 正是在这种背景下提出来的,其基本思想是 充分利用系统的先验信息,对系统的不确定参数和控制器中的控制增益进行自适 应迭代调节和学习。 类似于自适应控制,我们也可以将自适应迭代学习控制分为两大类i lo 】:间接 自适应迭代学习控制和直接自适应迭代学习控制。间接自适应迭代学习控制:首 先利用参数迭代更新律辨识系统的未知时变参数,然后根据参数的辨识结果调整 学习增益,以适应系统的变化。直接自适应迭代学习控制:直接根据系统的变化 在线调节控制器增益,不需要辨识系统的参数。 值得指出的是,跟传统的迭代学习控制方法一样,目前自适应迭代学习控制 研究的主要局限仍在于其控制器的设计和分析都是基于系统相同初始条件和参考 轨迹迭代不变的假设,即要求系统满足严格可重复条件。如果严格可重复条件被 破坏,则只能实现输出跟踪误差的有界收敛性,从而限制了其使用范围。因此, 迭代学习控制中初始条件的放宽成为具有重要意义的研究课题1 2 m 1 3 2 1 。然而,这些 研究大部分集中于跟踪误差有界收敛的鲁棒性能分析,只有当初始偏差消除时, 跟踪误差才能沿迭代轴渐近收敛为零。如果期望轨迹或控制目标随迭代次数而发 生变化,不论多小,学习过程必须从头开始,以前学习得到的控制知识将不能再 用来更新控制信号。相同参考轨迹的假设成为迭代学习控制在实际应用中的另一 6 北京交通大学博上学位论文1 绪论 个重要缺陷。目前,这方面的研究成果还不多。在文献 1 3 3 中,s a m e r 等针对期 望轨迹在迭代域中慢变的情况,分别提出了胪型、p d - 型和p i d - 型学习算法。在 文献 1 3 4 中,m o o r e 等指出高阶迭代学习控制律以处理参考轨迹迭代变化或干扰 迭代依赖的一类问题。在文献 1 3 5 。1 3 6 中,许建新等针对任意一个新的期望轨迹, 提出了直接学习控制和递归直接学习控制方法,利用以前获得的控制信息改进当 前的控制信号,实现对新的期望轨迹的跟踪。然而,这些控制方法本质上是属于 开环控制,并且要求以前控制信息完全正确,因此在实际应用中具有很大的局限 性。在文献 1 3 7 中,许建新等基于能量函数提出了一种新颖的能够跟踪不同期望 轨迹的迭代学习控制方法,其中任意两个连续迭代循环之间的期望轨迹可以完全 不同,美中不足的是该方法仅局限于连续时间系统。在文献 1 0 ,7 3 中,池荣虎等 针对有限时间内重复运行的非线性离散时间系统,提出了一种基于迭代轴上的紧 格式线性化方法的非参数自适应迭代学习控制方案( t f l n p d a i l c ) ,克服了传统 迭代学习控制中要求系统满足相同初始条件的局限。在文献 1 0 ,1 3 8 ,1 3 9 中,池荣 虎等针对在有限时间区间上执行完全跟踪任务带有时变参数不确定性的非线性离 散时间系统,提出了一种新的基于最小二乘算法( 或投影算法) 的离散参数自适 应迭代学习控制方案( p i ) a i l c ) ,与传统的离散自适应控制相比,该方法:实现 了有限时间区间的几乎完全跟踪性能;能够处理时变参数不确定性。与现有的迭 代学习控制及自适应迭代学习控制相比,所提出的方法:不要求系统的严格初始 重置条件:迭代重复中系统的参考轨迹可任意变化。 为了放宽迭代学习控制理论对相同初始条件的限制,本文推广了文献 1 0 ,7 3 研究成果,提出了基于迭代轴上的偏格式( 全格式) 线性化方法的无模型最优控 制方案( p f l m f a o i l c ,f f l m f a o i l c ) ,进一步丰富了无模型学习自适应控制理论, 并且使其更适合实际应用。另外,本文将文献 1 0 ,1 3 8 中提出的基于投影算法的 p - d a i l c 应用到快速路入口匝道控制和永磁直线电机控制中,与传统的迭代学习控 制和传统的自适应控制的仿真比较验证了该算法的有效性。 1 2 3 其它无模型控制理论 除了无模型自适应控制理论和迭代学习控制理论外,还有几种比较典型的无 模型控制理论和方法,比如自抗扰控制理论,迭代反馈整定方法,去伪控制方法, 虚拟参考反馈整定方法等。由于本文主要研究的是无模型自适应控制和迭代学习 控制,对这几种无模型控制方法仅作简单介绍。 基于用误差来消除误差的想法,自8 0 年代末开始,韩京清在剖析经典p i d 思 想精华的同时,认真分析了经典p i d 控制的局限,相继开发出对信号处理及控制 7 北京交通大学博上学位论文1 绪论 具有独特功能和效率的非线性跟踪微分器和扩张状态观测器,并提出了具有特殊 功能的非线性误差反馈机制,从而开发出像非线性p i d ,最优非线性p i d ,自抗扰 控制器,最优自抗扰控制器,自寻最优自抗扰控制器等一系列新兴非线性实用控 制器,在这些控制器结构中,自抗扰控制器具有代表性,因而统称为自抗扰控制 技术i j 9 啦j ,其最突出的特征就是把作用于被控对象的所有的不确定因素都归结为 未知扰动而用对象的输入输出数据对它进行估计并给予补偿。自抗扰控制技术是 一种实用性很强的控制技术,在火电厂、永磁电机控制、飞机飞行控制【4 5 】等多 个领域都取得了成功应用。虽然自抗扰控制技术取得了成功应用,但是已有的文 献对其理论上的研究工作还不多;而且自抗扰控制需要调节的参数很多,需要专 业人员调整。 迭代反馈整定方法( i f t ) 是一种由系统i o 数据驱动的无模型方法,南瑞典 的h h j a l m a r s s o n 和j o n a ss j o b e r g 于1 9 9 4 年提出1 4 6 ,其基本思想是预先给定 控制器结构,针对受控系统提出一个l o g 型优化性能指标,在闭环系统上迭代地 完成实验,用获得的数据计算性能指标函数对控制器参数的梯度,再采用 g a u s s n e w t o n 迭代算法,搜索使该指标函数最小的控制器参数,最终使控制器参 数向量收敛到局部极小点。i f t 方法的突出贡献在于它给出了一种计算指标函数对 控制器参数的无偏梯度( 也即系统输出微分的无偏信号) 的无模型方法,而在过 去人们是通过获取被控对象和扰动动态模型的估计来求取这些微分信号的。i f t 的 具体内容参见文献 4 6 - 5 3 3 。 美国的m i c h a e lg s a f o n o v 于1 9 9 5 年提出一种称为是去伪控制( u n f a l s i f i e d c o n t r 0 1 ) 的无模型控制方法p 4 。,其基本思想是首先构造一个满足性能规格的可行 控制器参数集合,然后基于量测到的新数据迭代地判别是否满足此性能规格,当 新量测到的数据否定掉目前使用的控制器之后,则控制器便会自动地切换到新的 控制器。当所使用控制器的性能规格未被所量测到的数据否定掉,则设计一个优 化算法缩小可行控制器的可行区域。此种无模型控制方法本质上是一种切换控制, 因此具有很多有待理论研究的问题,去伪控制的具体内容参见文献 5 4 - 5 6 。 虚拟参考反馈整定( v i w ) 方法是由g 0 g u a r d a b a s s i 提出的一种新的控制 器整定方法1 5 7 - 6 0 ,v r f t 只需要得到系统的一组i o 数据就可以选出一个合适的 控制器,但选择出的控制器是否与系统匹配则取决于我们获取的i o 数据能否将 足够的系统信息展现出来,因此v r f t 方法所找出的全局最优控制器实际上是与所 获得的i o 数据紧密相关的。在线性系统的控制器设计领域,由于许多理论已经 发展的非常成熟,例如z i e g l e r 和n i c h l o s 的校正方法等,因此v r f t 方法只是许 多传统控制方法的一个替代,然而在非线性系统的控制器设计领域,v r f t 是一种 “直接的基于数据的设计方法,它为解决非线性系统控制问题提供了一种简便 8 北京交通大学博上学位论文 1 绪论 的方法。从控制需求及其v r f t 的特征看,该领域尚有如下问题值得进一一步研究: 虚拟参考模型选择问题:灵敏性问题;评价函数的设计问题;应用性问题。v r f t 的具体内容参见文献 5 7 - 6 0 。 1 3 论文主要工作及组织结构 1 3 1 论文主要工作 本论文的选题来源于国家自然科学基金项目( 基金号:6 0 4 7 4 0 3 8 ) - “基于学习 的无模型自适应控制理论及其在快速路入口匝道控制中的应用 和高等学校博士 学科点专项科研基金( 基金号:2 0 q 6 0 0 0 4 0 0 2 ) “快速路交通流的非严格重复学习 控制理论及实现”的支持。针对无模型自适应控制和迭代学习控制在研究中存在 的主要问题,本文研究了无模型学习自适应控制的若干问题及其应用。论文的主 要研究内容可分为理论研究和应用研究两大部分,论文主要工作总结如下: 在理论研究方面: ( 1 ) 基于偏格式线性化的动态线性化模型能更加准确的表述非线性系统,但到目前 为止仍然未见s i s o ,m i s o 和m i m o 非线性离散时间系统的p f l m f a c 的稳 定性和误差收敛性证明。本文通过严格的理论推导,证明了s l s o 、m i s o 和 m i m o 非线性离散时间系统的p f l m f a c 的输出调节问题的稳定性和收敛性, 丰富了无模型自适应控制的理论基础; ( 2 ) 如果系统的滞后时间已知,可以采用无模型控制算法结合预估模型进行控制的 方式改善无模型自适应控制的控制效果。论文针对s i s o ( m i s o 、m i m o ) 滞 后非线性离散时间系统,基于伪偏导数( 伪梯度,伪j a c o b i 矩阵) 的概念动 态线性化非线性系统,提出了一系列适用于滞后非线性系统的改进无模型自适 应控制( i m f a c ) 方案,理论分析和仿真验证了提出控制方案的有效性。 ( 3 ) 针对一般非线性离散时间系统,提出了迭代轴上的偏格式线性化方法和迭代 轴上的全格式线性化方法,提出了基于偏格式线性化方法的无模型自适应最 优迭代学习控制方案( p f l m f a o i l c ) 和基于全格式线性化方法的无模型自适 应最优迭代学习控制方案( f f l m f a o i l c ) ,最后通过严格的理论推导证明了 这两种控制方案的稳定性和收敛性。在这两种控制方案中,控制器的设计和 分析不需要知道系统的任何先验知识,仅依赖于系统的输入输出数据。 ( 4 ) 针对一般的非线性离散时间系统,提出了动态时变参数的迭代辨识方案,通 9 北京交通大学博士学位论文1 绪论 过严格的理论推导,证明了该种迭代学习辨识方案下的算法收敛性和鲁棒性。 在应用研究方面: ( 1 ) 针对永磁直线电机在调速过程中表现出的“黑箱”或“灰箱”特性,本文将 t f l 坩a c 应用到永磁直线电机控制系统中,并给出了控制器参数的调节策略, 仿真结果说明了t f l - m f a c 的有效性。 ( 2 ) 本文将p f l m f a c 应用到三容水箱液位控制系统中,针对三容水箱液位控制系 统组合出的s i s 0 非线性系统和m i m o 非线性系统的仿真表明,所设计的控制器 对于干扰和耦合有较强的抑制作用,对于过程参数的摄动有较强的鲁棒性,而 且控制器的参数调整简单,易于实现。 ( 3 ) 针对快速路交通控制问题具有强非线性、不确定性和周期性的特点,将 p f l m f a o i l c 和f f l m f a o i l c 应用于快速路入口匝道控制中,仿真结果表 明了提出的控制方案的有效性。 ( 4 ) 针对快速路交通的强非线性、不确定性和周期性的特点,探讨了迭代学习辨识 方法在快速路宏观交通流模型参数辨识中的应用,仿真结果表明辨识算法效果 良好。 ( 5 ) 将一种新的基于投影算法的自适应迭代学习控制( p d a i l c ) 应用于永磁直线 电机控制系统和快速路交通系统。仿真结果表明当系统的初始条件和参考轨迹 均迭代变化时,该控制方案仍能保证跟踪误差沿迭代轴的渐近收敛性能。 1 3 2 论文创新点 为了方便读者阅读,将无模型自
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 3 1细胞膜的结构和功能教学设计高中生物人教版必修1
- 连锁餐饮食品成本控制办法
- 跨文化冲突心理干预-洞察及研究
- 长春版《英语语法手册》:初中英语语法学习指导
- 新学期小学一年级语文教学计划
- 农业领域技术合作研发协议
- 企业人力资源咨询服务合同
- 信息系统维护与升级管理模板
- 教师教学技能提升培训心得
- 餐饮行业节假日运营管理方案
- 最新VTE指南解读(静脉血栓栓塞症的临床护理指南解读)
- 旅行社计调实务课件完整版电子教案
- 乌有先生传(原文+注释+译文)精编版
- DB53∕T 1022-2021 三七栽培技术规程
- 直接还原铁生产工艺
- 《幂的运算》习题精选及答案
- 《春》默写练习
- 钢梁计算原理
- 风电场风机吊装施工工艺手册
- PPT汇报评分表(共1页)
- ESD防静电培训教材.ppt
评论
0/150
提交评论