(系统分析与集成专业论文)基于无模型控制外环补偿的控制系统模块化设计研究.pdf_第1页
(系统分析与集成专业论文)基于无模型控制外环补偿的控制系统模块化设计研究.pdf_第2页
(系统分析与集成专业论文)基于无模型控制外环补偿的控制系统模块化设计研究.pdf_第3页
(系统分析与集成专业论文)基于无模型控制外环补偿的控制系统模块化设计研究.pdf_第4页
(系统分析与集成专业论文)基于无模型控制外环补偿的控制系统模块化设计研究.pdf_第5页
已阅读5页,还剩59页未读 继续免费阅读

(系统分析与集成专业论文)基于无模型控制外环补偿的控制系统模块化设计研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

y 5 8 6 0 5 1 摘要 线性系统的自适应控制已经发展得比较成熟,有成熟的收敛性和 稳定性等理论分析的方法和手段。但是对于非线性系统来讲,虽然已 经有很多的文章发表,但都是针对一些特殊的非线性系统给出的。然 而,无论那一种自适应控制都存在如下的问题,即对受控系统数学模 型结构的依赖_ 葶d 受系统未建模动态的影响。因此,如何改善基于原有 自适应控制系统的控制品质,使之尽可能地摆脱由参数时变、未建模 动态及非线性性所产生的影响,不仅在理论上,对自适应控制理论在 实际中的应用也具有重要的意义。 论文结构如下:首先介绍了选题的学术背景与实际意义;第二章 介绍一种基于神经元网络的无模型控制方法同时扰动随机逼近 ( s p s a ) 神经元网络控制,并将它和无模型自适应控制从算法结构、 理论基础、计算复杂度、计算机仿真等方面进行比较;第三章是本论 文的主要部分,给出两种带有外环路补偿的自适应控制算法,即基于 无模型控制外环补偿的自适应控制算法和带有未建模动态估计外环 的白适应控制算法,它们是在原有的自适应控制系统的基础上增加一 个外回路来解决由于参数不确定性和结构不确定性引起的控制品质 下降的问题。并在一定假设条件下证明了基于偏格式线性化的无模型 自适应控制的稳定性结果。该种方法的特点是结构简单,能够处理结 构时变、阶数时变和参数时变等一大类非线性系统的控制问题。第四 章针对两种新型控制算法在计算机上进行了仿真研究,验证了控制算 法的有效性和优越性;最后对论文的主要观点作了归纳和总结,并提 出了需要进一步深入研究和探讨的问题。 关键词 非线性系统自适应控制无模型自适应控制未建模动态外环补偿 未经 # 喾、导娴遗煎 勿垒文公布 a b s t r a c t s i g m f i c a n tp r o g r e s sh a sb e e nm a d ei n t h er e s e a r c ha n dd e s i g no ft h e l i n e a ra d a p t i v ec o n t r o l s y s t e m sa n dt y p i c a ls t a b i l i t y a n dc o n v e r g e n c e - 。 a n a l y s i sm e t h o d sh a v eb e e np r o p o s e dt o o u pt on o w ,t h e r ee x i s t c f f o t so f l i t e r a t u r ep u b l i s h e do nn o n l i n e a rs y s t e mc o n t r o lp r o b l e m s ,b u tt h e ya r ea 1 1 血em e t h o d sp r o p o s e do ns p e c i a ln o n l i n e a rs y s t e m s h o w e v e r a l m o s ta l l o ft h ea d a p t i v ec o n t r o ls t r a f e g i e ss u f f e rt h ep r o b l e m s ,s u c ha s ,d e p e n d i n g o nt h em o d e lo ft h ec o n t r o l l e dp l a n ta n dt h eu n m o d e l l e dd y n a m i c s s o , h o wt oi m p r o v et h ec o n t r o lp e r f o r m a n c et ot h ee x i s t e da d a p t i v ec o n t r o l s t r a t e g i e si so fv e r yi m p o r t a n c en o to n l yt ot h ec o n t r o lt h e o r yb u ta l s ot o i t sa p p l i c a t i o n si np r a c t i s e t h e 也e s i si s o r g a n i z e d a s f o l l o w s ,c h a p t e r l c h i e f l yi n t r o d u c e st h e t h e o r e t i c a lb a c k g r o u n da n ds i g n i f i c a n c ef o rt h et h e s i s c h a p t e r2f i r s t 譬i v e sas u r v e yo ut h es p s ab a s e dm o d e l f r e ec o n t r o lu s i n gn e u r a l n e t w o r kc o n t r o l ,山e n f o l l o w ss o m ec o m p a r i s o nr e s u l t sb e t w e e nt h e s p s a & n nb a s e dm o d e l f r e em e t h o da n dt h em o d e l f r e e a d a p t i v e c o n t r o ls t r a t e g ya c c o r d i n gt ot h e o r yb a s i s ,c o m p u t i n gc o m p l e x i t yd e g r e e , s i m u l a t i o n s ,r e s p e c t i v e l y ,c h a p t e r3 i st h em o s li m p o r t a n tp a r to ft h e t h e s i s ,i nt h i ss e c t i o n ,t w ok i n d so fn e w - s t y l ea d a p t i v ec o n t r o ls t r a t e g i e s a r c p r o p o s e d ,t h e y a r e m o d e l f r e e - a d a p t i v e c o n t r o lc m f a c ) b a s e d e x t e r n a l l o o p a n dt h e a d a p t i v e c o n 玎0 1w i t hu n m o d e l l e de x t e l t a 一l o o p c o m p e n s a t i o n ,t h e s e t w oa d d e d o n l o o p s a r eu s e dt os e r v ea sa c o m p e n s a t o r t o rs y s t e mt r a c k i n ge r r o rc a u s e d b yt u n e v a r y i n gp a r a m e t e r s , p a r a m e t e re s t i m a t i o ne r r o r ,m o d e lm i s m a t c ha n du n m o d e l e dd y n a m i c s t m ss e c t i o na l s ol n c l u d e st h es t a b i l i t ya n a l y s i sr e s u l tf o r t h es i m p l e s te l l s e o ft h em o d e l f r e e a d a p t i v e c o n t r o lw i t hs o m ea s s u m p t i o n s t h et w o a l g o r i t h m sa r es i m p l et ou s ea n dt h e yc a nd e p r e s st h ep r o b l e m sc a u s e db y t h ev a r i a n c eo ft h e p a r a m e t e r o r d e r a n ds t r u c t u r eo ft h ec o n t r o l l e d n o n l i n e a rs y s t e m s c h a p t e r4p r e s e n t s an u m b e ro fs i m u l a t i o nr e s u l t s w h i c hd e m o n s t r a t et h eo f - c i e n c i e sa n dt h ec o r r e c t l e s so ft h em e t h o d s p r o p o s e d c h a p t e r 5i st h ec o n c l u s i o n sa n dt h ef u r t h e rr e s e a r c h t o p i c s , k e y w o r d sn o n l i n e a rs y s t e m ,a d a p t i v ec o n t r o l ,m o d e l f r e ea d a p t i v e c o n t r o l ,u n m o d e l l e dd y n a m i c s ,e x t e r n a l l o o pc o m p e n s a t i o n 第1 章绪论 1 1 确定性系统的自适应控制 1 1 1 概述 所谓控制,就是设计系统的控制输入信号使得在此控制输入信 号驱动下该系统的输出能够跟踪设定的目标信号,如机械人和机 器手的控制:宇宙飞船的姿态控制:工业对象中的流量控制;调 整经济时,利息和税率的控制;麻醉药物剂量使病人进入特定失 感状态的控制等等。当系统的模型己知时,已有许多设计方法, 如状态反馈、最优控制等,但是,几乎所有动态系统都带有未知 或者慢时变参数,像机械手抓举物体时初始参数的未知,动力系 统装载条件的变化,灭火飞机装卸水时质量的巨大变化等等。自 适应控制就是解决此类系统控制的一种方法,其基本思想是根据 系统可测信号在线估计系统的未知参数或控制器相关参数。自适 应控制系统可以认为是一种带有在线参数估计器的控制系统。 有些受控系统在控制一开始就存在控制参数的不确定性,如果 没有一个自适应机构能够在线她消除这种不确定性,就会导致控 制系统不稳定或跟踪输出信号的不精确;还有一些系统,系统的 动态在开始时是已知的,但是随着控制操作的进行,系统可能产 生不可预知的参数变化。这种情况下,如果没有控制器在线不断 地调整,开始设计好的控制器就不能有效地对系统进行控制。正 因为参数的这种不确定性和变化存在于许多实际系统的控制问题 中,所以自适应控制在工业控制中的应用非常广泛。 1 1 2 两类自适应控制系统 自从5 0 年代末期由美国麻省理工学院提出第一个自适应控制 系统以来,先后出现过许多不同形式的自适应控制系统。发展到 现阶段,无论是从理论研究还是从实际应用的角度来看,比较成 熟的自适应控制系统有以下两大类型:模型参考自适应控制 北京交通大学硕十学位论文 ( m o d e lr e f e r e n c ea d a p t i v ec o n t r o l ,简称m r a c ) 和自校正控制 ( s e l f - t u n i n gc o n t r o l ,简称s t c ) ”1 。 1 模型参考自适应控制系统: 此类自适应控制系统由参考模型、被控对象、反馈控制器和调 整控制器参数的自适应机构组成,如下图l l 所示: 圈1 1 模型参考自适应控制系统 这类控制系统包括两个环路:内环和外环。内环由被控对象和 控制器组成普通反馈回路,控制器的参数则由外环调整。由图可 以看出,模型参考自适应控制系统实际是在原有的反馈控制系统 的基础上,附加了一个参考模型和一个控制器参数的自动调节回 路,其中参考模型的输出响应y ,( 七) 表示系统期望的动态响应,当 参考输入r ( 七) 同时加到系统和参考模型入口时,由于受控对象的 动态参数未知或是变化的,控制器的初始参数也就可能整定不好, 产生偏差信号e ( k ) = y ,( k ) 一y ( k ) ,e ( k ) 经过自适应律所规定的运 算,产生相应的调整作用,从而改变控制器的参数,改变控制器 的输出“( 七) ,相应地改变受控对象的输出y ( k ) ,使y ( k ) 逐步接近 y 。( k ) ,直到y ( k ) = y ,( k ) 。此时g ( 七) = 0 ,自适应调整过程自动停 止。控制器参数也就自动整定完毕。 从以上系统的工作原理可以看出,此类控制系统解决问题的关 键在于如何设计自适应律来达到控制目的。目前关于自适应律的 设计主要有两类不同的方法,种称为局部参数最优化方法,即 绪论 利用梯度或其他参数优化的递推算法求得一组控制器的参数,使 某个预定的性能指标如j = j e 2 ( 七) 越达到最小。另一种设计方法是 基于稳定性理论的方法,它是在保证控制器参数的自适应调节过 程是稳定的前提下,尽量使整个过程收敛快一些。基于稳定性理 论的方法目前常用的主要有l y a p u n o v 稳定性理论和p o p o v 超稳定 性理论两种。 2 。自校正控制 这类系统是由估计器、调节器、被控对象、设计机构等几部分 构成,它的一个主要特点是具有一个被控对象数学模型的在线辨 识环节,具体地说,是加入了一个对象参数的递推估计器,具体 结构如下图: 图1 2 自控正控制系统 这类控制系统也包括两个环路:内环和外环。内环包括被控对 象和一个普通的线性反馈调节器,而调节器的参数由外环调节。 其工作原理是:根据被控对象的输入输出信息,利用估计器实时 估计被控对象的参数,然后根据估计值进行控制器的计算,修改 控制器的参数,再通过控制器的输出信号对被控对象施加控制, 以达到消除被控对象参数变化对系统性能的影响,使控制效果达 到预定目标。 自校正控制系统是根据确定性等价原理和分离原则来设计的, 北京交通大学硕士学位论文 先假设对象的参数是已知的,对调节器的参数进行在线调节,根 据给定的性能指标设计出系统的最优控制律,然后用未知参数的 估计值代替这个最优控制律中的相应未知参数,以便得到自校正 控制律。常用的控制算法有:最小方差自校正( 广义最小方差自 校正) 控制、极点配置自校正控制和p i d 自校正控制;另外还有 基于多步预测的自校正控制,增益调度自校正控制等等。在线辨 识参数的方法主要有:最小二乘法、投影算法、极大似然估计法 等等。 控制算法和辨识算法的不同组合构成了不同的自校正控制算 法。自校正控制算法可分为隐式和显式两种。所谓隐式自校正控 制,又称直接自适应算法,它是先将估计模型按控制器的参数重 新参数化,不需要估计过程参数而直接估计控制器参数的控制算 法。显式自校正控制,又称间接自适应算法,它是先将对象的参 数辨识出来,然后再估计控制器参数的控制算法,它的计算量较 大。下面介绍一种典型的自校正控制一一最小预测误差自适应控 制。 其基本思想是:根据在k 时刻已经得到的信息,预报k + d 时刻 的输出户( 七+ d ) ,然后,根据预报输出夕( 七+ d | d ) 计算适当的控制 律u ( k ) 来补偿随机扰动在k + d 时刻对输出的影响。之所以要提前 d 步进行预报是因为输入输出通道的滞后作用,使得现时的控制 作用u ( k ) 要滞后d 个采样周期才能对输出产生影响。这样,通过 不断地进行预测和调节,就能始终保持输出量的稳态方差为最小。 由此可见,实现预测误差自适应控制的关键在于预测。 1 预测模型 考虑被控对象的d a r m a 模型: a ( q 1 ) y ( 女) = b ( g 1 ) “( 女)( 1 1 1 ) 式中 a ( q 叫) = 1 + a l q 叫+ - + a 。q 一” b ( q 叫) = q 刊( b o + b i q - 1 + + b ,q 一) = q - a b ( g 。) 绪论 系统在k + d 时刻的输出可以表示成预测器形式: y ( k + d ) = a ( q “) y ( 女) + p ( q “) u ( k ) :7 ( 七) 口 其中 7 ( k ) = ( y ( 七) ,y ( k 一1 ) ,一,y ( k n + 1 ) ,“( 七) ,u ( k 一1 ) , 口1 = 缸o ,口1 ,一,a n - i , a o ,崩,崩+ ) a t ( q 。1 ) = g ( q 。1 ) ,( g 1 ) = f ( q 1 ) b ( g 。1 ) 多项式矩阵f ( q 1 ) 和g ( q 。) 都是唯一的,并满足 i = f ( q 1 ) 4 ( g 。) + q - d g ( q 1 ) f ( q 一1 ) = i + f , q - 1 + + 一i q 一。“ g ( q 一1 ) = g o + g i q “+ + g 。一l q 1 f ( q “) 和g ( q 。) 的系数可按下式计算: r o = , f = 一爿h ; g ,= 一爿。一, i = 1 ,一,d 一1 ( 1 1 2 ) u ( k 一1 一d + 1 ) ) ( 1 1 ,3 a ) ( 1 1 3 b ) f = 1 ,一,f 一1( 1 14 c ) ( 注意:上面公式中出现的一。,a 。,均被认为是零) 2 一步超前控制( 单输入单输出情形) 考患由确定性自回归滑动平均模型描述的系统: i ) 使时刻k + d 的输出y ( k + d ) 达到某个有界期望值y ( k + d ) 的反 馈控制律具有如下形式: f l ( q 1 ) u ( k ) = y ( k + d ) 一a ( q “) y ( k ) , k 0 ( 1 1 5 ) 2 1 所得的闭环系统为 y ( ) = y 。( 女) ; k 2 d b ( q 1 ) u ( k ) = a ( q “) y ( k ) , k d + n ( 1 1 6 ) 3 ) 所得的闭环系统具有有界输入和有界输出,只要: a ) “逆”模型的所有振型都位于闭单位园之内或之上。 c a b 3 4 4 1 1 i 1 1 l ( ( ( 北京交通大学硕士学位论文 b 1 “逆”模型的逆的所有能空振型严格位于单位园内。 c 1 “逆”模型的逆在单位园内上的任意一个振型所对应的根应 严格位于单位园内。 3 一步超前自适应控制 参数估计算法: o ( k ) = 百( 女一1 ) + z f i i ;! 【y ( 七) 一妒( 女一d ) 7 谷( t i ) 】 f 1 1 7 a ) 其中:0 及伽( 七) ) 是有界序列: 2 ) l i m y ( k ) 一y ( 七) = 0 : 3 ) l i m y ( 七) 一y ( 研 0 0 。 1 2 无模型自适应控制 1 2 1 非线性系统自适应控制面临的问题 传统的自适应控制系统设计思想主要包括两部分:在线估计 器和控制器。在线估计器利用受控系统的i 0 数据在线地估计出 模型参数或控制器参数;控制器则实时地计算出控制输入,使得 受控系统在此控制输入下的输出跟踪给定的期望输出信号。然而 自适应控制理论及方法都是基于以下的基本假设:受控系统的数 学模型结构己知,系统的参数未知或者慢时变。一般来说,自适 应控制方法不能处理好以下系统的自校正问题:非最小相位系统、 开环不稳定系统、未知阶数或变阶数系统、时滞未知或变时滞系 统、结构时变系统等。换句话说,现有的自适应控制系统缺乏对 广泛系统的适应性。 同时,自适应控制理论还存在另外两个问题:对受控系统数学 模型结构的依赖和未建模动态。没有数学模型就无从谈起控制: 有了数学模型就避免不了出现未建模动态。首先,建立受控系统 的数学模型不是一件容易的事情,有时甚至是不可能的,对时变 情况或非线形系统就更是如此。其次,即使受控系统的数学模型 已经建立起来,未建模动态也避免不了,基于建立的数学模型所 设计的自适应控制系统在实际应用中就有可能出现问题。 针对非线性系统自适应控制所面临的问题,如何设计部分依 赖、不完全依赖、不依赖受控系统数学模型的控制理论与方法, 国内外控制理论界已做了多年的努力,已发展了许多的理论和方 法。智能控制和专家控制、模糊控制、多模型方法等都是由于放 宽对受控系统数学模型的依赖的条件而产生和发展起来的。 1 2 2 无模型自适应控制的基本思想 处理非线性问题,尤其是非线性系统自适应控制问题,种常 见的方法就是将非线性系统线性化,我们在这里介绍一种不同于 已有的非线性系统线性化的方法,它是适合于控制系统设计的、 具有参数少、结构简单等特点的线性化方法。这种线性化方法是 对非线性系统在小范围内的一种折线化,与传统的线性化方式有 着本质的不同。 无模型自适应控制首先用一种全新的“目的于”非线性自适应 控制系统设计的一般离散时间非线性系统动态时变存在性线性化 方法,在受控系统轨线附近用动态线性时变模型来替代一般的非 北京交通大学硕士学位论文 线性系统,然后构造控制输入准则函数和参数估计准则函数,根 据优化思想得到控制律和参数估计算法。 1 2 3 无模型自适应控制方案 1 2 3 1 三种非线性系统线性化方法 一般离散时间非线形系统表示如下: y ( k + 1 ) = 厂( y ( 七) ,y ( k f l y ) ,“( 七) ,一,u ( k n 。) ) ( 1 2 1 ) 其中,y ( k ) ,u ( k ) 分别表示系统的输入与输出,u ( k ) r 1 或 u ( k ) r 9 ,n 。,。分别表示系统阶数。 第一种:紧格式线性化 定理l :对非线性系统( 1 2 1 ) 式,如果满足以下假设条件, 假设l :系统( 1 ,2 1 ) 式是输入输出可观测的,可控制的。即: 对某一系统一致有界的期望输出信号y ( + 1 ) ,存在一致有界的可 行控制输入信号,使得系统在此控制输入信号的驱动下其输出等 于系统的期望输出。 假设2 :( ) 关于系统当前的控制输入信号u ( k ) 的偏导数是 连续的。 假设3 :系统( 1 2 1 ) 式是广义l i p s c h i t z 的,即满足对任意的k 和a u ( k ) 0 有 i a y ( k + 1 ) l bl “( ) , 其中妙( 七+ 1 ) = y ( k + 1 ) 一y ( t ) ,a u ( k ) = u ( k ) 一u ( k 一1 ) ,b 是常数。那 么,当( 七) 0 时,一定存在一个伪偏导数( p s e u d o p a r t i a l d e r i v a t i v e ) 西( ) ,使得 a y ( 七+ 1 ) = ( 七) “( 七)( 1 2 2 ) 且悟( i ) l b ,其中b 是一个常数。 伪偏导数庐( 七) 是一个时变参数,并且它与u ( k 1 的关系可以忽 略,从理论上讲适合设计自适应控制系统;同时,该线性化方法 结构非常简单,它将一个复杂的非线性系统转化为一个带有单参 数线性时变系统,可以说它是一个目的于控制系统设计的“线性 化”方法。 第二种:偏格式线性化 紧格式线性化将一般的离散时间非线性系统转化成与输入同 维的时变动态线性系统,因此其参数时变的行为非常复杂,有时 可能变化过快,引起基于它的自适应控制系统鲁棒性不好或失稳, 因此不能适应于复杂系统的控制,或者是其输出变化量对过去某 一时刻的控制输入变化量过于敏感以至于不得不单独计算它们的 贡献。基于以上讨论,我们介绍偏格式线性化。 定理2 :对非线性系统( 1 2 1 ) 式,如果满足以下假设条件, 假设l :系统( 1 2 1 ) 式是输入输出可观测的,可控制的。 假设2 :厂( ) 对“( 七) ,u ( k 一1 ) ,u ( k 一+ 1 ) 分别存在连续的偏导 数。 假设3 :系统( 1 2 1 ) 式是广义l i p s c h i t z 的,即 i a y ( k + 1 ) i bj i u ( 七) f i , 其中u ( 七) = “( 七) ,缸( 七一l + 1 ) r ,l 为控制输入线性化长度常 数。 那么对某一给定的上,一定存在一个伪梯度向量中( ) ,当 怯u ( 的0 0 时,有 ( 七十1 ) = 中1 ( k ) a u ( k ) ( i 2 3 ) 且j p ( 0 b ,其中中( 尼) = 跏。( 七) ,丸( 尼) 。 偏格式线性化方法结构非常简单,将一个复杂的非线性系统转 化为一个带有伪梯度向量的线性时变系统,更进一步,偏格式线 性化将一个离散时间非线性系统转化为一个包含上个时变参数的 动态线性化系统,此时时变参数中( 七) 的变化比( 七) 变化缓慢一些, 从理论上讲,偏格式线性化方法更适用于某些复杂系统的自适应 设计的目的。 第三种:全格式线性化 北京交通大学硕士学位论文 从以上介绍的两种线性化方法可以看出,紧格式线性化是偏格 式线性化当工= 1 时的一种特殊情况,下面我们再介绍另外一种线 性化方法一一全格式线性化,它有松形式全格式线性化和松紧形 式全格式线性化两种形式。我们将看到全格式线性化是紧格式线 性化和偏格式线性化的推广形式。 1 松形式全格式线性化 定理3 :对非线性系统( 1 2 1 ) 式,在其阶数,l 、及_ ,l 。已知的条 件下,满足类似于以前的假设条件,则一定存在一个拟梯度向量 的向量( g r a d i e n t l i k ev e c t o r ) 庐( 七) ,使得 y ( 七+ 1 ) = 02 ( 七) ( 七) ( 1 2 4 ) 且胁( 七) 0 有界,其中 0 ( k ) ;( a y ( k ) ,a y ( k 一 ,) ,a u ( k ) ,a u ( k h 。) ) 7 松形式全格式线性化部分利用了受控系统的结构信息( 阶数n , 及n 。) a 然而在实际中的系统,系统的阶数n ,及n 。是很难知道的, 或很难辨识出来的,有时他们是时变的i 而且当系统的阶数n ,及n 。 很大时,其自适应控制的在线计算量过大丽使其自适应控制系统 不能适应于快速变化的过程。 2 松紧形式全格式线性化 定理4 :对非线性系统( 1 2 1 ) 式,在满足类似于以前的假设 条件下,给定伪阶数,及三一一定存在一个称为拟梯度向量的量 ( 七) ,使得 y ( + 1 ) = 0 。( ) ( 七) ( 1 2 j ) 且当 w ( y ( k 1 ) ,一,y ( k 一月。) ,“( 女一1 ) ,“( 七一n 。一1 ) ) = f ( y ( k 一1 ) ,4 ,y ( k 一三,) ,y ( k 一,) ,y ( k l 一1 ) ,- ,y ( k h 。) ,u ( k 1 ) , u ( k l 。) ,u ( k l 。) ,u ( k 一 。) ) 一f ( y ( k 一1 ) ,y ( k l 。) ,y ( k l 。一1 ) 一,y ( k i 1 j 一1 ) ,u ( k 一1 ) ,一,u ( k l 。一1 ) ,u ( k 一上。一2 ) ,u ( k n 。一1 ) ) 绪论 一致有界时,有修( 七) i l 有界。 其中:日( 七) = ( a y ( 七) ,一,a y ( j 】 一l ,) ,a u ( k ) ,一,“( 七一l 。) ) 7 全格式线性化更具般性和广泛性和控制系统设计的数学模 型的吝啬性。 1 2 3 2 控制算法 根据紧格式线性化,非线性系统( 1 2 1 ) 可表示成式( 1 2 2 ) 。 1 与受控系统、参数模型无关的控制律算法 控制输入准则函数 ,( “( 七) ) = 【y ( 七+ 1 ) 一y ( k + 1 ) 】2 + 【“( 尼) 一u ( k 一1 ) 】2 准则中引入项m “( 女) 一u ( k 一1 ) 2 ,使得控制输入量的变化受到 限制,且能克服稳态跟踪误差。将式( i 2 2 ) 代入准则函数中并对 u ( k ) 求导,令其等于零得控制律: “( 七) = “( 七一1 ) = j ;j ;箸 y + ( 七+ 1 ) 一y ( 七) ,p ;为步长序歹u 2 伪偏导数估计算法 采用与控制律算法对称相似的参数估计算法,伪偏导数估计 准则函数: ,( ( 七) ) = ( ,( 七) - y ( k - 1 ) 一( 七) “( 七一1 ) ) 2 + “( 庐( 七) 一;( 一1 ) ) 2f l j 将式( 1 2 2 ) 代入伪偏导数估计准则函数中并对( 七) 求导,令其等 于零得参数估计算法: 硒= 址1 ) + 器( 蛳) 一址1 ) “( ) ) 其中是权重因子,v 。是步长序列。 3 基于紧格式线性化无模型自适应控制方案 抽= 札1 ) + 器( 蛳) 一址1 灿( ) ) ( 1 2 6 a ) ( 七) = 庐( 1 ) ,若庐( 七) s 或i a u ( k - 1 ) l 兰s 北京交通大学硕士学位论文 “( ) = “( k 一1 ) = j ;等【y + ( 女+ 1 ) 一y ( ) 】 其中r 。,p + ( o ,2 ) ,五是权重因子,s 是一个充分小的正数, 西( 1 ) 是毋( k ) 的初值。 4 算法的稳定性分析结论为: 定理5 ;在定理2 中假设卜假设3 满足的条件下,由不依赖于 受控系统数学模型的学习自适应控制方案( 1 ,2 6 a ) 一( 1 2 6 c ) 所 组成的自适应控制系统有 1 ) i 灭厅+ 1 ) 一y + 叫叫血( 女_ ,m 是一个常数; 2 ) 当y ( 七十1 ) = c o n s t 时,系统在适当地选取仇,见,以后, 总存在一个小正数k 。,使得当五旯。时,系统是收敛的。 基于偏格式线性化以及全格式线性化的无模型自适应控制方 案可以由基于紧格式线性化的无模型自适应控制方案类似得到, 在这里就不一一详述了。 1 2 4 无模型自适应控制算法的适用范围 由上可以看出,无模型自适应控制方案仅仅用到受控系统的 i 0 数据,不需要指定特定的控制系统,与控制系统模型的结构、 系统参数、阶数无关,因此它适用于结构时变、阶数时变、参数 时变、时滞时变及非最小相位菲线性离散时阈系统等。 1 2 5 无模型自适应控制算法的特点 无模型自适应控制方案由参数估计算法与控制律算法构成,整 个控制方案属于算法式。 传统的自适应控制系统的控制器与估计器的设计均与受控系 统参数、数学模型的结构及阶数有关,然而实际系统的数学模型 结构及阶数又很难精确知道或很难辩识出来,即使已被理论证明 了具有稳定性、收敛性的控制系统在实际应用中也可能出现不稳 定、鲁棒性不好等问题。而无模型自适应控制方案中不包含系统 绪论 辩识环节,它仅用受控系统的i 0 数据,不需要系统大量的量化 信息,不需要指定特定的控制系统,与控制系统模型的结构、系 统阶数无关,从而消除了未建模动态,与传统的自适应控制相比 具有较强的鲁棒性。 同时,紧格式线性化无模型自适应控制方案只有一个需在线调 整的参数( 伪偏导数) ,较传统的自适应控制方案有需在线调整的 参数少、计算量小、能快速适应系统和易于实现等特点。 1 3 论文选题的理论和实际意义 从理论上讲,自适应控制对线性系统来说已经发展得比较成 熟,而且也有理论分析结果证明了系统的收敛性和稳定性。对非 线性系统来说,虽然近几年来有许多的文章讨论了某些特殊的非 线性系统的自适应控制问题,但它们均属于间接自适应控制,对 一般的离散的非线性系统基于系统输出误差直接调整其控制器参 数的直接自适应控制方案还未见到。如何摆脱受控系统对数学模 型的依赖以及如何针对一般非线性系统建立一套通用的控制理论 和技术,已成为国内外控制界关心的重大课题。本论文针对以上 问题给出两种在原来的自适应控制系统的基础上增加一个外回路 用以补偿由于参数不确定性和结构不确定性引起的控制品质下降 的问题,它们具有结构简单,能够处理结构时变、阶数时变和参 数时变等时变非线性系统的控制问题等特点。 从实际应用来看,国内侯忠生教授在其博士论文中提出了无 模型控制理论以来,基于无模型控制的理论与技术已成功研制 s i s o 系统的无模型控制器f o o l a 型和f o o l b 型,在炼油、化工、 电力、焦炭、化肥、造纸等行业中得到了成功的应用,该技术于 2 0 0 0 年2 月获得中国技术发明专利( 1 9 9 4 年9 月申请) 。美国加 州通控集团博软公司( c y b o s o f t ,g e n e r a lc y b e r n a t i o f ig r o u p i n c ) 总裁程树行博士设计出了m f a ”1 ( m o d e 卜f r e ea d a p t iv e ) , 该控制器无需数学建模以及复杂的人工参数整定即可控制时变、 北京交通人学硕士学位论文 多变量等复杂过程,该控制器在番茄热破碎、蒸发器、p h 回路控 制、多区域温度控制等工业实际过程中得到了广泛的应用,该技 术于2 0 0 0 年4 月获得了美国发明专利( 1 9 9 7 年1 0 申请) 。美国 h o p k ir t s 大学j a m e sc s p a l l 教授提出了同时扰动随机逼近神经 元网络控制技术“,在污水处理“、交通信号优化配时“”等领域 成功应用,此技术于1 9 9 7 年9 月获得了美国发明专利( 1 9 9 5 年 1 0 申请) 。 综上所述,如何摆脱对受控系统数学模型的依赖以及未建模动 态对控制系统的影响,即如何仅仅使用系统的i 0 数据设计控制 系统,实现系统的不依赖受控系统数学模型或实现非线形系统的 “黑箱”无模型自适应控制,不仅在理论上,也对控制理论在实 际中的应用具有重要的意义。 1 4 论文的主要工作 论文共分为五章。 第一章为绪论部分,主要介绍论文选题的学术背景与实际意 义,并且简要介绍了论文中需要用到的基本控制理论和方法; 第二章介绍了一种基于神经元网络的无模型控制一同时扰 动随机逼近神经元网络控制,并将它和无模型自适应控制从算法 结构、理论基础、计算复杂度、计算机仿真等方面进行比较; 第三、四章为本论文的核心部分,在该部分提出了种基于控 制系统模块化设计的新思想,给出两种带有补偿外环的自适应控 制算法一带有无模型控制外环补偿的自适应控制算法和带有未 建模动态估计外环的自适应控制算法,并给出了第一种控制算法 在一定假设条件下的相关理论分析;然后针对两种新型控制算法 在计算机上进行仿真研究,从那里我们可以很直观地看到新型控 制算法的有效性和优越性; 第五章对本论文的主要观点作了归纳和总结,并提出了需要进 一步深入研究和探讨的问题。 4 同时扰动随机逼近神经元网络控制 第2 章同时扰动随机逼近神经元网络控制 2 1 概述 多变量随机优化在很多工程系统的分析和控制中起主导地 位。在几乎所有的优化问题中,由于寻找优化问题的解析解在实 际操作中几乎是不可行的,所以我们常常使用数学迭代算法寻找 最优解。随机逼近算法( s a ) 就是在这种思想下产生和发展起来 的。 在实际工程、物理和社会科学等领域中,经常会遇到一些目 标函数的优化问题,也即:使一个可微的目标函数l ( 0 ) 最小化的 问题( 其中0 是一个p 维向量) 。解决这类优化问题最典型的做法 是寻找口+ 使嚣j 一= 0 。对于可微的目标粤数来说,经典的迭代公 式如下: 吼+ 。2 吼一口。反( 吼) ( 2 1 ) 最直接的得到磊( 或) 方法是根据系统的输出测量值和系统的 输入输出关系,通过链式法则来计算梯度。如:最速下降法、神 经元网络b p 算法。但大多数情况下,获得系统输入输出的具体关 系几乎是不可能的,而且观测到的数据通常带有噪声,这时,就 可使用随机逼近方法( s a ) 来解决问题。它仅需要通过系统的输 出测量值来对目标函数进行计算就能在一定程度上具备与基于梯 度算法相同的收敛性。 2 2 同时扰动随机逼近( s p s a ) 算法 2 2 1 几种常见的随机逼近算法 设y ( ) 表示工( ) 在某一点带有观测噪声的测量( 即y ( ) = l ( ) + 误差) ;彘( 矾) 表示反( 或) 的第i 个分量( i = 1 , 2 ,p ) ;c 。表示 随k 增大而减小的一个正整数序列。 北京交通大学硕士学位论文 1 有限差分法( f d ) : 言良) = 盥兰呜掣盟 ( 2 2 ) 其中:e ,表示第i 个分量为l 其余分量为0 的列向量: 2 随机方向法( r d ) : 菇( 反h 。盟竺鬯幽( 2 3 ) 其中:d 。= ( d 。d 2 ,d 。) 7 是指定的满足一定条件的随机向量。 3 同时扰动法( s p ) : 引驴盟避掣 ( 2a ) 其中: a t 2 ( a m 。,扣) 1 满足一定的条件的p 维随机扰 动向量。 2 2 2 基本s p s a 算法以及实施步骤 s p s a ( 同时扰动随机逼近) 算法是美国h o p k i n s 大学的s p d l l 教 授在t 9 8 7 年提出的一种随机优化算法,为证明算法的收敛性, s p a l l 教授给出了以下基本假设: q ) 和 c t ) 要以适当的速率( 不能太快也不能太慢) 收敛 到0 : l ( o ) 在目附近要足够光滑( 多次可微) : “) 序列对所有的k ,i 要独立对称分布于0 ,并存在有 限逆元e ( 1 a 。r ) 。满足条件的最简单也最常用的一个分布 是贝努利对称1 分布: s p s a 算法的基本形式如下: 反+ 。= 反一吼反( 反) 引耻 6 同时扰动随机逼近神经元网络控制 其中: 三f h = 【y + l t f “1 ) 7 a t ( y i + l k 一“) + “i 仕r b k l 让; 以“是基于两种权重向量幺= 吼一。c k a 。的神经元网络输出; t 。是目标向量序列; y 忙是基于“t “的系统输出; a 。 和 c ) 为满足一定条件的小正数序列; a 。,b 为正定矩阵,一般取a 。= i ,毋= 0 s p s a 算法的具体实施可以分为以下几个步骤: 第一步:初始化和系数选择 置计数器k = 1 ,确定初始解和非负系数口、c 、a 、1 2 和y , 在s p s a 算法中,增益序列& = 日( 4 + 女) 。,c 。= c k 。增益序列 吼) 和 o ) 的选择对s p s a 的运行起到很关键的作用。 第二步:同时扰动向量的产生 用蒙特卡罗法产生一个p 维随机扰动向量。,一个最简单的 ( 理论上可行) 分布是贝努利对称1 分布,即:a 。的每个元素都 是由1 组成且等概率出现。 第三步:损失函数的计算 根据第一步和第二步中的g 和。以及当前反下的同时扰动 获得两个损失函数的测量值y ( 反+ c 。) 和y ( 反一c 。a 。) 第四步:得到梯度逼近 由公式( 2 4 ) 产生对未知梯度g ( 文) 的同时扰动逼近。 注意:参。( 反) 的p 个分量计算是由向量反中所有分量的同时扰 动得到( 这也是s p s a 算法名称的由来) ,而在有限差分逼近算法 中,毒。( 百;) 的每个分量是由向量袅中一个分量紧接着一个的扰动 得到的( 每次只扰动一个分量) 。从而可以看出,随口的增加,f d s a 算法在每次迭代过程中计算目标函数的测量y ( ) 的次数会随之增 7 北京变通大肇项士学位论文 加,而s p s a 和s d s a 算法中,仅需要独立计算两次,所以当p 很 大时,s p s a 和s d s a 算法较f d s a 算法在计算量方面有很大的节省。 第五步:毋的递推估计 由公式( 1 ) 更新吼 第六步:迭代或终止条件 赋k = k + l ,返回第二步,当反连续数次迭代变动很小或定义 的最大迭代次数已达到时,停止。 2 2 3 同时扰动随机逼近神经元网络控制算法 同时扰动随机逼近( s p s a ) 神经元网络控制算法是鄹时扰动 随机逼近优化算法和神经元网络控制相结合的一种新型的控制算 法,神经元网络的权值由s p s a 算法来调节。下面介绍两种控制算 法的实现方式:直接逼近( d a ) 和自校正( s t ) 。 令k + i 时刻的输出向量用下式表示为:儿+ = 巾。( ( ) ,) 其中,中。( ) , ( _ ) 是动态系统的未知的非线性函数,“。是k + 1 时 刻的控制输入,是噪声。图2 - 1 为d a 算法控制结构图, 图2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论