(控制理论与控制工程专业论文)基于神经网络的非线性系统自适应优化控制研究.pdf_第1页
(控制理论与控制工程专业论文)基于神经网络的非线性系统自适应优化控制研究.pdf_第2页
(控制理论与控制工程专业论文)基于神经网络的非线性系统自适应优化控制研究.pdf_第3页
(控制理论与控制工程专业论文)基于神经网络的非线性系统自适应优化控制研究.pdf_第4页
(控制理论与控制工程专业论文)基于神经网络的非线性系统自适应优化控制研究.pdf_第5页
已阅读5页,还剩156页未读 继续免费阅读

(控制理论与控制工程专业论文)基于神经网络的非线性系统自适应优化控制研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,j f 、 ii , ad i s s e r t a t i o ni nc o n t r o lt h e o r ya n dc o n t r o le n g i n e e r i n g r e s e a r c ho n a d a p t i v ea n do p t i m a lc o n t r o l f o rn o n l i n e a rs y s t e m sb a s e do nn e u r a l n e t w o r k s b yl u oy a n h o n g s u p e r v i s o r :p r o f e s s o rz h a n gh u a g u a n g n o r t h e a s t e r nu n i v e r s i t y d e c e m b e r2 0 0 8 独创性声明 本人声明,所呈交的学位论文是在导师的指导下完成的。论文中 取得的研究成果除加以标注和致谢的地方外,不包含其他人己经发表 或撰写过的研究成果,也不包括本人为获得其他学位而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确 的说明并表示谢意。 学位论文作者签名:哆耗往 日期:伽、f 2 、 学位论文版权使用授权书 本学位论文作者和指导教师完全了解东北大学有关保留、使用学 位论文的规定:即学校有权保留并向国家有关部门或机构送交论文的 复印件和磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学 位论文的全部或部分内容编入有关数据库进行检索、交流。 作者和导师同意网上交流的时间为作者获得学位后: 半年口一年口一年半口两年d 学位论文作者签名:、罗寿白江 签字日期:够、1 1 、砷 导师签名 签字日期:铲、,、罗 1 1 东北大学博士学位论文摘要 基于神经网络的非线性系统自适应优化控制研究 摘要 非线性系统的最优控制问题一直是控制领域的难点问题,现存的最优控制方法 包括变分法、最大值原理和动态规划法都各自有其局限性,很难求得解析的最优 控制解因此,自适应动态规划作为一种近似求解最优控制问题的新算法,由于其 能够克服动态规划法的“维数灾,并且能够获得近似最优的闭环反馈控制律,受到 了不少研究者的关注然而,现有的大多数自适应动态规划方面的成果都集中于无 约束非线性系统的镇定控制,对于带约束的非线性系统的最优镇定问题和最优跟踪 控制问题仍未解决,同时自适应动态规划算法在稳定性和收敛性分析等方面也亟 待完善因此本文基于神经网络,利用自适应动态规划算法深入地研究了带约束的 非线性系统的最优镇定控制以及自适应最优跟踪控制,并给出了严格的收敛性分 析,为复杂非线性系统的分析与控制提供了新的思路与新的结果其主要工作如下: 1 针对一类执行器带未知死区的仿射非线性系统,提出了一种新型的神经网 络自适应控制器的设计方法,该方法首先引入一个神经网络来估计对象的部分未 知非线性动态行为,再基于隐函数定理构造另一个静态神经网络作为新型补偿器 以补偿执行器的未知不对称的死区非线性利用l y a p u n o v 理论在给出光滑的控制 律的同时严格证明了整个闭环系统的跟踪误差以及各个神经网络权参数的一致最 终有界性,而且通过调节设计参数可以使系统的跟踪误差收敛到零附近的一个小 邻域内 2 研究了一类约束离散非线性系统基于r b f 神经网络的近似最优控制问题 首先提出一种新型的非二次泛函用来处理非线性离散时间系统的控制约束,并导 出对应的离散哈密屯页_ 雅可比一贝尔曼( h j b ) 方程然后证明迭代的代价函数序列收 敛到最优的代价函数,即由所有容许控制律序列得到的代价函数里的最小值,同时 证明了这个最优的代价函数满足h j b 方程同时,通过引入协状态函数实现迭代自 适应动态规划算法,从而消除了求解最优控制律过程中的导数项和积分项的计算 另外利用r b f 神经网络来近似协状态函数和对应的最优控制律特别是使用了模 型网络来近似非线性系统的动态使得迭代自适应动态规划算法能够适用于数学模 型未知的对象 3 研究了一类离散非仿射系统基于g i - g d h p 算法的近似最优跟踪控制问题 首先,针对一类离散非仿射系统提出了一个无限时间最优跟踪控制方案,这个最优 控制由两个控制项组成:一个是前馈控制项,一个是反馈控制项其次,通过增维技 术把带有时变参数的误差系统的最优控制问题转化成为一个增广系统的镇定问题, 最后提出了一种新型的g i - g d h p 迭代算法来求解模型未知的非仿射非线性系统的 i i i 东北大学博士学位论文摘要 最优控制问题 4 针对带控制约束的非线性广义系统,提出了两种求取近似最优控制解的控 制方案第一种方案把广义系统变换成为普通的状态空间形式描述的系统,然后引 入g i - d h p 算法来求解变换后的系统的近似最优控制第二种方案直接进行广义系 统的协状态函数迭代和最优控制律迭代,寻求被控系统的近似最优控制律,并提供 了迭代过程的收敛性分析 5 针对一类控制受约束非线性系统,提出了一种单网络g i - d h p 算法的近似最 优控制方案首先针对被控系统的控制约束,通过引入非二次泛函把约束问题转换 成为无约束问题,从而解决了求得的控制策略不光滑的问题其次,针对h j b 方程 难于求解的问题,提出了贪婪迭代d h p 算法以求解近似最优的协状态函数和控制 策略,并给出了算法的收敛性分析另外,提出了一个自适应动态规划算法的新型 实现方案,消除了常规自适应动态规划方案中的控制网络,只引入一个神经网络来 近似协状态函数,而后最优控制策略可以根据协状态函数直接计算得到这样极大 地简化了算法的实现过程,并有效地减少了计算量 最后,指出了自适应动态规划研究中一些存在的问题和发展方向,并对接下来 的研究工作进行了展望 关键词:非线性系统,自适应动态规划,贪婪迭代,约束,非二次泛函,神经网 络,收敛性 一 jj1 jl 东北大学博士学位论文 英丈摘要 r e s e a r c ho na d a p t i v ea n do p t i m a lc o n t r o lf o r n o n l i n e a rs y s t e m sb a s e do nn e u r a ln e t w o r k s a b s t r a c t t h eo p t i m a lc o n t r o lp r o b l e mo fn o n l i n e a rs y s t e m sh a sa l w a y sb e e nt h ec h a l l e n g i n gp r o b l e mi nt h ec o n t r o lf i e l d t h ee x i s t e do p t i m a lc o n t r o lm e t h o d s ,i n c l u d i n g v a r i a t i o n a lc a l c u l u s ,m a x i m u mp r i n c i p l ea n dd y n a m i cp r o g r a m m i n g ,a l lh a v et h e i r r e s p e c t i v el i m i t a t i o n sa n dt h ea n a l y t i c a lo p t i m a ls o l u t i o ni sh a r dt og a i n t h e r e f o r e , a d a p t i v ed y n a m i cp r o g r a m m i n g ,a san e wa l g o r i t h mt oa p p r o x i m a t e l ys o l v et h eo p - t i m a lc o n t r o lp r o b l e m ,h a sg a i n e dm u c ha t t e n t i o nf r o mal o to fr e s e a r c h e r s t h e a d a p t i v ed y n a m i cp r o g r a m m i n ga l g o r i t h mc a no v e r c o m et h e c u r s eo fd i m e n s i o n a l - i t y ,a n dm e a n w h i l eo b t a i nt h ea p p r o x i m a t eo p t i m a lc l o s e d - l o o pf e e d b a c kc o n t r o l l a w h o w e v e r ,t h em o s te x i s t e dr e s u l t so na d a p t i v ed y n a m i cp r o g r a m m i n gf o c u so n t h es t a b i l i z a t i o nc o n t r o lo fu n c o n s t r a i n e dn o n l i n e a rs y s t e m s t h eo p t i m a ls t a b i h z a - t i o na n do p t i m a lt r a c k i n gp r o b l e m sf o rt h ec o n s t r a i n e dn o n l i n e a rs y s t e m sa r es t i l l u n s o l v e d a l s o ,t h ei m p r o v e m e n ta n dp e r f e c t i o no ft h ea d a p t i v ed y n a m i cp r o g r a m - m i n ga l g o r i t h m ,s u c ha st h es t a b i l i t ya n a l y s i s ,t h ec o n v e r g e n c ea n a l y s i s ,h a v eb e e n ah o tt o p i c t h e r e f o r e ,i nt h i sd i s s e r t a t i o n ,t h ea d a p t i v ed y n a m i cp r o g r a m m i n g a l g o r i t h mi sp r o p o s e db a s e do nn e u r a ln e t w o r k st os o l v et h eo p t i m a ls t a b i l i z a t i o n c o n t r o la n da d a p t i v eo p t i m a lt r a c k i n gc o n t r o lp r o b l e m so fc o n s t r a i n e dn o n l i n e a r s y s - t e r n sw i t hr i g o r o u sc o n v e r g e n c ea n a l y s i s ,w h i c hp r o v i d e sn e wi d e a sa n dn e wr e s u l t s f o rt h ea n a l y s i sa n dc o n t r o lo fc o m p l e xn o n l i n e a rs y s t e m s t h em a i nc o n t e n t so ft h e d i s s e r t a t i o nc a nb eb r i e f l yd e s c r i b e da sf o l l o w s : 1 p r o p o s ean o v e ln e u r a ln e t w o r kc o n t r o l l e rd e s i g ns c h e m ef o rac l a s so fa 伍l n e n o n l i n e a rs y s t e mw i t hu n k n o w na c t u a t o rd e a d - z o n e f i r s tan e u r a ln e t w o r ki si n t r o - d u c e dt oe s t i m a t et h ep a r t i a lu n k n o w nn o n l i n e a rd y n a m i c ,a n dt h e na n o t h e rs t a t i c n e t w o r ki sc o n s t r u c t e da san o v e lc o m p e n s a t o rt oo v e r c o m et h eu n k n o w nn o n s y m - m e t r i cd e a d - z o n eb e h a v i o ro ft h ea c t u a t o rb a s e do nt h ei m p l i c i tf u n c t i o nt h e o r e m l y a p u n o vt h e o r yi su s e dt op r e s e n tt h es m o o t hc o n t r o ll a wa n dp r o v et h eu n i f o r m u l t i m a t eb o u n d e d n e s so ft h ec l o s e - l o o pt r a c k i n ge r r o ra n dt h en e t w o r k sw e i g h t s f u r t h e r m o r e ,t h et r a c k i n ge r r o ri sa b l et oc o n v e r g et oas m a l ln e i g h b o r h o o da r o u n d z e r ob ya d j u s t i n gt h ed e s i g np a r a m e t e r s 2 b a s e do nt h er b fn e u r a ln e t w o r k s ,s o l v et h ea p p r o x i m a t eo p t i m a lc o n t r o l p r o b l e mo fac l a s so fc o n s t r a i n e dd i s c r e t e - t i m en o n l i n e a rs y s t e m s f i r s tp r o p o s e an o v e ln o n q u a d r a t i cf u n c t i o n a lt od e a lw i t ht h ec o n t r o lc o n s t r a i n t so fn o n l i n e a r v 0r, d i s c r e t e - t i m es y s t e m sa n dd e r i v et h ec o r r e s p o n d i n gd i s c r e t e - t i m eh j be q u a t i o n t h e np r o v et h a tt h ei t e r a t i v ec o s tf u n c t i o ns e q u e n c ec o n v e r g e st ot h eo p t i m a lc o s t f u n c t i o n ,i e ,t h ei n f i m u mo fa l lt h ec o s tf u n c t i o n so b t a i n e db ya 1 1a d m i s s i b l ec o n t r o l l a w s e q u e n c e s ,a n ds h o wt h a tt h i so p t i m a lc o s tf u n c t i o ns a t i s f i e st h eh j be q u a t i o n f u r t h e r m o r e i m p l e m e n tt h ei t e r a t i v ea d a p t i v ed y n a m i cp r o g r a m m i n ga l g o r i t h mb y i n t r o d u c i n gt h ec o s t a t ef u n c t i o n w h i c hg e t sr i do ft h ec o m p u t a t i o n so fad e r i v a t i v e t e r ma n dai n t e g r a lt e r ma p p e a r i n gi ns o l v i n gt h eo p t i m a lc o n t r o ll a w m e a n w h i l e , t h er b fn e u r a ln e t w o r k su t i l i z e dt oa p p r o x i m a t et h ec o s t a t ef u n c t i o na n dt h ec 0 卜 r e s p o n d i n go p t i m a lc o n t r o ll a w s p e c i f i c a l l y , u s eam o d e ln e t w o r kt oa p p r o x i m a t e t h en o n l i n e a rs y s t e md y n a m i c s ,w h i c hr e n d e r st h ei t e r a t i v ea d a p t i v ed y n a m i cp r o - g r a m m i n ga l g o r i t h ms u i t a b l et op l a n t sw h o s em a t h e m a t i c a lm o d e l sa r eu n k n o w n 3 b a s e do nt h eg i - g d h pa l g o r i t h m ,t h ea p p r o x i m a t eo p t i m a l t r a c k i n gc o n t r o l p r o b l e mi ss t u d i e df o rac l a s so fd i s c r e t e - t i m en o n - a f f i n en o n l i n e a rs y s t e m s f i r s t , p r o p o s ea ni n f i n i t e - t i m eo p t i m a lt r a c k i n gc o n t r 0 1s c h e m ew h i c hi sc o m p o s e do fa f e e d f o r w a r dc o n t r o lt e r ma n daf e e d b a c kc o n t r o lt e r mf o rac l a s so fd i s c r e t e - t i m e n o n - a f f i n es y s t e m s t h e ns o l v et h eo p t i m a lc o n t r o lp r o b l e mo ft h ee r r o rs y s t e mw i t h t i m e - v a r y i n gp a r a m e t e r sb yc o n v e r t i n gt h ee r r o rs y s t e mi n t oaa u g m e n t e ds y s t e m w i t ht h ed i m e n s i o na u g m e n t a t i o nt e c h n i q u e f u r t h e r m o r e d e v e l o pan e w i t e r a t i o n a l g o r i t h mn a m e dg i - g d h pa l g o r i t h mf o rd i s c r e t e - t i m en o n - a f f i n en o n l i n e a rs y s t e m s 耐t hu n k n o w nm a t h e m a t i cm o d e l s 4 p r o p o s et w oa p p r o x i m a t eo p t i m a lc o n t r o ls c h e m e sf o rac l a s s o fn o n l i n e a r d e s c r i p t o rs y s t e m sw i t hc o n t r o lc o n s t r a i n t t h ef i r s ts c h e m et r a n s f o r m st h ed e s c r i p - t o rs y s t e mi n t oac o l n m o ns t a t es p a c ef o r m a n dt h e ni n t r o d u c et h eg r e e d yi t e r a t i v e d h p ( g i - d h p ) a l g o r i t h mt os o l v et h ea p p r o x i m a t eo p t i m a lc o n t r o lp r o b l e m t h e s e c o n ds c h e m ed i r e c t l yi m p l e m e n t st h ec o s t a t ef u n c t i o ni t e r a t i o na n dt h eo p t i m a l c o n t r o ll a wi t e r a t i o nt oc o m p u t et h ea p p r o x i m a t eo p t i m a lc o n t r o ll a wf o rt h eo r i g - i n a ld e s c r i p t o rs y s t e m ,a n dp r o v i d e s t h ec o r r e s p o n d i n gc o n v e r g e n c ea n a l y s i so ft h e i t e r a t i o np r o c e s s 5 t h en e a r - o p t i m a lc o n t r o lp r o b l e mf o rn o n l i n e a rc o n s t r a i n e dd i s c r e t e - t i m e s y s t e m si ss o l v e db ys i n g l en e t w o r kg r e e d yi t e r a t i v ed h p ( g i d h p ) a l g o r i t h m f i r s t , an o n q u a d r a t i cf u n c t i o n a li sd e v e l o p e dt oc h a n g et h ec o n s t r a i n e dp r o b l e m i n t oaa n - c o n s t r a i n e dp r o b l e ms ot h a tt h ed e r i v e dc o n t r o lp o l i c yi ss m o o t h t h e ni no r d e rt o o v e r c o m et h ed i f f i c u l t yo fs o l v i n gt h eh j b e q u a t i o na n a l y t i c a l l y , t h eg i - d h pa l g o - r i t l u ni sp r o p o s e dt os o l v et h eo p t i m a lc o s t a t ef u n c t i o na n do p t i m a lc o n t r o lp o l i c y 诵t ha s s o c i a t e dc o n v e r g e n c ea n a l y s i s m o r e o v e r an e w i m p l e m e n t a t i o ns c h e m ef o r t h ei t e r a t i v ea l g o r i t h mi sp r e s e n t e d ,w h e r et h ea c t i o nn e t w o r kw h i c hi sn e e d e di n t h eu s u a la d a p t i v ed y n a m i cp r o g r a m m i n g ( a d p ) s c h e m ei sr e m o v e d i nt h en e w s c h e m e o n l yan e t w o r ki s u s e dt oa p p r o x i m a t et h ec o s t a t ef u n c t i o n ,a n dt h e nt h e o p t i m a lc o n t r o lp o l i c yc a l lb ed i r e c t l yc o m p u t e db a s e do nt h ec o s t a t ef u n c t i o n i n t h i sw a y , t h ei m p l e m e n t a t i o np r o c e s so ft h ei t e r a t i v ea l g o r i t h m i sg r e a t l ys i m p l i f i e d , a n dt h ec o m p u t i n gb u r d e nc a nb ee f f e c t i v e l yd e c r e a s e d f i n a l l y ,c o n c l u d i n gr e m a r k sa r eg i v e n s o m eu n s o l v e dp r o b l e m sa n dd e v e l o p - m e n td i r e c t i o nf o ra d a p t i v ed y n a m i cp r o g r a m m i n gm e t h o da r ep r o p o s e d f u r t h e r , t h ep r o s p e c t so ft h ef u t u r es t u d ya r eg i v e n k e yw o r d s :n o n l i n e a rs y s t e m s ,a d a p t i v ed y n a m i cp r o g r a m m i n g ,g r e e d y i t e r - a t i v e ,c o n s t r a i n t ,n o n q u a d r a t i cf u n c t i o n a l ,n e u r a ln e t w o r k ,c o n v e r g e n c e 一v i i ( 东北大学博士学位论丈 英文摘要 东北大学博士学位论文 目录 目录 独创声明i 中文摘要i i i a b s t r a c t v 第一章绪论1 1 1引言1 1 2 非线性系统最优控制理论概述1 1 2 1 最优控制问题描述2 1 2 2 最优控制方法分类3 1 3非线性系统自适应控制理论概述 6 1 3 1 自适应控制理论的发展历程6 1 3 2 基于神经网络的非线性系统自适应控制概述 7 1 4 基于神经网络的自适应动态规划算法概述8 1 4 1 自适应动态规划算法的发展历程8 1 4 2 基于神经网络的自适应动态规划算法基本理论9 1 4 3 基于神经网络的自适应动态规划算法的研究现状1 2 1 5 本文的主要工作1 3 第二章执行器带未知死区的一类非线性系统的神经网络自适应控制1 5 2 1 引言1 5 2 2问题描述和预备知识1 6 2 3 自适应控制器设计1 8 2 3 1 自适应控制器的形式。1 8 2 3 2 对象的部分非线性动态行为的估计1 9 2 3 3 针对执行器死区的补偿器设计1 9 2 3 4 权值调节律与稳定性分析2 l 2 4仿真分析2 5 2 5小节3 1 第三章带有饱和执行器的一类非线性系统的近似最优控制3 3 3 1 引言3 3 3 2约束非线性系统的离散h j b 方程3 4 i x 东北大学博士学位论文目录 3 3基于迭代自适应动态规划算法的近似最优控制3 6 3 3 1 迭代自适应动态规划算法的推导3 6 3 3 2 迭代自适应动态规划算法的收敛性分析3 7 3 3 3 迭代自适应动态规划算法的实现4 2 3 4仿真研究4 8 3 5小结5 9 第四章一类离散非仿射系统基于g i - g d h p 算法的近似最优跟踪控制6 1 4 1引言6 1 4 2问题描述6 2 4 3最优跟踪控制器的设计6 4 4 3 1 基于隐函数定理的前馈控制器设计6 4 4 3 2 最优反馈控制器设计6 5 4 4最优跟踪控制器的实现7 2 4 4 1 前馈控制器的实现7 3 4 4 2 最优反馈控制器的神经网络实现7 4 4 4 3 最优跟踪控制器的设计过程7 6 4 4 4 神经网络近似过程的收敛性分析7 7 4 5仿真研究7 9 4 6 小结一8 7 第五章带有控制约束的一类非线性广义系统的近似最优控制8 9 5 1引言8 9 5 2最优控制器的间接设计8 9 5 2 1 问题陈述8 9 5 2 2 贪婪迭代d h p 算法的推导和实现9 2 5 2 3 仿真研究9 5 5 3最优控制器的直接设计9 7 5 3 1 问题陈述和约束广义系统的离散h j b 方程的推导:9 7 5 3 2 贪婪迭代d h p 算法的推导和实现9 9 5 3 3 仿真研究1 0 6 5 4小结1 0 8 一x 一 东北大学博士学位论文 目录 第六章基于单网络g i d h p 算法的一类非线性系统近似最优控制1 1 1 6 1 6 2 6 3 引言1 1 1 ,i 口 问题陈述1 1 2 贪婪迭代的d h p 算法的推导和实现j 1 1 3 6 3 1 贪婪迭代的d h p 算法的推导1 1 3 6 3 2 贪婪迭代d h p 算法的收敛性分析1 1 6 6 3 3 单网络贪婪迭代d h p 算法的神经网络实现1 1 9 6 4仿真例子1 2 1 6 5小结1 2 5 第七章问题与展望1 2 7 参考文献:1 2 9 攻读博士学位期间的研究成果1 4 1 致谢1 4 3 个人简历1 4 5 一x i 东北大学博士学位论丈 目 录 一x i i j 1 东北大学博士学位论丈第一幸绪论 1 1 引言 第一章绪论 众所周知,针对线性定常系统的最优控制的理论和方法已经非常成熟u “而 针对非线性系统而言,虽然人们也对其最优控制问题进行了相应的研究,但由于其 高度的复杂性,一般很难得到其解析的最优控制解然而,非线性是自然界和工程 技术领域中最普遍的现象,许多实际工程系统都具有本质上的非线性,必须用非线 性系统描述才合理因此研究非线性系统的近似最优控制问题,无论在理论上还是 在实践上,都具有重大的意义 另一方面,由于神经网络具有强大的非线性逼近能力和学习能力,为复杂非线 性系统的控制开辟了一条崭新的途径神经网络自适应控制就是基于自适应的基 本原理,结合神经网络的特点和理论产生的新方法,它简化了单纯自适应控制系统 设计的复杂性,发挥了自适应与神经网络各自的长处,因而在智能控制研究领域中 受到了广泛的关注,并取得了大量的研究成果p 卅尽管如此,神经网络自适应控制 在理论与实践上,仍然存在一些问题,如神经网络的稳定性和收敛性问题,神经网 络控制的实时性问题,当执行器带有饱和或死区等非线性特性时如何设计光滑稳 定的自适应控制器等问题这些问题还有待于进一步研究与探讨 本章首先介绍了非线性系统最优控制的基本理论,其次介绍了非线性系统自适 应控制的发展历程,接着重点介绍了基于神经网络的自适应动态规划算法的基本 理论和研究现状,最后简述了作者在本领域所开展的主要研究工作 1 2 非线性系统最优控制理论概述 最优控制理论是现代控制理论的重要组成部分,其形成与发展奠定了整个现 代控制理论的基础早在上世纪5 0 年代初,布绍( b u s h a w ) 就研究了伺服系统的时 间最优控制问题,他用几何方法证明了继电式的控制可以用最短的时间将伺服系 统的误差调节到零之后,拉塞尔( l a s a l l e ) 发展了时间最优控制的理论,即所谓 的b a n g - b a n g 控制理论5 0 年代空间技术开始获得迅猛的发展导弹、卫星等都是 复杂的多输入一多输出非线性系统,而且在性能上有严格的要求这种工程上的要 求刺激了最优控制理论的发展人们发现,最优控制问题就其本质来说,是一个变 分学的问题然而,经典变分学只能解决控制作用不受限制的情况实际上常常碰 到控制作用受到限制的情况,这就要求人们开辟求解最优控制的新途径1 9 5 3 年 至1 9 5 7 年间,美国学者贝尔曼( b e l l m a n ) 仓l j 立了“动态规划”理论p ,发展了变分学中 的哈密顿雅可比( h 锄i l t o n j a u c o b i ) 理论1 9 5 6 年至1 9 5 8 年间前苏联学者庞特里亚 1 东北大学博士学位论文第一章绪论 金( p o n t r y 晒n ) 等创立了“极大值原理m 1 ”这两种方法成为了目前最优控制理论的 两个柱石时至今日,最优控制理论的研究无论在深度上和广度上都有了很大的发 展,例如发展了对分布参数系统、随机系统、广义系统的最优控制理论的研究等 等毫不夸张的说,最优控制理论仍是一个活跃的科学研究领域,它在国民经济和 国防事业中将继续发挥重要的作用 1 2 1 最优控制问题描述 在生产过程、军事行动、经济活动以及人类的其他有目的的活动中,常常需要 对被控系统或被控过程施加某种控制作用以使某个性能指标达到最优,这种控制 作用称为最优控制 最优控制理论研究的主要问题是:根据已建立的被控对象的时域数学模型或 频域数学模型,选择一个容许的控制律,使得被控对象按预定要求运行,并使给定 的某一性能指标达到最优值具体的说,最优控制问题应该由下面四个方面组成一: ( 1 ) 系统数学模型在集中参数情况下,被控系统的数学模型通常以定义在时间 间隔【t o ,圳上的状态方程来表示 圣( t ) = ,【z ( 亡) ,u ) ,亡】,t t o ,t ,】( 1 1 ) 其中,z r n 为系统状态向量,乱r m 为系统控制向量在确定的初始状态z ( t o ) = x o 情况下,若己知控制律u ( 亡) ,则状态方程( 1 1 ) 有唯一解z ( t ) ( 2 ) 边界条件与目标集 动态系统的运动过程,归根结底是系统从其状态空间的一个状态到另一个状态 的转移,其运动轨迹在状态空间中形成一条轨线z ( t ) 为了确定要求的轨线z ( 亡) , 需要确定轨线的两点边界值因此,要求确定初始状态和末端状态,这是求解状态 方程( 1 1 ) 所必需的边界条件 在最优控制问题中,初始时刻t o 及初始状态z ( t o ) 通常是己知的,但末端时刻 亡,和末端状态z ( t ,) 则视具体问题而异例如末端时刻t ,可以是固定的,也可以是自 由的,末端状态z ( t ,) 可以是固定的,也可以是自由的,或者是部分固定、部分自由 的一般可用如下目标集加以概括: 妒陋( t ,) ,亡,】= 0 ( 1 2 ) 其中,妒r r ,r n ,z ( 亡,) 妒( ) 若末端状态z ( t ,) = z ,为一固定向量,则目标集妒( ) 仅有一列元素;若z ( t ,) 应 满足某些约束条件,则目标集矽( ) 为n 维空间中的r 维超曲面;若z ( t 1 ) 自由,则目标 集妒( ) 扩展到整个佗维空间 ( 3 ) 容许控制 控制向量牡的各个分量u i 往往是具有不同物理属性的控制量在实际控制问题 一2 一 东北大学博士学位论文第一章绪论 中,大多数控制量受客观条件的限制只能取值于一定范围因此,在实际中一般存 在两类控制:一类是变化范围受限制的控制,这一类控制属于某一闭集;另一类是 变化范围不受限制的控制,这一类控制属于某一开集 在属于闭集的控制中,控制向量u ( 亡) 的取值范围称为控制域,以q 表示 q 是m 维控制空间r m 中的一个闭点集由于让( 亡) 可在q 的边界上取值,故凡属于 集合q 且分段连续的控制向量让( 亡) ,称为容许控制,以u ( 亡) q 表示 ( 4 ) 性能指标 在状态空间中,从给定的初态z ( 亡o ) 到要求的末态( 或目标集) 的转移可以通过不 同的控制函数u ( 亡) 来实现,为了在各种可行的控制函数中找出一种效果最好的控制, 这就需要首先建立一种评价控制效果好坏或控制品质优劣的性能指标函数 一般情况下,性能指标函数可以表示为: p | j = 砂陋0 ,) ,o ,】+ l p ( 亡) ,仳( t ) ,习班( 1 3 ) j t o 上述性能指标包括两个部分,即积分指标席l 陋( 亡) ,u ( 亡) ,t d t 和终端指标p ( t ,) t s , 这种综合牲能指标所对应的最优控制问题称为波尔扎( b o l z a ) 问题当只有终端指 标时,称为迈耶尔( m a y e r ) i 涵- 题;当只有积分指标时,称为拉格朗日( l a g r a n g e ) 问题 性能指标的确定因问题的性质而异在导弹截击目标的问题中,要求弹着点的散 步度最小,这时可用终端指标来表示在快速控制问题中,要求系统从一个状态 过渡到另一个状态的时间最短,i l p 廖d t m i n ,这就是积分指标性能指标,是控 制作用u ( t ) 的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论