(控制理论与控制工程专业论文)迭代学习控制算法设计与优化研究.pdf_第1页
(控制理论与控制工程专业论文)迭代学习控制算法设计与优化研究.pdf_第2页
(控制理论与控制工程专业论文)迭代学习控制算法设计与优化研究.pdf_第3页
(控制理论与控制工程专业论文)迭代学习控制算法设计与优化研究.pdf_第4页
(控制理论与控制工程专业论文)迭代学习控制算法设计与优化研究.pdf_第5页
已阅读5页,还剩90页未读 继续免费阅读

(控制理论与控制工程专业论文)迭代学习控制算法设计与优化研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

! 照查堂型生鲎些堡苎 塑型 摘要 迭代学习控制是上憾纪8 0 年代提出的- - 新兴学科,它在非线性、未知模型等系 统盼控制方面有蕾独至4 优势。农工业戡嚣人、数控枕藤等具毒蓬复运抒特性的领域鸯 猎非常好的应用前景。当然,作为- f 年轻的举科,迭代学习控制在很多方面还有待 避行一步硬究与宠善。 迭代学习算法设计一直是逡代学习控制研究的重点,本文从一些新的视角做了探 讨。蓠建,在潆入分摇动力学系统输入、输窭变量困祭关系静萋硝土,讨论了现有这 代学习算法在学习机理上存在的不足,并提出一类新的p 型因果性迭代学习算法。新 簿法不辩簧系统输出误麓静导数信息,阕时能缀好反浚系统输入输出颡采经若系。论 文还重点针对线性离散系统,给出了具体的迭代学习橼。仿真缋果也表明所撮出的迭 代学习算法相对于普通p 型迭代学习算法具有爨好的收敛特性。 其次,考虑丁薅类最优选代学习算法设计阅题:i ) 时间域内二次黧性能遗数最饯 化的迭代学习算法设计;2 ) 迭代城内确定性系统最优遮代学习律设计和不确定性系统 黪保性娆迭代学习终设计。 对于问题1 ) ,本文在模型融知与未知情况下,针对线性离散系统,得到了实现二 次型缝缝函数蚤饶纯熬遮找学习簿法与迭代域海参数德计方法,并得到了穗寝熬收敛 性条件。仿真结果表明,所得出的最优迭代学习算法方法及参数估计方法是非常有效 瀚,裁够获褥袋伉或者非常菝邋予最优的次伉控裁效暴。 对于问题2 ) ,论文酋先定义了迭代域内二次型性能函数,然后基于新的性能函数, 霞点讨论了确寇性线性离散系统最优遗代学习衿以及不确定性线性离敝系统保性能迭 代学习律的设计方法。这些方法具有一条非常好的特性:通过调整性能函数中的参数 矩阵,可以很好地控制迭代学习的速度。另外,针对不确定性系统给出的保性能迭代 学习箨突全基予l l v l i 方法遴嚣设诗,可以缀方便遗到耀i v l a t l a b 工典耱遴行求瓣。 与其优点相比,迭代学习控制的不足之处一样明盥。尤其是要求被控制对象的模 囊蘸褥、参数农每次运葶亍露都 w 聚籍嵩凌嚣重菱瞧。为增强系统瓣予饕蘩复不确定瞧豹 穗棒性,本文针对迭代学习控制应用较好的刚性不确定性机器人系统以及受限柔性连 秆橇器人膂,穆迭代学溺控稍与鲁棒装镪方法稳结合,褥到了镰棒迭代学习控铡策珞, 中商太学博士学位论文 摘簧 同时利用自适应参数估计方法对稚重复不确定性的界进行估计,有效降低了鲁棒控制 敬保守性。为了尽可自l 剥翅好能够获取瓣系统傣患,在控割策蝰中还考虑了系绞标穆 横型,可减轻系统学习负担。 在璐窍戆迭代学习接铡方法孛,控剿埝入麓篷( 第一迭代辩涎控翱麓天) 弱选取 完全是主观的,一般将其定为零娥一有界随机壁。为避免这一落目性,本文利用控制 系统对浚往诸多经务熬控裁经验建立“数据摸蝥”,然爱纂予“数摇模鼙”确定控稍输 入初值。论文详缃分析了“数据模型”的建立、相关性数据的挝取以及控制输入初值 静霸秤确定方法一线性加权、线性阐妇分析、人工神经湖络逼近以及模糊决策方法。 利用褥到的方法确定控制输入初傻,可以使得系统在首次迭代时便能以较小误麓跟踪 新的期望轨迹,从雨在栩同跟踪精度要求下减少了迭代次数。 关键词:遮代学翊控制,设计与优化,线性二次型函数,时间域,迭代域 i l 蝤塑型型坐生一 塑! ! 坠! ! a bs t r a c t a san e w s u b j e c tp r e s e n t e di n19 8 0 s ,t h ei t e r a t i v el e a r n i n gc o n t r o l ( i l c ) ,w i t hag r e a t f o r e g r o u n di nt h ec o n t r o lf o rt h ei n d u s t r yr o b o t ,n u m e r i c a lm a c h i n ea n do t h e rp l a n t sw i t h r e p e t i t i o np r o p e r t y , i sf e a s i b l ei nd e a l i n gw i t ht h en o n l i n e a rs y s t e m s ,a n du n m o d e l i n g s y s t e m sa n ds oo n 。c e r t a i n l y , a san e ws c i e n c eb r a n c h ,t h e r ea r es t i l lm a n yp r o b l e m sn e e d t ob ei m p r o v e da n df f t r t h e rs t u d i e di ni l c d e s i g n so f t h ei t e r a t i v el e a r n i n ga l g o r i t h m s ,t h em o s ti m p o r t a n tp r o b l e m si nt h ei l c ,a r e a l s os t u d i e di n t h i sd i s s e r t a t i o n a tf i r s t ,ak i n do fp - t y p e c a u s a l i t yi t e r a t i v el e a m i n g a l g o r i t h mi sp r e s e n t e da n dd e v e l o p e df o rl i n e a rd i s c r e t es y s t e m sa f t e ra n a l y s i so ft h e c a u s a l i t yb e t w e e nt h ei n p u t sa n do u t p u t so ft h ed y n a m i cs y s t e m sa n dt h ed e f i c i e n c vo f c u r r e n ti t e r a t i v el e a r n i n ga l g o r i t h mt ot h i sc a u s a l i t y t h ep r e s e n t e d a l g o r i t h m ,i nw h i c ht h e d e r i v a t i v e so f t h eo u t p u te r r o r sa r en o tn e e d e d ,c a nr e f l e c tt h ec a u s a l i t yb e t w e e ni n p u t sa n d 0 u t p u t sr i g h t l y t h es i m u l a t i o na l s od e m o n s t r a t e dt h a tt h ed e v e l o p e da l g o r i t h mh a sab e t t e r c o n v e r g e n c e t r a i tc o m p a r ew i t ht h ec u r r e n tp s t y l ei t e r a t i v el e a r n i n ga l g o r i t h m s 。 s e c o n d l y , t w ok i n d so fo p t i m a li t e m t i v el e a r n i n ga l g o r i t h m ( o i l a ) a r ei n v e s t i g a t e d :1 ) d e s i g no fo i l ab a s e do nt h el i n e a rq u a d r a t i cp e r f o f i n a n c ef u n c t i o ni nt i m ed o m a i n ,2 d e s i g no fo i l aa n dg u a r a n t e e dc o s ti t e r a t i v el e a r n i n ga l g o r i t h mb a s e do nt h el i n e a r q u a d r a t i cp e r f o r m a n c ef u n c t i o ni ni t e r a t i o nd o m a i nf o rc e r t a i na n du n c e r t a i ns y s t e m s r e s p e c t i v e l y t op r o b l e m1 ) ,t h eo i l aa n dp a r a m e t e r se s t i m a t ea l g o r i t h m sb o t hf o rt h ec e r t a i na n d u n c e r t a i nl i n e a rd i s c r e t es y s t e m sa r ed e v e l o p e d ,a n dt h e c o n d i t i o n sf o rt h ec o n v e r g e n c ea l s o g i v e ni nt h et e x t + b e s i d e s t h es i m u l a t i o nr e s u l t si n d i c a t e dt h a tt h eo i l aa n dp a r a m e t e r s e s t i m a t e a l g o r i t h m s躺v e r ye f f e c t , a n da no p t i m a lp e r f o r m a n c eo rn e a r o p t i m a l p e r f o r m a n c ea l w a y sa c h i e v e d t op r o b l e m2 ) ,al i n e a rq u a d r a t i cp e r f o r m a n c ef u n c t i o ni n 也ei t e r a t i o nd o m a i ni sd e f i n e d i nt h et e x tf i r s t l y , a n dt h e nb a s e do n 也en e wf u n c t i o na no i l af o rc e r t a i nl i n e a rd i s c r e t e s y s t e m sa n dag u a r a n t e e dc o s ti t e r a t i v el e a r n i n ga l g o r i t h mf o ru n c e r t a i nl i n e a rd i s c r e t e s y s t e m sa r ed e v e l o p e d + o n ei n t e r e s t i n gp r o p e r t yo ft h e s ea l g o r i t h m si st h a tt h ei t e r a t i v e c o n v e r g e n c es p e e dc a nb ec o n t r o l l e de a s i l yb ya d j u s t i n gt h ep a r a m e t e rm a t r i c e si nt h e p e r f o r m a n c ef u n c t i o n m e a n w h i l et h eg u a r a n t e e dc o s ti t e r a t i v el e a r n i n ga l g o r i t h mi sal m i ( 1 i n e a rm a t r i xi n e q u a l i t i e s ) b a s e do n e ,s oi tc a nb es o l v e de a s i l yb yu s i n gm a t l a bt o o l b o x c o m p a r i n gw i t hi t sa d v a n t a g e s ,t h ed e f i c i e n c i e so fi l ca r ee v i d e n tt o o ,e s p e c i a l l yt h a t t h es t r u c t u r ea n dt h ep a r a m e t e r so ft h ec o n t r o l l e dp l a n ts h o u l db er e p e t i t i v es t r i c t l yi na l l t r a i l s t ob o o s tu pi t sr o b u s t n e s st ot h eu n r e p e t i t i v eu n c e r t a i n t i e s ,s o m er o b u s t i l c s c h e m e sf o rt h eu n c e r t a i nr i g i dr o b o ta n dc o n s t r a i n e df l e x i b l el i n k sm a n i p u l a t o r sb y c o m b i n i n gt h ei l cw i t hr o b u s tc e n t r e lm e t h o d sa r ep r e s e n t e di nt h i sd i s s e r t a t i o n a tt h e i n 中南犬学博士学位论文 a b s t r a c t s a m et i m e ,s o m ea d a p t i v ee s t i m a t em e t h o d sf o rt h eb o u n d e dp a r a m e t e r so f t h eu n - r e p e t i t i v e u n c e r t a i n t i e sa r eu s e dt or e d u c et h ec o n s e r v a t i o no ft h er o b u s tc o n t r o l ,a n dt h en o r m a l m o d e lo f t h ec o n t r o l l e dp l a n t ,w h i c hu s u a l l yc 雒- - io b t a i ni np r a c t i c e ,i sa l s oc o n s i d e r e di nt h e d e v e l o p e dc o n t r o lt ol e s s e r it h el e a r n i n gb u r d e no f i l c 豫ei n i t i a lc o n t r o li n p u t s ( t h ec o n t r o li n p u t si nt h ef i r s tt r i a da l w a y sc h o o s ea sz e r o so r b o u n dr a n d o mv e c t o r ss u b j e c t i v e l yi nt h ee x i s t i n gi l c t oa v o i dt h i su n r e a s o n a b l e n e s s ,a “d m 和m o d e l ”i se s t a b l i s h e db yu s i n gt h ec o n t r o le x p e r i e n c eo b t a i n e di nt h ec o n t r o lf o r o t h e rt a s k s t h e nt h ei n i t i a lc o n t r o li n p u t sc a nb eg o t t e nb a s e do nt h ed a t a - m o d e l i nt h e t e x t 也ee s t a b l i s h m e n to ft h e “d a t a - m o d e l ”。e x t r a c t i o no ft h er e l a t i v ed a t af r o mt h i sm o d e l a n df o u rm e t h o d s ,l i n e a r i 移w e i g h t , h n e a rr e g r e s s i o na n a l y 螽s ,a r t i f i c i a ln e u r a ln e t w o r k s a p p r o a c ha n df u z z yd e c i s i o n , t og e tt h ei n i t i a lc o n t r o li n p u t sa r es t u d i e di nd e t a i l n l e s y s t e m sc a nt r a c kt h en e wd e s i r e dt r a j e c t o r yw i t hl i t t l ee r r o re v e n 敷t h ef i r s tt f i a lw h e nt h e i n i t i a lc o n t r o li n p u t sa r ec h o o s eb yt h e s em e t h o d s ,s ot h ei t e r a t i v el e a r n i n gt i m e si sr e d u c e d c o m p a r ew i 也龇i l ci nw h i c ht h ei n i t i a lc o n t r o li n p u t sa r ec h o o s es u b j e c t i v e l yu n d e r t h e s a m ep r e c i s i o nr e q u i r e m e n t k e yw o r d s :i t e m t i v el e a r n i n gc o n t r o l ,d e s i g na n do p t i m i z a t i o n ,l i n e a rq u a d r a t i c f u n c t i o n , t i m ed o m a i n , i t e r a t i o nd o m a i n 国家自然科学基金资助项目 湖南省自然科学基金资助项目 ( n o 9 8 j j y 2 0 4 4 ) 教育部高等学校骨干教师资助计划项目 ( 教技司 2 0 0 0 1 6 5 号) 原筒性声明 本人声磷,所莹交静学位论文是本人在导师指导下进行的研究工作 及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢的地方外, 论文中不毽含其缝入已经发表或撰写遵的研究成果,也不包含为获得中南 大学或其他单位的学位或证书而使用过的材料。与我共同工作的同志对本 綦暑究爨作懿嚣黻均已在在论文中俸了鞠确静说麓。 作者签名: 日期:型型年竺月圈 关于学位论文使用授权说明 本人了解中南大学有关保留、使用学位论文的规定,即:学校有权 保蜜学位论文,允许学位论文被查阅弱缮阅;学校可以公布学位论文鳆全 部或部分内容,可以采用复印、缩印或其它手段保存学位论文;学校可根 据国家绒湖南省商关郝f 娥定送交学位论文。 作者签名:生垂l 遣冱导师签名越日期:型让月卫目 中南大学博士学位论文 绪论 第一章绪论 辘逑鼹踩是控割孛常冕夔一类综合瓣蘧。麴巢系统模垄糟确己翔,逆露力学、最 优控制等基于模型的方法能够很好地实现系统输出y ( f ) 对期望轨迹儿( ,) 的精确跟踪。 然 嚣,嶷际应矮串系统采建模动力学及模鍪不确定经营遍存在,尽管p i d 控制,特剐 疑近年发展起来的各类镄棒控制方法在一定程度上均能获得比较好的跟踪控制效果, 德缀难满是高精度舔踪控制的簧求。另外,这炎时阀域内的控制方法通常会有一个或 长或短的镇定过程( 渐邋跟踪过程) ,也就是说教控制的初始阶段肇有较大的跟踪误差。 猩类似予机器人焊接等需要机器人末端严格按照预先确定的轨迹运行的控制任务中, 这类方法难以缮剥 # 霉满意鲍跟踪控制效果。 而畿工业生产中,搬运及装配工业机器人、数控机床、磁盘光盘驱动系统、机械 系统中戆坐标溺耋瓿等骞器买骞鬟爱运露豹特经。毽裁怒谨这类系统慧怒重复执季亍柽嗣 的任务,在同一条轨迹上反复趱行。那么,利用以前的输出误麓对本次运行及以后运 抒豹控潮输入蠢进行修涎,随整“运行、修正、再运行、再修涎”过程的反复进 行,最终完全裔望获得高精度、高性能的控制效果。基于这一出发点,日本学者 u c h i y a m a ( 1 9 7 8 ) 阳和a r i m o t o ( 1 9 8 4 ) 馨l 褥出了迭代学习控南s j ( i t e r a t i v el e a r n i n gc o n t r o l ,i l c ) 的思想与方法,并很快学l 起了国际同行的广泛关注。 经过二十多年的快速发展,迭代学习控制融成为智能控制的重要组成部分。并且 | ;! 琏予迭代学习控铡是嚣翦已有餐戆控制方法孛凑萋严密数学攒述的一大分支,在弹经 网络、模糊技术等相继陷入发展瓶颈的今天,逡代学习控制方法及其_ 敝用研究仍然显 示出强犬瓣生愈力彝广瓣靛撵势空润。 1 。1 迭代学习控剃基本原理 从上面的论述中我们看到,迭代学习控制其实与人类的学习过程脊黄惊人的相似。 一个入射某种技能的掌强通常簧经过无数次的练习,不断从失败中吸取教训,最终才 自毫获得成功。就像体操运动员,哪憾是一令非嚣豌单能动作也要重复羲于避才髓达到 比较完美的境界。为了更严密、更准确地领会遮代学习控制的旗本原蠼与思想,下面 偌助数学语言进褥拯述。 不必一般性,假定被控对象动力学模型为; 中南大学博士学位论文 绪论 黧( 0 = f i r ,t , x q “) 、l , u q m ) 、( 1 - 1 ) y 0 ) = g 驻,x ( f ) ,n 9 ) 】 其中,x 母r “、y e r ”、u r “分别表示系统状态向量、输出向量及控制输入量; f ( ) 、g ( ) 为襁瘦维数豹氯纛丞数,英结搦与参数筠未鲡。 对于该系统,我们的控制任务是:在时间【0 ,t 】范围内,要求系统输出y ( f ) 跟踪期 囊输壅y a ( ) 。程讨论之前先佟魏下缀定: 存在唯一的控制输入u 。( f ) ,使得在给定的初始状态x ( o ) 下,y ( d = y 。( ,) : 每一次对期望轨迹y 。跟踪对,f ( ) 、g ( ) 所表示的函数关系不变,即系统( 1 1 ) 具有可重复性; 每一次跟踪时,系统的初始状态x ( o ) 固定,即系统初态媳有可黧复性。 根擐如上假定,第k 次对期黧敬迹跟踪嚣,系统接受霹表示为; 轧y k 髦g :黧:u 揣 m z , ( 玲= 融x 。( f ) ,女( 镄 、7 定义输出误差: o 女( f ) = y k ( f ) - y d ( o ( 1 3 ) 如巢缝够埝娄铡鼹e 女( f ) 及控铡羧入爨( 玢囊或下一次跟踪瓣毂控臻藏入 i l k + t ( r ) = p 1 1 1 k ( ,) ,e t ( r ) ,明 ( 1 4 ) 使得当k 叶时,u 女( ,) 呻( f ) 、y ( f ) 叶y d 。即在f 【0 ,t 】范围内: ;i m u 女( f ) = u d ( f ) i i m y ( 0 = y d ( f ) 鼗时,褒( 1 珥) 懿作矮下,暹过慰y 。( f ) 黪茨复g 鑫黥,裁搿激这裁亵疆度控鞠效暴。 以上便是迭代学习控制的基本思想,( 1 4 ) 称为迭代学习律,整个过程还可以形象 逡磊蚕1 - 1 来表示。 根据如上分析,容易得到迭代学习控制步骤如下: ( 1 ) 给定期鼙辘迹y d ( 0 ,选取第一次运行辩的控翻输入u 1 ( ) ,f 【。,t j : ( 2 ) 对被控对象施加控制输入u ,( 1 ) ,采样势存储输嫩y ,( f ) ,运行完成时计冀输出 误差e i ( ,) = y i ( t ) - y d ( f ) ; ( 3 ) 利用迭代学习镶( 1 4 ) 诗舞第二次逶缛对的竣入豢u :g ) ; ( 4 ) 篷复与步骤( 2 ) 、步骤( 3 ) 相同的过程,依次得到u ,( r ) 、u ( f ) 、u ,( ,) 和相应的 中南大学博士学位论文 绪论 e 3 ( f ) 、e 。( 吼e ,( f ) 宜到输出谖差收敛至所期凝的范围之内 ( 5 ) 结束。 i ; 强卜 ;迷戎学习控稍过程源理黉 容易理解,如何有效设计学习律( 即给t b ( 1 4 ) 中龋数妒( ) 的具体形式与参数) 并 达到预期的控制目的是迭代学习控制的核心问题。 在( 1 - 4 ) 中,我们是测用第k 次迭代嚣重黪输爨误差及控制输入囊产生第k + t 次迭代 的控制输入,称之为开环迭代学习控制。如果利用第k 次迭代时控制输入及第k + 1 次 迭钱时熬输出谈差采获取薨k + 1 次迭饯瓣熬控铡输入,攫擒藏了阙蓼影式豹迭代学习 控制。相应的学习律( 1 - 4 ) 变为: u “= 妒辩l ) ,e ,f 】 ( 1 - 6 ) 另处,( 1 - 4 ) 及( 1 - 6 ) 均为一盼形式的迭代学习律。装充分利用激前羲于次这代魄辕 入量及输出误差来产生滥前迭代的控制输入,就构成了高阶迭代学习樟,其一般形式 霹写走: i t l ( t ) = c p u l ( f ) ,u2 ( 糖一,u 女( f ) ,e i ( f ) e 2 ( f ) ,e ( ,) ,t 】( 1 - 7 ) 1 2 迭代学习控制与其他按制方法的比较 迭代学习控制是- - l - j 年轻的学科,为进一疹加深对其思想的理解,我们将其与经 典控制、现钱按翻蹑及其它智控制方法进行院较,良展示其内在戆零震将蕊。 中南大学 撙士学位论文 绪论 1 2 1 与逆动力举控制的比较 迭代学习控制的思想很简单,就是通过不断地对控制输入进行修诋,最终实现对 麓鋈辕逡煞理想g 受踪。嚣然,黧菜系绞挨整霹瑷获褥,鄂么蠢接释躅系统煞遂模鏊静 可获得实现对期凝轨迹跟踪所需的控制输入。举一简单例子,如果y ( r ) * f c u ( t ) 】已知, 郡么敬u ( t ) = f 。【船) 】( 假设,( - ) 可遂) 便可实现对麓麓轨迹的理想躐踪。这就是我 们所熟知的机器人控制领域中经常采用的逆动力学控制策略。因此,遮代学习控制可 戳看作是对系统逆动力学的学习进程,它也属予一种前馈式控制策略:而逆动力学控 制就是“一步”实现的迭代学习控制。 1 2 2 与反馈控制的比较 “反馈”是控制理论中最基本的概念,传统的反馈控制( 如p i d 控制) 对系统模 蘩瞧其誊定赘簧襻瞧。透过辩系统赣掇或状态信号静茨馈与铡嗣,程一定条佟下, 反馈控制通常能在时间轴上实现对期望轨迹的渐近跟踪( 如图1 2 所示) 。但反馈控制 不能实现对麓望鞔迹鑫勺完全跟黥,特剐怒在控翻的裙始阶段输嬲误差鞍大:丽迭代学 习控制通过对同一任务的反复运行,最终能实现完全跟踪( 如图i - 3 所添) 。 输出 潜藏 豳1 - 2 :渐近跟踪过程 输出 酵瓣 圈1 _ 3 :迭代举习控制过程 另外,尽管反馈控制能一次实现对期望轨j 褒的渐:i 垃跟踪,假没有“记忆”功能, 巍系统下一次对嚣一辕浚逡霉亍舔踩辩,嗣样无法淆豫控翻初麓靛大误蓑。 利用反馈控制的渐避跟踪特性,在迭代学习控制中引入当前输出误差,形成开闭 环迭代学习控制策略,邋常能获得沈开环迭代学习控制疆快韵收敛速度。 法:图1 - 2 、t - 3 仪为示意图,丽; 某个系绞实际响应过程。 1 2 3 与自适应控制的比较 窿 中南大学博士学位论文 绪论 12 1 与逆动力学控制的比较 迭代学习控制的思想很简单,就是通过不断地对控制输入进行修正,最终实现对 期望轨迹的理想跟踪。显然,如果系统模型可以获得,那么直接利用系统的逆模型即 可获得实现对期望轨迹跟踪所需的控制输入。举一简单例子如果j ,( r ) = 1 ”( ,) 】己知, v z , i l r u ( t ) = f 。【儿( r ) ( 假设厂( 可逆) 便可实现对期望轨迹的理想跟踪。这就是我 们所熟知的机器人控制领域中经常采用的逆动力学控制策略。因此,迭代学习控制可 以看作是对系统逆动力学的学习过程,它也属于一种前馈式控制策略:而逆动力学控 制就是“一步”实现的迭代学习控制。 1 ,22 与反馈控制的比较 “反馈”是控制理论中最基本的概念,传统的反馈控制( 如p i d 控制) 对系统模 型也具有一定的鲁棒性。通过对系统输出或状态信号的反馈与利用,在一定条件下, 反馈控制通常能在时间轴上实现对期望轨迹的渐近跟踪( 如图1 - 2 所示) 。但反馈控制 不能实现对期望轨迹的完全跟踪,特别是在控制的初始阶段输出误差较大:而迭代学 习控制通过对同一任务的反复运行,最终能实现完全跟踪( 如图1 - 3 所示) 。 输出 时【百 图卜2 :渐近跟踪过程 辅出 时间 图1 - 3 :选代学习控制过程 另外,尽管反馈控制能一次实现对期望轨迹的渐近跟踪,但没有“记忆”功能, 当系统下一次对同一轨迹进行跟踪时,同样无法消除控制初期的大误差。 利用反馈控制的渐近跟踪特性,在迭代学习控制中引入当前输出误差,形成丌闭 环迭代学习控制策略,通常能获得比开环迭代学习控制更快的收敛速度 注:图1 - 2 、1 - 3 仅为示意图,而非某个系统实际响应过程。 1 2 3 与自适应控制的比较 1 2 3 与自适应控制的比较 中南大学博士学位论文 绪论 迭代学习控制的最大优点径子系统模型可以完全束知,通过反复的迭代最终实现 对期望孰迹的精确跟踪。对于模型未知窳统,姆系统熬识与具体豹控制方法程绥合, 就形成了通常所说的自通应控制。这两种控制方法均魑在控制过程中不断对系统进行 学习与辨谖,不同熬是爨逶应按铡是奁瓣阗域内遴嚣,焉迭l 弋攀习控铡裂是奁迭 弋域 内完成其学习过程。 与爱馕控铡一样,蠡逶建羧秘逶鬻憩一次蜜凌对簸疆鞔逑瓣渗透鼗踩,毽对于浚 遮时变系统,辨识过程跟不上系统的变化,此时自适应方法无法很好地对系统进行控 甓霭t 两翔聚抉遮辩交系统同样鼗有重复瞧,氇藏意昧蓉在迭代辘上其有不变髓,诧时 迭代学习控制仍能对系统进行学习,并在若干次运行之后实现完全跟踪。 献上面的分析中可以看出,迭代学习控翻的最大特点就是在迭代域实现对系统的 学习与控制。蔼在迭代鞍上,系统是璃数的、饕时变的,因薅霹以大麟剥用离教时不 变系统的相关理论来研究迭代学习控制,在这方面还有很多工作可做。 + 2 。4 与其它餐巯控黼方法蠢奄 较 终必餐戆控翻静缝残部分( 不遘,丈多鼗程荚智黥控翻稳专著爻涉及“毒拳经网络 控制”、“模糊控制”和“专家系统”三大部分) ,迭代学习控制有着严格的数学撼述, 艇系统农迭筏城内有着与离鼗时闯系统相类钕的一些毪厦。茵丽稻对箕它智能控制方 法来说,更容易刹用系统科学中的理论与方法对其稳定性、收敛性进行分析。 与神经网络控制方法相比,迭代学习控制怒对控制输入量在时间辅上的学习与记 忆,即对u ( o 的学习与记忆;蔼糖经鄹终方法则是对u ( x ) ( x 为系统状拳等) 黪学习与 记忆。选代学习控制没商较好的“联想”与“推广”能力,一艇跟踪轨迹发生改变必 须重耨学习,不过学习繁法篾攀、爨纛傣惠量少、g 曩踩糖度毫憝箕最大戆佬患。 与迭代学习控制一样,模糊控制适用于难以精确建模的复杂对象( 同样适用于非 绫牲窝辩交系绞) ,不j 壹模辍控翻仍然莛一耪基予模鍪( 籁识攘疆一入豹控翱经验) 静 控制方式,它以模糊集会、模糊语言变缀以及模糊逻辑推理作为控制算法的数学工具。 模糊控翻实质上还是一种反馈羧镑l ,与一簸静撩涮系绫一样,需要能够提供实时数据 的在线检测装置,且一般认为模糊控制难以实现商精度控制要求。 专家系统也是基予知识( 专家经验) 的控制方式,与模糊控制一样,难以从理论 上对其憾能进行分板,按制精度也很难保证。 中南大学博士学位论文 绪论 1 3 迭代学习控制主鼷研究内容 从1 1 盼分析中不难看到,迭代学习算法设计是迭代学习控制研究的蓖点。简单说 袋,就是在傈汪系统稳定蠖与浚散蛙蓠掇下,确定迭 弋学 - j 律( | 霉) 、( | | 5 ) 及( 1 。7 ) e 函 数妒( ) 的熙体形式和参数。除此之外,邀代学习控制的初值问题、鲁棒性、学习速度、 逸代学习控稍豹分辑方法戳及选健学习靛懿应嗣雅广穗都是这一领域豹研究热赢。当 然该学科中各研究方向通常是相凰融合、相互贯穿的有机体,丽非楣冀独立的一条条 分支。毽为了表述方硬,我稍还怒飘如下几个方面迸行探讨。 。3 。 迭援学习冀法设计 迭代学习算法设计怒迭代学习控制中最活跃、威果最先丰富戆磅完领域。1 9 8 4 年, 遮代学习控制创始者a r i m o t o 等人【2 1 首先构造了d 型学习算法: u 女+ l 瑟) = u 女器专f 8 )( 1 8 ) 并给出了系统稳寇性及学 - j 收敛憔条件。d 型迭代学 - j 律需要误麓的导数0 ( f ) ,在实际 森箱中鼹魏壹按溺量。魄螽迭代举鹭控锻应霭最多静梳器入系统通常袋安装有篾节位 鼹传感器,而速腱与加逮度信号襦要通道对位鹫信号的数字微分来获取。由于测量噪 声的存在,经过数字徽分以后,速度与期速度信号会带肖严重的误差,从而降低控制 孝毒度。随艏a r i m o t o 以及其他学袭相继研究了p 溅、p d 裂、p i 擞及p i d 型学习律( 可 统称为p i d 型学习律) 。这类算法的一般形式可碍为: 疆女“( 0 = 珏女( 辞+ t e 女 - - y a t ) ,t g 【0 ,露) 为基浆。农保证系统稳定性、收敛性豹裁摄下提出寒款。 利用迭代学习方法实现j c 寸某种性能指标( 比如= 次型性能指标) 的优化应该是比较有意 愿蕊课题。最饯按铡是瑗健控制爨论中熬薹要一支,瞧豢佬控裁器( 0 p r i m a lc o n t r o l l e r ) 的设计必须基于系统精确模型的建立( 对于带有模型不确定项的系统,保成本控制是 较好静方法) ,鼙翦氇灵怒在线戆系统范翡内取褥磐的鳐莱。穆稳健学骂控剩攥广戮对 于线性= 次型性能函数: j * n e t ( o q e ( o + “7 ( f ) r “( r ) 衍 ( 连续系统) ( 1 1 l a ) j = 肇7 ( o q e ( o + u 7 ( f ) r “( i ) ( 离散系统) ( 1 - l l b ) t 0 域其他形式的性能函数的优化上,或者说基于二次型性能函数( 1 - 1 1 ) 或其它形式的性能 掇拣绘爨一耪最饯迭戎学习控制( o p t i m a lt t e r a t i v el e a r n i n gc o n t r o l ,o i l c ) ,无论姨理 论上或者实际应用上都熙十分有价值、有意义的探讨。然而,基于二次型性能指标( 1 - 11 ) 静磷究,嚣蔫穗芙鞭道遥缓少 4 6 - 4 9 1 。 研究发现,要实现对二次型性能指标( 1 1 1 ) 的优化,学习律中必须包含系统模型 p h a n 和j u a n g 4 6 l 在假定系统禳黧已知静情况下符翻了激优迭代学习控制方法,其实这 融失去了迭代学习控制的优越性tm 。n o r r l o f 等人【4 7 4 8 1 利用可获得的模裂标称假特代真 实模型给出了一炎二次激最优遮代学习控制方法,很显然,结果只能烧次优的引入 纂函数概念,运躅辨识方法,f r u e h 襄p h a a 【4 9 1 钤对线性离散系绫,绘出了基予二次4 睦 能指标的最优迭代学习搬制方法。这一方法要求事先假定一组测试输入量作为激励函 中南大学博士学位论文 绪论 数,然盾不断产斑新的岛原基妫数正交的新基函数以及搪函数的系数,最后以菇函数 豹张集纷为系统按制输入蠹。对予 线黢系统,基懿还没有经舞硬宠缝聚毫蕊。 另外,还有烘文献【3 9 , 5 0 - 5 2 研究了基于性能指标: n 。 j 。= 芝:0 l ( i ) q e 。( f ) 十【“。+ 】( f ) 一“。( f ) 7 r 甜。+ ,( f ) 一“。( f ) 】 ( 1 1 2 ) f _ 0 豹最优迭代学习控制,对这一性能指标的优化,系统模型精度不会对学习结果产生大 的影响,因丽有了比较好驰结果。然蔼慰这一性能的优化,其壤论与实践意义均不及 对二次型性能指标( 1 1 1 ) 的优化。t o g a i 镣人嘲在性能指标 j = 圭9 1 0 + l 弦( 1 )( 1 1 3 ) 最小化的意义下,分别利用n e w t o n r a p h s o n 法、g a u e s s n e w t o n 法及最速下降法得到 了开环p 垄速最举习整髓方法。 总的来说,旗于性能的迭代学习控制,目前研究结果还很少。这方面的工作,特 辩是萋予二次墅经链指栎( 1 t 1 ) ,如褥给潞最饶或者次饶瀚迭代学习控粼方法,是有待 深入和急待解决的研究课题。另外,定义新的凝育特定物理意义的性能函数,然后基 予新函数给出新的最优逡代学习律也是使得探索的谍题。 1 。3 ,5 攀习逮蹙豹饶纯 学爵速度每蹑踪精魔赡旋藏一塞是学久遥求戆萎撂,这也楚冬类遮代学嚣舞法穗 继被提出的根本嗣的之。尽管这方面的研究文献很多,但很滩从理论上比较备类学 习箕法瓣优劣,灵栽逶过实验或谤真来验涯,箕结采氇不其备一般性。 一般情况下,在相同的迭代学习律作用下,学习步长越大,迭代学习控制的收敛 速度越浚。毽诧辩收敛稔条俘较严格,控制系统对参数变化敏感,容翁造成不收敛、 不稳定的现象。弓l 入自校正思想、参数优化技术对学习步长进行整定与优化是比较有 懑义的研究。 这方面研究戆一大荧键闻题是缺少统一的髑来筏鬟学习遮发静撑橼,因蔼辱致各 种算法缎难直接进行比较。所以定义合理的学习指标,进而对种类算法进行比较研究 楚枣待深入静方囱之一。 1 3 6 学习经验的利用 一! 塑查兰避圭堂垡笪塞缝堡 林辉等人从男一角度考虑迭代学 - 3 的优化问题,在文献 5 2 】的展望部分提到;“现 蠢瓣迭代学习控键昃戆矮毒:莱耱特定垂冬辘迹缳踩阉瑟,学习戆结果燕诡忆控粼遥程 “( ,) ,一恩要改变输出轨迹就必须重新学习遮方面的研究工作目前还是空囱,但 却是非常舆有挑战性的研究课题”。也就怒说,当系统面临新的控制任务时,如槊能充 分利用系统控制经验,恰港选取控制输入的初值,使褥攫学习伊媲系统便能以较小误 整( 甚至期望的精度) 跟踪期望轨迹,提高系统对新环境、新任务的适应能力,毫无 疑阏这是卡分寄爨义戆王终。这一阀题戆瓣决意昧藿系绕在爨一次迭我瓣裁戆璇鞍索 误蒺( 或期望的误差范围乏内) 实现对新轨迹的跟踪,从而缩短系统学习时间。 这一阀惩与遮健学习接翱番襻瞧蠡霉嚣串靛“期鏊鞔逑,j 、扰韵”阕瑟肖一定静莛性。 不过解决的办法不同,“期望轨迹小扰动”问题一般是通过增强迭代学习算法的镣棒性 来髂决;黼经验静铡用考虑的是辫罄轨迹大的变动,可能熙有依纛文献【5 2 】所说的,“将 目前对“( f ) 的记忆与修正敬成对u ( x ) 的记忆与修溉”( x s r “1 表添系统状态等) 。 1 3 + 7 迭代学习控制的应用研究 尽管遮代学习控制对系统的逶行特性有着严格的要求,过去的二十年里,遮代学 习控镶方法的应粥研究还是获褥了缀大谶展。迭代学习控制最翘是应用于刚校机器入 臂,最近一些学糟将其应用于分椎参数系统 5 3 - 5 4 、柔性系统【5 5 5 5 】的控制之中;媳有人 将其应用于化工行业阱】i 近来,滋有不少学者将之应用于时滞系统的预测与控制1 5 8 - 6 0 。 随麓迭弋学习控制理论爨巍的不叛完善( 魄妻珏学嚣速度的提裹、簧捧性的增强以及增 强对控制缀验的台理利用椁) ,遮代学习控制方法也必将得到越来越广泛的应用。 1 4 本文主要王作 本文侧重予遮健学习控铡算法设诗专优往稀究。圭黉工作体现在; 1 ) 动力学系统因果性分析及相应的迭代学习算法设计。深入分析动力学系统输入、 输出因采关系,在诧基础上讨论蒋通p 罄迭代学习算法在学习梳理上存在的不足,并 掇如一类新的p 型因果性迭代学习算法。针对线性离散系统,绘出具体的迭代学习律, 并对系统稳定性、迭代收敛性作深入研究。 2 ) 凝优选役学习算法设计。这里妻蘩讨论秀类聂俊迭健学哥算法设计阉瑟:1 ) 时间域内= 次型性能函数最优化的迭代学习算法设计;2 ) 在迭代城内定义二次型性能 1 2 一_ ! 堕奎兰塑主堂焦熊苎熊堡 函数,农迭代轴上考虑确定性系统性能缀优迭代学习律设计和不确定性系统的保性能 遮代学习律的设计问题。 3 ) 迭代学习控制方法鲁棒性的增强。考虑系统中非蘑复性不确定项的存在,与鲁 搭控铡等方法樱缝会,褥耍| 具鸯较努簧棒夔鸵懿遮弋学霹茬翻簿法。麓瓣考虑葶| 天謇 遮应参数估计方法对非熬复不确定性的界进行估计,以减小鲁棒控制的保守性。在研 究孛圭簧铮对琴确定缝撬器入、受袋柔槛辊器入臂进行讨论,分掰褥到系统稳定褴帮 学习收敛性条件。 4 ) 逡代学菇控稍输入初篷选取的优纯。考虑乖j 用系统对诸多任务的成功控制经验 建立系统“数据模型”,研究当系统面l 嘲所的控豢4 任务时,如何根据“数据模型”来确

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论