(模式识别与智能系统专业论文)非标准条件下的迭代学习控制设计.pdf_第1页
(模式识别与智能系统专业论文)非标准条件下的迭代学习控制设计.pdf_第2页
(模式识别与智能系统专业论文)非标准条件下的迭代学习控制设计.pdf_第3页
(模式识别与智能系统专业论文)非标准条件下的迭代学习控制设计.pdf_第4页
(模式识别与智能系统专业论文)非标准条件下的迭代学习控制设计.pdf_第5页
已阅读5页,还剩74页未读 继续免费阅读

(模式识别与智能系统专业论文)非标准条件下的迭代学习控制设计.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浙江大学硕士学位论文 摘要 迭代学习控制作为现代控制理论的重要分支之一,其高精度的轨迹跟踪能力 一直为人所称道。但实际控制系统中普遍存在的各种非标准条件,如含结构不确 定性、输入输出扰动、初态偏移和轨迹变化等,往往使得标准条件下收敛的学习 律无法满足原有条件,甚至于发散。这同时也影响到迭代学习控制的大规模工业 应用。因此,研究在非标准条件下依然收敛的迭代学习律,并保证鲁棒跟踪性能, 就显得十分重要了。 本文着重研究在各种非标准条件下迭代学习控制的设计问题。针对含未知有 界扰动的系统,采用前馈一反馈分部设计法,将迭代学习控制的设计问题转化为 标准日一问题后求解;针对系统存在结构不确定性问题,将前馈一反馈作一体化 设计,并将该问题转化为鲁棒优化问题后求解;针对输入输出扰动、初态偏移等 非标准问题,设计抗干扰的改进型算法;针对轨迹变化等非标准问题,采用轨迹 学习的策略以获得最优输入初值的估计,从而加快收敛速度、改进瞬态响应性能 等;最后以工业机械臂为仿真对象来验证算法的有效性。主要成果有: ( 1 ) 考虑一类受未知有界干扰影响的线性系统,通过鲁棒迭代学习控制分部 设计法来改善其跟踪性能;首先将该设计结构下的迭代学习律收敛条件转化为模 型匹配问题,然后利用标准日一方法求解;最后对线性化后的工业机械臂作仿真, 验证了算法的有效性; ( 2 ) 考虑系统存在结构不确定性问题,运用鲁棒迭代学习控制的综合设计 法,将反馈控制器与前馈控制器作关联设计,并将其转化为二自由度的标准设计 问题;而后分析该设计下的学习律收敛条件,并利用结构奇异值及t 综合等鲁棒 控制相关理论求解;再考虑系统存在输入输出扰动和初态偏移等非标准条件问 题,对原有算法作必要改进,并分析其收敛条件;最后利用针对直流电机伺服系 统所作的仿真验证了算法的有效性; ( 3 ) 考虑系统期望轨迹变化的问题,增加对“历史轨迹”的学习能力,从而 达到改善系统跟踪性能的目的;具体采用了局部权重思想来逼近系统逆,从而求 得最优输入初值的估计;最后通过对直流电机伺服系统的所作的仿真验证了算法 的有效性。 关键词:迭代学习控制,结构不确定性,鲁棒性能,非标准条件,一,刚性机 械臂,轨迹学习,局部权重学习 浙江大学硕士学位论文 a b s t r a c t i t e r a t i v el e a r n i n gc o n t r o l ( i l c ) h a sb e e nw i d e l yr e c o g n i z e db yi t su n i q u e c a p a b i l i t yi ni m p r o v i n gt h er o b u s tp e r f o r m a n c e so fac o n t r o ls y s t e m ,w h i c hu s u a l l y b a s e do nt h en o t i o no fr e p e t i t i o na n dl e a r n i n g b u tg o o dt r a c k i n gp e r f o r m a n c e e m p l o y i n gc o n v e n t i o n a li l cs t r a t e g yh a sl a r g e l yr e l i e do nt h ea s s u m p t i o n sa n di n i t i a l c o n d i t i o n s ,s u c ha sn os t r u c t u r eu n c e r t a i n t i e sa n dd i s t u r b a n c e s ,s a n l eo rs i m i l a r d e s i r e dt r a j e c t o r i e sa n ds oo n , w h i c hl a r g e l yl i m i t e di t si n d u s t r yi m p l e m e n t a t i o n s s o h o wt oa p p l yt h ei l cs t r a t e g yu n d e rn o n s t a n d a r dc o n d i t i o n sc o n c e l t i st h ep r e s e n ta n d f u t u r eo f i l c i nt h i sd i s s e r t a t i o nar o b u s ti t e r a t i v el e a r n i n gc o n t r o ls t r a t e g yi sp r o p o s e df o r a g a i n s tt h ed i s t u r b a n c e s ,p e r t u r b a t i o n , n o i s e sa n ds oo n f o rt h ei s s u eo f u n k n o w nb u t l i m i t e dd i s t u r b a n c e s o n es e p a r a t e dd e s i g ns c h e m ei s p r e s e n t e df o rt h e o p e n - a n d - c l o s e l o o ps t r u c t u r e t h e ni ti sr e s o l v e da sas t a n d a r d 口p r o b l e m f o r s t r u c t u r e du n c e r t a i n t i e sa n dd i s t u r b a n c e sr e l a t e di s s u e s ,as y n t h e s i sm e t h o di su t i l i z e d t oc h o o s es y s t e m a t i c a l l yt h ep a r a m e t e r so fl e a r n i n ga n df e e d b a c kc o n t r o l l e r sw h i l e a c h i e v i n gt h eo p t i m i z a t i o nb e t w e e nr o b u s t n e s sa n dt r a c k i n gp e r f o r m a n c e i nt h e p r e s e n c eo fc h a n g e a b l et r a c k i n gt r a j e c t o r i e s ,al o c a l l yw e i g h t e dm e t h o di se m p l o y e d f o rr e s t r u c t u r i n gp l a n ti n v e r s i o nw h i c h h e l p st oe s t i m a t et h eo p t i m i z e di n i t i a li n p u t n ”m a i na c h i e v e m e n t sa r el i s t e da sf o l l o w e d 皿ef i r s tp a r tm a i n l yc o n c e r n e dw i t hr o b u s tp e r f o r m a n c ei s s u e sw h i l eal i n e a r s y s t e mi sp e r t u r b e db yu n k n o w nd i s t u r b a n c e s b ya d d i n gt h ei l co p e n l o o pa l o n gt o t h eo r i g i n r ac o n t r o ls y s t e m ,i tc a ni m p r o v et h et r a c k i n ga c c u r a c yw h i l en o td e s t r o y i n g o r i g i n a ls y s t e mr o b u s t n e s s t h ed e s i g ni st h e nr e s o l v e d 船ac o m p a r a b l em o l d - m a t c h p r o b l e ma n das t a n d a r d 丑m e t h o di se m p l o y e df o rp a r a m e t e r sd e s i g n n l e e f f e c t i v e n e s so f t h em e t h o di sd e m o n s t r a t e d b yt h es i m u l a t i o no f r i g i dm a n i p u l a t o r s i n t h e f o l l o w i n gp a r tat w o - d e g r e e - o f - f r e e d o ma r c h i t e c t u r e i se m p l o y e df o r d e a l i n gw i t ht h ei s s u e so fu n s t r u c t u r e du n c e r t a i n t i e s d i s t u r b a n c e sa n ds oo n t l l i s s y n t h e s i sm e t h o d c a l l s y s t e m a t i c a l l yd e s i g n t h ew h o l e o p e n - a n d - c l o s e l o o p s i m u l t a n e o u s l yw h i c hi nr e t u l ma c h i e v et h eo p t i m i z a t i o nb e t w e e nt h er o b u s ts t a b i l i t i e s a n dp e r f o r m a n c e s t h em e t h o do fs t r u c t u r e ds i n g u l a rv a l u ea n d 2 s y n t h e s i si s e m p l o y e df o rd e r i v i n gt h ef i n a lp a r a m e t e r s as i m u l a t i o no ns e r v om o t o rc o n t r o l s y s t e mi sc o n d u c t e dl a s tf u rd e m o n s t r a t i o n t h el a s tp a r tf o c u s e do nt h ei s s u e so fc h a n g e a b l et r a c k i n gt r a j e c t o r i e s t h e i m p o r t a n c eo f t h es e l e c t i o no f i n i t i a lc o n t r o li n p u ti na t o rc o n v e r g e n c ei sh i g h l i g h t e d t h el o c a l l yw e i g h t e dt h e o r yi si n t r o d u c e df o rr e s t r u c t u r i n gt h el i n e a r i z e dp l a n t i n v e r s i o nw h i l ee s t i m a t i n gt h eo p t i m i z e di n i t i a li n p u t n l i sm e t h o di ss 0g e n e r a lt h a ti t c a nb ea p p l i e dt om o s to fi l ca l g o r i t h m s i n c l u d i n gn o n l i n e a ro n e s t h ec o m p u t e r i i i a b s c a c t s i m u l a t i o ni sa l s oc o n d u c t e do nt h es e r v om o t o rc o n t r o ls y s t e mf o rd i s c u s s i o n k e y w o r d s :i t e r a t i v el e a r n i n gc o n t r o l ,s t r u c t u r e du n c e r t a i n t i e s ,r o b u s ts t a b i l i t y r o b u s tp e r f o r m a n c e ,n o n s t a n d a r dc o n d i t i o n s ,r i g i d m a n i p u l a t o r s , t r a j e c t o r yl e a r n i n g ,l o c a l l yw e i g h t e dl e a r n i n g 浙江大学硕士学位论文 致谢 值此论文完成之际,我衷心地感谢我的导师刘山副研究员两年来对我孜孜不 倦的教育和指导。在科研上,刘老师在给予我悉心指导的同时,还提供了一个宽 松和谐的研究环境,引导我在科研工作中一步步前进。在生活工作上,又常常给 予关心,为我今后的职业生涯出谋划策。刘老师本人扎实的专业基础,广阔的研 究视野,深厚的理论修养,敏锐的学术感觉,先进的教育理念以及严谨的治学态 度和豁达的人生态度,将是我一生学习的榜样。 吴铁军教授、杜树新副研究员、李艳君副研究员、戴连奎教授都在生活和工 作上给予我热情的帮助和指导,在此表示诚挚的感谢。 感谢杨伟临、徐忠勇、杨曦、武晓莉、蔡晓慧、李宗涛、马俊、郑俊华、刘 同、李双彬、冯建华、赵亮、秦靖、齐楠、包鑫、白小琴、王晔、黄建生等兄弟 姐妹对我的帮助和支持,与他们在学习和生活上的交流给我留下了美好的回忆。 再次感谢我的室友徐忠勇、马俊、刘同,永远不能忘记与他们共度的两年美 好时光。 感谢所有关心帮助过我的老师、同学和朋友们。 最后特别感谢我的父母、家人对我的关心、支持和理解,我会在今后的工作 与学习中更加努力的奋斗来回报今天你们的付出! v 林坚 2 0 0 7 年5 月于求是园 浙江大学硕士学位论文 第一章绪论 摘要:本章首先概述了迭代学习控制理论的历史、研究内容、研究方法等;而后介绍了因非 标准条件所引发的各种系统鲁棒稳定性和跟踪性能问题,并对该领域研究现状作了总结;据 此g 出本文的主要研究内容和创新点;最后对全文的结构作了简要的说明。 关键词:迭代学习控制,非标准条件,鲁棒问题 1 1 引言 学习是什么? 作为人类获取知识的最主要形式和提高智能水平的基本途径, 学习是一个既通俗又广泛、既丰富又模糊的术语。如维纳将其定义为“系统自我 完善的过程”;西蒙认为它是“系统积累经验、改善性能的过程”等。当今人们 普遍认为学习是符合自然进化规律的变化。 一般学习控制的机理可概括为:利用控制系统某输入与输出间的简单动态关 系,将前一步控制过程的学习结果更迭至当前控制过程,并用于改善某个性能指 标;最终通过学习过程的反复执行,稳步地改善被控系统的性能。 学习控制的研究方向主要有三类,如以人工智能为基础,采用模式识别的方 法,着重于参数学习的模式识别学习;来源于人工智能,同时又基于人工智能神 经网络机制的联结主义学习;研究控制对象在一定周期内的重复性运动,并与经 典控制理论紧密联系,同时又能利用自身优势导出利于工程实现的迭代学习等。 本文的研究课题就是迭代学习控制( i t e r a f i v el e a m i n gc o n 枉 o l ,简称i l c ) 。 当控制对象为焊接、喷涂、装配、搬运等工业机械臂这类具有重复运动特性的控 制系统时,迭代学习控制运用从历史经验中学习知识的策略,将过去迭代过程中 的相关输入、轨迹跟踪误差实时地结合到当前的控制中来,从而在减少对过程模 型本身的先验知识依赖的同时,又为改进跟踪性能提供了可能性。相比于传统控 制策略,它能更好地应对那些要求在有限时间区域内实现完全跟踪的重复性任 务。特别是当控制对象为不确定模型或难以建模系统,同时又具有较强非线性耦 合时,迭代学习控制因其较少依赖模型先验知识的特质,将发挥更为重要的作用。 1 2 迭代学习控制理论简介 1 2 1 研究内容 正如孙明轩 1 9 9 9 d 0 所总结的那样,传统的工业控制中,先建数学模型后设 第一章绪论 计控制器的基于模型的系统综合方法得到了广泛的运用。显然,该类控制器的参 数设计依赖于所建模型的结构。然而,由于工业对象的复杂性及易变性,机理建 模或实验建模法往往带有较大的模型误差。无模型的设计方法由于只利用了系统 的输入输出信息来设计控制器,因此控制器结构能不依赖于受控对象动力学特 性。迭代学习控制最初也正是在该思想的引导下渐渐步入历史的轨迹。 图1 1 是最基本的迭代学习控制结构。 控制系统的运行如下:假设某控制任务在【o ,刀的有限时间域内周期性运行, 下标k 代表第k 次运行过程,u 。、l ,。分别为系统输入和输出。在第k 次运行完 成后,学习控制器非在线地利用当前的存储信息计算第k + 1 次的迭代输入u 。 随着系统输入不断地被调整,系统输出最终能跟踪上期望轨迹。 u h 图1 1 迭代学习控制基本结构 不失一般性,用非线性算子,表示u r 之间的空间映射,即y = f ( u ) ,其 中u 与y 分别是空闻u 与】,中的元素。假设s 为一给定系统,定义夕= z ) ,t ) 代表输入输出方程。则上述控制任务可定义为:寻找适当输入,使该控制系统s 的输出渐进跟踪上期望轨迹匕。设u ( f ) 为最优输入,则其应满足以下算式: 咖f ) 一f a 材( 删忙恢( ) 一f a ) i | ( 1 1 ) 则迭代学习控制的任务为: 利用某迭代学习律产生一系列的控制输入。( f ) ) u k + i ( ,) = 五沁( f ,y a t ) ,y d ( t 5 ,t ) r 1 口、 = 兀( ( f ,z ( ( f ,y a ( t ) ,f ) t * e 【o ,t 】 令下式成立 l 脚 ) = ”( r ) , o ,】 (13)uat t et 根据以上的定义,即可引申出迭代学习控制的基本研究内容。 2 浙江大学硕士学位论文 ( 1 ) 轨迹跟踪是迭代学习控制的主要研究问题。该问题所涉及的误差大小的 衡量一般由误差范数表示。 ( 2 ) 迭代学习控制的一大特点在于除时域外,还需考虑迭代域中的问题。一 般迭代域k 离散,时间域t 可离散,可连续。 ( 3 ) 迭代学习控制使得非因果控制成为可能。由于系统存储了第k 次迭代中 的所有信息,假定& 刮o ,t 】,且 - j 控制器五时,虽然无需精确的原系统数学模型,但对诸如, 的上下界等基本信息仍有一定的要求。但总体来说,迭代学习控制是非模型控制。 ( 6 ) 若原系统z 可逆,则最优输a u ( f ) = f - 1 ( 儿( f ) ) 可直接获得,无需迭代; 但实际系统往往不可逆且精确的无模型根本无法获得,因此迭代学习逐次逼近最 优控制输入的方法才有了用武之处。 ( 7 ) 误差的终值本应与期望轨迹乃( 玲无关,但实际的控制过程往往无法实现 输出完全跟踪,因此误差终值往往与儿( f ) 相关。 ( 8 ) 迭代学习控制专长于跟踪性能问题;当面对系统鲁棒稳定性问题,如对 本质不稳定系统作控制,往往需先镇定后迭代,这也就引申出其与反馈控制理论 的交叉。 1 2 2 研究方法 迭代学习控制是一个充满朝气的研究领域,从每年在各大国际期刊上层出不 穷的相关文献即可见一斑。有关迭代学习控制的综述有很多,尤以m o o r e 1 9 9 8 1 和x u 2 0 0 3 年的综述最为著名。下面简单介绍下的迭代学习控制的基本方法。 ( 1 ) 压缩映射法。一般认为早期的迭代学习控制的设计范例都是压缩映射的 简单形式。该方法最主要的前提假设是要求控制对象保证严格的全局l i p s c h i t z 连 续及每次运行前相同的初始条件。然后通过五范数的形式,实现输出的完全跟踪。 该研究领域产生了p 型、d 型、p d 型和高阶迭代学习控制等方法。如a r i m o t o 早期 的著作 1 9 8 4 a 。1 9 8 4 b ,1 9 8 5 中均有详细的介绍。a t k e s o n 1 9 8 6 j 丕将a r i m o t o 的方法 应用到线性机械臂控制中去。 而后该研究领域又扩展到了混杂系统,包括时滞系统 h i d e g ,1 9 9 5 b ;1 9 9 6 1 、 离散系统 h w a n g , 1 9 9 1 、多变量系统 h i d e g ,1 9 9 5 a 、非最小相位系统 m o o r e ,1 9 9 3 ; c h e o l ,1 9 9 6 ;a m a n n , 1 9 9 4 ;g h o s h , 2 0 0 1 1 等等。除此之外,频域分析也受到了广泛 第一章绪论 的关注,迭代学习控制结合h o o 的方法正是该理论的产物之一。a m a r m 1 9 9 6 c 1 将鲁棒经典控制中的h o * 控制算法运用到了迭代学习控制中,并取得了一定的成 果: ( 2 ) 基于2 d 理论的方法。2 d 系统理论同时考虑了时域和频域的问题,由于 其融合了高阶线性多变量理论的优点,能够同时系统性地分析迭代域中的跟踪误 差和时域的稳定性,因此也受到了一定的关注。 ( 3 ) 能量函数法。在非线性动态系统中,李亚普诺夫直接法应用最为广泛, 并被认为是处理非线性不确定系统最重要的工具之一。正是受到李亚普诺夫直接 法的启示,能量函数法的概念在时域和迭代域中被同时运用,并因此打开了在迭 代域中进行学习控制及收敛性设计的新天地。 1 2 3 工业应用 迭代学习控制算法的本质决定了其控制对象的特殊性,即具有重复性运动特 质。谈到此类运动特性,工业机械臂又常常是第一个映入人们的眼帘,因此许多 智能控制界的专家将工业机械臂控制誉为迭代学习控制的“本质应用领域” ( n a t u r a la p p l i c a t i o na r e a ) 。a r i m o t o 早在二十世纪中期就将学习控制理论和自适应 控制理论运用到机械臂控制中去,并发表了相关启发性著作。c r a i g 1 9 8 4 ,1 9 8 7 也是机械臂应用的经典案例。而后,有关学习控制理论在机械臂控制中的研究成 为热点,相关的文献层出不穷,尤以r o b e r t o 1 9 9 3 的总结得最为详细。除了工业 应用外,迭代学习控制在民用机械臂控制领域也极为活跃,例如足球机器人等; 此类研究又以y a m a k i t a a n d f u r u t a 1 9 9 1 的著作最先引起广泛关注。y a m a k i t a 通过 将迭代学习控制应用于一机器人,并完成了象杯中取球这样的难度任务。除了在 机器入控制领域,迭代学习控制在反应炉控制、光学磁盘驱动、芯片制造等领域 也发挥着重要的作用。 1 3 非标准条件下的迭代学习控制 1 3 1 主要问题和研究现状 与其它控制理论一样,迭代学习控制要想真正为人们所接受,还需经受实践 的考验。但实际系统中普遍存在的各种结构不确定性、输入输出扰动、初态偏移 等现象,往往又使得原有迭代学习律收敛条件不再满足。 ( 1 ) 系统存在不确定性 在实际生产过程中,对各过程及环节的控制系统设计总是不可避免的要利用 4 浙江大学硕士学位论文 到被控对象的相关信息,这些信息可能是过程或环节的脉冲或阶跃响应、传递函 数、动态方程等。最后用于设计控制器的模型精确性也受此类信息的精度所限制。 此外,即使获得了精确的系统模型,基于该模型的控制器设计往往又过于复杂, 因此需进行简化;而简化的过程又常常带来了模型不确定性。还有如系统工作环 境的变化,。元器件的老化、磨损,信号传输中的偏差或衰减,都会带来新的不确 定性。系统不确定性对控制系统的动态及静态性能影响很大,甚者会导致“失控”。 因此,对不确定性系统的稳定性进行研究具有重大的意义。 在一般的控制系统中,常见的不确定性模型主要有以下几种 k o k a m e ,1 9 9 8 : 随机模型:将不确定性用某种随机分布来描述。 统计模型:根据试验数据用回归方法获得不确定性,也称回归模型。统 计模型常常建立在抽样试验的基础上,由于受试验的次数和样本长度的限制以及 试验过程中的干扰的影响,只能得到不确定性的估计值及其统计特性。 模糊模型:用模糊集合来描述不确定性,与模糊控制理论结合紧密。 未知有界模型:不确定性通常无需假设,只认为它属于某满足一定条件 的集合( 有界集合) 。本文中研究对象的不确定性均采用该种描述。 从另一个角度考虑,模型的不确定性又可分为参数不确定性和结构不确定 性,参数不确定性通常不会改变系统的结构,一般情况下参数不确定性系统可以 用以下的模型来表示: 0 = g ( s ,p ) :p q c r ”) ( 1 4 ) 式中q 是彤中的有界闭集,p 描述了系统中的不确定性。在控制系统中, 另一种常见的不确定性是结构不确定性( 未建模动态或动态不确定性) 。未建模动 态a ( s ) 通常不知道它的结构以及阶次,但它一般满足以下条件: i a ( j w ) j i r ( j w ) l ,v 国r ( 1 5 ) 式中l r ( j w ) l 为有界确定值。 结构不确定性又常分为以下两种形式: 加性不确定性: g ( s ,0 ) ) = 6 ;( 5 ) + 0 ) ( l6 ) 式中g 0 0 ) 称为标称对象。 乘性不确定性: g ( s ,0 ) ) = g ;o ) ( 1 + 0 ) ) ( 1 7 ) 本文将以乘性不确定性作为研究对象。 实际应用中,尽管系统模型存在不确定性,我们总希望设计的控制器能够满 足一定的性能指标,并对不确定性鲁棒。为此,b o n d i 1 9 8 8 提出利用高增益反 馈学习律来克服系统不确定性,但在实际中由于控制信号幅度有限,因此难以应 第一章绪论 用。m o o n 1 9 9 8 将针对不确定系统的迭代学习控制问题转化为鲁棒性能问题,然 后根据鲁棒控制中的标准解法获得了相应的保证鲁棒收敛的迭代学习律。 x u 1 9 9 8 b 结合变结构和自适应控制,提出了针对存在不确定性的非线性系统的 鲁棒迭代学习律。但这些方法只考虑了系统不确定性的未建模动态,当系统存在 各种干扰和初始状态偏差问题时,不能保证算法鲁棒收敛 d o y l e ,1 9 9 2 。 r 2 ) 系统存在输入输出扰动和初态偏差 针对不依赖于系统数学模型的p i d 学习控制,h e i n z i n g e r 1 9 9 2 提出一种带遗 忘因子的d 型迭代学习律,用于克服干扰和初态偏移的影响,并保证误差渐近收 敛。a r i m o t o 1 9 9 0 指出遗忘因子对p 型迭代学习律仍有效,且认为遗忘因子是算 法鲁棒收敛的本质。a r i m o t o 还引入五范数来分析迭代学习律的鲁棒收敛性;但 其本质是依据a 范数的性质将时间值较大部分的系统误差加以忽略,而该被忽略 部分对算法收敛的影响将随着时间的增加而逐步增大;最终甚至会产生极大的跟 踪误差l e e 1 9 9 7 。因此,此种方法本身就存在缺陷,且p i d 型迭代学习律由于控 制器的综合问题并没有得到更好的发展。 结合反馈控制和引入系统模型可以克服上述问题。f u r u t a 1 9 8 7 针对二次型 性能指标提出了梯度型最优迭代学习律。a m a n n 1 9 9 6 a 弓l 入了优化性能指标,利 用最大值原理设计了相关迭代学习律,但控制信号的收敛性无法保证。 p a d i e u 1 9 9 0 利用压缩映射和日o 。优化设计方法研究了闭环迭代学习控制设计问 题,但算法收敛条件过于严苛。a m a n n 1 9 9 6 b 弓i x t 频段滤波器对p a d i e u l 拘算法 进行了改进,但需要在跟踪精度与系统鲁棒稳定性之间作平衡。 ( 3 ) 期望轨迹变化 虽然迭代学习控制的收敛性与期望轨迹无关,但期望轨迹一旦变化,原来的 学习结果就将失效,这大大限制了迭代学习控制的应用范围。若能设计出一类迭 代学习律,在面对完全不同的期望轨迹时还能保持原有学习结果的有效性,则是 非常理想的。 从现有的文献来看,该问题的解决大致可归纳为三种思路: 在现有迭代学习控制的框架下进行改进,首先保证迭代学习律在期望轨 迹慢变情况下的鲁棒收敛性能,然后通过让跟踪轨迹在不同次的迭代运行过程中 缓慢变化的办法,逐渐引导输出轨迹跟踪上期望轨迹。 针对不同期望轨迹间存在的某种特殊的线性关系,结合原有的学习成果, 通过该种线性关系来改变控制输入以期实现渐迸跟踪。如x u 1 9 9 7 ,1 9 9 8 a 提出的 直接学习律,正是利用了不同期望轨迹间在形状、振幅和时间标度等参数上存在 的特殊关系,从而达到轨迹学习的效果;但该方法在面对两种完全不同的期望轨 迹时,就束手无策了。 将系统的结构参数化,然后对参数进行迭代学习,学习的结果对新的轨 6 浙江大学硕士学位论文 迹仍然有效。g o r i n e v s k y 1 9 9 7 提出一种结合参数自适应控制的迭代学习律,但 f r e n c h 2 0 0 0 指出该方法的稳定性和鲁棒性较差,易受干扰和偏差影响导致迭代 学习律发散。 1 3 2 本文采用的技术路线 综上所述,本文将系统含结构不确定性、输入输出扰动、初态偏移和轨迹交 化等定义为迭代学习控制的非标准条件。从1 3 1 节可见,现有非标准条件下的迭 代学习控制的研究主要集中在系统存在结构不确定性、输入输出扰动,初始状态 偏差这三方面,而对于期望轨迹变化等非标准条件下的迭代学习控制设计的成果 还不多。另一方面,这些成果大多数是针对某单一的非标准条件获得的,同时考 虑几种非标准条件下的迭代学习控制器设计的成果很少。 本论文着重研究在各种非标准条件同时作用下迭代学习控制器的设计问题。 主要采用前馈一反馈综合的开闭环迭代学习控制结构,考虑系统在输入输出扰 动、初态偏移、结构不确定性动态以及期望轨迹变化的影响下,设计新型迭代学 习控制律,并分析学习律的收敛性能和跟踪性能等。最后给出同时兼顾收敛速度 和跟踪精度的鲁棒开闭环综合迭代学习控制的设计方法。最大的创新点在于该算 法同时考虑各种非标准条件的影响,且利用系统化的方法来选择学习控制器的参 数,相比于传统迭代学习控制器参数选择的盲目性,具有更强的实用价值。 1 3 3 刚性机械臂系统 为验证本文算法的有效性,最后将以刚性机械臂系统为对象作仿真。机械臂 系统的结构一般由四部分组成:机械臂、环境、任务和控制器( 如图1 2 所示) 。 外传感信息外传感信息 图1 2 机械臂系统结构 机械臂是具有传动执行装置的机械系统,它是由臂、关节和末端执行装置等 连接成的相互依赖的运动结构。任务一般被定义为环境两种状态( 初始状态和目 标状态) 的差别。这些任务常用适当的程序语言来表达,并将其存储到机械臂中。 7 第一章绪论 环境是指机械臂所处的环境。不仅包含几何条件( 空间) ,还包含环境及其所包含 事物的全部自然特性的集合。 机械臂的控制分运动控$ 1 j ( m o t i o nc o n t r 0 1 ) 和作业控$ ! | ( t a s kc o n t r 0 1 ) 两种,本 文主要研究前者。机械臂的的运动控制指以机械臂( m a n i p u l a t o r ) 为控制对象,机 械臂的末端执行装置( e n de f f e e t o r s ) 的空间位置、速度、加速度、轨迹和力矩等 参数作为控制且标。因为机械臂的运动控制与其运动学和动力学密不可分,因此 又被称作为机械臂动力学控制。工业机械臂是具有相当复杂度的机电系统,其控 制的难度在于其多变量、强耦合的非线性特质和高精度、快速响应的任务要求。 通常机械臂系统被分成机械臂和关节驱动电机两部分来作研究,究其原因有 以下几点: n ) 机械臂运动控制、电机及伺服控制器本身的复杂性。为了研究的便利, 一般首先将其转化为两个相对简单的问题,以期先“各个击破”,后“全面出击”! ( 2 ) 研究人员受自身知识及客观条件所限。机械臂整套控制系统要求机械臂 操作结构、控制理论、电机及伺服控制等多学科的专业性知识,在未能掌握全部 基本知识前,从个人熟知的领域下手,不失为一个明智的选择。另外,每个领域 都需要一定的专业设备辅助研究,在外部条件无法满足前,勉强要求对系统作全 面性的控制反而会适得其反,影响研究迸度。 ( 3 ) 由于机械臂系统往往将关节驱动转矩作为控制量,而伺服电机往往以电 流、电压作为控制输入,实际的机械臂系统也是以电流、电压作为控制输入。因 此在单独研究机械臂时,也需特别考虑当转化为实际应用时可能产生的问题。 1 4 主要研究内容和结构安排 1 4 1 主要研究内容 早期以前馈技术为核心的迭代学习控制,其学习律收敛性能受系统的特性、 初始状态和各种不确定性干扰等因素的影响很大。在非标准条件下( 包括;状态、 输入和输出扰动;初态偏差;系统结构不确定性;期望轨迹变化等) ,在标准假 设条件下收敛的迭代学习律可能会发散。因此需研究在非标准条件下如何设计迭 代学习控制器,以满足理论及实际应用的要求。 正是基于上述需求,本文将进行以下几方面的探讨。首先针对早期p i d 迭代 学习控制中因缺少反馈而引起震荡的现象,将从结合反馈控制和利用系统状态先 验知识两点切入。通过将经典的鲁棒控制与迭代学习控制相结合,利用一种开闭 环相结合的理论,首先将一类具有重复性特质的控制问题转化为经典的鲁棒控制 问题。一方面利用鲁棒控制镇定系统,另一方面利用鲁棒的经典理论求解。同时 8 浙江大学硕士学位论文 由于迭代学习的前馈作用,相较于纯鲁棒控制,该控制更能快速收敛于期望目标。 而后兼顾考虑在系统存在结构不确定性、输入输出扰动、初态偏移、期望轨迹变 化等非标准条件下,上述学习律使输出轨迹收敛到期望轨迹的充分条件。 i 4 2 论文结构安排 本论文由五章组成,主要内容如下: 第一章为绪论,概述了迭代学习控制理论的历史、研究内容、研究方法等; 通过对非标准情况下迭代学习控制的相关问题的叙述,引出本文的主要切入点和 技术路线。 第二章针对一类受未知有界扰动影响的线性系统,采用前馈一反馈分部设计 法来改进其鲁棒性能;然后根据相关迭代学习律收敛条件将其转化为模型匹配问 题,并利用标准盟。方法求解;最后通过对机械臂的仿真予以验证。 第三章针对系统存在结构不确定性的问题,采用开闭环综合的二自由度控制 结构,并将该设计问题转化为鲁棒指标优化设计问题;依据该设计所获得的算法 频域收敛条件,利用鲁棒相关理论予以求解;而后考虑算法收敛速度的要求及输 入输出扰动、状态偏移等非标准条件的影响,给出改进型的算法及其收敛条件; 最后对直流电机伺服系统作仿真予以验证。 第四章针对轨迹变化等非标准问题,采用“历史轨迹学习”的策略以加快收 敛速度、改善瞬态响应性能等;具体将利用局部权重思想对系统的模型逆进行逐 点线性化逼近,从而获得最优输入初值的估计;最后通过对直流电机伺服系统的 仿真予以验证。 第五章总结全文并讨论了需进一步研究的问题。 1 5 小结 本章首先对迭代学习控制理论的历史、研究内容、研究方法等作了简明扼要 的概述;而后针对因非标准条件所引起的一系列问题来论证本研究的必要性及可 行性,并简述了本文主要的突破点及创新点;最后对论文的结构安排作了简要的 说明。 9 浙江大学硕士学位论文 第二章鲁棒迭代学习控制的分部设计 摘要:针对一类含未知干扰的线性系统,采用前馈一反馈分部设计法来改善其跟踪性能;首 先将该设计条件下的迭代学习律收敛条件转化为模型匹配问题,然后利用日。标准方法求 解;最后通过刚性机械臂的仿真予以验证。 关键词:分部设计,模型匹配,h o o ,刚性机械臂 2 1 引言 如综述中所言,迭代学习控制的一大特点在于其能利用前馈控制的优势,对 系统的跟踪性能,如跟踪精度、收敛速度等作出较大的改善。而且迭代学习在与 其它控制方法相结合进行综合设计时,往往不会破坏原有控制结构,仅需单独形 成一前馈学习环即可。以学习控制结合反馈控制为例,一般有以下两种基本结构, 即串联型和并联型 d o u g l a s 2 0 0 6 。 ( 1 ) 串联型前馈一反馈控制结构:如图2 1 所示。 图2 1 串联型前馈一反馈控制结构 串联型前馈一反馈控制结构的特点在于迭代学习的前馈输入并不直接作用 到控制对象,而是间接地输出至参考信号,因此反馈控制与学习控制从结构上不 产生交叉。其主要应用于某些工业控制过程中由反馈控制器和控制对象所组成的 闭环在结构上难以分离,以致无法对控制对象直接作用新的控制信号,只能经由 反馈环来传递。 ( 2 ) 并联型前馈一反馈控制结构。从图2 2 可知,控制对象的输入信号是直接 第二章鲁棒迭代学习控制的分部设计 由反馈输入和前馈学习输入两部分所组成的。它的特点在于前馈的作用更加直 接,避免了信号经反馈环传递后可能受到的干扰、衰减等因素的影响。本论文所 要研究的两种控制结构一鲁棒迭代学习控制的分部及综合设计均采取该种结构。 本章首先利用鲁棒迭代学习的分部设计法以解决一类含未知干扰的线性系 统的跟踪性能问题,并根据学习律收敛条件将该设计问题转化为模型匹配问题, 最后结合经典月一标准方法求解。在此基础上,对线性化后的机械臂模型作仿真 以验证算法的有效性。 图2 2 并联型前馈一反馈控制结构 2 2 鲁棒迭代学习控制的分部设计法 2 2 1 基本控制结构 现考虑一常见的线性连续系统【胡寿松,2 0 0 1 : 器= 而b o s m 矿m - i 五+ 可o = 铬 ( 2 ) u o )口0 ,+ q j ”1 + 十q , ( j ) 其中y ( s ) 为系统输出,v ( s ) 为系统输入; 对于该线性系统,首先采用常规p i d 控制器对其进行反馈控制( 为简单起见, 用p d 控制器) ,即令 “= e 6 + k p e ( 2 2 ) 其中瓦、置。分别为p d 控制器的增益。 对( 2 2 ) 式作拉普拉斯变换,则反馈后的输出y ( s ) 与期望输入匕( j ) 之间的闭 环传递函数为: 浙江大学硕士学位论文 则: e ( s ) = y ( s ) 一艺( s ) = j i i :j j :i j :;! 艺( s ) ( 2 4 ) 如果我们假设误差的初始值e ( o ) = 0 ,“o ) = 0 ,则像l e w i s 1 9 9 3 所证明的那 样,只要墨,、置。取得足够大,误差的终值就能控制得足够小。但在实际控制中 墨、置。的幅值有限,不可能满足任意误差精度的要求:这必将导致误差终值收 敛到与期望轨迹艺( j ) 相关的某一固定值。此时,要想实现更高精度的跟踪效果, 只能寻求其它控制方法的帮助了。 这不禁又让人想起了迭代学习控制。既然本身的p d 反馈已经能满足系统鲁 棒稳定性的要求,那么面对跟踪精度及抗干扰等性能问题,就是迭代学习控制大 展身手的地方了。参考图2 2 所示的并联型前馈一反馈控制结构,如果将( 2 2 ) 式 中加上前馈输入“f ) ,则新的输入变成: u k = 耳蟊+ k p e k + 咋 ( 2 5 ) 下标k 代表第k 次迭代过程。 则系统输出g ( s ) 为: 耳。,= 面石; 丢;:; :答皇而艺o ,十面i f i 主i ; ;j 云j 芴丽k ( s ) ( z e ) 误差置( s ) 为: 最( s ) 2 面石再i 害艺( 。一面石再i 乏k ) ( 2 - 7 ) 从上式可见,迭代输入岖) 对最终的误差产生了补偿作用。在理想情况下, 该补偿项最后若能完全抵消原有固定误差,则系统就能实现完全跟踪了。 实际上,若式( 2 1 ) 所表示的线性系统含有未知输入扰动( 可为非线性) ,用 d 1 ( s ) 表示,则含输入扰动时的输出可表示为: 驰,= 蒜器驰,+ 丽等而嘶,亿。, + 丝生一一d l ( s ) + ( 置芦+ k 。) m o ) 误差为: 一 黯 黔 第二章鲁棒迭代学习控制的分部设计 黔而考擀而考南驰) 弦。, 一丝( ! l d 1 ( j ) ( s ) + ( 瓦s + k 。) m ( s 1 ) ”。 令 片f j ) = 二一 ( 2 ,l o ) ( s ) + ( 鼠s + k 。) m ( s ) _ d ( j ) = h ( s ) n ( s ) y a ( s ) 一目( s ) m ( s ) d l ( s ) ( 2 1 1 ) 则( 2 9 ) 变成: e ( j ) = d ( s ) 一日( j ) m ( j ) k ( s ) ( 2 1 2 ) 从上式可以清楚的看出,只要d ( j ) 是可重复且有界的,即使是高度非线性 的耦合项,迭代学习控制的前馈项也能对其产生补偿作用。 当然,如果三 ( j ) 中含有不可重

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论