(计算机应用技术专业论文)迭代学习控制的应用研究.pdf_第1页
(计算机应用技术专业论文)迭代学习控制的应用研究.pdf_第2页
(计算机应用技术专业论文)迭代学习控制的应用研究.pdf_第3页
(计算机应用技术专业论文)迭代学习控制的应用研究.pdf_第4页
(计算机应用技术专业论文)迭代学习控制的应用研究.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

(计算机应用技术专业论文)迭代学习控制的应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 迭代学习控n o l c ) 是伴随计算机应用技术而发展起来的,是人工智能与自动控制相 结合的新的学习控制技术。它非常适合于具有重复运动特性的被控对象,可以实现有限 时间区间上任意精度的跟踪。论文根据当前迭代学习控制的研究现状,针对线性时不变 ( l t i ) 连续系统讨论 p i d 型学习律的收敛性,受噪声干扰时的鲁棒性,以及学习控制 器的p i d 参数优化设计等问题。同时,运用迭代学习控制理论去分析和解决了工业控制 过程中的两类问题:一类是控制系统可以用精确的数学模型描述,另一类是控制系统没 有具体的数学模型,通过实际应用验证了此控制技术的良好性能。 本课题主要研究内容和结果如下: 1 研究了p i d 型迭代学习律的收敛性和鲁棒性问题。针对开环、闭环p i d 型学习律 作了收敛性证明,给出了收敛条件,更进一步针对迭代学习控制系统存在初态偏差、状 态扰动和测量噪声时,对p i d 型学习律作了收敛性和鲁棒性证明。 2 针对线性时不变连续系统,对开环和闭环迭代学习控制器的p i d 参数设计方法进 行探讨。深入研究了适用于离散系统开环迭代学习控制器p i d 参数基于一定性能指标进 行优化设计的方法,在适用于离散系统推导结论的基础上,按照一定限定条件把此设计 方法应用于连续系统。 3 研究了迭代学习控制应用于直流电动机的速度跟踪问题。探讨了电气控制系统 中电动机速度跟踪控制需求,对控制系统构建了具体的数学模型,深入讨论了开环和闭 环p i d 型迭代学习控制分别应用此类问题的跟踪效果,同时针对系统存在初态学习误差、 状态扰动和测量噪声时,通过m a t l a b 软件做了大量的仿真和实验,验证了迭代学习控 制不仅具有良好的控制性能,而且具有较强的鲁棒性和稳定性。 4 研究了迭代学习控制应用于稳定大罐液位调控的实际工程问题。此控制方式通 过改变抽水电动机给定频率,从而改变排水速率,把污水液位稳定在许可范围之内,此 类控制属于均匀控制问题。此工程问题在对控制系统没有建立具体数学模型的情况下, 用迭代学习控制理论去解决,探讨了迭代学习控制模型的建立过程,并依照控制需求作 了详细的仿真。最终在设计方法成功的基础上,应用于实际现场,并且深入阐述了工程 中的硬件、软件设计过程。 5 基于论文中的学习算法和工程应用问题,用m a t l a b 软件编制m 文件和基于 s i m u l i n k 的界面程序做了仿真验证。 关键词:迭代学习控制,参数优化,速度跟踪,稳定大罐液位 r e s e a r c ha n da p p l i c a t i o no fi t e r a t i v el e a r n i n gc o n t r o l z h a n gs h o u w e i ( c o m p u t e ra p p l i c a t i o nt e c h n o l o g y ) d i r e c t e db ys e n i o re n g i n e e rj iy o u f a n g a b s t r a c t i t e r a t i v el e a r n i n gc o n t r o l ( i l c ) i sd e v e l o p e da c c o m p a n y i n gt h ea p p l i c a t i o no fc o m p u t e r t e c h n o l o g ya n di s ac o n t r o lt e c h n i q u eo fn e ws t u d yw h i c hi sc o m b i n e dw i t ha r t i f i c i a l i n t e l l i g e n c ea n da u t o m a t i cc o n t r o lt e c h n o l o g y i tc a ni m p r o v et h et r a c k i n gp e r f o r m a n c ea n d t r a n s i e n tr e s p o n s eo fc o n t r o ls y s t e m sw h i c hp e r f o r m st h es a m et a s k si naf i n i t et i m ei n t e r v a l a c c o r d i n gt ot h er e s e a r c ha c t u a l i t y ,t h i sd i s s e r t a t i o na i m i n ga t l i n e a rt i m e - i n v a r i a n t ( l t i ) c o n t i n u o u ss y s t e mh a ss t u d i e dt h ep r o b l e m so nt h ec o n v e r g e n c e ,t h er o b u s t n e s so fp i d - t y p e l e a r n i n ga l g o r i t h m ,t h ed e s i g n i n go p t i m a lp a r a m e t e ro fp i dc o n t r o l l e r m e a n w h i l e ,a i m i n ga t i n d u s t r i a lp r o c e s sc o n t r o li nt w oc a t e g o r i e s :o n ei st h ec o n t r o ls y s t e mc a na c c u r a t e l yb e d e s c r i b e db yt h em a t h e m a t i c a lm o d e la n dt h eo t h e ri st h ec o n t r o ls y s t e md o e s n th a v ea n y s p e c i f i cm a t h e m a t i c a lm o d e l s ,h a sb e e na n a l y z e da n dr e s o l v e db yi l ct h e o r y t h r o u g ht h e p r a c t i c a la p p l i c a t i o n ,i th a sp r o v e dt h eg o o dp e r f o r m a n c eo f t h i sc o n t r o lt e c h n o l o g y t h em a i nc o n t e n t sa n dr e s u l t si nt h i sd i s s e r t a t i o na r ea sf o l l o w s : 1 t h ec o n v e r g e n c ea n dr o b u s t n e s so fp i d t y p el e a r n i n ga l g o r i t h mh a sb e e nr e s e a r c h e d t h ec o n v e r g e n c ei sp r o v e da n dt h ec o n v e r g e n tc o n d i t i o n sa r ea l s og i v e na b o u tt h eo p e n - l o o p a n dc l o s e d - l o o pp i d - t y p el e a r n i n ga l g o r i t h m f u r t h e rt h ec o n v e r g e n c ea n dr o b u s t n e s so f p i d - t y p el e a r n i n ga l g o r i t h mi sp r o v e dw h e nt h e r e i st h ei n i t i a le x i s t e n c eo fb i a s ,s t a t e d i s t u r b a n c e sa n dm e a s u r e m e n tn o i s ei nt h ei l cc o n t r o ls y s t e m 2 t h em e t h o d sa b o u tt h ed e s i g n i n go p t i m a lp a r a m e t e ro fo p e n l o o pa n dc l o s e d - l o o pp i d c o n t r o l l e rb a s e do nt h el i n e a rt i m e i n v a r i a n t ( l t i ) c o n t i n u o u ss y s t e mh a v eb e e nd i s c u s s e d f u r t h e r m o r e ,i ti st h o r o u g h l yr e s e a r c h e dt h a td e s i g ni sa p p l i e dt o t h ed i s c r e t es y s t e ma b o u t o p e n l o o pi t e r a t i v el e a r n i n gc o n t r o l l e rp i do p t i m a lp a r a m e t e rb a s e do nc e r t a i np e r f o r m a n c e i n d e x a c c o r d i n gt oc o n c l u s i o n st h a tt h em e t h o da p p l i e dt ot h ed i s c r e t es y s t e m ,t h i sd e s i g n m e t h o di sa p p l i e dt oc o n t i n u o u ss y s t e mw i t h i nc e r t a i nl i m i tc o n d i t i o n s 3 t h ep r o b l e ma b o u td cm o t o rs p e e dt r a c k i n gb a s e do ni l ch a sb e e ns t u d i e d t h e c o n t r o ld e m a n da b o u tt h em o t o rs p e e dt r a c k i n gi ne l e c t r i c a lc o n t r o ls y s t e mi sd i s c u s s e da n da s p e c i f i cm a t h e m a t i c a lm o d e la b o u tc o n t r o ls y s t e m i sb u i l t t h et r a c k i n gr e s u l t so ft h e o p e n l o o pa n dc l o s e d - l o o pp i d - t y p ei l cs o l v i n gs u c hp r o b l e m sa r ed i s c u s s e d a n dt h er e s u l t s a t ea l s od i s c u s s e dw h e nt h es y s t e mh a si n i t i a le r r o r , s t a t ed i s t u r b a n c e sa n dm e a s u r e m e n tn o i s e i ti st e s t e dt h a tn o to n l yd o e si l ch a v eg o o dp e r f o r m a n c e ,b u ta l s oh a ss t r o n gr o b u s t n e s sa n d s t a b i l i t yt h r o u g hal a r g en u m b e ro fs i m u l a t i o n a n de x p e r i m e n t sa r ed o n eb ym a t l a b s o f t w a r e 4 t h ep r a c t i c a le n g i n e e r i n gp r o b l e m sa b o u ts t a b i l i z i n gt h et a n k sl i q u i dl e v e lb a s e do n i l ch a v eb e e ns t u d i e d t h ew a t e r - d e l i v e r yp u m pi sc o n t r o l l e db yt h i sc o n t r o lm o d e lt h r o u g h c h a n g i n gi t sg i v e nf r e q u e n c y , t h u st h ew a t e rd r a i n i n gs p e e di sc h a n g e d t h e s eq u e s t i o n s b e l o n gt ou n i f o r mc o n t r o ls y s t e mp r o b l e m s t h ee n g i n e e r i n gp r o b l e m sa r es o l v e db yu s i n g i l ct h e o r yo nt h ec o n d i t i o n st h a tt h ec o n t r o ls y s t e mc o u l d n te s t a b l i s hs p e c i f i cm a t h e m a t i c a l m o d e l t h eb u i l d i n gp r o c e s so fl l cm o d e li sf u r t h e rd i s c u s s e d a tt h es a m et i m et h er e s u l t s a l ed e t a i l e ds i m u l a t e da c c o r d i n gt ot h ed e m a n d t h em o d e li sa p p l i e do nt h ei n d u s t r ys c e n e u n d e rt h ed e s i g nm e t h o d sa l es u c c e s s f u l f i n a l l y , t h eh a r d w a r ed e s i g na n dt h es o f t w a r ed e s i g n a r ee l a b o r a t e di nd e t a i l s 5 t h el e a r n i n ga l g o r i t h m sa n de n g i n e e r i n ga p p l i c a t i o n si nt h ed i s s e r t a t i o nh a v eb e e n t e s t i f i e da n ds i m u l a t e dt h r o u g hal a r g en u m b e ro fm f i l ea n dt h es i m u l i n ki n t e r f a c ep r o g r a m i sp r o g r a m m e db ym a t l a bs o f t w a r e k e yw o r d s :i l c ;o p t i m i z ep a r a m e t e r ;s p e e dt r a c k i n g ;s t a b i l i z et h et a n k sl i q u i dl e v e l 关于学位论文的独创性声明 本人郑重声明:所呈交的论文是本人在指导教师指导下独立进行研究工作所取得的 成果,论文中有关资料和数据是实事求是的。尽我所知,除文中已经加以标注和致谢外, 本论文不包含其他人已经发表或撰写的研究成果,也不包含本人或他人为获得中国石油 大学( 华东) 或其它教育机构的学位或学历证书而使用过的材料。与我一同工作的同志 对研究所做的任何贡献均已在论文中作出了明确的说明。 若有不实之处,本人愿意承担相关法律责任。 学位论文作者签名:兰生:盘! 垄日期:2 0 0 8 年,月钐日 学位论文使用授权书 本人完全同意中国石油大学( 华东) 有权使用本学位论文( 包括但不限于其印 刷版和电子版) ,使用方式包括但不限于:保留学位论文,按规定向国家有关部门( 机 构) 送交学位论文,以学术交流为目的赠送和交换学位论文,允许学位论文被查阅, 借阅和复印,将学位论文的全部或部分内容编入有关数据库进行检索,采用影印、 缩印或其他复制手段保存学位论文。 保密学位论文在解密后的使用授权同上。 学位论文作者签名:至垒生! 垄 指导教师签名:季刍i 耻 日期:2 0 0 8 年_ t - 月“日 日期:2 0 0 8 年j - 月形日 中国石油大学( 华东) 硕士学位论文 第一章前言 本章论述了迭代学习控制理论的提出、发展和数学描述,然后综述了迭代学习控制 理论的研究内容及现状,最后介绍了本文的主要工作。 1 1 选题目的和意义 控制理论从形成到发展至今,已经历了六十多年的历程,主要分为三个阶段:第一 阶段是以4 0 年代兴起的调节原理为标志,称为经典控制理论阶段;第二阶段以6 0 年代兴 起的状态空间法为标志,称为现代控制理论阶段;第三阶段则是8 0 年代兴起的智能控制 理论阶段。自动控制科学逐渐形成了完整的理论体系,这不仅推动了控制科学与技术的 发展,而且对其它科学领域也产生了很大的影响,为人类社会带来了巨大的利益。但是, 应该看到,不论是经典控制理论还是现代控制理论以及大系统理论,其分析、综合和设 计都是建立在严格和精确的数学模型基础之上的。这实际上是一种基于模型的系统综合 方法,以这种方法进行控制系统综合设计的步骤是先建模,再利用数学模型设计控制器。 一般而言,它把系统设计分成建模和控制器设计两个任务进行。由此,其控制器结构与 参数依赖于受控对象的模型结构和参数。 在科学技术与生产力高度发展的今天,人们对大规模、复杂和不确定系统实行自动 控制的要求不断提高,而且实际系统大量存在非线性、时变、不确定、时滞及强耦合特 性等,一般无法获得精确的数学模型。因而,用基于模型的系统综合方法来解决这类问 题时,控制系统可能变得十分复杂,而且增加了设备的初始投资和维修费用,并且降低 了系统的可靠性。如果利用系统的历史控制经验,可以让控制器本身具有某种“智能”, 使它在控制过程中不断完善自己,使控制效果越来越好,这是一种具有“学习 能力的 控制器。学习是人类的基本智能行为之一,让控制器具有某种“智能,一直是控制界 梦寐以求的一个目标【l 】。自从在1 9 7 1 年提出学习控制的概念后,对学习控制的研究一直 很活跃。几十年来,学习控制技术随着与其相关的学科及应用领域,如计算机技术、人 工智能、神经网络、模糊控制、机器人等的发展而发展,如今学习控制技术在控制界占 有相当重要的地位。 迭代学习控制,就是通过反复的迭代修正来达到某种控制目标。迭代学习控制是智 能控制领域中具有严格数学描述的一个分支,是集人工智能与自动控制于一体的新型控 制技术,适合于诸如工业机器人那样的具有重复运动性质的被控对象,它的目标是实现 有限时间区间上的完全跟踪任务。该控制过程是一种仿效人类的学习行为提取经验的过 第一章前言 程,采用的是一种“在重复中学习 的策略,它以系统的实际输出与期望输出之间的偏 差修正不理想的控制信号,产生新的控制信号,使得系统的跟踪性能得以提高,如此迭 代若干次后,系统的输出就会逼近理想的期望轨迹。由于迭代学习算法较为简单,而且 只需较少的先验知识,又能解决比较复杂的问题,故引起了广泛的关注。 1 2 迭代学习控制系统的描述 迭代学习控制是智能控制领域中具有严格数学描述的一个分支,可具体的从以下几 个方面描述: 1 2 1 可重复受控对象 考虑线性时不变( l t i ) 连续受控系统。 设被控对象的动态方程为: 戈o i 要x o ) + b 甜o ) ( 1 - 1 ) i y ( f ) = c x ( t ) 其中,x r ”,y 尺”,r ,要求系统在时间f 0 丁】内的输出| y ( f ) 存在,则 迭代学习控制的任务是通过多次重复的运行,在一定的学习律控制下使“( f ) 寸u d ( f ) , y ( f ) 专儿( r ) 。 在第k 次运行时,式( 1 - 1 ) 表示为 五( ) = 如( ) + 砒( ) ( 1 - 2 ) i 儿( r ) = c x k ( t ) 输出误差为 气( f ) = y d ( f ) - y ( f ) ( 1 - 3 ) k 表示迭代次数为第k 次。 1 2 2 控制目标 具体地说,迭代学 - j 控制问题就是,对于一个被控系统( 1 1 ) ,给定时间区间f 【o z 】上可达的期望输出轨迹朋( f ) 及期望初态( o ) ,寻找一控制输入甜( ,) ,使得在该控制 输入作用下系统的输出少( f ) 在区间f 【o 丁】上尽可能地跟踪上期望轨迹儿p ) 。 1 2 3p i d 型迭代学习律 迭代学习控制是通过函数迭代方法寻找甜( ,) 的,即构造用于修正控制的学习律,使 得它产生一函数序列 u k ( t ) 并收敛于“( r ) 。学习控制的基本结构如图1 一l 。 2 中国石油大学( 华东) 硕士学位论文 o 葡丌 y d t ) _ 一 + e k ( o y 垂| ) 一 + e h l ( 移 图1 - 1 迭代学习控制的基本原理 f i g l 1b a s i cp r i n c i p l eo fi l c 其中儿( r ) 为输) k 。u k ( t ) 时系统产生的输出。这种控制技术之所以被称为是一种学 - 3 控制是因为它类似于通过重复达到期望行为的学习方式。u k ( t ) 实际上可以被看作是第k 次迭代以前( 不包括第k 次) 积累下来的控制经验,而e k ( t ) 则是第k 次迭代时获得的有效 信息,用以修正以往的控制经验u j , ( t ) ,并且( f ) 作为下一次的控制输入。这种学习控 制称为开环迭代学习控制。 开环p i d 型学习律的典型形式为: 啡细心) + k p e k ( t ) + 毛f 吣) d s + 砧掣( 1 - 4 ) 其中k p ,毛,屯分别代表开环p i d 的学习增益矩阵。 闭环p i d 型学习策略是取第七+ 1 次运行的误差作为学习的修正项,闭环p i d 型学习律 的典型形式为: 啪) = u k ( 卅k 吼+ l ( 卅k h 。) a s + k 掣 ( 1 - 5 ) 开环迭代学习控制律采用的是一种离线的计算方法,因而对系统的计算要求不高, 但由于它没有考虑当次操作时系统的输出误差,故控制效果不如闭环迭代学习控制好。 但闭环迭代学习控制存在部分在线计算量,对系统提出了更高的要求。 上述算法中,对于,局,向,七肛,k ,k 等参数的确定问题,即迭代学 - 2 1 律参数优 化设计方法是是本课题研究的重点之一。完成参数整定,并且验证学习系统的收敛性和 稳定性,最终才能用p i d 型迭代学习控制方法较好的解决实际工程中的问题。 1 2 4 停止条件 在每一次重复操作结束时,需要检验停止条件。若停止条件成立,则停止迭代运行。 3 第一章前言 常见的停止条件为: l y e ( t ) 一y , ( t ) l l o ) 式中| 1 | i 为j i c ”上的一种范数。它具有以下性质: 性质1 对于常向量c r ”,有。= l i e 0 性质2 对于向量函数乃:【0 ,丁】专尺”,确- i l h l l 。 彳时,h i 五等生兰 l i 厂i i 五:特别地, 当a o 时,1 1 办1 1 五生m l 五。 引理2 2 2 ( b e l l m a n g r o n w a l l 引理) 设x ( t ) ,y ( t ) 都是【0 ,t 】上的实值连续函数且a o , 7 第二章迭代学习控制的收敛性和鲁棒性分析 并满足:x ( f ) c + 上( 甜( f ) + 砂p ) ) d f 则x ( f ) c p 讲+ 上p 口( f 叫砂( f ) j f 引理2 2 3 设矩阵a r “7 ,i r 是,阶单位矩阵,则存在,m 阶矩阵r 使 p ( ,一翻) 1 的充要条件为r a n k ( a ) = 厂:存在,m 阶矩阵,使p ( 。一爿r ) 1 的充要条件 为r a n k ( a ) = m 。 以上性质和定理的证明过程可参见文献 1 8 】。 2 2 无干扰情况下学习律的收敛性 考虑( 2 1 ) 式所示的线性时不变( l t i ) 连续系统: p i 竺+ 掣( 2 - 1 ) c ly ( r ) = x ( t ) 这里,x r ”,y r 衙,u r 7 分别为系统的状态、输入、输出向量。a ,b ,c 为具有 相应维数的矩阵,r c b o 设x a ( t ) ,y d ( t ) 分别是系统的期望状态轨迹、输出轨迹,且 为( f ) ,y a ( t ) 在 0 ,t 上连续可微。设存在唯一的: d ( ,) 使系统达到期望轨迹同时设每次 迭代的初始状态满足下式: + i ( o ) 2x k ( o ) 2x o 屯( 0 ) ,k = o ,1 ,2 ,( 2 - 2 ) 采用( 2 3 ) 所示的p i d 型开、闭环相结合的迭代学习律, + l ( f ) 2 心( f ) + 属( 吒o ) + q o o ) + q 1 上e k p ) d r ) + ( 1 - 厂) r 2 ( 垂i + , ( t ) + q o e k + l ( f ) + q lk + l ( f ) d f ) ( 2 - 3 ) 其中,7 为可调常数,i e l0 y l ,v if 2 ,q o ,q 分别为开、闭环学习参数。我们的目 的是讨论当( 2 3 ) 式所示开、h 3 环p i d 型i l c 算法作用于系统( 2 - 1 ) ,( 2 - 2 ) 时,系统能否收敛, 即系统期望轨迹与实际运行轨迹之差是否收敛到零值:如果不能,其期望轨迹与实际运 行轨迹差值的范围是多少,是否可调。 针对上述问题,我们给出了定理1 。 定理1 :对于式( 2 - 1 ) ,( 2 - 2 ) ,( 2 3 ) 所描述的线性时不变迭代学习控制系统,如果满足 下式, 8 ( ,+ ( 1 一厂) r :c b ) 一i lu :- :, c b ) n p 1 8 ! 旦至塑查兰! 兰查! 堡主兰垡堡壅 则有l i m y 女( t ) = y d ( t ) + c r e 胁氛 这里 日= 匕甜印靠 - 水。吨, 证明:设“。( f ) ,吒( f ) 分别为满足( 2 4 ) 式的输入变量、状态变量, p 卜2 、+ 暨彳拶+ ”咖 ( 2 4 ) 【虼( r ) + g p 胁厶= 瓯( f ) 、。 记d u k + l ( f ) = ( d u k + l ( f ) 吼+ l ( ,) = x o ( t ) - x , + l 抛( ) = 出t ( ) 一几 c ( 彳瓯( t ) + b 6 u ( f ) ) + q o c 阮( r ) + q 1j c 瓯( f ) 出) ( 1 一厂) r 2 c ( 么魄“( t ) + b s u k + lp ) ) + 蜴( 碱+ l ( ,) + gf c 6 x k + ( f ) ( 拓 ( 2 - 5 ) 整理( 2 - 5 ) 式,得 万+ l ( f ) = ( ,+ ( 1 一r ) r 2 c b ) 卅 ( ,一i f , 1 ) 砌i ( f ) 一声l ( c a + q o c ) , 罗x k ( t ) 市- q i c f 弧( r ) d f 一( 1 一r ) r :( c a + q c ) 魄+ ,( f ) 一( 1 一d r :q , c f 8 x k + ,( f ) 纠 两边取范数,得 0 帆+ t ( f ) 8 0 帆( f ) | | + 嬲( 6 l i i 氓( f ) | i + 6 3f l i 峨( f ) l l a f + ( 1 7 ) 局( 6 2 i l 峨卅( o i l + z , , f l l s x , + ,( f ) 忱 ( 2 6 ) 其中 岛= 8 ( ,+ ( 1 一r ) r :c b ) 一2 8 ,6 l = u r 。( c a + 幺c ) l l ,如= 0 r :( c a + q o c ) ,b , = l i t 。q , c l l , 6 4 = 0 r :q l c 0 式( 2 - 6 ) 两边同时取兄范数,得 ( ,) l - p l l a , , ( , ) l l 。+ 嬲( 岛+ 坐产) 慨( f ) 儿 + ( 1 一删6 2 + 业竽眺 9 第二章迭代学习控制的收敛性和鲁棒性分析 p 删慨( 毗挑阮( 叽f e - a t - , ) d r 竿阮( 砒 而8 x k ( f ) = f e a ( t - r ) b 8 ( r ) 打 两边取五范数,得 0 万矗 ) 忆吃f e - a ( t - r ) la ( f ) 忆d f 唑竽慨毗 这里 阮= s u pe m b l e 【o ,t l 同理可得 慨荆b 掣b , l e - a t 0 8 u , + j ( 佻 记d ( 名一1 ) :l _ _ e - , , i t ,将( 2 8 ) 、( 2 9 ) 、代入( 2 7 ) 得 忆焉篇鬻器扎 记岛:j 幽煎堂鲤必照 2 1 一( 1 7 ) 启( 也+ 钆d ( 五叫) ) 吃d ( 兄叫) 因为p 1 ,由式( 2 - 1 0 ) 可见,总可以选择足够大的元,使得岛 1 ,从而使 l i m l l a u , + ,( f ) 扎= o k - - - 口。 从( 2 - 4 ) 、( 2 8 ) 我们可以推出 l i m y k ( t ) = y a ( t ) + c r e 胁氛 k - + * o 证毕 从定理l 我们可以看出,系统的实际输出可由期望输出、初始误差、以及参数q ,q 白勺值估计得到。由此我们可以通过改变蜴,g 的值,从而使系统输出逼近理想输出, 艮9 将初始误差的影响克服至最小。 由( 2 3 ) 可知,上述i l c 算法是开、闭环结合的迭代学习算法。 当2 = i 时,( 2 3 ) 式变为: u k “( f ) = u k ( t ) + r l ( 以( f ) + 蜴o ) + q le k ( r ) d r ) 它正是p a r k 1 9 1 所讨论得开环p i d 型i l c 方案;当元= 1 时,( 2 3 ) 式又可变为: 1 0 、,、, ( 功 叻 们 _ 2 z 中国石油人学( 华东) 硕士学位论文 ( ,) = ( f ) + r 2 ( 吒+ 。( t ) + q o e k + 。( f ) + q lf 气+ ,( f ) d 彳) 这时,它是完全闭环算法。 2 3 存在初始偏移时学习律的收敛性与鲁棒性 每次迭代得初始状态均不同,但始终在而得一邻域范围内变化,即满足 i i 故( o ) 一而0 。s ,j | = o ,i ,2 ( 2 - 1 1 ) 定理2 给出了这一情况下算法( 2 3 ) 得收敛性和鲁棒性。 定理2 :对于( 2 1 ) 、( 2 3 ) 所描述得线性定常系统,假设 如下条件成立: l ( + ( 1 - d r :) 1 ( ,一几c b ) l l 。p l l s x , 1 1 a + y p ,b o ( a ) l l s x , 玑a = i m 。,得 l l 万( r ) l l :+ 牮1 1 8 ( f ) l i 五( 2 - 1 4 ) 同理可得 l i 万毛+ 。( f ) 扎:+ 华。万甜。+ ,o ) 虬( 2 - 1 5 ) 将( 2 - 1 4 ) 、( 2 1 5 ) 代入( 2 - 1 3 ) ,得 j i n x , + , k 而鳜糍蔫端裔筹高忪删l 五 + 趔型生幽堑婴塑芝丛塑磐塑堕( 2 16 ) 1 一( ( 1 7 ) 岛6 d ( 力_ 。) + ( 1 - r ) p , b o ( z 叫) 阮d ( 力叫) ) 、 记 执:2 丝垒翌( 墨:1 2 丝刍翌! 垄:1 2 丝里! 墨:12 尸3 1 一( ( 1 一y ) p l b o ( 2 一) + ( 1 7 ) 局6 6 d ( 兄。1 ) 吃d ( 见一) ) , 0 4 = l 一( ( 1 一z ) p , b o ( a 。1 ) + ( 1 一r ) p a o ( 兄。1 ) 吃d ( a 卅) ) 那么,式( 2 一1 6 ) 可变为 0 瓴+ ,( f ) 扎岛l l 万( f ) k + 趔监尘盟归+ q o c l l 。+ i i ( c a + q 0 c ) 州易c lo ( 砌 p 4 。 1 主i ( 2 - 1 6 ) 式可见,我们总可以找到足够大的允,使当兄专0 0 时,使岛 1 成立。 所以我们有: 舰1 1 8 x , ( ,) i k 2 兰l 业二! 旦二掣i i c a + q c i i 。+ k c 彳+ q c ) 彳+ 鸟c l l d ( a 。1 ) ) 证毕 从定理2 可以看出,误差的界值依赖于8 c 4 + g c k 和i i ( 例+ 幺c ) 彳+ q l c k ,因此我没 可以按照下式选择q 与q i 得值。 9 o 鼍- c a c ( c c ) 叫 q l = 一( c 4 + q oc ) 4 c ( c c ) 。1 = - ( c x - c x c ( c c ) c ) a c ( c c ) 。1 1 2 中国石油大学( 华东) 硕士学位论文 这里,4 ,c 分别式系统矩阵a ,c 的模型值。 2 4 具有信号噪声时收敛性与鲁棒性分析 考虑重复运动的具有状态扰动和测量噪声线性定常系统: p ) 饥( r 卜燃卜掣( 2 - 1 7 ) i y k ( t ) = c x k ( t ) + v k ( t ) 其中七代表系统的第k 次重复操作,x k r ”,几r ”,u k r 7 分别为系统的状态 向量、输出向量和输入向量:w k ( t ) ,v k ( t ) 为状态扰动和测量噪声:a ,b ,c 为具有适当维数 的有界矩阵, o ,t 】。 2 4 1 选用开环p i d 型学习律 + l ( f ) = u k ( t ) + k e e k ( t ) + k ,e k ( s ) d s + k d 吒( f ) ( 2 - 1 8 ) 在给出本节主要结论之前,先给出以下假设: ( 1 ) 不确定性和扰动有界且满足: 8 ( f ) k ,i i v , ( t ) l l - b ,0 1 k o ) 0 6 凶,( v k = o ,1 ,v t o ,丁】) ( 2 ) c b 列满秩。 针对上述问题我们给出定理3 。 定理3 考虑系统( 2 1 7 ) 及其假设条件( 1 ) 、( 2 ) ,给定时间区间 0 ,t 】上期望轨j 迹y a ( t ) 以 及任意的初始控制( f ) 和初始状态( 0 ) = 劫( 0 ) ,利用学习律( 2 一1 8 ) ,若x , j - t 0 ,卅有 lr o c s i i t 一) v + i i k , , c i b + i l k , , + k i t i l 6 + i l k d0 由p 1 ,显然存在充分大得,使得万 1 。 1 4 中国石油大学( 华东) 硕士学位论文 从而:! 骢( f ) 儿亡;有界。 进一步地,i 扫f e 【s u 吖p 1o ( f ) i i p 盯! 骢| i ( f ) 儿p 盯南有界。 从而七一o o 时,( f ) 在 0 ,t 】上一致有界,进而吼( f ) 在 0 ,t 】上一致有界。 当w ( ,) 暑0 ,v ( t ) 兰0 时,显然孝= 0 ,从a u ( f ) 一0 ,a e k ( t ) 专0 。 证毕 定理表明,开环p i d 型迭代学习算法的收敛条件仅仅受误差微分项增益k o 的影响而 不受巧,砟的影响。 2 4 2 选用闭环p i d 型学习律 + l ( f ) = u k ( t ) + k e c e k + i ( f ) + 如上气+ i ( s ) d s + k o c k + l ( ,) ( 2 - 2 2 ) 在给出本节主要结论之前,先给出以下假设: ( 1 ) 不确定性和扰动有界且满足: 8 k + ;o ) l l 瓦,8 唯+ 。o ) l 饥,1 1 吨+ ( f ) 0 h , ( v k = o ,1 ,v f 【o ,r 】) ( 2 ) c b 歹;j 满秩。 针对上述问题我们给出定理4 。 定理4 考虑系统( 2 1 7 ) 及其假设条件( 1 ) 、( 2 ) ,给定时间区间 o ,t 】上期望轨迹儿( f ) 以 及任意的初始控制u o ( f ) 和初始状态吒( 0 ) = 劫( o ) ,利用学习律( 2 - 2 2 ) ,若对, 0 ,刀有 i ( i + k o c c b ) 一1 p 1 贝1 k - - - ) o o 时,e k ( t ) 宅e o ,t i - _ 一致有界:当w ( f ) ,1 ,( r ) 不存在时,系 统输出收敛于期望轨迹,即几( f ) 专y a ( t ) ( k 专o o ) 。 证明: 令 a u , ( t ) = u a ( t ) - u , ( t ) a x e ( t ) = x e ( t ) - x , ( t ) 则由式( 2 - 1 7 ) ( 2 2 2 ) 得: a u , + l ( f ) = u a ( t ) 一致+ l ( f ) = a u , ( t ) - k e c e i + l ( t ) - k z cf e , + i ( f ) 如一k 屯+ l ( f ) = a u , ( t ) - k e c c a x + 1 ( r ) 一心c f 瓴+ i ( r ) 出一k o c c a a x , + l ( ,) 1 5 第二章迭代学习控制的收敛性和鲁棒性分析 一j r 矗c b + l ( t ) + k o c c w k + l ( f ) + j 【尸c 攻+ l ( ,) + - f 心“( f ) d f + j 【矗吨“( f ) ( ,+ k c b ) a u k + lo ) = ( f ) 一 k c + j 五明】+ l ( ,) 一k t c cfa x k 卅( _ ) d f + k c w k + l o ) + k 尸( ? 咋卅( f ) + 如f 咋+ 1 ( f ) d f + k j v k + ( ,) ( 2 - 2 3 ) 对( 2 2 3 ) 式两边取名一范数的性质3 得: l | 卅o ) 虬- 九) ( 2 - 2 5 ) 将( 2 2 5 ) 代入式( 2 2 4 ) 得: l i + 。o ) k _ 歹l l a u 。( t ) l l 五+ 善 其中万= 卅叫i 砭c m 1 ) 】| i b 1 - e 一( i a i - a ) r - ) l 一以 孝= 硝( + i i k , c c i i o ( , 无) r + i i k 艏c u b + p l i k 即+ k , c r l l b , + p k0 h 由p 1 ,显然存在充分大得,使得声 1 。 从而:l 受l l a u , t ) l l 五南有界。 进一步地, ,e i s u 叮p 】i i u k ( f ) l i e a r 。l i m 。l u k ( d 忆 e a r 南有界。 从而后专0 0 时,a u k ( t ) 在 0 ,t 】上一致有界,进- i 面e k ( t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论