(系统工程专业论文)时滞系统的迭代学习控制.pdf_第1页
(系统工程专业论文)时滞系统的迭代学习控制.pdf_第2页
(系统工程专业论文)时滞系统的迭代学习控制.pdf_第3页
(系统工程专业论文)时滞系统的迭代学习控制.pdf_第4页
(系统工程专业论文)时滞系统的迭代学习控制.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

(系统工程专业论文)时滞系统的迭代学习控制.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浙江工业大学硕士学位论文 时滞系统的迭代学习控制 摘要 时滞作为控制系统中普遍存在的一种现象,是由于信息的传递、 测量等因素所导致的时间延迟而产生的,并且时滞特性常常会对控制 系统的稳定性及系统性能指标产生严重影响,所以研究时滞系统的控 制问题具有重要的理论意义和应用价值。 迭代学习控制理论针对具有重复运动性质的被控对象,通过对被 控对象进行控制尝试,以输出轨迹与期望轨迹的偏差来修正不理想的 控制信号,产生新的控制信号,使得系统的跟踪性能得以提高,最终 获得满意的跟踪效果。因此,将迭代学习控制作为解决时滞系统控制 问题的方法是可行的。本文针对一类具有相对阶的时滞系统,讨论了 几种形式的迭代学习控制算法,给出其中几种学习系统的输出极限轨 迹,以及这几类学习系统的输出收敛时的充分条件。本文主要研究内 容如下: ( 1 ) 讨论具有相对阶和初始修正的时滞系统迭代学习控制算法,并 给出这类学习系统的输出极限轨迹。理论分析与仿真结果表明,该学 习算法可以在指定时刻之后实现对给定期望轨迹的完全跟踪。 ( 2 ) 探讨具有相对阶的非线性时滞系统闭环迭代学习控制算法,并 给出这类学习系统的输出极限轨迹。文中分别针对d 型、p d 型、p i d 型学习律以及带初始修正的d 型学习律进行讨论。 ( 3 ) 针对具有相对阶的非线性时滞系统,提出采样迭代学习控制算 法,并证明了该算法的鲁棒收敛性。 ( 4 ) 结合预期控制和迭代学习控制,提出具有相对阶的非线性时滞 系统预期迭代学习控制算法,并证明了该算法的收敛性。 关键词:迭代学习控制,时滞系统,相对阶,收敛性,闭环控制, 采样控制 浙江工业大学硕士学位论文 i t e r a t el e a r n i n gc o n t r o lf o rt i m e - d e l a y s y s t e m s a b s t r a c t a st h ep h e n o m e n o ne x i s t e du n i v e r s a l l yi nt h er e a lc o n t r o l l e do b j e c t s , t i m e d e l a yi sg e n e r a t e db ys o m ea c t i o n sf r o mt r a n s m i s s i o n ,m e a s u r ea n d s oo n a n do f t e nr e s u l t si nt h ei n s t a b i l i t ya n dp o o rp e r f o r m a n c e s oi ti s m e a n i n g f u la n dv a l u a b l et os t u d yt h ec o n t r o lp r o b l e mf o rt i m e d e l a y s y s t e m s i t e r a t i v el e a r n i n gc o n t r o lt h e o r yi ss u i t a b l ef o rt h ep r o c e s sw h i c hh a s r e p e t i t i v ec h a r a c t e r i s t i c i te x p l o i t se v e r yp o s s i b i l i t yt oi n c o r p o r a t ep a s t c o n t r o li n f o r m a t i o n :t h ep a s tt r a c k i n ge r r o rs i g n a l sa n di np a r t i c u l a rt h e p a s tc o n t r o li n p u ts i g n a l s ,i n t ot h ec o n s t r u c t i o no ft h ep r e s e n tc o n t r o l a c t i o n t h es y s t e mo u t p u tc o n v e r g e st ot h ed e s i r e dt r a j e c t o r yj o i n t e d s m o o t h l yf i n a l l y a sar e s u l t i ti sf e a s i b l et os o l v et h ec o n t r o lp r o b l e mf o r t i m e d e l a ys y s t e m sw i t hi t e r a t i v el e a r n i n gc o n t r o lt h e o r y t h i sd i s s e r t a t i o n a d d r e s s e st h ep r o b l e mo fi t e r a t i v el e a r n i n gc o n t r o lf o rt i m e d e l a ys y s t e m s w i t hw e l l d e f i n e dr e l a t i v ed e g r e e m u l t i f o r ml e a r n i n ga l g o r i t h m sa r e i n t r o d u c e d c o n v e r g e n c ec o n d i t i o n sa r ed e r i v e d , e n s u r i n gt h a tt h es y s t e m o u t p u tc o n v e r g e su n i f o r m l yt o ap r e - s p e c i f i e dt r a j e c t o r y t h em a i n c o n t r i b u t i o n si n c l u d et h ef o l l o w i n ga s p e c t s : ( 1 ) t h ed i s s e r t a t i o na d d r e s s e st h ep r o b l e mo fi t e r a t i v el e a r n i n g c o n t r o lf o rt i m e d e l a ys y s t e m sw i t hw e l l d e f i n e dr e l a t i v ed e g r e e i n i t i a l r e c t i f y i r i ga c t i o ni si n t r o d u c e di nac o n v e n t i o n a ll e a r n i n ga l g o r i t h mi nt h e p r e s e n c eo f i n i t i a ls h i f s c o n v e r g e n c ec o n d i t i o n sa l ed e r i v e d , e n s u r i n gt h a t t h es y s t e mo u t p u tc o n v e r g e su n i f o r m l yt oap r e - s p e c i f i e dt r a j e c t o r y i n p a r t i c u l a r , t h es y s t e mo u t p u tc o n v e r g e st ot h ed e s i r e dt r a j e c t o r yj o i n t e d s m o o t h l yw i t hap i e c eo f t r a n s i e n tt r a j e c t o r y ( 2 ) t h ed i s s e r t a t i o na d d r e s s e st h ep r o b l e mo fc l o s e d - l o o pi t e r a t i v e l e a r n i n g c o n t r o lf o rn o n - l i n e a rt i m e - d e l a ys y s t e m sw i t hw e l l d e f m e d r e l a t i v ed e g r e e c o n v e r g e n c ec o n d i t i o n sa r ed e r i v e d , e n s u r i n gt h a tt h e s y s t e mo u t p u tc o n v e r g e su n i f o r m l yt o ap r e - s p e c i f i e dt r a j e c t o r y t h e 塑垄三些查兰堡主兰垡丝奎 d - t y p e ,p d - t y p e ,p i d - t y p el e a r n i n gl a wa n dd - t y p el e a r n i n gl a ww i t h i n i t i a lr e c t i 黟i n ga c t i o na r ed i s c u s s e dr e s p e c t i v e l yi nt h ed i s s e r t a t i o n ( 3 ) t h cd i s s e r t a t i o na d d r e s s e st h ep r o b l e mo fn o n - l i n e a rt i m e d e l a y s y s t e m s 诵mw e l l - d e f i n e dr e l a t i v ed e g r e e n l es a m p l e d - d a t al e a r n i n g a l g o r i t h mi si n i t i a t e da n di t sr o b u s tc o n v e r g e n c ec o n d i t i o ni sd e r i v e d ( 4 ) c o m b i n i n gi t e r a t i v el e a r n i n gc o n t r o l 、v i ma n t i c i p a t o r ya p p r o a c h , t h ed i s s e r t a t i o na d d r e s s e st h ep r o b l e mo fa n t i c i p a t o r yi t e m t i v el e a r n i n g c o n t r o lf o rn o n - l i n e a rt i m e d e l a ys y s t e m sw i t hw e l l d e f i n e dm l a t i v ed e g r e e c o n v e r g e n c ec o n d i t i o no ft h ea n t i c i p a t o r y i m r a t i v el e a r n i n gc o n t r o li s d e r i v e d k e yw o r d s :i t e r a t i v e l e a r n i n gc o n t r o l ,t i m e d e l a ys y s t e m s , r e l a t i v ed e g r e e ,c o n v e r g e n c e ,c l o s e d - l o o pc o n t r o l ,s a m p l e d - d a t ac o n t r o l 浙江工业大学 学位论文原创性声明 本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研 究工作所取得的研究成果。除文中已经加以标注引用的内容外,本论文不 包含其他个人或集体已经发表或撰写过的研究成果,也不含为获得浙江工 业大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出重 要贡献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法 律责任。 作者签名 圾、 日期嬲吞月叫日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学 校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被 查阅和借阅。本人授权浙江工业大学可以将本学位论文的全部或部分内容 编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和 汇编本学位论文。 本学位论文属于 1 、保密口,在年解密后适用本授权书。 2 、不保密匝 ( 请在以上相应方框内打“0 ”) 作者签名: 导师签名: 日期:呻6 c 月口日 日期:年月日 浙江工业大学硕士学位论文 1 1 引言 第一章绪论 从2 0 世纪8 0 年代开始,随着科学技术的发展,智能控制的研究揭开了新的一 页。学习控制是广义智能控制( 包括学习控制、认知控制与联想决策等) 的一个 高级分支。它相对于其它典型的智能控制方法而言,具有自动知识获取能力即学 习能力,是美国学者f u 在1 9 7 0 年最先提出的,他在对线性再励学习控制系统的研 究中率先使用了人工智能中的启发式方法0 - 3 1 。学习控制的研究热点之一是迭代学 习控制( i t e r a t i v el e a r n i n gc o n t r o l ,简称i l c ) 。 迭代学习控制研究的动机,来源于从经验学习知识的深刻认知。从本质上讲, 一个系统控制器的设计问题可以归结为跟踪问题,其中调节问题可以看成是跟踪 问题的特殊情况。尽管对于跟踪问题,控制理论已经提出了各种各样的设计方法, 并取得了良好的效果,但是绝大多数的控制技术都还是渐近地实现跟踪任务的。 如果我们能够找到实现被控系统的输出完全精确地跟踪期望轨迹的控制方法,无 疑是一个吸引人的并且极具挑战性的任务。因此,设计一个控制器,让控制器本 身具有某种“智能”,即能在系统运行过程中估计未知的信息并基于这个估计的信 息确定最优控制,使它在控制过程中能不断地完善自己,也就是不断地训练控制 器,以使控制效果越来越好,这种具有“学习”能力的控制器就是迭代学习控制 技术的一种表现。当需要重复完成某一控制任务时,可以从过去的控制输入和跟 踪误差数据中获得额外的信息,利用这样的信息,就可以降低对过程模型的依赖, 并且提供了改进跟踪控制性能的可能性。 迭代学习控制作为在时域中发展的学习控制,相对于在频域中发展的重复学 习控制而言应用较广。成果较多,引起了更多的注意。迭代学习控制从本质上来 说是前馈控制,它的特点是能够充分利用前几次的控制信息构成当前的控制输入 信号,且不依赖于被控系统的详细模型。迭代学习控制的适用对象是诸如工业机 器人那样的具有重复运动性质的被控对象,它的目标是实现有限时间区间上的完 全跟踪任务。其目的在于改善控制系统的瞬态性能,或实现控制系统的稳态补偿, 或抑制系统的确定性干扰。迭代学习控制采用“在重复中学习”的学习策略,具 有记忆和修正机制。它通过对被控系统进行控制尝试,以输出轨迹与期望轨迹的 偏差来修正不理想的控制信号,产生新的控制信号,使得系统的跟踪性能得以提 高,最终达到完全跟踪的目的。迭代学 - 3 控制的研究对具有非线性、强耦合,较 l 塑婆三些奎堂堡主堂些丝苎 高的重复精度,难以建模和高精度轨迹跟踪控制要求的对象有着非常重要的意义。 1 2 迭代学习控制的研究内容与现状 最近几年,随着迭代学习控制研究的不断深入,其研究内容主要涉及到以下 几个方面:学习算法的稳定性与学习控制的收敛性、学习律及学习系统的研究、 学习控制过程的鲁棒性、学习的收敛速度、分析方法、初值问题和应用研究等【l j 学习控制的收敛性是迭代学习控制理论的中心问题。学习算法的稳定性是保 证学习控制能够运行的基本前提,它保证随着学习次数的增加,控制系统能够收 敛。但对于学习控制系统恧言,仅仅稳定是没有实际意义的,只有使学习过程收 敛到真值,才能保证得到的控制为某种意义下的最优控制。学习的稳定性与收敛 性问题是研究当学习律与被控系统满足什么条件时迭代学习控制过程是稳定或收 敛的。a r i m o t o 在最初提出p i d 型学习控制时就已经对线性系统在d 型学习律下的稳 定与收敛条件作了证明。林辉、王林给出了最一般的非线性系统的收敛性条件。 学习律的研究是迭代学习控制的基础。它包括提出新算法、放宽收敛条件、 加快收敛速度等。主要是研究各种不同的迭代学习算法,如p 型、d 型、p i 型、p d 型、p i d 型学习算法,沿时阃轴方向与沿学习迭代方向的迭代学习算法或其组合形 式的学习算法,以及其它形式的迭代学习算法。还有是研究不同的学习系统的结 构形式,即被控系统与学习控制器的构成形式,如开环学习和闭环学习,开闭环 结合算法,以及其它形式的学习算法。目前,在学习律的研究中,针对特殊系统 提出的控制律占了主导地位。 学习控制过程的鲁棒性问题主要讨论当系统存在包括不确定扰动、状态扰动、 测量误差、初始条件偏差、期望轨迹变动以及学习区间偏移等在内的各种扰动时, 在各种学习律下,被控系统控制过程的稳定性与收敛问题。鲁棒性最早是由 a r i m o t o 针对线性系统提出来的,后来才推广到非线性系统。当系统存在初始误差 时,如何克服这种扰动是迭代学习控制一个非常重要的研究课题。 学习的收敛速度对于各类学习系统面言都是一个非常重要的概念。它是研究 迭代学习控制对于给定的被控系统,在各种不同的迭代学习律作用下,系统的输 出收敛到给定的轨迹与哪些因素有关,可以通过采取一些相应的措施,来加快学 习速度,以期得到最优的学习律和最佳的系统构成,从而获得最快的收敛速度。 研究表明,采用高阶学习律可提高学习的收敛速度。 学习控制的分析方法研究主要是指类似于时域分析法、频域分析法、二维系 统分析法等用来分析控制过程的理论方法。另外还有分析收敛性用的 范数,以, 方法等。 初值问题是指学习控制过程中系统初始状态与收敛性的关系。目前所研究的 2 浙江工业大学硕士学位论文 大多数迭代学习控制都是假定系统的初始状态位于期望轨迹上才得出的收敛条 件。当初始状态不在期望轨迹上时,迭代学习控制的收敛性应该如何保证,这是 一个值得探讨商榷的问题。 学习控制的应用研究早期集中在离线处理,随着研究的不断深入,智能控制 的不断发展,学习控制的在线应用越来越受到人们的重视。在医学、加工制造、 机械系统、电子产品等领域的发展前景愈加广阔。当单纯的一种控制方案不能达 到很好的控制效果时,迭代学习控制与其它控制方法的结合成了大势所趋。如迭 代学习控制与神经网络控制的结合,与自适应控制的结合,与模糊控制的结合, 与滑模控制的结合等。 近年l e e 等【5 s 】已将迭代学习控制技术应用于某间歇反应器的温度控制。他们将 这种技术应用于某种重复运行性质的工业过程是十分诱人的。在许多化工过程中, 不同品种的批量生产方式越来越多,但系统中时延现象极为普遍。因此,研究应 用迭代学习控制技术实现时滞系统的跟踪控制问题是有背景的1 2 习。孙明轩等1 1 9 l 首 次讨论了一类非线性时滞系统的迭代学习控制。p a r k 等人1 8 】对具有不确定控制时滞 的线性时不变系统提出了一种基于采样的控制算法,并证明当系统满足一定条件 时在各采样点上的收敛性。方忠等f 2 啦2 1 针对一类非线性时滞系统,讨论采样迭代 学习律的收敛性问题。 1 3 迭代学习控制的基本描述 1 3 i 迭代学习控制的基本原理 迭代学习控制是智能控制中具有严格数学描述的一个分支。其过程是:在有 限的时间f e 【o ,7 - 】内,已知被控对象的期望响应儿( f ) ,r 【o ,明和相应的期望初 态而( 0 ) ,求解某种给定的( ,) ,r o ,刀,使其响应在某种意义上比几( f ) , , o ,刀有所改善,其中七为迭代学习次数。如图l 一1 所示: 图1 1 迭代学习控制的基本结构框图 设被控对象的动态过程为 浙江工业大学硕士学位论文 x ( t ) = f i t ,相,群( f ) 】( 1 1 ) 【y ( f ) = g t ,缸f ) ,“( r ) 】 式中,工r ”,y r ”1 ,工r 1 ,f 、g 为相应维数的向量函数,其结构 和参数都未知,要求系统在时间, 0 ,t 】内的输出跟踪期望输出y e ( t ) 。假定期望 控制蚴( f ) 存在,即:在给定状态初值石( o ) - f u d ( f ) 是式( 卜1 ) 当y ( f ) = y a ( t ) 的解, 则迭代学习控制的目的是通过多次重复的运动,在一定的学习律下使 “( r ) 斗( f ) ,y ( t ) 寸y a ( t ) 。第k 次运行时可表示为 r j 以( f ) 2s i t , ( ,) ,( ,) 】( i - 2 ) 【几( f ) = g t ,以( f ) ,“t ( f ) 】 输出误差为 气( f ) = y a ( t ) 一儿( f ) ( 1 - 3 ) 而迭代学习控制的学习律一般可由递推的形式表示为 “( f ) = l ( u ( f ) ,e i ( r ) ) ( 1 - 4 ) 在实际应用中,系统下一次运行的控制输入既可以在上一次运行结束后离线 计算得到,也可以在上一次运行中在线计算得到。新的控制量存入存储器,刷新 旧的控制量,在施加控制时,需从存储器中取出控制量。可以看到,迭代学习控 制算法可利用的信息要多于常规的反馈控制算法,它包括以前每次运行的所有时 间段上的信息和当前运行的当前时刻之前时间段上的信息。由此迭代学习控制可 分为开环学习和闭环学习。 1 开环p i d 型学习算法是:第k + 1 次的控制等于第k 次的控制加上第k 次输 出误差的p i d 校正项,即 啪h ( d + k p e , ( f ) + 岛乒+ 岛鼍笋 ( 1 - 5 ) 其中,吒、丘、屯分别为p i d 学习增益矩阵。如图l q 所示: 图1 2 开环p i d 型迭代学习控制的结构图 4 新江工业大学硕士学位论文 2 闭环p i d 型学习算法是:第七+ 1 次的控制等于第k 次的控制加上第k + 1 次 输出误差的p i d 校正项,即 ( 沪( f ) + k ,e k + ,( f ) + 毛丘+ o ) a s + ! ! 铲 ( 1 6 ) 0 _ 其中,露。、k j 、以分别为p i d 学习增益矩阵。如图l 一3 所示: 图i - 3 闭环p i d 型迭代学习控制的结构图 由式( 卜5 ) 与式( 卜6 ) 比较可知:开环迭代学习只利用了系统前次运行的 信息,而闭环迭代学习则在利用系统当前运行信息改善控制性能的同时,舍弃了 系统前次运行的信息。因此,总的来说,闭环迭代学习的控制性能要优于开环迭 代学习。 1 3 2 迭代学习控制研究中的假设 迭代学习控制在传统的迭代学习控制研究中,一般总是假定下述假设条件满 足 2 1 : 1 系统每次运行的时间间隔是有限的固定间隔,即t e 【0 ,t 】; 2 系统的期望轨迹总是预先给定并且是已知的: 3 系统的动态结构在每次运行过程中保持不变; 4 系统每次运行的输出y 。( f ) 可测; 5 存在唯一的理想控制u d ( f ) 使得系统的状态和输出为期望的状态屯( f ) 和输 出儿( ,) 。 最后一个假设条件与系统的逆密切相关,它等价于要求系统可逆,这显然是 一个非常强的假设条件。不幸的是,实际中的许多动态系统都不满足可逆的条件。 因此,有时我们不得不降低完全精确跟踪的要求,而代之以寻找使系统输出最接 近期望输出的系统输入这一合理的要求。这等价于在某种范数意义下,迭代学习 控制算法构造了一系列迭代控制序列缸。) ,它收敛于一个可实现的控制信号“( f ) 5 塑坚三些奎兰堡圭兰垡堡奎 且“( f ) 是如下最优问题的解 r a 。i 。n l y d ( r ) 一y ( t ) i i ( i - 7 ) 其中,y ( f ) 为系统的输出 一个成功的迭代学习控制算法,不仅应该在每一次控制作用于系统后,能使 系统的输出误差变小,还需要有较快的收敛速度以保证算法的实用性。另外,迭 代学习控制算法的收敛性应与具体的期望轨迹无关,如果给出一个新的期望轨迹, 迭代学习律应该无需作任何改变即可适用。 1 3 3 迭代学习控制的评论 1 一个成功的学习控制方案,它的下一次控制输入总是能够使系统性能逐渐 得到改善。评价的标准通常都用输出误差以某种范数的收敛来度量。 2 我们定义的信号有两个变量七、t ,需要注意的是,在此,k 代表迭代的 次数,f 代表每次迭代过程中的时间变量,它可以是离散的,也可以是连续的。 3 为分析方便,我们通常设r 为一固定值。当然,r 寸0 0 也是允许的,这种 情况称作重复学习控制。 4 迭代学习控制的大优点在于它仅需要知道系统( 或被控对象) 很少的经 验知识。 5 在实际中,迭代学习方案是不依赖于期望轨迹的。这就是说,如果期望轨 迹变了,只需要重新学习新的轨迹就可以了,并不需要改变迭代学习算法。 6 通常我们要求迭代学习控制的对象本身是稳定的。因为迭代学习控制是为 改善系统性能而采取的控制策略,它相当于一种前馈控制。 1 4 迭代学习控制问题的具体描述 迭代学习控制过程可从以下几个方面进行具体描述【3 l : 1 动力学特性的可重复性 连续系统可表示为 r x ( o = 几r 工( f ) q ( f ) 】( 1 8 ) 【y ( f ) = g t ,工( f ) ,“( f ) 】 式中,工r ,y r ”,x e r r - l ,厂、g 为相应维数的向量函数,假设系 统在有限时间区间t 【o ,刀重复运行,这里给定t 0 如果向量函数,、g 在每 一次重复运行时所表示的函数关系不变,则称由它们所描述的系统( 1 - 8 ) 的动力 学特性具有可重复性。以七表示重复操作次数,并以以( f ) 、蚝9 ) 、y k ) 分别为 6 浙江工业大学硕士学位论文 第k 次重复时系统的状态向量、控制向量、输出向量 可以表示为 j t ( f ) = f i t ,x k ( t ) ,u k ( t ) 】 【y i p ) = g t ,x k ( t ) ,甜i o ) 】 离散系统可表示为 可重复的控制系统( 卜8 ) ( 1 - 9 ) 嚣2鬈,;:篙(1-10)gt【y o ) =,善( f ) ,“o ) 】 式中,工e r “,y r ”,z r ”。,f 、g 为相应维数的向量函数,假设系 统在有限采样时间区问( o ,1 ,2 ,d 上重复运行。与上述类似,如果向量函数,、g 在每一次重复运行时所表示的函数关系不变,则称由式( 1 - 1 0 ) 所描述的系统具 有可重复性。以k 表示重复操作次数,并以k ( f ) 、( f ) 、y k ( t ) 分别为第k 次重复 时系统的状态向量、控制向量、输出向量,可重复的控制系统( 1 - 1 0 ) 可以表示 为 x k ( t + l 我戳等月 g p ,x 1 8 ) ,;l ) 】 。 2 跟踪任务 在有限时问区间,【o ,明上,给定可达的期望轨j 壶y a ( t ) ( t e 【0 , t 】) 和相应 的期望初态秘( q ) 。这里的期望轨迹儿( f ) 的可达性是指以( o ) 为初态的被控对象 存在控制( f ) 。在该控制输入作用下能产生相应手期望轨迹) ,。o ) 的状态轨迹 x o ( t ) ( r o , t 】) ,这里提到的u d ( f ) ( t o ,刀) 和矗( f ) ( t 0 , t 】) 分别被称为 期望控制和期望状态。系统存在期望控制和期望状态是设计和分析迭代学习控制 器的前提条件。 3 初始定位 自t = 0 时刻起,系统的每一次重复操作都必须从某初始点开始进行。这里的 初始点是指初始状态( o ) 。因此,在每一次迭代开始前都需要进行初始定位操作。 初始点的设置必须满足初始条件。所谓初始条件是指在每次迭代时为保证迭代的 收敛性,对于系统初始点的重复定位操作所限定的条件。目前,在迭代学习控制 系统的收敛性分析中,常见的初始条件有: ( 1 ) 迭代初始状态与期望初始状态一致,即以( o ) = 而( o ) ( k = 0 , 1 ,) ,此时, 称系统的初始状态是严格重复的。 ( 2 ) 迭代初始状态固定。即坼( 0 ) = 工( 0 ) ( k = o ,l ,) ,x ( 0 ) 为某给定的初始 状态,它与期望初始状态不一致。这时称初始状态是重复的。 针对不同的系统结构而言,初始条件( 1 ) 有时与初始条件( 2 ) 是一致的, 有时又与如下初始条件等价:迭代初始状态固定,迭代初始输出与期望初始输出 7 新江工业大学硕士学位论文 一致,即毛( 0 ) = 石( 0 ) ,g i ( o ) 2 0 ( k = o ,1 ,) ,工( o ) 为某给定的初始状态。 4 学习律 定义输出误差 e k ( ,) = y d ( f ) 一) ( f ) ( 1 - 1 2 ) 由当前控制输a u 。( d 和输出误差e 。( f ) 构成学习律产生下一次迭代时的控制 输入 u k + l ( ,) = l ( u i ( 咖e i o ”( i - 1 3 ) 式中l 为给定映射,大多取为线性函数;也常常取初始控制输入( f ) = o ( t 【o , t 】) 。学习律( 卜1 3 ) 的常见形式有 u k + l ( f ) = “t o ) + 气o ) ( 1 - 1 4 ) “( ,) = ( ,) + r 吼( f ) ( 1 - 1 5 ) l _ 。 u k + l p ) = u k ( t ) + z e a t ) + wl 吼( s ) 凼+ r 气o ) ( 1 - 1 6 ) i 其中,式( 卜1 4 ) 为p 型学习律,式( 卜1 5 ) 为d 型学习律,式( 1 - 1 6 ) 为组 合型学习律( p d 型,p i 型,p i d 型学习律) 的一般形式,上、甲、r 为定常增益矩 阵。 5 干扰环境 在第k 次迭代时,记m ( ,) 为状态干扰向量,v k ( t ) 为输出干扰向量。它们或为 确定性干扰。或为随机干扰。在干扰环境中重复运行的控制系统( 1 - 9 ) 可表示为 r 。 x k ( t ) = 巾,u ) ,坼( f ) ,( r ) 】( 1 - 1 7 ) 帆( t ) = g t ,瓢( f ) ,( f ) ,叱( ,) 】 实际中,迭代学习控制系统受到的干扰除了状态和输出干扰外,还包括初态 偏移、输入扰动、期望轨迹变动以及学习区间偏移等等。 迭代学习控制所研究的问题是学习律、初始状态、期望输出、动态方程结构、 参数、学习方法与学习收敛性、稳定性、鲁棒性及学习收敛速度的关系。学习目 标是最快地找到合适的控制甜,使输出跟踪误差趋于最小。 1 5 课题的研究背景和意义 初始条件问题是迭代学习控制的一个基本问题,常见的初始条件有两种形式: 1 、迭代初态与期望初态一致( 我们称初态是严格重复的) ;2 ,迭代初态固定( 我 们称初态是重复的) 。由于在很多情况下,期望初态是未知的,而迭代初态却是固 定的,并且可以任意设置,实现相对容易,因此研究第二种形式的初始条件问题 s 浙江工业大学硕士学位论文 更具有实际意义。目前,关于迭代学习控制技术在实际中的应用已有许多报道, 例如化工蚵歇过程。但是涉及时滞系统的研究却不多,而时延现象在实际受控过 程中普遍存在,所以研究时滞系统的迭代学习控制是有实际意义的。 在已发表的关于初始条件问题的文献中,文p 1 和文】针对任意固定初态下的 受控对象,讨论迭代学习律在增加初始误差修正因子后的收敛性问题。文【5 】针对 一类具有相对阶的非线性系统,讨论带有初始误差修正的迭代学习控制算法的收 敛性问题。在有关时滞系统的研究结果中,文| 4 1 针对一类具有相对阶的时滞系统, 讨论迭代学习律的收敛性问题。文【l 卅针对一类非线性时滞系统,讨论高阶迭代学 习律的收敛性问题。另外,文1 1 4 针对一类具有相对阶的非线性系统,讨论闭环迭 代学习律的收敛性问题。文【l5 】和文u 6 j 针对一类非线性系统,讨论采样迭代学习律 的收敛性问题。文 2 0 2 2 1 针对一类非线性时滞系统,讨论采样迭代学习律的收敛性 问题。文【1 2 l 和文【1 3 】针对一类非线性系统,讨论预期迭代学习律的收敛性问题。 1 6 本文的主要研究工作及各章节的安排 本论文主要针对一类具有相对阶的对滞系统,讨论几种形式的迭代学习控制 算法,证明该算法的收敛性,并给出这类学习系统收敛时的充分条件。 。 本文共六章,各章节安排如下: 第一章本章简单介绍了迭代学习控制的一些基本内容,包括其基本思想, 特点问题的数学描述,以及该技术目前的发展和研究现状。然后说明本文的研究 背景和意义。 第二章本章讨论具有相对阶和初始修正的时滞系统迭代学习控制算法,并 给出这类学习系统的输出极限轨迹。理论分析表明,该学习算法可以在指定时刻 之后实现对给定期望轨迹的完全跟踪。 第三章本章探讨具有相对阶的非线性时滞系统闭环迭代学习控制算法并 给出这类学习系统的输出极限轨迹。文中分别针对d 型、p d 型、p i d 型学习律以及 带初始修正的d 型学习律进行讨论。 第四章本章针对具有相对阶的非线性时滞系统,引入采样迭代学习控制算 法,并证明了该算法的鲁棒收敛性。仿真结果进一步表明算法的有效性。 第五章本章结合预期控制和迭代学习控制,提出具有相对阶的非线性时滞 系统预期迭代学习控制算法,并证明了该算法的收敛性。 第六章本章对本文所做的工作进行总结,对还未解决的问题提出构想,希 望能在今后做出进一步的工作。 9 浙江工业大学硕士学位论文 第二章具初始修正的时滞系统迭代学习控制 2 1 引言 在设计迭代学习控制器时,为了保证算法的收敛性,常对系统的初态限定一 定的条件。目前已发表的文献大多要求每次迭代的初态与期望轨迹对应的初态严 格一致。然而,实际的重复定位操作往往会引起迭代初态相对于期望初态的偏移 。本章针对一类具有相对阶的时滞系统,通过在常规迭代学习律中增加初始误 差修正成份,讨论该算法的收敛性,并给出这类系统的输出极限轨迹。文中针对 线性和非线性时滞系统分别进行讨论。 2 2 具相对阶的线性时滞系统 考虑一类线性时滞系统 f x ( f ) = 4 x ( f f f ) + 觑( r ) ,- o ) ,( f ) = c x ( t ) ,t 【o ,t 】 ( 2 1 ) ( 2 2 ) 工( 0 = f ( f ) ,t - 4 f ,0 】 ( 2 - 3 ) 其中,x r 4 ,砧= ,甜,r r ,y = 队,靠,e 胪分别是系统的状态,控 制和输出向量。矩阵a 尺,b = 6 l ,6 ,】r ”,c = 【0 ,】7 r f ( r ) 为初始状态函数,系统重复运行在有限的时间区间 o ,明上。 记口为纯时滞运算符1 6 - 7 1 ,则对于函数x ( ) 有 村 o x ( t ) = x ( t f ) ,p f ,f 】 并且对于复合函数( ) 有 耕 o f ( x ( t ) ) = f ( a x ( t ) ) = f ( x ( t f ) ) i t - - i ,t 】 很明显的,叮有以下性质【5 j ,式,岛芝1 盯7 = 酊“,仃o = l ,口盯b = 矿o i u ,鸭= 一盯b 对于具有相对阶的系统( 2 - 1 ) - ( 2 3 ) ,存在向量= “,以) ,使下式成 立,此时x 丑4 ,1 s p s r ,1 s g 晰 1 0 浙江工业大学硕士学位论文 c q b 。= 0 c q a b p = 0 ,o s , q 4 爿k 以b p = 0 ,o ,- 一2 , 勺以t 。2o ,o ,k 一- ,( + + k t o ) d # 乏:! :j = l j l k 4 产。6 l 舻。6 ,j 托u = 白4 i 矿”。石,o ,s 朋- 1 = z e t a , , 钆盯”k 工+ q 舻“b u 2 3 线性时滞系统的迭代学习控制器设计 对于系统( 2 1 ) 一( 2 3 ) ,采用带有初始误差修正的学习律 u k + i ( ,) = ( f ) + f ( 炸( f ) ) ( 均( d 一) 0 9 ( ,) ) 一r o 咯( ,) ) 篓呜r 加缈饥q 0 ) 胪( 。” ; 茗啄r 加) 酬饥一( o ) 一1 0 ) ) ( 2 - 4 ) 其中,钆 :【o ,t - - # r ,l q s 燃,满足 r 脚西= - 岛r 弘涵、。= 毪z 式中,t e o ,刀,k = o ,1 ,2 。为迭代次数,儿m ( f ) = 睇一涵( r ) ,靠一“( r ) 】, 见9 ( f ) = 舶“( f ) ,j “1 r ,r 魄( f ) ) r “。为学习增益矩阵。 浙江工业大学硕士学位论文 对系统( 2 1 ) ( 2 3 ) 作如下假设: a i ) 对于期望轨迹) ,。( f ) ,存在唯一的控制输入( f ) 使得系统的输出跟踪期望轨 迹,即 , 为( f ) = x d ( t - i 3 ) + b u d ( t ) ( 2 5 ) y d ( t ) = c x d ( t ) ,t 【0 , t 】 ( 2 ,6 ) x d ( t ) = 厶( r ) ,e 【- - 1 3 ,0 】 ( 2 - 7 ) a 2 ) 当工肜时,系统( 2 1 ) - ( 2 3 ) 具有相对阶,即存在向量f = 讹,以) 。 a 3 ) 当, o ,刀时,期望轨迹乃( ,) = 一( ,) ,一( ,) 】7 是岛阶连续可导的。 定理l :对于系统( 2 一1 ) - ( 2 - 3 ) 满足假设a 1 ) 一a 3 ) ,如果学习律( 2 - 4 ) 中 的学习增益矩阵满足条件 8 ,一r o 气( r ) ) d i i p 1 ( 2 8 ) 并且,在每次迭代的开始时满足条件 l l c d ( t ) 一氕( ,s ,r - t f ,o 】( 2 - 9 ) 则当_ i 斗时,误差u d ( t ) - u i ( t ) ,x a ( t ) - x k ( t ) ,y d ( t ) - y , ( t ) 一致收敛于一类关 于的有界函数。其中,当f 【o ,t 】时,此极限轨迹为 ,“q 一o t j 虻( f ) = 凡一( f ) 一二咭纸 ( s ) 西) 一气o ) 一,。 ( o ) ) ( 2 - 1 0 ) 证明:取一控制输入“( f ) ,使系统初态位于x o 时的输出轨迹为) ,+ o ) 。记 = ”- - u i ,l = r ( y k ) , e ( x ) = 白 矿”z t t = oi 1 0 岛4 气一广”k 石 i i = 0 j 一柚 对式( 2 一l o ) 两端取乒乞阶导数,然后代入式( 2 4 ) ,可得 “:+ l = 域- ( u m - u k ) = 虻一l 一儿 ) = 以一l ( e ( 工+ ) + d 甜一e ( 以) 一d ) = u l o ) a u :一r a e ( x 。) 一e ( 黾) ) 对上式两端取范数,并记6 r = 慨肌由式( 2 8 ) 可得 i | “:。8 d i 越+ 6 r 8 e o ) 一e ( 黾) 9 ( 2 1 1 ) 1 2 浙江工业大学硕士学位论文 另外的,记表达式白以4 。盯枷”x 中盯铲“+ k 膏前面系数的最大值 i - ol 。- 0 为,可得 h e ( x - ) 一e 瓴) 卜 再根据硝= x - x k ,可得 城= 城( o ) + 4 馘( s f f ) + b a “:协 ol 蝴 对上式两端取范数,记- - i b i i ,由式( 2 9 ) 可得 k + 晦4 州小蚓陋 记占 f ,l r ) ,当t e o ,占】时,可得 肺o 一占) i 陋= 删白( s ) 一六( s ) 8 出嘭 当r ( 占,t 】时,可得 所以当f o ,明时,有 t, 1 k ( s 一占) 陋z 西f + j l k o ) 怯 记以= 8 。,o g i l ,岛- 1 + 1 2 丸,6 2 = ( 1 + ,) 以,则有 4 8 6 l 屯+ ( 岛l k 8 + 8 d 凼 应用b e l i m a n - g r o n w a l i 定理,可得 4 4 6 1 e 婶+ p 吣“。忪以0 凼 同理,g r r ,以,f ) ,当,【o ,门时,可得 ( 2 1 2 ) 一 一 o 城 城 g 乙m g 己由 凼 吖川o + 也 v i凼 0嘶 q删川0 +出 0 磊 一 以 o 川噜 = 凼 0 一s “ 缸 ,九川o 浙江

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论