




已阅读5页,还剩68页未读, 继续免费阅读
(控制理论与控制工程专业论文)迭代学习控制的分析与应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
顿卜论文 迭代学习挣制的分析。,崩用 摘要 迭代学习控制是一种新兴控制技术,非常适合于具有重复运动特性鹄被控对 象,可以实现有限时间区间上任意精度的跟踪。论文根据当前迭代学习控制的研究 现状,讨论了迭代学习控制的收敛性、鲁捧性、初始状态及工程应用等同题。主 要研究内容如下: 1 研究了迭代学习律的收敛性和鲁捧性问题。针对丌闭环p 型、d 型学习律 以及开环p i d 型学习律作了收敛性和鲁棒性证明,给出了收敛条件。 2 基于2 d 线性系统理论研究了迭代学习控制的收敛性问题。首先针对线性 离散系统提出了迭代学习算法。针对线性离散时滞系统讨论了一种算法,给出了 收敛的充要条件。 3 研究了迭代学习控制的初态问题。讨论了具有初态学习和任意初态两种情 况下的迭代学习律的收敛性和鲁棒性问题。 4 以具体的工程实例研究了迭代学习控制理论的工程应用问题。讨论了迭代 学习控制在机器人系统以及有源滤波器的电流跟踪控制中的应用。 关键词:迭代学习控制,收敛性,鲁棒性,2 - - d 理论,初态问题,机器人 硕l 论文 迭代学习控制的分析与廊用 a b s t r a c t i t e r a f i v el e a r n i n gc o n t r o l ( i l c ) i san e wa d d i t i o nt ot h ec o n t r o lt e c h n i q u e s i tc a l l i m p r o v et h et r a c k i n gp e r f o r m a n c ea n dt r a n s i e n tr e s p o n s eo fc o n t r o ls y s t e m sw h i c h p e r f o r m st h es a m et a s k si naf i n i t et i m ei n t e r v a l a c c o r d i n gt ot h er e s e a r c ha c t u a l i t y , t h i s d i s s e r t a t i o ns t u d i e dp r o b l e m so nc o n v e r g e n c e ,r o b u s t n e s s ,i n i t i a ls t a t ea n dt h e a p p l i c a t i o n o fi t e r a t i v e l e a r n i n gc o n t r 0 1 t h e m a i nc o n t e n t sa n dr e s u l t si nt h i s d i s s e r t a t i o na r ea sf o l l o w s 1 t h e c o n v e r g e n c ec o n d i t i o n so ft h e b a s i ci l ca l g o r i t h ma r eg i v e n t h e c o n v e r g e n c ea n dr o b u s t n e s so fo p e n - c l o s ed - t y p e ,p t y p ea n do p e np i d t y p el e a r n i n g l a wa r ep r o v e d , 2 s t u d i e dt h ec o n v e r g e n c eo fi l cb a s e do nt h e2 - dt h e o r y al e a r n i n gl a wi s p r o p o s e df o rac l a s so fl i n e a rd i s c r e t es y s t e m s al e a r n i n gl a wi ss t u d i e df o rac l a s so f l i n e a rd i s c r e t es y s t e m sw i t hd e l a y s 3 ,t h ei n i t i a ls t a t ep r o b l e m so fi l ca r es t u d i e d t w ol e a r n i n gl a w sw i t hi n i t i a ls l a t e l e a r n i n ga n dr a n d o mi n i t i a ls t a t e sa r ep r o p o s e d ,a n dt h e i rc o n v e r g e n c ea n dr o b u s t n e s s a r ep r o v e d 4 i t e r a t i v el e a r n i n gc o n t r o la p p l i c a t i o ni s i n v e s t i g a t e db yp r o j e c te x a m p l e s t h e a p p l i c a t i o n so fr e r a t i v el e a r n i n gc o n t r o li nr o b o ts y s t e m sa n dp o w e rf i t e rs y s t e ma r e s t u d i e d k e y w o r d s :i t e r a t i v el e a r n i n gc o n t r o l ,c o n v e r g e n c e ,r o b u s t n e s s ,2 - dt h e o r y , i n i t i a ls t a t e p r o b l e m ,r o b o t j j 紫7 6 3 2 7 7 声明 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在 本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发 表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学 历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均 已在论文中作了明确的说明。 研究生签名:岱翅幽山d 年f 月歹日 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅 或上网公布本学位论文的全部或部分内容,可以向有关部门或机构送 交并授权其保存、借阅或上网公布本学位论文的全部或部分内容。对 于保密论文,按保密的有关规定和程序处理。 研究生签名:j 美盆l 明一a 哆年6 月曰 硕卜论立送代学习挣制的分析j l , ;i 用 l 绪论 本章首先论述了迭代学习控制理论的提出、发展和数学描述,然后综述了迭 代学习控制理论的研究内容及现状,最后介绍了本文的主要工作。 i 1 引言 迄今为止,自动控制科学经历了经典控制理论、现代控制理论及大系统理论 等阶段的发展,逐渐形成了完整的理论体系,这不仅推动了控制科学与技术的发 展,而且对其它科学领域也产生了很大的影响,为人类社会带来了巨大的利益。 但是,应该看到,不论是经典控制理论还是现代控制理论以及大系统理论,其分 析、综合和设计都是建立在严格和精确的数学模型基础之上的。这实际上是一种 基于模型的系统综合方法,浚方法往往考虑线性模型结构,忽略系统中的非线性 因素,以这种方法进行控制系统综合设计的步骤是先建模,再利用数学模型设计 控制器。一般而言,它把系统设计分成建模和控制器设计两个任务进行。由此, 其控制器结构与参数依赖于受控对象的模型结构和参数。 在科学技术与生产力高度发展的今天,人们对大规模、复杂和不确定系统实 行自动控制的要求不断提高,而且实际系统大量存在非线性、时变、不确定、时 滞及强耦合特性等,一般无法获得精确的数学模型。因而,用基于模型的系统综 合方法来解决这类问题时,控制系统可能变得十分复杂,而且增加了设备的初始 投资和维修费用,并且降低了系统的可靠性。而无模型的系统综合方法能很好地 解决这类问题,由于该方法只利用系统的输入输出信息来设计控制器,其控制结 构不依赖于受控对象动力学特性,它本质上适用于非线性控制系统。因此,对于 系统中固有的非线性因素,这类方法可获得更好的控制效果。如果利用系统的历 史控制经验,可以让控制器本身具有某种“智能”,使它在控制过程中不断完善自 己,使控制效果越来越好,这是一种具有“学习”能力的控制器。 学习是人类的基本智能行为之一。让控制器具有某种“智能”,一直是控制界 梦寐以求的个目标。自从f u l 2 3 ) 在1 9 7 1 年提出学习控制的概念后,对学习控制的 研究一直很活跃。几十年来,学习控制技术随着与其相关的学科及应用领域,如 计算机技术、人工智能、神经网络、模糊控制、机器人等的发展而发展,如今学 习控制技术在控割界占有相当重要的地位。 智能控制大致可分为基于人工智能的和基于数学描述的两大类。前者以专家 控制为代表,后者有如神经网络控制器、基于小脑模型的联想记忆学习控制器、 迭代学习控制、重复学习控制及自动机等。在基于数学描述的智能控制器中又可 硕士论文退代学习控制的分析与应用 分为基于参数的和基于品质的两大类。前者需要在线辨识被控对象的参数,后者 不需要在线辨识被控对象的参数,而是根据控制的效果,即“品质”来修正控制 器参数。 迭代学习控截是一种基于品质的智能控制方法。7 0 年代后期,日本学者 u c h i y a r n a 5 8 】针对高速运行的机械手,提出了迭代学习控制的基本思想:不断重复 一个轨迹,并以此修正控制律,能达到较好韵控制效果。后来a r i m o t o 等入发展了 u c h i y a m a 的思想,于1 9 8 4 年提出了迭代学习控f l ;l j ( i t e r a t i v el e a r n i n gc o n t r o l ,简称 i l q 的概念【训,建立了实用的算法并扶理论上证明了这种算法钓可行性,开剑了 一个新的研究方向。 迭代学习控制,顾名思义,就是通过反复的迭代修正柬达到某种控制目标。 迭代学习控制是智能控制领域中具有严格数学描述的一个分支,是集人工智能与 自动控制于一体的新型控制技术。适合于诸如工业机器人那样的具有重复运动性 质的被控对象,它的目标是实现有限时l 嘲区间上的完全跟踪任务。该控制过程是 一种仿效人类的学习行为提取经验的过程,采用的是一神“在重复中学习”的策 略,它以系统的实际输出与期望输出之间的偏差修正不理想的控制信号,产生新 的控制信号,使得系统的跟踪性能得以提高,如此迭代若干次后,系统的输出就 会逼近理想的期望轨迹。和鲁棒控制一样,迭代学习控制也能处理实际系统中的 不确定性,但它能实现完全跟踪,控制器形式更为简单且需要较少的先验知识, 并且能以非常简单的方式处理不确定度相当高的非线性强耦合动态系统。由于迭 代学习算法极为简单,而且只需较少的先验知识,又能解决比较复杂的问题,故 引起了广泛的关注。 迭代学习控制早期的研究集中在新算法的构成及其特性的分析,把迭代学习 控制作为离线计算方法,目标是在一定时间间隔内按期望输出找到期望输入控制, 主要由以下三个基本元素构成:学习控制适用的系统、输入的迭代控制算法及保 证算法收敛的条件。自从9 0 年代以来,迭代学习控制的研究出现了新的飞跃,自 适应控制、模糊控制、神经网络控制、预测控制等先进的控制技术越来越多地运 用于迭代学习控制,获得了用单一控制方式难以实现的期望特性,还可以克服传 统控制方法所固有的特性设计方面的缺陷。 迭代学习控制理论的发展,对其它控制方法的研究和应用,如模型参考自适 应控制、变结构控制、解耦控制、非线性p i d 以及最优控制等,具有重要的理论 意义。迭代学习控制在理论上的研究也正在向不确定菲线性系统、离散系统、2 一 d 系统、广义系统等方面发展。同时,迭代学习控制与非线性系统理论、神经网 络、模糊控制等理论的发展相结合。必将对控戳理论的发展与应用产,主积极的推 动作用。 硕士论文 迭代学习控制的分析与心用 1 2 迭代学习控制系统的描述 迭代学习控制是智能控制领域中具有严格数学描述的一个分支。迭代学 - j 控 制过程可具体的从以下几个方面描述: 1 可重复受控对象 考虑如下的连续受控系统: j 膏( f ) 5 厂( x ( ,) ,“( f ) ,)( 1 2 1 ) iy ( f ) = g ( x ( f ) ,“( f ) ,f ) 其中工r ”,y r “,“r 分别为系统的状态向量、输出向量及控制向量, f ,g 为相应维数的向量函数,其结构与参数均未知。假设系统在有限h , j - f i j 区间 f e ot 上重复运行,如果向量函数f 、g 在每一次重复运行时所表示的函数关 系不变,则称由式( 1 2 ,1 ) 描述的系统动力学特性具有可重复性。用k = 0 ,1 ,2 “, 表示重复操作次数( 也称为迭代次数) ,并以( r ) ,儿( r ) ,( r ) 分别表示第k 次 重复操作时系统的状态向量、输出向量和控制向量,刚可重复的控制系统可表示 为: 肛( ) 2f ( x t ( 7 ) ,“t ( ) ,幻( 1 2 2 ) l y t ( f ) = g ( x ( f ) ,u i ( f ) ,r ) 对于离散控制系统: x ( h 1 ) 。,( x ( ) ,“( r ) ,) ( 1 2 ,3 ) i _ y ( f ) = g ( x ( f ) ,“( f ) ,f ) 假设系统在有限离散时间区间f 0 1 ,2 ,7 上重复运行,则: 卜( h 1 ) 2 f ( x 女( ) ,“t ( ) ,)( 1 2 4 ) 【y ( f ) = g ( x ( r ) ,“t ( ,) ,) 2 控制目标 具体地说,迭代学习控制问题就是,对于一个被控系统( 1 2 1 ) ,给定时间 区间, 0 t 上可达的期望输出轨迹儿( ,) 及期望初态x d ( o ) ,寻找一控制输入 “( r ) ,使得在该控制输入作用下系统的输出y ( t ) 在区间, 0t 上尽可能地跟踪 上期望轨迹y a ( t ) 。 3 迭代学习律 迭代学习控制是通过函数迭代方法寻找“( ,) 的,即构造用于修正控制的学习 律,使得它产生一函数序列f 地( f ) ) 并收敛于“0 ) 。学习律的典型形式为: h + i ( f ) = 1 , 1 ( f ) + u ( e ( 晚,) ( 1 2 5 ) 硕十论义退代学习摔制的分析t j l f , i 用 e k ( ,) = y j ( f ) 一儿( r ) ( 1 2 6 ) 其中y 。( f ) 为输入坼( f ) 时系统产生的输出,u 为线性或非线性算子。这种控制 技术之所以被称为是一种学习控制是因为它类似于通过重复达到期望行为的学习 方式。u 。( f ) 实际上可以被看作是第次迭代以前( 不包括第k 次) 积累下来的控制 经验,而u ( 唧( ,) f ) 则是第k 次迭代时获得的有效信息,用以修正以往的控制经验 魄o ) 。这星+ ,8 ) 作为以往控制经验与修正信息的累加需要存储在记忆系统中 作为下一次的控制输入。这种学习控制称为开环迭代学习控制。 开环迭代学习控制的基本结构如图1 1 。 图l1 开环迭代学习控制的基本结构 若将学习律改为如下形式: 砜+ i o ) = ( t ) + u ( p ( f ) ,) ( 1 2 7 ) 显然,u k ( r ) 实际上可以被看作是第k 次迭代以前( 包括第k 次) 积累下来的控 制经验,这就是闭环迭代学习控制。 闭环迭代学习控制的基本结构如图1 2 。 图1 2 闭环迭代学习控制的基本结构 开环迭代学习控制律采用的是一种离线的计算方法,因而对系统的计算要求 不高,但由于它没有考虑当次操作时系统的输出误差,故控制效果不如闭环迭代 硕上论文迭代学习控制的分析与碰用 学习控制好。但闭环迭代学习控制存在部分在线计算量,对系统提出了更高的要 求。 4 停止条件 在每一次重复操作结束时,需要检验停止条件。若停止条件成立,则停止迭 代运行。常见的停止条件为: 儿( f ) 一y ( f 确 o ) f 6 1 0 ,7 式中l l 为上的一种范数。它具有一下性质: 性质l 对于常向量c e r ”,有 | c | l 。= i | c l i ; 性质2 对于向量函数h : o ,r 】斗r ”,有肛儿8 r u p 肛f j g ”忙忆; e 【u ,1 性质3 对于向量函数f ,h :( o ,t 】寸只1 。如果 堡主堡苎 堡丛兰望塑型塑! ! 堑! 生旦 a ( f ) :i :。叫圳,( z ) d r ,那么当a a 时,惭忆s 警4 删。;特烈地, 当。:o 时,。l l 。 引理2 1 ,l ( b e l l m a n g r o n w a l l 弓i 理) x q ) ,y ( f ) 都是 0 ,3 上的实值连续 函数且口0 ,并满足x ( f ) c + ( 甜( r ) + b y ( r ) ) d r 贝o :x ( f ) 蔓c e a t + i o ea ( t - r ) b y ( f ) d f 弓 理2 1 2 设矩阵a r ”,是r 阶单位矩阵,则存在r m 阶矩阵i _ 使 p ( ,一r a ) 1 的充要条件为r a n k ( a ) = ,;存在,聊阶矩阵f 使p ( 。一a t ) o ,使得 f 厂o , ) 一厂o ,x 2 ) t l l x - x 2 f i v ,【o ,】 v x 1x :r “ ( 2 ) 芏( 0 ) = x d ( o ) 女= 0 ,l ,2 - 一 ( 3 ) 在, o ,t 上c ( t ) 存在,且彳( ,) ,b ( ,) ,d ( 1 ) 有界 则取迭代学习律( 2 2 4 ) 使得对于任意给定鸽初始控告4 输入( ,) ,输出轨迹 一致收敛于期望轨迹,即儿( f ) 一y j ( t ) ( k _ o 。) 的充分条件为: p ( - r ( f ) c ( f ) b 0 ) ) 1 ( vt 【o ,t 1 ) 2 2 5 ) 证明过程参见文献 2 。 由引理2 1 、2 知,存在r 使得p ( f r c b ) 下面的定理给出闭环d 型学习律的收敛条件。 定理2 。2 2 ( 2 】设被控系统的动态方程如式( 2 2 1 ) ,且在f “o ,t 】上除满 足定理2 2 1 中的条件( 1 ) 一( 3 ) 外,还满足: ( 4 ) ,+ r ( t ) c ( t ) b ( t ) ,v ,【0 ,tj 存在逆矩阵 取迭代学习律( 2 2 6 ) 使得对于任意给定的初始控制输入( ,) ,输出轨迹一 致收敛于期望轨迹,即儿( ,) - - ) 儿( ,) ( k 寸o o ) 的充分条件为: p i ( i + r ( f ) c ( f ) b ( f ) ) - 1 】 l( v , o ,】) ( 2 2 7 ) 证明过程参见文献 2 。 2 2 2p 型学习律 p 型学习律不要求误差信号的微分形式,具有在物理上易于实现等优点,引起 了广泛的注意。 1 开环p 型学习律 预士论文 迭代学习控制的分析与应用 设被控系统的动态方程为: 膏( ) = 邝,x ( ) ,乱( ) )( 2 2 8 ) iy ( f ) = g ( t ,x ( r ) ) + d ( t ) u ( f ) 要求在t “o ,丁 内系统的输出y ( ,) 精确地跟踪系统期望输出y d ( t ) ,在第k 次 运行时,系统的动态方程表示为: 燃yt g t 蒜擀d ”( t ) u 觯, z 。, i。( ) =( ,工。( f ) ) +女( ,) 输出误差为: e ( t ) = y a ( r ) 一儿( f ) ( 2 2 1 0 ) 开环p 型学习律为: “( t ) = “女( r ) + f ( t ) e l ( t ) ( 2 2 1 1 ) 下面的定理给出开环p 型学习律的收敛条件。 定理2 2 3 2 】设被控系统的动态方程如式( 2 2 8 ) ,且在t 0 ,t 中满足 下列条件: ( 1 ) i i f ( t ,五,u ) - f ( t ,x 2 ,“) 0 f ( t ,“) i i 一一x 20 vt o ,7 1 】v x ,x :,“ ( 2 ) l i f ( t ,x ,“1 ) 一厂( f ,x ,h 2 ) 1 1 m0 l 一“2 1 1 vl 【o ,r v “l ,“2 ,x ( 3 ) 耳( 0 ) = 勤( o )k = 0 ,l ,2 则取迭代学习律( 2 2 1 1 ) 使得对于任意给定的初始控制输入“。( r ) ,输出轨 迹一致收敛于期望轨迹,即y k ( t ) 斗儿( ,) ( k - - - ) o o ) 的充分条件为: p ( ,一r ( f ) d ( ) ) 1 ( vt 【0 ,t 】)( 2 2 1 2 ) 证明过程参见文献 2 。 由引理2 1 2 知,存在r 使得p ( ,- f d ) 1 的充要条件为d 列满秩,故只有 d 列满秩时,才可利用此定理。对于d 非列满秩时的情况,参考文献 1 具有类似 的定理。 2 闭环p 型学习律 设被控系统的动态方程仍为式( 2 2 8 ) 所示的系统,取学习律为闭环p 型学 习律: “1 ( ) = 群i ( ) + r ( t ) e ( f ) ( 2 2 1 3 ) 下面的定理给出闭环p 型学习律的收敛条件。 定理2 2 4 嘲 设被控系统的动态方程如式( 2 2 8 ) ,且在f i o ,丁】上除满 足定理2 2 3 中的条件( 1 ) ( 3 ) 外,还满足: ( 4 ) i + r ( t ) d ( t ) ,vt ( 0 ,t 】存在逆矩阵。 取迭代学习律( 2 2 1 3 ) 使得对于任意给定的初始控制输入( f ) ,输出轨迹 硕t 论义 迭代学习控制的分析0 成用 一致收敛于期望轨迹,即y k ( t ) - - ) y a ( t ) ( k 寸。o ) 的充分条件为: p 【( ,+ r ( ) d ( ,”_ 】 ,若对v f 【o 列有i l ,一f i ( ,) c ( ) 8 ( ,) 川 ,+ r :( ,) c ( ,) 口( ,) r 1 1 - 芦 钆) ( 2 3 6 ) 同理:f i x 。+ 。( r ,| | 。r + 。! :j i ! :;孚 将式( 2 3 ,6 ) ( 2 3 7 ) 代八式( 2 3 5 ) 得: ( 1 6 ) 【f “。“( f ) ( 1 。口i l “。( f ) l l 。+ c 靴硼嘲m 警小盹屯警 c = p 2 ( b r i + b r 2 ) ( 钆( + 丁饥) + h ) 显然存在充分大的 ,使得当岛见声 0 ,旦 6 。) ( 2 3 1 4 ) 将式( 2 3 1 3 ) ( 2 3 1 4 ) 代入式( 2 3 1 2 ) 得: ( 1 一矗) 0 群。+ 。( f ) 。g 甜。( ) 。+ c 其中a = p l p z + p 2 懒警m 编靠k 警, c = p 2 ( 6 r i + b r2 ) ( 6 。+ t b fb 。) 显然存在充分大的五,使得当日岛 o 南 1 从而:l i m l a “t ( f ) n f i 有界- 硕论义迭代学习控制的分析与庶用 进一步地,由s u p 忪“。( f ) f | p ”忪“。( t ) i i 。知: “:0r 1 熙州s u 吲p ( f ) ”! 圳“删i 。e ”丁老有界 从而j ; 寸o o 时,a u 。( f ) 在【o 州上一致有界,i 捅e k ( t ) 在 o 明上一致有界。 证毕 注: 1 由定理的证明过程可知,迭代学习算法的收敛性不受不确定性、扰动等因 素的影响,因此算法具有鲁棒性。但e k ( t ) 直接受这些因素的影响,其界是一个与6 。、 6 等有关的数。 2 当不存在不确定性和扰动,即b 。、瓯均为零时,显然e 。( f ) 呻0 ( , 0 ”) , 可实现完全收敛。 3 当r :( ,) ;0 时,学习律退化为单纯的开环p 型学习律;当r ,( ,) ;0 时,学 习律退化为单纯的闭环p 型学习律。因此,上述定理的证明过程包含了对开环、 闭环p 型学习律的鲁棒性和收敛性证明。 2 3 3 仿真研究 例1 。d 型学习律的仿真。 考虑下面具有不确定性和扰动的s i s o 线性定常系统: f 量( f ) = a x ( t ) + b u ( f ) 4 - w ( f ) i y ( t ) = c x ( t ) + v ( t ) 其中: 爿= 阡- :3 b = 2 w ( f ) ,v ( t ) 分别为 0 5 ,0 5 和 一o 2 ,0 2 上的随机扰动。 给定输出期望轨迹:y 。( f ) = s i n ( 2 z r f ) t 【0 ,j l 。 取“o ( ,) = 0 ( f o ,1 】) ,( o ) = 0 ( k = 0 ,l ,) 。 对迭代轴k 的跟踪误差采用均方根形式。 1 取r = o 2 ,f := 0 5 ,学习律为开闭环d 型学习律。跟踪误差如图2 1 。 由图可以看出。在存在不确定性和扰动时,跟踪误差在2 次迭代后稳定在0 2 左右,因此算法具有鲁棒性;在= 2 时,在时间轴上的误差非常小( i p ( ,) i o ,1 2 ) , 因此算法对扰动起到了很好的抑制作用。无扰动时,在r = 2 时即可认为实现完全 跟踪( e = 0 0 0 6 0 0 1 ) ,因此算法是收敛的,且收敛速度较快。 婴:主堡兰垄垡兰翌丝型塑坌堑兰坐旦 ( a ) 有扰动时对迭代轴k 的误著 ( b ) 有扰动时对时间轴t 的误筹( = 2 ) ( c ) 无扰动时对迭代轴k 的误著( d ) 无扰动时对时间轴,的误芹( k = 2 ) 图21开剐环d 型学习律仿真的跟踪误著曲线 2 取f 。= 0 2 ,f ,一0 ,学习律为开环d 型学习律。跟踪误差如图2 2 。 由于f ,= o ,因此算法退化为纯粹的开环d 型学习律。由图可以看出,在存 在不确定性和扰动时,跟踪误差在3 次迭代后稳定在0 ,2 左右,因此算法具有鲁 棒性:在t = 2 时,在时间轴上的误差相对开闭环算法较大( p ( f ) l 0 4 ) ,因此算 法对扰动的抑制作用不如开闭环算法。无扰动时,在k = 2 时,e = 0 0 3 8 ,在k = 4 时, e = o 0 0 6 1 0 0 1 ,因此算法是收敛的,但收敛速度不如开闭环算法。 硕1 “论文选代学习摔制的分析与成用 c a ) 有扰动时对迭代轴的误差( b ) 有扰动时对时间牟i | f 的误筹( k = 2 ) ( c ) 无扰动时对迭代轴k 的误差( d ) 无扰动时对时间轴r 的误差( k = 2 ) 图2 2 开环d 型学习律仿真的跟踪误差曲线 3 取r 。= 0 ,1 1 ,= 0 5 ,学习律为闭环d 型学习律。跟踪误差如图2 3 。 由于r = o ,因此算法退化为纯粹的闭环d 型学习律。由图可以看出当存在 不确定性和扰动时,跟踪误差在2 次迭代后稳定在0 1 左右,因此算法具有一定 的鲁棒性:在k = 2 时,在时间轴上韵误差相对开环算法较小( p ( f 强 o 1 ) ,因此 算法对扰动的抑制作用较好。当不存在扰动时,在k = 2 时,e = 00 2 5 ,在k = 3 时 e = o 0 0 8 1 o 0 1 ,因此算法是收敛的虽然收敛速度不如开闭环算法,但要好于歼 环算法。 硕士论文迭代学习控制的分析弓应用 ( 8 ) 育扰动时对迭代轴k 的误差 ( b ) 有扰动时对时间轴,的误差( 女= 2 ) ( c ) 无扰动时对迭代轴k 的误荠( d ) 无扰动时对时间轴t 的误莘( t = 2 ) 图2 3 闭环d 掣学习律仿真的跟踪误差曲线 通过以上仿真可以看出,三种结构的d 型学习律均能实现收敛在存在不确 定性和扰动时,算法也能够收敛到期望轨迹的一个有界临域内,因此算法具有鲁 棒性。但是三种结构的d 型学习律相比较,开闭环算法和闭环算法在对扰动的抑 制方面显然好于开环算法;而在收敛速度方面,丌闭环算法相对来说最快,丌环 算法最慢,而闭环算法介于两者之间。因此,由于开闭环算法综合利用了当前和 以前的系统信息,从而算法的整体性能要好于开环算法和闭环算法。 硕十论文迭代学习控制的分析与应用 例2 p 型学习律的仿真。 考虑下面具有不确定性和扰动的s i s o 线性定常系统: i 膏( f ) = a x ( t ) + b u ( f ) + w ( f ) 【y ( f ) = c x ( t ) + d u ( f ) + v ( f ) 其中: 彳= 彳- ;3 曰= : c = r ,。, 。= c - , _ 1 ,( f ) ,v ( f ) 分别为 一1 ,1 和 一0 5 ,0 5 上的随机扰动。取f 。= 0 8 ,f := 1 ,采 用开闭环p 型学习律。给定输出期望轨迹:y d ( r ) = s i n ( 27 r t ) t o ,1 。 跟踪误差曲线结果如图2 4 。 ( a ) 有扰动时对迭代轴女的误差 ( c ) 无扰动时对迭代轴k 的误筹 ( d ) 无扰动时对时间轴r 的误筹( :3 ) 图2 4 开闭环p 型学习律仿真的跟踪误荠曲线 硕士论文迭代学习控制的分析与应用 由图可以看出,在存在不确定性和扰动时,跟踪误差在2 次迭代后稳定在0 1 左右,因此算法具有鲁棒性;在k = 3 时,在时闻轴上的误差非常小( 1 e ( o j o ,1 ) , 因此算法对扰动起到了很好的抑制作用。无扰动时,在k = 3 时即可认为实现完全 跟踪( e = 0 0 0 1 5 ( o 0 1 ) ,因此算法是收敛的,且收敛速度较快。 2 4p i d 型迭代学习控制的收敛性与鲁棒性分析 2 4 1 问题描述 考虑重复运动的具有不确定性和扰动的线性定常系统: 挣? ! 刊心9 占蟹) + w ( ) ( 24 1 ) l y i ( r ) = c x ( t ) + 叱( t ) 。 其中k 代表系统的第k 次重复操作,) 彤、y ;( f ) r 、聪。( f ) e r 分别 为系统的状态向量、输出向量和输入向量:w a t ) 、v k ( f ) 为系统的不确定性和扰动; a 、b 、c 为具有适当维数的有界矩阵,t 【0t 1 。 选用下面的开环p i d 型学习律: “ + i o ) = “女( t ) + k f ,e t ( f ) + k ,【e * ( r ) d r + k d 也0 ) ( 2 4 2 ) 在给出本节主要结论之前,先给出以下假设: ( 1 ) 不确定性和扰动有界且满足: 1 1 w 。( f ) l | b 。,i i v 。( ,) | | sb ,0 1 k ( r ) 0 k ( v = o ,1 ,一,v t o 丁】) ; ( 2 ) c b 列满秩。 2 4 2 主要结论 定理2 4 1 考虑系统( 2 4 1 ) 及其假设条件( 1 ) 一( 2 ) ,给定时间区间 0t 】 上期望轨迹儿( f ) 以及任意的初始控制u o ( t ) 初始状态x a o ) = ( o ) 。利用学习律 ( 2 4 2 ) ,若对v ,【o 川有- i i - x d c b i l p 1 ,则k j 。时,e k ( r ) e o 卅上一致 有界:当w ( r ) ,v ( ,) 不存在时,系统输出收敛于期望轨迹,即儿( f ) 叶y a ( t ) a 。,c z a s , 将式( 2 4 5 ) 代入式( 2 4 4 ) 得: i i “t + ( t ) l l 。sz l l u 。( f ) | 。+ f 舯脚制m 协】1 眺i i 酱 孝2 【( + 0 世,c l l d ( 五。) ) 丁+ i i k 。c i l 6 。+ 1 1 k ,+ k , t i i b ,+ i l k 。| k 由p 1 ,显然存在充分大的,使得万 1 : 从而: 受忪毗( ,) 儿r 与有界 进一步地,由州s u 。p ,i i a , ( f ) | | e 。f 陋“t ( f ) 1 1 。知: ! 受川s u p ( 悱l i m a u k ( ,) 8 x - e ,【r 南有界, 从而七一时,( f ) 在 0 列上一致有界,进而e k ( f ) 在【o 刀上一致有界。 当w ( r ) s o ,v ( ,) s o 时- 显然掌= o ,从而蚝( ,) 呻0 ,吼( ,) _ + 0 。 证毕 定理表明,p i d 型迭代学习算法的收敛条件仅仅受误差微分项增益k 。的影响 而不受k ,k p 的影响,因此与单纯的d 型学习律的收敛条件相同。 硕士论文迭代学习拄制的分析,应用 2 4 3 仿真研究 系统如同2 3 3 节中的例1 。 采用式( 2 4 2 ) 所示的p i d 型学习律,给定输出期望轨迹:y 。( r ) = s i n ( 2 ,r t ) t 【0 ,l 】。取o ( ,) = 0 ( f 【0 ,1 】) ,x k ( 0 ) = 0 ( k = o ,l ,) 。 仿真结果如图2 5 所示。对迭代轴k 的跟踪误差采用均方根形式。 由图可以看出,当不存在不确定性和扰动时,跟踪误差在3 次迭代后即可认 为实现了收敛( 此时e - - - - - 0 0 0 6 3 ) ,收敛速度较快。当存在不确定性和扰动时,在 3 次迭代后,跟踪误差稳定在0 1 左右,因此算法具有鲁棒性。 ( a ) 不存在不确定性和扰动情况( b ) 存在不确定性和扰动情况 圈2 5p i d 型学习律仿真结果 2 5 本章小结 本章主要研究了迭代学习控制的收敛性和鲁棒性问题。首先给出了各种基本 的迭代学习律的收敛条件,并针对开闭环p 型和d 型学习律作了收敛性和鲁棒性 证明,给出了收敛条件并进行了仿真分析,通过仿真可以发现,由于丌闭环算法 综合利用了当前和以前的系统信息,从而算法的整体性能要好于丌环算法和闭环 算法。最后,针对线性系统给出了p i d 型迭代学习律的收敛性和鲁棒性证明,给 出了收敛条件,同时进行了算例仿真,验证了算法的有效性。 硕十论文选代学习挣制的分析与心用 3 迭代学习控制的2 d 分析 从本质上说,迭代学习控制包食两个过程,即时阊过程和迭代过程。而在二 维( 2 d ) 系统中有两个相互独立的动念过程,可用其一反映迭代学习控制在时域 内系统动态特性,用另一过程反映系绕迭代学习过程,因此2 一d 系统模型是一种 能很好地反映迭代学习控制的数学模型。在前一章中,仅利用时间变量的一维分 析方法讨论了迭代学习算法的收敛性。本章将以二维 2 一d ) 系统模型,特剐是以 r o e s s e r 模型为基础,讨论线性系统的迭代学习控制及其收敛性。 3 1 引言 近几年,越来越多的人投入到迭代学习控制系统的研究当中,并且提出了各 种各样的学习律,当前应用最多的学习律为p i d 型学习律。但正如g e n g 等在文献 2 5 中指出的那样。所有的p i d 型学习律都不可避免地受到严格钓收敛条件和初 始条件的限制,所以g e n g 等人在文献 2 5 中将2 一d 系统理论引入到了迭代学习控 制系统中来。实际上,传统迭代学习控制的主要缺点是难于找弱一个数学模型昂 时表达控制系统在时域的动态特性和在空间的迭代学习过程。而在2 一d 系统中有 两个相互独立的动态过程,可用其一反映迭代学习控制在时域内系统动态特性, 用另一过程反映系统迭代学习过程,因此2 一d 系统模型能成为良好反映迭代学习 控制过程的一种数学模型。 正是由于以上优点,近几年2 - d 系统理论越来越多地应用于迭代学习控制, 并取得了一系列成果。文献 3 1 将2 d 系统理论应用到了线性离散多变量系统, 提出了相应算法,并给出了算法收敛的条件。s a n b 【49 】针对离散线性时不变系统, 应用2 d 系统理论提出了一种d 型迭代学习算法。t o m m y 5 7 】将2 - d 系统理论在迭 代学习控制中的应用从离散系统扩展到了连续系统,提出了种d 型算法,同时 提出了种经过一次迭代即可收敛到零的快速算法。国内在这方面的研究也在进 行,并取得了一定成果【1 , 2 1 , 5 5 , 6 9 。 本章主要基于2 一d 线性系统理论,首先针对线性离散系统,提出了一类迭代 学习算法,其中一种算法可以实现快速完全跟踪。同时针对存在状态时滞和控制 输入时滞的线性离散系统,给出了种迭代学习算法。对所有算法都给出了收敛 的条件并进行了理论证明,给出了仿真算侧进行了仿真研究,仿真结果验证了算 法的有效性。 硕士论文 迭代学习拧制的分析与艘用 3 22 - d 系统理论基础【6 4 】 随着现代工业的不断发展,人们需要处理越来越多的多变量系统和多维信号, 如多维数字滤波器、多维数字图像
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 甜品考试题及答案
- 天津全国高考试题及答案
- 角膜再生微环境调控-洞察及研究
- 2025年高压电工复审考试题库附答案
- 2025年高级健康管理师模拟考试题含答案
- 2025年高级化工仪表维修工业务理论知识题库与答案
- 远程实时指导-洞察及研究
- 西藏养护工程管理办法
- bt项目公司管理办法
- 电气师属地管理办法
- 【课件】二十四节气和日晷(人教版2019选择性必修1)
- 结算合同合同
- 2023年广东外语外贸大学考研英语练习题100道(附答案解析)
- 领导干部经济责任审计
- 电子科技大学微积分上册
- 压力弹簧力度计算器及计算公式
- 2022年高考英语真题试卷(天津卷)含答案
- 医院灾害脆弱性分析PDCA
- 讲义经尿道前列腺电切术
- 宫颈锥切日间手术临床路径(妇科)及表单
- GB/T 8905-2012六氟化硫电气设备中气体管理和检测导则
评论
0/150
提交评论