




已阅读5页,还剩55页未读, 继续免费阅读
(控制理论与控制工程专业论文)迭代学习控制的初值问题研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
硕士论文 迭代学习控制的初值问题研究 摘要 迭代学习控制是智能控制的个重要分支,特别适用于具有重复运行性质的被控对 象,可以在给定的有限时间区间内实现对期望轨迹的完全跟踪。因该方法简单有效而受 到众多研究人员的关注。本文基于算子理论对迭代学习控制的初值问题进行研究。 ( 1 ) 研究了固定初值问题,采用开环d 型迭代学习算法,给出了谱半径形式的收敛 条件,并利用算子理论详细证明了该算法的收敛性; ( 2 ) 研究了初值在一定范围内变化的问题,采用开环d 型迭代学习算法,给出了谱 半径形式的收敛条件,并利用算子理论详细证明了该算法的收敛性; ( 3 ) 研究了任意初值问题,采用控制输入与初值同时学习的算法,给出了谱半径形 式的收敛条件,并利用算子理论详细证明了该算法的收敛性; ( 4 ) 通过仿真分别验证了上述算法与收敛条件的有效性,仿真结果表明了谱半径形 式的收敛条件较范数形式的收敛条件放宽了; ( 5 ) 针对实际工程中普遍存在的时滞现象,在任意初始值情况下,研究了具有控制 时滞的一类线性定常系统和一类非线性系统的收敛性问题,并针对具有控制时滞的间歇 过程控制对象进行仿真研究,其结果表明迭代学习控制方法可以取得很好的控制效果。 关键字:迭代学习控制,初值问题,算子理论,收敛性,谱半径,控制时滞 a b s t r a c t i t e r a t i v el e a r n i n gc o n t r o l ( i l cf o rs h o r t ) i sa l li m p o r t a n tb r a n c ho ft h ei n t e l l i g e n tc o n t r 0 1 i ti su s e dt od e a lw i t hc o n t r o l l e dp l a n t sw h i c hh a v er e p e t i t i v ec h a r a c t e r i s t i c i tc a l lt r a c kf u l l y d e s i r e dt r a j e c t o r yo v e raf i n i t et i m ei n t e r v a l m a n yr e s e a r c h e r sh a v ep a i dm u c ha t t e n t i o nt o i t e r a t i v el e a r n i n gc o n t r o li nr e c e n ty e a r sb e c a u s eo fi t ss i m p l i c i t ya n de f f e c t i v e n e s s t h i s d i s s e r t a t i o nr e s e a r c h e so nt h ei n i t i a lv a l u ep r o b l e m sb a s e do no p e r a t o rt h e o r y ( 1 ) t h ef i x e di n i t i a lv a l u ep r o b l e a ni sr e s e a r c h e d t h i sd i s s e r t a t i o nu s e st h eo p e n - l o o p d t y p el e a r n i n ga l g o r i t h ma n dg i v e st h ec o n v e r g e n c ec o n d i t i o no fs p e c t r a lr a d i u sf o r m t h e n t h ec o n v e r g e n c eo ft h el e a r n i n ga l g o r i t h mi sp r o v e db a s e do no p e r a t o rt h e o r y ( 2 ) t h ep r o b l e mo fi n i t i a lv a l u et h a tv a r i e sw i t h i nac e r t a i ns c o p ei sr e s e a r c h e d t h i s d i s s e r t a t i o nu s e st h eo p e n - - l o o pd - t y p el e a r n i n ga l g o r i t h ma n dg i v e st h ec o n v e r g e n c e c o n d i t i o no fs p e c t r a lr a d i u sf o r m t h e nt h ec o n v e r g e n c eo ft h el e a r n i n ga l g o r i t h mi sp r o v e d b a s e do no p e r a t o rt h e o r y ( 3 ) t h ea r b i t r a r yv a l u ep r o b l e mi sr e s e a r c h e d t h i sd i s s e r t a t i o nu s e st h ea l g o r i t h mt h a t t h ec o n t r 0 1i n p u ta n dt h ei n i t i a lv a l h el e a r la tt h es a l t l et i m ea n dg i v e st h ec o n v e r g e n c e c o n d i t i o no fs p e c t r a lr a d i u sf o r m t h e nt h ec o n v e r g e n c eo ft h el e a r n i n ga l g o r i t h mi sp r o v e d b a s e do no p e r a t o rt h e o r y ( 4 ) t h ev a l i d i t yo ft h el e a r n i n ga l g o r i t h ma n dc o n v e r g e n c ec o n d i t i o n i st e s t e db y s i m u l a t i o n t h er e s u l t so fs i m u l a t i o na l s oi l l u s t r a t et h ec o n v e r g e n c ec o n d i t i o no fs p e c t r a l r a d i u sf o r mi sw e a k e rt h a nt h ec o n v e r g e n c ec o n d i t i o no fn o r mf o r m ( 5 ) f o rt h et i m e d e l a yp h e n o m e n o ne x i t sw i d e l yi np r a c t i c e ,t h ec o n v e r g e n c ep r o b l e m s f o rac l a s so fl i n e a rt i m e i n v a r i a n ts y s t e m sa n dn o n l i n e a rs y s t e m sw i t hc o n t r o lt i m e - d e l a yi n t h ec a s eo fa r b i t r a r yi n i t i a lv a l u ea r er e s e a r c h e d t h i sd i s s e r t a t i o ng i v e st h es i m u l a t i o n e x a m p l e sf o rt h eb a t c hp r o c e s sc o n t r o lp l a n t sw i t hc o n t r o lt i m e d e l a y t h e r e s u l to fs i m u l a t i o n s h o w st h a tt h ei t e r a t i v el e a r n i n gc o n t r o lm e t h o dc a l lg e tg o o de f f e c t k e yw o r d s :i l c ,i n i t i a lv a l u ep r o b l e m , 【l c o n t r o lt i m e d e l a y o p e r a t o rt h e o r y ,c o n v e r g e n c e ,s p e c t r a l r a d i u s , 声明 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在本 学位论文中,除- r ) j 口以标注和致谢的部分外,不包含其他人已经发表或 公布过的研究成果,也不包含我为获得任何教育机构的学位或学历而使 用过的材料。与我一同工作的同事对本学位论文做出的贡献均己在论文 中作了明确的说明。 研究生签名:。碴矗窒晰矽月e t 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅或 上网公布本学位论文的部分或全部内容,可以向有关部门或机构送交并 授权其保存、借阅或上网公布本学位论文的部分或全部内容。对于保密 论文,按保密的有关规定和程序处理。 研究生签名:狨序吵月口日 硕士论文迭代学习控制的初值问题研究 1 绪论 1 1 迭代学习控制概述 长久以来,在工程中基于对象模型的系统综合方法得到了广泛的应用。以这种方法 进行控制系统综合都是建立在严格和精确的数学模型基础上的。该方法往往仅考虑线性 模型结构,忽略系统中的非线性因素。以这种方法进行控制系统综合的步骤是先建模, 再利用数学模型设计控制器,它把系统设计扩展成建模与控制器设计两个任务进行。由 此,其控制器结构与参数依赖于被控对象的模型结构和参数。但是实际系统中大量存在 非线性、时变、不确定、时滞及强耦合等特性,一般无法获得其精确的数学模型。因而, 利用基于模型的系统综合方法来解决问题时,控制系统可能变得十分复杂,并且降低了 系统的可靠性。而无模型的系统综合方法能很好地解决这类问题,由于该方法只利用系 统的输入输出信息来设计控制器,其控制结构不依赖于被控对象动力学特性,它本质上 适用于非线性控制系统。因此,对于系统中固有的非线性因素,这类方法可获得更好的 控制效果。如果利用系统的历史控制经验,可以让控制器本身具有某种“智能,使它 在控制过程中不断完善自己,使控制效果越来越好,这是一种具有“学习”能力的控制 器。 学习是人类的基本智能行为之一。使控制器具有某种“智能,一直是控制界梦寐 以求的目标。自从f u i 】在1 9 7 1 年提出学习控制的概念后,对学习控制的研究就一直很 活跃。几十年来,学习控制技术随着与其相关的学科及应用领域,如计算机技术、人工 智能、神经网络、,模糊控制、机器人等的发展而发展,如今学习控制技术在控制界占有 相当重要的地位。 智能控制大致可分为基于人工智能和基于数学描述两大类。前者以专家控制为代 表,后者有如神经网络控制器、基于小脑模型的联想记忆学习控制器、迭代学习控制、 重复学习控制及自动机等。在基于数学描述的智能控制器中又可分为基于参数和基于品 质两大类。前者需要在线辨识被控对象的参数,后者不需要在线辨识被控对象的参数, 而是根据控制的效果,即“品质 来修正控制器参数。 迭代学习控制是一种基于品质的智能控制方法,它特别适合于那些如机器人那样有 着非线性、强耦合、难以建模以及高精度轨迹控制的场合。迭代学习控制,顾名思义, 就是通过反复的迭代修正来达到某种控制目标。7 0 年代后期,日本学者u c h i y a m a 2 针 对高速运行的机械手,提出了迭代学习控制的基本思想:通过对被控系统进行控制尝试, 以系统输出与给定期望轨迹的偏差信号修正不理想的控制信号,来产生一个新的控制信 号,使得系统跟踪性能得以不断提高。后来a r i m o t o 等人发展了u c h i y a m a 的思想,于 1 9 8 4 年提出了迭代学习控隹j l j ( i t e r a t i v el e a r n i n gc o n t r o l ,简称i l c ) 的概念【3 】,建立了实用 1 1 绪论硕士论文 的算法。并从理论上证明了这种算法的可行性,开创了一个新的研究方向。 1 2 迭代学习控制的基本原理 迭代学习控制其实与人类的学习过程有着惊人的相似之处。一个人对某种技能的掌 握通常要经过无数次的练习,不断从失败中吸取教训,最终才能获得成功。为了更严密、 更准确地领会迭代学习控制的基本原理与思想,下面借助数学语言进行描述。 不失一般性,假定被控对象动态过程为: 弘) = 巾,x ( ) ,“( f ) ( 1 2 1 ) l y ( f ) = g f ,工( f ) ,“( 明 。7 其中,x r 职1 、y r 一、u r “1 分别表示系统状态向量、输出向量及控制输入量; 厂( - ) 、g ( ) 为相应维数的向量函数,其结构与参数均未知。 , 对于该系统,我们的控制任务是:在时间f 0 ,t 范围内,要求系统输出y ( t ) 跟踪 上期望输出y d ( t ) 。在讨论之前先作如下几个假定: 系统期望轨迹y d ( t ) 是预先给定的; 每次对期望轨迹- y a ( t ) 跟踪时,厂( ) 、g ( ) 所表示的函数关系不变,即系统( 1 2 。1 ) 是可重复的;, 存在惟一的期望控制输入( f ) ,使得在给定的初始状态下,当重复学习次数k 尽可能多时,y ( ) 专y d ( t ) 。 根据上述假定,第k 次对期望轨迹跟踪时,系统模型可表示为: j 毫( ) = f t , x k ( t ) , u k ( 。) 】( 1 2 2 ) l 以( f ) 2 9 t ,以( f ) ,u 女( f ) 、 定义输出误差: e k ( f ) = y a ( t ) 一y ( f ) ( 1 2 3 ) 设每次运行时的期望输出y d ( f ) 不变。如果能恰当利用e k ( t ) 及控制输入量u 。( f ) 生成 下一次跟踪时的控制输入 、u 川( t ) = l u ( f ) ,e k ( t ) ,t ( 1 2 ,4 ) 这里是线性或非线性算子。 使得当k 斗0 0 时,( f ) 一u d ( f ) 、y k ( f ) _ y d ( f ) 。即在t “0 ,t 】范围内: 1 i m u k ( f ) = u d ( f ) i m y k ( t ) = 均( f ) 、7 此时,在式( 1 2 4 ) 的作用下,通过对y d ( t ) 的反复跟踪,就可以达到高精度控制效果。 以上便是迭代学习控制的基本思想,式( 1 2 4 ) 称为迭代学习律,整个过程还可以形 2 硕士论文 迭代学习控制的初值问题研究 象地用图1 2 1 来表示。 , 图1 2 1 迭代学习控制算法流程 根据以上分析,容易得到迭代学习控制步骤: ( 1 ) 置k = 0 ,给定期望轨迹儿( f ) 以及初始控制输k u o ( f ) ,t o ,t ; ( 2 ) 通过初始定位操作,使得系统初始输出位于y k ( 0 ) ,相应的初态位于吒( o ) ; ( 3 ) 对被控对象施加控制输a u 。( f ) ,采样并存储输出y k ( f ) ,运行完成时存储y 。( f ) ; ( 4 ) 重复操作结束时,计算输出误差e k ( t ) = y d ( f ) 一y 。( f ) ,利用迭代学习律式( 1 2 4 ) 计算下一次运行时的控制输入量u 川( t ) ; ( 5 ) 检验停止条件。若条件满足则停止,否则置k = k + 1 ,转步骤( 2 ) 。 容易理解,迭代学习控制的核心问题是如何设计学习律( 即给出式( 1 2 4 ) 中( ) 的具 体形式和参数) 并达到预期的控制目的。 式( 1 2 4 ) 是利用第k 次迭代时的输出误差及控制输入来产生第k + 1 次迭代的控制输 入,我们称之为开环迭代学习控制。如果利用第k 次迭代时控制输入及第k + 1 次迭代时 的输出误差来获得第k + 1 次迭代时的控制输入,便构成了闭环学习控制。相应的学习控 制律式( 1 2 4 ) 变为: u k + l ( f ) = l u ( f ) ,e k + l ( f ) ,t ( 1 2 6 ) 1 3 迭代学习控制的研究内容与现状 近些年来,对迭代学习控制的研究逐步深入,研究的具体内容包括学习律、学习算 法的稳定性与收敛性、鲁棒性、收敛速度、学习控制的分析方法、初值问题、应用研究 - y g r :i 于o 1 。学习律 l 绪论硕士论文 学习律即是迭代学习控制的算法。学习律的研究是迭代学习控制的基础,也是迭代 学习控制理论中研究最广、最成熟的问题之一。根据三( f ) ,e k ( t ) ,f ) 的不同形式,可以 得到不同的学习律,其中最主要的有p 型、d 型、p i d 型学习律。d 型学习律是首先被 提出的【3 】,同时也是研究最为成熟、应用最广的一种学习律。由于它采用了误差信号的 微分形式,学习律的收敛条件简单而又清晰。而p 型学习律,它不要求误差信号的微分 形式,具有在物理上易于实现等优点,故引起了广泛的关注 4 - 5 1 。随着迭代学习控制研 究的不断深入,近些年出现了迭代学习控制与其它控制方法结合,从而产生了一些新的 算法,如模型参考学习律【6 1 、自适应学习律阴、遗忘因子学习律8 1 、前馈反馈学习律【9 】 以及分别基于模糊控制【1 0 】、优化控制【1 1 1 、神经网络【1 2 1 、系统辨识 1 3 】、鲁棒控制等新 型学习律。 2 学习算法的稳定性与收敛性 迭代学习控制的稳定性是保证学习控制控制能够运行的基本前提,它保证随着学习 次数的增加,控制系统不发散。+ 但对于学习控制系统而言,仅仅稳定是没有实际意义的, 只有使学习过程收敛到真值,才能保证得到满意的控制效果。a r i m o t o 3 在最初提出迭代 学习控制理论时就对d 型学习律的收敛性进行了证明。目前,学习控制的收敛性研究成 果很多,从线性时不变系统到线性时变系统 16 1 、非线性系统 1 7 1 ,从连续系统【1 8 】到离 散系统【l9 】都得到了大量的具有稳定性和收敛性的学习律。 3 鲁棒性问题 鲁棒性研究是当系统存在不确定扰动、测量误差以及初始条件偏差时,在各种学习 律下,被控系统迭代学习控制过程的稳定与收敛问题。这一问题最早由a m o t o 【3 】提出, 且在后来得到深入研究。h e i n z i n g e r t 2 0 首先讨论了仿射非线性系统迭代学习对状态及输 出干扰的鲁棒性。文献 2 1 给出了般非线性系统、开环p 型学习律的鲁棒性结论。孙 明轩 2 2 1 讨论了p 、d 型迭代学习控制的鲁棒性问题。对非线性开环p i 型迭代控制,文献 2 3 给出了鲁棒条件,证明系统在状态、输出及初态干扰有界且干扰渐近重复的情况下 可以完全跟踪期望轨迹。文献 2 4 给出了工业过程初值漂移和系统参数在一定范围内扰 动迭代学习算法鲁棒性分析。文献 2 5 针对具有不确定性的线性系统,利用结构奇异值 理论和鲁棒性能的u 综合方法得到了抗扰动和初态偏移的鲁棒迭代学习控制算法。 4 学习速度问题 学习收敛问题是任何学习控制的最重要问题之一,只有满足收敛条件,迭代学习控 制才能用于控制过程。但收敛条件不能评价一个学习算法的优劣,而学习速度( 收敛速 度) 是评价学习算法的一个重要指标。它是研究迭代学习控制对给定的被控系统在各种 不同的学习律下,系统的输出收敛到给定的性能指标与哪些因素有关,以期得到最优的 学习律和最佳的系统构成,以获得最快的收敛速度。林辉【2 6 】给出了学习算法的学习速度 的定义。但对快速收敛性即学习次数的多少鲜有文献报道,这是因为所有的收敛条件均 4 硕士论文迭代学习控制的初值问题研究 是在学习次数k 专0 0 下给出的。魏燕定【27 】在利用i l c 算法对超低频标准振动台稳态正弦 波形反馈控制以及通过大量理论仿真和实验的研究中得出:在相同的迭代学习律下,学 习参数大,迭代学习的收敛速度快,但参数过大会导致收敛失败;学习参数小,收敛速 度就慢,但学习收敛条件较宽,可以保证收敛稳定性。文献 2 8 2 9 采用以理论优化迭 代学习收敛率,提高了学习收敛速度。 , 5 分析方法 学习算法的收敛性分析是迭代学习控制的核心问题,这方面的研究成果目前已经很 丰富。就目前发表的论文看,对迭代学习的分析和证明收敛性的手段主要有压缩映射方 法、能量函数法、算子理论、2 d 稳定性理论和几何分析方法。以下对每种方法进行详 细介绍。 压缩映射方法形成了迭代学习理论的基础。所有最初的迭代学习设计方法,即使没 有严格的数学推导,都能看作是压缩映射原理的简单形式。这种方法的关键是要求系统 动态满足全局l i p s c h i t z 条件,再利用时间权重函数范数( 五范数) 。文献 3 】中的给出了 开环d 型迭代学习控制算法,后来学者在此基础上提出其它形式的学习算法。基于压缩 映射的迭代学习控制已经扩展到时滞系统,文献 3 0 针对状态时滞进行了讨论,p a r k 等 人【3 1 1 、吉梗等人 3 2 】则应用压缩映射方法对具有控制时滞系统对象进行了研究。 l y a p u n o v 函数直接法己被广泛的应用到非线性动力系统的控制和分析中,并被看 成是处理非线性不确定性系统最重要的工具之一。j e o n 等【3 3 j 用l y a p u n o v 稳定性理论分 析了机械臂混合控制的迭代学习算法的稳定性。英国的f r e n c h 、r o g e r s 利用l y a p u n o v 设计方法【3 4 1 ,对具有参数化不确定性的非线性系统提出了一种自适应迭代学习方法,并 利用b a c k s t e p p i n g 技术将其扩展到更为一般的高阶非线性系统。受到l y a p u n o v 函数直 接方法的启发,能量函数的概念【3 扣3 6 在时域和迭代域上有了一定的发展。在能量函数的 基础上,新加坡学者j x x u 把复合能量函数( c e f ) 引入学习控制中【37 1 ,它可以保证在迭 代域上跟踪误差的渐进收敛以及参数在时间域上具有有界性和逐点跟踪的动态特性,并 且控制输入在整个迭代区问内是范数收敛,这适用于一类不具有全局l i p s c h i t z 连续条件 的非线性系统。c e f 为学习控制的设计和在迭代域上,跟踪误差收敛性分析开辟了一条 道路。复合能量函数,反映了系统能量既在时间域又在迭代域上,它由正标量和泛函组 成。正标量在时域上通过获得误差信息来估计跟踪性能;在整个学习期间内,在迭代域 上,泛函反映了学习误差从而估计学习性能。学习控制律由反馈项和学习项组成,通过 学习机制,学习项分别在时间域上进行逐点校正以及在迭代域上进行校正,文献 3 8 】对 一类时变参数的非线性不确定系统引入复合能量函数的概念,在迭代域上对时变参数进 行估计。 目前,大多数收敛条件是以范数形式给出的。而如采用算子理论进行收敛性证明, 其收敛性条件是以谱半径形式给出的。由于任何一个向量或者矩阵的谱半径不大于其任 5 1 绪论硕j 二论文 何范数,所以以算子理论给出的收敛条件比以范数形式给出的收敛条件较宽。自从o h 等【3 9 j 首次用算子理论证明了一类线性周期系统的模型算法迭代学习控制的收敛性以来, 算子理论得到了充分重视。其中林辉、王林写了一本应用算子理论对迭代学习控制收敛 性进行证明的专著【4 0 1 ,在这本专著中,作者应用算子理论,对开环p 型、d 型、p i d 型 以及相应的闭环形式给出了充分必要条件;并且以开环p 型学习律为例,讨论了一般非 线性状态方程学习控制的鲁棒性问题;作者还研究了迭代学习控制的初值问题,给出了 开环p 型学习律下的收敛条件,认为系统初值有大偏差时,闭环指数变增益学习律仍能 保证控制收敛于真值。针对算子理论,皮道映等人【4 1 州】也进行了深入研究。 从本质上说,迭代学习控制包含了两个过程,即时间过程和迭代过程。但通常仅基 于时间变量一维( 1 d ) 研究迭代学习算法收敛性的时候,很难找到一个数学模型同时表达 系统在时域的动态特性和在空间的迭代学习过程。为此,国外学者k u r e k 等人【4 5 】提出将 二维( 2 d ) 线性系统理论,即将以2 d 系统模型,特别是以r o e s s e r 模型为基础,应用于 迭代学习控制,但仅限于对开环迭代学习控制应用。而迭代学习控制能同时利用系统前 次运行和当前运行信息,因而性能优于单纯的开环或闭环迭代学习控制。文献 4 6 】考虑 到系统每次运行初始值的不确定性,利用二维系统理论设计了开闭环迭代学习控制器, 给出了控制收敛的充分条件。 在迭代学习控制算法上,自a r i m o t o 【3 】于1 9 8 4 年提出最简单形式的迭代学习控制算 法以来,人们相继提出了各种改进的迭代学习算法,如基于2 一d 系统理论的学习算法和 算子理论给出的算法以及高阶学习算法等等,它们基本上是沿着a r i m o t o 于19 8 4 年给 出的算法形式演化而来,可以说是同一类型的不同算法,并且没有说明新算法的实质性 意义。谢胜利等人 4 7 1 以几何分析为基础,通过对通常算法中的向量u 、“。及气所构 成的向量图进行几何分析得到新的迭代学习控制算法,这些算法具有与前面所介绍的算 法完全不同的形式,其收敛速度和精度有明显的提高。目前,对迭代学习控制的几何分析 方法的研究还处于初始阶段,还需要在已有的基础上继续深入研究。但该方法寻求学习 算法快速收敛的新途径,为完整的迭代学习控制理论的建立开辟了新的领域,指明了学 习算法进一步发展的方向。 6 初值问题 迭代学习控制的初值问题是指迭代学习控制过程收敛性与系统初始状态之间的关 系。在设计迭代学习控制器时,为保证算法的收敛性,在每次迭代时,对系统迭代初始 的重复定位的操作限定条件,大多数文章是假定迭代初始条件与期望初值一致。然而在 实际的工程应用中,个实际运行的迭代学习控制系统不仅不易求得期望轨迹的初值, 而且每次迭代难免存在一定的初值偏移以及测量噪声。目前,有关初值问题的结论可以 归纳为如下三类:l 、初值固定不变问题,这又分为两种情况,即:系统初值与期望初 值完全一致和系统初值虽然固定,但其值和期望初值不相等,这两种情况都是理想的, 6 硕士论文迭代学习控制的初值问题研究 在实际中很难做到,对其研究的理论意义远大于实践价值;2 、每次跟踪,系统初值和 期望初值不等,但其值在期望初值的一定范围内任意变化;3 、任意初值的问题。对于 这三类问题,许多学者进行了深入的研究,取得了一定的成果。a r i m o t o 【4 8 给出了当初 值偏差不大时,学习控制收敛于期望轨迹的某一邻域,但不能保证收敛到真值; h e i n z i n g e r 等【4 9 j 曾专门对偏差问题与学习的稳定性进行了研究,并给出了迭代学习算法 稳定性的结论,但不能保证收敛;l e e 等 5 0 】针对连续线性系统,讨论了存在固定初值 偏差,即:讫( 0 ) 一( o ) = x o 的情形下d 型和p d 型迭代学习控制问题,结果表明:具有 固定初始误差优于具有变化的初始误差的迭代学习控制系统;孙明轩等【5 l j 讨论了具有初 始偏差的非线性系统的d 型和p d 型迭代学习控制收敛性,指出d 型学习律下系统的迭 代输出会收敛到一极限轨迹,但与期望轨迹存在恒定偏差,而p d 型学习律通过引入p 型项,可有效的减少这种偏差;p a r k 等 5 2 】讨论了线性系统和一类非线性系统具有初值误 差的迭代学习控制,结果表明,初值误差的影响可通过学习增益的选取来控制;谢胜利 等【5 3 】讨论了由n 个传动器所驱动的n 个关节机器人系统的跟踪控制问题,通过变换将原 系统转化为低阶系统,然后对系统进行设计,从而消除了k a w a m a r a 等【5 4 j 在学习过程中 要求每次学习都经过相同的初始值的限制;任雪梅等【5 5 j 给出了任意初值下的迭代学习控 制,通过对系统的控制输入和初值同时学习来实现系统的完全跟踪;c h e n 等【5 6 j 利用文 献 4 9 1 中相同的策略,得n e - g 踪误差的一致有界性,且跟踪误差的界只与系统的不确定 项和扰动项有关,而且与初始误差无关;x g y a n 等【57 】提出一类非线性时变系统的离线 和在线迭代学习控制策略,在初值不确定情形下给出了范数形式的收敛性条件,并给出 了相应的证明;姚仲舒等【5 8 提出了迭代学习控制器在频域中设计的思想,给出了在任意 初值下迭代学习控制算法收敛的充分条件,证明了经过逐次迭代后系统实际输出信号对 期望输出信号的逼近轨迹,输出跟踪误差将一致有界,且与期望输出状态与期望输入无 关;洪波等 5 9 】通过引入状态误差的概念,对初值在一定范围内变化进行了鲁棒性分析。 7 应用研究现状 迭代学习控制思想最初的起源是针对机器人系统控制的问题而提出的【3 】,它具有很 浓厚的工程应用背景。除机器人系统外,目前迭代学习控制的应用主要集中在工业生产 线上的机械手6 0 】、数控车床6 1 1 、压塑机池3 、直线电机 6 3 】和过程工业中的批处理过程【朗, 主要原因在于它们都具有明显的重复运动特性,可以利用现有的迭代学习控制技术改善 其控制系统的跟踪性能。其能够精确逼近期望轨迹的优越性能,使得人们期望将它应用 到其它工业生产过程的控制上,考虑到工业过程控制的巨大市场,将迭代学习控制技术 推广应用到工业生产过程控制领域是一项有意义且极具挑战性的课题。但对于大多数常 规工业过程而言,其运行过程是没有重复性的,而迭代学习控制要求系统必须具有重复 性,这是迭代学习控制方法在工业过程控制中应用范围不广的重要原因之一。但由于迭 代学习控制是模拟人学习过程的一种智能控制方法,其思想是基于对象过程的重复性, 1 绪论 硕十论文 如果能够发现某一工业过程的重复性,就有可能利用迭代学习控制的思想来设计控制 律,通过多次迭代运行后获得满意的结果。文献 6 5 】正是利用这一点设计了工业过程稳 态优化的迭代学习控制。对于一些间歇生产过程,也可以用迭代学习控制方法进行控制 6 6 1 ,关键是如何找到特定问题的重复性并加以利用以及如何保证算法是收敛的。 1 4 课题研究背景及意义 迭代学习控制是智能控制领域中具有严格数学描述的一个分支,是集人工智能与自 动控制于一体的新型控制技术,适合于诸如工业机器人那样的具有重复运动性质的被控 对象,它的控制目标是实现有限时间区间上的完全跟踪。该控制过程是一种仿效人类的 学习行为而进行提取经验的过程,采用的是一种“在重复中学习”的策略,经过若干次 迭代后,系统的输出就会逼近理想的期望轨迹。由于迭代学习算法较为简单,而且只需 较少的先验知识就能处理不确定度相当高的非线性强耦合动态系统,故引起了广泛的关 注。自迭代学习控制概念提出以来,迭代学习控制一直是控制界的研究热点领域之一。 初值问题是指迭代学习控制过程收敛性与系统初始状态之间的关系,是迭代学习控 制理论研究的一个重要内容。目前大多数研究的迭代学习控制都是假定系统初值与期望 初值一致。但由于实际系统存在各种不确定的扰动,使得系统初值和期望初值不一致, 在这种情况下,分析迭代学习控制过程的收敛性具有重要的理论和现实意义。 在实际系统中,由于系统变量的测量、设备的物理性质及信号的传递等因素的存在, 时滞现象不可避免。事实上,由于科学技术的发展,近百年来,自然科学、工程技术、 社会科学中提出了大量的时滞动力学系统的问题。如:自动控制、生态、遗传、种群繁 殖、人口理论、交通运输等等。因此对含时滞的迭代学习控制系统的研究也具有重要的 理论意义和应用价值。 1 5 本文研究内容与章节安排 本文围绕迭代学习控制的初值问题,给出了几种不同初值情况下迭代学习律和较宽 的收敛条件,应用算子理论进行详细的收敛性证明,并通过仿真验证了学习算法和收敛 条件的正确性和有效性。主要研究内容如下: ( 1 ) 研究了固定初值的两类问题:初值无偏差问题与固定初值偏差问题; ( 2 ) 研究了初值在一定范围内变化的问题: ( 3 ) 研究了任意初值问题; ( 4 ) 针对系统普遍存在的时滞现象,研究了具有控制时滞系统在任意初值条件下的 迭代学习控制问题; ( 5 ) 在利用算子理论对以上几个问题的收敛性进行详细证明的基础上,通过仿真验 证了算法与收敛条件的有效性。 硕士论文 迭代学习控制的初值问题研究 根据以上研究内容,本文共分为六章,各章节安排如下: 第一章:绪论。论述了迭代学习控制的基本原理、研究内容与现状,介绍了本课题 研究背景与意义,并对本文的研究内容和章节安排进行了说明。 第二章:固定初值问题。研究了固定初值中简单也是理想的两种问题,采用开环d 型迭代学习算法,给出谱半径形式的收敛条件,应用算子理论进行了收敛性证明,最后 通过仿真验证算法的有效性。 第三章:初值在一定范围内变化问题。研究了初值在一定范围内变化问题,采用开 环d 型迭代学习算法,给出谱半径形式的收敛条件,应用算子理论进行了详细的收敛性 证明,最后通过仿真对算法进行了验证。 第四章:任意初值问题。研究了任意初值问题,采用输入与初值同时学习的学习律, 给出谱半径形式的收敛条件,应用算子理论进行了详细的收敛证明,最后通过仿真对算 法进行了验证。 , 第五章:具有控制时滞系统在任意初值条件下的迭代学习控制。针对具有控制时滞 的线性定常系统和非线性系统,采用了输入与初值同时学习的学习律,其中输入学习利 用了给定超前法,给出了谱半径形式的收敛条件,利用算子理论进行了详细的证明,并 针对具有控制时滞的间歇过程控制对象进行了仿真。 第六章:总结与展望。对本论文的主要工作进行了总结并给出了未来工作的展望。 9 2 固定初值问题 硕士论文 2 固定初值问题 2 1 引言 经过3 0 年来的发展,迭代学习控制理论研究取得了不少进展,无论是对线性系统 还是对非线性系统,都提出了各种算法,取得了具有理论意义和现实意义的成果。然而 在这些迭代学习控制理论的研究中,大部分都假定系统具有重复定位的操作:而且要求 系统初值等于期望初值,但在实际中一般都存在状态偏移,如果偏移量是固定的,这就 是固定初值偏差问题。固定初始值问题分为两种情况:第一种情况是初始值与期望初始 值完全一致,即无偏差情况【3 】;第二种情况是初值固定,但与期望初始值存在偏差,这 是固定初值偏差情况一8 5 0 j 。 本章对迭代学习控制的固定初值问题进行研究。首先讨论系统初始值与期望初始值 完全一致和存在一固定偏差的情形,采用开环d 型迭代学习控制,针对文献 3 ,4 8 - 5 0 是以范数形式给出的收敛条件,本章给出谱半径形式的收敛条件;其次应用算子理论对 其收敛性进行证明;最后通过仿真验证控制算法与收敛条件的有效性。 2 2 初值无偏差问题 2 2 1 问题描述 考虑如下非线性系统: 烨22 受x ? ! ) 邶( 撇) ( 2 “2 ) y ) 拳c ( f ) x 0 ) 、。 式中,te o ,t 】,x ( t ) 、f ( t ,( x o ) ) r “,b ( t ) r ”。7 ,y ( t ) r ”,c ( t ) r 。,u ( t ) r 7 。 该系统每次迭代时的初值相同,第k 次迭代的初值为x k ( o ) ,系统状态与输出为: l 毫( f ) = f ( t ,x k ( t ) ) + b ( t ) u 女( f ) y k ( t ) = c ( t ) x k ( t ) ( 2 2 2 ) i x k ( o ) = 为( o ) 其输出误差为: e 女o ) = y d o ) 一y t o ) ( 2 2 3 ) 采用开环d 型迭代学习控制算法: u k + l ( f ) = l f 女( f ) + l ( t ) k k ( t ) ( 2 2 4 ) 该系统要求在t o ,t 上,输出y 女( f ) 能够完全跟踪上期望轨j 痊y d ( t ) 。 1 0 硕士论文 迭代学习控制的初值问题研究 2 2 2 收敛性证明 定义2 1 厂= 磷 i ,1 ) 为”维向量厂= ( z ,疋,五) r 的范数; i i a i i = m 。“a x l , f 石+ i a ,哆为矩阵么= ( k 。的范数( 行和范数) ; 引理2 1 设常数序列 仇 卸( 坟o ) 收敛到零,算子鲛:c o ,研一c a o ,明满足: 慨 ) ( t ) l i 0 ,使得i i 厂( f ,x , ( t ) - f ( t ,x :( f ) ) 忙k ,i i x ,( t ) - - x :( f ) l | ( a 2 ) 期望轨迹儿( f ) 在 0 ,f 】上连续; ( a 3 ) 在f o ,明上,0 ( f ) 存在,且b ( z ) 、c ( f ) 、e ( f ) 有界; ( a 4 ) 存在惟一的理想控制u d ( f ) ,使得系统的状态和输出为期望值; ( a 5 ) 若取学习律为式( 2 2 4 ) ,并且满足: = p ( s 一三o ) c o ) b ( f ) ) 1t o ,r 】( 2 2 5 ) 则当尼_ 0 0 时,y t ( t ) 一致收敛于y d ( f ) 。 i 正明令 2 固定初值问题 硕士论文 l8 x , ( t ) = x d ( t ) 一x k ( t ) b y , ( t ) = y a ( t ) 一y t ( f ) ( 2 2 6 ) 【万( f ) = u d ( f ) 一u k ( f ) 式中:x d ( t ) 、y a ( t ) 、u d ( f ) 分别为期望轨迹上的状态、输出与控制。 令 f ( t ,功= f ( t ,吆0 ) ) 一f ( t ,x d ( t ) 一x 0 ) ) 由式( 2 2 2 ) - - - ( 2 2 7 ) 可得: 万丸( f ) = z ( f ,万吒( f ) ) + b ( t ) s u ( f ) 8 y 女( r ) = c ( t ) d x k ( t ) 万九( f ) = c ( t ) 万5 c k ( f ) + c ( t ) 万x k ( t ) = c ( t ) f l ( t ,6 吮o ) ) + c ( t ) b ( t ) s u ( f ) + c o ) 万以u ) 则有: d u 。+ ,) = 8 u 。0 ) 一三o ) 万夕t o ) = ( i - l ( t ) c ( t ) b ( t ) ) s u , ( t ) 一l ( t ) c ( t ) f ( t ,万o ) ) 一l ( t ) c ( t ) d x k ( t ) 定义算子p :g o ,明_ e o ,t 】为: p d u 。o ) = ,一三o ) c o ) b o ) 万甜女( f ) 定义算予q :c o ,明一e o ,邪为: 幺( s u ) ( f ) = - l ( t ) c ( t ) f ( t ,f i x k ( t ) ) - l ( t ) c ( t ) f i x k ( t ) 则式( 2 2 1 i ) 可写为: 8 u , + i ( t ) = p s u ( f ) + q ( d u ) ( f ) = ( p + q ) ( p + q t 一1 ) ( p + q o ) ( j “o ) o ) 以下对算子级进行估计: 由式( 2 2 8 ) 得: 8 x k ( t ) = 8 x k ( o ) + j : 石( r ,峨( f ) ) + b ( f 脚t ( r ) m = r z ( f ,万讫( f ) ) d f + r b ( r 矽( f ) d f 上式两端取范数得: 1 1 8 x 。( o l l - r0 z ( r ,万o ) ) l l d r + r8 b ( f ) 万( f ) 0 d f 、 - k 厂j :| l 氓( f ) 她+ 6j :| | 万( r ) 陋 ( 2 2 7 ) ( 2 2 8 ) ( 2 2 9 ) ( 2 2 1o ) ( 2 2 11 ) ( 2 2 1 2 ) ( 2 2 1 3 ) ( 2 2 1 4 ) ( 2 2 1 5 ) ( 2 2 1 6 ) 硕士论文 迭代学习控制的初值问题研究 其中扛f 【s u 咿p 】) 0 由引理2 2 ,式( 2 2 1 6 ) 变为: 1 1 8 x 。( o l l - i ib e k :, - , ) 慨。( f ) r 6 e k :r1 1 8 ( f ) 陋 = m j :j j 万( f ) 陋 式中m 1 = b e , 对式( 2 2 1 3 ) n 端取范数可得: i i q t 8 ) ( f ) 0 8 三( f ) c o ) 石( f ,艿o ) ) 8 + 8 三o ) e o ) 万& o ) 0 _ t c k ,i i 万瓦( f ) 0 + 乜0 万(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公文最易错别字的
- 饿了外卖市场经理月工作总结
- 如何说课培训课件
- 2026届山东省海阳市美宝学校化学九年级第一学期期中质量跟踪监视试题含解析
- 教学查房的价值与意义
- 2026届贵州省施秉县化学九年级第一学期期末联考试题含解析
- SMT生产现场培训
- 南昌市南大附中2026届英语九上期末调研模拟试题含解析
- 2026届安徽省蚌埠市怀远县化学九年级第一学期期末教学质量检测模拟试题含解析
- 江苏省苏州市虎丘区立达中学2026届化学九年级第一学期期中质量跟踪监视模拟试题含解析
- 伊斯兰教完整版本
- 计量经济学知到智慧树章节测试课后答案2024年秋安徽农业大学
- 《西方的文官制度》教学设计
- 食管纵隔瘘护理
- 外研版九年级英语上册单元模块满分必刷题 Module 1 【刷中考】(广东专用)(含答案)
- 华为ICT大赛网络赛道考试题库(786题)
- 新能源汽车检测与维修专业调研报告
- 2024年保安员证考试题库及答案(共240题)
- 2018低压电力线高速载波通信互联互通技术规范第3部分:检验方法
- 超声科医院感染管理:培训与演练
- 养老院餐饮供应服务行业发展全景调研与投资趋势预测研究报告
评论
0/150
提交评论