




已阅读5页,还剩42页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 迭代学习控制是一种能有效处理重复性跟踪问题或周期性干扰抑制问题的 控制方法。传统的p i d 型迭代学习控制方法虽然可以实现被控对象以较高精度跟 踪给定的目标轨线,但也存在着较大的缺陷,如要求非线性项满足全局李普希茨 连续性、初值重置问题等。而上世纪9 0 年代中期产生的自适应迭代学习控制方 法很好的克服了p i d 类控制方法的一些不足,并且为参数化系统的控制问题提供 了强有力的工具。 按不确定参数在状态方程或输出方程中的表现形式,参数化系统又可分为线 性参数化不确定系统和非线性参数化不确定系统。虽然目前线性参数化系统的自 适应迭代学习控制的研究已有许多成果,理论也较成熟,但非线性参数化系统的 研究却进展缓慢。因为实际工业中的控制问题很多都是非线性的,所以非线性参 数化系统的研究在理论上和现实中都具有更大的价值。 本文基于l y a p u n o v 稳定性理论,提出非线性参数化系统的自适应迭代学习 控制的新算法。主要工作包括以下几个方面:第一,针对一类严格反馈非线性参 数化系统,提出了一种新的自适应迭代学习控制方法。该算法利用分离性原理和 b a c k s t e p p i n g 方法相结合,可处理非线性参数化不确定项和不匹配的不确定项。 通过构造参数的微分差分型自适应律和学习控制律,使得跟踪误差的平方在一 个有限区间上的积分收敛于零。构造了复合能量函数,证明所有信号均在有限时 间区间内是有界的。第二,针对一类控制增益未知的含有时变和时不变参数的非 线性参数化系统,设计了一种自适应迭代学习控制方法。该方法通过对前1 1 1 个 方程采用b a c k s t e p p i n g 方法设计稳定化函数和时不变参数自适应律,对最后一个 方程进行重新参数化估计,有效地处理了控制增益未知的问题。第三,针对一类 更一般的非线性参数化系统,设计了一种自适应迭代学习控制方案。该方法有效 地处理了含有状态向量的非线性参数化项,实现了该系统对目标轨线的跟踪问 题。第四,对于上面提出的三种算法,本文都给出了仿真例子,以验证算法的可 行性和有效性。 关键词:b a c k s t e p p i n g非线性参数化不确定 自适应迭代学习控制复合能量函数 a b s t r a c t i t e r a t i v el e a r n i n gc o n t r o li so n ek i n do fc o n t r o lm e t h o d o l o g ye f f e c t i v e l yd e a l i n g w i t hr e p e a t e dt r a c k i n gc o n t r o lp r o b l e m so rp e r i o d i cd i s t u r b a n c er c j e c t i o np r o b l e m s t h o u g ht r a d i t i o n a lp i d - t y p ei t e r a t i v el e a r n i n gc o n t r o la l g o r i t h m sc a na c h i e v ep e r f e c t t r a c k i n g ,t h e yh a ss o m ed e f e c t s ,s u c ha sg l o b a l l yl i p s c h i t zc o n t i n u i t yo fn o n l i n e a r f u n c t i o na n di n i t i a lv a l u e sr e s e t t i n g t h ea d a p t i v ei t e r a t i v el e a r n i n gc o n t r o l ,p r o p o s e d i nt h em i d9 0 so ft h el a s tc e n t u r y , o v e r c a m es o m es h o r t c o m i n g so fp i d - t y p em e t h o d s , a n dp r o v i d e dp o w e r f u lt o o l st oh a n d l ec o n t r o lp r o b l e m so fp a r a m e t e r i z e ds y s t e m s b yt h ef o r m so fu n c e r t a i np a r a m e t e r si ns t a t ee q u a t i o n so ro u t p u te q u a t i o n s , p a r a m e t e r i z e ds y s t e m sc o u l db ed i v i d e di n t ol i n e a r l ya n dn o n l i n e a r l yp a r a m e t e r i z e d u n c e r t a i ns y s t e m s a l t h o u g ht h e r ea r em a n yr e s u l t si nl i n e a r l yp a r a m e t e r i z e ds y s t e m s , t h ep r o g r e s so fn o n l i n e a r l yp a r a m e t e r i z e ds y s t e m sh a sb e e ns e l d o mm a d e s i n c em a n y o fa c t u a lc o n t r o lp r o b l e m si n i n d u s t r ya r en o n l i n e a r , t h er e s e a r c ho fn o n l i n e a r l y p a r a m e t e r i z e ds y s t e m sh a so fs i g n i f i c a t i o n sb o t hi nt h e o r ya n dr e a l i t y b a s e do nl y a p u n o vs t a b i l i t yt h e o r y , t h i sp a p e rp r o p o s e st h r e en e wa d a p t i v e i t e r a t i v el e a r n i n gc o n t r o lm e t h o d o l o g i e so fn o n l i n e a r l yp a r a m e t e r i z e ds y s t e m s t h e m a i nr e s u l t sa r ea sf o l l o w s f i r s t l y , an e wa d a p t i v ei t e r a t i v el e a r n i n gc o n t r o la p p r o a c h i sp r o p o s e df o rac l a s so fn o n l i n e a r l yp a r a m e t e r i z e ds t r i c t l y - f e e d b a c ks y s t e m s b y m e r g i n gw i t hp a r a m e t e rs e p a r a t i o nt e c h n i q u ea n db a c k s t e p p i n gm e t h o dd e a lw i t h n o n l i n e a r l yp a r a m e t e r i z e du n c e r t a i nt e r ma n du n m a t c h e d u n c e r t a i nt e r m b y c o n s t r u c t i n gad i f f e r e n t i a l d i f f e r e n c et y p eu p d a t i n gl a wa n dal e a r n i n gc o n t r o ll a w m a k e st h et r a c k i n ge r r o rc o n v e r g et oz e r oi nt e r m so fm e a n s q u a r eo nt h ef i n i t e i n t e r v a l ,m e a n w h i l e ,b yc o n s t r u c t i n gc o m p o s i t ee n e r g yf u n c t i o n ,w ep r o v et h e b o u n d e d n e s so fa l l c l o s e d - l o o ps i g n a l si n af i n i t et i m ei n t e r v a l s e c o n d l y , an e w a d a p t i v ei t e r a t i v el e a r n i n gc o n t r o la p p r o a c hi sp r o p o s e df o rac l a s so fn o n l i n e a r l y p a r a m e t e r i z e ds y s t e m so fu n k n o w nc o n t r o lg a i nw i t hu l l k l l o w nt i m e - v a r y i n ga n d t i m e i n v a r i a n tp a r a m e t e r s t h r o u g hd e s i g n i n gs t a b i l i z e df u n c t i o n sa n da d a p t i v el a wo f t i m e i n v a r i a n tp a r a m e t e r sb yl y a p u n o va p p r o a c ht ot h ef i r s tn o1e q u a t i o n s ,a n d r e e s t i m a t i n gp a r a m e t e r st ot h el a s tf u n c t i o n ,t h ea p p r o a c he f f e c t i v e l yd e a l sw i t ht h e p r o b l e mw i t hu n k n o w nc o n t r o lg a i n t h i r d l y , aa d a p t i v ei t e r a t i v el e a r n i n gc o n t r o l a p p r o a c hi sp r o p o s e df o ram o r eg e n e r a lc l a s so fn o n l i n e a r l yp a r a r n e t e r i z e ds y s t e m s t h ea p p r o a c he f f e c t i v e l yd e a l sw i t ht h en o n l i n e a r l yp a r a m e t e r i z e dt e r mw i t hs t a t e s v e c t o r , a n da c h i e v e st r a c k i n gp r o b l e mo ft h es y s t e m f i n a l l y , t h es i m u l a t i o n r e s e a r c h e sa r ed o n ef o ra b o v et h r e em e t h o d s ,w h i c hi l l u s t r a t et h ee f f e c t i v e n e s sa n d f e a s i b i l i t yo ft h ep r o p o s e da l g o r i t h m s k e y w o r d s :b a c k s t e p p i n g n o n l i n e a r l yp a r a m e t e r i z e du n c e r t a i n t i e s a d a p t i v ei t e r a t i v el e a r n i n gc o n t r o l c o m p o s i t ee n e r g yf u n c t i o n 西安电子科技大学 学位论文创新性声明 秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导 师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注 和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果; 也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材 料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明 并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切的法律责任。 日期型。ti 、p 西安电子科技大学 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生 在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保留 送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容, 可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后结合 学位论文研究课题再撰写的文章一律署名单位为西安电子科技大学。 本人签名: 导师签名: 第一章绪论 第一章绪论 本章主要介绍一下迭代学习控制的发展概况及研究现状、参数化系统的研究 现状和存在问题及本文的结构和主要内容。 1 1 迭代学习控制的发展概况和研究现状 最近3 0 多年以来,在现代控制理论与技术的研究中,人们不断的探索如何 让控制器自身具有某种智能,使其在控制过程中通过学习而不断得到改进,从而 使控制效果越来越好。早在上世纪七十年代初,美国华裔学者傅京逊就首次提出 了这种学习控制的概念。此后,由于学习控制具有严格数学描述、算法简单等诸 多特点,得到控制界许多人士的关注,因而对它的研究一直非常活跃,并陆续产 生了许多学术论文,提出了许多具有不同学习结构的控制技术和方案。特别是上 世纪八十年代以后,随着计算机技术、人工智能、神经元网络等相关学科取得巨 大进展,学习控制的理论也得到飞速的发展。目前,学习控制已成为智能控制领 域的一个重要的分支。 迭代学习控制适用于具有重复运动性质的被控系统,是一种具有学习能力的 高级控制方法,属于学习控制研究中的一个分支。它基于前次迭代时的输入输出 动态信息,应用比较简单的学习算法,获得本次迭代学习所需的输入;经过若干 次迭代,以期达到在给定的时间区间内实现被控对象以较高精度跟踪一个给定目 标轨线。迭代学习控制的基本思想最早由日本学者u c h i y a m a t 2 】于1 9 7 8 年提出, 在后来的研究中,日本学者a r i m o t o 、k a w a m u r a 等人【3 】把这种学习思想系统化、 理论化,提出了迭代学习控制算法,从而使得在对机械臂控制中,能以简单的方 式处理不确定程度相当高的非线性动态系统,达到预期的学习控制目的。a r i m o t o 等人的工作在迭代学习控制理论的发展过程中是一个里程碑,为该理论的研究、 发展和应用开辟了广阔的空间。正是由于他们所做的工作,吸收了世界范围内的 许多学者对它进行比较广泛而深入的研究。 迭代学习控制为具有强非线性、强耦合、建模困难、有高精度轨迹控制要求 的对象,特别是具有重复运动特性的对象( 如工业机器人,数控机床等) 提供了一 种很好的控制方法。在控制界人士的不断努力中,已经提出了各种各样的迭代学 习控制方案:从开环学习到基于反馈的闭环学习、从线性系统到非线性系统的学 习、从s i s o 到m i m o 系统的学习、从基于压缩映射原理到基于l y a p u n o v 稳定 性原理的学习、从非参数化到参数化的学习、从线性参数化到非线性参数化的学 非线性参数化系统的迭代学习控制研究 习、从重复性到非重复性的学习、从单纯的迭代学习到结合其他智能工具( 如神 经网络、模糊推理、遗传算法等) 的混合迭代学习等,这使得i l c 成为了“学习 控制”的一个重要组成部分。同自适应控制、鲁棒控制、最优控制一样,i l c 成 为控制理论的一个重要的研究方向。到目前为止,迭代学习控制的主要研究内容 包括:迭代学习控制结构形式;学习算法及其收敛性分析;学习算法形式及与被 控系统之间的关系;学习速度问题;初值与鲁棒性分析;迭代学习控制方法在工 业控制中的应用等方面。本文主要对以下几个方面进行简要介绍。 p i d 型算法和其它学习律的研究。1 9 8 4 年,继u c h i y a m a 和a r i m o t o 之后, c a s a l i n o 4 】发表了把学习控制用于机器人运动控制的文章,因为假定了实时加速 反馈和高增益反馈,所以,实验的数据是否确凿成了问题;k a w a m u r a l 5 】研究了 将速度信号用于输入修正的p 型学习控制,该文章阐明了误差系统的无源性对误 差收敛的重要性,其有效性通过实验得到验证,但收敛证明不够充分。1 9 8 5 年, k a w a m u r a 6 】对一类时变系统进行研究,并对该系统提出了p i d 型控制算法。随 后,由于p i d 型学习控制算法结构简单、所需要的计算量小、仅仅需要极少的先 验知识等诸多特点,从而吸引着人们对它进行了广泛的研究。a r i m o t o 等【7 】于1 9 8 6 年率先针对p i d 类学习算法讨论了学习算法的鲁棒性问题。但讨论的前提是假设 初始轨迹在期望轨迹的一个邻域内,机器人模型被线性化为一个时变的线性机械 模型。1 9 8 9 年,h e i n z i n g e r 掣8 】在没有使用线性化模型的前提下,讨论了p i d 类 算法的鲁棒性问题,在控制器中首次引入了遗忘因子。1 9 9 0 年,a r i m o t o 9 】研究 了具有遗忘因子的p 类学习算法的鲁棒性问题。1 9 9 3 年,s a a b 掣1 0 】讨论了具有 遗忘因子的p 类学习算法对一类时变非线性系统关于状态扰动、测量噪声和每次 迭代的初始误差的鲁棒性和收敛问题,证明了在存在初始误差、测量噪声和动力 学扰动的情况下系统状态的一致有界,进一步,当所有扰动趋于零时,系统输出 收敛于期望输出。到目前,虽然p i d 型的迭代学习算法已有许多有益的成果,但 人们仍在研究把它应用到新的领域,如x u 等【l l 】对由抛物线型偏微分方程确定的 分布式参数系统提出p 型、d 型迭代学习控制方案,在每次迭代初始条件相同 的情况下,保证了闭环系统的收敛性。同时,人们也早就注意到,p i d 类控制方 法存在着较大问题,如只有在系统为双正则的条件下,p i 型学习律才能保证算 法的收敛性、控制器的参数较难选择等。因而促使着人们不断地探索其它的迭代 学习控制算法。人们陆续提出了高阶迭代学习控制算法 1 2 - 1 4 】、反馈前馈迭代学 习控制算、法【15 1 、最优学习斟1 6 1 、滤波器型学习控制算法【1 7 】、模型参考学习控制 算法【1 8 】等。 鲁棒性和收敛性;在实际的迭代学习控制系统中,实际的重复定位会导致系 统存在初始误差,如果这种误差具有可重复的本性,学习算法本身就能消除这种 第一章绪论 3 误差;如果这种误差不可重复,就会造成这种误差随着迭代次数的增加而积累, 最终形成跟踪误差。稳定性探讨的是初始误差对系统跟踪性能的影响:鲁棒性则 探讨初始误差、扰动、期望轨迹变化、学习期间偏移和系统不确定性等对系统跟 踪性能的影响。a r i m o t o 等 7 】最早提出迭代学习控制系统的稳定性问题,它讨论 初始偏移对系统跟踪性能的影响。一个实际运行的迭代学习控制系统除了存在初 始偏移外,还或多或少存在状态扰动、量测噪声、输入扰动等各种干扰。鲁棒性 问题讨论存在各种干扰时迭代学习控制系统的跟踪性能。具体地说,一个迭代学 习控制系统是鲁棒的,是指系统在各种有界干扰的影响下,其迭代轨迹能收敛于 期望轨迹的邻域岗:而当这些干扰被消除时,迭代轨迹会收敛于期望轨迹。陈瑶 等【l9 】基于包含两个二次项的分段l y a p u n o v 函数,研究了线性时变不确定系统的 鲁棒控制器设计问题,所考虑的系统由两个矩阵的凸组合构成,通过引入一个附 加矩阵,推导出了鲁棒控制器存在的充分条件。b r a d l e y 等【2 0 】对迭代学习控制系 统的不稳定现象进行研究,指出迭代学习控制系统的鲁棒稳定性依赖于系统从输 入输出干扰到内部信号的增益。从目前的研究结果来看,有些系统是鲁棒的,而 有些不是。 期望轨迹变化问题。现有的大多数文献中在讨论迭代学习控制问题时,都是 假设期望轨迹已知且固定不变的。c h e a h 等【2 1 】研究了一种模型参考迭代学习律, 使系统跟踪参考模型的动态输出。c h c n 等【2 2 】也在他们的书中探讨了变期望轨迹 的情况,指出了系统的最终跟踪误差的收敛界限受期望轨迹变化的上确界的影 响。s a a b l 2 3 】研究了期望轨迹慢时变的迭代学习控制方案,实际上是具有遗忘因子 的p i d 型迭代学习控制方案。李俊民等【2 4 j 针对一类含有时变和时不变参数的高 阶非线性系统,结合b a c k s t e p p i n g 方法,提出了一种新的自适应迭代学习控制方 法,克服了传统的迭代学习控制对目标轨线限制,可以跟踪非一致目标轨线。 初始条件和干扰问题。设计迭代学习控制器时,为保证算法的收敛性,在每 次迭代时,对系统迭代初始重复定位的操作限定条件,大多数文章假定迭代初始 条件与期望初态致,但重复定位操作中不可避免地存在误差,会导致初始状态 偏移期望值。a r i m o t o 9 】指出当初态偏差不大时,学习控制收敛于期望轨迹某一 邻域,但不能收敛到真值,且当初始状态的偏差较大时学习过程会有较大的误差, 因而使控制输出不能跟踪期望轨迹。实际应用中,不易求得期望轨迹的初始状态, 为了消除由于系统的初始状态和期望初始状态不同而引起的学习算法输出不能 完全跟踪期望轨迹的情况,任雪梅等【2 5 提出了同时进行系统的输入和初始状态的 学习来实现系统的完全跟踪,提出的算法适用于线性时不变系统,后来的研究发 现初始状态的学习算法也适用于非线性时不变系统。这些研究使迭代学习控制的 应用范围有所扩大,使其在实际应用中减弱了限制条件。s a a b 将参考文献 2 6 】 4 一 非线性参数化系统的迭代学习控制研究 的鲁棒性结果推广到非线性系统【”l 。l e e 等 2 8 】针对仅存在初始误差的系统提出了 一种基于初始状态的多模式迭代学习律,保证了学习控制在变初始误差情况下的 鲁棒收敛性。m e n g 等【2 9 1 对一类允许初值变化的时延系统,采用纯误差项或初始 较正项解决初值变化问题,提出了保证系统渐近稳定的充分条件。“掣如j 对非 线性连续多变量系统提出了一种新的带有初始较正项的迭代学习控制方法,该方 法允许迭代控制系统每次迭代时的初始输出在理想轨道初始值的邻域内扰动,通 过在一个非常小的初始时间间隔内添加一个初始校正项,实现了在初始时间间隔 内对目标轨道的跟踪。实际中,学习控制系统受到的干扰除状态干扰和输出干扰 外,还包括初态偏移、输入扰动、期望轨迹变动以及学习区间偏移等。 学习速度问题。算法的稳定性是系统能够运行的基本条件,它保证随着学习 次数的增加,控制系统不会发散。但对实际的学习控制系统而言,学习速度也是 一个很重要的问题。k a w a m u r a 掣3 1 】在很早以前就开始考虑迭代学习控制的收敛 速度问题,他们考虑了如何利用多次学习过程中得到的知识来改进后续学习过程 的速度。吴东南等 3 2 】给出了高阶学习律,即利用同一时刻前k 次运动的误差信息 以及前k 次控制量构造学习律。a r i f 等在文献 3 3 中提出了带有可调系数的迭代 学习控制方法,提高了迭代学习控制的收敛速度,但是没有给出系数的选取方法: 在文献 3 4 中提出了利用初始状态重构以及局部加权来提高收敛速度的方法,但 跟踪误差收敛到允许的范围内也需要几次甚至几十次。虽然经过学者们的不断努 力,有关学习速度的论文发表了许多,但总体上还是不尽如人意。在这方面还有 较大的研究空间。 迭代学习控制问题的展望。迭代学习控制成为一种正式的研究方向已经接近 2 0 年了,经过许多学者的不懈努力,迭代学习控制理论得以不断完善。然而, 由于迭代学习控制应用范围的局限性,目前,将迭代学习控制应用于除机器人以 外的动态系统的成功例子并不多,如何使迭代学习控制理论上的优越能力为实际 工业生产过程服务,是有待解决的极具挑战性的课题。展望未来,迭代学习控制 领域仍有许多课题有待进一步深入研究。( 1 ) 鲁棒收敛性分析与鲁棒迭代学习律 设计。鲁棒收敛性是保证迭代学习控制成为一种实用的控制技术的基础,没有鲁 棒收敛性的算法只具有理论上的意义。针对传统的迭代学习律的鲁棒性分析己经 相当透彻,且表明传统的迭代学习律具有很大的局限性,因此,寻求具有较为宽 松的鲁棒收敛条件的新的迭代学习律应该是目前的研究重点之一。( 2 ) 与各种反 馈控制技术相结合的开闭环综合迭代学习控制。从工业应用的实际来看,不加反 馈的纯粹开环的迭代学习控制是不可接受的。反馈控制中的最优控制、预测控制、 自适应控制、鲁棒控制和智能控制等技术均有可能与迭代学习相结合,构成新的 兼顾各种控制之长的学习律。( 3 ) 非因果的迭代学习律。传统的迭代学习控制在 第一章绪论 利用以前运行的信息时,仍然拘泥于因果的结构,这“浪费”了许多系统已知的 信息。针对以往的系统运行信息,采用非因果的结构,不仅可行,而且有可能大 大提高跟踪精度和收敛速度。( 4 ) 系统参数学习的迭代学习律。大多数迭代学习 控制只能用于特定轨迹的跟踪,一旦轨迹发生变化,原来的学习结果就将失效。 将系统的结构参数化,然后对参数进行学习可以避免这一问题。这一方法可以克 服传统迭代学习控制只会“死记硬背”的缺陷。( 5 ) 更广泛的实际应用。使迭代 学习控制实用化,关键在于收敛速度和运算量的大小,将先进的控制技术与迭代 学习控制相结合可以得到完善的特性,但是鉴于控制的实时性,控制算法不宜太 复杂,研究在线的控制算法将是今后的方向。 1 2 参数化不确定系统的研究现状 在实际的工程控制问题中,由于被控系统的复杂性,无法建立实际系统的精 确数学模型,被控系统的数学模型必然带有不确定性。这种不确定性通常可分为 结构不确定性和参数不确定性,方程中含有参数不确定性的系统即为参数化系 统。按不确定参数在状态方程或输出方程中的表现形式,参数化系统又可分为线 性参数化不确定系统和非线性参数化不确定系统。 传统的学习控制方法大都采用压缩映射原理获得闭环系统的稳定性。虽然传 统的控制方法仅利用很少的系统信息就能实现较快的收敛速度,但它们却很难充 分利用系统的参数和结构信息设计控制输入。1 9 9 3 年o w e n s 【3 5 】首次将自适应和 迭代学习控制的方法结合起来,提出了一种新型的自适应迭代学习控制的方法。 这种新型的控制方法很快引起了众多学者的注意,很多人都投入了这方面的研 究。作为自适应迭代学习控制的孪生兄弟,自适应重复学习控制也很快被提出。 人们将自适应迭代学习控制和自适应重复学习控制统称为自适应学习控制。自适 应学习控制方法为一些用压缩映射原理难于处理的复杂系统提供了强有力的工 具,并带来诸多好处,如可放宽l i p s c h i t z 条件、可处理相对高维度的系统、可 处理沿迭代域变化的干扰和目标轨线等。许多论文相继出现,它们采用各种方法 估计系统中的未知常值或时变参数从而获得控制输入。例如参数估计在时域中进 行【3 6 】,参数估计在迭代域中进行【3 7 】或者在个域中同时进行【4 1 1 。 线性化参数系统相对比较简单,目前,对线性参数化不确定系统的自适应学 习控制的研究已经得到了很多有益的结果。f r e n c h 等【3 6 1 针对一类具有不确定参 数的非线性系统,基于l y a p u n o v 设计方法,将传统的自适应控制方案进行简单 地修改,提出了一种自适应迭代学习控制方案,未知的系统参数在时域中自适应 学习,并利用b a c k s t e p p i n g 方法将其扩展为更一般的高阶系统。徐建新在线性参 数化系统的学习控制研究领域做了很多工作【3 1 】:文献 3 8 提出了一种自适应迭 6 一 非线性参数化系统的迭代学习控制研究 代学习控制方案,未知的时变参数在迭代域中进行自适应学习,同时引入了复合 能量函数的概念;文献 3 9 针对一类周期已知的时变参数不确定非线性系统提出 一种新的自适应重复学习控制,使得跟踪误差在嚣范数意义下渐近收敛于零, 该文献研究的目标轨迹是非周期的;对于周期的目标轨迹跟踪问题,文献【4 0 】提 出鲁棒自适应迭代学习控制方案;文献 4 1 1 提出了新的迭代学习方法,对于一阶 混合参数不确定性系统解决了非一致目标跟踪控制问题。目前,不确定机器人系 统的自适应学习控制方面也涌现出许多优秀的成果【4 2 舶】:针对不确定机器人系统 的跟踪问题,文献 4 2 提出了新颖的混合迭代学习律;文献 4 3 1 根据系统参数的 个数不同,设计了三种自适应迭代学习控制方案;文献 4 4 1 提出的自适应重复学 习控制方案,放松了初始定位条件;文献 4 5 提出的高阶自适应迭代学习控制律, 提高了跟踪误差收敛速度,但是计算量较大;文献 4 6 1 结合p d 型控制器和一个 交换型的二参数补偿力,提出了一种无投影的自适应迭代学习控制方案,不需要 机器人参数的先验知识,保证了跟踪误差收敛到零。文献 4 7 对一类同时含有周 期和拟周期的高阶非线性系统的周期跟踪问题,采用滑动平均方法估计周期参 数,设计了鲁棒学习控制方案。文献 4 8 针对状态难以测量的一类非线性系统, 当期望轨迹发生变化时,基于状态观测器设计了迭代学习控制器,实现了在有限 区间上跟踪误差渐近收敛于零。文献 4 9 1 对一类未知控制方向的线性参数化系 统,通过引入n u s s b a u m 函数,设计了一种新的学习控制方案,解决了控制方向 未知的问题。文献 5 0 对线性化参数系统提出了一种自适应迭代学习控制的框 架,构造了新的参数学习律,利用某个增益的取值范围,可以处理时变或时不变 系统的参考轨线迭代可变的跟踪问题。 虽然线性参数化不确定系统的自适应学习控制的理论已较为成熟,但非线性 参数化不确定系统的自适应学习控制研究进展却较缓慢。这是由于对非线性参数 化系统的分析和设计是较困难的。相对于线性参数化,非线性参数化可以适用于 更为广泛的非线性系统。非线性参数化问题存在于很多实际控制问题中,如生化 过程、带有摩擦的机械系统等。解决这一类的问题不仅仅是理论上的突破,在应 用的层次上也同样有着重要的意义。在过去的几年里,人们在这一困难的问题上 展开了研究并且取得了一些有益的结果。文献 5 1 n 用参数分离性原理和幂积分 器相结合,研究了非线性参数化系统的光滑反馈情况;用类似地方法,文献 5 2 】 解决了非线性参数化系统的非光滑反馈情况。文献【5 3 把积分l y a p u n o v 函数应 用到一类非线性参数化系统的自适应重复学习控制中,解决了控制器的奇异性问 题。文献【5 4 】针对非线性参数化的不确定性系统,设计了自适应学习控制律,基 于l y a p u n o v 稳定性分析,保证了系统状态的跟踪误差全局收敛于零,但它要求 未知时变参数的上界预先知道。当未知时变参数的上界未知,文献【5 5 利用反馈 第一章绪论 线性化设计方法,提出了一种新的自适应重复学习控制方法,通过引入微分差 分混合自适应学习律,使得广义跟踪误差在叠范数意义下渐近收敛于零。文献 5 6 1 针对一阶未知非线性参数化周期时变时滞系统,设计了一种自适应学习控制 方案,通过构造一个l y a p u a o v k r a s o v s k i i 复合能量函数证明了所有信号有界并 且跟踪误差收敛。文献【5 7 针对控制增益是未知时变的并含有混合未知参数的非 线性参数化系统,利用将整个区间分段与反馈线性化相结合,提出了一种新的自 适应控制学习方法。文献 5 8 针对类多输入多输出非线性参数化系统提出了一 种新的鲁棒自适应控制器的设计方法,采用自适应非线性阻尼和变能量方法抑制 了未建模动态和扰动对系统的影响。文献【5 9 】对一类含有时变和时不变参数的非 线性高阶系统,设计了一种新的自适应迭代学习控制算法,利用分离性原理和改 进的b a c k s t e p p i n g 方法相结合,处理了非线性参数化不确定项和不匹配的不确定 项,通过构造参数的微分差分型自适应律和学习控制律,使得跟踪误差的平方 在一个有限区间上的积分收敛于零。文献【6 0 研究一类含有未知时变参数化系统 的学习控制问题,利用参数分离技术和信号置换思想,设计了一种自适应迭代学 习控制方法,使得跟踪误差的平方在一个有限区间上的积分收敛于零。文献 6 1 】 针对一类含有时变和时不变参数的未知控制增益的高阶非线性系统,提出了一种 自适应重复学习控制方法,该方法结合分段积分机制和反馈线性化,可处理参数 在一个未知紧集内周期性快时变的非线性系统。文献 6 2 】针对一类高阶未知控制 增益的参数化非线性系统,利用参数重组技巧,并结合反馈线性化,设计了一种 新的自适应重复学习控制方法,但系统是线性参数化的。 上述的有关非线性参数化系统的一些成果都是针对某一类特殊系统的,这是 由于非线性参数化问题的复杂性造成的。如何对更一般化的非线性参数化系统设 计控制方案,是今后的一个研究方向,在这方面还有极大的研究空间。 1 3 本文主要工作 对非线性参数化不确定系统控制问题的研究不仅仅是理论上的突破,在应用 方面也同样具有着重要的意义。本文主要针对几类非线性参数化不确定系统,将 b a c k s t e p p i n g 方法和分离性原理相结合,提出了基于复合能量函数的自适应迭代 学习控制方案。 本文内容安排如下: 第二章:针对一类严格反馈非线性参数化系统,提出了一种新的自适应迭代 学习控制方法。该算法利用分离性原理和b a c k s t e p p i n g 方法相结合,可处理非线 性参数化不确定项和不匹配的不确定项。通过构造参数的微分一差分型自适应律 和学习控制律,使得跟踪误差的平方在一个有限区间上的积分收敛于零。构造了 非线性参数化系统的迭代学习控制研究 复合能量函数,证明所有信号均在有限时间区间内是有界的。仿真结果验证了所 提算法的有效性。 第三章,针对一类控制增益未知的含有时变和时不变参数的非线性参数化系 统,设计了一种自适应迭代学习控制方法。该方法通过对前n 1 个方程采用 b a c k s t e p p i n g 方法设计稳定化函数和时不变参数自适应律,对最后一个方程进行 重新参数化估计,有效的处理了控制增益未知的问题。 第四章,针对一类更一般的非线性参数化系统,设计了一种自适应迭代学习 控制方案。该方法有效地处理了含有状态向量的非线性参数化项,实现了该系统 对目标轨线的跟踪问题。 第二章耋严登反馈非缚性垄娄哗系统的连佳学三垡制 一 竺 第二章一类严格反馈非线性参数化系统的迭代学习控制 2 1 引言 迭代学习控制是一种能有效处理重复跟踪控制问题或周期性干扰抑制问题 的控制方法【6 3 - 6 6 ,在诸如机械臂这样的控制系统中,被控对象在有限的时间区间 上重复运行,要求系统能以任意精度跟踪给定的期望轨迹。对于这样的问题,可 采用迭代学习控制来解决。设跟踪的期望轨迹为y r ( t ) ,t 0 ,r 】,迭代学习控制在 每次重复运行中设计输入序列 ) ,并作用于系统,产生输出序列 y j ( f ) ,使 得y ,( f ) 能随着迭代次数的增加以任意精度跟踪y r ( t ) 。文献 3 8 】通过构造复合 能量函数,设计了自适应迭代学习控制律,可以处理含有时变参数的非线性系统 的跟踪问题;文献 4 1 提出了新的迭代学习方法,其控制律由反馈项和学习项组 成,引进了l y a p u n o v 函数,解决了一阶混合参数不确定系统的非一致目标跟踪 控制问题;文献【4 3 】根据机械臂系统所含参数个数的不同,设计了三种自适应学 习控制方案,解决了机械臂系统的跟踪问题;文献 5 0 根据某个增益的取值范围, 设计了自适应学习律,提出了自适应迭代学习控制一般框架。 对于非线性参数化系统的自适应控制问题,如今是一个具有挑战性的研究课 题。文献 5 1 利用参数分离性原理和幂积分器相结合,研究了非线性参数化系统 的光滑反馈情况:用类似地方法,文献 5 2 解决了非线性参数化系统的非光滑反 馈情况;文献 5 3 1 把积分l y a p u n o v 函数应用到一类非线性参数化系统的自适应 重复学习控制中,解决了控制器的奇异性问题;文献 5 5 】针对未知时变参数的上 界未知的非线性参数化系统,利用反馈线性化设计方法,提出了一种新的自适应 重复学习控制方法,通过引入微分一差分混合自适应学习律,使得广义跟踪误差 在层范数意义下渐近收敛于零。 本章研究一类严格反馈非线性参数化系统,结合b a c k s t e p p i n g 方法和对非线 性参数化不确定项进行处理的不等式技巧,提出了微分差分型自适应律,设计 出对该类非线性参数化系统的自适应迭代控制方法,使得跟踪误差在衅意义下 收敛于零。通过构造复合能量函数,对收敛性进行了严密的分析,数值仿真说明 所提方法的有效性和可行性。 里非线性参数化系统的迭代学习控制研究 2 2 问题描述 考虑下列非线性参数化系统 毫= 薯+ l + 0 2 t z ( i ) 1 i 珂- 1 毫= u + 岛t z ( x ) + g ( y ,鼠( f ) ) ( 2 1 ) y2 五 其中写= 五,t 】,x = 五,毛 r ”是系统状态,u r 是系统的控制输入,y 表示系统的输出,q ( f ) r p 是未知连续时变参数向量,幺r 9 是未知时不变参 数向量,g ( y ,毋( f ) ) 是未知连续函数,石( 五) ,五( 五,吃) ,z ( x ) 均为q 维已知的光 滑函数,且,( 0 ) = 0 ,i = 1 ,n ,y r ( t ) 表不参考系统的输出。 系统( 2 一1 ) 满足如下假设: 假设2 1 :函数z ( 夏) ,1 i 刀满足局部李普希茨连续条件,即 ( 爿) 一z ( 墨2 ) i l 毛恃一夏20 ,也是未知李普希茨常数。 假设2 2 :对任意的y ly 2 r ,未知连续函数g ( ,) 满足以下不等式: i g ( y 1 ,q ) 一g ( y 2 ,岛) l j y l 一y 2 l 办( y 1 ,y 2 ) 五( 岛) 其中j l l ( ,) 为已知连续非负函数,五( ) 是未知的连续非负函数。 假设2 3 :目标轨线和它的一阶到,z 阶导数均在葺- 范数意义下是有界的,即 r ( 一( f ) ) 2 j f o ( f = 1 ,甩) 为设计参数a 对( 2 2 ) 求导,得到误差变量动态方程为 宣,j = 飞z 1 ,+ z 2 ,+ 劈q , 乞,1 厂c 甜+ 弧,+ 鬻( f r :, j - 龟) ( 2 - 3 ) ( 2 - 4 ) 垫 “心 u 一 ,峰魄 h 魁 旦非线性参数化系统的迭代学习控制研究 气j 一氓j 飞气一m 一酝一凝q 气j + 卺厂龟) 撕以扩) 码+ g ( 州m + 呶,一等龟, 一霎c 等锄+ 券, 设计第r 1 个伪稳定化函数( 并不是真正的稳定化函数) o 【q - - 一z n 叫- c n z 厂鲤j 。i + 券),j + 两者) k ,+ 荟- i 谶a a 吼 ,川 则可得第,1 个误差变量动态方程为 钆硌厂以+ 薹鬻。, 。o a 一l 十= 一 8 9 ,: ( r 乙一睦,) + ( “+ g ( 五,q ( f ) ) 一) 在第次迭代中,设计常参数自适应律为: 工 岛= f 乃= 1 1 乙,岛,( o ) = 幺- l ( 丁) ,岛,。( o ) = 0 其中杉= q ,q ,】,乃= 毛,z 。,】r 。 ( 2 - 5 ) ( 2 - 6 ) ( 2 7
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工程资金监管协议书示范文本
- 2025年国家公务员考试试卷及答案
- 2025年保安员考试题库考试题库(答案+解析)
- 2025年医院安全(不良)事件报告制度培训试卷测试题库含答案
- 2025年C语言考试题库及参考答案
- 2025年医院院感知识培训考试模拟题库(答案+解析)
- 2025年信息安全工程师考试练习题加答案
- 2025年MRI医师上岗证考试真题及参考答案
- 海洋渔业废弃物综合利用标准创新创业项目商业计划书
- 水生植物立体养殖创新创业项目商业计划书
- 办公楼装饰装修工程施工组织设计方案
- 《机械制图(多学时)》中职全套教学课件
- 2024年公司内部审计制度例文(四篇)
- 江苏省江阴市河塘中学2024-2025学年七年级上学期10月阶级段性练习语文试题
- 小学英语词汇量小学英语词汇大全(约1000词)(按字母顺序)修改版
- 2024年道路交通(驾驶员交通法规及安全)知识考试题库与答案
- 2024年全国职业院校技能大赛中职(数字产品检测与维护赛项)考试题库(含答案)
- 【乡村旅游探究的文献综述4200字】
- 2025年上半年教师资格考试高中历史学科知识与教学能力试卷与参考答案
- 城市供热管网抢修与维护工程技术规程
- DB2104∕T 0011-2022 地理标志产品 清原龙胆
评论
0/150
提交评论