迭代学习控制

上传人：y*** IP属地：天津上传时间：2021-12-12 格式：DOCX 页数：4 大小：13.61KB 积分：15 举报 版权申诉

全文预览已结束

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、迭代学习控制1、前言迭代学习控制(Iterative Learning Control,简称ILC)是指不断重复一个同样的轨迹的控制尝试，并以此修正控制律，以得到非常好的控制效果的控制方法1。迭代学习控制是学习控制的一个重要分支，是一种新型学习控制策略。它通过反复应用先前试验得到的信息来获得能够产生期望输出轨迹的控制输入，以改善控制质量。与传统的控制方法不同的是，迭代学习控制能以非常简单的方式处理不确定度相当高的动态系统，且仅需较少的先验知识和计算量，同时适应性强，易丁实现；更主要的是，它不依赖丁动态系统的精确数学模型，是一种以迭代产生优化输入信号，使系统输出尽可能逼近理想值的算法

2、。它的研究对那些有着非线性、复杂性、难以建模以及高精度轨迹控制问题有着非常重要的意义。最初的学习控制-迭代学习控制(ILC),由日本学者首倡丁 1978年。不像其他的的控制方法从线性受控对象起步，迭代学习控制开门见山就把非线性系统作为研究对象，且要在有限区间0,T上实现输出完全追踪的控制任务。这里完全追踪(perfect tracking)指系统的输出自始至终，无论是暂态还是稳态，都和目标轨道保持一致。显然，迭代学习控制的起点要比其它控制方法高出一截可是，从二十年的发展历程看，起点过高也有不利的一面：发展空间不足以及难以和主流控制方法相融合。而事实上，只要任务是可重复的，或系统干

3、扰是周期性的，都可用 ILC来解决实际问题。从迭代学习控制方法的产生至今已有二十多年的历史它已经发展成为智能控制领域的一个新的发展方向，它的研究对那些有着非线性、强耦合、难以建模以及高精度轨迹控制的问题有非常重要的意义。迭代学习控制适用丁具有重复运动性质的被控系统，它的目标是实现有线区间上的完全跟踪任务。它通过对被控系统进行控制尝试，以输出信号与给定目标的偏差修正不理想的控制信号，使得系统的跟踪性能得以提高。迭代学习控制的研究对具有较强的非线性耦合、较高的位置重复精度、难以建模和高精度轨迹跟踪控制要求的动力学系统有着非常重要的意义。2、迭代学习控制的原理设被控对象的动态过程为：

4、 .x(t) = f(x(t),u(t),t) , y(t) = g(x(t),u(t),t)(1)式中，xw Rn,yRm,uW Ry分别为系统的状态，输出和输入变量，f(jg(、)为适当维数的向量函数，其结构与参数均未知。若期望控制ud(t)存在，则迭代学习控制的目标为：给定期望输出yd(t麻日每次运行的初始状态xj0),要求在给定时间tw0,T】内，按照一定的学习控制算法通过多次的重复运行，使控制输入 ujt ud(t )，而系统输出yjt T yd (t )第k次运行时，式(1)表示为： .xk(t) = f (xk(t), uk(t),t), yk(t) =g(xk(t),uk(

5、t),t)(2)跟踪误差为：ek t =yd t -yk t迭代学习控制可分为开环学习和闭环学习。开环学习控制的方法是：第k+1次的控制等丁第k次控制再加上第k次输出误差的校正项，即Uk i(t) = L Uk t ,ek t闭环学习策略是：取第K+1次运行的误差作为学习的修正项，即Uk i(t) =L Uk t ,ek i t式中，L为线性或非线性算子。迭代学习控制的基本结构如图(1)所示控制输入Ukt被控系统yk tyd t期望输出Ukit迭代学习控制器图1、迭代学习控制系统模型图1中，系统输入为U(t卜输出为y(t),系统的期望输入yd(t),下标k表示迭代运算的次数，即使得在时间

6、 Nb,T】内，系统控制输入Uk(tJ Ud(t),系统的输出yk(t X yd(t )。所得的误差ek(t)经过迭代学习律得出下次的控制输入 U“(t) 并存入控制存储记忆单元，到下次控制时再调用。在每次迭代运算后，需要检验停止条件。若停止条件满足，则停止迭代计算2。3、迭代学习控制算法Arimoto等首先给出了线性时变连续系统的 D型迭代学习控制律 .Uz(t )=Uk(tek(t )(6)式中，r为常数增益矩阵。在d型算法的基础上，相继出现了 p型、pi型、 PO型迭代学习控制律。从一般意义上来看它们都是 PID型迭代学习控制律的特殊形式。PID迭代学习控制律表示为1uz(t )=

7、Uk(t ek(t)+eek(t(ek(t dt(7)式中，r,甲为学习增益矩阵。算法中的误差信息使用称为开环迭代学习控制，如果使用则称为闭环迭代学习控制，如果同时使用则称为开闭环迭代学习控制。此外，还有高阶迭代学习控制算法、最优迭代学习控制算法、遗忘因子迭代学习控制算法和反馈-前馈迭代学习控制算法等。4、迭代学习控制的关键技术4.1迭代学习控制的稳定性和收敛性稳定性与收敛性问题是研究当学习律与被控系统满足什么条件时，迭代学习控制过程才是稳定收敛的。算法的稳定性保证了随着学习次数的增加，控制系统不发散，但是，对丁学习控制系统而言，仅仅稳定是没有实际意义的，只有使学习过程收敛到真值，才能

8、保证得到的控制为某种意义下最优的控制。收敛是对学习控制的最基本的要求，多数学者在提出新的学习律的同时，基丁被控对象的一些假设，给出了收敛的条件。例如， Arimot。在最初提出PID型学习控制律时，仅针对线性系统在D型学习律下的稳定性和收敛条件作了证明。4.2迭代学习控制的初值问题迭代学习控制的初值问题是迭代学习系统的基本问题之一。在设计迭代学习系统时，为保证系统收敛性，往往要求每次迭代开始时刻的迭代初值与期望初值一致。然而，在实际场合，在迭代时难免存在着迭代初值与期望初值不一致的现象。因此，研究任意初值条件下迭代学习系统设计方法是十分重要的3。目前关丁初值问题的研究成果集中丁压缩映

9、射方法，常用的方法有：基丁 PD学习律，在固定初态下，这种根轨迹能够保证极限轨迹沿时间轴趋丁零；含平均算子的学习律；带初值脉冲作用的学习律，其中脉冲作用可以克服任意初值误差，实现从零时刻开始的完全跟踪；以及初值修正作用，提出的学习律实现从预先指定时刻起的完全跟踪，初始修正作用的值是有限的，因而克服了初值脉冲作用的缺陷。目前已提出的迭代学习控制算法大多数要求被控系统每次运行时的初始状态在期望轨迹对应的初始状态上，当系统的初始状态不在期望轨迹上，而在期望轨迹的某一很小的邻域内时，通常把这类问题归结为学习控制的鲁棒性问题研究。4.3迭代学习控制的鲁棒性问题由丁开环迭代学习控制算法只利用

10、了系统前次运行的信息，所以对不可重复的干扰不具有鲁棒性，对被控对象无镇定作用，在学习过程中即使学习律满足收敛条件也有可能产生很大的跟踪误差；而闭环迭代学习控制算法只利用了系统当前运行的信息，反馈增益必须大，才能精确的跟踪期望轨迹，但实现中由丁执行器饱和等因素，使得高增益反馈失去意义1。所以从控制信息的使用方面看，两者都存在一些缺陷10为了增强迭代学习控制系统的鲁棒性，常用的方法有：在开环 PID型迭代学习器的基础上引入一 PID反馈控制器，构成反馈-前馈迭代学习控制系统。4.4迭代学习控制的速度问题在迭代学习算法研究中，其收敛条件基本上都是在学习次数kT必下给出的。而在实际应用场合，学习次数 kTM显然是没有任何实际意义的。因此，如何使迭代学习过程更快地收敛丁期望值是迭代学习控制研究中的另一个重要 I可题。迭代学习控制本质上是一种前馈控制技术，大部分学习律尽管证明了学习收敛的充分条件，但收敛速度还是很慢。可利用多次学习过程中得到的知识来改进后续学习过程的速度，例如，采用高阶迭代控制算法、带遗忘因子的学习律、利用当前项或反馈配置等方法来构造学习律，可使收敛速度大大加快。5、总结由于迭代学习控制模拟了人脑学习和自我调节的功能，因而是一种典型的智能控制方

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

迭代学习控制

文档简介

温馨提示

最新文档

评论

迭代学习控制

文档简介

温馨提示

最新文档

评论

相关文档