版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
复杂机电控制7-迭代学习控制-2013-11-19第一页,共39页。第七章迭代学习控制
ILC(IterativeLearningControl)7.1迭代学习控制概述7.2迭代学习控制律7.3迭代学习控制简单实例第二页,共39页。遗传学习(RacialLearning):
具有生存能力的动物,使那些在它的一生中,能被它所经历的环境所改造的动物,一个能繁殖的动物,至少能够产生与它大略相似的动物,这种从一代到下一代的种族学习或系统发育学习.学习控制系统:
它能通过与被控对象和环境的闭环交互作用,根据过去获得的经验信息,逐步改进系统自身的未来性能。第三页,共39页。第七章迭代学习控制
ILC(IterativeLearningControl)1978年,Uchiyama(内山)在一篇有关机器人控制的论文中提出ILC思想(日文杂志Repetive),因文章是日文发表的,当时并未引起人们的重视。1984年,Arimoto
(有本)和其合作者们将内山的初步思想加以完善,建立了实用的算法,从理论上证明了这种算法的可行性而成为正规的迭代学习控制理论,并以英文发表了他们的研究成果,迭代学习控制ILC(IterativeLearningControl)才得以推广。第四页,共39页。迭代学习是模拟人的学习过程与特性,类似于人的“循序渐进”。
“Learningbytrail”边学边干的学习规律,使得对被控对象的动力学描述和参数化估计的复杂计算均可以简化或省略。第五页,共39页。第七章迭代学习控制
ILC(IterativeLearningControl)7.1迭代学习控制概述7.2迭代学习控制律7.3迭代学习控制简单实例第六页,共39页。7.1迭代学习控制概述迭代学习控制适用的场合,以及与其它控制方法的区别1.适合场合
可用于不确定的对象或非线性系统,但系统动作过程应具有自己的重复性。2.ILC和ANNC(人工神经网络控制)的区别
a.ANNC给定一样本,包含输入对应的输出结果。
b.ILC只给出期望的输出,需要获得合适的输入达到或接近期望的输出。两者通常都是离线使用学习结果。第七页,共39页。7.1迭代学习控制概述3.ILC和最优控制的区别最优控制通过对描述的数学模型的理论优化得到所需的控制量。ILC是通过先前多次的实验结果改进,来获得最优的控制量。第八页,共39页。7.1迭代学习控制概述4.ILC和自适应控制的区别
两者都是用来解决系统不确定的问题,均基于在线的参数调整算法,都要使用与环境、对象闭环交互得到的实验信息。自适应控制是在线的控制,用于缓慢的时变特性以及新型的控制局势,对严重的非线性问题失效。ILC的控制是在线的,而学习是离线的,适合于建模不良的非线性系统,但不宜用于时变动态系统。
ILC是在每次试验后离线实现控制,而自适应控制的算法是在线算法,且需要进行大量的计算。第九页,共39页。自适应控制和常规的反馈控制和最优控制一样,也是一种基于数学模型的控制方法,所不同的只是自适应控制所依据的关于模型和扰动的先验知识比较少,需要在系统的运行过程中去不断提取有关模型的信息,使模型逐步完善。具体地说,可以依据对象的输入输出数据,不断地辨识模型参数,这个过程称为系统的在线辩识。随着生产过程的不断进行,通过在线辩识,模型会变得越来越准确,越来越接近于实际。在这个意义下,控制系统具有一定的适应能力。比如说,当系统在设计阶段,由于对象特性的初始信息比较缺乏,系统在刚开始投入运行时可能性能不理想,但是只要经过一段时间的运行,通过在线辩识和控制以后,控制系统逐渐适应,最终将自身调整到一个满意的工作状态。再比如某些控制对象,其特性可能在运行过程中要发生较大的变化,但通过在线辩识和改变控制器参数,系统也能逐渐适应。第十页,共39页。7.1迭代学习控制概述ILC的定义1.从控制的角度定义它是通过对具有重复性的被控对象系统,利用先前的控制经验尝试,以输出的轨迹与给定的期望轨迹偏差修正不理想的控制信号,最终找出一个理想的输入特性曲线,使得系统跟踪期望输出结果的能力提高,最终达到所期望的输出或接近于许可的输出。第十一页,共39页。7.1
迭代学习控制概述2.数学描述ILC在有限的时间域[0,T]内,给定的被控对象期望的响应为yd(t),t∈[0,T],寻找某种给定的控制量uk(t),t∈[0,T],使其响应yk(t),t∈[0,T],在某种意义上对y0(t)(可理解为yk-1(t))有所改善,其中k为寻找次数,这样的过程称为学习控制过程。第十二页,共39页。7.1迭代学习控制概述3.ILC过程的机理是寻找并求得动态控制系统的输入、输出之间比较简单的关系。执行每一个由前一步控制学习结束更新的控制过程。改善每一个控制过程,使其性能优于前一个过程。
希望通过重复执行这种学习过程和记录全过程的结果,能够稳步改善受控系统的性能。第十三页,共39页。7.1迭代学习控制概述ILC的特点ILC适用于某种具有重复学习运动的被控对象,每次都做同样的工作。可实现完全的跟踪。学习过程只需要测量实际的输出结果和期望的信号,对被控对象的动力学模型描述和参数估计的一些复杂计算均可简化或省略。在不明确已知(甚至未知)的被控对象动力学特性的情况下设计控制器,故适合非线性系统。第十四页,共39页。7.1迭代学习控制概述5.在线控制负担小进行快速的运动控制,实时性好6.具有记忆功能,遇到类似的控制功能时,它能根据记忆录中的任务,快速调整控制任务。7.对干扰和系统的变化量有一定的鲁棒性。第十五页,共39页。7.1迭代学习控制概述四.适用工业领域具备重复运动的场合:计算机搬运,装配,生产线焊接工业,喷涂工艺,机器人数控加工中间的送进。第十六页,共39页。第七章迭代学习控制
ILC(IterativeLearningControl)7.1迭代学习控制概述7.2迭代学习控制律7.3迭代学习控制简单实例第十七页,共39页。7.2迭代学习控制律一、ILC的被控对象需满足的具体条件每次运行的时间间隔为固定的周期T;期望的给定输出yd(t)是t∈[0,T]域内的已知函数;每次运行前动力系统的初始状态Xk(0)相同,k是学习次数,k=(1.2.3…);每次运行的输出yk(t)均可测,误差值可获得e
k(t)=yd(t)–y
k(t);第十八页,共39页。6.系统的动力学结构在一次运行中保持不变ILC在线性定常系统,线性时变系统和非线性的系统中均收敛,但对系统滞后等不收敛。
5.下一次运行的给定uk+1(t)满足以下递推条件:一、ILC的被控对象需满足的具体条件第十九页,共39页。二、ILC的学习过程若第k次训练时期望输出与实际输出的误差为ek(t)=yd(t)–yk(t);t∈[0,T]第k+1次训练的输入控制uk+1(t)则为第k次训练的输入控制uk(t)与输出误差e
k(t)的加权和uk+1(t)
=uk(t)
+we
k(t)
在ILC中,控制用的学习是通过对以往控制经验(控制作用与误差的加权和)的记忆实现的,算法的收敛性依赖加权因子w的确定。这种ILC的核心是系统不变的假设以及基于记忆单元间断的重复训练过程,学习规律极为简单。第二十页,共39页。反馈通道控制器被控对象加权因子反馈通道控制器被控对象加权因子+++++++----+记忆学习控制器学习控制器可有多种不同的变化加权因子也可以用学习控制量代替即(可用于不同的控制方法)ILC的学习过程第k次操作第k+1次操作第k+2次操作…第二十一页,共39页。7.2迭代学习控制律三.迭代学习控制的任务
给出系统的当前输入和当前输出,确定写个期望输入,使系统的实际输出收敛于期望值。第二十二页,共39页。7.2迭代学习控制律四、迭代学习控制律两种基本形式的学习律是D型学习律和P型学习律,其中D型学习律是首先被提出来的一种。单纯的D型学习律可调整的参数只有学习增益KD,当KD确定后,学习系统的跟踪性能和收敛速度也基本上随之确定,为了提高收敛速度,改善跟踪性能,需要在学习律中增添可调整的参数项,因而产生了PD型、DI型学习律、PID型学习律,PID型学习律是三者中最为完善的学习律。第二十三页,共39页。7.2迭代学习控制律迭代学习的PID控制律第二十四页,共39页。7.2迭代学习控制律PID型学习控制律的增量算式:ek(t)=yd(t)–yk(t)对于采样时刻t=nT(T为采样时间)令第二十五页,共39页。第二十六页,共39页。7.2迭代学习控制律令u0(t)
=yd(t)
,将输出转化为增量形式:初始化条件为:第二十七页,共39页。五、迭代学习控制律的算法流程(1)置k=0,给定并存储期望的轨迹yd(t)以及初始的控制u0(t),t∈[0,T](2)通过初始的定位操作,使系统初始输出位于yk(0),相应的初态位于xk(0)(3)对被控对象施加输入uk(t),t∈[0,T],开始反复操作,同时采样并存储系统的输出yk(t),t∈[0,T],(4)计算输出的误差ek(t)=yd(t)-yk(t),t∈[0,T](5)由学习控制律计算并存储新的控制输入uk+1(t)=uk(t)+△uk(t),t∈[0,T](6)将uk+1(t)施加给系统,产生yk+1(t),ek+1(t)(7)检验迭代停止条件:‖yd(t)-y0(t)‖<ε,式中ε为给定的允许跟踪精度。若条件满足则停止运行,否则置k=k+1,转步骤(2)第二十八页,共39页。第七章迭代学习控制
ILC(IterativeLearningControl)7.1迭代学习控制概述7.2迭代学习控制律7.3迭代学习控制简单实例第二十九页,共39页。7.3迭代学习控制简单实例例如直流电动机驱动的单自由度线形机械系统,如下图所示为系统方框图,其中y(t)为电动机的角速度,u(t)为输入电压。K1+-K2(1)系统描述该闭环系统用微分方程表示为:其中第三十页,共39页。当初始时刻取为零时,方程的解为:(2)控制任务在区间[0,T]上给定一个期望的角速度yd(t),寻求电压u(t)使得电机输出角速度y(t)在[0,T]上与yd(t)尽可能一致(3)确定输入数据选择任何一个输入电压u0(t),t∈[0,T],将y
d(t)和u0(t)存入存储器中,通过初始定位操作,使系统位于yk(0)(4)施加初始的输入电压u0(t)使系统运行得到y0(t),则e0(t)=yd(t)-y0(t)第三十一页,共39页。(5)以D型学习律计算新的输入电压,并获得下一次误差(6)迭代过程第三十二页,共39页。y
k(t)t设期望轨迹为yd(t)=t,t∈[0,1],初始条件yk(t)=
yd(t)(k=0,1,2,…)下,选取初始控制u0(t)=0,迭代输出轨迹如图所示。图中y9(t)与yd(t)(红色的线)重合,即迭代第9次达到期望。第三十三页,共39页。
移动机器人轨迹跟踪迭代学习控制
移动机器人是一种在复杂的环境下工作的具有自规划、自组织、自适应能力的机器人。在移
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 象思维:开启大学教学美的新视野
- 谷氨酰胺对窒息足月新生儿肠粘膜屏障功能影响的随机双盲探究
- 调节性匹配:解锁消费者重复购买动机的关键密码
- 2026年上半年广东“百万英才汇南粤”广州市越秀区教育局第二批招聘事业编制教师80人笔试模拟试题及答案详解
- 诺斯卡品逆转卵巢癌细胞顺铂耐药的多维度机制解析与展望
- 2026江西九江市濂溪区国有企业招聘13人笔试备考试题及答案详解
- 2026年度临沂市市级机关公开遴选公务员工作有关问题解答考试模拟试题及答案详解
- 语义透明度与语境:初中生英语复合词词义猜测的多维解析
- 2026陕西西安交通大学临港实验室招聘实习生12人笔试备考题库及答案详解
- 2026重庆地产集团有限公司公开招聘12人笔试模拟试题及答案详解
- 中国戏曲剧种鉴赏智慧树知到期末考试答案章节答案2024年上海戏剧学院等跨校共建
- 制糖业的环保措施
- 韶音供应商QSA+QPA审核-checklist-V1
- 开胸心肺复苏术技术操作规范
- JGT483-2015 岩棉薄抹灰外墙外保温系统材料
- 减压赋能-轻松前行心理课件
- 建筑节能技术及应用课件
- 墩柱模板计算书1
- 中职数学基础模块下册第八章《直线和圆的方程》单元检测试题及参考答案
- 幸存者偏差理论
- 初中英语语法中考复习词性转换精讲 课件 (共14张PPT)
评论
0/150
提交评论