(电力系统及其自动化专业论文)基于自适应神经模糊推理系统的迭代学习控制初始控制策略研究.pdf_第1页
(电力系统及其自动化专业论文)基于自适应神经模糊推理系统的迭代学习控制初始控制策略研究.pdf_第2页
(电力系统及其自动化专业论文)基于自适应神经模糊推理系统的迭代学习控制初始控制策略研究.pdf_第3页
(电力系统及其自动化专业论文)基于自适应神经模糊推理系统的迭代学习控制初始控制策略研究.pdf_第4页
(电力系统及其自动化专业论文)基于自适应神经模糊推理系统的迭代学习控制初始控制策略研究.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(电力系统及其自动化专业论文)基于自适应神经模糊推理系统的迭代学习控制初始控制策略研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于自适应神经模糊推理系统的迭代学习初始控制策略研究 ab s t r a c t n e r a t i v el e a m i n gc o n t r o l i sat e c h n i q u ef o ri m p r o v i n gt h et r a n s i e n tr e s p o n s e 锄dt r a c l ( i n g p e 而r m a n c eo fp r o c e s s e s ,m a c h i n e s ,e q u i p m e n t ,o rs y s t e m st h a te x e c u t et h es a m e t r a j e c t o r y , m o t i o n ,o ro p e r a t i o nr e p e t i t i v e l y t h ei d e ab e h i n di t e r a t i v e1 e a m i n gc o n t r o li s t h a ti ft h e s y s t e m so p e r a t i n gc o n d i t i o n sa r et h es a m ee a c ht i m e si te x e c u t e st h e na n ye 1 1 r o r sl nt h e t r a d d n gr e s p o n s ew i l lb er e p e a t e dd u r i n ge a c ho p e r a t i o n t h e s ee h o r sa n dt h ec o n t r o l i n p u t s i g n a lc a nb er e c o r d e dd u r i n ge v e r yr e p e t i t i o na n dt h i si n f o r m a t i o n c a nb eu s e dt oc o m p u t ea n e wi n p u ts i g n a lt h a tw i l lb ea p p l i e dt ot h es y s t e md u r i n gt h en e ) ( tr e p e t i t i o ns ot h a tt h e t r a c k i n ga c c u r a c yw o u l db ei n c r e a s e da st h en u m b e ro fr e p e t i t i o n s i n c r e a s e s w i t ht h e e m e r g i n go ft h ec y c l i co fr e p e t i t i v es y s t e m so rp r o c e s s e si ni n d u s t r y ,i t e r a t i v el e a r n i n gc o n t r o l h a sb e c o m eak e yt e c h n i q u eo fa d v a n c e dc o n t r 0 1 s h o wt oc h o o s et h e 叩p r o p r i a t ei n i t i a lc o n t r o l i n p u tv a l u ef o r t h es y s t e m ( t h ec o n t r o l i n p u t w h e nt h ef i r s ti t e r a t i o n ) i so n ee h e c t i v ew a yt om a k et h es y s t e ma c h i e v et h ed e s i r e dt r 萄e c t o 叮 t r a c k i n gi nh i g h - p r e c i s i o nu s i n gl e s si t e r a t i o n s h o w e v e r ,p r e v i o u ss t u d i e so nt h es e l e c t e d i n i t i a lc o n t r o li n p u tv a l u ei ss u b je c t i v e ,b l i n d ,a n dg e n e r a l l ys e ti ta sz e r oo rab o u n d e d r a n d o mq u a n t i t y i no r d e rt oa v o i dt h eb l e n dc h o i c eo ft h ei n i t i a lc o n t r o li n p u ti ni t e r a t i v el e a r n i n gc o n t r o l 、h e nt h ec o n t r o ls y s t e mf a c e dan e wd e s i r e dt r 面e c t o r y t r a c k e dt a s ko ran e we n v i r o n m e n t l e a dt ot h ee x i s t e n c eo ft a s k ss u c ha s :1 ) t h ec o n v e 唱e n c es p e e di sa 矗e c t e db e c a u s eo ft h e r e e x p e r i e n c e di t e r a t i v el e a m i n gp r o c e s ;2 ) i nt h ef i r s tc y c l e o ft h en e wt a s l ( t h ei n i t i a lc o m r 0 1 i n p u th a sn o 如n c t i o nt ot h ev o l u m eo u t p u to ft h es y s t e r i l ,o re v e nh a sc o u n t e 印r o d u c t i v e b e c a u s eo ft h ea b s e n c eo fa m e n d m e m st oc o n t r o lt h ei m p o r t a t i o no ft h ei n i t i a lv a l u e , i n c r e a s i n gt h e1 e a r l l i n gt i m ea n dt h ei m n l b e ro fc y c l e sa n ds oo n a ni m p r o v e da l g o r i t h mi s p r o p o s e dt oo b t a i nt h ei n i t i a lv a l u eo ft h ei t e r a t i v el e a r n i n gc o m r o lb a s e do nb pn e u r a l n e t w o r ka n da d a p t i v en e u r a l m z z yi n f e r e n c es y s t e m d e s i r e dc o n t r o li n p u to fi t e r a t i v e l e a r n i n gc o n t r o li s e s t i m a t e db a s e do nt h ee x p e r i e n c eo ft h ep a s tc o n t r o le x p e r i e n c e u s i n gt h en e wd e s i r e dt r a j e c t o r y t r a c k e dt a i ( t h es y s t e mo u t p u t ,s y s t e m s t a t ea n dl t s d e r i v a t i v e 嬲i t si n p u t t h es i m u l a t i o nr e s u l t ss h o wt h a t :1 ) t h e s em e t h o d si sf e a s i b l ea n d e f r e c t i v ef o rd i f r e r e n tn o n 1 i n e a ro b j e c t ;2 ) f o rd i n e r e n ti t e r a t i v el e a r n i n ga l g o r i t h m ,u s i n gt h e a b o v e m e n t i o n e dm e t h o dt 0d e t e m l i n et h ei n i t i a lc o n t r o li n p u tc 锄仃a c kt h ec h a n g e d e x p e c t a t i o n st r a j e c t o r yi nas m a l l e rt r a c k i n ge r r o rt h a j lt h ez e r oi n i t i a lv a l u ec o n t r o li n p u t , r e d u c et h en u m b e ro fi t e r a t i o n si nt h es a m er e q u e s tt 0t h et r a c k i n ga c c u r a c y k e yw o r d s :i t e r a t i v el e a r i l i n gc o m r o l ,d a t a b a s e ,i n i t i a lc on t 】r o l ,a d a p t i v en e u r a l f u z z y i n f e r e n c es y s t e m ,b pn e u r a ln e 柳o r k 硕士学位论文 插图索引 图2 1 迭代学习控制原理9 图2 2 两种控制过程的比较1 0 图2 3 迭代学习控制示意图1 0 图2 4 学习律的两种计算方式1 图2 5 神经网络基本结构2 2 图2 6 模糊逻辑系统2 4 图2 7自适应网络结构2 6 图3 1 迭代学习控制初始控制控制原理框图3 1 图3 2 迭代学习控制初始控制算法流程3 7 图4 1d 型学习律4 1 图4 2p 型学习律一4 l 图4 3b p 网络结构图4 2 图4 4 迭代学习控制的算法流程一4 3 图4 5 基于神经网络控制的迭代学习初始控制原理框图4 4 图4 6 隐层节点数。= 9 时的网络训练图一4 6 图4 7 隐层节点数。= l o 时的网络训练图4 7 图4 8隐层节点数。= 1 1 时的网络训练图4 7 图4 9 隐层节点数。= 1 2 时的网络训练图4 7 图4 1 0 隐层节点数= 1 3 时的网络训练图4 8 图4 1 1 隐层节点数。= 1 4 时的网络训练图4 8 图4 1 2 隐层节点数= 1 5 时的网络训练图4 8 图4 1 3 系统输出初始的期望轨迹y 胡4 9 图4 1 4 系统输出新的期望轨迹y 拼5 0 图4 1 5p 型迭代学习算法输出跟踪曲线5 0 图4 1 6p 型迭代学习算法误差输出曲线5 l 图4 1 7 系统均方误差与迭代次数关系曲线5 l 图4 1 8 系统( 1 ) 的逆模型数据库5 3 图4 1 9 6 岍i s 几c 的结构框图一5 3 图4 2 0 舢师i s i l c 算法工作流程图5 4 图4 2 1 系统现有轨迹跟踪控制经验曲线图1 5 5 图4 2 2 系统现有轨迹跟踪控制经验曲线图2 5 5 图4 2 3 系统现有轨迹跟踪控制经验曲线图3 5 6 图4 2 4 系统新的轨迹跟踪曲线图5 6 图4 2 5 系统均方误差与迭代次数关系曲线5 7 基于自适应神经模糊推理系统的迭代学习初始控制策略研究 附表索引 表2 1 心旺i s 学习过程的两个通道2 7 表4 1不同隐层节点网络误差及训练次数4 9 兰州理工大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取 得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其 他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个 人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果 由本人承担。 储虢平赫 日期:卅年石月,日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学 校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文 被查阅和借阅。本人授权兰州理工大学可以将本学位论文的全部或部分内容 编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇 编本学位论文。同时授权中国科学技术信息研究所将本学位论文收录到中 国学位论文全文数据库,并通过网络向社会公众提供信息服务。 作者签名 导师签名 日期:硼罗年月,日 日期:砷年舌月日 硕士学位论文 第1 章绪论 从根本上讲,控制系统设计中的问题可以归纳为两类:调节问题和跟踪问题。而调 节问题可以看成跟踪问题的特殊情况。尽管对于跟踪问题,控制理论已提供了的各种设 计方法,并取得了良好的效果,但绝大多数控制技术都是渐近地实现跟踪任务的。如果 希望实现被控系统的输出零误差地完全跟踪期望轨迹,无疑是一个吸引人的具有挑战性 的控制任务。迭代学习控制技术就是针对这种控制任务提出来的,它从一个不同的角度 构造控制律,能够克服一些传统控制方法难以逾越的困难。 迭代学习控制适用于具有重复运动性质的被控对象,可实现有限时间区间上的完全 跟踪任务,与现有的控制方式相比,迭代学习控制的特点是充分利用前几次的控制信息 构成当前的控制输入信号,且不依赖被控系统的详细模型,由于它的简捷有效而受到各 国科研工作者的极大关注,在许多领域内相机得到广泛应用,许多相关的论文和专著陆 续发表。 迭代学习控制经过二十多年的快速发展,己成为智能控制的重要组成部分。由于迭 代学习控制是目前已有智能控制方法中有着严密数学描述的一大分支,在神经网络、模 糊技术等相继陷入发展瓶颈的今天,迭代学习控制方法及其应用研究仍然显示出强大的 生命力和广阔的提升空间。 迭代学习控制所追求的目标无疑是使系统以较少的迭代次数实现对期望轨迹的高 精度跟踪。对于经常面对新环境、新任务的系统( 如室外移动机器人等) ,这方面的要 求更显得突出。要达到这一目标,多数学者从学习算法的方面入手,主要是通过提高学 习速度、加快收敛来实现迭代次数的减少和跟踪精度的提高。目前这方面的研究文献很 多,但大多数的成果均不具有一般性,只能通过具体的仿真实例来验证。为实现上述目 标,本文将从另一个方面入手进行研究,通过某种方法有效确定第一次迭代时的控制输 入( 以下称初始控制) ,使得首次跟踪期望轨迹时便表现出较高的控制精度,以此实现 以很少的迭代次数实现对期望轨迹的高精度跟踪。希望本文的工作能为迭代学习控制理 论的发展起到积极地促进作用。 1 1 迭代学习控制 智能控制大致可分为基于人工智能的和基于数学描述的两大类。前者以专家控制为 代表,后者有如神经网络控制、基于小脑模型的联想记忆学习控制器、迭代学习控制、 重复学习控制及自动机等。在基于数学描述的智能控制器中又可分为基于参数和基于品 质的两大类。前者需要在线辨识被控对象的参数,后者不需要在线辨识被控对象的参数, 基于自适应神经模糊推理系统的迭代学习初始控制策略研究 而是根据控制的效果,即“品质 来修正控制器的参数。 迭代学习是一种基于品质的智能控制方法【l 】o 早在7 0 年代末,日本学者u c h i y a m a 【2 】 在研究高速运动的工业机械手的控制问题时,提出了这样一个思想:不断重复一个同样 轨线的控制尝试,并以此修正控制律,能达到较好的控制效果。这就是最早的迭代学习 控制的思想,由于当时的文章是用日文发表的,因此并没有引起控制界的广泛重视。 缸i m o t o ,k a w a n l u r a ,m i v a z a k i 等人【3 】发展了u c h i v a m a 的思想,于1 9 8 4 年正式提 出了迭代学习控制( i t e r a t i v e1 e a r n i n gc o n t r o l :c ) 的概念,并以英文发表,将上述思想加 以完善,建立了实用的算法,并从理论上证明了这种算法的可行性,开创了一个新的研 究方向。 迭代学习控制是人工智能与自动控制相结合的新的学习控制技术,是智能控制中具 有严格数学描述的一个分支,是智能控制领域中研究、开发及应用的重要发展方向之一 f 4 。】。它适用于具有某种重复运动( 运行) 性质的被控对象,诸如进行搬运、装配、焊 接、喷涂等任务的工业机器人,它的目标是实现有限区间上的完全跟踪任务。通过对被 控系统进行控制尝试,以输出信号与给定目标的偏差修正不理想的控制信号,使得系统 的跟踪性能得以提高。迭代学习控制具有拟人的学习过程与特性,类似于人的循序渐进 的学习规律、边学边干的学习方法,因而迭代学习控制的研究对具有较强的非线性耦合、 较高的位置重复精度、难以建模和高精度轨迹跟踪控制要求的动力学系统有着非常重要 的意义【6 1 。 迭代学习控制理论最初是针对机器人系统的跟踪控制问题提出的,经过几十年的发 展,迭代学习控制在机器人领域取得了很大的成果。迭代学习控制能够精确逼近期望轨 迹的优越能力使人们期望将它拓展应用到其它工业生产过程的控制上。除机器人系统 外,目前迭代学习控制的应用主要集中在工业生产过程中的数控车床、包装机、电力系 统、直线电机、工业稳态优化、周期信号跟踪、半导体晶片生产和过程工业中的批处理 过程等,主要原因在于它们都具有明显的重复运动特性,可以利用现有的迭代学习控制 技术改善其控制系统的动态性能。文 7 】详细地讨论了迭代学习控制的工程应用,并具体 地论述了控制器的设计问题。 1 1 1 迭代学习控制的发展 迭代学习控制的思想最初起源于有关机器人控制的问题,后来人们发现,对具有重 复运动特征的被控系统,都可以利用迭代学习控制技术改善其控制系统的动态性能。 迭代学习控制的研究,来源于从经验中学习知识这一深刻认知。设计一种控制器, 让这种控制器本身具有某种“智能 ,即能在系统运行中估计未知的信息并基于这个估 计的信息确定最优控制,使它在控制过程中能不断地完善自己,也就是不断训练控制器, 以使控制效果越来越好。这种具有“学习”能力的控制器一直是控制工程师所追求的目 标。换句话说,当我们重复完成某项控制任务的时候,我们从过去的控制输入和跟踪 误差数据中获得额外的信息,这种信息我们把它看成是一种经验,一种关于动态过程模 型的经验知识。利用这种经验知识,我们降低了对过程模型的依赖,并且提供了改进跟 硕十学位论文 踪控制性能的可能性【引。 1 1 2 迭代学习控制的国内外研究现状 自1 9 8 4 年“m o t o 针对机器人系统的特点,模拟人类学习技能的过程,开创性地 提出迭代学习控制概念以来,迭代学习控制直是控制界的研究热点领域之一。研究人 员针对不同类型的对象,提出了形式多样的迭代学习控制律,并在定的前提假设条件 下,利用各种数学工具,分析得到了迭代学习控制的收敛性条件。1 9 9 2 年,m o o r e 对初 期的迭代学习控制研究作了较全面的综述,1 9 9 3 年,他写了迭代学习控制方面的第一本 专著【9 1 。之后,迭代学习控制研究又取得了大量的成果,1 9 9 8 年,m 0 0 r e 再次撰写了一 篇以2 5 4 篇迭代学习控制方面的研究论文作为参考文献的总结性综述论文,详细评述和 归纳了截止到1 9 9 7 年的迭代学习控制研究的进展【1 0 l 。国内外都存在着多个迭代学习控 制的研究小组,近几年来,他们的努力使得新的研究成果仍然层出不穷。近十几年来, 每届c d c 、a c c 和a c 等控制方面的大会都有迭代学习控制的分专题。国际著名的 控制类杂志之一i n t e m a t i o n a lj o u m a lo f c o n t r o l 在2 0 0 0 年出版了一期迭代学习控制的专 辑( v 0 1 7 3 ,n o 1 0 ) 【l l 】,介绍了一些新的研究成果。这一切都说明了迭代学习控制研究的 意义和活跃性,同时也表明迭代学习控制的理论还不能认为已经完善。 1 迭代学习控制的研究现状 迭代学习控制的研究内容主要包括学习律、学习算法的收敛性、鲁棒性、收敛速度、 迭代学习控制的分析方法、初值问题及迭代学习控制的应用等问题。 学习律即迭代学习控制的算法。学习律的研究是迭代学习控制的基础,包括提出新 算法、放宽收敛条件、加快收敛速度等。根据u 。( f l f ) 的不同形式,可以得到不同的学 习律,其中最基本的有p 型、d 型、p i d 型学习律。d 型学习律是首先被提出的【引,同 时也是研究最为成熟、应用最广的一种学习律。由于它采用了误差信号的微分形式,学 习律的收敛条件简单而又清晰。而p 型学习律,它不要求误差信号的微分形式,具有在 物理上易于实现等优点,故引起了广泛的注意。 迭代学习的收敛性是研究当学习律和被控对象满足什么条件时迭代学习控制过程 是稳定的和收敛的。学习算法的收敛性是保证学习控制能够进行的基本前提。时i m o t o 在最初提出p d 型学习控制律时,就己经对线性系统在d 型学习律下的收敛性作了证 吲引。后来的许多学者对其他系统( 非线性连续系统、离散系统、分布参数系统、广义 系统以及相应的滞后系统等) 作了相应的研究,得到了大量的具有稳定性和收敛性的学 习律。 迭代学习控制的鲁棒性是指当重复操作环境下的受控系统存在初态偏差、状态扰动 和量测噪声以及期望轨迹变动时,由几c 算法给出的跟踪轨迹会收敛到期望轨迹的某个 邻域内,该邻域大小是关于干扰上界的函数;当干扰不存在时,该邻域宽度为零( 即算 法收敛) 。鲁棒性研究当系统存在不确定扰动、测量误差以及初始条件偏差时,在各种 学习律下,被控系统迭代学习控制过程的稳定性与收敛性问题。迭代学习控制鲁棒性问 基于自适应神经模糊推理系统的迭代学习初始控制策略研究 题最早由心i m o t o 等【1 2 j 提出,且在后来的文章中做了深入的讨论,随后很多学者对其进 行了讨论。h e i n z i n g e r 【1 3 】首次针对带遗忘因子的d 型学习律分析了非线性系统的鲁棒性。 林辉等1 1 4 】和c h i e n 等【1 5 】将鲁棒性问题的讨论推广到一般非线性系统,并以p 型学习律为 例,给出了鲁棒性分析的理论结果。 对于迭代学习控制一个重要的研究问题就是如何使学习控制过程更快地收敛于期 望值,即研究学习算法的学习速度( 收敛速度) 问题。它是研究对于给定的被控系统, 在各种不同的学习律下,系统的输出收敛到给定的性能指标与哪些因素有关,以期利用 最优的学习律和最佳的系统构成,获得最快的收敛速度问题。影响学习速度的因素很多, 学习律本身就是一个重要的方面。此外,学习律参数的选取、初始控制输入的确定、跟 踪区间的大小、对控制系统的了解程度等都将影响到学习律的收敛速度。 迭代学习控制的分析方法是指用于分析控制过程的理论方法,包括时域分析法、频 域分析法、二维系统分析法等。 初值问题是指控制过程中系统初始状态与收敛性的关系。在迭代学习控制理论研究 中,一般都假定被控对象在每次运行的初始状态精确地定位在期望轨迹上或者在期望轨 迹的某一很小邻域上。l e e 等【1 6 】针对连续线性系统,分两种情况讨论了具有非零初始偏 差的d 型和p d 型迭代学习控制问题:每次迭代的初始状态与期望轨迹对应的初始状态 不同,但初始偏差保持不变,即( o ) 一吻( o ) = ;每次迭代的初始误差是变化的。结 果表明,具有不变初始误差的迭代学习控制系统的性质优于具有变化误差的迭代学习控 制系统。任雪梅等【1 7 】给出了任意初始状态下的迭代学习控制,通过对系统的控制输入和 初始状态同时学习来实现系统的完全跟踪。c h e n 等【18 】针对线性系统和非线性系统,利 用文献 1 7 中相同的控制策略,讨论了迭代学习控制问题,得到了跟踪误差的一致有界 性,且跟踪误差的界只与系统的不确定项和扰动项有关,而与初始误差无关。 随着迭代学习控制研究的不断深入及智能控制的不断发展,在近年来出现了迭代学 习控制与其它控制方法的结合。先进的控制技术越来越多地与迭代学习控制相结合,由 此产生了各种新的算法,如遗忘因子学习律【1 9 】、自适应学习律【2 0 1 、模型参考学习律【2 k 2 2 】以及分别基于模糊控制、优化理论、神经网络、系统辨识等的新型学习律。 2 迭代学习控制应用的研究现状 迭代学习控制在机器人控制的应用中,有一种离线计算方式,可以改善柔性关节控 制器的跟踪特性,使用该方法不必详细了解机器人的动态特性和关节柔韧性,迭代误差 可以收敛至有限范围内,如果适当选择学习控制参数可以减小此范围。 迭代学习控制用于批处理过程时可以采用l q ( l i n e a rq u a d r a t i c ) 系统设计方法, 它是一种工程上用于设计高性能迭代学习控制律的有效方法,并且易于在实际中使用。 迭代学习控制在包装机的应用中,可以使被包装的液体溅出量控制在最小,它将被 包装物体的加速作为控制输入,液体的溅出量作为系统输出,液体的水平升高分向前和 向后两个方向测量,将被包装的液体溅出量最小作为目标函数。 硕士学位论文 将迭代学习控制用于滚轧机的运行控制时,运行速度分“穿行速度 和“运行速度 , 速度变化时,机器的咬合摩擦力也随之变化,从而使线圈的规格和拉力也变化,采用迭 代学习算法控制规格和拉力,以补偿由咬合摩擦力变化而引起的干扰。 迭代学习控制可用于电力系统的可控串补控制,控制目标是当系统受到扰动,功角 摇摆较大时使t c s c 的容抗增大,以提高系统的稳定极限,反之应减小t c s c 的容抗。 与常规p i d 控制相比,该方法具有较强的适应性。 1 1 3 迭代学习控制存在的问题 迭代学习控制算法简单,特别适用于机器人等重复控制的场合。但从目前发展情况 来看,存在以下几个问题【2 3 】: ( 1 ) 初态问题。就目前发表的大量文献,有关几c 收敛性的证明很大程度上都对每 次运行的初始状态作了限定,严格的限定为每次相同,放大的限定为有界的领域内。但 在实际系统中,零初始偏差是很难保证的。 ( 2 ) m c 的泛化问题。泛化问题即非一致轨迹跟踪问题,在实际工程中存在跟踪轨 迹并不是每次严格一致的情况。由于现有的m c 算法都是针对某一特定的轨迹来学习 的,因而对这一轨迹可以实现很好的跟踪,但期望轨迹改变时就必须重新学习,缺少泛 化能力。因此能否通过迭代学习了解过程的机理信息,不依赖参考轨迹的信息仍能保证 跟踪误差的收敛性,使几c 具有泛化能力。 ( 3 ) 收敛速度问题。对几c 算法不仅要考虑其收敛性,还要考虑其收敛速度,一般 来说,稳定性和收敛速度是成反比关系,如何兼顾是值得探讨的问题。目前收敛性分析 较多,而收敛速度的分析较少,一些重要的学习算法收敛速度慢的问题仍没有解决。 1 1 4 迭代学习控制的未来发展方向 ,迭代学习控制理论与其他控制理论的结合是最近几年其发展的主要特性,并且取得 了大量成果,这也体现了现代控制方法的交叉和互相渗透,取长补短。 ( 1 ) 最优控制理论的结合。在最优控制理论中,要根据系统的精确数学模型来进行 最优设计,如果系统模型改变则最优控制器将不是最优的。将最优控制和迭代学习控制 结合起来可以提高迭代学习控制的收敛速度,即引入某个目标函数,采用最优化方法设 计最优学习控制律。文献 2 3 】跟踪误差的二次型性能为优化目标,通过极小化目标函数, 导出相应于开、闭环p 型学习律的新型控制策略,并给出了收敛条件。 ( 2 ) 与自适应控制理论的结合。自适应控制系统中,学习指的是控制器的在线修正, 虽然自适应控制具有对环境变化的适应性和对建模误差的不敏感性,但在线辨识参数需 要庞大计算。而迭代学习控制是一种离线的学习过程。通过仿效人的学习经验,并重复 执行同一任务来减小误差。所以将迭代学习控制和自适应控制结合将有很大的实际意 义。 基于自适应神经模糊推理系统的迭代学习初始控制策略研究 ( 3 ) 与智能控制的结合。现有的迭代学习控制只能用于某种特定的轨迹跟踪问题。 学习的结果是记忆控制过程,一旦要求改变控制轨迹,就必须重新学习。因而属于“死 记硬背式学习,没有较好的联想、推广等知识应用能力。迭代学习控制与专家系统、 神经网络等智能控制的结合可以弥补迭代学习控制的这一缺陷,通过抽象学习结果的特 征信息,从而提高系统的智能化程度。文献【2 4 采用三个控制器反馈控制器、迭代 学习控制器和神经网络控制器的结构。反馈控制器用于镇定系统和改善系统瞬态,迭代 学习控制器学习系统短记忆知识,神经网络控制器学习系统长记忆知识,当期望系统改 变时,系统不用重新学习。 当过程的机构和参数不完全己知时,通过与其它控制器的结合,引入过程模型和参 数的在线辨识,给现有的i l c 应用开辟更广的领域,成为迭代学习控制的发展趋势。 1 2 自适应神经模糊推理系统在迭代学习控制初始控制中的应用 基于以上迭代学习控制中存在的问题:一旦实际系统面临新的环境和控制任务,则 系统必须重新学习,即现有的迭代学习控制方法对于某种特定的轨迹跟踪问题具有良好 的控制效果,学习的结果是记忆下控制输入却f f ) ,一旦期望输出轨迹改变就必须重新学 习,因而属于“死记硬背 式的学习。也即学习控制过程依赖于看起来似乎已知,但实 际上是未知的2 ,。( f ) 的一些信息,而如何充分利用控制系统先前控制经验的所有信息, 以及这些信息利用与学习控制过程收敛的关系就成为了研究的关键所在。 一直以来,对于迭代学习控制,研究人员的研究热点多集中于学习律的提出及学习 算法的改进上,而对于迭代学习控制中系统先前的控制经验没有应用或是较少应用,而 迭代学习控制没有一个动态系统的最初的知识,所以在迭代的开始,常常会有一个特别 大的偏差出现,并且偏差趋向于零的过程非常缓慢。在传统的迭代学习控制应用中,对 于初始控制量的选择没有一个很好的方法。一部分应用是选择一个常值作为初始控制 量,另一部分应用是选择前一次迭代学习结束时的控制量作为本次任务的初始控制量, 然后完全依靠学习律算法进行修正,这样做的后果是在新的运行任务的第一个周期,控 制量对于系统的输出完全没有作用,甚至起反作用,大大增加了学习的时间以及周期数。 如何充分利用迭代学习控制系统先前的控制经验以期获取有效的初始控制输入进而使 迭代学习次数减少、收敛速度加快就成为了迭代学习控制中一个亟待解决的问题。1 9 9 9 年心i f 掣2 5 】针对迭代学习控制过程中对于控制系统先前的控制经验没有利用或是利用 不充分的问题提出了利用控制经验建立经验数据库进而获得有效的初始控制输入;同年 心i f 等【2 6 】又对该控制方法的收敛性进行了证明,同时得出了该控制方法能够使得系统收 敛速度加快的结论。2 0 0 1 年,m c c a m p i 掣2 7 】也相继给出了利用经验数据建立专家 数据库的方法;同年,舡i f 掣2 8 】再一次利用局部加权的控制算法获得最佳控制输入以使 带有初始控制输入的迭代学习控制策略初成体系。2 0 0 4 年杨胜跃【2 州等给出一种利用先 前的经验数据,建立专家数据库的方法,并采用线性加权、拟合曲线法、人工神经网络 逼近法、模糊映射法等方法确定新环境下的初始控制输入量,对心i f 等人的思想做了进 硕士学位论文 一步验证和改进。这一且都说明了迭代学习控制初始控制策略研究的意义和活跃性,同 时也表明了该控制方法还有进一步研究的意义。 自适应神经模糊推理系统( a d a p t i v en e u r a l f u z z yi n f e r e n c es y s t e m :舢盯i s ) 是一种将 模糊逻辑系统( f l s ) 和人工神经网络系统( 删相结合,利用两者各自的优点所形成的混 合智能系统。2 0 世纪9 0 年代初期到中期,基于f l s 和址州有机结合的混合智能系统n f s 从思潮初起到逐步成熟,其中心师i s 是这个潮流中具有代表性的一个成果,m 盯i s 具有 以下一些特色和优点,使之能在许多方面获得成功的应用。 1 ) 系统构成思想深刻又直观以具有仿人高层思维能力的模糊知识库为骨架,以具 有仿人低层学习功能的神经网络表述上述骨架从而使整个系统具有对环境和被控对象 动态变化的适应能力。 2 ) 推理、合成计算简单系统从输入到输出的推理、合成异常方便、直接,省去了 一般模糊系统在清晰化过程中所花费的大量计算。 3 ) 学习方法合理有效其混合学习方案用b p 算法辨识前件参数、用最小二乘法辨识 后件参数,使两种辨识算法各得其所、互为补充,提高了参数估计的准确性,加快了收 敛进程。 4 ) 获得了广泛的应用砧师i s 除了在控制和模型化方面的一些应用之外,在模式识 别、非线性数据回归、自适应信号处理等方面均有应用。 5 ) 目前舳吓i s 只有参数学习能力,不具备结构学习能力,它的知识库的构成需由 研究者根据先验知识确定,如何打破这一限制,使知识库的建立也在学习的基础上实现, 是值得进一步研究的问题。 利用自适应神经模糊推理系统对于迭代学习控制的初始控制输入进行有效选取,使 得系统能够获得更快的收敛速度和更佳的收敛性能,将是本文重点研究的问题。 1 3 本文的主要工作和章节安排 1 3 1 主要工作 本文主要对迭代学习控制初始控制策略,以及b p 神经网络和自适应神经模糊推理 系统在迭代学习控制初始控制中的应用进行了研究,所做的具体工作主要有: 1 具体阐述了迭代学习控制的产生、发展,以及其基本原理、数学描述和目前的 研究隋况,并介绍了基础的迭代学习算法_ p 型、d 型算法,并对其收敛性进行了分 析。 2 具体介绍了人工神经网络控制、模糊推理及自适应神经模糊推理系统的产生、 发展,以及控制器构成、基本原理等。 3 针对非线性被控对象,将p 型、d 型迭代学习算法应用于基于b p 神经网络及自 适应神经模糊推理系统的迭代学习初始控制策略中,并进行了仿真实验,对几种迭代学 习算法的应用进行了对比。 基于自适应神经模糊推理系统的迭代学习初始控制策略研究 1 3 2 章节安排 全文共分四章,主要内容包括如下下几个方面: 第一章绪论,概要介绍了迭代学习控制的研究现状,并分析了迭代学习控制存在 的问题与未来发展方向,简要阐述了自适应神经模糊推理系统在迭代学习控制初始控制 中的应用,列举了本文研究的主要工作与章节安排。 第二章对迭代学习控制及自适应神经模糊推理系统的相关知识进行介绍。包括迭 代学习控制的目前的研究情况和基本概念、基本原理、数学描述等,并重点介绍了基础 的p 型、d 型迭代学习算法。同时对神经网络、模糊推理及自适应神经模糊推理系统的基 本原理、学习算法、系统设计方法及控制方案进行了介绍。 第三章详细介绍了迭代学习控制初始控制的控制思想、控制器结构等,并对其进 行了收敛性分析。 第四章探讨了基于b p 神经网络的迭代学习初始控制策略及基于自适应神经模糊 推理系统的迭代学习初始控制策略,并分别针对不同的被控对象验证了方案的可行性和 有效性,通过选择不同的迭代学习算法( p 型、d 型) 仿真验证了两种迭代学习初始控制 的控制方案较之零初始控制输入的迭代学习控制方案的优越性。 最后总结了论文所做的工作,提出尚待进一步解决的问题。 硕士学位论文 第2 章相关知识准备 2 1 迭代学习控制 迭代学习控制是人工智能与自动控制相结合的新的学习控制技术,是智能控制中具 有严格数学描述的一个分支,是智能控制领域中研究、开发及应用的重要发展方向之一 p 0 1 。它适用于具有重复性质的被控对象,诸如进行搬运、装配、焊接、喷涂等任务的工 业机器人,它的目标是实现有限区间上的完全跟踪任务。它通过对被控系统进行控制尝 试,以输出信号与给定目标的偏差修正不理想的控制信号,使得系统的跟踪性能得以提 高。迭代学习控制具有拟人的学习过程与特性,类似于人的循序渐进的学习规律、边学 边干的学习方法,因而迭代学习控制的研究对具有较强的非线性耦合、较高的位置重复 精度、难以建模和高精度轨迹跟踪控制要求的动力学系统有着非常重要的意义1 3 1 j 。 2 1 1 迭代学习控制的基本思想与控制结构 迭代学习控制的基本思想是:针对一类特定的系统但又不依赖系统的精确数学模 型,通过反复的迭代修正,不断重复一个轨迹的控制尝试,使系统逐步逼近期望的输出, 达到某种控制目标的改善。 迭代学习控制原理如图2 1 所示。 图2 1 迭代学习控制原理 在实际应用中,系统下一次运行的新的控制量既可以在上一次运行结束后离线计算 得到,也可以在上一次运行中在线计算得到;新的控制量存入存储器,刷新旧控制量; 在施加控制时,需从存储器中取得控制量。可以看到,迭代学习控制算法可以利用的信 息要多于常规的反馈控制算法,它包括以前每次运行的所有时间段上的信息和当次运行 的当前时刻之前时间段的信息。由于迭代学习控制属于无模型控制系统综合方法,因此 它本质上适用于非线性控制系统。采用这种学习控制技术达到的完全跟踪性能优越于其 他控制方法。渐进跟踪与迭代学习两种控制过程的比较如图2 2 所示。 基于自适应神经模蝴推理系统的迭代学习控制初始控制策略研究 输出 输出 时间 时同 ( a ) 图2 2 两种控制过程的比较 ( a ) 渐进跟踪过程( b ) 迭代学习过程 迭代学习控制采用“在重复中学习的学习策略。它具有记忆系统和经验修正机制。 具体来说,它通过对被控系统进行控制尝试,以输出轨迹与给定轨迹的偏差修正不理想 的控制信号,产生新的控制信号,使得系统跟踪性能得以提高。这种控制技术以非常简 单的方式和需要较少经验知识处理不确定程度相当高的动态系统。它有以下显著特点 【3 2 】: ( 1 ) 适合于具有某种重复运动性质的被控对象。 ( 2 ) 实现完全跟踪。这不同于渐进跟踪。 ( 3 ) 在不精确已知( 甚至未知) 被控对象动力学特征的情况下设计控制器。它适用 于一般非线性系统。 ( 4 ) 在线计算负担小,适用于快速运动控制。 ( 5 ) 具有记忆功能。在遇到类似控制任务时,能根据记忆系统中的信息,迅速调整 控制信号。 迭代学习控制的任务就是寻求控制输入,使得被控对象的运动轨迹在有限时间区间 o ,邪上沿整个期望轨迹实现完全的零误差跟踪,即实现系统实际输出和期望输出之间 的偏差为零,并且要求整个过程快速完成。这里的完全跟踪指系统输出自始至终,无论 是暂态或稳态,都要保持和目标轨迹一致。 图2 3 迭代学习控制示意图 迭代学习控制的控制策略如图2 3 所示,就是根据当前的控制输入信号作用于系统, 产生当前的控制输出,与期望的输出之间存在输出误差,作用在迭代学习控制学习律中, 硕士学位论文 产生下一次的控制输入信号,再次作用于系统,如此重复,使得实际输出和期望输出之 间的输出误差为零。 2 1 2 迭代学习控制的数学描述 考虑重复运行的动态系统如下: j 毫( f ) = ( 黾( 她( 吐? ( 2 1 ) i 儿( f ) = g ( 收( f ) ,( f ) ,f ) 其中,h ,儿和分别为系统第j 次运行的状态、输出和输入变量。y d o ) 为给定区间 【o ,丁】上的期望轨迹,记第七次运行时系统的输出误差为( f ) = 儿( f ) 一儿( f ) ,则迭代学 习控制的学习律一般可表示为如下的递推形式: z ,“。o ) = 。o ) p 。o ) ) ( 2 2 ) 当后专时,如果p 。o ) 在【o ,丁】上一致趋于零,则称上述迭代学习控制律是收敛的。 收敛性是迭代学习控制中最重要的问题之一,只有迭代学习过程是收敛的,迭代学习控 制才有实际意义。 一个成功的迭代学习控制算法,不仅应该在每次控制作用于系统后,能使得系统的 输出误差变小,还需要有较快的收敛速度以保证算法的实用性。另外,迭代学习控制算 法的收敛性应与具体的期望轨迹无关,如果给出一个新的期望轨迹,迭代学习律应该无 需作任何改变即可适用。 2 1 3 迭代学习控制方法的分类 迭代学习控制的学习律有两种计算方式。在施加控制时,需从存储器中取出控制量。 每一次重复操作结束时计算新控制量存

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论