(控制理论与控制工程专业论文)非仿射非线性系统的迭代学习辨识与控制.pdf_第1页
(控制理论与控制工程专业论文)非仿射非线性系统的迭代学习辨识与控制.pdf_第2页
(控制理论与控制工程专业论文)非仿射非线性系统的迭代学习辨识与控制.pdf_第3页
(控制理论与控制工程专业论文)非仿射非线性系统的迭代学习辨识与控制.pdf_第4页
(控制理论与控制工程专业论文)非仿射非线性系统的迭代学习辨识与控制.pdf_第5页
已阅读5页,还剩81页未读 继续免费阅读

(控制理论与控制工程专业论文)非仿射非线性系统的迭代学习辨识与控制.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浙江t 业火学硕士学位论文 非仿射非线性系统的迭代学习辨识与控制 摘要 迭代学习控制适合于具有重复运行性质的被控对象,它利用系统以前的控制经验来修 正当前的控制输入,从而实现对期望轨迹的完全跟踪,其主要特点是无需精确已知系统的 模型。迭代学习控制的研究成果主要集中于线性系统和仿射非线性系统,而对于非仿射非 线性系统的迭代学习控制尚不多见。针对非仿射非线性系统,本文利用压缩映射分析方法, 讨论这类系统的迭代学习辨识以及迭代学习控制问题。主要工作包括以下几个方面: 第一,首先介绍了两种非线性迭代学习控制方法,即牛顿学习律和正割学习律。给出 了两种非线性学习律的收敛性充分条件。 第二,针对离散时间非仿射非线性系统和非仿射非线性时滞系统,讨论牛顿迭代学习 律和正割学习律。为提高系统的动态性能,对系统的控制输入引入饱和函数,构造出饱和 形式的非线性学习律。理论分析了具有饱和限幅的非线性学习律的收敛性条件。 第三,针对非仿射非线性系统,讨论迭代学习控制的初始定位问题。已有文献在讨论 迭代学习控制问题时,大多假设在每次迭代过程开始时,初始状态与理想初态重合或者固 定于某确定的值。这种严格的精确定位要求在实际操作中难以实现。本文讨论了关于非仿 射非线性系统的初态学习方法,同时进行控制输入的迭代学习和初态的迭代学习。理论分 析了初态学习下开环学习律、闭环学习律、开闭环学习律的收敛性条件。 第四,讨论含时变参数的非仿射非线性系统的迭代学习辨识问题。依据迭代学习控制 理论,讨论了p 型迭代学习辨识基本方法以及非线性迭代学习辨识方法。论文将迭代学习 辨识应用于混沌保密通信中,将有限长度信息信号的保密通信归结为迭代学习辨识问题, 并以迭代学习辨识技术完全重建信息信号。论文给出了非线性n s h i f t 加密新方法,该方案 在一定程度上增强了混沌通信的保密性能。 关键词:迭代学习控制,非仿射非线性系统,牛顿学习律,正割学习律,迭代学习辨识, 混沌保密通信 浙江工业大学硕上学位论文 i t e r a t i v el e a r n i n gi d e n t i f i c a t i o na n d co n t r o lf o rn o n a f f i n en o n l i n e a rs y s t e m s a b s t r a c t i t e r a t i v el e a r n i n gc o n t r o l0 l c ) a l g o r i t h mi ss u i t a b l ef o rr e p e t i t i v es y s t e m so v e raf i n i t e i n t e r v a l i no r d e rt of o l l o wt h ed e s i r e dt r a j e c t o r yc o m p l e t e l y , t h es y s t e mi n p u ti su p d a t e df r o m t h ep r e v i o u si n p u te x p e r i e n c e s t h em a j o rf e a t u r eo fi l ca l g o r i t h m si st h a tt h ee x a c ts y s t e m m o d e li sn o tn e c e s s a r y m o s to fi l cr e s e a r c h e sf o c u s e do nl i n e a rs y s t e m sa n da f f i n en o n l i n e a r s y s t e m s o nt h eb a s eo fc o n t r a c t i o nm a p p i n ga n a l y s i s ,t h i st h e s i sp r e s e n t sn o n l i n e a ri l c a l g o r i t h m sa n di t e r a t i v el e a r n i n gi d e n t i f i c a t i o n ( i l i ) a l g o r i t h m sf o rn o n - a f f i n en o n l i n e a rs y s t e m s t h i st h e s i sm a i n l yc o v e r st h ef o l l o w i n ga s p e c t s f i r s t l y , t w on o n l i n e a ri l ca l g o r i t h m sa r ep r e s e n t e df o rt h en o n a f f i n en o n l i n e a rc o n t i n u o u s s y s t e m s ,n a m e l yt h en e w t o n - t y p ei l ca l g o r i t h ma n dt h es e c a n t - t y p ei l ca l g o r i t h m s u f f i c i e n t c o n d i t i o n sa r eg i v e nf o rt h ec o n v e r g e n c ea n a l y s i so ft h et w oa l g o r i t h m s s e c o n d l y , t h et h e s i se x t e n d st h en e w t o n - t y p ea n dt h es e c a n t - t y p ei l ca l g o r i t h m st o n o n a f f i n en o n l i n e a rd i s c r e t et i m es y s t e m sa n dn o n - a f f i n en o n l i n e a rs y s t e m sw i t ht i m ed e l a y t h e f u l l y - s a t u r a t e dl e a m i n ga l g o r i t h mi sp r o p o s e dt oe n h a n c et h es y s t e mp e r f o r m a n c e ,o fw h i c ht h e s u f f i c i e n tc o n d i t i o n sf o rt h ec o n v e r g e n c ea n a l y s i sa r ed e r i v e d t h i r d l y , t h ep r o b l e mo fi n i t i a lr e p o s i t i o n i n gi sd i s c u s s e df o rn o n a f f i n en o n l i n e a r c o n t i n u o u s s y s t e m s t h ee x i s t i n gr e s e a r c h e so f t e na s s u m e dt h a tt h ei n i t i a ls t a t ei sr e s e tt ot h ed e s i r e do n e w i t h o u tr e p o s i t i o n i n ge r r o r so rw i t hk n o w ne r r o r sa tt h eb e g i n n i n go fe a c ht r a i l i nf a c t ,i ti s d i f f i c u l tt oa c h i e v et h ea c c u r a t er e p o s i t o n i n g i nt h i st h e s i s ,i n i t i a ls t a t el e a r n i n gm e t h o di s p r o p o s e dw h i c hr e l a x e st h ei n i t i a lr e p o s i t i o n i n gc o n d i t i o n t h es u f f i c i e n tc o n d i t i o n sf o rt h e c o n v e r g e n c ea n a l y s i sa r eo b t a i n e df o ro p e n l o o pi l ca l g o r i t h ma n dc l o s e d - l o o pi l ca l g o r i t h m a n d o p e n - c l o s e d l o o pi l ca l g o r i t h m f o r t h l y , t h ei l ia l g o r i t h mi s d i s c u s s e df o rn o n a f f i n en o n l i n e a rc o n t i n u o u ss y s t e mw i t h b n k n o w np a r a m e t e r s u s i n gi l cs y n t h e s i sm e t h o d s ,t h i st h e s i sp r e s e n tt h eb a s i cp - t y p ei l la n d n o n l i n e a ri l i ,a sw e l la st h es u f f i c i e n tc o n d i t i o nf o rt h e i rc o n v e r g e n c ea n a n l y s i sr e s p e c t i v e l y t h ei l ls c h e m ei s a p p l i e dt or e c o v e rt h em a s k e di n f o r m a t i o ns i g n a l f o rc h a o t i cs e c u r e c o m m u n i c a t i o ns y s t e m sc a r r y i n gt h ei n f o r m a t i o ns i g n a lo v e raf i n i t et i m ei n t e r v a l t h en o n l i n e a r i i 浙江t 业火学硕上学位论文 n - s h i f tc i p h e ri se s t a b l i s h e dt oi m p r o v et h ec o m m u n i c a t i o ns e c u r i t y k e y w o r d s :i t e r a t i v el e a r n i n gc o n t r o l ,n o n - a f f i n en o n l i n e a rs y s t e m ,n e w t o n t y p el e a r n i n g l a w , s e c a n t t y p el e a r n i n gl a w , i t e r a t i v el e a r n i n gi d e n t i f i c a t i o n ,c h a o t i cs e c u r ec o m m u n i c a t i o n 浙江工业大学 学位论文原创性声明 本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研究工作 所取得的研究成果。除文中已经加以标注引用的内容外,本论文不包含其他个人或 集体已经发表或撰写过的研究成果,也不含为获得浙江工业大学或其它教育机构的 学位证书而使用过的材料。对本文的研究作出重要贡献的个人和集体,均已在文中 以明确方式标明。本人承担本声明的法律责任。 作者签名:荔也辛 日期:沙舞,月彳日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留 并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本 人授权浙江工业大学可以将本学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 本学位论文属于 1 、保密口,在年解密后适用本授权书。 2 、不保密回。 ( 请在以上相应方框内打“ ) 日期:哮r 月彳日 日耵胼日 浙江工业大学顾士学位论文 第1 章绪论 1 1 课题的背景与意义 对于在有限时间区间上重复作业的动态系统,可以应用迭代学习控制方法设计其控制 输入。迭代学习控制通过重复学习的方式,利用系统的历史输出和输入以及特定的学习方 式更新系统的当前控制输入,使得系统的输出轨迹随着循环次数的增加能够跟踪上期望轨 迹。它是由a r i m o t o 等人【1 1 于1 9 8 4 年正式提出,并逐渐形成一较为完整的理论。迭代学习 控制可实现有限时间区间上的完全跟踪任务,其主要特点是在设计控制器时不需要动态系 统的精确描述仍然能够获得较高的跟踪性能。迭代学习控制理论研究的内容包括:快速收 敛问题、学习算法的稳定性和收敛性、鲁棒性问题、初始值问题等等。 在实际应用中,有限时间区间上重复作业的系统大量存在,例如机器人、直线电机等, 并且大多是非仿射非线性系统。非仿射非线性系统中各参数间具有较强的非线性耦合度, 系统复杂,建模困难,这给基于模型的控制器设计方法带来了一定的难度。迭代学习控制 本质上适用于非仿射非线性控制系统。有如下在有限时间区间上重复运行的连续时间非仿 射非线性系统 水) = m ( ) ,嘶) ( 1 1 ) 【j ,( f ) = i l l ( x ( f ) ,“( f ) ,f ) 其中,t 0 ,t 】,x ( t ) 为系统的状态向量,它是n 维的。“( f ) 为控制向量,它是,维的。y ( t ) 为输出向量,它是m 维的。( ) 与办( ) 为具有相应维数的向量函数。迭代学习控制的目的 就是通过迭代学习获得一个理想的控制输入,使得系统的输出轨迹跟踪上期望轨迹。系统 模型可表示为如下形式: j 毫( ) = 厂( 以( 帆( 删( 1 - 2 ) 【y k ( t ) = j l i ( 曩( f ) ,u ( f ) ,f ) 式中,t o ,t 】,k = o ,l ,2 表示迭代操作次数,吒( f ) ,u k ( f ) ,y k ( t ) 分别为第k 次重 复操作时系统的状态向量,控制向量和输出向量。 在工业生产中,计算机控制系统得到了广泛应用。计算机控制系统实质上是离散时间 系统,连续时间动态系统的迭代学习控制成果不能直接应用于离散时间系统,且连续时间 迭代学习控制方法也是在离散时间域里面被执行的。因此,讨论离散时间动态系统的迭代 1 浙江工业大学硕士学位论文 学习控制具有重要意义。对于离散时间非仿射非线性系统 x o + 1 ) = ( 工o ) ,“( f ) ,2 ) ( 1 - 3 ) 【j ,( f ) = 五( 石o ) ,“( f ) ,t ) 假设系统在有限离散时间区间 0 ,1 ,2 ,乃上重复运行。与上述类似,式( 1 3 ) 可表示为 x k ( t + 1 ) = ( 最( ) ,( 删( 1 - 4 ) 【y k ( f ) = j l l ( 以( f ) ,u 女( f ) ,t ) 具有时滞的动态系统在工业生产中也大量存在,例如,远程控制的机器人,批量处理, 磁盘驱动等等。迭代学习控制给具有时滞的动态系统提供了一种有效的控制器设计方法。 对于非仿射非线性时滞系统 妒) = 厂( x ( ) ,x ( t - t j ) u ( 伽( 1 - 5 ) l y ( f ) = l l ( x ( f ) ,“l r j ,f j 其可重复时滞系统可表示为 j 五( ) = 厂( o ) ,讫( f 一乞) ,( ) ,) ( 1 - 6 ) 【y 女o ) = h ( x k ( t ) ,u ( f ) ,f ) 对于以上离散时间非仿射非线性系统与非仿射非线性时滞系统的迭代学习控制的研 究尚不多见,本文将对其非线性学习律以及非仿射非线性系统的初始定位问题进行讨论。 非线性学习律一定程度上提高了迭代学习控制算法的收敛速度,初态学习律放松了实际应 用中对于初始定位条件的严格要求。 在设计控制器时,对于含有未知参数的被控对象需要估计其未知参数,即参数辨识。 针对被控对象中的时不变参数,人们提出了多种行之有效的辨识方法。在实际应用中,存 在一些在有限时间区间上运行的动态系统。对于这类系统动力学特性中时变的未知参数, 可以采用迭代学习辨识方法对其进行估计。迭代学习辨识是一种有效的参数辨识方法,它 应用迭代学习的思想,考虑输入收敛性问题,在一定的收敛性条件下,可给出未知参数的 完全估计【2 1 。 迭代学习辨识具有重要的现实意义,适用于含有时变参数的非仿射非线性系统,例如 混沌通信系统。目前混沌通信成为人们研究、关注的热点,已有多种信号加密和重建方案, 但尚未见针对有限长度信息信号的混沌保密通信的研究。保密系统的有效信号往往是一种 有限时间区间上的信息信号,针对这类信号的混沌保密通信系统,我们可以采用迭代学习 辨识方法对其进行加密与重建,将有限长度信息信号的保密通信归结为迭代学习辨识问 题。迭代学习辨识方法本质上适合于非线性系统的时变参数的估计,适用于混沌保密通信。 2 浙江工业大学硕士学位论文 1 2 迭代学习控制研究现状 迭代学习控制经过二十多年的发展,在理论和应用上都取得了丰硕的成果。迭代学习 控制在理论方面的研究主要有初始定位问题、学习律的收敛性和鲁棒性问题、非最小相位 问题 3 - 4 】等。在迭代学习控制理论的研究过程中,形成了多种分析方法,主要有压缩映射分 析方法、李雅普诺夫分析方法、二维分析方法【5 卅、频域分析方法 7 - 8 等。许多学者将迭代 学习控制技术应用于实际工业控制过程,例如机器人控制系统【9 加】,电机控制系统【1 1 13 1 , 分批生产过程【1 4 l 等。本文将从以下几个方面对迭代学习控制进行综述。 1 2 1连续时间非仿射非线性系统 实际存在的动态系统大多是非仿射非线性系统,这类系统的状态量和控制量往往是相 互耦合的,难以给出其精确的动态模型。迭代学习控制的主要特点是不需要精确已知系统 模型。因此,讨论非仿射非线性系统的迭代学习控制问题具有一定的现实意义。对于非仿 射非线性系统的迭代学习控制的研究比较少,目前的成果主要表现在仿射非线性系统的迭 代学习控制【1 5 - 1 9 1 。文献 2 0 】讨论了非仿射非线性系统的迭代学习控制算法,证明了迭代学 习控制用于非仿射非线性系统的有效性。文献 2 1 】讨论了多输入多输出的非仿射非线性系 统的迭代学习控制算法。文献 2 2 1 针对连续时间非仿射非线性系统,设计比较了线性与非 线性学习律,给出算法收敛的充分条件。 1 2 2 离散时间非仿射非线性系统 随着计算机控制技术的发展,讨论离散时间系统的迭代学习控制问题也具有重要意 义。关于离散时间系统的迭代学习控制的研究已有较长的历史,也取得了非常多的成果。 文献 2 3 】针对离散时间线性时不变系统提出了最优学习律。文献【2 4 给出了离散时间线性时 变系统的迭代学习控制的稳定性条件。关于离散时间系统的迭代学习控制大多局限于线性 系统【2 3 粕1 ,很少有文献讨论离散时间非线性系统的迭代学习控制。文献 2 7 3 1 讨论了离散 时间非线性系统的迭代学习控制方法,其中文献【3 0 】针对离散时间非线性系统讨论了非线 性牛顿型迭代学习控制算法。针对离散时间非仿射非线性系统,现有文献讨论得很少。文 献 3 2 】则针对离散时间非仿射非线性系统讨论了二阶最优迭代学习控制方法。论文第三章 将针对离散时间非仿射非线性系统,讨论非线性学习律。 1 2 3 非仿射非线性时滞系统 在工业生产中存在着一些时滞系统,因而关于时滞系统的迭代学习控制问题也受到控 制领域研究人员的关注。文献 3 3 3 4 讨论了线性时滞系统下的迭代学习控制方法的收敛性 和鲁棒性。时滞系统包括状态时滞和控制时滞。文献【3 5 】讨论了状态时滞非线性系统,引 浙江工业大学硕士学位论文 入初始修正因子,使得时滞系统的输出能够在有限时间区间上完全跟踪上期望轨迹。文献 【3 6 】针对一类具有状态时滞的连续系统提出一种采样迭代学习控制算法,给出了算法指数收 敛的充分条件。文献 3 7 1 讨论了输入时滞非线性系统下的采样迭代学习控制。文献 3 8 】讨论 了仿射非线性时滞系统下p d 型迭代学习控制方法,证明了算法的有效性。目前还没有文 献讨论非仿射非线性时滞系统下的迭代学习控制问题,然而在实际应用中非仿射时滞系统 大量存在,因此,对非仿射非线性时滞系统的研究具有一定的应用价值。 1 2 4 学习律 提高迭代学习控制算法的收敛速度,使得被控系统的输出能够更快地收敛于期望值是 迭代学习控制的一个重要方面。因此,众多学者对迭代学习控制的学习律做了大量研究, 提出各种形式的学习律和解决与之相应的收敛性问题。迭代学习控制的基本形式为: u k + l = u 女+ u ( 厶+ i ,厶) ( 1 7 ) 式中,k 表示迭代操作次数,u 。为第k 次控制输入,为每次迭代时系统中可利用的信息, u ( ) 为学习律的数学表达式,不同的学习律具有不同的表达式u ( ) 。常见的学习律有d 型 学习律【3 9 4 1 1 、p d 型【4 2 1 、p i d 型学习律【4 3 掣】、最优学习律【2 3 】【4 5 。4 7 1 、高阶学习律4 8 - 矧、模型 算法学习律5 1 5 3 】、闭环学习律5 4 5 7 】、高增益反馈学习律【5 8 棚】、带遗忘因子的p 型学习律 6 0 l 等等。通常这些学习律大都采用线性形式,其学习增益为一固定值。文献 2 2 3 0 1 讨论了非 线性牛顿学习律,这种学习律采用时变非线性的学习增益,文中给出了收敛性证明,理论 分析了非线性学习律可获得较快收敛速度。文献 1 9 】讨论了两种非线性迭代学习律,即牛 顿学习律和正割学习律,理论分析了其收敛性充分条件。本文将针对离散时间非仿射非线 性系统以及时滞系统讨论非线性学习律,构造饱和形式的牛顿学习律和正割学习律。在迭 代学习控制系统中对输入进行饱和限幅,可提高迭代学习过程的收敛性能【6 。 1 2 5 初始条件问题 初始条件是指迭代学习控制算法的收敛性对于初始定位操作设置的初始点提出的一 定的要求,即在每次迭代开始时,为保证算法的收敛性,对系统迭代初始点的重复定位操 作所限定的条件。迭代学习控制具有重复运行特征,初始定位条件以及关于初态误差引起 的鲁棒性问题是迭代学习控制理论中的基本问题之一。已有文献在讨论迭代学习控制的收 敛性问题时,对初始条件提出了一定的要求,一般假设其与期望初态完全重合,即 五( 0 ) = 吻( o ) k = 0 ,l ,2 , 这就要求期望初态已知以及每次迭代过程初态的精确定位。在非全状态输出的情形下,不 可能精确测得每一次迭代时的初态,又由于实际重复定位精度的限制,这种严格定位的要 4 浙江工业大学硕十学位论文 求在实际操作中是难以实现的。 实际的重复定位操作会导致迭代学习控制系统存在初态偏移,当系统的初始状态不在 期望轨迹上,而在期望轨迹的某很小邻域内时,通常把这类问题归结为学习控制的鲁棒 性问题研究。文献 6 2 6 3 讨论了初始定位误差对系统跟踪性能的影响。通过鲁棒性分析知, 跟踪误差收敛于原点的邻域内,该邻域半径正比于初始定位误差的界。因此,欲提高跟踪 性能只能寄希望于提高初始定位的精度,当初始误差不存在或者被消除时,该邻域半径为 零,算法一致收敛。文献 6 4 1 针对连续线性系统,分两种情况讨论了具有非零初始偏差的 d 型和p d 型迭代学习控制问题:每次迭代的初始状态与期望初态不同,但初始误差保 持不变;每次迭代的初始误差是变化的。结果表明,具有不变初始误差的迭代学习控制 系统的性能优于具有变化初始误差的迭代学习控制系统。文献 6 5 】讨论了具有初始偏差的 非线性系统的p d 型迭代学习控制系统,初始状态满足渐近严格重复时,可保证系统迭代 输出误差的一致收敛性。文献 6 6 】讨论了任意初态下不确定时滞系统的p d 型迭代学习控 制,其中将初始条件放宽为某任意可达初始状态函数的可重复性。文献 6 7 讨论了初态固 定的初始定位条件,在每次迭代过程开始时,初始状态都定位于某一具体位置,而与期望 初态之间有一个固定的偏移量。在这个初始定位条件下,跟踪误差渐近收敛到零。这在一 定程度上放宽了初始定位的要求,在实际应用中较易实现。文献 6 8 7 0 l 提出了带初始修正 的学习算法,该算法不仅放宽了初始定位条件,还在给定的时间区间上实现了完全跟踪。 文献 7 l 】提出了初始修正吸引子的概念,使得初始位置可以任意设置,初始定位误差不要 求足够小的情况下实现给定时间区间上的完全跟踪,这也使得初始条件进一步放宽。文献 7 2 】提出了更为松弛的初始定位条件,在输入学习的同时进行初始状态的学习,在第一次 迭代开始时对系统的初态则无要求。但是,初态学习律的学习增益为系统输入矩阵与输入 学习律中学习增益的乘积,一旦给出输入学习律,初态学习律也就确定下来,这在一定程 度上仍然属于严格定位条件。为了克服严格定位的要求,文 7 3 1 提出了新的初态学习律, 其学习增益与输入学习律中的学习增益无关,它允许初态在一定范围内变动。 迭代学习控制理论对初始定位条件的严格要求在实际应用中难以实现,对于如何放宽 迭代学习控制中的初始定位条件问题始终是迭代学习控制理论中的重要问题之一。 1 3 迭代学习辨识研究现状 在实际工程应用中,需要对系统的某些未知参数进行估计,即参数辨识问题。对于系 统中的时不变参数辨识问题的研究已取得较多的成果,这类参数辨识的主要方法有最d - - 乘法【7 4 1 、卡尔曼滤波器算法【7 5 】、辅助模型辨识方法【7 6 1 、自适应辨识方法【7 7 。8 1 等。然而,系 5 浙江工业大学硕士学位论文 统中的参数往往是时变的,常规的辨识算法难以解决时变参数的估计问题。文献 7 9 】介绍 了一种自动调整遗忘因子的快速时变参数辨识方法。文献 8 0 】针对时变参数辨识讨论了有 限数据窗最d - - 乘法,证明了该方法的收敛性。 针对一些在有限时间区间上重复运行的动态系统,其动力学特性中存在有时变的未知 参数,且这类参数是其运行时间区间上的函数。对于这类动态系统,需要考虑有限时间区 间上参数的完全辨识问题。可将迭代学习控制的概念和方法应用于有限时间区间上时变参 数的辨识,即迭代学习辨识。迭代学习控制考虑输出收敛性,与它相比较,迭代学习辨识 考虑输入收敛性问题【2 】。迭代学习辨识根据量测得到的系统输出,构造辨识学习律,据收 敛性充分条件确定学习增益,随着迭代次数的增加,估计参数趋于真值,从而实现时变参 数的完全估计。目前,关于迭代学习辨识的文献尚不多见。文献【8 1 】将无位置传感器的开 关磁阻电动机调速系统的位置估计归结为迭代学习辨识问题,构造了p d 型的非线性迭代 学习辨识器,理论分析了迭代学习辨识算法的有效性。文献 8 2 】针对既含有时不变参数又 含有时变参数的高阶线性时变系统,讨论了自适应迭代学习参数辨识算法,给出了时不变 参数的时域自适应学习律和时变参数的迭代域自适应学习律。文献 8 3 】将宏观交通流模型 转换为包含此模型的一般离散时间非线性系统模型,讨论其参数的迭代学习辨识算法。 1 4 保密通信研究现状 随着计算机通信技术的发展,信息安全问题越来越受到人们的重视。混沌信号具有类 噪声、对初始状态极为敏感等特点,因而特别适用于保密通信。混沌系统的同步方法是实 现混沌保密通信主要方法之一【8 4 1 ,它是在上世纪九十年代初提出并迅速发展的,控制领域 的研究人员将许多控制理论方法成功地应用于同步控制【8 5 6 1 ,同时也提出了多种混沌通信 的实现方法。 在混沌保密通信系统中,为增强信息传输的保密性,必须对信息信号进行加密处理。 混沌掩盖是主要的加密方案之一。文献 8 7 8 8 分别讨论了将信息信号与混沌信号相叠加和 相乘的混沌掩盖加密方法,它们都是将较弱的信息信号隐藏于较强的混沌信号中。相加、 相乘或加乘结合的掩盖方法相对简单且其逆易于计算。文献 8 9 】讨论的n s h i f t 加密是一种 十分新颖的混沌掩盖加密方案,它采用分段线性函数作为其基本函数,这易于逆的计算。 掩盖形式越复杂,通信系统的保密性越强,同时也会增加求逆的难度。另一种加密方案是 所谓的混沌参数调制唰,或系统辨识方法 9 1 - 9 2 】。参数调制方法利用混沌系统允许其参数在 一定范围内变化仍表现出混沌行为的特性,将信息信号调制于混沌系统的参数。文献 9 4 】 6 浙江工业大学硕士学位论文 提出并讨论了基于传输信号的参数调制和复合非线性掩盖两种加密方法。 针对有限长度信息信号的混沌保密通信,文献【9 3 提出混沌保密通信的迭代学习辨识 方法,将有限长度信息信号的保密通信归结为迭代学习辨识问题,提出的方案将信息信号 掩盖于混沌系统的参数中,以迭代学习辨识技术完全重建信息信号。迭代学习辨识适于估 计在有限时间区间上运行的已知系统动态特性中的时变参数,在一定收敛性条件下,可给 出时变参数的估计【9 5 1 。 1 5 本文工作及章节安排 本文基于压缩映射分析方法,针对非仿射非线性的离散时间系统与时滞系统,提出饱 和形式的牛顿学习律与正割学习律。理论分析给出了非线性迭代学习控制算法收敛的充分 条件。文中利用迭代学习的思想讨论迭代学习辨识,将迭代学习辨识技术应用于混沌保密 通信。针对通信系统的保密性能,本文提出了非线性n s h i f t 加密方案。本文各章节内容安 排如下: 第二章,针对连续时间非仿射非线性系统的迭代学习控制问题,讨论非线性学习律, 即牛顿学习律和j 下割学习律。给出两种非线性学习律的收敛性充分条件,阐明牛顿学习律 和正割学习律的概念。 第三章,针对离散时间非仿射非线性系统,讨论其迭代学习控制问题。构造饱和形式 的非线性学习律,对控制输入加以限幅来增强系统的动态性能。理论分析牛顿学习律和正 割学习律的收敛性条件。 第四章,针对非仿射非线性时滞系统,分别讨论状态时滞和输入时滞的迭代学习控制 问题。构造饱和形式的非线性学习律,理论分析牛顿学习律和正割学习律的收敛性条件。 第五章,讨论非仿射非线性系统在初态学习下的迭代学习控制问题,构造初态学习律。 分别讨论开环学习律、闭环学习律和开闭环学习律在初态学习下的收敛性充分条件。 第六章,针对非仿射非线性系统,讨论其迭代学习辨识问题。对迭代学习辫识进行描 述,并进一步讨论了p 型迭代学习辨识算法和非线性迭代学习辨识算法,给出辨识算法的 收敛性充分条件并与予证明。 第七章,将第六章讨论的迭代学习辨识算法应用于混沌保密通信系统。引入非线性 n s h i f t 加密方案以增强混沌通信系统的保密性。利用迭代学习辨识算法对加密后的信息信 号进行译码,实现信息信号的完全估计。 第八章,对本文所做工作进行总结,并对文章中有待进一步研究的几方面问题进行探 讨。 7 浙江工业大学硕上学位论文 第2 章连续时间非仿射非线性系统的迭代学习控制 2 1引言 迭代学习控制理论经过二十多年的发展,已发表的结果大多是关于线性迭代学习控制 问题,而关于非线性迭代学习控制问题的讨论相对较少。文献 2 较详细的阐述了针对各 种系统的线性迭代学习控制问题。线性迭代学习控制算法仅利用系统的前一次或者多次历 史输出误差信号和输入信号,其学习增益一般是一满足收敛性充分条件的常量。非线性迭 代学习控制算法可望获得更快的收敛速度,它利用了系统输出函数关于控制输入的偏导, 学习增益是与系统状态有关且随时间变化的。目前,非线性迭代学习控制方法主要有两种, 牛顿迭代学习控制方法和正割迭代学习控制方法。文献 3 0 讨论了牛顿迭代学习控制算 法。应该注意的是,牛顿学习方法以及正割学习方法只有在平衡点附近的邻域内才能保证 算法的快速收敛,这就使得在系统输出误差较大时不能直接使用非线性学习律。文献 1 9 针对非仿射非线性系统讨论牛顿迭代学习算法和正割迭代学习算法,根据输出误差的范围 确定学习律。输出误差较大时,采用线性学习律;输出误差处在平衡点附近一邻域内时, 采用非线性学习律。这就满足了非线性迭代学习控制算法对输出误差必须在平衡点附近的 要求,同时也获得了更快的收敛速度。本章介绍连续时间非仿射非线性系统的牛顿迭代学 习算法和正割迭代学习算法。 2 2 非仿射非线性系统模型 在实际的工业过程中,许多动态系统的状态量和控制量往往是相互耦合的,且动态特 性是非线性的,这样的非仿射非线性系统一般难以建立其精确的数学模型。迭代学习控制 算法适用于非线性控制系统,它在设计控制器时只要求已知系统的一个粗略模型。因此, 对于非仿射非线性受控对象,采用迭代学习控制方法是一较好的选择。考虑下述单输入单 输出非仿射非线性系统 水? 2 m ,“,i ( 2 - 1 ) i y ( f ) = h ( x ,“,f ) 。 其中,t o ,t 】,x r 4 ,u r ,y r 。厂( ) 和 ( ) 是非线性函数。假设式( 2 1 ) 描述的 动态系统在有限时间区间 o ,刀上重复运行,且满足 浙江工业大学硕j j 学位论文 假设2 1 、在每次迭代开始时,初始条件满足矗( 0 ) = x o ,p 为一给定初态。 假设2 2 、非线性函数f ( x ,“,t ) 关于工、u 二次可导,并且满足局部l i p s c h i t z 条件,即 l ( 五,u 。,t ) 一f ( x 2 ,u :,f ) f s 0 ( 1 x j 一ki + l u 。一吃1 ) ( 2 - 2 ) 假设2 3 、非线性函数h ( x ,u ,t ) 关于x 、t 二次可导,并且满足局部l i p s c h i t z 条件,即 lj l | ( ,u 。,t ) - h ( x 2 ,“2 ,t ) 摩( 1 一x 2i + i “i 一“21 ) ( 2 3 ) 将办( x ,“,f ) y y - x 的一次偏导记为吃:o h _ ( x _ , u , t ) ,h ( x , u , t ) 关于“的一次偏导记为 吃= 丝嬖坐盟,以及二次偏导记为k = 堡铲、h u l lmou掣o u、k = 堡錾o x 兰竽,a x d ” 并且记q 、气、q l i 、气为吃、k 、k 、h u 。的界,0 c l h i t c 2 。 2 3 线性p 型学习律 本节讨论采用p 型学习律的线性迭代学习控制方法。记k 为迭代次数,第k 次迭代 时,非仿射非线性系统( 2 1 ) 可表示为 毫( ) = 厂( _ ,) ( 2 - 4 ) 【儿( f ) = h ( x k ,u 女,f ) p 型学习律是一种基本学习律,它不像d 型学习律需要对输出误差信号进行导数运算, 而是直接使用输出误差信号本身。其形式为乜1 : u k + l ( f ) = u k ( t ) + q k ( t ) e k ( t ) ( 2 - 5 ) 式中,巳( f ) = 儿( f ) 一乃( f ) 为输出误差。q k ( f ) 为学习增益,假设i q k ( f ) i 巳,巳为学习增 益的界。 定理2 3 1 给定由式( 2 4 ) 与( 2 5 ) 描述的迭代学习控制系统,若满足下述条件 1 1 - q k ( t ) h 阵p 1 ( 2 - 6 ) 对于x x ,“u 成立,则当k 一时,儿( f ) 收敛于乃( f ) 。 证明:记万吒= 诈+ i 一,g u k - u 川- - u k ,磊= ( 毛+ f 1 6 x t ,u k + 胪u t ,f ) ,其中o 1 。 下面需先估计i 艿五i ,将式( 2 4 ) 中的状态方程两端积分,可得 一氓= 一万t ( o ) + f 厂( 吒,f ) 一f ( x k + ,“川,f ) d r 由假设2 1 知,每次迭代开始时屯( o ) - - - _ x 0 ,因此,万而( 0 ) = 0 。对上式两端取范数,有 1 6 吒巨f i ( 五,f ) 一( + 1 ,i g k + lt ) 1 d f 浙江工业人学硕t 学位论文 根据假设2 2 司得 i 万赡i n l ( i 一+ ,l + j 一+ 。i ) f 根据学习律( 2 5 ) 有+ 。一= q e k ,则上式可写成 i 万吒i of ( i 吒一吒+ i + lq 。( t ) l le 。1 ) d f lf ( i 一吒+ 。l + 巳i i ) d f 由b e l l m a n g r o n w a l l 引理得 l 万诈i 7 ,f e t :( t - r ) qi 咏l a f 两端取五范数,并根据兄范数的性质有 m 鲁五 下面讨论输出收敛性。根据泰勒定理,v t 0 ,t 】,有 儿+ i ( f ) = 五( 以+ i u k + it ) = 而( 五+ 万 ,“t + 锄t ,f ) = 矗( 而,f ) + 6 吃( 靠) + 万玩( 氧) = y t o ) + q k e k h ( 善k ) + 万z t h ,( 虽) 第k + 1 次迭代时的输出误差为 e k 。i2y d y k “ 2 e k + y t y 。“ 将式( 2 8 ) 代入上式有 e k + = e k 一吼吃( 氧) 一万t r h ,( 磊) = 【1 一吼吃( 氕) 】气一叫以( 磊) 对式( 2 9 ) 两端取范数得 i e k + 。i q l 一q k ( f ) 吃( 六) l f 气i + qi 艿气i piei + c 二l 万五i 两端取名范数,并将式( 2 7 ) 代入可得 却i 慨鲁丑 ( 2 7 ) ( 2 8 ) ( 2 9 ) 浙江工业大学硕士学位论文 = 万l 气k 其中,万- - p + q 巳筹,根据条件( 2 6 ) 知。p l ,可取允足够大,使得。 - 3 学习律则是一种具 有较快收敛速度的控制方法。在迭代学 - j 过程中,牛顿学y - j 律可以保证迭代学习控制系 统的快速收敛。但是要保证牛顿方法的有效性,输出误差必须在一个较小的范围内,这 就对牛顿方法提出了一定的限制。为了放宽对牛顿方法的限制,针对由式( 2 - 4 ) 描述的 非仿射非线性系统,采用下述非线性牛顿学习律n 町 ) :卜) + g 以川割啦警 ( 2 - 1 0 ) k ( f ) + 古气( f ) 其它 从上述牛顿学习律中可以看出,当动态系统的输出偏离期望轨迹较大时,线性学习律可 以保证其全局收敛。当输出逼近期望轨迹至一个较小的范围时,线性学习律便切换到非 浙江工业大学硕士学位论文 线性的牛顿学习律,并在这个较小的误差范围内加快学习过程的收敛速度。 定理2 4 1给定由式( 2 4 ) 与( 2 1 0 ) 描述的迭代学习控制系统,在假设2 1 2 3 下,当iei ,垒叠时,如果满足条件( 2 6 ) ,对于z 彳,“u 成立,则i ( z ) i 收敛于 等。当i 吼 0 。那么,可以使得在l 气( f ) i 收 敛于垒叠时刻停止使用线性学习律而切换到非线性学习律上。此时,只要讨论非线性 巳。 学习律的收敛性即可。 当l 气i : 垒叠时,利用泰勒定理可得 y k + i ( f ) = ( + i ,+ l t ) = ( 吒+ 万,“t + 万,f ) :矗( ,f ) + 万t t h ,。+ j “。九,。+ 丢【艿x j k 万t + 2 8 x :8 k 。+ ( 万蚝) 2 。】 第七+ 1 次迭代的输出误差为 e k + 1 2 e k + y k y k + l = 气嘞。吃厂夙一r h 。一1 2 艿机晚一万x 鼽k 一圭( 帆) 2 气。 因为万:- 1 吼( f ) ,所以上式变为 7 七 刊石一t h 。三1 万机瓴一以k 去一三( 砻2 吃。 对上式两端取范数得 i 巳+ i i = i 万吒i i 吃一+ 三i 万1 2 i ki + l 帆i i ki 砑1 i 哝i + 吉瓦:i k l i 气1 2 因为0 c iq 九ii c 2 ,所以有 1 2 浙江工业大学硕士学位论文 e k + li 蚓吲+ - 1 6 z , 1 2 + 等1 6 x , l l e t l + 耳c 1 2 ( 2 - 将式( 2 1 1 ) 两端取元范数有 烈q + 等慨卜詈i 咯i ,) ls x , i 五奄吼 根据式( 2 7 ) 可知 蚍跳警。 ( 2 - 1 2 ) 钉巳等警 协 将式( 2 1 2 ) 与式( 2 1 3 ) 都代入上式中可得 i 磨”百l _ e t b - 2 ) r 譬+ 警

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论