(控制理论与控制工程专业论文)改进自适应神经网络控制策略及仿真研究.pdf_第1页
(控制理论与控制工程专业论文)改进自适应神经网络控制策略及仿真研究.pdf_第2页
(控制理论与控制工程专业论文)改进自适应神经网络控制策略及仿真研究.pdf_第3页
(控制理论与控制工程专业论文)改进自适应神经网络控制策略及仿真研究.pdf_第4页
(控制理论与控制工程专业论文)改进自适应神经网络控制策略及仿真研究.pdf_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要 本文讨论了系统雅克比估计对未知非线性系统的自适应神经网络控制的影 响。在参考文献 2 6 】中,使用了一种新型的建模方法来提高系统的雅克比估计。本 文的目的,是在此方法的基础上,从教师信号入手,进一步提高系统雅克比估计 的性能,从而得到更加精确的控制效果,并比较不同精度的雅克比估计对系统控 制性能的影响,同时,将此建模方法应用于自适应预测控制,得到更加理想的自 适应预测控制效果,并在此基础上比较雅克比估计的性能对预测控制的影响。 在对教师信号的处理上,首先采用均值滤波器对教师信号进行处理,进一步 提出使用均值滤波与线性约束滤波相结合( 二次滤波) 的方法对教师信号进行滤 波,并将滤波后的教师信号用于系统雅克比估计。通过仿真,验证了新的教师信 号确实提高了系统雅克比估计的精度。将改进后的系统雅克比估计应用到逆动态 控制中,仿真结果验证了系统雅克比估计的提高对自适应动态控制性能的改进。 对于自适应预测控制方面,本文在已有的自适应神经网络预测控制理论的基 础上,采用改进的系统雅克比估计对系统进行建模。将雅克比估计的信息引入预 测控制的优化性能指标函数中,得到了新的优化性能指标函数,并由此推导出一 步超前控制律。然后,分别就使用原始雅克比估计的预测控制、直接使用原始的 教师信号获得的雅克比估计的预测控制1 2 6 1 ,和使用本文所提出的方法进行滤波后 的教师信号得到的雅克比估计的预测控制进行比较仿真。 以上试验结果验证了文献 2 6 1 的建模方法对预测控制性能的影响,得出了本 文中使用的滤波方法进一步提高了自适应神经网络预测控制的性能的结论。 关键字:非线性系统;神经网络;自适应逆控制;系统雅克比;预测控制 英文摘要 i m p r o v e da d a p t i v en e u r o c o n t r o la l g o r i t h m sa n ds i m u l a t i o ns t u d i e s a b s t r a c t t h i st h e s i sa i m st oi m p r o v ea d a p t i v ec o n t r o ls c h e m e sp r o p o s e db yp r o f e s s o rw a n g d i a n h u if o rc o n t r o l l i n gu n k n o w nn o n l i n e a rs y s t e m su s i n gn e u r a ln e t w o r k b a s e do nt h e n e wc o s tf u n c t i o n p r o p o s e di n 2 6 】f o ro n - l i n em o d e l i n g , af u r t h e rs t u d yo n i m p r o v e m e n to ft h ej a c o b i a nt e a c h e rs i g n a l si sg i v e ni nt h i sp a p e r i m p a c to ft h i s i m p r o v e dj a c o b i a nt e a c h e rs i g n a l so nb o t ht h ec o n t r o lp e r f o r m a n c eo fa d a p t i v ei n v e r s e d y n a m i c ss c h e m ea n da d a p t i v en e u r a ln e t w o r k sm o d e lb a s e dp r e d i c t i v ec o n t r o ls c h e m e i si n v e s t i g a t e d am e a n - v a l u ef i l t e r ( m v f ) a n dac o n s t r a i n e dl i n e a rf i l t e r ( c l f ) a r ee m p l o y e dt o t h ej a c o b i a nt e a c h e rs i g n a l sp r o p o s e di n 【2 6 ,w h i c hf u r t h e ri m p r o v e dt h eq u a l i t yo f j a c o b i a nt e a c h e rs i g n a l sf o ro n l i n et r a i n i n go fn e u r a ln e t w o r k s t h e nw ea p p l i e do u r p r o p o s e dm e t h o dt ot w oa d a p t i v en e u r a lc o n t r o ls c h e m e s ,a n df o u n dt h a tt h ee n h a n c e d j a c o b i a nt e a c h e rs i g n a l sc a nh e l pi na c h i e v i n gb e t t e rc o n t r o lp e r f o r m a n c et os o m e e x t e n t s o m et h e o r e t i c a la s p e c t ss u c ha sc o n v e r g e n c eo f l e a r n i n gp r o c e s sa n dc l o s e - l o o p s t a b i l i t yw e r er e v i s i t e dw i t ht h en e wc o s tf u n c t i o nu s e di no n l i n em o d e l i n g s o m e s i m u l a t i o n sw e r ec a r r i e do u tt oi l l u s t r a t et h ev a l u eo ft h ep r o p o s e dt e c h n i q u e si nt h i s w o r k k e yw o r d s :n o n l i n e a rs y s t e m s ;n e u r a ln e t w o r k s ;a d a p t i v ei n v e r s ec o n t r o l ;p l a n t j a c o b i a n :p r e d i c t i v ec o n t r o l 大连海事大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:本论文是在导师的指导下,独立进行研究工作所取得的成果, 撰写成博士硕士学位论文 :邀进抽经圆络自适廑控鱼9 筮喳丞笾墓婴究:。除论 文中已经注明引用的内容外,对论文的研究做出重要贡献的个人和集体,均已在 文中以明确方式标明。本论文中不包含任何未加明确注明的其他个人或集体己经 公开发表或未公开发表的成果。 本声明的法律责任由本人承担乏文作者签名:和他2 0 话0 8 年3 月砷日 论文作者签名:年月冲日 学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连海事大学研究生学位论文提交、 版权使用管理办法”,同意大连海事大学保留并向国家有关部门或机构送交学位 论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连海事大学可以将 本学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或 扫描等复制手段保存和汇编学位论文。 保密口,在年解密后适用本授权书。 本学位论文属于:保密口 不保密一( 请在以上方框内打“,) 敝作者躲和以糟黝虢弛 日期:。肟3 月妒 改进白适应神经网络控制策略及仿真研究 第1 章绪论 1 1 神经网络模型 自从认识到人脑的计算与传统的数字计算机相比是完全不同的方式开始,关于人工 神经网络( 一般称为“神经网络 ) 的研究工作就开始了。人脑是一个高度复杂的、非 线性的和并行的信息处理系统。人脑能够组织它的组成部分,即神经元,以比今天已有 的最快的计算机还要快许多的速度进行特定的计算( 如模式识别、感知和运动神经控 制) 。例如,视觉系统功能是为我们提供一个关于周围环境的表示,并且更重要的是提 供我们和环境交互所需的信息。具体讲,完成一个感知识别任务( 例如识别一张被嵌入 陌生场景的熟悉的脸) 人脑大概需要1 0 0 - - 2 0 0 毫秒,而一台传统的计算机却要花费几 天的时间才能完成一个相对简单得多的任务。 一个“发展中 的神经元是与可塑的人脑同义的。“可塑性”允许一个发展中的神 经系统适应它周边的环境。可塑性似乎是人脑中作为信息处理单元的神经元的功能的关 键,同样,它在人工神经元组成的神经网络中亦是如此。最普通的神经网络就是对人脑 完成特定任务或感兴趣功能的方法进行建模的机器,这种网络通过学习过程来实现有用 的计算。 神经网络是一个由简单处理单元构成的规模宏大的并行分布式处理器。天然具有存 储经验知识和使之可用的特性。神经网络在两个方面与人脑相似: ( 1 ) 神经网络获取的知识是从外界环境中学习得来的; ( 2 ) 互连神经元的连接强度,即突触权值,用于存储获取的知识。 用于完成学习过程的程序称为学习算法,其功能是以有序的方式改变网络的突触权 值以获得想要的设计目标。 突触权值修改提供神经元网络设计的传统方法。这种方法和线性自适应滤波器理论 很接近。滤波器理论已经很好的建立起来并成功应用在很多领域,但是神经网络的优越 性在于可以修改它自身的拓扑结构,这也和人脑的神经元会死亡和新的突触连接会生长 的情况相适应。 第l 章绪论 也就是说,所谓神经网络系统,是指利用数学模型模拟人脑神经网络的结构和功能 的一种复杂系统,它的计算能力很明显有以下两点: ( 1 ) 大规模并行分布式结构,可以实现信息的并行处理。 ( 2 ) 神经网络学习能力以及由此而来的泛化能力。 “泛化 是指神经网络对不在训 练集中的数据可以产生合理的输出。 、 这两种能力使得神经网络可以解决一些当前还不能处理的复杂问题。但是在实践 中,神经网络不能单独做出解答,它们需要被整合在一个协调一致的系统中。具体讲, 一个复杂问题往往被分解成若干相对简单的任务,而神经网络处理与其能力相符的子任 务。 神经网络具有下列性质和能力: ( 1 ) 非线性一个人工神经元可以是线性的或者非线性的。一个由非线性神经元互联 而成的神经网络自身是非线性的,并且非线性是一种分布于整个网络中的特殊性质; ( 2 ) 输入输出映射有教师学习是一个学习的流行范例,设计使用带标号的训练样本 对神经网络的突触权值进行修改。每个样本由一个唯一的输入信号和相应的期望响应组 成。从一个训练集中随机选取一个样本给网络,网络就调整它的权值,以最小化期望响 应和输入信号以适当的统计准则产生的实际响应之间的差别。使用训练集中的很多例子 重复神经网络的训练,直到网络达到没有显著权值修正的稳定状态; ( 3 ) 自适应性神经网络嵌入了一个调整自身权值以适应外界变化的能力。特别是, 一个在特定运行环境下接受训练的神经网络,在环境条件变化不大的情况下,可以很容 易的进行重新训练以适应新环境。而且,当它在一个时变环境中运行时,网络权值就可 以设计成随时间变化。一般来说,在保证系统稳定的前提下,一个系统的自适应性越好, 在时变环境下运行时它的鲁棒性就越好。但是,需要强调的是,自适应性不一定导致鲁 棒性,实际可能相反。比如,一个暂态自适应系统可能变化过快,以至对寄生干扰过于 敏感,这将引起系统性能的急剧恶化。为最大限度实现自适应性,系统的主要时间常数 应该长到可以忽略寄生干扰,而短到可以反应环境的重要变化; ( 4 ) 证据响应在模式识别的问题中,神经网络可以设计成既提供不限于选择哪一个 改进白适应神经网络控制策略及仿真研究 特定模式的信息,也提供决策的置信度信息。后者可以用来拒判那些出现的过于模糊的 模式。有这些信息,网络的分类性能就会改善; ( 5 ) 背景信息神经网络的特定结构和激发状态代表知识。网络中每一个神经元潜在 地都受网络中所有其他神经元全局活动的影响。因此,背景信息自然由一个神经网络处 理: ( 6 ) 容错性一个以硬件形式实现后的神经网络自然具有容错的潜质,或者鲁棒计算 的能力,意即它的性能在不利运行的条件下逐渐下降。比如,一个神经元或它的连接损 坏了,存储模式的回忆在质量上被削弱。但是,由于网络信息存储的分布特性,在网络 的总体响应严重恶化之前这种损坏是分散的。因此,原则上,一个神经网络的性能显示 了一个缓慢恶化而不是灾难性的失败。 1 1 1 神经元模型 神经元是神经网络操作的基本信息处理单位。如图1 1 所示,它是人工神经网络设 计的基础。在这里,我们给出神经元模型的三种基本元素: ( 1 ) 突触或连接链每一个都由其权值或者强度作为特征。在连到神经元七的权值- , 上的输入信号工,被乘以七的权值,人工神经元的权值有一个范围,可以取正值,也 可以取负值: ( 2 ) 加法器用于求输入信号被神经元的响应加权的和: ( 3 ) 激活函数用来限制神经元的输出振幅。它可以将输出信号限制到允许范围之内 的一定值。通常,一个神经元输出的正常幅值范围为【o ,1 】或者卜l ,1 】。 第l 章绪论 fx l i 输入i 而 信号 i 【 权值 图1 1 神经元的非线性模型 f i g 1 1n o n l i n e a rm o d e lo fn e r v ec e l l 输出 几 1 1 2 印网络 b p ( b a c kp r o p a g a t i o n ) 网络是一种典型的前馈型神经网络。并被广泛地应用在建模、 模式识别等相关领域。如图1 2 所示,这种网络由三部分组成:一组感知单元组成的输 入层,一层或多层计算节点的隐藏层,还有一层计算节点的输出层,同一层上的神经元 之间没有连接,相邻层神经元单向连接。 隐含层 输入层 一一一 输出层 图1 2b p 神经网络拓扑结构 f i g1 2t o p o l o t ys t r u c t u r eo fb pn e u r a ln e t w o r k 改进白适应神经网络控制策略及仿真研究 刚刮j k 嚣8 耕;j t 漂y , m - , ( 1 ) l o g i s t i c 函数巾) 2 丽1 ; ( 2 ) 双曲正切函数s ( x ) :a t a n h ( b x ) ,( 口,b 0 ) 。 1 1 3 径向基函数网络 监督神经网络可以有很多设计方法。反向传播算法可以看作是递归技术的一个应 用,这种技术在统计学中通称为随机逼近。而径向基函数网络的设计可以看作是一个高 维空间中的曲线拟合问题。径向基函数( r a d i a l b a s i sf u n c t i o n ,r b f ) 神经网络从结构 上看也属于一种前向型神经网络,如图1 3 所示,最基本形式的径向基函数网络构成包 括三层,其中每一层都有着完全不同的作用。输入层将网络与外界环境连接起来,第二 层是网络中仅有的一个隐层,它的作用是从输入空间到隐藏空间之间进行非线性变换, 在大多数情况下,隐藏空间有较高的维数。输出层是线性的,用于产生网络对于输入信 号的响应。其基本思想是:用径向基函数作为隐单元的“基”,构成隐含层空间,隐含 第1 章绪论 层对输入变量进行变换。根据c o v e r 的一篇早期论文,一个模式分类问题如果映射到一 个高维空间将会比映射到一个低维空间更有可能是线性可分的,这就是径向基函数网络 的隐藏空间的维数通常都比较高的原因。另外一个重要原因,是根据m h a s k a r ,n i y o g i 和g i r o s i 的研究结果,隐藏空间的维数与网络能否逼近一个光滑的输入输出映射有着 直接的关系,隐藏空间的维数越高,逼近就越精确。 输入层隐含层输出层 非线性变换 图1 3 径向基函数网络拓扑结构 f i g 1 3t o p o l o t ys t r u c t u r eo fr b fn e u r a ln e t w o r k 径向基函数作为隐层神经元的激活函数是由于受人脑感受域原理的启发以及径向 基函数的特点所决定的。径向基函数是一类局部分布的中心点径向对称衰减的非负非线 性函数。它有两个主要参数:一个作为基的中心,即对称点;另一个为基的宽度,即在 多大的区域内会产生明显的输出响应。其中,“基函数”一般选用格林函数: 缈( 鼍,薯) = g ( 以,置) ( 1 2 ) 径向基函数神经网络的学习往往是通过两个层次进行的,隐层采用非线性优化策 略,而输出层采用线性优化策略。正是由于隐层和输出层的不同功能,导致了不同的学 习策略。但不论何种算法,其主要学习网络的三个参数( 即基函数的中心、方差以及权 值) 是一致的。根据基函数中心选取方法的不同,径向基函数网路有多种学习方法,其 中最常用的三种学习方法是:随机选取中心法、自组织选取中心法和有监督选取中心法。 改进自适应神经网络控制策略及仿真研究 1 1 4h o p f i e l d 神经网络 带有一个或者更多反馈回路的神经网络被称为递归网络。在这种神经网络中,任意 一个节点既可以接收来自前一层各节点的输出作为输入,同时也可以接收来自后面任一 节点的输出作为反馈输入。反馈网络的每个节点都是一个计算单元。网络的输入信号决 定反馈系统的初始状态,然后系统经过一系列状态转换后,逐渐收敛于平衡状态。这种 状态就是反馈神经网络经计算后的输出结果。基本上,递归网络有两个基本功能作用: ( 1 ) 联想记忆; ( 2 ) 输入输出映射网络。 h o p f i e l d 神经网络是反馈型网络的典型代表。它主要用于模拟生物神经网络的记忆 机理,该网络在联想存取及优化计算等领域得到了成功的应用,拓宽了神经网络的应用 范围。图1 4 为包含4 个神经元的h o p f i e l d 网络结构图。 一l一厂_ j 一7一i 兰一厂 一 一l一1 一7 一i 兰:l - 、 一一厂习 一7 一l 兰一i 一厂= n 一7 一i 星j i = 图1 4 包含4 个神经元的h o p f i e l d 网络结构图 f i g 1 4h o p f i e l dn e u r a ln e t w o r kw i t h4n e r v ec e l l s 第1 章绪论 如图所示,h o p f i e l d 网络模型包含一组神经元和一组相应的单位延迟,构成一个多 回路反馈系统,反馈回路的数量等于神经元的数量。图中的网络中没有自反馈,每一个 神经元的输出都通过一个单位延迟元素被反馈到网络中另外的每一个神经元。对于 h o p f i e l d 网络来说, ( 1 ) 权值矩阵式形= 是对称的,即= k ,若= o ,则称其网络为无自反 馈的,否则,称其为有自反馈的; ( 2 ) 每个神经元有它自己的非线性激活函数,厂( ) 。 1 1 5 自组织映射神经网络 自组织映射( s e l f - o r g a n i z i n gm 印,s o m ) 神经网络基于竞争学习,网络的输出神经 元之间互相竞争以求被激活或点火,结果在每一时刻只有一个输出神经元,或者每组只 有一个输出神经元被激活或点火。赢得竞争的一个输出神经元被称作胜者全得 ( w i n n e r - t a k e s a 1 1 ) 神经元或简称获胜( w i n n i n g ) 神经元。在输出神经元中导出胜者全 得的竞争方法是在它们之间使用侧抑制连接( 即负反馈回路) ;这个思想是由r o s e n b l a t t 最先提出的。 在自组织映射里,神经元被放置在网格节点上,这个网格通常是一维或是二维的。 根据k o h o n e n 提出的理论,在竞争学习的过程中,神经元变化依不同输入模式或者输入 模式的类别而选择性的调整。这样调整后的神经元( 即获胜神经元) 的位置彼此之间成 为有序的,使得对于不同的输入特征,在网格上建立起有意义的坐标系。因此,自组织 映射由输入模式的拓扑映射结构所表征,其中网格神经元的空间位置表示输入模式包含 的内在统计特征,“自组织映射”因此而得名。 自组织映射的主要目的是将任意维数的输入信号模式转变为一维或二维的离散映 射,并且以拓扑有序的方式自适应实现这个变换。图1 5 给出常用作离散映射的二维神 经元网格的简要图表。网格中每个神经元和输入层的源节点均有连接。 改进白适应神经网络控制策略及仿真研究 7 u 一 卜0 r u一 源结点层 i卜、i卜、 i卜_ 弋 卜、 一一 l 一一l 。一 7 - 一一- 一一- 7一 , 7 一一一 i卜、i卜_ 弋i卜_ 弋卜1 、- 。 一 一。 。 一- 一7 - 一一- 7一- 一 一 | 一一 iii卜1卜_ 弋 一 一。一一 一 7 7 y 一 一7 7 7 一 _ _ _ _ _ _ - _ 一 - 。_ - _ 。_ - _ _ _ _ _ - _ 一一 77 7 7 一一7 一 一7 7 图1 5 神经元的二维网格 f i g 1 5n e v e rc e l l s t w od i m e n s i o nn e t w o r k s 负责自组织映射的算法,第一步进行网络权值的初始化,可以赋值较小的随机数, 这样,在特征映射上没有加载任何先验的序。当网络被恰当初始化,自组织映射的形成 中有三个主要过程: ( 1 ) 竞争。对每个输入模式,网络中的神经元计算它们各自的判别函数的值。这个 判别函数对神经元之间的竞争提供基础,具有最大判别函数值的特定神经元成为竞争的 胜利者; ( 2 ) 合作。获胜神经元决定兴奋神经元的拓扑领域的空间位置,从而提供这样的相 邻神经元合作的基础; ( 3 ) 权值调节。最后的这个机制使兴奋神经元通过对它们权值的适当调节以增加它 们关于该输入模式的判别函数值。所做的调节使获胜神经元对以后相似输入模式的响应 增强了。 第1 章绪论 1 2 基于神经网络的非线性系统建模 在自动控制理论中,关于被控对象的信息对控制器的设计有很大的影响,它需要利 用被控对象的数学模型来设计控制器,其结构和参数直接受到被控对象数学模型的结构 和参数的影响。 在系统建模、辨识等应用中,对于线性系统,在频域,传递函数可以很好的表达系 统的黑箱式输入输出模型;在时域,利用自回归滑动平均模型通过各种参数估计方法, 也可以给出系统输入输出的描述,从而较完美的解决了线性系统的辨识问题。但对于非 线性系统,一般采用非线性自回归滑动平均模型进行辨识。但是,很难为这种模型找到 一个恰当的参数估计方法。因此,传统的非线性系统辨识,在理论研究和实际应用中都 有一定的困难。 相比之下,神经网络在这方面显示出了明显的优越性,它可在不具备对象先验知识 的条件下,根据对象的输入输出数据直接建模,模型的在线校正能力强,同时,适用于 高度非线性系统和严重不确定性系统。因此,基于神经网络的建模,是近年来研究较多, 发展很快和应用范围非常广泛的一种建模技术。 对非线性函数的逼近能力是神经网络被用于控制和建模的主要原因。用输入输出样 本训练网络可以看作是一个非线性函数逼近问题。和多项式逼近一样,神经网络逼近也 遵循w e i e r s t r a s s 定理和s t o n e w e i e r s t r a s s 定理。满足定理条件的神经网络可以以任意精 度逼近任意非线性连续或分段连续函数。已有结果证吲1 1 ,具有一个或以上s i g m o i d 隐 层的多层前馈网络可以以任意精度逼近任意非线性函到2 1 ,可以说,是通用的非线性逼 近器。 神经网络对非线性系统进行建模是直接通过学习系统的输入输出数据,学习目的是 使得所要求的误差函数达到最小,从而归纳出隐含在系统输入输出数据中的关系。也就 是说,神经网络建模的实质,是选择一个适当的神经网络模型来逼近实际系统。 1 2 1 正向建模 正向建模是指训练一个神经网络表达系统的正向动态特性,得到的模型称为系统的 正向模型。其训练结构如图1 6 所示。 改进白适应神经网络控制策略及仿真研究 对象 出 图1 6 神经网络正向建模 f i g 1 6n e u r a ln e t w o r kf o r w a r dm o d e l i n g 神经网络与被建模系统并联,二者具有相同的输入,它们输出的误差作为网络的训 练信号。显然,这是一个典型的有教师学习,实际系统作为教师,向神经网络提供所需 的期望输出。学习结束后,神经网络与实际系统具有相同的输入输出特性。当系统是被 控对象时,神经网络一般采用多层前向网络的形式,可直接选择b p 网络或它的各种变 形。 1 2 2 逆向建模 建立动态系统的逆模型,是神经网络控制系统设计中经常用到的方法。其中比较简 单的是直接逆建模法。 直接逆建模也称广义逆学习,它是将系统的输出作为网络的输入,网络的输出与系 统的输入进行比较,并用相应的误差来训练神经网络,从而建立系统的逆模型。网络的 结构如图1 7 所示。然而,值得注意的是,如果非线性系统是不可逆的,那么,利用上 述方法便无法得到正确的逆模型。因此,在建立系统的逆模型时,应事先保证系统的可 逆性。 第1 章绪论 图1 7 直接逆建模法 f i g 1 7d i r e c ti n v e r s em o d e l i n g 在实际应用中,面对一个具体问题时,首先需要分析所求解问题的性质,然后根据 问题特点确立网络模型,最后对网络进行训练,仿真等,检验网络的性能是否满足要求。 这一过程一般包括: ( 1 ) 确定信息表达方式将问题及其相应知识转化为网络可以接受并处理的形式,即 将问题抽象为适合于网络求解的某种数据形式; ( 2 ) 网络模型的确定根据问题的情况,选择模型的类型、结构等。另外,还可以在 典型网络模型的基础上,结合问题的具体情况,对原网络进行变形、扩充等,同时也可 以采用多种网络模型的组合形式; ( 3 ) 网络参数的选择确定网络层数及各层神经元的个数。对于反馈网络,如h o p f i e d 网络和e l m a n 网络等,还需要进一步的设定反馈神经元的相关属性; ( 4 ) 训练模式的确定选择合理的训练算法,确定合适的训练步数,指定适当的训练 目标误差,以获得较好的网络性能; ( 5 ) 网络测试选择合理的测试样本对网络进行测试,或者将网络用于实际问题,检 验网络性能。 1 3 基于神经网络的控制策略 由于非线性系统自适应控制的复杂性,使得线性系统中成熟的自适应控制理论难以 推广到非线性系统。神经网络的出现,给非线性系统的自适应控制带来了希望。神经网 络自适应控制理论从8 0 年代开始出现,受机器人逆动态控制的启发,利用神经网络在 改进白适府神经网络控制策略及仿真研究 线学习逆动态的前馈神经网络自适应控制开始出现【3 】,文献 4 】中提出了采用b p 网络的 间接神经网络自适应控制。文献 5 中提出了前馈反馈神经网络自适应控制方案。这一时 期的主要工作,是探索将神经网络应用于非线性自适应控制的可能性,并提出了各种可 能的神经网络自适应控制方案。进入9 0 年代以来,神经网络自适应控制进入发展阶段。 这一时期已有的一些神经网络自适应控制方案走向成熟( 如文献【6 - 【8 】中的神经网络自 适应方案) 。各种新的方案不断出现,如文献【9 】中提出了自校正控制方案,文献 1 0 d p 提出了自适应预测控制方案。目前,神经网络自适应控制已成为神经网络控制领域的热 点,基于神经网络的各种自适应控制理论有了较大的发展【1 1 。1 4 】。 从控制器在系统中的连接方式来看,可以分两大类: ( 1 ) 前馈方案由于神经网络具有逼近任意非线性函数的能力,可以直接利用神经网 络来实现基于模型的控制策略,这里,神经网络作为直接逆模型控制器。直接逆模型控 制的主要思想是,先训练好某一结构的神经网络,使其能够反应输入输出之间的映射关 系,以及隐藏在训练样本中相应的逆关系,然后利用这些训练好的网络来构造不同结构 的控制方案 1 5 , 1 6 1 ; ( 2 ) 前馈反馈方案这种方案的特点是整个系统的控制器由神经网络前馈控制器加 上一个反馈控制器构成【l 丌,因此称前馈反馈方案。该方案通过对神经网络的权值进行训 练以使得常规反馈控制器的输出为零,从而使得系统从开始的常规反馈控制逐步变成前 馈神经网络控制。该方案的优点是,在神经网络训练初期,可以利用常规控制器保证系 统的稳定性。 从神经网络与现有的控制理论相结合的方面看,可以分以下几类: ( 1 ) 基于神经网络的自适应控制 与常规自适应控制方案相对应,基于神经网络的自适应控制也分为两类:神经网络 自校正控制( s t c ) 和神经网络模型参考自适应控制( m r a c ) 。对应于传统设计的两 种控制思想,即直接自适应控制和间接自适应控制,神经网络控制中的控制器设计也有 两种方式,泛化学习和特殊学习。泛化学习利用被控对象的输入输出数据来学习对象的 逆系统模型和预报模型。而模型参考自适应控制方案通过设计使被控系统具有期望性能 第l 章绪论 的理想参考模型,根据被控对象和参考模型的输出误差,通过自适应调节控制回路内部 的有关参数,使得被控对象的性能和参考模型的性能一致,从而获得良好的控制效果。 在直接神经网络自适应控制中,特殊学习方法是利用被控对象的真实输出与期望输 出之差来调节神经网络控制器的权重。是一个边控制边学习的过程,因而具有适应对象 和环境变化的能力。这种控制方法不需要用网络预先或者同时辨识被控对象的模型,而 是用网络直接训练控制器来达到控制效果,其关键在于获取对象雅克比行列式的j 下确 性。 间接神经网络模型参考自适应控制使得泛化具有自适应能力,并可以用于处理非线 性系统的模型不稳定问题。它利用神经网络来辨识非线性对象,方法是根据当前和以前 的输入输出数据,利用一个神经网络来预报对象在下一时刻的输出,再利用另一个神经 网络来训练控制器,文献 1 8 中给出了一种间接神经网络控制方案。 ( 2 ) 神经网络自适应预测控制 该方案用一个神经网络在线建立非线性被控对象的数学模型( 该神经网络称为预测 模型) ,利用此预测模型,就可以用当前的控制输入预报被控对象未来一段时间范围内 的输出值,并通过一定的优化机制对控制作用进行优化。这种方案中,神经网络必须经 过离线训练之后才能应用于神经网络自适应控制中。 ( 3 ) 神经网络自适应滑模控制 文献 1 9 2 2 1 从神经网络与滑膜控制集成的角度研究了神经网络自适应滑膜控制方 法。这种方法将系统的控制或者状态分类根据系统的变化进行切换和选择,利用神经网 络具有的学习能力,在不确定的环境下通过自学习来改进滑膜开关曲线,进而改进控制 的效果。 ( 4 ) 神经网络自适应反演( b a c k s t e p p i n g ) 控制 文献【2 3 】中首先给出了自适应反演的最初形式,这一结果解决了一类强非线性和线 性化未知参数的全局镇定和x 专0 这一难题。但这种方法存在过参数问题,并且系统的 未知参数是线性化的,对一般非线性却不适用。近年来,p o l y c a r p o u 应用自适应反演思 想提出了一种基于神经网络的自适应控制器。文献 2 4 】用神经网络来近似严格系统中的 改进白适应神经网络控制策略及仿真研究 非线性函数,将系统转化成线性参数,然后应用传统方法进行设计。神经网络自适应反 演还有待于进一步发展。 1 4 本文的主要工作 ( 1 ) 采用中值滤波和约束线性滤波的方法对雅克比导师信号进行修正,以改善在线 学习获得的雅克比估计精度; ( 2 ) 将改进的建模策略应用于自适应逆动态控制及一步预测控制中,推导出新的建 模方式下神经网络预测器的一步超前控制律,并讨论预测控制中学习算法的收敛性性; ( 3 ) 对以上提及的建模及控制问题进行了计算机仿真研究,讨论了学习过程的收敛 性和闭环控制系统的稳定性。比较分析表明,改进的建模策略对提高雅克比估计精度有 所帮助,进而改善了自适应神经控制器的控制品质。 第2 章自适应神经网络模型逆动态控制算法 第2 章自适应神经网络模型逆动态控制算法 2 1 引言 许多工业系统因其固有的不确定性和非线性特性,难以建立确切的数学模型,使传 统控制理论应用于实际时遇到了前所未有的困难。另一方面,由于各种扰动的存在,系 统的结构甚至参数都可能发生变化,因此,依靠过程先验信息离线辨识得到的系统模型, 有时候会因未建模动态的影响而难以保持原有的性能。 自适应逆动态控制在控制系统和调节器的设计中是一条很新颖的途径。传统逆动态 方法已在一般形式的非线性系统上建立起比较完备的设计理论。但是,传统的逆动态方 法要求明确的系统解析式,而大多数工业过程往往难以满足此要求。近年来,神经网络 技术得到了迅速的发展,由于它具有任意精度逼近复杂的非线性函数以及具有超强的自 学习能力和自适应能力等特点,为解决系统的逆动态自适应控制问题带来了生机。 近年来,国内外学者将神经网络与传统技术相结合应用于非线性、不确定性系统控 制方面,进行了许多有益的尝试,并取得了一些可喜的成果。目前在非线性系统的神经 网络控制中,一般采用双神经网络结构,其中一个神经网络用于建模,学习系统的正向 动态特性:另一个神经网络作为控制器,学习系统的逆动态。这种方法在模型精度足够 高时,会获得良好的控制性能。但是,由于训练样本获得途径不同,模型的学习结果也 有所差异。 2 2 逆动态控制策略 逆动态控制的基本思想如图2 1 所示:对于给定系统,求得适当的控制输入,使得 系统输出可以跟踪系统输入,即期望输出。 改进白适戍神经网络控制策略及仿真研究 图2 1 基本逆动态自适应系统 f i g 2 1b a s i ca d a p t i v ei n v e r s ed y n a m i cs y s t e m 逆动态控制中,最基本的是口阶逆系统方法【2 5 l ,它基本思想为:对于给定的被控对 象,利用对象的逆系统构成一种可以用反馈方法实现的口阶积分逆系统,将对象补偿成 为具有线性传递关系的、已解耦的一种规范化系统,称为伪线性系统;然后,利用已经 成熟的线性系统理论来完成这种系统的综合,从而进行诸如极点配置、二次型指标最优、 解耦等,使得被控对象具有令人满意的特性。 而由于神经网络在非线性建模中的逼近能力和它的学习特性,使得它在不确定或未 知非线性系统的控制领域的应用中具有重大意义。用神经网络实现逆动态的基本思想 是:通过训练神经网络,得到能够逼近被控对象逆动态特性的神经网络控制器,这个神 经网络控制器通过学习非线性系统的逆建模关系或最小化某种代价函数来产生控制输 入。 2 3 控制算法中雅克比估计的欠缺 文 2 6 提出了一种新型的建模方法和学习策略来对神经网络仿真器和控制器进行建 模,系统结构如图2 2 所示。 第2 章自适应神经网络模型逆动态控制算法 图2 2 自适应神经网络逆动态控制学习策略 f i g2 2a d a p t i v ei n v e r s en e u r o - c o n t r o l l e rl e a r n i n g 在本文中,图2 2 中的神经网络仿真器和神经网络控制器均采用单隐层结构。 考虑离散时间s i s o 未知非线性系统 y p ( 七+ 1 ) = g ( j ,p ( 七) ,y ,( k - 刀+ 1 ) ,“( 七) ,“( 七一所+ 1 ) ) + e ( 七) ( 2 1 ) 神经网络仿真器的输出可以表示为 此m ( 釜j = l 町 枞芝i = 1 胴+ 镌 ) + 蚍) ( 2 2 ) + 1 ) = 厶i 町 ) 1 名i k , ) + 镌 ) l | + k 。o ) i ( 2 2 ) i 、 lj 其中,吩和吆分别为输出层和隐层的权值,为偏差,为输入,虬为隐层 节点数,名和厶。分别为隐层和输出层的激活函数。从而,每一步的估计的系统雅可比 行列式可以由神经网络仿真器模型直接计算得到, 喇= 制= 善暇, 触 ( 2 3 ) 采用梯度下降算法作为更新规则的基础来调节神经网络控制器中的权值, 眠小( y p ”儿g 炒 ) 鹅 ( 2 - 4 ) 其中,彬 ) 表示在时刻k 时神经控制器的一般权值,彬( k ) 为k 时刻权值的变化 量,锄 ) a 彬 一1 ) 可以通过已知偏差的一般反向传播算法计算2 刀。 改进白适应神经网络控制策略及仿真研究 由图司见,系统的期望输入,就是神经网络控制器的输出,在k 时刻,它司以由f 式计算得到 g ) = 以( 姜呀 ) 露( 喜噶 k ) + h g ) + 屯 ) ) ( 2 5 ) g ) = 以l 呀 ) | 露i 噶 k ) + g ) i | + 屯 ) l ( 2 5 ) ,= ll f = l i, 其中, t 。( 尼) ,t 肿。( 七) = j ,p ( 后) ,y p ( k - ,z + 1 ) ,儿( 七十1 ) ,“( k - 1 ) ,“( k - m + 1 ) , 崂和呓分别为输出层和隐层的权值,6 c 为偏差,t 是输入,c 是隐层节点数,露和 厶分别为神经网络控制器中隐层和输出层的激活函数。 为了解决传统的代价函数无法得到令人满意的系统雅克比估计的问题,文【2 6 提出 了一种新型的神经网络仿真器在线训练的代价函数, 删= 私”小籼( 端郇) ) 2 亿6 , 其中五为权值系数, ) 为考虑过程噪声时的系统雅可比估计, ,。:必立垃 ( 2 7 ) ,2 e ( k ) + 卫u ( k - 三1 ) - u 一( k - 2 ) 瞄。 其中,s ) = 即初0 一1 ) 一u ( k 一2 ) ) ,民是一个足够小的正数,用来避免除数为零 的问题。 第2 章自适应神经网络模型逆动态控制算法 其中既 ) 表示在时刻k 神经网络仿真器模型的一般权值, 亿) = 既 ) 一既 一1 ) ,g ) = 依) 一y 。 ) 。 2 4 系统雅克比导师信号的改进 由式( 2 6 ) 可见, ) 作为教师信号,对系统雅克比行列式的估计起着举足轻重的 作用,而显然,从文献 2 6 1 的仿真可以看出,由式( 2 7 ) 所得到的j p q ) 只是一个初步 的估计值,虽然对其进行了限幅,但是并不能得到平滑的教师曲线,因此,我们考虑对 ,o ) 进行滤波,以得到更加合适的教师曲线。从对, ) 的仿真来看,原始的教师信号 主要有两大弱点: ( 1 ) 小幅度的毛刺遍布教师信号曲线整体; ( 2 ) 在峰值时刻,会产生幅值很大的脉冲。 我们想要达到的效果,是得到平滑的教师信号曲线。针对原始教师信号的不足之处, 我们首先尝试对教师信号,。 ) 进行均值滤波。 对于均值滤波,我们选取从七时刻到七一4 时刻的教师信号以( k ) ,( k - 1 ) , 以( 七一2 ) ,以( 七一3 ) 和以( 七一4 ) 有 ( 后) :丛丝也坐业型堕幽 ( 2 1 0 ) ( 七) = j 8 , i f jp j b 一厶,f ( 七) 一厶 ( 2 1 1 ) 以( j j ) , o t h e r w i s e 显然,这种滤波方法可以在一定程度上平滑教师信号曲线,但是,均值滤波的基本 原理决定了它只能平滑教师信号中的小幅度毛刺,而当峰值处脉冲过大的时候,效果并 不理想。 由于脉冲的产生,是因为在接近峰值的时刻,厶( 七) 的值由于某种原因突然大幅度 增大,因此,我们考虑是否可以限制教师信号以( 尼) 每一步的变化量,使得教师信号曲 改进自适应神经网络控制策略及仿真研究 线趋于平滑。基于这种思想,本文中尝试使用下面的滤波器: 驰,= p 雒袋4 ,烈篡 亿蚴 其中,= ( 尼) 一以( 七一1 ) ,万为一很小的正实数,4 的符号与相同,h 有1 6 , 1 = 8 。 事实上,这里所使用的,是一种简单的约束线性滤波器( c o n s t r a i n e dl i n e a rf i l t e r ) 。 这种滤波器的基本思想是:计算相邻两个时刻教师信号的差值,如果这个差值的绝对值 在一定的范围内,那么,使用当前计算出的以( j | ) 作为此刻的教师信号,否则,将上一 时刻的教师信号以( k - 1 ) 加上一个固定增益,作为这一时刻的教师信号( k ) 。 然而,由于这种滤波器对输入过于敏感,而由式( 2 8 ) 直接获得的教师信号又比较 粗糙,因此,并不能直接应用,在这里,我们首先对原始的教师信号进行均值滤波,在 此均值滤波的基础上,对所得到的教师信号进一步进行约束线性滤波( 以下简称二次滤 波,t w i c ef i l t e r ) 。即, 对于由式( 2 8 ) 所描述的原始教师信号厶( k ) ,首先有 珊) = 业盥坚盐譬丛坚出剑 然后,对所得芏u 阴- ,;【七j 近仃约束线任猛汲: 驰) = 翟袋f 砒l a m l - 妇万 ( 2 1 4 ) 其中,= ( 尼) 一( 七一1 ) ,万为一很小的正实数,4 的符号与相同,h 有l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论