基于神经网络课件_第1页
基于神经网络课件_第2页
基于神经网络课件_第3页
基于神经网络课件_第4页
基于神经网络课件_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 基本概念 最优控制系统 最优控制系统,是指在一定的具体条件下,完成所要求的控制任务时,其目标函数(性能指标)具有最优值的系统,更具体些说,最优控制是指在一定的约束条件下,选择一个表征过程的目标函数,决定一个最优控制函数,以使目标函数达到极大值或极小值,对于同一系统,若选择的目标函数不同,则可能得到不同的最优控制1 基本概念性能指标最优控制理论中,数字控制系统的性能指标定为性能指标可分为三种形式:积分型积分型目标函数可写成 Q为加权矩阵1 基本概念终值型 终值型目标函数可写成综合型上述综合型性能指标是比较普遍的性能指标。1 基本概念 若将综合型的目标函数写成 则当J为最小时,系统在整个控制过

2、程中,状态偏差最小。这种目标函数称为二次型性能指标。二次型性能指标在最优控制中占有很重要的地位。1 基本概念 最优控制问题 令系统的状态方程为 其初始条件为 式中X(k)是n维列向量,U(k)是p维列向量。 最优控制的任务是在一定的约束条件下,在时间0,N内求N个控制 使状态由初始值 转移到终止值X(N),并使 性能指标取最小值(或最大值)。 kX01 基本概念 线性二次型最优控制在最优控制中占有很重要的地位,其原因有二,一方面许多多线性系统的最优控制属于这种类型,另一方面线性二次型最优控制可以得到具有状态反馈的线性闭环最优控制系统,工程上易于实现。 所谓线性二次型最优控制就是在状态方程的约束

3、条件下,寻找最优控制 使状态X(0) 转移到X(N),并使下式二次型性能指标取最小值: kU01 基本概念 简单地讲,二次型最优控制就是指性能指标为二次型的最优控制。2 神经网络伺服最优鲁棒控制系统 什么是伺服系统? 用来精确地跟随或复现某个过程的反馈控制系统。又称随动系统。在很多情况下,伺服系统专指被控制量(系统的输出量)是机械位移或位移速度,加速度的反馈控制系统,其作用是使输出的机械位移(或转角)准确地跟踪输入的位移(或转角)。伺服系统的结构组成和其他形式的反馈控制系统没有原则上的区别。伺服系统最初用于船舶的自动驾驶,火炮控制和指挥仪中,后来逐渐推广到很多领域,特别是自动车床,天线位置 2

4、 神经网络伺服最优鲁棒控制系统 控制,导弹和飞船的制导等。采用伺服系统主要是为了达到下面几个目的:以小功率指令信号去控制大功率负载。火炮控制和船舵控制就是典型的例子。在没有机械连接的情况下,由输入轴控制位于远处的输出轴,实现远距同步传动。使输出机械位移精确地跟踪电信号,如记录和指示仪表等。 衡量伺服系统性能的主要指标有频带宽度和精度。 伺服系统按所用驱动元件的类型可分为机电伺服系统,液压伺服系统和气动伺服系统。2 神经网络伺服最优鲁棒控制系统 伺服系统的离散最优鲁棒控制 随着智能机器人和高精度的数控机床的发展,伺服技术得到了日益广泛的应用,同时对伺服技术也提出了更高的要求。希望伺服系统具有快速

5、性好,无超调,无静差,抗扰能力强等。然而由于实际的被控系统的数学模型往往含有非线性,干扰,不确定因素,当模型的不确定性超过传统线性最优鲁棒控制所允许的范围时,控制系统就变得不稳定,因此传统控制方法很难满足现代伺服系统的要求。2 神经网络伺服最优鲁棒控制系统 将人工神经网络所具有的并行性,自适应,自学习等能力应用于现有的最优鲁棒控制,作为控制系统中的补偿环节,完成更精确建模和稳定的控制,使控制系统具有更高一级的“智能”控制,以满足快速,稳定的伺服系统控制要求。2 神经网络伺服最优鲁棒控制系统 最优伺服系统的设计目标是系统跟踪一定指令信号时误差最小。解决这个问题的方法是: 设一个离散系统,其离散状

6、态方程为 其中 是 维状态向量, 是m维控制向量, 是l维输出向量,F,G,C分别是 , , 维的系统参数矩阵。 1n kU tynn)(mnnl kX2 神经网络伺服最优鲁棒控制系统 假定在一个稳定及可观的指令信号 作用下,控制输入 为 其中M和K分别为 和 维的反馈增益和前馈增益矩阵, 为给定的指令向量。 假定系统存在有稳态的平衡状态 它们满足方程和的稳态情况,即 nmlm kU2 神经网络伺服最优鲁棒控制系统 若用带记号”*”的新变量表示系统偏离稳态的平衡状态值(扰动),则这些新的变量定义为 将 式代入 和 式得: 2 神经网络伺服最优鲁棒控制系统 显然,从式和中分别减去稳态的关系式 ,

7、可得到新的差分方程: 且有2 神经网络伺服最优鲁棒控制系统由和式可组成一个新的增广系统 其中 这里 为 m维向量。V kV2 神经网络伺服最优鲁棒控制系统 现在的问题是,寻求控制输入 ,使如下性能指标J最小 或 其中 S 为 维正定权阵, 为 维的半正定矩阵,R为 维的正定矩阵。 在式的约束条件下,使式表示的性能指标为最小。 kV)(llnnmm2 神经网络伺服最优鲁棒控制系统 此时求 的方法完全与线性最优调节器问题相同。于是,可求得增广系统的最优控制输入 为 (21) 其中 (22) 式中 为增广系统的Riccatti方程,是 维正定矩阵。 kV kVP mnmn2 神经网络伺服最优鲁棒控制

8、系统 可分解为 (23)其中 为 维矩阵, 为 维矩阵, 为 维矩阵。将(22)式与(23)式相比较得 其中P定义为 (24)PP11P12P22nnmnmm2 神经网络伺服最优鲁棒控制系统 将 , 和 代入(24)式,得原系统的Riccati方程 (25) 若(F,G)是稳定的,(Q,F)可观,则闭环系统是渐近稳定的。 假定 (26) 那么(21)式可简化为 (27) P11P12P222 神经网络伺服最优鲁棒控制系统 比较(18)式和(27)式,便得到伺服系统的反馈增益和前馈增益 (28) 从(28)式可知,如果系统的参数 F,G,C及权矩阵Q和R已知,那么可利用(25)(26)(28)

9、式计算出最优控制器的增益M和K阵。 为了能观察和估计系统的状态,我们可根据系统模型(1)和(2)式中已知的控制输入u(k) 2 神经网络伺服最优鲁棒控制系统 和输出y(k)来估计系统状态,其(k+1)时刻的观测器的状态方程为 (29) 式中 表示状态估计值,H是 维的观测器的反馈增益矩阵。如果选择适当的H矩阵,使(F-HG)的特征值都位于Z平面的单位圆内,那么随时间K的增长,观测值 快速收敛于x(k)。kxmnkx3 基于神经网络的非线性最优控制 引言 经典线性最优控制是从时域角度根据对象的动态知识形成控制对象的数学模型。如果模型方程能够精确地表达对象的动态性,那么可以依二次型性能指标函数综合

10、出一个状态变量的线性反馈控制律,形成一个闭环反馈控制系统。这个系统是渐近稳定的,且在二次型指标意义下达到最优。但是,在工程实际系统中,参数往往不是准确的,甚至含有非线性特性,造成对象的模型不确定性。3 基于神经网络的非线性最优控制 要继续保持渐近稳定性所容许的非线性限度,一般的最优控制方法很难解决这个问题。本文提出在原有最优控制的基础上并联两个神经网络模型来完成精确模型的建立和稳定控制,以解决线性最优控制存在的问题。3 基于神经网络的非线性最优控制 线性最优控制 设线性时不变系统的状态方程为 (30) 其中,x(t)是n维系统的状态向量,u(t)是m维输入控制向量,A是 维的系统参数矩阵,B是

11、 维增益矩阵。 线性最优控制问题是寻找控制律u(t),使下列性能指标最小: (31)nmmn3 基于神经网络的非线性最优控制 其中,Q为 维的半正定矩阵,R为 维正定矩阵。若最优控制存在唯一,且可由下式确定: (32) 其中,K是 维的最优反馈增益,P是 维的矩阵,可由下列Riccati方程解出: (33) 这里的Riccati方程具有唯一正定解。nnmmnmnn3 基于神经网络的非线性最优控制 然而,实际控制对象的数学模型往往含有不确定性因素。如果模型的不确定性超过一定范围,控制系统就变得不稳定,这样不可能由线性系统方程(30)构造的数学模型求得最优解。为解决方程(30)含有的不确定性因素,

12、本文引入了神经网络的学习方法补偿被控制对象数学模型的不确定性。3 基于神经网络的非线性最优控制 神经网络非线性最优控制器设计 图1所示为本文设计的神经网络伺服最优控制器结构图。它由状态观测器,主控增益和反馈增益,两个神经网络(NNC,NNM)组成。其中,NNC网络表示神经网络控制补偿器,完成最优控制律的补偿作用,NNM表示神经网络模型补偿器,它完成原系统模型的不确定性补偿作用。3 基于神经网络的非线性最优控制 设NNM网络的输入信号为 ,输出信号为 ;NNC网络的输入信号 输出为 。系统参数A,B经过预估后,所得到系统模型表示为 (34) NNM和NNC两个网络经过训练以后,并入系统,且状态观

13、测器的状态方程和最优控制律分别表示为 (35) (36)3 基于神经网络的非线性最优控制 其中,M表示主控增益,K表示反馈增益阵, 表示系统误差, 表示指令信号, 表示系统的实际输出。 (37) 现在的问题是如何调整网络权值,使3 基于神经网络的非线性最优控制3 基于神经网络的非线性最优控制()NNC和NNM的学习算法 设一个NN网络模型如图2所示, 为第n层节点的总数,网络的输入为 ,隐层的第j个节点的输出为 ,输出层的第k个节点的输出为 , 和 分别为输入层第i个节点到隐层的第j个节点和隐层的第j个节点到输出层的第K个节点的连接权值,则有如下关系: (38) (39)3 基于神经网络的非线

14、性最优控制 其中,隐层激活函数为 ,输出层的节点激活函数为3 基于神经网络的非线性最优控制()建模网络NNM的学习算法 模型网络NNM训练主要取决于实际对象响应 与估计响应 的接近程度。因此,本文选取下面误差函数为训练网络的指标函数: (40) 利用最速下降法修正网络的权值: (41)3 基于神经网络的非线性最优控制 分别是(42)(43)(44)3 基于神经网络的非线性最优控制 其中, 为学习率,3 基于神经网络的非线性最优控制()控制网络NNC的学习算法 网络NNC与原线性最优控制律式(32)并联,以补偿式(30)中模型不确定性引起的控制误差。如果对象的动态模型能由式(30)精确地表达,那

15、么NNC网络的输出应为零,这样NNC网络的训练误差函数仍保持 为最小,因此训练NNC网络的性能指标为: (45)3 基于神经网络的非线性最优控制 式(45)中 在t时刻是未知的,但可用估计值 取代它,于是训练NNC的误差函数定义为 (46) 仍用最速下降法修正NNC的权值: (47) (48)3 基于神经网络的非线性最优控制 式(47)和(48)中, 为学习率, 表示网络权值, 表示动量因子, 计算如下: 首先设建模网络NNM的非线性映射定义为 即 (49) 而控制模型NNC非线性映射定义为 ,即 (50)3 基于神经网络的非线性最优控制很容易从式(35)和(37)获得: (51) (52)因

16、而有: (53)3 基于神经网络的非线性最优控制 式中, 的计算与网络NNM学习算法相同,直接对NNC网络的各节点求导数获得,其中 表示NNC网络 和 的权值。 而 可通过NNM网络求偏导得出: 由式(38)(39) 得: (54) 由(54)式可推导出 (55)3 基于神经网络的非线性最优控制 系统的实验仿真 本文对新的控制器进行了数字仿真,以验证所提控制算法的正确性和适应范围。控制算法计算步骤如下: 1)初始化 2)测量 3)NNM学习阶段由4144式计算 4)计算3 基于神经网络的非线性最优控制5)NNC学习阶段由4748式计算6)令 ,返回2) 。 例1 设被控对象为如下表示的非线性时

17、不变系统。 3 基于神经网络的非线性最优控制其中,参数a表示控制非线性的程度。假设原线性系统的参数估计为:3 基于神经网络的非线性最优控制选取 用方程(33)解Riccati方程得到: (60)仿真时,控制性能指标: (61)其中 (62)3 基于神经网络的非线性最优控制 每当t=100步时,给被控对象加入一个随机干扰信号 ,以检查系统的状态响应,比较传统的LOR(线性最优调节器)和本文提出的神经网络最优控制(NNLC)器性能。如果控制器性能优良,则 收敛于零。3 基于神经网络的非线性最优控制 例2 设非线性程度 时,图3表示了用LOR方法的仿真结果,图中,控制输入u和状态响应 在下一个干扰加

18、入前均不收敛于零,这说明LOR方法对模型具有不确定性,非线性,受到干扰时其鲁棒性较差。图4表明了用NNLC方法仿真结果(仿真中使用了两个三层BP网络,其中NNM网结构: 即4-30-2网络结构;3 基于神经网络的非线性最优控制 NNC结构: 即3-30-1网络,学习率 ,初始神经网络权值 从图4中表明控制输入u,状态响应 均能在下一次干扰出现前收敛于零,保证了系统的稳定性控制。3 基于神经网络的非线性最优控制 下面分别是图3 LOR控制的仿真结果和图4 NNLC控制的仿真结果。3 基于神经网络的非线性最优控制 例3 伺服控制仿真,在所有参数同例1的情况下,我们取不同的非线性参数 ,来验证所提方法的有效性。如 ,指令信号 时的伺服跟踪输出响应见图5所示。3 基于神经网络的非线性最优控制下面分别是图5 输出响应曲线和图6 作用输出响应。3 基于神经网络的非线性最优控制 图6所示, 时的输出响应曲线。图7所示, 时的响应曲线,其中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论