基于BP神经网络的自校正PID控制研究_第1页
基于BP神经网络的自校正PID控制研究_第2页
基于BP神经网络的自校正PID控制研究_第3页
基于BP神经网络的自校正PID控制研究_第4页
基于BP神经网络的自校正PID控制研究_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于bp神经网络的自校正pid控制研究摘 要: 基于反向传播bp算法的神经网络具有很强的学习能力,适应能力.本文详细叙述了bp算法的原理,并将改进的bp神经网络应用在传统的pid控制中,克服了pid控制在参数的调整过程中对于系统模型过分依赖的缺点.利用matlab仿真的结果表明基于bp神经网络的自校正控制能够使传统pid控制的参数逼近最优达到很好的控制效果.关键词: bp算法,神经网络,pid控制1引言随着科学技术的发展,人们需要加以控制的过程和系统越来越复杂,许多系统具有大型,复杂和强烈非线性的特点.对这些系统进行有效准确的控制就非常的困难.传统的pid控制是通过对偏差的比例(p),积分(i

2、),微分(d)的线性组合构成控制向量对被控对象进行控制.它算法结构简单,但是,当被控对象具有非线性,时变不确定性和难以建立精确的数学模型时,pid控制器参数整定不良,性能欠佳,不能达到理想的控制效果.随着人们对神经网络的研究,基于bp算法的神经网络以其自学习,自适应及逼近任意函数的能力在控制领域得到应用,将bp神经网络和传统的pid控制相结合构成的比例,积分,微分神经元控制器,不仅克服了pid控制的缺陷,而且具有快速的学习能力,快速的适应性,良好的性能和鲁棒性.因此,可以通过神经网络对系统性能的学习来达到最佳的比例,积分,微分组合,实现最佳的pid控制效果.2 神经网络的bp算法2.1 神经网

3、络的结构 bp神经网络是控制领域中应用最多的神经网络,它是多层神经元彼此以前馈方式连接组成的网络,网络中没有信号反馈,只有相邻层神经元,每个神经元首先完成输入信号与连接权值的内积计算,然后通过一个非线性函数作用产生输出.bp神经网络通常由输入层,输出层和若干隐层构成每层由若干个结点组成, 每一个结点表示一个神经元,上层结点与下层结点之间通过权值联接, 同一层结点之间没有联系。多层前馈神经网络的结构如图1所示:输入层 隐层 输出层k-1层第k层k+1层第1层第q层图1 神经网络结构图2.2神经网络的学习bp算法神经网络的学习方式有两种:有指导的学习在训练期间,向网络提供输入输出样本对;无指导的学

4、习自适应于输入空间.神经网络的学习规则就是修正权值的一个算法. bp神经网络的学习过程分为信息的正向传播过程和误差的反向传播过程两个阶段。bp算法是一种反向传播算法,外部输入的信号经输入层、隐含层的神经元层得不到期望输出,则转入误差反向向传播过程, 将实际值与网络输出值之间的误差沿原来联接的通路返回,通过修改各层神经元的联接权值,使误差减少,然后再转入正向传播过程,反复迭代,直到误差小于给定的值为止。以下是bp算法具体过程的算法原理:首先,从单神经元模型的输入输出关系着手图2 神经元模型 由图2神经元模型设: (1) (2) 其中为阈值, 为连接权值, 为输出变换函数。神经元的输出变换函数通常

5、选典型的非线性s型函数和双曲函数:下面探讨多层前馈神经网络的bp算法原理:给定p组输入输出样本对:利用样本对训练神经网络,设神经网络的评价函数为: (3)其中 (4)神经网络bp算法的关键是得到评价函数e的最优值,采用一阶梯度法调整权系数使评价函数为最小,即计算评价函数的e对寻优参数w的一阶倒数.由公式(3)得所以一阶梯度法寻优的关键是计算 (5)又 (6)设 (7) (8) ,为神经网络的学习率 (9) (10) 对于上式第一项的计算需要考虑以下两种情况:1. 输出层神经元的输出对e的影响: (11) (12)2. 中间层神经元的输出对e的影响(13) (14) 即对于第p组输入样本,第q层

6、有, (15). (16) 对于第p组输入样本,第q-1层有, (17) (18)由公式(15) (17) (18)可见,bp算法是反向递推算法.从以上推导可以得到bp算法修正权值的三个关键公式: (9) (12) (14) 其中, 当选定神经网络的输出变换函数时,公式(9)(12)(14)可以进一步简化得到:时则 (19) (20)则 (21) (22)综上,bp算法属于全局逼近算法,具有较好的泛化能力.只要有足够的隐层和隐节点数,它可以逼近任意的非线性映射关系.由上面的算法原理利用matlab源程序用多层前馈网络和bp算法对其系统进行辨识仿真,设某两输入两输出的系统模型为:yp2(k+1)

7、=0.5yp1(k)yp2(k)/(1+yp2(k)+u2(k)yp1(k+1)=0.5yp1(k)/(1+yp2(k)2)+u1(k)测试数据为 sin(pik/25), k250u(k)=1.0, 250k500 -1.0, 500k750 0.3sin(pik/25)+0.1sin(pik/32)+0.6sin(pik/40),750k1000.神经网络模型选3,3,1结构 ,步长为2500.得到output1与 output2输入信号和神经网络的输出信号的仿真图及误差为图3 output1输入输出信号及系统误差的仿真图图4 output1输入输出信号及系统误差的仿真图从以上四个仿真图可

8、以看出通过bp算法神经网络的输出信号能够以极小的误差逼近输入信号.但是从以上系统的输入输出信号对比以及累积误差曲线可以看出神经网络的bp算法具有收敛速度慢和容易陷入局部极值的缺点.因此对以上bp算法进行改进引入动量项 (23)为k时刻的负梯度.其中,w既可以是单个的权值也可以是权向量, 0为学习率, 01为动量项因子.通过增加动量项有效的提高了神经网络的收敛速度,下面把经过改进的bp算法与传统的pid控制相结合,研究基于bp神经网络的pid控制器.3 基于bp神经网络的pid控制原理根据神经网络的结构特点可得到应用在pid控制中的神经网络结构为:图5 神经网络pid控制结构图 从图5中可以看出

9、在传统的pid 控制中取神经网络的输出分别为pid 控制中的比例,积分,微分项时,就使得bp神经网络成为pid控制器的一部分.pid控制是一种负反馈控制。传统的pid控制器的数字增量形式可以描述为:(24) 其中, 为已知的期望输出或参考模型的输出.e(k)= .为比例系数;为积分系数;为微分系数。 一般来说,随着的增大,系统的稳态误差减小,但是系统的稳定性变差,而较小时,系统的调节时间较长, 过大又会导系统不稳定; 有助于提高系统的稳态精度,但是过大也会导致系统的不稳定, 的增加有助于减小系统的振荡.实际的控制过程通过实验加拼凑的方法确定pid控制器的三个参数.而神经元pid控制器则是用神经

10、元的输出替代pid控制,设, (25)则由bp算法可得神经元pid控制器的输出为:= (26)式(24)(26)两式的形式完全相同,不同的是式(24)的系数是预先确定好的且在控制过程中固定不变的.而式(26)的系数可以通过神经元的自学习能力来自适应调整,正是这样能在线自适应整定才大大提高了控制器的鲁棒性.基于神经网络的pid自校正控制研究的控制结构为由一个神经元pid控制器和一个nn辨识器构成,调整神经元pid控制器的参数采用了与基于神经网络的模型参考自适应控制同样的办法,即利用nn辨识网络充当反向传播误差e(k)的通道,得到神经元pid控制器的教师信号。神经元pid控制器的教师信号为其中,j

11、 为rmnn辨识器网络的中间层神经元数 为nn的中间层神经元到输出层神经元的连接权值 为nn的输入层神经元到中间层神经元的连接权值基于nn的自校正pid控制结构图为:图6基于上图的控制过程为:首先,离线的训练辨识器网络rmnn,待神经网络rmnn的权值固定后,将神经元pid控制器与辨识器网络rmnn串接离线的训练神经元pid控制器.由于控制器的误差信号不直接与对象相连,而是经过神经网络rmnn反向传播得到的,所以辨识器网络rmnn实际上充当了误差反向传播的通道,为控制器网络提供教师信号.4 仿真及分析4.1单神经元自适应pid控制器仿真设被控对象的近似数学模型为: yout(k)=0.368y

12、1+0.26y2+0.1u1+0.632u2选用单神经元,采用增加动量项的bp算法,输入信号为矩形波,得到单神经元pid控制器的仿真图形, 如图7,图8,图9所示图 7图8图9从图中可以看出:控制变量u变化规则,扰动较小,跟踪曲线光滑,跟踪误差小,达到稳定状态后,误差波动小.4.2基于bp神经网络的自校正pid控制器仿真设被控对象的数学模型为:yout(k)=a(k)*y1/(1+y12)+u1 其中, a(k)=1.2*(1-0.8*exp(-0.1*k)是慢时变的. 仿真采用的输入信号为正弦信号,初始权值取随机值,神经网络的结构为4,5,3.图10将输入信号和输出信号在同一坐标中绘出,从图

13、10可以看出,在整个过程中,输出信号和输入信号几乎完全重叠,说明系统对输入信号有很强的跟踪能力.图10 正弦跟踪曲线图11为系统的误差曲线,可以看出,系统跟踪误差非常小大约在(0. 008 - 0. 008 内) , 跟踪效果很理想.图11 误差曲线图12为控制变量曲线,变化规则并且扰动较小图12 控制变量u图13 反映了整个过程中参数kp , ki , kd 随时间变化的情况,可以看出, kp , ki , kd 在不断调整,从而使控制效果最佳.图13 pid控制器参数整定曲线综上所述,从仿真结果可以看出,bp网络自校正的pid控制器能够根据被控对象的变化,对kp ,ki ,kd 3个参数进行调节,在整个控制过程中,kp ,ki ,kd 3个参数总是在不断向最优值逼近,从而对控制效果有很大改进.参考文献:(1) 蔡自兴. 人工智能控制. 北京:化学工业出版社,2005(2) 张汉全,肖建,汪晓宁. 自动控制理论新编教程. 成都:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论