已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工神经网络应用于伺服控制系统(译文) 钱玲楠 050810504人工神经网络应用于伺服控制系统Yuan Kang, Min-Hwei Chu and Min-Chou Chen中原大学(台湾)机械工程系、东南科技大学(台湾)机械工程系摘要本章讲述了基本的神经网络控制器。介绍了有专门学习结构的神经控制。讨论和模拟了带有近似雅可比的直接神经控制。提出了使用多重神经网络的自适应控制,其中包括直接神经控制器,神经模拟器和神经调谐器。神经模拟器是用来近似雅克比值。误差以及误差的微分的线性组合是用来近似权值更新的反向传播误差。神经协调器是一种可在线调整线性组合中关键参数的在线神经网络。关键词:直接神经网络,伺服控制,专门学习结构,多重神经网络,神经协调器1.介绍近年来,神经控制因其在线学习能力和自适应能力应用于多种领域,有许多神经网络的学习策略被提出并应用于一些具体的非线性控制系统,以克服未知模型和参数的变化问题。一般学习结构和专门学习结构在早期的神经控制发展中被提出和研究1。一般学习结构如图19.1所示,用神经网络学习被控对象的逆动态,将训练好的神经网络应用于前馈控制器。在这个例子中,一般过程因为其神经网络需要在一个超过实际需要的操作范围上学习被控对象的的响应,效率较低。一个可能解决这一问题的办法就是将一般过程的方法与专门过程结合。在本章中,将介绍带有专门学习结构的直接神经控制器应用于伺服控制系统。19.3 专门学习结构的直接控制这种专门的学习结构如图19.2表示,训练专门的神经网络控制器仅作用于特定的范围。训练需要用期望的响应映作为神经网络的输入。训练这个网络用于找出可驱动被控对象输出理想命令的输入。这是用期望和实际被控对象响应之间的误差以一个最速下降的过程来调整网络的权值。权值在递归迭代中不断地调整以减小误差。这个过程需要知道被控对象的雅可比值。有两种策略可促进专业学习,一种是直接控制,如图19.2;一种是间接控制,如图19.3。前者,被控对象被看作是神经网络中不可调整的附加层,图19.2中的虚线图表示权值的更新需要被控对象的信息;后者,已经有过很多应用,它是一个两重过程,包括被控对象动态特性的鉴定和控制。在间接控制策略中,一个子网(模拟器)需要在控制阶段之前被训练,模拟器训练的质量对于控制性能非常重要。因此训练模拟器时送入的数据必须覆盖足够大范围的输入和输出数据对,但如果这些用于训练模拟器的数值在输入值范围之外,模拟器的反向传播失败,将造成不好的,甚至不稳定的控制性能。如果先知道被控对象的定性知识或者被控对象雅可比值(被控对象输入关于输出的偏微分),直接控制策略可以避免这个问题。但通常很难近似得到一台未知被控对象的雅可比值。在本章中,将介绍获得用于直接神经网络的近似雅可比值的方法。使用了近似方法的直接控制策略已经成功应用于伺服控制系统,相应的性能已经被调研和讨论。2.直接神经控制器一个三层的直接神经控制器,如19.4所示。已知被控对象的定性知识或者被控对象的雅可比值,一个带有隐藏层的三层神经网络可以计算出输出值的任意判别边界6。尽管有两个隐藏层的神经网络在一些专门问题上能获得更好的近似值,但也更容易陷入局部极小7,需要更多的CPU时间。在下面一节中,将考虑带有一个隐藏层的反向传播网络(BPN)。此外,还将考虑一个隐藏曾里面包含的正确单元的数目。李普曼8提供了全面的几何论据以及推理来证明为什么一个单隐藏层中单元的最大数目等于M(N+1),其中M是输出单元的数目,N为输入单元的数目。张等人2已经测试了一个传播跟踪控制系统上单隐含层的不同数目单元的数目。最终发现,一个带有三至五个隐藏层的网络足够给出一个满意的结果。2.1直接神经控制器的算法这里提出的直接神经控制器是有两个输入单元,一个输出单元,若干隐含单元的三层神经网络。,X和分别代表需要的命令输入,参考模型的输出和被控对象的输出。网络的两个输入是误差以及它关于和的微分。参考模型可以按照标准二阶传递函数设计,阻尼比和固有频率可以按照被控对象的物理特性定义。直接控制器的算法和权值更新方程如图表19.4并由下述方程表述。这里的直接神经控制器有隐含层(下标j),输出层(下标k)和输入层(下标i).为了标准化为-1和+1,输入信号在输入层被乘以增益和。切线双曲函数作为隐含层和输出层的激活函数。隐含层的单元数目等于J。输入层的单元数目等于I。输出层的单元数目等于K。隐含层中j节点的输入为: i=1,2I,j=1,2J (19.1)节点j的输出为: (19.2)其中0,在输出层,节点k的输入为: j=1,2,J,k=1,2,K (19.3)节点k的输出为: (19.4)输出层中节点k的输出被认为是单输入单输出系统的控制输入up。方程中,代表输入层和隐含层之间的连接权,代表隐含层和输出层之间的连接权。和分别代表隐含层和输出层的偏值。第N个样本作用时,误差方程被定义为: (19.5)和分别代表参考模型的输出和被控被控对象在第N次样本作用时的输出,在从N次改变到N+1次的时间间隙,权值矩阵得到更新。 (19.6)其中为指学习速率,为动量项因子。关于权系数的梯度变化为: (19.7)定义: n=1,2,K (19.8)这里定义为被控对象的雅克比值。同样的,关于权系数梯度变化,由下式决定: (19.9)这里: m=1,2,J (19.10)输出层和隐含层的权系数修正公式为: (19.11) (19.12)这里和可以由公式(19.21)和(19.24)得到。神经网络中的连接权在从样本N到样本N+1改变的过程中得到更新。 (19.13) (19.14)切线双曲函数作为激活函数,使得神经网络控制器输出( 19.4 )是介于-1和+1之间的值,再乘以尺度因子作为被控对象的输入。初始化置权值和偏值为+0.5到-0.5之间的最小随机数。根据公式(19.13)和(19.14)更新数值。2.2 在线调节的自适应神经控制器根据公式(19.8),被控对象的雅克比值需要预先知道。然而,因为被控对象的动态特性,确切的很难决定。用微分近似的方法,在很小的的范围内改变被控对象的每个输入,并测量输出的变化,雅克比是指: (19.15)或者,将微分关系的变量的变化与之前迭代的值比较,微分可以由以下关系近似: (19.16)早些的报告2中指出,当被控制被控对象惯性大或者有干扰时,使用公式(19.5)或者(19.6)近似时经常造成模棱两可的情况。这种情况说明神经控制器在输入和输出之间建立了一种因果关系。这是与期望的情形相违背的。一个简单的正负号函数由张等人提出用来近似被控对象的雅克比值2。被称为是工业跟踪控制应用的在线训练自适应神经控制器。因此,用和的变化率来近似。被他们的符号函数代替。因此根据公式(19.8): (19.17)清楚地了解控制信号如何影响被控对象的输出可以提供需要的符号信息。因此,当时,得: (19.18)当,得: (19.19)用公式(19.17)和由公式(19.18)和(19.19)得到的给定的微分的符号,神经控制器将根据被控对象的输出误差e(N),有效地输出正确方向的控制信号。3.雅克比近似值准确地跟踪响应需要增加收敛速度。然而,对于一个单输入单输出的控制系统,误差关于网络输出的灵敏度可以根据适应法则9被近似,将误差和误差的微分线性组合,如下: (19.20)这里和都是正常数,因此公式(19.8)可化为以下形式: (19.21)例19.1:一个应用于直流速度伺服控制系统的直接神经控制器如图表19.5所示。假定伺服放大器的电压增益是单位1。速度传感器的增益为0.001V/rpm。直流伺服电机的一阶动态模型为: (19.22)应用了适应法则的直接神经控制器由三个层,五个神经元组成,如图表19.6所示,用于控制和调节电机速度。学习速率=0.1,采样时间为0.0001s,, ,分配给模拟阶段的 为1V(1000rpm),模拟结果如图表19.7,19.8,19.9所示。模拟结果表明,连接权将收敛。的时域响应表明神经网络保持着一个适当的电压信号输出以克服旋转电枢产生的速度电压。同样的,神经控制器可以提供克服扭矩载荷和摩擦的输出。这与PI控制器类似,但神经控制器可以加强自适应调节能力以及改善控制系统的性能。该MATLAB仿真程序包在附录列出。用正负号函数接近雅克比的在线训练神经控制器也被应用于这个控制系统。仿真结果如图表19.10,19.11和19.12所示,该仿真结果表明,在线训练的方法需要较长的收敛时间。图19.5 使用直接神经控制器的直流速度伺服控制系统 图19.6 使用适应法则的直接神经控制器图19.7 直流伺服电机的速度响应图19.8 控制输入的时域响应 图19.9 所有连接权值在0.4s后收敛 图19.10 直流伺服电机的速度响应图19.11 直流伺服电机的时域响应 图19.12 所有连接权在0.6s后收敛用适应法则的直接神经控制器可以比在线训练方法提供更好的控制性能。适应法则使用误差的微分增加了误差收敛过程的阻尼,改善了权值更新算法的稳定性和收敛速度。没有提出专门的方法决定参数和的合适的值,这些参数只能在尝试和误差中调整。4.用神经协调器训练参数和应用适应法则提高了连接权更新的在线学习速率。然而,没有专门的方法在线确定参数和.参数仅在尝试和误差中调整。这很难计算出合适的参数值。参数和可以很容易地由输入信号的边界决定。输入信号在输入层与参数和相乘,使之以-1和+1的形式表示。近期有人证明,神经网络可以调节PID控制器的参数10。在这一节,将为伺服控制系统介绍一种使用多重神经网络的模式跟随自适应调节控制。直接神经控制系统包括一个传统的直接神经控制器,神经模拟器和神经调谐器。它用误差和误差微分的线性组合来近似反向误差。参数调节器用于在线调节线性组合中的参数。神经模拟器预先训练用于近似被控对象的雅克比值。这三种不同的网络和参考模型融入了自适应调节算法。多重神经网络自适应控制系统(MNNACS)假设:传统的直接神经控制器有5个隐含的神经元,神经模拟器和神经协调器均有8个隐含的神经元,以及一台非线性的三阶被控对象可用。一个非线性的三阶被控对象是用于证明: 这里的n是指第n次采样,up是被控对象的输入,是被控对象的输出以及是一个非线性函数可用神经网络描述。非线性三阶被控对象的模拟图表如19.13所示。带有一个隐含层和8个隐含神经元的BP神经网络如图表19.14所示,它需要被预先训练以及适应被控对象输入输出关系的模型。的输入早输入神经元中被标准化为-1和+1。的输出与一个常数增益相乘来近似作为被控对象的电压。这可以合成来近似目标位置。图19.13 离线训练的被控设备模拟器的结构图 图19.14 神经模拟器结构带有训练好的权值的神经网络作为模拟器在控制阶段近似雅克比值。此外,被控对象的动态性能在实际控制过程中可能改变,以至于神经模拟器需要在线训练来改善近似被控对象雅克比值时的精度。4.1 多重神经网络的自适应控制应用于伺服控制的模型跟踪多重神经网络自适应控制系统(MNNACS),包括神经控制器,神经模拟器和神经协调器,如图表19.15所示。其算法是根据李雅普诺夫定理保证收敛而设计的。一个带有期望性能指标的二阶线性传递函数被定义为参考模型。它可以执行所期望的动态响应即一个闭环控制系统的理想输出。参考模型如下: (19.23)这里和分别为参考模型的输入和输出,s是拉普拉斯算子,为阻尼,为自振角频率。两参数可由需要的性能指标(建立时间,上升时间和最大超调量)决定。三个神经网络被用于控制系统;图表19.14,19.16和19.17分别为神经模拟器,神经控制器和神经协调器。每个网络有三层,包括一个输入层(下标为i),一个隐含层(下标为j)和一个输出层(下标为k)。和的隐含层和输出层都应用了双曲正切函数,Sigmoid函数和单位阶跃函数分别作为N3隐含层节点和输出层节点的激活函数。神经网络是一个两输入一输出带有5个隐含节点的的直接神经控制器,两个输入分别为误差和误差的微分。这个误差是命令和输出之差。输入信号被乘以和后标准化为-1和+1.神经控制器的输出up乘以比例因子作为被控对象的输入。的权值更新取决于BPE,BPE由误差和误差的微分线性组合乘以参数K3和K4近似而得。误差为参考模型输入和输出之差。因此,合适的和值可以加快反向传播的收敛速率和稳定性。图19.15 模型跟踪多重神经网络自适应控制系统(MNNACS)结构图图19.16 神经控制器结构图19.17 参数协调器结构神经网络如图表19.6所示,在隐含层有8个节点,的两个输出被定义为参数和的合适值。六个输入为和与被控对象的输出,输入和指令信号有关,该输出,输入和命令信号被和标准化。三个神经网络的变量和参数在一下分析中使用下标“”,“-”和“”表示,和。4.2 神经协调器的权值更新和的两个算法已经在第一节中表述。神经协调器的算法和,不同。因此,在这一节中将对的算法有一个详细的表述。输出层和隐含层,隐含层和输入层之间的加权系数修正公式分别为: k=3,4,j=18 (19.24) i=16,j=18 (19.25)这里的误差能量函数为: (19.26)关于的梯度变化: k=3,4 (19.27)这里为激活函数,代表,因此: k=3,4 (19.28)这里。激活函数和输出神经元是统一的。被控对象的雅克比值: (19.29)这里的是神经网络的增益,是输入网络的标准化增益。根据适应法则9,一个单输入单输出控制系统,BPE即关于网络输出的敏敢性可由误差和其微分的线性组合所近似,神经网络的输出层的第n-1次权值更新为: (19.30)这里和为正常数。第N次的更新的权值关于,的微分分别为: (19.31) (19.32)以及被控对象输入关于和的微分分别为: k=3,4 (19.33)将公式(19.31)和(19.32)带入(19.33)并将结果带入公式(19.28)将得到和,再将和带入公式(19.27),可以得到N2网络的关于的梯度下降: (19.34)这里被定义为: (19.35)因此,权值和可以在N次到N+1次改变时决定: k=3,4 j=18 (19.36) i=16 j=18 (19.37)权值将在N2在线训练的过程收敛,参数和将收敛到适当的值。MNNACS可以为传统DNCS提供合适的参数。5总结传统的简单结构的直接神经控制器可以容易地执行,节省更多的CPU时间。但是被控对象的雅克比值不容易知道。传统的在线训练神经控制器使用正负号函数近似雅克比值还不足以用于伺服控制系统。适应法则可以有效提高收敛速率,但是合适的参数取决于尝试和误差,获得合适的参数不容易。这里提出的MNNACS可以为传统的直接神经控制(DNC)提供合适的参数。带有被MNNACS训练好参数的DNC可以提高自适应能力以及改善非线性控制系统的控制性能。参考资料1 Psaltis, D., Sideris, A. and Yamamura, A. A.: A Multilayered Neural Network Controller. IEEE Control System Magazine, v. 8, 1988, pp. 17212 Zhang, Y., Sen, P. and Hearn, G. E.: An On-line Trained Adaptive Neural Controller. IEEE Control System Magazine, v. 15, 1995, pp. 67753 Weerasooriya, S. and EI-Sharkawi, M. A.: Identification and Control of a DC Motor Using Back-propagation Neural Networks. IEEE Transactions on Energy Conversion, v. 6, 1991, pp. 6636694 Rubai, A. and Kotaru, R.: Online Identification and Control of a DC Motor Using Learning Adaptation of Neural Networks. IEEE Transactions on Industry Applications, v. 36, n. 3, 20005 Weerasooriya, S. and EI-Sharkawi, M. A.: Laboratory Implementation of A Neural Network Trajectory Controller for A DC Motor. IEEE Transactions on Energy Conversion, v. 8, 1993, pp. 1071136 Cybenko, G.: Approximation by Superpositions of A Sigmoidal Function. Mathemati
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026-2031中国女装行业发展趋势及前景战略研究分析报告
- 中学化学题库及答案
- 2026年笔记本定制合同
- 2026年医生在线诊疗服务合同
- 2026年网红代言合同
- 2025年医院护士三基考试试题及答案
- 2025年lng安全知识考试题及答案
- 2025年酒店运营与管理题目及答案
- 2025道路运输安全员两类人员考试考核题库含答案
- 2025年客服逻辑思维试题及答案
- 美术馆员工合同协议书
- 2025年广西普法考试(一)及答案
- 2025年中国华电集团有限公司总部部门招聘12人考试参考试题及答案解析
- 2024年Q1起重机指挥模拟练习题及答案
- 2025年庄河市公开招录社区工作者招聘62人笔试考试备考题库及答案解析
- 2026年辽宁医药职业学院单招职业倾向性测试题库附答案
- 幼儿园韵律活动培训
- 2025年广东普法考试考场二题目及参考答案
- 安全生产巡检及整改方案表格
- 2025中国微生物制剂农业应用与市场推广研究报告
- 焦裕禄事迹课件
评论
0/150
提交评论