机器人神经网络控制

上传人：微*** IP属地：河北上传时间：2026-06-29 格式：PDF 页数：8 大小：2.48MB 积分：12 举报 版权申诉

已阅读5页，还剩3页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第一局部机器人手臂的自适应神经网络控制

机器人是一具有高度非线性和不确定性的复杂系统，近年来各研究单位对机器

人智能控制的研究非常热门，并已取得相当丰富的成果。

机器人轨迹跟踪控制系统的主要目的是通过给定各关节的驱动力矩，使得机器

人的位置、速度等状态变量跟踪给定的理想轨迹。与一般的机械系统一样，当机器

人的结构及其机械参数确定后，其动态特性将由动力学方程即数学模型来描述。因

此，可采用经典控制理论的设计方法一一基于数学模型的方法设计机器人控制器。

但是在实际工程中，由于机器人模型的不确定性，使得研究工作者很难得到机器人

精确的数学模型。

采用自适应神经网络，可实现对机器人动力学方程中未知局部的精确逼近，从

而实现无需建模的控制。下面将讨论如何利用自适应神经网络和李雅普诺夫

(Lyapunov)方法设计机器人手臂跟踪控制的问题。

1、控制对象描述：

选二关节机器人力臂系统(图1),其动力学模型为:

图1二关节机器人力臂系统物理模型

M(q)q+V(q,q)q+G(q)+F(q)4-TJ=T(1)

其中

38sq2P2+P38S%-〃3(1+%)sin%

M(q)=V(q,q)=

+PlPAsin%0

G(q)JW[+P.gcos”%)],F(q)=002sgn(q),Tj=[0,2sin(r)0.2sin(r)]\

P58COS(q+%)

其中，q为关节转动角度向量，M(q)为2乘2维正定惯性矩阵，v(q，q)为2乘

2维向心哥氏力矩，G(q)为2维惯性矩阵，F(q)为2维摩擦力矩阵，乙为未知有界

的外加干扰，T为各个关节运动的转矩向量，即控制输入。

机器人动力学系统具有如下动力学特性：

特性1：惯量矩阵M(q)是对称正定阵且有界；

特性2：矩阵v(q，q)有界；

特性3：M(q)-2c(q,q)是一个斜对称矩阵，即对任意向量9有

/(M(q)—2c(q,q)).O⑵

特性4：未知外加干扰、满足口与为正常数。

我们取P=[外〃2,〃3,0，㈤=[2.9,0.76,0.87,3.04,0.87]依吟两个关节的位置指令

分别为0d=O.lsin(。，%1=0.1cos(。，即设计控制器驱动两关节电机使对应的

手臂段角度分别跟踪这两个位置指令。

2、传统控制器的设计及分析：

定义跟踪误差为：

e(/)=q”(，)一q。)⑶

定义误差函数为：

r=e+Ae(4)

其中A=八’>0o

那么

Mr=M(q^—q+Ae)=M(q[十Ae)—Mg

=M(q4+Ae)+Vq+G+F+T”-T

=M(q,/+Ae)-Vr+V(q[+Ae)+G+F+T,/-T(5；

=—Vr—T+f+T”

其中，f为包含机器人模型信息的非线性函数。f表示为

f(x)=M(qJ+Ae)+V(q</+Ae)+G+F(6)

在实际工程中，M(q),V(q,q),G(q)和F(q)往往很难得到精确的结果，导致

模型不确定项f(x)为未知。

为了设计控制器，需要对不确定项"X)进行逼近，假设[为f的逼近值。设计控

制律为

I+K「r(7)

将控制律式(7)代入式(5),得

Mr=-Vr-f-Kr+f+Tf/

=-(Kv+V)r+f+=-(Kv+V)r+g0⑻

其中f为针对f的逼近误差，f=f“，GO="T〃。

如果定义Lyapunov函数

L=-rrMr

2(9)

那么

这说明在L固定条件下，控制系统的稳定依赖于G),即f对f的逼近精度及干

扰T"的大小。

3、基于RBF神经网络逼近的机器人手臂控制

1).基于RBF网络的逼近算法

已经证明，采用RBF网络可以实现对任意连续函数的精确逼近。因此，可以采

用RBF网络实现对不确定项/的逼近。

在RBF网络结构中，取x=k，X2，...j,1为网络的输入向量。设RBF网络的径向基

向量H=[4，…，九」，其中力，为高斯基函数：

||x-c.||2

'=exp(/2〃)，/=1，2,・・・加.(10)

其中网络第/个结点的中心矢量为Cj二*，…，cj"1,2,…

假设存在权值W,逼近函数f(x)的理想RBE网络输出为：

f=Wh(x)4-£(x)(11)

其中W网络的权向量，h=[4,4・・・〃/,g(x)为逼近误差，£(X)<EAf(X)o

考虑式(6),针对f(x)中包含的信息，逼近函数f(x)的RBF网络输入取：

X=[ererq；q：；qj](⑵

2),基于RBF网络的控制器和自适应律设计

如果满足LWO,由于L>0,且M(q)有界，那么由L表达式可知，=(/)、W和W

都有界。由r(f)有界可知，跟踪误差e(f)及其导数e(/)都有界，从而q和q有界，且

跟踪误差e(r)及其导数e(r)的收敛值随神经网络逼近误差上界以和干扰上界〃的增

大而增大，并可通过增大K-的值到达任意小。

(2)考虑鲁棒项，v取式(18),那么

由于L>0,且M(q)有界，那么r(f)、W和W为有界。由于L=-2r/Kvr,又由

于式(17)的右边信号都有界，那么r有界，L有界，那么根据Barbalat引理.，工趋

近于零，即r(f)趋近于零，从而可得出e⑺和e⑺趋近于零。

4、SIMULINK仿真验证

仿真图如下：

由于系统比拟复杂，直接采用模块搭建比拟麻烦，所以本设计中采用S.function

动态函数来实现前面推导的算法公式，实现了三个动态函数：input.m产生输入、

Ctrl.m为控制器实现、plant.in表示控制对象：

其中控制器实现函数Ctrl,m中RBF神经网络的中心矢量及近似标准差分别设置

为：

这两个值的取值对神经网络控制的作用很重要，如果参数取值不适宜，将使高斯基函数无法得

到有效的映射，从而导致RBF网络无效。

网络输入取z=|eeqdqdqd],初始状态设置为零，控制参数取K「{50,50},

F=d〃/g{25,25}。高斯基函数的m语言实现如下：

逼近效果如下列图，由图可以看出开始阶段拟合误差较大，但随着时间的增大，RBF网络能够

较好地拟合原函数，即使原函数很复杂，通过调整参数，逼近效果会更好。

对两个关节的位置指令分别为0"=O.lsin(。，%,/=0.1cos(f)跟踪效果如下

列图所示，开始时有一定的误差，但稳定后能无静差跟踪，效果很好。

第二局部对《自适应神经网络》的理解与体会

本门课程是继《线性系统》后的一门比拟理论的关于控制理论的课程，与线性系

统不同的是自适应神经网络控制研究的对象更多的是非线性、参数未知、模型未知

的复杂系统，经典的控制方法在面对这样的系统时显得非常乏力，于是，自适应控

制、学习控制、智能控制如神经网络遗传算法等就大有用武之地了。

通过本门课程的学习我学到了backstopping方法，神经网络控制方法，通过严

格的公式推导出神经网络的控制思想还是挺有趣味与吸引力的，循序渐进的过程让

我懂得了虚拟控制、匹配条件、延迟参数设计等概念，不管以后自己是否走理论研

究这条道路，我感觉在这么短的时间内学到的这些知识还是很有价值的。

下面对我学到的一些知识进行简要的总结：

自适应控制的研究对象是具有不确定性的系统，这里所指的“不确定性”是指

被控对象及其环境的数学模型不是完全确定的。

对于具有较强不确定性的被控系统，如何设计一个满意的控制器，就是自适应

挖制所要研究的问题。参照在日常主活中生物能够通过自觉调整自身参数改变自己

的习性，以适应新的环境特性，从而提出了自适应控制器的设想。自适应控制器应

能够及时修正自己的特性以适应对象和扰动的动态特性变化，使整个控制系统始终

获得满意的性能。因此，自适应控制方法就是依靠不断采集的控制过程信息，确定

被控对象的当前实际工作状态，根据一定的性能准那么，产生适宜的自适应控制规

律，从而实时地调整控制器结构或参数，使系统始终自动地工作在最优或次最优的

运行状态下。

自适应控制是现代控制的重要组成都分，它同一般反应控制相比具有如下特点：

(1)一般反应控制主要适用于确定性对象或可以预知的对象，而自适应控制主要

研究具有不确定性的对象或难以确知的对象。

(2)一般反应控制具有较强的抗干扰能力，能够消除状态扰动所引起的系统误

差；而自适应控制由于具有辨识对象和在线修改参数的能力，因而不仅能消除状态

扰动引起的系统误差，而且还能消除系统结构扰动引起的系统误差。

(3)一般反应控制系统的设计必须依赖系统特性的数学模型及其环境变化状况,

而自适应控制系统设计那么对数学模型的依赖很小，仅需要较少的验前知识，但自

适应控制的实现往往更多地依靠计算机技术。

(4)自适应控制是较为复杂的反应控制，它在一般反应控制的根底上增加了自适

应控制环节或系统参数辨识器，另外还附加了一个可调系统。

Backstepping设计方法是针对不确定性系统的一种系统化的控制器综合方法，

是将Lyapunov函数的选取与控制器的设计相结合的一种回归设计方法。在处理线

性和某些非线性系统时，该方法在改善过渡过程品质方面展现出较大的潜力，应用

在机器人控制、电机控制、液压控制、船舶控制等许多控制领域。

Backstepping的具体的根本设计思想是将复杂的非线性系统分解成不超过系统

阶数的子系统，然后单独设计每个子系统的局部Lyapunov函数，在保证子系统具

有一定收敛性的根底上获得子系统的虚拟控制律，在下一个子系统的设计中，将上

一个子系统的虚拟控制律作为这个子系统的跟踪目标。相似于上个子系统的设计，

获得该子系统的虚拟控制律；以此类推，最终获得整个闭环系统的实际控制律，且

结合Lyapunov稳定性分析方法来保证闭环系统的收敛性。

Backstepping可用来设计控制方案以满足三角结构单输入单输出非线性系统的

匹配条件。Backstepping设计方法之所以受到国内外学者的极大关注，主要原因为

该方法取消了系统不确定性满足匹配条件的约束，从而解决了相对复杂的非线性系

统的控制问题。在现实世界中，存在大量非线性系统具有（或者可以经过微分同胚变

换成）严格反应等标准型；该方法为复杂非线系统的Lyapunov函数设计提供了较为

简单的结构化、系统化方法，解决了一直以来具有严格反应等结构的非线性系统稳

定性分析和控制器设计的难题。自适应backstepping设计方法开展的初级阶段，

要求系统不确定性能够线性参数化。随着神经网络与模糊系统等智能控制技术的不

断开展，很好地取消了自适应backstepping设计所需的该约束条件，从而使得

backstepping技术获得了很大的开展空间。特别是神经网络和自适应技术的引入，

极大地推广了backstepping方法的应用。

人工神经网络利用物理器件来模拟生物神经网络的某些结构和功能。下列图是

最典型的人工神经元模型，它是大多数神经网络模型的根底。

w.—-代表神经元i与神经元j之间的连接强度（模拟生物神经元之间突触连接强

度），称之为连接权；

%-一代表神经元i的活泼值，即神经元状态；

V；一一代表神经元j的输出，即是神经元i的一个输入；

。二一代表神经元的阐值。

函数f表达了神经元的输入输出特性。在M-P模型中，f定义为阶跳函数：

人工神经网络是一个并行与分布式的信息处理网络结构，该网络结构一般由许

多个神经元组成，每个神经元由一个单一的输出，它可以连接到许多其他的神经元,

其输出有多个连接通路，每个连接通路对应一个连接权系数。

严格来说，神经网络是一个具有如下性质的有向图。

（1）对于每个结点有一个状态变量F；

（2）结点i到结点j有一个连接权系数匕

（3）对于每个结点有一个阈值学;

（4）对于每个结点定义一个变换函数工民，吗4«工力］,最常见的情形为

/（2%咨一学）。

下列图表示了一个典型的前馈神经网络结构。

神经网络的应用已经涉及到各个领域，且取得了很大的进展。

机器人控制：对机器人轨道控制，操作机器人眼手系统，用于机械手的故

防诊断及排除，智能自适应移动机器人的导航，视觉系统。

自动控制领域：主要有系统建模和辨识，参数整定，极点配置，内模控制，

优化设计，预测控制，最优控制，滤波与预测容错控制等。

处理组合优化问题：成功解决了旅行商问题，另外还有最大匹配问题，装

箱问题和作业调度问题。

模式识别：手写字符，汽车牌照，指纹和声音,，只别，还可用于目标的自动

识别，目标跟踪，机器人传感器图像识别及地震信号的鉴别。

第三局部对研究的认识和感想

麻省理工大学人工智能实验室关于做研究的看法告诉我们如何做研究，为我们提

供的对做研究本身（阅读、写作和程序设计）、理解研究过程以及开始热爱研究（方

法论、选题、选导师和情感因素）建议都很有参考意义的。想想自己的学习研究方

法，颇感差距与惋惜。我将自己的研究方向定位为应用型研究，认为阅读参考文献、

写作不那么重要，但真的

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

机器人神经网络控制

文档简介

温馨提示

最新文档

评论

机器人神经网络控制

文档简介

温馨提示

最新文档

评论

相关文档