1机器人神经网络逆摸学习控制方法分析.doc_第1页
1机器人神经网络逆摸学习控制方法分析.doc_第2页
1机器人神经网络逆摸学习控制方法分析.doc_第3页
1机器人神经网络逆摸学习控制方法分析.doc_第4页
1机器人神经网络逆摸学习控制方法分析.doc_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机器人神经网络逆模学习控制技术分析【摘要】 机器人学是一门高度交叉的前沿学科,涉及到电子学、计算机科学、控制理论、传感器技术、机械工程、仿生学、人工智能、社会学等多门学科。本文以机器人为对象,探讨了基于神经网络的机器人控制问题。研究了神经网络和传统PID反馈控制相结合构成的一种混合型机器人逆模学习控制,并结合机器人动力学方程特点,采用启发式学习算法,对机器人进行轨迹跟踪,能够满足机器人快速、精确、实时的控制要求。【关键词】 机器人 神经网络 逆模学习控制1 引言机器人学是一门高度交叉的前沿学科,涉及到电子学、计算机科学、控制理论、传感器技术、机械工程、仿生学、人工智能、社会学等多门学科1。现在机器人已经进入了智能化时代,它们能够感知外界环境与对象,并具有对复杂信息进行准确处理,对自己行为做出自主决策能力。它们有触觉、视觉、力觉、听觉、味觉等多种感觉;能实现搜索、跟踪、辨色、识图等多种仿生动作;具有专家知识、语音功能和自学习能力等人工智能。智能机器人将极大地扩展机器人的应用领域,是当前研究的重点。智能机器人本身能够认识工作环境、工作对象及其工作状态。它根据人给予的指令和自身认识外界的结果,独立地决定工作方式,由操作机构和移动机构实现任务目标,并能适应工作环境的变化。目前,还没有高水平的智能机器人,具有个别功能的低智能机器人也只是在核工业、水下、爬壁等特殊的环境下有应用。由于高智能机器人开发的技术要求高,难度大,并受到计算机、控制理论、人工智能等相关技术和学科发展的制约,所以至今尚处于实验室研究阶段,有待于某些关键技术的突破。2 神经网络智能控制系统2.1 机器人控制技术机器人的控制问题可以看作是路径轨迹跟踪问题,控制系统由轨迹规划器、控制器、操作机和传感器组成,其中轨迹规划器主要对任务和路径进行规划与管理;控制器接收轨迹规划器发出的指令,控制操作机动作;操作机是执行机构,完成控制器发出的指令;传感器是检测元件,检测外部环境的信息并把信息反馈回控制器。机器人控制器具有多种结构形式,包括非伺服控制、伺服控制、位置和速度反馈控制、力(力矩)控制、基于传感器的控制、非线性控制、分解加速度控制、滑模控制、最优控制、自适应控制、递阶控制以及各种智能控制等2。机器人的控制主要分为三个方面:伺服控制、动作控制及操作控制2。所谓伺服控制也即是机器人的机械手等部分,按照所希望的数值来调整其运动的位置、移动的速度、移动的力量等。这里研究的问题与一般所指的自动控制问题相似。所谓动作控制是指当机械手等按照希望的轨迹运动时,如何决定每个关节的位置与速度的值。例如,在要求的两点之间使机械手运动时,需产生连接两点的光滑的运动轨迹等。所谓操作控制是指为了使机械手等进行某一操作,要使机械手按照一定的顺序来做动作。例如实现使机械手移动到A点,抓住零件,再移动到B点,把零件放下这一系列的动作。这个操作控制在目前的工业机器人上多用示教再现式,而从长远角度来看,人们正在开发机器人语言,用机器人语言来实现操作控制。2.2神经网络智能控制系统简介基于神经元网络的智能控制系统也称作基于连接机制的智能控制系统。随着人工神经元网络(ANN)研究的进展,神经网络越来越多地应用于控制领域的各个方面。从过程控制、机器人控制、生产制造、模式识别直到决策支持都有许多应用神经元网络的例子,而且获得了相当好的效果。由于ANN的固有优点,它在系统的辨识、建模、自适应控制中特别受到重视,尤其是它较好地解决了具有不确定性、严重非线性、时变和滞后的复杂系统的建模和控制问题。工业机器人是一个复杂的非线性、强耦合、多变量的动态系统,运行时常具有不确定性,如参数的摄动和负载的扰动,而用现有的机器人动力学模型的先验知识常常难以建立其精确的数学模型。即使能建立某种模型,也很复杂,计算量大,不能满足机器人实时控制的要求。人工神经网络的出现为解决机器人控制中存在的一些问题提供了新的途径。由于神经网络具有大规模并行处理、分布式信息记忆、自学习、自适应及联想功能等优点,因此可用来解决机器人控制等复杂问题。2.3 神经网络直接逆模型控制顾名思义,神经网络直接逆模控制采用受控系统的一个逆模型,它与受控系统串接以便使系统在期望响应(网络输入)与受控系统输出间得到一个相同的映射。因此,该网络可直接作为前馈控制器,而且受控系统的输出等于期望输出。此方法已用于机器人跟踪控制3,可达到高的精度。不过,这种方法很大程度上依赖于作为控制器的逆模型的精确程度。由于不存在反馈,故鲁棒性不足。因此,可通过在线学习调整逆模型参数,以期提高受控系统的鲁棒性。3 机器人神经网络逆模学习控制工业机器人控制对象是一个多关节机械手,它的数学模型相当复杂,是一个与运动学和动力学密切相关的、强耦合、非线性的多变量系统。同时,在运动过程中,机器人的负载可能变化很大,因而,它又是一个时变的系统。传统的机器人控制是在求得机器人的数学模型之后采用经典或现代控制方法进行控制,很多方法实现了机器人的快速、精确控制。但有时候机器人的数学模型并不精确已知,因此,在这种情况下,近年来人工神经网络的重新出现,为解决机器人控制中存在的一些问题提供了新的途径。逆系统方法是通过动态系统的“逆”的概念来研究一般非线性控制系统反馈线性化设计的一种方法。常规的逆系统方法要求已知受控对象的精确数学模型,这对于大多数工业过程难以做到,即使建立了非线性动力学模型,一般也难以求得逆模型的解析形式。为了克服逆系统方法在工程应用中的困难,可利用受控对象的输入输出数据建立对象的逆模型。运用神经网络等模型来建立受控对象的逆模型及其逆模控制已受到过程控制界的关注3 4。但是,基于输入输出数据辨识的逆模型存在未建模动、静态以及直接逆模控制的鲁捧性不足等问题。因此,采用一种神经网络和传统反馈PID控制相结合而构成的混合型的机器人逆模学习控制,给出了神经网络机器人控制的稳定性分析。3.1 神经网络逆模学习控制方法一个自由度的机械手微分形式的动力学方程可以表示为: (3.1)其中,为维对称正定惯性矩阵;为维哥氏力和向心力矩矢量;为维重力矢量;为维摩擦力矩变量;,分别为维的机械手关节位置、速度、加速度矢量。为了简化,这里认为每一个关节只由一个驱动器单独驱动,是维的关节力矩矢量。设基于模型的控制法则为: (3.2) (3.3)其中,分别是维关节位置和速度误差矢量;,分别表示机械手动力学模型,的估计;,分别是维的预期关节位置、速度和加速度矢量;,分别是维的位置增益和速度增益矩阵,通常选为定常对角矩阵。系统的闭环方程为: (3.4)当,时,可得误差方程: (3.5)其中,。当和为对角阵时,系统就被线性化并且被完全解耦,这样使用分割控制规律就把一个复杂的非线性多变量系统的设计问题转化为个独立的二阶线性系统的设计问题。然而,实际上机械手动力学系统的模型复杂,参数时变,难以精确知道时,存在着不确定性,解耦和线性化将难以精确实现。如果存在,那么由闭环方程式(3.4)得到的误差方程为: (3.6)其中,表示实际参数与模型参数之间的偏差造成的误差。为解决这个问题,可以训练一个人工神经网络,让它取代机械手的逆动力学模型,从而实现上述基于模型的非线性控制。基于神经网络模型的机器人逆模控制系统如图3-1所示,图中由反馈控制器和神经网络逆模学习器NNC组成。是常规PID反馈控制器用以保证神经网络在线学习期间使控制系统全局渐近稳定,同时起参考模型作用和提供NNC网络学习的误差信号。这样,网络的学习和控制可同时进行,不需要提供教师信号,也不需要规定网络学习何时开始,何时结束,而在整个学习控制过程中反馈转矩逐渐趋于零,网络权值趋于稳定。图3-1 神经网络逆模学习控制系统设机器人的动力学方程表示为: (3.7)PID反馈控制器: (3.8)NNC神经网络模型: (3.9)而 (3.10)由(3.10)式,可定义和之间的误差为 (3.11)其中,为外扰力矩。为使系统的力矩差最小,我们可通过NNC网络的学习(训练网络权值)达到。故定义网络NNC的学习误差信号为: (3.12)3.2 神经网络启发式学习算法在各类神经网络模型中,应用最广泛的一类是前馈神经网络,训练前馈网络最常用的学习方法是BP算法。然而,在实际应用中发现BP算法尚存在着不足之处,主要是算法收敛速度很慢,容易收敛于局部极小点,数值稳定性差,参数(学习率、初始权值)难以调整,不便应用。为了克服上述缺陷,下面采用一种启发式学习算法5。不失一般性,设前馈神经网络有M层,由输入层、一个或多个隐层和输出层组成,每层的前向输入输出关系为: (3.13) , (3.14) (3.15)其中k表示网络层数;表示第k层的第j个节点的总输入;表示第k-1层的第i个节点的输出;表示第(k-1)层的第i个节点到第k层的第j个节点的连接权值;对表示第k层的第j个节点的阈值;为神经网络的最终输出。在一般BP学习算法中,网络连接权值的迭代公式为 (3.16)其中网络输出层的误差为: (3.17)网络隐层的误差为: (3.18) (3.19) (3.20)其中,是反传误差,为学习率,为迭代次数,为期望输出值,这里有。由于(3.16)式是采用梯度最速下降法推导出来的,因此,当权值远离极值点时,其收敛速度是比较快的,但在接近极值点附近时,其收敛速度明显减慢。此时若加快收敛速度而增大学习率,则会引起网络振荡,而不收敛到极值点。为此,下面采用一种有效的变步长的Kalman滤波算法与(3.16)式的BP算法结合起来,即先用BP算法学习,接近极小点时,加入启发式知识,再用变步长的学习算法调整神经网络权值。变步长Kalman学习算法的推导过程如下:考虑如下非线性离散系统 (3.21) (3.22)式中w(t)是状态向量,是系统噪声,y(t)是观测向量,是观察噪声,假设,是相互独立的零均值高斯白噪声,且有 变步长Kalman滤波的基本思想是将非线性函数分别围绕滤波值和预测值展开成Taylor级数,略去二次以上项后,得到非线性系统的线性化模型,然后应用Kalman滤波的基本方程可得变步长的非线性Kalman滤波公式具体如下:Taylor展开取近似表达式 (3.23) (3.24)式中,。将近似表达式(3.23)整理,简化后代入Kalman滤波公式得网络输出层权值的修正式: (3.25) (3.26) (3.27) (3.28)其中,初始状态,。同样得网络隐层(K=M-1,2)的权值修正公式: (3.29) (3.30) (3.31)其中, (3.32) (3.33) (3.34) (3.35)初始状态 (3.36)上述启发式学习算法可归纳如下:(1)给定权值W向量的初始值,阈值,初值,S=1.0。及误差设定值,给定反馈控制增益,值,置t=0。(2)用(3.8)式计算,用(3.9)式计算,用(3.12)式计算,当时,转(4)步;否则转(3)步;(3)用(3.16)公式迭代,取得,计算控制量,转(2)步;(4)若,即为所求,结束学习,否则转(5)步;(5)用式(3.25)-(3.36)迭代计算出,计算出,及其算出误差,转(4)步。4 总结本文研究了一种把神经网络和传统PID反馈控制相结合构成一种混合型的机器人逆模学习控制方法,结合机器人动力学方程特点,采用了启发式学习算法,以适合机器人快速实时控制的特点。这种控制方法主要是利用神经网络丰富的学习与自适应能力、联想与概括能力,通过在线边学习边控制,逐渐建立比较精确的机器人系统的逆动力学模型,最终输出实际所需的控制力矩。本文研究的启发式混合学习算法能够满足机器人快速、精确、实时的控制要求。参考文献1 蔡自兴.机器人学.第一版.北京.清华大学出版社.20002 诸静.机器人与控制技术.浙江大学出版社.19913 Behere L. GoPal M and Chandhury S, Inversion of RBF networks and applications to Adaptive control of nonlinear systems J

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论