机器人神经网络控制.doc_第1页
机器人神经网络控制.doc_第2页
机器人神经网络控制.doc_第3页
机器人神经网络控制.doc_第4页
机器人神经网络控制.doc_第5页
免费预览已结束,剩余9页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

自适应神经网络控制课程论文第一部分 机器人手臂的自适应神经网络控制机器人是一具有高度非线性和不确定性的复杂系统,近年来各研究单位对机器人智能控制的研究非常热门,并已取得相当丰富的成果。机器人轨迹跟踪控制系统的主要目的是通过给定各关节的驱动力矩,使得机器人的位置、速度等状态变量跟踪给定的理想轨迹。与一般的机械系统一样,当机器人的结构及其机械参数确定后,其动态特性将由动力学方程即数学模型来描述。因此,可采用经典控制理论的设计方法基于数学模型的方法设计机器人控制器。但是在实际工程中,由于机器人模型的不确定性,使得研究工作者很难得到机器人精确的数学模型。采用自适应神经网络,可实现对机器人动力学方程中未知部分的精确逼近,从而实现无需建模的控制。下面将讨论如何利用自适应神经网络和李雅普诺夫(Lyapunov)方法设计机器人手臂跟踪控制的问题。1、控制对象描述:选二关节机器人力臂系统(图1),其动力学模型为:图1 二关节机器人力臂系统物理模型 (1)其中,。其中,q为关节转动角度向量,为2乘2维正定惯性矩阵,为2乘2维向心哥氏力矩,为2维惯性矩阵,为2维摩擦力矩阵,为未知有界的外加干扰,为各个关节运动的转矩向量,即控制输入。已知机器人动力学系统具有如下动力学特性:特性1:惯量矩阵是对称正定阵且有界;特性2:矩阵有界;特性3:是一个斜对称矩阵,即对任意向量,有 (2)特性4:未知外加干扰满足,为正常数。我们取,两个关节的位置指令分别为,即设计控制器驱动两关节电机使对应的手臂段角度分别跟踪这两个位置指令。2、传统控制器的设计及分析:定义跟踪误差为: (3)定义误差函数为: (4)其中。则 (5)其中,为包含机器人模型信息的非线性函数。表示为 (6)在实际工程中,和往往很难得到精确的结果,导致模型不确定项为未知。为了设计控制器,需要对不确定项进行逼近,假设为的逼近值。设计控制律为 (7)将控制律式(7)代入式(5),得 (8)其中为针对的逼近误差,。如果定义Lyapunov函数 (9)则这说明在固定条件下,控制系统的稳定依赖于,即对的逼近精度及干扰的大小。3、基于RBF神经网络逼近的机器人手臂控制 1)基于RBF网络的逼近算法已经证明,采用RBF网络可以实现对任意连续函数的精确逼近。因此,可以采用RBF网络实现对不确定项的逼近。在RBF网络结构中,取为网络的输入向量。设RBF网络的径向基向量,其中hj为高斯基函数:. (10)其中网络第个结点的中心矢量为,。假设存在权值,逼近函数的理想RBF网络输出为: (11)其中网络的权向量,为逼近误差,。考虑式(6),针对中包含的信息,逼近函数的RBF网络输入取: (12) 2)基于RBF网络的控制器和自适应律设计 定义RBF神经网络的实际输出为: (13) 取 (14) 控制律和自适应律设计为: (15) (16)其中为对称正定阵,。 将式(11)、式(13)和式(15)代入式(5),得 (17)其中,为用于克服神经网络逼近误差和干扰的鲁棒项。将鲁棒项设计为: (18)其中为符号函数。 (19) 3). 稳定性及收敛性分析针对个关节的神经网络控制,定义Lyapunov函数为: (20)其中为矩阵的迹,其定义为:设是阶方阵,则称的主对角元素的和为的迹,记作。则将式(17)代入上式,得 (21)将式(2)和式(16)代入上式,得下面分两种情况进行讨论。(1)不考虑鲁棒项,取,则如果要使,则需要满足: (22)如果满足,由于,且有界,则由表达式可知,、和都有界。由有界可知,跟踪误差及其导数都有界,从而和有界,且跟踪误差及其导数的收敛值随神经网络逼近误差上界和干扰上界的增大而增大,并可通过增大的值达到任意小。(2)考虑鲁棒项,取式(18),则由于,且有界,则、和为有界。由于,又由于式(17)的右边信号都有界,则有界,有界,则根据Barbalat引理,趋近于零,即趋近于零,从而可得出和趋近于零。4、 SIMULINK仿真验证仿真图如下:由于系统比较复杂,直接采用模块搭建比较麻烦,所以本设计中采用S_function动态函数来实现前面推导的算法公式,实现了三个动态函数:input.m产生输入、ctrl.m为控制器实现、plant.m表示控制对象:其中控制器实现函数ctrl.m中RBF神经网络的中心矢量及近似标准差分别设置为: 这两个值的取值对神经网络控制的作用很重要,如果参数取值不合适,将使高斯基函数无法得到有效的映射,从而导致RBF网络无效。网络输入取,初始状态设置为零,控制参数取,。高斯基函数的m语言实现如下: 逼近效果如下图,由图可以看出开始阶段拟合误差较大,但随着时间的增大,RBF网络能够较好地拟合原函数,即使原函数很复杂,通过调整参数,逼近效果会更好。 对两个关节的位置指令分别为,跟踪效果如下图所示,开始时有一定的误差,但稳定后能无静差跟踪,效果很好。第二部分 对自适应神经网络的理解与体会 本门课程是继线性系统后的一门比较理论的关于控制理论的课程,与线性系统不同的是自适应神经网络控制研究的对象更多的是非线性、参数未知、模型未知的复杂系统,经典的控制方法在面对这样的系统时显得非常乏力,于是,自适应控制、学习控制、智能控制如神经网络遗传算法等就大有用武之地了。 通过本门课程的学习我学到了backstepping方法,神经网络控制方法,通过严格的公式推导出神经网络的控制思想还是挺有趣味与吸引力的,循序渐进的过程让我懂得了虚拟控制、匹配条件、延迟参数设计等概念,不管以后自己是否走理论研究这条道路,我感觉在这么短的时间内学到的这些知识还是很有价值的。下面对我学到的一些知识进行简要的总结:自适应控制的研究对象是具有不确定性的系统,这里所指的“不确定性”是指被控对象及其环境的数学模型不是完全确定的。对于具有较强不确定性的被控系统,如何设计一个满意的控制器,就是自适应控制所要研究的问题。参照在日常主活中生物能够通过自觉调整自身参数改变自己的习性,以适应新的环境特性,从而提出了自适应控制器的设想。自适应控制器应能够及时修正自己的特性以适应对象和扰动的动态特性变化,使整个控制系统始终获得满意的性能。因此,自适应控制方法就是依靠不断采集的控制过程信息,确定被控对象的当前实际工作状态,根据一定的性能准则,产生合适的自适应控制规律,从而实时地调整控制器结构或参数,使系统始终自动地工作在最优或次最优的运行状态下。自适应控制是现代控制的重要组成都分,它同一般反馈控制相比具有如下特点:(1) 一般反馈控制主要适用于确定性对象或可以预知的对象,而自适应控制主要研究具有不确定性的对象或难以确知的对象。(2) 一般反馈控制具有较强的抗干扰能力,能够消除状态扰动所引起的系统误差;而自适应控制由于具有辨识对象和在线修改参数的能力,因而不仅能消除状态扰动引起的系统误差,而且还能消除系统结构扰动引起的系统误差。(3) 一般反馈控制系统的设计必须依赖系统特性的数学模型及其环境变化状况,而自适应控制系统设计则对数学模型的依赖很小,仅需要较少的验前知识,但自适应控制的实现往往更多地依靠计算机技术。(4) 自适应控制是较为复杂的反馈控制,它在一般反馈控制的基础上增加了自适应控制环节或系统参数辨识器,另外还附加了一个可调系统。 Backstepping设计方法是针对不确定性系统的一种系统化的控制器综合方法,是将Lyapunov 函数的选取与控制器的设计相结合的一种回归设计方法。在处理线性和某些非线性系统时, 该方法在改善过渡过程品质方面展现出较大的潜力,应用在机器人控制、电机控制、液压控制、船舶控制等许多控制领域。 Backstepping 的具体的基本设计思想是将复杂的非线性系统分解成不超过系统阶数的子系统,然后单独设计每个子系统的部分 Lyapunov 函数,在保证子系统具有一定收敛性的基础上获得子系统的虚拟控制律,在下一个子系统的设计中,将上一个子系统的虚拟控制律作为这个子系统的跟踪目标。相似于上个子系统的设计,获得该子系统的虚拟控制律;以此类推,最终获得整个闭环系统的实际控制律,且结合 Lyapunov 稳定性分析方法来保证闭环系统的收敛性。Backstepping可用来设计控制方案以满足三角结构单输入单输出非线性系统的匹配条件。Backstepping 设计方法之所以受到国内外学者的极大关注,主要原因为该方法取消了系统不确定性满足匹配条件的约束,从而解决了相对复杂的非线性系统的控制问题。在现实世界中,存在大量非线性系统具有(或者可以经过微分同胚变换成)严格反馈等规范型;该方法为复杂非线系统的 Lyapunov 函数设计提供了较为简单的结构化、系统化方法,解决了一直以来具有严格反馈等结构的非线性系统稳定性分析和控制器设计的难题。自适应 backstepping 设计方法发展的初级阶段,要求系统不确定性能够线性参数化。随着神经网络与模糊系统等智能控制技术的不断发展,很好地取消了自适应 backstepping 设计所需的该约束条件,从而使得 backstepping技术获得了很大的发展空间。特别是神经网络和自适应技术的引入,极大地推广了backstepping 方法的应用。人工神经网络利用物理器件来模拟生物神经网络的某些结构和功能。下图是最典型的人工神经元模型,它是大多数神经网络模型的基础。 -代表神经元i与神经元j之间的连接强度(模拟生物神经元之间突触连接强度),称之为连接权; -代表神经元i的活跃值,即神经元状态; -代表神经元j的输出,即是神经元i的一个输入; -代表神经元的阐值。 函数f表达了神经元的输入输出特性。在M-P模型中,f定义为阶跳函数:人工神经网络是一个并行与分布式的信息处理网络结构,该网络结构一般由许多个神经元组成,每个神经元由一个单一的输出,它可以连接到许多其他的神经元,其输出有多个连接通路,每个连接通路对应一个连接权系数。严格来说,神经网络是一个具有如下性质的有向图。(1) 对于每个结点有一个状态变量;(2) 结点i到结点j有一个连接权系数;(3) 对于每个结点有一个阈值;(4) 对于每个结点定义一个变换函数,最常见的情形为。下图表示了一个典型的前馈神经网络结构。 神经网络的应用已经涉及到各个领域,且取得了很大的进展。 机器人控制:对机器人轨道控制,操作机器人眼手系统,用于机械手的故障诊断及排除,智能自适应移动机器人的导航,视觉系统。 自动控制领域:主要有系统建模和辨识,参数整定,极点配置,内模控制,优化设计,预测控制,最优控制,滤波与预测容错控制等。 处理组合优化问题:成功解决了旅行商问题,另外还有最大匹配问题,装箱问题和作业调度问题。 模式识别:手写字符,汽车牌照,指纹和声音识别,还可用于目标的自动识别,目标跟踪,机器人传感器图像识别及地震信号的鉴别。 第三部分 对研究的认识和感想 麻省理工大学人工智能实验室关于做研究的看法告诉我们如何做研究,为我们提供的对做研究本身(阅读、写作和程序设计)、理解研究过程以及开始热爱研究(方法论、选题、选导师和情感因素)建议都很有参考意义的。想想自己的学习研究方法,颇感差距与惋惜。我将自己的研究方向定位为应用型研究,认为阅读参考文献、写作不那么重要,但真的是这样的吗!现在不培养好的研究习惯甚至连研究总结都不重视的话,这条路能走多远?阅读书籍进行的是基础性的、系统性的学习,这是本科生该干的,对于研究生,除非为了拓宽知识面,决不应该停留在书本上,我们应该走出去,密切关注领域动态、领略大牛风采,多看近期发表的期刊论文,开拓思维以便灵感的喷发,否则,作为研究生就落伍了,说明只停留在本科水平,需奋起直追! 选择自己的问题取向,不忘创新。作为一个研究生要认清自己不再是个容器,等着老师把某些东西倒在茶杯里,而是要开始逐步发展和开发自己。要重视问题取向的安排,所有的精力、所有修课以及读的书里面都应该要有一个关注的焦点,而不能像大学那般漫无目标。 循序渐进地练习论文写作。如何才能有条不紊、条理清楚,并把整体架构组织得通畅可读?首先,必须要循序渐进的训练,先从少的慢慢写成的,而且要在很短的时间内训练到可以从一万字写到十万字。这么大规模的论文谁都写得出来,问题是写得好不好,因为这么大规模的写作,有这么许多的脚注,还要注意首尾相映,使论述一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论