已阅读5页,还剩52页未读, 继续免费阅读
(电路与系统专业论文)未知环境下机器人路径规划算法研究[电路与系统专业优秀论文].pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 路径规划是移动机器人导航系统中最重要的任务之一,灵活有效的路径规划 算法能够帮助机器人适应各种复杂的环境,比如动态环境或未知环境等,大大提 高机器人的应用领域,使得机器人能自动识别环境,判断路径,继而完成指定地 点规定的工作任务。 本文在总结了已有的路径规划方法的基础上,进行了如下的几项工作: 采用了一种新颖的算法神经网络算法实现所要求的未知环境的路径规 划任务,在具体进行实旋之前,介绍了神经网络算法,并分析了不同神经网络针 对不同系统的辨识过程,并一一举例验证。 接下来详细地就新的神经网络路径规划算法“距离定位法”进行深入探 讨,通过算法模型的介绍,禁忌思想的引入,稳定性分析等方面详细阐述,并且 用动态和静态地图,简单和复杂环境等全方面的仿真验证了新算法的效率和收敛 性。本文同时还提出了采用神经网络算法将路径规划和地图建模相结合的可行 性。 最后,本文又对机器人路径规划中比较常用的人工势场法做了研究,根据以 往人工势场法中的缺陷,提出了自适应的动态人工势场法,通过让机器人自适应 的根据地图环境来改变步长的算法来提高机器人行进的速度,进步来实现机器 人在未知地图情况下的路径规划的效率的提高。数值仿真的结果也证明了算法的 有效性。 关键字:移动机器人、路径规划、神经网络、禁忌算法、人工势场 中图分类号:t p 2 4 2 6 第3 页共5 8 页 a b s t r a c t a b s t r a c t r o b o tp a t hp l a n n i n gi sav e r yi m p o r t a n tt a s ki nr o b o tn a v i g a t i o ns y s t e m ak i n do f f l e x i b l ep a t hp l a n n i n ga l g o r i t h mi sh e l p f u lf o rt h er o b o ti nv a r i o u sc o m p l i c a t e d e n v i r o n m e n t s ,l i k ed y n a m i co ru n k n o w ne n v i r o n m e n t s ,a n di m p r o v et h ea p p l i c a t i o n g r e a t l yw i t hn od o u b t ,s ot h a tr o b o t sc a l la u t o m a t i c a l l yi d e n t i f yt h ee n v i r o n m e n t , j n d g et h en e wp a t h ,a n dt h e nc o m p l e t et h ea s s i g n e dt a s ki nt h es p e c i f i cp o s i t i o n t h ef o l l o w i n gi st h ea u t h o r sw o r kb a s e do nt h ee x i s t i n ga l g o r i t h mo fr o b o tp a t h p l a n n i n g : f i r s t l y , an o v e lp a t hp l a n n i n ga l g o r i t h m ,n e u r a ln e t w o r k s ,i si n t r o d u c e dt os o l v et h e t r a d i t i o n a lp r o b l e mo fu n k n o w ne n v i r o n m e n t sp a t hp l a n n i n g b e f o r et h es p e c i f i c a n a l y s i s ,t h eg e n e r a ln e u r a ln e t w o r k si d e aw a si n t r o d u c e d ,a n dt h ea p p l i c a t i o no f d i f f e r e n tk i n d so fn e u r a ln e t w o r k si nd i f f e r e n ts y s t e mi d e n t i f i c a t i o nl i k ed y n a m i co r n o n l i n e a rs y s t e mw a sa n a l y z e di nd e t a i l s e c o n d l nt h es p e c i f i c n e wn e u r a ln e t w o r k sa l g o r i t h mi nr o b o tp a t hp l a n n i n g , “d i s t a n c e - o r i e n t e da l g o r i t h m i sd i s c u s s e db a s e do nt h em o d e li n t r o d u c t i o n ,t a b o o a l g o r i t h m ,s i m u l a t i o ni ns i m p l ea n dc o m p l i c a t e d ,d y n a m i ca n ds t a t i ce n v i r o n m e n t , a n dl y a p u n o vs t a b i l i z a t i o na n a l y s i s i na d d i t i o n ,t h ef e a s i b i l i t yo ft h ec o m b i n a t i o n w i t hp a t h p l a n n i n ga n dm a p - b u i l d i n gi sa l s od i s c u s s e d a tl a s t ,t h i sp a p e ra l s od i s c u s s e st h er e s e a r c ho nt h ec o m m o na l g o r i t h mo fr o b o tp a t h p l a n n i n g ,a p fa l g o r i t h m ,w i t hb r 证西n gf o r w a r dt h en e wa d a p t i v ep a c es t e p sb a s e do n d i f f e r e n te n v i r o n m e n t sb a s e do nt h ee x i s t i n gs h o r t a g eo fg e n e r a la p et h es i m u l a t i o n a l s oc a np r o v et h ee f f i c i e n c yt h en e wc h a n g i n gi nt h ea p f k e yw o r d s :m o b i l er o b o t ,p a t hp l a n n i n g ,n e u r a ln e t w o r k s ,t a b o oa l g o r i t l m a ,a p f 第4 页共5 8 页 第一章绪论 第一章绪论 当今世界范围内机器人技术研究的热点是智能机器人,随着理论和技术上的 突破,其应用领域也不断的扩大,不仅走出实验室,走进工厂企业,医院,田野, 海洋,而且还乘上最先进的星际交通工具,飞进浩瀚的太空,和人造卫星,空问 实验室一道去探索未知的空间和未来的世界。机器人技术的出现和发展是二十世 纪的奇迹,它和数控技术一样,改变了传统的生产方式,也影响了整个人类社会 的进步。 机器人技术是在五十年代起源于美困麻省理工学院,它的发展和应用,引起 了二十世纪自动化技术最重要的变革,使制造技术从传统的刚性自动化大量生产 方式向适于中,小批量生产的柔性自动化方式转变。技术发展初期,在理论与实 验研究阶段,机器人基本上在其分枝上独立发展,经历了示教再现型机器人,离 线编程机器人,和智能机器人等阶段。 九十年代全球经济,全球市场的出现和发展又推动全球制造( g l o b a l m a n u f a c t u r i n g ) 的快速发展。这种发展趋势对机器人提出新的要求。要求它的应 用范围更广,更可靠,技术更先进,智能化程度更高,并尽可能采用科学技术的 最新成果,使机器人更多的具有人的能力和人的智慧,不仅在工作能力上比人更 有力,更适于复杂艰难的生存条件,更适于突破肢体大小,活动范围和生命极限 的限制,而且要向人类学习逐步具有人的知识和生命的特征。 1 1 移动机器人的发展现状 在上世纪七十年代以前,机器人行业还停留在手动控制的阶段,当时的机器 人也只应用在太空、核培养、水下作业等几个领域;在7 0 年代与8 0 年代之间,制 造业领域的工业机器人迅速发展,其中出现了在一定的环境下自主操作的自动机 器人:8 0 年代后大量在非工业领域应用的机器人的出现引发了机器人领域的革 命,机器人走进了智能化时代;9 0 年代至今,除了工业用机器人的日益发展以外, 机器人技术在家庭、医疗、营救、娱乐等民用领域内都有了显著突破,各国也都 加强了在机器人领域上的投入。可以说,机器人行业有着广阔的发展空间和很好 的发展前景。 随着市场全球化的发展,国内外市场竞争f f 益激烈,人们比以往更加关注制 造过程的自动化程度,更加希望不断地快速调整它们的产品以满足客户。 在工业领域内,大量不同类型不同功能的机器人已被开发并使用,如传送机 第5 页共5 8 页 第一章绪论 器人、机器人升降机、焊接机器人、探测机器人、采矿机器人等,许多大型工业 中,机器人作业早已取代了手工劳动,不但提高了效率,也减少了人力操作的危 险性。此外,在教育、国防、科研、家用等各个领域内机器人技术都己被普遍运 用。图1 1 中的p i o n e e r3 型机器人主要应用于科研及教学领域,它也是本实验室 所购买的机器人之一。它由一个轮式移动机器人、摄像头、若干传感器组成,车 身周围的传感器作为机器人的“眼睛”,来对周围环境及障碍物情况进行判断。 图1 1 :带摄像头和传感器的轮式可移动机器人 智能化与应用性的不断增加是机器人技术发展的方向,让机器人具有“思 想”,更好的为人类服务,去完成人类无法完成的工作是发展机器人领域的最根 本目的,而随着科技的发展和生活水平的提高,人们对机器人产品的需求也日益 增加。近年日本科学家发明了具有3 0 个自由度的人形机器人h r p2 p ,如图1 ,2 所 示,他可以完成一些人类的基本动作,如稳定的行走、转动、后退,根据环境情 况实时改变行走模式,可以自由的躺下和站立,可以穿过狭窄空间,可以整个身 体进行运动等等。 图1 2 :具有3 0 个自由度,可以完成人类简单动作的人形机器人h i p 一2 p 第6 页共5 8 页 第一章绪论 在一些领域内,机器人可以完成人类难以完成的工作。美国的“勇气号”探 索机器人成功的完成了在火星上的探测工作,便是一个典型的代表,它由移动机 器人平台、机器人“大脑”、精密传感器和多个精密仪器组成,自主完成导航、 避障、采集、拍摄等操作,使得科学家只需在地球上接受它发送回的数据即可对 火星的表层进行进一步的分析。 图1 3 :美国“勇气号”探索机器人 机器人技术如今逐渐由基于行为型向着智能型过渡,即从机器人按照固定程 序完成指定的简单动作逐渐转变为可以t l 主的产生决策并执行的模式,也就是通 常所说的智能行为。而在智能行为中比较基本的行为就是智能导航行为,它包括 智能导航、自主避障和路径规划等,目前许多智能机器人都具有自主导航功能, 机器人吸尘器就是利用机器人的智能导航行为为基础而形成的一项新型产品。本 篇论文所讨论的问题就是主要针对移动机器人在未知环境下的智能导航行为问 题进行的研究,在本章的下一节将介绍机器人导航与路径规划的基本理论。 1 2 移动机器人的应用领域 对于地面上的移动机器人来说,它可分为车轮式机器人,脚式机器人,躯干 式机器人等。按照机器人是否要接受外界指令来分,又可以分为自主式和非自主 式机器人。自主式机器人不需要外界提供控制指令,所有的控制决策都由自行完 成,这增加了机器人的灵活性,扩大了机器人的使用范围。 移动机器人的研究具有以下几个关键领域: ( 1 ) 导航:移动机器人研究的一个重要问题。可阱分为:基于环境信息的 地图模型匹配导航,基于各种导航信号的路标导航,视觉导航,味觉导航等。 ( 2 ) 定位:移动机器人必须具备的基本技术环节,确定机器人在地图中的 坐标。根据环境的复杂性,定位方法有多种多样,其中主要的方法有:惯性定位, 第7 页共5 8 页 第一章绪论 路标定位,声音定位,预测定位。但是在环境未知的情况下,机器人无法根据环 境来定位,路标定位失去了作用。又因为运动存在着打滑,漂移等误差,使用惯 性定位也会产生很大的误差。目前流行的方法是采用卡尔曼滤波来消除运动误差 2 7 2 8 2 9 ,估计机器人下次的坐标。 ( 3 ) 路径规划:假设机器人知道导航方向和自己的坐标,接下来就要完成 路径规划的任务。路径规划是自主式机器人导航的基本环节之。它按照某“牲 能指标搜索一条从起始状态到目标状态的最优或近似最优的无碰路径。根据环境 信息的已知或部分未知或完全未知,路径规划的难度也逐渐上升。总的来说,机 器人通过传感器对机器人的工作环境进行探测,根据传感器返回的信息,估计障 碍物的位置,形状,从而进行规划。 ( 4 ) 多传感器信息的融合:由于信息采集手段的多样性和信息的多样性,使 得对信息的融合技术成为研究人员关注的话题。由于测量中的误差因素存在,传 感器的反馈信息并不能真实反映环境的情况,误差在以后的处理过程中将被累 积,对计算结果的真实性产生巨大的影响。因此,主要利用一些信号处理理论, 对信息进行抽取,整合,过滤等处理,常用方法有加权平均法,贝叶斯估计,卡 尔曼滤波,神经网络和模糊法则等。 ( 5 ) 多机器人协作系统:随着机器人应用领域的不断拓展,机器人工作环 境复杂度加重,使得不再局限于单个机器人的研究。多机器人协作系统主要研究 在给定一一个任务后,如何组织多个机器人分解任务,相互通信,相互协作最终完 成任务。 在实际的研究过程中,以上的技术是相互结合的,衍生出许多有趣的研究方 向 3 1 3 2 。对于单个机器人,导航,定位,路径规划,多信息的融合等技术都 是必不可少的。有了多信息的融合技术才能使机器人得到尽可能准确的环境信 息,才有可能定位和路径规划。有了定位技术,机器人才能够知道自己的坐标, 才能明确路径规划的起始点坐标。 1 3 移动机器人路径规划介绍 1 3 1 移动机器人路径规划研究综述 路径规划是移动机器人的一个重要组成部分,它的任务就是在具有障碍物的 环境内按照一定的评价标准,寻找一条从起始状态( 包括位置和姿态) 到达目标状 态( 包括位置和姿态) 的无碰路径障碍物在环境中的不同分布情况当然直接影响 到规划的路径,而目标位置的确定则是由更高一级的任务分解模块提供的。 第8 页共5 8 页 第一章绪论 由于路径规划的复杂性,不同的研究者从不同的角度研究某一方面的问题, 对具体问题的提法也不完全相同。典型的路径规划问题的提法是指在有障碍物的 工作环境中,如何为机器人寻找从起点到终点的运动路径,让机器人在运动过程 中能安全,无碰撞的通过所有的障碍物。我国学者蒋新松为路径规划作了这样的 定义:路径规划是自治式移动机器人的一个重要组成部分,它的任务就是在具有 幽1 4 机器人运动规划的流程 障碍物的环境内按照一定的评价标准,寻找一条从起始状态( 包括位置和姿态) 到达目标状态( 包括位置和姿态) 的无碰路径。 一般蜕来,路经规划得到的是一条几何路径,图1 4 说明了路径规划在整个 导航过程中的作用。首先,利用路径规划算法得到一条无碰撞的几何路径。这样 的一条几何路径不能够应用于实际的移动机器人,因为它是不连续的。第二步把 几何路径转换成一条连续的,可执行的路径。第三步,根据实际中机器人的速度 约束条件把可执行的路径装换成机器人的移动轨迹。最后,结合机器人的控制方 程,得到机器人可以实现的路径。 实际的路径规划算法往往会考虑到第三步,也就是机器人本身的速度约束。 因为障碍物可能是以一定速度移动的,如果障碍物移动速度太快,即使机器人在 缓慢的前进,也会由于相对速度的增大而大大提高碰撞的机率。第四步的控制方 程也经常是被结合在路径规划算法之内的,如果路径是不可控的,那么这条路径 是没有意义的。但是对于第二步中的路径连续性问题,路径规划往往不予考虑。 在产生路径以后,由特定的方法来光滑路径 3 3 。 另外,根据对环境的了解情况,路径规划可以分为全局规划和局部规划。其 中,全局路径规划需要知道关于环境的所有消息,根据环境地图进行大粒度的路 径规划,并产生一系列关键点作为子目标点下达给局部路径规划系统。而局部路 径规划则只需要距离机器人较近的障碍物信息。机器人在行走过程中,根据传感 器的信息来不断地更新其内部的环境表示,从而确定出机器人在地图中的当前位 置及周围局部范围内的障碍物分布情况,并在此基础上,规划出一条从起点或某 子目标点的优选路径。但局部路径规划只适合于起终点相距较近的情况,可以 看作是全局路径规划在机器人实际行走过程中的一个补充。如果从静态或动态地 获耿障碍物信息角度看,全局路径规划属于静念规划,而局部路径规划则是动态 第9 页共5 8 页 第一章绪论 规划。 1 3 2 环境的表示方法 机器人活动空间的有效描述称为环境模型。机器人在规划前首先要做的就是 将环境的描述由外部的原始形式通过一系列处理转化为适合规划的内部的世器 模型,这个过程我们称为环境建模,其中主要是障碍物的表示方法。 合理的环境表示才能有利于规划中搜索量的减少,才能有利于时空开销的减 少。不同的规划方法正是基于这种不同的环境建模。 这里介绍两种常用的环境建模方法:栅格法,边缘提取法。 ( 1 ) 栅格法: 图1 5 给出了几种常用的环境表示方法,其中( a ) 是原始的工作空间。图1 5 中的( b ) 是用栅格法来表示环境的。使用大小相同的栅格划分机器人的工作空间, 并用栅格数组来表示环境。每个栅格点标以两种状态之一,或者在自由空间中, 或者在障碍物空间中。如图( b ) 中所示,黑格代表原始环境中的障碍物,自格代 表自由空间。最短路径是通过搜索这张栅格图得到的。为了提高搜索的效率,栅 格通常按粒度分成若干层次。 这种方法的特点是简单、易于模拟实现,从而为路径规划器的实现带来了很 多方便,具有表示不规则障碍物的能力,适合于大规模并行处理机的实现。其缺 点是表示效率不高,存在着时空开销与求解精度之间的矛盾,并且在实际未知环 境的机器人路径规划操作中比较难实现。 幽1 5 ( a ) :原始的环境空间图1 5 ( b ) :采用栅格法表示的环境空问 ( 2 ) 边缘提取法: 另外一种较为常见也在实际情况中比较实用的方法是边缘提取法。通过机器 人自身携带的传感器,探测周围障碍物的边缘,并通过计算多个传感器所探测到 的障碍物边缘的夹角,提取出模拟的障碍物边缘形状,以便机器人壁障。 如下图1 5 中( c ) 所示的情况,其中,黑色部分为原始环境中的障碍物,绿 色线条部分机器人探测后通过计算形成的障碍物边界。 第1 0 页共5 8 页 第一章绪论 这个方法可以实现动态或未知环境的障碍物检测,具有较高的使用性,但是 缺点在于,此方法对机器人自身所携带传感器的精度要求较高,并且,在对于圆 形或者任意形状的障碍物的边缘提取较为困难。 图1 ,5 ( c ) :采用边缘提取法表示的环境空间 1 。3 3 路径规划方法 为了解决路径规划的问题,人们已探索出很多有效的求解方法。这些方法大 都是由几何法、单元分解法、人工势场法和数学分析法等基本方法引申出来的。 路径规划领域的很多问题都可以用这4 种基本方法来解决。他们也不是互相排斥 的,而常常结合起来共同的实现路径规划。下面简单的介绍一下这几种方法。 n ) 人工势场法 这种方法的思想类似于电子在正负电荷产生的电场中运动。将目标看作吸引 点,障碍物看成排斥点,机器人沿吸引点和排斥点产生的合力方向运动。 文 2 1 对此方法进行了综述,它构造一个叫做势函数的标量函数,使得机器 人的目标位姿对应于其最小值,障碍物区域对应于一些较大的值,在任何其它的 位置,势函数都是向机器人目标位姿单调递减的。这样,不论机器人处于自由空 问的任何位置,只要有路径存在,它都能通过势能值的负梯度方向找到目标位姿。 对应于障碍物的区域有较大值可以保证生成路径的无碰性。 该方法的优点是可以使机器人迅速躲开突发障碍物,实时性好。但是经常会 因为局部极点而使机器人可能运动到一个死区,发生震荡现象,从而导致规划失 败,如图1 6 所示。另外一个困难是很难找到一种适合于凹形障碍物的势函数。 这些不利因素限制了人工势场法在全局路径规划中的应用。 但由于其计算简单而经常被用于局部路径规划器的设计,适用于避碰和动态 规划。 我们对于人工势场法的避障算法的研究,会在后面做详细的阐述。 第1 1 页共5 8 页 第一章绪论 图1 6 :人工势场法中的振荡现象 ( 2 ) 随机法 以机器人的最初坐标点为起始点,按一定的随机规则往各个方向生成一棵随 机树,直至起始点和目标点都成为这棵树的其中两个节点为止。然后在树中搜索 这两点之间的一条最短路径。这就是随机法。 ( 3 ) 遗传算法 遗传算法模拟生物的进化过程,是一种全局优化算法。 遗传算法求解路径规划问题的基本思想是:将路径个体表示为路径中的一系 列中途点,并转换为二迸制串。首先初始化路径群体,然后进行遗传操作,如选 择、交叉、复制、变异。经过若干次代的进化以后,停止进化,输出当前最优个 体,其标准过程算法如下面框图所示。 1 ,开始: 2 随即初始化群体p ( 0 ) ; 3 计算群体p ( o ) 中的个体的适应度; 4 t := 0 5 w h i l e ( 不满足终止条件) d o 由p ( t ) 通过遗传操作形成新的种群p ( t + 1 ) 计算p ( t + 1 ) 中个体的适应度: t := t + 1 : ) 6 输出当前最优个体p ( t ) 图1 7 :遗传算法伪代码流程 图中,选择,交叉,变异是遗传操作中的三个主要步骤,通过不断的迭代, 筛选,得到越来越优的个体。遗传算法得到的解往往是高质量的,但是如果缺乏 合适的适应度函数和参数,迭代次数巨大。而且,遗传算法需要有起始的源路径 作为第一次迭代的父样本,这需要其他的舰划方法产生。所以遗传算法大多应用 第1 2 页共5 8 页 第一章绪论 于需要最优解的情况。 f 4 1 神经网络算法: 神经网络是模拟大脑控制所形成的类生物算法,神经网络在不确定性、非线 性、时变等复杂系统的建模和控制问题上有较好的解决效果。 针对机器人路径规划问题,可以采用动态回归神经网络实现。 本论文在后面章节将详细阐述神经网络用于机器人路径规划问题中的建模、 算法、仿真等问题。 r 5 1 栅格法: 在前面的环境建模中已经提到,栅格法把整个地图空间划分为许多小栅格, 按照栅格是否包含障碍物把栅格分为障碍单元和自由单元两类,那么自由单元的 集合就是自由空间。在分解栅格的同时,计算单元之间的邻接关系。然后把起点 单元和终点单元之间的连续的单元格连接起来,就得到了一条无碰路径。栅格法 简单易懂,但是计算量大,如果栅格太大,就会浪费很多自由空间,如果栅格太 小,栅格数量剧增,计算量也随指数级增加。 考虑到自由空间在整个空间中占绝大多数,如果可以把多个自由栅格合并成 个大的栅格,将会大大降低计算量,因此,单元树法应运而生。以四叉树为例, 首先把整个地图分成四个大小相等的栅格,考察每个栅格,如果是自由栅格或者 障碍栅格,就停止该节点的生长。如果该栅格既有障碍物,又有自由空间,就再 分成四个小栅格,以此类推。这类方法在一定程度上减轻了计算量,并且简单易 实现,因此成为许多混合型算法的必备算法。 本文对于栅格法和单元树法将不做进一步探讨。 1 4 论文的主要工作和创新点: 路径规划问题根据环境是否已知可分为未知环境的路径规划和已知环境的 路径规划;根据环境中的运动情况又可分为:静态路径规划和动态路径规划。这 其中就动态未知环境下的路径规划最为复杂。 本文总结了本人三年来在神经网络和路径规划方面研究工作和贡献,解决包 括快速收敛和稳定安全等互相矛盾的性能等,具体有以下几个方面: f 1 )对神经网络的应用进行研究分析,并将不同的神经网络应用与线性、 非线性,动态、非动态系统的辨识中。 ( 2 )根据以往神经网络用于路径规划算法的缺陷,提出全新的算法“距离 定位法”,将机器人能探知的局部信息和目标点信息作为神经网络的 第1 3 页共5 8 页 第一章绪论 ( 3 ) ( 4 ) ( 5 ) 输入并完全自动引导机器人的避障和运动,而不仅仅采用惩罚函数来 进行全局计算。 在神经网络算法中独特的加入了禁忌搜索算法的思想,并且通过禁忌 点的级别分类,进一步解决的导航时的效率问题和窄小道路时碰到的 问题。 将神经网络应用于动态未知地图情况下的路径规划问题,并成功的进 行仿真模拟。 进一步研究人工势场法,并针对传统的人工势场法提出了连续变步长 的自适应算法。 1 5 论文的组织结构: 本文在接下来的部分是这样安排的:第二章,将详细介绍神经网络的算法, 并包括一些实际的系统辨识方面的应用,并且分不同的神经网络和不同的辨识系 统进行分析;第三章将详细介绍采用神经网络进行的路径规划,包括算法原理, 禁忌搜索思想,环境建模,动态静态环境仿真,和地图建模分析等:第四章就模 型参考自适应的人工势场法进行探讨。第五章就未来神经网络和其他算法应用于 路径规划上提出一些总结和展望。最后是研究生期间所发表的论文列表和致谢。 第1 4 页共5 8 页 第二章神经网络运动控制基础 第二章神经网络运动控制基础 近年来,神经网络己从家用电器到工业对象的广泛领域找到了它的用武之 地。 众多的神经元广泛地连接就构成了神经网络,神经元网络作为一种新技术之 所以引起人们很多的兴趣,并越来越多地用于控制领域,是因为与传统的控制技 术相比,神经网络系统具有以下基本特性: ( 1 ) 并行分布处理神经网络具有高度的并行结构和并行实现能力,因而具有 较好的耐故障能力和较快的总体处理能力,这特别适合于实时系统的动态控制; ( 2 ) 非线性映射神经网络具有固有的非线性特性,这源于神经网络可近似任 意非线性映射( 变换) 能力,这一特性给非线性控制问题带来新的希望; ( 3 ) 通过训练进行学习神经网络是通过研究系统过去的数据记录进行训练 的,一个经过适当训练的神经网络具有归纳全部数据的能力,因此,神经网络能 够解决那些数学模型或描述规则难以处理的控制问题; ( 4 ) 适应与集成神经网络能够适应在线运行,并能同时进行定量和定性操 作,神经嘲络的强适应和信息融合能力使得网络过程可以同时输入大量不同的控 制信号,解决输入信息间的互补和冗余问题,并实现信息集成和融合处理。这些 特性特别适于复杂、大规模和多变量系统的控制; ( 5 ) 多变量系统神经元网络能够自然地处理多输入信号,并具有多个输出, 它们非常适合于多变量系统: ( 6 ) 硬件实现神经网络不仅能够通过软件而且可以借助硬件实现并行处理。 近年来,由一些超大规模集成电路实现的硬件神经网络已经问世,而且可从市场 上购得。 这使得神经网络成为具有快速和大规模处理能力的网络。 很显然,神经网络由于其学习和适应、自组织、函数逼近以及大规模并行处 理等能力,因而具有智能控制系统的潜力。神经网络在模式识别、信号处理、系 统辨识和优化等方面的应用,己有广泛研究。在控制领域,己经做出许多努力, 把神经网络用于控制系统、处理控制系统的非线性和不确定性以及系统的辨识等 方面。针+ 对当前人工神经网络存在的问题,今后研究的主要方向可分为理沦研究 和应用研究两个方面。 在理论研究方面有: ( 1 ) 利用神经理论与认知科学研究大脑思维及智能的机理; ( 2 ) 利用神经科学基础理论的研究成果( 即前一项成果) ,用数理方法探索智 能水平更高的人工神经网络模型,深入研究网络的算法和性能,例如稳定性、收 第1 5 页共5 8 页 第二章神经网络运动控制基础 敛性、容错性、鲁棒性等:建立新的网络数理理论,例如神经网络动力学,非线 性神经场等。 在应用研究方面有: ( 1 ) 神经网络模拟和硬件实现的研究; ( 2 ) 神经网络在各个科学技术领域应用的研究。它涉及的领域很广,包括模 式识别、信号处理、知识工程、专家系统、优化组合、智能控制等。 2 1 神经网络介绍与结构模型 人工神经网络( n n ) 的基本单元是神经元,它是由大量的神经元广泛互连而 成的网络 2 6 3 4 。 2 1 1 神经元模型; 联接机制结构的基本处理单元与神经生理学类比,亦被称为神经元,每个构 和模拟,它是神经网络的基本处理单元。如图2 1 ,它是一个多输入、单输出的 ! 二二二:耄j f ( ) i y 球。一一一一一j 譬 x 。,一。+ + r _ _ 一j n f。 卜善n 嫦卜毫w , 1 j :l m 自:1 7 ; 【d = 厂( 玎)【a = f ( n ) ( 1 ) 线性函数: f ( n ) = 以 c z , 对称阶跃: ;譬;! ! _ 。: 第二章神经网络运动控制基础 ( 3 ) 非对称阶跃:厂( 一) = i ( 4 ) 对称阶跃: 阳) = 等 习爹”园车 巨”团等崖 个+ l牛+ o 图2 2 : 一般神经网络所采用的传递函数 等等,不一介绍。 2 1 2神经网络的主要结构及算法: 田 人工神经网络的结构大体可分为层状和网状两大类。层状结构的神经网络是 由若干层组成,每层中有一定数量的神经元,相邻层中的神经元单向联接,一般 同层内的神经元不能联接:网状结构的神经网络中,任何两个神经元之间都可能 双向联接。下面介绍几种网络结构: ( 1 ) 递归( 反馈) 网络 在递归网络中,多个神经元互联以组成一个互联神经网络,如图2 3 ( a ) 所示。 有些神经元的输出被反馈至同层或前层神经元。因此,信号能够从正向和反向流 通。h o p f i e l d 网络、e l m m a n 网络和j o r d a n 网络是递归网络中几个典型的例子。递 归网络又叫做反馈网络。图中,e 表示节点的状态,丑为节点的输入( 初始) 值, 。为收敛后的输出值,j = 1 ,2 ,7 。 x l x 2 x n 输入层 v n 图2 3 ( a ) :递归( 反馈) 神经网络 第1 7 页共5 8 页 x - x n 输出层 第二章神经网络运动控制基础 对于不同的反馈神经网络的学习算法来说,主要都需要通过网络的自反馈运 算进行收敛来学习,这里面主要是网络参数的选择等,会对网络的收敛性产生影 响,如果参数选择不当,就会容易产生局部最小的现象。 ( 2 ) 前向( 前馈) 网络 前馈网络具有递阶分层结构,由一些同层神经元间不存在互联的层级组成。 从输入层至输出层的信号通过单向连接流通,神经元从一层连接至下一层,不存 在同层神经元间的连接,如图2 3 ( b ) 所示。图中,实线指明实际信号流通方向而 虚线表示信号的反向传播。前馈网络的例子有多层感知器( m l p ) 、学习矢量量化 ( l u q ) 网络、小脑模型联接控制( c m a c ) 网络和数据处理法( g m d h ) 网络等。 x l x 2 x 3 输入层 y 1 y 2 y 3 隐层 输入层 图2 3 ( ”:前馈神经网络 对于前馈神经网络来说,算法比较多样,最经典的就是b p 算法了。 典型的b p 网络是三层网络,如上图2 3 ( b ) 所示,包括输入层、隐含层和输出 层。各层之间实行全连接。隐含层的变换函数一般为非线性函数,如s 型函数或 双曲正切函数。输出层的变换函数可以是非线性的,也可以是线性的,这由输入、 输出映射关系的需要而定。 b p 网络是正向、各层相互全连结的网络。对于输入信号,要经过输入层,向 前传递到隐层节点。经过作用函数后,再把隐层节点的输出送到输出层节点,最 后给出输出结果。前面已经指出,在b p 网络中,作用函数通常选用s i g m o i d 函数。 这个网络的算法( 学习过程) 由正向传播和反向传播两部分组成。在正向传播过程 中,输入信息从输入层经隐层逐层处理,并传向输出层,每一层神经元状态只影 响下一层神经元状态。在输出层输出信号与期望值进行比较,如果存在误差,则 将误差沿原来连接的路径返回,通过修改层间各节点的连接强度( 权值) ,使误差 信号减少,直至把误差限定在预定的范围。 由b p 算法引申出的,又有变速率的b p 和r b f 算法等等,不一一介绍。 第1 8 页共5 8 页 第二章神经网络运动控制基础 ( 3 ) 相互结合型网络 相互结合型网络属于网状结构。构成网络中的各个神经单元都可能相互双向 联接,所有的神经元既作输入,同时也用于输出。 ( 4 ) 混合型网络 在前向网络的同一层之间神经元有互联的结构,称为混合型网络。 2 2 神经网络控制应用与系统辨识介绍 解下来,本章对神经网络对于系统辨识方面的应用做进一步的研究分析。 2 2 1 单层线性神经网络( s l n n ) 对线性动态系统的辨识 单层线性神经网络的结构,可用下面的图来表示 y 1 y 2 y n 图2 4 :单层线性神经网络( s l n n ) 篚j 结构 如图2 4 所示,其中,左面的圆圈表示输入端,右面的圆圈则表示关键的s l n n 系统,虚线方框中的每个圆圈皆表示一个神经元,每个神经元中的函数都为线性 函数,并且,每个神经元都可以接受来自所有输入端的加权信号。 当然,所有神经元都有一个阈值u ,对于一个神经元y i 来说,只有当所有输 入端的加权信号输入的总和大于闽值u i 时,才会对神经元的输出产生影响,具体 用数学表达式表示即为: y = “一w x ( 2 1 ) 对于线性动态系统来说,一般可以用数学表达式描述成以下的模型: 第1 9 页共5 8 页 第二章神经网络运动控制基础 x ( t ) = a x ( t ) + b u ( t )( 2 2 ) 其中,x ( t ) 表示系统中变量的时间变化量,u ( t ) 表示系统输入。 在实际情况中,很多问题可以用( 2 2 ) 的微分方程表示。举例来说,在一个电 阻与电感的串联系统中,电流i 的变化就可用微分方程( 2 3 ) 来描述: l 竺+ r i :e( 2 3 ) 讲 它就是这个电路的数学模型,只要变量名称稍加变化,就可以用( 2 2 ) 式来替 代。 研究这个方程的数学性质就可以知道这个电路的运动特点,在变化成( 2 - 2 ) 式进行研究这个方程时,人们就不再去考虑方程中的i 和e 的物理意义,只把他们 看作抽象的变量。同样,人们也不用再考虑l 和r 的物理意义,只把他们看作是a 和b 这样抽象的参数。 别的事物的数学模型如果与此相同,也可以简单的表示成( 1 ) 这样的微分方 程。 当然,对于线性动态系统来说,输入变量也许并不只是标量i ,而是具有矢 量性质的x ( f ) ,这样,( 1 ) 中的方程可以展开为: x ( r ) 如( f ) ”_ 一 以( r ) 口口12 a 2 1a 2 2 口】f 0 2 x t ( f ) 也( f ) _ _ x a t ) + b l b 2 钆 “( f ) ( 2 4 ) 于是对于线性方程x ( f ) = a x ( t ) + b u ( t ) ,系统的辨识目的是在于决定参数a 和 参数b 的值。 假设定y a 。和展作为未知参数a $ i i b 的估计值,则原系统方程可表示为: x o ( t ) = 4 x ( f ) + 皿“( f ) ( 2 5 ) 相应的,可以定义误差函数e ( t ) 为: e ( t ) = x ( f ) 一x e ( f ) ( 2 6 ) 微分可得: e ( t ) = x ( f ) 一x e ( f ) ( 2 7 ) 将( 2 7 ) 中的微分式展开即为: ;,:i k 。 第2 0 页共5 8 页 一b , i “ ( 2 8 ) 第二章神经网络运动控制基础 改用i ) 9 0 才单层神经网络( s l n n ) 的表不方法,我们将式2 8 写成: e ,= 一彬7 xw = k 。a e ,2 a e i k 氏r ( 2 9 ) 这样,相当于我们已将线性动态系统,用线性单层神经网络实现了建模。这 样,我们需要确定的就是网络的权值矩阵矾在这里,我们采用梯度下降法的递 归逼近来获得结果,关于梯度下降法的介绍在这里就不做赘述了,可以查看有关 文献。 定义误差函数为: 肚去卜2 巩 1 0 ) 也可以写成: 叫拇叫 其中,护f ,表示矩阵的迹( t r a c e ) 。 对于原来的参数估计问题,我们可以转化为求e 最小的问题。 对于单层神经网络( s l n n ) 来说,我们采取梯度法来求得厶。,进而得到最优 的参数估计值。关于梯度法的具体介绍,本文将不具体涉及。 采用梯度法估计动态系统的参数值,n e - t 以表示为: m 们 舳) = 打( 去翼z ,一嘭7 x x ,一彬7 x ,讲 展开: e = 吖去胁,l 矽崩:彬,甸 c z 蛇, e 的梯度口i 可表示成: v ,= 亭7 彤研一手# 出 v , c :哟 如果用离散的方程表示,则是: 甲,= ;| ;崩 亭喜,j v , ( 2 1 4 ) 其中,n 代表了样本数。 使得s l n n 优化的条件是使得误差函数的梯度为o ,即v i = 0 。在这样的条件 下,我们得到的权值w 是最优的。权值w 的计算方法如一f : 第2 1 页共5 8 页 蔓三翌塑丝旦塑堡塾丝型茎型 ,( + i ) = 彬( n ) 丑v ,( 2 1 5 ) 直到最后的结果为: 嘭扣+ 1 ) = 彤( ”)( 2 1 6 ) 当采用梯度下降法后,权值收敛接近于式2 1 6 ,并且误差函数在可以接受范 围之内,可以认为线性网络最后收敛成功。 我们采用仿真实例来进一步说明,举例来说,假设动态线性系统为: | _ 0 9 4 2 4 8 1 2 5 6 6 01 0 。2 i 一1 2 5 6 6 0 o 9 4 2 4 8 | 。( 。) + 2 0i “( 7 一= l :0 1 2 篇5 6 6 01 0 篇9 4 2 4 8 陶2 0 l 一 一, 1 1 通过梯度下降法进行神经网络训练后,得到的a e 和b e 以及e 可以从f 图看出: 轴 一一一一一 ih l5 , 巷“5 卜 l 。 室、 图2 5 ( a ) 对于a 矩阵的参数估计 以上2 5 ( a ) 中的四图分别代表了矩阵爿。中四个参数随神经网络( s ) 训练而 变化的值。 图2 5 ( b ) 中,前两幅图表示矩阵风随网络训i 练产生的变化,最后一幅图表示 误差函数随着网络的训练而趋近于o ,即表示爿。,段和原来系统的4 ,b 矩阵相一 致,从而达到最后系统辨识的目的。 第2 2 页共5 8 页 笙三童塑丝旦竺望垫丝垒! 苎型 25 一一一 2 ,一。、一一j 刊, 墨1 , 量。 o j r 0 告一i 高萄矿1 萄蕊i 也 t r e i r a n g c p o c h 图2 5 ( b ) 对= b 矩阵的参数估计以及误差函数e 的变化值 2 2 2 采用线性h o p f i e l d 反馈神经网络求解线性系统问题。 在前面讨论的神经网络求解动态线性系统采用的是前馈的单层神经网络加 梯度法解决的,这里我们采用反馈神经网络中比较著名的h o p f i l e d 网络 3 6 】来尝 试解决另一个比较实际的问题,线性方程组问题或者说是线性系统问题。 一般来说,线性系统的方程组定义为: 寸 一 a x 2b f 2 1 7 ) 对于常见的h o p f i e l d 反馈神经网络来说,基本n n - 络n 构有如下形式: 詹t 、 , 图2 6 常见h 0 p 6 e l d 反馈神经网络 最后的传递函数s ( x ) 可以为上图的饱和线性函数,也可以是s 型函数。 第2 3 页共5 8 页 o po$昌5詈 、卜 厂 第二章神经网络运动控制基础 与之前的单层神经网络,或者多层前馈神经网络相比较,h o p f i e l d 两 络没有 与之相关的学习,它不被训练,也不会自己来学习。它是用基于能量函数的设计 过程来确定权值矩阵的。对于这罩要求解的线性方程组的问题,实际上我们可以 转化成采用线性h o p f i e l d 网络来解决最小均方优化的问题。 对于线性h o p f i e l d 网络结构,我们可以将图2 5 中常见的h o p f i e l d 网络,稍加 变化,转换成如下的结构: 图2 7 线性h o 蛳e l d 网络结构与线性神经元函数 可以看到,神经元里面的传递函数为线性函数。 因此,连续或者离散的h o p f i e l d 网络可有以下的微分方程来表示: x ( i + 1 ) = w x ( i ) + 1 , 1( 2 1 8 ) x r ” 矿r 脓”“r ” 可以证明,如果w 的特征值半径在复平面的单位圆内时,i ! n m a x e i g ( 聊】 = l 时,网络能收敛。 现在回到刚才的线性方程组( 2 1 7 ) ,我们根据系统的a 矩阵建立h o p f i e l d 网络 的权值w 。现在将原方程重写为: 一a x + b = 0 ( 2 1 9 1 由于采g h o p f i e l d
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 北京邮政合作协议书
- 2025年RISC-VDAC接口规范考核试卷
- 协议书对接模式是什么
- 上市辅导签约协议书
- 2025年环境应急(饮用水源地应急保障方向)资格考核试卷
- 2025年环保科技行业清洁技术创新与生态保护研究报告及未来发展趋势预测
- 2025年互联网教育行业创新教学模式研究报告及未来发展趋势预测
- 2025年环保科技行业清洁技术应用与环境治理政策研究报告及未来发展趋势预测
- 2025年碳排放权交易数据安全管理实务考核试卷
- 2025年光伏电站运维操作知识更新考核试卷
- 2025年GSP培训试题及答案
- 2025年国企中层干部竞聘笔考试题附带答案
- 2025年及未来5年中国无磁不锈钢带行业市场运行态势与投资战略咨询报告
- 地下管线安全知识培训课件
- 工厂生产线安全风险评估表格范本
- 2025年贵州高中学业水平考试考信息技术模拟试卷(含答案详解)
- 垃圾填埋场作业人员培训方案
- 2025-2026学年 语文三年级上册 统编版(2025版)第四单元 综合过关验收卷(有答案)
- 临床试验质控课件
- 脂膜炎合并皮下结节护理查房
- 燃气施工材料管理办法
评论
0/150
提交评论