(计算机应用技术专业论文)液体状态机在足球机器人路径规划中的应用.pdf_第1页
(计算机应用技术专业论文)液体状态机在足球机器人路径规划中的应用.pdf_第2页
(计算机应用技术专业论文)液体状态机在足球机器人路径规划中的应用.pdf_第3页
(计算机应用技术专业论文)液体状态机在足球机器人路径规划中的应用.pdf_第4页
(计算机应用技术专业论文)液体状态机在足球机器人路径规划中的应用.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

(计算机应用技术专业论文)液体状态机在足球机器人路径规划中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 机器人路径规划技术是现代机器人控制领域内的一个焦点问题,也 是机器人避障比赛中的核心技术。作为一种新型循环神经网络,液体状 态机具有对数据大规模并行处理及对知识有较强的融合能力等良好的特 性,引起越来越多的关注。 本文在综合分析大量最新研究成果的基础上,将液体状态机应用到 机器人路径规划之中。主要完成以下研究工作。 一。 首先,描述了足球机器人,特别是类人机器人比赛的现状和特点。 然后,综合分析了液体状态机的结构特点,运行机制及学习方法。 最后,分析了机器人路径规划的特点与技术要求,并给出了液体状 态机在其中应用的具体方案,通过仿真与实际比赛验证了方案的合理性。 关键字:液体状态机;尖峰神经元;类人机器人;路径规划 a b s t r a c t s o c c e rr o b o ti sac h a l l e n g i n gi t e mi nr o b o tf i e l d ,a n d a ni d e a lb r e a k p o i n t i na r t i f i c i a li n t e l l i g e n c e i tl o o k sl i k eg a m ew h e n t h er o b o tk i c kf o o t b a l l , i nf a c t ,i tc a ns h o wt h ec o l l i g a t e da b i l i t y o fo n en a t i o n st e c h n i q u eo f i n f o r m a t i o na n da u t o m a t i o n t h e r e k i n d so ff i e l d s a r em a n ya p p l i c a t i o n so f s o c c e rr o b o ti n l i q u i ds t a t em a c h i n e ( l s m ) i so n en o v e ls t r u c t u r eo f r e c u r r e n tn e u r a l n e t w o r k ( r n n ) a l s oo n en o v e ll e a r n i n gm e t h o df o rr n n a sw e l l ,i t ss i m i l a r w i t ht h o s eb i o n e u r a l n e t w o r k ss t r u c t u r a l l y , i th a sal a r g eo f n e u r a lu n i t e s a n dr e c u n e n tp a t h ,a n di th a ss p a r s e l yr a n d o mc o n n e c t i o n ;t h e s ep e c u l i a r i t i e s m a k ei th a st h ep e r f e c ts h o r t t e r mm e m o r y ( s t m ) c a p a b i l i t y a so n er n n a s f o rm o t i o nc o n t r o la n dp a t hp l a n n i n gp r o b l e m o fw h e e l e dm o b i l er o b o t ,o nt h e b a s eo fa d v a n t a g e so fl s m ,t h i sp a p e rh a v ec a r r i e do u t t h ef o l l o w i n gw o r k s f i r s t ,r o b o ts o c c e ra n dc h a r a c t e r i s t i c so fr o b o ts o c c e ra r ei n t r o d u c e d ,t h e m o t i o nc h a r a c t e r i s t i co fs o c c e rr o b o t a n dm e t h o do fr o l es e l e c t i n g a r e i n c l u d e d s e c o n d ,t h el s mi si n t r o d u c e da n dr e s e a r e d ,i n c l u d in gi t s s t r u c t u r e c h a r a c t e r i s t i c ,i n n i n gp r o c e s sa n dl e a r n i n gm e t h o d f i n a l l y , t h ep a t hp l a n n i n gi si n t r o d u c e d ,a n dt h el s m i sa p p l i e dt op a t h p l a n n i n gp r o b l e mo f s o c c e rr o b o t t h ea d v a n t a g e so fl s m o nl a r g ep a r a l l e l p r o c e s s i n gf o rd a t aa n d i n f u s i o nc a p a b i l i t yo ne x p e r i e n c em a k e i th a sah i g h e r r e s e a r c h 凡lv a l u ei nr o b o t sp a t hp l a n n i n g ,t h ep e r f o r m a n c e h a sb e e ns h o w e d i nt h i sp a p e r k e yw o r d s :l i q u i ds t a t em a c h i n e ;s p i k en e u r a l ;h u m a nr o b o t ;p a t h p l a n n i n g 1 1 1 独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作 及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文 不包含任何其他个人或集体己经发表或撰写过的研究成果。对本文的研 究做出贡献的个人和集体,均已在文中以明确方式标明。本人完全意识 到本声明的法律结果由本人承担。 学位论文作者签名:舌研 f 2 n7 r 年月一日 学位论文版权使用授权书 本学位论文作者完全了解我校有关保留、使用学位论文的规定,即: 我校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允 许论文被查阅。本人授权武汉工程大学研究生处可以将本学位论文的全 部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等 复制手段保存和汇编本学位论文。 保密o , 在年解密后适用本授权书。 本论文属于 不保密影 ( 请在以上方框内打“寸) 学位论文作者签名:乏砷 了年6 月r 日 弘铷智 即年6 月f 日 第l 章绪论 第1 章绪论 人工神经网络是上个世纪5 0 年代后发展起来的热门学科,涉及计算 机,生物,数学,电子和物理等学科,存在十分广泛的发展背景,这个 内容对当前和以后的各门学科的扩展起到了非常重要的作用。 1 1 液体状态机概述 迄今为止,大量学者对人脑的特性进行了深入的研究,并通过各种 方法用现实的物理系统对人脑进行模仿,让这些系统达到和人脑相同的 功能。计算机组合很多电子元件实现人脑的一些判断和记忆等功能。现 代社会发展的重要指标是用计算机取代大脑的一些劳动以减轻人的负 担,提高做事效率。由于大脑中任何神经元的反应时间是几毫秒,而计 算机电子元件的计算速度是几纳秒,所以计算机的处理能力比大脑快很 多倍,但是,直至今日,计算机在处理某些例如嗅觉、视觉、听觉等简 单问题时却显得不好处理,远远比不上人的能力,人在处理声音、文字, 图像等问题的能力强很多倍,计算机需很长时间才能完成的识别任务, 人只要很短时间能处理完【l 】。当然,计算机在直觉、思维,人工智能,机 器人控制等问题更加不如人脑。所以人们一直在追求一种功能强大的计 算机结构,让其讨算能力超过人类,同时具有人其他的很多能力。 人工神经网络【2 】就是一种对生物神经元的功能和结构进行模拟的系 统,主要是依靠可实现的物理系统实现的。人工神经网络是把很多的基 本单元按照一定的顺序的组合,这些基本单元结构比较简单,但是并行 工作,其存储方式,信息传播和生物神经元类似,而且没有一般计算机 的根本结构。 人工神经网络的在很多问题中得到应用。当然在广泛的使用过程中, 人们不断发现了很多问题,同时在深入的理论研究中也遇到了一些原来 逼近论,非线性理论中的难点,于是,在其基础上提出了液体状态机的 概念。液体状态机是最近提出的理论,是一种由尖峰神经元组成的大规 模循环神经网络,能够对持续的输入流进行实时的计算。主要包含三个 部分,一个输入层,个随机产生的大规模神经网络,称之为液体层,一 武汉工程大学硕十学位论文 个输出层。 1 1 1 循环神经网络 循环神经网络( r e c u r r e n tn e u r a ln e t w o r k ) 也称为动态神经网络 ( d y n a m i cn e u r a ln e t w o r k ) 。因为内部节点存在延迟反馈的特点,所以该 神经网络也能被认为是反馈神经网络的一种。前馈网络的特点是输入与 输出相对应,而且是静态的,在实际应用中不台p - , 6 e i 好的支持非线性控制, 因为非线性控制具有动态的特性。相反,循环神经网络能够很好的支持 非线性系统,而且能够处理时变输入与输出,所以与前馈神经网络相比, 循环神经网络能够更好的处理动态系统【3 】。 循环神经网络具有两种类型:全局型和局部型,全局型循环神经网 络的连接权值数目是以2 ,表示其中每个神经元之间都相互连接和自连接, 这样的结果是连接权值数目太多,降低网络的逼近速度,所以,全局型 循环神经网络的应用存在一定局限性【4 1 。局部型循环神经网络与全局型的 区别是只有隐层的神经元之间有相互的连接和自连接,其他结构没有反 馈。局部型神经网络优点是逼近速度快,所以在非线性时变系统中一般 使用后者。 按时间变量的类型不同,把循环神经网络又分为离散时间递归神经 网络和连续时间递归神经网络两种。下面是离散时间递归神经网络 ( d r n n ) 的说明。 在一般表示中。,( 庀j 表示模型在时刻k 的第i 个输入信号,y ( 表示 模型的输出,表示输入层第f 个神经元到隐层第,个神经元的连接权值, 表示隐层第,个神经元到输出层的连接权值,坼表示隐层第,个神经 元的自反馈连接权值,s j ( k j 表示隐层第,个神经元的输入总和,x j ( k j 表示 隐层第,个神经元的输出。 用公式描述上述结构的动力学方程【5 】: y ( 尼) = ,”_ ( 忌) ( 后) = f ( s ( 足) ) ( 1 1 ) ( 1 2 ) 第1 章绪论 s j ( k ) = 矽( 七一1 ) + w o l , ( k ) , ( 1 3 ) 其中,一般设定阈值函数( ) 为双曲正切函数或s 型函数。通过( 1 3 ) 式,能够得到,该结构在隐层神经元存在自连接,因此该结构具有很好 的动态映射特性。 d r n n 网络的学习可以采用动态b p 学习算法( d b p a ) ,遗传算法等。 1 1 2 尖峰神经网络 h o d g k i n 和h u x l e y 通过对一些鱼的研究最终从鱿鱼神经元得到了动 力学方程,用这种动力学方程可以描述一般的神经元。神经元的输出信 号可以利用s p i k e 输入信号控制,当神经元输出信号超过设定阈值时,就 会发送一个特殊信号,这种信号的产生只需l 毫秒。神经元一般都很相 似,在对人脑和神经元的研究中这种特点起到很大的作用。 利用这种特殊信号的特征,称之为s p i k e 。神经元中有很长的轴突, s p i k e 信号经轴突传到各个分支。在这个处理中,s p i k e 信号会被放大,为 了减小信号的损失一般的分支就是拷贝接收到的s p i k e 。s p k i e 信号从一个 神经元之间的空隙到达另外一个神经元的过程的完成依靠的是神经突 触。神经突触是个十分繁琐的结构,主要进行信号预处理,由轴突终 端构成,并且对网络的自适应能力和网络自学习能力起到特别关键的作 用。如果一个s p i k e 信号传到突触前的轴突端,那么突触后也会做相应的 工作,即神经传递分子就会接收s p i k e 信号。突触后的电压可以是正的也 可以是负的,正的被叫做激励p s p 信号( e p s p ) ,负的被叫做抑制p s p 信 号( i p s p ) ,表示了这两种信号。 一万个神经突触的输入电压可以同时进入神经元,当这些电压的之 和超过设定阀值的时候,s p i k e 信号就会被神经元发送出,然后神经元就 会恢复一段时期,这个恢复期的时间持续l o 毫秒。 1 2 机器人路径规划 在对移动机器人进行研究时,路径规划技术是其中最主要的一个部 武汉工程大学硕士学位论文 分,同时也在机器人导航应用中占据着重要的角色。路径规划被蒋新松 作出了如下的描述【1 2 】:路径规划是双足移动机器人研究的重要部分,路 径规划的主要内容是通过某种分析标准,在存在一些障碍物的环境内, 找到一条从起始状态( 包括位置和姿态) 到达目标状态( 包括位置和姿 态) 的没有碰撞的路径。在实际环境中,不同分布的障碍物会得到不同 的路径,但是可以通过其他的任务模块得到目标位置。移动机器人的路 径规划问题根据对现实环境的了解情况一般可以分为两类:一类是机器 人全局路径规划,他是根据环境先验信息的;另一类是机器人局部路径 规划,这个是根据各种传感器信息的,这些信息能够从某种程度上反应 现实的环境。 1 2 1 全局路径规划 对于全局路径规划方法,可以根据已经得到的全局的环境信息,规 划机器人的行走轨迹,这条轨迹从给定的起始点到结束点。得到的环境 信息很重要,其准确程度直接决定了规划路径的精确度。全局路径规划 方法可以通过开始得到的精确的全局环境信息获得最优解。但是这个方 法的实时性比较差,计算量也很大,通常不能很好地应用于非确定的动 态环境。根据环境进行建模的全局路径规划的方法比较多,但主要是栅 格法、构型空间法和自由空间法等。 1 2 2 局部路径规划 对于局部路径规划方法,主要参考机器人通过传感器所了解的目前 局部环境信息,这种特性使得机器人存在很好的的避免碰撞的能力。目 前存在的很多移动机器人路径规划方法都利用的是局部路径规划方法, 只利用传感器实时得到的信息。局部路径规划方法比起全局规划方法更 具有实时性,实用性更强,对动态的环境也具有更强的适应能力等优点; 但也有缺点:由于局部路径规划只能利用局部信息,所以会产生振荡或 者陷入局部最优,这种情况将导致机器人不能准确地到达终点。 作为分布式系统,人工神经网络的特点是能够进行高度的并行处理, 第1 章绪论 在解决机器人系统所要求高的实时性的问题有很大帮助,使得这种高的 实时性要求成为现实,因此神经网络就被广泛应用于移动机器人路径规 划。禹建丽【l3 】在基于神经网络的机器人路径规划问题上贡献比较大,首 先提出了一种基于神经网络的机器人路径规划算法,接着把线性的自适 应变步长算法用到其中,大大地缩短了移动机器人路径规划实现时间【1 4 1 。 在障碍物位置和形状已经确定的条件下对移动机器人路径规划算法进行 深入的研究发现,该算法能量函数的定义能够很好的利用人工神经网络, 其得出的运动轨迹符合最短无碰撞路径,而且计算又简单学习速度又快。 刘成良等【l5 】提出了另外一种基于神经网络的机器人无碰撞路径规划方 法,同时给出了无碰撞轨迹规划的人工神经网络算法,并经过证明,这 种方法是可行的,这种方法为神经网络能真正用于机器人控制提供了坚 实的基础。陈宗海提出【1 6 】了在不确定环境中移动机器人的路径规划方法。 针对移动机器人在未知环境中的情况樊长虹【1 7 】等人采用了一种局部连接 的h o p f i e l d 神经网络规划器。 1 3 机器人足球类人比赛概述 1 3 1 机器人足球简介 博弈曾经作为典型问题极大的推动了人工智能的发展- i b m 公司 研制的“深蓝 计算机“打败 了世界象棋冠军卡斯帕罗夫成为了人工智能 发展史上的“第一个里程碑 ,表明了计算机可以战胜人类天才,实现了 人工智能学者近5 0 年的梦想。而今天,把机器人足球比赛作为人工智能 的研究平台受到了愈来愈广泛的关注【l8 1 ,同时机器人足球比赛也成为了 高新科技领域的对抗和国际化的比赛【l9 2 0 1 ,“绿荫场 上的“人机大战”将成 为下一个5 0 年的新梦想。 以“深蓝”为代表的计算机象棋本质上只是一个能在几分钟内分析 6 0 0 亿个棋局的搜索程序【2 ,然而,机器人足球则是新的历史条件下人工 智能的全面体现,足球机器人除了“思维”外,还包括“感知”和“行为 ,并 且机器人足球还涉及到多a g e n t 的智能研究和协作的问题,即机器人足 球研究的是一群多智能体在复杂动态环境下,通过相互通信和协调,以 武汉工程大学硕士学位论文 实时方式进行的知识处理问题。所以,机器人足球作为研究机器人智能 以及多智能体系统的重要的实验载体【2 2 1 ,标志着人工智能“新的里程 碑,【2 3 】。 自加拿大大不列颠哥伦比亚大学a l a n m a c k w o r t h 教授于19 9 2 首先 提出了让机器人走上“绿荫场 的宏伟设想以来【2 4 1 ,机器人足球发展迅猛, 许多比赛组织和研究团体纷纷建立。目前,在机器人足球比赛方面的国 际组织主要有两个:一个是于1 9 9 6 年在日本正式成立的“机器人世界杯 赛会 ( r o b o tw o r l dc u p ,简称r o b o c u p ) ,先后举行1 0 届机器人足球世 界杯赛,数十个国家的上百支球队前来参赛。r o b o c u p 在日本、欧洲和 美国都有很大的影响,成为世界上影响最大、参加人数最多的机器人足 球组织。国际上另一个很有影响的机器人足球社团则是总部设在韩国的 国际机器人足球联合会( f e d e r a t i o n o fi n t e r n a t i o n a lr o b o t s o c c e r a s s o c i a t i o n ,简称f i r a ) 。f i r a 于1 9 9 7 年6 月5 日正式成立,3 0 余个国 家的近百个学校与科研院所是其成员单位,主要分布在亚洲、澳洲、北 美和南美洲。f i r a 已组织了1 3 届机器人足球世界杯赛( 第1 3 届于2 0 0 8 年7 月2 1 日一7 月2 4 日于中国青岛举行) 。f i r a 主要比赛项目有: 半自主型机器人足球:m i r o s o t 全自主型机器人足球:r o b o s o t 仿真机器人足球:s i m u r o s o t 超小型半自主机器人足球:n a r o s o t 超小型全自主机器人足球:k h e p e r a s o t 类人机器人足球:h u r o s o t 、 我校是f i r a 赛事的主要参赛单位之一,开展了f i r a 所有项目的研 究,并多次在国内外举办的多项赛事的半自主型机器人足球比赛、全自 主机器人足球比赛、类人型机器人足球比赛和仿真机器人足球比赛等项 目中取得佳绩。 1 3 2 机器人足球的意义 足球机器人是人工智能与机器人领域极富挑战性的高技术密集项 笙! 童堕笙 一 目,同时又是人工智能技术的一个理想突破点。机器人踢足球,看似游 戏,其实展示了一个国家信息和自动化技术的综合实力。足球机器人系 统在许多领域有着广泛的应用前景。比如,系统中的协作控制与决策, 就可用于无人作战平台群的协助控制。 机器人足球虽然是在一个小平台上两个机器人球队进行的足球比 赛,但要使一个机器人球队战胜另一个机器人球队,不但需要人工智能 技术中的视觉、传感融合、行为决策、知识处理等技术,而且还需要和 无线通讯、智能控制、机电一体化、计算机仿真等许多关键技术集成为 一体的综合技术。因此凡参加“世界杯”机器人足球比赛的球队都是带着 自己国家的综合实力和尊严参加比赛的,因此可以说“世界杯 机器人足 球是衡量各国综合技术实力的一个小平台上的“技术战争。 机器人足球系统的研究涉及非常广泛的领域,包括机械电子学、机 器人学、传感器信息融合、智能控制、通讯、计算机视觉、计算机图形 学、人工智能等等,吸引了世界各国的广大科学研究人员和工程技术人 员的积极参与。更有意义的是,机器人足球比赛的组织者始终奉行研究 与教育相结合的根本宗旨。比赛与学术研究的巧妙结合更激发了青年学 生的强烈兴趣,通过比赛培养了青年学生严谨的科学研究态度和良好的 技能矧。 机器人足球比赛将过去计算机象棋中的单智能体研究对象发展到分 布式多智能体,静态研究环境发展到动态环境,并将非实时知识处理问 题发展到实时处理问题,因此可以说,机器人足球是继计算机象棋后出 现的发展人工智能的第二个里程碑,将人工智能技术发展到新的境界。 1 3 3f i r a 机器人足球类人机器人比赛 类人机器人比赛( h u r o s o t ) 主要分为四个小项目,分别是: 点球比赛( p e n a l t yk i c k ) 举重比赛( w e i g h tl i f t i n g ) 避障比赛( o b s t a c l er u n ) 正反走竞速( r o b o td a s h ) 武汉工程大学硕士学位论文 各个比赛项目对机器人的要求各不相同,如图l l 所示为点球比赛场 地,球被放在灰色区域中的任意位置,罚球机器人被要求从罚球点处开 始点球比赛,而守门机器人则在球门线处作出守门判断,完全模仿了人 类足球中实际的点球过程。该项比赛主要考察了类人型机器人的步态稳 定性以及机器视觉等技术,对机器人的智能化和机器稳定性都有很高度 要求。 举重比赛和人类的举重比赛类似,如图1 2 所示机器人要求举起选定 重量的杠铃,其中重量的大小以所加d v d 盘片数量为标准。在举重过程 中,要求机器人将杠铃举起到头顶以上5 公分以上。该项比赛对机器人 的电机负载能力以及机器人的静态平稳性的要求较高。 正反走竞速的比赛场地如图1 3 所示,要求机器人以最快的速度从起 点走到终点,然后再从终点以倒走到姿势回到起点。该项比赛的目的在 于促进类人机器人的行走速度,对机器人的行走的稳定性以及行走路线 的稳定性都有很高的要求。 避障比赛场地如图1 4 所示,图中共有四种类型障碍物,分别为墙式、 圆柱式、门式和槛式,分别是现实生活中各种障碍物的抽象。要求机器 人从开始端穿过各种障碍物的最终到达终点,在穿行的过程中不能触碰 任何障碍物和跌倒。其对机器人的实时信息采集能力以及实时地图创建 和自定位的要求都非常高。本文的主要内容就是针对该项比赛的要求而 展开的,实践证明其能适应比赛的要求并能比较好的完成比赛。在f i r a 组织的国内和国际机器人足球赛上都取得了一系列好成绩。 第1 章绪论 点笆罂场地1 l 。 嘲1 4 毕堆咻 i q1 - 3 甜止麟磷场地4 意圈 懈1 - 4 邋摊l t 赉场j m 月磕阱 2 0 0 6 年,在德围多特蒙德举行的第十一届f i r a 机器人世界杯足球 赛中,w i t 类人机器人在参加h u r o s o t 比赛的11 只代表队中在避障项 目中取得,单项第一的成绩。2 0 0 7 年,在美国旧金 1 l 举行的第十二届 f i r a 机器人世界杯足球赛中继续蝉联该项闷的第一。 i3 4 本文的主要工作 奉义十要对神经时络最新的方向液体状态机进行了研究,包括其内 在主要机制液体层和尖峰神经元。为适应国内外大赛的要求,在综合应 用上述研究成果的基础卜设计了、1 t 类人机器人实时路径规划系统。主 要研究内容如r : i 、简述了第三代神经元尖峰神经元的相关概念,对其两种模型进行 r 对比,并选择,其叶1 一种模型用于本文的研究中。针对尖峰神经元特 殊的结构,必须采用高斯接受域的方法对输入数据进行编码。探讨r 尖 峰神经元的两种不同的学习算法,基于传统b p 的s p i k e p r o p 算法和粒子 群算法。 武汉:【程大学硕士学位论文 2 、对液体状态机进行了深入的研究。首先给出了般概念和模型, 与相关的结构进行了对比。详细的探讨了其主要部分液体层的内部机制。 针对液体状态机特殊的结构,简单的对其仿真工具c s i m ( an e u r a lc i r c u i t s i m u l a t o r ) 进行了介绍。 3 、准确把握机器人路径规划问题的一般提法。对机器入路径规划问 题的各个不同类型的不同方法进行了相应的探讨,更深入的讨论了各种 不同类型的路径规划问题的典型算法,以及在机器人路径规划问题存在 的缺陷和发展趋势。 4 、通过w i t 类入机器人避障路径规划系统验证明,将液体状态机运 用到该系统中能比较好的完成f i r a 机器入足球类人机器人避障比赛的要 求。 l o 第2 章尖峰神经网络 第2 章尖峰神经网络 人工神经网络在各个学科中都有应用,特别是在计算机学科的应用 中尤为突出,成为计算机学科应用的一个主要方向。1 9 5 0 年前后首种模 型被提出,这个模型是很单一的由m p 神经元组成的 2 6 1 ,其作用是;一 旦信号输入值按照一定的比例进行求和后,总值比预定值高的时候,神 经元就会输出0 或者l 。这种模型早已在h o p f i e l d 神经网络和p e r c e p t r o n 神经网络中得到很好的实现。接着人们提出了第二种模型,没有使用类 似第一代神经元模型中的函数,而是利用其他不同的函数对神经元进行 信号相应的处理,这些函数具有很好的数学特性。最常使用的模型有两 种:s i g m o i d 函数和h y p e r b o l i c 函数。这两种函数在循环神经网络和前馈 神经网络中经常被用到,而且与酋种模型相比分析效果更好。首种模型 与第二种模型相比具有更多优点:对首科t 模型中的输出层的任何一个神 经元添加上述函数时,那么就可以用比较简单的结构处理很多计算数学 难题【2 7 】;第二种模型能进行模拟计算。从上面的描述中可以知道以上两 种的模型的输出值在知,1 】,而没有使用单一的输出信号。这种在,1 】的信 号被认为是在一段时闻里神经元的输出比率,输出比率高说明输出的信 号比较强,输出比率低表示输出的信号比较弱。上述方法利用的机制是 基于平均的思想,这种思想表示可以反复处理输出值,一次处理就可以 得到所需的结果;然而在实际应用中,神经元输出状态只存在有信号和 没信号两种状态,不存在其他状态,因此在现实应用中,神经元存在基 本的,用上述函数对输出比率进行模拟。通过上面的分析可以看如第二 种模型与首种模型相比 2 8 , 2 9 1 更实用。 神经元的信号强弱可以利用改变突触连接权值对其进行改变,这种 信号包括输入信号和输出信号。这种过程定义为突触可塑性,比较容易 实现。对于采用上述函数的网络般利用梯度下降法【粥1 。使用特殊的神 经元是第三种模型的特点,这种神经元所发出的信号是s p i k e ,跟生物神 经元类似【3 1 1 可以与时间的信息保持计算和通信。在对神经病学的研究中, 漫近得到一些发现,即神经元畿够很快的处理模拟计算问题,通过真人 武汉工程大学硕士学位论文 试验验证了人类可以对可视信号在l o o m s 内进行分类和分析等处理。这 也证明了这种神经元采用的是时间编码,而且与生物神经元在某种程度 上更相似。 2 1 尖峰神经元基本概念 2 1 1 尖峰神经元背景 h o d g k i n 和h u x l e y 通过对一些鱼的研究最终从鱿鱼神经元得到了动 力学方程,用这种动力学方程可以描述一般的神经元。神经元的输出信 号可以利用s p i k e 输入信号控制,当神经元输出信号超过设定阈值时,就 会发送一个特殊信号,这种信号的产生只需l 毫秒。神经元一般都很相 似,在对人脑和神经元的研究中这种特点起到很大的作用。如图2 1 a 描 述了生物神经元。 如图2 1 b ,利用这种特殊信号的特征,称之为s p i k e 。神经元中有很 长的轴突,s p i k e 信号经轴突传到各个分支。在这个处理中,s p i k e 信号会 被放大,为了减小信号的损失一般的分支就是拷贝接收到的s p i k e 。s p k i e 信号从一个神经元之间的空隙到达另外一个神经元的过程的完成依靠的 是神经突触,是包含在神经元中的。神经突触是一个十分繁琐的过程, 主要进行信号预处理,由轴突终端构成,并且对网络的白适应能力和网 络自学习能力起到特别关键的作用。如果一个s p i k e 信号传到突触前的轴 突端,那么突触后也会做相应的工作,即神经传递分子就会接收s p i k e 信 号。突触后的电压可以是正的也可以是负的,正的被叫做激励p s p 信号 ( e p s p ) ,负的被叫做抑制p s p 信号( i p s p ) ,图2 1 c 表示了这两种信号。 一万个神经突触的输入电压可以同时进入神经元,当这些电压的之 和超过设定阀值的时候,s p i k e 信号就会被神经元发送出,然后神经元就 会恢复一段时期,这个恢复期的时间持续l o 毫秒。 2 1 2 尖峰神经元的特点 尖峰神经元通过数学进行建模,与实际人脑神经元更相似。把信号输 翌! 至叁竺塑竺塑丝 入与信号输出利用某种特殊函数对应起来是以往神经元模型的工作过 程,然后把输出信号经过突触连接传到相关的神经元,但是却与以往神 经元模型不一样;尖峰模型就像一个信号的过滤器。外界的输入和父突 触神经元的输入都属于外界影响,当尖峰模型得到这些环境的影响导致 输入信号超过设定值时,该模型就会发出一个s p i k e ,同时伴随一段输出 值,定义为p s p 。 图2 1 ( a ) 现买模型;( b ) 矢峰输出;( c ) p s p 信号 实现尖峰模型时间单元的处理存在很多不一样的方法。因为不同尖 峰模型产生的s p i k e 在外表上看一般很相似的,利用尖峰时间? 表示 s p i k e ,在这个模型中神经元用符号i 表示,模型发出的s p i k e 数目用符号 表示。用e = 0 1 ,f ) 表示模型发出的s p i k e 链,同时用符号u i 描述神经元 i 的输入信号。一旦“r 的值大于1 9 ,这个模型就会发出s p i k e ,产生条件可用 公式2 1 表示【3 2 】: t f :“( f 厂) = 口,并且如( f ) o ( 2 1 ) 武汉工程大学硕士学位论文 平常一般应用的尖峰神经元模型有两种:积累发送模型和尖峰响应 模型( s r m ) 。其中前一种对h o d g k i n h u x l e y 模型进行了很好的模拟,与 实际的生物系统非常相似【3 3 1 ,后一种在应用上比较容易实现。 2 1 3s r m 模型应用 s r m 模型比较容易实现,利用尖峰时间力在尖峰模型输入值的不断 变化阶段中保存所需信息,没有把其他条件加入其中。 一般使用尖峰响应符号s 表示p s p 信号,描述如下: 占( f ) :t( f )( 2 2 )占( f ) = 7 ( f )( 2 2 ) 用日( f ) 表示步长的函数,一旦满足t 0 ,那么就有h ( f ) = l ,相反 日( f ) = 0 ;f 表示输入信息定值,用来表示p s p 信号不断减小时刻。 图2 2 一般的p s p 信号, 图2 2 描述了一般的p s p 信号,p s p 信号是由神经元发出的,经过 连接突触发送到其他单元,p s p 信号的大小在发送阶段中为固定不变的。 在这个过程中p s p 信号的发送突触连接能够确定延时时间段,这个延时 时间段既能够不断变化,也能够确定为一定值,输出值通过上述时间段 后会影响输出值对突触后模型的功能。图2 3 描述了加入延时段后的p s p 第2 章尖峰神经网络 信号。 图2 3 加入延时段后的p s p 信号。 可以通过突触连接权值的调整改变突触后神经元输出信号受p s p 信 号的影响强度。突触前的神经元称为父神经元,突触后的神经元称为子 神经元,如果父神经元激励子神经元,那么可以认为此时的连接权值是 正的,同时会产生e p s p 信号;如果父神经元抑制子神经元,那么可以认 为此时的连接权值是负的,同时产生i p s p 信号。上面父神经元对子神经 元的激励和抑制正好符合生物神经元的机理。 2 2 尖峰神经元的神经网络 以尖峰神经元构成的神经网络就是把尖峰时间元当作信息载体完成 处理和交流的,把这种神经网络定义为尖峰神经网络。图2 - 4 ( a ) 描述了具 有输入层、隐含层和输出层的尖峰网络模型,他们分别用符号i 、h 、o 表示。但是,对于这几层之间的连接,有两种结构。 第一种是前馈网络结构 3 4 , 3 5 ,如图2 - 4 ( b ) 所示,利用的是多突触的结 构来进行连接。这种网络结构一定数目的n 个突触之间的子连接包含在 不同相互连接的神经元中间,而且这些子连接包含不一样的连接的权值 和突触的延时( 从o 到以1 毫秒) 。 武汉 二程大学硕士学位论文 ,、。 z 二广 、 太二r 乃 、 l 一 - 厂、。 气、岐d 七 ( a )( b ) 图2 4 ( a ) 一般尖蜂神经网络;( b ) 连接的详细结构。 第二种采用的是简单一点的结构,如图2 - 5 ( b ) 所示,这种结构的相互 连接的不同神经元之间与多突触连接的前馈网络结构不同的是包含的不 是多突触丽是单个突触连接,既只存在单个的连接的权值和突触的延时。 他们各有各的优缺点:前种结构网络的结构的比较复杂,而且在处理 中要求变化的系数不少,不便于学习;但后一种结构不存在上述的一些 情况。 。弧 一iho ( a ) ( b ) 图2 5 ( a ) 简单的尖峰神经网络:( b ) 连接豹详细结构。 在上述尖峰网络简化结构中,用字母表示尖蜂神经元,用符号0 ; 示一群神经元集合,在时刻0 接受其他神经元传递过来的很多p s p 信 然后其反应可用下面公式表示: 1 6 第2 章尖峰神经网络 一( f ) = w i y i ( t ) i e r j 咒( f ) = c ( t f f 一叱) 一旦输入信号_ ( f ) 大于设定值的时候, 出时刻0 表示为: ( 2 3 ) ( 2 4 ) 神经元就会发出s p i k e ,把发 x j ( t j ) 铂且等 o 一 ( 2 5 ) 上面公式中的表示f 到的连接的权值,咒( f ) 表示f 发出的神经元信 号,其中办表示突触的延时,占( f ) 表示常量,是神经元f 发出的尖峰时 刻,突触延时能够在整个过程内任意表示。而且这个结构中一切的神经 元的设定值1 9 是不发生改变的。 2 3 尖峰神经网络的编码方式 尖峰神经网络的输入值和输出值都通过确定的尖峰时间元进行处理 并编码的,因此,尖峰神经网络结构的重点就是对各种变量处以时间上 的编码。通常使用高斯接受域对输入变量和输出变量处以s p i k e 编码和处 理,上述过程能够很好的表现实际神经元的很多特点【3 6 1 。 例如用n 个尖峰神经元对特定输入变量进行编码,则采用上述的内 容进行处理的具体步骤如下所示: ( 1 ) 首先得到上述n 个尖峰神经元表示的高斯函数,设定“为上述函数的 均值,o - 为方差: u = 圪i 。+ ( 2 i - 3 ) ( 毪。一c 。) 2 ( m - 2 ) ,f = l ,2 ,m ( 2 6 ) 盯= ( i 。x 。一瑶。) p ( m - 2 ) ,p = 1 5 ( 2 7 ) ( 2 ) 然后通过特定计算出输入量x 表示的n 个高斯函数值,表示 g ( x ) 1 ,g ( x ) 2 ,g ( j ) ”; ( 3 ) 接着将上述得到的g ( 石) 1 ,g ( x ) 2 ,g ( 石) ”规划到【o 1 】,用g ( x ) g 啪。进行规 化,f 1 聊】,钆表示g ( x ) ,g ( x ) 2 ,g ( x ) ”中的最大值,规化后的值用 武汉i t 程人学硕士学位论文 g ( x ) ,g ( x ) 2 ,g ( x ) 1 ”表示。 ( 4 ) 最后通过g ( z ) 值,对尖峰时间进行赋值;如果g ( x ) 1 的值是最小值, 那么把尖峰时间编码设为l o 毫秒;如果g ( x ) “的值是最大值,那么把尖峰 时间编码设为o 毫秒;如果g ( 力h 的尖峰时间比9 毫秒大,就说明神经元 不会发出任何s p i k e 信号。 2 4 尖峰神经网络算法研究 2 4 1s p 算法 图2 6 编码过程显示 尖峰神经网络模型的学习算法一般使用s p i k e p r o p 算法,但是很多学 者对这个算法进行深入的研究并提出了很多思想【3 7 】。 尖峰神经网络一般包括三层结构,包括输入层、隐含层和输出层, 分别用符号h 、i 、j 表示,相邻神经元之间存在很多神经连接突触,其 中任何一个连接突触都被认为是独一的,并且其值可用以表示。例如, 给这个模型输入一群集合 只h 】 ,只h 厶】是一群尖峰时间集合,用来 对传入数据集合的进行时间的编码尖峰时间集合,传入数据集合满足输 入层刀h 。针对传入数据信号,用f t d ,l 定义模型设定的要求结果,用t ;表 示尖峰神经元的尖峰时刻,结果满足,j 第2 章尖峰神经网络 描述这个模型整个误差为: = 寺( 巧一形) 2,“u j zr 州 ( 2 8 ) 上式中,f ;表示模型的结果。以往的网络模型,模型的误差改进算法 对误差的改进应该通过下列公式进行: 瞄叫嚣 ( 2 9 ) 上式中的r 表示神经网络模型的学习率。这个学习规则是在传统规则 基础上的加强算法,这种规则具体可以用下面4 个步骤进行表述: ( 1 ) 针对任何地结果歹,如下式得到嘭: 旷虿。而2 5 筋赫彬奶( 眵) 嘭( 别( 哆) 彬) ( 2 ) 针对任何剩下的i ,如下式得至慨; 万 。蝣( 硝( f ;) 钟) ) u 厂, 4 爰h i ( 酬( 乍) 钟) ( 3 ) 针对,如下式改变蝣: 嘁= 1 y :q j j ( 4 ) 针对剩下的,如下式改变喊: 以= 一刁y 。k ( ) 4 ( 2 1 0 ) ( 2 1 1 ) ( 2 1 2 ) ( 2 1 3 ) 从上面的步骤可以看出上述的s p 规则就是将以往的误差改进规则和 尖峰神经网络进行综合的结果,使用特定的数据对尖峰神经网络的系数 改变,在处理了要求的问题的同时又让该算法免于进入了局部最优的困 1 9 武汉工程大学硕士学位论文 境。在于连接权值的使用上,一旦利用负的,输出单元就会对输入单元 不仅产生激励效果而且还会产生抑制的效果,导致输入单元的结果一( f ) 不存在很好的特性,s p 算法特点体现不出来,所以尖峰网络模型最好利 用正值。在应用到现实环境中的时候,上述情况就会大大左右s p 算法的 实用性。 2 4 2 粒子群算法 十多年前j a m e sk e n n d e y 和r u s s e l le b e r h a r t 3 8 】给出了粒子群算法 ( p s o ) 的一般定义。经过进一步的研究, y s h i 和r e b e r h a r t 在几年后又 对该思想提出了很好的改进【3 9 1 。p o s 算法的核心过程是粒子群里单个粒 子相互的作用和影响,从而得到所要求的结果,这种算法非常迅速而且 十分有效果。该算法可以描述为:第步产生原始的粒子群,原始的粒 子群的生成机理就是随机产生一粒子群,这群粒子中的任意一个粒子不 断寻找问题的可行解,利用特定数值表示对应的满足值,这样方便决定 其中时候有一个粒子寻找到了要求的结果。这群粒子中的任何粒子都将 在特定的空间中不断地寻找,定义某矢量表示位移和方向。在粒子群中 粒子们都跟随目前的最优解,就这样一段时间的运行后获得要求的结果。 整个算法过程里面,粒子群中的每个单元追随两个目标,表示该单元自 身对追随目标的了解的当前的最优解;表示整个种群所了解的最优解。 对于尖峰网络模型,定义任意对应的模式,然后用上述思想改变尖 峰网络模型的突触的延时和连接的权值,从而规划尖峰网络模型,得到 想要的结果,用尖峰单元表示各种信息。 般设定模型的传入数据集用 # 【厶】) 表示,f 传入数据是# f 。】, 传入数据满足刀,。针对任何传入数据,用) 表示尖峰模型所要求的结 果,f ;是,输出结果的尖峰时刻,尖峰单元满足_ ,d 。可利用下列的式子 对粒子的满意值处理: e = 吉( 哆一巧) 2 ( 2 1 4 ) l 、i e nj e o 上式中表示输入数据的总数。 第2 章尖峰神经网络 在尖峰网络模型实际应用中,第一步随机初始化粒子群,即初始化 粒子群中单元的突触和权值,这些值都必须设定在系统大小内,取值的 同时可以顺便确定上述变量的改变率。第二步,任意单元在系统要求的 空间不断变化,通过不断比较后使得尖峰网络模型能够演变成符合要求。 该算法与s p 不同,其不要求网络的连接的权值,就是说正值和负值对整 个模型没有影响,这个特点更加表现出了实际神经元的抑制和激励特点。 本童小结 本章先介绍了尖峰神经网络的基本概念和尖峰神经网络的的编码方 法。尖峰神经网络的编码使用很多不同的神经元对特定变量进行处理, 其中许多单元是不起作用的,这样做能够很好的表示了实际神经元的特 点。其次,对尖峰网络模型的训练规则

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论