已阅读5页,还剩47页未读, 继续免费阅读
(计算机应用技术专业论文)基于局部搜索法的倒立振子模糊控制器改进研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
山东大学硕士学位论文 摘要 人工神经网络( a r t i f i c i a ln e u r a ln e t w o r k ) 是信息科学与高技术研究领域中 一门令人瞩目的新兴学科,它是一种在对人脑组织结构和运行机制的认识理解基 础之上模拟其结构和智能行为的工程系统近年来,模糊神经网络因为其在机械、 航天控制领域里的独特优势而成为该领域一个新的研究热点。随着诸如城市地铁 系统、核反应控制系统和汽车传动控制系统的研究日趋完善,基于模糊控制方法 的应用也日益增多,人们对模糊控制网络的设计与实现也进行了更为深入的研究。 在神经网络控制领域,倒立振子控制问题因为其代表性和复杂性,一直是一 个典型的热点和难点问题。因此,神经网络控制领域里每一种新方法的提出,都 倾向于把能否有效解决倒立振子控制问题作为衡量算法是否有效的一个标准。就 目前的研究情况来看,已经提出了很多方法来解决这一课题,其中包括a n d e r s o n 的a h c ( a d a p t i v eh e u r i s t i cc r i t i c ) 方法:p e n gj 的基于动态规划的学习方法: 反馈b p 网络算法:传统的局部搜索算法,q 学习算法,智能控制规则算法和李德毅 教授的云模型控制方法等。但是,在既有的这些方法中,都存在一定的缺陷,比 如a h c 方法不能有效解决网络陷入局部最小值问题。基于动态规划的方法收敛速 度较慢,超过了实际应用中可以忍受的时间维度,而传统的局部搜索算法又不能 成功解决初始大角度控制问题。 在本论文中,我们借鉴了前人控制模型和算法的有益经验,同时针对以往既 有算法的缺点,提出一种改进的网络控制模型和算法解决方案来解决倒立振子控 制问题。我们的创新工作主要体现在两个方面,一方面是对于模糊控制模型规则的 重新构建,在前人提出k i l r 算子的基础之上,我们对以往的两模糊态四规则的传 统模型进行了重新细化,构建出四模糊态十规则的模糊控制模型,从而使控制过 程更为精确和灵敏,加快了控制速度。另外一方面是对于控制算法的改进研究, 我们针对传统局部搜索算法常常陷入局部最小值而导致学习失败的弊端,提出了 改良局部搜索算法,这种方法通过将学习过程中的固定步长改为可变步长,有效 解决了模糊控制网络经常陷入局部最小值而导致无法收敛的问题,从而大大提高 了神经网络的学习收敛速度和学习成功率。 第1 页 山东大学硕士学位论文 本论文首先介绍了与倒立振子控制相关的神经网络知识,分析了当前国际上 对于倒立振子控制问题的研究现状以及各种控制方法的优缺点然后详细阐述了 四模糊态十规则模糊控制网络的构建过程,同时给出了控制模型中各层控制参数 获取的详细数学推导。在模型构建过程阐述完毕后,我们通过图示和对比数据分 析了传统局部搜索算法的弊端,同时着力描述了我们算法的主要改进思想。最后, 我们将通过给出多组实验数据来验证控制模型和改进算法的有效性。 关键词:人工神经网络、模糊控制网络、局部搜索算法、倒立振子 第儿! i f 山东大学硕士学位论文 a b s t r a c t a r t i f i c i a ln e u r a ln e t w o r k ( a n n ) i sas i g n i f i c a n tn e ws u b j e c ti nt h ef i e l d o fi n f o r m a t i o ns c i e n c ea n dt e c h n o l o g y i ti sas y s t e mb a s e do nt h es t u d y a n ds i m u l a t i o na b o u tt h ea r c h i t e c t u r ea n df u n c t i o nm e c h a n i s i l lo fh u m a nb r a i n i nt h er e c e n ty e a r s ,f u z z yn e u r a ln e t w o r kh a sb e c o m ean e wr e s e a r c hh o t s p o t o fm a c h i n ea n da v i a t i o nc o n t r o l f i e l db e c a u s eo fi t ss p e c i a la d v a n t a g e s n o wa p p li c a t i o n sb a s e do nt h ef u z z yl o g i cc o n t r o li n c r e a s eq u i c k l ya n dt h e r e s e a r c h e ss u c ha sc i t ys u b w a ys y s t e m ,n u c l e a rr e a c t i o nc o n t r o ls y s t e ma n d a u t o m o b i l ed r i v i n gs y s t e mg op e r f e c ts t e pb ys t e p s c i e n t i s t sa r ed o i n g f u r t h e rr e s e a r c hi nt h ed e s i g na n dr e a l i z a t i o no ff u z z yc o n t r o ln e t w o r k i nt h en e u r a ln e t w o r kc o n t r o la r e a ,t h ec o n t r o lo fi n v e r t e dp e n d u l u mi s a l w a c o m p i n c l at y p i c a lh o tb u td i f f i c u l tp r o b l e mf o ri t sr e p r e s e n t a t i v ea n d x it y t h e r e f o r e 。e v e r yn e wi d e ao ra l g o r i t h mo fn e u r a ln e t w o r k e dt oc h e c ki t sv a l i d i t yb ys o l v i n gt h ei n v e r t e dp e n d u l u mp r o b l e m m a n ym e t h o d sh a v eb e e np r e s e n t e dt os o l v et h i sp r o b l e ms u c ha sa n d e r s o n s a h c ( a d a p t i v eh e u r i s t i cc r i t i c ) m e t h o d ,p e n gj sd y n a m i cp r o g r a m m i n g m e t h o d , b pn e t w o r ka l g o r i t h m ,t r a d i t i o n a ll o c a ls e a r c ha l g o r i t h m , q - e a r n i n ga l g o r i t h m ,i n t e l l i g e n tc o n t r o lr u l e sa l g o r i t h ma n dp r o f e s s o r l i s c l o u d m o d e l c o n t r o la l g o r i t h me t c h o w e v e r ,t h e r ea r es o m e d i s a d v a n t a g e si nt h o s em e t h o d so ra l g o r i t h m s f o re x a m p l e ,t h ea h cm e t h o d c a nn o ts o l v et h el o c a lm i n i m u mp r o b l e me f f e c t i v e l y t h ed y n a m i c p r o g r a m m i n gm e t h o di sv e r ys l o w l ya n dy o ue v e nc a nn o tb e a rw i t hs u c ha l o n g t i m ei nt h e a c t u a l a p p l i c a t i o n s t h et r a d i t i o n a l l o c a l s e a r c h a l g o r i t h mc a nn o ts o l v et h ei n i t i a lb i ga n g l ep r o b l e ms u c c e s s f u l l y i nt h i sp a p e r ,w eb o r r o w e dt h eu s e f u le x p e r i e n c e so fc o n t r o lm o d e l sa n d a l g o r i t h m sf r o mf o r m e rr e s e a r c h e r sa n da tt h es a m et i m ew eo v e r c o m es o 鹏 d i s a d v a n t a g e so fo l d m e t h o d s w ep r o p o s e da ni m p r o v e dn e t w o r kc o n t r o lm o d e l a n da l g o r i t h mt os o l v et h ei n v e r t e dp e n d u l u mp r o b l e m o u rm a i ni n n o v a t i v e 山东大学硕士学位论文 w o r kli e si nt w oa s p e c t s f i r s t ,w er e c o n s t r u c tt h ef u z z yc o n t r o l r u l e s b a s e do nt h eu l ru n i t w ec h a n g e dt h eo l dm o d e lo ft w of u z z ys t a t e sa n d f o u rc o n t r o lr u l e sa n dp r o p o s e dan e wm o d e lo ff o u rf u z z ys t a t e sa n dt e n c o n t r o lr u l e s i tm a k e st h ec o n t r o lp r o c e s sm o r ea c c u r a t e ,s e n s i t i v ea n d m o r eq u i c k l y s e c o n d ,w ed os o m ei m p r o v e dr e s e a r c ho nt h ec o n t r o la l g o r i t h m w ep r o p o s e da ni m p r o v e dl o c a ls e a r c ha l g o r i t h mt os o l v et h ep r o b l e mo f t r a p p i n gi n t ol o c a lm i n i m u mi nt h et r a d i t i o n a ll o c a ls e a r c ha l g o r i t h m t h e n e wa l g o r i t h ms o l v e st h el o c a lm i n i m u mp r o b l e ms u c c e s s f u l l yb yc h a n g i n g t h ef i x e ds t e pt oa l t e r a b l es t e pd u r i n gt h el e a r n i n gp r o c e s s i tc a nm a k e t h el e a r n i n gp r o c e s sm o r eq u i c k l ya n di n c r e a s et h es u c c e s s f u ll e a r n i n g r a t e t h i sp a p e rw i l li n t r o d u c et h er e l a t e dn e u r a ln e t w o r kk n o w l e d g ea b o u tt h e i n v e r t e dp e n d u l u mp r o b l e mf i r s t l ya n da n a l y z et h ei n t e r n a t i o n a lr e s e a r c h s i t u a t i o na n da d v a n t a g e so rd i s a d v a n t a g e so fs o m am e t h o d sa b o u t i n v e r t e d p e n d u l u mc o n t r o lp r o b l e m w ew i l le x p l a i nh o ww ec o n s t r u c tt h ef o u rf u z z y s t a t e sa n dt e nc o n t r o l r u l e sn e t w o r km o d e li nd e t a i la n da tt h es a m et i m e w ew i l lg i v et h em a t h e m a t i c a lt h e o r yo fh o ww ec a nd e c i d et h ec o n t r o l p a r a m e t e r so fa l1c o n t r o ll a y e r s a f t e rt h a t w ew i11i1l u s t r a t et h e s h o r t c o m i n g so fl o c a ls e a r c ha l g o r i t h mb yc o n t r a s t i v ed a t a a n dt h e nw e w i i ip a ym o r ea t t e n t i o ni nt h em a i ni d e ao fo u rn e wa l g o r i t h m f i n a l l y , w ew i l lv c r 崎t h ev a l i d i t ya n de f f i c i e n c yo fo u tm e t h o d t h r o u g hs e v e r a lg m u p so fd a t a k e yw o r d :a r t i f i c i a ln e u r a ln e t w o r k ,f u z z yc o n t r o ln e t w o r k , l o c a ls e a r c ha l g o r i t h m ,i n v e r t e dp e n d u l u m 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不 包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研 究做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明 的法律责任由本人承担。 论文作者签名:差鎏互盈。 日期:望堕:丝:,歹 关于学位论文使用授权的声明 本人完全了解山东大学有关保留、使用学位论文的规定,同意学 校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论 文被查阅和借阅;本人授权山东大学可以将本学位论文的全部或部分 内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段 保存论文和汇编本学位论文。 ( 保密论文在解密后应遵守此规定) 论文作者签名:塞圣臼奠导师签名:日期:丛争1 g 山东大学硕士学位论文 1 引言 1 1课题的背景和意义 人的大脑是自然界所造就的最高级产物。人的思维是由人脑来完成的,思维 是人类智能的集中体现。研究表明,人的意识、思维、行为等脑的高级功能都与 客观世界密切相关。根据1 9 世纪末创建的神经元学说,人们认识到人脑是由大约 1 0 1 1 个神经元和1 0 1 4 - - 1 0 1 5 个突触组成的巨大系统【l j 神经元是以生物神经系统的 神经细胞为基础的生物模型。在人们对生物神经系统进行研究,以探讨人工智能 的机制时,把神经元数学化,从而产生了神经元数学模型。大量的形式相同的神 经元连结在一起就组成了神经网络神经网络是一个高度非线性动力学系统。虽 然每个神经元的结构和功能都不复杂,但是神经网络的动态行为则是十分复杂的; 囚此,用神经网络可以表达实际物理世界的各种现象。多少年来,人们从医学、 生物学、生理学、哲学、信息与计算机科学、认知学等各个角度试图认识人的大 脑和神经。在寻求研究的过程中,逐渐形成了一个新兴的多学科交叉技术领域, 人们称之为“人工神经网络”。作为一种崭新的信息处理方法,人工神经网络是对 过去4 0 余年中一直统治着信息处理的程序化计算的第一次挑战。实际上,自然界 提供给我们的信息处理问题可以分为两大类型:结构性问题和非结构性问题。前 者如数字计算机或方程求解,这正是冯诺依曼计算机善于解决的问题。后者如 语言或图形识别,人们无法把自己的认识翻译成严密的机器指令,因而难以用 冯诺依曼机获得满意的效果。神经网络计算机在处理非结构化问题方面显示出 了突出的优点。算法计算机和非算法计算机有着各自的长处和适当的应用领域, 目前二者还不能相互取代正是由于在信息处理和工业控制,机器人研究等若干 领域中利用冯诺依曼计算机遇到不少困难,而人工神经网络为解决这些问题提 供了一条具有潜力的新途径,因而引起了人们的巨大兴趣t 2 i 。当前,越来越多的科 技人员投入到人工神经网络这一研究领域。新的改进模型与理论不断提出,应用 范围不断扩大。人工神经网络研究高潮的到来标志着认知科学、计算机科学及人 山东大学硕士学位论文 工智能的发展又处于一个新的转折点。人工神经网络的应用和发展不但会雍丽雨 经动力学本身,而且将影响新一代计算机的设计原理,有可能为新一代计算机和 人工智能开辟一条崭新的途径。同时,它也为学习识别和计算提供了新的现代化 方法,有可能给信息科学带来革命性的变化。 由于倒立振子系统结构的特殊性以及控制的复杂性,传统的状态反馈控制方 法很难达到预期的控制效果,因此倒立振子系统被公认为自动控制理论中的一个 典型的试验设备,是控制理论教学和科研中不可多得的典型物理模型倒立振子 系统是一个复杂的高度不稳定的高阶非线性机械系统,由于它在结构上类似于人 的单足站立,对它的控制研究以及对两足机器人的开发和研究都具有非常重要的 意义。另外通过对倒立振子系统的研究不但可以验证各种控制方法的有效性,还 能够揭示许多在工业应用及机器人系统中存在的问题:如系统的非线性特性,执 行器的饱和现象,传感器具有标定误差现象以及系统中某些物理变量带有的约束 条件等,因此对倒立振子系统进行控制研究具有重要的理论意义和工业应用价值。 在该课题中,我们尝试用一种新的基于局部搜索算法的模糊控制模型,对9 0 度范 围内的倒立振子进行了模拟控制,达到了比较理想的控制结果,这是本课题提出 的背景和意义。 1 2本论文的工作与创新 在本论文中,我们分析了倒立振子控制问题,构建了基于u l r 的五层模糊控 制器模型,并且在该模型的基础上,提出了一种区别于传统搜索算法的局部改良 搜索法,我们成功的将该算法应用于振予的倒立控制,有效解决了模糊控制网络 经常陷入局部最小值而导致无法收敛的问题,从而大大提高了神经网络的学习收 敛速度和学习成功率。试验结果表明,我们的算法要明显优于传统的局部搜索算 法,可以很好的解决9 0 度范围内的倒立振子控制问题。 总的来说,我们工作的创新之处有两点:一个就是在前人提出u l r 算子模型 的基础上,构建了基于u l r 算子的包含四个模糊态和十个模糊规则的五层三角模 糊控制网络模型,实现了对一阶倒立振子的模拟控制。第二个是我们针对以往控 制方法特别是传统局部搜索算法的缺点提出了改良的局部搜索算法,这一算法改 山东大学硕士学位论文 变了固定步长的模式,学习过程中采用可变步长,从而可以使网络有效摆脱经常 陷入局部最小值而无法自拔的局面,大大提高了网络的学习速度和学习成功率。 1 3论文的组织结构 第一章论述了本课题提出的背景和意义,同时给出本论文的主要工作与创新, 阐述了解决该课题的创新性 第二章主要涉及与课题相关的背景知识,给出了神经网络的定义,简单介绍 了神经网络工作的控制特征,并且对几种常见的神经网络进行了阐述,本章最后 一部分对倒立振子控制问题目前的研究现状进行了分析 第三章对模糊神经网络进行了详细的说明,给出了模糊神经网络的基本概念 原理和结构模型。其中重点对多种神经元组成的神经模糊控制器及网络中各层的 作用进行了说明 第四章对本文要解决的问题倒立振子控制问题进行了说明并且给出了该 问题的主要物理模型和参数变量。 第五章详细说明了基于u l r 算孑的模糊神经网络控制器是如何构造出来的, 拙述了其构造方法和数学原理。 第六章阐述了改良局部搜索算法的理论依据及其主要原理并且通过两组试验 数据与传统搜索算法的控制结果进行了比较。 第七章集中给出了我们所设计的模糊控制器网络原型和多组试验数据,这些 数据可以很好的验证算法的控制结果。 第八章总结我们所做的工作,得出结论并且对这一课题和方法的未来发展做 一下预测。 2 课题相关的背景知识 2 1 人工神经网络 大家知道,人类是地球上具有最高智慧的生物,而人的智能均来自于大脑, 山东大学硕士学位论文 人类是靠大脑进行思考、联想、记忆和推理判断的,这些功能是任何破称作“电 脑”的一般计算机所无法取代的。长期以来,很多科学家一直致力于人脑内部结 构和功能的探讨研究,并试图建立模仿人类大脑的计算机,直到目前为止人们对 大脑的内部工作机理还不甚清楚,但对其结构已经有所了解。粗略来讲,人脑由 大量( 约1 0 1 1 个) 高度互连的单元( 每个单元约有1 0 4 个连接组成) ,这些单元被 称为神经元。每个神经元可看作一个小的处理单元,大脑的学习过程就是神经元 之间连接强度随外部激励信息做自适应变化的过程,大脑处理信息的结果却由神 经元的状态表现出来【3 】显然,神经元是信息处理系统的最小单元。虽然神经元的 类型有很多种,但其基本结构相似,如图2 - - ! 所示 幽2 一i 神经元结构示意图 一个神经细胞是由细胞体、树突、轴突和细胞之间相互关联的突触构成的。 细胞体内有细胞核、细胞浆、细胞膜等组成,突触的作用是传递信息。作为引入 输入信号的若干个突起称为“树突”或“晶枝”,而作为输出端的突起只有一个称 为轴突。树突是细胞体的延伸部,它e b 细胞体发出后逐渐变细,全长各部位都可 与其他神经元的轴突末梢相互联系,形成所谓“突触”( s y n a p s e ) 。在突触处两神 经元并未连通,它只是发生信息传递功能的结合部。突触可分为兴奋性与抑制性 两种类型,它相应于神经元之间耦合的极性。兴奋性的突触是指当神经细胞有冲 动传递时,他能使突触后成分极化,产生兴奋性突触后电位,可能引起下一个神 经细胞兴奋。抑制性的突触能使突触后成分超极化,产生抑制突触后电位,使下 山东大学硕士学位论文 一个神经细胞抑制。每个神经元的突触数目不等,最高可达l 矿个兴奋性突触在 脉冲刺激下,对下一个神经细胞产生兴奋性突触后的电位变化,抑制性突触在脉 冲刺激下产生抑制性突触后的电位变化很多神经细胞通过各自的突触对某一个 神经细胞的作用,都形成该神经细胞的后电位变化,电位的变化是可以累加的, 该神经细胞后电位是它所有的突触产生的总和,当该神经细胞的后电位升高到超 过一个阈值,就会产生一个脉冲。从而总和的膜电位直接影响该神经细胞兴奋发 放的脉冲数。一般来说,每个神经细胞的轴突大约连接1 0 0 一1 0 0 0 个其他神经细 胞,神经细胞的信息就是这样从一个神经细胞传递到另一个神经细胞的1 4 j 。 在人的大脑中约有1 4 0 亿个神经细胞单元,根据s t u b b a l 4 的估计,这些神经细 胞被安排进约1 0 0 0 个模块内,每个模块有上百个神经网络,每个网络约有1 0 万 个神经细胞,信息的传递从一个神经细胞传到另一个神经细胞,从一个类型的神 经细胞传到另一类的神经细胞,从一个网络传到另一个网络,有时从一个模块传 到另一个模块。 一些神经结构是与生俱来的,而其他部分则是在学习的过程中形成的。在学 习的过程中,可能会产生一些新的连接,一些连接也可能会消失。这个过程在生 命早期最为显著。比如,如果在某一关键的时期内禁止一只小猫使用它的某一只 眼腑,则它的这只眼在以后很难形成正常的视力。 神经结构在整个生命期内不断的进行蓍改变,后期的改变主要是加强或减弱 突触连接。例如,现在已经确认,新记忆的形成是通过改变突触强度来实现的。 所以,认识一位新朋友面孔的过程中包含了各种突触的改变过程。 正是受到人脑工作机理的启发,人们开创了人工神经网络这一全新学科。人 工神经网络虽然不像人脑那么复杂,但他们之间有两个关键的相似之处。首先, 两个网络的构成都是可计算单元的高度互连( 虽然人工神经单元比生物神经单元 简单得多) 。其次,处理单元之间得连接决定了网络的功能。 我们可以这样说,人工神经网络是在人类神经系统的基础上,对于这样一种 多输入、单输出的基本单元进一步从生物化学、电生物学、数学等方面给出描述 并建模。它采用可实现的器件和现有的计算机来模拟生物体中神经网络某些结构 与功能,并反过来用于工程或其他领域。人工神经网络的着眼点不是用物理器件 去完整的复制生物体中神经细胞网络,而是采纳其可利用的部分来克服目前计算 山东大学硕士学位论文 机或其他系统不能解决的问题,如学习、识别,控制、专家系统等。为了更确协 起见,美国神经网络学家h e c h tn i e l s e n 给出了如下定义:神经网络是由多个非常 简单的处理单元彼此按照某种方式相互连接而形成的计算机系统,该系统靠其状 态对外部输入信息的动态相应来处理信息【5 】。而著名的神经网络学家t k o h o n e n 教授,则是这样定义的:是由简单单元组成的广泛并行互连的网络,能够模拟生 物神经系统的真实世界所做出的交互反应【6 j 。 2 2神经网络模型概述 2 2 1 前向型神经网络 前向型神经网络是整个神经网络体系中最常见的一种网络结构,其网络中各 个神经元接受前一层的输入,并输出到下一层,网络中没有反馈。根据学习方法 的不同,常用前向型神经网络可以分为以下几种: 感知器网络感知器是最早提出的一种神经网络模型,特别适用于简单的 模式分类问题。感知器学习规则属于有监督学习类型,其中学习规则用一组正确 反映网络行为的实例的方式提供。当每个输入送入网络后,该规则调整网络参数, 使网络的实际输出逐步接近相应输入的目标值 线性神经网络主要用于函数逼近、信号处理滤波、预测、模式识别和控 制等方面。 b p 网络反向传播算法是神经网络研究中的重大进展,可以用来训练多层 网络。但是它的一个主要问题是需要较长的训练时间,使用基本反向传播算法求 解实际问题是不可行的,因为它需要用几周的时间来训练网络。在人工神经网络 的实际应用中,绝大部分的神经网络模型是采用b p 网络和它的变化形式。b p 算法 的改进主要有两种途径:1 ) 采用启发式学习方法;2 ) 采用更有效的优化算法【7 i 。 尽管如此,b p 网络在解决几类典型问题上仍然有自己的优势,b p 网络模型主要应 用于: 函数逼近用输入矢量和相应的输出矢量训练一个网络逼近一个函数。 模式识别用一个特定的输出矢量将它与输入矢量联系起来。 数据压缩减少输出矢量维数以便于传输或存储。 山东大学硕士学位论文 径向基函数网络( r a d i a lb a s i sf u n c t i o n ,r b f ) b p 网络用于函数逼近时, 权值的调节采用的是负梯度下降法,这种调节权值的方法有它的局限性,如学习 过程易陷入局部最小、学习算法的收敛速度很慢、学习过程易出现震荡现象等。 而径向基函数网络无论在逼近能力,分类能力和学习速度等方面均优于b p 网络 所以现在很多的文章中都使用径向基函数网络。孟伟等人在基于人工神经网络 与证据理论相结合的数据融合中的辐射源识别方法研究中就是使用径向基函数 神经网络对辐射源进行识别。 从理论上讲,r b f 网络和b p 网络一样可以近似任何的连续非线性函数。两者的 主要差别在于各使用不同的作用函数,b p 网络的隐含层节点使用的是s i g m o i d 函 数,其函数值在输入空间中无限大的范围内为非零值,而r b f 网络的隐含层节点中 的作用函数( 核函数) 对输入信号只在局部产生响应,也就是说,当输入信号靠 近核函数的中央范围时,隐含层节点将产生较大的输出。由此可看出这种网络具 有局部逼近能力,所以径向基函数网络也称为局部感知场网络。 支持向量机( s u p p o r tv e c t o rm a c h i n e ,s v m ) s v m 是2 0 世纪9 0 年代中期在 统计学习理论的基础上提出的一种新的学习算法,它应用于模式分类问题和非线 性同归,可以看作是感知器的推广。在线性可分的情况下,就是建立一个超平面 使得可分的两类数据到该平面的距离最小。通常称该平面为最优分离超平面。对 于非线性问题,是通过一个非线性映射把原始数据映射到另一个称之为特征空间 的新数据集上,使得新数据集在该特征空间上是线性可分的,由此建立的最优分 离超平面在原始空间内就是一个超曲面【8 j 2 2 2 反馈型神经网络 反馈网络又称递归网络,或回归网络。在反馈网络中( f e e d b a c kn n ) ,输入 信号决定反馈系统的初始状态,然后系统经过一系列状态转移后,逐渐收敛于平 衡态。这样的平衡状态就是反馈网络经计算后的输出结果,由此可见,稳定性是 反馈网络中最重要问题之一。如果能找到网络的l y a p u n o v 函数,则能保证网络从 任意的初始状态都能收敛到局部最小点。e l m a 网络和h o p f i e l d 神经网络是反馈网 络中最有代表性的例子。 e l m a n 神经网络其结构如 2 - - 2 所示,它具有与m l p 网络相似的多层结 山东大学硕士学位埝文 下文层或状态层。该层从普通隐含层接受反馈信号,上下文层内的神经元输出被 前向至隐含层。如果只有正向连接是适用的,而反馈连接被预定为恒值,那么这 些网络可视为普通的前馈网络。而且,可以用b p 算法进行训练;否则,可采用遗 传算法。闫巧等人在基于系统调用的神经网络异常检测技术中就是采用e l m a n 神经网络建立程序行为的轮廓。 输入单元隐含层单元输出单元 图2 - 2e l m a n 网络结构 h o p f i e l d 神经网络主要用于模拟生物神经网络的记忆机理。如果可把 l y a p u n o v 函数定义为寻优函数的话,h o p f i e l d 网络特别适用于解决模式识别和快 速寻优的问题。在解决每一个具体问题时,它先选择一种合适的表示算法,使神 经元网络的输出与问题的解对应起来,然后构造网络的能量函数,使其最小值对 应于问题的最佳解,最后建立起网络,令其运行,那么学习后达到的稳定状态就 是在一定条件下问题的解答【们 2 2 3 自组织与l v o 神经网络 自组织神经网络( s e l f - o r g a n i z i n gn n ) 是无教师学习网络,它模拟人类根 据过去经验自动适应无法预测的环境变化。因为没有教师信号,这类网络通常利 用竞争的原则进行网络的学习。 山东大学硕士学位论文 自组织竞争网络它的形成也是受生物神经系统的启发,之所以称为自组 织竞争人工神经网络,是因为它一般是由输入层和竞争层构成的两层网络。 自组织竞争人工神经网络的基本思想是:网络竞争层各神经元竞争对输入模 式的响应机会,最后仅有一个神经元成为竞争的胜者,并对那些与获胜神经元有 关的各连接权朝着更有利于它竞争的方向调整,这样获胜神经元就表示对输入模 式的分类。除了竞争方法外,还有通过抑制手段获胜的方法,即网络竞争层各神 经元都能抑制所有其他神经元,从而使自己成为获胜者。此外,还有一种侧抑制 的方法,即每个神经元只抑制与自己相邻的神经元,而对远离自己的神经元则不 抑制【1 0 】。因此,自组织竞争人工神经网络自组织自适应的能力迸一步拓宽了神经 网络在模式识别、分类方面的应用。 自组织特征映射神经网络( s e l f - o r g a n i z i n gf e a t u r em a p ,s o m 网络) 这 种网络是一种竞争式学习网络,它模拟大脑神经系统自组织特征映射的功能,在 学习中无监督地进行自组织学习。自组织特征映射网络应用广泛,可用于语言识 别、图像压缩、机器人控制、优化问题等。例如:h e l s i n k iu n i v e r s i t yo f t e c h n o l o g y n e u r a ln e t w o r k s r e s e a r c hc e n t e r 的k r i s t al a g u s 在t e x tr e t r i e v a lu s i n g s e l f - o r g a n i z e dd o c u m e n tm a p s 就是使用了s o m 算法。 自适应共振理论( a r t ) a r t 网络是一种向量模式的识别器,它根据存储 的模式对输入向量进行分类,其简化的结果如图2 - - 3 所示。当存储的模式中有的 模式和输入模式相匹配时,代表该存储模式的参数就被调整以更接近输入模式。 反之,如果在存储模式中,没有发现和输入模式相匹配的模式时,则输入模式作 为新的模式被存储到网络中,其他的模式保持不变【i 。 山东大学硕士学位论文 警戒线 x 幽2 - 3a r t 网络的简化结构 学习向量量化网络( 1 e a r n i n gv e c t o rq u a n t i z a t i o n ,l v q 网络) l v q 是监督学习技巧,它使用分类消息来轻微移动v o r o n o i 向量,以便提高分类器 的决策区域质量。从输入空间随即抽取一个输入向量x 。如果输入向量x 的类别标 号和v o r o n o i 向景w 符合,v o r o n o i 向量w 向输入向量x 的方向上移动。如果相反,输 入向最x 的类别标号雨l v o r o n o i 向量w 不符合,v o r o n o i 向量x 背离输入向量x 的方向 移动。 l v q 网络由两层组成,第一层为竞争层,第二层为线性层。竞争层能够学习对 输入向量的分类,这与前面的自组织竞争网络非常相似线性层将竞争层传来的 分类信息转变成使用者所定义的类别。将竞争层学习得到的类称为子类,将线性 层学习得到的类称为目标类。 2 3 神经网络的控制特征 人工神经网络是由大量称为神经处理单元的自律要素以及这些自律要素相互 作用形成的网络。它是在多年来对神经科学研究的基础之上,经过一定的抽象、 简化与模拟的人工信息处理模型。它反映了人脑功能的某些基本持性,却又不是 人脑的真实写照。必须指出,人工神经网络绝对不是任何意义的人脑的神经网络 或其它生物脑。为了更好的帮助我们了解神经网络控制的本质,这里我们简要介 山东大学硕士学位论文 绍一下人工神经网络与人脑生物网络的区别及其基本数学特征: ( 1 ) 大规模并行处理 人脑神经元之间传递脉冲信号的速度远低于冯诺依曼计算机的工作速度, 但是,由于人脑是一个大规模并行与串行组合处理系统,因而,在许多问题上可 以做出快速判断、决策和处理,其速度可以远高于串行结构的冯诺依曼计算机。 人工神经网络的基本机构与目前的计算机根本不同,它是由很多小的处理单元互 相连接而成,每个处理单元功能简单,但大量简单的处理单元集体的、并行的活 动得到预期的识别、计算的结果,可以大大提高工作速度。 一( 2 ) 分布式存储 一一 一一一 人脑存储信息的特点是利用突触效能的变化来调整存储内容,也即信息存储 在神经元之间连接强度的分布上,存储区与运算区合为一体。虽然人脑每日有大 量神经细胞死亡,但不影响大脑的功能,局部损伤有可能引起功能的衰退,但不 会突然丧失功能。冯诺依曼计算机具有相互独立的存储器,知识存储与数据运 算互不相关,只有通过人的编程给出指令使之沟通,这种沟通不能超过程序编辑 者的预想。元件的局部损伤或程序中微小错误可能引起严重的失常。由于神经网 络模拟了人脑的部分功能,使得它工作时所记忆的信息是存储在神经元之问的权 巾,从单个的权中看不山存储的信息内容,因为它的存储方式也是分布式的。从 而使得它具有很强的容错性,即局部的或部分的神经元损坏以后,不会影响全局 的活动1 1 2 l 。 ( 3 ) 自适应( 学习) 过程 人脑有很强的自适应与自组织特性。后天的学习与训练可以开发许多各具特 色的活动功能。如盲人的听觉和触觉非常灵敏,聋哑人善于运用手势等等。冯诺 依曼计算机强调程序编写,系统的功能取决于程序给出的知识和能力。显然,对 于上述智能活动要通过总结编制程序将非常困难。但是,神经网络具有十分强的 学习功能,在人工神经网络中,连接权和连接的结构都可以通过学习而得到。 神经网络工作过程主要是由工作期和学习期两个阶段组成。工作期指的是各 连接权值固定,计算单元的状态在改变,以求达到稳定状态,也可以说用该网络 来解决实际的问题。学习期( 自适应期或设计期) 指的是各计算单元状态不变, 各连接权值可以修改( 通过学习样本或其他方法) 。工作期较快,称这种各单元 山东大学硕士学位论文 的状态为短期记忆( s t m ) ,学习期相对来说速度要慢的多,称这种权及连接方式 为长期记忆( l t m ) , ( 4 ) 基本数学特征 a ) 非线性:人工神经元可以表述为激活和抑制两种基本状态,这就是一种非 线性关系。 b ) 非局域性:人工神经网络系统是以人工神经元之间的相互作用表现信息的 处理和存储能人。系统的整体行为不仅取决于单个神经元的状态,而且取决于它 们之间的相互作用,用此来模拟大脑的非局域性。 c ) 非凸性:非凸性是指人工神经网络的演化过程在满足一定条件下取决于某 特定函数,而且该函数具有多个稳定点,这将导致在不同边界条件下得到不同的 结果,这就是系统演变的多样性。 d ) 非定常性:表现在人工神经网络具有自组织、自适应和自学习能力 2 4 倒立振子控制问题的研究现状 倒立振子控制问题因为其代表性和复杂性,一直是神经网络控制领域里的 一个热点和难点问题。因此,该领域里每一种新方法的提出,都倾向于把能否 有效解决倒立振子控制问题作为衡量算法是否有效的一个标准就目前的研究 情况来看,已经提出了很多方法来解决这一课题,例如1 9 8 3 年b a r t o 等人设计 了两个单层神经网络,采用a h c ( a d a p t i v eh e u r i s t i cc r i t i c ) 学习算法实现了 状态离散化的倒立振子控制。1 9 8 9 年,a n d e r s o n 进一步用两个双层神经网络和 a h c 方法实现了状态未离散化的倒立振子的平衡控制【i3 1 我们在这里把9 0 年代 以后比较成功的几种方法简要介绍一下 1 、基于模糊联想规则的控制模型1 9 8 7 年美国的b a r tk o s k o 教授提出了一种 称为模糊联想记忆神经网络( f u z z ya s s o c i a t i v em e m o 计_ f a m ) ,这种联想 记忆神经网络是将模糊控制的规则隐含地分布在整个网络中,在神经网络的基 础上通过学习训练产生模糊规则,一次模糊联想记忆就是一次模糊逻辑推理。 随后,b a r tk o s k o 进一步提出模糊认知映射网络( f u z z yc o g n i f i v em a p f c m ) 。这种网络中,各单元( 节点) 表示各个不同的模糊集,单元之间的连 山东大学硕士学位论文 接权( 或称棱) 表示相应模糊概念之间的因果关系。它是一种知识网络,任何 一个专家都可以把他的知识用这种模糊神经网络表达出来,应用f c m 网络能灵 活地、较好地表达专家的知识,进行自动推理和预测。1 9 9 1 年中国科学院自动 化研究所应行仁、曾南,在b a r tk o s k o 研究的基础上,提出了基于b p 神经网络 记忆模糊规则的控制模型,并进行了倒立振子的仿真试验【1 4 1 他们的模型采用 b p 神经网络进行的模糊记忆控制,不必进行复杂费时的规则搜索、推理,而只 须通过高速并行分布计算就可产生输出结果。由于神经网络对信息储存与处理 是分布式( 或全息式的) 和并行式的。各种神经元在信息共享的基础上各部分 信息相互支持、相互补充,各自独立地从与其输入端相联接的其它神经元采集 输入。并计算其输出。再将其传递给上一层( 或其他) 的神经元,作为它们的 一个输入,或作为整个模型的输出,从而赋予模型较强的容错抗错性能和联想 能力,使它不会因为部分神经元的损坏而严重影响其总体性能,也不会因为输 入信号受到一定程度噪声污染而严重歪曲其输出。但是,受至i j b p 网络自身特点 的限制,该模型学习的成功率比较低,系统经常会陷入局部最小值而无法脱离。 2 、拟人智能控制模型。北京航空航天大学张明廉教授领导的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- AI职业规划与面试指南
- IT技术支持面试流程与技巧指导
- 湖北职称评审资料准备及答题要点解析
- 粮库清理施工方案
- 医疗机构服务质量监督员工作实施方案
- 专利预警专员专利预警专员团队建设方案
- 桁架板施工方案
- 电器展会营销方案
- 门口布置租房合同范本
- 房屋租赁 英文合同范本
- 光伏储能可行性研究报告
- 基坑施工冬季施工技术及管理方案
- 儿童故事狼和小羊
- 青海省西宁市2024-2025学年七年级上学期期末调研测试道德与法治试卷(含答案)
- 【MOOC】《人工智能通识基础(社会科学)》(国家高等教育智慧教育平台)章节作业慕课答案
- 2025温州市工业与能源发展集团有限公司2025年面向社会公开招聘工作人员6人考试笔试备考试题及答案解析
- 《工程勘察设计收费标准》(2002年修订本)
- 工厂化学品管理知识培训
- 期货基础知识(期货入门)
- 房产公司施工图设计标准
- GB/T 19685-2005预应力钢筒混凝土管
评论
0/150
提交评论