智能控制(精品PPT)_第1页
智能控制(精品PPT)_第2页
智能控制(精品PPT)_第3页
智能控制(精品PPT)_第4页
智能控制(精品PPT)_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 湖南大学电气与信息工程学院2 智能控制 湖南大学电气与信息工程学院3 智能控制: 第一章 智能控制概述 湖南大学电气与信息工程学院4 智能控制: 第一章 智能控制概述 湖南大学电气与信息工程学院5 智能控制: 第一章 智能控制概述 湖南大学电气与信息工程学院6 智能控制: 第一章 智能控制概述 湖南大学电气与信息工程学院7 智能控制: 第一章 智能控制概述 湖南大学电气与信息工程学院8 智能控制: 第一章 智能控制概述 湖南大学电气与信息工程学院9 智能控制: 第一章 智能控制概述 湖南大学电气与信息工程学院10 智能控制: 第一章 智能控制概述 湖南大学电气与信息工程学院11 智能控制:

2、第一章 智能控制概述 湖南大学电气与信息工程学院12 湖南大学电气与信息工程学院13 智能控制: 第二章 模糊控制 湖南大学电气与信息工程学院14 智能控制: 第二章 模糊控制 湖南大学电气与信息工程学院15 智能控制: 第二章 模糊控制 ba baab 湖南大学电气与信息工程学院16 智能控制: 第二章 模糊控制 湖南大学电气与信息工程学院17 |xxxx 智能控制: 第二章 模糊控制 ,| ),(yyxxyxyx 湖南大学电气与信息工程学院18 智能控制: 第二章 模糊控制 )(x a ax 0, ax , x a 1 )( 集合a的特征函数的值域是0,1。它代表普通集合中元素与集合的 关

3、系,表示元素是否属于集合。 在zadeh提出的模糊集理论中,元素与集合的关系,并不是简单的属 于不属于的关系,而是在多大程度上属于的关系。也就是说,元素 可以在一定程度上属于集合,而不是完全属于。模糊集中代表元素 与集合关系的特征函数称为隶属函数,其值域为0,1。 湖南大学电气与信息工程学院19 a )( x a a 3525 5 25 1 1 25151 )(2 x x x x a 5 . 0)30( a 智能控制: 第二章 模糊控制 湖南大学电气与信息工程学院20 智能控制: 第二章 模糊控制 n naaa x x x x x x a )()()( 2 2 1 1 ),()()()( 21

4、 naaa xxxa )(,)(,)(, 2211 nanaa xxxxxxa,(,( 湖南大学电气与信息工程学院21 )( x a 智能控制: 第二章 模糊控制 3525 5 25 1 1 25151 )(2 x x x x 年轻 )(x 年轻 1 0 152535 x 湖南大学电气与信息工程学院22 )( x a ex )()( xx ba ba )()()( xxx baba )( x b a b a b ex )()( xx ba a b ba a b ba a b ba )()()( xxx baba 智能控制: 第二章 模糊控制 湖南大学电气与信息工程学院23 a 智能控制: 第二

5、章 模糊控制 a )()( 1 xx aa 例:设论域e=a, b, c, d, e上有两个模糊集为: edcba x a 1 . 02 . 04 . 03 . 05 . 0 )( edcba x b 4 . 07 . 01 . 08 . 02 . 0 )( 求 , , 。 ba ba a 解: edcba ba 1 . 02 . 01 . 03 . 02 . 0 edcba ba 4 . 07 . 04 . 08 . 05 . 0 edcba a 9 . 08 . 06 . 07 . 05 . 0 湖南大学电气与信息工程学院24 智能控制: 第二章 模糊控制 模糊运算的性质: (1)交换率

6、abba abba, (2)结合率 )()(cbacba, )()(cbacba (3)分配率)()()( cabacba )()()( cabacba (4)传递率 ba, cb ,则 ca (5)幂等率 aaa , aaa (6)摩根率 baba baba , (7)复原率 aa 湖南大学电气与信息工程学院25 智能控制: 第二章 模糊控制 2.2.3 模糊关系 普通关系普通关系 普通关系是用数学方法描述不同普通集合中的元素之间有无关联。 例如:东西亚足球对抗赛,分两个小组a=中国,日本,韩国, b=伊朗,沙特,阿联酋。抽签决定的对阵形势为:中国-伊朗, 日本-阿联酋,韩国-沙特。用r表示

7、对阵关系,则r可用序偶的形式 表示为: r=(中国,伊朗),(日本,阿联酋),(韩国,沙特) 可见r是a,b的直积ab的子集。也可将r表示为矩阵形式,假设 r中的元素r(i,j)表示a组第i个球队与b组第j个球队的对应关系,如 有对应关系,则为1,否则为0,则r可表示为: r= 010 100 001 中国 日本 韩国 伊朗沙特阿联酋 该矩阵称为a和b的关系矩阵 湖南大学电气与信息工程学院26 智能控制: 第二章 模糊控制 模糊关系 将普通关系的概念扩展到模糊集合中,可定义出模糊关系为: 定义模糊集 和 的直积 的一个模糊子集 为 到 x y 的二元模糊关系,其序偶(x,y)的隶属度为 ba

8、r x y ),( yx r 二元模糊关系 可用矩阵表示为 r ),(.),(),( : ),(.),(),( ),(.),(),( 21 2 2 2 1 2 1 2 1 1 1 y x y x y x y x y x y x y x y x y x m n r n r n r mrrr mrrr r 该矩阵称为模糊集 和 的关系矩阵 x y 湖南大学电气与信息工程学院27 智能控制: 第二章 模糊控制 例: 设x=儿子,女儿 y=父,母,则“子女与父母长得相象”的模糊 关系可表示为 6 . 03 . 0 3 . 08 . 0 女子 母 父 r 模糊关系矩阵的运算模糊关系矩阵的运算 设 和 分

9、别是论域e上的模糊关系 r s r rrr rrr rrr ij r nn nnnn n n . : . . 21 22221 11211 s sss sss sss ij s nn nnnn n n . : . . 21 22221 11211 , 湖南大学电气与信息工程学院28 智能控制: 第二章 模糊控制 ijij srsr (1) 那么 ijij srsr (2) q srsr srsr ij sr nn nnnnnn nn 11 111111 (3) q srsr srsr ij sr nn nnnnnn nn 11 111111 (4) rir (5) (6)模糊关系矩阵的积(合成

10、) src )( kjik k ij src , 湖南大学电气与信息工程学院29 1 . 01 . 0 5 . 07 . 0 祖母祖父 母 父 s 6 . 03 . 0 3 . 08 . 0 母父 女 子 r 3 . 03 . 0 5 . 07 . 0 1 . 01 . 0 5 . 07 . 0 6 . 03 . 0 3 . 08 . 0 sr 子 女 祖父祖母 智能控制: 第二章 模糊控制 湖南大学电气与信息工程学院30 智能控制: 第二章 模糊控制 。 湖南大学电气与信息工程学院31 智能控制: 第二章 模糊控制 湖南大学电气与信息工程学院32 智能控制: 第二章 模糊控制 2001000

11、 10050 50 2 5001 )( s s x s s 慢 2001500 150100 50 3 100501 50 5000 )( s s x s x s s 中 2001501 1501002 50 10000 )( s s x s s 快 隶属度 1 0 慢 中快 50100150200 湖南大学电气与信息工程学院33 智能控制: 第二章 模糊控制 a b bar )()(),( vuvu bar a b c )()( cabar )()(1)()(),( vuvuvu cabar 湖南大学电气与信息工程学院34 )0 . 01 . 03 . 08 . 00 . 1 ( a )0

12、.18 .03 .01 .00 .0( b )0 . 164. 009. 001. 00 . 0( g )0 . 036. 091. 099. 00 . 1 ( c 智能控制: 第二章 模糊控制 a b c g 湖南大学电气与信息工程学院35 bar 0 .00 .00 .00 .00 .0 1 .01 .01 .01 .00 .0 3 .03 .03 .01 .00 .0 8 .08 .03 .01 .00 .0 0 .18 .03 .01 .00 .0 r 智能控制: 第二章 模糊控制 )()(),( vuvu bar 湖南大学电气与信息工程学院36 0.036.091.099.00.1

13、1.036.09.09.09.0 3.036.07.07.07.0 8.08.03.02.02.0 0.18.03.01.00.0 r 智能控制: 第二章 模糊控制 )()( cabar )()(1)()(),( vuvuvu cabar 湖南大学电气与信息工程学院37 a b, r 则 a b rab 智能控制: 第二章 模糊控制 , 湖南大学电气与信息工程学院38 0.036.091.099.00.1 1.036.09.09.09.0 3.036.07.07.07.0 8.08.03.02.02.0 0.18.03.01.00.0 r )0 . 032. 055. 089. 00 . 1

14、(, 1 1 a a“略小” 1 1 rab ),()()( 1 1 jiria i jb vuuv “近似长”0 . 18 . 055. 055. 055. 0 1 b 智能控制: 第二章 模糊控制 湖南大学电气与信息工程学院39 智能控制: 第二章 模糊控制 湖南大学电气与信息工程学院40 智能控制: 第二章 模糊控制 湖南大学电气与信息工程学院41 智能控制: 第二章 模糊控制 2 2 )( )( i i i b ax a ex - 6 - 4 - 2 0 2 4 6 0 0 .5 1 n b n m n s z o p s p m p b 湖南大学电气与信息工程学院42 智能控制: 第

15、二章 模糊控制 湖南大学电气与信息工程学院43 智能控制: 第二章 模糊控制 iiii cbar)( )()()(),(zyxzyx iiii cbar zzyyxx,, 湖南大学电气与信息工程学院44 智能控制: 第二章 模糊控制 rbau)( )()(),()(yxzyxz bar yy xx u n i i rr 1 ),(),( 1 zyxzyx i r n i r 湖南大学电气与信息工程学院45 智能控制: 第二章 模糊控制 规则r1 )( 1 x a x 0-66 ns y 0-66 zo z 0-66 ps )( 1 y b )( 1 z c 规则rn )(x an x 0-66

16、 zo y 0-66 ns z 0-66 ns )(y bn )(z cn e ec 1 0.9 0.2 0.8 z 0-66 )(z u 输出的模糊语言值 min min max 湖南大学电气与信息工程学院46 智能控制: 第二章 模糊控制 由模糊推理得到控制量的语言值后,要经过逆模糊化操作将其转 换为执行机构能够接受的精确值。 逆模糊化就是根据一定的算法将模糊推理得到的模糊输出转化为 可以直接控制对象的精确输出。去模糊化的算法也很多,最常用 的是隶属度函数加权平均判决法,即 n i iu n i iiu z zz u 1 1 )( )( 输出u在作用于执行机构之前,应将其论域z转换为执行机

17、构所能接受的范围 湖南大学电气与信息工程学院47 智能控制: 第二章 模糊控制 ec u e nbnmnszopspmpb nbnbnbnbnbnmzozo nmnbnbnbnbnmzozo nsnmnmnmnmzopsps zonmnmnszopspmpm psnsnszopmpmpmpm pmzozopmpbpbpbpb pbzozopmpbpbpbpb 湖南大学电气与信息工程学院48 ec u e -6-5-4-3-2-10123456 -6-5-5-5-5-5-5-5-4-3-2000 -5-5-5-5-5-5-5-5-4-3-2000 -4-5-5-5-5-5-5-5-3-3-200

18、0 -3-4-4-4-4-4-4-4-3-2-1111 -2-4-4-4-4-4-4-4-2-10222 -1-4-4-4-3-3-3-3-122333 0-4-4-4-3-3-10133444 1-3-3-3-2-213333444 2-2-200124444444 3-1-101234444444 40012345555555 50012345555555 60012345555555 智能控制: 第二章 模糊控制 湖南大学电气与信息工程学院49 智能控制: 第二章 模糊控制 模糊设计的步骤模糊设计的步骤 (1)确定模糊控制器的输入变量和输出变量; (2)确定输入、输出的论域; (3)总结

19、模糊控制规则; (4)选择推理算法; (5)确立模糊化和逆模糊化的方法; 模糊控制的优点:模糊控制的优点: (1)设计时不需要建立被控对象的数学模型,只要求掌握人类的控制经验 (2)系统的鲁棒性强,尤其适用于非线性时变、滞后系统的控制 模糊控制的缺点:模糊控制的缺点: (1)确立模糊化和逆模糊化的方法时,缺乏系统的方法,主要靠经验 和试凑。 (2)总结模糊控制规则有时比较困难; (3)控制规则一旦确定,不能在线调整,不能很好地适应情况的变化 (4)稳态精度不高。 湖南大学电气与信息工程学院50 智能控制: 第二章 模糊控制 机器人的控制问题 二关节机械手的结构如图所示 机器人的控制问题就是使

20、各个关节能够以理想 的动态性能无静差地 跟踪期望轨迹。 l1 m1 2 l2 m2 2 t1 t2 湖南大学电气与信息工程学院51 智能控制: 第二章 模糊控制 二关节机械手的数学模型 ),()(, d tfgvm 2 1 t t 2 1 2 222212 2 22 2212 2 22221 2 2 2 12 2 11 )2( lmcllmlm cllmlmcllllmlm m 2 22212 212212 2 22212 2 , sllm sllmsllm v 1222 11211222 )( gclm gclmmgclm g 摩擦矩阵 扰动 湖南大学电气与信息工程学院52 智能控制: 第二

21、章 模糊控制 模糊控制器1 两关节 机械手 模糊控制器2 1 1d 2d 1 z 1 z 1e k 1ec k 2e k 2ec k 1 e 1 ec 2 e 2c e 1 ec 2 e 2 ec 1 u 2 u 1u k 2u k 1 t 2 t 2 1 e 机器人模糊控制系统结构 对应每一个关节,都有一个模糊控制器来控制该关节的运动轨迹。模糊 控制器的设计如前所述。 量化因子 比例因子 湖南大学电气与信息工程学院53 智能控制: 第二章 模糊控制 机器人模糊控制实验结果: kgmkgm2,10 21 mlml8 . 0,1 . 1 21 0)0( 1 1)0( 2 0)0()0( 21 期

22、望轨迹为 )2sin()( 1 tt d )2cos()( 2 tt d 采样周期为0.0005s。摩擦项和扰动项分别为 )(5 . 0)( signf )5cos(5 )5cos(5 ),( t t d t 初始条件: 实验结果: 0 0.2 0.4 0.6 0.8 1 -1.2 -0.8 -0.4 0 0.4 0.8 1.2 角位移1 (rad) 时间t (sec) 期望 fc 0 0.2 0.4 0.6 0.8 1 -1.2 -0.8 -0.4 0 0.4 0.8 1.2 角位移2 (rad) 时间t (sec) 期望 fc 湖南大学电气与信息工程学院54 智能控制: 第二章 模糊控制

23、模糊控制的控制性能取决于它的控制规则,而根据人的经验总结出来的控 制规则往往具有一定的片面性。普通模糊控制器的控制规则一旦确定便不 能改变,就必然不能很好地适应系统动态特性的变化或随机干扰的影响, 从而影响模糊控制的效果。因此,这里介绍一种规则自校正模糊控制器, 使模糊控制规则可以得到在线调整,极大地改善了模糊控制的效果。 2.5 规则自校正模糊控制器 在这种规则自校正模糊控制器中,采用了一种在线的模糊推理算法。 设基本模糊控制器是一个双输入单输出结构的控制器,输入变量为 a,b(偏差、偏差变化率)输出变量为c(控制变量)。控制规则表 示为: 2.5.1 规则自校正模糊控制原理规则自校正模糊控

24、制原理 湖南大学电气与信息工程学院55 ai、bj、ck分别表示语言值 ),(,( : kjikjjii c is c then b is b anda is a ifr kj ii hhhk nnnj mmmi cc bb aa kkk jj j iii , 2 , 1 , 0 , 1, 1, , 2 , 1 , 0 , 1, 1, , 2 , 1 , 0 , 1, 1, 智能控制: 第二章 模糊控制 湖南大学电气与信息工程学院56 控制规则中,每个输出与输入可以用一定的对应关系来表示,这个模糊 对应关系表示为 1 , 0,)1 (),(jijik 控制规则不由人总结得出,而是由公式得出。

25、式中是加权因子,它反映了误差和误差变化率对输出影响的程度。 x 表示对x取整。 通过调整的值,就可以根据不同对象、不同时刻的误差和误差变 化率各自对输出的影响程度来调整控制规则。当被控对象阶次较低 或误差较大时,误差对输出的影响应超过误差变化率的影响,的 值应取得较大;当被控对象阶次较高或误差较小时,误差变化率对 输出的影响则更大些,的值就应取得小些。规则自校正模糊控制 就是通过实时在线地调整的值来达到调整控制规则的目的的。 智能控制: 第二章 模糊控制 湖南大学电气与信息工程学院57 2.5.2 改进改进fuzzy推理算法推理算法 传统的基本模糊控制器的推理过程可以描述为下式: )( , k

26、 ji ji cbar rbac)( 由上述的传统模糊推理算法计算控制量输出非常慢,无法满足实时在线推 理的需要。为了使模糊控制器做到实时在线推理。我们做以下改进 令 ii i aa )(max)(xx i a ii a jj j bb )(max)(yy j b jj b 其中xx,yy,a和b表示定义在x,y上的隶属函数,其形状如图 所示: 智能控制: 第二章 模糊控制 湖南大学电气与信息工程学院58 定义分布函数 和 , 11ii rrxix , 12jj rryjy 定义mc(k)为输出的语言值ck对应的中点,也就是隶属度为1的点。 智能控制: 第二章 模糊控制 湖南大学电气与信息工程

27、学院59 已知fuzzy控制器的输入(x0,y0),在线模糊推理算法步骤可描述为: 计算 )(),( 0201 yjxi jijik)1 (),( 则控制器的输出为: )( 0 kmcu 智能控制: 第二章 模糊控制 湖南大学电气与信息工程学院60 2.5.3 规则的调整规则的调整 仍然采用fuzzy推理来完成对的调整。规则自校正控制器的结构如图: 模 糊 化 去 模 糊 化 jik)1 ( s k e ec s u 模 糊 化 模糊推理 去 模 糊 化 模糊控制器1 模糊控制器2 a b k c 控制器1采用在线推理算 法,控制器2仍然采用 常规的推理方法,先 离线制定查询表,再 放入在线运

28、行。 控制器2的输入为e,ec;输 出为的调整量。 智能控制: 第二章 模糊控制 湖南大学电气与信息工程学院61 模糊控制器2用来完成对调整。e、ec、s分别为e、ec、和的模糊 量,其论域均为-6,-5,-4,-3,-2,-1,0,1,2,3,4,5,6。e 对应的语言值为nb、nm、ns、no、po、ps、pm、pb,ec和s对应 的语言值为nb、nm、ns、zo、ps、pm、pb,隶属函数采用高斯基 函数。 根据在校正过程中要遇到的各种可能出现的情况和相应的调整策略得 到调整规则表如表所示。 s ec e nbnmnszopspmpb nbnbnbnbpbpbpmps nmnbnbnbp

29、mpmpszo nsnbnbnmpspszons nonmnmnszozonmns ponsnmzozonsnmnm psnszopspsnmnbnb pmzopspmpmnbnbnb pbpspmpbpbnbnbnb 智能控制: 第二章 模糊控制 湖南大学电气与信息工程学院62 湖南大学电气与信息工程学院63 细胞体 树突 轴突 另一个 神经元 树突和轴突负责传入和传出信息,兴奋性的冲动沿树突抵达细胞体, 在细胞膜上累积形成兴奋性电位;相反,抑制性冲动到达细胞膜则形 成抑制性电位。两种电位进行累加,若代数和超过某个阈值,神经 元将产生冲动。 智能控制: 第三章 神经网络控制 湖南大学电气与信

30、息工程学院64 : x1 w1 y 2 w f x2 xn n w - 1 )( 1 n i ii wxfy 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院65 神经网络具有的基本特性:神经网络具有的基本特性: (1)分布存储和容错性。信息在神经网络中的存储是按内 容分布于许多神经元中的,部分神经元的损坏不会影响 整个网络的信息恢复。 (2)自适应性与自组织性。神经元之间的连接具有多样性, 各神经元之间的连接强度具有可调性,这使得神经网络 可以通过学习和训练进行自组织。 (3)并行处理性。网络的各单元可以同时进行类似的处理 过程,整个网络的信息处理方式是大规模并行的,处理 速度快

31、。 (4)能以任意精度逼近任意的非线性函数关系。 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院66 perceptron模型是美国学者rosenblutt在1957年提出的,它由一个神 经元构成,首次使神经网络具有了学习的能力,后来的神经网络模型 都是在此模型的基础上进行的改进和推广。 该模型的结构: x1 w1 y 2 w f x2 xn n w - 1 该模型的数学模型: )( 1 n i ii wxfy 权值或连接强度, 可调 令wn+1=-,xi+1=1,则: )( 1 1 n i ii wxfy 00 01 )( x x xf , 智能控制: 第三章 神经网络控制 湖

32、南大学电气与信息工程学院67 perceptron模型的学习方法: 输入一学习样本x=(x1,x2,xn,1)和它的希望输出d。 计算网络的实际输出: ) )()( 1 1 n i ii twxfty 用下式对权值w进行修正: iii xtydtwtw)()() 1( 反复修改, 直至w稳定不变 其实是最优化方法的最速梯度下降法,目标是使函数 2 )(2/1tydj最小, 也就是使网络的输出尽可能地逼近希望输出d。 从perceptron模型可以看出神经网络通过一组状态方程和一组学习方程加以描述。 状态方程描述每个神经元的输入、输出、权值间的函数关系,而学习方程描述权 值应该怎样修正。神经网络

33、通过修正这些权值来进行学习,从而调整整个神经 网络的输入输出关系。 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院68 3.1.3 神经网络的分类神经网络的分类 (1)从结构上划分 通常所说的网络结构,主要是指它的联接方式。神经网络从拓扑结构上 来说,主要分为层状和网状结构。 层状结构:网络由若干层组成,每层中有一定数量的神经元,相邻层 中神经元单向联接,一般同层内神经元不能联接。 a. 前向网络:只有前后相邻两层之间神经元相互联接,各神经元之 间没有反馈。每个神经元从前一层接收输入,发送输出给下一层。 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院69 网状结构:

34、网络中任何两个神经元之间都可能双向联接。 a. 反馈网络:从输出层到输入层有反馈,每一个神经元同 时接收外来输入和来自其它神经元的反馈输入,其中包 括神经元输出信号引回自身输入的自环反馈。 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院70 b. 相互结合型网络:网络中任意两个神经元之间都可能相互双向联接,所 有神经元既做输入也做输出。 c. 混合型网络:前向网络的同一层神经元之间有互联的网络。 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院71 (2)从激发函数的类型上划分,可分为高斯基函数神经网络、小波基函 数神经网络、样条基函数神经网络等等。 (3)从网络的学

35、习方式上划分,可分为有导师学习神经网络和无导师学 习神经网络。 有导师学习神经网络:为神经网络提供样本数据,对网络进行 训练,使网络的输入输出关系逼近样本数据的输入输出关系。 有导师学习神经网络:不为神经网络提供样本数据,学习过程 中网络自动将输入数据的特征提取出来。 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院72 3.2.1 前向多层前向多层bp神经网络神经网络 )(f )(f )(f bp算法 权值修正 1 x 2 x n x )1( ij w )1( nl w )1( 11 w )2( 11 w )2( jk w )2( lm w 1 y 2 y m y d +- 输入

36、层隐层 输出层 训练算法 信息的传播方向 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院73 沿信息的传播方向,给出网络的状态方程,用 和 表示第i层第j 个神经元的输入和输出,则网络的各层输入输出关系可描述为: )(i j in )(i j out 第一层(输入层):将输入引入网络 iii xinout )1()1( ni, 2 , 1 第二层(隐层): n i iijj outwin 1 )1()1()2( lj, 2 , 1 )( )2()2( jj infout 连接强度 为激发函数,可以取不同的形式,如:)(xf s函数: x e xf 1 1 )(高斯基函数: 2 2

37、 )( exp)( b ax xf 径向基函数、样条基函数、小波函数等 网络的结构 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院74 第三层(输出层): l j jjkkkk outwinouty 1 )2()2()3()3( mk, 2 , 1 网络的学习 学习的基本思想是:通过一定的算法调整网络的权值,使网络的实际输 出尽可能接近期望的输出。 在本网络中,采用误差反传(bp)算法来调整权值。 假设当网络的输入为x=(x1,x2,xn)时,网络的实际输出为y=(y1, y2,ym),网络的期望输出为d=(d1,d2,dm)。 则定义学习的目标函数为: m i i m i ii

38、 eydj 1 2 1 2 2 1 )( 2 1 平均方差 bp算法通过下列公式来调整权值,使目标函数最小: w j twtw )() 1( 最速梯度下降法 学习率 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院75 具体说来,有: )1( 1 )1()1( )() 1( ij ijij w j twtw )2( 1 )2()2( )() 1( jk jkjk w j twtw 其中: )2( )3( )3( )3( )3()2( jk k k k k k kjk w in in out out y y j w j )1 ( )2( )2( )2( 1 )2( )3( )3()1

39、 ( ij j j j m k j k k k kij w in in out out in in y y j w j 偏差逐步反传 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院76 学习的流程: 输入x,根据网络的状态方程沿信号传 播方向计算出网络输出y 假设已知输入为x时,期望输入为d,则网络学习的流程为: 计算目标函数 m i i m i ii eydj 1 2 1 2 2 1 )( 2 1 j? yes 训练完成 修正权值 w j twtw )() 1( no 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院77 3.2.2 hopfield网络(反馈网络)

40、网络(反馈网络) 1 x 2 x 1n x n x 1 y 2 y 3 y 4 y ffff 12 w 11 n w n w1 21 w 12 n w n w2 1nn w 1n w )( 1 kv )( 1 kvn 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院78 网络的状态方程可以描述为 )()()() 1( 1 kxkykwfky ji n i ijj nj, 2 , 1 网络的学习 假设d(k+1)是网络的期望输出,定义目标函数为: m i ii kykdj 1 2 )1() 1( 2 1 同样可以根据bp算法来对网络权值进行训练: )( )() 1( kw j kwk

41、w 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院79 3.2.3 递归网络递归网络 )(f )(f )(f bp算法 权值修正 1 x 2 x n x )1( ij w )1( nl w )1( 11 w )2( 11 w )2( jk w )2( lm w 1 y 2 y m y d +- 输入层隐层 输出层 )0( 1 w )0( 2 w )0( n w 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院80 沿信息的传播方向,给出网络的状态方程,用 和 表示第i层第j 个神经元的输入和输出,则网络的各层输入输出关系可描述为: )(i j in )(i j out

42、 第一层(输入层):将输入引入网络,内含递归环节z-1 ) 1()()()()( )1()0()1()1( koutkwkxkinkout iiiii ni, 2 , 1 第二层(隐层): n i iijj outwin 1 )1()1()2( lj, 2 , 1 )( )2()2( jj infout 连接强度 网络的结构 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院81 第三层(输出层): l j jjkkkk outwinouty 1 )2()2()3()3( mk, 2 , 1 网络的学习 在本网络中,采用误差反传(bp)算法来调整权值。 假设网络的期望输出为d=(d1

43、,d2,dm)。 则定义学习的目标函数为: m i i m i ii eydj 1 2 1 2 2 1 )( 2 1 bp算法通过下列公式来调整权值,使目标函数最小: w j twtw )() 1( 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院82 递归神经网络的输入输出关系可以概括为: )(),0(,),1(),()(kwxkxkxgky 不含递归环节的神经网络代表的函数关系是: )(),()(kwkxgky 假设用神经网络辩识对象: )(,),1(),(),(,),2(),1()(qkxkxkxpkykykyfky 普通神经网络的输入应为: )(,),1(),(),(,),

44、2(),1(qkxkxkxpkykykyx 输入层仅包括个神经元,结构简单得多。 递归神经网络的输入为: )(),1(kxkyx 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院83 3.2.4 小脑神经网络(小脑神经网络(cmac) 小脑模型关节控制器(cmac)是由albus最初于1975年基于神经生 理学提出的,它是一种基于局部逼近的简单快速的神经网络,类似 于perceptron的相联记忆方法,能够学习任意多维非线性映射。迄今 已广泛用于许多领域。特别是miller等的突破性应用研究,已使 cmac受到越来越多的关注 与bp网络之类的全局逼近方法不同,cmac具有优点: (

45、1)具有局部逼近能力,每次修正的权值极少,学习速度快,适 合于在线学习; (2)一定的泛化能力,相近输入给出相近输出,不同输入给出不 同输出; 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院84 cmac的原理 cmac是一种模仿人类小脑的学习结构。如图所示,在这种技术里, 每个状态变量被量化并且输入空间被划分成离散状态。量化的输入 构成的向量指定了一个离散状态并且被用于产生地址来激活联想单 元中存储的联想强度从而恢复这个状态的信息。对于输入空间大的 情况,联想单元数量巨大,为了节省存储空间,albus提出了hash 编码,将联想强度存于数量大大少于联想单元的hash单元中,联想

46、 单元中只存储hash单元的散列地址编码。 状态空间 联想单元hash单元 加法器 输出 输入空间 状态 划分 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院85 cmac的空间划分和量化机制 下图描述了cmac的空间划分和量化机制。 超立方体 联想单元 “块” 1 2 3 48 7 6 5 10 9 1234 1 2 3 4 11 12 13 14 15 16 ab cd ef b a c d e f 量化的第1 种方式 量化的第2 种方式 量化的第3 种方式 量化的第1 种方式 量化的第2 种方式 量化的第3 种方式 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学

47、院86 这个简单的例子有两个状态变量(v1和v2),每个变量在论域上被划分为几个离散的 区域叫做“块”。块的宽度影响cmac的概括能力。为了能够用较简洁的矩阵形式来描 述cmac的机制和特性,在这里我们将块的数量限定为2。譬如,v1被划分为a、b;v2 被划分为a、b。区域aa, ab, ba 和bb被称作“超立方体”(hypercubes)。通过将每 个变量以相同的方式平移一小段间隔(称为“元素”,如图5.2中1,2,3,4),可以 获得不同的超立方体。例如,v1通过平移后的区域c,d和v2的c,d组成一层新的超立 方体cc,cd,dc,dd。我们规定,相同的划分方式组成一层超立方体,例如v

48、1的第p 种划分方式与v2的第p种划分方式对应组成第p层超立方体。用上述方法分解,我们可 以得到一共有3层的超立方体,其中每一层对应一种划分方式。图5.2中可看出,两变 量的每一种状态组合(1,2,16)在每一层都被一个超立方体覆盖,则对应所有的划分方 式,一共被3个不同的超立方体覆盖。也就是说,两变量的每一种状态将激活3个不同 的超立方体,cmac为每个超立方体分配一个物理的存储单元(联想单元),每个联想 单元中存储着相应的超立方体对于输出的影响强度(联想强度),这样,两变量的每 一种状态将激活ne个不同的联想单元,这被激活的ne个联想单元又以不同的联想强度 影响输出。 对于输入空间较大的情

49、况,为了减少存储空间,几个联想单元可以通过hash映射被 分配同一个存储单元(hash单元)。这时,联想单元中只存储hash单元的散列地址 编码,而hash单元中才存储真正的联想强度。由于hash映射增加了分析cmac行为的 难度,所以只有当存储器空间不够时才使用hash映射。 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院87 cmac学习的数学推导 1。无hash映射的cmac 在cmac中,每个量化的状态属于ne个超立方体(联想单元)。假 设nh是总的联想单元的数量。用cmac技术,第s个状态对应的输 出数据ys可以被表示为: h h h n j jjs n nsss t

50、ss ccccwcy 1 , 2 1 ,2 ,1 , 式中w是代表存储内容(联想强度)的向量,cs是存储单元激活向量, 该向量包含ne个1。在决定了空间的划分方式后,对于指定的状态, 单元激活向量cs也随之确定。例如,对于图5.2中的cmac,有16个 离散状态,并且安排了标号。有12个联想单元分别对应超立方体aa, ab, ba, bb, cc, cd, dc, dd, ee, ef, fe和ff,这些单元从1到12按升 序排列。则第1个状态被超立方体aa、cc、ee覆盖,将激活与这三 个超立方体相对应的联想单元,对应于该状态的激活向量因此为 000100010001 1 t c 智能控制:

51、 第三章 神经网络控制 湖南大学电气与信息工程学院88 2。有hash映射的cmac hash映射将几个联想单元和一个物理存储位置(hash单元)相对应。hash 单元中存储联想强度,而此时的联想单元是虚拟的存储空间,只存储 hash单元的散列地址编码。有hash映射的cmac特别适用于存储空间小 于超立方体数量时的情况。用有hash映射的cmac技术,第s个状态对应 的输出数据ys可以被表示为: 式中mp是hash单元的数量,它小于联想单元数nh。hij=1表示联想单元i 激活hash单元j。由于每个联想单元仅仅和一个hash单元相对应,所以 hash矩阵h的每一行仅有一个单元等于1,其余的

52、都等于0。 p phh p h m mnn m nsss t ss hh hh ccchwcy 2 1 ,1 , , 111 ,2 ,1 , 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院89 没有hash映射的公式和有hash映射的公式可以合并为一个式子: waaaway h nsss t ss ,2 ,1 , 映射有 映射无 hash hash hc c a t s t s t s cmac的学习 cmac用迭代算法来训练联想强度。在学习中,我们将ns个训练数据 重复用于学习。在第i次迭代中用第s个样本学习的迭代算法为: 式中下标s-1和s表示样本数,上标i表示迭代次数,为学

53、习率, 是样本s-1的目标值,是样本s-1的误差,向量给出了在第i次迭 代时用第s个样本进行学习的联想强度。 )( )( 1 111 )( 1 )( 1 )( 1 )(i s t sss e i s i s i s i s waya n wwww 该算法采用的是重复样本训练方法,与前面采用的单样本训练方法不同, 它是在一次迭代中将所有样本数据依次代入训练,待所有样本训练完 成后,再重头开始第二次训练。 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院90 输入第i组样本 计算cmac输出y 计算目标函数 2 2 1 )(ydj j? yes no 训练完成 修正权值i=i+1 i=

54、0 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院91 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院92 根据控制系统的结构的不同,神经网络控制系统可以划分为以下几种类型: (1)神经网络直接控制系统 在这种控制系统中,神经网络被直接用作误差闭环系统的反馈控制器, 神经网络控制器首先利用其它已有的控制样本进行离线学习,而后以系 统误差的均方差为评价函数进行在线学习。 nnc被控对象 目标函数 ry + - eu 2 2 1 2 2 1 )()(tytrej )( )() 1( tw j twtw )( )( )( )( )()(tw tu tu ty ty j t

55、w j , )() 1( )() 1( )( )( tutu tyty tu ty 当被控对象模型不确定时, 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院93 (2)神经网络直接自适应控制 图中e=r-y,直接自适应控制中,nn先离线学习对象的逆动力学特 性,然后被用作前馈控制器,并在线继续学习逆动力学特性。这种 方法的思想是,如果nn充分逼近机器人的逆动力学特性,则从nn 的输入端至对象的输出端的传递函数近似为1。 nnc被控对象 目标函数 ry e u 逆动力学 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院94 (3)神经网络间接自适应控制 间接自适应控制系

56、统由nn估计器和反馈控制器构成。在系统中,nn 被用作机器人动力学特性的在线估计器,反馈控制器则根据nn的估 计结果进行修正。反馈控制器可以是常规控制器、也可以是nn控制 器。 nn估计器 被控对象 ry + - eu 控制器 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院95 (4) 模型参考自适应控制 模型参考自适应控制也可以分为模型参考直接自适应控制和模型 参考间接自适应控制,其结构分别如图中的(a)和(b)所示。 在两种系统中,都是以对象的实际输出和参考模型输出的误差e 来修正nn控制器的网络权值。在(a)中,nn控制器需事先离 线学习机器人的逆动力学模型;而在(b)中,

57、机器人的逆动力 学模型由专门的nn估计器来在线辩识。 nnc被控对象 参考模型 r y e u 逆动力学 r q 控制器被控对象 参考模型 r e u r q nn估计器 y + - + - +- 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院96 (5)神经网络学习控制 nn需要一个过程来进行学习,如果未经学习而直接用于系统,则系统的初 始响应不能令人满意。为提高系统的初始鲁棒性,神经网络学习控制系统 将神经网络与常规误差反馈控制结合起来,首先用nn学习对象的逆动力学 模型,然后用nn作为前馈控制器与误差反馈控制器构成复合控制器来控制 对象。系统以反馈控制器的输出作为评价函数来调节神经网络的权值。这 样,在控制之初,反馈控制器的作用较强,而随着控制过程的进行,nn得 到越来越多的学习,反馈控制器的作用越来越弱,nn控制器的作用越来越 强。神经网络学习控制系统的结构如图所示。 反馈控制器被控对象 ry + - e u nn控制器 + + 智能控制: 第三章 神经网络控制 湖南大学电气与信息工程学院97 神经网络控制的优点: (1)由于神经网络能够

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论