(控制理论与控制工程专业论文)对偶自适应控制与bss问题研究.pdf_第1页
(控制理论与控制工程专业论文)对偶自适应控制与bss问题研究.pdf_第2页
(控制理论与控制工程专业论文)对偶自适应控制与bss问题研究.pdf_第3页
(控制理论与控制工程专业论文)对偶自适应控制与bss问题研究.pdf_第4页
(控制理论与控制工程专业论文)对偶自适应控制与bss问题研究.pdf_第5页
已阅读5页,还剩77页未读 继续免费阅读

(控制理论与控制工程专业论文)对偶自适应控制与bss问题研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

搐要 对偶自适应控制与b s s 问题研究 学科:控裁理论与控制王程 研究生:刘筱琰 导师:刘丁教授 钱富_ 方副教授 ( 签名:刻丝! 整)( 签名:到丝圭整) ( 签名:逝 ) 、 ( 签名:照宣焘 ) 摘要 本文主要研究了对偶自适废控制和盲源信号分离两大问题。 针对实际工业生产过程中不确定性系统的控制问题,必须采用随机系统理 论和方法进行分析和处理。控制瓣标的实现要求控制信号平缓变化,同时辩系 统参数不确爱经懿擎习又要求壤羚一定堰值秘颧落稳输入覆号豁莛翔充分激黪 的作用,对偶自适应控制可以较好地解决遮两者之间静i 申突,因此具有良好懿 控制性能。本文分别针对单输入单输出和多输入多输出的随机系统进行了研 究,通过引入系统的新息对原不可解的动态规划问题进行重构,将系统参数随 机变纯的最小方差控制闻题转化成为多个基于新息的肇步控剁翔题。剥周卡客 曼遗渡对泰霸熬系缓参数进行 鑫诗,最终实瑗陡瓿系统瓣对镶骞逶瘟接篱l 。彷 真表明这种对伪自适应控制较好地实现了系统的控制隐标和对未知系统参数不 确定性的学习。 盲源储号分离( b s s ) 是近罐来信号处理领域中赍留热点问题之一,在语音 鼹安理工走擎疆士攀棱论文 识别、通讯和医学图像她理粹方面具有广阔的癍用前景。b s s 问题怒从某类混 合倍譬序列中分离或估计备个未知源信号的过程,其中假设源信号魁相互统计 独立的。由于关于混合信号的信息完全未知,因此将该过程称为盲源债号分离。 嚣蘸围瘫努主要采霜基予壤惑论原理的最大熵、最枣互绩惠量表锯决b s s 惩 题。本文不仅对现有的方混进行了研究,还终食蠡适应、神经网络等控制方法 对b s s 的学习收敛问题以及雾源信号分离等问题避行了探讨,提出应用对偶自 适应控制的基本思想重新构造b s s 闻题进行求解的研究方法,并且通过语音信 号分离蜜验对本文所研究麴器辞b s s 算法进行了分析和验证。 关键调:对偶自遥应控制,新息,盲源信号分岗 a b s l r a c t r e s e a r c ho nd u a la d a p t i v ec o n t r o la n d b s sp r o b l e m s s p e c i a l i t y : c o n t r o lt h e o r ya n dc o n t r o le n g i n e e r i n g a u t h o r : x i a o y a nl i u( s i g n a t u r e s u p e r v i s o r :p r o f d i n gl i u ( s i g n a t u r e卫绰 p r o ff u c a iq i a ( s i g n a t ur e = 垒竺巨型) a b s t r a c t t h ist h e s i si sc o n c e r n e dw i t hp r o b l e m so fd u a la d a p t i v ec o n t r o la n d b l i n d s o u r c es e p a r a t i o n f o rs t o c h a s t i cs y s t e m sw i t hu n c e r t a i np a r a m e t e r si np r a c t i c a ls i t u a t i o n so f i n d u s t r i a l p r o d u c t i o n ,d e s i g n so fa d a p t i v ec o n t r o l l e r s a r eb a s e do nt h e o r i e so f s t o c h a s t i cs y s t e m sw h i l em i n o rc o n t r o ls i g n a l sf i r en e e d e dt or e a l i z et h ec o n t r o l o b j e c t ,r e l a t i v e l yl a r g ed i s t u r b i n gs i g n a l sa r en e e d e di od e t e c tt h os y s t e ms t “u s d u a la d a p t i v ec o n t r 0 1 h o w e v e r ,c a ne l i m i n a t et h ec o n f l i c tb e t w e e nc o n t r o la n d l e a r n i n gs a t i s f a c t o r i l y b at i f f st h e s i ss i n g l ei n p u t s i n g l co u t p u ta n dm u l t i p l ei n p u t - m u l t i p l eo u t p u ts t o c h a s t i cs y s t e m s a r ed i s c u s s e dr e s p e c t i v e l y i n n o v a t i o n sa r e i n t r o d u c e dt or e c o n s t r u c tt h e o r i g i n a lm i m a l u mv a r i a n c ec o n t r o lp r o b l e m o f s t o c h a s t i cs y s t e m w h i c hi su n s o l v a b l eb yi n e a n $ o fd y n a m i cp r o g r a m m i n gs oi t c a nb ec o n v e r t e di n t om u l t i p l es i n g l e s t e po o n t r o lp r o b l e m s ,i nw h i c hk a l m a nf i l t e r i su s e dt oe s t i m a t eu n k n o w ns y s t e mp a r a m e t e r st h u sf i n a l l yw ec a nr e a l i z et h e m i n i m u mv a r i a n c ec o n t r o ls i m u l a t i o n ss h o wt h a tp r e f e r a b l ep a r a m e t e re s t i m a t i o n 西安理王走挚磺士学往 文 a n ds a t i s f a c t o r yc o n t r o lp e r f o r m a n c ec a nb ea c h i e v e du s i n gt h ed e r i v e dd u a l a d a p t i v ec o n t r o l b l i n ds o u r c es e p a r a t i o n ( b s s ) h a sa t t r a c t e dag r e a td e a lo fa t t e n t i o nf r o mt h e s i g n a lp r o c e s s i n gc o m m u n i t yr e c e n t l y a p p l i c a t i o n s r e l a t e dt oav a r i e t yo f a r e a s s u c ha ss p e e c hr e c o g n i t i o n :c o m m u n i c a t i o n sa n dm e d i c a li m a g ep r o c e s s i n g b s s p r o b l e m sa r et os e p a r a t eo re x t r a c ti n d i v i d u a ls o u r c es i g n a lf r o mas e to fm i x t u r e s i g n a l s e x c e p tt h a tt h e $ o d l c es i g n a l sa r ea s s v m e d t ob ei n d e p e n d e n t ,n oa p r i o r i i n f o r m a t i o ni sp u l o w na b o u tt h em i x t u r es i g n a l s t h a ti sw h yt h ep r o b l e mi sk n o w n a sb l i n ds o u r c es e p a r a t i o n b a s e do nt h ei n f o r m a t i o nt h e o r y t h ea l g o r i t h m ss u c h a sm a x i m u me n t r o p ya n dm i n i m u mm u t u a li n f o r m a t i o nh a v eb e e np r e s e n t e db y r e s e a r c h e r si nt h er r e ao fs i g n a lp r o c e s s i n g ,w h i c ha l eu s u a l l ya p p l i e dt os o l v eb s s p r o b l e m s t h et h e s i sn o to n l yd e a l sw i t ht h e s et y p i c a lb s sa l g o r i t h m s b u ta l s o d i s c u s s e st h ep r o b l e m so fl e a r n i n g 。o l a v e r g e n c ea n do fm u l t i p l es o u r c es e p a r a t i o n u s i n gc o n t r o lm e t h o d ss u c ha sa d a p t i v ec o n t r o l :n e u r a ln e t w o r k ,e r e an e x t , 7 m e t h o d i sp r o p o s e di nt h et h e s i sb a s e do nd u a la d a p t i v ec o n t r o la n de x p e r i m e n t so fs p e e c h s i g n a ls e p a r a t i o na r em a d et ot e s tv a r i o u sb s sm e t h o d st h a ta r ec o n s i d e r e di nt h e t h e s i s k e y w o r d s :d u a la d a p t i v ec o n t r o l ,i n n o v a t i o n s ,b l i n ds o u r c es e p a r a t i o n 西安理工大学硕士学位论丈 1 绪论 1 1 引言 对于一个系统而言,其不确定性普遍存在,使得大部分实际的工业生 产过程以及社会、经济等领域中的多步决策问题都无法用简单的确定性模 型加以描述,而必须采用随机系统的理论和方法进行分析和处理。二十世 纪六十年代初,苏联学者f e l d b a u m 针对随机最优问题,取得了若干研究成 果,从估计和控制两个方面揭示了随机最优控制策略具有对偶性( d u a l p r o p e r t y ) 的内在本质“j 。在实现控制目标与对参数不确定性的学习( 或 探测) 这两个通常相互矛盾的要求时”,前者力求控制信号平缓变化, 而只需引入少量的控制作用;后者则要求维持定幅度的激励信号才能 起到探测的作用。而对偶自适应控制策略则较好地解决了控制与估计之间 的矛盾,因此较其它自适应控制而言,具有更好的控制性能。 动态规划( d y n a m i cp r o g r a m m i n g ) 是分析和求解对偶最优控制策略 的有力工具。通常在假设存在最优解的前提下,运用动态规划原理得出一 个含有容许控制策略的最小方差目标函数方程“4 。然而受维数和多个 局部极小问题的限制,即使是最简单的情况,也得不到该方程的解析解, 使得具有对偶性质的最优控制策略仅具有理论分析意义。后来研究者们转 而研究既保持对偶性质_ 义可实现的次优随机控制策略,这种牺牲最优性以 换取可实现性的指导思想大大促进了随机控制理论的发展,形成了对偶自 适应控制的研究领域“。 盲源信号分离( b l i n ds o u r c es e p a r a t i o n ,b s s ) 问题是当前信号处理 领域的研究热点,在语音识别、通讯和医学图像处理等方面具有广阔的应 用前景1 “。一般而言,b s s 问题可视为从某线性混合信号中分离或估计出 源信号的过程。假设有打个相互统计独立的未知源信号,通过传感器得到 一一 竺垒 一一 卅个输出量即其混合信号。在没有任何关于混合信号的先验知识的条件 下,从中分离或恢复源信号的过程具有“盲”的特点,n 此n n n n 信号 分离。b s s 的这一特点决定了该问题的解决方法可以是多种多样的。最大 熵法、最小互信息量法是近年来主要采用的方法,另外自适应、神经网络 等控制领域的研究方法在该问题上也有很多的应用a 列偶自适应控制和盲源信号的分离问题分别是当前控制理论研究领域 和信号处理领域的热点问题之一,如何在对偶自适应控制的基础上来研究 盲源信号分离问题,也是本文所要探讨的内容之一。 1 2 本文的主要研究工作 对偶自适应控制经过4 0 多年的研究,在理论上取得了很大的成就。1 9 7 4 年,jm s t e r 等对单输入单输出( s i n g l e i n p u ts i n g l e o u t p u t ,简写为s i s o ) 系统的一步最小方差控制问题进行研究,通过添加估计的方差约束项获得 一个次优的对偶控制策略1 “。1 9 8 2 年,rm i l i t o 等针对具有未知恒定参数 的s i s o 随机系统,利用新息提出了最小方差控制问题的次优对偶控制算 法“。1 9 9 4 年、i 9 9 9 年,a m a i t e l l i 等利用预测控制方法分别给出了s i s 0 随机系统两步最小方差控制问题与多步最小方差控制问题的次优算法”。 这些算法的共同特点是对原无法求解的n 步动态规划问题加以近似并简 化,从而使问题能够顺利得以求解,且要确保所得的控制具有对偶的特性。 迄今为止,关于对偶控制器的设计问题仍然无法完全解决。针对这一问题, 本文针对单输入单输出( s i s o ) 和多输入多输出( m i m o ) 的随机系统分 别进行讨论,将原步动态规划问题转化为多个基于新息的单步最小方 差控制问题,从而实现了随机系统的对偶自适应控制。 卣源信号分离( b l i n ds o u r c es e p a r a t i o n ,b s s ) 问题的理论研究和应用 在近j 十年有了很大的发展。b e l l - 与s e j n o w s k i ( 1 9 9 5 ) 基于熵的最大化思 想,利用单层前馈神经网络提出了一种学习算法,它可以有效地分离出多 个具有超高斯分布的源信弓,也称信息最大化( i n f o r m a x ) 算法。“。tw l e e 西安理工走学硕士学位论文 等人( 1 9 9 9 ) 在锞聱b e l l 的基本算法体系的基醚上,蠹助a m a r i 等提出弱 “垒然裙度”矗胡。霸,跨i n f o r m a x 雾滚热茨攫广,孰纛虿竣骞教缝实现对 矮有超蔫颠帮亚毒斯劳毒懿混台篱孽黔分蔫。”。n a n d i 等大( 2 0 0 0 ) 姨羹 遄应的角度提出,利用高除统计学来 鑫计个正交旋转变换阵,从而实瑗 列+ 混台信号的分离。二。本文对b s s 问题的应用进行了一系列研究,对 i n f o r m a x 算法和n a n d i 的算法进行了淑避,并在对偶自适应控制思想的基 础上提出了一种新的b s s 求解方法。 第二章概要介绍了对偶自适应控制,简要分析了两大类对偶自适应控 制繁略,并对存在的问题和有待开展的工作进行了简要的说明。 第三章针对殖枫系统动态规划方稷的不可解问题,利用系统的颓息, 缝含卡尔受滤滚技术,对s i s o 蠢m i m o 醛辍系鲮分别遴孬磅究,搀出了纂 予赣惠翁对落垂适应挖镬方法。该方法瑟蠢学习牧敛速疫浃,控裁晶蒺良 好的优点。 第四章提出了盲源分离( b s s ) 问题,简要介绍了甚前国际上常用酶 硼种b s s 算法,针对b e l l 等人提出的1 n f o f m a x 基本算法进行了一系列的改 进,通过实验验证了改进后算法的有效性和良好的性能。 第五章针对一种自适应b s s 求解算法进行了研究和改进,并通过两源 信号的分离实验对该算法的性能进行了验证。 第六章以对偶自适应控制理论为熬档l | ,利耀s i g m o i dm l p 神经网络, 绻含攘广熬卡尔曼滤波技术,提爨了孝申凝的对羁鑫适应b s s 算法。该葵 法葵有学习收敛速疫浚,分离效暴妊懿饶点。 本文锌对瞄上阕题避舒了谈奏臻究,莠期望畿够薅对馁鸯适应控裁襄 膏源信号分离问题结合,寻求一静解决b s s 阎题的新方法。 对偶自髓摩控制 2 对偶自适应控制 2 。1 引言 针对实际工业生产过程不确定系统的控制问题,要采用随机系统的理 沦和方法进行分析处理。苏联学者f e l d b a u m 指出,对具有参数不确定性 的随机系统,通过优化含有不确定性艨餐的性能指标所得的随机最优控制 策略具有双重功能。一方面控制信号可将系统输出及状态保持在期望值上 ( 称为调节撵焉) :另一方面,控制信号叉能够探测未来信息,从而有助 予躐,l 、系统参数兹不确定往,迸露改藩信跨过程( 稼为学习或搽溺传焉) 。 隧祝最优茬裁蓑略豹这静双重 乍瘸簸羧稼为嚣霭建屡“i 【”。麦予控蘩囊蠡 往往要求控制信号平缓变化,霹救为了谓节只需弓l 入少量的控嚣传尾;谣 对参数不确定性的学习则要维持一定幅德的输入信号,以起到充分激励作 用,所以在实现控制律时控制目标和储计目标这两个要求常常是相互矛盾 的”“。而对偶随机最优控制策略可以较好地解决控制与估计之间的冲突, 较其它自适应控制策略而言,其控制性能更佳,尤其是在控制尺度较短、 初始参数不确定性较大或参数快速变化的情况下更具优势忙“。 求解具有对猖性质的最优控制繁潞一般采用动态规划( d y n a m i c p r o g r a m m i n g ) 亲完成。通常在缀设有羧貔艇存在的兹提下,运爱动态趣 潮象溪导塞一令含煮容许控翻蒙臻熬瓣繇泛避( b e l l m a n ) 方程田 。然嚣 受维鼗帮多个局部校小问题的限涮,郄健在最篱单静情凝下,数篷求释 b e l l m a n 方程也得不到解析解,使得艇有对偶性质的最优控制策略仅有理 论分析意义。因此研究者们转而研究既可实现又保持对偶性质的次优随机 控制策略。这种牺牲最优性以换取可实现性的指导思想大大促进了随机控 制理论的发展,进而形成了对偶臼邋应控制( d u a la d a p t i v ec o n t r 0 1 ) 的 研究领域“。 西安理工大学硕士学位论文 对偶控制器旨在寻求控制输入( 七) ,使下面的阶段最小方差性能 指标达到最小: 1 d “= 耳 y ( + 1 ) 一 ( 女+ 1 ) 】2i ,r + ( 2 一1 ) t = n 其中,( ) 是系统的期望输出,y ( k ) 是实际输出。】,定义为k 时刻己知的 全部信息,y 。: y ( t ) 、y ( o ) ,u ( k 1 ) “( o ) 。日) 则表示在r + 条件下对 系统的所有随机变量求条件数学期望。 理论上可以利用动态规划方程求解最优控制输入。但绝大多数实际情 况下,利用b e l l m a n 方程求解该问题面l 临着如下困难1 8 l 【”】【删: i )一般很难证明最优解的存在条件,通常只是假定它存在,再由最优性 原理来列写表达式; 2 )最优递推方程( 2 1 ) 式很难求解,这是因为首先它是随机的,几乎要涉 及所有随机变量的高阶矩;其次它又是非线性的,这使得状态和输出 的分白不是正态的,也即( 2 i ) 式是一个高维的随机非线性方程,通常 无法求得其解析解。 3 ) 理论上,为了得到方程的数值解需要存储最优值函数i ,( t ) 。但由于 该最优值函数的自变量关联到状态变量的条件概率分布,所以状态维 数增大时,其条件概率分布的各个分量将使存储j + ( t ) 的容量大幅度 膨胀,甚至远远超过大型计算机的存储容量。可见即使对于相当简单 的实际问题,最优控制的数值解也面临着无法实现的困难。 因此要解决该问题,既要在一定程度上保留理想对偶控制器的期望性 质,即对偶控制的谨慎作用与探测作用,又要考虑控制律的可实现性。这 样所得的控制律并非从b e li m a n 方程导出的精确解,因此是次优的。就研 究方法而言,根据对性能指标函数的不同处理方式可以概括划分为隐式 ( i m p l i c i t ) 和显式( e x p l i c i t ) 对偶控制策略两大类,后文将作详细论 讳。 对偶自适应控制 2 2 控制与辨识问题 大量文献对辨识与控制的关系进行了讨论。f a r i s o n 等人对辨识与控 制问题相互分离的情形进行了研究“,w i t t e n m a r k 等对二者相互结合的 情形也进行了深入的讨论”。下面我们将就一个简单的随机系统的控制与 辨识问题展开讨论。 针对f 面的单输入单输出随机系统模型: y t k ) 一y ( k 一1 ) = b u ( k 一1 ) + p ( )( 2 2 ) 其中, 是未知的系统参数,设为常数。 e 倒) 序列为不相关的零均值平 稳高斯随机向量,方差为盯2 。假设系统的期望输出为0 ,于是构造该系 统的最小方差目标函数为 j ( k ) = e y ( k + 1 ) 2 陟( ) ,y ( o ) :“( k 1 ) “( o ) ( 2 - 3 ) 式( 2 2 ) 中的未知参数b 可通过最小二乘法估计得到m 】: 62 e b l y ( k ) 一y ( k 1 ) ,( o ) “似一1 ) :“( o ) ) p 。( 女) 2 白r ( 6j y ( 女) y ( k 一1 ) :y ( o ) u ( k1 ) 、“( o ) ) 其中p 。似) 为参数估计误差的协方差。 首先求解参数6 己知的情况下使目标函数式( 2 3 ) 最小的最优控制。将 式( 2 3 ) 最小化,得: m i n j ( k ) = f 啦? ( e ( ,( t ) + b u ( k ) + e ( 女+ 1 ) ) = i y ( ) ,;y ( o ) u ( k 1 ) “( o ) ) ”r 1 l 叫 n u n ( y ( 七) + 6 “( 七) ) 2 十仃2 ) = 盯2( 2 4 ) ulh - j 显然,此时的最优控制律为“t ) = 一;y ( 女) 。若参数6 未知,不考虑估计的 不确定性,视参数的最d , - - - 乘估计i 为系统的真实参数值,可得: 娴一吉m ) ( 2 - 5 ) 这种确定性等价( c e r t a i n t ye q u i v a l e n c e ,c e ) 原理在很多实际情况中具 6 西安理工尢学硕士学位论文 裔应爝价氆 。可以看出,此融瓣识参数敬过程与控制策略是褶互分离的, 当耱羟嶷。转) 并不影豌下一步的参数臻沃。对系缓进行蹬燕翱对,峦蕞 表示参数瘩诗过程懿瑟惑窿捌,量嵇+ 1 ) 为擎瑟投因子,反映了藏 制与估计两种作用之问的均衡度。从式( 2 。1 2 ) 可以看出: 1 )在性能指标函数中增加新息的方麓颂,为参数估计效果的改善提供了 额外的信息,由此提高了闭环控制的性能; 2 ) 通过改变学习因子a ( j ) 的大小,可以提高或降低新的参数估计值在 对偶作用中的比例。此前所得的诸如确定性等价( c e ) 控制、谨慎控 制等控制策略都是这种算法的特例。 本文对m i i t o 等人所提出的单输入肇输出缱规系统的对偶自适应控制 蘩潦进行了疆究,叉以多输入多竣蠢| ;蠹辘系统为疆究对象,将该算法接广 爨1 多变量的渍形,洋缀蠹枣将在下瓣懿肇节中遂行阐述。 2 4 小结 对偶自适应控制是近年来一个十分活跃的研究领域。经过四十多年的 发腱,该领域在对偶性质的分析、线性化处理、次优目标函数描述和参数 估计不确定性的度量等方面都获得了丰寓的理论和应用成果。当前提出的 对偶控制策略尽管是次优的,但其在控制性能上大大优于非对偶控制,对 糇动髓枧最优控制策略的发展起卷麓爱瓣 乍用。但是,迄今为止所提出的 各静控铡蒙略仍熬存在研究方法蕈一、诗算藿较大熬离题;并且仅有极少 数算法爵隧给出程应静理论鑫蒺分辫,逶蠲懿莲淘龟较窄嘲,霞魏识然零 甏深入的研究。 对偶自适应控制的研究工作方兴来艾,尤其是当前在系统不确定性严 羹困扰控制界的情况下,研究对偶翻懋应控制策略更加具有理论和实际意 义。今后在以下几个方面应当加强研究工作: 1 ) 继续研究对偶自适应控制算法,尤其是易实现、计算量较小且可以赢 接应用于工业生产实际过程的控制篇略: 对偶自适应援制 2 ) 将对弱自适应控割熬研究飙单纯靛参数不确定往情况全丞箍广到系统 络稳其煮不确定牲瑟猿提; 3 ) 突破对稻叁逶应控裁嚣懿蕈一缭褥形式,尝试与警畿控麓等恶戆避一 步结合,如基于神经露络模型设计耨的对偶舀适应控制策略。这种控 制思想扩充了研究系统的模型结构嘲胁1 ,具有重要的研究价值。 西安理工大学硕士学位论文 3 基于新息的对偶自适应控制 本章对m i l i t o 等人提出的针对单输入单输出随机系统的基于新息 ( i n n o v a t i o n ) 的对偶自适应控制进行了研究,并在此基础上将其推广到 多变量的情形。下面分别针对单输入单输出( s i n g l ei n p u t s i n g l eo u t p u t , s i s o ) 与多输入多输出( m u l t i i n p u t m u l t i o u t p u t ,m i m o ) 随机系统的情 况进行讨论。 3 1s i s 0 随机系统的对偶自适应控制 针对具有未知参数的s i s o 随机系统,利用系统的新息序列,将系统 参数随机变化的最小方差控制转化为多个基于新息的单步控制问题,利用 卡尔曼滤波对未知的系统参数进行估计,最终可以实现对偶制。m i l i t o 等 人将其称为i d c ( d u a lc o n t r o lb a s e do ni n n o v a t i o n s ) 控制“。 3 l ls i s 0 随机系统最小方差控制问题 考虑下面的s i s o 随机系统 y ( e + 1 ) 一1 y ( k ) 一一a y ( 七一门+ 1 ) = b l u ( k ) + 十6 。“( 七一m 十1 ) + p ( 七)( 3 1 ) 其中k = o ,1 n 一1 。y ( k ) ,u ( k ) 分别是系统在足时刻的输出和输入;p ( 女) 为零均值的高斯白噪声序列,方差为盯2 ;m 与一分别为系统的输入阶次 和输出阶次。 将未知的系统参数构造为状态向量i s t ( t ) = 【6 。:6 1 6 。a 。n : ,假 设r ( o ) 具有初值i ( o ) 和估汁误差协方差阵的初值,( o ) ;量测矩阵为 巾7 ( t ) = 【“( ) ,“( 一m + 1 ) ,j j ( ) ,y ( k 一”+ 1 ) j ,将 时刻已知的所有输入量 和可量测的所有输出量构成控制过程的实时信息序列,记为 l ( k ) = u ( k1 ) :“( 0 ) ,( t ) ( 1 ) ,( 0 ) 】一t = 0 :1 n l( 3 2 ) 其中初始条件定义为( o ) = 阻( 一1 ) ;,“+ 1 ) y ( o ) 一y ( 一”+ 1 ) 】。随机自适应 控制的目标是:选择控制输入“( 女) = 厂( ( ) ) 为i ( k ) 的函数,使系统的实际 1 基于新息的时偶岛迓应控制 埝懑炎婶琵够跟踩期望轨迹只鳓。众掰瘸知,随辊系统的输出是无法准 确颈溺豹,墨蓝翻溺实嚣输出y f 妁与瓣黧羧篷y ,穆) 豹最,、方差丞数传为 强标蕾数,霉圈 。1 : 一1 1 = f y ( 女十1 ) - y ,( 膏+ 1 ) r p ( 膏) ) ( 3 - 3 ) = 0 于是随机的最小方差控制问题可以从数学上描述为: 寻求控制策略“( 女) = 厂( ,( 女) ) ,使榭式( 3 3 ) n 性能指标最小。其中“( t ) 怒实时信息序列( 女) 的函数。可见詹时刻的控制输入“( 七) 取决于过去时刻 的输入量和已知的输出信息。 3 1 2 最小方差闯题缒对镐控钊策略 将爨s 1 s o 疆瓿系统静输灭羧壅攘黧0 。 ) 式表示为热下筑凌态空阉表 达式: x ( k + 1 ) = 0 ( 露) x ( 青) + w ( 露) ( 3 - 4 a ) ,啦) = 中1 ( k ) x ( k ) 十e ( 膏) ( 3 - 4 b ) 其中,状态向量x ( k ) 定义为z 7 ( ) = 嗡。6 7 。b 。a 1 ( 2 ,吒】,表示系统的 未知参数向量,按照式( 3 - 4 a ) 的动态过程随机变化:j ,( 尼) 表示可量测的 系统输出,定义量测向量集妒。= y 7 ( o ) ,y 7 ( 1 ) ,y 7 ( 是) ;4 ( 女) 与妒( 女) 分 别表示系统矩阵和量钡0 矩阵,可以时变也可时不变,本章取彳( t ) 为时不 变。定义w 女) 帮e ( k ) 分别为模型嗓声秘羹 测噪声向量,相互独立,分别服 扶n ( o ,置,n ( o r :) 静毫颠分毒;寿) 与( 聋) 熬条俘穰率努_ 毒是褰囊豹; 曼琢) ,y ( 约与w 渤、。鳓耨互独立。 为了估计系统酶未知参数,褥卡尔受滤波技术应用至式p 4 a ) ( 3 舶) 所示的模型中,可得: ( + l 忙十1 ) = a i ( k l k ) 十k ( 女+ l 陋+ 1 ) v ( k + 1 ) = a i ( i i ) + 世( + 4 i + 1 ) y ( + 】) 巾7 ( ) 瓜( f 女) 】 ( 3 - 5 a ) k ( k + q 七+ 1 ) = p ( k + 1 k ) m ( 露) 【7 ( 七) p ( 七+ 1 ) o ( 玉) + r 2 】1( 3 5 b ) p ( i + l 忙) = a p ( t i k ) a 7 + 胄, ( 3 - 5 c ) 西安理工九学硕士学位论文 p ( k + 1 1 k + i ) = p ( k + i l k ) - k ( k + 秘+ 1 ) 辔7 ( ) 尹( 女+ l 舞) ( 3 5 d ) 葵中i 疆l 女为k 嚣蒸豹滤波,式抟斗1 # 专毡为滤渡增益,p ( k - l i k + 毡表示 滤波误差懿秘方差,零。 ,覆为爨浏戆簿。定义v ( k l 鸯耨惑痔确懿下渊l : 七+ 1 ) = ,f 量+ 1 ) 一多( 量+ l 降) 嚣j ,( 七斗1 ) 一乖7 ( 量) a ( 露) 王( 垂辟l( 3 - 6 ) 己知用动态规划无法求解以( 3 ,3 ) 式为目标函数的随机最优控制,基于 m i l i t o 等人提出的控制策略,利用新息可将原步动态规划问题转化为下 面的个单步随机最优控制问题,于是得到新的目标函数为: ,【“( 七) ,( 七) 】= m 啦占 i y ( 七+ 1 ) 一y r ( 七十1 ) j :一五( 七十1 ) v2 ( 七十l w ,( 七) ( 3 - 7 ) = 0 3 一l 。其中学习因子五( 妁袭缝控制作耀与参数估计之闽的均衡稷 壤,满足0 毒女l 。在k 嚣藜懿| 雯怒缮赫函数孛雩| 入一盖馨+ 1 ) v 2 女斗1 ) 磺, 觚瘫整荦霉控裁器繇含靛信塞羹委热丰藜,趸毒裂予对素翔参数戆蘩谖,滏 精致善了系统酶整体控裁品矮。m i l i t o 等人籀出,焉这静令苹步最傀控 制问题代替以( 3 3 ) 式为目标函数的髓桃袋优控制问题,可以得到几乎幅 同的控制效果。下面根据新的目标函数( 3 7 ) 式设计随机系统式( 3 一1 ) 的对 偶自适应控制器。 为了将( 3 7 ) 式的目标函数最小化,首先必须将其化为控制“( t ) 的恩 式函数: 疆牡啦) 蠹= 日o ( k + l i 靠) + v 血+ 1 ) 一y ,( 奄+ i ”! 丑 七+ 1 ) v 2 睡+ 1 ) 】 = 1 1 一五 嘉十0 t 盈f ! ( 壹+ i 强十或k 牛i | 壹) 一,( 素+ l 强2 = l l - x ( k + l 奠【蚤馨,p 嵇i 辔 o 搬6 ( ) 0 的条件下,褥到 该最,l 、方差差事馁控裁力 “( 女) = 【l 一五( 女十1 ) 】忍( ) + 6 ( 女) 6 。( 女) j ”x ( ( 1 一a ( k 十1 ) ) ( k ) 十6 ( ) d7 ( t ) 】p ( 女) 一6 ( ) ,( ) ( 3 1 1 ) 从式( 3 1 1 ) 中可以看出,k 时刻的控制“( ) 除了与未知参数的供计值 女) 与6 仕) 有关之羚,还要受到嵇诗误差蟛方菠黪( 嚣渤与气 + 6 ( 女) 口。( ) 】r ( ) 一6 ( t ) ,( i ) ) ( 3 - 2 b ) 由( 3 1 2 a ) 式可见,令丑( ) = 1 所得的控制为确定性等价( c e ) 控制;( 3 - 1 2 b ) 式刚表磷 毒 = 0 划可以得到谨慎( c a u t i o u s ) 控铡。c e 控裁完全忽嬉了 参数斡不雅定侄;丽c a u t i o u s 控隶l 霹极荬谨镶,当参数不确定馁较大, 即参数辨识精度较差时又易产生关断( t u r n - o f f ) 现象。对偶自适应控制 则介于二者之间,较这两种非对偶控制的性能鼹佳。本章的仿真分析中将 对这乏种控制的性能作以比较。同时三者的联系还表明,由于i d c 控制 器兹学习藤子i 辑) 表征静是羧潮馋雳与参数佶诗溪卷之阕兹均囊痰,宅应 西安理王走拳矮圭擎镶论文 介于名( ) = 1 ( c e 控制) 与五( ) = o ( c a u t i o u s 控制) 之间取值。下面针对 学习因子五( t ) 的取值范围进行讨论。 仍根据( 3 1 0 ) 式求关于控制“( 女) 的二阶德等0 1 - _ j t u ( k 。) j r ( k ) 。为侵,强) 一 达戮焱小,其二除镝譬寝满足 里二! 譬j ;j :;垡盟:2 【( 1 一五( i )

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论