已阅读5页,还剩112页未读, 继续免费阅读
(运筹学与控制论专业论文)传感器数据融合中的最优控制计算.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 传感器数据融合中的最优控制计算 运筹学与控制论 冯志国 赵怡教授张国礼教授 摘要 传感器是获取信息的工具,是信息采集的关键。而在现实生活中,单个传感 器的功能单一,局限性太多,不适于采集更精确的数据。因此,多传感器的应用 就越来越普遍了。另一方面,多传感器系统也带来了管理上的问题,即如何合理 利用这些传感器的问题。 本文共分八章。第一章为引言,第二章介绍了最优控制计算的方法,第三章 介绍了卡尔曼滤波与传感器的数据融合。 第四章考虑了离散时间的传感器数据混合问题,通过分配适当的权重到每一 个传感器数据源,使得融合后的数据的无偏差最小方差估计的误差达到最小。这 个问题是一个随机性的离散时间最优控制问题,本文证明了它与一个确定性的离 散时间最优控制问题等价,而权重就转化为相应的控制向量。从理论上给出了最 优解的存在性证明,并通过得出目标泛函与约束泛函的梯度表达式,转化为约束 数学规划问题求数值解。最后给出了两个数值例子。 第五章考虑了连续时间的传感器数据混合问题,通过分配适当的权重函数给 每一个传感器数据源,使得融合后的数据的无偏差最小方差估计达到最小。这些 权重函数是取值于有界变差函数空间上的。这个问题是一个随机性的连续时间最 优控制问题,本文证明了它等价于一个确定性的连续时间最优控制问题,而权重 函数就转化为相应的控制函数。本文给出了控制函数最优解的存在性的证明。在 数值解上,通过控制参数化方法与c p e t 技巧,把原问题转化为一系列的最优参数 选择问题。对于每一个最优参数选择问题,本文给出了目标泛函与约束泛函的梯 度表达式,从而转化为约束数学规划问题求解。另外,本文也给出关于这个数值 方法的收敛性分析。最后给出了两个数值例子。 摘要 第6 章考虑了离散时间的一个传感器数据调度问题,即选取一个最优的调度策 略,根据这个调度策略,在每一时刻打开其中的一个传感器,使得融合后的数据 的无偏差最小方差估计最优。这个问题是一个随机性的离散时间最优控制问题, 其中它的控制向量是离散向量。它与一个确定性的离散时间最优控制问题等价。 本文采用分支定界法解决这个问题。通过对它的误差协方差矩阵系统的正半定性 质进行分析,定义了一系列的下界系统,作为用分支定界法求解时的下界表达 式。通过这些下界,绝大多数的分支将不用被搜索。本文举了的两个例子,说明 了这个算法高效率性。 第7 章考虑了离散时间的另一个传感器数据调度问题。这个问题更具有一般 性,它在每一时刻可以打开其中的一些传感器,使得融合后的数据的无偏差最小 方差估计最优。这个问题依然是一个随机性的离散时间最优控制问题,其中它的 控制向量由两部分组成,一部分是调度策略,这是离散值变量,另一部分是在给 定的调度策略下分配给相应的传感器的权重,这是连续值变量。这个问题与一个 确定性的离散时间最优控制问题等价。本文通过对它的误差协方差矩阵系统进行 分析,得出了一系列的下界系统,作为用分支定界法求解时的下界表达式。通过 这些下界,绝大多数的分支将不用被搜索。而对于每一个搜索到的调度策略,相 应的权重分配问题是一个离散时间的最优控制问题,并且它的控制变量是连续 的。因此,可以通过m i s e r 求出相应的最优权重。本文通过两个例子说明了这个 算法的高效率性。 最后就是总结这篇论文,并给出了以后研究的方向。 关键词:传感器,卡尔曼滤波,数据融合,最优控制,控制参数 化,c p e t ,m i s e r ,分支定界法,下界系统。 一i i a b s t r a c t o p t i m a lc o n t r o lc o m p u t a t i o ni ns e n s o rd a t af u s i o n o p e r a t i o n a lr e s e a r c ha n dc o n t r o lt h e o r y f e n g ,z h i g u o p r o f z h a o ,y i p r o f t e o ,k o k l a y a b s t r a c t s e n s o ri sad e v i c et h a tm e a s u r e sa n dr e c e i v e si n f o r m a t i o ni nd a t aa c q u i s i t i o n t h e f u n c t i o no fa s i n g l es e n s o rm a y n o tb ea d e q u a t et oa c q u i r eu s e f u ld a t an e e d e di na p p l i c a - t i o n s t h u s ,t h eu s eo f m u l t i s e n s o r si si n e v i t a b l e s i n c em u l t i s e n s o r sa r eb e i n gi n v o l v e d , t h e r ei san e e dt ok n o wt h em o s te f f i c i e n tw a yo f u t i l i z i n gt h e s em u l t i - s e n s o r s t h e r ea r e8c h a p t e r si nt h i st h e s i s i tb e g i n sw i t ht h ei n t r o d u c t i o n t h e n ,c o m p u t a t i o n a tm e t h o d sf o ro p t i m a lc o n t r o lm e t h o d sa r ed i s c u s s e di nc h a p t e r 2 c h a p t e r3p r e s e n t s ab r i e fr e v i e wo fr e s u l t so nf u s i o no fs e n s o rd a t af o rk a l m a nf i l t e r i n g i nc h a p t e r4 ,t h eo p t i m a lc o n t r o lo ff u s i o no fs e n s o rd a t ai nd i s c r e t et i m ei sc o n s i d e r e d i t sa i mi st oa s s i g nw e i g h tt oe a c ho ft h es e n s o rs o u r c e si ns u c haw a yt h a tt h e e s t i m a t i o ne r r o ri sm i n i m i z e d ,w h e r et h e s ew e i g h t sa r et a k e na sc o n t r 0 1v a r i a b l e s t h i s p r o b l e mi sad i s c r e t et i m es t o c h a s t i co p t i m a lc o n t r o lp r o b l e m i ti se q u i v a l e n tt oad e t e r m i n i s t i co p t i m a lc o n t r o lp r o b l e mi nd i s c r e t et i m e t h eg r a d i e n tf o r m u l a so ft h ec o s t f u n c t i o na sw e l la st h ec o n s t r a i n t sa r ed e r i v e d o nt h i sb a s i s ag r a d i e n t b a s e dn u m e r i c a l m e t h o di so b t a i n e d ,a n dt w on u m e r i c a le x a m p l e sa r es o l v e d t h eo p t i m a lc o n t r o lo ff u s i o no fs e n s o rd a t ai nc o n t i n u o u st i m ei sc o n s i d e r e di n c h a p t e r5 ,w h e r et h ea i mi st oa s s i g nw e i g h tf u n c t i o nt oe a c ho ft h es e n s o rs o u r c e si n s u c haw a yt h a tt h ee s t i m a t i o ne r r o ri sm i n i m i z e d t h e s ew e i g h tf u n c t i o n sa r et a k e na s c o n t r o lf u n c t i o n s ,w h i c ha r er e s t r i c t e dt ot h es p a c eo fb o u n d e dv a r i a t i o nf u n c t i o n s t h i s p r o b l e mi sac o n t i n u o u st i m es t o c h a s t i co p t i m a lc o n t r o lp r o b l e m i ti se q u i v a l e n tt oa d e t e r m i n i s t i co p t i m a lc o n t r o lp r o b l e mi nc o n t i n u o u st i m e q u e s t i o n so nt h ee x i s t e n c e o f o p t i m a lc o n t r o l sa r ea d d r e s s e d t h ec o n t r o lp a r a m e t r i z a t i o nt e c h n i q u ea n dt h ec o n t r o l i i i r lnrrlll_-r l - i r l_-r- a b s t r a c t p a r a m e t r i z a t i o ne n h a n c i n gt r a n s f o r m ( c p e t ) a r eu s e dt oc o n s t r u c tas e q u e n c eo fa p p r o x i m a t eo p t i m a lp a r a m e t e rs e l e c t i o np r o b l e m s f o re a c ho f t h e s eo p t i m a lp a r a m e t e rs e l e c t i o n p r o b l e m s ,t h eg r a d i e n tf o r m u l a so f t h ec o s tf u n c t i o na sw e l la st h ec o n s t r a i n t sa r ed e r i v e d o nt h i sb a s i s ,ag r a d i e n t b a s e dn u m e r i c a lm e t h o di sd e v e l o p e d ,w h i c hs o l v e se a c ho f t h e s e o p t i m a lp a r a m e t e rs e l e c t i o np r o b l e m sa sam a t h e m a t i c a lp r o g r a m m i n gp r o b l e m c o n v e r - g e n c ea n a l y s i so ft h en u m e r i c a lm e t h o di sg i v e n ,a n dt w on u m e r i c a le x a m p l e sa r es o l v e d c h a p t e r6c o n s i d e r sas e n s o rs c h e d u l i n gp r o b l e m i nt h i sp r o b l e m ,o n l yo n es e n s o r i sa l l o w e dt ob et u m e do na te a c ht i m ett oa c q u i r et h es i g n a ls oa sn o tt or e v e a lt h eo t h e r s e n s o rs o u r c e s t h eo b j e c t i v ei st oo b t a i na l lo p t i m a ls c h e d u l es u c ht h a tt h ee s t i m a t i o n e r r o ri sm i n i m i z e d t h i si sad i s c r e t et i m es t o c h a s t i co p t i m a lc o n t r o lp r o b l e mw i t hc o n t r o l t a k i n gv a l e sf r o mad i s c r e t es e t i ti se q u i v a l e n tt oad e t e r m i n i s t i co p t i m a lc o n t r o lp r o b l e mi nd i s c r e t et i m e ab r a n c ha n db o u n dm e t h o di sd e v e l o p e df o rs o l v i n gt h i se q u i v a l e n t p r o b l e m f o rt h i s ,e f f i c i e n tb r a n c h i n gr u l e sa r en e e dt ob ec o n s t r u c t e d b yu t i l i z i n gt h e p o s i t i v es e m i d e f i n i t ep r o p e r t yo ft h ee r r o rc o v a r i a n c em a t r i x ,w ec o n s t r u c tas e q u e n c e o fl o w e rb o u n ds y s t e m s t h es o l u t i o n so ft h e s el o w e rb o u n ds y s t e m sa r et h e nu s e dt o p r o v i d ee f f e c t i v el o w e rb o u n d sf o rt h ec o n s t r u c t i o n so ft h eb r a n c h i n gr u l e so ft h eb r a n c h a n db o u n dm e t h o d w i t ht h e s el o w e rb o u n d s ,m a n yb r a n c h e sc a nb ei g n o r e d t h ea l g o r i t h mo b t a i n e di sh i g h l ye f f e c t i v ea n de f f i c i e n t t h i si sc l e a r l ys e e nf r o mt w on u m e r i c a l e x a m p l e st h a tw es o l v eu s i n gt h i sa l g o r i t h m c h a p t e r7c o n s i d e r sam o r eg e n e r a lc l a s so fo p t i m a ls e n s o rs c h e d u l i n gp r o b l e m , w h e r en 2s e n s o r so u to ft h en ls e n s o r sc a nb et u m e do na te a c ht i m ett oa c q u i r et h e s i g n a ls u c ht h a tt h ee s t i m a t i o ne r r o ri sm i n i m i z e d t h i si sa g a i nad i s c r e t et i m es t o c h a s t i c o p t i m a lc o n t r o lp r o b l e m ,w h e r et h ec o n t r o li sm a d eu po ft w op a r t s t h ef i r s tp a r ti s t h es c h e d u l i n gs t r a t e g y , w h i c hi sr e p r e s e n t e db yd i s c r e t ev a l u e dv a r i a b l e s t h es e c o n d p a r ti st h ea s s i g n m e n t so ft h er e s p e c t i v ew e i g h t st ot h en 2s e l e c t e ds e n s o r s ,w h i c hi s r e p r e s e n t e da sc o n t i n u o u sv a l u e dv a r i a b l e s t od e t e r m i n ew h i c hs c h e d u l i n gs t r a t e g yn e e d s t ob ec o m p u t e df u r t h e rf o rr e s p e c t i v ew e i g h ta s s i g n m e n t so fs e n s o r s ,as e q u e n c eo fl o w e r b o u n ds y s t e m si si n t r o d u c e dt op r o v i d ee f f e c t i v el o w e rb o u n d sf o rt h ec o n s t r u c t i o n so f t h eb r a n c h i n gr u l e so ft h eb r a n c ha n db o u n dm e t h o d w i t ht h e s el o w e rb o u n d s ,m a n y b r a n c h e sc a nb ei g n o r e d w i t hr e g a r d st oe v e r ys c h e d u l i n gs t r a t e g y , t h er e s p e c t i v ew e i g h t a s s i g n m e n tp r o b l e mi sad i s c r e t et i m eo p t i m a lc o n t r o lp r o b l e mw i t hc o n t i n u o u sv a l u e d c o n t r 0 1 t h u s ,t h eo p t i m a lc o n t r o ls o f t w a r ep a c k a g e ,m i s e r ,c a nb eu s e dt oo b t a i nt h e o p t i m a lw e i g h t st ob ea s s i g n e dt ot h er e s p e c t i v es e n s o r s t h em e t h o do b t a i n e di sh i g h l y i v a b s t r a c t e f f e c t i v ea n de f f i c i e n t i tc a nb es e e nf r o mt w on u m e r i c a le x a m p l e st h a tw es o l v e du s i n g t h i sm e t h o d t oc o n c l u d et h i st h e s i s ,w em a k ean u m b e ro fc o n c l u d i n gr e m a n sa n ds u g g e s t i o n s f o rf u r t h e rr e s e a r c ht o p i c s k e yw o r d s : s e n s o r , k a l m a nf i l t e r , d a t af u s i o n ,o p t i m a lc o n t r o l ,c o n t r o l p a r a m e t r i z a t i o n ,c p e t , m i s e r ,b r a n c ha n db o u n dm e t h o d ,l o w e rb o u n ds y s t e m 一v 一 统的动态特性去选取控制规律使控制系统按照一定规律运转,并使系统的性能或 品质达到最优。 通常的最优控制问题可以抽象成共同的数学问题。一般来说,最优控制问题 包括以下几个元素: ( 1 ) 、受控系统 一个最优控制问题首先是建立在一个受控系统上,而受控系统的数学模型是 动态系统的微分模型或差分模型。这个微分或差分表达式称为状态方程,它描述 了状态向量的变化规律。一般可以表示为: 或离散情形的 初始条件是 圣( 亡) = f ( t ,z ( 亡) ,u ( 亡) ) ( 1 1 ) x ( t + 1 ) = f ( t ,z ( t ) ,u ( t ) ) ( 1 2 ) x ( t o ) = z o ( 1 3 ) 其中,z 融表示状态向量,乱表示控制向量。 ( 2 ) 、目标集 动态系统( 1 1 ) 或( 1 2 ) 在控制向量u ( 亡) 的作用下会发生状态转移。一般来说,初 始状态是已知的,所要达到的状态是控制的目标,称为末态。通常,末态可用末 态约束条件来表示: 咖1 ( 亡,z ( 亡,) ) = 0 ( 1 4 ) 咖2 ( t f ,z ( t ,) ) 0 ( 1 5 ) 其中,亡,是末态时间,可以事先规定,也可以是未定的。有时初态也没有完全给 定,初态集合可以用初态约束来表示。 满足末态约束的状态集合称为目标集。 ( 3 ) 、容许控制 第1 章引言 在实际问题中,控制量一般会受到某种限制,只能在一定范围内取值,即必 须要满足一定的控制约束条件。所有满足控制约束的点集称为控制域,记为“, 则在控制域上取值的每一个控制函数u 称为容许控制,记为乱1 4 。 第( 2 ) ( 3 ) 项从数学角度来看都是约束条件。更一般地,有 ,n 仇( u ) = 西 ( z ( 死i 钆) ) + c t ( 亡,x ( t l u ) ,u ( t ) ) d t = 0 ,i = 1 ,e( 1 6 ) j t 0 ,n 阢( u ) = 西i ( z ( 丁l l 钆) ) + c i ( 亡,z ( t m ) ,u ( t ) ) d t 0 ,i = e + 1 ,n( 1 7 ) j t 0 或离散情形的 t y 1 俄( 钆) = 垂i ( z ( t 小) ) + 厶( t ,x ( t l u ) ,u ( t ) ) d t = 0 , i = 1 ,e( 1 8 ) t = t o t 一1 吼( u ) = m ( z ( t 小) ) + c t ( 亡,x ( t l u ) ,u ( t ) ) d t 0 ,i = e + 1 , ( 1 9 ) t = t o ( 4 ) 、性能指标 为了在控制集中找到一种效果最好的控制,需要建立一种评价控制效果好坏 的性能指标泛函。性能指标的选取与设计者的着眼点有关,同一问题的性能指标 第1 章引言 连续情形的一般形式为:给定受控系统( 1 1 ) 和初始条件( 1 3 ) ,求一容许控 制u “,使性能指标泛函( 1 1 0 ) 达到最小,并且满足约束条件( 1 6 ) $ 1 1 ( 1 7 ) 。 离散情形的一般形式为:给定受控系统( 1 2 ) 和初始条件( 1 3 ) ,求一容许控 制乱“,使性能指标泛函( 1 1 1 ) 达到最小,并且满足约束条件( 1 8 ) 和( 1 9 ) 。 一般来说,最优控制问题有三种解决方法:变分法、极小值原理与动态规 划( 参考 1 】) 。然而,很多实际问题是找不到严格的解析解的。在这种情况下,寻 找数值解就变得很重要了。 关于数值解的计算,目前有很多种算法成功运用到最优控制理论中。在第二 章里给出了控制参数化的方法的具体描述。参数化的方法很直观,就是把控制函 数通过参数化后的一系列的样条函数来逼近,原问题就转化为一系列的最优参数 选择问题,从而通过解决这一系列的最优参数选择问题来逼近原问题的最优解。 对于这个方法,已经集合到软件m i s e r 中。 在第二章里也给出了c p e t 的原理。c p e t 是一种技巧,它所解决的是在控制 参数化基础上如何参数化的问题。一般来说,控制函数的参数化有很多种方式, 如果选择的参数化方式不好,那么当达到所需的精确度时,计算的复杂度将会大 大提高。c p e t 所解决的就是这个效率问题,通过引入新的时间轴,选取有效的 参数化方式,降低计算的复杂度,从而达到满意的效率。 以上所考虑的是连续控制的情形,而对于离散值控制的情形,目前并没有很 有效的算法可以利用,这主要是因为离散值优化非常难处理。特别地,对于切换 系统中的决定切换顺序的控制,就更难处理了,目前还没有处理切换顺序的文 献。 最优控制的应用非常广泛,在各个领域里都有很多成功的应用。本文所考虑 的应用例子是传感器的数据融合模型。从建立的数学模型可以看到,它实际上是 一个随机性的最优控制问题,但它可以转化为相对应的确定性的最优控制问题进 行处理。 本文在第三章里给出了传感器数据融合问题的初步描述,而从第四到第七章 具体考虑了4 个不同的数据融合模型,建立了各自的数学模型,讨论了最优解的存 在性,并提出了相应的算法对数值解求解。 关于数值解的求解,不同的数据融合模型有不同的处理方法。由于数据融合 分为混合和调度两种方式,那么当它们转换为最优控制问题后就对应着连续控制 和离散控制的情形。对于连续控制的情形,本文采用第二章讨论的控制参数化方 法,并运用c p e t 进行处理。对于离散控制的情形,本文引进下界系统的定义,给 一3 一 第1 章引言 出下界表达式,通过分支定界法求解。另外,本文在第7 章还考虑了连续控制与离 散控制都存在的情形,所采用的方法就是将控制参数化与分支定界法相结合起来 的混合算法。 一d 一 第2 章最优控制的数值计算 第2 章最优控制的数值计算 在很多实际问题中,严格的解析解是求不出来的,这时候需要讨论它的数值 解。 最优控制问题从本质上还是一个优化问题。与一般优化问题不同的是它有一 个动态系统方程,并且需要处理的并不是变量,而是控制函数。一般来说,可以 通过控制函数的参数化,把控制函数表示为一序列的样条函数,原问题就可以转 换为一系列的最优参数选择问题,而这一系列的最优参数选择问题的解是逼近原 问题的解的。对于最优参数选择问题,它可以转化为一般的约束数学规划问题。 这样,最优控制问题就可以通过求解一系列的约束数学规划问题得到。一般地, 约束数学规划的形式是: r a i nf ( x ) ( 2 1 a ) x 雌n 并满足约束条件: 缈( x ) = 0 ,j = 1 ,m g j ( x ) 0 ,j = m + 1 ,m + 7 ( 2 1 b ) ( 2 1 c ) 其中,f 和j = 1 ,m + r ,是关于n 维变量x 的连续可微函数。 对于大规模的约束优化问题的求解,需要很多有效的数值算法。现在有很多 这样的算法,每一种在各自的应用领域是高效的。详细的可参考 2 ,【3 ,【4 和 5 】 。在这里要提到的是序n - 次规划法( 参考 3 , 6 f f i 7 ) 。这个方法被认为是解决 中小型约束优化问题的最有效方法之一( 参考 7 】) ,它首先i 主t w i l s o n 在 8 】提出,并 i 主t h a n 在 9 和 1 0 】中,p o w e l l 在 11 1 ,以及s c h i t t k o w s k i 在 6 】和 7 】中加以推广。由 于内容太多,在这里将不介绍这个算法的原理。 软件m i s e r ( 参考 1 2 】, 1 3 , 1 4 】) 是处理最优控制问题的一个很有效的工具, 它的原理就是上面的这些方法以及序y t - 次规划算法。它由l s j e r m i n g s ,m e f i s h e r , k l t e o ,c j g o h 共同建立,目前已经发展到版本三。在后面的几章里, 它将用于对其中的一些最优控制问题进行求解。这一章主要是简要介绍一下它的 原理。 2 1 最优参数选择问题 这一节讨论的是最优参数选择问题,它是最优控制问题的一种特殊形式,并 一5 一 第2 章最优控制的数值计算 且任何一个最优控制问题的解都可以通过参数化为一系列的最优参数选择问题进 行逼近。而另一方面,最优参数选择问题可以转化为一般的约束数学规划问题。 2 1 1 问题的描述 考虑的动态系统是: 百d x ( t ) = 瞧x ( 帆) ,t ( t o , t y ( 2 2 a ) 其中,x = 【x l ,x n 】t 妒是状态向量,( = 【( 1 ,g 】t 时是参数向量,而 f = m ,厶 t 瓞” 初始状态是: x ( 亡0 ) = x o ( e ) , 其中,x o = k 2 ,z : t 瓞竹是一个给定的关于( 的向量函数。 定义 z = e = 6 ,g t 贰8 :a i qsb i ,i = 1 ,s 其中,a i $ u b t ,i = 1 ,s ,是实数。显然,z 是酞s 上的一个紧凸子集。 对于给定的一个( er 8 ,令x ( i ( ) 表示( 2 2 ) 相应的解。 所考虑的最优参数选择问题是: i 门j j w 聒:2 a ( p 2 1 ) :给定动态系统( 2 2 ) ,寻求一个系统参数( z 使得目标泛函 枨) = 州球小) ,卅r ,佻绯出 在z 上达到最小,并满足约束条件: f 2 2 b ) ( 2 3 ) ( 2 4 ) 仇( ( ) = 由t ( x ( 几le ) ,e ) + t q ,x ( te ) ,( ) d t = 0 ,i = 1 ,e( 2 5 a ) t ,t 0 厂n 吼( ( ) = 垂t ( x ( le ) ,( ) + c t ( t ,x ( te ) ,e ) d t 0 ,i = e + 1 ,n( 2 5 b ) 其中,圣 和厶,i = 0 ,1 ,是给定的实函数;对于每一个i = 0 ,1 ,死是 一6 一 第2 章最优控制的数值计算 第i 个约束泛函的特征时间,满足0 死t 和罚= t f 。 ( 2 4 ) , 1 1 ( 2 5 ) 称为目标泛函和约束泛函的标准形式。 假设下面的条件得以满足。 ( a 1 ) v i = 0 ,n 和酞3 任意的一个紧子集y ,存在一个正常数k ,使得v ( t ,x ,( ) ( t o ,t f 瞅xv ,有 i f ( t ,x ,( ) i k ( 1 + i x l ) 怆( 亡,x ,e ) i k ( 1 + i x i ) ; ( a 2 ) f 和厶,i = 0 ,1 ,以及它们关于x 和( 的偏导数对于给定的一个( x , ) 时x 酞8 在 t o ,t l 】上是分段连续的,并且对于给定的一个t ( t o ,t f 】在础x 时 上是连续的; ( a 3 ) 哦,i = 0 ,1 ,关于x 和e 是连续可微的。 由微分方程理论,对于任意给定的一个e z ,( 2 2 ) 有一个唯一的解x ( l ( ) 。 2 1 2 梯度表达式 可以看到,最优参数选择问题是一个优化问题,但是与一般优化问题不 同的是,它的目标泛函里含有状态向量函数,而这个状态向量由动态方程给 出。目标泛函是关于参数( 优化的,当用序列二次规划法求解时,就需要知 道俄,i = 0 ,1 ,n 关于参数的梯度表达式。 对于每一个i = 0 ,1 ,定义相应的h a m i l t o n i 函数甄: 凰( t ,x ,( ,a ) = l ( z ,x ,e ) + ( a ) t f ( t ,x ,( ) ( 2 6 ) 则对任一个参数( 酞8 ,考虑协态向量系统: 终端条件是 d ( a i f ( t ) ) t :一垒丝丛生三生娶掣,t ( t 。,n ) ( 2 7 a ) 如披 7 。一r 1 7 、7 ( 训t = 燮警幽 一,7 一 ( 2 7 b ) 第2 章最优控制的数值计算 其中,x ( - i ( ) 表示( 2 2 ) 在参数( 瓜8 下的解。令( l ( ) 表示( 2 7 ) 在参数( 殿下 协态向量系统的解。 目标泛函和约束泛函关于参数c 酞s 的梯度表达式由下面定理给出。 定理2 1 :考虑问题( p 2 1 ) 。对于每一个i = 0 ,1 ,n ,9 i 关于e 的梯度表达式是: 掣= 半删蚓t 警 + r 燮掣筹蚴州2 固 定理的证明在 1 5 】中给出。 这样,通过计算目标泛函和约束泛函的值以及关于参数的梯度值,最优参数 选择问题就转化为约束数学规划问题了。一般采用以下的步骤计算。 ( 1 ) 对于每一个给定的e z ,通过( 2 2 ) 从t = t on t = t y 计算它的解x ( le ) 。 ( 2 ) 对于给定的( z ,通过( 2 4 ) ,( 2 5 ) 和x ( i ( ) 分别计算玑( ( ) ,i = 0 ,1 ,的 值。 ( 3 ) 对于给定的( 2 ,由( 2 7 ) 从t = r 往后到亡= t o 计算它的解a i ( i ) 。 ( 4 ) 对于给定的( z ,由( 2 8 ) 计算仇( ( ) 关于e z 的梯度。 2 2 控制参数化 控制参数化方法是解决最优控制问题的一个有效方法,在 1 6 1 , 1 7 , 8 1 , 1 9 , 2 0 , 2 1 , 2 2 】中都曾使用过。一般来说,这个方法就是把区间 亡o ,t f 】分成若干个 子区间,并且控制函数由分段常数函数来逼近,那么最优控制问题就相应地由最 优参数选择问题来逼近。从上一节可以知道,这些最优参数选择问题可以转化为 一般的数学规划进行求解。而关于收敛性的结论,可以参考 2 3 1 , 2 4 ,【2 5 】,【2 6 , 2 7 , 2 8 , 2 9 】, 3 0 】, 31 , 3 2 。 2 2 1 最优控制问题的标准形式 考虑的动态系统是: 百d x ( t ) = 瞧x ( 亡) ,u ( 砒( t o , t 1 ( 2 9 a ) 一8 一 第2 章最优控制的数值计算 其中,x = p 1 ,z n 】t 时是状态向量,u = u l ,u r t i r r 是控制向量,而 f = ,厶】t r n 初始状态是: x ( t o ) = x 0 , ( 2 9 b ) 其中,x 0 = x o ,x o t r n 是一个给定的向量。 定义u 是科上的一个紧凸子集。那么,一个有界可测的向量函数u = 【u 1 ,札r 】t 称为是可容许控制,如果对几乎处处的亡( 0 ,卅,群r u ( t ) u 。令“ 表示所有这些可容许控制的集合。 对于给定的一个u 纠,令x ( iu ) 表示( 2 9 ) 相应的解。 所考虑的最优控制问题是: 问题( p 2 2 ) :给定动态系统( 2 9 ) ,寻求一个可容许控制u 甜使得目标泛函 ,t , g o ( u ) = 西o ( x ( t ,iu ) ) + c o ( 亡,x ( tu ) ,u ( t ) ) d t , ( 2 1 0 ) j t o 在“上达到最小,并满足约束条件: g i ( u ) = 西t ( x ( 兀iu ) ,u ) + c i ( ,x ( tu ) ,u ) d t = 0 , i = 1 ,e( 2 1l a ) t o ,一 g i ( u ) = 垂t ( x ( nu ) ,u ) + t ( t ,x ( tu ) ,u ) d t 0 , i = e + 1 ,n( 2 1l b ) 其中,咄和厶,i = 0 ,1 ,是给定的实函数;对于每一个i = 0 ,1 ,n ,t i 是 第i 个约束泛函的特征时间,满足0 兀t 和= t f 。 ( 2 1 0 ) 和( 2 1 1 ) 称为目标泛函和约束泛函的标准形式,因为任何一个目标泛函 或约束泛函都可以表示为上述形式( 参考 1 5 的c h a p t e r6 ) 。 假设下面的条件得以满足。 ( a 4 ) 对于耐任意的一个紧子集y ,存在一个正常数k ,使得v ( t ,x ,u ) ( t o ,t f 】 p v ,有 l f ( t ,x ,u ) i k 1 + l x l 】 一9 一 第2 章最优控制的数值计算 ( a 5 ) f 和厶,i = o ,1 ,以及它们关于x 和u 的偏导数对于给定的一个( x ,u ) 酞n 对在,t f 上是分段连续的,并且对于给定的一个t ( t o ,亡,】在取n 上是连续的: ( a 6 ) 虫i ,i = 0 ,1 ,关于x 是连续可微的。 由微分方程理论,对于任意给定的一个u l 毛,( 2 9 ) 有一个唯一的解x ( u 1 。因此,对于u “,结论也是对的。 2 2 2 参数化 考虑一个单调非减的子区间集合序列 伊) 器。,对于每一仰,酽是区 间,t l 】上的唧+ 1 个点,即 其中, 酽= t i p ,) t g = t o ,= 2 ,锰1 ,尼= 1 ,2 ,t b p 相应的子区间分划为p ,即 尹= 嫒:尼= 1 ,嘞 - , 其中,露= 雠一。,壤) 。 对于s 的选取,应满足下面的性质: ( a 7 ) s p + 1 三s v ; ( a 8 ) l i m 伊在 t o ,t f 】上稠密,即 口一+ o o l i m ,m ,a x 吲= 0 p + o o 向= l ,n o 其中,i 露l = 2 一壤一1 表示第七个子区间的长度。 考虑分段常数函数: t t p u p ( t ) = 盯p , k x 七= 1 1 0 一 ( 2 1 2 ) 第2 章最优控制的数值计算 其中,o - p ,七对,x s 表示特征函数: 记 其中, 则垆r 墓 矿= ( 矿,1 ) t ,( t t p , n p ) t 】t ( 矿,七) t = 盯啦,衅,詹】t ( 2 1 3 ) 容易知道,u p “p 和矿伊存在一一对应的关系。令卯表示所有这些舻的集 合,令一p 表示所有使得u p 卯的相应的o pe 竹p 的集合。 当u 取u p 卯形式时,微分方程( 2 9 ) 等价于: 百d x ( t ) = 酏x ( ) 7 t :r p ) ,( 2 1 4 a ) 其中, 酏x ( t ) ,矿) = f ( t ,x ( 亡) ,矿七) ( j ) 初始条件是: x ( 亡o ) = x o ( 2 1 4 b ) 令x ( i 矿) 表示( 2 1 4 ) 中对应于矿p 的解。 同样地,当u 取u p 妒形式时,约束( 2 11 ) 等价于: g i ( a p ) = 中l ( x ( 兀io p ) ) + c t ( t ,x ( 亡io p ) ,a p ) d t = 0 ,i = 1 ,e ( 2 1 5 a ) l ,t
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 脑梗塞患者的智能康复训练
- 2026年项目管理成熟度评估与改进指南
- 自闭症儿童的家庭干预计划
- 2026年康复治疗学专业实操实训报告
- 2026年社区新进护士岗前培训计划
- 练习9 《赏析小说的形象描写》同步练习 (含答案解析)2027年高考一轮总复习
- 2026届重庆市高三考前模拟预测语文试卷(原卷版及解析)
- 2026年幼儿园冬季用火取暖防一氧化碳中毒
- 2026年儿科医院感染管理质量持续改进
- 肉制品电商代运营合作协议
- LY/T 3455-2025竹牙刷
- 第19课 清朝君主专制的强化 课件 人教统编七年级历史下册
- 2024年新课标高考物理试卷(适用黑龙江、辽宁、吉林地区 真题+答案)
- 8S管理培训基础知识课件
- 小学科学教学仪器配备标准
- 城市智慧路灯(5G综合灯杆)建设工程项目(含方案设计及项目实施方案)
- SWITCH暗黑破坏神3超级金手指修改 版本号:2.7.4.84040
- 浙江省消防技术规范难点问题操作技术指南(2020版)
- GB/T 3179-2009期刊编排格式
- GB/T 28730-2012固体生物质燃料样品制备方法
- GB/T 24283-2018蜂胶
评论
0/150
提交评论