(运筹学与控制论专业论文)一类带停时的奇异型随机最优控制.pdf_第1页
(运筹学与控制论专业论文)一类带停时的奇异型随机最优控制.pdf_第2页
(运筹学与控制论专业论文)一类带停时的奇异型随机最优控制.pdf_第3页
(运筹学与控制论专业论文)一类带停时的奇异型随机最优控制.pdf_第4页
(运筹学与控制论专业论文)一类带停时的奇异型随机最优控制.pdf_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

p 。7 6 9 2 2 声明 本人郑重声明,本论文的所有研究工作都是在导 师的指导下,由本人独立完成的,文中所有的引用均已 列在参考文献中。 摘要 f 随机最优控制是现代控制理论的一个重要分支近几十年来,随机 最优控制在很多领域已有广泛而成功的应用,如飞船导航、卫星天线定 位、跟踪问题、存储问题、风险控制及经济学中的投入产出分析等 随机最优控制模型的研究始于二十世纪五、六十年代,在七、八十 年代得到了很大的发展,各种模型被相继提出并进行了研究其研究主 要分为两个方面:对随机微分( 积分) 方程的研究和最优化问题( 基于费 用函数的变分方程) 的研究) l 本文研究的一类带停时的意显型随熟量岱控制燕型于1 9 9 4 年由 m h a d a v i s 和m z e r r o s ( 1 3 1 提出但相应的控制费用函数过于简单, 使其应用面受到了限制本论文的主要工作对原问题的超旦函錾进行了 扩展,使其归结到一类更广泛的函数上去,从而拓宽了其应用面;并且 基于动态规划方法研究了解决此类问题的关键所在:对费用函数所应满 足的变分方程的构造和分析 论文分为四章t 第一章绪论,主要介绍了随机最优控制的一些发展情况及一些常见 的随机最优控制模型 第二章研究了“跳一停”型最优控制策略,并扩展了费用函数 第三章研究了带有吸收壁和反射壁的最优控制策略,并将费用函数 进行了两方面的不同扩展 1 第四章对控制方法进行了描述,并给出了应用分析 冬里需要指出的是,论文的所有引理、定理都是按章列出的,对来 自不同章的引用将强调指出土 2 a b s t r a c t s t o c h a s t i co p t i m a lc o n t r o li sai m p o r t a n tb r a n c ho fc o n t r o lt h e o r y i nr e c e n ty e a r s ,s t o c h a s t i co p t i m a lc o n t r o l i sw i d e l ya n ds u c c e s s f u l l ya p p l i e di nm a n yf i e l d s f o re x a m p l e ,s p a c e s h i pn a v i g a t i o n ,a n t e n n a o r i e n t a t i o n ,t r a c ep r o b l e m ,s t o r a g ep r o b l e m ,r i s kc o n t r o la n dp r o d u c t i o n c o n s u m p t i o nr e s e a r c hi ne c n o m y t h er e s e a r c ho fs t o c h a s t i co p t i m a lc o n t r o li sc o m m e n c e di n1 9 5 0 s a n d1 9 6 0 s ,a n dd e v e l o p e di n1 9 7 0 sa n d1 9 8 0 s m a n ym o d e l si sp u tf o r w a r d a n dr e s e a r c h e d t h er e s e a r c ho ft h o s em o d e l sm a i n l yd i v i d e di n t ot w oa s p e c t :t h er e s e a r c ho fs t o c h a s t i cd i f f e r e n t i a le q u a t i o n ( o ri n t e g r a le q u a t i o n ) a n dt h er e s e a r c ho fv a r i a t i o n a le q u a t i o n t h i sp a p e ri sm a i n l yr e s e a r c h e dac l a s so fs i n g u l a rs t o c h a s t i cc o n t r o l p r o b l e mw i t hs t o p p i n gt i m e ,w h i c hi sp u tf o r w a r db ym h a d a v i sa n d m z e r r o s l l 3 】i n1 9 9 4 b u ti t sc o s tf u n c t i o ni st o os i m p l et ob eu s e d f o r t h es a k e0 fe x t e n d i n gi t sa p p l i c a t i o n i nt h i sp a p e rt h ec o s tf u n c t i o ni s m o d i f i e d a n dw ea l s od i s c u s st h ek e yw o r kt h a td i s s o l v et h i sk i n d so f p r o b l e m :t h ec o n s t r u c ta n da n a l y s i so fv a r i a t i o n a le q u a t i o n t h i sp a p e ri n c l u d e sf o u rc h a p t e r :t h ef i r s tc h a p t e ri st h ei n t r o d u c t i o n t h es e c o n dc h a p t e ri st h er e s e a r c ho fao p t i m a lc o n t r o ls t r a t e g y a n di t sc o s tf u n c t i o n t h et h i r dc h a p t e ri st h er e s e a r c ho fa n o t h e rc o n t r o ls t r a t e g ya n di t sc o s tf u n c t i o n ,t o o t h el a s tc h a p t e ri st h ed e p i c to f 3 c o n t r o ls t r a t e g ya n da p p l i e da n a l y s i s 4 关键词 随机控制,随机最优控制,变分方程,奇异型,停时,“跳一停”,吸收 反射 k e y w o r d s s t o c h a s t i cc o n t r o l ,s t o c h a s t i co p t i m a lc o n t r o l ,v a r i a t i o n a le q u a t i o n s i n g u l a r ,s t o pt i m e ,“j u m p s t o p ”,a b s o r b i n g ,r e f l e c t i n g 5 第一章绪论 1 1 、随机控制及随机最优控制简介 现代控制理论的奠基人属于美国科学家维纳( n w i e n e r ,1 8 9 4 1 9 6 4 ) 自从上个世纪五十年代以来,由于计算机技术、航空航天技术的飞速发 展,控制论技术得到了很好的发展和应用其主要包括如下五个分支: 线性系统理论,建模和系统理论,最优控制以及自适应控制 在对实际控制问题的研究中,人们认识到,由于某些外部及内部因 素的干扰,影响控制系统的不确定因素是时有发生的因此,随机控制 理论得到了应用和发展随机控制理论是研究具有随机信号,随机噪声 和随机特性的系统控制理论这方面的工作可分为两个方面来看: 1 、对随机过程的研究由于随机控制研究的是非确定性系统,传统 的微分方程理论在描述它时产生了很大的困难,1 9 5 1 年,伊藤( k i t 6 ) 发表了论随机微分方程一文,使得对具有良好统计规律的非确定性 系统的描述有了相应的理论基础 2 、对控制本身的研究这方面的主要理论有:庞特里亚金的极大 值原理( 1 9 5 1 年) ,贝尔曼的动态规划法( 1 9 5 7 年) ,卡尔曼的滤波和 预测理论( 1 9 6 0 年) ,这些工作产生了随机最优控制理论和滤波理论 随机最优控制是随机控制理论的一个重要分支,其主要利用最优状 6 态估计系统的运行状态,求出一个状态反馈,实现使给定性能指标( 一 般称为费用函数) 为最小的指标相应的状态反馈称为最优控制策略 随机最优控制的突破发展主要是由于贝尔曼的动态规划原理的提出,并 且人们已经证明,随机最优控制策略与确定性最优控制策略是相同的, 这就是确定性等价原理本文下面的主要工作就是利用动态规划原理得 出费用函数所应满足的变分方程,并给出最优控制策略 这里需要指出的是。目前主要研究的随机最优控制问题都是状态完 全能观测的系统,本论文研究的也是这样的一类问题 1 2 、几类常见的随机最优控制问题 本节介绍目前常见的几类随机最优控制模型,需要指出的是,这几 类模型的提出都是在对实际问题的分析中产生的,具有很强的应用背景 1 、奇异型随机最优控制模型 设( q ,p ) 为一概率空间,w t ,t o 为其上w i e n e r 过程,五= 盯( w ;,0 0 为其上w i e n e r 过程,五= 口( w :,0 s t ) 每一个控制 即指一列上升的五停时0 t ist 2 曼 及兀可测随机变量6 ,i = 1 ,2 ,令v = ( t 1 ,f l ;t i ,6 ;) 表全体控制之集合则对任意的初值z r 和任意控制u v ,定义费 用函数为: + 笋 厶( ) = e ee - s r i b 俺) + e 一肛日0 ( s ) ) 出) , i = l i 上式中b ) 为线性函数,h ( y ) 连续且非负,初值为z 时u 对应的状 态方程为z 。o ”( s ) = z + p s + a w + 6 h ,。1 】, = 1 “,盯为常数且盯 0 最优控制问题就是求一个控制矿v 使对任意 初值z 成立t 以( 。) 2 瓣以( ”) 脉冲控制模型对于具有跳变控制的问题( 如存储问题) 中具有广泛 的应用,相应的文献参看【1 0 】, 1 l 】,【1 2 】 9 3 、带有停时的随机最优控制模型 这里带停时的意思为费用函数中含有停时,这既要求不但要得出最 优控制,而且要求出最优停时以奇异型最优控制为例,条件同1 中所 述,并设t 表全体五适应之停时,则对v b ,r t ,费用函数为: 7 ,- 。l ( ,r ) = e e 一“ ( z ) d z + d 已】+ g ( z ,) ) , d 0 目的是寻找+ b ,r + t 使得: l ( f ,7 + ) 2 f m 8 ,r i n 丁以( ,7 ) 带有停时的随机最优控制在实际中有很强的应用背景,如跟踪问 题,经济学中的“投入一产出”问题,投资中的最佳停止问题等相应的 文献参看【1 3 】,【1 4 】 1 3 、本论文的工作简介 本论文主要研究一类带停时的奇异型随机最优控制模型。该模型由 m h a d a v i s 和m z e r r o s 在1 9 9 4 年i t 3 提出并进行了研究其一般模 型如下: 设( q ,p ) 为一概率空间,w t ,t 0 为其上w i e n e r 过程,五= 盯( k ,0 8 t ) ,以b 表示五适应右连续的有限变差过程全体 且o 一= 0 对任意f = 矗,t o ) b 有正规分解6 = 寸一f , 】0 专= 口+ f 为其全变差又设t 表全体五适应的停时,则对v f 8 r t ,使用积分矗代替书,q ( 下同) ,定义其控制费用为: 厶( f ,r ) = e e 一口b ( 现) 出+ 】+ e 一。7 ( z ,) ) , 0 上式中9 ( z ) ,h ( x ) 均为实函数( 一般为正的偶函数) ,若。为初值,则状 态x t = z + w t + 矗,z ,= z + 职4 - f ,二元组( f ,r ) 为一控制, 厶( f ,f ) 为控制费用,o l 为正常数以下用v 表示全体控制之集合 文献【13 】的作者证明了该模型存在两种不同的最优控制策略,分别 为“跳一停”控制策略和带有吸收壁和反射壁的控制策略,并给出了相 应的最优控制,但其只证明了g ( x ) = a ,h ( x ) = 6 2 2 ( n ,6 均为正常数) 这种特殊情况,并且证明中对随机微分方程的使用有一些纰漏,本论文 使用了逼近的方法使证明得以严格,并将两种不同的控制策略分别推广 为如下的一般函数; 1 、对“跳一停。控制策略,将其推广为: 二 五健,r ) = e e 一“b ( 窖t ) 出+ 】+ e - a 1 - ,l ( z ,) ) , 矗 上式中9 ( z ) ,h ( x ) 均为一二阶连续可导的偶凸函数且g ( o ) = h ( o ) = 0 , 并且j 0 ,使得 0 ,使得e 0 满足( o ) = 1 定义: f ( 互) ,0 z a , ( z ) = 口一o + ( o ) , z , 【 ( 一。) ,x 0 容易验证,u ( z ) 满足变分方程,对变分方程,当0 o 使得p ,( z ) ,q ( z ) = k z ( k 为正常数) 为一线性函数,则存在 正常数m 0 ,使得v z r ,有: p ( z ) + m2q 忸) 一 缃 忒jl 圹h j 0 , 圈l ” 证明:如上图1 ,显见p | ( 。) 单调上升到+ o 。,故存在唯一点粕r , 使得( $ 。) ;矗只霭取m 足够大。使p 0 。) + m q c z o ) 即可命题 得证口 引理3 、对引理1 中所述之 ( g ) ,v b ,r t 有: u ( z ) e fe 一耐 g o t ) 出+ 1 + e 一。7 ( z r ) ) ( 2 9 ) 五 证睨:若( 2 9 ) 式右部为无穷大,则( 2 9 ) 式显然成立,下设其为一有限 1 7 值 由u ( z ) 的构造,显然 ( z ) 为一次连续司导,其二阶导数在一a ,c t 点为第一类间断点对任意的正整数n ,构造函数列”:( z ) 如下: 嗍加凡竺二舅二攀嚣扑嚣:搿0 对其它情形,取”:( t ) = ( z ) ,则显然”:( z ) 连续,并且有: 。1 i r a 。 :( o ) = 互t 【 + i t ( o ) + u :( o ) 】, 。1 + i m 。u :( 一口) = ;【”军( 一) + ”! ( 一a ) 】 故有v - ( x ) 一矿扣) ,( n - 40 ( 9 ) 令嵋( z ) = 君碟( 牡) 砒,”。( z ) = 詹嵋( u ) d u ,此时易证有 l 畦( 功- j ( z ) i = ij f ( ( 让) - - , v t t ( u ) ) 如l s 门( 碟( u ) 一( u ) ) l a u n + s i ( ( u ) 一矿( u ) ) l 如 等,( c 为正常数) , 1 8 故有v l ( x ) _ t ,( 。) ( n _ + o o ) ,又: m z ) 一”( z ) l = i ( ”:( “) 一”( u ) ) d u l 门( ”:( u ) 一”如) ) l d u 憋砒 j礼 2 c l x l , 则对任意的z r ,有 。( z ) _ v ( x ) 一o o ) 由上面的分析易见,存在,2 为正常数,使得:l u :( z ) lsn l ,l ”:( z ) i z ,即”:0 ) ,口:( z ) 均有界 由前面构造,易见( z ) 二阶连续可导,则对轨= z - 4 - w t + 已, 应用d o l d a n s - m a d e - m e y e r 公式 1 5 1 ,得: ”。( 。) = e 一口r ”。,) + z 7e 一耐【口”。t ) 一;碟( 轨) 】出一j ( 0 re - a t 嵋( 甄) d w t fe ”。( 轨) d 6 一e 1 【( 乳) 一 :( 轨一) 观1 , ( 2 1 0 ) 。” o t r 上式中轨= 戤一o t 一 首先证明( 2 1 0 ) 式最后一项非负因为: 1 ,。( z t ) 一 :( 茁t 一) a z t = :”。( z t ) 一 。( 茁一) 一 :( z 一) z 。 = u n ( z t 一 4 - a x t ) 一口n ( x t 一) 一u :( 。一) a z t = ;( + o a z t ) a 2 z 。 ( o 目s1 ) 0 , 】9 所以( 2 1 0 ) 式最后一项非负,下面再来证明( 2 1 0 ) 式右部其余各项均是 可积的,从而可取数学期望 se ”( h ( z ,) + l u 。( z ,) 一u ( z ,) 1 ) ( 变分方程) 茎 e n r ( 。,) + e n r 三兰 g - - o r ( m l h ( x ,) + m 2 ) ( 引理2 ) , 上式中c l ,m l ,m 2 均为正常数( 下同,即对其依次编号) ,因为已假设( 2 9 ) 式右部为有限值,故e ( e “7 ( z ,) ) ,故有e l e - a r v 。( 。,) l ,即 e - a r v 。( z ,) 可积 再来看第二项,有: i 产- n 弘( 训一;( 川s e - o r a h ( 瑚一巾圳出 + e 一。r i n u ( z 。) i d t + ,;e a r i ”:( 。) 1 d t ,e q 舭+ j 产掣出 + n l l e - a t d ; 地te - 一g ( 引出+ 等( 1 - e - 1 慨re 1 7 9 ( x t ) d t + m 4 , 同理,由假设,( 2 , 9 ) 式右部为由限值,故有e m 3 fe - a r 9 ( x d d t + m 4 l 2 0 ,故e lfe 。【a ( z e ) 一i ”:( z t ) l e t l o 。,即其可积 再来看岳e - a t u :( z c ) 始,对其有: :7e “讹) 武t l 上7i e 一。”:( zc ) i t :7l e - o v l 埏 s 2 :7e “踮( ”有界) , 仍由( 2 9 ) 式右部为有限的假设,应有:e 届e - c k t 西 0 且有 ,( a ) = 1 证明:由( 2 9 ) 式,只需证明 ( 互) = 五( p ,r + ) 即可 由式( 2 1 ) ,易知, 当口时,五( p ,r ) = h ( x ) = 扣) 当$ 口时。j ;( f ,7 - ) = 如+ ,i ( n ) = x a + h ( a ) = ( 茁) 当$ 一a 时。j :代,r ) = 岛+ ( 8 ) = - - x , 一a + h ( - a ) = ( 一。) = ( z ) 综合上面所述,对v x r ,皆有:五( 7 - + ) = ( z ) ,这说明 ( 。) 即为最优控制所决定的控制费用,( f ,r + ) 既是最优控制( 控制策略) 定理证毕口 注l : 在这种控制策略下,变分方程所对应的控制情形不出现,即 只有变分方程与所对应的两种控制情形,在第三章中研究的问题将 同时利用到三个变分方程# 2 4 第三章带有吸收壁和反射壁的 奇异型随机控制 3 1 、第一种推广 在第二章“跳一停”控制策略的研究中,我们看到,这种控制策略 具有一定的特殊性其对应的变分方程的情形也不出现本节研究的 带有反射壁和吸收壁的控制策略,变分方程对应的情形是需要加以考 虑的 现将模型叙述如下: 设( q ,p ) 为一概率空间,t 0 为其上w i e n e r 过程, 五= 仃( h ,0 s8 t ) ,以8 表示五适应右连续的有限变差过程全 体且岛一= 0 对任意f = 6 ,t o b 知有正规分解毛= 口一, 已= p + 钉为其全变差又设t 表全体五适应的停时,则对v f 8 , r t ,定义费用函数为: f 以幢,_ r ) = e e - a t 【a 。;出+ 葩】+ e - a v h ( x ,) ) ,( 3 1 ) 6 上式中状态鼠= z + w t + 已,z ,= z + l 诈+ ,二元组( ,7 - ) 为一控制,以( f ,7 ) 为控制费用,o ,a 均为正常数以下用v 表示全体 2 5 控制之集合h ( z ) 为一二阶连续可导的偶凸函数且h ( 0 ) = 0 目的是 寻找特殊的( 。,7 ) v ,使得: 以( + ,1 ) = i 如n f 矗( ,7 ) ( 3 2 ) 因为费用函数( 3 1 ) 不同于第二章的费用函数( 2 1 ) ,同第二章的分 析相似,将变分方程修改如下: u ( z ) ( z ) v x r i 口( z ) is1 比r 互1 u - ”( z ) 一a v ( x ) + a z 2 0 v z r ( u ( z ) 一i l ( z ) ) ( ( z ) i 一1 ) ( o ”( z ) 一a v ( x ) + a z 2 ) = 0 v x r 这里( 茁) = 1 、v 。# x ) + ! ( z ) ) 引理1 、设 ( z ) 为r 上二阶连续可导偶函数且h ( o ) = 0 ,又vz r ,( ) 2 a q 则存在常数口,b :0 8 1 ,故g l ( 茁) = 9 2 ( x ) 在【0 ,p ) 之间必有一 解,设其为o 0 。再令: 6 = 云+ 去扛而万面雨丽,( 3 e ) 由( 2 4 ) 式,易见有2 a b 一口 0 ,且有: ( 2 a b n ) 2 = 一2 a ( 9 ( o ) ) 2 + 4 a g ( a ) + ( g l ( 口) ) 2 ,( 3 7 ) ( 3 7 ) 左右两边同时减去4 a 2 ,可化为: 蒜篙豁葛蒜篙篆焉叫c s s ,2 q 9 ( o ) + 、2 0 ( n ) 一2 a2 0 留( ) 一、2 q ( o ) 一2 a 、。叫 又由9 2 ( x ) 的定义,易见有 唧刊侗= 蒜篙蒜高, 。, 由( 3 8 ) ,( 3 9 ) ,还可得: 令 唧 ( b - a ,侗= 崧鬻等 a = ( 4 a 2 ) 一1e x p ( 一n 、甄) 【2 a 9 ( n ) + 、j 面a ) 一2 a 】 b = ( 4 a 2 ) 一1e x p ( n 、压苫) 【2 0 9 ( n ) 一、j 面( o ) 一2 a 由( 3 3 ) ,( 3 1 0 ) ,a ,b 亦可表为 a = ( 4 a 2 ) 一1e x p ( 一b , i - 5 ) 一2 a 一、瓦( 2 a 6 一o ) 】 b = ( 4 a 2 ) 一1e x p ( b 、菘) 卜2 a + 、瓦( 2 b a ) 】 ( 3 1 1 ) ( 3 1 2 ) ( 3 ,1 3 ) ( 3 1 4 ) 取,( z ) = a e x p ( v 慢 a x ) + be x p ( - v 甄x ) + :z 2 + 壶,先验证,( 。) 满足( 3 3 ) 式: 犰。) 一州z ) + 舻= ;( 2 口ae x p ( 屈) + 2 。b e x p ( _ 厮) + 芸) 一。( a e x p ( 厮) + b e x 小瓜) + - q a x 2 + 去) + 舻 = 立一a 。2 一立+ a z 2 do =0 再验证,( z ) 满足( 3 4 ) 式 m ) = ae x p ( 瓜) + b e x p ( 一瓜) + 会“去 = ( 4 固一( 4 。咖) 一4 a ) + :- a 2 + 会 = 掣一窘+ 宝“窘aq aq :g ( a ) + 一x a 2 a :掣:_ l ( 。) n ,( 。) :、l i 五ae x p ( 、瓦。) 一x v s be x p ( 一、互_ n ) + 兰丝 = 等2 俪,( 0 ) + i 2 a a a h ( 口) 一2 a a 2 a a 一i 一+ i = ,( a ) , 最后验证( 3 5 ) 式 ,( 6 )佤4e x p ( 墒) 一、互五口e x p ( 一、互石6 ) + 2 a b q 害- 2 厄h ) + 百2 a b 2 a b q2 a b =1 ,( 6 ) = 2 q ( ae x p ( 瓜6 ) + b e x p ( 一面) ) + i 2 a 2 a 4 a 2 =0 4 0 + 坠 o 以下只需再证明b a 0 即可 由( 3 1 3 ) 式可知a 0 ,再由( 3 1 2 ) ,( 3 1 3 ) 易见b a 0 ,既 a ,b 均为负( 3 9 ) 乘以( 3 1 0 ) 有: 唧。叫倜= 蔫粼t 鬻g 鬻高 ( 3 1 5 ) 因为_ 4 ,b 均为负,易得: 一2 a 一, t g ( 2 a b o ) 一2 a + v 互- 5 ( 2 a b q ) 0 ,再结合2 c y g ( a ) 一 甄g ( o ) 一2 a n 0 ,引理证毕口 引理2 、h ( z ) ,( z ) ,n ,b 同引理1 中所述,则存在r 上偶函数u ( z ) 满足 变分方程一 证明:利用引理1 中之( x ) ,构造口( z ) 如下: f ( z ) ,0 。a , ”。) = 一苗_ 。:q ,。主;菁6 【 ( 一z ) , z 0 故r ( a ,6 ) , 因此u ”( z ) 在区间( ,r ) 之间为单调增加,而在区间( r ,b ) 之间为单调 减,j 、贝0 对z ( a ,6 ) ,0 0 当z ( 口,b ) ,自有 o ”0 ) 一c t v ( x ) + a z 2 = ,”( z ) 一o ,0 ) + a 。2 = 当z 【b ,+ o o ) 时,由引理1 可推得2 妯 o l ,故有 ;雷( z ) 一。口( z ) + a z 2 =;u ”( $ ) 一q ( z ) + a z 2 一q ( 。一6 ) + i a b 2 ) + 地2 = ( z 一6 ) ( 一o + a 0 + 6 ) ) ( z 一6 ) ( 2 a 6 一q ) 0 当。= n 时,有: l v ,t t 、a ) 一o ”( o ) + a n 2 0 ,; ! ( ) 一c e v ( a ) + a n 2 0 ,故有: ;矿( 口) 一a v ( a ) + a n 2 0 这样,对v x r + , 均有i l u - ”( z ) 一o l v ( x ) + a z 2 0 又由于o ( z ) , ( z ) 均为偶函数,故对 v x r ,u ( 。) 均满足变分方程 变分方程成立是明显的,在此不再赘述引理证毕口 3 2 引理3 、对引理2 中所述之u ( z ) ,v e 3 ,7 - t 有: u ( z ) 曼e e - c t t 【a z ;出+ d 已】+ e 一” ( z ,) ( 3 1 9 ) 0 证明:同第二章引理2 中之证明,在此不再详细给出口 引理4 、v0 a b o 。,z 0 ,若钉为适合以下条件的b 中连续非 降过程: 0 - = m a x 0 ,o m a x ; x + 眠一6 ) ) , 则如下方程存在唯一解日一: ( a ) x t = o + w t 一町b v t 0 , ( b ) 0 一在 ,, t t b ) 之外是平的( 即0 一只在2 :t = b 时产生增量) 同样,对v0 a b o o ,。 6 时,s = ( b - z ) 眨o ) 一盯r + = i n f t20 :z t a ( 3 ) 一b 。 0 时,= 日产7 - + = i n f t 0 :轨一a ( 4 ) z _ o + 钳7 - + = i n f t 0 :x t 一n 证明:由( 3 2 ) 式和( 3 1 9 ) 式,只需证明v ( x ) = 五( r + ) 即可 当0 z o 时,f ;= - o - = o ,r = 0 ,此时易见有: 以( ,r + ) = ( z ) = ”( 。) 当asz 6 时,因为g = 一钉只在轨= b 时发生作用,且由町 的连续性,有觑= 6 = 0 ,z ,= z + - 碍+ 矗= 口 由d o l d a n s - m a d e - m e y e r 公式 i s , i s l ,得: v ( x ) = e ( 。一。r 。( “) ) + b 7 。一。t 【q 。( z :) 一;( z ;) 】出 e 7 。刊州引蟛 = e ( e 一口r + ( ) ) + e e - a t a 。;2 出+ e e - a t v ( b ) d o t = e ( e - * + h ( ,) ) + e e q 【入z :2 出+ ;1 = 以( + ,丁) 当z b 时 以( + ,r 。) = e e - , 5 t a 。;2 出+ ;】+ e 一护 o ,) ) = e 二】瞎+ e r 础噼出+ 霹】+ e - 护 ( 即) ) = 一b ) + v ( b ) = ( x - b ) + 等 = u ( z ) 故对任意的初值。0 ,均有口( z ) = 以( f + ,r + ) ,这说明控制( r + ) 为一最优控制 当初值o 0 时。同理仍可得证,在此不再给出定理证毕口 3 1 、第二种推广 本章第一节分析的费用函数具有对称性,但在实际应用中,有时控 制具有非对称性,即状态盈0 或孔 0 时分别有不同的控制费用比 率由于这类问题在实际中也比较常见,故本节研究这方面的问题首 先给出模型如下t 设( q ,厂,p ) 为一概率空间,眦,t o 为其上w i e n e r 过程, 五= 盯( w j ,0 8 t ) ,以b 表示五适应右连续的有限变差过程全 体且如一= 0 对任意= 已,t o ) b 知有正规分解已= 口一6 - , 毛= p + 6 - 为其全变差又设t 表全体五适应的停时,则对v f 8 , 3 5 r t ,定义费用函数为; l ( f ,7 ) = e e - n t a z ;出+ 七十鹰产+ 七一必_ 】+ e n 7 ( z ,) ) ( 3 2 0 ) 上式中状态甄= 。+ 眦+ 岛,珥= 。+ 鹏+ 矗,二元组( f ,r ) 为一控制,以( ,r ) 为控制费用,a ,a 均为正常数以下用v 表示全 体控制之集合h ( x ) 为一二阶连续可导的偶凸函数且h ( 0 ) = 0 ,k + k 一分别为正的实常数目的是寻找特殊的( ,7 - ) v ,使得; 以( + ,) = i 扣n f 五( f ,7 ) ( 3 _ 2 1 ) 首先来分析这个问题仔细观察就会发现,最优控制状态轧不会跨 越零点,即现恒为非负或非正并且当轨0 时,p = 0 ;当玩 0 时,4 i - = 0 这样,最优费用问题( 3 2 1 ) 可化为如下两个问题来独立研 究: 当初值x 0 时: 令: ,。偿,7 ) = e e - n t , x z ;出+ 七一a 盯】+ e a 7 ( z ) ) , ( 3 2 2 ) 此时应有: 簪以( f ,下) = i 即n f j l 熊r ) , ( 3 2 3 ) 当初值z 0 时: 令: 以,( ,7 _ ) - - - e e 一。【a z ;d z + + 鹰产 + e a 7 ( z ,) ) , ( 3 2 4 ) 3 6 此时应有: i 和n f 上( ,7 ) 2 弹如,z ( f ,7 ) , ( 3 2 5 ) 这样,问题变为只需分析初值z20 即可,对初值z 0 的情形同 理可得 注1 : 在这里强调指出,( 3 2 3 ) ,(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论