(概率论与数理统计专业论文)一类带有随机插入时间的控制模型.pdf_第1页
(概率论与数理统计专业论文)一类带有随机插入时间的控制模型.pdf_第2页
(概率论与数理统计专业论文)一类带有随机插入时间的控制模型.pdf_第3页
(概率论与数理统计专业论文)一类带有随机插入时间的控制模型.pdf_第4页
(概率论与数理统计专业论文)一类带有随机插入时间的控制模型.pdf_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

韭宝銮适太堂亟堂僮迨塞生塞擅噩 中文摘要 摘要:在过去三十年中,奇异型随机控制模型被广泛的研究,并且在设计,经济, 金融,生物等领域得到广泛的应用 1 , 3 , 5 , 1 8 这类模型的主要特色之一 就是能够得到详细的解,特别是当时域是无限的时候,但是其控制策略是即时的, 连续的,因而很难应用于实践文献 1 9 , 2 0 研究了一类控制模型,使得控制只 能在某一些固定正常数的整数倍时进行这类离散时间控制模型比较现实,但很难 得到详细的解,即使是当时域是无限的时候文献 2 1 研究了一类由泊松过程决定 的控制模型,该模型的主要特色是最优控制只能在泊松跳发生时进行,即控制只 能在离散时间进行,决策者不能对系统进行任意干预本论文第一部分所做的主要 工作是对 2 1 中两类模型的受控过程和费用函数进行扩展,使其归结到一类更为 广泛的函数上,从而拓宽了其应用范围 本论文第二部分对最优投资组合问题的发展现状作了介绍,引入了连续型带 有交易费用的多风险投资模型,并对进一步发展进行了展望 关键词:随机控制;泊松过程;费用函数:变分不等式,:局部鞅 分类号:f 2 5 3 9 ;0 2 3 2 a b s t ra c t a b s n 溘c r ,1 1 l es i n g l l l a rs t o c h a s t i cc o n t r o lp r o b l e m sh a v eb e e ne x t e n s i v e l ys t u d i e d i nt h el a s tt h r e ed e c a d e sa n dh a v ef o u n da p p l i c a t i o n s nm a i l ya r e a ss u c ha se n 百n e e r i n 岛 e c o n o m i c s ,f i n a n c ca n db i o i o g y ,e i c 【1 】,【3 】,【5 】,【1 8 】o n em a j o ra t t f a c t i o n o ft h i s f b 册u l a t i o nl i e si nt h ep o s s i b i l j t yo fo b t a i n i n ge x p l i c i ts o l u t i o n s ,e s p e c i a l l yw h e nt h e t i m eh o r i z o ni si n f i n i t e h o w e v e r t h eo p t i m a is t r a t e 西e si ns u c ho c c a s i o n sa r eo f t e n i n s t a i i t a n e o u s l ya n dc o n t i n u o u s l y ,w h i c hm a d et h e mv e r yh a r dt oi m p l e m e n t i np r a c t i c c a 皿a l t e m a t i v et y p eo fc o n t r o lp m b i e m sa l l o wt h ec o n t r o lp o l i c i e st ob ea d j u s t e do n l ya t t i m e sw h i c ha r cm u l t i p l e so fs o m ef i x e dp o s i t i v en u m b e r 【1 9 】,【2 0 1 w h i l et h i sd i s c r e t e t i m ef b 姗u i a t i o ns e e m sm u c hm o r cr e a i i s t i ci ti su s u a i l yv e r yd i f i c i l l tt oo b t a i ne x p l i c i t s o l u t i o n se v e nw h e nt h et i m eh o r i z o ni si n f i n i t e p a p e r 【2 1 】s t u d yak i n do fc o n t m l p m b l e m sg o v e m e db yp o i s s o np r o c c s s ,o n ef e a t u r eo ft h i sm o d e li st h a tt h ec o n t m l p o l i c yi se s s e n t i a l l yd i s c r e t e ,j nt h es e n s et h a tt h ec o n t r 0 1c a no n l yb ee x e n e da tt h e t i m e sw h e nt h ep o i s s o np r o c c s sh a saj u m p f i r s t l y ,w e 萨n e m l i z et h ec o n t m l l e ds t a t e p r i ) c e s sa n dt h ec o s tf i l n c t i o no ft h em o d e li np a p e r 【2 1 1 ,i tb e n e f i tf b rt h ee x t e n s i v e l y a p p l i c a t i o n s e n d l y ,w ed i s c u s st h eo p t i m a i i n v e s t m e n tm o d e l ,w ei n t r o d u c ct h em a t h e m a t i c a l m o d e lo fm u l t i p l er i s k yi n v e s t m e n tw i i ht m n s a c t i o nc o s t sa n dm a k eae x p e c t a t i o nf o r t h en c x tp m g r e s s k e y w o r d s :s t o c h a s t i cc o n t m l :p 0 i s s o np r o c e s s ; c o s tf u n c t i o n :v a r i a t i o n a l i n e q u a l i t y ; l o c a lm a n i n g a l e c l a s s n 0 :f 2 5 3 9 :0 2 3 2 学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国 家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名:毒冬壹睃 签字日期:。6 年月,8 日 一名翻磷今 导师签名:伽i y 7 弓 签字日期:0 6 年7 月吟日 p 致谢 本论文的工作是在我的导师刘坤会教授的悉心指导下完成的,刘坤会教授严 谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢三年来 刘老师对我的关心和指导。 王秋嫒老师对我的论文提出了许多的宝贵意见,在此表示衷心的感谢。 在实验室工作及撰写论文期问,于洋等同学对我的论文中的研究工作给予了 热情帮助,在此向他们表达我的感激之情。 另外也感谢家人,他们的理解和支持使我能够在学校专心完成我的学业。 最后,诚谢各位专家和学者在百忙之中审阅我的论文,诚恳接受您的宝贵意 见和建议,并期待您的批评和指导。 1 绪论 1 1 现代控制理论发展简介 现代控制理论的奠基人是美国科学家维纳( n w i e n e r l 8 9 4 一1 9 6 4 ) ,自从上个世 纪五十年代以来,由于计算机技术、航空航天技术的飞速发展,控制论技术得到 了很好的发展和应用,其主要包括:线性系统理论,最优控制,自适应控制等 在对实际控制问题的研究中,由于某些外部及内部因素的干扰,影响控制系 统的不确定因素是时有发生的,因此随机控制理论得到了应用和发展随机控制理 论是研究具有随机信号,随机噪声和随机特性的系统控制理论,这方面的工作可 分为两个方面: 1 对随机过程的研究由于随机控制研究的是非确定性系统,传统的微分方程 理论在描述它时产生了很大的困难1 9 5 1 年,伊藤( k 血d ) 发表了论随机微分方 程一文,使得对随机微分方程的研究受到了广泛重视,并渗透到很多领域,为 随机控制的发展提供了理论基础 2 对控制本身的研究庞德里亚金的极大值原理( 1 9 5 1 年) ,贝尔曼的动态规划 法( 1 9 5 7 年) ,卡尔曼的滤波和预测理论( 1 9 6 0 年) 标志着现代控制理论的产生,这 些理论与随机控制直接相关随机控制主要包括:最小方差控制,滤波,随机最优 控制目前解决最优控制的方法主要有三种,即:古典变分法,庞德里亚金的极大 值( 极小值) 原理,贝尔曼的动态规划原理 随机最优控制是随机控制理论的一重要分支,主要是求一状态反馈,使目标 达到最优该状态反馈称为最优控制策略本文的主要工作就是找出费用函数所应 满足的变分方程,并给出最优控制策略 1 2 几种常见的随机最优控制模型 本节介绍目前常见的几类随机最优控制模型,需要指出的是,这几类模型的 提出都是在对实际问题的分析中产生的,具有很强的应用背景 对于随机控制问题,就其受控状态过程而言,可分为奇异型随机控制和脉冲 e 躯銮适塞堂亟堂焦论室 箍二童缝盐 型随机控制 1 1 1 奇异型控制模型 自上世纪八十年代初,奇异型随机控制问题开始引起人们的关注,经过十多 年的发展成为一种比较实用的模型 设彬为概率空间( q ,p ) 上的标准布朗运动, z = o ( 形,o s s f ) , z 满足 通常条件,舀表示正适应的零初值左连续有限变差过程全体,任意亭a 毒8 ,有 正规分解亭,亭+ 一亭,亭一亭+ + 拿一为其全变差亭+ ,亭均为b 中单调非降过程通常 研究以下两种问题 ( 1 ) 折扣费用模型 对口) o ,工r ,宇召,费用函数为,o ,亭) = f p “陋 ) 出+ d 麦】 其中= 工+ 彬+ 皇,厅一般为非负偶函数第一个积分为黎曼积分,第二个积分为关 于单调函数的斯蒂阶积分,在不引起混淆的情况下,将其统一记为f ,最优控制 就是寻找嚣召,使得,0 ,亭) ;曾j o ,亭) 目前对奇异型折扣费用模型的研究已有许多工作 1 , 2 , 3 ,更进一步的 结果见刘坤会 4 ( 2 ) 平均期望费用模型 对工r ,亭8 ,费用函数为j 亭) = l 卿f 吾蝣陋 ) 出+ d 毒】 其中。工+ 彬+ 量,最优控制就是寻找等b ,使得, ,亭+ ) = 1 四,亭) 平均期望费用模型目前也有一些研究文献 6 , 7 ,关于这一问题的深入讨论见 刘坤会 8 关于奇异型随机控制问题,勋m t z a s ,i 的工作 1 是开创性的,有重要的理论价 值但其决策控制是即时的,连续调节的,这在实际中往往难于施行,特别是在控 制时域为无穷时所以决策者经常选择一列停时瓴,吃 和脉冲 舅,邑 对系统实 施控制( 参 9 , i 0 ) 来得到精确解 j e 盛銮通太堂亟堂焦i 金室蕴二重缮i 金 1 1 2脉冲控制模型 脉冲控制由于其应用上的可操作性,最先受到重视最初由 b e n s o n s s a na n di j o n s 提出,后来r i c h a r d 1 1 将其推到无限时域上 设彤为概率空间( q ,p ) 上的标准布朗运动,t 五 ;口( 彬,o s j s f ) , 正) 满足 通常条件每一个控制是指一列上升的停时亿,吃) 及可测随机变量列编,岛) 表示为v 一 ;岛) ,f 2 1 ,令矿表示全体控制的集合同样分两种情况: ( 1 ) 折扣费用模型 对芦 0 ,x r ,v 矿,费用函数为: j g ,v ) = e 晤e 如渺+ e 啦b ( 每) 】 上式中b ( 亭) 为线性函数,_ 1 1 0 ) 连续非负, 初值为x 时v 对应的状态方程为;石+ + 口彬+ 岛川,求一个控制v 使得 , ,v 。) 2 够,0 ,d 脉冲控制模型对于有跳变控制的问题具有广泛的应用,相应的文献参见 1 2 、 1 3 ( 2 ) 平均期望费用模型 对x 足v 矿,费用函数为: ,v ) 2 亭e 晴 “弦+ 荟b ( 磊) 】 求一个常数a o ,v l r ,找出控制v = ( ;等) ,f 1 ,使得 熙, ,v ) ;a2 磐1 1 粤掣,似v ) 其中满足分段随机微分方程如= 盯“m 彬,f ,+ 。】,+ ;+ 岛 对脉冲控制的研究,详细的证明见刘坤会 1 4 , 1 5 随着对随机最优控制理论的研究和其在实际应用中的发展,一类新的模型即带 有停时的随机最优控制模型被提出这里带停时的意思为费用函数中含有停时,这 要求不但要得出最优控制策略,而且要求求出最优停时 以奇异型随机最优控制为例,条件同1 中所述,并设丁表示全体z 适应的停时 则对任意亭口,f r ,费用函数为: 3 ,亭,v ) ;e “8 “阶 渺+ d 岛】+ g 纯) 目的是寻找亭+ 召,r r 使得: ,0 ,亭。,f ) 2 兽珏j ,氦f ) 带有停时的随机最优控制在实际中有很强的应用背景,如跟踪问 题,经济学中的“投入一产出”问题,投资中的最佳停止问题等,相 关的文献参看 1 6 1 7 1 3 本论文工作简介 在过去三十年中,奇异型随机控制模型被广泛的研究,并且在设计,经济, 金融,生物等领域得到广泛的应用 1 , 3 , 5 , 1 8 这类模型的主要特色之一 就是能够得到详细的解,特别是当时域是无限的时候,但是其控制策略是即时的, 连续的,因而很难应用于实践文献 1 9 , 2 0 研究了一类控制模型,使得控制只 能在某一些固定正常数的整数倍时进行这类离散时间控制模型比较现实,但很难 得到详细的解,即使是当时域是无限的时候文献 2 1 研究了一类由泊松过程决定 的控制模型,下面介绍其基本模型: 设( q ,只 z ) ,p ) 为一概率空间, 正) 满足通常条件 受控过程z = 工+ 彤+ 皇,= 工 ( 1 3 1 ) z r ,盯苫o ,矿= 彬;f 芑0 ) 为标准布朗运动, 宇2 传;f 苫o 为左连续过程,且皇。丘 b 以,口 m :f 苫o ) 为强度为a 的正适应 的泊松过程,口一 b :f 苫田为巧可料 b 表示允许控制集 目标为选取最优控制策略,使得期望折扣费用: 啊e ”( x ? m + 甜;,) 最小 ( 1 3 2 ) 或者使得平均期望费用: 舰i n f 亭( z 钮+ 耐舅) 最小 ( 1 3 3 ) 4 a ,o ,c ,o 为常数,;一 ;,:f 苫0 ) 为宇的全变差过程,;:i 吃i 烈,或d = i d 皇i 该模型的主要特色是控制策略是离散的,最优控制只能在泊松跳发生时进行, 决策者不能对系统进行任意干预 本论文的主要工作是对上述两类模型的受控过程和费用函数进行扩展,使其 归结到一类更为广泛的函数上,从而拓宽了其应用范围 对于期望折扣费用模型,目标是选取最优控制策略,使得: e f e “( 矸出+ g ( 置矽舅) 最小 ( 1 3 4 ) 对于平均期望费用模型,目标为选取最优控制策略,使得: h 擎虫寺吒( 砰出+ 占( 五矽舅) 最小 ( 1 3 5 ) 上式中置一石+ o 彬+ 皇,盯,0 ,g ( ) 满足一定的条件,对于这两类推广了的模型, 本文利用随机分析中的最优控制理论,得出了不同情形下的最优控制策略及相应 的最小费用函数 本论文第二部分的最优投资组合问题最初由m a r k w i t 提出并研究,后来m e r t o n 用随机控制方法得出了连续时问投资组合的著名结果,它与期权定价理论奠定了 金融数学的基础该学科在2 0 世纪8 0 年代到9 0 年代中期得到很大发展,涌出了大量 的研究成果,参文献 2 5 , 2 8 , 2 9 】,目前仍十分活跃而我国相应的理论大大 的滞后于西方发达国家,近几年来呈现出较快的发展趋势,取得了一定的成绩本 文对这方面的发展现状作了介绍,建立了连续型带有交易费用的多风险投资模型, 并对进一步发展进行了展望 5 2 一类带有随机插入时间的控制模型 文献【2 1 】研究了一类由泊松过程决定的控制模型,具体描述如下:设 ( q ,j 一 z ) ,力为一概率空间, z 满足通常条件 受控过程五= 工+ 彬+ 皇,蜀一工,x r ,盯芑o ,一 彬;f 芑o ) 为标准布朗运动, 亭j 皇;f 乏0 为左连续过程,且皇。丘,) 见以,= m :f 苫o 为强度为a 的z 适应 的泊松过程,p 一以:f 苫田为正可料 8 表示允许控制集对于期望折扣费用模型,目标是选取最优控制策略,使得: e 蠹e “q 和+ c d 最,l 、 对于平均期望费用模型,目标为选取最优控制策略,使得 舰i n 弓啊孵d f + 耐邑) 最,j 、 a ,o ,c ,o 为常数,亭2 藓:f 芑吣为亭的全变差过程,宇一j :1 只l 以,或d 宇= l d 磊i 该模型的主要特色是控制策略是离散的,最优控制只能在泊松跳发生时进行, 决策者不能对系统进行任意干预 本论文的主要工作是对上述两类模型的受控过程和费用函数进行扩展,使其 归结到一类更为广泛的函数上,从而拓宽了其应用范围 对于期望折扣费用模型,目标是选取最优控制策略,使得: e k e 噼;d f + g 呸m 3 最小 对于平均期望费用模型,目标为选取最优控制策略,使得: l i 孕卿f ;啊( 矸出+ g ( 置) d 邑) 最小 上式中墨;工+ 口彬+ 皇,盯,o ,g ( ) 满足一定的条件,对于这两类推广了的模型, 本文利用随机分析中的最优控制理论,得出了不i 司情形下的最优控制策略及相应 的最小费用函数 本文的论述共分三部分:第一部分为折扣费用模型,利用随机分析中的最优 控制理论,得出最优控制策略及相应的最小费用函数第二部分为平均期望费用模 型第三为结论 2 1 折扣费用模型 设( q ,厂, z ,p ) 为一概翠空i 司, 五) 满足通常条件 受控过程互一工+ 盯彬+ 袅,k = z ,z r ,盯 0 ,; 形;f 乏o 为标准布朗运动, 宇= 倡;r 苫0 为左连续过程,且岛。舯见烈,。:f 乏田为强度为a 的z 适应 的泊松过程,口一坦:f 0 ) 为z 可料 期望折扣费用为: j 融孙一e e q ;d f + g q t ;t ) 口,o 为常数,g o ) 为r 上的满足一定条件的非负连续偶函数,;。碚。:f 苫o 为亭的 全变差过程,亭。j :i 见i 以,或d 亭c d 皇i 口表示允许控制集,目标为选取最优控制策略亭8 ,使得 v o ) = , ;亭) 2 磐j 0 ;亭) 引理2 1 1 设季o ) 为r 上的非负连续偶函数,且在【o ,m ) 上喜( 力s 0 ,季( 0 ) 0 删2 赢+ 去础厮肛詈荆) 一志圳 则存在唯一x ( o ,m ) ,使得厂 ) = o ,且工,要害 。) 证明: i i 珥厂o ) x 。卿( _ 寿而+ 去c o t n ( 盯。1 瓜x 一詈删) - 志 鲰m 。规啧南+ 痧一号,一杀 7 下证当工,0 时,o ) o , m = 南+ 去届小 赢一去脚妙1 瓜删 【础( 盯4 屙州一t h ( 口。厩m ( - 翥薏等) 。竺! ! 鲤:! 塾生! ! ! ! 鱼:! 堑生二里:型! 竺 s i n h 2 ( 盯以2 a 石) e 式中分子可写为:呈:! := ! 兰:! :一盯一t 芝品, 上式中分子可写为:二= _ 一一盯“2 a x , 令m 勘一1 压,下证拿手一号训 令纠= 皇f 一争 z 。) = 丢卅e “+ 丢所e 一一丢卅,z ( o ) = o z 何) = 丢卅2 e 一丢卅2 e m ,z ( x ) o 故z 0 ) 0 ,由z ( 0 ) = o 知当石 0 时z 0 , 从而i c o t h p 一1 乏赢】,o 当删“北又由于厮) ) 一翥岩赫柚 【c o t h p - 互赢) 季 ) 】;( c 。t h p 一1 芝赢) ) 季o ) + c o t h p 一1 互赢) 蜃 ) 5o 所以当工,0 时,o ,存在唯一工( o ,m ) ,使得,o ) = o , 且由,唔彬) ) 一志枷知小号彬) f 季( x ) o 蔓z s 工 定理2 1 1 设g o ) 一括o + ) z ) 工。,存在一个二次连续可导非负的偶函数 ig ( 卅 工o v o ) 使得:v o ) 一9 0 ) ( 2 1 1 ) v ) o ,工r ( 2 1 2 ) 一阱如o o s + 霎v 。( x ) 一( 口+ a ) v ( 功+ 工z + a ( v ( x ) + g g ) ( x 一工+ ) ) ;o ,z ,z + 证明:定义 v = 觚s h ( 口4 屙) + 昙冉孚 。工 脓细4 厮丽) + 南 笔等工+ 南 + a+i a + l i _ + ( v 0 + ) 一g ( x + h ) 工,工 口+ v ( 叫)z 0 ,当x s 0 同理可证,( 2 1 2 ) 式成立 要v ) 一口v o ) + 工2 ;譬( 2 矿觚s h ( 仃1 赢) + 争一口s v l 厮) + 吉 多膏 要v ) 一( 口+ a 弘( 力+ 工2 + a o ) + g o + ) o 一工) ) = 譬+ a p 。2 b c x p 1 瓜i 丽) + 熹_ ) 如纠胁如4 瓜面) + 熹 笔鲁工+ 南 + 譬o g ) 一g 。讧) 】+ 石:+ a p o + ) + g o ) 一r ) ) 引理2 1 2 y ) 如定理2 1 1 所述,定义伊 ,口) = v + 8 ) + g + ) i 口卜v 0 ) , x r ,口r ,疗+ c x ,2 三:一。! i ; 则 ( 1 ) 妒( 口0 ) ) 2i 密驴 ,口 ) ) ( 2 ) 令 ) = 妒0 ,疗o ) ) ,则0 0 ) 苫一v ) ,且有 嬖v 。o ) 一a v o ) + 工2 + a h o ) 一。石r ( 2 1 6 ) 证明:当x 【叫+ ,工】,口0 时, 当石【。,工。】,口s o 时, p 0 + 口) 一9 0 妒一v ) ) t = v g + 口) 一g g ) s g ) 一g ) 一o ,故当口+ o ) 一o 时,伊0 ,口+ 0 ) ) 最小 当石 工,o 之疗之石一石时, v 0 + 口) 一g ( 。) 苫v 。( x ) 一g ( 工) 口g ( 善) 一g ( x + ) 互o 当x 工,口s x 一石时, v ( 石+ 日) 一g ( x + ) sv 。( x ) 一g ( 工) 一。 当工 工,口0 时, v 0 + 口) + g ( x ) 苫v ( 力+ g ( x ) 之2 9 ( x ) 之0 故日+ o ) 一x 一石时,伊o ,p + o ) ) 最小 当x 工时,p 暑石一石, ) = v ) + g o ) 一z + ) 一v ( 力 由( 2 1 2 ) 式,v 。g ) z v g ) = 9 0 ) , p ( 力一y g ) = r 向) p 一石+ ) 29 0 ) 0 一石) ,7 g , ) = v ) + 9 0 ) 0 一工) 一v ( 力s 0 故x o 时o ) 一v o ) ,当工s o 同理可证 由引理2 1 1 当x 【0 ,x 】时,口= 0 ,由( 2 1 3 ) 要v 。o ) 一口v o ) + 善2 + 舶 ) ;等v 。) 一口v 。) + x 2 + a l 密p + 口) + g g + ) l 口| - v 。) ) = 要v 。一口v + x 2 = o 当x 工时,日= r 一x ,由( 2 1 4 ) 要v 一a v + 工2 + 舶o ) = 等v 。( 力一a v g ) + ,+ az 密p o + 口) + g o ) i 口卜v o ) 一罢;v ( x ) 一口v ( x ) + x 2 + a ( v ) + g o ) ( x 一工) 一v ( d ) 昌0 当z 王0 同理可证 引理2 1 2 的证 定理2 1 2 如果v ,g ( 力如定理2 1 1 所述,则 v g ) s ,o 活) = 啊e “( 砰出+ g ( 墨) d ;,) ,v 亭8 证明:首先证明v o ) s x 2 + 2 ,卜g ) b 3 l z l + 。, 岛,f = 1 ,2 ,3 ,4 为某些正常数 当石【o ,x + 】时,v 。) = 彳c o s h p 1 互赢) + 吉石2 + 事 由于s h p 一1 芝赢) ) ,o ,4 c o , 彳c o s h ( 盯一1 芝赢) s 4 s h ( o ) 令s :;吉,s := 彳c o s h ( o ) + 等则v s 审2 + s : 当z ,。) 时, 。;b 。;p ( 一盯一t 再i i 蕊) + 乓石z + 丛掣石 口+ l口+ + 番+ 南) - g 州) 如果矩州乩悯蚰+ 生手学办淼+ 去( 叫h 茗) 口+ l a + j a 十 铡= 等学一讲南+ 去) _ g 吣) 则v 0 ) e 一2 + : 如果x ,) ,工s 1 ,当x 1 时和上面证明类似,当x “,1 1 v 眯b + 击 笔罟+ 南+ 去附) _ g 脚) 锕一击一出等+ 蒜+ 南附) 嘶y ) 口+ a 8 + a陋+ a y口+ a 、 7 则v ) 王幸2 + 令 = m a 】( ,f 2 ;m a ) 【 :,f ;,s : ,故v ) s q 工2 + 2 由于v 0 ) 为偶函数,v s _ 工2 + 2 ,坛r ( 2 1 7 ) 同理可以证明o ) l s 岛l 工l + 。,城r ( 2 1 8 ) 令五;石+ 盯彤+ 舅,由d d 妇n s d 口如一肘砂盯公式 1 e ”( j ,r ) 一v = f e 洲y 彬+ f e ”佤f 磊+ 瓢e - 口f v 。渺+ :一口e ”v 隅陟+ 。薹8 “p + 皇) 一v ) 一p ) 皇】 = f e “【一口v 瞄) + 等v ) 协e ”o v y 彤+ f e ”隅y 爵 + 罗g 一“【v ( 墨+ 皇) 一v ( 墨) 一v ( 墨) 皇】 o : = f e “卜口v ) + 手v ( 墨) 体e ”,倒隅矽彬+ e “p + 皇) 一v ( z ) 】 o 美7 由于 ( 力= 1 密p + 口) + g o ) i 口卜v ( 力) ,茧只有在泊松跳时刻f 不等于零, v ( 置+ 皇) + 9 0 ) i 皇l v ( 墨) ( 墨) t , 由( 2 1 6 ) 式 p “v ( 工r ) 一v 0 ) = f e “( 一墨2 一舳( 置) 陟+ f e 删( 墨矽彬 + 罗p 一“【v ( 置+ 皇) 一v ( z ) + g ( x ) i a 皇l g o + ) l 皇h o 嚣r p v 僻r ) 一v g ) 芝 e “墨锄一f e “| i l y 似) + f e 一倒矽彬 + 。薹e “6 ) 一。蚤8 ”g 洲莓i 故e ”7 v ( 墨) + j :p ”( 砰出+ g o + 矽舅) 乏v o ) + r e 一“洲彬+ f e 一“ m f e “i l 矽) 由于9 0 ) = g g ) ,x 之工,当五工时,g ( t ) 一g o ) , 由于石苫。时,g 单调递减,知当0 s 置s 工时,g ) 之9 0 ) , 故g 佤) 芑g g + ) ,墨苫o ,五s 0 时同理可证 令膏,;m 一加,称齑,为补偿泊松过程 e ”7 v 隅) + j :e ”o 缸+ 占佤) d 舅) 苫v + f e 洲y 彬+ f e “ 矽膏” 令m ,= e “洲( 互v 彬,z ,一f e “_ l ( 鹭膏t , p ”( 墨) + p ”珈+ g ( z ) d 亭r ) 乏v o ) + m r + z r ( 2 l9 ) 由于( 2 1 8 ) 式 啊【e “洲( z ) 】2 出s 啊p “盯( 岛1 ei + s 。) 】2 出 s “【2 盯2 s ,2 p “i 墨1 2 勘2 s 。铲弦 o 存在瓦 o ,s ,当r ,瓦时,e ”7 霹,言,6 ,o , e 蠹e - “x j a t 一e 殛;d t ,矿既j m ,每t = m 和e e x ;m t m 矛盾 对( 2 1 1 0 ) 式取极限 e c 呸2 d t + g 旺m ;| 、皂v 1 6 ( 2 1 1 0 ) 因此v 0 ) ,o ;乒) v 拿b ( 2 l 1 1 ) 最优控制策略为:当状态过程在【+ ,x 】内时,不进行任何控制,当泊松跳发 生时,状态过程在卜石+ ,x + 】之外,则进行控制使其到达最近的边界x 或一t 锄玢e : 定理2 1 3 如果v 0 ) ,g ( 力如定理2 1 1 所述,则存在最优策略 筠= 丘,) 爵玑;f o ,彰口o + 叫+ 舅;x ) 口o + 叫+ 丘,) 够玑;石+ ) ,使得 v ( 砷= j 浩+ ) ;啊e “( ( f ) 2 出+ g ( f ) d 嚣) 证明:要证v 0 ) = , ;亭) ,仅须证v ( 力苫, ;宇) , 令x :a x + o w | 七? e ”7 v ( 砗) 一v g ) = f e ”,【- a v 似) + 譬v ( f ) 忙e ”丽似) d 形+ e “v 心若 + 罗e ”【v 暇+ 等) 一v 孵) 一v 。心) 等】 o 者= r = f e ”【一口v ( f ) + 等v 。( f ) 弦e “洲( f 矽彬+ 罗p ”p ( f + 髟) 一v ( f ) 】, o 象 e ”7 v ( 群) 一v 0 ) = f e “( _ ( f ) 2 一肭( f ) 沙+ f e ”洲皤瑚彬 + 罗e 一“p ( f + 皇) 一v ( f ) + 9 0 ) i 占,l 9 0 + ) i 皇i 】 o 轰矗 由于皇只有在泊松跳时刻f 不等于零,由亭的定义, e v ( 巧) 一v ) 羹一q :了d t 一蠹h q :m + 蠹e “o v 晖:w k + 。薹8 ” ( f ) 一。薹8 ”g 酬引, p 1 7 v ( z ) + j :p “( ( f ) 2 出+ g o 矽等) 一v 曲+ 蠹e 。| m ;瞪:v w l + 蠹e 。| h 晤:n t 一蠹e h q : ;v o ) + f e “洲( f y 彬+ f e 一“1 l ( f y 膏, :v o ) + ,+ 云, j :e “g 等。荟。“g 酬讣。薹8 “g 似) k 博i 2 。薹8 “g 僻) 懈呱。“g 阿) d 等, e ”( 群) + j :8 ”( ( f ) 2 西+ g ( f 弦等) 2 v o ) + m r + z r ( 2 1 1 2 ) 因而( m r + z r ) 芑一v 0 ,) 由于m ,+ 互为局部鞅, 存在一停时列tm ,n j ,0tm ) ,使得m f + 为零初值鞅,e 【m ;= + z ;= 】= o 由n f d “引理,对上述, e 似r + z r ) = e 【1 1 罂缈;+ z ,) 】 5 1 1 罂掣研m + z 】 = 0 从而e ”7 v ( 墨) + f :e ”( ( f ) 2 出+ g ( f m 等) s v o ) -y e 囊f 。雕:丫d t + g 噼:v 韵 _v 玎“西僻) + 瓤。”“f ) 2 出+ g 孵v 嚣) s v 令丁一m ,v ( 力2 - 厂g ;亭) 结合( 2 1 1 1 ) 式v ) = 厂0 ;亭) 定理2 1 3 得证 最优控制策略与其对应的受控状态图为: x 工 0 一石 2 2 平均期望费用模型 设( q , z ) ,p ) 为一概率空问, z ) 满足通常条件 受控过程墨一x + 口彬+ 毒,凰= 工,x r ,盯 o ,一 彬;f 2o 为标准布朗运动 亭= 碹;f 苫0 ) 为左连续过程,且爵2 丘,) 见烈,= ,:f 之0 ) 为强度为a 的z 适应 的泊松过程,口一 只:f 田为五可料 召表示允许控制集,求常数,对坛r 有莹b ,使得单位时间平均期望费用最 小,即 舰亭锁【孵) 2 出+ g 孵) d 等1 * 卢 一 v = 雪她耐季啊【跏+ g ) d ;,】 。,o 为常数,g o ) 为r 上的满足一定条件的非负连续偶函数, : ,:f o 为亭的 全变差过程,耋2 上l 以l 烈,或d 宇= i d 引 1 9 设季o ) 为r 上的非负连续偶函数,且在【0 ,m ) 上季( 功s o ,季( o ) ,0 若令m 一吾 譬一丢荆+ 去z 圳 则厂 ) 一o 至少有一根 这是由于: 躲,。) = 蚴咩一丢喜( 0 ) ) 一一m 舰删;熙专a 譬+ 缶加+ * 。 ”jl 2 故,0 ) ;o 至少有一根 令6 一i n f 伽 o :,o ) = 0 ,贝u ,( 6 ) 一o , 争丢删一手一缶川 蜃p ) 昙仃z 6 , f 季( x ) 0 s x s 6 定理2 2 1 设g ) ; 季 工,6 ,存在一个二次连续可导非负的偶函数 k ( 叫 工c o 。 v g ) 及常数芦,o 使得: v ( 6 ) ;g ( 6 ) ( 2 2 1 ) v o ) o 工r ( 2 2 2 ) 罢;v 。o o + x :昌p ,o s x s 6 ( 2 2 3 ) 罢;v 。( x ) 一a v ( x ) + x :+ ( v ( 6 ) + g ( 6 ) ( x 一6 ) ) ;卢,工 6 ( 2 2 4 ) 证明: 定义v 0 ) ; 一譬工4 仃2 矿州。) 。6 胁p ( _ 盯“瓜) + 去 g ( 6 弦+ 譬一鲁+ 一g 工,6 v ( ) 工 0 当工兰0 同理可证,( 2 2 2 ) 成立 当。s x s 6 时,譬v 。 ) + x 2 一譬( 2 c r 2 卢一2 盯一k 2 ) + z 2 ;,( 2 2 3 ) 成立, 当x ,6 时,要v 。g ) 一加o ) + x 2 + a o p ) + g ( 6 ) o 一6 ) ) 。等【2 p 2 b e x “一盯一1 互盈) + 书】一a 陋e x “一盯1 芝确 二 + 去工2 + g p 讧+ 譬一鲁+ o ( 6 ) 一g ) 6 ) 】+ 工2 + a p ( + g ( 6 ) 。一6 ) ) = 芦( 2 2 4 ) 成立, 引理2 1 1v ) 如定理2 2 1 所述,定义妒口) ;v o + 8 ) + g ( 1 8 i _ v , r0- 6 妄z 量6 x r ,口r ,令日0 0 = 6 一工z 6 i 一6 一x工一6 则 ( 1 ) 妒( 南日+ 0 ) ) ;i 密中仁,口0 ) ) ( 2 ) 令 g ) = 妒0 ,口( d ) ,则0 0 ) 苫一p 0 ) ,且有 芝;v ( x ) 一口v ( x ) + 石2 + 枷( x ) = 卢茗r ( 2 2 5 ) 定理2 2 2 如果v ) ,g o ) ,卢如定理2 1 1 所述,则 p s 憋i n 亭甄( z ? 出+ 占( z 矽舅) v 亭召 1rv v g ) s l 工2 + 2 ,l v ( x ) i s 3 i 工l + 4 ( 2 2 6 ) 令x i 一石+ 口彬+ 磊,由d d ,1 5 一加如一m 叫盯公式l l j v ( 墨) 一v ( 力 = f d v ( 墨v 彤+ f v ( 墨矽毒手v 。( 置沙 + 罗【v ( 置+ 皇) 一v ( z ) 一p ( z ) 毒j o 美r j f 手v 渺洲。佤v 彬+ 。圣p + 皇) 一v 佤) 】 由于 0 ) 2 1 密p 0 + 口) + g ( 6 ) i 口j - v 0 ) ,岛只有在泊松跳时刻f 不等于零, v ( 置+ 皇) + g ( 6 ) i 岳i v ( 置) 之 ( 瓦) f , 由( 2 2 5 ) 式 v ( 品) 一v o ) 一f ( 卢一五2 一舳( 葺) 陟+ f 洲( 墨v 彬 + 。薹p ( z + 皇) 一v ) + g p ) j 皇l - g ( 6 ) l 】 v ( 墨) 一v 仅) 2 p t 一蠹x 细一蠹h 呸m 啡) + 蠹洲悸溉 + 荟“) 一荟g ( 6 ) l 莓i , v q o + 呸2 d l + g 蝴 苫v ) + 卢r + f 洲。( 置矽彤+ f ( 置) 删:一f 1 l ( 互矽( 加) 令蠢| ;n :一n 。 v ( x r ) + j :( 砰出+ g p 矽舅) rv v g ) + 卢r + j ;洲( 置矽彬+ f ( 墨y 膏r ( 2 2 7 ) 两i 力除以7 手晒) + 知泓+ g ( 6 幽 z 亭v + 声+ f 吾口v 。( z y 彬+ f 亭 ( 墨矽氟 令坼= f 亭洲y 彬,z ,一f 手 y 膏, 吾v ( 西) + 丧f ( x 细+ g p m 邑) 苫手v ) + 卢+ 时,+ z r ( 2 2 8 ) 由于( 2 2 6 ) 式 e 吖r ;0 啊哮o v m s 啊暑【 l 五i + s 。) 】2 出 辱啊阮2 2 耐体 又由于o 苫i l ( x ) 乏一v ( x ) ,d :苫0 蠹;h n 交t = 考n 比一f 季矗y 蠢h 伍江t s 矗咖e 泓t r 是局部鞅,z 可料,由于 0 ) 的连续性, ( 墨) 可料,因而z = z r ;f 皂o ) 是局 部鞅,存在一停时列tto 。,n j ,otm ) ,使得才= z i i 为零初值鞅, 膨 = o 又由于乙小于一可积函数,由而f d “引理,对上述t , e ( 乙) ;研l i m s u p z 】 2 l i m s u p 耳z 】 所以亭西( 坼) + 手( 矸出+ g p m ,) z 吾v 。) + 卢 ( 2 2 9 ) l i m i n fe 三i x ; r - 7 一卿e 吾( 叫;坞) 洲赃e 手v ) 1 1 擘卿f 陋争群+ 手唾( 砰出+ g p 矽舅) 】之芦 1rv l i m i n f e 三l 霹;o ,否则和e fx 如 r - 下 1 j o 两边取极限 2 1 得 1 1 挈璺亭吒( 砰疵+ g p 矽) 皂户 lr v 由于g o ) = g ( 6 ) ,x 之6 ,当互2 6 时,g ) ;g p ) , 由于石= o 时,g ) 单调递减,知当0 s 五s 6 时,g ) 2 9 p ) , 故g ( z ) g p ) ,置o ,墨s 0 时同理可证 1 1 卿f 手啊( 霹出+ g ( 互m 邑) 之声 ( 2 2 l o ) 最优控制策略为:当状态过程在【曲,川内时,不进行任何控制,当泊松跳发生 时,状态过程在卜6 ,6 1 之外,则进行控制使其到达最近的边界6 或一6 批泐2 e 粤 定理

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论