




已阅读5页,还剩27页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
j e 塞窑亟左堂亟主堂僮盈窒 主童揸噩 中文摘要 摘要:本文主要研究受控于几何布朗运动的随机控制模型,第一类模型我们 称之为最优停止问题,其目的是找到一个停时,使得过程停止的时候期望收益值达 到最大,我们运用随机分析的方法,通过变分方程来分别处理这个模型中所提出 的问题。在一组适当的充分条件下,我们分别证明了最优停时的存在性 第二类模型我们称之为脉冲控制问题,其目的是找到允许脉冲控制无干预时 的策略,我们希望施加最优控制后总折扣费用期望值达到最小,我们应该考虑使 得费用函数被很好地定义且使其值有限的策略首先让我们考虑未干涉时的策略, 我们运用随机分析的方法得到允许控制未干预时的策略 本文的模型中研究的状态结构都是几何布朗运动,几何布朗运动在经济和金 融的研究中有很多实际的应用我们研究受控于几何布朗运动的随机控制问题有 很重要的实际意义 关键词:几何布朗运动;最优停止;脉冲控制;变分方程;最优控制;伊藤 公式;无干预;折扣费用函数 分类号:0 2 1 1 d 塞窑亟盘堂亟堂僮纶童 旦s ! 基王 a b s t r a c t a b s t r a c t :t h i sp a p e rs t u d i e sm a i n l ys t o c h a s t i cc o n t r o lm o d e l sd r i v e nb y g e o m e t r i cb r o w n i a nm o t i o n t h ef i r s tm o d e li so p t i m a ls t o p p i n gp r o b l e m t h eo b j e c t i v e i st of i n das t o p p i n gt i m ef o rm a x i m i z i n gt h ee x p e c t e db e n e f i t i no r d e rt os o i v ct h i s p r o b l e m ,w er e l yo i ls t o c h a s t i cc a l c u l u sm e t h o dv i av a r i a t i o n a le q u a t i o n u n d e ra s u i t a b l es e to f s u f f i c i e n tc o n d i t i o n s ,w ep r o v et h ee x i s t e n c eo f a no p t i m a ls t o p p i n gt i m e t h es e c o n dm o d e li si m p u l s ec o n t r o lp r o b l e m o u ro b j e c t i v ei st of i n dt h es t r a t e g y o fa na d m i s s i b l ei m p u l s ec o n t r o lw h e nn oi n t e r v e n t i o n s i n c ew ew a n tt om i n i m i z et h e e x p e c t e dt o t a ld i s c o u n t e dc o s tf u n c t i o n , w es h o u l dc o n s i d e ro n l yt h o s es t r a t e g i e sf o r w h i c hc o s tf u n c t i o ni sw e l ld e f m e da n df i n i t e f i r s t ,l e tu sc o n s i d e rt h es t r a t e g yo fn o i n t e r v e n t i o n h e n c e ,b yr e l y i n go ns t o c h a s t i cc a l c u l u sm e t h o d ,w eg e tt h es t r a t e g yo f n o i n t e r v e n t i o ni sa d m i s s i b l e t h es t a t ei sg e o m e t r i cb r o w n i a nm o t i o ni nt w om o d e l so f t h i sp a p e r t h eg e o m e t r i c b r o w n i a nm o t i o nh a sm a n yp r a c t i c a la p p l i c a t i o ni nt h es t u d yo fe c o n o m i c sa n df i n a n c e i t i sv e r yi m p o r t a n tt os t u d yt h es t o c h a s t i cc o n t r o lp r o b l e m sd r i v e nb yg e o m e t r i c b r o w n i a nm o t i o ni np r a c t i c e k e y w o r d s :g e o m e t r i cb r o w n i a nm o t i o n ;o p t i m a ls t o p p i n g ;i m p u l s ec o n t r o l ; v a r i a t i o n a le q u a t i o n ;o p t i m a lc o n t r o l ;t of o r m u l a ;n oi n t e r v e n t i o n ;d i s c o u n t e dc o s t f u n c t i o n 学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 并采用影印、缩印或扫描等复制手段保存、汇编咀供查阅和借阅。同意学校向国 家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名导师签名: 签字日期:年月日签字日期:年月日 j b 峦銮适太生亟堂焦监塞 独创性直明 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研 究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或 撰写过的研究成果,也不包含为获得北京交通大学或其他教育机构的学位或证书 而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作 了明确的说明并表示了谢意。 学位论文作者签名:签字日期:年月 日 致谢 本论文的工作是在我的导师刘坤会教授的悉心指导下完成的,刘坤会教授严 谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢三年来 刘老师对我的关心和指导。 师母汪玮在学习上和生活上给予了我很大的关心和帮助,在此向她表示衷心 的感谢。王秋嫒老师和邵吉光老师在学习上给予了我很大的帮助,在此表示由衷 的谢意。 袁继红、杨瑞成、刘晓鹏师兄和于洋、田绍琳、赵永芹师姐对于我的科研工 作和论文都提出了许多的宝贵意见,在此表示衷心的感谢。 在实验室工作及撰写论文期间,傅德华、颜建江、张靖靖等同学对我论文中 的研究工作给予了热情帮助,在此向他们表达我的感激之情。 另外也感谢我的父母和弟弟妹妹,他们的理解和支持使我能够在学校专心完 成我的学业。 j e 塞銮遵盘堂亟堂焦j 金塞绪论 第1 章绪论 1 1 、随机控制及随机最优控制简介 随机控制是综合运用随机过程、分析理论、最优化控制、变分方程以及随机 微分方程等方面的知识,来解决金融决策、证券投资、卫星遥控和跟踪等方面的 实际问题,无论在学术理论还是实际应用方面都要其重要的价值和光明的前景 现代控制理论的奠基人属于美国科学家维纳( n w i e n e r , 1 8 9 4 1 9 6 4 ) 自从上个 世纪五十年代以来,由于计算机技术、航空航天技术的飞速发展,控制论技术得 到了很好的发展和应用其主要包括如下五个分支:线性系统理论,建模和系统理 论,最优控制及自适应控制 在对实际控制问题的研究中,人们认识到,由于某些外部及内部因素的干扰, 影响控制系统的不确定因素是时有发生的因此,随机控制理论得到了应用和发展 随机控制理论是研究具有随机信号,随机噪声和随机特性的系统控制理论这方面 的工作可分为两个方面来看: 1 、对随机过程的研究由于随机控制研究的是非确定性系统,传统的微分方程 理论在描述它时产生了很大的困难,1 9 5 1 年,伊藤( k 1 t o ) 发表了论随机微分方 程一文,使得对具有良好统计规律的非确定性系统的描述有了相应的理论基础 2 、对控制本身的研究这方面的主要理论有:庞特里亚金的极大值原理( 1 9 5 1 年) ,贝尔曼的动态规划法( 1 9 5 7 年) ,卡尔曼的滤波和预测理论( 1 9 6 0 年) ,这 些工作产生了随机最优控制理论和滤波理论 随机最优控制是随机控制理论的一个重要的分支,其主要利用最优状态估计 系统的运行状态,求出一个状态反馈,实现使给定性能指标( 一般称为费用函数 或收益函数) 为最小或最大指标相应的状态反馈称为最优控制策略随机最优控制 的突破发展主要是由于贝尔曼的动态规划原理的提出,并且人们已经证明,随机 最优控制策略与确定性最优控制策略是相同的,这就是确定性等价原理本文的主 要工作就是利用动态规划原理得出收益函数或费用函数所应满足的变分方程,并 给出最优控制策略 j e 瘟至道太堂亟堂僮j 金塞 绪监 1 2 、几类常见的随机最优控制问题 本节介绍目前常见的几类随机最优控制模型,需要指出的是,这几类模型的 提出都是在对实际问题的分析中产生的,具有很强的应用背景 1 、奇异型随机最优控制模型 设( q f ,p ) 为一概率空间,形,t o 为其上的一维标准布朗运动,f = 盯( 形,o s f ) 以曰表示全体f 适应左连续零初值有限变差过程全体,对任意 善= 缶,t - 0 b 有正则分解舌= 等一等,鲁= 第十等为其全变差等,# 皆为口中 单调非降过程这里定义控制孝为有限变差过程主要是由于在这类模型中控制费用 被单独计算在内对奇异型随机最优控制,视其费用函数不同,分别有如下三种模 犁: ( 1 ) 、折扣费用模型 对某口 0 及x r ,v 孝b ,费用函数为: 以( 善) = e f e “【 “) 疵+ d 瓢 上式中= z + 彤+ 岳,函数h 为一般非负偶函数( 下同) 第一个积分为黎曼积分, 第二个积分为关于单调函数的斯蒂阶积分,在不引起混淆的情况下,将其统一为 f 带有折扣费用的奇异型随机最优控制模型在一维情形下已经研究扩展的比较 完善这方面的文献可参考 1 , 2 , 3 ( 2 ) 、平均期望费用模型 在这种情形下,对初值工r ,v b ,费用函数为: 2 j e 塞銮堑态堂亟堂位j 金塞缝论 正( 毒) = “罂璺f ;e r ( ) 出+ d 害】) , 上式中5 工+ 形+ 毒,最优控制即是寻找算e 曰,使得以( f ) = m 。;i 。n g a 专) 平均期望费用模型目前也有一些研究文献,可参看 3 , 4 【5 , 6 】 ( 3 ) 、有限时间费用模型 对初值z r ,v b ,费用函数为: 以( 善) = 【a ) 出+ d 兽1 , 有限时间费用问题目前研究文献较少,详细介绍参看文献 3 】 这里需要指出的是,除了对费用函数的研究扩展之外,对状态空间的研究 与扩展也是一个重要的方面例如将状态空间= z + 彬+ 专扩展为 = z + f ( t 泌+ f 盯( v 形+ 鲁, 函数( ) ,盯( ) 为满足某些性质的实函数,分别称为扩散系数和漂移系数这方面的 文献可参看【7 】,【8 】, 2 、脉冲型随机最优控制模型 脉冲控制的原始模型最初由b e n s o u s s a n 和l i o n s 提出,后来r i c h a r d 9 1 将该模 型推广到无限直线上,r i c h a r d 模型简述如下: 设( g f ,p ) 为一概率空间,形,f o 为其上的一维标准布朗运动,f = j ( 形,o s s t ) 每一个控制v 即指一列上升的f 停时o = f o - - 0 最优控制问题就是求一个控制v v 使对任意初值z 成立: 以( v ) - i 。n ,f j a y ) 脉冲控制模型对于具有跳变控制的问题( 如存储问题) 中具有广泛的应用, 相应的文献参看 1 0 】, 1 l 】,【1 2 另外脉冲控制也有相应的类似于奇异型控制的折 扣费用模型和平均期望费用模型 3 、带有停时的随机最优控制模型 这里带停时的意思为费用函数中含有停时,这既要求不但要得出最优控制,而 且要求出最优停时以奇异型最优控制为例,条件同l 中所述,并设丁表示全体f 适 应之停时,则对v 善b ,f t ,费用函数为: 以( f ,f ) = e r p 一“【 ( ) 出+ d 毒】+ g ( x j , 目的是寻找善b ,f t 使得 以( 善,r + ) 2 :哿珏以( 善,r ) 带有停时的随机最优控制在实际中有很强的应用背景,如跟踪问题,经济学中的 “投入一产出”问题,投资中的最佳停止问题等相应的文献参看 1 3 1 、【1 4 1 4 、最优停止随机控制模型 4 j e 塞銮适盘堂亟堂焦论塞缝途 关于最优停止问题的一些特殊问题在概率论中已经有悠久的历史然而最初的 某些一般性的结果是在上个世纪四十年代后期由w a l d ,w o l f o w i t z 和a r r o w ,b l a c k w e l l ,g i r s h i c k 在研究序贯统计决策问题时得到的最优停止理论作为概率论的一个 部分和它对统计的特殊应用,大约自1 9 6 0 年以来处于迅速发展之中,尤其广泛被应 用于经济金融的理论研究中,l a r r y s h e p p 和a ,n ,s h i r y a e v 在文献 1 5 1 5 b 提出如下 的最优停止随机控制模型: 设( q 只p ) 为一概率空间,彤,t - q 为其上的一维标准布朗运动,z = a ( 形,o 0 ,= 0 ,盯为常数,g 称为漂移,盯称为扩散 我们的目标为,找到某一停时f t ,使得: 矿+ ( ”) _ s u p e r e 一 r e r 一一 其中,t 表示所有f 停时全体, 0 是一个折扣因子,墨= m a x ( m a x 置,j ) ,对于固 v m r 定的值s 石= 五 有关这方面的文献可参看 1 6 、 1 7 、 1 8 1 3 、本论文工作简介 本文主要研究受控于几何布朗运动的两类随机控制模型,第一类模型为最优 停止问题,l a r d :s h c p p 和a n s h i r y a e v 在1 9 9 3 年提出如下的模型: 设( q ,p ) 为一概率空间,彬,t o 为其上的一维标准布朗运动,f = 盯( 形,0 o ,w o = 0 r ,c r 为常数,d 称为漂移,盯称为扩散 我们的目标为,找到某一停时r + t ,使得: 矿( 叫) s u p e , ,- ” f e , 。 其中,r 表示所有f 停时全体r 0 是一个折扣因子,墨= m a x ( m 掣置,s ) 对于固定 u m r 的值j 2 j = 凡 题 x g u oa n dj l i u 在2 0 0 5 年研究文献【1 5 】的基础上提出了如下的最优停止问 找到最优停时,使得 v = “只a ) = s u p f ”l , 难5 t j , 一一 这里,是一个折扣因子,s = m a x ( m a 詈x ,s ) 对于固定的值s 工2 以,墨是一 个几何布朗运动即 矗x t = 杠x l d t 七o x , d w _ 这里彤,t o 为一维标准布朗运动,b ( 五) = “,2 ,) ,f 1 ,吒一,t 一f - 。为独立 同分布,服从具有参数为旯的指数分布 文献 1 6 中假设收到的信号服从参数为 的p o i s o n 分布,最优原则由收至信 号的频率分类,讨论了两种情况:存在一个临界值a ,如果兄 兄,最优停止问题 利用光滑适应原则的自由界公式得到解决,而最优停时由一个临界值置控制如果 五兄,当收到第一个信号就立即停止就是最优策略,即r = 五, 在文献【1 5 】、【1 6 】的启发下,本文考虑如下的最优停止随机控制模型 找到最优停时,使得 6 j b 立变亟盘堂亟圭堂焦论室 缓i 金 即 矿( 工) = e p 蚂) - 粤e p 魍) 其中,r 0 是一个折扣因子,丁表示所有f 停时全体z 是一个几何布朗运动 d r , = u x , d t + o x | d w ;, 这里形,t o 为一维标准布朗运动矽( z ) 为定义在( o ,m ) 上的满足一定条件 的实函数 本文研究的第二类模型是脉冲型随机控制问题,m a s a m i t s uo h n i s h i h 和m o t o h t s u j i m u r a 在2 0 0 6 年提出如下模型: 令( q ,f ,p ; 。) 表示带有滤子的满足通常条件的概率空间形,t o 为标准 布朗运动,f 。= “形,o s f ) 0 - - s f j f ,为一列上升的) 停时, 表吒前a 一域对每一r i 指定一一可测的随机变量缶i - - o o ,f 一q 叩约定 i - o ,若f f + = q ,则f + 广= 一若h j 受f f r 】:o ,v t 仨 o ,) ,记v 置( ,毒) k 为一个 脉冲控制用矿表示其的全体受控过程五状态方程: f d f = 卢f 也+ 嘲d 形,l 0 为常数施加控制v 后,系统状态就变为f ” 对应于控制v ,令其依赖于初值x 的完全费用为: 川加e je - r t d ( x j “) a t + 艺,e - k ( e ”,岳) j l i ij 其中r 0 d ( x ) = 甜2 ,口 0 是常数 g ( x ,善) := k o + k 2 ( x 2 一( x 一善) 2 ) + 毛( 工一( 工一舌) ) , 其中,k ,红为大于0 的常数 7 j e 夏变通盘堂亟堂僮硷塞 络j 金 所谓最佳控制问题即求一控制v v ,使厂”( j ) = i n f j ”( x ) v v 文献 1 9 的作者证明了该模型最优控制策略的存在性,本文针对文献 1 9 中的 模型,分析了一类带有二次费用几何布朗运动的脉冲控制无干预时的策略,另外 我们还得出当费用函数推广为7 次幂函数时相应的结论,这样的结论有助于我进一 步研究此类脉冲随机控制问题中的最优策略 本文主要讨论的模型都是受控于几何布朗运动,几何布朗运动在经济和金融 的相关理论研究中占有很重要的地位在研究证券价格随演化的过程时,几何布朗 运动可以看成是长期以来所研究的布朗运动模型的一个变体,几何布朗运动和布 朗运动都是未来价格变化只依赖于当前的价格,与历史价格无关,不同的是,几 何布朗运动下价格比率的对数服从正态分布,而在布朗运动下价格之差服从正态 分布在现代金融理论中,通常假设股票的价格服从几何布朗运动,著名的b l a c k - s c h o l e s 期权定价公式也是以此假设为基础因此对于受控于几何布朗运动的随机 最优控制问题的研究具有很重要的意义 本文分为三章,提纲如下:第2 章研究一类受控于几何布朗运动的最优停止 随机控制问题;第3 章分析了一类带有二次费用受控于几何布朗运动的脉冲控制 无干预时的策略,另外我们还得出当费用函数推广为i 7 次幂函数时相应的结论 j 塞銮垣叁堂亟堂僮诠窒 筮2 童量控王且但查龃运动的量位倥止堕扭控剑回星 第2 章受控于几何布朗运动的最优停止随机控制问题 2 1 、模型介绍 本章节研究的模型如下 令( q ,f ,p ; f k ) 表示一个满足通常条件的带有滤子的概率空间这里形,t o 为f 一标准布朗运动 令置表示以下随机微分方程定义的系统状态 d x t = p x t d t + o x 矗m ,x o = x 其中,石 o ,w o = 0 ,u ,o r 为常数,称为漂移,盯称为扩散,盯0 即受控过程的状态方程为 x | = x + t “x $ + t 。x i d w | ,t o 我们的目标为,找到某一停时r t ,使得: e e - q ( x ) ( 工) = 霉p 驴( _ ) ( 2 1 ) ( 2 2 ) 其中,r 表示所有c 停时全体, 0 是折扣因子( 石) 为定义在( o ,o o ) 上的满足 一定条件的实函数定义当f = m 时,e - ”( 丑) = o 2 2 、主要定理及证明 蝴加c + = ,羔i 卢+ 竽矿 叭。誓k = c o n s0,nenconstallt unn, x 席 9 j e 裹銮堡盔堂亟堂焦j 金塞2 :21 圭翌定堡厘延明 引理2 r n p + n ( n 2 - 1 ) 盯2 ,则o l h 其中,口为方程 三盯2 工2 + ( 一三仃2 ) 工一,= o ( 2 3 ) 的正根 a = ( j 1 一了, u + ( 考;一三 2 + 事 “2 证明:因为r n p + n ( n z - 1 ) 仃2 ,又a 为方程三仃2 石2 + ( 一圭盯z ) x - r = o 的正 根,所以 所以口 咒 0 2 2 - - b ( 一三旷) n - r = i u n + n ( n 2 - 1 ) 0 2 - - r n z + n ( n 2 - 1 ) 盯2 ,则存在常数t 。及( 。,叫上的连续可导函数 v ( x ) ,它在( o ,玉) u 阮,) 上二次连续可导且有 令 y ( 工) ( x ) , 矿( 力= 矿( x ) , 2 0 , 2 xy ( 力+ 石矿o ) 一,矿( 力= o , 工( o ,) 石【五,o o ) 工( 0 ,h ) ( 2 4 ) ( 2 5 ) ( 2 6 ) 圭c r 2 j 21 :2 ( ! ! ! 二生+ p x v ( 功一r 矿( 石) 。, 石( 。,。) ( 2 7 ) 溉七c 去声弘等 口一以。= 1 0 j e 鏖銮亟盔堂亟堂焦监塞2 :2 :圭垩定堡丞延明 t ,、f “4 ,z ( o ,) 9 2 i 卜k n , x e ,嘲 显然v ( x ) 在( o ,t ) u ( 一,。) i - - - 次连续可导,下证 实际上,由定义 f c x a = 鬈一k 。 1 c 口:硝一 钟= 簪旧:等等a _ l a = 忑n k “4 七白卜圳熹卅= 兰 由此可知( 2 8 ) 中的第一个式子成立,即虼k ) = 丘化) 又 蝣1 2 等i 心l h 熹,;2 等诎“寿 ! 一 r1 一l e l型 :腑一( a - n ) - a l :。k , - 1 ( 生) 1 _ :。七( 旦) 下硝一( 与1 口一以口一胛 由此可知( 2 8 ) 中的第二个式子成立,即( 五) = ( ) 由( 2 8 ) 可知y ( j ) 在( o ,) 上一次连续可导 下面再证( 2 4 ) 式成立 ( 2 8 ) j 塞銮亟鑫堂亟兰僮监塞z :2 :圭翌定堡理垂明 由v ( x ) 的定义可知只须让v ( x ) 妒扛) ,v x ( o ,五) 即证c x 。( r k n ) + 由a 月,c 0 知当j ( o ,k ) 时结论显然成立 下面证明x ( 七,置) 时结论成立 而( r - k “) + ;,一,v x ( t ,t ) 即须证“8 r 一,坛( 女,t ) 令( 力= 。一( ,一女”) 先证 厂( 工) o ,v x ( ,t ) 因。( 功= c o a x ”一,x ”1 = x ”( t a x ”。一) , 故欲证( 2 9 ) 式,只须证在( 七,t ) 有j 一n n g + n ( n 2 - 1 ) 盯2 ,可知以上函数在阮,o 。) 上严格减,故欲证( 2 1 。) 式只须证 a e 立銮通太堂亟堂焦监窒2 :21 圭垩定理厘运明 班掣盯2 + n 1 t - r ) 删s 。 由t 的定义知上式等于 尼c 身 ”c 掣n ( n 驴咖b c 丁n ( n - 1 ) 咿叫 叫南c 掣卉删一老r 熹 a ( - 孚c r 2 + t 1 一 l 口一刀 z口一 f口一九i 因为口为方程;o - 2 x 2 + ( 一i t 盯2 ) x - - r = o 的正根,且由引理2 1 知在所设条件下 口 n ,所以 挑n k 口c 字 叫= 兰 m 甲12 胪,卜 至此( 2 1 0 ) 得证,欲得( 2 7 ) 式只须再证当工= 置时( 2 7 ) 式成立 为此令 旃o ) = 靠4 ,j ( o ,0 0 ) 唬( 砷= ,一七4 ,石( o ,0 0 ) 则萌( 曲,唬( j ) 皆为( o ,o o ) 上的二次连续可导函数,由( 2 6 ) 的证明可以看出 三o - 2 x 2 缟( 工) + 确( j ) 一r o ( x ) :o ,工( o ,。) ( 2 i i ) 由( 2 1 0 ) 式证明的分析可以看出 ! 0 2 x 2 谚2 。( 工) + ,“唬( j ) 一r 疙( 工) o ,工e i x ,o o ) 【2 i z ) 再由v ( x ) 的定义及其在( o ,0 0 ) 上的连续可导性可知 西( t ) = 唬( t ) = 矿( 置) ,爿( 五) = 五( 置) = 矿( t ) 又由单边导数的定义可知 衍( ) = ( ) ,西( t ) = ( t ) 当z = 时,把( 2 1 1 ) 和( 2 1 2 ) 二式相加即可推知( 2 7 ) 式成立 4 j b 京交道盔堂亟堂僮盐塞2 :2 :圭要定理丞运盟 定理2 1 设r n l - t + 丛等旦盯2 ,t 及矿( 石) 为引理2 2 中得到的常数及函数, 则r = i n f t _ 0 ,置( o ,t ) ) 为本文模型的最佳停时,其中z ,f o 表示方程( 2 1 ) 所确定的状态过程,即 e e - r f q k ( x ) = 矿( 石) = 磐e e ”( t ) 且矿( 石) = 矿( j ) v x 0 证明:设v ( x ) 为引理2 2 中得到的函数,一,t o 为初值为z 时,方程( 2 1 所确定的状态过程 先证对v f t ,垤 0 ,都有 z e - ”矿( t ) sy ( 刁 ( 2 1 3 ) 首先定义停时只= i n f f o ,一e ,n ) ) ,n = 1 ,2 ,则由推广型的打:公式得,对v 日一7 7 “晶矿( 置品) 一矿( 力 = 卜厅w t 胁 $ , e - r s v ( x , ) d x + 扩矿4 盥掣迎d 由状态万程( 2 1 ) 瓦口j 知,上瓦b | j e - 7 “品矿( 以瓦) 一矿( j ) = 【“品e 一4 一,y ( 。t ) + 卢e y ( 。) + j 1 盯2 爿:! 二! 二- 2 - ; - ! 兰盟 a a + r o e 一4 x , v ( 置) d 形 由( 2 7 ) 式及上式可以推出 e - r ( r 晶) v ( x r 晶) 一y ( 砷f 品o e 一4 x , v ( 置) d 彬口j ( 2 1 4 ) 注意到j f 时皆有置正,n 】,故j m :伽t a i l f 0 ,s j 旧2 ( 叭z ) ) 2 卜m 从而 e r 碡 a e - x , v 。( 置) 2 凼s e f 仃2 4 置y ( 五) 2 d s _ e f c r 2 e - 2 r 1 m d s = 仃2 m e r e - :- d s = 2 r c r 2 m m j e 夏窑通盔堂亟堂焦边塞2 :21 主要定理厘适明 f r 仃e - x y ( t ) d 彬= o , 对( 2 1 4 ) 式两边取期望即得 e e - r ( r s d v ( x 孙) 矿 ) 当r 时,令月一,由f a t o u 引理( e 3 8 1 ) 知 e ”7 y ( 卫) = e 。l i m e a s ) v ( 置以) s 。l i r a e 1 ( f 晶帆五最) 矿 当f = 。时,由模型中给出的定义l i m e “庐( 以) = o r 【因为五= z e x p ( 一;a 2 p + a 形 ,取一个样本有 。玎钡五) 玎飞”圳) “f = 工唧 _ ,州一i 1 呐r + 盯彤) 一懿p 卜一三 吵+ 仃形 咒+ 竺生;旦盯2 ,n 在满足这个条件的情况下,我们得到最优停时 使得过程停止的时候折扣期望收益值达到最大我们的最优策略是,如果状态的初 始值工t 时,控制使其立即停止;如果状态的初始值0 0 为常数施加脉冲控制y 以后,系统状态就变为。砰” 对应于控制v ,定义其依赖于初值x 的完全费用为: 八功= e e - n d ( x :v ) 出嚆e 1 五( 吲枷铀 ( 32 ) 这里,r 0 为折扣因子 运行费用函数d ( x ) i ! :,0 - 一i o v 控制量的费用函数k ( x , ) 为: k ( x ,善) := + t :( 石2 - ( x - 善) 2 ) + 墨( j 一( 工一手) ) , 其中,墨,也为大于0 的常数 所谓最佳控制问题即求一控制v v ,使有 ( 3 3 ) ,( z ) = i n f j ”( j ) 1 9 j 哀銮道太堂亟堂僮监室3 :21 圭翌定堡厘适明 我们希望施加最优控制后使得函数j 7 ( 石) 的值达到最小,那么首先需要满足 j ”( x ) 的值是有限的下面我们针对凡种不同的费率函数讨论未干预时,”( 石) 应满 足什么条件令表示系统中无干预( p r j = m ) = 1 ) 条件下的控制,显然此时有 喜e ,n k ( 彳,缶m ,1 = 。,我们只需考虑使得e r e “。( x “) 出 o 为常数且p 0 , 则有 e 驴孵1 出 o , 工22 a xa 2 pr 一 7 状态方程保持不变,把费率函数推广为一般的二次函数形式得到 定理3 3 设如引理3 1 所述,若d ( 工) = a ( x - b ) 2 + c ,a o ,c o , b r 为常数且p 0 ,则有 所以有 e p 啷1 加垮一笔+ 宰锄c 胛- 2 p - a 2 , 证:由引理3 1 知,f ”= x e x p _ 似一三仃2 v + 仃彤) , 吐f 矿”d ( f “) 出 = f f “ n ( 矸一6 ) + c d t d 凡矿卅卟坩 f ,叫 d n 矿_ 6 ) 2 卟; j e 塞窑迪太堂亟堂位监塞:21 圭垩定垄厘逛明 由定理3 2 知, 上式一a x 2 2 a b x + 型竺 o ) 且日 0 ,则 吐p 啊1 出 _ 筹 0 则有 韭立奎逗盍堂亟堂僮论塞 :结迨 e 旷似矽) 出 耐f ”炒e 蚓f e - t r - f - 掣一7 出 划p 研2 筹 0 ,则未干预情况下的脉冲控制是允许的另外我们还得出当费 用函数推广为7 次幂函数时相应的结论这样的结论有助于我进一步研究此类脉冲 随机控制问题中的最优策略 j e 塞窑道盔堂亟堂僮监塞 壹耋奎越 参考文献 【1 b e n e s v e s h e p p l a ,w i t s e n h a u s e nh s ,s o m e s o l v a b l e s t o c h a s t i cc o n t r o l p r o b l e m j ,s t o c h a s t i c ,1 9 8 0 ,( 4 ) :3 9 - - - 8 3 2 k a r a t z a s i ,ac l a s so f s t o c h a s t i cc o n t r o lp r o b l e m j 。s t o c h a s t i c , a d v a p p l p r o b , 1 9 8 3 ,( 1 5 ) : 2 2 5 - 2 5 4 3 】刘坤会一类奇异折扣费用模型之推广 j ,系统科学与数学,1 9 8 9 ,( 2 ) :1 1 3 1 2 3 【4 】刘坤会,奇异随机控制中的平稳问题 j 】,系统科学与数学,1 9 9 2 ,( 3 ) :2 2 1 2 2 8 【5 】刘坤会,奇异随机控制中的折扣费用及平稳问题,科学通报,1 9 8 8 ,( 1 7 ) :1 2 9 卜 1 2 9 2 6 】周华春,刘坤会,一类平稳的奇异型随机控制问题的研究,应用数学学报,1 9 9 2 ,( 3 ) : 3 5 5 - - 3 6 3 7 】刘坤会,一个变分方程问题及其应用,北方交通大学学报,1 9 9 5 ,( 2 ) :2 0 0 一2 1 5 8 】刘坤会,状态由随机微分方程确定的平稳问题,北方交通大学学报,1 9 9 6 ,( 1 ) :6 9 - - 7 4 9 】s c o r f r i c h a a r d ,o p t i m a li m p u l s ec o n t r o lo fad i f f u s i o np r o c e s sw i t hb o t hf i r e d 舶 p r o p o n i o n a lc o s t s o f c o n t r o l ,s i a m j o u r n a l o n c o n t r o l a n d o p t i m i z a t i o n ,1 9 7 7 ,( 1 ) :7 扣_ 9 1 1 0 】刘坤会具有保留费用及按比例费用的受控扩散脉冲过程的最佳费用问题,应 用数学学报,1 9 8 6 ,( 3 ) :2 8 2 2 9 5 【1 1 刘坤会,r i c h a r d 模型最佳控制的存在性及其费用函数的结构,应用数学学报,1 9 8 6 , ( 4 ) :3 8 5 - - 4 0 8 【1 2 刘坤会,局部区域的最佳脉冲随机控制,数学学报,1 9 9 2 ,( 3 ) :2 8 卜2 9 5 1 3 】m h a d a v i sa n dm z c r r o s ap r o b l e mo fs i n g u l a rs t o c h a s t i ce o n 仃o lw i t hd i s c r e t i o n a r y s t o p p i n g ,t h e a n n a l so f a p p l i e d p r o b a b i l i t y ,1 9 9 4 ,( 4 ) :2 2 6 - - 2 4 0 1 4 】刘坤会,从停止问题到折扣费用问题,系统科学与数学,1 9 9 1 ,( 3 ) :2 6 3 - - 2 6 6 【1 5 】l s h e p pa n da n s h i r y a e v ,t h er u s s i a no p t i o n s :r e d u c e dr e g r e t ,a n n a bo f a p p l i e d p r o b a b i l i t y3 ( 1 9 9 3 ) ,p p 6 3 1 6 4 0 【1 6 】x g u oa n dj l i u ,s t o p p i n ga tt h em a x i m u mo f g e o m e t r i cb r o w n i a nm o t i o nw h e ns i g n a l s a r er e c e i v e d ,a p p l p r o b 4 2 ( 2 0 0 5 ) ,p p 8 2 6 8 3 8 1 7 p a u ld u p u i sa n dh u iw a n g ,o nt h ec o n v e r g e n c ef r o md i s c r e t et oc o n t i n u o u st i m ei na n o p t i m a ls t o p p i n g p r o b l e m ,a n n a l so f a p p l i e d p r o b a b i l i t y l 5 ( 2 0 0 5 ) ,p p 1 3 3 9 1 3 6 6 1 8 j d d u f f l ea n dj m h a r r i s o n ,a r b i 仃a g ep r i c i n go fr u s s i a no p t i o n sa n dp e r p e t u a l l o o k b a e ko p t i o n s ,a n n a l so f a p p l i e dp r o b a b i l i t y3 ( 1 9 9 3 ) ,p p 6 4 1 4 5 1 【1 9 m a s a m i t s uo h n i s h i ,m o t o ht s u j i m u m ,a 1 1i m p u l s ec o n u o lo fag e o m e t r i cb r o w n i a n m o t i o n w i t hq u a d r a t i cc o s t s e u r o p e a n j o u r n a l o f o p e r a t i o n a l r e s
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 福田消防知识培训课件
- 电子元件配件采购合同范本
- 电影知识竞赛试题及答案
- 福建省公共基础知识培训课件
- 本科成人考试试卷及答案
- vb考试试题及答案6
- BChE-IN-40-生命科学试剂-MCE
- 福州市急救知识培训课件
- smtipqc考试题及答案
- DB61T 575-2013 压裂用滑溜水体系
- 供应商保价协议合同范本
- 2025-2030中国乒乓发球机行业市场运营模式及未来发展动向预测报告
- 2025年广东省中考历史试卷(含答案)
- 在线知识付费讲座创新创业项目商业计划书
- 武汉市养犬管理暂行办法
- 2025 护理法律风险防范课件
- 2024-2025学年北京市西城区高一(下)期末数学试卷(含解析)
- 2025年网格员招聘笔试题库含答案
- 造型基础教学课件
- 抗菌型PE(聚乙烯)保鲜膜行业深度调研及发展项目商业计划书
- 行政单位固定资产培训
评论
0/150
提交评论