




已阅读5页,还剩56页未读, 继续免费阅读
(应用数学专业论文)动态对策中解的时间一致性.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 本论文将研究并解决在非零和动态对策冲突过程解的时间一致性问题,以及与 此相关的对策模型和求解等问题。具体地蜕,拟建立或运用已有的最优准则、研究 它们的存在性、建立有效的算法以寻找动念稳定的最优解,重点研究最优准则的动 态稳定性( 时间一致性) 。 本文的第一章主要介绍了关于时阳j 致性的基本概念。给出合作微分对策的定 义以及三种最优准则:动态稳定性最优准则,积分最优准则和微分强动态稳定最优 准则。 第二章主要介绍了具有贴现支付的对策的时间一致性问题。首先给出了在合作 微分对策背景下,弱稳定集中分配的时阳j _ 一致性问题,文中建立了一种判断弱稳定 集中分配的时间一致性的最优准则,并利删改变报酬分配程序给出一种调整的方法, 使得任意路径满足时问一致性。这也可以认为是本文主要创造性成果之一。然后给 了具有贴现支付的对策的强动态稳定的最优准则。 第三章分别描述了具随机持续时间的微分对策,具不确定支付的合作微分对策 的时间一致性问题。主要利用了分配补偿程序在给定最优准则的基础上建立动态稳 定和强动态稳定的最优准则,并给出计算分配补偿程序的公式。 在本文中,均是通过先介绍对策背景,给出确定时问一致性的最优准则,然后 给出一种调整的方法,使得给定的最优准则耐动态稳定的或者是强动态稳定的。因 为一个时间一致性的解应当满足:当对策沿着最优轨迹进行时,在每时每刻,局中 人们根据最初确定的最优准则,都不愿意偏离这个最优行为。但是会有许多不满足 的分配集合,因此我们给出调整的最优准则或者调整的解,使得所有的分配满足时 间一致性。 关键词:弱稳定集;时间一致性;随机持续时间;分配补偿程序;不确 定支付 a b s t r a er a b s t r a c t i nt h i sp a p e r , w ew i l ls t u d ya n ds o l v et h es o l u t i o ni nt h en o n - v a n i s h i n ga n d t h ed y n a m i c c o u n t e r m e a s u r ec o n f l i c tp r o c e s ss o l u t i o nt i m eu n i f o r m q u e s t i o n ,a sw e l la sw i t ht h i sq u e s t i o na n ds oo n c o r r e l a f t o n c o u n t e r m e a s u r em o d e ia n ds o l u t i o n t ob es p e c i f i c p l a n st oe s t a b l i s h o rt h eu t i l i z a t i o nt h e m o s ts u p e r i o rc r i t e r i o nw h i c hh a s ,h a ss t u d i e d t h e i re x i s t e n c e ,t h ee s t a b l i s h m e n te f f e c t i v ea l g o r i t h m s e e k st h e d y n a m i es t a b l eo p t i m a ls o l u t i o n ,k e yr e s e a r c hi n o s ts u p e r i o rcr i t e o n d y n a m i cs t a b i l i t y ( t i m e u n i f o r m i t y ) t h et h i sa r t i c l ef i r s tc h a p t e rm a i n l yi n t r o d u c e da b o u tt h et i m e u n i f o r mb a s i cc o n c e p t p r o d u c e st h e c o o p e r a t i o nd i f f e r e n t i a l c o u n t e r m e a s u r et h ed e f i n i t i o na sw e l la st h r e ek i n do fm o s ts u p e r i o r c r i t e r i a : d y n a m i cs t a b i l i t ym o s ts u p e r i o rc r i t e r i o n ,i n t e g r a lm o s t s u p e r i o rc r i t e r i o na n d d i f f e r e n t i a ls t r o n g d y n a m i cs t a b l em o s t s u p e r i o rc r i t e r i o n s e c o n dc h a p t e rm a i n l yi n t r o d u c e dh a st h ed i s c o u n tp a y m e n tt h e c o u n t e r m e a s u r et i m eu n i f o r i l l q u e s t i o n f i r s th a sp r o d u c e du n d e rt h e c o o p e r a t i o nd i l t 、e r e n t i a lc o u n t e r m e a s u r eb a c k g r o u n d ,t h ew e a k s t a b l e c e n t r a l i s ma s s i g n m e n tt i m eu n i f o r mq u e s t i o n ,i nt h ea r t i c l e e s t a b l i s h e do t l ek i n dt o j u d g et h e w e a ks t a b l ec e n t r a l i s ma s s i g n m e n t t h et i m eu n i f o n nm o s ts u p e r i o rc r i t e r i o n a n dp r o d u c e do n ek i n d o f a d j u s t m e n tu s i n gt h ec h a n g er e w a r da l l o c a t i o np r o c e d u r et h em e t h o d ,c a u s e dt h ef r e ew a y t os a i l s f y t h et i m eu n i f o r m i t y t h i sa l s om a y t h i n ki so n eo f t h i sa r t i c l em a i nc r e a t i v ea c h i e v e m e n t s t h e ng a v e h a d t h ed i s c o u n tp a y m e n tt h ec o u n t er m e a s u r es t r o n gd y n a m i cs t a b l em o s t s u p e r i o rc r i t e r i o n t h i r dc h a p t e rs e p a r a t e l yd e s c r i b e ds t o c h a s t i c a l l yt h ed u r a t i o nt h e d i f f e r e n t i a ic o u n t e r m e a s u r e ,h a d t h ei n d e f i n i t ep a y m e n tt h e c o o p e r a t i o nd i f f e r e n t i a lc o u n t e r m e a s u r et i m eu n i f o r mq u e s t i o n m a l n l y u s e d t h ea s s i g n m e n tt oc o m p e n s a t et h ep r o c e d u r ei nt oa s s i g nt h em o s t s u p e r i o rc r i t e r i o ni nt h ef o u n d a t i o nt o e s t a b l i s hd y n a m i ci ss t a b l e a n dt h es t r o n gd y n a m i cs t a b l em o s ts u p e r i o rc r i t e r i o n ,a n dp r o d u c e d t h e c o m p u t a t i o na s s i g n m e n tt oc o m p e n s a t et h ep r o c e d u r et h ef o r m u l a i nt h i sa r t i c l e i st h r o u g hf i r s ti n t r o d u c e dt h ec o u n t e r m e a s u r e b a c k g r o u n d ,p r o d u c e st h e d e t e r m i n a t i o nt i m eu n i f o r mm o s ts u p e r i o r c r i t e r i o n t h e np r o d u c e so n ek i n do fa d j u s t m e n tt h em e t h e d c a u s e s w h e nm o s ts u p e r i o rc r i t e r i o nw h i c ha s s i g n sd y n a m i cs t a b l eo ri ss t r o n g d y n a m i c a l l ys t a b l e b g e a u s eat i m eu n i f o r i l ls o l u t i o nm u s ts a t i s f t :w h e n t h ec o u n t e r m e a s u r ec a r r i e so na l o n gt h em o s t s u p e r i o rp a t h ,i ne v e r y t i m e ,i nt h eb u r e a ut h ep e o p l ea c c o r d i n gt ot h em o s ts u p e r i o r c r i t e r i o nw h i c h d e t e r m i n e da tf i r s t a l li sn o tw i 】i n gt od e v i a t e t h i sm o s ts u p e r i o rb e h a v i o r b u tc a nh a v em a n y d i s s a t i s f i e d a s s i g n m e n t ss e t s t h e r e f o r ew ep r o d u c et h ea d j u s t m e n tt h em o s t s u p e r i o rc r i t e r i o no rt i l e a d j u s t m e n ts o l u t i o n ,c a u s e sa l la s s i g n m e n t s t os a t i s f yt h et i m eu n i f o r m i t y k e y w o r d s :w e a ks t a b l ec o l l e c t i o n ;t i m eu n i f o r m i t y ;s t o c h a s t i c a l l y t h ed u r a t i o n ;t h e a s s i g n m e n tc o m p e n s a t e st h ep r o c e d u r e ;i n d e f i n i t ep a y m e n t 青岛人学硕十孚位论文 学位论文独创性声明 本人声明,所呈交的学位论文系本人在导师指导下独立完成的研究成果。文中 依法引用他人的成果,均已做出明确标注或得到许可。论文内容未包含法律意义上 已属于他人的任何形式的研究成果,也不包含本人已用于其他学位申请的论文或成 果。 本人如违反上述声明,愿意承担由此引发的一切责任和后果。 论文作者签名: 群窖速同期:乒吖年s 月引日 5 8 青岛人学硕h 学位论文 学位论文知识产权权属声明 本人在导师指导下所完成的学位论文及相关的职务作品,知识产权归属学校。 学校享有以任何方式发表、复制、公开阅览、借阅以及申请专利等权利。本人离校 后发表或使用学位论文或与该论文直接相关的学术论文或成果时,署名单位仍然为 青岛大学。 本学位论文属于: 保密口,在年解密后适用于本声明。 不保密d 在以匕疗框内打“”) 论文作者签名:涨字培 日期: 川年f 月5 日 导师签名: 翻似名 同期:厶吵年月6 日 ( 本声明的版权归青岛大学所有,未经许可,任何单位及任何个人不得擅自使用) 5 9 引言 引言 对策论是一门以严格的数学模型来研究和规范描述人与入之间利益相互制约下 策略选择时的理性行为及相应结局,并在统框架下加以严整的数学分析的理论。 它是在2 0 世纪4 0 年代形成并发展起来的- - f 年轻而极富生命力的学科。 1 9 7 7 年,彼得罗相( p e t r o s j a nl ) 与挪威经济学家芬恩基德兰德( f i n n e k y d l a n d ) 和美国经济学家爱德华普雷斯科特( e d w a r dc p r e s c o t t ) 分别独立 并几乎同时提出并深入研究了复杂的冲突控制系统中的时间一致性问题,而后两者 因为此项工作获得2 0 0 4 年诺贝尔经济学奖。 1 9 9 0 1 9 9 5 年由彼得罗相教授及其领导的学派创建了动态对策及其应用中动态 稳定解的理论体系,在近年来得到迅速发展并且被公认是极其独到的。他们所获得 的以整体化( 积分方法) 经典最优准则为基础的建立动态稳定解和以局部最优行为 为基础的建立最优准则的方法是多阶段对策理论中系统的最新结果。 近3 年,主要地由彼得罗相教授以及经济学家杨荣基( d a v i dw ky e u n g ) 教 授在经济管理系统背景下建立并发展了随机微分对策中关于解的时间一致性理论, 他们近期所取得的结果是目前在该领域国际上最新的研究结果。 对于弱稳定问题最初是由高红伟教授在1 9 9 8 年提出( 文献) ,通过引入弱优超 和弱稳定集的概念,与稳定集理论相对照。本文主要讨论了弱稳定集的时间一致性 问题。 对具有贴现支付的珂一人微分对策动态稳定性问题最初是由s t r o t zr h 在1 9 7 5 年提出的( 文献 1 ) ,那里证明了甚至巴勒托最优解可能是动态不稳定的。原因在 于,在沿着最优轨迹的子对策中局中人的贴现支付本质地改变了子对策的结构并导 致所选择的最优准则动态不稳定。到目前为止,针对具有贴现支付的对策情形没有 调整最优准则的任何尝试进行。关注k a i t a l av ,m p o h j o l a 的工作( 文献 2 ) , 那里这个问题第一次被提了出来。这罩我们尝试利用1 3 1 节的方式建立强动态稳 定最优准则簇。我们将考察核心作为对策的最优准则,但是所有结果对于任何其他 视作最优准则的分配的子集都是有效的。 动态平稳研究的发展特别是在子对策一致一是李亚酱诺夫( a l y a p u n o v ) ,蓬 特里亚金( l s p o n t r y a g i n ) 及祖博夫( v z u b o v ) 等在这方面的杰出传统的延续。 最初研究合作微分对策的文献是 3 ,之后是论著 4 。同时,在 3 2 一 1 1 中描述了 微分对策的动态稳定性准则,并引入了具有重要意义的分配补偿程序的概念。在保 青岛人学硕+ 学佗论文 证解的动态稳定性的分配补偿程序取负值的情形给出了两种调整方法。积分的方法 首先在c 6 3 中给出,而微分的方法在文献 8 中。 保证解的动态稳定性并在此基础构建最优准则的新的特征函数的建立首次出现 在文献 9 中。具有不确定支付的合作微分对策在工作在 1 2 中首次得到研究,而具 有随机持续时间的对策在 1 3 中。在调整的基础上建立强纳什均衡首次发表在 1 4 】, e l o 中。 近年来其他一些关于微分对策合作理论及其应用的文献如 1 5 2 , 1 6 , 1 7 , 1 8 , 1 9 2 同样值得关注。 本文讨论动态对策中解的时间一致性问题,给出了关于时间一致性的基本概念: 特征函数型合作微分对策的定义,解的动态稳定性和强动态稳定性,终端支付以及 积分最优准则和微分强动态稳定的最优准则的概念。此外本文分别描述了具有贴现 支付的对策及两种特殊的对策:具有随机持续时间的微分对策和具不确定支付的合 作微分对策。分别给出了在给定最优准则的基础上建立动态稳定或强动态稳定的最 优准则的方法。 2 第一章关于时间一致性的基本概念 第一章关于时间一致性的基本概念 本章主要介绍了关于时间一致性的基本概念。包括特征函数型合作微分对策的 定义和动态稳定性准刚。强动态稳定性准则以及积分最优准则。 1 1 特征函数型合作微分对策的定义 考察初始状态为而持续间隔为t - t 。的疗一人微分对策r ( ,r f o ) 。运动方程 型如 i = f ( x , u l ,暂。) ,“,u fc c o m p r t , i = 1 ,月 l 一( 1 ) x p o ) = x o l 一( 2 ) 这里吼以是局中人,的控制参数。局中人f 的支付函数如下定义: r k ,( x o ,t - t o ;,) = n ( 并o ) ) 出+ 只( x ( z m 1 一( 3 ) 1 0 红 o ,月,o ) 0 , i = 1 ,玎 这里雄) 是在局势,“。) 之下由初始状态而开始所实现的轨迹。在合作微分对策 中我们仅考察局中人的控制策略u ,= u l ( f ) ,t 【f 0 ,刀,i = 1 ,栉。 考察合作型微分对策r ( x 。,t - t 。) 。这里如前所述假设局中人在对策开始之前协 商一致采取使得相应的轨迹工0 最大化和收益: m a x 杰足,( 嘞,r f o ;l ,) ;窆( ,7 一f o ;i ,甜:) = f ii i i :窆k o ) 弦:v ( n ;x o , t - t o ) ib 这里是对策r ( ,t t 。) 中全体局中入的集合称轨迹x ( f ) 为条件最优的。假设 v ;,t t o ) ,scn 是特征函数。由超可加性可知,局中人更倾向于形成最大联 盟而获得对策进程中有可能取得的最大的共同收益“ r ;,y - t o ) 。有时我们认为 3 青岛大学硕士学位论文 v ( s ;x o ,t t 。) ( s ) 的值等于联盟s 的可以保障得到的最大收益,并且不取决于其 他局中人的行为,甚至如果后者结成联盟、s 以对抗s 我们发现,支付函数k 。,i = 1 ,疗取正值使得特征函数取正值。由v 的超可加性 得知,对于任意的s ,s c n ,并且s c s 。有“s ;x o ,t t o ) v ( s ;x o ,t - t o ) ,即由 函数v 的对于s 的超可加性可以得到该函数对于s 的单调性。 称二元组( n ,v ( s ;x o ,t - t 。) ) 为特征函数型合作微分对策,这里是局中人 的集合,而v 是由式1 一( 2 ) 所定义的特征函数。为简单起见,我们记该对策为 l ( ,r h ) 。 针对对策l ( ,t 一“) ,我们把基本的经典合作理论进行描述。 定义1 1 1 向量善= ( 磊,磊) ,其分量满足条件: 1 ) 参v ( f ) ;粕,t - t o ) ,i e n , 2 ) 磊= v ( ;黾,t t o ) 。 称为对策r , ( x o ,t t 。) 的分配,记对策l ( x o ,t t 。) 的全体分配的集合为 e ( ,t - t o ) , 定义1 1 2不能被优超的分配的集合称为对策r , ( x o ,t - t o ) 的核心,记为 c ( ,r f o ) 定义1 1 3 集合,( x o ,t 一气) c e ,( x o ,t t 。) 称为对策r ,( 粕,t t o ) 的诺伊曼一摩 根斯坦因解( 稳定集) ,如果: 1 ) 如果孝,r l ( ,t t o ) ,且有f 二卜叩( f 不优超于,7 ) ; 2 ) 对于玎仨三,( x o ,t t o ) ,存在善,( x o ,t - t o ) ,使得掌卜孙 。 定义1 1 4沙甫利向量定义为 m ;( 而,r t o ) :! 竺二:! :笋二型【v ( s ;x o , t - t o ) 一v ( s 、f ;而,t 一岛) 】, s e n o e s ) io f = l ,疗 卜( 4 ) 第一章关于时间一致性的基本概念 1 2几种最优准则 1 2 1 动态稳定性准则 晟优行为概念的描述构成 一人对策理论中的一个基本问题。目前,针对各类对 锻建立了最优准则。我们注意到,满足给定最优准财的局中人的行为被称为在该最 优准则意义下的对策的解并且应该具备两个性质。一方面,它应当准确地反映考虑 到对策类别的特殊性的最优的概念。另一方面,它应当在它所应用的对策的条件下 得到满足。 在动态对策中自然地还有个要求需要补充:最优准则的意义和可行性必须在 整个对策进程中得到保持。这个要求被称为对策解的动态稳定性。 微分对策解的动态稳定性是这样一个性质:当对策沿着“最优”轨迹进行时, 在每一个时间瞬间局中人为同一个最优准则所支配,因而在对策中没有任何偏离最 初的“最优行为准贝1 j ”的机会。当动态稳定性不能得到满足时,在某些时简瞬问会 出现延续最初的行为不是最优的条件,因而最初选定的最优准则就不能被满足了。 假设在对策的开始时刻某个最优准则被选定并且在此基础上建立了解( 满足被 选定的最优准则的分配的集合有如核心、稳定集等等) 。由合作对策的定义得知,对 策的进程应该沿着保证局中人最大的和收益的轨迹进行。在对策进程中局中人进入 以当前状态为初始状态的子对策。在某个时间瞬间t ,当前对策的最初的最优解可能 不存在或者不能让局中人满意。那么,在时间瞬间t 局中人将不会坚持最初选定的轨 迹。这就是所选择的最优准则的动态不稳定性,而这也意味着整体上对策进程的动 态不稳定性, 现在我们将考察具有可转移支付的合作微分对策解的动态稳定性。 假设对策( ,r 一气) 中某个最优准则被选定。以所选定的最优准则为基础,在 初始点x ( t o ) = x 0 处建立的对策的解记为w ,( x o ,t t o ) 。集合彬( 而,t - t o ) 是对策 l ( 而,z 一“) 的分配集合e ( x o ,t - t o ) 的子集,我们假设氍( ,t - t o ) o 。 定义 l ,2 1系统 卜( 1 ) , 卜( 1 )的任意满足条件 j 0 何( ) ) = 。墨( i ( ) ) = v ( ;,t t o ) 的轨迹舅( ) 称为对策r ,( x o ,t t o ) 中的条件 最优轨迹。 由定义得知,沿着条件最优轨迹局中人获得最大的共同收益。为简单起见我们 假设这样的轨迹是存在的。在条件最优软迹不存在的情况下可以弓l 入f 一条件最优轨 迹并以占一精度进行必要的构建。 我们将考察沿着条件最优轨迹舅( f ) 集合形( 丁一屯) 的行为。在本节将认为,当 前的合作子对策r ,( 覃p ) ,t - t ) 按如下方式定义:记( ) 为集合s 的局中人的策略组 合,即蜘( ) = 辑0 ,i e s 。类似地可以定义堪( ) 。设( ) 【,r 】是在时间间隔【,t 】 内n 中局中入j 的程序控制q ( f ) ,r e t ,r 】的组合,而d ,i f r 】是所有这样组合的 5 青岛大学硕十学位论文 集合。在状态i o ) 我们定义特征函数: “s ;i ( f ) ,t f ) = 0 , s = 中 v a l f s ( r ) ,t r ) , scn 叭”m 地a xp ,川k n ( x ( t ) ,h ( ) 【,r 1 ) ,s = n 这里酶( i ( f ) ,( ) 【f 丁】) 是由开始i ( f ) 沿着条件最优轨迹状态局中人的剩余的共同 收益,即 ( ( ,) ,( ) 【f r 】) ;乏弘( i ( f ) ) 如+ e ( 可r ) ) 1 ; ,e ”l f j v a l f s 伍( r ) ,t - t ) 是在联盟s 和n s 进行的零和微分对策r s ( i ( ,) ,t f ) 的值,这个零 和微分对策以i o ) 为初始状态,持续间隔为t - t ,而运动方程型如j = ,( 工,u s ,“w ) 。 此时,局中人s 的( 最大) 收益可以看作是加入到联盟s 的局中人收益的总和, 而局中人、s 的收益等于一墨。注意到,在零和对策b ( 联f ) ,t - t ) 中值的存在是一 个重要的问题并且取决于所考察对策策略的类别( 详见文献 2 0 ,2 1 ) 当前子对策r ,( 虿( ,) ,丁一f ) 定义为( n ,v ( s ;i ( f ) ,t - t ) ) 对策r ,( - ( r ) ,t - t ) 中分 配的集合为: , 一 e c i 。x r 一。= 手r ”i 专v c t ,;,双,r 一,x ,= t ,胛;善毒= v c ;i c ,x r r ,) 这里 v ( ;i o ) ,7 一f ) = v ( n ;x o ,t - t o ) - 压琏( o ) ) d f 压 ( 取f ) ) 咖的值可以解释为当对策进程沿着轨迹i ( ) ,局中人在时间间隔【r o ,】上 l j e “ 的共同收益。 我们考察当前对策簇 r ,( i ( r ) ,r r ) :( ,“s ;双,) ,t - t ) ) ,f o f 丁 它们是沿着条件最优轨迹i ( ) ,而解眠( i ( f ) ,t f ) ce ( i ( f ) ,t f ) 是与最初选定的解 雕( 而,t r o ) 运用一样的最优准则所导致的 第一章关于时间一致性的基本概念 引理1 2 1 集合睨仃( 7 ) ,0 ) 是当前对策r 。( i ( r ) ,o ) 的解,并且由唯一的分配 日( 虱r ) ) = z ( 覃( r ) ) ,i = 1 ,刀) 所构成,这里局( i ( 7 ) ) 是沿着轨迹孑( ) 局中人岫q 支付 的终端部分。 证明由对策r 。( 双,) ,o ) ,有0 持续间隔,那么对于任意i , v ( 啦i 叮) ,o ) = e ( i ( r ) ) 。因而洲v ( 啦i ( r ) ,o ) = 。e ( i ( 丁) ) = v ( ;飘r ) ,o ) , 即对策f 。( _ ( 丁) ,o ) 的特征函数对于s 是可加的,因而 e 丽丁) ,o ) = 日( - ( r ) ) = 彬( i ( r ) ,0 ) 。 以下主要介绍关于解的动态稳定性的内容 设条件最优轨迹取) 使得w r y ( t ) ,f f ) o ,t o ? ,如果这个条件不成立,那 么局中人不可能遵循所选定的最优准则,因为在时刻,当矾( - ( ,) ,t t ) = 中时,他们 便没有可能坚持这个准则。假设在初始状态局中人协商同意分配 尹k ( x o ,t - t o ) ,这意味着,在状态局中人同意对收益进行分割的方式是( 在时 刻r 对策完成的时刻) 第i 个局中人的份额为等,即善。的第i 个分量。假设在时间间 隔【f 0 ,f 】上第f 个局中人的支付是专 ( f ) ) ,那么在剩余的时间间隔【, 丁】上相应于善。他 还应该得到收益研= 等一螽( i ( 们。为了使得最初的协议( 分配p ) 在时刻f 时仍然 有效,非常重要的是向量矿= ( 研,域) 属于集合矾( i ( f ) ,t - t ) ,即属于当前对策 r ,( 粥) ,r f ) 的解。如果这样的条件沿着轨迹i ( ,) 在每一个时阃瞬闯t t o ,r 】都满 足。那么分配尹被实现。这里包含了分配的动态稳定性的概念意义。 沿着轨迹亨( ) 在时间间隔【f r 】,t osr r 上联盟获得支付 v ( ;i , t - t ) 2 善( p ( i ( ) ) 出+ e ( i ( 丁) ) ) 这时,差距 v ( ;两,t - t o ) - v ( ;i ( f ) ,t - t ) = 侄囊( 一) ) 如 屯6 “ 7 青岛大学硕十学位论文 等于联盟在时间间隔k ,】上将获得的支付。第f 个局中人在这个收益中所占的份 额为 力( f ) :k ( r ) 窆曩( i ( r ) y f :一( i ( f ) ,) 这里屈( f ) 是在区间【,o ,t 】内的可积函数,满足条件 芝:屈( f ) = 1 ,属( ,) o ,t os f 丁( j = 1 ,h ) l 一( 5 ) 由卜( 5 ) 得知,d 万y , = 屈( r ) 萎n 魄( ( f ) ) ,这个值可以解释为局中人f 在时刻f 的瞬时支 付。因而向量( f ) = ( 属( ,) ,成( ,) ) 规定了共同收益在联盟的局中人之间的分割方 式。选择了向量( ,) 局中人就能够保障所期望的薪金,即调整局中人的收益分割使 得在每个时间瞬间,【f o ,r 】不会产生违反实现最初协议( 分配尹) 的愿望。 定义1 2 2 称尹彤( x o ,t - t o ) 为对策l 。,t - t o ) 中动态稳定的分配,如果满足下 列条件; 1 ) 存在条件最优轨迹以) 使得职( 膏o ) ,t - t ) o ,t o f t ; 2 ) 存在区间k ,t 】内的可积函数( f ) = ( 屈( f ) ,成( f ) ) ,使得对每个时刻f o f r , 有屈o ) o ,屈o ) = l 并且 f o n ,( 覃( ,) ,) o 形( i ( f ) ,t - t ) 】 l 一( 6 ) 缸s f s r 这里,( i ( f ) ,) = ( n ( i o ) ,) ,以( i ( ,) ,) ) 并且既( 孑( f ) ,t f ) 是当前对策 l ( 孑p ) t - t ) 的解。 式卜( 6 ) 中的和。的含义是:对于,7 掣和彳c 掣有,7 0 4 = 叩+ 口p 彳 。 具有可转移支付的合作微分对策l ( ,t t o ) 具有动态稳定的解形( ,t t o ) , 如果所有的分配善巩( x o ,t - t o ) 是动态稳定的。 8 一墨二兰茎王堕塑二塾堡箜董查塑垒 解。 条件最优轨迹被称为最优轨迹,如果沿着它存在对策l ( ,t t o ) 的动态稳定的 如果至少存在一个动态稳定的分配尹w a x 。,t 一,0 ) ,但是不是所有的集合 w a x o ,t r o ) 中的分配都具有这样的性质,那么我们可以讨论对策l ( ,t r o ) 的解 矾( x o ,t - t o ) 的部分动态稳定性。 由动态稳定性的定义,在时刻f = r 我们有尹艇_ ( ,) ,夕) o 形( i ( d ,o ) ,这里 畋( ( r ) o ) 是当前对策r ,仃( r ) ,o ) 的由唯一的分配,= ( 膏( r ) ) 组成的解,分配尹可 , 以表示成尹2 , ( n ,历+ 胃( i ( r ) ) 或者尹= p ( f ) 。,危( 覃( f ) v f + 日何仃”。动态稳 定的分配尹形瓴,t 一岛) 可以按下面的方式实现。由式卜( 6 ) 在任时刻f o s f r 我们有 芋。f ,( i ( f ) ,) o 睨( ( f ) ,t - t ) 】 卜( 7 ) 这里,( 虱f ) ,) = 弘( f ) n 囊( i ( r ) 矽r 是在时间间隔【,0 ,f 】上的支付向量。在这个时间区 缸 辟 间上局中人f 在支付中的份额是力( i ( f ) ,) = 弘t ( f ) n 红( i ( f ) 矽f 。当对策沿着最优轨 h ,。j 迹进行时,局中人在每个时问区间k ,f 】分割共同的收益讫红( - ( f ) 炒 t oj 。i p 一) ,( 覃o ) ,) 呒( i u ) ,t f ) 1 一( 8 ) 所以式卜( 8 ) 的包含关系成立。进而由式卜( 8 ) 得到使得尹= ,( i ( ,) ,刃+ 的向量 尹形( i ( f ) ,t - t ) 存在,即运用上述选择( f ) 的方法,局中人在剩余的对策进程中 应该得到的收益向量 f = 孝0g ( - i ( t ) ,所= 协( i ( f ) ) d f + 月( _ ( r ) ) i 属于集合孵( i ( f ) ,t - t ) 。几何上这意味着,向量厂( i ( f ) 历= ( i ( f ) ,d ,以( i ( f ) ) ) 9 青岛大学硕士学位论文 的变化受到条件 一( i ( f ) ,) = 侄吩( 飘f ) 沙 l e n t a l e 的限制,并且局中人保障集合,( i ( ,) ,) 0 既( i ( f ) ,t t ) 的这种构型,于是式卜( 7 ) 的所属关系成立。 一般来说,易见可能存在无数的满足条件卜( 7 ) 一卜( 8 ) 的向量( f ) 。但是对于 任意一个在每个时刻,0 f s t 满足条件卜( 7 ) 一卜( 8 ) 的向量p ( r ) 局中人受到分配 尹形( i ( ,) ,t t ) 的支配,即与在整个对策中一样的最优准则,因而没有理由违背 先前签订的协议。 我们做下面的补充假设: a ) 集合睨( i ( f ) ,t t ) 在豪斯道夫度量下连续地依赖于i ( r ) ,t ; b )向量吸( 牙( f ) ,t f ) 可以选择为t 的连续可微单调不增的函数; 我们将说明,通过选择( ,) ,我们总是能够在假设a ) ,b ) 在沿着条件最优轨迹 有睨( i ( f ) ,t f ) o 的条件之下保证分配善o 形( 而,t - t o ) 的动态稳定性。 我们选择r w , c 2 ( t ) ,t f ) 为t 的连续可微单调不增的函数,t o 0 ,i n ,并且由于d 击s o ,则有屈( f ) o 这样,如果沿着条件最优轨迹所有的当前对策有满足条件a ) ,b ) 的非空的解,则 初始对策l ( x o ,t - t o ) 有动态稳定的解。理论上,主要的河题在于研究赋予向量函数 夕秘) 的条件,使得能保障在各种类别的对策中特殊形式的解形( x o ,t t o ) 的动态稳定 性。 现在考察具终端支付的合作对策的新的强动态稳定性的概念和解的强动态稳定 性的定义。 下面我们给出关于篇的强动态稳定往的有关概念 当分配尹w , ( x o ,r f o ) 动态稳定时,由定义可知,对于f o s t 0 ,j = 1 ,栉 t o 像前面一样我们考察对策r ( ,t - t o ) 的合作形式。假设局中人在对策开始之前 协商采用局势( w ,) ,相应的轨迹最大化收益总和: m a ) 【k , ( x o ,t - t o ;u l ,) = k f ( x o ,t t o ;u ;,域) = :窆矗。工。,出:,。;,r 一:i 1 一1 1 这里是对策r ( ,t t o ) 中全体局中人的集合。称轨迹x ( f ) 为最优的。假设s c n 青岛大学硕七学位论文 目i i v ( $ ;x o ,t t o ) 是特征函数,c ( x o ,t f o ) 是核心。考察沿着x + ( f ) 而f 【f o ,r 】的子对 策簇r ( ,) t 一,) ,相应的核心c ( x ( f ) ,t r ) ( 假设它非空) 以及特征函数 v ( s ;x 。( ,) ,t 一,) 。核心c ( ,t f o ) 是强动态不稳定的,并且进一步,它在所有的重要 情况下甚至是动态不稳定的。但是运用特征函数v ( s ;x ( f ) t t ) 和核心 c ( x ( 嘎r r ) ,t t o ,r 】我们将建立新的特征函数和以此为基础的新的强动态稳定 的最优准则。 引入下面的函数: 可( s ;x o , t - t o 卜志临p ( ) ) 出+ v ( r ) ,卜f ) ) 西 卜q 2 这里s c 而x ( f ) 是式( 8 3 1 ) 中的最优轨迹,v ( s ;x ( ,) t - t ) ,t t o ,r 】是子对策 r f o ) ,r f ) 的特征函数。假设v ( s ;x ( f ) ,t f ) 在【f o ,r 】上可积。 当s = n 时有 卜伊击蓐p 呦州肚善弋吐 拈“ 2 i 一1 - - l f o - j i : v ( n ;x o , t - t o ) 国= v ( n ;x o , t - 岛) 由于沿着最优轨迹x ( f ) ,f 【f o ,r 】对于函数;x ( r ) ,t 一,) 满足贝尔曼最优准则 2 2 ,即 v ( n ;x o ,r - , o ) - - e ( r ) ) d f + v ( r ;x ( f ) ,r f ) ,f 【f 0 ,r 】 易见 矿( su 足;x o ,t 一岛) 矿( s ;而,t - t o ) + f ( s 2 ;x o ,t 一) l 一( 1 4 ) 对于墨n 岛= m ,墨c n ,最c - n 。由特征函数的超加性对于所有的f 【f 0 ,r 】有 叹s ;石( r ) ,t 一,) + v ( 是;x ( f ) ,t f ) v ( su s 2 ;x ( r ) ,t - t ) 1 一( 1 5 ) 式卜( 1 5 ) 两端同时加上 弘f p 彬r + n f ( r 嬲f jtsito|eslto 1 4 第一章关于时间一致性的基本概念 并且在k ,】上积分,我们得到式l 一( 1 4 ) 。 这样由式l _ ( 1 3 ) 和卜( 1 4 ) 得到可受而,t t o ) ,s c n 在对策r ( x o ,t t o ) 中是 特征函数现在对于子对策r u ( o ) ,t - o ) ,o t o ,r 】定义与取岛而,r 一岛) 类似的。 设 酏x ( 。) r 一。) = f 1f og r 、篇妒th ( r ) ) 咖+ v ( 附一舭 l 一( 1 6 ) 酩工c 回,丁一唧= f 量t 善弘t c 茸c 力,办+ v c 只,砸x r 一功巩s c - 一c , 由i - ( 1 6 ) 得到 酏x ( 。) ,r 一。) = 瓦t - o v ( 附( o ) ,r 一。) 1 一( 1 劝 注意到歹在子对策r ( x + ( ) ,t 一0 ) ,t o s 0 t 中不是通常意义上的特征函数,因为 可( ;x ( 嘞,t 一0 ) 不等于该子对策中所有局中人的最大和收益。 容易证明可( s ;x ( o ) ,t o ) ,o 1 0 ,t 】,s c 对于s 是超可加的函数。 设c ( ,t t o ) 和c ( x + ( r ) ,t - t ) 是对策r ( 粕,t - t o ) f ( x q ) ,t - t ) ,t t o ,t 】的 非空核心。设 手p ) = 点( ,) ,c a t ) , ,c a t ) ) c ( 工( ,) ,t - t ) , t t o ,t 】 是在每一个时刻,是子对策r + ( f ) ,t f ) 核心中的分配这样一个可积的选择。考察 争= 击船啪蝴 破 弘南船f ( 啪吲蝴 1 ( 1 9 ) i = l ,刀 设e ( 而,t t o ) 和e ( z ( o ) ,t - o ) 是如卜( 1 9 ) 对子对策r ( r ( d ,r f ) 核心中的所有可 能的可积选择善( f ) c ( x ( ,) ,r f ) ,t t
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业软件系统测试策略大纲
- 2025年粮油食品检验人员真题及参考答案详解【培优】
- 2025年社会医学社区卫生服务与疫情防控演练试卷答案及解析
- 年产饲料加工厂商业计划书及可行性分析
- 高效项目管理工具与实战技巧
- 2025年心胸外科心脏手术术后护理操作规范考核模拟试卷答案及解析
- 电商平台投诉处理流程及典型案例
- 机械制造基础知识模拟试卷及解析
- 2025年自考专业(小学教育)真题及答案【网校专用】
- 2025年医学信息化系统应用能力评估答案及解析
- 花城版音乐课时15-第12课 走近戏曲(一)观赏京剧学习念白-京剧丑角的念白《报灯名》-课件
- 12.2闭合电路欧姆定律(第一课时)(教学课件+课后练习)高二物理同步备课系列(人教版2019必修第三册)
- 生猪标准化规模养殖场建设项目实施方案
- 广东开心学英语三年级下册Unit3-My-room
- JJG 425-2003水准仪
- 自动驾驶汽车-课件
- 2023年安康市交通建设投资集团有限公司招聘笔试题库及答案解析
- 学生学习力评价量表
- 藏餐培训教学计划5篇
- 技术需求征集表
- 三年级上册美术课件-第1课 五星红旗我为你骄傲|辽海版
评论
0/150
提交评论