(基础数学专业论文)fudenbergmaskin无名氏定理与可行集的维数限制问题.pdf_第1页
(基础数学专业论文)fudenbergmaskin无名氏定理与可行集的维数限制问题.pdf_第2页
(基础数学专业论文)fudenbergmaskin无名氏定理与可行集的维数限制问题.pdf_第3页
(基础数学专业论文)fudenbergmaskin无名氏定理与可行集的维数限制问题.pdf_第4页
(基础数学专业论文)fudenbergmaskin无名氏定理与可行集的维数限制问题.pdf_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 关于无名氏定理,这个在经济学中非常重要的定理。我们常见的结论有四种:较为 原始的无名氏定理,较弱的f r i e d m a n 无名氏定理,a u m a n 无名氏定理及f u d e n b e r g 无名 氏定理。在中国有些经济学家也对其进行了一系列的阐述,比如说北大的平新乔先生。 但是这些无名氏定理中的阐述中都有许多让人觉得混乱的地方,尤其是针对f u d e n b e r g 无名氏定理中可行集维数的限定条件,“可行收益集v 等于参与人的个数 ,存在许多值 得商榷的地方。在本文中我们将着重针对这个问题进行一系列的分析。 本文我们重点通过几个方面去分析对于可行集维数是n 维的这个限定条件的非充 分和非必要性。针对必要性。本文主要是从以下几个方面去研究:1 要求v 。是属于v 的, r ,、 这个条件需要么? 通过构造数学模型,本文将通过给出例子,来说明这个问题。2 ,vv ,即 中的 的一致性是必要的么? 通过对这个方面的分析,本文对f u d e n b e r g 无名氏定理的 条件进行改进,给出一个相对较弱的条件来。3 ,关于f u d e n b e r g 定理中矿的中心地位是 必要的么? 这个问题的解决,我们可以充分的减弱原定理中关于维数条件的限定,给出 体统的表达形式,和改进的新的无名氏定理来。 针对充分性,也将要通过两个方面进行分析,首先本文阐明了针对无名氏定理只探 讨纯策略可行性收益集,而不去探讨混合策略收益集的一些原因,并给出具体的实例来 说明原f u d e n b e r g 无名氏定理维数条件的非充分性。同时,本文也针对原定理的其他方 面提出了几个值得读者思考的问题,这也是原定理中有所纰漏的地方。 关键词:无名氏定理;无穷重复博弈;可行性收益;子博弈完美均衡;最小最大收益组合 f o l kt h e o r e mo ff u d e n b e r y - m a s k i na n dd i m e n s i o no ft h ef e a s i b l es e t r e s t r i c t i o n s a b s tr a c t t h ef o l kt h e o r e mo nt h i si nav e r yi m p o r t a n tt h e o r e m si ne c o n o m i c s t h em o s tc o m m o n f i n d i n g sa r ef o u r :t h em o r ep r i m i t i v ef o l k t h e o r e m ,w e a kf r i e d m a nf o l k t h e o r e m ,a u m a nf o i l k t h e o r e ma n df u d e n b e r gt h e o r e m s o m ee c o n o m i s t si nc h i n ah a v ec a r r i e do u tas e r i e so f e l a b o r a t ef o re x a m p l e m r p i n go fb e i j i n gu n i v e r s i t y b u tt h e s et h e o r e m si nt h ed e s c r i p t i o n o ff o l kh a v em a n yp e o p l ef e e lc o n f u s e di np l a c e s ,e s p e c i a l l yf o rt h ef o l kt h e o r e mo f f u d e n b e r gd i m e n s i o no ft h ef e a s i b l es e tq u a l i f i c a t i o n s ,”f e a s i b l es e tv i se q u a lt oy i e l dt h e n u m b e ro fp a r t i c i p a n t s ,”t h e r ea r em a n yd e b a t a b l e p l a c e i nt h i sa r t i c l ew ew i l lf o c u so nas e r i e s f o rt h ea n a l y s i so ft h i si s s u e t h r o u g ht h i sp a p e r , w ef o c u so ns e v e r a la r e a st oa n a l y z e t h ed i m e n s i o no ft h ef e a s i b l es e ti s l i m i t e dt ot h ec o n d i t i o n so ft h i sn d i m e n s i o n a ln o n f u ua n dn o n e s s e n t i a l f o rt h en e e d t l l i s a r t i c l ei st os t u d yt h ef o l l o w i n ga s p e c t s :1 ,t h e y i sb e l o n gt ovi sn e c e s s a r y ? ,t h i sc o n d i t i o n r e q u i r e sw h y ? b yc o n s t r u c t i n gam a t h e m a t i c a lm o d e l ,t h i sp a p e rw i l lg i v ee x a m p l e st o i l l u s t r a t et h ep r o b l 锄2 ,t h ec o n s i s 缸c yo f e i nt h e v 。l j ,剐i sn e c e s s a r y ? t h r o u g ht h ea n a l y s i s o ft h i sa s p e c t ,t h ep a p e rf u d e n b e r gf o l kt h e o r e mt oi m p r o v et h ec o n d i t i o n so ft h e o r e m ,g i v e n a r e l a t i v e l yw e a kc o n d i t i o n s 3 ,t h ec e n t r a lo fv 。i nt h et h e o r e mo ff u d e n b e r gr e q u i r e d 、h a ti s t h es t a t u s ? s o l u t i o no ft h i sp r o b l e m w ec a nw e a k e nt h eo r i g i n a lt h e o r e mo fs u 伍c i e n t d i m e n s i o nc o n d i t i o n so nt h el i m i t , g i v e sa ne x p r e s s i o no fd e c e n c y , a n di m p r o v e dn e wf o l k t h e o r e m i nv i e wo fs u f f i c i e n c yw ec a r r yo nt h ea n a l y s i st h r o u g ht w oa s p e c t sf i r s t ,t h i ss t u d y i l l u s t r a t e st h e o r e mf o rt h ef 0 1 kp u r es t r a t e g yt oc o n c e n t r a t eo nt h ef e a s i b i l i t yo fr e v e n u e c o l l e c t i o n ,c h o o s en o tt oe x p l o r et h es e to fm i x e ds t r a t e g i e sy i e l dan u m b e ro fr e a s o n s ,a n d g i v es p e c i f i ce x a m p l e st oi l l u s t r a t et h eo r i g i n a lt h e o r e mo ff u d e n b e r ga n o n y m o u sd i m e n s i o n o fn o ts u 伍c i e n tc o n d i t i o n s a tt h es a m et i m e 。t h i st h e o r e mf o ro t h e ra s p e c t so ft h eo r i g i n a l p r o p o s a lo f af e ww o r t h yo fr e a d e r st op o n d e rt h eq u e s t i o n ,w h i c hi ss o m e w h mf l a w e di nt h e o r i g i n a lt h e o r e mo f t h ep l a c e k e yw o r d s :f o l kt h e o r e m ;i n f i n i t e l yr e p e a t e dg a m e s ;t h ef e a s i b i l i t yo fi n c o m e ;s u b g a m e p e r f e c te q u i l i b r i u m ;m i n i m u mm a x i m u mb e n e f i tf r o mc o m b i n a t i o n ,i 目录 摘要。1 a b s t r a c t 1 弓l言1 1 符号与预备知识2 2 关于无名氏定理的一些结论5 3 平新乔关于无名氏定理的陈述8 4 可行收益集维数限制的意义1 0 5 关于维数条件的必要性分析1 3 5 1 可行收益集的构造问题1 3 5 2 饱和维数条件的非必要性1 4 5 2 1 零维收益集的构造1 5 5 2 2 占一致性的非必要性15 5 2 3v 。核心地位的非必要性1 6 5 2 4 f m 的改进无名氏定理。1 6 6 关于饱和维数条件的充分性1 8 6 1 混合策略的收益期望与惩罚策略的可行性1 8 6 2 纯策略博弈的饱和维数条件1 9 参考文献21 致谢。2 2 辽宁师范大学硕士研究生学位论文 引言 最初的无名氏定理又称为“纳什无名氏定理”( n a s hf o l kt h e o r e m ) ,之所以称 为“无名氏定理 ,是因为它在5 0 年代就为博弈论专家所共知的,但无人发表过。 这个定理不是子博弈完美均衡的,因为这里的惩罚可能伤及实施惩罚行动的人,于 是弗里德曼( f r i e d m a n ,1 9 7 1 ) 给出了被称为“纳什威胁”无名氏定理。但这个定理 要求存在静态的纳什均衡。可是要求可行收益集中存在静态均衡条件使定理适应范 围大大缩小。于是a u m a n n s h a p l e y 在1 9 7 6 年提出了在用“时间平均”标准评估阶 段的收益序列下的无名氏定理。但是这个结果有问题。受未来各期的利益毫无折损 的完全等同于现实利益似乎不合情理,而且从数学角度上讲,无贴现因子,无限期 的博弈的收益是无法比较的,可能都是无穷大。r u b i n s t e i n ( 1 9 7 9 a ) 对a u m a n n 的证 明提出了批评,认为在超越标准下,他说给出的策略不是子博弈完美的,并提出了 “指数累计的惩罚周期 策略。但是f u d e n b e r g 等人觉得他所提出的策略不是个人 理性的,因为太长的指数周期可能带来得不偿失的后果。1 9 8 6 年,f u d e n b e r g 和 m a s k i n 考虑了另一种策略,不是当参与人不实施最小最大策略的时候“惩罚”他们, 而是在他们实施以后给予“奖励”。但是在f u d e n b e r g 所给出的定理中,要求可行收 益集的维数要等于参与人的维数。我国的一些经济学校也对无名氏定理有所研究, 比如平新乔先生,但是其中关于维数的问题都有些混乱,在本文中,我们着重讨论 可行收益集的维数问题,针对这个维数的限定有必要性么? 有充分性么? 可不可以 抛开维数不谈,而给出比较弱条件的无名氏定理来。本文对定理中的维数问题给了 一定的解决方案,扩展了无名氏定理的结论,把经济学与比较高等的数学结合起来, 对研究无名氏定理提供了一些见解,并且也提出了几个值得思考的问题,对深入理 解无名氏定理有所帮助。 1 符号与预备知识 为了使读者能更清楚的去理解本文的内容,下面先对本文所涉及到的符号及预备知 识详细的介绍一下: 定义1 1 1 1 i 参与人:在本文中,我们一般用i - 1 ,2 n ,来表示参与人。 定义1 2 1 1 1 行动:行动是参与人在博弈中某一刻的决策,用a i 来表示第i 个人的行 动,舢表示出了第i 个人之外其他人的行动。a ,= k 表示供第i 个人可选择的所有行 动组合。 a = 口1 ,a :a 。 表示1 1 个参与人的行动集,也叫行动组合。 定义1 3 1 3 1 子博弈:扩展式博弈t 的一个子博弈g 是由t 中的一个结点和其所有后 续结点组成的,它具有性质:若x g ,和h ( x ) ,则,g ,也就是说在子博弈中 工和工。x 和工”在原博弈中处于同一个信息集,以及子博弈的收益函数正是原来收益函数 在子博弈终点结上的限制。 定义1 4 【2 i :子博弈完美均衡:扩展事博弈中的行动策略组合盯是一个子博弈完美均 衡,如果对每一个适当子博弈g ,仃在g 上的限制是g 的一个纳什均衡。 定义1 5 1 4 】可理性化:这个概念是由伯恩翰姆( b e r n h e i m ,1 9 8 4 ) 和皮尔斯( p e a r c e ,1 9 8 4 ) 独自引入的,奥曼( a u m a n n ,1 9 8 7 ) 和布兰登伯格以及戴克尔( b r a n d e n b e r g e r a n d d e k e l ,1 9 8 7 ) 在他们关于“贝叶斯方法 策略选择的论文中加以采用。集合:兰,对 于每个i 递归定义: ,r, ,、 ? = 4 川j 矿,篓( 7 1 的凸壳) 使得对4 ? - 1 有吩( 嗔,屯) u i ( 色屯) 参与人 l j “ j i 的可理性化策略是r ;= n 乙艺? 简言之,主,1 是参与人i 的对手在第( n - 1 ) 论遗留下来 的策略,而? 是参与人i 对,1 某种策略的最优有而遗留下来的策略。 定义1 6 【3 l 冷酷策略( g r i ms t r a t e g i e s ) 又称“触发战略 ( t r i g g e rs t r a t e g i e s ) :因 为任何参与人的一次性不合作将触发永远的不合作。 定义1 7 1 3 i 针锋相对策略:参与人开始选择抵赖,在t 阶段选择对手在t - 1 阶段的选 择。 定义1 8 t 3 i 公共随机化假设:参与人可以根据某个共同观测到的信号选择性的,譬 如掷一颗骰子,通过看它呈现的结果( 点数,或单点数,或双点数) 确定局中人的行动。 2 辽宁师范大学硕士研究生学位论文 定义1 9 1 1 1 :无限次重复博弈:我们称被重复进行的博弈为阶段博弈,令g 为一个n 人的阶段博弈,阶段博弈的收益用舀表示,g ,神为以g 为阶段博弈的无限次重复博 弈。 定义1 1 0 2 i :贴现因子:贴现因子代表对时间的偏好程度,用万表示:这个解释相 当于艿= p ,r 是对时间的偏好率,是一期的长度。 定义1 1 1 1 1 1 后继收益:无限重复博弈每一期都有一个适当子博弈开始进行,对于任 何策略组合神历史h ,我们就能计算参与人从t 期开始的期望收益,称之为“后继收 益”,为( 1 万压万“g 如7 功。 r = t 定义1 1 2 【l j 时间平均标准:即参与人“完全有耐心”的情形,参与人既不关心收益 时间,也不关心在任何有限的时期内的收益。 定义1 7 1 2 i 最小最大收益组合:最小最大收益组合是当其他参与人试图给参与人i 最大惩罚的死后,参与人i 能保证自己得到的最大收益我们用v 来表示最小最大收益 r h 。m l n im a x g i ( a i ,口一f ) 1 d l q i j 当参与人i 获得v ,时,f 的对手的策略我们用肌二表示,即 = g ,( 硝,所) 定义1 1 3 1 1 可行性收益集v = “,屹) 称为一个可行收益向量,如果它是阶段博弈 g 的纯战略收益的凸组合。所有的可行收益向量构成可行收益集v v = v 3 a 彳,g ( 口) = 1 ,却凸包 定义1 1 3 1 5 1 个人理性收益;大于最小最大收益的收益我们称为理性收益,这个概念 所要表达的含义是:如果要一个参与人在无线次重复博弈中有任何兴趣“合作”的话, 他从“合作 中得到的收益不应该小于他的最小最大收益,记 y = 训u u 记v o = v a v 为个人理性的可行性收益集。 定义1 1 4 1 6 j 大数定律:许多实验结果表明,虽然一次随机试验中某确定事件发生与 否不能预言,但是如果在相同条件下大量重复这个试验,则此事件发生的频率会稳定在 某个值附近,大小是客观存在的,可以用上述频率的稳定值来度量,这就是事件的概率。 频率的稳定性呈现在大量重复试验中,历史上把这个试验次数很大时出现的规律称为大 数定律。 , 定义1 1 5 1 7 1 帕累托有效:如果不存在其他任何可行的经济配置 ( 爿,x ;石;y 0 瑶乃) 满足: ( 1 ) ( ) “t ( 五) ,对于所有的i :l ,2 i 都成立。 ( 2 ) ( 爿) “,k ) 对于某些i 成立。 , 则称可行的经济配置( 墨,x ;z ,f ,f 以力) 是帕累托有效的。 定义1 1 6 1 8 1 稠密:设a ,b 是拓扑空间x 中的子集,如果亘3 a ,那么我们就称b 在 a 中是稠密的。 定理1 1 1 1 角古不动点定理( k a k u t a n i ) 设z 是n 维实空间r n 中的一个有界闭凸集, 对于每一个x z ,设f ( x ) 是z 中一个非空凸子集,假如“图 & ,y :y f ( x ) ) 是闭的,则存在z z ,使得z 。f ( 工) 4 辽宁师范大学硕士研究生学位论文 2 关于无名氏定理的一个些结论 无名氏定理的结论是不唯一的,它有几个不同层次的变形,其中都不仅涉及到博弈 论方面的知识,也涉及到了很多的数学知识,下面我们来详细的给出四种无名氏定理的 结论: 定理2 1 1 2 l :对于每个满足条件“ 对所有参与人i 成立。的收益向量v ,存 在互 1 ,使得所有6 1 府在纳什均衡g ( ,有收益v 这个定理直观上理解就是如果参与人足够有耐心的话,任何一期的背叛得到的收 益,一定会小于未来每一期收益损失的和。 证明:假设存在一个纯行动组合a ,使得g ( a ) - - v ,对于每个参与人i ,如果满足这样两 个条件之一 ( 1 ) ,前一期的行动是a , ( 2 ) 前一期实现的行动组合和a 有两个或更多的分量不同, 就继续选择a i ,如果某期只有参与人i 没有遵守组合a ,那么以后博弈中参与人j 就 选择m :。记= m a x g ; ) ,表示参与人i 一次性背叛获得的最大收益。 这样如果参与人i 在第t 时期背叛,他至多可以得到 ( h + 以+ + 6 卜1 _ ) + 万砭+ ( 万+ 1 哆+ 万h 2 h + ) = 蔷u 砭“兰击 ( 1 ) 如果他不背叛,总收益为+ 6 v i + 万2 m + 2 i l _ 坼( 2 ) 想要( 1 ) 的结果小于( 2 ) 的结果,则 v i 一万( 巧- - v i ) a 存在一个完美的子博弈均衡g ( ,得到收益v a l l 无名氏定理是在说:在无限次重复博弈中,如果参与人有足够的耐心( 即万足够大) , 那么任何一个个人理性的可行性收益集都是可以实现的。 证明:假设存在一个五,满足g ( 五) = v ,在时期0 每个参与人i 选择a ,只要以前时期 实现的行动总是a ,参与人i 就继续选择五,如果至少有一个参与人不选择a ,那么 每个参与人i 在剩下的博弈中选择a ,木。 若参与人i 不背叛,那么每期收益为v i 。总收益为 如果参与人i 背叛,在背叛时的收益为谚,后每期收益为e i ,则总收益为 。 6 u + 而e i 。 要满足亡 砭+ 击q 即u ( 1 一万溉+ 如 上式在万 ”的1 ,v ,存在一个收益为v 的完美子 博弈均衡。 证明:考虑如下策略:“从合作状态开始,在该状态下,选择一个有收益v 的公共 随机化p ,且若没有背离,就一直保持这个状态不变,如果参与人i 背离,则在以后n 期选择最小最大策略m = ( m ,i ,l ! ,) ,所选的n 满足 m a x g f ( 口) + n v i v ,的v v ,存在一个贴现因子万 e ,而不仅仅是v ,这个加强的条件,使得 实施惩罚行动的人可以不付出太多的成本。 但是,要求可行收益集中存在静态均衡的条件使定理适应范围大大缩小。于是又有 人提出在用“时间一平均”标准评估阶段博弈的收益序列下的无名氏定理,【1 7 】【1 8 这便是 a u m a n n s h a p l e y 在1 9 7 6 年提出的一个结果,但是这个结果有两个问题。 第一,受未来各期的利益毫无折损的完全等同于现实利益似乎不合情理,而且从数 学上讲,若无贴现因子,无限期的博弈的收益是无法比较的,可能都是无穷大。 第二,r u b i n s t e i n ( 1 9 7 9 a ) 对a u m a n n 等人的证明提出批评,认为在超越标准下,上 面的策略不是子博弈完美的。并提出“指数累计的惩罚周期”策略。但是,r u b i n s t e i n 所提出的策略在f u d e n b e r g 等人看来也是可以不是个人理性的,因为太长的指数周期可 能带来得不偿失的后果。分析上面歌后果的问题,除了弗里德曼的条件较强而使用范围 太小之外,其他的几种情况都涉及了对“实施惩罚行为 者的补偿问题,或者更准确的 方法是对那些“不实施惩罚行动 的参与人是否也有恰当的惩罚措施。 下面更具体地证明这里的关键问题: 在几个参与人采取合作的过程中有一个人可以从一次背离( 合作行为) 获得更多的 一次性收益,如果没有后继的惩罚,那么“合作”行为不是“纳什均衡”的策略,但是 实施惩罚,对背离者实施“最小最大”惩罚策略,那么对于参与实施惩罚的参与人来说 是否合适呢? 如果有某个参与惩罚的人认为自己在惩罚别人的时候损失太大,他便可能 背离“惩罚约定的行为 。尤其是在他得不到附加的惩罚的情况下,这几乎是必然要发 生的。因此从子博弈的角度讲,“惩罚阶段”每个参与人都参与惩罚并不是“纳什均衡 的。 所以,要得到“子博弈完美均衡”策略,就必须考虑对背离惩罚行为的参与者实施 惩罚。使每个参与人不愿背离合作行为的原因在于当需要惩罚背离者时,没有人愿意背 离“惩罚行动 。因为背离“惩罚行为 的人所受到的惩罚会使其“得不偿失 。 1 0 辽宁师范大学硕士研究生学位论文 那么可行收益集的维数要求( 维数与参与人数相同) 在这里又存在什么意义呢? 按 照f u d e n b e r g ( m a s k i n1 9 8 6 a ) 给出的证明这个条件是为了保证在可行收益集中能够找到一 个收益向量,这个收益向量可以起到两个作用 ( 1 ) 对每个在参与惩罚行为中遵守合作的人给予这个的奖励,使其可以补偿在惩 罚背离者的行为中所遭受的损失。 ( 2 ) 对最初背离合作的参与人没有后期补偿,依然保持一定程度的惩罚。【1 9 】 为了更为具体的分析,下面将f u d c n b e r g m a s k i n 无名氏定理中的主要证明思路如 下: 仅讨论纯行动组合a ,使g ( a ) - - v 记m 二满i f :v , = m 举g ( 口,m 二) u ,u 是参与人i 的最小 最大收益,选定1 ,7 , ! ,7 ! ,v i ,j 占 o ,3 v 7 k ,v 【1 ,7 g ,占) v ( a 其中,k ,v - - w r n f y 。 w v ) v ,= :,v :l v ( f ,) = :+ 占,吐。+ 占,v ;,v 0 。+ 占,y :+ 占) 注:虽然f - m 定理的证明中也要提到要求v 7 v ,但就证明的定理过程而言,只要 ,7 ( f 占) v 就可以了,v 7 本身是否属于v 并不重要 1 4 辽宁师范大学硕士研究生学位论文 为了满足这一要求,其实并不需要纯策略收益组合集的维数是饱和的下面从三个角 度讨论这个问题 5 2 1 零维收益集的构造 取定一个序列 w 。k ,v 睛足如下条件,w m ( 1 6 ) m a x g f ( 口) + 万( 1 一万y f + 万“一,。 可是注意到,1 ,7 中的各个分量并不要求一致,即当i j 时,v ;v :是允许的,那么 s 的确也没有必要对每个参与人是一致的,换句话说,对不同的参与人可以有不同的奖 励( 或惩罚) 。这样一来,前面的条件( a ) 便可以减弱为如下形式: v v v , v i 冀羔焉帮o v l 托吒二钆州沁小b , - 7 ( f ;占l ,占2 ,s f l ,占“l s n ) = - :+ 占l ,i + 占f 一1 ,v f ,1 ,0 l + s i + l ,v :+ s n ) 矿) 。7 例:满足条件( b ) 的集合可以是零维的,比如一个w 维凸集 v i v ! ) 中的所有有理坐 标点所组成的集合加入! 之后组成的v ,便满足条件( b ) ,不难看看出,当可行收益 集v 满足条件( b ) 时,只须作对应符号的修改,f m 定理的证明可以完全照搬下来。 虽然例5 2 2 例子中的v 不是零维的,但其闭包却是n 维的,从逻辑上讲,条件( b ) 更弱于条件( a ) ,而条件( a ) 更弱于饱和条件维数,所以并非不能构造出满足条件 ( b ) 且可行收益集v 的维数也同样满足较弱条件的模型来。其构造方法与6 1 2 1 中类 似,只是叙述稍烦,故略去。 5 2 3 v 。核心地位的非必要性 进一步分析可以看出,虽然1 ,7 中各分量不同,而占 0 的选择也可以不同,那么在 f m 定理证明中的,7 的“核心 地位也不是必要的。由于占的选择仅仅是为了对合作背 叛者的惩罚,而且当贴现因子充分大时,任何事先确定的大于0 的收益都可以起到惩罚 的作用。那么从逻辑上讲,f m 定理证明所需条件还可以弱化为如下形式: 若v ! ,v i ,j w 2 ,“2 矿,w 1 “2 ( c ) 0 “ ! ) 孵= “i ) 八j 专弓 “j ) 现设v 是纯策略的可行收益组合集,如果接受f m 定理的证明方法,可以得到如 下的结论 5 2 4f - m 定理的改进无名氏定理 f m 定理的改进无名氏定理:设纯策略可行收益集v 是满足条件( c ) ,那么对任 意v y , 旦,存在查 1 ,使得当贴现因子万b 1 时,存在一个完美子博弈均衡g ( 万) 的收益为v 证明:仍设存在纯策略行动组合a ,使得g ( a ) 孔记埘二满足兰2 m 驰a xg 0 r 聊二) b 选定 v v “i “;。 并存在纯行动组合d 6 ) ,使得g 白6 ) ) = w 确定充分大的自然数娜口占,使得 i t l 4 a xg ,0 ) 呼g t 0 ) + 二扩一兰) 行动组合如下:状态i :选择a ,使得g ( a ) - - - v 状态i i :如果第i 个人背叛,就对第i 个人实行n 期的最大最小惩罚; 状态i i i :选择a ( i ) ,使得g ( a ( i ) ) = ,对除了第i 个参与人之外的参与人进行补偿。 1 6 辽宁师范大学硕士研究生学位论文 其中,如果在某一状态有参与人j 背叛,则立刻转让状态u ,依此下去。这个策略 组合是满足子博弈完美均衡要求的。 在此定理的中,我们无需再去限定可行性收益集维数的相关问题,就避免了原 f u d e n b e r g 定理中出现的问题。我们不再关心可行收益集的维数到底是多少,只要保证 其可行性收益集是稠密的就可以了。举个例子,比如由有理点集组成的收益集,就是满 足条件c 的,但是它是零维的。这样我们也对原平新乔先生的无名氏定理中的那个n 维解释清楚了。 条件( c ) 显然更弱于条件( b ) ,因此可行收益集的维数要求也同样不高,结果 显然,不予阐述。 1 7 6 关于饱和维数条件的充分性 在讨论饱和维数条件在f m 定理中是否具有充分性之前,有必要进一步阐明我们专 注于纯策略可行收益集的理由。 6 1 混合策略的收益期望与惩罚策略的可行性 纯策略博弈在理论上的一个缺陷在于不一定存在纳什均衡,为了弥补这一缺陷,人 们考虑了所谓的混合策略的纳什均衡,利用所谓的角古不动点定理,得到了满足较一般 条件的混合策略博弈存在着纳什均衡,也正是这个均衡的存在,使博弈论从数学角度看 较为完整了。于是人们在讨论无名氏定理时也会考虑混合策略的收益集,尤其是f m 定 理,基本不考虑均衡问题,直接利用纯策略收益集的凸包作为分析的基础。 但是这里存在一个问题,混合策略组合所得到的可行收益集在线是中是很难观察到 的,因此这时的所谓收益向量只能是随机向量的期望,正如标准正态分布的期望虽然是 0 ,但是0 出现的概率却为o 由于不存在人们共知的分布函数,当一个人在博弈过程中 选用混合策略时,其他的参与人是无法知道其混合策略的分布函数的,按照统计学的方 法,人们可以统计其各种纯策略的出现次数,并以此判断其混合策略,但这便出现一个 问题,需要多长时段的观察呢? 我们知道,以统计学方法确定概率分布,是依所谓计数 定律作为依据的,但大数定律的论证也只是说频数依概率( 测度) 收敛于概率( 假设存在) 。 假如纯策略( 行动) 集a ;的基数较大,譬如说产量竞争,那么观测周期也要是较 长,否则无法作出合理判断,而且,即便有足够长的观察时期,所得判断也不见得正确 合理。 由于无名氏定理中涉及的确定的惩罚策略和惩罚周期问题,所以采用随机自主的方 式来寻找惩罚策略和惩罚周期几乎是没有任何现实可行性的。 笔者设想解决这个问题的一个参考方法:在每一阶段博弈的一定时段( 可包含多个 阶段博弈) 之前,用随机方法( 比如依每个参与人所应遵循的混合策略分布) 确定该时 段( 各阶段) 的具体产量,要求每个参与人严格按照已( 随机方法) 规定的行动参加博 弈过程,这样做的好处是不必进行事后的长期观测和判断,但是这样一来,混合策略的 博弈便转化为“纯策略”的合作博弈了,虽然从纯理论的角度,可行性收益集中的值可 以看作是随机向量的期望,但是现实中却是纯策略收益向量。 但是这依然存在诸多问题,由随机方法确定的产量不见得是帕累托有效的,因此有 可能出现某参与人在不损害其他人甚至有利于其他人的情况下违背事先的约定。按照西 方经济学的理性人假设,这种背叛将不会引起其他人的反抗。尤其当其他人因这个人的 辽宁师范大学硕士研究生学位论文 背叛而受益时,背叛是受欢迎的,于是用随机方法事先的确定行为组合充分可能被众参 与人一起进行调整,于是混合策略的随机性将完全被破坏,用纯数学推导出来的混合策 略惩罚措施也将变得模糊不清,因为收益函数中的向量将无法确定。 正是存在上述诸多问题,再注意看f m 的证明也是以纯策略收益为主要讨论对象 的,笔者对f m 定理的讨论也是将专注于纯策略博弈及其可行收益集。 6 2 纯策略博弈的饱和维数条件 按 1 中的定义方式,可行收益集必然是凸的连续集,因为其定义方式本身就是利用 凸包构造的,但若仅考虑纯策略组合的可行收益集( 以下记为v ) ,就不一定是凸连续 的了。 例:考虑一个双头策略式阶段博弈,其纯策略可行收益集( 见图式) 切 2 21 lj - 一 、 0 1 弓 - 1 图6 1 v = - 1 ,0 x - 2 ,o o o ,o ) ,( 2 ,1 ) ,( 0 5 ,2 ) ,( 1 ,0 5 ) ) 易知d i m v = n 设v l = - 2 ,v 2 = - 1 一一 不难验证,这个可行收益集v 是满足条件( a ) 的 现在取v = ( 0 ,0 ) ,这是双方合作的最好结果,但是这不是纳什均衡,无论是参与人1 还是参与人2 都有背叛的可能,注意的是双方的地位并不对称,如果参与人2 背叛,使 收益向量为( - 0 5 ,2 ) ,他会惧怕参与人1 的惩罚么? 尤其是运用“最小最大策略”的 惩罚可行么? 实行这个惩罚,惩罚者比被惩罚者的损失更大,考虑到双方都是理性人, 这样的“惩罚实施”将成为“不可置信的威胁”。 适当的设计,可以使任何一方的惩罚都可能不是理性的,如此一来,不仅仅是单阶 段博弈不存在纳什均衡,即使是无穷重复也找不到相应的完美子博弈纳什均衡。 1 9 实际上,即使v 是凸的,也同样存在类似的问题,这是因为单阶段博弈没有纳什均 衡的原因,实施惩罚的参与人都可能令因为个人损失太大而自由选取使自己损失较小的 策略,而不是以“不可置信的威胁”达到“恐怖均衡。这便提出了一些值得进一步讨 论的问题: 1 ) 对应于状态i ,中的行动组合的) ,其收益向量具有惩罚作用么? 2 ) a o ) 的实施是理性化的么? 由什么保证理性人愿意对背离a o ) 的参与人实施最小 最大收益的惩罚? 3 ) 参与人个数与所给的策略组合存在何种关系? 那么对此无名氏定理感兴趣的读者不妨试着去解答上面的问题,在这里本文就不做 过多的阐述。 辽宁师范大学硕士研究生学位论文 参考文献 【1 施锡铨博弈论上海财经大学出版社2 0 0 0 年,8 【2 朱弗登博格,让梯若尔博弈论中国人民大学出版社2 0 0 2 年,8 3 ,4 3 ,1 3 3 1 3 9 3 s p e n c e , a m e n t r y c a p a c i t y i n v e s t m e n ta n do l i g o p o l i s t i cp r i c i n g b e l lj o u r n a lo f e c o n o m i c s 1 9 7 7 8 :5 3 4 5 4 4 【4 i f a n ,k f i x d ep o i n ta n dm i n i m a xt h e o r e m si nl o c a l l yc o n v e xt o p o l o g i c a ll i n e a rs p a c e s p r o c e e d i n g so f n 撕o n a la c a d e m yo fs c i e n c e s1 9 5 2 3 8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论