(数量经济学专业论文)博弈模型中的信息传递.pdf_第1页
(数量经济学专业论文)博弈模型中的信息传递.pdf_第2页
(数量经济学专业论文)博弈模型中的信息传递.pdf_第3页
(数量经济学专业论文)博弈模型中的信息传递.pdf_第4页
(数量经济学专业论文)博弈模型中的信息传递.pdf_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 本文就博弈论模型中的信息传递模式展开讨论,分析了 三方及多方博弈情况下信息传递模式对博弈均衡状态的作 用,探讨信息传递模式影响博弈结果的机制,并给出一些处 理此类博弈问题的方法。同时,对于更大规模的博弈中信息 结构的影响进行了模拟分析。 关键字:博弈,信息结构,信息传递,模拟 中图分类号:f 2 2 4 3 2 a b s t r a c t t h i sp a p e rd i s c u s s e st h ep a t t e r n so ft r a n s m i s s i o n o fk n o w l e d g ei ng a m et h e o r ym o d e l s f o c u s i n go nt h e a f f e c to fi n f o r m a t i o ns t r u c t u r eo nt h ee q u i l i b r i u mo f ag a m em o d e lw i t hn ol e s st h a n3p l a y e r s ,t h i sp a p e r p u t sf o r w a r d s s e v e r a lm e t h o d st od e a lw i t ht h o s e s i t u a t i o n so fa s y m m e t r yi n f o r m a t y o n f u r t h e r m o r e 。s o m e s i m u l a t i o na n a l y s i sa r eg i v e nt os e a r c ht h ep r o p e r t i e s o fm o r ec o m p l e xg a m e s k e yw o r d s :g a m et h e o r y :i n f o r m a ti o ns t r u c t u r e : t r a n s m i s s i o no fk n o w l e d g e ,os i m u l a t i o n c h i n e s el i b r a r yc 1 a s s i f i c a t i o n :f 2 2 4 3 2 2 第一章导论 第一节静态博弈与动态博弈 博弈论是- - n 研究决策主体互动行为的经济学分支。为了得出博弈模型的均 衡解,通常通过假设,预先给定参与者、策略空间、支付函数,以及参与者对支 付函数的知识。然后由参与者根据其知识,从自己的策略空间中选择行动,最终 达到豹均衡状态就是博弈模型的解。 按照参与人行动的顺序,博弈被分为静态博弈和动态博弈。静态博弈的参与 人同时选择行动,或者虽然不是同时行动,但后者不知道前者的选择;而动态博 弈的参与者的行动则有先后顺序,且后者能够观察到前者的行动。 参与人行动的顺序及其认知对博弈结果有着非常显著的影响。以下列支付矩 阵的博弈为例 博弈方2 策略x 策略y 悸 策略x( 1 ,1 )( 4 ,o ) 策略y( 0 ,4 )( 2 ,2 ) 如果双方伺时采取行动,这就是一个静态博弈,其均衡解是个混合策略均 衡,博弈方1 的混合策略( p ,p ,) 一( 2 3 ,1 3 ) ,期望收益为e ,一2 3 ;博弈方2 的混合策略( q ,q ,) 一( 2 3 ,1 ,3 ) ,期望收益为e :;2 ,3 。 然而如果两个博弈方的行动并非同时做出,而且后者观察到了前者的行动, 则该博弈会产生一个纯策略均衡的解,其结果取决于先动的是哪一方。 如果博弈方1 先做出决策,然后由博弈方2 做出相应的反应,应用逆推法, 可知博弈方1 会选择策略x ,而相应地,在这种情况下,为了达到均衡,博弈方 2 将选择策略y ,最终的均衡结果是组合( x ,y ) ,期望收益( 4 ,0 ) 。反之如果 博弈方2 先行决策,然后博弈方做出相应决策,则均衡结果是( v ,x ) ,期望收 益( o ,4 ) 。 第二节复杂博弈的分解简化 传统的博弈论研究出于简化目的,通常把博弈方数量、可选策略集容量都假 设为2 ,博弈次数设定为1 次,以便把研究的重点放在支付矩阵对博弈结果的影 响上。在研究实际问题时,经常会出现多个壤弈方交替行动的复杂博弈情况。在 信息完美的假设下,这些复杂博弈可以等价成一系列双方静态或动态博弈的并行 和继起。 考虑在某产业低端市场上竞争的甲、乙两个厂商,厂商乙一开始就由于低成 本而获得略高的收益。由于低端市场日益萎缩,现在双方都在考虑转向拓展高端 市场;而缺少成本优势的厂商甲同时也在考虑引进一项新技术,该技术既降低生 产成本,也更适应高端市场的需求。假设甲、乙厂商的策略空间和相应支付如下 表: 厂商乙 x 转向高端市场弘不转向高端市场 a 引进新技术 ( 4 ,3 )( 6 ,2 ) x 转向高端市场 厂 a 引进新技术 ( 2 ,1 )( 2 ,0 ) 商 y 不转向高端市场 b 不引进新技术 田 ( 1 ,3 )( 5 ,4 ) x 转向高端市场 b 不引进薪技术 ( 3 ,1 ) ( 0 ,2 ) y ,不转向高端市场 假设在整个博弈过程中,由厂商甲首先决定是否引进新技术,然后甲乙两厂 商同时独立决定是否转向拓展高端市场。此时所有的决策并非同步进行,因此这 个问题可以分解为两个典型的博弈:后面是厂商甲的第二次决策和厂商乙的静态 博弈,而这个博弈的结果正和厂商甲的第一次决策构成一个动态博弈。为了求解 这一博弈模型,可采用逆推法如下: i )如果厂商甲在第一阶段选择策略a :引进新技术 第二阶段甲乙厂商的策略及相应支付为: 厂商乙 第二阶段 x 转向高端市场y 不转向高端市场 悟 x 转向高端市场( 4 ,3 )( 6 ,2 ) m 不转向高端市场 ( 2 ,1 )( 2 ,0 ) 得到纯策略均衡( x ,x ) ,甲乙厂商获得支付分别为( 4 ,3 ) 。 i i )如果厂商甲在第一阶段选择策略b :不引进新技术 第二阶段甲乙厂商的策略及相应支付为 厂商乙 第二阶段 x 转向高端市场 y 不转向高端市场 悟 x 转向高端市场( 1 ,3 ) ( 5 ,4 ) y 不转向高端市场 ( 3 ,1 )( o ,2 ) 得到纯策略均衡( x ,y ) ,甲乙厂商获得支付分别为( 5 ,4 ) 。 厂商甲在第一阶段如果选择策略a ,最终获得支付4 ;如果选择策略b ,最 终获得支付5 。因此第一阶段厂商甲会选择策略b ,这一博弈模型的纯策略均衡 为( ( b ,- ) ,( x ,y ) ) ,支付为( 5 ,4 ) 。 第三节复杂博弈中的信息延迟 然而正是两个参与者的假设,掩盖了纯静态博弈和不完美信息动态博弈的区 别。如果一个静态博弈的参与者不是同时行动,那么有两种可能:一是后行动者 根本不知道其他人已经做出决策;二是后行动者知道他人做出了决策,但不知道 决策的具体内容。如果博弈只有两个个体参与,那么这两种情况是等价的:仅知 道他人做出决策这一事实并不会对自身的决策环境产生影响。 但是当博弈的参与者超过两个时,信息在参与者之间的传递可能会产生不均 匀的现象,即一部分后行动者能够观察到先行动者的决策,一部分后行动者只知 道先行动者做出了决策而不知道具体内容,另一部分后行动者根本就不知道有人 行动在先;而对于先行动者来说,后行动者之间的信息分配模式也是自己进行决 策的重要参考依据。正是由于这种信息传递的延迟,造成后行动者之间信息的不 对称,进而可能会调整参与者的支付函数。不同的信息传递顺序、参与者对这一 顺序的了解程度都会影响这些复杂博弈的分解,并且应当等价为截然不同的简单 博弈序列,最终导致博弈均衡结果的巨大差异。 对于博弈模型中信息传递延迟的问题。一些研究曾有所涉及。j o s e f 和 v a l e r y y ( 1 9 9 9 ) 在完美信息线性“追逃博弈”基础上,研究了在追赶方存在信息 延迟的情况下的“追逃博弈”,重点考察一阶加速动态的连续决策的情况,并研 究了信息延迟程度对博弈结果的影响。k a r l ( 1 9 9 3 ) 以及j o e l ( 1 9 9 6 ) 分别研究了在信 息不对称情况下可能出现的随意散布无价值甚至虚假信息的“流言”( c h e a pt a l k ) 现象,并认为如果博弈参与者对自己的地位( 信息优势或者劣势) 并不了解,那 么即使信息不对称,博弈也会达到和完美信息一样的进化稳定均衡状态。然而这 些研究大多着眼于在特定条件下信息延迟对两方博弈的影响,并且把这种延迟设 定为博弈方的博弈策略之一,即做为信息优势一方遏制对方的一种手段,而没有 对信息延迟现象本身作进一步的分析和探讨。 h a n s ( 2 0 0 1 ) 则对信息传递的几种状态进行了比较细致的区分,他运用博弈理 论分析了c l u e d o 纸牌游戏的最佳获胜策略。这一游戏把有限的一组牌分发到几 名参与者手中,参与者按照次序轮流对任意一名其他参与者手中的牌进行猜测, 并得到真实的回应:首先完成获胜目标的参与者取得游戏的胜利。游戏的可控因 素包括猜测规则( 发问和回应的固定格式) 、信息规则( 猜测回应的揭示方法) 、 获胜目标( 比如正确说出预先选出局外的某几张牌,或者正确说出任意一名其他 参与者手中全部的牌) 等等。通过分析在不同情况下纸牌游戏的获胜策略选择和 博弈结果,研究了被称之为“知识博弈”( k n o w l e d g eg a m e s ) 的这一博弈现象。 同时h a n s 区分了三个博弈方a 、b 、c 之间信息传递的几种可能状态:a 的信 息不传递给b ;a 的信息传递给b ,但c 不知道:c 知道a 的信息传递给 了b ,但不知道信息具体内容;c 知道a 的信息传递给了b ,同时也知道了信 息的具体内容。 本文沿用了这种对于信息传递状态的区分,首先通过构造一个一般性的三方 博弈模型,来研究各种信息传递状态对于博弈均衡结果的决定性作用,并对信息 传递状态的区分作出进一步的探讨:进而考察在大量参与者共同博弈的高度复杂 的情况下,信息传递模式对于群体平均福利( 收益) 的影响。 本文第二章详细分析了在一个三方对称博弈模型中,信息传递延迟对博弈均 衡结果的作用,以及相应的博弈均衡解的处理方法;第三章对信息传递延迟的现 实意义进行探讨,并分析博弈模型中信息的分类和对信息传递的研究的局限性: 第四章通过一个交通网络模拟运行,描述性说明了信息传递速度对大量参与者的 混合博弈系统状态的影响;最后得出对于博弈模型中信息传递影响的一些结论。 第二章信息延迟对三方博弈混合策略均衡状态的影响 第一节三方静态博弈的均衡状态 三个参与者博弈的支付矩阵可以表示成一个2 2 2 的三维形式。假设这个 博弈是对称的: 博壤略l 彝 影 j )f 扎 d ,d ,e ) 黄日 鬣鞴? l 博弈方3 圈1 三方对称博雾的支付矩阵 首先研究完全信息静态博弈的均衡状态。由对称性,设博弈的三个参与者选 择策略1 的概率都为x ,则选择策略2 的概率都是( 1 x ) 。由于三方同时做出决 策,因此他们的行动是相互独立的。如果只考察博弈方1 和博弈方2 ,可以得到 下面的期望支付矩阵: 博弈方2 策略1策略2 博 策略1l a x + b ( 1 一x ) ,a x + b ( 1 一x ) 】 b x + d ( 1 一x ) ,c x + e ( 1 一x ) 】 弈 方 1 策略2 c x + e ( 1 一x ) ,b x + d ( 1 一x ) e x + f ( 1 一x ) ,e x + f ( 1 一x ) 】 图2 加权得出的二维期望支付矩阵 这一2 2 博弈的混合策略均衡,应该是以下方程的解 7 整理后得到 ( a + d 一2 b c f + 2 e ) x2 + 2 ( b d e + f ) x + ( d f ) = 0( 2 1 2 ) 式( 2 1 2 ) 的根x 就是图l 所示的三方静态博弈在均衡状态下各方选择策略l 的概率。这一结果和两个博弈方的静态博弈均衡状态是一致的。事实上,三方静 态博弈的结果正是从两个博弈方推导得出。 第二节一方先行动的动态博弈 如果我们假设图1 的三方博弈是动态进行的,即博弈方1 先做出动作,并且 为博弈方2 和3 所观察到,然后博弈方2 和3 同时行动。应用逆推法来研究三方 的均衡状态: i )如果博弈方1 采取策略1 : 博弈方2 和3 所面临的支付矩阵如图3 所示: 博弈方3 策略l策略2 博策略l ( a ,a )( b ,c ) 弈 博弈方1 收益a博弈方i 收益b 方 2 策略2 ( c ,b )( d ,d ) 博弈方i 收益b博弈方1 收益e 图3 当博弈方采取策略1 时,三方面l 临的支付矩阵 此时博弈方2 和3 的混合策略均衡都是以x ,= 石= 石d i - b 百雨 略1 。因此博弈方1 的期望收益是: e l l = x 12 a + 2 x 1 ( 1 一x 1 ) b + ( 1 一x 1 ) 2 e 的概率采取策 ( 2 2 1 ) q 曲 一 “ 订+ 叫敝 0 x d 一 + 0k 卜柚曲 一 一 0 o 卜托 叫k 0 x 岫 i i x l p x i 订如果博弈方l 采取策略2 : 博弈方2 和3 所面临的支付矩阵如图4 所示 博弈方3 策略1策略2 博策略1 ( b ,b )( e ,d ) 弈 博弈方l 收益c博弈方i 收益d 方 ( d ,e )( f ,f ) 2策略2 博弈方i 收益d博弈方1 收益f 幽4 当博弈方采取策略1 时,三方面临的支付矩阵 此时博弈方2 和3 的混合策略均衡都是以x := 石的概率采取策 略1 。因此博弈方l 的期望收益是: e 1 2 = x22 c + 2 x 2 ( 1 一x2 ) d + ( 1 - x2 ) 2 f ( 2 2 2 ) 博弈方1 应当从e 1 l 和e 1 2 当中选取较大者。如果e 1 1 e 1 2 ,则采用策略1 , 此时博弈方2 和3 都以x l 的概率执行策略1 ;如果e l l 型c a 辩b ) ( a c ) + ( d b )一c ) + ( d ) 、7 以及 a 筹4 - 辫 口4 渤 ( 一c ) ( d b )( a - c ) + ( d - b ) 、。 ( 2 4 2 ) 是不成立的,因此情况( 1 ) 并不箍成为一个均衡状态:情况( 4 ) 也存在同 样的问题。另外两种情况,如果满足不等式约束,就是这一信息延迟博弈的均衡 特杰 第五节两方先行动的动态博弈 作为对照,如果博弈方1 和3 同时行动,而且都被博弈方2 所观察,这就是 一个正常的动态博弈。应用逆推法,每当博弈方1 和3 分别确定一个策略,博弈 方2 就可在策略1 和策略2 之间做出确定的选择,从而给自己一个最佳支付,同 时也为博弈方1 和3 分别产生一个支付;这样的4 种可能情形列在一起,也就构 成了博弈方1 和3 静态博弈的支付矩阵,从而能够得出他们的混合策略均衡状态。 即如果博弈方1 和3 都选择策略l ,轮到博弈方2 行动时,如果博弈方2 选 择策略1 ,则得到支付a ;如果选择策略2 ,则得到支付c 。在此如果我们假设a c , 则博弈方2 将选择策略1 。 依照同样的过程,并假设d b ,e ,f 则博弈方1 和3 的静态博弈可以等 价为如下的形式: 博弈方3 策略1策略2 博 ( a a )( e ,d ) 策略l 弈 博弈方2 选择策略1博奔方2 选择策略2 方 ( d ,e )( d ,d ) 策略2 l 博弈方2 选择策略2博弈方2 选择策略1 因此博弈方1 和3 己开始就将根据这一支付矩阵进行静态博弈,并确定自己 的纯策略均衡状态或者混合策略均衡状态。博弈方2 的策略和收益则完全由另外 两方的均衡状态决定的。 如果我们假设d f l ,d e ,则博弈方1 和3 静态博弈的均衡状态是两者都 选择策略2 ,此时博弈方2 将选择策略1 ,最终三方得到的支付是( d ,e ,d ) 。 第三章政策的内部消息有信息延迟的三方博弈实例 第一节政策部门与市场个体的博弈 信息延迟是比较常见的经济现象,下面将通过一个实例来说明不同信息传递 模式对博弈行为均衡结果的影响。 政府的产业调控政策对被调节产业的市场环境、利润率甚至生存空间都有着 非常显著的影响。假设这样在一个相对发展成熟的行业中,存在两个互相竞争的 厂商。政府内部存在这样种观点:该行业处于过度产出的状态,需要通过调控 使一家厂商主动离开此行业。如果政府做出任何举措,都将在年末颁布实施,而 同时厂商对是否继续留在该行业做出决策。理想状态下政府政策发布前绝对保 密,政府和厂商构成一个三方静态博弈。我们假定如果政府选择不控制、两个厂 商也都选择不离开,即目前的市场环境不变化,则三方的额外收益都是0 :进一 步假设整个博弈的支付矩阵如图8 所示: 政 府 管制 放任 参与者a 蓦 持离开 1 3 , * 】) f 一3 :,一2 ,- z )( 3 舯 西 i )0 1 师)( 2 ,一1 ,2 。* j 。一1 ) )搿歼- 保持参与者b 圈8 政府和帝场参与者博拜豹支付矩阵 在理想的静态搏弈情况下,这一模型的均衡状态可以通过如下过程求解: 设政府选择调控市场的概率为p o ,两个参与者选择离开市场的概率都是p p 。 则两者应当满足: - p p 2 + 4 p p ( i p p ) = 一3 2 p p 2 + 6 p p ( 1 一p ;) 一1 2 ( 1 一p ;) 2 ( 3 1 1 ) 2 p p ( 1 一p g ) 一2 p 6 ( 1 一p 。) = 一1 ( 3 1 2 ) 求解( 2 6 1 ) 和( 2 6 2 ) ,得到 p g ;0 7 1 1 ;p o = 0 2 1 1 即在静态博弈均衡状态下,政府有7 1 1 的概率选择调控市场,而市场参与 者有2 1 1 的概率离开。 然而政府政策往往并不是在发布的时刻刊。为人们所周知。总是存在一个内部 消息群体,能够在政府政策制定之后发布之前获知政策内容,并先于他们的同行 做出反应。 现在假设市场参与者a 就是这样一个拥有内部消息优势的市场个体。这时 整个决策顺序发生了变化:首先由政府( 博弈方1 ) 做出决定管制或者放任 ,然后这一决定被厂商a ( 博弈方2 ) 观察到,a 据此做出自己的反应 离开或者继续留在这个市场上,同时厂商b ( 博弈方3 ) 也要给出自己的判 断,但是他无法观察到政府已经做出的决策。 在这种情况下,对于b 来说,整个博弈仍然是上面所讨论的静态结构。因 此他仍然采用上述的均衡策略,以2 1 1 的概率离开市场,以7 8 9 的概率留下 来。由于b 的决策已经确定,整个博弈实际上就变成了政府与a 的完全信息动 态博弈。其决策树为: 政府 薹矿譬 厂商a厂商a 保影开罐 ( o 2 4 ,- 1 5 8 )( 2 0 5 ,1 )( o 4 2 ,o 4 z )( 1 3 7 ,一1 ) 图9 一方拥有内部信息整个博弈转化为两方的动态博弈 图9 中的支付是按照厂商b 的行动概率加权得到的,比如当政府实行管制 政策,而厂商a 保持在市场中,则有2 1 1 的概率两者获得支付( 3 ,0 ) ,7 8 9 的概率获得( 一1 2 ,2 ) ,因此期望支付为( 0 2 4 ,1 5 8 ) 。 求解这一完全信息动态博弈的均衡状态,容易得知政府将采取管制行动,厂 商a 则离开这一市场,最终双方获得( 2 0 5 ,一1 ) 的支付;而厂商b 则获得一0 2 1 的期望支付。 另一方面,如果政府做出决定后,厂商b 虽然没有观察到这一决定的内容, 但是b 知道a 观察到了这一行动并依此做出决策,此时b 将不再按照静态博弈 的均衡状态行动,博弈结果也将发生剧烈的变化。 应用第二章第四节所述的方法,这一博弈事实上等价于政府与厂商b 首先 进行静态博弈,然后与厂商a 进行动态博弈。 当a 观察到政府的决策( 管制放任) 后,a 可以有四种行动策略: ( 1 )无论政府执行哪种政策,都保持留在该市场。 ( 2 )如果政府管制,则离开市场;如果政府放任,则继续留在该市场。 f 3 )如果政府管制,则留在该市场;反之则离开。 ( 4 ) 无论政府执行哪种政策,都离开该市场。 如果a 采取行动策略( 1 ) ,则政府和厂商b 所面临的静态博弈支付矩阵为 厂商b 保持( 概率q )离开( 概率l - q ) 管制 ( - 1 2 ,2 )( 3 ,- 1 ) 政( 概率p ) 府放任 ( 0 ,0 ) ( 2 ,1 ) ( 概率l - p ) 这一静态博弈的混合策略均衡状态是p = 1 1 2 ,q = 2 3 。然而在这种情况下, 当政府选择管制时,厂商a 的期望收益是o 1 3 + 2 x2 3 = 4 3 ;而如果此时厂 商a 选择离开市场,期望收益为1 。因此行动策略( 1 ) 不是一个稳定的策略。 应用这一分析方法,我们可以得到,行动策略( 3 ) 同样不是稳定策略,而行 动策略( 2 ) 和( 4 ) 都能够导向一个稳定的纯策略均衡状态( 管制,离开,保持) , 即政府选择管制,厂商a 离开市场,厂商b 继续留在这一市场内。最终三方获 得的支付是( 3 ,1 ,o ) 。 第二节博弈模型中信息的分类 事实上,即使是一个只有三方参与的博弈,其信息传递也还有着许多种值得 研究的可能路径: i )博弈方l 先行动,然后博弈方2 观察到l 的行动,并和未观察的博弈 方3 同时开始决策;博弈方3 只知道博弈方l 已经行动,但不知道具 体内容,但博弈方2 以为博弈方3 已经观察到博弈方1 的决策。 i i )博弈方1 和3 同时行动,然后轮到博弈方2 行动:博弈方2 观察了l 的决策,但2 不知道3 已经行动完毕。 谢)博弈方1 先行动,然后观察者2 和3 同时行动;但博弈方i 不知道博 弈方3 观察了自己的行动。 实际上,三方中任意两方之间的信息传递模式都可以是h a n s ( 2 0 0 1 ) 所论四种 状态之一,也就是说即使只考虑一个层次的信息传递,三方博弈就有至少6 4 种 可能的组合方式。如果我们考虑更复杂的情形,这些路径的组合方式还可以列举 更多。因此,单纯用一个“不完美信息”来涵盖所有信息不充分的现象,显得太 过宽泛。我们完全可以对博弈中涉及到的、可以传递并足以作为决策参考依据的 信息进行如下的区分: i )博弈结构,是指谁先动、谁后动这样的决策顺序; i i )历史行为,已经行动的博弈方,它们具体选择了怎样的行动: i i i )知识背景,即博弈方拥有的信息集,这里是指信息集包含的项目而非 具体内容。 这三种不同的博弈信息分别反映了经验的三个不同侧面。搏弈结构、决策顺 序描述事实的存在性,历史行为包含事实本身的内容,而知识背景则是博弈参与 者对事实的了解和适应。在博弈进行中,只有知识背景的信息才是博弈进程最根 本的影响因素。无论事实何时以何种形式发生,只有当这种改变被博弈方感知到, 才会对其决策行为以及博弈结果产生影响。 “知识背景”是个比较有趣的话题,我们还可以对它进一步区分,分成“关 于博弈结构的知识背景”、“关于历史行为的知识背景”以及“关于他人知识背景 的知识背景”。出于最后一条的存在,这种区分可以无限继续下去,直至穷尽所 有博弈方之间的认知关系i 。 然而人们认识能力本身是有限的。在博弈过程中,即使研究者也不可能对所 有可能的信息传递模式进行全面的列举分析。不过试图穷尽这些关系并没有实际 意义,各博弈方感知效用驱动的灵敏度是有限的,微小的不确定性并不能成为做 出次优决策的障碍。因此通常我们只分析两个层次的认知关系,即“a 知道”和 “b 知道a 知道”。 9 第四章群体博弈中的信息传递 第一节群体博弈的特性 博弈行为的本质是参与者依照自己对环境的知识调节自身行为的过程。当参 与者数目、决策空间容量、参与者间的信息传递关系等等这些标志博弈复杂程度 的变量增加时,博弈方收集信息和做出决策的难度和成本都迅速上升。这种大量 参与者交互进行的博弈,如果满足以下几个特性,就可以归结为“群体博弈”: 首先,支付函数简单明了,并且每个参与者的偏好都是公共知识,博弈的参 与者能够很明确的比较和排序自己几种博弈结果以及他人所获得的几种支付之 间的优劣。这样就保证所有参与者的决策基于一致性的基础。 其次,博弈频繁发生且不需要每次只有一部份参与者进行博弈,博弈发生的 时刻和规模都是随机的,甚至可以用一个连续性的模型来概括。 实际的经济运行中这种群体博弈的现象是非常普遍的。比如一个具备相当分 散程度和竞争规模的行业市场,众多厂商之间就可以概括为这种关系;又如 a r t h u r ( 1 9 9 4 ) 讨论的“酒吧问题”“博弈,也是“群体博弈”的一个简化事例。 作为群体博弈的参与者,在经济行为中,人们通常出于成本等因素的考虑, 并不追求获取完全甚至完美的信息,而只是了解统计意义上的信息,掌握环境的 大体特征:并不是一味追求“最优的”策略,而只是寻找一个没有明显缺陷的方 案而已。同时,随着博弈复杂程度的提高,对其进行研究也就更加困难。但是 在一个相当较小的规模下,可以通过计算机对某一问题真实环境进行抽象和模 拟。 以城市交通系统为例。在一个城市的交通路网系统中,有众多的车辆作为参 与者运行着,他们的道路选择决策分别遵循不同的标准;而在他们改变自己行动 的同时,整个系统的客观环境( 道路拥塞情况) 也随之动态改变。每一个瞬间所 有位于十字路口处的车辆都在进行着博弈,它们的备选决策正是接下来选择哪一 个方向前进,而支付函数是到达目的地需要花费的时问。决策所依据的信息集包 括所有其它参与者的信息,包括它们的目的地、速度、计划路线等等,以及目前 各路段的拥塞程度。这些随时都在发生的博弈决定了交通系统的效率和分布。对 于交通系统的参与者之间的博弈问题,m i c h a e lgh ( 2 0 0 0 ) 退i 过设定一个努力尽 2 0 快到达目的地的“正方”和一个试图尽量延迟正方的“反方”,来研究交通网络 中的双方博弈的纳什均衡状态。在此我们沿用其分析方法,但把博弈的参与者数 目大幅增加,并主要着眼于不同信息传递模式下博弈均衡状态的统计特征。 第二节一个模拟交通系统 现在来考察一个只有1 6 个节点、3 7 条道路的交通拓扑图,如图1 0 所示, 每条道路都被赋予初始权值,这个值体现了道路的实际长度,即在没有任何障碍 的情况下以一个单位速度通过这段道路所花费的时间。 把一些“车辆”放在这个微型交通网上运行,这些“车辆”的速度( 单位速 度的倍数) 都被预先设定。每个“车辆”都会随机选择一个起点和一个终点,然 后根据自己的信息集( 各路段拥塞程度,其它车辆的计划路线) 选择一条耗时最 短的路线;在行进过程中,每到达一个路口,它都会根据最新更新的信息及对路 线进行重新考虑:到达终点后,休息一段时间,选择一个新的终点继续开出。 , dr “1 。薹譬6 :爹 “ ;蔓鬻 j_ i - 啊_ i _ _ 。髟萋;i 鋈j 囊豢i 2 1 0 膏鬻髯k “譬瓣纛 誊8 :1 1 ; i 零 i ? _ 一l _j o 二邑_引_ 。 “i馘4 ”一誊j 1 0 ;_ 1 j 。 b 4 ; 。 94 i 毫 l ? 1 0 _ 1 :s 0 3 一m 一l_ m m 一 5 6 2784 1 01 1 ll ,_ j 8i8 图1 0 1 6 个节点、3 7 条道路的微型交通模拟系统 车辆数目达到一定程度后,拥塞情况将频繁出现。当车辆到达下一个路口, 整个系统的状况都已经发生的变化。每个车辆决策所依据的信息,在很大程度拥 上取决于信息传递的速度。 我们考察以下四种信息传递模式,按照传递速度从慢到快排列: i )信息不更新,“车辆”完全按照初始设定的权值进行路线选择; i i )纯经验模式,“车辆”每次经过某一路段,就根据自己实际花费的时 间调整对道路信息的知识,并在下次路线选择时使用这些知识: i i i )实际观察模式,“车辆”在自己积累道路信息的同时,也会观察和收 集周围车辆的计划路线和附近道路的实际情况,并把这些纳入自己的 选择决策参考之中。 i v )完全信息模式,“车辆”通过某种方式,可以完全获知所有路段和所 有其它车辆目前的状况。 同时把四个指标作为交通网整体运行情况的衡量因素: i )路段平均时间,即所有车辆在单一路段上花费时间的均值。 i i )路段加权时间,把各路段上平均花费的时间按照通过这一路段车辆的 数量进行加权。 i i i )路段时间标准差,各路段上平均花费时间的标准差。 i v )全程平均时间,“车辆”从起点到终点所花费的总时间的均值。 车辆数目影响总体交通状况,以及各种信息传递模式的效果。选取2 5 辆和 8 0 辆两种情况分别进行模拟实验,经过五万车次运行,分别得到以下的数据: 信息传递模式 不更新纯经验实际观察完全信息 路段平均时间1 5 4 61 5 9 2 1 6 1 l1 7 1 9 路段加权时间1 7 3 3 1 8 0 21 5 9 01 7 t 2 2 路段时间标准差77 5 8 6 4 97 - 2 9 全程平均时间5 1 4 35 4 1 4 4 8 5 55 1 - 2 4 a ) 2 5 辆车辆运行的模拟结果 表1 不同车辆数日在四种信息传递模式下模拟运行得到的数据指标 。信息传递模式 不更新纯经验实际观察完全信息 路段平均时间1 9 3 41 9 5 l1 9 3 71 9 1 4 路段加权时间 2 1 7 4 2 21 9 4 3 1 9 ,1 6 路段时间标准差 9 9 21 0 4 28 0 37 9 1 全程平均时间 6 3 4 2 6 4 3 45 7 9 6 5 7 4 b ) 8 0 辆车辆运行的模拟结果 续表i 不同车辆数目在四种信息传递模式下模拟运行得到的数据指标 从试验数据可以看出,当车辆数目比较少时,决策信息模式对交通状况的影 响相当微小,在一个车辆相当稀少的交通网络内,堵车的概率很小,这就使得各 道路运营效率充分提升。 随着车辆数目增加,决策信息模式对交通系统运行状况的影响越来越明显。 但是从试验结果可以发现,交通网最终运营效率和信息畅通程度并非完全相关。 因为在获知新信息的参与者改变路线决策的同时,其他参与者也在做出调适。这 些行为互动的结果,使得最终的博弈结果不一定是最优化。 结论 通过本文的分析,探讨了博弈模型中信息传递速度对博弈均衡结果影响。我 们可以的出以下的结论: 1 三方或多方博弈中,信息传递模式成为影响博弈方状态和博弈均衡 结果的重要控制因素; 2 在分析信息延迟时,可以运用等价转化的方法,把一些受到延迟影 响的博弈方的行动放到其它时间点,从而把博弈模型转换为普通的 复杂博弈; 3 即使在一个只有三个博弈方的博弈模型中,实际上相互间传递的信 息也是无限层的,不过这种区分理论上不可行,而且在实际上也超 出任何博弈方的理性能力,因此通常分析到某一层次为止; 4 在一个大量参与者的博弈系统中,均衡状态以及达到均衡状态的时 间都受到信息传递模式的显著影响; 5 顺畅的信息传递并不是总能改善博弈系统的总体支付,有时更多的 信息只是意味着更多的决策和成本,或者更多的潜在冲突。 进一步的研究可以考察各种信息传递模式下的进化稳定均衡状态,通过模拟 分析来研究信息传递模式可变的情况下博弈稳定状态的获得;在群体博弈的模拟 研究上,可以对信息传递设定速度变量,探寻博弈结果下总体支付和信息传递速 度的相关关系。这些都有待更多的工作。 参考文献 1 】wb ,a r t h u r , i n d u c 玎v er e a s o n i n ga n db o u n d e dr a t i o n a l i t y j ,a m e r i c a n e c o n o m i cr e v i e w ,v 1 8 4 ,1 9 9 4 4 0 6 2 】b e l l ,m i c h a e lq h ,ag a m et h e o r ya p p r o a c ht om e a s u r i n gt h ep e 咖r m a n c e r e l i a b i l i t yo ft r a n s p o r tn e t w o r k j t r a n s p o r t a t i o n r e s e a r c h :p a r tb : m e t h o d 0 1 日l g i c a l ,a u g u s t2 0 0 0 ,3 4 ,i s s 6 ,p p 5 3 3 4 5 3 】d eg r o o t e ,x a v i e r , an o t e o nt h es t r a t e g i ct r a n s m i s s i o no fe n d o g e n o u s i n f o r m a t i o n j ,e c o n o m i c sl e t t e r s ,o c t o b e r1 9 9 0 ,v3 4 ,i s s 2 ,p p 1 0 5 0 7 4 】s h i n a r , j o s e f & g l i z e r , v a l e r yy ,s o l u t i o no fad e l a y e di n f o r m a t i o nl i n e a r p u r s u i t - e v a s i o ng a m ew i t hb o u n d e dc o n t r o l s j ,i n t e r n a t i o n a lg a m et h e o r y r e v i e w ,s e p t d e c 1 9 9 9 ,v 1 ,i s s 3 - 4 ,p p 1 9 7 2 1 7 5 s o f i n s y l v a i n ,o nt h ei m p a c to f a ne v e n t j ,i n t e r n a t i o n a lj o u r n a lo fg a m e t h e o r y ,0 c t , 1 9 9 8 ,v 2 7 。 6 v a nd i t m a r s c h ,h a n s ,k n o w & d g eg a m e s j ,b u l l e t i no fe c o n o m i cr e s e a r c h , o c t o b e r2 0 0 l ,v 5 3 ,i s s 4 ,p p ,2 4 9 - 7 3 【7 w a r n e r y d ,k a r l ,c h e a pt a l k , c o o r d i n a t i o 哺a n de v o l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论