博弈论期末复习题复习过程_第1页
博弈论期末复习题复习过程_第2页
博弈论期末复习题复习过程_第3页
博弈论期末复习题复习过程_第4页
博弈论期末复习题复习过程_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、学习 好资料一、支付矩阵1、试给出下述战略式表述 博弈的纳什均衡L R再看看它是否有混合战略均衡设 B 以 ( ,1 ) 玩混合战略,则有均衡条件:VA(U) 12(1 ) 2VA(D) 46(1 ) 6 22 6 2得 4 1 ,这是不可能的,故无混合战略均衡,只有这一个纯战 略均衡。2、试将题一中的支付作一修改使其有 混合战略均衡解 :由奇数定理, 若使它先有两个纯战略均衡, 则很可能就有另一个混合战略均衡。5,62,54,16,2UDL R将博弈改成上述模型,则5 2(1 ) 4 6(1 )2 3 6 2得45同样,设A的混合战略为 ( ,1 ) ,则更多精品文档学习 好资料6 1 (1

2、 ) 5 2(1 )1 5 2 311 1 4 1,2,2 , 5,52于是混合战略均衡为、逆向归纳法1、用 逆向归纳法的思路求解下述 不完美信息博弈的子博弈精炼均衡1 认为设在 1 的第二个信息集上, 则 1 选 L 的支付 5P 2(1 P)2 选 a 的概率为 P ,2 3P1 选 R 的支付 6P 3(1 P)3 3P 2 3P更多精品文档学习 好资料故 1 必选 R 。给定 1在第二个决策结上选 R ,2 在左边决策结上会选 a 为L,R ,(a,d)四、两个厂商生产相同产品在市场上进行竞争性销售。第 1 个 c1 q1,其中 q1为厂商 1的产量。第 2个厂商的成本函数为 c2 2

3、 的产量, c 为其常数边际成本。两个厂商的固定成本都为零。厂商 厂商 2 的“私人信息” ,厂商 1 认为 c 在 1 , 3 2 上呈均匀分布。 P 4 q1 q2,其中 P 为价格,两个厂商都以其产量为纯战略,问,故子博弈精炼均衡厂商的成本函数为cq2 ,其中 q2 为厂商2 的边际成本 c 是设市场需求函数为纯战略贝叶斯均衡为何?解:给定 q2,厂商 1 的问题是 max 1 ( P 1)q1 q1(4 q1 q2 1) q1因 q2 q2(c) 。厂商 1不知道 c ,故目标函数为 3/2max 1 (4 q1 q2 (c) 1)q1dcq1 223 /2q12 q1 12 q2(c

4、)dc一阶条件:3/23 2q1 1 q2 (c)dc 023 1 3/ 21)得 q11 q2 (c) dc2 2 12厂商 2 的问题是: max 2 ( P c)q2q2( 4 q1 q2 c)q2(4 c)q2 q1 q2 q2一阶条件:(4 c) q1 2q 2 0更多精品文档学习 好资料q2(c)4 c q122)代入式( 1):3 1 3 /2 4 c q1 q11 dc1 2 2 1223/2 4 q1121 3/ 214 12 cdc3 4 q1 1 3 2 1 22 4 8 2 23 q14得 q1 1代入式( 2):3c q2(c)2 若 c 1 ,则 q1 q 2 11

5、 2 13 27若信息是完全的且 c 1 ,则古诺博弈均衡为 q1 q2 3 1, 12 27 1。525这说明信息不完全带来的高效率。2、完美信息动态博弈 。会用策略式表达、 扩展式表达 。用方框找纳什均衡,用 树找子博弈精炼均衡 。讲理由,看例题。该博弈中有三个纳什均衡:不进入,(进入,进入)进入,(不进入,进入)进入,(不进入,不进入)更多精品文档学习 好资料前两个均衡的结果 (进入,不进入 ),即 A 进入, B 不进入;第二个均衡结果是 (不 进入,进入 ),即 A 不进入, B 进入如果理论得到这样的结果,无助于预测博弈参与人的行为。此外,纳什均衡假定, 每一个参与人选择的最优战略

6、是在所有其他参与人的战略选择给定时的最优反应, 即参 与人并不考虑自己的选择对其他人选择的影响, 因而纳什均衡很难说是动态博弈的合理 解。必须在多个纳什均衡中剔除不合理的均衡解,即所谓“不可置信威胁” 。子博弈精 炼纳什均衡是对纳什均衡概念的最重要的改进。 它的目的是把动态博弈中的 “合理纳什 均衡”与 “不合理纳什均衡” 分开。 正如纳什均衡是完全信息静态博弈解的基本慨念一 样,子博弈精炼纳什均衡是完全信息动态博弈解的基本概 念。 不进入,(进入,进入) 进入,(不进入,进入) 进入,(不进入, 不进入) 前边得到的三个纳什均衡中, 均衡意味着当 A 不进入时, B 选择进入; 而 当 A

7、选择进入时, B 仍选择进入( B 威胁无论如何都要进入市场) 。显然, 当 A 选择进入时, B 仍选择进入是不合理的, 如果 A 进入市场, B 选择“不 进入”比选择“进入”收益要更大,理性的 B 不会选择进入,而 A 知道 B 是理性的,因此也不会把该战略视为 B 会选择的战略。因此, B 的 战略(进入,进入)是不可置信威胁。 不进入,(进入,进入) 进入,(不进入,进入) 进入,(不进入,不进入) 均衡意味着当 A 进入时, B 选择不进入;而更多精品文档学习 好资料 当 A 选择不进入时, B 仍选择进入( B 威胁无论如何都不进入市场) 。显然,当 A 选择 不进入时, B 仍

8、选择不进入是不合理的, B 的战略是不可置信的。只有均衡是合理的:如果 A 进入, B 不进入;如果 A 不进入, B 进入。因 为 A 是先行动者, 理性的 A 会选择“进入”(他知道 B 是理性的, B 不会选择 “进入”), 而理性的 B 选择“不进入” 。观察博弈树上的三个均衡中, B 的不可置信战略中的反应,在第二阶段 B 开 始行动的两个子博弈中不是最优; 而合理的纳什均衡中, B 的战略在所有子博弈中都是 最优的,与 A 的第一阶段可能选择的行动构成该子博弈的纳什均衡。解:有四种可能:混同均衡t1 m1 , t1 m2 ,t2 m1t2m2分离均衡t1m1,t2m2t1m2 ,t

9、2m1设 u(mi ) 为接收者看见 mi 时认为发送者是 t1 的后验概率。看 t1 m1 , t2 m1则 u(m1) 0.5,非均衡路径上 u(m2 ) 0,1更多精品文档学习 好资料当接收者看见 m1,选 a1 的支付为0.5 2 0.5 1 1.5 选 a2 的支付为 0.5 8 0.5 7 7.5 1.5 故选 a 2 。当接收者看见 m2,选 a1 的支付为u( m2 ) 1 (1 u(m2) 5 5 4u( m2 ) 选 a2 的支付为u(m2) 7 (1 u(m2) 3 3 4u(m2 )当 t1选 m1,接收者会选 a2, t1得支付 10,要求 t1不选 m2,对 u(m

10、2) 无要求,因 t1 总会选 m1。当 t2 选 m1 ,接收者会选 a2, t2得支付 3,要求 t2不选 m2是不可能的,因 t2选 m2 是占优于选 m1的,故此混同均衡 t1 m1, t2 m1不存在。再看混同均衡 t1 m2 , t2 m2此时 u(m1) 0,1 为非均衡路径上的后验概率,u(m2 ) 0.5当接收者看见 m2,选 a1 的支付为0.5 1 0.5 5 3 选 a2 的支付为0.5 7 0.5 3 5 3 故接收者必选 a2 。当接收者看见 m1时,选 a1 的支付为u(m1 ) 2 (1 u( m1) 1 1 u(m1 )选 a2 的支付为u(m1 ) 8 (1

11、 u(m1) 7 7 u(m1) 1 u( m1) 故必选 a 2 。这样,无论发送者发出 m1 或 m2 信号,接收者总选 a 2 , 给定接收者总是选 a2 。更多精品文档学习 好资料t1 会选 m1 , t2 会选 m2 。故 t1 m2 , t2m2 不是混同均衡。看分离均衡 t1 m1, t2 m2u(m1) 1, u(m2) 0 接收者看见 m1 时,必选 a2 接收者看见 m2 时,必选 a1 此时, t1选 m1,t2 选m2故 t1 m1, t2m2 是一个分离均衡。最后看分离均衡 t1 m2 , t2 m1u(m1) 0, u(m2) 1接收者看见 m1 时,必选 a2接收

12、者看见 m2 时,必选 a2 给定接收者总选 a2t1 m1, t2 m2故 t1 m2 , t2 m1 不是分离均衡。 故只有一个纯战略子博弈精炼分离均衡t1 m1t2m2鹰-鸽 (Hawk-Dove) 博弈(1) 参与人:争食的两只动物 -动物 1 和动物 2。动物 1和动物 2的行动空间都是一样的,即: Ai= 鹰,鸽 i=1 ,2支付矩阵如下:(2) 此博弈属于完全信息静态博弈,根据奇数定理知道共有三个纳什均衡,两个纯策略 纳什均衡和一个混合策略纳什均衡。更多精品文档学习 好资料两个纯策略纳什均衡是: (鹰,鸽 )和 (鸽,鹰 )。混合策略纳什均衡是:动物1 和动物 2分别以 50%的

13、概率随机地选择鹰 (象鹰一样行动 )或者鸽 (象鸽一样行动 )。 纯策略纳什均衡可以用划线法或箭头法求解。 混合策略纳什均衡则可根据无差异原则求 解概率分布,即:首先,动物 1 应该以 q 的概率选择鹰,以 1-q 的概率选择鸽,使得动物 2 在鹰或者鸽之 间无差异,那么可得 q* :由 4(1-q) = q+3(1-q) 得 q*=50% ;其次,动物 2 应该以 a的概率选择鹰,以 1-a 的概率选择鸽,使得动物 1在鹰或者鸽之 间无差异,那么可得 a* :由 4(1-a) = a+3(1-a) 得 a*=50% 。(3)此博弈实际就是一个斗鸡博弈,在现实生活许多现象都与此类似,如市场进入

14、、前 苏联与美国在世界各地争抢地盘等。七、狩猎博弈此博弈同样是一个完全信息静态博弈, 参与人是两个猎人, 他们的行动是选择猎鹿或者 猎兔。支付矩阵如下:根据划线或箭头法我们可以很容易地知道此博弈有两个纯策略纳什均衡,即:(鹿,鹿 )和 ( 兔,兔 ) ,也就是两个猎人同时猎鹿或同时猎兔都是纯策略纳什均衡。 由于存在两个纯策略纳什均衡, 现实中究竟哪个均衡会出现就是一个问题, 这是多重纳 什均衡下的困境。 但是, 比较两个纳什均衡, 很容易发现两人都猎鹿帕累托优于两人都 猎兔,所以,对两个猎人而言,都猎鹿是一个“更好”的纳什均衡,因此,在现实中两 个人都决定猎鹿的可能性要更大一些。 然而, 正如

15、卢梭所言, 如果一只野兔碰巧经过他 们中的一个人附近, 那么也许这个人会去猎兔而使猎鹿失败, 因为两个人都猎兔也是一 个纳什均衡,这就是人的自私性。此外,在多个纳什均衡下, 博弈之外的其他因素有助于我们判断哪个均衡会出现。 比如, 两个猎人是好朋友, 经常合作, 那么我们几乎可以 100% 的肯定他们都会同时选择猎鹿。 如果他们是仇敌,那么我们可以肯定他们不会合作猎鹿,因此他们都会选择各自猎兔。更多精品文档学习 好资料 来源 :考试大 - 考博考试不完全信息夫妻博弈混合策略均衡给定妻子分别以 q,1-q 的概率选择时装、 足球,则 丈夫选择时装、足球的期望收益相等,即 1.q+0.(1-q)=

16、0.q+3.(1-q) ,解得妻子选择时装、足球的 概率分别为( 3/4,1/4)给定丈夫分别以 p,1-p 的概率选择时装、足球, 则妻子选择时装、 足球的期望收益相等, 即 2.p+0.(1-p)=0.p+1.(1-p) ,解得妻子选择时装、足球的概率分别为( 1/3, 2/3)当妻子以 (3/4 ,1/4)的概率分布随机选择时装表 演和足球,丈夫以( 1/3 ,2/3)的概率随机选择时装表 演和足球时,双方都无法通过单独改变策略,即单独 改变随机选择纯策略的概率分布而提高利益,因此双 方的上述概率分布的组合构成一个混合策略纳什均 衡。该混合策略纳什均衡给妻子和丈夫各自带来的期望收益分别为

17、:q.p.2+q.(1-p).0+(1-q).p.0+(1-q).(1-p).1=2/3;q.p.1+q.(1-p).0+(1-q).p.0+(1-q).(1-p).3=3/4双方的期望收益均小于纯策略时的期望收益。某些静态贝叶斯博弈的例子1、市场进入博弈 一个完全垄断企业 B 正在垄断一个行业市场,另一个潜在的试图进入该行业的企 业 A ,称 A 为进入者, B 为在位者。 A 不知道 B 的成本特征,设 B 有两种可能的成本, 即高成本和低成本。两种成本情况下的博弈矩阵如表6.1。更多精品文档学习 好资料表 6.1 市场进入博弈 B高成本 低成本默认 斗争 默认 斗争进入40,50-10,

18、030,80-10,100A不进入0,3000,3000, 400假定 B 知道进入者 A 的成本为高成本, 且与 B 为高成本时的成本相同。 假若信息 是完全的,则当 B 为高成本时,唯一的精炼纳什均衡为(进入,默认),另一纳什均衡(不进入,斗争)是含有不可置信的威胁。当 B 为低成本时,唯一的纳什均衡为(不 进入,斗争) ,即若 A 进入行业,具有低成本优势的 B 将通过降低价格将 A 逐出市场。 由于存在行业进入成本,所以 A 被逐出市场后将有净的 10 单位进入成本的损失。当 A 不知道 B 的成本情况时, 他的选择将依赖于他对 B 的成本类型的主观概率或 先验概率密度。设 A 对 B

19、是高成本的先验概率判断为 P,则 A 认为 B为低成本的概率为 1 P。 如果 A 进入,其期望支付为P(40) (1 P)( 10)如果 1 不进入,其期望支付为 0。11当且仅当 P(40) (1 P)( 10) 0或P时,A 选择进入;反之,当P时,55A 不进入。于是,贝叶斯均衡为:1(进入,默认) ,高成本, P ;51(进入,斗争) ,低成本, P ;51(不进入, *), P5更多精品文档学习 好资料其中 * 表示可以是斗争,也可以是默认。2 成本信息不对称的古诺博弈例 3.10 给出的古诺博弈中,每个厂商的成本函数是共同知识。这里,我们假设每 个厂商的成本函数是私人信息, 具体

20、规定如下: 两个企业生产相同产品在同一市场上进 行竞争性销售, 市场需求函数为 Q a P,a 0 , P为产品价格, Q 为市场需求量。 假设 a充分大时总有 a P 0,企业 i的成本函数为 Ci biqi ,其中 Ci为企业 i的总 成本, qi为其产量, bi 为其平均成本, bi为常数且 bi 0,故 bi 也是边际成本。 bi是 企业 i的私人信息,企业 j不知道 bi但认为 bi 在 d, e上呈均匀分布, d 0,e 0, d e。且进一步假定 bi 在d , e呈均匀分布是共同知识, i j , i j 1,2。企业 i 的支付函数是其利润函数 ii Pqi ci(a Q)q

21、i bi qi因 Q q1 q2故 i (a q1 q2)qi bi qi设静态贝叶斯均衡为 qi* i 1,2 ,则由均衡战略的类型依存性有qi* qi*(bi ), i 1,2于是i (a q1* (b1) q*2(b2 )qi* (bi ) bi qi* (bi )i (bj )i 的期望支付为uiPi (bj |bi) i(bj )dbjHj显然 P(bj |bi ) P(b j ) ,由概率分布密度 P(bj )的归一化条件P(bj )dbj 1Hj更多精品文档学习 好资料及 b j 在 d ,e 上呈均匀分布假设,有P(bj ) dbj 1Hj或e dP(bj ) 11ed(a q

22、i )(e d)qj(bj )dbj即 P(bj )是,ui1edHj一阶条件:uiqi(e d)(e d)qi (a qi )(e d) qHj(a bi )(e d ) q j qi2(e d )同样由对称性有(a bj )(e d) qiqj2(e d )qi biqi (e d)(bj )dbj bi (e d) 06.5)6.6)在上式两端对qjbj 进行积分22ed2qi2a(e d )6.7)在式( 6.5)两端对 bi 积分e2 d 2a(e d) e d q j qi2 26.8)将式( 6.7)代入式( 6.8)的右端,得edaqi3 2 (e d)6.9)更多精品文档学习 好资料ed由对称性有 q jqia3 2 (e d)代入式( 6.5)得ed(a bi )(e d) qi3 2 (e d) 2(e d ) ed2a 3bi26ed2a 3b j同理有 q*j2q j 62a 3b1 于是得静态贝叶斯均衡为 (ed26 当a充分大时, qi*和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论