博弈与社会第二次作业参考答案.pdf_第1页
博弈与社会第二次作业参考答案.pdf_第2页
博弈与社会第二次作业参考答案.pdf_第3页
博弈与社会第二次作业参考答案.pdf_第4页
博弈与社会第二次作业参考答案.pdf_第5页
已阅读5页,还剩8页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二次作业参考答案第二次作业参考答案 1、 (1) 为简明起见, 我们假设当每位大臣达成自己最理想的结果时支付为 3, 其次支付为 2, 达成最不理想的结果时支付为 1。 这个博弈共有两个子博弈: 整个博弈本身和第二阶段的子博弈。 假设博弈能进入第二阶 段,先考虑这个子博弈中的 Nash 均衡。在这个阶段,每位大人都有两种选择: “流放三千里 (B) ”和“斩立决(C) ” 。 左都御史:B 大理寺卿 B C 刑部 尚书 B 2,3,2 2,3,2 2,3,2 C 2,3,2 1,1,3 左都御史:C 大理寺卿 B C 刑部 尚书 B 2,3,2 2,3,2 1,1,3 C 1,1,3 1,1,3 1,1,3 根据“杠杠法” ,这个子博弈中有三个均衡(B,B,B) , (B,B,C)和(C,C,C) 。 这告诉我们在所有可能的子博弈精炼 Nash 均衡中,第二阶段三人的策略组合必定是采取以 上形式的。 再考虑整个博弈中的 Nash 均衡。 在整个博弈中, 每位大人需要考虑在第一阶段选择 “有 罪”或“无罪” ,在第二阶段里选择 B 或 C。 左都御史:(无罪,B) 大理寺卿 (无罪,B) (无罪,C) (有罪,B) (有罪,C) 刑部 尚书 (无罪,B) 3,2,1 3,2,1 3,2,1 3,2,1 3,2,1 3,2,1 (无罪,C) 3,2,1 3,2,1 3,2,1 3,2,1 3,2,1 3,2,1 (有罪,B) 3,2,1 3,2,1 2,3,2 2,3,2 (有罪,C) 3,2,1 3,2,1 2,3,2 1,1,3 左都御史:(无罪,C) 大理寺卿 (无罪,B) (无罪,C) (有罪,B) (有罪,C) 刑部 尚书 (无罪,B) 3,2,1 3,2,1 3,2,1 3,2,1 3,2,1 3,2,1 (无罪,C) 3,2,1 3,2,1 3,2,1 3,2,1 3,2,1 3,2,1 (有罪,B) 3,2,1 3,2,1 2,3,2 1,1,3 (有罪,C) 3,2,1 3,2,1 1,1,3 1,1,3 左都御史:(有罪,B) 大理寺卿 (无罪,B) (无罪,C) (有罪,B) (有罪,C) 刑部 尚书 (无罪,B) 3,2,1 3,2,1 2,3,2 2,3,2 2,3,2 (无罪,C) 3,2,1 3,2,1 2,3,2 1,1,3 (有罪,B) 2,3,2 2,3,2 2,3,2 2,3,2 2,3,2 (有罪,C) 2,3,2 1,1,3 2,3,2 1,1,3 左都御史:(有罪,C) 大理寺卿 (无罪,B) (无罪,C) (有罪,B) (有罪,C) 刑部 尚书 (无罪,B) 3,2,1 3,2,1 2,3,2 2,3,2 1,1,3 (无罪,C) 3,2,1 3,2,1 3,2,1 3,2,1 1,1,3 1,1,3 (有罪,B) 2,3,2 1,1,3 2,3,2 2,3,2 1,1,3 (有罪,C) 1,1,3 1,1,3 1,1,3 1,1,3 1,1,3 容易知道在整个博弈中, 有 15 个 Nash 均衡 (用粗体标出) 。 结合第二阶段应有的选择, 可知博弈共有 9 个精炼 Nash 均衡,用灰色标出。 这些结果中,哪一个更有可能出现呢?注意到,其实对于尚书大人来说, (无罪,B) 是一个弱占优战略,而对于左督御史来说(有罪,C)是一个弱占优战略。如果剔除了所有 弱被占优战略,那么唯一剩下的 Nash 均衡就是( (无罪,B) , (有罪,B) , (有罪,C) ) 。相 对于其他的战略,这个战略显然更靠谱,更容易出现。此时,一枝花将有罪,并被流放三千 里。 (2) 如果刑部尚书可以承诺在第二期必然选择 C, 则他有可能通过子博弈精炼均衡 ( (无 罪,C) , (无罪,C) , (有罪,C) )为一枝花脱罪。如前所述, (有罪,C)是左督御史的占 优战略。给定他采用这一战略,如果刑部尚书威胁说: “我认为一枝花无罪,如果他被判有 罪,那么我宁愿将其斩首! ”这时大理寺卿会作何感想呢? 如果他确认尚书真能遵守承诺, 那么(无罪,C)就能成为其最优反应战略。此时, 均衡( (无罪,C) , (无罪,C) , (有罪, C) )将会实现,此时一枝花将会被无罪释放。 但是如果博弈真进行到第二阶段,那么尚书将会更偏好将“一枝花”流放而非处斩。因 此他的上述威胁是不可置信的。 如果其他两位大人预料到了这点, 那么上述的结果就不可能 出现了。 (3)如果博弈顺序改为先决定是否问斩,然后决定是否有罪。如果有罪,他将被流放。 则仍然可以先考虑第二阶段。这一阶段,三位大人可以选择“无罪(A) ”或“流放(B) ” 。 左都御史:A 大理寺卿 A B 刑部 尚书 A 3,2,1 3,2,1 3,2,1 B 3,2,1 2,3,2 左都御史:B 大理寺卿 A B 刑部 尚书 A 3,2,1 2,3,2 2,3,2 B 2,3,2 2,3,2 2,3,2 根据“杠杠法” ,这个子博弈中有三个均衡(A,A,A) , (A,B,B)和(B,B,B) 。 这告诉我们在所有可能的子博弈精炼 Nash 均衡中,第二阶段三人的策略组合必定是采取以 上形式的。 左都御史:(斩,A) 大理寺卿 (斩,A) (斩,B) (不斩,A) (不斩,B) 刑部 尚书 (斩,A) 1,1,3 1,1,3 1,1,3 1,1,3 1,1,3 1,1,3 (斩,B) 1,1,3 1,1,3 1,1,3 1,1,3 1,1,3 1,1,3 (不斩,A) 1,1,3 1,1,3 3,2,1 3,2,1 3,2,1 (不斩,B) 1,1,3 1,1,3 3,2,1 2,3,2 左都御史:(斩,B) 大理寺卿 (斩,A) (斩,B) (不斩,A) (不斩,B) 刑部 尚书 (斩,A) 1,1,3 1,1,3 1,1,3 1,1,3 1,1,3 1,1,3 (斩,B) 1,1,3 1,1,3 1,1,3 1,1,3 1,1,3 1,1,3 (不斩,A) 1,1,3 1,1,3 3,2,1 2,3,2 2,3,2 (不斩,B) 1,1,3 1,1,3 2,3,2 2,3,2 2,3,2 左都御史:(不斩,A) 大理寺卿 (斩,A) (斩,B) (不斩,A) (不斩,B) 刑部 尚书 (斩,A) 1,1,3 1,1,3 3,2,1 3,2,1 (斩,B) 1,1,3 1,1,3 3,2,1 2,3,2 (不斩,A) 3,2,1 3,2,1 3,2,1 3,2,1 3,2,1 (不斩,B) 3,2,1 2,3,2 3,2,1 2,3,2 左都御史:(不斩,B) 大理寺卿 (斩,A) (斩,B) (不斩,A) (不斩,B) 刑部 尚书 (斩,A) 1,1,3 1,1,3 3,2,1 2,3,2 (斩,B) 1,1,3 1,1,3 2,3,2 2,3,2 (不斩,A) 3,2,1 2,3,2 3,2,1 2,3,2 (不斩,B) 2,3,2 2,3,2 2,3,2 2,3,2 2,3,2 容易知道在整个博弈中,有 15 个 Nash 均衡(用粗体标出) 。结合第二阶段应有的选择, 可知博弈共有 9 个精炼 Nash 均衡,用灰色标出。 那么哪些均衡更容易出现,一枝花又该当何罪呢?先看左都御史有弱占优战略: (斩, B) 。给定左督御史选择这一战略, (不斩,B)对大理寺卿是弱占优战略。重复提除弱被占 优战略后,留下两个可能的均衡: ( (不斩,A) , (不斩,B) , (斩,B) )和( (不斩,B) , (不 斩,B) , (斩,B) ) 。此时,一枝花会被流放三千里。 2、或许本题的主人公称呼应该改为东嫂和东哥更为合适了。 (1)在 Stackelberg 模型中,我们先考虑“后动者”的行为,在给定“先动者”行为的情形 下,得到“后动者”的最优行为。然后将其反代回“先动者”的决策,求解其行为。 具体到本题:在给定奶茶 MM 的产量选择 1 Q时,考虑奶茶 GG 的最优反应: )(max)(max 2212 22 QQQbcaQcP QQ 求解 F.O.C,可得奶茶 GG 的最优反应曲线: b bQca Q 2 1 2 )( , 将其代回奶茶 MM 的目标函数。这时,奶茶 MM 的决策问题是: 1 1 1 ) 2 (max 1 Q b bQca Qba Q 求解 F.O.C,可得奶茶 MM 的最优产量为: b ca Q gStackelber 2 1 进而可以求得: b ca Q gStackelber 4 2 ,总产量为: b ca Q gStackelber 4 3)( 。市场价格为 4 3ca bQaP gStackelbergStackelber 。 在 Stackelberg 均衡下,奶茶 MM 的利润为 b ca Stakelberg 8 2 1 )( ;而奶茶 GG 的利润 则为 b ca Stakelberg 16 2 2 )( 。 (2)在奶茶之战第一季中,我们已经求得,在 Cournot 均衡下,奶茶 MM 和奶茶 GG 都将 生产 b ca QQ CournotCournot 2 21 ,而两人的利润则为 b ca CournotCournot 9 2 21 )( 。 很显然,在 Stackelberg 竞争下,先动者奶茶 MM 无论在产量上还是利润上都高于 Cournot 均衡,而后动者奶茶 MM 则在产量和利润上都不如 Cournot 均衡。这证明了奶茶 MM 存在 “先发优势” 。 (3)先考虑后动者行为。当观测到奶茶 MM 的产量 1 Q后,其余任一参与人 i,i=2、3 N-1 的决策目标为: )(max ii ij j Q QQQbca i 最优反应分别为: b Qbca Q ij j i 2 )( 由对称性, N QQQ. 32 。代入上式,可得: Nb bQca QQQ N 1 32 . (注意,由于奶茶 MM 的先动,这里 1 Q已经给定了) 代回奶茶 MM 的决策问题: 1 1 1 1 2 Q Nb bQcaN Qba Q ) )( (max 求解 F.O.C,可得奶茶 MM 的最优产量为: b ca Q 2 1 。 因此, Nb ca QQQ N 2 32 . 此时,市场上的总产量 Nb caN Q 2 12)( ,市场价格为 N cNa P 2 12)( 。因 此奶茶 MM 的利润为 Nb ca 4 2 1 )( ,其余人的利润 bN ca N 2 2 32 4 )( . 。 在 Cournot 均衡下,容易求得: bN ca QQQQ N )( . 1 321 ,由此,所 有人的利润都为: bN ca N 2 2 321 1)( )( . 。容易知道,N1 时,有 NN41 2 )(,因此 bN ca Nb ca 2 22 1 4 )( )()( 。这说明奶茶 MM 依然有先发优势。 但是由于 2 22 2 22 14 1 1 4 )( )()( )( )()( NN caN bN ca Nb ca Advantage, 容易求得当 N3 时: 0 14 1314 2 2 w NN NNN N Advantage )( )()( 即先发优势逐渐减小。极端地,当N时,0Advantage。 (4)在其它人观察到奶茶 MM 和奶茶 GG 的决策后,参与人 i,i=3N-1 的决策目标为: )(max ii ij j Q QQQbca i 最优反应分别为: b Qbca Q ij j i 2 )( 由对称性, N QQQ. 43 。代入上式,可得: bN QQbca QQQ N )( )( . 1 21 43 代回先动者问题,可知奶茶 MM 的决策问题为: 1 21 21 1 2 2 Q bN QQbcaN QQbca Q ) )( )()( (max 求解 F.O.C,可得: b bQca Q 2 2 1 。由对称性,可知: b ca QQ 3 21 从 而 bN ca QQQ N )( . 13 43 , 因 此 市 场 上 的 总 产 量 为 : bN caN Q )( )( 13 43 ,市场价格为: )( )_( 13 43 N cNa P。 容易算得,作为先动者的奶茶 MM 和奶茶 GG 的利润都为: bN ca )( )( 19 2 21 , 而其它后动者的利润都为 bN ca N 2 2 43 19)( )( . 。 (5)当有 M 个人先动时,采用完全和(4)中类似的步骤,可以算得: bMNM ca QQQ NMM )( . 11 21 反代回先动者的决策问题,可以算得: bM ca QQQ M )( . 1 21 从 而 市 场 总 产 量 为 bMNM caMNMN Q )( )( 11 2 , 市 场 价 格 为 : )( )( 11 2 MNM cMNMNa P。 从而容易算得,所有 M 位先动者的利润都为: bMNM ca M )()( )( . 11 2 2 21 而 N-M 位后动者的利润都为: bMNM ca NMM 22 2 21 11)()( )( . (6)当奶茶 MM 和奶茶 GG 结成卡特尔后,他们共同选择垄断总产量 m Q,以最大化联合 利润: max mm Q QbQca m 用 F.O.C 可得: b ca Qm 2 。故两人的产量都为 b ca QQ CartelCartel 4 21 ,市场的 价格为 2 ca PCartel 。此时他们两人的利润都为: b ca CartelCartel 8 2 21 )( 。 (7)尽管“砖家”通常都不靠普,但这次的论断却是言之有理的。 假设奶茶 GG 信守承诺,选择产量 b ca 4 。则对于奶茶 MM 来说,其最优的产量 1 Q求 解如下问题: )(max 11 41 Q b ca Qbca Q 由 F.O.C 可得,最优的 b ca Q 8 3 1 )( ,大于协商产量 b ca 4 。此时,市场上的总产量 为 b ca Q 8 5)( ,市场价格为 8 53ca P 。 此时奶茶 MM 的利润为: b ca 64 9 2 1 )( ,大于遵守卡特尔协议时的利润 b ca 8 2 )( 。 这表明,奶茶 MM 出于利润考虑,有强烈的违约动机。 (8)如果两人都信守卡特尔才协定,那么在每一期两人都能获得利润 b ca 8 2 )( 。因此,在 无穷期中,他们的总利润贴现都为: b ca b ca b ca b ca b ca Cartel )( )( )( .)( . )()()( 18 8 1 888 2 2 2 2 2 22 i. 如果两人都选择“以牙还牙” (tit-for-tat)的策略。那么,假设奶茶 MM 在第一期违 背了卡特尔协定,则在当期,其产量为 b ca 8 3)( ,利润为 b ca 64 9 2 )( 。在第二期,她重新返 回卡特尔产量,而奶茶 GG 则用 Cournot 竞争的产量加以报复。而到了第三期,奶茶 MM 会 选择 Cournot 竞争产量,奶茶 GG 重回卡特尔产量 在表 1 中,我们整理了两人在每期的行动,产量,以及对应利润: 表 1: “以牙还牙”策略下的每期行动、产量和利润 奶茶 MM 奶茶 GG 时期 行动 产量 利润 行动 产量 利润 1 最优偏离 b ca 8 3)( b ca 64 9 2 )( 卡特尔 b ca 4 )( b ca 32 3 2 )( 2 卡特尔 b ca 4 )( b ca 48 5 2 )( 古诺 b ca 3 )( b ca 36 5 2 )( 3 古诺 b ca 3 )( b ca 36 5 2 )( 卡特尔 b ca 4 )( b ca 48 5 2 )( 4 卡特尔 b ca 4 )( b ca 48 5 2 )( 古诺 b ca 3 )( b ca 36 5 2 )( 5 古诺 b ca 3 )( b ca 36 5 2 )( 卡特尔 b ca 4 )( b ca 48 5 2 )( 6 卡特尔 b ca 4 )( b ca 48 5 2 )( 古诺 b ca 3 )( b ca 36 5 2 )( 由此,我们可以算出,在两人都采用“Tit-for-tat”下,奶茶 MM 在第一期违约的贴现 利润为: b ca b ca b ca b ca b ca b ca b ca b ca b ca )( )( )( )( )( )()( . )()()()()( 偏离 2 22 2 22 2 22 2 4 2 3 2 2 22 1576 6081 136 5 148 5 64 9 36 5 48 5 36 5 48 5 64 9 要保持卡特尔长期稳定,就必须有: 偏离 Cartel,即: b ca b ca )( )( )( )( 2 222 1576 6081 18 可以解得,此时要求170820653).(。 ii. 如果两人选择“触发” (Trigger-Out)策略,那么如果奶茶 MM 在第一期违背卡特尔 协定,则在此后各期奶茶 MM 都会采取 Cournot 竞争产量报复,同时奶茶 MM 也只能选择 Cournot 竞争产量。两人在各期的行动,产量,以及对应利润将如表 2 所示。 在这种情况下,奶茶 MM 在第一期违约的贴现利润为: b ca b ca b ca b ca b ca b ca )( )()( . )()()()( 偏离 1964 9 99964 9 22 2 3 2 2 22 要保持卡特尔长期稳定,就必须有: 偏离 Cartel,即: b ca b ca b ca )( )()( )( )( 1964 9 18 222 可以解得,此时要求152940 17 9 ).(。 表 2: “触发”策略下的每期行动、产量和利润 奶茶 MM 奶茶 GG 时期 行动 产量 利润 行动 产量 利润 1 最优偏离 b ca 8 3)( b ca 64 9 2 )( 卡特尔 b ca 4 )( b ca 32 3 2 )( 2 古诺 b ca 3 )( b ca 9 2 )( 古诺 b ca 3 )( b ca 9 2 )( 3 古诺 b ca 3 )( b ca 9 2 )( 古诺 b ca 3 )( b ca 9 2 )( 4 古诺 b ca 3 )( b ca 9 2 )( 古诺 b ca 3 )( b ca 9 2 )( 3、 (1)如果平均分配,则两人各得 50 公斤棒子面和 50 公斤泡菜。此时,三胖和三顺的效 用分别为 75 和 100。考虑另外一种分配,三胖得 100 公斤棒子面,三顺得 100 公斤泡菜, 则两人的效用都为 100。相对于平均分配,这种配置方法在不损害三顺效用的前提下让三胖 的效用得到了改进,实现了帕累托改进。因此简单平均分配并不是帕累托最优。 (2)如果不谈判,三胖的期望效用为12002 . 0)50100(8 . 0,三顺的期望效用为: 40)100100(2 . 008 . 0。此即为两人的威胁点。 (3)效用可行性前沿如下: (注意,如果所有物资都归三胖,三胖的效用为 150;如果所有物资都归三顺,三顺的 效用为 200。 这样我们可以得到可行性前沿和横轴、纵轴的交点分别为(150,0) , (0,200) 。 考虑从(150,0)开始,考虑三胖和三顺之间效用的替代关系。由于相对来说三顺对泡菜的 评价更高,三胖每让给三顺 1 单位泡菜,他自己减少 0.5 单位效用,但三顺可以获得 1 单位 效用。直到三顺拥有所有的泡菜,此时两人的效用组合为(100,100) 。此后,三胖只能减 少棒子面了,由此他和三顺的效用替代关系是 1:1。因此帕累托可行边界如上所示。 ) 同时可以写出帕累托边界(Pareto Frontier)对应的方程为: 150100,200 100,2300 11 11 2 uu uu u (4) Nash 谈判问题为: )40)(120(max 21 , 21 uu uu 150100,200 100,2300 11 11 2 uu uu u 解得:125 1 u, 50 2 u。 进一步的,求解: 100 100 50 1252/ 21 21 22 11 KK CC KC KC 从而解得:100 1 C,0 2 C,50 1 K,50 2 K。 (5)当三胖经过叫兽点拨后,效用函数变成了KCU 2 1 。这时对应的帕累托效用前沿 (150,0) 三胖 三顺 (0,200) (100,100) 是将之前的帕累托前沿横向拉升,宽度变成原来的 2 倍。容易知道对应的方程为: 300200,200 200,2300 11 11 2 uu uu u 300200,5 . 0200 200,300 11 11 2 uu uu u Nash 谈判问题为: )40)(240(max 21 , 21 uu uu 300200,5 . 0200 200,300 11 11 2 uu uu u 解得:250 1 u, 50 2 u。 100 100 50 2502 21 21 22 11 KK CC KC KC 从而解得:100 1 C,0 2 C,50 1 K,50 2 K。其结果是和之前一样的。 这说明了 Nash 谈判的一个特性,即谈判结果不随效用函数的线性变换而变化。 4、我们可以用逆向归纳法来对其进行讨论。 首先考虑仅剩下的两个海盗 D、E 时的问题。这时应该由 D 提出方案,显然他如果提 (300,0) 三胖 三顺 (0,200) (200,100) 出由自己全得 100 金币,E 没有办法进行拒绝,因为即使表决,这一方案也必然会通过。因 此,分配的结果就应该是 D 得 100 金币,E 不得任何金币。 现在反推到 C 的分配问题。显然此时只要 C 的方案不是将全部 100 金币都给 D,则 D 都不会同意这一分配方案,因为如果将博弈进行到下一阶段,他就能独得全部金币。而如果 给予 E 的金币多于 0,则他就会支持这一方案,因为如果博弈进行到下一阶段,他将一无所 得。给定以上情况,C 的最优选择就应该是无视 D 的态度,但要争取 E。为此,他的最优方 案应该是不分给 D 任何金币,而给 E 以 1 个金币来争取其支持(注意,如果不给 E 任何金 币,则 E 将宁愿否决方案,将 C 投入大海) 。因此,分配结果就是 C 得 99,D 得 0,E 得 1。 再反推到 B 的分配问题。这时,他只要争取到另一个海盗支持自己,就可以让方案通 过。由于如果将博弈进行到下一轮,D 什么也得不到,因此 B 只要给予其 1 个金币就可以 让其支持自己的方案。因此,B 的最优方案就应该是,给 D 以 1 个金币,而不给 C、E 任何 金币。因此,分配结果就是 B 得 99,C 得 0,D 得 1,E 得 0。 最后考虑 A 的分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论