博弈论基础习题及详细解析_第1页
博弈论基础习题及详细解析_第2页
博弈论基础习题及详细解析_第3页
博弈论基础习题及详细解析_第4页
博弈论基础习题及详细解析_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论基础习题及详细解析博弈论的魅力在于它能为我们理解复杂的互动决策提供清晰的分析框架。从日常生活中的小事到国际间的战略对峙,博弈论的思想无处不在。掌握博弈论,关键在于理解其基本概念并能灵活运用分析方法。以下通过几组精选习题,帮助读者巩固基础,深化对核心概念的理解。一、占优策略与纳什均衡习题1:囚徒困境两个嫌疑犯A和B被警方逮捕,警方缺乏足够证据指控他们犯有严重罪行,只能以较轻的罪名判处每人1年监禁。警方将两人分别关押,并给他们以下选择:如果一人坦白(背叛对方),而另一人不坦白(保持沉默),则坦白者将被释放,沉默者将被判处10年监禁;如果两人都坦白,则各判处8年监禁;如果两人都沉默,则各判处1年监禁。请回答:(1)写出该博弈的支付矩阵。(2)找出每个参与者的占优策略(如果存在)。(3)找出该博弈的所有纳什均衡。解析:(1)支付矩阵如下(每一格中,第一个数字为A的支付,第二个数字为B的支付;负号表示监禁年数,故数值越小表示情况越糟):B沉默B坦白:-------:-----:-----**A沉默**(-1,-1)(-10,0)**A坦白**(0,-10)(-8,-8)(2)占优策略分析:对A而言,无论B选择沉默还是坦白,A选择坦白的结果都优于沉默。若B沉默:A坦白(0)>A沉默(-1)若B坦白:A坦白(-8)>A沉默(-10)因此,坦白是A的占优策略。同理,对B进行分析,可得坦白也是B的占优策略。(3)纳什均衡分析:纳什均衡是指在一个策略组合中,给定其他参与者的策略,每个参与者都没有动机单方面改变自己的策略。我们逐一检查所有可能的策略组合:(沉默,沉默):若A沉默,B有动机坦白(0>-1);若B沉默,A有动机坦白(0>-1)。故非均衡。(沉默,坦白):A沉默时,B坦白是最优的;但B坦白时,A沉默(-10)不如坦白(-8),A有动机改变。故非均衡。(坦白,沉默):与上类似,B有动机改变。故非均衡。(坦白,坦白):若A坦白,B坦白是最优的(-8>-10);若B坦白,A坦白也是最优的(-8>-10)。因此,(坦白,坦白)是该博弈唯一的纳什均衡。习题2:智猪博弈猪圈里有两头猪,一头大猪,一头小猪。猪圈的一端有一个食槽,另一端有一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但按按钮需要付出2个单位的成本。如果大猪先到食槽,大猪能吃到9个单位,小猪只能吃到1个单位;如果小猪先到,大猪能吃到6个单位,小猪能吃到4个单位;如果两头猪同时到,大猪吃到7个单位,小猪吃到3个单位。假设两头猪都能做出理性选择。请回答:(1)写出该博弈的支付矩阵(注意考虑按按钮的成本)。(2)找出该博弈的纳什均衡。解析:(1)支付矩阵构建:参与者为大猪和小猪,策略均为“按”或“等待”。支付计算需扣除按按钮的成本(仅由按按钮者承担)。大猪按,小猪等待:大猪付出2单位成本,猪食10单位。大猪后到,得6单位;小猪先到,得4单位。故大猪支付:6-2=4;小猪支付:4。小猪按,大猪等待:小猪付出2单位成本,猪食10单位。大猪先到,得9单位;小猪后到,得1单位。故大猪支付:9;小猪支付:1-2=-1。两者都按:两者都付出2单位成本?不,按按钮的成本是按的那一方付出。若两者同时按(题目未明确先后,但通常智猪博弈设定为一方按),此处按常规设定,假设一方按,则另一方等待。或者,若理解为同时按,则双方都到,但成本由双方共同承担?不,原模型是一方按。我们按经典智猪博弈来:按按钮的行为是一个,谁按谁付出成本。*大猪按,小猪按:这种情况在原模型中较少见,通常假设只有一个按钮,一次只能一人按。此处按题目描述“如果两头猪同时到”,指的是按按钮后跑到食槽的顺序。因此,正确的支付矩阵应基于“谁按按钮”和“谁先到食槽”。更清晰的矩阵应为:小猪按小猪等待:-------:-----:-------**大猪按**(7-2,3-2)=(5,1)(6-2,4)=(4,4)**大猪等待**(9,1-2)=(9,-1)(0,0)小猪等待小猪按:-------:-------:-----**大猪按**(4,4)(5,1)**大猪等待**(0,0)(9,-1)(解释:大猪按,小猪按:两人都按了(成本各2?),然后同时到食槽,大猪得7,小猪得3。则支付为7-2=5,3-2=1。但通常智猪博弈中,“按”与“等待”是互斥策略,即一方选择按,另一方只能等待。因此,经典的支付矩阵是:这里,“大猪按,小猪按”的情况可以认为是小猪选择了按,但大猪也选择了按,此时两者都付出成本,并同时到达,所以大猪7-2=5,小猪3-2=1。)两者都等待:无猪食,支付均为0。因此,支付矩阵(大猪支付在前,小猪支付在后):小猪按小猪等待:-------:-----:-------**大猪按**(5,1)(4,4)**大猪等待**(9,-1)(0,0)(2)纳什均衡分析:我们用划线法寻找纳什均衡。对大猪而言,给定小猪选择“按”,大猪选择“等待”(9>5);给定小猪选择“等待”,大猪选择“按”(4>0)。对小猪而言,给定大猪选择“按”,小猪选择“等待”(4>1);给定大猪选择“等待”,小猪选择“等待”(0>-1,因为-1是小猪按的支付)。因此,小猪有一个弱占优策略“等待”(无论大猪怎么选,等待至少不差于按,甚至更好)。当小猪选择“等待”时,大猪只能选择“按”(4>0)。所以,纳什均衡是(大猪按,小猪等待),支付为(4,4)。二、动态博弈与子博弈完美纳什均衡习题3:斯塔克尔伯格模型(两厂商产量竞争)市场中有两个厂商,厂商1为领导者,厂商2为追随者。市场需求函数为P=a-Q,其中Q=q1+q2,q1为厂商1的产量,q2为厂商2的产量。两厂商的边际成本均为c,且无固定成本。厂商1先选择产量q1,厂商2在观察到q1后选择产量q2。请回答:(1)用逆向归纳法求解该博弈的子博弈完美纳什均衡。(2)比较该均衡与古诺模型(同时选择产量)均衡的结果。解析:(1)逆向归纳法求解SPNE:*第二阶段:厂商2的最优反应厂商2的利润函数为π2=(P-c)q2=(a-q1-q2-c)q2。对q2求导并令其为0:∂π2/∂q2=a-c-q1-2q2=0→q2*=(a-c-q1)/2。这是厂商2对厂商1产量q1的反应函数。*第一阶段:厂商1的最优选择厂商1预知厂商2的反应,其利润函数为π1=(a-q1-q2*-c)q1=(a-c-q1-(a-c-q1)/2)q1=[(a-c-q1)/2]q1。对q1求导并令其为0:∂π1/∂q1=(a-c-2q1)/2=0→q1*=(a-c)/2。将q1*代入q2*,得q2*=(a-c-(a-c)/2)/2=(a-c)/4。子博弈完美纳什均衡为:厂商1生产(a-c)/2,厂商2生产(a-c)/4。(2)与古诺模型比较:古诺模型中,两厂商同时选择产量,反应函数分别为q1*=(a-c-q2)/2和q2*=(a-c-q1)/2。联立求解得q1*=q2*=(a-c)/3。比较:斯塔克尔伯格领导者产量(a-c)/2大于古诺模型中任一厂商产量(a-c)/3。斯塔克尔伯格追随者产量(a-c)/4小于古诺模型中任一厂商产量。总产量:斯塔克尔伯格为3(a-c)/4,古诺为2(a-c)/3。3/4=0.75>2/3≈0.666,故斯塔克尔伯格总产量更高,市场价格更低。领导者利润通常高于古诺均衡中任一厂商的利润。三、混合策略纳什均衡习题4:猜硬币博弈两个参与者,A和B,同时选择出示硬币的正面(H)或反面(T)。如果两人出示的面相同(都是H或都是T),A获胜,获得1单位支付,B损失1单位;如果两人出示的面不同,B获胜,获得1单位支付,A损失1单位。请回答:(1)写出该博弈的支付矩阵。(2)该博弈是否存在纯策略纳什均衡?为什么?(3)找出该博弈的混合策略纳什均衡。解析:(1)支付矩阵:BHBT:-------:--:--**AH**(1,-1)(-1,1)**AT**(-1,1)(1,-1)(2)纯策略纳什均衡的存在性:检查所有纯策略组合:(H,H):A偏好,B会偏离到T。(H,T):B偏好,A会偏离到T。(T,H):B偏好,A会偏离到H。(T,T):A偏好,B会偏离到H。不存在纯策略纳什均衡,因为任一策略组合下,总有一方有动机改变策略。(3)混合策略纳什均衡:设A以概率p选择H,以概率1-p选择T;B以概率q选择H,以概率1-q选择T。对A而言,选择H和T的期望支付应相等(否则A会偏向支付更高的纯策略):E[A选择H]=q*1+(1-q)*(-1)=2q-1E[A选择T]=q*(-1)+(1-q)*1=1-2q令2q-1=1-2q→q=1/2。对B而言,选择H和T的期望支付应相等:E[B选择H]=p*(-1)+(1-p)*1=1-2pE[B选择T]=p*1+(1-p)*(-1)=2p-1令1-2p=2p-1→p=1/2。混合策略纳什均衡为:A以(1/2,1/2)的概率选择(H,T),B以(1/2,1/2)的概率选择(H,T)。四、总结与思考通过以上习题,我们可以看到:1.占优策略是指无论对手如何行动,该策略都是最优的。存在占优策略时,参与者会优先选择。2.纳什均衡是博弈分析的核心概念,它要求在给定其他参与者策略的情况下,每个参与者都没有动机单方面改变自己的策

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论