博弈论基础习题与思维训练集

上传人：1*** IP属地：海南上传时间：2026-05-25 格式：DOCX 页数：14 大小：42.26KB 积分：15 举报 版权申诉

已阅读5页，还剩9页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

博弈论基础习题与思维训练集引言：为何博弈，如何精进？博弈论，作为研究决策者在相互作用情况下如何进行策略选择的理论，其智慧早已渗透到经济学、政治学、社会学乃至日常生活的方方面面。理解博弈论不仅能帮助我们洞察复杂现象背后的逻辑，更能提升我们在不确定环境中做出理性决策的能力。然而，理论的掌握离不开实践的锤炼。习题演练与系统性的思维训练，正是将抽象概念转化为分析工具的关键环节。本集旨在通过一系列精心挑选的基础习题与配套的思维引导，帮助读者夯实博弈论基础，培养策略性思考的习惯与直觉。习题与思维训练习题一：经典模型的重温与深化——囚徒困境的变体问题描述：两名嫌疑犯A和B因同一案件被警方逮捕，警方缺乏足够证据定罪。审讯官将两人分开，分别告诉他们以下政策：“如果两人都坦白，各判刑5年；如果一人坦白另一人抵赖，则坦白者释放，抵赖者判刑10年；如果两人都抵赖，由于证据不足，各判刑1年。”1.请构建该博弈的标准式（支付矩阵）。2.找出该博弈的纳什均衡。3.若将“都抵赖各判1年”改为“都抵赖各判3年”，均衡结果会发生变化吗？为什么？这说明了什么？思考要点：*如何准确地将文字描述转化为支付矩阵？（注意参与者、策略集、支付的对应）*纳什均衡的定义是什么？如何通过划线法或箭头法寻找纳什均衡？*支付的改变如何影响参与者的策略选择和最终均衡？这反映了囚徒困境的核心矛盾是什么？分析与解答：1.支付矩阵构建：我们以（A的支付，B的支付）来表示。B坦白B抵赖---------------------A坦白(5,5)(0,10)A抵赖(10,0)(1,1)B坦白B抵赖---------------------A坦白(5,5)(0,10)A抵赖(10,0)(3,3)2.纳什均衡的寻找：运用划线法：给定B坦白，A坦白（5）优于抵赖（10），故在（5,5）中A的支付5下划线。给定B抵赖，A坦白（0）优于抵赖（1），故在（0,10）中A的支付0下划线。同理，给定A坦白，B坦白（5）优于抵赖（10），在（5,5）中B的支付5下划线。给定A抵赖，B坦白（0）优于抵赖（1），在（10,0）中B的支付0下划线。支付矩阵中，只有（坦白，坦白）对应的支付对（5,5）两个数字均被下划线，因此（坦白，坦白）是唯一的纳什均衡。3.支付改变对均衡的影响：若“都抵赖各判1年”改为“都抵赖各判3年”，新的支付矩阵为：再次运用划线法：给定B坦白，A仍会选择坦白（5<10）。给定B抵赖，A选择坦白（0<3）。同理，B的选择也不受影响。因此，纳什均衡依然是（坦白，坦白）。说明：这说明囚徒困境的核心在于个体理性与集体理性的冲突。即使集体最优（都抵赖）的结果有所改善（从各1年到各3年，虽然这里集体最优的“优”是指刑期更短，但支付数值是刑期，所以3年比1年更差，但逻辑是，即使改变这个支付，只要“坦白”仍是双方的占优策略，均衡就不会改变），只要个体选择坦白的激励（避免最坏结果、甚至可能被释放）依然存在，个体理性的选择就会导致集体次优的均衡。习题二：策略互动与均衡选择——性别战博弈问题描述：一对情侣，男方（他）喜欢看足球，女方（她）喜欢看芭蕾。他们都希望能在一起度过周末，而不是分开。如果一起去看足球，男方的效用为3，女方的效用为2；如果一起去看芭蕾，男方的效用为2，女方的效用为3；如果分开各自去看，双方效用均为1。1.构建该博弈的支付矩阵。2.找出该博弈的所有纯策略纳什均衡。3.该博弈是否存在混合策略纳什均衡？若存在，请尝试计算。4.从聚点均衡（FocalPoint）的角度思考，现实中他们可能会如何选择？思考要点：*区分纯策略和混合策略的概念。*如何判断一个博弈是否存在多重均衡？多重均衡时如何进行选择？*混合策略纳什均衡的含义是什么？如何通过无差异条件求解？*聚点均衡依赖于哪些因素？分析与解答：1.支付矩阵构建：她：足球她：芭蕾-------------------------他：足球(3,2)(1,1)他：芭蕾(1,1)(2,3)2.纯策略纳什均衡：使用划线法或箭头法：若他选足球，她选足球（2）优于芭蕾（1）；若他选芭蕾，她选芭蕾（3）优于足球（1）。若她选足球，他选足球（3）优于芭蕾（1）；若她选芭蕾，他选芭蕾（2）优于足球（1）。因此，（足球，足球）和（芭蕾，芭蕾）是两个纯策略纳什均衡。3.混合策略纳什均衡：存在。设男方选择足球的概率为p，选择芭蕾的概率为1-p；女方选择足球的概率为q，选择芭蕾的概率为1-q。对于男方，要使女方在足球和芭蕾之间无差异，则女方选择足球的期望效用等于选择芭蕾的期望效用：女方选足球的期望效用：2*p+1*(1-p)=p+1女方选芭蕾的期望效用：1*p+3*(1-p)=3-2p令p+1=3-2p→3p=2→p=2/3。同理，对于女方，要使男方在足球和芭蕾之间无差异：男方选足球的期望效用：3*q+1*(1-q)=2q+1男方选芭蕾的期望效用：1*q+2*(1-q)=2-q令2q+1=2-q→3q=1→q=1/3。因此，混合策略纳什均衡为：男方以2/3概率选足球，1/3概率选芭蕾；女方以1/3概率选足球，2/3概率选芭蕾。4.聚点均衡思考：现实中，他们可能会根据过往习惯（比如“女士优先”、上次是谁做的决定、或者当天是什么特殊日子）来达成一个默契的选择，这些非博弈本身的信息成为了聚焦点。习题三：动态博弈与承诺行动——市场进入阻挠问题描述：一个潜在进入者（参与人1）考虑是否进入一个现有企业（参与人2）垄断的市场。如果进入者不进入，进入者的支付为0，现有企业的支付为100。如果进入者进入，现有企业可以选择默许或斗争。若默许，进入者和现有企业的支付分别为40和50；若斗争，进入者和现有企业的支付分别为-10和20。1.画出该博弈的扩展式（博弈树）。2.用逆向归纳法求出该博弈的子博弈完美纳什均衡。3.如果现有企业在进入者进入前，通过某种方式承诺：若进入则必定斗争（例如，与供应商签订排他性协议，若不斗争则面临巨额赔偿，从而改变斗争时的支付）。假设这种承诺使得现有企业在“进入-斗争”路径下的支付变为30（而非20），这会改变均衡结果吗？为什么？这说明了承诺的什么特性？思考要点：*如何正确绘制博弈树，清晰表示参与人、行动顺序、信息集和支付？*逆向归纳法的逻辑是什么？如何应用于求解子博弈完美纳什均衡？*承诺行动如何改变博弈的支付结构或行动顺序，从而影响均衡结果？可信性在承诺中扮演什么角色？分析与解答：1.扩展式（博弈树）：（此处文字描述博弈树结构）*起点为参与人1（进入者）的决策节点，有两个分支：“进入”和“不进入”。*若选择“不进入”，博弈结束，支付为（0,100）。*若选择“进入”，则轮到参与人2（现有企业）决策，其决策节点有两个分支：“默许”和“斗争”。*“默许”分支结束，支付为（40,50）。*“斗争”分支结束，支付为（-10,20）。2.子博弈完美纳什均衡（逆向归纳法）：*从博弈的最后阶段开始分析。参与人2在面临进入时，选择“默许”（支付50）优于“斗争”（支付20），因此会选择默许。*参与人1在初始节点，预见到如果自己进入，参与人2会默许，从而自己得到40，这优于不进入的0。*因此，子博弈完美纳什均衡是：进入者进入，现有企业默许。3.承诺的影响：*原博弈中，“斗争”对现有企业而言是不可信的威胁，因为其支付低于“默许”。*承诺后，“进入-斗争”路径下现有企业的支付变为30。此时，参与人2在面临进入时，比较“默许”（50）和“斗争”（30），依然会选择“默许”（50>30）。因此，均衡结果不变。*说明：此例中，承诺虽然改变了斗争的支付，但并未改变“默许”仍是更优选择的事实。这说明，有效的承诺必须使得承诺的行动（此处为斗争）在相应节点上成为承诺者的最优选择，即承诺必须是可信的。仅仅改变支付但不足以扭转优劣顺序，是无法改变均衡结果的。如果承诺使得“斗争”的支付高于“默许”（例如，承诺后“进入-斗争”支付为60），则现有企业的威胁变得可信，进入者将选择不进入。习题四：信息不对称与信号传递——二手车市场的初步考察问题描述：考虑一个二手车市场，卖方知道车的质量（好车或坏车），买方不知道，但知道好车的概率为p，坏车的概率为1-p。买方出价，卖方决定接受或拒绝。好车对卖方的价值是8万元，对买方的价值是10万元；坏车对卖方的价值是3万元，对买方的价值是5万元。1.如果买方是风险中性的，且买方只能出一个价格，那么买方愿意出的最高价格是多少？在什么情况下市场上所有车都能成交？在什么情况下只有坏车能成交（或市场萎缩）？2.若卖方可以选择是否对车辆进行一次检测，检测成本为C（C>0），且检测结果（好或坏）是公开可验证的。好车通过检测的概率是1，坏车通过检测的概率是0（即检测能完美区分车况）。卖方可以选择向买方展示检测报告。此时，好车卖方和坏车卖方会如何行动？买方会如何出价？这是否能解决信息不对称问题？思考要点：*信息不对称如何影响市场交易效率？*平均期望价值在买方决策中的作用是什么？*信号传递的基本原理是什么？有效的信号需要满足什么条件（例如，信号成本的差异）？分析与解答：1.买方的最高出价与市场结果：*买方风险中性，其愿意出的最高价格是车的期望价值。*期望价值EV=p*10+(1-p)*5=5+5p。*卖方是否接受价格P，取决于P是否不低于其车对自己的价值。*好车卖方愿意接受的最低价格是8万元。*坏车卖方愿意接受的最低价格是3万元。*所有车都能成交：买方出价P需同时满足P≥8（好车卖方接受）和P≥5+5p（买方愿意出）。但5+5p是买方的期望价值，若P≥8，则需5+5p≥8→p≥3/5(0.6)。此时买方出价8万元，好车卖方接受（8≥8），坏车卖方更会接受（8≥3）。*只有坏车能成交（市场萎缩）：若p<0.6，则买方的期望价值5+5p<8。买方最高只愿出5+5p<8，此时好车卖方不愿接受（5+5p<8），只有坏车卖方愿意接受（5+5p>3，因为p>0时5+5p>5>3）。买方预期到这一点，知道愿意卖的都是坏车，因此只愿出价5万元（坏车对买方的价值），坏车卖方接受（5≥3）。2.信号传递（检测与报告）：*好车卖方：检测成本为C，展示检测报告后，买方知道是好车，会愿意出价10万元。卖方净收益为10-C。若不检测，在信息不对称下，若市场萎缩，好车卖不出去，收益为0；若市场混同，可能被低估。因此，只要10-C>不检测时的收益（通常情况下，若不检测好车无法成交，则10-C>0→C<10，这通常成立），好车卖方会选择检测并展示报告。*坏车卖方：检测不能通过，展示报告无意义，且会花费成本C。因此，坏车卖方不会选择检测，或检测后无法展示有利报告。*买方：看到检测报告（好车信号）则出价10万元；看不到报告则推断是坏车，出价5万元。*结论：这种情况下，检测报告成为一种可信的信号，好车卖方有激励发送信号，坏车卖方无法模仿。因此，信息不对称问题得到缓解，市场能够区分好车和坏车，实现分离均衡。思维训练拓展：超越习题本身完成上述习题后，不应止步于得出答案。真正的思维训练在于：1.多视角审视：尝试改变习题中的参数（支付、概率、行动顺序），观察均衡结果如何变化，理解关键变量的影响。2.联系实际：思考每个模型在现实中的对应情境。例如，囚徒困境可以对应价格战、军备竞赛；性别战可以对应协调问题；信号传递可以对应教育文凭、产品保修等。3.反事实推理：“如果……会怎样？”（Whatif...?）的提问方式，有助于深入理解博弈的逻辑链条和潜在

人人文库> 全部分类> 应用文书 > 合同范本

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论基础习题与思维训练集

文档简介

温馨提示

最新文档

评论

博弈论基础习题与思维训练集

文档简介

温馨提示

最新文档

评论

相关文档