博弈论考研试题及答案

上传人：1*** IP属地：河南上传时间：2026-07-05 格式：DOCX 页数：34 大小：46.88KB 积分：6 举报 版权申诉

已阅读5页，还剩29页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

博弈论考研试题及答案一、选择题（20分）1.在囚徒困境博弈中，如果两个囚徒都选择坦白，各自判刑3年；如果都选择沉默，各自判刑1年；如果一个坦白而另一个沉默，坦白者释放，沉默者判刑5年。该博弈的纳什均衡是：A.两人都坦白B.两人都沉默C.一个坦白一个沉默D.无法确定答案：【A】解析：根据纳什均衡的定义，在给定其他参与者策略的情况下，没有任何参与者可以通过改变自己的策略而获得更好的结果。在囚徒困境中，无论对方选择什么，选择坦白都是最优策略，因此纳什均衡是两人都坦白。B选项不是均衡，因为如果对方沉默，自己坦白可以释放；C选项不是均衡，因为沉默者可以通过改变策略为坦白而获得更好结果；D选项错误，因为纳什均衡是确定的。2.下列关于占优策略的描述中，正确的是：A.占优策略是指在所有其他参与者的策略组合中，该策略总是最优的B.占优策略是指在任何情况下都能带来最高收益的策略C.占优策略是指在该博弈中所有参与者都采用的最优策略D.占优策略是指在该博弈中唯一能使参与者获得正收益的策略答案：【A】解析：占优策略是指在给定其他参与者策略的情况下，该策略总是能给参与者带来最高收益的策略。B选项错误，因为占优策略是相对其他策略而言的，不是绝对的；C选项错误，占优策略是针对特定参与者而言的，不是所有参与者；D选项错误，占优策略不一定带来正收益，只是相对其他策略更好。3.在完全信息静态博弈中，下列说法正确的是：A.所有参与者都知道博弈的结构和收益函数B.参与者同时选择自己的策略C.参与者可以观察到其他参与者的选择D.参与者在选择策略时知道其他参与者的选择答案：【A】解析：完全信息静态博弈是指所有参与者都知道博弈的结构和收益函数，同时选择自己的策略，且在选择策略时不知道其他参与者的选择。B选项不完全，因为完全信息静态博弈还需要信息完全的条件；C选项错误，因为在静态博弈中，参与者无法观察到其他参与者的选择；D选项错误，因为在静态博弈中，参与者不知道其他参与者的选择。4.下列博弈中，属于零和博弈的是：A.囚徒困境B.石头剪刀布C.商家定价竞争D.公共资源博弈答案：【B】解析：零和博弈是指一方的收益等于另一方的损失，所有参与者的收益总和为零。石头剪刀布是典型的零和博弈，因为一方的胜利意味着另一方的失败。囚徒困境和公共资源博弈是非零和博弈；商家定价竞争通常也是非零和博弈。5.在序贯博弈中，下列说法正确的是：A.参与者同时选择策略B.参与者可以观察到之前参与者的选择C.所有参与者都知道其他参与者的收益函数D.博弈的结果与参与者选择的顺序无关答案：【B】解析：序贯博弈是指参与者按一定顺序依次选择策略，且后行动的参与者可以观察到之前参与者的选择。A选项错误，序贯博弈不是同时选择策略；C选项描述的是完全信息，不是序贯博弈的必要条件；D选项错误，序贯博弈中行动顺序对结果有重要影响。6.在贝叶斯博弈中，下列说法正确的是：A.所有参与者都知道所有参与者的类型B.参与者的类型是公共知识C.参与者知道自己的类型，但不知道其他参与者的确切类型D.参与者不知道任何参与者的类型答案：【C】解析：贝叶斯博弈是指参与者知道自己的类型，但不知道其他参与者的确切类型，只能对其他参与者的类型有先验信念。A和B选项错误，因为如果所有参与者都知道所有参与者的类型，那就不是贝叶斯博弈；D选项错误，因为参与者至少知道自己的类型。7.下列关于子博弈精炼纳什均衡的说法中，正确的是：A.子博弈精炼纳什均衡是纳什均衡的子集B.子博弈精炼纳什均衡剔除了不可信的威胁C.所有博弈都存在子博弈精炼纳什均衡D.子博弈精炼纳什均衡只适用于静态博弈答案：【A】解析：子博弈精炼纳什均衡是纳什均衡的子集，它要求参与者的策略在每一个子博弈中都是纳什均衡。B选项不完全，因为子博弈精炼纳什均衡剔除了不可信的威胁，但不仅仅是这一点；C选项错误，并非所有博弈都存在子博弈精炼纳什均衡；D选项错误，子博弈精炼纳什均衡主要适用于动态博弈。8.在重复博弈中，下列说法正确的是：A.重复博弈的均衡结果与一次性博弈相同B.重复博弈中，参与者可能采取不同于一次性博弈的策略C.重复博弈中，参与者无法建立声誉D.重复博弈的收益等于各阶段博弈收益之和答案：【B】解析：重复博弈中，由于未来博弈的影响，参与者可能采取不同于一次性博弈的策略，如触发策略等。A选项错误，重复博弈的均衡结果通常与一次性博弈不同；C选项错误，重复博弈中参与者可以建立声誉；D选项错误，重复博弈的收益计算方式取决于贴现因子等因素。9.下列关于混合策略纳什均衡的说法中，正确的是：A.混合策略纳什均衡中，参与者以确定的概率选择各个纯策略B.所有博弈都存在混合策略纳什均衡C.混合策略纳什均衡中，参与者随机选择策略D.混合策略纳什均衡一定优于纯策略纳什均衡答案：【A】解析：混合策略纳什均衡中，参与者以确定的概率选择各个纯策略，使得其他参与者无法通过改变策略而获益。B选项错误，并非所有博弈都存在混合策略纳什均衡；C选项不完全，混合策略不是简单的随机选择，而是以特定概率分布选择；D选项错误，混合策略纳什均衡不一定优于纯策略纳什均衡。10.在信号博弈中，下列说法正确的是：A.信号发送者先行动，信号接收者后行动B.信号接收者无法观察到信号发送者的类型C.信号发送者通过发送信号来传递自己的类型信息D.信号博弈总是存在完美贝叶斯均衡答案：【A】解析：信号博弈中，信号发送者先行动，选择发送信号，信号接收者后行动，根据观察到的信号选择行动。B选项错误，信号接收者可以观察到信号，但不知道发送者的确切类型；C选项不完全，信号发送者发送信号可能是为了传递类型信息，也可能是为了其他目的；D选项错误，并非所有信号博弈都存在完美贝叶斯均衡。二、填空题（15分）1.在博弈论中，如果无论其他参与者采取什么策略，某个策略总是能给参与者带来最高收益，那么这个策略被称为______。答案：【占优策略】解析：占优策略是指在给定其他参与者策略的情况下，该策略总是能给参与者带来最高收益的策略。这是博弈论中的基本概念，理解占优策略对于分析博弈均衡至关重要。易错警示：占优策略是相对其他策略而言的，不是绝对的"最好"策略，而是相对于其他参与者的策略组合而言的最优策略。2.在完全信息静态博弈中，如果每个参与者的策略都是对其他参与者策略的最优反应，那么这个策略组合被称为______。答案：【纳什均衡】解析：纳什均衡是指在给定其他参与者策略的情况下，没有任何参与者可以通过单方面改变自己的策略而获得更好的结果。这是博弈论中最核心的概念之一，广泛应用于各种经济、政治和社会问题的分析中。定义：纳什均衡是一种策略组合，其中每个参与者的策略都是对其他参与者策略的最优反应。3.在动态博弈中，如果某个策略组合在每一个子博弈中都是纳什均衡，那么这个策略组合被称为______。答案：【子博弈精炼纳什均衡】解析：子博弈精炼纳什均衡是纳什均衡的精炼，它要求参与者的策略在每一个子博弈中都是纳什均衡。这个概念由塞尔顿提出，用于解决动态博弈中纳什均衡可能包含不可信威胁的问题。公式：如果策略组合s是子博弈精炼纳什均衡，那么对于每一个子博弈G'，s在G'中的限制都是G'的纳什均衡。4.在不完全信息博弈中，参与者根据对其他参与者类型的先验信念和观察到的行动，更新对其他参与者类型的判断，这个过程称为______。答案：【贝叶斯更新】解析：贝叶斯更新是指参与者根据观察到的新的信息，利用贝叶斯法则更新自己对他人的信念。这是处理不完全信息博弈的关键方法，使得参与者能够在信息不完全的情况下做出最优决策。计算过程：如果参与者i的先验信念为P(θi|θ-i)，观察到行动a后，后验信念为P(θi|a,θ-i)=P(a|θi,θ-i)P(θi|θ-i)/P(a|θ-i)，其中P(a|θi,θ-i)是给定类型θi时采取行动a的概率。5.在重复博弈中，参与者通过采取"如果你合作，我也合作；如果你背叛，我将永远背叛"的策略来维持合作，这种策略称为______。答案：【触发策略】解析：触发策略是一种在重复博弈中维持合作的有效策略，它以合作开始，但如果对方背叛，则永远采取背叛策略作为惩罚。这种策略能够通过威胁未来惩罚来促使合作。特点：触发策略具有"冷酷"特性，一旦对方背叛，合作就永久结束。6.在博弈论中，如果博弈的收益满足一方的收益等于另一方的损失，所有参与者的收益总和为零，那么这种博弈被称为______。答案：【零和博弈】解析：零和博弈是指一方的收益等于另一方的损失，所有参与者的收益总和为零的博弈。在这种博弈中，参与者的利益是完全对立的，一方的获益意味着另一方的损失。应用场景：零和博弈常见于体育比赛、棋类游戏等纯粹的竞争情境。7.在不完全信息博弈中，参与者知道自己的类型，但不知道其他参与者的确切类型，只能对其他参与者的类型有先验信念，这种博弈称为______。答案：【贝叶斯博弈】解析：贝叶斯博弈是指参与者知道自己的类型，但不知道其他参与者的确切类型，只能对其他参与者的类型有先验信念的博弈。这种博弈由海萨尼提出，通过引入虚拟参与者"自然"来处理不完全信息问题。定义：贝叶斯博弈是一种包含类型、信念和策略的不完全信息博弈模型。8.在信号博弈中，信号发送者通过发送信号来传递自己的类型信息，信号接收者根据观察到的信号选择行动，这种均衡称为______。答案【完美贝叶斯均衡】解析：完美贝叶斯均衡是信号博弈中的均衡概念，它要求信号发送者的策略是最优的，信号接收者的策略是最优的，并且信号接收者的信念是利用贝叶斯法则从先验信念和信号发送者的策略中推导出来的。公式：如果(s,a,b)是完美贝叶斯均衡，那么对于所有信号发送者的类型θ，s(θ)是最优的；对于所有信号m，a(m)是最优的；对于所有信号m和类型θ，b(θ|m)满足贝叶斯法则。9.在博弈论中，如果某个策略组合使得所有参与者的收益都至少不低于其他任何策略组合，那么这个策略组合被称为______。答案：【帕累托最优策略组合】解析：帕累托最优策略组合是指在不损害任何参与者利益的情况下，无法提高至少一个参与者收益的策略组合。这是博弈论中的重要效率概念，用于评估博弈结果的公平性和效率。特点：帕累托最优策略组合是有效率的，但可能不是公平的。10.在博弈论中，如果某个策略组合使得每个参与者的收益都至少不低于该参与者在其他策略组合中的收益，那么这个策略组合被称为______。答案：【个体理性策略组合】解析：个体理性策略组合是指每个参与者的收益都至少不低于该参与者在其他策略组合中的收益的策略组合。这保证了每个参与者都有动力参与该策略组合。定义：个体理性策略组合满足参与约束，即每个参与者都能获得至少保留效用。三、判断题（10分）1.在囚徒困境中，如果博弈只进行一次，那么纳什均衡是两人都坦白，但这个结果对双方来说都不是最优的。答案：【正确】解析：在一次性囚徒困境中，无论对方选择什么，坦白都是最优策略，因此纳什均衡是两人都坦白。然而，这个结果对双方来说都是次优的，因为如果两人都选择沉默，各自的刑期会更短。这体现了个人理性与集体理性的冲突。定义：纳什均衡是指在给定其他参与者策略的情况下，没有任何参与者可以通过单方面改变自己的策略而获得更好的结果。易错警示：纳什均衡不一定导致帕累托最优结果，这是博弈论中的一个重要洞见。2.在完全信息博弈中，所有参与者都知道博弈的结构和收益函数，但不知道其他参与者的策略。答案：【正确】解析：完全信息博弈是指所有参与者都知道博弈的结构和收益函数，但在静态博弈中，参与者不知道其他参与者的策略；在动态博弈中，参与者可以观察到之前参与者的策略。公式：完全信息博弈的条件是：对于所有参与者i，payoff函数ui(s)是公共知识。易错警示：完全信息不意味着参与者知道其他参与者的策略选择，只意味着博弈的结构和收益函数是公共知识。3.在零和博弈中，一方的收益等于另一方的损失，所有参与者的收益总和为零，因此不存在合作的可能性。答案：【错误】解析：在零和博弈中，虽然一方的收益等于另一方的损失，但参与者仍然可以通过策略选择来影响结果，甚至可以通过协商建立某种形式的合作。例如，在某些零和博弈中，参与者可以达成某种"君子协定"来避免最坏结果。定义：零和博弈是指一方的收益等于另一方的损失，所有参与者的收益总和为零的博弈。易错警示：零和博弈中仍然存在策略互动和相互影响，合作的可能性取决于具体的博弈结构和参与者的信息状况。4.在混合策略纳什均衡中，参与者以确定的概率选择各个纯策略，使得其他参与者无法通过改变策略而获益。答案：【正确】解析：混合策略纳什均衡中，参与者以确定的概率选择各个纯策略，使得其他参与者无法通过改变策略（包括改变混合策略）而获益。这是纳什均衡在混合策略空间中的自然扩展。公式：如果策略组合(s1,s2,...,sn)是混合策略纳什均衡，那么对于每个参与者i，si是对其他参与者策略组合(s-i)的最优反应。易错警示：混合策略纳什均衡不是简单的随机选择，而是以特定概率分布选择，使得其他参与者无利可图。5.在序贯博弈中，后行动的参与者可以利用先行动者的策略来推断其类型或意图，从而做出更有利的决策。答案：【正确】解析：在序贯博弈中，后行动的参与者可以观察到先行动者的策略选择，并利用这些信息来推断先行动者的类型或意图，从而做出更有利的决策。这是序贯博弈区别于静态博弈的重要特征。定义：序贯博弈是指参与者按一定顺序依次选择策略，且后行动的参与者可以观察到之前参与者的选择。应用场景：序贯博弈广泛应用于拍卖、谈判、进入博弈等经济活动中。四、名词解释题（15分）1.纳什均衡答案：【纳什均衡是指在给定其他参与者策略的情况下，没有任何参与者可以通过单方面改变自己的策略而获得更好的结果的策略组合。换句话说，纳什均衡是一种策略组合，其中每个参与者的策略都是对其他参与者策略的最优反应。纳什均衡是博弈论中最核心的概念之一，由约翰·纳什在1950年代提出。在纳什均衡中，每个参与者都认为自己的策略是最优的，因此没有动力单方面改变策略。纳什均衡的存在性和性质是博弈论研究的重要内容。定义：纳什均衡是一种策略组合s=(s1,s2,...,sn)，使得对于每个参与者i，ui(si,s-i)≥ui(si,s-i)对于所有si∈Si都成立，其中Si是参与者i的策略空间，ui是参与者i的效用函数。】解析：纳什均衡是博弈论中的基础概念，它描述了一种稳定状态，在这种状态下，没有任何参与者有动力单方面改变自己的策略。理解纳什equilibrium对于分析各种经济、政治和社会问题至关重要。公式：如果策略组合s=(s1,s2,...,sn)是纳什均衡，那么对于每个参与者i，ui(si,s-i)≥ui(si,s-i)对于所有si∈Si都成立。易错警示：纳什均衡不一定导致帕累托最优结果，如囚徒困境中纳什均衡是双方都坦白，但双方都沉默的结果对双方来说都更好。2.子博弈精炼纳什均衡答案：【子博弈精炼纳什均衡是指在动态博弈中，一个策略组合如果在每一个子博弈中都是纳什均衡，那么这个策略组合就是子博弈精炼纳什均衡。子博弈精炼纳什均衡由莱因哈德·塞尔顿在1965年提出，用于解决动态博弈中纳什均衡可能包含不可信威胁的问题。在子博弈精炼纳什均衡中，参与者的策略不仅在原博弈中是最优的，而且在每一个子博弈中都是最优的，因此剔除了那些在子博弈中不可行的威胁。定义：子博弈精炼纳什均衡是一个策略组合s，使得对于每一个子博弈G'，s在G'中的限制都是G'的纳什均衡。】解析：子博弈精炼纳什均衡是纳什均衡的精炼，它要求参与者的策略在每一个子博弈中都是纳什均衡。这个概念对于分析动态博弈非常重要，因为它剔除了那些在子博弈中不可行的威胁。计算过程：要判断一个策略组合是否是子博弈精炼纳什均衡，需要检查该策略组合在每一个子博弈中的表现，如果它在所有子博弈中都是纳什均衡，那么它就是子博弈精炼纳什均衡。易错警示：子博弈精炼纳什均衡只适用于动态博弈，在静态博弈中没有子博弈的概念，因此也不存在子博弈精炼纳什均衡。3.贝叶斯博弈答案：【贝叶斯博弈是指参与者知道自己的类型，但不知道其他参与者的确切类型，只能对其他参与者的类型有先验信念的博弈。贝叶斯博弈由约翰·海萨尼在1967年提出，通过引入虚拟参与者"自然"来处理不完全信息问题。在贝叶斯博弈中，每个参与者都有一个类型空间，类型决定了参与者的偏好和可能的策略选择。参与者根据对其他参与者类型的先验信念和观察到的行动，利用贝叶斯法则更新自己的信念。贝叶斯博弈的均衡概念是贝叶斯纳什均衡。定义：贝叶斯博弈是一个包含以下要素的博弈：(1)参与者集合N；(2)对于每个参与者i，一个类型空间Θi；(3)对于每个参与者i，一个策略空间Si(θi)，依赖于类型θi；(4)对于每个参与者i，一个效用函数ui(si,s-i,θi,θ-i)，依赖于策略和类型。】解析：贝叶斯博弈是处理不完全信息博弈的重要框架，它通过引入类型和信念来描述参与者的不确定性。在贝叶斯博弈中，参与者知道自己的类型，但不知道其他参与者的确切类型，只能通过观察到的行动来推断其他参与者的类型。公式：如果策略组合s=(s1,s2,...,sn)是贝叶斯纳什均衡，那么对于每个参与者i和每个类型θi，si(θi)是在给定其他参与者的策略s-i和类型信念下的最优反应。易错警示：贝叶斯博弈中的类型不是参与者的私人信息，而是参与者的特征，类型空间是博弈的一部分，是公共知识。4.混合策略纳什均衡答案：【混合策略纳什均衡是指参与者在纯策略空间上以概率分布的形式选择策略，使得在给定其他参与者策略的情况下，没有任何参与者可以通过改变自己的策略（包括改变混合策略）而获得更好的结果的策略组合。混合策略纳什均衡是纳什均衡在混合策略空间中的自然扩展。在混合策略纳什均衡中，参与者以确定的概率选择各个纯策略，使得其他参与者无利可图。混合策略纳什均衡的存在性是博弈论中的重要定理，由约翰·纳什证明。定义：混合策略纳什均衡是一个策略组合σ=(σ1,σ2,...,σn)，其中σi是参与者i在纯策略空间Si上的概率分布，使得对于每个参与者i，ui(σi,σ-i)≥ui(σi,σ-i)对于所有σi∈Δ(Si)都成立，其中Δ(Si)是Si上的概率分布集合。】解析：混合策略纳什均衡是博弈论中的重要概念，它扩展了纯策略纳什均衡的概念，允许参与者以概率分布的形式选择策略。在混合策略纳什均衡中，参与者以确定的概率选择各个纯策略，使得其他参与者无法通过改变策略而获益。计算过程：要找到混合策略纳什均衡，需要求解每个参与者的反应函数，找到使其他参与者无利可图的概率分布。易错警示：混合策略纳什均衡不是简单的随机选择，而是以特定概率分布选择，使得其他参与者无利可图；在混合策略纳什均衡中，参与者对各个纯策略的偏好是无差异的。5.完美贝叶斯均衡答案：【完美贝叶斯均衡是不完全信息动态博弈中的均衡概念，它要求：(1)参与者的策略是最优的；(2)参与者的信念是利用贝叶斯法则从先验信念和策略中推导出来的；(3)在每一个信息集上，给定信念，参与者的策略是最优的。完美贝叶斯均衡由大卫·克雷普斯和罗伯特·威尔逊在1982年提出，用于解决信号博弈等不完全信息动态博弈。完美贝叶斯均衡结合了贝叶斯updating和子博弈精炼的概念，是分析不完全信息动态博弈的有力工具。定义：完美贝叶斯均衡是一个策略组合、信念组合和均衡路径的集合，满足最优性、一致性和序贯理性条件。】解析：完美贝叶斯均衡是处理不完全信息动态博弈的重要概念，它结合了贝叶斯updating和子博弈精炼的思想。在完美贝叶斯均衡中，参与者根据观察到的行动和贝叶斯法则更新自己的信念，并在每一个信息集上选择最优策略。公式：如果(s,a,b)是完美贝叶斯均衡，那么对于所有信号发送者的类型θ，s(θ)是最优的；对于所有信号m，a(m)是最优的；对于所有信号m和类型θ，b(θ|m)满足贝叶斯法则。易错警示：完美贝叶斯均衡要求信念与策略一致，即信念必须是通过贝叶斯法则从先验信念和策略中推导出来的，不能是任意的。五、简答题（20分）1.解释什么是占优策略，并举例说明占优策略在博弈分析中的应用。答案：【占优策略是指在给定其他参与者策略的情况下，该策略总是能给参与者带来最高收益的策略，无论其他参与者采取什么策略。换句话说，占优策略是一种"无论对手怎么做，我这样做都是最好的"的策略。占优策略在博弈分析中非常重要，因为它可以帮助我们简化博弈分析，找出纳什均衡。例如，在囚徒困境中，无论对方选择坦白还是沉默，坦白都是占优策略，因为坦白带来的刑期总是不差于沉默（当对方坦白时，坦白判3年，沉默判5年；当对方沉默时，坦白释放，沉默判1年）。因此，囚徒困境的纳什均衡是双方都选择占优策略（坦白）。占优策略的存在使得博弈分析变得简单，因为我们可以直接找出参与者的占优策略，从而预测博弈的结果。】解析：占优策略是博弈论中的基础概念，它描述了一种特殊策略，这种策略在任何情况下都是最优的。理解占优策略对于分析博弈和预测结果至关重要。定义：占优策略是指在给定其他参与者策略的情况下，该策略总是能给参与者带来最高收益的策略。公式：如果策略s_i是参与者i的占优策略，那么对于所有其他参与者的策略组合s_{-i}，有u_i(s_i,s_{-i})≥u_i(s_i',s_{-i})对于所有s_i'∈S_i都成立，其中S_i是参与者i的策略空间。易错警示：占优策略是相对其他策略而言的，不是绝对的"最好"策略，而是相对于其他参与者的策略组合而言的最优策略；不是所有博弈中所有参与者都有占优策略。2.解释什么是纳什均衡，并说明纳什均衡与占优策略的关系。答案：【纳什均衡是指在给定其他参与者策略的情况下，没有任何参与者可以通过单方面改变自己的策略而获得更好的结果的策略组合。换句话说，纳什均衡是一种策略组合，其中每个参与者的策略都是对其他参与者策略的最优反应。纳什均衡是博弈论中最核心的概念之一，由约翰·纳什在1950年代提出。纳什均衡与占优策略的关系是：如果一个参与者有占优策略，那么他在任何纳什均衡中都会选择这个占优策略；但是，纳什均衡不一定涉及占优策略。例如，在囚徒困境中，双方都有占优策略（坦白），因此纳什均衡是双方都选择占优策略；但在性别战博弈中，没有参与者有占优策略，但仍存在纳什均衡（如双方都选择足球或双方都选择芭蕾）。纳什均衡的存在性是博弈论中的重要定理，由约翰·纳什证明，在有限博弈中至少存在一个纳什均衡（可能需要允许混合策略）。】解析：纳什均衡是博弈论中的核心概念，它描述了一种稳定状态，在这种状态下，没有任何参与者有动力单方面改变自己的策略。理解纳什equilibrium对于分析各种经济、政治和社会问题至关重要。定义：纳什均衡是一种策略组合s=(s1,s2,...,sn)，使得对于每个参与者i，ui(si,s-i)≥ui(si,s-i)对于所有si∈Si都成立，其中Si是参与者i的策略空间，ui是参与者i的效用函数。易错警示：纳什均衡不一定导致帕累托最优结果，如囚徒困境中纳什均衡是双方都坦白，但双方都沉默的结果对双方来说都更好；纳什均衡可能不止一个，博弈可能有多个纳什均衡。3.解释什么是子博弈精炼纳什均衡，并说明为什么需要子博弈精炼纳什均衡。答案：【子博弈精炼纳什均衡是指在动态博弈中，一个策略组合如果在每一个子博弈中都是纳什均衡，那么这个策略组合就是子博弈精炼纳什均衡。子博弈精炼纳什均衡由莱因哈德·塞尔顿在1965年提出。我们需要子博弈精炼纳什均衡的原因是：在动态博弈中，纳什均衡可能包含不可信的威胁。例如，在进入阻挠博弈中，在位者可能威胁"如果你进入，我将进行价格战"，这个威胁在纳什均衡中是可信的，但实际上，如果进入者真的进入了，在位者进行价格战并不是最优选择，因为价格战会损害在位者的利益。子博弈精炼纳什均衡剔除了这种不可信的威胁，因为它要求参与者的策略在每一个子博弈中都是最优的，而不是仅仅在原博弈中是最优的。子博弈精炼纳什均衡通过逆向归纳法求解，从博弈的最后阶段开始，逐步向前推导，确保每个决策点上的策略都是最优的。】解析：子博弈精炼纳什均衡是纳什均衡的精炼，它要求参与者的策略在每一个子博弈中都是纳什均衡。这个概念对于分析动态博弈非常重要，因为它剔除了那些在子博弈中不可行的威胁。计算过程：要判断一个策略组合是否是子博弈精炼纳什均衡，需要检查该策略组合在每一个子博弈中的表现，如果它在所有子博弈中都是纳什均衡，那么它就是子博弈精炼纳什均衡。易错警示：子博弈精炼纳什均衡只适用于动态博弈，在静态博弈中没有子博弈的概念，因此也不存在子博弈精炼纳什均衡；子博弈精炼纳什均衡的存在性依赖于博弈的有限性和完美信息。4.解释什么是重复博弈，并说明重复博弈如何促进合作。答案：【重复博弈是指同一个博弈被重复进行多次的博弈。在重复博弈中，参与者不仅考虑当前博弈的收益，还考虑未来博弈的收益，因此他们的策略选择会受到未来博弈的影响。重复博弈可以促进合作的原因是：在重复博弈中，参与者可以通过建立声誉和实施惩罚机制来维持合作。例如，在重复的囚徒困境中，参与者可以采取"触发策略"来维持合作：开始时选择合作，如果对方合作，则继续合作；如果对方背叛，则永远背叛。这种策略通过威胁未来惩罚来促使合作，因为参与者知道背叛虽然能在当前博弈中获得短期利益，但会导致未来博弈中的损失。重复博弈促进合作的另一个机制是"声誉效应"，参与者可以通过长期合作建立良好的声誉，从而获得长期收益。重复博弈的均衡结果通常与一次性博弈不同，因为参与者考虑了长期利益。】解析：重复博弈是博弈论中的重要概念，它描述了同一个博弈被重复进行多次的情况。在重复博弈中，参与者不仅考虑当前博弈的收益，还考虑未来博弈的收益，因此他们的策略选择会受到未来博弈的影响。定义：重复博弈是指同一个博弈被重复进行多次的博弈，可以分为有限次重复博弈和无限次重复博弈。公式：在无限次重复博弈中，参与者i的贴现总收益为U_i=Σ(δ^tu_i^t)，其中u_i^t是参与者在第t阶段的收益，δ是贴现因子（0<δ<1）。易错警示：重复博弈促进合作的前提是参与者有足够的耐心（即贴现因子足够大），否则参与者可能更关注短期利益而选择背叛；在有限次重复博弈中，如果博弈次数是公共知识，那么最后一次博弈的纳什均衡与一次性博弈相同，这可能导致逆向归纳和合作崩溃。六、计算题（10分）1.考虑以下博弈矩阵，参与者1和参与者2同时选择策略A或B：参与者2AB参与者1A3,30,4B4,01,1请计算：(1)参与者1和参与者2的占优策略；(2)该博弈的纳什均衡；(3)如果博弈重复进行两次，参与者1采用"先选择A，如果对方选择A则继续选择A，如果对方选择B则选择B"的策略，参与者2采用"先选择A，如果对方选择A则继续选择A，如果对方选择B则永远选择B"的策略，计算两个参与者的总收益（假设贴现因子为0.9）。答案：【(1)参与者1的占优策略是B，因为无论参与者2选择A还是B，选择B都能给参与者1带来更高的收益（当参与者2选择A时，B的收益4大于A的收益3；当参与者2选择B时，B的收益1大于A的收益0）。参与者2的占优策略是B，因为无论参与者1选择A还是B，选择B都能给参与者2带来更高的收益（当参与者1选择A时，B的收益4大于A的收益3；当参与者1选择B时，B的收益1大于A的收益0）。(2)该博弈的纳什均衡是双方都选择B，因为这是双方占优策略的组合，且没有参与者有动力单方面改变策略。(3)在第一次博弈中，参与者1选择A，参与者2选择A，收益分别为3和3。在第二次博弈中，由于对方在第一次都选择了A，参与者1继续选择A，参与者2继续选择A，收益分别为3和3。考虑贴现因子0.9，参与者1的总收益为3+0.9×3=5.7，参与者2的总收益为3+0.9×3=5.7。】解析：这道题目考察了占优策略、纳什均衡和重复博弈的计算。首先，我们分析占优策略：参与者1选择B的收益总是不低于选择A的收益（4≥3且1≥0），因此B是参与者1的占优策略；同理，参与者2的占优策略也是B。纳什均衡是双方都选择B，因为这是双方占优策略的组合。在重复博弈中，我们计算贴现总收益：参与者1的总收益为3（第一次）+0.9×3（第二次）=5.7，参与者2的总收益同样为5.7。计算过程：贴现总收益=当前收益+贴现因子×未来收益。易错警示：在计算重复博弈的收益时，需要考虑贴现因子，即未来收益需要乘以贴现因子；在分析占优策略时，需要比较所有策略组合下的收益，而不仅仅是部分策略组合。2.考虑以下信号博弈：发送者有两种类型θ1和θ2，每种类型的概率都是0.5；发送者可以发送信号m1或m2；接收者根据观察到的信号选择行动a1或a2。收益函数如下：当发送者类型为θ1时：-如果发送m1，接收者选择a1，收益为(2,1)；接收者选择a2，收益为(0,0)-如果发送m2，接收者选择a1，收益为(1,0)；接收者选择a2，收益为(0,1)当发送者类型为θ2时：-如果发送m1，接收者选择a1，收益为(0,0)；接收者选择a2，收益为(1,1)-如果发送m2，接收者选择a1，收益为(0,1)；接收者选择a2，收益为(2,0)请计算：(1)发送者的最优策略；(2)接收者的最优策略；(3)该博弈的完美贝叶斯均衡。答案：【(1)发送者的最优策略：对于类型θ1，发送m1的期望收益为0.5×2+0.5×0=1，发送m2的期望收益为0.5×1+0.5×0=0.5，因此类型θ1的最优策略是发送m1；对于类型θ2，发送m1的期望收益为0.5×0+0.5×1=0.5，发送m2的期望收益为0.5×0+0.5×2=1，因此类型θ2的最优策略是发送m2。(2)接收者的最优策略：当接收到m1时，根据贝叶斯法则，发送者类型为θ1的后验概率为P(θ1|m1)=P(m1|θ1)P(θ1)/P(m1)=1×0.5/(1×0.5+1×0.5)=0.5，类型为θ2的后验概率为P(θ2|m1)=0.5；当接收到m1时，选择a1的期望收益为0.5×1+0.5×0=0.5，选择a2的期望收益为0.5×0+0.5×1=0.5，因此接收者对a1和a2是无差异的；当接收到m2时，根据贝叶斯法则，发送者类型为θ1的后验概率为P(θ1|m2)=P(m2|θ1)P(θ1)/P(m2)=1×0.5/(1×0.5+1×0.5)=0.5，类型为θ2的后验概率为P(θ2|m2)=0.5；当接收到m2时，选择a1的期望收益为0.5×0+0.5×1=0.5，选择a2的期望收益为0.5×1+0.5×0=0.5，因此接收者对a1和a2是无差异的。(3)该博弈的完美贝叶斯均衡：发送者的策略是类型θ1发送m1，类型θ2发送m2；接收者的策略是当接收到m1时随机选择a1或a2（概率各为0.5），当接收到m2时随机选择a1或a2（概率各为0.5）；接收者的信念是P(θ1|m1)=P(θ2|m1)=0.5，P(θ1|m2)=P(θ2|m2)=0.5。】解析：这道题目考察了信号博弈和完美贝叶斯均衡的计算。首先，我们计算发送者的最优策略：对于每种类型，比较发送不同信号的期望收益，选择收益最高的信号。然后，我们计算接收者的最优策略：对于每个信号，利用贝叶斯法则更新对发送者类型的信念，然后计算选择不同行动的期望收益，选择收益最高的行动。最后，我们确定完美贝叶斯均衡：发送者的策略是最优的，接收者的策略是最优的，接收者的信念与发送者的策略一致。计算过程：接收者的期望收益=ΣP(θ|m)×u(a,θ)，其中P(θ|m)是给定信号m时发送者类型为θ的后验概率，u(a,θ)是接收者选择行动a且发送者类型为θ时的收益。易错警示：在计算接收者的期望收益时，需要正确使用贝叶斯法则更新信念；在完美贝叶斯均衡中，接收者的策略必须与信念一致，即信念必须是通过贝叶斯法则从先验信念和发送者的策略中推导出来的。七、证明题（5分）证明：在有限博弈中，至少存在一个纳什均衡（可能需要允许混合策略）。答案：【证明：考虑有限博弈G=(N,(S_i)_{i∈N},(u_i)_{i∈N})，其中N是参与者集合，S_i是参与者i的策略空间，u_i是参与者i的效用函数。由于博弈是有限的，每个参与者的策略空间S_i是有限的。定义参与者i的混合策略空间Δ(S_i)为S_i上的概率分布集合。考虑参与者i的反应函数r_i:Δ(S_{-i})→Δ(S_i)，其中Δ(S_{-i})是其他参与者混合策略空间的乘积，对于每个混合策略组合σ_{-i}∈Δ(S_{-i})，r_i(σ_{-i})是参与者i对σ_{-i}的最优反应集合。由于S_i是有限的，Δ(S_i)是紧致的（有限维单纯形的闭子集），且u_i是连续的，因此反应映射r_i是上半连续的（对应关系）。根据角谷不动点定理，

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论考研试题及答案

文档简介

温馨提示

最新文档

评论

博弈论考研试题及答案

文档简介

温馨提示

最新文档

评论

相关文档