博弈论战略分析题库答案_第1页
博弈论战略分析题库答案_第2页
博弈论战略分析题库答案_第3页
博弈论战略分析题库答案_第4页
博弈论战略分析题库答案_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论战略分析题库答案一、选择题(共60分)1.在博弈论中,纳什均衡是指()A.所有参与者的策略都是最优的B.参与者无法通过单方面改变策略而获益C.所有参与者都选择相同的策略D.博弈的结果对所有参与者都是公平的答案:B。纳什均衡是指在给定其他参与者策略的情况下,每个参与者的策略都是最优的,即没有人可以通过单方面改变自己的策略而获得更好的结果。选项A不完全正确,因为纳什均衡只要求在给定其他参与者策略的情况下,自己的策略是最优的,而不是所有策略都是最优的。选项C错误,因为参与者可以选择不同的策略。选项D错误,因为纳什均衡不一定保证公平性。2.下列哪项不是博弈论的基本要素?()A.参与者B.策略C.支付D.时间限制答案:D。博弈论的基本要素包括参与者、策略和支付。时间限制不是博弈论的基本要素,尽管在某些博弈中时间可能会影响策略选择,但它不是构成博弈的基本要素。3.在囚徒困境中,如果两名囚犯都选择合作,结果会是()A.两人都获得最轻的惩罚B.两人都获得最重的惩罚C.一人获得较轻惩罚,一人获得较重惩罚D.无法确定答案:A。在标准的囚徒困境中,如果两名囚犯都选择合作(都不坦白),他们通常会获得比都背叛(坦白)时更轻的惩罚。这是因为如果双方都不坦白,检方可能无法获得足够的证据来定罪,或者只能以较轻的罪名起诉。然而,由于个体理性导致的结果是双方都选择背叛,最终导致次优结果。4.占优策略是指()A.在任何情况下都最优的策略B.只在某些情况下最优的策略C.比其他策略平均收益更高的策略D.最复杂的策略答案:A。占优策略是指在无论其他参与者选择什么策略的情况下,该策略都能带来最优结果的策略。换句话说,占优策略是在所有可能的情况下都是最优的。5.在零和博弈中,下列说法正确的是()A.所有参与者的总收益为零B.所有参与者的总收益为常数C.一个参与者的收益等于另一个参与者的损失D.参与者之间不存在竞争关系答案:C。在零和博弈中,一个参与者的收益等于其他参与者的损失总和,即所有参与者的净收益为零。选项A不完全准确,因为零和博弈指的是净收益为零,而不是每个参与者的收益都为零。选项B描述的是常和博弈。选项D错误,因为零和博弈是高度竞争的博弈形式。6.在重复博弈中,"以牙还牙"策略是指()A.始终选择合作B.始终选择背叛C.第一轮选择合作,之后复制对手上一轮的行动D.随机选择合作或背叛答案:C。"以牙还牙"策略是一种在重复博弈中常用的策略,它首先选择合作,然后在后续的回合中复制对手在上一轮的行动。这种策略既展示了合作的意愿,又对背叛行为进行了惩罚,有助于促进合作。7.下列哪种博弈类型中,参与者同时选择策略?()A.静态博弈B.动态博弈C.序贯博弈D.重复博弈答案:A。静态博弈是指参与者同时选择策略,且不知道其他参与者的选择。动态博弈、序贯博弈和重复博弈都涉及时间因素,参与者可以根据之前的信息调整策略。8.在不完全信息博弈中,参与者通常需要考虑()A.对手的类型B.对手的偏好C.对手的策略D.以上都是答案:D。在不完全信息博弈中,参与者通常不知道对手的某些关键信息,如类型、偏好或策略。因此,他们需要考虑这些未知因素,并通过贝叶斯法则等工具进行推理。9.子博弈精炼纳什均衡是针对哪种博弈提出的?()A.静态博弈B.动态博弈C.不完全信息博弈D.零和博弈答案:B。子博弈精炼纳什均衡是由泽尔腾(Selten)针对动态博弈提出的一个概念,它排除了那些在子博弈中不是纳什均衡的策略组合,从而更准确地描述了动态博弈中的理性行为。10.在贝叶斯博弈中,参与者如何更新自己的信念?()A.通过贝叶斯法则B.通过最大最小化原则C.通过纳什均衡D.通过占优策略答案:A。在贝叶斯博弈中,参与者通过贝叶斯法则来更新自己的信念。贝叶斯法则是一种概率推理方法,允许参与者根据观察到的信息来更新对对手类型的概率分布。11.下列哪个概念描述了博弈中所有参与者都无法通过单方面改变策略而获益的状态?()A.帕累托最优B.纳什均衡C.占优策略均衡D.子博弈精炼纳什均衡答案:B。纳什均衡描述了这样一种状态:在给定其他参与者策略的情况下,每个参与者的策略都是最优的,即没有人可以通过单方面改变策略而获得更好的结果。帕累托最优关注的是效率,而非策略稳定性。占优策略均衡是纳什均衡的一种特殊情况。子博弈精炼纳什均衡是动态博弈中的纳什均衡。12.在序贯博弈中,参与者通常使用什么工具来分析最优策略?()A.收益矩阵B.博弈树C.贝叶斯网络D.线性规划答案:B。序贯博弈涉及时间因素,参与者依次行动,因此通常使用博弈树来表示和分析。博弈树可以清晰地展示博弈的顺序、行动和结果。收益矩阵更适合表示静态博弈。贝叶斯网络用于处理不确定性,线性规划用于优化问题。13.下列哪种情况会导致囚徒困境中的合作更难维持?()A.博弈次数增加B.参与者之间的未来互动可能性降低C.参与者之间的沟通增加D.惩罚机制加强答案:B。在囚徒困境中,如果参与者之间的未来互动可能性降低(即博弈次数少或参与者可能不再相遇),合作更难维持,因为背叛的短期收益可能超过合作的长期收益。相反,增加博弈次数、加强沟通和惩罚机制都有助于促进合作。14.在信号博弈中,信号发送者通常希望()A.最大化自己的信息B.最小化自己的信息C.传递对自己有利的信息D.隐藏自己的类型答案:C。在信号博弈中,信号发送者通常希望通过传递信号来影响信号接收者的行为,从而最大化自己的收益。这通常涉及传递对自己有利的信息,尽管有时也可能需要传递真实信息以建立信誉。15.下列哪种博弈理论模型最适合分析市场竞争?()A.囚徒困境B.拍卖理论C.进化博弈论D.合作博弈论答案:B。拍卖理论专门用于分析市场中的竞价和竞争行为,因此最适合分析市场竞争。囚徒困境可以用来解释为什么企业可能选择不合作,但不如拍卖理论直接。进化博弈论关注策略的动态演化,合作博弈论研究参与者如何形成合作联盟。16.在讨价还价博弈中,纳什讨价还价解满足哪个性质?()A.帕累托最优B.对称性C.不相关选项的独立性D.以上都是答案:D。纳什讨价还价解满足多个性质,包括帕累托最优(即没有其他分配方式能让一方获益而不损害另一方)、对称性(如果问题对称,解也对称)以及不相关选项的独立性(添加或删除不影响最终结果的选项不会改变解)。17.下列哪种情况下,占优策略均衡一定存在?()A.所有参与者都有占优策略B.博弈是零和的C.博弈是完全信息的D.博弈是静态的答案:A。只有当所有参与者都有占优策略时,占优策略均衡才存在。零和博弈、完全信息博弈和静态博弈都不保证占优策略均衡的存在。18.在演化博弈论中,演化稳定策略(ESS)是指()A.在任何情况下都优于其他策略的策略B.能够抵御小规模入侵的策略C.在长期演化中占主导地位的策略D.被大多数参与者采用的策略答案:B。演化稳定策略(ESS)是指这样一种策略:如果整个种群都采用该策略,那么任何小比例的突变策略都无法成功入侵。这并不意味着该策略在任何情况下都优于其他策略,也不一定是长期演化中占主导地位或被大多数参与者采用的策略。19.下列哪种博弈类型中,参与者可以形成bindingagreements?()A.非合作博弈B.合作博弈C.零和博弈D.非零和博弈答案:B。在合作博弈中,参与者可以形成有约束力的协议(bindingagreements),从而协调行动以实现共同利益。非合作博弈中,参与者不能形成有约束力的协议。零博弈和非零博弈是按照总收益是否为零来分类的,与合作或非合作无关。20.在博弈论中,"颤抖手完美均衡"是指()A.参与者手部颤抖导致策略选择错误B.考虑参与者可能犯错的均衡概念C.参与者故意选择次优策略以迷惑对手D.参与者选择风险最小的策略答案:B。颤抖手完美均衡是由泽尔腾提出的均衡概念,它考虑了参与者可能会犯错误(就像手部颤抖一样)的情况,排除了那些依赖于对手永远不会犯错的不合理均衡。二、填空题(共30分)1.在博弈论中,参与者同时选择策略的博弈称为______博弈。答案:静态。静态博弈是指参与者同时选择策略,且不知道其他参与者的选择。与之相对的是动态博弈,参与者依次行动。2.囚徒困境中,从个体理性出发,每个参与者都会选择______策略,但这导致了______的结果。答案:背叛;集体非理性。在囚徒困境中,从个体理性出发,每个参与者都会选择背叛策略,因为这无论对方选择什么都能带来更好的个人结果。然而,当所有参与者都这样做时,导致了集体非理性的结果,即双方都获得比合作时更差的收益。3.纳什均衡是一种策略组合,其中每个参与者的策略都是在给定______的情况下最优的。答案:其他参与者的策略。纳什均衡的关键特征是,在给定其他参与者策略的情况下,每个参与者的策略都是最优的,即没有人可以通过单方面改变策略而获得更好的结果。4.在重复博弈中,______是指参与者根据对手的历史行为来调整自己的策略。答案:策略互动。策略互动是指参与者根据对手的历史行为来调整自己的策略。在重复博弈中,这种互动可能导致合作的出现,因为参与者可能会为了未来的回报而选择合作。5.博弈论中的"信息集"是指参与者在决策时______。答案:知道的信息集合。信息集是指参与者在决策时知道的所有信息的集合,包括其他参与者的可能类型、历史行动等。在不完全信息博弈中,信息集可能包含多种可能性。6.在动态博弈中,______是指从一个节点开始并包含后续所有节点的子博弈。答案:子博弈。子博弈是从原博弈的某个节点开始,并包含该节点之后所有节点的子树。子博弈精炼纳什均衡要求均衡策略在每个子博弈中都是纳什均衡。7.在贝叶斯博弈中,参与者使用______来根据观察到的信息更新自己的信念。答案:贝叶斯法则。贝叶斯法则是一种概率推理方法,允许参与者根据观察到的信息来更新对对手类型的概率分布。这在处理不完全信息博弈时非常重要。8.在拍卖理论中,______是指出价最高的竞拍者获得物品并支付自己的出价。答案:第一价格拍卖。第一价格拍卖是拍卖的一种形式,其中出价最高的竞拍者获得物品并支付自己的出价。与之相对的是第二价格拍卖,其中获胜者支付第二高的出价。9.在讨价还价博弈中,______是指双方无法通过进一步谈判而使一方获益而不损害另一方。答案:帕累托最优。帕累托最优是指一种状态,在这种状态下,无法通过重新分配资源使一方获益而不损害另一方。在讨价还价博弈中,帕累托最优的分配是那些无法通过进一步谈判而改进的分配。10.在信号博弈中,信号发送者通过传递______来影响信号接收者的行为。答案:信号。在信号博弈中,信号发送者通过传递信号来影响信号接收者的行为。信号可以是各种形式,如价格、广告、承诺等,目的是向接收者传递关于发送者类型的信息。11.在合作博弈中,______是指参与者能够形成有约束力的协议。答案:联盟形成能力。联盟形成能力是指参与者能够形成有约束力的协议,从而协调行动以实现共同利益。这是合作博弈与非合作博弈的主要区别。12.在演化博弈论中,______是指能够抵御小规模入侵的策略。答案:演化稳定策略(ESS)。演化稳定策略(ESS)是指这样一种策略:如果整个种群都采用该策略,那么任何小比例的突变策略都无法成功入侵。这是演化博弈论中的一个重要概念。13.在博弈论中,______是指参与者的策略依赖于历史行动的博弈。答案:重复博弈。重复博弈是指同一博弈被多次进行的博弈,参与者的策略可以依赖于历史行动。这种重复互动可能导致合作的出现,即使是在一次性囚徒困境中不会合作的参与者。14.在不完全信息博弈中,______是指参与者对其他参与者的特征、偏好或策略缺乏了解。答案:信息不对称。信息不对称是指参与者对其他参与者的特征、偏好或策略缺乏了解。这可能导致逆向选择和道德风险等问题。15.在零和博弈中,一个参与者的收益等于______。答案:其他参与者的损失总和。在零和博弈中,一个参与者的收益等于其他参与者的损失总和,即所有参与者的净收益为零。这反映了完全竞争的情况。三、判断题(共20分)1.在任何博弈中,纳什均衡都一定存在。答案:错误。并非所有博弈都存在纳什均衡。例如,在某些博弈中,可能不存在纯策略纳什均衡,但可能存在混合策略纳什均衡。根据纳什的存在性定理,在有限博弈中,至少存在一个纳什均衡(可能是混合策略的)。2.占优策略均衡一定是帕累托最优的。答案:错误。占优策略均衡不一定是帕累托最优的。以囚徒困境为例,占优策略均衡(双方都背叛)不是帕累托最优的,因为双方都合作的结果对双方都更好。3.在重复博弈中,参与者一定会选择合作策略。答案:错误。在重复博弈中,参与者不一定总是选择合作策略。合作的出现取决于博弈的重复次数、参与者对未来互动的重视程度以及博弈的结构等因素。如果博弈只进行一次,或者参与者对未来不重视,合作可能不会出现。4.动态博弈中,子博弈精炼纳什均衡一定是纳什均衡。答案:正确。子博弈精炼纳什均衡是纳什均衡的精炼,它要求均衡策略不仅在原博弈中是纳什均衡,而且在每个子博弈中都是纳什均衡。因此,任何子博弈精炼纳什均衡都一定是纳什均衡。5.在不完全信息博弈中,参与者无法形成任何关于对手的信念。答案:错误。在不完全信息博弈中,参与者可以形成关于对手的信念,尽管这些信念可能是不完整的。参与者通常使用贝叶斯法则来根据观察到的信息更新自己的信念。6.在零和博弈中,所有参与者的总收益为零。答案:正确。在零和博弈中,一个参与者的收益等于其他参与者的损失总和,因此所有参与者的净收益为零。例如,在棋类游戏中,一方的胜利意味着另一方的失败。7.纳什讨价还价解总是对称的,无论讨价还价问题是否对称。答案:错误。纳什讨价还价解在问题对称时才是对称的。如果讨价还价问题不对称,纳什讨价还价解也会不对称,反映参与者的相对bargainingpower。8.在演化博弈论中,演化稳定策略(ESS)一定是纳什均衡。答案:正确。演化稳定策略(ESS)一定是纳什均衡。这是因为如果整个种群都采用ESS,那么任何小比例的突变策略都无法获得更高的收益,这与纳什均衡的定义一致。9.在合作博弈中,参与者不能形成有约束力的协议。答案:错误。在合作博弈中,参与者可以形成有约束力的协议,这是与非合作博弈的主要区别。在非合作博弈中,参与者不能形成有约束力的协议,只能独立决策。10.在静态博弈中,参与者依次选择策略。答案:错误。在静态博弈中,参与者同时选择策略,或者至少在选择时不知道其他参与者的选择。与之相对的是动态博弈,参与者依次行动。四、简答题(共50分)1.请解释纳什均衡的概念,并举例说明。答案:纳什均衡是指在给定其他参与者策略的情况下,每个参与者的策略都是最优的,即没有人可以通过单方面改变策略而获得更好的结果。换句话说,在纳什均衡中,所有参与者的策略都是相互最优的回应。以囚徒困境为例:-两名囚犯被分开审讯,不能交流-每个囚犯都有两个选择:坦白(背叛)或保持沉默(合作)-如果都保持沉默,各判1年-如果一人坦白一人沉默,坦白者释放,沉默者判10年-如果都坦白,各判5年这个博弈的收益矩阵如下:```囚徒B沉默坦白囚徒A沉默(-1,-1)(-10,0)坦白(0,-10)(-5,-5)```在这个博弈中,无论囚徒B选择什么,囚徒A选择坦白(背叛)都会获得更好的结果(如果B沉默,A坦白获得0>-1;如果B坦白,A坦白获得-5>-10)。同样,无论囚徒A选择什么,囚徒B选择坦白都会获得更好的结果。因此,(坦白,坦白)是这个博弈的纳什均衡。然而,这个纳什均衡不是帕累托最优的,因为如果双方都选择沉默,各判1年,对双方都更好。这展示了个体理性与集体理性之间的冲突。2.比较静态博弈和动态博弈的区别,并举例说明。答案:静态博弈和动态博弈的主要区别在于参与者选择策略的时间和顺序:1.时间因素:-静态博弈:参与者同时选择策略,或至少在选择时不知道其他参与者的选择-动态博弈:参与者依次选择策略,后行动者可以观察到先行动者的选择2.信息结构:-静态博弈:参与者选择策略时不知道其他参与者的选择-动态博弈:后行动者知道先行动者的选择,但可能不知道先行动者的类型(在不完全信息动态博弈中)3.表示方法:-静态博弈:通常用收益矩阵表示-动态博弈:通常用博弈树表示4.均衡概念:-静态博弈:纳什均衡-动态博弈:子博弈精炼纳什均衡举例说明:静态博弈例子:囚徒困境如前所述,两名囚犯同时选择是否坦白,不知道对方的选择。用收益矩阵表示。动态博弈例子:市场进入博弈-在位者(现有企业)和潜在进入者(新企业)进行博弈-潜在进入者首先决定是否进入市场-如果进入,在位者决定是斗争(如降价)或默许-如果不进入,在位者获得垄断利润,进入者获得0-如果进入且在位者默许,双方分享市场利润-如果进入且在位者斗争,双方都遭受损失这个博弈可以用博弈树表示:```进入/\/\默许斗争/\/\(2,1)(-1,-1)```在这个动态博弈中,子博弈精炼纳什均衡是潜在进入者选择进入,在位者选择默许。这是因为如果进入,在位者选择默许(1>-1)是最优的;既然在位者会默许,进入者选择进入(2>0)是最优的。3.解释什么是占优策略,并分析占优策略均衡与纳什均衡的关系。答案:占优策略是指在无论其他参与者选择什么策略的情况下,该策略都能带来最优结果的策略。换句话说,占优策略是在所有可能的情况下都是最优的。占优策略均衡是指当所有参与者都选择占优策略时形成的均衡。如果博弈中所有参与者都有占优策略,那么这些占优策略组合就是占优策略均衡。占优策略均衡与纳什均衡的关系:1.占优策略均衡是纳什均衡的一种特殊情况2.如果一个博弈有占优策略均衡,那么这个均衡一定是纳什均衡3.但并非所有纳什均衡都是占优策略均衡4.存在纳什均衡的博弈不一定有占优策略均衡举例说明:囚徒困境中的占优策略均衡:-如前所述,在囚徒困境中,无论对方选择什么,每个参与者选择坦白都是最优的-因此,坦白是每个参与者的占优策略-(坦白,坦白)是占优策略均衡,也是纳什均衡另一个例子:```参与者B策略1策略2参与者A策略1(3,3)(1,4)策略2(4,1)(2,2)```在这个博弈中:-对于参与者A:无论B选择策略1还是策略2,A选择策略2都能获得更高的收益(4>3,2>1),因此策略2是A的占优策略-对于参与者B:无论A选择策略1还是策略2,B选择策略1都能获得更高的收益(3>1,但1<2,所以策略1不是B的占优策略)-实际上,对于B,当A选择策略1时,B选择策略1(3)优于策略2(1);但当A选择策略2时,B选择策略2(2)优于策略1(1)。因此B没有占优策略-这个博弈没有占优策略均衡,但存在纳什均衡(策略2,策略1),因为当B选择策略1时,A的最优反应是策略2;当A选择策略2时,B的最优反应是策略1这个例子表明,即使没有占优策略均衡,也可能存在纳什均衡。4.请解释什么是子博弈精炼纳什均衡,并说明其重要性。答案:子博弈精炼纳什均衡是由泽尔腾(Selten)针对动态博弈提出的一个概念,它要求均衡策略不仅在原博弈中是纳什均衡,而且在每个子博弈中都是纳什均衡。子博弈是指从一个节点开始并包含该节点之后所有节点的子树。子博弈精炼纳什均衡排除了那些依赖于"不可信威胁"的均衡,即那些要求参与者在子博弈中选择非最优行动的均衡。子博弈精炼纳什均衡的重要性:1.解决了动态博弈中的多均衡问题:动态博弈通常有多个纳什均衡,其中一些可能依赖于不可信的威胁。子博弈精炼纳什均衡通过要求在每个子博弈中都满足纳什均衡条件,排除了这些不合理的均衡。2.提高了预测的准确性:子博弈精炼纳什均衡更准确地描述了理性参与者在动态环境中的行为,因为它考虑了参与者在每个决策点的最优反应。3.考虑了时间一致性:子博弈精炼纳什均衡确保了参与者的策略是时间一致的,即即使在博弈进行到某个子博弈时,参与者仍然愿意遵循原定的策略。4.广泛应用:子博弈精炼纳什均衡在经济学、政治学、生物学等多个领域有广泛应用,如分析企业竞争、国际谈判、进化过程等。举例说明:考虑市场进入博弈:-在位者(现有企业)和潜在进入者(新企业)进行博弈-潜在进入者首先决定是否进入市场-如果进入,在位者决定是斗争或默许-如果不进入,在位者获得垄断利润10,进入者获得0-如果进入且在位者默许,双方各获得5-如果进入且在位者斗争,双方各获得-1这个博弈的博弈树如下:```进入/\/\默许斗争/\/\(5,5)(-1,-1)```不进入的收益是(10,0)这个博弈有两个纳什均衡:1.潜在进入者选择不进入,在位者选择斗争(如果进入)-这个均衡依赖于在位者"威胁"会斗争,但这个威胁是不可信的-因为如果进入,在位者选择斗争(-1)不如默许(5),所以这个威胁是不可信的-因此这不是子博弈精炼纳什均衡2.潜在进入者选择进入,在位者选择默许-这个均衡是子博弈精炼纳什均衡-因为在进入后的子博弈中,在位者选择默许是最优的-既然在位者会默许,进入者选择进入是最优的因此,子博弈精炼纳什均衡预测潜在进入者会选择进入,在位者会选择默许,这更符合理性参与者的行为。5.解释什么是贝叶斯博弈,并说明贝叶斯纳什均衡的概念。答案:贝叶斯博弈是指参与者对其他参与者的某些关键信息(如类型、偏好、策略等)不了解的博弈。在不完全信息博弈中,参与者可能有不同的"类型",每个类型对应不同的收益函数。贝叶斯博弈的基本要素包括:1.参与者2.参与者的类型空间(每个参与者可能有多种类型)3.类型的先验分布(参与者对其他参与者类型的信念)4.策略空间(依赖于类型)5.收益函数(依赖于类型和策略)贝叶斯纳什均衡是指在给定其他参与者策略和类型分布的情况下,每个参与者的策略都是最优的。具体来说,贝叶斯纳什均衡满足以下条件:1.每个参与者的策略依赖于自己的类型2.给定其他参与者的策略,每个参与者在自己可能的类型上选择最优策略3.参与者使用贝叶斯法则根据观察到的信息更新自己的信念贝叶斯纳什均衡的重要性:1.处理不完全信息:贝叶斯纳什均衡允许我们分析参与者在不完全信息条件下的最优行为2.广泛应用:贝叶斯博弈和贝叶斯纳什均衡在拍卖、谈判、机制设计等领域有广泛应用3.连接完全信息和不完全信息:贝叶斯博弈可以看作是完全信息博弈的推广,而完全信息博弈可以看作是贝叶斯博弈的特殊情况举例说明:考虑一个简单的拍卖博弈:-两个竞拍者竞拍一件物品-竞拍者1对物品的估值是v1,竞拍者2对物品的估值是v2-v1和v2是私有信息,但竞拍者知道v1和v2在[0,1]上均匀分布-竞拍者同时提交出价b1和b2-出价最高者获得物品,支付自己的出价;如果出价相同,随机决定谁获得物品在这个贝叶斯博弈中,贝叶斯纳什均衡是每个竞拍者提交等于自己对物品估值的出价(即b1=v1,b2=v2)。这是因为:1.给定其他竞拍者的出价等于其估值,自己的最优出价也是自己的估值2.如果出价低于估值,有失去物品的风险;如果出价高于估值,有亏损的风险3.因此,出价等于估值是最优的这个均衡是贝叶斯纳什均衡,因为它考虑了竞拍者对其他竞拍者估值的信念(先验分布),并且在给定这种信念的情况下,每个竞拍者的策略都是最优的。五、计算题(共60分)1.考虑以下博弈,找出所有纳什均衡(包括纯策略和混合策略):```参与者B策略1策略2参与者A策略1(3,2)(0,0)策略2(0,0)(2,3)```答案:首先,我们检查是否存在纯策略纳什均衡。-对于参与者A:-如果B选择策略1,A选择策略1(3>0)-如果B选择策略2,A选择策略2(2>0)-对于参与者B:-如果A选择策略1,B选择策略1(2>0)-如果A选择策略2,B选择策略2(3>0)因此,(策略1,策略1)和(策略2,策略2)都是纯策略纳什均衡。接下来,我们检查是否存在混合策略纳什均衡。设A选择策略1的概率为p,选择策略2的概率为1-p;设B选择策略1的概率为q,选择策略2的概率为1-q。对于参与者A,选择策略1的期望收益为:E1=3q+0(1-q)=3q选择策略2的期望收益为:E2=0q+2(1-q)=2(1-q)在混合策略均衡中,A应该使Bindifferent,因此:3q=2(1-q)3q=2-2q5q=2q=2/5对于参与者B,选择策略1的期望收益为:E1=2p+0(1-p)=2p选择策略2的期望收益为:E2=0p+3(1-p)=3(1-p)在混合策略均衡中,B应该使Aindifferent,因此:2p=3(1-p)2p=3-3p5p=3p=3/5因此,存在一个混合策略纳什均衡,其中A以3/5的概率选择策略1,2/5的概率选择策略2;B以2/5的概率选择策略1,3/5的概率选择策略2。综上所述,这个博弈有三个纳什均衡:1.纯策略纳什均衡:(策略1,策略1)2.纯策略纳什均衡:(策略2,策略2)3.混合策略纳什均衡:A以(3/5,2/5)的概率选择策略,B以(2/5,3/5)的概率选择策略2.考虑以下动态博弈,使用逆向归纳法找出子博弈精炼纳什均衡:```进入/\/\默许斗争/\/\(5,5)(-1,-1)```不进入的收益是(10,0)答案:我们使用逆向归纳法来找出这个动态博弈的子博弈精炼纳什均衡。首先,考虑在位者(参与者B)的决策。潜在进入者(参与者A)已经决定进入市场,在位者面临两个选择:默许或斗争。-如果在位者选择默许,收益为(5,5)-如果在位者选择斗争,收益为(-1,-1)显然,在位者会选择默许,因为5>-1。接下来,考虑潜在进入者的决策。潜在进入者知道,如果自己选择进入,在位者会选择默许,导致收益(5,5);如果自己选择不进入,收益为(10,0)。比较这两个结果:-进入:收益(5,5)-不进入:收益(10,0)潜在进入者会选择不进入,因为10>5。然而,这里有一个问题:如果潜在进入者选择进入,在位者的最优反应是默许,这意味着威胁斗争是不可信的。因此,潜在进入者应该预期到,如果自己选择进入,在位者会选择默许,从而获得收益5,而不是不进入时的收益0。因此,潜在进入者会选择进入,在位者会选择默许,形成子博弈精炼纳什均衡(进入,默许),收益为(5,5)。这个均衡是子博弈精炼的,因为它在进入后的子博弈中也是纳什均衡(在位者选择默许是最优的)。3.考虑以下不完全信息博弈,找出贝叶斯纳什均衡:参与者1有两种类型:强(S)和弱(W),每种类型的概率为1/2。参与者1知道自己的类型,但参与者2不知道。参与者2有两种策略:合作(C)和斗争(F)。收益如下:如果参与者1是强类型:```参与者2合作斗争参与者1合作(3,3)(0,0)斗争(1,1)(2,2)```如果参与者1是弱类型:```参与者2合作斗争参与者1合作(2,2)(0,0)斗争(0,0)(1,1)```答案:在这个不完全信息博弈中,参与者1有两种类型:强(S)和弱(W),每种类型的概率为1/2。参与者2不知道参与者1的具体类型,但知道类型的分布。首先,我们分析参与者1的最优策略:对于强类型的参与者1:-如果参与者2选择合作,参与者1选择斗争(1>0)是最优的-如果参与者2选择斗争,参与者1选择斗争(2>0)是最优的-因此,对于强类型的参与者1,斗争是占优策略对于弱类型的参与者1:-如果参与者2选择合作,参与者1选择合作(2>0)是最优的-如果参与者2选择斗争,参与者1选择斗争(1>0)是最优的-因此,对于弱类型的参与者1,最优策略取决于参与者2的选择接下来,我们分析参与者2的最优策略。参与者2不知道参与者1的类型,但知道类型的分布(1/2强,1/2弱)。参与者2需要根据自己的信念选择最优策略。设参与者2选择合作的概率为q,选择斗争的概率为1-q。对于强类型的参与者1,参与者2的期望收益为:E_强=3q+0(1-q)=3q对于弱类型的参与者1,参与者2的期望收益为:E_弱=2q+0(1-q)=2q由于参与者2不知道参与者1的类型,参与者2的总体期望收益为:E=(1/2)E_强+(1/2)E_弱=(1/2)3q+(1/2)2q=2.5q然而,这个计算是错误的,因为参与者2的收益取决于参与者1的策略选择。我们需要更精确地计算。假设参与者2选择合作:-如果参与者1是强类型,参与者1会选择斗争(因为1>0),参与者2的收益为1-如果参与者1是弱类型,参与者1会选择合作(因为2>0),参与者2的收益为2-因此,参与者2选择合作的期望收益为:(1/2)1+(1/2)2=1.5假设参与者2选择斗争:-如果参与者1是强类型,参与者1会选择斗争(因为2>0),参与者2的收益为2-如果参与者1是弱类型,参与者1会选择斗争(因为1>0),参与者2的收益为1-因此,参与者2选择斗争的期望收益为:(1/2)2+(1/2)1=1.5因此,参与者2对合作和斗争是无差异的,可以选择任何混合策略。现在,我们考虑参与者1的策略:对于强类型的参与者1,无论参与者2选择什么,斗争都是占优策略。对于弱类型的参与者1:-如果参与者2选择合作,参与者1选择合作(2>0)是最优的-如果参与者2选择斗争,参与者1选择斗争(1>0)是最优的因此,贝叶斯纳什均衡是:1.强类型的参与者1选择斗争2.弱类型的参与者1选择与参与者2相同的策略3.参与者2可以选择任何混合策略(因为他对合作和斗争是无差异的)特别地,一个具体的贝叶斯纳什均衡是:1.强类型的参与者1选择斗争2.弱类型的参与者1选择合作3.参与者2选择合作在这个均衡中:-给定参与者2选择合作,强类型的参与者1选择斗争是最优的-给定参与者2选择合作,弱类型的参与者1选择合作是最优的-给定参与者1的策略,参与者2对合作和斗争是无差异的,因此选择合作是最优的(或至少不是次优的)六、案例分析题(共80分)1.考虑以下商业竞争案例:两家公司A和B在市场上销售相似产品,它们可以选择高价或低价策略。如果两家公司都选择高价,各获得利润100万;如果一家选择高价另一家选择低价,选择低价的公司获得利润150万,选择高价的公司获得利润50万;如果两家公司都选择低价,各获得利润75万。此外,两家公司可以进行重复博弈,即这个竞争可以持续多个时期。请分析:(1)这个一次性博弈的纳什均衡是什么?(2)如果博弈进行无限次重复,什么样的策略可以支持合作(都选择高价)?(3)如果博弈进行有限次重复,结果会如何?(4)如果引入折扣因子δ(0<δ<1),合作可以维持的条件是什么?答案:(1)一次性博弈的纳什均衡首先,我们构建这个博弈的收益矩阵:```公司B高价低价公司A高价(100,100)(50,150)低价(150,50)(75,75)```分析每个公司的最优策略:对于公司A:-如果B选择高价,A选择低价(150>100)是最优的-如果B选择低价,A选择低价(75>50)是最优的对于公司B:-如果A选择高价,B选择低价(150>100)是最优的-如果A选择低价,B选择低价(75>50)是最优的因此,(低价,低价)是这个一次性博弈的纳什均衡。这是一个囚徒困境类型的博弈,个体理性导致双方都选择低价,但合作(都选择高价)对双方都有利。(2)无限次重复博弈中支持合作的策略在无限次重复博弈中,可以使用"触发策略"(triggerstrategy)来支持合作。一个典型的触发策略是:-在第一轮选择高价-在随后的每一轮,如果对方在前一轮选择了高价,则选择高价;如果对方在前一轮选择了低价,则永远选择低价这种策略可以支持合作,因为它包含了惩罚机制:如果一方背叛(选择低价),另一方将永远选择低价作为报复,导致背叛者在未来各期都只能获得较低的收益。为了验证这种策略是否构成纳什均衡,我们需要比较合作与背叛的收益。假设双方都采用触发策略:-合作时的每期收益:100-总收益:100+100δ+100δ²+...=100/(1-δ)假设一方(如公司A)在某一期选择背叛(选择低价):-背叛当期的收益:150-之后各期的收益:75(因为对方将永远选择低价)-总收益:150+75δ+75δ²+...=150+75δ/(1-δ)合作要优于背叛,需要:100/(1-δ)>150+75δ/(1-δ)100>150(1-δ)+75δ100>150-150δ+75δ100>150-75δ75δ>50δ>2/3因此,如果折扣因子δ>2/3,触发策略可以支持合作(都选择高价)。(3)有限次重复博弈的结果在有限次重复博弈中,使用逆向归纳法,我们可以证明合作无法维持。假设博弈进行T期:在第T期(最后一期),博弈实际上等同于一次性博弈,因此双方都会选择低价。在第T-1期,双方都知道第T期双方都会选择低价,因此第T-1期的选择不会影响第T期的结果,所以双方在第T-1期也会选择低价。依此类推,双方在所有时期都会选择低价。因此,在有限次重复博弈中,无法维持合作。(4)引入折扣因子δ时合作可以维持的条件在无限次重复博弈中,合作可以维持的条件是折扣因子δ足够大,使得合作的长期收益超过背叛的短期收益。如前所述,对于触发策略,需要δ>2/3。更一般地,合作可以维持的条件是:δ>(背叛收益-合作收益)/(背叛收益-背叛后收益)=(150-100)/(150-75)=50/75=2/3因此,当折扣因子δ>2/3时,合作可以维持。2.考虑以下国际谈判案例:两个国家A和B需要就碳排放问题进行谈判。每个国家可以选择减排或不减排策略。如果两国都选择减排,全球气候得到改善,两国各获得收益10;如果一国选择减排另一国选择不减排,减排国承担成本,获得收益5,不减排国搭便车,获得收益15;如果两国都选择不减排,全球气候恶化,两国各获得收益0。此外,国家A比国家B更重视环境问题,国家A的收益函数是原来的1.5倍。请分析:(1)构建这个博弈的收益矩阵。(2)找出纯策略纳什均衡。(3)如果博弈进行无限次重复,什么样的策略可以支持合作(都选择减排)?(4)如果引入信息不对称,国家B不知道国家A的收益函数,但知道有50%的概率国家A是环保型(收益是原来的1.5倍),50%的概率是普通型(收益是原来的1倍),贝叶斯纳什均衡是什么?答案:(1)构建收益矩阵首先,我们确定国家A和国家B的收益函数:对于国家A:-如果A减排,B减排:收益=101.5=15-如果A减排,B不减排:收益=51.5=7.5-如果A不减排,B减排:收益=151.5=22.5-如果A不减排,B不减排:收益=01.5=0对于国家B:-如果A减排,B减排:收益=10-如果A减排,B不减排:收益=15-如果A不减排,B减排:收益=5-如果A不减排,B不减排:收益=0因此,收益矩阵为:```国家B减排不减排国家A减排(15,10)(7.5,15)不减排(22.5,5)(0,0)```(2)纯策略纳什均衡分析每个国家的最优策略:对于国家A:-如果B选择减排,A选择不减排(22.5>15)是最优的-如果B选择不减排,A选择不减排(0>7.5)是最优的对于国家B:-如果A选择减排,B选择不减排(15>10)是最优的-如果A选择不减排,B选择不减排(0>5)是最优的因此,(不减排,不减排)是这个博弈的纯策略纳什均衡。这是一个囚徒困境类型的博弈,个体理性导致双方都选择不减排,但合作(都选择减排)对双方都有利。(3)无限次重复博弈中支持合作的策略在无限次重复博弈中,可以使用"触发策略"来支持合作。一个典型的触发策略是:-在第一轮选择减排-在随后的每一轮,如果对方在前一轮选择了减排,则选择减排;如果对方在前一轮选择了不减排,则永远选择不减排这种策略可以支持合作,因为它包含了惩罚机制:如果一方背叛(选择不减排),另一方将永远选择不减排作为报复,导致背叛者在未来各期都只能获得较低的收益。为了验证这种策略是否构成纳什均衡,我们需要比较合作与背叛的收益。假设双方都采用触发策略:-合作时的每期收益:A获得15,B获得10-总收益:A:15+15δ+15δ²+...=15/(1-δ)B:10+10δ+10δ²+...=10/(1-δ)假设一方(如国家A)在某一期选择背叛(选择不减排):-背叛当期的收益:22.5-之后各期的收益:0(因为对方将永远选择不减排)-总收益:22.5+0+0+...=22.5合作要优于背叛,需要:15/(1-δ)>22.515>22.5(1-δ)15>22.5-22.5δ22.5δ>7.5δ>1/3对于国家B:-合作时的每期收益:10-总收益:10/(1-δ)假设国家B在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论