




免费预览已结束,剩余16页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章复习题2,4,5,6,7第一章提到了答案2.设置游戏中必须确定的方面包括:(1)玩家,即在游戏中做出决定并承担结果的玩家;(2)策略(空间),即玩家选择的内容,可以是方向、选择或连续数量级等。(3)利益或利益函数,即参与者行为和策略选择的相应后果和结果,必须是数量或可以转化为数量;(4)游戏的顺序,即玩家的行为、选择的顺序或重复的次数等。(5)信息结构,即参与者对彼此行为或最终利益的理解程度;(6)行为逻辑和理性程度,即博弈方是基于个人理性还是集体理性,以及理性的程度等。如果在建立博弈模型时没有特别设置后两个方面,则隐含的假设是完全的、完美的信息和完全理性的非合作博弈。4.“囚徒困境”的内在根源在于,基于个体理性和个体选择的分散决策方法无法在行为和利益相互制约的博弈结构中有效协调各方利益,实现整体和个体利益的共同优化。简而言之,“囚徒困境”问题是由个体理性和集体理性的矛盾引起的。实际上,有许多类型的“囚徒困境”问题。例如,制造商之间的价格战、恶性广告竞争、初中教育的应试教育等。都是各种形式的“囚徒困境”游戏。5.首先,根据参与者的行为逻辑,是否允许约束性协议可以分为两类:非合作博弈和合作博弈。其次,根据博弈双方的理性水平,可以分为两类:完全理性博弈和有限理性博弈。有限理性博弈是进化博弈。第三,根据游戏过程可以分为静态游戏、动态游戏和重复游戏。第四,根据游戏问题的信息结构和玩家是否有足够的关于利益和游戏过程的信息,可以分为完全信息静态游戏、不完全信息静态游戏、完全和完全信息动态游戏、完全和不完全信息动态游戏和不完全信息动态游戏。第五,根据收益的特点,可以分为零和博弈、常和博弈和变和博弈。第六,根据游戏中玩家的数量,游戏可以分为单人游戏、双人游戏和多人游戏。第七,根据博弈策略的数量,可以分为两种类型:有限博弈和无限博弈。9.根据问题的假设,博弈的利益矩阵和扩展形式如下:不言而喻赚取(35%)损失(65%)3000100100打开i不要打开自然的损失(65%)收入(35%)(300) (100) (0) (100)不要打开打开不要打开打开i如果我是风险中性的,那么根据预期收入和非预期收入的比较:0.35300 0.650=105100我一定会选择打开它。如果成功的概率降低到0.3,那么因为此时的预期收入与无法打开的收入相比较:0.30300 0.700=90100因此,他们会选择不开放,战略肯定会改变。如果我规避风险,预期回报是:0.9(0.35300 0.650)=0.9105=94.5 100所以在这个时候肯定会选择开放。10.首先,应该注意的是,两个玩家的利润单位是不同的,逃犯得到增加或减少刑期(年),而警卫得到奖金(元)。因此,除非效用概念首先被转换成同一个单位,否则两个玩家的利益不能相互比较和增减。这个游戏的利益矩阵如下:小心一号公路,二号公路-10,100010,010,0-10,1000逃离一号路线路线2游戏的扩展形式如下所示:护卫队路线2路线2路线1路线1逃犯路线2路线1(-10,1000)(10,0)(10,0)(-10,1000)根据上述利益矩阵和扩展形式,不难知道游戏中两个玩家的利益是相反的。虽然无法判断这是否是一个零和游戏,因为两个玩家受益于不同的单位,并且不能相加对方的利益,但两个玩家之间的关系的性质与硬币猜谜等游戏是相同的,也是相反的。因此,游戏也没有一个双方都愿意接受的稳定的策略组合。双方最合理的策略是以相同的概率随机选择路线。补充练习:1.判断下列陈述是否正确,并做一个简单的分析。囚犯困境两个囚犯陷入困境并且不能在囚犯困境游戏中获得更好结果的原因是,两个囚犯都不关心在监狱中的时间长度,只关心他们不能比另一个在监狱中度过更多的时间。合作游戏是一种游戏,在这种游戏中,玩家对彼此采取合作的态度。参考答案:a)错误。结论是完全相反的,也就是说,两个囚犯在囚犯困境游戏中陷入困境的原因是因为两个囚犯非常关心在监狱中的绝对时间长度。此外,我们已经开始假设两个囚犯都是理性的经济人,理性的经济人把他们自己的(绝对的)利益,而不是相对的利益,作为他们的决策目标。b)不正确。博弈论中的合作博弈具体指的是玩家能够达成并使用约束性协议来限制行为选择的博弈问题,与玩家的态度无关。2.游戏和游戏之间有什么关系?参考答案:现代博弈论和经济学中的博弈论通常指人们在经济、政治、军事等活动中的战略选择,尤其是在各种互动和战略互动条件下的战略选择和决策竞赛。游戏是指日常生活中的下棋、打牌、赌博、田径、球类运动和其他体育比赛。因此,游戏和游戏显然是有区别的。然而,游戏和游戏之间也有着重要的联系,因为游戏和许多游戏在本质上有着相同的特征:(1)有一定的规则;(2)有些结果可以用正值或负值表示,或者按照一定的规则转换成值;(3)战略至关重要;(4)战略和利益是相互依存的。正是由于这些共同的本质特征,从研究游戏规则中得出的结论可以用来指导经济和政治活动中的决策问题,或者把这些决策问题作为游戏问题来研究。因此,游戏在某种程度上可以理解为一种游戏。事实上,“游戏”这个英文名字的基本意思是游戏。3.工人为老板工作。工资标准是100元。工人可以选择是否懒惰,而老板可以选择是否扣除工资。假设工人不懈怠会产生相当于50元的负面影响,如果老板想扣除工资,他总是有借口扣除60元的工资,如果工人不懈怠,老板会有150元的产量,如果工人不懈怠,老板只会有80元的产量,但是在支付工资之前,老板不能知道实际产量,这是双方都知道的。对不起a)如果老板能看出员工是否懒惰,那是什么类型的游戏?游戏用利益矩阵或扩展形式表示,并简单分析。b)如果老板看不出员工是否懒惰,这是什么游戏?用效益矩阵或扩展形式表示并简单分析。参考答案:工人老板老板懒惰的不要懒惰少的少的没有扣减没有扣减(40,40)(100,-20)(-10,110)(50,50)a)因为老板在决定是否扣工资时可以完全知道员工是否懒惰,这是一个动态的游戏,也是一个信息完整的动态游戏。此外,由于双方都有足够的利益信息,所以这只是一个包含完整和完美信息的动态博弈。游戏以如下扩展形式表达:从上面的好处可以看出,在这个游戏中,懒惰总是对工人有利,而演绎总是对老板有利。因此,在双方只考虑自身利益最大化的情况下,这种博弈的正常结果应该是工人的懒惰和老板的克扣。由于老板在决定是否扣工资时不知道工人是否懒惰,这种游戏可以被视为一种静态游戏。由于双方仍然有足够的关于利益的信息,这是一个完全信息的静态游戏。该游戏由收益矩阵表示如下:老板少的不要吝啬工人懒惰的40,40100,-20不要懒惰-10,11050,50事实上,根据利益矩阵,不难得出与上述动态博弈相同的结论,即工人会选择懒惰,老板会选择吝啬。这个游戏实际上类似于囚徒困境。第二章复习题4,5,7,9,11,12第二章指的是答案4.多重纳什均衡不会影响纳什均衡的一致性预测性质。这是因为一致的可预测性并不意味着每个玩家都有一致的预测,而是每个玩家自己的策略选择与他自己的预测一致。对博弈分析的主要不利影响是,当博弈中存在多个纳什均衡且没有明显区别时,会给预测分析带来困难,影响以纳什均衡为核心的博弈分析的预测能力。存在帕累托最优政策均衡、风险最优政策均衡、聚集点均衡或相关均衡的可能性,当参与者之间有足够的默契和理解时,多重纳什均衡带来的不利影响将很小。5.游戏派对2中华人民共和国2,01,14,23,41,22,31,30,23,0马胃蝇蛆Yi m乙方1首先,利用重复淘汰严格策略的思想,不难发现在游戏1的策略中,B是相对于T的严格策略,所以这个策略可以从游戏1的策略空间中淘汰。在排除了游戏1的策略B之后,我们可以发现游戏2的策略C相对于R是一个严格的策略,它也可以被排除。在下面的效益矩阵中,相应的战略和效益用水平线和垂直线标出,以表明这些战略已被取消。游戏2中华人民共和国2,01,14,23,41,22,31,30,23,0马胃蝇蛆Yi m乙方1两个玩家各自取消一种策略的游戏是下面的两人22游戏,没有严格的策略。使用标记或箭头的方法,很容易发现在这22个游戏中有两个纯策略纳什均衡(m,l)和(t,r)。游戏2左对齐2,04,23,42,3马胃蝇蛆Yi m平方1由于两个纯策略纳什均衡之间不存在帕累托效率,并且双方的利益不一致,因此在没有其他进一步信息或决策机制的情况下,一次性静态博弈的结果无法得到证实。由于双方可能在游戏中采用混合策略,游戏的结果实际上可能是四种纯策略组合中的任何一种。7.我们用反应函数法来分析这个游戏。让我们首先讨论玩家1的选择。根据问题的假设,如果玩家2选择数量s2(0s210000),则玩家1选择s1有以下好处:当S110000 s2时当S110000 s2时u(s1)=因此,当玩家1采用S1=1000-S2时,他可以实现自己的最大利益U (S1)=S1=1000-S2。所以S1=1000-S2是第一场比赛的反应函数。玩家2和玩家1的兴趣函数和策略选择完全相似,因此对于玩家1选择的任何数量s1,玩家2的最佳响应策略,即响应函数,是s2=1000- s1。显然,上述玩家1的反应函数和玩家2的反应函数是完全一致的,因此该游戏具有无限个纳什均衡,并且满足该反应函数的所有数组(s1,s2),即s1 s2=10000,是该游戏的纯策略纳什均衡。如果我是两个玩家之一,我会要价5000元。原因是在博弈的无限多个纯策略纳什均衡中,(5000,5000)不仅相对公平,容易被双方接受,而且容易被双方同时想到,所以它是一个收敛均衡。9.(1)第一制造商的利润函数是:i=pqi-ciqi=(a-qi-qj)qi-ciqi利润函数从输出中导出,并设为0:=a-qj-ci-2qi=0两个制造商的反应函数如下:qj=(a- qj-ci)/2或者具体写为:q1=(a-q2-c1)/2q2=(a-q1-c2)/2(2)当0 ci a/2时,我们根据两个企业的反应函数直接计算两个企业的纳什均衡产量,如下:q1=q2=(3)当C1 C2 aC1时,从反应函数获得的制造商输出Q2 0 0。这意味着企业2不生产,那么企业1成为垄断企业,企业1的最优产出选择是利润最大的垄断产出。q1=q*=因此,这种情况下的纳什均衡是(a- c1)/2,0。11.(1)当两个候选人竞争时,纯策略纳什均衡为(0.5,0.5),即两个候选人都声明他们在中间。我们用直接的分析来证明:首先,如果一个候选人的位置是0.5,而另一个候选人的位置不是0.5,那么就不难证明获胜者将获胜,而后者将不可避免地失败,因为根据投票原则,前者将获得0.5以上的选票,那么双方都有50%的获胜机会。因此,对于任何一个候选人来说,不管另一个候选人的职位是0.5,0.5是他的正确选择,也就是说,0.5是最好的政策。因此,(0.5,0.5)是这个博弈中的最佳政策均衡,当然也是纳什均衡。事实上,即使两个候选人没有在一开始就立即找到0.5的最佳位置,他也会在竞争中通过学习迅速适应纳什均衡策略。因为当两个候选人的位置都不是0.5时,接近0.5的候选人将获得更多的选票。观察到这一点,两个候选人将不可避免地接近0.5,直到他们都采取0.5的立场。当两个候选人都选择0.5时,每个人都可以赢得一半的选民支持。谁能获胜通常取决于候选人的选举职位以外的因素,比如候选人的个人魅力和演讲能力。(2)当有三个候选人时,问题更复杂。因为当三个候选人的位置都接近中点时,夹在另外两个候选人中间的候选人只能获得很少的选票,因此他(她)有动机转向更“左”或更右倾的位置,而不是“左”的位置。此时,三名候选人在中点附近处于不稳定的平衡状态。(0.5,0.5,0.5),其中,和是小正数。如果考虑到在现实中候选人的位置不能用一维数学坐标精确地描述,并且选民区分候选人位置之间的差异的能力不能很好,那么当候选人的位置被阻挡在中点附近时,选民很难识别哪个候选人倾向于右边或“左边”,因此当他们接近中点时,三个候选人的位置可以被理解为相同。这样,三个候选人和两个候选人的纳什均衡策略可以被认为是相同的,即所有的选择(0.5,0.5,0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届四川省绵阳地区九上化学期中预测试题含解析
- 广西柳州市柳江区2026届九年级英语第一学期期末预测试题含解析
- 矿山资源整合开发项目转让合同范本
- 离婚协议书参考:房产分割与子女抚养责任协议
- 水稻种植项目劳务分包与农业物联网合作合同
- 直播平台与主播的多元化权益合作协议
- 双方离婚协议中财产分割及共同债务承担执行协议
- 智能家居产品研发合伙协议退伙技术支持与退伙协议
- 智能商业租赁合同分割及物联网技术应用协议
- 高新技术研发项目合同风险评估与优化策略
- 半导体semi F81 中文版
- 2025年有限空间作业安全知识问答试题集
- 国家教育考试保密安全培训
- 电器特种作业培训课件
- 2025新高考数学核心母题400道(教师版)
- 卫星网络管理与运维-深度研究
- 房地产质量管理制度
- 2024医疗设备融资租赁法规解读
- 2020-2024年五年高考政治真题分类汇编专题19 世界多极化(原卷版)
- 胃食管反流-讲稿
- 2024至2030年中国扇数据监测研究报告
评论
0/150
提交评论