版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、博弈论与政治学应用,林辉程 S131920005,一、博弈论简介 二、策略式博弈纳什均衡 形式化建模 求解(占优、最优回应) 政治学应用 三、扩展式博弈子博弈精炼纳什均衡 博弈树 求解(逆向归纳) 政治学应用 四、小结,一、关于博弈论,博弈论(Game theory),是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。一些相互依赖、相互影响的决策行为及其结果的组合称为博弈(Game)。,博弈论简史 对于博弈论的研究开始于恩斯特策梅洛(1913)、埃米尔博雷尔(1921)及冯诺伊曼(1928),后来由冯诺伊曼和奥斯卡摩根斯坦(1944,1947)首次将其系统化和形式化
2、(参照Myerson, 1991)。随后约翰福布斯纳什(1950,1951)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。 约翰福布斯纳什、约翰C海萨尼及莱因哈德泽尔腾因为他们对博弈论的突出贡献而获得1994年的瑞典银行经济学奖。罗伯特J奥曼、肯宾摩尔、戴维克瑞普斯及阿里尔鲁宾斯坦对于博弈论也做出重大贡献。,博弈的构成要素一个博弈一般由以下几个要素组成,包括:参与人、行动、信息、策略、收益、均衡等。 1、参与人 指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体); 2、行动 指参与人在博弈进程中轮到自己选择时所作的某个具体决策; 3、策略 指参与人
3、选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排; 4、信息 参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识; 5、收益 参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西; 6、均衡 所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合。 上述要素中,参与人、行动、结果统称为博弈规则,博弈分析的目的就是使用博弈规则来决定均衡。,博弈的分类,二、策略式博弈和纳什均衡,策略式(normal form)表达又称
4、为标准式表达,在这种表达中,所有参人同时选择自己的策略,所有参与人选择的策略一起决定每个参与人的收益。 一个策略式博弈包含以下要素: 参与人(players) 参与人的策略(strategies) 收益/效用(payoff/utility) (效用理论的简单介绍,买房子的选择 定性描述与定量描述的转化 今天天气很好晴,气温,湿度,风速,pm2.5;大多数人都喜欢上田老师的课 12位同学中的10人都喜欢;收益函数、期望效用、效用最大化 Max 函数求导),情景的形式化表述(建模的过程) 警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪,就能确认罪名成
5、立。为了得到所需的口供,警察将这两名罪犯分别关押防止他们串供或结成攻守同盟,并分别跟他们讲清了他们的处境和面临的选择:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白者立即释放而另一人将重判10年徒刑;果两人都坦白认罪,则他们将被各判8年监禁。问:两个罪犯会如何选择(即是坦白还是抵赖)?,求解策略式博弈的均衡解(博弈的三种不同解): 占优策略与占优均衡 占优均衡:如果每一个参与人的策略都是占优策略,那么称这个策略的组合为占优策略均衡。eg:囚徒博弈 2. 迭代剔除劣势策略与占优均衡(略) 最优回应与纳什均衡,最优回应与纳什均衡 最优回应:一位参
6、与者针对另一方的某个特定策略,选择能为自己带来最高收益的策略 纳什均衡:如果每个参与人的策略都是对其他参与人策略的最优回应,那么各参与人的策略组合构成一个纳什均衡。,混合策略纳什均衡 定理(纳什):每一个有限的非零和博弈都有至少一个混合策略纳什均衡。,政治学应用: 例1: 战国联盟 自我实施、强化 协调、说服(vs囚徒困境) (公开课p41)投资博弈(引申:协调博弈,2NE ,party,银行挤兑、美丽人生.力挽狂澜 战国联盟说客苏秦张仪合纵连横 协调之所以能达成在于它不同于囚徒困境,他没有去说服人们采取一个严格劣势策略),政治学应用: 例2: 贿选(由简单到复杂,逐渐完善模型) 考虑两个候选
7、人在一职位竞选中是否进行贿选。若两人都不贿选,候选人1胜出的概率为P,候选人2胜出的概率为1-P。贿选给候选人带来优势。候选人1进行贿选的话其胜出的概率提高V1(导致候选人2胜出的概率降低V1 );候选人2进行贿选的话其胜出的概率提高V2(导致候选人1胜出的概率降低V2) 博弈均衡解? 加入监督、反腐因素后的博弈 信息、信念因素,政治学应用: 例3: 中位数投票者定理 其它:美苏争霸、军备竞赛 、政治改革、政治分赃、政党竞争 政治学博弈论p109 田忌赛马混合策略引入到下篇的扩展式博弈,二、扩展式博弈和逆向归纳法求解纳什均衡,扩展式(extensive form)表达,是博弈论的另一种常用表达
8、形式,扩展式博弈给出了每个策略的动态描述:参与者及其可供选择的策略,行动的顺序及结果,以及选择时所知道的信息。扩展式博弈以博弈树的图像方式来描述。 一个扩展式博弈包含以下要素: 参与人(players) 参与人的策略(strategies) 收益/效用(payoff/utility) 参与人的行动顺序 参与人的信息集 自然的选择的概率分布,博弈树包含一系列被依次连接起来的节点。每个节点有一定数量的分支,这些分支通向其他节点。 节点代表决策,分支代表在每个决策中能够被选择的行动。,情景的形式化表述及求解 Play a game : Cash in the hat Player1 can put
9、$ 0, $ 1, $ 3 in a hat The hat be passed to player2 Player2 can either “match”(add the same amount) or take the cash Payoff: player 1 player 2 0 - 0 net 1.5 of match 1 1 - double if match ; - 1 if not net 2 of match 3 3 - double if match ; - 3 if not simply take the money in the hat,求解扩展式博弈:逆向归纳与子博弈
10、精炼 延伸:类似于囚徒博弈的困境 逆向归纳如此简单,以至于有人可能认为它无法提供任何有趣的洞见。Then,考虑下面的例子,政治学应用: 例1: 立法者给自己加薪 情景非形式化描述:三个立法者就是否给自己加薪进行投票。三人都希望加薪,但如果他们投票支持加薪的话会因选民反感而带来损失 c ,加薪的好处b大于 c 。如果他们按顺序来投票决定是否加薪,那么第一个投票好还是最后一个投票好呢? 形式化建模: 求解: 结论: 延伸:政党、候选人的竞选政纲,如平衡增加税收与财政赤字的问题的态度。,例2:复杂投票 & 议程控制 我们通常假定各个主体会投票赞成他们最偏好的结果。我们称这样的投票为真诚投票(sinc
11、ere voting)angege。但在多轮投票程序中,人们也许能在前几轮的投票中投与他们的偏好相反的票而获益。复杂投票(或策略性投票)能给这些参与人带来其所偏好的结果。 假定有三个方案 x , y , z 和三位投票者 1,2,3 。他们的偏好如下: 参与者1:x y z 参与者2:y z x 参与者3:z x y,议程控制 对议程的控制可以是一个强大无比的手段,能控制议程的参与者可以确保得到其最偏好的结果。 混沌定理(The Chaos Theorem):当各方都作真诚投票且有多于一个议题时,任何人但凡能控制议程就能得到任何他想要的结果。 结论:在策略性投票的情况下,投票者能预见什么时候议程会让他们上钩,他们按照每个选择所产生的最终结果而不是按照当前投票的直接结果来选择的。当投票者深思熟虑时他们就会预计未来的投票,从而大大降低议程决定结果的能力。 延伸:立法规则和结构引致的均衡(开放、封闭、关联性规则下的立法博弈),完全信息静态、动态 不完全信息静态、动态 贝叶斯定理的引入 贝叶斯定理是关于随机事件A和B的条件概率(或边缘概率)的一则定理。 其中P(A|B)是在B发生的情况下A发生的可能性。,三、小结,模型与现实 牛顿 地图 池塘的鱼 博弈论能做什么 解释 预测 提出建议,找出解决办法 怎样算
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 热处理区温控校验保养计划
- 路面临边防护栏杆搭设拆除规范
- 精雕加工标准作业程序书
- 寄养区域安全规定标准手册
- 临床路径管理提质增效实施方案
- 江西省南昌市2026届高三年级下学期四月检测(二模)政治试题(含答案)
- 窗帘清洗拆装消毒流程手册
- 2026年医院医技科工作总结及计划(2篇)
- 2026院感科室年度工作计划
- 冰冻灾害道路抢修应急预案
- 多器官功能障碍综合征(MODS)
- 《唐诗三百首》导读课(二稿)
- 【5套打包】兰州市小学五年级数学下期中考试单元检测试题(含答案解析)
- 重卡结构解析图
- 安踏集团零售管理培训手册定
- 职场小白快速读懂财务三张报表
- 土地机旋耕旋施工的方案设计
- 《我参与 我奉献》第4课时示范公开课教学PPT课件【道德与法治五年级下册】
- 2021-2022中国滑雪产业白皮书
- GB/T 5974.1-2006钢丝绳用普通套环
- FZ/T 52051-2018低熔点聚酯(LMPET)/聚酯(PET)复合短纤维
评论
0/150
提交评论