版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章博弈论1
博弈论用来分析所观察到的决策主体相互影响时的现象,在给定的条件下寻求最优的解决办法。本章主要介绍博弈论的基本概念,简单案例分析。2一、博弈论概述
博弈论:用来分析所观察到的决策主体相互影响时的现象,在给定的条件下寻求最优的解决办法。1、博弈论的发展
20世纪40年代博弈论思想体系初步建立,经过50年代的理论发展,博弈论在60年代逐步走向成熟。20世纪70年代中后期以后,随着博弈论在经济分析领域内的广泛和成功应用,博弈论也逐步进入主流经济学的体系。3(1)博弈论的发展1944年,由冯•诺依曼和摩根斯坦恩合著的《博弈论和经济行为》一书的出版标志着现代博弈论作为一种系统理论的创立。20世纪50年代,纳什创立了公理化的讨价还价理论,证明纳什讨价还价解的存在性,逐渐形成了以纳什非合作博弈理论为核心的现代博弈论体系。20世纪60年代以后,泽尔滕在纳什的研究基础上引入动态分析,海萨尼则把不完全信息引入到博弈论中。20世纪70年代以后,经济学家开始强调个人理性。4(2)博弈论与主流经济学博弈论进入主流经济学,反映了经济学发展的以下几个趋势:①经济学研究的对象越来越转向个体,放弃了一些没有微观基础的假定;②经济学越来越转向人与人之间竞争与合作的研究,特别是经济学注意到理性人的个人理性行为可能导致的集体非理性;③经济学越来越重视对信息的研究。博弈可以划分为合作博弈和非合作博弈。合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议。如果能,就是合作博弈;反之,则是非合作博弈。52、博弈的要素
博弈的要素包括参与人、行动、信息、策略、支付、结果和均衡,其中,参与人、策略和支付是描述一个博弈所需要的最基本的要素,参与人、行动和结果统称为博弈规则。①参与人:指一个博弈中的决策主体在囚徒困境模型中,有两个参与人,即“囚徒A”和“囚徒B”。②行动:是参与人在博弈的某个时点的决策变量。在囚徒困境模型中,囚徒A、B都只有两种行动可供选择,即“坦白”和“抵赖”。6
③信息是参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。在囚徒困境模型中,两囚徒的信息是都知道自己和另一囚徒在选择坦白和抵赖的不同组合时面对的处罚。④策略:是参与人在拥有既定信息情况下的行动规则,它规定参与人在什么时候选择什么行动。一个参与人的所有可选择的策略的集合就是这个参与人的策略空间。如果每个参与人选择一个策略,就构成一个策略组合。⑤支付:在博弈论中指一个特定策略组合下参与人得到的确定效用水平,或者是指参与人得到的期望效用7水平。支付是博弈参与人真正关心的东西。在一个策略组合下,所有参与者的支付就构成了一个支付组合。在囚徒困境模型中,如果两囚徒的策略组合为(抵赖,坦白),那么囚徒A的支付为-10,囚徒B的支付为0,两囚徒的支付组合为(-10,0);如果两囚徒的策略组合为(坦白,坦白),那么囚徒A和囚徒B的支付均为-8,两囚徒的支付组合为(-8,-8)。⑥结果:是博弈分析者感兴趣的所有东西,如均衡策略组合、均衡支付组合等。⑦均衡:是所有参与人的最优策略的组合。8二、博弈分析举例⒈沙滩上的饮料销售商为了争取更多的游客,两家销售商的销售位置又会开始向中点移动,最终都将销售位置定在了中点处。图10-1博弈分析举例:沙滩上的饮料销售商Ⅰ两家销售商的初始位置AB1/43/41/21/2Ⅱ销售商A的位置移动AB3/83/49/167/161/29/16Ⅲ销售商B的位置移动AB3/85/81/21/21/2Ⅳ两家销售商的最终位置A、B1×1/21/29⒉掷币游戏A、B两个小孩玩掷币游戏,两人各拿出一枚硬币抛掷在地面上,要么正面朝上,要么反面朝上。①都同为正面或反面朝上,A赢得B一枚硬币;②一正面一反面朝上,A输给B一枚硬币。这个例子中,两个小孩各自得到的结果(赢得一枚硬币或者输掉一枚硬币),不仅取决于自己掷币的后果,也取决于对手掷币的后果,双方决策的互相影响构成博弈。在这个博弈中,一方所得正是其他方所失,这种博弈称为零和博弈。10⒊囚徒困境囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里审讯。表10-1给出了囚徒困境模型的表述。每个囚徒都有两种选择:坦白或抵赖。表中每一格的两个数字代表对应两个囚徒选择组合下各自的刑期。
囚徒B囚徒A
坦白
抵赖
坦白
-8,-8
-1,-10
抵赖
-10,-1
-2,-211
最终,A,B都会现在“坦白”的占优战略,并不出现“两人都抵赖”的最优战略。个人理性与团体利益的冲突,“经济人”假设遇到挑战!12三、博弈的分类表2博弈的分类及对应的均衡概念不完全信息动态博弈精炼贝叶斯纳什均衡不完全信息静态博弈贝叶斯纳什均衡不完全信息完全信息动态博弈子博弈精炼纳什均衡完全信息静态博弈纳什均衡完全信息动态静态行动顺序信息13二、完全信息静态博弈
每一个参与人对所有其他参与人(对手)的特征、策略空间及支付函数有准确的知识,而且博弈的参与人同时选择行动或虽非同时但后行动者并不知道前行动者采取了什么具体行动,这种情况下参与人的决策就是完全信息静态博弈。纳什对非合作博弈的主要贡献是在一般的意义上定义了非合作博弈及其均衡解,并证明了均衡解的存在,这一均衡就被称为“纳什均衡”。14
博弈可以采用两种不同的方式来表述,一种是策略式表述,一种是扩展式表述。从理论上讲,这两种表述形式几乎是完全等价的,但策略式表述更适合于分析静态博弈,扩展式表述更适合于分析动态博弈。1、博弈的策略式表述(1)策略式表述n个参与人;说明每个参与人都有哪些策略;每个参与人都选定一种策略时,每个参与人的支付水平(获得的效用)是多少。根据上面给出的三要素,策略式表述的博弈就是:15表10-3掷币游戏1,-1-1,1反面-1,11,-1正面小孩A反面正面小孩B⒉策略式表述的博弈举例在掷币游戏中,每个参与人的支付直接用其赢得或输掉的硬币数量来表示:赢得一枚硬币的支付为1,输掉一枚硬币的支付为-1。掷币游戏的支付矩阵见表10-3所示。16表10-4斗鸡博弈-1,-10,2撤退2,0-3,-3进攻公鸡A撤退进攻公鸡B
再如下面的斗鸡博弈。试想有两只公鸡遇到一起,每只公鸡有两个行动选择:一是进攻,一是撤退。如果一只公鸡撤退,一只公鸡进攻,则进攻的公鸡获得胜利,撤退的公鸡很丢面子;如果两只公鸡都撤退则打个平手;如果两只公鸡都进攻,那么两败俱伤。设其支付矩阵见表10-4所示。17二、纳什均衡⒈占优策略均衡不论其他参与人选择什么策略,他的最优策略是唯一的,这样的最优策略被称为占优策略。在“囚徒困境”的例子中,每个囚徒都有两种可选择的策略:坦白或抵赖。但是,不论另一囚徒选择什么策略,每个囚徒的最优策略是“坦白”。所有参与人占优策略的组合称为占优策略均衡。18⒉重复剔除的占优均衡考虑“智猪博弈”例子。猪圈里围着两头猪,一头大猪,一头小猪。猪圈的一头有一个猪槽,另一头安装了一个按钮,控制着猪食的供应。按下一按钮会有8个单位的猪食进槽,但按下按钮的猪需要付出2个单位的成本。若大猪先到,大猪吃到7个单位,小猪只能吃1个单位;若同时到,大猪吃5个单位,小猪吃3个单位;若小猪先到,大猪和小猪各吃4个单位。表10-5的Ⅰ表列出对应不同策略组合的支付水平,如第一格表示两头猪同时按下按钮,就会同时走到猪食槽,大猪吃5个单位,小猪吃3个,扣除2个单位的成本,支付水平分别为3和1。19表10-5智猪博弈与重复剔除的占优均衡0,07,-1等待2,43,1按大猪A等待按小猪BⅠ智猪博弈的支付矩阵0,0等待2,4按大猪A等待小猪BⅡ剔出小猪劣策略的支付矩阵2,4按大猪A等待小猪BⅢ再剔出大猪劣策略的支付矩阵20⒊纳什均衡如果重复剔除劣策略后剩下的策略
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 员工绩效考核方案制定与执行指南
- 2026内蒙古霍林河机场管理有限责任公司招聘工作人员3人备考题库附参考答案详解【黄金题型】
- 2026广东广州市招聘中山医学院医科公共平台技术员1人备考题库及完整答案详解(夺冠)
- 2026浙江丽水市第二人民医院第一批引进高层次人才14人备考题库含完整答案详解(夺冠)
- 2026江西省人力资源有限公司招聘生产服务一线人员16人备考题库带答案详解(能力提升)
- 2026松原吉林油田医院招聘38人备考题库含答案详解【预热题】
- 2026新疆八一钢铁集团有限公司冶金铸造吊行车工社会化招聘16人备考题库及参考答案详解ab卷
- 2026广东云浮市郁南县招聘公益性岗位人员27人备考题库(第二轮)附参考答案详解(巩固)
- 2026四川广安市华蓥市人力资源和社会保障局全市各见习基地招聘第三批就业见习人员25人备考题库【基础题】附答案详解
- 2025 网络基础之毫米波通信与高速飞行器网络的通信保障课件
- 2026届高考英语高频固定短语搭配(共1000个)
- 管理学实战案例分析题及答案解析
- 失能老人照护培训
- 2026年海南软件职业技术学院单招综合素质考试必刷测试卷及答案1套
- 2026年宁夏石嘴山市单招职业适应性测试必刷测试卷必考题
- 2026年二级建造师之二建水利水电实务考试题库300道带答案(培优a卷)
- 《计算机机械图形绘制》课件
- DNA相关基础知识培训课件
- 矿井通风安全毕业论文
- 笔石古生态位分析-洞察及研究
- 景区管理旅拍管理办法
评论
0/150
提交评论