




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、高级管理学高级管理学第九讲第九讲 博弈论初步博弈论初步11/26/202111 1囚徒困境和纳什均衡囚徒困境和纳什均衡 n囚徒困境(prisoners dilemma)博弈论的著名的例子,纳什均衡是博弈论的重要概念。囚徒困境说的是,两个嫌疑犯作案后被捕,起诉机构没有足够的证据证明他们抢劫了银行。所以,若犯人们不坦白,起诉者只能就非法持有武器罪起诉,判犯人有期徒刑2年。起诉者于是向犯人采取攻心战,说可以“坦白从宽、抗拒从严”。如果一人坦白,则坦白者从宽处理,判徒刑1年,抗拒者从严处理,判徒刑12年。如果两人都坦白,每人依法判徒刑10年。两个囚徒是坦白还是不坦白呢?11/26/202121.11.
2、1囚徒困境囚徒困境 乙乙 不坦白不坦白 坦白坦白 不坦白不坦白 -2 -2 -1 -12 甲甲 坦白坦白 -12 -1 -10 -10 11/26/202131.2 1.2 博弈均衡博弈均衡n博弈论假设博弈的参加者都是理性的,即在对手战略博弈论假设博弈的参加者都是理性的,即在对手战略给定的条件下,每个参加者都会选择适当的战略来实给定的条件下,每个参加者都会选择适当的战略来实现自己报酬的最大化(或损失最小化)。问题是博弈现自己报酬的最大化(或损失最小化)。问题是博弈的一方不能控制另一方的决策。当参加者甲以最优战的一方不能控制另一方的决策。当参加者甲以最优战略对付乙的某个战略时,乙会发现原先的战略
3、不是对略对付乙的某个战略时,乙会发现原先的战略不是对付甲的实际战略的最佳战略,因而会改变其战略。要付甲的实际战略的最佳战略,因而会改变其战略。要是乙改变了战略,参加者甲也要进行相应的改变。这是乙改变了战略,参加者甲也要进行相应的改变。这样的改变行为会否停止?这里借用经济学常用的均衡样的改变行为会否停止?这里借用经济学常用的均衡概念,我们把博弈的稳定结果称为均衡,博弈的均衡概念,我们把博弈的稳定结果称为均衡,博弈的均衡也称为博弈的解。也称为博弈的解。均衡是指所有的参加者都不想改变均衡是指所有的参加者都不想改变战略的状态。战略的状态。 11/26/202141.3 1.3 占优均衡占优均衡n在一些
4、特殊的博弈中,一个参加者的最优战略可能并不依赖于其在一些特殊的博弈中,一个参加者的最优战略可能并不依赖于其他参加者的战略选择,也就是说,不论其他参加者选择什么战略,他参加者的战略选择,也就是说,不论其他参加者选择什么战略,他的最优战略是唯一的,这样的最优战略被称为他的最优战略是唯一的,这样的最优战略被称为“占优战略占优战略”(dominant strategy)。)。n在上述的囚徒困境博弈中,每个囚徒可选择的战略有两种:坦白在上述的囚徒困境博弈中,每个囚徒可选择的战略有两种:坦白与不坦白。显然,不论另外一个囚犯选择什么战略,每个囚犯的与不坦白。显然,不论另外一个囚犯选择什么战略,每个囚犯的最优
5、战略都是最优战略都是“坦白坦白”。例如,如果乙选择坦白,囚犯甲选择坦。例如,如果乙选择坦白,囚犯甲选择坦白时的报酬为白时的报酬为-10,选择不坦白的报酬为,选择不坦白的报酬为-12,因而坦白比不坦,因而坦白比不坦白好;如果乙选择不坦白,甲坦白的报酬为白好;如果乙选择不坦白,甲坦白的报酬为-1,不坦白的报酬为,不坦白的报酬为-2,所以坦白还是比不坦白好。也就是说,所以坦白还是比不坦白好。也就是说,“坦白坦白”是囚犯甲的是囚犯甲的占优战略。由于对称性,占优战略。由于对称性,“坦白坦白”也是囚犯乙的占优战略。于是,也是囚犯乙的占优战略。于是,(坦白,坦白)或(坦白,坦白)或(-10,-10)是囚徒困
6、境博弈的占优均衡。)是囚徒困境博弈的占优均衡。 11/26/20215个人理性与集体理性个人理性与集体理性n甲乙两人都寻求最好的结果,而得到的甲乙两人都寻求最好的结果,而得到的却是较糟的结果。这个例子说明,在多却是较糟的结果。这个例子说明,在多人决策的环境里,个人理性与集体理性人决策的环境里,个人理性与集体理性经常是矛盾的,这种集体利益和个人利经常是矛盾的,这种集体利益和个人利益的之间的益的之间的冲突被称为冲突被称为“囚徒困境囚徒困境”。 11/26/202161.4 1.4 纳什均衡纳什均衡n纳什均衡是这样一种稳定状态,博弈的任何一方参加者都不会改变其战略,如果其他参加者都不改变战略的话。
7、n依定义,任何占优战略均衡必定是纳什均衡,但纳什均衡却不一定是占优战略均衡,占优战略均衡是比较强的均衡概念。囚徒困境中的(坦白,坦白)就是纳什均衡。经济生活中的众多集体利益和个人利益的之间的冲突带来的非帕累托有效状态都是纳什均衡。11/26/20217纳什均衡纳什均衡( (严格的定义严格的定义) )纳纳什什均均衡衡: 在有 n个参加者的博弈里, 记Si为参加者i的战略空间,i为其报酬函数, 如果存在一组战略iinSssss*2*1,, 使得对每一个参加者ni i, 1都有 iiniiiiniSssssssssss,*1*1*2*1*2*1 那么,*2*1,nsss就是纳什均衡。 11/26/2
8、0218完全信息静态博弈的几个著名博弈完全信息静态博弈的几个著名博弈n智猪博弈智猪博弈(boxed pigs)n猪圈里有两头猪,一头大猪,一头小猪,猪猪圈里有两头猪,一头大猪,一头小猪,猪圈的一头有个猪食槽,另一头安装一个圈的一头有个猪食槽,另一头安装一个 按按钮,控制着猪食的供应。按一下按钮会有钮,控制着猪食的供应。按一下按钮会有10单位的猪食进槽,但谁按按钮谁就要付单位的猪食进槽,但谁按按钮谁就要付2个单位的成本。若大猪先到,大猪吃到个单位的成本。若大猪先到,大猪吃到9个个单位,小猪只能吃单位,小猪只能吃1个单位;若同时到,大个单位;若同时到,大猪吃猪吃7个单位,小猪吃个单位,小猪吃3个单
9、位;若小猪先个单位;若小猪先到,大猪吃到,大猪吃6个单位,小猪吃个单位,小猪吃4个单位。个单位。11/26/20219标准型支付矩阵标准型支付矩阵 小猪小猪 按按 等待等待 按按 1 5 4 4 大猪大猪 等待等待 -1 9 0 0 11/26/202110性别战(性别战(battle of the sexesbattle of the sexes) Rose 三三级级片片 纪纪录录片片 三三级级片片 1 2 0 0 Dell 纪纪录录片片 0 0 2 1 11/26/202111市场进入阻挠博弈 在位者在位者 默许默许 斗争斗争 进入进入 50 40 0 -10 进入者进入者 不进入不进入
10、300 0 300 0 11/26/2021122动态博弈n静态博弈,即博弈各方同时行动,但是经济生活中许多情形是动态博弈,也就是指博弈参加者的行动有先后顺序,又叫序贯博弈。 11/26/2021132.1完全信息动态博弈的分类完全信息动态博弈的分类n博弈总的可以分为完全信息的博弈(即博弈参博弈总的可以分为完全信息的博弈(即博弈参加者的收益函数是共同知识的博弈)和不完全加者的收益函数是共同知识的博弈)和不完全信息博弈(博弈中的一些参加者不知道其它参信息博弈(博弈中的一些参加者不知道其它参加者的收益函数)。加者的收益函数)。完全信息动态博弈完全信息动态博弈又分为又分为完全且完美信息(完全且完美信
11、息(complete and perfect information)的动态博弈和完全但不完美信的动态博弈和完全但不完美信息博弈两类。前者是指在博弈进行的每一步当息博弈两类。前者是指在博弈进行的每一步当中,要选择行动的参加者都知道这一步之前博中,要选择行动的参加者都知道这一步之前博弈进行的整个过程;后者是指在博弈的某些阶弈进行的整个过程;后者是指在博弈的某些阶段,要选择行动的参加者并不知道在这一步之段,要选择行动的参加者并不知道在这一步之前博弈进行的整个过程前博弈进行的整个过程 11/26/2021142.2子博弈完美纳什均衡(子博弈完美纳什均衡(SPNESPNE)n一个子博弈是全部博弈的一部
12、分,当全部博弈进行到一个子博弈是全部博弈的一部分,当全部博弈进行到任何一个阶段,到此为止的进行过程已经称为博弈参任何一个阶段,到此为止的进行过程已经称为博弈参加各方的共同知识,而其后尚未开始进行的部分就是加各方的共同知识,而其后尚未开始进行的部分就是一个子博弈。如果博弈参加者的战略在每一子博弈中一个子博弈。如果博弈参加者的战略在每一子博弈中都构成纳什均衡,我们称此纳什均衡是子博弈完美纳都构成纳什均衡,我们称此纳什均衡是子博弈完美纳什均衡(什均衡(subgame perfect Nash equilibrium)(Selten,1965)。)。n所有动态博弈的中心问题是可信任性,所以不可置信所有
13、动态博弈的中心问题是可信任性,所以不可置信的威胁被研究较多,子博弈完美纳什均衡(的威胁被研究较多,子博弈完美纳什均衡(SPNE)是是不含不可置信的威胁的。子博弈完美纳什均衡可以用不含不可置信的威胁的。子博弈完美纳什均衡可以用逆向归纳法(逆向归纳法(backwards-induction)找出找出 11/26/202115几种著名的动态博弈几种著名的动态博弈nStackelbeg模型nHotelling模型(地点模型)11/26/2021163重复博弈重复博弈: :特殊的动态博弈特殊的动态博弈n同一博弈重复多次,称为重复博弈同一博弈重复多次,称为重复博弈(repeated game),),其中的
14、每一次其中的每一次博弈称为博弈称为“阶段博弈阶段博弈”(stage game),),事实上它是动态博弈的一种事实上它是动态博弈的一种特殊情况。它的均衡状况可能与一次性特殊情况。它的均衡状况可能与一次性博弈不同,被研究最多的重复博弈还是博弈不同,被研究最多的重复博弈还是囚徒困境博弈。囚徒困境博弈。 11/26/202117例子例子: :古诺产量博弈古诺产量博弈 乙企业 守约 违约 守约 1000 1000 1100 800 甲企业 违约 800 1100 900 900 表:古诺产量博弈 11/26/202118n作为囚徒困境的一个例子,其占优战略均衡的结局双方都增加产量,它们的报酬各为900。如果它们能合作,共同压缩产量,则可以实现各自1000的报酬。它们都想合作,但是又怕被欺骗,于是就此陷入“囚徒困境”。关键是在一次性博弈中,被欺骗之后就无法报复了,当然也无法建立公司的声誉。重复博弈下的情形就会发生变化。因为博弈的其它参加者过去行动的历史是可以观测得到的,一个参加者可以使自己在某个阶段博弈的战略选择依赖于其它参加者过去的行动历史。这样企业就可以报复和建立合作的声誉,合作发生的原因在于公司的长远利益。11/26/202119n在重复博弈里,参加者每个阶段都得到一定的报酬
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB31/T 1047-2017家政服务溯源管理规范
- DB31/ 749-2013大型游乐设施维修保养规则
- 信息技术在企业管理中的应用考核试卷
- 货运火车站物流企业市场营销策划考核试卷
- 智能交通数据保密及智能管控协议
- 测试团队沟通方法试题及答案
- 跨国展览安全责任保证协议
- 跨区域购物中心商铺租赁权承继与合同续签协议
- 跨界合作网络文学IP影视改编合同
- 知识产权法律审查补充协议
- 会展安全风险评估报告
- 河南省青桐鸣大联考普通高中2024-2025学年高三考前适应性考试英语试题及答案
- 内蒙古自治区通辽市2025届高三下学期三模生物试题 含解析
- 浙江省丽水市2023-2024学年高一数学下学期6月期末教学质量监控试题含答案
- 2025年合肥交通投资控股集团有限公司第一批次招聘38人笔试参考题库附带答案详解
- 权益维护课件
- 浙江开放大学2025年《社会保障学》形考任务4答案
- 29.液化天然气加气站特种设备事故应急预案
- 浙江省金华市2025届六年级下学期5月模拟预测数学试题含解析
- 关节科考试试题及答案
- 2025新高考地理复习十大时事热点及命题预测(学生版+解析版)
评论
0/150
提交评论