信息经济学第三章_信息经济学研究方法.教学教程课件电子教案_第1页
信息经济学第三章_信息经济学研究方法.教学教程课件电子教案_第2页
信息经济学第三章_信息经济学研究方法.教学教程课件电子教案_第3页
信息经济学第三章_信息经济学研究方法.教学教程课件电子教案_第4页
信息经济学第三章_信息经济学研究方法.教学教程课件电子教案_第5页
已阅读5页,还剩79页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章第三章 信息经济学研究方法信息经济学研究方法博弈论博弈论基本概念基本概念规范研究规范研究实证研究实证研究非线性规划非线性规划应用例证基础模型基础模型其他例证例证基本类型基本类型信息经济学信息经济学的研究方法的研究方法例证例证经典模型经典模型第二节第二节 信息经济学基本方法信息经济学基本方法 规范研究规范研究&实证研究实证研究假设条件假设条件与现实不违背 条件之间不矛盾基本模型基本模型构造合理推导简洁、正确结论结论不可批判性 与现实吻合或合理复杂模型复杂模型(扩展或推广)复杂化 应用评论评论规范分析的基本框架规范分析的基本框架 经济学研究的经济学研究的“四步曲四步曲” ?经济学研究

2、的经济学研究的“八股文八股文” ?1. 规范研究的假设条件规范研究的假设条件 在信息经济学之前,微观经济学假设中几乎都包括经济人假设经济人假设和完全信息假设完全信息假设这两个最基本的假设。 经济人假设经济人假设也称为理性人假设,是指经济决策主体(消费者、生产者等)的经济行为都是理性的或合乎理性的,他们在经济活动中不会感情用事,而是精于判断和计算,总是以利己为动机,力图以最小的经济代价去追逐和获得自身的最大利益。 完全信息假设完全信息假设是指经济活动的所有当事人都拥有充分的和相同的信息,而且获取信息不需要支付任何成本。 其它假设其它假设: 完全竞争假设、稀缺性假设(资源不能够满足人们不断增长的需

3、求)、制度假设(既定的市场经济制度)、交易成本为零的假定完全信息完全信息不完全信息不完全信息 阿克洛夫首先提出的不对称信息市场更好的贴近了现实,更为准确地反映了市场上商品的异质性。 古典假设的错误?古典假设的错误? 经济学规范研究的模型假设两方面要求: 一是与现实不违背,二是条件之间不矛盾。 完全信息假设可以满足这两方面要求,甚至可以说,正是这种由简单到复杂的假设扩展过程使经济学的发展更为平稳和完备。2. 模型建立的典范模型建立的典范 一般均衡分析一般均衡分析里昂里昂瓦尔拉斯瓦尔拉斯(Leon Walras,18341910) 里昂瓦尔拉斯,法国经济学家,边际革命领导人,洛桑学派创始人。19世

4、纪50年代开始研究政治经济学,1870年被聘为洛桑大学政治经济学教授。瓦尔拉斯是边际效用价值论的创建人之一,他把边际效用称为“稀少性”,并在经济学中使用了数学,研究了使一切市场(不是一种商品的市场,而是所有商品的市场)都处于供求相等状态的均衡,即一般均衡,从而成为数理经济学和一般均衡理论的创建者和主要代表,他的一般均衡分析方法被经济学所普遍使用。瓦尔拉斯把自由竞争的资本主义看作最理想的制度,但也主张国家根据正义原则干预经济。实证研究的框架实证研究的框架理论分析理论分析提出假说构建模型实证分析实证分析收集数据数据处理计量检验结论结论作出预测给出问题的对策文献综述文献综述研究方法研究结论讨论讨论反

5、映现实反映现实 ?预测未来预测未来 ?实证研究能够实现:实证研究能够实现:讨论区讨论区第二节第二节 信息经济学基本方法信息经济学基本方法 博弈论博弈论经济学研究的基本问题:经济学研究的基本问题: 资源的有效配置资源的有效配置 人的行为人的行为经济学的基本假设:人是理性的经济学的基本假设:人是理性的理性人:在一定的约束条件下,使自己的收益最大化。理性人:在一定的约束条件下,使自己的收益最大化。价格制度价格制度每个参与者的决策是独立的。每个参与者的决策是独立的。基本假设基本假设:(:(1)市场是竞争的)市场是竞争的 (2)信息是完全的)信息是完全的 (3)产品是独立的)产品是独立的个人决策的分析:

6、收入个人决策的分析:收入支出(价格),收益最大化支出(价格),收益最大化基本假设:基本假设: (1)市场是不完全竞争的)市场是不完全竞争的 (2)信息是不完全的)信息是不完全的特征:特征: 每个参与者的决策是相互影响的每个参与者的决策是相互影响的 国家之间、企业之间、人与人之间国家之间、企业之间、人与人之间生活中的博弈:生活中的博弈: 打牌、下棋打牌、下棋 宿舍打扫卫生宿舍打扫卫生 宿舍买电风扇宿舍买电风扇 家庭装修家庭装修 挤公共汽车挤公共汽车一、经济博弈论的产生与发展一、经济博弈论的产生与发展 通常,人们将数学家冯通常,人们将数学家冯 诺依曼(诺依曼(von Neumann)于)于1928

7、年提出的二年提出的二人零和博弈的极小化极大定理作为博弈论奠基的标志。人零和博弈的极小化极大定理作为博弈论奠基的标志。 1944年,数学家年,数学家冯冯 诺依曼(诺依曼(von Neumann)和经济学家摩根斯坦恩)和经济学家摩根斯坦恩(Morgenstern)合作发表了)合作发表了博弈论和经济行为博弈论和经济行为一书,被认为是应用一书,被认为是应用博弈论进行经济分析的开始。博弈论进行经济分析的开始。 20世纪世纪50-60年代,博弈论确立了发展的基础。年代,博弈论确立了发展的基础。1950-1951年,年,Nash发发表了两篇关于非合作博弈的重要论文。表了两篇关于非合作博弈的重要论文。1950

8、年,年,Tucker定义了定义了“囚犯难题囚犯难题”(prisoners dilemma) 。Nash和和Tucker的工作基本奠定了现代博弈论的工作基本奠定了现代博弈论的基础。的基础。 20世纪世纪60年代,泽尔腾(年代,泽尔腾( Selten )将纳什均衡的概念引入了动态分析。)将纳什均衡的概念引入了动态分析。1967-1968年,海萨尼(年,海萨尼(Harsanyi)发表了具有不完全信息的由)发表了具有不完全信息的由Bayesian局中人所进行的博弈。此后,局中人所进行的博弈。此后,他们两人长期合作,发展了非合作博弈理他们两人长期合作,发展了非合作博弈理论。论。 1994年诺贝尔经济学奖

9、获得者:年诺贝尔经济学奖获得者: 美国数学家美国数学家John F. Nash,德国经济学家,德国经济学家Reinhard Selten,美籍匈牙利,美籍匈牙利经济学家经济学家John C. Harsanyi。 1928年年Nash出生于美国,出生于美国,1950年获年获Princeton大学数大学数学博士学位,曾先后任教于学博士学位,曾先后任教于MIT和和Princeton大学。其博大学。其博士论文士论文非合作博弈非合作博弈首次区分了合作博弈与非合作博首次区分了合作博弈与非合作博弈,并且提出了非合作博弈的所谓弈,并且提出了非合作博弈的所谓Nash均衡概念。均衡概念。 1930年年 Selte

10、n出生于现属于波兰的德国城市,出生于现属于波兰的德国城市,1961年获法兰克福大学数学博士学位,曾先后任年获法兰克福大学数学博士学位,曾先后任教于柏林自由大学、比勒菲尔特大学和波恩大学。教于柏林自由大学、比勒菲尔特大学和波恩大学。其主要贡献是在博弈论中引入了动态分析。其主要贡献是在博弈论中引入了动态分析。 1920年年Harsanyi出生于匈牙利,出生于匈牙利,1947年获布达年获布达佩斯大学博士学位,后到美国,佩斯大学博士学位,后到美国,1954年获斯坦福大年获斯坦福大学博士学位,曾先后任教于澳大利亚国立大学、加学博士学位,曾先后任教于澳大利亚国立大学、加州伯克利分校。于州伯克利分校。于20

11、00年去世。他的贡献是将不完年去世。他的贡献是将不完全信息引入了博弈论的研究。全信息引入了博弈论的研究。二、经济博弈论主要概念及表述二、经济博弈论主要概念及表述 (playersplayers):指做决策的个体。每个局中人):指做决策的个体。每个局中人的目标都是通过选择行动来使自己的效用最大化。的目标都是通过选择行动来使自己的效用最大化。 虚拟局中人(虚拟局中人(pseudo-playerspseudo-players):指以一种纯机械的):指以一种纯机械的方式来采取行动的个体。自然是一种虚拟局中人,它在博方式来采取行动的个体。自然是一种虚拟局中人,它在博弈的特定时点上以特定的概率随机选择行动

12、。弈的特定时点上以特定的概率随机选择行动。 例如:例如: 你要出门,要决策是否带伞你要出门,要决策是否带伞 打牌打牌(actionsactions):是指局中人的决策变量。):是指局中人的决策变量。 局中人局中人i i的行动以的行动以a ai i表示,是他所能做的某一选择。局表示,是他所能做的某一选择。局中人中人i i的行动集(的行动集(action setaction set)是其可以采用的全部行动的)是其可以采用的全部行动的集合。一个行动组合(集合。一个行动组合(action profileaction profile)是一个由博弈中)是一个由博弈中的的n n个局中人每人选择一个行动所组成

13、的有序集。个局中人每人选择一个行动所组成的有序集。 例如:例如: 出门:带伞出门:带伞 或或 不带伞不带伞 打牌:出牌打牌:出牌(information)指局中人在博弈中的知识,特别是)指局中人在博弈中的知识,特别是有关其他局中人(竞争者或对手)的特征和行动的知识。有关其他局中人(竞争者或对手)的特征和行动的知识。 一般地,信息一般地,信息是以信息集(是以信息集(information set)的概念来)的概念来模型化的。可以将局中人的信息集看成是其在特定时点对于模型化的。可以将局中人的信息集看成是其在特定时点对于不同变量的取值的了解程度。不同变量的取值的了解程度。例如:例如: 对天气的判断(

14、出门)对天气的判断(出门) 对其他人的判断(打牌)对其他人的判断(打牌) 对产品了解的程度(装修)对产品了解的程度(装修) (strategies),是局中人选择行动的规则,是局中人选择行动的规则,它告诉局中人在什么时候选择什么行动。它告诉局中人在什么时候选择什么行动。例如:例如: “人不犯我,我不犯人;人若犯我,我必犯人人不犯我,我不犯人;人若犯我,我必犯人” 三个和尚没水喝三个和尚没水喝 (payoff):指每个参与人从博弈中获得的效用):指每个参与人从博弈中获得的效用水平。既可以指实际支付,也可以用来指期望支付。它是水平。既可以指实际支付,也可以用来指期望支付。它是所有局中人战略或行动的

15、函数,是每个局中人关注的核心所有局中人战略或行动的函数,是每个局中人关注的核心问题。问题。例如:例如: 出门带伞的成本为出门带伞的成本为2,如果下雨,有伞获得的,如果下雨,有伞获得的收益为收益为6,则实际得到的效用为,则实际得到的效用为4。 (outcome)是指在博弈结束后,建立博弈模型)是指在博弈结束后,建立博弈模型者从行动、支付和其他变量的取值中所挑选出来的他所感者从行动、支付和其他变量的取值中所挑选出来的他所感兴趣的要素的集合。兴趣的要素的集合。(equilibrium):指所有局中人的最优战略组合或行动):指所有局中人的最优战略组合或行动组合。或者,均衡组合。或者,均衡s*=(s1*

16、, sn*)指由博弈中的)指由博弈中的n个局中个局中人人每人选取的最佳战略所组成的一个战略组合。每人选取的最佳战略所组成的一个战略组合。 局中人局中人B 左左 右右 上上 2, 1 0, 0局中人局中人A 下下 0, 0 1, 2 小丽小丽 足球足球 芭蕾芭蕾 足球足球 2, 1 0, 0 大林大林 芭蕾芭蕾 0, 0 1, 2 一个博弈中需要的要素包括:局中人、行动、信息、战一个博弈中需要的要素包括:局中人、行动、信息、战略或策略、支付、结果和均衡。略或策略、支付、结果和均衡。 其中,对一个博弈的描述至少必须包括:局中人、战略其中,对一个博弈的描述至少必须包括:局中人、战略和支付。和支付。

17、局中人、行动和结果合起来统称为博弈规则(局中人、行动和结果合起来统称为博弈规则(rules of the game),博弈分析的目的在于运用博弈规则来确定均衡。),博弈分析的目的在于运用博弈规则来确定均衡。(uniqueness):公认的均衡概念并不能保证惟):公认的均衡概念并不能保证惟一性,缺乏惟一性是博弈论的主要缺陷或问题。例如,可能一性,缺乏惟一性是博弈论的主要缺陷或问题。例如,可能存在多种均衡,或者根本就没有均衡。存在多种均衡,或者根本就没有均衡。 解决方案:看重博弈的规则,而不是均衡概念。解决方案:看重博弈的规则,而不是均衡概念。双变量指在两个局中人的博弈中,每一双变量指在两个局中人

18、的博弈中,每一单元格都有两个数字单元格都有两个数字分别表示两个局中人的收益。分别表示两个局中人的收益。 局中人局中人B 左左 右右 上上 2, 1 0, 0局中人局中人A 下下 0, 0 1, 2 合作博弈(合作博弈(cooperative game):是以局中人整体的可):是以局中人整体的可能联合行动集合为基本要素。通俗地说,如果局中人能够能联合行动集合为基本要素。通俗地说,如果局中人能够达成有约束力的协议或合约,则该博弈称为合作博弈。合达成有约束力的协议或合约,则该博弈称为合作博弈。合作博弈强调的是集体理性。作博弈强调的是集体理性。 非合作博弈(非合作博弈(non-cooperative

19、game):是以单个局中):是以单个局中人的可能行动集合为基本要素的博弈。通俗地说,如果局人的可能行动集合为基本要素的博弈。通俗地说,如果局中人不能在博弈中达成有约束力的协议或合约,则称该博中人不能在博弈中达成有约束力的协议或合约,则称该博弈为非合作博弈。非合作博弈强调的是个体理性。弈为非合作博弈。非合作博弈强调的是个体理性。 信息经济学主要研究的是非合作博弈。信息经济学主要研究的是非合作博弈。 按照博弈的收益分配结果划分,博弈可以划分为零和博按照博弈的收益分配结果划分,博弈可以划分为零和博弈和非零和博弈。弈和非零和博弈。 零和博弈指在博弈中一组局中人所得到的支付(或收益)零和博弈指在博弈中一

20、组局中人所得到的支付(或收益)恰好是另一组局中人的损失。通俗地说,博弈结果总和为零恰好是另一组局中人的损失。通俗地说,博弈结果总和为零的博弈称为零和博弈。的博弈称为零和博弈。 非零和博弈指所有局中人的支付(或收益)的代数和不非零和博弈指所有局中人的支付(或收益)的代数和不为零。为正或为负。为零。为正或为负。 例如:赢钱与输钱为零和博弈;例如:赢钱与输钱为零和博弈; 工会与厂方达成增加工资的协议双方获得工会与厂方达成增加工资的协议双方获得“双赢双赢”。反。反之,罢工导致之,罢工导致“两败俱伤两败俱伤”。(symmetric information):指博弈中任一局):指博弈中任一局中人都至少包含

21、与其他每个局中人的信息集相同的元素。中人都至少包含与其他每个局中人的信息集相同的元素。 (asymmetric information):指至少有一个):指至少有一个局中人拥有私人信息(局中人拥有私人信息(private information)。)。(complete information):指局中人完全了解):指局中人完全了解其他局中人的收益或收益函数。通俗地说,局中人完全了解其他局中人的收益或收益函数。通俗地说,局中人完全了解其他局中人的特征、战略空间及支付函数。其他局中人的特征、战略空间及支付函数。 (incomplete information):指至少有一个):指至少有一个局中人

22、不完全了解其他局中人的收益或收益函数。局中人不完全了解其他局中人的收益或收益函数。(perfect information):指一个参与人对其):指一个参与人对其他参与人的行动选择有准确的了解。他参与人的行动选择有准确的了解。(Imperfect information):):指博弈中至少指博弈中至少有一个局中人不了解其他局中人的行动选择。有一个局中人不了解其他局中人的行动选择。 (static game):博弈中局中人同时选择行动,):博弈中局中人同时选择行动,或虽然不是同时行动但后行动者并不了解前行动者采取了或虽然不是同时行动但后行动者并不了解前行动者采取了什么具体行动。什么具体行动。 例

23、如:例如: “石头、剪刀、布石头、剪刀、布”的游戏的游戏 应聘者演讲(轮流,但其他人在外等候)应聘者演讲(轮流,但其他人在外等候) 1 1)田忌赛马的博弈是否属于静态博弈?)田忌赛马的博弈是否属于静态博弈? 2 2)企业中有哪些属于静态博弈的例子?)企业中有哪些属于静态博弈的例子? 3 3)当你知道对方)当你知道对方40%40%出石头,出石头,30%30%出布和出布和30%30%出剪刀,但不出剪刀,但不知道组合的顺序,你的最优策略是什么?知道组合的顺序,你的最优策略是什么?(dynamic game):指局中人的行动有先后顺):指局中人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动

24、。序,且后行动者能够观察到先行动者所选择的行动。 例如:例如: 下棋、打牌等游戏下棋、打牌等游戏 应聘者演讲(轮流,但后者可以听前者的演讲)应聘者演讲(轮流,但后者可以听前者的演讲) 博士答辩的安排顺序博士答辩的安排顺序 政府政策与企业行为之间政府政策与企业行为之间“上有政策,下有对策上有政策,下有对策”博弈:博弈: 关税水平与走私、税收与逃税之间的博弈;关税水平与走私、税收与逃税之间的博弈; 政府与企业之间政府与企业之间“鞭打快牛鞭打快牛”的博弈;的博弈; 政府官员政府官员“四菜一汤四菜一汤”规定的博弈。规定的博弈。 博弈的类型及对应的均衡概念博弈的类型及对应的均衡概念 行动顺序行动顺序 静

25、态结构静态结构 动态结构动态结构 信信 息息 (战略博弈)(战略博弈) (扩展博弈)(扩展博弈) 完全信息静态博弈完全信息静态博弈 完全信息动态博弈完全信息动态博弈 完全信息结构完全信息结构 Nash均衡均衡 子博弈精练子博弈精练Nash均衡均衡 Nash(1950,1951) Selten(1965) 不完全信息静态博弈不完全信息静态博弈 不完全信息动态博弈不完全信息动态博弈不完全信息结构不完全信息结构 贝叶斯贝叶斯Nash均衡均衡 精练贝叶斯精练贝叶斯Nash均衡均衡 Harsanyi(1967-1968) Selten(1975)等等 信息结构与行动结构框架图信息结构与行动结构框架图 静

26、态结构静态结构 动态结构动态结构 (战略博弈)(战略博弈) (扩展博弈)(扩展博弈) 完全信息结构完全信息结构 石头石头/剪刀剪刀/布布 围棋、象棋围棋、象棋 不完全信息结构不完全信息结构 赌赌 博博 黔驴技穷黔驴技穷 局中人局中人 1人博弈人博弈 2人博弈人博弈 多人博弈多人博弈 (个人与自然)(个人与自然) 零和零和 A C E博弈结果博弈结果 非零和非零和 B D F 假设一位花农需要决定种植花的品种,但无法知道明年的天气假设一位花农需要决定种植花的品种,但无法知道明年的天气情况,通过经验和资料得知明年各种天气类型出现的可能性是:情况,通过经验和资料得知明年各种天气类型出现的可能性是:S

27、1=0.2,S20.1,S30.4,S40.3。可以选择的花的品种为。可以选择的花的品种为3种。种。 不同的花在不同的气候条件下的收成为:不同的花在不同的气候条件下的收成为:S1S2S3S4A1121090A28844A3161232概率概率0.20.10.40.3如果只能选择一种花的话,花农应该选择种哪种花?如果只能选择一种花的话,花农应该选择种哪种花?期望值(期望值(A1)、大中最大()、大中最大(A3)、小中最大()、小中最大(A2)天天 气气品品 种种三、经典博弈思想及其应用三、经典博弈思想及其应用 通俗地说,通俗地说,Nash均衡是指由全部局中人的均衡是指由全部局中人的最优战略最优战

28、略组成组成的均衡。在其他局中人战略既定的情况下,没有任何单个局的均衡。在其他局中人战略既定的情况下,没有任何单个局中人会选择其他战略,从而没有任何局中人会打破这种均衡。中人会选择其他战略,从而没有任何局中人会打破这种均衡。 Nash 均衡是一个稳定状态的解。在这个(均衡是一个稳定状态的解。在这个(“僵局僵局”)状态下,每个局中人的决策依赖于均衡的知识。状态下,每个局中人的决策依赖于均衡的知识。(1)Nash均衡可能是高成本的均衡可能是高成本的(2)可能不存在纳什均衡)可能不存在纳什均衡(3)Nash均衡可能有多重解均衡可能有多重解 张张 三三 坦坦 白白 不坦白不坦白 坦坦 白白 -3, -3

29、 0, -6 李李 四四 不坦白不坦白 -6, 0 -1, -1 囚犯难题的推论:囚犯难题的推论: 1)可能不是帕累托最优;)可能不是帕累托最优; 2)个体理性与集体理性的不一致性;)个体理性与集体理性的不一致性; 3)表明制度安排的重要性;)表明制度安排的重要性; 4)在现实政治经济中,合作具有积极普遍的意义。)在现实政治经济中,合作具有积极普遍的意义。 军备竞赛军备竞赛 企业员工企业员工 交通堵塞交通堵塞 经济改革经济改革 投票选举投票选举 20多年前,美、苏两国是两个超级大国,他们相互对垒。多年前,美、苏两国是两个超级大国,他们相互对垒。假设他们有两种策略选择:扩军或裁军。双方选择的支付

30、如假设他们有两种策略选择:扩军或裁军。双方选择的支付如下:下: 苏苏 联联 扩扩 军军 裁裁 军军 扩扩 军军 -2000,-2000 8000,- 美美 国国 裁裁 军军 - ,8000 0,0 两个企业(两个企业(u1,u2)被问:是否同意建造一个新的下水)被问:是否同意建造一个新的下水管道以使地下水不被污染。假设建造下水管道需要投资管道以使地下水不被污染。假设建造下水管道需要投资120万。万。如同意各承担如同意各承担50%,下水管道对企业的价值分别是,下水管道对企业的价值分别是80万。万。 说明:产权界定与环境保护的制度建设对于公共资源的说明:产权界定与环境保护的制度建设对于公共资源的保

31、护是十分必要的。保护是十分必要的。 u2 不不同同意意 同同 意意 u1 不不同同意意 0,0 80,-40 同同意意 -40,80 20,20 假设:学生假设:学生A和和B各有财产各有财产300元;对风扇的福利评价分元;对风扇的福利评价分别为别为100元,风扇价格为元,风扇价格为160元,合伙买风扇的收益为元,合伙买风扇的收益为200-160 =40元。元。 学生学生B 买风扇买风扇 不买风扇不买风扇 买风扇买风扇 320,320 240,400 学生学生A 不买风扇不买风扇 400,240 300,300现实中的搭便车现象:现实中的搭便车现象: 灯塔、路灯等公共设施;灯塔、路灯等公共设施;

32、 污染等环境问题;污染等环境问题; 各种滥竽充数的广告、产品或服务。各种滥竽充数的广告、产品或服务。搭便车问题的主要解决方案:搭便车问题的主要解决方案: 中央集权制;中央集权制; 投票制:少数服从多数;投票制:少数服从多数; 征收克拉克税(如汽油税、过桥费)。征收克拉克税(如汽油税、过桥费)。 小小 偷偷 不不 偷偷 偷偷 不睡觉不睡觉 0, 0 0, -1 保安保安 睡睡 觉觉 1, 0 -1, 3每个局中人的战略空间为(正面,背面)每个局中人的战略空间为(正面,背面) 局中人局中人2 正面正面 背面背面 正面正面 -1, 1 1, -1 局中人局中人1 背面背面 1, -1 -1, 1 在

33、博弈中,一旦每个局中人都竭力猜测其他局中人的战在博弈中,一旦每个局中人都竭力猜测其他局中人的战略选择,就不存在略选择,就不存在Nash均衡(至少不存在前面定义的标准均衡(至少不存在前面定义的标准的的Nash均衡)。因为这时局中人的最优行动是不确定的,均衡)。因为这时局中人的最优行动是不确定的,而博弈的结果必然要包含这种不确定性。而博弈的结果必然要包含这种不确定性。 (boxed pigs) 假设按一下按钮要支付假设按一下按钮要支付2个单位成本,有个单位成本,有10个单位猪食进入猪槽。个单位猪食进入猪槽。又假设:又假设:1)大猪和小猪同时赶到,大猪吃)大猪和小猪同时赶到,大猪吃7个单位,小猪吃个

34、单位,小猪吃3个单位;个单位;2)大猪和小猪同时按按钮又同时赶到猪槽,扣除大猪和小猪同时按按钮又同时赶到猪槽,扣除2个单位成本后,大猪支个单位成本后,大猪支付水平为付水平为7- -2=5,小猪支付水平为,小猪支付水平为3- -2=1。3)大猪按按钮,小猪等待,)大猪按按钮,小猪等待,小猪先赶到,小猪吃小猪先赶到,小猪吃4个单位,大猪吃个单位,大猪吃6个单位。大猪支付水平为个单位。大猪支付水平为6- -2=4,小猪支付水平为小猪支付水平为4- -0=4。4)小猪按按钮,大猪等待,大猪先赶到,大猪)小猪按按钮,大猪等待,大猪先赶到,大猪吃吃9个单位,小猪吃个单位,小猪吃1个单位。大猪支付水平为个单

35、位。大猪支付水平为9- -0=9,小猪为,小猪为1- -2= - -1。 大大 猪猪 按按 等等 待待 按按 1, 5 -1, 9 小猪小猪 等待等待 4, 4 0, 0在每个行业中龙头企业都要承担三个在每个行业中龙头企业都要承担三个“大猪成本大猪成本”:1)市场开拓成本)市场开拓成本群狼策略;群狼策略;2)人才培训成本)人才培训成本猎头策略;猎头策略;3)商业模式创新成本)商业模式创新成本模仿策略。模仿策略。例如,例如,“大猪控股大猪控股”和和“小猪有限小猪有限”都计划引进一种新产品,但为了获都计划引进一种新产品,但为了获得公众的认同,须投入广告费用。如大猪控股打头阵,小猪有限跟进也得公众的

36、认同,须投入广告费用。如大猪控股打头阵,小猪有限跟进也可以获得一部分市场。相反,如小猪有限先进入,大猪控股就会后发制可以获得一部分市场。相反,如小猪有限先进入,大猪控股就会后发制任,独占市场。任,独占市场。 现实生活中的智猪博弈例子:现实生活中的智猪博弈例子: 领头企业与小企业(麦当劳与小快餐店)领头企业与小企业(麦当劳与小快餐店) 股票市场上的大户与小户股票市场上的大户与小户 企业的大股东和小股东企业的大股东和小股东 公共设施或基础设施投资:富人与穷人的博弈公共设施或基础设施投资:富人与穷人的博弈(battle of the sexes)假设条件:假设条件: 1)联合行动收益大于非联合行动收

37、益;)联合行动收益大于非联合行动收益; 2)非合作基础:影响力或影响因子相同。)非合作基础:影响力或影响因子相同。 丈丈 夫夫 足足 球球 芭芭 蕾蕾 足足 球球 2, 3 -1, - 1 妻妻 子子 芭芭 蕾蕾 1, 1 3, 2:在性别之战中,任一:在性别之战中,任一Nash均衡都是帕累托最优,其均衡都是帕累托最优,其他任一战略组合都不可能在不降低其他局中人支付的条件他任一战略组合都不可能在不降低其他局中人支付的条件下提高另一局中人的支付。下提高另一局中人的支付。:在性别之战的两个:在性别之战的两个Nash均衡中,究竟最终是哪个?均衡中,究竟最终是哪个? 情形一:彼此不沟通,出现非联合行动

38、;情形一:彼此不沟通,出现非联合行动; 情形二:可以通过博弈的重复进行形成共同知识情形二:可以通过博弈的重复进行形成共同知识(common knowledge),也有可能出现),也有可能出现Nash均衡;均衡; 情形三:局中人不沟通,但每晚重复进行这一博弈,情形三:局中人不沟通,但每晚重复进行这一博弈,他们将最终稳定在某一他们将最终稳定在某一Nash均衡上。均衡上。 假设两个相互竞争的蔬菜市场可以自己决定是开早市还假设两个相互竞争的蔬菜市场可以自己决定是开早市还是开夜市,但每个市场一天只能开一次。如果是开夜市,蔬是开夜市,但每个市场一天只能开一次。如果是开夜市,蔬菜就可以通过船运,如果是开早市

39、,就必须通过货车运输。菜就可以通过船运,如果是开早市,就必须通过货车运输。船运会比车运便宜。中国家庭主妇虽然传统上习惯早上买菜,船运会比车运便宜。中国家庭主妇虽然传统上习惯早上买菜,但如果菜价在夜市便宜许多,她们也有可能到夜市买菜。无但如果菜价在夜市便宜许多,她们也有可能到夜市买菜。无论如何一户一天只买一次菜(数学上称为不重叠组合)。论如何一户一天只买一次菜(数学上称为不重叠组合)。 问题:两个菜市场如何决定开早市还是开夜市,在决定问题:两个菜市场如何决定开早市还是开夜市,在决定之前是否应该相互合作?各种支付如下图。之前是否应该相互合作?各种支付如下图。 菜场菜场 B(S2) 早早 市市 夜夜

40、 市市 菜场菜场 A(S1) 早市早市 12,12 20,30 夜市夜市 30,20 18,18 (单位:千元)(单位:千元)(1)先动优势)先动优势 A企业企业 民用市场民用市场 军用市场军用市场 民用市场民用市场 -10, -10 30, 15 B企业企业 军用市场军用市场 15, 30 -10,-10(2)公平性合作战略)公平性合作战略(3)补偿性合作战略)补偿性合作战略(4)随机行动策略()随机行动策略(“李王庄李王庄”车站)车站) 勇士博弈是反映勇士博弈是反映20世纪世纪50年代美国青年的行为特征,并通年代美国青年的行为特征,并通过过Jame Dean主演的电影典型地表现出来:某个青

41、年集团中有主演的电影典型地表现出来:某个青年集团中有A和和B两人争斗集团头领。他们将通过一个勇气的测验来决定两人争斗集团头领。他们将通过一个勇气的测验来决定谁更勇敢,勇敢者就可以当头领。谁更勇敢,勇敢者就可以当头领。 测验规则如下:测验规则如下:A与与B各自驾驶自己的小车在一条道路上各自驾驶自己的小车在一条道路上面对面朝对方高速开去,谁第一个让开谁就输掉。让开者被称面对面朝对方高速开去,谁第一个让开谁就输掉。让开者被称为胆小鬼(为胆小鬼(chicken)而不能当头领。如果两人都不让开,结)而不能当头领。如果两人都不让开,结果是车毁人亡。如果两人同时让开,结果是平局。如果一方让果是车毁人亡。如果

42、两人同时让开,结果是平局。如果一方让开一方不让,让开者则既丢面子,又当不成头领。开一方不让,让开者则既丢面子,又当不成头领。 勇士博弈的支付矩阵如下。勇士博弈的支付矩阵如下。勇士博弈模型:勇士博弈模型: 局中人局中人B 前前 进进 避避 让让 前进前进 0, 0 8, 2 局中人局中人A 避让避让 2, 8 6, 6现实生活中的勇士博弈例子:现实生活中的勇士博弈例子: 警察与游行队伍警察与游行队伍 夫妻吵架夫妻吵架 产品销售中的竞争产品销售中的竞争勇士博弈中的有效策略:恫吓或威慑勇士博弈中的有效策略:恫吓或威慑路灯维修路灯维修道路铺设道路铺设囚徒博弈囚徒博弈智猪博弈智猪博弈勇士博弈勇士博弈(e

43、ntry deterrance) 假设局中人假设局中人A为潜在市场进入者,局中人为潜在市场进入者,局中人B为现有市场为现有市场的占有者。具体博弈模型如下所示:的占有者。具体博弈模型如下所示: 局中人局中人B:占有者:占有者 接接 纳纳 竞竞 争争 进入进入 20, 30 -10, 0 局中人局中人A: 进入者进入者 不进入不进入 0, 100 0, 100(focal points) 在以下的选择中,如果你的选择与其他局中人的选择一致在以下的选择中,如果你的选择与其他局中人的选择一致的次数越多,你就赢得越多,那么,你在博弈中将采取什么战的次数越多,你就赢得越多,那么,你在博弈中将采取什么战略?

44、略? (1)选择下述一个数并画圈:)选择下述一个数并画圈:7,100,13,261,99,666。 (2)你要在中山大学与一个没有来过中山大学的高中同学会)你要在中山大学与一个没有来过中山大学的高中同学会面,应在什么时间、什么公共地点碰面?面,应在什么时间、什么公共地点碰面? (3)选择下述一个数并画圈:)选择下述一个数并画圈:14,15,16,17,18,100。 (4)你与另外一人一起分蛋糕,你们各自报出期望分到的比)你与另外一人一起分蛋糕,你们各自报出期望分到的比例,但如果你们报的比例之和超过例,但如果你们报的比例之和超过100%,大家都将一无所获。,大家都将一无所获。 (5)假设你到一

45、个热带岛国去做市场营销,只允许带一样产)假设你到一个热带岛国去做市场营销,只允许带一样产品,你会选择带什么产品?品,你会选择带什么产品?就是出于心理或其他非理性原因受到人们共同就是出于心理或其他非理性原因受到人们共同关注的那些关注的那些Nash均衡。均衡。 在上述博弈中,每一个题目都有许多在上述博弈中,每一个题目都有许多Nash均衡。均衡。但是,在这些但是,在这些Nash均衡中,总有一些看起来或多或少可能均衡中,总有一些看起来或多或少可能性会更大一些。这些特点的战略组合就称为聚点。性会更大一些。这些特点的战略组合就称为聚点。 在重复博弈中,以往的经历或做法通常就确定在重复博弈中,以往的经历或做

46、法通常就确定了聚点的位置。例如,如果我们第一次分蛋糕,往往彼此了聚点的位置。例如,如果我们第一次分蛋糕,往往彼此可能会同意五五分成。但是,如果曾经按四六分成过,这可能会同意五五分成。但是,如果曾经按四六分成过,这个比例就为这次划分蛋糕提供了一个聚点。个比例就为这次划分蛋糕提供了一个聚点。 现实生活中聚点的例子:现实生活中聚点的例子: 企业承包分成比例企业承包分成比例 成行成市成行成市 沙滩零售店沙滩零售店 边界(边界(boundary)是一种特殊的聚点。在边界)是一种特殊的聚点。在边界外的行为存在极度的不确定性。边界一旦确定就具有重要的外的行为存在极度的不确定性。边界一旦确定就具有重要的作用和

47、公共约束力,如共同知识成为一种边界后,就构成行作用和公共约束力,如共同知识成为一种边界后,就构成行动规则。动规则。 例如:例如: 在商业领域,两家生产不益于健康的产品的公司可能会达在商业领域,两家生产不益于健康的产品的公司可能会达成某种默契,彼此都不在广告中提及各自产品对健康的影响程度。成某种默契,彼此都不在广告中提及各自产品对健康的影响程度。 家庭分工家庭分工 在没有明确的聚点之前,调解(在没有明确的聚点之前,调解(mediation)和)和沟通(沟通(communication)是十分重要的两种手段。)是十分重要的两种手段。 例如:例如: 商业纠纷或家庭财产纠纷中的律师或法庭商业纠纷或家庭

48、财产纠纷中的律师或法庭(subgame perfect Nash equilibrium) (1)如前述,在多个)如前述,在多个 Nash均衡中,究竟哪个均衡会成均衡中,究竟哪个均衡会成为最后的均衡?为最后的均衡? (2)在)在Nash均衡中,局中人不考虑自己的选择如何影均衡中,局中人不考虑自己的选择如何影响其他局中人的战略(因为是静态结构)。但在动态结构中,响其他局中人的战略(因为是静态结构)。但在动态结构中,后者会根据前者的行动来调整自己的战略,因此,会考虑自后者会根据前者的行动来调整自己的战略,因此,会考虑自己的选择对其他局中人的影响。己的选择对其他局中人的影响。 (3)由于不考虑自己选

49、择对其他局中人选择的影响,)由于不考虑自己选择对其他局中人选择的影响,Nash均衡允许存在不可信威胁(在现实中这是不真的)。均衡允许存在不可信威胁(在现实中这是不真的)。 所有动态博弈的核心问题是所有动态博弈的核心问题是 第一步:局中人第一步:局中人A选择支付选择支付1000元给局中人元给局中人B还是一分还是一分不给;不给; 第二步:局中人第二步:局中人B观察局中人观察局中人A的选择,然后决定是否的选择,然后决定是否引爆一颗手雷将两个人一起炸死。引爆一颗手雷将两个人一起炸死。 假设局中人假设局中人B威胁局中人威胁局中人A,如果他不支付,如果他不支付1000元就引元就引爆手雷,如果局中人爆手雷,

50、如果局中人A相信这个威胁,其最优反应是支付相信这个威胁,其最优反应是支付1000元;如果局中人元;如果局中人A不相信这个威胁,他认为即使给局中不相信这个威胁,他认为即使给局中人人B一个机会,让他将威胁付诸实施,局中人一个机会,让他将威胁付诸实施,局中人B也不会选择也不会选择去实施,这样,局中人去实施,这样,局中人A就会一分不给。就会一分不给。不可信与可信威胁不可信与可信威胁 设局中人设局中人A为潜在市场进入者,局中人为潜在市场进入者,局中人B为现有市场的为现有市场的占有者。博弈模型如下:占有者。博弈模型如下: 局中人局中人B:占有者:占有者 接接 纳纳 竞竞 争争 进入进入 20, 30 -1

51、0, 0 局中人局中人A: 进入者进入者 不进入不进入 0, 100 0, 100假设:假设: U1 为实施威胁的收益为实施威胁的收益 U2 为不实施威胁的收益为不实施威胁的收益可信威胁:可信威胁:U1 U2 ; 不可信威胁:不可信威胁: U2 U1例如:例如: 英国农民的故事英国农民的故事 母亲对儿子(不做作业)母亲对儿子(不做作业) 父亲对女儿(谈恋爱)父亲对女儿(谈恋爱)* 威胁与威慑的区别:明确与潜在的进攻或制裁信号。威胁与威慑的区别:明确与潜在的进攻或制裁信号。 Selten(1965)通过对动态博弈的分析完善了)通过对动态博弈的分析完善了Nash均衡的概念,均衡的概念,并定义了子博

52、弈精练并定义了子博弈精练Nash均衡的含义,将均衡的含义,将Nash均衡中包含不可信威胁均衡中包含不可信威胁的战略剔除出去,使均衡战略不再包含不可信的威胁。这样,就要求的战略剔除出去,使均衡战略不再包含不可信的威胁。这样,就要求局中人的选择在任何时点上都是最优的,局中人需要局中人的选择在任何时点上都是最优的,局中人需要“随机应变随机应变”或或“随需而变随需而变”,而不能因循守旧。,而不能因循守旧。 由于剔除了不可信威胁的战略,因而在多数情况下精练由于剔除了不可信威胁的战略,因而在多数情况下精练Nash均衡均衡缩小了缩小了Nash均衡的数量,这对于预测具有重要意义。均衡的数量,这对于预测具有重要

53、意义。 通俗地说,子博弈(通俗地说,子博弈(subgame)指包含在一个博弈模型中的一个或)指包含在一个博弈模型中的一个或若干个阶段博弈。若干个阶段博弈。 出国读出国读例如:例如: 考研考研 本科毕业本科毕业 在国内读在国内读 就业就业 子博弈是一个对于所有局中人的信息集而言都是单结子博弈是一个对于所有局中人的信息集而言都是单结的结,这个结的后续结以及在相应的终点结处的支付三个的结,这个结的后续结以及在相应的终点结处的支付三个要素所组成的博弈。要素所组成的博弈。 如果满足下列条件,一个战略组合就是一个子博弈精如果满足下列条件,一个战略组合就是一个子博弈精练练Nash均衡(均衡(subgame

54、perfect Nash equilibrium):): 1)它是整个博弈的)它是整个博弈的Nash均衡;均衡; 2)它的相关行动规则在每个子博弈上都是)它的相关行动规则在每个子博弈上都是Nash均衡。均衡。一个精练均衡首先必须是一个一个精练均衡首先必须是一个Nash均衡,但均衡,但Nash均衡不一定是精练均衡。只有那些剔除了不可信威胁均衡不一定是精练均衡。只有那些剔除了不可信威胁的的Nash均衡才是精练均衡才是精练Nash均衡。均衡。 (sequential rational):指一个局中人在博):指一个局中人在博弈的每一个点上都重新优化自己的选择,并且将自己在未弈的每一个点上都重新优化自己

55、的选择,并且将自己在未来会重新优化其选择这一点纳入到考虑之中。来会重新优化其选择这一点纳入到考虑之中。 (commitment):指局中人使自己的威胁战):指局中人使自己的威胁战略变得可信的行动。通过承诺行动,局中人可以明确地告略变得可信的行动。通过承诺行动,局中人可以明确地告诉其他局中人其威胁是可信的威胁,而不是不可信的威胁。诉其他局中人其威胁是可信的威胁,而不是不可信的威胁。 例如:例如: 企业威胁(宣布降价)企业威胁(宣布降价) 破釜沉舟破釜沉舟 两个房地产商两个房地产商A和和B,他们要作出是否在,他们要作出是否在H市进行开发的市进行开发的决策。他们面临两种市场需求的情况。决策。他们面临

56、两种市场需求的情况。 高需求情况高需求情况 B 开发开发 不开发不开发 A 开发开发 4000,4000 8000,0 不开发不开发 0,8000 0,0 低需求情况低需求情况 B 开发开发 不开发不开发 A 开发开发 -3000,-3000 1000,0 不开发不开发 0,1000 0,0 N 高高 低低 A A 开发开发 不不 开发开发 不不 B B B B 开开 不不 开开 不不 开开 不不 开开 不不 (4,4) (8,0)()(0,8)()(0,0)()(-3,-3)()(1,0)()(0,1)()(0,0) 假设有一家连锁店(局中人假设有一家连锁店(局中人A)在)在20个城镇中有分

57、店,个城镇中有分店,其编号为其编号为1,2,20。同时,在每一个城镇都有一个潜。同时,在每一个城镇都有一个潜在的竞争者,即有一家公司可能通过银行贷款建立同样类在的竞争者,即有一家公司可能通过银行贷款建立同样类型和规模的商店,第型和规模的商店,第k个城镇的潜在竞争者被称为局中人个城镇的潜在竞争者被称为局中人k。这样,就形成了一个局中人这样,就形成了一个局中人A与它的与它的20个潜在竞争者,即局个潜在竞争者,即局中人中人k,k=1,20之间的一场博弈。之间的一场博弈。 如果从传统的博弈论来考虑问题,结论应该是每个潜在如果从传统的博弈论来考虑问题,结论应该是每个潜在竞争者在条件许可下,都会采取竞争者

58、在条件许可下,都会采取“进入进入”策略,即开设一策略,即开设一家与连锁店同类型的商店,而连锁店则应该对新开设的商家与连锁店同类型的商店,而连锁店则应该对新开设的商店采取店采取“接纳接纳”策略,以便取得更多的收益。策略,以便取得更多的收益。 然而,这个结论与实际情况并不符合。几乎所有的人都然而,这个结论与实际情况并不符合。几乎所有的人都会认为,连锁店应该对新开设的商店采取会认为,连锁店应该对新开设的商店采取“攻击攻击”策略,以策略,以保持其垄断地位。另一种方案是连锁店对前面保持其垄断地位。另一种方案是连锁店对前面N家商店采取家商店采取“攻击攻击”策略,而对后策略,而对后20-N家采取家采取“合作

59、合作”策略。这种方案策略。这种方案似乎更符合实际。似乎更符合实际。 Selten对这个对这个“连锁店博弈悖论连锁店博弈悖论”进行了深入分析,提进行了深入分析,提出了分层次的理性抉择的概念,认为人们对察觉到的理性解出了分层次的理性抉择的概念,认为人们对察觉到的理性解决方案,不一定会采取行动。决方案,不一定会采取行动。Selten连锁店博弈模型的应用:连锁店博弈模型的应用: 爱情博弈模型:爱情博弈模型:n个小伙子同时爱上一位姑娘,每个个小伙子同时爱上一位姑娘,每个小伙子的占有策略是什么?小伙子的占有策略是什么? 对于任意局中人对于任意局中人i,竞争者均为,竞争者均为n-1个。个。 毛泽东抗日战争与

60、解放战争时期的策略:毛泽东抗日战争与解放战争时期的策略: * 抗日战争时期:抗日民族统一战线抗日战争时期:抗日民族统一战线 * 解放战争时期:除国民党顽固派之外的所有力量解放战争时期:除国民党顽固派之外的所有力量 春秋战国时期:秦国春秋战国时期:秦国“远交近攻远交近攻”策略策略 市场竞争策略市场竞争策略(repeated play) 重复博弈,即是战略依存的厂商(局中人)在长期内相重复博弈,即是战略依存的厂商(局中人)在长期内相互竞争的状态。互竞争的状态。 在现实中,寡头垄断厂商之间存在重复博弈。重复博弈在现实中,寡头垄断厂商之间存在重复博弈。重复博弈将改变局中人对博弈的观点,并产生基于长期考虑的新战

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论