




已阅读5页,还剩54页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,第八章博弈论GameTheory,.,主要内容,1.博弈论概述2.完全信息静态博弈3.完全信息动态博弈4.不完全信息静态博弈5.不完全信息动态博弈,.,一博弈论概述,博弈论(Cametheory)又称对策论、游戏理论或策略运筹学。它最早由德国数学家,哲学家莱布尼兹于1710年提出。1713年,杰姆斯瓦尔德格雷夫首次提出了对策论中的极大中的极小定理(minimax)。然而,直到1944年,以冯诺依曼和奥斯卡摩根斯坦合著博弈论与经济行为一书的出版为标志,博弈论才得以广泛应用于经济学领域,并成为微观经济学的一个新的重要组成部分。,.,博弈思想最早产生于我国古代。早在两千多年的春秋时期,孙武在孙子兵法中论述的军事思想和治国策略,就蕴育了丰富和深刻的对策论思想。孙武的后代孙膑,为田忌谋划,巧胜齐王,这个著名的“田忌赛马”,就是典型的对策思想的成功运用。,.,1994年10月11日,瑞典皇家科学院公布了该年度诺贝尔经济学奖评先结果:美国普林斯顿大学的纳什(F.J.Nash)和加利福尼亚大学的豪尔绍尼(J.Harsanyi)与德国波恩大学经济学家泽尔腾(Reinhard.selten),因长期致力于博弈论及其在经济学中运用的研究,共同获此殊荣。,.,纳什JohnNash,.,.,2005年10月10日,瑞典皇家科学院在瑞典首都斯德哥尔摩的皇家科学院议事厅宣布,将2005年诺贝尔经济学奖授予有以色列和美国双重国籍的罗伯特奥曼和美国人托马斯谢林,以表彰他们通过博弈理论的分析增强世人对合作与冲突的理解。,.,博弈论与传统经济学有关理论的区别,传统经济学涉及的个人决策,是在给定价格参数和收入的条件下,追求效用最大化的决策(消费者均衡或生产者均衡);个人效用只依赖于自己的选择,而外在于他人的选择;个人最优选择只是价格和收入的函数而不包含其他人选择的函数。在博弈论看来,个人效用不仅依赖于自己的选择,而且依赖于他人的选择;个人的最优选择是其他人选择的函数。,.,非合作博弈的发展,博弈论包括合作博弈与非合作博弈两种类型。我们谈到的博弈论,一般是指非合作博弈,如下象棋等。非合作博弈创立于50年代。1950年,22岁的纳什连续发表两篇划时代的论文:N个人对策的均衡点与讨价还价问题,1951年又发表了非合作对策。(纳什均衡)塔克(A.Tucker)在1950年他的一篇名为两个之谜的论文中对“囚徒困境”作了明确的定义。他们两人的著作基本上奠定了现代非合作博弈论的基石。,.,泽尔腾则在60年代中期将纳什均衡的概念引入动态分析。他在1965年发表需求减少条件下寡头垄断模型的对策论描述一文,提出了“子博弈精炼纳什均衡”(SubgameperfectNashequilibrium)的概念,又称“子对策完美纳什均衡”。这一研究对纳什均衡进行了第一次改进,选择了更具说服力的均衡点。,.,豪尔绍尼在60年代末把不完全信息引入博弈分析。他在1967年发表的开拓性论文由贝叶斯局中人参加的不完全信息博弈中重新给出了不完全信息的新定义,并由此提出“贝叶斯均衡”的概念。进入80年代后,克瑞普斯(kreps)和威尔逊(wilson)则对不完全信息动态博弈的研究作出了突出的贡献,并提出了更高级的均衡概念:“贝叶斯精炼纳什均衡”或称“完美贝叶斯均衡”。,.,1博弈论在经济学领域中应用最广泛,最成功;博弈论的许多成果也是借助于经济学的例子来发展引申的;2经济学家对博弈论的贡献也越来越大,特别是在动态分析和不完全信息引入博弈后,例如克瑞普斯,威尔逊都是经济学家;3最根本性的原因是经济学和博弈论的研究模式是一样的,都强调个人理性,即追求给定条件下效用最大化。,博弈专家之所以获经济学奖,原因大致有三点:,.,博弈论的基本概念,博弈是指一些个人、团队或组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自从中取得相应结果的过程。博弈论就是描述在这种形势下各方理性地选择自己的行动所实现的结果,分析各决策主体的行为发生相互作用时的决策以及这种决策的均衡问题。,.,例:房地产开发,1、AB两个开发商,投资1亿;2、如果市场上有两栋房出售,需求大,每栋:1.4亿;需求小,每栋:7千万;如果市场上有一栋房出售,需求大,每栋:1.8亿;需求小,每栋:1.1亿;3、开发与不开发。,.,8种可能的结果,1、需求大,A开发,B不开发,则A的利润8千万,B的利润为0;2、需求大,A开发,B开发,则A的利润4千万,B的利润4千万;3、需求大,A不开发,B开发,则A的利润0,B的利润为8千万;4、需求大,A不开发,B不开发,利润各为0,.,5、需求小,A开发,B不开发,则A的利润1千万,B的利润为0;6、需求小,A开发,B开发,则A的利润-3千万,B的利润-3千万;7、需求小,A不开发,B开发,则A的利润0,B的利润为1千万;8、需求小,A不开发,B不开发,利润各为0,.,如果需求是不确定的,是否开发依赖于各自在多大程度上认为市场需求是大的及对方是否开发。例:如需求大的概率为0.3,A认为B开发的可能性为x,那么A开发的期望利润为:Eu=0.34000 x+8000(1-x)+0.7-3000 x+1000(1-x)A不开发的期望利润为0。解Eu0 x31/40,.,博弈三要素、信息及博弈均衡,(1)局中人(player):指参加博弈的各个决策个体,既可以是自然人,也可以是团体。局中人都是“理性”的,即他清楚地了解自己的目标或利益所在,在决策时考虑自己的知识(信息)以及对其他局中人策略的期望,总是采取最佳行动(或策略)以实现其支付的最大化。虚拟局中人:自然,是外部随机变量,对所有利益主体都无差异。,.,(2)行动与策略(actionsorstrategies)。行动是局中人在博弈的某个时点的决策变量;每一个局中人的所有可能选择的行动的集合称这该局中人的行动空间(actionspace);所有局中人的行动的一个有序集合称为该博弈的一个行动组合(actionprofile);策略是局中人在所有给定信息集(信息集是局中人在特定时刻进行决策时所面对的集合)下的行动规则,他规定局中人在什么时候选择什么行动。,.,策略和行动不是等同的,它是行动的规则而不是行动本身,策略必须具有完备性,即一个策略是关于行动的一个完整计划它明确了局中人在每一种可能情况下对可行动的选择;一个局中人所有可能策略的集合称为该局中人的策略空间(stratgyspace),所有局中人策略的一个有序集合称为博弈的一个策略组合(strategyprofile。Si=siS=(s1,s2,sisn)如果一个策略规定局中人在每一个给定信息的情况下,选择一种特定的行动,则这个策略称为纯策略(purestrategies)。相反,如果一个策略规定局中人在每一个给定信息的情况下,以某种概率分布随机地选择不同的行动,则这种策略称为混合策略(mixedstrategies),.,(3)支付(payoff):指在一个特定的策略组合下,局中人得到的效用水平或期望效用水平。一个局中人的支付是所有局中人的策略选择的函数,它不仅取决于自己的策略选择,而且还取决于(他所设想的)所有其他局中人的策略选择,任何一个局中人改变自己的策略都将影响其他局中人的支付水平,即,局中人之间的利益是相互牵制的和制约的。所有局中人的支付的一个有序集合称为博弈的一个支付组合(payoffprofile。Ui=Ui(s1,s2,sisn)参与博弈的多个局中人的收益可用一个矩阵或框图表示,这种矩阵或框图叫做收益矩阵。,.,(4)信息(information):是局中人有关博弈的知识,特别是有关其他局中人的特征(如策略空间、支付函数等等)和行动的知识。信息集(informationsets)是局中人在特定时刻进行决策时,所面对的信息变量值的集合。共同知识(commonknowledge)是指“所有局中人知道,所有局中人知道所有局人知道,”(或信息)。如果局中人的策略选择、支付函数等都是共同知识,则称之为完全信息(completeinformation),否则就是不完全信息(incompleteinformation),.,(5)博弈均衡(gamesequilibrium):是指所有局中人的最优策略组合。这里所讲的均衡与一般均衡是有区别的,前者是局中人的最优策略组合,即局中人之间的冲突与合作达到一种相对稳定的状态;而后者则是这种策略组合所产生的结果。从某种程度上讲是“均衡”和“均衡结果”的关系。前者是一种动态概念,后者是一种静态概念。与纯策略相对应的均衡是纯策略均衡,与混合策略相对应的均衡是混合策略均衡。,.,博弈的类型,根据博弈者选择的策略,博弈论可划分为合作博弈与非合作博弈。纳什(Nash)、泽尔腾(Selten)和豪尔绍尼(Harsanyi)(1994诺贝尔经济学奖获得者)的主要贡献在于非合作博弈方面,而且现在大多数经济学家论及博弈时,也主要是指非合作博弈。,.,合作博弈和非合作博弈的区别在于人们的行动为相互作用时,当事人能否达成一个具有约束力(bindingagreement)的协议。若有,就是合作博弈;否则就是非合作博弈。合作博弈强调的是团体理性、效率、公正和公平。非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的。,.,从局中人行动的先后顺序可划分为静态博弈(Staticgame)和动态博弈(dynamicgame)。静态博弈是指在博弈中,局中人同时选择行动或虽非同时行动但后行动者并不知道先行动者采取了什么具体行动。动态博弈是指局中人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。,.,从局中人是否具有有关其他参与人(对手)的特征、策略空间及支付函数方面的知识的角度,可划分为完全信息博弈(gameofcompleteinformation)和不完全信息博弈(gameofincompleteinformation)。此外,根据支付结构不同:常和与变和博弈,.,博弈的分类,.,博弈的表述方式:策略式与扩展式,策略式:支付矩阵,.,扩展式:博弈树,A,.,博弈论进入主流经济学,反映了经济学发展的以下几个趋势:,第一,经济学研究的对象越来越转向个体,放弃了一些没有微观基础的假定,如消费函数及其投资函数、销售最大化等,一切从个人效用函数及其约束条件开始,解约束条件下的个人效用函数及其约束条件开始,解约束条件下的个人效用最大化问题而导出行为及均衡结果。,.,第二,经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和作用,人们之间的利益冲突与一致,竞争与合作的研究。第三,经济学越来越重视对信息的研究,特别是信息不对称对个人选择及制度安排的影响。,.,通常情况下,每个局中人的支付是博弈中所有参与人策略的函数,故每个局中人的最优策略选择依赖于所有其他参与人的策略选择。但在一些特殊博弈中,一个参与人的最优策略选择可能并不依赖于其他参与人的策略选择,即无论其他参与人选择什么策略,他的最优策略是唯一的,这种最优策略被称为“占优策略”(dominantstrategy)。例:“囚徒困境”囚徒困境是博弈论中的经典案例。该故事讲的是,两个嫌疑犯作案后被警察抓住,分别被关在不同的房间里进行审讯。警察知道两人有罪,但缺乏有力的证据,除非两人之中有一个坦白。警察告诉每个人,他们的可选择的策略与支付如下表:,占优策略均衡,.,在该博弈中,每个囚徒有两种可能选择的策略:坦白和抵赖。显然,无论同伙选择什么策略,每个囚徒的最优策略都是“坦白”。如,B选择坦白,若A选择坦白时支付为-8,选择抵赖时支付为-10,因而坦白比抵赖好;若B选择抵赖,A坦白时的支付为0,抵赖时为-1,因而坦白比抵赖好。即是说,“坦白”是A的占优策略。同样,“坦白”也是B的占优策略。,.,广告战,A,B,不广告,广告,不广告,10,5,15,0,6,8,10,2,.,重复剔除的占优策略均衡,在绝大多数博弈中,并不存在占优策略均衡。但在有些博弈中,仍可应用占优的逻辑找出均衡。案例:“猪智博弈”猪圈里有两头猪(大猪和小猪),猪圈一头有一猪食槽,另一头安装着一个按制猪食供应的按钮,按一下钮,有8个单位的猪食进槽,但需2个单位的成本。两头猪有两种策略:按钮和等待。具体的博弈支付和结果如下表:,.,按按钮对对吃食量的影响,猪智博弈,.,依赖于小猪的策略:若小猪选“等待”,大猪的最优策略是“按”;若小猪选“按”,大猪的最优策略为“等待”。因此,不能用上述占优策略找出均衡。可能的均衡是什么呢?若小猪是理性的,他只会选“等待”,因为“等待”严格优于“按”。假定大猪知道小猪是理性的,则会预测到小猪的选择;此时,大猪的最优选择只能是“按”。因此,(按,等待)是该博弈唯一的均衡。找出上述均衡的思路是:先找出某个参与人的劣策略(假定存在),把它剔除,重新构造一个不包含已剔除策略的新博弈;然后再剔除新博弈中某个参与人的劣策略;直至剩下一个唯一的策略组合。该策略组合就是博弈的均衡解,称为“重复剔除的占优策略,.,例:找出下列博弈的重复剔除的占优策略均衡,.,解:,.,纳什均衡,纳什均衡(Nashequilibrium)是指这样一种均衡,博弈中的每个局中人都确信,在其他局中人策略给定的情况下,他选择了最优策略。博弈的理想结局是,每个局中人选择的策略是对其他局中人所选策略的最佳反应,其中每一个局中人都不能因单方面改变自己的策略而获益。,.,策略组合就是一个纳什均衡。表,.,斗鸡博弈,A,B,进,退,进,退,-3,-3,2,0,0,2,0,0,.,麦片商博弈,A,B,咸麦片,甜麦片,-5,-5,10,10,10,10,-5,-5,.,承诺行动,如果参与人能在博弈前采取某种措施改变自己的行动空间或支付函数,原来不可置信的威胁就可能变的可置信,博弈的均衡结果就会相应改变。这些为改变博弈结果而采取的措施即是“承诺行动”。如果一个承诺可以改变对手的最优选择,该承诺为完全承诺;如果一个承诺只是增加行动的成本而不是使该行动完全没有可能,该承诺为不完全承诺。,.,将承诺行动纳入模型的一个方法是明确将承诺行动作为初始阶段的“行动”包括在博弈中。例:在A决策前,B与某个客户签定一个合同,规定B交房的期限,如B不能履约,将赔偿客户3500万。这个合同就是一个承诺行动,这样B的开发,开发就是一个可置信的威胁,子博弈精炼纳什均衡是(不开发,开发,开发),而不是原来的(开发,不开发,开发)。可置信的威胁与不可可置信的威胁,.,重复博弈,一、重复博弈与序列博弈的区别1、在序列博弈中,上阶段的选择决定下阶段的选择,重复博弈的不同阶段则不存在这一必然联系;2、在序列博弈中,每个阶段的博弈结构彼此不同,重复博弈则是同样结构,重复多次;3、在序列博弈中,不仅有多个阶段博弈,而且每个阶段博弈都有先有后,重复博弈虽然有多个阶段,但各个阶段可以是同时博弈,也可以是先后博弈;,.,4、重复博弈与序列博弈都追求收益最大化,但前者并不追求每个阶段收益最大化,而是追求所有阶段收益的贴现值或加权平均值最大化,不因眼前局部利益而牺牲长远整体利益。,.,有限重复博弈-田忌赛马,田,齐,.,如果双方都采取混合策略,以相同概率随机选择出马次序,齐威王和田忌每次比赛的期望收益依次为1,-1:(3+1+1+1-1+1)/6=1(1-3-1-1-1-1)/6=-1如比赛为t次,则齐威王收益收益t,田忌收益收益-t。,.,囚犯困境的重复博弈,1、有限重复博弈囚犯困境重复博弈的总收益为:-8t,-8t,改变的只是总收益不改变均衡结果,.,2、无限
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国卫浴镜行业市场发展现状及投资战略咨询报告
- 线框项目投资可行性研究分析报告(2024-2030版)
- 税务师网校课件评价
- 星空主题商业计划书
- 2024年中国金属铥行业市场深度评估及投资方向研究报告
- 弹簧酒架项目投资可行性研究分析报告(2024-2030版)
- 2025年中国品牌燕麦片(麦片) 未来发展趋势分析及投资规划建议研究报告
- 中国凤凰木行业市场发展现状及投资潜力预测报告
- 2025-2030年中国化肥检测筛行业深度研究分析报告
- 2025年中国冲洗器市场运行格局及投资战略研究报告
- 餐饮老人临时用工协议书
- T/SHSOT 015.1-2024皮肤角质层胶带剥离方法及应用第1部分:角质层剥离方法
- 2025甘肃省农垦集团有限责任公司招聘生产技术人员145人笔试参考题库附带答案详解
- 2025至2030年中国豆角丝行业投资前景及策略咨询报告
- 消防心理测试题或答案及答案
- 全国中级注册安全工程师考试《其他安全》真题卷(2025年)
- 南开大学-商业健康保险与医药产业高质量协同发展-团体补充医疗保险改革新视角-2025年3月20日
- 弱电安防施工安全培训
- 电梯维保半年工作总结
- 12《寻找生活中的标志》(教学设计)-2023-2024学年二年级上册综合实践活动鲁科版
- 七年级道法下册 第二学期 期末综合测试卷(人教海南版 2025年春)
评论
0/150
提交评论