博弈与决策导论_第1页
博弈与决策导论_第2页
博弈与决策导论_第3页
博弈与决策导论_第4页
博弈与决策导论_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、博弈与决策导论第1页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 12课前小问题:博弈论之英雄(美人)救美人(英雄)记背景:有一座城堡,仅有南、北两个城门可以入内,城堡内驻扎了三个排的士兵看守城门。事件:你的心上人被关押在城堡内,攻入城堡就可营救出他(她)。条件:1、你只拥有两个排的兵力。 2、通往南北城门各自只有一条道路,去往两城门的道路不相通(你只能一条道走到底) 3、你方兵力少于或相同于对方时你肯定失败(所谓守易攻难),你方兵力超过对方则能成功破城,兵力调度只能以排为单位。 4、两兵相接时就不能再变动兵力布置。问题:你有

2、多大的概率救出你的心上人?第2页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 13教材:经济博弈论(第三版) 复旦大学出版社,2007年1月经济博弈论习题指南 复旦大学出版社,2003年1月第3页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 14学习要求:任何课程的知识都具有连贯性,所以不要经常逃课,更不能让教材“一尘不染”。听课时要多作笔记,笔记是知识的框架,教材是对知识的充实。二者缺一不可。对于老师布置的习题,要认真完成,以巩固所学的知识。学习时要搞清理论

3、,特别要注意结论成立的条件。 第4页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 15课程安排第一章 导论第二章 完全信息静态博弈第三章 完全且完美信息动态博弈第四章 重复博弈第五章 完全但不完美信息动态博弈第六章 不完全信息静态博弈第七章 不完全信息动态博弈第八章 有限理性和进化博弈第5页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 16第一章 导论 本章介绍博弈论的基本概念,包括什么是博弈和博弈论,给出一些经典博弈例子。对博弈分类和博弈理论的结构作一些讨论

4、,对博弈论的发展历史等作简单介绍。目标是让读对博弈论的内容和博弈模型有更直观的概念和印象,本教材的基本内容,以及博弈分析的基本思想方法等形成初步的认识,为后面各章展开详细分析作好铺垫和准备。第6页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 171.1什么是博弈论一、从游戏到博弈1、Game theory博弈就是策略对抗,或策略有关键作用的游戏游戏特征:(1)规则(2)结果(3)策略(4)策略与利益相互依存第7页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1

5、82、身边的博弈例子(1)无谓竞争如果本门课程按比例来给分,无论卷面分数是多少,只有40%的人能获得优秀,40%的人能获得良好。学生的反应:所有学生都达成一个协议:大家都不要太用功,如何?想法不错,但无法实施。第8页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 19稍加努力就可胜过他人,诱惑太大了问题是:所有人都这么做。结果:所有人的成绩都不比大家遵守协议来得高;而且,大家还付出了更多的功夫。(囚徒困境)还有其它什么例子?占座/军备竞争第9页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game T

6、heory-Lecture 1102、身边的博弈例子(2) 两职员上午开车外出办事,因处理了些许私人事件而耽误了下午及时返回公司工作,遂向老板谎称轮胎漏气去修理厂修理而耽误时间。老伴分别向他们提问:“哪个轮胎漏气了?该如何应答?聚(焦)点(focal point) 博弈 第10页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1112、身边的博弈例子(3)为何教授如此严厉许多教授强硬规定:不许补考,不允许迟交作业或论文教授为何如此苛刻?如果允许某种迟交,而教授又无法辨别真伪,则学生总是会迟交。期限本身就没意义了为避免此现象,只有

7、一种策略:没有例外的策略第11页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 112问题:一个好心肠的教授如何来维持铁石心肠的承诺?找到是拒绝变得强硬和可信的方法:拿行政程序或学校政策做挡箭牌;在课程开始时作出明确和严格的宣布;通过严打几次获得“冷面杀手”的声誉第12页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1132、身边的博弈例子(4)“濒危”舍友宿舍饮用水告罄,需要打开水了。自己亲自动手还是寄希望于别人僵持一阵子,有人失去耐心而选择让步争吵胆小鬼博弈

8、(game of chicken)消耗战(war of attrition)第13页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1142、身边的博弈例子(5)约会博弈(the dating game)他(她)真的是个好男孩(女孩)吗?他(她)真心爱我吗?燕赵晚报上的八卦新闻:女孩在情人节谎称被绑架,要男孩往一银行卡上打5000元。女孩使用的是筛选策略,男孩要么照办(真心爱她);要么拒绝(缺乏真心)第14页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 115此

9、类博弈中真正的策略是信息的批露传递关于自己好信息的策略称为“信号”(signals)例子:教育诱使他人采取行动,以可靠显示其私人信息(好或坏)的策略,称为“筛选”(screening)例子:数量折扣第15页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 116二、一个非技术性的定义博弈:一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。1、博弈的参加者(players)2、各博弈方各自可选择的全部策略(strategies

10、)或行动(actions)的集合3、进行博弈的次序(orders)4、博弈方的得益(payoffs)第16页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1171.2 几类经典的博弈模型一、囚徒困境1950年图克提出的,用于研究经济效率问题博弈方:两小偷(囚徒)策略:坦白、抵赖次序:同时收益:都坦白,各关押5个月;都抵赖,各关押1个月;一方坦白一方抵赖,坦白方释放,抵赖方关押8个月可以用得益矩阵的方式表示-1 , -1-8 , 0 0 , -8-5 , -5囚徒1囚徒2坦白抵赖坦白抵赖第17页,共40页,2022年,5月20日

11、,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1181.2 几类经典的博弈模型得益矩阵表示形式-1 , -1-8 , 0 0 , -8-5 , -5囚徒1囚徒2坦白抵赖坦白抵赖博弈方策略得益囚徒1:坦白囚徒2:坦白第18页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1191.2 几类经典的博弈模型二、赌胜博弈特点:一方所得等于另一方所失,不可能双赢,属于零和博弈博弈方:两玩家:一方盖,一方猜策略:正面朝上、反面朝上次序:同时收益:对方猜错赢1元钱,对方猜中输1元钱;猜中赢1元钱,猜错输1元钱

12、-1 , 1 1 , -1 1 , -1-1 , 1盖方猜方反面朝上正面朝上反面朝上正面朝上不让对方猜出自己的策略而自己尽可能猜出对方策略第19页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1201.2 几类经典的博弈模型三、产量决策的古诺模型博弈方:n个厂商策略:生产及投放市场的产量(无数个)次序:同时收益:利润无法用得益矩阵的方式表示,利用得益函数方式表述策略和得益的依存关系i=Ri-Ci =P(Q)qi-cqi =P(qi-cqi)第20页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Gam

13、e Theory-Lecture 1211.3 博弈结构和博弈分类研究问题不同博弈模型各异(博弈结构不同一、博弈中的博弈方(players)博弈方:独立决策、独立承担博弈结果的个人或组织博弈规则面前博弈方之间平等,不因博弈方之间权利、地位的差异而改变博弈方数量对博弈结果和分析有影响根据博弈方数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈,单人博弈是退化的博弈第21页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 122一、 博弈中的博弈方(一)单人博弈一般的最优化问题例:商人运货(价值9万)水路运费7千,陆路运费1万

14、,但水路有风险好天气(概率75%)时可平安抵达,坏天气(概率25%)时货物损失10%。 如何决策?分析:引入一个博弈方0(自然 nature)博弈方:商人、自然策略:商人:水路/陆路;自然:好天气/坏天气次序:同时得益:博弈方0的得益不考虑,仅商人的得益要考虑-7000-16000 -10000-10000商人自然坏天气(25%)水路陆路好天气(75%)信息拥有越多决策准确性越高第22页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 123一、 博弈中的博弈方(二)两人博弈两人博弈即有两个博弈方的博弈两人博弈最常见,研究最多,是

15、最基本和有用的博弈类型囚徒困境、猜硬币、齐威王田忌赛马等都是两人博弈两人博弈有多种可能性,博弈方的利益方向可能一致,也可以不一致 1 ,1 0 ,0 0 ,0 1 ,1女孩男孩西门南门西门南门第23页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 124一、 博弈中的博弈方(二)多人博弈三个博弈方之间的博弈可能存在“破坏者”:其策略选择对自身的利益并没有影响,但却会对其他博弈方的利益产生很大的,有时甚至是决定性的影响。多人博弈的表示有时与两人博弈不同,需要多个得益矩阵,或者只能用描述法第24页,共40页,2022年,5月20日,

16、3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1251.3 博弈结构和博弈分类二、博弈中的策略(strategies)策略:博弈中各博弈方的选择内容策略有定性定量、简单复杂之分不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同有限博弈:每个博弈方的策略数都是有限的无限博弈:至少有某些博弈方的策略有无限多个第25页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1261.3 博弈结构和博弈分类三、博弈中的得益(payoffs)得益:各博弈方从博弈中所获得的利益得益对应博弈的结果,也就是各博弈方

17、策略的组合得益是各博弈方追求的根本目标及行为和判断的主要依据数量、利润、收入、量化的效用、社会效益、福利等根据得益的博弈分类:零和博弈、常和博弈、变和博弈第26页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 127三、博弈中的得益(一)零和博弈:也称“严格竞争博弈”。博弈方之间利益始终对立,偏好通常不同 猜硬币,田忌赛马,石头-剪刀-布(二)常和博弈:博弈方之间利益的总和为常数。博弈方之间的利益是对立的且是竞争关系 分配固定数额的奖金、利润,遗产官司(三)变和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问题的

18、重要性。 囚徒困境、产量博弈等第27页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1281.3 博弈结构和博弈分类四、博弈的过程博弈过程:博弈方选择、行为的次序,包括是否多次重复选择、行为。博弈过程对博弈结果也有重要影响。根据博弈的过程,博弈可分为静态博弈、动态博弈(包含重复博弈)。(一)静态博弈:所有博弈方同时或可看作同时选择策略的博弈 田忌赛马、猜硬币、古诺模型(二)动态博弈:各博弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动 弈棋、市场进入、领导追随型市场结构(三)

19、重复博弈:同一个博弈反复进行所构成的博弈,提供了实现更有效略博弈结果的新可能 长期客户、长期合同、信誉问题1、有限次重复博弈2、无限次重复博弈第28页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1291.3 博弈结构和博弈分类五、博弈的信息结构信息差异决策行为差异博弈结果不同(一)关于得益的信息完全信息(complete information)博弈:各博弈方都完全了解所有博弈方各种情况下的得益不完全信息(incomplete information)博弈:至少部分博弈方不完全了解其他博弈方得益的情况的博弈,也称为“不对称信

20、息博弈”(二)关于博弈过程的信息(动态博弈中)完美信息(perfect information)博弈:每个轮到行为的博弈方对博弈的进程完全了解的博弈不完美信息(inperfect information)博弈:至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈第29页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1301.3 博弈结构和博弈分类六、博弈方的能力和理性理性能力博弈方的行为逻辑完全理性和有限理性完全理性:有完美的分析判断能力和不会犯选择行为的错误有限理性:博弈方的判断选择能力有缺陷个体理性和集体理性个体理

21、性:一个体利益最大为目标集体理性:追求集体利益最大化合作博弈:允许存在有约束力协议的博弈非合作博弈:不允许存在有约束力协议的博弈第30页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1311.3 博弈结构和博弈分类七、博弈的分类(1)合作博弈 有限理性 完全信息 非合作博弈 静态 不完全信息 完全理性 完全信息 完美信息 动态 不完美信息 (重复)不完全信息 第31页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 132七、博弈的分类(2) 信息时间 完全不完全

22、静态完全信息静态博弈纳什均衡(NE)不完全信息静态博弈贝叶斯纳什均衡(BNE)动态完全信息动态博弈子博弈完美纳什均衡(SPNE)不完全信息动态博弈完美贝叶斯纳什均衡(PBNE)或序贯均衡(SE)第32页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1331.4博弈论历史和发展简述一、早期研究对具有策略依存特点决策问题的研究可上溯到18世纪初甚至更早博弈论真正的发展在本世纪,博弈论总体上仍然是发展中的学科2000年前我国古代的“齐威王田忌赛马”1838年古诺寡头模型。1883年伯特兰德寡头竞争模型。 1913年齐默罗象棋博弈定理

23、 、“逆推归纳法”1921-1927年波雷尔混合策略的第一个现代表述,有数种策略两人博弈的极小化极大解 1928年诺伊曼和摩根斯坦扩展形博弈定义,证明有限策略两人零和博弈有确定结果 第33页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1341.4博弈论历史和发展简述二、博弈论的形成冯.诺伊曼和摩根斯坦博弈论和经济行为Theory of Games and Economic Behavior 1944引进扩展形(extensive form)表示和正规形(normal form)或称策略形(strategy form)、矩阵形

24、(matrix form)表示提出稳定集(stable sets)解概念正式提出创造博弈论一般理论的主意给出博弈论研究的一般框架、概念术语和表述方法第34页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1351.4博弈论历史和发展简述三、博弈论的成长和发展1、第一个研究高潮(20世纪40年代末50年代初)1950年纳什提出“纳什均衡”(Nash equilibrium)概念和证明纳什定理,发展非合作博弈的基础理论。 1950年Melvin Dresher和Merrill Flood在兰德公司(美国空军)“囚徒的困境”(Pris

25、ons dilemma)博弈实验,(Howard Raiffa)独立进行这个博弈实验;1952-1953年期间(L. S. Shapley)和(D. B. Gillies)提出“核”(Core)作为合作博弈的一般解概念Shapley提出了合作博弈的“Shapley值”(Shapley value)概念等。奥曼(R. J. Aumann)“40年代末50年代初是博弈论历史上令人振奋的时期,原理已经破茧而出,正在试飞它们的双翅,活跃着一批巨人。”第35页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1361.4博弈论历史和发展简述

26、三、博弈论的成长和发展2、迅速发展期(20世纪50年代后期70年代)1954-1955年提出了“微分博弈”(Differential games)的概念。奥曼则在1959年提出了“强均衡”(Strong equilibrium)的概念。“重复博弈”(Repeated games)也是在50年代末开始研究的,这自然引出了关于重复博弈的“民间定理”(Folk theorem)。1960年(Thomas C. Schelling)引进了“焦点”(Focal point)的概念。博弈论在进化生物学(Evolutionary Biology)中的公开应用也是在60年代初出现的。第36页,共40页,202

27、2年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 137塞尔腾(Selten)1965提出“子博弈完美纳什均衡”(subgame perfect Nash equilibrium)1975年提出的“颤抖手均衡”(Trembling hand perfect equilibrium)海萨尼(Harsanyi)1967-1968三篇构造不完全信息博弈理论的系列论文,“贝叶斯纳什均衡”(Bayesian Nash equilibrium)。海萨尼1973年提出关于“混合策略”的不完全信息解释,以及“严格纳什均衡”(Strict Nash equilibr

28、ium)。70年代“进化博弈论”(Evolutionary game theory)的重要发展,(John Maynard Smith)1972年引进“进化稳定策略”( Evolutionarily stable strategy,ESS)等。“共同知识”(Common knowledge)的重要性,因为奥曼1976年的文章引起广泛的重视。第37页,共40页,2022年,5月20日,3点28分,星期二河北经贸大学商学院 Game Theory-Lecture 1381.4博弈论历史和发展简述四、博弈论的成熟与主流经济学的融合1、成熟期(20世纪80年代-90年代)1981(Elon Kohlb

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论