博弈与决策1--导论.ppt_第1页
博弈与决策1--导论.ppt_第2页
博弈与决策1--导论.ppt_第3页
博弈与决策1--导论.ppt_第4页
博弈与决策1--导论.ppt_第5页
已阅读5页,还剩35页未读 继续免费阅读

VIP免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈与决策 game theory,河北经贸大学商学院,Game Theory-Lecture 1,2,课前小问题:,博弈论之英雄(美人)救美人(英雄)记 背景:有一座城堡,仅有南、北两个城门可以入内,城堡内驻扎了三个排的士兵看守城门。 事件:你的心上人被关押在城堡内,攻入城堡就可营救出他(她)。 条件:1、你只拥有两个排的兵力。 2、通往南北城门各自只有一条道路,去往两城门的道路不相通(你只能一条道走到底) 3、你方兵力少于或相同于对方时你肯定失败(所谓守易攻难),你方兵力超过对方则能成功破城,兵力调度只能以排为单位。 4、两兵相接时就不能再变动兵力布置。 问题:你有多大的概率救出你的心上人?,河北经贸大学商学院,Game Theory-Lecture 1,3,教材:,经济博弈论(第三版) 复旦大学出版社,2007年1月 经济博弈论习题指南 复旦大学出版社,2003年1月,河北经贸大学商学院,Game Theory-Lecture 1,4,学习要求:, 任何课程的知识都具有连贯性,所以不要经常逃课,更不能让教材“一尘不染”。 听课时要多作笔记,笔记是知识的框架,教材是对知识的充实。二者缺一不可。 对于老师布置的习题,要认真完成,以巩固所学的知识。 学习时要搞清理论,特别要注意结论成立的条件。,河北经贸大学商学院,Game Theory-Lecture 1,5,课程安排,第一章 导论 第二章 完全信息静态博弈 第三章 完全且完美信息动态博弈 第四章 重复博弈 第五章 完全但不完美信息动态博弈 第六章 不完全信息静态博弈 第七章 不完全信息动态博弈 第八章 有限理性和进化博弈,河北经贸大学商学院,Game Theory-Lecture 1,6,第一章 导论,本章介绍博弈论的基本概念,包括什么是博弈和博弈论,给出一些经典博弈例子。对博弈分类和博弈理论的结构作一些讨论,对博弈论的发展历史等作简单介绍。目标是让读对博弈论的内容和博弈模型有更直观的概念和印象,本教材的基本内容,以及博弈分析的基本思想方法等形成初步的认识,为后面各章展开详细分析作好铺垫和准备。,河北经贸大学商学院,Game Theory-Lecture 1,1.1什么是博弈论,一、从游戏到博弈 1、Game theory 博弈就是策略对抗,或策略有关键作用的游戏 游戏特征: (1)规则 (2)结果 (3)策略 (4)策略与利益相互依存,河北经贸大学商学院,Game Theory-Lecture 1,8,2、身边的博弈例子,(1)无谓竞争 如果本门课程按比例来给分,无论卷面分数是多少,只有40%的人能获得优秀,40%的人能获得良好。 学生的反应: 所有学生都达成一个协议:大家都不要太用功,如何? 想法不错,但无法实施。,河北经贸大学商学院,Game Theory-Lecture 1,9,稍加努力就可胜过他人,诱惑太大了 问题是: 所有人都这么做。 结果:所有人的成绩都不比大家遵守协议来得高;而且,大家还付出了更多的功夫。 (囚徒困境) 还有其它什么例子? 占座/军备竞争,河北经贸大学商学院,Game Theory-Lecture 1,10,2、身边的博弈例子,(2) 两职员上午开车外出办事,因处理了些许私人事件而耽误了下午及时返回公司工作,遂向老板谎称轮胎漏气去修理厂修理而耽误时间。 老伴分别向他们提问:“哪个轮胎漏气了? 该如何应答? 聚(焦)点(focal point) 博弈,河北经贸大学商学院,Game Theory-Lecture 1,11,2、身边的博弈例子,(3)为何教授如此严厉 许多教授强硬规定:不许补考,不允许迟交作业或论文 教授为何如此苛刻? 如果允许某种迟交,而教授又无法辨别真伪,则学生总是会迟交。期限本身就没意义了 为避免此现象,只有一种策略:没有例外的策略,河北经贸大学商学院,Game Theory-Lecture 1,12,问题: 一个好心肠的教授如何来维持铁石心肠的承诺? 找到是拒绝变得强硬和可信的方法: 拿行政程序或学校政策做挡箭牌; 在课程开始时作出明确和严格的宣布; 通过严打几次获得“冷面杀手”的声誉,河北经贸大学商学院,Game Theory-Lecture 1,13,2、身边的博弈例子,(4)“濒危”舍友 宿舍饮用水告罄,需要打开水了。 自己亲自动手还是寄希望于别人 僵持一阵子,有人失去耐心而选择让步 争吵 胆小鬼博弈(game of chicken) 消耗战(war of attrition),河北经贸大学商学院,Game Theory-Lecture 1,14,2、身边的博弈例子,(5)约会博弈(the dating game) 他(她)真的是个好男孩(女孩)吗? 他(她)真心爱我吗? 燕赵晚报上的八卦新闻: 女孩在情人节谎称被绑架,要男孩往一银行卡上打5000元。 女孩使用的是筛选策略,男孩要么照办(真心爱她);要么拒绝(缺乏真心),河北经贸大学商学院,Game Theory-Lecture 1,15,此类博弈中真正的策略是信息的批露 传递关于自己好信息的策略称为“信号”(signals) 例子:教育 诱使他人采取行动,以可靠显示其私人信息(好或坏)的策略,称为“筛选”(screening) 例子:数量折扣,河北经贸大学商学院,Game Theory-Lecture 1,16,二、一个非技术性的定义,博弈:一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 1、博弈的参加者(players) 2、各博弈方各自可选择的全部策略(strategies)或行动(actions)的集合 3、进行博弈的次序(orders) 4、博弈方的得益(payoffs),河北经贸大学商学院,Game Theory-Lecture 1,17,1.2 几类经典的博弈模型,一、囚徒困境 1950年图克提出的,用于研究经济效率问题 博弈方:两小偷(囚徒) 策略:坦白、抵赖 次序:同时 收益:都坦白,各关押5个月;都抵赖,各关押1个月;一方坦白一方抵赖,坦白方释放,抵赖方关押8个月 可以用得益矩阵的方式表示,河北经贸大学商学院,Game Theory-Lecture 1,18,1.2 几类经典的博弈模型,得益矩阵表示形式,得益,囚徒1:坦白 囚徒2:坦白,河北经贸大学商学院,Game Theory-Lecture 1,19,1.2 几类经典的博弈模型,二、赌胜博弈 特点:一方所得等于另一方所失,不可能双赢,属于零和博弈 博弈方:两玩家:一方盖,一方猜 策略:正面朝上、反面朝上 次序:同时 收益:对方猜错赢1元钱,对方猜中输1元钱;猜中赢1元钱,猜错输1元钱,不让对方猜出自己的策略 而自己尽可能猜出对方策略,河北经贸大学商学院,Game Theory-Lecture 1,20,1.2 几类经典的博弈模型,三、产量决策的古诺模型 博弈方:n个厂商 策略:生产及投放市场的产量(无数个) 次序:同时 收益:利润 无法用得益矩阵的方式表示,利用得益函数方式表述策略和得益的依存关系 i=Ri-Ci =P(Q)qi-cqi =P(qi-cqi),河北经贸大学商学院,Game Theory-Lecture 1,21,1.3 博弈结构和博弈分类,研究问题不同博弈模型各异(博弈结构不同 一、博弈中的博弈方(players) 博弈方:独立决策、独立承担博弈结果的个人或组织 博弈规则面前博弈方之间平等,不因博弈方之间权利、地位的差异而改变 博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈,单人博弈是退化的博弈,河北经贸大学商学院,Game Theory-Lecture 1,22,一、 博弈中的博弈方,(一)单人博弈 一般的最优化问题 例:商人运货(价值9万) 水路运费7千,陆路运费1万 ,但水路有风险好天气(概率75%)时可平安抵达,坏天气(概率25%)时货物损失10%。 如何决策? 分析:引入一个博弈方0(自然 nature) 博弈方:商人、自然 策略:商人:水路/陆路;自然:好天气/坏天气 次序:同时 得益:博弈方0的得益不考虑,仅商人的得益要考虑,信息拥有越多 决策准确性越高,河北经贸大学商学院,Game Theory-Lecture 1,23,一、 博弈中的博弈方,(二)两人博弈 两人博弈即有两个博弈方的博弈 两人博弈最常见,研究最多,是最基本和有用的博弈类型 囚徒困境、猜硬币、齐威王田忌赛马等都是两人博弈 两人博弈有多种可能性,博弈方的利益方向可能一致,也可以不一致,河北经贸大学商学院,Game Theory-Lecture 1,24,一、 博弈中的博弈方,(二)多人博弈 三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利益并没有影响,但却会对其他博弈方的利益产生很大的,有时甚至是决定性的影响。 多人博弈的表示有时与两人博弈不同,需要多个得益矩阵,或者只能用描述法,河北经贸大学商学院,Game Theory-Lecture 1,25,1.3 博弈结构和博弈分类,二、博弈中的策略(strategies) 策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同 有限博弈:每个博弈方的策略数都是有限的 无限博弈:至少有某些博弈方的策略有无限多个,河北经贸大学商学院,Game Theory-Lecture 1,26,1.3 博弈结构和博弈分类,三、博弈中的得益(payoffs) 得益:各博弈方从博弈中所获得的利益 得益对应博弈的结果,也就是各博弈方策略的组合 得益是各博弈方追求的根本目标及行为和判断的主要依据 数量、利润、收入、量化的效用、社会效益、福利等 根据得益的博弈分类:零和博弈、常和博弈、变和博弈,河北经贸大学商学院,Game Theory-Lecture 1,27,三、博弈中的得益,(一)零和博弈:也称“严格竞争博弈”。博弈方之间利益始终对立,偏好通常不同 猜硬币,田忌赛马,石头-剪刀-布 (二)常和博弈:博弈方之间利益的总和为常数。博弈方之间的利益是对立的且是竞争关系 分配固定数额的奖金、利润,遗产官司 (三)变和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问题的重要性。 囚徒困境、产量博弈等,河北经贸大学商学院,Game Theory-Lecture 1,28,1.3 博弈结构和博弈分类,四、博弈的过程 博弈过程:博弈方选择、行为的次序,包括是否多次重复选择、行为。 博弈过程对博弈结果也有重要影响。 根据博弈的过程,博弈可分为静态博弈、动态博弈(包含重复博弈)。 (一)静态博弈:所有博弈方同时或可看作同时选择策略的博弈 田忌赛马、猜硬币、古诺模型 (二)动态博弈:各博弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动 弈棋、市场进入、领导追随型市场结构 (三)重复博弈:同一个博弈反复进行所构成的博弈,提供了实现更有效略博弈结果的新可能 长期客户、长期合同、信誉问题 1、有限次重复博弈 2、无限次重复博弈,河北经贸大学商学院,Game Theory-Lecture 1,29,1.3 博弈结构和博弈分类,五、博弈的信息结构 信息差异决策行为差异博弈结果不同 (一)关于得益的信息 完全信息(complete information)博弈:各博弈方都完全了解所有博弈方各种情况下的得益 不完全信息(incomplete information)博弈:至少部分博弈方不完全了解其他博弈方得益的情况的博弈,也称为“不对称信息博弈” (二)关于博弈过程的信息(动态博弈中) 完美信息(perfect information)博弈:每个轮到行为的博弈方对博弈的进程完全了解的博弈 不完美信息(inperfect information)博弈:至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈,河北经贸大学商学院,Game Theory-Lecture 1,30,1.3 博弈结构和博弈分类,六、博弈方的能力和理性 理性能力博弈方的行为逻辑 完全理性和有限理性 完全理性:有完美的分析判断能力和不会犯选择行为的错误 有限理性:博弈方的判断选择能力有缺陷 个体理性和集体理性 个体理性:一个体利益最大为目标 集体理性:追求集体利益最大化 合作博弈:允许存在有约束力协议的博弈 非合作博弈:不允许存在有约束力协议的博弈,河北经贸大学商学院,Game Theory-Lecture 1,31,1.3 博弈结构和博弈分类,七、博弈的分类(1) 合作博弈 有限理性 完全信息 非合作博弈 静态 不完全信息 完全理性 完全信息 完美信息 动态 不完美信息 (重复)不完全信息,河北经贸大学商学院,Game Theory-Lecture 1,32,七、博弈的分类(2),河北经贸大学商学院,Game Theory-Lecture 1,33,1.4博弈论历史和发展简述,一、早期研究 对具有策略依存特点决策问题的研究可上溯到18世纪初甚至更早 博弈论真正的发展在本世纪,博弈论总体上仍然是发展中的学科 2000年前我国古代的“齐威王田忌赛马” 1838年古诺寡头模型。 1883年伯特兰德寡头竞争模型。 1913年齐默罗象棋博弈定理 、“逆推归纳法” 1921-1927年波雷尔混合策略的第一个现代表述,有数种策略两人博弈的极小化极大解 1928年诺伊曼和摩根斯坦扩展形博弈定义,证明有限策略两人零和博弈有确定结果,河北经贸大学商学院,Game Theory-Lecture 1,34,1.4博弈论历史和发展简述,二、博弈论的形成 冯.诺伊曼和摩根斯坦博弈论和经济行为 Theory of Games and Economic Behavior 1944 引进扩展形(extensive form)表示和正规形(normal form)或称策略形(strategy form)、矩阵形(matrix form)表示 提出稳定集(stable sets)解概念 正式提出创造博弈论一般理论的主意 给出博弈论研究的一般框架、概念术语和表述方法,河北经贸大学商学院,Game Theory-Lecture 1,35,1.4博弈论历史和发展简述,三、博弈论的成长和发展 1、第一个研究高潮(20世纪40年代末50年代初) 1950年纳什提出“纳什均衡”(Nash equilibrium)概念和证明纳什定理,发展非合作博弈的基础理论。 1950年Melvin Dresher和Merrill Flood在兰德公司(美国空军)“囚徒的困境”(Prisons dilemma)博弈实验,(Howard Raiffa)独立进行这个博弈实验; 1952-1953年期间(L. S. Shapley)和(D. B. Gillies)提出“核”(Core)作为合作博弈的一般解概念 Shapley提出了合作博弈的“Shapley值”(Shapley value)概念等。 奥曼(R. J. Aumann)“40年代末50年代初是博弈论历史上令人振奋的时期,原理已经破茧而出,正在试飞它们的双翅,活跃着一批巨人。”,河北经贸大学商学院,Game Theory-Lecture 1,36,1.4博弈论历史和发展简述,三、博弈论的成长和发展 2、迅速发展期(20世纪50年代后期70年代) 1954-1955年提出了“微分博弈”(Differential games)的概念。 奥曼则在1959年提出了“强均衡”(Strong equilibrium)的概念。 “重复博弈”(Repeated games)也是在50年代末开始研究的,这自然引出了关于重复博弈的“民间定理”(Folk theorem)。 1960年(Thomas C. Schelling)引进了“焦点”(Focal point)的概念。 博弈论在进化生物学(Evolutionary Biology)中的公开应用也是在60年代初出现的。,河北经贸大学商学院,Game Theory-Lecture 1,37,塞尔腾(Selten)1965提出“子博弈完美纳什均衡”(subgame perfect Nash equilibrium) 1975年提出的“颤抖手均衡”(Trembling hand perfect equilibrium) 海萨尼(Harsanyi)1967-1968三篇构造不完全信息博弈理论的系列论文,“贝叶斯纳什均衡”(Bayesian Nash equilibrium)。 海萨尼1973年提出关于“混合策略”的不完全信息解释,以及“严格纳什均衡”(Strict Nash equilibrium)。 70年代“进化博弈论”(Evolutionary game theory)的重要发展,(John Maynard Smith)1972年引进“进化稳定策略”( Evolutionarily stable strategy,ESS)等。 “共同知识”(Common knowledge)的重要性,因为奥曼1976年的文章引起广泛的重视。,河北经贸大学商学院,Game Theory-Lecture 1,38,1.4博弈论历史和发展简述,四、博弈论的成熟与主流经济学的融合 1、成熟期(20世纪80年代-90年代) 1981(Elon Kohlberg) “顺推归纳法”(Forward induction) 克瑞泼斯(David M. kre

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论