版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、,1 .定义博弈论的几个基本概念;2.定义优势战略和纳什均衡3。理解囚徒困境的含义及其应用。推导出迭代博弈的纳什均衡。推导出序列博弈的纳什均衡。本章的要点,完成本章后,你将得到11博弈论基础,2011-13王中秋节,2/100,6。可以理解为什么会有孙东东优势7。理解进入抑制力的可信性问题8。引导混合策略的纳什均衡,学习本章的要点,完成本章,11博弈论的基础,2011-13王中秋,3/100,游戏是一种比赛,2011-13王中秋节,4/100,游戏理论的基本概念,游戏游戏分析阶段的第一步是找到描述此游戏的有用方法。第二步是找到预测结果的方法。游戏要素(1)选手;(2)规则;(3)战略(4)收益
2、(5)结果。2011-13王中秋节,5/100,“剪刀、石头、布”的游戏,这个游戏有两个选手(players)。也就是参与这个游戏的行为者。每个选手可以选择三种策略:一把剪刀;2块石头;第三部分。通俗地说,战略就是招供。这个游戏有规则:如果两个人提出相同的战略(如石头、石头等三种可能性),那么双方就扯平了。如果两个人徐璐不同(例如石头对剪刀等6种可能性),就可以决定胜负。石头赢剪刀、剪刀、布胜石头(如剪刀、剪刀、布石)。2011-13王中秋节,6/100,“剪刀石头布”的游戏,否则胜者不喝酒,败者只喝一杯蜂酒,等等。如果是胜败一元的协议,则表(11.1)是这个游戏的收益表(Payoff tab
3、le),将选手的收益情况描述为表,有时也称为收益矩阵(Payoff matrix)。2011-13王中秋节,7/100,收益表,A交石头,B也交石头,各自收益都为零。2011-13王中秋节,8/100,收益表,如果A出石头,B出剪刀,A的收益为1,B的收益为(-1)。2011-13王中秋节,9/100,收益表,如果A出石头,B出的话,A的收益是(-1),B的收益是1。2011-13王中秋节,等等,10/100,博弈论的基本概念,一般来说,在每个小盒子里,第一个数据是左边的选手A的收益,第二个数据是上面的选手B的收益。上表是用一般的表来描述一个游戏的方法,简称为正规游戏(normal form)
4、。(莎士比亚,Normal Form,Normal Form,Normal Form)同时游戏:要求同时招募选手的游戏。序列游戏:选手是可以分先后招募的游戏。2011-13王中秋节,11/100,优势策略,A,B假设两个人在玩一个很简单的游戏,A可以在纸上写“上”或“下”,B可以在另一张纸上写“左”或“右”,12/100,优势策略,B选择左,那么A选择的收益是1,选择的收益是2,那么A选择。2011-13王中秋节,13/100,优势策略,优势策略:无论对方选择什么策略,该选手总是选择一定的策略,又名优势策略。在这种情况下,无论B采取什么手段,A总是选择。因此,选择是A的优势策略。所谓优势策略,
5、不管你用什么手段,我都会出这招。(莎士比亚,温斯顿,优势,优势,优势,优势,优势,优势)选手B也有优势策略吗?2011-13王中秋节,14/100,优势战略,给定A线,B线左收益为1,右收益为2,B线左;2011-13王中秋,如果A当选,B在收益0和1之间选择,B选择左侧。、15/100、优势策略、选手A如何选择,B总是选择左。选择b左边是优势策略。在任何游戏中,如果所有选手都有优势策略,那么两位选手的优势策略组合就是这个游戏的均衡。所谓游戏的均衡是可能发生的结局。,2011-13王中秋节,16/100,优势策略,在上例中,(A,B)=(下,左)=(2,1)是此游戏优势策略的均衡结果。2011
6、-13王中秋节,17/100,优势战略,大学成功的秘诀:无论如何,我总是把努力学习作为我的优势战略。2011-13王中秋节,18/100,纳什均衡,并非所有游戏都有优势策略均衡。2011-13王中秋节,在以下改进的游戏中,如果B选择左,则选择A。如果b选择右,则a将被选中。因此,A没有优势策略。19/100,纳什均衡,同样可以分析,B也没有优势策略。2011-13王中秋节,那么游戏有均衡吗?20/100,纳什均衡,优势策略均衡的要求可能太高。无论b采取什么手段,A都要求优势策略。而且,无论A采取什么手段,B也要求有优势策略。这两种优势战略的组合才是优势战略的平衡。给定b的选择,a的选择是最好的
7、。同时给出了A的选择,B的选择也是最好的。那么A和B的这个最佳选择的组合是纳什均衡。以2011-13王中秋节,21/100,约翰纳什,1994年诺贝尔经济学奖获奖者,美国经济学家约翰纳什的名字命名。据瑞典皇家科学院公报透露,“纳什引入了合作游戏和非合作游戏的区分,为非合作游戏创造了平衡概念”。这个均衡概念现在被称为纳什均衡。“2011-13王中秋,22/100,约翰纳什,纳什均衡,B选择左,A的最佳选择是商船。2011-13如果选择了王中秋节,a,b的最佳选择是左边。如果选择了a,则b的最佳选择是右侧。两个箭头表示纳什均衡。23/100,纳什均衡,给定的B线左,A的最佳选择是商船。在给定的a选
8、择中,b的最佳选择是左侧。所以,(上,左)纳什均衡。2011-13王中秋节,同样,(下,右)是另一个纳什均衡。24/100,优点平衡和纳什平衡的联系和差异,优点策略:无论你做什么,我都尽力。不管我做什么,你都尽力而为。纳什均衡:给出的策略,我尽力。给我我的策略,你是最好的。由此可见,优势策略均衡是纳什均衡的特例。通俗地说,如果是优势战略的均衡,一定是纳什均衡。反之则不然。2011-13王中秋节,25/100,囚犯困境,嫌疑人A和B因涉嫌偷自行车作为合伙人被警察抓住,提交审判,证据确凿,可以分别判处2年徒刑。如果两人都承认银行抢劫罪,当局将分别判处10年徒刑的两种罪和处罚。如果两个嫌疑人都否认银
9、行抢劫罪,当局将以盗窃自行车罪分别判处2年徒刑。一方承认银行抢劫罪并提供有效证据,当局以“坦白从宽,拒绝从严”的原则,承认罪犯不再追究自行车盗窃罪,释放妻子3罪和罚款(自行车盗窃、银行抢劫、不诚实罪),监禁20年。2011-13王中秋节,26/100,囚犯困境,这个游戏有两名名为囚犯A和B的选手。每个选手都有两种策略。承认或否认银行抢劫罪可能会产生表11.4所示的四种结果。在表的第一列,如果A和B同时承认犯罪,则分别被关押了10年。如果A否认犯罪,B承认犯罪,那么A被监禁了20年,但B可以自由。表格的第二列等。2011-13王中秋节,27/100,囚徒困境的对策有均衡吗?2011-13王中秋节
10、,28/100,囚徒困境,向对方承认,你也承认;被给予的对方否认,你承认。(承认,承认)=(-10,-10)是优势战略平衡。所以(承认,承认)也是囚徒困境的纳什均衡。2011-13王中秋节,29/100,囚徒困境,为什么称之为“囚徒困境”?(承认,承认)=(-10,-10)是纳什均衡。如果他们都否认犯罪,就要在监狱里呆两年,而不是每人10年。帕累托的效率,帕累托的效率低下。囚徒困境的“困惑”是为什么纳什均衡是帕累托最优,帕累托效率不是纳什均衡的结果。2011-13王中秋节,30/100,囚徒困境和适用,囚徒困境蕴涵,同谋可能是更有效的结果。囚徒困境是看不见手的挑战。亚当斯密看不见的手理论认为市
11、场经济中的所有人都在追求自我利益,但在追求自我利益的过程中同时实现了社会的公共利益。囚徒困境表明社会上每个人都在追求自身利益,但人类社会的公共利益是无法实现的。2011-13王中秋节,31/100,囚犯困境的表现,2011-13王中秋节,32/100第一,广告后,原先没有使用本产品的人知道了产品,其中一些可以购买。第二,一些使用其他类似品牌的人可能会转换以消费此产品。假设现在有两个寡头面临两个选择: (大量)不做广告和广告。在现实经济中,他们必须选择做多少广告。为了简化,假定没有失去一般性,只有这两种选择。2011-13王中秋节,33/100,可口可乐和百事冲突,2011-13王中秋节,34/
12、100,可口可乐和百事冲突,2011-13王中秋节,35/100一样,做广告也是A的,2011-13王中秋节,所以,(广告,广告)=(300,300)是这个博弈的优势策略均衡和纳什均衡。36/100,广告困境第二,企业B的优势战略做广告,而企业A没有优势战略。如果b在做广告,建议a跟随广告。但是如果B不做广告,那么A的最佳策略也是不做广告。2011-13王中秋节,37/100,广告困境,所以(广告,广告)=(200,300)仍然是纳什均衡。2011-13王中秋节,38/100,禁止烟草广告法案,1971年1月1日,美国众议院通过了禁止在电视上播出烟草广告的法案。但是法案制定者们不知道它有助于解
13、决香烟广告的困境。美国烟草制造商在烟草上花费的广告费从该法案实施前一年的3亿美元下降到实施后一年的6千万美元,其中大部分已转变为烟草行业的利益。2011-13王中秋节,39/100,研究开发游戏,研究开发是指企业研究新技术和开发新产品的活动。目前,假设两个实力相似的寡头在两个主要战略中选择了研发和研发,其假设见表11.7。2011-13王中秋节,40/100,开发游戏,寡头A和寡头B都有优势的战略研发,(R&D,R&D)成为了本游戏的纳什均衡。事实上,双方达成共识,不进行研究开发或少开发,是帕累托的改善。2011-13王中秋节,41/100,产量困境:古诺海,第10章介绍古诺模型时,假设两个果
14、头生产同质矿泉水,每个果头店的边际成本为0,其共同市场需求曲线为3360 p=120-Q 42,43/100,产量困境:古诺海,将上述情况描述为利润矩阵,如下表所示。,2011-13王中秋节,44/100,产量困境:古诺海,给定的B合作,A违约,给定的B违约,A违约,2011-13王中秋节,给定的A合作,2011-13王中秋节,公开募股垄断产量(分别为30)进一步提高了双方的利润(1800,1800),但这不是纳什均衡。46/100,囚徒困境及其应用,以上几个例子都有共同的特征:合作博弈的解释优于非合作博弈,但合作不是纳什均衡。现实生活中最终有合作的成功事例。不扩散核武器的条件,核国家首先不使
15、用核武器条约,甚至使用两国导弹徐璐瞄准的条约。在现实生活中,有些囚犯不承认犯罪。原因是这些游戏反复玩,而不是一次。2011-13王中秋节,47/100,重复游戏,在现实生活中,双方对产量和价格的决定并不是一次也不是一次。他们在根据对方的行为不断调整自己的产量和价格。这种不断调整战略和改变收益的游戏称为重复性游戏。囚徒困境的双方只能玩一次性游戏时,很难进行有效的处罚。在反复的游戏中,有效地处罚或威胁对方成为可能。重复性游戏摆脱了囚犯的困境。2011-13王中秋节,48/100,反复游戏,20世纪60年代进行的实验研究找到了偿还这一问题的简单方法。偿还这一战略是指,在反复的游戏过程中,一名选手对对方前一期的合作也采取合作的态度,如果不合作对方,就采取报复的战略。在囚徒困境的反复博弈中,我们知道合作的巨大收益提供了合作的积极激励,对方的有效威胁和潜在损失提供了合作的消极激励。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2026学年河北省邢台市英华集团初中部初三下学期5月联考试题含解析
- 广州市广大附中2026届中考模拟第一次测试数学试题试卷含解析
- 2026年广东省江门市江海区初三春季期中考试物理试题含解析
- 2026年大学大一(机械电子工程)机械电子学阶段测试试题及答案
- 护理护理实践中的儿科护理与儿童保健技术课件
- 2025年前台防疫接待礼仪答题技巧
- 护理面试面试成功之道与技巧
- 护理不良事件分级人文关怀
- 护理查房中的护理投诉
- 护理课件开发:护理职业发展
- 2026年徐州生物工程职业技术学院单招职业倾向性考试题库附答案
- 2026小红书商业产品全景手册
- 2025年抖音法律行业趋势白皮书-
- 2025年警务交通技术专业任职资格副高级职称考试题库及答案
- 2025年届华夏金融租赁有限公司校园招聘笔试参考题库附带答案详解
- 商业地产招商运营方案设计
- 2025疾控检验试题及答案
- mect治疗应急预案
- 2024年山西三支一扶真题
- 2025年江苏农林职业技术学院单招职业技能测试题库及完整答案详解
- 核磁室专项施工方案
评论
0/150
提交评论