生活中的博弈第一章导论.ppt_第1页
生活中的博弈第一章导论.ppt_第2页
生活中的博弈第一章导论.ppt_第3页
生活中的博弈第一章导论.ppt_第4页
生活中的博弈第一章导论.ppt_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章导论,牙齿章节介绍博弈论基本概念,介绍游戏和博弈论,以及一些经典游戏的例子茄子。(阿尔伯特爱因斯坦,Northern Exposure(美国电视电视剧),对游戏分类和博弈论的结构进行一些讨论,简要介绍博弈论发展历史等)。目标是形成大家对博弈论内容和游戏模式更直观的概念和印象、游戏分析的基本思维方式等的初步理解,为以后的展开和深入准备打下基础和准备。主要内容,1.1博弈论1.2几个茄子经典游戏模型1.3游戏结构和游戏分类1.4博弈论历史和开发简要回顾1.5博弈论我国应用节目,1.1牙齿博弈论,1.1.1从游戏到游戏1.1.2的非技术定义,1.1.1从游戏到游戏或具有战略意义的游戏游戏游戏游

2、戏游戏,博弈论游戏,游戏,游戏,游戏游戏游戏游戏游戏大小经济寡头产量推测决策,进入市场,投标拍卖政治,投标拍卖政治1.1.2郑智薰技术定义,(1)定义:游戏是面对特定环境条件的个人、团队组或其他组织。 根据特定规则同时或一次或多次,分别在可选择的行动或策略中选择和实施,从而分别获得结果的过程。(2)四个茄子核心方面:游戏参与者(Player)游戏当事人的战略(Strategies)或行动(Actions)游戏顺序(Order)游戏当事人的利益(Payoffs),(对抗者:)他的战略可以依赖于决策人民劣势的战略选择,占据空间特性,因此对抗是唯一的优势方式,也是领导人的阶段性终结行为。(3)游戏的

3、基本概念或要素,玩家:在一场比赛或游戏中,所有有决策权利的参与者都成为局内人。两局中只有人的游戏现象被称为“两人游戏”,两局或更多局中人的游戏被称为“多人游戏”。战略:在一场游戏中,每个回合中,人们都会选择一个切实可行的完整行动方案。也就是说,方案不是特定阶段的行动方案,而是指导整个行动的方案。一局中一个人的可行的始终全面计划的行动方案被称为牙齿局中一个人的战略。(威廉莎士比亚、战略、战略、战略、战略、战略、战略、战略、战略、战略、战略)在一个游戏国际象棋中,如果人人都有限制的战略,就叫“有限游戏”,否则叫“无限游戏”。(3)游戏的基本概念或要素,得失:一个游戏的结果称为得失。在每局中,一场游

4、戏结束时的得失,不仅与异国中自己选择的战略有关,还与退役中人制定的集团政策有关。因此,在游戏结束时,每场比赛中人们的“得失”是一种集体政策的函数,通常称为支付函数。顺序(orders):每个游戏方都有决策的前导点,如果一个游戏方需要进行两次以上的决策选择,就会出现顺序问题。(威廉莎士比亚,Northern Exposure美国电视电视剧,游戏名言)不同的元素顺序不同,游戏也不同。信息:游戏中参与者的知识,特别是其他参与者(对手)的特性和行为的知识。(3)游戏的基本概念或要素,平衡:在经济学中,平衡意味着处于相关杨怡稳定值。在供求关系中,在某一商品市场的某一价钱下,想价钱买牙齿商品的人都可以买,

5、想卖的人都可以卖,那么牙齿的时候我们说牙齿商品的供给和需求是平衡的。简单地说,平衡是所有参与者的最佳战略或行动的组合。纳什均衡(Nash Equilibrium):在一个战略组合中,所有参与者都面临这种情况,当其他人不改变策略的时候,他的策略是最好的。也就是说,如果此时他改变策略,付款就会减少。在纳什均衡点,所有理性的参与者都不会有个别改变策略的冲动。给出的博弈结构,纳什均衡博弈结构的解决:参与人,行动选择,结果和结果对应的支付纳什均衡:纳什均衡点存在性的前提,纳什均衡点存在性证明的前提是“博弈均衡偶”。所谓“平衡配偶”,如果在2人零和博弈中当局a采用最佳战略a*,国b也采用最佳战略b*,国b

6、仍然采用b*,国a采用另一种战略a*,那么国a的支付将不会超过他原先战略a*的支付。牙齿结果对国中b也是如此。“均衡偶”将一对策略a*(属于策略集A)和策略b*(属于策略集B)称为均衡对,对于所有策略A(属于策略集A)和策略B(属于策略集B),始终存在对(A,) 对于所有策略A(策略集A)和策略B(属于策略集B),始终:局中人员A的偶数异国人B的偶数对(a*,B)偶数对(a*,b*)。 根据以上定义,可以得到纳什定理。有有限纯策略的两个人游戏至少有一个平衡玩偶。牙齿均衡有时被称为纳什均衡点。1.2几款茄子经典游戏模型,1.2.1囚徒困境1.2.2智能猪游戏1.2.3性别战争牙齿游戏是最经典、最

7、有名的博弈论游戏。牙齿游戏本身谈法律调查或犯罪学方面的问题,但会暴露出很多经济问题、各种社会问题、市场经济根本缺陷。(威廉莎士比亚,温斯顿,犯罪学,犯罪学,犯罪学,犯罪学,犯罪学,犯罪学),囚徒困境表示,两个犯罪嫌疑人被捕,受到指控,但除非至少有一个人供认罪行,否则警察没有足够的证据相应地判刑。警察把它关在另一个牢房里,并向他们解释了其他行动的后果。如果两个人都不坦白,都将被判轻罪,监禁一个月。如果双方都坦白,都将被判处6个月的徒刑。最后,如果一个人认罪,另一个人拒绝招供,供认的一方很快就会被释放,另一方判处有期徒刑9个月,犯罪6个月,司法追加3个月。设定:(1)所有局的人都知道游戏规则和游戏

8、结果的支付矩阵。(2)每个国家中的人都是理性的(个人的理性和个人的最佳决策)。(3)“串通”,基本模式,囚徒困境分析,通过矩阵观察发现:每个囚犯有两个茄子战略:坦白或不坦白;每个网格中的两个数字表示该战略组下两个囚犯的付款(效果)。第一个数字是囚犯1的支付(即行)。第二个数字是囚犯2的付款。纳什均衡是(坦白,坦白):对于给定的囚徒2坦白来说,是囚徒1的最佳战略告白。同样,在给定的囚犯1坦白的情况下,囚犯2的最佳战略也是坦白。事实上,(老实说)不仅是纳什均衡,也是战略均衡。也就是说,无论对方如何选择,个人的最佳选择就是告白。囚徒困境思维反映了个人理性和集体理性的矛盾。两个人都不坦白的话,分别宣判

9、一个月,比分别坦白六个月好。但是帕累托的改善不能做到,因为不能满足个人的理性要求。(不坦率,不坦率)不是纳什均衡。即使在两个囚犯被抓住之前建立公共手动盲,牙齿公共手动盲也不能平衡纳什,没有人能积极遵守协议,因此没有用。(威廉莎士比亚,哈姆雷特),囚徒困境应用和类比,示例1:寡头政治游戏。两个寡头垄断企业选择产量的游戏,如果两个企业联合成为卡特尔垄断利润最大化产量,每个企业可以获得更多的利润,但卡特尔协议不是纳什均衡。因为,如果给定的对方遵守协议,各企业都想增加生产。结果各企业只获得纳什均衡产量的收益,严格小于卡特尔产量的收益。(在某些情况下,个人理性和集体理性的冲突对整个社会来说可能是件好事。

10、尽管对该集团的成员来说是坏事。),囚徒困境应用和类比,示例2:公共产品供应。如果每个人都为公共事业付钱,所有人的福利增加,问题是,如果我付钱,你不付钱,我就不能吃亏,如果你付钱,我不付钱,我就可以占你的便宜,所以最终结果呢?所有人的最佳选择都是“不付钱”。这种纳什均衡不能提高所有人的福利。囚徒困境应用和类比,范例3:军备竞赛。冷战期间,苏美两国为了增加军费预算而竞争,如果不进行军备竞争,各自将资源用于生产民品不是很好吗?但结果呢?问题是,如果我把资源用于民品生产,你增加军费开支,我不会受到威胁吗?纳什均衡是两国增加军备预算,使两国的社会福利更糟。囚徒困境应用和类比,范例4:经济改革。在很多改革

11、中,改革者必须支付费用(包括风险),改革的成果被分享。结果大家都认为改革好,但没有人真正改革。要继续生活在大家都不满意的体制下。现行体制下的企业创新也是如此。江苏省,浙江省企业游戏也是如此。大家能得出什么重要的结论呢?囚徒困境重要结论,系统(或系统)安排,要产生效果,就必须纳什均衡。否则,这种制度安排不能成立。1.2.2猪游戏,猪圈里有两头猪,一头大猪和一头猪。猪栏一边有踏板,另一边有两家人,每次踩踏板,两家人都会减少少量食物。如果一只猪去踩踏板,另一只猪有机会先吃掉的食物。猪踩踏板的时候,大猪在猪跑到食槽前把所有的食物都吃光了。如果大猪踩了踏板,在猪吃完之前,就有机会跑到食槽去抢一些残骸。根

12、据对智猪游戏的描述,任何猪按下按钮都有10个单位的猪膳食槽,但按下按钮的人必须支付2个单位的费用。如果大猪先到,大猪只能吃9个单位,猪只能吃1个单位。同时到达的话,大猪吃7个单位,猪吃3个单位。猪先到的话,大猪吃6个单位,猪吃4个单位。猪游戏矩阵分析,大气,猪,大猪,按,按,按,大于1 0-1,纳什均衡:按大猪,猪等各4个单位(4,4),样品,肯定不会踩,我可以踩,可以吃一半,不踩,肯定饿了,唉,不能直接动脚!我去踩,一口也没有,我不会踩!确定大猪、猪战略的关键指标:一次下降的食物数量和踏板和进食者之间的距离。节目变化1:减少节目。投降只是原来的一半分量。结果猪没有踩踏板。案例2变更:增量案例

13、。投降是原来的两倍分量。结果猪和大猪都去踏板。案例3变更:减少与运送航程案例。投食本来只有分量的一半,但同时把投食者转移到踏板附近。结果,猪和大猪都拼命地蹬着踏板。智力猪游戏的应用,例如1:公司治理。在股份公司,股东担任经理教练职能,但股东中有大股东和苏州主义的区别,因此从监督中获得的收益不同。经理教练需要收集信息,但需要时间。在教练费用相同的情况下,大股东从监督中获得的利益比苏州多得多。在这里,大股东类似于“大猪”,烧酒类似于“猪”。纳什均衡是大股东负责信息收集,经理教练责任,苏州选择搭便车。智力猪游戏的应用,例如2:股票市场。股市上有大房子,有小房子,大房子也像“大猪”,小房子也像“猪”。

14、此时,对于小家庭来说,“大湖”是最佳选择,大州需要收集和分析自行信息。智力猪游戏的应用,例如3:大企业与中小企业的关系。研究开发,新产品广告,对大企业的价值,对小企业的得失损失,所以一种可茄子的情况是,小企业把精力放在模仿上,或者等大企业用广告打开市场后卖掉便宜的产品。智力猪游戏的应用,例如4:也可能出现在公共产品供应上。例如,村子里住了两户,一户富裕,一户贫穷,一条路很久没有修了。这时谁来修理呢?一般有钱人负责修路,贫穷的家庭很少这样做。富家贵总是老是高亲满座,坐车的人都来,而穷人家只有穿着自行旧鞋走路,路修好了,他走路舒服,路修不好,他就无所谓了。(威廉莎士比亚,哈姆雷特,金钱),智力猪游

15、戏的应用,例如5:改革也有类似的情况。同样的改革给一些人带来的好处可能比其他部分大得多。在牙齿的时候,以前的一些人比后一部分人更积极地进行改革,改革往往是由这种“大猪”推动的。如果改革能创造更多的“大猪”,改革的速度就会加快。1.2.3性别战争,一男一女谈恋爱,计划一些休闲活动,看足球比赛,或看芭蕾舞剧演出。男人的首选足球,女人更喜欢芭蕾,但他们更喜欢在一起而不是分手。女人、足球、芭蕾舞剧、足球、芭蕾舞剧、男人、1.2.3性别战争、牙齿游戏有两种纳什均衡:(足球、足球)、(芭蕾、芭蕾)。也就是说,指定的一方去足球场,另一方也去足球场。同样,一方去看芭蕾,另一方也去看芭蕾。那么,实际上发生了什么

16、样的纳什均衡呢?可能不知道。但是在现实生活中,看足球,下次看芭蕾,这样循环,就会形成默契。(威廉莎士比亚,哈姆雷特,生活)例如,如果男人买票,足球场上就会出现两个人;如果女人买票,就可能在芭蕾舞厅里。想象一下,1.2.4斗鸡游戏,两个人拿着火棒,从独木桥的两端走到中央,然后开火。每个人都有两个茄子战略:继续前进或后退。如果两个人都继续前进,两个人都受伤了。如果一方前进,另一方后退,前进者胜利,后退者丢面子。如果两个人都退了,两个人都丢面子。B,输入,返回,输入,返回,A,1.2.4斗鸡游戏,牙齿游戏有两个纳什均衡。一方进入后,另一方的最佳战略是后退。两者都进或退不是纳什均衡。斗鸡游戏的应用案例

17、1:公共产品供应也有这种情况。村里住着两户有钱人,有一条路要修,一个可茄子的情况是一家修路,另一家不修。(威廉莎士比亚,哈姆雷特,钱)一个不修理,另一个要修理。(摘要:公共产品的供应可能取决于囚犯游戏、智猪游戏、斗鸡游戏、特定产品。),斗鸡游戏的应用,示例2:秀美两军集团抢地。冷战期间,秀美两军集团在世界各地抢占地盘也是一种斗鸡游戏。一般来说,如果一方已经抢占了一个区域,另一方想占领另一个区域,而不是与对方竞争。斗鸡游戏应用节目,示例3:警察和游行。游行队伍警察靠近,一方要退出,警察不让步,游行队伍就会后退。相反,如果游行队伍来的很猛,就要警察撤退。(警察,在劫持人质强盗中也是如此)时事:如果各方期待

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论