第十章 博弈论初步_第1页
第十章 博弈论初步_第2页
第十章 博弈论初步_第3页
第十章 博弈论初步_第4页
第十章 博弈论初步_第5页
已阅读5页,还剩75页未读 继续免费阅读

VIP免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人生如象棋,落子不后悔! 2、第十章博弈论是初步的,一、博弈论与战略行为二、同时博弈论:纯战略均衡三、同时博弈论:混合战略均衡四、逐步连贯博弈论,目前博弈论的发展非常深入,这里介绍初步的知识。 在二十世纪四、五十年代,冯诺伊曼、摩根斯坦将政策论、运营学导入经济学,形成了最早的博弈论。 几十年来,博弈论在经济学中发挥着越来越重要的作用,1994年的诺贝尔经济学奖被授予了纳什(Nash )、泽尔滕(Selten )、哈萨尼(Harsanyi )三位博弈理论家。 4、美薯匈牙利数学家冯诺伊曼(JohnVonNeuman )和美薯奥地利经济学家摩根斯坦(Morgenstern )认识普林斯顿大学,1944年出版了经典着作博弈论与经济行为,为现代博弈论的发展奠定了基础美国数学家、经济学家纳什(JohnNash )、美国国籍匈牙利经济学家海萨尼(JohnC.Harsanyi )和德国经济学家泽尔滕(R.Selten )以对博弈论的杰出贡献获得了1994年度的诺贝尔经济学家。 海萨尼,纳什,5,值得一提的是纳什,他发表在博弈论中建立了重要地位的学术论文时,年仅22岁,被称为“天才”。 1959年,纳什被精神科医生诊断为“妄想性精神分裂”,被精神科折磨了40多年。 塞尔滕,约翰纳什出生于1928年6月13日。 父亲是电子技术人员和教师,是第一次世界大战的退役军人。 纳什时间孤独内向,父母照顾他,但老师认为他不善于社交。 纳什的数学才能在大约14岁时开始出现。 他刚在普林斯顿大学获得博士学位,但是关于他的非合作游戏的博士论文和其他相关文章,确立了他的博弈论达人的地位。 在20世纪50年代末,他成为了世界著名的科学家。 7、博弈论(gametheory )古语中有云,世事如象棋。 人生中,每个人都像棋手一样,其行为都摆在看不见的棋盘上,精明谨慎的棋手们互相揣测、牵制,每个人都赢了,创造了一个精彩、多变的局面。 博弈论是研究在战略环境中如何进行战略决策和战略行动的科学。 战略环境是指每个人所做的决策和行动会影响别人。战略决策和战略行动是指每个人都根据别人可能的反应来决定自己的决策和行动。 第一节博弈论和战略行为从字面上意味着博弈战略,有时也将博弈论翻译成对策论,以用博弈解决问题的方法来解决社会、经济和其他领域的问题。 准确地说,博弈论在给定条件下寻求最佳策略,包括其他人的战略和他人的决策对其他决策主体的影响。 战略活动多存在于社会、经济、政治生活中,可以说整个社会、经济、政治生活都是游戏行为。 因此,博弈论作为一种方法广泛地应用于经济、政治、军事、外交上,而博弈论在经济学上是最广泛、最成功的。 前面介绍的古诺均衡是经济学中的游戏过程。 1、博弈论的三个基本要素: 1,参与者(Players ) :参与游戏的决策主体也称为“局中人”或“玩家”,各参与者通过选择最佳的行为或策略来最大化自己的效用2,策略(playersstrategy ) :参与者比如,如果对方怎么样,我应该怎么做,战略的整体被称为战略空间。比如,在我国古代有名的战略故事田忌赛马中,国王的赛马计划是先发上等马,然后发中等马,最后发下等马,这就是田忌的赛马计划,先发下马,然后这里的赛马计划是完全的行动计划,也就是战略。战略空间:参加者可以选择的战略整体构成战略空间。 例如在“田忌赛马”中,有上中下(上中马、上中马、下中马)、上中上下上下中下中上6个行动方案。 决定时,田忌可以选择任一策略,故事中,王选择上中下,所以田忌选择上中获胜。 每个人改变战略的话结果也会改变。 比如,国王选择了上中,而田忌选择了上中,国王就赢了比赛。 3,支付(playerspay off ) :参加者获得的报酬、效用水平或战略函数的期待效用水平,2 .游戏分类(1)游戏根据参加者之间能否达成协议分为协调游戏和非合作游戏。 能达成协议的被称为合作游戏,合作游戏不能强调团队合理性的被称为非合作游戏,非合作游戏重视个人理性。 (2)根据参加者行动的优先顺序分为静态游戏和动态游戏。 静态游戏不是参加者同时行动,也不是同时行动,但是之后的行动者不知道之前的行动者采取了什么样的具体行动。 动态游戏是指参加者的行动具有优先顺序,后一个行动者观察先一个行动者的行动。 (3)根据参加者掌握的信息分为完全信息游戏和不完全信息游戏。 完全信息游戏是指各参加者对其他所有人的特征、支付函数、战略空间等有着正确的认识,反之则是不完全信息游戏。 (4)根据参加者的数量和可以选择的战略的数量,分为有限游戏和无限游戏。 有限博弈是指参加者的数量和每个参加者允许选择的战略的数量有限,否则就是无限游戏。 (5)根据参加者是否有战略时间,可以分为同时游戏和逐次游戏。 本章将讨论参加者为2人,每个参加者有2个战略的同时游戏和逐次游戏。 (6)局里人的利益合计是否变动,零和游戏:双方的利益关系对立,一方的利益一定是另一方的损失。 毛利为零。 例如,田忌赛马和游戏正和游戏:双方利益关系对立,但其对立性表现在各自利益的多寡上,结果也许很高兴。 就像讨价还价一样。 变化和游戏:游戏方面的战略不同,各方面的利益合计也不同。 游戏结果有着社会整体利益的大小差异,就像囚犯的困境一样。 日常生活中静态游戏的例子很多,我们经常说的什么都做不了,没办法,我能做的事已经结束了,游戏没有任何影响,剩下的事情其他参加者做了,最后看情况。 比如,学生参加了高考,老师的命题和学生的考试先到,但不能互相传达信息和影响。 考生得分的多寡和出题水平的评价只有在大学入学考试结束之前才能知道。 老师和学生的决策行动不再影响游戏,只能等待最后的结果。 动态游戏的典型例子是下棋,我走先头炮,你走屏风马,我走一步,你走一步,你走一步,我走一步。 双方相继行动。 每个人各时刻的决策是前面一系列决策掌握的信息的函数。 中间的某个阶段,比如一方的“将军”,这受之前一系列双方的决策实施的影响,而不是什么时候“将军”能成为“将军”。 15、比如坏人,他遇到了从来没有见过的人,然后再见到了再也没见过的陌生人,他也许会变得大胆,本来的面容很清楚。 这种情况是静态游戏,是锤子买卖。 同样的坏人,在经常交往的人面前伪装成好人也是一个动态游戏,所以之前的信息都会影响到之后的决策。为了自己的长期利益,他现在必须极力制作虚假的信息,让以后的决策对自己有利,所以见面时要礼貌,别人以后的行动表现得对自己不客气。 好人,坏人? 第二节同时博弈:纯粹的战略均衡、囚犯困境、矛盾:个人理性与团体理性的冲突,例如:团结是力量囚犯的困境,解释了自私行为的结果不一定优于利他行为的结果。 如果两个囚犯能有义气地遵守同盟,他们的监狱的损失就最小化了。 同样,在现实生活中也是如此,当我们偷懒打扫宿舍的时候,我们付出了生存环境的代价,我们考虑奖学金互相中伤,我们失去了金钱和友谊,我们在球场上个人主义和别人不太合作时,我们输了比赛,政府为了出口邻居, 他什么都卖不出去所以,加强合作在自私的经济学上也是件好事,给别人一个笑容,你就会有更光明的春天。 卡塔尔的困境,制造商乙,制造商甲,合作,不合作,不合作,1 .甲制造商的条件战略和条件战略的组合,甲制造商在乙制造商的合作条件下的最佳战略合作被称为甲制造商的条件优势战略或相对优势战略,简称为条件战略。 与甲厂条件战略相关的战略组合称为甲厂条件优势战略组合或相对优势战略组合,简称为条件战略组合。 甲厂各有两种条件战略和条件战略的组合。 定义:条件战略和条件战略的组合,2 .乙方制造商的条件战略和条件战略的组合乙方制造商选择合作条件时的最佳战略,即合作称为乙方制造商的条件优势战略或相对优势战略,简称为条件战略。 将与乙制造商条件战略相关的战略组合称为乙制造商条件优势战略的组合或相对优势战略的组合,简称为条件战略的组合。 乙方制造商也分别有两种条件战略和条件战略的组合。 性别战斗,23,两个制造商的条件战略组合正好相同,如果两个制造商不再倾向于单独改变战略,则整个游戏达到了均衡,即游戏平衡。 游戏平衡是游戏相关者最终选择的战略的组合,是游戏的最终结果,是游戏的解。 这个均衡有一个专门的名字叫“纳什均衡”。 纳什均衡,24,更严格地说,纳什均衡是指参与者单独改变战略也没有收益的战略组合。 或者,如果在某个战略组合中,其他所有人不改变战略,谁也不改变自己的战略,那么该战略组合就是纳什均衡。 纳什均衡,25,纳什均衡的存在性,唯一性和最佳性,1 .存在性在同时博弈中,纳什均衡也有可能不存在。 不存在的例子,26,制造商b,制造商a,合作,不合作,不合作,2 .在唯一性纳什均衡存在的条件下,它可能是唯一的,也可能不是唯一的。 例如,如果存在多个纳什均衡,28、制造商b、制造商a、左、右、上、下、29,3 .最佳纳什均衡,那么它可能不是最佳的或最佳的。 不是最佳例子,30、制造商b、制造商a、合作、不合作、不合作、二人同时游戏的一般理论、31、参加者b的战略、参加者a的战略、战略1、战略2、战略2、32、二人同时游戏的一般理论、1.81种可能的支付矩阵a的支付矩阵有9种、33、两人同时博弈的一般理论,2 .纳什均衡这5种类型的所有纳什均衡分为5种类型,分别为4个均衡(包括一种情况)、3个均衡(包括12种情况)、2个均衡(包括38种情况)、1个均衡(包括28种情况)和0个均衡(包括28种情况)第三节同时博弈:混合战略均衡,36,一,不存在纯战略均衡时的混合战略均衡,1 .混合战略第一,“确定性”的选择是没有纳什均衡的同时游戏,所有参加者对战略的选择是“确定”,即,某个参加者选择了某个战略时,他同时选择了其他战略相应的条件战略也是“确定”,最后,参加者的条件战略是“确定”的情况下,最终的游戏平衡也是“确定”。 37、一、不存在纯粹的战略均衡时的混合战略均衡,一.混合战略第二、“混合性”的选择在现实生活中,人们的战略的选择并不是如上所述的“不是”,而是多以一定的可能性选择一种战略,另一种可能性选择别的战略。 38、一、不存在纯战略均衡时的混合战略均衡,1 .混合战略第三、“混合”战略的概念是甲制造商和乙制造商的原战略为“纯”战略,赋予这些纯战略的概率向量为“混合”战略,39,一、不存在纯战略均衡时的混合战略均衡,2 .混合40、一、不存在纯粹的战略均衡的情况下的混合战略均衡,3 .在期待支付的混合战略游戏中,每个混合战略的组合,支付的组合也存在,其中,各项都是相应的参加者在这个混合战略的组合的条件下得到的支付。 但是,现在全体参加者都以一定的概率选择了单纯的战略,所以与此对应的支付也是所谓的“希望支付”,成为了支付的期待值。 不存在例子,制造商乙、制造商甲、左、右、上、下、q1、q2、p1、p2、42、一、不存在纯战略均衡的情况下的混合战略均衡,4 .条件混合战略利用希望支付的计算式来计算甲制造商和乙制造商的条件混合战略(即,相对优势的混合战略) 、43、一、不存在纯战略均衡时的混合战略均衡、44、一、不存在纯战略均衡时的混合战略均衡、45、一、不存在纯战略均衡时的混合战略均衡、5 .混合战略的纳什均衡参加者的条件混合战略可以分别确定,如果确定条件混合战略,就可以进一步确定混合战略的纳什均衡46、图101混合战略的纳什均衡(一)、47、解决混合战略的纳什均衡的方法不仅适用于不存在纯战略的纳什均衡的情况,也适用于存在纯战略的纳什均衡的情况。 在后一种情形中,纯战略纳什均衡作为特例包含在对应的混合战略纳什均衡中。 二、纯战略均衡存在时的混合战略均衡,48、制造商b、制造商a、不合作、不合作、二、纯战略均衡存在时的混合战略均衡,49、二、纯战略均衡存在时的混合战略均衡,50、二、纯战略均衡存在时的混合战略均衡,51, 图102混合战略的纳什均衡(二),第四节序贯游戏,52,53,一,例:竞争对手-垄断者游戏,1.2名参与者在这个游戏中,两个参与者是竞争对手和垄断者。54、一、例:竞争对手-垄断者游戏,2.2名参加者的决策顺序和战略竞争对手先作出决策,决定垄断者是否进入垄断市场的垄断者,根据竞争对手的行为来决定“容忍”还是“抵抗”。 竞争对手有进入和不进入两种战略,垄断者也有宽容和抵抗两种战略。 因此,总共有四种战略的组合。 在各种战略的组合中,第一种是作为先行动者的竞争对手的战略,第二种是作为后行动者的垄断者的战略。 55、二、游戏树,1 .游戏树的起点也被称为“初始决定点”,通常只有一个。 起点是游戏树的“根”,是逐次开始游戏的地方,是游戏的最初行动者进行决策的地方。56,2,游戏树,2 .游戏树的线段从初期的决定点开始,向右延伸两条线段,分别表示了竞争对手可以采取的两种行动或战略。 57、二、游戏树,3 .游戏树中间点的中间点也被称为“中间决定点”,通常至少需要两个。 通常,在这些中间决策点旁边标记另一个参与者,以指示中间点是另一个参与者做决策的地方。 58,2,游戏树,4 .游戏树的终点

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论