博弈论以及经典案例分析.ppt_第1页
博弈论以及经典案例分析.ppt_第2页
博弈论以及经典案例分析.ppt_第3页
博弈论以及经典案例分析.ppt_第4页
博弈论以及经典案例分析.ppt_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论以及经典案例分析 第一节 博弈论基本概念 第二节 生活中的博弈论 第三节 企业经营决策的博弈分析 第一节 博弈与博弈论 一、市场竞争中的博弈 在现实经济生活中,许多产业市场是寡头断 市场。寡头垄断市场是指少数几家大厂商生 产一个产业中的全部或大部分产品,从而形 成对一个产业的控制的产业市场。 在分析寡头垄断市场中的企业决策行为时, 就必须把各种决策者之间的策略及其相互作 用纳入到经济模型中,这就是一种博弈分析 。 “博弈”分析实际就是“对策”分析 二、现代经济学与博弈论 从现代观点看,经济学在某种意义上是研究人的决策行为的学问。 经济学中的理性人是指有一个很好定义的偏好,在面临给定的约束条件下能 最大化自己偏好的人。理性的主要意思就是,从不同的备选对象集合作出的选 择之间应该满足的一致性条件”。而每一次选择中,决策者对自己的各种可能 的选择所导致的各种结果都有一个偏好排序,这种偏好排序体现了决策者的效 用,在数学上可以表达为决策者最大化其效用函数。gp,a,s,i,u 价格理论有两个基本假定,即:第一,市场参与人的数量足够多,从而市场 是竞争性的;第二,参与人之间不存在信息不对称问题。 然而在现实生活中,这两个假设在许多情况下是不能被满足的,特别是在寡 头垄断的市场上。寻求竞争与合作良性动态均衡效果的对策博弈始终伴随 着决策者。 1994年诺贝尔经济学奖授予了三位博弈论专家纳什、泽尔腾和海萨尼,这是 对博弈论在经济学发展中的贡献和作用的充分肯定,确立了博弈论在现代主流 经济学中的地位。 三、博弈论的基本概念 (一)博弈论的定义 博弈论(gametheory),又译为对策论,就是研究决策主体的行为 发生直接相互作用时的决策以及这种决策的均衡问题。实际上, 博弈是一种日常现象。 在经济学中,博弈论是研究当某一经济主体的决策受到其他经济主 体决策的影响,同时,该经济主体的相应决策又反过来影响其他 经济主体选择时的决策问题和均衡问题。 一些相互依赖、相互影响的决策行为及其结果的组合称为博弈 (game)。 博弈论是使用严谨的数学模型研究冲突对抗条件下最优决策问题 的理论。 博弈论作为分析和解决冲突和合作的工具,在管理科学、国际政 治、生态学等领域得到广泛的应用。 (二)博弈的组成要素 一个博弈一般由以下几个要素组成:参与人、行动、信息、策略、得益、结果、 均衡等。(博弈是决策者求其最大化效用函数gp,a,s,i,u的过程) 1、参与人,又称局中人,指博弈中选择行动以自身利益最大化的决策主体(可 以是个人,也可以是团体,如厂商、政府、国家)。 2、行为,指参与人的决策(变量),如消费者效用最大化决策中的各种商品的 购买量;厂商利润最大化决策中的产量、价格等。 3、策略,又称战略,指参与人选择其行为的规制,即参与人应该在什么条件下 选择什么样的行动,以保证自身利益最大化。 4、信息,指参与人在博弈过程中的知识,特别是有关其他参与人(对手)的特 征和行动的知识。即该参与人所掌握的其他参与人的、对其决策有影响的所有 知识。 5、收益,是指参与人从博弈中获得的利益水平,它是所有参与人策略或行为的 函数,是每个参与人真正关心的东西,如消费者最终所获得的效用、厂商最终 所获得的利润。 6、结果,指博弈分析者感兴趣的要素集合。 7、均衡(equilibrium)是指所有参与人的最优策略或行动的组合。这里的“均衡 ”是特指博弈中的均衡,一般称之谓“纳什均衡”。 上述要素中,参与人、行动、结果统称为博弈规则,博弈分析的目 的就是使用博弈规则来决定均衡。 (三)博弈的分类 1、根据参与人的多少,可将博弈分为两人博弈或多人博弈; 2、根据参与人是否合作,可将博弈分为合作博弈或非合作博弈; 根据博弈结果的不同,又可分为零和博弈、常和博弈与变和博弈 。博弈论运用“二个囚犯,二种选择”的博弈模型从理论上深刻 揭示了竞争与竞合为博弈双方带来的迥然相异的结局: 零和博弈。在这种博弈中,一方的赢必然伴随着另一方的输,不 管各博弈方如何进行决策,各博弈方得益之和都为零。 常和博弈。在这种博弈中,各种结果下的各博弈方得益之和总是 等于一个非零常数。与零和博弈一样,常和博弈各方的利益关系 也是对立的,一方多占有一点利益,另一方必然会少占有一点。 变和博弈。即意味着在不同策略组合下各博弈方的得益之和是不 同的。倘若博弈各方之间相互配合,则可能争取到总得益和个人 得益均较大的理想结局;反之则社会总得益和个人得益均较小。 3、从行动的先后次序来分,博弈可以分为静态博弈和动 态博弈。 静态博弈指在博弈中,参与人同时选择行动或虽非同时 但后行动者并不知道前行动者采取了什么具体行动; 动态博弈指的是参与人的行动有先后顺序,且后行动者 能够观察到先行动者所选择的行动的博弈。 4、从参与人对其他参与人的各种特征信息的获得差异来 分,博弈可分为完全信息博弈和不完全信息博弈。 完全信息指的是每一个参与人对所有其他参与人的特征, 如策略集合及得益函数都有准确完备的知识;否则就是 不完全信息。 将上述角度的划分结合起来,我们就得到四种不同类型 的博弈,这就是:完全信息静态博弈、完全信息动态博 弈、不完全信息静态博弈、不完全信息动态博弈 表5-1 博弈的分类和均衡表 行动次序 信息 静态 动态 完全信息 纳什均衡 纳什 子博弈精练纳什均 衡 泽尔腾 不完全信息 贝叶斯均衡 海萨尼 精炼贝叶斯均衡 泽尔腾等 第二节 博弈的种类 一、完全信息静态博弈 (一)完全信息静态博弈定义 所谓完全信息静态博弈指的是各博弈方同时决策,或者决策行动虽有先后, 但后行动者不知道先行动者的具体行动是什么,且各博弈方对博弈中各种策略 组合情况下所有参与人相应的得益都完全了解的博弈。 (二)博弈的策略式表达 在博弈论中,一个博弈可以用两种不同的方式表达:一是策略式表达,又称为标 准式表达,另一种是扩展式表达。 所有参与人同时选择自己的策略,所有参与人选择的策略一起决定每个参与 人的得益。值得强调的是,这里参与人同时选择的是“策略”,而不是“行动 ”。当然在静态博弈中,由于参与人只选择一次,所以策略就等同于行动了。 而在动态博弈中,策略是参与人在各个阶段的行动的全面计划。 策略式表达更适合于静态博弈,而扩展式表达更适合于讨论动态博弈。 (三)博弈的得益矩阵表示 一个博弈被称为有限博弈,如果:第一, 参与人的个数是有限的;第二,每个参人可 选择的策略个数是有限的。两人有限博弈的 策略式表达及其求解可以方便地用得益矩阵 直观地给出。 著名的“囚徒困境”的例子 警察抓住了两个罪犯,但是警察局却缺乏足够的 证据指证他们所犯的罪行。如果罪犯中至少有一 人供认犯罪,就能确认罪名成立。为了得到所需 的口供,警察将这两名罪犯分别关押防止他们串 供或结成攻守同盟,并分别跟他们讲清了他们的 处境和面临的选择:如果他们两人都拒不认罪, 则他们会被以较轻的妨碍公务罪各判l年徒刑;如 果两人中有一人坦白认罪,则坦白者立即释放而另 一人将重判10年徒刑;果两人都坦白认罪,则他们 将被各判8年监禁,问两个罪犯会如何选择(即是 坦白还是抵赖) 表5-2 囚徒困境 囚犯b 囚犯a 坦白抵赖 坦白-8 -8 0 -10 抵赖-10 0-1 -1 (四)纳什均衡 1、占优策略均衡 一般来说,由于每个参与人的得益是博弈中所有参与人的策略的 函数,因此每个参与人的最优策略选择依赖于所有其他参与人的 策略选择。但在一些特殊的博弈中,一个参与人的最优策略可能 可以不依赖于其他参与人的策略选择 不论其他参与人选择什么策略,他的最优策略是唯一的,这样的 最优策略被称为“占优策略”。 如果一个博弈中,某个参与人有占优策略,那么该参与人的其他 可选择策略就被称为“劣策略”。 在一个博弈里,如果所有参与人都有占优策略存在,那么占优策 略均衡是可以预测到的唯一的均衡,因为没有一个理性的参与人 会选择劣策略。所以在囚徒困境博弈里,坦白,坦白是占优策 略均衡。 囚徒困境反映了一个深刻问题,即个人理性与团体理性的冲突。 这给我们一个启示,我们学习博弈论,也许更应该研究的是怎样 设计一种制度,在满足个人理性的同时,去争取达到“集体理性 ” 2、严格劣策略的重复剔除 重复剔除“严格劣策略”的思路如下: 首先找出某个参与人的严格劣策略(假定其存在),把这 个劣策略剔除掉,重新构造一个不包含已剔除策略的新 的博弈; 所谓“严格劣策略” 是指:在博弈中,不论其他参与 人采取什么策略,某一参与人可能采取的策略中,对自 己严格不利的策略。 重复这个过程,直到只剩下一个唯一的策略组合为止 。 这个唯一剩下的策略组合就是这个博弈的均衡解,称 为“重复剔除的占优均衡”。 注意,上述表述中强调了“唯一”这个词。也就是说, 如果重复剔除后剩下的策略组合不唯一,那么该博弈就 不是可通过重复剔除劣策略求解的。 例如,在股份公司中,股东都承担着监督经理的职 能,但是,大小股东从监督中获得的收益大小不 一样。在监督成本相同的情况下,大股东从监督 中获得的收益明显大于小股东。 因此,小股东往往不会象大股东那样去监督经理 人员,而大股东也明确无误地知道小股东会选择 不监督(这是小股东的占优策略),大股东明知 道小股东要搭大股东的便车,但是大股东别无选 择。 大股东选择监督经理的责任、独自承担监督成本 是在小股东占优选择的前提下必须选择的最优策 略。 3、纳什均衡 纳什均衡是完全信息静态博弈解的一般概念,构 成纳什均衡的策略一定是重复剔除严格劣策略过 程中(留下的)不能被剔除的策略,即没有任何 一个策略严格优于纳什均衡策略。当然,逆定理 是不存在的。 纳什均衡是指在均衡中,每个博弈参与人都确信 ,在给定其他参与人选择的策略的情况下,该参 与人选择了最优策略以回应对手的策略。 占优策略均衡一定是纳什均衡 纳什均衡的正式定义自己看书理解。 现实生活中,有相当多的博弈,我们无法使用占优策略均 衡或重复剔除的策略均衡的方法找出均衡解。例如: 在房地产开发博弈中,假定市场需求有限,、两个 开发商都想开发一定规模的房地产,但是市场对房地产 的需求只能满足一个房地产的开发量,而且,每个房地 产商必须一次性开发这一定规模的房地产才能获利。 在这种情况下,无论是对开发商还是开发商,都不 存在一种策略优于另一种策略,也不存在严格劣策略: 如果选择开发,则的最优策略是不开发;如果选 择不开发,则的最优策略是开发;类似地,如果选 择开发,则的最优策略是不开发;如果选择不开发 ,则的最优策略是开发。 第二节 生活中的博弈论 1碟子、猫和古董商 有位古董商发现有个人用珍贵的碟子做猫食碗,于是假装对这 只猫相当喜爱,要从主人手中买下。猫主人不卖,为此古董商出高 价。 成交之后,古董商装作漫不经心地说:“这个碟子它用惯了 ,就一块给我吧。”猫主人不干了:“你知道我用这个碟子已经买 出多少只猫了?”下面分析该故事。在这里 知识是“碟子是古董” 古董商知道“碟子是古董” 猫主人知道“碟子是古董” 但 “碟子是古董”不构成他们中间的公共知识(由此产生戏剧性 结果),因为古董商不知道猫主人知道“碟子是古董”。猫主人正 是利用他的如下知识获利: 猫主人知道古董商知道“碟子是古董”(所以猫主人知道古董商会 出高价)古董商不知道猫主人知道“碟子是古董”(所以古董商会 自以为聪明)猫主人知道古董商不知道猫主人知道“碟子是古董” (所以猫主人知道自以为是的古董商会上当) 2皇帝的新装 设知识是“皇帝没穿衣服”。 每个人都知道“皇帝没穿衣服”,但每个人不知道 他人是否知道“皇帝没穿衣服”,所以 “皇帝没穿衣服”不构成人们中间的公共知识。在 该知识结构下的均衡是:皇帝趾高气扬地行进, 老百姓们默不作声地观看,人人装模作样地看到 了新装。 直到一小孩说出“皇帝没穿衣服”,此话如晴天霹 雳,老百姓们开始私下传递此话,于是“皇帝没穿 衣服”最终成为公共知识。人们间的知识结构改变 后,原有均衡打破,结果变为:老百姓们开怀大 笑,皇帝和他的臣仆们仓皇而逃。 3村庄里的寓言 一个村庄里有100 对夫妇,丈夫们都是地道的逻辑学家。这个 村庄有个奇特的风俗。每天晚上,丈夫们围篝火而坐。如果丈 夫认为自己的妻子是忠贞的,就赞美妻子的美德;如果丈夫发 现自己妻子不贞,就恸哭。另外,如果一个妻子不贞,则她和 她的情人立即通知村里除她丈夫之外的所有男人。这些传统是 村民的共同知识。 事实上,每个妻子都已对丈夫不贞了。于是,每个丈夫都知道 其他99 个妻子是不贞的女人,但对自己的妻子是否忠贞无从知 道。所以,每晚所有丈夫仍在赞美自己的妻子。 直到有一天晚上,一个传教士来到这村庄,并宣布:“这个村子 里至少有一个妻子不贞”。 此后99 个晚上,所有丈夫们都继续赞美他们的妻子。但是在第 100 个晚上,所有丈夫们都恸哭起来。 在此,“某(些)妻子不贞”是私人信息,传教士的宣布“这个村子 里至少有一个妻子不贞”是公共信息。 4、分粥游戏 有7 人组成的小团体,每个人的地位平等,每个人自利 。他们餐餐分食一锅粥,但没有量具。他们试验不同方 法,发挥各自聪明才智,经过多次反复博弈,终于形成 合理完善的分粥制度。 第一种方法,指定一个人负责分粥事宜。大家很快发现 ,这个人为自己分的粥最多。于是又换一个人,结果总 是主持分粥的人的碗里粥最多。“权力导致腐败,绝对权 力导致绝对腐败”。每个人都为了得到分粥的特权不择手 段,彼此尔虞我诈。 第二种方法,大家轮流主持分粥,每人一天。这样每个 人都有分粥的权利,也给予每个人为自己多分粥的机会 。这样看起来似乎是平等了,但是每个人在一周中只有 1 天吃得饱而且有剩余,其余6 天却饥饿难捱。大家认 为这种方法造成资源浪费,并且导致大家相互加倍报复 ,矛盾激化。 分粥游戏 第三种方法,大家选举一位信得过的人主持分粥 。起初,这人尚能主持公道,可是不久他就开始 为自己和溜须拍马的人多分一些粥。不能放任堕 落和败坏风气,看来还得寻找新方法解决分粥问 题。 第四种方法,选举一个分粥委员会和一个监督委 员会,形成监督和制约。公平基本做到了,但由 于监督委员会常提出各种方案,分粥委员会又据 理力争,等分粥完毕,粥早已凉了。可见,倘若 制度效率不高,恐怕大家就要吃凉粥,有违制定 制度的初衷。 第五种方法,每个人轮流值日分粥,但是分粥的 那个人要最后一个领粥。结果是,不论谁分粥, 7 只碗里的粥每次都一样多,就像用科学仪器量 过一样。 上面最后一种方法,正是利用了人的利己性达到 利他性,从而实现公平分粥的目标。就这样经过 反复博弈,聪明的人们终于找到了良好的制度, 清晰且精妙,简洁且有效,从而构建了一个和谐 社会。分粥游戏的一个简化版本是分蛋糕。一天 ,一位母亲买回一个蛋糕给两位孩子,她想, 自己分得再均匀,吃到小块的孩子也会抱怨说分 得不公平。于是,聪明的妈妈想出了一个办法, 让他们自己分,但有一条规则:谁分谁后拿。结 果可想而知,不再赘言 5、重复博弈 囚徒困境一旦从一次性博弈转变为重复博弈,情况会发生非常大 的变化,博弈的结局也就是纳什均衡可能会完全不同。举个例子 ,大家都知道国外的黑手党组织严密,对待背叛者的惩罚非常残 忍。一个黑手党成员告发别的黑手党成员,一定会被组织谋杀。 我们假设囚徒困境故事发生在意大利,囚犯1 和2 都是黑手党成 员。他们很可能宁愿被判处终生囚禁,也不愿意出狱之后被同伙 干掉。值得注意的是,虽然黑手党成员之间并无签订合作协议, 但他们之间相互约束力非常强。 在重复囚徒困境中,并不是签订合作协议很困难,困难的是这个 协议对博弈各方是否具有很强的约束力。如现实中的婚姻就是男 女双方签订的一种协议,它具有一定约束力,因为一旦一方背叛 婚姻,就会受到家庭的压力与社会舆论的谴责;但离婚率的攀升 也说明婚姻的约束力有限。 不管如何,在长期关系中,合约是联系人们的普遍方式,也是提 高人们福利的重要手段。 再思考一下小区超市商品价格比闹市区便宜的原因吧。 6、高薪养廉 新加坡是世界上廉洁程度很高的国家,这既得 益于新加坡的高薪养廉制度,同时也得益于其对 贪污贿赂等职务犯罪行为的严厉惩处,即胡萝卜 大棒并举。 关于高薪养廉,20 世纪七八十年代,新加坡政 府连续4 次给公务员加薪20%。1989 年后,新 加坡已成为世界上公务员工资最高国家之一。 2000 年,新加坡部长级公务员月薪为4.84 万 新元(1 新元约合人民币5 元),加上其它奖金 ,年收入超过100 万新元;局长级公务员年 收入约40 万新元;普通公务员年收入也在八九 万左右。 另一方面,新加坡对贪污受贿等职务犯罪行为的 惩处,更是疏而不漏雷厉风行,具有强 大的威慑力。1986 年,新加坡国家发展部原部 长郑章远的一个朋友承认,曾于1981 年和1982 年分别向郑行贿40 万新元,帮助发展商取得土 地。案发后,郑以为凭借与李光耀的私交,李 会压下此案。但是,李光耀不徇私情,郑最后畏 罪自杀。郑留给李光耀的信中称,自己是“用 自杀来表达对新加坡法律的的尊重”。在新加坡 ,一旦被查出有问题,公务员就不仅要受到经 济惩罚或者刑事惩处,而且丢尽脸面,以后将很 难在社会上找到相应的工作,特别是退休金 和公积金同时被没收(新加坡的公务员退休后没 有专门的养老金或退休工资,而是领取在职 期间积存的公积金),这对一个公务员来说实在 是得不偿失。 新加坡高薪养廉制度具有很强的可信度,所以, 这一制度较为成功。当然,高薪养廉在中国尚需 时日,因为中国的经济基础目前还相对薄弱,公 务员队伍又很庞大。但可适当提高公务员工薪, 同时对职务犯罪做出更严厉的经济和刑事打击。 请大家思考一下目前中国公务员工资改革的思路 ,以及需要具备的条件。 7、逆向选择(柠檬市场) 在美国的俚语中,柠檬是次品的意思。20 世纪60 年代 ,经济学家阿克洛夫正是对旧车市场这一典型的“柠檬市 场”进行分析而提炼出“信息不对称”的概念。 他发现:由于买卖双方对于所要交易的旧车存在信息不 对称,买方愿意支付的价格不超过市场上所有旧车的平 均估价,这样持有高于该估价的旧车的卖方就会退出市 场,由此买方 愿意支付的价格进一步下降,持有高于该价格的卖方进 一步退出市场,最终旧车市场萎缩至崩溃。阿克洛夫的 这一发现尤其是他提出的“信息不对称”概念深刻影响了 经济学。“柠檬市场”在经济生活中是个普遍现象。 经济学家斯宾斯发现人才市场其实也是个“柠檬市场”。 由于信息不对称,雇主愿意支付的工资是个平均市场工 资,这样精英人才不会参与此类人才市场,只有平庸之 辈趋之若鹜。斯蒂格利茨发现信贷市场也是个“柠檬市场 ”。因为信息不对称,贷款人只好确定一个较高利率,结 果经营好的本分的企业退避三舍,坏的甚至压根不想还 贷的企业蜂拥而至。 在保险市场上同样存在逆向选择,比如对于健康保险, 常常是身体健康者不去投保,而健康状况不太好的人则 觉得有必要投保。 这些“柠檬市场”中的“柠檬”分别是旧车、平庸之辈、经 营不好的企业和健康状况不好的人。逆向选择的结果是“ 劣币驱逐良币”。 第三节 企业经营决策的博弈分析 一、 企业和顾客的博弈价格歧视 1 定义:在价格上给予消费者不同的对待 2. 价格歧视的形式: 1)一级价格歧视:依靠完全的信息 2)二级价格歧视:依靠购买的数量 3)三级价格歧视:依靠消费者的类型,企业基于消费者 对价 格敏感程度的不同将消费者分为具有不同的群体, 然后再向不同群体收取不同的价格。 3. 三级价格歧视形式:主要原则就是让消费者自 己对号入座,即自己披露自己的类型。 团队旅行与散客 发放优惠券(coupon) 回扣方案 预订打折 质量歧视 案例分析 a 假定你拥有一个养鱼塘,接待一个顾客钓鱼的成 本是20元,如果每次收费20元,某顾客会光顾 8次。假如你知道该顾客对8次钓鱼愿意付出的 总价格最高

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论