15第七专题第1次:竞争型决策-基本概念_第1页
15第七专题第1次:竞争型决策-基本概念_第2页
15第七专题第1次:竞争型决策-基本概念_第3页
15第七专题第1次:竞争型决策-基本概念_第4页
15第七专题第1次:竞争型决策-基本概念_第5页
已阅读5页,还剩45页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

编写组决策理论与方法第一讲竞争型决策概述专题七竞争型决策主要内容博弈的基本概念1完全信息静态博弈2典型案例3竞争无处不在引例博弈论(gametheory)主要是解决决策者之间冲突和合作的理论。具体来讲,是解决决策主体的行为在发生直接的相互作用时,人们如何进行决策以及这种决策的均衡问题。引例一.基本概念

囚徒困境囚徒乙坦白抵赖囚徒甲坦白(-8,-8)(0,-10)抵赖(-10,0)(-1,-1)警方拘捕了两个同案的犯罪嫌疑人(囚徒)后,为防止串供,将其分开拘押,隔离审问。对他俩的政策是:若一人招供但另一人未招,则招者立即被释放,未招者判入狱10年;若二人都招则两人各判刑8年;若两人都不招则未获证据但因私入民宅各拘留1年。

如果都是理性的个体,应该作何决策?典型的博弈现象可以看出:1.两个囚徒决策时都已自己的最大利益为目标,结果是无法实现最大利益或者是较大利益;2.也反应了一个很深刻的问题,即个体理性与集体理性之间的矛盾,即从个体利益出发的行为往往不能实现集体的最大利益;3.同时也揭示了个体理性本身存在的内在矛盾,即从个体利益出发的行为最终也不一定能真正实现个体利益的最大化。典型的博弈现象

博弈就是一些人或组织在一定的环境和规则下,同时或先后,一次或多次,从各自允许选择的行动或策略中进行选择并加以实施,各自取得相应结果的过程。博弈的概念要素博弈的参与者。又称博弈方或局中人,是指博弈中独立决策、独立承担结果的决策主体。

博弈的要素参与者的支付

。每个参与者从各种策略组合中获得的收益或效用,它是策略组合s的函数,所以也被称为支付函数。记博弈方i的支付函数为ui(s)

要素博弈的要素以上是博弈问题的三个基本要素博弈的标准式囚徒困境中参与者:嫌犯甲和嫌犯乙策略集:{坦白,拒绝}支付:博弈结束,参与者得到的回报。双方的支付由所选策略决定。当两个嫌犯都选择“坦白”时,他们的支付都是-1,即坐牢1年。要素博弈的要素博弈方的信息。博弈的次序。所有随机事件的概率分布扩展要素分类博弈的分类参与者的数量:两人博弈和多人博弈参与者策略的数量:有限博弈和无限博弈收益情况:零和博弈、常和博弈和变和博弈行动的顺序:静态博弈、动态博弈、信息结构:完全信息博弈和不完全信息博弈参与者理性:非合作博弈和合作博弈分类博弈的分类参与者的数量:两人博弈和多人博弈两人博弈就是存在两个各自独立决策,但策略和支付具有相互依存与制约关系的博弈方的决策问题。多人博弈是指有三个或三个以上参与者进行的博弈。参与者寻求自身最大利益的决策活动,只是现在其他参与者不是一个,在分析参与者的策略行为时,不仅要考虑两两之间的相互作用,还要考虑参与者可能会形成联盟。分类博弈的分类参与者策略的数量:有限博弈和无限博弈有限博弈:参与者的数量和所有策略集合都是有限的。无限博弈:只要参与者数量或某一个参与者的策略集合是无限的,该博弈称无限博弈。分类博弈的分类收益情况:零和博弈、常和博弈和变和博弈零和博弈:所有参与者的得益总和始终为零的博弈,其是最常见的一种博弈类型,同时也是被研究得最早、最多的博弈问题。常和博弈:所有参与者的得益总和始终为某一非零常数的博弈,常用于分析固定份额财富或资源的分配。变和博弈:博弈中参与者的利益总和会随着策略组合的不同而变化。分类博弈的分类行动的顺序:静态博弈、动态博弈、重复博弈静态博弈:所有参与者同时采取行动,或者,虽然行动有先后次序但是参与者无法看到别人的行动。动态博弈:参与者的决策行动是有先后顺序的,而且后决策行动的参与者能够观察到先决策行动的参与者所选择的策略的博弈。如下棋游戏和纸牌游戏。重复博弈:同一个博弈反复进行所构成的整体博弈过程,构成重复博弈的一次性博弈叫作“元博弈”或者“阶段博弈”。分类博弈的分类信息结构:完全信息博弈和不完全信息博弈

在网上流传着这样一个故事。一个古董商发现一个人用珍贵的茶碟装猫食,于是假装对他的猫非常喜爱,想从他手里买下这只猫。猫主人一口回绝。为此古董商狠心出了高价,才说服猫主人成交。成交后,古董商装作不经意地说:“这个碟子它用习惯了,就一块儿送我吧。”猫主人微微一笑:“你知道用这个碟子,我卖了多少猫吗?”

在这个故事中,古董商掌握着“茶碟是古董”这个信息,非常得意,并自作聪明地认为养猫人不知道。谁知猫主人不但知道,而且还利用了古董商“认为自己不知道”的错误认识,更胜一筹。信息的重要性分类博弈的分类信息结构:完全信息博弈和不完全信息博弈

完全信息博弈:每个参与者对其他参与者的策略集合及支付函数有准确认识的博弈。

不完全信息博弈:至少部分参与者不完全了解其他参与者支付情况的博弈。分类博弈的分类参与者理性:非合作博弈和合作博弈

合作博弈:强调集体理性和效率,参与者的决策是以集体目标最大化为驱动。

非合作博弈:强调个体理性,即个体利益最大化。

行动顺序信息静态动态完全信息完全信息静态博弈纳什均衡纳什(1950,1951)完全信息动态博弈子博弈精炼纳什均衡泽尔腾(1965)不完全信息不完全信息静态博弈贝叶斯纳什均衡海萨尼(1967-1968)不完全信息动态博弈精炼贝叶斯纳什均衡泽尔腾(1975)博弈的分类二.完全信息静态博弈

完全信息静态博弈概念内涵每一参与者都拥有其他所有参与者的特征、策略集和支付函数等方面的准确信息,这样的博弈称为完全信息博弈。参与者同时行动,或者非同时行动但后行动者观察不到先行动者的选择的博弈,称为静态博弈。同时满足完全信息和静态两个条件的博弈称为完全信息静态博弈。囚徒博弈石头剪子布田忌赛马无限策略博弈(古诺博弈)……拥有支付函数的准确信息:1.指支付函数是确定的;2.支付函数是公共信息。

常见分析方法囚徒困境中,“双方都坦白”是极为可能出现的结果,而且这一结果非常“稳定”:假如任何一个人单方面改变自己的选择,将会得到更差的结果。所以没有人单方面更改策略,双方处于一个胶着状态,即均衡状态。怎样分析并求得这个均衡?

常见分析方法占优战略均衡

重复剔除占优战略均衡

划线法

箭头法

常见分析方法占优战略均衡

占优战略就是指不管其他参与者策略为何,该参与者总能可找到一个最佳策略。这个最优策略称为上策。如果在竞争型决策中每个参与者都有上策,这些上策所构成的策略组合必然会受到所有参与者的欢迎,这样的策略组合称为该博弈的一个均衡点,称为“占优战略均衡”。

常见分析方法占优战略均衡

常见分析方法占优战略均衡

占优战略均衡分析是最基本的博弈分析方法,占优战略均衡非常稳定,根据它可以做出最肯定的预测,因为它反映了博弈方对策略的绝对偏好,只要找到占优战略均衡,博弈分析任务基本完成。实际上经常出现所有参与者都没有上策,如石头剪刀布游戏。

不具有普遍适用性。

常见分析方法重复剔除占优战略均衡

如果一个参与者的某个策略给他带来的收益总是比另一种策略所带来的收益少,该策略对于该参与者来说就是“严格下策”,无论在什么时候,参与者都不会选择该策略。

因此,可以将包含该策略的所有策略组合消去,这样就可以简化博弈局面,一直循环往复,不断消去“严格下策”,直到只剩一个策略组合为止,这个策略组合就是该博弈局面的均衡点,这种均衡称为“重复剔除的占优战略均衡”,也称为“严格下策反复消去占优战略均衡”。

常见分析方法重复剔除占优战略均衡

常见分析方法重复剔除占优战略均衡

步骤:1、首先找出某一博弈参与人的严格下策,将它剔除掉,重新构造一个不包括已剔除下策的博弈;2、然后继续剔除这个新的博弈中某一参与人的严格下策;3、重复进行这一过程,直到剩下唯一的参与人策略组合为止。

常见分析方法划线法

基本思路:找出一个参与者针对其他参与者每种策略或策略组合(对多人博弈)的最佳对策,即自己的可选策略中与其他博弈方的策略或策略组合配合,给自己带来最大得益的策略,在其支付值下划线。若存在一个策略组合,使得所有参与者的支付值下都划了线,则该策略组合就是一个均衡点。

常见分析方法划线法

左中右甲上(0,4)(4,0)(5,3)中(4,0)(0,4)(5,3)下(3,5)(3,5)(6,6)

常见分析方法划线法

左中右甲上(0,4)(4,0)(5,3)中(4,0)(0,4)(5,3)下(3,5)(3,5)(6,6)

常见分析方法划线法

左中右甲上(0,4)(4,0)(5,3)中(4,0)(0,4)(5,3)下(3,5)(3,5)(6,6)

常见分析方法划线法

左中右甲上(0,4)(4,0)(5,3)中(4,0)(0,4)(5,3)下(3,5)(3,5)(6,6)

常见分析方法划线法

左中右甲上(0,4)(4,0)(5,3)中(4,0)(0,4)(5,3)下(3,5)(3,5)(6,6)

常见分析方法箭头法

基本思路:考察在每个策略组合处各个参与者能否通过单独改变自己的策略而增加收益,如能,则从所分析的策略组合对应的支付值数组引一箭头,指向改变策略后策略组合对应的支付数组,若博弈局面存在一策略组合,其支付值数组只有进来的箭头而没有出去的箭头,则该策略组合就是均衡点。该方法实质上是一种“趋利避害”的动态分析方法。

常见分析方法箭头法

亚当

坦白抵赖杰克坦白(-8,-8)(0,-10)抵赖(-10,0)(-1,-1)三.典型案例

智猪博弈大猪按等待小猪按(1,5)(-1,9)等待(4,4)(0,0)猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。如果大猪先到食槽,则大猪吃到9单位食物,小猪仅能吃到1单位食物;如果两猪同时到食槽,则大猪吃7单位,小猪吃3单位食物;如果小猪先到,大猪吃6单位而小猪吃4单位食物。下表给出这个博弈的支付矩阵。

案例:智猪博弈智猪博弈没有占优战略均衡。大猪没有上策,也没有严格下策。小猪有一个下策“按”,因为无论大猪作何选择,小猪选择“等待”是比选择“按”更好一些的策略。如果小猪是理性的,小猪会剔除“按”,而选择“等待”;大猪知道小猪会选择“等待”,从而自己选择“按”,所以,可以预料博弈的结果是(等待,按)。

案例:智猪博弈大猪按等待小猪按(1,5)(-1,9)等待(4,4)(0,0)力量成为弱势(1)根据智猪博弈的结论,在一个双方公平、公正、合理和共享的竞争环境下,有时占优势的一方最终得到的结果却有悖于其初始理性。(2)占有更多资源者,必须承担更多的义务。大猪出力,小猪抢食,这已经成为当今国际社会的一条规则。任何一个大国如果想要维护自己的利益,就必须自己动手,同时还要允许一帮小国从中牟利。

案例:智猪博弈案例:俾斯麦海的海空对抗1943年2月,第二次世界大战中的日本,在太平洋战区已经处于劣势。为扭转局势,日本统帅山本五十六统率下的一支舰队策划了一次军事行动:由集结地——南太平洋的新不列颠群岛的蜡包尔出发,穿过俾斯麦海,开往新几内亚的莱城,支援困守在那里的日军。案例:俾斯麦海的海空对抗

当盟军获悉此情报后,盟军统帅麦克阿瑟命令太平洋战区空军司令肯尼将军组织空中打击。

日本统帅山本五十六心里很明白:在日本舰队穿过俾斯麦海的三天航行中,不可能躲开盟军的空中打击,他要策划的是尽可能减少损失。案例:俾斯麦海的海空对抗未来3天气象预报:北线阴雨,能见度差;

南线晴好

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论