生产运作管理课堂报告:s02 战略制定的博弈分析模型_第1页
生产运作管理课堂报告:s02 战略制定的博弈分析模型_第2页
生产运作管理课堂报告:s02 战略制定的博弈分析模型_第3页
生产运作管理课堂报告:s02 战略制定的博弈分析模型_第4页
生产运作管理课堂报告:s02 战略制定的博弈分析模型_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、博弈的三个基本要素: 1.局中人(Player): 参与对抗的各方;参与人是理性的、智能的。 2.策略集(Strategy set): 局中人选择对付其它局中人的行动方案称为策略。 某局中人的所有可能策略全体称为策略集; 3.局势对策的益损值(支付 Payoff): 各局中人各自使用一个对策就形成一个局势,一个局势决定了个局中人的对策结果(量化),称为该局势对策的益损值.,博弈的其它要素: 1.虚拟参与人(Pseudo-player) 指 “自然” (Nature)、“上帝” God,也即决定外生的随机变量的概率分布的机制。 2.行动的顺序(the order of play) 博弈中参与人实

2、施决策活动的顺序。同时或有先有后。 其他因素不变,但顺序不同,博弈的结果也不同。 不同顺序意味着不同的博弈。静态博弈和动态博弈。 3. 信息 (Information) 指一个博弈中参与人有关该博弈的知识,如关于N的选择、其他参与人的策略集、支付函数、行动时间等. 完全信息、完美信息、共同知识、私人信息,“田忌赛马”齐王在各局势中的益损值表,齐王的策略集: S1=1, 2, 3, 4, 5, 6 田忌的策略集: S2=1, 2, 3, 4, 5, 6 下列矩阵称齐王的赢得矩阵: 3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1

3、 1 -1 3 1 1 1 -1 1 1 3,二人有限零和对策: (又称二人有限零和博弈、矩阵对策、矩阵博弈) 局中人为2; 每局中人的策略集中策略权目有限; 每一局势的对策均有确定的损益值,并且对同一局势的两个局中人的益损值之和为零; 同时行动,静态博弈。,记矩阵对策为: G = S1, S2, A “齐王赛马”即是一个矩阵策略.,甲的策略集,乙的策略集,甲的赢得矩阵,矩阵对策的最优纯策略,在甲方赢得矩阵中: A=aijmn I 行代表甲方策略 i=1,2m J 列代表乙方策略 j=1,2n aij代表甲方取策略 i,乙方取策略 j, 这一局势下甲的益损值,此时乙的益损值为-aij(零和性质

4、)。 在讨论各方采用的策略是必须注意一个前提就是对方是理智的。这就是要从最有把握取得的益损值情况考虑。,例:有交易双方公司甲和乙,甲有三个策略1,2,3;乙有四个策略1,2,3,4,根据获利情况建立甲方的益损值 赢得矩阵。 问:甲公司应采取什么策略比较适合?,甲:采取1至少得益3 2 0 3 -4 乙:采取1甲最多得益2(乙最少-2 ) 2 3 (乙-3 ) 3 0 (乙 0 ) 4 3 (乙-3 ),甲采取策略2 不管乙采取如何策略,都至少得益。 乙采取策略3 不管甲采取如何策略,都至少可以得益。(最多损失0) 分别称甲,乙公司的最优策略,由唯一性又称最优纯策略。 最优纯策略存在前提: ma

5、x min aij = min max aij = v i j j i 又称(2 ,3) 为对策G=s1,s2,A的鞍点。 值V为G的值。,纯策略Nash均衡,Nash:电影美丽心灵A Beautiful Mind,Nash均衡,若策略(s1*, , sk-1*, sk*, sk+1*, , sn* ) 对任意参与人 i 和策略 k 均满足: ui (s1*, , sk-1*, sk*, sk+1*, , sn* ) ui (s1*, , sk-1*, sk, sk+1*, , sn* ) 则称(s1*, , sk-1*, sk*, sk+1*, , sn* ) 为该博弈的Nash均衡。,例1

6、:团体对抗赛 甲、乙两队开展三人制团体对抗赛,各队的阵容安排视为一种策略,各种局势下的损益值可由下面的甲的赢得矩阵所示:问两队在稳妥原则下会选择何种阵容?,解: max min aij = max 1, -3, -1=1 i j i min max aij = min 3, 1, 3 =1 j i j,故(1 ,2) 为上述对策的最优纯策略,例2:预先采购与大自然博弈 冬季消耗煤:冷 20吨 正常 15吨 暖 10吨 冬季煤价: 冷 20元 正常 15元 暖 10元 已知秋季煤价10元,问秋季应采购多少吨?,解:max min aij = max -300, -250, -200 = -200

7、 i j i min max aij = min -100, -150, -200 = -200 j i j,故(3 ,3) 为 上述对策的最 优纯策略,设矩阵对策 G =S1,S2,A 当 max min aij min max aij 时, i j j I 不存在最优纯策略。 任务转变为: 求解混合策略。,矩阵对策的混合策略,混合策略Nash均衡,例:设一个赢得矩阵如下:,例3:猜拳博弈 甲乙各出1,2,3中一个数字,两人数字之和为m,若A为 奇数,甲付给乙m;若为偶数,乙付给甲m,求最优策略。,解:max min aij = max -3, -3, -5 = -3 i j i min m

8、ax aij = min 4, 4, 6 = 4 j i j,不存在最 优纯策略,本例的最优混合策略为:,甲: X* = (0.25,0.5,0.25)T V=0 乙: Y* = (0.25,0.5,0.25)T V=0,假设矩阵对策 G = S1, S2, A 甲方赢得矩阵 A=aijmn - 若存在两行(列),s 行(列)的各元素均优于 t 行(列)的元素,即 asjatj ,j=1,2n (ais ait , i=1,2m ) 称甲方策略s优超于t ( s优超于t),优超原则,当局中人甲方的策略t被其它策略所优超时, 可在其赢得矩阵A中划去第t行 (同理, 当局中人乙方的策略t被其它策略

9、所优超时, 可在矩阵A中划去第t列)。 如此得到阶数较小的赢得矩阵A, 其对应的矩阵对策 G= S1, S2, A 与 G = S1, S2, A 等价, 即解相同。,被第3、4行所优超,被第3行所优超,被第 1、2 列所 优超,例 设甲方的益损值 赢得矩阵。得到:,被第1行所优超,被第1列所优超,对A4计算,用线性规划方法得到: (注意:余下的策略为3,4,1,2) 甲: X* = (0, 0, 1/15,2/15,0)T V=5 X*= (0, 0, 1/3 , 2/3 ,0)T 乙: Y* = (1/10,1/10, 0, 0, 0)T V=5 Y*= (1/2 , 1/2 , 0, 0

10、, 0)T 注: 利用有超原则化简赢得矩阵时,有可能将原对策问题的解也划去一些(多解情况); 线性规划求解时有可能是多解问题。,反应函数:分赃博弈,博弈方1和博弈方2就如何分10000元进行讨价还价。 规则: 双方同时提出自己要求的数额s1和s2, 0s1,s210000 s1+s210000,则两博弈方的要求都得到满足,即分别得s1和s2,但如果s1+s10000,则该笔钱就被没收。 问该博弈的纯策略纳什均衡是什么?如果你是其中一个博弈方,你会选择什么数额,为什么?,反应函数,答案: 假设博弈方1选择s1,给定博弈方2的策略,博弈方1将选择Maxs1=10000-s2, 这就是博弈方1的反应

11、函数. 同理, 博弈方2对于另一人的反应函数为s2=10000-s1 解得:s1, s2为满足s1+s2=10000的任意值. 此外,如果双方判断彼此的选择是相同的,则s1=5000, s2=5000,反应函数:配比捐款,另一道题: 一个小镇上,有N个人(人数大于3),每个人有100元,如果每人都捐款一笔(每人捐款数额可以不同,并可以为零),共募集到F元。那么李嘉诚愿意再拿出F元来,最后这笔钱给他们平均分配,也就是说,他们可以每人分得2F/N元。 问:在均衡的情况下,每人愿意集资多少?,反应函数,答案: 假设捐款数量分别为s1, s2, ,sN. 给定其他人的策略,博弈方1的选择是如下的反应函

12、数: Max 2F/N-s1 = 2(s1+ s2+ +sN) /N-s1 可见,博弈方1的最佳选择是取S1=0 同理,所有人选择策略都是0. 思考:如何能够通过机制设计,来保证这种捐助的成功?,两个囚徒的选择:或者供出同伙,或者抵赖。 各种选择的后果:都抵赖:没有证据,均无罪释放 都认罪:坦白从宽,均判处轻刑; 一人招供一人抵赖: 招供方无罪释放,并有立功奖励 抵赖方判处重刑,且判处罚金,1.囚徒困境,博弈说明: 完全信息静态博弈 存在纯策略Nash均衡 可用优超求解,黄色为均衡解,延伸: (1)爱情博弈、军备竞赛、价格联盟、股市博弈 (2)有限次重复囚徒博弈的解不变 (3)无限次重复囚徒博

13、弈,结果是二人互相信任 (4)多人重复囚徒博弈:只要有一人上次背叛,即背叛,为什么麦当劳、肯德基总是开在一起?,2.位置困境,博弈说明: 完全信息动态博弈 存在子博弈精炼Nash均衡,延伸: (1)电视节目扎推现象 (2)商业中心、产业集聚 (3)政党争议为何总是趋向中间路线?,两人合作猎鹿,得鹿一头(10)平分:各得价值5; 一人猎鹿一人猎兔:前者一无所有,后者得兔一只价值3; 二人均猎兔,各得兔一只,各得价值3.,3.猎鹿博弈,博弈说明: 完全信息静态博弈 存在两个纯策略Nash均衡,黄色为均衡解,启示: (1)企业强强联合,接近于猎鹿模型的帕累托改善 (2)猎鹿模型是假设猎人双方平均分配

14、猎物,如果分配权不同,可能无法帕累托改善 (3)多人狩猎博弈,根据分配可以分成既得利益集团与弱势群体,大猪、小猪同槽,控制食物供应依靠按钮。按一次按钮有8个单位食物进槽,但需承担2个单位的成本。按者后进槽。 若二者同时按按钮同时进槽,大猪吃到5个食物,小猪3个 若小猪按按钮大猪先进槽,大猪吃7个食物,小猪吃到1个 若大猪按按钮小猪先进槽,大猪、小猪都吃到4个食物。,4.智猪博弈,博弈说明: 纯策略均衡最优策略:大猪按,小猪等待。 大猪的收益外部化,小猪不劳而获,免费搭了大猪的便车。,黄色为均衡解,延伸: (1)新产品引入时,小企业的跟随战术 (2) 一个和尚挑水喝,两个和尚抬水喝,三个和尚没水

15、喝 (3) Scott公司 与可口可乐、百事可乐的竞争 (4) 股市上的小猪策略 (5) 改变机制,避免智猪搭便车,二人进行胆小鬼游戏,从两头冲向独木桥。 如均勇进,则两败俱伤,效用均为-2; 若均胆怯,则受到嘲笑,效用为0; 如一方勇进一方胆怯,勇进方得到欢呼,效用4, 胆怯方受到嘲笑,效用-1.,5.胆小鬼博弈,博弈说明: 两个纯策略均衡最优策略(胆怯,勇进)(勇进,胆怯) 狭路相逢勇者胜。,黄色为均衡解,延伸: (1)讨债博弈 (2)房地产开发博弈 (3)赌博:跟还是不跟 (4) 赢者通吃轮流叫价拍卖,6.海盗分金,10个海盗分100金币, 先由最凶残的海盗来提出分配方案,然后大家一人一

16、票表决,如果有50%或以上的海盗同意这个方案,那么就以此方案分配,如果少于50%的海盗同意,那么这个提出方案的海盗就将被丢到海里去喂鱼,然后由剩下的海盗中最凶残的那个海盗提出方案,依此类推。,动态博弈的最优策略: 96、0、1、0、1、0、1、0、1、0 先发优势很重要,先考虑只有2个海盗的情况(其他海盗已丢到海里)。记他们为P1和P2,其中P2比较凶残。P2的最佳方案当然是:他自己得100枚金币,P1得0枚。投票时他自己的一票就足够50%了。 往前推一步。现在加一个更凶猛的海盗P3。P1知道P3知道他知道如果P3的方案被否决了,游戏就会只由P1和P2来继续,而P1就一枚金币也得不到。所以P3

17、知道,只要给P1一枚金币,P1就会同意他的方案。所以P3的最佳策略是:P1得1枚,P2什么也得不到,P3得99枚。 P4的情况差不多。他只要得两票就可以了,给P2一枚金币就可以让他投票赞同这个方案,因为在接下来P3的方案中P2什么也得不到。P5也是相同的推理方法只不过他要说服他的两个同伴,于是他给每一个在P4方案中什么也得不到的P1和P3一枚金币,自己留下98枚。 依此类推。,延伸: (1)拉拢小人物,来对抗大人物 (2)历史上的革命都是拉上贫苦大众,练习:分豆子博弈,5个囚犯,分别按1-5号在装有100颗绿豆的麻袋抓绿豆,规定每人至少抓一颗,而抓得最多和最少的人将被处死,而且,他们之间不能交

18、流,但在抓的时候,可以摸出剩下的豆子数。问他们中谁的存活几率最大? 提示: 1,他们都是很聪明的人 2,他们的原则是先求保命,再去多杀人 3,100颗不必都分完 4,若有重复的情况,则也算最大或最小,一并处死,十支箭与四十追兵问题,假如你是一位英雄,手中的剑已经折断,而在你后面,正有一帮坏人追杀你。幸运的事,你骑着马,而他们却没有。不幸的事,你的马已经筋疲力竭,而他们将最中会抓到你。幸好你有一把弓箭。可惜你只有十支箭。值得庆幸的事,作为一位英雄,你总是百发百中,从未失过手。糟糕的事,后面有四十个坏人,他们以一定的间隔在你身后横向排开一队,以最快的速度向前冲。他们离你很紧,已经到了射程之内。 请运用经济学的方法逃脱,7.最后通牒博弈,2个海盗分100金币: A提出分配方案,如果B同意,则以此分配;若不同意,则双方均一无所得,最优策略: 1,99 后发优势也很重要,延伸: (1)男生给女生切蛋糕 (2)找工作时要求年薪很低,在进入选美博弈后看到的第一个页面

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论