




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、博弈论 (对策论、游戏论)博弈论又名对策论、游戏论,是一门研究互动关系“游戏”的参与者各自选择策略的科学,博弈论把这些复杂关系理论化,以便分析其中的逻辑和规律,并对实际决策提供指导和借鉴。游戏三要素(博弈的规则、结构):1、博弈、游戏参加者。博弈论分析,假定参与者都是机智而理性的。2、行为和策略空间。博弈参与者必须知道他自己及其对手伙伴的策略选择范围,并了解各种策略之间的因果关系。3、有可评价优劣高下的决策行为结果。博弈论用数字表示这类结果,并称之为支付。支付矩阵可以用支付矩阵(得益矩阵、收益矩阵、赢得矩阵)来描述一个博弈结构。厂商B支配策略:由于游戏参与者试图实现自身利益最大化并具有理性的决
2、策能力,加上信息方面的假定,所以上述支付矩阵表示的博弈具有一个简单而确定的结果。从厂商A角度来说,它采取策略“下”而得到的支付总是好于 “上”(2,1分别对1,0)。同样,对于厂商 B来说,选择策略“左”得到的利益总是优于“右”(1,2分别对0,1 )。因此,我 们可以确定预期均衡选择策略是A选择“下”而B选择“左”的策略。囚徒困境:F面支付矩阵表示著名的“ 囚徒困境”游戏,从博弈论角度看,这是一个存在支配均衡的博弈;因为对囚犯A、B来说,无论对方如何选择,“坦白”都是各自的最优选择。虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保持沉默,然而,由于猜忌,试图获得更大好处(3个月刑期)
3、等竞争性动机阻碍了他们达到更好的互利选择,他们面临“囚徒困境”。我们将看到,寡头垄断厂 商经常面临类似的困境。囚犯B囚犯A纳什均衡:坦白坦白沉默5年,5年3个月,10年沉默10年,3个月1年,1年支配均衡是一个特例,并非每个博弈都存在支配均衡。下面修改的支配均衡表示博弈中,厂商A、B在选择做广告问题上存在的策略关系。其中厂商A没有支配策略,因为 A的最佳决策取决于 B的选择。例如,当B选择做广告时,A应当选择做广告,由此得到10而不是6的支付得益,然而,当 B选择不做广告时,A应当选择不做广告,从而得到 20而不是15的支付得益。假定两个厂商需要同时决策,A应当如何决策?厂商B左(做广告)右(
4、不做广告)上(做广告)10,515,0厂商 A下(不做广告)6, 820,2解答这个问题,A需要把自己放在 B的位置,从B的角度看什么是最好的选择,并在此基础上考虑自己的选择。支付矩阵表明 B有一个支配策略:不论 A选择如何,B选择做广告时利益较大(5,8对0, 2),因而A 可以判断B会选择做广告,而在 B做广告时,A应当选择做广告,因而。均衡结果是双方都做广告。上述均衡结果被称作纳什均衡。纳什均衡指给定一组对手行为前提下,各博弈方存在的最佳选择; 在纳什均衡状态下,只要其他参与者不变换策略选择,任何单个参与者不可能单方面通过变换策略来提高它的所获支付。美国数学家和统计学家纳什(Nash)5
5、0年代提出的折椅概念,所以称作纳什均衡。纳什均衡和支配策略均衡的区别是:在纳什均衡下,我(你)所做的是 给定你(我)的选择我(你)所能做的最好的”。而支配均衡下,“我(你)所做的是 不论你(我)的选择,我(你)所能做的更好的”。支配均衡 必然是纳什均衡,纳什均衡未必是支配均衡。,有时又可能不存在纳什均衡,下面左一个博弈可能有好几个纳什均衡(即几组稳定并且自我坚持的策略)表存在两个纳什均衡,右表则没有纳什均衡。左右上A2, 10, 0A下0, 01, 2I左B右上A0, 00,-1A下1, 0-1, 3重复博弈:上面讨论的“囚徒困境”暗含所几个假定是静态所一次性的博弈,结果陷入了个体理性决策导致
6、集体非理性结果的困境。现在我们改变条件,讨论博弈可以多次进行的重复博弈(Repeated Game),这时,囚犯同时选择沉默有可能成为纳什均衡。因为重复性博弈中,选择坦白的机会成本太高,可能成为不利的选择。例如:A有机会对B组成策略联盟,并对B宣布如下方针:我将选择沉默,并要求你也如此来增进各自利益;然而,如果你半途背叛选择坦白,我从下一阶段游戏开始一直选择坦白,这一方针跟A利益一致,因而是可信的。从 B角度来看,如和 A合作,可能每阶段得到1年监禁的较好结果;如中途变卦,固然当期可得3个月的更好结果,但此后便每次面临 5年监禁的结果,显然是不利的。因而重复博弈中,“沉默” + “沉默”点可能
7、成为双方的最佳选择,因而成为纳什均衡。由于博弈条件由一次性变为重复性,均衡状态随之发生变化。序列博弈前面讨论的博弈是参与者同时选择。在序列博弈(Sequential Game)中,各博弈方先后依次行动。F面的支付矩阵描述了一个博弈,如果同时行动,它有两个纳什均衡(“甜,咸”或“咸,甜”)。假定A可以先推出甜饼干(假如较快投入生产),就有了序列博弈:A先作决策,B随后选择。A决策是必须考虑竞争厂商B左(咸饼干)右(甜饼干)| A上(咸饼干)-5,- 510, 20丿商A下(甜饼干)20, 10-5,- 5者的理性反应;A知道不论自己推出哪种饼干, B处于自身利益会推出另一种;因而 A推出甜饼干,
8、B在给定A 决策时选择咸饼干;给定 B的选择,A的选择仍然最佳。结果两个纳什均衡点收敛为一个(下,左) 。其中A由 于具有先行者优势(First Mover Advantege)而得到较大利益。中国电信、中国联通的价格竞争模型:A (中国电信)是老牌企业,实力雄厚,占据了绝大多数的市场份额;B (中国联通)刚成立不久,翅膀没有长硬,是政府为打破垄断鼓励竞争而筹建的,B得到了政府的一些优惠,其中就有B的价格可以比A低10%。这一举动,还不会对 A产生多大的影响,因为A的根基实在是太牢固了。在这样的市场分配下,B可以达到平衡,但由于 B在价格方面的优势,市场份额逐步壮大,到了一定程度,对A造成了影
9、响。这时候,A该怎么办?B (中国联通)A (中国电信)降价、维持、维持、降价、维持降价维持5, 10-10, 15降价15, -5-5,- 5B损失5,整体获利A获利15,10;B维持,则B维持,则B降价,则B降价,则A获利A损失A损失5,10,5,从A角度看,显然降价要比维持好,B获利10,整体获利B获利15,整体获利B损失5,整体损失降价至少可以保证比15;5;10。B好,在概率均等的情况下,A降价的收益为15 X50 %5 X50%= 5,维持的收益为550 %- 10 X50% = - 2.5,为了自身利益的最大化,A就不可避免地选择了降价。从B角度看,降价也比维持好,其降价收益为5
10、,维持收益为2.5 , B也会选择降价。在这轮博弈中,都将降价作为策略,因此各损失5,整体损失 10 ,整体收益是最差的。这就是此博弈最终所出现的纳什均衡。电信业价格战博弈模型是典型的囚徒困境现象, 各个局部都寻求利益的最大化, 而整体利益却不是最优, 甚至是 最差。许多其他行业的价格竞争都是典型的囚徒困境现象, 如可口可乐公司和百事可乐公司之间的竞争、 各大航空 公司之间的价格竞争等等。OPEC 组织成员国之间的合作与背叛“囚徒困境” 告诉我们,个人理性和集体理性之间存在矛盾,基于个人理性的正确选择会降低大家的福利, 也就是说,基于个人利益最大化的前提下,帕累托改进得不到进行,帕累托最优得不
11、到实现。上述我们在对电信价格竞争的博弈分析中,只是一次性的“ 囚徒困境” 博弈,因此得到了互相降价的纳什均 衡。而在现实生活当中,信任与合作很少达到如此两难的境地,无论在自然界还是在人类社会, “ 合作” 都是一 种随处可见的现象。比如中东石油输出国组织(Organizationg of Petroleum Expoting Countries 简称OPEC)的成立,本身就是要限制各石油生产国的产量,以保持石油价格,以便获取利润,是合作的产物。OPEC 之所以能够成立,各组织成员国之间之所以能够合作,是因为囚徒困境如果是一次性博弈(One shot game) 的话,基于个人利益最大化,得到纳
12、什均衡解,但如果是多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解,合作就 有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解,这也是博弈论上著名的“大众定理”(Folk Theorem)的含义。但合作的可能性不是必然性。博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是 实力更强的一方)必须主动通过可信的承诺 (Credible commitment) ,向另一方表示合作的善意,努力把这个善意 表达清楚,并传达出去。如果该困境同时涉及多个对手,则要在博弈对手中形成声誉,并用心地维护这个声誉。 这里“ 可信的承诺” 是一个很牵强的翻译, “ Credible com
13、mitment 并”不是什么空口诺言,而是实实在在的付出。 所以合作是非常困难的。 所以 OPEC 组织经常会有成员国不遵守组织的协定,私自增加石油产量。每个成员国 都这样想,只要他们不增加产量,我增加一点点产量对价格没什么影响,结果每个国家都增加产量,造成石油价 格下跌,大家的利润都受到损失。当然,一些产量增加较少的国家损失更多,于是也更加大量生产,造成价格进 一步下降-结果,陷入一个困境:大家都增加产量,价格下跌,大家再增加产量,价格再下跌。理论上,几乎所有的卡特尔(正是串谋在一起的厂商称作Cartel)都会遭到失败,原因就在于卡特尔的协定(类似囚犯的攻守同盟) 不是一个纳什均衡, 没有成员有兴趣遵守。 那么是不是不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年【R1快开门式压力容器操作】考试题库及答案
- 2025年公路水运工程试验检测师公共基础试题库及答案(法规与技术标准)
- 2025年监理工程师之交通工程目标控制考试题库含答案a卷
- 桥梁招标课件
- 2025年品牌营销经理招聘面试模拟题与技巧解析
- 2026届安徽省亳州市第三十二中学高三化学第一学期期中联考模拟试题含解析
- 2025年电商运营岗位笔试模拟题及答案解析
- 2025护士资格证考试题库及答案
- 2025年大数据与人工智能课程考试试题及答案
- 2025年旅游管理与规划项目的考试试题及答案
- 小升初测试(试题)-2023-2024学年六年级下册数学苏教版
- 青少年抑郁症的预防和干预策略
- 考公行测言语理解与表达题库之选词填空公考公务员考试省考国考310题(含答案)
- 2021年度计算机审计初级网络培训测试题
- 康复科康复评定表
- 输液反应-完整版
- 【高质量】如何进行有效的校本研修PPT文档
- 水泥生产企业生产安全事故综合应急预案
- 食堂安全培训-课件
- 胆总管结石伴急性胆管炎
- 制度编写书写规范
评论
0/150
提交评论