版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第第12章章 博弈论博弈论(Game Theory)对策论又称博弈论对策论又称博弈论:主要研究策略形势主要研究策略形势自由竞争的企业自由竞争的企业: :企业是价格的接受者企业是价格的接受者, ,不用关心对手的情况不用关心对手的情况. .垄断企业垄断企业: :没有竞争对手没有竞争对手, ,不是价格的接受者不是价格的接受者, ,但面对需求曲线但面对需求曲线. .介于两者之间的就是策略形势介于两者之间的就是策略形势, ,即不完全竞争的情况即不完全竞争的情况: :如汽车产业如汽车产业少数几家公司的决策会互相影响少数几家公司的决策会互相影响. .策略形势书面定义策略形势书面定义: :行为影响结果行为影响
2、结果, ,然而结果不仅取决于你的行为然而结果不仅取决于你的行为, ,还取决于其它人的行为还取决于其它人的行为. .适用领域适用领域: :经济学、政治学、法学、生物学等经济学、政治学、法学、生物学等简单的成绩博弈:简单的成绩博弈:请仔细阅读以下条款:请仔细阅读以下条款: 在不被你同桌看到的情况下,在方框中填字母在不被你同桌看到的情况下,在方框中填字母或或,把这看成,把这看成是成绩的赌注。我会随机把你们分成两两一组,你们不知道会跟谁是成绩的赌注。我会随机把你们分成两两一组,你们不知道会跟谁分到一组。按如下方法给出你们的成绩:分到一组。按如下方法给出你们的成绩:如果你选如果你选 而你的对手选而你的对
3、手选,那么你得,那么你得A,你对手得,你对手得C;如果你们都选如果你们都选 ,那么你们都得,那么你们都得B - ;如果你选如果你选,而你对手选,而你对手选,你得,你得C,你对手得,你对手得A;如果你们都选如果你们都选,你们都得,你们都得B+。 定义:如果你选定义:如果你选得到的结果严格优于得到的结果严格优于,那么,那么相对于相对于 是是个严格优势策略。个严格优势策略。结论结论1.不要选择严格劣势策略。不要选择严格劣势策略。原因:如果我选择优势策略,在每次博弈都得到更好的收益。原因:如果我选择优势策略,在每次博弈都得到更好的收益。结论结论2.理性人的理性选择造成次优的结果。理性人的理性选择造成次
4、优的结果。 囚徒困境囚徒困境坏形势下最好的策略是减少损失。坏形势下最好的策略是减少损失。合作型博弈合作型博弈有劣势策略吗?有劣势策略吗?改变了收益,我们改变了目的,即改变了博弈,改变了结改变了收益,我们改变了目的,即改变了博弈,改变了结果,因此收益很重要。果,因此收益很重要。结论结论3. 汝欲得之,必先知之汝欲得之,必先知之是优势策略,是优势策略,是劣势策略是劣势策略学会换位思考,去分析他们的收益如何,再根据对手的策略学会换位思考,去分析他们的收益如何,再根据对手的策略选择。选择。12.1 博弈论的基本概念博弈论的基本概念-1-1-1a3(下下)1-1-1a2(中中)11-1a1(上上)b3(
5、下下)b2(中中)b1(上上) S2(齐齐王王)S1(田忌田忌) 例例1田忌赛马田忌赛马:1. 局中人局中人(players):参与竞争的各方参与竞争的各方,每方必须有每方必须有独立的决策能力和承担风险的能力。独立的决策能力和承担风险的能力。局中人局中人A的策略的策略局中人局中人B的策略的策略.3. 收益向量:一局博弈后的各局中人的输赢得失收益向量:一局博弈后的各局中人的输赢得失2. 策略策略:局中人为了应对其他局中人的行局中人为了应对其他局中人的行动而采取的方案和手段。动而采取的方案和手段。4. 二人零和对策二人零和对策三个条件三个条件:(1)有两个局中人有两个局中人(2)每个局中人的的策略
6、都是有限的每个局中人的的策略都是有限的(3)每一策略组合下每一策略组合下,各局中人赢得之和始终为零各局中人赢得之和始终为零.例例2 甲乙二人玩剪刀甲乙二人玩剪刀石头石头布游戏,输方付给布游戏,输方付给 赢方赢方1元人民币。元人民币。11232123,SS 剪刀 石头 布剪刀 石头 布01 11011 10A剪刀石头 布剪刀石头布赢得矩阵:赢得矩阵:G=S1,S2,A11232123,SS ()ijmnAa局中人局中人策略集策略集赢得矩阵赢得矩阵 1994年诺贝尔经济学奖授予了三位博弈论专家和。 1996年诺奖授予两位博弈论与信息经济学研究专家莫里斯、维克瑞; 2001年诺奖授予阿克洛夫、斯彭斯
7、、斯蒂格利茨,表彰他们在柠檬市场、信号传递和信号甄别等非对称信息理论研究中的开创性贡献。 2005年诺奖授予有以色列和美国双重国籍的罗伯特奥曼和美国人托马斯谢林,以表彰他们在博弈论领域作出的贡献。( (三三) )博弈的分类博弈的分类 根据参与人的多少,可将博弈分为两人博弈或多人博弈; 根据参与人是否合作,可将博弈分为合作博弈或非合作博弈; 根据博弈结果的不同,又可分为零和博弈、常和博弈与变和博弈。 1、从行动的先后次序来分,博弈可以分为静态博弈和动态博弈。n静态博弈指在博弈中,参与人同时选择行动,或虽非同时但后行动者并不知道前行动者采取了什么具体行动;n动态博弈指的是参与人的行动有先后顺序,且
8、后行动者能够观察到先行动者所选择的行动的博弈。 2、从参与人对其他参与人的各种特征信息的获得差异来分,博弈可分为完全信息博弈和不完全信息博弈。 完全信息指的是每一个参与人对所有其他参与人的特征,如策略集合及得益函数都有准确完备的知识;否则就是不完全信息。 将上述两个角度的划分结合起来,我们就得到四种不同类型的博弈,这就是:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈和不完全信息动态博弈。行动次序信息静态动态完全信息纳什均衡子博弈精练纳什均衡不完全信息贝叶斯均衡精炼贝叶斯均衡 博弈的分类和均衡均衡是所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合
9、,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合第二节第二节 完全信息静态博弈完全信息静态博弈 所谓完全信息静态博弈即各博弈方同时决策,且所有博弈方对博弈中的各种情况下的得益都完全了解的博弈问题. 静态:指博弈方同时采取行动,或虽不同时但后行动者对前者采取的策略并不了解。 纳什均衡 无限策略博弈的解和反应函数 混合策略 纳什均衡的存在性博弈模型的表达形式博弈模型的表达形式 基本式基本式 扩展式扩展式例例1 囚徒悖论囚徒悖论例例22.1 2.1 纳什均衡纳什均衡定义定义 在博弈 中,如果策略组合 中任一博弈方i的策略 都是对其余博弈方的策略组合 的最佳对策,也即 对任意 都成立,则称
10、 为G的一个纳什均纳什均衡衡。11,.,;,.,nnGSS uu*1(,.)nss*is*111( ,., ,., )iiinsss ss*111111( ,., ,., )( ,., ,., )iiijiniiijinu ss s ssu ss s ssijisS*1(,.)nss2.1.12.1.1博弈的解和纳什均衡博弈的解和纳什均衡划线法:先找出自己针对其他博弈方每种策略或策略组合(对多方划线法:先找出自己针对其他博弈方每种策略或策略组合(对多方博弈)的最佳对策,即自己的可选策略中与其他博弈方的策略或策博弈)的最佳对策,即自己的可选策略中与其他博弈方的策略或策略组合配合,给自己带来最大得
11、益的策略(这种相对最佳对策总是略组合配合,给自己带来最大得益的策略(这种相对最佳对策总是存在的,不过不一定唯一),然后在此基础上,通过对其他博弈方存在的,不过不一定唯一),然后在此基础上,通过对其他博弈方策略选择的判断,包括其他博弈方对自己策略判断的分析等,预测策略选择的判断,包括其他博弈方对自己策略判断的分析等,预测博弈的可能结果和确定自己的最有策略。博弈的可能结果和确定自己的最有策略。箭头法:对博弈中的每个策略组合进行分析,考察在每个策略组合箭头法:对博弈中的每个策略组合进行分析,考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加得益。如能,则处各个博弈方能否通过单独改变自己的
12、策略而增加得益。如能,则从所分析的策略组合对应的得益数组引出一个箭头,到改变策略后从所分析的策略组合对应的得益数组引出一个箭头,到改变策略后策略组合对应的得益数组。最后综合对每个策略组合的分析情况,策略组合对应的得益数组。最后综合对每个策略组合的分析情况,形成对策略结果的判断。形成对策略结果的判断。2.1.12.1.1博弈的解和纳什均衡博弈的解和纳什均衡 划线法 囚徒2 不坦白 坦白 囚 不坦白 徒 1 坦白 箭头法 囚徒2 不坦白 坦白 囚 不坦白 徒 1 坦白 1 1,1 1 8 8,0 0 0 0,8 8 3 3,3 31 1,1 1 8 8,0 0 0 0,8 83 3,3 3练习练习
13、2.1.22.1.2严格下策反复消去法与纳什均衡纳什均衡纳什均衡 总结总结纳什均衡点是一种局部均衡点,可以有很多个,也可以不存在。来源于策略组合的策略可能有n!个(离散),也可能无穷多个(连续),那么求解将会十分烦琐。得益 对于任一策略组合(s1,sn),其总得益为各博弈方得益之和 那么对于具有多个纳什均衡点的博弈,则对应的应有最优纳什均衡的概念,而对应于最优纳什均衡的点为全局最优点。此处最优的含义为稳定性而不是得益之和最大。11( ,.,)( ,.,)ninu ssu ss线性规划求混合策略的纳什均衡线性规划求混合策略的纳什均衡(1,., )ijia xvjn111111nnmmmnyyax
14、aAxaa 1jjmjja ya y甲赢得(, )ijijija x yE X Yv1 iiinia xa x乙损失(, )ijijija x yE X Yv当甲使用混合策略对付乙的纯策略时当甲使用混合策略对付乙的纯策略时,不不论乙采取何种纯策略论乙采取何种纯策略,甲的收入都不小于甲的收入都不小于双方都采取混合策略的期望值双方都采取混合策略的期望值v,即即:1212:max.1minmin:,1min.miimvxxxvvxxvxxxv 目标函数是期望收入最大,即或写成: 令则目标函数变为:或写或写成成:11 112211212222112212.10(1,.,)mmmmmmnmmmia xa
15、 xa xva xa xaxva xaxaxvxxxxim11 1212112122221122:.1.1. . .10(1,.,)mmmnmmnmnia xa xa xa xa xaxsta xaxaxxim约束条件变为1.矩阵对策线性规划模型矩阵对策线性规划模型线性规划求混合策略的纳什均衡线性规划求混合策略的纳什均衡(1,., )ijja yvim同理同理,当乙使用组合策略对付甲的纯当乙使用组合策略对付甲的纯策略时策略时,不论甲采取何种纯策略不论甲采取何种纯策略,乙的乙的损失都不大于双方都采取组合策略损失都不大于双方都采取组合策略的期望值的期望值v,即即:1212:min.1maxmax:
16、,1max.njjnvyyyvvyyvyyyv 目标函数是期望损失最小,即或写成: 令则目标函数变为:或写或写成成:11 1122121 122221 12212.10(1,.,)nnnnmmmnnnia xa xa xva xa xa xva xaxaxvxxxxim11 1122121 122221 122:.1.1. .10 (1,., )nnnnmmmnnja ya ya ya ya ya ysta ya ya yyjn 约束条件变为可见局中人甲与乙的线性规划可见局中人甲与乙的线性规划模型为一对对偶问题模型为一对对偶问题.例例利用线性规划方法利用线性规划方法求解赢得矩阵的最求解赢得矩阵
17、的最优策略优策略7292909011A解解该问题可以化为两个线性规划问题该问题可以化为两个线性规划问题:1231231231313:1min7291291. .91110Axxxvxxxxxstxxx局中人1231231231313:1max7291291. .91110Byyyvyyyyystyyy局中人2.4 2.4 几个应用例子几个应用例子 古诺的寡头模型 反应函数 伯特兰德的寡头模型 公共资源问题2.4.12.4.1古诺的寡头模型古诺的寡头模型 博弈方1 1利润: 博弈方2 2利润: 在本博弈中, 的纳什均衡的充分必要条件是 和 的最大值问题: 社会收益最大化: 假设总产量为Q Q,总
18、收益为U UQPQP(Q Q)CQCQ Q Q(8-Q8-Q)2Q2Q6Q6QQ Q2 2 其最大值为Q Q* *=3,=3, ;该结果与纳什均衡有较大的差异,这就是纳什均衡是源于各厂商追求自身利益最大化的结果。2111 1112111 21( )8 ()26uqP QCqqqqqqqqq2222221222122( )8()26uq P QC qqqqqqq qq*12(,)qq*1q*2q12*21121*22122max(6)max(6)qqqq qqqq qq*12122, u =u =4qq12u =u =4.52.4.2 2.4.2 反应函数反应函数 反应函数反应函数每个博弈方针对
19、其他博弈方所有策略的最佳反应构成的函数。而各个博弈方反应函数的交点交点(如果有的话)就是纳什均衡。2.4.2 2.4.2 反应函数古诺模型反应函数古诺模型 在古诺模型中厂商1和厂商2的反应函数分别为1122221111()(6), ()(6)22qR qqqR qqq2q1(0,6)(0,3)R1(q2)R2(q1)(2,2)E0(3,0)(6,0) 从左图可以看出,当一方的选择为0时,另一方的最佳反应为3,这正是我们前面所说过的实现总体最大利益的产量,因为一家产量为零,意味着另一家垄断市场。当一方的产量达到6时,另一方则被迫选择0,因为实际上坚持生产已无利可图。2.4.3 2.4.3 伯特兰德的寡头模型伯特兰德的寡头模型 在该模型中厂商选择价格而不是产量 厂商1的价格与需求函数: P1, 厂商2的价格与需求函数: P2, 其中,d1,d20为两厂商产品的替代系数。假设两厂商无固定成本,边际成本分别为c1和c2。收益:纳什均衡:221222221 ( ,)qq P Pab Pd P11121 11 11111 11 222122 22 22222 22 1( ,)()()( ,)()()uu P PPqcqPcabPd Puu P PPqc qPcab Pd P*12122 211 11 2121 212*21211 122 2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安全超车警示讲解
- 滴灌安全责任书讲解
- 改变自我激励话术
- 冷链施工单位资质审核办法
- 质量与安全培训心得体会课件
- 质检室安全管理职责培训
- 消化内科质控护士长年终总结汇报
- 急诊科医师质控年终总结汇报
- 血友病患者药物治疗与护理
- Unit4Grammar课件外研版英语八年级上册()-1
- 驳回再审裁定书申请抗诉范文
- 果园租赁协议书2025年
- 2025北京高三二模语文汇编:微写作
- DB6301∕T 4-2023 住宅物业星级服务规范
- 护理查房与病例讨论区别
- 公司特殊贡献奖管理制度
- T/CA 105-2019手机壳套通用规范
- 2025-2031年中国汽车维修设备行业市场全景评估及产业前景研判报告
- 门窗拆除合同协议书范本
- GB/T 1040.1-2025塑料拉伸性能的测定第1部分:总则
- 重症胰腺炎的中医护理
评论
0/150
提交评论