一完全信息静态博弈

上传人：我*** IP属地：北京上传时间：2023-03-20 格式：DOCX 页数：26 大小：572.75KB 积分：12 举报 版权申诉

已阅读5页，还剩21页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

什么是博弈

完全信息静态博Theory活动中的竞选、谈判和等也都有类似的特征。2005年与·教授共同经济学奖的·奥曼教授给博弈1944冯·诺依曼和摩根斯坦合著的《博弈论与经济行为》标志着现代博博弈举1.犯困1950年的一天，普林斯顿大学数学系教授Tucker教授给心理学家做，为了更都坦白，各判刑8年；如果两个都抵赖，各判1年（或许因为不足如果其中一人坦-8，-，--10，-1，--8，-，--10，-1，-表中每一格的两个数字代表对应策略组合下两个的支付（获益其中第一个数字个坦8，因为都抵赖隔得1显然比各得5而且各自都追求最大利益且不会考虑对方利益（的行为有负外部性，因此只能实现对为。与斥候的博和兄长都是楚国忠臣。公元前522年，楚平王怀疑“诸侯，将入为乱”，于是迁怒于太傅，将、骗到郢都，只身吴国。在中，在边境上被守关斥候抓到肚子里去了。楚王为了得到宝珠一定先杀死，还且会剖开你的肚子寻找宝珠，这样我活不长，你会0 -10000，-0，不- 0，那么他必死无疑，相应的支付为-10000；如果斥候，那么最终他还是将被，斥候（心理）支付是-20000，如果没有被，那么将得到赏金10。在这样一个格局中存在两个均衡，其中一个是（不，押送，另一个是（，释放，因为给定对方的策略，己方的选择是最优的。注意，这个时候，通过将斥候拉3.田忌赛对方的选择的，因此是同时决策；把赢一千斤铜记为得益1，输一千斤铜记为获益-1.3，-1，-1，-1，--1，-1，-3，-1，-1，-1，--1，--3，-1，-1，-1，--1，-1，-3，-1，-1，-1，-1，-1，--3，-1，-1，-1，--1，-1，-3，-４.斗鸡博斗鸡博ＡＢ进退进退 0，当年10月份，发现了在古巴的。由于的对造成了严重的威胁，因此宣布古巴，并开始集结和。最开始并没有选择妥协，而是加速向古巴运送及轰炸机。24日集结了二战后最庞大的登陆准备参战，一场核随时可能爆发。此时综合考虑了双方如果爆发对世界性的影响，于是由给肯尼署的42枚及轰炸机，而也结束了对古巴的。断增加。2007年，有1/3的离婚因夫妻不和，其中“装修”是一个重要。总是各执己见、互不退让，当爆发次数足够多时就会选择分手。５.战（情侣博弈兴得1；分开大海看球丽娟看芭蕾，大家都不那么高兴，各得0。2，弈有两个纳什均衡，都去看或者都去看芭蕾。至于那个均衡会出现呢？教授，跟文化、习惯和过去的历史有关。比如，如果近期是大海的生日，都去看这个均衡更有则如果上周是丽娟陪大海看，那么这周就很可能是大海陪丽娟去芭蕾舞厅。策略不等于行动，它是参与人相机决策的规制。比如：当A情况时我选择行博弈中的支付（得益刚出生的婴孩落入了李莫愁手中。李莫愁误以为此女是与小所生，欲以此来迫小交出自小受到郭家养育之恩，又敬佩为人，誓死要保护安全。一场三人博弈就这样开始了。最开始，在手中，为抢到与打斗，李莫愁则坐山观虎斗，欲借金轮之手除去。的武功是敌不过的，要保护不落入法王之手，他该怎么办？愁共斗，同时又要保护好。那么他必须设计一个激励机制，首先使李莫愁的参与约束得到满足，同时又得使保护对李莫愁而言是最优选择，即满足李莫愁的激励相容约束。于是他考虑是否将（转移支付）递给李莫愁。 (委托给李莫愁,和李莫愁形成,李莫愁保护)EU（自己保护孩子交给李莫愁之后，杨知道李单独一人无力保护，于是他自身的参与（杨-李）约束情况是EU（联合李莫愁） (不联合李莫愁)(PCyang的李莫愁总是可以将孩子抛还给或，然后相安无事，这是保留支付。EU李莫（保 EU李莫（不保 EU李莫（保护,不联合(IRliEU李莫（保护联 EU李莫（不保保护并联合的支付甚至要低于参与约束。上面两个条件是满足的，并且由于李莫愁知道之内，李莫愁会保护好。给定这个成立，在第一阶段的就会将委托给李莫愁。动态博弈：序贯行动（下象棋博弈为合作（走出犯困境）提供了可能（beliefMyerson（1999）对理性的辩护：（1）在没有更好的其他可选择的理论时，接受理性人假设是个退而求其次的办法；（2）管不是每时每刻都是理性的，但从长期看，人们应该习得理性；（3）整个社会科策和方案，理性假设使我们地关注制度、政策的作用故事【两个旅行者从一个以产出细瓷花瓶著名的地方旅行回来，他们都买了花瓶。提取行李的时候，发现花瓶被摔坏了。他们向航空公司索赔。航空公司知道价格十元上下浮动，22那么最后每个人都写0，而且是唯一的纳什均衡。

•是谨慎的，司马懿知道是谨慎的，知道司马懿知道诸agreement 博弈的策略式（标准式）所有参与人同时选择各自ui(s1sisni1,2,3博弈的策略式表述：G{S1,...,SnG{q10,q20;1(q1,q2),2(q1,q2完全信 “静态占优策略（1）困-- -0，---1，-即使两个在作案之前建立攻守（绝不坦白，这个攻守也不（2）s称为参与人i的严格占优策略，如果对应所有的ss*是i的严格最优选择，即 u(s,s)u(s,s)s,s 对应的，所ss被称为“严格劣策略（strictlydominatedstrategies。 si(s1,...,si1si1,...,sn是i之外所有参与人策略的组合（3）定i在博弈的策略式表述中，如果对于所有的isiis(ss称为占优策略均衡（dominant-strategy 制着食物供应。按下按钮（需支付成本2位），8个单位猪食进槽。大猪先到，吃到7，小猪吃1；453。】0，7，0，7，-2，3，按按总结上述方法（重复剔除严格劣策略：首先找到某个参与人的劣策略（若存在搭便车（小猪坐享其成，大猪去按按钮，小猪先吃，大猪再赶来吃称策略组合s(ss为重复剔除的占优均衡，如果它是重复剔除严格参与人LMRU1，1，0，D0，0，2，博弈能够简化为该结构的前提条件：AB是理

LMU1，LMU1，1,D0,0,B必须知道“A知道B是理性的”才能够进入上述简“A是理性的”的

在该新博弈中，对参与人A而言，U严格优于D，如果Ａ是理性的（并且AB理性的，这样才能将原博弈简化为该新博弈）A不会选D；“A知道B理性的BAB不会选RB知道原博弈已简化为以上新博弈）B可以D从A策略空间中剔除，于是B又将面对一个新博弈：LMULMU01,该新博弈实际上是单人决策问题，对BM严格优L，Ｌ被剔除，因上例中，(1)AB是理性的，A就无法排除B选R的可能U不一定是Ａ的最优选择；(2)如果Ａ知道B是理性的，但如果B不知道“Ａ知道B（R格不等式成立。si称为相对于si的弱劣策略如果每次剔除的是严格劣策略，均衡结果与剔除顺序无关；然而如果剔除的是略，则均衡结果可能与剔除顺序相策略）→R3（R1的严格劣策略）→（R1，C3）纳什均左中右上0,4,5,中4,0,5,下3,3,6,定义n个参与人的策略式表述博弈GS1Sn;u1un}，策略组合s(ss是一个纳什均衡，如果对于每一i，s*是给定其他参与人选 ssss*,...,s的情况下第i个参与人的最优策略，即 i1 u(s,s)u(s,s),sS, i或者用式表示，s是下述最大化问题的解isargmaxu(s,...,s,s,s*,...,s)，i1,2,..., isi

i1 i 某些i而言si不是i的最优策略（si。换句话说，至少存在一个siSi使左中右上0,4,5,中4,0,5,下3,3,6, 在得益（6,6）下都有标记，则对应的（下，右）是一个纳什均衡，因为给定某方的划再举给定参与人AR1，,参与B的最优策略有两个(C1C3)，因此相应的两给定参与人A的策略R1（一个点参与人B的最优反应策略是一个集合（点命题An个参与人的标准式博弈G{S1,...,Sn;u1,...,u2}中，如果重复剔除严劣策略法排除了 s）之外的所有策略，那么这一策略组合为该博弈惟一的纳命题Bn个参与人的标准式博弈GS1Sn;u1u2 s）是一个纳什均衡，那么重复剔除严格劣策略法一定不会将它剔存在着博弈方i的某个策s该策略在s被剔除时还没有被剔除且是相对于s 严格优势策略，即满足u(s,..., ,s, ,...,s)u(s,..., ,s, ,...,s)，对于 i1 i1 意此时尚未被剔除的其他博弈方的策略组合(s1,...,si1,si1,...,sn)都成立，从而对（ssss）u（sssss）u（ssss 1 i1 1 i1 BA得证。用反证法证明命题A，假设重复剔除劣策略法已经剔除了（s,...,s）之外的有策略组合，但（s,...,s）不是一个纳什均衡。也就是说至少存在一个博弈参与人 ,, 1 i1 1 i1 但是（s,...,s）是经过重复剔除严格劣策略法之后留下的唯一的策略组合，因此当时还没有被剔除的siui(s1si1sisi1,...,snui(s1si1sisi1,...,sn)当时尚未被剔除的任意其他博弈方的策略组合都成立，从而对 ,,...,1 i1 1 i1 过程中会被剔除（注意，最终留下的策（s,...,s）），则一定在某阶段存在s 证明结束，否则还可以进一步推论到s的存在。重复上述过程，由于s是最终未被消纳什均衡是复剔除劣策略均衡更强的解概enforcing 1,AC要签订合同，上表中每个策略组合都可以看成一个潜C1（R3，C3）AR3BC39个可能的合同。合同，B不愿意遵守，因为B会偏离而选择C3.□纳什均衡应用举例（策略是连续变量Cournot双寡头竞争求函数。第ii(q1q2qiP(q1q2Ci(qii1,2(q,q是纳什均衡产量意味着 qargmax(q,q)qP(qq)C(q qargmax(q,q)qP(qq)C(q 1P(qq)qP(qq)C(q) 2P(qq)qP(qq)C(q) 上述两个一阶条件分别定义了两个反应函数（reactionqR(q qR(q 为了得到更具体的结果，考虑以下特定的成本、需求函数，即Ci(qi)qicq1(aqc)Pa(qq)，那么代入一阶条件（1），可得反应函数：1 q1(aq qq1(ac (q,q)(q,q)1(a 为了与情况作比较，计算企业的最优产量和利润。企业选择Q最大化Q(aQc)，得到最产量Q1(ac)qq2(ac) 利 m1(ac)22(ac)2 的利润的影响而忽视了对另一个企业的负外部性：典型的困境

1）于产量，因此第一轮将所有大于𝑞𝑚和

给定企业2不选择大于产量，企业1不会选择小于𝑞2，同理企业2不会小于𝑞2 2第2

22222

22 32222

22 1又会调整…这个过程直到纳1 11春天每位农民决定自己养多少只羊。我们用gi0代表第i位农民饲养的数量， i1,2n;G 的总量；(G)代表每只羊的平均价值(G)0,ifG(G)0,ifG0;2 G每个农民的问题是选择gi0以最大化自己的利润。假一只羊的成本为cn则利润函数为：i(g1,...,gi,...,gn) gi)gic,i1,2,...,n。一阶条件为i(G)g(G)c0,i1,2,..., 得所有之前的羊的价值下降gi(G)0。最优解满足边际收益等于边际成本。（2）定义了n个反应函数：gg(g ,...,g),i i i 由（2记F(ggi(Gg(Gc0，由隐函数定理 2gigjgigj

2 gi2i(G(Gg(G0；2i(Gg(Ggi gig 与社会最优放牧量G的比社会最优的目标是最大化如下定义的社会总剩余:MaxG(G)G (G)G(G) 将每个农民的一阶条件相

G))

) 比较（3（4）可得GG[反证法，如果GG，则由于00，故(G(G和(G(GGG可知Gn

，因此（3）的左边大于（4）的左边， 3（4）不是（3）中的G(G)

G(Gn决：企业和工会分别向仲裁者开出自

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

一完全信息静态博弈

文档简介

温馨提示

最新文档

评论

一完全信息静态博弈

文档简介

温馨提示

最新文档

评论

相关文档