博弈论教材2013-3

上传人：我*** IP属地：贵州上传时间：2018-12-16 格式：DOC 页数：12 大小：175.50KB 积分：20 举报 版权申诉

已阅读5页，还剩7页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

例 2 情侣博弈丈夫（H）和妻子（W）决定周末去看足球（F）还是去剧院（O）。丈夫不愿意和妻子分开，但是他对妻子的性格不甚了解，妻子可能喜欢独处，也可能对丈夫充满深情要在一起。表 4-2 深情 W 独处 W O F O F O 3，1 0,0 H O 3，0 0,1H F 0,0 1,3 F 0,3 1,0 作为现实生活中的一个情景，考虑委员会选举（比如参议院中的小组委员会）；两位委员会成员的投票决定两个对立议案 F 和 O 的命运。规则要求一致同意；参与人 H 希望通过 F。第一种类型的 W 希望通过 O，第二种类型的 W 希望没有议案得到通过。此外，如果 W 投了 H 喜欢的议案的票，而投票结果又出现分散现象，她将得到最大的乐趣，因为看上去她很宽容。三贝叶斯纳什均衡潜存于例 2 之下的三个假设：假设 1：妻子知道自己的最优选择，即她知道“正确的博弈”是左表还是右表；假设 2：丈夫不知道她的妻子真正的优先选择，他对他的真实类型附加了概率；假设 3：妻子知道她的丈夫关于她的优先选择的估计，即她知道的取值。三个假设中最容易引起争议的是最后一个假设，它叫做公公先验假设。让我们转到均衡分析。在约翰海萨尼于 1967 年和 1968 年所写的三篇论文中，他提出了适合不完全信息博弈的纳什均衡的推广，他的建议分为两部分： 1 将不完全信息博弈转为不完美信息博弈一个虚拟参与人（自然）选择妻子的类型（类型 1 深情，类型 2 独处），将之告诉妻子但是不告诉丈夫，于是得到了对应的展开型博弈： - 2 - 2 使用这个不完美信息形式的纳什均衡解作为原博弈的解在不完全信息博弈中，赋予纳什均衡一个专用名词，成为贝叶斯-纳什均衡。注意到丈夫的纯策略是选择 F 或 O，混合策略是置于 F 的概率的选取，并且将这个概率表示为。妻子的策略是成对的。她的第一个分量是类型 1 的妻子的选择，第二个分量是类型 2 的妻子的选择。因此妻子的纯策略是（F,F）,（F,O）,（O,F）,（O,O）。而混合策略是( ),其中是21， 21，类型 1 妻子和类型 2 妻子将采取 F 的概率。定义博弈的贝叶斯-纳什均衡是三个部分，其中每个参与），（ 21 人及其每种类型将采取最佳反应如下：（1）如果丈夫以概率采取 F，那么概率最大化类型 i 妻子的效用；（2）如果丈夫相信他以概率遇到类型i 1 的妻子，并且她以概率采取 F，而已概率遇到类型 2 的妻子，并且1-1 她以概率采取 F，那么概率将使得丈夫的效用最大。2 博弈论第 - 3 - 页共 12 页 - 3 - 四纯策略贝叶斯-纳什均衡分析假设丈夫肯定采取 F，类型 1 的妻子最佳反应是 F，类型 2 的妻子最佳反应为 O，余下惟一问题是丈夫通过采取 F【针对妻子的（F,O）】是否能够最大化期望效用？容易计算出丈夫选取 F 时期望效用是，选 O 是期望效用为。当3-1 选 F 的效用不低于选 O 的效用时，（F,F,0）将成为一个纯策略纳什均衡。结论 1 当丈夫对妻子是类型 1 的信念时，丈夫选择 F， “妻子们”选择4 （F,O）将成为一个纳什均衡。请你证明如下的结论 2 结论 2 当丈夫对妻子是类型 1 的信念时，丈夫选择 O， “妻子们”选择43 （O,F）将成为一个纳什均衡。结论 3 当时，有 2 个纯策略纳什均衡；时，只有 1 个纯策略纳4 什均衡，时，没有纳什均衡。1 五不完全信息动态博弈举例例 3 【黔驴技穷】柳宗元（ “唐宋八大家 ”之一）唐柳宗元三戒黔之驴： “黔无驴，有好事者船载以入。至则无可用，放之山下。虎见之，庞然大物也。以为神。蔽林间窥之，稍出近之，慭慭然，莫相知。他日，驴一鸣，虎大骇，远遁，以为且噬己也，甚恐。然往来视之，觉无异能者。益习其声。又近出前后，终不敢搏。稍近益狎，荡倚冲冒。驴不胜怒，蹄之。虎因喜，计之曰： “技止此耳！ ”因跳踉大，断其喉，尽其肉，乃去。 ” 这则富有时代特色与战斗精神的寓言故事，被后人广为传诵，并派生出汉语圈中认知率最高的成语之一 “黔驴技穷 ”。上述寓言和成语，有其明确的内涵，表达了积极的理念，用来讽喻貌似强大的东西并不可怕，只要敢于斗争，善于斗争，就一定能战而胜之。如果正确地理解上述寓言和成语的内涵和理念，是无可厚非的，不会产生什么争议、更不会衍生出什么历史公案。但是一些后人，却不求甚解、生搬硬套，不知彼 “黔 ” 非此 “黔 ”。况这则寓言故事的 “领衔主演 ”应该是 “黔之虎 ”，对原文最正确的解读应该是 “黔之驴技穷 ”或 “驴黔技穷 ”！ - 4 - 行省制始于元朝，现在的贵州在元朝分属湖广行省、四川行省和云南行省。基于这一史实 ,现在的贵州在文化传统上，应当归属于湘楚文化圈、巴蜀文化圈和滇文化圈的交叉融合。贵州建省始于明朝洪武年间，当时的管辖范围与现在也略有出入。柳宗元创作黔之驴一文，应该是公元 800 年左右的唐朝中晚期，当时地方行政区划为 “道州县 ” 三级。黔之驴一文所涉及的 “黔中道 ”，包括了湖南西部、重庆东南部、贵州北部和湖北西南部一带地区，治黔州（今重庆市彭水苗族土家族自治县）。请你找出参与人，参与人的类型，策略与行动，并赋予相应的效用。例 4 信号博弈（Signaling game），是一种由一个发送者（S）和另一个接收者（R）所组成的动态博弈。一开始这个发送者有一个给定的类型（t），接着发送者会观察这个没有其他人（好比说接收者）知道的类型，去从讯息堆 M = m1, m2, m3,., mj 中选择送出一个讯息（m），接着接收者会观察这个讯息后从他可行的动作中 A = a1, a2, a3, ak 选一个作为反应动作（ a），这里要注意的是接收者除了讯息之外其他都无法得知（如发送者的类型 t），接着根据（t, m, a）的组合来决定双方会获得的报酬或回报。 1 在经济学中，信息不完全又可等同于信息不对称，几乎所有的信息不完全模型都与信息不对称相关，逆向选择和道德风险就是信息不对称的两种表现形式。信号博弈是研究逆向选择的一个重要模型，最早由斯彭思(spence) 提出并加以讨论，斯彭思也因此获得了 2001 年的诺贝尔经济学奖。博弈论第 - 5 - 页共 12 页 - 5 - 5.2 拍卖一英国式拍卖 English auction 是我们非常熟悉的拍卖类型，竞买者相继出价，且出价是逐步提高的。通常拍卖人会在每次出价之前确定提高的价格，直到有人愿意支付更高的价格为止。假设帕特和昆西在英国式拍卖中竞买一架照相机，他们买照相机自己用，不是要转手卖掉。帕特的估价是 114 美元，他不知道昆西的估价，但猜想是 102 美元或 108 美元。现在昆西出价 100 美元，竞价涨幅为 5 美元，从博弈论的观点出发，帕特应如何出价？图 4-1 照相机拍卖【练习】使用倒推法，找出该博弈的纳什均衡。如果在一个拍卖中两个竞买者理性地出价，即他们依据子博弈完美均衡出价，那么估价高的人总能得到拍卖品，我们称拍卖是有效率的。结论：在英国式拍卖中，只要出价小于你的估价，按最小竞价增幅提高出价，总能得到子博弈完美均衡，这是英国式拍卖最大的优点，且估价高者得到拍卖品，英国式拍卖是有效率的。二第二价格拍卖每个竞争者报一个价格，出价最高的人将得到这一物品，但其所付的价格仅是第二高价。这种类型的拍卖叫做第二价格拍卖（second-price auction）。第二价格拍卖通常以密封拍卖（sealed-bid auction）的方式进行，竞争者不必 - 6 - 出席竞标，所以这种拍卖形式很方便。【例 1】易趣拍卖鲁斯和萨拉竞买一件物品的投标博弈，鲁斯的估价是 100 美元，萨拉的估价是 70 美元。拍卖底价是 50 美元。双方并不知道彼此的估价，即对鲁斯来说，萨拉的估价是未知数。鲁斯认为的概率为，而得x10xp10x 概率为。对于萨拉来说，鲁斯的估价也是未知数，设为。的1p y7 概率为，而的概率为 .q70y1q 鲁斯先出价，她有三种行动可以选择：出价 50 美元，出价 100 美元或等到第三阶段出价。接下来，萨拉出价 70 美元或弃拍。第三阶段，鲁斯可以再次出价，但需要花一点功夫，假设成本为 3 美元。图 4-2 易趣拍卖博弈此处的收益以数学期望的形式表示，萨拉出价被表示成未知数，使用x 倒推法可分析该博弈：博弈论第 - 7 - 页共 12 页 - 7 - 图 4-3 倒推法解易趣博弈因此，鲁斯应出价 100 美元，得到的期望收益，萨拉应出价 70 美元，30p 得到的期望收益。以估价进行出价即可。20q 以上两例都是私有价值拍卖，有时竞拍者是为了中标后拿去转卖，此时价值变为共同价值。三共同价值拍卖【例 2】三个石油开发商以密封价格拍卖形式竞争一片油田的勘探权。称为甲方、乙方和丙方，他们都是风险中性的。而该油田的实际市场价值为 1000 万美元。甲的估价为 70 万，乙的估价为 1100 万，丙的估价为 1200 万。若是第二密封价格拍卖，丙是赢家，但是将损失 100 万，这就是胜利者的灾祸。因此，共同价值物品的拍卖，投标者出价时要综合考虑各种因素，往往不以自己的估价出价。四荷兰式拍卖拍卖历史悠久，种类繁多。英国式拍卖是一种最普通的增价拍卖。而荷兰式拍卖（Duth aucion）则是降价拍卖，直到有人接受该价格并获得拍卖品。五密封拍卖有单轮第一价格，单轮第二价格和多伦拍卖等。荷兰式拍卖与密封第一价格等价，英国式拍卖与两者不同。拍卖的策略和结果不仅取决于拍卖类型，还取决于拍卖环境，即拍卖的收益和拍卖者掌握的信息。 - 8 - 5.3 合作博弈及其应用一合作博弈到目前为止，我们探讨的都是博弈的非合作解。对于博弈问题，最优解不是唯一的，一类是不考虑他人，只需最大化个人收益的非合作解；另一类是以整体收益最优化为目标，参与者相互协调的合作解，整体收益最优是一个含糊的概念。由于可能存在多个整体收益最优的策略组合，博弈问题的合作解也可能有多个。参与者可以协调相互之间的策略选择的博弈叫做合作博弈，得到的解称为合作博弈解。现在的问题是：“如果参与人的策略可以相互协调，怎样选择策略才会带来整体最大收益呢？” 二自行车交易乔伊有一辆自行车但身无分文需要一些钞票，他估计自己的自行车的价值是 80 元。米奇有 100 元但没有自行车，他认为一辆自行车值 100 元。这样就存在着一笔潜在的交易，但是双方都不清楚对方的信誉。可供两人选择的策略是出让或保留，也就是说，乔伊可以把自行车给米奇，也可以不给；而米奇可以用任意数量的人民币交换自行车或者一分不给。下面是米奇愿意出让 90 元交换自行车的情况：表 4-3 乔伊出让保留米出让 110,90 10,170 奇保留 200,0 100,80 若将之看作非合作博弈，（保留，保留）是纳什均衡。但（出让，出让）却可以使双方获得更多的收益，问题是双方互不信任。不过，市场上确实存在能促使双方顺利进行互利交易的机构，这样就可以得到我们所期望的合作博弈解。当乔伊和米奇在第三机构的参与下对交易问题达成一致，他们就结成了博弈论第 - 9 - 页共 12 页 - 9 - 联盟，将协调各自的策略，视（出让，出让）为联盟的统一决策。这种买卖需要强制性的协议，买卖双方的转让支付与协议联系在一起，称为旁支付。前文将自行车价格定为 90 元只是一种情况，其价格仍可适当提高或降低，那么价格定为多少合适呢？图 5-4 阐述了限定条件：图 4-5 合作博弈的解集乔伊和米奇的收益分别用横轴和纵轴表示，两人收益之和最多为 200 元，如直线 AB 所示。不过，并非直线上所有的点都是解。在非合作博弈中，乔伊可得到 80 元，米奇可以得到 100 元。一旦合作博弈时的收益小于这两个值，他们可退出联盟以获得更高的收益。因此，两人的收益必然落在线段 AB 之上。从某种意义来说，线段 AB 上的点都是合作博弈的可行解。冯诺依曼和摩根斯坦称博弈问题的合作博弈解为解集。即允许旁支付的情况下，在保证每个参与人至少获得非合作博弈收益的基础上，使总收益达到最大值的所有合作联盟。三房地产开发杰伊是一个房地产开发商，他希望把两块或者更多的地产聚集到一起联合开发。凯、劳拉和马克各有一块地产，分别以 K、L、 M 表示。杰伊希望这三人能够以某种方式稳定地合并，即结盟。杰伊详细列出了各种联盟形式及相应的收益：表 4-4 房地产联盟的收益联盟收益 1 （KLM） (10) 2 (KL)(M) (6)(4) - 10 - 3 (KM)(L) (4)(4) 4 (LM)(K) (4)(4) 5 (K)(L)(M) (3)(3)(3) 表 5-2 中每一行都代表一种可能的联盟结构，第一行是所有人组成的三人联盟，称为大联盟，第五行是非合作博弈的情形，称为单人联盟。该博弈的解是(KLM) 和(KL)(M) 。在大联盟中，每个人均可退出而获得收益 4，因此每个人的收益应不小于 4。但总收益仅为 10，从而大联盟不稳定。如果凯和劳拉能够通过旁支付调整，第二行的联盟是稳定的，3,3,4 是三人的收益。在第二行，由凯和劳拉、马克组成的联盟结构是稳定的，称为该博弈的核（core ）。四解集与核博弈论创立之初，冯诺依曼和摩根斯坦引用新古典经济学中有效率的概念，认为合作博弈的解必须是有效率的。有效率意味着博弈的所有可能潜力已被挖掘，如果要使某些人变得更好，就不得不损害其他人的利益，经济学上这种资源配置状态称为帕累托最优。许多情况下有效配置不止一种。通常来讲，合作博弈的核包含所有使团体成员不能从联盟重组中获益的分配方案。五应用 1 议会政治：英国、加拿大和德国都是议会制度的代表，在这些国家里，除非得到议会的多数票支持，就不能组阁政府，议会中的部分党派通常结为联盟以获得绝对多数票的支持。假设中欧共和国是一个拥有议会政府的典型国家，该国议会由三个实力强大的党派组成：表 4-5 中欧议会的政党党派投票权立场保守党（CC） 40% 该党派对道德和家庭问题十分保守，经济态度温和，赞成有利于小型工商业和农业的政策社会劳动党(SL) 40% 该党派赞成有利于劳动者的决策，提倡经济系统的中央集权，对道德与家庭态度中立。激进党 (R) 20% 该党派支持市场自由化，限制政府权力，大力提倡博弈论第 - 11 - 页共 12 页 - 11 - 家庭价值观和道德观的解放。中欧议会政府的形成是一个合作博弈的过程，这里假定禁止腐败现象，排除了旁支付的可能：

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论教材2013-3

文档简介

温馨提示

最新文档

评论

博弈论教材2013-3

文档简介

温馨提示

最新文档

评论

相关文档