博弈论教材2013-3_第1页
博弈论教材2013-3_第2页
博弈论教材2013-3_第3页
博弈论教材2013-3_第4页
博弈论教材2013-3_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

例 2 情侣博弈 丈夫(H)和妻子(W)决定周末去看足球(F)还是去剧院(O) 。丈夫不 愿意和妻子分开,但是他对妻子的性格不甚了解,妻子可能喜欢独处,也可 能对丈夫充满深情要在一起。 表 4-2 深情 W 独处 W O F O F O 3,1 0,0 H O 3,0 0,1H F 0,0 1,3 F 0,3 1,0 作为现实生活中的一个情景,考虑委员会选举(比如参议院中的小组委 员会) ;两位委员会成员的投票决定两个对立议案 F 和 O 的命运。规则要求一 致同意;参与人 H 希望通过 F。第一种类型的 W 希望通过 O,第二种类型的 W 希望没有议案得到通过。此外,如果 W 投了 H 喜欢的议案的票,而投票结果 又出现分散现象,她将得到最大的乐趣,因为看上去她很宽容。 三 贝叶斯纳什均衡 潜存于例 2 之下的三个假设: 假设 1:妻子知道自己的最优选择,即她知道“正确的博弈”是左表还 是右表; 假设 2:丈夫不知道她的妻子真正的优先选择,他对他的真实类型附加 了概率 ; 假设 3:妻子知道她的丈夫关于她的优先选择的估计,即她知道 的取 值。 三个假设中最容易引起争议的是最后一个假设,它叫做公公先验假设。 让我们转到均衡分析。在约翰海萨尼于 1967 年和 1968 年所写的三篇论文 中,他提出了适合不完全信息博弈的纳什均衡的推广,他的建议分为两部分: 1 将不完全信息博弈转为不完美信息博弈 一个虚拟参与人(自然)选择妻子的类型(类型 1 深情,类型 2 独处) , 将之告诉妻子但是不告诉丈夫,于是得到了对应的展开型博弈: - 2 - 2 使用这个不完美信息形式的纳什均衡解作为原博弈的解 在不完全信息博弈中,赋予纳什均衡一个专用名词,成为贝叶斯-纳什均 衡。注意到丈夫的纯策略是选择 F 或 O,混合策略是置于 F 的概率的选取, 并且将这个概率表示为 。妻子的策略是成对的。她的第一个分量是类型 1 的妻子的选择,第二个分量是类型 2 的妻子的选择。因此妻子的纯策略是 (F,F),(F,O),(O,F),(O,O) 。而混合策略是( ),其中 是21, 21, 类型 1 妻子和类型 2 妻子将采取 F 的概率。 定义 博弈的贝叶斯-纳什均衡是三个部分 ,其中每个参与),( 21 人及其每种类型将采取最佳反应如下:(1)如果丈夫以概率 采取 F,那么 概率 最大化类型 i 妻子的效用;(2)如果丈夫相信他以概率 遇到类型i 1 的妻子,并且她以概率 采取 F,而已概率 遇到类型 2 的妻子,并且1-1 她以概率 采取 F,那么概率 将使得丈夫的效用最大。2 博弈论第 - 3 - 页 共 12 页 - 3 - 四 纯策略贝叶斯-纳什均衡分析 假设丈夫肯定采取 F,类型 1 的妻子最佳反应是 F,类型 2 的妻子最佳反 应为 O,余下惟一问题是丈夫通过采取 F【针对妻子的(F,O) 】是否能够最大 化期望效用? 容易计算出丈夫选取 F 时期望效用是 ,选 O 是期望效用为 。当3-1 选 F 的效用不低于选 O 的效用时, (F,F,0)将成为一个纯策略纳什均衡。 结论 1 当丈夫对妻子是类型 1 的信念 时,丈夫选择 F, “妻子们”选择4 (F,O)将成为一个纳什均衡。 请你证明如下的结论 2 结论 2 当丈夫对妻子是类型 1 的信念 时,丈夫选择 O, “妻子们”选择43 (O,F)将成为一个纳什均衡。 结论 3 当 时,有 2 个纯策略纳什均衡; 时,只有 1 个纯策略纳4 什均衡, 时,没有纳什均衡。1 五 不完全信息动态博弈举例 例 3 【黔驴技穷】 柳 宗 元 ( “唐 宋 八 大 家 ”之 一 ) 唐 柳 宗 元 三 戒 黔 之 驴 : “黔 无 驴 , 有 好 事 者 船 载 以 入 。 至 则 无 可 用 , 放 之 山 下 。 虎 见 之 , 庞 然 大 物 也 。 以 为 神 。 蔽 林 间 窥 之 , 稍 出 近 之 , 慭 慭 然 , 莫 相 知 。 他 日 , 驴 一 鸣 , 虎 大 骇 , 远 遁 , 以 为 且 噬 己 也 , 甚 恐 。 然 往 来 视 之 , 觉 无 异 能 者 。 益 习 其 声 。 又 近 出 前 后 , 终 不 敢 搏 。 稍 近 益 狎 , 荡 倚 冲 冒 。 驴 不 胜 怒 , 蹄 之 。 虎 因 喜 , 计 之 曰 : “技 止 此 耳 ! ”因 跳 踉 大 , 断 其 喉 , 尽 其 肉 , 乃 去 。 ” 这 则 富 有 时 代 特 色 与 战 斗 精 神 的 寓 言 故 事 , 被 后 人 广 为 传 诵 , 并 派 生 出 汉 语 圈 中 认 知 率 最 高 的 成 语 之 一 “黔 驴 技 穷 ”。 上 述 寓 言 和 成 语 , 有 其 明 确 的 内 涵 , 表 达 了 积 极 的 理 念 , 用 来 讽 喻 貌 似 强 大 的 东 西 并 不 可 怕 , 只 要 敢 于 斗 争 , 善 于 斗 争 , 就 一 定 能 战 而 胜 之 。 如 果 正 确 地 理 解 上 述 寓 言 和 成 语 的 内 涵 和 理 念 , 是 无 可 厚 非 的 , 不 会 产 生 什 么 争 议 、 更 不 会 衍 生 出 什 么 历 史 公 案 。 但 是 一 些 后 人 , 却 不 求 甚 解 、 生 搬 硬 套 , 不 知 彼 “黔 ” 非 此 “黔 ”。 况 这 则 寓 言 故 事 的 “领 衔 主 演 ”应 该 是 “黔 之 虎 ”, 对 原 文 最 正 确 的 解 读 应 该 是 “黔 之 驴 技 穷 ”或 “驴 黔 技 穷 ”! - 4 - 行 省 制 始 于 元 朝 , 现 在 的 贵 州 在 元 朝 分 属 湖 广 行 省 、 四 川 行 省 和 云 南 行 省 。 基 于 这 一 史 实 ,现 在 的 贵 州 在 文 化 传 统 上 , 应 当 归 属 于 湘 楚 文 化 圈 、 巴 蜀 文 化 圈 和 滇 文 化 圈 的 交 叉 融 合 。 贵 州 建 省 始 于 明 朝 洪 武 年 间 , 当 时 的 管 辖 范 围 与 现 在 也 略 有 出 入 。 柳 宗 元 创 作 黔 之 驴 一 文 , 应 该 是 公 元 800 年 左 右 的 唐 朝 中 晚 期 , 当 时 地 方 行 政 区 划 为 “道 州 县 ” 三 级 。 黔 之 驴 一 文 所 涉 及 的 “黔 中 道 ”, 包 括 了 湖 南 西 部 、 重 庆 东 南 部 、 贵 州 北 部 和 湖 北 西 南 部 一 带 地 区 , 治 黔 州 ( 今 重 庆 市 彭 水 苗 族 土 家 族 自 治 县 ) 。 请你找出参与人,参与人的类型,策略与行动,并赋予相应的效用。 例 4 信号博弈(Signaling game) ,是一种由一个发送者(S)和另一个接收 者(R)所组成的动态博弈。一开始这个发送者有一个给定的类型(t) ,接着 发送者会观察这个没有其他人(好比说接收者)知道的类型,去从讯息堆 M = m1, m2, m3,., mj 中选择送出一个讯息(m) ,接着接收者会观察这个讯 息后从他可行的动作中 A = a1, a2, a3, ak 选一个作为反应动作( a) ,这 里要注意的是接收者除了讯息之外其他都无法得知(如发送者的类型 t) ,接 着根据(t, m, a)的组合来决定双方会获得的报酬或回报。 1 在经济学中,信息不完全又可等同于信息不对称,几乎所有的信息不完 全模型都与信息不对称相关,逆向选择和道德风险就是信息不对称的两种表 现形式。信号博弈是研究逆向选择的一个重要模型,最早由斯彭思(spence) 提出并加以讨论,斯彭思也因此获得了 2001 年的诺贝尔经济学奖。 博弈论第 - 5 - 页 共 12 页 - 5 - 5.2 拍卖 一 英国式拍卖 English auction 是我们非常熟悉的拍卖类型,竞买者相继出价,且出价是 逐步提高的。通常拍卖人会在每次出价之前确定提高的价格,直到有人愿意 支付更高的价格为止。 假设帕特和昆西在英国式拍卖中竞买一架照相机,他们买照相机自己用, 不是要转手卖掉。帕特的估价是 114 美元,他不知道昆西的估价,但猜想是 102 美元或 108 美元。 现在昆西出价 100 美元,竞价涨幅为 5 美元,从博弈论的观点出发,帕 特应如何出价? 图 4-1 照相机拍卖 【练习】使用倒推法,找出该博弈的纳什均衡。 如果在一个拍卖中两个竞买者理性地出价,即他们依据子博弈完美均衡 出价,那么估价高的人总能得到拍卖品,我们称拍卖是有效率的。 结论:在英国式拍卖中,只要出价小于你的估价,按最小竞价增幅提高 出价,总能得到子博弈完美均衡,这是英国式拍卖最大的优点,且估价高者 得到拍卖品,英国式拍卖是有效率的。 二 第二价格拍卖 每个竞争者报一个价格,出价最高的人将得到这一物品,但其所付的价 格仅是第二高价。这种类型的拍卖叫做第二价格拍卖(second-price auction) 。 第二价格拍卖通常以密封拍卖(sealed-bid auction)的方式进行,竞争者不必 - 6 - 出席竞标,所以这种拍卖形式很方便。 【例 1】 易趣拍卖 鲁斯和萨拉竞买一件物品的投标博弈,鲁斯的估价是 100 美元,萨拉的 估价是 70 美元。拍卖底价是 50 美元。双方并不知道彼此的估价,即对鲁斯 来说,萨拉的估价是未知数 。鲁斯认为 的概率为 ,而 得x10xp10x 概率为 。对于萨拉来说,鲁斯的估价也是未知数,设为 。 的1p y7 概率为 ,而 的概率为 .q70y1q 鲁斯先出价,她有三种行动可以选择:出价 50 美元,出价 100 美元或等 到第三阶段出价。接下来,萨拉出价 70 美元或弃拍。第三阶段,鲁斯可以再 次出价,但需要花一点功夫,假设成本为 3 美元。 图 4-2 易趣拍卖博弈 此处的收益以数学期望的形式表示,萨拉出价被表示成未知数 ,使用x 倒推法可分析该博弈: 博弈论第 - 7 - 页 共 12 页 - 7 - 图 4-3 倒推法解易趣博弈 因此,鲁斯应出价 100 美元,得到 的期望收益,萨拉应出价 70 美元,30p 得到 的期望收益。以估价进行出价即可。20q 以上两例都是私有价值拍卖,有时竞拍者是为了中标后拿去转卖,此时 价值变为共同价值。 三 共同价值拍卖 【例 2】三个石油开发商以密封价格拍卖形式竞争一片油田的勘探权。 称为甲方、乙方和丙方,他们都是风险中性的。而该油田的实际市场价值为 1000 万美元。甲的估价为 70 万,乙的估价为 1100 万,丙的估价为 1200 万。 若是第二密封价格拍卖,丙是赢家,但是将损失 100 万,这就是胜利者的灾 祸。 因此,共同价值物品的拍卖,投标者出价时要综合考虑各种因素,往往 不以自己的估价出价。 四 荷兰式拍卖 拍卖历史悠久,种类繁多。英国式拍卖是一种最普通的增价拍卖。而荷 兰式拍卖(Duth aucion)则是降价拍卖,直到有人接受该价格并获得拍卖品。 五 密封拍卖 有单轮第一价格,单轮第二价格和多伦拍卖等。荷兰式拍卖与密封第一 价格等价,英国式拍卖与两者不同。拍卖的策略和结果不仅取决于拍卖类型, 还取决于拍卖环境,即拍卖的收益和拍卖者掌握的信息。 - 8 - 5.3 合作博弈及其应用 一 合作博弈 到目前为止,我们探讨的都是博弈的非合作解。对于博弈问题,最优解 不是唯一的,一类是不考虑他人,只需最大化个人收益的非合作解;另一类 是以整体收益最优化为目标,参与者相互协调的合作解,整体收益最优是一 个含糊的概念。由于可能存在多个整体收益最优的策略组合,博弈问题的合 作解也可能有多个。 参与者可以协调相互之间的策略选择的博弈叫做合作博弈,得到的解称 为合作博弈解。现在的问题是:“如果参与人的策略可以相互协调,怎样选择 策略才会带来整体最大收益呢?” 二 自行车交易 乔伊有一辆自行车但身无分文需要一些钞票,他估计自己的自行车的价 值是 80 元。米奇有 100 元但没有自行车,他认为一辆自行车值 100 元。这样 就存在着一笔潜在的交易,但是双方都不清楚对方的信誉。 可供两人选择的策略是出让或保留,也就是说,乔伊可以把自行车给米 奇,也可以不给;而米奇可以用任意数量的人民币交换自行车或者一分不给。 下面是米奇愿意出让 90 元交换自行车的情况: 表 4-3 乔伊 出让 保留 米 出让 110,90 10,170 奇 保留 200,0 100,80 若将之看作非合作博弈, (保留,保留)是纳什均衡。但(出让,出让) 却可以使双方获得更多的收益,问题是双方互不信任。不过,市场上确实存 在能促使双方顺利进行互利交易的机构,这样就可以得到我们所期望的合作 博弈解。 当乔伊和米奇在第三机构的参与下对交易问题达成一致,他们就结成了 博弈论第 - 9 - 页 共 12 页 - 9 - 联盟,将协调各自的策略,视(出让,出让)为联盟的统一决策。 这种买卖需要强制性的协议,买卖双方的转让支付与协议联系在一起, 称为旁支付。前文将自行车价格定为 90 元只是一种情况,其价格仍可适当提 高或降低,那么价格定为多少合适呢?图 5-4 阐述了限定条件: 图 4-5 合作博弈的解集 乔伊和米奇的收益分别用横轴和纵轴表示,两人收益之和最多为 200 元, 如直线 AB 所示。不过,并非直线上所有的点都是解。在非合作博弈中,乔 伊可得到 80 元,米奇可以得到 100 元。一旦合作博弈时的收益小于这两个值, 他们可退出联盟以获得更高的收益。因此,两人的收益必然落在线段 AB 之 上。 从某种意义来说,线段 AB 上的点都是合作博弈的可行解。冯诺依曼和 摩根斯坦称博弈问题的合作博弈解为解集。即允许旁支付的情况下,在保证 每个参与人至少获得非合作博弈收益的基础上,使总收益达到最大值的所有 合作联盟。 三 房地产开发 杰伊是一个房地产开发商,他希望把两块或者更多的地产聚集到一起联 合开发。凯、劳拉和马克各有一块地产,分别以 K、L、 M 表示。杰伊希望这 三人能够以某种方式稳定地合并,即结盟。杰伊详细列出了各种联盟形式及 相应的收益: 表 4-4 房地产联盟的收益 联盟 收益 1 (KLM) (10) 2 (KL)(M) (6)(4) - 10 - 3 (KM)(L) (4)(4) 4 (LM)(K) (4)(4) 5 (K)(L)(M) (3)(3)(3) 表 5-2 中每一行都代表一种可能的联盟结构,第一行是所有人组成的三 人联盟,称为大联盟,第五行是非合作博弈的情形,称为单人联盟。 该博弈的解是(KLM) 和(KL)(M) 。在大联盟中,每个人均可退出而获得收 益 4,因此每个人的收益应不小于 4。但总收益仅为 10,从而大联盟不稳定。 如果凯和劳拉能够通过旁支付调整,第二行的联盟是稳定的,3,3,4 是三人的 收益。在第二行,由凯和劳拉、马克组成的联盟结构是稳定的,称为该博弈 的核(core ) 。 四 解集与核 博弈论创立之初,冯诺依曼和摩根斯坦引用新古典经济学中有效率的概 念,认为合作博弈的解必须是有效率的。有效率意味着博弈的所有可能潜力 已被挖掘,如果要使某些人变得更好,就不得不损害其他人的利益,经济学 上这种资源配置状态称为帕累托最优。 许多情况下有效配置不止一种。通常来讲,合作博弈的核包含所有使团 体成员不能从联盟重组中获益的分配方案。 五 应用 1 议会政治:英国、加拿大和德国都是议会制度的代表,在这些国家里,除 非得到议会的多数票支持,就不能组阁政府,议会中的部分党派通常结为联 盟以获得绝对多数票的支持。假设中欧共和国是一个拥有议会政府的典型国 家,该国议会由三个实力强大的党派组成: 表 4-5 中欧议会的政党 党派 投票权 立场 保守党(CC) 40% 该党派对道德和家庭问题十分保守,经济态度温和, 赞成有利于小型工商业和农业的政策 社会劳动党(SL) 40% 该党派赞成有利于劳动者的决策,提倡经济系统的 中央集权,对道德与家庭态度中立。 激进党 (R) 20% 该党派支持市场自由化,限制政府权力,大力提倡 博弈论第 - 11 - 页 共 12 页 - 11 - 家庭价值观和道德观的解放。 中欧议会政府的形成是一个合作博弈的过程,这里假定禁止腐败现象, 排除了旁支付的可能:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论