博弈论与信息经济学讲义PPT课件.ppt_第1页
博弈论与信息经济学讲义PPT课件.ppt_第2页
博弈论与信息经济学讲义PPT课件.ppt_第3页
博弈论与信息经济学讲义PPT课件.ppt_第4页
博弈论与信息经济学讲义PPT课件.ppt_第5页
已阅读5页,还剩536页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈与社会 导论 个人理性与社会效率 张维迎教授北京大学光华管理学院 1 纳什均衡与一致预期 张维迎教授北京大学光华管理学院 2 博弈的基本概念 1 参与人 players 博弈中决策主体的集合 什么人参与博弈 每个人是什么角色 行动 actions 每个人有些什么样行动可以选择 在什么时候行动 信息 information 在博弈中的知识 每个人知道些什么 包括特征 行动等 战略 strategies 行动计划 每个人有什么战略可供选择 战略的完备性 3 博弈的基本概念 2 支付 payoffs 每个人在不同战略组合下得到些什么 依赖于所有参与人的选择 均衡 equilibrium 所有参与人最优战略的组合 结果 outcomes 我们所感兴趣的东西 4 静态博弈 最简单的博弈 所有参与人同时选择行动 并且只选择一次 同时 是一个信息概念 而不一定与日历上的时间一致 5 囚徒困境 prisoners dilemma 囚徒困境 坦白 不坦白 坦白 不坦白 8 8 0 10 10 0 1 1 无论对方如何选择 每个人的最优选择 坦白 所以 我们可以预测 结果将是 坦白 坦白 6 占优均衡 dominant strategyequilibrium 一般来说 由于每个参与人的效用依赖于所有人的选择 因此每个人的最优选择 战略 也依赖于所有其他人的选择 战略 但在上述例子中 一个人的最优选择并不依赖于他人的选择 这样的最优战略 被称为 占优战略 dominantstrategy 由所有参与人的占优战略构成的战略组合被称为 占优均衡 占优战略均衡的出现只要求所有人都是理性的 但不要求每个参与人知道其他参与人是否理性 囚徒困境博弈有占优均衡 所以其结果很容易预测 7 个人理性与集体理性的冲突 囚徒困境 表明个人理性与集体理性的冲突 这样的例子很多 寡头竞争 军备竞赛 团队生产中的劳动供给 公共产品的供给 等等 许多的制度就是为解决 囚徒困境 而存在的 8 公共产品 publicgoods 提供 不提供 提供 不提供 4 4 1 5 5 1 0 0 无论对方如何选择 每个人的最优选择 不提供 所以 我们可以预测 结果将是 不提供 不提供 9 公共产品与税收制度 比较私人产品与公共产品的不同 使用上排他性 私人产品是志愿购买的 但公共产品可能需要强制购买 税收制度就是保证公共产品的生产 解决公共产品生产上的 囚徒困境 10 囚徒困境 的一般表示 合作 不合作 合作 不合作 T T S R R S P P 满足 R T P S S R T T 11 用法律解决 囚徒困境 合作 不合作 合作 不合作 T T S R X R X S P P 满足 X R T 12 智猪博弈 boxedpigs 有些博弈没有占优均衡 但通过剔除 坏 战略 我们可以预测博弈的结果 如 智猪博弈 按 等待 按 等待 3 1 2 4 7 1 0 0 这个博弈中 大猪的最优选择依赖于小猪的选择 但小猪的最优选择与大猪的选择无关 如果大猪知道小猪的理性的 大猪将选择 按 均衡是 大猪按 小猪等待 劣 战略 无论对方选择什么 如果自己选择A得到的总是收益小于选择B得到的收益 A就是相对于B的劣战略 13 重复剔除占优均衡 重复剔除严格劣战略 iteratedeliminationofstrictlydominatedstrategy 的思路 首先找出博弈参与人的劣战略 dominatedstrategy 假定存在的话 把这个劣战略剔除后 剩下的是一个不包含已剔除劣战略的新的博弈 然后在剔除这个新的博弈中的劣战略 继续这个过程 直到没有劣战略存在 如果剩下的战略组合是唯一的 这个唯一的战略组合就是 重复剔除占优均衡 iterateddominanceequilibrium 如果这样的解存在 我们说该博弈是 重复剔除占优可解的 iterateddominancesolvable 14 理性共识 commonknowledgeofrationality 1 Zero orderCKR 每个人都是理性的 但不知道其他人是否是理性的 2 first orderCKR 每个人是理性的 并且知道其他每个人也都是理性的 但并不知道其他人是否知道自己是理性的 3 second orderCKR 1 2 每个人知道 2 nth orderCKR R b C b R b C b Risrational 15 重复剔除与理性共识 重复剔除不仅要求每个人是理性的 而且要求每个人知道其他人是理性的 每个人知道每个人知道每个人是理性的 如此等等 即理性是 共同知识 共识 C1 C2 C3 R1 R2 R3 10 4 1 5 98 4 9 9 0 3 99 8 1 98 0 100 100 98 这个博弈只要求一阶理性共识就可以预测均衡结果 如果把 下 左 的第一个数字改为11呢 16 最优选择 这个博弈只要求一阶理性共识就可以预测均衡结果 如果R相信C是理性的 R就知道C不会选择C3 所以R的最优选择是R1 如果C相信R是理性的 C就知道R不会选择R2 所以C的最优选择是C2 但要C预期R不会选择R3 需要二阶理性共识 要R不预期C会选择C1 需要三阶理性共识 17 R排除C选择C1 RbelievesCbelievesRbelievesCisrational C1 C2 R1 C2 18 好事变坏事 在单人决策中 个人给定选择在所有情况下的收益都增加 一个人的状况不会变得更坏 但博弈中则不同 上 下 左 右 上 下 左 右 1 3 2 1 0 2 3 4 1 3 4 1 0 2 3 4 19 选择越多 对理性共识的要求越高 R1 R2 R3 R4 C1 C2 C3 C4 5 10 0 11 1 20 10 10 4 0 1 1 2 0 20 0 3 2 0 4 4 3 50 1 2 93 0 92 0 91 100 90 20 1 Zero orderCKR CnotchooseC4forCisrational 2 1st orderCKR RnotchooseR4forR b C 3 2nd orderCKR CnotchooseC1forC b R b C 4 3rd orderCKR RnotchooseR1forR b C b R b C 5 4th orderCKR CnotchooseC3forC b R b C b R b C 6 5th orderCKR RnotchooseR3forR b C b R b C b R b Cso R2 C2 isanequilibrium 21 不能用重复剔除解的博弈 许多博弈没有占优均衡 也没有重复剔除的占优均衡 考虑如下博弈 C1 C2 C3 R1 R2 R3 0 4 4 0 5 3 4 0 0 4 5 3 3 5 3 5 6 6 22 可理性化的选择 Rationalizablestrategy 不能被重复剔除的战略 或者说 可以被合理的信念 belief 所支持的行为 例如 R理性化选择R1 如果R b C选择C2 如果R b C b R会选择R2 如果R b C b R b C会选择C1 如果R b C b R b C b R会选择R1 23 Consistentlyalignedbeliefs CAB 考虑 R3 C3 对方不会犯预期错误 R选择R3 如果他认为C会选择C3 C会选择C3 如果他认为R会选择R3 CAB 每个人对别人行为的预期 信念 是正确的 Harsanyidoctrine 如果两个理性的人具有相同的信息 他们一定会得出相同的推断和相同的结论 RobertAumann rationalagentscannotagreetodisagree 24 纳什均衡与一致预期 纳什均衡 所有参与人的最优战略的组合 给定该战略中别人的选择 没有人有积极性改变自己的选择 一致预期 基于信念的选择是合理的 支持选择的信念是正确的 预期的自我实现 如何所有人认为这个结果会出现 这个结果就会出现 预期是自我实现的 预期不会错误 如果你认为我预期你将选择X 你就真的会选择X 25 哲学思考 如果参与人事前达成一个协议 在不存在外部强制的情况下 每个人都有积极性遵守这个协议 这个协议就是纳什均衡 26 寻找纳什均衡 C1 C2 C3 R1 R2 R3 100 100 0 0 50 101 50 0 1 1 60 0 0 300 0 0 200 200 27 纳什均衡 举例 广告博弈纳什均衡 做广告 做广告 企业1 企业2 28 利用纳什均衡寻租 考虑股票市场融资的例子 设想企业价值是100 现在发行的流通股为100股 每股价值1元 现在假定经理想筹集100元 投资价值只有50元 有人买新股吗 假定每一股配4股 价格为0 25元 如果股东不接受配股 原来一股1元的价值就变成0 3元 150 500 如果接受配股 他持有的股票的价值是1 5元 因为配股的成本是1元 所以他的最优选择是接受配股 29 所有权配置与等级结构 考虑团队生产 让其中的一个人变成所有者 工作 偷懒 工作 偷懒 6 6 2 2 0 8 8 0 30 纳什均衡与学习过程 R2 R1 NE q1 q2 31 双寡头竞争 Cournot博弈 两个企业同时选择产量 价格由市场决定 假定需求函数为其中为企业1的产量 为企业2的产量假定成本函数为 那么 利润函数为 32 双寡头竞争 续 企业最大化利润的一阶条件为 纳什均衡产量 纳什均衡利润为 33 垄断产量和垄断利润 垄断企业的目标函数 垄断产量 垄断利润 34 划拳博弈 老虎 鸡 虫 杠子 老虎 鸡 虫 杠子 0 0 1 1 0 0 1 1 1 1 0 0 1 1 0 0 0 0 1 1 0 0 1 1 1 1 0 0 1 1 0 0 35 混合战略纳什均衡 有些博弈没有 纯战略 纳什均衡 但有混合战略纳什均衡 如监督博弈 监督 不监督 偷懒 不偷懒 1 1 1 2 2 3 2 2 给定工人偷懒 老板的最优选择是监督 给定老板监督 工人的最优选择是不偷懒 给定工人不偷懒 老板的最优选择是不监督 给定老板不监督 工人的最优选择是偷懒 如此循环 36 纳什均衡的存在性问题 每一个有限博弈至少存在一个纳什均衡 纯战略或混合战略 如果一个博弈存在两个纯战略纳什均衡 那么 一定存在第三个混合战略纳什均衡 37 风险与均衡 由于纳什均衡要求理性共识和一致预期 当人们可能犯小小的错误时 纳什均衡不一定被选择 如下面这个博弈中 多数人将选择 下 而不是 上 上 下 左 右 8 10 1000 9 7 6 6 5 只要B有千分之一的概念错误地选择右 A将选择下 如果B怀疑A怀疑自己可能犯错误 B将选择右 所以 出现的不是纳什均衡 38 有问题的纳什均衡 C1 C2 C3 R1 R2 R3 2 2 3 1 0 2 1 3 2 2 3 2 2 0 2 3 2 2 39 第三章多重均衡与制度和文化 张维迎北京大学光华管理学院 40 实验 选数博弈 规则 有两个人 1 10十个数字 每个人可以选择其中的任意五个 如果两个人的选择没有重复 每人得到50元 否则 各为0 41 多重纳什均衡 产品标准 许多博弈可能有多个纳什均衡 3 5 5 5 3 5 5 5 8 8 3 2 2 3 6 6 这个博弈被称为 协调博弈 有两个纯战略纳什均衡 一个混合战略均衡 哪一个将出现呢 42 交通博弈 靠左行 靠右行 靠左行 靠右行 1 1 1 1 1 1 1 1 43 约会博弈 芭蕾舞 足球场 芭蕾舞 足球场 1 2 0 0 0 0 2 1 44 进门博弈 先进 后进 先进 后进 1 1 1 1 2 1 1 2 45 分蛋糕博弈 x1 x2 1 1 任何满足x1 x2 1的点都是纳什均衡 46 资源争夺博弈 chicken Hawk Dove Hawk Dove 1 1 5 5 10 0 0 10 47 如何协调 仅仅 理性 是不够的 FOCALPOINT PROMINENCE Schelling 1960 帕累托最优均衡 可以通过协商选择一个纳什均衡 cheaptalking 文化与制度行业组织 48 帕累托最优均衡 3 5 5 5 3 5 5 5 8 8 3 2 2 3 6 6 3 5 3 5 帕累托优于 5 5 5 5 Cheaptalk可以帮助协调到一个帕累托最优均衡 49 为什么要相信 C1 C2 R1 R2 9 9 0 8 8 0 7 7 不论C选择什么 他都有积极性告诉R他将选择C1 所以没有理由认为R应该相信C的话 R C 50 锁定效应与路径依赖 如果博弈参与人很多 达成协议的成本很高 最初的非帕累托均衡可以被锁定 lock in 导致路径依赖 pathdependence 每个人多偏好于新产品 或标准 如果其他人都选择新产品的话 但由于每个人都预期其他人不会选择新产品 所以每个人的最优选择是不转向新产品 结果是整个社会被锁定在现有的产品 标准 非帕累托最优 这常被用来作为市场失灵的理论证据 经验证据 QWERTvsDvorak键盘 BetavsVHS录象机 MAC与IBM计算机软件 但最新的研究似乎正在推翻这些广泛流行的结论 51 键盘的寓言 1868年ChristopherL Stoles发明QWERT键盘 由Remington公司生产 1936年Dvorak发明简化键盘 DSK DvorakSimplifiedKeyboard 认为这一键盘通过平衡双手和更有力的手指之间的工作量 极大地减少了打字产生的手指运动 其优势在于提高速度 减少疲劳 以及更容易的学习 为什么没有被采用 最初的打字员不选择学习Dvorak 因为Dvorak机器很难找到 办公室不原配置Dvorak 因为找不到打字员 但这些说服并不成立 1 支持Dvorak更好的论点证据不足 许多是猜测 2 人体过程学方面的研究发现 它没有任何在科学上可靠 重要的优势 3 打字机市场上的竞争要比通常报告的要激烈的多 4 其他许多比赛证明其他键盘的优越性 52 VHS与Betamax Sony公司1975年开始销售Betamax 并把一再把该技术提供给松下 JVC 1976年4月三家公司最终同意召开一次会议来比较Betamax VHS和VX 但由于JVC的侵权 SONY和松下 JVC分道扬镳 SONY相信 小 松下相信 长 SONY吸引东芝和三洋支持Beta 松下则把日立 夏普和三菱拉入阵营 一种制式的任何改进都伴随着另一阵营的相同改进 一方降价 另一方也跟进 两中制式在几乎所有方面都被证明是完全相同的 除了一方面 VHS播放时间更长 Beta两小时 VHS4小时 Beta5小时 VHS8小时 市场在播放时间和磁带压缩之间的投票是决定性的 1979年前 VHS在美国的销售是Beta的三倍 1983年前 Beta的在世界市场份额的份额下降到12 1984年 只有SONY在生产Beta 53 MAC与IBM 据称 Macitosh要比命令行DOS好得多 甚至比基于DOS的Windows好 但为什么消亡了 通常的解释 DOS成功了是因为它成功了 有更多的软件 更多的用户 事实是 1 成本优势 2 速度优势 3 商业环境中 一台机器只用于一种软件 一旦操作员学会 Macitosh的界面优势就没有了 4 为DOS写软件要容易的多 StanLiebowitz andStephenMargolis TheFableoftheKeys JLE 1990 Beta MacitoshandotherFabulousTales 1999 Winner LosersandMicrosoft 54 大学改革 教师招聘 只留本校生 不留本校生 只留本校生 不留本校生 2 2 2 0 0 2 10 10 55 交通博弈与交通规则 靠左行 靠右行 靠左行 靠右行 1 1 1 1 1 1 1 1 56 法律和社会规范如何协调预期 法律和社会规范就是这种协调预期的规则 帮助人们在多个纳什均衡中筛选一个特定的纳什均衡 社会规范是通过习惯 长期的交互博弈产生的行为规则 法律是立法机关制定的行为规则 但不论是法律还是社会规范 它们的功能都是协调预期 57 交通规则的演变 在多个纳什均衡之间不存在优劣之分时 偶然事件对选择具有重要意义 从历史上来考察 许多交通规则一开始并不体现为法律 而是长期演化而来的 在欧洲大陆的早期 道路行走规范是非常地方化的 有些地方采用靠左走的习惯 有些地方采用靠右走的习惯 是不统一的 只是随着道路的增加和地区间交往的扩大 地方性的习惯才逐步演变为区域性的规范 然后有演变为全国性的规范 但直到 世纪前 道路规则也仅仅是作为规范而得到遵守 而不是作为交通法律而得到执行 现在欧洲大陆的靠右走的规则是在法国兴起的 58 交通规则的演变 在法国大革命以前 贵族的马车习惯上是靠左行的 穷人在路上看到富人的马车来了 要站在马路的右边 因此 靠左行与 特权阶级 相联系 而靠右行被认为更为 民主 随着法国大革命 作为一个革命的象征 规定所有的车都要靠右走 随着拿破仑对欧洲大陆的征服 拿破仑将法国的规则带给了欧洲 也包括靠右行驶的规则 当然 在地域上这个规则的转变也是从西到东逐步完成的 比如说 与靠右行的西班牙接壤的葡萄牙是在一战之后才转为靠右行 奥地利是从西到东一个省一个省逐步转变的 匈牙利 捷克和德国是在二战前才由左行转向右行的 瑞典 一直到1967年 才通过法律宣布从靠左行改为靠右行 59 文化的冲突与协调 为什么欧洲大陆的交通规则收敛于一致 英国将如何办 文化冲突 无论是组织和组织之间的 还是国家和国家之间的 大部分不过是游戏规则 社会规范和法律的冲突 用博弈论的话来说 是一个均衡的选择问题 全球化意味着资源的重新分配 60 解决规则冲突的三个方式 一是一个规则取代其他的规则 让一部分人改变行为规范适应另一部分人 也就是所谓的 接轨 如前面讲的欧洲大陆交通规则的演变所显示的 二是建立全新的规则 如中国人和德国人在一起交流时都用英语 而不是中文 也不是德文 三是建立协调规则的规则 如 入乡随俗 客随主便 究竟哪一种 与规则要解决的问题有关 也与其他因素有关 61 一致与冲突 先走 后走 先走 后走 1 1 2 1 1 2 1 1 进门博弈 62 文化既解决冲突又协调预期 尊老爱幼 妇幼保护 遵师重教 先来后到 社会分层与非对称权力 排位问题 黑社会组织 公平观念 如分蛋糕博弈 抓阄 63 分蛋糕问题与公平观念 x1 x2 0 5 0 5 64 信息与身份 identity 信息对预期的协调很重要 如果不知道谁是谁 协调就很困难 身份是传递信息的重要工具 身份的外在化 服饰 车座 秘书 学界的官本位问题 65 资源争夺博弈 chicken Hawk Dove Hawk Dove 1 1 5 5 10 0 0 10 66 产权的先占规则 人们为什么遵守这个规则 人们希望得到别人认可的愿望 一旦规则建立 每个人都预期其他人会遵守规则 给定这个预期 每个人发现遵守规则是自己的利益所在 也希望别人能遵守这个规则 任何不守规则的行为都会使守规则的人受到损害或者感到威胁 从而引起后者的愤怒 任何其他人也因此会觉得自己未来的利益受到威胁 对此种行为表示不满 对受害人表示同情 少数人不守规则并不会导致规则的消失 但如果规则总是偏向于某一组特定的人群 受到不公正对待的人并不会蔑视不守规则的人 规则就容易被违反 罗尔斯 Rawls 的正义论 67 关于论资排辈问题 容易被个人操纵的信息是没有价值的 当缺乏其他有效的信息时 资历可以成为协调博弈的信息 孙丕扬于万历22年 1595年 出任吏部尚书 创建了 掣签法 官员们无论贤愚清浊 一律抽签上岗 吴思 潜规则 68 为什么制度要有稳定性 制度是为了稳定预期 频繁的变化会打乱人们的预期 希思罗机场的MeetingPoint 69 第四章动态博弈与承诺 张维迎北京大学光华管理学院 70 动态博弈 行动有先后顺序 不同的参与人在不同时点行动 先行动者的选择影响后行动者的选择空间 后行动者可以观察到先行动者做了什么选择 因此 为了做出最优的行动选择 每个参与人都必须这样思考问题 如果我如此选择 对方将如何应对 如果我是他 我将会如何行动 给定他的应对 什么是我的最优选择 如下棋 71 博弈树 gametree A B B 进入 不进入 进入 不进入 进入 不进入 1 1 1 0 0 1 0 0 72 动态博弈中的战略 战略是一个完备的行动计划 在博弈开始之前就规定出每一个决策点上的选择 即使这个决策点实际上不会出现 考虑老师与学生之间考试之后的一个博弈 老师先行动 判分 学生后行动 在不同分数下如何应对 假定学生的实际成绩是不及格 73 战略表式下的纳什均衡 及格 不及格 老师 学生 A F F A A A F F 1 1 10 10 1 1 10 10 10 10 1 1 1 1 10 10 74 三个纳什均衡 及格 A F 不及格 F A 不及格 A A 问题 哪一个会出现呢 75 不可置信的威胁 noncrediblethreat 在 及格 A F 和 不及格 F A 中 学生 报复 F 的威胁是不可信的 无论老师判 及格 还是 不及格 报复 不是学生的最优选择 事前 exante 和事后 expost 一种战略所规定的行动在事前看来是最优的 但事后看并不是当事人的最优选择 这种行动就不可置信 该战略就不是一个合理的战略 76 精炼纳什均衡 perfectNE 不包含不可置信的行动的战略所组成的纳什均衡被称为 精炼纳什均衡 也就是说 不论过去发生了什么 构成精炼纳什均衡的战略 其所规定的行动在每一个决策点上都是最优的 所以 又称为 序惯均衡 sequentialequilibrium 首先必须是 纳什均衡 但并非所有纳什均衡都是合理的 只有其战略不包含不可置信行动的纳什均衡才是合理的 77 子博弈 subgame 由原博弈中某个决策点 信息集 开始的部分构成一个子博弈 1 2 3 2 3 原博弈 子博弈I 子博弈II 78 子博弈精炼纳什均衡 精炼纳什均衡 1 在原博弈是一个纳什均衡 2 在每一个子博弈上都是纳什均衡 考试博弈 及格 A F 在第二个子博弈上不构成纳什均衡 不及格 F A 在第一个子博弈不构成纳什均衡 不及格 A A 在所有子博弈上都构成纳什均衡 79 老师 学生 学生 及格 不及格 报复 接受 报复 接受 10 10 1 1 10 10 1 1 考试博弈 80 逆向归纳法 backwardinduction 在有限博弈中 我们可以用逆向归纳法求解精炼纳什均衡 从最后一个决策点开始 找出该子博弈的纳什均衡 然后再倒回到倒数第二个决策点 找出决策者的最优决策 假定最后一个决策者的决策是最有的 如此一直到初始决策点 所有子博弈上的最优选择就是精炼纳什均衡 又称 rollback 81 举例 1 2 1 2 0 5 0 4 2 1 1 U D R L U D 82 均衡路径与非均衡路径 精炼纳什均衡下所经过的决策点和最优选择构成的路径 称为均衡路径 equilibriumpath 其他的路径是非均衡路径 off equilibriumpath 均衡结果依赖于非均衡路径上的选择 1只所以一开始就选择U 是因为他预期如果选择D的话 2将选择L 而2只所以选择L 是因为她预期如果选择R的话 1将选择U 83 精炼均衡与理性共识 逆向归纳的过程实际上就是重复剔除劣战略的过程 其前提是博弈规则和理性共识 每个人是理性的 每个人知道每个人是理性的 如此等等 因此 精炼纳什均衡的合理性取决于理性共识的合理性 后面再讨论 84 先动优势与后动优势 在动态博弈中 行动总有先后顺序 有些博弈具有先动优势 first moveradvantage 但有些博弈具有后动优势 second moveradvantage 让产量竞争具有先动优势 而价格竞争可能是后动优势 开会发言 在不完全信息下 顺序更重要 但有些博弈既没有先动优势 也没有后动优势 如抓阄 85 练习 数30博弈 数30游戏 两个人 交替选择数字 每次只能选择一个或两个数字 每次可以选择1 3个数字呢 86 不可置信威胁 精炼纳什均衡剔除了不可置信的威胁 使得我们可以更合理地对博弈中参与人行为的预测 不可置信威胁的根源是事前最优与事后最优不同 导致许多帕累托效率无法实现 劫机事件为什么会发生 管教孩子为什么困难 家族企业为什么难以实行制度化管理 大企业为什么效率低 TBTF 研究学录取中的问题 87 承诺 承诺是将不可置信的威胁变成可置信的威胁的行动 威胁不仅是事前最优的 也是事后最优的 承诺意味着限制自己的自由 选择少反而对自己好 如 破釜沉舟 的故事 围城战略 88 举例 如果1承诺不选择U 1 2 1 2 0 5 0 4 2 1 1 U D R L U D 89 承诺举例 婚姻中的承诺 彩礼 昂贵的婚礼可以理解为一种对婚姻的承诺 订金 抵押物做为对交易的承诺 安营扎寨 固定资产投资可以作为承诺 所有权的承诺作用 90 最惠条款 生产耐用品的企业经常被 降价预期 所困扰 如果消费者预期企业将降价 他们将会等待 结果 企业只能降价 如汽车行业面临的问题 最惠条款可以起到承诺的作用 企业不会降价了 91 例子 产量 价格 收入 1 2 3 4 100 80 40 30 100 160 120 120 假定企业一开始定价80 如果前两个消费者购买了 企业将有积极性在50的价格下向第三个顾客出售 预期到这一点 前两个顾客将不会购买 如果企业向保证 任何降价的差额将返还顾客 前两个顾客将会购买 因为企业事实上不会降价了 92 大学改革 不升即走 up or out 没有这样的制度 人才就可能得不到公正评价 不升即走 是大学对教员的承诺 不会压制优秀人才 93 Up or out博弈 教员 学校 学校 努力 不努力 提升 不提升 提升 不提升 4 4 1 7 3 3 2 4 4 4 x 0 3 3 y 0 老制度 新制度 94 画家和政府的苦恼 名画的价值取决于数量 画家常为无法承诺而苦恼 谁相信他不会再画呢 这可能是为什么死了画家的画最值钱 政府也有类似的问题 政府经常缺乏承诺 给定投资者进入的情况下 多征税是最优的 但投资者预期到这一点 将不愿意进入 中国许多地方支付有严重的机会主义行为 坦白从宽 抗拒从严 面临的问题也如此 95 作为承诺的法律 法律改变事后的选择空间或选择成本 所以可以起到承诺的作用 合同的承诺作用 违约的成本增加 使得遵守合同更可能是事后最优的选择 刑法 为什么不能商量 为什么对严重犯罪要执行死刑 台湾问题 立法还是政府随机应变 法治 ruleoflaw 是政府的承诺 96 有限政府 limitedgovernment 市场要求有限政府 政府不仅要保护个人的基本权利不受其他人的侵犯 而且要把尊重这些权利作为对政府行为的限制 如果政府的自由裁量权过大 政府官员为所欲为 政府本身会受到损害 这里的关键是 老百姓与政府之间的博弈 97 光荣革命与英国政府的财政 年份总收入总支出总国债1668 16881 92 12 016954 16 28 416973 37 916 717206 35 654 0177011 410 5130 6178012 522 6167 2179017 016 8244 0 98 99 主权债模型 L D G L L H R P a P a 100 政府的举债能力 假定政府借D的债务 利息率是r 贷款人对政府所能实施的最大可信惩罚是P 那么 如果D 1 r P a 政府将还钱 否则政府将不还钱 所以政府的举债能力为D P a 1 r 英国光荣革命通过制度变迁 改变a 提高了国王违约时面临的最大可能惩罚P a 101 英国光荣革命 光荣革命前 国王可以随意单方面修改借款条款 拖延甚至拒绝支付 利用外国商人瓦解债权人之间的联盟 所以债权人不愿意向政府贷款 光荣革命后 决定国债的权力在议会 议会主要由潜在债权人组成 可以推翻国王 BANKOFENGLAND统一协调债权的行动 通过优先权的规定限制了政府 离间 债权人的可能 因为对违约的惩罚变大了 政府举债的能力提高了 102 逆向归纳的问题 A B B D U D U D U 2 1 1 2 4 1 3 4 6 3 A D U 103 CounterfactualProblem 犯错误的可能 tremblinghand 参与人是非理性的 automationassumption 假装非理性 理性非共识 104 人们为什么会受骗 如房地产 政治运动 105 Theultimatumgame 两人之间分配一笔钱 其中一个人提出方案 另一个人可以接受 也可以拒绝 如果接受 每人得到方案规定的份额 如果拒绝 没有人得到任何东西 什么是这个博弈的精练纳什均衡 实验结果 106 1 同班同学 107 2 北京大学同学 108 3 陌生人 109 第5章讨价还价与耐心 张维迎教授北京大学光华管理学院 110 Bargaining问题的普遍性 几乎所有的交易都涉及讨价还价 买卖双方之间 雇员与顾主之间 合伙人之间 竞争企业之间夫妻之间 政治领域之间 中央政府与地方政府 国家之间 111 所有讨价还价的共同之处 达成某种协议是当事人的共同利益 但他们之间在究竟达成哪一个协议的问题上存在利益冲突 协议的多重行可能阻止任何协议的出现 典型的 合作与竞争 问题 合作意味着存在着帕累托改进 但不同的当事人偏好不同的帕累托状态 不同与集体选择 唯一均衡 和其他多重均衡 不是零和博弈 112 课堂实验 两个同学谈判分100元 如果双方能达成协议 根据协议分配 如果达不成协议 按下面的方案分配 0 0 0 10 10 30 10 40 20 2030 60 113 两种思路 合作博弈思路 cooperativegameapproach 参与人联合作出决定 协议对双方具有约束力 强调的是集体理性 非合作博弈思路 non cooperativeapproach 每个参与人独立决策 协议是一个纳什均衡 没有约束力 强调的是个人理性 注意 这里 合作 与 非合作 指的是 联合决策 jointaction 和 独立决策 separateaction 114 纳什合作解 考虑一个画家与拍卖商之间的讨价还价问题 如果画家自己出售画 可得1000元 如果拍卖商干其他事情 如拍卖别人的画 收入是500元 如果画家委托拍卖商出售画 画的价格是3000元 他们之间如何分配这3000元 请同学们给出建议 115 问题的一般化 设想两个人 A和B 之间要就总价值等于V的分配问题讨价还价 如果他们之间能达成协议 V按照协议规定分配 如果不能达成协议 A得到a B得到b a b 被称 威胁点 或非合作状态 statusquo 是不能达成协议是的最好选择 a b V S V a b是合作带来的剩余 surplus 116 分配规则 我们用x表示A得到的价值 y表示B得到的价值 假定A和B分别从剩余价值S中达到h和k的份额 那么 x a h V a b x a h V a b y b k V a b y b k V a b 117 图示 V V a b P 118 关于可分配总价值的说明 一般来说 总价值V并不是一个固定数 可能与分配方案有关 在存在激励问题和边际效用递减的时候尤其如此 可行边界 119 纳什解 纳什证明 如果满足以下原则 1 Paretoefficiency 2 Invarianceoflineartransformation 3 independenceofirrelevantalternatives那么 讨价还价的唯一结果是最大化如下函数的解 120 纳什福利函数 121 纳什解图示 P a b N W1 W2 W3 122 关于三个原则的解释 Paretoefficiency 最后达成的协议应该是帕累托最优的 也就是说 不应该有没有被分配的剩余 现实并不总是如此 为什么 Invarianceoflineartransformation 期望效用函数的假设 不改变个人风险决策 independenceofirrelevantalternatives 如果原来可行的选择没有被选择 去掉这些 无关 选择并不会影响讨价还价的结果 123 图示 1 协议一定在边界上 2 效用度量单位的改变不会影响最后的协议 3 去掉没有被选择的部分也不会影响最后的协议 124 纳什福利函数的解释 a b 对最后的分配具有决定性的意义 可以理解为 谈判砝码 bargainingpower h和k 是剩余价值的分配比例 又可以理解为谈判力 bargainingstrength 可能与个人的耐心有关 或与个人的边际贡献 可替代性 有关 纳什 如果两个人是对称的 即可分配价值以过 a b 点的45度线对称 h k 1 2 125 个人边际贡献的解释 在两人的情况下 每个人的边际贡献都是都是V a b 所以每人得到1 2的总剩余 现在假定有C与B竞争 如果A与C合作同A与B合作创造的总价值一样 B和C每个人的边际贡献都是零 A将得到全部剩余价值V 如果A与C合作的总价值是2V 那么 A的边际贡献是2V a c C的边际贡献是2V a c V 那么 A得到的份额将是 2V a c 3V 2a 2c 接近2 3 市场上 谈判力是边际贡献决定的 不是技术上的重要性决定的 物以稀为贵 联盟的意义 如工会组织 欧盟 126 改变谈判砝码 谈判砝码对达成什么样的分配协议具有决定性的意义 如果双方预期分配是纳什解 他们可以通过在谈判前的阶段以非合作博弈的方式改变 a b 从而在第二阶段谈判时的相对优势 我们可以将第一阶段模型为非合作博弈 每个人独立的选择最优的a或b 127 图示 P P1 P2 P3 N N 128 砝码的相对性 决定结果的是相对砝码 b a 如果A的砝码a不变 B增加自己的砝码b就可以使得自己在谈判中占优势 非合作博弈意味着 每一方独立增加砝码可能是一个 囚徒困境 博弈 如果砝码比例增加 谈判结果不会改变 但如果改变砝码的成本不同 谈判砝码不可能同比例改变 129 举例 抗战后国共两党边谈判 边打仗 海峡两案军备 WTO谈判 中美贸易冲突 劳资谈判 130 举例 合资企业之间的谈判 WTO前后的变化 学生毕业时找工作有多少个OFFERS 人才流动与工资差别 所有权安排决定谈判砝码 企业所有权理论 131 非合作博弈思路 谈判实际上是一个讨价还价的过程 一个动态博弈 用非合作博弈的方法更合理 132 轮流出价谈判 基本特征 两人 A和B 分一块钱 A先出价 B决定接受还是拒绝 如果接受 按照A提出的方案分配 谈判结束 如果B拒绝 B提出方案 A决定接受还是拒绝 如果接受 按B的方案分配 谈判结束 如果不接受 再由A提出方案 如此等等 博弈有无穷多个纳什均衡 但精炼纳什均衡可能是唯一的 133 决定结果的关键因素 谁先出价 谈判有无最后时限 谁最有耐心 时间偏好 谈判的固定成本多大 134 变量说明 我们先考虑没有固定谈判成本的情况 假定x A得到的份额 y B得到的份额 x y 1s A的贴现率 a 1 1 s A的贴现因子 r B的贴现率 b 1 1 r A的贴现因子 135 有限期谈判 如果只有一次谈判 逆向归纳意味着精炼纳什均衡是 x 1 y 0 如果允许谈判两次 精炼纳什均衡是 x 1 b y b 如果贴现率不很大 就有后动优势 如果谈判三次 PNE是 x 1 b 1 a y b 1 a 如果谈判四次 PNE是 x 1 b 1 a 1 b y b 1 a 1 b 136 一般结论 如果两人的贴现率都不是很高 也就是对未来有足够的耐心 谈判有 后动优势 last moveradvantage 在奇数次谈判 先动和后动是一个人 但这个优势随允许谈判次数的增加而递减 无论如何 一个人对未来越没有耐心 得到的越少 137 无限次谈判 没有最后一次 我们不能用逆向归纳法求解 但可以使用类似的思路得到均衡解 x y 假定在时间t 3时 A出价 得到x 时间t 1时 B出价 给A为ax就可以了 B给得到y 1 ax 时间t 2时 A出价 给B为b 1 ax 就可以了 自己得到x 1 b 1 ax 138 精炼纳什均衡解 139 基本结论 无限次谈判具有 先动优势 first moveradvantage 一个人的耐心越大 贴现率越小 谈判中的优势就越大 140 如果B先出价 141 用贴现率表示 142 重新解释纳什谈判解 纳什谈判解中的谈判力 h k 是由谈判者的耐心决定的 越有耐心的人 得到的份额越大 143 对称性 纳什的对称性假设可以理解为 如果我们假定两人的耐心是一样的 s r 那么 纳什解决定的剩余价值的分配比例就相同 h k 纳什福利函数就是剩余之积 x a y b 在应用研究中 我们一般假定剩余价值是平均分配的 平均主义 有了博弈论基础 如果两个人的耐心相同 机会成本相同 生产率相同 平均分配就是一个均衡 否则 就不会平均分配 144 固定谈判成本 谈判的另一类成本是固定成本 如劳资谈判拖延的话 企业可能要为客户支付违约金 这类似于蛋糕随时间而变小 145 举例 设想蛋糕以每次1 4的量缩小 到第5期是 蛋糕已没有任何价值 第4期等于0 25 第3期是0 50 第2期是0 75 第1期是1 那么 在第4期 B出价 将把整个蛋糕留给自己 价值 0 25 在第3期 A出价 自己可以得到一半的蛋糕 价值 0 25 在第2期 B出价 自己可以得到2 3 价值 0 5 第1期 A出价 可以得到一半 价值 0 5 PNE 每人1 2 146 一般情形 假定初始价值V蛋糕以x1 x2 x3 x4 x5 x6 x7 x8 x9 x10的速度变为零 PNE A得到x1 x3 x5 x7 x9B得到x2 x4 x6 x7 x10 147 谈判成本不同 如果A每次谈判成本是c B每次的谈判成本是d 如果c d 结果是不确定的 如果cd A得到d B得到1 d 148 外部机会成本 固定成本的一种特殊形式是外部机会损失 如果谈判期间 外部机会就不能利用 此时 外部机会损失越大 对谈判越不利 考虑夫妻离婚谈判 149 问题 在前面的讨论中 尽管谈判允许多次 但均衡情况下 双方一开始就达成协议 之后的谈判路径都是非均衡路径 现实中 情况并不如此 通常 谈判总要进行多个回合 如果中国加入WTO是谈判 进行了10几年 为什么 150 信息与谈判 原因是 我们前面假定当事人具有完全信息 知道价值V和每个人的机会成本或谈判砝码 每个人的耐心 谈判的时限等等 并且 每个人知道每个人知道 每个人知道每个人知道每个人知道 如此等等 但在现实中 谈判面临的最大问题是信息不完全 价值V 生产成本 谈判砝码 a b 耐心 机会成本 151 谈判与信息 谈判的过程实际上是信息揭示和窥探的过程 ScreeningandSignaling 沈阳的砍价公司 由于信息不对称 谈判的结果并不总是帕累托最优的 事实上 许多帕累托改进没有被利用 152 谈判中的社会规范 Norm freebargainingandnorm constrainedbargaining Procedurenormsandsubstancenorms 153 ProcedureNorms 程序规范 出价顺序 恋爱 一旦接受不可反悔 秘密磋商 时限 deadline 授权限制 底价 不可撬价 154 SubstanceNorms 实体规范 Fairness NormofEquality NormofEquity 同工同酬 按劳分配 按需分配 参照系 referencepoint 155 第6章重复博弈与合作行为 张维迎教授北京大学光华管理学院 156 序惯博弈与重复博弈 序惯博弈 sequentialgame 参与人在前一个决策点的选择决定随后的子博弈的结构 因此 从后一个决策点开始的子博弈不同于从前一个决策点开始的子博弈 或者说 同样结构的子博弈只出现一次 重复博弈 repeatedgame 同样结构的博弈重复多次 其中的每次博弈被称为 阶段博弈 stagegame 157 重复博弈的三个特征 阶段博弈之间没有物质上的联系 也就是说 前一阶段的博弈不改变后一阶段的结构 所有参与人观察到博弈过去的历史 参与人的总支付 报酬 是所有阶段博弈支付的贴现值之和 158 重复博弈和信誉问题 如果博弈不是一次的 而是重复进行的 参与人过去行动的历史是可以观察到的 参与人就可以将自己的选择依赖于其他人之前的行动 因而有了更多的战略可以选择 均衡结果可能与一次博弈大不相同 重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释 在囚徒困境中 一次博弈的唯一均衡是不合作 即坦白 但如果博弈无限重复 合作就可能出现 159 囚徒困境博弈 合作 不合作 合作 不合作 3 3 1 4 4 1 0 0 A B 160 重复博弈与战略空间的扩展 假定上属博弈重复多次或无限次 那么 每个参与人有多个可以选择的战略 仅举几例 All D 不论过去什么发生 总是选择不合作 All C 不论过去什么发生 总是选择合作 合作 不合作交替进行 tit for tat 从合作开始 之后每次选择对方前一阶段的行动 triggerstrategies 从合作开始 一直到有一方不合作 然后永远选择不合作 161 囚徒困境 的一般表示 合作 不合作 合作 不合作 T T S R R S P P 满足 R T P S S R T T 162 支付函数 双方都不合作 对的解释 贴现率 博弈继续的概率 二者的结合 一般化 未来收益的重要程度 163 无名氏定理 FolkTheorem 在无限次重复博弈中 如果参与人对未来足够重视 足够大 那么 任何程度的合作都可以通过一个特定的子博弈精炼纳什均衡得到 这里 合作程度 定义为整个博弈中合作出现的频率 50年代就人所共知 但无人有发明权 164 Tit for tat 纳什均衡 但不是精炼纳什均衡 165 WhyNotAPerfectNE 假定A在t 5的时候 没有合作 根据TFT战略 在t 6 B应该选择惩罚 不合作 B会这样吗 如果B相信A采取的是TFT战略 那么 如果B对A实施惩罚 预期的收入流为 反之 如果B原谅A 166 Axelrod 1984 Tit for tat是成功率最高的战略 167 Triggerstrategies 如果未来足够重要 精炼纳什均衡 168 合作的条件 如果下列条件满足 合作就是均衡结果 169 解释 R T可以理解为不合作的诱惑 R P是合作的剩余 利益 条件说明 给定未来的重要程度 不合作的一次性诱惑 R T 相对于合作带来的利益 R P 越小 合作的可能性越大 给定不合作的诱惑和合作带来的利益 未来越重要 合作的可能性越大 170 行为的信息传递 假如欺骗两次才被发现 171 含义 欺骗行为越难以被发现 欺骗发生的可能性越大 或者说 合作越困难 在前面的例子 R 4 T 3 P 0 如果欺骗一次就被发现 只要合作就会出现 而如果欺骗两次才被发现 只有当时 合作才可能出现

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论