




已阅读5页,还剩61页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 上一讲内容回顾 博弈论用处 解释 预测和提出建议 猜数游戏 博弈关注的 interdependence 博弈论发展简史囚徒困境智猪博弈商业中心区 CBD 的形成动态博弈与承诺行动信息不对称 二手车市场 混合策略机制设计 定价策略 制度设计等 2 通俗理解博弈论 博弈论是有关取舍策略的科学 它的方程式告诉你在与人接触中怎样得到最大的好处 博弈论刚开始运用到经济领域 现在几乎在哪个科学领域都能看到它的身影 尤其是那些涉及到人性与人的行为的科学 3 4 上述问题都有如下共同点都有若干决策者 我们称之为参与人 players N 人博弈问题的决策者集合 习惯上也用N表示针对具体问题 参与人可以是个人一个政府公司的整个董事会 博弈的基本要素 5 6 7 对参与人的理解 博弈中的决策者 每个参与人的目标是选择一个期望最大化的策略 要求博弈的决策主体具有行为选择能力 并且对博弈结果负责的能力 否则不是参与人 众所周知的田忌赛马博弈 参与人是田忌和齐威王 孙膑仅仅是一个策略分析者 孙膑并不是决策者 因而不是参与人 虚拟参与人 又称为自然 nature 自然在博弈的一些特定点按照给定的概率随机选择行动 虚拟参与人与正常的参与人之间在概念上的差异是 参与人有预先设定的效用函数 而虚拟的参与人对于给定的结局 不存在任何效用感受 8 博弈论对参与人做两个基本假设 1理性的 rational 1 如果一个决策者在追逐其目标时能前后一致地做决策 就称他为rational RogerB Myerson P2 2 广义而言指的是一种行为方式 他同在给定条件或约束下最有效地实现预期目标相关 具体地讲 理性含义如下 9 1 存在一组可供选择的备选或替代方案 2 每一种方案均对应着某种特定的预期净收益或满足程度或目标实现程度 3 人们总是选择那个能够带来最大预期净收益的方案 西蒙 1964 博弈论对参与人做两个基本假设 10 2智能的 intelligent 当我们像博弈论专家那样分析一个博弈时 如果参与人知道我们对此博弈所知道的一切 并能做出我们对此博弈所能做出的一切推断 我们就说此博弈的参与人是智能的 RogerB Myerson P3 博弈论对参与人做两个基本假设 11 参与人都存在若干策略 strategies 或行动 actions 参与人i的策略用si表示 参与人i的所有策略构成的集合称为策略集 记为Si si Si注意行动与策略的区别 博弈的基本要素 12 13 14 支付 收益 效用 payoff 各参与人对所有参与人不同策略组合 strategyprofile 构成了博弈的一个局势 记为s参与人i i N 对局势s有一个主观的偏好 可用一个函数表示这种偏好 这个偏好函数称为参与人i的支付 博弈的基本要素 15 16 参与人 各参与人的策略集 各参与人的支付函数 是博弈最重要的基本要素 博弈的基本要素 17 1 博弈的基本特征是一个参与人的支付不仅取决于自己的策略选择 而且取决于所有其他参与人的策略选择 是策略组合的函数 2 效用是参与人真正关心的东西 参与人在博弈中的目标就是选择自己的策略以最大化自己的效用函数 18 19 20 21 22 Anitemofinformationinagameiscommonknowledgeifalloftheplayersknowitandalloftheplayersknowthatallotherplayersknowitandallotherplayersknowthatallotherplayersknowthatallotherplayersknowit andsoon Thisismuchmorethansimplysayingthatsomethingisknownbyall butalsoimpliesthatthefactthatitisknownisalsoknownbyall etc 23 Considerasimpleexampleoftwoalliedarmiessituatedonoppositehilltopswaitingtoattacktheirfoe Neithercommanderwillattackunlessheissurethattheotherwillattackatexactlythesametime Thefirstcommandersendsamessengertotheotherhilltopwiththemessage Iplantoattackinthemorning Themessenger sjourneyisperilousandhemaydieonthewaytodeliveringthemessage 24 Ifhegetstotheotherhilltopandinformstheothercommander canwebecertainthatbothwillattackinthemorning Notethatbothcommandersnowknowthemessage butthefirstcannotbesurethatthesecondgotthemessage Thus commonknowledgeimpliesnotonlythatbothknowsomepieceofinformation butcanalsobeabsolutelyconfidentthattherestknowit andthattherestknowthatweknowit andsoon 25 共同知识趣题 有一群人围坐在一起 假定只有4个人 每人头上带着戴着一顶帽子 颜色为黑色和白色 每个人看不到自己头上帽子的颜色 但能看到别人帽子的颜色 为了分析的方便 我们假定这四个人均戴的是黑色帽子 这时候 一个局外人来到他们集体当中 对他们说 你们其中至少一个头戴的是黑色帽子 当他说完这句话后 他问 你们知道你们头上的帽子颜色吗 4个人都说不知道 这个局外人第二次问道 你们知道你们头上帽子的颜色吗 4个人又都说不知道 局外人第三次问 你们知道你们头上帽子的颜色吗 4个人又说不知道 局外人第四次问道 你们知道你们头上帽子的颜色吗 这时4个人均说知道了 你能知道这是为什么吗 26 博弈概念的理解 OPEC成员国选择其年产量 两家制造商 一家做螺钉 一一家做螺帽 决定是采用美制标准还是公制标准 公司董事会为其总经理设立一项期股安排 一家电力公司在估计了未来10年对电力的需求后 决定是否购置一套新的发电机组 明天出去玩 决定是否带伞 诸葛亮和司马懿进行的空城计 27 DefinitionofaGame MustconsiderthestrategicenvironmentWhoarethePLAYERS Decisionmakers WhatSTRATEGIESareavailable Feasibleactions WhatarethePAYOFFS Objectives RulesofthegameWhatisthetime framefordecisions Whatisthenatureoftheconflict Whatisthenatureofinteraction Whatinformationisavailable 28 29 30 31 32 课程主要内容 完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 33 完全信息静态博弈概念 概念 各参与人对彼此的策略集 支付函数有准确了解博弈行为同时进行一些实例石头 剪子 布游戏彼此了解的两个厂商的价格战 34 完全信息静态博弈概念 有些实际博弈虽然决策不是在绝对时间意义上的 同时 但决策的时间先后差别跟博弈结果没有关系 也可看成是 同时进行的博弈 如不同竞标单位作出的工程投标决策 35 博弈的策略式表述 常用G表示一个博弈博弈模型的两种表示形式策略式表述 Strategicform 扩展式表述 Extensiveform 本章主要介绍博弈的策略式表述 36 博弈的策略式表述 参与人集合N人博弈的参与人集合 往往也记为N 参与人则记为i i N参与人i的策略集 记为Si 其中的一个特定策略 可记为si 有si Si 37 对于给定的参与人i i 1 2 N 卡氏积S1 S2 Si 1 Si 1 Sn表示除了参与人i外所有参与人所有策略的可能组合 通常记为S i 于是所有参与人不同策略组合构成的策略空间可表示为S Si S i 博弈的策略式表述 38 Si中的元素si表示参与人i的一个具体策略一旦确定了所有参与人的策略 便形成了一个博弈局势 表示为s s1 s2 sN s S 博弈的策略式表述 39 参与人i的效用函数参与人i的支付函数 是从博弈局势集S S1 S2 SN到实数集R的一个映射 记为ui s1 s2 sN 表示参与人i对局势s s1 s2 sn 的偏好 一个博弈可以表示为G S1 SN u1 uN i N 这就是博弈的策略式表述 博弈的策略式表述 40 博弈的策略式表述 例写出囚徒问题的策略式表述参与人集合N 囚徒1 囚徒2 参与人的策略集S1 S2 坦白 不坦白 各参与人的支付 可用图1 1表示 图1 1囚徒问题的支付矩阵 囚徒1 囚徒2 41 博弈的策略式表述 实质上 图1 1已经完全表述了囚徒困境的策略式表述信息称图1 1为二人有限博弈的双矩阵 bimatrix 表述 图1 1囚徒问题的支付矩阵 囚徒1 囚徒2 42 占优均衡 英文术语 Dominant strategyEquilibrium定义 在博弈中如果不管其他参与人选择什么策略 一个参与人的某个策略给他带来的支付值始终高于其他策略 或至少不劣于其他策略 则称该策略为该参与人的严格占优策略或占优策略 43 占优策略 对于所有的s i si 称为参与人i的严格占优战略 如果满足 ui si s i ui si s i s i si si 44 占优均衡 占优均衡定义一个博弈的某个策略组合中 如果对应的所有策略都是各参与人的占优策略 则称该策略组合为该博弈的一个占优均衡 45 占优均衡 占优战略均衡 每个参与人的占优战略组合 如果存在的话 被称为占优战略均衡 图1 2囚徒问题的支付矩阵 囚徒1 囚徒2 46 占优均衡 以囚徒1为例 无论囚徒2采取什么策略 图1 2囚徒问题的支付矩阵 囚徒1 囚徒2 47 占优均衡 坦白总是占优策略 图1 2囚徒问题的支付矩阵 囚徒1 囚徒2 48 占优均衡 由于矩阵的对称性 对囚徒2来说亦可得出类似结论 图1 2囚徒问题的支付矩阵 囚徒1 囚徒2 49 占优均衡 因此 该博弈的策略组合 坦白 坦白 是占优均衡 图1 2囚徒问题的支付矩阵 囚徒1 囚徒2 50 占优均衡 但该占优均衡的收益 却劣于另外一个策略组合 不坦白 不坦白 图1 2囚徒问题的支付矩阵 囚徒1 囚徒2 成绩博弈 分析占优策略和占优均衡 51 52 重复剔除严劣策略均衡 前面介绍了第一均衡概念 占优均衡 显然 并非所有博弈都存在占优均衡 如石头 剪子 布游戏对占优均衡概念稍加扩展 就得到重复剔除严劣策略均衡概念 选举实例 中间选民定理 53 54 重复剔除严劣策略均衡 严劣 和 弱劣 的含义 设si 和si 是参与人i可选择的两个策略 若对其他参与人的任意策略组合s i 均成立ui si s i ui si s i 则说策略si 严劣于策略si 上面式子中 若将 改为 则说策略si 弱劣于策略si 55 重复剔除严劣策略均衡 重复剔除严劣策略均衡的定义重复剔除严格策略就是各参与人在其各自策略集中 不断剔除严劣策略 如果最终各参与人仅剩下一个策略 则该策略组合就被称为重复剔除严劣策略均衡 56 重复剔除严劣策略均衡 实例一个虚拟的博弈 见图1 4 该博弈不存在占优均衡 图1 4 57 重复剔除严劣策略均衡 可用重复剔除严劣策略的方法 得到重复剔除严劣策略均衡解 图1 4 58 重复剔除严劣策略均衡 先从参与人2开始显然 策略 中 要严格优于策略 右 因此 参与人2应该剔除严劣策略 右 博弈简化为图1 5 图1 4 59 重复剔除严劣策略均衡 先从参与人2开始显然 策略 中 要严格优于策略 右 因此 参与人2应该剔除严劣策略 右 博弈简化为图1 5 图1 5 60 重复剔除严劣策略均衡 由于博弈的信息对于两个参与人来说是 完全的 因此 参与人1能够预测到参与人2的这个推理过程 图1 5 61 重复剔除严劣策略均衡 或者说 参与人1能够看到图1 5因此 参与人1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 三方担保借款合同范本
- 商业合作合同范本
- 医学专业应试题及答案
- 链功宝新安全法题库及答案解析
- 园林安全员题库及答案解析
- 湖北化工安全管理员题库及答案解析
- 巴州出租汽车从业考试题及答案解析
- 铲车司机安全题库及答案解析
- 安全常识急救知识题库及答案解析
- 房地产基础知识考试试题及答案
- 美发裁剪理论知识培训课件
- 舞蹈老师自我介绍课件
- 2025年吉林省教育系统校级后备干部选拔考试题及答案
- 社区安全知识培训资料课件
- 徐学义基础地质调查课件
- 2025主题教育应知应会知识题库及答案
- 无人机航空安全知识培训课件
- 警用侦查无人机在侦查行动中的应用分析报告
- 2024年春季云南省高中学业水平合格性考试化学试卷真题(含答案)
- 石膏板项目可行性研究报告
- 2025年肠造口护理及并发症防治考核试题及答案
评论
0/150
提交评论