北大光华管理学院张维迎博弈论-ppt.ppt

上传人：y*** IP属地：广东上传时间：2019-12-31 格式：PPT 页数：33 大小：470KB 积分：25 举报 版权申诉

已阅读5页，还剩28页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第7章不完全信息与声誉张维迎教授北京大学光华管理学院有限次博弈第6章证明只要未来足够重要合作行为可以是无限次重复博弈的精炼纳什均衡但是现实中许多博弈是有限次的不是无限次的如果博弈重复的次数是有限的无论重复多少次合作都不会出现连锁店悖论 chain storeparadox Selten 1978 进入者在位者进入不进入默许斗争 40 50 10 0 0 100 逆向归纳假定在位者有20个市场直观告诉我们如果进入者在第一个市场进入在位者应该选择斗争因为尽管从一个市场看斗争是不值得的但这样做可以遏止进入者在其他市场上的进入唯一的精炼纳什均衡是进入者总是进入在位者总是默许 Axelrod实验 Axelrod 1981 实验表明即使在有限次博弈中合作行为也频繁出现问题在哪里一个可能的原因在于我们前面假定不仅参与人的理性是共同知识而且每个参与人可以选择的战略和效用函数都是共同知识但现实不是这样可能性逆向归纳方法的问题理性共识信息不完全正如我们前面讨论的谈判情况如果信息是完全的谈判一开始就达成协议但现实中的谈判不是这样原因在于信息不对称不完全信息 KMRW模型 1982 如果参与人对其他参与人的效用函数和战略空间的信息不完全即使博弈重复的次数是有限的人们也有积极性建立一个合作的声誉 reputation 合作会出现单方不完全信息假定有两个参与人 A和B 进行囚徒困境博弈如下图参与人A有两中可能的类型非理性型只有一种战略 tit for tat TFT 或者grimstrategy 概率为p 理性型可以选择任何战略概率为 1 p 参与人B有一种类型理性型对非理性的解释特殊的成本函数或效用函数讲义气重情谊的人内在化了reciprocity社会规范的人认知问题囚徒困境博弈合作背叛合作背叛 3 3 1 4 4 1 0 0 A B 博弈重复两次 t 1 t 2 A 非理性 p 理性型 1 p B 理性型合作 X 背叛背叛 X 背叛第2阶段参与人A 如果是理性的选择背叛如果是非理性的选择B在第1阶段的行动 X 参与人B 选择背叛第1阶段参与人A 如果是非理性的选择合作如果是理性的选择背叛参与人B 如果选择合作面临被背叛的风险但如果A是非理性的可以换来第2阶段的合作 B在第2阶段的选择选择合作期望效用是 3p 1 1 p 4p 0 1 p 8p 1如果选择背叛期望效用函数是 4p 0 1 p 0 4p最优选择是合作如果 p 0 25 结论如果B认为A非理性的概率不小于0 25 B在第1阶段会选择合作即使博弈只重复两次博弈重复3次 t 1 t 2 A 非理性 p 理性型 1 p B 理性型合作 X 背叛 X X t 3 X 背叛背叛参与人A 理性的选择如果A是理性的在第2阶段和第3阶段一定会选择背叛但第1阶段也可能选择合作因为建立一个合作的形象可以换取B在第2阶段的合作如果p 0 25 并且A认为B在第1阶段会合作给定A在第2阶段合作的话B在在第2阶段也会合作那么A选择合作得到 3 4 0 5 如果A选择背叛得到 4 0 0 4 所以合作是最优的参与人B的选择 B有四种战略合作合作背叛合作背叛背叛背叛背叛背叛背叛合作背叛合作合作背叛 t 1 t 2 A 非理性 p 理性型 1 p B 理性型合作 X 合作合作背叛 X 合作 X 合作 t 3 X 合作背叛背叛 3 3p 1 1 p 4p 0 8p 2 预期效用合作背叛背叛 t 1 t 2 A 非理性 p 理性型 1 p B 理性型合作 X 合作合作背叛 X 合作 X 背叛 t 3 X 背叛背叛背叛 3 4p 0 1 p 0 4p 3 预期效用背叛背叛背叛 t 1 t 2 A 非理性 p 理性型 1 p B 理性型合作 X 背叛合作背叛 X 背叛 X 背叛 t 3 X 背叛背叛背叛 4 0 0 4 预期效用背叛合作背叛 t 1 t 2 A 非理性 p 理性型 1 p B 理性型合作 X 背叛合作背叛 X 背叛 X 合作 t 3 X 合作背叛背叛 4 1 4p 0 1 p 4p 3 预期效用 P 1 8p 2 合作合作背叛 0 2 4p 3 合作合作背叛背叛合作背叛 4 背叛背叛背叛结论只要p 0 25 下表所列战略组合是一个精炼纳什均衡理性型A在第1阶段选择合作然后在第2和第3阶段选择背叛 B在第1和第2阶段选择合作然后在第3阶段背叛精炼纳什均衡 t 1 t 2 A 非理性 p 理性型 1 p B 理性型合作 X 合作合作背叛 X 合作 X 合作 t 3 X 合作背叛背叛一般结论可以证明如果博弈重复T次只要p 0 25 对于所有的T 3 下列战略组合构成一个精炼纳什均衡理性型A在t 1 T 2阶段选择合作在T 1和T阶段选择背叛 B在t 1 T 1阶段选择合作在最后阶段T选择背叛背叛只在最后两阶段出现双方不完全信息在单方不完全信息下只要p 0 25 不论博弈重复多少次合作都不会出现但如果双方信息不完全即使小小的不确定性也会导致合作行为只要博弈重复的次数足够多但不需要是无限次原因在于如果博弈重复的次数足够长没有任何一方愿意一开始就把自己的名声搞坏 GrimStrategies 假定非理性型选择grimstrategy 如果A在一开始就选择背叛暴露了自己是非合作型的从第2期开始的唯一的均衡是每个人都背叛所以A的最大预期收益为 4 0 0 4 假定选择如下战略开始选择合作直到对方选择不合作之后永远背叛最小预期收益是 p 3T 1 p 1 0 0 p 3T 1 p 合作条件 p 3T 1 p 4 T 5 p p 所以无论p多小只要博弈重复的次数足够大一开始就选择背叛不是最优的 KMRW定理在不完全信息的情况下只要博弈重复的次数足够长参与人就有积极性在博弈的早期建立一个合作的声誉只是在博弈的后期才会选择背叛并且非合作阶段的数量只与p有关而与博弈的次数T无关看似不理性的行为其实是理性的大智若愚应该树立什么样的形象合作与非合作强硬与

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

北大光华管理学院张维迎博弈论-ppt.ppt

文档简介

温馨提示

最新文档

评论

北大光华管理学院张维迎博弈论-ppt.ppt

文档简介

温馨提示

最新文档

评论

相关文档