版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、博弈联均衡模型博弈论模型图示博弈可划分为合作博弈和非合作博弈,这两者的区别主要在于人们的行为相互作用时,当事人能否达成一个有约束力的协议:如能达成就是合 作博弈;反之就是非合作博弈。合作博弈强调团体理性,强调效率和公平,非合作博弈强调理性个人的 最优决策,其结果是否有效率则是不确定的。人们一般讲到的都是指非合作博弈,它 有四种不同类型的博弈,即完全信息静态博弈、完全信息动态博弈、不完全信息 静态博弈、不完全信息动态博弈,与上述相对应的是纳什均衡、子博弈精炼纳什 均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡。这四种均衡中最为基本的是纳什 均衡。所谓纳什均衡,指的是所有参与人最优选择的一种组合,在这种
2、组合下,给定其他人的选择,没有任何 人有积极性做岀新的选择。纳什均衡的哲学思想是:给定别人遵守协议的情况下,没有人有积极性偏离 协议规定的自己的行为规则。换言之,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少 有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。当博弈中的所有参与人事先 达成一项协议,给岀每个人的行为规则。在没有外在强制力约束时,当事人是否会自觉地遵守这个协议? 或者说这个协议是否可以自动实施?如果当事人会自觉遵守这个协议,等于说这个协议构成一个纳什均 衡。参见张维迎:“经济学家看法律、文化与历史”,载张维迎产权、政府与信誉,三联书店2001年 版。“囚
3、徒困境”最早是由美国普林斯顿大学数学家曾克 1950年提出来的。他当时编 了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论。 这个故事后来成为博弈 论最经典的案例。故事的内容如下:两个犯罪嫌疑人被捕并受到指控, 但除非至少其中至少有一个人供认犯罪, 警方缺 乏足够的证据指证他们所犯的罪行,从而将他们按罪判刑。为了得到所需的口供,警察将这两名罪犯关押在不同牢房以防止他们串供或结成攻守联盟,并给他们同样的选择机完全信息静态博弈一一纳什均衡、完全信息动态博弈子博弈精炼纳什均衡不完全信息静态博弈一一贝叶斯纳什均衡、不完全信息动态博弈一一精炼贝叶斯纳什均衡,与上述相对应的是、。这四种均衡中最为基本
4、的是纳什均衡。完全信息静态博弈(纳什均衡)债务人强硬妥协债强硬-200100权-1000人妥协01009010 债务人 债'、 权 人 妥协强硬妥协90100100强硬1000-200-100囚徒困境口文/柯华庆会:如果他们两人都拒不认罪,则根据已经掌握的证据他们会被判以1年徒刑;如果双方都坦白招认,都将被判入狱 5年(比事实上的罪行要轻);如果两人中有一人坦 白认罪,则坦白者从轻处理,立即释放(信息费用),而另一人则重判8年徒刑。支付(得益)矩阵如下:甲 徒 囚囚徒乙白 坦沉默1 1O8-坦白8-O5-5-第一,“囚徒困境”时有广义和狭义之分。狭义的“囚徒困境”是特指囚徒的困境。 广
5、义的“囚徒困境”是指个人追求收益最大化的策略由于策略的相互依赖性最后得到的 结果违背了自身的利益。在市场竞争的各个领域、在资源利用和环境保护,以及政治、 军事上大量存在“囚徒困境”。例如两个寡头的降价(反垄断法),“沉默现象”(两 个乘客在遇到一个歹徒抢劫财物)、当事人向法官行贿。广义的“囚徒困境”的决策特 点:其中任何一人在选择策略时都不可能知道另一人的选择是什么,因此不管他们决策 的时间是否相同,我们可以把他们的决策看作是同时作出的;每一方都知道对方的得益 情况;这两个决定了是完全信息静态博弈。另外,两个博弈方同有两种相同的可选策略, 策略和得益都对称的博弈。合作背叛合作BDBA背叛ADC
6、C一般性囚徒困境代数图(其中, B>C>且2 B>A+D)第二,根据个体理性行为准则和完全理性行为准则,两个博弈方的目标都想要实现也有能力判断自身的最大利益。实际上对双方来说最佳结果是(-1,-1 ),对单方最佳结果是(-8,0 )或(0,-8 ),问题就在于他们都看到对自己有利的结果,两者之间不能串通,双方都不敢相信或者期望对方有合作精神,所以最后的结果是(-5,-5 )。第三,对结果评价的多视角:就囚徒而言,是有害的;对警察有利、对社会利益来说是非常理想的结果,因为节省了信息费用(调查事实真相的费用);从博弈论的一般 性来看(不涉及具体人),两个决策者的立场是不明智的(“
7、聪明反被聪明误”),因 为既没有实现团体的最大利益, 也没有真正实现自身的个体最大利益。一般认为该博弈 揭示了个体理性与集体理性的矛盾,对经济学中斯密“看不见的手”理论是一种重创。“他受着一只看不见的手指导,去尽力达到一个并非他本意想要达到的目的,。他追 求自己的利益,往往使他能比在真正出于本意的情况下更有效地促进社会的利益”。单 个囚徒仅仅考虑自己,由于策略的相互依存性,最后的结果违背了囚徒自身的利益(仍 然是个体利益)。所以囚徒困境揭示的是“事与愿违”,原因在于社会中策略的相互依 存性,即个体追求自身利益要考虑其他人的策略,单纯从自身考虑最后的结果可能正好 相反。第四,“囚徒困境”主要是双
8、方不信任的结果。同时没有组织性,如果他们属于黑 社会组织或者是其他组织,在他们内部有一个惩罚措施,这时是合作博弈,结果肯定是 两个囚徒都选择抵赖。在囚徒困境中,尽管每个人都选择抵赖比选择坦白要好,但是这 个帕累托改善做不到,因为它不满足个人理性要求,(抵赖,抵赖)不是一个均衡。假 定两个囚徒在作案之前建立一个攻守同盟(绝不坦白),这个攻守同盟也没有用,因为 没有人有积极性遵守协定。这就是合作博弈与非合作博弈的区别。如果相互信任的话, 也不会出现这种情况。假定有约束力的协议:惩罚如果我们允许博弈中存在"有约束力的协议",使得博弈方采取符合集体利益最大 化而不符合个体利益最大化的行为时,能够得到有效的补偿,那么个体利益和集体利益 之间的矛盾就可以被克服,从而使博弈方按照集体理性决策和行为成为可能。比如黑社 会中的奖惩制度!沉默招供沉默-1_8-1-100
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025日喀则市第二中等职业技术学校工作人员招聘考试试题
- 2025江苏省睢宁中等专业学校工作人员招聘考试试题
- 高考英语近6年高频考察300个长难句型(带解析版)
- 基坑支护排桩施工方案
- 基于混合式学习的区域间人工智能教育师资交流与合作研究教学研究课题报告
- 吊顶反支撑施工指导书
- 变电站主变大修工程施工方案
- 2026年绿色建筑节能环保行业创新报告
- 2026年银发经济能源管理创新报告
- 从2022年经验看当前“钱多”演绎
- 2026年山东省济南槐荫区九年级中考物理二模考试试题(含答案)
- 中小学教学仪器配备标准2010试行
- 《敏捷革命》读书笔记思维导图PPT模板下载
- 企业合同风险与防范
- FZ/T 60007-2019毛毯试验方法
- 中小学班主任与心理健康教育教师专题培训课件
- 肝衰竭机制及治疗进展课件
- 中医诊所规章制度(完整版)
- DB33T 2383-2021 公路工程强力搅拌就地固化设计与施工技术规范
- 回转窑基础知识培训课件
- 人民币银行结算账户管理办法
评论
0/150
提交评论