博弈均衡模型及其举例.doc

上传人：仙*** IP属地：河南上传时间：2020-02-21 格式：DOC 页数：7 大小：57.01KB 积分：12 举报 版权申诉

已阅读5页，还剩2页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

博弈联均衡模型博弈论模型图示博弈可划分为合作博弈和非合作博弈，这两者的区别主要在于人们的行为相互作用时，当事人能否达成一个有约束力的协议：如能达成就是合作博弈；反之就是非合作博弈。合作博弈强调团体理性，强调效率和公平，非合作博弈强调理性个人的最优决策，其结果是否有效率则是不确定的。人们一般讲到的都是指非合作博弈，它有四种不同类型的博弈，即完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈，与上述相对应的是纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡。这四种均衡中最为基本的是纳什均衡。所谓纳什均衡，指的是所有参与人最优选择的一种组合，在这种组合下，给定其他人的选择，没有任何人有积极性做出新的选择。纳什均衡的哲学思想是：给定别人遵守协议的情况下，没有人有积极性偏离协议规定的自己的行为规则。换言之，如果一个协议不构成纳什均衡，它就不可能自动实施，因为至少有一个参与人会违背这个协议，不满足纳什均衡要求的协议是没有意义的。当博弈中的所有参与人事先达成一项协议，给出每个人的行为规则。在没有外在强制力约束时，当事人是否会自觉地遵守这个协议？或者说这个协议是否可以自动实施？如果当事人会自觉遵守这个协议，等于说这个协议构成一个纳什均衡。参见张维迎：“经济学家看法律、文化与历史”，载张维迎产权、政府与信誉，三联书店2001年版。完全信息静态博弈纳什均衡、完全信息动态博弈子博弈精炼纳什均衡不完全信息静态博弈贝叶斯纳什均衡、不完全信息动态博弈精炼贝叶斯纳什均衡，与上述相对应的是、。这四种均衡中最为基本的是纳什均衡。完全信息静态博弈（纳什均衡）债务人强硬妥协债权人强硬-200 -100100 0妥协0 10090 10债务人债权人妥协强硬妥协90 100 100强硬100 0-200 -100囚徒困境文/柯华庆“囚徒困境”最早是由美国普林斯顿大学数学家曾克1950年提出来的。他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论。这个故事后来成为博弈论最经典的案例。故事的内容如下：两个犯罪嫌疑人被捕并受到指控，但除非至少其中至少有一个人供认犯罪，警方缺乏足够的证据指证他们所犯的罪行，从而将他们按罪判刑。为了得到所需的口供，警察将这两名罪犯关押在不同牢房以防止他们串供或结成攻守联盟，并给他们同样的选择机会：如果他们两人都拒不认罪，则根据已经掌握的证据他们会被判以 1 年徒刑；如果双方都坦白招认，都将被判入狱 5 年（比事实上的罪行要轻）；如果两人中有一人坦白认罪，则坦白者从轻处理，立即释放（信息费用），而另一人则重判 8 年徒刑。支付（得益）矩阵如下：囚徒甲囚徒乙沉默坦白沉默-1 -1-80坦白0 -8-5-5第一，“囚徒困境”时有广义和狭义之分。狭义的“囚徒困境”是特指囚徒的困境。广义的“囚徒困境”是指个人追求收益最大化的策略由于策略的相互依赖性最后得到的结果违背了自身的利益。在市场竞争的各个领域、在资源利用和环境保护，以及政治、军事上大量存在“囚徒困境”。例如两个寡头的降价（反垄断法），“沉默现象”（两个乘客在遇到一个歹徒抢劫财物）、当事人向法官行贿。广义的“囚徒困境”的决策特点：其中任何一人在选择策略时都不可能知道另一人的选择是什么，因此不管他们决策的时间是否相同，我们可以把他们的决策看作是同时作出的；每一方都知道对方的得益情况；这两个决定了是完全信息静态博弈。另外，两个博弈方同有两种相同的可选策略，策略和得益都对称的博弈。合作背叛合作B BD A背叛A DC C 一般性囚徒困境代数图（其中，ABC且2 BA+D ）第二，根据个体理性行为准则和完全理性行为准则，两个博弈方的目标都想要实现也有能力判断自身的最大利益。实际上对双方来说最佳结果是（-1 ，-1 ），对单方最佳结果是（-8 ， 0 ）或（ 0 ，-8 ），问题就在于他们都看到对自己有利的结果，两者之间不能串通，双方都不敢相信或者期望对方有合作精神，所以最后的结果是（-5 ，-5 ）。第三，对结果评价的多视角：就囚徒而言，是有害的；对警察有利、对社会利益来说是非常理想的结果，因为节省了信息费用（调查事实真相的费用）；从博弈论的一般性来看（不涉及具体人），两个决策者的立场是不明智的（“聪明反被聪明误”），因为既没有实现团体的最大利益，也没有真正实现自身的个体最大利益。一般认为该博弈揭示了个体理性与集体理性的矛盾，对经济学中斯密“看不见的手”理论是一种重创。“他受着一只看不见的手指导，去尽力达到一个并非他本意想要达到的目的。他追求自己的利益，往往使他能比在真正出于本意的情况下更有效地促进社会的利益”。单个囚徒仅仅考虑自己，由于策略的相互依存性，最后的结果违背了囚徒自身的利益（仍然是个体利益）。所以囚徒困境揭示的是“事与愿违”，原因在于社会中策略的相互依存性，即个体追求自身利益要考虑其他人的策略，单纯从自身考虑最后的结果可能正好相反。第四，“囚徒困境”主要是双方不信任的结果。同时没有组织性，如果他们属于黑社会组织或者是其他组织，在他们内部有一个惩罚措施，这时是合作博弈，结果肯定是两个囚徒都选择抵赖。在囚徒困境中，尽管每个人都选择抵赖比选择坦白要好，但是这个帕累托改善做不到，因为它不满足个人理性要求，（抵赖，抵赖）不是一个均衡。假定两个囚徒在作案之前建立一个攻守同盟（绝不坦白），这个攻守同盟也没有用，因为没有人有积极性遵守协定。这就是合作博弈与非合作博弈的区别。如果相互信任的话，也不会出现这种情况。假定有约束力的协议：惩罚如果我们允许博弈中存在有约束力的协议，使得博弈方采取符合集体利益最大化而不符合个体利益最大化的行为时，能够得到有效的补偿，那么个体利益和集体利益之间的矛盾就可以被克服，从而使博弈方按照集体理性决策和行为成为可能。比如黑社会中的奖惩制度！沉默招供沉默-1 -1-8 -100招供-100 -8-

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈均衡模型及其举例.doc

文档简介

温馨提示

最新文档

评论

博弈均衡模型及其举例.doc

文档简介

温馨提示

最新文档

评论

相关文档