




已阅读5页,还剩33页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ab s t r a c t ab s t r a c t t h e g a m e l o g i c b e l o n g s t o a n e w r e s e a r c h a r e a w h i c h h a s a c l o s e c o r r e l a t i o n w i t h g a m e t h e o ry . t h e g a m e t h e o ry s t u d i e s t h e p o l i c y w h i c h d ir e c t l y m u t u a l l y a ff e c t s t h e b e h a v i o r o f t h e d i c is o n - m a k e r a s w e l l a s th e p o l i c y b a l a n c e d q u e s t i o n k n o w l e d g e . n o w t h e g a m e t h e o ry h a s b e e n w i d e l y a p p l i e d t o e c o n o m i c s , a n d o b t a i n s t h e r e l a t i v e m a t u r e e ff e c t . a l t h o u g h t h e g a m e t h e o ry h a s a l r e a d y y i e l d e d t h e s u b s t a n t i a l a c h i e v e m e n t , t h e g a m e l o g i c i s a c t u a l ly s t il l a t th e s t a r t s t a g e . hp r a c t i c e , th e g a m e l o g i c s t i l l h a s t o b e i m p r o v e d a n d s t r e n g th e n e d ; i n t h e o ry , t h e g a m e l o g i c s t i l l h a s t h e l i m i t a n d i n s u ff i c i e n c y w h e n a p p l i e d . t h e r e f o r e , th i s a r t i c l e i n t r o d u c e s s e v e r a l c l as s i c g a m e c as e s , t h r o u g h w h i c h , t h i s a r t i c l e s p e c i f i c a l l y a n a l y z e s t h e l o g i c a l m e t h o d o f g a m e l o g i c a n d t h e l i m i t as w e l l as p r o s p e c t s o f i t . t h e s c h o l a r w h o s t u d i e s t h e t h e o ry o f g a m e l o g i c s h o u l d a n a l y s i s t h e a c h i e v e m e n t o f g a me t h e o ry w i t h a s c i e n c e m a n n e r , a n d w h i c h i s f o r t h e p u r p o s e o f p r o m p t i n g t h e f u r th e r d e v e l o p m e n t o f g a m e l o g i c . k e y wo r d s : g a m e t h e o ry , g a m e l o g i c , c e n t i p e d e g a m e , p r i s o n e r s d i l e m m a , b a r p r o b l e m 南开大学学位论文版权使用授权书 本人完全了解南开大学关于收集、保存、 使用学位论文的规定, 同意如下各项内容: 按照学校要求提交学位论文的印 刷本和电 子版 本;学校有权保存学位论文的印刷本和电 子版,并采用影印、缩印、 扫描、 数字化或其它手段保存论文; 学校有权提供目 录检索以 及提供 本学位论文全文或者部分的阅览服务; 学校有权按有关规定向国家有 关部门或者机构送交论文的复印件和电子版; 在不以赢利为目的的前 提下,学校可以 适当复制论文的部分或全部内容用于学术活动。 学位论文作者签名: 呼 s ,q 今 奋 1难 方 p 日 经指导教师同意, 本学位论文属于保密,在年解密后适用 本授权书。 指导教师签名: 学位论文作者签 名: 解密时间:年月日 各密级的最长保密年限及书写格式规定如下: 内部 5 年 ( 最长5 年,可少于5 年) 秘密1 0 年 ( 最长1 0 年,可少于1 0 年) 机密2 0 年 ( 最长2 0 年,可少于2 0 年) f 汤 -息 飞 . - 赞, 山韶 舔心 生_ _ 后 _ _ _ 淞 南开大学学位论文原创性声明 本人郑重声明: 所呈交的学位论文, 是本人在导师指导下, 进行 研究工作所取得的成果。 除文中己经注明引用的内容外, 本学位论文 的研究成果不包含任何他人创作的、 己 公开发表或者没 有公开发 表的 作品的内 容。对本论文所涉及的研究工作做出贡献的其他个人和集 体, 均已 在文中以明 确方式标明。 本学位论文原创性声明的 法律责任 由本人承担。 学位论文作者签名:和 和妇 枷夕 年 v m o 日 引言 引言 随着经济科技的迅速发展,各个学科交叉融合的 趋势越来越明显,逻辑学 也不可避免的 从单一学科研究逐步走向既独立又与其它学科交叉融合的 研究趋 势,逻辑学为各个学科的发展提供了有效的逻辑方法,各个学科的发展又为逻 辑学的研究提供了许多巫待探索的新问 题和新领域。 新的分支学科不断涌现, 而逻辑学与博弈论的结合,为我们提供了 一个新的 可供研究的领域, 从而博弈 逻辑得以 兴起。 博弈逻辑是逻辑学的一个新的 分支学科, 它的出 现不仅拓宽了 逻辑学的 研究范围,同时也为许多经济社会现象提供了 一种新的 解决问 题的方 法,因而具有重要的理论与应用价值。 目 前对于博弈论的 研究己 相对成熟,但有关博弈逻辑的研究才刚刚起步, 对于一种尚 处于探索阶段的研究领域而言,博弈逻辑仍然存在着理论研究上的 不足与在实践应用中的限度。 例如博弈逻辑在非理性领域的研究缺失。从理论 意义上而言, 任何一门学科都不能涵盖人社会行为的全部方面。从实践意义上 而言,人更多的是社会中的人,人的思想行为除受理性支配外,还深受情感、 情绪等诸多非理性因 素的影响,因 此,博弈逻辑在非理性领域存在着非常大的 行为空间。由 此本文的研究在于:第一,使逻辑学者不仅对这一领域有一个更 为详细的了解,以给予博弈逻辑更多的理性的研究,从而促进博弈逻辑沿着科 学的道路发展。第二,使决策者在应用博弈逻辑时,能够更为全面的考虑博弈 逻辑尚无法涉及的领域,注重对博弈结论的实践检测,提高决策的科学性。本 文在第一章对博弈论和博弈逻辑的 有关概念和内容进行了 介绍; 在第二章, 本 文通过对几个经典的博弈案例进行分析, 进一步介绍了 博弈逻辑的 相关内 容, 并在案例分析的过程中, 部分提出了 博弈逻辑应用限 度的问 题, 这些问 题在第 三章中给出了详细的阐述;本文在第四章对博弈逻辑的发展前景进行了展望。 本文指出,尽管博弈逻辑存在着应用限度的问题,但随着理论研究的进一步推 进,博弈逻辑将日 趋完善, 对博弈逻辑的 研究将为推动博弈论和逻辑学的共同 发展做出贡献。 第一章 博弈论和博弈逻辑 第一章 博弈论和博弈逻辑 目前,博弈论和逻辑学的交叉研究主要沿着两条方向发展,其一是逻辑博 弈, 即逻辑学中的一些概念本身便可构建博弈模型,例如范约翰. 范. 本特姆 ( j o h a n v a n b e n t h e m ) 教 授 在 这 方 面 的 研 俨. 其 二 是 博 弈 逻 辑 , 在 这 个 方向 上, 不同的学者的研究角度也不同。有的学者运用逻辑学的技术构建博弈逻辑系统, 例如运用模态逻辑构建博弈逻辑系统; 有的学者则研究博弈论中运用的 逻辑方 法,用逻辑方法分析博弈论框架,以 应用于社会有关现象的 解读,例如形式逻 辑推理等。另外有些学者把辩证逻辑与博弈论结合起来,运用非形式化的手段 解读博弈行为中复杂的心理现象等. 逻辑博弈把逻辑学的有关概念作为博弈来 进行分析,因而属于博弈论的范畴; 而博弈逻辑则是研究博弈行为中的参与人 是如何做出决策的逻辑,它是运用逻辑学知识分析博弈行为,因而属于逻辑学 的范畴。 博弈逻辑的产生与发展都与博弈论有着紧密的联系。自2 0 世纪9 0 年代始, 博弈论的研究受到了世界的关注,并因为其在社会经济行为的分析方面具有独 特的 优势而三次受到诺贝 尔经济学奖的 青睐。1 9 9 4年, 诺贝 尔经济学奖颁给了 在非合作博弈均衡分析理论方面做出突出贡献的约翰. 纳什、 泽尔滕和海萨尼; 1 9 9 6年, 美国人威廉 维克瑞由 于把博弈论和信息经济学结合起来获得了 1 9 9 6 年诺贝尔经济学奖。 2 0 0 5年,诺贝尔经济学奖再度垂青博弈论,以 色列经济学 家罗伯特. 奥曼和美国 经济学家托马斯 谢林再次获此殊荣。随 着博弈论的发展, 许多学者开始运用形式化的手段构建博弈模型, 而逻辑学在形式方法运用方面 具有独特的 优势,于是有些逻辑学者自 觉地把逻辑学与博弈论结合起来, 博弈 逻辑应运而生。 博弈逻辑通过运用逻辑方法、逻辑技术来建构博弈框架,为分 析社会生活中的博弈现象提供方法。 博弈逻辑为博弈论的发展提供工具方法, 博弈论的 发展又推动了 人们对博弈逻辑的 进一步研究, 二者紧密联系, 相互促 进。 。见j o h a n v a n b e n t h e m . l o g ic g a m e s a r e c o m p l e t c f o r g a m e l o g i c s . s t o d ia . v o 1 7 5 ( 2 ) . 2 0 0 3 p p - 1 8 3 - 2 0 3 第一章 博弈论和博弈逻辑 第一节简析博弈论 博弈论的英文为“ g a m e t h e o ry, 也 有人把它翻译成对策论, 它是 研究决 策 主 体 如 何 在 行 为 发 生 相 互作 用 后 做出 的 决 策以 及 这 种 决 策 均 衡问 题的 理 论 (d 博弈论的 研究基于两个假定: 第一,博弈参与人是理性的, 他们会运用所掌握 的全部知识和信息选择效用最大化的行为;第二,博弈参与人的得益不仅取决 于自 己的 行为,同时取决于其他人的行为。 这两个假定表明了博弈论所要研究 的博弈行为:每个理性的参与人在进行决策时,为使自己得益最大, 会充分考 虑博弈中其他人的 策略选择。 在博 弈中,“ 每 个人是理性的” 是公 共知 识 ( c o m m o n k n o w l e d g e ) , 即 每 个参与人都知道其他参与人是理性的,每个参与人都知道别人知道自 己 是理性 的,每个参与人知道每个参与人知道别人知道自己是理性的等等。理性假定也 是每个参与人进行策略选择的前提。 根据研究的内容与角度的不同,可以 对博弈进行不同的划分。 首先根据博 弈中 参与人是否达成了 具有约束力的协议可把博弈划分为合作博 弈和非合作博 弈 ( 有关二者的具体阐述见本节第二部分),根据参与人行动的先后顺序,可 以 把博弈划分为静态博弈和动态博弈。静态博弈是指,博弈中的参与人同时选 择行动,即双方都不知道对方采取了什么行动:或者,即使时间上有先后,但 后行动者并不具有先行动者所采取行动的相关信息;动态博弈是指,参与人的 行动有明显的先后顺序,也即后行动者能够观察到先行动者的行动。根据参与 人对其他参与人的特征、战略空间及支付函数的 信息掌握程度的不同,还可以 把博弈划分为完全信息博 弈和不完全信息博弈。 完全信息指的 是每一 个参与人 都对其他参与人的特征、战略空间及支付函数有准确的知识;不完全信息则相 反。 把后面两种划分角度综合起来,我们还可以 把博弈划分完全信息静态博弈, 完全信息动态博弈,不完全信息静态博弈, 及不完全信息动态博弈等四 类博弈。 博弈论中存在与上述四类博弈相对应的四个均衡概念:纳什均衡,子博弈精炼 纳什均衡,贝叶斯纳什均衡,及精炼贝叶斯纳纳什均衡。 ( 相关内容介绍见本 节第二部分)。 表 1 . 1博弈划分及其对应均衡表 。见 张维 迎,博 弈论与 信息 经济学 上海: 上海人民 出 版社, 1 9 9 6 年8 月第一 版第30页 第一章 博弈论和博弈逻辑 溉咫 静态博弈动态博弈 完全 信息 完全信息静态博弈 纳什均衡 完全信息动态博弈 子博弈精 炼纳什均衡 不完全 信息 不完全信息静态博弈 贝叶 斯纳什均衡 不完全信息动态博弈 精炼贝叶斯纳什均衡 1 . 1 . 1博弈论运用到经济学 如前所述,博弈论最初被看成是数学的 一个分支, 它运用到经济学有一个 过程。传统的经济学观点认为:经济学主要围绕价格理论进行研究。但价格理 论的成立存在两个基本前提:一是完全竞争市场的存在,即市场上存在着众多 的买者与卖者,每一个买者与卖者都不能单独改变市场的价格;二是市场中参 与人的信息完全对称, 不存在不对称的现象。但是,随着经济学的发展, 研究 者们日益注意到:这两个前提与现实有很大的出入。首先,完全竞争市场只是 一种理想状态,现实中 存在的更多是不完全竞争现象。 第二,市场中买者与卖 者的信息并不完全等同, 参与人之间存在信息不对称的 情况.因此价格理论在 解决信息非对称条件下的市场交易问题时就存在缺陷,于是博弈论应运而生。 1 9 4 4 年, 冯 诺依曼( v o n n e u m a n n ) 和奥 斯卡 摩根斯坦( o s c a r m o r g e n s t e r n ) 合著了一本书,书名为 博弈论与经济行为。该书不仅奠定了现代博弈论基 础,并对博弈论应用到 经济领域起了重要作 用。 2 0 世纪4 0 年代末5 0 年代初, 纳 什 ( j o h n n a s h ) 提 出 了“ 纳 什 均 衡”( n a s h e q u i l ib r iu m ) 概 念, 纳 什 均 衡 概 念及相关证明 把博弈 论的 研究推向了高潮。 2 0 世纪5 0 年代中 后期到7 0 年代, 许多重要的理论成果 在这一时期完成。 莱茵哈德, 泽尔 滕( r e i n h a r d s e l t e n ) 提出 了“ 子博 弈 完 美 纳 什 均 衡” 和“ 颤 抖手 均 衡” 的 概念 ; 海萨 尼( j o h n h a r s a n y ) 提出了分析不完全信息 博弈问 题的 标准方法和“ 贝叶 斯纳什均衡” 概念. 博弈 论在八、 九十年代的 发 展受到了 广泛关注。1 9 9 4年, 纳什、 泽尔滕和海萨 尼获 得了该年度诺贝尔经济学奖, 他们的 研究 在提高非合作博弈理论的 有效性和预 见性方面起到了很大作用。 2 0 0 5 年, 罗伯特 奥曼 ( r o b e r ti . a u m a n n ) 和托马斯 谢林( t h o m a s c . s c h e ll in g ) 再 次 分 享了 诺 贝 尔 经 济 学 奖 这 一 荣 誉。 这 一 奖 项的 颁布以 表彰他们通过博弈论分析而增进了我们对冲突与合作的理解。 直到今天, 博弈论的发展已 广泛渗透到包括经济学在内的诸多学科领域。 第一章 博弈论和博弈逻辑 博弈论考虑了 在不完全竞争市场上, 理性人行为的 相互影响以 及由 此得出 的决策,这符合当代大多数经济学者所认同的观点:经济学是研究人的行为的 科学,即研究理性人的行为。所以,博弈论日 益受到经济学家们的普遍认可。 1 . 2非合作博弈 正如本节开始所述, 博弈论可以 被划分为 合作博弈和非合作博弈。 所谓合 作博弈是指,参与人之间达成了一种具有约束力的协议,并且这种约束有效, 参与人都乐意根据这个协议发挥参与人的职能; 所谓非合作博弈则是指参与人 之间 没 有 达 成 具 有约 束 力的 协议 的 博 弈 。 。 例 如 两 个 寡 头 企 业, 如 果 为了 获 得 垄 断利润,这两个企业之间达成了一项协议, 如果双方均按这个协议生产, 那他 们之间的博弈就是合作博弈。 合作博弈所解决的问题是参与人对合作剩余的分 享。但是,如果每个企业只按最优于自己 企业的产量进行生产, 任何一方均不 具有强制另一方遵守 这个协议的约束力, 那么 他们之间的博弈就是非合作博弈。 合作博弈强调团体理性、效率、公正、公平:非合作博弈强调个人理性、个人 决策最优,而不管决策的结果是有效率的还是无效率的.纳什、泽尔滕和海萨 尼的贡献主要是在非合作博弈方面。目 前非合作博弈在经济领域运用的更为广 泛,经济学家谈到博弈论,一般指的也是非合作博弈。 博弈论的基本概念主要包括:参与人、信息、战略、支付、函数、结果、 行动、均衡等。参与人是决策主体,他可能是个人,也可能是团体,参与人在 博弈中选择行动以使自己的效用最大化; 信息是参与人在博弈中 所知道的相关 知识;战略决定了参与人在相应时机选择的 相应行动; 支付函 数是参与人最关 心的,它是参与人在博弈中 获得的效用水平, 是所有参与人战略或行动的函数; 结果是指博弈分析者感兴趣的要素的集合:行动是参与人的决策变量;均衡是 所有参与人的最优战略或行动的组合。对每一个博弈进行分析均会涉及上述概 念,了解这些概念是进行博弈分析的基础。 如前文所述,博弈论可以 划分为完全信息静态博弈、 完全信息动态博弈、 不完 全信息静态博弈、 不完全信息动态博弈,以 下我们将对这些主要概念做简 要的介绍。 1 .完全信息静态博弈:纳什均衡 。n a s h l . n o n - c o o p e r a ti v e g a m e s . a n n a l s o f m a t h e m a ti c s 5 4 : 2 8 6 - 2 9 5 , 1 9 5 1 第一章 博弈论和博弈逻辑 纳什均衡是由所有参与人的最优战略组成的一种战略组合。它具有如下特 点:其一,给定别人的战略,参与人不会偏离现有的 策略;其二,每个参与人 持有的 信息都是对对手实际 采取策略的 一个精确的 实际 预测 。 也就是说, 给定 现有战略组合的情况下,所有参与人都愿意维持现有状态,没有任何参与人愿 意改变现有战略,即没有任何参与人有积极性打破现有均衡。我们也可以 换一 个角度来理解,举一个例子,两个企业为获取更大利润,事先达成了一项合作 协议,这项协议规定了这两个企业各自 的行为规范, 但双方实力相当,任何一 方都对另一方没有控制权,也就是说这项协议没有绝对的约束力。 那么这两个 企业会自 觉遵守协议的 规定吗? 如果双方均自 觉遵守 协议, 那么该博弈已 经形 成了双方均遵守协议战略的纳什均衡。所以,纳什均衡形成于这样的情况:假 定别人遵守协议的情况下, 没有任何参与 人有积极性改变自己 现有的 策略。 z . 完全信息动态博弈: 子博弈精炼纳什均衡 泽尔滕对完全信息动态博弈的发展做出了重要贡献,他通过对动态博弈的 分析完善了纳什均衡的概念。他首先定义了“ 子博弈精炼纳什均衡” 概念,子 博弈精炼纳什均衡与纳什均衡的主要区别是,前者剔除了纳什均衡中包含的不 可置信的 威胁。 子博弈精炼纳什均衡要求参与人的决策在任何时点上都最优, 即给定别人战略的情况下,参与人根据最大化自己的期望效用, 选择战略构成 纳什均衡. 讲到子博弈纳什均衡,我们首先要引 进两个概念:子博弈和不可置信威胁。 粗略地说,在原博弈中,从每一次行动开始到博弈结束都可以 看作是一个子博 弈,每一个子博弈可以 单独作为一个博弈进行分析。 所谓不可置信威胁指某种 威胁由 于不具有或具有较弱的威胁力而变得不可相信。 简而言之,即博弈中 参 与人一方的威胁是不可置信的。例如,参与人甲 身缠炸药,他威胁参与人乙: 不给钱就引爆炸药。假定在没有任何外在因素加入的情形下, 双方都理性地寻 求利益的最大化,那么这种威胁就是不可信的。因为, 如果甲引爆炸药,那么 无论是否乙 给钱,甲的得益都将降到最低。对上述概念初步了解后,我们可以 引 入“ 子博弈精炼纳什均衡” 概念,“ 一个纳 什均衡 被 称为精炼纳什均衡, 当只 当参与人的战略在每一个子博弈中都构成纳什均衡, 就是说,组成精炼纳什均 衡的战略必须在每一个子博弈中都是最优的。”。 将上面的例子略改一下, 假 费 尔 南多 维加 一 雷 尔多 著, 毛亮, 业 敏等 译,上 海 人民出 版社, 2 0 0 6 年9 月, 第3 7 - 3 9 页 张维迎, 博弈论与 信息经济学. 土海:上海 人民出 版社,1 9 9 6 年9 月第一版第1 4 - 2 5 页 第一章 博弈论和博弈逻辑 如甲引爆炸药不会对自身产生威胁,但作案后存在被警察抓住的危险,这种危 险的得益小于他拿到一大笔钱的得益,那么 ( 威胁,抵抗) 就是纳什均衡。但 是假定乙选择坚决抵抗的策略,甲的最优策略就不再是 “ 威胁”了,之前的均 衡也将被剔除出去,而 ( 放弃,抵抗)是唯一的子博弈精炼纳什均衡。也就是 说, 精炼均衡是剔除 掉不可置信威胁的 纳什均衡. 3 .不完全信息静态博弈:贝叶斯纳 什均衡 贝叶斯纳什均衡借用了 概率论的知识,它是纳什均衡在不完全信息博弈中 的扩展。 在不完全信息静态博弈中,参与人同时行动,参与人的行动不能被其 他的参与人观察到,每一个博弈方仅知道其他博弈方类型的概率分布,根据给 定类型的 概率分布, 参与人推测其他参与人的策略选择, 从而做出自己的行动, 最大化自己的收益。贝叶斯纳什均衡是这样的战略组合:“ 给定自己的类型和 别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是 说, 没 有 人 有 积极 性 选择 其 他战 略. ”。 贝 叶 斯 纳 什 均 衡 常 被 应 用于 经 济 领 域 的招标或拍卖. 4 .不完全信息动态博弈: 精炼贝叶斯均衡 精炼贝叶斯均衡与贝叶斯均衡的区别是,前者在于参与人可以 观察到先行 动方的战略, 然后修正自己 对该行为人的原有的信念 ( 类型主观概率分布), 并调整自己的战略。 参与人调整战略的过程也是运用贝叶斯规则的过程。为了 说清楚这个概念,我们简单介绍一下贝叶斯规则。贝叶斯是概率统计学家,贝 叶斯规则是根据他的 名字命名的 一种概率统计方法, 它被用来修正主观概率分 布。例如,在市场进入博弈中,甲 ( 进入者)不知道乙 ( 打击者)的类型 ( 打 击成本耗费的高低) , 但他知道乙 所属各种类型的 概率分布,甲 根据乙 所属类 型的分布计算甲的打击概率。当甲真的进入市场时,乙真的打击了,那么甲 就 会重新修订自 己的认识,他认为甲 是低成本耗费类型的 概率提高了。通过一次 次的修正,甲也不断的调整自 己的原有信念。 介绍了贝叶斯规则,我们接着介绍精炼贝叶斯规则。 精炼贝叶斯规则也是 参与人战略和信念的 一种结合, 精炼贝叶斯规则使参与人假定对手的 选择是均 衡战略, 即给定参与人对其他参与人所属类型的信念 后, 参与 人根据贝叶 斯规 则观察计算出自己行为的收益,实施行动,并认为这种行动是最优战略。在精 。张维迎, 博弈论与 信息经济学. 上海:上海人民出 版社,1 9 9 6 年s 月第一 版第3 0 页 第一章 博弈论和博弈逻辑 炼贝叶斯均衡中,最优战略相对于信念而言,因此信念就显得尤为重要。 第二节 博弈逻辑 博弈逻辑是与博弈论相交叉的 一个新的 研究领域。尽管博弈论的 研究已 成 果显著,但博弈逻辑的研究尚处于探索阶段。尽管如此,博弈逻辑在运用形式 化手段分析博弈现象中存在着独特优势,因此,越来越多的学者开始参与到该 理论的研究中 来,其中有些学者为博弈逻辑的发展做出了 重要贡献。 1 . 2 . 1逻辑和博弈的关系 博弈逻辑与博弈论密不可分。 博弈论中 蕴含着丰富的 博弈逻辑, 而博弈逻 辑的 研究也脱离不了 博弈论的 发展。 博弈论是一门决策学科, 它研究各种博弈 问题,寻求各博弈方合理的策略选择和得益结果。博弈论以数学的方法和逻辑 技术为主要手段,考虑各种社会力量相互作用的方式和影响。 在博弈论中,人 类的 所有活 动, 只要是互动行为均可以 看成是博弈行动。 博弈方在博弈中如何 行动、如何选择自己的策略,都是经过一番推理后采取的。 博弈论的发展己相对成熟并被广泛地应用于企业管理、国际关系、国际贸 易、 税收等各个领域,相关方向 的 论著也陆续发表。 例如张维迎 博弈论与信 息经济学;张守一 现代经济对策论等。对博弈论的 研究也促进了博弈逻 辑的发展,虽然有关博弈逻辑的论著还鲜有出版, 但相关领域的学术论文己开 始陆续出现,在此不再做一一介绍。 逻辑和博弈的关系可以 从两个角度考虑:一是逻辑中 有一些概念本身就具 有博弈的 性 质和结构, 从某种 意义上说, 这可以 看作是逻辑所具 有的 博弈属性; 二是逻辑的 技术结果如何应用于对于很多有趣的博弈现象的研究。 对于第一个 方向,例如我们常见的论证就可以看作是一种博弈。由 证实者和证伪者参加: 证实 者 认 为 某 个 命 题p 是 真 的 , 而 证 伪 者 则 要 对此 进 行 反 驳。 在2 0 世 纪, 出 现 了很多 逻辑博弈, 例如 “ 赋值博弈”。 它最初由 辛迪卡在1 9 6 0 年提出, 其主要 思想是把一阶公式的 赋值看作是由 证实者 和证伪者参加的博弈。 第二个方向, 我们探讨逻辑技术是如何应用到 对博弈的 分析当中, 例如,借助动态模态逻辑 公式、形式推理等手段描述博弈模型,分析博弈现象。 1 . 2 . 2博弈逻辑的概念和内 容 第一章 博弈论和博弈逻辑 不同的学者对博弈逻辑概念有不同的阐述,有的学者认为, “ 博弈逻辑是 研究理性的行动者或参与者在互动的过程中 如何选择策略或如何做出行动的逻 辑” 。 还有的 学 者 把 博弈逻 辑看作动态 逻 辑的引申 , 如帕 里克( p a r i k h ) ; 另 外有些学者把博 弈论与数理逻辑联系起来 构建新的博弈系统, 如金子守;国内 的潘 天群更 加关 注用 推理 分析 博弈 现象中 的问 题。 博弈 逻辑的 英文为“ g a m e l o g i c .日 常 生 活中的 游戏都 有一个 共同 点, 那就 是策略 在其中 起着重要的 作 用,博弈逻辑就是研究策略的逻辑。博弈逻辑也存在两个基本假定:第一,博 弈参与人是理性的,即参与人总是寻求自 己 的 利益最大化; 第二,博弈参与人 的利益不仅取决于自 己的行动,同时取决 于 他人的 行动。 博弈逻辑中 所研究的博弈,主要由 博弈参与人、策略、得益或支付函数等 基本要素组成。博弈中的参与人也可称为“ 博弈方”,参与人可以是个人也可 以是团体。有的学者在分析博弈现象时, 把自 然也看成博弈方,例如在风险博 弈和不确定型 个人博弈中, 可以 把自 然作为 单独的 博弈方进行分析。 策略或行 为指参与人在互动过程中 所做出的行动。 在博弈中,可供选择的策略或行为的 数量存在差异, 策略或行为的集合被用于博弈的整体分析。得益或支付函数对 应于参与人的决策选择。在博弈中,每一个参与人根据其他参与人的策略选择, 做出自己的行动,得益就是与此对应的 所得或所失, 这种得失量化为数值就被 称为参与人的 “ 得益”。 博弈逻辑也存在不同的 类型。根据博弈方的数量不同,可以将博弈逻辑划 分为一人博弈逻辑,二人博弈逻辑和多人博弈逻辑。有的学者认为应将博弈逻 辑划分为二人博弈逻辑和多人博弈逻辑: 因为在一人博弈逻辑中也有自 然的参 与,自 然可以 看作一个博弈方,另外一些学者则持相反的观点, 他们认为自 然 作为博弈方的单人博弈同二人博弈有明 显的区别,应该将一人博弈逻辑作为单 独的博弈逻辑类型纳入进博弈逻辑体系。 1 . 一人博弈逻辑。一人博弈逻辑指人和自 然分别为博弈方的逻辑,即人在 改造自 然的过程中所采取的策略与所得所失构成集合的博弈,包括风险个人博 弈逻辑和不确定型个人博弈逻辑。 在风险 个人博弈逻辑中,参与人通过给自 然 状态分配概率, 确定自 然的类型,计算出 每项行动的得失值,为自己 选取策略。 2 . 二人博 弈逻辑。 二人博弈逻辑指的 是博弈中 的两个参与人在互动的 过程 。 张峰,逻辑 学的新分 支一 博弈逻辑研究现状分 析. 哲学动态, 2 0 0 5 a 第2 期 第一章 博弈论和博弈逻辑 中 选择策略的逻辑。根据博弈中的得益情况,二人博弈逻辑又分为二人零和博 弈逻辑和二人变和博弈逻辑。二人零和博 弈逻辑指博弈方的利益完全相反, 一 方的所得是另一方的所失,即博弈双方得益之和等于零的情况。二人变和博弈 逻辑指,博弈方的利益既存在冲突又存在一致的方面。 3 . 多人博弈逻辑。多人博弈逻辑是指, 三个及三个以 上的 博 弈方的 利益相 互关联,各个博弈方为寻求利益最大化而选择自 己策略的逻辑。 多人博弈逻辑 以 二人博弈逻辑为基础。 我们在进行研究时,往往会根据具体的情况对博弈重新划分。 例如,在某 些多人博弈逻辑中,博弈结构的 类型更与二人博弈相似,我们就会把这种模型 放到二人博弈逻辑中去研究. 在现实中,最初由 三方参与的博弈,由于其中的 两方为了得到更大的利益而采取了 合作, 他们的策略选择是一致的,并且这种 一致性较为稳定,那么我们可以 把合作的 两方看作一个博弈方进行分析。奥曼 曾 经提出 过抗共谋均衡的 概 念 。 , 用以 解决 纳 什均 衡中 博 弈方 单 独改 变策 略的问 题,这就又需要考虑到多个博弈方的利益冲突与得益支付。 1 . 2 . 3博弈逻辑的研究概况 1 . 2 . 3 . 1国外学者的贡献 约翰 范 本 特姆( j o h a n v a n b e n t h e m ) 、 金子 守 和玻 利为 代 表的 学者 对 博 弈 逻 辑的发展做出了许多有益的探索。 约翰 范 本 特姆 ( j o h a n v a n b e n t h e m ) 教 授 对 博弈 论 与 逻辑 学 的 结 合 做出了 引导性的贡献,他是荷兰阿姆斯特丹大学的逻辑学教授,同时是美国斯坦福大 学 人文科学的 博 撒( b o n s a l l ) 教 授。 他曾 创 建 阿姆 斯 特 丹大学的 逻辑、 语言 与 计 算机研究所, 获荷兰政府授予的 斯宾 诺莎奖, 并用该奖金建立了 科研项目 :“ 行 动中的逻辑”。约翰. 范. 本特姆教授从2 0 世纪9 0 年代起开始开设关于 “ 博弈 中的 逻辑”的电 子讲座, 他致力于 在两个方向 上构建逻辑和博弈的结合。 一方 面, 进行 “ 逻辑博弈”的研究。 他认为许多逻辑活动可以 看成是一种博弈,例 如语义赋值、 模型比 较或模型建构等 类似于 “ 逻辑游戏”。这种“ 游戏” 本身 就可以 用基本的逻辑概念建立起博弈选手获胜策略之间的博弈. 另一方面, 进 行 “ 博弈逻辑”的研究。用逻辑体系去研究一般的博弈结构。社会生活中的经 。见a u m a n n . r . t h e o ry o f g a m e s l v 1 9 5 9 . a c c e p ta b l e p o i n t s in g e n e r a l c o o p e r a ti v e n - p e r s o n g a m e s .玩c o n tri b u ti o n s to t h e p ri n cet o n u n i v e rs i t y p r e s s 第一章 博 弈论和博弈逻辑 济竞争、社会合作、 下棋、足球、战争、 对话等都可以 被看作一般的博弈。逻 辑可以 用形式化的语言来描述博弈中的策略均衡,使博弈结构和参与人的思考 机制更精确的 表述。 。 约翰. 范. 本特姆教授认为时态逻辑很有发展前景,他认为时态逻辑的形式 对于描述无限博弈有很强的表达力,但无限博弈由于其结构的复杂性而很少有 人研究。 但是无限博弈逻辑同 有限逻辑一样重要.因为在社会生活中, 持续进 行的 行为并不鲜见,比如囚 徒困 境模型由 于囚徒的合作而构成重复囚 徒困 境模 型。 有限博弈中的推理不足以分析这些问 题, 所以时态逻辑的发展为持续行为 的 研究提供了 理论基础。约翰 范. 本特姆教授还 对现实博弈中的 不完美 信息进 行了 逻辑的分析。他认为,由于不完美信息、参与人有限的计算能力等因素的 存在,使得参与人不断地对其他参与人的理性假定进行修正,从而使原有的均 衡发生变化。 为此, 他在博弈分析中 增加了 有关参与人偏好的 推理, 研究了信 息更新的 情况。 约翰 范. 本特姆教授还结合认知 逻辑研究多主体博弈、结合动 态逻辑和线性逻辑研究重复博弈,并把概率论引入到博弈逻辑中,他为博弈论 与逻辑学的结合做出了重要贡献。 金子守 ( m a m o r a k a n e k o ) 是日 本筑波大学的 教 授, 他在数理逻辑和博 弈论结 合方面做了 开创性的工作。 他建立了 与博弈逻辑密 切相关的公共知识逻辑系统, 并结合模态逻辑来研究博弈逻辑。 金子守 教授认为 博弈论与 数理逻辑密切相关, 他认为博弈论中 有关理性人的假定与数理逻辑的 数学实践理论相关, 博弈方在 博弈中的理性决策和互动行为需要运用逻辑和内 省的能力。 他建构了博弈逻辑 的框架,该框架论述了博弈逻辑在两方面的研究:纳什均衡有关认知公理的 应 用和博 弈 操作的 不可 判定 性 研究 。 。 除 此 之外, 金 子守 教 授还 根 据 模态 逻 辑 系统 的相关原理, 构建了与博弈逻辑密切相关的公共知识博弈逻辑系统,为研究博 弈逻辑做出了努力。 法国学者波利毕业于荷兰阿姆斯特丹大学,并获得博士学位。他侧重于对 非认知逻辑的 研究并建构了联盟逻辑的理论体系. 波利认为,博弈逻辑可以为 博弈论构建精致的博弈模型提供形式化工具,形式化的方法有助于摆脱自 然语 言的歧义性,可以为博弈论分析提供精确的工具。波利还把博弈逻辑运用于关 。见j . v a n b e n t h e m . l o g i c a n d g a m e s . e l e c h o n i c l e c t n t c n o t e s . i l l c a m s ter d a m这里采用序数计 数法。 - 3 , - 2 , 一 l , 。 分 别 表示 得 益 大小的 相 对值 或 好 坏的 等级: 最差, 其 次, 再次, 较好。 如果双方均选择坦白 策略, 他们将各被判刑5 年,记作 ( - 3 ,一 3 );而如果双反均抵赖,因警察找不到证明 他们违法的充分证据,只能以 判刑 i 年进行惩戒, 记作( -1 , -1 ) 。 这两个小偷是如何决策的呢?图i 列出了“ 囚 第二章 逻辑学在博弈论中的应用 徒困境”的 支付矩阵 。 :( 每一方格中, 第一个 数是甲的得 益, 第二个数则是乙 的得益)。 表2 . 1 囚徒困 境得益支付 表 令又、 抵赖坦白 抵赖- 1 ,- 1一,0 坦 白0 . - 3一,- 3 “ 囚徒困 境”是一个被广泛谈论和研究的 双人博弈模型。在这个博弈模型 中,小偷的最终结果是当场释放还是被判刑 ( 1 0 年、 5 年、1 年) ,不仅取决于 该囚徒的决定,而且取决于另一个小偷的决定。 在这个例子中,每个小偷都将作如下的推理: 如果对方抵赖, 我抵赖的结果是: 得益一 1 , 坦白 的结果是: 得益0 ; 0 比一1 要好,所以,我应当选择坦白。 如果对方坦白,我抵赖的结果是:得益一 5 ,坦白的结果是:得益一3 ,- 3 比一5 要好, 所以我应当选择坦白。 所以, 无论对方是采取坦白还是抵赖,我最 好的策略是坦白。 无论是甲 还是乙, 他们均推理得出最好的策略是坦白,双方均选择坦白 策 略,则点 ( - 3 ,-3 )成为“ 纳什均衡” 点。这是一个演绎推理的过程,其形 式 较为 简单。 运 用形式推 理, 我 们可以 用p 表示 抵 赖, 用4 表 示得 益小的 结 果, 根据效用最大化的原则,每一个参与人都不愿意选取得益小的 策略, 那么上述 两个语句都可以 表述为下面的推理形式: ( 伽 心 a司心- 上述推理形式是把前面的推理作了 一种等价转换,即:如果抵赖,那么得 益就会小,没有人愿意得益小, 所以 没有人会选择抵赖。 一旦人们处于 “ 囚徒困境”,这一 “ 惟一的纳什均衡点” 便构成了参与人 的 “ 公共知识”,于是博弈双方均会选择坦白。 但是最终的结果对双方来说却 并不是最优的。 在经济生活中,“ 囚徒困境”的例子具有相当的普遍性,它在市场竞争、 。见王则柯, 李杰博弈论教程. 北京; 中国 人民 大学出 版社, 2 0 0 4 年”月第一版第2 6 1 页 第二章 逻辑学在博弈论中的应用 人口 控制、环境保护、资源开发等方面都屡见不鲜。例如,前几年空调市场上 的空调价格战就是一个例子。如果一个空 调厂商降价, 那么 其它厂商为了自 身 的空调能够卖出去,也会降 价。所以当整个空调市场的价格降下去后,利益受 损的是所有相关企业。如果所有的空调企业达成价格联盟, 那么价格会维持在 一个让大家都受益的点上, 但这并不是稳定的结果,因为单方降 价总是会获得 较大的利益, 所以总会有博弈方想要违背联盟,选择单方降 价。 在经过相互合 作及非合作性不断进行正负博弈之后,博弈的结果还是纳什均衡:各相关企业 均选择降价。为此,为了保护企业的 利益,各方需要在沟通的基础上进行合作, 必要的时候需要政府政策的调节。 2 . 1 . 2归纳推理与 “ 酒吧问题万 “ 酒 吧 问 题”( b a r p r o b le m ) 是 一 个 重 复 性 的 典 型 动 态 博 弈 问 淤.“ 酒 吧 问 题” 是美国 斯坦福大学经济学教授阿 瑟 提出 的。 1 9 9 4 年, 在 美国 经济评论 的题为 归纳论证和有限 理性一文中, 阿瑟提出了“ 酒吧问 题” 博弈, 后来 他又在1 9 9 9 年的著名的 科学 杂志 上题为 复杂性和经济一 文中 重新阐 述 了 这个博 弈,目 的 是为了 阐 述 其经济 学 观点: 经济主 体 或 行动 者( a g e n t s ) 的 经 济行为是建立在归纳基础上而非演绎的。 “ 酒吧问题”博弈的具体内容是:有一群人,比如总共有 1 0 0人,每个周 末均要做出决策:是去附近的一个酒吧还是呆在家里,原因是该酒吧的座位有 限。 我们假定该酒吧的 座位是6 0 个, 如果 有一天去酒吧的 人数少于6 0 , 并且某 人在这一天也去了,那么他的决定就是正确的;或者, 如果那一天去酒吧的人 数超过了 6 0 , 而某人没有去,那么他的决定也是正确的。否则, 其决定是错误 的。 我们在这里假定这群人之间不存在信息交流。每个人会对去酒吧的 人数进 行推理预测而做出相应的决定。 假如他预测去酒吧的人数少于 6 0 , 他将做出去 酒吧的决定,否则将做出相反的决定。那么他们是如何做出预测呢? 我们假定 每个决策者所获得的信息只是以 往去酒吧的人数,每个决策者只能根据以 往去 酒吧的人数归纳出下次去酒吧的人数,然后决定自己是去还是不去. 我们假定前面几周去酒吧的人数如下: 。瞿麦生,寻求超越:点击经济逻辑香港: 香港东 西方文化事 业公司出 版, 2 0 1”年, 第”, 7 吕 页 第二章 逻辑学在博弈论中的 应用 4 4 , 7 6 , 2 3 , 7 7 , 4 5 , 6 6 , 7 8 , 2 2 0 不同的决策者可根据以 往的情况 “ 归纳”出某个规律,根据这个规律做出 预测。例如某人预测: 下次去的人数将是前几次去的人数的平均数 通过计算机模拟试验,阿瑟总结出 一个结 论:当 不同的行动者根据过去的 历史数据而做出决策时,去酒吧的人数没有一个固定的规律。 但一段时间后, 却形成了这样一个比 例: 即这个人群中“ 去” 与“ 不去” 的人数比接近6 0 : 4 0 . 尽管每一个决策者不会总是固定的去或不去,但这个比 例固定不变。 这就是著 名的 “ 酒吧问 题”。在这个问题中,阿瑟所要表明的是:“ 正确”预测是没有 的,每个人只能根据以 往历史归纳的做出 预测, 而无其他办法。因为每个人预 测信息的来源相同, 人们要做出正确的预测,就要知道其他人如何做出预测。 例如,如果许多 人均归 纳推理去酒吧的 人数多 于6 0 , 他们就不会去酒吧, 此时 去酒吧的人数就会少于 6 0 ,则他们的预测错了:如果许多人归纳得出去酒吧的 人数少于6 0 ,这些人会选择去酒吧, 此时去酒吧的人数就会多于6 0 ,他们的预 测也错了。因此,对于下次去酒吧的人数,参与人无法做出肯定的预测。 所以 这是一个归纳的 过程, 博弈参与人的推理不是必然的。 与 “ 酒吧问 题”相似的例子是寡头垄断厂商间的博弈,如果一个行业被多 个寡头厂商 所垄 断, 他 们 之间的 竞争也 是一 个重复 性的 动 态 博 弈 。 。 寡头 厂商 要 确定自己 最优的生产产量, 就必须知道其他寡头厂商的 产量。 但他们无法知 道 当 前其他寡头厂商是怎样确定自 己的 产量的. 每个寡头厂商只能根据过去其他 企业的生产产量来预测他们下次的策略选择,从而确定自己的最优产量。 这个 产量对于所有的寡头厂商并不一定是最优的。所以 所有参与博弈的寡头厂商要 不断地调整自 己的策略,已 达到自 己生产产量的 最优。 这同 样是一个重复动态 博弈的过程。 2 . 1 . 3辩证逻辑思想与 “ 胆小鬼对局” 辩证逻辑不像数学那样要求严格与精确,前者更注重心理现象的复杂性, 它运用分析与综合的方法为种种矛盾的心理现
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 早餐店品牌授权与承包合同
- 高端家具定制诚意金支付合同标准范本
- 2025【标准范本】云服务器租用合同
- 餐饮企业员工劳动合同范本(含员工培训补贴协议)
- 美食广场餐饮经营管理权委托合同
- 2025年的房屋租赁版合同
- 2025企业标识及产品商标设计委托合同
- 2025关于个人房产抵押贷款合同范本模板
- 2025年最的设备采购合同趋势分析
- c语言期末考试题及答案陕师大
- 2025汽车销售合同简单版范本
- 《中级财务会计》第二版 课件 第4章 固定资产
- 2024年青海大学附属医院招聘笔试真题
- 2024年四川省南充市八年级(初二会考)中考地理+生物真题试卷
- 数字化转型背景下制造业产业链协同创新机制研究
- 第14课 光荣的少先队 课件-2024-2025学年道德与法治一年级下册统编版
- 2025年北京市海淀区高三二模-数学+答案
- 安全生产月活动查找身边安全隐患人人讲安全个个会应急课件
- 湖南炎德·英才大联考长郡中学2025届模拟试卷(一)政治+答案
- 公司主体变更劳动合同补充协议7篇
- DB33T 1376-2024乡镇(街道)应急消防管理站建设与运行规范
评论
0/150
提交评论