博弈行为中的演绎与归纳推理及其问题_第1页
博弈行为中的演绎与归纳推理及其问题_第2页
博弈行为中的演绎与归纳推理及其问题_第3页
博弈行为中的演绎与归纳推理及其问题_第4页
博弈行为中的演绎与归纳推理及其问题_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、博弈行为中的演绎与归纳推理及其问题【内容提要】博弈逻辑(gamelogic)是随着博弈论的迅 速发展而形成的一个新的学科,它是一行动逻辑。博弈逻辑 研究的是理性的人在互动行动中即博弈中的推理问题。在博 弈行为中存在演绎推理和归纳推理。正如在传统逻辑中存在 逻辑悖论一样,博弈逻辑中同样存在悖论或者“问题”。博 弈参与人运用演绎推理时存在逆向归纳法悖论,而运用归纳 推理时存在归纳是否有效的问题。【关键词】博弈逻辑/演绎推理与归纳推理/逆向归纳法 悖论/归纳推理的合理性【正文】1 一种新的逻辑:博弈逻辑博弈论研究人类活动中的互动行为,在经济学中得到广 泛的运用。在博弈论中,人类的所有活动,只要是互动

2、行为, 均可以看成是博弈行动。在此基础上,一种新的逻辑“博弈 逻辑”(gam elogic)得以兴起,它是一种特殊的行动逻辑 (actionlogic)o博弈论研究多个理性人在互动过程中如何选择自己的 策略。理性的人是使自己的目标或得益最大化的人,在经济 活动中理性的人即是使经济目标最大化的人_经济人。理 性人如何使得自己的“得益”最大?关键是“推理”。博弈逻辑中存在着两种研究纲领。第一种研究纲领是结合模态逻辑系统,建立新的博弈逻辑系统。在这方日本筑波大学的金子守(m amorukaneko)教授是这方面的权威。近 几年,他在国际刊物上发表了大量有关博弈逻辑方面的论文 他不仅在模态逻辑系统的基

3、础上建立了多个博弈逻辑 (gamelogic)系统,而且,建立了与博弈逻辑密切相关的公 共知识逻辑(commonknowledgel ogic)系统。第二种研究纲领 是研究博弈活动中的实际“推理问题”,许多博弈论专家在 此方面做了大量的工作。对博弈逻辑做整体的分析不是这里 的任务,本文的目的是简要论述博弈活动中的推理问题,属 于第二种研究纲领。根据博弈论,人们在实际的博弈活动中涉及到两种推理 演绎推理与归纳推理。然而,正如传统逻辑中存在着悖论, 在博弈逻辑中同样存在着悖论。2博弈逻辑中的演绎推理与归纳推理博弈论有两个假定:第一,博弈参与人是理性的;第二, 博弈参与人的得益不仅取决于自己的行动,

4、同时取决于其他 人的行动。每个理性的参与人在策略选取,使自己得益最大时,要 充分考虑局中其他人的策略选取。同时,每个参与人知道其 他参与人与他有同样的想法。在博弈中,“每个人是理性的” 是公共知识(commonknowledge),它是每个参与人进行策略 选择或者推理的前提。博弈参与人的推理表现在他对策略的选取上。决定参与 人的策略选取一方面是博弈结构,另一方面是其他参与人的 策略。博弈结构是不同策略组合下的支付函数或者得益函数 按照博弈的次序来分,博弈分动态与静态博弈;按照信息的 分布来分,博弈分为完全信息与不完全信息博弈。在不同的 博弈结构下,参与人所用的推理不同。根据参与人推理前提与结论

5、之间的关系,在博弈中推理 分为演绎推理和归纳推理。我们来分析博弈参与人是如何运 用演绎推理与归纳推理的。(1) 静态博弈的演绎推理让我们来分析典型的“囚徙博 弈”的例子。警察抓到了两个共同偷窃的小偷,对他们进行单独关押 囚徒面临这样的“政策”:如果一方“招认”,供出自己与对 方以前所做违法之事,而对方“不招认”,“招认”方将无罪 释放,对方会被判重刑10年;如果双方都与警方合作,选 择“招认”策略,各被判刑5年;而如果双方均“不招认”, 因警察找不到其他证明他们以前违法的证据,只能对他们的 小偷行为进行惩戒,各判刑1年。这两个小偷如何做出选择?囚徒困境的支付矩阵为:附图“囚徒困境”是一个被广泛

6、谈论和研究的博弈。在这个 囚徒困境中,小偷的最终“得益”是当场释放还是被判刑,不仅取决于该囚徒的决定,而且取决于另外的小偷的决定。 在这个例子中,每个小偷都作这样的推理:如果对方“招认”,我“不招认”的结果是判刑10年,“招认”的结果是判 刑5年;“招认”的结果好于“不招认”的结果 此时,我应当选择“招认”如果对方“不招认”,我“不招认"的结果是判刑1年,“招认”的结果是当场 释放;当场释放比判刑1年要好 此时,我应当选择“招认”因此,无论对方采取“招认”还是“不招认”,我最好 的策略是“招认”。无论是甲,还是乙,他们均推理得出最好的策略是“招 认”。双方均招认是“纳什均衡” 一一这

7、是一个稳定的结果。在囚徙博弈中存在惟一的纳什均衡点,即两个囚犯均选 择“招认”策略。一旦人们处于囚徒困境,“囚徒困境有惟 一的纳什均衡点”构成参与人的“公共知识”,双方均毫不 犹豫地选择“招认”。这是静态博弈的例子。在这个推理过程中,双方的推理均是演绎的。(2) 动态博弈中的演绎推理动态博弈过程如同静态博弈, 也是一个推理过程。我们来看一下动态博弈中人们是如何进 行演绎推理的。先看一个例子。有两个企业a、b。企业b独占一个行业的市场,企业a 要进入这个领域,想与企业b瓜分该市场。企业b不愿意a 与它一起瓜分该市场,它发出“威胁”:“如果你进入,我将 打击”。当然,对b进行打击,双方均有损失。一

8、一这是双 方的“公共知识”。该博弈用博弈树表示,即为:中的数字表明:如果a “不进入”,a的得益为0, b 的得益为10;如果a “进入”,b “不打击”的话,a与b平 分10,各得到5,而如果“打击”的话,a的收益为-3, b 的收益为4。这个博弈的结果是,a选择“进入”,b选择“不打击”。 一一它们构成“子博弈精炼纳什均衡”。对于这个博弈,b的 威胁“如果a进入,我将打击”是“不可信的”威胁。在这个动态博弈中,理性的参与人所用的推理方法被称 为“逆向归纳法”又称“倒推法” (backwar dinduction)。 虽然被称为逆向归纳法,但它是完全归纳法,即它是演绎性 的。逆向归纳法是求解

9、动态博弈的方法。它是演绎性的,因 为它的推理是必然的。在上面的例子,我们看到,企业a作 这样的推理:假定我(a)进入,b如果“打击”,它的得益为4; “不打 击”的得益为5。b是理性人。它将选择“不打击”。既然我 预测到b将“不打击”,我在“进入”和“不进入”间进行 选择时,“进入”的得益为5, “不进入”的得益为0,我作 为理性人,将选择“进入”。当a选择“进入”策略时,b的推理是:如果采取“打击”,我的得益为4;“不打击”的得益为5, 选择“不打击”是理性的选择。(3) 静态博弈中的归纳推理博弈中参与人运用归纳推 理,原因大体有两个:一是由于信息不完全;二是由于博弈 是竞争性的_零和博弈。

10、不完全信息博弈,又称贝叶斯博弈,是博弈论研究的重 要内容。不完全信息博弈是指博弈参与人的得益函数不是公 共知识时的博弈。此时,虽然博弈参与人是理性的构成公共 知识。但是,总存在某个策略组合下的得益不是公共知识。 这样,即使一个博弈存在惟一的纳什均衡,由于这个均衡不 是公共知识,这样的均衡不能够在一次博弈中迗到。而所谓 竞争性的博弈是指零和博弈,在一个博弈中如果只有两个参 与人,其中一方所得等于另外一方所失,此时,双方不可能 形成一个大家均接受而不会改变的纯策略对。在这样的过程中,博弈参与人如何确定自己的策略选取呢?他只能根据其他参与人“历史”中的策略“归纳地”得 出对方此时的策略,从而决定自己

11、的策略。一个例子就是, 三国演义一书中“空城计”博弈。诸葛亮误用马谡,致使街亭失守。孔明在西城中,准备 启程。等他安排停当,司马懿引大军15万蜂拥而来。当时 孔明身边别无大将,只有一班文官,五千军士,已分一半先 运粮草去了,只剩二千五百军在城中。众官听到这个消息, 尽皆失色。孔明登城望之,果然尘土冲天,魏兵分两路杀来。 孔明传令众将,旌旗竟皆藏匿,诸军各收城铺。打开城门, 每一门用上二十军士,扮作百姓,洒扫街道。而孔明披鹤髦, 戴纶巾,引二小童,携琴一张,于城上敌楼前,凭栏而坐, 焚香操琴。马司懿来到城下,见到诸葛亮焚香操琴,笑容可 掬。司马懿吓坏了,立即叫后军作前军,前军作后军,急速 退去。

12、司马懿之子司马昭问:莫非诸葛亮无军,故作此态, 父亲何故退兵?司马懿说:“亮平生谨慎,不曾弄险,今大 开城门,必有埋伏。我兵若进,中其计也。”孔明见魏军退 去,抚掌而笑,众官无不骇然。诸葛亮说:司马懿料吾平生 谨慎,不曾弄险,见如此模样,疑有伏兵,所以退去。吾非 行险,盖因不得已而用之。我们兵只有二千五百,若弃城而 去,必为之所擒。我们可以用如下的博弈矩阵来表示这个博弈: 附图这个博弈中,“进攻”是司马懿的“占优策略”。该博弈 有两个纳什均衡,即:;。然而,司马懿不知道自己和对方在 不同行动策略下的支付,而诸葛亮知道。他们对博弈结构的 知识是不对称的:诸葛亮拥有比司马懿较多的知识。当然这 种知

13、识的不对称完全是诸葛亮“制造出来的”。司马懿是如何推理的呢?司马懿的推理是“归纳的”。 司马懿说:“亮平生谨慎,不曾弄险。今大开城门,必有埋 伏。我兵若进,中其计也。”在司马懿看来,诸葛亮一生都是 谨慎的,既然诸葛亮一生没有冒险,此次也肯定不会冒险, 诸葛亮有埋伏。司马懿在“攻城”和“撤退”之间作出“撤 退”的选择。在这里,司马懿归纳作出了一个错误的策略选择。尽管 如此,我们不能说司马懿是不理性的。司马懿作出错误的策 略选取,是由于不完全信息造成的。在孔明一司马懿的博弈 中,孔明做出的空城假象,目的就是让司马懿感到“攻城” 有较大的失败的可能。如果我们用概率论的术语来说,诸葛 亮的做法是加大司

14、马懿对进攻失败的主观概率。此时,在司 马懿看来,“攻城”失败的可能性较大,而“撤退”的期望 效用大于“攻城”的期望效用。即:司马懿认为,“攻城” 的期望效用低于“撤退”的效用。诸葛亮惟有通过这个办法, 才能让司马懿退兵。(4) 动态博弈中的归纳推理下面我们来分析“酒吧问题”中人们是如何运用归纳推理的。“酒吧问题”是一个重复性 的动态博弈。“酒吧问题” (barproblem)是美国人阿瑟()提出的。阿 瑟是斯坦福大学经济学教授,同时是美国著名的圣塔菲研究 所(santafelnst itute)研究人员。他不满意经济学中人们所 认为的,经济主体或行动者(a gents)的行动是建立在演绎推 理

15、基础之上的观点。他认为人们的行动是基于归纳的基础之 上的。“酒吧问题”就是阿瑟为了说明他的这个观点而提出 的。在1994年美国经济评论的题为归纳论证和有界理 性一文中阿瑟提出了 “酒吧问题”博弈,后来在1999年 的著名的科学杂志上题为复杂性和经济一文又阐述 了这个博弈。酒吧问题是指这样一个博弈:有一群人,比如总共有100 人,每个周末均要决定,是去附近的一个酒吧活动还是呆在 家里。该酒吧的容量是有限的,比如空间是有限的,或者座 位是有限的。我们假定酒吧的容量是6 0人,或者说座位是 60个。如果去酒吧的人数少于60,并且他也去了,他的决定 就是正确的;或者,如果去酒吧的人超过60人,而他没有

16、 去_当然这只有事后才知道,他的决定也是正确的。否则, 其决定是错误的。这里,我们假定他们之间不存在信息交流。我们看到, 每个人根据对总的去酒吧人数的预测,而决定去酒吧与否。 如果他预测去酒吧的人数超过60人,他将做出“不去酒吧” 的决定,如果其预测不超过60人,他将做出“去酒吧”的 决定。他们是如何做出预测呢?每个参与者或决策者面临的信息只是以前去酒吧的人 数,每个参与者只能根据以前去的人数的信息“归纳”地得 出一个规律。根据这个规律,参与人预测下次去酒吧的人数, 从而决定自己去还是不去。这是一典型的动态博弈问题。假定,前面几周去酒吧的 人数如下:44,76,2 3,77,45,66,78,

17、22不同的行动者可根据过去的历史“归纳”出某个规律, 从而做出预测。例如预测:下次的人数将是前4周的平均数(53);两点的周期环(78);与前面隔一周的相同(78)通过计算机的模型实验,阿瑟得出一个有意思的结果。 当不同的行动者根据过去的历史而进行行动时,去酒吧的人 数没有一个可预测的固定的规律。然而有这样一个“规律”: 经过一段时间以后,“平均去酒吧的人数总是趋于60”。即, 经过一段时间,这个系统中的人群“去”与“不去”的人数 比是60:40。尽管每个人不会固定地属于“去”或“不去”的人群,但这个系统的这个比例是不变的。阿瑟说,预测者 自组织到一个均衡类型或生态均衡系统。这1 00人构成的

18、系统是一个混沌系统。这就是酒吧问题。在这个问题中,每个参与人根据历史 数据进行归纳并进行预测,然而,对于下次去酒吧的确定的 人数,参与人是无法作出肯定的预测。例如,有趣的是,如 果许多人均预测去酒吧的人数多于60,而决定不去酒吧,此 时酒吧的人数将少于60。他们的预测则错了。如果许多人预 测去酒吧的人数少于60,这些人去了酒吧,此时去酒吧的人 数多过60。他们的预测也错了。附因此人们要作出“正确的”预测,他要知道其他人如何 作出预测的。但是在这个问题中每个人的预测的信息来源是 一样的,即都是过去的去酒吧的人数。每个人不知道别人如 何作出预测的信息。因此,所谓“正确”预测是没有的。每 个人只能根

19、据以往历史“归纳地”作出预测,而无其他办法。 阿瑟教授提出这个问题,是强调在实际中归纳推理与行动之 间的实际关联。利用归纳法的另外的例子是寡头垄断厂商之间的博弈。 如果一个行业被多个寡头厂商所垄断,他们之间的竞争也是 一个重复性的动态博弈。寡头厂商要确定自己最优的生产产 量,但它们无法知道其他企业的产量。每个企业只能根据过 去其他企业的生产产量来“推测”它们将要生产的产量,从 而确定自己的最优产量。这个产量是最优的?不一定。如果 是,它们就不调整自己的产量,如果不是,他们还要不断地 调整。这同样是一个“归纳”和“调整”的过程。3演绎推理的一个悖论:逆向归纳法悖论 逆向归纲法是演绎推理,它是求解

20、完全且完美信息下的 动态博弈的方法。逆向归纳法推理严密。然而,将看到,逆 向归纳法面临着致命的缺陷:悖论。让我们来看一个候婚博弈(centipedega me)的例子。蜈蚣博弈是由罗森塞尔(rosenthal)提出的。它是指这 样一个博弈:两个参与者a、b轮流进行策略选择:可供选 择的策略有“合作”和“不合作”两种。假定a先选,然后 是b,接着是a,如此交替进行。a、b之间的博弈次数为一 有限次,比如198次。假定这个博弈的各自的支付给定如下: 附蜈蚣博弈上图中,c表示“合作策略”,nc表示“不合作”。在这个博弈中的参与人a、b是如何进行策略选择的? 这个博弈形状像一只蜈蚣,而被命名成蜈蚣博弈

21、。这个 博弈奇特之处是:当a决策时,他考虑博弈的最后一步即第 198步:b在“合作”和“不合作”之间作出选择时,因“合 作”给b带来io 0的收益,而“不合作”带来101的收益, 根据理性人的假定,b会选择“不合作”。但是,要经过第 197步才到第198步,在197步,a考虑到b在第198步时会选择“不合作” _此时a的收益是98,小于b合作时的 100那么在第197步时,他的最优策略是“不合作” 一因为“不合作”的收益99大于“合作”的收益98。 如此推论下去。最后的结论是:在第一步a将选择“不合作”, 此时各自的收益为1!远远小于大家都采取“合作”策略时 的收益:a:101,b:99o根据

22、逆向归纳法,结果是令人悲伤的。从逻辑推理来看, 逆向归纳法是严密的。但结论是违反直觉的。直觉告诉我们, 一开始就停止的策略a、b均只能获取1,而采取合作性策略 有可能均获取100,当然a开始采取合作性策略有可能获 得0,但1或者0与100相比实在是太小了。直觉告我们采 取“合作”策略是好的。而从逻辑的角度看,a 开始应选 择“不合作”的策略。是逆向归纳法错了,还是直觉错了?似乎逆向归纳法不正确。然而,我们会发现,即使双方 开始能走向合作,即双方均采取合作策略,但这种合作不会 坚持到最后一步。理性的人出于自身利益的考虑,肯定在某 一步采取不合作策略。逆向归纳法肯定在某一步要起作用。 只要逆向归纳

23、法起作用,合作便不能进行下去。因此,我们不能怀疑逆向归纳法的合理性,它的推理过 程严密,符合逻辑。然而如果我们用逆向归纳法来求解蜈蚣 博弈,则博弈结果是我们不能接受的。许多博弈论专家认为,蜈蚣博弈所反映的不是悖论,逆 向归纳法作为求解动态博弈的方法,是有效的。蜈蚣博弈的 结果尽管不是我们所期望的,但它是均衡结果。这个均衡结果反映的是多主体下个体理性的局限。这是理性的困境。4博弈行为中归纳推理的“合理性”问题休谟告诉我们,人们使用归纳法寻求自然现象之间的 果联系的这个过程,只不过是人的心理上的习惯联想。我们 有什么其他理由认为,我们所认为的事物之间的所谓因果联 系是必然的?这就是休谟问题。休谟质

24、疑的是认识中的归纳 法的合理性问题。在博弈行为中,归纳推理同样存在是否合 理的问题。我们用归纳法对自然进行认识,并根据我们归纳的结果 做出相应的行动。如:我们看到天空中乌云密布,风渐渐地 大了,我们想,天可能要下雨了,我们要带伞。之所以有这 样的认识,是因为以往的经验“告诉”我们:当乌云增多并 刮大风时,意味着要下大雨。即,当我们面对自然现象时, 我们根据过去的经验来归纳并采取相应的行动。在认识论中,我们知道,归纳推理所得出的结论是或然 的。但是在认识中我们存在着这样一个信念:全称命题要么 真、要么假,并且它是超越时间和空间的。我们用归纳法可 以不断地接近真理。在互动的博弈中,理性的人运用归纳

25、法 进行推理时,归纳法是否有效?它的合理性在哪里?在“酒吧问题”中,我们凭什么说,以前去酒吧的人数 与下次去酒吧的人数之间有联系呢?当某人进行预测时,只 有当他知道其他人预测的方法,他才能根据以往的人数和其 他人的预测方法来“正确地”预测下次去酒吧的人数。这样 的预测才能是“有根据的”或者说“有理由的”。但我们除 了能知道以往去酒吧的人数外,我们无法知道其他人的预测 的方法。即使我们知道了其他人的预测方法,但当其他人知 道了我们将根据他们的预测方法来预测时,他们将改变他们 的预测方法,从而使我们的预测归于无效。在酒吧问题上,我们通过归纳法无法准确预测下次去酒 吧的人数,那么我们通过对过去的历史

26、能够知道什么?或者, 在更一般的意义上说,在博弈行动中,人们通过归纳法能够 学习到什么东西?这就是归纳法的合理性问题。我们发现,在博弈中归纳法的有效性体现在参与人对博 弈均衡的认识。即通过归纳性的学习,博弈参与人对该博弈 均衡获得了认识,对其他参与人的均衡策略也获得了认识。任何一个博弈均存在均衡,这也是诺贝尔经济学奖获得 者约翰纳什的贡献,被称为纳什均衡存在定理。然而,这 里的均衡有两类:一类是纯策略均衡,另一类混合策略均衡。 归纳法的作用就是对这两种均衡的认识。当一个博弈存在惟一一个纯策略纳什均衡点时,并且该 博弈是完全信息博弈,参与人在一次博弈中就可达到均衡点。但当博弈不是完全信息博弈时,博弈参与人通过多次博弈,“了解”其他参与人不同策略组合下的得益,一旦策略组合 达到了纳什均衡,博弈方均无意改变策略。因为此时,这一 点是博弈各方均能够接受的点。在这样的过程中,参与人通 过归纳法认识到该策略均衡,同时认识到其他参与人的策略 选择。如果不存在纯策略均衡,而只存在混合策略均衡,博弈 参与人通过归纳法同样能够认识到该混合策略均衡,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论