版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第卷第期年月北京理工大学学报(社会科学版)()论博弈逻辑的分析方法纳什均衡分析法张峰(北京理工大学摘人文社会科学学院,北京)要:博弈逻辑是逻辑学研究的一个崭新领域,目前处于初创时期。文章探讨了博弈逻辑的基本分析方法纳什均衡分析法,并对其进行了评价。关键词:博弈逻辑;纳什均衡;分析方法中图分类号:文献标识码:文章编号:()博弈逻辑”英文为“。博弈逻辑研究”理性的”主体互动行动中的推理过程,即研究博弈中“的推理问题。博弈逻辑是博弈论和逻辑学相交叉的一个崭新领域,近年来为众多学者所关注。目前,世界上对博弈逻辑的研究处于起步阶段,至今,对博弈逻辑的理论基础纳什均衡的研究十分薄弱,国外只有个别学者对此进
2、行了初步探索;而笔者将对博弈逻辑的基本分析方法纳什均衡分析法进行探究和评价。规定了任何意义的合理结果都要满足的基本条件当某一参与人发现他单方改变策略便可以获取更多时,他会毫不犹豫地改变自己的策略,博弈自然也就没有达到均衡;另一方面,纳什均衡是所有其他均衡概念的基础。纳什均衡来源于博弈论,博弈逻辑作为新创的研究领域,理应从比较成熟的博弈论中吸取精华,从而些学者也认识到纳什均衡在博弈逻辑中的重要性。例霍克如,英国利物蒲大学计算机科学系的教授范德纳什均衡的模态()在他的论文特征(,(),:和关于博弈的模态逻辑解释(目前还很少有学者涉足纳什均衡分析法方面的研究。站在更高的起点、从不同的角度进行研究。国
3、外的一一、博弈逻辑的理论基石纳什均衡博弈逻辑研究“理性的”主体互动行动中的推理过程。在博弈逻辑中,博弈参与人的推理表现在他对策略的选取上。决定参与人的策略选取一方面是博弈结构,即博弈中不同策略组合下的支付函数或者得益函数;另一方面是其他参与人的策略。博弈逻辑的核心是通过研究推理寻求各博弈方合理的策略选择。均衡是博弈逻辑中的重要概念。均衡”即平衡的“在经济学中,均衡意即意思,在英文中是。相关量处于稳定值。在博弈逻辑中,博弈均衡是一稳定的博弈结果,是所有参与人最优策略或行动的组合。博弈的均衡是稳定的,因而是可以预测的。博弈逻辑中有多种均衡的概念,其中最重要、最基本的是纳什均衡。纳什均衡()是指这样
4、一种策略组合,在其他参与人的策略选择既定的前提下,每个参与人都会选择自己的最优策略(每个参与人的个人选择均依赖于其他参与人的选择,不依赖的情况只是例外),所有参与人的最优策略组合就是纳什均衡。纳什均衡的重要性体现在:一方面,它,:)中对纳什均衡概念进行了初步逻辑分析;但是,他的研究还仅限于在无重复的完美信息的扩展型博弈中的研究。日本筑波大学的金子守教授在研究博弈逻辑的应用时,阐述了纳什均衡的认知公理。博弈逻辑研究的集大成者,荷兰阿姆斯特丹大学的约翰范本瑟姆教授在对博弈逻辑的研究中也强调了纳什均衡的重要性。笔者认为,博弈逻辑的核心是寻求纳什均衡。博弈过程是一个推理过程,也是寻求纳什均衡的过程。纳
5、什均衡是博弈逻辑的理论基石,只有对纳什均衡的概念、分析方法有了全面的了解,才能深入研究博弈中的推理问题。纳什均衡是整个博弈逻辑理论大厦建构的基础。非合作博弈逻辑是目前博弈逻辑研究的主流。收稿日期:作者简介:张峰(),女,讲师,哲学博士,研究方向为现代逻辑学、应用伦理学。:北京理工大学学报(社会科学版)年第期纳什均衡”是一种非合作博弈均衡,在现实中,不仅“非合作的情况远远地比合作情况普遍;而且合作也往往只是暂时的和策略性的。从非合作博弈逻辑的一般研究看,非合作博弈逻辑主要有两个研究角度:一是从参与博弈的参与人的行动先后顺序研究,这样把博弈逻辑分为静态博弈逻辑和动态博弈逻辑。二是从参与人信息相互了
6、解程度分,这样分为完全信息博弈逻辑和不完全信息博弈逻辑。将上述两个角度的划分结合起来可以得到四种不完全信同类型的博弈逻辑:完全信息静态博弈逻辑、息动态博弈逻辑、不完全信息静态博弈逻辑和不完全信息动态博弈逻辑,与上述四种不同类型的博弈逻辑相对应的四种不同类型的均衡分别是:纳什均衡()、子博弈精炼纳什均衡()、贝叶斯纳什均衡()和精炼贝叶斯纳什均衡()。纳什均衡是博弈逻辑中最基本的均衡概念。在完全信息静态博弈逻辑中,参与人通过推理,寻求纳什均衡。其他类型博弈逻辑中的核心均衡概念,如子博弈精炼纳什均衡、贝叶斯纳什均衡和精炼贝叶斯纳什均衡等,本身都是纳什均衡,都是纳什均衡的某种精炼。法。寻求纯策略纳什
7、均衡的方法寻求纯策略纳什均衡的方法主要有占优策略均衡分析法、重复剔除严格劣策略法以及相对优势策略占优策略均衡分析采用的是一种选择法的思路,是在所有可能的策略中选出最好的一种策略。在一个博弈中,如果不管其他博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其他策略,至少不低于其他策略。这种策略被称为“占优策略”进一步,如果一个博弈的某个策()。略组合中的所有策略都是各个博弈方各自的占优策略,那么这个策略组合肯定是博弈方都愿意选择的,必然是该博弈比较稳定的结果。这个策略组合就被称为该博弈的一个“占优策略均衡”()。利用占优策略均衡分析博弈的方法称为“占优策略均衡分析法”占优策略均衡分析法
8、反映。了所有博弈方的绝对偏好,可以对博弈结果做出肯定的预测。但在很多博弈中,占优策略是不存在的,所以占优策略均衡分析法并不能解决所有的博弈问题。但如果部分博弈方有占优策略时,找出他们的占优策略可以简化博弈分析。在占优策略不存在的情况下,则需要应用其它的逻辑方法来寻求纳什均衡。重复剔除严格劣策略法”也称为“严格下策反复“消去法”。如果博弈中某个博弈方的两种策略之间有这样的关系:不管其他博弈方采用何种策略,一种策略的得益始终高于另一种策略。那么我们称始终具有较低得益的策略是相对于具有较高得益策略的“严格劣策略”()。重复剔除严格劣策略法与占优策略均衡分析法不同,该方法采用的是排除法的思路,是一种通
9、过将各个博弈方的策略空间中相对比较差,因而不可能采用的策略反复剔除的方法,简化甚至求出博弈结果的方法。如果这种方法将除了一个策略组合以外的其他所有策略组合都剔除,那么留下的策略组合是该博弈唯一的纯策略纳什均衡。一般而言,重复剔除严格劣策略法的适用范围比占优策略均衡分析法更大一些。然而,有些博弈中,一个参与人的不同策略之间,不存在绝对的优劣关系,而只存在相对的、有条件的优劣关系,因此重复剔除严格劣策略法无法应用。此外,在策略数较多的博弈中,重复剔除严格劣策略法往往只能消去其中的部分策略,不能消去的策略组合并不唯一,这时仅用重复剔除严格劣策略法也无法对博弈做出准确的判断,因而仍不能完全解决这些博弈
10、问题。相对优势策略法是通过对每一个参与人,并且对该参与人的每一个可选策略,确定另一个参与人相应的最优策略,从而找到相应的策略组合,来寻求纳什二、博弈逻辑的基本分析方法纳什均衡分析法博弈逻辑主要是使用博弈规则,通过对博弈行为进行推理来预测博弈的均衡结果。博弈逻辑中运用的主要分析方法是纳什均衡分析法。利用纳什均衡概念可以对非合作博弈中,各个博弈方在博弈中的策略选择和博弈的结果进行分析和预测。因为根据纳什均衡的定义,给定其他博弈方采用某个纳什均衡策略时,所考察博弈方同样选择该纳什均衡的策略是符合自己利益的,因此如果一博弈方预测或者判断其他博弈方都会采用某个特定的纳什均衡策略,那么该博弈方的策略选择和
11、博弈的结果就比较容易判断,只要这个博弈方是理性的。这种利用博弈中的纳什均衡,分析判断博弈方在推理过程中做出的策略选择和博弈结果的方法,就是“纳什均衡分析法”。纳什均衡分析的首要工作是找出博弈中的纳什均衡。根据所讨论的博弈问题是静态博弈还是动态博弈,是完全信息还是不完全信息的博弈,是完美信息还是不完美信息的动态博弈,是求纯策略纳什均衡还是求混合策略纳什均衡的区别,求非合作博弈纳什均衡的方法不同。论博弈逻辑的分析方法纳什均衡分析法均衡的方法。当博弈可以用得益矩阵表示时,可以通过在相应最优策略的得益出做记号(划线等),找出相互是最优策略的策略组合,即纳什均衡。相对优势策略法是一种非常简便的博弈分析方
12、法,由于它以策略之间的相对优劣关系为基础,因此在分析得益矩阵表示的博弈问题时具有普遍适用性。当然,这并不意味着每个用得益矩阵表示的博弈都可以用这种方法求出确定性的博弈结果。是否能得到确定性的结论,依赖于具体博弈的得益矩阵中是否存在唯一的每个数字下都划有短线的得益数组。的行动。完全且完美信息指博弈方对博弈进程的信息及博弈方得益的情况有完全的了解。逆推归纳法即从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法。逆推归纳法事实上就是把多阶段动态博弈简化为一系列的单人博弈,通过对一系列单人博弈的分析,确定各博弈方在各自选择阶段的选择,最终
13、对动态博弈结果,包括博弈的路径和各博弈方的得益做出判断,归纳各个博弈方各阶段的选择则可得到各个博弈方在整个动态博弈中的策略。不完全的博弈、具有稳定此外,对于信息不完美、性的均衡是“精炼贝叶斯纳什均衡”或“贝叶斯纳什均衡”等精炼纳什均衡概念,而不是一般的纳什均衡。因不完全信息博弈问题,需要寻找的是此,分析不完美、精炼贝叶斯纳什均衡”或“贝叶斯纳什均衡”由于这“。种博弈中博弈方的策略和他们的判断之间总是有相互影响和制约关系,因此这种博弈不像完全信息的博弈那样有一般的逻辑方法。通常是借鉴其他类型博弈的分析方法,从一定的判断或者策略出发,按照纳什均衡的定义检验他们是否具有一致性,是否构成“精炼贝叶斯均
14、衡”或“贝叶斯纳什均衡”等。找出博弈的纳什均衡(一般的纳什均衡或各种精炼的纳什均衡)策略组合或者纳什均衡路径,是纳什均衡分析必须做的基础工作,但这仅仅是纳什均衡分析的第一步,因为并不是每个博弈都只有唯一的纳什均衡策略组合或唯一的子博弈精炼纳什均衡路径等。一个博弈中的纳什均衡或子博弈精炼纳什均衡等常路径中进行选常有许多个,这时候就存在这些均衡、择的问题。因此要对博弈问题做出准确地判断、预测,帮助参与人做出科学的决策选择,需要做进一步的深入分析。寻找混合策略纳什均衡的方法当博弈中不存在纯策略纳什均衡或存在多个纯策略纳什均衡时,我们可以寻找混合策略纳什均衡来预测参与人的策略选择。求混合策略纳什均衡,
15、就是计算各参与人在自己的策略空间中随机选择的特定概率分布。首先寻找该博弈中是否存在纯策略纳什均衡,再根据如下规则计算混合策略的概率分布:参与人自己采用的混合策略概率分布,必须使其他参与人采用不同纯策略的期望得益相同。否则其他参与人会选择对自己较有利的纯策略,而这可能对采用混合策略的参与人不利,结果是双方(或多方)的选择不可能构成纳什均衡。参与人以一定的概率分布在可选策略中随机选择的决策方式,在分析没有纯策略纳什均衡和有多个纳什均衡的博弈时有重要的意义。这种策略选择的方式称为混合策略。比较而言,纯策略是参与人确定性地从自己的策略集中选取一个策略;混合策略是参与人在自己的策略集中随机地选取策略。纯
16、策略也可以看作是一种混合策略,即选择相应纯策略的概率为混合策略又可,选择其余策略概率为的混合策略。以看作纯策略的扩展。如果给一个博弈的每个参与人的纯策略空间赋予不同的概率分布,就形成了不同的混合策略。事实上,存在多个纯策略纳什均衡的博弈中肯定存在着混合策略纳什均衡。威尔逊()证明了奇数定理(),即几乎所有的有限博弈都有奇数个纳什均衡。这意味着,如果一个博弈有两个纯策略纳什均衡,那么一定存在着一个混合策略纳什均衡。多重纳什均衡的选择方法一个博弈中存在的纳什均衡不止一个时,就是一个多重纳什均衡的博弈问题。多重纳什均衡选择的思路就是寻找一种方法在多个纳什均衡中挑选出更可能实现的一个。事实上,并不是所
17、有多重纳什均衡博弈都会导致分析困难。因为有些博弈中存在多个纳什均衡,但很可能这些纳什均衡有明显的优劣差异,所有参与人都偏好其中同一个纳什均衡。也就是说,可能有这些纳什均衡中的某一个,给所有参与人带来的利益,都大于其他所有纳什均衡会带来的利益。这时候参与人的选择倾向性就会是一致的,各个参与人不仅自己会选择该纳什均衡的策略,而且可以预料其他参与人也会选择该纳什均衡的策略,因此不会有选择困难。用这"种方法选择出来的纳什均衡,依据的是帕累托效率!寻求子博弈精炼纳什均衡的方法寻求子博弈精炼纳什均衡的方法主要是“逆推归逆纳法”。逆推归纳法(,又译为“向归纳法”)是一种分析完全且完美信息动态博弈(
18、)的方法。所谓动态博弈是指博弈方的行动存在着先后次序,并且后行动的博弈方能够观察到前面北京理工大学学报(社会科学版)年第期意义上的优劣关系,因此该方法也被称为“帕累托占优策略均衡分析法”。在存在帕累托效率意义上优劣关系的情况下,帕累托占优策略均衡分析法是纳什均衡选择的基本法则。但在一些博弈中,决策者也不一定会选帕累托占优策略均衡,他们的决策还会受风险因素的影响。在风险占优策略均衡分析法”更适用。风这种情况下,“险占优策略均衡的理解方法是,如果所有参与人在预计其他参与人采用两种纳什均衡的策略的概率相同时,都偏爱其中某一纳什均衡,则该纳什均衡就是一个风险占优策略均衡。风险占优策略均衡分析法是人们在
19、日常生活中进行决策的重要方法之一,如果我们忽视这种均衡的存在,忽略人们选择风险占优策略均衡的可能性,就可能无法对许多决策问题进行准确的分析判断,无法对许多社会现象做出合理的解释。在多重纳什均衡博弈中,一些博弈并没有帕累托占优策略均衡。而混合策略纳什均衡也只能给出策略选择的概率分布。在这样的博弈中,参与人往往会利用博弈规则以外的特定信息,如参与人共同的文化背景中的习惯或规范,共同的知识或者具有特定意义事物的特征等来达到一个“聚点”均衡,这时采用的方法为“聚点均衡分析法”聚点均衡反映了人们在多重纳。什均衡选择中的某些规律性,但因为它涉及的方面很多,因此虽然对每个具体的博弈问题可能可以找出聚点,但对
20、一般的博弈却很难总结普遍规律,只能具体问题具体分析。预测结果不一致的策略,即所有博弈方都没有偏离这个纳什均衡的愿望,这个纳什均衡最终真的会成为博弈的结果。在这个意义上,纳什均衡是博弈结果的“一致预测”这里所说的“一致预测”中“一致”的含义是,。各博弈方的选择与他们的预测是一致的,而不是不同博弈方的预测相同、无差异。一致预测性”是纳什均衡的本质属性,也是保证“纳什均衡的价值,使纳什均衡不同于其他分析概念的重要性质之一。一致预测性在博弈分析中具有十分重要的地位。一个博弈方在博弈中所作预测的内容包括他自己的选择,因此博弈方有可能会利用预测改变自己的选择,而具有一致预测性质的博弈分析概念就能避免这样的
21、矛盾,从而是稳定的和自我强制的,相应选择也才是真正可预测的。不具有一致预测性质的博弈分析概念,在分析预测博弈结果时,则难以避免预测和行为之间的矛盾,因此是不稳定的。而且只有纳什均衡才具有一致预测的性质。如果一个博弈的所有博弈方都预测博弈结果是某个纳什均衡,那么由于纳什均衡策略组合中各博弈方的策略都是对其他博弈方策略、策略组合的最佳对策,因此任一博弈方都不会单独改变策略,因此预测的结果会成为博弈的最终结果。反之,如果每个博弈方都预测到某个策略组合将是博弈结果时,都会主动坚持该策略组合中的策略,而不想采取与预测不一致的策略,则说明该策略组合中每个博弈方的策略都是对其他博弈方策略的最佳对策。根据纳什
22、均衡的定义,这个策略组合一定是一个纳什均衡。正是由于纳什均衡是博弈方将如何博弈的“一致性预测”,因而具有如下特征:各博弈方可以预测均衡,博弈方可以预测到他们的对手会预测均衡,还可以预测他们的对手会预测自己会预测均衡等等。相比之下,如果预测博弈的最终结果将是非纳什均衡策略组合,则意味着要么各博弈方的预测其实并不相同(预测不同的纳什均衡会出现等),要么预期至少一个博弈方要“犯错误”,包括对博弈结构理解的错误,对其他博弈方的策略预测错误,其理性和计算能力有问题,或者是实施策略时会出现差错等。因此在假设各博弈方预测的策略组合相同,以及各博弈方都有完全理性的,即不会犯错误的情况下,不可能预测任何非纳什均
23、衡是博弈的结果。()纳什均衡具有普遍存在性,因而在对博弈行为的分析中,纳什均衡分析法有广泛应用价值。纳什均衡的另外一个重要性质,就是纳什均衡的三、纳什均衡分析法评析博弈逻辑属于应用逻辑,与现实联系密切。纳什均衡分析法作为博弈逻辑的基本分析方法,可以为博弈方进行决策提供方法和依据,在实际博弈推理中有指导作用。()纳什均衡是博弈结果的一致性预测,因而纳什均衡分析有利于对博弈结果进行预测,指导参与人做出合理的策略选择。预测是进行博弈推理最基本的目的之一。进行博弈推理,主要是预测特定博弈中的博弈方究竟会采取什么行动,博弈将有怎样的结果,并通过博弈分析研究人类行为的规律等。纳什均衡的一致预测性质正是其预
24、测能力的基本保证。一致预测性”是指这样一种性质:如果所有博弈“方都预测一个特定的纳什均衡会出现,那么,所有的博弈方都不会利用该预测或者这种预测能力,选择与"帕累托(,)是意大利著名经济学家。以帕累托命名的所谓帕累托效率准则是指:经济的效率体现于配置社会!资源以改善人们的境况,主要看资源是否已经被充分利用。如果资源已经被充分利用,要想再改善任何人都必须损害别的人了,这时候就说一个经济已经实现了帕累托效率。相反,如果还可以在不损害别人的情况下改善任何人,就认为经济资源尚未充分利用,就不能说经济已经达到帕累托效率。论博弈逻辑的分析方法纳什均衡分析法普遍存在性,即纳什均衡在相当多的博弈类型中
25、普遍存在。普遍存在指即使没有纯策略纳什均衡,也一定有混合策略纳什均衡。关于纳什均衡存在性的证明,首先是纳什在他益大小为唯一的决策依据,博弈方可能还会考虑风险问题。在现实博弈中,不同的博弈方的风险偏好是不同,在不完全信息情况下很难对对方的风险偏好做出准确判断。而且现实中的博弈方常常并不只考虑最大限度地获得经济利益,有时候为了公平等方面的要求,会放弃部分或者全部经济利益。特别是在谈判活动中,争取平等待遇往往会影响决策者的行为或最后的结果。此外,纳什均衡分析法的前提是假设各博弈方预测的策略组合相同,以及各博弈方都有完全理性的,即不会犯错误的情况下;而且博弈方都有完全理性成为了博弈各方的公共知识。但是现实中的博弈方时常存在博弈方的理性、能力等与假设不符的情况,这些都会影响纳什均衡在博弈分析中的预测作用。()纳什均衡的存在性不等于唯一性,许多博弈中不只是存在一个纳什均衡,而是有多个纳什均衡,特别是在多阶段博弈和重复博弈问题中。这种多重纳什均衡的问题会引出关于纳什均衡选择和精炼的必要。这种选择有时候是很困难的,因为可能不同的均衡或者均衡路径之间并无严格的优
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 采购流程及电子合同制度
- 原料采购日常管理制度范本
- 采购部部门绩效考评制度
- 采购部门奖惩激励制度
- 采购部验收复秤制度
- 采购集中招聘制度汇编
- 采购项目资金控制制度
- 采购验收保管调配制度
- 重点采购物品管理制度
- 2025年前台沟通礼仪考核集
- 2026年黑龙江农垦职业学院单招职业适应性测试题库与答案详解
- 2026年保安摸似考试测试题及答案
- 浙江省新阵地教育联盟2026届第二次联考英语+答案
- 2026年行测真题及答案
- 游乐设施安全管理台账范本
- 2026贵州遵义市部分市直机关事业单位招聘编外人员(驾驶员岗位)12人笔试备考试题及答案解析
- 2025至2030中国商用车联网市场供需状况及政策影响分析报告
- 2026清醒的一代:Z世代主动定义的人生研究报告-
- 2026届北京市朝阳区高三上学期期末质量检测历史试题(含答案)
- 水泥生产线设备维护检修计划
- 发生食品安全事件后保障供餐的应急管理措施制度
评论
0/150
提交评论