孙子兵法的博弈分析.docx

上传人：m*** IP属地：河南上传时间：2020-01-19 格式：DOCX 页数：5 大小：24.66KB 积分：20 举报 版权申诉

免费预览已结束，剩余1页可下载查看

下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

一、引言很早以来，学者们就对如何阐明一般性的策略原则有着极大的兴趣，无论这策略是应用于战争、棋类游戏、还是政治。对于像中国古代战略家孙子这样的人来说，他们感兴趣是因为需要就眼前的事务出谋划策，而对其他人来说，他们的兴趣源自知性的好奇心。不管兴趣来源为何，对策略原理进行研究都是有意义的，因为它抓住了人类生存的基本性事实：首先，人们的命运是相互决定的；其次，这种互赖性一般情况下表现为人们的目标相互冲突；最后，前面两点说明战争不是偶然的，而是国家政策的有目的性的延续，并因此必须用理性去解释。写于两千五百多年前的孙子兵法是人类有记载以来第一次试图连贯地、一般性地理解冲突和策略。它的年代对于我们来说并不太重要，重要的是它写于一个形成中的中国内部长年交战时期，其时各诸侯国富有外交和军事上的策略经验。所以我们应该认为孙子兵法系统整理了那个时代战略和战术方面的精湛洞见。对孙子兵法加深理解不光有助于我们了解孙子写作的那个年代，也能对今日冲突的本质加深认识。但尽管我们可以假设孙子的洞见适用于过去和现在，我们不能以为我们对策略的理解在过去两千五百年里没有进步。新的分析模式，包括决策论和数学应用，已经进入了策略分析的领域并使我们的思考得到了精炼和概括。所以要想理解孙子对策略理论的贡献，我们必须搞清楚怎样在现在的背景下理解和分析他的著作，因为只有这样我们才能最大化孙子兵法的当代意义。这也是本文所要分析的问题。但我们的讨论不从孙子本人开始，而从二十世纪下半叶发展出来的策略行为理论-博弈论开始。博弈论既可以被看成是数学的一个分支，也可以被看成是政治学或者经济学的一个分支（Ordeshook, 1986）。简单地说，博弈论试图就如下情况下的决策得出一般性的、抽象的原则：一个人行为会有什么结果取决于他人的行为，而每个人又都知道他们的行为是互赖的。所以博弈论不仅能应用在军事战略规划上，也能用于分析商业公司在争夺利润和市场份额时，政客们为了赢得选举、委员会成员们为了形成对自己有利的派系，以及各个国家为了在合纵连横中占据有利位置而进行的决策行为。二、孙子兵法中的博弈思想博弈论(Game Tleory)，又称对策论，是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论，一般认为博弈理论开始于1944年由Von Neuma和Mor即nstem合作的博弈论与经济行为一书的出版，近50年来，博弈论得到了很大的发展，逐渐成为了主流经济学的一部分，其应用范围遍及经济、政治、军事、外交等众多领域。以至于有人说，如果未来社会科学还有纯理论的话，那就是博弈论。（1）博弈均衡纳什均衡(sh EqLlilibium)是博弈论中最基本的博弈均衡概念，它指的是这样一种由所有参与人的最优战略组成的战略组合。其最重要的特征就是(联合)自我支持，即在博弈均衡的状态下，每个参与人都没有动机去偏离自己的选择。而自我支持是以每个参与人的支付函数最大化为前提的。博弈分析的目的就是预测博弈的均衡结果。孙子兵法首篇计篇中对胜负的预测就与博弈均衡的分析是一致的：首先，要“经之以五事、校之以计而索其情”，“主孰有道?将孰有能?天地孰得?法令孰行?兵众孰强?士卒孰练?赏罚孰明?”分析这些影响支付函数的关键因素，就可以制定出有利于己方的作战方略，“计利以听，乃为之势，以佐其外”，这里的势，事实上就是由双方的支付函数所确定的一个博弈均衡局势，即“势者，因利而制权也”，所以孙子正是“以此知胜负”，通过“庙算”，虽“未战”，但“胜负见矣”。纳什(1950)已经证明，任何有限博弈都存在至少一个纳什均衡，真正令博弈论专家棘手的问题是一个博弈可能有多个均衡，因此对纳什均衡的改进、精炼及选择成为了博弈论研究的热点，出现了一系列博弈均衡概念，从帕累托上策均衡、风险上策均衡、聚点均衡(schellin，1960)、相关均衡(Aumann，1974)到子博弈精炼纳什均衡、(精炼)贝叶斯纳什均衡、序贯均衡(KrepWiIBon，1982)、颤抖手均衡(selten，1975)等，它们构成了现代博弈论的基本内容。孙子兵法在对胜负的预测的基础上更强调其实现的途径、策略的选择和制定，他认为“不可胜在己，可胜在敌”(形篇)，支付函数的值“胜(负)”依赖于己方的策略攻或守的转换，“不可胜者，守也；可胜者，攻也”又言“十则围之，五则攻之，倍则战之，敌则能分之，少则能守之，不若则能避之”(谋攻篇)，从“围”至“避”，策略空间的细分和增大攻守的转换，可使支付函数发生巨变，“守则有余，攻则不足”，“故善战者，能为不可胜，不能使敌必可胜”，他将均衡作为变量，反过来决定策略的选择。（2）理性假设与博弈过程纳什均衡的预测假设每个参与者是理性的，而且理性是参与者的共同知识的，因此，纳什均衡需要共同的正确的推断，逆向归纳法成为分析动态博弈的有效方法。如果所有人预测到一个纳什均衡会出现，那么没有人有兴趣作不同的选择。但纳什均衡、或者哪一个纳什均衡会出现，却依赖于具体的博弈过程，参与人偶然的错误(有关对手决策的预测的错误，或者自己决策的错误)、或者参与人有意识地偏离纳什均衡路径将可能导致非纳什均衡结果的出现。泽尔腾(selten，1975)引入的颤抖手均衡使动态博弈的均衡的稳定性更强、预测更可靠，但颤抖手均衡本身并没有解决博弈参与人犯错误的问题，即使博弈的颤抖手均衡是唯一的，也不能保证对它预测就一定实现。前向归纳法遵循参与人未来的行为应与其过去的行为，包括偏离均衡路径的行为相一致的原则，视参与人有意的偏离为他发送的信号，它是精炼纳什均衡的另一种思路。这些似乎可以解决动态博弈均衡的精确预测，但对“蜈蚣博弈”(centipede Game)的分析表明并非完全如此。孙子兵法认为“见胜不过众人之所知，非善之善者也”（形篇），孙子更推崇超出一般人的见识（理性）的博弈。他认为“古之善战者，胜于易胜者也”（形篇），“善战者之胜，无奇胜，无智名，无勇功”，“其战胜不忒”（形篇）。孙子的观点是一方的胜利往往是另一方的错误造成的，“先为不可胜，以待敌之可胜”，“立于不败之地，而不失敌之败也”（形篇），不要放过敌人招致失败的时机，要“先胜而后求战”，而非“先战而后求战胜”。可见孙子非常注重战争（博弈）过程的分析，伦敦大学著名的博弈论专家Binomone（1990）也指出改进博弈论必须模拟出局中人的思考方式，应该更多地注意均衡过程而不是均衡点。（3）混合战略均衡所谓混合战略是指参与人以某种概率分布随机地选择不同的行动。对应地参与人只选择某一特定行动的战略称为纯战略，在博弈论里，假定参与人的偏好关系满足V-N-M效用假设时，混合战略纳什均衡具有一个令人费解的特征，即在混合战略纳什均衡下：每个参与人在所构成均衡的纯战略之间是无差异的，均衡却要求每个参与人以特定的概率选择纯战略。据此，难道人们真的是使用类似掷硬币的方法来决定选择什么行动的吗？这一令人难以满意的结论，博弈论专家们对此给出了各种解释。一种解释是视混合战略均衡作为一个随机稳定状态，均衡中混合战略中某一战略的概率被理解为选择这一战略的参与人数量的概率；另一解释是考虑一个给定的个人在一次博弈中的选择，依赖于不能被对手确定的特质性因素。这种因素在其他参与人或外部观察者看来似乎是“随机的”。混合战略均衡正体现了有关参与人视作不相关因素方面的行为依存关系。海萨尼在标准型博弈模型中，将影响局中人决策的随机波动因素化为微小的连续随机变量，其具体取值仅为相关的局中人所知，其他人不知，随机变量的分布为公共知识，这样，混合战略均衡等价于不完全信息下的纯战略均衡。这一解释被认为是具有重大意义和概念创新。“见胜不过众人之所知，非善之善者也”（形篇），孙子兵法中应该说是较多地考虑这类不存在纯战略均衡的博弈。善战者，“先为不可胜，以待敌之可胜”（形篇），要“立于不败之地，而不失敌之败”（形篇），选择均衡的混合战略，虽“人皆知我所胜之形。而莫知吾所以制胜之形，故其战胜不复，而应形于无穷”（虚实篇），“不可胜在己，可胜在敌”（形篇），“运兵计谋，为不可测”（九地篇），参与人选择均混合战略，目的是给其他人制造出更多的不确定而自己立于“不败”，尽管对手知道他选择各种战略的概率，但并不能猜透他实际上会选择哪个战略，博弈重复而制胜之策却是不重复的。“能因敌变化而取胜者，谓之神。”（虚实篇）三、博弈模型分析孙子兵法（1）单人决策为了理解博弈论的看法和能教我们的东西，也为了理解孙子的洞见，我们首先应该考察决策人只有一个时的情况，这个决策人必须从某个可选行为的集合里选取一个。要用决策论(decision theory)讨论这种问题，通常我们需要详细说明下列要素：（1）该决策者所能选择的所有行为。这个行为清单必须是详尽的，也就是说决策者必须最终从中选择其行为。清单里的行为也必须是排他的，换句话说决策者只能选择其中一项行为。（2）所有可能的行为结果。这个结果清单也必须是详尽的和排他的。（3）各行为与各结果之间的关系，也就是说某项具体行为被采取后会发生什么结果。与上述内容相对应的是，孙子兵法的第一篇一开始就细述了连接行为与结果的策略环境要素：道（内政、民心）、天（气候、天象、季节）、地（地形、远近等）、将（将领、领袖的品质）、法（国家和军队的组织、管理效率）。其中的“将”是与策略和行动相关的决策变量。决策环境的另一个重要成分是决策参与者的目标（对各种不同结果的偏好）。当然，国王和军队统帅的目标是显而易见的-赢得胜利。正如孙子所言，取得战争胜利实际上是一个国家生存所必需的：“兵者，国之大事，死生之地，存亡之道，不可不察也”（计篇）；“其用战也胜”（作战篇）。不光如此，孙子还指出，对胜利的追求应该放在社稷安危的框架下考虑，不能太短视：“兵贵胜，不贵久”（作战篇）。更具体地来说，孙子兵法的开始几篇有好几段与持久性冲突相关。这些段落我们可以这样理解：应该避免会耗尽己方资源的冲突。“百战百胜，非善之善者也；不战而屈人之兵，善之善者也”（谋攻篇）。所以，正确的目标不应仅仅是取得某场战斗的胜利，而是用最小的成本取胜，并为将来的可能冲突保持实力。此外，我们应该采取能最大化胜利果实的战术：“凡用兵之法，全国为上，破国次之”（谋攻篇）。除了统帅之外，孙子也没有忽视那些在战争中实际执行任务的人们士兵的目标：“故杀敌者，怒也；取敌之利者，货也。故车战，得车十乘已上，赏其先得者”（作战篇）。在最简单的-也就是没有不确定性的-决策环境中，我们假设每个行为都会导致一个定义精确的（well-defined）具体结果。在这种情况下，我们只需知道决策者对各种不同结果的偏好顺序，然后就能推测出决策者会选择的行为。但是在一种更普遍的决策环境中，也就是带有风险的决策环境中，我们或者决策者可能不确定某个具体行为会导致什么结果。在简单的决策论里我们假设行为的结果由“大自然”决定，这个“自然”是指一个自身不具目的、不追求任何目标的实体。因为自然没有目标-它既无善意也无恶意-我们可以认为我们对它的行为不具影响力。我们只能对自然的各种可能行为给定概率。举例来说，农夫在决定种植何种作物时面临的就是这种决策环境。农夫可以选择播撒不同的种子，土地的出产是结果；农夫的偏好顺序由各种结果的相对收益率决定；而自然的行为则可能跟该年的气候相关。在这个例子里，我们一般不会把自然当作一个仁慈的或者邪恶的生命；相反，我们只会给该年可能出现的各种气候特征一定的概率（而这可能由历史纪录决定）。某个具体行为会导致的后果可以看成是在各种可能的结果中进行抽(lottery)。决策理论家们关注的一个问题是人们如何看待这些抽彩-对各个具体的结果的偏好决定了对这些结果组成的抽彩的偏好。总的来说，博弈理论家假设我们可以给各个结果一个价值-即用数字表达的偏好，这样我们就可以计算每个行为的预期值并且推测决策者会选择那个带来最大预期收益的行为。我们在这里举个例子，请看图 1。图1假设决策者（代号1）必须在两个行为A 和B 中选择一个。自然也有两个行为可以选择，其选择每个行为的可能性分别为p 和1-p。方格里显示的是决策者给每个结果赋予的值。在这个例子里，行为A的预期值E(A)等于4p+2(1-p) = 2+2p行为B的预期值E(B)等于p+3(1-p) = 3-2p。如果E(A)E(B),或者说2+2p3-2p，即p 1/4,那么决策者选择A。如果p = 1/4, 决策者对选择A 还是B无所谓如果p1/4,那么决策者喜欢B 超过A。自然 P 1-p4213 A B孙子偶尔也会对类似于上述的简单策略结构提出建议。比如他说：“凡火攻有五发火有时，起火有日。时者，天之燥也；日者，月在箕、壁、翼、轸也。凡此四宿者，风起之日也”（火攻篇）。但孙子兵法仅有少数几处地方集中讨论主要对手是自然的决策问题。很明显，孙子意识到一个全面的决策结构包括自然的可能行为、决策者的策略、以及决策者的对手们所拥有的策略。“知彼知己，胜乃不殆；知天知地，胜乃可全”（地形篇）。因此，要探究事务深处，我们必须求助于博弈论和互动决策分析。（2）博弈我们上面对简单决策的讨论只是为了抛砖引玉。实际上，孙子很早就警告说我们不能停留于这种初级决策模型对行为和目标

人人文库> 全部分类> 生活休闲 > 科普知识

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

孙子兵法的博弈分析.docx

文档简介

温馨提示

最新文档

评论

孙子兵法的博弈分析.docx

文档简介

温馨提示

最新文档

评论

相关文档