15第七专题第1次：竞争型决策-基本概念

上传人：1*** IP属地：广东上传时间：2026-01-22 格式：PPTX 页数：50 大小：3.47MB 积分：20 举报 版权申诉

已阅读5页，还剩45页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

编写组决策理论与方法第一讲竞争型决策概述专题七竞争型决策主要内容博弈的基本概念1完全信息静态博弈2典型案例3竞争无处不在引例博弈论(gametheory)主要是解决决策者之间冲突和合作的理论。具体来讲，是解决决策主体的行为在发生直接的相互作用时，人们如何进行决策以及这种决策的均衡问题。引例一.基本概念

囚徒困境囚徒乙坦白抵赖囚徒甲坦白（－8，－8）（0，－10）抵赖（－10，0）（－1，－1）警方拘捕了两个同案的犯罪嫌疑人（囚徒）后，为防止串供，将其分开拘押，隔离审问。对他俩的政策是：若一人招供但另一人未招，则招者立即被释放，未招者判入狱10年；若二人都招则两人各判刑8年；若两人都不招则未获证据但因私入民宅各拘留1年。

如果都是理性的个体，应该作何决策？典型的博弈现象可以看出：1.两个囚徒决策时都已自己的最大利益为目标，结果是无法实现最大利益或者是较大利益；2.也反应了一个很深刻的问题，即个体理性与集体理性之间的矛盾，即从个体利益出发的行为往往不能实现集体的最大利益；3.同时也揭示了个体理性本身存在的内在矛盾，即从个体利益出发的行为最终也不一定能真正实现个体利益的最大化。典型的博弈现象

博弈就是一些人或组织在一定的环境和规则下，同时或先后，一次或多次，从各自允许选择的行动或策略中进行选择并加以实施，各自取得相应结果的过程。博弈的概念要素博弈的参与者。又称博弈方或局中人，是指博弈中独立决策、独立承担结果的决策主体。

博弈的要素参与者的支付

。每个参与者从各种策略组合中获得的收益或效用，它是策略组合s的函数，所以也被称为支付函数。记博弈方i的支付函数为ui(s)

。

要素博弈的要素以上是博弈问题的三个基本要素博弈的标准式囚徒困境中参与者：嫌犯甲和嫌犯乙策略集：{坦白，拒绝}支付：博弈结束，参与者得到的回报。双方的支付由所选策略决定。当两个嫌犯都选择“坦白”时，他们的支付都是-1，即坐牢1年。要素博弈的要素博弈方的信息。博弈的次序。所有随机事件的概率分布扩展要素分类博弈的分类参与者的数量：两人博弈和多人博弈参与者策略的数量：有限博弈和无限博弈收益情况：零和博弈、常和博弈和变和博弈行动的顺序：静态博弈、动态博弈、信息结构：完全信息博弈和不完全信息博弈参与者理性：非合作博弈和合作博弈分类博弈的分类参与者的数量：两人博弈和多人博弈两人博弈就是存在两个各自独立决策，但策略和支付具有相互依存与制约关系的博弈方的决策问题。多人博弈是指有三个或三个以上参与者进行的博弈。参与者寻求自身最大利益的决策活动，只是现在其他参与者不是一个，在分析参与者的策略行为时，不仅要考虑两两之间的相互作用，还要考虑参与者可能会形成联盟。分类博弈的分类参与者策略的数量：有限博弈和无限博弈有限博弈：参与者的数量和所有策略集合都是有限的。无限博弈：只要参与者数量或某一个参与者的策略集合是无限的，该博弈称无限博弈。分类博弈的分类收益情况：零和博弈、常和博弈和变和博弈零和博弈：所有参与者的得益总和始终为零的博弈，其是最常见的一种博弈类型，同时也是被研究得最早、最多的博弈问题。常和博弈：所有参与者的得益总和始终为某一非零常数的博弈，常用于分析固定份额财富或资源的分配。变和博弈：博弈中参与者的利益总和会随着策略组合的不同而变化。分类博弈的分类行动的顺序：静态博弈、动态博弈、重复博弈静态博弈：所有参与者同时采取行动，或者，虽然行动有先后次序但是参与者无法看到别人的行动。动态博弈：参与者的决策行动是有先后顺序的，而且后决策行动的参与者能够观察到先决策行动的参与者所选择的策略的博弈。如下棋游戏和纸牌游戏。重复博弈：同一个博弈反复进行所构成的整体博弈过程，构成重复博弈的一次性博弈叫作“元博弈”或者“阶段博弈”。分类博弈的分类信息结构：完全信息博弈和不完全信息博弈

在网上流传着这样一个故事。一个古董商发现一个人用珍贵的茶碟装猫食，于是假装对他的猫非常喜爱，想从他手里买下这只猫。猫主人一口回绝。为此古董商狠心出了高价，才说服猫主人成交。成交后，古董商装作不经意地说:“这个碟子它用习惯了，就一块儿送我吧。”猫主人微微一笑:“你知道用这个碟子，我卖了多少猫吗?”

在这个故事中，古董商掌握着“茶碟是古董”这个信息，非常得意，并自作聪明地认为养猫人不知道。谁知猫主人不但知道，而且还利用了古董商“认为自己不知道”的错误认识，更胜一筹。信息的重要性分类博弈的分类信息结构：完全信息博弈和不完全信息博弈

完全信息博弈：每个参与者对其他参与者的策略集合及支付函数有准确认识的博弈。

不完全信息博弈：至少部分参与者不完全了解其他参与者支付情况的博弈。分类博弈的分类参与者理性：非合作博弈和合作博弈

合作博弈：强调集体理性和效率，参与者的决策是以集体目标最大化为驱动。

非合作博弈：强调个体理性，即个体利益最大化。

行动顺序信息静态动态完全信息完全信息静态博弈纳什均衡纳什（1950,1951）完全信息动态博弈子博弈精炼纳什均衡泽尔腾（1965）不完全信息不完全信息静态博弈贝叶斯纳什均衡海萨尼（1967-1968）不完全信息动态博弈精炼贝叶斯纳什均衡泽尔腾（1975）博弈的分类二.完全信息静态博弈

完全信息静态博弈概念内涵每一参与者都拥有其他所有参与者的特征、策略集和支付函数等方面的准确信息，这样的博弈称为完全信息博弈。参与者同时行动，或者非同时行动但后行动者观察不到先行动者的选择的博弈，称为静态博弈。同时满足完全信息和静态两个条件的博弈称为完全信息静态博弈。囚徒博弈石头剪子布田忌赛马无限策略博弈(古诺博弈)……拥有支付函数的准确信息：1.指支付函数是确定的；2.支付函数是公共信息。

常见分析方法囚徒困境中，“双方都坦白”是极为可能出现的结果，而且这一结果非常“稳定”：假如任何一个人单方面改变自己的选择，将会得到更差的结果。所以没有人单方面更改策略，双方处于一个胶着状态，即均衡状态。怎样分析并求得这个均衡？

常见分析方法占优战略均衡

重复剔除占优战略均衡

划线法

箭头法

常见分析方法占优战略均衡

占优战略就是指不管其他参与者策略为何，该参与者总能可找到一个最佳策略。这个最优策略称为上策。如果在竞争型决策中每个参与者都有上策，这些上策所构成的策略组合必然会受到所有参与者的欢迎，这样的策略组合称为该博弈的一个均衡点，称为“占优战略均衡”。

常见分析方法占优战略均衡

占优战略均衡分析是最基本的博弈分析方法，占优战略均衡非常稳定，根据它可以做出最肯定的预测，因为它反映了博弈方对策略的绝对偏好，只要找到占优战略均衡，博弈分析任务基本完成。实际上经常出现所有参与者都没有上策，如石头剪刀布游戏。

不具有普遍适用性。

常见分析方法重复剔除占优战略均衡

如果一个参与者的某个策略给他带来的收益总是比另一种策略所带来的收益少，该策略对于该参与者来说就是“严格下策”，无论在什么时候，参与者都不会选择该策略。

因此，可以将包含该策略的所有策略组合消去，这样就可以简化博弈局面，一直循环往复，不断消去“严格下策”，直到只剩一个策略组合为止，这个策略组合就是该博弈局面的均衡点，这种均衡称为“重复剔除的占优战略均衡”，也称为“严格下策反复消去占优战略均衡”。

常见分析方法重复剔除占优战略均衡

步骤：1、首先找出某一博弈参与人的严格下策，将它剔除掉，重新构造一个不包括已剔除下策的博弈；2、然后继续剔除这个新的博弈中某一参与人的严格下策；3、重复进行这一过程，直到剩下唯一的参与人策略组合为止。

常见分析方法划线法

基本思路：找出一个参与者针对其他参与者每种策略或策略组合（对多人博弈）的最佳对策，即自己的可选策略中与其他博弈方的策略或策略组合配合，给自己带来最大得益的策略，在其支付值下划线。若存在一个策略组合，使得所有参与者的支付值下都划了线，则该策略组合就是一个均衡点。

常见分析方法划线法

乙