第2章博弈的基本知识

上传人：知*** IP属地：广东上传时间：2026-01-29 格式：PPT 页数：28 大小：437KB 积分：5.99 举报 版权申诉

已阅读5页，还剩23页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第2章博弈的基本知识一、博弈的构成要素1、参与人：参与人指的是一个博弈中的决策主体，他的目的是通过选择行动（或战略）以最大化自己的支付（效用）水平。不作决策的被动主体只当作环境参数来处理。在房地产开发博弈中，有两个参与人，即“开发商A“和“开发商B”，而写字楼的需求者被当做环境变量某省市场需求中”。博弈的外部环境（environoment）：外部环境的改变将影响博弈均衡2、行动：行动是参与人在博弈的某个时点的决策变量。参与人的行动可以是离散的，也可以是连续的。

囚徒困境寡头产量竞争的古诺模型行动组合和行动顺序3、信息：参与人有关博弈的知识，特别是有关“自然”的选择、其他参与人的特征和行动的知识。信息集：一个参与人无法准确知道的变量的全体属于一个信息集。自然：是指决定外生的随机变量的概率分布的机制。

海萨尼转换完美信息：一个参与人对其它参与人（包括虚拟参与人“自然”）的行动有准确了解的情况。完全信息：自然不首先行动或自然的初始行动被所有参与人准确观察到的情况，即没有事前的不确定性。共同知识：每个博弈者都知道该事实，每个博弈者都知道每个博弈者都知道该事实，这样无穷推演下去，也即是说，（每个博弈者都知道）k每个博弈者都知道该事实。例：两个学生与一起玩猜帽子的游戏：学生甲学生乙头上各戴有一顶帽子，帽子只可能是红色或白色，而事实上每个学生戴的都是红帽子。甲乙均可看到对方，但看不到自己帽子的颜按照先甲后已的顺序依次问，“你能确定自己头上帽子的颜色吗？”学生只回答能或不能。此时两学生的回答各是什么？进一步宣布，“至少有一顶帽子是红色！”那么两人的回答又各是什么？4、战略（strategy）：参与人在给定信息集的情况下的行动规则，它规定参与人在什么时候选择什么行动。战略是行动的规则而不是行动本身。

策略（strategy）：参与者在给定信息集的情况下选择行动的规则，它规定参与者在什么情况下选择什么行动，是参与者的“相机行动方案”，包括参与者采取行动的完整描述。对于静态博弈，策略等于行动；对于动态博弈，策略针对不同情况由一系列不同阶段分别采取的行动构成。“敌不犯我，我不犯敌；敌若犯我，我必犯敌”理解：策略可以理解成指示参与人进行博弈的一系列指令，必须毫无遗漏；参与人按照指令参与博弈，本身没有任何主观的直觉判断意图。相当于计算机按照既定程序运行，从而简化了行为的分析。思考：理性限制使得参与者的思考过程机械化,从而实现数学建模5、结果：在规则允有行动进行完毕之后，最终结果怎样。各博弈参与者采取不同的行动会带来不同的博弈结果。6、支付：在博弈论中，支付是指在一个特定的战略组合下参与人得到的确定效用水平，或者是指参与人得到的期望效用水平。二、博弈的表示方式（一）博弈的规范式（二）博弈的扩展式对弈：仙人对弈图（局部放大图，）“策略式”模型(Shapley，1973采用这一术语，最初采用“标准式”)策略式表述模型是把每一可行的策略向量与支付向量相联系的函数（X1,…,Xn；u1,…,un）。“策略式”表述模型必须说明：（1）参与者集合{A,B}；（2）每个参与者的可行策略集合{N,NP}；（3）每个参与者采取某一可行的行动组合时，所获得的支付。注：策略式表述不涉及行动顺序。

-8，-80，-10-10，0-1，-1坦白P抵赖NP坦白P抵赖NP囚徒B囚徒A“扩展式”模型(VonNeumann和O.Morgenstern，1944)扩展式表述模型准确描述了参与者的行动顺序和参与者采取行动时所拥有的信息。“扩展式”表述模型必须说明：（1）参与者集合；（2）该轮到谁采取行动；（3）在他（她）的每个信息集中，可以选择什么；（4）在他（她）做出决策时，知道什么；（5）每个参与者采取某一可行的行动组合时，所获得的支付。思考：同时行动博弈是否可采用扩展式表述模型？扩展式博弈用博弈树（gametree）表示：结点：包括初始结点、决策结点(作出决策)、终结点(对应参与者报酬)；若结点是有限的，则称有限次博弈。枝：从一个决策结到它的直接后续结的连线,每一个枝代表参与者的一个行动选择；信息集：一个参与者无法作出区分的最大决策点集合（如图，囚徒B无法判断A的行动，因此其信息集为虚线连接）。例：扩展式囚徒困境B(-8,-8)(0,-10)(-10,0)(-1,-1)A坦白抵赖坦白抵赖坦白抵赖“扩展式”模型的几点说明：当事件中有偶然因素介入时，在初始结点引入“自然”参与者，因为偶然因素等价于“自然”在参与人之前行动但参与人不能观测到。完美回忆（perfectrecall）——通俗描述：当轮到某个参与者行动时，从不会忘记过去知道什么，做了些什么。——标准描述：在博弈树的每个信息集处，每个参与者知道以前的所有信息集，和在那些信息集所做的决策完美信息：如果博弈树的所有信息都是单结的，该博弈称为完美信息博弈。121UDRLLR练习1：“扩展式”表述模型的一个例子双人博弈中，每人都有两种行动，参与者1先行。a参与者2知道1的行动；b参与者2不知道1的行动；c有偶然行动，且2不知道1的行动1212N12练习2：剪刀-石头-布：双人博弈中，同时行动，每人有三个策略（石头Rock、剪刀Scissors、布Cloths）思考：如何用扩展式表述模型？0，01，-1-1，1-1，10，01，-11，-1-1，10，0CRCRSS12C12RCSRRRCCSSS(0,0)(-1,1)(1,-1)(1,-1)(0,0)(-1,1)(-1,1)(1,-1)(0,0)RCSRRRCCSSS21(0,0)(-1,1)(1,-1)(1,-1)(0,0)(-1,1)(-1,1)(1,-1)(0,0)对于非合作博弈的表述形式；

——“扩展式”模型（extensive-form）

——“策略式（标准式）”模型（strategic-form）“策略式”仅适用静态博弈例2：扩展式囚徒困境B(-8,-8)(0,-10)(-10,0)(-1,-1)A坦白抵赖坦白抵赖坦白抵赖囚徒A坦白抵赖坦白抵赖囚徒B例1：策略式囚徒困境-8，-80，-10-10，0-1，-1（一）经验主义博弈论与经验主义：博弈论并不是仅用于示意性说明的智力游戏，而是来源于社会现实中的矛盾冲突与合作。

——博弈模型需要经验证明：或者实验室进行；或者实地检验。(1)实验博弈：在可控的实验条件下进行有关策略相互作用的经验性研究。(2)通过分析经济社会的历史数据分析，可以对博弈模型的“理性”行为加以检验——即计量革命。三、其它重要概念（二）均衡均衡的存在性：纳什定理（1950，利用不动点定理证明）均衡的唯一性：非常不幸，经常面临的一个苦恼就是多个均衡同时存在（世界的多样性）非合作博弈理论的主要研究问题：多重均衡的选择与精练问题选择（selection）与精练（perfection）选择问题：在非合作博弈中，一些威胁和承诺是不可信的，如何选择那些能够实现一致预期的均衡结果；精练问题：对于博弈存在多重均衡的情况，如何判断哪些均衡更有可能实现。三、其它重要概念博弈均衡是如何形成的？？

Nas论文“Non-cooperativegames”（1950年）给出Nash均衡的两种解释，一种是“理性主义”某省市的、演绎的传统解说——均衡是通过理性的参与者进行严密的逻辑演绎推理得到的，对参与者的理性能力有较高要求（传统博弈分析，顿悟）。一种是学习的、归纳的、演化的解说——当时没有很好的方法构建数学模型（国际上90年代兴起演化博弈理论，渐悟）。佛教禅宗六祖慧能“顿悟”

六祖慧能原在一家小旅馆里打杂，有一天在给客人收拾东西的时候听客人在念《金刚经》。六祖慧能听罢便觉其某著名企业义博大，于是决心出家为僧。他投在五祖弘忍门下，每日做些杂务。有一日，五祖要门下众人将自己领悟的佛法写做一偈，大弟子神秀在门前徘徊，又返回居所。后来在墙上写的是：身若菩提树，心如明镜台。时时勤拂拭，莫使惹尘埃（渐悟）。弟子们看见了十分钦佩。五祖看了，却说他还没有领悟佛法的真谛。众弟子自然不明白其中的道理。又一日，有游客入寺。慧能请求游客帮忙，游客问他你为什么不自己写呢？慧能说我不识得字。游客笑他说：你连字都不识还能领悟佛法？慧能说我能否领悟，你看偈语便知道了。游客笑道：那好，你若能领悟，别忘记引我入法门啊！于是，慧能说，那游客写道：菩提本无树，明镜亦非台。本来无一物，何处惹尘埃？（顿悟）众人看后大惊，才知慧能果然领悟了佛法真谛！就这样，五祖将衣钵传与六祖慧能。而神秀则是北派佛教一代宗师！理性主义的均衡实现：均衡形成的“理性主义”的传统博弈观点，认为均衡形成纯粹是一个高度理性的智力游戏，并在瞬间实现了均衡。局限性举例：分：两个参与者对100美圆协商进行分配，如果无法达成一致意见，则都得不到。理论分析结果：在［0，100］之间的连续集合上有无限多均衡。实际结果将是50：50——因为这一均衡具有符合公平的社会原则特点，成为吸引注意力的焦点。Schelling（1960）提出焦点理论（focal-point）——多重均衡中考虑公平、效率、对等原则等社会和文化习俗因素。该观点是在个体“冰冷的”理性选择中（经济学规范），引入了社会准则的伦理道德（社会学规范）。演化主义的均衡实现：真实世界中，有限理性的人们，行为具有模仿、经验主义的、惯例特征，从错误和尝试中进行学习。（

“摸石头过河”）由于实际中会发生重复，时间弥补了较弱的理性。在学习过程中，有限理性的参与者在观察对手的行动后，根据一些实用主义的修正原则（各种动态调整过程），修改关于对手未来采取行动的预期。一个有意思的结果：如果动态的过程是收敛的，则将趋向于传统博弈的均衡点。即使参与者行为是有限理性的，群体行为的演化最终也学会达到理性均衡。根据进化论的均衡观点，传统博弈对多重均衡进行精练没有太大意义，因为真实世界中的均衡来自于历史演化的初始条件和演化过程中引起突变的一些随机事件。（三）合作

非合作博弈：除了规则允议以外，参与者之间无法达成有约束力的协议，作出的威胁、无法强制实施的，因此参与者只能根据“可察觉到的自我利益（perceivedself-interest）”决策.

例子：一次性囚徒困境博弈中攻守同盟的瓦解在非合作博弈中，仍可以出现内生的合作行为：

1无名氏定理揭示出，无限次重复博弈可摆脱“囚徒困境”；

人人文库> 全部分类> 办公材料 > 办公文档

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第2章博弈的基本知识

文档简介

温馨提示

最新文档

评论

第2章博弈的基本知识

文档简介

温馨提示

最新文档

评论

相关文档