版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
§1.博弈论概述§2.完全信息静态博弈§3.完全信息动态博弈§4.不完全信息静态博弈§5.不完全信息动态博弈第十章博弈论第一节博弈论概述博弈论(theGameTheory)也就是运筹学中的对策论,“是关于策略相互作用的理论”,研究两个或两个以上参加者在对抗性或竞争性局势下如何采取行动,如何作出有利于己方的决策及其均衡问题。对策思想最早产生于我国古代。对策思想明确地应用于经济领域,始于Cournot(1838),Bertrand(1883),Edgeworth(1925)等人关于寡头竞争、产量与价格垄断、产品交易行为的研究。JohnF.NashJr博弈论提供了一种研究人类理性行为的通用方法,运用这些方法可以更为清晰完整地分析各种社会力量冲突和合作的形势,具体分析人与人之间在利益相互制约下理性主体的策略选择行为及相应结局。博弈论强调在既定约束条件下追求效用最大化(服从微观经济学的一般分析方法)。同时,信息和时序问题成为博弈论的两个重要的分析工具。一、博弈论的基本概念
博弈论研究人与人之间相互“斗智”的形式和结果。当经济主体间的利益存在冲突时,一方所获得的利益不仅取决于自己所采取的行动,而且也取决于其他主体采取的行动或对自己行动的反应。博弈论就是描述在这种形势下各方理性地选择自己的行动所实现的结果,分析各决策主体的行为发生相互作用时的决策以及这种决策的均衡问题。博弈论的基本概念包括:局中人、策略、支付。
①局中人(Player):局中人是指在博弈中选择行动以最大化自身效用的决策主体。可能是个人或团体(如国家、企业等)。
②策略或策略空间(Strategy):策略是局中人选择行动的规则,它规定局中人如何对其他人的行动作出反应,即在每种可能的情况下应该如何行动。它与行动不同,行动是局中人的决策变量。如“人不犯我,我不犯人;人若犯我,我必犯人”是一种策略,而“犯”与“不犯”是两种不同的行动,策略规定了什么时候选择“犯”什么时候选择“不犯”。局中人可选择的策略的全体构成了策略空间(或策略集)。③支付(Payoff)(支付函数与支付矩阵):博弈论中,可用数值表示各局中人从博弈中所获得的收益或效用水平,该数值称为支付。支付依赖于各个局中人所作出的策略,这种收益与策略的依赖关系构成了支付函数。参与博弈的多个局中人的收益可用一个矩阵或框图表示,这种矩阵或框图叫做收益矩阵。除此之外,博弈论中的基本概念还包括:行动、信息、结果和均衡。它们关系是:行动是局中人的决策变量;信息是局中人在进行博弈时有关其他局中人的特征和行动的知识;结果是博弈分析者感兴趣的要素的集合;均衡是所有局中人的最优策略或行动的集合。
①根据博弈者选择的策略,博弈论可划分为合作博弈与非合作博弈。纳什(Nash)、泽尔腾(Selten)和海萨尼(Harsanyi)(1994诺贝尔经济学奖获得者)的主要贡献在于非合作博弈方面,而且现在大多数经济学家论及博弈时,也主要是指非合作博弈。一、博弈论的基本概念
合作博弈和非合作博弈的区别在于人们的行动为相互作用时,当事人能否达成一个具有约束力(bindingagreement)的协议。若有,就是合作博弈;否则就是非合作博弈。例如,两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,且各自按该协议生产,即是合作博弈。其面临的问题是如何分享合作带来的剩余。但若两个企业间的协议不具有约束力,即没有哪一方能强制另一方遵守该协议,每个企业都只选择自己的最优产量(或价格),则是非合作博弈。另外,合作博弈强调的是团体理性、效率、公正和公平。非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的。②从局中人行动的先后顺序可划分为静态博弈(Staticgame)和动态博弈(dynamicgame)。静态博弈是指在博弈中,局中人同时选择行动或虽非同时行动但后行动者并不知道先行动者采取了什么具体行动。动态博弈是指局中人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。③从局中人是否具有有关其他参与人(对手)的特征、策略空间及支付函数方面的知识的角度,可划分为完全信息博弈(gameofcompleteinformation)和不完全信息博弈(gameofincompleteinformation)。
“完全信息”指的是每个局中人对所有其他参与人的特征(策略空间、支付函数等)有完全的了解,“静态”指的是所有局中人同时选择行动且只选择一次。纳什均衡是完全信息静态博弈解的一般概念,也是所有其他类型博弈解的基本要求。本节先讨论纳什均衡的特殊情况,然后讨论纳什均衡的一般概念。在博弈论里,一个博弈可以有两种表述方式:一种是策略式(strategicformrepresentation)表述,另一种是扩展式(extensiveformrepresentation)表述。前者适合于讨论静态博弈,后者适合于讨论动态博弈。在策略式表述中,所有参与人同时选择各自的策略,所有参与人选择的策略一起决定每个参与人的支付。第二节完全信息静态博弈
通常情况下,每个局中人的支付是博弈中所有参与人策略的函数,故每个局中人的最优策略选择依赖于所有其他参与人的策略选择。但在一些特殊博弈中,一个参与人的最优策略选择可能并不依赖于其他参与人的策略选择,即无论其他参与人选择什么策略,他的最优策略是唯一的,这种最优策略被称为“占优策略”(dominantstrategy)。例:“囚徒困境”囚徒困境是博弈论中的经典案例。该故事讲的是,两个嫌疑犯作案后被警察抓住,分别被关在不同的房间里进行审讯。警察知道两人有罪,但缺乏有力的证据,除非两人之中有一个坦白。警察告诉每个人,他们的可选择的策略与支付如下表:一、占优策略均衡在该博弈中,每个囚徒有两种可能选择的策略:坦白和抵赖。显然,无论同伙选择什么策略,每个囚徒的最优策略都是“坦白”。如,B选择坦白,若A选择坦白时支付为-8,选择抵赖时支付为-10,因而坦白比抵赖好;若B选择抵赖,A坦白时的支付为0,抵赖时为-1,因而坦白比抵赖好。即是说,“坦白”是A的占优策略。同样,“坦白”也是B的占优策略。
B
A坦白抵赖坦白-8,-80,-10抵赖-10,0-1,-1
三、纳什均衡纳什均衡(Nashequilibrium)是指这样一种均衡,博弈中的每个局中人都确信,在其他局中人策略给定的情况下,他选择了最优策略。其核心思想是:博弈的理想结局是,每个局中人选择的策略是对其他局中人所选策略的最佳反应,其中每一个局中人都不能因单方面改变自己的策略而获益。当参与人的策略空间很大时,按上述方法检查每一个策略组合是不是纳什均衡很繁琐。在两人博弈中,有一简单的方法。首先,考虑A的策略,对于每一个B的给定策略,找出A的最优策略,在其对应的支付下划一横线,然后,用类似的方法找出B的最优策略,若某个支付格的两个数字下都有横线,则该格对应
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年江苏省溧水县重点名校中考适应性考试物理试题含解析
- 山东省淄博市张店区重点达标名校2026届中考物理猜题卷含解析
- 山东省单县北城第三初级中学2026届中考物理全真模拟试卷含解析
- 2026届山东省滨州市阳信县重点名校初中物理毕业考试模拟冲刺卷含解析
- 2026年义乌市中考物理猜题卷含解析
- 2026届安徽省宣城市中考物理考试模拟冲刺卷含解析
- 中医养生护理表
- 临床护理技能与素养提升
- 扬州社区工作者考试真题库(2025版)
- 护理服务流程与康复护理
- 2026年建筑施工焊工考试试题及答案
- 2026年上海市初三语文二模试题汇编《综合运用》含答案
- (2026版)《煤矿重大事故隐患判定标准》培训课件
- 2026年无锡小升初语文小升初分班考卷:语文阅读写作与基础积累(冲刺讲评版第2套)含参考答案、逐题解析与评分细则
- 2026贵州遵义余庆县公安局面向社会公开招聘警务辅助人员18人笔试备考题库及答案解析
- 2026年安全月知识竞赛试题附答案
- 2026年北京市西城区初三下学期二模英语试卷和答案
- 2026年新版应急处置卡共31项含管理和操作岗位
- 2026年江苏省宿迁市泗洪县中考数学二模试卷(含答案)
- 社区特殊人群服务管理操作规范
- 体检中心感染工作制度
评论
0/150
提交评论