博弈论导论笔记第一部分.docx_第1页
博弈论导论笔记第一部分.docx_第2页
博弈论导论笔记第一部分.docx_第3页
博弈论导论笔记第一部分.docx_第4页
博弈论导论笔记第一部分.docx_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

在所有社会中,人们的行为总是会相互影响的(合作、竞争)。术语“相互依赖性”,表示一个人的行为对另一个人的福利造成的影响,不管这种影响是正面的还是负面的。 相互依赖的情形可称为“策略环境”,因为人们为了确定所采取的最优行动,必须考虑他周围的其他人会怎么行动。 博弈论有助于你对这个社会是如何运行的问题做出评估。非合作博弈论在“非合作博弈”的框架内,我们可以将策略环境理解为通常字面上博弈(game)的含义。因为名词博弈意着这样一种环境,其中两个及以上的对手进行才智的比拼,因此游戏中必然存在这样的依赖性,也就是一方的最优行为取决于他所相信的对方会采取的行动。非合作博弈论区别于其他研究策略的理论框架的一个主要特征是:非合作的框架把所有人的行动都当成是个别行动(individual actions)。 个别行动指的是一个人进行自主决策,而与这个策略环境中的其他人无关。这个理论框架并没有排除以个人限制另一个人的可能性;也并非与参与人进行群体决策的情况不相容。在群体决策的情况下,非合作理论模型要求理论学者规定如何做出决策的程序。这个程序包括了规定行为人如何就选择权进行谈判,其中可能有讨价还价(都视为个别行动)。事实上,其中的任何一个人所做出的每一个决定都可以模型化为个别行为。合同及合作博弈论在某些情况下,从所有决策都被看作是个别行动的思路抽离出来也就是,跳出非合作博弈论模式,根本不将协商过程模型化,而单单将协商的结果看作是一个联合行动(joint action),这样反而对研究更有帮助。 这种理论称为“合作博弈论”(cooperative game theory)。这本书将合同视为策略互动整体化的一个部分,因此,对合同的选择和执行要特别予以注意。将联合行动的概念纳入策略模型是一个简化装置,使得你可以刻画行为人之间就某些事情进行协商,但不用明确的将协商过程本身模型化。行为人如果就 联合行动达成协定,将受其约束而采取相应行动,从这个意义上说,协商的目标可以认为是“可实时缔约(spot-contractible)的。“博弈“的含义简而言之,博弈是策略环境的正式描述。因此,博弈论是研究相互依赖情形的正式的方法论。本书的前半部分强调了在策略互动中由理论所确定的三个主要矛盾(tensions):(1)个别利益和集体利益之间的冲突 ,(2)策略不确定性,以及(3)无效率协调的阴影。 制度有助于缓和这些矛盾。 关于博弈的正式表述含有以下共同的要素:1. 博弈的一组参与人;2. 对于参与人可能采取行动的一个完整描述(即它们的可行行动集);3. 对于参与人采取行动时所知信息的描述;4. 对于参与人的行为将如何导致博弈结果的规定;5. 对于参与人对结果的偏好的定义。 非合作博弈的数学描述有两种通常的形式:扩展型(extensive form)和标准(策略)型normal (strategic) form。 我们可以用一个树状结构图来表示两个人之间的决策互动,这种树状结构由节点和分支组成,节点表示博弈过程中事件的发生点(比如参与人之一做出的决策),而分支表示参与人能够选择的不同行为方案。我们用实心圆来表示节点,并用连接节点的箭头来表示分支。一个适当构造而成的树状结构就称为“扩展型表述(extensive-form representation)。图2.4描述了博弈中所有参与人的行动及信息。节点a、b、c、d和e都称为决策点(decision nodes),因为参与人在博弈的这些节点上做出决策。其他节点(f , g , h , l , m和n)称为终止点(terminal nodes); 它们表示为 博弈的结果博弈结束的地方。每一个终止点也同时对应于一条唯一的沿着决策树的路径,这是一条从初始点出发,沿着箭头的方向由各分支连接,贯穿整个决策树的决策路径。 在扩展型中,路径和终止点之间有一一对应的关系。一般来说,我们用信息集来定义各参与人在博弈中的决策节点所拥有的信息。 一个信息集描述的是那些用虚线互相连接的决策节点(意思参与人无法区分这些节点)。 每一个决策点包含在某个信息集里,一个信息集可包含一个or多个决策节点,如:节点a的信息集就只包含一个节点,c和d 则包含在同一个信息集里。一个博弈中的每个信息集明确的描述了各参与人必须做出的不同决策。通常用数字来表述参与人的偏好排序时最简便的,这也称为得益(payoffs)或效用(utilities)。越大的回报数字意味着更为偏好的结果。在某些博弈中,一个参与人可能从无限多的行动中进行选择。定义:策略(strategy) 是博弈中参与人的一组完整的相机的行动计划。“完整的相机的计划”是对一个参与人行为的完整描述,它包含了这一个参与人在它的每一个决策点上所做出的行为,即策略描述的是在它的每个信息集中它所做出的行动。我们用Si来表示参与人i 的策略空间(strategy space),也称为策略集合(strategy set)。也就是说,Si是包含了改博弈的参与人i的每一个可能策略的集合。我们用小写字母来表示单个策略(即这些集合中的一般元素),则siSi是博弈中参与人i的一个策略。一个策略组合(strategy profile)是关于策略的向量,每一项表示一个参与人。换句话说,一个策略组合描述了博弈中所有参与人的策略。举个例子,假设我们在研究一个有n个参与人的博弈。那么一个典型的策略组合就是这样一个向量,s = (s1, s2、,sn),其中si是参与人i的策略,i=1,2,,n。S表示策略组合的集合。在数学上表示为S = S1S2Sn。(符号表示笛卡尔乘积。比如S1=A,B,S2=X,Y,那么S = S1S2 = (A,X),(A,Y),(B,X),(B,Y)。)对于某个参与人i,我们经常要说到博弈中其他所有参与人所选择的策略。就符号而言,用 i来指代除了参与人i之外的所有其他参与人会比较方便。因此,s-i 是关于除参与人i之外的所有参与人的策略集合:s-i = (s1, s2、,si-1, si+1,sn)将一个策略组合s分为参与人i的策略和其他参与人的策略,我们可以写为s = (si, s-i)。 对于每个参与人i,我们可以定义一个函数ui:SR(这个函数的定义域是策略组合的集合,它的值域是实数),因此,对于各参与人所选择的每个策略集合sS,ui(s)是参与人i在博弈中的得益。这个函数ui称为参与人i的得益函数(payoff function)。策略和得益可以作为一个博弈的基本表述,其正式定义如下:用标准型(normal form)表示的博弈(也可称之为策略型(strategy form)包含一组参与人,1,2,n,各参与人的策略空间S1,S2,,Sn,以及各参与人的得益函数u1,u2,un。 具有有限策略空间的博弈型两方博弈可以用得益矩阵来表示。因此,这种博弈有时又称为“矩阵博弈”。标准博弈的经典例子对标准型的解释看图4.3中包含的标准型和扩展型可以发现,由两个扩展型得到的标准型是相同的(对此你可以进行核实)。这就证明,虽然把扩展型变为标准型只有唯一的一条路径,但反过来则不尽然

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论