群决策详解课件_第1页
群决策详解课件_第2页
群决策详解课件_第3页
群决策详解课件_第4页
群决策详解课件_第5页
已阅读5页,还剩128页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

群决策王国华群组决策社会选择理论专家咨询法博弈论群决策的引出传统的决策分析所研究的问题中,决策者可以是一个人,或者是可以当作一个人处理的意见完全一致的集体。

在现实生活中,每一项决策都应当尽量满足受到该决策影响的所有群众的愿望和要求,或者由集体制订决策。群决策集中群众各成员的意见和要求,形成群的意见,并以此为依据作出决策的过程,称之为群决策或群组决策。群决策是研究多人如何作出统一的有效抉择。群可以在成员意见一致的情况下制订决策也可在意见不一致的情况下制订决策。群决策分类群决策注意的问题应当尽量避免在意见不一致的情况下制订决策,注意下列问题:避免由少数人控制集体,否则失去群决策的意义。不能急于求成。不可滥用投票表决的办法。回避不必要的争论,必要时应通过第三者的干预来取得一致意见,制订决策。

群形成一致意见的要求尊重其他成员和其他成员的意见。

讨论要充分。

不断征求不同意见。

注意决策过程的引导。

群决策理论的基本假设群决策的理论建立在个体决策理论的基础上,因此,个体决策理论假设也是群决策假设。如:对决策者理性

的假设,偏好的传递性

要求等。任何个体决策者难以作出完美决策,都可能会犯错误。

至少有两名决策者需要共同负责决策。

群决策理论的基本假设群决策一般来说是非结构化的复杂决策问题。

群决策的结果应该是个体决策者的偏好形成一致或妥协之后得出的。

群决策的质量受到所采用决策规则影响。

群决策质量受个体和群体的关系影响。

第一部分社会选择理论

——阿罗不可能定理王国华社会选择的定义社会选择就是根据社会中各成员的价值观及其对不同方案的选择产生社会的决策;即把社会中各成员对各种状况的偏好序集结成为单一的社会偏好模式从形式上看,社会选择是典型的群决策问题,但从更深层次分析,社会选择理论研究的是“个人价值与社会选择之间的冲突与一致性的条件”。社会选择的常用方式惯例、常规、宗教法规、职权、独裁者的命令、投票表决和市场机制社会选择的方式投票:少数服从多数,大多用于解决政治问题市场机制:本质是用货币投票,大多用于经济决策独裁:根据个人意志进行(取代)社会选择

传统:以惯例、常规、宗教法规等代替社会中各成员的意志传统到独裁的演变传统(无论惯例、常规还是宗教法规)在开始时是社会上大部分公民或成员认可的规则(以及规定、法规),随着社会的发展,总有新的问题、新情况是原来的规则(以及规定、法规)所无法解决的,解决这些新的问题、新情况的新规则就要由社会上比较有威望的某些人制订,这些人在解决新问题、新情况时就代替整个社会进行了选择。只要这些人不是以民主方式选举产生的,他们的权力就会逐渐增大,成为代替社会进行决策的小团体。这个小团体中最强有力的人物最终也就有可能成为独裁者。群决策——福利经济学福利经济学派研究的是整个社会的福利问题,他们企图使社会中资源和商品的分配产生最大的社会福利,它从社会福利的观点去评价各种可能的社会状况。认为社会福利是一种能测度的量,定义社会福利函数来度量社会福利。W(x)=G[(Ul(x),…,Un(x))]社会福利函数在用社会福利函数去研究实际问题时的两个问题:怎样确定社会福利函数?由谁来确定社会福利函数值?福利经济学家认为可以集结社会中各成员福利函数形成社会福利函数(即群的效用函数),而阿罗(Arrow·K·J)则认为不存在这种社会福利函数。

阿罗的不可能定理社会福利函数是一类特定的集体选择的规则,它要对每个偏好断面设定群对所有方案的排序。如果不加条件限制,则集体选择规则的数量是惊人的。阿罗想通过列举一组社会福利函数所应具有的合理的性质来把集体选择规则约束为一个较小的数目。

阿罗社会福利函数的性质(1/3)阿罗列举的社会福利函数应具有的性质:(一)完全域

对备选方案的个人偏好排序的所有可能的组合,社会选择过程都有能力达成社会决策。因此,个人如何选择他的偏好排序是无关紧要的,个人面临一组选择方案时可以按照自己的意愿排列偏好次序。(二)无关方案独立性

对于两个备选方案的任一选择,只依赖于个人对仅此两个备选方案的排序,而与其它备选方案的排序无关。阿罗社会福利函数的性质(2/3)(三)成员的主自权

社会偏好次序是从所有逻辑上可能的个人偏好次序的范围内推演而来的,而不是通过限制个人偏好次序的范围而获得的,即它社会福利函数不应该是强加的。这一条件表达了自由选择的思想。(四)非独裁性

社会中不存在这样一种个人,对方案集中的任一对方案X和Y,只要他认为X优于Y,社会就认为X优于Y。就是说,社会偏好次序不受某些个人的偏好所左右,任何个人不能把他的偏好强加为社会的偏好。阿罗社会福利函数的性质(3/3)(五)群与个人排序的正联系

假设对于某一特定的偏好关系,社会排序的结果是X优于Y,如偏好关系作了如下修改:(1)个人对不涉及方案X的方案做成对比较,其偏好不变;(2)个人对方案X与其他方案作成对比较时,或者偏好不变,或者变得对X更有利。即方案X在个人的排序中的位置有所提高或保持不变,则群的排序仍有X优于Y。阿罗不可能定理美国斯坦福大学教授阿罗在1951年发表的《社会选择和个人价值》一文中证明了:不存在任何一种社会选择方法能同时满足两条公理和具备五个性质,即:不可能存在一种社会选择的机制,能够把个人对多种备选方案的偏好次序转换成社会偏好次序,并且准确表达社会全体成员的个人偏好。这就是著名的阿罗不可能定理,又称独裁定理。次序关系的两个公理:传递性公理、连通性公理

多数票法则的谬误设有成员甲、乙、丙,有三个备选方案:a1,a2,a3,成员甲认为a1>

a2>a3,成员乙认为a2>

a3>

a1,成员丙认为a3>

a1>

a2。将方案作成对比较后,对方案问的优先关系投票表决结果为:

a1>

a2二票赞成一票反对,同样多数成员认为a2>

a3,故群据传递性公理应认为a1>

a3。实际上a1>

a3为二票赞成一票反对,与上面的结论矛盾。

成员次序甲乙丙1a1a2a32a2a3a13a3a1a2打分法对方案排队的问题成员次序甲乙丙1XZZ2YXX3ZYY方案成员XYZ甲321乙213丙213总分747成员次序甲乙丙1XZZ2ZXX3YYY方案成员XYZ甲312乙213丙213总分748开始时:改变后:打分法对方案排队的问题打分的方法既符合两条公理,也满足性质一,三,四,五,但是不满足性质二:无关方案的独立性。改变前方案X和Z各得7分,Y得4分;改变后Z增到8票,X仍7票,Z优于X。虽然三个成员对方案X和Z的排队均未改变,但优先序发生改变。简单多数票法则的谬误由11个成员组成的群,要在a、b、c、d

四个候选人中选举一人.设各成员心目中的偏好序如下:

成员i1234567891011排序第一位aaabbbbcccd

第二位c

ccaaaaaaaa

第三位dddccccddd

c

第四位bbb

ddddbbbb

按简单多数票法则,b得4票当选。实际上,虽然有4人认为b最好,但是有7人认为b最差;虽然只有3人认为a最好,但是其余8人认为a是第二位的;所以,由a当选为宜。

过半数规则的谬误设各成员心目中的偏好序如下:成员i1

2345

6

7

8

91011排序第一位bbbbbbaaaaa

第二位aaaaaac

ccdd

第三位cc

c

dddd

ddcc

第四位dddccccbbb

b按简单多数票法则或过半数规则,b得6票当选。实际上,虽然有6人认为b最好,但是有5人认为b最差;虽然只有5人认为a最好,但是其余6人认为a是第二位的;所以,由b当选未必合适。

二次投票的谬误设各成员心目中的偏好序如下:成员i

12345678910

11排序第一位bbbc

cccddaa

第二位aaaaaaaaa

b

d

第三位dcdbbbdcbdc

第四位cdcdddbbc

cb

按过半数规则,第一次投票由于无人获得过半数选票,c、b得票多进入第二次投票;第二次投票时,6人认为c比b优,c当选。然而,在该问题中没有人认为a处于第二位以下,却有4人认为c最差。投票规则投票是现实世界中将个人偏好加总为集体偏好时常用的方法,每种投票方式都事先设定了一组复杂程度不同的规则,每一规则都会对投票结果产生重要的影响。投票规则包括:第一组是涉及到投票的参与者,即谁可以投票,以及每个投票人可以投票的票数;第二组规则涉及到投票程序;第三组规则涉及到确定投票结果的程序,即采用何种方式来确定最后胜出的备选方案。投票程序第二组规则即投票程序,包括:提出需要投票的备选方案的过程,确定可以提出提案的人选;适当的投票程序,基本上有两种规则,一是二取一规则,就一对备选方案进行投票,二是相对多数规则,对两个以上的备选方案同时进行投票;投票的次序,即先在哪些备选方案中进行投票,这对于三个以上的备选方案不进行同时投票时很重要,可以影响投票的结果。投票结果确定规则第三组规则涉及到确定投票结果的程序,即采用何种方式来确定最后胜出的备选方案。例如,可以在一致性规则和多数规则间进行选择,在这两种情况下,个人偏好在社会选择中受尊重的程度不同。多数规则有许多形式孔多塞标准、博尔达计算、淘汰投票、赞同投票等等。咖啡或茶待客问题甲认为:咖啡>茶乙认为:茶<咖啡由甲乙构成的群不能作结论,但若抛开无关方案独立性条件:甲认为:咖啡>茶>牛奶>汽水>可乐>啤洒

乙认为:茶<牛奶<汽水<啤洒<可乐<咖啡则似以茶待客为宜。咖啡或茶待客问题(续)若甲、乙表达的对饮料的偏好强度如右图所示:则仍以咖啡待客为宜。即:若各成员的偏好强度可测,则集结成员偏好序就变成了集结各成员的基数效用。效用人际间可比吗?效用函数与阿罗不可能定理阿罗在集结群中各成员的偏好排序形成群的偏好序时,避开了个人对各方案的偏好强度,及偏好强度的人际比较;否认效用函数的基数性,否认效用在人际比较的可能性。如果把阿罗的集结成员偏好序的概念改为集结各成员的基数效用函数,则阿罗的不可能定理就成为可能定理。

第二部分专家咨询法王国华专家咨询法的由来专家咨询法又称德尔斐(Delphi)法。Delphi原是一处古希腊遗址,是传说中可预卜未来的阿波罗神殿所在地。美国兰德公司在20世纪50年代与道格拉斯公司协作时,曾以“德尔斐”为代号,研究如何通过有控制的反馈更为可靠地收集专家意见的方法。德尔斐法便由此而得名。它应用极广(占常用预测方法总数的24.3%)。专家咨询法的概念德尔斐法是就一定的问题函请相关领域的专家提出意见或看法,然后将专家的答复意见或新设想加以科学地综合、整理、归纳,以匿名的方式将所归纳的结果反馈给各专家再次征询意见。如此经过多轮反复,直到意见趋于较集中,得到一种比较一致的、可靠性较高的意见。Delphi法的应用领域在长远规划者和决策者心目中,德尔斐法享有很高威望,并逐渐成为一种重要的规划决策工具。在G.A.STEINER所著的高层次管理规划一书中,把德尔斐法当作最可靠的技术预测方法。德尔斐法应用的领域主要有:军事领域、机械工业科技发展和市场需求预测、人口预测、医疗和卫生保健预测、经营预测、教育预测、研究方案的评价、信息处理、以及社会各界的规划等等。Delphi法的特点匿名性不断重复的受控的信息反馈对集体答复进行统计处理根据小组成员的回答可提出中位数和上下四分点,中位数代表小组的倾向性意见,上下四分点之间的间隔代表意见的分歧程度或者平均值一一方差法对方案进行排队或择优。Delphi法的构成要素德尔斐法由三个要素组成:一是一名协调人;二是一群与决策问题有关的专家;三是一套特制的征询调查表和程序。Delphi法协调人的工作确定需要咨询的问题挑选专家。人数不拘。通常一般问题为十至五十人,重要问题一百人左右。专家挑选应照顾到问题不同的方面。寄出征询调查表收集、归纳综合、整理反馈征询结果并进行下一轮的意见再征询提出预测报告或者决策建议Delphi法使用需要注意的问题专家小组成员的选择必须得到专家的同意要使专家明白德尔斐法的工作程序要简化调查表问题的数目(根据经验,25个问题应考虑为调查的上限)必须克服协调人意见的介入德尔斐程序的工作量调查周转时间(德尔斐预测调查如利用邮寄,通常每两次调查之间要花费一个月的时间。)Delphi法的评价德尔斐法自从应用以来,在大多数情况下,专家的意见能够趋向一致,调查结果具有较强的收敛性,但也出现过无法取得一致意见的情况。然而通常无法取得一致意见并不意味着德尔斐法运用的失败。在运用德尔斐法的过程中,经常可以发现由于学派的不同而产生不同或者对立的观点,这样可以使组织者从不同的角度考虑问题,有利于对问题的深入研究。德尔斐方法作为一种决策或预测的有效工具,其价值在于结果的有效性,有大量事例证明了其预测结论的准确性。Delphi法的评价德尔斐法不受地区和人员的限制,用途广泛,而且能引导思维,提供了一种系统的预测方法。在缺乏足够历史资料的领域中,有时只能用这种方法来解决问题。但是德尔斐法也存在一些不足之处,主要有:预测结果受主观认识的制约。专家思维的局限性会影响最终的效果。德尔菲法在技术上仍不够成熟。例如专家的概念没有完善的客观的衡量标准,征询调查表的设计也难以掌握,有时会比较粗糙。德尔斐法的操作程序德尔斐法就是用一系列征询调查表向专家集体征询意见。每一次调查就叫“一轮”,每一轮要求专家小组成员和协调人完成的任务均有所不同。所谓“征询调查表”可能容易造成误解。征询调查表不仅仅提出问题,而且还要向专家成员提供有关集体意见情况和其他专家成员各自的观点等信息资料。以下介绍的是兰德公司创建的“传统”的德尔斐法具体实施步骤:德尔斐法的操作程序第一轮。第一份征询调查表是没有固定格式的,允许任何回答。首先,提出使用德尔斐法所要咨询的问题其次,选择和确定专家小组的成员再次,制定第一份征询调查表,并把其散发给每个专家成员最后,协调人收回第一份征询调查表并进行分析。至此,完成了德尔斐法的第一轮调查德尔斐法的操作程序在整理专家们的意见时,无论什么情况,协调人都不能把自己或组织的意见掺入专家们的反应中。如果组织认为收集到的意见明显地忽略了所提出的问题中某些有意义的重要因素,组织者应该考虑到所选择的专家小组不符合条件,可以考虑重新挑选更换专家小组中的成员。

德尔斐法的操作程序第二轮。首先,要制订第二份征询调查表并散发给各个专家。(这时要把根据第一轮调查结果综合归纳出来的事件一览表发给各个成员,并展开第二轮调查。)其次,协调人收集第二份征询调查表,对专家成员们的意见进行统计处理,再制订第三份征询调查表。德尔斐法的操作程序这一轮除了要求专家对表中所列各项方案或事件继续发表补充或修改意见外,还要他们对表中的每个方案或事件做出评估。专家成员的评估意见应以最简单的方式表示,如打分法,在这一步还希望成员说明做出这种选择或估计的理由。在第三份征询调查表中除了反映第二轮调查的统计结果之外,还应当把成员所说明的理由作一小结。这个小结既要简洁、便于阅读又能充分反应专家们彼此之间意见分歧,这样,在第三份征询调查表中充分概括了第二轮调查中所获得的信息。德尔斐法的操作程序第三轮。首先协调人把第三份征询调查表散发给专家小组的成员,专家小组成员在受到反映专家小组意见的综合统计报告后,要仔细审阅统计的结果,了解意见的分歧和各种意见的理由,再对方案或事件作出新的评估。其次是协调人回收第三个征询调查表,并处理收集到的意见,即重新计算方案或事件的平均值,方差,上、下四分位点,对专家们的争论作出小结,至此,完成了德尔斐法的第三轮。德尔斐法的操作程序第四轮咨询,是第三轮的重复。在第四轮结束时收集和整理第四份征询调查表所获得的信息。经典的德尔斐法共四轮。在大部分场合,经过几次信息反馈已能得到协调程度较高的结果。一般经验是,经过连续几轮调查,小组估计数值趋向集中。小组成员通常在第二轮对每一事件的估计数值有较大的差别。但是,后来由于小组成员提出了更改估计数值的理由,下几轮的估计数值就趋向更理想的结果了。这种集中收敛过程是由于信息资料的传递和小组成员相互影响形成的。如果专家小组成员的确难于达成一致意见,则协调人需要从各方得到他们的最后意见,并把这种不能达成一致的意见作为德尔斐法的最终结果。征询调查表的制定征询调查表是使用德尔斐法进行决策或预测的一个主要工具。征询调查表制定的好坏,直接关系到决策或者预测结果的优劣。制定时,需要注意以下几点:对德尔斐法作出简要说明问题要集中并有针对性,要按等级排队,先整体,后局部。同类问题中,先简单,后复杂避免组合事件用词要确切征询调查表要简化要限制问题的数量不应强加领导者个人的意见征询调查表的制定专家小组中成员的选择如果要求比较深入地了解内部的历史情况和技术政策,或牵涉到本部门的机密问题,最好从内部选取专家;如果决策或预测任务仅仅关系到一些具体技术的发展,最好同时邀请部门内外的专家。在选择专家是要考虑到:广泛的代表性有较高的权威性对提出的问题深感兴趣并有时间参加德尔斐法分析的全过程成员人数要适当德尔斐法中常用的统计方法四分位法将评价结果依次表示在横轴上,并把数据分为四等分。中分点称为中位数,小于中位数的四分位点成为上四分位点,大于中位数的四分位点成为下四分位点。上下四分位点越接近中位数,表示专家评价意见越集中。落在上下四分位点之外的评价值,表示该专家与多数专家与多数专家意见分歧。德尔斐法中常用的统计方法四分位法在实际操作中,上下四分位点可以用经验公式计算。在预测事情完成时间的统计处理中,设中位数为T0,组织预测时间为T,中位数与组织预测时间之差为T

-T0=X

,则上四分点T1和下四分点T2分别为德尔斐法中常用的统计方法平均值——方差法方案的优劣程度常用方案的评分值表示。设有m个专家对个n方案进行评价,评价矩阵其中aij表示第i个专家对第j个方案的评分值,分值一般取0~100分。方案评分均值和方差分别为:德尔斐法中常用的统计方法直方图结构预测结果和状态预测结果均可用直方图表示。表示结构预测结果的直方图的横坐标是结构相对数,一般以每20%为一单位,0~100%分为五段,其纵坐标为预测目标将呈现何种结构的专家人数占全部专家人数的比重。而表示状态预测结果的直方图,其横坐标为预测目标可能出现的各种状态或备选方案,其纵坐标为预测某状态出现或择优的专家人数占全部预测专家人数比重,即各状态出现或各方案被选优的可能性。若对各专家评判赋予不同的权重,那么预测结果将发生变化。德尔斐法中常用的统计方法两类派生的德尔斐法自从兰德公司创立德尔斐方法以来,在实际运用过程中,德尔斐法出现很多变化的形式,这些派生的德尔斐法都是对原来的德尔斐法做出某些修改而产生的。派生的德尔斐法主要可以分为两类:第一类是保持传统的德尔斐法的基本特点;第二类是改变其中一个或者多个特点。第一类派生Delphi法这类主要是对传统的德尔斐法中的某些部分进行修正,从而排除传统的德尔斐法中的一些不足。列出未来事件一览表向专家提供背景资料增加或者减少调查轮次多重日期对结果进行自我评价使用计算机进行分析第二类派生Delphi法部分匿名的德尔斐方法德尔斐方法也可用于面对面的会议中,论点可以公开,估计值则仍然匿名,并通过秘密投票。有时也可以用意见征求器电子装置来代替。部分取消反馈的德尔斐方法第三部分博弈论王国华博弈论的起源博弈论(Gametheory)又称对策论、游戏理论或策略运筹学。它最早由德国数学家、哲学家莱布尼茨于1710年提出。1713年,杰姆斯·瓦尔德格雷夫首次提出极大中的极小定理(minimax)。1944年,以冯·诺依曼和奥斯卡•摩根斯坦合著《博弈论与经济行为》出版为标志,博弈论得以广泛应用于经济学领域,并成为微观经济学一个新的重要组成部分。

博弈论的研究对象研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。博弈论与传统经济学有关决策理论区别后者涉及的个人决策,是在给定价格参数和收入的条件下,追求效用最大化的决策;个人效用只依赖于自己的选择,而不依赖于他人的选择。而博弈论看来,个人效用不仅依赖于自己的选择,而且依赖于他人的选择;个人的最优选择是其他人选择的函数。

博弈论的类型博弈论包括两种类型:合作博弈非合作博弈通常提到的博弈论,一般是指非合作博弈,如下象棋。生活中的很多游戏如打“八十分”,下陆战棋“四国大战”,就同时包含两种形式的博弈。非合作博弈论的起源创立于50年代。1950年,年仅22岁的纳什连续发表两篇划时代的论文:《N个人对策的均衡点》与《讨价还价问题》,1951年又发表了《非合作对策》。塔克(A.Tucker)在1950年他的一篇名为《两个之谜》的论文中对“囚徒困境”作了明确的定义。他们两人的著作基本上奠定了现代非合作博弈论的基石。博弈论的发展泽尔腾则在60年代中期将纳什均衡概念引入动态分析。在1965年发表《需求减少条件下寡头垄断模型的对策论描述》一文,提出了“子博弈精炼纳什均衡”的概念,又称“子对策完美纳什均衡”。这一研究对纳什均衡进行了第一次改进,选择了更具说服力的均衡点。海萨尼在60年代末把不完全信息引入博弈分析。博弈论的发展80年代后,克瑞普斯(kreps)和威尔逊(wilson)则对不完全信息动态博弈的研究作出了突出的贡献,并提出了更高级的均衡概念:“贝叶斯精炼纳什均衡”或称“完美贝叶斯均衡”。严格地说,博弈论并不是经济学的一个分支。它是一种方法,实际上,它属于数学范畴。博弈论与经济学博弈论在经济学领域应用最广泛,也最成功;博弈论的许多成果是借助于经济学的例子来发展引申的。经济学家对博弈论的贡献也越来越大,特别是在动态分析和不完全信息引入博弈后。最根本性的原因是经济学和博弈论的研究模式是一样的,都强调个人理性,即追求给定条件下效用最大化。博弈论的基本概念参与人(player)也叫局中人,指的是一个博弈中的决策主体。其目的是通过选择行动(或战略)以最大化自己的支付(效用)水平。每个参与人必须有可供选择的行动和一个很好定义的偏好函数。参与人可能是自然人,也可能是团体。除一般意义上的参与人外,为了分析方便,在博弈论中,常把“自然”作为“虚拟参与人”来处理。博弈论的基本概念行动(actions),是参与人在博弈的某个时点的决策变量。参与人的行动可能离散,也可能连续。几个参与人的行动的有序集叫“行动组合”。参与人的行动往往是有顺序的。行动顺序对博弈结果很重要。同样参与人,同样行为组合,由于行动顺序不同,导致每个参与人的最优选择不同,得到不同的博弈结果。博弈论的基本概念信息(information),是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。信息集可理解为参与人在特定时刻有关变量值的知识。完全信息是指自然不首先行动或自然的初始行动被所有参与人准确观察到的情况,即没有事前的不确定性。博弈论的基本概念策略(strategies)也叫战略,是参与人在给定信息集的情况下的行动规则。它规定参与人在什么时候选择什么行动。因为信息集包含了一个参与人有关其他参与人之前行动的知识,战略告诉该参与人如何对其他参与人的行动作出反应,因而战略又叫参与人的“相机行动方案”。博弈论的基本概念支付(payoff),是指在一个特定的战略组合下参与人得到的确定效用水平,或者是参与人得到的期望效用水平。它是参与人真正关心的东西,并且是所有参与人战略或行动的函数。博弈论的基本概念结果(outcome),是博弈分析者所要揭示的东西,是分析者感兴趣的要素的集合,如均衡战略组合,均衡行动组合,均衡支付组合等。均衡(equilibrium),是所有参与人的最优战略组合或行动组合。一个博弈中可能出现多个均衡。静态博弈与动态博弈博弈的类型从参与人行动的先后顺序角度描述:静态博弈指的是博弈中,参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取了什么具体行动。动态博弈是指参与人行动有先后顺序,且后行动者能观察到先行动者行动的选择。完全信息与不完全信息博弈博弈类型从参与人对有关其他参与人(竞争对手)的特征、战略空间及支付函数的知识角度描述:完全信息博弈指的是每一个参与人对所有其他参与人(对手)的特征、战略空间及支付函数有准确的知识不完全信息博弈四种不同类型的博弈行动顺序信息静态动态完全信息完全信息静态博弈纳什均衡纳什(1950,1951)完全信息动态博弈子博弈精炼纳什均衡泽尔腾(1965)不完全信息不完全信息静态博弈贝叶斯纳什均衡海萨尼(1967–1968)不完全信息动态博弈精炼贝叶斯纳什均衡泽尔腾(1975)克瑞普斯和威尔逊(1982)费得伯格和泰勒尔(1991)完全信息静态博弈完全信息静态博弈是一种最简单的博弈,在这种博弈中,由于每个人是在不知其他人行动的情况下选择自己的行动,故战略与行动是一个意思。纳什均衡最优策略在一些特殊的博弈中,一个参与人的最优战略可能并不依赖于其他参与人的战略选择。这种不论其他参与人的策略如何,能够使自己的支付(效用)对自己最为有利的策略叫最优策略。最优策略均衡举例:广告战广告战:假定A、B两企业生产同类产品,同时面临着是否为自己进行广告促销的策略决策,支付矩阵为分析企业A的最优策略为采取广告促销。对企业A来说,针对企业B的两种策略,不论B选择哪种策略,A都会选择作广告。企业B的最优选择也是做广告。所以支付组(10,5)构成了一博弈的均衡点,对应于A、B企业的最优策略,从而构成了最优策略均衡。重复剔除的最优策略均衡在每个参与人都有最优策略的情况下,最优策略均衡是很理想的,然而,大多数情况下,最优策略均衡是不存在的。尽管如此,在有些博弈中,我们仍可以应用最优策略的逻辑,找到均衡。运用“重复剔除严格劣战略”的思想。举例:智猪博弈假定猪圈内有大小猪各一头,猪圈的一头有一个猪食槽,另一头安装一个按钮,控制猪食的供应。按一下按钮,有8个单位猪食进槽,但需支付2个单位成本。若大猪先到,大猪吃到7个单位,小猪只能吃到1个单位;若小猪先到,大猪与小猪各吃到4个单位;若两猪同时到,大猪吃到5个单位,小猪吃到3个单位。这里,每头猪有两种策略:“按”和“等待”。支付矩阵如下表小猪按等待大猪按等待3,12,47,-10,0第一格表示两头猪同时按按钮,因而同时走到食槽边,大猪吃到5个单位,小猪吃到3个单位,各扣除2个单位成本,支付水平分别为3个与1个单位。分析这个博弈没有最优策略均衡。尽管“等待”是小猪的最优策略,但大猪没有最优策略:若小猪选择“等待”,大猪最优策略是“按”;反之,若小猪选择“按”,大猪最优策略是“等待”。大猪的最优策略依赖于小猪的策略。必须用“重复剔除严格劣战略”的思想来找出均衡。重复剔除严格劣战略思想是:首先找出参与人的劣战略(假定存在),把这个劣战略除去,重新构造一个不包含这个劣战略的新的博弈;然后再剔除新博弈中的劣战略,直至唯一的策略组合,即均衡解。这个博弈均衡解,称为“重复剔除的最优策略均衡”。

分析(续)首先剔除小猪的劣战略“按”(给定大猪“按”,小猪也按时得到1单位,等待则得到4个单位;给定大猪“等待”,小猪“按”得到-1个单位,等待则得到0个单位。因此不管大猪“按”还是“等待”,小猪都会选择“等待”,而绝不会去“按”)。小猪按等待大猪按等待3,12,47,-10,0分析(续)在剔除掉“按”这个策略后的新博弈中,小猪只有一种策略“等待”,大猪仍有两个策略,但此时,“等待”已成为大猪的劣战略,剔除这个策略,剩下的唯一策略组合即是(按,等待)。也就是说,如果小猪选择“等待”,大猪的最优策略只能是“按”了。这是一个“多劳不多得,少劳不少得”的均衡。其他例子股份公司中股东承担监督经理职能,博弈结果是,大股东必须绞尽脑汁、多方搜集信息以监督经理的责任。小股东则节约“脑细胞”,进行“免费搭车”。股票市场的大、小户市场中大企业与小企业的关系纳什均衡纳什均衡是完全信息静态博弈解的一般概念。它指在知道其他参与人采取的策略后,能够使自己的支付效用最为有利的策略组合,即如果B的选择给定,A的选择是最优的;以及A的选择给定,B的选择是最优的话,我们就说这一对策略组合是纳什均衡。举例麦片商博弈。假定A、B两企业都是生产麦片食品的业务,各自有两种策略:生产咸麦片和甜麦片。A、B支付矩阵见下表:B企业的策略生产咸麦片生产甜麦片B企业的策略生产咸麦片生产甜麦片-5,-510,1010,10-5,-5分析当A、B之间的博弈属于合作性博弈时,双方可以通过协商达成共同瓜分市场的结果。当A、B之间的博弈属于不合作博弈时:如果B企业得知A企业将生产咸麦片,那么B企业肯定是生产甜麦片,因为生产甜麦片比咸麦片更有利;反之,如果A企业得知B企业将伸出咸麦片,这时如果A企业生产咸麦片将会亏损5单位,而生产甜麦片将获利10单位,故A将生产甜麦片。

分析右上角与左下角两组支付,分别对应着知道对手策略选择后另一方的最佳策略,从而构成纳什均衡。一旦达到纳什均衡,A、B企业都不会改变其策略,因为一旦偏离纳什均衡,对双方来说都是不利的(即各自亏损5单位)。因而,纳什均衡是一种稳定解。一个博弈中可能同时存在多个均衡。举例斗鸡博弈。设想有两个人手持利剑从独木桥的两端走向中间进行决斗,每个人有两种战略:继续前进,或败下阵来。若两人都继续前进,必将两败俱伤;但若一方前进,另一方后退,则前进者光荣,后退者蒙羞;若都败下阵来,则双方都没面子。(夫妻吵架是个典型的斗鸡博弈。)假设其支付矩阵如下表:

举例分析两个纳什均衡:如果A进,则B的最优策略应是退;如果B进,则A退。两方都进或都退不是纳什均衡。

若双方都寄希望另一方退步,则两败俱伤也会出现。B进退A进退-3,-32,00,20,0纯策略均衡与混合策略均衡有些博弈既存在纯策略均衡也存在混合策略均衡。

例:性别战。一男一女谈恋爱,晚上约会时或者看足球比赛,或者看芭蕾舞演出。男的偏好足球,女的更喜欢芭蕾,但都宁愿在一起而不愿分开。支付矩阵见表:

女足球芭蕾男足球芭蕾2,10,00,01,2分析显然,该博弈存在两个纯战略纳什均衡:(足球,足球),(芭蕾,芭蕾)。即,给定一方去足球场,另一方也会去,对于芭蕾也一样。但不清楚究竟选择哪个均衡。实际生活中,也许这次看足球,下次就看芭蕾,形成一种默契。或者是,谁先买票,就听谁的。事实上,这个博弈中还有一个混合战略纳什均衡:男的以2/3的概率选择足球赛,1/3的概率选择芭蕾;女的以1/3的概率选择足球赛,2/3的概率选择芭蕾。

囚犯的难题(困境)A、B两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里审讯。每个囚犯都有交代犯罪这样一个选择,从而把另一囚犯也牵连在内;也都有否定参与犯罪这样一个选择。他们明白:如果两个人都坦白,各判刑3年;如果两个都抵赖,各判1年;如果其中一人坦白,另一人抵赖,坦白的放出去,不坦白的判刑6年。

分析如果B不承认犯罪,那么,对A,采取坦白的态度一定会比其他选择更好,因为A将被释放。同样,如果B决定承认犯罪,那么A选择坦白需判3年,显然比不坦白需判6年要好。因此,不论B选什么策略,坦白交代都是A最优策略。对B来说情况也是一样。纳什均衡就是(坦白,坦白)。事实上,A、B都坦白交代不仅是纳什均衡,也是最优策略均衡。

囚徒B交代不交代囚徒A交代不交代-3,-30,-6-6,0-1,-1分析囚徒困境反映了个人理性与集体理性的冲突。若两人都能拒不交代,那么他俩的境况就会比其他策略下更好一些!如果他俩都确信另一方不交代,且双方都能应允自己也不交代,那么他们每个人就能得到支付-1,这些支付使他们的境况比其他选择好。

但这个改进办不到,因为不满足个人理性的要求,(不交代,不交代)不是纳什均衡。问题在于双方没有办法协调他们的行动。即使两囚徒在被捕之前约定双方都拒不交代仍然于事无补,因为没有人有积极性遵守事先的约定。

其他例子裁军计划

纳什均衡是双方都大量增加军费预算,大量扩军。

停止核试验

两个寡头选择产量

经济改革

尽管人人认为改革好,却没有人真正去改革,大家只好在都不满意的体制下继续生活下去。

排队候车

纳什均衡为:每个人都不排队,都尽量争取“找熟人”、“托关系”、“走后门”,除非资源不再稀缺,使人们不需要插队便能实现效用最大化。“三个和尚没水喝”

子博弈精炼纳什均衡将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的,决策者要“随机应变”,“向前看”,而不是固守旧略。

由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。这一点对预测分析是非常有意义的。

与纳什均衡的区别在纳什均衡中,参与人在选择自己战略时,把其他参与人策略当作给定的,不考虑自己的选择将如何影响对手的策略。实际上,当一个人行动在前,另一个人行动在后时,后者自然会根据前者的选择而调整自己的选择,前者在作选择时自然会理性地考虑这一点,所以不可能不考虑自己的选择对其对手选择的影响。

博弈表达的标准型与扩展型博弈的标准型表达有三个要素:参与人,可选择策略及支付函数。

两人有限策略博弈的标准型可用一个矩阵表来表示。

扩展型表达包括五个要素:(1)参与人;(2)每个参与人选择行动的时点;(3)每个参与人在每次行动时可供选择的行动集合;(4)每个参与人在每次行动时有关对手过去行动选择的信息;(5)支付函数。

市场进入阻挠博弈假设一个企业A是市场上的唯一供给者,面临企业B可能的竞争威胁。企业A有两种可选策略,即斗争与默许。斗争表现为采用降低价格使B的收益为0,默许意味着维持高价格。企业B也有两种策略:进入或者不进入。假定进入之前垄断利润为300,进入之后寡头利润共为100(各得50),进入成本是10。各种策略组合下的支付矩阵如下表:

举例分析该博弈显然有两个纳什均衡,即(进入,高价),(不进入,低价)。静态分析方法,得到两个纳什均衡。企业A高价低价企业B进入不进入40,50-10,00,3000,300分析给定企业B进入的话,企业A选择高价时得50利润,选择低价时得不到利润,所以最优战略是高价(默许)。同理,给定企业A高价时,进入策略成为企业B最优选择。尽管在企业B选择不进入时,企业A采取任何一种策略都是一样得,但只有当企业A选择低价时,不进入才是企业B的最优选择,所以(不进入,低价)也是一个纳什均衡,而(不进入,高价)不是纳什均衡。

子博弈与精炼纳什均衡用动态博弈理论来讨论实际究竟发生哪个纳什均衡。给定“历史”,每一个行动选择开始至博弈结束构成了一个博弈,称为“子博弈”。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。举例的进一步分析在市场进入博弈中,在给定企业B已经进入的情况下,在位者的“斗争”,“低价”策略已不再是最优的,这种“斗争”是不可置信的威胁,因为斗争的结果是没有利润;而合作会带来50单位利润。所以(不进入,低价)不是一个精炼纳什均衡。

剔除这个均衡,可以证明,(进入,高价)是唯一的子博弈精炼纳什均衡。

说明只有那些不包含不可置信威胁的纳什均衡才是精炼的纳什均衡。

有些纳什均衡之所以不是精炼均衡,是因为它们包含不可置信的威胁;然而,如果参与人能在博弈之前采取某种措施改变自己的行动空间或支付函数,使不可信的威胁变得可信,博弈的精炼均衡就会相应改变。

承诺行动怎样才能使不可信的威胁变得可信呢?往往采取信息经济学中的重要概念:“承诺行动”。承诺行动是指当事人在不施行这种不可置信威胁时,就会付出更大的代价。尽管这种代价不一定发生,但承诺行动会给当事人带来很大好处,因为它会改变均衡结果。

举例(一)在市场进入博弈中,若企业A通过某种承诺行动使自己的“斗争”威胁变得可置信,企业B就不敢进入了。如:企业A与第三者打赌:若企业B进入后他不斗争,就付给第三者100单位。这时,斗争就变成可信的威胁。因为若B进入后,企业A不斗争带来50寡头利润扣除100赌注,将得-50净利润,而斗争将得0利润,所有斗争比不斗争好。这样,企业B就不敢进入了,在位者实际上无需支付赌注便能得到300垄断利润。一般说来,承诺行动的成本越高,威胁的可信度就越高。

举例(二)富家“千金”爱上穷小伙子,她父亲坚决不同意,威胁说,如果你嫁给穷小子,你就永远没有这个父亲(断绝父女关系)。也许女儿可能会想:父亲只有一个,而丈夫可以有很多选择机会,所以,如果她相信父亲的话,她大概会中断与恋人关系。问题是她不知道如果失去女儿,父亲损失也很巨大。一旦女儿真嫁给了穷小子,“木已成舟”,一般说来父亲不会断绝父女关系。聪明的女儿如果认识到父亲威胁不可信时,会勇敢地嫁给小伙子。这是一个精炼的纳什均衡。

分析对于父亲来说,关键是要使自己的威胁变得可信。更聪明的父亲可能会在与女儿争吵时装出心脏病发作之迹象。这样,女儿知道一旦父亲生气引起心脏病突发或心肌梗塞等,她将真正没有父亲了,因此,父亲的威胁变得真正可信了,女儿也就可能中断与恋人的关系了。

典故破釜沉舟。项羽与秦兵交战,领兵过河就砸锅沉船了,这就是一种承诺行动,即誓死力战。最后项羽大胜秦兵。另外,《三国演义》中仓亭之战也是一例。曹操召集将领来献破袁之策,程昱献了十面埋伏之计。他让曹操退兵河上,诱袁绍来追,到那时“我军无退路,必将死敌,可胜绍矣”。曹军采纳此计,令许褚诱袁军至河上,曹军无退路,操大呼曰:“前无去路,诸军何不死战!”众军四头奋力反击,袁军大败。有限次重复博弈如果博弈只进行一次,参与人只会关心一次性支付;但如果博弈重复多次,参与人可能会为长期利益暂时牺牲眼前利益从而选择不同的策略。影响均衡结果的主要因素是博弈的次数及信息的完整性。连锁店之谜在位者选择斗争的唯一原因是市场斗争(低价)起到威慑作用,使企业B不敢进入。然而,在有限次重复博弈中,斗争并不是一个值得置信的。这个博弈的唯一子博弈精炼均衡是企业A在每个市场(连锁店)都选择高价,企业B在每个市场都选择进入。分析这个博弈还有其他均衡,如(斗争,不进入)等,但它不是子博弈精炼均衡。可以说,只要博弈重复的次数是有限的,则博弈的结果就将与一次性博弈(指对局一次)的结果相同。无限次重复博弈假设博弈进行无数次,那么你就有办法影响你的对手的行为:如果他这次拒绝合作,你就可以在下一次拒绝合作,直到他开始选择合作,然后双方永远选择合作。这就是所谓“针锋相对策略”。只要双方都充分关心各自将来的支付,那么将来不合作的威胁就足以说服他们,使他们采取合作的策略。说明“针锋相对”的策略的确非常令人满意,因为它能立即对背叛以惩罚。它也是一种宽恕的策略:对于对手的每一次背叛,只惩罚他一次。如果他的对手选合作策略,那么针锋相对的策略就会以合作作为对他的报答。显然,这是在进行无数次重复博弈中达到有效结局的令人满意的机制。冷酷策略、声誉冷酷策略指如果第一次对方背叛了我,我将永远对你进行惩罚,采取不合作的策略,丝毫不给他“赎过自新”的机会。实践证明这种策略并不是最好的对策。声誉模型:如果市场只进行一次交易或有限几次交易,显然难以达到高效率。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论