重复博弈囚徒困境_第1页
重复博弈囚徒困境_第2页
重复博弈囚徒困境_第3页
重复博弈囚徒困境_第4页
重复博弈囚徒困境_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.6重复博弈一、有限重复博弈

定义:对于完全信息博弈,其中I=(1,2,…,n)为参与者集合,为所有参与者的策略空间,为所有参与者的收益函数,如果G在时间上(程序上)不断重复,并且在下一次博弈G开始前,所有以前博弈的历史都被观察到,那么它构成的动态博弈就称之为重复博弈,G就为重复博弈中的阶段博弈。如果G重复进行T次,那么G(T)就表示重复进行T次的有限重复博弈。如果G重复进行次,那么G()就表示无限重复博弈。

二、序贯博弈与重复博弈

1、序贯博弈:参与人在前一个阶段的行动选择决定随后的子博弈结构,从后一个决策节开始的博弈不同于从前一个决策节开始的博弈。

2、重复博弈:简单地说,就是同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。阶段博弈可以是静态博弈,也可以是动态博弈;

3、重复博弈的三项特征:(1)阶段博弈之间没有“物质上”的联系;序贯博弈涉及到物质上的联系。(2)所有参与人观测到博弈过去的历史;(3)参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。4、参与人在某一阶段的博弈选择依赖于其他参与人过去的行动历史,所以,参与人在重复博弈中的战略空间远远大于和复杂于在每一个阶段博弈中的战略空间。这一点意味着,重复博弈可能带来一些“额外的”均衡结果,这些均衡结果在一次性博弈中是从来不会出现的。5、影响重复博弈均衡结果的主要因素是博弈的重复次数。重复次数的重要性来源于参与人在短期利益和长远利益之间的权衡。

2.5—1有限次重复博弈:连锁店悖论例1:见下图市场进入博弈,假定同样的市场有20个,其均衡会与单个市场不同吗?均衡1:进入者总是选择进入,在位者选择默许;均衡2:在位者选择斗争,进入者总是选择不进入。40,50-10,00,3000,300

在位者默许斗争进入者进入不进入图1市场进入博弈定理1、如果阶段博弈G有惟一的纳什均衡,则对任意有限的T,重复博弈G(T)有惟一的子博弈完美纳什均衡,即G的纳什均衡结果在每一个阶段重复进行。注意:此定律的一个重要条件是:单阶段博弈存在“唯一”的纳什均衡。例2:重复博弈举例1、参与人:商人1,商人2;2、行动空间:都是诚信、欺骗;3、博弈次数:两次;4、支付函数:见图2所示。4,40,55,01,1

商人1诚信欺骗商人2诚信欺骗图2信用困境(1)逆推到第一阶段,将第二阶段的纳什均衡收益代入,则如图3所示。有限重复博弈纳什均衡是(欺骗,欺骗)

此题解释了现实中存在的一类现象——普遍的欺诈行为;没有解释另一类现象——广泛的合作。

为了在理论上容纳合作解,博弈论主要从三个方面来加以发展:一是引入多重均衡;二是引入无限重复博弈;三是引入信息不完全。

5,51,66,12,2

商人1诚信欺骗商人2诚信欺骗图3信用困境(2)2.5—2无限重复博弈1、合作解要在有限重复博弈申出现要求阶段博弈G必须存在多重纳什均衡,但在无限重复博弈中这一条件并不是必需的:即使阶段博弈G只存在惟一纳什均衡,无限重复博弈中也可以存在子博弈完美纳什均衡解,其中没有任何一个阶段结果是G的纳什均衡。显然这和定理1相对立,根本的原因就在于博弈可以进行无限期。如果博弈是无限的,那么长远利益就要好于短期利益。2、解开连锁店难题的办法之一是引入信息的不完全性,或者博弈重复无限次,或者重复未知的次数。(一)数学分析假设利率r,则贴现率为:1/(1+r),贴现因子,一般的有1/(1+r)=;有了贴现因子,我们就能比较无限博弈中的不同收益值。

收益值计算法如下:如果未来的收益系列为:其收益流现值为:如果每一期的收益都是R,则贴现值为:例4:仍考察信用困境博弈1、单阶段博弈是:(欺骗,欺骗)2、无限重复博弈中子博弈精练纳什均衡有可能为:每一阶段都是合作:(诚信,诚信);3、此博弈的可能完美均衡:触发策略,又叫冷酷战略;4,40,55,01,1

商人1诚信欺骗商人2诚信欺骗图6信用困境(1)(二亮)证线明冷酷防战略战略铸表述忠:在第陆一阶叶段选健择诚再信,脂且如硬果所刑有前谋面t一1阶段狼的结果扛都是(诚信迟,诚绩信),则在第t阶段茎,选择撑诚信末,否窑则选忽择欺波骗,快并永坑久欺阵骗下笨去。1、先岗证明逐此战宴略是帆纳什扇均衡下:即如果给给定量参与月者j的策旗略为丹触发乔策略助,那盏么参惜与者i的最愈优反底应也尝是触呼发策夕略,芬即触塞发策傅略是筒彼此册策略策的最议优反捐应。舌假设避与1足够锻接近瓜的条课件下艺,我悼们用悟计算咬来证末明;参与劫者j在某阶段拐选择稿欺骗凤将会吃使当城期得舞到5的收腐益,干但却喂会触谷发参潮与者i的永连远不音合作赠策略失,于薄是未蚁来每脂一阶花段的收侮益都鲜将成羞为1。收益罢现值横为:如果戒采取黄合作趴,设V为j在无体限博腊弈中械的最璃优反晓映的欣收益缸现值导,则测有:a、故:b、当且鞋仅当乒下式贴成立借,选拳择诚锈信才皆是最宝优的辈。4,40,55,01,1

商人1诚信欺骗商人2诚信欺骗图6信用困境(1)(1)(2)2、再虑证明云此战棵略是被子博惕弈精丝式练纳累什均已衡无限六重复相博弈烂的每域一子贤博弈茫都等侦同于确原博津弈,较而触脉发策吨略是高无限捧重复涝信用挠博弈苦的纳斑什均内衡,菌因而禾它同辽样是蹦任意摔一个单子博艺弈的印纳什剩均衡轰,根贸据完仁美均闯衡的背定义垒可知婶触发围策略糟是一妄个子迫博弈抄精练凝纳什乒均衡。在无搞限重衫复信圈用困标境的德触发傻策略烧纳什乒均衡滨中,丢当博垦弈进绣行到t阶段德时,社存在抗两个冰可能胞的历短史过幸程:(1顿)所有裤以前厦阶段希的结喝果都前是(诚信貌,诚窗信)的子膛博弈浓;(2洲)至少认有一触个前拐面阶棒段的捏结果工不是(诚信凉,诚薯信)的子弟博弈应。如帮果参德与者洁在整助个博咐弈中锤采取是触发喊策略膊,则杀:(1翅)参与仅者在庄第一誓类子灾博弈殖中的隆最优信策略踪蝶同样捷是触哥发策击略,萄我们需已证晨明它计是整酬个博岂弈的杜一个反纳什端均衡针;(2荣)参与窃者在素第二柿类子吓博弈捕中的详最优日策略倘是永溪远单蔽纯重纪复阶漏段博讯弈的诞均衡(欺骗扯,跃桶骗),它挠本身就剧是阶矛段博婶弈G的纳蓝什均刃衡。愤这就哭证明规了无交限重润复信族用困尊境中嘉的冷讯酷战鱼略纳旁什均锤衡是蚊子博搏弈精冰练的斤。(三裤)以含牙还茧牙战透略也温是此狗博弈滚的子捆博弈病精练闻纳什饰均衡爬,可牵类似滔以上婶进行夹证明倾。1、先酷后悔晌比后毙后悔迹好;(1)0阶段趴欺骗摘,1阶段斜后悔幕的收萄益现拴值(3斤)(2)0阶段违欺骗私,t阶段绵后悔遭的收悔益现魔值(4骑)2、后文悔要敏比永盖远欺斑骗好星;(3)式蝴大于筛(1)式柔:当贴圣现因总子为>1觉/4时,含参与县者j选择厅后悔遗,以境求得搁重新却合作裂要优于毯永远研欺骗场。3、证明际永远躺诚信举比欺祥骗之煎后再覆后悔卧要优,等崇于证枣明(2)式短大于芽(3)式孤;4、结带论:当贴氧现因挠子是接津近1(细>1/4),以需牙还瓜牙策飘略组运合是挪重复酿无限辞信用露博弈炼的纳态什均衡渔。(四地)无蔑名氏蜓定理当贴辅现因唉子充那分接作近1,无限植重复壁信用搞博弈存闲在合租作解膊,那烫么是伯否所邪有的竖无服怜重复匪博弈G(波)都存我在合由作解?这就引出了无逝名氏渔定理好。无名签氏定参理:令G为一嫌个n人阶辽段博老弈,凝为畅以G为阶动段博涉弈的妇无限屯次重吨复博祥弈,早是G的一紫个纳满什均阁衡(抖纯战像略或供混合钳战略塘),俱是堤决章定的枯支付勒向量叮,暗是纽奉一个扯任意弯可行备的支稠付向芬量,V是可跑行支考付向打量集骂合。浊那么役,对含于任乎何满菊足军的,存碍在一奏个贴涛现因计子渠使机得对逆于所裙有的,圆是一欢个特盐定的剥子博评弈精见练纳失什均练衡结惠果。子博嫁弈精浇练纳致什均煎衡的澡多重删性是俭无限至次重锹复博影弈的多普遍面问题葛。(五慈)对许无名鼻氏定搂理的竟三点后说明菊:1、惩抗罚点(纳哭什威顷胁点笔):姓在上恭述定提理中普,阶常段博凡弈的佛纳什遗均衡致可能怨是混睬合战贱略均朱衡也店可能思是纯乐战略塘均衡享;由刮决定蔑的支烂付向贺量哥是意达到津任何活精练片均衡展的结镰果v的惩物罚点逐。2、可随行支轻付:高称榴为一耳个可愁行支艳付向带量,斜如果忽它是枣阶段球博弈G的纯铲战略丸支付挥的凸汇组合毁;所户有可绢行支凡付向吊量构悼成可详行支馆付集锈合V。凸组朴合:假设男为哄参与就者选测择纯怨策略做组合耕下所栗有可携能收衔益组怨合的线集合瞧(r为向潜量)风,向茅量中的哗任意哲一个贸元素请,且那么稳,娘就乎称之知为凸刃组合量。例如谷“信窄用困套境”昏的所判有纯场战略械收益颤的凸欺组合砍如图7的阴北影部挡分其纳磁什威炒胁点光是e=钞(1察,1宇)。无名矮氏定理槽告诉姜我们枣,如所果溉足够溜接近喜于1,由过揪点(1,宜1)的牢两条早垂直容线围即成的无可行集常合上若的任致意点允都可谜以是衣一个懒子博弈精姥练纳夹什均付衡的亩结果烟。3、平滑均支自付:假维设贴斤现因嗽子为课,无溜穷收茎益系损列为揭:,其赴贴现钢值之聚和为它:糟;另假冠设有旅无穷袄收益们系列饭:忘,您其贴砖现值谦之和悔为:袜;要殃求年成总为无竹穷序丢列婚的舅平均商支付吊,要郑求:赖因事此有偶:即:腔平均鼓支付嚷是贴就现值愉之和混的标浴准化(标准紫化因遵子是)可行赢收益之集合(1屈,1套)(5则,0莲)(4驴,4蓄)(0泻,5戒)企业1收益企业2收益o例:柴无限棉重复燥库诺桶特双形头垄返断下起的共笑谋1、在阀纳什围均衡昂下,执库诺慌特均大衡产锐量:库诺磨特均这衡利眠润:2、在翻垄断粱情况活下:弯垄断丝式产量阅:垄断魔利润云:3、无嫩穷次胸重复除博弈肉,考凭虑冷悲酷战由略:首先舟选择中生产分,继肉续选缠择生孤产庸;陆直匆到有乔一个村企业况选择珍生产厘:疏,然烧后生题产:(1)给缘瑞定企努业j坚持容冷酷业战略猎,证拆明其武为纳俊什均谋衡:企业i坚持鄙合作耗,每侵期利衫润为静:如果速企业i选择僻短期贪最优俊产量获:当期软利润怖为:但随宜后的聪利润墓流量堵为:如果悟下列夕条件择满足伞,企堡业i会选很择合生作均套衡:解得准:(2)证片明其魂为子驼博弈垒精练世纳什肯均衡病;街(拳略)(3)讨杠论a、此博凉弈也志有多栏个精聚练纳颗什均秆衡,鸣“总攻选择略库诺般特均享衡产桌量”也就是区一个缴精练静纳什弟均衡种;若制产量恢选择旨:都是走冷酷腐战略稍精练铅均衡守的一幼个特叶定结夕果。b、其可袭行支犯付集箭与子傻博弈精练哭均衡质可达辟到的惯支付眯集如图7所示c、保留旺支付海(最握小最闹大支厅付)拢:是当炸其他验参与作人试盼图给泻参与棋人i最大互惩罚量时参民与人i能保借证自派己得悬到的唯最大园支付斗;d、个人造理性缓支付虏:指斯大于挥保留栏支付无的支覆付;2.肉5—宫3参与捕人不鲁固定嗽时的节重复叼博弈消费涉者市阁场交闷易就遇是一棵个典颂型的诊例子榜。厂用商是丽长期颜的固上定参杜与人忌,重跟复提侍供产顾品;述而消膜费者纵是不捧固

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论