社会学博弈论PPT课件.ppt_第1页
社会学博弈论PPT课件.ppt_第2页
社会学博弈论PPT课件.ppt_第3页
社会学博弈论PPT课件.ppt_第4页
社会学博弈论PPT课件.ppt_第5页
免费预览已结束,剩余62页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、博弈论理论及应用,参考书目,经济博弈论 谢识予 复旦大学出版社 博弈论与信息经济学 张维迎 上海三联出版社 纳什均衡论 谢识予 上海财大出版社 博弈学习理论 陈学彬 上海财大出版社 微观信息经济学 谢康 中山大学出版社 詹姆斯莫里斯论文精选 商务印书馆,博弈论(game theory)是由美国数学家冯诺依曼和经济学家摩根斯坦于1944年创立的带有方法论性质的学科,它被广泛应用于经济学、社会学、心理学、智能计算、生物学、火箭工程技术、军事及政治科学等。1994年,三位博弈论专家即数学家纳什(美丽心灵)、经济学家海萨尼和泽尔滕因在博弈论及其在经济学中的应用研究上所作出巨大贡献而获得诺贝尔经济学奖。

2、,1996年,两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)、以及2001年三位经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学所取得的成就而成为这两个年度的诺贝尔经济学奖得主。,博弈论的发展过程,1. 博弈思想源于对策问题,可谓历史悠久,至少可追溯到2000多年前我国古代的“田忌赛马”;1500年前巴比伦犹太教法典中的“婚姻合同问题”等; 2. 博弈论早期研究的起点1883年的“古诺模型”。这一模型同1883年伯特兰德的寡头竞争模型都是对博弈问题的早期研究; 3. 博弈论

3、的系统研究是从本世纪初期开始的。系统研究博弈理论的发端是齐默罗和波雷尔对象棋博弈等的系统研究;,4. 博弈论的真正起点为冯诺伊曼、摩根斯坦1944年博弈论和经济行为(Theory of Games and Economic Behavior),在这本著作中引进了扩展形表示和策略形表示,定义了极小化极大解提出了稳定集解概念等,正式提出了博弈论的一般理论,这时期也是博弈论研究的第一个高潮时期;,博弈论的发展过程,5. 博弈论研究的第二个高潮时期为20世纪50年代后期到70年代,其中的重要代表人物是海萨尼和泽尔滕,产生了微分博弈、重复博弈的重要理论以及子博弈完美纳什均衡和贝叶斯纳什均衡的概念;,博弈

4、论的发展过程,6. 博弈论研究的第三个高潮时期为20世纪80至90年代,其中提出了顺推归纳法、序列均衡以及进化博弈的重要理论。,诺贝尔经济学奖与博弈论,诺贝尔经济学奖与博弈论,诺贝尔经济学奖与博弈论,诺贝尔经济学奖与博弈论,诺贝尔经济学奖与博弈论,为什么博弈论在经济学领域会产生如此大的影响呢?这是因为博弈论从一个独特的视角帮助我们更加深刻地理解和把握经济现象,并指导更加有效的经济政策制订。,博弈论在经济学中的应用,产业组织理论 信息经济学 讨价还价理论 拍卖理论 公共经济学 产权与制度分析 国际贸易政策 宏观经济政策分析,此外,博弈论在保险市场、金融市场、企业管理、跨国公司经营、会计学等领域也

5、有广泛的应用,博弈论的发展前景,新的博弈分析工具和应用领域的不断发现成为博弈论继续向前发展的根本基础和保证 随着博弈理论的发展和博弈研究的不断深入,博弈论本身还存在着许多问题,特别是理论基础方面还存在一些没有很好解决的根本性问题 金融、贸易、法律、政治等众多领域,不断提出新的博弈论应用课题,也不断有新的应用博弈模型产生,这些是今后博弈论进一步发展的巨大动力 在合作博弈和非合作博弈中,非合作博已成为当今博弈论的主流。然而,合作博弈理论的发展及合作与非合作博弈的重新融合,将为博弈论发展提出新的方向和课题,博弈论 (Game theory) 是针对多个利益主体间的利益冲突和相互决策研究方面而产生和发

6、展起来的一门学科,用来分析人类的社会行为和管理活动以及自然界生物的相互行为。,什么是博弈论?,博弈人 策略集 支付函数,博弈论的三要素,博弈模型,支付,Player 1,博弈类型分类方法,得益 过程 完全 完美,完全且完美信息动态博弈,完全但不完美动态博弈,博弈类型,博弈分类,博弈中的博弈方 单人博弈 两人博弈 多人博弈 博弈中的策略 有限策略博弈 无限策略博弈 博弈中的得益 零和博弈 常和博弈 变和博弈 博弈的过程 静态博弈 动态博弈 重复博弈,博弈的解与Nash均衡,Nash均衡分析,划线法:,反应函数法:,Nash均衡分析,常见经典博弈模型,1. 囚徒困境 2. 赌胜博弈 3. 产量决策

7、的古诺模型,坦 白,不坦白,坦 白,不坦白,囚徒 2,囚 徒 1,囚徒1:坦白 囚徒2:坦白,囚徒困境,囚徒困境,-5, -5,0, -8,-8, 0,-1, -1,两个罪犯的得益矩阵,双寡头削价竞争,政府组织协调的 必要性和重要性,寡头1:低价(70) 寡头2:低价(70),囚徒困境,田忌赛马,取胜关键:不让对方猜到自己策略,尽可能猜出对方策略,赌胜博弈,硬币博弈,赌胜博弈,石头-剪子-布,0, 0,1, -1,-1, 1,-1, 1,1, -1,0, 0,1, -1,-1, 1,0, 0,石 头,剪 子,布,博弈方2,石 头,剪 子,布,博 弈 方 1,赌胜博弈,产量决策的古诺模型,古诺模

8、型是寡头产量竞争,是市场经济中最常见的问题之一 古诺1838年提出,直到现在还是经常使用 古诺模型有很多扩展 古诺模型与囚徒困境相似,对理解市场经济和博弈分析本身都有重要价值,古诺的寡头模型,博弈方1利润: 博弈方2利润: 在本博弈中, 的纳什均衡的充分必要条件是 和 的最大值问题: 社会收益最大化: 假设总产量为Q,总收益为UQP(Q)CQ Q(8-Q)2Q6QQ2 其最大值为Q*=3, ;该结果与纳什均衡有较大的差异,这就是纳什均衡是源于各厂商追求自身利益最大化的结果。,产量决策的古诺模型,伯特兰德的寡头模型,在该模型中厂商选择价格而不是产量 厂商1的价格与需求函数: P1, 厂商2的价格

9、与需求函数: P2, 其中,d1,d20为两厂商产品的替代系数。假设两厂商无固定 成本,边际成本分别为c1和c2。 收益: 纳什均衡:,产量决策的古诺模型,两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据。警方将两人分别置于两间房间分开审讯,政策是若一人招供但另一人未招,则招供者立即被释放,未招供者判入狱10年;若二人都招供则两人各判刑8年;若两人都不招供则未获证据但因私入民宅各拘留1年。,案例分析(1),招 供,不招供,招 供,不招供,囚徒2,囚 徒 1,-8, -8,0, -10,-10, 0,-1, -1,两个罪犯的得益矩阵,问题:罪犯如何做出选择?,设想有两户相居为邻的农家,十分需

10、要有一条好路从居住地通往公路。修一条路的成本为4,每个农家从修好的好路上获得的好处为3。如果两户居民共同出资联合修路,并平均分摊修路成本,则每户居民获得净的好处(支付)为3-4/2=1;当只有一户人家单独出资修路时,修路的居民获得的支付为3-4=-1(亏损),“搭便车”不出资但仍然可以使用修好的路的另一户人家获得支付3-0=3。,案例分析(2),修 路,不 修,修 路,不 修,乙,甲,1, 1,-1,3,3,-1,0, 0,修路博弈的得益矩阵,问题:为什么政府要负责修建公共设施?,我们看到,对甲和乙两家居民来说,“修路”都是劣战略,因而他们都不会出资修路。 这里,为了解决这条新路的建设问题,需

11、要政府强制性地分别向每家征税2单位,然后投入4单位资金修好这条对大家都有好处的路,并使两家居民的生活水平都得到改善。这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建的原因。 同样的道理,国防、教育、社会保障,环境卫生等都由政府承担资金投入,私人一般没有积极性承担这方面服务的积极性和能力,猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。如果大猪先到食槽,则大猪吃到9单位食物,小猪仅能吃到1单位食物;如果两猪同时到食槽,则大猪吃7单位,小猪吃3单位食物;如果小猪先到,大猪吃6单

12、位而小猪吃4单位食物。,案例分析(3),按,等 待,按,等 待,小猪,大 猪,5, 1,4,4,9,-1,0,0,智猪博弈的得益矩阵,问题:大猪小猪会如何选择?,智猪博弈没有“剔除劣战略均衡”,因为大猪没有劣战略。 但是,小猪有一个劣战略“按”,因为无论大猪作何选择,小猪选择“等待”是比选择“按”更好一些的战略。 所以,小猪会剔除“按”,而选择“等待”;大猪知道小猪会选择“等待”,从而自己选择“按”,所以,可以预料博弈的结果是(按,等待)。这称为“重复剔除劣战略的占优战略均衡”,其中小猪的战略“等待”占优于战略“按”,而给定小猪剔除了劣战略“按”后,大猪的战略“按”又占优于战略“等待”。,为何

13、股份公司中的大股东才有投票权? 在股份公司中,大股东是大猪,他们要收集信息监督经理,因而拥有决定经理任免的投票权,而小股东是小猪,不会直接花精力去监督经理,因而没有投票权。,为什么中小企业不会花钱去开发新产品? 在技术创新市场上,大企业是大猪,它们投入大量资金进行技术创新,开发新产品,而中小企业是小猪,不会进行大规模技术创新,而是等待大企业的新产品形成新的市场后生产模仿大企业的新产品的产品去销售。,为什么只有大企业才会花巨资打广告? 大企业是大猪,中小企业是小猪。大资金为产品打广告,中小企业等大企业的广告为产品打开销路形成市场后才生产类似产品进行销售。,博弈论作为经济学研究的有力工具,真正大行

14、其道是在70年代不对称信息下经济行为分析的兴起。不对称信息指一些局中人拥有别的局中人不拥有的“私人信息”,也就是说一些局中人知道别的局中人不知道的某些情况。下面用一些例子说明这种情形下的博弈行为。,不对称信息博弈,二手车市场为什么难以建立?,在发达国家,二手车(旧车)的价格往往比新车差一大截,即使旧车本身没有什么质量问题,一旦旧车进入二手车市场,其价格就会与新车相比差得老远。在我国许多城市,二手车市场甚至难以建立起来,原因是进入市场的买车人太少。这是为什么呢?二手车市场的博弈理论为我们解答了这个谜语。,案例分析(4),在二手车市场上,卖车人比买车人更多地知道车的质量情况,但卖车人不会将旧车的质

15、量问题老老实实地告诉买车人。买车人也知道这种情形,因此,买车人在开出价格时会考虑到车的质量问题。假定没有问题的好车价值20万元,有问题的坏车只值10万元,并且设买车人认为市场上出现好车和坏车的可能性各占一半。这时,买车人开出的价格不会高于15万元。这样,如果卖车人的车果真是好车,他就不会出售,好车退出市场,但当卖车人的车是坏车时,他会十分积极地将只值10万元的车按15万元卖给他。,但买车人知道愿意按15万元卖的车一定是坏车,从而认定市场上全是坏车。所以,除非他愿意买一辆坏车,否则他会退出市场。当他愿买坏车时,他只开出10万元的价。于是,旧车市场或者建立不起来,没有买主,或者充斥着坏车,真正的好

16、车退出市场,而坏车在不断成交,但价格很低。 类似现象广泛存在如人才市场、信贷市场等。如一个公司往往流走的是能力强的人,因为公司不能正确评价一个能力强的员工的能力,给予的薪水低于其市场价值。,如果有一件古董需要拍卖,有许多人参加竞争性拍卖。这件古董在每个买主心中有一个价值评价。但是,卖主不知道买主的评价,买主也不会老实将其对古董的评价告诉卖主。不同买主之间也不知道其他人的价值评价。,案例分析(5),如果采用“英式拍卖法”,买主们轮流出价,直到开出最高价的买主拿走古董并支付所开出的最高价格。按这种拍卖方法,古董并不能按买主心中的最高评价价值卖出。壁如,当买主中的最高评价为100万元,第二高评价为9

17、0万元时,当评价最高的买主开出91万元时,就可买走其评价为100万元的古董但只支付了91万元。由于这是公开竞价,会出现围标问题,即买主们合谋压价。,另一种方法是:“一级密封价格拍卖法”。买主每人将其开出的价格写入一个信封,密封后交给卖主。卖主拆开所有信封,将古董卖给信封中出价最高的买主,并要求支付最高的价格。这种方法可避免围标,但不能将古董按买主中最高的评价价值卖出。因为买主不会按心中的评价老老实实地将价格写为其价值评价。如果该买主认为古董值100万元,他不会写出价格为100万元,因为当他开出比100万更低一些的价格时,有可能赢得古董但净赚一个价值与价格的差额。如当他开出90万元时,有可能成交

18、并净赚10万元。相反,当他开出100万元时,即使成交也无赚头。所以,大家都不会老老实实报出心中的价值。,经济学家维克里发明的“二级密封价格拍卖法”(维克里拍卖法),既可避免围标,又可诱使买主们老老实实地开出心中的真实评价。 维克里拍卖法要求每个买主写入信封一个出价,密封后交给卖主,卖主拆开信封后宣布将古董卖给出价最高的人,但只需支付开出的第二高的价格。譬如,出价最高的为100万元,第二高的为90万元,古董就卖给开出100万元的人,但他只需支付给卖主90万元。,对每个买主来说,他不知道其他买主的评价,但给定其他买主的评价(尽管他不知道),他一旦获胜,支付的第二高的价格是固定的,不会随他开出的价格

19、而变;但他开出的价格愈高,获胜的可能就愈大;但是,他不能开出比他的价值评价更高的价格。因为一旦存在别的人开出的价格比他的价值评价还要高,当他获胜时,就必须以高出他的价值评价的价格购买古董,对他来说是得不偿失的。,所以,每个人都会老老实实在按心中的评价开出价格。如果所有人的评价是一样的,古董就以真实的最高价值卖出。维克里拍卖法可以诱使买主说出真话。 70年代美国联邦政府运用维克里招标法进行公共工程招标,为联邦政府节省了大笔开支。,在18世纪以前,英国苏格兰地区有大量的草地,其产权没有界定,属公共资源,大家都可以自由地在那里放牧。草地属于“可再生资源”,如果限制放牧的数量,没有被牛羊吃掉的剩余草皮

20、还会重新长出大面积草场,但如果不限制放牧规模,过多的牛羊将草吃得一光二净,则今后不会再有新草生长出来,草场就会消失。,案例分析(6),由于草地的产权没有界定,政府也没有对放牧作出规模限制,每家牧民都会如此盘算:如果其他牧民不约束自己的放牧规模,让自己的牛羊过多地到草地上吃草,那么,我自己一家约束自己的放牧规模规模对保护草场的贡献是微乎其微的,不会使草场免于破坏;相反,我也加入过度放牧的行列,至少在草场消失之前还会获得一部分短期的收益。,如果其他牧民约束放牧规模,我单独一家人过度放牧不会破坏广褒的牧场,但自己却获得了高额的收益。因此,任何一位牧民的结论都会是:无论其他牧民是否过度放牧,我选择“约束自己的放牧规模”都是劣战略,从而被剔除。大家最终都

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论