




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、管理中的博弈分析,1,课程要求,课程目标:树立双赢的现代经营观念,理解行为相互作用的各种表现,掌握分析多利益主体决策的方法,培养认识事物本质的敏锐视角、提高把握机会与分寸的能力。 要求认真听课,积极参与案例讨论,预先做好课前的教材与资料阅读,及时完成课后作业,2,教 材:谢识予经济博弈论,入门,复旦出版社,参考书: 弗登博格博弈论,手册,人民大学出版社 张维迎博弈论与信息经济学,参考,上海人民出版社 吉本斯博弈论基础,简洁,中国社会科学出版社 奥斯本博弈论教程,深刻,中国社会科学出版社 拉斯缪森博弈与信息,基础,北大出版社 麦克米兰市场演进的故事,精彩,中信出版社,3,课程介绍,1.博弈论(g
2、ame theory)多利益主体的决策理论 什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 招数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。 博弈研究的是存在外部相互作用条件下的个人选择问题的理论 不仅需要考虑个人选择,更应考虑别人如何进行选择 示例:三人枪击的最优决策,4,示例:三人枪击问题与三国启示,80,60,40,5,现代社会是一个错综复杂的组织,可以看成
3、是一个需要在许多层面上行为协调的系统。 在分工合作的社会里,了解行为相互作用的机理,研究行为决策的理论对每一个个体都具有重要意义。 博弈论在经济分析的应用最成功、最广泛 博弈论在军事、社会、心理、贸易、管理等诸多领域有着越来越广泛的应用,2.博弈论的价值(分析工具,6,学而优则仕”:高考改革,自古以来,人才选拔一直是提升组织竞争力和维护长治久安的基础性工作; 尽管科举制度备受批判,但不可抹杀其在中华文明传承中所起的作用; 现代高考制度已经历了学校自主招生到国家统一考试,再到分省市考试,又回到自主招生考试的循环,其中的利益分析耐人寻味,7,研究的热点主题取决于研究的兴趣和现实的需求,受制于以研究
4、工具为基础的研究能力 博弈分析工具的出现促使经济与管理的论题: (1)越来越转向个体经济行为研究 (2)越来越转向人与人的关系的研究 (3)越来越重视信息不对称时,个人选择、制度安排的研究,3.博弈给社会科学研究带来的变化,8,4、博弈论为什么会成为主流的分析工具,第一,无处不在的利益冲突导致现实需求 第二,量变到质变的工具性突破 第三,人间世态绝好的解释能力 第四,定量与定性的有机结合 第五,行为、效用和信息等因素的巧妙综合 第六,促进了各学科之间的融合 第七,推进人文学科的阔步发展,9,1)前提假设的合理性 (2)预测的可靠性 (3)多重均衡的择优原则 (4)共用知识、共同知识的界定(脏脸
5、博弈) (5)博弈均衡解的稳定性(蜈蚣博弈 悖论,5.博弈理论应用中的相关问题,10,1)前提假设的合理性 理论的价值:抽象和归纳、演绎与推理 学术训练的意义 分析基础:综述的价值,11,预测是规律总结基础上对未来的判断 准确预测的前提: 因素把握准确程度 外在环境的变化程度 趋势把握的可靠程度,2)预测的可靠性,12,模型解的应用价值 解的精度对应用的影响 多重解的选择问题,3)多重均衡问题,合作的困境,13,脏脸博弈 三人脸上均有墨迹,但自己无法看清自己脸上是否干净 老师问:脸黑的请举手 结果如何? 如果老师提示:你们三人当中至少有一人脸是黑的,那么脸黑的请举手 结果又如何,4)共用知识、
6、共同知识的界定,14,解的稳定性问题:Chaos 蜈蚣博弈 悖论 多阶段博弈的短期利益和长期利益,5)博弈均衡解的稳定性,15,第一部分、博弈的基本概念,博弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样,都是从复杂的现象中抽象出基本的元素,对这些元素构成的数学模型进行分析,而后逐步引入对其形势产影响的其他因素,从而分析其结果。基于不同对象,博弈形成三种表述方式,标准型、扩展型和特征函数型。利用这三种表述形式,可以研究形形色色的问题,因此,它被称为“社会科学的数学”。 从理论上讲,博弈论是研究理性的行动者相互作用时的决策理论,其思想和方法已被经济学、政治学、社会学等各门社会科学所
7、应用,16,1)规则 2)结果 3)策略 4)相互作用,1、构成博弈的共同特征,17,1) 参与者 (2) 博弈方的选择(方案) (3) 博弈的次序 (4) 得益,2.构成博弈的要素,18,1) 单人博弈 确定性决策 不确定性决策 多目标决策 群体决策,3、博弈中的参与者(Player,19,2) 双人博弈 *并非总是对抗 *信息多并不一定得益多 *个体理性并不一定导致群体理性,20,3) 多人博弈: 干扰均衡,伦敦奥运会申奥得票进程数据,伦敦 巴黎 马德里 纽约 莫斯科,22 21 20 19 15,54 50,27 25 32 16,39 33 31,21,4.博弈中的策略(Strateg
8、y,决策是一个策略选择的过程,关键在于: (1)你有哪些可行选择; (2)对于选择策略的条件和最终结果的判断; (3)你准备做出怎样的选择。 策略表达的方式:有限策略用枚举法 无限策略用表达式,22,天下熙熙皆为利来,天下攘攘皆为利往 优化得益是个体决策的目标,明确得益是博弈分析的基础 既然博弈得益是策略相互作用的结果,探究得益与博弈策略之间的关系是博弈分析的核心问题! 根据得益区分的博弈类型: (1) 零和博弈 (2) 常和博弈 (3) 变和博弈,5.博弈中的得益(Profit,23,博弈中的得益大多是以效用的形式出现,效用的测定是博弈分析的前提; 博弈中的得益通常不仅是共同知识,也更多是公
9、用的知识; 博弈中的得益结构影响了博弈的类型,也影响了博弈分析的方法; 即使是不对称信息的博弈,也需假定博弈的得益是可以预计和猜测的,24,博弈特别讲究的是决策的次序,它象征着决策者的实力地位,表明决策者掌握的主动权,代表决策过程中的不同心境。 (1) 静态博弈 (2) 动态博弈 (3) 重复博弈 (诚信对交易的重要性,6.博弈中的次序(Order,25,不完美信息 结果已知、进程未知 不完全信息,7.博弈方的信息(Information,掌握一定量的信息是博弈方计算得失的基本前提,为了提高决策的科学性,博弈的当事者必须清楚地掌握有关博弈规则、参与者、类型、决策偏好、方案、进程等若干信息。 其
10、中尤为重要的是对信息的理解和信息的交换,26,年薪40万面试题,老师的生日是下面十天中的一天: 3.4 3.5 3.8 6.4 6.7 9.1 9.5 12.1 12.2 12.8 老师将自己出生的月份告诉给小明,将日子告诉了小强 然后老师问两位爱徒能否推算出自己的生日 小明:若我不知,小强肯定也不会知道 小强:本来我不知,现在我知道了 小明:那我也知道了 请问老师的生日是哪天,27,分析: M = 3 6 9 12 D = 1 2 4 5 7 8 双方的行为表现和有限的信息交流至关重要 小明的信息明确缩小了讨论的范围 而小强的回答则明确作了定位 3.4 3.5 3.8 6.4 6.7 9.1
11、 9.5 12.1 12.2 12.8,28,第二部分:完全信息静态博弈,完全信息静态博弈的特征 同时行动 每个参与者独立选择. 完全信息 每个参与者的策略和相应收益是共用知识. 关于参与者的假定 完全理性 参与者的目标皆为最大化收益 参与者能正确分析和判断 每个参与者都知道对方是理性的,29,完全信息静态博弈的特征,同时行动 每个参与者独立选择. 完全信息 每个参与者的策略和相应收益是共用知识. 关于参与者的假定 完全理性 参与者的目标皆为最大化收益 参与者能正确分析和判断 每个参与者都知道对方是理性的,30,经典模型: 囚徒困境,两个同案的犯罪嫌疑人被隔离审讯,但却没有足够证据指证他们的罪
12、行 两个嫌疑人被告知了以下的政策: 如果没有人坦白,双方都将被监禁一个月. 如果双方都坦白,双方都将被监禁六个月. 如果只有一方坦白, 则坦白方将被释放而被供出一方则会被监禁九个月,31,经典模型:性别战,Chris 和 Pat 需要选择一个项目共渡周末. 双方都知道: Chris 偏爱歌剧. Pat 偏爱拳击,32,经典模型: 猜硬币,参与者1抛硬币让参与者2猜. 双方采用以下规则: 如果参与者2猜对,则硬币归参与者2. 如果参与者2猜错,则参与者2必须付出一枚硬币,33,一、博弈的标准式表示,所谓的博弈的标准式通俗的讲就是描述式,34,定义: 博弈的标准式表示,博弈的标准式有以下内容构成:
13、 有限参与者集 1, 2, ., n, 参与者的策略 S1 S2 . Sn 和 得益 u1 u2 . un where ui : S1 S2 . SnR,35,完全信息静态博弈的要素,参与者的集合 (至少两人) 每个参与者的策略或行动集合 参与者的得益,Player 1, Player 2, . Player n S1 S2 . Sn ui(s1, s2, .sn), 对所有的 s1S1, s2S2, . snSn,36,双人博弈的标准式,收益矩阵表示 两个参与者: 参与者 1和参与者2 每个参与者均只有有限策略 示例:S1=s11, s12, s13 S2=s21, s22,37,囚徒困境的
14、标准式表示,参与者的集合:Prisoner 1, Prisoner 2 策略集合: S1 = S2 = Mum, Confess 收益函数: u1(M, M)=-1, u1(M, C)=-9, u1(C, M)=0, u1(C, C)=-6;u2(M, M)=-1, u2(M, C)=0, u2(C, M)=-9, u2(C, C)=-6,得益,38,性别战的标准式表示,标准式表示: 参与者集: Chris, Pat (=Player 1, Player 2) 策略集: S1 = S2 = Opera, Prize Fight 收益函数: u1(O, O)=2, u1(O, F)=0, u1(
15、F, O)=0, u1(F, O)=1; u2(O, O)=1, u2(O, F)=0, u2(F, O)=0, u2(F, F)=2,39,猜硬币的标准式表示,标准式表示: 参与者集:Player 1, Player 2 策略集: S1 = S2 = Head, Tail 收益函数: u1(H, H)=-1, u1(H, T)=1, u1(T, H)=1, u1(H, T)=-1; u2(H, H)=1, u2(H, T)=-1, u2(T, H)=-1, u2(T, T)=1,40,二、博弈求解,坦白”对双方来说总是占优策略 所谓占优策略就是不管对手策略如何,存在某一策略其收益比其他策略的
16、收益都高,Payoffs,41,42,1,0,1,2,0,3,0,1,上,下,左,右,0,1,2,0,中,重复剔除严格劣战略,43,Iterated elimination of strictly dominated strategies: an example,Player 1,Player 2,Middle,Up,Down,Left,Right,44,应用示例,波斯湾美伊的导弹与防御博弈 I点的一艘伊朗舰艇准备向A点的美国军舰发射导弹,导弹可以直行,也可以拐弯, A点的美国军舰同时发射两枚拦截导弹,速度与伊导弹速度相同,燃料只够飞三格,导弹中途相遇则爆炸,导弹飞行路线可事先设定,试求美舰的
17、安全策略,A,B,C,D,E,F,G,H,I,45,46,通过重复消除法,可得到简化的得益矩阵,47,三、博弈均衡,48,最佳反应函数求Nash均衡,49,划线法的对应规则是: 参与者1有最优法则f:S1 S2 参与者2有最优法则g:S2 S1 f(左)= 中 f(中)= 上 f(右)= 下 g(上)= 左 g(中)= 中 g(下)= 右,50,51,四、博弈应用:智猪博弈,一大一小两头猪住在一间现代化的居室中,每按动一下按钮,食槽都会滚出10个萝卜,食槽与按钮有一定距离,按者需支付2个单位成本,如果大猪先吃,分配为(9,1),小猪先吃份额(6,4),同时开吃则为(7,3,大猪,按 等待,按,
18、等待,小猪,52,现实中的智猪博弈: 石油输出国组织的勾心斗角 公共设施建设和维护中的“搭便车”现象; 企业产品开发和市场开拓的决策问题; 大小股东对企业的投入与监督问题,53,Cournot Duopoly,54,55,56,57,哈定悲剧 The Tragedy of the Commons,让我们看一下著名的公共资源悲剧问题,即哈定悲剧。该问题是经济学中的经典问题,也是博弈论教科书中必定要讨论的问题。 公共资源悲剧最初由哈定提出。哈定(Garrit Hadin)1968年在科学杂志上发表了一篇文章,题为The Tragedy of the Commons。北京大学的张维迎教授将之译成公共
19、地悲剧,但哈定那里的the commons不仅仅指公共的土地,而且指公共的水域、空间等等;武汉大学的朱志方教授将The Tragedy of the Commons译成大锅饭悲剧,有一定的道理,但也不完全切合哈定所表达的意思。将the commons译成“公共资源”似乎更确切些。哈定描述的The Tragedy of the Commons,我们可称为哈定悲剧,58,59,五、混合策略均衡,60,监督博弈,61,62,博弈应用:吉蒂谋杀案,纽约的吉蒂在自己的家中,光天化日之下被歹徒残暴杀害,她的38位邻居都目睹了这一幕却无一人报警,社会心理学家对此大加批判,但经济学家拉斯缪森却给出另外的解释,
20、邻居1,旁观 r,报警 1-r,邻居2,旁观 r,报警 1-r,63,对于每一个局中人,他考虑其他N个参与者的决策,假定每个人的决策独立同分布。 10(1-r )=7 r =0.3 lim r =lim (0.3) =1,邻居i,旁观 r,报警 1-r,其他邻居,无人报警 r,有人报警 1-r,N-1,N-1,N-1,N-1,1/N-1,N,N,64,65,两个纯策略,很难判断谁最优,(T,W),(W,T,聚焦原则:focus,六、多重均衡的讨论,66,风险占优,纯策略(9,9),(7,7),风险原则,看似(9,9)更好,但要冒很大风险 pareto最优,67,防联盟原则: eg,三人博弈,N
21、ash均衡:(ULA) (DRB) (ULA) pareto最优 若丙选A,则对于甲、乙,则(DR) pareto最优,若甲、乙联手选DR,则丙收益由10到-5,丙损失了15 若要丙去选择,丙会选(DRB),这就是防联盟原则,68,相关均衡 通过外界信号获得,得益,69,70,三个博弈,71,72,分金币博弈: 5个人分100个金币,每一枚都是一样的大小和价值。 规则如下: 1先是抽签来决定自己的号码(1,2,3,4,5) 2接下来首先由抽得1号的人提出分配方案,然后大家5人进行表决,“当且仅当”超过了半数的人同意时,按照他的提案进行分配,否则将被处死。 3如果1号被处死,由2号提出分配方案,
22、然后剩下的这4人进行表决,还是“当且仅当”超过了半数的人同意时,按照他的提案进行分配,否则将被处死。 4以此类推条件:每个人都是极聪明的人,都能很理智的判断、做出选择,他们的目标都是想得到最多的金币。问题:第一个人提出怎样的分配方案才能够使自己得到最多的金币,73,倒推归纳法,决策可分为五个阶段: 最后阶段:无论4提什么,5都可否决,(0,100)或可保命; 第三阶段:3知道4的立场,应该提(99,1,0)方案; 第二阶段:无论2提什么方案,3应该会反对,但2只要笼络4,5即可获得最大利益,所以应提(97,0,2,1); 第一阶段:1知道只要争取到两个以上的人支持,自己就可以获得最大利益,故最
23、优(97,0,1,0,2) 在利益面前,没有永远的对手,也没有永远的朋友,74,挖金矿博弈: 甲:有资源 乙:有能力 乙希望甲投钱,甲,分,枝,0,4,不投,1,0,乙,投,2,2,不分,博弈树,不存在威胁时,甲一定选择不投,结:决策点,枝:决策方案,路径:系列决策,75,增加社会的介入与干涉 法律体系or信用体系,76,动态博弈:用博弈的展开式表示 包含:(1)局中人的集合 (2)行动的次序 (3) 局中人行动时的策略选择 (4) 决策时掌握的信息 (5) 盈利和效用 博弈树(Game Tree) 规则:1.每一个结至多以一个其它结直接位于它的上方 2.在博弈树中,没有一条路径可以使决策结与
24、自身相连(即不存在环) 3.博弈树必须以初始结 4.任何一博弈树正好只有一个初始结,一、动态博弈的相关概念,77,子博弈:能够自成一个博弈的某个动态博弈的部分后续博弈,它必有一个初始单结,且具备进行博弈所需要的信息。 逆推归纳法(backward induction):是从动态博弈的最后一个阶段逐步向前倒推以求解动态博弈的算法。(共同信息,链不可太长,否则不可信) 子博弈精炼Nash均衡 路径:从第一阶段开始,通过每一个阶段一个行为最后到达博弈结束的行为组合。如果动态博弈中各博弈方的策略在动态博弈本身和所有子博弈中都构成一个Nash均衡,则称该策略组合为“子博弈精炼Nash均衡”(Subjec
25、t Perfect Nash Equilibrium,78,S1=上,下 S2=(左,左),(左,右),(右,左),(右,右,二、动态博弈的标准式,79,当信息不完美,即(不完美信息动态博弈),用连起来,其本质上就是静态博弈,不完美信息博弈的标准式,80,Stackelberg 博弈,三、动态博弈应用,81,82,工会,Leontief 厂商-工会博弈,83,谈判博弈,84,85,最后通碟(ultimatum)游戏公平的价值,1982年,德国波恩大学经济学系,46名学生参加了一项有趣的博弈论实验,每组两个人分一笔钱,比如说10马克。其中一个人提出分钱方案,另一人有两种选择:接受或拒绝。若是接受
26、,实验者就按他们所提方案把钱发给两人。若是拒绝,钱就被实验者收回。 为防止交情、一时冲动、事后的社会议论等因素起作用,实验采取双盲方式,86,按照利益最大化原则,只要钱数不为零,回应者接受比拒绝总有更大的利益,他应该选择接受;那么提议者只需分给对方一点小钱就够了。此即正统博弈理论所预测的结果。 结果却与此大异其趣。 首先,大多数提议者提出的方案都在四六开到五五开之间,其中有四分之一的人提出五五开对半分; 其次,特别不公平的分配提议,几乎都被回应者毫不犹豫地加以拒绝-他们宁愿什么都不要,也不能接受那虽有一点利益然而却极不公平的分配。 主持实验的古特(W. Guth)教授等人在论文中指出,很明显,
27、受试者是依赖其公平观念而不是利益最大化来决定其行为的,87,近二十年里,最后通碟游戏及其变种,成了实验经济学中一个很火的课题,出来了上百篇论文。人们在世界各地,不断重复实验,结果都相当一致: 第一、提出较公平分配方案(给对方40%50%)的人,占受试者的4066%,其中又以提出对半分的人居多; 第二、几乎每次实验,都有2030%的人提出非常不公平的分配方案(分给对方低于30%); 第三、然而,这些极不公平的提议,总是以很高的概率被对方拒绝。 看起来,世界各地的受试者,尽管都有相当一部分人不管公平只要利益,但是大多数人,在实验中考虑公平原则却是重于利益考虑的,88,公平值多少钱,第一个质疑是:大
28、多数实验中,待分配的利益太少,受试者自然满不在乎了。 天下没有免费午餐,公平感也是有价的。对于许多人来说,只要出的价钱足够高,或与此相关的利益足够大,公平原则就不得不退居第二位。这个论点虽然不美,很残酷,然而却是事实,89,维农斯密斯教授,筹集了5000美元研究基金,找了五十个受试者,玩每盘100美元的最后通碟游戏。结果与玩 10美元游戏时候的情形完全相似。提出50对50对半分的人最多。5个人提议给对方30美元,其中两个被对方拒绝;4个人提议给对方10美元,其中3个人被拒绝。 公平原则仍然支配着大多数人的行为,90,卡麦农(Lisa A. Cameron)教授在印尼做的实验,每盘游戏价分别是5
29、000、40,000以及200,000 卢比,后者相当与受试者三个月的工资。 实验的结果,分配提议仍是以对半开居多,但分给对方份额的平均值,随着利益的增大而减少,从5000卢比时的47%减少到40000卢比时的43%再减少到200000 卢比时的38%。拒绝率也相应从30%减少到10%,然而却仍然显著为正。 实验表明,当面临极不公平的分配时,不少人宁愿牺牲相当大的利益,也要坚决说“不”,91,公平与表现,对这些实验的第二个批评是:受试者在游戏中表现得公平,可能是不想让主持人认为自己太自私、太贪婪。特别在许多实验中,受试者是学生,而实验者是教授,这个因素就更重要了。 勃尔顿和兹威克(Bolton
30、 and Zwick 1996),巧妙设计了一个实验,用来对比匿名与不匿名的效果。结果发现,人们在匿名情况下,确实比非匿名情况下,表现得更为自私,92,为了比较,勃尔顿和兹威克还设计了最后通碟的一个变种 -无报复博弈: 当回应者拒绝时,仍然给提议者他所要的钱,但给回应者的收入是零。结果,他们非常惊奇地发现,当提议者能够确认自己的不公平提议不受任何报复性惩罚时,98%的人都按博弈论的纯利益预测行事,毫不顾及公平问题,93,94,95,96,Hotelling模型,两家商店x1、x2卖同种产品S,去掉绝对值 优化,97,98,四、委托代理问题 委托人(Principle) 代理人(Agents)
31、利益分配,合作监督 机制,合同 (1)无不确定性,99,2)存在不确定性,但可以监督的模型,100,3)存在不确定性,但不可监督的模型,按产出结果付工资,101,开店合约博弈,102,103,论语-为政篇-子张学干禄,子曰:“多闻阙疑,慎言其余,则寡尤;多见阙殆,慎行其余,则寡悔。言寡尤,行寡悔,禄在其中矣。” 子张,姓颛孙名师;干禄,求官;阙,通缺;尤,过失,104,五、重复博弈,1.有限次的重复博弈 (1)定义:给定一个博弈G,重复进行T次,并且在每次重复之前,各博弈方都能 观察到从前的博弈结果。 这样的博弈过程称为G的一个T次重复博弈,记为G(T),G称为G(T)的原博弈,105,2)例
32、子:重复一次的囚徒困境 对于原博弈若存在唯一的Nash均衡,则重复后的子博弈精炼Nash均衡不变。 坦白 不坦白 坦白 不坦白 坦白 坦白 不坦白 不坦白 (得益累加法,106,3)定理: 设原博弈G有唯一的纯策略Nash均衡,则对任意正整数T,G(T)有唯一的子博弈精炼Nash均衡,即各博弈方每个阶段都采用G的Nash均衡策略,107,2.两个纯策略均衡的重复博弈,1)例子: 厂商2 (1,4) A B (3,3) 厂商 1 A (1,1) B (4,1,108,2)民间定理 设原博弈的一次性博弈均衡的数组w,那么在该博弈的多次重复博弈中,所有的个体理性得益和可实现得益都至少有一个子博弈精炼
33、Nash均衡来实现,109,规则指定路径的均衡 (3)例子1重复三次的情况 厂商1:A,若(A,A),则选A, 若(A,B),则 选B。 无条件选B 厂商2:选A 无条件选B 若(A,A), A 若(B,A), B ?在此过程中,双方是否有背离的愿望,110,4)另一个例子 2 L M R L 1 M R Nash均衡(L,L)和(R,R,111,博弈方1: M,若(M,M),则 R 若其他组合 L 博弈方2:同1 (M,M)为(4,4),(R,R)为(3,3), 所以w=(7/2,7/2,112,通过叠加: 2 L M R L 1 M R (M,M)变成了纯策略Nash均衡,113,例子的改
34、进 有限次重复博弈可以通过累加的方式将收益放在一个收益矩阵中进行分析, 例如,L M R P Q,L M R P Q,114,3.无限次重复博弈,1)概述 (贴现) r为利率,115,2)例子:无限次囚徒困境 L R L R,触发策略:采用R,若t-1个阶段为(R,R),则t阶段选R;否则选L,合作时, 背离时,时,即,所以当 时合作,116,3)例:重复古诺博弈,古诺模型时,垄断模型时,成本,均分后为,117,规则:若,否则,坚持,背离,当 时,即,双方都不会背离,118,4)例子:有效工资率,厂商决定工资率:w,努力工作 e,拒绝:个体户,社会利率,接受,工人选择,不努力工作 0,119,
35、y0,yw,若工人努力 y 若不努力 以概率p得到y,厂商只能看到产量y,工人努力:厂商得益 y-w 工人不努力:厂商期望得益 p y-w,工人努力时得益 w-e 工人不努力时得益 w 一旦发现偷懒,得益为,120,触发策略:厂商第一阶段 第t-1阶段,结果 则继续 否则,工人:若 则接受,否则个体户,121,若偷懒,只要 工人就会努力工作,对于厂商来说,122,5)例子:消耗战,离散型 连续型,假定在博弈过程中,双方都坚持一个回合付出1,在每一回合t,选择停止,不停止,在 至少有一方停止,此前 -1时刻,双方均未停止争斗, 折现,123,I) i 在 先放弃,II) 双方同时停止,124,行
36、为策略:如果其他局中人在t之前尚未停止,则以概率p在t停止,总的概率为,125,连续化,在一小时段 中,损耗,126,把时段分成k段,每段长1/k,k趋近无穷,1/k趋近0,V,127,极限分布,一个时段分成k个长度为1/k的小时段,损耗1/k,均衡,负指数分布,128,8)例子:专利竞赛,停止意味着放弃,专利价值V,若企业i在t之前没有退出,在t,t+dt之间,花费,以概率 取得 一项发明,129,130,博弈思考题演绎归纳法,A New Stone Game 有N堆石子,两人轮流进行操作,每一次为“操作者指定一堆石子,先从中扔掉一部分(至少一颗,可以全部扔掉),然后可以将该堆剩下的石子中的
37、任意多颗任意移到其他未取完的堆中”,操作者无法完成操作时为负。 问题:参与者应如何挑先?如何操作,131,倒推归纳法Plus演绎归纳法,演绎归纳法:寻找必胜/败状态 小数据推演 = 猜想 = 证明 假定局面进展到某种状态,此时无论当局者如何选择都将得到必胜或者必败的结果,称这种状态为必胜/败态,132,简单点阐述,必败态就是“在对方使用最优策略时,无论做出什么决策都会导致失败的局面”,与其相对的局面称为必胜态。 值得注意的是在必胜态下做出错误的决策也有可能导致失败。 此类博弈问题的精髓就是让对手永远面对必败态,133,必胜/败态有着如下性质: 1、若末状态为获胜则为必胜态,否则末状态为必败态。
38、 2、一个局面是必胜态的充要条件是该局面下进行某种决策后会成为必败态。 3、一个局面是必败态的充要条件是该局面无论进行何种决策均会成为胜态,134,分析: 1)只有一堆时先手必胜。 2)有两堆时若两堆相等则后手只用和先手一样决策即可保证胜利,后手必胜。若不同则先手可以使其变成相等的两堆,先手必胜。 3)有三堆时先手只用一次决策即可将其变成两堆相等的局面,先手必胜。 4)有四堆时由于三堆必胜,无论先手后手都想逼对方取完其中一堆,而只有在四堆都为一颗时才会有人取完其中一堆, 结论:只有当四堆可以分成两两相等的两对时先手才会失败,135,归纳猜想,凭借归纳猜想,我们猜测必败态的条件为: “堆数为偶数
39、(不妨设为2N),并且可以分为两两相等的N对,136,证明猜想,只需检验该状态是否满足必败态的三条性质即可。 首先,末状态为必败态,第一条性质符合。 其次,可以证明任何一个必胜态都有策略变成必败态(分奇数堆和偶数堆两种情况讨论)。 最后,证明任何一个必败态都无法变成另一个必败态,137,第四部分 不完全信息的静态博弈,不完全信息是指对完全信息的否定 不对称信息是从局中人掌握信息的角度考虑问题 完全一定对称,对称不一定完全 不对称一定不完全,不完全不一定不对称,138,企业的竞争充满了未知且不确定的因素,竞争的各方不仅需要了解博弈局中的利益相关者,更需要了解各自的可行策略,以及相应的得益结果。
40、理论上讲,如果信息真的无法估计,博弈分析是无法进行的,139,上海交通一卡通业务模式的拓展分析 如何把握未来的不确定性,140,上海东方交通卡股份有限公司是按照现代企业制度,由上海市城市建设投资开发总公司、上海市地铁总公司、上海巴士实业股份有限公司、上海市轮渡公司、上海强生集团有限公司等 10家单位共同发起组建,于一九九九年五月二十五日正式成立,公司承担上海市府99年实事工程之一的上海公共交通“一卡通”工程项目,注册资本为人民币一亿元。 公司经营范围:交通卡的制作、发行、结算服务,公共交通卡结算系统的开发、投资,公司相关设备使用、租赁等。 公司经营目标:建立安全可靠、覆盖全市公共交通行业的公共
41、交通卡付费结算系统;使持卡人可以在本市的交通、地铁、轮渡、出租、轻轨等客运行业持卡进行付费结算,公司简介,141,盈利模式分析,现有模式的收入情况,手续费收入,投资收入,单位:万元,142,关键因素分析,结论,143,发展基础分析,影响发卡量的因素,最直接的因素:给持卡人提供的服务,服务种类,服务质量,行业客户是持卡人服务的直接提供者,结论,行业客户的关系管理是企业生存和发展的基础,144,业务拓展分析,行业客户的关系管理的目标,维系老客户,发展新客户,拓展使用区域,拓宽使用领域,促进,重点:是同客户形成更多的共同利益,145,业务拓展分析,约束条件,为企业创造的价值,成本核算,经济上,增加了
42、一卡通公司的收入来源。 扩大了内部数据库的数据来源。 规模效应带来的低成本,经济利益:为持卡人的跨地域的出行以及小额消费带来了便利,同时将刺激当地卡的销量。 政治利益:顺应长三角地区经济联系日益紧密的内在需求,顺应长三角地区区域一体化的呼声,消费观念的制约。 城市间政治利益对一卡通公司的跨地域运作的制约。 城市间经济利益分配对一卡通公司跨地域运作的制约,为客户创造的价值,主要的成本来自于原有POS机的兼容性改造成本,以及网络建设成本,地 域,146,业务拓展分析,约束条件,为企业创造的价值,成本核算,增加了一卡通公司的收入来源,一卡通的发卡量大,可以直接作为广告载体。 一卡通的使用时间长,使用
43、频率高,具有极高的广告使用价值,广告只能在新卡上印刷。目前老卡的发卡量已经很大,又无法在短时期内回收,这将限制一卡通作为广告载体的价值。 一卡通的使用时间长,一旦投入广告,需要经过很长的周期才能更换新的内容,为客户创造的价值,老卡的回收将产生较高的成本。建议目前在新卡上投放广告,领域:广告业,147,业务拓展分析,约束条件,为企业创造的价值,成本核算,扩大了一卡通的应用范围,提高了一卡通的附加值。 带来一定的沉淀资金,使便利店、报刊零售点避免找零。 方便消费者购物,国家相关政策的约束 便利店和报刊零售点的营业额低,同时需要交纳手续费,应此可能对一卡通的使用兴趣不高,为客户创造的价值,pos机单
44、价约为3000元,折旧期为5年。手续费按1计算,如果需要在2年内收回成本,网点的日刷卡金额需要达到400元,148,业务拓展分析,约束条件,为企业创造的价值,成本核算,扩大了一卡通的应用范围,提高了一卡通的附加值。 带来大量的沉淀资金,加快缴费速度,解决水、电、煤及电话缴费高峰时期的缴费难问题。 提高公用事业单位的服务质量和企业形象。 减少排队缴费现象的发生,方便了消费者,涉及上级主管部门、上述公司同一卡通之间的利益分配。 目前许多银行和邮局均开办该业务,用户缴费方便,而一卡通尚未铺设相应的缴费网点,在短期内将会制约该业务的开展,为客户创造的价值,用户分散,pos机前期投入较大。但水、电、煤和
45、电话缴费数量大、金额高,有大量的资金沉淀,回收期较短,149,业务拓展分析,约束条件,为企业创造的价值,成本核算,扩大了一卡通的应用范围,提高了一卡通的附加值。 带来大量的沉淀资金,使快餐店避免找零,提高付款数度,增加收入。 上班族一般均持有一卡通,他们使快餐店的主要消费者。一旦一卡通进入快餐领域,将极大的方便该消费群体,国家相关政策的约束,为客户创造的价值,如果选择进入规模大、营业额高的连锁快餐企业(如肯德基、麦当劳等),就可以提高刷卡金额,获取更高的手续费,150,业务拓展分析,约束条件,为企业创造的价值,成本核算,扩大了一卡通的应用范围,提高了一卡通的附加值。 带来一定的沉淀资金,目标客
46、户为外地来沪的游客,宾馆将一卡通出租给游客,以方便游客在上海市内进行小额消费 。 增加了宾馆的服务项目,无,为客户创造的价值,从成本角度考虑应选择入住率高的宾馆 ,从而加快成本的回收,151,业务拓展分析,约束条件,为企业创造的价值,成本核算,扩大了一卡通的应用范围,提高了一卡通的附加值。 带来大量的沉淀资金,加快邮资的支付的速度,提高邮局的工作效率和服务质量。 用户支付邮资将十分便利,节约了用户的时间,主要是政府相关法规的约束,为客户创造的价值,邮局的营业点众多,一卡通公司前期的投入会比较大。但邮局的营业额稳定,一卡通公司通过手续费和沉淀资金可以很快收回投资,152,业务拓展分析,约束条件,
47、为企业创造的价值,成本核算,扩大了一卡通的应用范围,提高了一卡通的附加值。 带来一定的沉淀资金,在特定时期会出现较大的客流量,比如体育比赛和旅游高峰。使用一卡通可以提高体育场馆和公园的售票速度,降低其在高峰时期的排队购票现象,国家相关政策的约束,为客户创造的价值,从成本角度考虑应选择体育赛事较多和人流量较大的体育场馆和公园铺设pos机,从而加快成本的回收,153,业务拓展分析,约束条件,为企业创造的价值,成本核算,扩大了一卡通的应用范围,提高了一卡通的附加值。 带来一定的沉淀资金。 提高了数据库中数据了录入量,可用于分析运输业的消费特点,提高车站的售票效率,降低人员成本。 减少客运高峰时期的排
48、队购票现象。 提升了乘客的满意度,国家相关政策的约束,为客户创造的价值,长途车站相对集中,前期投小。购买 车票的刷卡金额高,成本能够很快得以回收,154,业务拓展分析,约束条件,为企业创造的价值,成本核算,扩大了一卡通的应用范围,提高了一卡通的附加值。 带来一定的沉淀资金。 提高了数据库中数据了录入量,可用于分析高速公路车流量的特点,提高收费站的收费速度,减少了收费站车辆的堵塞现象。 提升了乘客的满意度,国家相关政策的约束,为客户创造的价值,成本低,资金回收快,155,业务拓展分析,约束条件,为企业创造的价值,成本核算,提高了数据的使用价值,增加了一卡通公司的收入来源,一卡通的发卡量大,录入的
49、数据量多,这些数据直接反映出消费者在日常生活中小额消费的习惯,对政府和企业都具有极高的参考价值。 降低了数据使用单位收集相关信息的成本,对咨询业比较陌生。 缺乏对数据的分析能力已及相应的人才,为客户创造的价值,通过和专业咨询公司合作可以避免成本的发生,直接获得收益,领域:咨询业,156,业务拓展分析,项目比较,157,1.不对称信息的古诺模型,C和Q是共同知识,158,159,2.Harsanyi转换,不完全信息博弈完全但不完美信息博弈 n个人的静态贝叶斯博弈 正则表达: 行动 A1An 类型 T1Tn 判断 P1Pn 盈利 U1Un 贝叶斯均衡,160,3.搭便车,捐款:局中人i=1,2,捐
50、CiC, C, C 1 C Ci是随机变量,分布函数F(x)=P(X x), F(C)=0 F(C)=1,161,162,163,4、拍卖与竞标,拍卖也称竞买, 79年版本辞海中的解释为“资本主义制度一种买卖方式”,十年以后辞海第二版,重新解释为:“拍卖也称竞买,商业中的一种买卖方式,卖方把商品买给出价最高的人”。 拍卖品是不是都是处理商品,现在外面很多拆房子,换季拍卖等,实质上是一种大甩卖、贱卖,我们所说的拍卖是一种高档次的行为,不是削价处理,价格是不固定的,必须要有二个以上的买主,要有竞争,价高者得,没有这三个条件的不能称为拍卖,164,和谐的藏区的启示:盐粮古道上的驮帮,纳木措,唐拉亚秀
51、7111,拉萨,当雄,赞宗措,多久泉水,扎加赞布,保吉五村,保吉乡,查尔乡,尼荣乡,羊八井,巴宁,雄麦,东嘎,自公元600年囊日松赞开始记载,藏北牧民每年二月北上盐湖取盐,历时月余。每年9月,驮队大规模南下农区,以盐换粮,盐粮总量均达万斤以上,藏北有大小湖泊1000多个,盐湖490多个,矿化度大于50g/L有220多个,165,拍卖方式有英格兰式拍卖、荷兰式拍卖、英格兰式与荷兰式相结合的拍卖方式。 英格兰拍卖也称“增价拍卖”或“低估价拍卖”。是指在拍卖过程中,拍卖人宣布拍卖标的的起叫价及最低增幅,竞买人以起叫价为起点,由低至高竞相应价,最后以最高竞价者以三次报价无人应价后,响槌成交。但成交价不
52、得低于保留价。 荷兰式拍卖也称“降价拍卖”或“高估价拍卖”。是指在拍卖过程中,拍卖人宣布拍卖标的的起叫价及降幅,并依次叫价,第一位应价人响槌成交。但成交价不得低于保留价。 英格兰式与荷兰式相结合的拍卖方式。是指在拍卖过程中,拍卖人宣布起拍价后及最低增幅,由竞买人竞相应价,拍卖人依次升高叫价,以最高应价者竞得。若无人应价则转为拍卖人依次降低叫价及降幅,并依次叫价,以第一位应价者竞得。但成交价不得低于保留价,166,拍卖的形式变化,标准增量式拍卖 这是一种拍卖标的数量远大于单个竞买人的需求量而采取的一种拍卖方式(此拍卖方式非常适合大宗积压物资的拍卖活动)。卖方为拍卖标的设计一个需求量与成交价格的关
53、系曲线。竞买人提交所需标的的数量之后,如果接受卖方根据他的数量而报出的成交价即可成为买受人。 速胜式拍卖这是增价式拍卖的一种变体。拍卖标的物的竞价也是按照竞价阶梯由低到高、依次递增,不同的是,当某个竞买人的出价达到(大于或等于)保留价时,拍卖结束,此竞买人成为买受人。 反向拍卖反向拍卖也叫拍买,常用于政府采购、工程采购等。由采购方提供希望得到的产品的信息、需要服务的要求和可以承受的价格定位,由卖家之间以竞争方式决定最终产品提供商和服务供应商,从而使采购方以最优的性能价格比实现购买。 定向拍卖 这是一种为特定的拍卖标的物而设计的拍卖方式,有意竞买者必须符合卖家所提出的相关条件,才可成为竞买人参与
54、竞价,167,一次价格密封标价拍卖,局中人 i, 估价vi,开出价格P,投标费用忽略。 策略空间: 类型空间:vi 信念:局中人i相信vi均匀分布于0,1 报价策略: 盈利,168,1)线性Bayes均衡,169,1)线性Bayes均衡,vi是随机变量,比较得,170,2)对称Bayes均衡,双方遵循同一个报价规则,bi(vi)连续RV,171,172,5.双边拍卖,局中人 i=1,2 卖者p1, 买者p2 若p2 p1交易成立 若p2 p1 交易不发生,1卖者估价C,C0,1;2买者估价V,V0,1 买者以P得货的收益U2=V-P;卖者以P出售的收益U1=P-C 交易若未成功,U2= U1=
55、0,173,174,线性报价 C与V均服从0,1均匀分布,175,176,177,6.性别战,混合策略,178,2+t1,1,0,0,0,0,1,2+t2,戏,戏,足球,足球,妻,丈夫,现将其看成不完全信息,ti0,x均匀分布 A1= A2=戏,球 T1=T2=0,x,179,t1临界值C1,当t1C1,妻选择看戏(I) 否则 看球 t2临界值C2,当t2C2,丈夫选择看球 否则 看戏 妻,看戏概率, 看球 丈夫,看球概率, 看戏,180,此时,妻子看戏是关于丈夫策略的最优反应,由(I),,同理, 时,丈夫看球是关于妻子策略的最优反应,181,由得,此为完全信息下混合策略概率,182,7.机制
56、设计,机制设计理论是研究在自由选择、自愿交换、信息不完全及决策分散化的条件下,能否设计一套机制(规则或制度)来达到既定目标的理论。 这一理论可看作是博弈论和社会选择理论的综合运用,被广泛地运用于垄断性定价,最优税收,公共经济学以及拍卖理论等诸多领域。它有助于经济学家、各国政府和企业识别在哪些情况下市场机制有效,哪些情况下市场机制无效,能帮助经济学家确定有效的贸易机制、规则体系和投票程序。 机制设计理论最早由赫维奇提出,并由马斯金和迈尔森进一步发展,183,机制设计是博弈的反求工程 如果我们假设人们是按照博弈论所刻画的方式行为的,并且我们设定按照社会选择理论我们对各种情形都有一个社会目标存在,那
57、么机制设计就是考虑构造什么样的博弈形式,使得这个博弈的解就是那个社会目标,或者说落在社会目标集合里,或者无限接近于它。它和所谓的信息经济学也几乎是一回事,只不过后者有不同的发展线索,但毫无疑问所有信息经济学成果都可以在机制设计的框架中处理,184,从研究者的角度看,一个机制的最值得关注的特征有两个,信息和激励。 机制的运行总是伴随着信息的传递,那么信号空间的维度成为影响机制运行成本的一个重要因素,所谓信息问题就是要求机制的信号空间的维度越小越好,当然必要时还须考虑信息的复杂性。而激励问题就是我们通常说的激励相容,这是赫维茨1972年提出的重要概念。在不同的博弈解前提下,激励相容有不同的表现形式
58、。机制设计理论家们几乎对各种情形下什么样的社会选择规则是可执行(马斯金贡献的概念)的问题都进行了探讨,185,非线性定价模型,某产品边际成本C,购买q的产品支付 , 效用,v双方共同知识, 是消费方的私人信息,0(递增), 0(边际效用递减,总效用 (消费者,效用总类:假定,186,公司开价,公司期望收益,187,参与约束:IR(participation constraint,激励约束:IC(incentive compatibility constraint,188,1) 与 自然成立,0, , 0, 0, 0,189,2) 一般严格成立不等号 (3) 一般成立等号,反证:若 0, 0,可
59、用 代替 ,使4个约束依然成立,而价格T提得更高,一定是等号(最优时,190,4) 成立等号,反证:假如,令 ,用 代替 ,约束成立,是等号,191,约束,变为,留,一个,约束,192,低端,C,所以厂商一般压低低端产品产量来满足高端,193,验证: 仍然是满足的,194,第五部分 不完全信息动态博弈,不完全信息的博弈,局中人需要对某种重要信息加以判定。 不完全信息的动态博弈,局中人需要根据博弈的进程对重要信息的判定加以修正。 例1:抽签问题,195,上海莲花路楼盘倒塌案例,2009年6月27日5时30分许,上海市闵行区莲花南路罗阳路口一在建楼盘工地发生楼体倒塌事故,造成1名工人死亡,无人受伤
60、,196,各方态度,舆论: 论因为地质原因或施工质量原因而倒下,这幢倒塌的大楼都反映了在城市开放建设过程中所存在的隐忧,也是现阶段房地产市场乱象的一种写照。 从勘察单位开始-设计单位-施工单位-检测部门及政府监管部门 大众: 倒塌大楼是否存在严重建筑质量问题;该小区是否距离河道太近;为何工地施工已对附近防汛墙造成严重损害,却没有被及时发现和阻止;如果这幢大楼存在地质隐患,何以还能公开发售;该小区其他建筑是否也会存在质量安全问题,周边住宅会不会受到大楼倒塌的影响;该小区在审批、开发过程中是否存在违规问题,等等,197,政府: 上海市委书记俞正声、市长韩正立即作出批示,要求成立联合调查小组,彻查事
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024桂林信息科技学院辅导员招聘笔试真题
- 翻译(俄语)岗位考试试卷及答案
- 2025年航空制造和材料专用设备项目合作计划书
- 2025年聚烯烃类线缆项目建议书
- 2024年杭州市委党校萧山区分校招聘真题
- 2025年吉安县农业产业发展中心人员招聘笔试考试试题【答案】
- 消费偏好变迁下的产品创新
- 湘艺版音乐一年级上册牵牛花当喇叭教案
- 2025年装订活动及印刷用附件项目建议书
- 2025年电动护理床合作协议书
- 公司年终答谢宴策划方案
- 2025年成人高考高升专语文全真模拟试卷(含作文范文)真题演练
- 舞台租赁协议模板与舞台设备租赁合同3篇
- T/CIES 035-2024生鲜食用农产品照明光源显色性规范
- 湖北中考英语真题单选题100道及答案
- 二维材料光电子器件集成-全面剖析
- 母婴店转让协议书范本
- 《赵丽颖概述》课件
- 2025-2030中国医疗IT行业市场深度调研及竞争格局与投资研究报告
- 沼气补充合同协议
- 豪爵购车合同协议
评论
0/150
提交评论