版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章 博弈论 引论,引例,诺曼底战役攻防战 如果给你两个师的兵力,由你来当“司令”,任务是攻克“敌人”占领的一坐城市,而敌军的守备力量是三个师,规定双方的兵力只能整师调动。通往城市的道路有两条。当你发起进攻的时候,你的兵力超过敌人,你就获胜;你的兵力比敌人的守备兵力少或者相等,你就失败。那么,你如何制定攻城方案?,城市,敌我双方部署方案 敌人的部署方案: A.三个师都驻守道路1; B.两个师驻守道路1,一个师驻守道路2; C.一个师驻守道路1,两个师驻守道路2; D.三个师驻守道路2。 我方部署方案: a.集中全部两个师的兵力从道路1攻击; b.兵分两路,一师从道路1,另一师从道路2,同时发
2、起攻击 c.集中全部两个师的兵力从道路2攻击。,表1.1 诺曼底战役攻防作业演练,表1.2 化简后的诺曼底战役攻防作业演练,这样排列出来的矩阵,叫做二人博弈的支付矩阵。 这种表示方式叫做博弈的矩阵表示、博弈的正规型表示或博弈的策略型表示。 而这种博弈,叫做矩阵型博弈、正规型博弈或策略型博弈,支付矩阵与高数矩阵的区别,当以支付矩阵的形式表达一个二人博弈的时候,我们把一个参与人写在左方,把另一个参与人写在上方。 左方参与人就是行参与人,上方参与人就是列参与人,表1.2 化简后的诺曼底战役攻防作业演练,参与人,行参与人,列参与人,博弈的种类,博弈的种类,3、在一个博弈中所有参与人对 其他参与人曾经采
3、取的决策 或者行动完全清楚的博弈,2、参与人是否了解该次 对局中每个人的得益,博弈的种类,5、一个博弈在所有各种对局下 全体参与人之得益的总和 是否保持一个常数,4 、在一个博弈中所有对局下 所有参与人的得益总和是否为零,博弈的三要素,一、谁参与这个博弈 博弈要有2个或2个以上的参与人(Player) 在博弈中存在一个必须的因素,那就是不是一个人在一个毫无干扰的真空里做出决策。如果是一个人做决策而不受到他人干扰的话,那就是一个传统经济学或管理学中最经常研究的最优化问题,,最简单的一个最优化的例子就是,吸烟伤肺, 不吸烟却又伤心,烟民是选择抽烟还是不抽烟, 这就需要进行权衡(Tradeoff)。
4、如果这个 烟民非单身贵族,而是有妻子或女友,这种情况 下就很有可能形成一个博弈。,二、可供参与人选择的行动(action)或者策略(strategy) 三、博弈要有参与各方争夺的资源或收益(Resources或Payoff支付)。 资源是有主观性的。人们之所以会参与博弈是受到利益的吸引,预期将来所获得利益的大小直接影响到竞争博弈的吸引力和参与者的关注程度 。,即得益,支付不是付出,是得到。支付一般是一个实数,可正可负.,有些参考书中还包括第四个要素:参与者拥有一定量的信息(Information)。比如在“合纵连横”的故事中,秦国与六国之间所拥有的信息就是完全的秦国采取“连横”政策,齐国默许秦
5、国的“连横”政策并与秦国建立友好外交关系 。 但有些时候,信息并不是完全的,俗话说“天有不测风云”,比如今天是阴云密布、狂风大作,气象台预报明天是“阴转小雨”,明天出门上班到底要不要带伞呢?这种情况的信息是不完全的,人们决策的信息条件是不确定。当然从情理上说,在实际生活中一般是要带伞以防不测。,2.囚徒困境(博弈论中最重要最著名的例子),话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人甲和乙,并从他们的住处搜出被害人家中丢失的财物。但是,他们都矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离审讯。 这个时候,聪明的警官
6、找他们谈话,分别告诉他们说:“你们的偷盗罪确凿,所以可以判你们1年刑期。但是,我可以和你做个交易。如果你招了,他不招,那么你会作为证人无罪释放,他将被判5年徒刑;如果你招了,他也招了,你们都将被判3年有期徒刑;如果他招了,你不招,他无罪释放,你被判5徒刑;如果你们都不招,各判1年。”,图1.3 “囚徒困境”,囚徒困境的初步求解过程。 囚徒困境含义。 囚徒困境反映了一个很深刻的问题,这就是个人理性与集体理性的矛盾。换言之,从个人利益最大化出发的行为往往不能实现团体的最大利益,而从个体利益出发的行为最终也不一定能真正实现个体的最大利益,甚至会得到相当差的结果。,练习:独木桥火拼博弈,设想两个人同时
7、举着火棍从独木桥的两端走向中央进行火拼,每人面临两种选择,前进或后退。如果每人都前进,则会两败俱伤,大家的得益均为-3。如果一方前进另一方后退,前进者胜利,其得益为2,退下来的丢面子,得益为0。如果两人都后退,都得丢面子,得益均为0。 问题: 1.该博弈是静态博弈,还是动态博弈。 2.描述该博弈应该使用如何表示这个博弈模型。,1.答:该博弈是静态博弈。 2.答:应该使用博弈的矩阵型(博弈的正规型表示)。该博弈的正规型表示如下:,序贯决策博弈,博弈的参与人在博弈时,决策是先后进行的进行。 局中人做出策略选择时知道对手的策略选择。,用博弈树来表示序贯博弈。 它描述了博弈参与人的一个序贯决策过程,从
8、博弈数的根开始,到末端点结束。 拥有初始决策节点的局中人先做出决策,他的决策引出博弈树的棱,而棱的末端将是下一个局中人做出决策,依此类推。,动态博弈的表示,抓钱博弈 故事背景(略) 用博弈树来表示,(1,1),(5,5),(2,2),(3,3),(4,4),甲,甲,乙,乙,拿,拿,拿,拿,不拿,不拿,不拿,不拿,决策节点,末端节点,棱,利益一致(双方利益单调上升),(2,0),(10,0),(0,4),(6,0),(0,8),甲,甲,乙,乙,拿,拿,拿,拿,不拿,不拿,不拿,不拿,你死我活(利益只归一方),(2,0),(6,4),(1,3),(4,2),(3,5),甲,甲,乙,乙,拿,拿,拿,
9、拿,不拿,不拿,不拿,不拿,温和对抗(财富单调曲折上升),作业,大海和丽娟正在热恋。难得的周末又到了,安排什么节目 好呢?周末晚上,中国足球队要在世界杯外围赛中和伊朗队作 生死之战。大海是个超级球迷,国内的什么“中超”联赛都不肯 放过,何况是不争气的国家队的生死大战?也正好是这个周末 的晚上,俄罗斯一个著名芭蕾舞剧团莅临该市演出芭蕾舞剧 胡桃夹子。丽娟最崇尚钢琴芭蕾这样的高雅艺术,对斯拉 夫民族的歌唱和芭蕾更是崇拜得五体投地,她怎么肯放过正宗 俄罗斯的芭蕾胡桃夹子? 这么说,一个在自己家里看电视转播的足球比赛,一个 去剧院看芭蕾演出不就得了?问题在于,他们是热恋中的情侣 。各自度过这难得的周末时光,才是最不乐意的事情。这样一 来,他们真是面临一场温情笼罩下的“博弈”。,给大海和丽娟的“满意程度”赋值:如果大海看球,让 丽娟一个人去看芭
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教育经历及在校奖惩制度
- 文明施工管理奖惩制度
- 关于消防维修奖惩制度
- 班级如何设计奖惩制度
- 员工培训期间奖惩制度
- 采购流程以及奖惩制度
- 幼儿园考试奖惩制度细则
- 如何制定团队奖惩制度
- 亚马逊员工考核奖惩制度
- 公司潜在推动奖惩制度
- 2026云南楚雄市司法局第一批司法协理员招聘10人考试参考试题及答案解析
- 2025年02月陕西省国际信托股份有限公司2025年招考笔试历年常考点试题专练附带答案详解试卷2套
- 2026年阜新高等专科学校单招职业技能测试题库必考题
- GB/T 5973-2026起重机械钢丝绳绳端固接接头
- 中央预算资金34个细分领域资金分布比例及项目申报实操
- 2026马年春节开学第一课课件:用英语讲述我的中国年
- 2026年南京机电职业技术学院单招职业适应性测试题库附答案解析
- 蒲公英介绍教学课件
- 2026青海海东公安招录32名人民警察备考题库及答案详解(夺冠系列)
- 2026北森测评试题及答案
- 2026西藏自治区教育考试院招聘非编工作人员11人备考考试题库及答案解析
评论
0/150
提交评论