已阅读5页,还剩65页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 一 囚徒困境二 智猪博弈三 斗鸡博弈 博弈经典案例 2 一 囚徒困境 3 一 博弈论 从 囚徒困境 谈起 人类的自私天性 使他们陷入 囚徒困境 难以自拔 社会生活和商业竞争中的许多逻辑都与这一困境密切相关 合作是可能的吗下面看看 囚徒困境 的故事 4 1问题 两个小偷甲和乙联手作案 被警方逮住但未获证据 警方将两人分别置于两间房间分开审讯 政策是若一人招供但另一人未招 则招者立即被释放 未招者判入狱10年 若二人都招则两人各判刑8年 若两人都不招则未获证据但会以较轻的罪名各判1年 5 小偷甲的选择 招或不招小偷乙的选择 招或不招甲或乙可以作出的选择被称为 策略 如 招 或 不招 都是策略 2两小偷的最后选择是什么 6 3博弈的表达表1囚徒困境博弈乙招不招招甲不招 问题1 甲 乙如何选择 7 尽管甲不知乙是否招供 但他认为自己选 招 最好 因而甲会选择 招 乙也同样会选择 招 结果各判8年 但若两人都不招 结果是两人只被判1年 但这种结果是不会出现的 我们可以运用 剔除劣策略 的方法来获得这样的结果 8 对甲来说 尽管他不知道乙是选择了 招 还是 不招 他发现他自己选择 招 都是比选择 不招 为好的 因此 不招 是相对于 招 的劣战略 他不会选择劣战略 所以 甲会选择 招 同样 根据对称性 乙也会选择 招 结果是甲乙两人都 招 9 甲和乙是参与博弈的人 称为 局中人 或 参与人 表1中每一个小方格内的数字被称为局中人的支付或 得益 其中左边的数字代表甲的支付 右边的是乙的支付 表1中的双变量矩阵称为博弈支付矩阵或 得益 矩阵 10 局中人所选择的策略构成的组合 招 招 被称为博弈均衡 这个组合中前后两个策略分别表示甲和乙所选择的策略 11 甲和乙都不会选择劣策略 不招 称为 剔除劣策略的占优策略均衡 其中 招 是占优于 优于 不招 的占优战略 12 通过追求个人的自身利益 他常常会比其实际想要做的那样更有效地初进了社会利益 亚当 斯密所著的 国富论 13 14 15 囚徒的困境通常被看着个人理性和集体理性的经典情形 合作是有利的 利己策略 但它必须符合以下的黄金律 按照你愿意别人对你的方式来对别人 但只有他们也按同样的方式来行事才行 这就是 己所不欲施于人 前提是 人所不欲施于我 16 囚徒的困境 的内在根源是在个体之间存在行为和利益相互制约的博弈结构中 以个体理性和个体选择为基础的分散决策方式无法有效地协调各方面的利益 并实现整体 个体利益共同的最优 简单地说 囚徒的困境 问题都是个体理性与集体理性矛盾引起的 现实中 囚徒的困境 类型的问题是很多的 例如厂商之间的价格战 恶性的广告竞争 初等 中等教育中的应试教育等 其实都是 囚徒的困境 博弈的表现形式 17 18 19 20 21 我们可以利用这个道理来分析日常生活中的许多不合作现象 例子1商家价格战出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利 但实际上却是相互杀价 结果都赚不到钱 22 当一些商家共谋将价格抬高 消费者实际上不用着急 因为商家联合维持高价的垄断行为一般不会持久 可以等待垄断的自身崩溃 价格就会掉下来 譬如 2000年我国几家生产彩电的大厂商合谋将彩电价格维持高位 他们搞了一个 彩电厂家价格自律联盟 并在深圳举行了由多家彩电厂商首脑参加的 彩电厂商自律联盟高峰会议 23 当时 国家有关部门还未出台相关的反垄断法律 对于这种在发达国家明显属于违法行为的所谓 自律联盟 国家在法律上暂时还是无能为力的 寡头厂商在光天化日之下进行价格合谋 并且还通过媒体大肆炒作 这在发达国家是不可思议的 24 但是 尽管政府当时无力制止这种事情 公众也不必担心彩电价格会上涨 这是因为 彩电厂商自律联盟 只不过是一种 囚徒困境 彩电价格不会上涨 在高峰会议之后不到二周 国内彩电价格不是上涨而是一路下跌 这是因为厂商们都有这样一种心态 无论其他厂商是否降价 我自己降价是有利于自己的市场份额扩大的 25 26 27 人质困境 多个人的囚徒困境 老鼠们意识到 假如可以在猫脖子上系一个铃铛 那么 他们的安全就会有保障 问题在于 谁会愿意冒赔上小命的风险给猫系上铃铛呢 老鼠所面临的这个问题同样摆在人类面前 人们在直接面对威胁或损失时 也面临同样的心理困境 在一群人面对威胁或损失时 第一个采取行动 的决定是很难做出的 因为它意味着将付出惨重代价 这个困境便就叫做人质困境 28 例子 长途汽车上的劫匪众人抢劫 若是众人一哄而上肯定能降伏劫匪 但是问题就在于如何一哄而上 首先联合他人或挺身而出或者是首先报警的人必然受到劫匪的剧烈打击 这是他一个人所承受不了的负担 结果就造成了没人愿意第一个站出来 即人质困境 29 问题 烟草商为何不反对禁止烟草广告 30 通过上面的例子 我们对博弈的概念重新理解一下 博弈即一些个人 团体或其他组织 面对一定的环境条件 在一定的规则下 同时或先后 一次或多次 从各自允许选择的行为或策略中进行选择并加以实施 各自取得相应结果的过程 31 二 基本概念 局中人或参与者 Players 规则 rules 规定博弈各方的行动顺序 方式 以及最终的结果等 策略 Strategy 一整套的行动方案 规定了各种情况下的行动 比如 敌进我退 敌退我追 敌驻我扰 敌疲我打 32 相机策略 contingentstrategy 仅在不确定事件发生时才会采取的策略 如 人不犯我 我不犯人 人若犯我 我必犯人 行动 局中人在特定条件下的行为支付 Pay off 博弈结束时 各方得到的收益 策略均衡 参与者之间稳定的 可预测的互动行为模式 就是策略均衡 二 基本概念 33 纳什均衡 纳什均衡是指在对手策略既定的情况下 各自对局者所选择的策略都是最好的 给定你的策略 我所选择的是最好的 给定我的策略 你所选择的是最好的 34 一农户在杀鸡前的晚上喂鸡 不经意地说 快吃吧 这是你最后一顿 第二日 见鸡已躺倒并留遗书 爷已吃老鼠药 你们别想吃爷了 爷也不是好惹的 点评 当对手知道了你的决定之后 就能做出对自己最有利的决定 纳什均衡理论所以保密 信息安全很重要 35 纳什均衡的意义 所以 纳什均衡 是对冯 诺依曼和摩根斯特恩的合作博弈理论的重大发展 甚至可以说是一场革命 合作是有利的 利己策略 但它必须符合以下黄金律 按照你愿意别人对你的方式来对别人 但只有他们也按同样方式行事才行 也就是中国人说的 己所不欲勿施于人 但前提是人所不欲勿施于我 其次 纳什均衡 是一种非合作博弈均衡 在现实中非合作的情况要比合作情况普遍 36 一个博弈需要设定下列四个方面 1博弈的参加者 是博弈的决策主体 是指博弈中独立决策 独立承担后果 以自身利益最大化来选择行动的主体 可以是个人 团体如厂家 政府 国家 局中人以实现自身利益的最大化为目标 都可以作为博弈中的参加者 37 判断博弈参与者的根本标志是他是否是博弈的利害关系者 只有在博弈中存在利害关系的决策主体才被看作是博弈的参与者 那些不作决策或虽做决策但不直接承担决策后果的被动主体不是参与人 而只能当做环境参数来处理 如指手划脚的看牌人 看棋人 企业的顾问等 天塌下来关我啥事 38 2各博弈方各自可选择的全部策略或行为的集合 可以是有限的 也可以是无限的 39 谈到博弈策略问题 可以说在我国传统文化中 包含有许多精妙的博弈策略 许多成语及成语典故 就是对博弈策略的令人叫绝的运用和归纳 如围魏救赵 背水一战 暗渡陈仓 釜底抽薪 狡兔三窟 先发制人 借鸡生蛋等等 当然 博弈策略的成功运用须依赖一定的环境 条件 在一定的博弈框架中进行 40 3进行博弈的次序4博弈方的得益或支付对应于各个博弈方的每一组可能的决策选择 都应有一个结果表示该策略组合下各博弈方的所得或所失 如 利润 损失 个人效用和社会福利 经济福利等 41 博弈方的个体理性和集体理性以个体利益最大为目标被称为 个体理性 存在以集体 团体 利益为目标 追求集体利益最大化称为 集体理性 囚徒的困境揭示了个体理性和集体理性之间的矛盾 42 一般情况 集体利益最大化本身不是博弈方的根本目标 人们在博弈中的行为准则是个体理性而不是集体理性 如果在博弈中存在 有约束力的协议 使得博弈方采取符合集体利益最大化而不符合个体利益最大化的行为时 能够得到有效的补偿 从而使博弈方按照集体理性决策和行动成为可能 43 我门将允许存在有约束力协议的博弈方称为 合作博弈 不允许存在有约束力协议的博弈则称为 非合作博弈 44 合作的基础 1 存有共同的利益 2 必要的信息交流 消除各方的参与者的信息不对称 才能使参与者对合作有一个较为稳定的预期 3 自愿 平等和互利 4 强制性的契约所以 合作博弈论允许博弈各方通过谈判与沟通来树立合作意识 45 君子和而不同 小人同而不和 论语 子路第十三 46 2博弈的策略 如果一个博弈中每个博弈方的策略都是有限的 则称为 有限博弈 如果一个博弈方的策略是无限多个 则称为 无限博弈 47 3博弈中的得益 支付 得益即参加博弈的各个博弈方从博弈中所获得的利益 1 零和博弈 即一方的得益必定是另一方的损失 指的是所有博弈方的得益总和为零 各种赌博就属于零和博弈 例如4个人参与一场赌博 其中3个人输了总共1000元 那么另外一个人必然赢了1000元 期货交易市场的参与者之间的关系也属于零和博弈 人们平常所说的 损人利己 实际上也包含有零和博弈的意思 例如 石头 剪子 步 48 2 常和博弈 所谓常和博弈 又叫非零和博弈 是指各博弈方的得益之和是一个非零的常数 它区别于零和博弈 在这种状况时 自己的所得并不与他人的所失的大小相等 连自己的幸福也未必建立在他人的痛苦之上 即使伤害他人也可能 损人不利己 所以博弈双方存在 双赢 的可能 进而合作 譬如 在恋爱中一方受伤的时候 对方并不是一定得到满足 也有可能双方一起能得精神的满足 也有可能双方一起受伤 通常 彼此精神的损益不是零和的 目前的中美关系 就并非 非此即彼 而是可以合作双赢 49 3 变和博弈 变和博弈也称非常和博弈 则是指随着博弈参与者选择的策略不同 各方的得益总和也不同 即所有博弈方的得益为不确定的变量 而非某个确定的常数 比如 同一个股票市场 面对同样的大盘走势 伴随着投资者的投资策略不同 有可能大部分人赚钱而小部分人亏钱 也有可能小部分人赚而大部分人亏 甚至还有可能所有人都赚或都亏 在这个博弈中 博弈各方的得益是不确定的变量 无法用确定的常数表示出来 50 4博弈的过程 1 静态博弈博弈的参与者同时作出决策 或者虽然决策有先后 但是没有人在决策之前看到了其他参与者的决策行为 一旦决策做出之后 就只能等待结果 对博弈的发展再也不能产生任何影响 这种博弈叫做静态博弈 譬如 在投标活动中 投标人投出标书一般虽有先后 但因为所有投标人在开标前都不知道其他投标人的标价 因此可看作同时选择策略 采取行动 体育竞赛中 双方出场阵容的选择也属于静态博弈 51 2 动态博弈动态博弈则是指博弈方的选择和行动有先后之分 后行者可以根据先行者的策略选择来决定自己的策略 如A企业降价后 B企业也跟着降价 足球比赛中 一方换上一名攻击性前卫后 另一方针对性地换上一名后卫 如此等等 52 3 重复博弈 实际上就是同一个博弈反复进行所构成的博弈过程 如果你去菜场买菜 当你对某种菜的质量 口味等有疑虑时 卖菜的阿姨常会讲 你放心 我一直在这儿卖呢 这句朴实的话中其实包含了华丽的 博弈论 思想 我卖与你们买是一个次数无限的重复博弈 我今天骗了你 你们今后就不会再来我这儿买了 所以我不会骗你的 菜的质量 口味肯定没问题 而你在听了阿姨的上述一句话后 常常也会打消疑虑 买菜回家 地摊 车站 旅游点 这些流动性大的地方 不但商品服务质量最差 而且假货横行 因为商家和顾客之间没有明天 53 二 智猪博弈 54 什么是智猪博弈 智猪博弈说的是 有两头非常聪明的猪 要不怎么叫智猪呢 一大一小共同生活在一个猪圈里 猪圈的一端有一个踏板 踏板连着开放饲料的机关 只要踏一下 在猪圈的另一端就会出现10个单位食物 经过精确的衡量 任何一头猪去踏这个踏板都会付出相当于两个单位食物的成本 每只猪都可以选择 踏 或者 不踏 踏板 那么 大猪小猪分别会做什么选择呢 55 选择 该博弈的赢利表见图4 2 56 智猪博弈的收益表 小猪踏不踏踏大猪不踏 6 04 410 20 0 观察此博弈发现 小猪有优势策略 无论大猪踏或不踏 小猪选择不踏总是最合适的 但是大猪没有优势策略 57 改变方案一 减量方案 投食仅原来的一半分量 结果是小猪大猪都不去踩踏板了 小猪去踩 大猪将会把食物吃完 大猪去踩 小猪将也会把食物吃完 谁去踩踏板 就意味着为对方贡献食物 所以谁也不会有踩踏板的动力了 58 改变方案二 增量方案 投食为原来的一倍分量 结果是小猪 大猪都会去踩踏板 谁想吃 谁就会去踩踏板 反正对方不会一次把食物吃完 小猪和大猪相当于生活在物质相对丰富的 共产主义 社会 所以竞争意识却不会很强 对于游戏规则的设计者来说 这个规则的成本相当高 每次提供双份的食物 而且因为竞争不强烈 想让猪们去多踩踏板的效果并不好 59 改变方案三 减量加移位方案 投食仅原来的一半分量 但同时将投食口移到踏板附近 结果呢 小猪和大猪都在拼命地抢着踩踏板 等待者不得食 而多劳者多得 每次的收获刚好消费完 对于游戏设计者 这是一个最好的方案 成本不高 但收获最大 60 智猪博弈的启示 原版的 智猪博弈 故事给了竞争中的弱者 小猪 以等待为最佳策略的启发 但是对于社会而言 因为小猪未能参与竞争 小猪搭便车时的社会资源配置的并不是最佳状态 为使资源最有效配置 规则的设计者是不愿看见有人搭便车的 政府如此 公司的老板也是如此 而能否完全杜绝 搭便车 现象 就要看游戏规则的核心指标设置是否合适了 61 搭便车者 智猪博弈深刻的反映了经济和社会生活中的免费搭便车问题 无论大猪踏或不踏 小猪都选择不踏 给定小猪不踏 大猪最好去踏 有意思的是大猪选择踏在主观上是为了自己的利益 但在客观上小猪也享受到了好处 在经济学里 这头小猪被称为 搭便车者 若全部的博弈主体都试图免费搭车 那么就可能陷入囚徒困境 62 改革与制度锁定 如果一个制度不是一个好制度 那么就会有人试图推翻这项制度并建立新的制度 但是 改革是有成本的 需要流汗 甚至流血 总有一些人充当 大猪 的角色 为改革东奔西走 承担为改革而付出的代价 而另一些人就象小猪一样 没有为改革付出努力 却坐享了改革的成果 是 免费搭车者 如果这个社会人人都想搭免费车 都不站出来向旧制度发难 那么并不美好的旧制度就会被长期锁定 这也许可以解释为什么有些制度明明不合理却又长期存在的现象 63 技术创新便车 小企业通常模仿大企业的产品 等大企业通过广告打开市场后出售廉价模仿品 大企业作为 大猪 常会花钱进行研究开发 技术创新
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年全科医学概论检测卷附答案详解【考试直接用】
- 2026年安全注射知识考核通关练习题库含答案详解(基础题)
- 2026年初级银行从业资格之初级个人理财能力提升试题带答案详解(满分必刷)
- 2026年建筑施工技术考前冲刺练习题库及完整答案详解【名师系列】
- 2026长鑫存储科技集团股份有限公司招聘16人笔试历年参考题库附带答案详解
- 2026荣成康派斯新能源车辆股份有限公司博士后科研工作站招聘3人笔试历年参考题库附带答案详解
- 2026福建漳州市芗江人力资源服务有限公司招聘劳务外包人员拟聘笔试历年参考题库附带答案详解
- 2026甘肃兰州七里河区民生城乡发展投资(集团)有限公司招聘实习生10人笔试历年参考题库附带答案详解
- 2026浙江衢州市龙游县粮食收储有限公司考察及拟聘用人员笔试历年参考题库附带答案详解
- 2026浙江宁波市江北区劳动和社会保障事务代理服务有限公司招聘编外人员(核减)岗位招聘笔试历年参考题库附带答案详解
- 2026公司级新员工安全培训教材
- 配电架空线路标准施工工艺课件
- 医疗器械网络经营培训
- 足浴按摩店卫生管理制度
- 艾滋病知识防治培训课件
- 《生活中的人工智能》课件
- 2025年五类人员考试真题及答案
- 断绝姐妹关系协议书
- 2026年物流配送数字化方案与企业配送效率提升指南
- 5年(2021-2025)山东高考生物真题分类汇编:专题13 种群和群落(解析版)
- 电厂工程取水口施工方案
评论
0/150
提交评论