第十一章二人有限零和对策PPT课件.ppt_第1页
第十一章二人有限零和对策PPT课件.ppt_第2页
第十一章二人有限零和对策PPT课件.ppt_第3页
第十一章二人有限零和对策PPT课件.ppt_第4页
第十一章二人有限零和对策PPT课件.ppt_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第11章二人有限零和对策 1 第11章二人有限零和对策 11 1基本概念11 2二人有限零和对策的纯策略对策模型11 3二人有限零和对策的混合策略对策模型 2 11 1基本概念 一 对策现象与对策论 对策和对策论对策 就是竞争或斗争中的决策 如 政治方面的阶级斗争 经济方面的劳资纠纷 市场竞争 原料竞争 投标竞争 外贸谈判 军备竞赛 各种体育比赛等 对策论 把各式各样的冲突现象抽象成一种数学模型 然后给出分析这些问题的方法和解 3 对策论 数学角度博弈论 经济角度 对策论的历史春秋战国时期 孙子兵法殷代 围棋19世纪 西方人把对策论应用于经济领域 4 40年代中期 对策论作为一种数学理论1944年 美籍匈牙利数学家 纽曼 Neuman 经济学家 曼格斯特 Morgenstern 对策论及其在经济管理中的应用 在40年代发展迅速 缘于二战中军事的需要 二战后又应用于其他领域 5 50年代是对策论发展的鼎盛时期 纳什和夏普利等提出了讨价还价模型和合作对策的 核 的概念 60年代 泽尔腾 1965 引入动态分析 提出 精练纳什均衡 概念 海萨尼 1967 1968 则把不完全信息引入对策论的研究 6 对策问题举例 下棋 打牌 体育比赛等 7 4 对策的分类动态 是连续时间的动态对策 因此从上一状态到另一状态的转移用微分描述对策零和 得 失 二人 静态 非零和 得 失 零和结盟 多人在一起交换策略非零和多人零和不结盟 多人在一起交换策略非零和 8 二 对策问题的组成 几个基本要素 1 局中人 一局对策的参加者 2 策略 局中人在一局对策中对付对手的一个行动方案 策略全体称为策论集 S s1 s2 sm 局中人甲的策略集D d1 d2 dn 局中人乙的策略集3 局势 在一局对策中 每个局中人都选定一个策略后的各策略的组合 表示为 Si Dj 4 得失值 赢得函数 局中人选定某策略后相应的收益值 表示为R甲 si dj 甲的收益R乙 si dj 乙的收益 9 11 2二人有限零和对策的纯策略对策模型 二人 指参加对策的局中人有 个 有限 指每个局中人的策略集为有限集 零和 指在任一局势下 双方收益之和为 10 一 纯策略对策模型 矩阵对策 11 二 纯策略对策的解1 纯策略分析例 今有甲 乙两厂生产同一种产品 它们都想通过内部改革挖掘 获得更多得市场份额 已知两厂分别都有三个策略措施 据预测 当双方采取不同的策略措施后两厂的市场占有份额变动情况如下所示 12 d1d2d3S110 13 S21210 5S3685请你分析 理智情况下 甲 乙两厂最可能出现什么策略 最大收益是多少 13 s3 d3 即为双方的最优策略 此时甲得5 乙失5 有唯一最优策略 对甲而言 先想最坏 再想最好 则s s3 V甲 maxminaij对乙而言 先想最坏 再想最好 则d d3 V乙 minmaxaij 14 纯策略对策的解 15 定理1 16 17 例 只有一个鞍点 2 3 6 8 3 8 7 18 例 19 3 优超原理 20 例5 用优超原理求解下列对策 故鞍点为 s3 d1 对策值为 21 练习先用优超原理简化矩阵 再求解 22 2020 3 18 23 11 3二人有限零和对策的混合策略对策模型 一 基本概念例 已知对策 A 744 36376 易知 在纯策略意义下无解 24 25 当甲取s1时 最少收益为 min 7x1y1 4x1y2 当乙取d1时 最大损失为 max 7x1y1 3x2y1 则 x y 混合策略下的最优解E x y 混合策略下的最优值 26 二人有限零和对策的混合策略对策模型 G S D E 其中 S X x1 x2 xm T xi 1 xi 0 甲的混合策略集D y y1 y2 yn T yj 1 yj 0 乙的混合策略集E E X Y aijxiyj 甲的期望收益 乙的期望损失 27 二 混合策略对策的解 定义 如果混合策略对策G S D E 满足 定理 设G S D E 为混合对策 则 28 例 求解下列对策 29 例 求解矩阵d1d2d3S110 13x1A S21267x2S3685x3y1y2y3y 1 0y 2 0 50000y 3 0 50000 x 1 0 x 2 0 75000 x 3 0 25000VG 6 50000 30 案例 企业建厂决策问题某企业生产甲 乙两种家用电器 据预测 若在某地建新厂则要投资100万元 每年可净收益14万元 若将此款存入银行 则有 万元利息 此外 还有以下信息可供决策者参考 在某地建新厂后 原厂房若不能售出 则要维修 每年将花费3 2万元 因此 在某地建新厂后的净收益只能是10 8万元 据预测 今后 年中 乙产品的需求量将下降 与进口无关 在此情况下 未被吸收的固定管理费用为2 万元 因此 建新 31 厂的净收益只能是11 7万元 在某地建新厂后 可增加销售额 经计算能多得2 4万元的收益 因此 净收益为16 4万元 反之 若不建新厂将会损失2 4万元 扣除利息 万元 净损失为0 万元 竞争者建厂 若该企业不在此地建厂 则竞争者将在该地建厂 于是该企业在此地的销售额将被竞争者所占有 将损失3 万元 扣除利息 万元 净损失1 万元 进口影响 进口产品中对甲产品影响不大 但对乙产品销路的威胁极大 若进口产品成功 将会占去 的市场 此时在该地建新厂不但无 32 收益 反而损失4 5万元 根据以上信息 该企业的决策者应如何决策 解 33 X 0 16 0 84 TY 0 0 0 0 0 29 0 71 TVG 0 94 34 案例2 俾斯麦海的海空对抗 对策问题一 相关背景资料1943年2月 第二次世界大战中的日本 在太平洋战区已处于明显的劣势 为扭转战局 日军统帅山本五十六大将统率下的一支舰队策划了一次军事行动 由集结地 南太平洋新不列颠群岛的拉包尔出发 穿过俾斯麦海 开往新几内亚的莱城 支援困守在那里的日军 山本五十六心中非常明白 在日本舰队穿过俾斯麦海的3天航程中 不可能躲开盟军的袭击 他要谋划的是尽可能减少损失 当盟军获悉此情报以后 盟军统帅麦克阿瑟即命令他麾下的太平洋战区空军司令肯尼将军组织空中打击 35 日美双方的指挥官及参谋人员都进行了冷静与全面的谋划 自然条件对于双方来说是已知的 基本情况是 1 从拉包尔到莱城的海上航线有南线和北线两条 通过时间均为3天 2 气象预报表明 未来3天中 北线阴雨 能见度差 而南线则天气晴好 能见度佳 二 局势估计局势1 盟军侦察机重点搜索北线 日本舰队也恰好走北线 由于气候恶劣 能见度低以及轰炸机群在南线 因而盟军只能实施两天有效的轰炸 局势2 盟军侦察机重点搜索北线 而日本舰队走南线 由于发现晚 尽管盟军轰炸机群在南 36 线 但有效轰炸也只有两天 局势3 盟军侦察机重点搜索南线 而日本舰队走北线 由于发现晚 盟军轰炸机群在南线 以及北线天气恶劣 故有效轰炸只能实施1天 局势4 盟军侦察机重点搜索南线 日本舰队也恰好走南线 此时 日军舰队被迅速发现 盟军轰炸机群所需航程很短 加之天气晴好 这将使盟军空军在3天中皆可实施有效轰炸 三 历史情况局势1成为事实 即肯尼将军命令盟军侦察机重点搜索北线 而山本五十六命令日本舰队取道北线航行 37 盟军飞机在1天后发现日本舰队 基地在南线的盟军轰炸机群远程飞行 在恶劣天气中 实施了2天有效地轰炸 重创了日本舰队 但未能全歼 四 数学模型1局中人 美日双方决策者2策略 美日双方各有两个策略 南线 北线 38 3支付与支付函数 日军北线南线盟军北线22南线13 A日军北线南线盟军北线 2 2南线 1 3 B五 求解分析 1 局中人1 盟军 希望获得的支付 赢得轰炸天数 尽可能多 但同时 他们也深知 局中人2 日军 必然想方设法使自己的付出 被轰炸天数 尽可能少 39 2 因此 盟军参谋部或肯尼将军在作选择时 首先要考虑 选择每个策略时至少能赢得多少 然后从中选取最有利的策略 具体来说 先对支付矩阵A各列求极小 至少赢得 然后 在对矩阵各列极小组成的集合中取极大 争取最佳 于是有 maxmin aij max 2 1 2 3 对于日军参谋部或山本五十六大将 因居于被动地位 故首先考虑在对方每个策略中最多最多损失多少 在此前提下争取损失最小 具体来说 对同一支付矩阵A各行求极大 最多损失 然后 对矩阵各行极大组成的集合中取极小 争取最佳 于是有 minmax aij min 2 3 2 40 上述求解思想可概括为 从最坏处着想 去争取最好的结果 这是理性思考的表现 此例中 恰有 maxmin aij minmax aij 2这是实际对局的结果 41 案例3 中美贸易问题 对策问题一 相关背景资料1996年5月15日 美国政府借口中国对知识产权保护不力 单方面宣布 对中国出口到美国的纺织品 服装及电子产品实施惩罚性关税 涉及产品金额达30亿美元 惩罚性税率达100 并于一个月后生效 当晚 中国外经贸部发表公告 做出了强烈的反应 公告中表示 如果美国政府一意孤行 中国将实施反报复 并与美国贸易报复措施生效的同时生效 在公告中还列举了反报复清单 报复惩罚额相当 42 二 数学模型1局中人 中国 美国2我们可以用一些模拟的数据来写出该对策问题的赢得矩阵 美国报复不报复中国报复 50 50 50 150 不报复 150 50 20 20 其中 姑且将双方报复的损失同假设为50亿元 双方不报复的收益均假设为20亿元 单方报复而另一方不报复 不报复方的损失极为150亿元 考虑牵连效应 43 三 结果这

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论