数学建模第十讲博弈模型ppt课件.ppt

上传人：儿*** IP属地：广东上传时间：2020-03-30 格式：PPT 页数：30 大小：970KB 积分：20 举报 版权申诉

已阅读5页，还剩25页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第十讲对策模型 10 1二人零和对策模型10 2进攻与撤退的选择10 3二人常数和对策模型10 4二人非常数和对策模型对策行为问题一甲乙两名儿童玩石头剪子布的游戏石头胜剪子剪子胜布布胜石头那么甲乙儿童如何做使自己获胜的可能最大问题分析问题中所涉及的要素 1 游戏决定者甲乙儿童两人 3 游戏的收益支付胜得分为1 负得分为 1 平得分为0 2 游戏者的决定石头剪子布问题二囚徒困境甲乙两个嫌疑犯因同一罪行被逮捕如果双方均坦白则各获刑3年如果双方均不坦白则各获刑2年如果其中一人坦白另一人不坦白则坦白一方宽大释放另一方获刑5年两个嫌疑犯各自应采取什么策略才能使自己的刑期最短问题分析问题中所涉及的要素 1 决定者甲乙嫌疑犯两人 3 甲乙的收益支付获刑年数 2 可用的决定坦白不坦白对策行为的三要素 1 局中人在一个对策行为中有权决定自己行动方案的对策参加者称为局中人通常用I表示局中人的集合如果n个局中人则I 1 2 n 它可以是一个人也可以是一个集团或一个自然现象 2 策略集一局对策中可供局中人选择的一个实际可行的完整的行动方案称为一个策略设i为局中人 i的所有策略构成的集合Si称为i的策略集 3 赢得函数支付函数局势在一局对策中各局中人所选定的策略形成的策略组称为一个局势即若设si是第i个局中人的一个策略则n个局中人的策略组s s1 s2 sn 就是一个局势全体局势的集合S可用各局中人策略集的笛卡尔乘积表示即S S1 S2 Sn 赢得函数当局势出现后对策的结果也就确定了也就是说对任一局势s S 局中人i可以得到一个赢得Hi s 显然 Hi s 是局势s的函数称之为第i局中人的赢得函数 1 二人有限零和对策是指有两个参加对策的局中人每个局中人都只有有限个策略可供选择在任一局势下两个局中人的赢得之和总等于零 2 二人零和对策模型矩阵对策模型设分别表示两个局中人且它们的纯策略集分别为S1 1 2 m 和S2 1 2 n 记局中人对任一纯局势 i j 的赢得值为aij 并称为局中人的赢得矩阵局中人的赢得矩阵为 A 通常将矩阵对策记成G S1 S2 A 或G S1 S2 A 10 1二人零和对策 3 局中人如何选取对自己最有利的纯策略局中人的理智行为双方都不想冒险都不存在侥幸心理而是考虑到对方必然会设法使自己的所得最小从各自可能出现的最不利的情形中选择一种最为有利的情形作为决策的依据选择原则局中人按最大最小原则局中人按最小最大原则即局中人从所有最小的赢得中选择最大的赢得的策略局中人从所有最大的损失中选择最小的损失的策略解根据选择的原则分析局中人的选择的策略局中人的策略纯策略 1 2 2 4可能带来的最小赢得分别 8 2 10 3 所以最小赢得中最大的值为2 因此局中人的策略应为 2 局中人的策略纯策略 1 2 3可能带来的最大损失分别9 2 6 所以最大损失中最小的值为2 因此局中人的策略应为 2 总之局中人的最优察纯策略分别为 2 2 4 矩阵对策的解定义1设G S1 S2 A 为矩阵对策其中S1 1 2 m S2 1 2 n A aij m n 若等式成立记VG ai j 则称VG为对策G的值称上述等式成立的纯局势 i j 为G在纯策略下的解或平衡局势 i 与 j 分别称为局中人的最优纯策略根据定义1可知上例中 2 2 是在纯策略下的解对策值VG a22 2 i 2 j 2 定理的直观解释如果ai j 既是矩阵A aij m n中第i 行的最小值又是第j 列的最大值则ai j 是对策的值且 i j 是在纯策略意义下的解定理的对策意义一个平衡局势 i j 具有这样的性质当局中人选择了纯策略 i 后局中人为了其所失最小只能选择 j 否则就可能失去更多反之当局中人选择了纯策略 j 后局中人为了得到最大的赢得只能选择 i 否则就会赢得更少双方在局势 i j 下达到一个平衡状态定理1矩阵对策G S1 S2 A 在纯策略意义下有解的充要条件是存在纯局势 i j 使得对一切i 1 2 m j 1 2 n 均有aij ai j ai j 定理1的一个等价命题定义2设f x y 为一个定义在x A y B上的实值函数如果存在x A y B 使得对一切x A y B 有f x y f x y f x y 则称 x y 为函数f x y 的一个鞍点定理1的等价命题矩阵对策G在纯策略意义下有解且VG ai j 的充要条件是 ai j 是矩阵A的一个鞍点也称为对策的鞍点矩阵对策的混合策略定义3设G S1 S2 A 为矩阵对策其中S1 1 2 m S2 1 2 n A aij m n 记则S1 和S2 分别称局中人和的混合策略集或策略集 x S1 y S2 分别称为局中人和的混合策略对x S1 y S2 称 x y 为一个混合局势或局势这样得到的一个新的对策记成G S1 S2 E 称G 为对策G的混合扩充局中人的赢得函数记成 1 纯策略与混合策略的关系纯策略是混合策略的特例局中人的纯策略 k等价与混合策略x x1 x2 xm S1 其中当i k时 xi 1 当i k时 xi 0 混合策略x x1 x2 xm S1 可设想成当两个局中人多次重复进行对策G时局中人分别采取纯策略 1 2 m的频率定义4 设G S1 S2 E 是矩阵对策G S1 S2 A 的混合扩充如果记其值为VG 则称VG为G 的值称满足上述等式的混合局势 x y 为G在混合策略意义下的解或简称解 x 和y 分别称为局中人和的最优混合策略或简称最优解 E x y E x y E x y 定理2矩阵对策G S1 S2 A 在混合策略意义下有解的充要条件是存在x S1 y S2 使 x y 为E x y 的一个鞍点即对一切x S1 y S2 有 2 矩阵对策G在混合策略意义下解的定义 3 混合对策求解方法下列线性规划问题的解就是局中人的最优混合策略x 问题一求解 3 混合对策求解方法下列线性规划问题的解就是局中人的最优混合策略y 问题一求解 1944年6月初盟军在诺曼底登陆成功到8月初的形势背景 10 2进攻与撤退的抉择双方应该如何决策问题分析与模型假设对策参与者为两方盟军和德军盟军有3种使用其预备队的行动强化缺口原地待命东进德军有2种行动向西进攻或向东撤退对策双方完全理性目的都是使战斗中己方获得的净胜场次胜利场次减去失败场次尽可能多对策模型对策参与者集合N 1 2 1为盟军 2为德军盟军行动S1 1 2 3 强化缺口原地待命东进德军行动S2 1 2 向西进攻向东撤退无鞍点混合策略盟军的混合策略集赢得函数 S1 x x1 x2 x3 德军的混合策略集 S2 y y1 y2 局中人求解局中人求解在晚8点至晚9点这时间段两家电视台在竞争100万电视观众收看自己的电视节目并且电视台必须实时公布自己在下一时段的展播内容电视台1可能选择的展播方式及可能得到的观众如下表 10 3二人常数和对策模型试确定两家电视台各自的策略 10 4二人非常数和对策模型囚徒困境甲乙两个嫌疑犯因同一罪行被逮捕如果双方均坦白则各获刑3年如果双方均不坦白则各获刑2年如果其中一人坦白另一人不坦白则坦白一方宽大释放另一方获刑5年两个嫌疑犯各自应采取什么策略才能使自己的刑期最短双矩阵对策记成G S1 S2 A B 两个局中人的纯策略集分别为S1 1 2 m 和S2 1 2 n A B分别为局中人和的赢得矩阵双矩阵对策记成G S1 S2 A B A B分别为局中人和的赢得矩阵若存在则称局势 i j 为G在纯策略意义下的解或称纳什均衡点 i 与 j 分别称为局中人的最优纯策略 1 双矩阵对策纯策略意义下的解 2 双矩阵对策G在混合策略意义下的解设G S1 S2 E1 E2 是矩阵对策G S1 S2 A B 的混合扩充如果存在x S1 y S2 使得对一切x S1 y S2 有则称混合局势 x y 为G在混合策略意义下的解也称双矩阵对策的纳什均衡点 E1 x y E1 x y E2 x y E2 x y 3 双矩阵混合对策求解方法下列线性规划问题的解就是局中人的最优混合策略x 下列线性规划问题的解就是局中人的最优混合策略y 可以合并为下列线性规划问题比赛策略

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

数学建模第十讲博弈模型ppt课件.ppt

文档简介

温馨提示

最新文档

评论

数学建模第十讲博弈模型ppt课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档