决策问题2.ppt_第1页
决策问题2.ppt_第2页
决策问题2.ppt_第3页
决策问题2.ppt_第4页
决策问题2.ppt_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、,打牌,两套纸牌,分别是3,5,7,4,6,8。先选择,然后先出来。为什么我总是赢?这就是决定。对策田赛马是大多数人都知道的故事。据说战国帝王想和大张旗鼓的赛马在一起。双方同意各自从奖中挑选下三个等级的一匹马进行比赛。每局赌金是千金。(威廉莎士比亚,温斯顿,战争)帝王同一等级的话,都比达奇的话领先一手,看来宝儿必胜。田忌的朋友孙膑对他说,以下麻痹智的上等马、上等马的上等马、中马的下等马、中马的下等马下次该怎么报告?(囚犯的困惑),警察同时逮捕了两个人,分别关押起来。逮捕的原因是他们持有大量假币,警方怀疑他们有假币,但找不到足够的证据,希望能自行招供。两人都知道,如果他们不全部招供,就会因使用和

2、持有大量假币的罪分别被判处18个月的监禁。如果双方供认都伪造了硬币,将分别被判处3年徒刑。如果一方供认另一方不供认,供认者将被宽大处理,免除刑罚,但另一方面将被判处7年监禁。可以宣判嫌疑人A,B的几个可茄子情况列表如下。表中的每个数字表示嫌疑人A,B被判刑的年数。如果两个嫌疑人都担心对方的供认,希望受到最轻的处罚,最安全的方法当然是承认制造假币。对策论(博弈论)解决具有对立情况的模型。在这些模型中,参与对立的各方都有可供选择的策略。牙齿模型为各方提供最佳对策的方法决策分析。决策环境不确定,风险情况下确定几个茄子选择方案的标准和方法预测的未来发展的推测。例如,基于历史数据和相关分析的定量方法,利

3、用专家判断的定性方法,主要分支,1,对策的基本要素,(1)局中的人。参与决策的各方被称为决策问题的局内人,一个决定总是可以包括两局(如围棋比赛、人与自然的斗争等),也可以包括两个以上的局(如大多数商业中的竞争、政治派之间的斗争)。国中应该拥有可以选择并影响最终结果的战略。例8.3中,国中是A,B两名嫌疑人,警察不是国中人。两个嫌疑人最终如何判刑取决于各自的态度,警察不能为他们做出选择。在这些简单的案例中,可以看到对策现象中包含的几个茄子基本要素。(2)策略集。局中人可以采取的可行方案称为战略,每局中人可以采取的所有战略称为局中人的战略集合。在对策问题上,每局中有一组对应的战略,每组战略至少要有

4、两个策略。否则,异国人可以从牙齿对策问题中删除。因为他没有选择战略的馀地。要注意,所谓战略是指在整个竞争过程中对付对方的完整方法,而不是指在竞争过程中的任何阶段采取的具体局部方法。例如,围棋的一个阶段只能看作是一个完整战略的组成部分,不能看作一个完整的战略。当然,有时可以将其视为多层次对策的子对策。策略集可以是有限集,也可以是无限集。当战略集是有限集时,称为有限对策,否则称为无限对策。在记录局,人I的战略集是Si。对策问题的各方从各自的战略集合中选择了一个策略后,各方采用的策略都可以用称为纯局势(称为国税)的矢量S来表示。,例如,如果一个对策包含两个参与人A,B,则战略集分别为SA=1,m,S

5、B=1,n。如果a选择战略I,B选择战略J,那么(I,J)构成牙齿对策的纯情况。显然,SA和SB都可以构成Mn的纯情况,它们构成表8.3。对策问题的整体纯局势构成的集合S称为牙齿对策问题的局势集合。获取、(3)函数(或支付函数)。对策的结果用矢量表示,称为胜利函数。胜利函数F是情况集S中定义的向量函数,对于S中的所有纯情况S,F(S)表示每个回合中人在牙齿对策结果下必须胜利(或支付)的值。摘要,对策模型由局中人、战略集、胜利函数三部分组成。奇国中的集对于I=1,k,每个iI都有战略集Si,I的每个局中的人I选择策略后得到情况S。将S赋给函数F,得到矢量F (S)=(F1 (S),FK (S)。

6、其中Fi(s)是情况S中人I的胜利(或支付)。牙齿部分讨论了两个异国中只有一个的对策问题,即两个人的对策,结果可以扩大到一般对策模式。(大卫亚设,美国电视电视剧,对策名言)对于只有两局中一局的对策问题,形势集和胜利函数都可以用表格表示。例如,表8.2显示了案例8.3中的情况集和胜利函数。第二,零和对策有特别的对策。在这种对策中,如果净形势确定,A的收入就是B的损失,或者A的损失就是B的收入,也就是双方的收入总和等于0牙齿。(阿尔伯特爱因斯坦,金钱) (威廉莎士比亚,美国电视电视剧,成功)在零和对策中,F1(s)=F2(s)只需要指出其中一个人的胜利值,因此胜利函数可以用胜利矩阵来表示。例如,A

7、有M个策略,B有N个策略,赢矩阵。也就是说,如果A选择战略I,B选择战略J,那么A的收入就是AIJ(在牙齿支付aij0时支付)。在一些两人对策的胜利表中,A的收益显然不是B的损失,但双方获胜的数字之和是常数。例如,在表8.4中,无论A,B如何选择策略,双方得到的总数都是10。此时,每个人的胜利数减去两个人的平均胜利数,就能把胜利标记为0,得到票数。表8.4中的对策转换为零和对策后,有胜利矩阵,表8.4。两人对策只需给出在出局中A,B的战略集SA,SB和表示双方获得的值的胜利矩阵R。综上所述,当出现可以转换为零和对策或零对策的问题时,R在一般意义上可以表示为矩阵。否则,R的因子是一维向量。因此,

8、两个人的对策G也可以称为矩阵对策,G=SA,SB,R,示例8.4提供了G=SA,SB,R。在这里,为了使SA=1,2,3,SB=1,2,3稳妥,双方必须考虑到对方使自己遭受最大损失的动机,在最坏的可能性中争取最好的结果。(约翰f肯尼迪,努力)当国家A采用战略1,2,3时,最糟糕的冠军结果分别是min12,6,30,22=22,min14,2,18,10=2,min6,B采用每个方案时的最大损失为max12,14,6=14,max6,2,0=2,max30,18,10牙齿,B采用战略2时的损失不超过2。在胜利矩阵中,2是该行的最小元素,也是该列的最大元素。在牙齿时,除非对方改变战略,否则任何一局

9、都不能改变战略,增加或减少损失。这种情况被称为对策的稳定点或稳定。(注:也称为鞍点),纯情势()这样的话,()就叫对策G的鞍点或稳定解,在矩阵中(),(8.1)式的胜利矩阵很容易发现没有具有上述特性的鞍点。给出对策后,如何判断它是否有鞍点?为了回答牙齿问题,首先引入以下极小原则。定理8.1设定G=SA,SB,R,记住,0,证明3360,A的最小胜利,B的最小胜利,G是零和对策,所以0牙齿成立。定理8.2零和对策G需要稳定的必要条件为0。证明:根据、(适合性)和的定义,一行(例如,P行)是P行中的最小元素,而一列(例如,Q列)是Q列中的最大元素。因此,因为有apq,apq又为零=,所以apq=,

10、apq是战胜矩阵的鞍点,(p,q)是G的稳定度。如果,(必需)g有稳定解(p,q)牙齿,则apq是矩阵中获胜的鞍点。因此,上述定理为对策问题提供了稳定解决(简称解决)牙齿的充分条件。当对对策问题有解决方法时,该解决方法可能不是唯一的。例如,、(2,2)、(2,4)、(4,2)、(4,4)都是牙齿对策问题的解决方案一般还可以证明。具有稳定解决方案的零和对策是一种特别简单的对策,在相应的胜利矩阵上有鞍点,任何一局都不能通过自己的单方面努力来改善结果。但是在实际遇到的零和对策中,更典型的情况是零。胜利矩阵没有鞍点,所以至少有一个局的人,如果单方面改变策略,可以改善自己的收益。例如,在(8.1)中,调

11、查胜利矩阵R。如果双方都采用保守的麦斯曼原则。顺势(4,1)或(4,3)牙齿出现。但是如果国中人A适当地改变战略,他可以增加收入。例如,如果B采用战略1,A更改战略1,则A可以获得收益3。但是此时,如果B改变战略2,A就会输4。此时,在只使用纯策略的范围内,对策问题无法解决。如果这种决定只进行一次,局里的人除了碰运气别无他法。但是,如果要多次重复这种决定,局中人固定地采用一种茄子战略无疑是不明智的。因为如果对方知道你会采用什么样的策略,他会选择对自己最有利的策略。此时,要根据主席团中的人均某些概率,采取各种战略,即混合策略,使自己的期望收益最大化。记住,、3 SA和SB分别称为A和B端的混合策

12、略,对应该使用混合策略的对策问题也有具有稳定解法的对策问题的类似结果。定义8.2 m维概率矢量和n维概率矢量的情况下,所有m维概率矢量x和n维概率矢量y的(,)被称为混合战略对策问题的鞍点。定理8.4 (Von Neumann)随机混合战略对策问题必须有鞍点。也就是说,必须有概率向量之和。 (跳过证明)。使用纯策略的对策问题(具有稳定解决方案的对策问题)可以看作是使用混合策略的对策问题的特殊情况。概率1等于选择这些战略中的一个,概率0等于选择剩下的策略。对于双方都只有两个茄子战略(即22对策)的对策,可以用几何方法解决。例8.5 A,B是作战双方,A方计划派出两架轰炸机I和II轰炸B方指挥部,

13、轰炸机I在前面飞行,II在后面飞行。两架轰炸机中,一架有炸弹,另一架只是护航。轰炸机飞向B侧上空,遭到B侧战斗机的拦截。如果战斗机阻止后面的轰炸机II,那只是受到II的射击,被击中的概率为0.3(I来不及返回)。如果战斗机阻止I,它将同时受到两架轰炸机的射击,被击中的概率为0.7。如果战斗机没有被击落,将以0.6的概率摧毁选定的轰炸机。A,B双方的最佳战略,即对于A方面,应该选择什么轰炸机装载炸弹?(阿尔伯特爱因斯坦,美国电视电视剧,战斗)对于B方战斗机,应该阻止哪个轰炸机?解决:双方可以选择的战略集分别是,SA=1,2,1:轰炸机I炸弹,II护航2:轰炸机II炸弹,I护航,SA=1,2,1:

14、轰炸机II:轰炸机II:轰炸机轰炸B方指挥部由于A11=0.7 0.3 (10.6)=0.82、A12=1、A21=1、A22=0.3 0.7 (10.6)=0,矩阵R没有鞍点,因此需要找到最佳混合策略。现在的A以概率x1取战略1,以概率x2取战略2。b以概率y1取战略1,以概率y2取战略2。先从B方面考虑问题。b 1点A方轰炸机攻击指挥部的概率期望值为E(1)=0。82x1 x2,B采用2时,A方轰炸机攻击指挥部的概率期望值为E(2)=x1 0.58x2。如果E(1)E(2),则可以设置E(1) E(2)。b方应使用1减少指挥部被轰炸的概率。因此,A方面选择的最佳概率x1和x2必须得到满足。

15、也就是说,可以相应地得到x1=0.7,x2=0.3。同样,A方面可以考虑问题。也就是说,可以解决y1=0.7、y2=0.3。b方指挥部轰炸概率的期望值VG=0.874。以上方法也可以几何表示。获取x轴上长度为1的线段。左端点为x=0,右端点为x=1。通过X=0和x=1的x轴的垂直线称为轴I和轴II。如果从轴I取B1,B2,则到X轴的距离分别为a11和a12,这意味着当A采用战略1,即(x2=0)时,A侧在B侧分别取得战略1和2的胜利(参见图8.1)。,但在m2和N2中,使用几何方法解决可能会很麻烦,在牙齿中,通常使用线性规划方法解决。现在A以概率x2取战略2,B取战略2,A的期望以a11(1x2) a21x2获胜。与X2的其他值(0 x21)对应的a11(1x2) a12x2正好构成连接两个B1的直线段。同样,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论