




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1 对策论的基本概念对策模型的三个基本要素:1. 局中人:参与对抗的各方;2. 策略集:局中人选择对付其它局中人的行动方案称为策略; 某局中 人的所有可能策略全体称为策略集;3. 一局势对策的益损值:局中人各自使用一个对策就形成了一个局 势,一个局势决定了各局中人的对策结果 (量化) 称为该局势对策 的益损值。“齐王赛马 ”齐王在各局势中的益损值表(单位:千金)§ 1 对策论的基本概念其中:齐王的策略集 :S1= 1, 2,3, 4, 5,6 ,田忌的策略集:S2= 1, 2,3, 4, 5,6 。下面矩阵称齐王的赢得矩阵:3 11 1-111 31 11-1A=1-13 1 1 1
2、-1 11 3111 11 -1311 1-1 113§ 1 对策论的基本概念二人有限零和对策(又称矩阵对策):局中人为 2;每个局中人的策略集的策略数目都是有限的;每一 局势的对策均有确定的损益值, 并且对同一局势的两个局中人的益损 值之和为零。通常将矩阵对策记为 : G = S1, S2, ASi:甲的策略集;S2:乙的策略集;A :甲的赢得矩阵。“齐王赛马 ”是一个矩阵策略。§ 2 矩阵对策的最优纯策略在甲方的赢得矩阵中:A=aij mxni行代表甲方策略i=1,2,m ; j行代表乙方策略j=1,2,n; aij代表甲方 取策略i,乙方取策略j,这一局势下甲方的益损
3、值。此时乙方的益损值为 -aj (零和性质)。在考虑各方采用的策略时,必须注意一个前提,就是双方都是理智的,即 双方都是从各自可能出现的最不利的情形选择一种最为有利的情况作为决策的 依据。§ 2 矩阵对策的最优纯策略 例:甲乙乒乓球队进行团体对抗赛, 每队由三名球员组成, 双方都可排成三种不同 的阵容,每一种阵容可以看作一种策略,双方各选一种策略参赛。比赛共赛三局,规定 每局胜者得 1分,输者得 -1分,可知三赛三胜得 3分,三赛二胜得 1分,三赛一胜得 -1 分, 三赛三负得 -3 分。甲队的策略集为 S1= 1, 2, 3 ,乙队的策略集为 S2= 1, 2, 3。 根据以往比赛
4、的资料,有甲队的赢得矩阵为 A,如下所示,请问这次比赛各队采用哪种阵容上场最为稳妥 ?§ 2 矩阵对策的最优纯策略矩阵a中每行的最小元素分别为 1,-3,-1 o在这些最少赢得中最好的结果是 1,故甲队会采取策略 1,无论对手采取何策略,甲队至少 得1分。对于乙队, 1,2,3可能带来的最少赢得,即 A中每列的最大元素,分别为 3,1,3乙队会采取2策略,确保甲队不会超过 1分。1和2分别称为局中人甲队、乙队的最优策略。由于双方必然选择这一种策略,所以,这种 策略又称为最优纯策略。这种最优纯策略只有当赢得矩阵 A=(aij )中等式成立时,双方才有最优纯策略,并把(1, 2)称为对策
5、G在纯策略下的解,又称( 1, 2)为对策G的鞍点。把其值 V称之为对策G=S1,S2,A的值。§ 2 矩阵对策的最优纯策略已知在正常的冬季气温条例 某单位采购员在秋天决定冬季取暖用煤的储量问题,件下要消耗 15吨煤,在较暖和较冷的天气下要消耗 10吨和 20吨。假定冬天的煤价随天气 寒冷程度而有所变化,在较暖和、正常、较冷的气候条件下每吨煤价分别为10元、 15元、20元。又设冬季时煤炭价格为每吨 10元。在没有关于当年冬季准确的气象预报的条 件下,秋天储煤多少吨能使得单位的支出最少?解:局中人 I 为采购员,局中人 II 为大自然,采购员有三个策略,买 10吨、 15吨、 20吨
6、。分别记为 1, 2, 3。大自然也有三个策略:暖、正常、冷,分别记为1, 2,3。§ 2 矩阵对策的最优纯策略赢得矩阵如下:在此表上计算,有故(3, 3)为对策G的解,VG=-200设矩阵对策 G = S1, S2, A 。当max min aij min max aiji j j i 时,不存在最优纯策略。例:设一个赢得矩阵如下 :min5 9 5A =max 6策略 28 6 6 imax 8 9策略 1min 8j当甲取策略 2 ,乙取策略 1时,甲实际赢得 8比预期的多 2,乙当然不满意。考虑 到甲可能取策略 2这一点,乙采取策略 2 。若甲也分析到乙可能采取策略 2这一点
7、,取 策略i,则赢得更多为9。此时,对两个局中人甲、乙来说,没有一个双方均可接受 的平衡局势, 其主要原因是甲和乙没有执行上述原则的共同基础, 即 max min aij minmax aij 。一个自然的想法:对甲(乙)给出一个选取不同策略的概率分布,以使甲(乙)在 各种情况下的平均赢得(损失)最多(最少) 即混合策略。求解混合策略的问题有图解法、 迭代法、 线性方程法和线性规划法等, 我们这里只 介绍线性规划法,其他方法略。例:设甲使用策略1的概率为Xi',使用策略2的概率为X2 ,并设在最坏的情况下, 甲赢得的平均值为 V (未知)。59A=STEP 1861)X1' +
8、X2' =1X1' , X2'02)无论乙取何策略,甲的平均赢得应不少于 V:对乙取 1: 5X 1'+ 8X2' V 对乙取 2: 9X 1'+ 6X2' V 注意V>0,因为A各元素为正。STEP 2 作变换: X1= X1'/V ; X2= X2'/V得到上述关系式变为:X 1+ X 2=1/V (V 愈大愈好)待定5X 1+ 8X2 19X 1+ 6X2 1X 1, X 2 0建立线性模型:min X1+X2s.t. 5X1+8X2 1X1= 1/219X1+6X2 1X2= 2/21X1, X 2 01/V
9、= X1+X2=1/7所以, V=7返回原问题:X 1'=X 1V= 1/3X2'=X 2V= 2/3于是甲的最优混合策略为:以1/3的概率选 1, 以2/3的概率选 2,最优值 V=7。例:求解“齐王赛马”问题。 已知齐王的赢得矩阵 A求得故不存在纯策略问题下的解,可求其混合策略。A中有负元素,可以取k=2,在A的每个元素上加2得到A'如下:建立对G =Si, S2, A 中求甲方最佳策略的线性规划如下:Min x1+x2+x3+x4 +x5+x6约束条件:5x 1+3x2 +3x3 +X4 +3x5 +3x6 > 13x 1+5x2 +X3+3x4 +3x5
10、+3x6 > 13x 汁3x2 +5x3 +3x4+3x 5+X6 > 13x 1+3X2+3X3+5X4+X5+3X6 A 1x 1+3X2+3X3+3X4+5X5+3X6 A 13x 1+x2+3x3+3x4+3x5+5x6 A 1x i A 0,i=1,2,6可解得解为:X1=X4=X5=0, X 2=X3=X6=0.111, V =3, X 1 =X4 =X5 = 0 ,X2 ' =X3 =X6 =1/3,即X *=(0,1/3,1/3,0,0,1/3) T,所以甲的最优策略为作出策略2、3、6的概率都为0.333,而作出 1、4、5 的概率为 0,此时 V G=V
11、 =3。同样可以建立对策 G =S1, S2, A 中求乙方最佳策略的线性规划如下: Min y1+y2+y3+y4+y5+y6约束条件:5y 1+3y2+3y3+3y4+y5+3y6 w 13y 1+5y2 +3y3 +3y4+3y 5+y 6 w 13y 1+y2+5y3+3y4 +3y5 +3y6 w 1y 1+3y2+3y3+5y4+3y5+3y6 w 13y 1+3y2+3y3+y4+5y5+3y6 w 13y 1+3y2+y3+3y4+3y5+5y6 w 1y iA0,i=1,2,6可解得解为:y 1=y4=y5=0.111, y 2=y3=y6=0, v =3, y 1 =y4
12、=y5 = 1/3 ,y 2' =y3 =y'=0,即 Y' * =(1/3,0,0,1/3,1/3,0)T。所以田忌的最优混合策略为作出策略1、4、5的概率都为1/3,而作出2,3,6的概率为0,此时VG=Vg-k=1 。*T 齐王赛马问题的对策最优解可简记为 X*=(0,1/3,1/3,0,0,1/3)T,Y*=(1/3,0,0,1/3,1/3,0)丁,对策值 Vg=1o例 两个局中人进行对策,规则是两人互相独立的各自从 1、 2 、 3这三个数字中任意选写一个数 字。如果两人所写的数字之和为偶数,则局中人乙支付给局中人甲以数量为此和数的报酬;女口 果两人所写数字之
13、和为奇数,则局中人甲付给局中人乙以数量为此和数的报酬。试求岀其最优 策略。解:首先计算局中人甲的赢得矩阵如下表:即甲的赢得矩阵为 A:可知无纯策略意义的解,下面求其在混合策略下的解。A的各元素都加上6,得到建立线性规划模型如下:Min x1+x2+x3Max y1+y2+y3S.T.8x1+3x2+10x3 > 18y1+3y2+10y3 冬 13x1+10X2+X3 > 13y1+10y2+y3 W110x1 +x?+12x3 A110y1+y2+12y3 冬 1x1,x 2,x 3 >0y1,y 2,y 3 > 0得到X1 =0.25, x 2 =0.50, x 3
14、 =0.25;y1 =0.25, y 2 =0.50, y 3 =0.25o即此对策的解为*TX* =(0.25,0.50,0.25) T,*TY* =(0.25,0.50,0.25) T。Vg=Vg -k=0 o例4 甲乙两个企业生产同一种电子产品, 甲企业可以采取的策略措施有 :(1) 降低产品价格; (2) 提高产品质量;(3)推岀新产品。乙企业考虑采取的策略措施有(1)增加广告费用;(2)增设维修网点,加强售后服务;(3)改进产品性能。由于甲乙两个企业财力有限,都只能采取一个措施。假定这两个企业所占有的市场总份额一定,由于各自采取的措施不同,通过预测今后两个企业的市场占有份额变动情况如
15、下表,试求岀这两个企业各自的最优策略。解:易知此对策无纯策略意义下的解。把A的每一个元素加上12,得到A建立线性规划模型如下:Max y1+y2+y3Min x1+x2+x3S.T.22X i+20X2> 16x 1+17x2+22x3 > 115x1+7x2+20x3122y1+6y2+15y3 < 120y1+17y2+7y3 < 122y2+20y3 < 1x1,x 2,x 3 0y1,y 2,y 3 0得到:x1=0.027,x 2=0.020,x 3=0.023;y1=0.0225,y 2=0.0225,y 3=0.025 oV=14.29o X1
16、9; =0.3858, x 2 =0.2858, x 3' =0.3286 ; y =0.3215,y 2' =0.3215,y 3' =0.3572即此对策的解为 X* =(0.3858,0.2858,0.3286) T ,Y* =(0.3215,0.3215,0.3572) 仏=乂 -k=2.29 o优超原则: 称甲方策略s优超于t ( s优超于t)。假设矩阵对策甲方赢得矩阵若存在两行(列),G = S 1, S 2, A A=aij ms 行(列)的各元素均优于as a© j=1,2n ( a ist 行(列)的元素,即ait i=1,2 m )优超原则:当局中人甲方的策略t被其它策略所优超时,可在其赢得矩阵 A中划去第t行(同理,当局中人乙方的策略t被其它策略所优超时,可在矩阵 A中划去第t列).如此得到阶数较小的赢得矩阵 A',其对应的矩阵对策G'= S1, S2, A' 与 G = S1, S2, A 等价,即解相同。例.设甲方的益损值,赢得矩阵为3 203 0被第 3、 4行所优超5 025 9被第 3行所优超A= 73 9 594 687 5.56 088 3得到73
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论