决策问题和企业分配决策_第1页
决策问题和企业分配决策_第2页
决策问题和企业分配决策_第3页
决策问题和企业分配决策_第4页
决策问题和企业分配决策_第5页
已阅读5页,还剩109页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

玩扑克牌,比大小两组扑克牌,分别是3、5、7和4、6、8你们先选,然后先出为什么我是总能赢?这就是决策,对策田忌赛马田忌赛马是大多数人都熟知的故事,传说战国时期齐王欲与大将田忌赛马,双方约定每人挑选上、中、下三个等级的马各一匹进行比赛,每局赌金为一千金。齐王同等级的马均比田忌的马略胜一筹,似乎必胜无疑。田忌的朋友孙膑给他出了一个主意,让他用下等马比齐王的上等马,上等马对齐王的中等马,中等马对齐王的下等马,结果田忌二胜一败,反而赢了一千金。第一场第二场第三场获胜方齐

王上中下田忌1上中下齐王田忌2上下中齐王田忌3中上下齐王田忌4中下上齐王田忌5下上中田忌田忌6下中上齐王田忌能赢,主要是已知齐王的策略而做出决策如果田忌和齐王事先都不知道各自采用何种组合来赛马,那结果又如何两人轮流报数,每次只能报1或2,把两人报的所有数加起来,谁报数后和是10,谁就获胜。想一想,如果让你先报数,为了确报胜利,你第一次应报几?接下来应该怎样报?(囚犯的困惑)警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个人都知道:如果他们双方都不供认,将被以使用和持有大量伪币罪被各判刑18个月;如果双方都供认伪造了钱币,将各被判刑3年;如果一方供认另一方不供认,则供认方将被从宽处理而免刑,但另一方面将被判刑7年。将嫌疑犯A、B被判刑的几种可能情况列表如下:嫌疑犯B供认不供认嫌疑犯A供认不供认(3,3)(0,7)(7,0)(1.5,1.5)表中每对数字表示嫌疑犯A、B被判刑的年数。如果两名疑犯均担心对方供认并希望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。对策论(博弈论)解决具有对抗性局势的模型。在这类模型中,参与对抗的各方都有一些可供选择的策略,该模型为对抗各方提供获得最优对策的方法决策分析在决策环境不确定和风险情况下对几种被选方案进行决策的准则和方法预测对未来的发展作出的推测。如,基于历史数据及相关分析的定量方法、利用专家判断的定性方法

主要分支一、对策的基本要素(1)局中人。参加决策的各方被称为决策问题的局中人,一个决策总是可以包含两名局中人(如棋类比赛、人与大自然作斗争等),也可以包含多于两名局中人(如大多数商业中的竞争、政治派别间的斗争)。局中人必须要拥用可供其选择并影响最终结局的策略,在例8.3中,局中人是A、B两名疑犯,警方不是局中人。两名疑犯最终如何判刑取决于他们各自采取的态度,警方不能为他们做出选择。从这些简单实例中可以看出对策现象中包含的几个基本要素。(2)策略集合。局中人能采取的可行方案称为策略,每一局中人可采取的全部策略称为此局中人的策略集合。对策问题中,对应于每一局中人存在着一个策略集合,而每一策略集合中至少要有两个策略,否则该局中人可从此对策问题中删去,因为对他来讲,不存在选择策略的余地。应当注意的是,所谓策略是指在整个竞争过程中对付他方的完整方法,并非指竞争过程中某步所采取的具体局部办法。例如下棋中的某步只能看和一个完整策略的组成部分,而不能看成一个完整的策略。当然,有时可将它看成一个多阶段对策中的子对策。策略集合可以是有限集也可以是无限集。策略集为有限集时称为有限对策,否则称为无限对策。

记局中人i的策略集合为Si。当对策问题各方都从各自的策略集合中选定了一个策略后,各方采取的策略全体可用一矢量S表示,称之为一个纯局势(简称局势)。

例如,若一对策中包含A、B两名局中人,其策略集合分别为SA

={1,…,m},SB

={1,…,n}。若A选择策略i而B选策略j,则(i,j)就构成此对策的一个纯局势。显然,SA与SB一共可构成m×n个纯局势,它们构成表8.3。对策问题的全体纯局势构成的集合S称为此对策问题的局势集合。

(m,n)

…(m,j)

…(m,2)

(m,1)

m…………………(i,n)

…(i,j)

…(i,2)

(i,1)

i…………………(2,n)

…(2,j)

…(2,2)

(2,1)

2(1,n)

…(1,j)

…(1,2)

(1,1)

1A的策略n…J…21B的策略(3)赢得函数(或称支付函数)。对策的结果用矢量表示,称之为赢得函数。赢得函数F为定义在局势集合S上的矢值函数,对于S中的每一纯局势S,F(S)指出了每一局中人在此对策结果下应赢得(或支付)的值。综上所述,一个对策模型由局中人、策略集合和赢得函数三部分组成。记局中人集合为I={1,…,k},对每一i∈I,有一策略集合Si,当I中每一局中人i选定策略后得一个局势s;将s代入赢得函数F,即得一矢量F(s)=(F1(s),…,Fk(s)),其中Fi(s)为在局势s下局中人i的赢得(或支付)。本节讨论只有两名局中人的对策问题,即两人对策,其结果可以推广到一般的对策模型中去。对于只有两名局中人的对策问题,其局势集合和赢得函数均可用表格表示。例如,表8.2就给出了例8.3的局势集合和赢得函数。二、零和对策存在一类特殊的对策问题。在这类对策中,当纯局势确定后,A之所得恰为B之所失,或者A之所失恰为B之所得,即双方所得之和总为零。在零和对策中,因F1(s)=-F2(s),只需指出其中一人的赢得值即可,故赢得函数可用赢得矩阵表示。例如若A有m种策略,B有n种策略,赢得矩阵

表示若A选取策略i而B选取策略j,则A之所得为aij(当aij<0时为支付)。在有些两人对策的赢得表中,A之所得并非明显为B之所失,但双方赢得数之和为一常数。例如在表8.4中,无论A、B怎样选取策略,双方赢得总和均为10,此时,若将各人赢得数减去两人的平均赢得数,即可将赢得表化为零和赢得表。表8.4中的对策在转化为零和对策后,具有赢得矩阵表8.4局中人B123局中人A1(8,2)(1,9)(7,3)2(4,6)(9,1)(3,7)3(2,8)(6,4)(8,2)4(6,4)(4,6)(6,4)给定一个两人对策只需给出局中人A、B的策略集合SA、SB及表示双方赢得值的赢得矩阵R。综上所述,当遇到零和对策或可转化为零和对策的问题时,R可用通常意义下的矩阵表示,否则R的元素为一两维矢量。故两人对策G又可称为矩阵对策并可简记成G={SA,SB,R}例8.4

给定G={SA,SB,R},其中SA

={1,2,3},SB

={1,2,3,4}

从R中可以看出,若A希望获得最大赢利30,需采取策略1,但此时若B采取策略4,A非但得不到30,反而会失去22。为了稳妥,双方都应考虑到对方有使自己损失最大的动机,在最坏的可能中争取最好的结果。局中人A采取策略1、2、3时,最坏的赢得结果分别为min{12,-6,30,-22}=-22min{14,2,18,10}=2min{-6,0,-10,16}=-10其中最好的可能为max{-22,2,-10}=2。如果A采取策略2,无论B采取什么策略,A的赢得均不会少于2.B采取各方案的最大损失为max{12,14,-6}=14,max{-6,2,0}=2,max{30,18,-10}=30和max{-22,10,16}=16。当B采取策略2时,其损失不会超过2。注意到在赢得矩阵中,2既是所在行中的最小元素又是所在列中的最大元素。此时,只要对方不改变策略,任一局中人都不可能通过变换策略来增大赢得或减小损失,称这样的局势为对策的一个稳定点或稳定解,(注:也被称为鞍点)定义8.1

对于两人对策G={SA,SB,R},若有,则称G具有稳定解,并称VG为对策G的值。若纯局势()使得,则称()为对策G的鞍点或稳定解,赢得矩阵中与()相对应的元素称为赢得矩阵的鞍点,与分别称为局中人A与B的最优策略。对(8.1)式中的赢得矩阵,容易发现不存在具有上述性质的鞍点。给定一个对策G,如何判断它是否具有鞍点呢?为了回答这一问题,先引入下面的极大极小原理。蕴涵的思想是朴素自然的,可以概括为:“从最坏处着想,去争取最好的结果”定理8.1

设G={SA,SB,R},记,则必有μ+ν≤0证明:,易见μ为A的最小赢得,ν为B的最小赢得,由于G是零和对策,故μ+ν≤0必成立。定理8.2

零和对策G具有稳定解的充要条件为μ+ν=0。

证明:

(充分性)由μ和ν的定义可知,存在一行(例如p行)μ为p行中的最小元素且存在一列(例如q列),-ν为q列中的最大元素。故有apq≥μ且apq≤-ν又因μ+ν=0,所以μ=-ν,从而得出apq=μ,apq为赢得矩阵的鞍点,(p,q)为G的稳定解。

(必要性)若G具有稳定解(p,q),则apq为赢得矩阵的鞍点。故有

从而可得μ+ν≥0,但根据定理8.1,μ+ν≤0必成立,故必有μ+ν=0。上述定理给出了对策问题有稳定解(简称为解)的充要条件。当对策问题有解时,其解可以不唯一。例如,若

则易见,(2,2),(2,4),(4,2),(4,4)均为此对策问题的解。一般又可以证明。例:某单位采购员在秋天时要决定冬天取暖用煤的采购量。已知在正常气温条件下需要用煤15吨,在较暖和较冷气温条件下需要用煤10吨和20吨。假定冬季的煤价随着天气寒冷的程度而变化,在较暖、正常、较冷气温条件下每吨煤价为100元、150元、200元。又秋季每吨煤价为100元。在没有关于当年冬季气温情况下,秋季应购多少吨煤,能使总支出最少?解:局中人I(采购员)有三个策略:策略1:10吨,策略2:15吨,策略3:20吨。局中人II(环境):策略1较暖,策略2正常,策略3较冷现把该单位冬天取暖用煤全部费用(秋季购煤费用与冬天不够时再补购煤费用)作为采购员的赢得矩阵。

1231 -1000-1750-30002 -1500-1500 -25003 -2023-2023 -2023由maxminaij=

minmaxaij=a33=-2023Ijji该最优策略为(3,

3),即秋季购煤20吨。具有稳定解的零和对策问题是一类特别简单的对策问题,它所对应的赢得矩阵存在鞍点,任一局中人都不可能通过自己单方面的努力来改进结果。然而,在实际遇到的零和对策中更典型的是μ+ν≠0的情况。由于赢得矩阵中不存在鞍点,至少存在一名局中人,在他单方面改变策略的情况下,有可能改善自己的收益。例如,考察(8.1)中的赢得矩阵R。若双方都采取保守的maxmin原则。将会出现纯局势(4,1)或(4,3)。但如果局中人A适当改换策略,他可以增加收入。例如,如果B采用策略1,而A改换策略1,则A可收益3。但此时若B改换策略

2,又会使A输掉4,……。此时,在只使用纯策略的范围内,对策问题无解。这类决策如果只进行一次,局中人除了碰运气以外别无办法。但如果这类决策要反复进行多次,则局中人固定采用一种策略显然是不明智的,因为一旦对手看出你会采用什么策略,他将会选用对自己最为有利的策略。这时,局中人均应根据某种概率来选用各种策略,即采用混合策略的办法,使自己的期望收益尽可能大。

设A方用概率xi选用策略i,B方用概率yj选用策略j,,且双方每次选用什么策略是随机的,不能让对方看出规律,记X=(x1,…,xm)T,Y=(y1,…,yn)T,则A的期望赢得为E(X,Y)=XTRY其中,R为A方的赢得矩阵。记SA:策略α1,…,αmSB:策略β1,…,βn概率x1,…,xm概率y1,…,yn分别称SA与SB为A方和B方的混合策略。对于需要使用混合策略的对策问题,也有具有稳定解的对策问题的类似结果。定义8.2若存在m维概率向量和n维概率向量,使得对一切m维概率向量X和n维概率向量y有则称(,)为混合策略对策问题的鞍点。定理8.4(VonNeumann)任意混合策略对策问题必存在鞍点,即必存在概率向量和,使得:(证明从略)。使用纯策略的对策问题(具有稳定解的对策问题)可以看成使用混合策略的对策问题的特殊情况,相当于以概率1选取其中某一策略,以概率0选取其余策略。对于双方均只有两种策略的对策问题(即2×2对策),可按几何方法求解。例8.5A、B为作战双方,A方拟派两架轰炸机I和II去轰炸B方的指挥部,轰炸机I在前面飞行,II随后。两架轰炸机中只有一架带有炸弹,而另一架仅为护航。轰炸机飞至B方上空,受到B方战斗机的阻击。若战斗机阻击后面的轰炸机II,它仅受II的射击,被击中的概率为0.3(I来不及返回击它)。若战斗机阻击I,它将同时受到两架轰炸机的射击,被击中的概率为0.7。一旦战斗机未被击落,它将以0.6的概率击毁其选中的轰炸机。请为A、B双方各选择一个最优策略,即:对于A方应选择哪一架轰炸机装载炸弹?对于B方战斗机应阻击哪一架轰炸机?

解:双方可选择的策略集分别为SA={1,2},1:轰炸机I装炸弹,II护航

2:轰炸机II装炸弹,I护航SA={1,2},1:阻击轰炸机I2:阻击轰炸机II赢得矩阵R=(aij)2×2,aij为A方采取策略

i而B方采取策略j时,轰炸机轰炸B方指挥部的概率,由题意可计算出:a11=0.7+0.3(1-0.6)=0.82a12=1,a21=1a22=0.3+0.7(1-0.6)=0.58即易求得,。由于μ+ν≠0,矩阵R不存在鞍点,应当求最佳混合策略。现设A以概率x1取策略1、概率x2取策略2;B以概率y1取策略1、概率y2取策略2。先从B方来考虑问题。B采用1时,A方轰炸机攻击指挥部的概率的期望值为E(1)=0。82x1+x2,而B采用2时,A方轰炸机攻击指挥部的概率的期望值为E(2)=x1+0.58x2。若E(1)≠E(2),不妨设E(1)<E(2),则B方必采用1以减少指挥部被轰炸的概率。故对A方选取的最佳概率x1和x2,必满足:即由此解得x1=0.7,x2=0.3。同样,可从A方考虑问题,得即并解得y1=0.7,y2=0.3。B方指挥部轰炸的概率的期望值VG=0.874。上述方法也可以用几何方式表达。在x轴上取长度为1的线段,左端点为x=0,右端点为x=1。过x=0和x=1各作x轴的垂线,称之为轴I和轴II。在轴I上取B1、B2,它们到x轴的距离分别的a11和a12,表示在A采取策略1

即(x2=0)时A方在B方分别采取策略1和2下的赢得,如图8.1所示。零和对策的解法矩阵对策的线性规划法A方选择混合策略的目的是使得其中ej为只有第j个分量为1而其余分量均为零的向量,Ej

=XTRej。记,由于,在yk=1,yj=0(j≠k)时达到最大值u,

故应为线性规划问题

minu

,j=1,2,…,n(即Ej≤Ek)xi≥0,i=1,2,…,mS.t的解。同理,应为线性规划maxν

,i=1,2,…,myj≥0,i=1,2,…,nS.t的解。

做相应的数学处理,可将求解零和对策化为更简单的线性规划问题

(LP)

min

pipiaij1ipi0(i=1,2,…..m)(DLP)maxqjqjaij1jqj0(j=1,2,…..n)且pi=qj=1/VX=(pi

)*V

例对给定的赢得矩阵AA,=(aij+2)01-1123A=2311-10-101312A,=

(LP)min

(p1+p2+p3)2p1+p2+3p313p1+2p2+p31p1+3p2+2p31pi0(i=1,2,3)

(DLP)

max(q1+q2+q3)2q1+3q2+q31q1+2q2+3q313q1+q2+2q31qj0(j=1,2,3)且pi=qj=1/V例对给定的赢得矩阵A729A=2909011(DLP)

max(q1+q2+q3)7q1+2q2+9q312q1+9q219q1+11q31qj0(j=1,2,3)且pi=qj=1/V(DLP)max(q1+q2+q3)7q1+2q2+9q312q1+9q219q1+11q31qj0(j=1,2,3)且pi=qj=1/V例在W城的冰箱市场上,以往的市场份额由本市生产的A牌冰箱占有绝大部分。本年初,一个全国知名的B牌冰箱进入W城的市场。在这场竞争中假设双方考虑可采用的市场策略均为三种:广告、降价、完善售后服务,且双方用于营销的资金相同。根据市场预测,A的市场占有率为:

B广告1降价2售后服务3广告10.600.620.65A=降价20.750.700.72售后服务30.730.760.78试确定双方的最优策略。田忌赛马,田忌不知齐王出马次序,请问田忌应如何出马三、非零和对策除了零和对策外,还存在着另一类对策问题,局中人获利之和并非常数。例8.4现有一对策问题,双方获利情况见表8.5。表8.5B方A方1231234(8,2)(3,4)(1,6)(4,2)(0,9)(9,0)(6,2)(4,6)(7,3)(2,7)(8,1)(5,1)假如A、B双方仍采取稳妥的办法,A发现如采取策略4,则至少可获利4,而B发现如采取策略1,则至少可获利2。因而,这种求稳妥的想法将导至出现局势(4,2)。容易看出,从整体上看,结果并不是最好的,因为双方的总获利有可能达到10。不难看出,依靠单方面的努力不一定能收到良好的效果。看来,对这一对策问题,双方最好还是握手言和,相互配合,先取得总体上的最大获利,然后再按某一双方均认为较为合理的方式来分享这一已经获得的最大获利。例8.4说明,总获利数并非常数的对策问题(即不能转化为零和对策的问题),是一类存在着合作基础的对策问题。当然,这里还存在着一个留待解决而又十分关键的问题:如何分享总获利,如果不能达到一个双方(或各方)都能接受的“公平”的分配原则,则合作仍然不能实现。怎样建立一个“公平”的分配原则是一个较为困难的问题,将在第九章中介绍。

最后,我们来考察几个对策问题的实例。例8.6(战例分析)1944年8月,美军第一军和英军占领法国诺曼第不久,立即从海防前线穿过海峡,向Avranches进军。美军第一军和英军的行动直接威胁到德军第九军。美军第三军也开到了Avranches的南部,双方军队所处的地理位置如图8.2所示。美军方面的指挥官是Bradley将军,德军指挥官是VonKluge将军。VonKluge将军面临的问题是或者向西进攻,加强他的西部防线,切断美军援助;或者撤退到东部,占据塞那河流域的有利地形,并能得到德军第十五军的援助。Bradley将军的问题是如何调动他的后备军,后备军驻扎在海峡南部。Bradley将军有三种可供选择的策略:他可以命令后备军原地待命,当海峡形势危急时支援第一军或出击东部敌人,以减轻第一军的压力。双方应如何决策,使自己能有较大的机会赢得战争的胜利呢?

我们将用建立矩阵对策模型的方法,来试图求得双方的最优策略。模型假设:

1、Bradley将军和VonKluge将军分别为对策问题的局中人A和B。2、局中人A的策略集合为SA={1,2,3},其中:1为后备军增援保卫海峡;2为后备军东征,切断德军后路;3为后备军待命

3、局中人B的策略集合为SB={1,2},其中:1为德国向西进攻海峡,切断美军援助;2为德军撤退到东部,占领塞纳河流域有利地形。4、SA、SB构成六种纯局势,综合双方实力,各种局势估计结果如下。若B采取策略1,即德军采取攻势,则有(1)(1,1),估计美军击败德军并占领海峡的可能性(即概率)为(2)(2,1),估计美军取胜的可能为。德军很可能打破美军第一军的防线,并切断美军的退路。(3)(3,1),估计美军可以根据需要增援。如不需增援,后备军可东进绕行到德军后方。这样,美军将占领海峡并彻底歼灭德军第九军。情况(1)、(2)、(3)如图8.3(1)、(2)、(3)所示。若B采取策略2,即德军第九军东撤,占据塞纳河流域有利地形,则有

(4)(1,2),美方扩大了战线,德军虽占据了有利地形,美军仍有击败德军的可能性。(5)(2,2),美后备军东进给德军东撤造成压力并挫伤德军,使美军击败德军的可能性增大到。(6)(3,2),美后备军待命。在发现德军撤退后,奉命向东扰乱敌方撤退,为以后歼灭德第九军创造条件,估计是美军击败德军的可能性。情况(4)、(5)、(6)见图8.3(4)、(5)(6)所示。上述分析估计是由Bradley将军作出的,据此构造出A方赢得矩阵这是一个3×2对策矩阵。可以求得,,,不存在稳定解,需要考虑其他解法。定义8.3对于赢得矩阵R,如果对所有j,aij≥akj均成立,且至少存在一个使得则称i行优于k行(策略ai优于ak)。同样,如对一切i有aij≤akl,且至少有一个i0使得,则称j列优于l例(局中人B的策略j优于l)。易见,若一个对策矩阵的第i行优于第k行,则无论局中人B选择哪种策略,局中人A采取策略i的获利总优于(至少不次于)采取策略k的获利。定理8.5对于矩阵对策G={SA,SB,R},若矩阵R的某行优于第i1,……,ik行,则局中人A在选取最优策略时,必取。令,R’为从R中划去第i1行,…,ik行后剩下的矩阵,则的最优策略即原对策G的最优策略,对于R中列的最优关系也有类似的结果。利用这一定理,有时对策问题可先进行化简,降低矩阵的阶数。现在回过来讨论美、德军队对策问题。在Bradleg构造的矩阵中容易发现a1j<a3j,j=1,2故3优于1。根据上面的定理8.5,可划去该矩阵的第一行,得到2×2赢得矩阵这仍然是一个无鞍点的对策矩阵。设Bradley以概率p1取策略2而以概率p2取略3,则应有解得类似地,设VonKluge以概率q1取策略1而以概率q2取策略2,则应有解得。由于两军作战并非可以反复进行的对策问题,看来最大的可能是美军采取策略3而德军采取策略2,即美方后备军待命而德军第九军东撤。事实上,当时双方指挥官正是这样决策的,如果真能实行,双方胜负还难以料定。但正当德军第九军刚开始东撤时,突然接到了希特勒的命令要他们向西进攻,从而失去了他们有可能取得的最佳结局,走上必然灭亡的道路。VonKluge将军指挥的德军向西进攻,开始时德军占领了海峡,但随之即被美军包围遭到了全军复灭,VonKluge本人在失败后自杀。

例8.7(防坦克地雷场的布设)实战中,攻方为了增强攻击力,大量使用攻击力强、防御坚固的坦克;守方为了抵御对方攻击,需要大量杀伤敌方的有生力量,有效对策之一是布设防坦克地雷场。1、分析评价防坦克地雷场的重要指标是战斗效力,而布雷密度是基本因素之一。只要有足够多的地雷,用较高密度的地雷场对付敌方进攻总是行之有效的。但在实际战斗中,地雷不太可能是足够多的。假设:(1)防坦克地雷数量有限;(2)通过侦察、分析,已知敌方可能采用1、2、…、n种进攻策略之一;(3)通过敌情分析,确定了防御正面的宽度,并根据我方地雷数量,设计了1,2,…,m这m种布雷方案。问采取哪一方案或什么样的混合策略能有效击毁敌方的坦克?本例在过去一般是凭指挥员的作战经验定性决策的,现用矩阵对策方法进行定量择优。

由于每两辆坦克之间一般要保持50米的间距,因而进攻正面拉得很宽,如一个梯队20辆坦克,进攻正面约为一公里宽。因为只有有限个防御正面,用有限个进攻策略来描述敌方的进攻状态是非常接近实际情况的。对守方来讲,布雷密度通常可分成0.5,1,1.5,2等有限个等级。按常规做法,在防御正面上一般采用同一种技术密度。为了提高杀伤率,现将一个防御正面划分成几段,各段允许采用不同密度。2、对策决策要用矩阵对策决策,关键问题是如何列出守方的赢得矩阵。由效率评定试验可得出在各种布雷密度下的杀伤率表,如表8.6所示。表8.6布雷密度0.511.52杀伤率0.640.870.950.98根据上表,在确定方案后即可根据各段不同密度针对攻方的进攻策略计算出坦克的杀伤率。为便于理解,作为实例分析下面两种情况:情况1设守方只有1500个防坦克地雷,欲布设在攻方必经的2公里攻击正面上。攻方一个坦克梯队的20辆坦克展开成1公里宽的阵面,但既可能从左侧进攻(策略1)也可能从右侧进攻(策略2)。守方设计了三种布雷方案1,2,3,(图8.4),试求守方的赢得矩阵和最优策略。图8.4情况1求解:容易求得守方的赢得矩阵这是一个有鞍点的矩阵,鞍点为a22。守方只要按2方案布雷,则不管攻方从哪一侧进攻,总可毁伤对方47.5%的坦克。情况2攻方一梯队20辆坦克可从左侧(1)、中路(2)或右翼(3)进攻,展开成1公里布阵。守方只有2000个防坦克地雷,初步提出三种布雷方案,如图8.5所示,试求守方采用何种布雷方案较好。图8.5对情况2,可求得守方的赢得矩阵为此时,矩阵A中不存在鞍点,对策无稳定解,应采用混合策略。可以求得,此时守方如按照0.166:0.456:0.378的比例采取策略1,2,3布雷,平均可毁伤对方83.5%的坦克。由本例可以看出,在决策问题中,策略的设计至关重要,它直接影响到赢得矩阵。策略的设计并没有包含在决策问题的求解中,事实上,仅当策略设计完成后,即策略集合给定后,决策问题才被给定,从而才能被求解,因而,在用对策论方法研究实际课题时,应当特别注意策略的设计。这一部分工作既具有一定的创造性又在很大程度上影响到结果,对它研究也是十分有趣的。§8.2决策问题人们在处理问题时,常常会面临几种可能出现的自然情况,同时又存在着几种可供选择的行动方案。此时,需要决策者根据已知信息作决策,即选择出最佳的行动方案,这样的问题称为决策问题。面临的几种自然情况叫做自然状态或简称状态。状态是客观存在的,是不可控因素。可供选择的行动方案叫做策略,这是可控因素,选择哪一方案由决策者决定。

不确定环境下的决策决策者面临的决策环境由一些自然状态组成,决策者可以采取若干决策方案,每一种决策方案在不同的自然状态下出现的结果是已知的,但决策者不能预先估计各种自然状态出现的概率。不确定决策的几种准则:悲观准则乐观准则等可能性准则乐观系数准则后悔值准则悲观准则:最坏的情况下争取最好的结果例1.某工厂决定投产一种新产品。投产以后销售情况有好、中等、差三种可能,但厂家目前无法估计这三种情况出现的概率。产品的生产批量有大中小三种选择。不同的生产批量在不同的市场销售情况下企业的收益如下表:收益(万元)需求大N1需求中N2需求小N3MinMax(min)大批量(S1)500300-250-250100中批量(S2)3002008080小批量(S3)200150100100*按照这个准则,最优决策是小批量生产收益(万元)需求大N1需求中N2需求小N3MaxMax(max)大批量(S1)500300-250500*500中批量(S2)30020080300小批量(S3)200150100200乐观准则:最好的情况下争取最好的结果按照这个准则,最优决策是大批量生产讨论:你认为悲观和乐观的决策准则在实际决策问题可行吗?有那些不足?悲观准则和乐观准则都假定,决策环境是不确定的,而不确定的决策环境中可能出现的各种状态的可能性是不可知的或不可度量的。如果这些状态出现的可能性是可以度量的,决策问题就转变成为风险型决策。收益(万元)需求大N1需求中N2需求小N3期望值最大期望值概率(pi)1/31/31/3大批量(S1)500300-250183.33193.33中批量(S2)30020080193.33*小批量(S3)200150100150.00等可能性准则:假设等可能性条件下,期望值最大按照这个准则,最优决策是中批量生产乐观系数准则:乐观系数α(0≤α≤1)收益(万元)需求大N1需求中N2需求小N3CVi大批量(S1)500300-250275*中批量(S2)30020080234小批量(S3)200150100170对于α=0.7 (1-α)=0.3最优决策为大批量生产CV1=0.7max(500,300,-250)+0.3min(500,300,-250)=350-75=275CV2=0.7max(300,200,80)+0.3min(300,200,80)=210+24=234CV3=0.7max(200,150,100)+0.3(200,150,100)=140+30=170对于α=0.5 (1-α)=0.5收益(万元)需求大N1需求中N2需求小N3CVi大批量(S1)500300-250125中批量(S2)30020080190*小批量(S3)200150100150最优决策为中批量生产CV1=0.5max(500,300,-250)+0.5min(500,300,-250)=250-125=125CV2=0.5max(300,200,80)+0.5min(300,200,80)=150+40=190CV3=0.5max(200,150,100)+0.5(200,150,100)=100+50=150对于α=0.3 (1-α)=0.7收益(万元)需求大N1需求中N2需求小N3CVi大批量(S1)500300-250-25中批量(S2)30020080146*小批量(S3)200150100130最优决策为中批量生产CV1=0.3max(500,300,-250)+0.7min(500,300,-250)=150-175=-25CV2=0.3max(300,200,80)+0.7min(300,200,80)=90+56=146CV3=0.3max(200,150,100)+0.7(200,150,100)=60+70=130后悔值准则:以最大后悔值中的最小的为最优决策收益(万元)需求大N1需求中N2需求小N3大批量(S1)500300-250中批量(S2)30020080小批量(S3)200150100Max(Si,Nj)500300100收益(万元)需求大N1需求中N2需求小N3Max(Si,Nj)大批量(S1)00350350中批量(S2)20010020200*小批量(S3)3001500300后悔值矩阵风险型决策最大可能决策收益(万元)需求大N1需求中N2需求小N3概率(pi)0.10.20.7大批量(S1)500300-250中批量(S2)30020080小批量(S3)200150100*100最大可能为需求小,按最大可能考虑,应采用小批量生产。最大可能决策用于一种状态的可能性明显大于其它状态时,如果几种状态发生的概率相差不大,则不适用。决策者能预先估计决策环境中各种自然状态出现的概率。期望值决策收益(万元)需求大N1需求中N2需求小N3期望值概率(pi)0.10.20.7大批量(S1)500300-250-65中批量(S2)30020080126*小批量(S3)200150100120选择期望值最大的决策为最优决策中批量的决策为最优决策。例8.8在开采石油时,会遇到是否在某处钻井的问题。尽管勘探队已作了大量调研分析,但由于地下结构极为复杂,仍无法准确预测开采的结果,决策者可以决定钻井,也可以决定不钻井。设根据经验和勘探资料,决策者已掌握一定的信息并列出表8.7。表8.7000不钻井(2)

4020-30钻井(1)

P(3)=0.3

P(2)=0.5

P(1)=0.2

(亿元)高产油井(3)

一般(2)

无油(1)

自然状态概率

收益方案问:决策者应如何作出决策?解:由题意可以看出,决策问题应包含三方面信息:状态集合Q={1,…,n}、策略集合A={1,…,m}及收益R={aij},其中aij表示如果决策者选取策略i而出现的状态为j,则决策者的收益值为aij(当aij为负值时表示损失值)。决策问题按自然状态的不同情况,常被分为三种类型:确定型、风险型(或随机型)和不确定型。确定型决策是只存在一种可能自然状态的决策问题。这种决策问题的结构较为简单,决策者只需比较各种方案,确定哪一方案最优即可。值得一提的是策略集也可以是无限集,例如,线性规划就可行看成一个策略集是限集的确定型决策,问题要求决策者从可行解集合(策略集)中挑选出最优解。确定型决策的求解并非全是简单的,但由于这些问题一般均有其自己的专门算法,本节不准备再作介绍。在本节中,我们主要讨论风险型与不确定型决策,并介绍它们的求解方法。一、风险型决策问题在风险型决策问题中存在着两种以上可能出现的自然状态。决策者不知道究竟会出现哪一种状态,但知道各种状态出现的概率有多大。例如,例8.8就是一个风险型决策问题。对于风险型决策问题,最常用的决策方法是期望值法,即根据各方案的期望收益或期望损失来评估各方案的优劣并据此作出决策。如对例1,分别求出方案1(钻井)和2(不钻井)的期望收益值:E(1)=0.2×(-30)+0.5×20+0.3×40=16(万元)E(2)=0由于E(1)>E(2),选取1作为最佳策略。风险型决策也可采用期望后悔值法求解。首先,求出采取方案i而出现状态j时的后悔值。例如,如果不钻井,但事实上该处可开出一口高产井,则后悔值为40。因为钻井可收益40万元,但决策者作了不钻井的决策,未获得本来可以获得的40万元收益。然后,比较各方案的期望后悔值,选取期望后悔最小的方案作为最佳策略。在例8.8中,如采用期望后悔值法,则E(1)=6,E(2)=22,取1为最佳策略。在选取策略i而出现状态j时后悔值为的理由是在出现状态j情况下的最大可能收益为。定理8.6最大期望收益法与最小期望后悔值法等价,即两者选出的最佳策略相同。证明:由得故

等式(8.4)的右端项为一常数,其左端项为采取策略i时期后悔值与期望收益值之和,从而,若某策略使期望收益最大,则该策略必使期望后悔值最小,定理得证。对于较为复杂的决策问题,尤其是需要作多阶段决策的问题,常采用较直观的决策树方法,但从本质上讲,决策树方法仍然是一种期望值法。

例8.9某工程按正常速度施工时,若无坏天气影响可确保在30天内按期完工。但根据天气预报,15天后天气肯定变坏。有40%的可能会出现阴雨天气而不影响工期,在50%的可能会遇到小风暴而使工期推迟15天,另有10%的可能会遇到大风暴而使工期推迟20天。对于可能出现的情况,考虑两种方案:(1)提前紧急加班,在15天内完成工程,实施此方案需增加开支18000元。

(2)先按正常速度施工,15天后根据实际出现的天气状况再作决策。如遇到阴雨天气,则维持正常速度,不必支付额外费用。如遇到小风暴,有两个备选方案:(i)维持正常速度施工,支付工程延期损失费20230元。(ii)采取应急措施。实施此应急措施有三种可能结果:有50%可能减少误工期1天,支付应急费用和延期损失费共24000元;有30%可能减少误工期2天,支付应急费用和延期损失费共18000元;有20%可能减少误工期3天,支付应急费用和延期损失费共12023元。如遇大风暴,也有两个方案可供选择:(i)维持正常速度施工,支付工程延期损失费50000元。(ii)采取应急措施。实施此应急措施也有三种可能结果:有70%可能减少误工期2天,支付应急费及误工费共54000元;有20%可能减少误工期3天,支付应急费及误工费共46000元;有10%可能减少误工期4天,支付应急费和误工费共38000元。根据上述情况,试作出最佳决策使支付的额外费用最少。解:由于未来的天气状态未知,但各种天气状况出现的概率已知,本例是一个风险型决策问题,所谓的额外费用应理解为期望值。

本例要求作多次决策,工程初期应决定是按正常速度施工还是提前紧急加班。如按正常速度施工,则15天后还需根据天气状况再作一次决策,以决定是否采取应急措施,故本例为多阶段(两阶段)决策问题。为便于分析和决策,采用决策树方法。根据题意,作决策树如图8.6图8.6中,□表示决策点,从它分出的分枝称为方案分枝,分枝的数目就是方案的个数。○表示机会节点,从它分出的分枝称为概率分枝,一条概率分枝对应一条自然状态并标有相应的发生概率。△称为未梢节点,右边的数字表示相应的收益值或损失值。在决策树上由右向左计算各机会节点处的期望值,并将结果标在节点旁。遇到决策点则比较各方案分枝的效益期望值以决定方案的优劣,并且用双线划去淘汰掉的方案分枝,在决策点旁标上最佳方案的效益期望值,计算步骤如下:(1)在机会节点E、F处计算它们的效益期望值E(E)=0.5×(-24000)+0.3×(-18000)+0.2×(-12023)=-19800E(F)=0.7×(-54000)+0.2×(-46000)+0.1×(-38000)=-50800(2)在第一级决策点C、D处进行比较,在C点处划去正常速度分枝,在D处划去应急分枝。

(3)计算第二级机会节点B处的效益期望值E(B)=0.4×0+0.5×(-19800)+0.1×(-50000)=-14900并将-14900标在B点旁。(4)在第二级决策点A处进行方案比较,划去提前紧急加班,将-14900标在A点旁。

结论最佳决策为前15天按正常速度施工,15天后按实际出现的天气状况再作决定。如出现阴雨天气,仍维持正常速度施工;如出现小风暴,则采取应急措施;如出现大风暴,也按正常速度施工,整个方案总损失的期望值为-14900元。

根据期望值大小决策是随机型决策问题最常用的办法之一。实际应用时应根据具体情况作出分析,选取期望收益最大或期望损失最小的方案。二、不确定型决策问题只知道有几种可能自然状态发生,但各种自然状态发生的概率未知的决策问题称为不确定型决策问题,由于概率未知,期望值方法不能用于这类决策问题。下面结合一个例子,介绍几种处理这类问题的方法。例8.10设存在五种可能的自然状态,其发生的概率未知。有四种可供选择的行动方案,相应的收益值见表8.7表8.866653415964387543266544154321自然状态方案(1)乐观法(maxmax原则)

采用乐观法时,决策者意在追求最大可能收益。他先计算每一方案的最大收益值,再比较找出其中的最大者,并采取这一使最大收益最大的方案,在例8.10中,maxa1j=6,maxa2j=8,maxa3j=9,maxa4j=6,而max{6,8,9,6}=9,采取方案3。(2)悲观法(maxmin原则)采用悲观法时,决策者意在安全保险。他先求每一方案的最小收益,再比较找出其中的最大者,并采取这一使最小收益值最大化的方案。对于例8.10,mina1j=4,mina2j=3,mina3j=1,mina4j=3。因为max{4,3,1,3}=4,采取方案1。(3)乐观系数法(Hurwicz决策准则)乐观系数法采用折中的办法,引入一个参数t,0≤t≤1,称t为乐观系数。作决策时,决策者先适当选取一个t的值;再对各方案1求出;最后再作比较,找出使最大的方案。在例8.10中,若取t=0.5,采用乐观系数法决策,将选取方案2。易见,t=1对应乐观法,而t=0则对应于悲观法。(4)等可能法(Laplace准则)由于不能估计各状态出现的概率,决策者认为它们相差不会过大。此时,决策者采用将各状态的概率取成相同值的办法把问题转化为风险型,并借用风险型问题的期望值法来决策。对于例8.10,如取各状态出现的概率均为0.2,用期望值法决策,将选取策略2。不难看出,对于不确定型决策问题,不论采用什么方法决策,最终采用的策略都不能称为最佳策略。事实上,采取什么方法决策与决策者的心理状态有关。而且,即使对同一决策者,在处理不同决策问题时也可能采取不同的方法。例如,在决定购买几元钱一张的对奖券时,决策者也许会采用乐观法。因为几元钱的损失对他来讲是无所谓的事,小额奖金他也许看不上眼,要中就来个大奖。但是,在决策购买何种股票时,因为关系重大,也许他为了保险又会采取悲观法。同而,不确定型问题的决策充其量只能算是在决策者某种心理状态下的选优。要作出较符合实际情况的决策,还需决策者多作些调查研究,以便对未来自然状态的出现作出较符合客观实际的预测,才能收到较好的效果。例8.11(离散报童模型)设某商品的需求量θ为离散变量,其取值范围为Q={1,…,n},取值i的概率为P(i),=1。记该商品的进货量为(决策变量),若>,进货过量,每单位进货过剩将造成k0元过量损失;反之,若<,进货不足,每单位进货不足将造成ku元的不足损失。试确定该商品的最佳进货量。解:当≥时,将有过量损失k0(-);当<时,将有不足损失ku(-)。故总期望损失为若*为最优进货量,则必有且

由此经平凡的计算可以得出:最佳进货量*应使成立(推导过程从略)。例8.12

某烧鸡店每卖出一只烧鸡可赚5元,如出现过剩将于下午5点另作处理,每剩一只将损失2.5元。该店根据平时销售情况列出下表,试根据表8.9中提供的信息确定制作烧鸡的最佳数量并求该店销售烧鸡的最佳平均利润。表8.90.10.180.20.220.20.1概率P()

302928272625需求量

解:根据题意,单位过剩损失k0=2.5,单位不足损失ku=5,。

因为,

但。故烧鸡的最佳制作量为28只。

最佳平均利润为

(元)

有一个风险投资的机会,成功和失败的概率都是0.5。投资1元,如果成功可以得到1.6元的利润,即资本成为2.6元。如果失败,则损失1元,即资本成为0。开始的资本为100万元。投资的次数和每次投资额不限。为了不至于把钱输光,投资者采取如下的策略:每次总是将资本的一半去投资。问题:这项投资的结局如何,是一本万利,还是一贫如洗?问题1:风险决策的一个讨论题1(订货计划)某厂制造和销售一种新仪器,需要外购一种配件。现有三个厂生产这种配件,牌号为A,B,C。A配件每只10元,但有次品,装配的仪器也是次品,每台损失100元;B配件每只55元,也有次品,但装配的仪器出售后可在保修期内稍加修理就能使用,修理费55元;C配件每只118元,没有次品;问该厂应如何购置各种配件,使总费用(包括损失费和修理费)最少?对策问题习题2(费用分摊问题)假设沿某河流有相邻的三个城市:A,B,C。各城市都想建立自来水厂解决用水问题。各城市可单独建立自来水厂,也可以合作建一个大水厂,再用管道送到各城市。经估计,合作建一个大水厂比单独建三个自来水厂的总费用少。三个城市有意合作,但是否实施,看总费用的分摊是否合理。问题是如何合理分摊费用,使合作建立大水厂的方案得以实现。3(拍卖问题)拍卖形式是先由拍卖商对拍卖品描述一番,然后提出第一个报价。接下来由买者报价,每一次都比前次高,最后谁出的价格高拍卖品即归谁所有。假设报价为p1,p2…pn-1,pn,设p1<p2<

…<pn-1<pn.买主只要略高于pn-1就能买到。问题是,各买主之间可能知道他人的估价,也可能不知道他人的估价,每人应如何报价对自己能以较低的价格得到拍卖品最为有利?4(囚犯难题)设有两个嫌疑犯被警察拘留,警察分别对两人进行审讯。根据法律,如果两人都承认此案是他们干的,则每人各判刑7年;如果两人都不承认,则由于证据不足,两人各判刑1年;如果只有一人承认,则承认者以宽大处理,当场释放,而不承认者判刑9年。因此,对两个囚犯来说,面临着一个“承认”和“不承认”之间两个策略的选择的难题。案例:俾斯麦海的海空对抗

1943年2月,第二次世界大战中的日本,在太平洋战区已经处于劣势。为扭转局势,日本统帅山本五十六大将统率下的一支舰队策划了一次军事行动:由集结地——南太平洋的新不列颠群岛的蜡包尔出发,穿过俾斯麦海,开往新几内亚的莱城,支援困守在那里的日军。

当盟军获悉此情报后,盟军统帅麦克阿梭命

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论