对策与决策问题概要课件_第1页
对策与决策问题概要课件_第2页
对策与决策问题概要课件_第3页
对策与决策问题概要课件_第4页
对策与决策问题概要课件_第5页
已阅读5页,还剩119页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章、对策与决策模型前言§7.1对策问题§7.2、决策问题§7.3层次分析法建模7/22/20231MCM前言

对策与决策是人们在日常生活和工作中经常碰到的择优活动。人们在处理某一问题时,往往会面临多种可能出现的情形,同时又存在多种可供选择的行动方案,要求根据自己的行动目的从中选定一种方案,以期获得最佳的结果。有时,人们面临的问题具有竞争或对抗性质,如商业上的竞争、体育中的比赛和军事对抗、政治派别的斗争等等。这时竞争双方或各方都希望发挥自己的优势,使己方获得最好结果。因而双方或各方都要根据不同情况、不同对手作出各自的决择,此时遇到的问题被称为对策。7/22/20232MCM在有些情况下,我们面临的并非竞争对手而是可能出现的多种情况,我们不知道究竟哪一种情况会发生,但希望我们的决策能获得最好的结果,此时,我们面临的问题被称为决策问题,不过,如果我们将可能出现的若干种情况也看作是竞争对手可采取的几种策略,那么也可以把决策问题当作对策问题来处理。7/22/20233MCM§7.1对策问题

对策问题的特征是参与者为利益相互冲突的各方,其结局并不取决于其中任何一方的努力,而是各方所采取的策略的综合结果。先考察几个实际例子。例7.1(田忌赛马)田忌赛马是大多数人都熟知的故事。事情发生在战国时期,据说齐王欲与大将田忌赛马,双方约定每人从自己的上、中、下三个等级的马中各挑选赛马一匹来进行三局比赛,进行每局比赛时,双方7/22/20234MCM各派赛马一匹比试,每局的败者要付给胜者一千两黄金。当时,齐王的每一等级的马都比田忌同等级的马要强,因而,如果田忌用自己的上等马与齐王的上等马比试,用自己的中等马与齐王的中等马比试,用自己的下等马与齐王的下等马比试,则田忌要输三局,因而要输掉黄金三千两。但是结果田忌并没有输,反而赢了一千两黄金。这是因为田忌的谋士孙膑给他出了一个主意,让他用下等马对齐王的上等马,上等马对齐王的中等马,中等马对齐王的下等马,结果田忌二胜一败,反而赢了一千两黄金。

7/22/20235MCM例7.2(石头—剪刀—布)这是一个大多数人小时候都玩过的游戏。游戏双方每次出拳只能选石头、剪刀、布中的一种,石头赢剪刀,剪刀赢布,而布又赢石头,赢者得一分,输者失一分,双方相同时不得分,见下表。AB石头剪子布石头01-1剪子-101布1-10表7-17/22/20236MCM例7.3(嫌犯的困惑)警察同时拘捕了两嫌疑犯,为防止串供,将他们分开关押。逮捕的原因是他们持有大量伪币。警方怀疑他们伪造钱币,但没有找到充分的证据,希望他们能自己供认。这两个人都知道:如果他们双方都不供认,将被以使用和持有大量伪币罪被各判刑18个月;如果双方都供认伪造了钱币,将以伪造钱币罪被各被判刑3年;如果一方供认而另一方不供认,则供认方将被从宽处理而免予刑事处分,但另一方则将被判刑7年。将嫌疑犯A、B被判刑的几种可能情况列表如下:7/22/20237MCM表7-2AB供认不供认供认(3,3)(0,7)不供认(7,0)(1.5,1.5)表中每对数字是嫌疑犯A、B分别被判刑的年数的组合。如果两名嫌疑犯均担心对方供认并希望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。从这些简单实例中可以看出对策现象中包含着几个基本要素。7/22/20238MCM(对策的基本要素)(1)局中人。参加决策的各方被称为对策问题的局中人,一个决策问题至少包含着两名局中人(如棋类比赛等),也可以包含多于两名局中人(如大多数商业中的竞争、政治派别间的斗争等)。局中人必须拥有可供其选择并影响最终结局的策略,在例7.1中,田忌的朋友孙膑不能称之为局中人,他只是给田忌了提供了可供参考的策略,而没有做出决策的权利,最终的决策只能由局中人田忌本人来做出。同样,在例7.3中,局中人是A、B两名嫌疑犯,警方并非局中人。两名嫌犯最终被如何判刑,取决于他们各自采取的态度,警方并不能代替他们做出选择。7/22/20239MCM(2)策略集。局中人所能采取的每一可行方案均被称为策略,某局中人可采取的全部策略称为该局中人的策略集。对策问题中,对应于每一局中人均存在着一个策略集,而每一策略集中至少要求有两个策略,否则,该局中人可从此对策问题中删去,因为对他来讲,他只有唯一的方案,不存在任何选择策略的余地。应当注意的是,所谓策略是指在整个竞争过程中对付他方的整套策略,并非指竞争过程中某个步骤所采取的具体局部办法。例如田忌先出下等马比赛只能看成其完整策略的组成部分,而不能看成一个完整的策略。7/22/202310MCM因为首先出下等马比赛,比赛还没有结束,接下来还必须继续为剩余的比赛寻找应对方法。只有当比赛全部结束,各比赛方案组合在一起才能构成一个策略,比如,先出下等马,再出上等马,后出中等马就构成了一个策略。当然,有时也可将具体的局部方法看成一个多阶段对策中的子对策。策略集合可以是有限集也可以是无限集,策略集为有限集时的对策问题被称为有限对策,否则被称为无限对策。7/22/202311MCM记局中人的策略集为。对策时,对策问题的各方都从各自的策略集合中选定了一个策略。各方都采取了自己的策略后,对策问题将产生一个结果,该结果可用一个矢量表示,称之为一个纯局势(简称局势)。例如,若一对策中包含A、B两名局中人,A有种策略,B有种策略7/22/202312MCMA、B的策略集合分别为和如果局中人A选择策略而局中人B选择策略则对策结果就成为此对策的一个纯局势。显然,策略集与共构成个纯局势,它们构成表7.3。由对策问题的全体纯局势构成的集合称为此对策问题的局势集合。7/22/202313MCM表7-37/22/202314MCM在例7.1中,齐王和田忌双方都要各选派自己的三匹分属上、中、下三个等级的马分别参加一局比赛。如果用1、2、3分别代替齐王的上等马、中等马、下等马,而用三个数字排列的先后顺序表示参赛次序,例如(1,2,3)表示齐王用上等马参加第一局比赛,中等马参加第二局比赛,下等马参加第三局比赛,那么齐王的策略集也包含(1,3,2)、(2,1,3)、(2,3,1)、(3,2,1)、(3,1,2)六个策略,分别记为(此处仍用1、2、3分别代替田忌的上等马、中等马、下等马)。局势集合S包含了由双方的策略两两组合而成36个纯局势。

7/22/202315MCM同样,田忌的策略集也包含(1,3,2)、(2,1,3)、(2,3,1)、(3,2,1)、(3,1,2)六个策略,分别记为(此处仍用1、2、3分别代替田忌的上等马、中等马、下等马)。局势集合S包含了由双方的策略两两组合而成36个纯局势。

7/22/202316MCM(3)赢得函数(或称支付函数)。对策的结果要体现到每位局中人身上,所以一般用矢量表示,称之为赢得函数。赢得函数F为定义在局势集S上的矢值函数,对于S中的每一纯局势s,F(s)指出了每一局中人在此对策结果下应赢得(或支付)的值。记局中人集合为I=(1,…,k),对每一有一策略集,当I中每一局中人选定自己的策略后得一个局势s;将s代入赢得函数F,即得一矢量

其中为在局势s下局中人i的赢得(或支付)。7/22/202317MCM如例7.1在局势(,)下齐王的赢得值为=3,而田忌的赢得值为=-3(以1千两黄金为单位)。综上所述,一个对策模型由局中人、策略集和赢得函数三部分组成。本节讨论只有两名局中人的对策问题,其结果可以推广到一般的对策模型中去。一般的对策问题讨论起来相当繁琐,为简单起见,本节只讨论仅有两名局中人的对策问题(简称为两人对策)。7/22/202318MCM对于只有两名局中人的对策问题,其局势集和赢得函数均可用表格表示。例如,表7.2就给出了例7.3的局势集和赢得函数,为方便起见,我们不妨仍用来记一方采用,另一方采用时双方的赢得。(两人零和对策)一类特殊的两人对策问题被称为零和对策问题,在这类对策中,当纯局势确定后,局中人A之所得恰为另一局中人B之所失,或者A之所失恰为B之所得,即双方所得之和总为零。如例8.1的赛马比赛结果,齐王之所得必为田忌之所失,齐王之所失必为田忌之所得,因此例7.1中的两人对策问题就属于零和对策问题。7/22/202319MCM在零和对策中,因要指出对策结果只需指出其中一人的赢得即可,故赢得函数可用赢得矩阵来表示。例如若A有m种策略,B有n种策略,赢得矩阵可写成

表示若A选取策略i而B选取策略j,则A之所得为B之所失为(当时为赢得)。7/22/202320MCM例7.1中的两人零和对策问题,赢得函数可以使用齐王或者田忌的赢得矩阵来表示。齐王的赢得矩阵(以1千两黄金为单位)为:而田忌的赢得矩阵为-R。7/22/202321MCM在有些两人对策的赢得表中,A之所得并非明显为B之所失,但双方赢得数之和为一常数。例如在表7.4中,无论A、B怎样选取策略,双方赢得总和均为10。这种对策问题可以很容易地转化为A之所的即为B之所失的零和对策问题。表7.4局中人A局中人B1231(8,2)(1,9)(7,3)2(4,6)(9,1)(3,7)3(2,8)(6,4)(8,2)4(6,4)(4,6)(6,4)7/22/202322MCM此时,若分别把两人的赢得数各减去平均赢得数,即可将赢得表化为零和赢得表,从而可用赢得矩阵来表达。表8.4中的对策在转化为零和对策后,具有赢得矩阵(7.1)一个两人对策需要给出局中人A、B的策略集和以及表示双方赢得值的赢得矩阵R。7/22/202323MCM特别地,当遇到零和对策或可转化为零和对策的问题时,由以上分析,R可用通常意义下的矩阵来表示,否则R的元素应为一个二维矢量。故两人对策G又可称为矩阵对策,并可简记成例7.4给定二人对策,其中和7/22/202324MCM从R中可以看出,A的最大可能赢利为30。若A希望获得最大赢利30,需采取策略但此时若B采取策略,A非但得不到30,反而会失去22。为了稳妥,A在决策前应事先考虑到对方可能有使自己损失最大的动机,应该在最坏的可能中争取最好的结果,B也应该做同样的考虑。如果情况果真如此,局中人A会这样来考虑问题:

、采取策略

时,最坏的赢得结果分别为min{12,-6,30,-22}=-227/22/202325MCMmin{14,2,18,10}=2min{-6,0,-10,16}=-10其中最好的可能为max{-22,2,-10}=2那么如果A采取策略无论B采取什么策略,A的赢得均不会少于2。B采取各方案的最大损失为max{12,14,-6}=14max{-6,2,0}=2max{30,18,-10}=30max{-22,10,16}=16当B采取策略时,其损失不会超过2。7/22/202326MCM注意到在赢得矩阵中,2既是所在行中的最小元素又是所在列中的最大元素。此时,只要对方不改变策略,任一局中人都不可能通过变换自己的策略来增大赢得或减小损失。在这种情况下,看来,对双方而言这一结果都应当被看成是最好的结果,应当采用什么策略似乎并无悬念,称这样的局势为对策问题的一个稳定点(鞍点)或稳定解。

定义7.1对于两人对策,若有7/22/202327MCM则称G具有稳定解,并称为对策G的值。若有纯局势使得

则称为对策G的鞍点或稳定解,赢得矩阵中与相对应的元素称为赢得矩阵的鞍点,

与分别称为局中人A与B的最优策略。对(7.1)式中的赢得矩阵,容易发现不存在具有上述性质的鞍点。给定一个对策G,如何判断它是否具有鞍点呢?7/22/202328MCM定理7.1零和对策记则具有稳定解的充要条件为定理7.1给出了对策问题有稳定解(简称为解)的充要条件。但当一个对策问题有解时,其解有可能不唯一。例如,若赢得矩阵为7/22/202329MCM则易得,、、

均为此对策问题的解。一般而言,零和对策问题的解具有下列性质:(1)无差别性。若同为对策G的解,则必有7/22/202330MCM(2)可交换性。若均为对策G的解,则和也必为G的解。具有稳定解的零和对策问题是一类特别简单的对策问题,它所对应的赢得矩阵存在鞍点,任一局中人都不可能通过自己单方面的努力来改进结果。然而,在实际遇到的零和对策中更典型的是的情形。由定理7.1知,此时的赢得矩阵中不存在鞍点,也就是说,至少存在一名局中人,在他单方面改变策略的情况下,有可能改善自己的收益。例如,考察(7.1)式中的赢得矩阵R。7/22/202331MCM若双方都采取保守的maxmin原则,将会出现纯局势但如果局中人A适当改换策略,他可以增加收入。例如,如果B采用策略而A改换策略则A可收益3。但此时若B改换策略又会使A输掉4,……。此时,在只使用纯策略的范围内,对策问题无解。如果这类决策只进行一次,局中人除了碰运气以外别无办法。7/22/202332MCM但如果这类决策要反复进行多次,则局中人固定采用同一种策略显然是不明智的,因为一旦对手看出你会采用什么策略,他将会选用对自己最为有利的策略。(例如,在你和别人玩石头剪子布游戏时,你始终采用同一策略显然是很不明智的,可以肯定,输掉的一定是你)。为了预防对手猜到你会采用哪一种策略,你应当不断变换你使用的策略。换句话说,此时局中人应采用混合策略的办法,即根据某种概率来选用各种策略,使自己的期望收益尽可能大。设A方用概率选用策略B方用概率选用策略7/22/202333MCM双方每次选用什么策略是随机的,不能让对方看出规律,记则A的期望赢得为

其中,R为A方的赢得矩阵。7/22/202334MCM分别称SA与SB为A方和B方的混合策略。7/22/202335MCM对于需要使用混合策略的对策问题,也有具有稳定解的对策问题的类似结果。定义7.2若存在m维概率向量和n维概率向量使得对一切m维概率向量和n维概率向量成立,则称为混合策略对策问题的鞍点。7/22/202336MCM定理7.2任意混合策略对策问题必存在鞍点。即必存在概率向量和使得:混合策略对策问题通常可采用线性规划方法求解,具体解法从略。(非零和对策)除了零和对策外,还存在着另一类对策问题,局中人的获利值之和并非常数。7/22/202337MCM例7.5现有一对策问题,双方获利情况见表7.5。表7.5

BA1231(8,2)(0,9)(7,3)2(3,4)(9,0)(2,7)3(1,6)(6,2)(8,1)4(4,2)(4,6)(5,1)假如A、B双方仍采取稳妥的办法,A发现如采取策略4,则至少可获利4,而B发现如采取策略1,则至少可获利2。因而,这种求稳妥的想法将导至出现局势(4,2)。7/22/202338MCM容易看出,从整体上看,结果并不是最好的,因为双方的总获利有可能达到10。不难看出,此时依靠单方面的努力不一定能收到良好的效果。看来,对这样的对策问题,双方最好还是握手言和,相互配合,先取得总体上的最大获利,然后再按照某一个双方均认为较为合理的方式来分享这一已经获得的最大获利。例7.5说明,总获利数并非常数的对策问题(即不能转化为零和对策的问题),是一类存在着合作基础的对策问题。当然,这里还存在着一个留待解决而又十分关键的问题:如何分享总获利。7/22/202339MCM如果不能达成一个双方(或各方)都能接受的“公平”的分配原则,则这样的合作仍然不能实现。怎样建立一个“公平”的分配原则是一个较为困难的问题,1953年,Shapley用公理化方法研究了这一问题,并提出了他认为公平的分配方法。因篇幅的限制,本书不准备介绍他的方法,有兴趣的读者可参阅有关对策论的书籍。最后,我们来考察一个对策问题的实例。例7.6(战例分析)7/22/202340MCM图7-1

1944年8月,美军第一军和英军占领法国诺曼第不久,立即从海防前线穿过海峡,向Avranches进军。美军第一军和英军的行动直接威胁到德军第九军。美军第三军也开到了Avranches的南部,双方军队所处的地理位置如图7.1所示。7/22/202341MCM美军方面的指挥官是Bradley将军,德军指挥官是VonKluge将军。VonKluge将军面临的问题是或者向西进攻,加强他的西部防线,切断美军援助;或者撤退到东部,占据塞那河流域的有利地形,并能得到德军第十五军的援助。Bradley将军的问题是如何调动他的后备军,后备军驻扎在海峡南部。Bradley将军有三种可供选择的策略:他可以命令后备军原地待命,当海峡形势危急时支援第一军或者出击东部敌人,以减轻第一军的压力。双方应如何决策,使自己能有较大的机会赢得战争的胜利呢?我们将用建立矩阵对策模型的方法,来试图求得双方的最优策略。7/22/202342MCM模型假设:

1、Bradley将军和VonKluge将军分别为对策问题的局中人A和B。2、局中人A的策略集合为其中:为后备军增援保卫海峡;为后备军东征,切断德军后路;为后备军待命。3、局中人B的策略集合为其中:7/22/202343MCM为德国向西进攻海峡,切断美军援助;为德军撤退到东部,占领塞纳河流域有利地形。4、构成六种纯局势,综合双方实力,各种局势估计结果如下。若B采取策略即德军采取攻势,则有(1)估计美军击败德军并占领海峡的可能性(即概率)为1/37/22/202344MCM,

(2),估计美军取胜的可能为1/6。德军很可能打破美军第一军的防线,并切断美军的退路。(3),估计美军可以根据需要增援。如不需增援,后备军可东进绕行到德军后方。这样,美军将占领海峡并彻底歼灭德军第九军。情况(1)、(2)、(3)如图7.2(1)、(2)、(3)所示。7/22/202345MCM

图7-2(a)(b)(c)7/22/202346MCM若B采取策略,即德军第九军东撤,占据塞纳河流域有利地形,则有(4),美方扩大了战线,德军虽占据可能性。了有利地形,美军仍有击败德军的(5),美后备军东进给德军东撤造成压力并挫伤德军,使美军击败德军的可能性增大到(6),美后备军待命。在发现德军撤退后,奉命向东扰乱敌方撤退,为以后歼灭德第九军创造条件,估计美军击败德军的可能性7/22/202347MCM情况(d)、(e)、(f)见图7-2(d)、(e)(f)所示。图7-2(d)、(e)、(f)7/22/202348MCM上述分析估计是由Bradley将军作出的,据此构造出A方赢得矩阵这是一个3×2对策矩阵。可以求得7/22/202349MCM不存在稳定解,需要考虑其他解法。定义7.3对于赢得矩阵R,如果对所有jaij≥akj均成立,且至少存在一个j。使得aij>akj。则称i行优于k行(策略ai优于ak)。则称j列优于l例局中人B的策略j优于同样,如对一切i有aij≤akl,且至少有一个i0使得l)。7/22/202350MCM易见,若一个对策矩阵的第i行优于第k行,则无论局中人B选择哪种策略,局中人A采取策略i的获利总优于(至少不次于)采取策略k的获利。定理7.3对于矩阵对策G={SA,SB,R},若矩阵R的某行优于第i1,……,ik行,则局中人A在选取最优策略时,必取令R’为从R中划去第i1行,…,ik行后剩下的矩阵,则7/22/202351MCM的最优策略即原对策G的最优策略,对于R中列的最优关系也有类似的结果。利用这一定理,有时对策问题可先进行化简,降低矩阵的阶数。现在回过来讨论美、德军队对策问题(例7.6)。在Bradleg构造的矩阵中容易发现a1j<a3j,j=1,2。

故优于根据上面的定理7.3,可划去该矩阵的第一行,得到2×2赢得矩阵7/22/202352MCM这仍然是一个无鞍点的对策矩阵(注:这是必然的)。设Bradley以概率p1取策略而以概率p2取略,则应有解得,。7/22/202353MCM类似地,设VonKluge以概率q1取策略而以概率q2取策略,则应有解得。7/22/202354MCM由于两军作战并非可以反复进行的对策问题,看来最大的可能是美军采取策略而德军采取策略,

即美方后备军待命而德军第九军东撤(真正实施时,指挥官有可能不这样做,而是出其不意地采取其他策略)。事实上,当时双方指挥官正是这样决策的,如果真能实行,双方胜负还难以料定。但正当德军第九军刚准备开始东撤时,突然接到了希特勒的命令要他们向西进攻,从而失去了他们有可能取得的最佳结局,走上必然灭亡的道路。VonKluge将军指挥的德军向西进攻,开始时德军占领了海峡,但随之即被美军包围,遭到了全军覆灭,VonKluge本人在失败后自杀身亡。7/22/202355MCM§

7.2、决策问题决策也是人们在日常生活和工作中经常会碰到的一类择优活动。人们在处理某一问题时,常常会面临几种可能出现的自然情况,同时又存在着几种可供选择的行动方案。此时,需要决策者根据已知的信息作出决策,即选择出最佳的行动方案,这样的问题称为决策问题。面临的几种自然情况叫做自然状态或简称状态。状态是客观存在的,是不可控因素。可供选择的行动方案叫做策略,这是可控因素,选择哪一方案由决策者作出决定。7/22/202356MCM例7.7某工厂要确定下一年度产品的生产计划,并拟定了三个可供选择的生产方案:甲方案、乙方案和丙方案。而该产品的销路可能有好、一般、差三种情况,根据以往的经验,未来市场出现销路好坏的可能性以及各种方案在各种销路下工厂的效益见表7.6。决策者应选择哪种方案使工厂获利最大。7/22/202357MCM表7.67/22/202358MCM解:由此例可以看出,一个决策问题应包含三个基本要素:(1)状态集合

其中的为自然状态,决策者无法对其控制。例如,本例中的“销路好”、“销路一般”、“销路差”为决策者无法控制的三种自然状态。(2)策略集合其中的为可供决策者选择的策略,采取哪一种完全由决策者决定。7/22/202359MCM本例中的策略有甲、乙、丙三种。(3)收益矩阵其中表示如果决策者选取策略(当而出现的状态为时决策者的收益值为负值时表示损失值)在本例中,决策者若选取甲方案而出现销路好的情况时工厂将获利40万元。根据自然状态的不同,决策问题常被分为三种类型:确定型决策、风险型(或随机型)决策和不确定型决策。7/22/202360MCM确定型决策是只存在一种确定的自然状态的决策问题。这种决策问题的结构较为简单,决策者只需比较在这种确定的自然状态下的各种方案,确定哪一种方案最优即可。值得一提的是策略集也可以是无限集,因而仍可能存在算法研究问题。例如,线性规划、二次规划等均可看成确定型决策,因为问题要求决策者从可行解集合(策略集)中挑选出最优解。确定型决策的求解并非都很简单,但由于这些问题一般均有其自己的专门算法,本节不准备再作介绍。在本节中,我们主要讨论风险型与不确定型决策,并介绍它们的一般求解方法。7/22/202361MCM一、风险型决策问题在风险型决策问题中存在着两种或两种以上不以决策者的主观意志为转移的自然状态。虽然决策者不知道究竟会出现哪一种状态,但可以通过一定的方法估算出各种状态出现的可能性,即知道各状态发生的概率有多大。例如,例7.7就是一个风险型的决策问题。对于风险型决策问题,最常用的决策方法是期望值法,即把每个行动方案看成是一个离散型随机变量,根据各种行动方案的期望收益或期望损失来评估各种行动方案的优劣并据此作出决策。7/22/202362MCM例如,对例7.7,可以首先分别求出方案甲乙和丙的期望收益值。由于方案的期望收益最大,故选取作为最佳策略。7/22/202363MCM对于较为复杂的决策问题,尤其是需要作多阶段决策的问题,常采用较直观的决策树方法。所谓决策树就是将有关的方案、状态、概率、收益值、结果等用一些节点和边组成的“树枝状”的图形表示出来。决策树的构成为:(1)决策节点,一般用“□”表示,其上方数字表示最终决策的期望收益值。从决策节点引出的不同的边,表示不同的决策方案,且未被选中的方案要用符号“║”标出。(2)方案节点,一般用“○”表示,其上方的数字表示该方案的期望收益值。从方案节点引出的边称为概率分支,每条分支上表明它代表的自然状态及其出现的概率。(3)结果节点,一般用“△”表示,它是概率分支的末梢,其右边的数字为相应方案在该自然状态下的收益值。从本质上讲,决策树方法仍然是一种期望值法。7/22/202364MCM简单的决策问题当然也可用决策树来解决,如例7.7对应的决策树如图7-3所示。图7-37/22/202365MCM例7.8有一工程要进行施工,施工的费用与工程完工时间有关。无坏天气的情况下,按正常速度施工可确保在30天内按期完工,但根据气象预报,15天后天气肯定会变坏。有40%的可能会出现阴雨天气但不会影响工程进度,有50%的可能会遇到小风暴而使工期推迟15天,另有10%的可能会遇到大风暴而使工期推迟20天。对于可能出现的各种情况,考虑两种行动方案:(1)提前紧急加班,在15天内完成工程,实施此方案需增加开支18000元。(2)先按照正常速度施工,15天后根据实际出现的天气状况再作决策。具体情况如下:.7/22/202366MCM若遇到阴雨天气,则维持正常的施工速度,不必支付额外费用。若遇到小风暴,有两个备选方案:①维持正常速度施工,工程延期损失费为20000元。②采取应急措施。实施此应急措施又有三种可能结果:1)有50%的可能减少误工期1天,应急费用和延期损失费共24000元;2)有30%的可能减少误工期2天,应急费用和延期损失费共18000元;3)有20%的可能减少误工期3天,应急费用和延期损失费共12000元。7/22/202367MCM若遇到大风暴,也有两个被选方案:①维持正常速度施工,工程延期损失费为50000元。②采取应急措施。实施此应急措施也有三种可能结果:1)有70%的可能减少误工期2天,应急费用及误工费共54000元;2)有20%的可能减少误工期3天,应急费及误工费共46000元;3)有10%的可能减少误工期4天,应急费和误工费共38000元。根据上述情况,试帮助施工单位作出额外费用最少的最佳决策。7/22/202368MCM解答:15天后的天气状态未知,但气象部门已经预测出出现各种天气状况的可能性,可以认为出现各种天气状况的概率已知,因此本例属于风险型决策问题,所谓的额外费用应理解为期望值。同例7.7不同,本例属于多阶段(两阶段)决策问题。工程的初期就需要作出决策,是按正常速度施工还是需要提前紧急加班。若按正常速度施工,则15天后还需根据天气的实际状况再作一次决策,以决定要否采取应急措施。根据题意,作决策树如图7-4所示。7/22/202369MCM图7-47/22/202370MCM在决策树上自右向左计算各方案节点处的期望值,并将结果标在节点旁。遇到决策节点则比较各方案的期望收益值以决定方案的优劣,并划去未被选中的方案,在决策节点旁标明最佳方案的期望收益值,计算步骤如下:(1)在方案节点E、F处计算它们的期望收益值E(E)=0.5×(-24000)+0.3×(-18000)+0.2×(-12000)=-19800元E(F)=0.7×(-54000)+0.2×(-46000)+0.1×(-38000)=-50800元7/22/202371MCM并将-19800和-50800分别填在方案节点E、F的上方。(2)在一级决策节点C、D处进行比较,在C点处划去正常速度方案,在D处划去应急方案。(3)计算二级方案节点B点处的期望收益值E(B)=0.4×0+0.5×(-19800)+0.1×(-50000)=-14900元并将-14900标在方案节点B点的上方。(4)在二级决策节点A处进行方案比较,划去提前紧急加班,将-14900标在决策节点上方。7/22/202372MCM结论最佳决策为前15天按正常速度施工,15天后根据天气的实际状况再作决定。如果出现阴雨天气,仍维持正常速度施工;如果出现小风暴,则采取应急措施;如出现大风暴,仍按正常速度施工。整个方案总损失的期望值为-14900元。二、不确定型决策问题在风险型决策问题中,虽然不知道哪一种自然状态会发生,但每种自然状态发生的可能性可以通过查阅历史资料或预测、估算等方法得到。我们把只知道有几种可能的自然状态,而各自然状态发生的概率未知的决策问题称为不确定型决策问题。由于概率未知,期望值方法不能用于这类决策问题。下面结合一个例子,介绍几种处理这类问题的方法。7/22/202373MCM例7.9某决策问题有五种可供选择的行动方案,未来存在四种可能的自然状态,且各自然状态发生的概率未知。相应的收益值见表7.7。表7.7方案自然状态14567224693573543568535557/22/202374MCM(1)乐观法(max-max原则)采用乐观法时,决策者对未来的结果持乐观的态度,他不放弃任何一个可能获得最大利益的机会,充满了冒险精神。因此他总是假设会出现对自己最有利的自然状态。他先计算每一方案的最大收益值,再通过比较找出其中的最大者,并采取这一使最大收益最大的方案,在例8.9中而其中最大值max{7,9,7,8,5}=9,采取方案。7/22/202375MCM(2)悲观法(max-min原则)采用悲观法时,决策者比较谨慎保守。他总是从每一方案的最坏情况出发,从各种可能的最坏结果中选择一个相对最好的结果,即采取使最小收益值最大的方案。对于例8.9,而其中最大值max{4,2,3,3,3}=4,采取方案7/22/202376MCM(3)乐观系数法(Hurwicz决策准则)乐观系数法是介于乐观法和悲观法的一个准则,即采取了折中的办法,引入一个乐观系数t(0≤t≤1),来反映决策者对状态估计的乐观程度。作决策时,决策者先适当选定一介于0与1之间的数作为t的取值;再对各方案分别计算

的值;最后作比较,找出使最大的方案。在例7.9中,若采用乐观系数法决策并取t=0.8,7/22/202377MCM对应的收益为:0.8×7+0.2×4=6.4方案

方案对应的收益为:0.8×9+0.2×2=7.6其余各方案分别为6.2、7、4.6,而其中的最大值为7.6,故选取方案为最优方案。若取t=0.6,最优方案仍为而当t=0.5时,最优方案可以是中的任何一个;t=0.4时,最优方案为因此决策者对状态估计所持乐观程度不同,最终的决策也有可能不同。显然,t=1就是我们前述的乐观法,而t=0则为悲观法。7/22/202378MCM(4)等可能法(Laplace准则)等可能法是19世纪数学家Laplace提出的,因此又称为Laplace准则。他认为决策者面对着可能发生的n种自然状态,如果没有确切的理由说明此自然状态一定比彼自然状态发生的可能性大,那么就只能认为它们发生的可能性相同,即每一种自然状态发生的概率都是1/n根据这个观点,决策者就把一个不确定型决策问题转化为一个风险型决策问题,于是可以按风险型决策问题的期望值法进行决策。对于例8.9,共有4种自然状态,可取各状态出现的概率均为0.25,求出7/22/202379MCM可选取策略或,而的方差比较小,故最优方案为。(5)遗憾准则如果决策者选择的决策方案并不是最终出现的自然状态下的收益最大的方案,决策者必然会感到后悔或遗憾。遗憾准则的基本思想就是尽量减少决策之后的遗憾,使决策者不后悔或少后悔。7/22/202380MCM具体作法为:首先把每一自然状态对应的最大收益值视为理想目标,然后它与该状态下的方案的收益值之差作为选择方案而没有达到理想目标的后悔值,得到一个后悔值矩阵其元素为

从此后悔矩阵找出各方案对应的最大后悔值最后选择最小的最大后悔值

7/22/202381MCM对应的方案作为决策方案。对于例8.9,使用遗憾准则的最优方案为或以上五种方法为处理不确定型决策问题的常用方法,不难看出,对于不确定型决策问题,采取不同的决策方法得到的决策结果并不完全一致,而由于没有一个统一的评价标准我们又很难判断五种方法究竟哪个好,哪个不好,所以最终采用的策略都不能称为最佳策略。具体采用哪种方法显然取决于决策者的心理状态,持乐观态度者使用乐观法,持悲观态度使用悲观法,持中间态度使用乐观系数法等等。7/22/202382MCM而对于同一决策者,在处理不同决策问题时也可能会持有不同的心理状态。例如,在决定购买2元钱一张的体育彩票时,决策者会采用乐观法。因为2元钱的损失对他来讲无所谓,小额奖金他也许看不上眼,要中就中个大奖。但是,在决策几万元购买何种股票时,也许他为了保险又会采取悲观法。因此对于不确定型问题的决策,要作出较符合实际情况的决策,还需决策者多作些调查研究分析,以便对未来自然状态的出现作出较符合客观实际的预测,才能收到较好的效果。7/22/202383MCM§7.3层次分析法建模层次分析法是对一些较为复杂、较为模糊的问题作出决策的简易方法,它特别适用于那些难以完全定量分析的问题。社会的发展导致了社会结构、经济体系及人们相互关系的日益复杂化,人们希望能在错综复杂的情况下,利用各种信息,通过理智的、科学的分析,作出最佳决策。例如,生产者面对消费者的各种喜好或竞争对手的策略要作出最佳决策;消费者面对琳琅满目的商品要根据它们的性能质量的好坏、价格的高低、外形的美观程度等选择自己最为满意的商品;毕业生要根据自己的专业特长、社会的需求情况、福利待遇的好坏等等挑选最为合意的工作;7/22/202384MCM科研单位要根据项目的科学意义和实用价值的大小、项目的可行性、项目的资助情况及周期长短等选择最合适的研究课题……。当我们面对这类决策问题时,容易发现,影响我们作决策的因素很多,其中某些因素存在定量指标,可以给以度量,但也有些因素不存在定量指标,只能定性地比较它们的强弱。在处理这类比较复杂而又比较模糊的问题时,如何尽可能克服因主观臆断而造成的片面性,较系统、全面地分析比较并作出较为明智的决策呢?Saaty.T.L等人在70年代提出了一种以定性与定量相结合,系统化、层次化分析问题的方法,称为层次分析法(AnalyticHiearchyProcess,简称AHP)。7/22/202385MCM层次分析法将人们的思维过程层次化,逐层比较其间的相关因素并逐层检验比较结果是否合理,从而为分析决策提供了较具说服力的定量依据,层次分析法的提出不仅为处理这类问题提供了一种实用的决策方法,而且也提供了一个在处理机理比较模糊的问题时,如何通过科学分析,在系统全面分析机理及因果关系的基础上建立数学模型的范例。一、层次分析的基本步骤(1)建立层次结构模型;(2)构造出各层次中的所有判断矩阵;(3)层次单排序及一致性检验;(4)层次总排序及一致性检验。7/22/202386MCM下面通过一个简单的实例来说明各步骤中所做的工作。例7.11某工厂有一笔企业留成利润要由厂领导决定如何使用。可供选择的方案有:给职工发资金、扩建企业的福利设施(改善企业环境、改善食堂等)和引进新技术、新设备。工厂领导希望知道应当按怎样的比例来使用这笔资金较为合理。步1建立层次结构模型在用层次分析法研究问题时,首先要根据问题的因果关系并将这些关系分解成若干个层次。较简单的问题通常可分解为目标层(最高层)、准则层(中间层)和方案措施层(最低层)。7/22/202387MCM与其他决策问题一样,研究分析者不一定是决策者,不应自作主张地作出决策。对于本例,如果分析者自行决定分配比例,厂领导必定会询问为什么要按此比例分配,理由是什么理?符合决策者要求的决策来自于对决策者意图的真实了解。经过双方沟通,分析者了解到如下信息:决策者的目的是合理利用企业的留成利润,而利润的利用是否合理,决策者的主要标准一般是:(1)是否有利于调动企业职工的积极性(2)是否有利于提高企业的生产能力(3)是否有利于改善职工的工作、生活环境。分析者可以提出自己的看法,但标准的最终确定将由决策者决定。7/22/202388MCM根据决策者的意图,可以建立起本问题的层次结构模型如图7-5所示。图中的连线反映了因素之间的关联关系,哪些因素存在关联关系也应由决策者决定。对于因果关系较为复杂的问题也可以引进更多的层次。例如,在选购电冰箱时,如以质量、外观、价格、品牌及信誉等为准则,也许在衡量质量优劣时又可分出若干个不同的子准则,如制冷性能、结霜情况、耗电量大小等等。建立层次结构是进行层次分析的基础,它将思维过程结构化、层次化,为进一步分析、研究创造了条件。7/22/202389MCM图7-57/22/202390MCM步2构造判断矩阵层次结构反映了因素之间的关系,例如图7-5中目标层-利润利用是否合理可由准则层中的各准则反映出来。但准则层中的各准则在目标衡量中所占的比重并不一定相同,在决策者的心目中,它们各占有一定的比例。在确定影响某因素的诸因子在该因素中所占的比重时,遇到的主要困难是这些比重常常不易定量化。虽然你必须让决策者根据经验提供这些数据,但假如你提出“调动职工积极性在判断利润利用是否合理中占百分之几的比例”之类的问题,不仅让人感到难以精确回答,而且还会使厂领导感到你书生气十足,不能胜任这一工作。7/22/202391MCM此外,当影响某因素的因子较多时,直接考虑各因子对该因素有多大程度的影响时,常常会因考虑不周全、顾此失彼而使决策者提出与他实际认为的重要性程度不相一致的数据,甚至有可能提出一组隐含矛盾的数据。为搞清这一点,让我们来做一个实验:例7.12将一块重为1千克的石块砸成n小块,你可以精确称出它们的质量,设为现在,请人估计这n小块的重量占总重量的百分比(不能让他知道各小石块的重量),此人不仅很难给出精确的比值,而且完全可能因顾此失彼而提供彼此矛盾的数据。7/22/202392MCM假设要比较n个因子X={x1,…,xn}对某因素Z的影响大小,怎样比较才能提供可信的数据呢?Saaty等人建议可以采取对因子进行两两比较,建立成对比较矩阵的办法。即每次取两个因子xi和xj,以aij表示xi和xj对Z的影响大小之比,全部比较结果用矩阵A=(aij)n×n表示,称A为Z-X之间的成对比较判断矩阵(简称判断矩阵)。容易看出,若xi和xj对Z的影响之比为aij,则xj和xi对Z的影响之比应为定义7.4若矩阵A=(aij)n×n满足7/22/202393MCM(i)aij>0

(ii)(i,j=1,2,…,n)则称之为正互反矩阵,(易见aii=1,i=1,…,n)。关于如何确定aij的值,Saaty等建议引用数字1~9及其倒数作为标度。他们认为,人们在成对比较差别时,用5种判断级较为合适,即使用相等、较强、强、很强、绝对强表示差别程度,aij相应地取1,3,5,7和9。在成对事物的差别介于两者之间难以定夺时,aij可分别取值2、4、6、8。7/22/202394MCM从心理学观点来看,分级太多会超越人们的判断能力,既增加了作判断的难度,又容易因此而提供虚假数据。Saaty等人还用实验方法比较了在各种不同标度下人们判断结果的正确性,实验结果也表明,采用1~9标度最为合适。如果在构造成对比较判断矩阵时,确实感到仅用1~9及其倒数还不够理想时,可以根据情况再采用因子分解聚类的方法,先比较类,再比较每一类中的元素。步3层次单排序及一致性检验7/22/202395MCM上述构造成对比较判断矩阵的办法虽能减少其他因素的干扰影响,较客观地反映出一对因子影响力的差别。但综合全部比较结果时,其中难免包含一定程度的非一致性。如果比较结果是前后完全一致的,则矩阵A的元素还应当满足:i、j、k=1,2,…,n(7.2)定义8.5满足(7.2)关系式的正互反矩阵称为一致矩阵。如前所述,如果判断者前后完全一致,则构造出的成对比较判断矩阵应当是一个一致矩阵。但构造成对比较判断矩阵A共计要作7/22/202396MCM正互反矩阵是较容易办到的,但要求所有比较结果严格满足一致性,在n较大时几乎可以说是无法办到的,其中多少带有一定程度的非一致性。更何况比较时采用了1~9标度,已经接受了一定程度的误差,就不应再要求最终判断矩阵的严格一致性。如何检验构造出来的(正互反)判断矩阵A是否严重地非一致,以便确定是否接受A,并用它作为进一步分析研究的工具呢?Saaty等人在研究正互反矩阵和一致矩阵性质的基础上,找到了解决这一困难的办法,给出了确定矩阵A中的非一致性程度是否应当允忍的检验方法。次比较(设有n个因素要两两比较),保证A是7/22/202397MCM定理7.4正互反矩阵A的最大特征根λmax必为正实数,其对应特征向量的所有分量均为正实数。A的其余特征根的模均严格小于λmax。(证明从略)现在来考察一致矩阵A的性质,回复到将单位重量的大石块剖分成重量为的n块小石块的例12,由于我们可以精确地称出各小石块的重量,故构造出来的矩阵A应当为严格的一致矩阵。7/22/202398MCM(7.6)

从(7.6)式容易看出,一致矩阵A具有以下性质:定理7.5若A为一致矩阵,则(1)A必为正互反矩阵。7/22/202399MCM(2)A的转置矩阵AT也是一致矩阵。(3)A的任意两行成比例,比例因子(即大于零,从而rank(A)=1(同样,A的任意两列也成比例)。)(4)A的最大特征根λmax=n,其中n为矩阵A的阶。A的其余特征根均为零。(5)A的最大特征根λmax对应的标准特征向量为

i,j=1,2,…,n。7/22/2023100MCM(注:(1)、(2)可由一致矩阵定义得出,(3)—(5)均容易由线性代数知识得到,证明从略)。定理7.6n阶正互反矩阵A为一致矩阵当且仅当其最大特征根λmax=n,正互反矩阵A非一致时,必有λmax>n。根据定理7.6,我们可以由λmax是否等于n来检验判断矩阵A是否为一致矩阵。由于特征根连续地依赖于aij,故λmax比n大得越多,A的非一致性程度也就越为严重,λmax对应的标准化特征向量也就越不能真实地反映出X={x1,…,xn}在对因素Z的影响中所占的比重。因此,对决策者提供的判断矩阵有必要作一次一致性检验,以决定是否应当接受它。7/22/2023101MCM为确定多大程度的非一致性是可以允忍的,Saaty等人采用了如下办法:(1)求出称CI为A的一致性指标。由定理7.6可知,当且仅当A为一致矩阵时,CI=0。CI的值越大,A的非一致性越严重。利用线性代数知识可以证明,A的n个特征根之和等于其对角线元素之和(即n)故CI事实上是A的除λmax以外其余n-1个特征根的平均值的绝对值。若A是一致矩阵,则其余n-1个特征根均为零,故CI=0;7/22/2023102MCM否则,CI>0,其值随A非一致性程度的加重而连续地增大。当CI略大于零时(对应地,λmax稍大于n),A具有较为满意的一致性;否则,A的一致性就较差。(2)上面定义的CI值虽然能反映出非一致性的严重程度,但仍未能指明该非一致性是否应当被认为是可以允许的。事实上,我们还需要一个度量标准。为此,Saaty等人又研究了他们认为最不一致的矩阵——用从1~9及其倒数中随机抽取的数字构造出来的正互反矩阵,取充分大的子样(即试验充分多次),求得最大特征根的平均值7/22/2023103MCM,并定义称RI为平均随机一致性指标。对n=1,…,11,,Saaty给出了RI的值,如表7.8所示。N1234567891011RI000.580.901.121.241.321.411.451.491.51表7.87/22/2023104MCM(3)将CI与RI作比较,定义称CR为随机一致性比率。经大量实例比较,Saaty认为,在CR<0.10时可以认为判断矩阵具有较为满意的一致性,否则就应当重新调整判断矩阵,直至具有满意的一致性为止。综上所述,在步3中应先求出A的最大特征向量λmax及λmax对应的特征向量进行标准化,使得

再对A作一致性检验:计算查表得到对应于n的RI值,求7/22/2023105MCM,若CR<0.1,则一致性较为满意,以作为因子xi在上层因子Z中所具有权值。否则必需重新作比较,修正A中的元素,直到一致性较为满意时,W的分量才可用作层次单排序的权重。现对本节例7.11(即合理利用利润问题的例子)进行层次单排序。为求出C1、C2、C3在目标层A中所占的权值,构造O-C层的成对比较矩阵,设构造出的成对比较判断知阵A为7/22/2023106MCMOC1C2C3C111/51/3C2513C331/31

即λmax=3.038,CI=0.019,查表得RI=0.58,故CR=0.033。因CR<0.1,接受矩阵A,求出A对应于λmax的标准化特征向量W=(0.105,0.637.0.258)T,以W的分量作为C1、C2、C3在目标O中所占的权重。于是经计算,A的最大特征根7/22/2023107MCM类似求措施层中的P1、P2在C1中的权值,P2、P3在C2中的权值及P1、P2在C1中的权值:7/22/2023108MCM7/22/2023109MCM经层次单排序,得到图7-6图7-67/22/2023110MCM步4层次总排序及一致性检验最后,在步骤(4)将由最高层到最低层,逐层计算各层次中的诸因素关于总目标(最高层)的相对重要性权值。设上一层次(A层)包含A1,…,Am共m个因素,它们的层次总排序权值分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论