第10章-对策论课件_第1页
第10章-对策论课件_第2页
第10章-对策论课件_第3页
第10章-对策论课件_第4页
第10章-对策论课件_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章对策论

§1.引言

1.对策模型

研究两个或两个以上的参加者在某种对抗性或竞争性的场合下各自作出决策,使自己的一方得到尽可能最有利的结果。带有竞争性质的现象,称为对策现象。日常生活中:下棋、打牌在政治方面:选举策略、外交策略在经济领域:谈判策略、价格策略田忌赛马2.对策现象的三个基本要素

(1)局中人:决策者,利益得失者聪明的、理智的,不存在利用他人失误的可能性;可以是国家、团体等;可以不是人;把那些利益完全一致的参加者们看作一个局中人;在田忌赛马例子中,局中人是田忌、齐王;不是公证人、马、谋士等局中人的策略全体,称做这个局中人的策略集合;有限,无限例如,在齐王与田忌赛马的例子中,如果一开始就要把各人的三匹马排好次序,然后依次出赛。各局中人都有六个策略:(1)(上、中、下),(2)(上、下、中),(3)(中、上、下),(4)(中、下、上),(5)(下、中、上),(6)(下、上、中)。这个策略全体就是局中人的策略集合。

2.对策现象的三个基本要素

(1)局中人:决策者,利益得失者(2)策略:自始至终的行动方案从每个局中人的策略集中各取一个策略,组成的策略组,称作“局势”。“得失”是“局势”的函数。如果全体局中人的“得失”相加总是等于零时,这个对策就称为零和对策。否则称为“非零和对策”。在田忌赛马的例子中,若齐王选定策略(上、中、下),田忌选定策略(下、上、中),则田忌赢得1,齐王赢得-1

2.对策现象的三个基本要素

(1)局中人:决策者,利益得失者(2)策略:自始至终的行动方案(3)赢得函数(支付函数):一局对策结束时,每个局中人的“得失”是全体局中人所取定的一组策略的函数。3.对策模型的分类§2.矩阵对策(MatrixGames)

1.定义:矩阵对策即二人有限零和对策,指参加对策的局中人只有两个,每个局中人都有有限个可供选择的策略。而且在任一局势中,两个局中人的得失之和总等于零(一个局中人的所得即为另一个局中人的所失)。局中人的利益是冲突的,也称为对抗对策。如田忌赛马。

第十章对策论

例1:配钱币游戏两个局中人1和2各出示一枚钱币,在不让对方看见的情况下,将钱币放在桌上,若两个钱币都呈正面或都呈反面,则局中人1得1分,局中人2得-1分。若两个钱币一正一反,则局中人2得1分,局中人1得-1分。则局中人1的得分可用下表表示:

局中人2局中人11(正)2(反)1(正)1-12(反)-11A=例2:“石头、剪刀、布”游戏局中人2局中人11(石头)2(剪刀)3(布)1(石头)01-12(剪刀)-1013(布)1-10A=例3:局中人1从p=0,1,2,3四个数中选出一个数,局中人2在不知道局中人1出什么数的情况下从q=0,1,2三个数中选出一个数。局中人1得到的支付由下函数确定:

P=p(q-p)+q(q+p)

或P=q2-p2+2pq

局中人2q局中人1p01200141-1272-4183-9-27A=2.数学模型

设局中人1有m个纯策略α1,α2,…,αm,记集合为S1={α1,α2,…,αm};同样,局中人2有n个纯策略β1,β2,…,βn

,集合为S2={β1,β2,…,βn}局中人1的赢得矩阵为:

对策模型记为G={S1,S2,A}

在田忌赛马例子中

S1={(上、中、下),(上、下、中),(中、上、下),(中、下、上),(下、中、上),(下、上、中)}

S2={(上、中、下),(上、下、中),(中、上、下),(中、下、上),(下、中、上),(下、上、中)}齐王的赢得矩阵为A,田忌的支付(赢得)矩阵为-A3.最优纯策略例4

对于一个矩阵对策G={S1,S2,A},其中S1={α1,α2,α3,α4},S2={β1,β2,β3}求双方的最优策略。解:由A可以看出,局中人I的最大赢得是16,就是说局中人I十分希望自己取得16,就会出α3加入博弈。然而,局中人Ⅱ也在考虑,因为局中人I有出α3的心理状态,于是局中人Ⅱ就想出β3进行博弈,这样不仅不能使I得到16,反而要输9(即赢得-9)。同样,I也会这样想,Ⅱ有出β3的心理状态,于是I就会出α2,结果Ⅱ不但得不到9,反而要输5。同样,如果I出α2,则Ⅱ会出β2,使I的赢得达到最小2。而对于I来说,如果Ⅱ出β2,I的最优策略仍然是α2,可获得最大赢得值2。α2和β2分别是双方的最优策略,a22=2称为矩阵博弈G的值。它是第2行中最小值,也正好是第2列中的最大值。

对于给定的G={S1,S2,A},局中人1希望支付值越大越好,局中人2希望支付值越小越好。局中人1可选择i,使他得到的支付不少于:局中人2可以选择j,保证他失去的支付不大于:容易证明:例1:配钱币游戏-1<1

局中人2局中人11(正)2(反)1(正)1-12(反)-11-1<1例2:“石头、剪刀、布”游戏局中人2局中人11(石头)2(剪刀)3(布)1(石头)01-12(剪刀)-1013(布)1-100=0例3:局中人1从p=0,1,2,3四个数中选出一个数,局中人2在不知道局中人1出什么数的情况下从q=0,1,2三个数中选出一个数。局中人1得到的支付由下支付函数确定:

P=p(q-p)+q(q+p)

或P=q2-p2+2pq

局中人2q局中人1p01200141-1272-4183-9-27田忌赛马:-1<3定义:一个矩阵对策,如果它的支付矩阵A的元素满足:

则称这个值v为对策的值。如果纯局势(i*,j*)使:则称(i*,j*)为对策G的鞍点(Saddlepoint),也称它是对策G在纯策略中的解,i*与j*分别为局中人1和局中人2的最优解。

即矩阵对策有两个性质:鞍点的可交换性,无差异性。定理:为对策G的鞍点的充要条件是对于任意的i,j,有:如:定理:若和都是矩阵对策A的鞍点,则和也都是它的鞍点,且在鞍点处的值都相等。即:即为该列的最大元素及该行的最小元素.

例5:某单位在秋天要决定冬季取暖用煤贮量问题,在正常的冬季气温下要消耗15吨,但在较暖与较冷的冬季需要10吨和20吨,假定煤的价格随着冬季寒冷程度而有所变动,设在较暖的、正常的、较冷的冬季气温下分别为每吨100元,150元,200元,又设在秋季煤价是每吨100元,在没有关于当年冬季准确的气象预报条件下,秋季贮煤多少吨才较合理?解:把采购员当作局中人I,他有三个策略:在秋天时买10吨、15吨与20吨,分别记为a1,a2,a3。把大自然看作局中人Ⅱ,(可以当作理智的局中人来处理),大自然(冬季气温)有三种策略:出现较暖的、正常的与较冷的冬季,分别记为b1,b2,b3。

故对策的解为(3,3),即秋季贮煤20吨合理。现在把该单位冬季取暖用煤实际费用(即秋季购煤时的用费、与冬季不够时再补购的费用总和)作为局中人I的赢得,得例5:……,在正常的冬季气温下要消耗15吨,但在较暖与较冷的冬季需要10吨和20吨,假定煤的价格随着冬季寒冷程度而有所变动,设在较暖的、正常的、较冷的冬季气温下分别为每吨100元,150元,200元,又设在秋季煤价是每吨100元……例6:甲、乙双方谈判签订一项合同,甲方的“要价”是25万元,而乙方的“出价”是20万元,谈判陷于僵局。为打破僵局,双方约定,再各报一个价。以下述价格成交:谁让步多,取谁出的价;如果双方让步相同,则取双方报价的中间值。问甲、乙双方应如何报价?最后的成交价是多少?

解:显然,甲、乙双方的报价都在20万元到25万元之间。不妨取整数值,甲、乙各有6个策略:报价20,21,…,25(单位:万元)。由约定知,甲的支付矩阵可用表所示。

(23,22)是鞍点。甲方的最优纯策略是要价23万元,乙方的最优纯策略是出价22万元,双方的让步相同(甲方降低2万元,乙方提高2万元),最后的成交价是22.5万元。4.混合策略

一般情况下,二人零和对策有:不存在纯策略意义上的最优解,考虑用多大概率选取各个纯策略?

定义1:对于支付矩阵A=(aij)mxn,局中人1的一个混合策略就是一组数xi≥0,i=1,2,…,m,满足:;局中人2的一个混合策略就是一组数yj≥0,j=1,2,…,n,满足:设X=(x1,x2,…,xm)和Y=(y1,y2,…,yn)分别为局中人1和局中人2的混合策略,则局中人1选择策略i,局中人2选择策略j,并且支付为aij的概率为xiyj

,局中人1的期望支付为:定义2:称数学期望E(X,Y)=

为局中人1的赢得,-E(X,Y)为局中人2的赢得,而(X,Y)称为混合局势。定义3:设S1*是满足xi≥0的一切X=(x1,x2,…,xm)的混合策略集,S2*是满足yi≥0的一切Y=(y1,y2,…,yn)的混合策略集,即S1*={X},S2*={Y},对于给定的一个对策G={S1,S2,A},称G*={S1*,S2*,E}为G的混合扩充(拓展)。(P298,无须区别)对于局中人2,若采取混合策略Y,则可能支出:因此他应选取Y,使支出最小:对于局中人1,若采取混合策略X,则只能希望赢得:因此他应选取X,使赢得最大:定理1:对于给定的对策G,有:

定理2:(最小最大值定理、对策论基本定理)对于一切矩阵对策,都有:

定义4:设G*={S1*,S2*,E}为对策G={S1,S2,A}的混合扩充,如果有混合局势(X*,Y*),使:则称V为对策G的值,而混合局势称为G在混合策略下的解。而X*与Y*分别称为局中人1和局中人2的最优解。定理3:若矩阵对策G的值为V,则以下两组不等式的解就是局中人1和局中人2的最优策略:定理4:设混合局势(X*,Y*)是矩阵对策G的最优解,记对策值V=E(X*,Y*),则:(1)若(2)若

(3)若(4)若

第十章对策论

§3.矩阵对策的求解1.特殊情况下的解

1).如果有鞍点,则鞍点就是最优解。2).如果没有鞍点,但事先知道均不为零,则可将两组不等式化成线性方程组来求解。例1:设

解:无鞍点,混合策略的各分量不为零,求最优混合策略.3).可降低矩阵阶数求解

例2:给定一个矩阵对策G={S1,S2,A},求对策G的值与解。其中若所给矩阵中i行的各个元素比j行各元素小,则对局中人1来说策略i明显不如策略j,称纯策略j优超纯策略i;同理,若i列的元素比j列的对应元素大,则对局中人2来说策略j优超策略i。而明显不利策略出现的概率为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论