第03讲随机决策理论与方法-2.ppt_第1页
第03讲随机决策理论与方法-2.ppt_第2页
第03讲随机决策理论与方法-2.ppt_第3页
第03讲随机决策理论与方法-2.ppt_第4页
第03讲随机决策理论与方法-2.ppt_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、决策理论与方法(3) 随机决策理论与方法(2), 2 2020 .,随机决策理论与方法,1、主观概率 2、效用函数 3、决策准则 4、贝叶斯决策分析 5、多属性决策分析 6、多目标决策分析 7、序贯决策分析,多属性决策分析多目标决策,什么是多目标决策问题?(例如购买衣服时,款式、价格、颜色、质量等可能都是决策目标)。多目标决策问题的特点: 决策问题的目标多于一个; 多个目标间不可公度(non-commensurable),即各目标没有统一的衡量标准,难以比较; 各目标之间存在矛盾。 一般将决策变量离散、决策方案有限的多目标决策问题称为多属性(Multi-attribute)决策问题;而将决策变

2、量连续、有无限决策方案的多目标决策问题称为多目标(Multi-objective)决策问题。两者又可以统称为多准则(Multi-criterion)决策问题。,多属性决策分析相关术语,属性(Attribute):备选方案的特征、品质或性能参数 (如描述服装的款式、颜色、布料、质量、价格) ,也称为指标。 指标体系(Index Systems):一系列互相联系、互相补充的指标所组成的统一整体。指标体系往往由多层组成(习惯上称为一级指标、二级指标等),层次结构分为树状结构和网状结构,其中以树状结构最常用。,一级指标,总目标,二级指标,三级指标,多属性决策分析相关术语,目标(Objective):决

3、策人的愿望或决策人所希望达到的、努力的方向(如物美价廉)。在多目标决策中,目标是求极值的对象,是需要优化的函数式。 目的(Goal):在特定时间、空间状态下,决策人的期望,是目标的具体数值表现。目标和目的常混用。 准则(Criterion):判断的标准或度量事物价值的原则及检验事物合意性的规则,兼指属性和目标。,多属性决策分析求解过程,多属性决策分析目标与属性,在多目标决策中,决策目标常用目标集、目标递阶分层结构以及属性集描述; 目标递阶分层结构的最下层目标要用一个或多个属性来描述;不同的方案对应的各属性值存在差异,也就导致目标实现的差异,因此可借此来评价方案的优劣; 替代属性:某些目标无法用

4、属性值直接度量时,需要使用替代属性对目标进行度量。如师资队伍的质量可以用学历结构、职称结构、专业结构、科研能力等替代属性来衡量。(寻找“替代属性/替代变量”在科学研究中是非常重要的),多属性决策分析目标与属性,属性选择的要求: 每个属性是可测和可理解的; 属性集是最小完备集:既要能够描述决策问题的所有(重要)方面,又不能有冗余; 属性的测量值是可运算的; 属性集内的各属性相互独立、可分解。 但在实际决策中,上述要求很难达到,这也正是我们开展决策理论与方法研究的动力源。,多属性决策分析目标与属性,例:某流域水资源项目建设目标(指标体系)及属性,多属性决策分析问题的符号表示,MA= X表示方案集,

5、X=x1, x2, , xm A表示属性集,A=a1,a2,an 表示状态集,=1, 2, , k V表示值集,所有可能取值的集合 :V,分布函数,确定各状态发生的可能性 f:XAV,目标函数,确定各方案对应的属性值,多属性决策分析问题的符号表示,例:给定自然状态的多属性决策问题,多属性决策分析属性值预处理,剩下的问题是我们如何评价方案的优劣。 属性值预处理的目标是规范化各属性值,使其能够真正体现方案优劣的实际价值。 属性值类型: 效益型指标:属性值越大越好; 成本型指标:属性值越小越好; 中性指标:属性值取某一个恰当的值最优,过大、过小都不合适。,多属性决策分析属性值预处理,预处理主要有两项

6、任务: 非量纲化:通过某种方法消除量纲的选用对决策或评价结果的影响。 归一化:不同属性的属性值取值范围存在很大差别,为了真实反映各属性值的价值,需要将属性值统一变换到0,1区间上以消除属性取值范围的差异对决策或评价结果的影响。,多属性决策分析属性值预处理,设fi(a)为方案i的a属性值,记fmax=max(fi(a), fmin=min(fi(a) 线性变换 效益型。变换z:fi(a)zi(a)定义为:zi(a)=fi(a)/fmax; 成本型。变换z:fi(a)zi(a)定义为:zi(a)=1-fi(a)/fmax; 或者变换z:fi(a)zi(a)定义为:zi(a)=fmin/fi(a)。

7、 标准0-1变换 效益型。 zi(a)= (fi(a)-fmin)/(fmax-fmin); 成本型。 zi(a)= (fmax-fi(a)/(fmax-fmin)。 向量规范化:zi(a)=fi(a)/(ifin(a)1/n(n可以取1或2)。,多属性决策分析属性值预处理,线性变换,标准0-1变换,向量变换,多属性决策分析属性值预处理,中性属性(最优值为给定区间)规范化策略,zi(a)= (1)fi(a)f0,0 (2)f0fi(a)f1,1-(f1-fi(a)/(f1-f0) (3)f1fi(a)f2,1 (4)f2fi(a)f0,1-(fi(a)-f2)/(f0-f2) (5)fi(a)

8、f0,0,多属性决策分析属性值预处理,多属性决策分析属性值预处理,异常(outlier)处理。对同一个属性a,若各方案的值差异极大或某方案的值相对其他方案出现明显的偏离,如按一般方法规范化,在评价时该属性的影响将被不恰当地放大(如前例中的论著一项,方案5的值是14,显著大于其他4个方案)。因此需要采用特别方法处理,处理方法有很多,下面介绍一种常用方法。 设定一个转换后的期望值(均值):M(0.50.75) 作变换z:fi(a)zi(a),zi(a)=(fi(a)-E)(1-M)/(fmax-E)+M 其中E为当前属性值的均值;fmax为当前属性值的最大值,多属性决策分析属性值预处理,多属性决策

9、分析属性值预处理,专家评分范围差异的处理。当一组专家对若干方案进行评价时,由于习惯不同,各自的评分范围可能存在较大差异,需要进行规范化处理。 映射区间定义:M0,M* 定义映射z:fi(a)zi(a),zi(a)=M0+(M*-M0)(fi(a)-fmin)/(fmax-fmin) 一般取M0=0,M*=1。对应标准0-1转换。,多属性决策分析属性值预处理,两个不同专家对方案1-5评价结果(百分制)如下表。,多属性决策分析权重确定,当决策者面对多个目标时,存在目标的重要性不同的问题,这就需要引入权(Weight)的概念加以解决。权是目标重要性的数量化表示,它的作用有: 决策人对目标的重视程度;

10、 各目标属性值的差异程度; 各目标属性值的可靠程度。 权重确定方法:两两比较法。对不同目标的重要性进行两两比较,形成一个判断矩阵。但判断矩阵存在两方面的一致性问题:(1)a1/a2=3, a2/a3=2 a1/a3=6? (2)不同专家间的一致性问题a2(1)/a3(1)=2 a2(2)/a3(2)=2?,多属性决策分析权重确定,判断矩阵的构造 假设属性ai的权记为wi,则wij=wi/wj为判断矩阵A的第i行第j列元素。A=wijnn 在实际决策中,wi是未知的,需要借助专家的评价。我们用专家的评价结果aij=ai/aj代替wij。aij=ai/aj的取值如下: =1:同等重要 =3:目标i

11、略重要于目标j =5:目标i比目标j重要(相当重要) =7:目标i比目标j明显重要 =9:目标i相对目标j绝对重要 =2,4,6,8:上述两个相邻判断的中间值,多属性决策分析权重确定,最小二乘法确定权重。由于用aij代替wij,两者之间可能存在误差ij=(wjaij-wi)。利用最小二乘法,得到下列二次规划方程: Min ijij2=ij(wjaij-wi)2 St: iwi=1,wi0(i=1,2,n) 利用拉格朗日法可将该优化问题转为求解下列方程组:,多属性决策分析权重确定,Matlab求解: Function weight(A) D=diag(diag(A*A)+1)-A-A; n=le

12、ngth(A); Row1=ones(n,1); Col1=ones(1,n); D=D Row1;Col1 0; B=zeros(n,1); B=B;1; W=inv(D)*B,多属性决策分析权重确定,特征向量法:因为AW=nW,n为A的最大特征值。当判断矩阵A的估计存在误差时,则A中元素值的变化带来最大特征值的变化,记此时的最大特征值为max,则AW=maxW,W为A关于最大特征值max的特征向量,对W进行归一化处理即得到权重向量。 Matlab函数:V,D=eig(A),返回的V为特征向量矩阵;D为特征值矩阵。,多属性决策分析权重确定,Satty近似算法: A中每行元素连乘并开n次方,记

13、为wi*; 求权重:wi=wi*/iwi*; A中每列元素求和:Sj=iaij; 计算最大特征值max=iwiSi=sum(AW)。 判断矩阵A的一致性检验 一致性指标CI(Consistency Index):CI=|max-n|/(n-1) 随机指标RI(Random Index):用随机方法构造判断矩阵,经过500次以上的重复计算,求出一致性指标并加以平均得到。 一致性比率CR(Consistency Ratio):CR=CI/RI。CR0.1,一致性好;CR0.1,一致性差。,多属性决策分析权重确定,例:设判断矩阵为A ,求权重。,多属性决策分析决策方法,一般加权和法 将属性表值cij

14、规范化,得zij;i=1m; j=1n。 确定各指标的权重系数,wj;j=1n。 计算各方案的综合指标Ci=jwjzij。 最后根据Ci大小排出各方案的优劣。 一般加权和法的使用条件(实际上很难满足) 指标体系为树状结构; 每个属性的边际价值是线性的(优劣与属性值大小成正比);任意两个指标的相互价值都是独立的; 属性间的完全可补偿性:一个方案的某属性无论多差都可用其他属性来补偿(一个方案优于另一个方案并不要求在所有属性上都优)。,多属性决策分析决策方法,AHP法(层次分析法,Satty):在实际决策中并不是所有指标的值都是容易测量的,但不同方案的这些指标的优劣性是可以比较的。Satty提出了一

15、种层次分析法(Analytic Hierarchy Process)来解决此类问题。 构造关于指标权重的判断矩阵,求出各指标的权重wj,并检验判断矩阵的一致性; 构造每个方案关于各指标优劣性的判断矩阵,从而得到各方案关于该指标的规范化属性值zij;(如果方案关于该指标的值是可测的,则不需要构造此指标的判断矩阵) 计算各方案的综合指标Ci=jwjzij。 根据Ci的优劣确定方案的优劣。,多属性决策分析决策方法,根据下图所描述的指标体系,如果完全使用AHP法进行决策,需要构造多少个判断矩阵?( ),16,多属性决策分析决策方法,加权和与加权积的综合决策法:加权和要求指标具有线性可加(可补偿)性,但

16、在实际决策中有些指标之间是不可补偿的,此时方案关于这类指标的优劣可用加权积法。例如,设方案的优劣可由四个一级指标A, B, C, D评判,其中A, B满足可加性,C, D满足可加性,但A、B与C、D间不满足可加性,则可用下面的加权和与加权积的综合决策法确定各方案的优劣:(wAzA+wBzB)(wCzC+wDzD),多属性决策分析决策方法,逼近理想解排序方法(Technique for Order Preference by Similarity to Ideal Solution, TOPSIS):借助多属性问题的理想解和负理想解给方案集X中的各方案排序。 在多属性决策中,每个属性都有一个最优

17、值,也有一个最差值。取所有属性的最优值构造一个虚拟方案x*,同时取所有属性的最差值构造另一个虚拟方案x0,则称x*为理想解,x0为负理想解。 TOPSIS法就是将各实际方案与理想解和负理想解进行比较,离理想解越近、离负理想解越远的方案越好。,多属性决策分析决策方法,TOPSIS法求解步骤 用向量规范法求得规范决策矩阵:zij=cij/(icij)1/2 确定各属性的权重系数W=w1,w2,wn 确定理想解和负理想解: zj*=maxi(zij)(效益型属性)或mini(zij)(成本型属性) zj0=mini(zij)(效益型属性)或maxi(zij)(成本型属性) 计算各方案到理想解和负理想

18、解的加权距离 di*=(j(wjzij-wjzj*)2)1/2 di0=(j(wjzij-wjzj0)2)1/2 计算综合评价指标Ci=di0/(di0+di*) 按Ci的大小对各方案排序,Ci越大方案越优,否则越劣。,多属性决策分析决策方法,多属性决策分析决策方法,TOPSIS法的边界问题,x*,x0,随机决策理论与方法,1、主观概率 2、效用函数 3、决策准则 4、贝叶斯决策分析 5、多属性决策分析 6、多目标决策分析 7、序贯决策分析,多目标决策分析问题描述,多目标决策问题是指决策变量连续、存在无数决策方案的多准则决策问题。其一般形式为: 决策规则:DRf1(x), f2(x), fn(

19、x) x表示一种方案,且xX=xRN|gk(x)0, k=1,2,m, x0 问题共包含n个目标,每个目标可能受N个属性影响,所有属性必须满足一定的约束条件(共计m+N个约束)。 多目标决策分析就是根据给定的决策规则(体现了决策人的偏好)从可行方案集X中找出最佳调和解xC。,多目标决策分析决策方法,多目标决策问题主要使用多目标规划方法进行求解。 DEA方法(Data Envelopment Analysis):在多目标决策分析中,除多目标优化问题外,还有一类多目标评价问题:对于多个同质的管理系统(决策单元),如果已知各系统投入和产出,如何评价这些系统的优劣,或者说相对有效性? 问题描述:设有n

20、个决策单元,每个决策单元都有m种资源投入,第j个决策单元第i种投入指标的投入量记为xij0(已知);每个决策单元均有p种产出,第j个决策单元第r种产出量记为yrj0(已知)。vi 、ur分别表示第i种投入指标和第r种产出指标的权系数,需要通过建模得到。如何评价这n个决策单元的相对有效性?,多目标决策分析决策方法,C2R(Charnes, Cooper, Rhodes)模型(第一个DEA模型) 对每一个决策单元j,都定义一个效率评价指标: hj称为效率指标,可通过对权系数取值的选择使hj1。 评价第j0个决策单元有效性的C2R模型为:,多目标决策分析决策方法,模型转化:将分式规划转变成线性规划。

21、令 则分式规划转变为下列形式:,多目标决策分析决策方法,有效性分析: 若线性规划的最优解0,0满足条件 则决策单元j0为弱DEA有效。若00, 00也成立,则决策单元为DEA有效。,随机决策理论与方法,1、主观概率 2、效用函数 3、决策准则 4、贝叶斯决策分析 5、多属性决策分析 6、多目标决策分析 7、序贯决策分析,序贯决策分析问题描述,序贯决策是一类多阶段决策问题,前一阶段的决策结果对后一阶段决策直至最终决策产生影响,整个决策问题的求解需要采取多次行动才能完成。将贝叶斯决策分析方法应用于不同的决策阶段,并根据各阶段之间的关系可以获得多阶段决策问题的解。动态规划和马尔可夫决策是两类重要的多

22、阶段决策方法。,序贯决策分析多阶段决策,经过相互衔接、相互关联的若干阶段决策才能完成的决策任务称为多阶段决策。 决策分析的关键:划分决策阶段、确定各阶段状态变量、寻找各阶段之间的关系;采用从后向前的逆序归纳法进行决策分析。 决策方法:根据问题不同,可选用贝叶斯决策分析方法、多属性决策方法或多目标决策方法。,序贯决策分析贝叶斯方法,例:某公司计划购买一种新产品专利,购置费1万元。若购置了专利,可选择三种生产规模:大批量生产(a1),中批量生产(a2),小批量生产(a3)。市场销售状态为:畅销1,0.6;一般2,0.3;滞销3,0.1。根据历年资料统计分析,新产品进入市场的销售收益矩阵如左下表。为

23、了准确掌握市场动向,公司可投入0.5万元开展试销。根据统计表明,产品欢迎度和销售状态之间的关系如右下表。试帮助该企业做如下决策: 是否购买专利?(已知如果不购买专利,1万元的投资收益为1.1万元) 购买专利后是否试销? 如何确定该公司的批量生产计划?,序贯决策分析贝叶斯方法,解:这是一个三阶段决策问题。第一阶段确定是否购买专利,第二阶段确定是否试销,第三阶段确定批量生产计划。决策过程采取逆序归纳法,即先从第三阶段开始。 试销:计算后验概率及各批量生产计划的收益,得: 试销的期望收益为:0.44*3.406+0.39*2.620+0.17*1.53=2.7805,序贯决策分析贝叶斯方法,不试销:

24、 结论:,序贯决策分析Markov法,有一类序贯决策问题,其状态随着时间变化而随机变化,决策的任务就是根据当前状态预测其未来某一时刻的状态,如销售状态预测、股价预测等。下面介绍一种Markov决策方法分析求解此类问题。虽然Markov过程是很严格的,实际管理问题并不能总是满足其条件,但往往将其看作近似Markov过程也能得到很好的结果。,序贯决策分析Markov法,链及其状态集:设m为随机变量(如股价),称随机变量序列m|m=1,2,.为链,称由m的全体状态构成的有限集为该链的状态集(如上涨、持平、下跌),记为N=N1,N2,.,Nn。 Markov链:设链m|m=1,2,.,其状态为N=N1

25、,N2,.,Nn。若对于任意正整数k及i(1), i(2), . ,i(k), i(k+1)n,条件概率等式: pk+1=Ni(k+1)|1=Ni(1),.,k=Ni(k)=pk+1=Ni(k+1)|k=Ni(k) 成立,则称链m|m=1,2,.为Markov链。 说明:Markov链的特点是随机变量在第k+1时刻出现某状态的概率仅取决于其在第k时刻的状态,而与k时刻之前的任何时刻的状态无关,即无后效性。,序贯决策分析Markov法,例:如果股价状态(u:上涨;e:持平;d:下跌)的变化序列构成Markov链,则根据下列两个序列:udeedu, duddeu预测下一个交易日为上涨的概率相同。

26、齐次Markov链:设m|m=1,2,.,其状态为N=N1,N2,.,Nn。对于任意正整数i,j,以及s,t,k,条件概率等式 ps+k=Nj|s=Ni=pt+k=Nj|t=Ni 成立,则称此Markov链为齐次Markov链。,序贯决策分析Markov法,状态转移概率及转移概率矩阵:设齐次Markov链m|m=1,2,.,状态为N=N1,N2,.,Nn。称pij=ps+1=Nj|s=Ni为随机变量从状态Ni到Nj的转移概率(即s时刻为Ni状态时,s+1时刻为Nj状态的概率)。称对应的矩阵P=(pij)nn为转移概率矩阵。显然有:pij0; jpij=1。 k步转移概率及k步转移概率矩阵:设齐

27、次Markov链m|m=1,2,.,其状态为N=N1,N2,.,Nn。称pij(k)=ps+k=Nj|s=Ni为随机变量从状态Ni经k步转移到Nj的转移概率(即s时刻为Ni状态时,s+k时刻为Nj状态的概率)。称对应的矩阵P(k)=(pij(k)nn为k步转移概率矩阵。显然有:pij(k)0; jpij(k)=1。 可以证明:P(k)=Pk,序贯决策分析Markov法,基于Markov过程的预测:设随机变量遵从齐次Markov过程,状态转移概率矩阵为P,且第k时刻随机变量的各状态N1,N2,.,Nn的概率分布为u(k)=(u1(k), u2(k), . ,un(k)T,则第s时刻(sk)随机变

28、量的各状态的概率分布为: u(s)=(Ps-k)Tu(k) 特别地,若k=0(初始状态),则有u(s)=(Ps)Tu(0),序贯决策分析Markov法,稳定状态概率:设有齐次Markov链m|m=1,2,.,状态为N=N1,N2,.,Nn。若对一切状态Ni,存在不依赖于i的常数j,对于状态Nj,恒有:limkpij(k)=j,则称该齐次Markov链具有遍历性。j称为状态Nj的稳定状态概率;=(1, 2, ., n)T称为稳定状态概率向量。 若转移矩阵P为正规矩阵(即存在正整数k使得Pk0),则对应的Markov链具有遍历性,且该Markov链的随机变量各状态最终收敛于某个与初始状态完全无关的稳定状态,稳定状态概率向量满足:PT=。,序贯决策分析Markov法,例:某厂家生产商品A,为了与同类产品B、C的竞争,厂家可采用下列经营策略: (1)发放有奖债券;(2)投放广告;(3)优质售后服务。统计表明,三种经营策略带来的市场

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论