第03讲随机决策理论与方法-2(1).ppt

上传人：努*** IP属地：江西上传时间：2019-12-27 格式：PPT 页数：58 大小：512KB 积分：9.6 举报 版权申诉

已阅读5页，还剩53页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

决策理论与方法 3 随机决策理论与方法 2 合肥工业大学管理学院2019年12月27日 2019年12月27日11时35分决策理论与方法随机决策理论与方法 2 61 随机决策理论与方法 1 主观概率2 效用函数3 决策准则4 贝叶斯决策分析5 多属性决策分析6 多目标决策分析7 序贯决策分析 2019年12月27日11时35分决策理论与方法随机决策理论与方法 3 61 多属性决策分析多目标决策什么是多目标决策问题例如购买衣服时款式价格颜色质量等可能都是决策目标多目标决策问题的特点决策问题的目标多于一个多个目标间不可公度 non commensurable 即各目标没有统一的衡量标准难以比较各目标之间存在矛盾一般将决策变量离散决策方案有限的多目标决策问题称为多属性 Multi attribute 决策问题而将决策变量连续有无限决策方案的多目标决策问题称为多目标 Multi objective 决策问题两者又可以统称为多准则 Multi criterion 决策问题 2019年12月27日11时35分决策理论与方法随机决策理论与方法 4 61 多属性决策分析相关术语属性 Attribute 备选方案的特征品质或性能参数如描述服装的款式颜色布料质量价格也称为指标指标体系 IndexSystems 一系列互相联系互相补充的指标所组成的统一整体指标体系往往由多层组成习惯上称为一级指标二级指标等层次结构分为树状结构和网状结构其中以树状结构最常用一级指标总目标二级指标三级指标 2019年12月27日11时35分决策理论与方法随机决策理论与方法 5 61 多属性决策分析相关术语目标 Objective 决策人的愿望或决策人所希望达到的努力的方向如物美价廉在多目标决策中目标是求极值的对象是需要优化的函数式目的 Goal 在特定时间空间状态下决策人的期望是目标的具体数值表现目标和目的常混用准则 Criterion 判断的标准或度量事物价值的原则及检验事物合意性的规则兼指属性和目标 2019年12月27日11时35分决策理论与方法随机决策理论与方法 6 61 多属性决策分析求解过程 2019年12月27日11时35分决策理论与方法随机决策理论与方法 7 61 多属性决策分析目标与属性在多目标决策中决策目标常用目标集目标递阶分层结构以及属性集描述目标递阶分层结构的最下层目标要用一个或多个属性来描述不同的方案对应的各属性值存在差异也就导致目标实现的差异因此可借此来评价方案的优劣替代属性某些目标无法用属性值直接度量时需要使用替代属性对目标进行度量如师资队伍的质量可以用学历结构职称结构专业结构科研能力等替代属性来衡量寻找替代属性替代变量在科学研究中是非常重要的 2019年12月27日11时35分决策理论与方法随机决策理论与方法 8 61 多属性决策分析目标与属性属性选择的要求每个属性是可测和可理解的属性集是最小完备集既要能够描述决策问题的所有重要方面又不能有冗余属性的测量值是可运算的属性集内的各属性相互独立可分解但在实际决策中上述要求很难达到这也正是我们开展决策理论与方法研究的动力源 2019年12月27日11时35分决策理论与方法随机决策理论与方法 9 61 多属性决策分析目标与属性例某流域水资源项目建设目标指标体系及属性 2019年12月27日11时35分决策理论与方法随机决策理论与方法 10 61 多属性决策分析问题的符号表示 MA X表示方案集 X x1 x2 xm A表示属性集 A a1 a2 an 表示状态集 1 2 k V表示值集所有可能取值的集合 V 分布函数确定各状态发生的可能性f X A V 目标函数确定各方案对应的属性值 2019年12月27日11时35分决策理论与方法随机决策理论与方法 11 61 多属性决策分析问题的符号表示例给定自然状态的多属性决策问题 2019年12月27日11时35分决策理论与方法随机决策理论与方法 12 61 多属性决策分析属性值预处理剩下的问题是我们如何评价方案的优劣属性值预处理的目标是规范化各属性值使其能够真正体现方案优劣的实际价值属性值类型效益型指标属性值越大越好成本型指标属性值越小越好中性指标属性值取某一个恰当的值最优过大过小都不合适 2019年12月27日11时35分决策理论与方法随机决策理论与方法 13 61 多属性决策分析属性值预处理预处理主要有两项任务非量纲化通过某种方法消除量纲的选用对决策或评价结果的影响归一化不同属性的属性值取值范围存在很大差别为了真实反映各属性值的价值需要将属性值统一变换到 0 1 区间上以消除属性取值范围的差异对决策或评价结果的影响 2019年12月27日11时35分决策理论与方法随机决策理论与方法 14 61 多属性决策分析属性值预处理设fi a 为方案i的a属性值记fmax max fi a fmin min fi a 线性变换效益型变换z fi a zi a 定义为 zi a fi a fmax 成本型变换z fi a zi a 定义为 zi a 1 fi a fmax 或者变换z fi a zi a 定义为 zi a fmin fi a 标准0 1变换效益型 zi a fi a fmin fmax fmin 成本型 zi a fmax fi a fmax fmin 向量规范化 zi a fi a ifin a 1 n n可以取1或2 2019年12月27日11时35分决策理论与方法随机决策理论与方法 15 61 多属性决策分析属性值预处理线性变换标准0 1变换向量变换 2019年12月27日11时35分决策理论与方法随机决策理论与方法 16 61 多属性决策分析属性值预处理中性属性最优值为给定区间规范化策略 zi a 1 fi a f0 0 2 f0 fi a f1 1 f1 fi a f1 f0 3 f1 fi a f2 1 4 f2 fi a f0 1 fi a f2 f0 f2 5 fi a f0 0 2019年12月27日11时35分决策理论与方法随机决策理论与方法 17 61 多属性决策分析属性值预处理 2019年12月27日11时35分决策理论与方法随机决策理论与方法 18 61 多属性决策分析属性值预处理异常 outlier 处理对同一个属性a 若各方案的值差异极大或某方案的值相对其他方案出现明显的偏离如按一般方法规范化在评价时该属性的影响将被不恰当地放大如前例中的论著一项方案5的值是14 显著大于其他4个方案因此需要采用特别方法处理处理方法有很多下面介绍一种常用方法设定一个转换后的期望值均值 M 0 5 0 75 作变换z fi a zi a zi a fi a E 1 M fmax E M其中E为当前属性值的均值 fmax为当前属性值的最大值 2019年12月27日11时35分决策理论与方法随机决策理论与方法 19 61 多属性决策分析属性值预处理 2019年12月27日11时35分决策理论与方法随机决策理论与方法 20 61 多属性决策分析属性值预处理专家评分范围差异的处理当一组专家对若干方案进行评价时由于习惯不同各自的评分范围可能存在较大差异需要进行规范化处理映射区间定义 M0 M 定义映射z fi a zi a zi a M0 M M0 fi a fmin fmax fmin 一般取M0 0 M 1 对应标准0 1转换 2019年12月27日11时35分决策理论与方法随机决策理论与方法 21 61 多属性决策分析属性值预处理两个不同专家对方案1 5评价结果百分制如下表 2019年12月27日11时35分决策理论与方法随机决策理论与方法 22 61 多属性决策分析权重确定当决策者面对多个目标时存在目标的重要性不同的问题这就需要引入权 Weight 的概念加以解决权是目标重要性的数量化表示它的作用有决策人对目标的重视程度各目标属性值的差异程度各目标属性值的可靠程度权重确定方法两两比较法对不同目标的重要性进行两两比较形成一个判断矩阵但判断矩阵存在两方面的一致性问题 1 a1 a2 3 a2 a3 2 a1 a3 6 2 不同专家间的一致性问题a2 1 a3 1 2 a2 2 a3 2 2 2019年12月27日11时35分决策理论与方法随机决策理论与方法 23 61 多属性决策分析权重确定判断矩阵的构造假设属性ai的权记为wi 则wij wi wj为判断矩阵A的第i行第j列元素 A wij n n在实际决策中 wi是未知的需要借助专家的评价我们用专家的评价结果aij ai aj代替wij aij ai aj的取值如下 1 同等重要 3 目标i略重要于目标j 5 目标i比目标j重要相当重要 7 目标i比目标j明显重要 9 目标i相对目标j绝对重要 2 4 6 8 上述两个相邻判断的中间值 2019年12月27日11时35分决策理论与方法随机决策理论与方法 24 61 多属性决策分析权重确定最小二乘法确定权重由于用aij代替wij 两者之间可能存在误差 ij wjaij wi 利用最小二乘法得到下列二次规划方程 Min i j ij2 i j wjaij wi 2St iwi 1 wi 0 i 1 2 n 利用拉格朗日法可将该优化问题转为求解下列方程组 2019年12月27日11时35分决策理论与方法随机决策理论与方法 25 61 多属性决策分析权重确定 Matlab求解 Functionweight A D diag diag A A 1 A A n length A Row1 ones n 1 Col1 ones 1 n D DRow1 Col10 B zeros n 1 B B 1 W inv D B 2019年12月27日11时35分决策理论与方法随机决策理论与方法 26 61 多属性决策分析权重确定特征向量法因为AW nW n为A的最大特征值当判断矩阵A的估计存在误差时则A中元素值的变化带来最大特征值的变化记此时的最大特征值为 max 则AW maxW W为A关于最大特征值 max的特征向量对W进行归一化处理即得到权重向量 Matlab函数 V D eig A 返回的V为特征向量矩阵 D为特征值矩阵 2019年12月27日11时35分决策理论与方法随机决策理论与方法 27 61 多属性决策分析权重确定 Satty近似算法 A中每行元素连乘并开n次方记为wi 求权重 wi wi iwi A中每列元素求和 Sj iaij 计算最大特征值 max iwiSi sum AW 判断矩阵A的一致性检验一致性指标CI ConsistencyIndex CI max n n 1 随机指标RI RandomIndex 用随机方法构造判断矩阵经过500次以上的重复计算求出一致性指标并加以平均得到一致性比率CR ConsistencyRatio CR CI RI CR 0 1 一致性好 CR 0 1 一致性差 2019年12月27日11时35分决策理论与方法随机决策理论与方法 28 61 多属性决策分析权重确定例设判断矩阵为A 求权重 2019年12月27日11时35分决策理论与方法随机决策理论与方法 29 61 多属性决策分析决策方法一般加权和法将属性表值cij规范化得zij i 1 m j 1 n 确定各指标的权重系数 wj j 1 n 计算各方案的综合指标Ci jwjzij 最后根据Ci大小排出各方案的优劣一般加权和法的使用条件实际上很难满足指标体系为树状结构每个属性的边际价值是线性的优劣与属性值大小成正比任意两个指标的相互价值都是独立的属性间的完全可补偿性一个方案的某属性无论多差都可用其他属性来补偿一个方案优于另一个方案并不要求在所有属性上都优 2019年12月27日11时35分决策理论与方法随机决策理论与方法 30 61 多属性决策分析决策方法 AHP法层次分析法 Satty 在实际决策中并不是所有指标的值都是容易测量的但不同方案的这些指标的优劣性是可以比较的 Satty提出了一种层次分析法 AnalyticHierarchyProcess 来解决此类问题构造关于指标权重的判断矩阵求出各指标的权重wj 并检验判断矩阵的一致性构造每个方案关于各指标优劣性的判断矩阵从而得到各方案关于该指标的规范化属性值zij 如果方案关于该指标的值是可测的则不需要构造此指标的判断矩阵计算各方案的综合指标Ci jwjzij 根据Ci的优劣确定方案的优劣 2019年12月27日11时35分决策理论与方法随机决策理论与方法 31 61 多属性决策分析决策方法根据下图所描述的指标体系如果完全使用AHP法进行决策需要构造多少个判断矩阵 16 2019年12月27日11时35分决策理论与方法随机决策理论与方法 32 61 多属性决策分析决策方法加权和与加权积的综合决策法加权和要求指标具有线性可加可补偿性但在实际决策中有些指标之间是不可补偿的此时方案关于这类指标的优劣可用加权积法例如设方案的优劣可由四个一级指标A B C D评判其中A B满足可加性 C D满足可加性但A B与C D间不满足可加性则可用下面的加权和与加权积的综合决策法确定各方案的优劣 wAzA wBzB wCzC wDzD 2019年12月27日11时35分决策理论与方法随机决策理论与方法 33 61 多属性决策分析决策方法逼近理想解排序方法 TechniqueforOrderPreferencebySimilaritytoIdealSolution TOPSIS 借助多属性问题的理想解和负理想解给方案集X中的各方案排序在多属性决策中每个属性都有一个最优值也有一个最差值取所有属性的最优值构造一个虚拟方案x 同时取所有属性的最差值构造另一个虚拟方案x0 则称x 为理想解 x0为负理想解 TOPSIS法就是将各实际方案与理想解和负理想解进行比较离理想解越近离负理想解越远的方案越好 2019年12月27日11时35分决策理论与方法随机决策理论与方法 34 61 多属性决策分析决策方法 TOPSIS法求解步骤用向量规范法求得规范决策矩阵 zij cij icij 1 2确定各属性的权重系数W w1 w2 wn 确定理想解和负理想解 zj maxi zij 效益型属性或mini zij 成本型属性 zj0 mini zij 效益型属性或maxi zij 成本型属性计算各方案到理想解和负理想解的加权距离di j wjzij wjzj 2 1 2di0 j wjzij wjzj0 2 1 2计算综合评价指标Ci di0 di0 di 按Ci的大小对各方案排序 Ci越大方案越优否则越劣 2019年12月27日11时35分决策理论与方法随机决策理论与方法 35 61 多属性决策分析决策方法 2019年12月27日11时35分决策理论与方法随机决策理论与方法 36 61 多属性决策分析决策方法 TOPSIS法的边界问题 x x0 2019年12月27日11时35分决策理论与方法随机决策理论与方法 37 61 随机决策理论与方法 1 主观概率2 效用函数3 决策准则4 贝叶斯决策分析5 多属性决策分析6 多目标决策分析7 序贯决策分析 2019年12月27日11时35分决策理论与方法随机决策理论与方法 38 61 多目标决策分析问题描述多目标决策问题是指决策变量连续存在无数决策方案的多准则决策问题其一般形式为决策规则 DR f1 x f2 x fn x x表示一种方案且x X x RN gk x 0 k 1 2 m x 0 问题共包含n个目标每个目标可能受N个属性影响所有属性必须满足一定的约束条件共计m N个约束多目标决策分析就是根据给定的决策规则体现了决策人的偏好从可行方案集X中找出最佳调和解xC 2019年12月27日11时35分决策理论与方法随机决策理论与方法 39 61 多目标决策分析决策方法多目标决策问题主要使用多目标规划方法进行求解 DEA方法 DataEnvelopmentAnalysis 在多目标决策分析中除多目标优化问题外还有一类多目标评价问题对于多个同质的管理系统决策单元如果已知各系统投入和产出如何评价这些系统的优劣或者说相对有效性问题描述设有n个决策单元每个决策单元都有m种资源投入第j个决策单元第i种投入指标的投入量记为xij 0 已知每个决策单元均有p种产出第j个决策单元第r种产出量记为yrj 0 已知 vi ur分别表示第i种投入指标和第r种产出指标的权系数需要通过建模得到如何评价这n个决策单元的相对有效性 2019年12月27日11时35分决策理论与方法随机决策理论与方法 40 61 多目标决策分析决策方法 C2R Charnes Cooper Rhodes 模型第一个DEA模型对每一个决策单元j 都定义一个效率评价指标 hj称为效率指标可通过对权系数取值的选择使hj 1 评价第j0个决策单元有效性的C2R模型为 2019年12月27日11时35分决策理论与方法随机决策理论与方法 41 61 多目标决策分析决策方法模型转化将分式规划转变成线性规划令则分式规划转变为下列形式 2019年12月27日11时35分决策理论与方法随机决策理论与方法 42 61 多目标决策分析决策方法有效性分析若线性规划的最优解 0 0满足条件则决策单元j0为弱DEA有效若 0 0 0 0也成立则决策单元为DEA有效 2019年12月27日11时35分决策理论与方法随机决策理论与方法 43 61 随机决策理论与方法 1 主观概率2 效用函数3 决策准则4 贝叶斯决策分析5 多属性决策分析6 多目标决策分析7 序贯决策分析 2019年12月27日11时35分决策理论与方法随机决策理论与方法 44 61 序贯决策分析问题描述序贯决策是一类多阶段决策问题前一阶段的决策结果对后一阶段决策直至最终决策产生影响整个决策问题的求解需要采取多次行动才能完成将贝叶斯决策分析方法应用于不同的决策阶段并根据各阶段之间的关系可以获得多阶段决策问题的解动态规划和马尔可夫决策是两类重要的多阶段决策方法 2019年12月27日11时35分决策理论与方法随机决策理论与方法 45 61 序贯决策分析多阶段决策经过相互衔接相互关联的若干阶段决策才能完成的决策任务称为多阶段决策决策分析的关键划分决策阶段确定各阶段状态变量寻找各阶段之间的关系采用从后向前的逆序归纳法进行决策分析决策方法根据问题不同可选用贝叶斯决策分析方法多属性决策方法或多目标决策方法 2019年12月27日11时35分决策理论与方法随机决策理论与方法 46 61 序贯决策分析贝叶斯方法例某公司计划购买一种新产品专利购置费1万元若购置了专利可选择三种生产规模大批量生产 a1 中批量生产 a2 小批量生产 a3 市场销售状态为畅销 1 0 6 一般 2 0 3 滞销 3 0 1 根据历年资料统计分析新产品进入市场的销售收益矩阵如左下表为了准确掌握市场动向公司可投入0 5万元开展试销根据统计表明产品欢迎度和销售状态之间的关系如右下表试帮助该企业做如下决策是否购买专利已知如果不购买专利 1万元的投资收益为1 1万元购买专利后是否试销如何确定该公司的批量生产计划 2019年12月27日11时35分决策理论与方法随机决策理论与方法 47 61 序贯决策分析贝叶斯方法解这是一个三阶段决策问题第一阶段确定是否购买专利第二阶段确定是否试销第三阶段确定批量生产计划决策过程采取逆序归纳法即先从第三阶段开始试销计算后验概率及各批量生产计划的收益得试销的期望收益为 0 44 3 406 0 39 2 620 0 17 1 53 2 7805 2019年12月27日11时35分决策理论与方法随机决策理论与方法 48 61 序贯决策分析贝叶斯方法不试销结论 2019年12月27日11时35分决策理论与方法随机决策理论与方法 49 61 序贯决策分析 Markov法有一类序贯决策问题其状态随着时间变化而随机变化决策的任务就是根据当前状态预测其未来某一时刻的状态如销售状态预测股价预测等下面介绍一种Markov决策方法分析求解此类问题虽然Markov过程是很严格的实际管理问题并不能总是满足其条件但往往将其看作近似Markov过程也能得到很好的结果 2019年12月27日11时35分决策理论与方法随机决策理论与方法 50 61 序贯决策分析 Markov法链及其状态集设 m为随机变量如股价称随机变量序列 m m 1 2 为链称由 m的全体状态构成的有限集为该链的状态集如上涨持平下跌记为N N1 N2 Nn Markov链设链 m m 1 2 其状态为N N1 N2 Nn 若对于任意正整数k及i 1 i 2 i k i k 1 n 条件概率等式 p k 1 Ni k 1 1 Ni 1 k Ni k p k 1 Ni k 1 k Ni k 成立则称链 m m 1 2 为Markov链说明 Markov链的特点是随机变量在第k 1时刻出现某状态的概率仅取决于其在第k时刻的状态而与k时刻之前的任何时刻的状态无关即无后效性 2019年12月27日11时35分决策理论与方法随机决策理论与方法 51 61 序贯决策分析 Markov法例如果股价状态 u 上涨 e 持平 d 下跌的变化序列构成Markov链则根据下列两个序列 udeedu duddeu预测下一个交易日为上涨的概率相同齐次Markov链设 m m 1 2 其状态为N N1 N2 Nn 对于任意正整数i j 以及s t k 条件概率等式p s k Nj s Ni p t k Nj t Ni 成立则称此Markov链为齐次Markov链 2019年12月27日11时35分决策理论与方法随机决策理论与方法 52 61 序贯决策分析 Markov法状态转移概率及转移概率矩阵设齐次Markov链 m m 1 2 状态为N N1 N2 Nn 称pij p s 1 Nj s Ni 为随机变量从状态Ni到Nj的转移概率即s时刻为Ni状态时 s 1时刻为Nj状态的概率称对应的矩阵P pij n n为转移概率矩阵显然有 pij 0 jpij 1 k步转移概率及k步转移概率矩阵设齐次Markov链 m m 1 2 其状态为N N1 N2 Nn 称pij k p s k Nj s Ni 为随机变量从状态Ni经k步转移到Nj的转移概率即s时刻为Ni状态时 s k时刻为Nj状态的概率称对应的矩阵P k pij k n n为k步转移概率矩阵显然有 pij k 0 jpij k 1 可以证明 P k Pk 2019年12月27日11时35分决策理论与方法随机决策理论与方法 53 61 序贯决策分析 Markov法基于Markov过程的预测设随机变量遵从齐次Markov过程状态转移概率矩阵为P 且第k时刻随机变量的各状态 N1 N2 Nn 的概率分布为u k u1 k u2 k un k T 则第s时刻 s k 随机变量的各状态的概率分布为 u s Ps k Tu k 特别地若k 0 初始状态则有u s Ps Tu 0 2019年12月27日11时35分决策理论与方法随机决策理论与方法 54 61 序贯决策分析 Markov法稳定状态概率设有齐次Markov链 m m 1 2 状态为N N1 N2 Nn 若对一切状态Ni 存在不依赖于i的常数 j 对于状态Nj 恒有 limk pij k j 则称该齐次Markov链具有遍历性 j称为状态Nj的稳定状态概率 1 2 n T称为稳定状态概率向量若转移矩阵P为正规矩阵即存在正整数k使得Pk 0 则对应的Markov链具有遍历性且该Markov链的随机变量各状态最终收敛于某个与初始状态完全无关的稳定状态稳定状态概率向量满足 P

人人文库> 全部分类> 行业资料 > 管理策划

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第03讲随机决策理论与方法-2(1).ppt

文档简介

温馨提示

最新文档

评论

第03讲随机决策理论与方法-2(1).ppt

文档简介

温馨提示

最新文档

评论

相关文档