第03讲随机决策理论与方法-2(1).ppt_第1页
第03讲随机决策理论与方法-2(1).ppt_第2页
第03讲随机决策理论与方法-2(1).ppt_第3页
第03讲随机决策理论与方法-2(1).ppt_第4页
第03讲随机决策理论与方法-2(1).ppt_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

决策理论与方法 3 随机决策理论与方法 2 合肥工业大学管理学院2019年12月27日 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 2 61 随机决策理论与方法 1 主观概率2 效用函数3 决策准则4 贝叶斯决策分析5 多属性决策分析6 多目标决策分析7 序贯决策分析 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 3 61 多属性决策分析 多目标决策 什么是多目标决策问题 例如购买衣服时 款式 价格 颜色 质量等可能都是决策目标 多目标决策问题的特点 决策问题的目标多于一个 多个目标间不可公度 non commensurable 即各目标没有统一的衡量标准 难以比较 各目标之间存在矛盾 一般将决策变量离散 决策方案有限的多目标决策问题称为多属性 Multi attribute 决策问题 而将决策变量连续 有无限决策方案的多目标决策问题称为多目标 Multi objective 决策问题 两者又可以统称为多准则 Multi criterion 决策问题 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 4 61 多属性决策分析 相关术语 属性 Attribute 备选方案的特征 品质或性能参数 如描述服装的款式 颜色 布料 质量 价格 也称为指标 指标体系 IndexSystems 一系列互相联系 互相补充的指标所组成的统一整体 指标体系往往由多层组成 习惯上称为一级指标 二级指标等 层次结构分为树状结构和网状结构 其中以树状结构最常用 一级指标 总目标 二级指标 三级指标 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 5 61 多属性决策分析 相关术语 目标 Objective 决策人的愿望或决策人所希望达到的 努力的方向 如物美价廉 在多目标决策中 目标是求极值的对象 是需要优化的函数式 目的 Goal 在特定时间 空间状态下 决策人的期望 是目标的具体数值表现 目标和目的常混用 准则 Criterion 判断的标准或度量事物价值的原则及检验事物合意性的规则 兼指属性和目标 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 6 61 多属性决策分析 求解过程 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 7 61 多属性决策分析 目标与属性 在多目标决策中 决策目标常用目标集 目标递阶分层结构以及属性集描述 目标递阶分层结构的最下层目标要用一个或多个属性来描述 不同的方案对应的各属性值存在差异 也就导致目标实现的差异 因此可借此来评价方案的优劣 替代属性 某些目标无法用属性值直接度量时 需要使用替代属性对目标进行度量 如师资队伍的质量可以用学历结构 职称结构 专业结构 科研能力等替代属性来衡量 寻找 替代属性 替代变量 在科学研究中是非常重要的 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 8 61 多属性决策分析 目标与属性 属性选择的要求 每个属性是可测和可理解的 属性集是最小完备集 既要能够描述决策问题的所有 重要 方面 又不能有冗余 属性的测量值是可运算的 属性集内的各属性相互独立 可分解 但在实际决策中 上述要求很难达到 这也正是我们开展决策理论与方法研究的动力源 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 9 61 多属性决策分析 目标与属性 例 某流域水资源项目建设目标 指标体系 及属性 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 10 61 多属性决策分析 问题的符号表示 MA X表示方案集 X x1 x2 xm A表示属性集 A a1 a2 an 表示状态集 1 2 k V表示值集 所有可能取值的集合 V 分布函数 确定各状态发生的可能性f X A V 目标函数 确定各方案对应的属性值 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 11 61 多属性决策分析 问题的符号表示 例 给定自然状态的多属性决策问题 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 12 61 多属性决策分析 属性值预处理 剩下的问题是我们如何评价方案的优劣 属性值预处理的目标是规范化各属性值 使其能够真正体现方案优劣的实际价值 属性值类型 效益型指标 属性值越大越好 成本型指标 属性值越小越好 中性指标 属性值取某一个恰当的值最优 过大 过小都不合适 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 13 61 多属性决策分析 属性值预处理 预处理主要有两项任务 非量纲化 通过某种方法消除量纲的选用对决策或评价结果的影响 归一化 不同属性的属性值取值范围存在很大差别 为了真实反映各属性值的价值 需要将属性值统一变换到 0 1 区间上以消除属性取值范围的差异对决策或评价结果的影响 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 14 61 多属性决策分析 属性值预处理 设fi a 为方案i的a属性值 记fmax max fi a fmin min fi a 线性变换效益型 变换z fi a zi a 定义为 zi a fi a fmax 成本型 变换z fi a zi a 定义为 zi a 1 fi a fmax 或者变换z fi a zi a 定义为 zi a fmin fi a 标准0 1变换效益型 zi a fi a fmin fmax fmin 成本型 zi a fmax fi a fmax fmin 向量规范化 zi a fi a ifin a 1 n n可以取1或2 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 15 61 多属性决策分析 属性值预处理 线性变换 标准0 1变换 向量变换 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 16 61 多属性决策分析 属性值预处理 中性属性 最优值为给定区间 规范化策略 zi a 1 fi a f0 0 2 f0 fi a f1 1 f1 fi a f1 f0 3 f1 fi a f2 1 4 f2 fi a f0 1 fi a f2 f0 f2 5 fi a f0 0 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 17 61 多属性决策分析 属性值预处理 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 18 61 多属性决策分析 属性值预处理 异常 outlier 处理 对同一个属性a 若各方案的值差异极大或某方案的值相对其他方案出现明显的偏离 如按一般方法规范化 在评价时该属性的影响将被不恰当地放大 如前例中的论著一项 方案5的值是14 显著大于其他4个方案 因此需要采用特别方法处理 处理方法有很多 下面介绍一种常用方法 设定一个转换后的期望值 均值 M 0 5 0 75 作变换z fi a zi a zi a fi a E 1 M fmax E M其中E为当前属性值的均值 fmax为当前属性值的最大值 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 19 61 多属性决策分析 属性值预处理 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 20 61 多属性决策分析 属性值预处理 专家评分范围差异的处理 当一组专家对若干方案进行评价时 由于习惯不同 各自的评分范围可能存在较大差异 需要进行规范化处理 映射区间定义 M0 M 定义映射z fi a zi a zi a M0 M M0 fi a fmin fmax fmin 一般取M0 0 M 1 对应标准0 1转换 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 21 61 多属性决策分析 属性值预处理 两个不同专家对方案1 5评价结果 百分制 如下表 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 22 61 多属性决策分析 权重确定 当决策者面对多个目标时 存在目标的重要性不同的问题 这就需要引入权 Weight 的概念加以解决 权是目标重要性的数量化表示 它的作用有 决策人对目标的重视程度 各目标属性值的差异程度 各目标属性值的可靠程度 权重确定方法 两两比较法 对不同目标的重要性进行两两比较 形成一个判断矩阵 但判断矩阵存在两方面的一致性问题 1 a1 a2 3 a2 a3 2 a1 a3 6 2 不同专家间的一致性问题a2 1 a3 1 2 a2 2 a3 2 2 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 23 61 多属性决策分析 权重确定 判断矩阵的构造假设属性ai的权记为wi 则wij wi wj为判断矩阵A的第i行第j列元素 A wij n n在实际决策中 wi是未知的 需要借助专家的评价 我们用专家的评价结果aij ai aj代替wij aij ai aj的取值如下 1 同等重要 3 目标i略重要于目标j 5 目标i比目标j重要 相当重要 7 目标i比目标j明显重要 9 目标i相对目标j绝对重要 2 4 6 8 上述两个相邻判断的中间值 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 24 61 多属性决策分析 权重确定 最小二乘法确定权重 由于用aij代替wij 两者之间可能存在误差 ij wjaij wi 利用最小二乘法 得到下列二次规划方程 Min i j ij2 i j wjaij wi 2St iwi 1 wi 0 i 1 2 n 利用拉格朗日法可将该优化问题转为求解下列方程组 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 25 61 多属性决策分析 权重确定 Matlab求解 Functionweight A D diag diag A A 1 A A n length A Row1 ones n 1 Col1 ones 1 n D DRow1 Col10 B zeros n 1 B B 1 W inv D B 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 26 61 多属性决策分析 权重确定 特征向量法 因为AW nW n为A的最大特征值 当判断矩阵A的估计存在误差时 则A中元素值的变化带来最大特征值的变化 记此时的最大特征值为 max 则AW maxW W为A关于最大特征值 max的特征向量 对W进行归一化处理即得到权重向量 Matlab函数 V D eig A 返回的V为特征向量矩阵 D为特征值矩阵 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 27 61 多属性决策分析 权重确定 Satty近似算法 A中每行元素连乘并开n次方 记为wi 求权重 wi wi iwi A中每列元素求和 Sj iaij 计算最大特征值 max iwiSi sum AW 判断矩阵A的一致性检验一致性指标CI ConsistencyIndex CI max n n 1 随机指标RI RandomIndex 用随机方法构造判断矩阵 经过500次以上的重复计算 求出一致性指标并加以平均得到 一致性比率CR ConsistencyRatio CR CI RI CR 0 1 一致性好 CR 0 1 一致性差 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 28 61 多属性决策分析 权重确定 例 设判断矩阵为A 求权重 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 29 61 多属性决策分析 决策方法 一般加权和法将属性表值cij规范化 得zij i 1 m j 1 n 确定各指标的权重系数 wj j 1 n 计算各方案的综合指标Ci jwjzij 最后根据Ci大小排出各方案的优劣 一般加权和法的使用条件 实际上很难满足 指标体系为树状结构 每个属性的边际价值是线性的 优劣与属性值大小成正比 任意两个指标的相互价值都是独立的 属性间的完全可补偿性 一个方案的某属性无论多差都可用其他属性来补偿 一个方案优于另一个方案并不要求在所有属性上都优 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 30 61 多属性决策分析 决策方法 AHP法 层次分析法 Satty 在实际决策中并不是所有指标的值都是容易测量的 但不同方案的这些指标的优劣性是可以比较的 Satty提出了一种层次分析法 AnalyticHierarchyProcess 来解决此类问题 构造关于指标权重的判断矩阵 求出各指标的权重wj 并检验判断矩阵的一致性 构造每个方案关于各指标优劣性的判断矩阵 从而得到各方案关于该指标的规范化属性值zij 如果方案关于该指标的值是可测的 则不需要构造此指标的判断矩阵 计算各方案的综合指标Ci jwjzij 根据Ci的优劣确定方案的优劣 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 31 61 多属性决策分析 决策方法 根据下图所描述的指标体系 如果完全使用AHP法进行决策 需要构造多少个判断矩阵 16 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 32 61 多属性决策分析 决策方法 加权和与加权积的综合决策法 加权和要求指标具有线性可加 可补偿 性 但在实际决策中有些指标之间是不可补偿的 此时方案关于这类指标的优劣可用加权积法 例如 设方案的优劣可由四个一级指标A B C D评判 其中A B满足可加性 C D满足可加性 但A B与C D间不满足可加性 则可用下面的加权和与加权积的综合决策法确定各方案的优劣 wAzA wBzB wCzC wDzD 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 33 61 多属性决策分析 决策方法 逼近理想解排序方法 TechniqueforOrderPreferencebySimilaritytoIdealSolution TOPSIS 借助多属性问题的理想解和负理想解给方案集X中的各方案排序 在多属性决策中 每个属性都有一个最优值 也有一个最差值 取所有属性的最优值构造一个虚拟方案x 同时取所有属性的最差值构造另一个虚拟方案x0 则称x 为理想解 x0为负理想解 TOPSIS法就是将各实际方案与理想解和负理想解进行比较 离理想解越近 离负理想解越远的方案越好 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 34 61 多属性决策分析 决策方法 TOPSIS法求解步骤用向量规范法求得规范决策矩阵 zij cij icij 1 2确定各属性的权重系数W w1 w2 wn 确定理想解和负理想解 zj maxi zij 效益型属性 或mini zij 成本型属性 zj0 mini zij 效益型属性 或maxi zij 成本型属性 计算各方案到理想解和负理想解的加权距离di j wjzij wjzj 2 1 2di0 j wjzij wjzj0 2 1 2计算综合评价指标Ci di0 di0 di 按Ci的大小对各方案排序 Ci越大方案越优 否则越劣 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 35 61 多属性决策分析 决策方法 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 36 61 多属性决策分析 决策方法 TOPSIS法的边界问题 x x0 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 37 61 随机决策理论与方法 1 主观概率2 效用函数3 决策准则4 贝叶斯决策分析5 多属性决策分析6 多目标决策分析7 序贯决策分析 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 38 61 多目标决策分析 问题描述 多目标决策问题是指决策变量连续 存在无数决策方案的多准则决策问题 其一般形式为 决策规则 DR f1 x f2 x fn x x表示一种方案 且x X x RN gk x 0 k 1 2 m x 0 问题共包含n个目标 每个目标可能受N个属性影响 所有属性必须满足一定的约束条件 共计m N个约束 多目标决策分析就是根据给定的决策规则 体现了决策人的偏好 从可行方案集X中找出最佳调和解xC 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 39 61 多目标决策分析 决策方法 多目标决策问题主要使用多目标规划方法进行求解 DEA方法 DataEnvelopmentAnalysis 在多目标决策分析中 除多目标优化问题外 还有一类多目标评价问题 对于多个同质的管理系统 决策单元 如果已知各系统投入和产出 如何评价这些系统的优劣 或者说相对有效性 问题描述 设有n个决策单元 每个决策单元都有m种资源投入 第j个决策单元第i种投入指标的投入量记为xij 0 已知 每个决策单元均有p种产出 第j个决策单元第r种产出量记为yrj 0 已知 vi ur分别表示第i种投入指标和第r种产出指标的权系数 需要通过建模得到 如何评价这n个决策单元的相对有效性 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 40 61 多目标决策分析 决策方法 C2R Charnes Cooper Rhodes 模型 第一个DEA模型 对每一个决策单元j 都定义一个效率评价指标 hj称为效率指标 可通过对权系数取值的选择使hj 1 评价第j0个决策单元有效性的C2R模型为 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 41 61 多目标决策分析 决策方法 模型转化 将分式规划转变成线性规划 令则分式规划转变为下列形式 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 42 61 多目标决策分析 决策方法 有效性分析 若线性规划的最优解 0 0满足条件则决策单元j0为弱DEA有效 若 0 0 0 0也成立 则决策单元为DEA有效 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 43 61 随机决策理论与方法 1 主观概率2 效用函数3 决策准则4 贝叶斯决策分析5 多属性决策分析6 多目标决策分析7 序贯决策分析 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 44 61 序贯决策分析 问题描述 序贯决策是一类多阶段决策问题 前一阶段的决策结果对后一阶段决策直至最终决策产生影响 整个决策问题的求解需要采取多次行动才能完成 将贝叶斯决策分析方法应用于不同的决策阶段 并根据各阶段之间的关系可以获得多阶段决策问题的解 动态规划和马尔可夫决策是两类重要的多阶段决策方法 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 45 61 序贯决策分析 多阶段决策 经过相互衔接 相互关联的若干阶段决策才能完成的决策任务称为多阶段决策 决策分析的关键 划分决策阶段 确定各阶段状态变量 寻找各阶段之间的关系 采用从后向前的逆序归纳法进行决策分析 决策方法 根据问题不同 可选用贝叶斯决策分析方法 多属性决策方法或多目标决策方法 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 46 61 序贯决策分析 贝叶斯方法 例 某公司计划购买一种新产品专利 购置费1万元 若购置了专利 可选择三种生产规模 大批量生产 a1 中批量生产 a2 小批量生产 a3 市场销售状态为 畅销 1 0 6 一般 2 0 3 滞销 3 0 1 根据历年资料统计分析 新产品进入市场的销售收益矩阵如左下表 为了准确掌握市场动向 公司可投入0 5万元开展试销 根据统计表明 产品欢迎度和销售状态之间的关系如右下表 试帮助该企业做如下决策 是否购买专利 已知如果不购买专利 1万元的投资收益为1 1万元 购买专利后是否试销 如何确定该公司的批量生产计划 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 47 61 序贯决策分析 贝叶斯方法 解 这是一个三阶段决策问题 第一阶段确定是否购买专利 第二阶段确定是否试销 第三阶段确定批量生产计划 决策过程采取逆序归纳法 即先从第三阶段开始 试销 计算后验概率及各批量生产计划的收益 得 试销的期望收益为 0 44 3 406 0 39 2 620 0 17 1 53 2 7805 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 48 61 序贯决策分析 贝叶斯方法 不试销 结论 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 49 61 序贯决策分析 Markov法 有一类序贯决策问题 其状态随着时间变化而随机变化 决策的任务就是根据当前状态预测其未来某一时刻的状态 如销售状态预测 股价预测等 下面介绍一种Markov决策方法分析求解此类问题 虽然Markov过程是很严格的 实际管理问题并不能总是满足其条件 但往往将其看作近似Markov过程也能得到很好的结果 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 50 61 序贯决策分析 Markov法 链及其状态集 设 m为随机变量 如股价 称随机变量序列 m m 1 2 为链 称由 m的全体状态构成的有限集为该链的状态集 如上涨 持平 下跌 记为N N1 N2 Nn Markov链 设链 m m 1 2 其状态为N N1 N2 Nn 若对于任意正整数k及i 1 i 2 i k i k 1 n 条件概率等式 p k 1 Ni k 1 1 Ni 1 k Ni k p k 1 Ni k 1 k Ni k 成立 则称链 m m 1 2 为Markov链 说明 Markov链的特点是随机变量在第k 1时刻出现某状态的概率仅取决于其在第k时刻的状态 而与k时刻之前的任何时刻的状态无关 即无后效性 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 51 61 序贯决策分析 Markov法 例 如果股价状态 u 上涨 e 持平 d 下跌 的变化序列构成Markov链 则根据下列两个序列 udeedu duddeu预测下一个交易日为上涨的概率相同 齐次Markov链 设 m m 1 2 其状态为N N1 N2 Nn 对于任意正整数i j 以及s t k 条件概率等式p s k Nj s Ni p t k Nj t Ni 成立 则称此Markov链为齐次Markov链 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 52 61 序贯决策分析 Markov法 状态转移概率及转移概率矩阵 设齐次Markov链 m m 1 2 状态为N N1 N2 Nn 称pij p s 1 Nj s Ni 为随机变量从状态Ni到Nj的转移概率 即s时刻为Ni状态时 s 1时刻为Nj状态的概率 称对应的矩阵P pij n n为转移概率矩阵 显然有 pij 0 jpij 1 k步转移概率及k步转移概率矩阵 设齐次Markov链 m m 1 2 其状态为N N1 N2 Nn 称pij k p s k Nj s Ni 为随机变量从状态Ni经k步转移到Nj的转移概率 即s时刻为Ni状态时 s k时刻为Nj状态的概率 称对应的矩阵P k pij k n n为k步转移概率矩阵 显然有 pij k 0 jpij k 1 可以证明 P k Pk 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 53 61 序贯决策分析 Markov法 基于Markov过程的预测 设随机变量 遵从齐次Markov过程 状态转移概率矩阵为P 且第k时刻随机变量 的各状态 N1 N2 Nn 的概率分布为u k u1 k u2 k un k T 则第s时刻 s k 随机变量 的各状态的概率分布为 u s Ps k Tu k 特别地 若k 0 初始状态 则有u s Ps Tu 0 2019年12月27日11时35分 决策理论与方法 随机决策理论与方法 54 61 序贯决策分析 Markov法 稳定状态概率 设有齐次Markov链 m m 1 2 状态为N N1 N2 Nn 若对一切状态Ni 存在不依赖于i的常数 j 对于状态Nj 恒有 limk pij k j 则称该齐次Markov链具有遍历性 j称为状态Nj的稳定状态概率 1 2 n T称为稳定状态概率向量 若转移矩阵P为正规矩阵 即存在正整数k使得Pk 0 则对应的Markov链具有遍历性 且该Markov链的随机变量各状态最终收敛于某个与初始状态完全无关的稳定状态 稳定状态概率向量 满足 P

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论