系统工程--决策分析方法研讨(ppt 140页).ppt_第1页
系统工程--决策分析方法研讨(ppt 140页).ppt_第2页
系统工程--决策分析方法研讨(ppt 140页).ppt_第3页
系统工程--决策分析方法研讨(ppt 140页).ppt_第4页
系统工程--决策分析方法研讨(ppt 140页).ppt_第5页
已阅读5页,还剩134页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 系统工程概论 第四讲决策分析方法 参见教材第6章 2 本章主要内容 第一节管理决策概述第二节不确定型决策分析第三节风险型决策分析第四节冲突分析 3 决策分析方法 第一节管理决策概述 本节主要内容 一 基本概念二 决策问题的基本模式三 决策问题的分类 4 决策分析方法 一 基本概念1 决策人们为达到某一目标 从若干可能的方案 或措施 途径 行动 中经过分析 选出最佳 或满意 方案的行为 2 决策分析决策者的决策活动需要系统分析人员的决策支持 决策分析就是为帮助决策者在多变的环境条件下进行正确决策而提供的一套推理方法 逻辑步骤和具体技术 以及利用这些方法技术规范地选择满意的行动方案的过程 5 引例 某农场要决定一块地中选择什么作物 条件如下 如何决策 决策分析方法 6 二 决策问题的基本模式 1 备选方案 Ai 可供决策者进行选择的各个行动方案 有时简称为策略或方案 备选方案为可控因素 2 自然状态 j 决策过程中那些必须考虑的不依人们的主观意志为转移的客观条件 自然状态为不可控因素 决策分析方法 7 3 状态概率P j 即各个自然状态出现的可能性大小4 益损值 Wij 决策者的第i种备选方案在第j种自然状态下的经济收益或损失值称为益损值 将益损值按原有的顺序构成的矩阵称作益损阵R 决策分析方法 8 决策分析方法 三 决策问题的分类 按自然状态分类 9 决策分析方法 1 确定型决策 条件 存在决策者希望达到的明确目标 收益大或损失小等 存在确定的自然状态 存在着可供选择的两个以上的行动方案 不同行动方案在确定状态下的益损值可以计算出来 特点 明确知道哪种自然状态会发生方法 在方案数量较大时 常用运筹学中规划论等方法来分析解决 如线性规划 目标规划 10 引例 某农场要决定一块地中选择什么作物 条件如下 如何决策 决策分析方法 11 决策分析方法 2 风险型决策 条件 存在决策者希望达到的明确目标 收益大或损失小等 存在两个以上不以决策者主观意志为转移的自然状态 但决策者或分析人员根据过去的经验和科学理论等可预先估算出自然状态的概率值 存在着可供选择的两个以上的行动方案 不同行动方案在确定状态下的益损值可以计算出来 特点 不知道哪种自然状态会发生 但其发生的概率可以估算出来方法 期望值 决策树法 12 引例 某农场要决定一块地中选择什么作物 条件如下 如何决策 决策分析方法 13 决策分析方法 3 不确定型决策 条件 存在决策者希望达到的明确目标 收益大或损失小等 自然状态不确定 且出现的概率不可知 存在着可供选择的两个以上的行动方案 不同行动方案在确定状态下的益损值可以计算出来 特点 不知道哪种自然状态会发生 且其发生的概率也不知道 方法 乐观法 最大最大原则 悲观法 最小最大原则 后悔值法 最大最小原则 14 引例 某农场要决定一块地中选择什么作物 条件如下 如何决策 决策分析方法 15 4 对抗型决策Wij f Ai Bj i 1 m j 1 n其中 A 决策者的策略集B 竞争对手的策略集W 决策者的益损 方法 冲突分析 决策分析方法 16 决策分析方法 第二节不确定型决策分析 不确定型决策是在只知道有几种自然状态可能发生 但这些状态发生的概率并不知道时所做出的决策 引例 某药厂决定生产一种新药 有四种方案可供选择 甲药 乙药 丙药 丁药 可能发生的状态有三种 畅销 一般 滞销 每种方案在各种自然状态下的年效益值如下表所示 为获得最大销售利润 问药厂应如何决策 17 这类问题在理论上没有一个最优决策准则让决策者决策 它存在着几种不同的决策分析方法 这些方法都有其合理性 具体选择哪一种 主要靠决策人的经验和性格等因素 决策分析方法 18 系统决策 一 乐观法 大中取大准则 1 适用场合决策者对客观情况比较乐观 认为任何方案都是收益最大的自然状态将发生 愿意争取一切最好结果机会 2 概念乐观准则 也称大中取大准则 它是从最乐观的观点出发 对每个方案都按最有利状态来考虑 然后从中选取最优的作为最优方案 3 具体做法先找出各方案在不同自然状态下的最大效益值 再从这些最大收益值选出最大值 该最大值对应的方案为决策所选定的方案 19 决策分析方法 最优方案应为生产甲药 20 二 悲观法 小中取大准则 1 适用场合决策者对客观情况比较悲观 总是小心谨慎 从最坏处考虑 在最坏的情况下选择一个相对好的 2 概念悲观准则 也称为小中取大准则 它是从最悲观的观点出发 对每个方案按最不利的状态来考虑 然后从中选取最优的作为最优方案3 具体做法先从各方案中选出一个最小收益值 再从这些最小收益值中选出一个最大收益值 其对应方案为决策选定方案 决策分析方法 21 最优方案应为生产丁药 决策分析方法 22 系统决策 三 折中法 乐观系数准则 1 适用场合完全乐观 完全悲观都是一种极端的态度 现实的态度是既不完全乐观 也不完全悲观 介于乐观和非观之间 2 概念决策者根据自己的愿望 经验和过去的数据 引入一个表达乐观程度的乐观系数 越大 越乐观 对每一个方案计算折中收益值 选择数值最大者对应的方案作为最优方案 23 设 0 7 按折中准则 有 最优方案应为生产甲药 决策分析方法 3 具体做法 Max 404 250 190 167 404 显然 1时 折中法就变成乐观法 0时 折中法就变成悲观法 24 系统决策 四 等可能性法 拉普拉斯准则 等概率法 1 适用场合决策者认为 在对未来事件发生的概率缺乏了解的情况下 没有理由认为哪一种自然状态出现的可能性大小或小些 则可假定各种自然状态出现的可能性相同 即赋予每种自然状态相等的出现概率 若有n种自然状态 则每种自然状态的概率都是1 n 2 概念在假定各种自然状态发生的概率相同的情况下 采用风险型决策中的期望值法 计算各方案的择期望益损值 并选择数量最大的方案为最优的方案 25 Max 266 7 216 7 146 7 266 7 所以生产甲药为最优方案 注 若益损值为损失值时 公式改为取最小值 3 具体做法 决策分析方法 26 系统决策 五 后悔值法 最小后悔值法 1 适用场合决策者希望使未来的后悔值最小2 概念 1 后悔值 各状态中 最大损益值与其他损益值之差 称为 后悔值 也就是将每种自然状态的最高值定为该状态的理想目标 将最高值与该状态中的其他值相减所得之差称为 未达到理想之后悔值 将后悔值构成的矩阵称为 后悔值矩阵 2 后悔值准则 后悔值准则是从后悔值考虑 希望能找到一个这样的策略 以使在实施这个策略时能产生较少的后悔 27 决策分析方法 3 具体做法 1 按列找出各种自然状态下的最大益损值 2 按列计算最大益损值与其他益损值之值 导出后悔值矩阵 28 min 260 250 400 450 250 所以生产乙药为最优方案 决策分析方法 3 在后悔值矩阵中 找出每行的最大后悔值 4 从这些最大后悔值中选出最小后悔值 它所对应的方案为选定的决策方案 注 若益损值为损失值时 公式中后悔值 29 系统决策 第三节风险型决策分析 在解决实际问题时 对自然状态出现的概率一无所知的情况比较少见 通常情况下 我们可以根据过去的统计资料和积累的工作经验 或通过一定的调查研究所获得的信息 总是可以对各种自然状态的概率作出一定估算 这种事先估算和确定的概率叫做主观概率 所以实际工作中需要进行决策分析的大多数都属于风险型问题 30 一 主观概率 一 概率的概念1 频数在相同条件下 进行n次实验 在这n次实验中 事件A发生的次数为k 称为事件A发生的频数 2 频率比值k n称为事件A发生的频率 也就是说事件A发生的频率是它发生的次数与试验次数之比 其大小表示A发生的频繁程度 频率越大 就意味着A在一次试验中发生的可能就越大 决策分析方法 31 3 概率当试验次数n很大时 频率将 稳定 在一个常数p附近 n越大 频率偏离这个常数p的可能性越小 这个常数p称为该事件的概率 二 频率和概率的关系1 频率是随机的 概率反映的是多次试验中频率的稳定性 概率是一个客观存在的常数 1 频率反映事件发生频繁的程度 但频率是随机的 是这n次试验中的频率 换另外n次试验 一般说 频率将不同 决策分析方法 32 2 概率反映的是多次试验中频率的稳定性 频率的稳定性反映的是大量试验中出现的性质 其稳定性要在试验次数很多时才体现出来 对个别的几次试验 由于其随机性 是无法预料的 3 出现频率偏离概率较大的情形是可能的 这是随机现象的特性 以下观点是错误的 掷一个均匀硬币 正面出现的概率等于二分之一 就应该两次试验中出现一次正面 掷一个均匀骰子 每掷六次 各点都应该出现一次 否则就是不均匀 决策分析方法 33 2 可以用频率来估计概率在现实中 概率往往是不知道的 通常用频率来估计概率 通过做n次随机试验 观察频率的变化 获得其稳定值 三 主观概率1 为什么引入主观概率有的自然状态无法重复试验 明天是否下雨 新产品销路如何 明年国民经济增长率如何 能否考上博士生 试验费用过于昂贵 代价过大 洲导弹命中率 战争中对敌方下一步行动的估计 决策分析方法 34 为什么有的自然状态无法进行试验 概率论中 随机试验应满意以下三个条件 1 可以在相同的条件下重复地进行 2 每次试验的可能结果不止一个 并且能事先明确试验的所有可能结果 3 进行一次试验之前不能确定哪一个结果会出现 决策分析方法 35 2 主观概率的定义主观概率是合理的信念的测度 即某人对特定事件会发生的可能的主观估计 也就是他相信 认为 事件将会发生的可能性大小的程度 决策分析方法 36 二 风险型决策分析的常用方法 一 最大可能法 二 期望值法 三 决策树法 决策分析方法 37 一 最大可能法1 概念由概率论知识可知 一个事件的概率越大 它发生的可能性越大 基于这种考虑 在风险型决策问题中选择一个概率最大的自然状态进行决策 而其他状态可以不管 这种决策准则称为最大可能准则 2 具体作法利用这种决策准则进行决策时 把概率最大的自然状态看作必然事件 其发生的概率看作1 而其他自然状态看作不可能事件 其发生的概率看作0 这样 认为系统中只有一种确定的自然状态 从而将风险型决策转化为确定型决策 决策分析方法 38 例 某农场要决定一块地中选择什么作物 条件如下 如何决策 决策分析方法 39 3 适用范围在各个自然状态发生的概率相差很大 而相应的益损值又差别不大时 使用这种决策准则效果较好 决策分析方法 40 教材例题 P142例7 1 决策分析方法 二 期望值法 41 决策分析方法 理解 数学期望是随机变量的平均取值 是不确定情况下所有可能结果的加权平均 权数是每一种结果的概率 42 3 对期望值法的评价 1 适用范围 不同自然状况发生的概率相差不大 2 特点 直观 计算简单 3 缺陷 不适合于多级决策问题 决策分析方法 43 决策分析方法 三 决策树法 1 适用范围实际中的决策问题往往是多步决策问题 每走一步选择一个决策方案 下一步的决策取决于上一步的决策及其结果 因而是多阶段决策问题 这类问题一般不便用决策表类表示 常用的方法是决策树法 2 概念决策树是一种由结点和分支构成的自左向右横向展开的树状图形 决策树法就是利用树形图模型来描述决策分析问题 并直接在决策树上进行决策分析的一种方法 它将备选方案 自然状态 益损值和状态概率等用一棵树来表示 将期望益损值也标在这棵树上 然后直接通过比较进行决策 44 3 组成决策树是由决策节点 方案分枝 状态节点 状态分枝 结果节点五个部分组成 1 2 3 结果节点 结果节点 结果节点 结果节点 状态节点 状态节点 决策节点 方案分支 方案分支 状态分枝 状态分枝 状态分枝 状态分枝 决策分析方法 45 决策分析方法 1 决策节点与方案分枝 决策节点用正方形 表示 由决策节点引出若干分枝 每个分枝表示一个方案 称为方案分枝 决策节点表明 从它引出的行动方案需要进行分析和决策 2 状态节点与状态分枝 用圆形 表示 由状态结点引出若干分枝 每个分枝表示一个自然状态 称为状态分枝 或概率分枝 3 结果节点 通常用三角形 表示 它表示不同行动方案在不同自然状态下的结果 益损值 通常将结果值注明在结果节点的右端 46 4 决策树的画法决策树一般是从左向右画 1 画决策节点 再画由决策节点引出的方案分枝 有几个备选方案 就要画几个分枝 在方案分枝上注明各备选方案的名称及代表符号 并在每个方案分枝的末梢画上状态节点 2 由状态节点引出状态分枝 有几个自然状态 就要画几个分枝 在每个状态分枝上按以下格式标出自然状态名称及概率 自然状态名称 概率 3 在每个状态分枝末梢画上结果节点 在它右端标上不同方案在不同自然状态下的益损值 注意 初始状态下决策节点和状态节点中是没有内容的 这两处的数值要在以后的计算中得到 决策分析方法 47 教材例题P152 例7 1 上涨 0 3 不变 0 6 下跌 0 1 40 32 6 上涨 0 3 不变 0 6 下跌 0 1 36 34 24 上涨 0 3 不变 0 6 下跌 0 1 20 16 14 大批量生产A1 中批量生产A2 小批量生产A3 决策分析方法 48 5 决策的步骤决策一般是从右向左计算 1 计算行动方案的期望益损值 计算方法法 先将状态分枝上标注的状态概率与该状态分枝对应的结果节点上标注的益损值相乘 然后求这些乘积之和 得到每个方案的期望益损值 并将计算结果标注在相应的状态节点上方 2 比较各行动方案的期望益损值 将其中最大的值标注在决策节点上方 并在其余方案分枝上画上 符号 表明这些方案已被子舍弃 而期望益损值大的方案则保留 这就是最优策略 决策分析方法 49 解 上涨 0 3 不变 0 6 下跌 0 1 40 32 6 上涨 0 3 不变 0 6 下跌 0 1 36 34 24 上涨 0 3 不变 0 6 下跌 0 1 20 16 14 大批量生产A1 中批量生产A2 小批量生产A3 33 6 30 6 33 6 17 0 决策分析方法 50 决策分析方法 例 某厂要确定下一计划期内产品的生产批量 根据以前的经验并通过市场调查和预测 书籍产品销路好 一般 差三种情况的可能性分别为0 3 0 5 0 2 产品采用大 中 小批量生产的备选方案 可能获得的效益值也可以相应地计算出来 如下表所示 请选择最佳方案 好一般差 51 好 0 3 一般 0 5 差 0 2 好 0 3 一般 0 5 差 0 2 好 0 3 一般 0 5 差 0 2 解 画决策树 大 批 量 生 产 20 8 12 16 10 16 12 12 12 13 6 14 8 12 0 14 8 中批量生产 小 批 量 生 产 决策分析方法 52 决策分析方法 计算行动方案的期望益损值 比较各行动方案的期望益损值 53 例 某农场要决定一块地中选择什么作物 条件如下 采用决策树法如何决策 决策分析方法 54 5000 4200 3700 正常 0 7 早 0 2 多雨 0 1 1000 4000 7000 2000 5000 3000 3000 6000 2000 种植棉花 种植小麦 种植蔬菜 正常 0 7 早 0 2 多雨 0 1 正常 0 7 早 0 2 多雨 0 1 5000 决策分析方法 55 决策分析方法 6 多级决策树 如果只需作一次决策 其分析求解即告完成 则这种决策分析问题就叫做单级决策问题 simple leveldecisionproblem 反之 有些决策问题需要经过多次决策才告完成 则这种决策问题就叫做多级决策问题 multiple leveldecisionproblem 应用决策树法进行多级决策分析叫做多级决策树 这类问题采用决策树法进行决策显得尤为方便简洁 56 教材例题P154 例7 2 多级决策树见P156 决策分析方法 57 决策分析方法 例 某储运公司的现有设备虽然可以使用 但技术上已经落后 因此公司领导召集有关人员讨论更新方案 在讨论中主要有两种意见 一种意见是立即更新设备并扩大生产规模 另一种意见则认为先更新设备 3年后再根据市场形式考虑扩大生产规模的问题 于是形成了两个方案 一是更新设备并扩大生产规模 二是现在先更新设备 3年后再决定是否扩大生产规模 以下是已知的有关资料 58 决策分析方法 1 现在更新设备并同时扩大生产规模 需投资60万元 若现在只更新设备 需投资35万元 3年后扩大生产规模需投资40万元 2 现在更新设备并扩大规模 在储运业务量大的情况下前3年可获利12万元 后7年每年可获利15万元 在储运业务量小的情况下 每年只能获利3万元 如果现在只更新设备 在储量大的情况下 每年可获利6万元 在储运量小的情况下 每年可获利4 5万元 3 根据市场预测 前3年储运业务量大的概率为0 70 如果前3年储运业务量大 则后7年储运量大的概率为0 85 而若前3年储运业务量小 则后7年储运量大的概率只为0 1那么 公司领导应采取哪个方案为好呢 59 解 1 画出决策树图 1 2 41 4 4 5 11 3 6 7 大 0 85 小 0 15 大 0 85 小 0 15 大 0 10 小 0 90 大 0 10 小 0 90 大 0 85 小 0 15 大 0 10 小 0 90 15 3 6 4 5 15 3 6 4 5 15 3 15 3 10 9 8 扩大 40 不变 扩大 40 大 0 70 小 0 30 大 0 70 小 0 30 92 4 40 34 29 4 32 55 52 4 32 55 92 4 29 4 63 1 101 4 更新 35 60 更新扩大 前3年 后7年 不变 60 决策分析方法 2 计算各点期望值结点8 结点9 结点10 结点11 61 决策分析方法 决策点4 决策点5 结点6 结点7 62 决策分析方法 结点2 结点3 决策点1 3 选择方案选择更新设备并同时扩大生产规模 63 三 信息的价值决策需要信息 但信息的获取需要成本 从而提出了一个问题 是否值得花费一定数量的成本去获得信息以便决策呢 决策所需的信息分为两种 完全信息 据此可以得到完全肯定的自然状态 这类信息是完全可靠的 抽样信息 通过抽样获得信息 并用统计方法来推断自然状态出现的概率 这类信息不完全可靠 决策准则 获取信息所花费的成本 不应大于该信息所能得到的收益 64 例 某企业对一台机器的换代问题进行决策 有三种方案 购买一台新机器 A1 对老机器进行改造 A2 维护老机器 A3 用于投入该机器生产的原材料的质量分为两个等级 优等和一般 其中约有30 是优等 三种策略的收益表如下表所示 单位 万元 65 问题 可以还600元对材料的质量进行测试 若测试的结果是完全可靠的 请问是否应该进行测试 若测试的可靠性如下 请问是否应该进行测试 66 解 1 若不进行测试 各方案的期望收益为 E A1 3 0 3 1 5 0 7 0 15E A2 1 0 3 0 5 0 7 0 65E A3 0 8 0 3 0 6 0 7 0 66所以 方案A3为最优方案 2 若测试完全结果可靠 完全信息价值 0 3 max 3 1 0 8 0 7 max 1 5 0 5 0 6 0 3 3 0 7 0 6 1 32因为1 32 0 66 0 66 万元 6600元 600元所以 应该花600元进行测试 正确的决策过程是 先花600元进行测试 如果测试结果为优等 则购买新机器 如果测试结果为一般 则维护老机器 67 68 3 若测试的结果不可靠 抽样信息价值 G 原料实际质量为优等B 原料实际质量为一般fg 测试结果为优等fb 测试结果为一般条件概率公式 已知事件A发生的情况下事件B发生的概率全概率公式 每次试验中 Bi i 1 n 必有一个且仅有一个会发生贝叶斯公式 69 当n 2时 将B1为B B2记为B 那么 全概公式和贝叶斯公式就变为 这是最常用的两个公式 70 71 P fg 和P fb 利用公概率公式计算测试结果为优等的概率之和 P fg P G P fg G P B P fg B 0 3 0 8 0 7 0 3 0 45测试结果为一般的概率之和 P fb P G P fb G P B P fb B 0 3 0 2 0 7 0 7 0 55 72 P G fg P B fg 和P G fb P B fb 利用贝叶斯公式计算 73 在抽样信息的情况下 最后的期望收益为 0 45 0 8985 0 55 0 6218 0 747因为0 747 0 66 0 087万元 870元 600元所以 应该进行测试正确的决策过程是 先花600元进行测试 如果测试结果为优等 则购买新机器 如果测试结果为一般 则维护老机器 74 四 效用曲线的应用 一 效用的概念 P122 定义 评价主体对于某种利益或损失的感觉和反应 二 效用曲线定义 效用值与益损值之间的对应关系 0 益损值M 效用值U 1 75 益损值是货币单位 效用值是无量纲 值域为 0 1 一般规定 决策者是喜爱 最偏向 最愿意的事物 其效用值这1 而最不喜爱 最不愿意的事物 效用值为 效用值也可以是其他值 如0 100 在风险型决策问题中 用效用值来量化人们对待风险的态度 76 三 效用曲线的确定一般采用对比提问法 设决策者面临两种可选方案A B A方案为他可无风险地得到一笔资金X2 B表示他可以概率p得得一笔资金x1和以概率 1 p 损失一笔资金x3 且X1 x2 x3 U xi 代表xi的效用值 若在某种条件下 决策者认为方案A B是等价的 可表示为 pU x1 1 p U x3 U x2 这表明 决策者认为x2的效用值等价于x1 x3的效用期望值 于是可有对比提问法来测定决策者的效用曲线 77 一般采用改进的V M方法 即取p 0 5 固定x1 x3 利用pU x1 1 p U x3 U x2 改变x2 提三问 确定三点 例 x1 10 x3 5取U x1 1 U x3 0 第一问 0 5U 10 0 5U 5 U x2 X2取什么值时 该式成立 若回答为 2 5 则0 5 1 0 5 0 U 2 5 得U 2 5 0 5第二问 0 5U 10 0 5U 2 5 U x2 X2 取什么时 该式成立 若回答为0 75 则0 5 1 0 5 0 25 U 0 75 得 0 75 0 75第三问 0 5U 5 0 5U 2 5 U x2 X2 取什么值时 该式成立 若回答 4 2 则0 5 0 0 5 0 5 U 4 2 得U 4 2 0 25 78 四 效用曲线的类型 M U 1 0 型 保守型 当收益值较小时 效用值增加较快 当收益值增大时 效用值增加的速度变慢 表明决策者不求大利 谨慎小心 保守 型 冒险型 当收益值较小时 效用值增加较慢 当收益值增大时 效用值增加的速度变快 表明决策者对增加收益比较敏感 愿意冒大风险 谋求大利 型 中间型 决策者非常理性 是一种较少主观感受的 机器人 实验表时 大多数人的行为的效用曲线属于 型 79 第四节冲突分析 冲突分析主要解决人为的不确定型决策问题 对抗型决策问题 它是分析多人决策和解决多人竞争的有效工具之一 它主要研究如何在冲突状态下做决策的问题 是决策论的一个分支 决策分析方法 80 一 对抗型决策问题的基本模式Wij f Ai Bj i 1 m j 1 n其中 A 决策者的策略集B 竞争对手的策略集W 决策者的益损 冲突分析是一种对冲突行为进行正规分析的决策分析方法 决策分析方法 81 实例 囚徒困境囚徒甲和乙由于涉嫌一个重要案件被拘留 法官已经确定他们是有罪的 但是没有找到足够的证据给他们定罪 为此 法官将二人分开监禁并告诉他们条件 各个囚徒需在坦白与不坦白之间作出选择 若二人都不坦白 法官将以一件较轻的罪名 如非法持枪 将二人各判刑1年若其中一人坦白 则坦白者不被追究刑事责任 而不坦白者受此罪最重刑 判刑10年若二人都坦白 则他们将被起诉 但在量刑上可以从轻 各判刑5年 决策分析方法 82 二 冲突分析的过程 决策分析方法 83 三 冲突分析的要素 建模 冲突分析的要素 冲突事件的要素 是使现实问题模型化 分析正规化的基本信息 对是对冲突事件原始资料处理的结果 1 时间点 冲突 开始的标志 也是建模时能够得到有用信息的终点 冲突是一个动态的过程 各种要素都在变化 这样容易使人认识不清 所以需要确定一个时间点 使问题明朗化 但时间点不直接进入分析模型 决策分析方法 囚徒困境的时间点 法官定罪前 84 2 局中人 players 参与冲突的集团或个人 1 局中人必须大于或等于2 2 各局中人必须有独立决策权 为了研究问题清楚起见 利益与行动完全一致的参与者往往被视为同一个局中人 例如在一场球赛中 比赛双方各有许多队员 但我们仍将比赛模拟为二人对策 决策分析方法 囚徒困境局中人 囚徒甲和囚徒乙 85 1 相应的行动被选取0 相应的行动不被选取 决策分析方法 3 选择或行动 options 各局中人在冲突事件中可能采取的行为动作 冲突局势正是则各方局中人各自采取某些行动而形成的 某个局中人一组行动的某种组合称为该局中人的一个策略 Strategy 策略采用二进制数表征 分别用 1 和 0 表示某行动的 取 和 舍 甲和乙的行动均可以为 坦白与不坦白甲和乙的策略均可以为 86 行动与策略的关系分析 实际例子 在一场劳资冲突中 工会有三项行动 接受资方提出的提高工资3 的提案 提出提高工资5 的提案 罢工基于这些行动 工会有许多策略 拒绝3 的提案 提出5 的提案 而不罢工 拒绝3 的提案 提出5 的提案 并且罢工 拒绝3 的提案 而不罢工 拒绝3 的提案 并且罢工行动与策略的区别在于后者是一组可行和完整的行动方案 它包括了对某些行动的取舍 注 因为工会不可能在接受3 提高的同时 提出5 的要求 所以任何涉及同时选择这两项行动的策略都是不可行的 决策分析方法 87 囚徒困境的基本结局 决策分析方法 4 结局 outcomes 各局中人冲突策略的组合共同形成冲突事态的结局 当所有局中人都选择了某一策略时 就形成了冲突的一个结局 全体策略的组合称为基本结局 结局采用二进制数组表示 88 决策分析方法 在人工分析时 一般将二进制数转换为十进制数 89 5 优先序或优先向量 preferencevector 各局中人对于结局的偏好次序 由于局中人在冲突中的不同利益 他们对各种结局就有不同的偏好 各局中人按照自己的目标要求和好恶标准 对可能的结局 可行结局 排出优劣次序 形成各自的优先序 在优先序排列中 一般将最有利的结局排在左边 最不利的结局排在右边 决策分析方法 90 决策分析方法 甲的优先序 91 决策分析方法 乙的优先序 92 四 稳定性分析的概念 1 理性人假设在冲突分析中 我们假设所有局人都是理性的 即 每个局中人总是选择那种能给他带来有利结局的策略 并且将不断朝着对自己最有利的方向改变其策略 分析 局中人在决定自己的选择时都会考虑到其他局中人可能的反应及对本人的影响 局中人想要达到的是对自己最有利的结局 而他所能做的只是选择自己的某一个策略 而无法控制其他局中人的策略选择 因此各方只能确定什么样的结局是最有可能为所有的局中人接受 因此 最后的结局必须是能被所有局中人共同接受的结局 决策分析方法 93 2 稳定与非稳定 1 稳定 无法进行改进 或改进后的新结局劣于原结局 2 非稳定 改进后的新结局优于原结局3 平稳结局指对所有局中人都可接受的结局 也即对任一局中人 更换其策略后得到新结局 而所有新结局的效用值 赢得 或偏好度都较原结局小 这时原结局就是一个平稳结局 在平稳结局中 没有一个局中人愿意离开他已经选定的策略 平稳结局为最优结局 最优解 94 决策分析方法 五 稳定性分析的步骤 4 稳定性分析稳定性分析是从所有可行结局中求得平稳结局的过程 它是使冲突问题得以 圆满 解决的关键 95 1 单方面改进UI 单方面改进 unilateralimprovement UI 假定其他局中人不改变其策略 而某一局中人单方面改变其策略使自己的处境更好则形成单方面改进 即 对于局中人A而言 考虑结局q 如果A可以通过改变自己的策略使q变到q 且q 优于q 则称对于A q存在单方面改进q 记作UI 决策分析方法 96 从第1 2列看 乙的策略都是 10 甲的策略是 01 或 10 因此结局5上存在单方面改进 6 从第3 4列看 乙的策略都是 01 甲的策略是 01 或 10 因此结局9上存在单方面改进 10 甲的单方面改进UI分析 决策分析方法 97 乙的单方面改进UI分析 从第1 2列看 甲的策略都是 10 乙的策略是 01 或 10 因此结局5上存在单方面改进 9 从第3 4列看 甲的策略都是 01 乙的策略是 01 或 10 因此结局6上存在单方面改进 10 决策分析方法 98 将每个结局的UI写在该结局的下面 并按照优先程度的高低由上而下依次排列 决策分析方法 99 2 确定基本的个体稳定状态 以单个局中人为分析对象 以UI为基础 可得到三种基本的个体状态 合理性稳定结局 r 连续处罚性稳定结局 s 非稳定结局 u 决策分析方法 1 合理性稳定结局r 合理性稳定结局 对于局中人A而言 考虑结局q 如果不存在单方面改进 即无UI 则称对于A q是合理稳定结局 记作r 也就是在局中人B不改变其策略时 对于局中人A 结局q是最优的 合理性稳定表明局中人在现有结局上已无法进一步优化自己的偏好 100 从第1 2列看 结局5上存在单方面改进 6 而6属于r从第3 4列看 结局9上存在单方面改进 10 而10属于r 甲的合理性稳定结局r 决策分析方法 101 乙的合理性稳定结局r 从第1 2列看 结局5上存在单方面改进 9 9属于r从第3 4列看 结局6上存在单方面改进 10 10属于r 决策分析方法 102 在合理性稳定结局的上方标注r 决策分析方法 103 2 连续处罚性稳定结局s 连续性处罚 对于局中人A 考虑结局q 如果存在UI结局q 而结局q 对于局中人B 也存在UI结局q 但结局q 对于局中人A不比q更优 则称结局q的UI结局q 存在着一个连续性处罚 连续处罚性稳定结局 对于局中人A的结局q的全部UI结局都存在连续性处罚 则称对于局中人A 结局q为连续处罚性稳定结局 记作s 决策分析方法 104 直观地表述如下 若某个局中人在现有的某个结局中有UI可以单方面改进自己的处境到一个更为有利的结局 但在这个新的结局上 其他局中人也可以运用UI使结局再次变化 使得对该局中人来说由此产生的结局比初始的结局还要差 则称该结局为连续处罚性稳定结局 连续处罚性稳定结局的意义在于 其他局中人连锁反应的后果 会迫使该局中人放弃使用自己的UI 因而呈现一种稳定状态 决策分析方法 105 3 非稳定结局u 非稳定 unstable u 结局 对于局中人A 考虑结局q 如果存在UI 但又不是s 则称对于A q是非稳定结局 记作u 非稳定结局有两种情况 q q r即对于B 结局q 不存在单方面改进q q q q 且q q A 在非稳定结局中 局中人总是通过UI来改进自己的处境 决策分析方法 106 分析囚徒甲的s u 决策分析方法 107 分析囚徒乙的s u 决策分析方法 108 在相应的结局的上方标注s u 决策分析方法 109 3 分析同时处罚性稳定 1 同时性处罚 对于局中人A 考虑非稳定结局q 如果另一局中人B 对于结局q也是非稳定的 那么结局q的UI结局 ai 对于局中人A bj 对于局中人B 同时UI 合成 产生的结局 pk 中 存在一个p0 对于局中人A而言 不比q更优 则称对于局中人A 结局q的UI结局a0存在一个同时性处罚 决策分析方法 110 2 同时处罚性稳定结局 若对于局中人A 结局q的全部UI结局 ai 都存在同时性处罚 则称对于局中人A 结局q为同时处罚性稳定结局 记作 3 同时处罚性稳定的现实意义 如果两个局中人同时从对他们都不稳定的一个结果q出发而改变策略的话 可能会导致一个对他们二者都不利的结局 两个局中人 A和B 同时UI产生的结局P的计算公式为 P a b q 111 例 课本P170表7 11同时处罚性稳定结局分析对于美国而言 属于u的结局有 571309108对于苏联而言 属于u的结局有 213119108因此 对二者都属于u的结局有 1391081 当q 1时 a 2 b 5 1 对于美国1 2 2 5 1 6 6在1之前 2不存在同时性处罚a中只有一个元素 所以结局1不属于 2 对于苏联1 5 5 2 1 6 6在1之前 5不存在同时性处罚b中只有一个元素 所以结局1不属于 112 2 当q 3时 a 2 1 b 7 1 对于美国3 2 2 7 3 6 6在3之前 2不存在同时性处罚3 1 1 7 3 5 5在3之前 1不存在同时性处罚所以结局3不属于 2 对于苏联3 7 7 2 3 6 7 1 3 5 5和6在3之前 7不存在同时性处罚所以结局3不属于 113 3 当q 9时 a 11 b 5 1 1 对于美国9 11 11 5 9 7 11 1 9 3 3和7在9之前 11不存在同时性处罚所以结局9不属于 2 对于苏联9 5 5 11 9 7 7在9之前 5不存在同时性处罚9 1 1 11 9 3 3在9之前 1不存在同时性处罚所以结局9不属于 114 4 当q 10时 a 11 9 b 6 2 1 对于美国10 11 11 6 10 7 11 2 10 3 3和7在10之前 11不存在同时性处罚10 9 9 6 10 5 9 2 10 1 1和5在10之前 9不存在同时性处罚所以10不属于 2 对于苏联10 6 6 11 10 7 6 9 10 5 5和7在10之前 6不存在同时性处罚10 2 2 11 10 3 2 9 10 1 1和3在10之前 6不存在同时性处罚所以10不属于 115 5 当q 8时 a 11 9 10 b 0 4 1 对于美国8 11 11 0 8 3 11 4 8 7 3和7在8之前 11不存在同时性处罚8 9 9 0 8 1 9 4 8 5 1和5在8之前 所以9不存在同时性处罚8 10 10 0 8 2 10 4 8 6 2和6在8之前 所以10不存在同时性处罚所以结局8不属于 2 对于苏联8 0 0 11 8 3 0 9 8 1 0 10 8 2 所以0不存在同时性处罚8 4 4 11 8 7 4 9 8 5 4 10 8 6 所以4不存在时性处罚所以结局8不属于 116 例 课本P172表7 13同时处罚性稳定结局分析对于美国而言 属于u的结局有 571309108对于苏联而言 属于u的结局有 2375108因此 对二者都属于u的结局有 3571081 当q 3时 a 2 1 b 11 1 对于美国3 2 2 11 3 10 10在3之后 2存在一个同时性处罚3 1 1 11 3 9 9在3之后 1存在一个同时性处罚所以结局3属于 2 对于苏联3 11 11 2 3 10 11 1 3 9 10在3之后 所以11存在一个同时性处罚所以结局3属于 117 2 当q 5时 a 4 6 b 9 1 1 对于美国5 4 4 9 5 8 4 1 5 0 8和0在5之后 4存在同时性处罚5 6 6 9 5 10 6 1 5 2 10在5之后 6存在同时性处罚所以5所以 2 对于苏联5 9 9 4 5 8 9 6 5 10 10和8在5之后 9存在同时性处罚5 1 1 4 5 0 1 6 5 2 0和2都在5之前 1不存在同时性处罚所以5不属于 118 3 当q 7时 a 4 6 5 b 11 3 1 对于美国7 4 4 11 7 8 4 3 7 0 0与8在7之后 4存在同时性处罚7 6 6 11 7 10 6 3 7 2 2与10在7之后 6存在同时性处罚7 5 5 11 7 9 5 3 7 1 1与9在7之后 5存在同时性处罚所以7属于 2 对于苏联7 11 11 4 7 8 11 6 7 10 11 5 7 9 8和10在7之后 11存在同时性处罚7 3 3 4 7 0 3 6 7 2 3 5 7 1 1 2和0都在7之前 3不存在同时性处罚所以7不属于 119 4 当q 10时 a 11 9 b 6 2 1 对于美国10 11 11 6 10 7 11 2 10 3 3和7都在10之前

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论