




已阅读5页,还剩52页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章效用函数 广西大学数学与信息科学学院运筹管理系 3 1理性行为公理 问题 某公司拟推出一种新产品 经预测该产品在市场看好的情况下 可以获利10万 在市场前景较差时 将亏损1万元 市场看好和较差的概率分别为0 6和0 4 是否推出该新产品 若另有一产品可稳获利2万元 推出哪种产品更好 这是一个随机决策问题 3 1理性行为公理 在随机决策中 决策系统 A F 中的决策方案均是在状态空间背景中加以比较 并按照某种规则 选出决策者最满意的行动方案 在本章中 我们用事态体表示在随机性状态空间中的行动方案 方案的比较表示为事态体的比较 并引入效用的概念 用以衡量事态体 行动方案 的优劣 3 1理性行为公理 3 1 1事态体及其关系1 事态体的概念定义3 1具有两种或两种以上有限个可能结果的方案 或事情 称为事态体 事态体中各可能结果出现的概率是已知的 事态体即随机性状态空间中的行动方案 1 事态体的概念 设某事态体的n个可能结果为 o1 o2 on各结果出现的概率是相应为 p1 p2 pn则该事态体记为 T p1 o1 p2 o2 pn on 特别当n 2时 称T为简单事态体 此时T p o1 1 p o2 1 事态体的概念 事态体可以用树形图表示如下 当n 2时 p 事态体集合 的性质 在凸线性组合下 是闭集 即 若T1 T2 则当0 1时 有 T1 1 T2 两个事态体的凸线性组合仍是一个事态体 T 0 o1 0 o2 1 oj 0 on 称T为退化事态体 退化事态体仍属于事态体集合 2 事态体的比较 定义3 2设o1 o2是事态体T的任意两个结果值 根据决策目标和决策者偏好 o1和o2有如下关系 若偏好结果值o1 则称o1优于o2 记作o1 o2 反之 称o1劣于o2 记作o1 o2 若对结果值o1 o2无所偏好 则称o1无差异于o2 记作o1 o2 若不偏好结果值o1 则称o1不优于o2 记作o1 o2 反之 称o1不劣于o2 记作o1 o2 2 事态体的比较 定义3 3设两个简单事态体T1 T2具有相同的结果值o1 o2 即 T1 p1 o1 1 p1 o2 T2 p2 o1 1 p2 o2 并假定o1 o2 则 若p1 p2 称事态体T1无差异于T2 记作T1 T2 若p1 p2 称事态体T1优于T2 记作T1 T2 反之 称事态体T1劣于T2 记作T1 T2 2 事态体的比较 定义3 4设两个简单事态体T1 T2仅具有一个相同结果值 另一个结果值不相同 即 T1 p1 o1 1 p1 o0 T2 p2 o2 1 p2 o0 且o2 o1 o0 若p1 p2 则事态体T2优于T1 记作T2 T1 若T1 T2 则必有p1 p2 3 1理性行为公理 3 1 2理性行为公理公理3 l 连通性 可比性 事态体集合 上事态体的优劣关系是连通的 即若T1 T2 则或者T1 T2 或者T2 T1 或者T1 T2 三者必居其一 表示任意两个事态体都是可以比较其优劣的 3 1理性行为公理 3 1 2理性行为公理公理3 2 传递性 事态体集合 上事态体的优劣关系是传递的 即若T1 T2 T3 且T1 T2 T2 T3 则必有T1 T3 表示任意多个事态体的优劣是可以排序的 若有些事态体无差异 可排在同一位置 满足公理3 1和公理3 2的事态体集合称为全序集 3 1理性行为公理 3 1 2理性行为公理公理3 3 复合保序性 替代性 若T1 T2 Q 且0 p 1 则T1 T2当且仅当pT1 1 p Q pT2 1 p Q 表示任意事态体的优劣关系是可以复合的 复合后的事态体保持原有的优劣关系不变 3 1理性行为公理 3 1 2理性行为公理公理3 4 相对有序性 连续性 偏好的有界性 若T1 T2 T3 且T1 T2 T3则存在数p q 0 p l 0 q 1 使得 pT1 1 p T3 T2 qT1 1 q T3表示任意事态体都不是无限优 也不是无限劣 3 1理性行为公理 3 1 3事态体的基本性质性质3 1设事态体T1 p o1 1 p o0 T2 x o2 1 x o0 且o1 o0 o2 o0 若o2 o1则存在x p p使得T1 T2称x为可调概率值 3 1理性行为公理 3 1 3事态体的基本性质性质3 2 确定当量和无差异概率 设事态体T x o1 1 x o2 且o1 o2 则对于满足优劣关系o1 o o2的任意结果值o 必存在x p 0 p l 使得T p o1 1 p o2 o 称结果值o 为事态体T的确定当量 称p为o 关于o1与o2的无差异概率 3 1 3事态体的基本性质 性质3 3任一事态体无差异于一个简单事态体 设有事态体T p1 o1 p2 o2 pn on 则必存在一个简单事态体T p o 1 p o0 T其中 o max o1 o2 on o0 min o1 o2 on 且 这里 qj j 1 2 n 为oj关于o 与o0的无差异概率 3 1 3事态体的基本性质 根据性质3 3比较一般事态体之间的优劣关系 可以转化为比较简单事态体之间的优劣关系 将问题简化 得到事态体之间两两的优劣或无差异关系后 再根据公理3 2 传递性 即可得到所讨论事态体的排序 3 2效用函数的定义和构造 设有决策系统 A F 在离散情况下 结果值可以表示为决策矩阵 3 2效用函数的定义和构造 矩阵O的第i行表示第i个可行方案的n个可能结果值 即事态体Ti p1 oi1 p2 oi2 pn oin i 1 2 m 决策就是要对这m个事态体进行排序 由第一节中的性质3 3知 存在简单事态体T 使得Ti pi o 1 pi o0 Ti问题又化为对这m个简单事态体Ti 进行排序 3 2效用函数的定义和构造 Ti pi o 1 pi o0 Ti注意到这m个简单事态体Ti 具有相同的结果值o o0 根据定义3 3 其优劣关系可以由比较pi 的大小决定 根据性质3 3 qjj是结果值oij关于o 与o0的无差异概率 其中 问题 如何测定无差异概率 o o0 3 2效用函数的定义和构造 3 2 1效用和效用函数的概念效用的概念定义3 5设决策问题的各可行方案有多种可能的结果值o 依据决策者的主观愿望和价值倾向 每个结果值对决策者均有不同的价值和作用 反映结果值o对决策者的价值和作用大小的量值称为效用 3 2效用函数的定义和构造 3 2 1效用和效用函数的概念效用函数的概念定义3 6若在事态体集合 上存在实值函数u 有 1 对任意的T1 T2 T1 T2当且仅当u T1 u T2 2 对任意的T1 T2 且0 1 有u T1 1 T2 u T1 1 u T2 则称u T 为定义在 上的效用函数 3 2 1效用和效用函数的概念 估计效用函数的方法 1 标准效用测定法 概率当量法 V M法 思路 对于给定的结果值 测定其效用值 设有决策系统 A F 其结果值集合为 O o1 o2 on 记 o max o1 o2 on o0 min o1 o2 on 对于每一个结果值oj都存在一个概率值pj 使得oj pj o 1 pj o0 pj就可以作为结果值oj的效用值 3 2 1效用和效用函数的概念 1 标准效用测定法 概率当量法 V M法 步骤 设u o 1 u o0 0 建立简单事态体 x o 1 x o0 其中x称为可调概率 通过反复提问 不断改变可调概率值x 让决策者权衡比较 直至当x pj时oj pj o 1 pj o0 测得结果值oj的效用u oj pj pju o 1 pj u o0 3 2 1效用和效用函数的概念 估计效用函数的方法 2 确定当量法 修正的V M法 思路 对于给定的效用值 测定其结果值 步骤 设u o 1 u o0 0 对于给定的效用值pj 构造简单事态体 pj o 1 pj o0 通过反复提问 不断改变结果值o 让决策者权衡比较 直至当o oj时oj pj o 1 pj o0 得效用值pj对应的结果值为oj 即u oj pj 3 2 2效用函数的构造 介绍一种实用的效用函数的构造方法 基本思路对于决策问题的结果值集合 先用确定当量法找出一个基准效用值 即效用值等于0 5的结果值 称为确定当量o 其余效用值不再测定 而是按比例用线性内插的方法 用同一个标准计算得到 3 2 2效用函数的构造 方法设决策问题结果值集合为 O o1 o2 on 取o max o1 o2 on o0 min o1 o2 on 并令u o 1 u o0 0 构造简单事态体 0 5 o 0 5 o0 用确定当量法找到该事态体的确定当量o 使得 o 0 5 o 0 5 o0 3 2 2效用函数的构造 方法 对结果值进行归一化处理 记归一化的结果值为x oj 则 x x o 1 x0 x o0 0 0 x oj 1 记确定当量o 的归一化值为 也记为x0 5 得到经归一化变换后的效用曲线上的三个点 0 0 0 5 1 1 u x 0 1 1 0 5 3 2 2效用函数的构造 方法 在新区间 0 和 1 按同样方法插入点 x0 25 0 25 和 x0 75 0 75 保持比例关系 计算得 效用曲线上新增两个点 2 0 25 2 2 0 75 u x 0 1 1 0 5 0 25 2 0 75 2 2 若认为点数太少 效用曲线不够精确 可继续按同样方法在新产生的区间内插入效用中点 直到产生足够的点为止 若在效用区间 0 1 中插入2n个分点 记相应的归一化的结果值为 k 有 3 2 3效用与风险的关系 在风险型或不确定型决策问题中 决策者选择方案几乎都要承担一定的风险 不同的决策者对风险的态度是有区别的 效用表示了决策者对决策方案各结果值的偏好程度 也反映了不同类型的决策者对风险的不同态度 因此从不同类型的效用函数可以看出决策者对风险的不同态度 3 2 3效用与风险的关系 中立型效用函数设有效用函数u u x 若对xl x2 有 则称该效用函数为中立型 其效用曲线是一条直线 中立型效用函数的效用值和结果值成正比例 因此可以用结果值直接评选方案 3 2 3效用与风险的关系 保守型效用函数设有效用函数u u x 若对xl x2 有 则称该效用函数为保守型 其效用曲线是一条上凸曲线 表示效用值随结果值的增加而增加 但增加的速度逐渐由快至慢 反映了决策者随结果值增加越来越谨慎 对风险持厌恶态度 3 2 3效用与风险的关系 冒进型效用函数设有效用函数u u x 若对xl x2 有 则称该效用函数为冒进型 其效用曲线是一条下凸曲线 表示效用值随结果值的增加而增加 且增加的速度越来越快 反映了决策者随结果值增加越来越敢于冒险追求高额回报的态度 3 2 3效用与风险的关系 中立型效用函数 保守型效用函数 冒进型效用函数 3 2 3效用与风险的关系 混合型效用函数三种基本效用函数的混合 如 混合型效用函数 表示当x x0时 即结果值不大时 决策者具有一定冒险精神 当x x0时 即结果值较大时 决策者对风险转而持谨慎态度 x0 3 3效用函数表 一 效用函数表的构造实际构造效用函数时 取n 6定出效用曲线上的26 64 个点 效用函数的精度已经足够 书后附表6给出了n 6对于不同的权衡指标值 0 5时 对应的是冒进 下凸 型效用函数 效用函数值无法直接查表 3 3效用函数表 一 效用函数表的构造可以证明 0 5的效用曲线u x 与 1 的效用曲线u x 是关于直线u x对称的 因此 0 5的效用函数值可以按下面的方法求得 u x 1 u 1 x 具体步骤见教材P62 注 查表时在给定的 列若没有对应的x值 则找出与之相邻的两个值x1 x2 查出对应的效用值后用线性内插的方法确定u x 3 3效用函数表 二 效用函数表的使用例3 1某企业欲投产一种新产品 有三种方案可供选择 已知市场存在三种状态 畅销 一般 滞销 三种方案在不同的市场状态下所获利润额构成以下的决策矩阵 决策者认为 o 4 5 0 5 20 0 5 5 例3 1试求该企业决策者的效用矩阵 解 o max oij 20 o0 min oij 5u o 1 u o0 0将决策矩阵的结果值归一化 得归一化后的决策矩阵为 例3 1试求该企业决策者的效用矩阵 由o 4 5 0 5 20 0 5 5 得 查P369附表6 0 38所在列 以x22 0 5为例 0 490621 x22 0 5 0 503698而u 0 490621 0 65625 u 0 503698 0 671875用线性内插法 解得u x22 0 6675 例3 1试求该企业决策者的效用矩阵 同理得 u x11 0 7300 u x12 0 6091 u x13 0 4306 u x31 0 8742u x32 0 5596 u x33 0 2068且u x21 u o 1 u x23 u o0 0 得决策者的效用矩阵为 例3 2在上例中 若决策者认为 o 11 25 0 5 20 0 5 5 试求该企业决策者的效用矩阵 解 同上例方法得归一化后的决策矩阵为 例3 2 由o 11 25 0 5 20 0 5 5 得 查P369附表6 1 0 65 0 35所在列 以x32 0 44为例 u x32 1 u 1 x32 1 u 0 56 0 53689 0 56 0 5775而u 0 53689 0 734375 u 0 5775 0 75用线性内插法解得u 0 56 0 7433 因此 u x32 1 u 0 56 0 2567 例3 2 同理得 u x11 0 3819 u x12 0 2598 u x13 0 1271 u x22 0 2920u x31 0 5725 u x33 0 0251且u x21 u o 1 u x23 u o0 0 得决策者的效用矩阵为 3 4效用函数的曲线拟合 前面讨论了针对特定的结果值 如何测定其效用 我们得到的只是一些离散的效用值 要得到连续的效用函数 则需要用曲线拟合的方法 常见的拟合曲线形式线性函数型u x c1 a1 x c2 其中c1 a1 c2为待定参数 前面查表时用内插法确定某些效用值 实际上就相当于效用函数为分段线性函数 3 4效用函数的曲线拟合 常见的拟合曲线形式指数函数型 其中ci ai i 1 2 3 均为待定参数 双指数函数型 指数加线性函数型 3 4效用函数的曲线拟合 常见的拟合曲线形式幂函数型 其中c1 a1 c2为待定参数 不论采用哪种形式的函数 一般都尽可能化为线性函数通过最小二乘法确定待定参数 对数函数型 3 4效用函数的曲线拟合 3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建立健全特种设备安全培训与认证体系
- 终身教育视角下老年人健康教育系统设计
- 一年级珠心算教学中的练评一体化探索
- 校园欺凌的治理逻辑与进路选择
- 护理搬运法课件
- 中药药理学:化痰止咳平喘药讲课件
- 公司各类软件管理制度
- 公司员工体验式管理制度
- 公司多元化目标管理制度
- 公司对外借款担保管理制度
- 培训中心管理规定范文
- 大气污染控制工程第四版(郝吉明马广大王书肖编)复习重点资料
- 华为的科技创新生态系统构建
- 施工组织设计施工方案报审表
- 雅马哈YS12编程手册
- 5G(UE)中PDU会话建立流程(消息)
- 组合数学(第二版)递推关系
- 酒水厂家授权书范本
- 21ZJ111 变形缝建筑构造
- 产品供货质量保证措施方案
- 河南产业分析介绍课件
评论
0/150
提交评论