第3章_效用函数

上传人：闯*** IP属地：广东上传时间：2020-04-27 格式：PPT 页数：75 大小：1.04MB 积分：25 举报 版权申诉

已阅读5页，还剩70页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

.,第三章效用函数,.,引言决策的特点之一是后果的价值待定。为了用定量的方法研究决策问题，除了要用主观概率量化自然状态的不确定性以外，还需要量化后果的价值。在量化后果的价值时，会遇到两个主要问题：（1）后果本身是用语言表达的，可能没有任何合适的直接测量标度。（2）即使有一个明确的标度（通常是钱）可以测量后果，按这个标度测得的量也可能并不反映后果对决策人的真正价值。,.,抽奖的期望值有1250元，大于礼品的确定性收入1000元，但是一定有一部分人会选择这确定的1000元收入。因为对他们而言，抽奖的期望值虽大，风险也大，实际价值还不如保险的1000元。而有的人则相反，认为礼品不如抽奖，因为抽奖提供了获得2500元的机会。,例决策人面临图中决策树所示的选择：,.,在商业经营中，经营者经常遇到类似的情况，要在（1）期望收益较低但是有保险；（2）期望收益较高风险也较大这两种行动中进行选择。,因此，在进行决策分析时，存在如何描述或表达后果对决策人的实际价值，以便反映决策人心目中对各种后果的偏好次序（preferenceorder）的问题。偏好次序是决策人的个性与价值观的反映，与决策人所处的社会地位、经济地位、文化素养、心理和生理（身体）状态等有关。,.,在决策理论中，后果对决策人的实际价值，即在有风险的情况下决策人对结果的偏好的量化是用效用（utility）来描述的。效用就是偏好的量化，是数（实值函数）。,.,3.1理性行为公理,问题：某公司拟推出一种新产品，经预测该产品在市场看好的情况下，可以获利10万；在市场前景较差时，将亏损1万元。市场看好和较差的概率分别为0.6和0.4，是否推出该新产品？若另有一产品可稳获利2万元，推出哪种产品更好？这是一个随机决策问题。,.,3.1理性行为公理,在随机决策中，决策系统（，A，F）中的决策方案均是在状态空间背景中加以比较，并按照某种规则，选出决策者最满意的行动方案。在本章中，我们用事态体表示在随机性状态空间中的行动方案，方案的比较表示为事态体的比较，并引入效用的概念，用以衡量事态体（行动方案）的优劣。,.,3.1理性行为公理,3.1.1事态体及其关系1事态体的概念定义3.1具有两种或两种以上有限个可能结果的方案（或事情），称为事态体。事态体中各可能结果出现的概率是已知的。事态体即随机性状态空间中的行动方案。,.,1事态体的概念,设某事态体的n个可能结果为：o1,o2,on各结果出现的概率是相应为：p1,p2,pn则该事态体记为：T（p1,o1；p2,o2；pn,on）特别当n2时，称T为简单事态体，此时T（p,o1；1p,o2）,.,1事态体的概念,事态体可以用树形图表示如下：,当n2时：,p,.,事态体集合的性质,在凸线性组合下，是闭集。即：若T1，T2，则当01时，有T1(1)T2两个事态体的凸线性组合仍是一个事态体。T(0,o1；0,o2；1,oj；0,on)称T为退化事态体。退化事态体仍属于事态体集合。,.,2事态体的比较,定义3.2设o1，o2是事态体T的任意两个结果值，根据决策目标和决策者偏好，o1和o2有如下关系：若偏好结果值o1，则称o1优于o2，记作o1o2；反之，称o1劣于o2，记作o1o2。若对结果值o1,o2无所偏好，则称o1无差异于o2，记作o1o2。若不偏好结果值o1，则称o1不优于o2，记作o1o2；反之，称o1不劣于o2，记作o1o2。,.,2事态体的比较,定义3.3设两个简单事态体T1，T2具有相同的结果值o1，o2，即：T1（p1,o1；1p1,o2）T2（p2,o1；1p2,o2）并假定o1o2，则：若p1p2，称事态体T1无差异于T2，记作T1T2。若p1p2，称事态体T1优于T2，记作T1T2；反之，称事态体T1劣于T2，记作T1T2。,.,2事态体的比较,定义3.4设两个简单事态体T1，T2仅具有一个相同结果值，另一个结果值不相同，即：T1（p1,o1；1p1,o0）T2（p2,o2；1p2,o0）且o2o1o0，若p1p2，则事态体T2优于T1，记作T2T1。若T1T2，则必有p1p2。,.,3.1理性行为公理,3.1.2理性行为公理公理3.l（连通性，可比性）事态体集合上事态体的优劣关系是连通的。即若T1，T2则或者T1T2，或者T2T1，或者T1T2，三者必居其一。表示任意两个事态体都是可以比较其优劣的！,.,3.1理性行为公理,3.1.2理性行为公理公理3.2（传递性）事态体集合上事态体的优劣关系是传递的。即若T1、T2、T3，且T1T2，T2T3，则必有T1T3。表示任意多个事态体的优劣是可以排序的（若有些事态体无差异，可排在同一位置。）满足公理3.1和公理3.2的事态体集合称为全序集。,.,3.1理性行为公理,3.1.2理性行为公理公理3.3（复合保序性，替代性）若T1，T2，Q，且0p1，则T1T2当且仅当pT1(1p)QpT2(1p)Q。表示任意事态体的优劣关系是可以复合的，复合后的事态体保持原有的优劣关系不变。,.,3.1理性行为公理,3.1.2理性行为公理公理3.4（相对有序性，连续性，偏好的有界性）若T1，T2，T3，且T1T2T3则存在数p，q，0pl，0q1，使得：pT1(1p)T3T2qT1(1q)T3表示任意事态体都不是无限优，也不是无限劣。,.,3.1理性行为公理,3.1.3事态体的基本性质性质3.1设事态体T1（p,o1；1p,o0）T2（x,o2；1x,o0）且o1o0，o2o0，若o2o1则存在x=pp使得T1T2称x为可调概率值。,.,3.1理性行为公理,3.1.3事态体的基本性质性质3.2（确定当量和无差异概率）设事态体T（x,o1；1x,o2）且o1o2。则对于满足优劣关系o1oo2的任意结果值o，必存在xp（0pl），使得T（p,o1；1p,o2）o称结果值o为事态体T的确定当量，称p为o关于o1与o2的无差异概率。,.,3.1.3事态体的基本性质,性质3.3任一事态体无差异于一个简单事态体。设有事态体T（p1,o1；p2,o2；pn,on）则必存在一个简单事态体T（p,o*；1p,o0）T其中：o*maxo1,o2,ono0mino1,o2,on且：,这里，qj(j=1,2,n)为oj关于o*与o0的无差异概率。,.,3.1.3事态体的基本性质,根据性质3.3比较一般事态体之间的优劣关系，可以转化为比较简单事态体之间的优劣关系（将问题简化）得到事态体之间两两的优劣或无差异关系后，再根据公理3.2（传递性）即可得到所讨论事态体的排序。,.,3.2效用函数的定义和构造,设有决策系统（，A，F），在离散情况下，结果值可以表示为决策矩阵：,.,3.2效用函数的定义和构造,矩阵O的第i行表示第i个可行方案的n个可能结果值，即事态体Ti（p1,oi1；p2,oi2；pn,oin）(i=1,2,m)决策就是要对这m个事态体进行排序。由第一节中的性质3.3知，存在简单事态体T，使得Ti（pi,o*；1pi,o0）Ti问题又化为对这m个简单事态体Ti进行排序。,.,3.2效用函数的定义和构造,Ti（pi,o*；1pi,o0）Ti注意到这m个简单事态体Ti具有相同的结果值o*、o0，根据定义3.3，其优劣关系可以由比较pi的大小决定。根据性质3.3,qij是结果值oij关于o*与o0的无差异概率。其中：,问题：如何测定无差异概率？,o*,o0,.,3.2效用函数的定义和构造,3.2.1效用和效用函数的概念效用的概念定义3.5设决策问题的各可行方案有多种可能的结果值o，依据决策者的主观愿望和价值倾向，每个结果值对决策者均有不同的价值和作用。反映结果值o对决策者的价值和作用大小的量值称为效用。,.,3.2效用函数的定义和构造,3.2.1效用和效用函数的概念效用函数的概念效用函数(曲线)：反映决策者的期望值与效用值的对应关系.效用决策：将结果用效用值代替，以期望效用最大为决策准则.,.,3.2效用函数的定义和构造,3.2.1效用和效用函数的概念效用函数的概念定义3.6若在事态体集合上存在实值函数u，有：(1)对任意的T1、T2，T1T2当且仅当u(T1)u(T2)(2)对任意的T1、T2，且01，有uT1(1)T2=u(T1)(1)u(T2)则称u(T)为定义在上的效用函数。,.,3.2.1效用和效用函数的概念,估计效用函数的方法（1）标准效用测定法(概率当量法，VM法)思路：对于给定的结果值，测定其效用值。设有决策系统（，A，F），其结果值集合为：O（o1,o2,on）记：o*maxo1,o2,ono0mino1,o2,on对于每一个结果值oj都存在一个概率值pj，使得oj（pj,o*；1pj,o0）pj就可以作为结果值oj的效用值。,.,3.2.1效用和效用函数的概念,（1）标准效用测定法(概率当量法，VM法)步骤设u(o*)=1，u(o0)=0；建立简单事态体（x,o*；1-x,o0），其中x称为可调概率；通过反复提问，不断改变可调概率值x，让决策者权衡比较，直至当x=pj时oj（pj,o*；1pj,o0）测得结果值oj的效用u(oj)=pj=pju(o*)(1pj)u(o0),.,3.2.1效用和效用函数的概念,估计效用函数的方法（2）确定当量法(修正的VM法)思路：对于给定的效用值，测定其结果值。步骤设u(o*)=1，u(o0)=0；对于给定的效用值pj，构造简单事态体（pj,o*；1pj,o0）通过反复提问，不断改变结果值o，让决策者权衡比较，直至当o=oj时oj（pj,o*；1pj,o0）得效用值pj对应的结果值为oj，即u(oj)=pj。,.,3.2.2效用函数的构造,介绍一种实用的效用函数的构造方法。基本思路对于决策问题的结果值集合，先用确定当量法找出一个基准效用值，即效用值等于0.5的结果值，称为确定当量o。其余效用值按照类似方法测定，或是按比例用线性内插的方法，用同一个标准计算得到。,.,3.2.2效用函数的构造,方法设决策问题结果值集合为：O（o1,o2,on）取o*maxo1,o2,ono0mino1,o2,on并令u(o*)=1，u(o0)=0；构造简单事态体（0.5,o*；0.5,o0），用确定当量法找到该事态体的确定当量o，使得：o（0.5,o*；0.5,o0）,.,3.2.2效用函数的构造,方法对结果值进行归一化处理，记归一化的结果值为x(oj),则：x*=x(o*)=1，x0=x(o0)=0，0x(oj)1,记确定当量o的归一化值为，也记为x0.5,.,得到经归一化变换后的效用曲线上的三个点：,（0,0）,（,0.5）,（1,1）,u,x,0,1,1,0.5,.,3.2.2效用函数的构造,方法在新区间0,和,1按同样方法插入点（x0.25,0.25）和（x0.75,0.75），保持比例关系,计算得：,.,效用曲线上新增两个点：,（2,0.25）,（22,0.75）,u,x,0,1,1,0.5,0.25,2,0.75,22,.,若认为点数太少，效用曲线不够精确，可继续按同样方法在新产生的区间内插入效用中点，直到产生足够的点为止。,.,做该问题的决策树，如图所示。决策人对四种后果优劣的排序是：,例天气预报说球赛时可能下雨，一个足球爱好者要决定是否去球场看球。不下雨去球场看球是最理想的，如果肯定下雨则留在家中看电视为好；不下雨在家中看电视虽然不如下雨看电视，但比下雨去球场看球挨淋要强。试设定各种后果的效用值。,.,第一步：令第二步：询问决策人，下雨在家看电视这种后果与去球场看球有多大概率下雨被淋相当，若决策人的回答是0.3，则,C1：下雨看球，C2：无雨看球，C3：下雨看电视，C4：无雨看电视,第三步：询问决策人，无雨看电视这种后果与去球场看球有多大概率下雨被淋相当，若决策人回答是0.6，则得到,.,看球：0.5*0+0.5*1=0.5看电视:0.5*0.7+0.5*0.4=0.55,看球：0.4*0+0.6*1=0.6看电视:0.4*0.7+0.6*0.4=0.52,下雨概率0.5：,下雨概率0.4：,.,产品开发问题(i)Noteminimumpossiblepayoffis-60(103)maximumpossiblepayoffis175(103)Chooseleastfavourablepayoff=-80mostfavourablepayoff=200(anyconvenientnumbers-60forleastfavourablepayoffand175formostfavourablepayoffwilldo)Setu(-80)=0u(200)=1Thisestablishestheendpointsoftheutilitycurveas(-80,0),(200,1),.,产品开发问题(ii)PosetotheDMaquestionwhichwillgivehiscertainmonetaryequivalent(CME)ofthefollowinglottery,DenotetheCMEofthislotterytobex,.,Thenu(x)=0.5u(200)+0.5u(-80)=0.51+0.50=0.5WhatevervalueDMspecifiesforx,itsutilitywillbe0.5asxistheCMEoftheabovelottery.Forx=200,thecertainoptionwillbepreferredtothelottery,butasxisreduced,indifferencewilloccuratsomepoint.Themorerisk-averseDMis,thelowerthisCMEvaluewillbeandthemoreconcavetheutilitycurve.,(iii)ObtainfurtherpointsbyputtingquestionstoDMusingothermonetaryvalueswhoseutilitieshavepreviouslybeenfound,.,Thenu(y)=0.5u(200)+0.5u(x)=0.51+0.50.5=0.75Continueuntilsufficientpointsareobtained.,e.g.wemightaskDMtoevaluateysuchthat,.,产品开发问题,(i),(ii),.,SupposeDMprovidesthefollowingpreferences,(iii),(iv),.,SupposeDMprovidesthefollowingpreferences,(v),.,3.2.3效用与风险的关系,在风险型或不确定型决策问题中，决策者选择方案几乎都要承担一定的风险，不同的决策者对风险的态度是有区别的。效用表示了决策者对决策方案各结果值的偏好程度，也反映了不同类型的决策者对风险的不同态度。因此从不同类型的效用函数可以看出决策者对风险的不同态度。,.,3.2.3效用与风险的关系,中立型效用函数设有效用函数u=u(x)，若对xlx2，有,则称该效用函数为中立型。,其效用曲线是一条直线。,中立型效用函数的效用值和结果值成正比例，因此可以用结果值直接评选方案。,.,3.2.3效用与风险的关系,保守型效用函数设有效用函数u=u(x)，若对xlx2，有,则称该效用函数为保守型。,其效用曲线是一条上凸曲线，表示效用值随结果值的增加而增加，但增加的速度逐渐由快至慢。反映了决策者随结果值增加越来越谨慎，对风险持厌恶态度。,.,3.2.3效用与风险的关系,冒进型效用函数设有效用函数u=u(x)，若对xlx2，有,则称该效用函数为冒进型。,其效用曲线是一条下凸曲线，表示效用值随结果值的增加而增加，且增加的速度越来越快。反映了决策者随结果值增加越来越敢于冒险追求高额回报的态度。,.,3.2.3效用与风险的关系,中立型效用函数,保守型效用函数,冒进型效用函数,.,3.2.3效用与风险的关系,混合型效用函数三种基本效用函数的混合，如：,混合型效用函数,表示当xx0时，即结果值不大时，决策者具有一定冒险精神；当xx0时，即结果值较大时，决策者对风险转而持谨慎态度。,x0,.,3.3效用函数表,一、效用函数表的构造实际构造效用函数时，取n=6定出效用曲线上的26（64）个点，效用函数的精度已经足够。书后附表6给出了n=6对于不同的权衡指标值(0.5时，对应的是冒进（下凸）型效用函数，效用函数值无法直接查表。,.,3.3效用函数表,一、效用函数表的构造可以证明：0.5的效用曲线u(x)与=1的效用曲线u(x)是关于直线u=x对称的。因此，0.5的效用函数值可以按下面的方法求得：u(x)1u(1x)具体步骤见教材P62。注：查表时在给定的列若没有对应的x值，则找出与之相邻的两个值x1、x2，查出对应的效用值后用线性内插的方法确定u(x)。,.,3.3效用函数表,二、效用函数表的使用例3.1某企业欲投产一种新产品，有三种方案可供选择。已知市场存在三种状态：畅销、一般、滞销，三种方案在不同的市场状态下所获利润额构成以下的决策矩阵：,决策者认为：o4.5（0.5,20；0.5,5）,.,例3.1试求该企业决策者的效用矩阵。,解：o*maxoij20，o0minoij5u(o*)=1，u(o0)=0将决策矩阵的结果值归一化：,得归一化后的决策矩阵为：,.,例3.1试求该企业决策者的效用矩阵。,由o4.5（0.5,20；0.5,5）得：,查P369附表6，0.38所在列，以x220.5为例：0.490621x220.50.503698而u(0.490621)0.65625，u(0.503698)0.671875用线性内插法：,解得u(x22)0.6675。,.,例3.1试求该企业决策者的效用矩阵。,同理得：u(x11)0.7300，u(x12)0.6091，u(x13)0.4306，u(x31)0.8742u(x32)0.5596，u(x33)0.2068且u(x21)u(o*)=1，u(x23)u(o0)=0,得决策者的效用矩阵为：,.,例3.2在上例中，若决策者认为：o11.25（0.5,20；0.5,5）试求该企业决策者的效用矩阵。,解：同上例方法得归一化后的决策矩阵为：,.,例3.2,由o11.25（0.5,20；0.5,5）得：,查P369附表6，1-0.65=0.35所在列，以x320.44为例，u(x32)1u(1x32)1u(0.56)：0.536890.560.5775而u(0.53689)0.734375，u(0.5775)0.75用线性内插法解得u(0.56)0.7433，因此：u(x32)1u(0.56)0.2567,.,例3.2,同理得：u(x11)0.3819，u(x12)0.2598，u(x13)0.1271，u(x22)0.2920u(x31)0.5725，u(x33)0.0251且u(x21)u(o*)=1，u(x23)u(o0)=0,得决策者的效用矩阵为：,.,3.4效用函数的曲线拟合,前面讨论了针对特定的结果值，如何测定其效用，我们得到的只是一些离散的效用值，要得到连续的效用函数，则需要用曲线拟合的方法。常见的拟合曲线形式线性函数型u(x)c1a1（xc2）其中c1、a1、c2为待定参数。前面查表时用内插法确定某些效用值，实际上就相当于效用函数为分段线性函数。,.,3.4效用函数的曲线拟合,常见的拟合曲线形式指数函数型,其中ci、ai（i1，2，3）均为待定参数。,双指数函数型,指数加线性函数型,.,3.4效用函数的曲线拟合,常见的拟合曲线形式幂函数型,其中c1、a1、c2为待定参数。不论采用哪种形式的函数，一般都尽可能化为线性函数通过最小二乘法确定待定参数。,对数函数型,.,3.4效用函数的曲线拟合,3.4.1幂函数型效用曲线的拟合幂函数的一般形式yta（0a1）当0a1时，幂函数曲线是上凸的。在区间（0，）上，曲线的曲率是变化的，因此为了取得最佳的曲线拟合效果，一般取幂函数曲线的某一段(待定)，作为效用函数的近似曲线。为此，作坐标平移变换：参见教材P66图3.6,.,3.4.1幂函数型效用曲线的拟合,幂函数型的效用函数坐标变换后得：Y-ca(Tc)a（0a1）令：,且Tx，则：,其中b、c为待定常数，这就是幂函数型的效用函数表达式。当a取特定值时，可设法用线性回归的

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第3章_效用函数

文档简介

温馨提示

最新文档

评论

第3章_效用函数

文档简介

温馨提示

最新文档

评论

相关文档