第3章-效用函数市公开课一等奖省赛课获奖课件_第1页
第3章-效用函数市公开课一等奖省赛课获奖课件_第2页
第3章-效用函数市公开课一等奖省赛课获奖课件_第3页
第3章-效用函数市公开课一等奖省赛课获奖课件_第4页
第3章-效用函数市公开课一等奖省赛课获奖课件_第5页
已阅读5页,还剩70页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章效用函数第1页引言

决议特点之一是后果价值待定。为了用定量方法研究决议问题,除了要用主观概率量化自然状态不确定性以外,还需要量化后果价值。在量化后果价值时,会碰到两个主要问题:(1)后果本身是用语言表示,可能没有任何适当直接测量标度。(2)即使有一个明确标度(通常是钱)能够测量后果,按这个标度测得量也可能并不反应后果对决议人真正价值。第2页抽奖期望值有1250元,大于礼品确实定性收入1000元,不过一定有一部分人会选择这确定1000元收入。因为对他们而言,抽奖期望值虽大,风险也大,实际价值还不如保险1000元。而有人则相反,认为礼品不如抽奖,因为抽奖提供了取得2500元机会。例决议人面临图中决议树所表示选择:1000250001.00.50.5礼品a1抽奖a2▲▲▲▲●●第3页在商业经营中,经营者经常碰到类似情况,要在(1)期望收益较低不过有保险;(2)期望收益较高风险也较大这两种行动中进行选择。所以,在进行决议分析时,存在怎样描述或表示后果对决议人实际价值,方便反应决议人心目中对各种后果偏好次序(preferenceorder)问题。偏好次序是决议人个性与价值观反应,与决议人所处社会地位、经济地位、文化素养、心理和生理(身体)状态等相关。第4页在决议理论中,后果对决议人实际价值,即在有风险情况下决议人对结果偏好量化是用效用(utility)来描述。效用就是偏好量化,是数(实值函数)。第5页§3.1理性行为公理问题: 某企业拟推出一个新产品,经预测该产品在市场看好情况下,能够赢利10万;在市场前景较差时,将亏损1万元。市场看好和较差概率分别为0.6和0.4,是否推出该新产品? 若另有一产品可稳赢利2万元,推出哪种产品更加好? 这是一个随机决议问题。第6页§3.1理性行为公理 在随机决议中,决议系统(Ω,A,F)中决议方案均是在状态空间背景中加以比较,并按照某种规则,选出决议者最满意行动方案。 在本章中,我们用事态体表示在随机性状态空间中行动方案,方案比较表示为事态体比较,并引入效用概念,用以衡量事态体(行动方案)优劣。第7页§3.1理性行为公理3.1.1事态体及其关系1.事态体概念

定义3.1

含有两种或两种以上有限个可能结果方案(或事情),称为事态体。 事态体中各可能结果出现概率是已知。 事态体即随机性状态空间中行动方案。第8页1.事态体概念 设某事态体n个可能结果为:

o1,o2,…,on 各结果出现概率是对应为:

p1,p2,…,pn

则该事态体记为:

T=(p1,o1;p2,o2;…;pn,on)尤其当n=2时,称T为简单事态体,此时

T=(p,o1;1-p,o2)第9页1.事态体概念 事态体能够用树形图表示以下:Tp1p2︰︰︰pno1o2︰︰︰on当n=2时:pT1-po1o2第10页事态体集合Ŧ性质①在凸线性组合下,Ŧ是闭集。即: 若T1∈Ŧ,T2∈Ŧ,则当0≤λ≤1时,有

λT1+(1-λ)T2∈Ŧ

两个事态体凸线性组合仍是一个事态体。②T=(0,o1;0,o2;…;1,oj;…;0,on)∈Ŧ 称T为退化事态体。

退化事态体仍属于事态体集合。第11页2.事态体比较定义3.2

设o1,o2是事态体T任意两个结果值,依据决议目标和决议者偏好,o1和o2有以下关系:①若偏好结果值o1,则称o1优于o2,记作o1

o2;反之,称o1劣于o2,记作o1

o2。②若对结果值o1,o2无所偏好,则称o1无差异于o2,记作o1~o2。③若不偏好结果值o1,则称o1不优于o2,记作o1≼o2;反之,称o1不劣于o2,记作o1

≽o2。第12页2.事态体比较定义3.3

设两个简单事态体T1,T2含有相同结果值o1,o2,即:T1=(p1,o1;1-p1,o2) T2=(p2,o1;1-p2,o2) 并假定o1

o2,则:①若p1=p2,称事态体T1无差异于T2,记作T1~T2。②若p1>p2,称事态体T1优于T2,记作T1

T2;反之,称事态体T1劣于T2,记作T1

T2。第13页2.事态体比较定义3.4

设两个简单事态体T1,T2仅含有一个相同结果值,另一个结果值不相同,即: T1=(p1,o1;1-p1,o0) T2=(p2,o2;1-p2,o0) 且o2

o1

o0,①若p1≤p2,则事态体T2优于T1,记作T2

T1。②若T1~T2,则必有p1>p2。第14页§3.1理性行为公理3.1.2理性行为公理公理3.l(连通性,可比性)

事态体集合Ŧ上事态体优劣关系是连通。即若 T1,T2∈Ŧ 则或者T1

T2,或者T2

T1,或者T1~T2,三者必居其一。表示任意两个事态体都是能够比较其优劣!第15页§3.1理性行为公理3.1.2理性行为公理公理3.2(传递性)

事态体集合Ŧ上事态体优劣关系是传递。即若 T1、T2、T3∈Ŧ,且T1

T2,T2

T3,则必有 T1

T3。 表示任意多个事态体优劣是能够排序(若有些事态体无差异,可排在同一位置。)

满足公理3.1和公理3.2事态体集合称为全序集。

第16页§3.1理性行为公理3.1.2理性行为公理公理3.3(复合保序性,替换性)

若 T1,T2,Q∈Ŧ,且0<p<1,则T1

T2当且仅当

pT1+(1-p)Q

pT2+(1-p)Q。 表示任意事态体优劣关系是能够复合,复合后事态体保持原有优劣关系不变。第17页§3.1理性行为公理3.1.2理性行为公理公理3.4(相对有序性,连续性,偏好有界性)

若 T1,T2,T3∈Ŧ,且T1

T2

T3则存在数p,q,0<p<l,0<q<1,使得:

pT1+(1-p)T3

T2

qT1+(1-q)T3

表示任意事态体都不是无限优,也不是无限劣。第18页§3.1理性行为公理3.1.3事态体基本性质性质3.1

设事态体

T1=(p,o1;1-p,o0) T2=(x,o2;1-x,o0) 且 o1

o0,

o2

o0,若o2

o1 则存在 x=p’<p 使得

T1~T2 称x为可调概率值。第19页§3.1理性行为公理3.1.3事态体基本性质性质3.2(确定当量和无差异概率)

设事态体T=(x,o1;1-x,o2)且o1

o2。则对于满足优劣关系o1

o2任意结果值oξ,必存在x=p(0<p<l),使得

T=(p,o1;1-p,o2)~oξ 称结果值oξ为事态体T确定当量,称p为oξ关于o1与o2无差异概率。第20页3.1.3事态体基本性质性质3.3

任一事态体无差异于一个简单事态体。 设有事态体T=(p1,o1;p2,o2;…;pn,on)则必存在一个简单事态体

T’=(p’,o*;1-p’,o0

)~T其中: o*≽max{o1,o2,…,on} o0≼min{o1,o2,…,on}且:这里,qj(j=1,2,…,n)为oj关于o*与o0无差异概率。第21页3.1.3事态体基本性质依据性质3.3

比较普通事态体之间优劣关系,能够转化为比较简单事态体之间优劣关系(将问题简化)

得到事态体之间两两优劣或无差异关系后,再依据公理3.2(传递性)即可得到所讨论事态体排序。第22页§3.2

效用函数定义和结构 设有决议系统(Ω,A,F),在离散情况下,结果值能够表示为决议矩阵:第23页§3.2

效用函数定义和结构 矩阵O第i行表示第i个可行方案n个可能结果值,即事态体 Ti=(p1,oi1;p2,oi2;…;pn,oin)

(i=1,2,…,m) 决议就是要对这m个事态体进行排序。 由第一节中性质3.3知,存在简单事态体T’,使得

Ti’=(pi’,o*;1-pi’,o0

)~Ti 问题又化为对这m个简单事态体Ti’进行排序。第24页§3.2

效用函数定义和结构

Ti’=(pi’,o*;1-pi’,o0

)~Ti 注意到这m个简单事态体Ti’含有相同结果值o*、o0

,依据定义3.3,其优劣关系能够由比较pi’大小决定。 依据性质3.3qij是结果值oij关于o*与o0无差异概率。其中: 问题:怎样测定无差异概率?o*≽o0≼第25页§3.2

效用函数定义和结构3.2.1效用和效用函数概念效用概念定义3.5 设决议问题各可行方案有各种可能结果值o,依据决议者主观愿望和价值倾向,每个结果值对决议者都有不一样价值和作用。反应结果值o对决议者价值和作用大小量值称为效用。第26页§3.2

效用函数定义和结构3.2.1效用和效用函数概念效用函数概念

效用函数(曲线):反应决议者期望值与效用值对应关系.

效用决议:将结果用效用值代替,以期望效用最大为决议准则.第27页§3.2

效用函数定义和结构3.2.1效用和效用函数概念效用函数概念定义3.6 若在事态体集合Ŧ上存在实值函数u,有:(1)对任意T1、T2∈Ŧ,T1

T2当且仅当u(T1)>u(T2)(2)对任意T1、T2∈Ŧ,且0≤λ≤1,有u[λT1+(1-λ)T2]=λu(T1)+(1-λ)u(T2) 则称u(T)为定义在Ŧ上效用函数。第28页3.2.1效用和效用函数概念预计效用函数方法(1)标准效用测定法(概率当量法,V-M法)思绪:对于给定结果值,测定其效用值。 设有决议系统(Ω,A,F),其结果值集合为: O=(o1,o2,…,on)记: o*≽max{o1,o2,…,on} o0≼min{o1,o2,…,on}

对于每一个结果值oj都存在一个概率值pj,使得 oj~(pj,o*;1-pj,o0)

pj就能够作为结果值oj效用值。第29页3.2.1效用和效用函数概念(1)标准效用测定法(概率当量法,V-M法)步骤①设u(o*)=1,u(o0)=0;②建立简单事态体(x,o*;1-x,o0),其中x称为可调概率;③经过重复提问,不停改变可调概率值x,让决议者权衡比较,直至当x=pj时

oj~(pj,o*;1-pj,o0)④测得结果值oj效用

u(oj)=pj=pju(o*)+(1-pj)u(o0)第30页3.2.1效用和效用函数概念预计效用函数方法(2)确定当量法(修正V-M法)思绪:对于给定效用值,测定其结果值。步骤①设u(o*)=1,u(o0)=0;②对于给定效用值pj,结构简单事态体 (pj,o*;1-pj,o0)③经过重复提问,不停改变结果值oξ

,让决议者权衡比较,直至当oξ=oj时

oj~(pj,o*;1-pj,o0)④得效用值pj对应结果值为oj,即u(oj)=pj。第31页3.2.2效用函数结构 介绍一个实用效用函数结构方法。基本思绪

对于决议问题结果值集合,先用确定当量法找出一个基准效用值,即效用值等于0.5结果值,称为确定当量oξ。其余效用值按照类似方法测定,或是按百分比用线性内插方法,用同一个标准计算得到。第32页3.2.2效用函数结构方法 设决议问题结果值集合为: O=(o1,o2,…,on)①取

o*≽max{o1,o2,…,on} o0≼min{o1,o2,…,on}

并令u(o*)=1,u(o0)=0;②结构简单事态体(0.5,o*;0.5,o0),用确定当量法找到该事态体确实定当量oξ,使得: oξ~(0.5,o*;0.5,o0)第33页3.2.2效用函数结构方法③对结果值进行归一化处理,记归一化结果值为x(oj)

则:x*=x(o*)=1,x0=x(o0)=0,0≤x(oj)≤1④记确定当量oξ归一化值为ε,也记为x0.5第34页得到经归一化变换后效用曲线上三个点: (0,0),(ε,0.5),(1,1)ux011ε0.5第35页3.2.2效用函数结构方法⑤在新区间[0,ε]和[ε,1]按一样方法插入点(x0.25,0.25)和(x0.75,0.75),保持百分比关系计算得:第36页效用曲线上新增两个点: (ε2,0.25),(2ε-ε2,0.75)ux011ε0.50.25ε20.752ε-ε2第37页⑥若认为点数太少,效用曲线不够准确,可继续按一样方法在新产生区间内插入效用中点,直到产生足够点为止。第38页做该问题决议树,如图所表示。决议人对四种后果优劣排序是:例

天气预报说球赛时可能下雨,一个足球兴趣者要决定是否去球场看球。不下雨去球场看球是最理想,假如必定下雨则留在家中看电视为好;不下雨在家中看电视即使不以下雨看电视,但比下雨去球场看球挨淋要强。试设定各种后果效用值。

看球看电视θ1θ2θ1θ2C1下雨看球C2无雨看球C3下雨看电视C4无雨看电视第39页第一步:令第二步:问询决议人,下雨在家看电视这种后果与去球场看球有多大约率下雨被淋相当,若决议人回答是0.3,则C1:下雨看球,C2:无雨看球,C3:下雨看电视,C4:无雨看电视第三步:问询决议人,无雨看电视这种后果与去球场看球有多大约率下雨被淋相当,若决议人回答是0.6,则得到第40页看球:0.5*0+0.5*1=0.5看电视:0.5*0.7+0.5*0.4=0.55看球:0.4*0+0.6*1=0.6看电视:0.4*0.7+0.6*0.4=0.52下雨概率0.5:下雨概率0.4:看球看电视θ1θ2θ1θ2C1下雨看球C2无雨看球C3下雨看电视C4无雨看电视第41页产品开发问题(i) Note minimumpossiblepayoffis-60(103) maximumpossiblepayoffis175(103) Choose leastfavourablepayoff=-80 mostfavourablepayoff=200(anyconvenientnumbers≤-60forleastfavourable

payoffand≥175formostfavourablepayoffwilldo)Set u(-80)=0

u(200)=1Thisestablishestheendpointsoftheutilitycurveas (-80,0), (200,1)第42页产品开发问题(ii) PosetotheDMaquestionwhichwillgivehis certainmonetaryequivalent(CME)ofthe followinglotteryDenotetheCMEofthislotterytobe

x

第43页Then u(x)=0.5u(200)+0.5u(-80) =0.5×1+0.5×0=0.5WhatevervalueDMspecifiesforx,itsutilitywillbe0.5asxistheCMEoftheabovelottery.Forx=200,the"certain"optionwillbepreferredtothelottery,butasxisreduced,indifferencewilloccuratsomepoint.Themorerisk-averseDMis,thelowerthisCMEvaluewillbeandthemoreconcavetheutilitycurve.(iii) ObtainfurtherpointsbyputtingquestionstoDMusing othermonetaryvalueswhoseutilitieshavepreviously beenfound第44页Then u(y)=0.5u(200)+0.5u(x)

=0.5×1+0.5×0.5=0.75Continueuntilsufficientpointsareobtained.

e.g. wemightaskDMtoevaluateysuchthat第45页产品开发问题(i)(ii)第46页SupposeDMprovidesthefollowingpreferences(iii)(iv)第47页SupposeDMprovidesthefollowingpreferences(v)第48页3.2.3效用与风险关系在风险型或不确定型决议问题中,决议者选择方案几乎都要负担一定风险,不一样决议者对风险态度是有区分。效用表示了决议者对决议方案各结果值偏好程度,也反应了不一样类型决议者对风险不一样态度。所以从不一样类型效用函数能够看出决议者对风险不一样态度。第49页3.2.3效用与风险关系中立型效用函数

设有效用函数u=u(x),若对xl<x2,有则称该效用函数为中立型。其效用曲线是一条直线。中立型效用函数效用值和结果值成正百分比,所以能够用结果值直接评选方案。第50页3.2.3效用与风险关系保守型效用函数

设有效用函数u=u(x),若对xl<x2,有则称该效用函数为保守型。其效用曲线是一条上凸曲线,表示效用值随结果值增加而增加,但增加速度逐步由快至慢。反应了决议者随结果值增加越来越慎重,对风险持厌恶态度。第51页3.2.3效用与风险关系冒进型效用函数

设有效用函数u=u(x),若对xl<x2,有则称该效用函数为冒进型。其效用曲线是一条下凸曲线,表示效用值随结果值增加而增加,且增加速度越来越快。反应了决议者随结果值增加越来越勇于冒险追求高额回报态度。第52页3.2.3效用与风险关系ux110中立型效用函数保守型效用函数冒进型效用函数第53页3.2.3效用与风险关系混合型效用函数 三种基本效用函数混合,如:ux110混合型效用函数表示当x<x0时,即结果值不大时,决议者含有一定冒险精神;当x>x0时,即结果值较大时,决议者对风险转而持慎重态度。x0第54页3.3效用函数表一、效用函数表结构 实际结构效用函数时,取n=6定出效用曲线上26(64)个点,效用函数精度已经足够。 书后附表6给出了n=6对于不一样权衡指标值ε(ε<0.5)效用函数值。ε<0.5时,对应是保守(上凸)型效用函数,效用函数值可直接查表。ε>0.5时,对应是冒进(下凸)型效用函数,效用函数值无法直接查表。第55页3.3效用函数表一、效用函数表结构能够证实:

ε>0.5效用曲线u(x)与ε’=1-ε效用曲线u’(x)是关于直线u=x对称。所以,ε>0.5效用函数值能够按下面方法求得:u(x)=1-u’(1-x)详细步骤见教材P62。注:查表时在给定ε列若没有对应x值,则找出与之相邻两个值x1、x2,查出对应效用值后用线性内插方法确定u(x)。第56页3.3效用函数表二、效用函数表使用例3.1某企业欲投产一个新产品,有三种方案可供选择。已知市场存在三种状态:畅销、普通、滞销,三种方案在不一样市场状态下所赢利润额组成以下决议矩阵:决议者认为:oξ=4.5~(0.5,20;0.5,-5)第57页例3.1试求该企业决议者效用矩阵。解:o*≽max{oij}=20, o0≼min{oij}=-5

u(o*)=1, u(o0)=0将决议矩阵结果值归一化:得归一化后决议矩阵为:第58页例3.1试求该企业决议者效用矩阵。由 oξ=4.5~(0.5,20;0.5,-5)得:查P369附表6,ε=0.38所在列,以x22=0.5为例

:0.490621<x22=0.5

<0.503698而 u(0.490621)=0.65625,u(0.503698)=0.671875用线性内插法:解得u(x22)=0.6675。第59页例3.1试求该企业决议者效用矩阵。同理得:u(x11)=0.7300,u(x12)=0.6091, u(x13)=0.4306,u(x31)=0.8742

u(x32)=0.5596,u(x33)=0.2068且 u(x21)=u(o*)=1,u(x23)=u(o0)=0得决议者效用矩阵为:第60页例3.2在上例中,若决议者认为:

oξ=11.25~(0.5,20;0.5,-5)

试求该企业决议者效用矩阵。

解:同上例方法得归一化后决议矩阵为:第61页例3.2

由 oξ=11.25~(0.5,20;0.5,-5)得:查P369附表6,ε’=1-0.65=0.35所在列,以x32=0.44为例,

u(x32)=1-u’(1-x32)=1-u’(0.56): 0.53689<0.56

<0.5775而 u(0.53689)=0.734375,u(0.5775)=0.75用线性内插法解得u’(0.56)=0.7433,所以:

u(x32)=1-u’(0.56)=0.2567第62页例3.2

同理得:u(x11)=0.3819,u(x12)=0.2598, u(x13)=0.1271,u(x22)=0.2920

u(x31)=0.5725,u(x33)=0.0251且 u(x21)=u(o*)=1,u(x23)=u(o0)=0得决议者效用矩阵为:第63页§3.4

效用函数曲线拟合

前面讨论了针对特定结果值,怎样测定其效用,我们得到只是一些离散效用值,要得到连续效用函数,则需要用曲线拟合方法。常见拟合曲线形式线性函数型

u(x)=c1+a1(x-c2) 其中c1、a1、c2为待定参数。

前面查表时用内插法确定一些效用值,实际上就相当于效用函数为分段线性函数。第64页§3.4

效用函数曲线拟合常见拟合曲线形式指数函数型其中ci、ai(i=1,2,3)均为待定参数。双指数函数型指数加线性函数型第65页§3.4

效用函数曲线拟合常见拟合曲线形式幂函数型其中c1、a1、c2为待定参数。不论采取哪种形式函数,普通都尽可能化为线性函数经过最小二乘法确定待定参数。对数函数型第66页§3.4

效用函数曲线拟合3.4.1幂函数型效用曲线拟合幂函数普通形式 y=ta

(0<a<1) 当0<a<1时,幂函数曲线是上凸。在区间(0,+∞)上,曲线曲率是改变,所以为了取得最正确曲线拟合效果,普通取幂函数曲线某一段(待定),作为效用函数近似曲线。为此,作坐标平移变换:

参见教材P66图3.6第67页3.4.1幂函数型效用曲线拟合幂函

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论