版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章 效用函数 第一节效用的定义和公理系统一、引言为什么要引入效用 决策问题的特点:自然状态不确定以概率表示; 后果价值待定:以效用度量。1.无形后果,非数字量(如信誉、威信、出门带伞问题的后果)需以数值度量;2.即使是数值量(例如货币)表示的后果,其价值仍有待确定,后果的价值因人而异。例一:同是100元钱,对穷人和百万富翁的价值绝然不同;对同一个人,身无分文时的100元,与已有10000元再增加100元的作用不同,这是钱的边际价值问题。例2:礼品a1抽奖a21.00.50.510万元25万元0元在各类决策中,常常面临着这种选择:风险小但期望收益也小;期望收益大但风险也大!不同的决策人有不同
2、的选择,相同的决策人在不同的情境下选择也不同。那么在决策中如何描述或表达后果对决策人的实际价值,以便反映决策人心目中对各种后果的偏好次序呢?8/30/2022*偏好次序是决策人的个性与价值观的反映,与决策人所处的社会、经济地位,文化素养,心理和生理(身体)状态有关。 * 除风险偏好之外,还有时间偏好。 而效用(Utility)就是偏好的量化,是数(实值函数).Daniel Bernoulli 在1738年指出: 若一个人面临从给定行动集(风险性展望集)中作选择的决策问题,如果他知道与给定行动有关的将来的自然状态,且这些状态出现的概率已知或可以估计,则他应选择对各种可能后果的偏好的期望值最高的行
3、动。决策的目标就是使期望效用极大化。二、效用基本概念及符号严格序:ab表示a优于b。满足传递性和非对称性。无差异:ab表示a与b无差异。满足自反性、对称性和传递性。弱序:ab表示a不劣于b。满足可比性、传递性、与无差异的一致性和严格优于的一致性。展望(prospect)(可能的前景):各种后果(r种)及后果出现的概率的组合,记为:Pj=,(j=1,2,m; m为行动的可能种数)8/30/2022复合展望:当无法确定采取某个行动时,可随机选择一种行动,设选择行动aj的概率为qj。则决策的展望就是一种复合展望,记为P=。所有展望(包括简单展望和复合展望)构成展望空间。8/30/2022抽奖(lot
4、tery)与确定当量 若 ( ; )则称 确定性后果 为抽奖的确定当量效用的定义若展望空间上的实值函数u对于展望空间P的任意两个展望P1、P2,有P1P2 当且仅当 u(P1)u(P2),则称u为效用函数三、效用存在性公理(理性行为公理)连通性:任意两个展望的优劣都是可比的传递性:展望的优劣满足传递性复合保序性:展望的优劣关系是可以复合的,且复合不会破坏原有的优劣关系偏好的有界性:展望的优劣是相对的,没有无限优的展望,也不存在无限劣的展望。理性行为公理认为合乎理性的决策人在进行价值判断时一定能满足这些公理。(实际决策中是否存在某种悖论呢?)8/30/2022Allais悖论抽奖a1抽奖a21.
5、00.890.0150万元50万元0元0.10250万元抽奖a1抽奖a21.00.890.0150万元50万元0元0.10250万元决策A决策A抽奖b1抽奖b20.110.9050万元0元0.10250万元决策B实际上决策B是在决策A的基础上同时减去了89%的机会获得50万元,复合保序性没有得到满足0万元0.898/30/2022效用的公理化定义:在上述公理系统中,若展望空间上存在实值函数u,有:对展望空间中的任意展望P1、P2,P1P2 当且仅当 u(P1)u(P2)u(P1+(1-)P2)= u(P1)+(1-)u(P2) (复合展望的效用等于展望效用的复合)对满足上述条件的实值函数u1,
6、 u2, 必有u1(Pi)=bu2(Pi)+c, 其中b, cR1,b0。(任意两个决策人的效用是线性相关的)则效用函数u(P)为(基数)效用函数8/30/2022四、效用函数基数性和序数性前述定义的效用是一种基数效用,不仅能够反映决策者的偏好次序,还能够反映决策者的偏好强度。但在实际决策中,有时只需要偏好次序而不一定需要知道偏好强度就可以决策。此时只需要序数效用就可以了。有关序数效用的应用在多属性决策中介绍。Hicks对效用函数的基数性和序数性的比喻:如果知道两个人的身高,那么我们可以把高个儿排在第一位;如果不知道他俩的身高也没关系,让他们比一下就可以了。8/30/2022第二节效用函数的构
7、造一、估计效用函数值的方法概率当量法(Von Neumann, Morgenstern,N-M法):设决策系统的自然状态集=1, n、行动集A=a1, ,am、后果集C=cij=c(ai,j),最优后果为c*=max cij,最劣后果为c0=min cij。则对于任意后果cij的效用值u(cij),可按以下步骤获得:设u(c*)=1, u(c0)=0;建立简单展望,p可调反复向决策人提问,改变可调概率p,使得当p=pij时得到如下的无差异关系:cij测得后果cij的效用值为: u(cij)=pij*u(c*)+(1-pij)*u(c0)=pij8/30/2022确定当量法(修正N-M法):设u
8、(c*)=1, u(c0)=0;建立简单展望,p为0-1间的给定值,如p=0.5反复向决策人提问,改变cij得到如下的无差异关系:cij测得后果cij的效用值为: u(cij)=p*u(c*)+(1-p)*u(c0)=pij增益当量法:已知u(cij)和u(c0),确定u(c*)的方法损失当量法:已知u(cij)和u(c*),确定u(c0)的方法8/30/2022如何选择估计方法使用确定当量法时决策人对最优后果(增益)的保守性和对损失的冒险性都比概率当量法严重(Hershey,1982)采用增益当量法与损失当量法时产生的误差也比用概率当量法大尽可能使用概率当量法后果为离散型随机变量时,后果集中
9、元素为有限个,构造后果集上的效用函数有两个方面的内容,一是确定各后果之间的优先顺序,二是确定后果之间的优先程度。步骤:二、离散型后果的效用设定例:看球的效用函数构造(不考虑经济成本)构建问题的决策树,根据一般偏好,四种后果的优劣是C2C3C4C1;令u(C1)=0, u(C2)=1;询问1:“下雨看电视转播”的后果与“现场看球”时有多大的概率下雨被淋相当?(例如:0.3,则u(C3)=0.7)询问2:“天晴看电视转播”的后果与“现场看球”时有多大的概率下雨被淋相当?(例如:0.6,则u(C4)=0.4)一致性检验:用C3,C4加上C1(或C2)进行校验,直至一致性得到满足。现场看球a1电视看球
10、a2C4:天晴看电视C3:下雨没被淋C2:天晴未被淋C1:下雨被淋8/30/2022三、连续型后果效用函数的构造若后果是连续型,则可通过分析u(c)的若干特征值,求出特征点的效用后再连成光滑曲线。例:试作出每天投入学习的时间t对应的效用曲线。分析特征点:u(t=0)=0; u(tTM)=0(TM=?);状态导入期(0t0),效用增加较慢;状态稳定期(t0t1),效用与投入学习的时间基本成比例关系;效率下降,效用增加期(t1tm),效用是投入学习的时间的单调增函数,但增长率小于状态稳定期且随着时间的增加越来越小,最终达到零(t=tm),此时效用达到最大;当投入的学习时间大于tm时,将会得不偿失,
11、学习效率急剧降低,效用减少。8/30/2022t0t1tmtM024U(t)Umaxt8/30/2022四、效用曲线的解析函数近似适用于规范化的效用曲线规范化的效用函数是指0 x 1,且u(0)=0, u(1)=1的效用函数幂函数对数函数第三节风险与效用一、风险的概念风险:遇到破坏或损失的机会或危险。“风险”:以打鱼捕捞为生的渔民们在长期的捕捞实践中,深深的体会到“风”给他们带来的无法预测无法确定的危险,他们认识到,在出海捕捞打鱼的生活中,“风”即意味着“险”,因此有了“风险”一词的由来。风险包含两个方面的内容:一是后果的损失严重程度;二是损失出现的可能性大小。参考:/view/156901.htm8/30/2022二、风险的度量方差:设某决策方案a的后果为收益y,y的概率密度函数为f(y),期望值为E(y),则方差可用来度量风险,方差越大风险越大。协方差:若期望收益为决策人设定的目标收益c,则可用协方差度量风险。临界概率:小于目标收益的概率。8/30/2022三、效用包含的内容1、对风险的一种态度。U(t)Umax=1C(万元)风险厌恶型风险中立型风险追求型0.50912.51425风险酬金k8/30/20222、对后果的强度偏好3、可测价值函数四、相对风险态度1、效用函数反映的风险的局部测度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026儿童益智玩具市场消费趋势及投资价值评估报告
- 2026儿童服装设计创新与消费趋势调研报告
- 深度解析(2026)《GBT 26802.3-2011工业控制计算机系统 通 用规范 第3部分:设备用图形符号》
- 基础护理疼痛管理
- 2025地板材料(采购供应)合同
- 深度解析(2026)《GBT 25123.1-2018电力牵引 轨道机车车辆和公路车辆用旋转电机 第1部分:除电子变流器供电的交流电动机之外的电机》
- 深度解析(2026)《GBT 23981.2-2023色漆和清漆 遮盖力的测定 第2部分:黑白格板法》
- 西南地区数字普惠金融发展的影响因素分析
- 介入护理中的护理伦理
- 内科护理学教学资源配套课件
- 倪海厦汉唐药方全集
- 太空舱产品买卖合同
- 《新能源发电与控制技术 第4版》 课件 第1章 新能源发电与控制技术导论
- DL-T5418-2009火电厂烟气脱硫吸收塔施工及验收规程
- 安全隐患排查及整改制度
- 人教版小学四年级信息技术上册知识点整理与归纳
- 饭店送餐合同协议书
- 《肿瘤分子生物学》课件
- 记账凭证封面直接打印模板
- 治安管理处罚法一本通
- 头针疗法幻灯片
评论
0/150
提交评论