




已阅读5页,还剩53页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,主讲人:邓昇,贝叶斯决策分析,目录,贝叶斯决策概述贝叶斯决策的基本方法(重点)贝叶斯决策信息的价值抽样贝叶斯决策(难点)贝叶斯风险和贝叶斯原则(难点),一、贝叶斯决策概述,一、贝叶斯决策概述,(一)贝叶斯决策的意义在管理决策的实际过程中,往往存在两种偏向:(1)缺乏市场调查,对状态变量的概率分布情况掌握和分析还十分粗略就匆忙进行决策,使得决策结果与市场现实出入较大,造成决策失误;忽视了信息对决策的价值。(2)市场调查或局部试验的费用过高,收集的信息没有给企业带来应有的效益。没有考虑信息本身的成本。因此,我们既要充分重视信息对决策的价值,用补充信息的方法,使状态变量的概率分布更加符合现实市场状况,又要充分注意信息自身的价值,少花钱对办事。只有将两者合理地结合起来,才能提高决策分析的科学性和效益性。而如何将两者有机结合并加以科学分析,这就是贝叶斯决策所要解决的问题。,先看下面的例子。例:某公司经营一种高科技产品,若市场畅销,可以获利15000元;若市场滞销,将亏损5000元。根据历年的市场销售资料,该产品畅销的概率为0.8,滞销的概率为0.2。请问该公司经营该产品应如何决策?经营:15000*0.8-5000*0.2=11000元;不经营:0元。选择经营。这是一种常见的风险型决策,其基本方法是将状态变量视为随机变量,用先验状态分布表示状态变量的概率分布,用期望值准则计算方案的满意程度。由于先验状态分布与实际情况存在一定误差,为了提高决策质量,需要通过市场调查或局部试验等方法收集有关状态变量的补充信息,对先验分布进行修正,用后验状态分布进行决策这就是本章将要介绍的贝叶斯(Bayes)决策。这里主要介绍贝叶斯决策的基本方法、补充信息的价值、抽样贝叶斯决策以及贝叶斯风险和贝叶斯原则等内容。,(二)概率论与数理统计基础在讨论贝叶斯决策方法之前,先回顾概率论与数理统计中的一些知识,在后面的学习中经常会用到。1.全概率公式和贝叶斯公式(重要)离散情况设有完备事件组(j=1,2,n),满足:则对任一随机事件H,有全概率公式:,(公式1),贝叶斯公式:,(公式2),连续情况设随机变量的概率密度为,则对任一随机变量,有其中表示随机变量的密度函数,表示在条件下的条件密度函数。,(公式3),(公式4),2.条件概率设0,称为在事件A发生条件下,事件B发生的条件概率,简称条件概率。3.数学期望离散型随机变量的数学期望设离散型随机变量X有概率分布若级数绝对收敛,则称此级数之和为随机变量X的数学期望,记为E(X),即。,连续型随机变量的数学期望设连续型随机变量X有概率密度f(x),若积分绝对收敛,则称为X的数学期望。二维随机变量的函数的数学期望设Z是随机变量X,Y的函数Z=g(X,Y)(g是连续函数),则Z是一个一维随机变量。若二维离散型随机变量(X,Y)的联合分布律为i,j=1,2,且绝对收敛,则Z=g(X,Y)的数学期望为,若二维连续型随机变量(X,Y)的概率密度为f(x,y),且绝对收敛,则Z=g(X,Y)的数学期望为条件数学期望对于二维离散型随机变量(X,Y),在X取某一个定值,即X=的条件下,Y的条件数学期望,记作同样地,对于二元连续型随机变量,定义,其中及分别是在X=x的条件下Y的条件概率密度和在Y=y条件下关于X的条件概率密度。,4.离散型随机变量中的二项分布若随机变量X有分布律,k=0,1,n(其中0p1,q=1-p),则称X服从参数为n,p的二项分布,记为XB(n,p)。,二、贝叶斯决策的基本方法(一)引例:例1:某公司经营一种高科技产品,产品的销售情况有畅销(1),滞销(2)两种,据以往的经验,估计两种情况发生的概率分布和利润如下表所示:为了进一步摸清市场对这种产品的需求情况,拟聘请某咨询公司进行市场调查和分析,该公司对销售情况预测也有畅销(H1)和滞销(H2)两种,对畅销预测的准确率为0.95,对滞销,预测的准确率为0.9:试根据市场咨询分析结果,该公司经营该产品应如何决策?解:设该公司经营高科技产品有两个行动方案,即经营方案(a1)、不经营方案(a2)。该产品的市场销售有两种状态,即畅销(1)、滞销(2)。状态变量的先验分布为据题意,该公司的收益矩阵为,P(1)=0.8,P(2)=0.2,于是,由风险型决策的期望结果值准则因此,按状态变量的先验分布进行决策,最满意的行动方案为a1。即由于故有这表示,不论市场状态是畅销或是滞销,应该做出经营该产品的决策。,如果补充市场调查分析的信息,应如何决策分析?根据市场预测的准确率,即在实际状态j(j=1,2)的条件下,利用预测值Hi(i=1,2)的条件概率P(Hi/j)进行决策。这里预测值H1表示预测市场畅销,H2表示预测市场滞销。据题意,有P(H1/1)=0.95,P(H2/1)=0.05P(H1/2)=0.10,P(H2/2)=0.90市场预测的准确率可以表示为矩阵由全概率公式(1),咨询公司预测该产品畅销和滞销的概率分别为,由贝叶斯公式(2),在不同的预测值Hi(i=1,2)的条件下,状态值j(j=1,2)的条件概率分别为用补充信息(即市场预测)对状态变量(即畅销或滞销)的先验分布进行修正,得到的状态变量的概率分布称为后验,分布。后验分布表示为矩阵,称为后验分布矩阵。即当市场预测为畅销时,即事件H1发生,用后验分布的条件概率值P(1/H1),P(2/H1)去代替先验分布的概率值P(1),P(2),再计算方案a1,a2的期望收益值为,此时,aopt(H1)a1,表示当预测值H1发生时,最满意方案为经营该产品。当市场预测为滞销时,即事件H2发生,用后验分布的条件概率值P(2/H2),P(2/H2)去代替先验分布的概率值P(1),P(2),再计算方案a1,a2的期望收益值为此时,aopt(H2)a2,表示当预测值H2发生时,最满意方案为不经营该产品。,例1告诉我们,贝叶斯决策就是通过市场调查分析获取补充信息,利用补充信息修正状态变量的先验分布,依据风险型决策的期望值准则,用后验分布替代先验分布,使状态变量的概率分布更加符合实际情况,从而作出决策,找出最满意方案,提高决策的科学性和效益性。(二)贝叶斯决策的基本方法1.几个概念的含义状态变量指将研究的对象可能处于的状态视为变量,这里我们通常用来表示。如上面例1中的市场销售的两种状态,即畅销(1)、滞销(2)。先验状态分布指根据历年的资料所获得的状态变量的概率分布。,补充信息(信息值)指通过市场调查分析所获取的补充信息,用已发生的随机事件H或已取值的随机变量表示,称H或为信息值。信息值的可靠程度用在状态变量的条件下,信息值H的条件分布p(H/)表示。离散情况下若取n个值j(j=l,2,n),H取m个值Hi(i1,2,m),则信息值的可靠程度对应一个矩阵贝叶斯决策的似然分布矩阵:,2.贝叶斯决策的基本步骤贝叶斯决策的基本步骤如下:1)依据数据和资料以及经验和判断,去测算和估计状态变量的先验分布p();计算各可行方案在不同下的条件结果值;根据某种决策准则评价选择,找出最满意方案。2)比较分析补充信息的价值和成本的过程。目的:判断是否值得去补充信息?判断:如果信息的价值高于其成本,则补充信息给企业带来正效益,应该补充信息反之,补充信息大可不必。注:如果获取补充信息的费用很小,甚至可以忽略不计,本步骤可以省略,直接进行调查和收集信息,并依据获取的补充信息转入下一步骤。,验前分析,预验分析,3)利用补充信息修正先验分布,得到更加符合实际的后验分布;再利用后验分布进行决策分析,选出最满意的可行方案;对信息的价值和成本作对比分析,对决策分析的经济效益情况作出合理的说明。验后分析和预验分析的异同:,验后分析,相同:都是通过贝叶斯公式修正先验分布。,不同:主要在于侧重点不同,预验分析是依据可能的调查结果,侧重于判断是否补充信息。验后分析是根据实际调查结果,侧重于选出最满意方案。,4)(主要针对多阶段决策)指把复杂的决策问题的决策分析全过程划分为若干阶段,每一阶段都包括先验分析、预验分析和验后分析等步骤,每个阶段前后相连,形成决策分析全过程。序贯决策属于多阶段决策,这里我们主要讨论单贝叶斯决策。下面以实例来说明贝叶斯决策的基本方法。例2:某企业为开发某种新产品需要更新设备,有三种方案可供选择:引进大型设备(a1)、引进中型设备(a2)、引进小型设备(a3)。市场对该新产品的需求状态也有三种:需求量大(1)、需求量一般(2)、需求量小(3)。根据市场预测,企业的收益矩阵如下(单位:万元):,序贯分析,根据历年资料,该产品各需求状态的概率分别p(1)=0.3,p(2)=0.4,p(3)=0.3。为使新产品开发产销对路,该企业利用试销法做市场调查,在市场需求状态j的条件下,调查结果Hi的条件概率P(Hi/j)(I,j=1,2,3)如下表所示,H1、H2、H3分别表示调查结果值为需求量大、需求量一般、需求量小。试对该企业新品开发方案进行决策。,解:1)验前分析各行动方案的期望收益值:,E1maxE(a1),E(a2),E(a3)E(a1)=17(万元)因此验前分析后的决策为:引进大型设备。即:aopta1E1为不进行试销(市场调查)的期望收益。,2)预验分析由全概率公式得:由贝叶斯公式,得:,于是,后验分布矩阵为用后验分布代替先验分布,计算各方案的期望收益值。当市场调查值为H=H1,即市场调查结果表示该产品需求量大时,用事件H1发生的后验分布替代先验分布,计算各方案的期望收益值。,E(aopt/H1)maxE(a1/H1),E(a2/H1),E(a3/H1)E(a1/H1)=29.375(万元)当市场调查值H=H1时,最满意方案为a1,即aopt(H1)a1即试销为产品需求量大时,最优方案是引进大型设备。,当市场调查值为H=H2,即市场调查结果表示该产品需求量一般时,用事件H2发生的后验分布替代先验分布,计算各方案的期望收益值。,E(aopt/H2)maxE(a1/H2),E(a2/H2),E(a3/H2)E(a1/H2)=20.853(万元)当市场调查值H=H2时,最满意方案为a1,即aopt(H2)a1即试销为产品需求量一般时,最优方案是引进大型设备。,当市场调查值为H=H3,即市场调查结果表示该产品需求量小时,用事件H3发生的后验分布替代先验分布,计算各方案的期望收益值。,E(aopt/H3)maxE(a1/H3),E(a2/H3),E(a3/H3)E(a3/H3)=10(万元)当市场调查值H=H3时,最满意方案为a3,即aopt(H3)a3即试销为产品需求量小时,最优方案是引进小型设备。,3)验后分析通过试销,该企业可获得的收益期望值为:,该企业收益期望值能增加:,只要市场调查费用不超过3万元,通过市场调查补充信息在经济上是可行的,就应该进行市场调查;如果市场调查费用超过3万元,市场调查给企业将造成负效益,一般不宜进行市场调查。若试销结果是该产品需求量大或一般,则应该选择方案a1,即引进大型设备;若调查结果是该产品需求量小,则应该选择方案a3,即引进小型设备。,从前面的分析看出,利用补充信息来修正先验概率,可以使决策的准确度提高,从而提高决策的科学性和效益性。因此,信息本身是有价值的能带来收益。但获得的情报越多,花费也更多。因此有一个获取补充信息是否有利的问题:收益与成本的比较。问题:如何衡量信息的价值?(一)完全信息价值(EVPI)完全情报:指能够提供状态变量真实情况的补充信息。即在获得补充情报后就完全消除了风险情况,风险决策就转化为确定型决策。1.完全信息值设Hi为补充信息值,若存在状态值0,使得条件概率P(0/Hi)=1,或者当状态值0时,总有P(/Hi)=0。,三、贝叶斯决策信息的价值,则称信息值Hi为完全信息值。(补充信息可靠性100%)2.完全信息值Hi的价值设决策问题的收益函数为Q=Q(a,),其中a为行动方案,为状态变量。若Hi为完全信息值,掌握了Hi的最满意的行动方案为a(Hi),其收益值为Q(a(Hi),)maxQ(a,)验前最满意行动方案为aopt,其收益值为Q(aopt,),则称掌握了完全信息值Hi前后的收益值增量:为在状态变量为时的完全信息值Hi的价值。3.完全信息价值如果补充信息值Hi对每一个状态值都是完全信息值,则完全信息值Hi对状态的期望收益值称为完全信息价值的,期望值(expectedvalueofperfectinformation),简称完全信息价值,记做EVPI。在例1中如果补充信息(咨询公司市场调查)的准确度很高,预测畅销,则100%畅销;预测滞销,则100%滞销;这时:P(1/H1)=1,P(2/H1)=0P(1/H2)=0,P(2/H2)=1则H1(咨询公司预测畅销)、H2(咨询公司预测滞销)都是完全信息值(完全情报)。试求例1中决策问题的完全信息价值?若H1、H2都是完全信息值验前最满意行动方案为a1(生产新产品),(公式5),方法一:(利用公式5中前半部分的公式)完全信息值H1的价值=1.5-Q(a1,1)=1.5-1.5=0完全信息值H2的价值=0-Q(a1,2)=0-(-0.5)=0.5完全信息价值为:,方法二:(利用公式5中后半部分)此决策问题的收益函数为离散情况,完全信息值可根据公式5用公式由例1可知E(aopt)=E(a1)=11000(元)收益矩阵在掌握了完全信息条件下,当=1时,采取行动方案a1;当=2时,采取行动方案a2;于是,掌握了完全信息的期望收益值因此,完全信息价值EVPI=12000-11000=1000(元),(二)补充信息的价值(EVAI)1.补充信息价值在贝叶斯决策的实际工作中,获取完全信息是困难的。一般情况下,信息值Hi对状态值0来说,条件概率P(0/Hi)1,信息值Hi并非完全信息。因此,需要讨论补充信息的价值及其计算。补充信息值Hi的价值:决策者掌握了补充信息值Hi前后期望收益值的增加量(或期望损失值的减少量)。补充信息价值:全部补充信息值Hi价值的期望值,称为补充信息价值的期望值。简称补充信息价值,记做EVAI(ExpectedValueofAdditionalInformation)。2、补充信息价值(EVAI)的计算公式6:,其中:a()表示在信息值下的最满意方案,E/表示在信息值的条件下对状态值求收益期望值。公式7:公式8:R=R(a,)表示决策问题的损失函数例1中:验前最满意行动方案为a1(生产新产品)E(aopt,)=E(a1,)=1.1万元;a(H1)=a1,a(H2)=a2,EVAI=1.13-1.1=0.03万元,(三)EVAI与EVPI的关系任何补充信息价值都是非负的,且不超过完全信息的价值。即:EVPIEVAI0推导:实事上由公式8知由公式5得于是上式右边两项均非负,且第一项显然不小于第二项。因此,有:EVPIEVAI0信息价值对管理决策的意义任何补充信息决不会降低决策方案的经济效益!完全信息是一类特殊的补充信息,是最有价值的信息。同时,这也从理论上说明,信息工作是科学决策中十分重要不可缺少的环节。,贝叶斯决策的关键是利用补充信息修正先验分布,使后验分布更加符合市场实际,从而提高决策质量。获取补充信息的主要途径是本节所要讨论的内容。在管理决策中,最常用的获取补充信息的方法是抽样。用抽样方法修正先验分布的决策,称为抽样贝叶斯决策。1.抽样贝叶斯决策的意义设为来自决策总体的随机样本,为了描述总体的性质,选择一个适当的统计量X,称为决策统计量。在状态变量固定的条件下,决策统计量X的条件分布P(X=x/)称为抽样分布,决策统计量X的取值称为抽样信息值。利用抽样信息值作为补充信息值,去修正状态变量的先验分布,得到后验分布,再依据后验分布进行的贝叶斯决策,称为抽样贝叶斯决策。,四、抽样贝叶斯,2.抽样贝叶斯决策的步骤抽样贝叶斯决策除了补充信息是靠抽样方法获取之外,其基本方法和步骤与一般贝叶斯决策相同,即按照验前分析、预验分析、验后分析和序贯分析四步进行。在多数情况下,抽样分布可以应用数理统计中的二项分布计算,根据不同条件,也可以应用泊松分布、正态分布等其他分布计算。例3:设某公司的一条生产线成批地生产某种零件,每批为800件。现将零件组装成仪器,根据过去的统计资料分析,零件的次品率及其相应的概率如表所示。若组装成仪器调试时,发现次品零件则需要更换,每件更换的改装费为15元。若采取某种技术措施,可使每批零件的次品率降到最低为0.02,但每批要花费技术改造费500元。,下面看2道例题:,进行技术改造之前,采取抽样检验,抽取20个零件,发现一个次品。试对该公司是否应该采取技术改造措施作出决策分析。解:1)验前分析方案:不采取技术措施(a1),采取技术措施(a2),E1minE(a1),E(a2)=740因此验前分析后的决策为:采取技术措施。即:aopta22)预验分析如果允许抽样检验,设X=“抽取个零件中所含废品个数”,则:P(X=kj)=C20kjk(1-j)20-k,k=0,1,20,j=1,2,5计算得:P(X=11)=0.2725,P(X=12)=0.3774P(X=13)=0.2702,P(X=14)=0.1368P(X=15)=0.0576,根据全概率公式,后验概率:P(1X=1)=0.3903,P(2X=1)=0.4053P(3X=1)=0.1451,P(4X=1)=0.0490P(5X=1)=0.0103两方案的期望费用值:因此抽到1个次品后的决策为:不采取技术措施。即:aopta1其结论与验前分析相反。3)后验分析预验分析已完成,再比较调查费用与费用减少值决定是否抽样。,例4:某公司降价销售一批某种型号的电子元件,这种元件一箱100个,以箱为单位销售。已知这批元件每箱的废品率有三种可能,即0.20,0.10,0.05,其相应概率分别是0.5,0.3,0.2。假设该元件正品的市场价格为每箱100元,废品不值钱。该公司处理价格每箱为85元,遇到废品不予更换。某乡镇企业正需要购买这种元件,该企业应如何作出决策?如果该公司允许购买前从每箱中抽取4个元件进行检验,确定所含废品个数,假定抽样是可放回的,该企业应如何作出决策。解:1)验前分析设a1,a2分别表示该企业购买和不购买这批元件的可行方案。,E1maxE(a1),E(a2)=1因此验前分析后的决策为:购买该批产品。即:aopta12)预验分析如果允许每箱抽样4个检验,设X=“抽取个零件中所含废品个数”,则:P(X=kj)=C4kjk(1-j)4-k,k=0,1,4,j=1,2,3当X=0时,计算得:P(X=01)=0.4096P(X=02)=0.6561P(X=03)=0.8145由全概率公式得,后验概率:P(1X=0)=0.3628P(2X=0)=0.3487P(3X=0)=0.2885两方案的期望收益值:因此若抽样4个未抽取到废品,应购买该批产品。即:aopta1当X=1时,计算得P(X=11)=0.4069,P(X=12)=0.2916,P(X=13)=0.1715,后验概率:P(1X=1)=0.6271,P(2X=1)=0.2679,P(3X=1)=0.1050因此若抽样4个抽取到1个废品,则不应购买该批产品。即:aopta2当X=2时,计算得:P(X=21)=0.1536,P(X=22)=0.0486,P(X=23)=0.0135,后验概率:P(1X=1)=0.8163,P(2X=1)=0.1550,P(3X=1)=0.0287因此若抽样4个抽取到2个废品,则不应购买该批产品。即:aopta2。同理:抽到废品3、4个时,也不应购买该批产品。3)验后分析因此若抽样4个未抽取到废品,则应选择购买该批产品(a1),预期收益为2.815元;否则不应购买该批产品(a2),预期收益为0。抽样的预期收益为:比未经抽样就进行决策,其收益可增加:,3.抽样信息的价值当补充情报是采用抽样的方法获得时,这种补充情报价值习惯上称为抽样情报价值(ExpectedValueofSamplingInformation)记做EVSI。在例3中EVSI=E1-E2=167.55(元)在例4中EVSI=E2-E1=0.59(元)4.最佳样本容量在抽样贝叶斯决策中,抽样所支付的费用叫抽样成本。样本容
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 美容服务租赁合同范本
- 电气代维合同范本
- 产品销售合同范本格式2篇
- 厂房生活保障合同范本
- 兄弟房子转让合同范本
- 2025年卫生政策与管理知识测评试题及答案
- 知识竞赛题目及答案excel版
- 生物科技产业创新发展新趋势研究
- 2025年辅助判读题库及答案
- 2025年石油天然气开采行业安全生产考试题库及答案
- 2025年中国船舶集团校园招聘面试模拟题及答案
- 2025房屋租赁托管合同示范文本
- (2025年标准)股东合伙协议及分红协议书
- 污水处理厂设备安装施工方案
- 巴西白糖联营协议合同范本
- 2025年事业单位工勤技能-甘肃-甘肃护理员一级(高级技师)历年参考题库含答案解析(5卷)
- 通信技术的现状与发展
- 水稻全程机械化栽培技术
- 北京师大附中市级名校2026届中考适应性考试语文试题含解析
- 2025年秋季学期初中学校全面工作安排(含各周重点工作安排)
- 2025年山西省教师职称考试(理论知识)复习题及答案(新课标)-山西教师
评论
0/150
提交评论