第04章:随机性决策问题的决策准则_第1页
第04章:随机性决策问题的决策准则_第2页
第04章:随机性决策问题的决策准则_第3页
第04章:随机性决策问题的决策准则_第4页
第04章:随机性决策问题的决策准则_第5页
已阅读5页,还剩123页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

决策理论与方法Decision

theory

and

method决策理论与方法第4章

随机性决策问题的决策准则主要内容引言严格不确定型决策问题的决策准则风险型决策问题的决策准则贝叶斯分析4.1.1决策问题的表示1.决策问题的表格表示——决策表决策表-表格化表示的决策问题决策矩阵-决策问题的后果是用收益表示时损失矩阵-决策问题的后果是用损失表示时对于一个决策问题,假设有有限个互不相容的可能的状态,记为:Θ={θ1,θ2,…,θn}同时假设只有有限种可行的行动,记为:A={a1,a2,…,am}把在真实的状态为θj时采用行动ai的后果记为xij,就可以得到决策表如表4.1。·状态·

行动·

…·

…··

a1·

x11·

x12·

…·

x1j·

…··

a2·

x21·

x22·

…·

x2j·

…··

…·

…·

…·

…·

…·

…··

ai·

xi1·

xi2·

…·

xij·

…··

…·

…·

…·

…·

…·

…··

am·

xm1·

xm2·

…·

xmj·

…·表4.1决策表的一般形式·状态·

行动·

…·

…··

a1·

u11·

u12·

…·

u1j·

…··

a2·

u21·

u22·

…·

u2j·

…··

…·

…·

…·

…·

…·

…··

ai·

ui1·

ui2·

…·

uij·

…··

…·

…·

…·

…·

…·

…··

am·

um1·

um2·

…·

umj·

…·表4.2用效用表示后果价值的决策表·行动·状态·

a1

·

a2

·

·

ai

·

··

1

·

l11

·

l12

·

·

l1i

·

…··

2

·

l21

·

l22

·

·

l2i

·

…··

·

·

·

·

·

··

j

·

lj1

·

lj2

·

·

lji

·

··

·

·

·

·

·

··转·置的损失n

矩·阵,l在n1

统·计决l策n2

理·论中…常·用的,l通ni

·常lji=…-uij表4.3用损失表示后果价值的决策表需要说明的是:决策表只适用于表示没有观察值的决策问题——无数据问题。有观察值的决策问题还是用决策树为宜。决策树表示法决策点机会点C1决策枝机会枝后果点后果值C2C3C4a1a2(

1)(

2)(

1)(

2)⑴确定型决策问题确定型决策问题的特点是决策人在进行选择之前了解真实的自然状态,即他可以确切地知道各种行动的后果。事实上,这就相当于假设自然状态的个数唯一,即:n=1,这时决策表形如表4.4。·表4.4

确定性决策问题的决策表·

这一价值的测类问题在度问题,形式化描但是这类述时要涉问题的求及到后果解纯属运对决策人筹学中的实际纯量优化问题,因此本书对此不作讨论。·行动·

状态·

a1·

a2·

…·

ai·

…·

am·

V11·

v12·

v1i·

v1m4.1.2

决策问题的分类4.1.2

决策问题的分类⑵严格不确定型问题决策人只能知道有哪些自然状态可能出现,他无法以任何方式量化这种不确定性,即他只能给出各种可能状态的列表,而对各种状态出现的可能性的大小一无所知,各种自然状态出现的概率无法估计。⑶风险型决策(重点)这一类决策问题中,决策人虽然无法确知将来的真实自然状态,但他不仅能给出各种可能出现的自然状态设定概率分布,还可以给出各种状态出现的概率,通过来量化不确定性。4.1.3决策准则与决策规则无论是不确定型问题还是风险型问题,都需要根据某种准则来选择决策规则δ,使结果最优(或满意),这种准则就叫决策准则,或称决策原则。例如贝叶斯分析的决策准则是使期望效用极大。本章重点是介绍贝叶斯分析方法,在介绍贝叶斯分析以前先在4.2节介绍用于严格不确定性决策问题的若干决策准则。在4.3节介绍用于风险型决策问题的其他决策准则。4.2严格不确定型决策问题的决策规则4.2.1主要决策准则严格不准确型问题的决策准则主要有下列几种。1.悲观准则悲观准则亦称极小化极大准则(Wald,1950)思路:考察可能采取的行动中最坏的后果,然后在所有最坏后果中找出损失最小的行动为作为首选行动。即:对于行动

,当可能出现的最坏后果,,使得最大的损失时,决策尽可能小,,使:根据式(4.1),这一准则称作极小化极大的理由是显而易见的。采用该原则的人一般来说是极端保守的悲观主义者,认为老天总跟自己作对,总是假设会发生最糟的情况并且被自己遇上。或者说是最大的损失为:人应选择行动即选择例:已知四个行动方案在四种自然状态下的损失值如下表所示:a1a2a3a410879•1•2•3•4•

6

9

•各行动最大损失见图中红色数字。根据极小化极大准则,其中损失最小的行动为a3

。所以a3是该准则下所选择的行动。•

4

1

••

13

13 •

16

16

•9

212

12

14148

102.乐观准则与Wald的悲观主义方法相对立,可以形成一种乐观主义的准则,即:(使损失)极小化极小准则。定义行动ai的乐观主义水平Oi为:Oi是采用行动ai时可能导致的最佳后果。于是乐观注意的准则是是损失极小化极小,即选择ak,使:i乐观主义者只考虑行动a各种可能后果中最好的(即损失最小的)后果,其实质是在损失矩阵中找出损失最小的元素lhk,决策人会选择lhk所对应的行动ak。见前例:•

a1

a2

a3

a4•107

9•2•

4

1•

9

2各行动最小损失:见图中绿色数字。•33

62•

1

1

1

140•

6

9

8

1根据乐观原则,应该4

选损失最小行动a2。采用该原则者极端冒险,是乐观主义者,认为总能撞大运。4•

1

8

•7213.Hurwitz准则(乐观系数法)该方法是Hurwitz在1951所提出。在现实生活中很少有人像极小化极大准则所显示的那么悲观,也很少有人象极小化极小准则那么乐观。因此他提出一种折衷:决策人应根据这两种准则的加权平均值来排列行动的优劣次序,其中的权称为乐观系数。由决策者个人给定,并适用于他所面临的所有决策问题。Hurwitz介绍的决策规则是:选择使:使用这种方法首先要确定λ。为此可让决策人对表4.5所示的简单的2×2决策矩阵进行判断。一旦确定λ,可用它求解决策人所面临的其他决策问题。调整表中的损失值与a2两者无差别时,即可确定,直到决策人认为a1。表4.5确定乐观系数的决策表·

a1·

a2·

si·

oi·

(1-)sk+Ok·(1-)·

L•a1•a2•a3•a410•8•7•94•1•9•213•16•12•146•9•8•104172132160.5123.51416.58678.58.59.58••••1••••234MinMaxλmin(1-λ)

maxλmin+(1-λ)经过m折ax

衷之后损失值最小的是行动a4,故采用这种准则应选择行动a4。例如,当λ=0.5时,在前面的例子中:4.后悔值极小化极大准则Savage,1951认为,真实的自然状态是决策人所无法控制的,在用损失矩阵 来作决策时,决策人会把采用一种行动ai在某一自然状态 j下的结果与同样的自然状态下采用不同的行动的结果加以比较。因此Savage定义了一个后果的后悔值rji,它是在状态为

j时采取行动ai的损失

与状态为

j采用不同的行动的最佳结果(最小损失)

之差。即:Savage

认为:应该用由rji构成的后悔值表

取代由

构成的损失值表,再用Wald的悲观主义方法求解。他提出每种行动的优劣用最大后悔值pi作为指标来衡量。pi即采取行动ai时的最大后悔值,然后再选择使pi极小化的行动。也就是说,选择ak,使:根据上述原则,得前例中的后悔值矩阵如下:•

a1

a2

a3•

10

8

7a49•1•2412••34719•

13

16

12

12

14•

6

9

8

106•1•302•2•3后悔值矩阵1081•314024•

0

3

2

•4各种行动的最大后悔值为见图中绿色数字。其中行动a1

的最大后悔值最小,所以按后悔值极小化极大准则应采取行动a1。38445.等概率准则Laplace于1825年在“无充分理由原则”一文中指出:对真实的自然状态一无所知“等价于”所有自然状态具有相同的概率。因此不妨认为选择一种行动使损失的平均值极小化是有正当理由的。于是决策人面临不确定结果的期望值:他应选择ak使:也可直接用每一个行动在所有状态下的损失值之和来表示,即33;34;36;35。因此采用等概率准则,选期望损失最小的行动为a1。•

a1

a2

a3

a4••••1234•

10

8

7

9•

4

1

9

2•

13

16

12

14•

6

9

8

1033/4

34/4

36/4

35/433

34

36

35••ijl

/4lij用前面的例子可得对应的值为:33/4;34/4;36/4;35/4,下表所示。决策准则的比较解决问题的思路完全不同,但是孤立地看,每种准则都有一定的道理。示例:4.2.2理想的决策规则应具备的性质其理想的决策规则应具备下列性质:完全序:能把方案或行动排成完全序;标号无关性:优劣次序与行动及状态的编号无关;标度无关性:优劣次序与测量所用的标度无关;强优势原则:若行动ak按状态优于aj,则应有ak优于aj;无关方案独立性:已经考虑过的若干行动的优劣不因增加新的行动而改变;在损失矩阵的任一行中各元素加同一常数时,各行动间的优劣次序不变;后果排序无关性:列中元素位置变换的不变性。某种状态下各种后果所在行复制的无关性:在损失矩阵中添加一行,这一行与原矩阵中的某行相同,则各行动的优劣次序不变。与上面的性质有关的公理如下:公理4.1完全的优劣次序:一种决策规则应能提供所有可能行动的完全的优劣次序。公理4.1中的“优劣次序”是弱序。公理4.1隐含:决策准则应当以某种方式为每一行动或方案ai

赋一个数值指标vi,并且根据vi的值增加(或减少)来排列行动的优劣次序。公理4.2标号无关性公理4.3决策结果的标度无关性定义4.1按状态优于如果每种自然状态下行动ai的后果不劣于另一种行动ak,即lji

ljk,且至少有一种状态

j使lji<ljk则称行动ai按状态优或称对ak有优势。若对任何状态都有lji<ljk,则称ai对ak有强优势。对决策准则的很自然的要求是,如果ai对ak有强优势,则这种准则应该使ai的排序优于ak。这就是下面的公理。公理4.4强优势原则:若对

j,有lji<ljk,则行动ai对ak具有强优势,决策规则应给行动ai和ak赋予指标值vi和vk,使得vi<vk。公理4.5无关方案独立性公理4.6某行中各元素加常数的无关性公理4.7某一行动的各种后果排列次序的无关性

公理4.8某种状态下各种后果所在行复制的无关性公理4.1到公理4.6对于任何一种决策准则,无论是用于严格不确定型决策问题的决策准则还是用于风险型决策问题的决策准则,都是必要的。后面介绍的期望效用决策准则也能满足满足公理

4.1-4.6。公理4.7到公理4.8则反映了严格不确定型决策问题的特征。4.2.3对决策准则的分析根据上面所给的理想决策准则应具备的性质,我们可以对前面的几种决策准则进行分析,看看各个准则是否满足这些性质。表4.8

Wald、Hurwitz、Savage和Laplace决策准则与公理的一致性(表中√表示满足,×表示不满足)表4.8

Wald、Hurwitz、Savage和Laplace决策准则与公理的一致性公理4.8

某种状态下各种后果所在行复制的无•关性(表中√表示满足,×表示不满足)••Wald

H

• S

Lurwit

avagz

eaplae•公理4.1

完全序√公理4.2公理4.3公理4.4标号无关性标度无关性强优势原则√√√公理4.5

无关方案独立性√公理4.6公理4.7同一状态下各后果值加常数的无关性•• √

•• √

•• √

•• √

•• √

•—

•√

•√

•√

•√

•√

•—

•√

•√

•√

•√

•—

•√

•√性某一行动的各种后果排列次序的无关•√

•√

•—

•√√

•√

•√

•—定理4.2设一种决策准则满足公理4.1和4.4-4.7,则该准则为每个行动ai赋予数字指标vi,使得:换句话说,能满足公理4.1和4.4-4.7的决策准则必定是laplace的平均损失极小化准则定理4.2推论没有哪种决策准则能满足公理4.1-4.8对比分析后的结论:虽然真实自然状态是不确定的,但这种不确定与严格不确定性概念所说的不确定有本质的区别,因此现实中的决策问题都不可能是真正的严格不确定性

的,于是我们要连同严格不确定性的概念一起抛弃公理4.7与4.8。研究问题的思路:为了判断某些方法的优劣,需要有一套衡量标准,这套标准以公理的形式表述,在用这些标准判断方法的优劣时还需要对标准的合理性加以权衡,甚至可以从根本上否定最初提出的基本概念的合理性。4.3

风险型决策问题的决策准则完全不确定型决策是在状态概率未知的条件下进行的,它的几种决策准则都带有很强的主观色彩,决策的结果因人而异一旦各自然状态的概率经过预测或估算确定下来后,决策分析得到的最满意方案具有一定的稳定性风险型决策分析(decision

under

risk)的前提是知道每种自然状态发生的概率由于风险型决策的意义更大,因此在不引起歧义的情况下,随机型决策分析特指风险型决策分析4.3

风险型决策问题的决策准则风险型决策问题的特点:决策人虽然无法确知将来的真实自然状态,但他不仅能给出各种可能出现的自然状态还可以给出各种状态出现的可能性,通过设定各种状态的(主观)概率

来量化不确定性。风险型决策分析的决策准则最大可能原则贝叶斯准则

伯努利准则E-V准则不完全信息情况下的决策准则优势原则与随机性决策准则4.3

风险型决策问题的决策准则最大可能值则:(众数原则)The

most

probable

state

principle基本思路:一个事件概率愈大,发生可能性也越大。因此可以假定出现概率最大的自然状态决策步骤:选择在概率最大自然状态条件下,收益值最大或者损失值最小的方案适用情况:求解一次性决策问题时使用本原则;(在一组自然状态中某一状态出现的概率比其它状态出现的概率大很多,并且其它状态下诸行动方案的损益值差别不很大)·

j·(

j)·

a1·

a2·

a3·

1·0.2·

7·6.5·

2·0.5·

3·0.3·

E(ai)=

Σi(

j)cij·4.1·3.6·3.74.3

风险型决策问题的决策准则2、贝叶斯准则:期望效用最大或期望损失最小。注:后果为损失值·在实际决策中,一般先确定后果对决策人的实际价值即效用函数(若是损失则使用负效用)(称为伯努利过程),然后再应用贝叶斯准则。·

j·(

j)·

a1·

a2·

a3·

1·0.2·

7·6.5·

2·0.5·

3·0.3·

E(ai)=

Σi(

j)cij·4.1·3.6·3.74.3

风险型决策问题的决策准则3、贝努利准则按照贝努利(Bernoulli)准则,应该首先确定后果对决策人的实际价值即效用函数,若采用损失,也应该是效用函数的负值;然后再用Bayes原则求最优行动。在随后介绍的各种方法,所用的决策准则实际上都是贝努利准则:使期望效用极大化,或者使期望损失极小化。4.3

风险型决策问题的决策准则4、E-V准则(均值-方差准则)期望值最大原则只考虑了收益值,忽略了风险1a1,a2均值=102=906.4,22=1.64.3

风险型决策问题的决策准则4、E-V准则(均值-方差准则):用期望与方差(度量风险)共同判决一个方案的优劣。4.3

风险型决策问题的决策准则4、E-V准则(均值-方差准则):·

j·(

j)·

a1·

a2·

1·0.2·

7·6.5·

2·0.5·

3·0.3·

E(ai)=

Σi

(

j)cij·4.1·3.6·

3.·

2=Σ

(l

-E(l

))2i

i

ij

i(

j)·2.29·3.79·

5.9方差越大,说明风险越大!厌恶风险的人偏爱风险较小的方案4.3

风险型决策问题的决策准则4、E-V准则(均值-方差准则):·帕累托优:若不存在方案al,使得方案ak的期望与风险均劣于al,称ak为有效方案或帕累托优。·评价函数:fi(E,V)=Ei+2fi(E,V)=Ei+fi(E,V)=Ei+i(E

2

+2)·

反映了决策人的风险态度,

>0风险厌恶;=0风险中立(对应于贝叶斯准则);

<0风险追求。决策准则—E-V准则4.3风险型决策问题的决策准则5.不完全信息情况下的决策准则6、优势原则与随机性决策准则在实际决策中,主观概率的确定有时是很困难的,因此可利用优势原则进行决策。·给不出准确的主观概率;·任何两个行动(方案)之间都不存在绝对优;·决策方法(以损失函数为例):列出方案ak最优的判别不等式组E(ak)≤E(ai),i=1,…,m求解不等式组的解即得到ak方案最优的概率分布判断这种概率分布是否可能4.3

风险型决策问题的决策准则4.3风险型决策问题的决策准则6、优势原则与随机性决策准则⑴优势原则4.3风险型决策问题的决策准则优势原则4.3风险型决策问题的决策准则(2)

随机策略当

(

1)>0.6时,方案a1最优;当

(

1)<0.6时方案a3最优;方案a2被称为强劣的(strongly

dominated)。决策准则—优势原则·

a1·

a2·

a3·

1注:后果为损失值贝叶斯决策分析贝叶斯定理回顾行动函数和贝叶斯风险贝叶斯决策分析方法获得情报信息的途径情报的价值及后验预分析决策前获得新情报(信息)的意义只要预先设定先验分布(prior

distribution),就可以用期望值准则对备选方案进行排序,找到达到给定目标(最大盈利或最小损失)的最优方案一般情况下,给定准确的先验分布是一件很难的事情。这时进行决策,决策人将冒很大的风险。因此决策人一般都愿意花费一定的时间和资金去减少决策环境的不确定性,以便减少决策的风险减少不确定性的方法就是通过一定的试验收集有关自然状态新的信息,以便改进对状态概率分布的估计,得到后验状态分布(posterior

distribution),从而提高决策的准确性不确定性及其度量方法—信息熵离散随机变量X,它有n个取值:a1,a2,…,an,取值出现的概率分别为p1,p2

,…,pn,则其信息熵定义为:可证明,当p1

=p2=…=pn

=1/n时,H(X)=logn最大,此时,随机变量X的不确定性最大,随着H(X)的减小,X的不确定性减低,当X是确定量时,信息熵为0信息量可以定义为“获得信息前后的信息熵之差”信息熵(information

entropy)的概念是信息论创始人香农

(Shannon)于1948年提出的结论当没有任何先验信息的情况下,自然状态θi的概率只能定为1/n,信息熵最大,此时的决策是完全不确定决策,风险最大当有先验信息时,自然状态θi的出现概率不再相等,信息熵减小,此时的决策风险降低如果能通过试验手段获得后验信息,则有可能进一步降低自然状态的信息熵,从而降低决策风险确定情况下,自然状态的信息熵为0,决策的风险为0两个问题决策人面临的两个问题:·如何进行试验获得更多的情报信息,以便修正先验分布并得到后验分布?·进行这样的试验是否值得?(信息的价值)目录1贝叶斯定理回顾行动函数和贝叶斯风险贝叶斯决策分析方法获得情报信息的途径情报的价值及后验预分析贝叶斯定理一般情况下,决策分析的结果往往对状态的概率分布比较敏感,即自然状态概率分布的小的变化会显著地改变分析结果,因此要提高决策分析的精度就必须设法提高状态概率分布的估计精度。显然,仅仅依靠决策人的经验作主观的估计,所设定的自然状态的先验分布的精度不可能有很大的改进,因此需要通过随机试验去收集有关自然状态的信息,以便改进所设定的自然状态的概率分布的准确性,从而改善决策分析的质量。贝叶斯定理随机试验是广义的,它包括了获取有关信息的一切可能的手段,只要这些信息有助于提高状态概率分布的准确性。例如:·出门是否带伞问题在事先听天气预报;·医生看病时做各种检查、化验;·生产厂家或经销商对商品的市场调查等等在决策分析中,如何设计随机试验去获取有效信息,如何利用新的信息改进状态概率分布,是非常实际而又重要的环节。利用新的信息,或者说通过信息处理修正原有的观点,是人类最重要的智力活动之一。贝叶斯定理条件概率:设A、B为随机试验E中的两个事件,在事件A发生条件下事件B发生的概率称为条件概率,记为

(B|A),且

(B|A)=

(AB)/

(A)。(A→B)若Aj(j=1,…,n)是样本空间S中n个互不相容的事

件,且

(Aj)>0,

(AkAl)=0(k≠l);∪j(Aj)=S。称Aj是样本空间的一个划分。则对任一事件B,有:贝叶斯定理:已知

(B|Aj)、

(Aj)(先验概率)

(j=1,…,n),求当事件B发生(随机试验的结果或观察值)时Ak发生的概率(后验概率)。贝叶斯定理在决策分析中的意义:在实际决策中,我们需要准确估计的随机变量是未来的自然状态Θ,而通过随机试验所观察到的往往是与之相关的另一个随机变量。例如,疾病诊断往往是通过观察症状如发烧、咳嗽等来判断其疾病如感冒、甲流。贝叶斯定理可以帮助我们判断当出现发烧时患甲流的概率。贝叶斯定理贝叶斯定理例4.2

设有A和B两个外形相同、装有足够数量黑白小球的不透明坛子,A坛中装有白球30%,黑球70%;B坛中白球70%,

黑球30%。从中任取一坛,作放回摸球12次,观察的记录是摸出白球4次,黑球8次。求所取为A坛的概率。(后页附解答)用本例子说明,通过试验和观察,可以修正先验分布,获得关于自然状态的更准确的判断,由此理解贝叶斯定理在决策分析过程中的重要作用。贝叶斯定理例4.2分析及结论可见——通过收集信息能减少不确定性(信息熵减小)信息的发生本身也是不确定的,是随机事件如何描述信息的发生概率非常重要,否则将得出错误的结果例2:经临床观察,患甲流的病人约70%发烧超过38度,患感冒的病人约40%发烧超过38度,而肺炎病人中有60%发烧超过38度。统计表明当前甲流发病率约15‰,感冒7‰,肺炎1‰。现有一病人发烧超过38度,请诊断该病人最可能患上哪种疾病。解:记发烧超过38度的事件为X;患甲流、感冒、肺炎分别记为A、B、C。先验概率分别为

(A)=0.015,

(B)=0.007,

(C)=0.001。条件概率分别为

(X|A)=0.7;

(X|B)=0.4;

(X|C)=0.6。则

(X)=0.7×0.015+0.4×0.007+0.6×0.001=0.0139·

(A|X)=0.7×0.015/0.0139=75.54%·

(B|X)=0.4×0.007/0.0139=20.14%·

(C|X)=0.6×0.001/0.0139=4.32%贝叶斯定理例2目录1贝叶斯定理回顾行动函数和贝叶斯风险贝叶斯决策分析方法获得情报信息的途径情报的价值及后验预分析损失函数为了使损失函数能够确切地反映后果对决策人的实际价值,令效用函数的负值为损失函数。基数效用在正线性变换下的惟一性使得损失函数在正线性变换下也是惟一的。为了运算的方便,可以采用下式使损失函数值非负:无论上述哪一种方式定义损失函数,对分析的结果不会有任何影响。例:(油井钻探问题)某公司拥有一块可能有油的土地,公司或自己开采,或以以下两种模式出租:①无条件出租,租金

45万元;②有条件出租,产量在20万桶或以上时,每桶提成5元;产量不足20万桶不提成。设钻井费用为75万元,采油设备费25万元(有油时),油价为15元/桶。假设油产量的可能状态及其先验概率分布如表。若决策人风险中立,决策人该选择什么行动?·

产油量·50万桶·20万桶·

5万桶·

无油·

()·10.·0.15·0.25·0.5石油公司的决策案例解:公司可采取的行动有3种:a1自己开采;a2无条件出租;a3有条件出租。决策表如下(单位:万元):井。·

产油量·50万桶·

20万桶·

5万桶·

无油·

期望效用·

(j)·0.1·0.15·0.25·0.5·

a1·650·200·-25·-75·51.25·

a2·45·45·45·45·45·根据贝a3

叶·斯准2则50,·方案10a01效·用最大0,·故应0自己·钻40石油公司的决策案例无任何情报信息下的决策完全不确定型决策问题(信息熵最大,不确定性最高)利用等可能准则,设每种可能性(共四种)的概率均为0.25·方案a1的收益期望值为:750/4·方案a2的收益期望值为:180/4·方案a3的收益期望值为:350/4所以最佳方案为a1回顾:损失值和损失矩阵损失值:指由于决策者不知道实际上将发生哪一种自然状态,致使所做的损失值函数决策不是:r(a,

θ)际最优的,表示自然决策所带来的状态θ下采用损失方案a带来的机会损失损失矩阵:决策表中每一自然状态下的最高收益值与其它收益值相比得到的差值矩石石油油公公司决决策策问问题的的损损失失矩阵阵·

产油量·

5实0万桶·

20万桶·

5万桶·

无油·

期望效用·

(

j)·

0.1·0.15·

0.25·

0.5·

a1·

650·200·

-25·

-75·

51.25·

a2·

4阵5·45·

45·

45·

45·

a3·

250·100·

40情报信息和行动函数(1)为了提高决策的可靠性,必须通过某种途径尽可能准确地去获得自然状态的后验概率θ,比如通过市场调查、咨询、试验等手段来获得情报信息通过情报收集的方法去获得补充信息时,得到一个与θ有联系的变量X。X的取值x称为情报信息·用地震探测资料来取得地质结构的信息,再来确定底层是否有油。X对应地质结构情报信息x在一定的自然条件θ下也是一个随机变量,其条件概率分布p(x|θ),这个分布一般容易获得·

x1

·

x2

·

x3

·

x4·1·

7/12·

1/3·

1/12·

0·2·

9/1

·

3/16

1/8

·

1/8·3·

11/24·

1/6

·

1/4

·

1/8石油公司的情报信息p(x|θ)情报信息

xx∈{1,

2,

3,

4}情报信息和行动函数(2)问题:在有情报信息的情况下,决策人如何根据情报信息x

去采取行动决策人的行动(即方案a

的选择)是x

的函数,称为行动函数,比如:行动函数也称为行动规则(决策规则)情报信息和行动函数(3)可以任意定义很多行动函数(行动规则)决策者的最终目的就是从所有可能的行动函数中,选择一个行动函数,作为最优行动函数什么样的行动函数是最优的?如何确定最优行动函数?风险最小可以作为最优的判据!特定行动规则下的决策风险函数风险是决策人采用某一行动规则的后果在情报信息为x

的条件下,由于此时的自然条件θ

仍不能完全确定,因此肯定存在风险真实的自然状态为θ

,决策人根据情报信息x

和决策规则δ(x)采取行动,相应的损失值函数为:

,它是一个随机变量对于给定的自然状态θ而言,损失值的期望值称为风险函数:风险函数的意义:在自然条件θ情况下,采用行动规则δ的损失期望值风险函数的例子(1)对于石油公司决策问题,假定某行动规则如下:如何求采用该行动规则的决策风险?风险函数的例子(2)如果自然条件为θ1(500万桶油井)探测地质结构为一类的可能性为7/12,二类结构的可能性为4/12,三类结构的可能性为1/12根据行动规则1,真实情况θ1

下采取a1

的可能性为7/12,采取a2

的可能性为0,采取a3

的可能性为(4/12+1/12)=5/12特定自然状态和行动规则条件下的风险函数值(后悔值的期望)风险函数的例子(3)如果自然条件为θ2(200万桶油井)·探测地质结构为一类的可能性为9/16,二类结构的可能性为3/16,三类结构的可能性为2/16,四类结构的可能性为2/16同理:有情报信息情况下的决策表无情报信息情况下的决策表和有情报信息情况下决策表相比·行动方案变为行动规则·益损值变为风险函数有情报信息情况下决策表的例子无情报信息时的决策表12不同的行动规则有情报信息时的决策表(x)(x)贝叶斯风险函数若决策人预先知道自然状态的先验分布:应用期望值原理,决策人采用行动

δ

的损失值期望值为: ,即贝叶斯风险意义:在预先给定自然状态的分布概率的情况下,根据情报信息和决策人选定的行动规则,所得到的损失期望值在一定的自然状态先验分布条件下,给定一个行动规则δ(x),就有一个贝叶斯风险值贝叶斯风险函数的例子如果给定先验概率:p(θ1)=0.1,p(θ2)=0.15,p(θ3)=0.25,对于风险决策表:p(θ4)=0.5则贝叶斯风险如下:显然,行动规则2的贝叶斯风险较小!小结得到采取某种行动方案的概率行动规则情报信息损失矩阵特定自然状态得到特定行动规则和自然状态条件下的决策风险得到采取某种行动规则的贝叶斯风险自然状态先验分布目录1贝叶斯定理回顾行动函数和贝叶斯风险贝叶斯决策分析方法获得情报信息的途径情报的价值及后验预分析贝叶斯决策分析的正规型贝叶斯决策原则:如果行动规则在同样先验分布的贝叶斯风险下的贝叶斯,则定义行动规则

优于小于行动规则风险值,即

行动规则最优决策就是贝叶斯风险最小的决策:贝叶斯分析的正规型:选择一个行动规则,使其贝叶斯风险最小例子可见行动规则δ2优于行动规则δ1如果不存在其它的行动规则优于δ2,则δ2是最优行动规则,即该情报信息条件下的最优决策注意,最优决策和先验概率相关!在先验概率:p(θ1)=0.1,p(θ2)=0.15,p(θ3)=0.25,p(θ4)=0.5条件下:贝叶斯决策分析的正规型的难点行动规则有无穷多个,不可能计算出每一个行动规则的贝叶斯风险值,然后进行比较一般采取贝叶斯决策分析的扩展型贝叶斯分析的扩展型(1)贝叶斯分析的扩展型(2)步骤一:用试验数据来修正自然状态的先验分布,得到后验分布,然后用期望值法求出每一个行动a

的期望后悔值(或期望损失),选其中期望后悔值(或期望损失)最小的行动,就是在给定试验数据x的情况下的最优行动步骤二:对每一个试验数据x

,进行同样的贝叶斯分析,就可以得到决策人根据试验数据x

所采取的一组最优行动规则δ(x)贝叶斯决策分析的例子(1)贝叶斯决策分析的例子(2)贝叶斯决策分析的例子(3)贝叶斯决策分析的例子(4)综上,最优决策规则为:9798目录贝叶斯定理回顾行动函数和贝叶斯风险贝叶斯决策分析方法获得情报信息的途径情报的价值及后验预分析基本途径试验·比如通过加工试验获得机床的运行状态咨询·向专业机构(气象台、地质局)或专家咨询·咨询的结果就是情报信息抽样·常称为抽样贝叶斯决策分析·抽样的统计结果也是情报信息……99通过咨询来进行贝叶斯决策的例子行动规则抽样的意义抽样检查(抽检)是获得情报信息的重要手段为了解一批产品中次品率的情况,可以从这批产品中提出一定数量的样品进行检查,然后对总体进行评估构造决策统计量,该统计量代表抽样情报信息抽样分析的例子某厂生产某种设备,其中一个关键部位的质量不够稳定,其次品率有时为0.05,有时为0.25。该部件按批量生产,每批1500件。据统计,在过去生产的各批部件中,次品率为0.05的占80%该厂对一批部件,可以:在使用前逐个检查,剔除所发现的次品,这样每个部件的检查费为15元也可以整批部件都不检查就用于设备装配,这样在设备最终调试时还得拆换该部件的次品,其检查、拆换费用为每件次品100元还可以从一批部件中先抽取部分样品送交实验室严格检验,根据检验结果再决定检查或不检查。抽样检验费用为每件125元问该厂如何检查该部件?比较全检和不抽检两种方案•

a2(不检)•

-7500•

-37500•

-13500因因此此,,选择择不不抽抽检检比比全全检好好。。为为了了保保险起起见见,,应应该先抽检,并根据抽检结果决定是否全检或不检,那么抽多少次最合适?θ1

(次品率0.05)θ2

(次品率

0.25)期望收益0.80.2

a1(全检)-22500-22500-22500θ1

(次品率0.05)θ2

(次品率

0.25)期望损失0.80.2

a1(全检/p>

a2(不检)0150003000收益矩阵和损失矩阵抽检一次的情况h1:结果为合格品,h2:结果为不合格品求得:·

p(h1)=0.91,

p(h2)=0.09·

p(θ1

|h1)=0.84,

p(θ2

|h1)=0.16·

p(θ1

|h2)=0.44,

p(θ2

|h2)=0.56决策结果:如果h1发生,则a2(不检),如果h2发生,则a1(全检)期望损失h1

(0.91)h2

(0.09)a1(全检)126006600a2(不检)24008400抽检两次的情况h1:全部为合格品,h2:一合格,一不合格,h3:全部为不合格品求得:·

p(h1)=0.8345,p(h2)=0.151,p(h3)=0.0145·

p(θ1

|h1)=0.87,

p(θ2

|h1)=0.13·

p(θ1

|h2)=0.5033,

p(θ2

|h2)=0.4967·

p(θ1

|h3)=0.14,

p(θ2

|h3)=0.86决策a1(全检)期望损失h1(0.83 45)h2(0.151)

h3(0.0145)a1(全检)130507549.672100结•果:如a2果(不检)h1•或h2发19生50,则•a2(不检745)0,.3如3果•h3发生12,900则抽检三次的情况h1:全部为合格品,h2:两合格,一不合格,h3:一合格,两不合格,h4:全部为不合格品求得:·

p(h1)=0.7703,p(h2)=0.1927,p(h3)=0.0338,

p(h4)=0.0032·

p(θ1

|h1)=0.8905,

p(θ2

|h1)=0.1095·

p(θ1

|h2)=0.5621,

p(θ2

|h2)=0.4379·

p(θ1

|h3)=0.1685,

p(θ2

|h3)=0.8315·

p(θ1

|h4)=0.031,

p(θ2

|h4)=0.969,则期望损失h1h2h3h4a118432527465(全检)33582决策•结果a:2

如a1(全(检不)检)果•h1或1h2642发•生,6则56a82(•不检)1,24如73果h•3或h41发45生35目录1贝叶斯定理回顾行动函数和贝叶斯风险贝叶斯决策分析方法获得情报信息的途径情报的价值及后验预分析一个需要权衡的问题进不进行试验、咨询或抽样本身也是一个决策问题·通过试验、咨询或者抽样获得的新情报可以修订先验分布而得到后验分布,使决策的准确度提高·但试验和抽样需要成本,如果收益比代价大,则获得情报就是正确的决策,否则是错误的决策比如:·新产品投放市场之前,值不值得进行市场调查?·抽样调查时,该不该进行抽样?进行多少次抽样最合适?完全情报和不完全情报价值在某些情况下,有可能在获得补充情报后完全消除风险,而使我们在确定情况下进行决策,这种情报称为完全情报,它是情报价值的上限如果获得补充情报后,仍然存在不确定的因素,这种情报就是不完全情报不完全情报的价值应该小于完全情报的价值如何对情报的价值进行度量?完全情报的价值完全情报的价值完全情报的价值EVPI(Expected

Value

of

Perfect

Information)确定情况下的收益无任何情报情况下的收益完全情报的价值—=EVPI(Expected

Value

of

Perfect

Information)无任何情报情况下的损失值确定情况下的损失值=0完全情报的价值—=无任何情报情况下的损失值=不确定性的代价=石油公司的完全情报公式1·确定情况下的收益=650*0.1+200*0.15+45*0.25+45*0.5=

128.75·不确定情况下的收益=650*0.1+200*0.15-25*0.25-75*0.5=

51.25·完全情报的价值=

128.75-51.25=77.50.10.150.250.5石油公司的完全情报公式2·完全情报的价值=无任何情报情况下的损失值=各方案的最小损失值=

70*0.25+120*0.5=77.50.150.250.5损失矩阵

0.1补充情报的价值(1)补充情报价值(E

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论