杰弗里的决策逻辑初探_第1页
杰弗里的决策逻辑初探_第2页
杰弗里的决策逻辑初探_第3页
杰弗里的决策逻辑初探_第4页
杰弗里的决策逻辑初探_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、杰弗里的决策逻辑初探胡毅敏杰弗里(richard jeffrey) (1926)是美国著名的逻辑学家,他在决 策逻辑、归纳逻辑、形式逻辑、逻辑与计算机、机遇和可能性等方面 都有深入的研究。他的专著决策逻辑在1965年出版,于1983和 1990年两次进行了修订。在这部著作中,他介绍了决策逻辑的发展 过程,在主观贝叶斯主义框架下,用逻辑和数学的方法构建了自己独 特的决策理论,并对许多问题进行了哲学上的思考。因此,对杰弗里 的决策逻辑思想的探讨是很有意义的。一、决策过程1. 决策的一般过程决策逻辑主要研究风险型决策问题。在风险型决策的过程中,有两个 因索起着决定性的作用。一是决策者无法控制的世界状

2、态,二是决策 者对某些行为在某个状态下可能产生的后果的主观估计。我们用概率 (probability)來描述状态出现的可能性的大小,用期望(desirability) 来描述后果在决策者心目屮的价值。期望常由金钱、物品或其它事物 来体现,也能用数值对它进行度量。决策者执行哪一种行为,需要对 每种行为在所有状态下的后果作全面的考虑,我们可以通过计算每个 行为的估计期望(estimated desirability)值,然后进行比较和抉择。 一个行为的估计期是该行为所有后果的期望的加权和。其中,权数为 每一后果所处状态的概率。(在国内的有关文献中常用“期望效用” 描述“估计期望”)。这样,我们可以

3、根据贝叶斯原则,选择执行具有 最大估计期望的行为。设决策问题有n个行为:ai,a2/-*an,可能的状态有m个:bi, b2,- bm, 笫j种状态发生的概率为p)(j = 1, 2,m),笫i个行为(i = 1,2,n) 在第j种状态下的期望为dij9 ©表示第i个行为的估计期望。则© = zpjdij = pldii+pmdim,利用这个公式,可以分别求出n个行为的估计期望值,我们选择执行 那个具有最大估计期望值的行为。还可以把行为按照它们的估计期望 值的由大到小顺序排序,建立行为的偏好等级。决策的原则是:执行 具有最高偏好等级的行为之一。这个原则称为贝叶斯原则。一般地

4、,在同一的决策过程屮,状态的概率和后果的期望都是唯一的。2. 古典决策理论在决策过程中,如果状态的概率是唯一的,后果的期望却不相同,一 般來说可能产生不同的偏好等级。但也有特殊情况。当后果的期望以 特殊方式相联系,在概率相同的条件下,它们产生的行为的偏好等级 相同。古典决策理论的代表有蓝姆塞(f.p.ramsey)和萨维奇(l.j.savage) 等。在古典决策理论屮,后果的期望的联系方式是:一个期望值是另 一个期望值的带有正系数的线性变换。具休地:设决策问题有n个行为:ai, a?,可能的状态有m个:bh b?,bm, 第j种状态发生的概率为pj(j = l,2,m)。第一种情况是,第i个行

5、 为(i二1, 2,n)在第j种状态下的期望为山,勺表示第i个行为的估计 期望。第二种情况是,第i个行为(i=l,2,,n)在第j种状态下的期 望为dq, e表示第i个行为的估计期望。这里,dq与山的关系为: dy= adjj+b (a是正数,b是实数),则pjdjj= p 1 dj j+ ei = spjdij = pidi+pmdim=pi(adii+b)+pm(adhn+b)二 a(p i 山 i+pmdim)+b(p i+pm) o令b (pi+pm)二则ej = ae汁r。因为a>0, r为任意实数,所以, 如果ek>ep则必有ek>ei;如果ek<ep则必有

6、ek<el;如果e, 则必有 ek= ei(k = 1, 2,,n, 1=1, 2,n)o 故行为的偏好等级不会被期望值的这种变换打乱。由此,我们看到,一个期望标准可以用另一个期望标准代替而不改变 行为的偏好等级。在一般的决策理论中,主观概率是对状态而言的,它是某个人对状态 出现的一种相信程度;期望是对后果而言的,表明某个人对于后果的 渴求程度。在决策逻辑屮,我们将状态、后果和行为都作为命题来处 理。用符号proba表示命题a的概率;用符号desa表示对命题a的 期望,用瓦表示命题a的否定,用ab表示命题a与b的合取,avb 表示命题a与b的析取。命题的合取和析取可以推广到两个命题以 上

7、的情况。用t表示必然命题,用f表示不可能命题。并且命题的 概率和期望满足下面的概率公理和期望公理。概率公理:(a) 概率是非负的:probx>0o(b) 概率是正常的:probt = 1 o(c) 概率是可加的:如果xy = f,贝iprob(xvy) = probx+prob y o概率的可加性说明:如果命题x, y互不相容,则xvy的概率为x, y的概率之和。期望公理:如 果 probxy =0 且 prob(xvy)0 ,贝ij des(xvy)=(probxdesx4-probydesy)/(probx+proby)o期望公理是说,不相容命题的选言命题xvy的期望是这两个命题的

8、加权平均数。这里,权数probx和proby正是这两个命题的概率。有 了期望公理,我们可以将估计期望看作为期望的运算。用这种表示方法,上述理论可表述为:假设prob,des和prob,des是两对赋值,两者都代表确定的偏好等 级,若对任意命题x,有:probx = probx,desx=adesx+r (a为正数,r为实数),那么,如果prob, des代表一个偏好等级,我们能选择正数a和实数r, 运用上述等式得到prob, des,它们代表的偏好等级与prob, des代表 的偏好等级一致。在这里,概率是唯一的,期望是不唯一的,prob, des与prob, des代 表的偏好等级一致。我们

9、进一步思考,如果对任意命题x, probx 与probx不相等,desx与desx也不相等,那么,在什么条件下, prob, des与prob,des代表的偏好等级一致?杰弗里给出了这个问 题的解答。二、杰弗里的决策逻辑在这部分内容中,等式probx = probx和desx = adesx+b的作用 由更为复杂的等式执行。在数学上的工作是由波克(e.bolker)完成 的,他提出了相等法则。杰弗里把波克的相等法则运用于偏好理论, 构建了现代意义下的贝叶斯决策逻辑。1 波克的相等法则假设:prob, des和prob, des是两对不同的赋值,它们之间的联系 为:(2-1) probx = p

10、robx(cdesx+d),(2-2) desx = (adesx+b)/(cdesx+d) o这里,a, b, c, d是任意常数。这两对赋值能否反映同一个偏好等级呢? 为了解决这个问题,先给岀存在条件。存在条件:有一对满足概率公理和期望公理的值prob和des,反映了 命题的偏好等级。则desa是大于、等于或小于desb,依赖于a的等 级大于、等于或小于b的等级。如果当旧的一对赋值prob, des满足存在条件时,我们能说明在一定 的条件下,新的一对赋值prob, des也满足存在条件,我们就能确 定它们能反映同一组命题的偏好等级。相等法则:假设prob, des满足存在条件,等式(21)

11、和(22)对于偏好等级中的所有x都成立,下列(23)也被满足,那么prob, des也满 足存在条件。(2-3) (a) ad-bc是正数;(b)对于偏好等级中的每一个x, cdesx+d也 是正数。(c) cdest+d=l相等法则表明,在讨论命题的偏好等级时,所用的概率和期望对并不 是唯一的。那么,期望的范围是什么?两个期望标准之间的关系如何 宜观地表示?下面,我们就这两个问题进行讨论。2.期望的范围市变换(22),即使有desa=desa, desb=desb,也不能保证所有的 命题在两个标准下的期望一致。要完全一致,还需要对于任意c,都 冇 desc=desco我们把注意力集中到des

12、和des对于两个不同等级命题的期望相一 致的情况。设:(2-4) dest = dest = o, desg = desg = 1 o这样,就为期望找到了 0和单位1。(这种选择是为了讨论方便)在(21)中,设 x 二 t,有 1 = l(c0+d),即 d= lo在(2-2)中,设 x = t,有 0 = (ao+b)/(co+d),即 b = 0o在(2-2)中,设 x = g,有 1 =(al+0)/(cl+l),即 a = c+lo这样,在(24)成立时,等式(23)(b), (2-2)和(21)分别有如下形式: (2-5) cdesx>-l,(2-6) desx = (c+l)

13、desx)/(cdesx+l), (2-7)probx = (probx)(cdesx4-l), 在(27)中,设x = g,有: (2-8) probg/probg 二 c+1 二 a。以上讨论的特殊等式,为我们探讨期望的范围作了准备。假设desx的范围有如下4种情况:(s,i是常数)(a) -00<desx<+00; des既无上界,也无下界;(b) i<desx<+°°, des 无上界,有下界;(c) -°°<desx<s, des 有上界,无下界;=0,这时(26)和(27)(d) i<desx<

14、s, des既有上界,又有下界。 当des既无上界也无下界时,条件(25)屮, 为如下形式:desx = desx,probx = probxo这时,对于任意命题x,新旧期望值与新旧概率值都各自相等。des =des, prob = prob,两个标准退化为一个标准。当des有上界,无下界时,des可取任意小的负值,则没有足够小的 正数c,保证(25)的左边总大于右边;当des无上界有下界时,des可取任意大的正值,没有足够接近于0的负值c,保证(25)左边总大 于右边。因此,这两种情况不满足条件,我们把它们排除。这样,我们仅需要考虑des既有上界,又有下界的情况。这时,(2-5) 中的c不为

15、零。可以通过考察c的取值范围,來得出期望的范围。 先给出最小上界和最大下界的概念:假设在偏好等级中不存在这样的命题,它的偏好等级与每一个命题的 等级相同。如果有数s,使得s>desx,没有更小的数具有这个性质, 称s为des的最小上界。类似地,有数i,使得i<desx,没有更大的 数具有这一性质,称i为最大下界。如果x是好命题,desx为止,(25)能写成o-1/desxo 因为无论命题x的偏好等级有多高,不等式都成立,故c>-l/so 类似地,如果x是一个坏命题,desx为负,(25)能写成:c<-l/desxo 因为无论命题x的偏好等级有多低,不等式都成立,故c&l

16、t;-l/io 联立上述两不等式,有:(2-9)-l/s<c<-l/io特殊地,因为desg = 1, s必大于1,故有: (2-10) c>-k我们可以通过作图,更直观地说明期望的范围以及新旧期望值之间的 关系。desdes图(a)desx图(b)在图中,直观地展示了 desx与desx的关系。des标准是des标准 的一个投影,des是由p点,将纵轴上的des投影到横轴上而得。同一个命题的期望在des标准屮用横轴上的点代表,在des标准中 用纵轴上的点代表。在图(a)中,注意到 rtaprqsrtaqqq,故有 oq/oq' = rq/rp, 即:desx/des

17、x = (desx+h-l)/h。解之,得:desx = (h-l)desx/(-desx+h)o把这个等式与(26)相比较,得(2-ll)h = -l/co在图(b)中,情况完全类似。从图中还可以看到,命题的期望在des标准下为零,在des标准下 也为零。因为零点在两个标准下是重合的。命题的期望在des标准下 为1,在des标准下也为k因为投影点p总在两个标准单位z间的 直线上。但是,除此之外,对于其它命题x,当h是有限数值时, desx与desx总是不同的两个数。当c = 0,即h是无穷大时,p点 在无限远处,所有过p点的射线实际上为平行的直线,此时,两个标 准一致。当h的正数时,(如图(

18、a),如果对x的偏好人于对g的偏好,则 desx>desx;如果对x的偏好小于对g的偏好,则desxvdesx。当 h为负数时,情况正好是相反的(如图)。特殊地,当h = s时,des标准下的最小上界被投射到正无穷,类似 地,当h二i吋,在des标准下的最大下界被投射到负无穷。通过以上变换,我们把des标准转化成为des标准,获得的期望或是 有上界无下界,或是有下界无上界,或是既有上界又有下界。我们不可 能把一个有上、下界的标准转化为既无上界,又无下界的标准。4.概率的范围在古典决策系统中,决定偏好等级的概率值是唯一的。在杰弗里的系 统中,概率值不唯一,概率的变换由(27)决定。在(27

19、)中,当c = -l/i 吋,probx = probx(l-desx/i)当 c = -1/sprobx = probx(l-desx/s)当c取-1/s和-l/i z间的其它值时,也可根据(27)求出相应的probx的值。换言之,如果已知一对旧的赋值probx, desx并且选定-1/s和-1/i 之间的参数c,就可以确定新的赋值中的概率。决策逻辑是研究在未来状态具有不确定性的情况下,进行合理决策的 问题。在决策过程中,只要确定了概率和期望的值,就可以通过贝叶 斯原则进行决策。因此,从数量上把握这两个概念就成为决策逻辑的 中心逻辑问题。杰列里在前人的基础上,利用波克的相等理论,构建 了现代意义

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论