人工智能 课件 第十二讲 不确定性推理 可信度方法_第1页
人工智能 课件 第十二讲 不确定性推理 可信度方法_第2页
人工智能 课件 第十二讲 不确定性推理 可信度方法_第3页
人工智能 课件 第十二讲 不确定性推理 可信度方法_第4页
人工智能 课件 第十二讲 不确定性推理 可信度方法_第5页
已阅读5页,还剩111页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

不确定性推理--可信度方法

不确定性推理--可信度方法1内容简介不确定性推理的基本概念与原理可信度方法的基本模型和三个扩展方法内容简介不确定性推理的基本概念与原理2基本概念

--不确定性推理的定义

从不确定性的初始证据出发,通过运用不确定性的知识,最终推出具有一定程度的不确定性但却是合理或者近乎合理的结论的思维过程。事实和知识是构成推理的两个基本要素。已知事实称为证据(E),用以指出推理的出发点及推理时应该使用的知识;而知识是推理得以向前推进,并逐步达到最终目标(H)的依据。基本概念

--不确定性推理的定义从不确定性的初始证据出发,3基本概念

--一些基本问题

不确定性的表示与量度知识不确定性的表示

制定表示方法时需要考虑:一是要能根据领域问题的特征把其不确定性比较准确地描述出来,满足问题求解的需要;另一是要便于推理过程中对不确定性的推算。

一般由领域专家给出,称为知识的静态强度。静态强度可以是相应知识在应用中成功的概率,也可以是该条知识的可信程度或其他。

基本概念

--一些基本问题不确定性的4基本概念

--一些基本问题证据的不确定性的表示

证据来源于用户在求解问题时提供的初始证据或者在推理中用前面推出的结论作为当前推理的证据。证据的不确定性称为动态强度。不管怎么表示,通常证据的不确定性表示方法与知识的不确定性表示方法保持一致,以便于推理过程中对不确定性进行统一的处理。基本概念

--一些基本问题证据的不确定5基本概念

--一些基本问题不确定性的量度

不确定性的程度是不同的,需要用数值表示其确切程度,当然也要事先规定它的取值范围,这样在推理中计算不确定性才有意义,是定量的。(例如MYCIN专家系统中可信度取值范围为[-1,1]等)

基本概念

--一些基本问题不确定性的量6基本概念

--一些基本问题不确定性匹配算法及阈值的选择问题:知识所要求的不确定性程度与证据实际具有的不确定性程度不一定相同,那么如何匹配才算成功?解决办法:设计一个算法用来计算匹配双方相似的程度,另外再指定一个相似的“程度”,用来衡量匹配双方相似的程度是否落在指定的限度内。这个限度就是阈值。基本概念

--一些基本问题不确定性匹配7基本概念

--一些基本问题组合证据不确定性的算法在基于产生式规则的系统中,知识的前提条件既可以是简单条件,也可以是用AND或OR把多个简单条件连接起来构成的复合条件。这组复合条件对应于一组证据,就称为组合证据。目前有三种计算组合证据不确定性的方法:最大最小方法

T(E1ANDE2)=min{T(E1),T(E2)}T(E1ORE2)=max{T(E1),T(E2)}概率方法

T(E1ANDE2)=T(E1)*T(E2)T(E1ORE2)=T(E1)+T(E2)-T(E1)*T(E2)有界方法

T(E1ANDE2)=max{0,T(E1)+T(E2)-1}T(E1ORE2)=min{1,T(E1)+T(E2)}注:T(E)表示证据E为真的程度,如可信度、概率等。基本概念

--一些基本问题组合证据不确8基本概念

--一些基本问题不确定性的传递算法不确定性程度由用户提供的证据中给出,通过推理过程中运用的知识(其本身也有不确定性程度)传递到结论,而结论又可以作为新的证据供以后推理用,这样不确定性程度依次传递,到最终结论。结论不确定性的合成当用不同的知识进行推理得到了相同的结论,但不确定性的程度却不同,这样就需要对这些不确定性程度进行合成。(注意:如果推出的结论不同就产生冲突,无法进行合成)

基本概念

--一些基本问题不确定性的传9基本概念

--不确定性推理方法的分类

沿着两条路线发展:一是模型方法,与控制策略无关;二是控制方法,没有统一模型,依赖于控制策略。我们只讨论模型方法。模型方法分为数值方法和非数值方法。对数值方法又可分为基于概率的方法和基于模糊理论的模糊推理。现在人们在纯概率方法上发展了一些新理论和方法,主要有可信度方法、证据理论和主观Bayes方法等。下面主要介绍可信度方法。基本概念

--不确定性推理方法的分类沿10可信度方法

--概念

根据经验对一个事物或现象为真的相信程度称为可信度。可信度带有较大的主观性和经验性。可信度方法是一个集合,其中C-F模型是基本方法,然后通过加入一些可行的因子发展出其他方法。可信度方法

--概念根据经验对一个事物或现象为真11可信度方法

--C-F模型

知识不确定性的表示

知识是用产生式规则来表示的,形式为:

IFETHENH(CF(H,E))说明:

E是知识的前提条件,可以是简单条件也可以是复合条件。如:

E=E1ANDE2ANDE3或

E=E1ORE2或

E=E1AND(E2ORE3)etc.

可信度方法

--C-F模型知12可信度方法

--C-F模型H是结论,可以是单一的也可以是多个的,就如上述前提条件。CF(H,E)是该条知识的可信度,称为可信度因子(CertaintyFactor),相当于静态强度。表示E对应的证据为真时对结论H为真的支持程度(联系程度),其值越大就越支持H为真。

例如:

IF发热38°以上AND四肢关节疼痛无力AND胸闷咳嗽THEN患SARS

(0.7)表示病人如有上述症状则有七成把握认为他患SARS可信度方法

--C-F模型H是13可信度方法

--C-F模型定义:CF(H,E)=MB(H,E)-MD(H,E),其中CF(H,E)∈[-1,1]MB(MeasureBelief)--信任增长度,表示因与E匹配的证据的出现,使H为真的信任增长度。

可信度方法

--C-F模型定义14可信度方法

--C-F模型MD(MeasureDisbelief)--不信任增长度。表示与E匹配的证据的出现,对H的不信任增长度。(注:P(H)表示H的先验概率,P(H/E)是条件概率)上面两条公式的实际意义如下:MB:因E而对H信任的增长/不相信H的概率

MD:因E而对H信任的减少/相信H的概率并有0≤MB(H,E)≤1,0≤MD(H,E)≤1

可信度方法

--C-F模型15可信度方法

--C-F模型对上述公式作如下分析:当MB(H,E)>0时-->

P(H/E)>P(H).由于E的证据的出现增加了对H的信任程度。

当MD(H,E)>0时-->P(H/E)<P(H).由于E的证据的出现增加了对H的不信任程度。

同一个证据不可能既增加对H的信任程度,又增加对H的不信任程度。所以MB(H,E)与MD(H,E)是互斥的。即:

MB(H,E)>0时,MD(H,E)=0MD(H,E)>0时,MB(H,E)=0可信度方法

--C-F模型对上16可信度方法

--C-F模型根据CF(H,E)的定义及MB(H,E)和MD(H,E)的互斥性,可得到CF(H,E)的计算公式:可信度方法

--C-F模型根据17可信度方法

--C-F模型由CF(H,E)计算公式可知其意义:若CF(H,E)>0,则P(H/E)>P(H).也有CF(H,E)↑=>H为真的可信度↑。若CF(H,E)<0,则P(H/E)<P(H).也有CF(H,E)↓=>H为假的可信度↑。若CF(H,E)=0,则P(H/E)=P(H),即H与E独立,E的证据的出现与否均对H没有影响。可信度方法

--C-F模型由C18可信度方法

--C-F模型证据不确定性的表示

在C-F模型中,证据的不确定性也是用可信度因子表示的。如CF(E)=0.5来源:作为初始证据,其值由用户给出;由先前推出的结论作为当前推理的证据,其值通过传递算法计算得到。值域:当0<CF(E)<1时,表示证据以某种程度为真。当-1<CF(E)<0时,表示它以某种程度为假。当CF(E)=0时,表示无法知道它的真假。CF(H,E)和CF(E)的区别:

静态强度CF(H,E)表示知识的强度,即E为真时对H的影响程度。动态强度CF(E)表示证据的不确定性程度。可信度方法

--C-F模型证据19可信度方法

--C-F模型组合证据不确定性的算法

当组合证据是多个单一证据的合取时,即

E=E1ANDE2AND…ANDEn则有

CF(E)=min{CF(E1),CF(E2),…,CF(En)}当组合证据是多个单一证据的析取时,即

E=E1ORE2OR…OREn则有

CF(E)=max{CF(E1),CF(E2),…,CF(En)}可信度方法

--C-F模型组合20可信度方法

--C-F模型不确定性的传递算法

CF(H)=CF(H,E)×max{0,CF(E)}其中H可作为E的证据来供下次推理使用,因而可信度由初始证据开始通过传递算法传递到最终结论。分析上式可知:若E为假时,CF(E)<0->CF(H)=0。说明该模型没有考虑证据为假时对结论H所产生的影响。若E完全为真时,CF(E)=1->CF(H)=

CF(H,E)。说明知识强度CF(H,E)实际上就是在前提条件对应的证据为真时结论H的可信度。可信度方法

--C-F模型不确21可信度方法

--C-F模型结论不确定性的合成算法

当不同知识推出具有不同可信度的相同结论时,要将各结论H的可信度进行合成。(注:推出不同结论时将出现冲突,后面会讲解决办法)

设有如下两条知识:

IFE1THENH(CF(H,E1))IFE2THENH(CF(H,E2))合成步骤:

分别对每一条知识求出各自的CF(H):

CF1(H)=CF(H,E1)×max{0,CF(E1)}CF2(H)=CF(H,E2)×max{0,CF(E2)}用以下公式求合成CF1,2(H)可信度方法

--C-F模型结论22可信度方法

--C-F模型如果是三个或以上的结论合成,那么就将某两个先合成,得到的CF1,2(H)再与CF3(H)运用上式合成,这样不断循环直至全部合成完毕。可信度方法

--C-F模型如果23可信度方法

--带有阈值限度的不确定性推理

在C-F模型上添加阈值限度λ,用以限制不合要求的证据和对应的知识的运用。知识不确定性的表示在带有阈值限度的不确定性推理中,知识用下述公式表示:

IFETHENH(CF(H,E),λ)说明:

可信度方法

--带有阈值限度的24可信度方法

--带有阈值限度的不确定性推理CF(H,E)的取值范围是(0,1]。取消了不信任增长度MD(H,E)对知识可信度的影响。只表示知识为真的可信程度。λ是阈值。它对相应知识的可应用性规定了一个限度,只有当支持前提条件E的证据的可信度CF(E)≥λ时,相应的知识才有可能被应用。λ取值范围为:

0<λ≤1可信度方法

--带有阈值限度的25可信度方法

--带有阈值限度的不确定性推理证据不确定性的表示

证据可信度的取值范围也作了改变:

0≤CF(E)≤1

CF(E)=0时,表示该证据可信度无法得知。组合证据不确定性的算法与C-F模型一样。可信度方法

--带有阈值限度的26可信度方法

--带有阈值限度的不确定性推理不确定性的传递算法当CF(E)≥λ时,结论H的可信度CF(H)由下式计算得到:

CF(H)=CF(H,E)×CF(E)注:由于CF(E)≥0,所以用CF(E)与CF(H,E)“相乘”,而不是max{0,CF(E)};并且这里的“×”既可为“相乘”运算,也可为“取极小”或其他运算,要按实际情况定。(后面出现的“×”号均表示这个意思,不再赘述)可信度方法

--带有阈值限度的27可信度方法

--带有阈值限度的不确定性推理结论不确定性的合成算法跟C-F模型相似,也是分两步完成。首先分别对每条知识求出它的CFi(H),(i=1,2,…,n),即:

CFi(H)=CF(H,Ei)×CF(Ei)然后用以下方法中任一种求出合成可信度CF(H)(注:C-F模型只限于一条公式)求极大值法:可信度方法

--带有阈值限度的28可信度方法

--带有阈值限度的不确定性推理加权求和法:

CF(H,Ei)被看作权值

有限和法:

各结论H的可信度和不能大于1,否则CF(H)取1可信度方法

--带有阈值限度的29可信度方法

--带有阈值限度的不确定性推理上式是加权求和法下式是有限和法可信度方法

--带有阈值限度的30可信度方法

--带有阈值限度的不确定性推理递推计算法:

从CF1(H)开始,按知识被应用的顺序逐步进行递推。可用以下两条公式表示:令C1=CF(H,E1)×CF(E1)对任意的k>1,

当k=n时,Ck就是综合可信度CF(H)可信度方法

--带有阈值限度的31可信度方法

--带有阈值限度的不确定性推理小结与C-F模型相比,不同之处有:多了一个阈值λ,只有CF(E)≥λ时,才能应用该知识知识的可信度值域为(0,1],证据的可信度值域为

[0,1],而不是[-1,1].计算结论H可信度时用CF(H)=CF(H,E)×CF(E),而不是:

CF(H)=CF(H,E)×max{0,CF(E)}结论H可信度的合成算法有多种选择,而不是C-F模型中只有一种。传递算法公式中的“×”号不仅表示乘法,也表示取极小或其他运算。可信度方法

--带有阈值限度的32可信度方法

--加权的不确定性推理

当知识的前提条件E是复合条件时(E=E1ANDE2AND…ANDEn),前面讨论的方法都默认要求E1、E2、…、En是彼此独立的,但现实情况不是这样,如:

IF天气预报说有寒流来到本地

AND气温急剧下降

AND你感到有些冷

THEN你应多穿衣服这里各子条件之间存在着依赖关系,如“气温急剧下降”依赖于“天气预报说有寒流来到本地”。可信度方法

--加权的不确定性33可信度方法

--加权的不确定性推理另外,各子条件也不是平等的。也就是说,各子条件对结论的“贡献”(支持程度)是不同的。如:

IF该论文有创见

AND立论正确

AND文字通顺流畅

AND书写清楚规范

THEN该论文可以发表这里“该论文有创见”及“立论正确”要比“文字通顺流畅”及“书写清楚规范”重要得多。为了解决上述两个问题,我们可以在前提条件中加入加权因子,使不同的子条件具有不同的“权”,代表该子条件的重要性或独立性。可信度方法

--加权的不确定性34可信度方法

--加权的不确定性推理知识不确定性的表示

IFE1(W1)ANDE2(W2)AND…ANDEn(Wn)THENH(CF(H,E),λ)其中Wi

(i=1,2,…,n)是加权因子,λ是阈值,均由领域专家给出。某子条件对结论成立的重要性越大,其权值应该相应增大;某子条件具有较大的独立性,而其他子条件对它有依赖关系,则该子条件应该具有较大的权值。另外权值应满足以下条件(归一条件):可信度方法

--加权的不确定性35可信度方法

--加权的不确定性推理组合证据不确定性的算法

不是用min{CF(Ei)},(i=1,2,…,n)当Wi

不满足归一条件时,即:则用下式表示:可信度方法

--加权的不确定性36可信度方法

--加权的不确定性推理问题是:如果换成是OR连接的情况,那么该如何算?

不确定性的传递算法

只要一条知识的CF(E)满足CF(E)≥λ时,该知识就可以被应用。传递公式跟上节一样:

CF(H)=CF(H,E)×CF(E)可信度方法

--加权的不确定性37可信度方法

--加权的不确定性推理加权因子不仅解决了证据的重要性、独立性问题,而且还解决了证据不完全和冲突消解问题。

证据不完全性问题。

先举一个例子:

IF该动物有蹄(0.3)--E1

AND该动物有长腿(0.2)--E2

AND该动物有长颈(0.2)--E3

AND该动物是黄褐色(0.13)--E4

AND该动物身上有暗黑色斑点(0.13)--E5

AND该动物的体重在200kg以上(0.04)--E6

THEN该动物是长颈鹿(0.95,0.8)--H可信度方法

--加权的不确定性38可信度方法

--加权的不确定性推理如果有一位小朋友在动物公园看到一个动物后提供了以下证据:该动物有蹄,其可信度CF(E1)=1该动物有长腿,其可信度CF(E2)=1该动物有长颈,其可信度CF(E3)=1该动物是黄褐色,其可信度CF(E4)=0.8该动物身上有暗黑色斑点,其可信度CF(E5)=0.6那么该动物是什么动物?很显然小朋友提供的证据少了“该动物的体重在200kg以上”这个条件。如果按不带加权因子的不确定性推理来计算是不行的。

可信度方法

--加权的不确定性39可信度方法

--加权的不确定性推理因为:CF(E1ANDE2ANDE3ANDE4ANDE5ANDE6)=min{CF(E1),CF(E2),CF(E3),CF(E4),CF(E5),CF(E6)}=0,(∵CF(E6)=0)该知识不能应用。但对于加权不确定性推理来说,它就有可能被应用,因为应用与否取决于CF(E)是否≥λ。在此例中:可信度方法

--加权的不确定性40可信度方法

--加权的不确定性推理

CF(E)≥λ=0.8,所以该知识能被应用,并推出结论H“该动物是长颈鹿”的可信度CF(H)=CF(H,E)×CF(E)=0.95×0.882≈0.84。由此可见,虽然有些证据没有被提供,但如果它的重要性不大(权值小)那么需要用它的知识也有可能被应用并推出结论,只要组合证据的可信度大于或等于λ即可。

可信度方法

--加权的不确定性41可信度方法

--加权的不确定性推理冲突消解

当有两条或以上知识应用并推出不同的结论,且各自的CF(E)均≥λ时,就会出现冲突。对此,若max{CF(E1),CF(E2),…,CF(Ek),…,CF(En)}=CF(Ek)时,则先用CF(Ek)所对应的知识,再用值其次大的,如此类推。(注:CF(Ei)表示第i条知识的组合证据的可信度)可信度方法

--加权的不确定性42可信度方法

--加权的不确定性推理例子:r1:IFE1(0.6)ANDE2(0.4)THENE6(0.8,0.75)r2:IFE3(0.5)ANDE4(0.3)ANDE5(0.2)THENE7(0.7,0.6)r3:IFE6(0.7)ANDE7(0.3)THENH(0.75,0.6)已知:CF(E1)=0.9,CF(E2)=0.8,CF(E3)=0.7,CF(E4)=0.6,CF(E5)=0.5求:CF(H)=?可信度方法

--加权的不确定性43可信度方法

--加权的不确定性推理解:由r1:∵λ1=0.75∴r1具备了可被应用的条件。由r2得:

可信度方法

--加权的不确定性44可信度方法

--加权的不确定性推理∵λ2=0.6∴r2也具备了可被应用的条件。又∵∴r1先被应用,然后才能应用r2。由r1得:CF(E6)=0.8×0.86=0.69由r2得:CF(E7)=0.7×0.63=0.44由r3得:可信度方法

--加权的不确定性45可信度方法

--加权的不确定性推理∵CF(E6(0.7)ANDE7(0.3)>λ3∴r3可被应用,得CF(H)=0.75×0.615=0.46问题:

1,什么时候知识应用分先后?

2,上述例题中r1,r2应用的先后顺序并不影响推理过程和结论。可信度方法

--加权的不确定性46可信度方法

--加权的不确定性推理解决:对同一个问题应用不同的知识推出不一样的结论时就产生冲突,此时知识应用就分先后;如果推出的结论一样,就可用前面介绍的方法合成各个结论的可信度。原例题中r1和r2分别推出的E6和E7在r3中作为证据的地位是平等的,所以分不分先后并不影响结论。例题改成如下形式时就能体现出知识应用分先后的重要性了:

r1:IFE1(0.6)ANDE2(0.4)THENE6(0.8,0.75)r2:IFE3(0.5)ANDE4(0.3)ANDE5(0.2)THENE7(0.7,0.6)

r3:IFE6(0.7)ANDE8(0.4)THENH1(0.75,0.6)r4:IFE7(0.3)ANDE9(0.6)THENH2(0.8,0.65)可以看出,由于E6和E7分别推出的结论不一样,所以先后启用的顺序就显得很重要。如果推出的结论一样,那么启用的顺序就不重要了,只需最后作一个结论的合成运算即可。可信度方法

--加权的不确定性47可信度方法

--前提条件中带有可信度因子的不确定性推理

前面那些方法的一个共同特点是它们都没有为前提条件E或其子条件指出所需的可信度值,它们都是在前提条件E为真的前提下为CF(H,E)取值的。实际应用中,有时这样做不能准确地反映领域专家的知识。为此,在有些专家系统中提出了在前提条件中设置可信度的方法。知识不确定性的表示:可信度方法

--前提条件中带有可信度48可信度方法

--前提条件中带有可信度因子的不确定性推理其中:前一种表示形式是不带加权因子的表示形式,后一种是带加权因子的表示形式。cfi是对于条件Ei(i=1,2,…,n)指出的可信度,它表示当子条件Ei所对应的证据存在且具有cfi(i=1,2,…,n)大小的可信度时,结论H具有可信度CF(H,E)。

cfi在[0,1]上取值,其值由领域专家给出。Wi是子条件Ei(i=1,2,…,n)的权值,在[0,1]上取值,且应满足如下条件:可信度方法

--前提条件中带有可信度49可信度方法

--前提条件中带有可信度因子的不确定性推理Wi的值由领域专家给出。CF(H,E)及λ分别为知识的静态强度及权值,其值由领域专家给出。

证据不确定性的表示跟前面方法类似,证据Ei的可信度记为cf'i。可信度方法

--前提条件中带有可信度50可信度方法

--前提条件中带有可信度因子的不确定性推理不确定性匹配算法在前面讨论的不确定性推理方法中,都没有明确提出不确定性匹配问题,这是因为这些方法在推理时都是以证据的可信度直接作为相应条件的可信度的,一条知识是否可用于当前的推理,关键的因素是其前提条件所要求的证据是否已经出现。前面的方法虽然要对复合证据的可信度进行判断,看其是否满足阈值条件,从而决定相应的知识可否被应用,并没有看每个证据对每个子条件是否匹配。(其实是不需要的,实质上cfi=1)可信度方法

--前提条件中带有可信度51可信度方法

--前提条件中带有可信度因子的不确定性推理在介绍基本概念时已指出,当知识的前提条件与相应的证据不完全一致时.需要用相应的不确定性匹配算法检查两者相似的程度是否落在阈值指定的限度内。如果落在阈值指定的限度内,就认为它们是可匹配的,相应的知识可被应用;如果不落在阈值指定的限度内,就认为它们是不可匹配的,相应知识不可用于当前的推理中。在目前正在讨论的方法中,由于知识中为各子条件指出的可信度cfi与相应证据实际具有的可信度cf'i不一定完全一致.因此需要用不确定性匹配算法确定它们是否可以匹配。可信度方法

--前提条件中带有可信度52可信度方法

--前提条件中带有可信度因子的不确定性推理不带加权因子的匹配算法:

有如下证据存在:其中cf‘i是证据的Ei的可信度(i=1,2,…,n),则不确定性匹配算法为:这里的相加运算“+”可改为取极大运算“V”,应用时可根据实际情况确定。可信度方法

--前提条件中带有可信度53可信度方法

--前提条件中带有可信度因子的不确定性推理带加权因子的匹配算法:有如下证据存在:则匹配算法为:这里的相加运算“+”可根据实际需要改为取极大“V”运算。

可信度方法

--前提条件中带有可信度54可信度方法

--前提条件中带有可信度因子的不确定性推理由上面列出的匹配算法可以看出:当证据Ei的可信度cf‘i大于或等于相应子条件的可信度cfi,即均有:

它们都满足“小于或等于λ”的条件,所以知识的前提条件可与相应的证据匹配。至于cf'i小于cfi(i=1,2,…,n)或部分小于的情况,究竟能否匹配,这取决于对λ的取值,同时还要对上述两种算法进行计算才能决定。

可信度方法

--前提条件中带有可信度55可信度方法

--前提条件中带有可信度因子的不确定性推理不确定性的传递算法

不带加权因子的算法:在进行匹配算法成功后,用下式计算:由此算法可以看出:当cf'i≥cfi(i=1,2,…,n)时,有CF(H)=CF(H,E)带加权因子的算法:可信度方法

--前提条件中带有可信度56小结上述介绍的4种不确定性推理方法都比较简单、直观。缺点是推理结果的准确性依赖于领域专家对可信度因子的指定,但如何合理且准确地把知识的可信度因子估计为一个数字却是相当困难的,并且难有一个统一的标准尺度,具有浓厚的个人主观判断色彩。另外,随着推理链的延伸,可信度的传递将会越来越不可靠,误差越来越大,当推理深度达到一定深度时,有可能出现推出的结论不再可信的情况。

小结上述介绍的4种不确定性推理方法都比较简单、直观。缺点是推57谢谢各位!

谢谢各位!58不确定性推理--可信度方法

不确定性推理--可信度方法59内容简介不确定性推理的基本概念与原理可信度方法的基本模型和三个扩展方法内容简介不确定性推理的基本概念与原理60基本概念

--不确定性推理的定义

从不确定性的初始证据出发,通过运用不确定性的知识,最终推出具有一定程度的不确定性但却是合理或者近乎合理的结论的思维过程。事实和知识是构成推理的两个基本要素。已知事实称为证据(E),用以指出推理的出发点及推理时应该使用的知识;而知识是推理得以向前推进,并逐步达到最终目标(H)的依据。基本概念

--不确定性推理的定义从不确定性的初始证据出发,61基本概念

--一些基本问题

不确定性的表示与量度知识不确定性的表示

制定表示方法时需要考虑:一是要能根据领域问题的特征把其不确定性比较准确地描述出来,满足问题求解的需要;另一是要便于推理过程中对不确定性的推算。

一般由领域专家给出,称为知识的静态强度。静态强度可以是相应知识在应用中成功的概率,也可以是该条知识的可信程度或其他。

基本概念

--一些基本问题不确定性的62基本概念

--一些基本问题证据的不确定性的表示

证据来源于用户在求解问题时提供的初始证据或者在推理中用前面推出的结论作为当前推理的证据。证据的不确定性称为动态强度。不管怎么表示,通常证据的不确定性表示方法与知识的不确定性表示方法保持一致,以便于推理过程中对不确定性进行统一的处理。基本概念

--一些基本问题证据的不确定63基本概念

--一些基本问题不确定性的量度

不确定性的程度是不同的,需要用数值表示其确切程度,当然也要事先规定它的取值范围,这样在推理中计算不确定性才有意义,是定量的。(例如MYCIN专家系统中可信度取值范围为[-1,1]等)

基本概念

--一些基本问题不确定性的量64基本概念

--一些基本问题不确定性匹配算法及阈值的选择问题:知识所要求的不确定性程度与证据实际具有的不确定性程度不一定相同,那么如何匹配才算成功?解决办法:设计一个算法用来计算匹配双方相似的程度,另外再指定一个相似的“程度”,用来衡量匹配双方相似的程度是否落在指定的限度内。这个限度就是阈值。基本概念

--一些基本问题不确定性匹配65基本概念

--一些基本问题组合证据不确定性的算法在基于产生式规则的系统中,知识的前提条件既可以是简单条件,也可以是用AND或OR把多个简单条件连接起来构成的复合条件。这组复合条件对应于一组证据,就称为组合证据。目前有三种计算组合证据不确定性的方法:最大最小方法

T(E1ANDE2)=min{T(E1),T(E2)}T(E1ORE2)=max{T(E1),T(E2)}概率方法

T(E1ANDE2)=T(E1)*T(E2)T(E1ORE2)=T(E1)+T(E2)-T(E1)*T(E2)有界方法

T(E1ANDE2)=max{0,T(E1)+T(E2)-1}T(E1ORE2)=min{1,T(E1)+T(E2)}注:T(E)表示证据E为真的程度,如可信度、概率等。基本概念

--一些基本问题组合证据不确66基本概念

--一些基本问题不确定性的传递算法不确定性程度由用户提供的证据中给出,通过推理过程中运用的知识(其本身也有不确定性程度)传递到结论,而结论又可以作为新的证据供以后推理用,这样不确定性程度依次传递,到最终结论。结论不确定性的合成当用不同的知识进行推理得到了相同的结论,但不确定性的程度却不同,这样就需要对这些不确定性程度进行合成。(注意:如果推出的结论不同就产生冲突,无法进行合成)

基本概念

--一些基本问题不确定性的传67基本概念

--不确定性推理方法的分类

沿着两条路线发展:一是模型方法,与控制策略无关;二是控制方法,没有统一模型,依赖于控制策略。我们只讨论模型方法。模型方法分为数值方法和非数值方法。对数值方法又可分为基于概率的方法和基于模糊理论的模糊推理。现在人们在纯概率方法上发展了一些新理论和方法,主要有可信度方法、证据理论和主观Bayes方法等。下面主要介绍可信度方法。基本概念

--不确定性推理方法的分类沿68可信度方法

--概念

根据经验对一个事物或现象为真的相信程度称为可信度。可信度带有较大的主观性和经验性。可信度方法是一个集合,其中C-F模型是基本方法,然后通过加入一些可行的因子发展出其他方法。可信度方法

--概念根据经验对一个事物或现象为真69可信度方法

--C-F模型

知识不确定性的表示

知识是用产生式规则来表示的,形式为:

IFETHENH(CF(H,E))说明:

E是知识的前提条件,可以是简单条件也可以是复合条件。如:

E=E1ANDE2ANDE3或

E=E1ORE2或

E=E1AND(E2ORE3)etc.

可信度方法

--C-F模型知70可信度方法

--C-F模型H是结论,可以是单一的也可以是多个的,就如上述前提条件。CF(H,E)是该条知识的可信度,称为可信度因子(CertaintyFactor),相当于静态强度。表示E对应的证据为真时对结论H为真的支持程度(联系程度),其值越大就越支持H为真。

例如:

IF发热38°以上AND四肢关节疼痛无力AND胸闷咳嗽THEN患SARS

(0.7)表示病人如有上述症状则有七成把握认为他患SARS可信度方法

--C-F模型H是71可信度方法

--C-F模型定义:CF(H,E)=MB(H,E)-MD(H,E),其中CF(H,E)∈[-1,1]MB(MeasureBelief)--信任增长度,表示因与E匹配的证据的出现,使H为真的信任增长度。

可信度方法

--C-F模型定义72可信度方法

--C-F模型MD(MeasureDisbelief)--不信任增长度。表示与E匹配的证据的出现,对H的不信任增长度。(注:P(H)表示H的先验概率,P(H/E)是条件概率)上面两条公式的实际意义如下:MB:因E而对H信任的增长/不相信H的概率

MD:因E而对H信任的减少/相信H的概率并有0≤MB(H,E)≤1,0≤MD(H,E)≤1

可信度方法

--C-F模型73可信度方法

--C-F模型对上述公式作如下分析:当MB(H,E)>0时-->

P(H/E)>P(H).由于E的证据的出现增加了对H的信任程度。

当MD(H,E)>0时-->P(H/E)<P(H).由于E的证据的出现增加了对H的不信任程度。

同一个证据不可能既增加对H的信任程度,又增加对H的不信任程度。所以MB(H,E)与MD(H,E)是互斥的。即:

MB(H,E)>0时,MD(H,E)=0MD(H,E)>0时,MB(H,E)=0可信度方法

--C-F模型对上74可信度方法

--C-F模型根据CF(H,E)的定义及MB(H,E)和MD(H,E)的互斥性,可得到CF(H,E)的计算公式:可信度方法

--C-F模型根据75可信度方法

--C-F模型由CF(H,E)计算公式可知其意义:若CF(H,E)>0,则P(H/E)>P(H).也有CF(H,E)↑=>H为真的可信度↑。若CF(H,E)<0,则P(H/E)<P(H).也有CF(H,E)↓=>H为假的可信度↑。若CF(H,E)=0,则P(H/E)=P(H),即H与E独立,E的证据的出现与否均对H没有影响。可信度方法

--C-F模型由C76可信度方法

--C-F模型证据不确定性的表示

在C-F模型中,证据的不确定性也是用可信度因子表示的。如CF(E)=0.5来源:作为初始证据,其值由用户给出;由先前推出的结论作为当前推理的证据,其值通过传递算法计算得到。值域:当0<CF(E)<1时,表示证据以某种程度为真。当-1<CF(E)<0时,表示它以某种程度为假。当CF(E)=0时,表示无法知道它的真假。CF(H,E)和CF(E)的区别:

静态强度CF(H,E)表示知识的强度,即E为真时对H的影响程度。动态强度CF(E)表示证据的不确定性程度。可信度方法

--C-F模型证据77可信度方法

--C-F模型组合证据不确定性的算法

当组合证据是多个单一证据的合取时,即

E=E1ANDE2AND…ANDEn则有

CF(E)=min{CF(E1),CF(E2),…,CF(En)}当组合证据是多个单一证据的析取时,即

E=E1ORE2OR…OREn则有

CF(E)=max{CF(E1),CF(E2),…,CF(En)}可信度方法

--C-F模型组合78可信度方法

--C-F模型不确定性的传递算法

CF(H)=CF(H,E)×max{0,CF(E)}其中H可作为E的证据来供下次推理使用,因而可信度由初始证据开始通过传递算法传递到最终结论。分析上式可知:若E为假时,CF(E)<0->CF(H)=0。说明该模型没有考虑证据为假时对结论H所产生的影响。若E完全为真时,CF(E)=1->CF(H)=

CF(H,E)。说明知识强度CF(H,E)实际上就是在前提条件对应的证据为真时结论H的可信度。可信度方法

--C-F模型不确79可信度方法

--C-F模型结论不确定性的合成算法

当不同知识推出具有不同可信度的相同结论时,要将各结论H的可信度进行合成。(注:推出不同结论时将出现冲突,后面会讲解决办法)

设有如下两条知识:

IFE1THENH(CF(H,E1))IFE2THENH(CF(H,E2))合成步骤:

分别对每一条知识求出各自的CF(H):

CF1(H)=CF(H,E1)×max{0,CF(E1)}CF2(H)=CF(H,E2)×max{0,CF(E2)}用以下公式求合成CF1,2(H)可信度方法

--C-F模型结论80可信度方法

--C-F模型如果是三个或以上的结论合成,那么就将某两个先合成,得到的CF1,2(H)再与CF3(H)运用上式合成,这样不断循环直至全部合成完毕。可信度方法

--C-F模型如果81可信度方法

--带有阈值限度的不确定性推理

在C-F模型上添加阈值限度λ,用以限制不合要求的证据和对应的知识的运用。知识不确定性的表示在带有阈值限度的不确定性推理中,知识用下述公式表示:

IFETHENH(CF(H,E),λ)说明:

可信度方法

--带有阈值限度的82可信度方法

--带有阈值限度的不确定性推理CF(H,E)的取值范围是(0,1]。取消了不信任增长度MD(H,E)对知识可信度的影响。只表示知识为真的可信程度。λ是阈值。它对相应知识的可应用性规定了一个限度,只有当支持前提条件E的证据的可信度CF(E)≥λ时,相应的知识才有可能被应用。λ取值范围为:

0<λ≤1可信度方法

--带有阈值限度的83可信度方法

--带有阈值限度的不确定性推理证据不确定性的表示

证据可信度的取值范围也作了改变:

0≤CF(E)≤1

CF(E)=0时,表示该证据可信度无法得知。组合证据不确定性的算法与C-F模型一样。可信度方法

--带有阈值限度的84可信度方法

--带有阈值限度的不确定性推理不确定性的传递算法当CF(E)≥λ时,结论H的可信度CF(H)由下式计算得到:

CF(H)=CF(H,E)×CF(E)注:由于CF(E)≥0,所以用CF(E)与CF(H,E)“相乘”,而不是max{0,CF(E)};并且这里的“×”既可为“相乘”运算,也可为“取极小”或其他运算,要按实际情况定。(后面出现的“×”号均表示这个意思,不再赘述)可信度方法

--带有阈值限度的85可信度方法

--带有阈值限度的不确定性推理结论不确定性的合成算法跟C-F模型相似,也是分两步完成。首先分别对每条知识求出它的CFi(H),(i=1,2,…,n),即:

CFi(H)=CF(H,Ei)×CF(Ei)然后用以下方法中任一种求出合成可信度CF(H)(注:C-F模型只限于一条公式)求极大值法:可信度方法

--带有阈值限度的86可信度方法

--带有阈值限度的不确定性推理加权求和法:

CF(H,Ei)被看作权值

有限和法:

各结论H的可信度和不能大于1,否则CF(H)取1可信度方法

--带有阈值限度的87可信度方法

--带有阈值限度的不确定性推理上式是加权求和法下式是有限和法可信度方法

--带有阈值限度的88可信度方法

--带有阈值限度的不确定性推理递推计算法:

从CF1(H)开始,按知识被应用的顺序逐步进行递推。可用以下两条公式表示:令C1=CF(H,E1)×CF(E1)对任意的k>1,

当k=n时,Ck就是综合可信度CF(H)可信度方法

--带有阈值限度的89可信度方法

--带有阈值限度的不确定性推理小结与C-F模型相比,不同之处有:多了一个阈值λ,只有CF(E)≥λ时,才能应用该知识知识的可信度值域为(0,1],证据的可信度值域为

[0,1],而不是[-1,1].计算结论H可信度时用CF(H)=CF(H,E)×CF(E),而不是:

CF(H)=CF(H,E)×max{0,CF(E)}结论H可信度的合成算法有多种选择,而不是C-F模型中只有一种。传递算法公式中的“×”号不仅表示乘法,也表示取极小或其他运算。可信度方法

--带有阈值限度的90可信度方法

--加权的不确定性推理

当知识的前提条件E是复合条件时(E=E1ANDE2AND…ANDEn),前面讨论的方法都默认要求E1、E2、…、En是彼此独立的,但现实情况不是这样,如:

IF天气预报说有寒流来到本地

AND气温急剧下降

AND你感到有些冷

THEN你应多穿衣服这里各子条件之间存在着依赖关系,如“气温急剧下降”依赖于“天气预报说有寒流来到本地”。可信度方法

--加权的不确定性91可信度方法

--加权的不确定性推理另外,各子条件也不是平等的。也就是说,各子条件对结论的“贡献”(支持程度)是不同的。如:

IF该论文有创见

AND立论正确

AND文字通顺流畅

AND书写清楚规范

THEN该论文可以发表这里“该论文有创见”及“立论正确”要比“文字通顺流畅”及“书写清楚规范”重要得多。为了解决上述两个问题,我们可以在前提条件中加入加权因子,使不同的子条件具有不同的“权”,代表该子条件的重要性或独立性。可信度方法

--加权的不确定性92可信度方法

--加权的不确定性推理知识不确定性的表示

IFE1(W1)ANDE2(W2)AND…ANDEn(Wn)THENH(CF(H,E),λ)其中Wi

(i=1,2,…,n)是加权因子,λ是阈值,均由领域专家给出。某子条件对结论成立的重要性越大,其权值应该相应增大;某子条件具有较大的独立性,而其他子条件对它有依赖关系,则该子条件应该具有较大的权值。另外权值应满足以下条件(归一条件):可信度方法

--加权的不确定性93可信度方法

--加权的不确定性推理组合证据不确定性的算法

不是用min{CF(Ei)},(i=1,2,…,n)当Wi

不满足归一条件时,即:则用下式表示:可信度方法

--加权的不确定性94可信度方法

--加权的不确定性推理问题是:如果换成是OR连接的情况,那么该如何算?

不确定性的传递算法

只要一条知识的CF(E)满足CF(E)≥λ时,该知识就可以被应用。传递公式跟上节一样:

CF(H)=CF(H,E)×CF(E)可信度方法

--加权的不确定性95可信度方法

--加权的不确定性推理加权因子不仅解决了证据的重要性、独立性问题,而且还解决了证据不完全和冲突消解问题。

证据不完全性问题。

先举一个例子:

IF该动物有蹄(0.3)--E1

AND该动物有长腿(0.2)--E2

AND该动物有长颈(0.2)--E3

AND该动物是黄褐色(0.13)--E4

AND该动物身上有暗黑色斑点(0.13)--E5

AND该动物的体重在200kg以上(0.04)--E6

THEN该动物是长颈鹿(0.95,0.8)--H可信度方法

--加权的不确定性96可信度方法

--加权的不确定性推理如果有一位小朋友在动物公园看到一个动物后提供了以下证据:该动物有蹄,其可信度CF(E1)=1该动物有长腿,其可信度CF(E2)=1该动物有长颈,其可信度CF(E3)=1该动物是黄褐色,其可信度CF(E4)=0.8该动物身上有暗黑色斑点,其可信度CF(E5)=0.6那么该动物是什么动物?很显然小朋友提供的证据少了“该动物的体重在200kg以上”这个条件。如果按不带加权因子的不确定性推理来计算是不行的。

可信度方法

--加权的不确定性97可信度方法

--加权的不确定性推理因为:CF(E1ANDE2ANDE3ANDE4ANDE5ANDE6)=min{CF(E1),CF(E2),CF(E3),CF(E4),CF(E5),CF(E6)}=0,(∵CF(E6)=0)该知识不能应用。但对于加权不确定性推理来说,它就有可能被应用,因为应用与否取决于CF(E)是否≥λ。在此例中:可信度方法

--加权的不确定性98可信度方法

--加权的不确定性推理

CF(E)≥λ=0.8,所以该知识能被应用,并推出结论H“该动物是长颈鹿”的可信度CF(H)=CF(H,E)×CF(E)=0.95×0.882≈0.84。由此可见,虽然有些证据没有被提供,但如果它的重要性不大(权值小)那么需要用它的知识也有可能被应用并推出结论,只要组合证据的可信度大于或等于λ即可。

可信度方法

--加权的不确定性99可信度方法

--加权的不确定性推理冲突消解

当有两条或以上知识应用并推出不同的结论,且各自的CF(E)均≥λ时,就会出现冲突。对此,若max{CF(E1),CF(E2),…,CF(Ek),…,CF(En)}=CF(Ek)时,则先用CF(Ek)所对应的知识,再用值其次大的,如此类推。(注:CF(Ei)表示第i条知识的组合证据的可信度)可信度方法

--加权的不确定性100可信度方法

--加权的不确定性推理例子:r1:IFE1(0.6)ANDE2(0.4)THENE6(0.8,0.75)r2:IFE3(0.5)ANDE4(0.3)ANDE5(0.2)THENE7(0.7,0.6)r3:IFE6(0.7)ANDE7(0.3)THENH(0.75,0.6)已知:CF(E1)=0.9,CF(E2)=0.8,CF(E3)=0.7,CF(E4)=0.6,CF(E5)=0.5求:CF(H)=?可信度方法

--加权的不确定性101可信度方法

--加权的不确定性推理解:由r1:∵λ1=0.75∴r1具备了可被应用的条件。由r2得:

可信度方法

--加权的不确定性102可信度方法

--加权的不确定性推理∵λ2=0.6∴r2也具备了可被应用的条件。又∵∴r1先被应用,然后才能应用r2。由r1得:CF(E6)=0.8×0.86=0.69由r2得:CF(E7)=0.7×0.63=0.44由r3得:可信度方法

--加权的不确定性103可信度方法

--加权的不确定性推理∵CF(E6(0.7)ANDE7(0.3)>λ3∴r3可被应用,得CF(H)=0.75×0.615=0.46问题:

1,什么时候知识应用分先后?

2,上述例题中r1,r2应用的先后顺序并不影响推理过程和结论。可信度方法

--加权的不确定性104可信度方法

--加权的不确定性推理解决:对同一个问题应用不同的知识推出不一样的结论时就产生冲突,此时知识应用就分先后;如果推出的结论一样,就可用前面

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论