证据理论方法详解_第1页
证据理论方法详解_第2页
证据理论方法详解_第3页
证据理论方法详解_第4页
证据理论方法详解_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章证据理论(EvidenceTheory)方法在本章§1,我们将讨论一种被称之为登普斯特-谢弗(Dempster-Shafer)或谢弗-登普斯特(Shafer-Dempster)理论(简称D-S理论或证据理论)的不精确推理方法。这一理论最初是以登普斯特(Dempster,1967年)的工作为基础的,登普斯特试图用一个概率区间而不是单一概率数值去建模不确定性 ・1976年,谢弗(Shafer,1976年)在《证据的数学理论》一书中扩展和改进了登普斯特工作.D-S理论具有好的理论基础。确定性因子能被证明是D-S理论的一种特殊情形。在§2我们将描述一种简化的证据理论模型MET1.在§3我们将给出支持有序命题类问题的具有凸函数性质的简化证据理论模型。六章介绍。质的简化证据理论模型。六章介绍。绕证据理论的一些新的研究工作,将在第§1D-S理论(Dempster-ShaferTheory)•辨别框架(FramesofDiscernment)D-S理论假定有一个用大写希腊字母0表示的环境(environment),该环境是一个具有互斥和可穷举元素的集合:0={01,02,…,0n}术语环境在集合论中又被称之为论域(theuniverseofdiscourse)。一些论域的例子可以是:0={airliner,bomber,fighter}0={red,green,blue,orange,yellow}0={barn,grass,person,cow,car}注意,上述集合中的元素都是互斥的。为了简化我们的讨论,假定0是一个有限集合。其元素是诸如时间、距离、速度等连续变量的D-S环境上的研究工作已经被做。理解0的一种方式是先提出问题,然后进行回答。假定0={airliner,bomber,fighter}提问1:“这军用飞机是什么?”;答案1:是0的子集{02,03}={bomber,fighter}提问2:“这民用飞机是什么?”;答案2:是0的子集{01}={airliner},{01}是单元素集合。因为元素是互斥的,环境是可穷举的,对于一个提问只能有一个正确的答案子集。环境的所有子集是对应论域的所有可能的有效答案。飞机环境的所有可能的子集由图5.1.1示出。注意,图5.1.1是一个格,子集节点可以有多个父亲节点,这个格(Lattice)是一个分层结构。从。到0的任一路径都表达了连接父节点到儿子节点的子集分层关系,例如,0u<a}u<A,b}u{a,B,c}.当一个环境的元素可以被解释成可能的答案,并且仅有一个答案是正确的,那么该环境被称之为一个鉴别框架。鉴别这个术语意味着,对于一个提问,从与该提问相关的所有可能的答案中能区分出一个正确的答案。能区分出一个正确的答案需要鉴别框架是可穷举的,其子集是不相交的。一个大小为N的集合包括自身恰有2n个子集,这些子集定义了幂集,记为2®,对于飞机框架有2®={0,<a|<b|如、<A,b}{a,f}鼠c|<a,b,c}}2®和对应于环境的所有可能提问的正确答案之间存在着一一对应关系。•MASS函数和无知在贝叶斯理论中,后验概率随着证据而改变是所需要的。同样地,在D-S理论中,关于证据的信任

也可以改变。在D-S理论中,习惯上把证据的信任度类似于物理对象的质量去考虑,即证据的质量(Mass)支持了一个信任。关于质量这一术语也被称为基本概率赋值(BPA,theBasicProbabilityAssignment)或简称为基本赋值(BasicAssignment)o为了避免与概率论相混淆,我们将不使用这些术语,而是简单的使用质量(Mass)一词。D-S理论和概率论的基本区别是关于无知的处理。即使在无知的情况下,概率论也必须分布一个等量的概率值。假如你没有先验知识,那么你必须假定每一种可能性的概率值都是PP=土N其中,N是可能性的总数。事实上,这赋值为P是在无可奈何的情况下作出的。但是,概率论也有一种冠冕堂皇的说法,即所谓的中立原理(theprincipleofindifference)。当仅仅有两种可能性存在的时候,比方说“有石油”和“没有石油",分别用H和「日表示,那么出现应用中立原理的极端情况。在与此相类似的情况中,即使在没有一点知识的条件下,那么也必须是P=50%,因为概率论要求P(H)+P(-H)=1,就是说,要么赞成H,要么反对H,对H无知是不被允许的。在没有关于「H的任何证据的情况下,即使不用中立原理,那么约束P(H)+P(-H)=1也要求必须对-H进行概率赋值。D-S理论不要求必须对无知假设H和反驳假设H赋以信任值,而是仅仅将Mass分配给你希望对其分配信任的环境的子集。任一未被分配给具体子集的‘信任’被看成‘未表达意见’,并将其分配给环境0.反驳一个假设的'信任’,实际上,是对该假设的'不信任’,但不是对该假设‘未表达意见’。例1・1假定一个敌友飞机识别(IFF,IdentificationFriendorFoe)传感器(敌友飞机识别(IFF,IdentificationFriendorFoe)传感器也被简称为敌友飞机识别器),从一架飞机的应答器获得了一个响应。如果某飞机是友机,那么它的发射机应答器应通过回送它的识别代码立即进行应答。若接收应答的飞机未收到某架飞机A的应答,那么接收应答的飞机的缺省处理结果是:飞机A是一架敌机。一架飞机A*可能因下列原因未能发送应答信息:A*的敌友飞机识别器发生了故障A*的发射机应答器发生了故障A*上没有敌友飞机识别器A*的敌友飞机识别器受到了干扰A*收到了保持其雷达沉默的命令假定因敌友飞机识别器的故障,导致了关于目标飞机有0.7的可能性是敌机的证据,其中仅仅轰炸机和战斗机被认为是敌机。由此,这Mass的赋值为mMB,F})=0.7其中,m1系指由第一个敌友飞机识别器提供的证据的Mass值。注意,其余的信任将被留给环境0,作为未表达意见的部分:m1({0})=1—0.7=0.3注意‘未表达意见'既不是信任,也不是不信任。而概率论对此却给出不同的结果P(敌机)=0.7 P(「敌机)=1—0.7=0.3对同一个问题,两种理论却给出了不同的处理,这正体现了D-S理论和概率论之间的主要差别。证据理论概率论0.7m1({B,F})支持假设P(敌机)支持假设0.3m1({0})未表达意见P(「敌机)反驳假设环境的幂集合中的任一个集合,若其Mass值大于0(zero),则称其为焦点元素(focalelement)。使用焦点元素这一术语的原因是:一个幂集合元素X的Mass值m(X)大于0,意味着可用证据在X中的被聚焦,或者说被集中。表5.1.1说明Mass比概率有大得多的自由度:D-S理论概率论m(0)不必须等于1£与=1j如果X[Y,m(X)<m(Y)不是必须的如果X[Y,P(X)<P(Y)是必须的m(X)和m(iX)之间没有什么关系表5.1.1D-S理1P(X)+P(iX)=1论和概率论的比较每一个Mass能被形式化表成一个函数,该函数映射幂集合中的每一个元素成为区间[0,1]的一个实数。函数的形式化描述为m:20T[0,1]按着惯例,空集合的Mass通常被定义为0(zero),m(0)=0.0的幂集合20的所有子集的Mass和为1£Xg20m(X)=1或 £m(X)=1X[0

例如,在飞机环境中有£m(X)=m1({B,F})+m1(0)=0.7+0.3=1Xg20•组合证据当新的证据变成可用的时候,我们希望组合所有的证据以产生一个更好的信任评价。为了说明如何组合证据(也称之为证据组合),我们首先看一个证据组合一般公式的一种特殊的情形。假定另一类型的一个传感器用0.9的信任识别出目标飞机为轰炸机。现在,来自传感器的证据的Mass为:m1({B,F})=0.7 m1(0)=0.3m2({B})=0.9 m2(0)=0.1其中,m1和叫与第一和第二种类型的传感器相对应。使用下述登普斯特的组合规则的特殊形式以产生组合Mass血3已)=m】£皿20)=£m】(X)xm2(Y)XcY=Z其中,求和遍布使XcY=Z成立的所有元素X与Y,操作符©表示正交和或直接和。登普斯特的规则组合两个Mass以产生一个新的Mass,新Mass表示初始可能是冲突的证据间的一致意见。这新Mass通过仅仅对交集的Mass求和汇集了一致意见,集合的交集表达了公共的证据元素。十分重要的一点是:用于组合的证据必须是独立差错的(independenterrors)。注意,独立差错的证据丰独立采集的证据。表5.1.2给出了登普斯特的组合规则,其中每一个交集之后都跟随一个数值(两个Mass的乘积)。m2({B})=0.9m2(0)=0.1m1({B,F})=0.7{B}0.63{B,F}0.07m1(0)=0.3{B}0.27。 0.03表5.1.2行列Mass相乘(轰炸机)(轰炸机或战斗机)(未表示意见)m12({B})=m1©m2({B})=0.63+0.27=0.90m12({B,F})=m1©m2({B,F})=0.07血12(®)=皿1©m?(®)=0.03(轰炸机)(轰炸机或战斗机)(未表示意见)这m12({B})表示目标飞机是轰炸机的信任。但是,这m12({B,F})和m12(0)却包含着另外的信息。因为它们的集合中包含了轰炸机,所以把它们的正交和贡献给轰炸机一个信任似乎是合理的。由此,关于{B}的最大信任为0.03+0.07+0.9,关于{B}的最小信任为0.9,{B}的真实的信任在区间[0.9,1.0]中的某处。在证据推理中,证据导致一个证据区间(EI,EvidenceInterval)。EI的下界在证据推理中被称为support(Spt),在D-S理论中被称为Bel,这上界被称为plausibility(Pls)。这support是基于证据的最小信任,而plausibility是基于证据的最大信任。我们有,0<Bel<Pls<1成立。在证据理论中,下界和上界有时被称做下概率和上概率。表5.1.3给出了一些通常的证据区间。support或belief函数(即Bel函数)是一个集合和它的所有子集的总的信任。Bel之定义如下:Bel(X)=£m(Y)YcX以飞机环境中的第一个传感器为例,Bel1({B,F})=m1({B,F})+m1({B})+m1({F})=0.7+0+0=0.7证据区间区间含义的解释[1,1]完全是真的[0,0]完全是假的[0,1]完全无知[Bel,1]其中0<Bel<1趋向于支持[0,Pls]其中0<Pls<1趋向于反驳[Bel,Pls]其中0<Bel<Pls<1既趋向于支持又趋向于反驳表5・1・3一些通常的证据区间Mass是关于一个集合的信任,而不包括它的任何一个子集的信任,Mass是一个较为局部的信任。belief函数应用于一个集合和该集合的任何一个子集,Bel是一个更为全局的信任。这Mass和belief函数之间的关系可表示为m(X)=£(-1)X-YBei(Y) 其中,IX-Yl是集合X-Y的基数。YcXBei1©Bei2({B,F})=m1©m2({B,F})+m1©叫({B})+m1©m2({F})=0.07+0.90+0=0.97实际上,Bei(0)=1,因为所有的Mass和必须等于1。证据组合恰恰在不同的子集中重新分配了MasS值。一个集合S的证据区间,EI(S),可用信任来定义:EI(S)=[Bei(S),1-Bei(S)]如果S={B},那么S={A,F},有Bei({A,F})=叫©m2({A,F})+m1©m2({A})+叫©m2({F})=0,所以,又有EI({B})=[0.90,1一0]=[0.90,1] .一^集合X的似然性(piausibiiity)被定义为不反对X(或不反驳X)的程度:Pis(X)=1-Bei(X)=1-£m(Y)YcX•信任的标准化 一假定第三个传感器报告了关于目标飞机的一个冲突的证据m3({A})=0.95m3(0)=0.05表5.1.4给出了证据组合的十字相乘的结果:m1©m2({B})0.90m1©m2({B,F})0.07m1©m2({0})0.03m3({A})=0.9500.85500.0665{A}0.0285m3(0)=0.05{B}0.045{B,F}0.003500.0015表5・1・4组合第三个证据因为有{A}c{B}=0,{A}c{B,F}=0,所以出现了空集合。具体计算如下:m1©m2©m3({A})=0.0285m1©m2©m3({B})=0.045m1©m2©m3({B,F})=0.0035m1©m2©m3(0)=0.855+0.0665=0.9215m1®m2®m3(0)=0.0015注意,我们有所有Mass之和必须等于1,即£m1©m2©m3(X)=1,其中求和只需遍及所有的焦点元素。XC0但是,由于m1©m2©m3(0)>0就产生了问题:该事实与m(0)=0之定义相矛盾。一种解决办法是使焦点元素标准化。就是用某种原则把m1©m2©m3(0)分给焦点元素。首先定义K=£m1(X)xm2(Y),然后对每一个焦点元素Z作:XcY=0置Z—Z/(1-K)对表5.1.4的例子,K=0.855+0.0665=0.9215,1-K=0.0785,每个焦点元素标准化后的值为:m1©m2©m3({A})=0.363m1©m2©m3({B})=0.573m1©m2©m3({B,F})=0.045m1©m2©m3(0)=0.019可见,由于第三个(与前两个证据相冲突的)关于{A}的证据的存在,显著地侵蚀了对{B}的信任。有,Bel({B})=m1©m2©m3({B})=0.573Bel({B})=Bel({A,F})=mj©m2©m3({A,F})+=mj©m2©m3({A})+=m】©m2©m3({F})=0.363又有,{B}的证据区间EI({B})=[Bel({B}),1-Bel({B})]=[0.573,1-0.363]=[0.573,0.673]注意,由于{A}的冲突证据使{B}的support和plausibility都明显地减小了。登普斯特的证据组合规则的一般形式为£m1(X)xm2(Y)m1©m2(Z)=XcY=Z 其中,K=£m1(X)xm2(Y)1-K XcY=0注意,当K=1时,正交和无定义。K的值指出了被组合证据相互冲突的程度。当K=0时,表示两个证据完全一致(完全相容);当

K=1时,表示两个证据完全冲突;当0VKV1时,表示两个证据部分相容。•移动(MovingMassesandSets)移动Mass的模拟有利于理解支持(support)和似真性(plausibility)。主要原则如下:•支持(support)是赋予一个集合和它的所有子集的Mass;一个集合的Mass能够自由地移入它的子集;一个集合的Mass不能移到它的超集(superset)中去;•如果从一个集合移动Mass进入它的子集,则这些被移动的Mass在相应的子集中仅仅能贡献给子集的似真部分,而不能贡献给支持部分;1=•环境0的Mass能移到任一子集。1=假定M(X)=0.6,M(Y)=0.4,分别是X和Y的支持。X的似真性是0.6,因为Y的Mass不能移入X.然而,X的Mass能移入Y,所以Y的似真性是0.4+0.6=1 .X和Y的证据区间是EI(X)=[0.6,0.6],EI(Y)=[0.4,1].•D-S理论的困难由于标准化使D-S理论出现了困难,并导致了与人们期待相反的结果。1984年,扎德(Zadeh)引用了两个医生A,B关于对同一个患者疾病的信任的例子。关于一个患者疾病的信任如下:mA(脑膜炎)=0.99, mA(脑瘤)=0.01mB(脑震荡)=0.99, mB(脑瘤)=0.01

两个医生都认为这个患者得脑瘤的可能性只有0.01.用登普斯特的证据组合规则计算如下:mA({脑膜炎})=0.99mA({脑瘤})=0.01mB({脑震荡})=0.990 0.98010 0.0099mB({脑瘤})=0.010 0.0099{脑瘤}0.0001mA㊉mB({脑瘤})=0.0001mA㊉mB(0)=0.9801+0.0099+0.0099=0.99991-K=1-0.9999=0.0001标准化后得到:mA㊉mB({脑荡})=0mA㊉mB({脑膜炎})=0,mmA㊉mB({脑荡})=0这样一个结果与我们的直觉完全不同。我们认为不仅当K=1时,不能做正交和,而且当K接近于1的时候也不能做正交和。§2一种简化的证据理论模型MET1考虑集合S={s「s2,…,sn},设四是集合2su{忑}上的一个函数,说p是2su{S}上的一个基本支持函数(这里的基本支持函数与D-S中的Mass函数相当),如果p满足:VAuS,都有0<h(A)<1”0)=0;£"A)<1AuS£MA)+MS)=1.在比较普遍的一类应用问题中,VAu2sU&},^p(A)>0,则必有:A=余集S,或者,「=单个元素集合{s.},1<i<n换言之,如果Ag<S}UOs.}1<i<n},则必有p(A)=0.在后面将看到,基于此,可使基本支持函数的运算大为简化。为简便计,简记卜(^sj)为「㈤),对于1=1,2, ,n.于是基本支持函数的定义又可改述如下:2su{S}上的一个函数口说是震7电}1<1<n}上的一个基本支持函数,如果四满足:①0<^",1<1<n;£^(s1)<1;1<1<n③MS)=1-£H(s1).这样,基本支持函数g就完全取决于它在集合0U%}1<1<n}中的元素的取值。•组合规?}或曰综合函数)设g,v是Wu}1<1<n}上的两个基本支持函数,其直乘积函数(也称之为综合函数,或组合规则、综合运算、直乘积运算等)定义如下:(人=g®vMs.)=^(s1)v(s1)+岫)V(S)+^(S)v(s1)D=v(S)xp(S)+£(n(s1)v(s1)+n(s1)v(S)+h(S)v(s1))1<1<n其中,D壬0.如果D=0,则说g与v相互矛盾,对相互矛盾的基本支持函数g与v不作直乘积运算。可以证明存在一个基本支持函数£对于任意一个基本支持函数卜,都有£®g=g所以,我们有:{s1,s2,...,sn}上的所有基本支持函数和®,构成一个无穷有壹的阿贝尔半群。•综合函数(综合运算)的封闭性、可交换性与可结合性⑥若g,v是S上的两个基本支持函数,那么①=g®v也是S上的基本支持函数。①=g®v=v®g,®'=p®v®y=(p®v)③Y=p③(v®y),证明从略。•关于A的g支持函数对于VAuS,定义关于A的g支持函数,9(A)=£p(a), (9(A)对应于D-S理论中的Bel,Spt,BeliefaeA函数)・•关于A的g不反对函数W(A)=p(S)+9(A)=1-£p(a)+£p(a)=1-£p(a)aeS aeA aeS\A直观上说,9(A)是A中兀素的g值总和,W(A)是1减去S-A中元素的g值总和。这里的9(A)和v(A)分别与D-S理论中support和plausibility对应。中(为和w(A)之含义由图5.2.1示出。SS无知A(不反对A)SS-A 反对AA支持A(不反对A)图5.2.19(A)和w(A)显然,对于任意A和g,有9(A)<W(A);又对于S的任意两个子集A1和A2我们有v(A1)-9(A1)=W(A2)-9(A2)=MS)我们可以把V(A)-9(A)看成是对A无知的程度。在应用中,称集合S为一个“概念”。设X是2su{S}上的一个变量,称X=A为一个命题(简记为A),表示“S是A”。命题A的不确定性值e[9(A),w(A)],并称[9(A),w(A)]为命题A的证据区间,简记为EI(A)。为了说清楚命题A的不确定性值究竟在EI(A)中的何处,在

MES1中定义了关于命题A的g认可函数:f(A)=(A)+[.(A)-9(A)]x|A|+S|,对于任意人g2sU{S}或者(AYf(A)=(A)+[W(A)-9(a)]xPx面,其中0-a,P-1是两个待定常数。

k问其中,|A|和|S分别表示A和S中元素的个数。可以证明命题A的g认可函数满足:0<f(A)<1,MTVAuS;£f(a)=1,其中f(a)表示f({a}).aeS事实上,f(A)>0自明。证明f(A)<l如下:注意f(A)=9(A)+[v(A)-9(A)]X|A|/|SI=£g(a)+[1—£g(a)]X|A|/|SIaeA aeS<£g(a)+1—£g(a)=1aeS aeS对于II,我们有,f(A)=9(A)+[w(A)-9(A)]X|A|/|SI£f(a)=£g(a)+特xlS|=g(S)+£g(a)=1aeS aeS aeS显 然 有9显 然 有9(A)<f(A)<V(A)证毕下面,让我们看一个例子。设S={油层,同层,水层,干层,气层},g是S上的基本支持函数,且 _g(油层)=0.40,g(同层)=0.30,g(水层)=0.00,g(干层)=0.10,g(S)=0.20于是,对于A={油层,同层},支持函数、不反对函数和认可函数的值分别为9(A)=g(油层)+g(同层)=0.70W(A)=g(S)+9(A)=0.20+0.7=0.90f(A)=9(A)+[.(A)—9(A)]X|A|/|S|=0.70+(0.90—0.70)X2:5=0.78上面,我们讨论了g支持函数,g不反对函数和g认可函数。注意,我们的这些讨论都是在同一个概念S上进行的。在实际应用中,通常将同时来考虑多个不同的概念S,T,…。为此,我们将S上的g支持函数,g不反对函数,g认可函数及g基本支持函数分别记为:9s,Ws,fS,gS•I定义规则在定义规则之前,我们先给出,MET1用于油气资源评价的一个具体例子。[方法名]:用有机碳含量评价生油岩丰度[方法注释]:作者:吴立真;时间:1985年8月;参考文献:黄弟藩,《中国陆相油气生成》[对应任务]:生油岩丰度评价[方法适应条件]:有机碳含量低于4%•・・ ・・・ .•• ...[规则]:(1)如果:有机碳含量大于1.0%则上有可信度(CF1)证明应属于高丰度,同时有可信度(CF2)证明应属于较高丰度;(2) 如果:有机碳含量属于区间[0.6%,1.0%]则上有可信度(CF1)证明应属于高丰度,同时有可信度(CF2)证明应属于较高丰度,同时有可信度(CF3)证明应属于较低丰度;(3) 如果:有机碳含量属于区间[0.4%,0.6%]则上有可信度(CF2)证明应属于较高丰度,同时有可信度(CF3)证明应属于较低丰度,同时有可信度(CF4)证明应属于非生油岩;(4) 如果:有机碳含量小于0.4%则上有可信度(CF3)证明应属于较低丰度,同时有可信度(CF4)证明应属于非生油岩;下面将给出上面MET1用于油气资源评价的一个具体例子的进一步解释。我们定义规则的形式化描述:〈后件〉H=(〈属性值1〉〈可信度1〉…〈属性值k〉〈可信度k〉)或〈后件〉H=(〈属性值1〉〈可信度1〉)且(〈属性值2〉〈可信度2〉)且…(〈属性值k〉〈可信度k〉)命题BH=(〈属性值1〉〈属性值2〉…〈属性值k〉),实际上命题B是一组命题:T是属性值1,T是属性值2,…,T是属性值k,这里T是一个概念。命题B的可信度因子:CF=(〈可信度1〉〈可信度2〉…〈可信度k〉)=(CF1,CF2,…,CFk)并满足:CF.>0 i=1,2,…,k; 2)£CFi<1〈前件〉由若干个〈断言〉的逻辑与连接所构成:1<」"〈前件〉II=〈断言〉AND〈断言〉AND…AND〈断言〉〈规则〉II=IF〈断言〉AND〈断言〉AND…AND〈断言〉THEN(〈属性值1〉〈可信度1〉…〈属性值k〉〈可信度k〉)为定义〈前件〉的可信度,首先来定义一个〈断言〉的可信度。〈谓词〉是〈断言〉的核心,所有〈谓词〉的解释都是由系统或用户给出的。〈谓词〉在[0,1]上取值。一个〈规则〉的〈前件〉的可信度BF,定义为反复使用如下规则得到的值:

』若〈前件〉中只有一个〈断言〉,则〈前件〉的可信度定义为该〈断言〉的可信度;II使用一个新的〈断言〉代替用AND连接的〈断言〉,这个新〈断言〉的可信度被定义为这些用AND连接的〈断言〉的可信度中的最小值。定义一个〈规则〉之〈后件〉的可信度CER为:CER=(BFXCF1BFXCF2…BFXCFk),其中BF是〈前件〉的可信度,C与是〈后件〉中的可信度因子,即规则强度。 1下面通过属性A(或命题A)来阐明其可信度因子。耳的解释:AA>Z+电Z—£3<A<Z+qY+£2<A<Z-£3Z—£3<A<Z+《3Y-£2<A<Y+£2X+£1<A<Y-£2Y-£2<A<Y+£2X-£1<A<X+£1A<X-£1X-£1<A<X+£1s1=(Y-X)Xd1;s2=(Z-Y)Xd3;s3=s2;取乌=d3假定A取非负实数值CF1=Vj(A-Z+e3)^(2X£3)CF2= 1-(A-Z+电):(2X电)(A-Y+s2)^(2X£2)CF3= (Y+e2-A)^(2Xe2)(A-X+上):(2X上)cf4=V、(X+£1-A)^(2X£1)如果一条〈规则〉之〈后件〉中有一个概念T上的命题A,T={t1,t2,…,tn},则当这条产生式规则被触发后,就得到一个关于命题A={a1,a2,…,%}的可信度(或该规则之结论的可信度)CER=(BFXCF1BFXCF2…BFXCFk)我们利用这组值,来定义T上的一个基本支持函数|iT:BFXCF. 如果a=a.(a.gA)虻0 若a。"砂a电A;显然llT满足基本支持函数的定义。所以,我们可以利用每条被触发的规则定义一个基本支持函素数。设|iT,•••,*是概念T上由若干条不同的规则所定义的基本支持函数,我们定义roT=pT①…③vT为所有这些规则执行后,T上的新的基本支持函数,同一概念上的基本支持函数具有综合关系。当用概念T作为进一步推理的证据时,我们将使用这个新的基本支持函数®T作为T上的当前的基本支持函数。总结起来,不确定性传播的过程为:初始时,每个概念S其上都有基本支持函数,如久。若对此函数完全无知,则财如=1,火(s)=0,对于任意seS。然后,利用被触发的规则,根据一些概念上已知的基本支持函数值,通过求〈前件〉的可信度值,得到〈前件〉的可信度。再与规则的可信度因子结合,得到关于〈后件〉的可信度,即结论的可信度。然后,利用这组可信度值定义相应概念上的一个基本支持函数,结合此概念上的原有的基本支持函数,产生新的基本支持函数,用作进一步推理的基本支持函数。这就是MES1的不确定性传播的一个周期。§3一个新的简化证据理论模型—凸函数证据理论模型不精确推理模型IRM(InexactReasoningModel),是专家系统的重要组成部分之一。IRM与其所隶属的专家系统的应用领域的知识和问题求解特点的符合程度,直接决定着专家系统的问题求解质量[1]。§3.1IRM1的困难对应用领域中的有序命题类问题(文中下面给出定义),MES1的不确定性处理方法遇到了困难,下面用一些例子说明。在这些例子中,用一个n元组表示生油条件的评价结果,n元组的第i项(即第个i元素)表示第i个命题:生油岩丰度是第i类(的),设第i个命题有真值ae[0,1].例1:在由MES1支撑建造的生油条件评价专家系统中,对一个圈闭的生油岩丰度进行评价时,采用了有机碳、总烃和氯仿沥青等方法,假定用有机碳和氯仿沥青方法分别得到的评价结果是:(0.1,0.6,0.0,0.0), (0.0,0.0,0.1,0.6),其中:四元组(0.1,0.6,0.0,0.0)代表了一个基本支持函数:你s1)=01,你s2)=0.6,你s3)=0.0,你s4)=0.0;四元组(0・0,0・0,0.1,0.6)代表了另一个基本支持函数:v(s)=0.0,v(s)=0.0,v(s)=0.1,V(s)=0.6 。1 2 3 4那么利用MESl系统中的综合函数得到的综合结果是:(0.0325,0.353,0.0325,0.353).在这个综合结果中,“生油岩丰度是第二类”与“生油岩丰度是第四类”的真值都比较大,由此可得出结论:“生油岩丰度既是第二类的,又是第四类的”。在石油地质勘探领域中,第一、二、三、四类分别被认为是好类、较好类、较差类和差类,这个结论就表示:“生油岩丰度既是较好的,又是差的”,毋庸置疑,这是一个不能被地质专家接收的错误的结论。例2:当使用有机碳方法和氯仿沥青方法得到的评价结果分别是:(0.2,0.8,0.0,0.0), (0.0,0.0,0.8,0.2)时,MES1认为这样的两个结果是不相容的,无法进行综合。因此,只能将这两个结果罗列起来,而不能给出评价。从有序命题的观点出发,石油地质勘探专家却认为:这种情况应该进行综合,并完全能够进行综合。为此,我们基于MESl系统中的基于简化证据理论提出了一个新模型—凸函数证据理论模型。上面的例子可作形式描述:S是一个概念,概念S即“生油岩丰度”,S={s1,s2,s3,s4},其中:si表示“第i类”,对于1<i<4.第i个命题是“生油岩丰度是第i类”,对于1<i<4.我们注意到:这些命题均呈“S是P”的形式,并且表示被考察对象的主词,即S,均相同,表示对象性质的谓词P又依次是“第一类”,“第二类”,“第三类”和“第四类”,即呈序关系。例3:如果S={用先进设备装备的,宽敞的,装修典雅的,明亮的},所考察的对象是“205教室”。若四个命题“205教室是用先进设备装备的”,“205教室是宽敞的”,“205教室是装修典雅的”和“205教室是明亮的”的不确定性值分别为:0.059,0.353,0.059和0.353,那么,该结果是完全可以接受的,其含义是“205教室(是)既宽敞又明亮(的)”。对上述例1和例3作一下分析可知:第3个例子中各命题的谓词分别是“用先进设备装备的”,“宽敞的”,“装修典雅的”和“明亮的”。它们描述的是概念“205教室”的不同特征或性质。而第1个例子中各谓词描述的却是概念“生油岩丰度”的同一性质,并且各谓词间还存在着“序”关系。§3.2具有凸函授性质的简化证据理论模型我们把例1中的命题称为一组有序命题。有序命题的定义如下:定义1.说一组简单命题P『P2,…,Pn,是一组有序命题,如果它们满足:1对i=1,2,…,n,命题P.的主词项均为S,谓词项为%;II对i=1,2,…,n,%均描述S的同一性质或特征;』谓词项S],s2,…,sn描述S的同一性质的程度依次增强或减弱。下面来定义一组有序命题间的“小于等于”关系,记为“<”。定义2.设一组有序命题P],P2,…,Pn,对任意1<i,j<n,说P.<牛当且仅当i<j.(s,<)是一个全序集,这里s是有序命题集,简记p.<p.和p.<Pk为'p.<P.<Pk .对实际应用领域中的评价类、解释类等问题,在有序命题的情况下,人们对同一事物的某一特征或性质的评价结果,一定表现出一种趋向性和连续性其形式化描述如下:定义3.对一组有序命题P],P2,…,Pn,IP.I表示命题P.的真值,1<i<n.若1PmI=max{IPJ,…,IPnI},则:对Vig{1,2,…,m-1},都有IP.I<IP^I;对Vig{m,m+1,…,n-1},都有IP.I>IPi+1I .由此我们得到: 1 '定义4. 一组有序命题P1,P2,…,Pn的真值IP1I,I P2I,・・・,IPnI应呈现出凸的性质,即对:任意P.<P.<Pk都有IP.I>min{IP.I,IPkI}成立。设S={S1,S2,…,sn}。S表示一个概念,S1,S2,・'・,Sn是一组有序命题,命题“S是Si”(1<i<n)简写为*。定义5./={」口是2Su{S}上的基本支持函数},表示2Su{S}上的基本支持函数空间。说f:/X/—/是综合函数,如果f满足如下性质:(i) 设叩冉g/,贝f(朽,%)也是基本支持函数(记3=f(^1,%)),称之为新的基本支持函数,即f(朽,%)满足10<f(出,%)(s.),对于1<i<n;1Zf31,日2)(s.)<1.1<i<n(ii) f(出,匕)应是凸函数,即对S中的任意命题%,s.,Sk,若%<s.<Sk,则有1 2f(比,四2)(s.)>min{f(比,四2)(s.),f(四],四2)(sk)}.性质(i)由综合函数定义本身得到。综合函数实质上就是把两个基本支持函数组合成为一个新的基本支持函数。性质(ii)由评价有序命题时所表现出来的凸性质得到。下面,我们给出针对有序命题的新的综合函数f的定义。定义6.设概念S={S],s2,…,sn}。S],s2,…,sn为一组有序命题。则其不确定性值的综合函数f为Vq,四2G/(i)当四1=四°,有f(曰0,^2)=f(^2,H0)=^2 ;(ii)当四]更口0且四2更口o时,有:

TOC\o"1-5"\h\zr.▽(一 -}*£V1(sk)[1+u1(S)]+u2(sk)[1+u2(S)p/(g-k+1)J<£sk)[1+u1(S)]+u2(sk)[1+u2(S)]}/(g-k+1)+f(四],f(四],四2)(si)=<2£v1(sk)[1+u1(S)]+u2(sk)[1+u2(S)p/(k-g+1)gg<n_ -}当i>g1£V1(sk)[1+u1(S)]+u2(sk)[1+u2(S)p/(k-g+当i>g〔i<k<n其中其中05x£加05x£加(s,)[1+u.(S)/(1-^.(S))]+u2(s,)[1+u2(S)/(1-u2(S))]1i 1 1 2I 2 21<i<n}xi四0G/满足*(Si)=0,对i=1,2,…,n(3.2.0)下面,将以定理形式证明函数f具备性质(i),(ii):定理1如上定义的函数①=f(u1,u2)是基本支持函数u1,u2G/证:1当u1=u0,或u2=u0时,显然。II当u1即0,u2即。时,证明乙①(s,)=1-05X[u2(S)+u2(S)]<1.1<i<n令A(k)=u1(sk)[1+u1(S)]+u2(sk)[1+u2(S)],当i<g时q(s.)=f(u,u,)(s.)=1£ =1[AH+婪+...+*]i],杪2八〃2 g-k+1 2g g-1 g-i+11<k<i当Z=g当Z=g时,g,)=2£另+2

1<k<g=_L[AH+A2)£ A(k).,k—g+1g+1<k<n+...+A(g)+A(g+1)+A(g+2)+...|A(n)]g-1 1 2 3 n-g+1(3.2.1)(3.2.2)£ A(£ A(k)=1[A(i)+A(i+1)+...+A(n-1)+A(n)]k-g+1 2i-g+1 i-g n-g n-g+1i<k<n(3.2.3)由(3.2.1): £①(s.)=1[(g-1)A(1)+(g-2)A(2)+…+2xA(g-2)+A(g-1)]1<i<g-1 1 2 & &-1 3 2(3.2.4)由(3.2.3)由(3.2.3): £①(s.)=HA(g+1)+2xA(g+2)+…+(n-g)A(n)]1 2 2 3g+1<i<n由(3.2.2),(3.2.4),(3.2.5):£①(s,)=-L[A(1)+A(2)+A(3)+…+A(n)]=-L1<i<nn-g+1(3.2.5)£A(i)1<i<n=[[£H (s)+£u (s)+u(S) x£ u(s)+u(S)x£u (s)]2 i 匕i i 匕 匕i1<i<n 1<i<n 1<i<n 1<i<n•.•对于Vug/,都有u(S)=1-£u(s,),所以又有:1<i<n

\1 T — — 。一 一 。一乙①(Si)=![1-F(S)+1―日2(S)+也(S)-"(S)+日2(S)-时(S)]1<i<n=2[2-"(S)-时(S)]=1-*”(S)+时(S)] (3.2.6)故 Z①(si)<1 得证1<i<n[又由新基本支持函数的定义有①崟)>0,i=1,2,…,n故W故W=f(R],日2)是基本支持函数。证毕引理对于V口],四2G/,有:当si<sg时,①=f(^],妇是递增函数,又当sg<si时,①=f(口],四2)是递减函数,其中g在定义6中被定义。g g证:对任意St<Sj<Sg,有«S)-«(Si)=1£\(Sk)[1+叩S)]+H2(Sk)52(S)]}/(g-k+1)>0i+1<i+1<k<j故①(s.)>«(S.).当S<S.<S.时,仿上可证①(s.)>«(S.).j I gIj I J由引理,易证:定理2有序命题的综合①=f(|i],冉)是凸函数。事实上我们提出的新综合函数①=九坦皈将找出有序命题集中最有可能成立(或最有可能为真)之命题的序号g,当一命题之序号与町之差的绝对值越小时,该命题的不确定性值与序号加的命题的不确定性值就越接近应用这个新定义的综合函数于引言中的例1和例2,分别得到新的综合结果分别是:(0.0325,0.585,0.1625,0.13)(0.05, 0.6833334, 0.2333333,0.0333333)这两个结果是比较令人满意的。我们面向有序命题类问题构造的新综合函数,有效解决了有序命题类问题。实际验证还表明:对有序命题类且满足MES1的简化证据理论和一般证据理论模型的综合条件的领域问题,与MES1的简化证据理论和一般证据理论模型相比,这个新综合函数得到的综合结果不仅更合理,而且与领域专家所给出的结论之间有着更好的吻合。§3.3具有凸函授性质的简化证据理论模型的分析新综合函数中的g的公式为:TOC\o"1-5"\h\z*(』「-_- \g=05x£V1(Si)[1+比(S)/(1-^1(S))]+R2僵)[1+巨2(S)/(1-R2(S))]/xi- 1<i<n(- _ _ _(3.3.1)_]令gd=1£ixv1(si)[1+叩S)/(1-叩S))]+R2(Si)[1+h2(方/(1-日2(s))]i,故有/ JL1/ JL JL Ig=-gdJ .1<'<n命题:g£[1,n],g表示最有可能为真之命题的序号。证:为此只须证明 ]W1=+£V(S)[1+口(S)/(1-u(S))]+口(s)[1+口(S)/(1-u(S))][=12 1i 1 1 2i 2 21<i<n进而只须证明 ]w2=£Le)[1+u1(S)/(1-u1(S))]+u2(si)[1+u2(S)/(1-u2(S))])=21<i<n————“2=[1+山(5)/(1一山(》)]旗山(七)+[1+日2(,/(1—日2(,)]旗H2僵)TOC\o"1-5"\h\z1<i<n 1<i<n又— _•E^1(s.)=1一叩S),Z%(七)=1—r2(S),将此代入上式得到:1<i<n 1<i<n••.有“2=2, 证毕g表示最有可能成立之命题的序号,所以我们必须准确地确定gd实际上更接近于哪一个命题之序号。T因此,我们改写关于g的表达式(3.2.0)成为如下的公式(3.3.1):^gd] 当gd~[_gd」>05时g[l_gd」 当gd-\_gd」<05时 (3.'1)其中的符号“L」”和“「]”分别是天棚函数和地板函数。我们称由公式(3.3.1)确定g的方法为新法,由定义6决定g(即由公式(3.2.0)决定g)的方法为旧法。下面我们用例子来说明这一改进的意义。例4.假定有如上定义的两组有序命题,为简便计,这里不给出命题的具体含义,只给出与之对应的两组数据: (0.2,0.6,0.0,0.0) (0.0,0.0,0.2,0.8)由旧法得到的结果为 (0.06,0.6033334,0.1833333,0.1333333)由新法得到的结果为 (0.04,0.22, 0.52, 0.2 )第一组数据说明某对象是第二类的可能性为最大,第二组数据说明某对象是第三类的可能性为最大,由此可知命题“某对象是第三类的”(即序号为3的命题)成立的可能性为最大。由此可以得出:旧法得到的结果是不够合理的。例5.最后让我们举一个更为明显的例子,有如上定义的两组有序命题,与之对应的两组数据为:(0.2,0.8) (0.3,0.5)由旧法得到的结果为 (0.63,0.35)由新法得到的结果为 (0.14,0.84)无庸置疑,这是一个很有说服力的例子。II事实上,在公式(3.3.1)中,我们还未认真考虑gd-Lgd」=0.5的情况。在这种情况下,「gd]和Lgd」两者有完全相同的可能性作为最有可能成立之命题的序号。因此,取其中的任何一个都不是合理的解决办法。下面我们给出两个例子予以说明。例6.有如上定义的两组有序命题,与之对应的两组数据为:(0.7,0.1,0.1,0.0)(0.0,0.1,0.1,0.7)g=Lgd」得到的结果为 (0.1925,0.4858333,0.1833333,0.1283333)g=「gd]得到的结果为 (0.1283333,0.1833333,0.4858333,0.1925)例7.有如上定义的两组有序命题,与之对应的两组数据为:(0.3,0.7) (0.7,0.3)g=Lgd」得到的结果为(0.75,0.25)g=「gd]得到的结果为 (0.25,0.75)由此,我们把关于g的表达式(3.3.1)改成为如下的公式(3.3.2):「gd] 当gd-Lgd」>0.5时(3.3.2)g= Lgd」 当gd-Lgd」<0.5时(3.3.2)把g=Lgd」和g=「gd]得到的结果合成一个当gd-Lgd」=0.5时卜面我们给出当gd-Lgd」=0.5时,把g=Lgd」和g=「gd]所得到的两个结果结合成一个新结果的方法。设g=igd」和g=「gd]时所得到的两个结果为:①](k),k=1,2,…,n;%(k),k=1,2,…,n.Q(k)=0.5X[①](k)+%(k)],1<k<n,为合成得到的新结果。把公式(3.3.2)应用于上面的例6和例7:』对于例6有:被综合的两组数据: (0.7,0.1,0.1,0.0),(0.0,0.1,0.1,0.7)gd-lgd」=0.5g=Lgd」得到的综合结果(0.1925,0.4858333,0.1833333,0.1283333)g=「gd]得到的综合结果(0.1283333,0.1833333,0.4858333,0.1925)结合上述两个综合结果得到新结果(0.1604167,0.3345833,0.3345833,0.1604167)』对于例7有:被综合的两组数据: (0.3,0.7),(0.7,0.3)gd-Lgd」=0.5g=Lgd」得到的综合结果(0.75,0.25)g=「gd[得到的综合结果(0.25,0.75)结合上述两个综合结果得到新结果(0.5,0.5)由此可见,公式(3.3.2)比公式(3.3.1)所给出的结果要合理。』但事实上,在公式(3.3.2)中,我们对gd-Lgd」>0.5和gd-Lgd」<0.5的两种情况的处理还是很粗糙的。实际上,当且仅当gd-Lgd」=0时,g之确定才是准确的。由此,我们可根据具体的应用领域选择两个正实数A1,A2>0(两个待定常数),譬如,一般可选A1=0.2,A2=0.8.' 「gd] 当gd-LgdJ>A2时g=<Lgd」 当gd-LgdJ<A1时把g=Lgd」和g=「gd]得到的结果合成一个 当A]<gd-Lgd」<A2时(3.3.3)下面我们给出当A]<gd-Lgd」<A2时,把g=Lgd」和g=「gd]所得到的两个结果结合成一个新结果的方法。设g=Lgd」和g=「gd]时,分别得到的两个结果为:w(k),k=1,2,…,n;w(k),k=1,2,…,n.令8=gd-Lgd」,0(k)=w(k)x(1-8)+w2(k)x8,k=1,22,…,n,为合成得到的新结果。假定「gd〕与Lgd」之间的距离为1(表示一个等级),8是gd离Lgd」的距离,当gd离Lgd」越近时,w'k)在组合中所起的作用就应该越大,所以作为w1(k)的组合权重应该是1/8,同理,因1-8是gd离「gd]的距离,所以w2(k)的组合权重应该是1/(1-8).考虑规范化,w1(k)的权重应该是18)+[(1/8)+1.(1-8)]=1-8,w2(k)的权重应该是[1八1-8)]+[(1/8)+1/(1-8)]=8. 2§3.3.1对满足有序命题类问题的组合函数的扩展让我们把定义6中的公式改写为:f(七,女)(s)='£L]X出(sk)[1+出(亍)/(1-出(S))]+W2x^2(sk)[1+四2(S)/(1-四2(S))]*(g—k+1)当iVgTOC\o"1-5"\h\z1-k冬 j£L1X目1(sk)[1+叩S)/(1-四1(S))]+l2X日2(sk)[1+四2(S)/(1-四2(S))]孑(g-k+1)+<1-k-g _ _ _ _ j£L1x目1(sk)[1+叩S)/(1-四1(S))]+L2x日2(sk)[1+四2(S)/(1-四2(S))P/(k-g+1)当i=gg+M平〃 _ _ - _ j£L1X目1(sk)[1+叩S)/(1-四1(S))]+l2X日2(sk)[1+四2(S)/(1-四2(S))]也k-g+1)当i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论