




已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十章 处理两级不确定性的推理模型1 引 言我们以产生式规则和处理不确定性的问题为背景来展开两级不确定性处理的讨论。迄今为止,绝大多数专家系统建造者在完成领域知识获取后,便认为所获取的每一条产生式都是完全正确的,就是说每条规则的前件、后件和规则强度都是准确无误的。尔后,以此为基础,采用某种不确定性处理模型并利用所获取的规则进行推理求得领域问题的解答。但是,上述关于每条产生式规则都是准确无误的观点是不正确的。其理由是:领域专家的权威性是相对的(譬如,医学专家对疑难病患者的诊断,常常采用多个专家会诊的方式加以解决,即使是相当权威的医学专家也不例外),知识工程师的水平是有限的,建造一个专家系统在时间、成本等方面是有严格限制的,确保大量规则之间的完全一致性是非常困难的,等等。事实上,领域专家清楚的知道,在他(或她)给出的规则中,有一些是很准确的(很有把握的),有一些则不是很准确(对规则所刻画的关系有一个基本上的把握)。规则的准确性处理,对于提高推理的准确性,改善专家系统(ES)的性能,解决多ES协作冲突等问题都是很有意义的。2 规则中的不确定性、不准确性 2.1 规则强度某规则后件,一个结论(或中间结论),往往会有大量的前提证据,若前提证据集是完备的、证据间的逻辑关系是严格的、诸证据对结论的重要性刻画是百分之百准确的、LL,那么规则所推出的结论就是完全确定的,在这种情况下,我们说该规则是完全准确的或完全可靠的。但是,这常常是不现实的。为解决这一问题,文1引入了规则置信度因子(也称为规则强度)的概念。规则强度的含义是:当规则前件为真时,规则后件有多大程度为真。规则强度刻画了规则前件与后件之间的不确定性关系,它给出了规则的不确定性度量。这里应特别强调的一点是:规则强度与我们这里所说的规则准确性或规则可靠性全然不是一回事。 2.2 规则的准确性、可靠性一些原因使所获取的规则完全可靠、准确是很困难的。例如: 在一些情况下,一个结论(或中间结论,为简便计,下面用黑斜体的“结论”表示:结论(或中间结论)与很多(前件中的)证据(或曰事实)有关,从很多证据中选出与结论最有关一些证据是很困难的(当与一个结论 相关的证据很多时,通常不允许把所有与该结论 相关的证据都放在前件中); 在一些情况下,前件中一些证据间的逻辑关系不易准确确定,证据间的相对重要性不容易区分; 规则强度很难给准,通常只能给出一个范围,比如某领域专家给出某规则的强度为0.8 ,其相对误差为 12.5 % ,就是说该规则的强度可取区间0.7 , 0.9中的任一个值,但取0.8可能性为最大; 知识库中,确保众多规则的完全一致性是很困难的;等等。由此可见,规则不是完全准确的具有一定的普遍性。因此,研究表达、处理规则的准确性,或曰规则的准确度,是很有意义的。我们说证据可信度,规则强度,都描述了一级不确定性,即通常所说的不确定性,而规则的准确性却刻画了二级不确定性。定义1. 二级不确定性是关于一级不确定性的不确定性。从理论上讲,不确定性可以有多级。定义2. N+1级不确定性是关于N级不确定性的不确定性。 2.3 知识表示在基于规则的专家系统中,通常主要有两种不同粒度的知识片(知识表达中的一个知识单位):证据(或曰事实),产生式规则。定义3. 一个证据可表成一个四元组(E , , d1 , d2),其中E是一个证据,是E存在(或曰为真)的最可能的信度值,d1 和 d2分别是E的信度值朝着小于和大于的两个方向所可能产生的最大偏差,E的信度值可取区间-d1 ,+ d2中的任何一个值。d1 和 d2都描述了二级不确定性。定义4. 一个带有规则强度偏差的规则可表为:IF THEN (I , D) . 其中,I表示具有最大可能性的规则强度值,D表示规则强度取值I时所可能产生的最大偏差,就是说规则强度可取区间I-D , I+D中的任何一个值。这里的D描述了二级不确定性。定义5. 一个证据可表成一个三元组(A , , r),其中A是一个证据,为证据A的可信度,r 是证据A 及的准确度。r的取值区间为0 ,1, r = 0表示(A , )是完全不准确的,r = 1则表示(A , )是完全准确的。定义6. 一个带有准确度描述的规则可表为:IF THEN (I , R) . 其中,I是规则强度,R是规则的准确度。应指出的一点是,这里只讨论关于偏差的两级不确定性处理方法。3 关于偏差的两级不确定性推理模型我们以定义3和定义4给出的知识表示为背景,来研究信度与偏差的传播方法。 3.1 两级不确定性推理模型的必要条件设V是一级不确定性取值集合(包括证据信度值和规则强度值),D是二级不确定性的取值部分集合(包括证据的一级不确定性值的偏差和规则强度的偏差),U 是二级不确定性的取值集合,我们有D U, V D U . U上定义了一个综合函数G:U U U,G满足交换律和结合律。符号表示在一级不确定性的意义下的关于证据E的单位元,Ie表示规则强度单位元 1 .1. 对任意证据E,d1 D , d2 D , V,(, d1 , d2)满足如下性质:a. 如果,则d1 -,d2 1 -;b. 如果=,则d1 ,d2 1 -;c. 如果,则:C(H)= Ce(H)d1 除以变成统一标准乘以,变成局部于H左部的值d2 d. 如果 I = Ie 且D 0且 Ie 且,则: Ce(H)C(H) 1,0 d1 C(H) - Ce(H) , 0 d2 1- C(H)d. 如果 I ,则: 0 C(H) Ie 且,则: 0 C(H)Ce(H),0 d1 C(H) , 0 d2 Ce(H)- C(H)f. 如果 I Ie 且,则: Ce(H) Ie,则:Ie I - D I , I I + D 1b. 如果 I Ie 且 =,则: C(H) = Ce(H) d1 = d2 = 如果 I ,则: C(H) = Ce(H) d1 = d2 = 如果 I Ie 且,则: C(H) = Ce(H)+ Cmin = Cmax = d1 = C(H) - Cmin d2 = Cmax - C(H) 如果 I ,则: C(H) = Ce(H) - Cmin = Cmax = d1 = C(H) - Cmin d2 = Cmax - C(H) 如果 I = Ie 且 Ie 且,则: C(H) = Ce(H) - Cmin = Cmax = d1 = C(H) - Cmin d2 = Cmax - C(H) 如果 I Ie 且,则: C(H) = Ce(H)+ Cmin = Cmax = d1 = C(H) - Cmin d2 = Cmax - C(H) 3.2.2 规则前件由多个证据的逻辑与组成假定有规则 IF E1 E2 L Ek THEN H (I , D),与证据E1,E2,L,Ek对应的诸四元组为(, ,),(, ,),L,(, ,),与H对应的四元组为(H , C(H) , ,) . 假定集合 有h个最小元素:,其中 h 1,a 是待定常数。令 . 用 , 分别代替3.2.1中的公式 ,便可以得到 . 3.3 多条前件不同但后件相同的规则的结论综合假定有k条后件(结论)相同的规则:IF THEN H ( ,)L L IF THEN H ( ,)由k条规则分别得到的关于H的四元组为:(H , , , )(H , , ,)L L(H , , , ) (1)综合(1)式得到 (H , , ,)按(i = 1 , 2 , L , k)的不减次序排列式(1)中的 k项:(H ,)(H ,)L (H , , , ) (2)假定:,,那么为得到对应于H的四元组 ,我们一次综合公式(2)中的两个四元组: , 1 若,令 , 如果 ,则 ; 如果 ,则 ; 如果 ,则有a. 最大偏差为 : b. 最可能的偏差为 :其中,是待定常数。2 当 ,这计算方法类似于1;3 当 时,则说这两个结论相互冲突,此时,辩论是解决冲突的一种有效方法;4 当 时,我们有: ;5 当 时,又有: .4 讨 论 信度偏差的增宽问题为讨论在不精确推理过程中信度偏差的增宽问题,我们首先定义一个基于规则的专家系统的推理链长度。如果一个专家系统ES* 的推理树的根节点到某叶节点i的路径长为,那么ES*的推理链长度可定义为: 。在实用ES中,完成领域问题求解所形成的推理链长度一般不超过5,并且多数在2 4之间。此外,在实用专家系统中信度偏差和规则强度偏差都是比较小的。初始信度的相对偏差一般 20 % ,规则强度的相对偏差一般 10 % .综上所述,在实际应用领域,具有信度偏差不确定性推理模型的ES一般都不会产生:信度偏差由于不断传播而变得过宽。具有信度偏差不确定性推理模型的ES与通常的ES不同。如MYCIN在选择推理结果时,只考虑可信度一个因素,(基本上是)选择可信度最高的结论作为输出。而具有信度偏差的ES在选择推理结果时,却要考虑可信度和信度偏差两个因素。粗略地说,选出可信度高且信度偏差小的结论作为输出。 协作ES输出结论的评价在由多个领域相关的ES组成的组协作知识系统中,解决协作ES的结论评价问题是解决多结论冲突的重要方面,为此人们相继给出了一些评价ES结论的方法:a. 对参与协作的ES赋予一个权值该方法(下a. 方法)假定ES输出的结论为二元组()所示的形式,并假定不论在任何输入环境下,也不管输出的是什么结论,都用赋予协作ES的权值(一个固定的数)作为其权威性的度量。因为a. 方法既不区分协作ES的不同输入环境,也不区分协作ES的所有输出结论,所以是一个较粗的方法。b. 文2的方法该方法(下称b. 方法)寻找协作ES的所有输入证据 和它的所有输出假说 之间的概率统计关系: ,其中 表示在所有输入证据e下,假说 为真的观察数。b. 方法未能区分在所有不同的输入下,同一个假说为真的观察数的差异。另一方面,给出所有初始证据和任一输出假说之间的关系,是很困难的。c. 采用两级不确定性推理模型的方法该方法(下称 c. 方法)对协作ES的每一个输入证据,对协作ES的知识库中的每一条规则都赋予偏差(证据偏差和规则强度偏差)。在c. 方法中,协作ES的每一个输出假说都表成四元组( ),其中,“断言信度”,“ 断言信度偏差1”和“ 断言信度偏差2”都是一步步推理出来的,“断言信度”,“ 断言信度偏差1”和“ 断言信度偏差2”较好地刻画了在任一输入情况下,协作ES的某一输出假说的准确性,或者说权威性。领域专家给出一条规则的规则强度和规则强度偏差远比给出最低层证据与最高层假说之间的数量关系来得容易和准确。 使不确定性推理更准确的研究两级不确定性推理是一项使不确定性推理更准确的研究。这项研究主要是找出影响不确定性推理准确性的因素,这些因素主要有:不确定性处理模型(的健壮性、合理性),二级不确定性因素,证据阈值,规则触发阈值,规则强度阈值,规则强度的误差范围,领域专家知识的准确性,知识表示、不确定性处理模型和推理控制之间的关系,不确定性处理模型的敏感性,从ES推出的多个(可信度值都较高的)结论中确定一个结论的方法,输入数据的准确性,等等。开展这方面的研究是很有意义的。参考文献1 Zdrahal, Z., Second order measures for uncertainty processing, in: Proceedings of IJCAI, 1993, 626-631.2 Shortliffe , E. H. , Computer-Based Medical Consultations: MYCIN , Elsevier , NEW , York , 1976.3 Da-you Liu , F. Q. Zheng , Z. F. Ma & Q. L. Shi , Conflict Resolution in Multi-ES Cooperation Systems , SOIE Proc. Vol. 1468 OE/Aerospace Sensing 91 on Applications of Artificial Intelligence IX
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 诊所注射容器管理制度
- 试制车间物料管理制度
- 财政帮扶资金管理制度
- 货币内部控制管理制度
- 货物运输操作管理制度
- 货箱摆放配送管理制度
- 提前结清协议书范本
- 家庭房屋管理协议书范本
- 机器试用担保协议书范本
- 简易印刷协议书范本
- 监护证考试试题及答案
- 2022石油化工消防设施维护保养技术标准
- 2025-2030中国天然气勘探业发展动态与发展潜力规划研究报告
- 2025年小学英语三年级下册期末测试卷(人教版PEP)(含答案含听力原文无音频)
- 2025丽水市辅警考试试卷真题
- 工程研究中心组建方案投资可行性报告
- 部编版三年级下语文易错字
- 侦察基础知识课件
- 建办质202463号危险性较大的分部分项工程专项施工方案严重缺陷清单宣贯(雄安)
- 设备电气接线规范
- 2025中国国新控股有限责任公司招聘7人笔试参考题库附带答案详解
评论
0/150
提交评论