




已阅读5页,还剩63页未读, 继续免费阅读
(计算机应用技术专业论文)用xml表示clips知识库的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 c l i p s 是cl a n g u a g ei n t e g r a t e dp r o d u ( - t o ns y s t e m 的缩写,它是美国航空 航天局约翰逊太空中心用c 语言设计的一个专家系统工具。本文主要研究了该 开发工具的知识表示系统及其与x m l 的转换。 c l i p s 中的知识存储于纯文本文件之中,不利于知识的检索和修改,更不利 于知识的流通。我们分析了对c l i p s 知识库进行转换的必要性,介绍了c l i p s 工 作原理和事实存储技术。又由于x m l 具有良好的数据定义格式、可扩展性、高 度的结构化和便于网络传输等优点,我们选择由x m l 来表示知识库。继而以数 据库为中间环节,先将知识库用关系数据库表示,再实现关系数据库到x m l 文 档的转换。由此完成由x m l 建造知识库的过程。 论文的主要工作和特色如下: 1 研究c l i p s 对事实存储的方法和原理,将c l i p s 的事实模型转换为关系数 据库的表模型,研究表之间的约束和关联关系,剖析c l i p s 对事实数据的 处理原理和内部机制; 2 研究c l i p s 与高级语言的相互嵌入。并且用关系数据库建造 c l i p s 事实 库。 3 实现关系数据库到x m l 的转换,提出一种在保持数据约束的前提下实现 关系数据库到x m l 文档的转换的方法,最终达到以x m l 构造事实库的目 的。 最后,本文对今后的发展方向进行了展望 关键词:c l i p s ,事实,知识库,e r ,x m l a b s t r a c t c l i p sa na c r o n y mf o rcl a n g n a g ei n t e g r a t e dp r o d u c t i o ns y s t e m ,w a sa n e x p f ,r ts 、s l o n ld e v e l o p m e n tt o o l sd e s i g n ( 1 du s i n gl h ecp r o g r a n m u n gl a n g u a g e a tn a s a j o h n s o ns p a c ec e n t e r t h i sd m s e r t a t l o nm a i n l ys t u d m st h ek n o w l e d g er e p r e s e n t a t i o ns y s t e mo fc l i p sa n dt h ee x c h a n g eb e t w e e nx m la n dt h e k n o w l e d g er e p r e s e n t a t i o ns y s t e m t h ef a c ti nc l i p sa r es t o r e di np u r et e x tf i l ef o n i l a tw h i c hi sn o tg o o df o r t h er e t r i e v a la n dt h em o d i f i c a t i o no ft h ek n o w l e d g e ,n o tm e n t i o ns p r e a d i n go n t h ei n t e r n e t w ba n a l y z et h es t u d yn e c e s s i t yo ft h ee x c h a n g eo fc l i p s k n o w l e d g e b a s e i n t r o d u c et h eb a s i ct h e o r ya n dt h ef a c ts t o r a g et e c h n i q u eo fc l i p s w e c h o o s ex m lt or e p r e s e n tt h ek n o w l e d g eo fc l i p sb e c a u s eo ft h ea d v a n t a g e s i th a s ,s u c ha sw e l l - d e f i n e dd a t af o r m a t ,g o o de x p a n s i b i l i t y , h i g h l yf o r m e d ,e a s i l y t ot r a n s f e rt h r o u g hi n t e r n e t ,e t c t h e nw em a d ed a t a b a s ea sa ni n t e r m e d i a t e t e c h n o l o g yt oc o n v e r tt h ef a c tm o d e li n t ot h ed a t a b a s et a b l em o d e l ,t h e nc o n v e r t t h ed a t a b a s ei n t ot h ex m ld a t af o r m a t t h em a i nw o r ka nf e a t u r eo ft h i sd i s s e r t a t i o ni s : 1 s t u d yt h ei n t e r r e l a t e dt h e o r yi nt h ef a c t ss t o r a g et e c h n i q u e so fc l i p s , c o n v e r tt h ef a c tm o d e li n t ot h ed a t a b a s et a b l em o d e l ,s t u d yt h er e s t r i c t i o n a n dr e l a t e dr e l a t i o n sb e t w e e nt h et a b l e s ;a n a l y z et h ep r i n c i p l ea n di n n e r - m e c h a n i s mw h i c hc l i p sd e a lw i t hf a c t 2 s t u d yt h ei n t e r - e m b e dt e c h n o l o g yb e t w e e nt h ec l i p sa n dt h ea d v a n c e d l a n g u a g e ,u s i n gd a t a b a s et od e s i g nc l i p s sk n o w l e d g eb a s e 3 r e a l i z et h ec o n v e r t i n gb e t w e e nr e l a t i o n a ld a t a b a s ea n dx m ld o c u m e n t a n e wm e t h o do ft r a n s l a t i n gr e l a t i o n a ld a t a b a s ei n t ox m ld o c u m e n t sw i t h d a t ac o n s t r a i n tp r e s e r v a t i o nw a sp u tf o r w a r d t oa c h i e v eo u rp u r p o s eo f u s i n gx m lt od e s i g nc l i p s sk n o w l e d g eb a s e k e y w o r d s :c l i p s ,f a c t ,k n o w l e d g eb a s e ,e r ,x m l 独创性声明 本人声明所呈交的学位沦文是本人在导烬指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得移崩噘彰或其他教育机构 的学位或证书丽使硝过的材料。与我一霹工作的圈志对本研究所做妁任何贡献均 已在论文中作了明确的说明并表示谢意。 学位论文作者签名:等瑚哪 签字日期:劲一6年r 月扩日 学位论文版权使用授权书 本学位论文作者完拿了解岳疆足欠有关保留、使用学位论文的规, 有权保留并向国家确关部门或机构送交论文的复印件和磁盘,允许论文被查阅和 借阗。本人毅权墨赣跃争可以将学位论文的全部或霉分内容编入有关数撂库进干亍 检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:华均崤 导师签名 签字日期:弘略年f 月矿日 学位论文作者毕业去向: 工作单位: 通讯地址: 签字日期 电话 邮编 莎 月 街钞哩渤 表格 21 专家系统扔史的一此币要事件 1 1 4 1 l s e r i l i l ( l i o n 函数的返刚炎型3 7 5 1 x m l 演进表 5 2 知识库与数据库内容比较 7 1 关系数据库中关系的属性分类 7 2r 1 图书i d 一图书名 7 3 r 2 :图书名一图书作者一图书价格 7 4 l :b 3 :图书作者一图书译者 7 5r 4 :图书1 d - - 出版社名称 7 6r 5 :出版社名称一出版地 船 的砸弱 w w 插图 21 号家系绕的般结构 22 七家系统的开发过 兀 2 3 专家系统的五个丌发阶段 2 4 语义网络的知识单元 3 1c l i p s 平台基本结构 3 2 专家系统总体结构 4 1 c l i p s 界面 4 2 自定义函数嵌入过程 43c l i p s 嵌入v c + + 的过程 6 1 用c l i p s 编辑器查看文本事实 6 2e r 图例 7 1 关系数据库l i i j x m l 文档转换结构图, 0玛坞坞 殂凹 n 弱 弱船 h 第一章序论 1 1 问题的提出 1 1 1 课题研究的科学意义和应用背景 专家系统和专家系统开发工具的研究己有许多成果发表,在知识表示【1 1 知识获取【2 】、推理技术嘲、知识库1 4 】等各技术环节都有许多新成果。国外现在 一方面深入研究专家系统基本理论和技术,另一方面致力于专家系统的实用化, 研究专家系统的建构方法此外我国专家系统的研究方面也取得了很大的进展, 提出了专家系统开发环境的通用化【5 】、多种知识表示,以及知识自动获取的商 品化与产业化等方面的新概念、新理论但在专家系统开发工具的实用化研究 方面,还有许多工作要做。 c l i p s ( cl a n g u a g ei n t e 酽a t e dp r o d u c t i o ns y s t e m ,c 语言集成产生式系 统) 是美国航空航天局n a s a - j o h n s o n 太空中心为弥 b l i s p 语言的不足而开 发的一种专家系统工具【6 | ,自1 9 8 6 年推出以来,在全世界范围内得到广泛的应 用和发展。 事实是专家系统的基础,在c l i p s 中,有两种得到事实的途径: 1 在文本文件编辑器中手工输入事实,然后保存到文件中,需要时通过发 布装入命令将其载入; 2 在规则推理过程中动态的增加或删除事实。 在文本编辑器中存储事实这一特征,暴露出c l i p s 在知识管理和调度方面 存在的明显不足。用其他方式来代替c l i p s 的知识库文本存储方式的研究势在 必行。由此我们想到用x m l 格式来存储c l i p s 的知识库。良好的数据定义格式, 可扩展性、高度的结构化和便于网络传输是x m l 的4 个主要优点1 1 由于知识库与数据库之间存在相互对应关系,数据库与x m l 之间也有着 相互对应关系,于是我们用关系数据库为中介,先用关系数据库存储c l i p s 系 统的知识库中的事实,再将数据库中的关系转换为x m l 格式。该研究的意义如 下: 1 与文本编辑器相比,数据库提供的功能更丰富、可以更加轻松的实现对 知识库中事实的管理和调度 用x m l 表示c l i p s 知识库的研究 2 芙系数据库提供了数据完整性和一致性的机制,这一点足c l i t s 的知识 库无法满足的。 3 在数据库中可以对表进行各种运算,在运算结果中消除冗余数据,再转 换为x m l 格式或再提供给c l i p s ,可以显著提高推理速度。 4 x m l 能针对特定的应用领域而定义特定的标记集合,使得x m l 可以在 电了商务、政府文档、报表,出版和中介信息交且等领域,根据不同的系统和应 用提出各具特色的独立解决方案。我们将c l i p 的知识库通过数据库这个中介转 换为x m l 格式,就可以使知识库通过网络得以维护。 综上所述,通过关系数据库实现用x m l 对c l i p s 事实存储的转换,将c l i p s 事 实的开发和维护工作转换为对数据库的开发和维护,提高了c l i p s 的运行速度。 并且由于x m l 的特定的标记集合,使得知识库得以在网络上实现传播和维护。 1 1 2 可行性分析 c l i p s 是cl a n g u a g ei n t e g r a t e dp r o d u c t i o ns y s t e m 的缩写,它是美国航空 航天局约翰逊太空中心用c 语言设计的一个专家系统工具。c l i p s 的事实由 事实名、槽名以及相关值组成,关系数据库的表由表名、字段以及相关值组 成。x m l 文档中涉及的是元素、子元素,属性,处理指令、实体、实体引用、名 域等概念,三者之间具有相互对应关系。因此,由关系数据库存储c l i p s 的事实 是可行的。又x m l 和数据库的转换,最终可以用x m l 来表示c l i p s 的知识库。 1 1 3 知识库与关系数据库的必然联系 用关系数据库实现的事实库具有以下几个特点和意义f 8 】: 1 关系数据库与谓词逻辑知识表示具有密切关系,关系数据库中的逻辑代 数表达式是谓词逻辑表达式之一,因此可以很容易地将关系数据库扩展成基于 谓词逻辑的事实库,同样也可以进一步改造成基于产生式知识表示的知识库; 2 关系数据库具有坚实的数学基础,为事实库提供了可靠的理论依据,可 以运用关系数据库的理论设计事实库; 3 关系数据库具有高度的数据独立性,结构合理的关系数据库具有最小的 数据冗余度,较高的数据一致性、完备性,这从一定程度上消除了事实库的冗 余,提高了事实库的一致性、完备性; 4 关系数据库系统理论提供了丰富的数据检索、存取等操作,为事实库的 实现提供了便利,大大减少了事实库的设计开发费用; 2 第一章序论 5 笑系数据库具有存储琶大、维护方便、运行速度快、效率高的特点,这极 大地改善了事实库的性能; 6 关系数据库系统的广泛应用为事实库中事实的收集和再利用提供了便利 条件,它们的数据库中的数据都可以转化为事实库中的事实,而它们建立的数 据库都可以用来存储事实。 1 1 4 关系数据库与x m l 的结合 x m l 与关系数据库都属于数据管理手段,广义的x m l 与d b m s 有着类似的 作用【9 】,主要体现如下: 1 提供数据存储。关系数据库以数据系统为手段,x m l 主要以文件系统为 存储手段。 2 提供数据的直接存取访问,不需要用户关心数据的物理结构 3 提供数据的模式描述,x m l 采用d t d 或x m ls c h e m a 描述数据的逻辑 结构,关系数据库通过关系模式( 行、列) 来描述数据的逻辑结构。 4 提供应用程序编程接口,x m l 由s a t 和d o m ,而关系数据库的编程接口 很多,也很成熟。如j d b c 、o d b c 等。 简单的说,x m l 比数据库的优点在于:跨平台,直接支持动态w e b 操作, 在数据描述方面更灵活,可扩展,自描述。 1 2国内外研究现状 c l i p s 在国外有着较为广泛的应用人群。但在国内研究c l i p s 的人较少,同 国外相比,应用和理论研究都较为落后。通过使用如下方式: 1 g o o g l e 搜索引擎 2 万方科技数据库 3 中国期刊网 我们对国内外的科技文献和新闻报道进行了查询,有如下的分析结果: 1 我们以c l i p s 作为关键词进行查找。没有找到国内有关该语言知识库 与x m l 转换的相关报道。只有c l i p s 与高级语言交互的有关研究。 2 通过g o o g l e 搜索使用关键字“c l i p s ”引擎对简体中文网页的搜索结 果,目前国内对c l i p s 系统的研究还停留在规范的介绍和与高级语言的交互 上:在s m t h o r g 上的查询结果也是停留在规范自身和语言的能力讨论上从已有 3 用x m l 表示c l i p s 知识库的研究 的资料石凼内尚无对知识库研究的实现报道。国外对c l i p s 的研究较幽内先 进很多,但依旧没有有关c l i p s 知识库与x m l 转换的相关内容。 从上面对国内外的现状分析看,作为一个流行的专家系统工具,由于其知 识库在维护和检索方面的不足,可能会对其发展有一定的限制,而国内尚停留 在规范自身和与高级语言的交互方面,因此我们认为对c l i p s 的知识库研究具 有重要的理论和实践意义。 1 3 主要研究内容 本文从一种专家系统的设计工具:c l i p s 入手,研究了c l i p s 的事实存取途 径,将c l i p s 原本存储在文本编辑器中的事实结构加以转换,以关系数据库为 中间转存,最终实现以x m l 来表示c l i p s 的事实库下面是本文研究的重点问 题: 1 c l i p s 对事实存储的方法和原理,将c l i p s 的事实模型转换为关系数据库 的表模型,研究表之间的约束和关联关系,剖析c l i p s 对事实数据的处理原理和 内部机制; 2 c l i p s 与高级语言的相互嵌入 3 用关系数据库模拟实现c l i p s 事实库。 4 在保持数据约束的前提下实现关系数据库到x m l 文档的转换。 1 4 本文的组织 本文是按如下方式组织的: 第一章:序论:问题的提出,给出了课题研究的科学意义和应用背景。分析 了国内外的研究现状,介绍了主要研究内容。 第二章:专家系统概述:对专家系统的概念做了个简单介绍,然后给出了 知识的若干表示方法。 第三章:c l i p s 原理:介绍了c l i p s 系统。包括c l i p s 事实的表示、对事实 的有关操作;规则的结构,推理机制;以及它的执行周期和工作机制 第四章:c l i p s 与高级语言的交互:概述了c l i p s 存在的问题,以及与高级 语言相互嵌入的实现。 第五章:c l i p s 知识库与x m l 的联系:对c l i p s 知识库与x m l 的转换做了 详细的可行性分析,给出了转换步骤。 4 第一章序论 第六章:c l i l l s 知识库与数据库的转换:详细分析 c l i p s 的事实存储机 制,论证了c l i p s 知识库与数据库转换的可行性,给出了事实和关系之间的通 信机制和对应关系。 第七章:x m l 和关系数据库的转换:提出一种在保存数据约束条件下把关 系数据库信息转换为x m l 文档,并在得到的x m l 文档信息中亦能完整的体现出 所保存的数据约束的新方法。解决了只注意数据结构的无损转换而忽略数据约 束的保存的问题。 第八章:结论与展望:总结全文并指出迸一步的研究方向。 5 第二章专家系统概述 2 1 专家系统简介 2 1 1 什么是专家系统 专家系统是一种基于知识的智能系统i l o l 。主要包括知识库、数据库、推理 机、解释机制、人机接口和知识获取等功能模块。专家系统能够利用其知识库 中丰富权威的专家知识进行启发式推理,能够解释其推理过程,对用户询问作 出回答,并且具有学习机制能对知识库进行改进,不断灵活地增加新的知识,它 可以简单做如下定义: 专家系统是一个在某个特定领域内,运用人类专家的丰富知识进行推理求 解从而模拟了人类专家解决问题的计算机程序系统。专家系统主要依靠大量知 识来解决领域问题,因此有时也将其成为知识库系统,另外,专家系统常被用于 帮助专家工作,因此又称为智能助手。 作为人工智能面向实际应用的一个分支,专家系统从2 0 世纪7 0 年代产生开 始,经过3 0 多年的发展,它广泛应用于国民经济的各个领域,如:医学、农业、 军事、气象、地址、法律、教育、科学技术等方面。近年来,随着人工智能、数据 库、分布系统等有关技术的发展,专家系统的概念也在改变,它已不再局限于 与领域专家的结合,获取那些只是经验性,技巧性的知识,同时强调与其他技 术的集成。而成为功能强、知识多样化的智能化系统。这样的系统可以汇集来 自相同或者不同领域的多种类型的知识,具有自适应性和学习功能,来源于专 家,又高于专家,成为灵活性、智能度更高的智能型专家系统i l l 】。 专家系统通常有如下几个组成部分:知识库,推理机、综合数据库、解释子 系统、知识获取子系统和人机交互接口等。图2 1 为专家系统的一般结构。 1 知识库( k n o w l e d g eb a s e ,简称k b ) 知识库存储从专家那里得到的、关 于某个领域的专门知识和关于知识的知识,即元知识元知识可能是指导如何 选择和使用领域知识的知识,也可能是与知识库系统结构和运行有关的知识。 2 推理机。推理机是对推理过程进行控制的模块,是整个专家系统进行工 作、求解问题的机构,所以又称为推理机构,控制机构或问题求解器。 3 解释子系统。解释子系统负责回答用户提出的各种问题,包括与系统运 用x m l 表示c l i p s 知识库的研究 图2 1 :专家系统的一般结构 f i 9 2 1c o n s t r u c t i o no fe x p e r ts y s t e m 行有关的问题和与运行无关的关于系统本身的一些问题。解释子系统是实现系 统透明性和体现信任度的主要部件 4 综合数据库。综合数据库用于存放系统运行过程中所需要和产生的所有 信息,包括问题的描述、中间结果解题过程的记录等信息。数据的表示与组织 结构与知识的表示与组织相容,推理机就是使用知识库中的知识和描述问题当 前状态的数据去求解问题的。 5 知识获取子系统。它负责管理知识库中的知识,包括根据需要修改、删 除或添加知识及由此引起的一切必要的改动,维持知识库的一致性、完整性等。 6 人机交互接口即专家系统的用户界面,它是用户与专家系统进行信息 交互的部分。一般是用来进行数据、信息或命令的输入,结果的输出和信息的 显示等。交互的信息可以是文字、声音、图像、图形、网页、动画、影像等多媒 8 第二章专家系统概述 体内容。一个图文并茂,易学易用的用户界面也是一个专家系统能台推广使用 的关键因素。 2 1 2 专家系统的优点和特征 专家系统的优点如下1 1 2 】: 1 适应性强。专家知识在任何计算机硬件上都是可利用的实际上,专家 系统是专家知识的集成体。 2 成本低。提供给用户的专家知识成本非常低。 3 危险性低。专家系统可以用于某些对人有害的环境。 4 持久性。人类专家可能会疲劳、退休或死亡但专家系统的知识会持续 下去 5 复合专家知识。复合专家知识可以做到在白天或者晚上的任何时候同时 和持续的解决某一问题。由几个专家复合起来的知识,其水平可能会超过一个 单独的专家。 6 可靠性强专家系统可增强正确决策的信心,这是通过向专家系统提供一 个辅助观点而得到的;此外,专家系统还可协调多个专家的不同意见, 7 解释,说明专家系统能够明确、详细的说明导出结论的推理过程。人类 专家可能会厌烦或是不愿意或是没有能力这么做。而明确、详细的说明有利于 得出正确的决策。 8 响应快迅速而实时的响应对某些应用而言是必要的,依靠所使用的软件 或硬件,专家系统可以比人类专家的反应更为迅速和有效。 9 在任何时候能出到稳定、理性的响应。在实时和突发情况下,人类专家 可能会因为疲劳或压力等因素而不能作出正确决策,而这一点是至关重要的。 1 0 智能导航和数据库。专家系统能以智能的方式来存取一个数据库。 专家系统的特征如下: 1 高性能。系统能以此领域的专家的同等或更高水平响应,即系统所给的 建议质量必须很高。 2 适当的响应时间。系统必须能在适当的时间里工作此时间与人类专家 得出一个结论所需的时间相当或更好。 3 可靠性高。专家系统必须可靠,且不易崩溃,否则不能投入使用。 4 理解性高。在执行过程中,系统能解释推理步骤,使之易于理解,专家系 统不应该有信息隐藏功能,而是应该具有解释能力。其解释方式应与专家解释 9 用x m l 表示c l i p s 知识库的研究 他们推理的方式一样。 5 灵活性。专家系统可能有大量的知识,因此一个增加、修改和删除知识 的灵活机制是必须的。 2 1 3 专家系统的研究内容 专家系统是基于知识的系统,围绕着知识,主要研究三方面的内容“乜 1 知识获取。解决如何从领域专家的口述或文字、书本资料实例中抽取出 该专家系统所需要的知识。从人工获取到半自动获取方式再到自动获取方式, 是研究者们不断提高系统智能性、提高系统建造效率和质量的一个历程。 2 知识的表示研究如何将领域知识和专家经验等有效的表示撑计算机能够 工作和运行的形式。常用的知识表示方式有规则、框架、逻辑、面向对象表示方 式等,其中以规则表示法使用的最为广泛采用什么方法是由领域知识的特点 决定的,每种表示法都有其优缺点,一个专家系统常常综合使用了多种知识表 示方法 3 知识的运用。研究如何对存放再知识库种的知识进行控制和操作,以求 得问题的解决方法。常用方法有搜索和推理。 2 1 4 专家系统的发展 表2 1 是专家系统历史的一些重要事件 2 1 5 专家系统的开发工具 随着计算机应用的普及和信息化生产生活需求的飞速增加。专家系统的应 用领域区域广泛和深入。每个专家系统都有其正对的特定领域问题。但是,如 果对每个具体的专家系统的建造都一切从头开始,效率将会非常低下。已往开 发一个难度适中的专家系统大约需要5 6 人年的工作量,开发一个难度较大的 专家系统则需要2 0 人年以上,开发所需周期、人力和无力都很大 1 4 1 。 随着现代科技不断发展,对专门领域知识的普及和运用需求不断扩大为 了提高专家系统的开发效率,简化构造过程,研究者很早就开始研制一些较通 用的工具,作为设计和开发专家系统的辅助手段和环境。这些就是专家系统开 发工具【1 目 目前的专家系统开发工具分为三种主要类型:语言,外壳和工具 1 e l 【1 7 】1 语言 第二章专家系统概述 表2 1 :专家系统历史的一些重要事件 年份 事件 1 9 4 3 p o s t 产生式规则,m c c u l l o c h 和p i t t s 神经元模型 1 9 5 4控制规则执行的m a r k o v 算法 1 9 5 6d a r t m o u t h 会议;启发式搜索;创立“a i ”术语 1 9 5 7r o s e b l a t t 提出感知机;通用问题求解器 1 9 5 8人工智能语言l i s p 1 9 6 2r o s e b l a t t 关于感知的神经动力原理 1 9 6 5自动定理归结的证明方法 模糊对象的模糊推理逻辑 第一个专家系统 1 9 6 8 语义网络,联想记忆模型 1 9 6 9m a c s y m a 数学专家系统 1 9 7 0p r o l o g 1 9 7 1语音识别h e a r s a y1 人类问题求解通用规则 1 9 7 3m y c i n 医疗诊断系统及由此产生的g u i d o n ,即智能家教 概念解释机 e m y c l n 第一个外壳 h e a r s a yi i 1 9 7 5框架知识表示 1 9 7 6人工数学家;数学概念的创造性发现 不确定性推理 开始建立矿产探测的p r o s p e c t o r 专家系统 1 9 7 7 o p s 专家系统外壳 1 9 7 8 开始建* 寺- x c o n r 1 ;配置d e c 计算机系统 元规则、规则归纳 1 9 7 9快速模式匹配的r e t e 算法 人工智能开始商业化 1 9 8 0 s y m b o l i c s ,l m i 推出l i s p 机 1 9 8 2 s m p 数学专家系统;h l p f i e l d 神经网络; 开发智能计算机的日本第五代语言项目 1 9 8 3k e e 专家系统工具 1 9 8 5c l i p s 专家系统工具 用x m l 表示c l i p s 知识库的研究 用于建造专家系统的语言可以分为两类: ( 1 ) 知识工程语言,特意为构造和调试专家系统而设计。由语言本身提供一 个推理机去执行该语言编写的语句,如:p r o l o g 、c l i p s 等; ( 2 ) 普通的程序设计语言本身不提供推理机,常用于开发专家系统的这类 语言有l i s p 、s m a l l t a l k 、c 和c + + 。 用第一类语言开发专家系统不用程序员编写控制推理机制,但这类语言表 达和处理知识的格式比较固定,不够灵活;而用第二类语言则需要开发人员既 是领域专家又是计算机方面的专家,并且一切从头开始,开发效率底下。 2 外壳 在一个理想的专家系统中,推理机完全独立于求解问题领域。系统功能上 的完善或或改变,只依赖于规则集的完善和改变。如果能抽去已经开发成功的 专家系统中的具体知识、保留它的体系结构和功能,将专用领域的界面改为通用 的界面,就能得到一个专家系统外壳,也称为骨架型的开发工具,如e m y c i n 是 由m y c i n 而来,k a s 是是由p r o s p e c t o r 而来e x p e r t 是 扫c a s n e t 而来。 通过向外壳中加入新的知识,就可以开发出新的专家系统 专家系统外壳的推理控制机制是预先给定的,开发人员可以把主要经历放 在领域知识的整理上,从而大大提高了专家系统的开发效率。 3 工具这里的工具指的是,能提供更多灵活的功能模块的专家系统开发工 具包。这种组合型开发工具包由语言加上一些实用程序模块组成,能提供多种 形式的知识表示模式、多种推理模式、多种知识获取的手段、多种辅助工具( 如 数据库访问、作图等) 以及多种友好的的辅助界面( 如调试功能、解释功能、自 然语言接口) 等等,实用程序模块分为辅助设计和知识获取两大类,如脚本编辑 器、编译器、调试器、代码生成器等。 组合型开发工具为开发专家系统提供了一个集成开发环境。它能根据任务 描述构成多种类型的推理机制和多任务的知识库程序模块,建立使用这些程序 模块的辅助设施。这种系统还能帮助建造者选择系统结构,设计规则表示方式 和使用各种程序模块,形成一个完整的专家系统。 2 1 6 专家系统的开发过程 构造专家系统的过程通常称为知识工程,知识工程又称应用人工智能,是 设计和构造高性能知识系统的技术。在这一过程中,专家系统的构造者知 识工程师( k n o w l e d g ee n g i n e e r ) 从领域专家( d o m a i ne x p e r ) 那里获得他们求 1 2 第二章专家系统概述 解问题的过程、策略和一些经验规则,并把这些知识以计算机能理解和使用的 形式加入到专家系统的知识库中,如图2 2 所示。 询问 图2 2 :专家系统的开发过程 f i 9 2 2d e v e l o pp r o c e s so fe x p e r ts y s t e m 专家系统有别于传统程序,它采用启发式的方法控制和推理知识,并对知 识库进行有效的管理;而传统程序通常采用一定的算法通过计算处理一般的数 据,很少借助其他工具软件维护数据库因此专家系统的开发过程也有别于其 他传统程序的开发,一般来说,其开发过程分为五个阶段,如图2 3 :在识别阶 识别阶段概念化阶段 形式化阶段实现阶段测试阶段 图2 3 :专家系统的五个开发阶段 f i 9 2 3f i v ed e v e l o ps t a g e so fe x p e r ts y s t e m 段,知识工程师和领域专家确定问题的重要特点包括问题本身、开发过程的 1 3 用x m l 表示c l i p s 知识库的研究 参与者、所需资源、构造专家系统的目标。 概念化阶段,专家系统和领域专家决定描述领域中问题求解所需的概念、 关系和控制,子任务、策略和有关问题求解的约束。 形式化阶段用形式化方法( 通常用某种知识工程的工具,如专家系统建造 语言) 描述重要的概念和关系,将其形式化。主要是建立模型、解决知识表示方 法和求解方法的问题这是建造专家系统过程中最天键和最困难的阶段。 实现阶段把建立的形式模型映射到具体的计算机软硬件环境中去,选取适 用的语言或工具建成可执行的原型系统。 测试阶段评价原型系统的表示形式及应用情况,通过运行几个实例,检查 系统的正确性,发现系统知识表示和推理控制中的问题。 2 1 7 专家系统的应用 专家系统已被应用到几乎每一个知识领域1 1 8 】,其中有些被设计为研究工 具,有些则履行着重要的商业和工业功能。包括医学专家系统、电子学专家系 统、工程学专家系统、地质学专家系统、计算机专家系统等。 2 2 知识表示和推理 2 2 1 概述 人们所涉及到的知识是十分广泛的。有的属于多数人熟悉的,有的只是有 关专家才能掌握的专门领域知识。对于“知识”难以给出明确的定义,只能从不 同侧面加以理解。 从知识库观点看,知识是某论域中所设计的各有关方面、状态的一种符号 表示。 知识可从范围、目的、有效性加以三维描述。其中知识的范围是由具体到一 般,知识的目的是有说明到指定,知识的有效性是由确定到不确定。例如:“桌 子有四条腿”这种知识是具体的、说明性、不确定性的【1 0 】。 知识表示是研究用机器表示知识的可行性、有效性的一般方法,是一种数 据结构与控制结构统一体,既考虑知识的存储又考虑知识的使用。知识表示可 看成是一组描述事务的约定,以把人类知识表示成机器能处理的数据结构。 一个智能程序高水平的运行需要有关的事实知识、规则知识、控制知识和 元知识其中 1 4 第二章专家系统概述 事实知识是有关问题环境的些事物的知识,篇以“是”的形式出现。 规则知识是有关问题中与事物的行动、动作相联系的因果关系知识,是动 态的,常以“如果那么”形式出现。特别是启发式规则是属于专家提供的专 门经验知识,这种知识虽无严格解释但很有用处。 控制知识是有关问题的求解步骤、技巧性知识,告诉怎么做一件事。也包 括当有多个动作同时破激活时应该选用哪一个动作来执行的知识。 元知识有关知识的知识,事知识库中的高层知识。包括怎样使用规则、解 释规则、校验规则、解释程序结构等知识。元知识与控制知识是有重叠的,对一 个大程序来说,以元知识或元规则形式体现控制知识更为方便。 知识具有下列特性【19 】: 1 知识的客观性。虽然知识是人脑对信息加工的成果,但这些成果是客观 的,人类对自然、社会、思维规律的认识是客观的,这些规律的运行是不以人的 意志为转移的。 2 知识的相对性。人类对自然、社会、思维规律的认识必须有一个过程。在 一段时间内认为正确的东西,经过变革,可能发生变化。 3 知识的进化性人类在认识客观世界和主观世界的过程中,不断地加入 新的内容,知识会不断更新。 4 知识的依附性。知识有载体,载体分层次。离开载体的知识是不存在的。 随着载体的消失,知识也会消失。 5 知识的可重用性。在使用过程中知识可以反复使用。 6 知识的共享性。 2 2 2 知识表示方法 2 2 2 1 谓词逻辑表示法 谓词逻辑表示法采用一阶谓词逻辑表示知识,是一种叙述性的知识表示方 法。它的推理机制采用归结原理,主要用于自动定理证明。自从1 9 7 3 年实现了基 于一阶谓词逻辑中h o r n 子句理论的p r o l o g 语言后,获得了广泛的应用 谓词逻辑是一种形式语言,它与自然语言较为接近,却可以方便的存储到 计算机中去,并被精确的处理谓词逻辑适合于表示事物的状态、属性、概念等 事实性的知识,也可方便地表示事物间的因果关系,即规则。 使用逻辑法表示知识,需要将以自然语言描述的知识,通过引入谓词、函数 1 5 用x m l 表示c l i p s 知识库的研究 来加以形式描述,获得有关的逻辑共识。事实通常用合式公式的“与或”形表 示( 用合取符号及析取符号链接起来的公式) 。规则通常用蕴含式表示。用谓词 公式( 合式公式) 表示知识时,需要首先定义谓词,指出每个谓词的确切含义, 然后再用连接词把有关的谓词连接起来,形成一个谓词公式表达一个完整的含 义。 谓词表示泫的特点自自然性、描述性、精确性无二义、严密性、易于模块化 等。但它不能表示不确定的知识,容易形成组合爆炸拥堵、效率低。另外,一阶 谓词逻辑的表达能力是有限的,具有归纳结构的知识、多层次的知识类型都难 以用一阶逻辑来描述。 2 2 2 2 产生式表示法 产生式系统由p o s t 在1 9 4 3 年提出:最初指的是符号的变换规则a a a 。1 9 6 5 年s i m o n 和n e w e l l 把它引入到基于知识的系统中,目前已是专 家系统中使用最广泛的一种表示方法,产生式系统也称为基于规则的系统。 1 事实与规则的表示 产生式表示方法容易描述事实、规则以及它们的不确定性度量。 ( 1 ) 事实的的表示 一般使用三元组( 对象,属性,值) 或( 关系,对象1 ,对象2 ) 来表示事实。 其中对象就是语言变量。例如事实“李明年龄是4 0 岁”,可表示成:( l i m i n ga g e 4 0 ) ,事实“李明和张元是朋友”可表示为:( f r i e n dl i m i n gz h a n g y u a n ) ( 2 ) 规则的结构 规则结构的基本要素包括:综合数据库、产生式结构和控制系统。 综合数据库是规则结构中所使用的主要数据结构。用来描述问题的状态, 在问题求解中,它记录已知的事实、推理中间结果和最终结论。 产生式规则的作用是对综合数据库进行操作,使综合数据库发生变化,其 一般形式是: i f 前提l t h e n i 动作0 或i 结论0 规则的前提通常是能和综合数据库匹配的任何模式。前提允许包含一些变 量,这些变量在匹配过程中可能以不同的形式被约束旦匹配成功,则执行 规则的“动作”或显示“结论”。动作”部分可以是使用约束变量的任一过程, 也可以得出某一“结论”。 2 规则表示下的推理 1 6 第二章专家系统概述 控制系统的功能负责基于规则的推理工作流程如下: i 根据综合数据库的当前状态查找可用的规则; 试在可用的规则集种选择一条当前应用的规则; 衄执行选出的规则。 规则的执行作用于综合数据库,使之发生变化,拧制系统再根据综合数据 库的新状态重新从l 开始执行,如此形成一个“识别一一动作”循环,直到综合 数据库的状态满足了结算条件或无可用规则为止。 基于规则的推理从推理的方向上分为正向推理和反向推理,前者由事实驱 动,自底向上,后者由目标驱动,自顶向下双向混合推理则是正反向推理的结 合。 规则推理还可以分为精确推理和不精确推理,精确推理中事实和规则都被 认为是绝对正确的,推理的结果也是确定无疑的;而不精确推理中事实和规则 都带有一个可信度,常用一个小范围的实数表示,如 1 ,1 1 ,推理过程中需要进 行可信度的计算,推理的结果也是一个概率小于1 的值。 围绕着规则人们提出了很多推理策略,如各种启发式推理、案例推理、基 于模型的推理、定性推理、非单调推理等。 3 产生式表示法的特点 ( 1 ) 产生式表示格式固定,形式单一,规则( 知识单位) 问互相较为独立,没 有直接关系使知识库的建立比较容易,可用于处理较为简单的问题。 ( 2 ) 推理方式单纯,没有复杂计算。 ( 3 ) 知识库与推理机分离的结构给知识库的修改带来方便,无需修改程序, 对系统的推理路径也容易作出解释。 2 2 2 3 语义网络表示法 语义网络式1 9 6 8 年q u i l l i a n 在研究人类联想记忆时提出的心理学模型。1 9 7 2 年s i m m 0 1 】 先将语义网络表示法用语自然语言理解系统。 1 语义网络的结构 语义网络把知识表示为有向图,一个语义网络由一些以有向图表示的三元 组( 结点1 ,弧,结点2 ) 连接而成。其中结点表示概念、事物、事件、情况等;弧 是有方向有标注的。方向体现主次,结点1 为主,结点2 为辅弧上的标注表示 结点1 的属性和结点间的关系。 三元组的图如2 4 所示: 1 7 用x m l 表示c l i p s 知识库的研究 图24 :语义网络的知识单元 f i 9 24k n o w l e d g eu m t o fs e m a n t mn e t 例如有事实:雪是白色的,可表示成 把语义网络视作一种知识的单位,人脑的记忆是由存储了大量的语义网络 来体现的。结点间有如下三种关系 ( 1 ) s a i s a 链用来表示具体一抽象关系,或说表示一种隶属关系,体现某种层次分 类。特点是具体层结点可继承抽象层结点的属性。如:鸟类是动物可表示为“鸟 类i s a 动物”。 ( 2 ) p 口n - d , p a r t o f 链用来表示部分一全体关系,或说表示包含关系。特点是p a r t o f 关 系下各层结点的属性可能是很不相同的。如:两只手是人体的一部分可表示 为“两只手p a r t - o 从体
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年生物技术在农业生产中的应用与前景研究报告
- 2025年机械行业工业机器人应用前景研究报告
- 压力灭菌器培训课件
- 压力气体安全培训总结课件
- 2025年环保行业绿色产品市场前景研究报告
- 2025年机器人产业行业智能机器人应用前景分析报告
- 2025年机器人产业发展趋势与市场前景研究报告
- 商场化妆品安全培训课件
- 2025年环保行业可再生能源发展策略及市场前景研究报告
- 商场儿童乐园安全培训课件
- 2025湖南益阳安化县事业单位招聘工作人员61人考试参考试题及答案解析
- 7 呼风唤雨的世纪 课件
- 新增临时排水管方案
- GB/T 5796.3-2022梯形螺纹第3部分:基本尺寸
- 第七章-辐射防护分析课件
- 研究生英语阅读综合教程reading more
- 比较思想政治教育学-课件
- 眼科学教学课件:眼睑病
- ZXONE8700技术规范书
- 微观经济学生产与成本理论
- 环境监测第2章(2)——水和废水监测ppt课件
评论
0/150
提交评论