




已阅读5页,还剩72页未读, 继续免费阅读
(模式识别与智能系统专业论文)可视化知识获取研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
搔舞 摘要 随着信息技术的开益发展,大量的知识蜂拥而至。如何有效地获取知识、整 理知识,组织知识,并最终充分利用所需要的知识成为越来越突出的问题,为了 达到这个目的,本文从可视化的角度进行了研究,以期提高知识获取效率。 在知识获取过程中,知识获取的规范性、知识表示的优劣直接关系到a i 应用 系统的智能化程度和科技含量水平。纯粹以文本描述组织知议不仪无法展现其全 貌,而且很难将知识片段州错综复杂的关联| 兑清楚。 因此,本文针对知识表示、知谀可视化知识库一致性检测算法和人机交互 等多项静沿技术展丌了深入研究。通过引入可视化手段方便领域专家进行显性 隐性知识获取,分9 4 用知识图元、框架蝣、规刚单元图来构建具有丰富含义、所 见即所得的领域知识库,可视化知识图形描述及其内部表示的映射函数,构成了 相应的知激内部表达形式;同时,针对知识库的维护工作,研究了知识库的一致 性检测方法,实现了相应的检测工具箱,从而实现肯敛的组织知识,提高知i 利 用率;最后针对基于摸糊变星的模糊推理泉斌函数建以获i k 的缺点,提出了基于 g p 的模糊袭属函数获取方法,并对学习过程及结果进行可视化,极大地方便了隶 属函数的获耿。 关键字:知识表示,知识获取,知识可视化。知识树,知识库一致性检测,遗传编程 ! 堕塑 a b s t r a g t a l o n gw i t hi n f o r m a t i o nt e c h n o l o g yf l o u r i s h i n gm o r ea n dm o r ed a i l y ,t h em a s s i v e k n o w l e d g ee m e r g e s h o wt oe f f e c t i v e l ya c q u i r e c o o r d i n a t i n g ,o r g a n i z i n gk n o w l e d g e , a n df i n a l l yt a k ef u l la d v a n t a g eo ft h en e e d e dk n o w l e d g eb e c o m ea l li n c r e a s i n g l y p r o m i n e n ti s s u e i no r d e rt o a c h i e v et h i sa i m t h i st h e s i sf r o mt h ep o i n to f v i s u a l i z a t i o np e r s p e c t i v et oi m p r o v et h ee f f i c i e n c yo f k n o w l e d g ea c q u i s i t i o n i nt h e p r o c e s so fk n o w l e d g ea c q u i s i t i o n t h es t a n d a r d i z a t i o n o fa c q u i r e d k n o w l e d g ea n dt h ej u d g m e n to fk n o w l e d g er e w e s e n t a t i o n h a v ea 1 1 i m p o r t a n t i n f l u e n c eo nt h ea is y s t e m s i n t e l l i g e n tg m d ea n ds c i e n c el e v e l p u r e l yt e x t u a l d e s c r i p t i o no fo r g a n i z a t i o n a lk n o w l e d g ew i l ln o to n l yb eu u a b l et os h o wi t se n t i r e t y , b u ta l s od i f f i c u l tt oc l e a r l yd e s c r i b et h ec o m p l e xi n t e r l i n k a g e sr e l a t i o n s h i pb e t w e e n k n o w l e d g ef r a g m e n t t h e r e f o r e t h i st h e s i sh a sd o n es o m e d e e p l yr e s e a r c h o n k n o w l e d g e r e p r e s e n t a t i o n ,k n o w l e d g ev i s u a l i z a t i o n ,k n o w l e d g e b a s ec o n s i s t e n c yd e t e c t i o n a l g o r i t h m sa n dh u m a n c o m p u t e ri n t e r a c t i o n 。i tj n t r o d u c e sv i s u a l i z a t i o nm e t h o di n t o t h ep r o c e s so fk n o w l e d g e a c q u i s i t i o n ,r e g a r d i n go ft h ec h a r a c t e r i s t i c so fe x p l i c i ta n d t a c i tk n o w l e d g ea c q u i s i t i o n b yu s i n gk n o w l e d g ec e l l ,f l a m et r e e ,k n o w l e d g eu n i t g r a p ht ob u i l dr i c hm e a n i n g ,w y s i w y gd o m m nk n o w l e d g eb a s e v i s u a lg r a p h i c d e s c r i p t i o no ft h ek n o w l e d g ea n di n t e r n a lr e p r e s e n t a t i o no fm a p p i n gf u n c l i o n s , c o n s t i t u t et h ec o r r e s p o n d i n gi n t e r n a lk n o w l 鲥g ee x p r e s s i o n s i na d d i t i o n ,f o c u so nt h e k n o w l e d g eb a s em a i n t e n a n c ew o r k ,h a v er e s e a r c h e dt h ek n o w l e d g eb a s ec o 兀s j s t e n c y d e t e c t i o nm e t h o da n da c h i e v et h ec o r r e s p o n d i n gc o n s i s t e n c yd e t e e t i o nt o o l k i t s s o u s e ec a l le f f e c t i v eo r g a n i z ek n o w l e d g e i m p m v ek n o w l e d g eu t i l i z a t i o n ;f i n a l l y , f o c u so nf u z z ym e m b e r s h i pf u n e t i o nv a r i a b l e sa r cd i f f i c u l tt oo b t a i ns h o r t c o m i n g s , p r o p o s e dnm e t h o dw h i c hb a s e do nt h eg pt og e tf u z z ym e m b e r s h i pf u n c t i o na n d v i s u a l i z a t i o nf o rt h i sm e t h o d ,t h i sg r e a t l yf a c i l i t a t et h ea c q u i s i t i o no fm e m b e r s h i p f u n e t i o n k e yw o r d s :k n o w l e d g er e p r e s e n z a t i o n ,k n o w l e d g ea c q u i s i t i o n 。k n o w l e d g e v i s u m i z a t i o n ,k n o w l e d g et r e e ,k n o w l e d g e b a s ec o n s i s t e n c yd e t e c t i o n ,g p l l 中国科学技术大学学位论文相关声明 本人声明所呈交的学位论文,是本人在导师指导下进行研究 工作所取得的成果。除已特别加以标注和致谢的地方外,论文中 不包含任何他人已经发表或撰写过的研究成果。与我同工作的 同志对本研究所做的贡献均已在论文中作了明确的说明。 本人授权中国科学技术大学拥有学位论文的部分使用权, 即:学校有权按有关规定向国家有关部门或机构送交论文的复印 件和电子版,允许论文被查阅和借阅,可以将学位论文编入有关 数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、 汇编学位论文。 保密的学位论文在解密后也遵守此规定。 作者签名:么。! 妾 即年,月万日 中国科学技术大学硕上学位论文 绪论 1 1 引言 第一章绪论 我们面临的是信息和知识的大爆炸以及多领域学科问题的复杂度逐步增加 的一个时期。对于知识和信息在其数量和复杂度变化影响之下,在日益复杂的 复用任务需求之下,学习和工作的文化也正发生着变化。知识的产生、储存, 传播柬白干多方面,包括各类文件,设计图、档案、电子邮件、i n t e r n e t 网站的 内容、企业、实验室、协会或政府的数据资料与文件等。因此,所谓的“知i 工 作者”最主要的任务,就是如何系统的搜寻知识,整理知识,组织知识,并最终 有效的利用知识。 在专门的领域,领域专家虽具有领域知识,但缺乏数据库及计算机知识;而 普通知识工作者一般具有一定的计算机应用水平,但缺乏相应的领域知识:对于 同一数据,不同用户可能有不同的理解,这些部成为知识获取过程中的障碍。因 此,我们很有必要设计有效的知识获取功能模块,结合领域专家和普通知识工作 者的长处,来消除知识获取过程中存在的一些问题。 纯粹以文字组织知识不仅困难而且无法展现其全貌。特别是用纯文字的记 录很难将知识片段间错综复杂的关联说清楚“1 。同时,在知识获取过程中,知 识获取的规范性、知识表示的优劣直接关系到a i 应用系统的智能化程度和科技含 量水平。用户在使用知识获取工具的过程中,由于操作提示或智能帮助不够,对 知识获取规范不够统一,往往容易犯错;而且这些错误不易及时查出来,有的错 误甚至要到知识库被应用到实际系统中时才显露出来。在知识表示方面,以往采 用描述语言来表达知识,并以文本的形式来存储知识”。这样,知识获取工具自 身调用无可厚非,但是从知识共享,复用角度来看,不便于和其他a l 系统进行交 互、共享知识。 创新思维大师狄波诺( e d w a r dd eb o n o ) 认为,避免人类语言造成的僵化,有 一个很好的办法,就是在思考的时候,脑海里尽量多用“图形”少用文字“。“知 识地图”( k n o w l e d g em a p ) 是指以专业知识项目为分类主线,类同地图绘制方法 制作知识的二维或多维图形,让知识工作者从知识库、知识专家系统、知识社群 中取得知识,进而得以利用与复制这些知识。知识地图能激发知识工作者的主动 参与性和学习热情,并建立“知识分享”的氛围。2 0 0 2 年l o f t k m w o r l d 研讨会上, g a r t n e r6 r o u p 的信息和知识管理副主席f r e n c hc a l d w e l l 就预言,今后几年将学 术界越来越关注于分类学( t a x o n o m i e s ) 。本体论( o n t o l o g i e s ) 和知识地图 ( k n o w l e d g em a p ) 。2 0 0 5 年世界知识和信息可视化大会,寻求这两者的鼬合。会 中国科肇技术大学硕十学位论立 上有种明显的趋势,就是以概念图为基础理论柬融合知识和信息可视化。针 对知识获取及知识可视化日益发展的需要在参考概念图模型的基础之上,本文 提出了一种改进的知识可视化模型。并将其引入到知识获取过程中。该模型是一 种基于知识的分而治之、知识单元的多级展示、综合的复杂问题求解模型,可以 采用面向对象的技术进行分析、集成,能够有效解决复杂知识的可视化显示问题。 1 2 可视化知识获取概述 1 2 1 知识的概念和分类 知识是人们在社会实践中积累起来的经验,从本质上说,知识属于认识的 范畴。国外有些学者认为知识( k n o w l e d g e ) 是一种能够改变某些人或某些事物的 信息( i n f o r m a t i o n ) 这既包括使信息成为行动的基础的方式,也包括通过对 信息的运用使某个个体( 或机构) 有能力进行改变或进行更为有效的行为的方式, 且经过认知处理并被集成到已存在的人类知识结构中。 知识与信息的最大区别是信息足存在于人脑外的( 有时u q 做“知识存在于世 界中”) ,而知识是存在于人脑中的。“知识存在于人脑中”和“知识存在于世 界中”理论观点认为,人脑中的知识涉及到采用不同表示方法所表示的多种类型 的知识 6 。而世界中的知识可咀是两种:( 1 ) 人脑中的知识的外部形式化表现: ( 2 ) 表现为感观激励和感知输入的文化和认知产品,其能通过自动处理,被认知 系统集成为知识。知识属于每一个人一组人群和整个社会。知识的外观可以是 外形具体化,例如,它的结构可通过多种可视化方式来表现。 关于知识的分类,按其作用可分为三类:描述性知识( i ) e s c r i p t i r e k n o w l e d g e ) ,也称为事实性知识,表示对象及概念的特征及其相互关系的知识, 以及问题求解状况的知识:判断性知识( j u d g m e n t a tk n o w l e d g e ) ,也称为启发性 知识,表示与领域有关的问题求解知识如推理撬则等;过程性知识( p r o c e d u r a l k n o w l e d g e ) ,表示问题求解的控制策略,即如何应用判断性知识进行推理的知识。 按其作用的层次分为两类:对象级知识( o b j e c t l e v e lk n o w l e d g e ) ,也称为领域 相关的知识,是直接描述有关领域对象的知识元级知识( b t e t a l e v e l k n o w l e d g e ) ,也称为关于知识的知识是描述对象级知识的知识,如关于领域知 识的内容、特征、应用范围、可信程度的知识以及如何运用这些知识的知识。根 据知识的认知可达性,知识可以分为两太类:显性和隐性。显性知识能够用符 号( 如词语或数字) 和图标表示也能以数据、科学公式、产品说明书、可视化、 手册、公理等方式进行共享。显性知识是可以表达的有物质载体的,可确知的。 隐性知惧是高度个人化的,难以正规形式化( f o r m a l i z e ) 的,是个人或组织经过 长期积累而拥有却不易用言语表达的知识,因此难以与其他人进行交流和共事。 中圈科学技术太学硕士学位论文绪论 主观洞察,直觉、预感等都属于这类知识。它由信念、感知、理想、价值、动机 和心智模型组成。此外,隐性知识根深蒂固于个人化的行为和经验”。 根据以上观点我们可以认为,“知识”不是一个简单的、各种信息和各种经 验的无序集合,而是一个动态的、与人或组织相交互的系统。只有在“人”的“使 用”过程中,知识才体现出其价值,才成为有实践意义的,真正的知识。但是, 我们人类却天然的具有遗忘的特性,遗忘就意味着无法使用,知识也失去了它的 意义。可见要充分利用知识,无论是个人还是社会,必须对知识进行规范化的获 取、条理化的管理,以便人们随时使用和学习。 1 2 2 知识获取的方法 作为纯技术的概念,知识获取在计算机人工智能领域由来已久。知识获取是 指知识从外部知识源到计算机内部的转换过程。就是如何将一些问题求解的知识 从专家的头脑中和其它知识源中提取出来,并按照一种合适的知识表示方法将它 们转移到计算机中( 通常将这种转换后形成的系统称为专家系统) 。 根据1 2 1 节,知识可以分为显性知识和隐性知识。从知识获取的对象 知识的角度,可将知识获取分为对显性知识的获取和对隐性知识的获取两大类。 l 、显性知识获取方法 显性知识( e x p l i c i tk n o w l e d g e ) 能够透过“载体”传达、表现,例如像专 利、学术著作和技术文档等。此类知识“能够用正式的系统的语言袭达和沟通” 易于以文字、图表、语言等载体,在个体和组织之问转移和传播。这类知识存在 于世界上,是未经专门收集、组织和整理的大量信息,如各种文献资料、网络上 的各种信息。知识获取机制将针对待解决的问题寻找和识别与之相关的关键性信 息,并将这些信息进行提取形成对某一问题的专门知识作为决策的依据。根据 知识具体的存在形式,显性知识的获取方法分为一下几类: ( 1 ) 数据挖掘( 1 ) a t am i n i n g ) 。数据挖掘作为知识发现( k d d ) 的关键步骤,也 是知识挖掘的难点。数据挖掘技术不仅是面向特定数据库的简单检索、查询和调 用,而且要对这些数据进行微观、中观乃至宏观的统计、分析、综合和推理以指 导实际问题的求解,企图发现事件问的相互关联,甚至利用已有的数据对未来的 活动进行预测;不仅仅满足于对信息的纯存储管理和简单的统计分析处理。而且 希望能够从中进行信息提取、再发掘,发现其中隐藏着的、具有潜在价值的知识 模式,进而用于指导人们的科学研究和社会实践活动。从1 9 8 0 s 末期至今,经过 十几年的发展,k d d 的研究已经逐渐渗透到了众多的应用领域发挥着积极、有 效的作用,在商业、工业、农业、金融投资、信息网络等领域展示了其广阔的应 用前景。 3 中国科学技术大学硕士学位论文 ( 2 ) 分布式搜索( d i s t r i b u t e ds e a r c h i n g ) 。分布式搜索是近年来研究比较多 的一种搜索策略。它按区域、主题或其它标准创建分布式索引服务器,索引服务 器之间可以交换中问信息,且查询可以被重新定向。如果一个检索服务器没有满 足查询请求的信息它可以将查询请求发送到具有相应信息的检索服务器。分布 式搜索引擎将索引数据库划分到几个分布或者异构的数据库中,每个数据库都可 以较小,而所有搜索引擎覆盖的范围变太,很少有信息重复,并具有分布式系统 的可扩充性。我们所需要的知识来源是多种多样的,例如关系型数据库、专用文 档库,i n t e r n e t 搜索站点,w e b 等。我们则可以利用分布式搜索技术,跨越对信 息进行检索和访问,而不必考虑信息来自何种资源。 2 ,隐性知识获取方法 聪性知识是难于形式化、难于交流的个人知识,包括主观的知道如何解决 问题的见识和直觉:往往来源于从事于某项活动的人,被潜意识的理解和使用, 并且常常和特定的情景相关。实现对存在于个人( 通常指领域专家) 头腑中的隐性 知识的获取,需要借助于知识工作者和领域专家的共同工作来实现。转移和扩散 知识的难度取决于知识类别。那些或多或少是明晰的知识可咀纳入研究教学资料 与传播程序,或以文件和数据库的形式来表示并以合理的正确度进行传递。隐 性知识获取的主要困难在于怎样恰当地把握领域号家所使用的概念、关系以及问 题求解方法。造成这些困难的主要原因有: a 领域专家一般用自己特定的语言来描述所掌握的知识,而不是用日常语 言表达这些行话,更不用说用相应的数学、逻辑或其它决策理论来表示了。在大 部分情况下,这些行话可能是领域专家为了描述一种微妙的处境而创造的词汇。 b 大部分情况下领域专家处理问题靠的是经验和直觉,它们深藏于人的意识 中,以至于使人认为它是固定的。为了解决领域的问题用到一些非领域的原理和 事实的东西,其中有很大一部分是关于日常生活中的常识,这类知识领域专家往 往在解题过程中下意识地使用到,在其表述过程中却容易忽略。 鉴于隐性知识获取的上述特点,可以将对隐性知识获取的方法大致分为交谈 法和技术法。 ( 1 ) 交谈法( i n t e r v i e w s ) 。在缺乏书面材料的情况下,知识工作者通过交谈 可以准确把握领域专家的专业概念和术语的内涵。知识工作者可以将领域的概念 和问题组织成若干个主题,针对每一主题同领域专家进行集中式交谈。知识库中 的知识便是由知识工作者把挖掘来的专家知识按规定的知识表示形式加工,并输 入到计算机的。通过集中式交谈,知识工作者己大致领会专家对问题的处理方式, 并在心中对如何形式化的表述这些知识有了一个基本的框架。为了确保将知识准 确无误地代入知识库中,还需要进行反馈式交谈,即知识工作者将领域知识反馈 4 中国科学技术 = 学碗士学位论文 结论 确无误地代入知识库中,还需要进行反馈式交谈,即知识工作者将领域知识反馈 给领域专家,借此来评价知识工作者对领域的概念和思想的理解。 ( 2 ) 技术法。隐性知识获取的技术方法主要有半自动知识获取方法和自动 知识获取方法两种。传授方式的自动知识获取机制能够通过专家直接同系统的对 话和无需知识工作者的介入,专家的对话内容便可自动变换成知识库中的知识, 或进行知识库的修改。具有自适应学习功能的系统能够通过用户对求解结果的大 量反馈信息自动修改和完善知识库,并能在问题求解过程中自动积累和形成各种 有用的知识。现在一般使用半自动知识获取方法,出现了若干具有一定知识编辑 能力和知识库求精能力的知识工程语言和知识获取工具。要获得一个性能优良的 知识库,需要反复进行知识获取的三个阶段:概念化、形式化和知识库求精1 。 概念化的知识获取之后,需要用合适的知识表示方法将概念知识形式化并存放到 知识库中去。在概念化和形式化之后,便可获得一个知识库的雏形。然后要对初 始知识库进一步求精,以消除存在矛盾或冗余的规则,修正知识的使用结果与专 家给出的结论无法吻合的问题,得到一个结构良好、功能完善、知识相对完备的 高质量知识库。 1 2 3 可视化知识获取的任务 通过引入可视化手段方便领域专家进行显性隐性知识获取,提高知识获取 的效率。 长期以来,聪性知识获取主要靠传统的由知识工作者与领域专家对话的手工 方法来逐个挖掘埋藏在专家心灵深处的知识宝藏。据估算,这种手工方法的生产 率每天平均只能获取2 5 条经验性规则取知识,效率极低。所以,隐性知识获取一 直是知识管理系统开发的瓶颈,也是计算机人工智能领域需要大力攻克的关键性 研究课题。 为了提高知识获取的效率,必须加强计算机半自动和自动获取知识的各种方 法、工具和技术的研究。为此,本文讨论一种可视化的知识获取技术,不但知识 工作者可以通过查阅科技文献或同领域专家对话来进行半自动知识获取,而且领 域专家可以直接同系统对话对话内容便可自动变换成知识库中的知识,或进行 知识库的修改,以期望用户可以在可视化环境下轻松获取显性和隐性知识。 中国科学扳术太学顾 学位论空 图i 1 半自动自动知识获取方法 知识的可视化获取是用一组可视化对象( 如图标、树形图、有向图) 等将知识 的内部表达形象化地展现在用户面静,为用户建造知识库提供直_ 理理解,提高知 识获取的效率。用户按照可视化知识图形的方法对知识进行描述,同时启动知识 图形描述和内部表示的映射函数。构成相应的知识内部表达形式。 1 3 国外相关研究 知识获取技术已经发展多年了,在理论和实践上已经逐步形成了一些方法和 理论。2 0 0 5 年国际知识和信息可视化大会。力图把在各自领域独自发展的信息可 视化和知识可视化技术融合在一起。会上多位学者使用概念图相关技术作为连接 它们的桥梁,从某种意义上为可视化知识获取奠定了基础。 概念图自问世以来,经过了从纸笔到计算机工具的发展历程。在这个过程中, 许多学术机构研究开发了概念图殴计软件工具,下面简要列举以下几种基于概念 图的知识获取工具。 铡8 是美国人机认知研究所( i n s t i t u t ef o rh u m a ne n dm a c h i a e c o g n it i o n ) 开发的概念图工具,用户可以将知识表示成概念图形式将多媒体资 源链接到概念图上,用于实现知识共享和发布。c m a p 的人机界面设计得很简单, 初学者,甚至小孩子都能很快地学会使用这种工具;同时,c m a p 又为高级用户开 发专家级的知识提供了强有力的支持。 w e b s t e r 是基于网络的概念图工具,允许用户灵活地使用多种名次术语来将 知识和信息表示成结构化的概念圈。在这种结构下w e b s t e r 简化了知识构建的 过程,简化了抽象知识的多层次展示,便于用户实现可视化的知识认知表示结构, 有助于用户的理解和学习。 日本高科技研究所( j a p a na d v a n c e di n s t i t u t eo fs c i e n c ea n dt e c h n o l o g y ) 开发了一种知识发现工具d 2 m s ( d a t am i n in gw i t hm o d e s e l e c t i o n ) “”。主要用 于研究模式知识挖掘的模式选择和可视化技术。d 2 m s 工具为用户提供了多种知识 挖掘模式算法,每种算法可以注册到一个列表中,叫做个计划( p l a n ) 。执行所 注册的计划后,用户便可以从数量和质量上来评估,以确定最终是否采用这个计 划。d 2 m s 在可视化技术方面提供了导航器和数据、规则、体系结构可视化窗口, 便于用户从可视化角度来进行知识获取。 这些知识获取工具都是在概念图基础上发展而柬的,大多集中在概念性的知 识,以语言形式的文本格式束表示知识。从知识共享复用的角度束| 兑,知识库应 当尽量以结构化的形式来表示。其接口也应该很容易获取。 6 率谨辑擘技木九学硕士学位电交 绪论 1 4 前期工作基础 中科院合肥智能机械研究所智能农业实验室多年来承担着多个关于农业信 息化的科研项目,并研制了农业知识处理系统开发平台( 9 e t 系列) ”1 ,掌握了 系列研制知识处理系统及相关工具的理论、方法和技术,为本文的研究提供了坚 实的工作基础和宝贵的开发经验。 农业知识处理系统开发平台( d e t 系列) 由基于树结构的知识管理系统、知识 编译系统和知识推理系统以及知识发布系统组成。 1 5 本文所作工作 本文通过将d e t 原有知识表示采用x m l 进行标记映射,设计了k k m d l 知识库模 型描述语言,使得知识库可以x m l 形式进行存储,发布,方便知识库的共享、传 播。结合可视化知识获取的方法完成可视化知识获取平台v k a p 中的可视化知识建 模环境,方便进行显性隐性知识获取。针对知识一致性检测方面,本文实现了 知识库一致性检测工具箱,方便进行知识库的检测、求精,以获取结构优良的知 识库。最后本文针对基于模糊变量的模糊推理隶属函数难以获取的缺点,结合机 器学习技术采用遗传规划算法进行隶属函数的学习,并对学习过程和学习结果采 用可视化技术进行展示,方便对获取隶属函数的优劣进行判断。 1 6 本文的组织结构 论文首先概述了知识和知识获取的研究发展情况,提出了可视化知识获取的 任务,接着在第二章中介绍了常用的知识表示,对d e r r 系统采用的知识表示形式 进行了详细的介绍。并根据该知识表示形式设计实现了基于x m l 的知识库模型描 述浯言k b m i ) l ;第三章介绍了知识可视化的思想,并借鉴该思想结合本系统的知 识表示提出本文的知识可视化建模方法;第四章则介绍了可视化韵知识获取平台 的设计与实现,完成了知识库的一致性检测工具,并利用该平台进行可枕化知识 获取,利用分页式层次知识树绘制知识库;第五章对基于机器学习技术的自动知 识获取方法进行了研究,利用遗传规划算法对模糊推理中模糊变量的隶属度函数 进行结构化参数学习,并结合可视化技术完成学习过程及结果的图形显示;最后 进行了总结和展望。 7 中国科学技术太学硕士学位论文 第二章知识表示 知识的基本单元是抽象概念,知识表示就足研究如何合理地描述和组织这些 抽象概念以及这些概念之间的联系本章将讨论知识表示的基本概念和几种主要 的知识表示方法。并对本文所采用的知识表示方法进行了详细的介绍,最后根据 d e t 系统平台的原有知识表示方法并结合l 数据表示技术,设计了一套映射知识 结构化表示的知识自标记系统,实现了基于x m l 的知识库模型描述语言k b m d l ( k n o w l e d g eb a s em o d e ld e s c r i p _ c i o nl a n g u a g e ) 。 2 1 引言 知识表示是人工智能的一个重要分支。表示是为描述世界所作的一组约定, 是知识的符号化过程,即表示是将知识编码成一种适当的数据结构。知识表示则 是将关于世界的事实、关系、过程等编码成为一种合适的数据结构,即知识表示 是将数据结构和解释过程结合起来,如果在程序中以适当方式使用将使得程序产 生智能行为“”。同一知识可以采用不同的表示方法。但在解决某一问题时不同的 表示方法可能产生完全不同的效果,因此,为了有效解决问题,我们必须选择一 种合适的表示方法。知识表示主要是选择合适的形式表示知识,即寻找知识与表 示之间的映射。它研究的问题是设计各种数据结构,即知识的形式表示方法:研 究表示与控制的关系,表示与推理的关系以及知识表示与其他领域的关系。 从计算机信息处理角度来看知识处理系统是一个符号处理程序,将领域 专家的知识用符号结构柬表达,并通过符号推理来解决问题。如图2 1 所示。 、,、 图2 1 知识处理与推理系统 这里的符号表达就是对在人机交互过程中获取到的知识进行结构化表示,使 得计算机程序能够理解。其表示结构的方式在一定意义上决定了推理的方式,表 示结构的好坏在一定程度上决定了推理的效率。此外,表示结构的方式还决定了 知识的维护形式、共享性能等特征。本文考虑到特定领域的应用、知识维护的费 用以及共享性的需求。采用x m l 语言完成结构化知识的表示。 2 2 知识表示方法概述 知识表示与知识库的组织、推理机的构造有密切联系。为了便于知识管理和 推理分析,一般要求所表达的知识简单、明了、易于理解,并能对知识进行方便, 中目科学技术大学硕士学位论文知识表示 灵活的扩充“”。知识表示的方法有多种,目前使用的知识表示方法主要有:自 然语言表示、谓词逻辑表示、语义网络1 、框架、产生式规则、概念图、p e t r i 网、 面向对象等,这些知识表示方法都有其自身的局限性仅限于表示某些特定领域 的知识。通常知识库中包含不同的各类知识,例如关于对象、过程、常识性的知 识、以及关于目标、动机、原因、时间、动作等知识。下面对本知识获取平台采 用的知识表示进行介绍。 2 2 1 产生式表示方法 产生式系绕。1 ( 又称产生式规则) 是历史悠久且使用最多的知识表示系统, 在a i 中得到了最广泛的应用。如:第一个专家系统d e n d r a l 就是采用这种知识表 示系统开发的。产生式系统以一个基本概念为基础来描述若干条知识。这个基本 概念就是产生式规则。在产生式系统中,论域的知识分为两部分:用事实表示静 态知识如事物、事件和它们之间的关系:用产生式规则表示推理过程和行为。 通过产生式规则,产生式表示法易于表示启发性知识,特别是直接演绎处理领域 特殊问题的信息。由于这类系统的知识库主要用于存储规则,因此又称为基于规 则的系统( r u l e b a s e ds y s t e m ) ,用“i f t h e n ”的舰则形式捕获人类问题求解 的行为特征,井通过“认识一行动”循环过程求解问题,其表现形式单一、直观, 有利于知识的提墩与形式化,其问题求解过程符合人的认识过程,且计算机容易 实现,有利于问题求解和专家系统的建立。其介绍如下: 1 ) 组成部分 产生式系统包括三个基本组成部分,即舰则库、全局数据库和规则解释器 相当于专家系统中的知识库、综合数据库和推理机。因此。基于规则的专家 系统也可称为是一种扩充的产生式系统,各部分间的关系如图2 2 所示。 图2 2 产生式系统的组成部分 2 ) 表示形式 基于规则表示的知识库实际上就是一个规则集或称舰则库,规则库的常规 概念形式为:i fp r e m i s e st h e n c o n c l u s i o n ,或通俗地表示为:i fc o n d i t i o nt h e n a c t i o n 即“如果满足一定的前提条件,则会产生某个结论或采取某个行动。” 3 ) 优点 中国科学技术= 学碰t 学位沧芷 ( 1 ) 简单、自然、直观、易于表达,理解和应用: ( z ) 模块化。每条规则描述一个单独的概念; ( 3 ) 既可以表示说明性知识。也可以表示过程性、启发性知识t 有利于控制 说明性和过程性命题之间的相互作用; ( 4 ) 易于跟踪动作发生和变化的轨迹。 2 2 2 框架表示方法 框架( f r a m e ) 是一种组织和表示知识的数据结构,通常用于描述具有固定形 式的对象。世界上的各类事物,其状态、属性、发展过程及相互之间的联系往往 具有一定的规律性。这种规律性的知识经过提炼,形成了人们认识事物的一种固 定框架。框架系统芷是用来表示这种经验性知识的一种知识表示方法。框架之间 可以形成层次的或更复杂的关系组成一种框架网络,代表整块的知识结构,可 以表示复杂的知识内容。 框架由框架名和一组用于描述框架备方面具体属- 陆的槽( s l o t ) 组成。每个槽 又有个槽名,对应的取值称为槽值或填充值( f i l l e r ) ,在较复杂的框袈中,槽 的下面还可以进一步区分为多个侧面( f a c e t ) ,每个侧面又可以有各自的取值, 作为对槽的进一步说明。 框架的推理,框架是一种复杂的语义网络,语义网络推理中的推理在框架系 统中也可实行。当在框架中最主要的推理形式为:填充槽值。 填充槽值有两种办法:匹配和继承 1 ) 匹配: 产生式匹配是完全的匹配,框架匹配只能做到部分匹配。框架是一类事物的 完整描述。事物之间的匹配只能是部分相同槽值的匹配。 2 ) 继承: 继承分直接继承和复杂继承。前者在框架网络中下层框架直接从上层框架中 继承所有的属性和条件。后者即有条件的继承。 框架的知识表示方法具有以下的优点: ( 1 ) 结构化的知识表示方法,适合于表示典型的概念、事件和行为; ( 2 ) 框架之间可以形成层次的或更复杂的关系,组成一种框架网络,代表整 体的知识结构,可以表示复杂的知识内容: ( 3 ) 附加过程是框架系统的重要特征之一,它们使得描述性知识和过程性知 识紧密地融合在一起,有机地形成一个一体化系统: ( 4 ) 继承性支持概念抽象和信息共享,在框架系统中起了极其重要的作用: ( 5 ) 基于框架理论的通用知识语言已经开发出若干种,它们与产生式系统比 0 中国科学技术太学硕士学位论文 知识表示 较其通用性更高。但是用户建立知识库的负担都随之增加,对于给定的嗣题领 域,要用框架系统来形式化领域知识并不是简单的事情; ( 6 ) 框架适合模拟常识,丽常识是计算机非常难掌握的。语义网本质上是一 种二维知识表示方法:框架通过允许节点有结构而增加了第三维,这些结构可以 是简单类型的值或其他的框架。与语义网相比,框架可以表示更广泛的知识。 2 2 3 框架与规则的结合 规则常常与规则结合起来构成规则库,规则库被当作一种框架,从而通过框 架的知识组织与规则的推理能力的结合,构建体系结构优良,功能强大灵活的专 家系统本系统的知识表示机制采用的就是框架与舰则结合的混合表示 2 3 规则用框架的形式表示时。表示如下: : : : 过程操作 从上面的介绍知,框架是一个复杂的数据结构,用以组织一系列具有完整意 义的信息体。显然,过程性知识和启发性知识均可被视为一个个可识别的信息体, 并插入到框架的槽中。因此,通过定义合适的槽( 及其侧面) ,可以将过程性知 识和启发性知识及其框架自身统一组织在框架结构中形成具有二者优点的混合 表示系统。 在本系统中,知识库可以同时包含若干知识模型和规则库,知识模型组织的 是过程性知识,而规则库组织的是启发性知识。所以,知识模型对应了框架表示 而规则库则对应了产生式表示。整个知识库( 还包括宏定义和全局变量) 则是通 过总体框架结构将若干知识模型和规则库组织在一起。 2 3 基于x m l 的知识库模型描述语言 2 3 1x m l 数据表示技术 x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) 是互联网联盟( w 3 c ) 于1 9 9 8 年制定的一种 通用语言规范,是s g m l 的一个优化子集,x m l 继承t s g m l 的大部分优点,而且更 规范和易于使用。x m l 语言不仅能够表达文档内容。而且可以表示文档的结构。 l 是一种新的协议,也是一种定义标记语言的元浯言。还是一系列技术的集合。 x m l 是电子文档内容结构化的统一标准,具有良好的可扩展性:通过定制一套相 应的自标记系统,x m l 能够对各种各样的数据信息进行结构化。另外,x m l 是网络 中国科学技术丈学硕士学位论文 上数据交流的语言,因此具有“可以利用w e b 浏览器进行数据确认”以及“易于 生成数据”等优点,同时利于异构数据之间的转化,实现知识共享。x m l 文件具 有平台无关性,且其编程规范统一。目前,至少几个主要的编程语言( 如v c 、j a v a 等) 都提供了统一的处理l 文件的编程模型。因此,采用x m l 文件作为软件系统 之间通信的媒介,可以轻松地实现异构系统之间数据交流与共享的功能。同时, 在计算机信息处理流程中占据着越来越重要的角色。从可标识、可存储等数据管 理功能的角度来看,x m l 就相当于个数据库管理系统,但比任何一个真正的数 据库管理系统都灵活,方便。图2 3 是x m l 技术的应用示意图。 图2 3x m l 应用 23 2 知识库模型描述语言k b m d l 在x m l 逐渐被业界接受并被广泛支持的今天,包括知识管理在内的各方面的 信息处理领域都在“悄悄”地向着x m l 靠近。本文在农业专家系统开发平台( d e t ) 的知识表示基础之上,引入x m l 技术,实现了框架表示产生式表示、过程表示 的结合,定义实现t k b m d l 知识库摇述语言。以x m l 为载体的知识存储,不仅方便 了知识的传阅、查看人们只需通过随处可得的w e b 浏览器,而不必使用具体 的开发平台,还在一定程度上保征了知识对其他系统的可用度:x m l 不仅具有跨 操作系统性能,其编程模式( d o m 模型和s a x 模型) 还是业界共同遵守的标准。综上, 以x m l 为载体的知识存储,对于知识的人机可读、知识的传阅和共享等具有重要 的意义。 作为数据表示技术。x m l 提供了一种开放灵活的数据结构化机制。通过自定 义的标记系统,b i l 不仅能将信息进行结构化,而且还能确定信息的语义,指定 信息语义的结构。另外,通过向标记中嵌入脚本语言,还可以方便地对过程性知 识进行描述。 对比x m l 标记系统与知识的框架结构,如果把框架结构的槽( 侧面) 对应于 x m l 可自定义语义的标记( 及相关属性) ,则基于框架结构表达的知识可以对应于 具有一定格式的x m l 文档。 中国科学技术太学硕上学位论文 知识表示 由此可见,通过定义一套合适的标记系统,可以映射框架与规则表示法所表 达的任何结构,包括本文用来统一组织过程性知识( 知识模型) 和启发性知识( 规 则) 的混合框架结构。 结合农业专家系统开发平台( b e t ) 的知识表示,对系统的原有知识表示采用 功能划分和聚合的方法完成系统平台知识表示与x m l 的映射。 本文定义了四种知识单元( k n o w l e d g eu n i t ) 包括框架知识单元( f r a m e k n o w l e d g eu n i t ) 、宏定义知识单元( m a c r ob e f i n ek n o w l e d g eu n i t ) 、全局变量 知识单元( g l o b a lv a r i a b l ek n o w l e d g eu n i t ) 和规则库知识单元( r u l eb a s e k n o w l e d g eu n i t ) 。分别对应后面介绍的宏定义、全局变量、规则库和知识模型 标记。通过主框架知识单元( 知识库标记) 完成知识库的层次组织,以及框架推 理链路的构建。 框架知识单元,简称f k u 。f k u 用于复杂系统“系统综合”中与系统分解对应
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安全施工安全培训课件
- 建设工程委托监理合同补充协议5篇
- 瑞安全屋定制安装培训课件
- 瑞吉欧课程模式课件
- 农业碳汇项目市场机遇与挑战分析报告
- 定向工程博士培养方案(3篇)
- 安全文库安全培训课件
- 安全教育重点培训课件
- 以学习任务统整习作单元教学探究
- 方案工程师简历(3篇)
- 《无人机法律法规知识》课件-第1章 民用航空法概述
- 2024届广东省高三三模数学试题(解析版)
- 2.5动荡变化中的春秋时期课件 2024~2025学年统编版七年级历史上册
- 经外周静脉穿刺中心静脉置管(PICC)操作技术专家共识解读
- 幼儿园大班科学课件:日月地
- 校园五清三提方案
- 高龄患者PICC导管静脉血栓形成的个案分享课件
- 国有企业采购管理规范 T/CFLP 0027-2020
- 国企纪检干部业务知识竞赛题库及参考答案(2套)
- 《混凝土结构房屋裂缝检测技术规程》
- (正式版)HGT 20593-2024 钢制化工设备焊接与检验工程技术规范
评论
0/150
提交评论