(模式识别与智能系统专业论文)基于xml的可视化知识获取与模式验证.pdf_第1页
(模式识别与智能系统专业论文)基于xml的可视化知识获取与模式验证.pdf_第2页
(模式识别与智能系统专业论文)基于xml的可视化知识获取与模式验证.pdf_第3页
(模式识别与智能系统专业论文)基于xml的可视化知识获取与模式验证.pdf_第4页
(模式识别与智能系统专业论文)基于xml的可视化知识获取与模式验证.pdf_第5页
已阅读5页,还剩77页未读 继续免费阅读

(模式识别与智能系统专业论文)基于xml的可视化知识获取与模式验证.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 信息技术和网络技术的迅速发展使得大量的知识蜂拥而至。如何有效地获 取、整理、组织和共享知识,并最终充分利用知识成为越来越突出的问题。本 文从可视化的角度对这个问题进行研究,以期提高知识获取和利用的效率。本 文以可视化知识获取系统与x m l 知识库验证系统的开发工作为基础,结合开发过 程中涉及的相关理论,阐述可视化知识获取和) ( m l 知识库验证与错误处理的详细 技术路线和解决方案。 本文对知识表示、知识可视化获取、可视化环境构建、订l 验证与查错以 及人机交互等多项内容进行了研究和实现。在s c h e m a 描述的知识表示的约束下, 通过引入可视化手段对显性隐性的领域知识进行知识获取,并对知识获取得到 的】( m l 知识库进行验证和错误处理,保证知识获取得到的知识的可用性。本文的 主要研究内容包括知识表示、可视化知识获取、知识库验证三大部分: ( 1 ) 知识的规范性、知识表示的优劣直接关系到人工智能应用系统的智能 化程度。本文综合运用多种知识表示方法,并结合x m l 表示形式,开发了一种基 于x m l 的知识表示方法,并通过x m ls c h e m a 对知识表示方法进行描述。 ( 2 ) 可视化知识获取系统是整个专家系统开发平台的核心内容之一,本文 综合运用可视化技术,计算机图形学、2 d 技术等技术,通过j a v a 技术构建了基 于m v c 模式的可视化组件,并以此为基础,构建具有丰富含义的可视化知识图元 和可视化知识获取环境。 ( 3 ) x m l 知识库验证是整个系统中非常重要且必需的一部分,本文通过x m l 知识库的模式有效性验证,保证经过验证的x m l 知识库文档符合x m l 语法和 s c h e m a 规范。同时进行与x m l 文档有效性无关的语义错误处理,保证x m l 知识库 的可用性。 通过上述三个关键步骤,构建了一个可视化知识获取平台及相应的验证系 统。 关键字:专家系统知识表示知识获取知识可视化x m ls c h e m a 模式验证 a b s t l a c t m e a n i i l g m lv i s u a l i z e dk n o w l e d g em e t a 丘l ea n dl ( i l o w i e d g e a c q u i s i t i o ne n v i r o i l l l l e n t ( 3 ) x m lv a l i d a t i o ni st h ev e r yi n l p o r 伽1 ta j l dn e c e s s a d ,p a no ft h e 、h o l es y s t e m b yv a l i d a t i n gt h ev a l i d i t ) ro fx m lk n o w l e d g eb a l s e ,9 1 1 a r a l l t e em e 订ll ( i l o w l e d g e b a s et e x t st o 诅l l yw i t ht h es c h e m ac r i t e r i o n m e a n w h i l e ,w ed e v e l o pt h es e m a n t i c d i s p o s a lm e t h o di r r e s p e c t i v eo ft h ex m ld o c u m e n tv a l i d i t ) ,a 1 1 de n s u r et l l a tt h e k n o w l e d g er e a l s o n i n ga i l dm es h a r eo fk n o 、订e d g ep r o c e s ss u c c e s s 龟l l y t h o u 曲t h ea b o v et h et 1 1 r e ek e ys t e p s ,w ec o n s t m c tav i s u a l i z e dk n o 、v l e d g e a c q 试s i t i o np l a t f o 面a 1 1 dc o n e s p o n d i n gv a l i d a t i o ns y s t e m k e yw o r d s :e x p e f ts y s t e m ,k n o w l e d g er e p r e s e n t a t i o n ,k n o w l e d g ea c q u i s i t i o n , k j l o w l e d g ev i s u a l i z a t i o n ,) ( m l ,s c h e m apa t t e m ,v a l i d a t i o n m 中国科学技术大学学位论文原创性和授权使用声明 本人声明所呈交的学位论文,是本人在导师指导下进行研究工作 所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任 何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究 所做的贡献均己在论文中作了明确的说明。 本人授权中国科学技术大学拥有学位论文的部分使用权,即:学 校有权按有关规定向国家有关部门或机构送交论文的复印件和电子 版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 保密的学位论文在解密后也遵守此规定。 作者签名: 年 第1 章绪论 1 1 引言 1 1 1 人工智能与专家系统 第1 章绪论 人工智能( a i ,a n i f i c a l i n t e l l i g e n c e ) 工作者经过长期的实验研究发现,人 工智能系统要解决现实世界中的许多复杂问题,不能仅有一般的问题求解方法, 还需要解决有关领域中的专门知识。缺少知识,去处理一个无限制的领域是非 常困难的。要使高速计算机工作得像人类专家那样好,必须为它提供人类专家 所具有的那些专门知识。( 约翰德尔金,2 0 0 5 ) 基于这种思想,被誉为“专家 系统和知识工程之父”的费根鲍姆( e f e i g e n b a 啪) 在化学专家的配合下于1 9 6 5 年成功研制世界上第一个专家系统d e n d 地,用于质谱仪分析有机化合物的 分子结构。从此,专家系统如同雨后春笋迅速遍及世界各地。1 9 7 6 年美国斯坦 福大学肖特列夫( s h o r t l i f r ) 开发成功医疗专家系统m y c i n ,用于抗生素药物治 疗。这个系统后来被知识工程师视为“专家系统的设计规范”( 王永庆,2 0 0 1 ) 。 1 9 7 7 年费根鲍姆进一步提出知识工程( k n o w l e d g ee n g i n e e r i n g ) 的概念,确定 了知识在人工智能中的重要地位,为人工智能的应用奠定了基础,大大促进了 专家系统的发展。 专家系统( e s ,e x p e r ts y s t e m ) 是人工智能领域的一个重要分支,是一个 具有大量专门知识和经验的程序系统,是对传统人工智能问题中智能程序设计 的一个非常成功的近似解决方法。( 专家系统与传统的计算机程序的主要区别) 它应用人工智能技术,根据某个领域一个或多个人类专家提供的知识和经验进 行推理和判断,模拟人类专家的决策过程,以解决那些需要专家提供决策的复 杂问题。( 蔡自兴,徐光佑,1 9 9 6 ) 专家系统的应用面十分广泛,涉及医疗、化 学、地质、石油、商业、金融、气象等,几乎渗透到各行各业,凡是需要用专 家知识解决问题的地方,都有专家系统生存的土壤。 图1 1 描述了一个基于知识的专家系统的基本概念。用户提供事实或其他 4 第l 章绪论 该系统将知识经过编译技术,依赖自定义的一套虚拟推理指令系统生成该 知识库的推理指令序列。然后推理机读取指令,并且结合用户的信息交互完成 问题的求解。采用虚拟指令的技术保证了知识的保密性,并且有利于知识的跨 平台性,经过该步处理大大提高了解释推理机的执行效率。( 张红艳,2 0 0 7 ) 1 1 3 知识获取 ( 一) 知识获取的概念 作为纯技术的概念,知识获取( k a ,k n o w l e d g ea c q u i s i t i o n ) 在计算机人工 智能领域由来已久。知识获取工具是沟通领域专家和知识应用开发人员的桥梁。 知识获取是指知识从外部知识源到计算机内部的转换过程。就是如何将一些问 题求解的知识从专家的头脑和其它知识源中提取出来,并按照一种合适的知识 表示方法将它们转移到计算机中( 通常将这种转换后形成的系统称为专家系 统) 。也就是把一些问题求解的知识( 如事实、经验、规则等) 从知识源中提取 出来,并以某种形式在计算机中存储,以建立起健全、完善、有效的知识库( 高 华,余嘉元,2 0 0 6 ) 。知识源一般包括领域专家、文献资料、数据库以及系统运 行中产生的数据等。 ( 二) 知识获取的步骤 专家系统中的知识获取是一个不断循环和不断完善的过程。 x 第1 章绪论 要特征、预期效益和所要达到的目标等,确定知识的类型和结构。 ( 2 ) 概念化阶段:对关键概念和关系以更直接和明显的方式进行描述和说 明,并对任务进行划分,确定问题的控制流程和约束条件。 ( 3 ) 形式化阶段:把主要概念、子问题、信息流特征关系及领域知识,用 适合于计算机表示和处理的形式化方法描述出来。 ( 4 ) 实现阶段:将形式化的知识用系统可理解的表现形式或语言形式描述 出来,使知识得以合理地组织,最终定义出控制和信息流,并存储到知识库中。 ( 5 ) 测试阶段:由于初始的知识库中往往存在着矛盾或冗余规则,或者知 识的使用结果与专家给出的结论无法吻合,这就需要对它进一步求精约简,以 期获得一个结构良好、功能完善、知识相对完备的高质量知识库。 ( 三) 知识获取的方法 知识可以分为显性知识和隐性知识( p a l v i o a ,1 9 8 6 ) 。从知识获取的对象 知识的角度,可将知识获取分为对显性知识的获取和对隐性知识的获取。 l 、显性知识获取方法 显性知识( e x p l i c i tk h o w l e d g e ) 能够透过“载体”传达、表现如专利、学 术著作和技术文档等知识。此类知识“能够用正式的、系统的语言表达和沟通”, 易于以文字、图表、语言等载体,在个体和组织之间转移和传播。这类知识存 在于世界上,是未经专门收集、组织和整理的大量信息,如各种文献资料、网 络上的各种信息。知识获取机制将针对待解决的问题寻找和识别与之相关的关 键性信息,并对这些信息进行提取,形成对某一问题的专门知识作为决策的依 据。根据知识具体的存在形式,显性知识的获取方法分为以下几类: ( 1 ) 数据挖掘( d a t am i n i n g ) 。数据挖掘作为知识发现( i 视觉隐喻 “怎么做”的知识学习( 获取、内化) 表示知识的动画 “在哪儿”的知识 。 编订( 文档、外化) 知识地图 “关于谁”的知识发现( 专家、文档) 科学图表 评定( 知识登记评定) 图3 1 知识可视化研究的三个角度 2 7 第3 章可视化组件设计与实现 “知识类型”在于区分需要进行传输的知识的类型。不同的文献对知识分 类的结果不同,至今还没有一个能够将可视化形式与知识类型相对应的知识分 类法,因此还没有能够为特殊知识类型提供特殊表示方法的框架;“可视化动机” 对使用可视化表示的动机进行了区分,可以包括:通过视觉手段进行共享、知 识创新、学习,把过去的经验编成文件供别人使用和知识构图等;“可视化形式” 给出了可视化的几种方法,如启发式草图,概念图表,视觉隐喻,知识地图和 科学图表等。当然,这个图表中的知识类型,可视化目的以及可视化形式等的 列举只是一个示意,没有一个对应关系,研究者们可以根据自己的需要去确定 ( 赵国庆,黄荣怀,陆志坚,2 0 0 5 ) 。 ( 二) 知识可视化研究的一般思路 知识可视化研究可以借鉴传统的四步实验法: ( 1 ) 构建理论上的形式化模型和相应的算法: ( 2 ) 开发实现该理论的软件; ( 3 ) 应用理论和工具,构建实际问题的解决方案; ( 4 ) 评估建构的系统,重复这四步,直到得到满意的效果。 在实施时,这四大步骤需要进行进一步的分解。第( 1 ) 步大致可以分解为: ( a ) 明确知识可视化的目的,即解决研究的动机问题; ( b ) 选取一种切实有效的知识分类法; ( c ) 分析该分类法下的各种知识类型,哪些适合进行可视化,哪些不适合 进行可视化; ( d ) 为各种知识类型选择合适的知识可视化方法,即图解手段; ( e ) 为各种图解形式寻求对应的计算机知识表示法,即建立相应的数据结 构( 含逻辑结构和物理结构) 和算法。 第( 2 ) 步则可以依据软件工程的思想将其分解为需求分析,设计,编码, 测试等步骤;第( 3 ) 步是实验环境的创建;第( 4 ) 步则是实验效果的分析和 评估,从而为进入下一个迭代做准备。 3 1 3 几种已有的知识可视化工具 ( 一) 概念图( c o n c e p tm a p ) 概念图是康乃尔大学的诺瓦克( n o v a k ) 博士根据奥苏贝尔( d a v i dp 第3 章可视化组件设计与实现 a u s u b e l ) 的有意义学习理论提出的一种教学技术。根据诺瓦克博士( 1 9 8 4 ) 的 定义,概念图是用来组织和表征知识的工具。它将某一主题的有关概念置于圆 圈或方框中,然后用连线将相关的概念和命题连接,连线上标明两个概念之间 的意义关系。 概念图是使用节点代表概念,连线表示概念间关系,由包含一个概念的节 点及连接组成。连接被贴上标签并用箭头符号指示方向,被贴上标签的连接解 释节点之间的关系,箭头描绘关系的方向,“概念一连接词一概念”这样一个三元 组形成了一个命题。另外,概念图是具有层次结构的,最高级的概念处在顶端。 人们可以用适合的关联词来说明不同层次的概念之间的关系,并确定不同分支 之间的横向联系( 朱学庆,2 0 0 2 ) 。 概念图最大的优点在于对知识的体系结构( 概念及其概念之间的关系) 一 目了然的表达出来,还突出表现了知识体系的层次结构。 ( 二) 思维导图( m i n dm a p ) 思维导图最初是2 0 世纪6 0 年代英国人托尼巴赞( t o n yb u z a n ) 创造的一 种笔记方法。托尼巴赞( 1 9 9 9 ) 认为:传统的草拟和笔记方法有埋没关键词, 不易记忆,浪费时间和不能有效的刺激大脑四大不利之处,简洁,效率和积极 的个人参与对成功的笔记有至关重要的作用。在草拟和笔记的办法成效越来越 小的情况下,需要一种可以不断增多回报的办法,这种办法就是思维导图。尽 管思维导图的初始目的只是为了改进笔记方法,它的作用和威力还是在日后的 研究和应用中不断显现了出来,被广泛应用于个人,家庭,教育和企业。 托尼巴赞认为思维导图是对发散性思维的表达,因此也是人类思维的自 然功能。他认为思维导图是一种非常有用的图形技术,是打开大脑潜能的万能 钥匙,可以应用于生活的各个方面,其改进后的学习能力和清晰的思维方式会 改善人的行为表现。 ( 三) 认知地图( c o g n i t i v em a p s ) 认知地图也被称为因果图( c a u s a lm a p s ) ,是a c k e n l l a n & e d e n 提出的,它 将“想法”( i d e a s ) 作为节点,并将其相互连接起来。想法不同于概念( c o n c e p t s ) , 它们大多是句子或段落。认知地图是以个体建构理论( p e r s o n a lc o n s t m c tt h e o r y ) 为基础提出的,其中的“想法”都是通过带箭头的连接线连起来,但连接上没 有连接词,连接线的隐含意思是“因果关系 或“导致”,且没有层次的限制。 c o g i l i t i v em a p s 用来帮助人们规划工作,促进小组的决策( a c k e n n a n ,e d e n , 2 9 第3 章可视化组件设计与实现 面的处理也变得具有挑战性。一个应用可能有很多不同的视图,m v c 模式对于 视图的处理仅限于视图上数据的采集和处理,以及用户的请求,而不包括在视 图上的业务流程的处理。业务流程的处理交予模型处理。比如一个订单的视图 只接受来自模型的数据并显示给用户,以及将用户界面的输入数据和请求传递 给控制和模型。 控制( c o l l 仃o l l e r ) 可以理解为从用户接收请求,将模型与视图匹配在一起, 共同完成用户的请求。划分控制层的作用也很明显,它清楚地告诉你,它就是 一个分发器,选择什么样的模型,选择什么样的视图,可以完成什么样的用户 请求。控制层并不做任何的数据处理。例如,用户点击一个连接,控制层接受 请求后,并不处理业务信息,它只把用户的信息传递给模型,告诉模型做什么, 选择符合要求的视图返回给用户。因此,一个模型可能对应多个视图,一个视 图可能对应多个模型。 模型、视图与控制器的分离,使得一个模型可以具有多个显示视图。如果 用户通过某个视图的控制器改变了模型的数据,所有其它依赖于这些数据的视 图都应反映到这些变化。因此,无论何时发生了何种数据变化,控制器都会将 变化通知所有的视图,导致显示的更新。这实际上是一种模型的变化一传播机制。 模型、视图、控制器三者之间的关系和各自的主要功能如图3 2 所示。 状态查询 i 覆塑 l 状态改变 视囝 解释梗型 梗型更新请求 发送用户输入给控制器 允许控制器选择视图 封装应用程序状态 响应状态查询 应用程序功能 通知视图改变 视图选择 控爿器 定义应用程序行为 用户动作映射成模型更新 选j 荤d 向应的视图 图3 2m v c 组件类型的关系和功能 3 2 2m v c 模式的扩展 m v c 模式具有良好的可扩展性,可以轻松实现以下功能: ( 1 ) 实现一个模型的多个视图; 3 2 第3 章可视化组件设计与实现 ( 2 ) 采用多个控制器; ( 3 ) 当模型改变时,所有视图将自动刷新; ( 4 ) 所有的控制器将相互独立工作。 这也是m v c 模式的优越性的体现,只需在以前的程序上稍作修改或增加新 的类,就可以轻松地增加程序功能。以前开发的许多类可以得到,而程序结构 根本不再需要改变,各类之间相互独立,便于团体开发,提高开发效率。对于 一个模型、两个视图和一个控制器的扩展实现,模型类及视图类不需要改变, 只需要增加另一个视图,并与模型发生关联即可。这种模式下视图、控制器、 模型三者之间的示意图如图3 3 所示。 图3 3 模型、控制器和视图三者关系示意图 同样也可以实现其它形式的m v c

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论