(计算机软件与理论专业论文)面向ia的案例知识管理系统关键技术研究.pdf_第1页
(计算机软件与理论专业论文)面向ia的案例知识管理系统关键技术研究.pdf_第2页
(计算机软件与理论专业论文)面向ia的案例知识管理系统关键技术研究.pdf_第3页
(计算机软件与理论专业论文)面向ia的案例知识管理系统关键技术研究.pdf_第4页
(计算机软件与理论专业论文)面向ia的案例知识管理系统关键技术研究.pdf_第5页
已阅读5页,还剩53页未读 继续免费阅读

(计算机软件与理论专业论文)面向ia的案例知识管理系统关键技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 2 1 世纪是知识经济的时代,对知识的管理更是社会经济发展的主要驱动力和提高 组织竞争力的重要手段。案例知识作为知识中的一个特殊类别,蕴含着丰富的信息和大 量知识。案例知识管理目前主要形式是c b r ( c a s e - b a s e dr e a s o n i n g ,基于案例的推理) , 将c b r 应用于案例知识管理具有许多优势,但是目前已经出现的c b r 理论模型中存在 一定问题,而c b r 应用系统则缺乏通用性,这些都制约着c b r 的发展。传统的触 ( a r t i f i c i a li n t e l l i g e n c e ,人工智能) 思想的出发点在于试图理解案例并建立模型,从而 在使用的时候为用户提供解决方案:而近年出现的i a ( i n t e u i g e n e e a s s i s t a n t ,智能助理) 思想的出发点则在于描述案例的本质及他们的关系,从而在必要的时候为用户求解提供 帮助,人工智能只是一个辅助伙伴。将认的思想与c b r 结合将产生一个全新的推理技 术,可以将c b r 技术应用于任何领域,应用于没有案例的案例推理。 本文首先对现有的c b r 理论模型进行了分析,并对研究团队将面向认的人工智能 技术应用于c b r 过程中提出的一个c b r 改进模型b r 2 ( c a s eb a s e dr e t r i e v ea n d r e a s o m n g ) 模型进行了分析和完善。接着对基于c b r 2 模型的案例知识管理系统的若干 关键技术进行了研究,最后对案例知识管理工具系统c b r z t ( c b r 2 m o d e l b a s e dt o o l s y s t e m ) 的框架进行了分析并给出了其实现原型。 论文的贡献主要体现在以下方面: 1 )对新一代c b r 模型叫b r 2 模型进行了改进和完善。 2 ) 对句子向量空间模型进行了研究,并实现了基于此模型的案例的检索和分类算 法,获得较好的检索效果。 3 ) 研究了基于句子向量空间模型的案例库中案例的索引机制,很好地改进了检索 算法的效率。 4 ) 根据队思想及c b r 2 模型,设计出了案例知识管理系统的体系构架。 5 ) 研究了基于j a v a 的动态方法库实现技术,可对检索算法进行动态扩展,从而 支持软件进化和使用领域专用算法进行数字案例检索。 6 ) 采用先进的a o m 开发框架,完成了一个案例知识管理系统的整体框架及其中 案例库建立、案例资源管理、文本案例分类和检索、案例特征值管理、数字案 例检索、领域知识管理等模块的开发。 关键词:案例知识管理,智能助理,基于案例的推理,句子向量空间模型 t r e s e a r c ho nk e y t e c h n o l o g i e so f l ao r i e n t e d ca s ek n o w l e d g e m a n a g e m e n ts y s t e m a b s t r a c t t h e21s tc e n t u r yi sak n o w l e d g e e c o n o m ye r a t h em a n a g e m e n to fk n o w l e d g ei st h e t h r u s to ft h ed e v e l o p m e n to fo u rs o c i a le c o n o m ya n dt h ei m p o r t a n tm e a n so f i m p r o v i n gt h e c o m p e t i t i v e n e s so fa l lo r g a n i z a t i o n c a s ek n o w l e d g e ,a sas p e c i a lc a t e g o r yo fk n o w l e d g e ,i s r i c ho fi n f o r m a t i o na n dk n o w l e d g e t h em a i nf o r mo fc a s ek n o w l e d g em a n a g e m e n ti sc b r ( c a s e - b a s e dr e a s o n i n on o w a d a y s ;u s i n gc b r t om a n a g ek n o w l e d g eh a sm a n y a d v a n t a g e s , b u tn o wt h ea p p e a r e dt h e o r ym o d e l so fc b rh a v es o m ef l a w s ,a n dt h ec b rs y s t e m sl a c ko f u n i v e r s a l ,b o t ho ft h e ma r ec o n s t r a i nt h ed e v e l o p i n go fc b r t h et a k e o f fo ft r a d i t i o n a l t h i n k i n go fa i ( a r t i f i c i a li n t e l l i g e n c e ) i st r y i n gt ou n d e r s t a n dt h ec a s e sa n de s t a b l i s hm o d e l s o ft h e m ,a n dp r o v i d eu s e r sw i t hs o l u t i o n sw h e ni nu s e b u tt h et a k e o f fo fn e wt h i n k i n go fl a ( i n t e l l i g e n c ea s s i s t a n t ) ,w h i c hw a sa p p e a r e di nr e c e n ty e a r s ,i st r y i n gt od e s c r i b et h en a t u r e o ft h ec a s e sa n dt h e i rr e l a t i o n s ,a n dh e l pu s e r st os o l v ep r o b l e mw h e nn e c e s s a r y , a r t i f i c i a l i n t e l l i g e n c ei sj u s ta na u x i l i a r ya s s i s t a n th e r e an e wr e a s o n i n gt e c h n i q u ew i l lc o m ei n t o b e i n gb yc o m b i n i n gc b rw i t hi a ,c b rc a nb ea p p l i e dt oa n yf i e l d ,e v e nd oc a s e - b a s e d r e a s o n i n go nt h eb a s i so f n oc a s e i nt h i sp a p e r , t h ee x i s t i n gt h e o r e t i c a lm o d e l so fc b ra r ea n a l y z e df i r s t l y , a n dan e w t h e o r e t i c a lm o d e ln a m e dc b r 。m o d e l ,w h i c hi sp r o p o s e db ya p p l y i n gi a - o r i e n t e da r t i f i c i a l i n t e l l i g e n c et e c h n o l o g yt ot h ep r o c e s so fc b rb yo u rr e s e a r c ht e a m ,i sa d d r e s s e da n d a n a l y z e di nd e t a i l s t h e n ,s o m ek e yt e c h n o l o g i e so fc b p 3m o d e lo r i e n t e dc a s ek n o w l e d g e m a n a g e m e n ts y s t e ma r er e s e a r c h e d a n daf r a m e w o r ko fc a s ek n o w l e d g em a n a g e m e n t s y s t e mi sa n a l y z e da n dap r o t o t y p es y s t e mi sd e s i g n e da n di m p l e m e n t e da tl a s t t h ec o n t r i b u t i o no ft h i sp a p e ri sm a i n l yr e f l e c t e di nt h ef o l l o w i n ga s p e c t s : 1 ) h a si m p r o v e da n dp e r f e c tt h en e wc b rm o d e l c b m o d e l 2 ) p a r t i c i p a t e di nt h er e s e a r c ho fs v s m ( s e n t e n c e s - b a s e dv e c t o rs p a c em o d e l ) , a n di m p l e m e n t e dt h er e t r i e v a la l g o r i t h m sa n dc l a s s i f i c a t i o na l g o r i t h mo fc a s e t t a b s t r a c t b a s e do nt h i sm o d e la n do b t a i n e dag o o dr e t r i e v a le f f e c t r e s e a r c h e dt h ei n d e xs y s t e mo fc a s eb a s e do ns v s m ,a n db yw h i c h ,w ei m p r o v e t h ee f f i c i e n c yo ft h er e t r i e v a la l g o r i t h m sal o t d e s i g n e dt h es y s t e ma r c h i t e c t u r e o fc a s e k n o w l e d g em a n a g e m e n ts y s t e m a c c o r d i n g t ot h et h i n k i n go f i aa n dc b r zm o d e l r e s e a r c h e dt h el i b r a r yt e c h n o l o g yo fd y n a m i cm e t h o d s b yj a v ap r o g r a m m i n g l a n g u a g e ,w h i c hm a k e st h er e t r i e v a la l g o r i t h m sc a l lb ed y n a m i ce x t e n d e d ,a n d p r o v i d e st os o f t w a r ee v o l u t i o na n dc a b er e t r i e v a lb yr e t r i e v a la l g o r i t h mo fs p e c i a l d o m a i m 6 ) f i n i s h e dt h ec o d eo ft h eo v e r a l lf r a m e w o r ka n ds o m em o d u l e s ,s u c ha sc a s eb a s e b u i l d i n g , c a s er e s o u r c e sm a n a g e m e n t ,t e x t u a lc a s ec l a s s i f i c a t i o na n dr e t r i e v a l , c a s ea t t r i b u t e s e x t r a c t i o n ,d i g i t a l c a s er e a s o n i n g , a n dd o m a i nk n o w l e d g e m a n a g e m e n t ,o fac a s ek n o w l e d g em a n a g e m e n ts y s t e mb yu s i n gt h ea d v a n c e d a o mf r a m e w o r k k e y w o r d s : c a s ek n o w l e d g em a n a g e m e n t ,i a ,c b r , s e n t e n c e s - b a s e dv e c t o rs p a c em o d e l i i i 西北大学学位论文知识产权声明书 本人完全了解西北大学关于收集、保存、使用学位论文的规定。学校有 权保留并向国家有关部门或机构送交论文的复印件和电子版。本人允许论 文被查阅和借阅。本人授权西北大学可以将本学位论文的全部或部分内容 编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和 汇编本学位论文。同时授权中国科学技术信息研究所等机构将本学位论文 收录到中国学位论文全文数据库或其它相关数据库。 保密论文待解密后适用本声明。 一 学位论文作者签名:氢肇旺指导教师签名:经二一 卅年月2 - z - e t 矿年衫肛日 西北大学学位论文独创性声明 本人声明:所呈交的学位论文是本人在导师指导下进行的研究工作 及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外, 本论文不包含其他人已经发表或撰写过的研究成果,也不包含为获得西 北大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的 同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢 :正 思。 学位论文作者签名:弼即磐专 硼年移月沈日 西北大学硕士学位论文 1 1研究背景 第一章绪论 几千年来,人们不断地在使用知识、学习知识、处理知识和研究知识。1 9 4 6 年世 界上第一台计算机诞生,从此以计算机为工具的信息处理技术逐渐取代传统的纸张和算 盘式的信息计算和处理,信息处理先后经过了数值计算、数据处理、知识处理三个阶段 【1 1 。数值计算和数据处理阶段计算机在人脑支配下代替人完成繁琐且不断重复的脑力劳 动,在知识处理阶段计算机逐步具有人工智能,能独立进行一些脑力劳动【2 1 。 随着知识经济的兴起,知识管理作为科学的概念已经逐渐被人们接受。2 1 世纪是 知识经济的时代,知识成为经济增长、社会发展和国际竞争力的第一推动力和决定性因 素。知识产业逐渐成为经济发展的主导产业,应用知识进行创新成为经济活动的重要内 容【3 1 。对组织而言,知识和信息正在取代资本和能源成为最主要的资测4 1 。 1 9 7 7 年,知识工程的鼻祖f e i g e n b a u m 教授在第五届国际人工智能联合会议上提出 了知识工程的概念【5 】,成为知识可操作化的一个里程碑。f e i g c n b a u m 并指出知识工程的 途径是应用人工智能的原理和方法,知识工程的目标是对那些需要专家知识才能解决的 应用难题提供求解的手段,同时他还指出设计基于知识的系统的重要技术问题是恰当地 运用专家知识的获取、表达和推理过程的构成与解释。1 9 9 4 年的首届知识管理大会之 后,知识管理的概念逐渐被计算机领域人员重视【6 1 。1 9 9 5 年,n o n a k a 和t a k e u c h i 第一 次介绍“知识型企业 的概念【7 】。 今天,信息技术的广泛应用和互联网的普及,使得人类的知识空前浩繁;知识的急 剧增长和通信手段的便利,使得知识获取更加容易,但同时知识泛滥、知识冗余、垃圾 知识的观点也层出不穷。在某种意义上,人类的知识并不贫乏,甚至过多,但是人们有 效获得知识的能力却十分不足,这就是知识管理的本质【8 】。 在今天激烈竞争的环境中,知识管理有助于企业整合自身的知识,实现知识流程化, 使企业能够快速有效地对外界进行响应,提高单位时间内的创造价值,扩大知识利用的 程度与范围,增强创新能力和商务智能,打破原有的管理等级边界,拓展组织发展的空 间【8 1 。 知识管理是人类几千年来的热爱与追求,是知识经济产生与发发展的必然结果,是 企业增强组织竞争力的源泉。 第一章绪论 案例知识是知识中的一个特殊部分,属于隐性知识的一种,是人们在实践活动中不 断积累的经验、教训、技巧或方法知识,对解决现在或将来遇到的问题有极大的参考价 值。案例知识管理就是要研究如何对案例及蕴涵其中的丰富知识进行管理和利用,从而 能高效高质量地解决现实中遇到的问题,或者对问题有建设性的建议。案例知识管理是 知识管理中一个重要方面。 1 2 案例知识管理研究现状 1 2 1 案例知识概述 广义上说,知识就是人们在认识世界、改造世界过程中所获得的认知,包括积累经 验的总和。具体说来,知识是经过加工提炼,将很多信息材料的内在联系进行综合分析, 从而得出的系统结论【引。 虽然案例已经较为广泛地被不同领域所关注,并且其存在也有了一段相当长的历 史,但对于何谓案例、衡量案例的标准等,也远未达成一致的认识,概括地说,案例是 含有问题或疑难情境在内的真实发生的典型性事件【9 1 。 在认知科学中,许多研究者在数学、物理、计算机科学等不同领域探讨了案例学习, 多方面论证了案例在知识学习中的重要作用。研究表明,无论是在实验条件下,还是在 自然场合中人们都比较喜欢利用过去的示例进行学习。当人们解决问题时,他们经常参 考过去的示例【1 们,这就是案例学习。 案例学习就是从具体案例中发现规律,解决问题。案例往往蕴涵着大量的丰富的理 论知识,这些知识作为以往活动的经验、教训,是解决实际问题的重要依据,由此引出 了案例知识的概念。 1 2 2 案例知识管理的渊源 自古以来,人们就一直在尝试对知识进行管理。语言的发明使得人类的知识可以被 传递和共享;文字的发明使得知识可以被记录;纸张的发明使得知识可以被持久性存储; 计算机的发明使得知识可以被管理;互联网的出现使得知识可以被更好更快速地传播; 数据库的出现使得知识可以被大规模地存储和方便地检索;x m l 、o n t o l o g y 、元数据、 r d f 、语义网、网格等现代信息技术再一次点燃了无障碍、共享、重用和协作的知识管 理的希望。 知识管理已经出现了几十年,但是长期以来人们对知识管理的理解存在两种误区, 2 西北大学硕士学位论文 一种是把传统文档管理当作知识管理,仅仅是对知识外在的分类进行管理,而并没有使 用文档的内容,他们所谓的知识检索实际上是基于分类的导航式的文档查找;另一种是 类似于专家系统的知识编码系统,即将所有的知识进行结构化表示并通过对知识进行编 码来表示知识,然后用布尔检索方法对知识进行检索,但是现实中知识不一定要被编码, 也不一定可以被编码 1 l j 。 最初案例的提出来源于人工智能( a r t i f i c i a li n t e l l i g e n c e ,a i ) ,对案例知识管理的 研究与人工智能的研究有很大联系。人工智能自1 9 5 6 年被提出并发展至今,取得了许 多实用性的成就,开发出了许多以专家系统为核心的各种智能决策系统。2 0 世纪8 0 年 代以来,知识工程成为人工智能应用最显著的特点。但人工智能在知识管理方面的抽取 知识、建立模型、知识表达、规则推理的模式在应用中还存在许多技术难题,使得在面 对无法给出具体模型的应用领域或者不习惯参考规则或统计模型的决策者时人工智能 中存在的不足十分突出【1 1 1 。 基于案例的推理( c a s e b a s e dr e a s o n i n g ,c b r ) 是人工智能中的一项重要推理技 术,也是发展较为成熟的一个分枝。c b r 基于“相似的问题有相似的解 这一假设, 使用的主要知识不是规则而是案例,求解问题时不是通过链式推理而是通过相似检索。 c b r 作为一种方法论是合理的,因为世界从总体上来看存在一定的规整性,相似的条 件下发生的动作会产生相似的结果。“历史是惊人的相似”,过去的经历可能预示未来【8 l 。 由于c b r 的特定推理模式,以及c b r 具有的简化知识获取、提高问题的求解效率、 改善求解质量、进行知识积累等优点,使得将c b r 应用于案例知识管理是目前最合适 也是最主要的案例知识管理形式。 随着知识经济时代的到来,社会各组织中案例知识急剧增加,要想用案例推理的方 法得到一个十分准确的问题解决方案有时是需要很长时间的,缺乏实时性,并且有些案 例并不适合推理。于是一些学者提出了i a ( i n t e l l i g e n ta s s i s t a n t ,智能助理或i n t e l l i g e n c e a m p l i f i e r ,智能放大器) 的概念,队的目标不是给出独立问题的解答,而是作为一个 智能助手,在人们需要的时候给问题求解提供有效的帮助【7 1 。 近些年来,数据挖掘和分析技术的发展能更好地解决人工智能在知识获取方面的局 限,为案例知识管理系统的实现及c b r 技术提供了更好的技术保障【12 1 。 目前国内外案例知识管理的主要形式是将c b r 应用于案例知识管理,开发出案例 知识管理系统。案例知识管理系统对一个组织上整体的案例知识的获取、存储、学习、 共享、创新过程进行管理,从而提供了一个学习经验、方法和理论知识的平台,通过对 3 第一章绪论 知识共享和重用来加快学习速度和鼓励创新,对提高企业综合能力与竞争能力有很大的 帮助作用。 1 3 现有案例知识管理系统的不足 目前国内外对案例知识管理比较活跃,但目前的对案例知识管理系统的理论研究大 多数只是将c b r 技术应用于解决某一特定方面的问题【1 3 。16 1 ,开发出应用于小范围的专 用系统,缺乏比较通用的案例知识管理系统。 在实践方面,国外的m 、a p q c 、惠普公司、英国石油公司以及因内的长城企业 战略研究所、中国海洋石油总公司、用友公司、金山公司等已经出现了一些案例知识管 理的实践,但是管理实践中还存在许多问题。 通过详细分析和研究,发现目前案例知识管理系统普遍存在以下不足【l l 】: 1 ) 案例的表示方式缺乏规范性、一致性和可扩展性,导致案例的共享性、重用性 和互操作性差,知识共享还局限于企业或组织内部。 2 ) 理论知识与案例以及资源之间缺乏连通性。现有案例知识管理系统缺乏理论知 识和资源方面的支持,忽略了资源对问题解决的重要性,只是单纯的案例分类 管理。 3 ) 案例缺乏领域知识的支持,忽略了领域知识在推理过程中的重要作用。 4 ) 案例知识管理系统基本都是建立在c b r 的r 4 模型理论基础上的,模型相对落 后,因而模型中存在的一些问题也表现在系统之中。 5 ) 基于案例的推理系统工具化,一种工具只能用于特定领域的案例模型,缺乏通 用性,且不支持软件进化,工具的可扩展性较差。 6 ) 不能实现案例的推理检索,只是单一的关键字检索方式。由于忽略了语序、词 序和语法,不能保证检索的查全率和查准率。 7 ) 知识不能及时更新。在知识的获取阶段不能把实践中增加的新案例及时收集到 系统中,造成在知识的检索阶段难以准确找到与实际相联的案例。 1 4 研究的目标及意义 1 4 1 研究目标 在研究案例知识管理系统的原理的基础上,结合现有案例知识管理系统中存在的不 足,本文拟从案例知识管理的需求出发对案例推理的理论模型、案例知识管理系统框架 4 西北大学硕士学位论文 及实现技术进行研究。 具体研究的目标如下: 1 ) 研究一个面向认的更完善的c b r 理论模型叫b r 2 理论模型。 2 ) 研究案例中的文本案例的检索及推理技术基于句子向量空间的检索技术。 3 ) 研究应用c b r - 理论模型的案例知识管理系统框架。 4 ) 研究案例知识管理系统实现的若干关键技术。 1 4 2 研究意义 知识管理是知识经济时代的要求。案例知识是知识的一种重要形式,是人们在实践 活动中不断积累的经验、教训、技巧或方法,对解决现在或将来遇到的问题有极大的参 考价值。案例知识管理是企业信息化和企业知识管理的必然目标和重要内容。 2 0 世纪9 0 年代以来,案例知识管理的一系列理论得以论证并不断完善,很多国际 知名的企业都在积极探索有效的案例知识管理方法,并且有相当多的企业已经从中受 益。而国内的知识管理还方兴未艾,一些咨询机构、知识型企业中已出现了对案例知识 的管理思想,但是管理水平还比较低,还存在许多问题,有此小公司所谓的知识管理更 是没有脱离信息管理的阴影。 现有的c b r 理论模型中还存在一定的问题,且存在理论研究丰富而面向应用不足 的现象,这极大地影响了案例知识管理的发展和c b r 理论的研究。现有的案例知识管 理系统中也存在诸多不足,案例表达不统一、理论模型落后、系统缺乏通用性等等,急 需进行系统的研究和完善。 传统的c b r 是基于案例特征值的,因此案例的表示缺乏直观性,特征值的权重也 难于确定。近年来出现的文本案例推理( t e x t u a lc b r ,t c b r ) 提倡用自然语言表示的 纯文本来描述案例,t c b r 的推理过程也可以采用目前成熟的搜索引擎技术,对传统 c b r 进行了改善并拓宽了推理技术的应用领域。但是国内t c b r 研究还刚刚起步,在 中国知网( h t t p :w w w c n k i n e t ) 的中国学术期刊全文数据库中进行检索,最近1 0 年 来只有2 篇研究t c b r 的文献。 导师带领的研究团队近一年来承接了两个研究课题:基于语义的分布式知识库及 检索系统和生产测井的综合解释支持系统平台,这两个系统都包含了案例知识管 理的子系统。 总之,对案例知识进行管理既是客户的需求、项目的需要,也是广泛的社会需要, 5 第一章绪论 是知识经济带来的必然趋势。因此对c b r 和案例知识管理的研究具有重大的理论意义 和现实意义。 1 5 本文的工作 在研究团队承接的两个的研究课题基于语义的分布式知识库及检索系统和生 产测井的综合解释支持系统平台中都含有案例知识管理的子系统,且它们具有基本相 同的研究内容。案例知识管理子系统研究需要从案例的推理理论模型、案例描述和检索 语言、案例知识表示、案例知识的查询、案例知识的重用、案例知识的改编、案例知识 的存储、数字案例语义标记、文本案例自动聚类、领域知识管理、推理规则应用、案例 知识管理系统框架研究及开发这些方面来开展。根据现有c b r 理论模型及案例知识管 理系统的不足,本文所做的改进主要围绕下面几个方面: 1 ) c b r 的模型研究 分析现有的c b r 模型的优缺点,并研究将认思想与c b r 结合的新c b r 模型 1 b r 2 模型。 2 ) 案例检索技术研究 主要研究案例索引的理论模型及其存储表示方法、基于句子向量空间的检索算法和 分类算法、支持软件进化和领域专用算法的动态方法库技术。 3 ) 基于队的案例知识管理系统框架研究 主要研究在队思想指导下的案例知识管理与复用模型,将c b r 与认理论相结合, 设计并开发一个建立在c b r 2 理论基础上的案例知识管理系统。 4 ) 案例知识管理系统中若干开发技术研究 主要对c b r :理论基础上的案例知识管理系统中若干关键理论技术进行研究。并结 合多年j a v a 平台项目开发经验和1 年半的o p e r a m a s k s 开发技术研究案例知识管理系 统的实现技术。 1 6 本文创新点 论文的主要创新点有: 1 ) 本文分析了现在c b r 模型的不足,并在结合面向队的人工智能技术给出了一 个新的改进c b r - 模型。 2 ) 本文采用基于句子向量空间模型的s v s m 算法对文本案例进行检索,以提高检 6 西北大学硕士学位论文 索的查全率和查准率。 3 ) 本文研究并实现了可跨平台的能对检索方法库的动态扩展技术。 4 ) 本文给出并分析了一个基于c b r 2 模型的案例知识管理系统的系统框架,在最 后还设计并实现了一个案例知识管理系统原型。 7 第二章c b r 2 模型 第二章c b r 2 模型 目前的c b r 理论模型中还存在一些问题,本章将先分析现有的c b r 理论模型及其 不足,然后结合认的思想,给出了研究团队提出的c b r 2 模型的改进模型。 2 1c b r 方法产生的人工智能背景 2 1 1r b r 专家系统存在的问题 “人工智能 这个词最初是在1 9 5 6 年由m c c a r t h y 、m i n s k y 等发起的d a r t m o u t h 学会上正式提出的。经过5 0 多年的研究和发展,人工智能也取得了很大的进展,提出 了启发式搜索策略、非单调推理、机器学习等方法,在自然语言理解、模式识别、机器 人、图像处理等方面取得了不少研究成果,在应用上形成了以专家系统为核心的各种智 能决策研究【8 1 。 专家系统是一个运用特定领域的专门知识,通过推理来模拟通常由人类专家才能解 决的各种复杂的、具体的问题,达到与专家具有同等解决问题能力的智能计算机程序系 统【1 7 】。专家系统的出现,使得珍贵的专家知识获得普遍的应用。近年来,专家系统技术 逐渐成熟,广泛应用在工程、科学、医药、军事、商业等方面,而且成果相当丰硕,甚 至在某些应用领域,还超过人类专家的智能与判断。2 0 世纪8 0 年代初之后,人们在将 人工智能应用于大型项目的研究经常会出现失败,于是出现过由于对困难估计不足而丧 失研究的信心,一度使得人工智能的研究和开发工作陷入困境,走入了低谷【1 8 - 2 0 1 。 人工智能的研究者发现基于规则推理( r u l e b a s e dr e a s o n i n g ,r b r ) 的专家系统 存在许多问题【1 2 , 2 1 - 2 3 】: 1 ) 专家系统必须建立应用空间模型,不能求解没有对应推理规则的问题。 2 ) 知识获取是最繁琐的一件事,需要领域专家和知识工程师的密切合作。 3 ) 领域知识非常复杂,把专家知识表述规则化有相当的难度,需要知识工程师参 与开发过程,系统开发周期较长。 4 ) 专家系统推理过程复杂,相似的问题的推理每次都要从头做起,导致错误结果 的推理过程经常重复进行,通常运行较慢,而且随着规则的增多,很容易出现 搜索时的组合爆炸问题。 5 ) 专家系统一旦开发出来很难维护,系统运行后常常由于初始知识不完备等原因 而需要更新,而更新的新知识可能会与原来的知识冲突,导致系统无法使用或 8 西北大学硕士学位论文 需要大的改动。 6 ) 专家系统无法进行自学习,也不能对知识进行积累。无法记录问题解答执行后 的效果,或者即使记录了,这种记录对将来的推理并没有任何影响。 以上问题都制约着专家系统的进一步发展,专家系统只能在极有限的和狭窄的专业 领域中发挥作用。 2 1 2c b r 方法的优点 c b r 是案例知识管理的重要方法之一,最早起源于美国耶鲁大学,1 9 8 2 年文献 2 5 中首先提出了案例推理的基本理论【2 4 2 6 1 ,随后c b r 许多领域得到广泛的应用,已经深 入到电子商务、万维网及信息服务、规划、设计、农业、气象、诊断、分类、辅助决策、 音乐、软件复用、辩论和法律案例推理、医学、争端调解及智能教学等领域【2 引。 c b r 是基于人们的认知心理过程,通过过去已解决问题的相关经验知识来进行有 意识地类比推理以求解新的问题的过程,推理过程是基于历史事实,其推理结果易于理 解和具有说服力【2 9 】。这种推理方法特别适合应用于没有很强的理论模型、领域知识不完 全而经验丰富的领域。c b r 是在r b r 的基础上引入的,与r b r 相比,c b r 具有以下 优点【2 1 。2 2 】 1 ) 基于案例推理系统创建时不会出现知识获取的瓶颈问题,因为知识获取只不过 是获得过去发生过的案例( 经验) 。 2 ) 基于案例推理系统不必建立应用空间模型,可以用于没有模型的领域。 3 ) 基于案例推理系统仅需从案例库中检索出相似案例而不需要复杂的规则或模 型推理,容易实现。 4 ) 案例的多少只会影响结果的可用性,因为案例库可以不断增长,所以即使仅有 少量案例基于案例推理系统也可以运行。 5 ) 基于案例推理系统可以快速提供解决方案而不必每次都进行推理。 6 ) 基于案例推理系统提供给用户的是具体的案例,也就是历史事实,事实胜于雄 辩,容易理解而且比纯粹的规则更有说服力。 7 ) 基于案例推理系统可以通过获得新案例来学习,容易维护。 8 ) 通过获取新案例,基于案例的推理系统的案例库可以从不同的领域中学习新的 知识。 9 ) c b r 系统能够反映使用者的经验积累,同一套c b r 系统在不同的使用环境下 9 第二章c b r 2 模型 经过一段时间,将会成为不同的系统。 2 1 3c b r 的理论模型 c b r 的原理和人们日常解决问题的方法基本相同,当我们碰到一个不熟悉的新问 题时,我们通常会回忆起以往的成功经验,并以之为参考做出新的解决方案, 如果方 案成功,则这次经验被作为成功经验记下来,如果下一次碰到类似的问题就可以以此作 为参考;若失败,则作为失败经验记下来,这就是我们不断学习的过程【2 2 1 。 c b r 作为增量式的学习方法,为人们解决问题提供了一种循环认知模型。从c b r 提出至今,人们在基于认知学、心理学、逻辑学等研究的基础上,提出多种有用的c b r 的推理模型,其中最有影响的模型主要有以下六种: 1 ) a l l e n 的c b r 模型【3 0 】。 2 ) h u n t 的c b r 过程的基本结构【3 l 】。 3 ) k o l o d n e r 和l e a k e 的“回忆+ 适应的c b r 过程模型【3 2 1 。 4 ) w a t s o n 和m a r i r 的c b r 循环模型3 3 1 。 5 ) a a m o d t 和p l a z a 的r 4 模型【3 4 1 。 6 ) g a v i nf i n n i e 和s u nz h a o h a o 的r 5 模型【3 5 1 。 下面主要介绍目前较流行的c b r 过程模型、r 4 、c b r 循环模型和r 5 模型。 1 9 9 6 年d a v i db l e a k e 和j a n e tk o l o d n e r 认为案例检索过程是基础性的一步也是案 例推理的第一步,推理过程中需要不断指正候选方案的潜在的问题,并对解决方案的进 行评估,在对反馈信息进行分析后,最后将案例存储起来。c b r 模型描述如图1 所示【3 6 j 。 a a a m o d t 和e p l a z a 在1 9 9 6 年提出的r 4 模型,如图2 所示,他们认为一个c b r 过程主要有四个主要过程【3 5 】: 1 ) 检索( r e t r i e v e ) 相似度较高的案例。 2 ) 复用( r e u s e ) 案例的方法并能通过适当推理解决当前问题,生成新问题的初 步解决方案。 3 ) 修正( r e v i s e ) 前述的解决方案使更符合问题的描述。 4 ) 保存( r e t a i n ) 新的案例到案例库中。 1 0 西北大学硕士学位论文 图1l e a k e 和k o l o d n e r 的c b r 过程模型 问题 图2r 4 推理模型 r 4 模型直观且高度抽象地反映了c b r 推理过程的本质特征,更能被人们所接受。 但r 4 模型存在两个缺附3 7 】: 1 ) 案例、问题及问题的解没有明确分离,不满足c b r 的案例由问题和问题解决 方法所组成的条件。 2 ) 该模型假定所有案例及案例库己经存在,回避了构建案例库也是c b r 过程的 一个重要任务。 1 9 9 7 年i w a t s o n 和f m a r i r 用一个循环示意图来描述c b r 模型,如图3 所示。他 们认为新问题的求解是通过在事例库中检索一个或多个相关事例,再利用匹配事例提供 的解答进行修改和验证,以获得一个可保留的较成功的事例m 1 。 第二章c b r 2 模型 确认解 问题 图3w a t s o n 和l 缸r i r 的c b r 循环模型 以上三种模型都认为案例库的建立是为案例推理过程做准备,都没有将案例表示、 案例库的建立和r 4 过程统一起来。直到2 0 0 3 年,澳大利亚邦德大学f i n n i eg a v i n 、 s u nz h a o h a o 等扩充r 4 模型并提出了r 5 模型【3 6 1 ,如图4 所示。 玎曲 州c 豳一 西静 图4l r 模型原图 其中r e p a r t i t i o n ( 重新分配) 过程将案例的表示分为问题域w p 和解决方案域( 解 域) w s 两部分,此过程主要研究了将现实世界的案例的实例分割为问题域和解决方案 域来建立案例库,其他四个过程均和r 4 模型一样。重新分配的思想为案例库构建和案 1 2 西北大学硕士学位论文 例检索提供了相似逻辑推理的理论基础。r 5 模型统一了案例库的建立、案例检索、案 例调整,促进了c b r 理论及其应用的发展【3 8 1 。 2 2 面向i a 的人工智能技术 在网络的时代,知识的处理正在逐渐从传统的触方式转变到n 方式【3 鲫。传统的 础是以自动链式推理为特点的人工智能,而新的队则认为人工智能只是一个辅助伙伴。 认要求的是一个可以在必要的时候给用户求解问题提供帮助的智能伙伴,而不再是以 前的那种基于自动推理的、无需用户介入其求解过程的问题解决者。 基于a i 的设计思想是先由知识工程师组织案例、抽象特征、研究算法、建好c b r , 交给用户使用,如图5 所示。从认识论的角度来看,思想的方法可以认为是在人类已经 从实践中总结出案例的基础上,一种从理论到实践的方式。 基于认的设计思想是由用户组织案例、基于文本检索、必要时知识工程师再介入 建立c b r ,如图6 所示。从认识论的角度来看,基于n 思想的方法可以认为是在人类 已经从实践中总结出案例的基础上,一种从实践到理论方式。 现有的c b r 模型都是典型的越思想指导下的案例知识管理与复用模型,其基本点 是从案例知识中提取特征信息存入案例库,并通过案例的特征检索与匹配方法,建立一 个“高于用户水平的问题求解系统,通过自动推理,给用户问题一个答案。为了实现 队这种智能伙伴,必须对传统的知识加以扩充及细化、对知识处理方式加以变化,对 c b r 的模型进行适当的改进【3 川。 候选案例集 图5 基于a i 的设计思想 1 3 文本 第二章c b r 2 模型 2 3c b r 2 模型 候选案例 图6 基于l a 的设计思想 2 1 3 节讲到了目前较流行的c b r 过程模型、r 4 、c b r 循环模型和r 5 等模型。r 5 模型明显克服了r 4 模型中两个不足,研究团队在对c b r 的研究过程中发现r 5 模型中 仍然存在一个问题:建立案例库前,建立问题分类规则有相当的难度。 r 5 模型认为每一个问题存在于问题空间w p 中,对应的解决方法( 以下简称解) 存 在于解空间w s 中,不管是w p 还是w s ,定义在其上的某种等价关系和该空间的某种 划分是一一对应的,即由某种等价关系s 导出的 p w = l o l si p w p 是w p 的划分,记 为w p s ;反之,集族 a i ) 如是w s 的某个划分,那么便由它确定了w s 上的某个等价 关系r a i 。显然,对于相似等价类m s ,如果有p l ,p 2 p j s ,那么可以认为p 1 和p 2 有相同的解,记为f ( p 1 ) = f ( p 2 ) ,这正好反映了“相似的问题有相似的解 原则。 r 5 构建案例库的过程中要求基于某种等价关系s ,那么在建库之前,等价关系s 是 如何得来的? c b r 期望达到目标是:c b r 系统可以用于没有模型的领域,而且即使仅 有少量案例,c b r 系统也可以运行,对于具有这两个特点的领域,找到“某种等价关 1 4 西北大学硕士学位论文 系s 是关键也是有非常难度的【5 】。 为了克服这个问题,研究团队在认思想指导下提出了一种改进的案例知识管理与 复用模型b r 2 模型,该模型如图7 所示。c b r 2 模型的基本点是建立一个能是尽可 能多地提供用户相关知识、支持用户知识创新或问题求解活动的智能助理,不强求给用 户提供成熟的、”高与用户”水平的问题解决方案,而只要求在必要的时候可以给用户求 解问题提供帮助。 图7c a r 2 模型 c b r 2 模型按功能共分为三层,分别是案例知识抽象层( c a s ek n o w l e d g ea b s t r a c t l a y e r ) 、案例实例层( c a s e i n s t a n c el a y e r ) 、领域知识层( d o m a i na n d c o n c e p tl a y e r ) 。 三个层的功能互相独立,互不影响,三个层可以并行处理。 相比以前的基于趾的c b r 模型,基于i a 的c a r :模型具有以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论