(计算机应用技术专业论文)基于语义web的企业知识集成关键技术研究.pdf_第1页
(计算机应用技术专业论文)基于语义web的企业知识集成关键技术研究.pdf_第2页
(计算机应用技术专业论文)基于语义web的企业知识集成关键技术研究.pdf_第3页
(计算机应用技术专业论文)基于语义web的企业知识集成关键技术研究.pdf_第4页
(计算机应用技术专业论文)基于语义web的企业知识集成关键技术研究.pdf_第5页
已阅读5页,还剩113页未读 继续免费阅读

(计算机应用技术专业论文)基于语义web的企业知识集成关键技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大连理工大学博十学位论文 摘要 随着知识经济时代的到来,知识已逐渐成为企业生存和发展的关键性因素;知识的 有效集成管理是企业实现智能化的有效方法,对企业的意义重大。然而,传统的知识集 成的研究采用种类众多的知识工程的理论和方法,使得研究处于百花齐放的状况,为企 业实施知识集成带来困难。语义w e b 相关技术的飞速发展为企业知识集成研究带来了 契机。分析发现,语义w e b 技术应用于企业知识集成管理系统能达到双赢的效果。在 这种背景下,本文对基于语义w e b 的企业知识集成的若干关键问题进行了探讨。本文 的主要工作如下: 1 1 简要概括了知识集成、语义w e b 、本体和基于范例的推理( c b r ) 等相关理论基 础方面的发展现状。围绕研究所涉及的三个关键问题,宏观的综述了前人相关的工作情 况:对本体构建与本体学习的研究现状进行了概括、总结,并分析了其面临的困难;对 现有典型本体集成方法进行了对比分析,总结了各自的优缺点;概括了基于本体的范例 推理系统的国内外研究情况,总结了存在的主要不足。在此基础上,设计、提出了基于 语义w e b 的企业知识集成系统的体系框架,并确定了三个需解决的关键问题的技术路 线,为下一步研究工作奠定了基础。 2 】提出一种从企业遗留智能系统学习o w l 局部本体的方法。其既规避了基于文本 的本体学习中尚未解决的中文分词歧义问题,又能够实现企业遗留智能系统中拥有的大 量领域知识的复用;主要由模式信息提取和模式信息、知识项向o w l 本体转换两步组 成。与现有相关方法相比,本方法针对的数据源蕴含更丰富的领域知识,更加适合实际 的工程应用;设计采用了一个简单、低时间复杂度的自动映射算法,以实现模式信息、 知识项向o w l 本体的自动转换,易于实现:并且,该自动映射算法不仅能实现关系数 据库模式信息向o w l 本体的转换,而且能实现遗留系统中范例、规则知识项向o w l 本体 中对应个体的移植,这最大限度的重用了已有的领域知识,便于实现知识共享。一个以 企业遗留的工装工时定额智能系统为数据源的应用实例证实了该方法的有效性。 3 ) 提出了基于形式概念分析( f c a ) 和概念等同度、概念包含度计算的o w l 领域 本体的半自动构建方法。该方法依据名称和结构方面的相似性确定一组相似的o w l 本体 类集合作为初始信息;通过生成并分析两两类所对应属性间的相似度矩阵来构建形式背 景,进而生成相应的概念格来实现对o w l 局部本体的概念聚类;根据概念等同度、概 念包含度的计算结果,自动推荐本体间的概念语义关系;在以上参考信息的辅助下,设 计者根据个人背景知识可以更好的构建拥有丰富概念层次结构关系的o w l 领域本体。 与相关研究相比,本研究面临的是一个以各个o w l 局部本体为数据源、以本体合并与构 基于语义w e b 的企业知识集成关键技术研究 建为任务的新问题,本方法将f c a 和相似度计算结合使用,实现了整合各自优点、规 避各自缺点的目的,在实现难易、格的复杂度、语义强度等方面都拥有更好的性能。一 个以企业级工装工时定额领域o w l 局部本体为数据源的应用实例验证了该方法的有效性 和优越性。 4 ) 提出一种新型的基于语义w e b 的范例表示与检索方法。在该方法中,我们定义 的基于r d f 的w e b 范例标记语言( r c w m l ) 提供了统一的、基于r d f 的、面向w e b 的范例表示方法,便于范例知识与领域知识本体的集成,使得共享不同范例库之间的范 例知识成为可能;基于概念语义的加权平均相似度评估将基于领域本体的概念相似度计 算用于c b r 的相似度模型,知识项效用的评估不仅依靠特征描述也依靠领域本体的概 念层次关系,这样使得范例检索更加精确、合理。该方法既规避w e b 环境难以支持严 格逻辑推理的困境,又实现了分布式范例库之间的集成。为有效评价此方法,阐述了将 此方法应用在企业级工装工时定额领域的情况。 关键词:语义w e b ;知识集成;本体学习;本体集成;基于范例的推理 大连理工大学博士学位论文 t h ek e yt e c h n o l o g yo fs e m a n t i cw e b - b a s e d e n t e r p r i s ek n o w l e d g e i n t e g r a t i o n a b s t r a c t w i t i lt h ec o m i n go ft h ee r ao fk n o w l e d g ee c o n o m y ,k n o w l e d g ei sb e c o m i n gt h ek e y e l e m e n to fe n t e r p r i s e ss u r v i v e m e n ta n dd e v e l o p m e n t k n o w l e d g ei n t e g r a t i o ni sa l le f f i c i e n t a p p r o a c h t o i n t e l l i g e n t i a l i z e t h ee n t e r p r i s e k n o w l e d g ei n t e g r a t i o ni sm o r ea n dm o r e i m p o r t a n tt oe m e r p f i s e b u tt o om a n yt h e o r i e sa n da p p r o a c h e so fk n o w l e g ee n g i n e e r i n ga r e i n t r o d u c e di nt r a d i t i o n a lk n o w l e d g ei n t e g r a t i o nr e s e a r c h ,w h i c hm a k et h ek n o w l e d g e i n t e g r a t i o no fe n t e r p r i s ed i f f i c u l t n l er a p i dd e v o l o p m e n to fs e m a n t i cw e bo p e n su pn e w o p p o r t u n i t i e sf o rt h er e s e a r c ho fk n o w l e d g ei n t e g r a t i o no fe n t e r p r i s e i tc a l lb ef o u n dt h a t a p p l y i n gt h et e c h n o l o g yo fs e m a n t i cw e b t ok n o w l e d g ei n t e g r a t i o ns y s t e mi sa “w i n - w i n ” s o l u t i o n a g a i n s t t h i sb a c k g r o u n d ,s o m e k e yp r o b l e m sa b o u tc o n s t r u c t i n g s e m a n t i c w e b - b a s e dk n o w l e d g ei n t e g r a t i o ns y s t e mi ne n t e r p r i s ea r ed i s c u s s e d r e s e a r c hw o r k sa r et a k e na sf o l l o w s : 1 ) a i m e dt ot h ep r o b l e m sd i s c u s s e di nt h i st h e s i s ,t h et h e o r yd e v o l e p m e n t so fk n o w l e d g e i n t e g r a t i o n , s e m a n t i cw e b ,o n t o l o g ya n dc a s e - b a s e dr e a s o n i n g ( c b r ) a r er e v i e w e d n e d e v e l o p m e n ta n df a c i n gd i f f i c u l t i e s o fo n t o l o g yc o n s t r u c t i o na n do n t o l o g yl e a r n i n ga r e g e n e r a l i z e d t y p i c a la p p r o a c h e so fo n t o l o g yi n t e g r a t i o na r ea n a l y z e d ,a n ds u p e r i o r i t i e sa n d d e f i c i e n c i e so ft h e ma r es u m m a r i z e d 1 1 1 er e s e a r c h e so fo n t o l o g y - b a s e dc b ra th o m ea n d a b r o a da r er e v i e w e da n dt h em a i nd e f i c i e n c i e sa r ea n a l y z e d t h e nt h eo v e r a l lr e s e a r c h p l a n n i n ga n dt h et e c h n i c a ll i n e so f t h es e v e r a lk e yp r o b l e m sa r ep u tf o r w a r d 2 ) i no r d e rt og e ta r o u n da m b i g u i t i e si nc h i n e s ew o r ds e g m e n t a t i o na n dr e u s eal o to f d o m a i nk n o w l e d g ei ne n t e r p r i s el e g a c yi n t e l l i g e n ts y s t e m s ,an o v e la p p r o a c hf o rl e a r n i n g o w ll o c a lo n t o l o g yf r o ml e g a c yi n t e l l i g e n ts y s t e mi ne n t e r p r i s ei sp r o p o s e di nt h i st h e s i s o n t h e b a s i so ff o r m a lm o d e l i n gs o u r c ed a t aa n dg o a l ,t h ee l e m e n tc o r r e s p o n d e n c eb e t w e e n r e l a t i o n a ld a t a b a s es c h e m a s ,t u p l es e ta n do w lo n t o l o g yi sa n a l y z e d , t h eo w lo n t o l o g y l e a r n i n ga p p r o a c ha n dr e v e l a n ta u t o m a t i cm 印p i n ga l g o r i t h m 、析ml o wt i m e c o m p l e x i t ya r e p r o p o s e d t h ea p p r o a c hc o n s i s t so ft w os t e p st h a ta r ea c q u i r i n gr e l a t i o n a ld a t a b a s es c h e m a a n dm a p p i n gr e l a t i o n a ld a t a b a s es c h e m aa n dk n o w l e d g ei t e mt oo 亿l o c a lo n t o l o g y c o m p a r e dw i t he x i s t i n gm e t h o d s t h ea p p r o a c hw h o s ed a t as o u r c ei m p l i e sm o r ed o m a i n k n o w l e d g ei sm o l ea p p r o p r i a t ef o ra c t b a le n g i n e e r i n ga p p l i c a t i o n o w lo n t o l o g yf r o ml e g a c y i n t e l l i g e n ts y s t e m sc a nb ea c q u i r e da u t o m a t i c a l l yv i aas i m p l et r a n s l a t i o na l g o r i t h mw i t hl o w t i m e - c o m p l e x i t yi n s t e a do fu s i n gam i d d l em o d e lo ral o to fa b s t r a c tl e a r n i n gr u l e s ,a n d 基于语义w e b 的企业知识集成关键技术研究 n u m e r o u sk n o w l e d g ei t e r n sa b o u tr u l e sa n dc a s e s ( t u p l es e t ) c a l lb er e u s e da si n s t a n c e so f o w lo n t o l o g ya c c o r d i n gt oc e r t a i np r i o r i t y v a l i d a t i o no ft h ea p p r o a c hi sd o n eb ya l l a p p l i c a t i o ni n s t a n c el e a r n i n go w ll o c a lo n t o l o g yf r o mal e g a c yi n t e l l i g e n ts y s t e mi nt h e w i d eo ft o o l i n gm a n - h o u rr a t i o n i n gi nt h ee n t e r p r i s ew i d e 。 3 ) a d v a n c e das e m i - a u t o m a t i cc o n s t r u c t i n go w ld o m a i no n t o l o g ya p p r o a c ht h a ti s b a s e do nf c aa n dc o m p u t i n gc o n c e p te q u a t i o nm e a s u r ea n dc o n c e p ti n c l u s i o nm e a s u r e i n t h ea p p r o a c h , c o n s t r u c t i n gf o r m a lc o n t e x ti sb a s e do ns i m i l i a r i t ym e a s u r ea b o u th a t t i e , s t r u c t u r ea n da t t r i b u t i o n c o n c e p tc l u s t e r i n gi sb a s e do nc o n c e p t1 a t t i c ec o n s t r u c t i o n s u g g e s t i o n st oe n r i c ho ra m e n dc o n c e p th i e r a r c h yo fo n t o l o g i e sa r em a d ea u t o m a t i c a l l y , w h i c hi sb a s e do nc o m p u t i n gc o n c e p te q u a t i o nm e a s u r ea n dc o n c e p ti n c l u s i o nm e a s u r e t h e f i n a l0 弦zd o m a i no n t o l o g yc a nb ec o n s t r u t e db yd e s i g n e r sb a s e do nt h e i ro w nd o m a i n k n o w l e d g e c o m p a r e dw i t he x i s t i n gr e l e v a n tm e t h o d s ,h e r ef a c e san e wp r o b l e mw h o s ed a t a s o u r c ei ss e r v r a lo ,ll o c a lo n t o l o g i e sa n dw h o s et a s ki so n t o l o g ym i x i n ga n dc o n s t r u c t i n g t h ea p p r o a c hi sc o m b i n i n gf c aw i t hs i m i l i a r i t ym e a s 证e ,w h i c hc o m e sb e t t e rp e r f o r m a n c e a b o u td i f f i c u l t yo fi m p l e m e n t , c o m p l e x i t yo fl a t t i c ea n ds e m a n t i ci n t e n s i t y v a l i d a t i o no ft h e a p p r o a c hi sd o n eb yt h ee v a l u a t i o no fa ne x p e r i m e n tr e s e t 4 1a tt h eb a s i so fa n a l y z i n gt h a tt l l es e m a n t i cw e ba n dc b rc a nb e n e f i tf i o me a c ho t h e r i ni n t e g r a t i n ge n v i r o n m e n t , an o v e lk i n do fs e m a n t i cw e b b a s e dc a s er e p r e s e n t a t i o na n d r e t r i e v a la r i t h m e t i ci sp r o p o s e di nt h i st h e s i s ai 江) f b a s e dc a s ew e bm a r k u pl a n g u a g e ( r c w m l ) t h a tw ed e f i n ei sa p p l i e df o re x p e r i e n c ek n o w l e d g er e p r e s e n t a t i o ni no r d e rt o f l e x i b l y i n t e g r a t es p e c i a lc a s ek n o w l e d g ew i t hg e n e r a ld o m a i no n t o l o g ya n di n t e r o p e r a t e d i f f e r e n tc a s e so fd i f f e r e n tc a s eb a s e s r e l e v a n tc a s er e t r i e v i n ga r i t h m e t i cc a nb em o r ep r e c i s e t h r o u g hc o m b i n i n gt h em e a s u r eo fd o m a i no n t o l o g y b a s e dc o n c e p ts i m i l a r i t ya s s e s s m e n t n l e a p p r o a c hc a l lg e ta r o u n dt h ed i f f i c u l t yo fs t r i c t l yl o g i cr e a s o n i n gi nw e be n v i r o n m e n ta n d a c h i e v ee f f e c t i v ei n t e g r a t i o no fd i f f e r e n tc a s eb a s e s a na p p l i c a t i o ns c e n a r i of r o mt o o l i n g m a n h o u rr a t i o n i n gi nt h ee n t e r p r i s ew i d ei si n t r o d u c e dt oe v a l u a t eo u rm e t h o d o l o g y k e yw o r d s :s e m a n t i cw e b ;k n o w l e d g ei n t e g r a f i o mo n t o l o g yl e a r n i n g :o n t o l o g y i n t e g r a t i o n ;c a s e - b a s e dr e a s o n i n g i v 独创性说明 作者郑重声明:本博士学位论文是我个人在导师指导下进行的研究工 作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写的研究成果j 也不包含为获得大连理 工大学或者其他单位的学位或证书所使用过的材料。与我一同工作的同志 对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。 作者签名:缈日期丝盟 大连理工大学博士研究生学位论文 大连理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位论文版权使用 规定 ,同意大连理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子 版,允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内 容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论 文。 作者签名: 导师签名: 高硒 大连理工大学博士学位论文 第一章绪论 1 1 研究背景 随着知识经济时代的到来,在日益激烈的竞争环境中,知识已逐渐成为企业生存和 发展的关键性因素。信息不对称理论的研究发现:市场中的人因为获得信息渠道之不同、 信息量的多寡,从而承担不同的风险和收益;这有力说明了在知识经济形态下掌握充分 知识的重要性以及对知识管理的迫切性。人们也逐渐认识到知识的有效集成管理对企业 的意义重大可提高企业的创新能力、对外环境的适应能力、工作效能、企业素质等。 然而,随着w e b 技术的普及和社会信息化程度的提高,各个应用领域所积累的知识资 源在飞速增长,我们正处于知识爆炸的时代。除了分散在人的头脑中的大量隐性知识, 还有许多显性知识资源分散在音频、视频、网页、文本、表格、应用系统、源代码、产 品图纸等多种形式的介质和系统中。人们常常为在企业内或互联网上寻找自己想要的知 识花费大量时间,为知识交流中存在的大量误解而苦恼。企业中积累了大量的知识,但 这些知识却常被束之高阁,没有发挥它们应有的作用。总之,显性知识形式多样、缺乏 统一的描述方式以及隐性知识的显性化困难都给企业知识集成带来了诸多挑战。 同时,以语义w e b 为代表的相关技术,以其严格的逻辑理论基础和标准化的技术 路线,正逐渐成为未来w e b 信息系统的一项支撑技术。语义w e b 构想产生的最初原因 是为了改变当前w e b 资源难于集成,数据难于交换和大量资源无法有效发现的现状。 传统的w e b 资源以一种隐含语义的方式存在,大量的数据逻辑以机器难于处理的自由 文本存在,而资源之间则以一种隐含语义的超链接存在,资源之间的关系也因没有明确 描述而丧失,所以机器无法理解和有效处理传统的w e b 资源的内涵语义与逻辑。因此, 语义w e b 的根本目的是要通过明确的、规范化的描述信息资源的语义来实现w e b 资源 的自动发现、数据的直接交换与服务的无缝集成,并希望通过缩小人的认知域与计算机 的处理域之间的距离,以支持人们用直观的语义对信息资源在概念层次进行操作。随着 w 3 c 对语义w e b 的大力推广,语义w e b 技术在诸多领域得到了初步的应用,例如:企 业间的数据交换和知识管理、电子商务、w e b s e r v i c e s 、基于代理的分布式计算、基于 语义的网页搜索引擎和基于语义的数字图书馆等。 通过分析可以发现:一方面,知识集成是企业实现智能化的有效途径之一,在相应 的理论和方法研究上大多采用知识工程的技术来解决;然而,由于知识工程的理论和方 法众多,对知识集成的研究处于百花齐放的状况,为企业实施知识集成带来困难。另一 方面,语义w e b 相关技术飞速发展;特别地,本体作为一种能在语义和知识层次上描 基于语义w e b 的企业知识集成关键技术研究 述信息系统的概念模型建模工具,语义w e b 的一项支撑技术,一直引起国外众多科研 人员的关注,并且,本体提出的最初目标就是实现知识的共享、集成和重用( 这也是本 体的主要作用和研究本体的意思所在) ;然而,语义w e b 相关技术仍不成熟,在诸多 领域的应用都处于研究初期,在实际的应用中仍需很好的与相对成熟的技术相结合。 因此,基于语义w e b 技术构建企业知识集成管理系统可以达到双赢的效果:既可 以充分利用语义w e b 提供的知识化、语义化和结构化特性,又可以充分利用知识工程 的技术和方法,为w e b 资源的查找、定位以及基于w e b 的数据挖掘和基于数据库的知 识发现提供更准确的支持。可以预见,随着语义w e b 技术不断成熟,越来越多的知识 集成管理系统将采用这种新技术;事实上,利用语义w e b 技术( 特别是本体理论) 实 现企业知识集成正在成为了领域内的研究热点。 鉴于以上认识,本文以知识管理和语义w e b 技术为研究背景,试图采用语义w e b 的相关技术来对企业知识的集成管理进行研究。 1 2 研究目标与内容 本学位论文的研究课题是:基于语义w e b 相关技术构建企业知识集成系统的若干 关键性问题研究。 众所周知,为了构建一个能为企业用户提供良好服务的企业知识集成系统,必须面 对并解决集成基础和集成实现方法等多方面的问题。从集成基础考虑主要解决以下问 题:企业知识的概念体系建立;为了实现基于w e b 的知识集成,需建立一种统一 的语义描述方法。从实现机制考虑,知识集成系统可以从两个方面展开:从上而下方 式,企业用户从应用的角度出发要求知识工程师建立基于知识的应用;知识工程师将根 据用户的需求,通过集成系统建立任务;从下而上建立集成模型,知识工程师根据企 业内部包含的知识系统着手,将其集成和组合为企业用户可以利用的任务。 因此,本文研究的总问题可以这样来描述:给定一个企业遗留智能系统( 其中包括 存储于关系数据库的范例知识、规则知识) 或者一个崭新的领域问题域,如何有效的构 建一个基于语义w e b 技术的企业知识集成管理系统;主要涉及知识的构建、集成以及 应用等方面的研究( 在基于语义w e b 的环境下,对应本体构建、本体集成以及范例知 识表示与检索等) 。 显然,要解决以上问题,首先,必须确定一个统一的、易于组织、便于重用的基于 语义w e b 技术的企业知识集成管理系统的体系结构。 其次,完整、准确的本体是有效构建基于语义w e b 技术的企业知识集成管理系统 的必要前提;根据面临的实际情况的不同,可以按照两条主线进行研究:一是针对企业 大连理工大学博士学位论文 中存在遗留智能系统的情况,采用从下而上的方式建立集成模型,另一条是针对一个崭 新的领域问题域( 企业不存在遗留智能系统) 的情况,采用从上而下的方式。 再次,从下而上的方式建立集成模型的采用,必然面临基于多本体构建领域本体以 及多本体概念间的语义关系确定问题。 最后,在基于知识的应用系统中,人工智能的推理技术一直是人们研究的重点。因 此,在知识的应用方面,一种面向知识集成基于语义w e b 的推理技术的研究势在必行。 因此,要解决以上总的问题必须全部解决以下三个关键( 子) 问题: 关键问题1 如何从遗留智能系统中学习o w l 局部本体 关键问题2 如何半自动生成o w l 领域本体 关键问题3 如何实现基于语义w e b 的范例知识表示与检索 解决以上总问题和三个关键问题是本文的研究目标,相应的具体研究内容如下: 1 ) 统一的、易于组织的、便于重用的基于语义w e b 技术的企业知识集成的系统框 架和结构; 2 ) 基于遗留智能系统学习o w l 局部本体的方法及实现技术; 3 ) 基于f c a 和概念等同度、概念相似度计算的o w l 领域本体半自动构建方法及 实现技术; 4 ) 基于语义w e b 的范例表示方法与检索算法及实现技术; 5 ) 一个验证以上方法算法有效性以及展示实现正确性的典型案例。 1 3 论文研究的意义 ( 1 )理论上:探索一种适合工程实际的构建基于语义w e b 技术的企业知识集 成管理系统的方法与相应关键技术。 ( 2 )方法上:提出一种两层本体的企业知识集成框架;提出一种从企业 遗留智能系统学习o w l 局部本体,进而半自动构建o w l 领域本体的方 法;提出一种面向企业知识集成基于语义w e b 的范例表示与检索方法。 ( 3 )应用上:实验性的将以上方法应用于工装工时定额领域和相应的企业遗 留智能系统。 1 4 论文的写作安排 论文的总体结构框架如图1 1 所示。 论文余下部分组织如下: 基于语义w e b 的企业知识集成关键技术研究 图1 1 论文的总体结构框架 f i g 1 1s t r u c t u r ef r a m eo f t h et h e s i s 4 大连理工大学博士学位论文 第二章,围绕研究所涉及的问题,简要概括了研究相关的理论基础和发展现状;从 方法、分类、工具等方面,对本体的构建与本体学习的研究现状进行了概括、总结,并 分析了各自面临的困难;明确了本体集成的问题来源和概念定义,对现有典型本体集成 方法进行了对比分析,总结了各自的优缺点;概括了基于本体的c b r 的国内外研究情 况,总结了存在的主要不足。在以上总结归纳的基础上,理清了总体解决方案和几个需 要解决的关键问题的技术路线,为进一步研究工作奠定了基础。 第三章,提出一种从企业遗留智能系统学习o w l 局部本体的方法。在对数据源和学 习目标进行形式化建模分析的基础上,确定了关系数据库模式、元组集与o w l 本体之间 的元素对应关系,进而确定了分为关系数据库模式信息的提取和模式信息、知识项向 o w l 本体的转换两步的o w l 本体学习方法以及相应的映射算法。与现有相关方法相 比,本方法的数据源蕴含更丰富的领域知识,更加适合实际的工程应用:通过一个简单、 低时间复杂度的转换算法,而非中间模型或大量抽象规则,从关系数据库模式中自动获 取相应的0 w l 本体部分;并按照一定的先后顺序将遗留系统中范例、规则知识项( 元组 集) 移植为o w l 本体中对应的个体。一个应用实例证实了该方法的有效性。 第四章,提出了基于f c a 和概念等同度和概念包含度计算的o w l 领域本体的半自 动构建方法。该方法以同一领域内一组o w l 局部本体为输入,首先根据名称和结构方面 的相似性确定具有一定语义关系的o w l 局部本体的类,再根据这些类所对应属性间的 相似度矩阵构建形式背景,进而通过概念格的生成实现对o w l 局部本体的概念聚类, 然后,计算相应的概念等同度、概念包含度,推荐领域本体与局部本体间的概念语义关 系。最后,根据概念格对应的h a s s e 图所体现的概念之间的泛化例化关系,参考相应的 概念等同度、概念包含度计算结果,辅助设计者构建拥有丰富的概念层次结构关系的 o w l 领域本体。应用实例证明了该方法的有效性和优越性。 第五章,提出一种新型的基于语义w e b 的范例表示与检索方法。为实现范例知识 与领域知识本体相结合以及不同范例库之间的范例知识的共享,采用了我们定义的基于 r d f 的w e b 范例标记语言( r c w m 【) 来表示经验知识,相应的范例检索算法加入了 基于领域知识本体的概念相似度计算,使结果更加精确合理。该方法既规避w e b 环境 难以支持严格逻辑推理的困境,又实现了分布式范例库之间的集成。为有效评价此方法, 阐述了将此策略应用在企业级工装工时定额领域的情况。 第六章,总结了全文。对论文主要的研究成果进行了系统的总结,对今后的研究方 向进行了展望。 基于语义w e b 的企业知识集成关键技术研究 第二章研究现状综述与本文技术路线 本章将围绕本文研究所涉及的问题,简要概括一些相应的理论基础的发展现状,并 针对本文研究的三个关键问题,比较宏观的综述前人相关的工作情况,进而提出本文研 究课题的总体研究方案和三个需要解决的关键问题的技术路线,以达到承前启后的目 的。第2 1 节,简要概括了知识集成、语义w e b 、本体和基于范例的推理等相关理论的 发展现状,为本文的研究奠定基础;第2 2 - - - - - - 2 4 节,宏观地,从本体构建与学习、本 体集成、基于本体的范例推理三个方面综述前人相关研究工作状况及不足;第2 5 节, 提出本文研究课题的总体研究方案和几个需要解决的关键问题的技术路线;第2 6 节, 总结本章。 2 1 背景理论现状 2 1 1 知识管理与知识集成 ( 1 ) 相关定义 在讨论知识集成前需要对数据、信息、知识、信息管理和知识管理等概念进行定义。 1 ) 数据可以看作是事物的属性、数量、位置与相互关系等等的抽象表示,是知识的 最低级的组成单元。数据的一般特征是关于事件和关于世界的一组独立的事实。作为数 据的文字本身还不具备意义,仅仅是字符。 2 ) 篪宣是渗透了语境与意义的数据,是经过形式化、分类、处理和格式化,对某一 特定任务来说其形式与内容都有用的数据。数据模型与模式把数据转换为信息。 3 ) 匆次是一个内涵丰富、外延广泛的概念,不同学科有不同的说法。本文提到的“知 识 是指结构化的、相互链接的、不断增长的信息及其间存在的复杂的相互关系, 其增长来源于这些信息同人的交互,以及其他辅助技术对其所蕴含关系的分析或所蕴含 规律的应用。 4 ) 篪富管理是以信息资源的有序化和结构化为目的,将各种信息以一定的方式进行 采集、汇总、组织、存储和控制,方便人们利用计算机来查询和检索。 5 ) 匆讶葶碧( k n o w l e d g em a n a g e m e n t ,即k m ) 是一个涉及面较宽的研究领域,不 同学者往往从不同的角度理解它,从而导致了多种不同的定义。这里我们定义为:知识 管理是鼓励在企业内部获取和传递知识的一套过程、方法和技术;它通过对知识加以有 效识别、获取、开发、分解、储存和传递,从而改进和提高个人、部门和组织的创新能 力、响应能力和生产力。 一6 一 大连理工大学博士学位论文 6 ) 匆识第礅k n o w l e d g ei n t e g r a t i o n ,k i ) 是通过信息技术和业务过程的组合,在信息 管理的基础上,对显性知识进行有效识别、获取、开发、使用和共享,同时尽量使隐性 知识转化为显性知识的过程;其以知识共享和创新为主要目的,重点解决信息超载导致 的知识匮乏问题,重视显性知识和隐性知识的交互作用。 ( 2 ) 知识管理与知识集成概述 知识管理来源于企业对内部知识共享、降低成本、促进创新的实际需求。近年来, 关于知识管理的研究,是沿着两条主线进行的,一条是把重点放在信息管理上,因为信 息是知识的载体,通过对信息内容和信息工具的管理来实现知识管理;另一条主线则是 把重点放在人的管理上( 本次研究更偏向前者) 。从研究方法看,可分为侧重于计算机 信息技术与人工智能技术手段的研究和侧重于人文、社会与经济管理等角度进行的研究 ( 本次研究更偏向前者) 。据此,关于知识管理的研究大致可进行如表2 1 所示的分类。 本文主要从信息技术人工智能角度对企业知识的集成管理进行研究。 表2 1 知识管理研究的分类 t a b 2 1c l a s s i f i c a t i o no fk n o w l e d g em a n a g e m e n tr e s e a r c h 知识集成与知识管理有着非常密切的联系,是集成方法在知识管理中的具体应用, 利用对知识的集成达到创新的目的。知识集成的研究从一开始就是朝着如何应用集成技 术来实现对知识的应用和创造这个方向发展;当前,比较有代表性的知识集成思想的内 涵是:知识集成就是运用科学的方法对企业不同来源、不同层次、不同结构、不同内容 的知识进行综合,实施再建构,使单一知识、零散知识、已有知识、新获知识、显性知 识和隐性知识经过综合形成新的知识体系,实现“l + l 2 ”的效果。 知识集成的作用主要体现在能够实现系统之间的知识共享,加强系统的问题求解能 力,实现知识处理系统间的互操作;通过知识集成充分发挥知识系统的效率,达到知识 创新的效果,满足用户对知识及知识处理系统共享与互操作的要求。 目前研究热点集中在三个方面:知识建模、知识共享和综合集成。知识建模是把知 识系统的开发视为建模活动,并将知识模型的结构化、组织化作为建模的核心任务:知 识共享是把智能系统开发视为基于知识共享技术的配置任务,通过组装可重用的知识和 基于语义w e b 的企业知识集成关键技术研究 推理部件构造智能系统;综合集成是通过集成知识处理技术来完成复杂的知识系统的实 现。其中,知识建模的研究为知识集成提供了基础技术;知识共享的研究使知识集成得 以经济和高效的利用;综合集成的研究促使知识集成的优化组合。 知识建模的目标是分析并建立静态( 关注知识源) 和动态的( 关注知识处理过程) 的知识模型。最近几年中,知识建模研究的重点从知识库系统开发方法的研究转向重视 语言及技术以定义可重用部件。人们希望通过可重用模型的开发实现摆脱昂贵的、容易 出错的知识系统开发,利用本体和问题求解方法库解决重新开发存在的问题。集成模型 的研究工作非常困难,其原因主要在于:建模方法差异、建模工具差异、“背景知识” 差异。研究表明:应该建立规范的领域词汇及转换方法,以实现知识的共享。 2 1 2 语义w e b ( s e m a n t i cw e b ) 根据w e b 的创建者t i mb e m e r s l e e 的定义【l 引,语义w e b 是当前w e b 的扩展, 它通过规范化的定义信息所包含的语义,来更好的帮助计算机与人之间进行交互。事实 上,w e b 文档描述的是现实世界中的对象、概念和它们之间的关系,也就是世界模型。 但传统的w e b 是基于自然语言描述的,方便人浏览,但机器却无法处理。 逻辑学研究如何清晰准确的表达思想,并提供了形式化描述语义和实现有效推理的 基本方法;本体论( o n t o l o g y ) 形式化定义了领域的概念化描述( c o n c e p t u a l i z a t i o n ) ; 知识表达与推理借助逻辑学和本体理论探究领域知识的有效表达与计算模型。借助逻辑 学可清晰准确的描述w e b 文档所蕴含的世界模型;基于本体理论对w e b 文档中的概念 或术语进行规范化的定义来消除人们在用概念或术语来描述对象时的二义性;知识表达 与处理为w e b 逻辑与w e b 本体的实现提供了有效的计算模型。这就是语义w e b 的基本 出发点,它的根本思想就是通过提供标准的模型语义表达框架来方便人们规范化的定义 w e b 信息的语义,以实现在w e b 资源创建之初就增加信息的有序度,其最终目的是实 现w e b 信息的自由大共享。 国外的很多大学、研究机构、大公司都成立了专门的项目组来推动这项技术的发展。 在研究方面,典型的参与大学与研究机构有m i t ;m a n c h e s t e r ,s t a n f o r d ,c m u ,d f k i 等;在工业应用方面,有惠普公司支持开发的j e n a 语义w e b 工具包,有由欧盟资助, w 3 c 所领导的s w a d 系列项目;在标准化方面,w 3 c 国际标准化组织已经陆续完成了 r d f 、o w l 等的标准化规范工作。 ( 1 ) 语义w e b 模型 大连理工大学博士学位论文 t i mb e m e r s l e e 在综合了语义w e b 研究领域的最新成果的基础上,提出了语义w e b 模型并得到了众多语义w e b 研究者的认同。图2 1 是t i mb e m e r s l e e 提出的语义w e b 体系结构【1 7 1 。其中: 图2 1 语义w e b 体系结构图 f ig 2 1a r c h i t e c t u r eo ft h es e m a n t i cw e b 1 ) 统一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论