已阅读5页,还剩126页未读, 继续免费阅读
(计算机软件与理论专业论文)基于本体的不确定性知识管理研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于本体的不确定性知识管理研究摘要摘要随着人类社会步入知识经济时代,知识正取代传统的土地、自然资源、资本和劳动力成为推动社会进步与发展的主要力量。知识经济在客观上要求有与之相适应的管理模式和管理理论;另外组织或企业也迫切需要有效的技术来管理这种极具经济价值的战略性资源。基于以上背景,本文着重探讨了基于本体的知识管理,特别是不确定知识管理中的几个关键问题,具体来说包括以下几个方面:( 1 ) 基于本体的不确定性知识表示和查询当前组织和企业所处的环境( 如w e b 、市场) 具有开放、不确定性和分布式等特征。如何表示领域中的知识,特别是不确定知识是一个重要的研究问题。传统的本体建模方法以及现代基于描述逻辑的本体表示语言都存在不足。为了表示领域知识的不确定性并支持对不确定性知识进行推理,本文对现代描述逻辑进行了扩展提出了p s h _ r q 描述逻辑,引入概率来表示概念之间的依赖关系,并使用贝叶斯网络作为不确定性知识的推理手段。在知识查询方面,本文也对现有基于描述逻辑的知识查询机制进行了扩展,使之能处理不确定知识查询问题。( 2 ) 半自动本体获取方法w e b 时代的来临加剧了知识获取这一瓶颈问题。知识的手工获取不仅效率低下、代价高昂,而且还容易导致不一致性和各种其他错误本文提出了一个半自动的本体获取方法,该方法主要从w 曲页面、文本数据库等多种源语料库中获取浅层本体,并通过领域专家的干预和确认得到符合应用要求的领域概念模型。我们重点研究了基于本体的语料获取、领域概念发现和关系学习,所获得的本体可以用现有语言来表示。( 3 ) 本体映射方法在多主体系统、语义网和信息集成等领域,如何协调同一领域内不同本体,甚至是不同领域本体的语义差异是一个重要问题本文基于相似度度量提出了一个多维动态概念映射算法一s m a t c h 算法。该算法可以根据应用领域不同灵活性和准确性需求,在语言级、结构级、实例级和推理级四个维度上动态地进行本体概念映射。s - m a t c h 算法在查全率和查准率方面要优于h m a t c h 算法,和g l u e 方法相比,s - m a t c h 需要更少的专家支持。对于概率本体,我们提出了s - p o m a p 算法,它是s m a t c h 算法的扩展,主要在推理级上使用贝叶斯网络学习算法发现概念相似关系( 4 ) 面向语义的多主体知识服务面向服务的结构为动态环境中的知识共享和利用提供了一种良好的集成手段。当前w e b 服务描述仅停留在语法层面,并没有对其意义做任何说明。这种语义信息的缺失和关系的匮乏严重阻碍了服务协作和组合本文以开放动态环境下的语义级知识共享和利用为目标,定义了知识服务描述o w l - k s ,赋予知识服务丰富的语义信息着重阐述了知识服务的描述、发现和匹配问题在实现上以多主体系统为平台。知识服务提供方和l中国科学院研究生院博士学位论文请求方注册到注册中心,主体遵循知识服务协议进行交互完成所代表用户指定的知识服务任务基于上述工作,我们实现了一个面向语义的多主体知识管理系统k m s p h e r e 原型系统。整个系统分为三大部分,分别是本体工程和本体学习工具o n t o s p h e r e ,主要负责语料分析、本体学习、本体编辑和本体映射等功能。其次是知识库o n t o b a s e ,根据不同的领域可以建立相应的领域知识库,即o n t o b a s e 实例。最后是o n t o p o r t a i o n t o s e r v i e e s ,前者提供基于w e b 的知识查询服务,后者则支持应用级知识利用。关键词:知识管理、本体、不确定性、知识服务,多主体系统hr e s e a r c ho no n t o l o g y - b a s e du n c e r t a i nk n o w l e d g em a n a g e m e n ta b s t r a c tr e s e a r c ho no n t o l o g y b a s e du n c e f t t a i nk n o w l e d g em a n a g e m e n ty o n gc h e n g ( c o m p u t e rs o f t w a r e & t h e o r y )s u p e r v i s e db yp r o f z h o n g z h is h ia b s t r a c tt h ek n o w l e d g ee c o n o m ya g ei su p o nu & n o w , k n o w l e d g ei se n d o w e dw i t ht h en e wr o l e 嬲t h er e f i l lo fn a t u r a lr e s o l l r c e s ,c a p i t a la n dl a b o r , a n db e c o m e so n eo ft h ep r i m a r yd 由i 1 1 9f a c t o r sf o rs o c i a ld e v e l o p m e n t o b v i o u s l y , t h em a n a g e m e n tm o d ea n dt h e o r yf o rk n o w l e d g e 疵u r g e n t l yr e q u i r e di na c c o r dw i t ht h ek n o w l e d g ee c o n o m y f o ro r g a n i z a t i o n sa n de n t e r p r i s e s , k n o w l e d g ei sc o m i n gi n t ob e i n g as t r a t e g i cr e s o u r c ew i t hg r e a te c o n o m i cv a l u e s i nk n o w l e d g ec i l g i n c e d o 舀o n t o l o g i e sp r o v i d ea ne f f e c t i v em e s n st od e s c r i b et h ec o n c e p tm o d e la n ds t r u c t u f ed o m a i nk n o w l e d g e w i t ht h i sb a c k g r o u n di nm i n d , t h et h e s i si sm a i n l yd e a l tw i t ho n t o l o g y - b a s e dk n o w l e 电em a n a g e m e n t , e s p e c i a l l yi no p e nu n c e r t a i ne n v i t o n m e n t s e v e r a li s s u e sa r ea d d r e s s e df o l l o w s :( i ) r e p r e s e n t a t i o na n dq u e r yo fu n c e r t a i nk n o w l e d g eb a s e do r lo n t o l o g yt h ee n v i r o n m e n te 岳w e b , m a r k e t s ) ,i nw h i c ho r g a n i z a t i o n sa n de n t e r p r i s e sr t es i t u a t e d , i so f t e no p e n , a y m m i ca n dd i s t r i b u t e d t h ek n o w l e d g er e h t e dt ot h i sc o n t e x ti so f t e nu n c e t t a i n , s ot h a ti tc a n tb en s 姆r e p r e s e n t e db yt r a d i t i o n a lo n t o l o g ym o d e j i n gm e t h o d sa n dm o d e md e s c r i p t i o nl o g i c b a s e do n t o l o g yl a :哩咿b e c a u s eo ft h e i ri n n e rd e f i c i e n c y i no r d e rt oo v e r c o m et h i sp r o b l e m , w ee x t e n dm o d e r nd e s c r i p t i o nl o g i c sb yi n t r o d u c i n gp r o b a b i l i t yt od e s c r i b et h ed e p e n d e n c er e l a t i o n sb e 协e e nc o n c e p t si nd o m a i na n db a y e s i a nn e t w o r kt oi n f e rt h er e h t i o n & w ea l s oe x t e n dt h ek n o w l e d g eq u e r ym e c h a m s ma n dp r o v i d es u p p o r tf o ru n c e r t a ml 【n d w l e d g 。,( 2 ) as e m i - a u t o m a t i cm e t h o df o ro n t o l o g ya c q u i s i t i o ni nt r a d i t i o n a lk n o w l e d g ee n g i n i n g , k n o w l e d g ei sm a i n l ya c q u i r e dm m l u a i 魄w h i c hr e s u l t si nn o to n l yl o we f f i c i e n c ya n dh 电ec o s t , b u ta l s o $ o r n cs e r i o mi n c o n s i s t e n c ya n dv a r i o u se r r o 拖w ep r o p o s eas e m i - a u t o m a t i co n t o l o g ya c q u i s i t i o nm e t h o d , w h i c ha t t e m p t st oo v c r c o l l l et h eu n s u r p a s s a b l ek n o w l e d g eb o t t l e n e c kt h a th a sb e e n 缸t h c ta g g r a v a t e dw i t ht h ea d v e n to fw e l xt h em e t h o dp r o v i d e sg e n e 姐ls u p p o mt ol e a r nt h es h a l l o wo n t 0 1 , y 丘o mv 盔d 邮s o u r c c ss u c h4 5w e bp a g e sa n dt e x t , a n dv a l i d a t ei tb yd o m a i ne x p e r t st oo b t a i nt h es h a x ed o m a i nm o d e ls e v e r a lp r o b l e m s 玳e m p h a s i z e & h o wt oc r a w lt h et e x tc o r p u sb a s e do no n t o l o g y , h o wt ol i ip h dt h e s i s g r a d u a t es c h o o l ,c h i n e s ea c a d e m yo f s c i e n c e sd i s c o v e rt h ec o n c e p t sa n dr e h t i o n s h i p si nt h ec o r p u s ( 3 ) o n t o l o g ya l i g n m e n tm e t h o do n t o l o g i e sc a nb ev i e w e d am e a n sf o rp e o p l et ou n d e r s t a n dt h ew o r l d , s oi t i sh a r df o rp e o p l et oh a v et h es a m ev i e w p o i n t sa b o u tt h ew o r l d o w i n gt ot h en a t u r eo fh e t e r o g e n e i t ya n dd y n a r m c s t h ei n t e r a c t i o no fd i f f e r e n to n t o l o g i e si nd i f f e r e n td o m a i n si sb e c o m i n gak e yi s s u e w ep r e s e n tas i m i l a r i t y b a s e dm u l t i d i m e n s i o nd y n a m i cc o n c e p ta l i g n m e n ta l g o m h ms - m a t c ht h a tc a ne x e c u t ed y n a m i c a l l yc o n c e p tm a p p l l l ga tl i n g u i s 如s t r u c t u r e ,i n s t a n c ea n dg e a s o n l n gl e v e l sa c c o r d i n gt ot h ed i f f e r e n tr e q u i r e m e n t so ff l e x i b i l i t ya n da c c u r a c yo fa p p l i c a t i o n t h ea l g o t i t h mo u t p e r f o r m sh - m a t c hi np r e c i s i o na n dr e c a l la n dn e e d sm u c hl e s se x p e r t sk n o w l e d g et h a ng l u ea p p r o a c h w ea l s oe x t e n dt h es - m a t c ha l g o r i t h mf o rp r o b a b i l i s t i co n t o l o g y , a n dt h em a i ni m p r o v e m e n tt on e ws - p o m a pi st h a tb a y e s i a nn e t w o r ki sl e a r n e dt od i s c o v e rt h ep r o b a b i l i s t i c$ i l x x i l a tr e l a t i o n s h i p ( 4 ) s e m a n t i c s - - o r i e n t e dm u l t i - a g e n tk n o w l e d g es e r v i c e sa sk n o w nt oa j lw e bs e r v i c e sp r o v i d e sap o t e n t i a ls o l u t i o nt ot h ei n t e r o p e r a u o no fa p p l i c a t i o ni nt h ed y n a m i ca n df l e x i b l ew e bc o n t e x t b e c a u s ei tr e l i e so no p e nx m l - b a s e ds t a n d a r d sl i k es o a pa n dw s d l , t h es h 血i go fi n f o r m a t i o ni sg r e a t l yi m p r o v e d h o w e v e r , t h ed i s c o v e r ya n dm a t c h i n go fs e r v i c e sa r es e r i o u s l yb a f f l e db e c a u s eo ft h el a c ko fs e m a n t i c s t oa u t o m a t et h ea b o v et a s k s , s e m a n t i cd e s c r i p t i o na b o u ts e r v i c e si sr e q u i t e dt op r o m o t et h es e r v i c ed i s c o v e r ya n dm a t c h m a k i n g i nt h et h e s i s , as e a n a n t i c s - o r i e n t e da g e n t - b a s e dk n o w l e d g es e r v i c e sm e c h a n i s mi sp r o p o s e da tt h ea p p l i c a t i o nl e v e lt os h a i et h ek n o w l e d g ei no p e n , u n c e r t a i na n dh e t e r o g e n e o u se n v t o n m e n t s k n o w l e d g es e r v i c ed e s c r i p t i o n , m a t c h m a k i n ga r ea d d r e s s e di nd e t a i l s t h ek n o w l e d g es e r v i c e sa r ei m p l e m e n t e do l lt h em u l t i a g e n tp l a t f o r mm a g ei nw h t c ha g e n t sc a ni n t e r a c tw i t he a c ho t h e rt om e e tt h eu s e rk n o w l e d g er e q u i r e m e n t s b a s e do na b o v ew o r k s , w ed e s i g nas e m a n t i c s - o r i e n t e dm u l t i - a g e n tk n o w l e d g em a n a g e m e n tp r o t o t y p e k m s p h e r es y s t e m k m s p h e r ec o n s i s t so ft h r e ep a r t s :t h ef i r s to n ei so n t o l o g ye n g i n e e r i n ge n v i r o n m e n tn a m e do n t o s p h e r ei nw h i c ht e x ta n a l y s i s , o n t o l o g yk m m g , e d s u n ga n da l i g n m e n tr f ep r o v i d e d t h en e x to n ei so n t o b a s e , t h ek n o w l e d g eb a s e a c c o r d i n gt od i f f e r e n tm o d e l i n gd o m a i n o n t o b a s ec a nb ei n s t a n 6 a t e dt oc t e a t et h ed o m a i nk n o w l e d g eb a s e t h el a s ti so n t o p o r t a i o n t o s e r v i e e s , o n t o p o r t a li saw e b b a s e dk n o w l e d g ep o r t a lw h i l eo n t o s e r v i c e sp r o v i d e ss u p p o r tt ok n o w l e d g em a t c h m a k i n ga n dc o m p o s i t i o na ta p p l i c a t i o nl e v e lk e yw o r d s :k n o w l e d g em a n a g e m e n t ,o n t o l o g y 。u n c e r t a i n t y ,k n o w l e d g es e r v i c e s 。m u l t i - a g e n ts y s t e mi v基于本体的不确定性知识管理研究描述逻辑符号描述逻辑符号顶概念底概念概念属性属于、不属于存在量词全称量词概念等同概念否定概念合取概念析取子概念描述逻辑解释论域解释函数t b o xa b o xi 也o x描述逻辑知识库a l c 描述逻辑5 描述逻辑( 或a l c r + 描述逻辑)5 描述逻辑+ 角色层次5 描述逻辑+ 逆角色5 ) 玎描述逻辑+ 数量约束概率描述逻辑5 h 描述逻辑+ 符号概念+ 数量约束+ 数据类型i xd硭dddd。r 阉鳓冗、cu 几l ff比mm6 触t上pj旷吖一f,jf”足膨5鲋鲫锄一一基于本体的不确定性知识管理研究图表清单图1 1表2 1表2 - 2图2 1图2 2表3 1图3 1图3 2图3 3图3 - 4图3 5表3 - 2图3 6图3 7表3 3表3 - 4图3 8图4 1图4 - 2图4 - 3表4 1表禾2图卅图4 - 5图5 一l图5 - 2图5 3图5 4图5 5图5 6图6 1图6 - 2图6 3图6 - 4图6 5图6 6图6 - 7图6 8图6 9论文组织结构图图表清单础述逻辑概念及解释1 9原子概念贝叶斯网络:! l:1 5复杂概念贝叶斯网络w e b 本体表示语言比较“3 3半自动本体获取框架基于本体的知识系统使用场景3 6本体学习过程o n t o s p l d e r 体系结构源文档预处理过程雅典奥运网页抓取实验结果。4 5简单概念词汇图新发现概念对比图词汇相似计算比较h o w n e t 中的符号及其含义5 0新发现关系对比图本体映射例子本体映射过程树状的义原层次结构映射模式对映射结果的影响s - m a t c h 算法结果比较。概率本体本体映射贝叶斯网络概率知识查询过程! ;65 96 46 1 ;概率概念结点7 4简单角色概念结点s u b c l a s s o f 构造算子i n t e r s e c t i o n o f 构造算子d i s j o i n t w i t h 构造算子o w l - s 顶层本体服务过程本体知识服务描述元本体基于匹配的知识服务发现基于代理的知识服务发现基于p 2 p 的知识服务发现。知识服务发现交互图m a g e 平台体系结构多主体知识服务系统x i7 47 57 68 l8 :!8 :;8 68 78 8中国科学院研究生院博士学位论文图6 1 0 多主体知识服务交互过程9 6图7 - l知识管理主要过程1 0 0图7 - 2k m s p e h r e 体系结构图1 0 3图7 - 3o n t o s p h e r e 主界面1 0 4图7 4o n t o s p h e r e 本体编辑1 0 4图7 - 5o n t o s p h e r 本体映射结构1 0 5图7 - 6本体数据库模式1 0 6图7 - 7知识查询主界面1 0 7图7 - 8知识门户0 n t o p o r t a l 1 0 7图7 - 9主体知识服务o n t o s e r v i c e s 1 0 8声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。就我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。作者签名:钐努日期:z 优哆乒,z 口关于论文使用授权的说明中国科学院计算技术研究所有权处理、保留送交论文的复印件,允许论文被查阅和借阅;并可以公布论文的全部或部分内容,可以采用影印、缩印或其它复制手段保存该论文。储躲彳呈旁聊虢鼬社嗍如“叫基于本体的不确定性知识管理研究第一章绪论i 1 研究动机及意义第一章绪论全球经济一体化及信息技术的飞速发展标志着人类正逐步由工业经济时代向知识经济时代转变其重要特征是知识这种无形资源正逐步取代传统的有形资源( 如土地、自然资源、资本和劳动力等) 成为推动社会进步的关键因素。客观上,知识经济要求有与之相适应的管理理论和管理模式。很多学者已经从不同角度进行了研究,如彼得圣吉的“学习型组织”理论、沙利文的“智力资本管理”,尤其以彼得德鲁克博士( p e t e red r u c k e o 和斯威比博士为代表提出的“知识管理”理论影响较大,他们的思想对现代知识管理理论和研究产生了深远的影响。对组织和企业而言,知识正变成最具经济价值的无形资源。特别是对于知识密集型企业来说,更是决定组织和企业成败的战略性资源。知识对组织和企业的决定作用主要体现在以下几个方面:首先,知识可以确保组织和企业活动的顺利进行。激烈的市场竞争和市场情势变化客观上要求组织能响应这种变化并迅速作出决策。对组织和企业其他成员来说,无论是销售策略制定还是新产品开发、市场拓展都依赖知识进行决策。其次,管理学研究表明经验、观念等形式表现的隐式知识对决策起着不可估量的作用,对这些知识必须进行有效管理,否则将极有可能重犯过去的错误甚至导致组织或企业活动的失败。最后,知识还是确保组织和企业核心竞争力的关键。如果组织和企业知识化程度越高,就越有可能在竞争中处于主动地位,并提升组织和企业的可持续发展能力。近几十年的变化深刻地印证了这一点。总之,知识经济时代的到来将不可避免地对现有的生产生活方式、人类思维方式、价值观念、教育模式以及企业经营管理等人类社会的方方面面产生深远的影响对于知识这种无形资源,时代迫切需要相应的管理理论和管理模式,组织和企业需要管理实践。知识管理已成为知识经济时代管理理念的核心,正如泰勒的科学管理理论和方法是工业时代的企业管理基础,知识管理正是二十一世纪知识经济时代的企业管理基础。本课题主要来源于9 7 3 国家重点基础研究发展计划“语义网格的基础理论、模型、方法和关键技术”( 项目编号2 0 0 3 c b 3 1 7 0 0 4 ) 、8 6 3 高技术研究发展计划。面向智能主体的软件方法学”( 项目编号2 0 0 1 a a l l 3 1 2 1 ) 、“多主体环境m a g e ”( 项目编号8 6 3 3 0 6 z t 0 2 - 0 1 3 ) 和2 0 0 4 年中国科学院研究生科学与社会实践资助专项等项目。我们重点研究了基于本体的知识管理,特别是不确定知识管理的几个关键问题:包括基于本体的不确定领域知识表示,获取,语义消解和知识服务等几个方面本体提供了一种表第1 页中国科学院研究生院博士学位论文示领域概念模型和结构化领域知识的有效手段。在信息集成、语义网、自然语占处理等领域中,本体的应用越来越广泛。本文主要研究使用本体进行知识管理,特别是不确定性知识的管理。理论上的重要意义如下:_ 支持语义级知识管理。传统的知识管理方法往往只是从语法上对知识进行描述,并不对其意义进行描述,常采用基于关键字的检索方法,查全率和查准率都较低。本体提供了领域相关的概念及其关系描述,因此可以对具体知识进行标注,形成含有丰富语义信息的知识库,进而可以利用这些语义信息进行检索或提供更高层的知识服务。一支持对隐含知识进行推理。本体表示语言通常具有严格的逻辑基础。特别是现代w e b 本体表示语言如o i l ,d a m l + o i l 、o w l 等均以可判定描述逻辑为基础。因此,可以支持对隐含知识进行推理,发现知识库中隐含的概念和关系。_ 提高知识管理自动化程度。由于基于本体的知识库是机器可理解的,因此主体可以根据用户的需要执行相应的知识管理任务,如知识查询、知识组合等。甚至不同的主体还可以相互协作,完成更复杂知识管理活动,提高知识使用率。一支持经验知识管理。专家和领导的经验知识对组织和企业具有重要的价值。本体提供了一种手段来表示这类非形式化知识。甚至可以对它们进行推理。由于基于本体的知识管理具有语义层、自动化、支持推理等优点,大大深化了知识管理的内涵,促进了知识的共享和应用。具体说来,基于本体的知识管理大大促进了以下应用:一电子商务应用。在开放的电子商务环境中,本体可以有效地进行知识表达,知识查询,或不同领域知识的语义消解。本体还可以支持更丰富的商务服务发现、匹配和组合,提高自动化程度。著名的电子商务企业如e b a y 、y a h o o 等都有应用一多主体系统应用。多主体系统为开放、分布式环境下的应用提供了一种极具潜力的解决方案。采用本体进行知识表示,主体从而可以和其他主体进行知识的共享,共同协作完成复杂的任务特别是对于多领域情况,基于的本体的方法是有效的动态语义知识共享方法。- 计算机支持的协同工作。协同工作模式下,多个用户在计算机系统的支持下,相互协作共同完成某一任务。由于各用户的知识背景可能是不同的,因此如果缺乏共同的理解基础,将不可避免导致协作失败。本体可以提供这样的基础,因此大大促进了计算机支持的协同工作应用此外,基于本体的知识管理在数据挖掘、信息集成、语义网等方面都有广泛应用。综上所述,知识经济时代和企业组织迫切要求现代的知识管理理论和实践基于本体的知识管理思想是对传统方法的革新和超越,在理论上和实际应用中显示出巨大的意义和价值 s c h 0 3 1 。本文以本体为基本手段,以贝叶斯网络理论为基础研究了不确定知识管理中的几个关键问题,包括基于描述逻辑的不确定性知识表示、半自动领域本体获取第2 页基于本体的不确定性知识管理研究第一章绪论方法、本体映射方法和面向语义的知识服务等问题,并设计了知识管理原型系统。1 2 面临的主要挑战目前,基于本体的知识管理,特别不确定性知识的管理研究面临的主要挑战包括以下几个方面:领域知识获取问题知识获取问题是长期以来困扰知识工程的一大瓶颈。w e b 的迅速发展更加剧了这种现象,导致“数据的海洋,贫乏的知识”这一新的困境。具体说来,知识获取难题主要体现在以下几个方面:( 1 ) 知识源选择。知识工程中,传统知识源主要包括用户、技术文档、参考书籍、词典和词汇表等。w e b 的爆炸式增长使得以电子文档形式存在的资料在知识源中占据越来越重要的地位,这些语料不仅数量大而且存储式样有极大差异因此,需要开发新技术对这些大量的语料进行处理和筛选,以选取适量的代表性的文档便于进一步分析。( 2 ) 知识获取方式。传统上领域专家和知识工程师可以采用调查、分析和用户面谈等方式获取知识,也可以查阅技术手册和相关参考文档。海量电子文档的出现迫切要求改变这样的知识获取方式,交互式计算机辅助知识获取是将来的主要获取方式之一,这不仅可以提高知识获取效率降低代价,而且还可以避免某些错误和不一致性( 3 ) 领域知识内容。领域知识包括领域概念、概念之间的关系和领域实例,此外还包括领域规则和公理等。目前,w e b 上绝大多数语料都是以文本形式表现的。如何从这些无结构化和半结构化文档中获取领域概念和关系还有很多困难,相关研究尚处在初期阶段这一方面要依靠w e b 信息处理、语义网技术的进步,同时也要积极利用自然语言处理、机器学习和数据挖掘等其他领域的先进研究成果。( 4 ) 知识表示语言传统的知识表示语言通常基于一阶逻辑( k 1 1 0 ,框架与一阶逻辑( 如c y e l 、o n t o l i n g u a 、o c m l 、f l o g i c ) 、描述逻辑( l o o m ) 等,这些语言表示能力强,但不适合表示w e b 资源。为此,学术界相继推出了基于w e b 的本体语言( 或称作本体标记语言) 如s h o e s h o e 0 5 】、x o l 、r d f 、r d fs c h e m a 、o i l 、d a m l + o i l 、o w l 等,这些语言为表示w e b 资源的语义提供了良好的基础,但在表示能力方面还有待进一步提高。( 5 ) 知识工程环境。良好的本体开发工具和支持环境是促进和保证本体成功应用的关键尽管现在已经成功开发了一些系统,如本体开发工具( 如p r o t 6 9 6 2 0 0 0 p t 0 0 5 、w e b o d e o d e 0 5 、o n t o e d i t j o e 0 5 1 、k a o n l k a o n 0 5 ) 、本体合并工具( 如p r o m p t ) 、本体标注工具( 如c o h s e c o h s e 0 5 i 、m n m w m d + 0 2 1 等) 、本体存储和查询工具( j e n a 、s e s a m e 等) ,但是它们离工业级应用还有一段距离。第3 页中国科学院研究生院博+ 学位论文一不确定领域知识表示不确定性是w e b 、多主体系统、知识管理系统等复杂系统具有的固有属性。如何表示不确定知识是人工智能和知识工程领域研究己久的问题。通常的方法有贝叶斯理论、确定性理论、证据理论和可能性理论等等,并广泛应用在模式识别、自然语占理解等领域。一个重要的问题是要求这些不确定性知识表示方法支持对隐含知识的推理并满足“可判定性”约束。由于一般的概率推理问题是n p h a r d 问题,因此如何在语占能力和语言推理复杂度之间进行折衷仍然需要进一步研究。本体语义协调问题从本质上来说,本体是人们对客观世界的认识和反应。由于人们具有不同的世界观和看法,他们对客观世界具有完全不同甚至冲突的观点,这导致本体的异构性。本体本身并不能解决这种异构性。在多主体系统、语义网、信息集成等领域,如何消除异构本体的内在语义差异是非常重要的,否则可能导致理解失败。这种环境下,开发一个全局本体是一种可能的解决方法但有时候或许并不存在一个这样的全局本体来满足各方面的需求,或许得到这样的全局本体的代价过于高昂。这时,本体映射提供了实现语义协调的重要途径所谓本体映射就是概念级上在源本体和目标本体之自j 定义某种映射关系,从整体上维护一个可共享的概念模型。知识库与知识查询信息( 知识) 库是信息( 知识) 应用的前提条件。目前组织和企业中广泛采用的还是管理信息系统( m i s ,m a n a g e m e n ti n f o r m a t i o ns y s t e m ) ,这种系统一般采用关系数据库作为信息存储设施,检索时使用s q l 语句进行查询,建库过程一般手工完成。至于知识库的建立问题,特别是如何使用领域所提供的概念模型来建立领域知识库,目前仍主要靠手工完成。在研究上,有人使用机器学习方法进行知识标注方面,相关研究仍处于初期阶段。在知识查询上,尽管语义网等研究领域已经提出了r q l 、r d q l 、r d f q l 、r m l 、t r i p l e 等查询语言,并且各具特色。在以下方面还需更多的研究工作:是功能方面,要支持不确定知识点查询,提高查询效率。二是标准化方面,学术界和工业界要取得共识,提出一种广为接受的查询语言一应用级知识利用w e b 的迅速增长促进了基于w e b 的知识应用。w e b 服务为整合w e b 上的组件提供了种集成解决方案,具有良好的交互性。语义网作为下一代w e b ,为w e b 上的资源提供了清晰的语义。语义网上的w e b 服务。即语义w e b 服务将是未来一个重要的发展方向,适合应用于动态分布式环境如多主体系统、虚拟组织等,满足知识服务智能化、个性化和动态性需求目前,这方面的研究还正在起步阶段,特别是知识服务的描述、匹配和组合等关键问题需要进一步研究第4 页基于本体的不确定性知识管理研究第一章绪论i 3 相关研究工作现状1 3 1 半自动本体学习方法根据学习语料的不同,a l e x a n d e r m a e d c h e 和s t e f f e ns t a a b 将本体学习方法分为五类i m s 0 1 1 :分别是基于文本的本体学习、基于字典的本体学习、基于知识库的本体学习、基于半结构化数据的本体学习和基于关系模式的本体学习方法。其中基于文本的本体学习方法又可以分为基于模式的抽取、关联规则、概念聚类、本体修剪和概念学习等几类,下面我们选取一些代表性的方法予以介绍。基于文本的本体学习方法a g u i r r e 方法【从h + 0 0 】是2 0 0 0 年由a g u i r r e 等人提出来的,其目的就在于使用w e b上可以检索的文本来丰富现有本体中的概念。执行过程中,该方法由四个阶段组成:首选根据本体中的概念从w 曲上检索相关的文档;其次对这些文档进行预处理,抽取出词条并使用统计方法获得其频率;然后再对相同意义的词条进行聚类;最后是选择合适的方法进行评价。b a c h i m o n t 方法 b i t 0 2 是b r u n ob a c h i m o n t 等人于2 0 0 2 年提出的。该方法分为三个过程:一是语义规范化( n o r m a l i z a t i o n ) 。用户选用领域中相关的词条并规范它们的意义。二是知识形式化。领域专家根据第一阶段获得的分类结构,澄清概念的意义将知识形式化。第三阶段用某种特殊的知识表示语言表示该本体。该方法部分地由d o et 具所支持g u p t a 方法 g k a + 0 2 1 主要根据领域相关的文档来维护w o r d n e t 语言本体。这种学习方法使用了三步迭代开发过程。首先发现概念元素,包括词条、短语以及这些元素之间的关系;然后从上阶段发现的短语和关系中识别新的概念和关系;最后是更新和维护,包括插入、删除和更新前一个阶段获得的本体元素,保持予w o r d n e t 的完整性。h a h n 方法 h s 9 8 1 h m 0 1 1 基于自然语言文本理解来丰富和维护领域分类关系。这种方法是一种增量本体学习方法文本知识抽取过程大致可分为以下四个阶段:首先是语占处理阶段,主要从语法结构中获得结构依赖关系;然后根据所得到的分析树计算语言质量指标和概念质量指标;第三阶段根据上面的结果计算概念的综合可信度;最后进行评价。h e a r s t 描述了一个基于模式的方法期望从本体中学习概念间的关系 h e a 9 8 1 。该方法寻找与现有本体( 如w o r d n e t ) 相关的概念,然后决定它们之间满足具有某种关系( 主要是上下位关系) 的模式这种基于模式的方法已经应用到o n - t o k n o w l e d g e 系统l a v o o 中进行本体细化,但是错误率仍然较高,因此需要专家的确认。其他基于文本的学习方法还包括a l f o n s e c a & m a n a n d h a r 方法j a m 0 2 1 ,a u s s e n a c - g i l l e s 方法 a b s o o a a b s o o b l 、f a a t z s t e i n m e t z 方法 f s 0 2 i 等一基于半结构化数据的本体学习方法第5 页中国科学院研究生院博士学位论文d e i t e l 等人提出了一个方法从r d f 注释的w e b 资源中学习本体i d f d 0 1 1 ,总的目标是从全局r d f 图中学习新的领域概念来丰富用于注释r d f 的本体。它系统地考虑了包括r d f 图中某一结点集的全部概念。为了获得资源描述,该方法定义了资源抽取标准为资源的长度为n 的描述,指r d f 图中包含全部长度小于或等于n 的路径的最大连通子图。执行过程中,首先抽取长度为l 到图中最大路径长度的资源描述,并将这些描述表示为r d f 元组,再对所有可能的元组对进行泛化,把具有相似外延的元组分组,最后建立概念层次结构。p a p a t h e o d o r o u 方法 p v s 0 2 1 是欧盟u n i v e r s a l 项目开发的本体学习方法。其主要目的是使用数据挖掘计算来建立分类关系。语料源是x m l 或r d f 表示的半结构化数据。基本思想就是将相似的元数据文件进行聚类,然后从中抽取出一些关键词汇,以此发现领域概念并建立关系。该方法主要步骤如下:首先是数据收集和预处理。从元数据文件中选择代表性的关键词,并计算文档之间的相似关系。其次使用数据挖掘技术发现模式。主要使用聚类算法根据文档内容的相似性将文档进行聚类。最后是对模式的评价和本体创建。通过考察前期阶段获得的关键词并使用统计的方法进行度量,选择最好表示类的关键词汇,它们提供了必要的信息来形成领域概念,并结合不同的计算度量来发现它们之间存在的关系。v o l z 方法w o s + 0 3 1 是2 0 0 3 年由v o l z 等人提出来的。该方法企图通过规则将非终结和终结符翻译为本体的概念和角色从而获取x m l 模式的语义信息。输入源文件可以是x m l 文件,x m ls c h e m a 文件或d t d 等。在执行过程中,首先
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 转速保护系统安装调试施工方案及技术措施
- 建筑消防设备安装规范及要求
- 2026电工证考试题库及模拟考试答案(新训、复审)
- PPR管道热熔连接施工方案方法与技术措施
- 石膏线安装施工工艺及施工方法
- 粉体输送系统安装调试施工方案及技术措施
- XXXX储能项目施工组织设计
- 2026年消费者权益保护培训班考试题(含答案)
- (试题)空调与制冷作业(运行操作)考试题库及答案
- 2026年千灯镇公开招聘编外工作人员12人简章参考题库【夺分金卷】附答案详解
- GB/T 20065-2025预应力混凝土用螺纹钢筋
- 旅游景区安全与消防培训课件
- 盐酸利托君的应用及护理
- 冶金用电安全培训课件
- 出血性中风课件
- 护理质量指标解读2025年非计划拔管
- 2025年首都博物馆合同制用工人员招聘17人笔试参考题库附带答案详解(10套)
- 2025年广东省中学生天文知识竞赛试题(及答案)
- 超声引导阴部神经阻滞技术
- 海洋弧菌护理查房
- 房建工程质量标准化实施手册(2025版)
评论
0/150
提交评论