已阅读5页,还剩11页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
国防科学技术大学研究生院硕士学位论文 摘要 本体是共享概念模型的明确的形式化规范说明,通过描述概念及概念之间关 系来描述概念的语义。作为一种有效表现概念层次结构和语义的模型,本体被广 泛运用到计算机科学的众多领域。 随着本体应用的深入,本体发展也面临了一些现实的问题:如何方便的构建 本体、本体的形式化描述、如何集成已有本体以及本体的应用等。 本文在概述分析本体研究现状和研究热点的基础上,针对本体研究中两个关 键性问题本体构建和本体映射,将形式概念分析引入其中,提出了基于形式 概念分析的本体构建方法和本体映射方法。 本文的主要工作和创新点包括: 1 本体理论和形式概念分析的研究 首先介绍了本体的基本概念,包括其定义、基本构成、描述语言、分类等; 其次介绍了形式概念分析和概念格的基本理论、概念格的构造算法;再次,分析 了形式概念分析与本体的区别和联系,介绍了二者结合的研究。 2 基于形式概念分析的本体构建方法研究 在研究了本体构建的基本原则及介绍了已有的几种本体构建方法的基础上, 提出了一种基于形式概念分析的本体构建方法d o b m ( d o m a i no n t o l o g yb u i l d i n g m e t h o d ) 。这种本体构建方法,通过循环添加、编辑对象( 类) 和属性构建概念 格,以概念格将本体可视化,构建本体原型。可视化的表达概念以及概念之间的 关系,容易为人们所理解。 3 基于形式概念分析的本体映射方法研究 本文将f c a 技术引入到本体映射中,提出了一种基于f c a 的概念相似度计算 方法。该方法利用辞典形成两个本体特征之间的偏序关系,建立形式背景,以此 为基础形成概念格。引入基于概念格的相似度计算模型,以概念格的不可约下确 界元素作为相似度计算的依据。理论分析与实验结果都证明该方法比通常的基于 特征的方法更准确。然后将粗糙集理论引入到f c a 中,定义了f c a 中的等价关系, 提出了基于粗糙概念格的相似度计算模型,解决了粗糙概念之间的相似度计算问 题。 主题词:本体形式概念分析本体构建本体映射 第i 页 国防科学技术大学研究生院硕士学位论文 a b s t r a c t o n t o l o g yi st h ee x p l i c i ta n df o r m a ld e s c r i p t i o no fs h a r ec o n c e p t u a l i z a t i o n i tc a n p r o v i d es e m a n t i cm e a n i n gt h r o u g hr e l a t i o n sb e t w e e nc o n c e p t s a saf i n em o d e lf o r p r e s e n t i n gh i e r a r c h ya n ds e m a n t i cm e a n i n go fc o n c e p t s ,o n t o l o g yh a sb e e na p p l i e d w i d e l yi nt h ef i e l d so f c o m p u t e rs c i e n c e w i t ht h ea b r o a da p p l i c a t i o no fo n t o l o g y ,o n t o l o g yd e v e l o p m e n ta l s of a c es o m e p r o b l e mo f r e a l i t y s u c ha sh o w t ob u i l do n t o l o g yc o n v e n i e n t l y ,t h ep r o b l e mo f o n t o l o g y f o r m a ld e s c r i p t i o n , t h ep r o b l e mo f o n t o l o g yi n t e g r a t i o na n dt h eo n t o l o g ya p p l i c a t i o n o nt h eb a s i so fab r i e fa n a l y s i so fo n t o l o g yr e s e a r c hs t a t u sa n dh o t s p i t , t h i st h e s i s f o c u so nt w ok e yp r o b l e mo fo n t o l o g yr e s e a r c h :o n t o l o g yb u i l d i n ga n do n t o l o g y m a p p i n g w ep r o p o s ea p p r o a c h e so ff c a - b a s e do n t o l o g yb u i l d i n g a n dm a p p i n g t h r o u g hi n t r o d u c et h em e t h o do f f o r m a lc o n c e p ta n a l y s i s t h ep r i m a r yw o r ka n dc o n t r i b u t i o n so f t h i st h e s i sa r ea sf o l l o w s : 1 t h er e s e a r c ho f o n t o l o g yt h e o r i e sa n df o r m a lc o n c e p ta n a l y s i s f i r s t l y ,t h i st h e s i si n t r o d u c et h eb a s i cc o n c e p t so fo n t o l o g y ,i n c l u d i n gt h ed e f i n i t i o n s o fo n t o l o g y , t h ed e s c r i p t i o nl a n g u a g eo fo n t o l o g ya n do n t o l g yc l a s s i f i c a t i o n s s e c o n d l y t h et h e s i si n t r o d u c et h et h e o r i e so ff o r m a l c o n c e p ta n a l y s i s a n d c o n c e p t l a t t i c e l a s t l y ,a n a l y z et h ed i f f e r e n c e sa n dr e l a t i o n sb e t w e e uo n t o l o g ya n df o r m a lc o n c e p t a n a l y s i s 2 r e s e a r c ho na p p r o a c h e so f f c a b a s e do n t o l o g yb u i l d i n g a f t e rr e s e a r c h i n gt h eb a s i cc r i t e r i o na n dm e t h o d so fo n t o l o g yb u i l d i n g ,ad o m a i n o n t o l o g yb u i l d i n gf r a m e w o r kb a s e do nf o r m a lc o n c e p ta n a l y s i s i sp r o p o s e d t i l i s m e t h o dc o n s t r u c t sc o n c e p tl a t t i c eb ya d d i n go b j e c t s ( c l a s s e s ) a n dp r o p e r t i e sa n dt o v i s u a l i z e so n t o l o g yb yc o n c e p tl a t t i c e , t h e nb u i l d so r i g i n a lo n t o l o g y t h ea p r o a c ht h a t v i s u a l i z i n gc o n c e p t sa n dr e l a t i o n sb e t w e e nc o n c e p t si se a s i l yc o m p r e h e n db yp e o p l e 3 r e s e a r c ho na p p r o a c h e so f f c a - b a s e do n t o l o g ym a p p i n g t h i st h e s i si n t r o d u c et h ef o r m a lc o n c e p ta n a l y s i si n t oo n t o l o g ym a p p i n g ,a n da f c a - b a s e do n t o l o g ym a p p i n gm e t h o di sp r o p o s e d 1 1 l ea t t r i b u t e so fc l a s s e si nd i f f e r e n t o n t o l o g i e si so r g a n i z e di nap a r t i a lo r d e rs e tb ym e a n so fat h e s a u r u s ,t h e nt h e c o r r e s p o n d i n gf o r m a lc o n t e x ta n dc o n c e p tl a t t i c ei se r e a t e d as i m i l a r i t yc o m p u t a t i o n a l m o d e lb a s e do nc o n c e p tl a t t i c ei si n t r o d u c e d , w h i c ha l l o wu st oc o m p u t ec o n c e p t s i m i l a r i t ya c c o r d i n gt ot h em e e t - i r r e d u c i b l ee l e m e n t s t h er e s u l to fa n a l y s i si nt h e o r y a n de x p e r i m e n tp r o v e st h ef c a - b a s e dm e t h o dh a v eh i g h e rp r e c i s i o nt h a nt h em e t h o d b a s e do nt r a d i t i o n a lf e a t u r em o d e l t oc o m p u t et h es i m i l a r i t yb e t w e e nr o u g hc o n c e p t s , t h i st h e s i si n t r o d u c et h er o u g hs e tt of o r m a lc o n c e p ta n a l y s i sa n dd e f i n e st h e e q u i v a l e n c er e l a t i o n s h i p si nf c a ,p r o p o s e sar f c a b a s e ds i m i l a r i t yc o m p u t i o n a l m o d e l 第i i 页 国防科学技术大学研究生院硕+ 学位论文 第i i i 页 独创性声明 本人声明所呈交的学位论文是我本人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表和撰写过的研究成果,也不包含为获得国防科学技术大学或其它 教育机构的学位或证书而使用过的材料与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示谢意 学位论文题目:基王毖盛攫佥金堑鳗奎生拉建当然盟左洼珏窒 学位论文作者签名:纽走日期:2 0 0 占年,月j 7 日 学位论文版权使用授权书 本人完全了解国防科学技术大学有关保留,使用学位论文的规定。本人授权 国防科学技术大学可以保留并向国家有关部门或机构送交论文的复印件和电子 文档,允许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文 ( 保密学位论文在解密后适用本授权书) 学位论文题目:基王丝塞攫金金堑数奎焦抱壅生哒盟左洼翌壅 学位论文作者签名:丛茎, 作者指导教师签名: 日期:撕年,月,) 日 日期:加年,月加日 国防科学技术大学研究生院硕士学位论文 第一章绪论 1 1 课题研究背景 本体论( o n t o l o g y ) 的概念最初起源于哲学领域,它在哲学中的定义为“对世 界上客观存在物的系统地描述,即存在论”,是一种存在的系统化解释,用于描 述事物的本质i l j 。在计算机科学领域,本体是知识形式化描述的方法,是共享概念 模型的明确的形式化规范说n t 2 j ,通过描述概念及概念之间关系来描述概念的语 义。 作为一种有效表现概念层次结构和语义的模型,本体被广泛地应用到计算机 科学的众多领域,在信息抽取、语义w e b 、搜索引擎、时空推理、知识工程、软 件复用等领域有广泛的应用。本体的功能及其应用领域可以概括为3 类: ( 1 ) 作为知识表示方法,应用于知识工程和知识管理等【3 l 口本体统一了领域 中的术语和概念,从而使知识共享和重用成为可能。如欧盟i s t 资助的 o n t o - k n o w l e d g e 项目开发了基于本体的知识管理工具集。 ( 2 ) 作为系统分析方法,应用于信息建模、面向对象分析和数据库设计等1 4 。 本体建模过程澄清了领域知识的结构,为信息系统的分析和设计提供了基础。 ( 3 ) 作为信息语义的形式化表示方法,应用于异构信息集成、多智能体系统、 语义w e b 等。本体用显式、形式化的方法描述了领域中概念的结构以及概念之间 的关系。基于本体可以实现基于内容的访问、异构信息语义层的集成和互操作1 5 】。 当前,对本体的研究主要包括3 个层次的内容: ( 1 ) 本体论工程。研究和开发本体的内容,包括两个方面,其一是研究和创 建特定领域的本体库,其二是研究和建立通用知识( 如常识知识) 的本体库。 ( 2 ) 本体的表示、转换和集成。研究用于表示各种本体的知识表示系统,提 供形式化的方法和工具,使所建立的本体能够方便地被共享和重用,提供不同的 本体评价和比较框架,研究不同本体之间的转换方法和不同本体的集成方法,提 供不同本体之间的互操作手段。 ( 3 ) 本体的应用。主要研究以特定领域本体或通用知识本体为基础的应用。 尽管本体的功能已经被认识,并逐渐得到应用,但目前对本体构建方法的研 究才刚刚起步,仅有的一些方法也是从个案的开发过程中通过逆向工程总结出来 的。随着本体应用的日益深入,领域本体的开发不能再简单视为项目开发,而应 看成是工程开发,因此就有必要对本体工程开发方法论进行系统研究。本体是现 实世界的模型,所建立的本体必须能够客观反映世界,因此,本体工程的开发应 该是一个反复迭代的过程,即特定领域的本体的初始版本建立后,还要反复地将 第i 页 国防科学技术大学研究生院硕士学位论文 其应用到实际系统中或与领域专家交流,来评价和排错,直至满意。这个反复迭 代的过程将贯穿于本体的整个生命周期。 本体是人和机器、程序间知识交流的语义基础 6 1 ,使用本体的目的是为了知识 的共享和重用。然而由于各自建立本体的局限性和不同本体之间存在个体丰富性, 本体问的语义冲突也就不可避免地存在着。因而解决不同本体的概念间的语义冲 突的本体映射成为本体研究领域的重要课题。本体映射是个复杂和艰难的过程, 人工的参与可能会提高映射的准确率,但是同样会影响效率甚至困扰本体的集成 和应用。目前,本体映射需要领域专家的干预,这在较大的本体工程应用中显然 是不现实的。因而怎样实现映射的自动化或半自动化是本体映射研究的努力的方 向。 1 2 本体论和本体的基本理论 1 2 1 本体的基本概念 本体论( o n t o l o g y ) 的概念最初起源于哲学领域,它在哲学中的定义为“对世 界上客观存在物的系统地描述,即存在论”,是对客观存在的一个系统的解释或 说明,关心的是客观现实的抽象本质【l 】。 在人工智能界,最早给出本体定义的是n e c h e s 等人,他们将o n t o l o g y 定义为 “本体定义了组成主题领域的词汇表的基本术语和关系,以及组合这些术语和关 系来定义词汇表外延的规则”用。 后来在信息系统、知识系统等领域,越来越多的人研究本体,并给出了许多 不同的定义。 c , r u b e r l 8 】于1 9 9 3 年指出:“本体是概念化( c o n c e p t u a l i z a t i o n ) 的一个显式的 ( e x p l i c i t ) 规范说明或表示”。 g u a r i n o 和c r i a r e t t a 9 1 为了澄清对本体的认识,针对本体七种不同的概念解释进 行了深入的分析,于1 9 9 5 年给出了如下定义,即“本体是概念化的某些方面的一 个显式的规范说明或表示”。 b o r s t 1o 】于1 9 9 7 年给出了一个类似的定义:“本体可定义为被共享的概念化的 一个形式的规范说明”。 陆汝钤院士掣”j 从实用的角度出发,也采用对本体的如下定义,即“本体是 关于某个主题的形式化和说明性表示,包括它的论域、论域中诸对象的名称、定 义及相互关系”。 目前被大部分人公认的定义是t o mg r u b e r 在1 9 9 4 年提出的旧:“本体是关 于共享概念的一致约定。共享概念包括用来对领域知识进行建模的概念框架、需 第2 页 国防科学技术大学研究生院硕士学位论文 要互操作的主体之阃用于交互的与内容相关的协议,和用于表示特定领域的理论 的共同约定。在知识共享的情况下,本体的形式特化为具有代表性的词汇的定义。 一种最简单的形式是一种层次结构,用来详细描述类和它们之间的包含关系。关 系数据库的框架( s c h e m a t a ) 也是一种本体,它用来描述能共享的数据库之间的关 系和集成这些数据库需遵循的约束”。 尽管定义的方式不同,但从内涵上来看,不同研究者对于本体的认识是统一 的,本体的概念有下面四层含义l l 习: ( 1 ) 概念化( c o n c e p t u a l i z a t i o n ) :通过抽象出客观世界中一些现象 ( p h e n o m e n o n ) 的相关概念而得到的模型,其表示的含义独立于具体的环境状态。 ( 2 ) 形式化( f o r m a l ) :有精确的数学描述,是计算机可读的。 ( 3 ) 明确( e x p l i c i t ) :概念与概念之间的联系及使用这些概念的约束都被明 确定义。 ( 4 ) 共享( s h a r e ) :本体中体现的是共同认可的知识,反映的是相关领域中 公认的概念集,它所针对的是团体而不是个体。 总之,本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解, 确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇( 术 语) 和词汇之间相互关系的明确定义。本体既包括一个领域内的知识也包括各种 领域之间的知识。人类、数据库和应用软件使用本体来共享领域知识。 1 2 - 2 本体基本构成 从知识工程角度,我们把本体形式地表示为如下形式: 定义1 1 ( 本体结构) 本体的逻辑结构可以看成个五元组,d := 伽,4 刃, 其中: c :概念。本体中的概念是广义上的概念,它除了包括一般意义上的概念如“武 器”、“指挥机构”、“导弹”等外,还包括任务、功能、行为、策略、推理过 程等等。本体中的这些概念通常按照一定的关系形成一个层次结构。例如,按照 “s u b c l a s s o f 关系,本体中的概念形成一个分类层次结构。在复杂的本体中,概 念还包括更详细的描述,即概念的定义、性质等描述。 r :概念之间的关系,表示概念之间的一类关联。如概念之间的“s u b c l a s s o f ” 关系、“p a r t - o f ”关系等。一般情况下,可以用关系r :c l x q x c n 表示概念 c 卜c 2 、g 之间存在的n 元关系r 。一般地,本体中概念之间至少存在以下 三类二元关系;继承关系、聚合关系、关联关系,概念和概念中属性之间的关系 也是一种关系,称为属性关系。 f :函数。是一种特殊的关系,其中第n 个元素c n 相对于前面n 1 个元素是唯 第3 页 国防科学技术大学研究生院硕士学位论文 一确定的。函数可以用如下形式表示,:c l c 2 x c 0 一c n 。例如,部队装备 库存量、携运行量可以唯一地确定部队装备的现有数。 4 :概念或者概念之间的关系所满足的公理,是一些永真式。例如,部队装备 的完好数肯定不会超过现有数。 为领域内概念实例的集合。其中,f :卜c 为概念实例到所属相应概念的 映射,概念的实例具有所属概念定义的属性。 1 2 3 本体的描述语言 本体的描述语言使得用户为领域模型编写清晰的、形式化的概念描述,一般 要具有丰富而直观的表达能力,用此语言表示的本体要能方便地被计算机理解、 处理和应用。因此它应该满足以下要求l “】: ( 1 ) 良好定义的语法( aw e l l d c f i n e ds y n t a x ) ; ( 2 ) 良好定义的语义( aw e l l - d e f i n e ds e m a n t i c s ) ; ( 3 ) 有效的推理支持( e f f i c i e n tr e a s o n i n gs u p p o r t ) ; ( 4 ) 充分的表达能力( s u f f i c i e n te x p r e s s i v ep o w e r ) ; ( 5 ) 表达的方便性( c o n v e n i e n c eo f e x p r e s s i o n ) 。 当前的本体描述语言基本可以分为三大类:基于谓词逻辑的本体表示语言、 基于w e b 的本体表示语言、基于图的本体表示语言。 ( 1 ) 基于谓词逻辑的本体表示语言:开始使用的本体表示语言多数基于框架 模型和谓词逻辑,现在的本体表示语言在此基础上多数采用了x m l 语法。比较有 代表性的基于谓词逻辑的本体表示语言如下: k i f ( k n o w l e d g ei n t e r c h a n g ef o r m a t ) ”j :s t a n f o r d 大学人工智能实验室专家 在研究本体时,提出了一种基于谓词演算的形式化语言,它重点研究语言的表达 能力,主要功能包括对象、函数、和关系的定义,它允许元级知识和非单调推理 规则的表示,并基于一阶谓词逻辑,具有描述性语义,为采用不同知识表示方式 的计算机程序之间的通讯搭建了桥梁。 o n t o l i n g u a ! 1 6 】:以k i f 为其核心语言,定义本体框架作为知识表示的基础。 该语言支持三种本体定义形式:k i f 表示;仅使用f r a m eo n t o l i n g u a 的词汇库;同 时使用上述两种表示方法。无论采用哪种表示方法,o n t o l i n g u a 都包括3 个组成部 分:定义头部分、用自然语言描述的非形式化定义部分、用k i f 或者f r a m e o n t o l i n g u a 定义的转换器。这些o n t o l i n g u a 转换器可将由o n t o l i n g u a 表示的本体转 换为l o o m 等目标语言。 c y c l 】:c y c 系统的描述语言,本质上讲,c y c l 是一阶逻辑语言。但是, 为了增强知识表示的灵活性,c y c l 在一阶逻辑的基础上增加了缺省知识的表示、 第4 页 国防科学技术大学研究生院硕士学位论文 等价推理、二阶谓词等,具备二阶谓词演算的能力;其语言环境中配有功能很强 的可进行推理的推理机。 l 0 0 m 【1 8 】:一种基于阶谓词逻辑的知识表示语言,由美国南加州大学信息 科学学院设计并实现。l o o m 提供了明确定义而且表达力强的模型描述语言,能描 述定义、规则、事实和缺省规则等;提供了有效的推理机制,能利用向前推理、 语义一致化和面向对象的真值维护等技术实现推理;提供了编程范例如逻辑范例、 产生式规则范例和面向对象范例等,并能方便地把范例集成到应用中。l o o m 还提 供了知识库服务功能以方便用户对知识库的操作和维护。目前南加州大学又推出 了l o o m 的第二代p o w e r - l o o m 。 f 1 0 9 i c ( f r a m el o g i c ) 1 1 9 :集成了基于框架的语言和一阶谓词演算,特点在 于知识表示和推理两个方面。在知识表示方面,f i c ,g i e 支持简单和复杂的对象定 义,支持继承定义、多态类型、封装等。在演绎推理方面,f ,l o g i c 同时支持谓词 演算和结构以及行为继承。 ( 2 ) 基于w e b 的语言系列:随着w e b 的发展,又出现了一系列基于w e b 的 本体语言,也叫做本体标记语言,如s h o e 、x o l 、r d f 、r d f s 、o i l 、d a m l 、 d a m l + o i l 、o w l 。 s h o e 1 】( s i m p l eh t m lo n t o l o g ye x t e n s i o n s ) 作为h t m l 的扩展,是马里 兰大学开发的。它是基于框架和规则的,它使用不同于h t m l 的一些标记,使得 可以在h t m l 文档中插入本体。当x m l 产生并成为w e b 上交换信息的标准后, s h o e 的语法被修改为基于x m l 。目前,马里兰大学已经停止研究s h o e ,他们 有关本体的研究项目开始使用o w l 和d a m l + o i l 作为本体的描述语言。 x o l 【l 】( o n t o l o g ye x c h a n g el a n g u a g e ) 是s r ii n t e r n a t i o n a l 的人工智能中心 ( a i c ) 开发的。它是一种简单通用的定义本体的方法。其目的是在不同的数据库、 本体开发工具、或者其他应用程序之间交换本体。x o l 设计之初是为生物信息学 领域本体的交换,但是它可以应用于各种领域。 r d f 1 1 ( 资源描述框架,r e s o u r c ed e s c r i p t i o nf r a m e w o r k ) 、r d f s ( r d f s c h e m a ) ,是w 3 c 在x m l 的基础上推荐的一种标准,用于表示任何的资源信息。 r d f 提出了一个简单的模型用来表示任意类型的数据。这个数据类型由节点和节 点之间带有标记的连接弧组成。节点用来表示w e b 上的资源,弧用来表示这些资 源的属性。因此,这个数据模型可以方便的描述对象( 或者资源) 以及它们之间 的关系。r d f 的数据模型实质上是一种二元关系的表达,由于任何复杂的关系部 可以分解为多个简单的二元关系,因此r d f 的数据模型可以作为其他任何复杂关 系模型的基础模型。r d fs c h e m a 为r d f 资源的属性和类型提供定义良好的词汇 表。w 3 c 推荐以r d f r d f s 标准来解决x m l 的语义局限。 第5 页 国防科学技术大学研究生院硕七学位论文 o i l 2 0 】( 本体推理层本体交换语言,o n t o l o g yi n f e r e n c el a y e r o n t o l o g y i n t e r c h a n g el a n g u a g e ) 是在欧洲的i s t 项目o n - t o - k n o w l e d g e 中开发的。o i l 以 r d fs c h e m a 为起点,用更为丰富的o n t o l o g y 建模原语对r d fs c h e m a 进行扩充。 o i l 将框架系统、描述逻辑和w e b 标准( x m l 和r d f ) 这三个不同领域的优点 结合起来,提供了一种通用的语义w e b 的标记语言。其中,基于框架的语言在a i 中有很长的历史,它们的中心建模元语是类( 称为框架) 和属性( 称为槽) 。描 述逻辑( d l ) 通过概念( 对应于类或者框架) 和角色( 对应于槽) 描述知识,具 有良好的语义和有效的推理。o i l 的使用比较广泛,支持o i l 的工具也很多,最 著名的有o i l e d 。是一个基于o i l 的本体编辑器。其他一些工具,比如o n t o e d i t 、 t h ef a c t ( f a s tc l a s s i f i c a t i o no f t e r m i n o l o g i e s ) s y s t e m 等也都支持0 i l 。 d a m l t l 】( d a r p aa g e n tm a r k u pl a n g u a g e ) 是d a r p a 计划第一阶段所创 建的一种语言。d a r p a ( a g e n tm a r k u pl a n g u a g e ) 项目始于2 0 0 0 年8 月,由美 国政府支持,目标是开发一种语言和一组工具,为语义w e b 提供支持。m a r k g t c a v e s 是该项目的领导者。d a m l 形成于d a m l o n t ( 一种本体语言) 和d a m l - l o g i c ( 一种表达公理和规则的语言) 。d a m l 扩展了r d f ,增加了更多更复杂的类、 属性等定义。它一度很流行。成为网上很多本体的描述语言,直到d a m l 的研究 者和o i l 的研究者开始合作,推出了d a m l + o i l 语言,成为w 3 c 研究语义w e b 中本体描述语言o w l 的起点,并成为标准。 o w l 【l 】( w e b 本体语言,w e bo n t o l o g yl a n g u a g e ) 是w 3 c 推荐的本体描述 语言的标准,位于w 3 c 绘制的本体语言栈的栈顶。它是为了在w w w 上发布和 共享本体而提供的语义标记语言。o w l 是在d a m l + o i l 的基础上发展起来的, 作为r d f ( s ) 的扩展,目的是提供更多的元语以支持更加丰富的语义表达,并更好 的支持推理。 ( 3 ) 基于图的本体表示语言:基于图的表示方法是另外一种重要的本体表示 方法,它的最大特点是直观。 w o r d n e t 的语义网络【2 1 】:w o r d n e t 采用语义网络作为其词汇的表示形式, 是典型的基于图的本体表示例子。w o r d n e t 的词汇包括名词、动词、形容词、副 词和功能词。每个词( 更确切地说是词的一条意项) 是一个网络节点。节点之间 通过“同义关系”、“反义关系”、“上位关系”、“下位关系”、“部分一整 体关系”、“形态关系”等联系在一起。目前,w o r d n e t 已经分别建立了名词i 动词、形容词和副词的四个相互独立的语义网络,包括约9 5 6 0 0 个词项。 概念图( c o n c e p t u a lg r a g h s :c g ) 阱】:概念图是s o w a 提出的基于图的本体 表示方式,是c s p e i r c e 的存在图( e x i s t e n t i a lg r a p h s ) 的扩展。概念图是二分有 向图,包括“概念”和“关系”两类节点,分别称为“概念节点”和“概念关联 第6 页 国防科学技术大学研究生院硕+ 学位论文 节点”,二者之间通过由“概念关联节点”到“概念节点”的有向弧相连。概念 图中的所有概念按照“i s k i n d o f ”关系形成一个格结构。这个格的最顶层元素是 “e n t i t y ”,任何事物都是它的子类型或者实例;最底层元素是“a b s u r d i t y ( _ k ) ”, 是任何类型的子类型,而且任何事物都不是它的实例。 1 2 4 本体分类 本体的分类明确了不同本体之间的区别与联系,虽然目前尚没有统一的本体 分类方法,通常情况下,可以按照本体的开发目的、研究主体、形式化程度对本 体进行分类固j 。 ( 1 ) 根据本体的研究主题,可以分为知识表示本体、通用或者常识本体、领 域本体、语言学本体、任务本体等。 其中知识表示本体的研究重点是语言对知识的表达能力,典型的有s t a n f o r d 大学知识系统实验室提出的一种称为知识交换格式k i f ( k n o w l e d g ei n t e r c h a n g e f o r m a t ) ;通用或者常识本体关注于常识知识的使用,例如著名的c y e 工程等; 领域本体则在一个特定的领域可以重用,他们提供特定的概念定义和概念之间的 关系,提供该领域中所发生的活动以及该领域的主要理论和基本原理等,对特定 领域的本体研究和开发目前己经涉及到许多领域,包括企业本体、医学概念本体、 酶催化生物学本体等;语言学本体是指关于语言、词汇等的本体,典型的实例有 g u m ( g e n e r a l i z e du p p e rm o d e l ) 和p r i n c e t o n 大学研制的w o r d n e t 等;任务本体 主要是指可以共享的问题求解方法,这里的推理方法与领域无关,任务本体主要 涉及动态知识,而不是静态知识。任务本体的研究以c h a n d r a s k a r a n 等人的关于任 务和问题求解方法本体的研究为代表。具体的研究主题包括:通用任务、与任务 相关的体系结构、任务方法结构、推理结构和任务结构等。 ( 2 ) 根据本体表示的形式化程度不同,可以把本体分为高度非形式化的 ( h i g h l y i n f o r m a l ) 、结构非形式化的( s t r u c t u r e d - i n f o r m a l ) 、半形式化的 ( s e m i f o r m a l ) 和严格形式化的( r i g o r o u s l y f o r m a l ) 四类。其中,高度非形式化 本体完全采用自然语言来描述本体,例如爱丁堡大学企业项目中的e n t e r p r i s e o n t o l o g y 自然语言版本;结构非形式化采用受限的或结构化的自然语言表示,以 减少二义性,例如e n t e r p r i s eo n t o l o g y 的文本版本和w o r k f l o wm a n a g e m e n t c o a l i t i o n 推出的工作流术语汇编;半形式化则用人工定义的形式化语言来表示, 许多采用o n t o l i n g u a 描述的本体都属于这一类;严格形式化本体一般具有形式化 语义,并且能够在某种程度上证明“一致性”和“完整性”等属性,例如多伦多 大学虚拟企业项目的企业本体。 ( 3 ) 根据本体的研究层次,可以分为顶层本体、领域本体、任务本体和应用 第7 页 国防科学技术大学研究生院硕士学位论文 本体等。如图2 1 所示。其中,顶层本体描述的是最普通的概念及概念之问的关系, 如空间、时间、事件、行为等,它独立于具体的应用领域,因而可以在很大的范 围内共享;领域本体描述的是特定领域中的概念及概念之间的关系,如医学、企 业模拟等;任务本体描述的是特定任务或行为中的概念及概念之间的关系,领域 本体和任务本体通过特殊化顶层本体来描述一般领域、任务或活动中的概念;应 用本体描述的是依赖于特定领域及任务的概念及概念之间的关系,这些概念对应 于领域实体执行一个活动的作用,是领域和任务本体的特殊化。 图1 1 按本体研究层次划分的本体层次结构 1 3 本文主要研究内容 针对本体研究中两个关键性问题,本文将形式概念分析引入本体构建和本体 映射中,提出了基于形式概念分析的本体构建方法和本体映射方法。 本文的主要工作体现在以下几个方面: 1 本体理论和形式概念分析的研究 首先介绍了本体的基本概念,包括其定义、基本构成、描述语言、分类等; 其次介绍了形式概念分析和概念格的基本理论、概念格的构造算法:再次,分析 了形式概念分析与本体的区别和联系,介绍了二者结合的研究。 2 基于形式概念分析的本体构建方法研究 在研究本体构建的基本原则及介绍了已有的几种本体构建方法后,提出了一 种基于形式概念分析的本体构建方法d o b m ( d o m a i no n t o l o g yb u i l d i n gm e t h o d ) , 将形式概念分析引入本体的构建过程。这种本体构建方法,通过循环添加、编辑 对象( 类) 和属性构建概念格,以概念格将本体可视化,构建本体原型。可视化 的表达概念以及概念之间的关系,容易为人们所理解。 3 基于形式概念分析的本体映射方法研究 本文将f c a 技术引入到本体映射中,提出了一种基于f c a 的概念相似度计算 第8 页 国防科学技术大学研究生院硕十学位论文 方法。该方法利用辞典形成两个本体特征之间的偏序关系,建立形式背景;以此 为基础形成概念格。引入新的基于概念格的相似度计算模型,以概念格的不可约 下确界元素作为相似度计算的依据。然后将粗糙集理论引入到f c a 中,定义了f c a 中的等价关系,提出了基于粗糙概念格的相似度计算模型,解决了粗糙概念之间 的相似度计算问题。 1 4 论文组织结构 论文共分为五章: 第一章:绪论。简要介绍本文的课题背景、研究意义、本体理论的基本概念、 本文的主要研究内容和论文组织结构。 第二章:形式概念分析概述。详细介绍了形式概念分析、概念格的相关理论, 分析了形式概念分析与本体的区别和联系。 第三章:基于f c a 的本体构建方法研究。介绍本体的构建原则、方法,提出 基于形式概念分析的领域本体构建方法d o b m ( d o m a i no n t o l o g yb u i l d i n g m e t h o d ) ,并通过一个实例说明构建过程。 第四章:基于f c a 的本体映射方法。介绍本体间异构及解决方法,引出本体 映射的概念、过程和方法,将f c a 技术引入到本体映射中,提出了一种基于f c a 的概念相似度计算方法,即通过辞典建立特征之间的结构关系,并以概念格的结 构元素作为计算形式概念相似度的依据。 第五章:总结与展望。总结了本文研究工作的成果并对未来的工作做了展望。 第9 页 国防科学技术大学研究生院硕士学位论文 第二章形式概念分析概述 形式概念分析( f o r m a lc o n c e p ta n a l y s i s ,f c a ) 理论,又叫概念格理论,是 一种用数学的形式化语言来反映人形成概念的过程的集合理论模型,用来研究特 定领域可熊存在的概念的几何结构、概念格形式。 在哲学中,概念被理解为由外延和内涵两个部分所组成的思想单元。基于对 概念的这种哲学理解,德国的r w i l l e 教授于1 9 8 2 年首先提出了形式概念分析理 论洲,用于概念的发现、排序和显示。在形式概念分析理论中,概念的外延被理 解为属于这个概念的所有对象的集合,内涵被理解为所有这些对象的公共属性集 合。所有的概念连同定义在其上的层次关系共同构成了概念格,概念格是形式概 念分析理论中的核心数据结构,概念格基于二元关系,体现了概念内涵和外延的 统一,它从本质上描述了概念之间的泛化与特化关系,非常适合于发现数据中潜 在的概念。形式概念分析理论利用其相应的h a s s e 图实现了概念层次的可视化。 作为数据分析和知识处理的形式化工具,形式概念分析已经在信息检索、数 字图书馆、软件工程和知识发现等方面获得了广泛而成功的应用。在知识发现领 域,概念格可以从关系数据中构造出来,然后从概念格上可以提取各种类型的知 识,如蕴含规则、关联规则、分类规则等等;在软件工程领域,概念格可以从类 库的规范说明上构造,从而对类库结构的可视化以及类库的重构和优化提供支持; 在知识工程领域,概念格可以用于知识库的重新结构化;在信息检索方面,概念 格可以实现对信息的有机组织并过虑掉无用的信息。 2 1 形式背景,形式概念分析与概念格相关理论 定义2 1 一个形式背景( f o r m a lc o n t e x t ) 是一个三元组k = ( d ,a ,r ) ,其中d 是对象的集合,一是属性的集合,r 是d 和彳之间的一个二元关系,即,r c - o x a 。 根据定义2 2 ,一个形式背景能够用一个矩形表来表示,表的每一行是一个对 象,每一列是一个属性。若g 行m 列的交叉处是x ,则表示对象g 具有属性m , 见表2 1 所示。 表2 1 形式背景的矩形表表示
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中小学教师信息技术应用能力提升-教育APP选择与应用考核试卷
- 光伏组件边框材质耐腐蚀性考核试卷
- 2025年供应商协同管理平台应用实体零售升级能力考核试卷
- 2025年工业废气SCR脱硝催化剂性能评估考核试卷
- 2025山东省社会治安综合治理中心招聘考试笔试备考题库及答案解析
- 2025江西南昌汉代海昏侯国遗址管理局招聘国有企业正职背景调查笔试考试参考题库及答案解析
- 2025四川宜宾钲兴智造科技有限公司第四批项目制员工招聘3人笔试考试参考试题及答案解析
- 2025中国农业科学院附属小学招聘12人笔试考试备考试题及答案解析
- 2025湖南永州市蓝山县引进急需紧缺高层次专业人才20人(第二期)考试笔试模拟试题及答案解析
- 分布式光伏运维体系构建
- 2024-2025学年人教版物理九年级上学期期中测试物理模拟试卷
- 人力资源岗位招聘笔试题及解答(某大型央企)
- 【医麦客】:2023-2024类器官技术与应用发展白皮书
- DL∕T 5343-2018 110kV~750kV架空输电线路张力架线施工工艺导则
- 四川省内江市2024年中考物理试卷
- 解除冻结复议申请书
- DZ∕T 0153-2014 物化探工程测量规范(正式版)
- 莎士比亚戏剧赏析 知到智慧树网课答案
- 自动驾驶技术路径对比:模块化、端到端
- 2024年02月新疆岳普湖县引进急需人才笔试近6年高频考题难、易错点荟萃答案带详解附后
- 马克思主义哲学原理课件
评论
0/150
提交评论