已阅读5页,还剩48页未读, 继续免费阅读
(管理科学与工程专业论文)基于本体的面向对象数据库模型研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于本体的面向对象数据库模型研究 摘要 随着信息产业的高速发展,信息来源在不断的产生与变化,形成了大量分 布的数据集。如何将这些数据加以有效的利用,是当前信息领域急需解决的问 题。数据库是管理数据的一种有效方式,然而传统的关系数据库的局限性已无 法满足目前的信息需求,包括不能表达对象、不能关联对象和行为、不能理解 数据语义等。本文根据面向对象数据库能表达复杂对象和本体方法能描述数据 语义,针对目前数据库系统不能有效处理分布的不断变化的海量数据问题,提 出了一种基于本体的面向对象数据库模型。 本文首先对本体理论和方法进行了深入的讨论,阐述了本体的基本概念、 描述语言、建模方法以及本体的映射和进化。然后对面向对象数据库技术进行 了详细的分析与介绍,将本体建模方法应用到面向对象数据库模型的建立上, 提出了对象数据库访问的应用、语义和数据三层结构,详细的阐述了语义层的 本体库管理、对象数据库管理和本体学习。在文章的最后讨论了基于本体的数 据集成,在对现有数据集成技术进行深入分析的基础上,提出了一种通过本体 学习修正本体映射结果的数据集成方法。 关键词:本体;面向对象;数据库;数据集成;语义 r e s e a r c ho no n t o l o g yb a s e do b j e c t o r i e n t e dd a t a b a s e m o d e l a b s t r a c t w i t ht h ed e v e l o p m e n to fi n f o r m a t i o nt e c h n o l o g yr a p i d l y , t h ei n f o r m a t i o n s o u r c e sg e n e r a t ea n dc h a n g ec o n s t a n t l y ,a n dh a v ec r e a t e dm a s s i v ed i s t r i b u t i o no f d a t as e t s h o wt ou s e t h e s ed a t a e f f e c t i v e l y , i t i s u r g e n t t ob es o l v e di n i n f o r m a t i o nf i e l d d a t a b a s ei sa ne f f e c t i v ew a yo fd a t am a n a g e m e n t ,h o w e v e r ,t h e l i m i t a t i o no ft h et r a d i t i o n a lr e l a t i v ed a t a b a s eh a sb e e nu n a b l et os a t i s f yt h ed e m a n d o fc u r r e n ti n f o r m a t i o n ,s u c ha se x p r e s s i n go b j e c t ,r e l a t i n go b j e c tw i t hb e h a v i o r , u n d e r s t a n d i n gd a t as e m a n t i c s ,e t c b a s e do nt h eo b j e c t - o r i e n t e dd a t a b a s e c a n e x p r e s sc o m p l e xo b j e c ta n do n t o l o g yc a ne x p r e s sd a t as e m a n t i c s ,i nv i e wo ft h e c u r r e n td a t a b a s es y s t e mc a nn o th a n d l em a s s i v ed i s t r i b u t e dd a t a e f f e c t i v e l y , w e p r e s e n tad a t a b a s em o d e lt h a tb a s e d0 1 1t h eo n t o l o g ya n do b j c o t o r i e n t e dm e t h o d a tt h eb e g i n n i n go ft h i sp a p e r , w eh a v ea ni n - d e p t hd i s c u s s i o no fo n t o l o g y t h e o r ya n dm e t h o d ,a n de x p l a i nb a s i cc o n c e p t so fo n t o l o g y , d e s c r i p t i o nl a n g u a g e , m o d e lb u i l d i n gm e t h o d ,m a p p i n ga n de v o l u t i o n t h e ne x p l a i na n di n t r o d u c et h e o b j c o t o r i e n t e dd a t a b a s et e c h n o l o g yi nd e t a i l ,a n da p p l yo n t o l o g yt oo b j e c t o r i e n t e d d a t a b a s es y s t e mm o d e lb u i l d i n g ,a n d p r e s e n t at h r e e l a y e rs t r u c t u r ef o rt h e o b j e c t o r i e n t e d d a t a b a s ea c c e s s i n g ,w h i c hi n c l u d e sa p p l i c a t i o nl a y e r , s e m a n t i c l a y e r , a n dd a t al a y e r w ed e s c r i b et h eo n t o l o g yd a t a b a s em a n a g e m e n t , o b j e c t o r i e n t e dd a t a b a s em a n a g e m e n ta n do n t o l o g yl e a r n i n gi ns e m a n t i cl a y e ri n d e t a i l a tt h ee n do ft h i sp a p e r ,w ed i s c u s sad a t ai n t e g r a t i o nm e t h o db a s e do n o n t o l o g y o nt h eb a s i so ft h ee x i s t i n gd a t ai n t e g r a t i o nt e c h n o l o g i e sf o ri n d e p t h a n a l y s i s ,w ep r e s e n tad a t ai n t e g r a t i o nm e t h o dt h a tu s i n go n t o l o g yl e a r n i n gt o c o r r e c tt h er e s u l to ft h eo n t o l o g ym a p p i n g k e yw o r d s :o n t o l o g y ;o b j e c t o r i e n t e d ;d a t a b a s e ;d a t ai n t e g r a t i o n ;s e m a n t i c i i 图2 - 1 图2 2 图3 1 图3 2 图3 3 图3 4 图3 5 图3 6 图3 - 7 图3 8 图4 1 图4 2 图4 3 图4 4 图4 5 图4 6 插图清单 语义w e b 体系结构图 本体映射示例 对象关系表达示例 一1 3 基于本体的对象数据库模型基本结构图1 8 本体库管理结构图。 客户经纪人系统e r 图 客户经纪人系统本体模型 对象存储页面结构 语义网络示例。 本体学习结构图 2 l 2 2 一2 7 f d b s 的数据集成3 5 数据仓库法的数据集成 w r a p p e r m e d i a t o r 数据集成 基于本体的数据集成框架 数据集成前的原本体模型。4 0 数据集成后的结果本体模型 v l 表4 1 表4 2 表4 3 表格清单 概念相似度表4 0 员工( 职工) 和部门之间关系相似度表。 员工( 职工) 属性相似度表 4 1 4 1 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所 知,除了文中特别加以标志和致谢的缝方乡 ,论文中不包含其他入已经发表或撰写过的研究成果, 也不包含为获得金日b 兰些太堂 或其他教育机构的学位或证书而使用过的材料。与我一同工作 的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签字:冶叫签字日期:汐6 7 年f 月少日 学位论文版权使用授权书 本学位论文作者完全了解金g g 至些太堂有关保留、使用学位论文的规定有权保留并向 国家有关部门或机构送交论文的复日j 件和磁盘,允许论文被查圈或借阅。本人授权金筵王些态 :l 可以将学位论文的全部或部分论文内容编入有关数据库进行检索,可以采用影印、缩印或扫 描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位做者魏l 钞剐 签字日期:汐啦钿f 7 日 学位论文作者毕业后去向: 工作单位: 导师魏幻秀玩 签字日期9 7 年 膏宇日 电话: 邮编 致谢 本论文是在我的导师毛学岷副教授的悉心指导下完成的。他渊博的科学知 识、严谨的治学态度、一丝不苟的工作作风和精益求精的科研精神,一直是我 学习中的楷模和榜样,都深深地感染和激励着我。三年来,毛老师在学业上给 了我无微不至的关心和帮助,从课题选择到论文的最终完成,毛老师都始终给 予我细心的指导和不懈的支持。在这里,谨向毛老师致以衷心的感谢和崇高的 敬意。 在此,感谢倪志伟等其他老师,正是由于各位老师的全力指导,才能使我 克服许多困难和疑惑,从而顺利完成论文的写作。各位老师渊博的知识、严谨 求实的态度、一丝不苟的作风、永远追求卓越的精神为我树立了一个榜样,是 我终身学习的典范。 同时,感谢参加我论文审阅和答辩的各位老师,感谢他们在百忙之中帮助 我完成论文的最后一个过程,这是我莫大的荣幸! 我还要感谢传授我知识的老师和三年同窗的同学们,他们在学习上、工作 上给我不断的支持和鼓励,让我顺利完成了学业。在这里,请接受我诚挚的谢 意! 由于本人水平有限,文中疏漏和错误难免,敬请各位专家批评指证! m 作者:张兄利 2 0 0 7 年5 月2 0 日 第一章绪论 1 1 选题背景及意义 数据库技术从诞生到现在,在不到半个世纪的时间里,形成了坚实的理论 基础、成熟的商业产品和广泛的应用领域。当前,关系数据库已成为世界上最 大的数据源之一。然而随着信息的本质和来源在不断变化,大量复杂的数据集 的数据存储、组织、管理和访问带来的问题,使关系数据库的局限性己日益明 显。关系数据库不能表示客观事物对象、缺少对复杂数据表达、对象不能和行 为关联、不能准确的表达和理解语义等【1 1 。面向对象数据库是面向对象方法和 数据库技术相结合的产物,利用它能处理海量和复杂数据的特征,可以弥补传 统数据库系统的诸多不足,已在人工智能、g i s 、软件工程和数据挖掘等诸多 领域得到了应用。然而目前的面向对象数据库模型对客观事物对象语义的描述 和语义冲突的处理仍显不足。 本体作为一种能在语义和知识层次上描述信息系统概念模型的建模工具【4 1 , 在信息科学中,已经被广泛应用于知识工程、自然语言处理、协同数据处理、 智能信息集成和知识管理等领域中。本体是一种对信息按照一定的规范进行描 述的建模方法,是对需求和资源的概念说明。它有效的将大量复杂的数据、知 识等资源进行管理,并让计算机能对这些信息进行表达和处理,为科学研究和 工程应用提供有效的信息和知识。将本体与面向对象技术相结合,实现一种基 于本体的面向对象数据库模型,能够解决当前数据库技术中遇到的一些问题, 如大量信息的集成、数据库的语义理解等。 1 2 国内外研究现状 自上个世纪8 0 年代以来,数据库技术一直是计算机科学技术中发展最快、 应用最广泛的重要分支之一,已成为计算机信息系统的重要技术基础和支柱。 以关系数据库为代表的传统数据库系统,对结构化数据的应用有明显的优势, 主要应用于商务领域,如财务管理、人事管理等。然而,随着信息产业和互联 网的迅猛发展,新的数据库应用不断产生,如万维网、计算机集成制造、电子 商务等等。在这种不断提高的应用需求下,以关系数据库为代表的传统数据库 系统的局限性日益明显。 9 0 年代以来,不同领域的应用提出了许多新的数据管理需求,传统数据库 技术遇到了巨大的挑战。数据库技术不断与多学科技术有机结合。数据库系统 结构也由主机终端的集中式结构发展到网络环境的分布式结构,随后又发展成 多层的客户,服务器结构、浏览器服务器结构等。多种数据库结构并存,以满 足不同应用需求,适应不同的应用环境。同时,数据库应用环境也正在发生巨 大的变化,w e b 上的应用需求向数据库技术提出了前所未有的挑战,对半结构 化和无结构数据模型的描述、管理、查询和安全控制等问题的研究已成为新的 研究课题。信息管理内容的不断扩展和新技术的层出不穷,信息的本质和来源 在不断变化,在互联网上,特别是物理科学、生物科学和工程领域等自然科学 领域,产生了大量复杂的数据集,需要比现有的数据库系统更高级的技术支持。 这些领域同样也需要信息集成机制的支持。在过去的几十年里,w e b 搜索引擎 导致了信息检索的商品化,并需要和传统的数据库查询技术集成,数据挖掘已 经成为数据库系统重要的一个组成部分。许多人工智能领域的研究成果和数据 库技术融合起来,这些新的技术使得我们可以处理语音、自然语言,进行不确 定性推理和机器学习等。l l j 如何克服传统数据库技术的不足并适应新的信息需求呢? 归纳起来主要有两 种思路:一是对关系数据库进行改造,如并行数据库技术、分布式数据库系统等; 二是采用新的数据模型,如面向对象数据模型、演绎数据库技术等。根据这两 种思路衍生出的新一代的数据库管理系统主要有:扩展关系数据库系统、面向 对象的数据库系统、分布式数据库系统、并行数据库系统、专家数据库系统、 数据仓库等。其中,面向对象数据库近1 0 几年来一直是数据库学术界和信息业 研究的热点之一。 面向对象数据库是其行为和状态以及关系都是根据面向对象数据模型定义 的对象的汇集1 1 6 】。面向对象的概念已经包括了传统数据库语言中的某些数据模 型概念,比如类、对象的聚簇、类型的泛化等。面向对象的概念是面向对象数 据库系统数据建模的坚实基础。面向对象数据库系统为定义和操作对象的联系 提供了用户接口,应用程序员和用户无需显式地关心这些概念。面向对象数据 模型能够有效地表示复杂对象,有效地实现对现实世界客观事物的表达和描述。 2 0 世纪8 0 年代以来,许多研究机构都在进行面向对象数据库系统的研究工 作。2 0 世纪9 0 年代至今,经历了十几年的发展,已经出现了一系列的面向对 象数据库系统原型系统和商品化系统,如g e m s t o n e 、o n t o s 、0 2 、i t a s c a 等1 1 6 j 。 g e m s t o n e 系统是美国s e r v i ol o g i c 公司研发的,是最早进入商品化的面向对象 数据库系统之一。o n t o s 系统是美国o n t o l o g i c 公司用c + + 语言开发的,采用多 c s 体系结构,每个客户进程处理一个逻辑数据库。0 2 是法国a i t a i r 公司研制 开发的,其设计且标是集成面向对象程序技术和数据库技术,支持c a m 、c a d 等高级应用。i t a s c a 系统是i t a s c a 公司在o r i o n 系统基础上研发的商业化系统, 采用基于对象服务器的多服务器多客户的分布式体系结构,支持长事务,支持 复合对象和版本管理。 面向对象数据库最早的应用于计算机辅助设计( c a d ) 领域。在采用面向 对象数据库之前,c a d 领域中的大量的数据对象存储于关系数据库中,设计的 对象被分解为记录或元组,当检索对象时,需要读取很多记录或元组,并在内 2 存中将它们重新组合成对象。这样,明显影响了c a d 系统的查询性能,采用 面向对象库之后,系统性能便提高了。近1 0 年来,面向对象数据库在c i m s 、 c a s e 、多媒体应用、地理信息系统等领域中得到了广泛的应用。 本体最初是一个哲学的概念,自2 0 世纪9 0 年代以来,本体方法被计算机领 域关注,并将其应用到知识共享、信息集成和语义w e b 等领域的知识表示,逐 渐成为研究热点。本体自身是一个广泛的概念,包括本体方法论,本体映射、 本体进化、本体学习等各个方面的研究。同时本体也被应用到很多科学领域, 尤其涉及到知识表示的研究领域。这些研究领域包括人工智能、知识工程、信 息检索、数据集成和语义w e b 等。 国内外很多著名学者在对大型本体工程进行深入研究和分析的基础上,总结 出了几种本体建模方法,如美国空军的i d e f 5 法、t o v eo n t o l o g yp r o j e c t 中 提出来的企业建模法、m i k eu s h o l d 和m i c h e a lg r u n i n g e r 提出来的骨架法和 m a r i a n of e r n a n d e z 和g o m e z p e r e z 等人在马德里大学开发人工智能图书馆 时提出来的m e t h o n t o l o g y 方法等。 本体映射是实现不同本体之间知识共享和重用。本体映射的发展在一些本体 工程中和著名本体映射研究中被体现出【2 2 l 。如i n f o s l e u t h 的参考本体、斯坦福 大学的本体代数、a i f b 的形式概念分析、e c a l 2 0 0 0 的方法、i s l 的o n t o m o r p h 、k r a f t 的本体聚类、h o v y e ( 1 9 9 8 ) 的启发式规则、c h i m a e r a 系统( m c o u i n n e s s 等,2 0 0 0 ) 本体词的合并、b o r s t a k k e r m a n s ( 1 9 9 7 ) 实体和应用的区分等。 很多数据集成工程中,本体映射方法都在直接或间接的被使用。最初的异构 数据库集成的研究主要是针对跨多个自治数据库模式和解决异构数据冲突,为数据源 的集成提供一个全局模式。这些研究成果暗含了本体映射和合并的方法。后来s h e t h 、 l a r s o n ( 1 9 9 0 ) 和b a t i n i ( 1 9 8 6 ) 等提出了结构集成的概念,并给了相关定义。2 0 0 0 年f a l o p o l i 等提出两种技术来集成和抽取数据库模式,将异构模式抽取成一个全局模 式和把一个模式分出相似的簇,这两种技术都假定描述语义的本体集合都存在于模式 中。 在国外,目前本体应用在信息检索中的著名项目包括基于网络代理搜索本体 的本体、基于本体的分布式半结构化信息获取和升级知识合成。最值得关注的 是s k c ,它是斯坦福大学正在进行的一个项目,主要研究如何利用代数学方法 合成不同领域的本体,目标是解决信息系统语义异构的问题,实现异构系统间 的互操作。国内关于本体论的研究整体上处于起步阶段,目前主要集中在知识 工程、信息管理和语义w e b 三个方面,绝大多数是本体工程方面的研究,比较 有名的通用本体构建研究包括中科院计算技术研究所的大规模知识系统研究和 中科院数学研究所的常识知识库研究。 本体的应用既增强了数据库模式的语义表达,又简化了语义冲突的化解过 程,为建立快速准确的数据源索引提供了便利。在本体论基础上建立的模型能 够确保建立一个完整的,能够理解数据语义的数据库模式。 1 3 本文的结构和内容安排 本文首先对本体进行概述,在这个基础上详细的介绍了本体建模方法,并 将本体和面向对象数据库相结合,提出了一种基于本体建模的面向对象数据库 系统模型,最后探讨了基于本体的异构数据集成。本文的内容安排如下: 第一章综述了本体理论、建模方法和应用,介绍了面向对象数据库的基本 特点和发展,分析了当前数据库面临的问题,并在此基础上,提出了面向数据 库系统的本体建模的可行性。 第二章对本体理论和方法进行了详细的讨论,阐述了本体的基本概念、描 述语言、建模方法以及本体的映射和进化。 第三章对面向对象数据库进行了详细的分析,并且将本体建模方法应用到 面向对象数据库系统模型的建立上,提出了对象数据库访问的应用、语义和数 据三层结构,实现了基于本体的对象数据模型的创建、数据语义的描述、对象 数据结构的定义、对象存储管理和查询处理等。在最后总结了本体学习的意义, 提出了基于语义网络和公理语义的本体学习方法。 第四章探讨了基于本体的数据集成。首先对数据集成概念和数据集成方法 进行深入的研究和讨论,最后提出了一种改进的基于本体的数据集成方法。该 方法利用本体映射理论确定概念关系,同时利用本体学习修正映射结果,从而 达到数据的结构和语义上的一致,避免了异构数据集成时出现结构冲突和语义 冲突。 第五章主要对本文的研究结果进行了总结,并且对以后关于基于本体的数 据库系统建模进一步的研究提出了一些个人的意见。 4 第二章本体相关知识 2 1 本体概述 本体最早是一个哲学概念,是对客观存在的一种解释,描述客观事物的本 质 5 1 。近十多年来,本体的研究远远超过了哲学的范畴,在信息技术、知识工 程及人工智能等领域都有着广泛的应用。尤其是近些年来在w e b 上的应用,试 图解决w e b 信息共享中的语义问题,给语义w e b 的发展带来了无限的前景。 在人工智能和知识工程等领域,本体是一种概念层次上的建模工具,是对特定 领域应用本体方法分析、建模,即把现实世界中的某个领域抽象为一组概念及 概念之间的关系,本体的目标是捕获相关领域的知识,提供对该领域知识的共 同理解,并给出这些知识的概念和关系的说明。本体的建模方法已被广泛用于 知识工程,信息检索和数据库。 2 1 1 本体的定义 本体在不断的发展和完善过程中,也出现了一系列不同的定义,具有代表 性的有【4 】: 1 9 9 1 年,n e c h e s ,f i k e s 等人将本体定义为“给出构成相关领域词汇的基本 术语和关系,以及利用这些术语和关系构成的规定这些词汇外延规则的定义” 2 5 1 。 1 9 9 3 年,g r u b e r 给出定义“本体是对概念化体系的规范说明”【1 4 l 。 b o r s t 在g r u b e r 定义的基础上,给出了另外一种定义:“共享概念模型的形 式化规范说明”【2 扪。 s t u d e r 等深入地分析和研究了g r u b e r 和b o r s t 的定义,最后给出本体定义 “本体是共享概念模型的明确的形式化规范说明”【”。并指出,本体具有概念 模型、明确、形式化和共享四层含义。概念模型是指一些模型可以通过抽象出 客观事物的相关概念两得到;明确是指使用这些概念时所用到的束缚和限制等: 形式化指本体应当能够被计算机识别和处理;共享是被普遍认可的概念集合。 n i c o l ag u a r i n o 把形式化定义为:c = c d ,w ,r 其中d 是一个领域,w 是 该领域中相关概念的集合,r 是领域空间中概念之间关系的集合,本体论是采 用某种语言对一个领域概念化的描述【8 】。 2 1 2 本体的分类 g u a r i n o 提出了以详细程度和领域依赖度两个角度来对本体进行划分。其 中,详细程度是指描述建模对象的程度,按程度高低将本体分为参考和共享两 个类别。领域依赖程度分类指将本体和其建模领域之间的从抽象到具体的一种 依赖关系的紧密度来划分的。有以下几个类别的划分1 8 】: ( 1 ) 顶级。描述的是一般性的概念及概念之间的关系,与具体的领域和应 用无关。 5 ( 2 ) 领域。描述的是特定领域中的概念及概念之间的关系。 ( 3 ) 任务。描述的是特定任务或行为中的概念及概念之间的关系。 ( 4 ) 应用。描述的是依赖于领域或任务的概念及概念之间的关系 1 9 9 9 年p e r e z 和b e n i a m i n s 在对本体的分类进行了深入研究的基础上,归纳 出1 0 种本体:知识表示o n t o l o g i e s 、普通o n t o l o g i e s 、顶级o n t o l o g i e s 、元( 核 心) o n t o l o g i e s 、领域o n t o l o g i e s 、语言o n t o l o g i e s 、任务o n t o l o g i e s 、领域一任 务o n t o l o g i e s 、方法o n t o l o g i e s 和应用o n t o l o g i e s 。这1 0 种本体之间有交叉。 层次不够清晰1 6 j 。 2 1 3 本体应用 本体在计算机领域中的应用很广泛,渗透了人工智能、语义网、信息管理 和知识工程等各个相关领域,具体来说,有以下应用: ( 1 ) 知识工程。在知识工程领域,知识工程师通过分析本体中的概念、实 例、关系以及公理规则等基本理论,建立了领域内的知识模型。在这种模型上, 知识用本体表示,并建立相应的知识库,包括语言知识库,领域知识库和专家 知识库等。本体在知识工程领域的应用,解决了知识共享等问题,实现了知识 的有效重用。 ( 2 ) 信息检索。目前互联网上存在着海量的数据信息,如果没有一个强语 义分析能力的理论方法,很难从这些海量的数据里面检索出有效的信息。本体 具有概念和关系的描述、以及其自身的智能推理能力,对数据语义有很强的表 达和分析能力,因而在信息检索领域中得到了广泛的应用。基于本体的信息检 索,将所需求的信息通过本体描述,并按照本体内部的规则将这些概念进行筛 选和扩充,以确定所需信息的语义,从而达到提高检索信息的查全率和查准率。 ( 3 ) 数据集成。在数据库中,异构数据源集成的问题已经出现多年。如何 解决异构数据源之间的结构冲突和语义冲突,是数据集成的一个重要问题。本 体映射是在已建立的本体上,重用已存在的本体,为已存在的和新的系统之间 的交流时提供通用的接口和共同的理解。通过本体的映射与合并,能够很好的 解决数据源之间的结构冲突和语义冲突,从而能够很好的实现异构数据源的数 据集成。 2 2 本体描述语言 本体研究自上个世纪9 0 年代以来,和近些年来本体在w e b 上的应用,出现 了一系列的本体描述语言,如k i f 、o n t o l i n g u a 、c y c l 、l o o m 、o w l 等。 2 2 1k i f k i f l j l j ( k n o w l e d g ei n t e r c h a n g ef o r m a t ) 是由斯坦福大学提出的一种标准, 是一种基于一阶逻辑的形式语言,用于不同计算机程序之间的知识交换。在一 个计算机系统内部作为知识的表现形式,在不同的计算机系统之间交换知识的 时候,将各自的内部表现形式转换为k i f 交互知识,交互后再转换成各自的内 部形式。和其他计算机语言一样,k i f 语言的基本内容包括对象、关系和函数 等,对象可以是常量和变量,关系和函数对应着阶逻辑中的谓词。k i f 被广 泛应用于专家系统、知识工程和数据库等领域,主要起到了两种系统之间的信 息交互和沟通的作用。 2 2 2 o n t o l i n g u a o n t o l i n g u a l 3 4 1 是一种基于k i f 的提供统一的规范格式来构建o n t o l o g y 的语 言。它允许用k i f 定义类、关系和对象,并能将这些定义转换为特定系统的语 言来描述。它为创建和维护本体提供了统一的、一般性的、计算机可读的方式。 并且由其创建的本体可以很容易地转换到各种知识领域和信息系统,从而将本 体的维护与特定领域分离。 2 2 3 c y c l c y c l 3 5 】语言是c y c 系统采用的知识描述语言。其语法是通过一阶谓词演算 的形式描述语言。词汇表包括语义常量、非原子项、变量、数字和字符串。描 述信息时,将这些项合并成有一定意义的表达式,从而形成有意义的封闭予句, 而c y c l 的子句集则构成知识库。另外,它在一阶谓词演算的基础上扩充了等 价推理、缺省推理等功能,并同时具备一些二阶谓词演算的能力。 2 2 ,4 l o o m l o o m 3 6 】是o n t o s a u r u s 的描述语言,一种基于一阶谓词逻辑的高级编程语言, 是一种基于d l 的框架式语言,属于逻辑描述体系。它提供规范说明语言,提 供多种编程风格和知识表示服务,并且具有强大的演绎推理能力。然而它在二 阶谓词的表达和规则的自定义方面有所欠缺,后来发展的p o w r l o o m 语言作了 些改进。 2 2 5语义w e b 和w e b 上的本体描述语言 近些年来,随着w e b 的发展,本体论在互联网上得到了广泛的应用。为了 提高w e b 上信息检索的质量,需要实现w e b 上的资源能够被计算机所理解和 处理。基于这种考虑,1 9 9 8 年b e r n e r s l e e 首次提出了“语义w e b ”的概念, 并且在2 0 0 0 年的x m l 会议上将语义w e b 的概念引入正式的定义【”】。语义w e b 的目标是使w e b 上信息资源的语义可以被计算机理解。b e r n e r s l e e 用一个层 次结构的体系结构来描述未来语义w e b 框架,框架从底层到高层有七层,是一 个概念抽象程度的描述过程,下面是体系结构图: 7 r u l e st r u s t d a l a , p r o o f 盖 lc 。l f d a t a , l o g i c 禹 号 , o n t o l o g y 瘩 舀 r d f + r d f s c h e m a ix m l + n s + x m l s c h 哪a fu n i c o d eu r i 图2 一l 语义w 曲体系结构图 第一层是u n l c o d e 和u r i 。是整个语义w 曲的基础,其中u n i c o d e 处理 资源的编码,u r i 负责标识资源。 第二层是x m l + n s + x m l s c h e m a ,x m l 是可扩展标记语言,n s ( n a m e s d a c e ) 是指名字空间,x m l s c h e m a 指x m l 模式。通过x m l 、n s 和x m l s c h e m a 来 表示数据的内容和结构。 第三层是r d f + r d f s c h e m a ,r d f 是资源描述框架,是一种描述w c b 上信 息资源的形式语言。r d f s c h e m a 是r d f 模式,定义描述资源的词汇。这层用 来描述w 曲上的资源。 第四层是0 n t 0 1 0 9 y 层,用语描述各种资源的概念以及它们之间的联系。 第五、六、七层分别是逻辑层、证明层和信任层,主要用于在下面四层的 基础上实现智能推理的功能。逻辑层提供公理和推理规则,证明层提供认证功 能,信任层提供信任机制,建立信任关系。 在这七层的体系结构中,。x m l ,r d f 和o n t o l o g y 都能为信息资源提供一定 的语义。x m l 提供对资源内容的表示和资源结构信息的描述。r d f 是描述元 数据的基础,它提供一个w 曲资源元数据的标准,解决了利用x m l 对资源对 象的语义描述。而o n t o l o g y ( 本体) 则通过对概念和关系的严格定义,表达了 一种可共享的信息资源的语义,从而实现了语义层次上w c b 信息交换和共享。 为了w 曲上的信息交流,需要有一个标准语言来表示本体。目前已经出现 的语言有x m l 、x m l s c h e m a 、r d f 、r d fs c h e m a 、o w l 等。其中,o w l 能 够被用于清晰地表达客观事物概念以及这些概念之间的关系。而这种概念以及 概念之间关系的表达就称作本体。o w l 相对x m l 和r d f 拥有更多的机制来 表达语义,从而o w l 超越了x m l 和r d f 对数据语义的表达和分析能力。 o w l 【9 j 语言的文档结构包括命名空间、o n t 0 1 0 9 y 头、类定义和属性定义等 几个组成部分。 命名空间说明正在使用的特定的词汇表。一个本体的初始模块是对一系列 命名空间的声明,这些声明用以说明文档中标识符的含义。 o n t o l o g y 头开始一个本体模型的描述。其描述形式如下: 接下来可以在o n t o l o g y 头中定义一些标签标明注释、版本控制等信息。 类定义指概念的形式定义。类以关键字o w l :c l a s s 定义,包括类的声明、引 用方法和相关约束。如一个学生和人这两个概念类的定义: 属性定义描述类的属性,说明类的共同特征。有两类属性:类型属性和对 象属性。类型属性描述对象和数据类型之间的关系,如下面的描述 就是将生日和d a t e t i m e 类型联系起来。对象属性描述对象和对象之间的关系, 一般可以通过指定p r o p e r t y 的d o m a i n 和r a n g e 以及定义约束s u b p r o p e r t y 来描述 对象属性,如下面的教师和学生之间关系的属性“t e a c h ”。 2 3 本体建模方法 2 3 1 本体建模元语 p e r e z 等人用本体分类法对本体进行了深入的研究,归纳出5 个基本的建模 元语( m o d e l i n gp r i m i t i v e s ) 【5 】: ( 1 ) 概念( c o n c e p t s ) 指客观事物的抽象。它表示对象的集合,包括概念的名称,概念的描述、 概念的特征以及与其它概念间的关系等。 ( 2 ) 关系( r e l a t i o n s ) 表示概念之间的联系和相互作用,在形式上定义为n 维笛卡儿积的子集: r : c l c 2 c 。 在本体模型中,基本的关系有4 种,分别是p a r t o f 、k i n d o f 、i n s t a n c e o f 和 a t t r i b u t e o f 。p a r t o f 表示概念之间部分与整体的关系;k i n d o f 表示概念之间继 承的关系;i n s t a n c e - o f 表示实例与概念之间的关系;a t t r i b u t e o f 表示属性与概 念之间的关系。实际建模型中,概念之间的关系还包含很多具体的关系,如“教 师”和“学生”之间的“教”的关系、“公司”和“员工”之间的“工作”关系 等,这些关系在建模时需要进行自定义。 9 ( 3 ) 函数( f u n c t i o n s ) 是一种特殊的关系,该关系的前n 一1 个元素可以推导出第n 个元素。形式 化的定义为 f :c 1 c j c ,l c i 。 如p a r t o f ( ) 是一个函数,p a r t o f ( x ,y ) 表示x 是y 的一部分。 ( 4 ) 公理( a x i o m s ) 是客观事物的一个陈述,在领域中是常识性的规则,表示关于事物对象的 陈述以及对对象的确定是真还是假。 ( 5 ) 实例( i n s t a n c e s ) 代表元素。表示概念的对象。如“张三”是“人”的一个实例。 2 3 2 本体建模规则 出于对不同工程领域具体问题的考虑,构造本体的方法也各不相同,目前 还没有一个标准的本体建模方法。g r u b e r 总结了一些本体工程的建模方法,并 提出了下面的五条规则【1 3 】: ( 1 ) 明确性和客观性。本体应该用通用语言对所定义的术语给出明确、客 观的语义解释。 ( 2 ) 完全性。本体所给出的定义应当是完整的,能完全表达所描述术语的 含义。 ( 3 ) 致性。根据本体规则,由术语得出的推论与术语本身的含义是相容 的,不会产生矛盾。 ( 4 ) 最大单调可扩展性。向本体中添加术语时,不需修改已有的内容。 ( 5 ) 最,j 、承诺。对待建模对象给出尽可链少的约束。 2 3 3著名本体构建方法 本体建模的方法,国内外已经有很多著名学者在对大型本体工程进行深入 研究和分析的基础上,总结出了以下几种方法: ( 1 ) i d e f 5 方法 i d e f ( i c a md e f i n i t i o nm e t h o d ) 1 3 9 】是用于描述企业内部运作的一套建模 方法,由美国空军发明,它本来是用在制造业上的,改造后适用于一般的软件 开发。i d e f 经过了系列的发展,从i d e f 0 到i d e f l 4 ( 包括i d e f i x 在内) 共有1 6 套方法,每套方法都是通过建模来对特定类型信息的获取。其中,i d e f 5 是本体描述获取( o n t o l o g yd e s c r i p t i o nc a p t u r e ) ,它是通过图形表达来获取和 管理信息。i d e f 5 方法包括以下四个步骤: 确定领域范围,确定本体项目的目标和语境。 数据收集和数据分析。收集本体建设所需要的原始数据,并分析数据, 为抽取本体做准各。 本体的初始化。根据收集的数据和分析后结果,建立一个初步的本体。 1 0 本体的评估与确认。完善本体建设过程,并对本体的建设结果进行评估 和确认。 ( 2 ) 企业建模法 企业建模法f 4 1 】是从多伦多大学e n t e r p r i s ei n t e g r a t i o nl a b o r a t o r y 的一个项目 t o v e o n t o l o g yp r o j e c t 中提出来的,它的目标是为一些公共企业的集成建立一 个本体模型。该方法根据领域的场景激发本体的建设。它将本体能理解的一些 问题作为需求,从而根据需求实现对数据的本体建模。这个过程包括本体的形 式化描述、一阶逻辑表达的术语规则和公理的实现以及对模型的完备性检测。 ( 3 ) 骨架法 骨架法( s k e l e t a lm e t h o d o l o g y l 【4 0 】是m i k eu s h o l d 和m i c h e a lg r u n i n g e r 在英 国e d i n b u r g h 大学a i 应用研究所开发企业建模过程的e n t e r p r i s eo n t o l o g y 中提 出来的,该方法采用m i d d l e o u t 方式,只提供本体构建的指导方针。其开发过 程包括确定本体的目的范围、本体建设、本体评价和本体的归档四个步骤。其 中本体建设包括本体的捕获、编码和集成。本体归档是指将本体中的概念、关 系和规则存储到知识库中,以达到知识共享。另外,骨架法在提出之初没有自 己的本体评价方法,只是肯定了评价的作用所在。 ( 4 ) m e t h o n t o l o g y 方法【4 2 】 该方法是m a r i a n o f e r n a n d e z 和g o m e z p e r e z 等人在马德里大学开发人 工智能图书馆时使用的本体建设方法。类似于软件工程的瀑布方法,该方法的 建模方法是一种结构化方法,其基本过程如下: 规格说明书。规格说明书一般包括本体的目的、范围和术语等的说明。 知识获取。从领域中获取知识,一般可使用头脑风暴法、文本分析和知 识获取工具对知识进行获取。 概念化。将领域知识按一定本体分类方法进行概念化,并建立相应数据 模型。 集成。共享其他已存在的本体,实现知识的重用。 实现。对本体数据模型进行编码实现。 评价和文档化。在本体建设的各个阶段对本体进行评价,以确保本体的 正确性和有效性。并且在每个阶段要将相关数据和过程进行文档化,以便其他 本体的共享。 ( 5 ) 循环获取法 循环获取法( c y c l i ca c q u i s i t i o np r o c e s s ) 1 4 3 】是由a l e x a n d e rm a c d c l e 等提出 的,是一个不断重复的对本体进行评价的过程。本体建设过程包括基础本体的 选择、概念学习、概念筛选、关系学习和本体评价五个步骤。其中,本体评价 根据本体的领域特征对本体进行评价,根据评价度进行不断对概念和关系的学 习的过程。 n 2 4 本体映射与进化 2 4 1本体映射 本体的目标是为了提供知识的共享和重用,给信息交流提供通用的语义。 当不同的系统问需要交换信息时,首先要将数据的语义达成一致性。就需要实 现本体的映射。 在实际应用中,尤其是在w e b 上,大量的信息不断产生,其信息的性质也 在不断的变化,并且这些数据都分布在不同的信息源,如何对海量的信息进行 统一有效的管理,是信息相关
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年法律维护仓储托管协议
- 2025年浙江省临海市高二生物下册期末考试检测卷及一套完整答案
- 2025年江苏省句容市高二生物下册期末考试考试卷及参考答案【满分必刷】
- 2026年云南省芒市高二生物下册期末考试模拟卷及答案【基础+提升】
- 2026年山西省河津市高二生物下册期末考试模拟卷及答案(典优)
- 2026年河北省辛集市高二生物下册期末考试测试卷【达标题】附答案
- 2025年黑龙江省抚远市高二生物下册期末考试模拟卷及答案
- 2025年辽宁省庄河市高二生物下册期末考试检测卷(培优)附答案
- 2025年云南省个旧市高二生物下册期末考试考试卷(综合卷)附答案
- 2026年吉林省大安市高二生物下册期末考试模拟卷及1套参考答案
- 2026年一级建造师之一建建筑工程实务考试题库500道及答案(真题汇编)
- 杭州萧山技师学院职业教育教师招聘笔试真题2024
- 工程机械维修保养技术标准
- 人教版数学二年级上册全册教案(2022年11月修订)
- 舞蹈解剖学教学课件
- 检验科标本溢洒处理课件
- 婚恋面谈销售培训
- 舒缓焦虑的课件
- 广东省深圳市南山区2024-2025学年六年级下学期期末数学试题
- 2025年军士转业考试题库
- 部队热射病的防治
评论
0/150
提交评论