(计算机软件与理论专业论文)高校教学管理本体的建立及其语义检索研究.pdf_第1页
(计算机软件与理论专业论文)高校教学管理本体的建立及其语义检索研究.pdf_第2页
(计算机软件与理论专业论文)高校教学管理本体的建立及其语义检索研究.pdf_第3页
(计算机软件与理论专业论文)高校教学管理本体的建立及其语义检索研究.pdf_第4页
(计算机软件与理论专业论文)高校教学管理本体的建立及其语义检索研究.pdf_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

宁夏人学硕f j 学位论文摘要 摘要 由于数据缺乏语义信息及其查询处理缺乏语义支持,传统基于关键词的信息查询只能查找出 与用户查询条件在语法层上匹配的信息,而无法给出与其在语义层上具有相关性的其它信息,从 而导致信息查询结果质量低下。可用于在语义和知识层面上描述领域概念模型的本体,具有良好 的概念层次结构和对逻辑推理的支持,可以为信息查询提供较好的语义支持,来实现信息的语义 查询。 本体是语义检索的重要辅助手段,由于本体本身具有一定的推理能力,可以利用本体进行查 询扩充,从而使检索结果更加全面。本文详细的讨论了本体的概念、分类以及几种主要的本体描 述语言;对目前国内外主要的本体构建方法进行了比较研究,分析其局限性:对目前主要的几种 本体构建t 具进行了介绍,并从不同角度对其进行了评价。在此基础上,选用本体编辑工具p r o t 6 9 6 3 3 1 及本体描述语言o w l 构建了高校教学管理方面的领域本体。 以构建的高校教学管理本体为基础,提出了基于该本体的语义检索系统模型,并详细描述了 该模型的设计原理及每个模块的关键技术。通过把能描述语义信息的本体论理念及其相关技术引 入到该信息检索系统中,在一定程度上可以提高信息检索的查全率和查准率。 关键词:本体构建;语义检索;高校教学管理;p r o t 6 9 6 ;j e n a a b s t r a c t b e c a u s eo fl a c ko fs e m a n t i c sf o rd a t aa n ds e m a n t i c s u p p o r tf o r t h eq u e r yp r o c e s s i n g ,t h e k e y - w o r d - b a s e dc o n v e n t i o n a lq u e r yo n l yc a ng i v ei n f o r m a t i o nw h i c hi sm a t c h i n gt h ec o n d i t i o no f u s e f s , q u e r i e si nt h es y n t a xl a y e r ,b u tc a n tg e to t h e ri n f o r m a t i o nw h i c hi s m a t c h i n gt h ec o n d i t i o ni l lt h e s e m a n t i cl a y e r ,s ot h eq u a l i t yo fr e s u l to fi n f o r m a t i o nq u e r yi sb e c o m i n g l o w e r o n t o l o g y ,、h i c hc 觚b e u s e dt od e s c r i b et h em o d e lo fd o m a i n sc o n c p t s ,h a sg o o dh i e r a r c h i c a l s t r u c t u r eo fc 0 n c e p t s 锄d s u p p o r t sf o rl o g i c a li n f e r e n c e ,c a l lp r o v i d es e m a n t i cs u p p o r tf o ri n f o r m a t i o nq u e r y , f o ra e h i e v i n gt h e s e m a n t i ci n f o r m a t i o nq u e r y 。 o n t o l o g yi st h ea s s i s t e dm e t h o di nt h es e m a n t i cr e t r i e v a l a so n t o l o g yi t s e l fh a sc e r t a i nd e 孵o f i n f e r e n c ea b i l i t y , w em a yu s eo n t o l o g yt oe x p a n d0 1 1 1 q u e r ya n dt h u sc 飙坶路t 1 1 e 舰l l tt ob em o r e c o m p r e h e n s i v e t h i sp a p e ra n a l y z e dt h ed e f i n i t i o n ,c l a s s i f i c a t i o n sa n dl a n g u a g e so f o n t o l o g y ;i tm a k e s a c o m p a r a t i v es t u d y0 1 1t h em e t h o & o fb u i l d i n go n t o l o g y ,p r e s e n t st h e i rl i m i t a t i o n s i t s u r v e y sa n d c o m p a r e ss o m ef a m i1i a ro n t o l o g y b u i l d i n gt o o l sb yt h ea i do fa ne v a l u a t i o nf r a m e w o r k t l l e i lt l l ea u t h o r s e l e c t e dat o o lo fb u i l d i n go n t o l o g y - p r o t d g d 3 3 1a n dal a n g u a g eo f o n t o l o g y - o w lt ob u i l dad o m a i n o n t o l o g ya b o u th i g h e l e d u c a t i o nm a n a g e m e n t o nt h eb a s i st h a tt h ea u t h o rb u i l tt h e h i g h e re d u c a t i o nm a n a g e m e n to n t o l o g y i t 西v e st h em o d e l s t r u c t u r eo fs e m a n t i cr e t r i e v a ls y s t e ma n dd e s c r i b e dd e s i g np r i n c i p l ea n dk e y t e c h n o l o g i e s t h en o d o n o fo n t o l o g ya n di t st e c h n o l o g i e s ,w h i c hc a l ld e s c r i b es e m a n t i c so f t h ed o m a i ni n f o r m a t i o n ,a r ei n t r o i l u c e d t ot h ei n f o r m a t i o nr e t r i e v a ls y s t e m ,i tc a ni m p r o v ee f f i c i e n c ya n dp r e c i s i o no f t h ei n f o r m a t i o ns e a r c ht oa c e r t a i ne x t e n t k e y w o r d s :o n t o l o g yb u i l d i n g ;s e m a n t i cr e t r i e v a l ;h i g h e re d u c a t i o nm a n a g e m e n t ;p r o t 6 9 6 ;j e n a i i 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得宁夏大学或其它教育机构的学 位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在 论文中作了明确的说明并表示了谢意。 虢毋两君 咖7 町月尹 关于论文使用授权的说明 本人完全了解宁夏大学有关保留、使用学位论文的规定,即:学校有权保留 送交论文的复印件和磁盘,允许论文被查阅和借阅,可以采用影印、缩印或扫描 等复制手段保存、汇编学位论文。同意宁夏大学可以用不同方式在不同媒体上发 表、传播学位论文的全部或部分内容。 ( 保密的学位论文在解密后应遵守此协议) 虢参砀z 导师签名: 嗍:细卜月刁日 喇:呷盼月彳同 宁夏犬学硕f :学位论文第一章绪论 第一章绪论 1 1 研究背景与研究意义 随着i n t e r n e t 的出现并得到广泛应用以来,当今社会已经步入了信息社会时代。i n t e r n e t 与信息技术的发展使得w e b 成为一个巨大的信息源,w e b 呈指数式增长,并成为全球范围内传播 信息的最主要渠道之一。当前w e b 信息包括有关系数据库、文本文件、h t m l 文档、x m l 文档、电 子邮件及多媒体信息等川馏1 。在如此信息膨胀和信息源多样性的共同作用下,快速、有效地获取 有用信息变得越来越困难,其原因幢儿副儿副在于:信息源中数据在格式和存储结构上的异构性:人为 原因造成的信息源中数据之间“同义异形”和“同形异义”等的语义混乱。从而信息查询的结果 往往很难满足用户需要。 w e b 信息存储方式多种多样,但是在处理数据异构性与语义混乱造成的问题时,传统基于关 键词的信息查询技术变得无能为力1 6 m 1 ,只能查找出与用户查询条件在语法层上匹配的信息,而 无法给出与其在语义层上具有相关性的其它信息,从而导致信息查询结果质量低下。造成这种状 况的根本原因在于数据源中数据缺乏语义信息,其查询处理缺乏语义支持。因此,对数据源中数 据“理解”的需要变得越来越强。为了解决这样的问题,信息查询迫切需要从基于语法层面上提 升到语义层面上,即语义信息查询。 本体源于哲学范畴,当前被计算机研究领域所广泛接受的本体定义1 8 l 为:本体是共享概念模型 的明确的形式化规范说明。本体的目标是获取、描述和表示相关领域的知识,提供对该领域知识 的共同理解,确定该领域内共同认可的词汇( 术语) ,并从不同层次的形式化模式上给出这些词汇 和词汇之间相互关系的明确定义1 9 “川。本体在应用程序间的知识处理、共享和重用扮演非常重要 的角色,是解决语义层次上具有不同知识表示格式的应朋系统之间的信息共享和交换的基础,并 促进在不同系统之间共享、交换和复片 数据和知识。作为一种能在语义和知识层面上描述领域概 念模型的建模工具,本体具有良好的概念层次结构和对逻辑推理的支持 。冈此,本体可以为 信息查询提供较好的语义支持,从而能从根本上解决上述传统信息奄询的语义缺乏问题。 语义信息查询方面实现了用户查询请求的语义化,语义查询引擎像领域专家一样,不仅给 出与用户查询条件精确匹配的查询结果,还可以查询出与用户查询具有语义相关性的资源:另一 方面实现了基于语义层次的查询,突破了传统基丁语法层面查询的固有缺陷。冈此,将本体技术 运用到信息查询中,构造基于本体的语义夯询技术将是一个必然的发展趋势。基丁本体的语义查 询能较好地解决传统信息查询中由于缺乏语义支持所造成的问题,为信息查询领域的研究开辟了 一个新的方向,具有广泛的应用前景。 1 2 国内外研究现状及分析 2 0 世纪8 0 年代末至9 0 年代初,哲学领域的概念“o n t o l o g y ”被a i 领域所借鉴,对本体的 宁夏大学硕t 学位论文第一章绪论 研究逐渐增多。近年来,国内外对本体作了大量研究。 1 2 1w 3 c 的研究1 w 3 c 是一个关于信息、商业、通讯和共识的论坛。它立足于开发交互技术( 如规范、指南、软 件和工具) ,使得w e b 得以发挥最大的潜能。 w 3 c 致力于本体的研究始于2 0 0 1 年。w 3 c 制定的) 眦作为一种资源描述语言,由于它良好的 可扩展性,适合表示各种信息,现已被广泛接受为未来w e b 上的数据交换的标注。r d f 是w 3 c 推 荐的用于描述和处理元数据的方案,能为w e b 上的应用程序间的交互提供机器能理解的信息。它 独立于任何语言,适合于任何领域,是处理元数据的基础。 w e b o n t o l o g y 工作组的主要贡献是从2 0 0 2 年1 月起开始制定o w l ( o n t o l o g yw e bl a n g u a g e ) 规范标准 1 2 0 2 0 0 3 年8 月1 8 日,o w l 成为w 3 c 的候选推荐标准,2 0 0 4 年2 月l o 日,o w l 成为w 3 c ( 正 式) 推荐标准。o w l 的设计目的是要让软件代替人工来进行信息内容的加工。o w l 促进了由x m l 、 r d f ( s ) 支持的w e b 内容在机器间的互操作性。 1 2 2 a lf b 的研究 德国卡尔斯鲁厄大学( u n i v e r s i t yo fk a r l s r u h e ) 的r u d is t u d e r 、a l e x a n d e rm a e c h e , 和以他们为首的应用情报学和规范描述方法研究所( a i f b , i n s t i t u t eo fa p p l i e di n f o r m a t i c s a n df o r m a ld e s c r i p t i o nm e t h o d s ) 对本体基础理论( o n t o l o g yl e a r n i n g ) 和本体的数学表达进行 了深层次的研究“。 欧洲的o n t ow e b 就是依托a i f b 研究所的o n t o w e b 项目建立的以知识管理为目的的网上知识 门户。o n t ow e b 的目标是集合欧洲语义网网页标准的研究人员和产业学会的力量,加强该领域的 跨学科协作,促进欧洲文化的复兴,保护欧洲语言多元化和欧洲文化多样性,并在本体领域的研 究中占据主导地位4 1 。 1 2 3k s l 的研究 美国斯坦福人学的知识系统实验室( k s l ,k n o w l e d g es y s t e m sl a b o r a t o r y ,以下简称k s l ) , 无论是在本体建模工具领域,还是在本体应用层面的研究方面,都站在了知识j :程领域的最前沿。 k s l 的n g r u b e r 在1 9 9 3 年最早提出了“本体”在知识j j 程领域的定义。g u a r i n o 博士根据 整体与部分理论、同一性理论和关系理论等哲学理论成果,设计了顶级一层本体。g u a r i n o 本体 框架的设计特征是根据特殊性和普遍性两个角度来设计。特殊性表示具体的实体、事件、物质。 普遍性表示从具体事件中抽象出的概念、属性、状态和关系等。 目前,k s l 的研究主题主要有以下3 个副: 知识共享技术( k n o w l e d g es h a r i n gt e c h o l o g i e s ) 。 物理系统的建模与分析( m o d e li n ga n da n a l y s i so fp h y s i c a ls y s t e m s ) 。 2 宁夏人学硕卜学化论史第。章绪论 应用性智能系统( a d a p t i v ei n t e l l i g e n ts y s t e m s ) 。 k s l 对语义网技术的研究主要集中于语义标引和基于代理的技术两个方面。 1 2 。4 国内的研究1 订 我国对语义w e b 的研究具有以下几个特点:( 1 ) 近年来关于语义w e b 研究的论文数量骤增,说 明语义w e b 作为未来互联网的发展趋势已引起了国内学术界的高度重视。( 2 ) 但论文的参考文献 大部分为外文文献,表明我国语义w e b 的研究处于起步阶段。( 3 ) 对语义w e b 的研究具有定的 层次性,从基本介绍到理论探讨,由理论探讨到实际试验与应用,逐层递进。 国内研究语义网的一些著名专家学者是: 何克清博士,武汉大学软件工程研究所所长,目前主要研究方向:语义互联网上的软构件工 程,语义w e b 软构件,软件工程信息知识网格的基础研究,本体元建模理论与方法,互操作性理 论与测试方法、标准。 瞿裕忠,东南大学计算机科学与工程系教授:语义w e b 的关键技术研究,国家自然科学基金 项目。 吴朝晖博士,浙江大学计算机科学与技术学院教授:以语义模型与a i 体系结构为研究主线, 研究分布网络智能系统,重点研究语义网格的模型、平台,以及中医药网络的智能应用。 诸葛海博士,中科院计算技术所研究员,国家9 7 3 “语义网格的基础理论、模型与方法研究” 项目首席科学家。他认为s e m a n t i cw e b 或者s e m a n t i cg r i d 的研究分成三个步骤:首先是语义互 联,就是将现有的w e b 利用类似本体的t a x a n o m y 关联上语义:然后是规范组织,进入w e b 的资源 不是随意的,是需要规范约束:最后就是智能聚合,所谓推理或者问题解决模型之类的东两。 胡运发,复旦人学计算机与信息技术系教授,研究兴趣:语义w e b 、语义w e bs e r v i c e s 、语 义融合、o n t o l o g y 库、基于o n t o l o g y 库的语义推理、基于规则引擎软件系统集成。 俞勇,上海交人电子信息与电气上程学院教授,它负责的a p e x 实验室当前的主要研究内容 包括o 下一代搜索技术,本体工程的理论和技术,语义万维网( s e m a n t i cw e b ) 等。 潘越博士,i b m 中国研究中心,目前的研究兴趣包括信息检索、自然语言处理、知识的表示 和推理等。 另外,还有许许多多的专家,像史忠植教授,北人的张铭教授、宋炜博士,以及清华等一些 高校的学者们,这里就不一一罗列,他们为国内的语义网研究都做出了巨大的贡献。 1 3本文的工作及章节安排 本文的研究重点是领域本体的构建和语义检索技术的研究,本体开发是本体应用的前提和基 础,本体应用是本体开发的目的和价值体现。本文采用理论联系实际的方法进行本体和语义网的 信息检索技术的研究,首先提出研究方法和思路,然后通过建立实验平台与实验模型进行示范性 应用。 论文第一章对本体和语义检索技术的背景、主要研究课题进行了介绍:提出了本文的研究路 3 宁砭大学硕 j 学化论文第一章绪论 _lii_i ii i 线、方法和意义。 论文第二章介绍了本体的一些相关技术,重点介绍了本体的构建方法、语言和构建工具。 论文第三章对领域本体的构建过程进行了细致研究,并构建了高校教学管理本体。 论文第四章对语义检索相关技术进行了分析。 论文第五章进行了基于高校教学管理本体的语义检索研究。首先对该检索模型进行了分析, 然后提出了设计原理和检索框架,最后对该模型的各模块进行详细分析。 论文第六章总结了本论文所做的工作,指出了现有工作的局限性及有待改进的方面,并展望 了下一步的工作。 4 宁夏大学硕l + 学 节论文 第一:章本体研彳e 综述 曼鼍曼曼曼曼曼曼曼曼曼蔓曼曼曼曼曼曼曼皇鼍曼皇曼鼍曼曼i ;l a i n m m - - - 一a l t o 曼曼鼍曼曼寰罡皇曼曼曼曼曼曼 第二章本体研究综述 2 1 本体的概念 本体( o n t o l o g y ) 的概念起源于哲学领域,即“对世界上客观存在物的系统的描述” 1 7 o 后被 用于研究实体存在性和实体存在的本质等方面的通用理论。计算机界借用这个理论,把现实世界 中某个领域抽象或概括成一组概念及概念间的关系,创建出这个领域的本体。本体论正逐步成为 知识获取以及表示、规划、进程管理、数据库框架集成、自然语言处理和企业模拟等研究领域共 同关心的一个核心。 在人工智能界,最早给出o n t o l o g y 定义的是n e c h e s 等人,他们将o n t o l o g y 定义为“给出 构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则 的定义”。 后来在信息系统、知识系统等领域,越来越多的人研究o n t o l o g y ,并给出了许多不同的定义。 其中最著名并被引用得最为广泛的定义是由g r u b e r “引提出的,“本体是概念模型的明确的规范说 明”。霄n b o r s t 对该定义进行了引申,提出“本体是共享概念模型的形式化规范说明” 1 9 jof e n s e l 对这个定义进行分析后认为o n t o l o g y 的概念包括四个主要方面:概念化( c o n c e p t u a li z a t i o n ) 客观世界现象的抽象模型;明确( e x p l i c i t ) 一概念及它们之间联系都彼精确定义:形式化 ( f o r m a l ) 一精确的数学描述;共享( s h a r e ) 一本体中反映的知识是其使用者共同认可的。 f e n s e l 也提出了自己的定义“本体是对一个特定领域中重要概念的共享的形式化的描述”。 另外,s w a r t o u t 将本体定义为:“本体是一个为描述某个领域而按层次关系组织起来的一系 列术语,这些术语可以作为一个知识库的骨架”。n o yf n 定义“本体是对某个领域中概念的形 式化的明确表示,每个概念的特性描述了概念的各个方面及其约束的特征和属性。”f o n s e c a 定义 “本体是以某一观点用详细明确的词汇表描述实体、概念、特性和相关功能的理论”。s t a r l a 认 为“本体必需包括所使用术语的规范说明,大家一致认可的该术语的含义,以及术语之间的联系, 从而表达概念”。除此之外,还有很多种本体的定义。 综上所述,本体是一种可形式化的知识,也是一种管理知识的知识。具有群体共享知识表达、 知识重用、知识互换支持等目的。本体可以是一纽协议集、一门语言,也可以是一种标准、一种 框架。这里,本体首先是群体共同遵守的协议,协议要有无二义性的严格定义才能保证本体知识 的可共享性;其次,本体应该是组织系统空间知识的最小集,本体的最小集保证了知识语义的一 致性:再其次,本体是一种较为稳定的知识,是超越了具体应h j 的内容性知识。 2 2 本体的分类 本体的分类明确了不同本体之间的区别与联系,目前比较有代表性的分类方法有以一f ) l 种: 根据本体描述对象的不同,u s c h o l d 把本体分为特殊领域本体( 如医药、地理、金融等) 、 一般世界知识本体、问题求解本体和知识表示语言本体等。 s 宁夏大学硕i 学何论史第一:章本体研究综述 n g u a r i n o 分别在1 9 9 7 年和1 9 9 8 年提出了以详细程度和领域依赖度两个维度作为对本体 划分的基础。详细程度高的称为参照本体,详细程度低的称为共享本体。依照领域依赖程度,可 以细分为顶级、领域、任务和应用四类。 其中: 顶级本体:描述最普通的概念及概念之间的关系,如空间、时间、事件、行为等,与具体的 应用无关,其他种类的本体都是该类本体的特例。 领域本体:描述特定领域中的概念及概念之间的关系。 任务本体:描述特定任务或行为中的概念及概念之间的关系。 应用本体:描述依赖于特定领域和任务的概念及概念之间的关系。 a g p 6 r e z 在分析和研究了各种本体分类法的基础上,归纳出1 0 种本体:知识表示本体、 普通本体、顶级本体、元( 核心) 本体、领域本体、语言本体、任务本体、领域任务本体、方法本 体和应用本体。这种分类法是对g u a r i n o 提出的分类方法的扩充和细化,但这1 0 种本体之间有 交叉,层次关系划分不够清晰。 中科院的李景博士根据本体是否具有推理功能将本体划分为三类俚引:( 1 ) 轻量级本体 ( l i g h t w e i g h to n t o l o g y ) ,不具备逻辑推理功能,例如叙词表和w o r d n e t ;( 2 ) 中级本体( m i d d l e o n t o l o g y ) ,具有简单的逻辑推理功能,系统可以识别一阶谓词逻辑的表达式;( 3 ) 重量级本体 ( h e a v y w e i g h to n t o l o g y ) ,具有复杂的逻辑推理功能,系统可以识别更加复杂的二阶谓词逻辑的 表达式,并为更加复杂的推理的实现预留了接口,如c y c 本体系统。 我国学者曹存根将当前的本体按照研究主题,分为五种类型1 2 ”:( 1 ) 知识表示本体 ( k n o w l e d g er e p r e s e n t a ti o no n t o l o g i e s ) ,如f r a m eo n t o l o g y 和斯坦福人学知识系统实验室提 出的知识描述语言k i f ( k n o w l e d g ei n t e r c h a n g ef o r m a t ) ;( 2 ) 通用或常识本体( g e n e r a l c o m m o n o n t o l o g i e s ) ,如c y c 本体系统。到2 0 0 0 年为止,c y c 的常识库已有了1 ,6 0 0 ,0 0 0 条知识和几百 个微理论( m i c r o t h e o r y ) ;( 3 ) 领域本体( d o m a i no n t o l o g i e s ) ,如基因本体g o ( g e n eo n t o l o g i e s ) 、 爱_ j 堡人学企业本体;( 4 ) 语言学本体( 1 i n g u i s t i co n t o l o g i e s ) ,关于语言、词汇等的本体,典 型实例有g u m ( g e n e r a l i z e du p p e rm o d e l ) ,w o r d n e t 和m i n d n e t 等;( 5 ) 任务本体( t a s k o n t o l o g i e s ) ,主要研究如c h a n d r a s e k a r a n 等人的关于任务和问题求解方法本体的研究。 本体的分类方法很多,目前还没有能够被广泛接受的分类标准,但各学者对领域本体的概念 已达成共识,即领域本体是用于描述指定领域知识的一种专门本体,它给出了领域实体概念及相 互关系领域活动以及该领域所具有的特性和规律的一种形式化描述。本文所要研究的内容就是领 域本体知识的表示及其实现方法和过程。 2 3 本体的描述语言 o n t o l o g y 描述语言使得用户为领域模型编写清晰的、形式化的概念描述,冈此它应该满足以 下要求2 2 1 : 良好定义的语法( aw e ll d e f i n e ds y n t a x ) 良好定义的语义( w e l1 - d e f i n e ds e m a n t i c s ) 6 宁夏人学颤l 岸位论女 第一章车件研究综述 有,放的推理支持( e f f i c l e n tr e a s o n i n gs u p p o r t ) 充分的表达能力( s u f f i c i e n te x p r e s s i v ep o w e r ) 表选的方便性( c o n v e n i e n c eo fe x p r e s s i o n ) 由于o n t o l o g y 已经成为国内外各个领域的专家学者的研究热点,闻此山现了许多o n t o l o g y 的描述语言,具体包括:r d f 、r d f s 、o i l 、n 删l 、删l 、k i f 、s h o e 、x o l 、o g i l 、o n t o l i n g u a 、 c y c l 、l o o m 等等。简单归纳如f “: 和w e b 相关的有:r d f 和r d f s 、o i l 、d a m l 、o w l 、s h o e 、x o l 。其中r d f 和r d f s 、o i l 、 d 删l 、o w l 、x o e 之间有若密切的联系,是w 3 c 的本体语言栈中的不同层次,也都是基于x m l 的。 而s h o e 是基于h t l i l 的。 和具体系统相关的( 基本只在相关项日中使片j 的) 有:o n t o l i n g u a 、c y c 、l o o m 。 o k i f 已经是美国国家标准,但是它并没有艘j 泛应圳于互联网,而是作为一种交换格式更 多的应j i 丁企业级。 其中o w l 是w 3 c 组毋 推荐的语义互联网中本体描述语言的标准。伽l 全称w e bo n t o l o g y l a n g u a g e 它是从欧美一些研究机构的一种结台性描述语吉d r m l + o i l 发胜起米的。其中d 删l 是 米白茭国的提案d a u l - o n t ,o i l 是来自欧洲的一种本体描述语言。在w 3 c 提出的l 语肓栈中,o w l 处丁晟上层,见幽21 本体语言栈。 目2 i 本体镕言棱 f 面简皆介削几种土要的描述i :! 言。“。1 。 ( 1 ) s h o e s i m p l ei i t m lo n t o o g ye x t e n s i o n s 简单h t m l 的率体扩展。这魁种与x m l 一致的互联网 知识袁选语言,使得网页编辑者可阻对他们的互联网文档进行标注。由马里兰人学计算机系提出 的,但是目前他们有关本体的研究项目已经使川o w l 剃d & i i l + o i i ,竹为互联网本体的描述语言 s h o e 的研究已经停l r 。 s h o e 是h t m l 的一个超集,它扩展了些标记,使得在h t m l 中可咀增加任意的语义数据。它 的标记有两类,一类川丁刨建本体,一类h r 注解文档。 ( 2 ) x o l o n t o l o g y e x c h a n g el a n g u a g e 奉体交换语言。源丁s r ii n t e r n a t i o n a l sa r t i f i c i a l i n t e l l i g e n c ec e n t e r ( a i c ) 的b i o i n f o r m a t i c sr e s e a r c hg r o u p ,x o l 设计之初足为生物信息学 7 宁夏大学硕l j 学位论文 第一:章奉体研究综述 ! i i i imi l l i, ! i l l mi i ii iiiii l i 皇曼曼曼曼量! 皇曼舅舅 领域本体的交换,但是它可以推广应用于各种领域。它是一种简单通用的定义本体的方法。基于 x m l 和r d f s h c e m a 有两种变体。其目的是在不同的数据库、本体开发工具、或者其他应用程序之 间交换本体。 ( 3 ) t o p i cm a p s t o p i cm a p s 最初是s g m l 社团中的一群人开发的,用来实现索引和辞典构建过程的形式化。 这些早期努力的结果就是i s 0 i e c1 3 2 5 0 ,这项标准定义出了t o p i cm a p s 的完整模型。它早于 x m l 出现,但是x m l 与w e b 的迅速发展导致出现了x m lt o p i cm a p s ( x n l ) 。x t m 的基础是i s 0 i e c 1 3 2 5 0 模型,但是定义了一种x m l 语法,并限制它自己只能通过u r i 实现。事实上,x t m 被定义 为一种x l i n k 应用程序,其中的链接专门表示t o p i cm a p s 模型中的语义。 ( 4 ) r d f r d f s r e s o u r c ed e s c r i p t i o nf r a m e w o r k ,资源描述框架。这是w 3 c 在x m l 的基础上推荐的一种标 准,用于表示任何的资源信息。p j ) f 提出了一个简单的模型用来表示任意类型的数据。这个数据 类型由节点和节点之间带有标记的连接弧所组成。节点用来表示w e b 上的资源,弧用来表示这些 资源的属性。因此,这个数据模型可以方便的描述对象( 或者资源) 以及它们之间关系。r d f 的数 据模型实质上是一种二元关系的表达,由于任何复杂的关系都可以分解为多个简单的二元关系, 因此r d f 的数据模型可以作为其他任何复杂关系模型的基础模型。w 3 c 推荐以r d f 标准来解决x m l 的语义局限。 ( 5 ) o i l o n t o l o g yi n f e r e n c el a y e r 0 n t o l o g yi n t e r c h a n g el a n g u a g e 。o i l 是一种针对本体的基丁 互联网的表现和推理层。它是由t h ee u r o p e a nu n i o ni s tp r o g r a m m e rf o ri n f o r m a t i o ns o c i e t y t e c h o l o g i e su n d e rt h eo n t o k n o w l e d g ep r o j e c t ( i s t 一1 9 9 9 1 0 1 3 ) a n di b r o w ( i s t 一1 9 9 9 1 9 0 0 5 ) 资助研究的,也得剑了更广泛的研究者的参与。 ( 6 ) d a m l d a r p aa g e n tm a r k u pl a n g u a g e ,该项目正式开始于2 0 0 0 年8 月,由美国政府支持,目标是 开发一种语言和一组工具,为语义互联网提供支持。m a r kg r e a v s 是该项目的领导者。d a m l 形成 于d a i d l o u t ( 一种本体语言) 和d l - l o g i c ( 一种表达公理和规则的语言) 。 d a m l 提出的原因和o i l 类似,一批支持语义互联网的研究者发现x m l 、r d f 作为模式语言其 表达能力很有限,希望开发一种有更强的表达能力的模式语言。尽管d a m l 并不是w 3 c 的标准, 但是参与的开发者中有很多来自w 3 c 的工作者,包括t i mb e r n e r s l e e 。 d a m l 扩展了r d f ,增加了更多的更复杂的类、属性等定义。它一度很流行,成为网上很多本 体的描述语言,直到d a m l 的研究者和o i l 的研究者开始合作,推出了d u d l + o i l 语言,成为w 3 c 研究语言互联网的本体语言的起点。 ( 7 ) o w l o w l 由万维网联盟的w e bo n t o l o g y :i = 作组设计,是d a m l + o i l 的修订本。它的语法与d a m l + o i l 的非常相似,因此可以很容易地被转换为后者。万维网联盟w e bo n t o l o g yj :作组最初于2 0 0 2 年 3 月发布了o w l 规范工作草案。2 0 0 3 年2 月,万维网联盟又发布了新的o w l 规范1 :作草案。o w l 是在d a m l + o i l 的基础上发展起米的。作为r d f ( s ) 的扩展,目的是提供更多的元语以支持更加丰 富的语义表达,并更好的支持推理【2 9 1 。 8 宁夏人学硕 j 学化论文第一:章本体研究综述 基于不同的应用需求,o w l 提供了三个表达能力依次递增的子语言:o w ll i t e ,o w ld l 和o w l f u l l 。在表达能力和推理能力上,每个子语言都是前面的语言的扩展。0 1 r l 是一个强大的本体描 述语言。用o w l 能够描述很多概念与概念之间的基本关系,如等价,传递,概念之间的联合等等。 0 w l 有一些不能表达,这些包括字符串处理,数字运算,缺省值等等。o w l 的三个子语言描述列 表如下: 予语苦描述 侈l 子 o w l l i t e 用于提供给那些只需要一个分类层次支持蒜数( c a r d i n a l i l y ) , 和简单的属性约束的用户只允许基数为o 或1 o w l d l 支持那些需要在推理系统上送行最大当一个类可以愿多个类 程度表达的用户。这曩的推理系统能的一个子类时,它技约柬 够保证诗算完全性( c o m p u t a t i o n a l不能悬另外个类的实 c o m p l e t e n e s s 郫所有地结论都能够 例 保证被计算出来) 和- - 决定性 ( d e c i d a b i l i t y 即所有的计算部在有 限的时闻内完成) 它包括了o w l l 语 占的所有约束但是可以放仅仅置于 特定的约柬下 o w l f u l l支持那些蘅攫在没有计算保证豹语法个类可以坡嗣时寝达 自国的r d f 上进行最大程度衰达的用为许多个体的一个集台 户它允许在一个o n t o l o i l y 在预定义以及这个集合中的个 的( r d f 、o w l ) 词汇袭上增加词汇,个体 从而任何摊理软件均不能支持o w l f u l l 的所有f e a t u r e 2 4 本体的构建方法 构建本体的方法是当前研究中的热点问题。由于本体的构建多是面向特定领域,如果没有好 的方法路线指导,就难以在不同领域本体的构建中保持一致,也不利于本体的规模化和规范建设。 因此,关于本体构建方法的研究对于本体的应用具有至关重要的作用。 现行的本体构建方法都不是经权威标准化机构认证的方法。m u s c h 0 1 d ( 1 9 9 6 ) 试图制定出一 套构建本体的方法,但正如他在文章中指出的,他们并不是要给出套规范性的指南,只是要表 示这种方法在他们的研究环境下能很好地发挥作用m 3 1 l 。k m a h e s h ( 1 9 9 6 ) 和b a t e m a n ( 1 9 9 3 ) 都给 出了各自的本体构建原则。“3 3 。这些原则都是研究人员在各自的系统开发经验之上提出的。实际 上,几乎每一个系统的开发都会导致一些不同的本体构建方案产生。 出于对各自学科领域和具体一【i j 掣的不同考虑,构建本体的过科各不相同。目前尚没有一套标 准的本体构建方法。一般认为,g r u b e r 在1 9 9 5 年提出的5 条规则是比较有影响的| 3 刮: 明确性和客观性:本体应该朋自然语言对术语给出明确、客观的语义定义。 完整性:所给出的定义是完整的,能表达特定术语的含义。 9 宁夏大学硕卜学f 江论文第二章本体研究综述 m mm lm_mm 一致性:知识推理产生的结论与术语本身的含义不会产生矛盾。 最大单向可扩展性:向本体中添加通用或专用的术语时,通常不需要修改已有的内容。 最少约束:对待建模对象应该尽可能少列出限定约束条件。 以下,介绍几种常见的本体构建方法路线。 l 、t o v e 法 t o v e 法,又称g r u n i n g e r f o x “评价法”。t o v e 是指多伦多虚拟企业( t o r o n t ov i r t u a l e n t e r p r is e ) ,专用于构建t o v e 本体( 是关于企业建模过程本体) ( f o x1 9 9 5 ,g r u n i n g e r l 9 9 6 ) , 由多伦多大学企业集成实验室( e n t e p r i s ei n t e g r a t i o nl a b ) 研制,使用一阶谓词逻辑进行集成 t o v e 本体包括企业设计本体、工程本体、计划本体和服务本体b 引。t o v e 流程见图2 2 。 图2 - 2 “t o v e ”流程图”7 1 ( 1 ) 定义直接可能的应用和所有解决方案。提供潜在的1 卜形式化的对象和关系的语义表示。 ( 2 ) 将系统“能够回答的”问题作为约束条件,包括系统能解决什么问题和如何解决。这里 的问题用术语表示,答案用公理和形式化定义同答,由丁是在本体没有形式化之前进行的,所以 又被称为非形式化的系统能力问题。 ( 3 ) 术语的形式化:从非形式化系统能力问题中提取非形式化的术语,然后用本体形式化语言 进行定义。 ( 4 ) 形式化的系统能力问题:一旦本体内的概念得到了定义,系统能力问题就脱离了非形式 化,演变为形式化的能力问题。 ( 5 ) 将规则形式化为公理:术语定义所遵循的公理用一阶谓词逻辑表示,包括定义的语义或解 释。 ( 6 ) 调整问题的解决方案,从而使本体趋于完备。 2 、m e t h o n t o l o g y 法 m e t h o n t o l o g y 法,专用于构建化学本体( 有关化学元素周期表的本体) ( f e r n a n d e z 等1 9 9 6 , f e r a n d e z 等1 9 9 9 ) ,该方法已被马德里人学理t 分校人:r 智能图书馆采用。它的流程包括m 矧: ( 1 ) 管理阶段:这一阶段的系统规划包括任务的进展情况、需要的资源、如何保证质量等问题。 ( 2 ) 开发阶段:分为规范说明、概念化、形式化、执行以及维护五个步骤。 ( 3 ) 维护阶段:包括知识获取、系统集成、评价、文档说明、配置管理五个步骤 目前,用这种方法开发的本体有:( o n t o ) 2 a g e n t :是基于本体的w e b 代理,是使用参考本体作 为知识源,在一定的约束条件下进行新知识获取的j i :具:1 40 j 化学本体( c h e m i c a lo n t o l o g y ) :是基 于本体的化学教育代理,允许学生在学习的基础上自测本身在该专业领域

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论