已阅读5页,还剩45页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
上海海洋大学硕士学位论文 摘要 g i s 技术的快速发展,为海洋资源信息化提供了有利的工具。海洋g i s 在海 岸带开发和管理、海洋渔业、海洋环境监测评价等领域的应用获得了巨大的成功。 然而,海洋环境具有动态性,而目前的商业软件在处理这些动态数据时还存在着 智能性差等不足。为了准确掌握海洋环境随时空变化的规律、预测海洋资源的地 理分布情况,就必须首先将海洋资源随时间、空间而变化的分布规律用知识化的 方法加以表示。本体论是关于用计算机语言规范知识概念表示、进行知识组织、 开展知识服务的科学方法论,恰恰适合解决此类领域知识间的推理问题。 本体论在海洋g i s 应用的过程中,有很多关键技术值得探索。其中,首先遇 到的问题就是本体的构建。如果没有本体的构建,本体的进一步推理和领域应用 就不能得到充分的验证和实现。目前,普遍采用的利用本体编辑工具手工构建本 体的方法在很大程度上是一个人工过程,需要耗费大量的时间、人力和费用。于 是,实现基于机器学习的本体半自动构建成为本体构建的发展方向。随着近年来 计算机技术和信息提取技术的不断发展,为本体库的半自动生成奠定了技术基础。 在实践的基础之上,本文对本体半自动生成技术及其应用进行了系统的研究,取 得了以下主要成果: 1 对本体论的基础理论进行了系统的研究,其中包括本体论的的定义、建模 元语、分类等。这些是本文研究重点本体半自动生成技术的基础。 2 分析了以电子表格形式存放的数据中隐藏的知识结构,并且在此基础上提 出了表格结构中的语义转换映射生成本体的转换规则。另外,论证了采用专家干 预与知识提取相结合的方法的必要性。在此两点的基础上设计了基于p r o t 6 9 6o w l a p i 进行本体半自动构建的流程图。 3 依据流程图的步骤设计,实现了本体半自动生成工具。设计了该工具的结 构模块图和每个模块所实现的功能。 4 对本体在g i s 服务系统的应用进行研究。提出一种基于多o w l 本体的模型 来解决g i s 网络服务过程中存在的服务请求者与服务提供者之间语义不匹配的问 题。并在该模型的基础上构建出基于多本体的风暴潮辅助决策支持系统的原型框 架。 关键字:本体,半自动构建,关系规则,服务发现,o w l - s a b s t r a c t t h er 印i dd e v e l o p m e mo fg i st e c h n o l o g y i sp r o v i d i n gap o w e 柏1t o o l t - o r 也e i n f o r m a t i o nt e c h n o l o g yo fm a r i n er e s o u r c e s m a r i n eg 1 s a c c e s st oah u g es u c c e s sm t h e a p p l i c a t i o na r e a ss u c ha sc o a s t a lz o n ed e v e l o p m e n ta n dm a n a g e m e n t ,m a n n e 士1 s n e n e s , m 撕n ee n v i r o 衄e n t a lm o n i t o r i n ga n de v a l u a t i o n h o w e v e r , t h em a r i n ee n v 肿n m e n t 1 s d v n 锄i c ,w m l et h ec u r r e n tc o m m e r c i a ls o f t w a r ei nd e a l i n gw i t ht i l e s e d y n 锄1 cd 啦 黜a r sal a c ko fi n t e l l i g e n c e i no r d e rt oa c c u r a t e l yg r a s p t h ec h a n g e smt h e 嫩n n e e n v i r o 眦e n t ,w em u s tt k s td e p i c tt h ev a r i a t i o no f m a r i n er e s o u r c e sw i t ht i m e 锄ds p a c e o n t o l o g yc a l lb eu s e dt od e s c r i b et h ec o n c e p t o fk n o w l e d g e ,k n o w l e d g eo r g 锄z a t l o n , k n o w l e d g ea i l ds e r v i c e st oc a l t yo u tt h es c i e n t i f i cm e t h o d o l o g y , p r e c l s e l y s u i t e dt o a d d r e s ss u c ha r e a so fk n o w l e d g e a n dr e a s o n i n ga m o n gt h ei s s u e s w i t hu s i n go n t o l o g yi nm a r i n eg i s ,t h e r ea r em a n yk e yt e c h n o l o g i e s 、n h e x p l o n n g a m o n gm e m ,t h ef i r s t i st h ec o n s t r u c t i o no fo n t o l o g y i ft h e r ei s n oo n t o l o g y1 s c o n s t r u c t e d ,t h er e a s o n i n ga n dt h ef u r t h e ra p p l i c a t i o no fo n t o l o g yc a n n o tb ef u l l y v e f i 矗e d 锄dr e a l i z e d a tp r e s e n t ,t h em o s tw i d eu s e d t o o lf o ro n t o l o g y sc o n s t m c t l o n1 s o n t o l o g ye d i t o r ;t h i sa p p r o a c hi sl a r g e l yam a n u a lp r o c e s st h a tr e q u i r e s al o to ft l m e c o n s 吼i n g ,m a l 叩o w e ra n dc o s t s a sar e s u l t ,f i n d i n gaw a yt oc o 删o n t o l o g y a u t o m a t i c a l l y ,砌c hb a s e do nm a c h i n el e a r n i n g ,i st h ed i r e c t i o no f o n t o l o g yb u i l d i n g 1 1 1r e c e my e a r s ,c o m 肼l t e rt e c h n o l o g ya n di n f o r m a t i o ne x t r a c t i o nt e c h n o l o g y c o n t l n i l e s t oe v 0 1 v e ,h a sl a i dt h et e c h r t i c mf o u n d a t i o nf o rs e m i a u t o m a t i cg e n e r a t eo n t o l o g y1 1 b r 哪 o nt h eb a s eo fp r a c t i c e ,t h i sp a p e r f o c u s e so nt h es e m i - a u t o m a t i cg e n e r a t i o no fo n t o l o g y a n da c h i e v e st h ef o l l o w i n gr e s u l t s : 1 m a k eas y s t e m a t i c a n dp r o f o u n ds t u d yo ft h eb a s i c t h e o r i e so fo n t o l o g y , i n c l u d i n gi t sd e f i n i t i o n ,p r i m i t i v eo fm o d e l i n g ,a n d c l a s s i f i c a t i o n ,w h i c h1 s t h e e m p h a s e so fs t u d yi nt h i st h e s i s ,a n d b a s e so ft e c h n o l o g yo fa u t o m a t l cg e n 倒【i o no f o n t o l o g y 2 。m a k em u c hi m p r o v e m e mi n t h ek e yt e c h n i q u e so fa u t o m a t i cg e n e r a t i o n o f 。n t o l 。g y :i n c 蜥n gt e m 汹l o g y 嗽a c 雠g ,c 。n c e p tl e a r n i n g ,i n s t a n t e l e a n l i n ga n d r e l a t i o nl e a r n i n g 3 i m p l e m e n tt h es y s t e m 。f a u t o m a t i cg e n e r a t i 。n 。fo n t o l 。g y d e s i g na b l 。c kd i a g r 撇 2 上海海洋大学硕七学位论文 o ft h et o o la n dd e f l n et h ef u n c t i o no f e a c hm o d u l et oa c h i e v e 4 m a k eas t u d yo fa p p l i c a t i o n so fo n t o l o g yt og i ss e r v i c es y s t e m 。p r o p o s eam o d e l b a s e do nm u l t i - o w lo n t o l o g yt or e s o l v et h ep r o b l e mo fs e r v i c er e q u e s t e r sa n ds e r v i c e p r o v i d e r sd on o tm a t c ht h a te x i s t si nt h ep r o c e s so fg i sw e b a n d ,o nt h eb a s i so ft h i s m o d e lt ob u i l dap r o t o t y p ef r a m e w o r ko fas t o r ms u r g ea s s i s t e dd e c i s i o ns u p p o r ts y s t e m k e y w o r d s :o n t o l o g y ;a s s o c i a t i o nr u l e s ;s e r v i c es e a r c h i n g ;o w l s 3 上海海洋大学硕士学位论文 上海海洋大学学位论文原创性声明 本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的学位 论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除 文中已经明确注明和引用的内容外,本论文不包含任何其他个人或集 体已经发表或撰写过的作品及成果的内容。论文为本人亲自撰写,我 对所写的内容负责,并完全意识到本声明的法律结果由本人承担。 学位论文作者签名: 善蒜罐字 日期:2 驴秒年弓月日 上海海洋大学学位论文版权使用授权书 学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并 向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅或借阅。 本人授权上海海洋大学可以将本学位论文的全部或部分内容编入有关数据库 进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 本学位论文属于 保密口,在年解密后适用本版权书。 不保密 口 学位论文作者签名:绻罐亨 日期:沙d 年;月日 指导教师签名:墨k p 日期:加o 年主月弓日 上海海洋大学硕士学位论文 1 1 研究背景 第一章引言 海洋经济正在逐步成为国民经济的一个重要组成部分,开发利用海洋对人类生 存与发展的意义日显重要。海洋资源信息化当前任务主要包括四个方面:一是海 洋信息的数字化,将历史与现实的、不同信息源的、不同载体的各类海洋信息进行 数字化处理,形成以海洋基础地理、海洋环境、海洋资源、海洋经济、海洋管理等 为主题的、统一的、标准的、易于理解和使用的海洋基础数据库。二是海洋信息的 网络化,建设海洋实时信息采集与传输网络、统计信息网络和海洋行政管理信息网 络。三是决策支持信息系统的业务化,开发和整合支撑海洋管理、执法监察和国家 安全决策的信息系统和信息产品,并实现业务化运行。四是海洋基础信息服务的社 会化,开发海洋基础性、公益性信息资源,研制面向社会、面向市场的海洋信息产 品,促进海洋信息产业化进程,实现社会共享。 现代g i s 技术的快速发展,为实现海洋资源的综合利用提供了有利的工具。海 洋g i s 在海洋资源开发和管理、海水养殖、远洋捕鱼等领域的应用取得了巨大的成 功。海洋信息科学是跨多领域的综合性学科,各种知识组织关系错综复杂、互相联 系。海洋环境随时间、空间的变化具有很大的动态性,而目前的商业软件在处理这 样的动态数据时还存在着智能性差等不足。为了实现海洋信息化的发展目标,就必 须解决海洋信息管理的智能化这个关键问题。另外,为了准确掌握海洋环境随时空 变化的规律、预测海洋资源的地理分布情况,也需要将海洋资源随时间、空间而变 化的分布规律用知识化的方法加以表示。而本体论是关于用计算机语言规范知识概 念表示、进行知识组织、开展知识服务的科学方法论,恰恰适合解决此类领域知识 间的推理问题。 本体( o n t o l o g y ) 是概念模型的明确的规范说明,其目标是捕获相关的领域的知 识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次 的形式化模式上给出这些词汇( 术语) 和词汇之间相互关系的明确定义眵1 。领域本 体是将某个或多个特定领域的概念和术语规范化,使其在该领域或领域之间的实际 应用提供便利。而将时空本体和领域本体进行结合进行知识的表达和推理有益于正 确理解领域对象和时空对象间的关系,有益于构造时空体化模型,还能作为实现 异源异构的信息系统综合的基础。因此,将时空本体的概念引用到海洋g i s 应用中 作为系统规划设计的基础理论是十分有意义的。 本文对领域本体的半自动生成技术、基于多本体的g i s 网络服务发现这两个方 4 上海海洋大学硕士学位论文 面做出理论探索。这两个关注点都是时空本体在海洋g i s 应用中所必需解决的核心 问题,为数字海洋这个庞大的系统工程提供智能核心。解决好这几个问题,就可以 更加系统地描述海洋资源随时态、空间变化的语义关系,并且能够与时态g i s 相结 合以进行更进一步的研究。 1 2 问题陈述 1 z 1 本体的半自动生成技术 领域本体的构建是本体研究的第一步。构建领域本体的目标是要将某个或多个 特定领域的概念和术语规范化,为其在该领域或领域之间的实际应用提供便利。在 领域本体的支持下,知识搜索,知识积累,知识共享等知识服务的效率将大大提高, 真正意义上的知识共享和知识重用也将成为现实。没有领域本体的构建,本体论的 思想和精髓就不能得到充分的验证和实现。 在目前阶段,构建本体在很大程度上是一个人工过程,需要耗费大量的时间、 人力和费用。因此,本体的半自动生成技术逐渐受到了人们的关注。近年来计算机 技术的发展,信息提取等技术的不断发展也为本体库的半自动生成奠定了技术基础。 因此可以说,本体半自动生成技术成为目前一个研究热点,不仅是因为对它的紧迫 需求,而且与相关技术的发展日益成熟也是密不可分的。可是,由于本体应用领域 的纷繁复杂,造成研究的相对局限性,所以目前在这方面的研究还没有很好的通用 方法。 找到一种普适性较好的本体半自动技术,能够减少本体开发过程中对领域专家 的依赖,有效提高本体开发效率,也有利于进一步开展本体的应用和推广工作。 1 2 2 基于多本体的g i s 网络服务发现 g i s 网络服务允许g i s 应用程序开发者将网络上公开的g i s 功能( 诸如地点数据 查询、地图绘制、路径选择等) 集成到自己的w e b 应用程序中,而不用在本地实现该 g i s 功能,已经成为新一代地理信息系统的发展方向。然而,目前对g i s 网络服务 的研究没有很好地将服务语义描述与服务流程建模、执行结合起来,难以根据用户 需求进行有效的动态服务选择和匹配。 现有的w e b 服务行业标准u d d i ( u n i v e r s a ld e s c r i p t i o n 、d i s c o v e r ya n d i n t e g r a t i o n ,统一描述、发现与集成) 提供了一种基于分布式的商业注册中心机制, 进行服务描述文件的注册、管理和发现3 。i s o t c 2 1 l 和o p e ng i s 组织也推出了一 系列的规范。但是由于缺少语义的支持,这些规范都只能解决语法的异构性,而不 上海海洋大学硕士学位论文 能解决语义的不一致性问题。在服务发现过程中,一旦服务请求者和提供者使用不 同的术语来表示同一个概念,就会导致诸如找不到匹配的服务等语义冲突问题。为 了统- - h e 务表达的方式,w w g ( w e b - o n t o l o g yw o r k i n gg r o u p ) 在w 3 c ( w o r l dw i d e w e bc o n s o r t i u m ) 上建议使用o w l s ( o n t o o g yw e bl a n g u a g ef o rs e r v i c e s ,一种 基于o w l 作为描述w e b 服务的语义标记语言) 。但o w l - s 缺少一套正式的语义框架, 而且规定对于每一个服务都只能使用一个s e r v i c e m o d e l ,这使得服务需求者不可能 发现潜在的异构信息提供者。 为了发现基于o w l s 的g i s 网络服务,很多学者对此进行了提出了基于o w l s 和a g e n t 的地理信息服务的框架h 1 。但是,使用a g e n t 进行服务发现的方法,具有 推理知识和推理程序的之间耦合关系过于紧密,知识体系的可重用性较低等缺点; 另外也有一些学者提出采用“概念层一应用层”两个层次来描述地理信息服务畸3 ,通 过对服务描述中输入输出等参数和用户需求中功能描述的测度来判断服务与用户需 求的匹配程度,从而进行服务发现。但是,这种方法对于知识的表达又缺乏系统性、 连贯性。 1 3 主要工作 本文的主要研究内容是:在传统的本体半自动构建技术的基础上,着重分析 和研究抽取以电子表格形式存放的数据中的隐含知识关系进行本体建模,并结合适 当的专家干预以提高所构建本体的完整性,实现一种基于p r o t e g eo w l a p i 的本体 半自动构建方法。提出一种基于领域本体和时空本体协同推理的模型来解决g i s 网络服务中服务请求者与服务提供者之间语义不匹配的问题。并将这个模型应用到 海洋g i s 信息管理平台中。这种方法具有推理知识和推理程序的组合更加灵活、知 识可扩充、各本体之间逻辑关系清晰、对现有本体的可重用性好等优点。 1 4 本文组织结构 本文共分四章,各章安排如下: 第一章是引言,主要概述了课题的研究背景、研究意义及研究内容,全文的组 织结构。 第二章是本体理论综述,介绍了本体论的相关理论及国内外研究现状,包括本 体起源、定义、分类等。这些内容的理解是本体论研究的基础,尤其是本体的定义、 建模元语和描述语言对本课题研究重点更是至关重要。 第三章探讨本体半自动生成的关键技术。在本章中,我们首先探讨了本体半自 6 上海海洋大学硕七学位论文 动构建技术的理论,包括:本体构建的原则、自顶而下与自底而上的本体构建方法、 分析了电子表格结构中隐藏的知识结构,并且在此基础上提出了表格结构中的语义 转换映射生成本体的转换规则。然后,在这些理论基础上实现本体半自动生成工具, 介绍了该工具的模块结构。 第四章对现有的g i s 网络服务发现过程进行分析的基础上,提出一种基于多 o w l 本体的模型来解决g i s 网络服务发现过程中存在的服务请求者与服务提供者 之间语义不匹配的问题。 7 上海海洋大学硕士学位论文 第二章本体论综述 上世纪八十年代以来,随着知识表达的需要,本体的概念被引入到知识工程, 并有众多的研究机构参加到对本体论的研究工作中。近年来,许多本体研究项目都 有了很大的进展,一些研究成果被逐步应用到特定领域中。可以说,本体论已经成 为一个热门的研究领域。 2 1 本体的起源 本体论( o n t o l o g y ) 这个词产生于1 6 世纪,被普遍认为派生于希腊语的“o n t o ” ( “存在 ) 和“l o g i a ( “箴言录”) ,最初起源于哲学领域。1 它在哲学中的定 义为“对世界上客观存在的事物的系统描述”。所以哲学意义上的本体论是对世界 的物质性所做出的最深刻地探究,这种探求不仅仅是针对已有的知识体系,重点在于 追求客观现实的抽象本质。实际上,人类对“存在”问题的探讨由来已久,也和哲 学的起源分不开。 在过去的数十年中,随着人工智能和信息技术的起步和发展,知识工程领域得 到了迅速发展。在知识工程领域,产生了很多种知识表达的方式。其中,有一部分 学者试图通过建立专业领域的知识表达来研究智能推理技术,他们注重于描述领域 中的基础概念及其间的关系,于是哲学中刻画世界本质的“本体 一词被引入到人 工智能领域。以d e n d r a l h l 为代表的知识库系统的成功确立了知识在解决人工智能问 题方面的重要地位,作为研究知识库和知识系统构建技术的学科“知识工程” ( k n o w l e d g ee n g i n e e r i n g ) 喁1 便迅速发展起来。 2 2 本体论的定义 在人工智能界,最早给出o n t o l o g y 定义的是n e c h e s 等人,他们将o n t o l o g y 定 义为“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的 规定这些词汇外延的规则的定义”。随着人工智能技术的进步,人工智能界对本体 ( o n t o l o g y ) 的定义也经历了不同的阶段。其中,比较有代表性的定义可列表乜3 如 下: 8 上海海洋大学硕七学位论文 表2 - 1 本体的定义发展过程 t a b l e2 1d e v e l o p m e n to fo n t o l o g i c a ld e f i n i t i o n 范畴提出时间提出人定义 客观存在的一个系统的解释和 哲学 说明,客观现实的一个抽象本质 1 9 9 1 n e c h e s 等 给出构成相关领域词汇的基本 术语和关系,以及利用这些术语和关 系构成的规定这些词汇外延的规则 的定义 计算机1 9 9 3 g r u b e r概念模型的明确的规范说明 1 9 9 7 b o r s t 共享概念模型的形式化规范说 明 1 9 9 8 s t u d e r 共享概念模型的明确的形式化 规范说明 s t u d e r 提出的定义体现了本体论的四层含义: a ) 概念模型( c e r p t u a l i z a t i o n ) 通过抽象出客观世界中一些现象( p h e n o m e n o n ) 的相关概念而得到的模型,其 表示的含义独立于具体的环境状态 b ) 明确( e x p l i c i t ) 所使用的概念及这些概念之间的联系都被明确地定义 c ) 形式化( f o r m a l ) 精确的数学描述 d ) 共享( s h a r e ) 本体论中体现的知识都是由其使用者共同认可的,反映的是相关领域中公认的 概念集,它所针对的是团体而不是个体。 尽管对本体的定义有着不同的理解,但是从内涵上来看,不同研究者对于本体 的认识是统一的,都把本体当作是领域( 可以是特定领域的,也可以是更广的范围) 内部不同主体( 人、机器、软件系统等) 之间进行交流( 对话、互操作、共享等) 的一种语义基础,即由本体提供一种对某领域知识的共同理解。 2 3 本体的组成元素 在本体论的定义中,领域本体涵盖了一个领域中所涉及的概念、关系和实例, 并能借助推理规则对那个领域中的实体及实体间关系进行推理。本体论作为有关整 个世界或世界的某一部分的一种知识表现被广泛地应用在人工智能、语义网、软件 上海海洋大学硕士学位论文 工程和信息构建中,图2 - i 是本体的通用知识框架图。 图2 - i 本体的通用知识框架图 f i g u r e2 1c o m m o no n t o l o g i c a lk n o w l e d g ef r a m e w o r k 由这个框架图可以看到,本体一般由以下四个部分组成: 1 ) 实例( 个体,i n s t a n c e s ) 实例是一个本体中最基本的组成部分。严格来讲,一个本体并不需要包含任何 实例,但是可以根据对类的描述,把一个给定的实例确切的划分入一个或几个符合 定义的类中。 2 ) 类( c l a s s e s ) 类( 概念) 是指实例的抽象群、集合或集成。它们可能包含实例、其它类或两者 的组合。以下是一些类的例子: 时间单位:表示所有能刻画时间单位的集合。 地理分布:代表所有能表示地理分布的集合。 本体的多样性在于一个类能否包含其它类、一个类能否包含它自身以及是否存 在一个通用的类( 即包含任何事物的类) 。叙词表中对叙词的定义有严格的限制,本 体论继承了这一点。 3 ) 属性 一个本体中的事物能通过对它们分配属性来进行描述。每个属性最少有一个名 字和一个确切内涵,并用来储存与之关联的实体的具体信息。 属性的一个重要作用是描述本体中各个实体的关系。 4 ) 关系( p r o p e r t i e s ) 一般地,关系是指那些其价值己经成为本体中另一个实体的属性。许多本体的 能力来自于其描述关系的能力。同时,关系的集描述了领域的语义学。从语义上讲, 基本的关系共有4 种瞳1 : l o 上海海洋大学硕士学位论文 表2 - 2 本体中的基本关系 t a b l e2 - 2t h eb a s i cr e l a t i o n s h i pb e t w e e no n t o l o g y 关系名关系描述 p a r t o f 表达概念之间部分与整体的关系。 表达概念之间的继承关系,类似于面向对象中 k i n d - o f 的父类与子类之间的关系。 表达概念的实例与概念之间的关系,类似于面 i n s t a n c e o f 向对象中的对象和类之间的关系。 表达某个概念是另一个概念的属性。如“价格” a t t r i b u t e o f 是桌子的一个属性。 在实际建模过程中,概念之间的关系不限于上面列出的4 种基本关系,可以根 据领域的具体情况定义相应的关系。 2 4 本体的分类 依据不同的分类标准,本体可以有很多种分类方法。按照本体表示的形式化程 度可把本体分为1 :严格形式化本体( r i g o r o u s l yf o r m a lo n t o l o g y ) 、半形式化本 体( s e m i f o r m a lo n t o l o g y ) 、高度非形式化本体( h i g h l yi n f o r m a lo n t o l o g y ) 、结 构非形式化本体( s t r u c t u r e d i n f o r m a lo n t o l o g y ) ;按照本体的主题又可以把本体 分为:知识表示的本体、通用的常识本体、特定领域的本体、语言学的本体、任务 的本体。 此外,g u a r i n o 在文献凹3 中提出以详细程度和领域依赖度两个维度作为对本体进 行划分的基础。详细程度是相对的、较模糊的一个概念,指描述或刻画建模对象的程 度。详细程度高的称作参考( r e f e r e n c e ) 本体,详细程度低的称为共享( s h a r e ) 本体。 依照领域依赖程度,可以细分为项级( t o p l e v e l ) 本体、领域( d o m a i n ) 本体、任务 ( t a s k ) 本体和应用( a p p l i c a t i o n ) 本体等4 类。其中: 顶级本体描述的是最普通的概念及概念之间的关系,如空间、时间、事件、行 为等等,与具体的应用无关,其他种类的本体都是该类本体的特例。 领域本体描述的是特定领域( 如医药、海洋等) 中的概念及概念之间的关系。 任务本体描述的是特定任务或行为中的概念及概念之间的关系。 应用本体描述的是依赖于特定领域和任务的概念及概念之间的关系。 上海海洋大学硕士学位论文 2 s 本体论的研究现状 本体的研究与应用主要集中在三个方向:( 1 ) 对本体基础理论的研究,包括:本 体的概念、本体的分类方法、本体的数学表述;( 2 ) 对本体描述语言的研究;( 3 ) 在 信息系统中的应用,包括:领域知识的组织方式、异构信息源的匹配、信息检索系 统中进行隐含知识的发现。 2 5 1 本体论在国内的研究现状 1 ) 本体论在语义网中的发展现状 许多语义网的具体研究内容,如语义导航系统、网络数据挖掘、网络搜索等, 都可以使用本体作为其知识基础,用来提高查询的准确率。在国内,许多专家学者 已经开始在这一方向进行研究,并且取得了一些成果。 门户网站应该是一个提供个性化的系统,用户通过这个门户能够找到与其相关 的内容。浙江大学的王洁给出了一个基于本体驱动的知识门户框架,包括推理引擎、 门户组织、显示引擎和知识提供,并且给出了推理的实例【1 2 】。本体被用来进行知识 组织、知识提供和知识搜索,在此基础上提供了高相关性的个性页面。北京农业科 学院的李景主张利用本体对网页进行主体分类,在此基础上向用户提供语义导航系 统f 1 3 1 ,与王洁提出的方法殊途同归。刘娇蛟提出了一个具有可行性的主题分类过程, 其在对主题的语义匹配环节中引入本体,能够对网页进行较为精确的标引【1 4 1 。李恒 杰等给出了一些技术方法,构建了用本体进行语义网知识发现的抽象模型【1 5 1 。武汉 大学的金燕等对语义导航提出了基于本体的语义导航模型【l 引,其关键技术是使用本 体的作为语义映射的基础。东北大学的张蓉等研究基于本体的网络服务查找与协同 技术研究,从而提高了查找的准确度【l7 1 。关慧芬在最佳优先搜索算法基础上,加入 本体帮助“主题爬虫 识别具有“未来回报 的链接,对抛弃的主题无关链接再基 于领域本体进行一次其他主题相关度的判断实验。这种方法能够抓取大量主题相关 度高的网页,提高了主题资源覆盖率。 总结这些学者的研究状况,本体在语义网中存在的意义主要有:第一,利用本 体的知识表示,为系统提供准确的术语,力图把模糊的用户需求转化为标准的检索 词;第二,为检索信息系统提供了语义模型,模型中包含研究领域所包含的实体、 关系、类之间的约束,从而使系统能比较精确地检索出用户所需内容。作为信息检 索系统的知识表示方式,本体已经成为语义网中不可或缺的重要部分。 2 ) 本体论在知识管理领域的发展现状 在知识管理领域,本体论同样获得了广泛的应用,比如知识共享、资源平台的 建立、知识管理系统等,改善了目前知识管理系统中利用传统技术难以检索和融合 1 2 上海海洋大学硕士学位论文 相关资源的状况。复旦大学的刘炜提出规范的数字图书馆语义化方法,包括规范的 元数据方法和本体模型的建立方法:采用结构化、层次化方法对数字图书馆语义信 息进行组织和存储。武汉大学信息资源研究中心的董慧等人讨论了以历史事件为研 究领域的本体数字图书馆检索模型( 国共两党关系历史数字图书馆) 的设计、构建和 实现。浙江大学人工智能研究所的周明建等,在以o m l 为本体建模语言的基础上提 出了e d o c o m 框架。中国科学院的朱礼军等人构建了服装知识本体,并基于这个 本体库设计和实现了资源管理平台框架。东南大学的陈壮生等人探讨了一个基于本 体的信息处理系统的设计和实现,并分析了可扩展性、查询灵活性及逻辑推理等特 点。叶荣华认为,本体论为知识管理系统提供了语义清晰、赞同一致的共同理解基 础,从而实现组织内的知识的共享【l 引。姚靠华等人提出,当前的研究应该主要集中 在构建可集成异构数据源、并可自由进化的本体模型【19 。同济大学的吴沛和南京大 学的粟湘分析了知识管理中的异构特点,描述了本体在知识管理中的相关技术,结 合某物流企业的实例提出了知识管理中基于本体集成的框架1 2 0 1 。 在地理信息系统领域,武汉大学遥感信息工程学院的崔巍对本体驱动的信息系 统集成的研究进展进行总结,提出一种新的基于本体的地理信息系统集成结构 网状动态模型【2 1 1 。武汉大学资源与环境科学学院的吴运超等人讨论了本体理论在解 决g i s 互操作中的作用,并给出了使用d a m l + o i l 构建地理本体在g i s 中简单应 用实例【2 2 1 。武汉大学的黄茂军重点研究了地理本体的形式化表达机制,提出借助于 部分整体理论、定位理论以及拓扑理论,构造出形式化的空间特征以及空间关系公 理,加入到本体的建模原语当中,从而能够在本体构建的地理本体之中表达其空间 特征。 在农业领域,钱平教授指出农业本体论研究有助于进行农业科学的知识组织和 发现,为系统地建立农业领域内的知识组织体系提供理论和方法,为进一步开展农 业语义网研究和应用奠定基础。苏晓鹭等人介绍了采用文献计量方法对中国农业 科技文献数据库中的分类和主题标引进行分析,揭示主题词与类目之间的关系, 用于构建农业初级本体,建立了农业科技智能检索系统1 2 3 1 。 2 5 2 本体论在国外的研究现状 国外对本体论的研究工作起步较早,其中w 3 c ( 万维网联盟) 、美国斯坦福大学 知识系统实验室、德国k a r l s r u h e 大学的应用情报和规范描述方法研究所、美国加州 大学国际计算机科学研究所、西班牙萨拉戈萨大学等研究机构处于领先地位,以下 是这些机构正在进行的一些比较著名的本体研究项目 2 4 - 2 9 : 1 ) c y c 计划 c y c 计划是斯坦福大学的l e n a t 教授所领导的,原则上采取一阶谓词演算加框 上海海洋大学硕士学位论文 架树作知识表示,以框架树表示基本知识,以谓词演算作推理手段,并为每个问题 领域建立一个微理论。这个研究小组主要从大英百科全书及其他知识源整理人 类常识性知识,从1 9 5 4 年启动以来,c y c 计划的常识库已拥有了几百万条知识, 数百个理论。 2 ) w o r d n e t w o r d n e t 是一个联机英语词汇检索系统,由普林斯顿大学认识科学实验室在心 理学教授乔治a 米勒的指导下建立和维护的。开发工作从1 9 8 5 年开始,主要用 于在线语法参考。w o r d n e t 最具特色之处是试图根据词义而不是词形来组织词汇信 息。w o r d n e t 的核心是其词汇源文件,每个源文件包含一组“同义词集合 单元, 其中,每个“同义词集合 单元包含一组同义词、一组关系指针( 反义、继承等) , 并记录不同“同义词集合”之间的语义关系。但是,由于w o r d n e t 词汇范围有限, 而且其推理机制较差,并不能称其为真正意义上的本体。 3 、m i n d n e t m i n d n e t 是微软公司n l p 小组设计的一个概念知识库系统,这个系统是通过从 英语词典中自动获取语言概念及其语义信息而建立的,试图用三元组作为全部知识 的表示单元,全部三元组通过句法分析其自动获取。m i n d n e t 提取了2 4 种动词与名 词间的语义关系,类似于语义角色,构造方法是全自动的。不同于简单的统计, m i n d n e t 不仅描述了统计上相关的两个单词,还给出了词语间的语义关系,因而对 义项消歧和结构消歧很有帮助。 4 、f r a m e n e t f r a m e n e t 是由美国国家科学基金赞助、加州大学国际计算机科学研究所进行研 究的词汇数据库,它包含词典构建工具、在线的词汇语义资源和语言技术应用软件。 f r a m e n e t 能提供强大的语义分析功能,它采用被称为框架语义学的描述结构,即把 单词根据其语义分配到不同的语义框架中。f r a m e n e t 的数据库包括三个部分:词典、 框架数据库和例句。词典中不仅包含了传统词典的数据,还给出了语义框架中元素 如何在句中组合的模板以及针对模板的例句链接和框架链接。框架数据库给出每个 框架的基本概念结构描述,类似于格框架。 f r a m e n e t 数据库的基本元素是经过标引的句子,每个句子都要符合某种谓词结 构的框架,而框架元素则是句子中的每一个单词。f r a m e n e t 作为一个发展中的项目, 具有很大的应用前景,目前,f r a m e n e t 网站上为研究者提供了可进行编辑、标引和 浏览的软件工具。 5 ) l o o m l o o m 是由美国南加利福尼亚大学信息科学学院人工智能研究小组开发的一种 基于一阶谓词逻辑的知识表示语言,属于描述逻辑体系。其特点是:提供表达能力 1 4 上海海洋大学硕士学位论文 强、声明性的规范说明语言;提供强大的演绎推理能力;提供多种编程风格和知识 库服务。 l o o m 的描述性知识包括定义、规则、事实和缺省规则等,它利用向前推理、 语义一致化和面向对象的真值维护等技术实现推理,通过多种技术的高度融合,使 得逻辑范例、产生式规则范例和面向对象范例能集成在同一个应用中。在l o o m 基 础上发展的p o w e r l o o m ,具有更好的表达和推理能力,它采用前后链的推理机制, 能够处理复杂的规则、否定、等价推理、包含以及部分高阶推理。 2 6 本章小结 本章主要介绍了本体论的产生来源和基础概念、本体论的定义、本体论的建模 元语、本体论的描述语言和本体的种类等几个重要内容。这些内容的理解是本体论 研究的基础,尤其是本体的定义、建模元语和描述语言对本课题研究重点更是至关 重要。在介绍本体论在国内外的研究及应用现状时,分析了本体论作为语义信息系 统的基础作用,同时也说明了本体论有着广泛的应用领域。本章节的内容是为后面 几个章节的内容做一铺垫。 上海海洋大学硕士学位论文 第三章本体的半自动构建 在基于本体的实际应用中,构建本体是最基本的任务。一方面,所建立的本体 必须保持正确性和权威性,这就需要依据一些准则来指导建立本体的过程。另一方 面,由于本体构建的过程需要大量的人工参与,因此还需要考虑如何尽可能减少构 建过程中的繁重工作。结合这两方面的要求,本章将全面研究本体的半自动构建技 术。 3 1 本体构建的基础理论 构建本体的目的是为本体用户提供可共同理解的某一领域的知识,使得这些知 识可被机器识别。同时,本体构建也为进一步的本体推理和本体应用建立基础。脱 离了已构建的本体,本体论的思想和精髓就不能得到充分的验证和实现。本节中主 要介绍构建本体的一般规则、过程、阶段划分等。 3 1 1 本体构建的规则 在构建本体的规则中,最有影响的是o r u b e r 于1 9 9 5 年提出的5 条规则: 1 ) 明确性和客观性( c l a r i t y ) :即o n t o l o g y 应该用自然语言对所定义术语给出 明确的、客观的语义定义。 2 ) 完全性( m i n i m a le n c o d i n gb i a s ) :即所给出的定义是完整的,完全能表达所 描述术语的含义。而在构建本体时不应该局限于使用某一种表示方法,要使用多种 知识表示方法。 3 ) 一致性( c o h e r e n c e ) :即由术语得出的推论与术语本身的含义是相容的不会 产生矛盾。 4 ) 最大单调可扩展性( e x t e n d i b i li t y ) :即向o n t o l o g y 中添加通用或专用的术 语时,不需要修改其己有的内容。 5 ) 最小承诺( m i n i m a lo n t o l o g yc o m m i t m e n t ) :即对待建模对象给出尽可能少的 约束。这可以通过定义尽可能少的概念和定义约束最弱的公理来提供。 3 1 2 本体构建的语言 本体形式化描述语言直接影响本体模型的表达能力和可扩展能力。目前的形式 化的本体描述语言非常多,主要有r d f 和r d f 2 s 、o i l 、d a m l 、o w l 、k i f 、s h o e 、 1 6 上海海洋大学硕士学位论文 x o l 、o c m l 、o n t o l i n g u a 、c y c l 、l o o m 。通过本体语言发展的各个阶段,现在通 常选用o w l 。由于o w l 建立在x m l r d f s 等已有的标准基础之上,所以o w l 在保持了与r d f 和r d fs c h e m a 的最大兼容性,同时它基于r d f x m l 的语法模式, 也适合利用机器进行识别和自动处理。o w l 也是w 3 c 的推荐标准,具有良好的应 用前景。另外,o w l
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年系统解剖学模拟习题+答案
- 基于系统动力学的大型工程项目社会冲突演化与调控研究
- 2025年特许经营财务监管协议合同
- 2025年考研英语考试辅导合同协议合同
- 2025年金融科技系统开发协议合同
- 2025年考研考试合同协议合同
- 2025年3D建模外包合同协议合同
- 2025年云计算资源调度协议合同
- 采购2025年汽车配件电商平台采购合同协议合同
- 2025年股权转让尽职调查协议书合同
- 南充市高2026届高三高考适应性考试(一诊)语文试卷(含答案)
- 临床抗生素使用课件
- 2025山东济南医学发展集团有限公司国有企业招聘22人笔试考试参考试题附答案解析
- 律师事务所保密制度和保密措施
- 物业管理费用结构分析报告
- 2025天津港保税区安全生产技术专家招聘26人笔试考试参考题库附答案解析
- 第十六章整式的乘法数学活动课件人教版数学八年级上册
- 旅馆从业人员在线考试及答案解析
- 医疗机构感染控制制度及操作流程规范
- 科学防疫敬畏生命
- 雨课堂在线学堂《小白学人工智能》单元考核测试答案
评论
0/150
提交评论