




已阅读5页,还剩64页未读, 继续免费阅读
(计算机应用技术专业论文)计算机科学领域本体服务器的研究与设计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算机科学领域本体服务器的研究与设计 东华大学学位论文原创性声明 脚删l l | j j l j i l l 川| j j j j l i | i i l j j i j 】j | 删 y 18 14 4 5 8 本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的学位论文,是本 人在导师的指导下,独立进行研究工作所取得的成果。除文中已明确注明和引用 的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品及成果的 内容。论文为本人亲自撰写,我对所写的内容负责,并完全意识到本声明的法律 结果由本人承担。 学位论文作者签名:夺抱1 日期: 2 泌莎年岁月孑日 计算机科学领域奉体服务器的研究与设计 东华大学学位论文版权使用授权书 学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留 并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅或借阅。 本人授权东华大学可以将本学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 保密。在三年解密后适用本版权书。 本学位论文属于 不保密口。 学位敝作者签名:甘焉 同期:洲年岁月8 日 嗽:钢 日期:州年弓月c d 日 计算机科学领域本体服务器的研究与设计 计算机科学领域本体服务器的研究与设计 摘要 w e b 网上存在着大量题目资源,学生在学习过程中需要准确找 到与他想要了解的知识点相关的题目,但是从题目的语言表述往往很 难得知题目所用的知识点和难度等信息,合适的题目难以找到。为解 决该问题本文提出了w e b 个性化计算机程序题检索系统,该系统利用 计算机科学领域知识本体中的概念为异构的分布在w e b 上的题目资 源添加知识点语义注释,使这些w e b 题目资源具有无二义性的机器 “可理解 的语义;通过建立用户本体将学生的知识结构抽象出来, 每一个注册的用户都对应用户本体中的一个实例,使得每个学生的知 识结构得以被机器“理解”:在学生检索题目过程中,个性化检索平 台会根据学生想要掌握的知识点请求,结合他用户模型实例中已经掌 握的知识点,依照个性化匹配规则为该学生返回真正适合自身情况的 题目。 本文研究的内容是计算机科学领域本体服务器,它是w e b 个性化 计算机程序题检索系统的重要组成部分。首先计算机科学领域本体是 为w e b 上的题目资源添加知识点语义注释和进行推理的基础:其次, 计算机科学领域本体服务器是集本体存储、本体维护以及提供与本体 相关的查询服务为一体的服务器。 本文首先研究了建立计算机科学领域本体的方法,然后依据此方 计算机科学领域本体服务器的研究与设计 法建立了计算机科学领域本体,继而研究了基于o w l 规范的关系数 据库本体存储方法,最后提出了计算机科学领域本体服务器的体系结 构并开发出了原型系统。 关键词:o n t o l o g y ,o w l ,c s o ,本体存储,o n t o l o g ys e r v e r 计算机科学领域本体服务器的研究与设计 t h es t u d yo fc o 口u t e rs c l e n c ed 0 【a i n 0 n t o l o g ys e r v e r a b s t r a c t s t u d e n t sn e e dt og e tp r o b l e mr e s o u r c e st h a te x i s tl a r g e l yi nw e bt h r o u g h ap r e c i s ea n de f f i c i e n tw a y b u ti ti sd i f f i c u l tf o rs t u d e n t st og e tw h a tt h e y r e a l l yw a n t ,w h i c ha r ei nc o r r e s p o n d e n c ew i t ht h ek n o w l e d g et h e yh a v e a l r e a d ya c q u i r e d t os o l v et h i sp r o b l e m ,w ep r o p o s e ap e r s o n a lr e t r i e v i n g w e bp r o b l e mr e s o u r c e ss y s t e m i nt h es y s t e m ,t h ed o m a i no n t o l o g yi s d e v e l o p e dt os p e c i f yt e r m i n o l o g yo fc o m p u t e r s c i e n c ed o m a i nk n o w l e d g e w eu s et h i sc s ot om a k ek n o w l e d g ea n n o t a t i o no nt h ep r o b l e m si nw e b , t h e nt h ec o m p u t e rc a nu n d e r s t a n dt h e s ep r o b l e m ss i n c et h e yh a v ee x p l i c i t m e a n i n g w ec o m b i n eo n t o l o g yw i t hr u l e s t om a k ei n f e r e n c e si no r d e rt o f i n i s ht h em a t c h i n gb e t w e e np r o b l e m sa n ds t u d e n t st oh e l pt h e mf i n dt h e p r o b l e m s ,w h i c hi sm a t c h e d w i t ht h e i rk n o w l e d g es t r u c t u r e t h em a jo rw o r ki nt h i sp a p e ri st h ed e s i g na n ds t u d yo ft h ec o m p u t e r s c i e n c ed o m a i no n t o l o g ys e r v e r , w h i c hi st h ev e r yi m p o r t a n tp a r to ft h e p e r s o n a lr e t r i e v i n gw e bp r o b l e m r e s o u r c e ss y s t e m f i r s to fa l l ,t h ec s o i st h eb a s i so fk n o w l e d g ea n n o t a t i o na n di n f e r e n c e s s e c o n d l y , t h i sc s o s e r v e ri n c l u d i n gt h eo n t o l o g ys t o r a g ea n dm a i n t e n a n c e a sw e l la st h e q u e r yo f t h eo n t o l o g y 6 f i r s to fa l l ,w e p r o p o s ean e wm e t h o do fb u i l d i n gc o m p u t e rs c i e n c e d o m a i no n t o l o g y , a n dt h e nw eb u i l dt h ec s o a c c o r d i n gt ot h i sm e t h o d s i n c et h i st h es c a l eo ft h ecs oi s v e r yl a r g ew es t u d yt h em e t h o df o r s t o r i n gt h eo w lu s i n gd a t a b a s et e c h n o l o g y i nt h ee n d ,w ep r o p o s et h e s y s t e ms t r u c t u r eo fs c os e r v e ra n dd e v e l o pi t k e y w o r d s :o n t o l o g y ,o w l ,c s o ,o n t o l o g ys t o r a g e , o n t o l o g ys e r v e r 7 计算机科学领域本体服务器的研究与设计 目录 摘要3 a b s t r a c t 5 第一章绪论1 0 1 1引言1 0 1 2 研究背景1 1 1 2 1 本体1 1 1 2 2 课题背景1 2 1 3w e b 个性化计算机程序题检索系统介绍1 4 1 4 课题的研究目的和研究成果1 5 1 5 论文的组织结构1 6 第二章本体研究综述1 7 2 1 什么是本体1 7 2 2 本体描述语言1 9 2 2 1 基于a i 的本体描述语言1 9 2 2 2 基于w e b 的本体描述语言2 0 2 3 本体的建模元语2 2 2 4 本体的分类2 3 2 5 本体建设的方法论2 4 2 6 本体的建设工具2 6 2 6 1 基于a i 的本体描述语言的一类工具2 6 2 6 2 基于w e b 的本体描述语言的一类工具2 7 第三章计算机科学领域本体的开发2 9 3 1 领域本体构建过程中存在的问题2 9 3 2c s o 的开发方法研究3 1 3 2 1 需求分析3 1 3 2 2 制定计划3 2 3 2 3 建设本体3 2 3 2 4 确认与评价3 5 8 一 计算机科学领域本体服务器的研究与设计 3 3c s o 的设计原则3 6 3 4c s o 的设计与实现3 7 3 4 1 需求分析与计划3 7 3 4 2 计算机科学领域重要概念的确定3 7 3 4 3 建立概念分类层次3 8 3 4 3 1 建立概念分类层次方法的选择3 8 3 4 3 2 计算机科学领域概念分类层次结构本体的建立3 9 3 4 4 知识点关系的确立4 0 3 4 5 采用o w l 表示计算机科学领域本体4 4 第四章计算机科学领域本体服务器的设计4 6 4 1 需求分析4 6 4 2 系统结构介绍4 8 4 3 本体存储模式设计4 9 4 3 1 现有存储模式分析4 9 4 3 2 本系统存储模式介绍5 0 4 4 功能模块设计5 4 4 4 1 导入导出模块5 4 4 4 2 用户管理模块5 4 4 5 重要接口设计5 5 4 5 1 关于类的查询5 5 5 5 5 6 5 8 。5 8 6 0 6 0 6 1 6 2 6 2 计算机科学领域本体服务器的研究与设计 6 2 主要创新与贡献6 3 6 3 进一步的研究方向6 4 参考文献6 5 攻读硕士期间主要成果6 8 致谢6 9 1 0 计算机科学领域本体服务器的研究与设计 第一章绪论 1 1 引言 随着i n t e r n e t 的迅速发展,w e b 网已汇聚了大量的资源,为用户利用这些 资源提供了可能。例如对学生而言,尤为重要的是w e b 上的题目资源,学生需要 借助机器从这些大量的题目资源中找到自己所需的资源,现有的搜索技术是基于 关键字的,但是由于从题目的语言表述中往往很难使机器获得其隐含的语义信 息,包括所涉及的知识点、所采用的语言、难度等。因此当学生在w e b 上查找题 目时往往难以查找到其真正所需要的题目。以b 主羔乜;么么垒竺里:望垒:皇璺上的一道名为 u l t r a q u i c k s o r t 的题目为例,因为题目的名称含有o u i c k s o r t ,使目前基于关键 字的检索系统会误将该题作为快速排序的题目返回给学生,而实际上解决该问题 主要用归并排序( m e r g e s o r t ) 的相关知识,应作为归并排序的题目返回给学生。 因此,我们提出了w e b 个性化计算机程序题检索系统,该系统的主要思想是, 通过建立计算机领域知识本体清晰的定义计算机程科学领域的知识点以及知识 点之间的关系并建立题目资源本体对题目的结构进行抽象,然后对w e b 上的各 种题目资源进行语义标注,将题目涵盖的核心概念显式的呈现出来,标注后的题 目的语义信息便作为资源实例存储在题目资源本体中,这样就实现了w e b 题目 资源到本地资源的语义映射;当用户查询他所希望了解的知识点的题目资源时, 我们就可以根据题目的语义标注信息进行查找,找到与这些知识点相关的题目资 源。另外,不同的学生在查找题目时,学生本身的知识结构各不相同,对题目的 要求各不相同,我们通过建立用户本体将学生的知识结构抽象出来,每一个注册 的用户都对应用户本体中的一个实例,在学生检索题目过程中,个性化检索平台 会根据学生想要掌握得知识点请求,结合他用户模型实例中已经掌握的知识点, 依照个性化匹配规则为该学生返回真正适合自身情况的题目。 计算机科学领域本体服务器是w e b 个性化计算机程序题检索系统的重要组 成部分。首先计算机科学领域本体是为w e b 上的题目资源添加语义注释和进行推 理的基础,其次,计算机科学领域本体服务器是集本体存储、本体维护和提供本 体语义服务为一体的本体服务器,它提供一系列的接口用于进行本体的相关查 询,从而有力支持为w e b 上的题目资源添加语义注释和进行逻辑推理。 计算机科学领域本体服务器的研究与设计 1 2 研究背景 1 2 1o n t oio g y o n t o l o g y 的概念最初起源于哲学领域,并在很长一段时期都是哲学研究的一 个分支。逻辑在信息科学中占有重要地位,但人们认识到逻辑没有表示具体现实 世界的能力,逻辑中的存在量词符号仅仅能声明有某物存在,但逻辑本身却没有 词汇来描述到底存在的是什么,o n t o l o g y 由此被引入信息科学中,用来弥补逻 辑表达能力的不足。o n t o l o g y 包含了观察与推理两个范畴。观察提供了现实世 界的知识,描述了知识的组织形式;推理通过虚拟框架来澄清观察的意义,描述 了知识的语义。2 0 世纪9 0 年代,信息科学的发展面临着种种新难题,主要包括诸 如知识表示、信息组织、软件复用等。特别是由于因特网的快速发展,如何组织、 管理和维护海量信息并为用户提供有效的服务也就成为一项重要而迫切的研究 内容。为适应这些要求,o n t o l o g y 作为一种能在语义和知识层次上描述信息系 统的概念模型建模工具,从一产生就引起了国外众多科研人员的关注,并在计算 机的许多领域得到了广泛应用,如知识工程、数字图书馆、软件复用、信息检索 $ 口w e b 上异构信息的处理、语义w e b 等。 o n t o l o g y 这个哲学范畴,被人工智能界赋予了新的定义,从而被引入信息 科学中。然而信息科学界对o n t o l o g y 的理解也是逐步发展才走向成熟的。1 9 9 1 年 n e c h e s 等人最早给出o n t o l o g y 在信息科学中的定义:“给出构成相关领域词汇的 基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延规则的定 义。”后来在信息系统、知识系统等领域,随着越来越多的人研究o n t o l o g y ,产 生了不同的定义。1 9 9 3 年g r u b e r 定义o n t o l o g y 为“概念模型的明确的规范说明” n 1 。1 9 9 7 年b o r s t 进一步完善为“共享概念模型的形式化规范说明”。s t u d e r 等 人对上述两个定义进行了深入研究,认为o n t o l o g y 是共享概念模型的明确的形式 化规范说明心1 ,这也是目前对o n t o l o g y 概念的统一看法。s t u d e r 等人的o n t o l o g y 定义包含四层含义:概念模型( c o n c e p t u a l i z a t i o n ) 、明确( e x p l i c i t ) 、形 式化( f o r m a l ) 和共享( s h a r e ) 。o n t o l o g y 的目标是捕获相关领域的知识,提 供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形 式化模式上给出这些词汇( 术语) 和词汇之间相互关系的明确定义。 目前广泛使用i 拘o n t o l o g y 有: w o r d n e t 【川、f r a m e n e t 、g u m 矛d s e n s u s 等。 1 2 计舅机科学领域本体服务器的研究与设计 w o r d n e t 基于心理语言规则的英文词典,以在特定的上下文环境中可互换的同义 词的集合为单位组织信息;f r a m e n e t 英文词典,采用称为f r a m es e m a n t i c s 的描 述框架,提供很强的语义分析能力,目前发展为f r a m e n e tii ;g u m 面向自然语言 处理,支持多语种处理,包括基本概念及独立于各种具体语言的概念组织方式; s e n s u s 面向自然语言处理,为机器翻译提供概念结构,包括7 万多个概念。 对于o n t o l o g y 的分类则有着不同的标准。详细程度和领域依赖度是两个常用的对 o n t o l o g y 进行划分的准则。详细程度是为了描述或刻画建模对象的程度,高的 称作参考( r e f e r e n c e ) o n t o l o g y ,低的称作共享( s h a r e ) o n t o l o g y 。g u a r i n o 4 l 提出以详细程度和领域依赖度两个方面对知识本体进行划:顶级( t o p l e v e l ) o n t o l o g y 描述的是最普遍的概念及概念之间的关系,如空间、时间、事件、行为 等,与具体应用无关,其他o n t o l o g y 均为其特例:领域( d o m a i n ) o n t o l o g y 描述 的是特定领域中的概念和概念之间的关系;任务( t a s k ) o n t o l o g y 描述的是特 定任务或行为中的概念及概念之间的关系;应用( a p p l i c a t i o n ) o n t o l o g y 描述 的是依赖于特定领域和任务的概念和概念之间的关系。 1 2 2 课题背景 本课题是国家自然科学基金资助项目面向资源自动发现的网络信息空间结 构化模型研究的一个子课题。该项目针对在w e b 网中难以发现期望信息资源的 问题源头,构建一种直接支持信息资源自动发现的网络信息空间结构化模型。提 出结构化网络信息空间的概念,研究支持这种概念的机制与技术,其目标是引入 一个模拟人类分类思维模式的全局统一结构,使机器能够自主地进行联想,自动 地把每一个读者的浏览空间和每一个作者的表达空间联想映射地组织在一起,以 利于网络信息资源的自动发现和查找,使得每一位信息需求者都可以拥有一个与 其思维模式和习惯相容的完全个性化浏览空间成为可能。 该项目研究反映人类联想和分类思维特征的机器可联想的信息单元模型,使 每一个信息单元在网络环境下能够唯一地标识:研究信息单元的语义描述机制, 使机器能根据信息单元的语义模拟人类思维活动对信息单元进行操作;研究支持 结构化网络信息空间的作者表达空间模型,使作者表达空间的信息单元能够自动 归入全局分类结构中的相应类别,使机器能对作者表达空间中的信息单元进行联 想搜索;研究基于结构化网络信息空间的完全个性化浏览空间模型,建立读者信 计算机科学领域本体服务器的研究与设计 - 二二二= 二二二= 二二2 = o = = = 息需求的特征模型,使机器能基于读者信息需求的语义在网络信息空间中进行联 想搜索。 计算机科学领域本体服务器的研究与设计 1 3w e b 个性化计算机程序题检索系统介绍 开发w e b 个性化程序题检索系统的目的是:一方面积累学生训练的题目,使 得学生能通过对程序题的训练,加深对知识的理解,掌握运用知识的方法,提高 解决问题的能力。另方面,目前网上的一些程序题训练网站,比如西班牙的 v a l l a d o l i d 大学( h t t p :a c m u v a e s ) 、浙江大学( h t t p :a c m z j u e d u c n ) 、 北京大学( h t t p :a c m p k u e d u c n ) 等都提供了大量的程序题,供训练者使用, 但是这些题目大都针对a c m 国际大学生程序设计竞赛的,大部分题目对于一般学 生来说难度太高,初学者很难适应。这样就需要有一种个性化的题目检索方案, 为不同知识程度的学员提供不同的题目,用种引导性的方式,循序渐进的提高 他们的问题解决能力。 于是,我们通过建立计算机领域知识本体清晰的定义计算机程序领域的知识 点以及知识点之间的关系:通过建立题目资源本体对题目的结构进行抽象,让指 导老师对w e b 上的各种题目资源进行语义标注,将题目涵盖的核心概念显式的呈 现出来,标注后的题目的语义信息便作为资源实例存储在题目资源本体中,这样 就实现了w e b 题目资源到本地资源的语义映射;通过建立用户本体将学生的知识 结构抽象出来,每一个注册的用户都对应用户本体中的一个实例,随着该学生做 过题目的增加,他掌握的知识点也不断增加,它所对应的用户实例也随之变化。 在学生检索题目过程中,个性化检索平台会根据学生想要掌握得知识点请求,结 合他用户模型实例中已经掌握的知识点,依照个性化匹配规则为该学生返回真正 适合自身情况的题目。 计算机科学领域本体服务器的研究与设计 1 4 课题的研究目的和研究成果 本文所研究的主要内容建立计算机科学领域本体,设计并开发计算机科学领 域本体服务器,计算机科学领域本体服务器是集本体存储、本体维护和提供本体 相关语义服务为一体的本体服务器,它提供一系列的接口用于进行本体的相关查 询,从而有力支持为w e b 上的题目资源添加语义注释和进行逻辑推理。 主要研究成果有: 1 提出了一种适合本项目的计算机科学领域本体建设的方法, 2 分析了计算机科学领域的知识结构和知识点之间的关系,建立了计算机 科学领域本体, 3 出了一种将o w l 本体转换到关系数据库中的方法,该方法很好的支持了 o w l 规范的特性,该方法了易于理解,结构稳定,查询效率较高等, 4 设计并开发了计算机科学领域本体服务器,它是w e b 个性化计算机程序题 检索系统重要组成部分。 计算机科学领域本体服务器的研究与设计 1 5 论文的组织结构 论文总共分为六章,现简要介绍如下: 第一章绪论。论述了研究背景、研究问题以及论文的主要工作。 第二章相关技术及研究。阐述了本体论的定义,本体的分类,本体的描述 语言,本体的方法论研究,以及本体的开发工具介绍。 第三章计算机科学领域本体的开发。总结了现有本体建设方法的不足,提 出了计算机科学领域本体的建设方法,并根据此方法建立了计算机科学领域本 体。 第四章计算机科学领域本体服务器的设计。提出了计算机科学领域本体服 务器的体系结构,分析了现有大型本体的存储方法,提出了一种由o w l 本体向关 系数据库的转换方法,介绍了主要功能模块,以及系统向外的重要服务接口。 第五章计算机科学领域本体服务器的实现。开发了计算机科学领域本体服 务器的原型系统,实现了导入导出和本体浏览等功能。 第六章结束语,总结本研究工作并对未来工作进行展望。 计算机科学领域本体服务器的研究与设计 第二章本体研究综述 2 1 什么是本体 本体的概念最初起始于哲学领域,可以追溯到公元前古希腊哲学家亚里士多 德尝试对世界上的事务分类。作为一个哲学术语,本体( o n t o l o g y ) 的定义为“对 世界上客观存在物的系统的描述,即存在论”。古希腊罗马时代的西方哲学,被 称为“本体论 的时代,那时哲学家们最关心的是世界的本源问题,即世界是由 什么组成的? 世界的本质是什么? 等等这些探究世界根本的问题。从泰勒斯的 “万物皆水”到“四元素”说、“原子论”,再到柏拉图的“绝对理念”,都对 这一问题提出了各自的见解。 最先意识到哲学本体论与建立a i 系统逻辑理论的活动之间存在相通点的是 m c c a r t h y ,他于1 9 8 0 年提出,在建立具有逻辑姓的智能系统时首先必须考虑的问 题是“建立一个现实世界的本体”:而c r u b e r 则把本体看成概念的说明。 在人工智能中,本体( o n t o l o g y ) 定义为概念、方法的一个显式表示形式。 在a i 领域,研究者首先开发本体来便利知识的共享和复用,本质上经常以某种形 式的和更适合机器易读的方式把本体的意思属性化为概念的规范,即已经定义的 术语和术语之间的关系。对于现代专家知识系统的开发而言,本体的思想正逐渐 变得越来越重要。 o n t o l o g y 这个哲学范畴,被人工智能界赋予了新的定义,从而被引入信息 科学中。然而信息科学界对o n t o l o g y 的理解也是逐步发展才走向成熟的。1 9 9 1 年 n e c h e s 等人最早给出o n t o l o g y 在信息科学中的定义:“给出构成相关领域词汇的 基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延规则的定 义。”后来在信息系统、知识系统等领域,随着越来越多的人研究o n t o l o g y ,产 生了不同的定义。1 9 9 3 年g r u b e r 定义o n t o l o g y 为“概念模型的明确的规范说明” l 。1 9 9 7 年b o r s t 迸一步完善为“共享概念模型的形式化规范说明”。s t u d e r 等 人对上述两个定义进行了深入研究,认为o n t o l o g y 是共享概念模型的明确的形式 化规范说明【2 】,这也是目前对o n t o l o g y 概念的统一看法。 s t u d e r 等人的o n t o l o g y 定义包含四层含义:概念模型( c o n c e p t u a l i z a t i o n ) 、 明确( e x p l i c i t ) 、形式化( f o r m a l ) 和共享( s h a r e ) 。“概念模型”是指通 计算机科学领域本体服务器的研究与设计 过抽象出客观世界中一些现象( p h e n o m e n o n ) 的相关概念而得到的模型,其表示 的含义独立于具体的环境状态:“明确”是指所使用的概念及使用这些概念的约 束都有明确的定义:“形式化 是指o n t o l o g y 是计算机可读的,也就是计算机可 处理的:“共享”是指o n t o l o g y 中体现的是共同认可的知识,反映的是相关领域 中公认的概念集,它所针对的是团体而非个体。o n t o l o g y 的目标是捕获相关领域 的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不 同层次的形式化模式上给出这些词汇( 术语) 和词汇之间相互关系的明确定义。 虽然不同研究者对本体有不同的描述,但是从内涵上来看,他们对本体的认 识是一致的,都是把本体当作某个领域内( 可以是特定领域的,也可以是更广的 范围) 不同主体( 人、代理、机器等) 之间进行交流( 对话、互操作、共享等) 的一种语义基础,即由本体提供明确定义的词汇表,描述概念和概念之间的关系, 作为使用者之间达成的共识。 知识工程在许多领域得到了广泛的应用,但不同开发工具和应用平台使系统 的通信、共享、重用性等性能受到了限制,新的知识系统不能有效的利用现有的 知识系统,不断开始“重新设计”,造成人力,物力、财力的大量浪费。 自从2 0 世纪9 0 年代,本体工程已经成为流行的研究主题,研究者逐步意识到 本体不仅适用于基于知识的系统,所有软件都要需要现实世界的模型,并在设计 阶段就开始充分利用本体。目前,本体已经被广泛应用于知识工程、自然语言处 理、数字图书馆、信息检索和w e b 异构信息的处理、软件复用、面向对象技术和 语义w e b 等领域。 计算机科学领域本体服务器的研究与设计 2 2 本体的描述语言 自上个世纪9 0 年代以来,一些基于a l 的本体实现语言陆续被提出,女u k i f 、 o n t o l i n g u a 、c y c l 、l o o m ,o c m l ,f l o g i c 。后来,随着w e b 的发展,又出现 了一系列基于w e b 的本体语言,也叫做本体标记语言,如s h o e 、x o l 、r d f 、 r d f s ,o i l ,d a m l ,d a m l l l o i l ,o w l o 2 2 1 基于a l 的描述语言 k i f 【5 】( k n o w l e d g ei n t e r c h a n g ef o r m a t ) 是由斯坦福大学开发的。它是一 种在不同k r 系统间交换知识的格式,是基于一阶逻辑的语言。其特点是: 有公开的语义:它不再需要专门的解释器。 在逻辑上是全面的:它可以对任意的逻辑语句进行表达。 提供对元知识的表现。 o n t o l i n g u a 6 是一种基于k i f ( k n o w l e d g ei n t e r c h a n g ef o r m a t ) 的,提供 统一的规范格式来构建o n t o l o g y 的语言。其特点是:为构造和维护o n t o l o g y ,提 供了统一的、计算机可读的方式;由其构造的o n t o l o g y 可以方便地转换到各种知 识表示和推理系统( p r o l o g 、c o r b a 的i d l 、c l i p s 、l o o m 、e p i k i t 、a l g e r n o n 和 k i f ) ,从而将o n t o l o g y 的维护与使用它的目标系统分离。 c y c l 6 】是c y c 系统的描述语言,一种体系庞大而非常灵活的知识描述语言。 其特点是:在一阶谓词演算的基础上扩充了等价推理、缺省推理等功能:具备一 些二阶谓词演算的能力;其语言环境中配有功能很强的可进行推理的推理机。 l o o m 6 1 是一种基于一阶谓词逻辑的高级编程语言,属于描述逻辑体系。其特 点是:提供表达能力强、声明性的规范说明语言;提供强大的演绎推理能力;提 供多种编程风格和知识库服务。该语言后来发展成为p o w e r l o o m 语言。p o w e r l o o m 是k i f 的变体,它是基于逻辑的,具备很强的表达能力,采用前后链规则( b a c k w a r d a n df o r w a r dc h a i n e r ) 作为推理机制。 o c m l 7 8 】( o p e r a t i o n a lc o n c e p t u a lm o d e l l i n gl a n g u a g e ) 是由英m o p e n u n i v e r s i t y 的k m i ( k n o w l e d g em e d i ai n s t i t u t e ) 实验室开发的。它被称为一种 “可操作的o n t o l i n g u a ”。实际上,o c m l 中的定义类似于o n t o l i n g u a ,另外,它 还可以定义用于推理的规则,还可以为函数进行可操作的定义。k m i 的w e b o n t o 编辑器就是基于o c m l 的。 计算机科学领域本体服务器的研究与设计 f l o g i c 桫j ( f r a m el o g i c ) 是卡尔斯鲁厄大学开发的,是基于框架逻辑和一 阶逻辑的。它可以表示概念,概念分类,二元关系,函数,实例,公理和规则。 与前面的几种语言相比,它是唯一没有采用类似l i s p 语法的语言。其推理引擎 o n t o b r o k e r ,可以用来进行约束检查和演绎新知识。 2 2 2 基于w e b 的本体描述语言 图2 1 【1 0 】给出了基于w e b 的本体描述语言的发展历程和相互关系。 晕罾2,氍辨l 卿辱 图2 1 基于w e b 的本体描述语言的发展 s h o e 例( s i m p l eh t m lo n t o l o g ye x t e n s i o n s ) 作为h t m l 的扩展,是马里兰 大学开发的。它是基于框架和规则的。它使用不同于h t m l 的一些标记,使得可以 在h t m l 文档中插入本体。当x m l 产生并成为w e b 上交换信息的标准后,s h o e 的语法 被修改为基于x m l 。目前,马里兰大学已经停止研究s h o e ,他们有关本体的研究 项目开始使用o w l 和d a m l + o i l 作为本体的描述语言。 x o l l l l j ( o n t o l o g ye x c h a n g el a n g u a g e ) 是s r ii n t e r n a t i o n a l 的人工智能中 心( a i c ) 开发的。它是一种简单通用的定义本体的方法。其目的是在不同的数据 库、本体开发工具、或者其他应用程序之间交换本体。x o l 设计之初是为生物信 息学领域本体的交换,但是它可以应用于各种领域。 r d f 1 2 】( 资源描述框架,r e s o u r c ed e s c r i p t i o nf r a m e w o r k ) 、r d f - s 1 1 ( r d fs c h e m a ) ,是w 3 c 在x m l 的基础上推荐的一种标准,用于表示任何的资源信 息。r d f 提出了一个简单的模型用来表示任意类型的数据。这个数据类型由节点 计算机科学领域本体服务器的研究与设计 和节点之间带有标记的连接弧组成。节点用来表示w e b 上的资源,弧用来表示这 些资源的属性。因此,这个数据模型可以方便的描述对象( 或者资源) 以及它们 之间的关系。r d f 的数据模型实质上是一种二元关系的表达,由于任何复杂的关 系都可以分解为多个简单的二元关系,因此r d f 的数据模型可以作为其他任何复 杂关系模型的基础模型。r d fs c h e m a 为r d f 资源的属性和类型提供定义良好的词 汇表。w 3 c 推荐以r d f r d f s 标准来解决x m l 的语义局限。 o i l 1 3 1 ( 本体推理层本体交换语言,o n t o l o g yi n f e r e n c el a y e r o n t o l o g y i n t e r c h a n g el a n g u a g e ) 是在欧洲的i s t 项目o n t o k n o w l e d g e 中开发的。o i l 以 r d fs c h e m a 为起点,用更为丰富的o n t o l o g y 建模原语对r d fs c h e m a 进行扩充。o i l 将框架系统、描述逻辑和w e b 标准( x m l 和r d f ) 这三个不同领域的优点结合起来, 提供了一种通用的语义w e b 的标记语言。其中,基于框架的语言在a i 中有很长的 历史,它们的中心建模元语是类( 称为框架) 和属性( 称为槽) 。描述逻辑( d l ) 通过概念( 对应于类或者框架) 和角色( x c 应于槽) 描述知识,具有良好的语义 和有效的推理。o i l 的使用比较广泛,支持o i l 的工具也很多,最著名的有o i l e d , 是一个基于o i l 的本体编辑器。其他一些工具,比立i o n t o e d i t 、t h ef a c t ( f a s t c l a s s i f i c a t i o no ft e r m i n o l o g i e s ) s y s t e m 等也都支持o i l 。 d a m l i l 4 j ( d a r p aa g e n tm a r k u pl a n g u a g e ) 是d a r p a 计划第一阶段所创建的一 种语言。d a r p a ( a g e n tm a r k u pl a n g u a g e ) 项目始于2 0 0 0 年8 月,由美国政府支 持,目标是开发一种语言和一组工具,为语义w e b 提供支持。m a r kg r e a v e s 是该 项目的领导者。d a m l 形成于d a m l o n t ( 一种本体语言) 和d a m l l o g i c ( 一种表达公 理和规则的语言) 。d a m l 扩展了r d f ,增加了更多更复杂的类、属性等定义。它一 度很流行,成为网上很多本体的描述语言,直至u d a m l 的研究者和o i l 的研究者开 始合作,推出了d a m l + o i l 语言,成为w 3 c 研究语义w e b 中本体描述语言o w l 的起点, 并成为标准。 o w l 1 5 1 6 】( w e b 本体语言,w e bo n t o l o g yl a n g u a g e ) 是w 3 c 推荐的本体描述 语言的标准。它是为了在w w w 上发布和共享本体而提供的语义标记语言,o w l 是在 d a m l + o i l 的基础上发展起来的,作为r d f ( s ) 的扩展,目的是提供更多的元语以支 持更加丰富的语义表达,并更好的支持推理。针对不同的需求,o w l 有三个子语 言:o w ll i t e 、o w ld l 幂d o w lf u l l 。 计算机科学领域本体服务器的研究。j 设计 2 3 本体的建模元语 o n t o l o g y 是一种组织知识的艺术。为研究如何用o n t o l o g y 来组织知识, p e r e z 等人采用了分类法,并归纳出5 个基本建模元语f 1 7 1 :类( classes ) 或概念( c o n c e p t s ) 、关系( r e l a t i o n s ) 、函数( f u n c t i o n s ) 、公理( a x i o m s ) 和实例( i n s t a n c e s ) 。类或概念表示对象的集合;关系表示领域中概念之间的 交互作用;函数是一类特殊的关系,该关系的前n 一1 个元素可以惟一决定第n 个元素;公理代表永真断言;实例代表元素,从语义上讲它表示的就是对象。关 系在o n t o l o g y 中非常重要,从语义上讲,基本的关系共有4 种:p a r t o f 、k i n d - o f 、 i n s t a n c e - o f 和a t t r i b u t e o f 。p a r t o f 表达概念之间部分与
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 临床急性胸痛患者急救护理
- 一场精彩的足球比赛记叙文兼事件报道4篇
- 快递公司物流派送记录表格
- 无线通信网络建设合作合同
- 人流与车流动态管理在提升枢纽承载能力中的创新实践
- 校园里的友谊故事记叙文(9篇)
- 基础教育生态系统演变与变革的内在驱动力
- 农村社区农业生态建设协议
- 古代汉语常用词汇的演变与含义解析教案
- 商品库存变动与销售记录表
- 来料质量异常反馈单
- 封底混凝土计算
- n系列蒸汽型溴化锂吸收式冷水机组f.ju.1
- 附件9:未取得国外国籍的声明
- 2022年DPI610-615型便携式压力校验仪操作规程
- 数学分析试题及答案(两份)
- 司炉岗位应急处置卡(燃气)参考
- 最新四川省教师资格认定体检表
- 儿童手机设计报告
- 防眩板施工组织设计
- 公路交通工程及安全设施施工指导意见
评论
0/150
提交评论