已阅读5页,还剩81页未读, 继续免费阅读
(计算机应用技术专业论文)本体的构造及其应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
武汉理工大学硕士学位论文 摘要 作为武汉理工大学科研基金资助项目“仉数据库设计方法与工具研究”的前期 工作,本文着重研究了领域本体的构造,以及如何将本体应用在数据库建模的工作中。 如今,w e b 成为了网络信息的主要平台,是人们获取知识的主要来源。但是,由于 w e b 页面的无结构性、超链接的自由无序、以及w e b 内容的海量性、多样性和动态变 化,人们从w e b 上搜索真正想要的信息其实并不容易。为解决上述矛盾,w e b 创始人t i m 8 e m e r s - c e e 提出了语义w e b 的构想,它是当前w e b 的扩展。目的是使w e b 信息更为有 序,让计算机同人们更好的协同工作。语义w e b 采用多层次的表示框架,本体位于由文 档描述到知识推理转折的层次,因此本体的构建是实现语义w e b 的关键环节。 本体是用来描述某个领域甚至更广范围内的概念以及概念之间的联系,并使得这些 概念和联系在一定的范围内有着明确唯一的定义,达成种共识,这样 、和机器之间就 可以进 亍! 交流。尽管本体的构建是一个很重要的问题,但是目前还没有成熟的方法论指 导本体构建的工作。本文认为本体的构建类似软件的开发过程。与传统的软件开发相 比,本体更强调进化、共享、重用,因此它的工程牲更为明显。目前流行的各种方法论 也都不同程度的借鉴了软件工程的思想。在软件工程中,螺旋模型和原型法都是重视软 件进化的。类似的,研究中采用了种基于螺旋模型的原型化方法。 本论文系统介绍了语义w e b 和本体的理论。在这些理论的指导下,本研究工作的目 标是构建个以经济学的学科资源为应用领域的领域本体。在领域本体的构建过程中, 我们将采用w 3 c 推荐的本体描述语言0 】| 】l 作为编写语言,并且以基于螺旋模型的原型化 方法作为开发指导,使用脚碰g 姗编写目标应用领域的领域本体文件。 在本体的应用研究中,我们通过分析本体和b 书模型之间的关系,进而分析了本体 在数据库概念建模中的作用,探讨了应用本体辅助b _ r 建模设计的基本方法,并由此提 出了一种基于本体的辅助数据库概念建漠的框架。在整个辅助概念建模框架中,本体处 于基础地位,它通过向设计者提供黝口识,来辅助数据库的设计。最后我们通过一个 原型系统来验证这个框架的可行陛。 关键词:本体,语义w e b ,构建,领域本体,硎。,数据库概念建模 武汉理工大学硕士学位论文 a b s t r a c t a st h ep r e l i m i n a r yw o r ko f “r e s e a r c h0 nt h e 舭鹰d e s i g na p p r o a c ha n dt o o l ” s u o r t e db y _ | ;垤岍御u a nb h i v e r s i t yo f1 k l 瑚l o 勖r e s e a r c h 缸出,t h i s 嘟) e rf o c u s e s o nt h es t u d yo fb u i l d i n gd f l l b i n o n t o l o g i e s a n dh o wt o 印p l yo n t o l o g yt o 陋拓i 咄 c o n c e p td e s i g r l n o a b d a y s , w e bb e c ( i i l s st h em a i ni n f 商m h t i 。nr e s o u r c e p o ”e v e r , i ti sn o te a s yf o r p e o n et og e tt h er e d l yi n t e r e s t e di n f o r m a t i o no nt h ew e b , s i n c ew e bp o g e sa r es a n i s t r u c t u r eo rr n n - s t r u c t u r e , t h eh y p e r l i n k sa r ed i s o r d e r e da n dt h ed a t aa r e 嘲s s i v e a n d 由r 脚i c t os o v et h ea b o v ec o n t r a d i c t i o r l ,t 血b e m e r s q | ep r c s e dt h ec o n c e p t o fs a m n t i cw e b i ti sa 3e x t e n s i o no ft h ec u r r e n tw e hi nw h i c hi 面o r m a t i o ni sg i v e n w e l l - d e f i n e dm e a n i n g , h e t 亡e re n a b l i n g 咖h j t e r sa n dp e o p l et ow o r ki n ( d 印e r a t i o r l t h es a n t i cw e bu s e sam u l t i l e m lf r a m e a r kt 0a c h i e v ei t sg 。a l o n t o l o g yl o c a t e s i nt h el e v e lf r o mt e x t u a ld a s c r i p t i o nt o 时删1 e d 曲s e dr e a s o n i n g s 0i ti st h ek e y t ob u i l do n t o l o g i e sf o rt h es e m a n t i cw e b a na n t o l o g yi s 锄e x p l i c i ts p e c i f i c a t i o no fac 。f 聊t u a l i z a t i mi td e f i n e st h e k a s i cc o n c e p t sa n dr e l a t i o r lw h i c hs c o p ei sac k l i d i no rm u c hw j d e r t h i sm a k e st h e s e c o n c e p t sa n dr e l a t i o n sh a v ee x p l i c i ta n de x c l u s i v ed e f i n i t i o r si nc e r t a i ns c o p e t h e n p e a o l e c a nc a m m i c a t ew i t h t i l 曲i n e s a 1 t h o g hb u i l d i n go n t o l o g l e s i sav e r y i m p o m m t i s s u e a t p r e s e n t 。t h e r e i sn o a n y m a t l l e m e t h o d o l o g y t o g u i d e t h e d e v e l q i 【| e n t o fo n t o l o g i e s h e d e v e l o l e n t o fo n t o l o g i e ss h o u l db ea 1 1 e n g i n e e r i n g p r o c e s st h es a r a ea ss o f t w a r ed e v e l o l x n e n t t i c e v e r , c c m g 脚e dw i t h 缸a d i t i a 1s o f t w a r e d e v e l o l m e n t ,b u i l d i n go n t o l o g i e s 酬1 妇s i z e se v o l v e m e n t ,s h a r e a n dr e u s e s oi th a s f i b r ee n i n e e r i n ge b a r a c t e r i s t i c ac u r r e n t l y , t h ep 糟叫e n tm e t h o d o l o g i e sa l s ou s et h e i d e ao fs o f t w a r e 印g i 删i n gf o rr e f e r e w t os o m ee x t e n t i nt h e s o f t w a r e e n g i n e e r i n gs p i r em e d e la n dp r o t o t y p em e t h e db o t hs t r e s se v o l u t i o f ls i m i l a r l y , w e a d o p tt h i s d d e la n dm e t h o di ne t l rr e s e a r c 血 i n t h e 田p e r ,w es y s t e r a i c a l l y i n t r o d u c et h e t h e o r y o ft h es e r r a n t i cw e ba n d o n t o l o g y w i t ht h eg u i d e n c e o ft h e o r y ,t h ei x a 3 z o s eo ft h i sr e s e a r c hi st ob u i l da d a m a n s t r a t i n gd 疵no n t o l o g yb a s e do nr e s ( x l r c o f 咖f 【i c & d u r i n gt h eb u i l d i n go f o n t o l o g y , w ea d o p t0 】| 】l ( 1 】l 】出o n t o l o g yl a n a n g e ) w h i c hi s r e c a r m e n & db yw 3 ca st h e o n t o l o g yk f 坶j a g 包u n d e rt h eg u i d a n c e o fs p i r em c ) d e la n dp r o t o t y p em e t h o d ,w eu s e p r o t 锯僦t 。w r i t eo n t o l o g yf i l e 武汉理工大学硕士学位论文 i nt h er e s e a r c ho fo n t o l o g ya p p l i c a t i o n , w ea n a l y z et h e r e l a t i o n s h i pb e t w e e n o n t o l o g ya n de - r 出1 ,a n dt h ea c t i o no fo n t o l o g yi nd a t a b a s en _ n d e ld e s i g r l1 h i s i :l l p e ri n q u i r e s i n t ot h eb a s i cm e t h o dt h a to n t o l o g yi su s e di nd a t a b a s ee _ 书m o d e l d e s i g na n dp r e s e n t sas i n - p l eo n t o l n g r - h a s e dd e s i g nf r a m e w o r ko fd a t a b a s ec o n c e p t u a l m e d e l i n gi nt h ef r k , o n t o l o g yi s a ni l l 脚t 晖吨w h i c hp r o v i d et h ed o m a i n k n o w l e d g et od e s i g n e r sa n dh e l p t h e mt o m o d e l i n g i nt h e e n do fp a p e r , w eu s ea p r o t o t y p es y s t e mt oe v a l u a t et h ef e a s i b i l i t yo fa p p l y i n gt h ef r m h v o r k k e yw o r d s :o n t o o g y , s a m n t i cw e b , 融i l d i n l h m i no n t o l o g y , a 忆d a t a b a s ec o n c e p t u a l m o d e l i n g 武汉理工大学硕士学位论文 第1 章绪论 1 1 本课题的研究背景及意义 1 1 1 关于选题的研究背景 信息技术对人类生活和工作方式产生了重大的影响。我们经常与信息和信息系统打 交道,将来会更加依赖信息和信息系统。能i 新张识处理的信息系统有能力帮助人们学 习和工作。基于知识的系统建模与应用研究,是信息时代发展的必然。而利用本体对系 统建模,是提高知识的共享性、互操作性、可维护性和可重用性的一个有效的途径。 1 1 1 1 语义w e b 的兴起 ( 1 ) 语义w 由的定义 t i m r s _ l e e 于1 9 8 9 年仓建了眦,被誉为“万维网之父”,现为w 3 c ( w o r l d w i d ew e bc o n s o r t i u i r 0 的理事,以及麻省理工学院计算机科学实验室的研究员。他对 吾义 w e b 的定义是:“语义w e b 不是种独立的w e b ,而是砂现今的w e b 中延伸出来的,它所 表达的信息的意义被很好地定义,使得计算机和人类能够更好地合作”。 w 3 c 创立于1 9 9 4 年1 0 月,是一个致力于领导万维网娜o r l dw i d ew e b ) 、制定公共的 协议、促进万维网的发展并确保其互操作性的标准化组织。w 3 c 下的语义w e b 活动论坛 ( s e m a n t i c1 驻强a c t i v i t y ) ,在其宣言中对语义w e b 的定义是:“语义w e b 是当前w e b 的一 个扩展,其中信息被赋予明确定义的含义,有助于计算帆之间以及计算机与人之间的协 同工作。其思想是使w e b 上的数据以这样_ 十方式来定义与链接;能够被机器用于各种 不同应用系统,而且可以实现数据的自动化处理、集成与复用。只有当w e b 成为人和自 动化工具所共享加工的场所时方能实现其全部潜力”“。 语义w b b 的提出 1 9 8 9 年,时任p a r t i c l ep h y s i c s 欧洲实验室咖研究员的t i f i lg e r n e r s - i e e 和 m j e r sb e r g l u n d 创建了m 也。 泣是互联网成功的关键性力量,由于h i m 的简易性, w e b 得到了迅猛发展。w 曲使用起来很简单,通过浏览器用户可以在任何地方、任何时 武汉理工大学硕士学位论文 间方便浏览各种来源的h i y l 文档,这些文档也可以通过超链接将不同的资源和信息连 接起来。 然而,h 1 2 v l 有着先天陛的不足网页上的内容是设计成专供 、类浏览的,它仅仅 描述内容的外观和表现形式,即供人们阅读而非机器自动处理;对于信息之间的联系, 它也仅仅提供了按“网页的地址”的线眭链接关系,而非以“内容的语义”来定位信息 资源的,网e 所有信息都是由不同的网站发布的,相同主题的信息分散在全球众多不同 的服务器上。这些缺陷的存在,导致了机器在采集、分解和组合w e b 中的信息时,显得 力不肌心,语言文字本身存在的语义模糊性和歧义生也增加了机器分析的难度。 1 9 9 8 年,t m r m r s 4 提出了下一代w e b 语义w e b 的理念。,其后在2 0 0 0 年1 2 月1 8 日的l 2 0 0 0 的会议匕提出了语义w e b 并给出了其体系结构”。2 0 0 1 年5 月,b e r r e r s - l e e ,h e n d l e r 和l a s s a i l a 在t h es e m m n t i cw e b 一文中给出了语义w e b 的定义并对其进行 了阐释。目前,负责浯义v e r b 相关标准的设计、制定及修订的机构包括:w 3 c 的语义 w e b 论坛饷拉于2 0 0 1 2 ,其前身是元数据论土j 0 、网 f 核心工作组( 2 0 0 1 4 ) 。w e bo n t o l o g y 工作组( 2 0 0 1 8 ) 。 现在的w e b 是按网页地址的线性链接,未来的语义w e b 网页是本体0 1 t 0 1 0 刚的实 例及其到其他实例的链接。 ( 3 ) 语义w e b 效能的发挥依赖于b 上本体的增加 语义w e b 是全球知识网,其最终结果是个巨大的数据结构,语义w e b 的建立是 一项很具挑战性、十分困难而又具有重大意义的工作,其困难主要表现在技术、观念以 及内容的规模e 圈。不可能在短时间内建立语义w 出的所有技术标准,w e b 上的每量信 息也不可能在短时间内全部建立语义标记。 目前,语义w 曲刚刚兴起,其力量即在信息检索、电子商务、知识管理等领域有 所展示,但语义w e b 效能的发挥,强烈依赖于w 出上本体的增加。 语义w e b 目前盼研究现在还主要侧重于知识表示与推理方面,w 3 c 已经确立本体 层及其以下各层知识表示语言的技术标准,这些技术僦该尽快得到广泛的研究和应 用,在此基础使越来越多的领域知识和企业毁据按照逸! 敷术鼯难得到表示,不仅可 以解决当前企业应用集成与领域知识交换共享的某些实际问题,也是真正发挥语义 w e b 潜能的必由之路。 2 武汉理工大学硕士学位论文 1 1 1 2 概念建模介绍 概念建模的目的是获取和表现 们理解现实世界的某些方面,而它在信息系统及软 件应用开发中起了重要作用,也是数据库早期开发阶段的产物。由于其简单易用,已被 广大开发人员接受,常用的概念模型如:e _ r 模型。 概念模型的建立是一件既费时又枯燥的工作,通常需要分析人员不断与用户交流, 以获得应用领域的需求信息。目前,概念建模的方法理论已经取得了很大的进步,许多 数据库厂商纷纷推出c a s e 工具( 例如s y b 吲的p o 哺。臣姆h ) ,这些工具除了可以画 各式复杂的图外,还能够对设计中的句法进行致陛检查。但是,这些工具仍然存在不 足,即无法提供数据库设计中的大量领域知识。 由于开发 、员对应用域的不熟悉,常常会出现误解的现象,这将为后面的设计工作 带来困难。倘若,在数据库建模时,加入应用领域的知识,c a s e 工具的功能将更办1 1 强 大。利用领域知识评估设计的b r 模型的完备隆和一致陛,数据库设计工具将支持更高 程度的建模工作,达到更高程度的建模自动化。 1 1 1 ,4 为什么用本体 本体作为知识工程的一个工具,其构造依赖应用域,利嗣本体对常识进行定义,采 用本体存储应用域中的概念、联系及应用需求等,利用本体的主要目的是使计算机能 “理解”概念,并实现所研究问题的半自动、自动处理,毙们采用本体对域概念进行划 分、存储,使我们的处理过程可以半自动化地执行。 本体可以为数据库设计提供瓣口识。首先,储存在本体中的领域知识能够有助于 数据库设计,因为它可以建议什么术语可以出现在应用领域,以及如何使这些术语与其 它术语联系。另外本体中的约束映射于应用域的交易规则,而这些规则暗示着数据库设 计中的语义完整隆约束。其次使用本俸可以检查设计中存在的遗漏。本体作为领域语义 的知识基础,可以在两个主要阶段来改进数据库设计,分别是设计和确认设计阶段。在 设计阶段,我们通过利用本体中的术语和关系作为应用域的典型模型,进行设计建模。 在确认设计阶段,我们能够利用本体找出设计的模型中存在遗漏术语和不一致的地方, 针对b r 模型本体,为应用领域中的实体和关系提供最合适的标签。概括使用本体进行 数据库建模的几点原因如下: 1 沱将大大减轻设计者( 特别是不熟悉应用领域的设计者) 的工作量。 2 ) 当设计不完全时,本体能够向设计者显示术语,以便对遗漏的术语进行检查,而且识 别它们如何同其它的术语关联。 武汉理工大学硕士学位论文 3 ) 本体能够用来对因为遗漏某些模型的设计进行分析。 1 ,1 2 与本课题有关的国内外研究现状分析 现今,本体的研究仍然主要集中于理论的研究。j a v a 和x m l 等技术的出现将n 口速 本体研究的发展,其实用前景十分广阔。研究的成果例如:本体语言标准的制定 ( w 3 c 规定) 、本体( 领域本体) 建模方法、本体编写工具( 例如:p 慨轷2 0 0 0 、 s e n t a l k 等) 、本体管理系统( 例如:i b mq m 出斟m 瑚g 锄e r t 跚曲了n s n o b a s e ) 。相 关概念介绍如下: ( 1 ) 本体的标准( ( h l :o l o g ys t a n d a r d s ) w 3 c 对本体标准提出了一系列的推荐规范,并作为语义w 曲体系结构的部分。 下一章将对语义w 曲进行详细的介绍。 以下是对w 3 c 推荐的部分标准作简要介绍。x m ld i d 为结构文档提供了表层语 法,但是在这些文档的语义e 没能提供具有语义的约束。亿s d 黜为上述问题提出 了解决方法,它可以对) m 几文档结构提供约束。r 峨r e 姒| l 。e 瓣枷m 磁眦翮嘲语言 可以对对象( 资源) 和对象间的联系建立数据模型,并且为数据模型提供简单的语义。 数据模型本身由x m l 语法表示。r d fs d 曩m 是一个词汇表,用来描述r d f 硝珊的 属性和类别。r d fi 圉姒的属性和类的层次关系可以通过语义来描述。o w t ( w 出 q 自。蛐l a 凹_ 薛漕加了更多描述属性和类别词汇,以及类之间的联系,等价陛,提供 更丰富的属性种类。o w l 继承了前者d a 4 v i l + o i l 的成果。总之,o w l 为x m l 、 r d f 、r d f s d 廿n a 表达语义增加了便利,从而在表达机器可读的内容方面超过了上面这 些语言。在本研究工作中将采用o w l 作为本体的描述语言。 ( 2 ) 本体设计和管理工具( 0 r r t o l o e yd e s i g na n d 怕怕i 邸e n tt o o l s ) 时下,有超过5 0 多种本体工具,副门都是由非盈利研究组织或商业软件提供商开 发。其中大多数的本体工具是进行设计和编写本体文件的。有部分工具除了编辑功能 2 _ 9 嘲! 提供了更多的功能,e 匕女口:一定的分析、修改、维护本体的能力。在这些本体工 具中由斯坦福大学开发的p i 嘣西2 0 0 0 是最普遍使用的。另外还有其他的几种工具, 如:s e n t a k ,嘶d ,u r 曲o m 等。在本研究工作中将采用p 唧辅2 0 0 0 作为本体的编写工 具。 ( 3 ) 本体管理系统( 0 r r l o l o g yh k m g 锄邕t ts y s 七哪) “ 本体定义了用来描述和表现种知识域的一系列条件和概念,而本体管理系统使应 用程序可以凭借其提供的编程接口来操纵和查淘本体,而不必共蚌体的存储方式、查 4 武汉理工大学硕士学位论文 询处理方式等等细节。从某种意义上,本体管理系统有些类似于数据库管理系统 ( d b c s ) 。d b m s 允许应用程序通过标准接口存储和处理数据,而且减轻了程序的种 种负担,比如:决定如何存储数据、如何索引数据、如何使查询最优、如何得到查询结 果等等。类似地,本体管理系统也允许直用程序操纵和查询本体,而| 啦直用不需要关心 本体怎样存放和访问、查询如何处理以及结果如何获得,这些部可以通过本体管理系统 提供的编程接口实现。编写本体并不是本体管理系统至关重要的组成部分,它只是个 可选项。如果个本体管理系统没有提供编写本体的功能,它可以借助其他的编写本体 的工具,例如p t 魄鞴2 0 0 0 。i b m 在这个研究领域走在了前列,它研究出来的s n o b a s e 就是这样种本体管理系统。i b mq 蝴m 骶昏m 缸s y d n n ( 也称作s n o b a s e ,意为 s a 獭l i cn e t 咖kq 如l o 科b a 嘲,它是一个框架能够从文件中载入本体,并且可以通过互 联网对本体进行创建、修改、查询和存储。 1 1 3 意义 x m l 作为项突破性技术,它正在迅速成为信息交换和存储的通用形式。x m l 数 据的存储需求引发了对x m l 数据库技术的研究和应用,使之成为近年数据库学术界和 工业界的一个热点问题。x m l 数据库设计方法和工具对x m l 数据库的应用和推广起着 举足轻重的作用。 本体定义了用来描述和申明个知识域的条件、规贝忻嘴聒念。一个本体提供了一个 模型编码的方式,并且本体己经被采纳为语义w e b 的一层。利用本体可以将一个模型 具体化,在共享或重用知识的时候应用更加容易,而且增强了信息的导航和检索能力。 另外它使定制应用软件更加容易不用修改代码。由此,认为在数据库建模时,特别是基 于某领域建模时,能够有本体作为支撑,将使建模工作更加方便迅速。 作为武汉理工大学科研基金资助项目“x m l 数据库设计方法与工具研究”的部 分,本研究的主题是“本体的构造及其应用研究”。研究的目标是:利用本体建模的方 法,构建某领域的本体;将本体应用于x m l 数据库设计工具的开发中。使此工具对 该领域建模时,由本体技术对建模成果进行优化调整。 在x m l 技术广泛应用的今天,x m l 数据也急速增长。从而引出x m l 数据库技术 的研究和应用,传统的数据库建模方式显得力不从心。x m l 作为一种数据交换规范, 为将本体应用到x m l 数据库设计提供了便利,本体技术的应用将大大陌蝴库建模 的难度。此课题具有很强的理论价值和实际价值。 武汉理工大学硕士学位论文 1 2 论文的组织结构 本论文共分六章,其主要章节内容如下: 第二章“语义w e b ”,详细介绍了语义w e b 的基本构架,以及关键技术仉、i i ) f 、 q 岫( 本体) ,从而引出本体的概念。 第三章“本体慨述”,相对全面的介绍了本体的概念,构建本体的方法论,描述本体的 语言以及构建本体的工具。并目通过文档举例,讲解了如何利用o w l 语言编写本体。 第四章“领域本体的构建”,基于匕章本体的理论等知识,本章运用了种新的构建本 体的方法,并目选取某领域作为构建领域本体的对象,详细讲解了整个构建此领域本 体的过程。在构建本体的过程中,编写本体采用了w 3 c 推荐的本体描述语言o w l ,本 体编写工具选择群蟾囝0 0 0 。 第五章“本体在数据库概念建模中的应用”,尝试将本体应用到数据库概念建模。在本 章中,i 甩过分析本体与e r 模型的关系,以及本体在数据库档捻建模中的作用,探讨了 应用本体辅助b r 建模设计的基本方法,提出了种“本体辅助数据库概念建模的框 架”。在整个辅助概念建模框架中,利用本体向设计者提供领域知识,来辅助数据库的 设计。并且我们通过一个原型系统来验证这个框架的可行陛。 第六章“总结和未来研究方向”总结全文,并且说明了下一步的研究工作。 6 武汉理工大学硕士学位论文 2 1 概述 第2 章语义w e b w e b 从1 9 9 1 年出现以来,其上的信息量以几何级数的速度增长,经过1 0 年已经发 展成为一个巨大的全球化信息资源库。然而,在伴随着w e b 成功的同时,呈指数级增 长的海量信息使得来自各领域的用户对信息的查找、访问、表示以及维护变得越来越困 难起来。“丰富的数据和贫乏的知识”问题越来越突出,主要的原因是目前的w 曲对 知识的表示主要是“呈现”式的,大量的信息以自然语言、图片等方式罗列出来,使人 淹没于知识的辨别、提取等繁杂的劳动中。对于目前w e b 上的信息,计算机只能从格 式上来处理和验证并不能处理知识级别的问题。 为了解决这种问题,人们提出了语义w e b 的概念。语义w e b 的发展为在语义级匕 进行信息的描述和知识表示提供了种崭新的、非常有意义的手段。语义w e b 的思想 就是利用元数据( m 由d 血龉言对w e b 信息资源的内容进 亍_ 晤义匕的描述,从而使计算 机能够利用这些语义信息对信息资源的内容进行理解和处理,并在此基础上,实现更高 级的、基于知识的智能直用。从计算机科学知识表示的角度来说,语! ;c 是建立在一定的 语法上,反映一定认知结果的数据对象、数据对象之间关系的描述与客观存在的种对 应关系。语义w e b 中采用的知识表示方法,是为了满足计算机能够理解w 幽上的内 容,并对其进行判断和推理,满足智能代理( a g 绷耐w w w 上异构和分布信息的有效访 问和搜索的需要,而产生的基于基本知识表示方法的新思想。因此,语义w e b 中的语 义与对客观存在的概念化以及描述认知结果的语言密切相关。定义这种语义的核心就是 在数据的相互关系中定义数据的含义。 语义w e b 的建设分成三个步骤:通过标记语言( 女口皿) 定义套术语,用r d f 、 o w l 等本体描述语言对其进行基本的语义描述,形成某个领域的本体,这样不断地在 网络中建设很多本体:然后编制软件,能够根据本体之间的关系进行推理;最后基于推 理软件建设应用。b e m 髓- i x c 认为:语义w e b 将会给网页有意义的内容带来结构,从而 为网络中的代理了用户复杂需求的a 9 缸,提供一个具有足够信息丰度的环境。 武汉理= _ 大学硕士学位论文 2 2 语义w e b 构架 b e m n s - k e e 为未来的w e b 发展提出了基于语义的体系结梅语义w e b 体系结构, 如图2 - 1 所示:从底层到高层分别为:u r k o d e 与u r i ,x m l ,r d f ( s ) ,q 蝴, i 面,p r o o f , t r u s t 。 图2 1 语义w 曲体系结构 ( 1 ) u r a c o d e 和u r i 层 这是语义w e b 的最底层。u n i c c d e 是个字符编码系统标准,支持世界上所有主要 语言文本的混合,它可以保证我们使用国际化、通用化的字符集,避免不同类型字符集 之间由于编码不同而造成的存储、传递和使用上的混乱,同时也可以实现多国语言的混 合存储和使用。负责标识资源的u r i ( 【恻删r 瑚姗是u r l ( 【恻 r s c l 耶匝嘞) 的超集。u r i 是h 衄矗资源的种识别方法,在语义w e b 中,任何可以 被描述的事物无论是网络中的个w e b 页面或者站点,还是现实中的个人、一 座房子、一张桌子等,都可以称为资源,每一个资源都由唯一一个u r i 所标识,不同 的资源捕有不同的u r i ,通过指定的u r i 可以确定互联网中唯个资源( 即定位的唯 一l 生) 。 圆x m l + n s + x m l 蛐层 这是语义w e b 中首要的关键技术,也是整个体系结构的基础。用于从语法e 表示 数据的内容和结构,通过使用标准的格式语言将网上资源和信息的表现形式、数据结构 和内容分离。 x m l 是种允许自定义标记的通用、结构化描述语言,已经成为描述w e b 文档和 数据的标准化语言。名称空间n s 锄酬为x m l 文档中的结构化标记提供了上下 文环境,一方面为文档中的每个标记都赋予了确定的含义,另方面将不同上下文环 武汉理工大学硕士学位论文 境中相同名称的标记区分开来,从而避免了语义上的歧义。x m ls d l m l a 在标记的使用 和文档结构上,为x m l 文档提供了明确的语义限制,最终确保每一个x m l 文档都是 语义合法、结构完整、内容有效的。 ( c ) r 1 + i t d f s d h m 层 其提供的语义模型用于描述w e b 上的资源及其类型,为网上资源描述提供了种 通用表示框架,实现数据集成的元数据解决方案。 r d f e 娴瞄d e 懿蚴曜m :呐d ( ,资源描述框架) 定义了一种用以描述资源及其相 互关系的简单模型,是语义w e b 实现的关键技术之一,也是语义信息描述的有效手 段。其基本数据模型包含三类对象:资源、属性和陈述;资源之间的关系通过属性和值 来描述。描述特定资源特定属性的值,就构成r d f 中的一卟陈述,通常可以用三元式 勺硒畦雕d 幽d j o 咿描述;其中,被描述的资源称为咄i 酣,描述资源的属性称 雕d i c 跪,喇瞅则是屙龇的值。r d f 建立在x m l 和u r i 的基础上。 r d f 通过属性和值描述了资源及资源之间的关系,但并没有提供描述这些属性及 属性问关系的机制。r d fs d h 耐简称r i 硅s ) 提供了这种表达机制,它描述了r d f 弭p 自 i i 鹧的使用规则,为r d f 定义了领域字典,并用类型层次结构来组织该字典,从而 构成完备的语义空间。r d f 和r d fs d h m 合称r d f ( s ) 。 x m l 和r d f 都能为所表述的资源提供一定的语义。但是x m l 中的标签和r d f 中 的屙眭集都没有任何限制,x m l 和r d f 不能处理以下问题:同一僦有多种词汇表示; 同个词汇表示多种概念。这一问题在本体层得到解决。 ( 4 ) q 蝴词汇( 、伐出d 口县 其用来定义应用领域中的共享知识,从而对各种资源之间的语义关系进行描述,揭 示资源本身以及资源之间更为复杂和丰富的语义信息。语义信息的交流必须以共同的理 解为前提,否则双方就会发生误解或者不理解。在语义w e b 中,这一“共同的理 解”,即共同的语义空间,是由本体建立和提供的。 本体最早是个哲学上的概念,用于描述事物的本质。在近一、二十年来,本体论 己被计算机领域所采用,用于知识表达、共享及重用。许多学科和研究都在使用“本 体”这个术语,但存在不同的定义。在 、工智能界,最早给出q d o 掣定义的是 等人,f t 卧f 鸺q 吐哥定义为“给出构成相关轫倒i i 司汇晦黔蚓谓和关系,以及利用这 些术语和关系构成的规定这些词汇外延的规则的定义”。1 9 9 3 年,q u b c :给出了 q 删。斟的一个最为流行的定义,即“q 由i d 斟是概念模型的明确的规范说明”。后 来,b o d 在【比= 基础e ,给出了。吲o g y 的另外种定义:“q 蝴是共享概念模型的 形式化规范说明”。1 9 9 8 年s n d 置对上述两个定义进行了深入的研究,将本体定义为 “共享概念模型的明确的形式化规范说明”,其中概念模型,指通连 由象出客观世界中 些现象的相关概念而得到的模型,其表示的含义独立于具体的环境状态;明确,指所 9 武汉理工大学硕士学位论文 使用的概念及使用这些概念的约束都有明确的定义;形式化,是指计算机可读的;共 享,指本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集。 关于本体,目前尚无个明确的形式化定义,可以将一个本体定义为个四元组: 0 e ( c ,凡a ,d 。其中c 表示o 中概念集合;r 表示o 中概念之间关系集合;a 表示 公理集合,常在其中定义o 中的相关约束;i 是c 的实例集合。 本体通过定义属性并建立一个分类层次结构,将不同的概念区别和组织起来,同时 也通过属性将概念相互联系起来,从而建立起概念的语义空问,亦即对某个领域内事 物的共同理解。这些概念和属性的名字构成了本体的词汇表。在语义w 出中,本体具 有j 常重要的地位,是解决语义层次上w 由信息共享和交换的基础。为了便于w e b 上 应用程序使用方便,本体需要有个通用的标准语言来描述和建构。 本体的上层:b 出,h 0 0 f 和1 破层 这三层位于语义w e b 体系结构的顶部,也是语义表达的高级要求,目前正处于研究 的阶段,也有些简单的示范性应用系统正在建设中。其中,逻辑层提供了推理规则的 描述手段,证明层通过运用这些规则进行逻辑推理和求证,而信任层则负责为应用程序 提供一种机制以决定是否信任给出的论证。 固数字签名谤哟 数字签名位于层次模型的右侧,并且贯穿于中间的四层。数字签名是种基于互联 网的安全认证机制。当信息内容从个层次传递至4 另个层次时,撇用数字签名说 明内容的来源和安全性,这样接受方就可以通过数字签名鉴别其来源和安全性以决定是 否接受。数字签名对于语义w 曲及其他使用x m l 进行信息交换的系统非常重要。 在这个层式结构中,上层将下层的语言机制作为本层的支撑语言。通过分析器,从 合法有效的下层瞄述中抽取出本层所能理解的模型,实现更多的语义处理功能。因此, 语义w 曲是向下兼容的,当用r d f x m l 表达o w l 时,如果只有i e ) f 分析器,可以部 分解释该本体内的类结构,只要忽略其中带肌玉前缀的元素即可,但能完全解释该本 体内的所有实例,因为这只是语法相关的。由于w 出上的海量信息不可能在短时间内 全部建立语义标记,而且语义的标记方法也将不断发展,这种向下的部分可解释性为语 义w 曲的发展提供了良好的基础。 语义w d ) 研究的主要目的就是扩展当前的w w w ,使得网络中所有信息都是具有 语义的,是计算机能够理解和处理的,便于人和计算机之间的交互与合作。语义w e b 目前的研究现在还主要侧重于知识表示与推理方面,而对于用户来讲,语义w 曲应该 提供种丰富完善的服务,种在知识表示与推理之匕的服务,这些服务由具有智能的 代理来提供。 1 0 武汉理工大学硕士学位论文 2 1 3 语义w e b 的关键技术 2 3 1 ) 札技术 x m l 嘁h 罂蹿,可扩展标记语言) 是w 3 c 删w i d ew e b g 。峨衄m ,万维网联盟) 推荐的下一代网页发布语言,是一种定义标记语言的工具。 x m l 是s g m l 瓤啪g c n 醐谊m 翦k u pi 舶目n 萨,标准通用标记语句的子集,保存了 s g m l 可扩展性、结构化和有效性等特点。虽然,x m l 和h t m l 都是s c i m l 的子集, 由于在扩展| 生问题上的差异,相比较而言,h t m l 是对w e b 页面的数据显示风格的描 述,而x m l 是对w e b 页面数据的描述。x m l 使用简单灵活的标准格式,为基于w e b 上的应用提供了一个描述数据和交换数据的有效手段。 x m l 用来描述结构化数据,包括以下几个方面内容:m d ( r t x l n 眦t y p er 盘r 血硫 文档类型定义) 、x s l ( e y a m s i l 盘s t y l e a 矗l a n 驰咎可扩展样式语言) 和x l l ( 触l i n k l a 舶萨可扩展链接语言佯。 d i d 规定了x v i l 文件的逻辑结构,定义了x m l 文件中的元素、元素的屙陡以及 元素与元素之间的关系。它可以帮助x m l 的分析程序校验x m l 文档标记的合法性; x s l 是用于规定x m l 文档样式的语言,它能在客户端使w 曲浏览器改变文档的表示 法,从而不需要再与服务器进行交互;上将进一步扩展目前w e b 以后的简单链接。 x m l 中的另个基本概念是x m l 删拦擎瞄( x m l 名字空间) ,指的是也文档引 用多个d i d 的标记的机制,通过在标记前加入d i d 的引用前缀,可以避免不同组够濑 用相同名称的标记而引起的冲突。由于x m l 提供了套把不同信息源的数据用统一的 方法进行数据结构化的机制,就为w e b 上的资源提供了种统一格式,使信息独立于 平台之间,x m l 文档的结构化表示,使数据的提取更容易。x m l 的应用模型女l ;i 图2 2 所示: 图2 2 也的应用模型 武汉理工大学硕士学位论文 x m l 作为种资源描述语言,不仅提供对资源内容的表示,同时也提供资源所具 有的结构信息。x m l 让每个人者阿以创建自己的标记,允许用户在文档中加入任意的 结构,但无须说明这些结构的色义。对于语义网来说,仅有x m l 是不够的,还需要提 供描述x m l 资源的元数陬即m 嘲d 如,是关于数据的数据,也就是对所描述的对象结 构或内容所作的规范说明) 。r d f 是w 3 c 推荐的用于描述和处理元数据的一个草案,是 处理元数据的基础。 2 3 2r d f 技术 r d f ( r e s a l x e 啦啦! f m m e w o d ( ,资源描述框架) ,是w 3 c 推荐的种通用的元数 据结构,是描述和交换元数据的框架,是处理元数据的基础。它用x m l 进行表达,其 目的是提供个访问网络资源元数据的标准,因此也疑供了个描述特定资源内容的标 准协议。r d f 解决的是如何采用x m l 标准语法无二义l 生的描述资源对象的问题,使得 所描述的资源的元数据信息成为计算机可以理解的信息。如果我们把见看作为_ 中 标准化的元数据语言规范,那么r d f 就可以看作为一种标准化的元数据语义描述规 范。r d fi 雌于x m l 语法的明确的结构化约定来帮助建立语义协定和语法编码之间 的桥梁,以此来促进元数据的互操作能力。r d f 本身并不规范语义,但是它为每个资 源描述体系提供定义反映某特定需求的语义结构的能力。从这个意义上讲,r d f 是一 个开放的元数据框架。 语义w e b 的首要目的就是要让计算机能够对信息的语义进行处理,作为w 3 c 标准 的r d f 为基于元数据的语义表示提供了基础。r d f 为在w e b 上应用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 临床试剂工岗前复试考核试卷含答案
- 社群健康助理员操作规范水平考核试卷含答案
- 粉末冶金工艺及材料课件
- 房源统购合同范本
- 采耳行业合同范本
- 写转让合同协议书
- 香皂购销合同范本
- 通信安全协议合同
- 劳务兼职合同范本
- 投资占股合同范本
- JZ-7型空气制动机解析课件
- 社会研究方法风笑天
- 激光切割软件lasercad说明书
- 柑桔周年管理工作历第二版课件
- 学生教职工每日晨检午检流程图
- 医学髌上入路髓内钉技术治疗胫骨骨折专题课件
- Q∕SY 1775-2015 油气管道线路巡护规范
- 高处作业吊篮安装验收表(范本模板)
- [管理]企财险风险查勘记录
- 中药学综合知识与技能考试卷
- 220th煤粉锅炉热力设计热动专业锅炉原理课程设计书
评论
0/150
提交评论