




已阅读5页,还剩115页未读, 继续免费阅读
(计算机软件与理论专业论文)资源空间模型自动构造及操作语言研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 资源空间模型是面向网络资源的具有语义的模型,该模型基于网络资源的分类语义 组织和管理资源。资源空间模型利用多维资源空间定位资源,用户在资源空间中浏览、 共享和操作资源,提高了资源组织的效率。资源空间的范式理论保证资源空间的正确性 和高效性。 资源空间涉及到领域知识和相关资源,主要依靠系统分析员设计和构造资源空间, 需要结合领域知识对资源进行分类。这个过程工作量大,容易受到设计者的个人知识水 平,设计技巧等因素的影响。因此本文深入研究并解决了资源空间的自动构造问题,提 出了资源空间转换为领域本体的原则和方法,定义了资源操作语言的基本功能和语法。 另外探讨了构建资源空间模型系统所涉及的技术问题,并且将该系统应用于敦煌学研究 领域,本文主要的研究工作包括: 1 提出一种从0 w l 文件自动构造资源空间的方法。该方法的基本思想是利用o w l 文件所描述的资源和领域知识,将0 w l 中的个体转换为资源,资源的继承结构转 换为继承坐标轴,资源的属性转换为属性坐标轴,资源和坐标轴共同构成资源空间。 对构造的资源空间进行了范式理论分析,证明其满足第一范式和第二范式,另外提 出并证明了构造的资源空间满足第三范式的充分条件,可以作为构造时的参考原 则。本文所提出的构造方法,一方面减轻了人工构造资源空间时的劳动负担,另一 方面也避免了个人因素的影响,使构造的资源空间能够客观地反映资源的分类语 义。该方法使资源空间模型在不同领域的应用更加容易。 2 提出一种资源空间的评价方法。针对资源空间模型缺乏语义表达方面的评价方 式,提出了资源空间予空间及论域内最大资源空间的概念,从语义表达的角度为资 源空间的提供了一种新的评价标准。 3 提出由资源空间转换为o w l 描述的领域本体的方法。其基本思想是将资源空间 所表达的分类语义,转换为0 w l 文件中的相关语句,如个体、类和属性等。根据 资源空间构造的o w l 文件可以反映资源的基本特征、分类语义和继承关系等。对 于已经构造了资源空间领域,利用该方法可以辅助进行领域本体的构造。但由于资 源空间仅仅涉及到资源的描述和分类语义,由资源空间构造的本体不能够表达完整 的领域知识,需要补充其它相关语义信息。 4 定义了资源操作语言的基本操作和语法。本文阐述了资源操作语言的基本功能, 定义了r o l 的基本操作和语法,并为r o l 的实现提供了可参考的策略和步骤。将 资源操作语言与s q l ,x q l ,r q l 等查询语言进行了分析与比较。 5 构造了基于资源空间模型的资源管理系统。本文对基于资源空间模型的资源管理 系统的系统架构、工作流程等进行了描述。资源空间以特定模式的x m l 文件形式 存储,用户利用三维浏览器对资源空间进行交互式浏览和操作。该原型系统为资源 空闻模型的实现提供了一个良好的基础。通过与敦煌研究院的合作,将资源空间模 型应用于敦煌学研究领域,开发了基于资源空问模型的敦煌学资源管理系统。该系 统中收集了大量的敦煌学资源,构建了若干敦煌资源空间,并通过资源空间组织和 管理资源。该系统提高了研究人员的研究效率,有利于敦煌文物的保护工作。 关键词:本体;敦煌学;分类语义;网络本体语言;网络资源;语义网;知识网格;自 动构造;资源操作语言;资源空间模型 r e s e a 眦ho na u t o m a t e dc r e a t i o na n do p e r a t j o nl a n g u a g eo f r e s o u r c es p a c em o d e l p e n gs h i ( c o m p u t e rs o r w a r ea n dt h e o r y ) r e s o u r c es p a c em o d e i ( r s m ) i sas e m a n t i cm o d e lt oo 略a i l i z e ,l o c a t c 蜘do p e r a t ew 曲 r e s o u r c e si nm u l t i d i m e n s i o n a ir e s o u r c es p a c e s i t se a s yf o ru s e r st ou n d e r s t a i l dr e s o u r c e s p a c e 锄dl o c a t er e s o u r c e sb e c a u s er e s o u r c es p a c ei sb a s e do nt h ec l a s s i t i c a t i o ns e m a n t i c s r s mi m p r o v e st h ee 硒c i e n c yo fo 唱a 1 1 i z a t i o n 卸dk a t i o no fw e br e s o u r c e s 1 1 1 en o 册a l f b 舯so fr e s o u r c es p a c eh a v eb e e np r o p o s e dt og u a r a n t e et h ec o r r e c ta n de 历c i e n tu s a g eo f r s m 。 r e s o u r c es p a c e sa r eb 鹬e do nd o m a i nk n o w l e d g ea l l dr e s o u r c ea n a l y s i s t h e ya r ea l w a y s d e s i 朗e da n dc r e a t e db ys y s t e ma n a l y s t sm a i l u a l 】y t h ei n d i v i d u a lf 如t o i s ,s u c ha sp e r s o n a l o p i n i o i i s ,l ( i i o w l e d g el e v e la 1 1 dd e s i g ns k i l l ,m a yi n n u e n c et h ed e s i g nr e s u l to fr e s o u r c es p a c e 1 oa v o i dt h es h o r t c o m i n 叠so fm a n u a ld e s i g i l ,t h i sw o r kg m d i e st h ei s s u e so fa u t o m a t e d c r e a t i o no fr c s o u r c es p a c e t h ep r i c i p l e st o 仃a n s f o 哪r e s o u r c es p a c ei n t oo n t o l o g ya r ea l s o p r o p o s e d n e 缸1 c t i o n sa 1 1 ds y n t a ) 【o fr e s o u r c eo p e r a t i o nl a n g u a g e a r ed e 6 n e d t h e i m p l e m e n 诅t i o na n da p p l i c a t i o no fr s ms y s t e ma r ea l s od i s c u s s e d n l em a i nc o n t 曲u t i o n i n c l u d e s : 1 p r o p o s eam e 慨o dt oa u t o m a t i c a l l yc r e a t e r e s o u r c es p a c e s6 d mw e b0 m o l o g y l a n g i l a g e ( o w l ) t h em a i ne l 锄e m so fo w li n c l u d ei n d i v i d u a l s ,c l a s s e s a n d p r o p e l t i e s o l l rm e t l o dc o n v e r t si n d i v i d u a i si no w l i n t or e s o u r c e si nr s m ,t h e i 1 1 1 1 e r i t e dh i e r a r c h ya n dp r o p e n i e so ft h er e s o u r c e si n0 w li n t oa x e si nr s m t h e r e s o u r c e sa n da ) 【e sc o m p o s et h et e s o u r c es p a c et o g e m e t i fa no w l f i l ei sw e l l d e e n e d , t h er e s o u r c es d a c ew h i c hi se s t a b l i s h e df 而mi ts a t i s f i e st h ef i r s t n o 册a l f o 册a n dt h e s e c o n d n o m l a l f o 珊at h e o r e mi sg i v e nt os h o wt h es u 衔c i e n tc o n d i t i o n ,u n d e rw h i c h t h er e s o u r c es p a c ec a n 鼢t i s 矗t h et h i r d n o 帅a l ,f o 哪t h i sm e t h o dc r e a t e sr s mf 幻m o w l 叫t o m a t i c a l l y 1 t1 i 曲t e n st h eb u r d e no fm a l l u a ld e s i g na n dr e d u c e st h ei n n u c e s c a u s e db yi n d i v i d u a lf a c t o f s 2 p r o p o s ean e wm e t h o dt oe v a l u a t er e s o u r c es p a c e t h es u b s p a c ea n dm a x l m u ms p a c e o fr e s o u r c es p a c ea r ep r o p o s e d t h e yc a l lb er e g a r d e da san e wp r i n c i p l e ,丘d mt h e s e m a l l t i c sr 印r e s e m a t i o na s p e c t ,l oe v a i u a t ear e s o u r c es p a c e 3 p r o p o as e to f 研n c i p l e si no r d e rt oc o n v 鳅r e s o u r c es p a c ei n t oo m o l o g yd e s c 抽e d b yo w l i nm ed o m a i nw k 托r e s o u r c es p a c e sh a v eb e e nc r c a t e d ,r e s o u r c es p a c e sc a i l d i r e c tt h ec r c a t i o no fo m 0 1 0 9 ya n db ec o n v e r t e di n t oc o 玎e s p o n d i n go w ld e s c r i p t i o n s t h e0 w ld 嘶v e dc a nr e p r e s e n tt t l er e s o u r c e s ,t 1 1 e i rc l a s s i f i c a t i o ns e m a n t i c s a n d i n h e r i t e dr e l a t i o n s h i p s b e c a u s er s mm a i n l yr e p r e s e n t sc l a s s i f i c a t i o ns 锄a n t i c so f r e s o c e s ,也eo n t o l o g yt r a i l s f o n n e df 如mr e s o u r c cs p a c ec a n tr e p r e s e n tc o m p l e t e d o m a i nk n o w l e d g e 0 t l l e rr e l a t e di n f o 咖a t i o ns h o u l db ea d d e di n t ot h eo w l f i j et o e n h a n c et h er e p r e s e n t a t i o no f r e s o u r c e s s e m a i l t i c s 4 d e f i n et h eb a s i c0 p e r a t i o n so fr e s o u r c eo p e r a t i o nl a n g u a g ea n dd e f i n et h es y n t a x i i i 蹰ds t a t e m e n t s t h er e s o u r c eo p e r a t i o nl a n g u a g ep r o v i d e sau n i f o m li n t e r f h c ef o r p r o g r a m m e r st oo p e m t er s mm r o u g hp r o g 豫m s t h i sd i s s e r t a t i o na l s op r o p o s e st h e u s e 如ls t r a t e g ya n dp r o c e d u r et oi m p l e m e n tt h er o l 1 1 1 ec o m p 撕s o no fr o l ,x q l , r q l 柚ds q li sa l s op r o p o s e da n da n a l y s e d 5 c o n s t n l c ta nr s ms y s t 哪a n dp r o p o s eah i g h l e v e la p p j i c a t i o np l a t f o 咖u s e r sc a l l o 唱a i l i z ea i l ds h a r ew 曲r e s o u r c e su n d e rt h ei n t e r a c t i o ne n v i m 砌e mp r o v i d e db yt h e r s ms y s t e m u s e r sb r o w s er e s o u r c es p a c ea n do p e 硎【er e s o u r c e st h r o u g has p e c m ct o o l c a l l e d3 d b r o w s e r r e s o u r c es p a c e sa r es t o r e di nx m lf i l ew i t has p e c i f i cs c h e m a w i t h t l l ec o o p e r a t i o no f d u f l l l u a | l ga c a d e m y ad u l l l l u a n gr s ms y s t 啪h a sb e e nd e v e l o p e db y i n t r o d u c i n gr s mi m od u i l l m a r i g r e s e a r c ha r e a s o m ed u i 山u a n gr e s o u r c es p a c e sa r e c r e a t e db a 辩do nt h e 柚a l y s i so fd u l l l l u a i l gr e s o u r c e s n ef i o wc h a r ta 1 1 di n t e m l c e so f 也i ss y s c e ma r eg i v e n 弱w e l l t h i ss y s t e mi 巾r o v e s 也ee 砸c i e n c yo fr e s e a r c ha n d b e n e f i t st h ep r o t e c t i o no fd u n h u a n gr e l i c s k e y w o r d s :a u t o m a t e dc r e a t i o n , c l a s s i f i c a t i o n s e m a l l t i c s ,d u n h u a n g ,o n t o l o g y , o w l , k n o w i e d g eo r i d ,r c s o u r c eo p e r a t el 锄g i l a g e ,r e s o u r c es p a c em o d e l ,s e m 肌t i cw e b ,w e b r e s o u r c e s j v 图目录 图1 1b e m e 隆l e e 提出的语义网模型2 图2 1 二维资源空间举例 图2 2 不同范式的资源空间集合1 3 图3 1 语义网语言栈的示意图。2 1 图4 1 由o w l 构造资源空间的流程示意图2 6 图4 2 敦煌文件资源的继承结构 图4 3 敦煌资源空间的继承坐标轴 :1 9 图4 4 对多继承处理的举例3 l 图4 5 对具体类处理结果举例3 3 图4 6 由属性c a v e n u m b e r 构造的数据类型坐标轴3 5 图4 7 类c o n t e n t c l a s s 的继承结构及资源的取值。3 8 图4 8 由属性c o n t e n t 构造的对象坐标轴3 8 图4 9 敦煌文件资源空间的结构示意图3 9 图4 1 0 满足第三范式充分条件举例4 5 图5 1 三维大学学生资源空间。5 4 图5 2 具有细分结构的g r a d e 坐标轴5 7 图6 1r o l 程序解析执行流程图。7 5 图7 1 资源空间模型系统结构。8 0 图7 2r s m 系统中操作和通信示意图8 0 图7 1 3 二维资源空间存储举例。8 3 图7 4 资源空间构造器( r s b u i j d e r ) 的操作界面8 6 图7 5 三维浏览器3 d b r o w s e r 界面示意图8 7 图7 6 确定资源后的3 d b m w s e r 界面8 8 l x 图7 7 资源空间模型系统运行平台结构图8 9 图7 8r s m 系统的工作流程图9 0 图7 9 敦煌资源的主要分类示意图9 2 图7 1 0 敦煌学领域对于洞窟内容的详细分类示意图9 4 图7 1 l 敦煌学资源空间系统的基本流程图9 7 图7 1 2 敦煌学资源空间载入界面9 8 图7 1 3 敦煌学资源空间系统和定位的资源9 9 图7 1 4 敦煌学资源空间系统中修改资源的界面1 0 0 图7 1 5 敦煌学资源空间系统中资源上传的界面。1 0 0 x 表目录 表2 1 多维数据库和数据立方体与资源空间模型的特征对比表1 1 表2 2 范式基本概念与功能对比表。1 3 表3 1 本体概念的提出与演变1 8 表3 2 本体描述的基本关系表。1 9 表4 1x m ls c h e m a 的数据类型表3 4 表4 2 资源空问设计与数据库设计方法的比较4 8 表6 1r o l 与x q l 、r q l 和s q l 的特征对比表7 6 表7 1 敦煌相关的中国古代朝代与现代纪年对应表9 3 声明 我声明本论文是我本人在导师指导下进行的研究工作及取得的研究成 果。尽我所知,除了文中特别加以标注和致谢的地方外,本论文中不包含 其他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做 的任何贡献均已在论文中作了明确的说明并表示了谢意。 作者签名:订鹇 日期:弘咕爱夕 论文版权使用授权书 本人授权中国科学院计算技术研究所可以保留并向国家有关部门或机 构送交本论文的复印件和电子文档,允许本论文被查阅和借阅,可以将本 论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编本论文。 ( 保密论文在解密后适用本授权书。) 作者躲时鸦翩躲僦嗍洲7 侉 1 1 互联网的发展及现状 第一章绪论 互联网( i n t c m e t ) 从其诞生( 以1 p i p 协议成为正式标准的1 9 8 3 年1 月1 日为标 志) 以来,虽然只有短短2 0 余年,但经历了一个非常迅速的发展过程,并且广泛深入 地影响着人类的生活,目前已经成为一个非常重要的发布信息、获取和共享资源的平台。 数据的组织和管理问题,自从计算机的诞生起就是一个重要的问题,对于互联网上 的资源更是如此。数据库理论和系统已经影响了世界近4 0 年,尤其是关系数据库的理 论、模型和系统获得了巨大的成功,成为数据管理领域最成功的解决方案之一 【c o d 7 0 】【b 7 4 】。关系数据库基于关系代数理论,利用二维表的方式存储和管理数据。 面向对象的数据库和对象关系数据库利用面向对象方法和编程语言的优点,如继承和封 装等,拓展了数据库的应用范围,提供了复杂对象的规范管理方法【砌m 9 0 】【r b p e 9 l 】。 但若将其直接应用于网络资源,缺陷也比较明显,这是由于网络上资源需要一种具有开 放性,分布式,平台无关性和基于内容等特点的管理方式。针对海量、分布式的数据, 产生了数据仓库、数据挖掘和在线分析处理等新技术【i n l t l 9 3 】【c o d 9 4 】,它们的主要目的 是管理和分析历史数据并据此进行未来决策的支持,并不能满足对互联网上频繁变化、 异构资源进行组织的应用需求。 随着网络硬件和软件技术的发展和普及,互联网提供的服务和资源越来越多,而且 更新频繁。以网页为例,2 0 0 5 年8 月,著名的搜索引擎提供商雅虎( h t t p : 棚例y a h o o c o m ) 宣称其可搜索的网页数量已经达到1 9 2 亿,由此可知全球互联网上网页的实际数量已经 达到惊人的数字。对已知网址的信息和资源,用户可以根据网址进行直接访问;而当用 户试图获得未知网址的资源时,通常会利用互联网搜索服务。据中国互联网信息中心 2 0 0 5 年8 月所做的调查显示,8 6 的北京网民使用搜索引擎,5 5 的用户每天都使用搜 索,因此搜索服务对于网络资源的定位和共享具有重要的意义。搜索引擎提供的搜索服 务,是以关键字为基础,对相关网页进行关键字匹配搜索或近似搜索进行匹配 b a e 9 9 】, 但由于同义词广泛存在、网页雷同较多和网页结构多样等原因导致搜索的目标资源隐藏 在大量的冗余结果之中,用户仍然需要从中进行二次寻找。搜索引擎也能提供特定资源 的专用搜索服务,如图像、文件等,为用户提供了更专业的服务,但其搜索原理仍然是 基于关键字的匹配搜索,仍然存在搜索不精确的问题。造成上述情况的主要原因在于网 络资源缺乏语义,从而导致网络资源组织和共享效率较低,因此用户迫切需要具有丰富 语义的新一代的互联网模型和组织方法。 1 2 互联两颞模型 由于互联网新模型具有巨大的商业前景和重要的学术价值,因此吸引了来自于不同 l 中国科学院博士学位论文资源空问模型自动构造及操作语言研究 领域的研究人员在网络资源的组织、管理和应用等问题上开展研究。针对当前w 曲缺 乏语义的缺点,一些具有语义的理论模型和原型系统先后被提出,主要有语义网、计算 网格和知识网格等。语义网利用标记语言和本体论机制表达丰富的机器可理解的语义信 息【b h l o l 】,其主要研究内容为语义的表达。计算网格的目标是将互联网上分布式的计 算资源进行整合,以便提供高性能计算的服务【f o s 0 0 1 。最初的网格并不涉及语义,随着 开放网格服务结构的产生,语义成为网格的一个核心事务【f n t 0 2 】。知识网格是一个智 能互联环境,它能使用户或角色有效地获取、发布、共享和管理知识资源,并为用户和 其他服务提供所需要的知识服务,辅助实现知识创新、协同工作、问题解决和决策支持 【z h u g e 0 2 a 】。知识网格涉及的核心问题是资源的规范组织、智能聚合和语义互联。下面 两节详细介绍上述互联网的新模型。 1 2 1 语义网 语义网( s e m 肌t i cw 曲) 的目标是使w 曲资源能够被信息服务提供商所理解 【b h l 0 1 】,通过为现有的w 曲增加一层机器可理解的元数据,使计算机程序能够得出可 预知的结论【h a r 0 4 】。语义网核心技术的基础性工作和标准化工作主要是由w 3 c 组织的 语义网工作组( h 印:,m v w w 3 o e 毋,2 0 0 1 s w ) 负责。、w c 提出了语义网的层次模型( 亦 称协议栈) ,该模型由九个层次组成,如图1 1 所示【b e r 9 8 】。 图1 1b e m e r s - k 埒提出的语义网模型 1 u n i c o d e 和u l u 层 语义网的最底层是u n i c o d e 和u ( u l i i f o 咖r e s o u r c ei d e m m 砷层。u n i c o d e 定义了 国际化、通用化的字符集,以避免不同类型字符集之间由于编码不同而造成的存储、传 递和使用上的混乱,同时也可以实现多国语言的混合存储和使用。在语义网中,无论是 网络中的一个w 曲页面或者网站,还是现实中的一个人或者一个地方,任何可以被描 述的事物都可以称之为资源。每一个资源都可以用u i u 唯一标识和定位【k c 0 3 】。 2 第一章绪论 2 x m l + n s + x m l s c h e m a 层 x m l 是语义网中首要的关键技术,也是整个体系结构的基础【b p s m 0 0 】。x m l 是一 种允许自定义标记的通用结构化描述语言,目前正逐步取代h t m l 成为描述w 曲文档 和数据的标准化元语言。命名空间( n 栅e s p a c e ) 为x m l 文档中的结构化标记( m a r k u p ) 的定义和使用提供了上下文机制【b h 9 9 】,其一方面为文档中的每一个标记都( 隐含地) 指明了特定的含义,另一方面将不同上下文中具有相同名称的标记区分开来,以避免命 名冲突。“ls c h e m a 为x m l 文档提供了语法结构上的约束,最终确保x m l 文档的完 整性与有效性f h a r 0 1 】。 3 i u ) f ,m ) f s c h 锄a 层 r i ) f ( r e s o l l r c ed e s c r i p t i o nf m m e r o r k ) 资源描述框架定义了一种描述w 曲资源及 其相互联系的简单模型,j 是语义网实现的关键技术之一,也是语义信息描述的有效手段 【w w w c 9 9 】。i u ) f 基本的数据模型包含三类对象:资源、属性和陈述;资源之间的关 系通过属性来描述。对特定资源特定属性的描述,构成了r d f 中的一个陈述,用三元 组 表示,其中被描述的资源称为s u b j e c t ,描述资源的属性称 p r e d i c a t e ,o b j e c t 则是属性的取值。r d f 建立在x m l 和u 砒的基础上,通过属性描述 了资源及资源之间的关系,但并没有提供描述这些属性及属性问关系的机制。砌) f s c h e m a 提供了这种表达机制,它描述了r d f 属性的使用规则,可为r d f 定义领域本 体,并将其组织为类和属性的层次结构。 4 o n t o l o g y ( 本体) 层 语义信息的交流必须以共同的理解为前提,否则双方就会产生误解。在语义网中, 本体是概念模型的明确的规范说明,它提供了这一“共同的理解”,即共同的语义空间 f u g 9 6 】【s b f 9 8 】f g m 9 3 b 】。对于w 曲应用而言,本体的表示需要以w e b 数据表示和交 换的标准化语言为基础。基于x m l 的本体表示语言包括:s h o e ( s i m p l eh 州l o n t o l o g y e x t e n s i o n s ) i h n 9 9 】、 x o l( x m l - b a s e do n t o l o g y - e x c h a n g el a n g u a g e , h t c p : v w w o n t o i o g o s o 唱0 n t o l o g y x o l h t m ) 、 o m l ( 0 n t o l o g ym a r k u pl a l l g u a g e , h n p :,v 啪m d m 0 1 0 9 0 s o 哕o m l ,o m 协2 0 0 3 h t m ) 、r d f ( r e s o 砒c ed e s c t i p t i o nf r a m e , m p :,v n v w 3 o 锄f ) 、0 i l ( o n t o l o g yi n t e r c h a i l g el a i l g u a g e ) 【f h h m o l 】、d a m l + o i l ( d a r j ,aa g e n tm a r k u pl a l l g u a g e + o n t o l o g yi n f e r e n c el 硝e r ) 【s h h 0 2 】以及0 w l ( t h e w 曲o n t o l o g yl 锄g i l a g e ) 【m h 0 3 】【d e a 0 3 】等。d a m l ( d a r p a a g e n tm 盯k u pl a i l g l l a g e ) 发布于2 0 0 0 年8 月,由美国军方d a 心) a ( i n t e m e t 也起源于该组织的研究项目) 支持。 o i l 由欧盟的o n t o k n o w l e d g e o r g 项目支持,提供了基于本体的推理层。o i l 与d a m l 一起形成了本体语言d a m l + o i l 。0 w l 是w 曲o n t 工作组为了在w w w 上发布和共 享本体而推荐的语义标记语言,它起源于d a m l + o i l ,是以x m l 和r d f 为基础研究 制定的本体描述语言,目前已经成为描述w 曲本体的标准化语言。然而,o w l 对规则 的表达能力还较弱,有待进步研究。 中国科学院博士学位论文资源空间模型自动构造及操作语言研究 5 其它层 语义网的目标是使w 曲资源可以被机器理解和处理,能够更好地支持人机协同工 作。为此,语义网研究如何解决元数据的表示和规则性知识的表示两个关键问题。到目 前为止,大部分有关语义网的研究主要集中在w 曲内容的语义表示上。例如,大部分 基于x m l 和i m f s 的本体表示语言( 如d a m l + 0 l l 、o w l ) 都能表示复杂的领域概 念性知识以及领域相关的公理知识,例如概念包含公理、属性包含公理等;但目前本体 知识表示语言尚不能较好地表示领域规则性知识。目前的研究表明,逻辑层的实现将有 必要引入描述逻辑之外的其它逻辑,如h o m 逻辑 l e v 9 8 】。由于w 曲环境下,信息的不 完整性和数据的不一致性将是一种普遍现象,因此,允许系统内部存在不一致现象的某 类非单调逻辑应该引起研究者的重视。另外,由于逻辑层处于本体层之上,因此在逻 辑层的研究中,规则推理将势必结合本体中的概念与属性( 即角色) ,因此逻辑层的规 则推理将是一种混合型( h y 嘶d ) 推理f g r 0 0 3 】【d l n 9 8 】。在规则的表示方面,语义w 曲 可以借鉴已有的规则语言( 如r e m l ,h n p :伽m vn l i e m i o 呵等) ,同时对现有的本体表 示语言( 如0 w l ) 进行相应扩展,如s w i 也( as 锄a m i cw 曲r u l el a i l g i l a g cc o m b i n i n g o w la n dr u l e m l ,h n p :伽嗍,d 锄1 o 珂m l e 昨r o p o s a l ) 。 总体来看,目前语义w 曲的研究还主要集中在本体层,已形成w 曲本体表示的语 言标准o w l 。本体层次以上的规则、逻辑、验证以及信任管理层次还有待进一步研究。 1 2 2 计算网格 网格计算( g r i dc o m p u t i n 曲指利用大规模分布式计算系统实施可控的计算资源共享 的技术【f o s o o 】。网格计算概念早期出现在1 9 9 5i m w 试验中,用高速网络将北美的1 7 个站点资源连接起来,以获得高性能的计算能力。网格论坛( h n p :,h w w 鲥d f o n l m o 唱) 于2 0 0 2 年6 月公布了开放网格服务架构( o p e ng 剐s e r v i c e s a r c h i t e c t i l r e ) ,这是一组基 于现有开放标准的技术规格和标准,旨在为世界各地的网格提供一个公共的技术基础。 g l o b 璐网格项目( h n p :伽m 州酉o b u s ,o 呵) 是由美国a 唱。衄e 国家实验室等科研单位共 同研发的项目,是当前国际上最有影响的网格计算项目之一。目前网格已经成为下一代 互联网的核心技术之一。 中科院计算所开展了“织女星网格”项目的研究,其目标是使同一个平台同时具备 以下几种能力:大规模的数据处理能力、高性能计算能力、资源共享和提高资源利用率 的能力【x s l l 0 2 】。网格被看作是一台虚拟的计算机,具有通用服务、辅助智能、全局一 体,自主控制等四个特点。从计算机体系结构角度,用地址空间的方法研究了资源的表 示,描述、组织、部署、发现、访问、使用、维护和最终撤销等问题,提出了一个网格 资源空间三层模型【李0 3 】。此模型包括三个层次:有效信息资源层、虚拟资源层和物理 资源层,其中有效信息资源层由网格中的应用构成,虚拟资源层由网格虚拟组织构成, 物理资源层由资源所在的物理节点构成。虚拟资源层对有效信息资源层屏蔽了物理资源 层,使得用户可以透明访问物理资源,这种方法有助于提高网格软件的好用性、透明性、 4 第一章绪论 自治性和模块性。 1 2 3 知识网格模型 知识网格( k j l o w l e d g eg r i d ) 一词最初由f mb e 册姐于2 0 0 1 年提出,指出知识网格 的主要研究内容是利用网格、数据挖掘、推理等技术从大量在线数据集中抽取和合成知 识,使搜索引擎能够智能地进行推理和问题回答,并从大量数据中得出结论【b e r 0 1 】。 c 锄a t a r o 和嘲i a 也提出了基于数据挖掘的知识网格【c t t o l 】【c t 0 3 】。中国知识网格研究 组( h n p :肌g i c t a c c n ) 成立于2 0 0 1 年,致力于下一代网络交互环境的研究【刘0 3 】,诸 葛海研究员认为知识网格是一个智能互联环境,它能使用户或角色有效地获取、发布、 共享和管理知识资源,并为用户和其他服务提供所需要的知识服务,辅助实现知识创新、 协同工作、问题解决和决策支持【z h u g e 0 2 a 】。知识网格的研究目标是建立基于下一代w 曲 的信息、知识和服务资源有效共享、管理的模型、方法和平台【z h u g e 0 4 b 】【z h u g e 0 4 c 】, 其研究的核心问题包括资源的规范组织、智能聚合和语义互联。资源的规范组织主要通 过资源空间模型实现,智能聚合通过软设备实现【z h u g e 0 2 c 】 b l l c 0 5 】,语义互联以语义 链网络为实现基础【刁0 4 】。 资源空间模型( r e s o u r c es p a c em o d e l ) 是一个能够统一,规范和高效的定位和管理资 源的具有语义的数据模型【z h u g e 0 4 a 】【z h u g e 0 4 d 】【z h u g e 0 4 e 】,该模型利用网络资源( 包括 信息、服务和知识) 的分类语义信息,构建资源空间,将资源按照其分类语义分布于资 源空间中。该空间包括若干互相独立的坐标轴,空间内的每个点代表一个资源集合。通 过此坐标系统,用户可以高效地定位资源,并对资源进行操作。资源空间遵循若干范式 理论和完整性约束,保证了资源空间的合理性和可操作性【z y x l 0 5 】【z x 0 5 】。统一资源 抽取,资源的正交语义划分,统一资源操作和统一资源视图是资源空间模型的主要基础。 资源空间模型理论基于分类语义对资源进行管理,但目前许多方面仍然不完善,尤其在 资源空间的自动设计、系统实现和应用方面。本课题致力于资源空间的自动构造方法, 并对系统实现、高层运行平台和应用进行探索性研究。 1 3 本文的贡献 本文的研究内容围绕资源空间模型展开,尤其是对于资源空间的构建问题进行了深 入研究,尝试进行领域内资源空间的自动构造,将资源空间用于领域本体的构造,定义 了资源操作语言的基本功能和语法,探讨了资源空间模型在实现过程中遇到的问题,构 建了一个资源空间模型系统,并将该系统应用于敦煌领域的文物保护和研究资源管理。 本文的主要贡献包括: 提出了资源空间的自动构造方法。本文提出了一种利用o w l 文件自动构建资源空 间的方法,包括其理论依据和具体步骤。通过对构造的资源空问的相关理论分析, 证明其满足资源空间的第一范式和第二范式,提出并证明了其满足第三范式的充分 条件。由此可知该构造方法正确可行。本文所提出的构造方法,一方面减轻了系统 5 中国科学院博士学位论文资源空间模型自动构造及操作语言研究 分析员构造资源空间时的劳动负担,另一方面避免了个人因素的影响,使构造的资 源空间能够正确地反应领域内资源的分类语义。该方法使已经存在本体描述的领域 能够自动构造资源空间,以便利用资源空间模型对各个领域进行资源组织和管理。 提出了子空间和最大资源空间的概念。资源空间的子空间提供了一种比较资源空间 的方法,最大资源空间表达了论域内的最多的分类语义,它们为资源空间提供了一 种新的评价方法。 提出了利用资源空间构建领域本体的方法本文提出了资源空间转换到o w l 文件 的若干原则和转换方法,对于已经构造了资源空间的领域,可以根据资源空间构造 领域本体。根据资源空间构造的o w l 文件可以反映资源的描述信息、分类语义和 继承关系等。在增加其它相关语义信息的情况下,由资源空间构造的本体能够表达 完整的领域知识。 定义了资源操作语言的基本功能和语法。本文对资源操作语言的基本操作进行了阐 述,定义了相应的语法和语句格式,并提出了实现的策略。资源操作语言为高层用 户提供了一个统一的编程接口,使用户能够利用编程语言实现对资源空间和资源的 操作。 构造了基于资源空间模型的资源管理系统。本文利用资源空间模型理论,开发了一 个原型系统。本文对该原型系统的系统架构,工作流程等进行了描述。资源空间以 特定模式的x m l 文件形式存储。用户利用三维浏览器对资源空间进行浏览并对资 源进行操作。该原型系统为资源空间模型的完全实现提供了一个良好的基础。通过 与敦煌研究院的合作,将资源空间模型应用于敦煌学研究领域,开发了敦煌学资源 空间系统。本文描述了敦煌资源的特点、敦煌资源空间和系统的工作流程和操作界 面等。该系统提高了敦煌研究人员的研究效率,为敦煌文物保护工作提供了新的方 式。 1 4 论文的组织 本文第二章介绍了资源空间
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届湖南省名校联盟化学高一上期末达标检测试题含解析
- 初三化学上教学工作方案
- 2026届河北省邯郸市磁县滏滨中学化学高一上期末综合测试试题含解析
- 幼儿园学期末汇报活动方案
- 大学支教面试题及答案
- 书香机关活动实施方案
- 论语导读考试题及答案
- 广东美电贝尔科技java面试题及答案
- 空降乘务面试题及答案
- 慢性胰腺癌的临床观察
- 楼梯切割安全生产合同范本
- 2025-2026学年人教版2024八年级上册开学摸底考试英语模拟卷
- 2025至2030中国CPU市场运行现状与发展前景分析报告
- DB37-T4899-2025深远海养殖管理工作指南
- 物业消防改造服务方案(3篇)
- 功率放大器测试培训课件
- 全域土地综合整治实施方案
- 小学生校园文明礼仪常规教育主题班会
- 人体脚部解剖课件
- 资料员考试题库及答案
- 会议管理实务培训课件
评论
0/150
提交评论