(计算机应用技术专业论文)基于本体映射的商务数据集成系统分析与设计.pdf_第1页
(计算机应用技术专业论文)基于本体映射的商务数据集成系统分析与设计.pdf_第2页
(计算机应用技术专业论文)基于本体映射的商务数据集成系统分析与设计.pdf_第3页
(计算机应用技术专业论文)基于本体映射的商务数据集成系统分析与设计.pdf_第4页
(计算机应用技术专业论文)基于本体映射的商务数据集成系统分析与设计.pdf_第5页
已阅读5页,还剩72页未读 继续免费阅读

(计算机应用技术专业论文)基于本体映射的商务数据集成系统分析与设计.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

01 :乙、! : - _ _ - _ _ _ 一 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 h 、- 1 签名:重主坚 日期:矽p 年j 月 5 t 论文使用授权 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:迥导师签名: 日期: 。ff 年广月乙e l 、 鼻 一 ; 气 摘要 摘要 随着我国的经济的腾飞以及互联网技术飞速发展,电子商务也在高速发展。 电子商务具有成本低,足不出户的购物体验受到广大消费者的青睐。电子商务市 场呈逐年递增的速度发展,它将成为未来主流的商务模式。目前,无论是传统的 制造业还是新兴的金融业,都将电子商务作为企业经营的一种新方式。但目前我 国很多企业还处在转型阶段,普遍面临企业信息化水平较低,信息化程度不高等 问题。同时,由于历史的原因,各企业间甚至企业内部信息系统相互独立,形成 了信息孤岛。如何将这些系统整合,实现数据共享成为当前急需解决的问题。 传统的数据集成技术有联邦数据库系统、数据仓库和虚拟视图法。这些传统 方法解决了系统异构、语法异构和结构异构,但没能解决语义异构。本文提出了 基于本体映射的商务数据集成系统,可以较好地满足商务数据集成的要求,并解 决了语义异构的问题。本文的工作主要有以下几个方面: ( 1 ) 分析了电子商务的发展现状和传统数据集成技术。传统数据集成技术解决了多 种异构问题,但无法解决语义异构问题。 ( 2 ) 分析了异构数据集成的相关技术,并将本体技术应用到数据集成系统中。提出 了数据集成系统的总体模型,介绍了建立本体的方法和原则。采用o w l 作为 本体描述语言,建立了全局本体、局部本体和全局本体与局部本体的映射。 ( 3 ) 采用更加通用的s q l 语言作为全局查询语言,在做查询分解前,先使用j a v a c c 对全局查询语句建立语法树,同时做词法分析和语法分析,以验证语句的合法 性。提出了全局查询分解算法和结果合并算法,并以实例说明了这两个算法的 执行过程。 ( 4 ) 在提升系统性能方面,设计了查询缓存并介绍了缓存的内存模型,还提出了查 询语句优化的策略。 关键词:数据集成,本体映射,商务数据,异构 、, 一 , # 气 a bs t r a c t w i t he c o n o m yo fo u rc o u n t r ya n di n t e m e tt e c h n o l o g yr i s i n gr a p i d l y , e l e c t r o n i c c o m m e r c ed e v e l o p sa l s oi nh i 曲s p e e d me l e c t r o n i cc o m m e r c em a r k e t p l a c ea s s u m e s t h es p e e di n c r e a s i n gb yd e g r e e sy e a rb yy e a rd e v e l o p i n g , i tw i l lb e c o m et h em a i n b u s i n e s sp a t t e r ni nt h ef u t u r e b o t ht h en e w l yd e v e l o p i n gf i n a n c ea n dt h et r a d i t i o n a l m a n u f a c t u r i n gi n d u s t r y , l o o k i n go ne l e c t r o n i cc o m m e r c ea so n ek i n do fn e ww a yt h a t e n t e r p r i s em a n a g e s m a n ye n t e r p r i s eo fo u rc o u n t r ya r es t i l li nd e v e l o p i n g t h e ya r e c o n f i o n t e dw i t he n t e r p r i s ec o m m o n l yi n f o r m a t i o n i z el e v e ll o w e r , i n f o r m a t i o n i z ed e g r e e i sn o ta d v a n c e dp r o b l e m a tt h es a m et i m e ,d u et ot h ec a u s eo fh i s t o r y , t h ei n f o r m a t i o n s y s t e m sa r e ,e v e ni n s i d eo fe n t e r p r i s e ,m u t u a l l yi n d e p e n d e n ta m o n ge v e r ye n t e r p r i s e , a n di s o l a t e di s l a n dh a v i n gf o r m e di n f o r m a t i o n h o wt oi n t e g r a t et h e s es y s t e m sa n d s h a r ed a t ab e c o m e sp r e s e n tb e i n gb a d l yi nn e e do ft h ep r o b l e ms o l v i n g t r a d i t i o n a ld a t ai n t e g r a t i o nt e c h n o l o g i e sh a v ef e d e r a ld a t a b a s e , t h ed a t a w a r e h o u s ea n dv i r t u a lv i e w t h o s et r a d i t i o nm e t h o d so n l yh a v er e s o l v e dt h ep r o b l e m so f s y s t e m a t i ci s o m e r i s m ,g r a m m a ri s o m e r i s ma n ds t r u c t u r a li s o m e r i s m , b u tf a i l e d t o r e s o l v et h es e m a n t e m eh e t e r o g e n e i t y i nt h i st h e s i s ,t h eo n t o l o g y - b a s e dm a p p i n go f b u s i n e s sd a t ai n t e g r a t i o ns y s t e mt h a tc a r ls o l v et h ep r o b l e mo fs e m a n t i ch e t e r o g e n e o u s 田l em a i nw o r ko ft h i st h e s i sa r ea sf o l l o w s : l a n a l y s i so ft h ed e v e l o p m e n ts t a t u so fe - c o m m e r c ea n dt r a d i t i o n a ld a t ai n t e g r a t i o n t e c h n o l o g y t r a d i t i o n a l d a t a i n t e g r a t i o nt e c h n o l o g y t os o l v eav a r i e t yo f h e t e r o g e n e o u sp r o b l e m s ,b u tc a r ln o ts o l v et h es e m a n t i ch e t e r o g e n e i t y 2 a n a l y s i so fh e t e r o g e n e o u sd a t ai n t e g r a t i o nr e l a t e dt e c h n o l o g i e s ,a n do n t o l o g y t e c h n o l o g ya p p l i e dt ot h ed a t ai n t e g r a t i o ns y s t e m p u tf o r w a r dt h eg e n e r a lm o d e lo f d a t ai n t e g r a t i o ns y s t e mt oi n t r o d u c et h em e t h o do fe s t a b l i s h i n gi d e n t i t ) ra n d p r i n c i p l e s u s i n go w l 够t h eo n t o l o g yl a n g u a g e ,t h ee s t a b l i s h m e n to ft h eg l o b a l o n t o l o g y , l o c a lo n t o l o g ya n dt h em a p p i n go fg l o b a lo n t o l o g ya n dl o c a lo n t o l o g y 3u s em o r eg e n e r i cs q ll a n g u a g ea sae # b a lq u e r yl a n g u a g e ,q u e r yd e c o m p o s i t i o n d o i n gb e f o r eu s i n gj a v a c co nt h ee s t a b l i s h m e n to ft h eg l o b a lq u e r ys y n t a xt r e e , w h i l ed o i n gl e x i e a la n a l y s i sa n ds y n t a xa n a l y s i s ,t ov e r i f yt h el e g i t i m a c yo ft h e l i a b s t r a c t s t a t e m e n t p r o p o s e d 西0 b a lq u e r yd e c o m p o s i t i o na l g o r i t h ma n dr e s u l t sm e r g i n g a l g o r i t h m ,a n de x e m p l i f i e st h ep r o c e s so fi m p l e m e n t a t i o no ft h e s et w oa l g o r i t h m s 4i ni m p r o v i n gs y s t e mp e r f o r m a n c e ,m o d e lh a v i n gd e s i g n e dt h em e m o r yh a v i n g i n q u i r e da b o u ts l o we x i s ta n dh a v i n gi n t r o d u c e ds l o we x i s t , h a v es u g g e s t e dt h a t i n q u i r i n ga b o u tt h et a c t i c st h a tt h es e n t e n c eo p t i m i z e s k e y w o r d s :d a t ai n t e g r a t i o n , o n t o l o g ym a p p i n g ,b u s i n e s sd a t a , h e t e r o g e n e o u s i i i 气 一 了 一- , 夕 目录 目录 第一章引言1 1 1 研究背景1 1 2 研究现状1 1 2 1 联邦数据库系统2 1 1 2 2 数据仓库2 1 2 3m e d i a t o r 2 1 2 4 问题总结。3 1 3 研究目的和内容。4 1 4 论文结构4 1 5 小结5 第二章异构数据集成相关技术研究6 2 1 异构数据集成简介6 2 1 1 异构数据集成需解决的问题6 2 1 2 异构数据集成的目标6 2 2x q u e r y 简介7 2 2 1 数据模型7 2 2 2x q u e r y 表达式8 2 2 3x q j 介绍1 0 2 3 本体。1 0 2 3 1 本体概述1 0 2 3 2 本体构成的要素1 1 2 3 3 本体描述语言1 1 2 3 4 本体在异构数据集成中的作用1 3 2 3 5 基于本体的数据集成技术1 3 2 4 本章小结1 4 第三章系统总体结构设计1 5 3 1 设计思想1 5 3 2 总体结构设计15 i v 目录 3 3 容错设计1 6 3 4 开发环境1 7 3 5 本章小结一17 第四章本体的构建及数据模式转换。1 8 4 1 元数据18 4 2 元数据字典19 4 3 本体构建原则1 9 4 4 构建领域本体的方法2 0 4 5 构建局部本体2 1 4 5 1 提取数据源数据模型2 2 4 5 2 数据模型转换为本体2 4 4 6 全局本体2 7 4 6 1 模式异构2 7 4 6 2 构建全局本体2 7 4 7 本章小结3 0 第五章查询分解与优化3 1 5 1 全局查询分析31 5 2 查询分解算法3 3 5 3 查询分解实例3 4 5 4s q l 查询优化3 6 5 5 缓存管理3 7 5 6 本章小结3 8 第六章局部查询与结果合并4 0 6 1 任务分发4 1 6 2 局部查询身份鉴别4 2 6 3 结果合并4 3 6 4 本章小结4 4 第七章数据集成系统在国际贸易中的应用。4 5 7 1 设计目标4 5 7 2 数据集成系统总体设计4 6 7 3 接口设计。4 7 7 4 系统关键模块实现4 9 v 目录 7 5 本章小结5 2 第八章基于本体映射的商务数据集成系统测试 8 1 测试环境。5 3 8 2 测试用例。5 4 8 3 测试结果分析。5 5 8 4 本章小结5 6 第九章总结与展望 9 1 总结5 7 9 2 下一步工作5 8 致谢 参考文献 攻硕期间取得的研究成果 v i 5 9 第一章引言 1 1 研究背景 第一章引言帚一早 i ji 嗣 计算机技术的飞速发展,为电子商务的应用提供了基础,具有简单、快捷、 低成本等特点的电子商务技术取得了快速的发展。电子商务将传统的商务流程电 子化、数字化,既代替了实物流从而极大地减少了人力和物力,另一方面突破了 时空的限制,大大地提高了效率。但是由于各领域、行业和单位的具体业务与分 工的不同,它们根据各自不同的应用需求、业务流程、信息机构和计算机软硬件 环境等特点,构建了大量的不同信息系统。而大部分信息系统的软硬件条件也不 尽相同,从而产生了大量的“信息孤岛“。 不断增长的客户以及业务规模使得跨区域、跨领域的合作已是目前发展的必 然趋势。随着网络化与信息化进程的不断推进,电子商务数据迫切需要能被最大 限度地相互共享、交换、集成和再利用。将逻辑上、物理上异构的电子商务数据 源集成起来,为用户提供统一地、透明地访问接口成了当前急需解决的问题。 1 2 研究现状 多年来,学者们对数据集成技术的深入研究已经取得了许多有效的方法和策 略。目前数据集成分为物理集成和逻辑集成两个方面,物理集成主要技术有数据 仓库,逻辑集成主要采用m e d i a t o r 、联邦数据库等。 声1 2 1 联邦数据库系统 多数据库系统主要研究如何应用传统数据库技术解决异构数据源之间的不匹 配l l j ,此研究方法在上世纪8 0 年代较为盛行。具有代表性的多数据库系统有g 砌i c 、 t s i m m i s 、y a t 和p e g a s u s 等。我国有北京理工大学的u n h d b 系统和东北大学的 s c o p e 系统等。8 0 年代中后期,开始联邦数据库系统研究,m c l e o d 等人首次提 出采用全局模式的集成方法,将所有数据源集成到一个单一的集成系统中。联邦 数据库的数据源是独立的,通过数据源之间的数据交换格式进行一一映射,一个 数据源可以访问任何其他数据源提供的信息,这种方式容易实现,但是工作量大, 扩展性差 2 - 4 。 电子科技大学硕士学位论文 1 2 2 数据仓库 数据仓库概念始于上世纪8 0 年代中期,首次出现是在被誉为“数据仓库之父 w h i n m o n 的建立数据仓库书中。数据仓库把来自多个数据源的数据副本, 按照集中、统一的视图要求,进行预处理和转换,以形成一致的模式,存储到数 据仓库中,以便于进行联机分析处理和数据挖掘。数据仓库集成结构中,来自各 个信息源的数据被提取后组成一个全局模式【5 1 。数据存储在数据仓库里,从用户角 度看,数据仓库如同普通数据库。其组织结构如图1 - 1 所示: l 用户层 l 查上t 结 询 果 lj 数据仓库 图1 - 1 数据仓库组织结构图 数据仓库中存放了各个数据源中的数据副本,数据源中的数据改变后数据仓 库需同步更新。这种方式实现较为简单但缺点是数据重复存储,及时更新困难【6 1 。 1 2 3m e d i a t o r m e d i a t o r 是一种软件组织,支持虚拟视图或视图集,此方法又称为虚拟视图法, 它与数据仓库相似,就像存在物理的数据库一样,但是它不存储任何实际数据。 m e d i a t o r 介于异构数据源和应用程序之间,向下协调各数据源系统,向上为应用程 2 第一章引言 序提供结构化的模式和数据访问的标准接i 7 1 。m e d i a t o r 由查询处理器、包装器和 结果处理器等几个部分组成。用户在提交了一个查询后,查询处理器将查询翻译 成一个或者多个对数据源的查询,然后对数据源返回的结果交给结果处理器综合 处理,并将处理后的结果返回给用户【8 1 。其组织结构图如图1 2 所示: m e d i a t o r i l 用户屡 l i 查询处结果处 j 一 p 。、 l 包装 器 夕 lll 图1 - 2m e d i a t o r 组织结构图 m e d i a t o r 使用包装器对特定数据源进行封装,将其数据模型转换为系统使用的 通用模型,作为输出模式,提供一致的访问机制。m e d i a t o r 解决了数据重复性和不 一致性,提供统一的数据视图和查询语言【9 1 。此外,m e d i a t o r 具有很强的扩展性, 可以方便地集成新增数据源,是目前数据集成的主要方法。目前,基于m e d i a t o r 的数据集成研究很多,国内比较著名的有东南大学开发的v e r s a t i l e 系统和华中科 技大学开发的p a n o r a m a 数据集成原型系统等 1 0 1 1 1 。 1 2 4 问题总结 以上三种方式各有所长,但是都只解决了系统异构、语法异构和结构异构, 但没能解决语义异构。目前,采用本体映射解决语义异构成为研究的焦点。国内 在这方面也有相应研究,如:浙江大学基于本体的数据集成系统 o n t o b r o k e r t l2 1 ,c o i n 1 3 1 等。在电子商务数据集成领域的数据集成研究较少,如何利用 本体技术解决电子商务数据语义异构还没有相关的研究。 电子科技大学硕士学位论文 1 3 研究目的和内容 本文围绕电子商务数据互操作中由于异构数据所带来的问题,着力于构建基于 本体映射的异构数据集成系统。研究重点在于本体的构建、应用层查询语句分解 和对各数据源返回的结果组合以返回给应用层。其中查询组合引擎与异构数据源 间通过w e b s e r v i c e 进行交互。 按照课题要求,本文研究、设计及实现了基于本体映射的异构数据集成系统。 本人研究的内容主要有以下几方面: 1 研究本体的相关知识以及本体的构建和模式的转化,并以此为基础对应用 层的s q l 语句进行分析并按照本体知识库进行分解。 2 将分解后的s q l 子语句通过w 曲服务发送到各个数据源进行查询。 3 将各数据源返回的结果按照本体知识库进行组合,并将组合的结果返回给 应用层。 1 4 论文结构 第一章:引言。简要介绍了课题的背景和电子商务数据集成的研究现状,以 及本人所作的研究,最后概要讲述了各章节的内容。 第二章:介绍了理论基础。介绍了异构数据集成相关技术。 第三章:介绍系统设计思想、数据处理流程和逻辑以及总体架构。 第四章:介绍了元数据的相关概念,本系统中元数据设计思路。详细介绍了 局部本体和全局本体的构建,并简单阐述了模式间的转换。 第五章:分析了全局查询分解与优化,重点分析了如何将全局查询语句的分 解成子查询,并介绍查询语句的优化策略。 第六章:详细介绍了缓存机制及其内存模型,简述了任务分发的调度侧率以 及如何在局部查询时做身份鉴别,详细分析了如何将各数据源查询的结果组合起 来返回给应用层。 第七章:对基于本体映射的数据集成系统的功能和性能进行测试,并且对测 试结果做了一定分析。 第八章:结束语。总结了本文的主要研究工作和意义,针对目前的不足,提 出了进一步的研究内容和方向。 4 第一章引言 1 5 小结 本章首先介绍,析了电子商务数据集成研究背景,然后从联邦数据库、数 据仓库、m e d i a t o r 三含方面讨论了的国内外数据集成的研究现状,最后说明了本 文的主要研究内容谚受论文的组织结构安排。 电子科技大学硕士学位论文 第二章异构数据集成相关技术研究 2 1 异构数据集成简介 2 1 1 异构数据集成需解决的问题 异构数据集成的关键点在于消除数据异构性,异构分为以下几个方面: ( 1 ) 系统异构 系统异构是指数据源所依赖的应用环境,如果硬件环境的不同、操作系统的 不同、开发语言的不同和网络协议的不同。 ( 2 ) 模式异构 目前主流的数据模式为关系模式和面向对象模式等,大部分的数据库厂商的 数据库产品仍以关系模式为主。即使都是关系模式的数据,不同厂商的数据存储 方式也不相同。本文在4 6 1 中阐述了几种常见的模式异构。 ( 3 ) 语义异构 信息的语义具有异构性,语义异构是数据集成的一大难点,语义异构将带来 数据冗余、干扰数据处理以及增加数据集成的复杂度,如何消除语义异构成为当 前研究的热点。语义异构分为三类:概念模糊、命名冲突和域冲突。 概念模糊:看上去某个概念指的是同一个事物,但实际却表示了不同的对象。 命名冲突:名字相同而含义不同,或者名字不同含义相同。例如:数据库中 的字段名相同,含义却不同。 域冲突:某个概念在不同领域中采用的衡量标准不同。例如:在一个领域中 手表的价格单位是人民币,在另一个领域中的单位却是美元。 2 1 2 异构数据集成的目标 异构数据集成的目的是实现各异构数据源间的数据共享,有效地利用资源, 减小数据冗余。数据集成的目标是在分布式环境下提供给用户一个单一系统映像。 这要求各个数据源之间的相互作用必须透明地进行。为了达到透明性,将各个子 系统无缝地整合起来,数据集成需要达到两个目标,即分布透明性和异构数据源 的透明性。 6 第二章异构数据集成相关技术研究 ( 1 ) 分布透明性 用户不必知道数据源的物理位置,所使用的数据就像存储在本地一样。用户 处理各种网络资源如同在自己本地机器上一样,即分布式存取透明性。 ( 2 ) 数据源透明性 对于系统中的用户来说,不用关心它所需要的数据所在的地方,存在于什么 样的数据源。异构数据源的透明性表现在:不同数据库管理系统的常规数据之间 的透明性;不同数据库管理系统的常规数据和非常规数据之间的透明性。 2 2x q u e r y 简介 x q u e r y 是一种用于从x m l 格式文档获取数据的查询语言,它是由q u i l t 语言 发展而来,2 0 0 7 年1 月2 3 日,w 3 c 发布了x q u e r y 的推荐标准。x q u e r y 查询与 s q l 语言类似,s q l 是以关系代数为基础的二维数据表查询语言,x q u e r y 用于查 询各种类型的x m l 数据。随着x o u e r y 的不断发展,它不仅仅可以查询x m l 文 档,还包括任何可以以x m l 形式呈现的数据,如数据库、w 曲网页等,所以x o u e r y 可以被认为是“x m l 中的s q l ” 1 4 - 1 6 】。 2 2 1 数据模型 x q u e r y 使用一个抽象的逻辑结构来表示x m l 文档中的信息,这个逻辑结构 称为数据模型。x q u e r y l 0 和x p a t h 2 0 使用相同的数据模型。 a t o m i cv a l u e s ( 原子值) 原子值组建自词汇表达式。对于一个s t r i n g 类型和原子类型,原子类型将被以 与s c h e m a 校验一致地方式组建。如果s t r i n g 值不合法将出现错误。 s t r i n g 值 s t r i n g 值可以由原子值转换而来。 x q u e r y 数据模型中分为七种类型节点: 文档节点 文档节点表示x m l 文档,文档节点具有b a s e - u r i ( 允许为空) 、c h i l d r e n ( 允 许为空) 、u n p a r s e d e n t i t i e s ( 允许为空) 、d o c u m e n t - u r i ( 允许为空) 、s t r i n g - v a l u e 、 t y p e d v a l u e 等属性。 元素节点 元素节点描述x m l 元素,其子节点必须由非空的特定元素组成如:注释节点、 7 电子科技大学硕士学位论文 文本节点、处理指令等。属性节点、命名空间节点和文档节点不能做为其子节点。 属性节点 数据模型允许属性节点没有父元素,这种属性节点不能出现在任何元素节点 的属性集合中。 文本节点 文本节点表示元素内容中的字符数据( 包括c d a t a 段中的字符数据) ,如果 文本节点的父节点不为空,则不允许在内容中出现长度为零的字符串。 命名空间节点 命名空间节点表示命名空间u r i 到命名空间前缀的绑定。虽然数据模型中允 许有命名空间节点,但x q u 哪, 并没有提供任何访问它们的方式,也不能对它们执 行任何操作。 处理指令节点 处理指令节点表示x m l 处理指令,包括:t a r g e t 、c o n t e n t 、b a s e - u r i 、p a r e n t 等属性。 注释节点 注释节点表示x m l 注释,字符串“一 不能出现在内容中,字符“不能作 为最后一个字符出现。 2 2 2x q u e r y 表达式 x q u e r y 是一种组合语言,每一个表达式都有其优先级【1 7 1 。逗号表达式优先级 最低,其次是f l w o r 表达式、量化表达式、条件表达式等。 2 2 2 1 基本表达式 基本表达式是x q u e r y 最基本、最简单的表达式,它包括:字面值、变量引用、 上下文项表达式、构造器和函数调用【1 8 1 。 1 字面值 原子值的最直接的代表就是字面值,x q u e r y 支持两种字面值:数字字面值和 字符串字面值。字符串字面值都是类型为x s :s t r i n g 的原子值。数据类型为x s :i n t e g e r 的数字字面值不允许出现“、“e ”和“e 等字符,x s :d e c i m a l 类型支持i dp 9 而 x s :d o u b l e 类型支持“e ”或e 字科1 9 1 。 2 变量引用 变量引用由一个$ 加上一个q n a m e 组成,;t i $ t i t l e 。如果两个变量引用的本地 一| 第二章异构数据集成相关技术研究 名,以及它们的前缀所绑定的命名空间u r i 都是一样的,那么这两个变量引用就 是相等的。没有前缀的变量引用不属于任何命名空间。每个变量绑定都有静态作 用域,该作用域定义了合法的变量引用发生的范围。如果一个变量在静态上下文 中绑定到一个表达式上,那么这个变量的作用域就是整个表达式【2 0 1 。 3 括号表达式 括号表达式用于表达式中含有多个操作符时改变运算顺序。 4 上下文项表达式 上下文项表达式就是( ),可以是节点如: f n :d o c ( ”b i b x m l ”) b o o k s b o o k f n :c o u n t ( a u t h o r ) 1 ) ,也可以是原子值如:( 1 t o1 0 0 ) r o o d5e qo 】) 。在上下文未定义或不明确时,将出现动态错误。 5 函数调用 函数调用由函数名和参数列表组成,参数也可以是表达式。 2 2 2 2f l w o r 表达式 f l w o r 表达式支持迭代器和将变量绑定到中间结果,它常被用于两个以上 的文档连接运算。f l w o r 取自于f o r , l e t ,w h e r e ,o r d e r , b y 和r e t u r n 几个单词的首字母。 它们也是组成f l w o r 表达式的几个子句【2 1 。2 3 1 。 1 f o r 和l e t 子句 f o r 和l e t 子句用于生成元组流,每个元组由一个或多个绑定变量组成。f o r 子 句在绑定序列中迭代数据项,并依次将变量绑定到每个数据项上。f o r 子句可以包 含多个变量,变量间用逗号分隔。f o r 子句示例如下: f o r $ ii n ( 1 t o5 ) r e t u r n $ i * $ i f o r 子句从l 到5 迭代,每次迭代返回变量i 的平方。上述语句运行结果为: 1 4 9 1 6 2 5 l e t 子句的写法与f o r 子句类似,但是,l e t 子句只是将变量与其关联的表达式 计算结果绑定,而并不是迭代绑定序列中的每一项。将上述f o r 子旬示例修改为l e t 子句,如下: 1 e t $ i ( 1t 05 ) r e t u r n $ i * $ i 运行结果为: 1 4 9 1 6 2 5 9 电子科技大学硕士学位论文 2 w h e r e 子句 w h e r e 子句用于过滤f o r 子句和1 e t 子句生成的元组,w h e r e 子句中的表达式 称为w h e r e 表达式,当表达式中的有效布尔值为真是,则当前迭代的项被保留, 当有效布尔值为假时,则当前迭代项被丢弃。 3 o r d e r b y 和r e t u r n 子句 o r d e rb y 子句用于对结果进行排序,它包括一个或多个排序表达式,每个表 达式后面添加a s e n d i n g 或d e s c e n d i n g 关键字来指定是升序排列还是降序排列,默 认的排序方式为升序。如果结果中有多个相同的值,则x q u e r y 将自行选择以何种 顺序来返回这些数据。 r e t u r n 子旬规定返回的内容,如果在r e t u r l l 子旬前没有出现o r d e rb y 子句, 则返回数据的顺序由f o r 子句和l e t 子旬以及排序模式决定。可以同时返回多个变 量,如:r e t u r n ( $ a ,$ b ) ,也可以在r e t u r n 子句中嵌套子语句。 2 2 3x q j 介绍 x q j 全称是x q u e r y a p if o rj a v a ,是由j a v ac o m m u n i t yp r o c e s s 设计开发的。 x q j 用于x m l 处理和开发数据集成应用,它完全支持j a v as e 和j a v ae e 平台。 x q j 允许j a v a 程序连接到x m l 数据源执行x q u e r y 查询,并处理以x m l 方式处 理结果,它的作用类似于j d b c l 2 4 1 。 目前,主要的x q j 引擎有d a t a d i r e c t 和s a x o n ,d a t a d i r e c t 是收费授权软件, s a x o n 是开源引擎,本系统采用s a x o n 。s a x o n 是由m o z i l l a 基金会开发授权的,它 分为三个发布版本:h o m ee d i t i o n 、p r o f e s s i o n a le d i t i o n 和e n t e r p r i s ee d i t i o n ,h o m e e d i t i o n 是免费版本。s a x o n 可应用在j a v a 和n e t 两种环境,支持x s l t 2 0 ,x p a t h 2 0 , x q u e r y l 0 和x m ls c h e m a l 0 。 2 3 本体 2 3 1 本体概述 英文术语“o n t o l o g y 一词源于哲学领域,且一直以来存在着许多不同的用法。 在计算机科学领域,其核心意思是指一种模型,用于描述由一套对象类型( 概念 或者说类) 、属性以及关系类型所构成的世界。尽管不同的本体对于这些构成成分 的确切称谓有所不同,但它们却都是一部本体不可或缺的基本要素【3 1 1 。一般来说, l o 声 第二章异构数据集成相关技术研究 人们所普遍期望的一点就是,本体之中模型的那些特征应当非常类似于相应的现 实世界。 由于建立一个通用的本体是不可能的,需要对本体的应用领域进行细分,由 此产生了应用于不同领域的领域本体。领域本体是对领域内共享概念的形式化建 模,共享概念为互操作提供了基础。同一领域内的本体可以共享,交叉领域内的 本体也可以共享,领域本体面向的是更实际的应用。 2 3 2 本体构成的要素 就现有的各种本体而言,无论其在表达上采用的究竟是何种语言,在结构上 都具有许多的相似性。如前所述,大多数本体描述的都是个体( 实例) 、类( 概念) 、 属性以及关系【3 2 删。在这一节当中,我们将分别依次论述本体的这些构成要素。 常见的本体构成要素包括: 个体( 实例) :基础的或者说“底层的”对象。 类:集合( s e t s ) 、概念、对象类型或者说事物的种类 注释1 】。 属性:对象( 和类) 所可能具有的属性、特征、特性、特点和参数。 关系:类与个体之间的彼此关联所可能具有的方式。 函式术语:在声明语句当中,可用来代替具体术语的特定关系所构成的复 杂结构。 约束( 限制) :采取形式化方式所声明的,关于接受某项断言作为输入而 必须成立的情况的描述。 规则:用于描述可以依据特定形式的某项断言所能够得出的逻辑推论的, i f - t h e n ( 前因一后果) 式语句形式的声明。 公理:采取特定逻辑形式的断言( 包括规则在内) 所共同构成的就是其本 体在相应应用领域当中所描述的整个理论。这种定义有别于产生式语法和 形式逻辑当中所说的“公理 。在这些学科当中,公理之中仅仅包括那些 被断言为先验知识的声明。就这里的用法而言,“公理 之中还包括依据 公理型声明所推导得出的理论。 事件( 哲学) :属性或关系的变化。 2 3 3 本体描述语言 本体一般都是采用本体语言来编制的。本体语言,又称为“本体论语言 ,是 电子科技大学硕士学位论文 一种用于编制本体的形式化语言。本体语言应该满足以下要求:良好定义的语法( a w e l l d e f i n e ds y n t a x ) 、良好定义的语义( aw d l d e f i n e ds e m a n t i c s ) 、有效的推理支持 ( e f f i c i e n tr e a s o n i n gs u p p o r t ) 、充分的表达能j j ( s u f f i c i e n te x p r e s s i v ep o w e r ) 、表达的 方便性( c o n v e n i e n c eo fe x p r e s s i o n ) 3 s 】。目前,存在着许多种本体描述语言。 基于一阶逻辑的表示语言主要有:o n t o l i n g u a 、o c m l 、f l o g i c 、c a r i n 等传 统本体语言。o n t o l i n g u a 由斯坦福大学开发,是一种基于k i f 的,提供统一的规范 格式来构建的本体语言,它为构造和维护本体提供了统一的、计算机可读的方式。 由o n t o l i n g u a 构造的本体可以很方便地转换为各种知识表示和推理系统。目前 o n t o l i n g u a 主要是作为本体服务器上提供的,用于创建本体的。另外有不少的项目 使用o n t o l i n g u

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论