(计算机应用技术专业论文)xml及xml中间件的研究.pdf_第1页
(计算机应用技术专业论文)xml及xml中间件的研究.pdf_第2页
(计算机应用技术专业论文)xml及xml中间件的研究.pdf_第3页
(计算机应用技术专业论文)xml及xml中间件的研究.pdf_第4页
(计算机应用技术专业论文)xml及xml中间件的研究.pdf_第5页
已阅读5页,还剩69页未读 继续免费阅读

(计算机应用技术专业论文)xml及xml中间件的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 本论文的主要内容是研究x m l ( e x t e n s i b l em a r k u pl a n g u a g e 可 扩展标记语言) 技术以及基于x m l 的异构数据源集成中间件和s v g 矢 量统计图中间件,并研究了基于x m l 的中石化石油专业工程造价管理 系统的实现方法。 x m l 作为新一代的w e b 语言,显示出其强大的优越性,使许多只利 用h t m i 。难以解决的任务变得简单,使只利用h t m l 不可能完成的系统 得以完成。与此同时,w e b 正成为越来越重要的数据来源,如何把多 种异构的数据源转换到结构统一的,更加方便、灵活的w e b 数据源, 已经成为国内外研究的重点。 s v 6 是一种基于x m l 的开放的矢量图形描述语言。使用s v g 可以在 网页上显示出各种各样的高质量的矢量图形。本论文实现了s v g 矢量 统计图中间件。 论文共分六章。第一章介绍了课题的背景、意义、目标以及任务, 分析了石油专业工程定额管理系统的特点,讨论了现有技术以及发展 状况;第二章分析研究了x m l 标准、x m l 数据模型以及x m l 半结构数 据库;第三章研究了基于x m l 的异构数据源集成中间件的相关技术, 以及实现方法;第四章研究了s v g ,实现了s v g 矢量统计图中间件; 第五章结合最新的x m l 技术,使用中间件,借助s m i l 、c d f 、x m ld a t a i s l a n d 等x m l 应用程序,设计实现了中石化石油专业工程造价管理系 统:最后一章对论文进行了总结。 关键字:x m l ,s v g ,中间件,异构数据源集成,矢量统计图 x m lt e c h n o i o g ya n dt h es t u d yo fx m l b a s e dm i d - w a r e a b s t r a c t r b em a i nc o n t e n to ft h i st h e s i si sa b o u tt h er e s e a r c hjn t o x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) t e c h n 0 1 0 9 y ,x m l b a s e dw e b h e t e r o g e n e o u sd a t a s o u r c e s i n t e g r a t i o nm i d w a r e , s v gv e c t o r s t a t i s t i c a lc h a r tm i d w a r ea n dx m l b a s e dr a t i o n m a n a g e m e n t s y s t e mo fs i n o p e cc o r p x m l ,w h i c hi san e ww e bl a n g u a g e ,h a ss h o w nl o t so fg r e a t a d v a n t a g e s i t m a k e ss o m et a s k s e a s y t or e s o l v ew h i c ha r e d i f f i c u l tf o rh t m la n db r i n g st h es y s t e mt os u c c e s st h a tc a n n o t b ec o m p l e t e db yh t m l a tt h es a m et i m e ,w e bi sb e c o m i n gm o r ea n d m o r e i m p o r t a n tf o rd a t as o u r c e s w e bd a t a b a s e ,w h i c hi sm o r e c o n v e n i e n t ,m o r ef l e x i b l ea n do ft h eu n i f o r mf o r m a t ,h a st u r n e d o u tt ob ea ni m p o r t a n tr e s e a r c h i n gf i e l db o t ha th o m ea n da b r o a d s v gi sa nx m l b a s e d ,o p e n ,v e c t o rg r a p h i c l a n g u a g e u s i n g s v g ,w ec a nd r a wv a r i o u sv e c t o rg r a p h s ,w h i c hc a nb ed i s p l a y e d i nw e bp a g e sw i t hh i g hq u a l i t y i nt h i st h e s i s ,w er e a l i z e dt h e w e bs v gv e c t o rs t a t i s t i c a lc h a r tm i d - w a r e t h i st h e s i si sc o m p o s e do fs i xc h a p t e r s t nt h ef i r s tc h a p t e r w ei n t r o d u c e dt h eb a c k g r o u n d ,t h ea i ma sw e l la st h e t a s k , a n a l y z e dt h et r a i t so ft h er a t i o nm a n a g e m e n ts y s t e m ,d i s c u s s e d t h et e c h n o l o g yi ne x i s t e n c ea n dt h es t a t eo ft h e i rd e v e l o p m e n t : i nt h es e c o n dc h a p t e r ,w es t u d i e dt h ex m lp r o t o c o l ,t h ex m ld a t a m o d e la n dt h ex m lh a l f s t r u c t u r e dd a t a b a s e :i nt h et h i r dc h a p t e r w eg a v et h er e l a t e dt e c h n o l o g ya n dr e a l i z i n gm e t h o do fw e bd a t a s o u r c e si n t e g r a t i o nm i d - w a r e :i nt h ef o r t hc h a p t e r ,w es t u d i e d t h es v gp r o t o c o la n dr e a l i z e dt h es v gv e c t o rs t a t i s t i c a lc h a r t m i d - w a r e :i nt h ef i f t hc h a p t e rw er e b u i l tt h er a t i o nm a n a g e m e n t s y s t e mb yu s i n gm i d - w a r e ,s m i l ,c d fa n dx m ld a t ai s l a n d s :a tl a s t , i nt h el a s t c h a p t e r ,ac o n c l u s i o no ft h i st h e m sw a sm a d e k e yw o r d s :x m l ,s v g ,m i d w t r e i n t e g r a t i o n ,v e c t o rs t a r i sl i c a l h e t e r o g e n e o u s d a t as o u r c e s c h a r t 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作 及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为 获得石油大学或其它教育机构的学位或证书而使用过的材料。与我一 同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明 并表示了谢意。 签名: j 年 月? 日 关于论文使用授权的说明 本人完全了解石油大学有关保留、使用学位论文的规定,即:学 校有权保留送交论文的复印件及电子版,允许论文被查阅和借阅:学 校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制 手段保存论文。 ( 保密论文在解密后应遵守此规定) 学生签名:硅堡墓。沙? 年,月2 , - n 导师签名:吐垒丛 。哆年 占月 上日 石油大学( 华东) 硕士论文 前言 第一章前言 1 1 课题背景及意义 随着计算机网络的发展和壮大,i n t e r n e t 已经成为一个人们生活、 工作中不可缺少的必需工具,在此期间,h t mr ,为网络技术的蓬勃发展 发挥了不可磨灭的作用,但随着其应用的不断深入和扩展,它的不足 之处也逐渐暴露出来了。x m l ( e x t e n d e dm a r k u pl a n g u a g e 可扩展标 记语言) 就是为了弥补这些缺点而出现的,x m l 使许多只利用h t m l 难 以解决的任务变得简单,使只利用h t m l 不可能完成的任务得以完成。 x m l 不仅改变了h t m l 固定的标识集,而且也从根本上改变了旧式的 i n t e r n e t 信息组织方式,创造了一种让所有计算机系统和所有程序员 均可进行“智能”交流的语言。自从1 9 9 8 年初x m l 由w 3 c ( w o r l dw i d e w e bc o n s o r t i u m ) 设计完成以来,这个标准便迅速漫延到许多计算机 领域。本文追踪和研究了最新的瑚l 应用技术。 与此同时,w e b 正成为越来越重要的数据来源,通过w e b 可以方 便地获得大量的信息。目前把多种异构的数据源转换到结构统一的、 更加方便、灵活的w e b 数据库,已经成为了国内外研究的重点;利用 新的w e b 技术( 如x m l ) ,建立功能、性能都更强大的w e b 数据库系统 的理论和方法,已成为当今对数据库和网络技术人员提出的挑战。本 文首先研究了x m l 数据模型、数据库系统,然后利用中间件技术实现 了基于x m l 的异构数据源的集成中间件。 中间件是处于系统和应用软件中间的种软件,它在操作系统、 网络和数据库之上,应用软件的下层,总的作用是为处于自己上层的 应用软件提供运行与开发的环境,帮助用户灵活、高效地开发和集成 复杂的应用软件。据有关专家介绍,中间件现已与操作系统和数据库 并驾齐驱,成为基础软件领域的三驾马车。系统用中间件技术实现了 基于x m l 的异构数据源集成中间件和s v g 矢量统计图中间件。 1 2 异构数据源集成系统需要解决的问题 异构数据源集成是数据库领域中的经典问题,并随着x m l 技术的 兴起,在国内外再次成为了该领域研究的一个热点。总的看来,在构 石油入学( 华j j i ) 硕士论文日u 茜 建异构数据源集成中f 司件时,主要会面临以下几方面的问题: 1 、异构性 异构性是异构数据源集成系统的首要问题,例如,异构的数据 库管理系统、异构的操作系统、异构的数据模型( 层次、网状、关 系、对象等) 、异构表的结构。 2 、完整性 异构数据源集成的目的是为应用提供统一的访问支持,为了满 足各种应用处理的要求,集成后的数据必须保证一定的完整性,包 括数据完整性和约束完整性( 例如数据类型、长度等) 。 3 、通用性 通用性包括两个方面:一个是中间件对于各种不同的数据源都 能够集成到一种统一的模式( x m l ) ,一个是对于不同的应用系统, 这个中间件都能够做到复用。 4 、开放性 中间件的每个组件都要有标准的接口,这样用户可以在其他应 用系统中进行方便的调用。 1 。3 目标与任务 课题跟踪研究最新的x m l 技术和应用,用x m l 技术结合其他编程 语言实现基于x m l 的异构数据源集成中间件和s v g 矢量统计图中间 件,然后用这两个中间件以及一些相关的x m l 应用程序( 例如:c d f 、 s m i l 、x m l 数据岛等) 实现了中石化石油专业工程造价管理系统, 满足了用户对广泛的数据交换和复杂的数据显示的要求。 1 3 1 基于x m l 的异构数据源集成中间件的设计与实现 基于x m l 的异构数据源集成中间件解决了在现有w e b 平台上如 何用x m l 实现对各种异构数据源集成的问题,向用户提供采用x m l 作为数据模型的w e b 数据库系统的用户视图。需要注意的是,为了简 化所研究的问题,抓住问题的核心,考虑到大部分企业数据目前仍旧 存储在关系数据库系统中,本文只针对企业数据集成中的主流和难点 问题异构的关系数据库数据集成问题进行了研究。但是,其中所 提出的问题、解决的方案、思想,完全适合于其它异构的数据源。 2 石油大学( 华东) 硕士论文 前言 课题用x m l 描述集成数据,用x s l 定义用户视图,用d t d 表示集 成的x m l 模式和关系数据库数据模式之间的映射。主要设计和实现了 基于关系数据库的以下几个中间件: l 、d b 2 x m l 实现从关系数据库到x m l 文档和d t d 转换的中间件。 2 、t a b l e 2 x m l 实现从一个数据表到x m l 文档和d t d 转换的中间 件。 3 、o u e r y 2 x m l 实现从一个标准的s q l 查询到x m l 文档和d t d 转 换的中间件。 研究了以下几个中间件的实现方案: l 、x m l 2 d b :实现从x m l 文档到关系数据库转换的中间件,包括 模式和数据。 2 、h t m l 2 x m l 实现从一个本地的h t m l 文件到x m l 文档和d t d 转 换的中间件。 3 、u r l 2 x m l 实现从一个标准的u r l 地址的h t m l 文档到x m l 文档 和d t d 转换的中间件。 1 ,3 2s v g 矢量统计图中间件的设计与实现 课题将利用s v g 实现基于常用的关系数据库( 例如:a c c e s s 、s o l s e r v e r 、o r a c l e ) 下的s v g 矢量统计图的中间件。主要实现了基于s q l 查询的矢量统计图中间件:q u ;r y 2 s v g ,该中间件可以把一个标准s q l 查询的数据转换为用s v g 显示得线状、柱状、或饼状统计图的s v g 。 1 3 3 中石化石油专业工程造价管理系统的x m l 实现 结合最新的x m l 技术,使用基于y d d l 的异构数据源集成中间件和 s v g 矢量统计图中间件以及s m i l 、x m l 数据岛、c d f 等x m l 应用程序实 现了中石化石油专业工程造价管理系统。用户可以通过报表模板和矢 量统计图模扳,实现自定义的统计报表和数据统计汇总的统计图表示。 石油大学( 华东) 硕士论文l 标准及x 札数据模型研究分析 第二章x m l 标准及x m l 数据模型研究分析 x m l 技术以及x m l 数据模型是我们研究的基础,因为基于x m i ,的 异构数据源集成中间件和8 v g 矢量统计图中间件都是在这两种技术的 基础上加上中间件技术而实现的。 x m ,设计的初衷是作为一哥十广泛应用j :i n t e r n e t 的标记语言,但 这并不意味着x m l 就只能在w e b 上应用。随着x m l 及其相关技术、应 用的发展,x m l 已经成为了万维网重要的信息发布标准和表示技术之 一,越来越多的应用之间都开始通过x m l 进行数据交换。最终,x m l 可以成为一条把许多应用联系在一起的纽带,通过分布式应用来处理 数据。实际上,x m l 已经不仅仅是一个标准,一个标记语言,从数据 库的角度而言,它已经成为了一个基于x m l 的,层次模型的半结构数 据库。 2 1 x m l 标准研究与分析 x m l 的前身是s g m l ( s t a n d a r dg e n e r a h z e dm 。 j pl a n g u a g e 标 准的通用标记语言) ,是一种国际标准,功能强大但是复杂繁琐,因此 便有了将s g m l 简化的想法s g m l 简化之后的结果便是x m l “1 。 2 1 1s g m l 、h t m l 与x m l s g m l 、h t m l 和x m l 之间有着密切的关系。 1 、s g m l s g m l 是一种用来描述电子文件结构与内容的标记语言。1 9 8 6 年, 国际标准化组织( i s o ) 发布了s g m l 标准的正式文本s g m li s 0 8 8 9 7 , 使s g m l 成为通用的描述各种电子文件的结构及内容的国际标准。 2 、h t m l h t m l 是从8 g m l 衍生出来的一种简单的标记语言,是w e b 史上最 成功的文档格式,已经成为了w e b 页面制作的标准,它具有易学性和 通用性,语法简单精练等特点。但是,h t m l 使用的是一套固定的标记 集,用户不能改动,这使得h t m l 越来越不堪重负。 3 、x m l 第一个x m l 建议标准于1 9 9 8 年2 月提出,也就是目前使用的x m l 1 0 版本。与h t m l 相似,x m l 也是s g m l 的一个子集,它免除了s g m l 4 杠油大学( 华东) 硕一l 论文x m l 标准及x m l 数据模型研究分析 的繁杂并保持了s g m l 的优秀特性,可以方便直接地运用到w e b 开发上, 给w e b 制作者提供了比传统的s g m l 和h t m l 环境强得多的对文档过程 和设计的控制能力,x m l 的应用和优点远远比s g m l 和h t m l 多。 2 1 2h t m l 的缺点 1 、它是一种表示技术,它包含了关于如何显示信息的标记,但是标 记和数据是混合在一起的,很难进行分割,给编程人员带来了不 少麻烦; 2 、它的标记集合是固定的,不能在自己的应用中扩展h t m l 标记; 3 、它对数据只提供了一个“视图”,如果想要得到不同的视图的话, 就必须重新生成一个h t m l 网页,它不允许客户端对数据进行变 换以便进一步进行处理,客户端只是起到显示的作用; 4 、它的格式既不适合机器分析也不适合人阅读它的源码,而且它的 格式要求比较松散,h t m l 解释器采用的是尽量解释的机制。这样 造成的一个弊病是同一个页面在不同的浏览器中可能显示的结 果大不相同。 2 1 3x m l 的技术特征 1 、简单性x m l 规范简单明了,语法包含一个非常小的规则集,使开 发者能很快学会;x m l 的格式使人和计算机都能很容易地阅读。 2 、可扩充性h t m l 发展至今,一个最大的缺点就是标记是固定的。x m l 使用者可以定义和使用自己的标记,也可与他人共享,可扩充性大。 3 、有效性使用d t d 或者s c h e m a 可以验证x m l 数据的有效性,这一点 类似于关系数据库中的数据完整性。 4 、国际化x m l 是以u n i c o d e 为基础,可以使用多种字符集。 5 、自描述数据x m l 每个元素都有自己的名字,而这个名字又与文档所 描述的现实世界中的实体所涉及的某项具体内容密切相关。 6 、显示与内容的分离x m l 的内容与x m l 的显示是分离的。可以通过c s s 或者x s l 等对x m l 数据进行显示。 7 、可以提供多种数据视图传递到客户端( 浏览器) 的数据可以根据 用户喜好和配置以适当的形式在视图中动态表现给用户,也可以进行 重新查询计算等。 综上所述,正是因为x m l 具有了这些优点,x m l 才可以被用来实 现更复杂的企业需求。 石油大学( 华东) 硕h 论文x m l 标准及x m l 数据模型研究分析 2 14x m l 约定及其相关处理 1 、x m l 文件语法规范 x m 。文件有着严格的语法规范”1 : 1 ) 必须有x m l j 声明语句声明是x m l 文档的第一句,其一般格 式是 。v e r s i o n 表示x m l 规范的版本;s t a n d a l o n e 表 示是否附带d t d 文件;e n c o d i n g 表示所用的语言编码。 2 ) 只能拥有一个顶层元素必须严格限定一个x m l 文档中只能 拥有一个项层元素,所有其它的元素都必须嵌套在这个元素 中。 3 ) 元素必须适当地嵌套也就是说,如果元素是在某一个元素 之中开始,它必须在同一个元素之中结束。 4 ) 所有的标识必须有相应的结束标识比如 ,在h t m l 中可 能不是成对出现的。而在x b l l 中规定,有一个开始标识,就必 须有一个结束标识。对于空标识( 例如: ) 处理的方法 是在原标识最后加,就可以了( 例如: ) 。 5 ) 区分大小写所有x m l 标识中的文字郡是有大小写区分的。 6 ) 给属性值加引号所有属性值必须加引号。 7 ) 元素的语法元素由一对标识以及其中的内容组成。名称可 以是字母、数字以及其它字符,名称不能以数字、“”、字母 x m l ( 或x m l 或x m l ) 开头、不能包含空格、不能包含“:”。 2 、文件有效性检查 一个遵守x m l 语法规则( w e l 卜f o r m e dx m l ) ,并遵守相立d t d 文 件规范的x m l 文档称为有效( v a l i dx m l ) 的x m l 文档。前者规定x m l 文档必须完全遵守x m l 语法规范,后者规定x m l 文档必须遵守“文件 类型定义( d t d ) ”。 3 、x m ln a m e s p a c e $ ( 名称空间) 当在一个x m l 文档中使用他人的或者多个d t d 文件时,可能就会 出现在不同的d t d 中标识名相同但表示的含义不同,这就会引起数据 混乱。比如在一个文档 t a b l e l 中 表示桌子, 而在另一个文档 t a b l e 2 中 表示表格。 n a m e s p a c e s 就是为了解决这个问题而引进的。n a m e s p a c e s 通过给标识 6 石油大学( 华东) 硕士论文x m i 。标准及x m l 数据模型研究分堑 名称加一个网址( u r l ) 定位的方法来区别这些名称相同的标识。这个 u r l 并不是真的要登录到这个网址上,仅仅是一个区别的标志而已。 4 、数据处理和显示 对x m l 常用的数据处理和显示方法是使用x s l 进行变换。x s l 能 够把数据从一种x m l 表示转换成另一种表示。例如:x s i 。可以完成以 下数据的处理:计算节点的值、处理多个元素、用表达式选择节点、 理解缺省的模板规则、确定输出要包含的内容、复制当前节点、对:付 点进行计数、对输出元素分类以及插入c d a t a 和 3 1 2 4 2 2 3 4 4 1 2 5 5 1 0 9 石油大学( 华东) 硕士论文x m l 标准及x m l 数据模型研究分析 2 1 5 2 3 7 4 4 2 2 3 8 描述了一个费用的信息:直接材料、燃料及动力、人工费等。我 们可以很方便的将其对应于传统r d b m s 中一张二维表。但是,x m l 数 据本身的树形结构不同于关系模型中的二维表结构,这种差别反映在 数据库产品处理x m l 数据的技术上,形成两大阵营:x m l e n a b l e dd b m s ( x e d ) 和n a t i v ex m ld b m s ( n x d ) 。x e d 是在原有数据库基础上扩展 了x m l 支持模块,完成x m l 数据和数据库之间的格式转换和传输。n x d 实际上就是单纯在x m l 领域内的一种模型,出现在x m l 数据处理领域 内,一般采用x m l 文档的存储数据。实质上我们研究的就是n x d 。 n x d 文档包含两种类型”1 : l 、“以数据为中心”( d a t a - c e n t r i c ) “以数据为中心”的x m l 文档着重于文档中的数据和数据之间的 关系,如销售订单、航班时刻表、科研数据及股市汇率等。这种文档 的数据一般由机器产生,来源于传统数据库中的数据。主要应用在电 子商务、e r p 、e a i 等领域,集成不同数据源的数据,交换信息。 “以数据为中心”的x m l 文档是一种结构化的数据,具有结构规 整、数据粒度精细( f i n e g r a i n e dd a t a ) 、很少或没有混和内容( m i x e d c o n t e n t ) 、文档顺序( d o c u m e n t o r d e r ) 不重要等特点。上面定额系 统报表就是一个典型的“以数据为中心”的x m l 文档,记录了费用的 信息。每个费用的信息都很规整,而且粒度合适,同级元素( e l e m e n t ) 间的顺序不重要,交换两个同级元素( e l e m e n t ) 并不会破坏文档的可 读性。 一般来说,关系数据库的数据都可以转换成一系列以数据为中心 的x m l 文档。 2 、以文档为中心的文档( d o c u m e n t - c e n t r i ed o c u m e n t s ) “以文档为中心”的x m l 文档主要是用来表示人类自然语言描述 的数据,如书籍、e m a i l 、广告等。这种文档具有更复杂的结构,一般 不是机器自动产生的。其特性为结构不太或根本不规则、数据粒度大 ( 1 a r g e rg r a i n e dd a t a ) ,混合内容多,同级元素或p c d a t a 出现的次 矗油大学( 华东) 硕士论文 ) l i l 标准及x m l 。数据摸型研究分析 序一般来说是比较重要的。 2 32x m l 数据库的特征分析 l 、x m l 数据库的优点 用x m l 作为数据文件来存储数据具有一些优势:例如,x m l 的跨 平台性和强适应性,它是自描述的( 所用的标记描述了数据的结构和 类型) ,能够以树型或图形结构描述数据。同时,x m i 也提供了许多数 据库所具备的东西:存储( x m l 文档) ,模式( d t d 、x m ls c h e m a ) ,查 询语言( x q u e r y 、x p a t h 、x q l 、x m l q l 等等) ,编程接口( s a x 、d o m 、 j d o m ) 等等。 2 、x m l 数据库的缺点 从以上的分析可以得出,x m l 数据库实质上是层次数据库,而不 是关系型或面向对象型数据库。所以它具有一些与关系数据库相比的 缺点。例如,它是冗余的,由于要对它进行解析和文本转换,所以数 据访问速度较慢;还有,它缺少一些真正的数据库所应具备的东西: 高效的存储,索引,安全。事务和数据一致性,多用户访问,触发器, 在多个文件中查询等等。 2 3 3 各大关系数据库系统对x m l 的支持 从以上的分析可以得出,使用关系数据库来解决x m l 数据的存储 问题。是较好的选择。事实上,各大关系数据库系统正在逐步增加对 x m l 文档格式的支持: o r a c l e o r a c l e 作为各种x m l 技术的领头人,提供了对x m l 术语、d i d 、模 式和n a m e s p a c e 的技术支持。例如:新版本的o r a c l e 增加了许多与 x m l 相关的分析器,o r a c l ex m ls q l 工具包提供数据库记录和x m l 元 素之间相互转换的功能。 m i c r o s o f ts q ls e r v e r 从s q ls e r v e r7 0 之后,m i c r o s o f t 公布了两项技术预展x m l 与s q ls e r v e r 集成,通过u r l 访问s q ls e r v e r ( 即通过u r l 直接把 查询传送到s q ls e r v e r ,返回x y l 格式的查询结果) 。s q ls e r v e r 已 经可以利用i i si s a p i 实现h t t p 访问s q ls e r v e r ,x m l 数据格式访问 及x m l 数据更新。 石油大学( 华东) 硕士论文异构数据源集成d t d 设计与中间件实现 第三章异构数据源集成d t d 设计与中间件实现 异构数据源问的数据集成或者交换长期以来一直是困扰数据库和 w e b 应用开发人员的问题。因为每种数据源都有自己特定的数据格式, 当要从一种数据格式转换成另种数据格式时,出于互不相同的数据 格式和数据库运行的操作系统平台而导致加载非常困难。利用目前流 行的x m l 语言,可以很容易的解决格式不一致和数据源的异构性从而 实现数据的交换。这样,必须首先能把各种数据源都集成到煳l 文档 上来,我们完成了基于x m l 的异构数据源集成中间件。 由于,目前关系数据在整个的数据源中占有很重要的位置,所以 我们以关系数据库为主,完成了从关系数据库到x m l 转换的中问件, 同时,我们也研究了其它类型的数据源到x m l 的映射方法和y j 4 l 到关 系数据库的映射方法。 关系数据库到x m l 转换中间件的设计目标就是能够将任何与o d b c 兼容的关系数据库( 例如;s q ls e r v e r 、o r a c l e 、a c c e s s 、s y b a s e ) 中的数据转换成符合x m ld t d ( d o c u m e n tt y p ed e f j n j t i o f f 文档类 型定义) 的x m l 文档:并具有一定的用户可配置性、能将不同形式的 关系数据库表转换成符合不同d t d 的x m l 文档。 3 1 相关技术 这一部分要实现异构数据源集成中间件。所以涉及到的主要技术 有x m l 数据模式描述语言d t d ( 或者s c h e m a ) 、操作x m l 的应用程序接 口d o m ( 或者s a x ) 和中间件。 3 1 1 d t d 与x m ls c h e m a 的选择 为了使x m l 的其他用户能够理解符合自己创建的词汇表的文档的 结构,保证x m l 文档格式的正确性必须通过某种通用的方式说明词 汇表的语法规则( 类似于关系数据中的完整性约束的定义) 。d t d 和 x m ls c h e m a 都是用来说明词汇表的语法规则的语言。d t d 作为 s g m ld t d 的一个子集,与x m l 格式完全不同的格式,是近几年来 最广泛使用的一种x m l 文档类型定义模式。w 3 c 于2 0 0 1 年5 月又正 石油大学( 华东) 硕二e 论文异构数据源集成i ) t d 设计与中间什实现 式推荐了x m l 的标准模式x m l s c h e m a ,格式与x m l 完全性相同, 有可能成为x m i ,模式描述语言的主流,并逐渐代替x m ld t d 。那么, 到底在系统中是使用d t d 还是x m ls c h e m a 呢? 下面对这两个语言做 个比较i ”。 i t e mx m i 。d t dx m ls c h e m a 语法使用自己的语泫,与x m l 的语事实一卜也是x m l 的一种应用, 规则法完全不同语法规则与x m l 完全相同 强数提供的数据类型只有c d a t a内置了如l o n g ,i n t ,s h o r t , 据类等十种内置数据类型d o u b l e 等3 7 种数据类型另外 型还可以自定义数据类型。 元素没有提供对于无序情况的描提供了对于无序情况的描述 顺序述,它必须采用穷举元素各种 的支可能出现的排列顺序的方式 持来实现 命名并不能支持命名空间 支持命名空间 空间 对于d o m 和s a x 只对x m l 实例文档由于x m ls c h e m a 本身就是一个 a p i有效,所以无法通过d o m 或 x m l 文档,所以我们可以通过 的支s a x 来解析d t d使用d o m 、s a x 或j d o m 等 持

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论