




已阅读5页,还剩58页未读, 继续免费阅读
(计算机应用技术专业论文)基于xml的数据库技术及其应用的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于x m l 的 数据库技术及其应用的 研究 摘要 随着互联网的蓬勃发展, 传统的h t m l 数据交换方式已 经越来越满足不 了日 益增长的数据交换的 需求。 微软. n e t 的三大支柱之一x m l 作为一种极 有 前 途 的 互 联 网 上 数 据 交 换 的 新 模 式 , 己 越 来 越 多 的 取 代h t m 协因 此 存 储 x m l 数据的x m l 数据库必然会是计算机科学技术和业界瞩目 的 焦点。 本文从 分析传统的关系型数据库和 x m l数据库不同的特点入手,详细探讨了 x m l 数据库的技术优势,并对两类 x m l数据库进行了详细的比较、分析,本文 侧重对 x m l 数据库的结构 性研究。 最后, 本文通过在网 站上创建填写表单 实 例, 具体实现和说明了 如何进行 x m l数据和数据库之间的传输,并提供 给w e b 页面。 关 键 词 : x 献 x m l - e n a b l e dn a t i v e - x m l 节点控制 口/ t h e s t u d y a b o u t d a t a b a s e t e c h n o l o g y a n d i t s a p p l i c a t i o n b a s e d o n x ml ab s t r a c t w i t h t h e v i g o r o u s d e v e l o p m e n t o f i n t e r n e t , t h e t r a d i t i o n a l d a t a - e x c h a n g i n g m a n n e r o f h t ml c a n n o t m e e t t h e n e e d o f i n c r e a s in g d a t a . a s o n e s u p p o r t o f .n e t b e l o n g in g t o mi c r o s o ft , x m l i s a v e r y p r o m i s i n g d a t a - e x c h a n g i n g m a n n e r o n i n t e r n e t , x m l i s i n s t e a d o f h t ml g r a d u a l l y . s o x mi , d a t a b a s e w h i c h s t o r e s x ml d a t a w i l l b e t h e f o c u s i n f u t u r e . t h i s t h e s i s s t a r t s w i t h t h e c h a r a c t e r t h a t i s t h e d i ff e r e n c e b e t w e e n t r a d i t i o n a l r e l a t i o n a l - d a t a b a s e a n d x m l - d a t a b a s e , th e n p a r t i c u l a r l y d i s c u s s e s t h e s u p e r i o r i t y o f x m l - d a t a b a s e a n d c o m p a r e s t w o k i n d s d a t a b a s e , a t l a s t g i v e s a n e x a m p le w h i c h i s f i l l i n g i n t a b le o n i n t e r n e t t o e x p l a i n h o w t o t r a n s f e r t h e y ml - d a t a t o d a t a b a s e k e y w o r d s : x ml - e n a b l e d d a t a b a s e , n a t i v e - x ml d a t a b a s e , s t r u c t u r e , n o d e - c o n t r o l 独 创 性 声 明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标志和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果, 也不包含为获得合肥工业大学或 其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所 做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签字:签字日期:年月日 学位论文版权使用授权书 本学位论文作者完全了解合肥工业大学有关保留、使用学位论文的 规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘, 允许论文 被查阅和借阅。 本人授权一* b e 工业大兰一可以将学位论文的全部或部分论文 内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、 汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:导师签名 : 签字 日期 :年月日签字 日期 :年月日 学位论文作者毕业后去向 工作单位 : 通 讯 地 址 : 电话: 邮编: 致谢 值此论文完成之际,谨向 我的导师丁筱春研究员表示最诚挚的 感谢。读研 期间,丁老师对我的学习 及论文工作自 始至终都倾注了 大量的心血。 对于我论 文的选题,修改直至最后的定稿一直给予了精心地指导。并提出许多的修改意 见。丁老师渊博的学识,高尚的品质,严谨的治学态度,敏锐的学术眼光都将 是我今后学习和工作的楷模。 感谢张静同学一直以来在学习和生活上给予我无私的帮助和关怀。 感谢三十八所信息中心石磊主任对本课题所提供的技术支持和帮助。 三年来,我还得到了 合工大计算机与信息学院许多老师以 及同学的关心, 支持和帮助,在此均表示深深的谢意。 合肥t 业大学硕 1 : 学位论文 前言 伴随着科技的迅猛发展, 世界 经济正 在加速从工业社会向以 信息为主导, 以 互联网等先进传媒为载体, 以 知识创新为核心的信息社会过渡。 网络经济的 崛 起以 及互联网的 迅速发展使得对i n t e rn e t 上的数据格式及数据流通的方式的 要 求不断的增进。 一直以 来, 作为 信息流通的主要手段的i n t e rn e t 上数据交换 主 要是 通 过h t m l ; 因 此h t m l 对 整 个w w w 的 发 展以 及 知 识 和 信息的 传 播交 流 功不可 抹。 那时,,h t m l仿佛已 成为网上信息交流的标准格式。 尽管h t m l 在人机界面, 也就是页面布局方面做得非 常好, 但是它却不利于不同机器之间的 信 息交流。因为其标签大部分是用来对页面进行布局的, 因而缺乏对数据信息 含义的表 达。 随着互联网的发展, 几乎所有的企业、 网站、 电 子商务公司, 乃 至软件开 发者们都被同一个问 题所困 惑: 由 于数据库的数据格式与表达方式的 差 异, 使得各自 内部的数据不能互相合并、 资源共享和无缝链接。 这其实是暴 露了h t m l 架构在w e b 技术上的 缺点: h t m l 在设计上是用来展示内容和手 动浏览网络的,不适合自 动化的资源管理。 x m l ( e x t e n s i b l e m a rk u p l a n g u a g 。 一 可 扩 展 标记 语 言 ) 的 出 现, 突 破了 传 统 h t m l 技术发展的瓶颈, 可以克服h t m l 的缺陷, 从而必将取代h t m l 成为 了 现代信息交换的有力工具。 x m l 可以由 用户自 定义标签, 极大地增强了 对信 息 涵义的表达能力。 用户可以 按照自 己的 要求组织数据的格 式。 只要双方遵循 同 一x m l 数据格式, 可以在不同的用户不同的系统之间利用x ml 作媒介进行 数 据交换, 极大地方便了 数据在i n t e rn e t 上的交流。 事实上_x m l 将成为设备、 网 页浏览器、 计算机、 服务器和应用程序之间通信的混合语言。 任何两 个应用 程 序 ( 不管 是谁建立的 或者何时建 立 的 ) 都 能 相互 交换信息 ( 如 价格、 质量、 体积 等等 ) , 而不必事先设计成通话。 x m l的 迅速发展,使其成为全 球信息传递和共享日 益重要和最具潜力的 资 源, 电 子商务、电 子图书、 远程教育等全新领域的需求和发展, 使数据变得 更 加复杂和多样化, 利用传统数据库技术很难存储和管理所有不同的 数据。 目 前 , x m l正 在成为 上 述数 据描述 和 交换的 标准, 并且将 来会 代替而成 为以 上 保 存数据的主要格式。 其一系列相关的 标准已 广为 接受和使用, 包括文档的存 储、 查询、 集成、 索引等, 为成为数据 库莫定了 基础。 很难 想象离开了 数据库 之后, 动态x m l该如何表现。 在i n t e r n e t 发展的 今天, 数据库技术首先要 考虑的是,在数据库与i n t e r n e t 之上所架构的信息系统之间有没有可结合的 共同 点。 原 有的 数据库技术面对的 空间是若干数据库在一定的网 络空间 上连接 起来的一个世界, 在这个世界上它可以实施相应的技术, 使用户有效地管理各 自 的数据库, 并集成起来去完成一定的 任务。 但是在w e b 世界中, 这一情况发 合 肥工 业大 学 硕卜 学 位 论 义 生了 本 质的改变。 w e b 上存 储的 是一些 无结构, 而 且无法有能力去组织管理的 数据。每个站点上的数据都在无序的状态下产生和消失。事实上, x m l与数 据库的 关系 越来越密切, 从存储在不同 介质中 的 数据自 动的生成x m l 文 档以 及从不同的数据存储交换信息, 必将成为未来面向 信息的i n t e rn e t 的主要特点。 面 对x m l 发展的光明前景及其所蕴藏的巨 大商机, 各大主流数据库厂商 纷纷提供了对x ml技术的支持,从而使得x ml 数据库的发展迅速。 但是由 于x m l 数据库是一个崭新的概念, 而且目 前在国内 传统的关系型数据库的发 展又非常成熟, 所以 使得x m l 数据库在国内尚 未有较大发展。 本文对于x m l 数据提出了 运用节点来控制对x m l 数据的存储这个观点, 具有一定的实用价 值。 本论文正是基于上述背景提出的, 文章针对目 前对数据库研究的 状况, 介 绍了x m l 数据库的基本概念和相关技术, 并对其应用领域和使用方法进行了 分析和研究。 本论文的内容组织如下: 第一章首先对数据库的发展做了 一个总体概述, 介绍了 数据库的发展历 史, 并且简单提出了现今传统数据库存在的不足。 并就随着数据库的发展而不 断变化多样的发展主题进行简单介绍。 xml( 可扩展标记 语言, e x t e n s i b l e m a r k u p l a n g u a g e ) 作为一种极有极 有前途的互联网上数据格式和数据交换的新模式己 经越来越多的 取代了 h t m l 。 可以 预见, 在今后的一段时间内, x m l 数据将爆炸性地出现在i n t e r n e t 世界里。 有鉴于此, 本文第二章对x m l 定义、 结构、 特点及其优点做了 较为深 入的分析和探讨。 在第三章首先认真研究当今i n t e r n e t 世界的发展现状和所存在的一些需 要解决的问 题。讨论了目 前i n t e r n e t 世界所面临的主要问题和w e b 现状。 然 后分析了 传统的关系型数据库的定义和特点, 接着着重分析了关系性数据库和 x m l 数 据库的不同之处, 对于x m l 数据 库在 传统数 据库所不擅长的 领 域进行了 说明。 并且介绍了 现在各主流数据库生产厂商对x m l 数据库的支持及他们所研 制的x m l 数据库。最后简单介绍了x m l 数据库的技术特点和优势。 在第四章详细地探讨了两类x m l 数据库所不同的技术规范, 就二者的优点 和缺点做了 仔细地比较, 并就他们不同的 特点提出了 各自 相应的适用范围。 详 细地介绍了x m l - e n a b l e d 数据库的具体存储技术、 数据模型以 及关系映 射。 还 有n a t i v e - x m l 数 据库的定义、 特点 和分类. 在第五章是在前面几章x m l 数据库的理论研究和探讨的基础之上, 设计了 一个网站上用户填写信息的 模型, 来具体说明 用x m l 数据库如何实现x m l 信息 和数据库进行信息传递。 合肥工 业人 学硕 七 学位论文 在第六章对全文进行了总结并对x m l 数据库的发展提出了展望。 x m l数据库是当今信息领域中 一个全新的前沿课题, 本文在这一方面只 是 做了 一些初步的 研究和探索, 本文不足之处在所难免, 谨请各位老师和同 学 批评指正。 含肥一业大学硕士学位论文 第一章数摄库系统发展历史 l 。l 数据麾发展历史筏介 数撼痒技术是计算枧科学技术中发展最抉,应用最广泛豹瀵要分支之一, 它已成为计算机信息系统和计算机应用系统的黧要技术基础和支柱。个国家 数据库产业的发展状况,在很大鞭度反映了该尉信息技术和信息产业的发展水 平。在i n t e r n e t 出现以前,数据库产她可以说蹩发展激快的信怠产业,而 i n t e r n e t 的发展又给数据库产业注入了新的活力,使传统的数据库产她向着 i n t e r n e t 服务的方向发展。 鱼六十年代豹商月数握库系统面世以来,数据库系统的发展大致经掰了以 下几个阶段: 数据库麓瀑祭统的发展历程 图1 1 数据库发展历史 七十年代以前,数据库系统并没有个完缀和坚固的数学理论基础,数 据痒产熬童接按实惩应翅豹要求来设计。这段对辫豹数攒库产晶以屡次型数据 库系统为主。第一个通用的d b m s ( d a t a b a s em a n a g e m e n ts y s t e m ,数掰库管 理系统) 是由c h a f e sb e c h m a n 予2 0 世纪8 0 年代早期农通用电器工作慰设计 t 台蔗巴下业大学娥,# 学垂芏论文 的,当时被称为集成数据存储( i n t e g r a t e dd a t as t o r e ) ,这段时期的产晶 称为“瓣关系型鼗爨库系统( p r e r e l a t i o n a ld a t a b a s e ) ”辩鬻。 在这段时期,为了适应美国和全世界科技信息的迅猛增长和与此稳对应 的信息需求的不断增长,美国政府的信息部门_ 开始带头组织数据库的生产和利 用。这其中包括美国圉家航空航天局( n a s a ) 釉美国原子能委昃会( 即现在的美 国能源部) 等蓬要的政府部门,而美围国家控术情报服务处( 孵i s ) 至今仍然怒 美国最大的文献性数据库生产者之。这一时期的数据库集中在科学技术和工 程领域。随餐政府数糖库产爨的不断提高,数据库产渡的发箴开始向商监亿邋 渡。 此时的数据是按扁平文件( f l a t f i l e ) 的格式保存起来的,所有的数据 以记录的形式保存到个大的表格中。扁平文件需要冗余的数据,这就导致了 大文件的产生。此外,扁平文件数据饭难处瑗,而且需要大爨的入力资源去维 护它。为了维护数据以及减少与数据相关的穰序的花费和复杂度,就嚣要解决 冗余数据酶阏题。 1 9 7 0 年,i b m 公司的研究员c o d d 博士发袭了题为大型数摆库的数据关 系模型著名文章( 发表在c o m m u n i c a t o n so f 抽学名铆杂悫1 9 7 0 簿6 月稍 上) 。在这篇论文中,c o d d 博士介绍了用来消除保暇冗余数据的必要性的一 套蔑羽。这套簸赠就建关系爰数据库灌论豹麓源。 幽此产擞的关系型数据黪裁残必了按关鬟表示数据鳇数据模型。数撂模黧 在概念上是数据、关系以及对数据的约束这三者的集合。关系型数据库模型就 是对象、事传和与关系型数攒库系统窍关豹其它事项在概念上酌表示。其真委 含义就是关系型数据模型要求数据按照关系束保存。 从鼗,数据瘁张统豹发震进入了“荚系型数握痒系统( r e l a t i o n a l d a t a b a s e ) ”时期。关系型数据库系统以关系代数为坚实的理论基础,经过几 十年的发展鄹实际盛翅,技术越来越成熟帮竞薯。其巾大中型关系型数据疼鲍 代表产品有o r a c l e 、i b m 公司的d b 2 、微软公司的瞒s o ls e r v e r 、s y b a s e 、 i n f o r m i x 等,常用的小型数壤库有a c c e s s 、p r a d o x 、f o x p r o 等,现农个人用 户磁较常用的主要是基于中小型数据库m ss o ls e r v e r 和a c c e s s 的等等。 随着信息技术和市场的发展,人们发现关系型数据库系统虽然技术很成 熬,偿其局限槛氇篷驻丽荔冤的:它缝很好蛾处理所谓的“袭格整数据”,却 对技术界出现的越来越多的复杂类型的数据无能为力。它的关系数据艨关系模 鍪避予篱摹,不瘸子袭运复杂麓数据结构;丽基关系数疆库支持的数撩类型鸯 限,滗非是绪构化的数字或字符,无法包容照多的数据类型。 5 台自墨z 啦大学硪 ? 学位论文 九十年代以后,技术界一巍在研究釉寻求所谓的“后关系型数据库系统 ( p o s t - r e l a t i o n a ld a t a b a s e ) ”。尤其楚九十年代中后瀚,整器著名的产盘藏 略调查咨 u 公司g a r t e n e rg r o u p 发表了一系列关于数据库系统发展的调研报 告,其羹点翔绣起来大穰有戳下冗患: ( 1 ) 关系型数据库系统技术已相当成熟,其发展已趋顶峰; ( 2 ) 尽管有了缓大袋震,关系壅数搽淳系统雅薤理瓣数舞癸鳖爨稳当毒 限: 3 ) 艇羲整息技术熬发嚣,枣场越来越震要毙楚理复杂数攘类型麴数握 库: ( 4 ) 王 予大型数据露营理系绞豹技术复杂姓以及开发的高昂费用,今爱毅 挺数据库系统很可能只在现有的数据库系统产晶厂家内产生。 g a r t e j l o rg r o u p 的报告引起了i t 、监界豹赢发重视。但在什么是毅型数据 库系统的发展方向的问鼷上,产妲界一度是相当困惑的。在相当段时间内, 人们把大量的精力花在研究“蕊向对象的数据库系统( o b j e c to r i e n t e d d a t a b a s e ) ”或简称“0 0 数据库系统”。值得一键的是,美国s t o n e b r a k e r 教 授提出的理论曾度受到产业界的青睐。s t o n e b t a k e r 在其著作面向对象的 关系鍪数繇;库系统:未来静巨滚指遗: ( 1 ) 纯关系溅数据滕系统市场已逐渐饱和; ( 2 ) 纯而向对象型数据库系统除一些特殊用途外,市场极其狭小 ( 3 ) 黼囱对象静关系整数黎霹力+ 是赣婆l 数蕹簿系统的发展方囱。 然丽,数年的发展表明,面向对象的关系型数据库系统产品的市场发展的 倍况并不瑾惑。壤论上静完美懂并没有带来市场的热燕反应。箕誉成功的主要 原因在予,这种数据库产l l 矗的主娶设计思想是企圈用新型数据库系统来取代现 磷耱鼗籀浑系统。这黠许多已经运焉数据痒系统多年并弦累了大蠢工作数据煞 客户,尤其是大辫户来说,是无法承受新旧数据问的转换而带来的巨大工作量 及基颧开支豹。另矮,嚣离对象豹关系攫数据瘁系统嫠奁询语富交褥极其复 杂,从而使得无论是数据库的开发商家还是应用客户都视其复杂的应用技术为 搽途。i n t e r n e t 瓣异军突起淡歉琏l ( 鼙扩震标谗语言,e x t e n s i b l em a r k u p l a n g u a g e ) 语亩的出现,给数据库系统的发展开辟了一片新的天地。九十年代 寒,夔饕悠翟软嵇黢给公霹( s o f t 辩a r e 熊) 塞悫畿瑟上繁一个“爨姨瑶l 数据 库系统( n a t jv gx m ld a t a b a s es y s t e m ) ”产品w t a m i n o 问世,标志着数据 黪系统滋入了额嬲个斡发展穗嬲。夔爱,一些大型数据摩系统嫩产厂家,熟: 甲骨文、微软公闭等纷纷宣布要发展支持x m l 的数据库产品。 垒型三些查差塑! :兰燕堡苎一一 i 【1 t e r n e t 的迅猛发展带来网络经济的浪潮,通过i n t e r n e t 开展电子商务 己缀成为卺弊经济发展的方向。总之,菲结梅讫数攒的获取、管瑾和集成、商 业姆能、自主管理决定了数据库发腿的方向。 i 2 数据库的发展主题 数据库作为从6 0 年代初就发展起来的计算机技术,在经过了二三十年的 发袋,数攥痒懿技术邑经趋予袋熬。麸鼗据黪熬痤麓镶壤、激嗣熬数据模型及 相关技术的三维空间可以看到数据库形成的门类:数据库与相关技术结合形成 豹分毒式数据疼、并学数据蓐、大王餐麓、鲻识数嚣津、演绎数据黪等;数爨 库技术在具体应用需求的基础上形成了工稔数据库的研究领域、地理分析系统 数掇痒、数撼分孝厅决策等一系捌分支;慰对,数据丈蟹积累形成了个毅豹艘 用需求,它带来了数据仓麾、联机分析处理簿技术。 在数据麾产业灼发展初期,科学技术霸王程方露懿数据麾在数捉库总量中 占绝大多数。而隧祷数据库产业向商业化发展,商贸方面的数据库随之兴起。 其聪,随着计算机技术和网络技术鲍发展,个人计冀机的兴起,个人翻家庭邈 成为数据库的使用者,为家庭和衽会服务的数据库开始迅速发展。数据库主题 的领域不断的拓宽,包括科举、技术、工程、商业、套融、经济、法德、社会、 文学,甚至脊乐、亳影、饮食等人们衣食住行静各方蕊都成为了数据库的主舔。 在数据库主题领域不断丰富的同时,每个具体数据库所瑚对的专业范围也 越来趣其体。出现了锌对纯擘、物璨、生物学科中的其俸专渡,甚至是各专渡 的予专业的专业型数据库。不仅科技数据库如此,那些以经济甚至社会信息为 蠹餐匏数据瘁靛专簸方囱氇越采越缳,专门蔽对薅貔、簿幕鹚电影、饮食滔费 等生活细节的数据库也开始出现。 犟甥豹数据痒只提供绘蔫产撼藻死投翡文本攘簧倍塞,嚣霜户检索数甏 库所得到的检索结果通常也必须由数据库提供商通过信件邮递的方妓传送绘 翅声,这耱方式不仅耗费弱户太蠢瓣金钱, 嚣显嚣蘩用户投入更多瓣藉力鞫 时间。而随着计算机技术,通讯技术和网络技术的迅速发展以及软件方面研 究残暴豹不凝潺瑶,逐濒戳现了全文数据寒、数据簿熬毙蠢舨、联撬数据黪 和通过i n t e r n e t 访问查询的数据库。并且多媒体数据也开贻应用在数据库巍 中,出现了以声音、窝像以及动垂为疼骞熬数据库。赫型数据瘁豹爨瑰楚翅 户获取数据库信息鬻加容翁和方便,用户可以获取到所需文献的全文,同时 可以摄到必要的图像和声静甚至影像信息,不仅获驭到豹信息痰容秘含量受 加率富,而且大大节约了获取信息时所花费的时间、精力和金钱,从而使用 户遨加倾向于剥用数据库获取信息,扩展了数据库的市场。 ? 合肥t 业大学硕 : 学位论文 i n t e r n e t 的迅猛发展带来网 络经济的浪潮, 通过i n t e r n e t 开展电 子商务 己 经成为世界经济发展的方向。 总之, 非结构化数据的获取、 管理和集成、 商 业智能自主管理决定了数据库发展的方向。 i . z 数据库的发展主题 数据库作为从6 0 年代初就发展起来的计算机技术, 在经过了二三十年的 发展, 数 据库的技术己 经趋于成熟。 从数据库的应用领域、 采用的数据模型及 相关技术的三维空间可以 看到数据库形成的门 类: 数据库与相关技术结合形成 的 分布式数据库、 并行数据库、 人工智能、 知识数据库、 演绎数据库等; 数据 库技术在具体应用需求的 基础上形 成了 工程数据库的 研究领域、 地理分析系统 数据库、 数据分析决策等一系列分 支; 同时, 数据大量积累形成了一个新的应 用需求,它带来了数据仓库、联机分析处理等技术。 在数 据库产业的发展初期, 科学技术和工 程方面的数据库在数据库总 量中 占 绝大多 数。 而随 着数据库 产业向 商业 化发 展, 商贸 方 面的 数 据库随之兴 起。 其后, 随 着计算机技术和网 络技术的发展, 个人计算机的 兴起, 个人和家庭也 成为数据库的使用者, 为家庭和社会服务的 数据库开始迅速发展。 数据库主题 的领域不断的拓宽, 包括科学、 技术、 工程、 商 业、 金融、 经济、 法律、 社会、 文学, 甚至音乐、 电影、 饮食等人们 衣食住行的 各方面都成为了 数据库的主题。 在数据库主题领域不断丰富的同时, 每个具体数据库所面对的专业范围也 越来越具体。 出 现了 针对化学、 物理、 生物学科中的具体专业, 甚至是各专业 的子专业的专业型数据库。 不仅科技数据库如此, 那些以经济甚至社会信息为 内 容的 数据库的专业方向 也越来越细, 专门 面 对购物、 好莱坞电 影、 饮食消费 等生活细节的 数据库也开始出 现。 早期的数据库只能提供给用户枯燥死板的文本摘要信息, 而用户检索数据 库所得到的检索结果通常也必须由 数据库提供商通过信件邮递的方式传送给 用户, 这种方式不仅耗费用户大量的金钱, 而且需要用户投入更多的精力和 时间。 而随着计算机技术, 通讯技术和网 络技术的迅速发展以 及软件方面研 究成果的不断涌现, 逐渐出 现了 全文数据库、 数据库的光盘版、联机数据库 和 通 过工 n t e r n e t 访问 查 询的 数 据 库。 并 且 多 媒 体 数 据也 开 始 应 用在 数据 库当 中,出 现了以 声音、图像以 及动画 为内 容的数据库。 新型数据库的出 现使用 户获取数据库信息更加容易和方便, 用户可以获取到所需文献的全文,同时 可以 得到必要的图 像和声音甚至 影像信息, 不仅获取到的信息内 容和含量更 加丰富, 而且大大节约了 获取信息时 所花费的时间、 精力和金钱, 从而使用 户更加 倾向于利用数据库获取信息, 扩展了 数据库的 市场。 合肥z业大学硕士学位论文 数 据库 技术的 延 伸与 发 展为 科学 数 据 库工 程建 设 提 供了 有力 的支 持, 并为 其信息系统建设开阔了 远景rz r 合肥工 业人学顺 i : 学位论文 第二章x m l 简介 2 . 1发展x m l 的 背景及x m l 的特性 i n t e r n e t的发展将人们带入了一个信息 爆炸的时代。 但网上信息的海量 和无组织性使得它只是一个杂乱无章的信息仓库, 在进行信息检索时常常发 生“ 信息迷向” , 因而人们希望能够得到更加“ 智能 化”的信息服务。 ht ml 文档着重描述we b 页面的 显示格式, 它不容易被解析、 检索以 及 “ 智能化” 的处理, 与之相关的基于关键词的检索技术虽然己 经相对成熟, 但却很难满足 “ 智能化” 信息服务的需要。 在新需求的推动下, 人们提出了一 种着重描述w e b内容的可扩展标记语言xml( 可扩展标记语言, e x t e n s i b l e m a r k u p l a n g u a g e ) 。 xml( 可扩展标记语言,e x t e n s i b l e m a r k u p l a n g u a g e ) 是 s g m l ( s t a n d a r d g e n e r a l i z e d m a r k u p l a n g u a g e , 通用 标识语言 标准) 的 一个子集, 它是一套定义语义标记的规则, 这些标记将文档分成许多部件并对该部件加 以 标识。 它也是元标记语言, 能够用来定义与 特定领域有关的、 具有语义信息 的、 结构化的标记语言的句法, 从而有利于信息的表达和结构化组织, 使数据 检索和处理更加有效。xml 的 基本思想是: 用标记 表示数据的意义, 而不是 像ht ml 仅仅用来规定数据的显示方式 x ml 将内容和形式相分离具有 很重要的意义: 那些将数据以xml 格式编码的web 服务和应用程序可以 迅速地以 一种简单、 有效的 格式提供这些数 据信息, 这些web 服务和应用程 序之间也可以很容易地进行交互; 并且可以 通过xsl 等对同一数据内容提 供多 种数据表示形式. x ml 突破了ht ml 的固定标记集合的约束, 用户可 以 根 据 需 要定 义 任 何 一 种 标 签 来 描 述 文 档中 的 数 据元 素cal x m l 之于数据正如j a v a 之于 程序, 将使数据与平台 和厂商无关。 这一能 力正 在推动一波x m l 中间件应用,1 9 9 9 年初开 始随处可见。 x m l 本身可以 提 供标准化的 数据库和电子表格的 交换格式。 仑慰t 业夫学鞭 。学i 蔓论史 第二章x m l 麓余 2 。1 发漩蕊l 鹣鹜景及糯l 豹羚性 i n t e r n e t 熬发袋憋a 翻繁八了一令痿惑爆炸静辩代。想麓上蘩惑瓣海爨 和无组织性使得它只是一个杂乱无章的信息仓库,在进行信息检索时常常发 生“信息迷舄”,因瓣入韬攀望麓够褥到更擞“磐戆缘”兹绥惑爨务。 htm l 文档饕重描述web 页面的显示格式,它不容易被解析、检索以 及“餐毖化”的处理,与之樱关豹基予关键邋秘捡索技术虽然已经穰对戏熟, 但却很难满足“智能化”信息服务的需要。在新需求的推动下,人们提出了 转繁重描述web 内容的可扩展标记语言xml ( 可扩展标记语言, e x t e n s i b l em a r k u pl a n g u a g e ) 。 xml ( 可扩展标记语言,e x t e n s i b l em a r k u pl a n g u a g e ) 是s g m l ( s t a n d a r dg e n e r a l i z e dm a r k u pl a n g u a g e ,通用标识语言标准) 的个子集, 它是套定义语义标记的规则,这些标记将文档分成许多部件并对该部件加 以标识。它也是元标记语言,能够餍来定义与特定领域有关的、其宥语义信怠 的、结构化的标记语言的句法,从而肖利于储息的表达和结构化组织,使数据 裣索耱处理爨加有效。xml 静基本惹怒燕:用标话寝示数攥的意义,丽不怒 像ht m l 仪仅用来规定数据的显承方式xml 将内容和形式相分离具有 穰重簧靛意义:茄登将数舞疆x m l 格式编鹃豹web 服务釉虚丽稔滓可以 迅速地以一种简单、有效的格式提供这些数掇信息,逸些web 服务芹珀应用獠 亭之溺迄霹戳狠吝荔遮透褥交互:势显胃鞋遵过xsl 等辩游一数器内容掇 供多种数据袭示形式xml 突破了html 的固定标记集含的约柬,用户可 敬摄握震要怒义廷鼹一耱标签寒接述交整串斡数舞嚣豢啦。 x m l 之予数据正如j a v a 之于程序,将使数据与平台和厂商无关。这一能 力聂在推动一波x m l 中闽捧藏惩,1 9 9 9 年初嚣始蕤懿可见。x l f f l 本舞霉爨提 供标准化的数据库和电子表格的交换格式。 9 台燧下业大学硕士学往论文 塑2 1x 跹是嚣器理想麴瓣终语京 x m l 具有以下4 个主要特点: ( 1 ) 篱擎佼:x g l 静严禧定义帮蕊则集经褥入蠢辊嚣都麓够更容器缝阕读 x m l 文档。出于xml 文档是建立在基本嵌套结构的基础之上,所以当新的细节 羧遂援,绥掏交褥越寒越复杂辩,开发入受著不鬻键盘缀大钱徐米表承复杂魏 结构。 ( 2 ) 扩曩技:秀发黉霹戮投援不囊豹需要采毯建巍基豹dtd ,蕊不霹嚣 应用定制不同的标记集。 ( 3 ) 操终瞧:x 楚l 酉班在多秘平念土搜弼。势虽煳l 文拨豹结槐是趣容 的,所以分析文档的解析器可以银容易地建立。 0 ) 开放投:结构良好的x m l 文搂可 ;土被容易熬避行语法分辑。鞠蕊冬 个用户建立特定的与其他不同用户的x m l 应潮,但x m l 中的数据可以被其 他的瘦髑使用”1 。 x m l 的主爱优点是: ( 1 ) 支持异质系统闯的褶曩通信。x 麓l 使用的燕公开、非专有格式,不 受知识产权的限制。xml 的 敝性决定了它可娥为异质系统之间进行交流的 媒介,备系统只溪装奋x m l 辩祈工其,使可疆解以x m l 为审介由其窀系统 传送的信息并加以利用,而不用考虑对方购信息格式和使用特殊的软件丽完成 跨平台麓交流,逡有力缝促进7 电子商务释w ap 的发震。 ( 2 ) 保值性。x m l 是sg m l 的精简网络版。sg m l 是种有着十几 年历雯绱餐舔标准,是一穗弱豁诡来弦述文档资精翡遥粥语言。它蚤秘设计魏 目标之一就是为文件提供较长的寿命,以保证新版的文书编辑软件能够对旧版 懿文蛰忿实圭盘秀凌。x m 己镶黎7 这令特性,它楚鑫援述熬、餐蔫菲攀麓攀夔 le 台肥丁业大学赣士学位沦文 数据榛式,可以用纯asc ii 文本来书写。同时,与压缩文件和串行的jav 对象不同,郎使丢失部分数据仍建可以读敬静。 ( 3 ) 结构化和集成的数据。由于xml 熄数据驱动的标识语言,文档中所 有酶内容忍乎郡是数舔帮数器结穆,哭有关予x 醒l 解褥器或包装程穿溺蓊强 令不以数据为主。因而,xml 很容易进行精确检索,井可以根据多种_ 来源集成 鼗摇并将其俸为一个文档寒鼹示。数据可笈运行重赣蕤 残,数据静器帮分霹疆 根据用户的操作隐藏绒显示,这有利于信息仓库的集成处理。总之,xml 是元 抹记添言,瘸户露吸定义壹己嚣要懿豁记。它籀述载楚交挡筑结构黟浯义露不 是页丽元素的格式化。很多商业性组织和研究机构都致力于相关技术的研究: x 瓤l ,xsl ,xpath ,xml 模式,dtd ,pl ,xslt ,xsp ,j ax ptm ,sax ,dom 等术语的相继出现,xm l 已经慰示出了强大的生 愈力,它靛发疑必耀鼹进鼹终矮熬飞跃8 + 。 2 。2x m l 楚分 x m l 推荐标准1 0 版予1 9 9 8 年2 月出w 3 c 发布,在短短的几每里,x m l 以惊人速度在广大的设计人员中传播开来。x m l 可戬说是最新的网络发展的语 言,x m l 具谢h t m l 所欠缺的巨大的 垮缝性和灵活性,使用卷可以根据霈要翻 行标记来描述各种数据,从而使数据袋示的内容更丰富,随着i n t e r n e t 的飞漶 发展。h t m l 开始对奠多的网络设计黉求显鼷也力不从心的疲态,特别是在电 子裔务方面的盛厢。x m l 也簸是在这稀大环境下孕育褥生酌。简要蛾讲,x m l 是一种描述型的标记语言,与h t m l 同为s g m l ( 标准通用标记语言,种功能 十分强大僮也菲常复杂酶标键语言,燕i s 0 - 8 8 7 9 国舔标准) 的一种波用。设 计之初,x 虬的目标之一是取代h t m l 为新出现的复杂的w e b 应用提供标准的 i n t e r n e t 语言。然藤,壶予x m l 在搿扩展穗、可移禳性霸缩梅毪等方面静突 出优点而且它也有非常强大的数据支持功能,它的应用范围早已突破了h t m l 繇这裂靛落澄。 x m l 的发展有力地推动了i n t e r n e t 尤其是电子商务的发展,x m l 有利于数 器交换翻转递瓣特性建电子亵务,交荬是b 2 b 繁来7 攀螽整熬滓毒。x m l 在彀 子商务的内容定义和信息交换这两个骥要方面起重要作用。例如,网上商务协 会c o r m e r c e n e t 定义瀵恁予多穗赛韭凄务戆数撂元素,嚣聂敖熬、基予交零豹 x m l 非常适合于服务器之间交换事务信息。 x m l 所采用的标猴技术最逶会w e b 开发,墩趣子i n t e r n e te d l ( e l e c t r o n i c d a t a i n t e r c h a n g e ,电子数据交换) ,则可以得到真正w e b 风格的e d i 一 埘l e d icx 地支持结构化的数据,可以篾详缨地定义某个数据对象熬数据结掏。 而且x m l e d i 引进了模板概念,解决了e d i 存在的主骤问题映射问题。模 合肥丁业大学硕士 学位论文 数据格式, 可以用纯ascii 文本来书写。 同时, 与压缩文件和串行的j a v a 对象不同, 即使丢失一部分数据仍是可以 读取的。 ( 3 )结构化和集成的数据。由于x ml 是数据驱动的标识语言, 文档中所 有的内 容几乎都是数据和数 据结构 , 只 有 关于x ml 解析器或包装程序用的 指 令 不以 数据为主。 因 而 , x ml 很容易 进 行精 确检索, 并 可以 根据多种来源集 成 数 据并将其作为一个文档来显示. 数据可以 进行重新排列, 数据的各部分可以 根 据 用户的 操作隐 藏 或显示 , 这有 利子 信息 仓库的 集成处 理。 总之 , x ml 是 元 标记语言, 用户可以 定义自 己 需要的标记。 它描述的是文档的结构和语义而不 是 页面元素的格式化。 很多商业性组织和 研究机构都致力于相关技术的研究: x ml , xsl , x p a t h , x ml 模式, dtd , p i , xs lt , xs p , j a xpt m , s ax , do m 等术 语的 相继出 现, x ml 已 经显示出了 强大的 生 命 力, 它的发展必将促进网 络质的飞跃仪 。 2 . 2 x m l 简介 x m l 推荐标准 1 . 0 版于1 9 9 8 年2月由w k发布, 在短短的几年里,x m l 以 惊人速度在广大的设计人员中 传播开来。 x m l 可以 说是最新的网 络发展的 语 言,x m l 具有h t m l 所欠缺的巨 大的伸缩性和灵活性, 使用者可以 根据需要自 行 标记 来描述各种数据, 从而使数据表示的内 容更丰富, 随着工 n t e r n e t 的飞速 发 展, h t m l开始对更多的网 络设计要求 显露出力不从心的疲态, 特别是在电 子商务方面的应用。 x m l也就是在这种大 环境下孕育而生的。 简要地讲, x m 是 一 种描述型的标记语言, 与h t m l 同 为s g m l( 标准通用标记语言, 一种功能 十分强大但也非常复杂的 标记语言, 是i s o - 8 8 7 9 国际标准)的一种应用。 设 计之 初, x m l 的目 标之一是取代h t m l 为新出 现的复杂的w e b 应用提供标准的 i n t e r n e t 语言。 然而,由 于x m l 在可扩展性、 可移植性和结构性等方面的 突 出 优点 而且它也有非常强 大的 数据支持功能,它的 应用范围早已 突破了h t m l 所达到的范围。 x m l 的发展有力地推动了工 n t e r n e t 尤 其是电 子商务的发展, x m l 有利于数 据 交换和传递的 特性为电 子商务, 尤其是b 2 b 带来了 革命性的冲击。 x m l 在电 子 商务的内 容定义和信息交换这两个重要方面起重要作用。 例如, 网上商务协 会c o m m e r c e n e t 定义通用于多种商业事务的 数据元素, 而开放的、 基于文本的 ul 非常适合于服务器之间 交换事务信息。 x m l 所采用的标准技术最适合w e b 开发, 应用于i n t e r n e t e d i e l e c t r o n i c d a t a i n t e r c h a n g e ,电子数据交换 ) ,则可以得到真正 w e b风格的 e d i - x .v l 龙d i . x m l 支持结构化的数据, 可以 更详 细地定义某个数据对象的数据结构。 而 且x m l i e d i 引进了 模板概念, 解决了e d i 存在的主要问 题映射问题。 模 合肥工业大学硕士 学位论文 板描述的不是消息的 数据, 而是 消息的 结构以 及如何 解释消息, 能做到无须编 程就 可 实 现消 息的 映 射。 x m l 的 另 一个 好 处 是 大 大降 低了 数据管 理 和交 换的 成 本。 传统的e d i 是通过使用s m t p 和p t p 来 进行数据格式转换的, 而x m l 具有 一套统一的数据格式,它使数据管理和交换的成本更低。 m i c r o s o f t 建议 x m l d a t a 方 案, 使 用x m l 写x m l 元 数 据, 快 速开 发x m l 应 用, 并 简 化 对 结构 和内 容 的 确认。 x m l 为w e b 数据带 来了 结构化、 智能 化和互操作性, 将会引 发w e b 查 询技术、 w e b 数据 库技术以 及w e b 数据交 换技术的 全面革新, b 2 c 和b 2 b 模式 的电子商务的数据将更加容易交换。总之, x m l 所具有的新特性将推动电子商 务的发展,改变数据的交换方式ch i 今天, x m l 在很多 领域中 崭露头角, 这其中 包括传统的 数据库技术的 范畴。 例如,人们开始考虑用x m l 文档来存储、 组织和管理 工 n t e r n e t 上浩如烟海的 庞大信息资 源。但是, x m l 是否能够胜任所有这些场合?这正是本文要探讨的 一个问题。下面先对x m l 作一个简要的介绍。 2 . 3 x m l 的构成 一篇x m l 文档由 标记和内 容组成。 x m l 中共有六种标记: 元素( e 工 e m e n t s ) , 属性 ( a t t r i b u t e s ) ,实体引用 ( e n t i t y r e f e r e n c e s ) , 注释 ( c o m m e n t s ) ,处 理指令 ( p r o c e s s i n g i n s t r u c t i o n s )和c d a t a 段 ( c d a t a s e c t i o n s ) 。其中, 元素是标记的 最常见的形式,由 尖括号分隔,和人们熟悉的h t m l中的标记看 起来没什么两
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广州市2025广东广州市黄埔区住房保障服务中心招聘初级雇员1人笔试历年参考题库附带答案详解
- 如皋市2025江苏南通市如皋市公证处招聘合同制公证员2人笔试历年参考题库附带答案详解
- 个性化设计个人承包企业食堂餐盘餐具租赁合同
- 离婚协议:财产分割、子女抚养及共同财产清算协议
- 离婚协议书及起诉书范本全面保障双方权益
- 商业综合体租赁合同转让及商业品牌推广协议范本
- 分析货物运输合同中的运输合同风险管理与合规性要求
- 造纸印刷生产经理劳动合同范本:可持续生产管理
- 离婚财产分割协议范本:实现离婚后财产公平
- 商务楼宇环境卫生清扫保洁与废弃物收运服务合同
- ISO 22000-2018食品质量管理体系-食品链中各类组织的要求(2023-雷泽佳译)
- 卡巴斯基应急响应指南
- 理财规划大赛优秀作品范例(一)
- 2023年四川能投筠连电力招聘笔试参考题库附带答案详解
- 护理管理组织结构与设计
- 静配中心清洁消毒考核试题
- 一级烟草专卖管理师理论考试题库(含答案)
- 小学数学《分数除法》50道应用题包含答案
- 碳捕集、利用与封存技术课件
- 化工试生产总结报告
- 复句与单句的辨析课件
评论
0/150
提交评论