基于xml的文档资料管理上_第1页
基于xml的文档资料管理上_第2页
基于xml的文档资料管理上_第3页
全文预览已结束

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于xml的文档资料管理上

1文档资料的问题万维网是一个分布广泛、全球范围广泛的信息服务中心。它包括新闻、广告、消费信息、金融管理、教育、电子商务和许多其他信息服务。因此,高效资源和web知识的管理具有很大的挑战。目前文档管理所面临的难题主要表现在以下几个方面。(1)文档资料的数量极其庞大。当前万维网上的文档资料过于庞大,其数据量以兆兆字节计算,而且仍然在迅速地增长。(2)文档资料的组织形式多种多样。目前的文档资料以不同的格式存储于不同的数据组织形式之中,其中包括文本数据、关系数据库数据、面向对象数据库数据、文件数据以及声音、图像、邮件等。(3)Web页面的复杂性高于任何传统的文本文档。Web页面缺乏统一的结构,它包含了远比任何一组书籍或其它文本文档多得多的风格和内容。为解决以上问题,就必须实现文档的同一性结构组织,和页面内容的有效的标识和索引。所谓同一性结构组织,意即数据文件的组织结构不依赖于系统平台和数据库管理平台;实现页面内容的有效标识,即将数据信息与格式信息相分离,从而以有表述能力的标签语言表达文档内容。2基于rssp的意义具有形成了xm-l-pcp的注意条XML技术作为文档管理难题的解决手段已经日益被人们接受和采纳。一方面,大量的原始信息开始通过特定的转换机制,整合为XML数据;另一方面,未来将会有大量的Web页面用XML书写,并遵循一组良好的文档类型定义,从而有利于促进不同Web站点间的信息交换,更便于实现对各种组织形式的海量文档资料的有效管理。XML的最大优点在于它的数据存储格式不受显示格式的制约。一般来说,一篇文档包括三个要素:数据、结构以及显示方式。XML把文档的三要素独立开来,分别处理。首先把显示格式从数据内容中独立出来,保存在样式表单文件中,这样如果需要改变文档的显示方式,只要修改样式表单文件就行了。XML的自我描述性质能够很好地表现许多复杂的数据关系,使得基于XML的应用程序可以在XML文件中准确高效地搜索相关的数据内容,忽略其他不相关部分。XML还有其他许多优点,比如它有利于不同系统之间的信息交流,并有希望成为数据和文档交换的标准机制。3创建系统配方本节主要描述基于XML的文档管理,内容包括以下几个方面:(1)XML数据存取机制;(2)XML与数据库;(3)XML文档创建;(4)XML文档类型定义;(5)XML文档的显示。3.1数据库的应用从整体上讲,XML定义了应用间传递数据的结构,而且这种结构的描述不是基于二进制的、只能由程序去判读的代码,而是一种简单的、能够用通用编辑器读取的文本。XML数据源多种多样,根据具体的应用,大概可分为下面三种:一种是XML纯文本文档,第二种是关系型数据库,第三种则来源于其他各种应用数据,如邮件、目录清单、商务报告等。其中,第一种来源,即XML纯文本文档是最基本的也是最为简单的,将数据存储于文件中,其最大的优点在于可以直接方便地读取,或者加以样式信息在浏览器中显示,或者通过DOM接口编程同其他应用相连。第二种数据来源是对第一种来源的扩展,其目的是便于开发各种动态应用,其优点则在于通过数据库系统对数据进行管理,然后再利用服务器端应用(如ASP,JSP)等进行动态存取。这种方式最适合于当前最为流行的基于三层结构的应用开发。3.2关系数据库中的表与表之间的关联数据库提供了对于大批量数据的有效存储管理和快速信息检索、查询的功能。从体系结构上看,数据库技术的发展历经了网络型数据库、层次型数据库、关系数据库、面向对象数据库。虽然面向对象数据库融入了面向对象技术,但是到目前为止,在各个领域使用最广的还是关系数据库。关系数据库管理系统采用二维表格作为存储数据的模型,表格由行和列组成,一般情况下,列被称作“字段”用于表示组成数据有效信息的属性,而行则用于指示一条完整的数据记录。由于数据间的相关性可以通过表与表之间关键字来关联,由此产生了“关系”类型数据库的由来。针对XML数据,一般有两种存储方式:一是将其按结构层次拆分开来分别存于不同字段,二是将XML文档原封不动地存入数据库。3.3ent的关系型数据库现在假定文档保存在一个名叫document的关系型数据库中,其中有football表,包含了甲A联赛的报道。可以定义以下XML文档结构:3.4属性的互动关系文档类型定义详细描述了一组文档结构规则,提供了一连串的元素、属性、表示法和文档中的各种实体以及其相互间的关系。对应于上面的XML文档,可以进行下面的文档类型定义:3.5web服务器xllXSL是为XML文档定义的一种标识语言,提供了远远超过CSS的强大功能.它包含了一套元素集的XML语法规范,该语法规范用宋把XML文档转换成HTML文档。一个XSL样式表集合了一系列设计规则,以用于将信息从XML文档中提取出来,并将其转换成HTML等其它格式。XSL凭借其可扩展性能够控制无穷无尽的标签,而控制每个标签的方式也是无穷无尽的,于是给Web提供了高级的布局特性。同时,XSL不仅仅是应用格式,当使用XML浏览器时,XSL源文档中的信息将被评价、重新安排,然后重新组装。这样,最终所得到的不只是XML的数据版本,而且还可以被很容易地添加、修改和重新排序的灵活的源信息。这个最终产品叫做结果树。这样,XSL能使Web浏览器直接根据用户的不同需求改变文档的表示法,如数据的显示顺序改变,从而不需要再与服务器进行交互通信。通过变换样式表,同一个文档可以显示得更大,或者经过折叠,只显示外面的一层。4实现相关文本文档的同一性,提高资源的整合和共享为了解决文档管理所面临的难题(1)文档资料的数量极其庞大、(2)文档资料的组织形式多种多样和(3)Web页面的复杂性高于任何传统的文本文档,就必须实现文档的同一性结构组织,和页面内容的有效的标识和索引。基于XML技术实现文档管理,已经日益被人们

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论