(计算机应用技术专业论文)xml在基于net平台的分布式gasor系统中的应用.pdf_第1页
(计算机应用技术专业论文)xml在基于net平台的分布式gasor系统中的应用.pdf_第2页
(计算机应用技术专业论文)xml在基于net平台的分布式gasor系统中的应用.pdf_第3页
(计算机应用技术专业论文)xml在基于net平台的分布式gasor系统中的应用.pdf_第4页
(计算机应用技术专业论文)xml在基于net平台的分布式gasor系统中的应用.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 论文题目: 专业: 硕士生: 指导教师: x m l 在基于n e t 平台的分布式g a s o r 系统中的应用 计算机应用技术 ( 签名) ( 签名) 摘要 g a s o r ( g e o s t a t i s f i c a la n a l y s i ss y s t e mo fr e s e r v o i r ,储层地质统计分析系统) 系统 是西安石油大学软件研究所经过十多年研制开发出来的一种油藏描述软件。g a s o r 系 统主要用于油气田分布预测和开采方案的可行性分析,从而在油气田开采过程中为工作 人员提供技术支持。g a s o r4 0 版本是运行在p c ( p e r s o n a lc o m p u t e r ,个人计算机) 机 上的一种桌面应用系统。该系统中所有的计算、图形显示等功能都是由单独的p c 机来 完成的,这样就存在一些缺憾。首先,在g a s o r 的开发过程中,其模块间的耦合很紧 密,使得增加和完善其功能都很困难,g a s o r 的分布式系统结构有助于减少模块间的 耦合程度。其次,由于g a s o r 的目的是储层地质建模,在它的整个应用过程中,原始 数据的提供、中间结果的评价、最终结果的引用,涉及油田开发的各个部门( 如地质、 工程、测井、地震、经济评价和管理等) ,只有保证这些部门的人员相互及时、准确交流, 才能把储层地质建模的工作做好。然而这些部门可能分布在不同的大楼、城市,甚至不 同的国家。因此,将g a s o r 系统改造为分布式系统结构就是谋求新发展和拓宽更大市 场的必然要求。 本文首先对国内石油行业应用系统的技术特点进行了剖析,从用户角度出发:分析 了g a s o r 系统的发展需求,得出了将原有g a s o r 系统改造成分布式系统是该系统发 展的必然趋势。接着,对x m l 技术、w e b 服务技术以及n e t 平台的体系结构、工作原 理、技术特点等进行了研究。由于w e b 服务具有松散耦合、支持异构平台、支持软件复 用等优点,本文认为w e b 服务适合用于建立分布式g a s o r 系统。n e t 是新一代互联 网全面解决方案,它允许应用程序之间通过互联网进行通讯和共享数据。它不必考虑应 用程序的操作系统和编程语言,其目标就是让分布在不同区域的计算机、设备一起工作, 为用户提供各种各样的服务。最后,结合储层随机建模领域的应用特点,经过业务逻辑 抽取,确定了基于w e b 服务的分布式g a s o r 系统的软件体系结构,将原先的g a s o r 系统中的模块分别进行包装、改造,使其以w e b 服务的形式出现在新的基于n e t 的分 布式g a s o r 系统中。 关键词:g a s o r 系统,x m l ,w e b 服务,分布式, n e t 论文类型:应用研究 ( 本文得到国家自然科学基金项目“河流相储层建模的随机游走方法研究”( 项目批准 号:5 0 4 7 4 0 4 2 ) ,陕西省科技厅2 0 0 3 年科技推广计划项目“储层地质统计分析系统 g a s o r p c 微机版开发与推广”( 项目编号为2 0 0 3 k t - 0 0 8 ) 的资助) i i 英文摘要 s u b j e c t :a na p p l i c a t i o no fx m li nt h ed i s t r i b u t e dg a s o rb a s e do nt h e n e t p l a t f o r m s p e c i a l i t y : n a m e : i n s t r u c t o r c o m p u t e r a p p l i c a t i o nt e c h n o l o g y a b s t r a c t g a s o r ( g e o s t a t i s t i c a la n a l y s i ss y s t e m o fr e s e r v o i r ) i sal a r g e s c a l es o f t w a r e a p p l i c a t i o ns y s t e mw i t c hu s e di ns t o c h a s t i cr e s e r v o i rm o d e l i n g i ti sa r e s u l to fm o r et h a nt e n y e a r s r e s e a r c ha n dd e v e l o p m e n to fx i a l ls h iy o uu n i v e r s i t y , c o m p u t e rs c i e n c ec o l l e g e , s o f t w a r et e c h n o l o g yi n s t i t u t e g a s o ri sm a i n l yu s e di nt h ep r e d i c t i o no fr e s e r v o i ra n d a n a l y s i st h ef e a s i b i l i t yo ft h ep r o j e c t ,i tc a na f f o r dh e l pd t t r i n gt h ep e t r o l e u ma n dn a t u r a lg a s e x p l o i t a t i o n g a s o rv e r s i o n4 0i sa k i n do fd e s k t o pa p p l i c a t i o ns y s t e mw i t c hr u n n i n go nt h e p e r s o n a lc o m p u t e r t h e r e f o r e ,t h es y s t e mh a ss o m ed e f e c t s f i r s t l y , i ti sd i f f i c u l tt oa d dn e w f u n c t i o na n dp e r f e c tt h eo l df u n c t i o nd u r i n gt h ed e v e l o p m e n t ,b e c a u s et h ec o n n e c t i o n s b e t w e e nt h em o d u l e so fg a s o ri sc o m p l e x s e c o n d l y , t h ep u r p o s eo fg a s o ri st od o s t o c h a s t i cr e s e r v o i rm o d e l i n g ,d u r i n gt h ew o r k i n gp r o c e s sw h i c hi n c l u d et h eo r i g i n a ld a t a p r o v i d i n g t h ee s t i m a t eo ft h em i d d l er e s u l ta n dt h eq u o t a t i o no f t h ef i n a lr e s u l t ,o n l yi ft h e s e p e o p l ew h i c hc o m ef r o me a c hd e p a r t m e n to ft h eo i l f i e l dd e v e l o p m e n t ( s u c ha sg e o l o g y , p r o j e c t ,l o g g i n gw e l l ,e a r t h q u a k e ,e c o n o m i ce v a l u a t i o na n dm a n a g e m e n t ,e t c ) c o m m u n i c a t e f u l l ya n di nt i m em u t u a l l yc a l ld ot h es t o c h a s t i cr e s e r v o i rm o d e l i n gw e l l h o w e v e r , t h e s e d e p a r t m e n t sm a ys e t t l e i nd i f f e r e n tb u i l d i n g ,c i t y , e v e nc o n n t r y s oi ti sa ne s s e n t i a l r e q u i r e m e n tf o rg e t t i n gp r o g r e s sa n de n l a r g i n gt h em a r k e tt or e f o r mg a s o ru s i n gd i s t r i b u t e d s y s t e ma r c h i t e c t u r e a tf i r s t ,t h i sa r t i c l ec a r r i e do nt h ea n a l y s i st ot h ec h a r a c t e r i s t i co ft h ed o m e s t i cp e t r o l e u m a p p l i c a t i o ns y s t e m ar e s u l tw a so b t a i n e dt h a tt h er e f o r mo fg a s o ru s i n gd i s t r i b u t e ds y s t e m a r c h i t e c t u r ei sa ni n e v i t a b l et r e n d t h e n ,t h i sa r t i c l ed os o m er e s e a r c hw o r kt ox m l t e c h n o l o g y , w e bs e r v i c et e c h n o l o g ya sw e l la st h ed o tn e tp l a t f o r ms y s t e ms t r u c t u r e ,t h ,e p r i n c i p l eo fw o r k ,t h et e c h n i c a lc h a r a c t e r i s t i ca n ds oo n b e c a u s et h ec o n n e c t i o n sb e t w e e n t h e w e bs e r v i c e sa r en o tc o m p l e x ,t h i sa r t i c l ec o n s i d e r e dt h a ti ti ss u i t a b l et or e f o r m i n gt h e d i s t r i b u t e dg a s o r s y s t e m n e ti san e wg e n e r a t i o ns o l u t i o n ,t h i sa r c h i t e c t u r ea l l o w st h e m o d u l e so ft h ed i s t r i b u t e dg a s o rc o m m u n i c a t i n ge a c ho t h e ra n ds h a r i n gd a t at h r o u g ht h e i n t e r a c t ,i td o e sn o tn e e dt oc o n s i d e rt h ep r o g r a m m i n gl a n g u a g eo rt h eo p e r a t i o ns y s t e m t h e g o a lo f t h er e f o r m i n gi st ol e tt h ec o m p u t e r sa n df a c i l i t i e ss c a t t e r e di nd i f f e r e n tr e g i o nw o r k i n g t o g e t h e ra n dt oa f f o r da l lk i n g so fs e r v i c e s i nt h ee n d ,t h i sa r t i c l ed e s i g n e da n de s t a b l i s h e dt h e f r a m e w o r ko ft h ed i s t r i b u t e dg a s o rs y s t e mb a s eo nt h ew e bs e r v i c et e c h n o l o g y h e r et h e i i l 英文摘要 w e bs e r v i c e so f t h ed i s t r i b u t e dg a s o r s y s t e mc o m ef r o mt h eo l dm o d u l e so f g a s o r k e yw o r d s :g a s o rx m lw e bs e r v c i ed i s t r i b u t e d n e t d i s s e r t a t i o n :a p p l i c a t i o ns t u d y ( t h i sp a p e ri ss u p p o r t e db yn a t i o n a l n a t u r a ls c i e n c ef o u n d a t i o np r o j e c t ,s c i e n c ea n d t e c h n o l o g ys p r e a d i n gp r o j e c to f s h a n x ip r o v i n c es c i e n c ea n dt e c h n o l o g yb u r e a ui n2 0 0 3 ) 学位论文创新- 胜声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成 果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他 人已经发表或撰写过的研究成果:也不包含为获得西安石油大学或其它教育机构的学位 或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做 了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 论文作者签名:盘丝日期:墨翌笸童! 堕 学位论文使用授权的说明 本人完全了解西安石油大学有关保留和使用学位论文的规定,即:研究生在校攻读 学位期间论文工作的知识产权单位属西安石油大学。学校享有以任何方法发表、复制、 公开阅览、借阅以及申请专利等权利。本人离校后发表或使用学位论文或与该论文直接 相关的学术论文或成果时,署名单位仍然为西安石油大学。 论文作者签名:垒主江 导师戳:舻 日期:2 塑区! 堕 日期:型! 墨:丛 第一章绪论 第一章绪论 1 1 引言 g a s o r ( g e o s t a t i s t i c a la n a l y s i ss y s t e mo fr e s e r v o i r ,储层地质统计分析系统) 系统 是西安石油大学软件研究所经过十多年研制开发出来的一种油藏描述软件。g a s o r 系 统主要用于油气田分布预测和开采方案的可行性分析,从而在油气田开采过程中为工作 人员提供技术支持。 当i n t e r n e t 技术特别是w e b 技术在2 0 世纪9 0 年代中期成为技术主流时,业务计 算的模型发生了巨大变化。w 曲服务模型 1 1 3 4 1 是由各种信息和应用程序集合所组成的层 松散地连接而成,而这些信息和应用程序又驻留在种类繁多的硬件平台上。i n t e r a c t 技 术之所以能够取得飞速的发展,其根本的原动力在于它能给用户提供一个可伸缩、可扩 展和高度可用的公共信息传送平台。这一平台设计上非常灵活,而且不局限于一个或两 个计算层。 x m l ( e x t e n s i b l em a r k u pl a n g u a g e ,可扩展标志语言) 【3 2 】作为可扩展标志语言技术家 族的基础成员,x m l 源自s g m l ( s t a n d a r d g e n e r i c m a r k u p l a n g u a g e ,标准通用标记语言) , 是一种元标记语言。它定义了一套元句法,可以用来定义不同应用领域中的数据组织和 数据结构。 一 w e b 服务1 1 2 1 以开放的标准为基础,构建在i n t e m e t 之上,为企业应用提供工 个 灵活的、松散耦合的分布式计算环境,同时,w e b 服务屏蔽了底层的应用平台,具有良 好的平台无关性,并且通信数据都是标准的x m l 数据,具有良好的语言无关性,为应 用集成提供了一个便捷而快速的途径。 w s d l ( w e bs e r v i c ed e s c r i p t i o nl a n g u a g e ,w e b 服务描述语言) 是一种接口定义语言 ( i n t e r f a c e d e f i n i t i o n l a n g u a g e ,i d l ) 。它以一种x m l 模式来描述w 曲服务的接口。 u d d i ( u n i v e r s a ld e s e r i p t i o nd i s c o v e r ya n di n t e g r a t i o n ,通用描述发现和集成) 1 5 】【3 3 】是 一套基于w e b 的、分布式的、为w e b 服务提供信息注册中心的实现标准规范,同时也 包含一组使企业能将自身提供的w e b 服务注册以使得用户能够发现的访问协议的实现 标准。 d i s c o ( d i s c o v e r y ,发现文档规范) 是由美国微软公司提出的一种规范,它主要用来 发现指定服务器上的w 钉服务描述产即w s d 文档。d i s c o 规范的功能比u d d i 规范 要简单一些,没有象u d d i 那样提供丰富的信息和功能。 s o a p ( s i m p l eo b j e c ta c c e s sp r o t o c o l ,简单对象访问协议) 2 9 】【3 0 1 是应用在w e b 服务 中的用于交换信息的通讯协议,是一个基于x m l 的协议。 针对i n t e m e t i n t r a n e t 迅猛发展的现状,微软于2 0 0 0 年6 月发布了名为m i c r o s o f t n e t 的下一代软件和服务战略1 】f 】6 】,使其利用以互联网为基础的分布式计算和通信激增的特 西安石油大学硕士学位论 点,通过先进的软件构架,利用网络协议和格式,来协调众多的智能设备与网站,从而 提供更简单、更为个性化和更有效的互联网服务。 n e t 是微软提出“服务式软件”的概念【l ,】的实现,是将互联网本身作为构建新 一代操作系统的基础,对互联网和操作系统的设计思想进行合理的延伸。这将从根本上 改变开发应用程序的模式,开发人员必将创建出摆脱设备硬件束缚的应用程序,轻松与 互联网连接,在更大范围的实现资源与技术的共享。n e t 无疑是当今计算机软件开发技 术进入一个崭新的时代的一个重要里程碑i l 。 a d o n e t 似c t i v e xd a t ao b j e c t n e t ,a c t i v e x 数据对象) 是在n e t 平台内用于访问 数据源的一组类。a d o n e t 具有全新且更好的对象模型,该模型使用x m l 作为主要的 数据传输格式,同时它使用户对无关联数据的操作变得更加简单。 a s r n e t ( a c t i v es e r v e rp a g e n e t ,动态服务器页面) 是统一的w e b 开发平台,它给 开发人员提供了生成企业级w e b 应用程序所需的服务。a s r n e t 是建立在c l r ( c o m m o n l a n g u a g er u n t i m e ,通用语言运行时刻库) 上的应用程序框架。它用来在服务器端构建功 能强大的w e b 应用程序。 1 2 课题的背景和意义 “储层地质统计分析系统( g a s o r ) ”是一个应用于油气储层随机建模的工作站版本 的软件系统。该系统自1 9 9 0 年开始研究以来,历经“八五”国家重点科技攻关项目、“九 五”国家重点科技攻关项目、中国石油天然气集团公司等重点科研项目的攻关,以及和 大庆、胜利、辽河、长庆等油田的横向合作项目的研究,已经成为国内油气储层随机建 模方面的商品化软件。 该系统以地质统计学中的随机建模理论 3 5 】为基本方法,以来自各油田的实际测井、 井位等数据为输入参数,来建立地质构造、层、沉积相、物性参数、砂体厚度等模型, 以形成相应的三维定量地质模型。 g a s o r4 0 版本是运行在p c 机上的一种桌面应用系统。该系统中所有的计算、绘 图等功能都是由单独的p c 机来完成的,这样就存在一些缺憾。首先,在g a s o r 的开 发过程中,其模块间的耦合很紧密,使得增加和完善其功能都很困难,g a s o r 的分布 式系统结构有助于减少模块间的耦合程度。其次,由于g a s o r 的目的是储层地质建模, 在它的整个应用过程中,原始数据的提供、中间结果的评价、最终结果的引用,涉及油 一”田开发的各个部门( 如地质、工程、测井、地震、经济评价和管理等) ,只有保证这些部 门的人员相互及时、准确交流,才能把储层地质建模的工作做好。然而这些部门可能分 布在不同的大楼、城市、甚至不同的国家。因此,将g a s o r 系统改造为分布式系统结 构就是谋求新发展和拓宽更大市场的必然要求。 第一章绪论 1 3 论文研究内容及组织结构 在基于n e t 的分布式g a s o r 系统的开发过程中,利用w e b 服务技术将原g a s o r 系统的部分模块包装成为w e b 服务。 首先,本论文详细介绍了x m l 技术。x m l 源自s g m l ,是s g m l 的一个简化子集, 是一种元标记语言。它是w e b 服务的基础,因而也是本系统的基础。无论在w 曲服务 的接口描述方面、w e b 服务的数据通讯方面,还是在系统数据的保存、传输方面,它都 发挥着最基本的功能。如果没有x m l ,那么就没有w e b 服务,也没有本系统; 然后,本论文又详细介绍了w e b 服务和n e t 平台。从表面上看,w e b 服务就是一 个应用程序,它向外界暴露出一个能够通过w e b 进行调用的a p i :更深入_ 点看,w e b 服务就是建立可互操作的分布式应用程序的新技术、新规范、新标准。而n e t 则是美国 微软公司推出的新一代基于互联网平台的软件开发平台,在这一平台上互联网本身将成 为构建新一代应用程序的操作系统。本系统的核心部分就是将原先的g a s o r 系统中的 模块分别进行包装、改造,使其能够以w e b 服务的形式出现在新的基于n e t 的分布式 g a s o r 系统中; 最后,本论文给出了基于n e t 的分布式g a s o r 系统的总体结构图,并结合这个总 体结构图详细的研究了整个系统实现的各个细节,包括表示层、应用层和数据层的实现 部分。 1 4 基于n e t 平台的分布式g a s o r 系统的开发环境 本系统的开发环境是:w i n d o w s x p + i e 6 0 + i i s 5 0 + m i c r o s o tv i s u a ls t u d i o2 0 0 3 + s q ls e r v e r2 0 0 0 。 西安石油大学硕士学位论文 第二章x m l 技术 x m l 是可扩展标志语言( e x t e n s i b l em a r k u pl a n g u a g e ) l 拘简称,它是s g m l ( s t a n d a r d g e n e r i cm a r k u pl a n g u a g e ,标准通用标记语言) 的一个简化子集,它将s g m l 的丰富功能 与h t m l ( h y p e r t e x t m a r k u p l a n g u a g e ,超文本标记语言) 的易用性结合到w e b 的应用中, 以一种开放的自我描述方式定义了数据结构,在描述数据内容的同时能突出对结构的描 述,从而体现出数据之间的关系,这样所组织的数据对于应用程序和用户都是友好的、 可操作的。 2 1x m l 概述 , 2 1 - 1x m l 的产生 六十年代末,m 公司的c h a r l e sg o l d f a r b 、e d m o s h e r 和r a yl o r i e 为了解决由不同 专用格式创建的法律文件不能在公司不同部门之间相互移植的问题,提出了任何可互操 作系统的三个主要要求: ( 1 ) 文件处理程序需要支持一个公共文档格式; ( 2 ) 这个公共格式对特定的领域是专用的; r 3 ) 为了达到高度可靠性文档格式必须遵守特殊规则。 这个文档格式编排系统称为g m l ( g e n e r a l i z e dm a r k u pl a n g u a g e ,通用标记语言) 。 以此为基础,经过几年的发展终于建立了s g m l ( s t a n d a r dg e n e r a l i z e dm a r k u pl a n g u a g e , 标准通用标记语言) ,而且i s o ( i n t e r n a t i o n a ls t a n d a r do r g a n i z a t i o n ,国际标准化组织) 于 1 9 9 6 年最终批准采用s g m l 。 s g m l 为语法标记提供了异常强大的工具,同时具有极好的扩展性,因此在分类和 索引数据中非常有用。但是,s g m l 非常复杂,并且价格昂贵,使s g m l 在互联网上传 播遇到了很大障碍。与之相反,h t m l 免费、简单,在世界范围内得到了广泛的应用。 它侧重于主页表现形式的描述,大大丰富了主页的视觉、听觉效果,为推动互联网的蓬 勃发展、推动信息和知识的网上交流发挥了不可取代的作用。可是,h t m l 也有如下几 个致命的弱点,这些弱点逐渐成为h t m l 继续发展应用的障碍。 ( 1 ) h t m l 是专门为描述主页的表现形式丽设计的,它疏于对信息语义及其内部结构 的描述,不能适应日益增多的信息检索要求和存档要求; f 2 ) h t m l 对表现形式的描述能力实际上也还非常不够,7 它无法描述矢量图形、科技 符号和一些其他的特殊显示效果; ( 3 ) h t m l 的标记集日益臃肿,而其松散的语法要求使得文档结构混乱而缺乏条理, 导致浏览器的设计越来越复杂,降低了浏览的时空效率。 正因为如此,1 9 9 6 年人们开始致力于开发一个新的标记语言,使它既具有s g m l 第二章x m l 技术 的强大功能和可扩展性,同时又具有h t m l 的简单性,x m l ( e x t e n s i b l em a r k u p l a n g u a g e ,可扩展标志语言) 就这样诞生了。 x m l 是一套定义语义标记规则的语言,是s g m l 的一个简化子集。x m l 定义的这 些标记将文档分成许多部分,并对这些部分加以标记。它是元标记语言,即定义了用于 定义其他与特定领域有关的、语义的、结构化的标记语言的句法语言。 x m l1 0 版本标准由w 3 c ( 万维网联盟) 于1 9 9 8 年1 月1 0 日正式批准公布,x m l1 0 第二版于2 0 0 0 年1 0 月6 日发布。 2 1 2x m l 与s g m l 的比较 s g m l 是一个创建语言的语言,利用s g m l 能创建标记集。例如:医学、建筑、工 商、行政等等各个行业都可以用s g m l 来创建符合自己行业规范的标记集。x m l 是 s g m l 的一个子集,在很多方面就像是一个琐碎的w e b 版本。 x m l 与s g m l 的差别是实际上使得x m l 更加适合w e b 的分布式环境。实际的差 别相当程度上是技术方面,与标记的形成和缩写方式、字符和实际引用、注释的结构以 及其他限界符有关。 2 1 3x m l 与h t m l 的比较 与h t m l 一样,x m l 也源自s g m l ,它保留了s g m l8 0 的功能,使复杂度降低 了2 0 。尽管如此,x m l 却有着h t m l 语言所欠缺的巨大的伸缩性与灵活性。x m l 不 再像h t m l 一样有着一成不变的格式。x m l 实际上是一种定义语言,即使用者可以定 义无穷无尽的标记来描述文件中的任何数据元素,从而突破了h t m l 固定标记集合的约 束,使文件的内容更丰富更复杂并组成一个完整的信息体系。x m l 与h t m l 的主要区 别如下表所示: 比较内容 h t m l x m l 可扩展性不具有扩展性 是原标记语言,可定义新的标记语言 侧重点侧重如何表现信息侧重如何结构化地描述信息 不要求标记的嵌套、配对等,不严格要求嵌套、配对,并遵循d t d 的树 语法要求 要求标记之间具有一定的顺序形结构 可读性及 难于阅读、维护结构清晰,便于阅读、维护 可维护性 数据和显 内容描述与显示方式整合为一内容描述与显示方式相分离 示的关系 编辑及浏 绝大多数编并、:潮羹主具受籍。 部汾编辑、浏览工具支持,如i e 和 览工具n e t s c 印e 2 1 - 4 x m l 的应用范围 。 ,:i x m l 是一个元语言,根据不同的行业和语义,制定了许多适合特定应用领域的x m l 应用标准,当前较为重要的应用标准主要包括以下几方面: 西安石油大学硕士学位论文 ( 1 ) 面向网页的x h t m l :即采用x m l 对h t m l 重新定义,w 3 c 发布的x h t m l l 0 规范兼具x m l 和h t m l 特点,是当今的w e b 标记标准; ( 2 ) 面向科学领域的数学标记语言m a t h m l :完全采用x m l 定义规范,是一种机器 之间交换数学信息的基层协议; ( 3 ) 面向多媒体的同步多媒体集成语言s m i l :它是一个音频、视频和动画的w 3 c 建议,主要用于控制由声音、视频、文字和图像等组成的多媒体资料在w e b 上的表现形 式; ( 4 ) 面向电子商务的应用标准有很多,例如b i z t a l k , e b x m l 和u d d i :b i z t a l k 是 微软发起的电子商务s c h e m a 库,商家可用s c h e m a 定义语言x m l d a t a 来定义s c h e m a 并进行注册。e b x m l 是联合国u n c e f a c t 小组和o a s i s 发起的一个计划,目的是使 x m l 以稳定、格式化的方式在用户端和应用程序环境进行数据交换与处理。u d d i 是由 i b m ,a r i b a ,m i c r o s o f t 等公司发起的跨平台电子商务开放框架,目的是为各公司参与网 络市场提供一个注册标准; ( 5 ) 面向无线网的无线标记语言w m l :用来描述w a p 内容显示方式,提供导航支 持、数据输入、超链接、文本和图像显示等功能。 最初x m l 的目标是让各种结构的文件都作为统一的网络文件的一部分在网上传输。 过去这些文件是用h t m l 实现的,h t m l 允许指定明确的元素类型说明。和h t m l 相 比,x m l 允许客户定义他们自己的文件元素集合,同时也可以指示这些元素在屏幕上如 何按指定的要求表现出来。 x m l 的应用弥补了许多h t m l 的缺陷,它的应用有以下几点: ( 1 ) 当网络客户必须在不同的数据库之间传递信息时的应用; ( 2 ) 当需要把大部分从网络服务器下载的数据在客户端处理时的应用; ( 3 ) 当相同的数据对于不同的客户需要有不同的界面时的应用; ( 4 ) 当网络服务提供商要把发现的信息精心裁减,并发送给不同的个人用户时的应 用。 2 2x m l 的内容 x m l 的内容包括以下各项内容:x m l 语法、d t d 、x m l s c h e m a 等等。 2 2 1x m l 语法 w 3 c 在1 9 9 8 年2 月发布了x m l1 o 建议,该建议严格规定了衄:j _ 应遵循的语法 规则,下面是该建议规定的一些常用语法规则: ( 1 ) 文档必须包含版本声明,例如,版本为1 0 的声明代码如下: ( 2 ) 一个元素如果不是空元素,那么它就必须有开始标记和结束标记; 第二章x m l 技术 f 3 ) 所有的空元素必须在开始元素的结尾包含一个空元素标识符,即个反斜杠: “ : ( 4 ) 所有的属性值必须用单引号或双引号括起来; ( 5 ) 元素必须被正确的嵌套:元素的开始和结束标记之间不能互相重叠; f 6 ) 元素是大小写敏感的; ( 7 ) 整个文档只能有一个称为根的元素。 当一个x m l 文档遵守x m l1 0 所规定的语法规则时被认为是格式良好的。实际上, 由定义可知,所有的x m l 文档都是格式良好的。如果一个文档不是格式良好的,它就 不是一个x m l 文档。x m l 文档严格的文档格式要求好处在于增强了文档间的互操作性, 因为所有与x m l 说明规范兼容的文档都能解析得到同样的嵌套元素结构。 2 2 2d t d 概述 d t d ( d o c u m e n tt y p ed e f i n e ,文档类型定义) 是一套关于标记符的语法规则,规定了 文档标记属性、出现顺序等信息。d t d 最初是为了使用s g m l 而开发的,可以是x m l 文档的一部分,但它通常是份单独的文档或者一系列文档。一个有效的x m l 文档首 先应该是一个格式良好的x m l 文档,此外,它还必须遵守d t d 中己声明的种种规定。 d t d 实际上描述了一个标记语言的语法和词汇表,也就是定义了文档的整体结构以及文 档的语法。 ( 1 ) 内部d t d 使用d t d 最简单的方法,是在x m l 文档的前导说明部分加入一个d t d 描述。一 个包含d t d 的) l 的文档结构如下: 文档体 其中,第一行是x m l 声明,它以“ ”结束,其后紧跟处理指令 的名称,这里是x m l 。x m l 声明中有三个属性,其中,v e r s i o n 的属性值必须指定,它 指明所采用的x m l 版本号,其它两个属性可选;e n c o d i n g 属性声明采用的编码; s t a n d a l o n e 属性表明该文档是否和一个外部的d t d 配套使用,若属性值是“y e s ”,说明 该文档是一个独立的文档,值为“n o ”时则相反。被定义的文档以d o c t y p e 中规定的 根元素名作为其根元素的名字。 ( 2 ) 外部d t d 在实际中,更多的情况是为一批x m l 定义一个相同的d t d ,并将d t d 单独放置 在一个文档中,若使用该d t d 只需在x m l 文档中加以引用即可,这就是外部d t d 。 外部d t d 可以作为一个文档被引用,方便高效地被多个x m l 所共享。当需要对 d t d 进行修改时,只需修改一个公用的d t d 文档即可。其声明格式如下: 话安石油大学硕士学位论文 其中,s y s t e m 是使用外部d t d 的关键字:u r l 可以是绝对路径,也可以是相对 路径。 ( 3 ) d t d 中元素的定义 在d t d 中,属性是通过关键字a t t l i s t 来定义的。一般属性定义方法如下: 在属性定义中,a t t r i b u t e - t y p e 可选的值如表2 - 2 所示。 表2 - 2 属性a t t rb u t e - t y p e 的可选值 值 说明 c d a l a 字符数据,不可以解析 e n u m e r a t e d 属性的值从列表中选择 i d 属性的值是一个i d 值,也就是该属性的值唯一 i d r e f 该属性的值是另一个元素的i d 值 i d r e f s 该属性的值是其它i d 值的列表 n m t o k e n 该属性的值是一个有效的x i v l l 名 n m t o i ( e n s 该属性韵值是一系列有效的x m l 名 e n l l t y 该属性的值是一个实体 e n t i t i e s 该属性的值是一系列的实体 n 0 1 1 a t i o n 该属性的值是一个n o t a t i o n 的值 a t t r i b u t e - t y p e 可选的值如表2 - 3 所示。 表2 - 3d e f a u l t - v a i u e 可选值 值 说明 d e f a u i j 属性的缺省值 # r e q u i r e d 该属性的值必须在x m l 源文件的元素标签中给出 # i i p l i e d 该属性值可有可无 # f i x e d 该属性值固定不变 2 2 3 s c h e m a 概述 使用d t d 和s c h e m a 都可以验证x m l 文档的有效性,但s c h e m a 功能更加强大, 可以验证整型、布尔型等数据类型,而且s c h e m a 本身也是x m l 文档,而不像d t d 那 样是一种特殊的格式。 ( 1 ) s c h e m a 声明 s c h e m a 元素是x m ls c h e m a 中出现的第一个元素,用于声明该x m l 文档是一个 s c h e m a 文档。s c h e m a 语法表达如下: s c h e m a 具有两个属性:n a m e 指定该s c h e m a 的名称,而x m l n s 指定该s c h e m a 包含 的命名空间。 ( 2 ) s c h e m a 中元素的定义 在s c h e m a 中元素的定义是通过关键字e l e m e n t t y p e 来进行的,一般的元素定义规则 第二章x m l 技术 如下: e l e m e m t y p e c o n t e n t = ” e m p t yt e x t o n l ye k o n l ym i x e d ” d t :t y p e = ”d a t a t y p e ” m o d a l = ” o p e n 。c l o s e d ” n a m e = ”e l e m e n t n a m e ” o r d e r = ” o n efs e qfm a n y ” 以上的定义中,表达式“ ”的作用是为元素增添一个子 元素,使该元素成为元素类型。 。, 下面简要介绍该定义中常用的几种属性的意义: 一 e l e m e n t t y p e 的c o n t e n t 属性 该属性的可选值有四个,即:e m p t y ,t e x t o n l y , e l t o n l y 和m i x e d 。其中,e m p t y 表示内容为空,与d t d 中的关键字e m p t y 作用相同。t e x t o r d y 表示只包含文本类型的 内容,与d t d 中的“# p c d a t a ”作用相似。e l t o n l y 表示只包含元素类型的内容。m i x e d 表示包含上述任何情况。 e l e m e n t t y p e 的d t :t y p e 属性 这个属性表示数据类型由d a m t y p e 的命名空间定义,用于指定元素文本的数据类型。 表2 4 中给出了一些常见的用于指定元素文本和属性值的数据类型。 e l e m e n t t y p e 的m o d e l 属性 m o d e l 指定该元素是否可以包含其它未在x m ls c h e m a 中定义的元素和属性,若为 o p e n ,表示该元素可以包含其它未在x m ls c h e m a 中定义过的元素和属性,c l o s e d 则表 示该元素只能包含在本x m ls c h e m a 中定义过的元素和属性。 e l e m e n t t y p e 的o r d e r 属性 o r d e r 指定该元素的子元素的排列规则:o n e 表示只允许一个子元素出现,s e q 指定 子元素的出现顺序,m a n y 表示子元素可以按任何顺序排列或者不出现。 西安石油大学硕士学位论文 ( 3 ) s c h e m a 中属性的定义 在s c h e m a 中属性的定义是通过关键字”a t t r i b u t e t y p e ”来进行的,一般的元素定义如 下: a t t r i b u t e t y p e f l a m e = ”n a n l e “ + e f a u l 停 d e f a u l t - v a l u e ” d t :t y p e 2 ”p r i mi t i v e t y p e 。 d t :v a l u e s = ”e n u m e r a t e d v a l u

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论