




已阅读5页,还剩64页未读, 继续免费阅读
(通信与信息系统专业论文)基于xml的信息整合技术在电子商务中的研究与应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
武汉理工大学硕士学位论文 摘要 随着科技和经济的发展,电子商务的发展经过了以信息发布为主的阶段,然 后到互联网成为商业交易媒介的阶段,再到现在的“电子商务面向服务组件化” 的阶段。而传统分布式计算技术c o r b a 、d c o m 和r m i 不适合于在松散耦 合、异构的、有防火墙的i n t e m e t 网络环境下进行电子商务应用系统的设计开 发,这就对技术提出了新的要求:需要起能实现远程的数据交互、新一代电子商 务数据集成、异构平台上不同应用间相互通信以及穿越防火墙等等。 x m l ( e x t e n s i b l em a r k u pl a n g u a g e ,可扩展标记语言) 因其自描述性和可扩展 性等特性可以满足新一代电子商务数据集成的要求,本文为电子商务系统提出了 一种新的基于x m lw e bs e r v i c e s 技术的分布式体系结构,其目标是解决异构环 境下应用系统的集成和互操作。而采用s o a ( 面向服务架构) 为电子商务提供 了一种新的逻辑架构。基于这些技术,实现电子商务系统面向服务的组件化,从 而使得电子商务系统不仅内部之间而且内部与外部之间的信息能够便捷而高效 的整合起来。 本文以基于x m l 的w e bs e r v i c e s 技术为基础,提出基于s o a 架构的电子 商务模型,实现电子商务组件化,最后应用到美国m a d e b i g 电子商务门户上。论 文首先深入研究了x m l 各主要技术,分析其原理,包括x m l 数据文件的结 构,格式的定义、校验,x m l 数据文件的解析,基予x m l 技术的网络传输技 术。再介绍了电子商务发展现状,分析了在电子商务开发中存在的问题,商务流 程的频繁更新,企业异构平台上不同系统之间信息收集、归纳、整合和传播的困 难等等。对这些问题,需要改变企业之间的商务运作和企业应用的设计和开发模 式,而w e bs e r v i c e 技术正是解决这些问题的最佳手段,它为动态电子商务的实 施提供了有效的技术支持。接着给出了基于x m l 的信息整合在电子商务中解决 方案,提出基于s o a 的电子商务模型,最后结合a s p n e t 技术实现本电子商务 系统。 本电子商务系统发布许多基于服务的信息库组件,还调用了许多美国公司的 w e bs e r v i c e 组件,包括g o o g l e 公司的地图组件,y a h o o 公司的商家信息库组件 等,本系统由这些组件组装而成,很方便的实现了信息的整合,而且还给系统的 扩展升级带了极大的便利,这些组件相互独立,可以多处利用。 关键字:x m l ,信息整合,w 曲s e r v i c e ,电子商务,组件 武汉理工大学硕士学位论文 a b s t r a c t w i t ht h ed e v e l o p m e n to fs c i e n c ea n de c o n o m y , e - c o m m e r c eh a se x p e r i e n c e dt h e p e r i o do f p u b l i s h i n gi n f o r m a t i o n , a n dt h ep e n o di nw h i c hi n t e r n e tw o r k e da st h ei n t e r m e d i u mo fc o m n l 廿- c e ,a n dt h e ni th a sb e e ni nan e wa g e - s e r v i c e - o r i e n t e d c o m p o n e n t so fe - c o m m e r c e t r a d i t i o n a ld i s t r i b u t e dc o m p u t i n gt e c h n o l o g yc o r b a , d c o ma n d 舢a r en o tf i tf o rt h ed e v e l o p m e n to fe l e c t r o n i cb u s i n e s sa p p l i c a t i 蚰i l l i n t e r n e tw h i c hi s l o o s e - c o u p l i n g a n dh e t e r o g e n e o u sn e x w o r ke n v i r o n m e n tw i t l l f i r e w a l l m a n yn e wt e c h n i c a lr e q u i r e m e n t sh a sb e e nb r o u g h t , s u c ha st h et 吼n o t e i n f o r m a t i o ne x c h a n g e c o m m u n i c a t i o nb d 砷嗍d i f f e r e n ta p p l i c a t i o n so nt h e h e t e r o g e n e o u sp l a t f o r m , an e wa g eo fe - b u s i n e s sd a t ai n t e g r a t i o na n dg ot h r o u g ht h e f i r e w a l lt r a n s p a r e n t l y t h e s er e q n i t 髓n e n t so fd a t ai n t e g r a t i o nc a nb em e e t e db vx m 儿w h i c h 锄b e d e f i n e db yi t s e l fa n dc a nb ee x p a n d e d an e wm o d e lo fd i s t r i b u t e de - b u s i n e s s a r e h i t e e t u r ew a sp r e s e n t e df o rw e bs e r v i c e s w h i c hi sb a s e do nx m la n da i m e da t i n t e g r a t i o n a n di n t e r - o p e r a t i o nb e t w e e nd i f f e r e n t p l a t f o r m s k s o a ( s e r v i c e - o r i e n t e da r c h i t e c t u r e ) f o re - o d m m e l c eh a sp r o v i d e dan e wl o g i cs t r u c t u r e b a s e do nt h e s et e c h n i q u e s ,s e r v i c e - o r i e n t e de - g o m m e r c es y s t e mc o m p o n e n t sc a nb e a c c o m p l i s h e d , a n dt h ee o o m m e r c es y s t e mi n f o r m a t i o nw h i c h i sn o to n l yi n t e r n a lb u t a l s ob e t w e e ni n t e r n a la n de x t e r n a l 锄b ei n t e g r a t e dc o n v e n i e n t l ya n de 伍c i e n t l y 1 1 地p a p e rd e v o t e st od i s c u s sh o w t od e v e l o pa ne b u s i n e s ss y s t e mb a s e do nx m l w 曲s e r v i c e st e c h n o l o g y 1 1 1 ee - c o m c r c cm o d e lb a s e do nt h es o af r a m e n , v o r ko f e c d m m a c o m p o n e n t sh a sb e e nr a i s e da n df i n a l l ya p p l i e di nm d e b i ge - c o n i i n e r c e p o r t a l f i r s t l y , d a t ae x c h a n g et e c h n o l o g yb a s e do nx m lh a sb e e nr e s e a r c h e dm o s t l y i nt h i st h e s i s a n dt h ep r i n c i p l e sh a sb e e na n a l y z e d , s u c ha st h es t r u c t u r eo fx m l d o c u m e n t s ,t h em e t h o d so fv a l i d a t et h es t r u c t u r eo fx m l ,d o c u m e n t s , t h ep a r s i n go f x m l d o c u m e n t s s e c o n d l y , m a n yp r o b l e m si nd e v e l o p i n ge - b u s i n e s ss y s t e mh a sb e e n p r e s e n t e d , s u c ha sf r e q u e n t l yu p d a t i n go f c o m m e r c ef l o w , t h ed i f f i c u l t yi ni n f o r m a t i o n c o l l e c t i o n , c o n c l u s i o n , i n t e g r a t i o na n dt r a n s m i s s i o no f d i f f e r e n ts y s t e m so ne n t e r p r i s e p l a t f o r m f a c i n gt h e s ep r o b l e m s , t h ec h a n g e so fb u s i n e s so p e r a t i o nb e t w e e n e n t e r p r i s e s m o d eo fd e s i g na n dd e v e l o p m e n to fb u s i n e s sa p p l i c a t i o na 地n e e d e d w b bs e r v i c ei st h eb e s tw a yt os o l v et h e s ep r o b lm sb e c a u s ei tp r o v i d e se f f e c t i v ef o r t h ei m p l e m e n t a t i o no fd y n a m i ce - b u s i n e s s t h e nt h es o l u t i o n so fe - 4 :o i n r n e r c e i n f o r m a t i o ni n t e g r a t i o nw h i c hi sb a s e do nx m la n ds o am o d e la r er a i s e d u s i n gt h e w e bs e r v i c et e c h n o l o g yt oa c h i e v e w i t ht h e ,f m a lr e a l i z a t i o no ft h ea s p :n e t e - c o m m e r c es y s t e m m a n ye c o m m e r c es e r v i c e sb a s e do nt h ei n f o r m a t i o nc o m p o n e n t sh a v eb e e n r e l e a s e di nt h es y s t e m ,i n c l u d i n gm a n yc o m p o n e n t so f a m e r i c a nc o m p a n i e s ,s u c ha s g o o g l e sm 印c o m p o n e n t s ,y a h o o sb u s i n e s si n f o r m a t i o nc o m p o n e n t s ,t h es y s t e m c o n s i s t so f t h e s ec o m p o n e n t s s ot h ei n f o r m a t i o nc a nb ei n t e g r a t e dc o n v e n i e n t l y , a n d s y s t e mc a nb ee x p a n d e da n du p g r a d e dw i t t iag r e a tc o n v e n i e n c e t h e s ec o m p o n e n t s c a nb em u l t i p l eu s e ds e p a r a t e l y 武汉理工大学硕士学位论文 k e yw o r d s :x m l ,i n f o r m a t i o ni n t e g r a t i o n , w e bs e r v i c e ,e c o m m e r c e ,c o m p o n e n t s i 独创性声明 本人声明,所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特尉加以标注和致谢的地方外,论文中不包含其他人 已经发表或撰写过的研究成果,也不包含为获得武汉理工大学或其它教育机构的 学位或证书而使用过的材料与我一同工作的同志对本研究所做的任何贡献均已 在论文中作了明确的说明并表示了谢意。 签名:叁盘 豳日期:边! ! : 关于论文使用授权的说明 本人完全了解武汉理工大学有关保留、使用学位论文的规定,即学校有权保 留、送交论文的复印件,允许论文被查阅和借四;学校可以公布论文的全部或部 分内容,可以采用影印、缩印或其他复制手段保存论文 ( 保密的论文在解密后应遵守此规定) 签名:垒埠导师签名:弛期:丝嘘:! :f ( 注:此页内容装订在论文扉页) 武汉理工大学硕士学位论文 1 1 研究背景与意义 第1 章绪论 随着互联网的普及和发展,以网络为核心的信息技术正在对人类社会的发 展、进步和繁荣起着越来越重要的影响。以互联网为中心的电子商务已经渗透到 社会生活的方方面面,成为推动世界经济又一轮快速增长的重要力量电子商务 就是商务活动的电子化、网络化、信息化,是人类社会进入到信息时代进行商务 活动的一种必然选择。随着经济的发展,电子商务作为网络经济一个重要组成部 分,在新经济舞台中将扮演越来越重要的角色。越来越多的企业开始采用以互联 网为媒介的电子商务系统,作为企业内外部之间数据交换、信息发布,以及管理 和交易的平台。利用网络信息技术进行商务活动可以显著的降低企业在开发、管 理、维护等方面的费用,扩大企业的影响力,而且可以很方便的实现信息的共享 和交流,参与世界贸易。但企业交易模式和信息技术的快速发展给电子商务平台 发人员提出了一系列新的问题 首先,目前的分布式计算技术d c o m ( d i s t r i b u t e dc o m p o n e n to b j e e tm o d e l , 分布式组件对象模型) 、c o r b a ( c o m m o no b j mr e q u e s tb r o k e ra r c h i t e c t u r e ,通 用对象请求代理结构) 使用的协议要求系统客户端与服务器端紧密耦合,即要求 一个同类的基本结构,而且不同的分布式技术如c o r b a 与d c o m 之间难以通 信。然而在电子商务应用中,各个企业的交易平台组成结构差别较大,要求所有 企业采用同一种体系架构和数据模式是不现实的。其次,客户端与服务器端之问 在语义上紧密耦合,一旦服务器端的接口或执行方式发生变化,客户端将无法执 行,这种紧密耦合性无法适应商务应用的动态变化。另外,现在许多企业都在服 务器上安置了防火墙,关闭了不常用的端口,以阻挡黑客的入侵,保护企业内部 数据库系统。而c o r b a 与d c o m 之类的分布式技术远程调用方法是基于动态 端口分配的,很难穿越企业防火墙,必须更改防火墙设置,这给企业应用带来不 安全因素和麻烦。 还有,企业之间交换的商品和交易数据,由于各自采用的数据库和电子商务 系统的不同,或是因企业或行业标准的不同,而造成格式不统一。为了满足电子 商务交易的自动化、快捷和安全性,需要一种统一、自描述和易于理解的格式规 范交易数据。 对于开发电子商务系统中遇到的上述问题,通过使用x m l 技术和w e b s e r v i c e s 技术可以得到很好得解决。x m l ( e x t e n s i b l em a r k u pl a n g u a g e ,可扩展 标记语言) 将是解决一系列数据交换和跨平台通信等问题的根本,也是未来电子 武汉理工大学硕士学位论文 商务发展的基础和趋势。x m l 可以允许用户定义自己的描述标签,从而赋予文 档中的数据的含义,其采用的树型结构可以用来描述格式复杂的数据。) 几为 信息的交换和计算提供了新的载体,可以说是信息在i n t e m e t 中传输的标准代码。 w e bs e r v i c e s 是部署在w e b 上的软件组件或者一组应用程序,向外界提供一个能 够通过w e b 进行调用的a p i ,提供某种特定的功能服务,可在w e b 上发布、发 现和使用。w e bs e r v i c e s 的主要目标是在现有的各种异构平台的基础上构筑一个 通用的与平台无关、语言无关、松散耦合的系统集成环境,各种不同平台上的应 用依靠这个技术层实施彼此的连接和集成。 x m l 是w 曲s e l - v i c a 3 的基础,w e bs e r v i c e s 的大部分标准,例如s o j a p 、 u d d i 、w s d l 等都是基于x m l 制定的i l j 。w e bs e r v i c e s 的使用将改变目前的开 发模式和应用部署的费用规模。各种w e b 服务分别实现一定的电子商务功能, 通过将各种电子商务的w e b 服务进行组合和集成以创建动态电子商务应用。w e b s e r v i c e s 能够统一地封装信息、行为、数据表现以及商务流程,而无需考虑应用 所在的环境是使用何种系统和设备。 随着w e bs e f v i o 器的研究和应用的深入,越来越多的企业将自己的业务能力 包装成w 曲s e r v i c e s 发布。通过使用w e bs e r v i c e s ,企业能够通过抽象和混合 将自身的电子商务组件化。对于企业而言,w 曲s e r v i c e s 技术不仅带来了发布自 己的业务能力,而且可动态地发现潜在合作伙伴的能力。更重要的一点是,合作 的双方( 或多方) 通过w e bs e r v i c e s ,可以实现真正跨平台的、即时的业务流程 对接。 目前,大多数的w e b 应用程序使用分层模型进行创建,这种模型包含了用 户接口、组件和数据库。组件将业务规则、其他具体功能以及对数据库的所有访 问进行封装。而w e bs e r v i c e s 可以提供企业级的集成,而且还对i n t e m e t 上的 任意设备连接到服务器上提供支持。w e bs e r v i c e s 从根本上说就是一个分布式解 决方案,是分布式计算机技术的大飞跃。w e bs e r v i c e s 的设计目的是便于升级 到下一代的i n t e r n e t ,使用w e bs e r v i c 髂,更易于开发对等和分布式应用程序, 其方法是提供连接的w e b 应用程序可以共享的公共协议,w e bs e r v i c e s 的设计 依赖于诸如h t t p 和x m l 这些i n t e r n e t 标准。在w e bs e r v i c e s 之前,公司通 常是购买c o m 组件,然后在每台需要这些功能服务器上进j 亍安装,以便在自 己的客户解决方案中使用这些组件。而w e bs e r v i c e s 的出现使得第三方厂家通 过w e bs e r v i c e s 提供这些功能。在w e bs e r v i c e s 升级时,你就可以访问它们, 因为w e bs e r v i c e s 就位于i n t e r a c t 上的中心位置,在需要升级时,你只需通过 w e bs e r v i c e s 内部功能的改变即可完成工作。w e bs e r v i c e s 还解决了长期以来困 扰c o m 开发人员的同一台计算机中存在多个版本的c o m 组件的问题。现在 2 武汉理工大学硕士学位论文 电子商务需要摆脱以往独立解决方案的实现模式,需要舍弃复杂系统连接的实现 方法,从而解决传统的电子商务的创建、维护和定制的代价及复杂度等问题。一 个有效的电子商务应用绝对不应该是仅仅基于程序员以及那些复杂的代码的。对 于电子商务而言,传统的由程序员主导的由里向外的开发模式应当被由用户主导 的由外向里的开发模式取代。冗长的串行的开发循环应当被即时的,快速的应用 装配所取代。同时这样的应用应当天生就具备高可定制性。如果探究其商业本质, 这是来自经过时间考验的商业技术概念:“即时制造”以及”规模可伸缩”等概念, 我们需要做的就是将传统的商业概念延伸到电子商务中去基于x m l 技术的 w e bs e r v i c e s 正是解决这一问题的最佳手段。w e bs e r v i c e s 的使用将改变目前的 开发模式和应用部署的费用规模翻各种w e b 服务分别实现了一定的电子商务 功能,通过将各种电子商务的w e bs e r v i c e s 进行组合和集成以创建动态电子商 务应用。w e bs e r v i c e s 能够统一地封装信息、行为、数据表现以及商务流程,而 无需考虑应用所在的环境是使用何种系统和设备。通过使用w e b 服务,企业能 够以以前所不可能的方式通过抽象和混合将自身的电子商务组件化。当一个企业 的核心竞争力被组件化之后,那么这些核心竞争力就能够很方便地在不同的企业 之间共享,同时架构跨企业的电子商务应用,形成商务w e b t 4 j 1 2 研究任务 研究和探讨x m l 、w e bs e r v i c e s 技术在电子商务中应用的应用方式,结合 x m l 和w e bs e r v i c e s 技术设计基于s o a 的新型电子商务组织模型和结构层次, 给出解决上述电子商务平台开发问题的方案。所需设计的电子商务系统应采用 w e bs e r v i c e s 实现商务应用的各部分业务逻辑,各种服务之间使用s o a p 通信, 以便电子商务平台具有x m l 数据格式良好的跨平台性和扩展性,以实现服务组 件化。 另外要求电子商务系统中数据和通信可以穿越企业服务器防火墙,使得企业 可以使用外部多种来源的数据库,方便企业问的数据交换。在数据集成中实现面 向关系数据库和x m l 数据的双向转换,实现高效的x m l 解析并将其与系统集 成。设计的系统模型要能体现了x m l 的内容与形式相分离的优点及w e b s e r v i c e s 的新型组件化思想,在电子商务这样涉及大量数据的分布式应用中,方 便数据的交换和发布。 1 3 国内外现状 ( 1 ) 国外现状 如2 0 0 6 年世界电子商务交易额达1 2 8 万亿美元,占全球商品交易的1 8 。 武汉理工大学硕士学位论文 目前,电子商务的应用已经成为决定企业国际竞争力的重要因素,总量规模也不 断变化,并影响着未来商业发展模式。面对世界电子商务的发展和变化,电子商 务系统的信息繁杂而且难以整合,这已成为电子商务面临的一大瓶颈。解决这一 问题的各种技术也在推进中,尤其是基于x m l 的w e bs e r v i c e 技术的发展 6 1 因此在发达国家尤其在美国,基于x m l 的w e bs e r v i c e 技术已经得到很多 大公司的应用推广,而且还在不断优化与发展,最具代表性的是g o o g l e 公司和 y a h o o 公司,他们已经成功地将他们的产品组件化,在微软公司推出的v i s u e s t a t i o 开发工具以来,它使得开发w e bs e r v i c e 组件变得更加便利。 ( 2 ) 国内现状 2 0 0 6 年,是我国电子商务继续快速发展年,电子商务已成为我国经济增长 的助推器,他的广泛应用降低了企业经营、管理和商务活动的成本,促进了资金、 技术、产品、服务和人员在全球范围的流动,推动了我国经济全球化的发展。虽 然我国电子商务发展起步较晚,但势头较强,政府也在积极推进电子商务的发展, 政府级电子商务总体框架基本确立,调查显示,目前中国1 0 0 0 万中小企业中, 已有1 4 的企业开始尝试并熟练运用电子商务工具;有关人士预测,随着国内新 一代人的成长,到2 0 0 6 年中国将会超过美国成为拥有最多互联网用户的市场, 这也表明进行电子商务的企业大概会在明年迎来一个快速发展的高峰。到2 0 0 7 年,中国电子商务市场总体规模将会达到1 7 万亿元,而b 2 b 电子商务市场规模 将会达到1 6 9 万亿元。到2 0 0 9 年,中小企业信息化投资将突破2 3 0 0 亿元。据 专家预测,中国电子商务这几年的发展速度在4 0 0 , 6 ,未来几年可能会超过5 0 0 , 6 例。 但是基于x m l 的w e bs e r v i c e 技术应用到电子商务系统中的在国内还处 于初级阶段,基于服务组件化程度还远远不够,做的比较好的有百度公司和阿里 巴巴公司,即使他们也没有很好的把面向服务构架( s o a ) 技术应用到电子商务 中去。所以到目前,国内依然没有大规模商业化的信息库组件。这与发达国家还 有很大的差距。 。 1 4 本文的组织结构 第一章:本章主要介绍了该研究的背景,以及所要完成的研究任务,并对论 文的整体结构做一个概括介绍。 第二章:x m l 与电子商务概况。本章主要介绍了电子商务的基本概念和运 作模式,概括电子商务的发展历程,以及现在面临的困境和解决趋势;还介绍 了x m l 的定义,以及产生经过、发展,分析了x m l 技术在解决电子商务面临 的问题时如何发挥作用。 第三章:x m l 与w e bs e r v i c e s 在系统内部以及与外部信息整和中的研究。 4 武汉理工大学硕士学位论文 详细介绍的w e bs e r v i c e s 的工作原理,并结合电子商务系统作了简单的说明。 第四章:提出基于x m l 的信息整合在电子商务中的解决方案。本章首先分 析传统分布式组件( c o 妯l a 、d c o m 等) 电子商务系统的特点和不足之处,提 出新的基于x m l w e bs e r v i c e s 技术的电子商务系统模型,阐述了基于s o a 的系 统架构,并对各层进行设计,对其实现方式做了探讨和研究。 第五章:本章详细描述了基于x m l 的信息整合在电子商务里的应用,给出 了通过a s p n e t 实现系统的过程和方法。 第六章:对本系统进行总结,并展望了了基于x m l 的信息整合在电子商务 中应用的发展趋势 武汉理工大学硕士学位论文 2 1 引言 第2 章x m l 技术与电子商务 在电子商务应用中,需要将大量复杂的动态数据用统一的数据格式进行表示 和操作。目前最好的方法就是使用x m l 。x m l 基于文本格式,开放跨平台,采 用结构化数据内容格式,数据内容与数据显示相分离,无论是在数据显示还是在 数据交换中,均能发挥重要作用。所以x m l 不仅是w e bs e r v i c e 的基础,还是 许多数据交换标准的基础,这也就决定了它将成为本文中电子商务系统信息进行 分布式整合的基础,是构建电子商务信息籀合解决方案的有效途径。 2 2x m l 技术 2 2 1 x m l 基础 1 9 6 9 年,m m 的研究人员e dm o s h e r ,r a yl o r i e 和c h a r l e sg o l d f a r b 开发出 了第一种现代标记语言通用标记语言g m l ( g e n e r a l i z e dm a r k u pl a n g u a g e ) 。 g m l 是一种元语言( m e t al a n g u a g e ) ,它能够描述其它语言及其语法和词汇表, 可以用于标记任何数据集合的结构此后,g m l 发展成了标准通用标记语言 ( s t a n d a r d g e n e r a l i z e dm a r k u pl a n g u a g e ,s g m l ) 2 j 。 1 9 8 6 年,s g m l 被国际标准化组织i s 0 接受为国际性的数据存储和交换的 标准,并收录在i s o - - - 8 8 7 9 中。s g m l 是一种用标记来描述文档资料的通用语 言,+ 它包含了一系列的文档类型定义( 简称d 1 d ) ,d t d 中定义了标记的含义, 因而s g m l 的语法是可以扩展的。s g m l 十分庞大,主要用于大型工业企业中, 如飞机制造、汽车和军事工业,但是s g m l 非常复杂既不容易学,又不容易使 用,在计算机上实现也十分困难,这使得s g m l 在网上传输遇到了很大障碍。 鉴于这些因素,w e b 的发明者一欧洲核子物理研究中心的研究人员根据当时 ( 1 9 8 9 年1 计算机技术的能力,开发了s g m l 标准的超文本版本,即h t m l 来解 决机构内的信息共享任务。h t m l 继承了s g m l 的重要功能,如结构化、独立 予实现等,但是它在许多方面是有限制的,如它使用一套固定的标记集,并且它 主要注重于表现形式的描述。 h t m l 只使用s g m l 中很小一部分标记,例如h t m l 3 2 定义了7 0 种标 记。为了便于在计算机上实现,h t m l 规定的标记是固定的,即h t m l 语法是 不可扩展的,它不需包含d t d 。h t m l 这种固定的语法使它易学易用,在计算 机上开发h t m l 的浏览器也十分容易。i f 是由于h t m l 的简单性,使w e b 技 6 武汉理工大学硕士学位论文 术从计算机界走向全社会,走向千家万户,w e b 的发展如日中天。近年来,随 着w e b 的应用越来越广泛和深入,人们渐渐觉得h t m l 不够用了,h t m l 过 于简单的语法严重地阻碍了用它来表现复杂的形式。尽管h t m l 推出了一个又 一个新版本,已经有了脚本、表格、帧等表达功能,但始终满足不了不断增长的 需求。另一方面,这几年来计算机技术的发展也十分迅速,已经可以实现比当初 发明创造h t m l 时复杂得多的w e b 浏览器,所以开发一种新的w e b 页面语 言既是必要的,也是可能的。有人建议直接重新使用s g m l 作为w e b 语言, 这固然能解决h t m l 遇到的困难【刀。但是s g m l 太庞大了,用户学习和使用 不方便尚且不说,要全面实现s g m l 的测览器也非常困难,于是自然会想到仅 使用s g m l 的子集,使新的语言既方便使用又实现容易。正是在这种形势下, w 3 c 决定开发一套新的s g m l 标准的子集x m l ,以供w e b 使用。x m l 也是一 种元语言,即用于定义其它与特定领域有关的、语义的、结构化的标记语言的句 法语言。x m l 克服了h t m l 标准的限制,保留了s g m l 标准的大多数功能,在 w w w 环境中,它更易于使用和实现。总的来说,x m l 是一种中介标示语言 ( m e t a - m a r k u p l a n g u a g e ) ,可提供描述结构化资料的格式,详细来说,x m l 是 一种类似于h t m l ,被设计用来描述数据的语言。x m l 提供了一种独立的运行 程序的方法来共享数据,它是用来自动描述信息的一种新的标准语言,它能使计 算机通信把i n t e m e t 的功能由信息传递扩大到人类其他多种多样的活动中去 x m l 由若干规则组成,这些规则可用于创建标记语言,并能用一种被称作分析 程序的简明程序处理所有新创建的标记语言,正如h t m l 为第一个计算机用户 阅读i n t e m e t 文档提供一种显示方式一样,x m l 也创建了一种任何人都能读出和 写入的世界语。x m l 解决了h t m l 不能解决的两个w e b 问题,即i n t e r n e t 发展 速度快而接入速度慢的问题,以及可利用的信息多,但难以找到自己需要的那部 分信息的问题。x m l 能增加结构和语义信息,可使计算机和服务器即时处理多 种形式的信息。因此,运用x m l 的扩展功能不仅能从w e b 服务器下载大量的信 息,还能大大减少网络业务量。 1 9 9 8 年,x m l 正式成为w 3 c 的标准这个新标准的初始化草案包含了以 下十个关键的设计目标: ( 1 ) l 应该可以直接用于i n t e r n e t 。 ( 2 ) 订l 应该支持大量不同的应用。 ( 3 ) x m l 应该与s g m l 兼容。 ( 4 ) 用于处理x m l 文件的程序应该容易编写。 ( 5 ) x m l 中的可选项应无条件地保持最少,理想状况下应该没有。 ( 6 ) x m l 文件应该是人可以直接阅读的,应该是条理清楚的。 7 武汉理工大学硕士学位论文 ( 7 ) x m l 的设计应快速完成。 ( 8 ) x m l 的设计应该是形式化的,简洁的。 c 9 ) x m l 文件应易于创建。 ( 1 0 ) x m l 标记的简洁性是最后考虑的目标 2 2 2x m l 的技术标准和规范 w 3 c 建立了一系列x m l 规范,以便于软件开发人员和数据编辑人员在网页 以及其他软件上组织信息,并希望借此能确保在通过网络进行交互合作时,具有 良好的可靠性和交互性。虽然x m l 标准本身很简单,但与x m l 相关的标准 却种类繁多,w 3 c 制定的相关标准就有2 0 多个,在重要的电子商务标准中, 采用x m l 制定的就有1 0 多个。这也表明x m l 确实是一种非常实用并且被广 泛使用的结构化语言。 2 2 2 1x m l 相关标准体系 x i d l 相关标准体系可分为元语言标准、基础标准和应用标准三个层次。 ( 1 ) 元语言标准( m e t a - l a n g u a g e ) :定义的是用来描述标准的元语言,在x m l 标准体系中就是x m l 标准。x m l 标准在x m l 标准体系中与s g m l 标准在 s g m l 标准体系中的地位相似,是整个体系的核心,其他x m l 相关标准都是用 它制定的或为其服务的。 ( 2 ) 基础标准( f o u n d a t i o ns t a n d a r d s ) :这一层次的标准是为x m l 的进一步 实用化制定的标准,规定了采用x m l 标准时的一些公用特征、方法或规则。包 括d t d 、x m ln a m c s p a c c 、x m ls c h e m a 。s a x ( s i m p l ea p i sf o rx m l ,x m l 简单应用程序接口) 、x p a t h 、x l l n k 、x s l 及r d f ( r e s o u r c ed e s c r i p t i o nf o r m a t , 资源描述框架) 等。 ( 3 ) 应用标准( a p p l i c a t i o ns t a n d a r d s ) :x m l 已经被广泛接受,大量的应用 标准特别是针对i n t c r n c t 的应用标准纷纷采用x m l 进行制定。在这个i n t c m c t 时代,几乎所有的行业领域都与i n t e m e t 有关。而这些行业一旦与i n t c m e t 发生 关系,都必然要有其行业标准,这些标准往往是采用帆来制定的包括 ) i 3 1 t m l 、s v g ( 可伸缩向量) 、w a p 、m a t l l m l ( 数学标记语言) 、e b x m l ( 联 合国u n c e f a c t 小组和o a s i s 共同发起的一个计划,目标是制定出基于x m l 的全球范围的电子商务数据交换的标准) 、b i z t a l k ( m i c r o s o f t 公司发起的电子商 务的s c h e m a 库,其结构是各个商家定义自己豹s c h e m a ,定义好的s c h e m a 提交 到b i z t a l k o r g 进行注册) 等。从x m l 标准体系中可以看到x m l 基础标准是 相当多的,而且这些标准又是非常重要的,因为这些标准是x m l 应用标准的 基础。它们是在x m l 标准的基础上,进_ 步对x m l 中的一些公共的特性、 8 武汉理工大学硕士学位论文 方法及规则做了更为详细明确的规定,应用标准通常都要使用到这些标准的内容 或者遵照其中的约定。 2 2 2 2x m l 基本语法 对于一个x m l 文档,可以从两个层次上来考察它一是它是否是格式正规 的x m l 文档,二是它是否是有效的x m l 文档所谓格式正规的x m l 文档 是指它符合x m l 的基本语法规则,并且没有受到其他任何的约束。所谓有效 的x m l 文档是指它不仅遵循x m l 的语法规则,而且受到所创建的词汇表及 有关规则的约束【2 】 x m l 文档的语法规则简单而严格,我们总结有以下8 条: ( 1 ) x m l 文档必须以一个x m l 声明开头,声明格式为 ( 2 ) 每个元素必须包括一个开始标记 和一个结束标记叫标记名 ,将 该元素的值夹起来,形成完整的配对。 ( 3 ) 各元素必须正确的嵌套,形成包含关系( 父子关系) 或者并列关系( 兄 弟关系) ,不允许两元素互相交错。 ( 4 ) 文档有且仅有一个根元素,为所有元素的父元素 ( 5 ) 当元素内容为空时,允许将开始标记和结束标记合写为一个空标记q 示记 名卢。 ( 6 ) 标记对大小写敏感。 ( 7 ) 标记符后面可以有:属性= “属性名”的设置。 ( 8 ) 特殊字符,如“ ”等必须用规定的所谓实体参考表示。 总之,x m l 使用一个简单而有灵活的标准格式,为基于w e b 的应用提供 了一个描述数据和交换数据的有效手段。h t m l 描述了显示全球数据的通用方 法,而x m l 提供了直接处理全球数据的通用方法。 2 2 2 3 啪和s c h e m a 为了使得用x m l1 0 开发的文档结构便于和他人交流,x m l i 0 提供了一种 机制d t d ( d o c u m e n tt y p ed e f i n i t i o n ,文档类型定义) ,并将其作为此规范 的一部分。x m ld t d 使用正式的语法来定义x m l 文档的结构和在文档中所用 的词汇。d t d 包括元素类型声明、属性列表声明、实体声明、记号声明等。d t d 可以用直接写入或是外部链接的方式来与x m l 文件相结合。利用外部链接的方 式,也可以让数个x m l 文件共同使用一个d t d 。x m l 作为一种元标记语言, 创建的新标记语言( 也叫标记集) 要通过d t d 来定义。各个文档要与d t d 相 比较,这一过程称为合法性检验。如果文档符合啪中的约束,这个文档就被 9 武汉理工大学硕士学位论文 认为是合法的,否则就是不合法的。由于d t d 可以精确地定义x m l 文档实例 的词汇表和文档实例的结构,因此利用d t d ,许多解析器可以验证文档实例的 有效性,由此形成了一种有效的错误检测机制。d t d 有效地推动了x m l 的发展, 但是当x m l 用于更多的程序环境而不只是文档标记时,d t d 就表现出一些不足 之处,如d t d 的扩展性不好,d t d 不提供对命名空间的支持,d t d 不支持数 据类型和数据类型的继承等。于是人们希望有一种基于x m l 语法的模式语言来 代替和扩展d t d 。 2 0 0 1 年5 月,x m ls c h e m a 正式成为w 3 c 的推荐标准。x m ls c h e m a 也是 用来定义x m l 文件的文本结构和数据类型等x m l 文件描述规则的。其实,x m l s c h e m a 本身也是一个x m l 文件。x m ls c h e m a 的功能和d t d 基本相同,但在 定义文档实例的词汇表和结构时能做到更为精确,并且x m l s c h e m a 克服了d t d 的缺陷:x m ls c h e m a 提供对命名空间的支持,它的扩展性好,并且支持数据类 型以及数据类型的继承。 x m l s c h e m a 由许多不同类型的组件构成,模式
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新能源技术2025年研发投入与产业创新驱动研究报告
- 新能源汽车轻量化车身结构优化与碰撞安全性能提升创新路径
- 2025年中国新能源汽车充电基础设施互联互通解决方案研究报告
- 2025年生物质能发电项目政策支持与收益评估报告
- 听辟谷课件的感受
- 2025年新能源汽车智能座舱硬件配置与智能化解决方案研究报告
- 2025年猪场分娩考试题及答案
- 银行案防考试监管基础题库
- 2024-2025学年计算机操作员题库试题附完整答案详解【各地真题】
- 兴业银行长春市朝阳区2025秋招无领导小组面试案例库
- 云南学法减分题库及答案
- 幼儿园大班数学活动《4的分解与组合》课件
- 江苏省制造业领域人工智能技术应用场景参考指引2025年版
- 三级医师查房制度考试题(含答案)
- 文旅公司考试试题及答案
- 2025至2030年中国公立医院行业发展监测及市场发展潜力预测报告
- 2025年全国翻译专业资格(水平)考试土耳其语三级笔译试卷
- 人工智能技术在网络安全威胁检测中的应用
- 2025内蒙古民族大学招聘管理助理、教学助理50人笔试模拟试题及答案解析
- 2025年麻醉、第一类精神药品管理培训考核试题及答案(护士卷)
- 胃肠镜报告的解读
评论
0/150
提交评论