




已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
山东大学软件学院XML论文1、 XML简介1、 背景随着计算机和网络技术的不断发展深入XML技术的应用也将不断扩大。由于HTML对超级链接支持不足,并缺乏空间立体描述,处理图形、图像、音频、视频等多媒体能力较弱,图文混排功能简单,不能表示多种媒体的同步关系等缺点,也影响HTML的大规模应用以及用于复杂的多媒体数据处理。可以说XML的诞生给数据交换带来了一场革命;XML的出现是至今为止最聪明的一种符号化语言;XML成为下一代网络发展的基石。所以说,XML的出现,使HTML存在的问题可以得到很好的解决2、 什么是XMLxml(Extensible Markup Language)即可扩展标记语言。可扩展标记语言,标准通用标记语言的子集,一种用于标记电子文件使其具有结构性的标记语言。它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。它非常适合万维网传输,提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。3、 XML的演变XML(eXtensible Markup Language)由SGML(Standard for General Markup Language,通用标记语言标准)演变而来,XML并不是SGML的一种应用,而是它的子集。XML,在许多方面都与SGML雷同。任何用XML完成的工作同样也可以用SGMI来完成。XML拥有SGML 80的功能,其复杂程度却只有SGML的20。XML能有效地在互联网上应用,因而,XML带来了在SGML中所没有的优点,而且XML能与HTML整合来描述与显示数据。2、 XML的优势1、XML把数据从HTML分离通过XML,数据能够存储在独立的XML文件中。这样就可以更专注于使用HTML进行布局和显示,并确保修改底层数据不再需要对HTML进行任何的改变。通过使用几行JavaScript,就可以读取一个外部XML文件,然后更新HTML中的数据内容。2、XML简化数据共享在真实的世界中,计算机系统和数据使用不兼容的格式来存储数据。XML数据以纯文本格式进行存储,因此提供了一种独立于软件和硬件的数据存储方法。让数据存储方法创建不同应用程序可以共享的数据变得更加容易。3、XML简化数据传输通过XML,可以在不兼容的系统之间轻松地交换数据。对开发人员来说,其中一项最费时的挑战一直是在因特网上的不兼容系统之间交换数据。可以通过各种不兼容的应用程序来读取数据,以XML交换数据降低了这种复杂性。4、XML简化平台的变更升级到新的系统(硬件或软件平台),是非常费时的。必须转换大量的数据,不兼容的数据经常会丢失。而,XML数据以文本格式存储。这使得XML在不损失数据的情况下,更容易扩展或升级到新的操作系统、新应用程序或新的浏览器。XML使您的数据更有用。XML独立于硬件、软件以及应用程序,XML使数据更可用,也更有用。不同的应用程序都能够访问用户的数据,不仅仅在HTML页中,也可以从XML数据源中进行访问。通过XML,用户的数据可供各种阅读设备使用(手持的计算机、语音设备、新闻阅读器等),还可以供盲人或其他残障人士使用。XML用于创建新的Internet语言很多新的Internet语言是通过XML创建的:其中的例子包括:XHTML-最新的HTML版本WSDL-用于描述可用的web serviceWAP和WML-用于手持设备的标记语言RSS-用于RSS feed的语言RDF和OWL-用于描述资源和本体SMIL-用于描述针对web的多媒体5、使用Xml文档的优势Web的开始阶段是简单的网站(信息中介和信息发布的平台),随着Internet和Intranet、Extranet的快速发展而发展成为各种应用的主要平台。Web在商业、工业、银行、财政、教育、政府等领域产生了深远影响,这得益于Web标准化、松散耦合、语言中立、平台无关性、开放性等特性的服务。Web服务需要XML(可扩展标记语言)、SOAP(简单对象访问协议、WSDL(Web服务描述语言)和UDDL(统一描述、发现和集成协议)四大技术标准的支持1。其中UDDI、SOAP和WSDL基于XML,因此XML在Web系统中占有重要位置。XML扩展标记语言第1版XML是世界互联网协会(World Wide Web Consortium,WSC)于1998年2月颁布。由于XML源自标准通用标记语言SGML,XML作为一种可扩展的标记语言,目前已成为信息描述的事实标准。因此XML可以放便地描述风险及其相关的属性,这样也就能方便地对风险进行分析,进而选用对应的策略。许多软件提供了对XML的支持,XML可以作为不同用户的异构应用系统之间进行数据交换的标准语言,实现数据交换的透明性。目前,因特网上安全通信的事实标准是传输层安全性(Tvansport Layer SecurITy,TLS)和安全套接子层(SSL)。TLS和SSL不具备加密交换数据的一部分和多方(不止两方)之间的安全会话,而XML涵盖了安全性需求的机制。6、XML风险描述的优势传统的风险描述主要包括适于规范数据,较为规范数据的关系数据库描述和适宜于非规范知识的本体描述。关系数据库不方便扩展,风险间的关系不易用二元关系表达且关系表难于设计,本体描述难度大,概念间的关系难确定且一致性差。XML结合了关系数据库和个体描述,并有效地解决了传统风险描述的缺点。同时,XML Schema易于确定XML文档的格式,使得风险描述更易实施和见效。7、XML开放性的优势XML的开放性主要指它既与平台无关,又与技术提供厂商无关。它解决了电子数据交换(Electronic Data Interchange,EDI)的缺点。EDI的主要缺点是国际上对于交换数据的格式和语义没有统一标准。尽管国际上各个国家针对不同的行业制订了用于数据交换的EDL标准,然而一个系统为了能够和不同的行业乃至不同的国家的合作伙伴进行数据交换,不得不购买并安装多种进行数据转换的适配软件插件,更何况各个行业具体的用户在实现这些数据时会或多或少加上一些个性化的标准。因此,利用EDI技术实现平台系统成本和复杂度都比较高。8、XML加密的优势XML可完成加密交换数据的一部分,而TLS/SSL的处理方式只能保证通信传输过程中的数据安全,不能对不同的用户施加不同的权限来保证用户信息的安全,即TLS/SSL(Tvansport Layer SecurITy/SSL)不用完成对交换数据的一部分进行加密。XML加密可实现多方之间的安全会话,即每一方都可保持与任何通信方的安全或非安全状态,可在同一文档中交换安全或非安全的数据。XML加密可作为SOAP协议的安全性扩展,因为SOAP协议基于XML,可以通嵌入加密了的XML数据的形式来实现在消息传输的应用层灵活采用适当的加密策略。三、XML文档的组成XML文档的序言里包含了关于文档本身的元信息,而不是文档的内容。它可能包含XML声明、处理指令、注释以及嵌入的DTD或模式。1、XML声明XML文档通常都以一个XML声明开始,虽然这并不是必需的.在XML文档中,包含一个声明是好的做法,因为它可以告诉应用程序或人随后的是一段XML内容。它还能向处理程序提供关于该文档的额外信息,比如它的字符编码类型。如果在XML中包含声明,就必须将它置于文档的第一行。任何内容都不能放在XML声明前面,空格也不行。如果你不小心在声明前面放了一个空格,XML处理程序就将无法正确解析文档的内容,并且会产生错误消息。XML声明中还可以包含一些属性,这些属性提供关于版本、编码以及文档是否独立的信息:XML声明中的每个属性都是可选的,但是它们的顺序很重要。如果需要包含encoding属性,那它必须出现在version属性的后面。而standalone属性只能是声明中的最后一个属性。2、处理指令序言中还可包含处理指令(processing instruction,PI),它们将关于XML文档的信息传递给其他应用程序。XML处理程序并不处理PI,而是将它们原封不动地传递给应用程序。PI以结束。它们通常会在序言中出现,虽然它们也可出现在XML文档内的其他地方。XML声明也以;(2)注释不能包含于标签内部;(3)元素中的开始标签或结束标签不能被注释掉;(4)虽然大多数XML处理程序都会把注释传递给应用程序,但并不一定必须这么做。4、DTD和XML模式DTD和XML模式提供关于XML文档内的元素和属性如何出现的规则。也就是说,它们确定哪些元素和属性是有效的,哪些是必需的或可选的。序言中可以包含关于XML文档的声明,也可以包含一个到外部DTD或模式的引用,或是两者都包括。5、XML文档元素中的段XML文档中的数据存储在文档元素或根元素内。这个元素包含文档中的所有其他的元素、属性、文本和CDATA,同时也可包含实体和注释。5.1、元素在XML文档中,元素有很多作用,它们(1)可以标记内容;(2)为它们标记的内容提供一些描述;(3)为数据的顺序和相对重要性提供信息;(4)展示数据之间的关系。元素包括一个开始标签、一个结束标签和内容。内容可以是文本、子元素或是二者都有。元素的开始标签中也可包含属性。在元素内部可以放置注释。一共有四类元素:(1)空元素如果元素中不包含任何文本,那么它就是个空元素,可以以两种方式书写。(2)仅含文本的元素有些元素仅含文本内容。、和都是仅含文本的元素:(3)含其他元素的元素一个元素可以仅包含其他的元素。容器元素称为父(parent),被包含的元素称为子(child)。(4)混合元素混合元素既含有文本也含有子元素。综上所述,元素有以下条件:(l)元素必须含有开始标签和结束标签。在没有内容的情况下,才可以使用省略写法;(2)标签名称必须符合XML命名规则;(3)元素必须正确地嵌套。5.2、属性在XML文档中,提供信息的另一种方法就是在元素的开始标签中使用属性。属性通常为它们所修饰的元素提供额外的信息。一个元素中可以出现的属性的数量是没有限制的。属性由名称/值对组成,其中值是包含于单引号或双引号中的。属性的两种通常用法是转换信息格式和指定特定的格式或编码。当元素包含属性时,常称为复合类型(complex type)元素。在同一个元素内,可以为不同的属性分别使用双引号或单引号。请注意,不要在同一个属性中分别使用单引号和双引号,否则文档就不是合式的了。注意从文字处理文档中剪切属性粘贴到XML文档中时要十分小心。文字处理软件通常使用小引号,而这会在XML文档中引起错误。还可以将属性改写为嵌套的子元素。现在总结一下与属性相关的规则:(l)属性由名称/值对组成;(2)属性值必须封装在单引号或双引号中;(3)属性中不能含有XML标签;(4)属性名称必须遵循XML命名规则。5.3、文本所有XML文档内部的文本都包含于开始标签和结束标签内部。除非该文本被标记为CDATA,那么它将会被认为是XML,从而做相应的处理。也就是说,左尖括号会被认为是某个XML标签的一部分。如果希望在文本中使用保留的字符,那么必须将它们写为字符实体。例如,可以将左尖括号写作<。保留字符也可以嵌入到CDATA中。5.4、CDATA段CDATA可以对文本块进行标记,这样它们就不会被当作XML进行处理。这对于包含XML保留字符的文本来说是非常有用的。CDATA段可用于在XML文档中嵌入代码,如JavaScript代码,或者加入不需要处理的内容。例如,当一个应用程序从数据库里读取数据并且将它标记在XML文档中时,它可能将所有的内容都嵌入到CDATA段中,以避免对那些保留字一个一个地进行处理。5.5、实体字符实体是表示单一字符的符号。在XHTML中,字符实体被用于表示一些特殊的符号,如与号&(&)和不间断空格( )。在XML文档中,可以用字符实体替代保留字符。因为所有的标签都以左尖括号开始,所以在一个元素的文本中是无法包含这个字符的。以下这些保留符号是需要注意的:(l),表明一个标签的开始;(2)&,表明一个实体的第一个字符;(3)xml,保留为用于对XML语言其他部分的引用。有时一些字符是不能加入到XML文档中的,也许因为这些字符不在键盘上或者它是图形字符。在这种情况下,可以使用Unicode或十六进制数字将它们以字符实体的形式加入。比如,可以将版权符号编码成或。以。每次需要在XML文档中包含这段文字时,都可以使用实体引用©right;。这使文本更容易管理和更新。四、XML的应用1、Web应用XML文档无疑将成为Web资源的重要组成部分,而且基于XML的文档资源使Web搜索引擎的智能化变得容易起来。除此之外,XML能够用来建立HTML所不能达到的多层Web应用,特别地,XML在Web应用中有下列用途:集成不同数据源、本地计算、数据的多种显示、支持Web应用的互操作和集成、基于语义的Data Mining。1.1、XML在Web数据挖掘中的应用XML给基于Web的应用软件赋予了强大的功能和灵活性,因此它给开发者和用户带来了许多好处。XML能够使不同来源的结构化的数据很容易地结合在一起。软件代理商可以在中间层的服务器上对从后端数据库和其它应用处来的数据进行集成。然后,数据就能被发送到客户或其他服务器做进一步的集合、处理和分发。XML的扩展性和灵活性允许它描述不同种类应用软件中的数据,从描述搜集的Web页到数据记录,从而通过多种应用得到数据。同时,由于基于XML的数据是自我描述的,数据不需要有内部描述就能被交换和处理。利用XML,用户可以方便地进行本地计算和处理,XML格式的数据发送给客户后,客户可以用应用软件解析数据并对数据进行编辑和处理。使用者可以用不同的方法处理数据,而不仅仅是显示它。XML文档对象模式(DOM)允许用脚本或其他编程语言处理数据,数据计算不需要回到服务器就能进行。XML可以被利用来分离使用者观看数据的界面,使用简单灵活开放的格式,可以给Web创建功能强大的应用软件,而原来这些软件只能建立在高端数据库上。另外,数据发到桌面后,能够用多种方式显示。XML还可以通过以简单开放扩展的方式描述结构化的数据,XML补充了HTML,被广泛地用来描述使用者界面。HTML描述数据的外观,而XML描述数据本身。由于数据显示与内容分开,XML定义的数据允许指定不同的显示方式,使数据更合理地表现出来。本地的数据能够以客户配置、使用者选择或其他标准决定的方式动态地表现出来。CSS和XSL为数据的显示提供了公布的机制。通过XML,数据可以粒状地更新。XML也允许加进其他数据,比如预测的温度。加入的信息能够进入存在的页面,不需要浏览器重新发一个新的页面。XML应用于客户需要与不同的数据源进行交互时,数据可能来自不同的数据库,它们都有各自不同的复杂格式。但客户与这些数据库间只通过一种标准语言进行交互,那就是XML。由于XML的自定义性及可扩展性,它足以表达各种类型的数据。客户收到数据后可以进行处理,也可以在不同数据库间进行传递。总之,在这类应用中,XML解决了数据的统一接口问题。但是,与其他的数据传递标准不同的是,XML并没有定义数据文件中数据出现的具体规范,而是在数据中附加TAG来表达数据的逻辑结构和含义。这使XML成为一种程序能自动理解的规范。XML应用于将大量运算负荷分布在客户端,即客户可根据自己的需求选择和制作不同的应用程序以处理数据,而服务器只须发出同一个XML文件。XML将处理数据的主动权交给了客户,服务器所作的只是尽可能完善、准确地将数据封装进XML文件中,正是各取所需、各司其职。XML的自解释性使客户端在收到数据的同时也理解数据的逻辑结构与含义,从而使广泛、通用的分布式计算成为可能。XML还被应用于网络代理,以便对所取得的信息进行编辑、增减以适应个人用户的需要。有些客户取得数据并不是为了直接使用而是为了根据需要组织自己的数据库。此外,XML文件中还可以包含进诸如难度系数、往年错误率等其他相关信息,这样只需几个小程序,同一个XML文件便可变成多个文件传送到不同的用户手中。1.2、XML在Web风险描述中的应用通用漏洞发布(Common VulnerabilITy Exposures,CVE)推出了漏洞的XML格式文档;OASIS和OWASP分别提出了各自的基于XML漏洞描述语言。若在这些漏洞描述中增加有关风险的发现信息,风险的危害信息和风险的解决信息。这样在漏洞查找和描述
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中华传统文化知识竞赛题库
- 2025年人力资源行业招聘面试预测题及备考指南
- 2025年新型节能水泵、风机和压缩机项目建议书
- 2025年糖果、巧克力、蜜饯及类似食品项目发展计划
- 2025年非晶、微晶合金项目发展计划
- 2025年高绝缘高导热氮化铝陶瓷基片合作协议书
- 抢救仪器使用教学课件
- 抛丸机安全培训总结课件
- 抗逆性育种课件
- 河南省商丘市夏邑县多校2024-2025学年七年级下学期3月月考生物试题(含答案)
- 2025-2026学年人教版(2024)初中信息科技七年级(全一册)教学计划及进度表(第一学期)
- 埃菲尔铁塔精品课件
- 德国工业标准DIN8077聚丙烯(PP)管材尺寸赵彦波
- 大班语言《我喜欢我》课件
- 拖拉机和联合收割机查验记录表
- (公开课)26个英文字母书写笔顺动态演示(基础教育)
- Q∕GDW 11304.2-2021 电力设备带电检测仪器技术规范 第2部分:红外热像仪
- 部编版一年级道德与法治上册第1课《开开心心上学去》精品课件
- 高分子化学6离子聚合阳离子
- 注塑机各部件的中英文名称和作用
- NB_T 10337-2019《水电工程预可行性研究报告编制规程》_(高清最新)
评论
0/150
提交评论