已阅读5页,还剩20页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Xml 的技术目录目录1摘要21. 使用Xml的功能31.1使用Xml的功能31.1.1 XML把数据从 HTML 分离31.1.2 XML 简化数据共享41.1.3 XML 简化数据传输41.1.4 XML 简化平台的变更42 使用Xml文档的优势62.1使用Xml文档的优势62.1.1 XML风险描述的优势72.1.2 XML开放性的优势72.1.3 XML加密的优势73 XML文档的组成93.1 XML文档的序言93.1.1 XML声明93.1.2 处理指令103.1.3 注释103.1.4 DTD和XML模式103.2 XML文档元素中的段113.21元素113.22属性133.2. 3文本143.2. 4CDATA段143.2. 5实体144 XML的工作原理174.1 XML数据结构转换技术174.2 显示和打印XML数据的技术174.2.1 XML3种方法:174.2.2 XSL是用XML描述的文件184.3 定义XML数据结构的技术184.4 XML的主要技术分类194.4.1 处理XML数据194.5 XML类似新闻阅读器205. XML的应用215.1 Web应用215.1.1 XML在Web数据挖掘中的应用215.1.2 XML在Web风险描述中的应用235.1.3 XML开放性在Web服务中的应用245.1.4 XML加密优势在Web中的应用24摘要随着计算机和网络技术的不断发展深入XML技术的应用也将不断扩大。由于HTML对超级链接支持不足,并缺乏空间立体描述,处理图形、图像、音频、视频等多媒体能力较弱,图文混排功能简单,不能表示多种媒体的同步关系等缺点,也影响HTML的大规模应用以及用于复杂的多媒体数据处理。可以说XML的诞生给数据交换带来了一场革命;XML的出现是至今为止最聪明的一种符号化语言;XML成为下一代网络发展的基石。所以说,XML的出现,使HTML存在的问题可以得到很好的解决。关键字:XML ,优势,功能,文档的组成,工作原理,应用。 1. 使用Xml的功能1.1使用Xml的功能XML (eXtensible Markup Language)由SGML(Standard for General Markup Language , 通用标记语言标准 )演变而来, XML并不是SGML的一种应用,而是它的子集。 XML,在许多方面都与SGML雷同。任何用XML完成的工作同样也可以用SGMI来完成。XML拥有SGML 80的功能,其复杂程度却只有SGML的20。XML能有效地在互联网上应用,因而, XML 带来了在SGML中所没有的优点,而且XML能与HTML整合来描述与显示数据。其中,Xml的功能包括:XML把数据从 HTML 分离; 简化数据共享;简化数据传输;简化平台的变更。1.1.1 XML把数据从 HTML 分离通过 XML,数据能够存储在独立的 XML 文件中。这样就可以更专注于使用 HTML 进行布局和显示,并确保修改底层数据不再需要对 HTML 进行任何的改变。通过使用几行 JavaScript,就可以读取一个外部 XML 文件,然后更新 HTML 中的数据内容。1.1.2 XML 简化数据共享在真实的世界中,计算机系统和数据使用不兼容的格式来存储数据。XML 数据以纯文本格式进行存储,因此提供了一种独立于软件和硬件的数据存储方法。让数据存储方法创建不同应用程序可以共享的数据变得更加容易。1.1.3 XML 简化数据传输通过 XML,可以在不兼容的系统之间轻松地交换数据。对开发人员来说,其中一项最费时的挑战一直是在因特网上的不兼容系统之间交换数据。可以通过各种不兼容的应用程序来读取数据,以 XML 交换数据降低了这种复杂性。1.1.4 XML 简化平台的变更升级到新的系统(硬件或软件平台),是非常费时的。必须转换大量的数据,不兼容的数据经常会丢失。而,XML 数据以文本格式存储。这使得 XML 在不损失数据的情况下,更容易扩展或升级到新的操作系统、新应用程序或新的浏览器。XML 使您的数据更有用。XML 独立于硬件、软件以及应用程序,XML 使数据更可用,也更有用。不同的应用程序都能够访问用户的数据,不仅仅在 HTML 页中,也可以从 XML 数据源中进行访问。通过 XML,用户的数据可供各种阅读设备使用(手持的计算机、语音设备、新闻阅读器等),还可以供盲人或其他残障人士使用。XML 用于创建新的 Internet 语言很多新的 Internet 语言是通过 XML 创建的:其中的例子包括:XHTML - 最新的 HTML 版本WSDL - 用于描述可用的 web serviceWAP 和 WML - 用于手持设备的标记语言RSS - 用于 RSS feed 的语言RDF 和 OWL - 用于描述资源和本体SMIL - 用于描述 针对 web 的多媒体2 使用Xml文档的优势2.1使用Xml文档的优势Web的开始 阶 段是简单的网站(信息中介和信息发布的平台),随着Internet和Intranet、Extranet的快速发展而发展成为各种应用的主要平台。Web在商业、工业、银行、财政、教育、政府等领域产生了深远影响,这得益于Web标准化、松散耦合、语言中立、平台无关性、开放性等特性的服务。Web服务需要XML(可扩展标记语言)、SOAP(简单对象访问协议、WSDL(Web服务描述语言)和UDDL(统一描述、发现和集成协议)四大技术标准的支持1。其中UDDI、SOAP和WSDL基于XML,因此XML在Web系统中占有重要位置。 XML扩展标记语言 第1版XML是世界互联网协会(World Wide Web Consortium,WSC)于1998年2月颁布。由于XML源自标准通用标记语言SGML,XML作为一种可扩展的标记语言,目前已成为信息描述的事实标准。因此XML可以放便地描述风险及其相关的属性,这样也就能方便地对风险进行分析,进而选用对应的策略。许多软件提供了对XML的支持,XML可以作为不同用户的异构应用系统之间进行数据交换的标准语言,实现数据交换的透明性。目前,因特网上安全通信的事实标准是传输层安全性( Tvansport Layer SecurITy ,TLS)和 安全套接子层 (SSL)。TLS和SSL不具备加密交换数据的一部分和多方(不止两方)之间的安全会话,而XML涵盖了安全性需求的机制。 2.1.1 XML风险描述的优势 传统的风险描述主要包括适于规范数据,较为规范数据的关系数据库描述和适宜于非规范知识的本体描述。关系数据库不方便扩展,风险间的关系不易用二元关系表达且关系表难于设计,本体描述难度大,概念间的关系难确定且一致性差。 XML结合了关系数据库和个体描述,并有效地解决了传统风险描述的缺点。同时,XML Schema易于确定XML文档的格式,使得风险描述更易实施和见效。2.1.2 XML开放性的优势 XML的开放性主要指它既与平台无关,又与技术提供厂商无关。它解决了电子数据交换(Electronic Data Interchange,EDI)的缺点。EDI的主要缺点是国际上对于交换数据的格式和语义没有统一标准。尽管国际上各个国家针对不同的行业制订了用于数据交换的EDL标准 ,然而一个系统为了能够和不同的行业乃至不同的国家的合作伙伴进行数据交换 ,不得不购买并安装多种进行数据转换的适配软件插件,更何况各个行业具体的用户在实现这些数据时会或多或少加上一些个性化的标准。因此 ,利用EDI技术实现平台系统成本和复杂度都比较高。2.1.3 XML加密的优势XML可完成加密交换数据的一部分,而TLS/SSL的处理方式只能保证通信传输过程中的数据安全,不能对不同的用户施加不同的权限来保证用户信息的安全 ,即TLS/SSL(Tvansport Layer SecurITy / SSL)不用完成对交换数据的一部分进行加密。XML加密可实现多方之间的安全会话,即每一方都可保持与任何通信方的安全或非安全状态 ,可在同一文档中交换安全或非安全的数据。XML加密可作为SOAP协议的安全性扩展 ,因为SOAP协议基于XML,可以通嵌入加密了的XML数据的形式来实现在消息传输的应用层灵活采用适当的加密策略。 3 XML文档的组成3.1 XML文档的序言XML文档的序言里包含了关于文档本身的元信息,而不是文档的内容。它可能包含XML声明、处理指令、注释以及嵌入的DTD或模式。3.1.1 XML声明XML文档通常都以一个XML声明开始,虽然这并不是必需的.在XML文档中,包含一个声明是好的做法,因为它可以告诉应用程序或人随后的是一段XML内容。它还能向处理程序提供关于该文档的额外信息,比如它的字符编码类型。如果在XML中包含声明,就必须将它置于文档的第一行。任何内容都不能放在XML声明前面,空格也不行。如果你不小心在声明前面放了一个空格,XML处理程序就将无法正确解析文档的内容,并且会产生错误消息。XML声明中还可以包含一些属性,这些属性提供关于版本、编码以及文档是否独立的信息:XML声明中的每个属性都是可选的,但是它们的顺序很重要。如果需要包含encoding属性,那它必须出现在version属性的后面。而standalone属性只能是声明中的最后一个属性。3.1.2 处理指令序言中还可包含处理指令(processing instruction,PI),它们将关于XML文档的信息传递给其他应用程序。XML处理程序并不处理PI,而是将它们原封不动地传递给应用程序。PI以结束。它们通常会在序言中出现,虽然它们也可出现在XML文档内的其他地方。XML声明也以;(2)注释不能包含于标签内部;(3)元素中的开始标签或结束标签不能被注释掉;(4)虽然大多数XML处理程序都会把注释传递给应用程序,但并不一定必须这么做。3.1.4 DTD和XML模式DTD和XML模式提供关于XML文档内的元素和属性如何出现的规则。也就是说,它们确定哪些元素和属性是有效的,哪些是必需的或可选的。序言中可以包含关于XML文档的声明,也可以包含一个到外部DTD或模式的引用,或是两者都包括。3.2 XML文档元素中的段XML文档中的数据存储在文档元素或根元素内。这个元素包含文档中的所有其他的元素、属性、文本和CDATA,同时也可包含实体和注释。3.21元素在XML文档中,元素有很多作用,它们(1) 可以标记内容;(2)为它们标记的内容提供一些描述;(3)为数据的顺序和相对重要性提供信息;(4)展示数据之间的关系。元素包括一个开始标签、一个结束标签和内容。内容可以是文本、子元素或是二者都有。元素的开始标签中也可包含属性。在元素内部可以放置注释。一共有四类元素:(1)空元素如果元素中不包含任何文本,那么它就是个空元素,可以以两种方式书写。(2) 仅含文本的元素有些元素仅含文本内容。、和都是仅含文本的元素:(3) 含其他元素的元素一个元素可以仅包含其他的元素。容器元素称为父(parent),被包含的元素称为子(child)。(4) 混合元素混合元素既含有文本也含有子元素。综上所述,元素有以下条件:(l) 元素必须含有开始标签和结束标签。在没有内容的情况下,才可以使用省略写法;(2) 标签名称必须符合XML命名规则;(3) 元素必须正确地嵌套。3.22属性在XML文档中,提供信息的另一种方法就是在元素的开始标签中使用属性。属性通常为它们所修饰的元素提供额外的信息。一个元素中可以出现的属性的数量是没有限制的。属性由名称/值对组成,其中值是包含于单引号或双引号中的。属性的两种通常用法是转换信息格式和指定特定的格式或编码。当元素包含属性时,常称为复合类型(complex type)元素。在同一个元素内,可以为不同的属性分别使用双引号或单引号。 请注意,不要在同一个属性中分别使用单引号和双引号,否则文档就不是合式的了。注意 从文字处理文档中剪切属性粘贴到XML文档中时要十分小心。文字处理软件通常使用小引号,而这会在XML文档中引起错误。还可以将属性改写为嵌套的子元素。现在总结一下与属性相关的规则:(l) 属性由名称/值对组成;(2) 属性值必须封装在单引号或双引号中;(3) 属性中不能含有XML标签;(4) 属性名称必须遵循XML命名规则。3.2. 3文本所有XML文档内部的文本都包含于开始标签和结束标签内部。除非该文本被标记为CDATA,那么它将会被认为是XML,从而做相应的处理。也就是说,左尖括号会被认为是某个XML标签的一部分。如果希望在文本中使用保留的字符,那么必须将它们写为字符实体。例如,可以将左尖括号写作<。保留字符也可以嵌入到CDATA中。3.2. 4CDATA段CDATA可以对文本块进行标记,这样它们就不会被当作XML进行处理。这对于包含XML保留字符的文本来说是非常有用的。CDATA段可用于在XML文档中嵌入代码,如JavaScript代码,或者加入不需要处理的内容。例如,当一个应用程序从数据库里读取数据并且将它标记在XML文档中时,它可能将所有的内容都嵌入到CDATA段中,以避免对那些保留字一个一个地进行处理。3.2. 5实体字符实体是表示单一字符的符号。在XHTML中,字符实体被用于表示一些特殊的符号,如与号&(&)和不间断空格( )。在XML文档中,可以用字符实体替代保留字符。因为所有的标签都以左尖括号开始,所以在一个元素的文本中是无法包含这个字符的。以下这些保留符号是需要注意的:(l) ,表明一个标签的开始;(2) &,表明一个实体的第一个字符;(3) xml,保留为用于对XML语言其他部分的引用。有时一些字符是不能加入到XML文档中的,也许因为这些字符不在键盘上或者它是图形字符。在这种情况下,可以使用Unicode或十六进制数字将它们以字符实体的形式加入。比如,可以将版权符号编码成或。以。每次需要在XML文档中包含这段文字时,都可以使用实体引用©right;。这使文本更容易管理和更新。4 XML的工作原理4.1 XML数据结构转换技术在XML的应用中,有的XML数据需要转换到其他结构的XML数据,为此W3C制订了描述标准化的XML数据结构转换规则的语言XSLT。XSLT是为显示和打印XML,而从XSL规范独立出来的规范,原本是描述排版信息的语言,因此,用XSLT制作的程序称为样式表。但是,XSLT也可以用于排版以外的各种用途。例如,使用了不同Schema(标记集合)的企业团体之间交换XML数据时,需要将使用了各公司独自数据格式的XML数据向双方系统共同采用的业界标准格式结构转换以后,才可能进行数据交换。在XSLT中不仅描述了转换规则,结构转换还可以交给XSLT样式表的执行引擎(XSLTProcessor)。为了跨过业界之间的障碍实现数据交换,其它文件格式的数据交换也会经常发生,尽管如此,结构转换时如果利用XSLT,可以不改程序只改变样式表就可以了。4.2 显示和打印XML数据的技术4.2.1 XML3种方法:1.用CSS定义打印和显示排版信息;2.用XSLT转换到HTML进行显示和打印;3.用XSLT转换成XSL的FO(FormatterObject)进行显示和打印。4.2.2 用XSLT改变XML数据使用XSLT,可以改变XML元素名、属性名、元素层次结构等,根据XSLT的指定,可以将XML的元素转换为HTML元素,则可以是用浏览器浏览。这种用浏览器显示XML数据的方法是最常用的方法。4.2.2 XSL是用XML描述的文件XML是一种可以详细描述商用印刷排版水平的规范,XSL排版信息的定义。用XSL指定排版信息的方法由2步组成:(1).将要打印、显示的原XML树进行结构变换,追加排版信息生成新的树结构(XSL-FO树);(2).将这个新树传递给XSL-FO对应的打印和显示引擎进行相应的操作。4.3 定义XML数据结构的技术在XML中用户可以自由的定义标记名以及与标记相关的元素及元素层次,这是XML的主要特征。为了在企业团体之间进行XML格式的数据的交换,XML数据的结构、元素的名称、元素的数据类型以及元素的亲子关系都需要仔细考虑,一定要设计成人和系统能够理解的语言。 XMLSchema在XML中,所谓的“DTD”就是Schema文件。DTD描述的Schema应用非常广泛。从SGML继承下来的DTD显然有许多不足的地方。为了解决这些问题,W3C制订了Schema语言XMLSchema。 XMLSchema中有下述DTD中不具备的特征:多个Schema复合使用XML名字空间;用XML语法描述;可以详细定义元素的内容及属性值的数据类型。由于在XMLSchema中的数据结构也都是用XML数据来表现的,与DTD相比数据量增大很多。不仅支持字符串、10进制数、浮动小数点、日期等,还支持m回以上和n回以下出现的元素(m、n为整数)的指定。例如“邮编xxxxxx”(x是字符)是邮政编码元素的格式指定等都是DTD所不能表现的内容。XMLSchema于2001年5月成为W3C的推荐规范,对XML的利用产生了重要的影响。4.4 XML的主要技术分类XML是描述内容的数据格式,在使用XML数据时,还需要XML数据的显示、打印、数据结构的变更等许多相关技术。4.4.1 处理XML数据一定要使用XMLProcessor(也就是XMLParser),把XML数据结构的检查等交给XMLParser去做。开发工程师只需将XML数据的检查工作交给XML Processor即可,集中精力开发应用程序部分,减少了不小的负担。 应用程序对接收到XML Processor传递来的XML树进行处理,向用户提供服务。此时,不管是电子商务,还是知识管理,都是定义XML数据结构的技术、显示打印XML数据的技术、XML数据结构变更技术、XML数据联接整合技术、用程序操作XML树的API和其它应用技术的组合。4.5 XML类似新闻阅读器用户在网站上订阅新闻,一般来说网站上会给出一种标志性 的东西。然后将这种标志性的东西(Feed)提交到新闻阅读器程序中。新闻阅读器接到Feed后,分析Feed文件。 然后将解析出的内容组织起来,显示到新闻阅读器当中,供用户阅读。 用户对新闻进行更新,刷新Feed。等等.5. XML的应用5.1 Web应用XML文档无疑将成为Web资源的重要组成部分,而且基于XML的文档资源使Web搜索引擎的智能化变得容易起来。除此之外,XML能够用来建立HTML所不能达到的多层Web应用,特别地,XML在Web应用中有下列用途:集成不同数据源、本地计算、数据的多种显示、支持Web应用的互操作和集成、基于语义的Data Mining。5.1.1 XML在Web数据挖掘中的应用 XML给基于Web的应用软件赋予了强大的功能和灵活性,因此它给开发者和用户带来了许多好处。XML能够使不同来源的结构化的数据很容易地结合在一起。软件代理商可以在中间层的服务器上对从后端数据库和其它应用处来的数据进行集成。然后,数据就能被发送到客户或其他服务器做进一步的集合、处理和分发。XML的扩展性和灵活性允许它描述不同种类应用软件中的数据,从描述搜集的Web页到数据记录,从而通过多种应用得到数据。同时,由于基于XML的数据是自我描述的,数据不需要有内部描述就能被交换和处理。利用XML,用户可以方便地进行本地计算和处理,XML格式的数据发送给客户后,客户可以用应用软件解析数据并对数据进行编辑和处理。使用者可以用不同的方法处理数据,而不仅仅是显示它。XML文档对象模式(DOM)允许用脚本或其他编程语言处理数据,数据计算不需要回到服务器就能进行。XML可以被利用来分离使用者观看数据的界面,使用简单灵活开放的格式,可以给Web创建功能强大的应用软件,而原来这些软件只能建立在高端数据库上。另外,数据发到桌面后,能够用多种方式显示。 XML还可以通过以简单开放扩展的方式描述结构化的数据,XML补充了HTML,被广泛地用来描述使用者界面。HTML描述数据的外观,而XML描述数据本身。由于数据显示与内容分开,XML定义的数据允许指定不同的显示方式,使数据更合理地表现出来。本地的数据能够以客户配置、使用者选择或其他标准决定的方式动态地表现出来。CSS和XSL为数据的显示提供了公布的机制。通过XML,数据可以粒状地更新。XML也允许加进其他数据,比如预测的温度。加入的信息能够进入存在的页面,不需要浏览器重新发一个新的页面。XML应用于客户需要与不同的数据源进行交互时,数据可能来自不同的数据库,它们都有各自不同的复杂格式。但客户与这些数据库间只通过一种标准语言进行交互,那就是XML。由于XML的自定义性及可扩展性,它足以表达各种类型的数据。客户收到数据后可以进行处理,也可以在不同数据库间进行传递。总之,在这类应用中,XML解决了数据的统一接口问题。但是,与其他的数据传递标准不同的是,XML并没有定义数据文件中数据出现的具体规范,而是在数据中附加TAG来表达数据的逻辑结构和含义。这使XML成为一种程序能自动理解的规范。XML应用于将大量运算负荷分布在客户端,即客户可根据自己的需求选择和制作不同的应用程序以处理数据,而服务器只须发出同一个XML文件。XML将处理数据的主动权交给了客户,服务器所作的只是尽可能完善、准确地将数据封装进XML文件中,正是各取所需、各司其职。XML的自解释性使客户端在收到数据的同时也理解数据的逻辑结构与含义,从而使广泛、通用的分布式计算成为可能。XML还被应用于网络代理,以便对所取得的信息进行编辑、增减以适应个人用户的需要。有些客户取得数据并不是为了直
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年成都文理学院单招职业倾向性考试必刷测试卷及答案1套
- 2025广东阳江阳西县融媒体中心(阳西县广播电视台)就业见习岗位2人参考题库及一套完整答案详解
- 2025年湖南常德市招聘大学生乡村医生10人参考题库及答案详解(有一套)
- 2026年皖北卫生职业学院单招职业技能测试题库汇编
- 2025年河南省事业单位联考真题试卷 公共基础知识附答案详解(黄金题型)
- 2026年九江职业大学单招职业适应性测试必刷测试卷带答案
- 民航行业知识题库及答案
- 2026年四川科技职业学院单招职业适应性考试必刷测试卷带答案
- 电芯研发招聘真题及答案
- 2025广西柳州市救助管理站招聘1人参考题库及1套参考答案详解
- 企业研究开发的组织管理制度
- QFD知识培训课件
- 山东物理创新题库及答案
- 送风施工方案
- 学堂在线 西方思想经典与现代社会 章节测试答案
- 集团电力建设业务安全生产“十四五”总结暨“十五五”规划报告范文
- 小学生安全教育培训课件
- 争当宪法小卫士课件
- 7.1《集体生活成就我》课件 2025-2026道德与法治七年级上册 统编版
- 高尔夫6电子说明书
- 集团自媒体管理办法
评论
0/150
提交评论