版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、XML知识简介,2006-08-16,XML的定义,XML(eXtensible Markup Language) 可扩展的标记语言 一套定义语义标记的规则,这些标记将文档分成许多部件并对这些部件加以标识。,XML的起源和目标,XML是1996年由W3C (World Wide Web Consortium)赞助,由XML工作组开发的。 目标:1可以直接在因特网上使用 2可以支持更广泛的使用 3与SGML兼容 4便于程序处理XML文档 5尽量减少XML文档的不确定性 6便于人类阅读,条理清晰 7设计便捷 8形式化、简洁 9XML文档易于创建,SGML、HTML、XML,SGML、HTML是XM
2、L的先驱。 SGML“标准通用置标语言”(Standard Generalized Markup Language),是国际上定义电子文件结构和内容描述的标准,是一种非常复杂的文档的结构,同XML相比,定义的功能很强大,缺点是它不适用于Web数据描述,软件价格非常昂贵。 HTML“超文本标识语言” ( HyperText Markup Language)它的优点是比较适合web 页面的开发。但它有一个缺点是标记相对少,只有固定的标记集如、等。缺少SGML 的柔性和适应性。不能支持特定领域的标记语言,如对数学、化学、音乐等领域的表示支持较少。举个例子来说,开发者很难在webpage 上表示数学公
3、式、化学分子式和乐谱。 XML结合了两者的优点、摒弃了其缺点。,SGML、HTML、XML,XML是SGML的一个子集。 由XML语言描述的一系列数据形成XML文档。 XML文档由一系列实体entities构成,可以是字符数据,也可以是格式数据 XML处理器用来接收读取XML文件,XML是什么,XML是元标记语言 用户可以定义自己需要的标记 可以选择XML的元素名称,以便使其在附加的上下文中具有额外的意义 HTML预定义标记语言 XML描述的是结构和语义,而不是格式化 XML标记描述的是文档的结构和意义。它不描述页面元素的格式化。可用样式单为文档增加格式化信息。文档本身只说明文档包括什么标记,
4、而不是说明文档看起来是什么样的。 作为对照,HTML文档包括了格式化、结构和语义的标记 就是一种格式化标记,它使其中的内容变为粗体。,示例, book name author name publisher name isbn number - HTML book name author name publisher name isbn number -XML,XML的特点,设计与特定领域有关的标记语言 允许各种不同的专业开发与自己的特定领域有关的标记语言 自描述数据 使用的是非常简单的数据格式 应用间交换数据 易于阅读和编写、不是专有格式、功能强大 结构化和集成的数据,XML的发展,在专业领域
5、中出现了Web标记语言的许多项目,著名的有CML化学标记语言,由Peter Murray-Rust 开发,同时开发了第一个通用xml 浏览器Jumbo。在数学方面,包括IBM公司在内都在致力开发MathML。 1997年4月,出版了xll的第一个版本。当Xll完整实现时,将比html 和当前浏览器所达到的链接水平更复杂,更强大。 1997年8月,Microsoft公司和Inso公司引入xsl。由于xml是纯结构和语义的,需要描述单个元素格式方法。可以使用html的CSS;另一种方案是xsl. 1998年1月,Microsoft 公司出版发行了msxsl程序。可以利用xsl表和xml文档创建能被
6、IE4 识别的html页面。1998年2月,WC发布了xml1.0的正式版本。 出现了DOM(Document Object Model),XSLT(XSL Transformation)等新名词,xml的应用软件也有了飞速的发展,Microsoft、IBM、Breeze、Stilo等公司纷纷推出了自己的解析器或开发平台。,XML应用简介,编辑器:Notepad、 UltraEdit、XMLSpy XML将文档的内容与文档的外观相分离。首先开发内容,然后再用样式单将格式附加其上。将内容与样式分开是非常有效的技术,这既改善了文档内容也改善了文档外观。对于大型复杂的文档,xml 是一种理想语言,不
7、仅允许指定文档中的词汇,还允许指定元素之间的关系 XML用于不只是一种数据格式的话,就需要与多种相关的技术相互作用。这些技术包括为了向后兼容老式的浏览器的HTML、CSS(Cascading Style Sheet,级联样式单)和XSL(eXtensible Style Languages,可扩展的样式语言)、URL和URI、XLL( eXtensible Linking Language,可扩展的链接语言)和Unicode字符集。,XML小结,一种能够为特定文档和领域创建标记语言的元语言。 XML标记描述了文档内容的结构和语义,而不是内容的格式。格式是在另外的样式单中描述的。 XML的起因是
8、,用户受到SGML复杂性的挫伤和HTML的不充分。 XML是用编辑器创建的,由语法分析程序来读取,而由浏览器来显示的。 在Web上的XML是建立在由HTML、级联样式单和URL提供的基础之上的。 许多支持技术处于XML之上,包括XSL样式单、XLink和XPointer。这些技术使用户可以比只使用CSS和URL完成更多的任务。 XML并未彻底完成。它随时会发生变化或是扩展,而在当前的XML软件中可能会遇到这样或那样的错误。,第一个XML文档, /声明 /开始标记 Hello XML! /元素内容 /结束标记 XML文件的扩展名.xml,第一个XML文档, 处理指令以结束,在 自定义元素名,通常
9、要和元素所代表的意义相关 元素中还可以有属性,XML文档结构,有物理结构和逻辑结构。 从物理结构上讲,文档由一些叫做实体的单位组成,一个实体可以包含另一些实体。文档从一个根(root)开始,或者叫文档实体。 从逻辑结构上讲,文档由声明、元素、注释、字符引用、处理指令构成,所有这些都有清晰的标记显示在文档中。物理结构和逻辑结构都要符合规范要求。,XML文档中的标记,标记有三类意义:结构、语义和样式。结构将文档分成元素树。语义将单个的元素与外部的实际事物联系起来。而样式指定如何显示元素。,XML文档内容,可以包含一个或多个元素,但只能有一个根元素,其他元素都在根元素内部。一个元素的开始标记如果在另
10、一个元素的内部,则它的结束标记也要在这个元素的内部,即不能出现元素的交叉。,XML文档中的元素,元素是XML文件内容的基本单元。从语法上讲,一个元素包含一个起始标记、一个结束标记以及标记之间的数据内容。其形式是: 数据内容 - /空标记 元素可以包含子元素 数据内容 也可以包含属性。属性由联结在一起的属性名和属性值对表示。属性出现在元素开始标记或空元素标记中。 数据内容 ,文档中元素的命名,元素命名区分大小写。 命名可以由字母或一小部分标点符号开头,接下来可以是字母、数字、连字符、下划线、冒号、句号。但XML和冒号在XML文档中有特定的含义,一般不作命名。 &、在XML文档中有特定意义,使用时
11、需要有实体引用。,XML中的实体引用,在XML中,起始和结束标记之间出现的所有合法字符都被忠实地传给XML处理程序。 为了避免把字符数据和标记中需要用到的一些特殊符号相混淆,XML还提供了一些有用的实体引用。 实体引用的作用是,当在字符数据中需要使用这些特殊符号时,我们采用它的 实体引用来代替。这些特殊的XML实体引用包括: ,XML文档中的注释,注释可以出现在文档的任何地方,用来表示 在注释文本中不能出现字符-或字符串-,XML处理器可能把它们和注释结尾 标志-相混淆。 不要把注释文本放在标记之中。类似地,不要把注释文本放在实体声明中,也不要 放在XML声明之前。XML声明永远作为XML文件
12、中的第一行。 注释不能被嵌套。在使用一对注释符号表示注释文本时,要保证其中不再包含另一 对注释符号。,形式良好的XML文档满足条件,文档的开始必须是XML声明。 含有数据的元素必须有起始标记和结束标记。 不含数据并且仅使用一个标记的元素必须以/结束。 文档只能包含一个能够包含全部其他元素的元素。 元素只能嵌套不能重叠。 属性值必须加引号。 字符、和。,三个XML文档示例,员工通讯录 nameaddress.xml 图书馆图书登记 booklist.xml 新闻语料 newscorpus.xml,XML文档验证,数据对象如果符合规范所定义的格式,我们就说它是一个格式良好(well-formed)
13、的XML文档,如果格式良好的XML文档符合某些特定的约束,我们就说它是有效的(valid)。 DTD和SCHEMA DTD (Document Type Definition ) 文件类型定义,XML文档格式化,XML可以定义信息的内容,却没有定义信息该如何表达,这实际上就是XML的长处,它把内容和形式分离了,这样同一个内容可以有不同的表达,增强了文本的重用性 XML内容的表达就是通过XSL(XML Style Language)和CSS(Cascading Style Sheets 层叠样式表)来实现。,其他相关概念,DOM 即Document Object Model, 它把XML文档的内容实现为一个对象模型,简单的说就是应用程序如何访问XML文档,W3C的DOM Level 1 定义了如何实现属性、方法、事件等。 XSLT即XML Stylesheet Language Transformation。1999年的11月通过了XSLT。XSLT是一种用来进行XML文档间相互转化的语言,利用XSLT我们可以从一个已经定义的XML文档抽取我们需要的数据,组成不同的形式,可以是XML, HTML和各种不同的SCRIPT。,其他相关概念,Xpointer和Xlinks类似于HTM
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 西湖大学《行政秘书学》2024-2025学年第二学期期末试卷
- 长沙师范学院《社会学概论B》2024-2025学年第二学期期末试卷
- 海尔会计内部控制制度
- 混凝土内部管理制度
- 烤漆内部环保管理制度
- 煤矿内部监控管理制度
- 煤矿环保内部培训制度
- 环保行政审批内部制度
- 甲方内部工程管理制度
- 监理单位内部控制制度
- 成都高投集团招聘笔试题
- 第1课 身心健康很重要 课件 2025-2026学年道德与法治二年级下册统编版
- 2025至2030中国农业无人机市场供需格局及政策导向深度研究报告
- 2025年江西生物科技职业学院单招职业技能考试题库附答案解析
- VDA 19.1 装配技术清洁度检测培训课件
- 汽车起动机课件
- 2025-2026秋期末考试质量分析报告:剖析考试数据查找薄弱环节优化教学策略促提升
- 2025年华电校招要笔试及答案
- 2025年湖北襄阳特长生自主招生数学试卷真题(含答案详解)
- 南瑞集团在线测评试题
- 学校德育活动评估标准体系
评论
0/150
提交评论