XML课件2.ppt_第1页
XML课件2.ppt_第2页
XML课件2.ppt_第3页
XML课件2.ppt_第4页
XML课件2.ppt_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章XML简介与语法,2.1 目标 2.2 XML的概述 2.3 XML文档结构 2.4 XML语法 2.5 满足Well-Formed的XML文件,目 标,理解 XML概述 掌握 XML语法,XML概述,XML 是Extensible Markup Language的缩写,中文含义为“可扩展的标记语言”。 XML是一种标记语言 是一种可扩展的标记语言 标记语言:指在普通文本中加入一些具有特定含义的标记(Tag),以对文本的内容进行标识和说明的一种文件表示方法。 目的:对文档的内容进行整理、细化,以方便察看和查询,XML的发展 1969年,IBM的研发人员发明了第一种现代标记语言通用标记语言

2、GML,他是一种自参考的语言,可以用于标记任何数据集合的结构,同时也是一种元语言能够描述其他语言机器语法和词汇表的语言。后来成为了标准通过标记语言SGML。 86年被国际标准化组织接受成为国际性的数据存储和交换的标准。 功能虽然强大,但是标签的定制是很复杂的 96年万维网协会W3C,设计出了一种新的可以扩展的标记语言 实现GML的灵活性和强大功能 集合HTML一起使用 XML曾经被人成为“Web上的ASCII码” 98年2月,XML1.0成为了W3C的推荐标准 是一种可以用来创建自己的标记的标记语言,XML概述,XML文档结构,XML文档结构,前言区 XML声明 XML声明必须显示在每个XML

3、文件的第一行 注释 处理指令 提供了XML处理器传递给应用的信息 ,主体区 在XML文档中,元素指出了文档的逻辑结构,并且包含了文档的信息内容 一个典型的元素有起始标签、元素内容和结束标签。元素的内容可以是字符数据、其他(嵌套的)元素或者两者的组合。 下面是一个简单的元素:,XML文档结构,该XML文件出现标记错误,应该是,XML文档结构,例如:,XML文档结构,标记语法 标记 标记的命名规则 元素 元素 属性 字符引用和实体引用 字符引用 实体引用 注释 CDATA,XML语法,XML语法,XML标记主要由一下三个部分组成 标记起始字符“” 标记的命名规则 必须以字母、下划线(_)或冒号(:

4、)开头 后面可以跟有效的名字符,有效名字符除了前面的,还包含数字、连接符(-)、句点(.) 英文字母大小写敏感的 名称不能含有空格,名称中不能有字符串“xml”,“XML”或任何以次顺序排列的这三个字母的组合。W3C保留对三个字母的命名的使用权。,下面是合法的标记: ,下面是不合法的标记: ,XML语法,XML语法,Xml中标记种类 在xml中有开始标记就必须有对应的结束标记。起始标记和结束标记间必须有内容 XML 如果是空标记或是空元素 如果对应的标记间无任何的内容,既无字符数据又无其他的标记,则成为“空标记” 空标记有两种表示方法 ,属性设置 在XML中可以为元素加上属性,同一个元素不可以

5、拥有两个相同的属性名称,但是不同的元素则可以有相同的属性名称。 属性设置方法格式如下: ,XML语法,元素 元素相当于盛放了XML文档内容的容器。 XML中所有的“内容”都必须被各样、大大大小小小的容器封装起来。 一个完整的XML文件就是由这些不同的元素组成的,且形成一个元素树。,XML语法,元素的嵌套 XML允许由简单的元素进行合理的排列、嵌套来组成一个复杂的xml文件。 LX2000 128M 15XGA 21000RMB LX2000 PIII600 ,XML语法,嵌套也必须符合一定的规则: 所有XML文档都是从一个根文档开始 文档中所有其他元素都包含在根元素中 包含在根元素中的第一个元

6、素为根元素的子元素,如果不止一个子元素,且子元素没有嵌套其在第一个子元素内,则这些子元素互为兄弟元素。 子元素还可以包含子元素 包含子元素的元素成为分枝,没有子元素的称为树叶,XML语法,根元素 树根,子元素 树叶,子元素 分枝,子子元素 树叶,子子元素 树叶,子元素 分枝,XML语法,XML语法,XML文档树状结构图,属性是元素的可选组成部分,其作用是对元素的附加内容信息进行描述,由“=”分隔开的名称-数值对构成; 内容 2200 同一个元素不能有多个同名的属性 属性值是被双引号或者单引号包含起来的字符串。如果字符串包含有双引号,则需要使用单引号进行界定。例如: ,XML语法,XML语法,X

7、ML中的关键字符: 在xml中有些字符用于构成xml的置标,如,”,&等。 如果在文档的内容中也包含了这些特殊字符,不加处理的话,解析器将把他们解释为置标的一部分,这将引起置标和内容的混乱。 实体引用 字符引用,实体引用(Entity Reference) XML默认有五个实体引用见右表; 元数的属性中,也同样可以使用实体引用; 用户还可以自定义实体引用;,XML语法,字符引用 用Unicode编码数字代替字符的机制,称为“字符引用”。 如果文件中要输入的字符并不是键盘中找得到的,只要它是属于Unicode(通用字码),就可以通过字符引用的方式输入,XML解析器会将字符代码(Character

8、 Code)转成对应的字符。,XML语法,字符引用 两种形式: 一种用十进制Unicode代码表示,以“ 其中:nnnn为字符代码(Character Code),XML语法,XML 语法,注释 在xml中的注释方法为“”,加入注释 XML文件中也可以加入注释,以方便一般人阅读该XML文件。 格式为: 当XML解析器读取到注释,它会自动略过该注释中的文字。 注释的位置 注释在XML文件中,并不限定在主体区显示,它也可以出现在前言区,也就是说注释可以加在XML文件的根元素之前。,XML语法,由于XML声明必须显示在每个XML文件的第一行,所以如果你加入的注释是在XML声明之前,将导致错误的产生。

9、 例如: 杜浩翠 女 ,XML语法,XML中的注释不可以包含在其他标记中,注释中也不可以内含其他的注释。 例如:下面是不正确的注释 - ,XML语法,CDATA标记 若描述的数据中包含很多特殊符号,利用XML所提供的实体引用或是字符引用,处理起来还是麻烦。 XML提供了CDATA标记来标识文字数据;CDATA标记基本语法是,其中“”是任何字符串,只要不包含字符串“”即可。CDATA标记之间不能嵌套,字符串“”之间不能有空格或者换行符。 当XML解析器处理到CDATA标记时,它会不解析该段中的任何符号或标记,只将原数据原封不动传递给应用程序。CDATA标记的语法结构如下:,或是,XML 语法,例

10、如: The price is 22000 ,XML 语法,满足Well-Formed的XML文件,对于不含有调用任何外部文件的XML文件,也就是说standalone属性为yes的文件,Well-Formed的XML文件必须满足以下的八项规则: XML文件的第一行必须是XML声明。 元素的起始标记和结尾标记必须成对出现。 空标记必须以结尾。 必须有一个根元素包含所有的其他元素。 所有标记必须满足嵌套排列,不可以交错排列。 属性值必须以双引号(”)括起来。 只使用5个默认的实体引用(Entity Reference)。 使用开始一个标记,使用&开始一个实体引用。,编写XML文件常见的错误如下: 漏掉起始或结尾标记。 忘了声明XML版次。 忘了加入根元素。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论