xml实例教程1.ppt_第1页
xml实例教程1.ppt_第2页
xml实例教程1.ppt_第3页
xml实例教程1.ppt_第4页
xml实例教程1.ppt_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主讲苏新民学院:工学院课时:56学时联系方式:sinosu教材:XML编程实例教程丘广文张文敏编科学出版社,XML编程实例教程,第一讲XML基础入门,XML是eXtensibleMarkupLanguage的缩写,意为可扩展的标记语言,1.1什么是XML,1.1.1标记语言1.1.2SGML1.1.3HTML1.1.4XML1.1.5XML与SGMLHTML的关系,1.1.1标记语言,“标记”是一种传输元数据(即关于数据集本身的信息)的方法。”标记”由起始与结束标签构成。标记语言使用文字串或标记来界定和描述这些数据。XML与HTML都是一种标记语言,两者都是由同一种语言SGML(标准通用标记语

2、言)发展而来.,1.1.2SGML,SGML是一种非常强大(当然也相当复杂)的标记语言SGML文件是由标记和内容组成的简单ASCII数据串流1986年,SGML被国际标准化组织(ISO)接受为国际性的数据存储和交换的标准SGML既要用户制定标记,又要制定排列方式的规则,因此太复杂、太麻烦,由SGML派生出了HTML与XML,1.1.3HTML,为了更好的在网络上交流信息,以SGML语言为基础,描述Web页信息的HTML诞生了HTML提供了固定的预定义元素集,可以使用它来标记一个典型、通用的Web页的各个组成部分。显示HTML页的浏览器可以识别这些标准元素中的每一个元素,并且知道怎样格式化和显示

3、它们。一个例子:.xml例子第一章1-1.html,尽管HTML的使用范围特别大,但是HTML仍然无法适用于很多领域:HTML缺乏标记音乐乐谱或算术等式集的元素。HTML页中的信息不能通过排序、过滤、查找,以及其他方法来使用这些信息。解决这些限制的方法是XML。,1.1.4XML,XML的定义只是由框架语法组成。当创建一个XML文档时,不必使用有限的预定义元素集,而是创建自己的元素,并赋予任意你喜欢的名称这就是扩展标记语言中术语“扩展”的意义。因此,你可以使用XML描述任意类型的文档,从音乐乐谱到数据库。一个例子:.xml例子第一章1-2.xml,1.1.5XML与SGMLHTML的关系,SG

4、ML代表标准通用标记语言StructuredGeneralizedMarkupLanguage),是所有标记语言的母语言HTML着重于数据的显示,而XML着重于数据结构的描述,至于数据的显示可以搭配适当的格式,将数据结构与数据显示分隔开来,可以简化XML文件的复杂度,也使得XML的应用更加宽广。,目前,XML不但没有代替HTML,还与HTML一起使用,并且极大地扩展了Web页的能力,使Web页可以:a.传递任意类型的文档。b.用其他方法排序、过滤、重新排列、查找以及管理信息。c.显示高度结构化的信息。总之,XML可以与HTML进行互操作。分别用XML和HTML实现的人事档案,.xml例子第一章

5、html1-1.html.xml例子第一章html1-2.html.xml例子第一章html1-3.html.xml例子第一章ex1-1.xml,1.2XML的结构和语法,1.2.1XML文档结构1.2.2XML标记语法1.2.3XML文档语法1.2.4建立规范有效的XML文档,1.2.1XML文档结构,一个XML文档是由一下几个部分组成的:序文(prolog),可包含XML宣告、注释、处理指令等文档的主体(body)由一个或多个文档元素组成,元素之间可以嵌套成层次树可选的文档尾,基本上没什么用,因为一般的处理程序处理到根元素的结束标签就结束处理了。,序文:XML宣告XML宣告必须显示在每个X

6、ML文件的第一行注释注释不可以包含在其他标记中,注释中也不可以内含其他的注释或是内含(-)理指令提供了XML处理器传递给应用的信息,文档元素:在XML文档中,元素指出了文档的逻辑结构,并且包含了文档的信息内容(在示例文档是图书的信息,例如标题、作者名和价格)。一个典型的元素有起始标签、元素内容和结束标签。元素的内容可以是字符数据、其他(嵌套的)元素或者两者的组合。下面是一个简单的元素:,一个BOOK元素包括一系列的嵌套元素,如果用节点表示元素,连线表示包含关系,则元素之间有树状结构关系。,交易清单的例子:.xml例子第一章ex2.xml,1.2.2XML标记语法,XML使用尖括号来界定标记以小

7、于号()结尾。所有的XML标记都是大小写敏感的,其中包括元素的标记名和属性值,之所以大小写敏感,主要是满足XML国际化的设计目标和简化处理过程的需要。大多数非英语语言并不把字母表分成若干种写法,即不同的符号就表示不同的意思。,关于字符:由于XML是要在全球范围内使用的,所以不能局限于7位的ASCII码字符集。XML指定的字符均在16位的Unicode2.1字符集(统一代码字符集)中定义一般在文件中如果要输入的字符并不是键盘中找得到的,只要它是属于Unicode(通用字码),就可以通过字符参照的方式输入,XML解析器会将字符代码(CharacterCode)转成对应的字符。字符参照的语法格式为:

8、启动字符映射工具:开始-附件-系统工具-字符映射表,特殊字符的使用:实体参照(EntityReference)XML默认有五个实体参照见右表;元数的属性中,也同样可以使用实体参照;,合法的XML字符包括三个ASCIIC0控制符,所有普通的ASCII可显示字符,以及所有其他统一代码字符值(用十六进制表示)可参见下表:,关于标记命名:XML文件中也允许使用中文,至于一般常用的英文标记其命名原则如下:英文字母大小写视为不同的。例如:这三个标记是不同的标记标记中不可以含有空格。名称字符串不可以XML三个字母为开始(不管大小写均不可以),保留给XML系统使用。,名称字符串可以一般的英文字母或底线(_)开

9、始。除了开始字符外,其他可以使用数字(1,3)、点(.)或是连接线(-)。,下面是合法的标记:,下面是不合法的标记:,1.2.3XML文档语法,元素属性CDATA处理指令事例,元素:,XML文件中的每一个元素(Element)在经过解析后,会对应到XML树状结构的一个节点(Node)。每个XML文件中必须要有一个根元素(RootElement)而且只能有一个。根元素下可以有其他的子元素或文字,当然子元素下还可以有子元素和文字,如此构成XML文件的树状结构。,XML文件中的元素必须以起始标记和结尾标记来定义,该元素所含的文字内容,则显示在起始标记和结尾标记之间。格式为:该元素的文字内容有时候一些

10、元素不含任何的子元素或是文字内容,用空标记(EmptyTag)来定义。格式为:或者,在XML文件中,如果含有多个元素,那么这些元素之间的起始标记和结尾标记不可以交错出现,必须满足嵌套排列。例如下面的代码是错误的:李四男,属性,在很多情况下,我们会希望将某些信息附着在元素上,它们与元素本身包含的信息内容有所不同。我们利用属性(attribute)来做到这一点,它们都包括一个名称-值组合,使用的格式有如下两种形式:attribute_name=“attribute_value”attribute_name=attribute_value在起始标记或空标记中属性只允许有一个实例存在也就是attrib

11、ute_name只能出现一次。任何一个受保护的标记字符(”。CDATA区段可以放置在任何字符数据可以出现的地方,也就是说,它位于元素的内容中而不是在XML的标签中。,处理指令,格式:处理指令target是必须的部分,而且必须是有效的XML名称,它用来指明哪个应用程序(或者其他对象)需要PI的帮助。PI的instruction部分只不过是一个字符串表示,它可能包含任何有效的字符,除了“?”(因为这是PI的结束符)。处理指令可以添加到XML文件中标签以外的任何地方,即不能出现在标签中,也可以出现在文件形态定义中。,例如:,处理指令目标,处理指令,例子,.xml例子第一章ex3.html.xml例子第一章ex3.css.xml例子第一章ex3.xml,1.2.4建立规范有效的XML文档,对于不含有调用任何外部文件的XML文件,也就是说standalone属性为yes的文件,Well-Formed的XML文件必须

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论