XML培训.ppt_第1页
XML培训.ppt_第2页
XML培训.ppt_第3页
XML培训.ppt_第4页
XML培训.ppt_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

yu kun 2010-08-16,xml基础知识,xml语言简介 xml文档的组成 xml的语法规则 元素的语法 xml文档的有效性 dtd简介 xml与数据库实践,课程简介,xml是extensible markup language的缩写,即可扩展标记语言。它是一种用来创建标记的标记语言。1996年,万维网协会(或者叫w3c,)开始设计一种可扩展的标记语言,1998年2月,xml1.0成为了w3c的推荐标准。这种xml语言继承了sgml的规范,standard generalized markup language (sgml)是一种基于记号文本的语言。xml还保持了对现有的面向sgml系统的向下兼容性。xml将sgml的灵活性和强大功能与已经被广泛采用的html结合起来,简化了计算机对文档和数据交换的处理,使得现有的协议和软件更为协调,从而简化了数据的处理和传输。,xml简介,使用xml标记语言可以做到数据或数据结构在任何编程语言环境下的共享。例如我们在某个计算机平台上用某种编程语言编写了一些数据或数据结构,然后用xml标记语言进行处理,那样的话,其他人就可以在其他的计算机平台上来访问这些数据或数据结构,甚至可以用其他的编程语言来操作这些数据或数据结构了。这就是xml标记语言作为一种数据交换语言存在的价值。,xml简介,xml和html都是用于操作数据或数据结构,在结构上大致是相同的,但它们在本质上却存在着明显的区别,它们的区别主要有以下几点: 语法要求的不同 在html中不区分大小写,在xml中对大小写要求非常严格。 标记不同 html使用固有的标记,而xml没有固有标记。 作用不同 html用于显示页面,而xml用于描述页面内容的数据或数据的结构。html把数据和显示合在一起,在页面中把这些数据显示出来,而xml则将数据和显示分开。,xml和html的区别,xml_example.xml html_example.html,xml示例,每种语言的产生都能完成某些特定的功能,xml作为一种标记语言也不例外。xml最大的优势在于它能对各种编程语言编写的数据进行管理,使得在任何平台下都能通过解析器来读取xml数据。它的优势可归纳为以下几点: 数据的搜索 在xml中可以提取文档中任何位置的数据 数据的显示 xml将数据的结构和数据的显示形式分开,根据需要使数据呈现出多种显示方式。如html、pdf等格式。 数据的交换 xml标记语言的语法非常简单,可以通过解析器在任何机器上解读。并可以在各种计算机平台上使用。逐渐成为一种数据交换的语言。,xml的优点,xml文档属于纯文本文件,该文档一般如下四部分组成: 声明 定义 注释 标识及其内容 *前三项都是可选的。,xml文档的组成,一般 xml的语法规则大致可归纳为以下几点: 结束标记不可忽略 在html中某个标记有起始标记,却可以没有结束标记,但在xml文档中却不可以。 区分大小写 在xml中严格区分大小写,主要表现在开始标记和结束标记的大小写必须相同。还包括文档的声明部分和文档类型定义部分的大小写区分。 正确的嵌套包含,xml的基本语法,元素是xml文档的重要组成部分,在xml文档中必须存在元素。xml文档的元素一般是由标记头、标记末和标记间的字符串数据构成,如下代码所示: this is test xml文档中的第一个元素被称为根元素,在任何一个xml文档中有且只有一个元素被称为根元素。其余所有的元素都是子元素,子元素必须正确的嵌套在根元素中。 标记间的字符串数据就是该元素的值,在xml中,如果元素的值中存在空格,那么这些空格将按原样解析出来,xml中的元素,属性是用来修饰某个元素的,如: this is test 关于元素的属性,需要注意以下问题: 属性的值必须用引号括起来,如: attribute1=“aa” 或attribute3=aa ; 元素的属性以名和值成对出现; 用来修饰同一个元素的属性的属性名不能相同 ; 属性值不能包含“&”、“”、“”等字符。,元素的属性,结构良好的xml文档 如果某个文档符合xml语法规范,那么我们就说这个文档是“结构良好”的文档。 有效的xml文档 所谓有效的xml文档是指通过了dtd( document type definition )验证的,具有良好结构的xml文档,在此大家要明白xml文档可分为结构良好的xml文档和有效的xml文档,以及他们之间的关系。即具有结构良好的xml文档并不一定就是有效的xml文档,但一个有效的xml文档必定是一个结构良好的xml文档。,xml文档的有效性,实践,制作一个结构良好的的xml文档 (内容:eid,full_name,mail,tel,remark),在信息的高速交流中,不同领域之间的信息交换越来越紧密,如何才能保证这些不同领域之间的信息可以更容易且更有效率地交换成为我们首要关注的问题。为了解决这个问题,就需要不同的领域来针对领域的特性制定共同的信息内容模型(content model),然后再通过这个共同的内容模型来标识信息。而dtd就是一种内容模型。 dtd(文档类型定义)可以定义合法的xml文档结构,它使用一系列合法元素来定义文档的结构。dtd分为内部dtd和外部dtd,所谓内部dtd是指该dtd在某个文档的内部,只被该文档使用。外部dtd是指该dtd不在文档内部,可以被其他所有的文档来共享。dtd文档与xml文档实例的关系可以看成是类和对象的关系。,dtd的简介,通过 dtd,您的每一个 xml 文件均可携带一个有关其自身格式的描述。 通过 dtd,独立的团体可一致地使用某个标准的 dtd 来交换数据。 而您的应用程序也可使用某个标准的 dtd 来验证从外部接收到的数据。 您还可以使用 dtd 来验证您自身的数据。,dtd的优势,内部的 doctype 声明 外部的doctype声明 ,dtd申明语法,根元素的声明 每个xml文档都只有一个根元素,其它的子元素都包含在该根元素中。因此在dtd中对根元素的声明是必不可少的。根元素声明的一般形式如下: doctype是“document type”(文档类型)的简写,doctype声明必须放在文档最顶部,在所有代码和标识之上,doctype声明是必不可少的关键组成部分。dtd语法要求doctype必须要大写,而且doctype和元素之间必须要有空格隔开。如在以上代码中doctype和根元素root之间要有空格隔开。,元素的定义,子元素的声明 element是关键字,后面跟元素名和元素类型,中间用空格分开。元素类型一般分为以下几种: empty #pcdata any 其他,元素的定义,empty 属于empty类型的元素没有字符串值,即该元素不包含任何内容,但可以有一个或多个属性。如下: ,元素的定义,#pcdata #pcdata表示该元素可以包含经过xml解析器解析过的文本数据。如下: zhang shan ,元素的定义,any any类型表示可以包含多个子元素且不受限制,也可包含字符串数据。但any一般用在对根元素的声明中。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论