版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
XML语言及相关技术应用目标章节目标:
通过本章学习,你应该能够:了解HTML与标记语言理解什么是XML
了解从HTML到XML的发展了解XML的优点及应用了解XML相关技术标准引言超文本标记语言(Hyper-textMarkupLanguage,HTML)是当今最流行、应用最广泛的一种标记语言,遗憾的是HTML存在许多致命的弱点。1996年由万维网联盟(WorldWildWebConsortium,W3C)发起,一群从业界到学院的众多标记语言专家,立足为Web开发一种简化版本的标准通用标记语言(StandardGeneralizedMarkupLanguage,SGML)。到1998年2月,W3C正式确定XML1.0规范。XML集HTML和SGML的优势于一身,具有易于编辑、便于管理、适于存档、容易查询等诸多优势,已经成为网络发展的新一代标准。HTML与标记语言在介绍HTML、XML之前,先介绍一下“标记”的含义。标记——标注说明之意。也就是为了方便处理的目的,在数据中加入一些附加信息,对某一特定对象起到标注说明的功能,这些附加信息就称为标记。超文本标记语言(Hyper-textMarkupLanguage,HTML),就是用来定义网络Web上文字、图像及声音等的显示及格式的一种标记语言。每当我们在浏览器里打开一个网页时,便从网上获取一个HTML文件,然后通过浏览器解析成我们熟悉的可视化界面HTML的基本结构<HTML>
<HEAD>头部信息</HEAD><BODY>文档主体,正文部分</BODY></HTML>其中<HTML>在最外层,表示这对标记间的内容是HTML文档。<HEAD>之间包括文档的头部信息,如文档总标题等,若不需头部信息则可省略此标记。<BODY>标记一般不省略,表示正文内容的开始。『例1-1』一个简单的HTML文档<HTML><HEAD><TITLE>欢迎光临我的主页</TITLE></HEAD><BODY><CENTER><BR><H2><FONTface="楷体_GB2312"COLOR=RED>Hello,XML!</FONT></H2><HR></CENTER></BODY></HTML>标记语言家族1969年,世界上第一种计算机使用的现代标记语言通用标记语言(GeneralizedMarkupLanguage,GML)由IBM的研究人员EdMosher.Ray
Loric和CharlesF.Goldfarb发明。几十年的完善和改进,由GML发展成为了SGML(StandardGeneralizedMarkupLanguage,SGML)1986年,SGML被国际标准组织(InternationalStandardOrganization,ISO)接受为国际性的数据存储及交换的标准,并收录在ISO8879当中。标准通用标记语言(SGML)通过名为文档类型定义(DocumentTypeDefinetion,DTD)的规则集合创建许多的标记语言。HTML和XML就是标准通用标记语言SGML所创建的标记语言,属于SGML的子集。自从XML诞生以来,又有一大批用XML定义的新的标记语言随之诞生,它们有的仍处在草案阶段,还有一些已经由W3C推荐成为正式标准,开始在各个领域发挥着它们、同时也是XML的巨大优势。XML的来源XML有两个先驱SGML和HTML,这两个语言都是非常成功的标记语言,但是他们都在某些方面存在着与生俱来的缺陷。XML正是为了解决它们的不足而诞生的。SGML是一种非常强大,非常复杂的标记语言,它已经被美国政府及其合同商、大型制造公司、信息技术发布者等广泛采用。但是SGML实在是太复杂了,要使用它需要大量的资金,使得它的应用还是非常的狭窄。HTML免费、简单,而且它获得了广泛的支持。不幸的是,HTML有许多致命的弱点。正因为如此,人们开始致力于描述一个新的标记语言,它既要具有SGML的强大功能和可扩展性,同时又要具有HTML的简单性。
XML1.0规范成为W3C的推荐标准。标志着一个崭新而大有前途的标记语言诞生了XML的制定目标在制定XML标准之初就确定了它的目标,下面是XML1.0标准中描述的制定XML的目标:XML应该可以在Internet互联网上直接使用XML应该支持各种不同的应用方式XML应该与SGML兼容XML文档的处理程序应该容易编写XML中的可选项应该尽可能少,理想状况下应为零XML文件应该具清晰明了,可读性强XML应易于设计XML设计的标记语言应该正式、简洁XML文件应该容易编制XML标记的简洁性较为次要XML概述XML(eXtensibleMarkupLanguage),可扩展标记语言。它是一种可以自行创建标记的置标语言。XML,是一种用于描述和构造独立于应用程序逻辑的通用语法。XML可以为特定行业和应用程序定义无限制的语言。
XML1.0语言版本是万维网联盟(W3C)组织于1998年2月创建的,用以克服HTML的局限性。XML是一种元置标语言,程序开发人员可以根据它所提供的规则为特定行业和应用程序制定所需要的标记语言。如矢量图形的SVG,用于表现多媒体效果的SMIL,用于电子书的OEB,用于手机上网的WML,都是通过XML为特定的行业所定义标记语言。XML创建新的标记语言过程那么,当我们需要通过标记将有用的信息告知一组用户时,也就是说将创建一种新的标记语言时应该具备:(1)我们必须有一个标准,用它来描述什么是有效的标记。(2)我们还要有一个标准描述每个标记的具体含义。『例1-2』创建一套标记用于存放联系人的相关信息。(1)确定描述数据的有效的标记假如要创建一套新的标记语言,以这个标记语言定义一些标记来描述联系人的相关信息,并且这些标记还代表了一定的语义。所以,首先我们得先设计好用什么标记来界定数据。下面就是一个存放联系人相关信息的XML文档。描述联系人的相关信息的XML文档<?xmlversion="1.0"encoding="GB2312"standalone="no"?><!DOCTYPE联系人列表SYSTEM"lxr.dtd"><联系人列表><联系人><姓名>张三</姓名><ID>001</ID><公司>A公司</公司><EMAIL>zhang@</EMAIL><电话>(010)62345678</电话><地址><街道>五街1234号</街道><城市>北京市</城市><省份>北京</省份></地址></联系人></联系人列表>(2)确定描述每个标记的具体含义在XML中,通过文档类型定义(DocumentTypeDefinition,DTD)或Schema来描述标记的语法。也就是说,通过DTD或Schema来描述什么是有效的标记,确定标记的含义,从而进一步定义标记语言的结构。(关于DTD和Schema的内容在后续章节中讲解)下面就是一个让本例中的XML文档中的标记合法化的DTD定义:<?xmlversion="1.0"encoding="GB2312"?><!ELEMENT联系人列表(联系人)*><!ELEMENT联系人(姓名,ID,公司,EMAIL,电话,地址)><!ELEMENT地址(街道,城市,省份)><!ELEMENT姓名(#PCDATA)><!ELEMENTID(#PCDATA)><!ELEMENT公司(#PCDATA)><!ELEMENTEMAIL(#PCDATA)><!ELEMENT电话(#PCDATA)><!ELEMENT街道(#PCDATA)><!ELEMENT城市(#PCDATA)><!ELEMENT省份(#PCDATA)>对XML文档的显示不难得出,我们可以通过DTD定义一套新的标记语言。但是存放数据的XML不像HTML那样,能够直接在浏览器里显示。于是还应该专门为XML定义一个样式单,这样,应用处理程序就需要综合DTD、样式单及XML文档数据三方要素,根据这些数据和规定来显示它。<?xmlversion="1.0"encoding="GB2312"?><xsl:stylesheetversion="1.0"xmlns:xsl="/1999/XSL/Transform"xmlns:fo="/1999/XSL/Format"><xsl:templatematch="/"><HTML><HEAD><TITLE>F公司的客户联系信息</TITLE></HEAD><BODY><xsl:apply-templatesselect="联系人列表"/></BODY></HTML></xsl:template><xsl:templatematch="联系人列表"><xsl:for-eachselect="联系人"><UL><LI><xsl:value-ofselect="姓名"/></LI><UL><LI>用户ID:<xsl:value-ofselect="ID"/></LI><LI>公司:<xsl:value-ofselect="公司"/></LI><LI>EMAIL:<xsl:value-ofselect="EMAIL"/></LI><LI>电话:<xsl:value-ofselect="电话"/></LI><LI>街道:<xsl:value-ofselect="地址/街道"/></LI><LI>城市:<xsl:value-ofselect="地址/城市"/></LI><LI>省份:<xsl:value-ofselect="地址/省份"/></LI></UL></UL></xsl:for-each></xsl:template></xsl:stylesheet>有了HTML了,为什么还要发展XMLSGML虽然功能强大,但太复杂了,无法有效地在网上传递信息。由于有太多的可选功能与其它特性,令编写在网页浏览器中处理与显示SGML信息的软件变得非常困难。HTML虽然源于SGML,但由于种种原因,HTML偏重于信息的表示,标签中原本就很微弱的信息描述含义也被削弱了,于是它难以满足网络进一步发展的需要。HTML的缺点(1)所有的HTML标记都是预定义的,而且固定的,用户不能自定义自己的标记。(2)HTML主要是用来描述数据的显示格式,而不能描述数据的结构及语义(Semantics)。在HTML中<H2>Apple</H2>这条代码在网络浏览器中有特定的表现,但是HTML却没有告诉我们它到底是什么。尽管Apple只是一个英文单词,但它在不同的环境之中可能会有不同的意义,它可能是指Apple计算机公司,也可能是指一种水果,还可能是一个姓氏。搜索引擎开发人员来说,几乎不能从HTML标记本身得到任何有用的信息。(3)HTML语言语法不够严格
<ul>20013121</ul><li>张三</li><li>女</li><li>计信一班</li><学生列表><学生> <学号>20013121</学号> <姓名>张三</姓名> <性别
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 主动脉夹层应急演练工作总结(2篇)
- 星级酒店市场营销部年工作总结年工作计划(2篇)
- 安全漫画解读讲解
- 运动控糖健康指导手册
- 工地生活区消防安全通知
- 2026年招股说明书撰写能力测试题集
- 音像技术职业发展规划
- 2026年实验室职业健康安全知识培训
- 安全生产验收规范讲解
- 施工会计及基础 1
- DB11-T 513-2025 绿色施工管理规程
- 2025四川泸州交通物流集团有限公司及下属公司招聘12人笔试参考题库附带答案详解
- 危险作业审批培训
- (正式版)DB54∕T 0428-2025 《“一河(湖)一策”方案编制规程》
- 地贫防控知识培训课件
- GB/T 26941-2025隔离栅
- 人工智能概论课程教学大纲
- 2025年江西省中级档案职称考试(档案事业概论)经典试题及答案
- 新疆公务员面试题目及答案
- 物理与现代军事科技
- 2024年广西建设职业技术学院聘用人员招聘考试真题
评论
0/150
提交评论