多媒体技术14超文本与标记语言.doc_第1页
多媒体技术14超文本与标记语言.doc_第2页
多媒体技术14超文本与标记语言.doc_第3页
多媒体技术14超文本与标记语言.doc_第4页
多媒体技术14超文本与标记语言.doc_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

25 第14章 超文本与标记语言第四篇 标记语言从用于文档和图书管理的鼻祖SGML,到描述网页的万维网基石HTML,再到集万千宠爱于一身的数据描述和交换标准XML,标记语言在当今的信息社会中起着举足轻重的作用。标记语言的蓬勃发展,得益于超文本标记语言HTML的意外成功;而标记语言的无限未来,则有赖于可扩展标记语言XML的广泛应用。本来只能显示文本信息的超文本标记语言HTML,由于图形与多媒体界面浏览器的引进和脚本语言的出现,发展成为可以包含各种多媒体信息的动态超媒体标记语言DHTML(这大大推动了万维网和因特网的普及与应用)。现在网页变成了典型的多媒体数据的集成工具,万维网因此成为了多媒体技术的最主要应用之一。可扩展标记语言XML的发布,使标记语言从一种主要是描述网页的简单工具,发展到可以描述各类数据、并能够进行各种数据交换的万能工具,从而成为了信息表示、存储、处理和交换的核心技术。本篇首先给出超文本和超媒体的基本概念,然后讨论标记语言的功能与演化,重点介绍HTML、JavaScript和XML的基本内容。通过对这些知识的学习,可以为网页编辑、Web服务器编程和XML应用打下良好的基础。本篇包含如下4章:n 第14章 超文本与标记语言n 第15章 HTMLn 第16章 JavaScriptn 第17章 XML入门第14章 超文本与标记语言超文本(hypertext)又叫超媒体(hypermedia)是将各种信息节点链接在一起的一种网状逻辑结构。标记语言(ML = Markup Language)又叫置标语言,是一套标识文档的内容、结构和格式的语法规则,源于出版印刷部门对文档格式的排版标注。随着万维网(WWW = World Wide Web,又叫环球网,常简称为Web)的发展,超文本标记语言(HTML = HyperText Markup Language)得到广泛应用,其超文本功能可将多种媒体元素集成和链接在一起,是表达多媒体信息的有力工具。可扩展标记语言(XML = eXtensible Markup Language)是对超文本标记语言的发展和超越,其应用已渗透到需要信息表示与交换的各个领域,更是下一代万维网的基础。本章先简介超文本的基本概念与内容,然后概述标记语言的发展与应用,重点介绍SGML、HTML与XML的基本概况。14.1 超文本与超媒体超文本(hypertext)是一种由许多相关联的信息节点所组成的逻辑语义网络,符合人类的联想型思维方式。超文本有节点、链和网络三种组成要素,其中关键的是连结各个节点的链。超文本是由存储、结构和界面构成的一种三层模型,可以用来表示知识、连接推理系统和进行信息检索。超文本发展成为超媒体(hypermedia),可以包含各种媒体信息节点。为了在超文本中表示多媒体信息,需要建立多媒体的数据模型。超文本正在朝网络型、智能化、超媒体方向发展,超文本和超媒体的应用也越来越广泛。14.1.1 概述本小节先介绍超文本出现的背景和原因,然后给出超文本的定义和特点,最后介绍超文本的发展简史。1) 背景传统的资料(图书、文章、文件等)所采用的都是(层次型)线性的顺序结构(如水浒书籍),而真实世界的实际信息则是非线性网状结构(如水浒的故事情节和人物关系)。人类的思维方式是联想型的,是一种互联的交叉网络,具有典型的非线性网状结构。例如:l 夏天太阳星星天文学伽利略比萨斜塔宝塔佛教和尚l 夏天游泳江河鱼吃饭餐具银器耳环婚纱白雪冬天冷太阳太空飞船卫星电视转播足球赛万事万物皆互相关联,人的大脑也为网状结构。所以,具有网状逻辑结构的超文本,非常符合人类的联想型思维方式,这也正是万维网之所以流行的深层原因。节点AOOOBOOCODEOFOO链2) 定义超文本(hypertext)= 由信息节点和表示节点之间相互关系的链所组成的具有一定逻辑结构的语义网络。图14-1是一个具有6个节点和9条链的超文本结构。图14-1 超文本的网状结构l 节点(node) 基本信息块(段、帧、卷、文件);l 链(link) 节点之间的关联(指针);l 网络(network) 由链连接在一起的节点所组成的网状结构。若超文本中的节点内容不仅包含文本,而且还包含各种媒体对象(如图形、图像、声音、动画、视频等),则称其为超媒体(hypermedia),即:超媒体 = 超文本 + 多媒体其实现在的超文本的定义有两种:狭义超文本的节点仅含文本(原始定义);广义 超文本 = 超媒体(流行定义)。3) 简史l 开创期(1932年1965年)n 1932年美国总统罗斯福的科学顾问V. Bush(布什)提出一种非线性文本结构Memex (memory extender记忆延伸器),1945年才公开发表,当时曾引起广泛注意。布什是超文本的先驱,被公认为是超文本的创始人;n 1965年美国的Ted Nelson造hypertext (超文本)一词来表示信息以复杂形式相连,1974年出版有影响的书Computer lib / dream machines(计算机库/梦想机器),1970s末开始开发联机全球图书馆Xanadu(世外桃源),至今未成(数字图书馆/数字地球);l 研究期(1965年1985年)n 1967年美国布朗(Braun)大学的A. Van Dam研制成首个超文本系统The Hypertext Editing System(超文本编辑系统),1968年又推出文件检索与编辑系统FRESS(File Retrieval and Editing System);n 1975年美国卡内基梅隆大学(CMU)推出知识库管理系统KMS(Knowledge Management System)(原称为ZOG);n 1978年美国麻省理工学院(MIT)的A. Lippman制成首个超媒体视频盘片系统Aspen Movie Map(白杨城地图集);l 成熟期(1985年1990年)n 1985年苹果(Apple)公司的Janet Walker推出首个商品化超文本系统Symbolics Document Examiner(符号文献检测器),运行于Macintosh机上;n 1985年美国布朗(Braun)大学的N. Meyrow推出交互媒体(Intermedia),也在Macintosh机上运行;n 1986年办公工作站有限公司(OWL)推出第一个广泛应用的超文本系统Guid(指南);n 1987年施乐(Xerox)公司的Halasz推出Notecards(笔记卡)系统;n 1987年苹果(Apple)公司的Bill Atkinson在Mac机中引入HyperCard(超卡)系统;n 1987年11月召开ACM(Association for Computing Machinery美国计算机协会)超文本专题讨论会;n 1989年6月召开首届超文本大会,出版第一本超媒体专业杂志Hypermedia(超媒体);l 应用期(1990年今)n 1990年英国科学家Tim Berners-Lee发明万维网,设计出HTTP和HTML;n 1991年美国的Asymtrix公司推出基于超文本的多媒体著作工具ToolBook;n 1993年美国人Marc Anderressen和Eric Bina合作开发出支持内嵌图像的浏览器马赛克(Mosaic,镶嵌图案);n 1998年W3C(World Wide Web Consortium,万维网联盟)发布XML 1.0;n 2000年W3C推出基于XML的XHTML 1.0。14.1.2 组成要素超文本有节点、链和网络这三种组成要素,下面逐个加以介绍。1 节点节点(node结点)为基本信息块,在不同系统中有不同得名称,如卡(card)、页(page)、帧(frame)和片(pad)等。可以按照不同依据,将节点分成多种类型:(1)按属性和功能分:文本、符号、数字,图形、图像,动画、视频,语音、音乐、声响,混合、索引、规则;(2)按结构性分:结构化、半结构化、非结构化、上下文关联、合成;节点的具体类型有:1) 符号媒体节点l 文本节点 一段文字(可滚动、可含链接热字)l 结构化数据节点数据库(关系数据库中的结构数据/多媒体数据库中的多媒体数据索引)2) 静态图像节点位图节点(可含链接热区)、图形节点(可含链接热区和图元)3) 动态图像节点动画/视频节点,具有时间连续性,链源与时间有关,如为某一片段或某帧(热点)。可交互控制,包括:设置参数路径、速度、步长;控制播放播、停、快进/退、定位;4) 声音节点语音节点(波形数据)、音乐节点(波形数据或MIDI)、声响节点(波形数据)。都可交互控制、设置热点、与视觉媒体节点同步;5) 混合节点以上四类节点的混合,处理复杂;6) 按钮节点通过按钮来访问动作与操作(如拨号、传真、计算等),实质上是启动相应的计算机程序已完成特定的操作任务。又叫操作节点或程序节点。其中:按钮 = 执行链 普通链以上各类都属于只表示信息、不表示知识的表现型节点,下面两类属于可以表示知识的知识型节点:7) 组织节点l 目录节点(索引文本节点)含媒体目录索引指针,指向索引节点l 索引节点由单个索引项组成,可连接目的节点、相关项、相关项组和目录节点8) 推理节点用于辅助链的推理与计算,是超文本智能化发展的产物,包括:l 对象节点用于描述对象,由槽(slot)、继承链(inheritance link)和嵌入的附加过程所组成,同Is-a、Part-of等组合链连接后,可用于表现知识的结构l 规则节点用于保存、判定和解释规则2 链链(link)是固定节点间的信息联系,用来以某种形式连接相应的节点。链在节点之间穿针引线,是超文本的灵魂。链在形式上是从一个节点指向另一节点的指针,但在本质上则表示不同节点之间的信息联系。链定义了超媒体的结构,提供浏览和探索节点的能力。因为链是单向箭头,所以超文本信息网络实质上是一个有向图。链的组成部分有:l 链源导致节点迁移的原因,可以是热字、热区、热点、图元、按钮和媒体对象与节点等;l 链宿链的目的所在,一般为节点;l 链属性决定链的类型、版本、权限等,有时可作为独立实体类型链。按功能可将链分成如下三大类:1) 基本结构链是最主要的链形式,为实链,主要用于导航和检索。又可分为如下几种:l 基本链建立节点间的基本顺序,表现节点的层次结构。还可细分为:顺序链、结构链、查询链、移动链、缩放(zoom)链、全景(pan) 链和视图(view) 链等l 交叉索引链将节点连接成交叉的网状结构,是超文本中最重要的链l 注释链混合媒体节点中的点内注释2) 组织推理链用于节点的组织、机器推理和程序化等,适用于智能超媒体。可进一步分为:l 索引链索引入口,用于数据库接口和查找文献l Is-a链似语义网络,用于指明对象节点中的某类成员l Has-a链用于描述节点所具有的属性l 蕴含链用于连接推理树中的事实,通常等价于规则l 执行链(程序链)将一程序与按钮相连,可使超文本成为高层程序界面推理链的含义由谓词定义,可以通过逻辑编程来增强超媒体嵌入谓词的能力。因此,推理型链是一种虚链或称之为动态链/实时链。3) 其他链l 自动链接允许系统自动地把当前节点与相似的主题或满足某些条件的所有其他节点链接在一起,便于对超文本进行基于内容的检索;l 类型链描述节点间的关系,如注释链、扩展链,可预先知道目标节点的属性,允许对节点进行预查询,使超媒体智能化。3 网络超文本为一种信息网络,似人工智能中的语义网络:l 节点 单一概念/思想的表达;l 链 概念之间的语义关系。也似知识工程,但是不同之处在于:l 知识工程致力于建立一个表示,以便于机器推理;l 超文本组合各种思想和概念,便于浏览。多数超文本网络非常巨大,而且一般分散在不同的物理节点上。需要通过分层来进行有效的管理。分层:l 宏文本(macrotext)大型超文本,支持宏节点的查找与索引;l 微文本(microtext)小型超文本,支持节点内信息的浏览;存储结构接口l 子网(宏节点)节点组。14.1.3 模型超文本是一种层次模型,超文本的功能可用一个三层的层次模型来描述:(参见图14-2)图14-2 超文本的多媒体层次模型l 存储模型最低层,处理信息存储问题,支持对节点和链的基本信息进行存储管理和访问,依赖于计算机的软硬件环境(链式数据库);l 结构模型中介层,保存和存储节点和链的结构性信息,控制存储层按指定的结构存储和访问数据(标准化重点);l 接口模型最高层,管理人机界面,决定信息的表现、交互操作和导航方式(应用系统中要求高)。超文本层次多媒体模型的具体功能有:l 知识表示表示文本和图形、表示概念、表示组织结构、表示概念间的关系;l 连接推理系统:n 表示概念间关系的链可由逻辑程序设计中的谓词定义,也可由推理系统在运行时创建或显示定义;n 超媒体与推理的集成为知识库提供可视表示:超媒体语义网络、链谓词、结构规则;l 信息检索:n 节点的层次结构强有力的检索形式;n 链谓词推理;n 层次索引可附加索引机制构成扩展检索,将信息检索与信息访问和应用合并在一起。14.1.4 发展与应用超文本正在朝智能化和网络化方向发展,超文本的研究和应用也越来越广泛。表现层表现说明接口超媒体抽象/推理机层锚定接口数据库和知识库1 智能超媒体智能超媒体是由Rada & Barlow于1989年提出的,它的系统结构和推理模型如下:n 系统结构(参见图14-3)图14-3 智能超媒体的系统结构n 推理模型语义网络模型、流控模型2 网络超媒体主要是万维网上基于XML的超文本与多媒体数据模型,包括:XHTML替代HTML、SMIL多媒体集成、SVG2D矢量图形和动画、X3D3D图形和动画等。3 研究方向当前,超文本和超媒体的主要研究方向有:表现、时基媒体的影响、数据模型、检索与查询(可访问)、智能化(可推理)、协同性工作、标准化、自动化(可自建链)等。4 应用超文本的应用十分广泛,包括传媒、出版、图书馆、万维网、。14.2 标记语言标记语言(Markup Language,ML)是一种基于文本的描述性语言,源于图书和报刊等排版时的标注。现代标记语言的鼻祖是1986年推出的ISO国际标准标准通用化标记语言(SGML),它是一种功能完备且可定义性强的元语言,受到政府、大公司和出版界的欢迎,但是因为其过于复杂且系统难实现,使得对其的推广和使用受到了很大的限制。Tim Berners-Lee在创建万维网时,将SGML加以应用和简化,于1990年创建了用来描述网页文档的超文本标记语言(HTML),获得了意想不到的巨大成功,也促进了因特网和万维网的普及和应用。但是,后来由于微软和网景公司对HTML的各自扩展且互不兼容,使得网页文档的设计与维护异常困难。而且由于商业应用的增加,过于注重网页的外观(如字体、排版、色彩、闪烁、动画等),使得内容被形式所掩盖,难于检索和利用。由万维网联盟(W3C)于1998年推出的可扩展标记语言(XML),彻底改变了这种不利局面。虽然XML只是SGML的一个子集,但是它简单实用,也是一种可开展定义的元语言。在其他配套标准的协助下,XML正在替代HTML,成为新一代万维网的基础。本节先介绍标记语言的基本概念和来龙去脉,然后逐个介绍SGML、HTML和XML这些主要标记语言的一些基本情况。14.2.1 概述与自然语言和编程语言不同,标记语言是一种基于文本的描述性语言。标记(markup)原本是在图书和报刊等排版时,对手稿和清样中的字体和格式等的标注(markup)。后来用于描述文档格式和结构化数据的文本标记,并形成具有严格语法规则的形式语言标记语言。下面先介绍语言的分类,然后讨论标记和标记语言的概念,接着给出标记语言的发展历史框图,最后介绍在标记语言发展过程中,起着核心作用的W3C及其标准的基本情况。1 语言分类1) 自然语言汉语、英语、法语、;2) 编程语言机器语言、汇编语言、高级语言(Algol、Fortran、Basic、Cobol、Pascal、C、C+、Java、C#、);3) 描述语言:a) 脚本语言PostScript、JavaScript、VBScript、PHP、Perl、ASP、JSP、;b) 标记语言SGML、HTML、XML、XHTML、。2 标记标记(markup)为了传达有关文档的信息而添加到文档数据中的文本。标记可以分为说明性标记(这里是什么)和过程性标记(在这里做什么)。图示标记(人看)(机器识别)粗体粗体下划线下划线表14-1 图示和标记说明性标记(descriptive markup)以一种非特定的方式来描述文档的结构和其他属性的标记,它独立于可能对文档进行的任何处理。例如,为表示重要或强调,可以在显示界面上使用粗体(bold)或下划线(underline)进行图示;但是在计算机内部,则需要使用特殊的符号体系(如文本标记)来表示,参见表14-1。3 标记语言标记语言(ML = Markup Language) 一种用文本标记描述结构化数据,并具有严格的语法规则的形式语言。标记语言可用于描述数据,如定义:文本格式与处理、通信语义、数据库字段的含义与关系、多媒体数据源、。例如,表示上标(superscript)x2 x2和下标(subscript)ai ai。4 历史发展图14-4为标记语言历史发展的简要框图。其中,粗线为重点标记语言与发展主线,箭头上标注的是标记语言之间的关系,圆括号内为语言推出的时间。应用应用扩展应用简化子集实例发展SGML(1986)HTML(1990)XHTML(2000)XML(1998)HyTime(1992)SMDL(1995)MathML(1998)、CML(1999)SMIL(1998)、SVG(2001)、X3D(2002)SOAP(2000)、ebXML(2001)、图14-4 标记语言的历史发展5 W3C及其标准在标记语言的发展过程中,除了制订SGML的Charles F. Goldfarb和ISO/IEC外,创建万维网(HTTP/HTML)的Tim Berners-Lee及其领导的W3C起着关键性的作用。特别是XML的推出,使得标记语言的发展进入了一个全新的辉煌时期。W3C(World Wide Web Consortium,万维网联盟/环球网协会,)是1994年10月由Berners-Lee牵头成立的一个国际化组织,负者万维网的标准制订和技术开发。W3C通过公开出版(非商业性的)万维网语言和协议标准,致力于维护万维网的统一和良性发展。W3C 的运作由(Berners-Lee所在的)美国麻省理工学院计算机科学与人工智能实验室 (MIT CSAIL)、总部设在法国的欧洲信息与数学研究论坛 (ERCIM) 和日本的庆应大学 (Keio University of Japan)来共同管理,Tim Berners-Lee任总监(Director,主任)。W3C的语言和协议标准由其相关工作组(Working Group)负责制订,需要经历若干阶段,包括如下W3C技术报告发展过程(W3C Technical Report Development Process):1) 工作草案Working Draft (WD) :从首个公开的工作草案(First Public Working Draft)WD1到最后呼叫(Last Call,LC)通告,可能有多个工作草案WDi;2) 候选推荐(标准)Candidate Recommendation (CR) :已经满足工作组的技术要求,收集实现的经验,该环节是可选的;3) 建议推荐(标准)Proposed Recommendation (PR):已经成熟,送交万维网联盟咨询委员会(W3C Advisory Committee)进行最后的审批;4) 万维网联盟推荐(标准)W3C Recommendation (REC):已经获得万维网联盟的成员和总监批准的W3C规范和指导方针集。除了推荐标准外,W3C还有一种技术报告叫做工作组记录(Working Group Note,WGN),是由特许工作组发布,表明有关特定主题的工作已经终止。在工作组记录之前可能有也可能没有相关的工作草案。即W3C技术报告的发展过程为(方括号括起的部分是可选的):WD1 WDi LC CR PR REC或 WD WGN14.2.2 SGMLSGML(Standard Generalized Markup Language,标准通用化标记语言),是现代标记语言的始祖,现在流行的标记语言都是它的应用或其派生语言(的应用)。1 历史1) 1969年IBM公司为了解决其内部大量文档的交换与存储问题,由Charles F. Goldfarb创建GML(通用标记语言),很快成为出版业的一个重要标准;2) 1978年Goldfarb出任ANSI文本处理计算机语言委员会的主任;3) 1980年ANSI公布SGML的第一个工作草案;4) 1986年SGML成为国际标准ISO/IEC 8879:1986 Information Processing Text and Office Systems Standard Generalized Markup Language信息处理文本和办公系统标准通用化标记语言,对应的中国国家标准为GB/T 14814-1993。2 特点1) 基于文本的元标记语言;2) 不指定文本的格式与显示,不是一种格式化语言(不会使文档更漂亮);3) 使用基于内容的标记(而不是基于格式的标记),方便信息的检索与管理;4) 是一种元标记语言(不是一种特定的标记语言),有用于创建具体标记语言的一套规范,使文本的一致性格式化非常容易;5) 适用于涉及大量结构相似的数据工程(如目录、手册、清单和摘要等),受政府、大公司和出版界的欢迎;6) 复杂,系统难实现(太完备、可定义性太强)。SGML的特点似XML,但与HTML不同。3 文件组成1) SGML声明说明Dtd和文件实例所使用的语法(字符集、定界符、命名规则、名字字符、数量特征等),体现“抽象语法”的思想2) Dtd(Document Type Definition,文档类型定义)定义文件中的元素类型及其关系的一类文件结构(记录及其字段的含义、结构与关系)3) 文件实例由数据内容和描述其结构的标记所组成的文件(含实际要表达的信息)图14-5是SGML(复杂Dtd)的文件组成及其与HTML(固定Dtd)和XML(简化Dtd)的文件组成的比较示意图。SGML声明DtdSGML文件SGML文件HTML-DtdHTML实例文件XML-DtdXML文件XML文件图14-5 标记语言的文件组成元语言标准SGMLSDIFDSSSLHyTime9070FontsISMID13673SPDLSMDL基础标准应用标准HTMLVRMLNITFMARTIF4 标准体系SGML标准体系参见图14-6。其中:1) SDIF = SGML Document Interchange Format,SGML文档交换格式(ISO 9069:1988);图14-6 SGML标准体系2) DSSSL = Document Style Semantics and Specification Language文档样式语义与规范语言(ISO/IEC 10179:1996);3) HyTime = Hypermedia / Time-based Structuring Language时基超媒体结构化语言(ISO/IEC 10744:1992),基于SGML,作了多媒体扩展,可表示超文本、多媒体、超媒体和时基文档的逻辑结构;4) 9070 = ISO/IEC 9070:1991 Registration procedures for public text owner identifiers公共文本拥有者标识符的注册过程;5) Fonts = ISO/IEC 9541:1991 Font information interchange字体信息交换;6) ISMID = Interchange Standard for Multimedia Interactive Documents多媒体交互文档的交换标准(ISO/IEC 13240:2001);7) SMDL = Standard Music Description Language标准音乐描述语言(ISO/IEC DIS 10743:1995),SGML的应用,HyTime97的实验实例;8) 13673 = ISO/IEC 13673:2000 Conformance testing for SGML systems,SGML系统的一执性测试;9) SPDL = Standard Page Description Language标准页面描述语言(ISO/IEC 10180:1995);10) NITF = News Industry Text Format新闻工业文本格式;11) MARTIF = Machine-readable terminology interchange format机器可读术语交换格式(ISO 12200:1999)。14.2.3 HTMLHTML(HyperText Markup Language超文本标记语言),是书写Web文档的一套语法规范,由Tim Berners-Lee与Damiel W. Connolly于1990年设计。1 历史图14-7 Tim Berners-Lee万维网之父蒂姆贝纳斯李(Tim Berners-Lee)是英国人(参见图14-7),1976年毕业于牛津大学的皇后学院。为了弥补自己健忘的缺陷,1980年他编写了一个可以把易忘的东西联系在一起的软件Enqiure(询问)。后来在CERN(Conseil Europeen pour la Recherche Nucleaire,瑞士欧洲粒子物理研究所)工作期间,他在Enqiure的基础上,于1989年提出全球超文本计划(global hypertext project),后来取名为万维网(WWW = World Wide Web,环球网)。1990年Berners-Lee写出了第一个万维网服务器(HTTP)和第一个客户机软件(HTML浏览器)。1990年12月,万维网开始在CERN内部推出,1991年夏天开始在互联网上流行。1994年Berners-Lee加入麻省理工学院(MIT)计算机科学系的人工智能实验室,并牵头成立了万维网联盟(World Wide Web Consortium,W3C),任该联盟的总监(Director,主任)至今。网景(Netscape)公司创始人马克安德森(Marc Anderressen)是美国人,他在伊利诺(Illinois)大学读研期间,到该校内的NCSA(National Center for Supercomputing Applications美国超级计算应用中心)打工。1993年3月,他与好友埃里克比纳(Eric Bina)合作开发出支持内嵌图像的浏览器马赛克(Mosaic镶嵌图案)0.9版,1993年11月又推出马赛克1.0版,并在网上迅速扩散。1994年4月安德森与SGI公司的创始人吉姆克拉克(Jim Clark)共同创办了网景公司,安德森等人又重写了马赛克的代码,并于1994年10月推出了Navigator浏览器,后来改名为Netscape浏览器。1995年Netscape公司的Brendan Eich发明了JavaScript,为HTML浏览器提供了脚本功能和动态网页能力。1995年微软公司从伊利诺大学购得马赛克技术,并在此基础上开发出IE(Internet Explorer因特网探索者)浏览器,并推出了与JavaScript功能类似的JScript和VBScript。网景公司后来被微软公司随Windows操作系统免费赠送的IE浏览器挤垮,于1998年11月被AOL公司收购,安德森当时成为该公司的CTO(首席技术官)。(1999年9月他离开了AOL,并创立了一家基于服务的Web主机公司Loudcloud,2002年更名为Opsware。)目前的三大浏览器:微软的IE、网景的Netscape和Mozilla的Firefox(火狐)都是基于Mosaic的。其中,Mozilla是2005年8月3日成立的一家非盈利公司(由AOL的Netscape分部于2003年7月成立的Mozilla基金支助)。总之,Tim Berners-Lee发明了具有超文本能力的万维网(HTML/HTTP),Marc Anderressen等人将图像、多媒体、交互动态等功能带入万维网,促进了因特网的发展和普及,成就了今天万维网的繁荣兴旺。2 特点1) 是一种描述文档的标记语言,用标签(tag)来说明文档的内容与格式;2) 源自SGML,是其应用与简化;3) 支持超链接;4) 支持C/S交互(如表单、JavaScript、Java Applet);5) 基于HTTP,与平台无关。3 版本HTML的版本有:1) 0.91990,基本超文本。(Berners-Lee & Connolly)2) 1.01992.1. 内嵌图、文字格式。(CERN)3) 2.01995.11. 表单。(IETF:RFC 1866)4) 3.01996. 数字、表格、控件。未公开、未标准化。(W3C)5) 3.2REC: 1997.1.14. 规范对Applet、脚本和颜色的支持。(W3C:REC标准)6) 4.0REC: 1997.12.18 (1998.4.24推出修订版). 提倡结构与外观的分离,支持CSS(Cascading Style Sheets层叠样式表单),提高了对(动态)页面的控制能力、改进外观和功能、支持多语言文档。(W3C:REC标准)7) 4.01REC: 1999.12.24. 对4.0的修正与补充,如更新样式表单、添加内容短表、修正文档脚本等。(W3C:REC标准)因为W3C想用XHTML来代替HTML,所以已经停止了HTML的开发,也不会在发布HTML的新版本了。XHTML的版本有:l 1.0XHTML 1.0: The Extensible HyperText Markup Language A Reformulation of HTML 4 in XML, REC:2000.1.26(可扩展超文本标记语言,基于XML的HTML,HTML4的XML重写);l 1.0 (Second Edition)REC: 2002.8.1;l 1.1XHTML 1.1 - Module-based XHTML, REC: 2001.5.31(基于模块的XHTML);l 2.0XHTML 2.0, WD8: 2006.7.26(针对丰富、移动的基于Web的应用,不向后兼容)。从HTML到XHTML的版本演化,参见图14-8。应用应用CSS 多语言内嵌图 文字格式表格、控件 Applet、脚本HTML 0.9Berners-Lee 1990HTML 1.0CERN 1992.1重内容轻格式 基本超文本HTML 2.0IETF 1995.11表单HTML 3.2W3C 1997.1.14HTML 4.0W3C 1997.12.18提倡结构与外观分离XHTML 1.0W3C 2000.1.26XML 1.0W3C 1998.2.10兼容 过渡XHTML 1.1W3C 2004.2.4XHTML MOD W3C 2001.4.10模块化XHTML 2.0W3C WD8 2006.7.26通用化 多用途子集化 扩展性XML Events W3C 2003.10.14SGMLISO/IEC 1986子集应用XForms W3C 2003.10.14应用图14-8 从HTML到XHTML的版本演化4 常用标签1) 文档结构(html、head、title、body)2) 字符/段落格式(font、hn、b、i、u、sup、sub、em、strong、p、br、hr)3) 列表(ul、ol 、li)4) 表单(form、input、select、option)5) 链接(a、base、link)6) 图像(img)7) 小应用程序(applet)、脚本(script)8) 框架(frameset、frame)5 例子 Test 试  验中山大学课程:程序设计 操作系统 编译原理成绩单 学号 姓名 成绩 01 张三 75 02 李四 82 运行结果为参见图14-9(另外还播放MIDI乐曲)。14.2.4 XMLXML(eXtensible Markup Language,可扩展标记语言)是W3C于1998年推出的一种用于数据描述的元标记语言的国际标准。图14-9 HTML例子本小节先从HTML的不足出发,给出引入XML的必要性,然后讨论XML的特点和意义,接着列出XML的各种版本,重点介绍XML的标准系列,随后列出若干XML的应用分支,最后给出一个XML文档的实例。1 HTML的不足1) 花哨内容被形式掩盖(如字体、排版、色彩、闪烁、动画等),难检索;2) 不兼容微软和网景公司各自扩展,互不兼容,使网页文档的设计与维护困难;3) 分离不彻底虽然4.0版已经提倡结构与外观的分离,但这种分离并不彻底,如仍然保留了格式标签,而且微软抵制CSS。应用迫切需要内容与形式彻底分离、且容易扩展的标记语言,XML应运而生。2 XML的特点1) SGML的子集20%复杂、80%功能;2) 文档定义的元语言可用来定义各种具体应用领域的专用文档类型;3) 扩展性好可自定义标签,伸缩灵活;4) 形式与内容分离易进行内容检索,同一数据可多视;5) 高度结构化良好的数据存储格式,使应用软件易集成使用,可粒状更新数据,面向对象;6) 应用广泛主要应用领域有:网页发布、数据交换、分布式计算、信息描述、数据库等等。3 XML的意义1) 应用于几乎一切(需要描述、处理、交换、展示数据的)领域(如操作系统、数据库、网页发布、电子商务、电子书、图书馆、无线通信、网格计算、音乐、动画、);2) 打破以往各自为政、互不兼容的尴尬局面,确立数据交换的共同国际标准;3) 得到所有政府、公司、院校、研究单位等的一致支持与好评;4) 各个具体行业标准的制定竟争激烈。4 XML流行的原因传统的数据一般采用专用的二进制格式,占用存储空间小,访问与处理的效率高。但是,随着计算机技术的高速发展,CPU的性能在不断提高,存储器的容量也越来越大,专用二进制格式的这两个优势已经不复存在。而随着网络的发展普及,以及分布式计算的兴起,数据的可交换性和可维护性变得十分重要。XML作为W3C推出的通用国际标准,采用基于文本的标记语言,即可用于机器访问处理,也能供人类阅读理解。用XML来描述数据,虽然比专用二进制格式会牺牲一些处理效率和存储空间,但是换来的却是数据的通用性、可交换性和可维护性,这对跨软件、跨公司、跨平台的分布式网络环境中的计算机应用是至关重要的,这也正是XML能得到如此广泛的支持和应用的根本原因。现在,本来是作为HTML替代品的XML,“无意插柳柳成荫”地成为了全世界数据描述和交换的热门标准。这也能帮助理解,为什么会有XML Schema来替代DTD,为什么XSLT会意外地受到重用,以及XPath与XQuery的发展和XML数据库的兴起了。5 XML版本XML元语言标准用于描述DTD。XML标准目前有两个主要版本:1.0和1.1。它们的主要差别在于,元素和属性名称所采用的字符集(标准的版本)有所不同。1) 1.0版Extensible Markup Language (XML) 1.0a) 1.0(1.0第一版)REC:1998.2.10. W3C推荐标准;b) 1.0 Second Edition(1.0第二版)REC:2000.10.6. W3C推荐标准(加删DTD生成式,修改错误,改进描述);c) 1.0 Third Edition(1.0第三版)REC:2004.2.4. W3C推荐标准(修改错误,改进描述);d) 1.0 Fourth Edition(1.0第四版)REC:2006.8.16. W3C推荐标准(修改错误,改进描述);2) 1.1版Extensible Markup Language (XML) 1.1(扩展字符集)a) 1.1(1.1第一版)2004.2.4. W3C推荐标准b) 1.1 Second Edition(1.1第二版) REC: 2006.8.16.(修改错误,改进描述)6 XML标准系列XML并不是一个单独的标准,而是一个标准系列。包括定义文档结构的核心标准组、展现文档内容的样单及其格式对象标准、起源于样单展现的文档转换标准、定位和链接文档的路径/指针/链接语言、以及访问XML文档的三种常用API等。1) 核心a) Infoset(信息集) XML应用文档的抽象数据模型,为需要引用XML文档中信息的规范提供了一组定义(XML Information Set)1.0, REC 2001.10.24;Second Edition, REC 2004.2.4)b) Dtd(Document Type Declaration文档类型声明)提供定义文档结构的语法规范(Extensible Markup Language (XML) 1.0, REC: 1998.2.10.;1.0 Second Edition, REC: 2000.10.6.;1.0 Third Edition, REC: 2004.2.4.;1.0 Fourth Edition, REC: 2006.8.16.;1.1, REC: 2004.2.4.)c) Schema(模式/架构/大纲)XML的应用、可定义文档结构与数据类型,有替代Dtd的趋势(XML Schema 1.0, REC: 2001.5.2.;1.0 Second Edition, REC: 2004.10.28.;现正在开发1.1版Part 1:WD 2006.8.31.,Part 2:WD 2006.2.17.)d) Namespace(命名空间)由上下文确定名字的意义(Namespace in XML 1.0, REC: 1999.1.14.;1.1, REC: 2004.2.4.;1.0 Second Edition, REC: 2006.8.16.)2) 展现与转换a) CSS(Cascading Style Sheets层叠样单)可用于HTML和XML,为结构文档中的各个标记定义出相对应的一组显示样式。分成三个级别,已有四个推荐标准:CSS1 (CSS level 1, REC: 1996.12.17.;revised edition, REC: 1999.1.11.) 、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论