




已阅读5页,还剩98页未读, 继续免费阅读
(计算机应用技术专业论文)嵌入式浏览器deltabrowser的设计与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 、随着计算机及相关技术的发展,计算变得越来越自由,在资源使用方面也越来 越灵活,逐渐里现出普及计算模式,嵌入式系统的普及是普及计算模式发展的体现。 嵌入式浏览器是嵌入式系统n t e m e t 技术在嵌入式系统中的关键应用,是嵌入式信 息设备的核心技术之一。目前市场的嵌入式浏览器产品一般都是由国外公司研发, 国内在嵌入式浏览器技术方面的研究很少。因此深入的研究嵌入式浏览器技术并且 研制自己的嵌入式浏览器产品具有重要的意义。步 嵌入式系统接入i n t e r a c t 是其发展的必然趋势。嵌入式系统的i n t e r a c t 上网主要 是w a p 和w w w 两种编程模式,论文对比分析两者的优缺点。同时随着无线技术 以及i n t e r a c t 技术的更新,面向信息终端的标记语言及其脚本语言技术规范也进行 了相应的发展。标记语言及其脚本作为浏览器解析处理的对象,论文深入分析应用 于嵌入式系统的各种标记语言及其脚本的技术特点。同时,提出设计的嵌入式浏览 器d e l t a b r o w s e r 支持w m l 和h t m l 及x h t m l 标记语言,并根据嵌入式系统技 术特点,阐述d e l t a b r o w s e r 的设计需求及其体系结构。 参考已有浏览器及相关i n e m e t 技术的优点是d e l t a b r o w s e r 的设计开发策略。主 要分析了基于嵌入式l i n u x 系统的v i e w m l 浏览器和日本a c c e s s 公司的嵌入式浏览 器n e t f r o n t ,提出d e l t a b r o w s e r 的体系结构和设计思路,阐述d e l t a b r o w s e r 主要组 成部分,d e l t a b r o w s e r 主要包含h t t p 相关协议、h t m l 用户代理、w m l 用户代 理及( i 管理等模块。 主要分析和介绍d e l t a b r o w s e rh t m l 用户代理、w m l 用户代理中和h t t p 应 用层相关协议的设计和实现。【d e l t a b r o w s e r 设计并实现了边下载边解析显示、模块 可扩展机制等关键技术,主要涉及h t m l 的词法分析和排版及w m l 主要组成部分 的设计。d e l t a b r o w s e r 开发采用的d g u i 窗口系统支持多字节语言,且功能可灵活 配置。d e l t a b r o w s e r 模块设计充分可裁减和可移植性, 笨文详细描述其各个部分接 口的设计实现,包含g u i 、嵌入式操作系统及网络协议与浏览器的接口关系及交互 过程。d e l t a b r o w s e r 是一个面向嵌入式领域的、稳定的、实用的、功能强大的嵌入 式浏览器。 此外,论文阐述d e l t a b r o w s e r 实现情况,展示在网络电话、p d a 和图形终端等 环境中的成功应用案例。f 实践证明,d e l t a b r o w s e r 结构合理,性能稳定,具有广阔 的商业前景。最后对嵌入式浏览器d e l t a b r o w s e r 的进一步的发展提出了自己的合理 设想。j 、 关键词:嵌入式浏览器,、嵌入式系统,h t m l ,w m l ,h r r p a b s t r a c t e m b e d d e dw 曲b r o w s e r ss e r v ea st h ek e m e lm o d u l eo fi n f o r m a t i o na p p l i a n c e s a s ac r i t i c a lt e c h n o l o g yo fi a ,t h e r ei sl i t t l ed o m e s t i cr e s e a r c hw o r ki nt h ee m b e d d e dw e b b r o w s e rf i e l d f o r e i g nv e n d o r sh a v ea l m o s to c c u p i e dt h ew h o l es h a r e so fe m b e d d e dw e b b r o w s e rm a r k e t s oi t su r g e n tf o ru st om a s t e rt h ee m b e d d e dw e b b r o w s i n gt e c h n o l o g y a n d p r o d u c e o u ro w ne m b e d d e dw 曲b r o w s e r s a t f i r s t ,t h em a r k u pl a n g u a g ea n d t h es c r i p tl a n g u a g ef o ri n f o r m a t i o na p p l i a n c ea r c r e s e a r c h e di nt h i sd i s s e r t a t i o n v i e w m lf o rl i n u xa n dn e t f r o n ta st w oc l a s s i ce m b e d d e d b r o w s e r sa l ea n a l y z e d t h o r o u g h l ya n d ad e t a i l e d ,c l e a ri m a g ec a na l s ob eo b t a i n e d ,a f t e r as e r i e so f a n a l y s e sa n d r e s e a r c ht h ed e s i g n e de m b e d d e dw e b b r o w s e r , d e l t a b r o w s e r , i s i n t r o d u c e d d e l t a b r o w s e r si m p l e m e n t a t i o ni sb a s e do nd g u i ,a ne m b e d d e dg r a p h i c s y s t e m d e l t a b r o w s e rm a i n l yi n c l u d e sh t t ph t m l u s e ra g e n ta n dw m lu s e ra g e n t h t m lu s c ra g e n ti m p l e m e n t st h ep a r t l yp a r s i n ga n dd i s p l a y i n gt e c h n o l o g y t h e r ei s s o m es a m et e c h n o l o g ya sh t m lu s e ra g e n t d i s s e r t a t i o ni l l u m i n a t e st h et e c h n i q u eo f w m lu s e ra n g e n t ,w h i c h p a r s e sw m lp a g e sa n d c r e a t e sb r o w s e r o b j e c t s h t t p i sc r i t i c a l a p p l i c a t i o np r o t o c o lf o r w e b b r o w s e r ;i t sd e s i g na n di m p l e m t i o na f ei n t e r p r e t e d 1 1 1 ei n t e r f a c ed e s i g no ft h em o d u l e si s v e r yi m p o r t a n ti no r d e rt op r o v i d eh i g h d e g r e eo fo p e n n e s s ,m o d u l a r i t y , a n ds c a l a b i l i t y d i s s e r t a t i o ne x p l a i n st h ec r i t i c a ld e s i g n o fd e l t a b r o w s e r sg u im a n a g e m e n ta n dt h es e r v i c ei n d i c a t i o na n dd a t af o r m a t p r o c e s s l a y e l a f t e rm a n yt e s t sa n da p p l i c a t i o n s ,t h ei m p l e m e n t a t i o nh a sb e e np o r t e di nm a n y i n f o r m a t i o na p p l i a n c e s d e l t a b r o w s e rc a ns a t i s f yt h er e q u i r e m e n t so f t y p i c a la p p l i c a t i o n i ni n f o r m a t i o na p p l i a n c e ,a n dh a sb e e na p p l i e d s u c c e s s f u l l yi nw e bp h o n e s ,p d a , s m a r t p h o n e ,a n ds oo n d e l t a b r o w s e r sd e v e l o p m e n tp r o c e s s ,i t si n n o v a t i o na n dc t u a l a p p l i c a t i o na r ee n u m e r a t e d a tl a s t ,t h en e x tg e n e r a t i o no f d e l t a b r o w s e r i si n l r o d u c e d k e y w o r d s :e m b e d d e dw e b b r o w s e r , e m b e d d e ds y s t e m ,h t m l ,w m l ,h 丌p j i 独创性声明 本人声明所里交的学位论文是本人在导师指导下进行的研究工作 及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为 获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与 我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的 说明并表示谢意 签名: 日期:习年? 衫目 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘, 允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全 部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描 等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:导师签名;篮 日期;、- 年、月日 0 2 , 翁o5 5 7 - 生! 型丝查堂堡主堂笪丝苎 一一 第一章绪论 1 1 嵌入式浏览器概述 随着计算机及相关技术的发展,嵌入式计算机系统( 嵌入式系统) 的应用范围 越来越广,计算越来越自由,从一般的手持设备( 如:手机,p d a 等) 到网络通信 设备( 如:路由器,交换机等) 等领域都涉及其应用,并呈现普及计算模式( p e r v a s i v e c o m p u t i n g ) 。各种嵌入式设备都具有功能专一,针对性强的特点。综观嵌入式系统 的发展,大致经历了3 个阶段。第一阶段是可编程微控制器形式的系统,这种系统 中一般没有操作系统的支持。第二阶段以嵌入式实时操作系统为标志。这种嵌入式 操作系统能运行于各种不同类型的嵌入式微处理器上,操作系统内核小、效率高, 并且具有高度的模块化结构和扩展性,嵌入式应用软件丰富,但设备未接入互联网。 第三阶段是以i n t e r n e t 为标志的嵌入式系统,随着i n t e r n e t 的发展,i n t e r n e t 技术与 信息家电、工业控制技术等结合日益密切,嵌入式设备与i n t e r n e t 的结合将代表着 嵌入式技术的未来,以手持上网设备为代表的嵌入式信息终端就是这类结合体,而 嵌入式浏览器正是其中的关键技术之一。 嵌入式浏览器没有一个准确、严格的定义,但从其功能来看,可以从两个方面 进行描述。第一,它是一个网络信息浏览器,网页浏览必须支持h t r p 或w a p 等 网络协议、h t m l 或w m l 等标记语言甚至j a v a s c r i p t 或w m l s c r i p t 等脚本语言。 第二,这类浏览器必须适合于非p c 资源有限的的嵌入式设备,运行并完整实现通 讯协议、标记语言所规定的功能,能根据嵌入式设备的多样性而便于裁减,并满足 用户对获耿文字、图像、声音、视频等信息的需求。 嵌入式系统主要特点之一是多样性。设备生产厂商在芯片选择、系统功能定义、 显示设备特性、耗电限制方面会有许多不同的要求,没有任何嵌入式浏览器可以满 足所有嵌入式系统的要求。因此,无论是嵌入式操作系统还是嵌入式浏览器市场, 不会出现如同w i n d o w s 和i e 在桌面p c 市场所呈现的一统天下的局面。嵌入式浏 览器市场具有分散性、多样性和变异性的特点。软件开发商必须对市场进行进一步 细分,对特定设备,如掌上电脑、机项盒、手机进行更有针对性的设计开发,才有 可能赢得市场和得到实用化推广。 1 2 互联编程模型 电子科技大学硕士学位论文 现有的互联网技术主要针对桌面机或更强计算能力的机型,其下载显示内容大。 嵌入式信息终端( 以下简称信息终端) 要完全实现对面向桌面机网站内容的浏览很 难。一方面,桌面机网络带宽和可靠性较高;另一方面,信息终端受其移动性和便 携性的制约,c p u 主频及计算及处理能力、存储器容量、显示屏和输入硬件都有限。 所以信息终端上网有其自身的特点,就目前来看,这类信息终端互联模型主要有两 种讹p 模型【1 ,2 ,3 l 和w w w 4 】模型。 图1 2w l y l 编程模型 针对无线应用这一特殊环境,w a p 模型重写现有互联网协议,采用四层结构模 型,分别为w s p 、w t p 、w d p 以及适配层。为了与现有的i n e m e t 网络互联互通, 该体系模型需要w a p 和t c p i p 协议转换的网关平台,网关同时具有减小数据量的 编码解码及c o o k i e 代理等功能处理。该模型的典型应用为手机上网。另一种方式 w w w 模式是将信息终端当作功能简化了的p c 机,基本沿用目前的i n t e m e t 技术, 只是在传送的内容上作变化,这样现有的互联网协议和工具等广大互联网资源可以 直接使用。该方式仍然采用t c p i p 协议栈,可能一定的裁减修改。此模型的应用 例子如日本的i - - m o d e 上网手机、w i n d o w s 信息终端和智能p d a 。 由于信息终端硬件的性能越来越高和无线带宽增大,目前信息终端互联模式趋 于后一种模型。 1 3 本课题来源和攻读学位期间完成的主要工作 嵌入式浏览器技术是信息终端的关键技术,但该技术在国内的研究很少。目前 市场上的嵌入式浏览器产品基本都是国外的,国内的产品开始出现,产品普遍不适 用,因此深入的研究嵌入式浏览器技术并实现相应的产品是非常有研究价值和市场 2 电子科技人学硕十学位论文 一一。 效益。本论文题目是以电子科技大学科园股份公司的信息产业部科技攻关w 廿项 目的w a p 终端软件的主要部分,同时以北京科银京成技术有限公司的“8 6 3 ”项目 一智能终端s m a r t p l a o n e 平台软件的研发为背景,研究及开发智能终端的嵌入式浏 览器d e l t a b r o w s e r ,我在项目中担任主研人员。首先对当前信息终端的上网方式进 行了研究,并对w a p 、终端标记语言及其脚本语言作了分析。由于终端接入i n t e r n e t 是发展的必然趋势,而嵌入式浏览器是终端上网的关键应用。通过对当今几种流行 嵌入式浏览器的分析,结合教研室在嵌入式系统丌发平台中的研究实践,提出 d e l t a b r o w s e r 的设计需求和原则。理论上总结了嵌入式浏览器的体系结构及设计的 关键技术,同时,把研究成果应用于实际软件开发项目中,主要进行了下述几个工 程项目: 主要负责d e l t a b r o w s e r 的项目的前期研究和| ;i 期模型设计。 负责设计开发d e l t a b r o w s e r 的h t m l 用户代理,并已经成功应用于爱达w e b 电话终端和侨兴信息终端。 作为浏览器项目组负责人参与设计和开发d e l t a b r o w s e r 的w m l 用户代理,实 现w h t t p 和应用于w a p 的h r r p s m 。 实现h t m l 用户代理和w m l 用户代理的集成,实现d e l t a b r o w s e r 的二合一版 本,目前已经应用于名人的信息终端。 d e l t a b r o w s e r 丌发采用增量丌发模式,集成并实现了w m l 、h t m l 及 h t m u w m l 二合一三个版本浏览器。 在多种平台实现d e l t a b r o w s e r ( x 8 6 ,d r a g o n b a l le z 3 2 8 ,e p s o n 手机板等) 。 1 4 论文章节安排 本论文以嵌入式浏览器技术为出发点,针对信息终端的特点。重点分析和实现 其相关技术,包括h t t p 、词法分析、语法分析、排版及g u i 接口等技术。 第一章概述嵌入式浏览器及两种互联模型,在说明论文课题来源同时总结了我 在硕士学位攻读期间的主要研究成果。 第二章分析嵌入式浏览器相关技术内容,综述了信息终端标记语言的发展过程 及其脚本语言的技术特点,指出了d e l t a b r o w s e r 的设计需求和原则,并建立了嵌入 式网络应用即d e l t a b r o w s e r 的体系结构参考设计模型。 第三章阐述d e l t a b r o w s e rh t m l 用户代理的设计原理,重点分析了对h t m l 词法语法分析、排版等的设计方法。 第四章阐述d e l t a b r o w s e rw m l 用户代理的设计原理,重点分析了对w m l 处 理流程、w m l s c r i p t 、w m l 主要组成部分及接口的设计和实现。 电子科技大学硕士学位论文 第五章阐述d e l t a b r o w s e r 模块接口设计原理和设计实现方法,同时论述其 h t t p 等应用层相关协议的设计与实现。 第六章内容总结d e l t a b r o w s e r 的实现情况,讨论了其开发过程、关键创新技术、 性能指标、实现平台及实际效果。 第七章总结论文的工作,讨论了本课题的成功以及下步的改进方向和目标。 4 皇王型垫查堂堕主兰垡堡苎 _ h _ h _ _ _ _ _ _ 一一 第二章嵌入式浏览器相关技术 2 1终端标记语言 w w w 网页是w w w 网信息组织的基本单位。w w w 服务器采用超文本 ( h y p e r t e x t ) 方式来存储文件,超文本文件在文本上用u r l 实现”镶嵌”许多”链接点 ”( l i n k ) ,协议允许一些u r l 指向服务器可以运行的程序以响应用户要求。例如, 用户要求发送一个电子订单,需要服务器运行接收订单的程序。而w w w 网页的这 些功能,必须有一种能支持这些功能的语言来描述,该语言就是超文本标记语言 h t m l ( h y p e r t e x tm a r k u pl a n g u a g e ) 睁】,它是w w w 上的操作语言,读者在w 曲上 的一切操作( 包括组织文件、建立连接、发布消息等) 都依靠h t m l 语言来完成,网 页需按这种语言格式书写。h t m l 文件是简单的纯文本文件( 全a s c i i 文件) ,在 m i m e 6 ( m u l t i p u r p o s e i n t e m e tm a i le x t e n s i o n s 多用途互联网邮件扩展) 机制中使 用h t m l ( 或h t m ) 扩展名,在文本中有h t m l 标注符。h t m l 语言标注简单明了,可 以定义文件的显示格式、标题、字型、表格、窗口等,使用辅助应用程序连入图像、 视频、声频等多媒体资料。h t m l 语言的局限性表现在:排版功能不强、灵活而不 规范等。 w w w 网由服务器、浏览器和通信协议三部分组成,采用c l i e n t s e r v e r 方式运 行,w w w 客户程序( 浏览器) 向w w w 服务器发出传送文件的请求,w w w 服务器 则根据请求将所需信息从存储地点返回浏览器。w w w 网规范的统一资源定位器 ( u r l ) 、传输信息的标准协议( 如h 订p ) 和标准的内容类型( 如h t m l 、w m l ) 保证其普遍的互操作性。w w w 服务采用为超文本传输协议h t t p ( i - i y p e a e x t t r a n s f e rp r o t o c 0 1 ) ,也可用文件传输协议f t p 等不同协议。请求资源通过u r l 指定, 它是w w w 网用于查找不同服务器上信息的一种地址语言,u r l 地址是信息在 i n t e m e t 上的标准通信地址。u r l 不仅告知浏览器信息在何处存放,它还告知使用 何种通信协议,u r l 的一般格式:( 通信协议) :( 主机名) ( 路径) ( 文件名) , 其中通信协议指使用的通信协议( 如h t t p ) ,主机指服务器的主机域名或i p 地址, 路径指示信息在主机上的路径,文件名表示信息文件名称, h t t p :w w w c h i n a s h i s h i c o m i n d e x h t m l 表示使用h t t p 协议且i n d e x h t m l 网页在 w w w c h i n a s h i s h i t o m 网站的根目录中。 电子科技大学硕士学位论文 2 1 2c h t 】l 随着i n t e m e t 发展。h t m l 面临两个方向的发展,一方面要求更丰富的多媒体 文档格式的支持,如:h m l 4 0 在h t m l 3 2 发展中加入了c s s 等新特征。另一方 面,对于后p c 时代的小信息家电,信息家电的软硬件限制需要h t m l 精简,c h t m l ( c o m p a c t h t m l ) 7 1 是日本a c c e s s 公司t o m i h i s ak a m a d a 向w 3 c 提交的一个应 用于小信息家电的n o t e 级标准。c h t m l 是h t m l 2 0 、h t m l 3 2 及h t m l 4 0 的 子集,主要应用在日本n t td o c o m o 提供的无线互联网服务i - m o d e 上。i - m o d e 服务于1 9 9 9 年2 月推出,借助于现有的i n t e r n e t 技术成为世界最成功的无线互联网 服务之一,最早地赋予了移动电话除通话外的功能,其计费按数据流量( 只要没有 数据传送,停留在网站上不支付钱) 。i - m o d e 手机主要用于预定机票和音乐会门票、 查询银行余额和转帐、阅读新闻和天气预报、查询火车时刻表和城市地图、发送和 接受电子邮件( 申请服务得到手机号码 d o c o m o n e j p 邮件帐号) 、下载壁纸和手机 铃声等。n t t d o c o m o 在c h t m l 基础上加入一些特殊手机用途标识符。特殊标 识符t e l 超链电话号码并直接拔号,如: c a l ls u z u k i ; a c c e s s k e y 属性表示快捷键操作, 如: c o m p a n y ;支持图形字符,如:s h i f t - j i s 编码;i s t y l e 属性设置 字母、数字等输入模式,如: 。i - m o d e 要求页面大小不超过5 k ,n t td o c o m o 推 荐2 k :不支持c o o k i e 、j s ;编码上采用s h i f i - j i s 来显示日文,i s o 8 8 5 9 - 1 来显示 英文;对g i f 大小、u r l 和书签名的长短限制;部分手机支持c h t m l 规范以外的 功能( 如表格和多种字体) 。 定义c h t m l 原则包含完全基于h t m l 、舍去需大的内存的f r a m e 和t a b l e 、 单色终端能显示、舍去需二维方向的焦点移动的t a b l e 、i m a g em a p 使其易操作。 由于内存有限,推荐对以下元素限制:i n p u t 的m a xb u f f e r 为5 1 2 b ,t e x t a r e a 的m a xb u f f e r 为4 0 9 6 b ,s e l e c t 的m a xb u f f e r 为4 0 9 6 b 。推荐b r o w s e r 设计支 持数字键直接超链,女l l m a r r y 。主 要特点体现在精简h t m l 元素上,c h t m l 不支持j p e o 图象、表格、图形地图、 多种字体和风格、背景颜色和背景图象、表单、样式表。c h t m l 网页要求很容易 导航,四个方向键( 前进、后退、选择、返回) 即可使用,面向的信息终端:1 2 8 5 1 2 k br a m ,5 1 2 1 m br o m ,1 1 0 m i p s 级别c p u ,5 0 x 3 0 、1 0 0 x 7 2 、1 5 0 x 1 0 0 点阵的小屏幕,颜色少( 主要单色) ,字体少( 如单字体) ,输入键少( 如数字键及 前、后、选择、后退) 。要求b r o w s e r 能在1 5 0 2 0 0 k b 数据区、1 5 0 2 0 0 k b 的代 码段的内存运行。 6 电子科技大学硕士学位论文 2 1 3 w m l ( 1 x ) w m l ( w i r e l e s sm a r k u pl a n g u a g e ) 【8 】是w a pf o r u m 提出的w a p 协议规范的 一部分。w a p ( w i r e l e s s a p p l i c a t i o n p r o t o c 0 1 ) 无线应用协议是在移动终端和互联网 之间进行通信的开放标准,以便开发各种无线终端( 主要是手机) 的应用和业务, 也被部分厂商用于有线信息终端。w m l 符合x m l 规范的标记语言,w m l 使用的 标签数量比h t m l 标签要少很多,w m l 的文档由一系列精心定义的用户交互单 元组成,一个交互单元称为一个卡( c a r d ) ,用户可以在一个或多个w m l 文档的 c a r d 之间进行浏览。w m l 用来定义窄带设备中用到的内容和用户接口,其设计受 到小型的窄带设备的限制,这些限制是小型显示屏、受限的用户输入、窄带网络、 有限的内存和计算的资源。w m l 主要有四个的功能:1 ) 文本显示和布局w m l 支持文本和图像,包括各种格式和排版命令,如可以定义粗体字。2 ) 页面卡片的 组织所有w m l 的信息都被组织在一系列的卡片和页面内,卡片指定一个或更多 的用户交互单元( 例如,菜单选择、文本屏或文本输入域) 。用户在逻辑上可在 系列的w m l 卡片中导航,检查每项内容、输入要求的信息、作出选择或移动到另 一张卡片上。把多张卡片组合在一起可构成页面,w m l 页面类似于个由u r l 标识的h t m l 页面,是内容传输的单位。3 ) 卡片间的导航和链接w m l 不仅支 持卡片和页面之间的导航,而且支持设备中的事件处理,这些处理可能用于导航或 脚本的执行。4 ) 字符串参数化和状态管理所有的w m l 页面都可以实现参数化, 这种参数化有助于提高网络资源的使用效率,变量可以在字符串的位置上使用并且 在运行时被替代。 w m l 和c h t m l 设计都针对手机类小型窄带设备。在指定导航( 如超链接) 及外部资源( 如图像或脚本) 时w m l 采用了w w w 网的u r l 机制,它的字段锚 由u r l 文件定义,后面紧随着井号( 拌) ,再后面是字段标识符,w m l 在页面中 借助字段识别符识别卡片( c a r d ) ,如果没有指定字段,u r l 则为整个页面。 w m l 符合x m l 规范且继承了x m l 文档的字符集。在s g m l 命名法中, 个文档字符集是该文档类型包含的所有逻辑字符( 例如,字母t 和识别这个字母 的固定整数) 。一个s g m l 或x m l 文档就是一系列这样的整数记号,这些记号放 在一起构成了一个文档。x m l 和w m l 的文档字符集是i s o i e c 1 0 4 6 i s 0 1 0 6 4 6 1 的通用字符集,该字符集与u n i c o d e2 0 u n i c o d e 保持一致,指的是同一个文档字 符集。w m l 对 x m l 】和 i s 0 1 0 6 4 6 】规范做进一步的修改和增强,w m l 页面不要 求使用完整的u n i c o d e 编码( 如u c s 一4 ) ,u n i c o d e 字符集的任何一个恰当的子集( 如 u s a s c i i 、i s o 一8 8 5 9 1 等) 都可以使用,未使用u t f _ 8 或u t f 1 6 编码的文档必须 象x m l 中样声明其编码方式。用户代理在处理文档之前,必须用某种方法将文 电子科技大学硕士学位论文 档的外部字符编码正确地映射成u n i c o d e 编码,任何实体的处理都在这个文挡的字 符集中进行,一个给定的具体实现可以选择一种方便的内部表示方法。w m l 支持 命名和数字字符实体,参考处理模型的一个重要结果就是所有数字的字符实体都参 考文档字符集( u n i c o d e ) 而不参考当前的文档编码( c h a r s e t ) ,意味着& # 3 0 2 总是 引用同样的逻辑字符,这些逻辑字符与当前的字符编码无关。w m l 支持已命名的 字符实体( 如:& a m p 和& l t ;) 、十进制的数字字符实体( 如:& # 3 2 ;) 和十六进制 的数字字符实体( 如:& 撑) 【2 0 ;) 。在处理w m l 时,有七个特别重要命名字符实体: ! - a p o s t r o p h e 2 】4x h t m 眦b a s i c c h t m l h t m l 有语法不严格、不利于扩展等缺点,且h t m l 设计时没有考虑 小设备需求。x h t m lb a s i c 9 的设计目的是提供一种针对手机、电视、p d a 等各种 信息设备通用的x h t m l 文档类型编写网页,新社团范围内的文档类型可以通过把 x h t m lb a s i c 作为子集定义来保证x h t m lb a s i c 通用性,可以在更多的互联网终 端上显示。x h t m lb a s i c 文档类型定义是以x h t m lm o d u l e s 定义为基础的, x h t m lm o d u l e s 在文档m o d t d a r i z a t i o no fx h t m l 中定义。x h t m lb a s i c 来源于 x h t m l ( 新一代的w w w 网标记语言) ,有x m l 的优点,同时考虑了c h t m l 、 w m l 和h t m l 4 0g u i d e l i n e sf o rm o b i l ea c c e s s 的优缺点。因为许多网页开发者熟 悉h t m l 的特性,所以这些特性构成了一种有用的主机( h o s t ) 语言。x h t m l b a s i c 限制网页编写语言的功能特性,h t m l 4 为桌面机设计的一些特性( 如f r a m e , a d v a n c e dt a b l e ,af i x e ds e to f a t t r i b u t ee v e n th a n d l e r s 等) 对非桌面设备不适用。其基 本设计原理也就是解释为什么h t m l 中的有些特性x h t m lb a s i c 中没有,包含: ( 1 ) 样式表x h t m lb a s i c 不支持元素 ,建议使用 元素外部样式表 单,元素 和 以及属性 用来指定构件的风格信息,构件及其属性 描述分离使用户代理可以灵活的处理显示风格,支持样式表单则下载处理,属性 m e d i a 的类型选择适当的样式;( 2 ) 脚本和事件x h t m l b a s i c 不支持元素 和 ,小设备通常内存和c p u 处理能力有限,不支持执行脚本程序,不支 电子科技大学硕士学位论文 持用来激活脚本程序的事件处理属性,事件是设备依赖的,一个i n c o m i n g c a l l 事件 在电视机中是不可能发生的,一般的事件处理机制比在文档类型定义中定义事件名 字的方式更合适;( 3 ) 显示许多简单的网络终端只能显示等宽字体,双向文本 ( b i d i r e c t i o n a lt e x t ) 、不支持加粗字体和其它的文本扩展元素,建议使用样式表描 述风格;( 4 ) f o r m 表单支持b a s i cx h t m l f o m s ,因为只有具有文件系统的设备 才可以利用f o r m 中的文件和图象输入类型,所以这些类型在b a s i cx h t m lf o r m s 中不支持,而且内容开发者还应知道一些设备是不能输入很多字符的( 如移动电 话) ;( 5 ) t a b l e 支持b a s i c x h t m l t a b l e s ,但是t a b l e s 在小设备上是很难显示的, b a s i ct a b l e sm o d u l e 不允许t a b l e s 嵌套。( 6 ) f r a m e不支持f r a m e s ,f r a m e s 依赖 于屏幕接口,不能应用到电话等小设备。 x h t m lb a s i c 一致性规定包含两方面:( 1 ) 文档一致性x h t m lb a s i c 文档 的兼容性是指x h t m lb a s i c 文档需满足本规范中强制要求的功能:遵守其d t d 的 限制、根结点必须是 、根结点缺省的n a m e s p a c e 名字必须是x h t m l n a m e s p a c e 名h t t p :w w w w 3 o r g 1 9 9 9 x h t m l 、文档根结点前必须有d o c t y p e 声名,d o c t y p e 声名中如果出现标识符 p u b l i c ”,那么该标识符必须通过正式的公共标识符指向 h t m ll i n km o d u l e 描述的d t d ,标识符“s y s t e m 可以做适当的修改。一个完整的 例子: ,d t d 子集不能用来替换 d t d 中的任何参数实体。( 2 ) 用户代理致性规则用户代理必须遵守x h t m l l 0 规范中定义的“用户代理一致性规则”。 x h t m lb a s i c 文档类型被定义为一组x h t m l 模块。所有的x h t m l 模块都 在规范“m o d u l a r i z a t i o no f x h t m l ”中定义,见表1 - 1 。同时,因为h 咖l 事件处理 属性没有包括在x h t m lb a s i c 中,在表单之外的表单控件有可能不能完成用户期 待的功能。 表1 - 1x h t m lb a s i c 的x h t m l 模块组成见表 模块名称包含的标签 结构模块( + ) b o d y ,h e a d ,h t m l ,t i t l e 文本模块( ) a b b r ,a c r o n y m ,a d d r e s s ,b l o c k q u o t e ,b r c i t e ,c o d e , d i l l ,d i v ,e m ,h l ,1 1 2 ,h 3 ,h 4 ,h 5 ,h 6 ,k b d , p ,p r e ,q s a m p ,s p ,s t r o n g , v a t 超链模块( ) 列表模块( + )d l ,d t ,d d ,o l ,u l ,l i 基本表单模块 f o r m ,i n p u t ,l a b e l ,s e l e c t ,o p t i o n ,t e x t a r e a 基本表格模块 c a p t i o n ,t a b l e , t d ,t h ,t r - 图象模块 l i n g 对象模块 o b j e c t ,p a r a m 电子科技大学硕士学位论文 im e t a 信息模块 m e t a i 连接模块 l i n k i lb a s e 模块 b a s e ( + ) = x h t m lh o s tl a n g u a g e 模块定义要求模块 综上所述,标记语言的经历了s g m l 、h t m l ( h t m l 2 0 ,h t m l 3 2 h t m i a o ) 、 x m l 和x h t m l 发展历程。伴随这个过程,信息终端标记语言经历了c h t m l 、 w m l 、h t m l 4 0g u i d e l i n e sf o rm o b i l ea c c e s s 、x h t m l b a s i c 及w m l 2 o ( x h t m l m o b i l ep r o f i l e ) 发展历程,过程如图2 1 所示,其规范性、可扩展性和通用性越来 越好,功能越来越强。目前移动终端两种主要商业模式w a p 和i - m o d e 分别采用 w m l w m l s c r i p t 和c h t m l 。随着w a p 2 0 协议规范的推出,w m l 2 采用了x h t m l m o b i l ep r o f i l e ,它是x h t m lb a s i c 的严格超集。从分析可以看出,为满足信息终端 和低网络带宽要求它们有许多公共特征,都遵守互联网上基本规范r f c ( 如:u r l , d t d ) ,所具有的功能基本相同( 包括文本、简单图象、超级链接、输入等) ,弱支 持图象动画等多媒体。同时各种标记语言开发具有差异性,w m l 支持w m l s c r i p t 和内容编码且使用u n i c o d e2 , 0 字符集,w m l 、x h t m l 句法严格规范,w m l 分d e c k 和c a r d 两个层次,并且不与h t m l 兼容,所有网站都需要专门的制作工具、 协议栈及其网关支撑。c h t m l 、x h t m lb a s i c 与h t m l 兼容,其网页设计可以充 分利用现有网络资源,如h t m l 工具软件,同时两者不支持s c r i p t 脚本。c h t m l 使用i s o8 8 7 8 1 9 8 6 字符集,并且不支持t a b l e 标签。从中看出信息终端标记语言的 发展趋势:支持包括标题、段及列表 等简单的文本,具有超链和关连文档 连接,采取编码或压缩方式减少流 量,提供适用简单的排版标签( 简单 f o r m 和不嵌套t a b l e ) ,不支持t 臣a m e 、 j a v a s c r i p t v b s c r i p t 脚本。同时要求 与现有的n t e m e t 标准兼容,如采用 u r l 方案等,支持有限多媒体g i f t f l a s h 等。 2 2 脚本语言 图2 一i 标记语言发展 应用于标记语言的s c r i p t 脚本包括v b s c r i p t 、g a v a s c r i p t l l o j 、j s c r i p t 、w m l s c r i p t l l 】 等。v b s c r i p t 为微软的v i s u a lb a s i c 的轻量级的子集,j s c r i p t 是e c m a s c r i p t 【1 1 】的 m i c r o s o f t 版本,e c m a s c f i p t
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论