(微电子学与固体电子学专业论文)基于arm的h264编解码实现.pdf_第1页
(微电子学与固体电子学专业论文)基于arm的h264编解码实现.pdf_第2页
(微电子学与固体电子学专业论文)基于arm的h264编解码实现.pdf_第3页
(微电子学与固体电子学专业论文)基于arm的h264编解码实现.pdf_第4页
(微电子学与固体电子学专业论文)基于arm的h264编解码实现.pdf_第5页
已阅读5页,还剩69页未读 继续免费阅读

(微电子学与固体电子学专业论文)基于arm的h264编解码实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要:由国际电信联合会视频编码专家组和国际化标准组织运动图像专家组联合 制定的h 2 6 4 视频压缩标准,凭借相对其它标准较高的压缩效率和优秀的图像质 量,已经成为目前最流行的视频处理协议,具有广阔的前景和巨大的应用价值, 考虑其复杂的计算度,目前主流的实现方式包括a s i c 的专用集成电路实现和d s p 的纯软件实现等等。 a r m 处理器伴随着技术的进步,加入对数字信号处理的有效支持之后,在视 频编解码领域的应用也越来越广泛,本文就是在考虑这点的基础上,研究利用深 圳武耀博德公司设计的,基于i n t e l 高性能的p x a 2 7 0 处理器的多功能嵌入式开发 平台e e l i o d 来实现h 2 6 4 的编解码。 本文对h 2 6 4 协议主要算法进行了研究,在基于a r m 的e e l i o d 平台上利用 w i n c e 嵌入式实时操作系统,通过e v c 编译环境,实现对w i n d o w sv i s u a lc + + 下x 2 6 4 - 0 6 0 8 0 5 代码的编码移植和对j m l 0 1 的解码移植。 关键词;h 2 6 4 :a r m ;j m ;x 2 6 4 ; 分类号:t n 4 7 ;t n 9 1 9 8 1 a b s t r a c t :a si t sh i g h e rc o m p r e s s i o nr a t i o na n db e t t e ri m a g eq i i a l i t y , t h eh 2 6 4 , w h i c hi st h en e wv i d e oc o m p r e s s i o ns t a n d a r dw o r k e do u tb yj v t ( j o i n tv i d e o1 e a m 卜 - - c o m e si n t oe x i s t e n c ef r o mt h ev c e g ( v i d e oc o d i n ge x p e r tg r o u p ) o f i t u - ta n dt h e m p e g ( m o f i o np i c t u r ee x p e r tg r o u p ) o fi s o i e c ,h a sb e e nw i d e l ya c c e p t e da n du s e d i n m a n ya p p l i c a t i o n s c o n s i d e r i t s c o m p u t a t i o n a lc o m p l e x i t y , p e o p l eu s ea s i c ( a p p l i c a t i o ns p e c i a li n t e g r a t e dc i r c u i t ) o fd s p ( d i g i t a ls i 孕a lp r o c e s s ) t oi m p l e m e n t t h eh 2 6 4 se n c o d i n g d e c o d i n g w i mt h ea d v a n c e m e n to ft h et e c h n o l o g y , t h ea r mp r o c e s s o ra d d si t ss u p p o r to f d i g i t a ls i g n a lp r o c e s sa n du s e dh i g h e rf t e q u e n f l yi nt h ef i e l do f v i d e oe n c o d i n g d e c o d i n g c o n s i d e r i n gt h i s ,t h ea r t i c l es t u d yt h ei m p l e m e n t a t i o no f t h eh 2 6 4 se n c o d i n g d e c o d i n g b a s e do nt h ee e l i o de m b e d d e ds y s t e mw h i c hi sd e s i g n e db ys h e n z h e n5 1 b o a r d i n f o r m a t i o nt e c h n o l o g yc o m p a n ya n db u i l to nt h ei n t e l sp x a 2 7 0p r o c e s s o r i nt h ep a p e r , id os o m er e s e a r c ha b o u tt h em a i na l g o r i t l u no f h 2 6 4 ,a n di m p l e m e n t t h eh 2 6 4 se n c o d i n ga n dd e c o d i n gi nt h ew i n c ee m b e d d e ds y s t e mb a s e do nt h e e e l i o d 1 1 l ee n c o d i n gc o d ei sb a s e do l lt h ex 2 6 4 - 0 6 0 8 0 5a n dt h ed e c o d i n gc o d eo nt h e j m l 0 1 k e y w o r d s :h 2 6 4 ;a r m ;j m ;x 2 6 4 : c l a s s n o :1 小4 7 :t n 9 1 9 8 1 学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国 家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名:。肇夺 签字日期:乒口7 年压月胳日 导师签名:兽冬乙 签字日期:伽刁年月扩日 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研 究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或 撰写过的研究成果,也不包含为获得北京交通大学或其他教育机构的学位或证书 而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作 了明确的说明并表示了谢意。 学位论文作者签名:印聋 签字日期:叼 年压月缪日 致谢 本论文的工作是在我的导师骆丽教授的悉心指导下完成的,骆丽教授严谨的 治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢三年来骆丽 老师对我的关心和指导。 李哲英教授悉心指导我们完成了实验室的科研工作,在学习上和生活上都给 予了我很大的关心和帮助,在此向李哲英老师表示衷心的谢意。 刘元盛教授对于我的科研工作和论文都提出了许多的宝贵意见,在此表示衷 心的感谢。 在实验室工作及撰写论文期间,盂晓、于庆梅等同学对我论文中的h 2 6 4 研 究工作给予了热情帮助,在此向他们表达我的感激之情。 另外也感谢我的父母,他们的理解和支持使我能够在学校专心完成我的学业, 鼓励着自己一直前进。 1 1 目前的现状 1 引言 最近几十年,随着科技的迅速进步,人类社会步入了真正意义上的信息社会, 人类对信息的处理进入到了数字领域和网络交互使用阶段,面对的对象从开始的 文本信息逐步转变为多媒体信息。 所谓多媒体,即文字、图像、声音以及视频等的综合体,特别是视频,因为 其直观、娱乐性强已经成为多媒体中的核心,但其包含的信息量巨大,虽然已有 各种成熟的压缩算法,比如m p e g 2 4 ,h 2 6 3 ,但依然无法阻止压缩后仍然庞大的 码流成为网络平台与用户交互过程中的瓶颈。 从以上现状可以知道,要解决视频信息与用户交互的问题,关键在于产生新 的视频压缩算法,来对视频信息进行更加有效的压缩,使得压缩后的信息码流能 够满足用户在现有网络环境下的实时传输处理和存储。 h 2 6 4 正是基于以上背景产生的新一代视频编码标准,它由国际电信协会 ( i n t e r n a t i o n a lt e l e c o m m u n i c a t i o nu n i o n , r r u ) 的视频编码专家组( v i d e oc o d i n g e x p e r t sg r o u p ,v c e g ) 和国际标准化组织( i n t e r n a t i o n a ls t a n d a r d i z a t i o no r g a n i z a t i o n , i s o ) 的运动图像专家组( m o t i o np i c t u r ee x p e r t sg r o u p ,m p e g ) 联合成立的“联 合视频组”o v t :j o i n t v i d e o t e a m ) 共同制定的新视频标准,该标准也被i s o 接受, 称为a v c ( a d v a n c e d v i d e oc o d i n g ) ,是m p e g - 4 的第1 0 部分。该标准主要面向视 频传输,具有压缩率商、适用范围广等优点【i l 。 与现有的h 2 6 3 和m p e g - 4 相比较,h 2 6 4 拥有更高的压缩效率和图像质量。 在同等的图像质量条件下,h 2 6 4 的数据压缩比比当前d v d 系统中使用的m p e g - 2 高2 到3 倍,比m p e g - 4 高1 5 到2 倍。这样的特性为视频电话,可视会议等实时 应用和存储,流媒体等非实时应用的实现都提供了保证。 h 2 6 4 性能的大幅提升很大程度上是以计算复杂度的大幅增加为代价。包括分 层设计、多模式高精度运动补偿、多参考帧预测、统一变长编码和基于内容的自 适应算术编码等等,这些都显著提高了预测精度,从而获得了较之其它标准更加 优秀的压缩性能。 尽管h 2 6 4 具有这么多优点,但它运算复杂度提升依然带来了问题,即一般 的图像处理芯片难于满足实时编解码的要求。目前主流嵌入式平台( d s p ,a r m ) 的发展很大程度上缓解了这个问题,很多主流公司都采用a r m + d s p 的双核应用 在移动平台上,常用的做法是利用a r m 复杂系统运行,d s p 用于视频解码,特别 是将h 2 6 4 算法在高速d s p 平台上实时实现是目前多媒体信号处理及图像通信研 究领域的一个热点问题,同时由于a r m 芯片的多媒体处理能力增强,利用a r m 实现h 2 6 4 也逐渐变得可行,也有公司推出了双a r m 核作为处理核心,进行系统 任务和视频编解码,因为a r m 芯片的通用性,必将能够在未来的h 2 6 4 芯片市场 占据一席之地1 2 1 1 3 1 。 1 2 研究目标及挑战 e e l i o d 是由深圳武耀博德公司设计的,基于i n t e l 高性能的p x a 2 7 0 处理器的 多功能嵌入式开发平台。 本次研究目标为在e e l i o d 平台上,采用w i n c e 5 0 操作系统,实现h 2 6 4 的 编解码,并利用其系统上的s h a r p 八寸1 下t 液晶屏对编码结果进行验证。 因为编码算法实现利用的原型是x 2 “0 6 0 8 0 5 ,而解码使用的j m l 0 。1 原型, 都只在w i n d o w s 平台下v c + + 编译器验证通过,要移植到a r m 平台下,需要解 决相关函数重写,头文件重定义等等问题,两个平台对a p i 函数的支持不一致, w i n c e 相对较少,所以困难主要在于对程序的修改编译,最后的联调在这里不做 复述。 1 3 本文的主要内容及安排 h 2 6 4 的编解码实现是目前各高校图像通信研究领域的一个热点问题,它的研 究以及实现具有巨大的现实意义。本文的研究重点在于对h 2 6 4 标准做出相关的 研究,对其编码的流程做出一定的总结,并采用a r m + w 巧c e 的组合,利用 x 2 6 4 - 0 6 0 8 0 5 j m l 0 1 代码,实现h 2 6 4 的编解码。 全文内容安排如下: 第二章主要对h 2 6 4 协议进行了简单的介绍,并对它的主要特征做了分 析; 第三章针对a r m 平台,对e e l i o d 平台所使用的p x a 2 7 0 嵌入式处理器 以及平台所采用的w i n c e 操作系统作了相应的介绍; 第四章结合标准的h 2 6 4 代码j m l 0 1 中的程序分析介绍帧内预测编码和 熵编码; 第五章针对h 2 6 4 的协议移植,具体介绍了平台的搭建,w i n c e 系统的 生成导入以及程序移植的要点,最后给出了测试结果; 2 第六章给出总体结论,并提出下一步的计划; 3 2 1h 2 6 4 标准介绍 2h 2 6 4 标准概述及分析 2 1 1h 2 6 4 标准制定及产生过程 在1 9 9 5 年r r u t 完成了视频电话的h 2 6 3 标准之后,该组织盯i 1 视频编码 专家组v c e g 着手在两方面开始进一步的研究:一是短期研究,努力在h 2 6 3 中 增加许多额外的特征,这就形成h 2 6 3 的第二版本h 2 6 3 + 和第三版本h 2 6 3 h j 4 】; 二是长期研究,着手制定低比特率的视频通信新标准,这就是h ,2 6 l 标准,它提 供比以前的r r u t 标准更为有效的视频压缩。与此同时,i s o i e c 的运动图像专家 组m p e g 意识到了h 2 6 l 潜在的优越性能,结果i s o i e c 的m p e g 与r r u - t 的 v c e g 联合成立了“联合视频组”j ( j o i n tv i d e ot e a m ) ,共同制定新的建议。 事实上,n 呵的努力最后产生了两个相同的标准,邸i s o 的m p e g - 4 的p a r t l 0 和 i t u t 的h 2 6 4 。h 2 6 4 标准制定的时间大致如下嘲: 1 9 9 8 年2 月j v t 正式开始提案征集。 1 9 9 9 年8 月完成第一版草案和测试模型。 2 0 0 1 年9 月,在j v t 的第一次会议上形成h 2 6 4 的w d 2 ( w o r k d r a 舵) 版,并推出测试模型t m l 9 ( t e s tm o d e ll o n gt e r mn u m b e r 9 ) 。 2 0 0 2 年7 月j v t 第四次会议上推出h 2 “的c d ( c o m m i t t e ed r a f t ) 版。 2 0 0 3 年3 月公布了标准的最终草案,称作h 2 6 4 a v c 或者m p e g - 4 v i s u a l p a r t l 0 。正式名称为r r u - tr e c h 2 6 4ii s o i e c1 4 4 9 6 1 0a v c ( d r a t ! tr r u - t r e c o m m e n d a t i o na n df i n a ld r a f ti n t e r n a t i o n a ls t a n d a r d o fj o i n tv i d e o s p e c i f i c a t i o n ) 。 2 0 0 3 年9 月公布了草案勘误表( d r a f te r r a t al i s tw i t hr e v i s i o n - m a r k e d c o r r e c t i o n sf o rh 2 6 4 膳l v c ) 。 2 0 0 4 年7 月提交了v e r s i o n3o f h 2 6 轨w c 。 2 1 2h 2 6 4 与其它视频压缩标准比较 h 2 6 4 与h 2 6 1 h 2 6 3 和m p e g - x 相比有很大改进,它不仅包含有一个规定视 频编码算法的视频编码层( v c l ,v i d e oc o d i n gl a y e r ) ,还包括一个规定网络传输 规范的网络提取层( n a l ,n e t w o r ka b s t r a c t i o nl a y e r ) 。h 2 6 4 的视频编码层采取 4 的编码框架仍然是传统的混合编码框架,h 2 6 4 编码效率的提高也不只是其中某一 项新的编码技术所产生的决定性的结果,而是多种新技术所产生的细微的效果累 计而致。这些新技术包括:多种新的帧内预测方法、可变尺寸块的运动补偿技术、 多参考帧的运动补偿技术、4 x 4 整数变换技术、新的环路滤波技术等【6 】用。整体的 编解码框图如图2 - 1 ,2 - 2 所示: 图2 - 1h 2 6 4 编码器 f i g u r e2 - 1 h 2 6 4e n c o d e f 图2 - 2h 2 6 4 解码器 f i g u r e2 - 2 h 2 6 4d e c o d e r h 2 6 4 与先前的标准相比,应用前景更加广泛,例如它允许在i n t e r a c t 中以 1 m b i t s 的速率传送电视质量的视频信号,它可以使8 m h z 的模拟带宽中容纳两倍 于m p e g 2 编码的数字电视频道,它使无线视频通信成为可能,它对传统的数字 媒体存储技术也将产生巨大的影响。 h 2 6 4 的特点可以归纳为三个方面【川:一是注重实用,采用成熟的技术,追求 更高的编码效率,简洁的表现形式;二是注重对移动和m 网络的适应,采用分层 技术,从形式上将编码和信道隔离开来,实质上是在源编码器算法中更多的考虑 到信道的特点;三是在混合编码器的基本框架下,对其主要关键部件都做了重大 改进,如多模式运动估计、帧内预测、多帧预测、统一v l c 、4 x 4 二维整数变换 5 等。 需要指出的是,h 2 6 4 的优越性能的获得是以计算复杂度的大大增加为代价 的,据估计,编码的计算复杂度大约相当于h 2 6 3 的三倍,解码复杂度大约相当 于h 2 6 3 的2 倍。 2 2h 2 6 4 的主要特征 2 2 1h 2 6 4 的分层处理 与早期的视频压缩标准一样,h 2 6 4 标准并没有明确定义编解码器算法,而是 定义了编码视频码流的结构和这个视频码流的解码方法。h 2 6 4 的编解码结构功能 框图如图2 1 所示: h 2 6 4 算法在概念上可以分为两层:视频编码层( v c l ) 负责高效的视频内容 表示;网络提取层( n a l ) 负责按照网络所要求的适当方式对数据进行打包和传 送,h 2 6 4 编码器分层结构图中的h 3 2 4 m 表示用于移动的h 3 2 4 系纠明。图2 3 给出了上述两个层次的关系: r 磊h 视频编码层( v c l ) 卜卓 h :。l 筹彳兰卜,撕i 图2 - 3 视频编码层和网络抽象层 f i g u r e2 - 3 v c la n d n a l h 2 6 4 的视频编码层由h 2 6 4 所定义的编码方案表面上类似于已获得成功 应用的视频编码标准( 比如h 2 6 3 和m p e g 2 ) 。也包括了基于块的运动补偿,基 于d c t 交换的残差编码,因比特率控制而引入的可变量化步长,z i gz a g 扫描和 系数的v l c 编码等。然而,h 2 6 4 草案的v c l 层除了通用的基于块运动补偿的混 合编码之外,还具有一些其他视频编码建议所没有的特性。为了增加标准应用的 灵活性,h 2 6 4 建议与以前的建议一样,没有考虑视频的前处理和后处理功能。 6 在v c l 中,运动补偿的过程不同于先前标准,一个1 6 x 1 6 的宏块可以具有7 种不同形状和尺寸的块运动预测,最小的块尺寸可以是4 x 4 ,因此每个宏块可以有 l 、2 、4 、8 或1 6 个运动矢量,缺省的运动矢量精度通常为1 4 像素,最初草案中 h 2 6 4 选项也支持运动矢量1 8 像素精度。支持小数取样内插滤波、支持多参考帧 图像,除了i 帧,p 帧和b 帧外还支持两种类型的s 帧,即s p 帧和s i 帧。s p 帧 类似于p 帧,是一种充分利用运动预测编码来去除时间相关性的方法,它与p 帧 的区别在于及时采用几个不同参考帧预测时,也可以允许有相同的重建帧。这种s 帧的引入,对于在比特流中进行帧切换、拼接、随机存取、快进、快退等功能的 实现更为方便。在编码器预测环路采用了去方块效应滤波, h 2 6 4 的网络提取层网络提取层( n a l ) 负责使用下层网络的分段格式来 封装数据,包括组帧、逻辑信道的信令、定时信息的利用或发序列结束信号等。 例如,n a l 支持视频在电路交换信道上的传输格式,支持视频在i n t e m e t 上利用 r t p - u d p 坤传输的格式。n a l 包括网络提取层的头信息、段结构信息和实际载荷 信息,即上层的v c l 数据。n a l 提供适当的映射方法将头部信息和数据映射到传 输协议层上。可以减少在分组交换传输中组帧和重同步所需要的资源开销。 为了提高在不同特性的网络上定制v c l 数据格式的能力,h 2 6 4 的网络提取 层在v c l 和n a l 之间定义了基于分组的接口规范、打包方式等,也包括了相应 的信令内容。这样,高效率编码任务和网络友好性任务就由v c l 和n a l 分别来 完成。 2 2 2h 2 6 4 的档次和级别 h 2 6 4 标准规定了三个档次、它们是基本档次b a s e l i n ep r o f i l e 、主档次一 m a j l lp r o f i l e 、扩展档次e x t e n d e dp r o f i l e ,分别对应于不同场合的应用【1 0 1 。 日前一个新的扩展档次的标准化工作正在进行,郾专业扩展档次e x t 钆d c d p r o f e s s i o n a lp r o f i l e ,其主要应用为超高质量的视频图像,数字影院。 属于某个档次的h 2 6 4 解码器必须支持这个档次所包括的所有内容,而编码 器则不需要支持这个档次的所有内容,但是要符合标准规定的码流结构。h 2 6 4 的 三个档次规定的内容如下: 基本档次基本档次包含除了下述两部分之外的所有h 2 6 4 标准所规定的 内容。这两部是: b 帧、加权预澳d ( w e i g h t e dp r e d i c t i o n ) 、自适应算术编码( c a b a c ,c o n t e x t - b a s e d a d a p t i v eb i n a r ya r i t h m e t i cc o d i n g ) 、场编码( f i e l dc o d i n g ) 及其视频图像宏块自 适应切换场和帧编码( m b a f f ,m a c r ob l o c k a d a p t i v ef i e l d f r a m ec o d i n g ) 。 7 s p s i 片( s l i c e ) 和片的数据分割( d a t ap a r t i t i o n i n g ) 。 主档次首先主档次包含了基本档次中不包括的上述第一个部分,同时主 档次不包含基本档次中所包含的灵活宏块顺序( f m o ,f l e x i b l em a c r ob l o c k o r d e r i n g ) 、任意片顺序( a s o ,a r b i t r a r ys l i c eo r d e r i n g ) 和可冗余的图片数据 ( r e d u n d a n tp i c t u r e sf e a t u r e s ) 这些内容。 扩展档次扩展档次包含了除自适应算术编码之外的所有h 2 6 4 标准所规 定的内容。 图2 4 给出了各种档次所支持的编码工具: 图2 - 4h 2 “的档次结构图 f i g u r e2 - 4 t h e8 1 r u c t u o f h 2 6 4p r o f i l e 2 2 3 多种帧内预测模式 在以往的视频编码标准中,帧内图像编码是直接对宏块进行d c t 变换、量化 和熵编码生成输出比特流,帧内编码的数据量往往要比帧间编码图像大很多,在 所制刷新、码流控制以及增加抗误码性能时引入的帧内编码往往造成码率的不平 稳现象。h 2 6 4 在帧内编码作了进一步改进,类似于帧间编码引入了帧内预测方式, 即对编码宏块进行不同模式的帧内预测,然后对预测误差信号进行d c t 变换,避 免了以往帧内编码的缺陷。帧内4 x 4 亮度块共有九种可选帧内预测模式,帧内 1 6 1 6 亮度块共有4 种可选帧内预测模式。而帧内8 8 色度块有四种预测模式。 2 2 44 4 块的整数变换 与以往的视频编码标准类似,h 2 6 4 对残差采用基于块的变换编码,而且这种 变换是整数操作而不是实数运算,其过程和d c t 基本相似。这种方法的优点在于: 在编码器和解码器中可以得到精度相同的正变换和反变换,便于使用简单的定点 运算方式。也就是说,这种变换不会出现“反变换误差”,从而消除因变换精度所 8 引起的图像失真。变换的最小单位是4 x 4 块,而不是以往的常用的8 x 8 块。由于 用于变换块的尺寸的缩小,运动物体的划分更精确,这样,不但变换计算量比较 小,而且在运动物体边缘处的衔接误差也大为减小。为了使小尺寸块的变换方式 对图像中交大面积的平滑区域不产生块之间的灰度差异,可对帧内宏块亮度数据 的1 6 个4 x 4 块的d c 系数( 每个小块一个系数,共1 6 个) 进行第二次4 x 4 块的 变换。因此h 2 6 4 标准中的变换主要有三种:4 x 4 残差数据变换,4 x 4 亮度直流系 数变换( 1 6 x 1 6 帧内模式下) ,2 x 2 色度直流系数变换。h 2 6 4 协议中的量化采用分 级量化原理i l ”。 9 3a r m 处理器及开发平台 因为本文主要研究基于以p x a 2 7 0 为核心的嵌入式平台结合w i n c e 嵌入式操 作系统对h 2 6 4 的实现,因此本章将对a r m 芯片,w i n c e 系统,及开发平台统 一作相关的介绍。 3 1a r m 处理器简介 a r m ( a d v a n c e dr i s cm a c h i n e s ) 是一家微处理器公司,1 9 9 0 年成立于英国 剑桥,致力于精简指令集嵌入式处理器的研究和设计。1 9 9 1 年推出第一个r i s c 的微处理器设计a r m 6 ,之后的几年中陆续推出a r m 7 、a r m s 、a r m 9 、a r m l 0 和a r m l l 系列微处理器,其体系结构版本也由v 1 演化到、,6 ,处理能力也达到了 惊人的1 0 0 0 m i p s ( 百万指令每秒) 。 目前a r m 家族的处理器分为三类:应用处理器核、嵌入式处理器核和安全核。 应用处理器核是在嵌入式处理器上扩展c a c h e ,扩展m m u 以及1 0 核外围总线而 构成的微处理器,主要应用在移动设备,手持终端,路由器等网络设备中;安全 核是为了实现安全计算环境而设计的微处理器,几乎支持所有的加密算法,广泛 应用在s m a r t p h o n e 、s m a r t c a r d 、指纹识别以及各种安全扫描应用上;嵌入式处理 器核则仅仅包含a l u 、移位器、调试支持部件和乘法器等基本运算功能器件的处 理器核,主要用于给第三方制造商提供基本的计算能力支持,在此基础上,很多 第三方的半导体制造商推出了基于a r m 嵌入式处理器核的应用处理器。例如i n t e l 的s t r o n g a r m 系列,s a m s u n g 公司的s 3 c 系列等等u ”。 3 1 1a r m 处理器架构特点 a r m 处理器属于精简指令集的处理器,因此其体系结构比复杂指令集的处理 器要简单很多。通常来说,a r m 由3 2 位a u ,、地址加法器、3 1 个3 2 位通用寄 存器及6 个3 2 位状态寄存器、3 2 x 8 位乘法器、3 2 x 3 2 位桶形移位器、指令译码器 和数据地址寄存器组成。以典型的a r m t t d m i 为例,其内部实现了三级流水线, 采用流水线互锁、旁路和分支预测克服了流水线中的相关,极大的提高了流水线 的吞吐量。此外,独立的地址加法器也节省了a u j 的时问,地址的加法通过加法 器来完成,a l u 只负责操作数的各种运算。最有特色的桶形移位器,可以把乘法 操作或者加减法操作转换为移位操作,缩短了算术指令的执行时间。同时还包含 1 0 了对硬件调试的支持,通过标准的j t a g 协议,能够对目标代码进行在线调试,缩 短软件开发时间,降低开发成本。 a r m 的地址线是3 2 位的,所以可以寻址的空间是4 g b 。a r m 架构的处理器 一般片内没有配置r a m 和r o m ,因此,系统所需要的r a m 和r o m 都要通过总 线来外接。此外,一些高端的应用处理器还配置的c a c h e 。常用的c a c h e 有指令和 数据统一的c a c h e 和指令和数据分离的i - - c a c h e 和d - - c a c h e 。下面表格给出了 c a c h e 结构和性能之间的一个关系表: 表3 - 1c a c h e 结构性能关系表 t a b l e 3 1r e l a t i o nt a b l eb g l w t m lc a c h e ss t r u c t u r ea n dp e r f o r m a n c e c a c h e 结构 性能 无c a c h e l 仅i - c a c h e 1 9 5 仅d c a c h e 1 1 3 i - c a c h e 和d - c a c h e2 5 目前新型的a r m 处理器大多数都采用独立的指令和数据c a c h e 的缓存结构。 例如i n t e l 公司的s a l l l 0 处理器内含有1 6 k 字节的i - c a c h e 和8 k 字节的d - c a c h e 。 a r m 结构处理器核内部没有i o 模块,y o 功能必须通过a m b a 总线来扩充。 a r m 系统的应用处理器以及第三方的应用处理器的i o 结构一般有三种:存储器 映像y o 、直接存储器存取d m a 、中断i r q 和快速中断f i q 。 a r m 处理器同时支持两种指令集,分别是3 2 位的a r m 指令集和1 6 位的 t h u m b 指令集。t h u m b 指令集是a r m 指令集的一个子集,包含了a r m 指令集中 最常用的指令。在我们的嵌入式应用程序中,可以根据应用程序运行的硬件环境 来选择合适的指令集。就嵌入式操作系统运行的硬件环境而言,内存子系统的配 置有两个参数:容量和总线宽度。容量表示内存的大小,比如8 m b ,3 2 m b :总 线宽度表示内存的一次读或写操作能够传输的比特数,比如1 6 位,3 2 位。当运行 环境的内存容量非常小时,t h u m b 指令集是最好的选择,因为3 2 位的空间,能够 容纳两条t h u m b 指令,却只能容纳一条a r m 的指令。当运行环境的总线宽度是 1 6 位时,t h u m b 指令集的性能要优于a r m 指令集,因为a r m 指令的长度是3 2 位,每取一条a r m 指令,需要访问两次内存;而t h u m b 指令的长度是1 6 位,每 取一条t h u m b 指令,只需要访问一次内存。一般而言,t h u m b 代码的尺寸是相同 功能a r m 代码的6 5 ,而且t h u m b 代码在1 6 位总线上的性能是a r m 代码的 1 6 0 。但t h u m b 指令集毕竟只是a r m 指令集的子集,很多a r m 指令在t h u m b 代码中无法使用,功能上弱于a r m 指令集。由于a r m 平台同时支持a r m 和 t h u m b 指令集,我们可以在应用程序中混合使用a r m 和t h u m b 指令进行程序设 计,但这会带来额外的状态切换开销。所以如果内存容量相当,并且采用3 2 位地 址线时,应毫不犹豫选择a r m 指令集 1 3 】。 3 1 2p x a 2 7 0 处理器介绍 英特尔公司于2 0 0 3 年底推出了性能最为强劲的p x a 2 7 x 嵌入式处理器,最高 频率可达6 2 4 m h z 。作为一款性能极其强劲的嵌入式处理器,配合嵌入式l i n u x 或 w i n c e 操作系统,p x a 2 7 0 理论上可以支持任何媒体格式,并通过软件升级,支持 未来媒体格式。但由于媒体播放对硬件的极高要求,因此单纯依靠p x a 2 7 0 处理 器进行媒体播放是不现实的,实际测试的结果也不理想。因此,为了满足p ) 【a 2 7 0 的p m p ( m p 4 ) 功能,必须外加2 7 0 0 g 多媒体加速芯片,配合p x a 2 7 0 进行视频 加速与3 d 加速。 p x a 2 7 0 天生不是专门为p m p 设计的,更适合传统p d a ,手持p c ,平板电 脑,智能手机市场。它最初出现在p d a ( 比如惠普h p 4 7 0 0 ) 和智能手机( 如m o t o e 6 8 0 ) 上。因此它的扩展接口相当丰富,扩展接口有s d s d i o m m c 、c f p c m c i a 、 c m o s c c dc a m e r a 、蓝牙、u s b l 1 、o t g 等。 选择p x a 2 7 0 作为p m p 处理器,是源于它w i r e l e s sm m x 技术和s p e e d s t e p 动 态电源管理技术。s p e e d s t e p 技术原用于英特尔移动处理器,这种技术用通俗的语 言表述就是系统需要多高的主频,它就调节到多高的频率,系统不需要时,它就 将处理器主频调节到最低,绝不浪费一点点。s p e e d s t e p 技术可以将p x a 2 7 0 的主 频在2 6 m h z 6 2 4 m h z ( 最高) 之间自由调节! 也就是说,在系统完全空闲时,p x a 2 7 0 可以运行在2 6 m h z 的主频下,此时它的功耗将低于0 1 毫安。 图3 - 1 为该类型处理器的结构框图: 1 2 图3 - 1p x a 处理器结构图 。f i g u r e 3 - 1 s t r u c t u r ef i g u r eo f p x a p r o c e s s o r 其中代号为b u l v e r d e 的x s c a l ep x a 2 7 0 系列处理器时钟频率高达6 2 4 m h z , 支持无线多媒体指令集扩( w i r e l e s sm m x ) ,允许p x a 2 7 0 以较低的时钟频率实现增 强的多媒体性能,同时该处理器引用了英特尔的s p e e d s t e p 技术来延长电池寿命。 另外可以配合内部开发代号为m a r a t h o n 的2 7 0 0 g 多媒体加速器,提升高分辨率图 像处理和3 d 加速处理能力,构建手持终端中的“骨灰级”多媒体应用。 x s c a l ep x a 2 7 0 处理器内部集成了双通道1 6 位p c m c n p cc a r d o f 控制器。 支持8 位1 6 位i o 模式和m e m o r y 模式的访问,但不支持3 2 位的c a r d b u s ,符合 工业标准的3 2 位p c 卡和1 6 位p c 卡通常可以从外观上辨别。i o 模式和m e m o r y 模式可以在相同的硬件设计上通过驱动和软件来控制。 通常在开发平台上,为了适合不同接口和设备的实验,需要c p l d 和f p g a 。 控制逻辑将状态转换中断信号和读写中断信号交给c p l d 和f p g a 处理后通过单 一的g p i o 交由c p u 处理在手持产品应用中。考虑成本和功耗的因素,通常将逻 辑部件用成本更低的电路实现。对于p x a 2 7 0 这样的处理器来说,用软件实现接 口的时序和中断逻辑很容易1 1 4 j 。 3 2 嵌入式操作系统介绍 嵌入式系统本身是一个相对模糊的定义。由于目前嵌入式系统已经渗透到日 1 3 常生活中的各个方面,在工业、服务业、消费电子等领域的应用范围不断扩大, 使得很难给出一个明确的定义。嵌入式系统的发展大体上可划分为以下三个阶段: 无操作系统的嵌入算法阶段; 简单监控式的实时操作系统阶段; 通用的嵌入式实时操作系统阶段; 根据电气工程师协会( i e e ) 的定义,嵌入式系统是用来控制或监视机器、装 置或工厂等的大规模系统的设备。 可以看出此定义是从应用方面考虑的。嵌入式系统是软件与硬件的综合体, 还可以涵盖机电等附属装置。 目前国内一般的定义为:以应用为中心、以计算机技术为基础,软件硬件可 裁减,适应应用系统对功能、可靠性、成本、体积、功耗严格要求的专用计算机 系统。 3 2 1 嵌入式操作系统特点 从当前嵌入式系统的应用可以看出嵌入式具有如下特征: 系统内核小。由于嵌入式系统一般是应用于小型电子装置,系统资源相对 有限,所以内核较之传统的操作系统要小得多; 专用性强。嵌入式系统的个性化很强,软件系统和硬件的结合非常紧密, 一般要针对硬件进行系统的移植,即使在同一品牌、同一系列的产品中也 需要根据系统硬件的变化和增减不断进行修改。同时针对不同的任务,往 往需要对系统进行较大更改,程序的编译下载要和系统相结合; 系统精简。嵌入式系统一般没有系统软件和应用软件的明显区分,不要求 其功能设计及实现上过于复杂,这样一方面有利于控制系统成本,同时也 利于实现系统安全; 高实时性的操作系统软件是嵌入式软件的基本要求。而且软件要求固化存 储,以提高速度。软件代码要求高质量和可靠性; 嵌入式软件开发要想走向标准化,就必须使用多任务的操作系统。嵌入式 系统的应用程序可以没有操作系统而直接在芯片上运行;但是为了合理的 调度多任务,利用系统资源、系统函数以及专家库函数接口,用户必须自 行选配r t o s 开发平台,这样才能保证程序执行的实时性、可靠性,并减 少开发时间,保障软件质量; 嵌入式系统开发需要专门的开发工具和环境。由于嵌入式系统本身不具备 自主开发能力,即是设计完成以后用户通常也不能对其中的程序功能进行 1 4 修改,必须有一套开发工具和环境才能进行开发,这些工具和环境一般是 基于通用计算机上的软硬件设备以及各种逻辑分析仪、混合信号示波器 等。开发时往往有主机和目标机的概念,主机用于程序的开发,目标机作 为最后的执行机,开发是需要交替结合进行; 当前主流嵌入式系统可以分为实时系统和分时系统。其中实时系统又可以分 为两类:硬实时系统和软实时系统。实时嵌入式系统是为执行特定功能而设计的, 可以严格的按时序执行功能。其最大特征就是程序的执行具有确定性。在实时系 统中,如果系统在指定的时间内未能实现某个确定的任务,会导致系统的全面失 败,则系统被称为硬实时系统。而在软实时系统中,虽然响应时间同样重要,但 是超时却不会导致致命错误。一个硬实时系统往往在硬件上需要添加专门用于时 间和优先级管理的控制芯片,而软实时系统则主要在软件方面通过编程实现时限 的管理。 嵌入式系统技术具有非常广阔的应用前景,其应用领域可以包括工业控制、 交通管理、信息家电、家庭智能管理系统、p o s 网络及电子商务、环境监测、机 器人。随着信息化、智能化、网络化的发展,嵌入式系统技术也将获得广阔的发 展空间。进入2 0 世纪9 0 年代,嵌入式技术全面展开,目前已成为通信和消费类 产品的共同发展方向。而软件、集成电路和新型元器件在产业发展中的作用日益 重要。所有上述产品都离不开嵌入式系统技术。在个人领域中,嵌入式产品将主 要是作为个人移动的数据处理和通信软件【1 5 j 。 3 2 2w i n c e 嵌入式实时操作系统 实时系统是一种能在限定时间内对输入数据进行快速处理并做出响应的计算 机处理系统。根据响应的时间限定的程度,实时系统可分为硬实时系统( 也称实 时控制系统) 和软实时系统( 也称实时处理系统) 。 硬实时系统主要用于工业生产的过程控制、航天系统的跟踪及控制、武器的 制导等。这类操作系统要求的响应速度快,一般为毫秒级,甚至微妙级,工作要 求极其安全可靠、否则就有可能造成灾难性后果。另外,过载防护功能也是硬实 时系统的一个特点。 软实时系统主要用于响应速度在毫秒以上数量级的系统中。常见的有定票系 统,情报、资料检索系统等。这些系统一般配有大型数据库,对系统安全性、可 靠性和保密性要求较高。 嵌入式实时操作系统( r e a lt i m e e m b e d d e do p e r a t i n gs y s t e m ) 是一种实时的、支 持嵌入式系统应用的操作系统软件,通常包括与硬件相关的底层驱动软件、系统 内核、设备驱动接口、通讯协议、图形界面、标准化浏览器等。i e e e 的实时u n i x 分委会认为实时操作系统应具备以下的几点: 异步的事件响应实时系统能在系统要求的时间内响应异步的外部事 件,要求有异步i o 和中断处理能力。i o 响应时间常受内存访问、硬盘 访问和处理器总线速度所限制; 切换时间和中断延时确定; 优先级中断和调度允许用户定义中断优先级和被调度的任务优先级 并指定如何服务中断;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论