




已阅读5页,还剩65页未读, 继续免费阅读
(信息与通信工程专业论文)基于vlsi的视频压缩帧间预测技术研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙江大学硕士学位论文 摘要 摘要 预测编码是视频压缩技术中的经典图像编码方法,其原理是根据数据的统计 特性得到预测值,然后传输图像像素与其预测值的差值信号,使传输的码率降低, 达到压缩的目的。预测编码由于对视频信号的相关性利用最充分而具有很高的压 缩效率,适用于对图像质量要求较高的场合。其中采用运动补偿预测的时间预测 编码是视频编码标准成功的关键。 超大规模集成电路( v l s i ) 技术的发展使大计算量、实时处理的视频压缩 任务实现变得越加简单,在v l s i 上实现视频压缩技术是一种合理的选择,且逐 渐成为实现视频处理器的趋势。 本文在研究帧问预测技术理论和发展的基础上探索了在v l s i 硬件上实现帧 间预测技术的问题。对在v l s i 上实现帧间预测技术从算法上进行了讨论,以全 搜索算法设计为基础,提出一系列为适应v l s i 实现而做出的适应性算法调整, 同时提出了实现快速算法的设计思路。 在算法研究的基础上,本文提出了一种块匹配可变块大小的运动估计器的 v l s i 实现结构,分别研究和讨论了数据通路和控制器模块的硬件实现。在数据 通路上,重点讨论运动估计单元和s a d 组合比较单元的设计,分别给出了以速 度为优先因素和以面积为优先因素下的硬件结构。在控制器模块上,分别讨论了 有限状态机和微代码控制器两类控制策略,分析了各自的实现特点和原理,提出 一种同时采用微代码控制和有限状态机控制的混合控制策略的设计思路。 文中设计的硬件结构可以工作在1 0 8 m h z 时钟频率,在理想的硬件电路面积 上实现7 2 0 x 5 7 6 2 5 h z 格式的视频图像的实时帧问预测,数据通路采用通用的运 算部件,可以通过微码控制实现不同的运动估计算法,具有一定的可扩展性,通 过应用快速算法或者增加处理单元的方法可以实时处理高清晰度视频序列。 关键词:视频压缩超大规模集成电路帧间预测运动估计运动补偿控制策略 塑翌盔堂堡圭兰垒鲨苎 一塑:塑竺 a b s t r a c t p r e d i c t i o nc o d i n gi so n eo ft h ec l a s s i cg r a p h i cc o d i n gt e c h n o l o g i e s ,a n di th a s h i g hc o m p r e s s i o ne f f i c i e n c yb ye x p l o i t i n gt h ec o r r e l a t i o nb e t w e e nc o n s e c u t i v e v i d e o f l a m e s t h em o t i o n c o m p e n s a t e dt e m p o r a lp r e d i c t i o nc o d i n gm e t h o di so n eo f t h ek e y f a c t o r so ft h es u c c e s so fv i d e oc o d i n gs t a n d a r d s w i t ht h ed e v e l o p m e n to fv l s i ( v e r yl a r g es c a l ei n t e g r a t i o n ) t e c h n o l o g y , t h e h a r d w a r ei m p l e m e n t a t i o no fr e a l - t i m ev i d e op r o c e s s i n gw i t hh i g hc o m p u t m i o n d e m a n db e c o m e se a s i e r i ti sb e c o m i n gt h et e n d e n c yt or e a l i z ev i d e oc o m p r e s s i o n t e c h n o l o g yi nv l s i , i nt h i sp a p e r , t h ev l s ii m p l e m e n t a t i o no fi n t e r - f l a m e - p r e d i c t i o ni ss t u d i e d t h e a l g o r i t h m so fi n t e r - f l a m e p r e d i c t i o nt o w a r d sv l s i - i m p l e m e n t a t i o na r ed i s c u s s e da n d as e r i e so fo p t i m i z e da l g o r i t h m sa r ep r o p o s e db a s e do nt h ef u l l - s e a r c hm o t i o n e s t i m a t i o nm e t h o d ,f a s tm o t i o ne s t i m a t i o n a l g o r i t h m s w h i c ha r es u i t a b l ef o r v l s i i m p l e m e n t a t i o na r ea l s od i s c u s s e d v l s ia r c h i t e c t u r eo f i n t e r f r a m e p r e d i c t i o n i s p r o p o s e d i nt h i s p a d e l a r c h i t e c t u r eo fd a t ap a t ha n dc o n t r o l l e ra x es t u d i e ds e p a r a t e l y t nt h ed a t ap a t hd e s i g n , t h eh a r d w a r ei m p l e m e n t a t i o nf o rv a r i a b l eb l o c ks i z eb l o c k m a t c h i n gm o t i o n e s t i m a t i o ni sd i s c u s s e di n d e t a i la n dt h ed i f i e r e n th a r d w a r ea r c h i t e e t u r e su n d e r s p e e d p r i o r i t yr u l ea n da r e a - p r i o r i t yr u l ea r ei n t r o d u c e ds e p a r a t e l y i nt h ec o n t r o l l e r m o d u l e t w od i f f e r e n tc o n t r o ls t r a t e g i e sb a v eb e e ni n t r o d u c e dw h i c ha r ef i n i t es t a t e m a c h i n e ( f s m ) c o n t r o ls t r a t e g ya n dm i c r oc o d ec o n t r o ls t r a t e g y t h ec h a r a c t e r i s t i c s o fb o t hs t r a t e g i e sa r ea n a l y z e da n dam i x e dc o n t r o ls t r a t e g yi sp r o p o s e du s i n gf s m a n dm i c r oc o d e t h eh a r d w a f l ea r c h i t e c t a r ep r o p o s e di n t h i sp a p e rw o r k sa ti o o m h zc l o c k f r e q u e n c ya n dc a nm a t c ht h er e a lt i m ed e m a n do ft h e7 2 0 x 5 7 6 2 5 h zf o r m a tv i d e o s i g n a lp r o c e s s i n ga n di sp r o g r a m m a b l ei ns e l e c t i n gt h em o t i o ne s t i m a t i o na l g o r i t h m b yu s i n gd i f f e r e n lm i c r oc o d e s b ya p p l y i n gf a s ts e a r c hm o t i o ne s t i m a t i o na l g o r i t h m o ri n c r e a s i n gt h ep en t t m b e r , t h ea r c hk e c t u r ec a l lp r o c e s sr e a l t i m eh i g hd e f t n l t i o n v i d e os e q u e n c e s k e yw o r d s :v i d e oc o m p r e s s i o n ,v l s i ,i n t e r - f r a m e p r e d i c t i o n ,m o t i o ne s t i m a t i o n , m o t i o nc o m p e n s a t i o n ,c o n t r o ls t r a t e g y 浙江大学硕士学位论文目录 表目录 表1 1 各种视频应用在压缩前后的码率 表1 22 0 0 4 年i t r s 修订版集成电路技术发展节点( 近期) 表1 ,32 0 0 4 年i t r s 修订版集成电路技术发展节点( 远期) 。 表2 - ls k i p ,d i r e c t ,s y m m e t r i c 模式比较表 表4 1 相同容量下不同类型存储器面积对比 表4 - 2 本设计中的硬件结构与不同硬件结构的比较 v 1 7 7 2 2 4 1 4 8 浙江大学硕士学位论文 目录 图目录 图1 1 视频压缩混合编码框架图3 图1 2 摩尔定律7 图1 3a s i c 设计流程8 图2 1 一个有损预测编码系统的编码器和解码器方框图1 2 图2 - 2 基于块的帧间预测示意图1 3 图2 - 3 多参考帧的单向帧问预测示意图1 4 图2 - 4 采用单向和双向帧间预测的视频编码1 5 图2 - 5 块匹配算法运动估计示意图】6 图2 - 6 三步搜索算法示意图18 图2 7 新三步搜索算法示意图1 8 图2 - 8 四步搜索算法示意图1 9 图2 - 9 亚像素精度运动搜索示意图1 9 图2 1 0 亮度块e 和相邻亮度块的空间位置关系2 0 图2 - il8 x 1 6 或1 6 x 8 模式预测2 1 图2 - 1 2 不同预沏9 起始点周围的运动矢量分布图2 】 图3 1s a d 组合相加示意图2 5 图3 - 2 全搜索过程示意图2 5 图3 3 先插值后选择模式的流程2 6 图3 4 先选择模式再插值的流程2 6 图3 - 5m o b i l e 序列在相同码率下的主观质量对比:7_ccir 图3 - 6f o o t b a l l c c i r 序列在相同码率下的主观质量对比2 7 图3 - 7 不同搜索范围下全搜索算法性能分析2 9 图3 - 8 运动矢量预测示意图3 0 图3 - 9 采用简化预测起点的全搜索性能分析31 图3 - 1 0 a v s 标准中整数样本、二分之一样本和四分之 样本的位置3 2 阁3 - 1 】运动估计简化插值算法与标准插值算法性能对比3 4 图4 1 帧间预测模块外部接口示意图3 6 图4 2 帧间预测模块的内部结构图3 7 图4 - 3 帧问预测模块:【作流程图3 7 图4 - 4 运动估计模块功能框图3 8 图4 - 5 全搜索范围示意图3 9 图4 - 6 速度优先的硬件结构图4 0 圈4 - 7p e 结构图4 1 图4 - 8 双时钟工作示意圈4 2 图4 - 9 存储器与搜索窗数据的对应关系4 2 图4 - 1 0p e a r r a y 结构示意图4 3 图4 - 11s a d 组合示意图4 3 图4 一】2 加法树结构示意图4 4 图4 1 3 复用加法器的s a d 组合结构4 4 图4 1 4 增加了比较器的s a d 组合图4 5 图4 15p ea r r a y 中p e 之间最小值比较器4 5 图4 - 】6 块大小模式选择框图4 5 浙江大学硕士学位论文目录 图4 1 7 运动矢量预测流程图4 6 图5 - 1 序列检测器状态转移图5 0 图5 - 2 微代码控制器基本组成图5 1 图5 - 3 帧间预测模块结构图5 2 图5 - 4 微代码控制器框图5 3 图5 5 第一组比较器控制信号的有限状态机状态转移图5 5 图5 - 6 第二组比较器控制信号的有限状态机状态转移图5 5 圈5 7 集中控制下的协同工作示意图5 6 图5 - 8 分散控制下的协同工作示意图5 7 v i i 塑坚盔堂堡主兰垒堡苎一墨二墨! ! 鱼 第一章绪论 1 视频压缩理论与相关技术的发展 1 1 视频压缩的意义及分类 视频图像是多媒体中携带信息的重要媒体。人们获取信息的7 0 来自视觉系统,实际 就是图像和电视。但是,随着人类步入以信息数字化为重要特征的信息时代,数字化的多媒 体信息特别是视频信息的数据量之大是惊人的。例如,当模拟信号数字化后其频带大大加宽, 一路6 m h z 的普通电视信号数字化后,其数码率将高达1 6 7 m b p s ,对储存器容量要求很大, 占有的带宽将达9 0 m h z 左右,这样将使数字信号失去实用价值。 数字视频压缩技术很好地解决了上述困难压缩后信号所占用的频带大大低于原模拟信 号的频带。因此,视频压缩编码技术的研究与应用是解决数字化视频存储和传输问题的关键, 是使数字视频信号走向实用化的关键。表1 1 中列出了各种视频应用环境下视频信号在压缩 前后的码率对比。 表1 - 1 各种视频应用在压缩前后的码率 i 应用种类像素,行行数,帻帧数,秒亮色比 压缩前码串( 比特,秒)压缩后码率( 比特,秒) 【h d t v1 9 2 01 0 8 03 06 :2 :01 1 8 02 0 电5 m c c i r 6 0 i7 2 04 8 03 04 :201 6 7 m4 - , 8 m 会议电视3 5 2 2 8 83 0 4 :2 :03 65 m 15 - 2 m c i f 亲上电视 1 7 61 4 4 3 0 4 :2 :09l m1 2 9 k q c i f 电视电话 2 81 1 2 3 04 :2 :t )5 ,2 m5 6 k 图像数摧压缩主要根据下面两个基本事实来实现的【1 。 一个是图像数据中有许多重复的数据,使用数学方法来表示这些重复数据就可以减少数 据最,从信息论观点来看,图像作为一个信源,描述信源的数据是信息量( 信源熵) 和信息冗 余量之和。信息冗余量有许多种,如空间冗余、时间冗余、结构冗余、知识冗余、视觉冗余 等,数据压缩实质上是减少这些冗余量。可见,冗余量减少可以减少数据量而不减少信源的 信息量。从数学上讲,图像可以看作一个多维函数,压缩描述这个函数的数据量实质是减少 其相关性。 另一个事实是人的眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉, 允许图像有一定的失真,而并不妨碍图像的实际应用,那么数据量压缩的可能性就更大了, 这也就达到压缩数据的目的。 视频压缩方法有许多种,从不同的角度出发有不同的分类方法。从信息论角度出发可分 为两大类: ( 1 ) 冗余度压缩方法:也称无损压缩。信息保持编码或熵编码。具体讲就是解码图像和 压缩编码前的图像严格相同,没有失真,从数学上讲是一种可逆运算。属于无损压缩的编码 浙江大学硕士学位论文 第一章绪论 方法有哈夫曼编码、算术编码、行程编码、l e m p e lz e v 编码等。 ( 2 ) 信息量压缩方法:也称有损压缩,失真度编码或熵压缩编码。也就是解码图像和原 始图像是有差别的,允许有一定的失真。属于有损压缩的编码方法有 预测编码:d p c m ,运动补偿 频率域方法:正文变换编码( 如d c t ) 子带编码 空间域方法:统计分块编码 模型方法:分形编码,模型基编码 基于重要性:滤波,子采样,比特分配,矢量量化 根据压缩是否基于内容,视频压缩又可分为两种:基于数据统计的压缩和基于内容的压 缩【2 】。 传统的压缩编码是建立在香农( s h a n n o n ) 信息论的基础上,它以经典的集合论为基础, 用统计概率模型来描述信源,但是,它未考虑信息接收者的主观特性及事件本身的具体含义、 重要程度和引起的后果。压缩编码的发展历程是以香农信息论为出发点不断完善的过程。考 虑信源的统计特性,有预测编码方法、变换编码方法、矢量量化编码方法、子带小波编码 方法、神经网络编码方法;考虑人眼的视觉特性,有基于方向滤波的图像编码方法、基于图 像轮廓- 纹理的编码方法;考虑图像传递的景物特性,有分形编码、基于内容的编码方法。 基于数据统计的压缩,去掉的是数据冗余,称为低层压缩编码方法: 基于内容的压缩,去掉的是内容冗余,其中基于对象的方法称为中层压缩编码方法; 基于语义的方法称为高层压缩编码方法。 根据降低冗余度类型的不同,视频压缩可分为三种:预测编码、变换编码、统计编码三 大经典编码方法【3 】。 预测编码的基本思想:根据数据的统计特性得到预测值,然后传输图像像素与其预测值 的差值信号,使传输的码率降低,达到压缩的目的。 变换编码的基本思想:由于数字图像像素间存在高度相关性,因此可以进行某种变换来 消除这种相关性。变换编码不直接对空域图像像素编码,而是先将它变换到频域,得到一组 变换系数。虽然变换并不对数据进行压缩,但经过变换后,能量相剥集中。通过后续的量化、 编码就能达到压缩的目的a 变换编码方法中的离散余弦变换( d c t ) 和小波变换( w a v e l e t ) 在视 频,图像压缩中得到了广泛应用。 统计编码的基本思想:根据信息码字出现概率的分布特征而进行压缩编码,寻找概率与 码字长度间的最优匹配。统计编码主要针对无记忆信源,它又可分为定长码和变长码f v l 。c ) , h u f f m a n 编码和算术编码是两种常见的变长码字编码方法。 1 2 视频压缩编码框架 从前期通用的视频编解码标准h 2 6 i ,到i f l 前最新的视频编解码标准h 2 6 4 ,以及a v s 标准等都是基于混合编码( h y b r i dc o d i n g ) 框架之上的。所谓混合编码框架是综合考虑预测、 变换以及熵编码的编码框架,有以下几个特点: 1 通过对预寝4 残差进行变换和量化来消除图像内的视觉冗余。 2 , 利用带有运动估计与运动补偿的帧间预测来消除图像间的冗余,利用帧内预测来消 除图像内的冗余。 3 利用熵编码来消除统计上的冗余。 其基本框图如图1 1 : 2 塑坚查兰堡圭兰垡望苎 一塑二皇! ! 堡 输入 图1 1 视频压缩混合编码框架图 视频编码标准都具有帧内编码图像帧( i 帧) 和帧间编码图像帧( p 帧) ,i 帧和p 帧采 用不同的编码方法。i 帧的编码过程如下:可采用基于频率域或空间域的帧内预测,用预测 模式标记当前待编码块的参考值获得方法,然后计算待编码块与其参考块之间的差值t 得到 相应的残差数据块,对原始图像数据块或残差数据块进行二维变换,接着在变换域中对变换 系数进行量化,最后进行熵编码,即采用变长编码或算术编码等。p 帧的编码过程如下:采 用基于运动补偿的帧间预测,通过运动矢量来标记当前待编码块的参考块位置,然后计算待 编码块与其参考块之闻的差值,得到相应的残差数据块接着对残差数据块进行二维变换, 再对变换域系数进行量化,最后进行熵编码。 在视频编码中,编码端只需要传输编码模式信息、运动矢量、重建图像块与其预测值残 筹的变换量化系数。而在解码端,接收到了编码模式信息和运动矢量,即可对当前解码块进 行预测,获得其预测值,再对残差的变换量化系数进行反量化反变换,与预测值相加得到重 建图像块。 1 3 视频编码标准 标准化是产业活动成功的前提。如果没雀个共同的标准做基础,不同j u 家编解码系统 问的互连将会十分困难。憋于这一状况国际电信联盟i t u 和国际标准化组织i s o 国际电 工委员会i e c 近年来在世界范围内积极工作,已经制定并在继续制定一系列静止和活动图 像编码的国际标准,这些标准和建议是在相应领域工作的各国专家合作研究的成果和经验的 总结。这些标准的推出,i 仅极大地推动了视频压缩技术的研究。而且已经或即将对多媒体 相关产业产生深远的影响。下面介绍一些主要的视频压缩标准。 1 3 1 h 2 6 x 系列 h 2 6 1 标准:这是最早的视频压缩标准。由国际电信联盟! n j ( 前称国际电报电话咨询委员会 c c i t t ) 于1 9 9 0 年1 2 月制定,它首创的基于运动估计与补偿的帧间压缩模式比起基于帧内 压缩的j p e g 具有更高的压缩比。它的推出是为了在速率为p x 6 4 kb i t s s ( e = l - 3 0 ) 的信道上 传输可视电话与会议电视。这个标准草案对以后同类标准的发展产生了深远的影响。 浙江大学硕士学位论文 第一章绪论 h 2 6 3 标准:h 2 6 3 是由i t u 于1 9 9 5 年推出并于1 9 9 6 年完善的在公用电话网上传输甚低码 率视频的编解码标准。h 2 6 3 的发展分为三个阶段。初始标准的技术工作与1 9 9 5 年11 月完 成。h 2 6 3 的扩展0 l i 名为h 2 6 3 十) ,于1 9 9 7 年9 月放入标准中。第三个阶段的结果( 别名为 h 2 6 3 _ 卜+ ) ,与1 9 9 9 年合并入标准,并且于2 0 0 0 年1 1 月正式通过。同h 2 6 1 相比,h 2 6 3 主要改进有:支持更多的图像格式运动估计的精度精确到半像素,搜索范围也扩大到( 一1 6 , 1 5 5 ) ,对运动矢量采用差分编码。 h 2 6 4 标准:i t u - t 的h 2 6 4 标准也被称为“m p e g 4v i s u a lp a r t1 0 ”,也就是“m p e g - 4a v c ( a d v a n c e d v i d e o c o d i n g ) ”。标准化工作由i s o i e c 下属的运动图像专家组m p e g ( m o v i n g p i c t u r e s e x p e r t s g r o u p ) 和i t u 下属的视频编码专家组v c e g ( v i d e o c o d i n g e x p e r t s g r o u p ) 共同成立的联合视频小组j v t ( j o i n tv i d e ot e a m ) 负责完成,在2 0 0 3 年3 月被正式确定为 国际标准i s ( i n t e r n a t i o n a ls t a n d a r d ) 。h 2 6 4 视频编码标准仍是基于运动补偿和变换编码的 混合编码方式,但其关键部件都做了重大改进,在保证图像质量的同时仍能获得很高的压缩 比。h 2 6 4 标准中的关键技术主要有如下几个方面【3 】【4 】: 可变大小块划分;为了更精确地对图像的运动内容进行预测补偿,h 2 6 4 允许宏块更进 一步划分为1 6 x 1 6 、1 6 8 、8 1 6 、8 8 、8 4 、4 8 、4 4 的子块;运动估计精确到 1 4 象素位置。 多参考帧的预测:规定运动估计使用的参考帧数最多可达1 5 帧多参考帧的使用大大提 高了对图像传输的容错性,抑制了错误在时间和空间上的扩散。 整数变换:在变换部分t 不同于以前标准对预测参差值的变换编码使用d c t 变换,h 2 6 4 使用了简单的整数变换。这种变换与d c t 相比,压缩性能几乎相同且有许多优势,其 核心变换的计算只使用加减、移位运算,避免了精度的损失。 改进的量化器:对变换参差系数的量化使用了5 2 级步长的量化器,而h2 6 3 标准只有 3 1 级。量化步长以1 25 递增,量化步长范围的扩大使得编码器能够更灵活、更精确地 进行控制,在比特率和图像质量之间达到折中。 先进的熵编码:对于要传输的量化变换系数,当使用基于上下文的变长编码时,根据前 面已编码传输的量化变换系数值的大小来选择接下来系数编码要使用的变欧编码表。由 于变长编码表的设计是基于相应的统计条件,所以其性能要优于使用单一变长编码表。 去块滤波:为了去除由于块预测和重构产生的块效应,h 2 6 4 的滤波器是这样设计的: 当块边界上两边差较小时,就使用滤波器对差别进行“平滑”;若边界上图像特征明显, 就不使用滤波。这样既是为了减弱“块效应”的影响,又避免丁滤掉图像的客观特征, 同时在相同主观质量下使得比特率减少5 l o 。 1 3 2 m p e g 系列 m p e g ( m o v i n g p i c t u r e e x p e r t g r o u p ) 是在1 9 8 8 年由国际标准化组织1 s o ( i n t e m a t i o n a l o r g a n i z a t i o nf o rs t a n d a r d i z a t i o n ) 和国际电工委员会i e c ( i n t e r n a t i o n a le l e c t r ot e c h n i c a l c o m m i s s i o n ) 联合成立的专家组。负责开发电视图像数据和声音数据的编码、解码和它们 的同步等标准。这个专家组开发的标准称为m p e g 标准,目前为止,已经开发和正在开发 的m p e g 标准主要有【5 】: m p e g - 1 :数字电视标准,1 9 9 2 年正式发布。它将视频数据压缩成l 2 m b s 的标准数 据流,对动作不激烈的视频信号可获得较好的图像质量,但当动作激烈时,图像就会产生马 赛克现象。它没有定义用于额外数据流进行编对码的格式,因此这种技术不能广泛推广。它 4 塑垩查兰堡主堂些丝壅 一苎二兰! ! 堂 主要用于家用v c d 和m p 3 ,需要较大的存储空间。 m p e g 2 :数字电视标准,制定于1 9 9 4 年,它是为了力争获得更高的分辨率( 7 2 0 4 8 6 ) , 提供广播级视频和c d 级的音频,它是高质量视频音频编码标准。传输速率在3 1 0 m b i f f s 之间。作为m p e g 一1 的兼容性扩展,m p e g 一2 支持隔行扫描视频格式和其它先进功能,可广 泛应用在各种速率和各种分辨率的场合。但是m p e g - 2 标准数据量依然很大,不便存放和 传输。适用于d t v 和d v d 。 m p e g 4 1 6 1 1 7 1 :多媒体应用标准。它是1 9 9 9 年5 月建议并于1 9 9 3 年7 月确认。其目 标是甚低数码率的音视频压缩编码( 码率低于2 8 8 k b s ) ,适用于固定和移动网络的多媒体。 相比较以前的标准,它有三个特点: 基于内容的交互性( c o n t e n t b a s e di n t e r a c t i v i t y ) :基于内容的操作与比特流编辑支 持无需编码就可进行基于内容的操作与比特流的编辑;自然与合成数据混合编码提 供将自然视频图像同合成数据有效结合的方式,同时支持交互性操作:增强时间域 随机存取m p e g 4 将提供有效的随机存取方式。 高压缩率( c o m p r e s s i o n ) :在相同的码率下,m p e g 4 提供更好的主观视觉质量的 图像使之能应用于迅速发展中的移动通信网络。同时,m p e g 一4 能对同一景物提 供有效多视角编码,加上多伴音声道编码及有效的视听同步。 灵活多样的存取( u n i v e r s a la c c e s s ) :在错误易发的环境中,m p e g 一4 能够提供较 高的抗误码能力( e r r o rr o b u s t n e s sc a p a b i l i t y ) ,尤其是在易发生严重错误的环境下 的低比特应用中( 如移动通信环境) 。此外,给予内容的尺度可变性( c o m e n l b a s e d s c a l a b i l i t y ) 是m p e g 4 的核心,因为一旦图像中所含对象的目录以及相应的优先 级确定后,其他的基于内容的功能就比较容易实现了。 1 3 3 a v s 标准 数字音视频编解码技术标准工作组( 简称a v s 工作组) 由国家信息产业部科学技术司 于2 0 0 2 年6 月批准成立 8 。工作组的任务是:面向我国的信息产业需求,联合国内企业和 科研机构,制( 修) 订数字音视频的压缩、解压缩、处理和表示等共性技术标准,为数字音 视频设备与系统提供高效经济的编解码技术,服务于高分辨率数字广播、高密度激光数字存 储媒体、无线宽带多媒体通讯、互联网宽带流媒体等重大信息产业应用。 日前,a v s 标准中涉及视频压缩编码的有两个独立部分:a v s 第二部分( a v s l - p 2 ) , 主要针对高清晰度数字电视广播和高密度存储媒体应用f l o :a v s 第七部分( a v s l p 7 ) ,主 要针对低码率、低复杂度、较低图像分辨率的移动媒体应用 1 1 1 。 a v s 视频编码标准的特色是在同一编码框架下,针对有明显不同的应用制定不同的信 源压缩标准,尽可能减少技术的冗余,从而降低a v s 视频产品的设计、实现和使用成本。 在高清晰度数字视频应用中,a v s i p 2 的性能与h 2 6 4m a i np r o f i l e 相当。在低分辨率移动 应用中,a v s i - p 7 的性能与h 2 6 4 b a s e l i n e p r o f i l e 相当。但在获得同等压缩性能的前提下, 由于a v s 中的压缩技术都经过针对性的优化,其计算复杂度、存储器和存储带宽资源的占 用都低于h 2 6 4 相应的p r o f i l e 。 相对于新近标准h 2 6 4 ,a v s 的主要技术有以下特点f 9 【1 0 【11 。 帧内预测:a v s l - p 2 采用基于8 8 块的帧内预测。亮度和色度帧内预测分别有5 种和4 种模式。相邻已解码块在环路滤波前的重建像素值用来给当前块作参考。与 h 2 6 4 的4 4 块的帧内预测相比,大的预测块将增加待预测样本和参考样本间的 浙江大学硕士学位论文 第一章绪论 距离,从而减弱相关性。降低预测精确度。因此在a v s l - p 2 的d c 模式,d i a g o n a l d o w nl e 竹模式和d i a g o n a ld o w nr i g h t 模式中先用3 抽头低遁滤波器( 1 ,2 ,1 ) 对 参考样本滤波【1 3 】。另外,在a v s i p 2 的d c 模式中,每个像素值由水平和垂直位 置的相应参考像素值来预测,所以每个像素的预测值都可能不同。这种d c 预测较 之h 2 6 4 中的d c 预测更精确,这对于较大的8 x 8 块尺寸来讲更有意义。r m 4 0 ( a v s l - p 2 的参考软件) 上的实验表明,a v s 采用5 种模式仅比h 2 6 4 采用9 种 模式损失0 0 5 d b 的p s n r 1 4 】。 帧间预测;a v s i - p 2 支持p 帧和b 帧两种帧间预测图像。p 帧最多采用2 个前向参 考帧;b 帧采用前、后各一个参考帧。与h 2 6 4 的多参考帧相比,a v s l p 2 在不增 加存储、数据带宽等资源的情况下,尽可能地发挥现有资源的作用,提高压缩性能。 允许宏块划分为1 6 1 6 、1 6 8 、8 1 6 、8 8 的子块;运动估计同样精确到1 4 象素位景。 变换量化:a v s - p 2 采用8 8 二维整数余弦变换i c t ( i n t e g e rc o s m et r a n s f o r m ) 。 在a v s 中,采用带p i t ( p r e - s c a l e d i n t e g e r t r a n s f o r m ) 的8 8 整数余弦变换技术 【1 2 ,即正向缩放、量化、反向缩放结合在一起,而解码端只进行反量化,不再需 要反缩放。由于a v s l 一p 2 中采用总共6 4 级近似8 阶非完全周期性的量化,p i t 的 使用可以使编、解码端节省存储与运算开销,而性能上又不会受影响。 亚像素插值:a v s i 巾2 帧间预测与补偿中,亮度和色度的运动矢量精度分别为四分 之一和八分之一像素精度,因此需要相应的亚像素插值。与h 2 6 4 的亚像素插值相 比,a v s i p 2 的数据带宽减小1 1 】5 。此插值方法在高清序列上略有增益。 熵编码:a v s l 一p 2 所有语法元素的码宇基于指数哥伦布码或定长码雨构造。定长码 用来编码具有均匀分布的语法元素,指数哥伦布码用来编码可变概率分布的语法元 素。a v s l - p 2 中指数哥伦布码编码所有可变分布的语法元素,而h 2 6 4 中指数哥伦 布码编码除变换系数以外的语法元素。对于变换系数,h 2 6 4b a s e l i n ep r o f i l e 用 c a v l c ,m a i np r o f i l e 用c a b a c 。 去块滤减器:由于a v s i 2 变换和最小预测块大小都是8 x8 ,因此环路滤波的块 大小也是8 8 。与h 2 6 4 的4 4 相比,a v s l p 2 块边界数量大大减少。另外,b s 值和改变的像素值的数量都订所减少。 2 0 0 5 年4 月3 0 日,a v s 标准视频部分通过公示,在标准道路上迈出决定性一步。2 0 0 6 年2 ,| = 2 2 日,国家标准化管理委员会颁布通知:信息技术先进音视频编码第二部分视 频j :2 0 0 6 年3 月1 日起开始实施。a v s 视频部分正式成为闰家标准,成为震动业内外的一 件大事。 2 集成电路相关技术 2 1 集成电路技术的发展 半导体工业从2 0 世纪7 0 年代初第一代i c 开始发展并迅速趋于成熟。早期的小规模集 成( s s i ,s m a l l s c a l e i n t e g r a t i o n ) i c 仅包含几个( 1 至1 0 个) 逻辑门一与非门、或非门( n o r ) 等,相当于几十个晶体管a 中规模集成( m s i ,m e d i u m s c a l ei n t e g r a t i o n ) 时期增加了逻辑集 成的范围,可得到计数器和类似的较大规模的逻辑功能。大规模集成( l s i 。l a r g e - s e a i e i n t e g r a t i o n ) 时期在单个芯片上集成了更强的逻辑功能,诸如第一代微处理器之类。如今的 超大规模集成( v l s i ,v e r yl a r g es c a l ei n t e g r a t i o n ) 时代可以提供6 4 位微处理器,并在单个 6 浙征大学硕士学位论文第一章绪论 硅芯片上拥有高速缓冲存储器和浮点运算单元一一远远超过百万个晶体管。随着c m o s 工 艺技术的改进,晶体管尺寸继续变小,使l c 可容纳更多的晶体管,已进入特大规模u l s i ( u l n al a r g es c a l ei n t e g r a t i o n ) 时代。 在集成电路技术发展过程中,电路复杂度主要表现在个人计算机用d r a m 位数及c p u 中晶体管数量上。由于晶体管数量的增加主要是通过尺寸缩小来实现的,因此在技术上一般 将晶体管的半节距作为集成电路每个技术节点的检验标志。2 0 世纪6 0 年代,一个产业界的 先行者g o r d o nm o o r e 预测一块芯片上集成的晶体管数量将呈指数规律增长。他的预测( 现 在被称为摩尔定律) 极有预见性。摩尔认为芯片上的晶体管的集成度将每1 8 个月翻一番, 这与实际情况非常相符。图卜2 展示了i c 制造水平的发羼情况【1 8 】。在二十世纪七十年代以 前,d r a m 和c p u 的晶体管数严格遵循了每两年增长一倍的速率发展;其后逐步演化成 d r a m 每1 8 个月增长一倍、微处理每2 4 个月增长一倍。s i a 在2 0 0 1 年版的“国际半导体 技术发展路线图( i t r s ) ”中提出了每3 6 个月翻倍的论点,并将其一直延伸至2 0 1 6 年,2 0 0 4 年修订版又将其延长到2 0 1 8 年( 表1 2 表1 3 ) 。 轴 蛙 皿墨 图l - 2 摩尔定律 g t l 2 2 0 0 4 年i t r s 修订版集成电路技术发展节点( 近期) 表1 - 32 ( ,4 年i t r s 修订版集成电路技术发展节点( 远期) 铲年份 2 u l o 1 2 0 1 2 1 2 0 1 3 1 2 0 1 51 2 0 1 61 2 0 1 8 l i 殳年_ p 屁;4 5 i 3 2 2 2; 掣熙苎烹曼氅! 罂! j 4 5 1 3 5 3 2 5 2 5 1 2 2 i 8 删簖嗣舛f 逛 i t y - - - - 耐髓“橱一葡一薹一售r 熙班笼基。p o l ,s z - 4 r l l l ! ( n ) 5 ;3 51 3 2 2 5 1 2 2 ;1 8 鲤塑塑熙鱼如。 芦 2 0 1 8赫1 4黼 辩明嘲鞠磲石菌一一1 f r ”1 酉亍苛一茅“_ 书 7 寸泸矿铲沪妒舻驴刚噼 浙江大学硕士学位论文 第一章绪论 i c 技术是目前已经改变我们生活方式的众多革新性器件及其系统的基础技术。i c 产品 以其体积小、成本低、性能优、可靠性高、保密性强等特点而具有良好的产品综合性能和竞 争力。 实际应用要求的不断提高,促进i c 和电子系统的设计和制造向更复杂的方向发展。这 种发展过程最让人瞩目的特征是系统的多样性。随着系统越来越复杂,我们不仅开发了几种 通用计算机,而且还能制造出各种各样的专用系统。这反映了i c 设计和制造能力越来越强。 但是,随着消费者的要求不断提高,l c 设计和制造能力也将不断地受到挑战。 2 2 集成电路设计方法 i c 的设计方法经历了几十年的发展演变,从最初的全手工设计发展到现在先进的可以 全自动实现的过程。这也是近几十年来科学
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 银行行政考试题库及答案
- 银行消防试题及答案
- 河南旅游专业试题及答案
- 医学转专业试题及答案
- 销售专业试题及答案英语
- 印刷专业试题及答案
- 湖北省孝感市2025-2026学年高二上学期9月起点考试地理(B)试卷(含答案)
- 翼载荷和推重比的确定课件
- 河北省廊坊市2024-2025学年八年级上学期11月月考物理试卷(含答案)
- 坡道太高用什么施工方案
- 生产车间出勤管理制度
- 亲子观影活动方案
- 水利工程设计概估算编制规定工程部分
- 《销售经理技能提升》课件
- 培育战斗精神 砥砺血性胆气 -2024教育实践活动
- 小学生科普讲堂课件-彩虹的秘密
- 心理健康和生命教育
- 医院感染在眼科医疗中的预防与控制
- 园区废气与噪音综合治理管理制度
- 催收专业知识培训课件
- 增强现实技术文旅项目中应用
评论
0/150
提交评论