已阅读5页,还剩74页未读, 继续免费阅读
(电路与系统专业论文)用DSP实现视频图像压缩与解压缩[电路与系统专业优秀论文].pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
重庆大学顾士学位论文中文摘要 摘要 随着多媒体技术的发展,数字图像在家庭娱乐、远程监控、网络教育和公共 安全领域得到了广泛的应用。图像数据的大容量与传输带宽的有限性之间的矛盾 越来越突出,研究高压缩率的图像压缩算法是一项迫切而艰巨的任务。国际标准 化组织( i s o ) 总结了全球范围内最新、晟有效的图像压缩研究成果,针对一些具体 应用颁布了多种图像压缩国际标准,推荐了标准算法和数据格式,为图像压缩领 域的科技人员改进和实现算法指明了方向。本文研究的主要目的是寻找一种适合 于远程红外线监控设备的图像压缩算法并采用d s p 实现图像压缩和解压缩。 首先,对图像压缩的一般方法和图像压缩系统的硬件要求进行了介绍,并对 相关的国际标准进行了综述。 然后,根据图像压缩系统的实时要求详细介绍了图像压缩硬件系统的设计。 具体介绍了t m s 3 2 0 c 6 2 1 1 芯片的整体性能、外部器件与d s p 的连接、d s p 内部寄存 器的设置、f p g a 与d s p 的接口和d s p 开发环境c c s 2 0 的使用,同时对f p g a 的程 序设计给出了对应的仿真波形。 接着,讨论了基于离散余弦变换和哈夫曼编码的图像压缩算法及其d s p 实现 问题。具体介绍了离散余弦变换、运动估计以及哈夫曼编码原理,并着重阐述了 快速离散余弦变换、三步搜索法和准可变长编码的d s p 实现。 最后,针对实现过程中碰到的问题提出了改进方法,通过深入分析小波变换 的原理及特征后,认识到小波变换在图像压缩应用中具有良好的压缩效率,但运 算量太大,在实时图像压缩的应用场合必须对小波变换算法进行较大的改进,同 时提出了用f p g a 实现小波变换的可能结构。 关键词:图像压缩离散余弦变换离散小波变换哈夫曼编码数字信号处理器 重庆大学硕士学位论文英文摘要 a b s t r a c t w i t ht h ed e v e l o p m e n to fm u l t i m e d i at e c h n o l o g y , d i g i t a li m a g ei sw i d e l yu s e di n t h ef i e l d so ff a m i l ya m u s e m e n t ,r e m o t es u r v e i l l a n c e ,n e t w o r ke d u c a t i o na n dp u b l i c s e c u r i t y b u tt h ec o n t r a d i c t i o ni sm o r ea n dm o r ec o n s p i c u o u sb e t w e e nl a r g en u m b e ro f i m a g ed a t aa n d t h el i m i t e dc a p a e i t yo fb a n dw i d t h i ti san e c e s s a r ya n dh a r dt a s kf o ru s t or e s e a r c hh i g l le f f i c i e n c ya r i t h m e t i cf o ri m a g ec o m p r e s s i o n i n t e m a t i o n a ls t a n d a r d o r g a n i z a t i o n ( i s 0 1h a v ep r o m u l g a t e ds e v e r a li n t e r n a t i o n a ls t a n d a r d si na c c o r d a n c ew i t h v a r i o u sa p p l i c a t i o n s ,i nw h i c ht h el a s t e s ta n dm o s te f f i c i e n c yr e s e a r c ha c h i e v e m e n t sa r e a d o p t e d ,t h es t a n d a r d sh a v er e c o m m e n d e ds t a n d a r da r i t h m e t i ca n dd a t at y p e s t h i sc a n d i r e c tr e s e a r c h e rh o wt oi m p r o v ea n di m p l e m e n tt h ea r i t h m e t i c s i t st h em a i np u r p o s e o ft h i sp a p e rt os e a r c he f f i c i e n c ya r i t h m e t i cf o ri n f r a r e d i m a g ec o m p r e s s i o n ;m e a n w h i l e , w ea i mt oi m p l e m e n tt h ea r i t h m e t i co nt id s p f i r s t l y ,t h ec o i t u t i o nm e t h o da n dh a r d w a r ed e v i c eu s e di ni m a g ec o m p r e s s i o nw e r e i n t r o d u c e d ,a n ds e v e r a li n t e m a t i o n a ls t a n d a r d sw e r es u m m a r i z e di nt h i st h e s i s , s e c o n d l y , t h eh a r d w a r ed e s i g nw a sd e s c r i b e dd e t a i l e d l y , a n dr e a l - t i m er e q u e s to f i m a g ec o m p r e s s i o nw e r et h o u g h to v e r i nt h ed e s i g np r o c e s s m a n yd e t a i la b o u t h a r d w a r e ,s u c ha st m s 3 2 0 c 6 2 11o v e r v i e w , d s p c o n n e c t 、v i t l lp e r i p h e r a le q u i p m e n t ,t h e s e t t i n go fd s pc o r er e g i s t e ra n dc c s 2 0s o f t w a r ew e r ei n v o l v e d f u r t h e r m o r e ,t h e s i m u l a t i o nw a v e f o r mo f f p g aw a sp r e s e n t e d t h i r d l y , am a t e r i a la r i t h m e t i ca n dt h ei m p l e m e n tw e r ed e s c r i b e d s i n c e t h i s a r i t h m e t i cw a sb a s e do nd i s c r e t ec o s i n et r a n s f e r ( d c t ) a n dh u f f m a nc o d i n g , f a s t d c t ,h u f f m a nc o d i n ga n dt h r e es t e ps e a r c h ( t s s ) w e r eh i g h l i g h t e di nt h i ss e c t i o n f i n a l l y , a ni m p r o v e dm e t h o db a s e do nd i s c r e t ew a v e l e tt r a n s f e r ( d w t ) a i ma t s h o r t a g eo fd c t i nt h i ss e c t i o n ,t h et h e o r ya n dc h a r a c t e ro fd w t w a sd e s c r i b e d , t h r o u g hw h i c hw er e a l i z e dt h a td w tp u tu ph i g he f f i c i e n c yi ni m a g ec o m p r e s s i o n b u t , t h el a r g en u m b e ro fo p e r a t i o ni saf a t a ls h o r t a g eo fd 帆w h i c hi sw h yd w ta r i t h m e t i c m u s tb ei m p r o v e dw h e ni tw a su s e di nr e a l - t i m ei m a g ec o m p r e s s i o n s o ,i nt h ee n do f t h et h e s i s ,as t r u c t u r eo f i m p r o v e dd w tw a sp r o v i d e d k e yw o r d s :i m a g ec o m p r e s s i o n ,d c t ,d w t ,h u f f m a nc o d i n g ,d s p i i 莺庆大学硕i :学位论文 1 绪论 1 1 引言 1 绪论 人们获取的外部信息8 0 都是以图像形式存在的。随着信息技术的发展,产 生了大量的图片、气象云图、遥感图像等静止图像以及可视电话、广播电视等各 类活动图像。红外热像仪是一种将光、机、电技术融为一体的高新技术产品,它 将人眼不可见的温度分布图( 红外波段o 9 1 4 微米) 通过光电转换成人眼熟悉的灰 度图像或者是人工彩色图像,这一个光电转换过程扩大了人眼的光谱响应波段、 增加了人获取信息的能力。红外图像的另外一个特点是红外波段具有较强的穿透 烟雾的能力,如图1 1 ,因此在烟雾弥漫的火灾现场红外热像仪可以发挥其独特的 作用。 红外技术近年来 最引人注目的进展是 低成本非制冷红外热 像仪的大量普及应 用,例如公安、缉私、 缉毒、搜索与救援、 安全防范、工艺控制、 质量控制、机器人、 边境巡逻、环境监测、 :茛烟下的红外围像猿涸下的可见光图像 车辆防撞、警戒和医图1 1 红外图像和可见光图像在浓烟r 的对比 疗诊断等。在非制冷 9 i 9 1 1 t h e c o m p a r eo f i n f r a r e d - i m a g ea n d n o r m a l i m a g e 红外热像仪的便携应用场合强烈要求红外热像的实时传输以便增强对现场了解和 指挥调度,特别是在事故现场,抢救队员在实施抢救同时,用携带的便携式非制 冷红外热像仪和无线扩频图像传输发射机,将事故现场情况的红外图像进行采集 并传输到指挥车或临时指挥部。 视频信号数字化后的数据量非常大,不便于存储和实时传输。例如,非制冷 红外热像仪输出的数字图像为3 2 0 x 2 4 0 象素,2 5 6 级灰度,帧频为2 5 f p s ,这样输 出的数据流速率为1 5 3 6 m b p s ,考虑到无线信道的容量及图像信息较大的冗余度, 有必要采用图像压缩技术。 重庆大学硕士学位论文 1 绪论 1 2 图像压缩基本原理 通过大量的统计实验发现图像信息中存在很大的冗余信息,例如,图像的 同一行相邻像素之问,相邻行像素之间以及活动图像相邻的帧之间都存在很强的 相关性,图像压缩技术就是在保证图像质量的前提下去除图像信息中的冗余信息 以达到减小数据量的目的的种技术。图像数据中的冗余信息主要包括:空间冗 余、时间冗余和视觉冗余【1 】。空间冗余是指相邻像素之间存在的相关性,通过d p c m 编码可以去处空间冗余;时间冗余是指活动图像相邻帧之间存在的相关性,通过 运动补偿与估计技术可以去处时间冗余。上述的两种编码技术都属于信息保持型 编码,即编码前后的信息量不变,所以数据量的减少相当有限。接下来介绍的视 觉冗余属于有限失真编码。视觉冗余是指人类的视觉图像的某些细节不敏感,对 这些信息进行删减会导致信息的损失,不过这些损失不易被发觉,有限失真编码 f 由此得名。一般而言,有限失真编码的压缩比较高,经常用于通信中的图像编 码,尤其是用于视频编码。 1 2 1 图像的变换 在数字信号处理中,通常有两种方法: 在图像处理技术中同样存在以上两种方法。 以从另外一个角度来分析图像信号。 a ) 离散傅立叶变换f t ) 一是时域分析法,二是频域分析法。 把图像信号从空阀域变换到频率域可 离散傅立叶变换在数字信号及数字图像处理中应用十分广泛,它建立了离散 时域( 或空域) 与离散频域之问的联系f 2 1 。 对于二维信号 f ( x ,y ) l x = 0 ,1 ,2 ,m 1 ;y = 0 ,1 ,2 ,n 1 ) 的离散傅立叶交换对为嘲: 脚) = 赢_ 赤_ m 萎- i 萎n - 1m 朋产 似,y ) = 赤篓篓脚州瀚 ( 1 1 a ) ( 1 ,1 b ) 二维d f t 正反变换运算可以分解为两次一维d f t ,而且d f t 还有快速算法, 重庆人学坝l 学位论文1 绪论 即f f t 算法,它可以大大减少计算次数,如果按照二维d f t 的定义直接计算共需 要n 2 n 2 次复数乘法。当n 增大时,这个运算量是相当大的。根据可分离性可以 用两次一维f f t 来降低计算的复杂度,此时所需的复数乘法次数为n 2 l 0 9 2 n 。 b ) 离散k l 变换 k l 变换( k a r h u n e n - l o e v et r a n s f o r m ) ,也称为特征向量变换或主分量变换, 它完全是从图像的统计性质出发实现的变换,它在数据压缩、图像旋转、遥感图 像的特征选择和统计识别中是很有用的【4 】。它的最大优点是去相关性能很好,但二 维k - l 变换不是可分离的变换,不能通过求两次一维的变换来完成二维k l 变换 的运算,同时它是一种和图像数据有关的变换,在变换中必须计算图像数据的协 方差矩阵的特征值和特征向量,计算量庞大,因此造成了k l 变换难以应用到实 际( 尤其是实时应用) 中去1 5 j 。 c ) 二维离散余弦变换( d c t ) 通常d f t 是复数域的运算,尽管借助于f f t 可以提高运算速度,但在实际应 用特别是实时处理中带来了不便。由于实偶函数的傅立叶变换只含实的余弦项, 因此可以构造一种实数域的变换离散余弦变换,在对语音、图像信号的确定 变换矩阵的正交变换中,d c t 是一种准晟佳变换。 d c t 变换的基本思想是将一个实函数对称延拓成一个实偶函数,对二维的图 像信号 f i x ,y ) l x = 0 ,1 ,2 - - , m 一1 ;y = 0 ,l ,2 - - , n 一1 ,其变换对为【6 j : 卿咖去荆m 萎- i 丢n - i 他加芝笋c 。避笋 :砷 f ( x , y ,= 击蓦篓c c 脚灿s 竽c o s 骂产n :e , 二维d c t 与二维d f t 类似,其正反变换的变换核相同且是可分离的,可采 用两次一维d c t 实现图像信号的二维d c t ,也有类似f f t 的快速算法f d c t 【7 j 。 综上所述,d c t 具有下列优点: 1 1 实数变换 2 ) 确定变换矩阵( 与变换对象无关) 3 ) 准最佳变换性能 4 ) 是一种可分离的变换 5 1 有快速算法 在近年颁布的一系列视频压缩标准建议中,都把d c t 作为其中的一个基本模 块,足以表明其重要地位。 重庆大学坝l :学位论文1 绪论 d ) 离散小波变换( d w t ) 基于小波变换的图像压缩被认为是当前最有发展前途的图像压缩算法之一, 具有广泛的应用前景。 对于二维数字图像,通过分别进行水平和垂直滤波,离散小波变换将图像分 成四个子带【8 】:垂直方向和水平方向的低频分量l l l ,水平方向的低频和垂直方向 的高频分量l h l ,水平方向的高频和垂直方向的低频分量h l l ,垂直方向和水平 方向的高频分量h h l 。l l l 称为近似信号,其它三个分量称为细节信号。对近似 信号进行类似的分解又可得到四个分量:u 上,l h 2 ,h l 2 和h h 2 ,如此反复可对 图像进行多级分解。如图1 2 所示为三级小波变换示意图 l l 3h l 3 h l 2 l h 3h h 3 h l l l h 2h h 2 l h lh h l 图1 2 三层小波分解示意图 f i g i 23 - l e v e lw a v e l e td e c o m p o s i t i o nm 印 1 2 2 图像统计特性与压缩编码 1 ) 图像的信息熵 由于图像信息的编码必须再保持信息源内容不变或者损失不大的前提下才 有意义,这就涉及到信息的度量闽题。对于一个无记忆的信源x ,各抽样值i 的出 现的概率为p i ,则图像的信息熵h ( x ) 为【9 】:( 单位:比特象素) 日( ) = 一p f l o g :只0 3 ) 在有记忆的信源中,如果相继的n 个符号之间存在关联性,则可以把这些有 关联的n 个符号作为个信的符号b j ( n ) ,信息源发出这个新符号的序列的概率用 重庆人学硕j :学位论文1 绪论 p ( b i ( n ) ) 表示,此时每个符号序列的平均信息量为:( 单位:比特新符号) 目( ) = - e p ( b i ( n ) ) l 0 9 2 尸( 0 3 i ( n ”) ( 】,4 ) 2 ) 几种常用的统计编码方法 统计编码是建立在图像的统计特征基础上的压缩编码方法。信源冗余度来自 于信源本身的相关性和信源内部事件的概率分布的不均匀性,只要找到去除相关 性的和改变概率分布不均匀的方法就得到了信源统计编码的方法。 咯夫曼编码是根据可变长最佳编码定理而产生的一种编码方法【1 0 】。在哈夫曼 编码中,如果码字的长度严格按照所对应符号出现概率的大小排列,则平均码字 长度一定小于其它任何顺序的排列方法。哈夫曼编码虽然效果较好,但实际中往 往遇到一些具体问题,比如码字集合过于庞大,硬件实现比较复杂等。因此,在 实际编码方法中采用一种性能较差但实现方便的方法,即准可变长编码。 算术编码的方法是将被编码的信源信息表示成实数轴上的o 1 之间的一个区 间,消息越长,编码表示它的区间就越小,表示这一区间所需的二进制位数就越 多码字越长,反之,编码所需的二迸制位数就越少码字越短。信源中连续符号根 据某一模式生成概率的大小来缩小间隔,可能出现的符号要比不太可能出现的符 号缩小范围少,只增加了较少的比特。 还有一种编码为香农编码,它的效率比哈夫曼效率略低一些。 1 2 3 运动估计与补偿 对活动图像的压缩编码既要考虑利用每幅图像的内部相关性进行帧内压缩编 码,又要考虑利用相邻帧之间的相关性进行压缩编码,这样得到的最终码率才可 能达到最佳。帧间编码主要采用的是运动估计与补偿技术。 实际的序列图像内容千差万别,把运动图像以整体形式划分出来是极其困难 的,目前广泛应用的是块匹配运动估计与补偿方法,这种方法有一个基本假设, 即块内所有象素具有同样的平移运动,因此,子块的运动矢量就是子块内所有象 素的运动矢量。对于其它类型的运动,例如缩放、旋转,以及背景区的暴露或掩 盖等。则没有考虑。 块匹配算法主要有三种:全所搜法、三步搜索法和分层运动估计算法i 】,其 中,三步搜索法是目前应用很广泛的一种次最优的运动矢量搜索算法。在三步法 重庆人学硕f 二学位论文 1 绪论 中,搜索范围为- - - - - 7 ,即在上一帧以当前子块为原点,将当前子块在其上下左右距 离为7 的范围内按一定的规则移动,每移动到一个位置,取出同样大小的子块与 当前子块进行匹配计算。 1 3 图像数据对d s p 的要求 在数字图像处理中,有大量的数字信号处理工作要完成,而这些工作大多要 求实时完成,传统的计算机技术已经难于胜任,因此,这一问题的解决很大程度 上依赖于高速d s p 技术。在图像处理系统中对d s p 有许多特殊的要求,大致体现 在三个方面1 1 2 1 : 1 ) 处理的数据量庞大 和文本信息相比,图像的信息量显得十分庞大,要求d s p 运算速度快,具有 高速的存储器及i o 存取能力,具有高速的数据定位能力,在运算上要适应简单的、 规则、重复率高、速度快的算法,如果需要,还应具有并行处理和多机协同工作 的能力。 2 ) 处理的数据量可变、突发性强 图像信息的数据量在很多情况下是随图像的内容变化而变化的,例如图像编 码中的码率是随着不同的信息内容、不同的时间而变化的,场景图像中物体的运 动等也会形成数据量的突发或波动。要求d s p 能适应复杂、不规则但运算量较小 的运算及控制任务。 3 1 图像通信中复合信息多,同步性、实时性要求高 在图像通信系统中,各类信息之间存在很强的时空关联,因此,对信息传输 的同步性、实时性的要求也很高。 1 4 图像质量的评价 图像质量的研究是图像信息科学的基础研究之一。对于图像处理或图像通信 系统,其信息的主体是图像,衡量这个系统的重要指标就是图像的质量,因此就 要求有一个合理的图像质量评价方法。 图像质量包含两方面:一个是图像的逼真度,即被评价图像与原标准图像的 相似程度;另一个是图像的可懂度,是指图像能向人或机器提供信息的能力。尽 管最理想的情况是能够找出图像逼真度核图像可懂度的定量描述方法,以作为评 价图像核设计图像系统的依据,但由于目前对人的视觉系统性质还没有充分理解, 重庆大学硕士学位论文 1 绪论 对人的心理因素还没有定量的描述方法,因而,用得较多的、最权威的还是主观 评价方法。 1 ) 图像的主观评价【1 3 】 图像的主观评价是通过人来观察图像,对图像的优劣作出主观评定,然后对 评分进行统计平均,就得出评价的结果。这时评价出的图像质量与观察者的特性 及观察条件等因素有关。 国际规定,标准环境,标准图像主观评价采用5 级评分制,如表1 1 所示: 表1 1 图像主观评价5 级评分表 t a b l e1 1 l a m g eq u a l i t ys c o r ei n5l e v e l s 妨碍尺度质量尺度得分 看不出劣化非常好5 有劣化不影响观看好 4 有劣化稍微影响观看一般3 影响观看 差2 严重影响观看非常差 1 2 1 图像的客观评价 尽管图像主观的质量评价是最权威的方式,但在一些研究场合,也希望对图 像的质量有一个定量的客观描述。图像质量的客观评价由于着眼点不同而有多种 方法,一种常用的方法为归一化的均方误差n m s e 【1 4 j ,设f i ( j ,k ) 为原参考图像,f 2 0 , k ) 为其降质图像,图像尺寸为m n 则 ( ,k ) - f 2 ( j ,) 】2 m 艇= 型等品石一 m ( ,a ) 】2 = 0k = o 另一种常用的方法是峰值信噪比p s n r : p s n r = 2 0 l o g l o a 4 m n 其中,a 为f 0 ,k ) 中的最大值,对于8 比特精度的图像a = 2 5 5 。 ( 1 5 ) ( 1 6 ) 一研一u一厶 一 一 一”一u 一听 丽 而脚 重庆大学硕士学位论文2 图像压缩国际标准简介 2 1 引言 2 图像压缩国际标准简介 随着多媒体技术应用的不断增加,图像压缩技术不仅要求具有较高的压缩性 能,而且还要求有新的特征来满足一些特殊的要求,因此,在实际中根据应用目 的的不同制定了各种不同的图像压缩编码国际标准。通过对这些标准的研究并对 现行的编码方法进行归纳总结,有助于图像编码的发展方向,可以前人已经取得 的成果融入我们的系统并对尚未解决的问题进行更深入的研究。 目前,图像压缩编码国际标准可分为静态图像压缩和动态图像压缩两大类, 静态图像压缩技术主要是对空间信息进行压缩,其主要代表是j p e g 和j p e g 2 0 0 0 : 动态图像压缩技术除了对空间信息进行压缩外,还采用了帧间编码技术,对时间 信息也进行了压缩,主要代表有m p e g 1 ,m p e g 2 ,m p e g 一4 和h 2 6 x 。本章 将对这些标准作一个简单的介绍。 2 2 j p e g 标准旧 j p e g 全名为j o i n tp h o t o g r a p h i ce x p e r t sg r o u p ( 联合摄影专家组) ,它是一个在 国际标准组织( i s o ) 下从事静态图像压缩标准制定的委员会。它用于连续变化的静 止图像,这里包括灰度等级和颜色两方面的连续变化。j p e g 包含两种基本压缩方 法,各有不同的操作模式。第一种是有损压缩,它是以d c t ( d i s c r e t ec o s m e t r a n s f o r m ) 为基础豹压缩方法。第二种为无损压缩,又称预测压缩方法。但最常使 用的是第一种,即d c t 压缩方法,因为这种方法的优点是先进、有效、简单、易 于交流,因此应用广泛,是以d c t 为基础的最基本、最重要的方法,j p e g 优良 的品质,使得它在短短的几年内就获得极大的成功,目前网站上8 0 的图像都是 采用j p e g 的压缩标准。然而,随著多媒体应用领域的激增,传统j p e g 压缩技术 已无法满足人们对多媒体图像资料的要求。因此,更高压缩率以及更多新功能的 新一代静态图像压缩技术j p e g2 0 0 0 就诞生了。j p e g2 0 0 0 正式名称为:i s o l 5 4 4 4 , 同样是由j p e g 组织负责制定。该标准是由联合摄影专家组于1 9 9 7 年开始征集提 案,把它作为j p e g 标准的一个更新换代标准。 重庆大学硕士学位论文2 斟像压缩国际标准简介 2 2 1 j p e g 2 0 0 0 的新特征 j p e g 2 0 0 0 与传统j p e g 最大的不同,在于它放弃了j p e g 所采用的以离散 余弦变换( d i s e r e t ec o s i n et r a n s f o r m ) 为主的区块编码方式,而采用以离散小波转 换( d i s c r e t ew a v e l e tt r a n s f o r m ) 为主的多分辨率编码方式。离散小波变换算法是现 代谱分析工具,在包括压缩在内的图像处理与图像分析领域正得到越来越广泛的 应用。此外j p e g 2 0 0 0 还将彩色静态画面采用的y p e g 编码方式与2 值图像采用的 j b i g 编码方式统一起来,成为对应各种图像的通用编码方式1 6 】1 1 7 】。 j p e g 2 0 0 0 标准提供了一套新的特征,这些特征对于一些新产品( 如数码相机) 和应用( 如互联网) 是非常重要的。它把j p e g 的四种模式( 顺序模式,渐进模式,无 损模式和分层模式) 集成在一个标准之中。在编码端以最大的压缩质量( 包括无失真 压缩) 和最大的图像分辨率压缩图像,在解码端可以从码流中以任意的图像质量和 分辨率解压图像,最大可达到编码时的图像质量和分辨率。j p e g 2 0 0 0 应用的领域 包括互联网、彩色传真、打印、扫描、数字摄像、遥感、移动通信、医疗图像和 电子商务等等。它的最主要的特征如下【i 8 】: 1 ) 高压缩率 由于在离散小波变换算法中,图像可以转换成一系列可更加有效存储像素模 块的“小波”,因此,j p e g 2 0 0 0 格式的图片压缩比可在现在的j p e g 基础上再提高 l o 3 0 ,而且压缩后的图像显得更加细腻平滑,这一特征在互联网和遥感等图 像传输领域有着广泛的应用。 2 ) 无损压缩和有损压缩 j p e g 2 0 0 0 提供无损和有损两种压缩方式,无损压缩在许多领域是必须的,例 如医学图像中有时有损压缩是不能忍受的,再如图像档案中为了保存重要的信息 较高的图像质量是必然的要求。同时j p e g 2 0 0 0 提供的是嵌入式码流,允许从有损 到无损的渐进解压。 3 ) 渐进传输 现在网络上的j p e g 图像下载时是按“块”传输的,因此只能一行一行地显 示,而采用j p e g2 0 0 0 格式的图像支持渐进传输( p r o g r e s s i v et r a n s m i s s i o n ) 。所谓 的渐进传输就是先传输图像轮廓数据,然后再逐步传输其他数据来不断提高图像 质量。互联网、打印机和图像文档是这一特性的主要应用场合。 4 ) 感兴趣区域压缩 可以指定图片上感兴趣区域( r e g i o no f i n t e r e s t ,r o i ) ,然后在压缩时对这些区 域指定压缩质量,或在恢复时指定某些区域的解压缩要求。这是因为子波在空间 重庆大学硕士学位论文 2 图像压缩国际标准简介 和频率域上具有局域性,要完全恢复图像中的某个局部,并不需要所有编码都被 精确保留,只要对应它的一部分编码没有误差就可以了。 5 ) 码流的随机访问和处理 这一特征允许用户在图像中随机地定义感兴趣区域,使得这一区域的的图像 质量高于其它图像区域;码流的随机处理允许用户进行旋转、移动、滤波和特征 提取等操作。 6 ) 容错性 在码流中提供容错性有时是必要的,例如在无线等传输误码很高的通信信道 中传输图像时,没有容错性是让人不能接受的。 7 ) 开放的框架结构 为了在不同的图像类型和应用领域优化编码系统,提供一个开放的框架结构 在是必须的,在这种开放的结构中编码器只实现核心的工具算法和码流的解析, 如果需要解码器可以要求数据源发送未知的工具算法。 8 ) 基于内容的描述 图像文档、图像索引和搜索在图像处理中是个重要的领域,m p e g 7 就是 支持用户对其感兴趣的各种“资料”进行快速、有效的检索的一个国际标准。基 于内容的描述在j p e g 2 0 0 0 中是压缩系统的特性之一。 2 2 2 j p e g 2 0 0 0 的基本实现框架 j p e g 2 0 0 0 编码器的结构框图如图2 1 ( a ) 所示,首先对源图像数据进行离散小 波变换,然后对变换后的小波系数进行量化,接着对量化后的数据熵编码,最后 形成输出码流。解码器是编码器的逆过程,如图2 1 ( b ) 所示,首先对码流进行熵解 码,然后解量化和小波反变换,最后生成重建图像数据“9 】。 源图像数据 重建图像数据 ( b ) 图2 1j p e g 2 0 0 0 编解码结构 f i g2 1j p e g 2 0 0 0c o d e cs t r u c t u r e j p e g 2 0 0 0 的处理对象不是整幅图像,而是把图像分成若干图像( i m a g e t i l e s ) ,对每一个图像片进行独立的编解码操作。术语“图像片”是指原始图像被 重庆人学碳l 学位论文2 图像压缩国际标准简介 分成互不重叠的矩形块,对每一个图像片进行独立的编解码处理。j p e g 2 0 0 0 的编 码步骤如下: 1 ) 把原图像分解成各个成分( 亮度信号和色度信号) 。 2 ) 把图像和它的各个成分分解成矩形图像片。 3 ) 对每个图像片实施小波变换。 4 ) 对分解后的小波系数进行量化并组成矩形的编码块( c o d e b l o c k ) 。 5 ) 对在编码块中的系数进行“位平面”熵编码。 6 )为使码流具有容错性,在码流中添加相应的标识符( m a k e r ) 。 7 )可选的文件格式用来描述图像和它的各个成分的意义。 在j p e g 2 0 0 0 中,核心熵编码算法是基于e b c o t ( e m b e d d e db l o c kc o d i n gw i t h o p t i m i z e dt r u n c a t i o n ) 的自适应算术编码。 2 3 m p e g 标准 m p e g 的全称是m o v i n gp i c t u r e se x p e r t sg r o u p ( 即动态图像专家组) ,由 i s o ( i n t e m a t i o n a ls t a n d a r d so r g a n i z a t i o n ,国际标准化组织1 与i e c ( i n t e m a t i o n a l e l e c t r o n i cc o m m i t t e e ) 于1 9 8 8 年联合成立,致力于运动图像( m p e g 视频) 及其伴音 编码( m p e g 音频) 标准化工作。m p e g 共有4 个版本,其中前两个版本m p e g 1 和m p e g 2 应用比较广泛,而m p e g 4 虽然己推出近两年,但有关它的应用却赢 到最近才活跃起来,m p e g 7 则是属于未来的标准。1 2 0 j 2 4 l 2 3 1 m p e g 1 标准1 2 2 l i 矧 m p e g 1 标准( i s o i e c l l l 7 2 ) 伟q 定于1 9 9 2 年,是针对1 5 m b p s 以下数据传输 率的数字存储媒体运动图像及其伴音编码设计的国际标准,主要用于在c d r o m ( 包括v i d e o c d 、c d i 等) 存储彩色的同步运动视频图像,它针对s i f ( 标准交 换格式) 标准分辨率( n t s c 制为3 5 2 x 2 4 0 ;p a l 制为3 5 2 2 8 8 ) 的图像进行压缩,每 秒可播放3 0 帧画面,具备c d ( 指激光唱盘) 音质。同时,它还被用于数字电话网络 上的视频传输,如非对称数字用户线路( a d s l ) 、视频点播( v o d ) 、教育网络等。它 的目的是把2 2 1 m b i t 秒的n t s c 图像压缩到l 。2 m b i t 职) ,压缩率为2 0 0 :1 。使用 m p e g 1 的压缩算法,可以将一部1 2 0 分钟长的电影压缩到1 2 g b 左右,因此, 它被广泛地应用于v c d 制作和一些视频片段的下载,目前9 0 以上的v c d 都是 重庆人学坝i j 学位论文2 图像压缩犀际标准简介 用m p e g 1 格式压缩的。 2 3 2 m p e g 一2 标准1 列i1 2 5 11 2 6 m p e g - 2 用于宽带传输的图像,图像质量达到电视广播甚至h d t v 的标准。 和m p e g 1 相比,m p e g - 2 支持更广的分辨率和比特率范围,将成为数字图像盘 ( d v d ) 和数字广播电视的压缩方式。这些市场将和计算机市场交织在一起,从而使 m p e g 2 成为计算机的一种重要的图像压缩标准。m p e g 2 标准i s o e c l 3 8 1 8 ) 制 定于1 9 9 4 年,是针对3 1 0 m b p s 的数据传输率制定的的运动图像及其伴音编码的 国际标准。m p e g 一2 可以提供一个较广的范围改变压缩比,以适应不同画面质量、 存储容量和带宽的要求。它在与m p e g i 兼容的基础上实现了低码率和多声道扩 展:m p e g 2 可以将部1 2 0 分钟长的电影压缩到4 8 g b ( 它提供的是我们通常所 说的d v d 品质) ,其音频编码可提供左右中及两个环绕声道、一个加重低音声道 和多达7 个伴音声道( 因此d v d 可有8 种语言配音) 。除了作为d v d 的指定标准 外,m p e g 2 还可用于为广播、有线电视网、电缆网络等提供广播级的数字视频。 不过对普通用户来说,由于现在电视机分辨率的限制,m p e g 2 所带来的高清晰度 画面质量( 如d v d 画面) 在电视上效果并不明显,倒是其音频特性( 如加重低音、多 伴音声道等1 得到了广泛的应用。 m p e g 3 是i s o i e c 最初为h d t v ( 高清晰电视广播) 制定的编码和压缩标准, 但由于m p e g 2 的出色性能已能适用于h d t v ,因此m p e g 一3 标准并未制定。 2 3 3 m p e g 4 标准1 2 7 i1 2 8 m p e g 4 于1 9 9 8 年1 1 月公布,它是针对一定比特率下的视频、音频编码, 更加注重多媒体系统的交互性和灵活性。为此,m p e g 一4 引入了a v 对象 ( a u d i o v i s u a lo b j e c t s ) ,使得更多的交互操作成为可能。“a 、,对象”可以是一个孤 立的人,也可以是这个人的语音或一段背景音乐等。m p e g 4 对a v 对象的操作主 要有:采用a v 对象来表示听觉、视觉或者视听组合内容:组合已有的a v 对象来 生成复合的a v 对象,并由此生成a v 场景;对a v 对象的数据灵活地多路合成与 同步,以便选择合适的网络来传输这些a v 对象数据;允许接收端的用户在a v 场 景中对a v 对象进行交互操作等。 m p e g 4 标准则由6 个主要部分构成: 1 ) 多媒体传送整体框架 重庆大学硕士学位论文2 图像压缩国际标准简介 多媒体传送整体框架主要解决交互网络中、广播环境下以及磁盘应用中多媒 体应用的操作问题。通过传输多路合成比特信息来建立客户端和服务器端的交互 和传输。 通过d m i f ,m p e g 4 可以建立起具有特殊品质服务( q o s ) 的信道和面向 每个基本流的带宽。 2 1 数据平面 m p e g 4 中的数据平面可以分为两部分:传输关系部分和媒体关系部分。为了 使基本流和a v 对象在同一场景中出现,m p e g 4 引用了对象描述( o d ) 和流图桌面 ( s m t ) 的概念。o d 传输与特殊a v 对象相关的基本流的信息流图。桌面把每一 个流与一个c a t ( c h a n n e l a s s o c i a t i o nt a g ) 相连,c a t 可实现该流的顺利传输。 3 ) 缓冲区管理和实时识别 m p e g 4 定义了一个系统解码模式( s d m ) ,该解码模式描述了一种理想的处理 比特流句法语义的解码装置,它要求特殊的缓冲区和实时模式。通过有效地管理, 可以更好地利用有限的缓冲区空间。 4 ) 音频编码 m p e g 4 的优越之处在于它不仅支持自然声音,而且支持合成声音。 m p e g 4 的音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对 象特征。 5 ) 视频编码 与音频编码类似,m p e g 4 也支持对自然和合成的视觉对象的编码。合成的 视觉对象包括2 d 、3 d 动画和人面部表情动画等。 6 ) 场景描述 m p e g 4 提供了一系列工具,用于组成场景中的组对象。些必要的合成信 息就组成了场景描述,这些场景描述以二进制格式b i f s ( b i n a r yf o r m a tf o rs c e n e d e s c r i p t i o n ) 表示,b i f s 与a v 对象一同传输、编码。场景描述主要用于描述各a v 对象在一个具体a v 场景坐标下,如何组织与同步等问题。同时还有a v 对象与 a v 场景的知识产权保护等问题。m p e g 4 为我们提供了丰富的a v 场景。 2 3 4 m p e g 小结 与m p e g - 1 和m p e g 2 相比,m p e g 4 更适于交互a v 服务以及远程监控, 它的设计目标使其具有更广的适应性和可扩展性:m p e g 一4 传输速率在4 8 0 0 6 4 0 0 0 b p s 之间,分辨率为1 7 6 x 1 4 4 ,可以利用很窄的带宽通过帧重建技术压缩和 传输数据,从而能以最少的数据获得最佳的图像质量。因此,它将在数字电视、 重庆大学硕十学位论文 2 图像压缩国际标准简介 动态图像、互联网、实时多媒体监控、移动多媒体通信、i n t e r n e t i n t r a n e t 上的视频 流与可视游戏、d v d 上的交互多媒体应用等方面大显身手。 不过,和d v d 相比,m p e g 。4 属于一种高比率有损压缩算法,其图像质量始 终无法和d v d 的m p e g 2 相比,毕竟d v d 的存储容量比较大。此外,要想保证 高速运动的图像画面不失真,必须有足够的码率,目前m p e g 4 的码率虽然可以 调到和d v d 差不多,但总体效果还有不小的差距。因此,现在的m p e g - 4 只能面 向娱乐、欣赏方面的市场,那些对图像质量要求较高的专业视频领域暂时还不能 采用。 2 4 n 2 6 4 标准 h 2 6 4 是i t u t ( 国际电信联盟) 的v c e g ( 视频编码专家组) 和i s o i e c 的m p e g 活动的联合视频组( t j o i n tv i d e ot e a m ) 开发的一个新的数字视频编码标准,它 既是i t u t 的h 2 6 4 ,又是i s o i e c 的m p e g 4 的第1 0 部分。1 9 9 8 年1 月份开始 草案征集,1 9 9 9 年9 月,完成第一个草案,2 0 0 1 年5 月制定了其测试模式t m l 8 , 2 0 0 2 年6 月的j t v 第5 次会议通过了h 2 6 4 的f c d 版。2 0 0 3 年3 月正式发布。 h 2 6 4 有望比目前根据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 云原生数据库工程师培训计划
- 人力资源部企业文化建设方案
- 企业安全生产与应急管理数字化方案
- JS框架选择与比较分析
- 产品部经理新产品上市与产品生命周期管理计划
- 公共演讲技巧提升演讲能力与表达力的方法
- 数字科技面试技巧与常见问题解答
- 供应链管理方法及面试准备
- hashmap面试技巧与实战经验分享
- 仓储加盟协议合同范本
- 国开2023年秋《分析化学(本)》形考任务1-3参考答案
- 车联网技术与应用PPT完整全套教学课件
- 如何识别与消除七大浪费演示文稿
- 最新工程施工组织设计论文参考文献99例,参考文献
- GB/T 2585-2021铁路用热轧钢轨
- GB/T 242-2007金属管扩口试验方法
- GB/T 16825.1-2008静力单轴试验机的检验第1部分:拉力和(或)压力试验机测力系统的检验与校准
- 中东历史及文化
- 主令电器(课用)课件
- 新形势下群众工作的理论与实践课件
- 人力资源公司简介课件
评论
0/150
提交评论