图像压缩技术的发展现状与趋势_第1页
图像压缩技术的发展现状与趋势_第2页
图像压缩技术的发展现状与趋势_第3页
图像压缩技术的发展现状与趋势_第4页
图像压缩技术的发展现状与趋势_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、E国裁技沦袁在茨图像压缩技术的发展现状与趋势耿玉静1赵华21燕山大学信息科学与工程学院 河北秦皇岛(066004)2河北师范大学电子系 河北保定(071003)E-mail: gyjlunwen摘 要 文章简要论述了图像和视频压缩技术的研究状况,就目前国际上正在研究的压缩标准和方法作了介绍,并对图像和视频压缩技术的发展趋势和前景进行了初步探讨。关键词 图像压缩,视频编码,视频对象,压缩标准1 图像压缩的可行性图像编码压缩的目的是对要处理的图像源数据按一定的规则进行变换和组合1,从而达到以尽量少的比特数来表征图像,同时尽可能好的复原图像的质量,使它符合预定应用场合的要求。图像数据之所以可以进行压

2、缩,是因为有以下几个方面的原因:组成图像的各像素之间,无论在行方向还是列方向都存在一定的相关性,即原始图像数据是高度相关的,应用某种编码方法提取或减少这些相关性,便可达到压缩数据的目的;从信息论看,描述图像信源的数据是由有效信息量和冗余量两部分组成的,去除冗余量能够节省传输和存储中的开 销,同时又不损害图像信源的有效信息量;有些场合允许图像编码有一定的失真,也是图像可以压缩的一个重要原因。2图像压缩的分类图像压缩编码的方法目前有很多种,出发点不同其分类亦有差异。以信息保真度为出发点,可以分为两大类:一类是冗余度压缩法。如著名的哈夫曼编码、香农编码、游程编码等,其特征是压缩比较低(一般不超过8:

3、1),但不丢失任何数据,可以严格恢复原图像,实现编/解码的互逆,故又称可逆编码或无损压缩。另一类是熵压缩法。如预测编码、变换编码、 统计编码等,由于在压缩过程中要丢失一些人眼所不敏感的图像信息,且所丢失的信息不可恢复,即图像还原后与压缩前不完全一致,故又称有损压缩。以具体编码技术为出发点,可 以分为:预测编码、变换编码、统计编码、轮廓编码、模型编码等。3图像压缩技术的现状20世纪80年代后,ISO、IEC和ITU陆续制定了各种数据压缩与通信的标准与建议。3.1静止图像压缩标准:JPEG标准&JPEG 2000标准3.1.1 JPEG 标准JPEG全名为Joi nt Photograph

4、ic Experts Group ,是一个在国际标准组织 (ISO)下从事静 止图像压缩标准制定的委员会。JPEG标准从1986年正式开始制订,1988年决定采用以图像质量最好的ADCT (Adaptive Discrete Cosine Transform )方式为基础的算法作标准 2,于1991 年3月提出10918号标准3 “连续色调静止图像的数字压缩编码”,即JPEG标准4,5。它在较低的计算复杂度下,能提供较高的压缩比与保真度。JPEG采用4种编解码方式:串行DCT( Discrete Cosine Transform )方式、渐进浮现式DCT 方式、无失真方式和分层方式。由于JPE

5、G优良的品质,使它在短短几年内就获得极大的成 功。随着多媒体应用领域激增,传统的JPEG压缩技术已无法满足人们对多媒体影像资料的要求。因此,更高压缩率以及更多功能的新一代静止影像压缩技术JPEG2000就诞生了。3.1.2 JPEG2000JPEG2000,正式名称为“ISO 15444 ” 2,6,7,亦是由JPEG组织负责制定。自 1997年3 月开始筹划,2000年规定基本编码系统的最终协议草案才提出。JPEG2000与JPEG最大的不同,在于它放弃了 JPEG所采用的以DCT为主的区块编码方式,而改用以DWT ( DiscreteWavelet Transform )为主的多分辨率编码

6、方式 6。JPEG2000的新特征有: JPEG2000作为JPEG的升级版,具有良好的低比特率性能,特别是对细节丰富的图像以0.25bpp的比特率进行压缩时,总体上其压缩率比JPEG高约30%左右。 JPEG2000同时支持有损和无损压缩;而 JPEG只支持有损压缩。 JPEG2000能实现渐进传送。它先传输图像的轮廓,然后逐步传输图像数据的细节,接收端重构图像时让图像由朦胧到清晰显示,而不像JPEG那样由上到下由左到右的显示。 JPEG2000支持所谓的“感兴趣区域”编码(Region of interest coding )17。可任意指定图像上感兴趣区域的压缩质量,亦可以选择指定的部分

7、先解压缩以突出重点。3.2运动图像压缩标准:MPEG-X系列&H.26X系列3.2.1 MPEG 系列MPEG (Moving Picture Experts Group )运动图像专家组成立于1988年,专门从事运动图像和伴音编码的标准制定。MPEG最初的三个任务是制定1.5Mb/s,10Mb/s,40Mb/s的压缩编码标准,即MPEG-1、MPEG-2、MPEG-3,后因MPEG-2的功能使MPEG-3多余,故MPEG-3 被撤消8。MPEG-4于1994年开始制定,其目的是实现甚低码率的音/视频压缩编码。MPEG-1是1991年11月提出草案,1992年11月通过,1993年8月

8、公布的。它适用于1.5Mb/s速率的数字存储媒体的运动图像及伴音的压缩编码。MPEG-1追求高的压缩比,去除图像序列的时间冗余度,同时满足多媒体等随机存取的要求。它的图像类型有三种:I图像,采用内部编码,不参照其他图像,亦称内部编码图像;P图像,采用预测编码,参照前一幅I或P图像作运动补偿编码,亦称预测编码;B图像,采用双向预测编码,参照前一幅和后一幅I或P图像作双向运动补偿编码,亦称双向预测图像9。MPEG-2制定于1994年,其设计目标是高级工业标准的图像质量以及更高的传输率。它进一步提高了压缩比,改善了音频、视频质量,采用的核心技术是分块 DCT和帧间运动补 偿预测技术10。MPEG-2

9、所能提供的传输率在 310Mb/s间,在NTSC制下的分辨率可达 720 X 486 ;可提供广播级的视像和 CD级的音质;向下兼容 MPEG-1,使得大多数MPEG-2解码 器可播放MPEG-1格式的数据,如VCD ; MPEG-2除了作为DVD的指定标准外,还可以用于 为广播、有线电视网、电缆网络以及卫星直播提供广播级的数字视频;MPEG-2可提供一个较广范围的压缩比11,以适应不同画面质量、存储容量以及带宽的要求。MPEG-4是对数字音/视频数据进行压缩、通信、存取和操作管理等的新标准,并为各种通信环境提供一种通用的技术解决方案。MPEG专家组深入分析了信息领域中计算机、通信以及以电视为

10、代表的消费电器即3C交叉融合的方式后12,认为MPEG-4应提供用于通信的新方式,其中心是基于内容的AV信息存储、处理与操作,支持交互性、高压缩比以及通用存储性等功能。在其结构上应具有适应性与可扩张性,以适应软、硬件技术的不断发展, 及时融合新的技术。由于MPEG-4的中心是基于内容与交互性的,它就不再对低码率范围做出特别要求。MPEG-4在通信信息描述中,首次提出了对象的概念13,如视频对象VO (Video Object)、 音频对象AO (Audio Object )等,这是一个新的飞跃。在编码方案上,MPEG-4仍是以块为基础的混合编码。MPEG-4标准主要应用于视频电话、视频电子邮件

11、和电子新闻等,其传输 速率要求较低,在 4.864kb/s之间,分辨率为 176 X 144。 MPEG-4利用很窄的带宽,通过 帧重建技术,压缩和传输数据,以求以最少数据获得最佳图像质量。MPEG-4更适用于交互AV服务以及远程监控。MPEG-7由MPEG委员会于1998年10月提出提议,2001年9月正式成为国际标准,又称为"多媒体内容描述接口(Multimedia Content Description In terface )” 12,其目标是建立对多媒体信息内容的标准化描述,试图规范不同种类多媒体信息的描述而不受表达形式的限 制。这些描述要与信息内容直接相关以便用来快速有效

12、的查询、访问各种多媒体信息。MPEG-7的应用范围广泛,既可以应用于存储,也可用于流式应用(如广播、将模型加 入In ternet等)。它可以在实时或非实时环境下应用,如数字图书馆、多媒体编辑等。另外, MPEG-7在教育、新闻、导游信息、娱乐、研究业务、地理信息系统、医学、购物、建筑等 各方面均有较深的应用潜力。MPEG-21是基于"多媒体框架(Multimedia Framework )标准” 12的,其最终目的是建 立一个多媒体框架,以通过预购网络和设备使多媒体资源在用户之间透明方便的使用。MPEG-21的基本框架要素包括数字项目说明、内容表示、数字项目的识别和描述、内容管 理

13、和使用、知识产权管理和保护、终端和网络、事件报告等。它支持的功能有:通过网络存 储,使用并交互操作多媒体对象;实现多种业务模型,包括对版权和交易的自动管理;对内 容进行隐私的尊重等。目前,这一标准仍处于开发当中。3.2.2 H.26X 系列1984 年国际电报电话咨询委员会的第23研究组建立了一个专家组专门研究电视电话的编码问题。经过研究与努力,1988年形成草案,1990年12月通过ITU-T的H.261建议。H.261是ITU-T针对可视电话和会议、窄带ISDN等要求实时编码和低延时应用提出的一 个编码标准12。它允许“采用p X 64kbit的图像业务的图像编解码”,因而 H.261简称

14、pX 64。 其中p是一个整数,取值范围为130,对应比特率为 64kb/s1.92Mb/s14。它建议采用中间格式 CIF (Com mon In termediate Format)和 QCIF (Quarter CIF )解决不同制式通信的矛盾; 解决了编码算法问题。H.261采用了运动补偿预测和离散余弦变换相结合的混合编码方案, 获得很好的图像压缩效果。1995年,在H.261的基础上,ITU-T总结当时国际上视频图像压缩编码的最新进展,针 对低比特率视频应用制定了 H.263标准。它提高了运动补偿的精度,常用于超低速率的图像 传输,被公认为是以像素为基础的采用第一代编码技术的混合编码

15、方案所能达到的最佳结果。之后,ITU-T又对其进行了补充,以提高编码效率,增强编码功能。补充修订的版本有1998年的H.263+,2000年的H.263+12。H.263采用第一代编码技术,在低速率视频传输质量,抗误码能力方面有明显提高,在视频业务传输中得到广泛应用。与H.261只能工作在CIF、QCIF两种格式不同,H.263的信源编码器可以工作于5种图像格式:QCIF、Sub-QCIF、CIF、4CIF、16CIF。另外,H.263还在H.261基本编码算法的基 础上提供了四种可选编码模式:非限制运动矢量模式、基于语法的算术编码模式、高级预测模式以及PB帧模式15,17。由于仅限于五种固定

16、图像大小、形状和时钟频率,它应用的灵活 性较低。H.263+即ITU-T在1998年通过的H.263第二版,增加了 12个新的高级模式,修正了第 一版中的非限制运动矢量模式16,18。修订版首先在视频格式多样性上做了改进,还提出一些新技术:如附加增强信息模式和增强参考帧再采样模式,进一步扩大适用范围,支持图像冻结和快照,以及多分辨率视频的应用,同时还增加了一些新技术来增强抗误码的能力:如分片结构模式、增强参考帧选择模式等,使视频信号经过压缩编码后能够在具有较大噪声干扰 的窄带信道PSTN ( Integrate Services Digital Network )和无限移动信道等上传输。通过使

17、用 去方块效应滤波器,降低分辨率更新模式和修正量化模式等新技术,重建图像的主观质量显著提高。由于H.263+的高级模式有些不能同时使用,有些需结合使用,如何选择合适的编码模式结合,对使用者来说很困难,因此ITU-T于2000年11月提出了 H.263+,称为H.263的第三版。它在H.263+的基础上增加了三个高级模式。H.26L标准是ITU-T和ISO/IEC联合制定的最新的图像压缩编码标准,它最先由ITU-T的VCEG于1997年提出的,它的目标是提出一种更高性能的视频质量有实质性提高的视频 编码标准。该标准于2003年3月完成,在ITU-T中被称为 Recommendation H .2

18、64 而在ISO/IEC 中成为 MPEG-4 标准的第 10 部分(ISO/IEC 14496-10 AVC,简称 MPEG-4-10 )。H.26L的一个基本概念是引入了两个不同的层次:视频编码层(VCL : Video CodingLayer)以及网络适配层(NAL : Network Adapter Layer)19,前者负责对视频进行高效的压 缩,后者则负责根据网络的传输需要进行编码数据的打包。H.26L相对于其他标准有以下的特点:低码率、高质量、可达到比H.263+提高一倍以上的编码效率;广阔的应用范围,既可用于严格时延限制的实时通信,可用于对时延要求不高的其他应用;稳健性,在网络

19、中传输时,有较强的抗误码性能;对各种网络的友好性,提供了友好的网络接口。4图像压缩技术的发展趋势从国际数据压缩技术的发展尤其是 MPEG的发展可以看出,基于内容的图像压缩编码方 法是未来编码的发展趋势。它不仅能满足进一步获得更大的图像数据压缩比的要求,而且能够实现人机对话的功能。 另外,任意形状物体的模型建立的关键问题还没有解决,这严重影响其应用的广泛性。因此,视频编码将朝着多模式和跨模式的方向发展。通过元数据进行编码也是今后编码的发展方向。元数据是指详细的描述音/视频信息的基本元素,利用元数据来描述音视频对象的同时也就完成了编码,因为此时编码的对象是图像的一种描述而不再是图像本身。从另一个角

20、度来说, 进一步提高压缩比, 提高码流的附属功能(码流内容的可访问性、抗误码能力、可伸缩性等)也将是未来的编码的两个发展方向。-5 -E国憩技论袁任线5.结束语从图像和视频压缩的发展可以看到:图像压缩的操作对象由像素到块再走向对象;压缩的分辨率逐渐提高,可扩展性逐渐增强;压缩的目的由单纯的减少数据量走向功能的多元化: 交互性、可分级性、灵活性;压缩的方法由单一化走向自适应的使用多种压缩工具。压缩技 术的发展与社会的需求息息相关。随着数学理论、信息论和计算机视觉等的发展必然会有功能更全面的更有效的图像压缩编码技术的产生。参考文献1 夏得深,傅得胜.现代图像处理技术与应用.南京:东南大学出版社,2

21、001,84-852 朱秀昌,刘峰,胡栋.数字图像处理与图像通信.北京:北京邮电大学出版社,2002, 199-2043 JPEG 2000. Signal Processing: Image Communication 17. 2002: 1-24 Michael W, Marcellin A. An overview of JPEG-2000A. Proc.IEEE Data Compression Conference©, 20005 丁莉,张琦.JPEG2000关键技术.电视技术,2003, 1: 74-786 刘方敏,吴永辉,俞建新.JPEG2000图像压缩技术过程及原理概

22、述J.计算机辅助设计与图形学学报,2002, 14(10): 905-9167 Majid Rabbani, Rajan Joshi. An overview of the JPEG2000 still image compression standard. SignalProcessing: Image Communication, 2002, 17: 3 - 488 尹显东,李在铭,姚军.图像压缩标准研究的发展与前景.信息与电子工程,2003, 1(4): 326-3319 薛文通,宋建设,袁礼海,沈涛.图像压缩技术的现状与发展.计算机工程与应用,2003: 65-6710 ISO/IEC

23、 144961-2: Information Technology-Coding of Audio-Visual Objects, Part 2: Visual S. 200111 Tingting, Zhang ,Ulf, Jennehag, Youshi Xu. Numerical modeling of transmission errors and video quality of MPEG-2. Signal Processing: Image Communication, 2001, 16: 817-82512 沈兰荪,卓力.视频编码与低速率传输.北京:电子工业出版社,2001:

24、30-50, 230-24813 Marius Preda,Fran-coise Preteux. Insights into low-level avatar animation and MPEG-4 standardization.Signal Processing: Image Communication, 2002, 17: 717-74114 ITU-T Recommendation H.261, Video coding for audiovisual services at p x 64kbitS. Rev.2, 199315 ITU-T Recommendation H.263

25、, Video coding for Low Bit Rate Communication S. 1995, Geneva16 ITU-T Recommendation H.263 Version 2(H.263+), Video coding for Low Bit Rate Communication S. 199817 Chi-Chang Kuoa, Jin-Jang Leoub. A new rate control scheme for H.263 video transmission. Signal Processing: Image Communication, 2002, 17: 537-55718 James T.H. Chung-How, David R. Bull Loss resilient H.263+ video over the Internet. Signal Processing:Image Communication, 2001, 16: 891-90819 Sheng-Wei Lin, Jin-Jiang Leou, and Li-Wei Kang. An error resilient codi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论