




免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学年论文论文题目: 图像压缩技术研究进展姓 名: 孟国栋 学 号: 08054215 班 级: 电子082 信息与电子工程学院2011年3月27日图像压缩技术研究进展孟国栋(山东工商学院 信息与电子工程系,山东 烟台 264005)摘要:本文主要介绍图像压缩技术的发展,分类及应用,并重点分析了几种主要图像压缩技术实现的原理。在通信系统中,为最大化的通过信道传输信息,在具有自然性质的信源、信道与信宿之中,增加人为的编码器与解码器,形成基本的通信系统模型。而在这些通信系统信息的传输中,就需要借助编码进行图像的压缩。关键词:图像压缩;编码;图像编码国际标准。文章编号:2011-08054215中图分类号:TP 391.41文献标识码:AThe Development of the Research of Image Compression TechnologyMeng Guodong ( Department of Information and Electronic Engineering ; Shandong Institute of Business & Technology, Yantai Shandong 264005)Abstract: The development,type and application of image compression techonology is mainly described,and an analysis of some kind of main image compression technologies theory is made in this article. In the communication system,inorder to maximize the transfer information through channels,in the information source,channel and hostel with nature character, encoder and decoder are increased to form the basic communication system model .Coding for image compression is needed in these transmission of the information in the comunication sysetms. Key words:image compression;coding; Image encoding to international standard.0.引言 多媒体计算机系统是现代计算机发展的主流方向。应用多媒体计算机是现代计算机系统的特征,有专家预测,多媒体技术的蓬勃发展将会导致计算机及系统的又一次革命。但是,多媒体计算机的发展面临着一个重大的难题,这就是海量数据的.存储与传送。在所有可能的数据中,图像又是数据量最大的数据类。以一般的彩色电视信号为例,以二倍于原始信号频率的采样频率进行采样,得到的数据量约为每秒钟96Mb,而现在各国即将推出的高分辨率电视的数据量约为1.2Gbps,这样大的数据量,不管是存储还是传输,都是令人难以接受的,因此必须经过压缩处理后再传输或保存。本文主要讲述了一些基本的图像压缩技术的一般过程和分类及应用,论述了一些图像压缩技术的常用方法,并对图像压缩技术的国际标准进行了简要的介绍,对图像压缩技术的未来发展趋势进行了一些预测,阐明了图像压缩技术的重要意义。1.图像压缩简介1.1图像压缩的可行性分析图像压缩的目的是为了减少需要保存或传输的数据量,但这不应以破坏原有图像信息为根本原则,否则压缩是无用的。由于原始图像中的数据量的大小与其携带的信息量并不相等,我们可以通过除去原始图像中的没有携带信息的数据以达到压缩的目的。一般来说,图像数据中存在以下几种冗余:编码冗余;知识冗余;视觉冗余。采取一定的策略从原始信息中找出并去掉这些冗余中的一种或几种,就可已达到压缩的目的。允许图像编码有一定的失真,也是图像可压缩的一个重要原因。1.2图像压缩的意义 由于图像具有很大的信息量,而在目前计算机系统的条件下,要想实现实时处理,就必须对图像进行压缩,如果对图像信息不经过压缩,则占用信息宽,是传输成本变得昂贵。1.3图像压缩的一般过程图像压缩处理一般是由两个过程组成的:一是编码过程,即将原始数据经过编码进行压缩,以便于存储和运输;二是解码过程,此过程对编码数据进行解码,还原为可用的数据。2.图像压缩的分类(1)按解码后的数据是否与原数据一致进行分类此种情况下,数据压缩方法一般可划分为两类:1.可逆编码方法 2.不可逆编码方法。(2)根据压缩方法的原理进行分类预测编码:这是一种基于统计冗余的编码方法。对于空间冗余来说,由于同帧图像内相邻像元点均可以由与它相邻且被编码的点来进行预测与此类似,只是将帧内转换为帧间。变换编码:这也是一种针对统计冗余进行压缩的方法。所谓变换编码,是将图像光强矩阵(时域信号)变换到系数空间(频域)上进行处理的方法。变换编码一般采用正交变换来做。信息熵编码:这是一种根据信息熵原理让出现频率大的码字短的码字表达,反之用长的码字表达。最常见的方法如哈夫曼编码、游程编码、以及算术编码。结构编码:也称为第二代编码。编码时先将图像的边界、轮廓、纹理等结构特征求出来,然后保存这些参数信息。解码是根据结构和参数信息进行合成,从而恢复出原图像。基于知识的编码:对于人脸等可用规则描述的图像,可以利用人们对于人脸的知识形成一个规则库据此将人脸的变化等用一些参数进行描述,从而用参数加上模型就可以实现人脸的图像编码和解码。基于知识的编码是一种比较新的编码理论,目前仍在研究阶段。3.常用的图像压缩方法3.1二值图像编码的压缩方法这是只由0和1两种数值的二值图像的数据压缩方法,其中具有代表性的是游程长度编码,这种编码是把连续出现的0或者1的个数用一个码字来表示,即将连续出现的相同的值汇总,并对其长度进行编码的方法。二值图像作为一类特殊的灰度图像,本身结构最简单,数据量最小,但在实际生活中以及图像处理、模式识别等科研领域中却占据重要的地位,许多文本、文件、工程图、传真、报纸等都可以看成是二值图像,而在模式识别、目标检测、运动跟踪、医学图像处理等课题的研究过程中,也都需要存储和处理大量的二值图像;此外,作为灰度图像的特殊情况,二值图像编码技术的发展无疑会对灰度图像编码起到巨大的促进作用。3.2预测编码的压缩方法已知图像一个像素离散值,利用其相邻像素的相关性,预测它的下一个像素(水平或垂直方向)的可能性,求其两者差,再量化编码,如果预测比较准确,误差就会很小。在同等精度要求的条件下,就可以用比较少的比特进行编码,达到压缩数据的目的。具有代表性的预测编码是差分脉冲编码调制(DPCM)。3.3变长编码它是种根据的值改变码字长度的方法,其中哈夫曼编码(Huffman coding)是代表性的变长编码之一,哈夫曼编码是计算机各数据出现的概率,从出现概率高的开始分配短的码字,对出现概率集中的情况比较有效。3.4变换压缩方法图像进过正交变换以后能够实现图像数据压缩的物理本质在于:经过多维坐标系中适当的坐标旋转和变换,把散落在个坐标轴上的原始图像数据,集中到少数坐标轴上,因而可以用较少的编码字节来表示一幅复杂图像,实现了图像压缩,从数学上看,可用于图像压缩编码的正交变换有很多,如Fourie变换,Cosine变换(DCT)和K-L变换等。3.5分形压缩方法分形编码算法是一种有损图像压缩技术。它是图像压缩的重要数学工具,有着广阔的应用前景。分形图像压缩是以迭代函数系统(IFS)为理论基础,即用自然景物的自相似性来进行数据压缩。分形图像压缩算法具有高压缩比、任意尺度下的重构、快速编码等优越性。此项研究由 M.Barnsley 于 1988 年首先提出,他成功地给予迭代函数系统的分形图像压缩应用于计算机图形学上,对航空图像进行压缩编码,并获得了 1000:1 的压缩比。但其算法有很大的局限性,最主要的缺陷就是编码过程需要人工干预。3.6小波变换的压缩方法小波变换用于图像编码的基本思想就是把图像根据Mallat塔式快速小波变换算法进行多分辨率分解。其具体过程为:首先使用某种小波 基函数将图像作小波变换,再根据 4个通道的不同情 况,分别量化编码, 比如对低频频段( LL) 采用较多的量化级别,而对中间频段( LH,RH) 采用较少量化级别,对高频频段 ( HH) 采用很少几个量化级别 ,这样根据重构时对复原信号的重要程度分别对待的方式可以有效地提高压缩比而又不产生明显 的失真。小波变换在静态图像压缩中的作用已经得到公认,为JPEG-2000标准所采纳。小波变换应用于图像压缩时,本质上是对原始图像的小波系数进行重组处理,然后用处理后的小波系数恢复图 像,在实际的信号压缩标准中(如JPEG-2000 ) , 一般采用支集长度为9和7的双正交小波,该方法容错性比较好,因此更适合实际的应用。小波图像压缩是当前图像压缩的热点之一,已经形成了基于小波变换的国际压缩标准。3.7复合压缩方法由于压缩方法繁多,为了充分利用各自优点,克服缺点,相应产生了多种复合方法,如:基于小波变换的分形图像压缩,基于DCT的分形图像压缩,基于非均匀分割和基础表的图像压缩,基于小波变换和大量量化的图像压缩等。为了满足不同需求和新理论、新技术的不断发展,对图象压缩的要求会越来越高。新的图像压缩方法必将会不断产生,同时研究现有的方法并有机地结合能解决很多图像处理问题。4.图像编码国际标准图像压缩的标准格式有以静态图像作为对象的JPEG(联合图片专家组)和以活动图像作为对象的MPEG(动态图像专家组)是ISO(国际标准化组织)和IIU(国际电信联盟)联合制定的图像压缩国际标准。另外,还被国际社会广泛接受和认可的一种多媒体数据压缩编码是H.261。 4.1 H.261H.261是由CCITT(国际电报电话咨询委员会)通过的。用于音频视频服务的视频编码解码器(也称K64标准),主要适用于视频电话和视频电视会议。它使用两种类型的压缩:一帧中的有损压缩(基于DCT)和用于帧间压缩的无损编码。并在此基础上使编码器采用带有估计的DCT和DPCM4的混合方式。这种标准与JPEG及MPEG标准有很明显的相似性,是其他图像压缩标准的核心和基础。其中的关键区别在于它是为动态使用设计的,并提供了完全包含的组织和高水平的交互控制。 4.2 JPEG “ 连续色调的静止图像的数字编码”,即JPEG标准。JPEG系统可分为基本系统和扩充系统两种:基本系统由DCT的顺序型工作模式和Huffman编码组成,所有符JPEG标准的设备必须符合基本系统;扩充系统提供不同的选择,除了基本系统以外,还提供其他编码方式。JPEG由ISO(国际标准化组织)和CCITT共同制定,并于1992年成为国际标准。它把冗长的图像信号和其他类型的静止图像减小到百分之一(及即压缩比100:1)。但是,过高的压缩率会严重影响图像的质量。当压缩比为20:1时,能看到图像稍微有点变化;当压缩比大于20:1时,一般来说图像质量开始变坏。JPEG是无损编码DPCM(查分脉冲编码调制)和有损编码DCT(离散余弦变换)的图像压缩格式。无损编码由于无损压缩得不到很高的压缩比,所以JPEG主要用于有损压缩的DCT,将有DCT得到的参数经过DPCM,游程长度编码,然后通过量化,斜线扫描等技术,实现高压缩比的目的。4.3 MPEGMPEG即活动图像专家组。4.3.1 MPEG-1标准活动图像专家小组于1992年11月通过11172号建议,即MPEG-1标准。该标准在H.261建议基础上有重大改进,以满足随机存取与高压缩比的要求,并与H.261建议后向兼容。为了满足这些要求,MPEG将图像分为三类:I图像仅作为帧内编码; P图像是利用过去的I或P图像向前预测得到,并作为下一个可预测的参照图像;B图像可以依据过去的和/或后来的参考图像(I和/或P)进行前向、后向或双向预测。三类图像如何选定和组合是开放的。另外,MPEG-1在系统层次上采用了分组技术,以便适应不同的传输和存储方式,媒体。这样MPEG-1数码流就支持压缩数据上的随机存取、频道更换、快进快倒(有点类似录像带)及一定的可编辑性和容错性。MPEG-1主要用于多媒体和广播电视,数据率要求在1.5Mbps4.3.2 MPEG-2标准1994年11月,活动图像专家小组通过了13818号建议,即MPEG-2标准,MPEG-2具有DVD级质量2。数据率要求4Mbps-10Mbps.在MPEG-1的基础上进行了重要扩展与改进。MPEG-2针对隔行扫描的常规电视图像(NTSC/PAL)专门设置了“按帧编码”和“按场编码”两种模式。并相应的对运动补偿技术做了扩展。为了适应不同应用的要求并保证数据的可交换性。MPEG-2定义了不同的档次和级别。支持可扩展性。目前已定义了四种可扩展性:空间扩展、信噪比扩展、数据分割扩展、时间域扩展。这些扩展性使得MPEG-2能支持许多应用,如数字电视。可以说MPEG-2是一个直接与数字电视广播有关的高质量图像与声音编码标准。4.3.3 MPEG-4标准1996年2月MPEG第33次会议上正式定义了第一个MPEG-4的视频验证模型VM(Verification Mode).1998年11月公布的国际标准草案FDIS(Final Draft International Standard)成为正式标准14496号的第一版。MPEG-4标准第二版是对第一版的扩充,增加了物体的伸缩编码,提高了编码效率,鲁棒性和灵活性。这个国际标准包含有纹理和视频编码、任意形状的视频对象编码和视频流的纠错编码等比较成熟的技术。至今仍在不断发展之中,MPEG-4于1999年完成第三版3。应该讲MPEG-4是为试听数据的编码和交互播放而开发的算法和工具,它是一数据速率很低(4832Kbps)的多媒体通信标准,它在异构网络环境下能可靠地工作,并具有很强的交互功能。为此MPEG-4引入了对象基表达的概念用来表达视听对象,并扩充了编码的数据类型,由自然数据对象扩展到计算机生成的数据对象,采用合成对象自然对象混合编码算法,在实现交互功能和重用对象中引入了组合、合成和编排的重要概念。4.3.4 MPEG-7标准MPEG-7多媒体内容描述接口作为MPEG家族的新成员,为各种多媒体信息进行标准化描述,是一种方便基于内容的多媒体信息进行快速有效的检索和查询的编码方案。MPEG-7多媒体内容描述接口,可以看作是基于语义信息的表示。它将指定用于一个描述各个多媒体信息的描述符标准集。还将对定义其他描述符的方法进行标准化。其中包括标准化描述符及其相互关系的结构。MPEG-7也将标准化一种说明描述计划的语言,如DDL(Description Definition Language)。视听材料如静止图像、3D模型、音频、视频以及这些元素在一个多媒体表达中是如何结合的信息。通过MPEG-7的描述就能被索引和搜索。MPEG-7是一个建立在其他标准之上的标准,它用到了MPEG-4中使用的形状描述符,MPEG-1和MPEG-2中的运动向量等。4.3.5 MPEG-21标准最新的MPEG-21多媒体框架将为人们更大范围地利用视频图像等多媒体信息资源提供有效的手段1。它是一个多媒体框架,允许用户可以透明地定制各种类型的网络上的多媒体资源,MPEG-21的基本框架要素包括数字项目说明,内容表示,数字项目的识别和描述,内容管理与使用,知识产权管理和保护,终端和网络,事件报告等部分。5.图像压缩技术发展趋势目前,图像压缩技术的发展可将图像编码划分为以下六代:“第一代压缩方法:直接波形变化,代表技术:PCM;第二代压缩方法:冗余去除,代表技术:DPCM、DCT、DWT、VQ;第三代压缩方法:结构编码,代表技术 :图像分割;第四代压缩方法:分析与综合,代表技术:基于模型的编码;第五代压缩方法:识别与重构,代表技术:基于知识的编码;第六代压缩方法:智能编码, 代表技术:语义编码。现在的编码处于第四代的水平,从国际数据压缩技术
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高一物理课件
- 移动基站场地租赁与通信基站信号覆盖扩展服务合同
- 离异双方财产分割及债务清偿确认合同
- 离婚房产分割及子女抚养、财产分配及债务承担协议书
- 城市核心区二手住房买卖及租赁综合服务合同
- 骶髂关节影像诊断课件
- CAD三维建模技术指南
- 养殖业市场开拓策略方案
- 工作总结:实现目标的坚晓之默
- 如何帮助中学生体验天生
- 2025年江苏省农垦集团有限公司人员招聘笔试备考及参考答案详解
- 2025至2030年中国粗杂粮及粗杂粮加工行业市场调研分析及投资战略咨询报告
- 军用无人机讲解课件
- 2025年中国移动校园招聘笔试试题解析及答题技巧
- 2025-2026学年地质版(2024)小学体育与健康三年级(全一册)教学设计(附目录P123)
- 《研学旅行指导师实务》课件-第6章 基(营)地研学课程操作
- 【MOOC】人格与精神障碍-学做自己的心理医生-暨南大学 中国大学慕课MOOC答案
- NB-T 47013.15-2021 承压设备无损检测 第15部分:相控阵超声检测
- 白酒委托灌装合同协议书范本
- YGL系列有机热载体锅炉安装使用说明书
- 中国美术史课件完整版
评论
0/150
提交评论