版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、三种数字图像压缩算法性能的研究夏细苟,胡亮,代光发(中南民族大学电信学院湖北武汉430074摘要:基于数字图像压缩的可能性与必要性,本文用信息论观点讨论了数字图像压缩的方法。并分别采用差分脉冲编码调制、离散余弦变换、离散小波变换等3种方法,对L ena (512×512图片进行处理,统计处理后的系数的概率分布、标准差、信息熵,以及增大量化阈值后0系数所占的比率,来研究他们用于数字图像压缩的性能。同时,还给出了每种方法的压缩重建的误差分析。并做了详细地比较,分析了导致他们性能差异的原因,这对于进一步学习和寻找更好的数字图像压缩方法具有一定的指导意义。关键词:数字图像压缩;差分脉冲编码调
2、制;离散余弦变换;子带编码;离散小波变换中图分类号:T P 312文献标识码:A 文章编号:1004373X (20051606904Research of Performance on Three Algorithms of Digital Image CompressionXIA Xigo u,HU L iang ,DA I Guang fa(Colleg e of T elecom municatio n,So ut h Centre U niv ersity fo r Nat i o nalit i es,Wuhan,430074,ChinaAbstract :Fo r the po
3、ssibility a nd necessit y o f dig it al image co mpr ession ,this paper has discussed the principle of three usual algo rithms applied t o dig ital image co mpressio n .Including Differ ential Pusle Code M o dulatio n (DPCM ,Discr ete Cosine T r ansfo rm (D CT ,Discret e Wav elet T r ansfor m(DW T .
4、What s mor e,for r esearching their per for mance o n imag e co mpr ession,it has g iv en out the pro bability distr ibuting of co efficient,standar d difference,info rm atio n ent ro py ,mea n squared er ro r,and the percentag e of zer o coefficient after pr ocessing the picture L ena (512×512
5、with them on M atlab .It ha s a com par ison o f these thr ee alg or it hms in detail ,and has analy sed the cause of leading to their different perfo rm ance,t his co ntributes to fur ther lear ning and sear ching the bet ter algo rithms fo r dig it al image co mpr ession.Keywords :digit al image c
6、o mpr essing;DPCM ;DCT ;subband coding ;DW T收稿日期:20050509在过去的20多年里,微电子、计算机和传感器技术取得了突飞猛进的发展。数字图像的获取、数字处理、存储、传输、显示等技术也因此获得了极大的成功。但是,当前随着人们对图像、声音等多媒体信息的需求越来越大,如果直接把未经压缩的图像数据用于交换和存储,那么数据的大小还是会远远超出已有的存储技术和网络带宽1。不过,把图像数据进行适当的压缩,则可能使图像数据大小减小几十倍甚至上百倍。显然,数字图像压缩有着重大的实用价值和广阔的发展前景。1图像压缩的原理图像的数字化就是用矩阵表示图像象素的色彩及亮
7、度信息。这种方法得到的数字图像毫不考虑图像内部的相关性,因此引入很大的冗余。图像数据压缩就是要去掉这些冗余以及可能存在的不相关的信息,来减小图像数据。一般的静态图像都存在空间冗余和频谱冗余,而动态的图像不同帧之间还存在很强的相关2。图像压缩的性能将取决于去除这些冗余的效果。同时,图像本身的冗余度决定了无损压缩的比例。因为自然图像是极富规律性和相关性的,所以压缩的空间都很大。图像解压重建时,有时不必精确恢复每一个象素的值,而只需恢复重要信息。这就是有损压缩,他允许合理地重建误差,但却能得到极低的编码率,所以非常实用。DPCM (差分脉冲编码调制利用相邻象素间的相关性,用邻近的象素值预测当前象素值
8、,对预测误差进行量化,减小了量化的动态范围,降低编码率。DCT (离散余弦变换使得图像的能量主要集中在低频成分,高频系数值都很小,再做熵编码,压缩效果也很明显。而DWT (离散小波变换能够极好地去除所有尺度下的冗余,所以被最新的图像压缩标准JPEG 2000采纳。由Shannon 的信息论3知道,对由K 个符号a k ,k =0,1,K -1组成,a k 出现的概率分别为P (a k 的无记忆信源图像的信息熵:H =E I (a k =-K -1k =0P (a klog P (a k(1如果所有符号出现的概率相等,那么信息熵将最大。当采用二进制编码时,单位为比特/象素。相反,对图像进行适当处
9、理,改变系数概率分布,那么就可以经过熵编码,减小图像编码的平均比特数。这里所指的适当处理包括各种预测、变换等,要求是可逆的,否则就不能恢复原图像。如果能够设计出式(2表示的编码方法时,编码的冗余度R 为0,如式(3所示。 L w (a k =-log P (a k (2其中,L w (a k 用来代表符号a k 的码字的长度。R =E L w (a k -H =0(3即理想编码的平均码长为式(4:E L w (a k =-K -1k =0P (a klog P (a k(4 由于符号的概率难以估计,通常这种理想的编码方法实现起来都很困难,因此在实际应用中,为了增大压缩比,往往可以通过增大量化阈
10、值的方法来使更多的小系数落入量化0值区间。本文后面的内容将分别采用差分脉冲编码调制、离散余弦变换、离散小波变换等3种方法,对Lena 图片处理,统计处理后的系数的概率分布及标准差、信息熵以及增大量化阈值后0系数所占的比率,来研究他们用于数字图像压缩的性能。同时,还给出了每种方法的压缩重建的误差分析。2三种图像压缩的方法及性能比较2.1DPCM 压缩本文采用一种编码方法简单,编码效果适度的DPCM 方案,即由前m 个象素的线性组合预测当前象素值。预测器如图1所示,用式(5表示。x =0.75A -0.50B +0.75C (5 图1DP CM 预测器用预测值与实际图像值比较得到预测误差。预测误差
11、和原数据比校,幅值的动态范围小得多。因此对预测误差编码比直接对图像的每个点编码用的码位要少得多。从信息论来看,DPCM 很好地去除了邻近象素的相关性,是一种比较有效的编码方法。原L ena 图像灰度概率分布如图2所示,采用DPCM 得到的预测误差值概率分布P (x (0,1,x (-200:200,如图3所示。显然,做DPCM 后的数据的动态范围大大减小了,几乎绝大多数的数据值都集中在0附近。并且实验结果表明,不同图像的预测误差统计都有与图3有相似的曲线关系,只不过偏差和方差的大小有所不同。可以算得原L ena 图像的信息熵为7.59比特/象素,标准差为47.85。DPCM 的预测误差值的信息
12、熵为4.56比特/象素,标准差为6.92。即以大于4.56比特/象素码率编码时,可以得到无损的图像,也就是说DPCM 几乎可以把图像数据压缩为原来的一半,而丝毫不影响图像的质量。表1给出了做DPCM预测量化的系数的统计值及重建误差。图2Lena的灰度概率分布图3DP CM 后系数分布表1DPCM 压缩性能DPCM 量化阈值0系数比例M SE D =6.92H =4.56无损10.24%0228.79%7.33457.55%44.92674.87%77.50其中M SE 指解压缩图像与原始图像的均方根误差(式6,D 表示标准差,H 表示信息熵,以下同。M SE =1N 2Ni =1Nj =1f
13、(i ,j -f (i ,j 2(6可以看出,DPCM 在压缩比不是很大时,重建误差较小。而当增大量化阈值时,重建误差很快增大,这是因为DPCM 做整数量化时的误差积累造成的。2.2DCT 变换编码傅里叶变换把时(空域的信号变换到频域中,信号的能量按频谱从低到高的顺序重新排列。因为自然图像的主要能量主要集中在低频部分,而在高频部分有很多小系数。DCT 变换以离散傅里叶变换为基础,只不过变换基函数为余弦函数,因此变换后的值仍然在实数域内。而且,DCT 类似于傅里叶变换有快速算法。JPEG 图像压缩标准2是以块余弦变换来消除块内冗余为基础的。图像被分成8×8的子块,分别对每个子块做DCT
14、 变换,得到频域系数。再利用人眼对不同频率的敏感度程度不同,做加权量化来增大压缩比。加权矩阵如表2所示,可以看出低频系数的量化精度高,而高频系数的量化间隔大。这样就有效增加了小系数的个数。对L ena 图像做分块DCT 变换,均匀量化与加权量化的系数统计分布图如图4,图5所示,准确的统计参数见表3。均匀量化更直接地反映了DCT 去冗余的效果,而加权量化是实际采用的方法,更加符合人眼视觉特性,所以在做大比例压缩时更有用。表2JPEG 量化权矩阵16111016244051611212141926586055141316244057695614172229518780621822375668108
15、10377243555648119411392496478871031211201017292959812110010399 图4DCT均匀量化系数分布 图5DCT 加权量化系数分布 其中量化阈值为1时,也会造成较小的重建误差,这就是取整量化引入的量化噪声,可以忽略。可以看出DCT 变换比DPCM 后的系数分布更集中,分布图有更强的峰值。也就是说DCT 比DPCM 更好地去除了象素间的相关性,这是由于DPCM 只去除邻近象素的冗余,而DCT 能够去块内的冗余。而且,加权量化与均匀量化相比,具有更多的0系数,但其重建错误总体都很大,不过这个重建误差是基于人眼特性的,所以视觉并不敏感。另外,以上数
16、据是对直流分量采用DPCM 编码得到的结果,目的是更进一步增大压缩比,所以上图显示的性能比单独的DCT 效果要好。当压缩比较大(编码率低于0.25比特/象素时,JPEG 就会出现马赛克现象。可以推知,只有不仅能去除邻近象素的冗余、块内冗余,而且能够去除所有尺度内的冗余的变换,才会更好地实现图像压缩。小波变换就具有这样的优点,因此能得到更高的压缩比。表3DCT 变换后的系数统计结果量化技术量化阈值0系数比例M SE 量化技术量化阈值0系数比例M S E 均匀量化D =10.89H =04.53121.09%0.7379238.05%0.8882462.92% 1.7284884.20% 3.14
17、1693.40%4.6157加权量化D =10.05H =03.05156.67%8.05272.02%8.22482.59%8.381694.77%9.093297.60%9.83 2.3子带编码和DW T 变换子带编码的基本框图如图6所示,关键是构造一组相互正交的滤波器组,把原信号分解成许多子带频谱(分解的过程如图7所示,再用不同的码率分别对不同的子带进行编码。为了保持总采样点不变,子带滤波后,对原信号做下抽样。在子带解码时,做相应的上抽样,再应用适当的滤波,就可以重建子频带。最后把重建的子频带合成得到原信号。分解和合成的过程也不造成任何压缩,但对各子带分别以不同的比特率编码,却能压缩数据
18、。图6子带编码框图图7低通高通滤波理想的子带分解滤波器是频率响应无重叠,连续且段内增益为1。然而这样的理想滤波器是无法实现的,只能用交叉响应的带通滤波器。频带重叠的主要问题是子带分解抽样时会造成镜像,采用正交镜像滤波器(QM F(如图8所示的一维2子带,可以很好地解决此问题。使用Q M F 滤波器时,能在滤波综合重建图像时,精确地消除镜像。图8正交镜像滤波器当子频带个数不是太多时,子带中的象素仍然具有很强的相关性,还可以在子带内采用DPCM 或V Q 编码。不过更好的方法是,继续分解子带,并做相应的下抽样,多级子带分解的示意图如图9所示。这种多级分解使得能够逐级把信号的高频部分分解出来。在小波
19、分析理论中,把信号分解的低频部分称为近似,记为A ;而把高频部分称为细节,记为D 。目前,已经设计出丰富的性能良好的小波函数用来对信号进行分解和合成。小波函数一般具有快速收敛(FIR,正交和线性相位等特性。这些性质决定了其分析信号时的优良性质,如他能以所有尺度分析整幅图像,去除全部尺度内的相关性等。这样就不需要对图像分块,且能带来更大的编码压缩率。图9信号多级分解小波函数由尺度函数和小波函数的伸缩平移系组成。对图像做小波分解就是把信号分解为正交的小波函数系中去,这和DCT 本质上是相似的。这一过程相当于用尺度函数和小波函数的伸缩平移系对信号做逐级的低通和高通滤波,如图10所示,L 表示低频,H
20、 表示高频。图11显示了一层的Haar 小波分解的结果,其中3/4的地方几乎全黑,这就相当于在做位编码时几乎75%的系数为0,明显地减小了图像编码数据。分别采用Haar ,Db 5小波对Lena 图像做6层分解,系数统计分布图如图12,图13所示,各种统计参数见表4。 图10逐级分解存放系数的方法 图11Lena 一级Haar小波分解 图12Haar 小波D WT后的系数分布 图13Db 5小波DW T 后的系数分布由表4可以看出,DWT 比采用联合的DCT 及DPCM 编码效果稍好。在相同压缩比的条件下,DWT 的重建误差要比DCT 重建误差小,即DWT 能去除所有尺度下的相关冗余,具有最优
21、的数据压缩性能。JPEG 20004引入了嵌入式零树结构存储系数结构,把重要系数存放在数据头,而大量小系数高频细节被存放在后部分。这样就可以进行累进传输,先传送最重要的信号,然后再传送次重要信号,不断改善图像质量,而且可以随时停止,对于网络传输非常有用。或者实现精确的压缩比,在规定的压缩比下,先存放重要的信息,然后存放细节信息,直到填满全部存储空间。同时JP EG 2000还引入了其他的编码技术,近一步提高编解码的性能,如用于无线环境的反抗差错性等,但不是本文讨论的重点。DWT 变换编码性能更详细的数据见文献5。表4DWT 变换后的系数统计结果小波函数量化阈值0系数比例M S E 小波函数量化
22、阈值0系数比例M SEHaar 小波140.11%0.5397250.23% 1.18469.56% 1.92882.92% 3.081690.96% 4.463295.74% 4.966498.19%9.99Db5小波145.65%0.5347264.90% 1.2547476.95% 1.94887.68% 2.861693.24% 4.003296.34%5.686598.16%8.17133性能比较及结论要减少存放图像数据的大小,关键是要合理地选择数学模型,使得用其表示图像时引入的冗余最小;另一方面,要合理利用人眼特性,减少对人眼并不敏感的信号的量化精度。本文讨论的3种方法都能对原数字
23、图像去相关,减少冗余,因此去冗余的效果不错。DP CM 因为只能去除相邻象素的相关,因此压缩比不是很大,只适合大码率的情况。另外,DPCM 去相关后的象素灰度分布范围较宽,因此,增大量化门限对DPCM 压缩率影响不大,相反对解压缩错误影响很大。DCT 去块内相关,性能得到了很明显的改善。采用DCT 与加权量化相结合的JPEG 标准就得获得较大的压缩比和较满意的质量。DWT 因为能消除所有尺度内的相关,因此除了显著提高压缩比外,使图像不用分块,可以直接对大幅图像进行处理,较好地适应不同类型的图像。同时,图像压缩的性能除了其压缩比外,还有很多其他方面需要考虑,如编解码速率、重建质量、编解码的复杂度
24、、编解码延时、对抗噪声的坚韧度等。因为他们都直接影响到应用系统的设计与实现。所以真正的应用系统应该是基于以上所有因素的综合考虑以及合理折衷。参考文献1Sa ha S .Imag e Co mpr ession fr om DCT to Wav alet s J .AR eview A CM Cr ossro ads Student M agazine.2000, 6.2杨长生.图像与声音压缩技术M .杭州:浙江大学出版社,2000.3K enneth R Castlema n .数字图像处理M .北京:清华大学出版社,2001.(下转第75页囊线肌瘤样增生图像。从图2原图可以看出,图像较暗,他
25、的灰度值在低灰度区域分布较为集中,目标和背景都看不清楚,采用Pal 算法增强后,红细胞比原图稍微清晰一些,但视觉效果仍然不佳,且背景太黑,几乎得不到任何信息。用本文的算法增强之后,可以非常清晰地看见低渗状态下红细胞的形态,以及背景的一些细节。与图2相反,图5较亮,他的灰度值在高灰度区域分布较为集中,采用Pal 算法增强后,图像看起来亮度更高,导致一些肌瘤轮廓信息的消失,势必会影响医生的诊断。 图2低渗状态下红细胞原图像图3Pal算法结果 图4本文算法结果图5胆囊线肌瘤样(r =2,u c =0.32增生原图像 图6Pal 算法结果图7本文算法结果(r =2,u c =0.58采用本文的算法增强
26、后,图像的对比度明显提高,肌瘤的轮廓显示更加清晰,一些细节信息也得到很好的显现。传统模糊增强算法对低对比度图像的处理效果不佳,针对这一不足,有学者做过相关的研究和改进,但他们都是在采用模糊增强算法对图像增强前5或者增强后6做灰度变换,完全靠主观观察直方图来确定要变换的灰度范围,显然,这种方法操作起来十分不便。相比之下,本文的算法可操作性较好。4结语本文在分析传统模糊增强算法缺陷的基础上,提出了一种改进的模糊增强算法。实验结果表明:本文的算法克服了Pal 算法的不足,并具有较强的灵活性和适应性,可以根据图像类型动态选择u c ,满足不同类型图像增强的需要,能使图像在增强后保留更多的灰度信息,对比度显著增强,具有良好的视觉效果。参考文献1Pa l S K ,K ing R A .Imag e Enhancement U sing F uzzy Set sJ .Elect ro nics L ett er s .1980,(16:376378.2周德龙.图像模糊边缘检测的改进算法J.中国图像图形学报,2001,(4:353358.3O tsu N .A T hreshold Selectio n M ethod fro m G ray L ev elHisto gr amJ.IEEE T ran
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 光刻技术原理
- 2025年高职地图数据图例转换技术(图例转换实操)试题及答案
- 2025年中职设备维护管理(管理技术)试题及答案
- 2025年中职服装与服饰设计(服饰教学实操)试题及答案
- 2025年高职房地产经营与管理(房地产经营与管理基础)试题及答案
- 2025年高职人力资源管理(招聘与配置)试题及答案
- 2025年高职河运海事管理(海事管理基础)试题及答案
- 2025年中职电子技术应用(电子电路基础)试题及答案
- 2025年大学环境科学(水污染控制实验)试题及答案
- 2025年中职第二学年(老年护理方向)照护实务阶段测试题及答案
- 章节复习:平行四边形(5个知识点+12大常考题型)解析版-2024-2025学年八年级数学下册(北师大版)
- 《实践论》《矛盾论》导读课件
- 中试基地运营管理制度
- 老年病康复训练治疗讲课件
- DB4201-T 617-2020 武汉市架空管线容貌管理技术规范
- 药品追溯码管理制度
- 脚手架国际化标准下的发展趋势
- 购销合同范本(塘渣)8篇
- 生鲜业务采购合同协议
- GB/T 4340.2-2025金属材料维氏硬度试验第2部分:硬度计的检验与校准
- 销售合同评审管理制度
评论
0/150
提交评论