高效的DCT域图像任意比率下采样方法.doc_第1页
高效的DCT域图像任意比率下采样方法.doc_第2页
高效的DCT域图像任意比率下采样方法.doc_第3页
高效的DCT域图像任意比率下采样方法.doc_第4页
高效的DCT域图像任意比率下采样方法.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第28卷第7期通信学报Vol.28 No.72007年7月Journal on CommunicationsJuly 2007高效的DCT域图像任意比率下采样方法杜耀刚1,蔡安妮2(1. 北京电子科技学院 基础部,北京 100070;2. 北京邮电大学 电信工程学院,北京 100876)摘要:提出了一种新DCT域任意比率的下采样方法,即直接找出输入个块与下采样输出的个的块的DCT系数关系式。实验结果表明:本方法的重构图像的峰值信噪比(PNSR)优于Park方法0.5dB,且有较低的计算复杂性,适用于任何基于DCT压缩的视频转码方案。关键词:DCT域; 任意下采样; 峰值信噪比; 转码中图分类号:TN919.8文献标识码:A文章编号:1000-436X(2007)07-0123-06Efficient method for DCT-domain image arbitrary downsampling DU Yao-gang1,CAI An-ni2(1. Foundation Department Beijing Institute of Electronic Science and Technology, Beijing 100070,China;2. School of Telecommnication Engineering, Beijing University of Posts & Telecommunications,Beijing 100876, China)Abstract: A novel approach to resize Images with m/n resizing ratio in the DCT domain,was proposed which expoits the relationship of DCT coefficients between input blocks and output blocks. Experimental results confirm that the scheme performs about 0.5dB better than Parks method in terms of PNSR of reconstructed image with a comparable computational speed.The proposed method can be used to any DCT-based compressed video transcoding applications.Key words: DCT domain; arbitrary down-sampling; peak signal to noise ratio; transcoding27第7期杜耀刚等:高效的DCT域图像任意比率下采样方法1251引言收稿日期:2006-05-25;修回日期:2007-03-30在许多多媒体应用中,人们常常希望同一视频内容能有不同空间分辨率的压缩版本,例如,希望相同的图像可以在不同带宽信道上,以不同的空间分辨率进行传输;又如浏览视频数据库时,希望可以先检索低分辨率图像,如果感兴趣,再浏览高分辨率的图像,等等。而从高分辨率的图像获得低分辨率的图像则需要进行下采样。压缩域上的空域下采样技术,与像素域下采样方法相比,可以有效地减少计算复杂性,同时可较好地保持原始图像的质量,因此越来越受到重视。基金项目:北京电子科技学院信息安全和保密重点实验室基金资助项目(YZDJ0502)Foundation Item: Beijing Electronic Science and Technology Institute Key Lab. of Information Security and Secret(YZDJ0502)压缩域的图像下采样一般在DCT域上进行,DCT域下采样一般通过截取高频分量进行,而DCT域上采样通过在高频分量添零来实现。典型的DCT域21下采样方法主要有(基本思想是将4个块变为一个88块):Merhav提出的抗混叠虑波器(又称为双线性滤波器)1、Dugad 等人提出的从每一个88块上截取44低频率子块的方法2以及提出的能较好保持高频能量的准卷积下采样技术3。目前,DCT域上实现任意比率的下采样方法通常有3种。第一,用DCT域卷积4,5,先进行上采样,再进行下采样;第二,合并个88的块,得到一个8m8m块,然后截取其8n8n的低频分量,最后再按照文献6将拆分为个88的块;第三,将的块变为88的块7。上述方法由于需要大维数矩阵乘法而变的很复杂。为此,提出了一种方法:直接找出输入个块与下采样输出的个块的DCT系数关系式。以3:2为例,从每一个2424的宏块中截取1616的低频分量,并将相应的各低频系数均乘以2/3,然后变为4个88的DCT系数矩阵,作为DCT域上的下采样结果,这种方法尽可能地保持了图像高频分量。同时我们利用下采样DCT系数矩阵的稀疏特性,给出了快速计算方法。实验结果表明:经上采样后,重构图像的峰值信噪比(PNSR)优于Park4的方法。2DCT域任意下采样定理设是一无理数,那么,一定存在无穷多个有理分数使得 (1)成立8。上式说明为实现任意比率的下采样,只需要实现整数比率的下采样即可。下面以3:2为例说明算法的基本思想(如图1所示)。图1DCT域上32下采样的一般框图将组成DCT域上任意一个2424块的每一个块进行88的逆DCT变换,得到像素域上的对应宏块;再对宏块进行2424的DCT变换,然后截取其的低频矩阵,并将该低频矩阵的各系数均乘以2/3,最后变为4个88的DCT系数矩阵,作为DCT域上的32下采样结果(如图2所示)。图2基于宏块的下采样方案给定图像数据,则它的MN DCT变换为X(k,l)= ,k=0, 1,M-1,l=0, 1,N-1 (2)其中式(2)可以用矩阵形式表达如下(3)其中CM、CM分别为MM和NN的DCT变换矩阵,T表示转置。将1616的DCT变换矩阵表示成(4)将的DCT变换矩阵表示成(5)用表示1624的低通滤波器,代表88的单位矩阵。则图1所示的32下采样方案对应的下采样算子可表示为(6)其中,代表88的DCT变换矩阵将4个88的DCT系数矩阵变为一个的DCT系数矩阵,有,令其等于下采样算子的运算结果,得到第7期杜耀刚等:高效的DCT域图像任意比率下采样方法23 (7)由式(7)可以从求出,但运算复杂。为此,提出另外的简便方法如下。为表示方便,下面将88的像素域块分成4个44的子块。用下标字母L、R、T、B分别表示左、右、顶及低部,例如:,等。首先,在DCT域上将个88的块Xij,i,j=1,2,3(见图2)用个1212的等效块Zij,i,j=1,2来替代,每一个1212的块Zij由4个相邻88的块经过适当的矩阵运算而得到;其次,仅保留每一个Zij的88低频分量Yij(8)(9)(10)(11)其中 (12)(13)即快速下采样变换系数矩阵。下面以求为例加以说明。在像素域上由相临4个块获得1个的块的过程分别由式(18)式(21)表示,在DCT域上从1个块截取低频分量的过程分别由式(22)表示。B11=(14)-0.8165-0.0000-0.0000-0.0000-0.0000-0.0000-0.0000-0.0000-0.4788-0.5382-0.0824-0.0329-0.0169-0.0095-0.0053-0.0024-0.2415-0.7756-0.2660-0.0787-0.0374-0.0204-0.0111-0.0050-0.0000-0.0000-0.8165-0.0000-0.0000-0.0000-0.0000-0.0000-0.1250-0.2045-0.3943-0.6264-0.1250-0.0556-0.0280-0.0121-0.1027-0.1587-0.2218-0.7224-0.2940-0.0932-0.0426-0.0178-0.0000-0.0000-0.0000-0.0000-0.8165-0.0000-0.0000-0.0000-0.0788-0.1163-0.1341-0.1818-0.3832-0.6290-0.1197-0.0411B12= (15)-0.4082-0.3699-0.0000-0.1299-0.0000-0.0868-0.0000-0.0736-0.4788-0.4008-0.0824-0.2257-0.0169-0.1153-0.0053-0.1074-0.2415-0.1108-0.2660-0.3053-0.0374-0.1109-0.0111-0.1130-0.0000-0.1697-0.4082-0.3230-0.0000-0.1439-0.0000-0.1134-0.1250-0.2859-0.3943-0.2107-0.1250-0.2222-0.0280-0.1097-0.1027-0.2062-0.2218-0.0040-0.2940-0.3031-0.0426-0.1165-0.0000-0.0305-0.0000-0.2095-0.4082-0.3136-0.0000-0.1532-0.0788-0.0958-0.1341-0.2894-0.3832-0.2051-0.1197-0.2244B13=(16)-0.4082-0.3699-0.0000-0.1299-0.0000-0.0868-0.0000-0.0736-0.4788-0.4008-0.0824-0.2257-0.0169-0.1153-0.0053-0.1074-0.2415-0.1108-0.2660-0.3053-0.0374-0.1109-0.0111-0.1130-0.0000-0.1697-0.4082-0.3230-0.0000-0.1439-0.0000-0.1134-0.1250-0.2859-0.3943-0.2107-0.1250-0.2222-0.0280-0.1097-0.1027-0.2062-0.2218-0.0040-0.2940-0.3031-0.0426-0.1165-0.0000-0.0305-0.0000-0.2095-0.4082-0.3136-0.0000-0.1532-0.0788-0.0958-0.1341-0.2894-0.3832-0.2051-0.1197-0.2244B14=(17)-0.8165-0.0000-0.0000-0.0000-0.0000-0.0000-0.0000-0.0000-0.4788-0.5382-0.0824-0.0329-0.0169-0.0095-0.0053-0.0024-0.2415-0.7756-0.2660-0.0787-0.0374-0.0204-0.0111-0.0050-0.0000-0.0000-0.8165-0.0000-0.0000-0.0000-0.0000-0.0000-0.1250-0.2045-0.3943-0.6264-0.1250-0.0556-0.0280-0.0121-0.1027-0.1587-0.2218-0.7224-0.2940-0.0932-0.0426-0.0178-0.0000-0.0000-0.0000-0.0000-0.8165-0.0000-0.0000-0.0000-0.0788-0.1163-0.1341-0.1818-0.3832-0.6290-0.1197-0.0411 (18) (19) (20) (21) (22)3算法复杂性分析假设用式子cM+aA表示计算中需要c次乘法和a次加法。下面对用卷积方法4、块拆分方法6及我们提出的准卷积方法计算式(12)、式(17)式(22)的计算量给予比较。方法1 用DCT域卷积4方法,先进行上采样,再进行下采样。即先将个块的每一个块上采样为个的块;然后再将个的块变为个的块。当时,平均每个像素需要5.675M+6.67A。方法2 块拆分方法6,合并个的块,得到一个块,然后截取其的低频分量,最后再按照6拆分为个的块。以为例,用快速行列方法9 ,首先计算个88的IDCT,需要12829M+298 29A=1728M+4176A;再计算出一个2424的DCT,需要3456M+3168A;第三,再计算出1个1616的IDCT,需要32162M+81162A= 1024M+2592A;最后,计算出 4个的DCT,需要12824M+29824A=768M+1856A;总共需要6720M+11144A。平均每个像素需要11.67M+19.347A。方法3 用提出的准卷积算法,将的块变为的块,即利用式(12)、式(17)、式(22)计算。以为例,则计算式(12)、式(17)、式(22)需要:6907M+6464A。即便是充分利用了共享信息,但比方法一的慢了一些,究其原因:一是没有和的快速DCT变换;二是在式14式17中,矩阵的稀疏特性不够好。但比方法4的速度快。方法4 将像素域上个块变为个88的块12。以为例,首先计算个88IDCT;其次,将相临像素平均或直接抽取4个88的像素块;最后计算出 4个88的DCT。平均每个像素需要13.25M+15.719A4种算法的运算量如表1所示。表1 进行DCT域下采样时,每个像素需要的平均乘法和加法数目方 案乘 法加 法方法105.67506.670方法211.67019.347准卷积法11.99011.220方法413.25015.7194实验结果对于给定的下采样方法,通常采用峰值信噪比(最大像素值的平方与MSE之比)来评价该下采样图像的质量,其中MSE为经过上采样恢复的图像与原始图像x之间的均方误差。在仿真实验中,分别用卷积方法4、Mehta6及我们提出的方法,对4个原始视频图像进行32的下采样,其实验结果见表2和图3。实验的硬件执行环境见表3。表2 用3种方法对4个原始图像进行3:2的下采样性能比较视频分辨率帧速率比特率帧数本方法文献4方法文献6方法PNSR时间PNSR时间PNSR时间susimobltensflwr70448070448070448070448029frame/s29frame/s29frame/s29frame/s4Mbit/s4Mbit/s4Mbit/s4Mbit/s1212121237.2dB24.9dB29.2dB28.1dB17721418322436.7dB24.4dB28.6dB27.6dB15620816020135.8dB23.9dB27.1dB27.2dB161227172215*时间:每帧平均处理时间,单位ms 表3进行下采样运算的软硬件执行环境硬件软件视频名内存128MBSDRAM硬盘ATA-667200 RPM操作系统Windows 2000Professional编程环境VisualC+ 6.0Susi,moblTens,flwr从表2可以看出,本文方法与文献4比较接近,但由于本文方法比较好地保持了图像的高频分量,因此比文献4的PSNR平均高0.5dB。这两种方法均比文献6明显要好一些。从图3不难看出,图3(b)较图3(a)的视觉效果要好一些。(a)文献4方法(b)本文方法图3 视频mobl.mpg的下采样结果5结束语压缩域上的视频转码技术越来越受到重视。本文提出了一种基于DCT域的帧图任意比率下采样方法。在视频转码中,如果再使用DCT域快速运动补偿算法1,10或整数DCT快速算法11,则视频转码的速度会更快一些,本文提出的下采样方法适用于任何基于DCT压缩的视频转码方案。参考文献:1MERHAV N,BHASKARAN V.Fast algorithms for DCT-domain image down-sampling and for inverse motion compensationJ. IEEE Transon CSVT, 1997,7(3): 468-476.2DUGAD R, AHUJA N.A fast scheme for image size chan

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论