




已阅读5页,还剩5页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
河南理工大学计算机科学与技术学院多媒体技术论文2010 2011学年第一学期学生姓名 张 坤 学 号 31079010426 专业班级 计算机07-4班 2010 年 10 月 25 日目录0 引言11 JPEG图像压缩算法21.1 JPEG标准的工作模式21.2 JPEG顺序型编码21.2.1 颜色模式转换及采样31.2.2 正向离散余弦变换(FDCT)31.2.3 量化51.2.4 Z字型编码61.2.5 直流系数的编码61.2.6 交流系数的编码71.2.7 熵编码71.2.8 组成位数据流72 JPEG算法的改进讨论83 参考文献8JPEG压缩算法及其改进的研究摘要介绍了基于DCT静态图像压缩编码标准产生的背景、算法以及所涉及的重要概念和关键技术。并进一步提出了基于小波变换对JPEG算法的改进。关键词图像压缩;JPEG算法; 小波变换AbstractThis paper introduces the background, algorithms and some involved important concepts and key techniques of the DCT based still image compression coding standard. And a method based on wavelet transform is proposed to improve the JPEG arithmetic.Key words image compresses; JPEG algorithm; wavelet transforms0 引言JPEG 是一种通用的静止图像的压缩标准。这种标准适用于所有连续色调、多级灰度、静止图像的压缩和编码。它是色彩、灰度、静止图像的第一个国际标准,是一个适用范围广泛的通用标准。它不仅适用于静止图像的压缩,也适用于电视图像序列的帧内压缩。由于图像信息的数据量十分庞大,给视频信号存储及传输带来了很大的困难,对视频图像信号的压缩显得及其重要。压缩就是对要处理的图像源数据用一定的规则进行变换和组合,从而达到以尽可能少的代码来表示尽可能多的数据信息的目的。有关图像压缩编码的国际标准很多, JPEG是目前静态图像中压缩比最高图像质量最好的,因此获得了最广泛的应用。本文探讨了JEPG压缩算法的重要概念和关键技术,以及在低比特率压缩时容易产生方块效应的原因,并提出了一种基于小波变换的改进方法。1 JPEG图像压缩算法1.1 JPEG标准的工作模式传统的JPEG算法通常具有以下4种工作模式:一是顺序编码模式,每一图像分量从左到右,从上到下扫描,一次扫描完成编码。二是累进编码,图像编码在多次扫描中完成。接收端收到的图像是经多次扫描由粗糙到清晰的累进过程。三是无失真编码,能保证解码后精确地恢复原图像的采样值,压缩比低于有失真编码。四是分层编码,图像在多个空间分辨率中进行编码。在信道传送速率低,接收端显示器分辨率也不高的情况下,只需要做低分辨率的图像解码。1.2 JPEG顺序型编码在JPEG应用中,最常用的工作模式是基于DCT变换的顺序型模式,又称为基线系统。基于离散余弦变化(DCT)的编码方法,是JPEG算法的核心内容。基于JPEG编码器和解码器结构见图1.1。重构图像数据源图像数据FDCT量化器熵编码量化步长表熵编码表压缩图像数据压缩图像数据熵编码逆量化码IDCT表格规范表格规范图1.1 JPEG编码器和解码器结构图1.2.1 颜色模式转换及采样第一步是预备数据块在编码器的输入端,将原始图像分为88的像素块(见图1.2),用从左到右、从上到下的光栅扫描进行排序。在进行处理时,对每一块分别进行处理。所以图像的变换、量化和熵编码等所有的处理过程都是以图像块为单位。采用88的像素块原因主要是像素之间的关系研究表明一系列相似像素通常持续1520个pixel之后像素相关性通常会开始下降,用图像块为单位不仅可以明显降低对存储器的要求,而且也便于抽取图像中的部分图像。缺点就是图像质量有所下降,在低比特率压缩时容易产生方块效应。所以在新一代算法JPEG2000中使用一种基于小波变换的改进算法,成功地解决了这一问题。JPEG可压缩灰度和彩色图像,但该标准并不提供表示彩色图像的初始格式。如彩色图像的表示可用RGB三原色、YUV(欧洲PAL电视中采用的色彩)或YIQ(北美NTSC电视中采用的色彩)。用三原色表示的这些图像也可以相互转换,如YCbCr就是JPEG的缺省色彩系,它是从YUV色彩系统中衍生出来的。将U和V做少许调整就得到Cb和Cr,YCbCr与RGB的转换关系为:Y0.299 0R0.587 0G0.114 0B (1-1)RY1.402 00(Cr128) (1-2)Cb0.168 7R0.331 3G0.500 0B128 (1-3)GY0.344 14(Cb128)0.714 14(Cr128) (1-4)Cr0.500 0R0.418 7G0.081 3B128 (1-5)BY1.772 00(Cb128) (1-6)图像的各数字化分量可以进行二次采样如亮度分量Y与色度分量U、V等三分量,每一分量为一系列88像素块。图1.2 将图像分为一系列88像素块1.2.2 正向离散余弦变换(FDCT)离散余弦变换是在傅立叶级数展开中,如果被展开的函数是实偶数函数,那么其傅立叶级数中只包括余弦项,再将其离散化可导出离散余弦变换。离散余弦变换是数字图像处理中空间域转换到变换域的常用方法,特别是在图像压缩领域,它不用像傅立叶变换那样参数都是复数,所以在数据描述上减少了处理运算量。但是其功能与傅立叶变换相同的。当信号变换到频率域时,能量集聚在小的空间频率内。信号往往只含有少量的频率成分,所以DCT允许在频率域中只用几个数据点就可以表示信号,而在时间域中用大量数据点来表示信号。二维DCT正变换的公式如下(采用88的块): (1-7)DCT逆变换采用下面的公式: (1-8)上面两式中,当u,v=0; (1-9),其他。 (1-10)经DCT变换之后,是直流系数,其他为交流系数。二维的离散余弦变换具有可分离特性,所以二维变换可分解为一系列的一维变换。(行,列)计算公式如下: (1-11) (1-12)二维变换可分解为一系列的一维变换,见图1.3。垂直方向的81DCT变换水平方向的81DCT变换图1.3二维DCT变换分解为一维的DCT变换在实际编程中,DCT的一个重要性质就是,它能够直接从FFT(快速傅立叶变换)算法中求得。 (1-13)u=0,1,(8-1)其中,归一化加权系数当u=0时,当u1,2,81时;为一维余弦变换,为一维像素函数,Re.代表实部,对列或行求和的项就离散傅立叶变换。输出的矩阵F(u,v)表示的是频率域。在矩阵的64个系数中处于第0行0列的那个系数明显比其他63个系数大很多,把它称为DC。它表示了88输入矩阵全部值的平均数,其余63个系数称为AC系数。AC系数的值随着它与DC系数的距离增大而越来越小。所以DCT变换实际就是空间域的低通滤波器,它把低频分量都集中在左上角,高频分量分布在右下角。由于低频分量包含了图像的主要信息,而高频与之相比就不那么重要了。所高频分量部分可以忽略以减少了数据量,从而达到压缩的目的。但是,图像会损失一些信息,只不过当压缩一定比例时人眼很难察觉到。1.2.3 量化量化是对经过FDCT变换以后的频率系数进行量化。量化的目的是减小非零系数的幅度以及增加零值系数的数目。量化是图像质量下降的最主要原因。对于有损压缩算法,JPEG算法使用如图1.4所示的均匀量化器进行量化,量化步距是按照系数所在的位置和每种颜色分量的色调值来确定。因为人眼对亮度信号比对色差信号更敏感,因此使用了两种量化表:亮度量化值和色差量化值。此外,由于人眼对低频分量的图像比对高频分量的图像更敏感,因此图中的左上角的量化步距要比右下角的量化步距小。DCT系数输入量化系数输出图1.4 均匀量化器1.2.4 Z字型编码量化后的DCT系数要重新编排,目的是为了增加连续的“0”系数的个数,就是“0”的游程长度,方法就是按照Z字型的式样编排,如图1.5所示。DCT系数的序号如表1.1所示,这样就把这一个88的矩阵变成一个164的矢量,频率较低的系数放在矢量的顶部。DC值AC系数开始AC系数结束图1.5 量化DCT系数的编排表1.1 量化DCT系数的序号01561415272824713162629423812172530414391118243140445310192332394552542022333846515560213437475056596135364849575862631.2.5 直流系数的编码88图像块经过DCT变换之后得到的DC直流系数有两个特点:一是系数的数值比较大,二是相邻88图像块的DC系数值变化不大。根据这个特点,JPEG算法使用了差分脉冲调制编码(DPCM)技术,对相邻图像块之间量化DC系数的差值(Delta)进行编码, (1-14)1.2.6 交流系数的编码量化AC系数的特点是164矢量中包含有许多“0”系数,并且许多“0”是连续的,因此使用非常简单和直观的游程长度编码(RLE)对它们进行编码。JPEG使用了1个字节的高4位来表示连续“0”的个数,而使用它的低4位来表示编码下一个非“0”系数所需要的位数,跟在它后面的是量化AC系数的数值。1.2.7 熵编码使用熵编码号可以对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩。在JPEG有损压缩算法中,使用霍夫曼编码器来减少熵。使用霍夫曼编码器的理由是可以使用很简单的查表方法进行编码。压缩数据符号时,霍夫曼编码器对出现频度比较高的符号分配比较短的代码,而对出现频度较低的符号分配比较长的代码。这种可变长度的霍夫曼表可以事先进行定义。1.2.8 组成位数据流JPEG编码的最后一个步骤是把各种标记代码和编码后的图像数据组成一帧一帧的数据,这样做的目的是为了便于传输、存储和译码器进行译码,这样组织的数据通常称为JPEG数据流2 JPEG算法的改进讨论尽管基于分块DCT变换编码的JPEG图像压缩技术已得到了广泛的应用,然而在低比特率压缩时,这种编码的一个主要缺点是产生方块效应,严重影响解码图像的视觉效果。其主要原因是低比特率压缩的粗量化过程在各个方块内引入高频量化误差,各子块独立编码而没有考虑块间的相关性,从而造成块边缘的不连续性。此外,由于舍去了图像的高频信息,因而编码图像的边缘难以很好地保持,特别是图像中有文字的地方,这样的失真显得很明显。目前去除方块效应的方法主要有两类:第一类是在编码部分采用重叠分块的方案,但这会提高图像传输的比特率,加重编解码的负担;第二类是后处理技术,即对解码图像进行图像增强或图像恢复处理。现有的后处理方法主要包括各种结合边缘检测和增强的空间滤波算法,如基于凸集投影的迭代算法、约束最小平方算法(CLS)和图像最大后验概率(MAP)估计等。但各种图像估计的迭代算法则有计算量过大的缺点。初步研究表明,基于小波变换的低比特率压缩图像的后处理技术能有效地减少方块效应和保留图像的重要边缘,并且具有计算复杂性较小的优点。图像小波变换具有多分辨率的特性和时频局部化特性,它在兼顾图像噪声平滑和图像边缘检测方面表现出良好的性能,因此十分适合解决JPEG压缩图像的去方块化问题。实验表
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年辽宁普通高中学业水平选择性考试化学试题【含答案】
- 向量基底变换题目及答案
- 物业保安经理试题及答案
- 2024译林版八年级英语上册Unit 2 School life 校园生活(话题阅读)含答案
- 2025年中小学教师心理健康网络知识竞赛试题库及答案(共80题)
- 2025年3月动物性食品检验模拟考试题(附答案)
- 物料泄露试题及答案
- 营销业务知识培训课件
- 2025公司借款合同纠纷起诉状
- 2025设备租赁合同解除协议
- 争当排头兵心得体会争当排头兵
- 儿内科临床常见操作技术规范2023版
- 外墙翻新安全施工方案
- 机械产品检测与质量控制
- 冲压自动化生产线技术协议
- 小学教育教学工作计划范文(5篇)
- 汽轮机汽封系统
- 语言学纲要(全套课件354P)
- 复变函数与积分变换教案
- 湖北厂房施工进度计划网络图和横道图
- GB/T 7424.2-2008光缆总规范第2部分:光缆基本试验方法
评论
0/150
提交评论