版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
6.1图像压缩与编码基本概念6.2行程编码6.3哈夫曼编码6.4香农-范诺编码6.5算术编码6.6变换编码6.7静止图像压缩编码标准-JPEG6.8运动图像压缩编码标准-MPEG第六章图像编码图像标准的制定:ISO和CCITT(国际电报电话咨询委员会)联合制定静止图像:JPEG(JointPhotographicExpertGroup,联合图像专家组)通常为有损压缩(采用DCT变换编码),JPEG是目前静态图像压缩比最高的,但失真的程度非常小也支持无损压缩(采用预测编码),但压缩比降低(无损压缩的压缩比总有个极限)运动图像:MPEG(MovingPictureExpertGroup,运动图像专家组)6.7
静止图像压缩编码标准-JPEG
JPEG标准简述
JPEG压缩流程及实现
JPEG2000压缩算法
JPEG文件格式6.7静止图像压缩编码标准-JPEG6.7.1JPEG标准简述由ISO/IEC与CCITT联合发起的联合图像专家组,在过去十几年图像编码研究成果的基础上于20世纪90年代初制定了静止图像(包括8bit/像素的灰度图像与24bit/像素的彩色图像)的编码标准。JPEG标准在较低的计算复杂度下,能提供较高的压缩比与保真度。在视觉效果不受到严重损失的前提下,算法可以达到15到20的压缩比。如果在图像质量上稍微牺牲一点的话,可以达到40:1或更高的压缩比。
JPEG定义了一个基本系统,一个符合JPEG标准的编解码器至少要满足基本系统的技术指标。JPEG基本系统其核心属于变换编码。JPFG编码时,对原始图像的每一个分量首先分割成互不重叠的8×8像素块,然后对每个像素块的编码过程可分为二维DCT变换。根据图像信号的特点,对图像块进行二维DCT变换可以消除像素间的相关性。自然图像的像素块经DCT变换后,图像信号的能量主要集中到块的左上角,即图像的低频成分中。DCT变换后得到的系数矩阵中包括左上角的一个直流(DC)系数与63个交流(AC)系数,从左到右.水平频率增高,从上到下坚直频率增高。JPEG编码的总体框架输入图像图像被分割成8*8小方块DCT变换标量量化和DC系数预测熵编码基于块编码码流之字形扫描,游程编码6.7.2JPEG压缩流程颜色空间转换人眼对亮度更敏感,提取亮度特征,将RGB转换为YCbCr模型,编码时对亮度采用特殊编码。熵编码源图像正向变换量化压缩图像数据分块空间转换色彩模型(回顾!!)颜色的描述是通过建立色彩模型来实现的,不同的色彩模型对应于不同的处理目的CIE(国际照明委员会)在进行大量的色彩测试实验的基础上提出了一系列的颜色模型:RGB模型:红(R)、绿(G)、蓝(B)三基色混合HSI模型:色度(H)、饱和度(S)、亮度(I)YUV模型:亮度(Y)、色度(UV)YCbCr模型:亮度(Y)、色度(CbCr)各种不同的颜色模型之间可以通过数学方法转换YUV模型在这种色彩模型中:Y表示亮度,UV表示色度目的是为了可以与黑白电视兼容。电视信号在发射时,转换成YUV形式,接收时再还原成RGB三基色信号,由显像管显示。YUV模型Y,U,VYYY,0,0彩色电视信号黑白电视信号黑白电视机彩色电视机YCbCr模型目的:用于彩色图像压缩时的一种色彩模型,Y代表度,Cb、Cr代表色度与YUV模型不同的是它充分考虑了色彩组成时RGB三色的重要因素。YUV考虑的是简单,YCbCr考虑的是压缩时可以充分取出冗余量YCbCr与RGB的转换RGB到YCbCr的转换YCbCr到RGB的转换R=Y+1.40200(Cr–128)G=Y–0.34414(Cb–128)–0.71414(Cr–128)B=Y+1.77200(Cb–128)Y=0.299R+0.5870G+0.1140BCb=–0.1787R–0.3313G+0.5000B+128Cr=0.5000R–0.4187G–0.0813B+128数据分块
构造子图像 子图像尺寸:8x8熵编码源图像正向变换量化压缩图像数据分块空间转换基于频域变换的图像编码基于DCT的图像压缩(JPEG)DCT变换:一类正交变换正交变换特性可逆熵保持(信息不丢失)去相关
变换系数线性无关(设计目的)能量集中
大部分能量集中到少数变换系数熵编码源图像正向变换量化压缩图像数据分块空间转换基于DCT的图像压缩DCT的基函数生成每个变换系数所用的各点权重不同的系数与不同的空域频率共振第一个系数:DC整个块的平均值熵编码源图像正向变换量化压缩图像数据分块空间转换基于DCT的图像压缩变换前像素值52556166706164736359669010985697262596811314410466736358711221541067069676168104126886870796560707768587585716459556165838779696865767894熵编码源图像正向变换量化压缩图像数据分块空间转换基于DCT的图像压缩(变换前的操作)对于灰度级是2n的像素,通过减去2n-1,替换像素本身对于n=8,即将0~255的值域,通过减去128,转换为值域在-128~127之间的值目的:使像素的绝对值出现3位10进制的概率大大减少熵编码源图像正向变换量化压缩图像数据分块空间转换基于DCT的图像压缩变换后系数-415-29-622555-20-137-21-62911-7-66-46877-25-30107-5-501335-15-960311-8-13-2-11-41-1013-3-102-1-4-12-12-31-2-1-1-1-2-1-10-1熵编码源图像正向变换量化压缩图像数据分块空间转换基于DCT的图像压缩量化对DCT变换后的系数进行量化系数除以量化步长再取整不可逆信息丢失
依据心理视觉特性量化丢失难以看见的信息保留容易看见的信息如果量化台阶小于人眼在该频率的灵敏度,则量化噪声无法被看见[-415/16]=-26-26*16=-416熵编码源图像正向变换量化压缩图像数据分块空间转换基于DCT的图像压缩量化JPEG建议的亮度分量量化值熵编码源图像正向变换量化压缩图像数据分块空间转换161110162440516112121419265860551413162440576956141722295187806218223756681091037724355564811041139249647887103121120101729295981121001039917182447999999991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999熵编码源图像正向变换量化压缩图像数据分块空间转换基于DCT的图像压缩量化JPEG建议的色度分量量化值基于DCT的图像压缩量化后的系数-26-3-6220001-2-400000-315-1-1000-412-1000010000000000000000000000000000000
熵编码源图像正向变换量化压缩图像数据分块空间转换基于DCT的图像压缩DC系数(直流系数)先做预测编码,再做熵编码用前一块的DC系数预测本块的DC系数相邻的8×8子块之间的DC系数有强的相关性,JPEG对DC系数采用DPCM编码(差分脉冲编码),即对相邻块之间的DC系数的差值DIFF=DCi-DCi-1编码。(预测编码)熵编码源图像正向变换量化压缩图像数据分块空间转换预测编码DCj-2DCj-1DCjDCj+1DCj+2基于DCT的图像压缩DC系数(直流系数)先做预测编码,再做熵编码对差分值做霍夫曼编码,采用“前缀码(SSSS)+尾码”表示。
前缀码:用来指明尾码的有效位数B,可以根据差分值从表1查出前缀码对应的的霍夫曼编码。
尾码:差分值大于等于0,尾码的码字为差分值的B位原码;否则,为差分值的B位反码。熵编码源图像正向变换量化压缩图像数据分块空间转换表1:DC系数差分值霍夫曼转换表SSSSDC系数差值亮度码字色度码字01234560-1,1-3,-2,2,3-7~-4,4~7-15~-8,8~15-31~-16,16~31-63~-17,17~63000100111001011101110000110110111011110111110基于DCT的图像压缩AC系数(交流系数)先做行程编码,再做熵编码由于低频分量多呈圆环形辐射状向高频率衰减,因此可看成按Z字形衰减,如下图所示。因此,AC系数按Z字形扫描读数。熵编码源图像正向变换量化压缩图像数据分块空间转换Z字形扫描AC0DCAC0AC7AC7对这63个AC系数采用行程编码,行程编码采用两个字节表示。JPEG使用1字节的高4位表示连续“0”的个数,而使用它的低四位来表示下一个非“0”系数所需要的位数,跟在它后面的是量化AC系数的数值。AC系数的行程编码如下图所示:NNNNSSSS两个非零值间连续零个数表示下一个非零值需要的比特数第一个字节下一个字节(RunLength)(Size)下一个非零值的实际值熵编码源图像正向变换量化压缩图像数据分块空间转换最后将每个组合以“[NNNN/SSSS]+尾码”表。其中NNNN为0的行程的长度,SSSS表示尾码的有效位数B,即当前非零系数所占的比特数。尾码:系数值大于等于0,尾码的码字为系数值的B位原码;否则,为系数值的绝对值的B位反码。熵编码源图像正向变换量化压缩图像数据分块空间转换表3:亮度AC系数的霍夫曼编码表NNNN/SSSS亮度AC系数色度AC系数码长码字码长码字0/0(EOB)0/10/20/30/40/50/60/70/80/90/A4223457810161610100001100101111010111100011111000111111011011111111100000101111111110000011223455679101200011001010110001100111100011110001111101001111110110111111110100例:给出Lena测试图像(分辨率256×256)从72×72开始的一个8×8块,它的前一个块的量化DC系数为17,这个块取值如下:
9892958075826850 9491947974816749 9589927772796547 9387907570776445 9185887368756143 8983867166735941 8781846964715739 8579826763695537
说明JPEG编解码过程。解:(1)使输入图像取值范围为-27~27-1,每个像素减128,进行DCT变换输出为:591106-1828-3414183350000000-1000000030000000-1000000000000000-1000000000000000解:(2)亮度量化矩阵进行量化,量化器输出为:3710-22-100030000000000000000000000000000000000000000000000000000000(3)对量化结果按照规定进行Z形扫描,对其中一个DC及无个非零AC系数进行编码。(4)求DC系数的编码。Z形扫描的第一个系数是DC系数。假设前一亮度数据块DC系数为17,则差分值为20(37-17),查表1得,SSSS为3,其前缀码字为“110”,尾码即为20的5位二进制原码“10100”,从而DC系数的编码为“11010100”表1:DC系数差分值霍夫曼转换表SSSSDC系数差值亮度码字色度码字01234560-1,1-3,-2,2,3-7~-4,4~7-15~-8,8~15-31~-16,16~31-63~-17,17~63000100111001011101110000110110111011110111110(5)求AC系数编码①第一个非零AC系数为10,该系数之前的0的连续个数为0,即NNNN=0,根据系数10,查表2得,SSSS=4,因此,NNNN/SSSS=0/4,查表3的霍夫曼编码为“1011”,加上10的二进制编码为“1010”,因此,AC系数10的编码为“10111010”表2:AC系数的霍夫曼尾码位数表SSSSAC系数的幅度SSSSAC系数的幅度0123450-1,1-3,-2,2,3-7~-4,4~7-15~-8,8~15-31~-16,16~31678910-63~-17,17~63-127~-64,64~127-255~-128,128~255-511~-256,256~511-1023~-512,512~1023表3:亮度AC系数的霍夫曼编码表NNNN/SSSS亮度AC系数色度AC系数码长码字码长码字0/0(EOB)0/10/20/30/40/50/60/70/80/90/A4223457810161610100001100101111010111100011111000111111011011111111100000101111111110000011223455679101200011001010110001100111100011110001111101001111110110111111110100②同理可以得到:
第2个非零AC系数3的编码为“0111”第3个非零AC系数-2的编码为“11111001001”第4个非零AC系数2的编码为“0110”第5个非零AC系数-1的编码为“11110100”结束块“EOB(0/0)的编码为”1010”
8×8子块的编码为:1101010010111010011111111001010110111101001010压缩比???基于DCT的图像压缩使用的技术颜色空间:通常用YUV颜色分量亚采样:通常用4:2:0即使不用亚采样,YUV空间也比RGB空间容易压缩使用高级压缩技术,颜色分量亚采样用处不大频域变换:DCT基于心理视觉的量化系数设置(量化矩阵)预测编码(DC系数)Zig-zag和游程编码(AC系数)熵编码(霍夫曼或算术编码)基于DCT的图像压缩优点实现较简单对自然图像压缩率不错缺点块效应由于每8x8块独立处理,块的边界上很容易出现前后块差异较大的情况人眼对边缘敏感……不能实现无损压缩例:图像块经过DCT变换,并且通过量化矩阵量化后的输出如下,进行JPEG编码。6457000000450231000000000000-300000000-160000000000000000000000000000000表AC系数的尾码位数表SSSSAC系数的尾码位数表001-1,12-3,-2,2,33-7~-4,4~74-15~-8,8~155-31~-16,16~316-63~-17,17~637-127~-64,64~1278-255~-128,128~2559-511~256,256~51110-1023~-512,512~1023表亮度AC系数码表
续表续表64;(0,57);(0,45);(4,23);(1,-30);(0,-16);(2,1);EOB(7),100000;(0,6),111001;(0,6),101101;(4,5),10111;(1,5),00001;(0,4),0111;(2,1),1;(0,0)10000011110001110011111000101101111111111111110011000101111111111011000001101101111101111010JPEG实现压缩的关键点1)在图像的色调连续性较好的前提下,通过对图像数据中的色度和饱和度进行一定比例的抽样,从而达到消除“视觉冗余”、压缩数据量的目的。2)通过DCT变换,将图像信息从空间域变换到频域,消除了图像数据之间的相关性,亦即消除了“空间冗余”,并利用其信息收集能力,将信息集中到少数系数上面,并为后续压缩步骤建立基础。3)将频域系数进行一定程度的量化,从而忽略更多的不重要的图像高频成分,以及忽略更多的不重要的色度和饱和度分量,以进一步消除“视觉冗余”,精简图像数据。4)采用高效的变长编码方法:霍夫曼编码。根据符号出现的概率对符号进行变长编码,从而有效消除原始图像数据中的“编码冗余”,很大程度上减少了数据总量。小波分析方法最早是1910年Harr提出的小“波”规范正交基的概念。到80年代,Stromberg证明了小波函数的存在性,1984年法国地球物理学家Morlet在分析地震波的局部性质时,发现传统的付立叶(Fourier)变换难以达到要求,因而引入小波概念于信号分析中。1987年,Mallat将计算机视觉领域内的多尺度分析的思路引入到小波分析中,小波函数的构造以及信号按小波变换的分解与重构,其相应的算法(称为Mallat算法)有效地应用于图像分析与重构。6.7.3基于小波变换的图像压缩(JPEG2000)小波变换(wavelettransformation)基于小波变换的图像压缩(JPEG2000)小波变换(wavelettransformation)用一对滤波器对图像进行滤波,把图像分解成不同的频带滤波器对:低通滤波器+高通滤波器基于小波变换的图像压缩(JPEG2000)小波变换(wavelettransformation)基于小波变换的图像压缩(JPEG2000)二者均在约43:1的压缩率时JPEGJPEG2000基于小波变换的图像压缩(JPEG2000)优点无块效应整个图像统一处理,不存在块边界可实现无损压缩同等质量下压缩率高缺点运算复杂计算量大,存储开销大6.7.4JPEG文件格式
在制定JPEG标准时,已经定义了许多标记用来区分和识别图像数据及相关信息。目前,使用广泛的是JFIF(JPEG文件交换格式——JPEGFileInterchangeFormat)1.02版。JPEG文件中的字节格式是按照正序排列的,即存放时高位字节在前,低位字节在
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年四川铁道职业学院单招职业倾向性考试题库及答案详解(新)
- 2026年天门职业学院单招职业适应性考试题库含答案详解(典型题)
- 2026年宁德师范学院单招职业倾向性考试题库含答案详解(突破训练)
- 2026年宁夏财经职业技术学院单招职业倾向性测试题库附答案详解(夺分金卷)
- 2026年塔里木职业技术学院单招职业适应性考试题库带答案详解(达标题)
- 2026年娄底职业技术学院单招职业技能考试题库带答案详解(基础题)
- 2026年天津职业技术师范大学单招综合素质考试题库附答案详解(能力提升)
- 2026年塔里木职业技术学院单招职业适应性考试题库含答案详解(突破训练)
- 2026年天津医学高等专科学校单招职业倾向性考试题库附答案详解(培优a卷)
- 2026年天津滨海职业学院单招职业倾向性测试题库及答案详解(真题汇编)
- 旋挖钻孔灌注桩全护筒跟进施工工艺主要施工方法及技术措施
- 大桥连续刚构桥实施性施工组织设计
- 《当前保密工作面临的新形势、新任务》课件
- 食品微生物学基础课程标准(一)
- 国家职业技术技能标准 6-11-01-04 制冷工 人社厅发2018145号
- 承插型盘扣式钢管脚手架安全技术标准JGJT231-2021规范解读
- 2025年齐齐哈尔市高三语文3月一模考试卷附答案解析
- 环卫清扫保洁服务方案投标文件(技术方案)
- 生命教育与心理健康教育的融合路径研究
- 新概念英语第一册随堂练习-Lesson127~128(有答案)
- 2024-年全国医学博士外语统一入学考试英语试题
评论
0/150
提交评论