第6讲-静止图像编码.ppt_第1页
第6讲-静止图像编码.ppt_第2页
第6讲-静止图像编码.ppt_第3页
第6讲-静止图像编码.ppt_第4页
第6讲-静止图像编码.ppt_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、静止图像的编码,静止图像的采样与量化 图像压缩分类 变换域编码 DCT变换 JPEG标准 JPEG2000标准,静止图像的采样与量化,静止图像采样,空间轴上二维伸展,时间轴上一点。 图像的色彩由人眼决定,三元色RGB。 图像的数字化 在二维平面上,将图像划分为一个个很小的方块,每个方块内近似具有同样的色彩。这样的方块称为像素。 实际应用中,像素数决定于图像输出设备的分辨率。若分辨率较低,则每个像素对应的方块较大,就能明显看到块的结构,如大屏幕电视。,静止图像采样,量化,如果图像的细节很精致(如电视台专用的测试信号),则像素分割仍无法体现细节。类似时域的奈奎斯特采样定理。 每个像素有对应的色彩,

2、有不同的色彩分量。直接的色彩空间是RGB,每个分量采用8bit量化,一共可以表示 种色彩,基本上可以接近原始的真实色彩。 人眼实际上对亮度信号更敏感,因此可以将色彩空间进行变换,得到YUV分量,每个分量依旧采用8bit量化。,电视信号测试图,图像压缩分类,图像为什么可以压缩?,熵冗余 像素间具有相关性 不同的符号具有不同的概率 视觉冗余 不是所有的细节都可见 不是所有的细节都需要看到 人眼的视觉特性,比如对亮度比色度敏感,对黄、绿等颜色更敏感等等。,图像压缩的分类,对于一些特定要求的图像,如地图、遥感或航拍的图像,医疗图片,警用图片等,对细节要求很高,而且一旦出现失真,影响极大,此时一般用无损

3、压缩。 对于娱乐用图片,如照片,广告,文字等,人们关心的重点是整体的视觉效果,因此可以使用有损压缩,以获得更好的压缩比。,有损编码与无损编码,无损编码(压缩比1.5-3) 无失真 完全可复原 不利用人的视觉特性 有损编码(压缩比10-200) 有失真 可复原 利用了人的视觉特性,无损编码,游程编码,一般采用熵编码,包括Huffman编码,香农编码,LZW编码,算数编码,游程编码等。 游程编码适用于二值图像,或者有大片同色部分的图像。典型应用是传真的图像。 在二值图像中,一定是0,1交替出现,因此,如果假设每行都从0开始,则编码时只需记录连续像素的个数,而不必记录像素的颜色。 比如像素为0001

4、01110010001,游程编码后为31132131,然后可以对多元序列进行Huffman编码。,香农编码(一),根据香农定理,对二进制码,码字长度满足下面公式,其中ti为该码字长度,Pi为该符号出现的概率 香农编码步骤 将信息符号按出现的概率由大到小顺序排列 按上面公式计算各概率对应的码字长度ti 计算各概率对应的累加概率ai a1 = 0, a2 = P2, a3 = P2+P1, a4 = P3+P2+P1, 将累加概率转换为2进制小数,取前ti位,即为香农编码的结果,香农编码(二),举例 Y1概率0.40 t1=2 a1=0 00 Y2概率0.18 t1=3 a1=0.4 011 Y3

5、概率0.10 t1=4 a1=0.58 1001 Y4概率0.10 t1=4 a1=0.68 1010 Y5概率0.07 t1=4 a1=0.78 1100 Y6概率0.06 t1=5 a1=0.85 11011 Y7概率0.05 t1=5 a1=0.91 11101 Y8概率0.04 t1=5 a1=0.96 11110,算数编码(一),20世纪60年代由Elias提出,是信息保持型编码,无须为一个符号设定一个码字。 举例说明 信源4个符号,a-1/2, b-1/4,c-1/8,d-1/8.要对aabc进行编码 利用单位长度的矩形来表示,指针起点为0,宽度为1。 第一个符号是a,指针指向0+

6、1(宽度)*0.011(a的起始位置)=0.011,宽度变为1(宽度)*0.1(a的宽度)=0.1,算数编码(二),第二个符号是a,指针指向0.011+0.1(宽度)*0.011(a的起始位置)=0.1001,宽度变为0.1(宽度)*0.1(a的宽度)=0.01 第三个符号是b,指针指向0.1001+0.01(宽度)*0.001(b的起始位置)=0.10011,宽度变为0.01(宽度)*0.01(b的宽度)=0.0001 第四个符号是c,指针指向0.10011+0.0001(宽度)*0.111(c的起始位置)=0.1010011,宽度变为0.0001(宽度)*0.001(c的宽度)=0.000

7、0001,算数编码(三),解码过程,码字为0.1010011 在0-1空间里定位,由于0.0110.10100110.111,所以第1个符号为a 0.1010011-0.011(a的起点)/0.1(a的宽度)=0.0100011*2=0.100011,由于0.0110.1000110.111,所以第2个符号为a。 0.100011-0.011(a的起点)/0.1(a的宽度)=0.001011*2=0.01011,由于0.0010.010110.011,所以第3个符号为b。 0.01011-0.001(b的起点)/0.01(b的宽度)=0.00111*4=0.111,由于0.111就是c的起点,

8、因此第4个符号是c,有损编码,对于大量图像,并不需要无损编码,只要人的视觉接收即可。此时重点在于压缩效率,故采用有损压缩。 有损压缩常采用以下方法 预测编码:点预测,帧内预测,帧间预测 变换域编码:KL,DCT,小波 量化编码:标量量化,矢量量化,变换域编码 DCT变换,变换域编码(1),在变换域(频率域)上利用信源的相关性进行数据压缩。 变换的目的是寻找信号更有效的表示方式。简单来说,一个实际信号在信号空间中表示为一点,在各坐标方向上都有投影。对信号空间作线性变换,可以让该信号只在一个坐标方向上有投影,而其他分量为0。,以三维空间为例,蓝线表示原有坐标系,信号点在三个方向上都有投影。坐标系线

9、性变换后(红色),信号点只在一个坐标轴上有分量。从而达到了压缩的目的。,变换域编码(2),上述方式,对每个信号都需要一个特定的坐标系变换,这是不现实的。对所有的信号,都要采用同样的坐标系变换,设该变换矩阵为T,是正交阵。 设一个离散信号由N个采样值组成,则对应N维向量空间,该信号可表示为一个N维向量X。 正交变换Y=TX。 变换后,Y也是一个N维向量,但其中N-M个分量近似为零。此时Y被压缩为只有M个分量,这就是变换域编码的基本原理,变换域编码(3),使MSE最小的条件是,即变换矩阵是由X的协方差矩阵的特征向量构成,此最佳变换称为KLT变换。变换矩阵与信号的统计特性相关,具体问题具体分析。,离

10、散余弦变换(1),离散余弦变换(DCT)是正交变换的一种,采用固定的基向量。 当信号是一阶平稳马尔可夫过程,且相关系数接近1,则DCT十分接近KLT。 一维DCT变换与 反变换,离散余弦变换(2),DCT的物理意义:空间频率的提取。 回顾: 傅立叶级数:连续周期性信号可以分解为若干正弦信号之和。 傅立叶变换:连续非周期信号分解为连续谱。 离散傅立叶变换:有限长度离散信号的傅里叶变换。 通过离散傅立叶变换,得到时域上的离散信号的各频率分量 引入空间频率的概念,沿着某个空间方向信号幅度产生变化,这种变化的速度就是空间频率。,离散余弦变换(3),斑马纹,木材横剖面,纵剖面的纹理具有典型的空间频率特性

11、。 与时域信号相似,任何图像都具有空间频率。因此,与时域的傅立叶变换相似,通过空间域的“傅立叶变换”,得到空间频率,也可以起到数据压缩的效果。 DCT就是空间域的“傅立叶变换”,DCT变换后得到的系数,就代表了空间频率的分布情况。,离散余弦变换(4),对图像而言,空间频率的高频部分代表其细节,低频部分代表其主体。因此DCT变换后,如果抛弃了图像的高频部分,则损失图像细节。 二维DCT变换的基函数图样。,图像分块,为什么图像处理要分块? DCT必须对一段数据进行操作,如果只对一点做DCT,则没有意义。 分块操作,可以减小对存储器的需求 分块操作,可以将图像细化,每个块内的图像细节将不再起主要作用

12、。因此可以将每块的DCT变换后的高频部分丢弃,而不影响图像质量。 如何分块: 正方形?矩形? 块的大小?块越小,图像细节保持的越好,编码用的比特越多;块越大,则相反。一般选择8*8像素大小的块。 产生的问题 马赛克效应。,JPEG标准,JPEG标准,JPEG是Joint Photographic Experts Group(联合图像专家小组)于1994年制定的一种图像编码格式,是在Web上最普遍的照片存储格式 。在保证图像质量的前提下,可以将图像压缩为1/10到1/20。 JPEG是图像和视频编码的基础。后面出现的JPEG2000,H.261,H.263等,都是以JPEG的框架作为基础的。,J

13、PEG流程,色彩空间转换 DownSampling DCT 量化 熵编码,JPEG流程(1),色彩空间转换 一般来说,摄像头采集到的信号,是RGB格式,而我们需要YUV的分量进行处理,因此需要进行色彩空间转换。 Y是像素的亮度,UV表示色调与饱和度 转换公式如下:,JPEG流程(2),DownSampling 人眼对亮度信号很敏感,而对色调与饱和度则相对不敏感。 为了提高编码效率,可以减小UV的数目,从而减小UV所占的比特。 从4:4:4到4:2:2或者4:2:0,JPEG流程(3),DCT 原始图像像素 52 55 61 66 70 61 64 73 63 59 55 90 109 85 6

14、9 72 62 59 68 113 144 104 66 73 63 58 71 122 154 106 70 69 67 61 68 104 126 88 68 70 79 65 60 70 77 68 58 75 85 71 64 59 55 61 65 83 87 79 69 68 65 76 78 94,经DCT变换后系数 -415 -30 -61 27 56 -20 -2 0 4 -22 -61 10 13 -7 -9 5 -47 7 77 -25 -29 10 5 -6 -49 12 34 -15 -10 6 2 2 12 -7 -13 -4 -2 2 -3 3 -8 3 2 -6

15、 -2 1 4 2 -1 0 0 -2 -1 -3 4 -1 0 0 -1 -4 -1 0 1 2,JPEG流程(4),量化 量化矩阵 16 11 10 16 24 40 51 61 12 12 14 19 26 58 60 55 14 13 16 24 40 57 69 56 14 17 22 29 51 87 80 62 18 22 37 56 68 109 103 77 24 35 55 64 81 104 113 92 49 64 78 87 103 121 120 101 72 92 95 98 112 100 103 99,量化后的DCT系数 -26 -3 -6 2 2 -1 0

16、0 0 -2 -4 1 1 0 0 0 -3 1 5 -1 -1 0 0 0 -4 1 2 -1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0,量化矩阵的获得是经过对大量图像统计后得到的,是固定的。 经量化后的DCT系数,高频部分出现了大量的0值。,JPEG流程(5),熵编码 Zig-Zag扫描,将频率由低到高依次排列 对排列后的数据进行熵编码,一般使用Huffman编码,也可使用算数编码。 当序列中不再有非零元素时,不在将0逐个列出,而是用EOB表示结束,从而压缩编码比特。,JPEG压缩实例,在量化这一步中,量化矩阵直接决定了DCT系数的精度,也就决定了图像的质量。下面是三幅同样的图片,用不同的量化矩阵,得到不同的品质。,JPEG2000简介,JPEG2000,JPEG200

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论