第6章 图像编码课件_第1页
第6章 图像编码课件_第2页
第6章 图像编码课件_第3页
第6章 图像编码课件_第4页
第6章 图像编码课件_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、6.1 图像压缩原理6.2 数据冗余6.3 编码定理6.4 图像保真度6.5 变长编码6.6 位平面编码*6.7 预测编码6.8 变换编码l 图像编码,也称为图像压缩l 提出的原因:未经编码(压缩)的图像数据量巨大,不利于储存和网络传输。l 数据和信息是不同的概念:数据是信息的载体,对给定量的信息可以用不同的数据量来表示。l 对给定量的信息,设法减少表达这些信息的数据量称为数据压缩。l 压缩数据的重要方法是消除冗余数据,从数学角度来看就是要将原始图像转化为从统计角度尽可能不相关的数据集。图像压缩的理论基础是信息论。l 压缩的数据恢复为原始数据的过程称为解压缩,或解码。l 根据解码结果对原始图像

2、的保真程度,压缩分为无损压缩和有损压缩。原始图像编码编码结果存储传输解码解码图像图像的编码和解码过程码率(流量描述)l 码率(也叫比特率):表示经过压缩编码后的视音频数据每秒需要用多少个比特来表示,即把每秒显示的图像进行压缩后的数据量,一般采用的单位是kbps或Mbps【该指标对图像的传输有意义】。l 一般来说码率越大,处理出来的文件就越接近原始文件,但文件体积与码率是成正比的,所以几乎所有的编码格式重视的都是如何用最低的码率达到最少的失真,围绕这个核心衍生出来的CBR(固定码率)与VBR(动态码率)。l 固定码率CBR(Constant Bitrate):指文件从头到尾都是一种码率,这是以固

3、定文件大小为前提的压缩方式。l 动态码率VBR(Variable Bitrate):指没有固定的码率,压缩时根据视音频数据即时确定使用什么码率,这是以质量为前提兼顾文件大小的压缩方式。根据编码原理可以将图像编码分为熵编码预测编码变换编码混合编码(1) 熵编码。熵编码是纯粹基于信号统计特性的编码技术,是一种无损编码。熵编码的基本原理是给出现概率较大的符号赋予一个短码字,而给出现概率较小的符号赋予一个长码字,从而使得最终的平均码长很小。常见的熵编码方法有行程编码(Run Length Encoding)、哈夫曼编码和算术编码。(2) 预测编码。预测编码基于图像数据的空间或时间冗余特性,用相邻的已知

4、像素(或像素块)来预测当前像素(或像素块)的取值,然后再对预测误差进行量化和编码。预测编码可分为帧内预测和帧间预测。常用的预测编码有差分脉码调制(Differential Pulse Code Modulation,DPCM) 和运动补偿法。(3) 变换编码。变换编码通常将空间域上的图像经过正交变换映射到另一变换域上,使变换后的系数之间的相关性降低。典型的如DCT。(4) 混合编码。混合编码是指综合了熵编码、变换编码或预测编码的编码方法,如JPEG标准和MPEG标准。根据对压缩编码后的图像进行重建的准确程度,可将常用的图像编码方法分为三类:(1) 信息保持编码(也称无失真编码),要求在编、解码

5、过程中保证图像信息不丢失,从而可以完整地重建图像。信息保持编码的压缩比较低,一般不超过31,主要应用在图像的数字存储方面,常用于医学图像编码中。(2) 保真度编码, 主要利用人眼的视觉特性,在允许的失真(Lossy)条件下或一定的保真度准则下,最大限度地压缩图像。保真度编码可以实现较大的压缩比,主要用于数字电视技术、静止图像通信、娱乐等方面。(3) 特征提取。在图像识别、分析和分类等技术中,往往并不需要全部图像信息,而只要对感兴趣的部分特征信息进行编码即可压缩数据。算法的编码效率。算法的编码效率通常有几种表现形式:平均码字长度图像的压缩比每秒钟所需的传输比特数(bits per second,

6、bps)图像信息熵与平均码长之比()这些表现形式很容易相互转换。如果使用不同的数据量来表示给定的信息量,那么使用较多数据量的方法中,有些数据必然代表了无用的信息,或者重复地表示了其他数据已表示的信息,这就是数据冗余的概念。在图像压缩中,有三种基本的数据冗余:编码冗余、像素间冗余、心理视觉冗余。如果能减少或消除其中的一种或多种冗余,就能取得数据压缩的效果。(1)编码冗余对图像编码需要建立以表达图像数据。码本:指用来表达一定量的信息或一组事件所需的一系列符号(如字母、数字等)。其中对每个信息或事件所赋的码符号序列称为,而每个码字里的符号个数称为。例 自然码和变长码出现概率高的码分配长度最短的编码(

7、2)像素间相关冗余l 图像中同一目标的像素间一般均有相关性,即由某一个像素的性质往往可以获得其邻域像素的性质,换句话说,各像素的值可以比较方便地由其邻近像素的值预测出来。l 这种由邻近像素相关性预测的方法确定某像素值的过程,意味着存在像素相关冗余(称为空间冗余或几何冗余)。l 连续序列图像中的帧间冗余l 单个独立的像素自身携带的信息相对较少,因为可由其邻域像素预测出来具有相同的目标(一系列圆环),直方图相同,但是像素间的相关性不同(a)的中心行相关性曲线(b)的中心行相关性曲线呈现规律性,表示这样的目标和曲线并不需要给出所有的点某行的自相关系数为便于比较,自相关系数按下式进行了归一化:(3)心

8、理视觉冗余心理视觉冗余技术与人类的视觉感官密切相关对正常视觉感知过程来讲不是必不可少的信息可以去除心理视觉冗余压缩是有损的编解码器模型l 映射器:通过变换输入数据(信源符号码字)以减少像素相关冗余l 量化器:通过减少映射器输出精度,达到降低心理视觉冗余的效果l 符号编码器:最短码赋给最频繁出现的量化器输出值,以减少编码冗余l 并不是所有的编码器同时包括以上三个模块1 信息论简介信息论可以回答两个有关图像压缩的基本问题: 什么是图像压缩的最终极限熵(entropy) 什么是图像传输率的最终极限信道容量Claude Elwood Shannon (Apr. 30, 1916 Feb. 24, 20

9、01) was an American mathematician, electronic engineer, and cryptographer known as the father of information theory. Shannon is famous for having founded information theory with one landmark paper published in 1948.信息论是研究编解码的理论基础,创始人香农(Shannon)。信息测量离散信源的熵表示对于一个离散信源,常分两种类型考虑:无记忆和有记忆信源。无记忆信源即信源的当前输出与以

10、前的输出是无关的,否则就是有记忆信源。确定信息的测量单位,如果底数为2,则单位是比特一个小概率的符号出现将带来更大的信息量,即信息量与该符号的概率成反比。img = rgb2gray(imread(face1.jpg);r c = size(img);pi = imhist(img) / ( r * c ); % 直方图分布数据I = -log(pi); % 自信息量灰度直方图与自信息量的对比每个符号的平均自信息量为:1 物理学上指热能除以温度所得的商,标志热量转化为功的程度。 2 科学技术上用来描述、表征系统不确定程度的函数。亦被社会科学用以借喻人类社会某些状态的不确定程度。 3 传播学中表

11、示一种情境的不确定性和无组织性熵的含义:是随机变量的平均不确定性的一个测度它在数值上描述随机变量所需的平均比特数如,设一个随机变量有16个概率相同的取值,对每个取值赋一个标记,解释:每个标记需要4bit。该随机变量的熵是4,与需要描述该随机变量的bit数相同。解:求:信息量和熵图像的信息熵一元灰度熵两个随机变量,它们之间的互信息是一个变量由于另一个变量而引起的不确定性减少的量度;条件信息熵是一个变量在给定另一个变量时的熵。信息系统信源信道信宿简单的信息系统示意图信道的容量,即传递信息的能力信源符号在信道传输时可能会出现差错则输出符号集的概率分布可由下式计算,其中,互信息()信道容量给出信息可靠

12、地通过信道传输的最大速率。含噪声的二元对称信道(Binary Symmetric Channel, BSC)由信道矩阵:2 基本编码定理() 信源编码是以提高通信的有效性为目的编码。 通常通过压缩信源的冗余度来实现。 采用的一般方法是压缩每个信源符号的平均比特数(信源的码率)。信源编码的基本途径有两个: 使序列中的各个符号尽可能地互相独立,即解除相关性; 使编码中各个符号出现的概率尽可能地相等,即概率均匀化(从而使从而使得每个码符号所携带的信息量达到最大,进而可以用尽量少的码符号传输得每个码符号所携带的信息量达到最大,进而可以用尽量少的码符号传输信源信息。信源信息。)信源编码的基础是信息论中的

13、两个编码定理:可变长无失真信源编码定理(香农第一定理)率失真编码定理无失真编码只适用于离散信源;对于连续信源,只能在失真受限制的情况下进行限失真编码。无失真信源编码 要求精确地复现信源的输出 保证信源的全部信息无损的送给信宿无失真信源编码器N次扩展码N次扩展N次扩展变长码变长码001001111000010001 111111二次扩展码实例平均码长设编码是唯一可译码,即信源符号与码字一一对应。信源码字码长定义为码长的数学期望:对于定长码,平均码长单个码字的码长无损信源编码的平均码长度可以接近信源的熵,但不能小于信源的熵。这就是无损信源压缩的极限。二阶扩展编码效率比一阶效率有提高图像的有损压缩,

14、需要对信息损失进行测度,以描述解码图像相对于原始图像的偏离程度,这些测度一般称为保真度(逼真度)准则。客观保真度准则主观保真度准则客观保真度准则最常用的准则是输入图和输出图之间的均方根(RMS)误差,总误差均方根误差实际使用中常将SNR归一化并用分贝(dB)表示:主观保真度由于视觉的主观特性,也可以用主观保真度准则来测量,即对一组精心挑选的观察者的评价结果进行平均得到综合评价结果。图像中灰度最大值主观保真度准则使用起来比较困难,另外,利用主观保真度准则与利用客观保真度准则还未得到很好的吻合。1 哈夫曼编码哈夫曼编码是以信源概率分布为基础的,但一般无法事先知道信源的概率分布,通常采用对大量数据进

15、行统计后得到的近似分布来代替,这样会导致实际应用时哈夫曼编码无法达到最佳性能。哈夫曼编码的一般算法如下:step 1:首先统计信源中各符号出现的概率,按符号出现的概率从大到小排序。step 2:把最小的两个概率相加合并成新的概率,与剩余的概率组成新的概率集合。step 3:对新的概率集合重新排序,再次把其中最小的两个概率相加,组成新的概率集合。如此重复进行,直到最后两个概率的和为1。step 4:分配码字。码字分配从最后一步开始反向进行,对于每次相加的两个概率,给大的赋“0”,小的赋“1”(也可以全部相反); 如果两个概率相等,则从中任选一个赋“0”,另一个赋“1”即可。读出时由符号开始一直走

16、到最后的概率和“1”,将路线上所遇到的“0”和“1”按最低位到最高位的顺序排好,就是该符号的哈夫曼编码。设一幅灰度级为8(分别用S0、S1、S2、S3、S4、S5、S6、S7表示)的图像中,各灰度所对应的概率分别为0.40、0.18、0.10、0.10、0.07、0.06、0.05、0.04。现对其进行哈夫曼编码。2 香农-范诺编码3 算术编码算术编码是1980年代发展起来的一种熵编码方法。基本原理是将被编码的数据序列表示成0和1之间的一个间隔(也就是一个小数范围),该间隔的位置与输入数据的概率分布有关。信息越长,编码表示的间隔就越小,因而表示这一间隔所需的二进制位数就越多(由于间隔是用小数表

17、示的)。区间0.06752,0.0688用于描述输出符号,可以用0.0688表示整个符号序列(有误差)0.20.20.40.40.80.80.040.040.080.080.160.160.0480.0480.0560.0560.0720.072将多灰度值图象分解成一系列二值图对每一幅二值图再用二元压缩方法1 位平面分解位平面(bit plane)一幅图像的高阶比特面携带大量的可见相关细节,低阶面分布着一些细小的细节b7b6b5b4b3b2b1b02 位平面编码常数块编码(CAC) n 基本思想: 将一扫描行中颜色值相同的相邻像素用两个字节来表示, 第一个字节是一个计数值, 用于指定像素重复的

18、次数; 第二个字节是具体像素的值。n 压缩是通过消除空间冗余的一种简单形式(即一组相同的灰度)来实现的。Example:有一表示颜色像素值的字符串RRRRRGGBBBBBB,用RLE压缩方法压缩后可用 5R2G6B 来代替n “病态”情况:RLE 压缩算法对于数据重复量大的情况是非常高效率的。但是, 当图像像素的颜色值出现每个相邻像素的颜色值均不同的特殊情况时,反而会使编码扩展。如:颜色字符串GBR, 则经此方法压缩后变成了 1G1B1Rn 改进方法:对计数字节和图像像素字节进行了区分, 利用计数字节的高两位作为压缩的 标 志 。 对 每 个 相 邻 像 素 的 颜 色 值 均 不 同 的 单 个 像 素 数 据 :只有当计数字节高 2位全1( 即 C0) 时才加 1 计数, 否则直接输出该像素值, 因此避免了压缩后长度增加一倍的情况。l RLE所能获得的压缩比有多大,这主要是取决于图像本身的特点。如果图像中具有相同颜色的图像块越大,图像块数目越少,获得的压缩比就越高。反之, RLE对颜色丰富的自然图像就显得力不从心。JPEG编码n JPEG静态图像压缩的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论