工学医学图像处理第十五讲图像压缩_第1页
工学医学图像处理第十五讲图像压缩_第2页
工学医学图像处理第十五讲图像压缩_第3页
工学医学图像处理第十五讲图像压缩_第4页
工学医学图像处理第十五讲图像压缩_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

工学医学图像处理第十五讲图像压缩主要内容:1图像压缩基础;2无损压缩的常用技术;3有损压缩的常用技术;4

MATLAB图像压缩;第八章图像压缩2023/3/21主要内容:1图像压缩基础;2无损压缩的常用技术;3有损压缩的常用技术;4

MATLAB图像压缩;第八章图像压缩2023/3/21图像压缩基础—必要性从图像存储看:一幅512×512大小的8位灰度图像占用的存储空间为:512×512×8=2,097,152bit=256KB一部90分钟的彩色电影(画面大小为640×480,每秒24帧)仅图像(不考虑声音)需要的存储空间:90×60×24×640×480×3×8÷8÷1024÷1024=113,906MCD:113,906M÷600M=190DVD:113,906M÷4200M=27一次CT检查的图像数据大小:512×512×12×60÷8÷1024÷1024=22.5M300天×20人/天×30M/人=180,000M图像压缩基础—必要性从图像传输看:图像数据分辨率比特/像素大小(B)传输带宽(b)传输时间(28.8Kbps

Modem)灰度图像512×5128256K2M1min11sec彩色图像512×51224768K6M3min34sec医学图像1024×1024121.5M12M7min6sec动态视频640x480

1分钟(24帧/秒)241.24G169M4days4hrs图像压缩基础—必要性数字图像数据量很大,需要相当大的存储空间、带宽和传输时间,单纯依靠增加存储器容量和改善信道带宽无法满足需求;图像压缩解决的问题是尽量减少表示数字图像时所需的数据量;图像压缩可以节省存储空间、可以节约传输时间;简言之,便于存储和传输。图像压缩基础—可能性“数据”和“信息”:数据是表达信息的手段;例:欧阳公在翰林时,常与同院出游。有奔马毙犬,公曰:“试书其一事。”“有黄犬卧于道,马惊,奔逸而来,蹄而死之。”“有黄犬卧于通衢,逸马蹄而杀之。”“有马逸于街衢,卧犬遭之而毙。”公曰:“使子修史,万卷未已也。”曰:“内翰云何?”公曰:“逸马杀犬于道。”相与一笑。图像压缩基础—可能性可见,数据压缩的对象是数据。数据是信息的载体,用来记录和传送信息。真正有用的不是数据本身,而是数据所携带的信息。大的数据量并不代表含有大的信息量。数据能够得到压缩(可能性)是因为数据包含了不必要(无用的)的或重复(已表达的)的信息;或者称包含了冗余。压缩就是对给定量的信息,设法减少表达这些信息的数据量,也就是去掉对信息没有本质影响的冗余的数据。图像压缩基础—压缩率和相对冗余数据冗余可用数学方式进行量化;如果n1和n2代表两个表示相同信息的数据集合所包含的数据单元数目,则第一个数据集合的相对冗余RD定义为:其中CR为压缩率,定义为:图像压缩基础—压缩率和相对冗余例:第1种表达的数据单元数目(比特)n1=4×4×8×3=284bit;第2种表达的数据单元数目(比特)n2=8+3×8=32bit;故CR=n1/n2=8.875,RD=1-1/CR=0.887RGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGB16RGB图像压缩基础—图像数据的三种冗余在数字图像数据中存在三种基本的数据冗余,即像素间冗余、心理视觉冗余和编码冗余。当这三种冗余中的一种或多种得到减少或消除时,就可以实现数据压缩。图像压缩基础—图像数据的三种冗余像素间冗余:图像相邻像素之间的相关性所造成的冗余。包括:空间冗余:图像中大部分区域信号变化缓慢,尤其是背景。单个像素对一幅图像的多数视觉贡献是多余的,它的值可以根据这个像素的相邻像素进行适当的预测结构冗余:规则纹理、具有某种自相似的结构表面帧间冗余:(视频)图像序列中相邻帧之间的相关性图像压缩基础—图像数据的三种冗余心理视觉冗余:人眼不能感知或不敏感的那部分图像信息称为心理视觉冗余,与人观察图像的方式有关,主要表现在:1)眼睛对某些视觉信息更敏感(亮度I);2)人对某些视觉信息更关心;因此,视觉感知时对信息的接受是有选择的,有些信息相对不重要,去除这些信息并不会明显地降低对图像质量的感受。

224颜色28颜色图像压缩基础—图像数据的三种冗余编码冗余:如果一个图像的灰度级编码,使用了多于实际需要的编码符号,就称该图像包含了编码冗余;例:如果用8位表示下面图像的像素,则该图像存在着编码冗余,因为该图像的像素只有两个灰度,用一位即可表示。事实上,如果图像中各灰度级出现的概率不完全相同,则自然二进制编码总会存在编码冗余,因为自然二进制编码对所有灰度级编以同样的码长;如果希望消除编码冗余,应该用尽可能少的比特数表达出现概率高的灰度级,这种方法称“变长编码”。图像压缩基础—图像数据的三种冗余变长编码原理的理解:英文字母出现相对频率字母ABCDEFGHIJKLM百分比8.21.52.84.312.72.22.06.17.00.20.84.02.4字母NOPQRSTUVWXYZ百分比6.77.51.90.16.06.39.12.81.02.40.22.00.1图像压缩基础—图像数据的三种冗余变长编码原理的理解:国际莫尔斯电码符号SymbolABCDEFGHIJKLMCode.--…-.-.-.....-.--.…....----.-.-..--SymbolNOPQRSTUVWXYZCode-.---.--.--.-.-.…-..-…-.---..--.----..Symbol0123456789Code-----.----..---…--….-…..-….--...---..----.Symbol.,?:;-/“Code--..--..--..---…-.-.-.-…--..-..-..-.图像压缩基础—图像数据的三种冗余例:设一灰度图像共有L灰度级,用rk表示(k=0,1,…,L-1);rk出现的概率用p(rk)表示;设l(rk)为表达灰度级rk的二进制位的长度,则用于表示每个像素的平均二进制位长度(码长)为:表达M×N大小的图像,共需要二进制位(数据量)MNLavg。图像压缩基础—图像数据的三种冗余例:考虑如下8灰度级图像Lavg1=3;Lavg2=2×0.19+2×0.25+2×0.21+…+5×0.06+6×0.03+6×0.02=2.7故等长编码相对于变长编码的相对冗余为1-1/(3/2.7)=1-1/1.11=0.099rkPr(rk)等长编码l1(rk)变长编码l2(rk)00.1900031121/70.2500130122/70.2101031023/70.16011300134/70.081003000145/70.0610130000156/70.031103000001610.0211130000006图像压缩基础—图像数据的三种冗余例:下图显示了图像的直方图Pr(rk)和l2(rk)。可以看出这两个函数以相反的趋势变化;对出现概率大的灰度级用短的二进制符号表示,出现概率小的灰度级用长的二进制符号表示,这就是变长编码原理。图像压缩基础—信息熵问题:表达一给定的图像(信源),究竟需要多大的数据量?有没有满足充分描述一幅图像且没有信息丢失的最小数据量?要回答这个问题,需要信息论的支持;答案是肯定的,这个最小数据量由图像的信息熵(平均信息量)决定;图像压缩基础—信息熵信息论的创始人香农提出,信息可以从概率论的角度用函数表示为:其中,P(ai)

是信源符号集X{a1,a2,…,ar}中的符号ai出现的概率,P(ai)可以度量ai所含的信息量。思考:为什么事件发生的概率能够反映信息量?事件发生的概率和信息量是怎样的关系?高概率事件→确定性、低信息量低概率事件→不确定性、高信息量图像压缩基础—信息熵信息量与事件出现概率的关系:当P(ai)=0.5时,即事件发生的概率为1/2时:I(ai)=1;信息量的单位是比特,即表达上述事件时仅需要1个二进制位图像压缩基础—信息熵信源的信息熵定义为每个信源符号输出的平均信息量:信息熵的单位和信息量的单位一样,是比特。图像压缩基础—信息熵例:计算输入字符串“aabbaccbaa”的信息量和信息熵;解:a、b、c出现的次数分别为5、3、2;其概率分别为0.5、0.3和0.2,则信息量分别为:I(a)=-log2(0.5)=1I(b)=-log2(0.3)=1.737I(c)=-log2(0.2)=2.322总信息量也即表达整个字符串需要的二进制位数为:I=I(a)×5+I(b)×3+I(c)×2=14.855bit信息熵为平均信息量,即:H=I(a)×0.5+I(b)×0.3+I(c)×0.2=I/10=1.4855bit图像压缩基础—信息熵信源的信息熵定义为每个信源符号输出的平均信息量:信息熵的性质:(1)信息熵是一个非负数,即总有H≥0;(2)当其中一个符号aj的出现概率p(aj)=1时,其余符号ai(i≠j)的出现概率p(ai)=0,H=0。(3)当各个ai出现的概率相同时,H取得最大平均信息量log2r(仅此时自然二进制编码不存在编码冗余)。只要信源不是等概率分布,就存在着数据压缩的可能性。(4)总有H≤log2r。编码冗余(信息熵冗余):如果图像中平均每个像素使用的比特数大于该图像的信息熵,则存在编码冗余。图像压缩基础—绝对冗余和编码效率平均码长:令l(ai)为符号ai的码长绝对冗余:编码效率:Lavg≥H:总可以设计出某种无失真编码方法;Lavg>>H:编码方法效率太低,占用比特数太多;Lavg≈H:最佳编码;使数据单元的编码长度尽量等于其信息熵Lavg<H:信息有丢失;信息熵是进行无失真编码的理论极限图像压缩基础—图像数据的三种冗余例:考虑之前的8灰度级图像该图像的信息熵为:H=-0.19×log20.19-0.25×log20.25-…-0.02log20.02=2.65等长编码和变长编码的编码效率分别为88.33%和98.15%;绝对冗余分别为:0.1321和0.0189rkPr(rk)等长编码l1(rk)变长编码l2(rk)00.1900031121/70.2500130122/70.2101031023/70.16011300134/70.081003000145/70.0610130000156/70.031103000001610.0211130000006Lavg=3Lavg=2.7图像压缩基础—思考同样是512×512分辨率的图像,为什么文件大小不一样呢?图像压缩基础—思考同样是512×512分辨率的图像,为什么文件大小不一样呢?

答案:

1)图像数据在保存为特定格式的图像文件时经过了压缩;

2)不同图像所表达的信息不一样,其信息熵也不一样,在经过压缩后,信息熵较小(数据冗余较多)的图像数据能够获得更大的压缩比;图像压缩基础—压缩图像的分类压缩可分为两大类,第一类压缩过程是可逆的,也就是说,从压缩后的图像能够完全恢复出原来的图像,信息没有任何丢失,称为无损压缩;第二类压缩过程是不可逆的,无法完全恢复出原图像,信息有一定的丢失,称为有损压缩。一般在正常观测条件下,感觉不到明显的损失(视觉无损);通常有损压缩的压缩比比无损压缩的高;有损压缩的压缩比越高,失真越大。原图JPEG100:1图像压缩基础—压缩技术的分类无损压缩有损压缩压缩数据还原后,与原始数据一致,无损失。压缩后再还原的数据有损失。可逆编码不可逆编码霍夫曼编码有损预测编码行程编码DCT变换编码算术编码小波变换编码LZW编码JPEG无损预测编码JPEG2000压缩比:2:1~5:1压缩比:≤100:1图像压缩基础—图像保真度和质量在有损压缩时,需要有对信息损失的测度以描述解码图像相对于原始图像的偏离程度,这些测度一般称为保真度。客观保真度准则:用原输入图像与解压缩后输出图像的某个确定函数表示损失的信息量,便于计算或测量;点误差:图像总体误差:均方根误差:平方误差平均值的平方根图像压缩基础—图像保真度和质量主观保真度准则:观察者对解压图像综合评价的平均电视图像质量评价尺度图像压缩基础—图像压缩模型一个常用的图像压缩系统模型如下所示:编码器和解码器成对出现;信源编码器:消除输入冗余,实现压缩的目的;信道编码器:为了增强噪声抗干扰性,增加一些容错、校验位、版权保护,实际上是增加冗余;信道:如Internet、广播、无线通讯、可移动介质如果编码器和解码器之间的信道是无噪声的,则信道编码器和信道解码器可以略去。图像压缩基础—图像压缩模型信源编码器和信源解码器量化器是产生失真的原因;无损压缩编码器中不需要量化器主要内容:1图像压缩基础;2无损压缩的常用技术;3有损压缩的常用技术;4

MATLAB图像压缩;第八章图像压缩2023/3/21无损压缩的常用技术无损压缩霍夫曼编码行程编码算术编码LZW编码无损预测编码无损压缩的常用技术—霍夫曼编码编码原理:对出现概率高的符号分配短码,对出现概率低的符号分配长码;通过改变编码分配的长度,降低总数据量;只消除编码冗余,不消除像素间冗余或视觉冗余。编码算法步骤:1)、将信源符号按概率递减顺序排列;2)、将两个最小的概率作为二叉树的两个叶子节点,将它们的和作为根节点,这两个叶子节点不再参与比较,新的根节点参与比较;3)、重复步骤1)和2),直到概率和等于1;4)、完成上述步骤后沿路径返回进行编码。寻找从概率为1处到每一信源符号的路径,每层有两个分支,给大的概率赋予1、小的概率为0(或相反),从而得到每个符号的编码。无损压缩的常用技术—霍夫曼编码例:对如下图像进行霍夫曼编码解:1)统计出每级灰度出现的概率:灰度值:0

10

20

30

40出现概率:1/161/167/163/164/16

2)从左到右把上述概率率按从小到大的顺序排列。灰度值:0

10

30

40

20出现概率:1/161/163/164/167/163010402020402002020303020402040无损压缩的常用技术—霍夫曼编码例:对如下图像进行霍夫曼编码3)选出概率最小的两个值(1/16,1/16)作为二叉树的两个叶子节点,将概率和2/16作为它们的根节点,新的根节点再参与其它概率排序:2/163/165/167/1630104020204020020203030204020401/161/162/16无损压缩的常用技术—霍夫曼编码例:对如下图像进行霍夫曼编码4)选出概率最小的两个值(2/16,3/16)作为二叉树的两个叶子节点,将概率和5/16作为它们的根节点,新的根节点再参与其它概率排序:4/165/167/1630104020204020020203030204020401/161/162/163/165/16无损压缩的常用技术—霍夫曼编码例:对如下图像进行霍夫曼编码5)选出概率最小的两个值(4/16,5/16)作为二叉树的两个叶子节点将概率和9/16作为它们的根节点,新的根节点再参与其它概率排序:7/169/1630104020204020020203030204020401/161/162/163/165/164/169/16无损压缩的常用技术—霍夫曼编码例:对如下图像进行霍夫曼编码6)最后两个概率值(7/16,9/16)作为二叉树的两个叶子节点,将概率和1作为它们的根节点。30104020204020020203030204020401/161/162/163/165/164/169/167/161无损压缩的常用技术—霍夫曼编码例:对如下图像进行霍夫曼编码7)分配码字:将形成的霍夫曼二叉树的左节点标0,右节点标1(或相反)。把从最上面的根节点到最下面的叶子节点途中遇到的0,1序列串起来,就得到了各级灰度的编码。30104020204020020203030204020401/161/162/163/165/164/169/167/16101003014002001110无损压缩的常用技术—霍夫曼编码例:对如下图像进行霍夫曼编码8)各灰度的编码如下:灰度值:20

40

30

10

0霍夫曼编码:0

10

11111011100则上图所示图像的霍夫曼编码为:共用了32比特,原图像128比特,压缩比4:130104020204020020203030204020401/161/162/163/165/164/169/167/16101003014002001110无损压缩的常用技术—霍夫曼编码例:对如下图像进行霍夫曼编码9)原图像的信息熵H=1.9746

霍夫曼编码的平均码长Lavg=2编码效率η=98.73%30104020204020020203030204020401/161/162/163/165/164/169/167/16101003014002001110无损压缩的常用技术—霍夫曼编码霍夫曼编码的特点:编码的不唯一性;需要事先知道输入图像灰度的概率分布;只在图像灰度分布不均匀的时候有高的编码效率;编码长度可变,压缩与解压缩较慢;无损压缩的常用技术—霍夫曼编码作业:一幅灰度图像的灰度级分别为{f0,f1,f2,f3,f4,f5,f6,f7}={0,1/7,2/7,3/7,4/7,5/7,6/7,1},各个灰度级对应的概率分别为{P(f0),P(f1),P(f2),P(f3),P(f4),P(f5),P(f6),P(f7)}={0.1,0.06,0.07,0.2,0.35,0.04,0.03,0.15}。请对该图像的灰度级进行Huffman编码(要求画出霍夫曼树)并计算编码效率。无损压缩的常用技术—行程编码行程编码又称行程长度编码(RunLengthEncoding,RLE)编码原理:在给定的图像数据中寻找连续重复的数值,将具有相同灰度值的连续数值用其串长和一个代表值来代替,该连续串就称为行程,串长称为行程长度;消除像素间冗余。例:如下字符串:5555557777733322221111111行程编码:(6,5)(5,7)(3,3)(4,2)(7,1)如下图像数据的行程编码为:(3,)

(12,)

(4,)

(9,)

(

1,)无损压缩的常用技术—行程编码二维行程编码要解决的核心问题是:将二维排列的像素,采用某种方式转化成一维排列的方式。之后按照一维行程编码方式进行编码。两种典型的二维行程编码的排列方式:(a)(b)无损压缩的常用技术—行程编码例:对下图进行行程编码(数据量:8×8×8=512(bit))无损压缩的常用技术—行程编码例:如果按照行扫描的顺序排列的话,数据分布为:行程编码为:数据量为:46×(3+8)=506(bit)压缩率:1.01:1130,130,130,129,134,133,129,130;130,130,130,129,134,133,130,130;130,130,130,129,132,132,130,130;129,130,130,129,130,130,129,129;

127,128,127,129,131,129,131,130;127,128,127,128,127,128,132,132;125,126,129,129,127,129,133,132;127,125,128,128,126,130,131,131(3,130),(1,129),(1,134),(1,133),(1,129),(4,130),(1,129),(1,134),(1,133),(5,130),(1,129),(2,132),(2,130),(1,129),(2,130),(1,129),(2,130),(2,129),(1,127),(1,128),(1,127),(1,129),(1,131),(1,129),(1,131),(1,130),(1,127),(1,128),(1,127),(1,128),(1,127),(1,128),(2,132),(1,125),(1,126),(2,129),(1,127),(1,129),(1,133),(1,132),(1,127),(1,125),(2,128),(1,126),(1,130),(2,131)无损压缩的常用技术—行程编码例:如果按照列扫描的顺序排列的话,数据分布为:行程编码为:数据量为:42×(3+8)=462(bit)压缩率:1.24:1130,130,130,129,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论