已阅读5页,还剩34页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数字图像处理第九章图像编码,主要内容,图像编码分类图像编码的保真度图像编码方法简介PCM编码统计编码预测编码变换编码图像编码方的国际标准,(1)图像编码分类,数字通信系统,图像编码对信源进行数字化压缩处理,第一代压缩编码以去除冗余度为基础,主要根据传统的信源编码方法(八十年代以前):PCM、DPCM、M、亚采样、DFT、DCT、Walsh-Hadamard变换编码第二代压缩编码八十年代以后提出,突破传统信源编码理论,充分考虑视觉系统生理心理特性和图像信信号的分解与表述,采用图像的合成与识别策略:金字塔编码、分形、模型基、神经网络、小波变换,(1)图像编码分类,图像编码应用分类无损编码又称为信息保持编码。要求解码过程中能够无误差的重建图像,如在医学图像应用中。有损编码常被称为保真度编码。常用在图像的输出为人眼应用中,如数字电视、可视电话等。特征抽取编码是另一种有损编码。常用在图像的输出为计算机应用中,只需要保留计算机处理的信息特征如图像识别。,图像编码实现方案分类,(1)图像编码分类,(2)图像编码的保真度,图象保真度描述解码图象相对于原始图象的偏离程度对信息损失的测度主观保真度准则主观测量图象的质量,因人而异,应用不方便客观保真度准则用编码输入与解码输出的某个确定函数表示损失的信息量,便于计算或测量,客观保真度准则,点误差,均方误差,均方信噪比,均方根误差,原图像为,经压缩后解压的图像为,(2)图像编码的保真度,归一化信噪比,令,峰值信噪比,(单位:分贝),主观保真度准则,(2)图像编码的保真度,(3)图像编码方法简介,一、PCM编码,脉冲编码调制(PulseCodingModulation,PCM)将模拟信号转换为数字信号(产生量化噪声),线性PCM编码均匀量化(一般用等长码或格雷码)。,非线性PCM编码提高小信号在量化过程中的信噪比,采用非线性压扩。,亚奈奎斯特采样PCM编码降低采样速率以提高编码效率。在亚奈奎斯特采样时,使混叠部分处于原始信号各次谐波的间隙内,在接收端滤除(梳状滤波器)。,二、统计编码(基于像素灰度概率分布),编码效率与冗余度,设无记忆信源X有N个消息,其概率分布,设某个信源xk出现的概率是pk,信源熵,xk的自信息量,要求用符号集合A=a1,a2,am,通常A=0,1,对X进行编码,(比特/消息),(3)图像编码方法简介,设第i个消息的码字长度为Li,则,平均码长,平均每个符号所含有的熵,将编码后的每个符号视为新的无记忆“信源”,符号数为n,则该“信源”的最大熵为(各符号出现概率相等时),(比特/符号),若S,则编码效率达到100,一般情况下,S,信源熵(S)是进行无失真编码的理论极限。,(3)图像编码方法简介,(比特/符号),定义编码效率,冗余度,设信源有4个消息(x1,x2,x3,x4),其概率分布,取A=0,1,则n=2,可以用如下等长码:,x1=00,x2=10,x3=01,x4=11,(比特/消息),(3)图像编码方法简介,平均码长,编码效率,冗余度,如果采用不等长码概率大的短,概率小的长,x1=0,x2=10,x3=110,x4=111,(3)图像编码方法简介,平均码长,编码效率,冗余度,变长编码可以实现较高的编码效率,而且是一种无损编码,(3)图像编码方法简介,变长编码条件:单义性和非续长性,单义性任意一个有限长的码字序列只能被唯一分割成码字集合中的码字,而任何其他的分割方法都会产生不属于码字集合中的码字。,非续长性任意一个码字都不是由码字集合中的一个码字在后面添上一些码元构成的,信源码码码码x10000 x2011001x3100110011x410111110111,*码缺乏单义性;码缺乏单义性和非续长性;码具备单义性和非续长性;码具备单义性,但缺乏非续长性,(3)图像编码方法简介,霍夫曼(Huffman)编码,编码步骤:Step1:按照图像灰度出现的概率从大到小排序;Step2:把最后两个概率相加,再重新排序(消减信源);Step3:重复2,直到只有两个概率为止(构造二叉树);Step4:从最后的位置开始反向编码,每遇到二叉树,在上位添0,下位添1。,(3)图像编码方法简介,平均码长:,信源熵:,编码效率:,(3)图像编码方法简介,Huffman编码是最优变长码;需要多次排序,耗时大可采用分块编码。,香农-法诺(Shannon-Fano)编码,编码步骤:Step1:按照信源出现的概率从大到小排序;Step2:把信源分成上下两个子集,使得两个子集中的概率和相等或最接近;Step3:分别对两个子集赋值0和1;Step4:对每一个子集重复步骤24,直到每个子集只包含一个信源。,(3)图像编码方法简介,三、预测编码,基本原理,图像像素间存在很大的相关性,可以由前n个采样值预测下一个值:,预测误差:,预测编码对ei进行编码,由信息论可知直接对信号编码的平均码长的下限:,对预测误差编码的平均码长的下限为:,(3)图像编码方法简介,如果预测较准确,则必有H(e)H(x),概率分布越均匀,熵越大,而ei的分布集中在0附近,预测编码可以提高编码效率,最佳预测均方误差最小,均方误差:,j=0,1,n;,要求:,j=0,1,n;,(3)图像编码方法简介,视信号为零均值的平稳随机过程,其协方差为:Rij=Exixj,对i=0,有,由此求出ai(n为预测阶数),一维预测:利用图像中同一行的前面若干个像素进行预测;二维预测:利用图像中前面几行进行预测;三维预测:利用视频信号前面几帧进行预测,对于电视信号,一般认为是一阶马尔柯夫过程,可以采用前值预测:,(3)图像编码方法简介,M编码(增量调制编码,或DM),原理:编码器是1bit的预测编码,当e(t)0,当e(t)0,在接收端,当译码器收到“1”时信号产生正跳变,收到“0”时产生负跳变。,M编码的基本特性斜率过载、量化噪声、信噪比等,(3)图像编码方法简介,DPCM编码(DifferentialPulseCodeModulation),M和PCM二者结合的编码方法,(原理)编码器:采样比较量化预测编码译码器:PCM译码与预测值相加,(DPCM编、译码原理),(3)图像编码方法简介,四、变换编码,(3)图像编码方法简介,行程编码(RLC,Run-LengthCoding),将扫描行中灰度值相同的相邻像素,用一个计数值和该灰度值来代替。,1、一维行程编码,映射结果,设扫描行中有8个灰度级,24个像素,直接编码的比特数:,243=72bit,若对参数(gi,li)编码,灰度值需3bit,长度用4bit,则每对参数需7bit,共有,74=28bit,提高压缩率,(3)图像编码方法简介,行程编码尤其适用二值(黑白)图像(位平面表示),对二值图像,扫描行中的行程长度组成信源集合:,(1,2,N),对应的出现概率:(P1,P2,PN),用统计编码,平均每个行程的比特数满足:,HBH1(变长编码定理),平均行程长度:,可以估计平均每个像素所需比特数b(比特率):,(3)图像编码方法简介,如果把黑白行程分别编码,可进一步减小比特率。,如果采用一阶马尔可夫模型,测量平均行程长度就能较好估计出比特率。,1、二维行程编码,(a),(b),(方法一)转换成一维行程:,(3)图像编码方法简介,(方法二)利用相邻的一维扫描线之间的相关性预测微分量化器(PDQ,PredictiveDifferentialQuantizer),相邻扫描行上行程起点之间的差;,1相邻扫描行的行程的差;,自左向右开始(排扫),依次记录(,1,“开始”,“消失”)这4个参量的序列。,图像有少量大暗区时更有效;而图像有大量小暗区时,一维行程编码有效,(3)图像编码方法简介,3、等值线编码,不同灰度级的像素构成不同高度的“平台”,对所有平台的高度、位置和形状的表示,即是对图像的表示。,三要素:等值线的灰度级、起始点(IP)、跟踪方式,算法:从图像左上角开始(第一个IP),用T算法跟踪直至返回此IP,得到第一条等值线,再用IP算法寻找第二个IP,用T算法跟踪直至返回,得到第二条等值线,以此类推。此过程中,赋予每个像素一个指示符(代表四种走向)。,编码方法:对四个参量(等值线灰度;IP行号,列号,指示符序列)编码。,(3)图像编码方法简介,正交变换编码,正交变换的特点,(1)熵保持(变换不丢失信息);(2)能量保持(Parseval定理);(3)稀疏性;(4)去相关性。,高压缩比的可能性,(3)图像编码方法简介,数学模型,Y=TX,X=x0,x1,xN-1T,Y=y0,y1,yN-1T,(T为正交矩阵),X=T-1Y,如果变换后只保留M个分量(MN),则反变换得到X的近似,最佳变换准则X与有最小均方误差,K-L变换(完全去除冗余),K-L变换由信源计算,复杂度高,难以实时处理,(3)图像编码方法简介,准最佳变换,根据线性代数理论,任何矩阵A可以经相似变换为Jordan标准型:,TTAT=B(T非唯一),FT、DCT、Walsh-Hadamard等具备变换T的性质。,将信源变换为近似对角矩阵,(3)图像编码方法简介,一个能把最多的信息集中到最少的系数上去的变换所产生的重建误差最小。不同变换的信息集中能力不同K-L最优,但计算量非常大(依赖于图像)正弦类变换(如DFT和DCT)较优非正弦类变换(如WHT)实现简单小波变换计算快且有局部性质(不需分块),变换选择,信息集中能力:K-LDCTDFTWHT所需计算量:K-LDCTDFTWHTDCT是较好的(综合)选择,(3)图像编码方法简介,编码,(1)区域编码只对能量集中的区域内的系数编码(低频部分)。均方误差与所选区域尺度有关。缺点:区域方块固定不变,某些图像可能产生较大降质。,(2)门限编码对变换系数设定门限,只对大于门限的部分编码,具有自适应性。缺点:需加上位置码对系数所在位置做标记,压缩比可能会降低。,(3)图像编码方法简介,图像编码的国际标准,JPEG标准(静止图像),联合图像专家组(JointPhotographicExpertGroup)1991年提出。,基本系统:以88的图像块为基本单位进行编码;将RGB转换为亮度、色调、饱和度表示,并重新采样;采用DCT变换编码。,(4)图像编码的国际标准,JPEG系统规定了亮度分量和色度分量的量化表,色度分量的量化步长比亮度分量大;将每个DCT系数除以各自量化步长并四舍五入后取整,得到量化系数(高频部分出现大量0值);,量化:,依据视觉心理经验得出,(4)图像编码的国际标准,编码:,对量化后系数的DC(直流成分)采用无失真DPCM(差分脉冲调制编码),即对每个分块的DC值与前一个块DC值的差值进行编码。对量化后系数的AC(交流成分),采用行程编码,得到(M,N)的数据对,其中M是两个非零AC系数之间连续的0的个数(行程长度),N是下一个非零AC系数的值。,zig-zag排序:为使连续的0个数增多,采用z形编码,(4)图像编码的国际标准,存储的中间格式为了节约空间,JPEG并不直接保存数据的数值,而是将数据按照编码所需位数分为16组,保存在VLI编码表里面(用行、列位置表示某编码值)。,熵编码在得到DC系数和AC系数的中间格式之后,对两者进行熵编码(进一步压缩)。JPEG标准规定了两种熵编码方式:Huffman
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学国学竞赛复习题库+-图文
- 2025年全国导游资格考试大纲
- 2023重症医学科ICU护理专科理论试题
- 2025版税务师《涉税服务实务》真题模拟试题
- 2023年一级人力资源管理师专业技能真题及答案
- 2022年国家公务员考试申论真题(副省级)
- 基层卫生人才能力提升培训理论补考考试
- 《市场营销学》第六章定价策略练习题
- 2022监理工程师网络继续教育专业课试题
- 《文化差异与跨文化交际》章节测试题与答案
- 数据恢复违约合同范本
- 2026年南京信息职业技术学院单招职业技能测试题库及答案1套
- 2025年的财产信托合同示范文本
- 2025年西宁市城东区面向社会公开选拔社区工作人员笔试考试参考试题及答案解析
- 西红柿种植技术
- 第一章(诱发电位概论)+第二章(体感诱发电位)(2013年)
- GB/T 27924-2011工业货架规格尺寸与额定荷载
- GB/T 25085.3-2020道路车辆汽车电缆第3部分:交流30 V或直流60 V单芯铜导体电缆的尺寸和要求
- GB/T 242-2007金属管扩口试验方法
- GB/T 20878-2007不锈钢和耐热钢牌号及化学成分
- 政治理论水平任职资格考试题库
评论
0/150
提交评论