毕业设计(论文)-图像压缩方法研究.doc_第1页
毕业设计(论文)-图像压缩方法研究.doc_第2页
毕业设计(论文)-图像压缩方法研究.doc_第3页
毕业设计(论文)-图像压缩方法研究.doc_第4页
毕业设计(论文)-图像压缩方法研究.doc_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

图像压缩方法研究图像压缩方法研究 the research of image compression method 专 业:电子信息科学与技术 学 号:03111252 姓 名: 指导教师: 目录目录 内容摘要i abstract .ii 第一章 绪 论.1 1.1 课题背景.1 1.2 图像数据压缩的必要性.1 1.3 图像数据压缩的可能性.2 1.4 图像压缩技术研究的起源与发展.3 第二章 数字图像压缩的原理.4 2.1 数字图像的压缩概述.4 2.2 图像压缩的基本原理.4 2.2.1 信息论基础4 2.2.2 图像的基本压缩方式5 2.3 图像压缩系统概述及压缩系统评价.6 2.3.1 图像压缩系统的组成6 2.3.2 图像压缩系统评价7 第三章 数字图像的编码方式.10 3.1 数字图像编码的分类.10 3.2 无损数字图像编码方式.10 3.2.1 游程编码10 3.2.2 lzw 编码10 3.2.3 霍夫曼编码11 3.2.4 算术编码11 3.3 有损图像压缩编码方式.12 3.3.1 失真度理论和有损压缩13 3.2.2 变换编码13 3.2.3 预测编码14 3.2.4 矢量量化编码15 3.2.5 dct 变换编码.16 3.2.6 小波编码17 结束语.19 参考文献.20 致 谢.21 襄樊学院毕业论文(设计) i 内容摘要内容摘要 随着计算机多媒体技术的发展,人们期望更高性能的图像压缩技术的出现。基于对图像存 储技术和图像通信的考虑,良好的图像压缩技术不仅能够实现高压缩率和高保真率,还能满足 诸如渐进传输、图像渐现等网络应用的需要。因此,为了满足实际应用的需要,有必要对图像 数据压缩处理进行深入细致的研究,目前已发展成为专门的研究领域:图像编码。常见的主要 编码方法有预测编码、变换编码、矢量量化编码、小波编码、分形编码等等。论文首先对数字 图像压缩技术进行了综述,回顾了图像压缩技术的起源与发展,详细阐述了图像压缩的必要性 和可能性,分析图像压缩的一般模型,以及复原图像质量的性能评价标准。然后重点介绍图像 压缩编码的分类,对图像压缩编码,特别是预测编码、变换编码、矢量量化编码、小波编码的原 理和特点进行分析,并阐述图像压缩编码的作用。 关键词关键词: 图像压缩,图像编码,小波变换,图像质量 襄樊学院毕业论文(设计) ii abstract with the ever-growing multimedia technique, people are looking forward to new image compression techniques with better performance. taking the storage and transfer of mass image data into consideration, not only could favorable image compression techniques achieve high compression ratio and fidelity, they should also meet the demands of web applications. image compression needs further detailed study, thus a specialized research field known as image coding develops. frequently used major coding methods include pedicel code, transform code, vestal quantization, wavelet transform code, and fractal code. the paper firstly summarizes the image compression technology, presents the general conception of image compression technique, and briefly introduces several image compression algorithms. also, it introduces the general model of image compression, as well as the performance appraising criterion of recovered image quality. then,it expatiates on the classification of image coding and analyzes the images compression coding , especially to pedicel code, transform code, vestal quantization, wavelet transform code, fractal code. at last, the function of image compression coding is described. keywords: image coding,image compression,wavelet, image quality 襄樊学院毕业论文(设计) 1 第一章第一章 绪绪 论论 1.1 课题背景课题背景 图像压缩编码技术始于五十年代初的电视信号数字化。当时图像压缩技术主 要局限在预测编码、亚采样以及内插复原等技术上。七十年代后出现了变换编码 技术,并且由于通信技术的发展,对活动图像压缩技术也有较多的研究,如运动 估值和运动补偿。进入八十年代中后期,出现了许多新的图像压缩编码方法,例 如小波、分形和神经网络图像压缩方法。这新的图像编码方法从图像压缩机制及 处理方法上都有新的突破,获得了更高的图像压缩效率。因而使图像压缩的技术 和理论取得了很大的发展。此外,对活动图像压缩编码技术的研究也取得了许多 重要研究成果:电视电话/会议电影的 mit h.2b3 建议和静止及活动图像压缩的 jpeg, mpeg-1 和 mpeg-2 国际标准。所有这些己成为成熟的技术并获得了厂-泛 的应用。1998 年底,针对低比特率的活动图像压缩编码国际标准 mpeg-4 也正式 制定,新的静止图像压缩标准 jpeg2000 也已施行。鉴于图像压缩所具有的重要性, 己引起世界各国的广泛重视,图像压缩编码技术己成为当今信息技术中最具吸引 力的热门研究领域之一。近年来随着基础理论和科学技术的进步,人们一直在寻 求更好的压缩编码的方法。在新提出的编码方法中,小波变换方法和分形几何方 法被认为是有较大应用潜力的,受到该领域专家们的广泛关注,掀起了研究的热 潮。 随着现代通信技术的飞速发展和通信业务的不断拓展,图像信息传输已经成 为现代通信系统所提供的基本服务。在当前这样一个信息爆炸的社会中,人们在 交换图像及声音等媒体信息方面的需求越来越大,对交换的质量要求也越来越高。 通常图像经数字化后形成的数据量非常大。例如,一副分辨率为 1024768 的 24bit 真彩色静止图像,就有 2.36mb 的数据量。如果进行视频处理,假设每秒 30 帧, 则每秒产生近 70mb 的数据,也就是说,一张普通的光盘只能容纳 9s 的图像。但 是具有庞大数据量的数字图像难以传输和存储,数字图像通信与通信网容量的矛 盾日益突出,极大地制约了图像通信的发展,已经成为图像通信领域中的“瓶颈”问 题。为了解决数字图像数据量巨大的问题,必需对图像数据进行有效地压缩。因 此,数字图像压缩编码,已经成为现代信息社会中一个研究的热点问题。 1.2 图像数据压缩的必要性图像数据压缩的必要性 长期以来,人类获取到的信息其 80来源于图像媒体,15来源于语音。所 以,人们在自然界感受到的最主要的信息是视觉信息,这说明图像是人们生活中 信息交流最为重要的载体也是蕴含信息量最大的媒体。但与此不同,在早期的 计算机和通信领域,能够处理和传输的主要是文字和声音,因此,早期的计算机 和通信设备的处理能力跟人类的需求有很大的差距。随着通信信道及计算机容量 和速度的提高,图像信息已经成为通信和计算机系统的一种重要的处理对象。 襄樊学院毕业论文(设计) 2 与文字信息不同,图像信息需要大的存储容量和宽的传输信道,尤其是在需 要实现大规模图像数据库或传输高分辨率实时图像序列的场合。正因为这一点, 图像也给人们的信息交流(传输)、信息的保留(存储)带来很大的困难。特别是数字 化地球的今天和未来,这一问题尤为突出。但是,由于信息社会的到来人类追 求高质量的信息通信,采用数 字化信息是必经之路。这是因为数字化信息具有如 下特点: (1)易交换,畅通无阻,无处不达; (2)高容量以惊人的传输速度满足人们的信息需求; (3)高分辨率,信息质量优化; (4)高稳定性。传输途中不易受干扰,能原原本本地还它本来面目等。图像数字化 后计算机面临的最大难题之一是海量数据的存储与传送问题。 1.3 图像数据压缩的可能性图像数据压缩的可能性 经研究发现,与音频数据一样,图像数据中存在着大量的冗余,原因在于原 始图像数据是高度相关的。通过去除那些冗余数据可以节约文件所占的码字从而 极大地降低原始图像数据量,解决图像数据量巨大的问题,达到数据压缩的目的。 图像之所以能够进行压缩有以下几个方面的原因: (1)原始图像数据是高度相关的,存在很大的数据冗余。如种信源编码,其信源 是各种类型的图像信息。图像恢复的过程叫图像内相邻像素之间的空间冗余度、 系列图像前后帧之间的时做解码,根据解码后的数据与原始数据是否一致,图像 压缩方法间冗余度、多光谱遥感图像各频谱间的频率域冗余度等,它们造成了大 量的比特数浪费,消除这些冗余就可以节约码字,大大减少数据量,达到数据压 缩的目的。 (2)信源符号出现的概率不同,若用相同码长表示不同出现概率的符号,就会造 成符号冗余度。如果采用可变长编码技术,对出现概率高的符号用短码字,对出 现概率低的符号用长码字表示,就可以消除符号冗余度,从而节约码字。 (3)人眼具有视觉冗余,允许图像编码有一定的失真。人类视觉系统是有缺陷的, 人眼对于某些失真不敏感难以察觉。在许多场合中,并不要求经压缩及复原以后 的图像和原始图像完全相同,可以允许有少量的失真,只要这些失真并不被人眼 所察觉即可。这就为压缩比的提高提供了十分有利的条件,这种有失真的编码称 为限失真编码。在多数应用中,人眼往往是图像信息的最终接受者,图像编码方 法如果能充分利用人眼的视觉特性,就可以在保证复原图像主观质量较好的前提 下取得较高的压缩比。 (4)还可以利用先验知识来实现图像编码,降低知识冗余度。例如,在可视电话 中,编码对象可为人的头和肩等,这时可利用对编码对象的先验知识为编码对象 建立模型,通过提取模型参数,对参数进行编码而不对图像直接进行编码,可以 襄樊学院毕业论文(设计) 3 达到非常高的压缩比。 图像数据压缩技术就是研究如何利用图像数据的冗余性来减少图像数据量的 方法。因此,进行图像压缩研究的起点是研究图像数据的冗余性。 1.4 图像压缩技术研究的起源与发展图像压缩技术研究的起源与发展 图像压缩的研究起源于 20 世纪 40 年代。1948 年,oliver 首先提出了电视信 号的线性 pcm 理论,开辟了图像压缩理论的先河。随后,1958 年 graham 采用计 算机模拟试验的方法,提出了静止图像压缩的前值预测编码法,该方法能获得约 4bits/pix 的图像质量。70 年代 a.habibit 进行了帧间预测编码的研究,并在 80 年 代初针对运动补偿 (mc)所用的运动估值 (me)进行了研究。这些早期的预测编码 方法都是对象素为处理单元,其理论是线性预测理论。这些预测理论的思想至今 仍被广泛应用,但由于预测编码的最小方差不能反映人的视觉特性及它的压缩比 的限制,导致其在 90 年代开始被编码效率更高的变化编码所取代。 1968 年 h.c.andrews 等人提出了变换编码的概念,采用的是二维离散傅立叶 变换。此后相继出现了用其它变换方法的变换编码,其理论基础是把图像看成广 义平稳随机场,用线性变换去实现相关,如 k-l 变换,dct 变换等。其实现方法 均是通过正交变换把图像从相关性很强的空间域变换到相关性很弱的频域,再保 留方差较大的变换系数,忽略方差较小的变换系数,从而实现图像压缩。 1990 年通过的 itu-t如果取值 于某一离散集合,就叫离散信源。我们研究的是数字化系统,均为离散信源,本 文讨论的数字图像为离散空间函数。( , )x x y 襄樊学院毕业论文(设计) 5 自信息量和一阶熵:记字符,出现的概率为,那么按概率的公理化定 j a() j p a 义必须有 ;(j=1,2,3m); (2-01 j p1 j p 2) 则 shannon 信息论把字符出现的自信息量定义为: (2-()log jj i ap 3) 式中的符号可以保证其为正值。在计算机科学系统中,通常对对数的底取 2, 单位为比特 (bit), 亦称为自信息函数,其含义是:随机变量 x 取值为 a,时所携() j i a 带的信息的度量。我们把信息量的概率平均值,即随机变量的数学期望,叫() j i a 做信息熵或者简称熵(entropy),记为 (2- 11 ()()log nn ijii ii h xp i app 4) 单位为比特/字符,通常也称为一阶熵,它代表每个字符所给出的平均信息量。 于是,h(x)就是离散信源进行无失真编码的基本极限(不经映射变换,只作熵编码)。 2.2.2 图像的基本压缩方式 图像压缩的基本方法主要有以下两种:概率匹配和条件概率。 2.2.2.1 压缩基本方法之一 -概率匹配 如果对字符码的编码长度为,则显然,也是一个非负的随机变量,不妨 j a j l 记做: () (2-log jj lq 1 01,1,2,3,1 m jj j qjmq 5) 那么对信源.编码的平均码长就是 m a (2-6)log jjj j ip lpq 而信息论中已 经证明熵具有极值性,即 襄樊学院毕业论文(设计) 6 (2- 11 ()()log nn jjjj jj h xp i apq 7) 其中等号仅在=时成立这就告诉我们,对于离散无记忆源,必须准确得 j p j q 到字符集率,对各字符的编码长度都达到它的自信息量。在式中,若令=1/m,便 j q 得到最大离散熵定理,所有概率分布 p;所构成的熵,以等概率时为最大。即: ;在数字化系统中,通常使。若各字符以等概率出现,则()logh xmm 2r ,则,此时可以说,r 的二进制码字包含 1 ()2 2 r r j p a ()log2() r j i ar bit 有 r bit 的自信息量。对 256 级灰度图像,样本数目为256,最大熵为 8bit/字符,m 如果各字符以非等概率出现,就减少。因此,最大值与熵之间的差值,就是信 p h 源 x 所含有的冗余度(redundancy),即 (2-8) max( ) log( )rhxmh m 由此可见,离散无记忆信源的冗余度隐含在信源字符的非等概率分布之中。 只要信源不是等概率分布的,就存在着数据压缩的可能性。在数据压缩技术中, 一般将压缩前每个信源字符的编码位数 ()与压缩后每个字符的编码位数(l)之logm 比,定义为数据压缩比(cr:compression ratio) (2- logm cr i 9) 也可以使用 cr 的倒数来衡量压缩效果,称为压缩率。 2.2.2.2 压缩基本方法之二- 条件概率 若信源 x 的各分量不是相互独立的,就称为有记忆信源,实际上信源大多是 这种信源。在遮掩的一个信号序列中,任意字符的出现总是要附带的接触前面的 或后面字符的若干不确定性,即各字符是相关的,要用条件概率和条件熵的方法 来处理。而且字符间的相关性越强,对前面的字符知道的越多,下一个字符的信 息量越小.因此对于离散有记忆信源,可以利用条件概率进行编码,减少信源的极 限熵. 2.3 图像压缩系统概述及压缩系统评价图像压缩系统概述及压缩系统评价 2.3.1 图像压缩系统的组成 襄樊学院毕业论文(设计) 7 一个图像压缩系统包括两个不同的结构块:一个编码器和一个解码器。编码器 又包括一个信源编码器和一个信道编码器,同样解码器包括了一个信道解码器和 一个信源解码器。编码器和解码器都是彼此相关的函数或子块。图 2-1 表示了一个 一般的图像压缩系统模型框图。 图 2-1 一般图像压缩系统模型 2.3.1.1 信源编码器和信源解码器 信源编码器的任务是减少或消除输入图像中的冗余。它包含以下三部分 (量化 器不是必须的): 图 2-2 表示了信源编码器和信源解码器的模型。 图 2-2 (a)信源编码甜和(b)信源解码器 (1)转换器:它的作用是将输入数据转换为可以减少输入图像中象素间冗余的格 式。这部分操作通常是可逆的。 (2)量化器:它的作用是将转换程序的输出精度调到与预设的保真度准则相一致。 该操作是不可逆的,如果要进行无损压缩时,必须略去这一步。 (3)符号编码器:它生成一个固定的或可变长编码用于表示量化器输出并将输出 转化为与编码相一致。它是可逆的操作。 信源解码器仅包含两部分:一个符号解码器和一个反向转换器。因为量化过程 会导致不可逆的信息损失,故反向量化器不包含在信源解码器模型中。 2.3.1.2 信道编码器和解码器 信道编码器和解码器通过信源编码数据中插入预置的冗余数据来减少信道噪 声的影响。汉明(hamming)编码是一种有效的信道编码技术。 2.3.2 图像压缩系统评价 图像压缩系统的性能评价分为主、客观评价. 襄樊学院毕业论文(设计) 8 2.3.2.1 主观评价 采用平均判分 mos(mean option score)或多维计分等方法进行测试,所评 价出的图像质量不仅与图像本身特征有关,也与观察者特性以及观察者的环境条 件有关。观察者将复原图像与原图像相对比,比较损伤程度,可参照表 1 给评定 的图像打上一定的质量等级,最后用平均的方法得到图像的分数。 表 1 图像质量主观评价尺度表 质量尺度妨碍尺度 5.非常好5.丝毫看不出图像质量变坏 4.好4.能看出图像质量变坏,但不妨碍观看 3.一般 3.能清楚的看出图像质量变坏,对观看有妨 碍 2.差2.对观看有妨碍 1.非常差1.非常严重的妨碍观看 2.3.2.2 客观评价 客观评价的参数有以下几个:的参数有以下几个: (1)编码效率 (2-100% h l 10) 其中 h 为信源的熵,, (n 代表信源长度,a 分别为信源中第 k 1 n kk k ll p l 个字符的编码长度和出现概率)为平均码长。 (2)冗余度 冗余度 r 可表示为: 1r (3)压缩比:;其中 n. l 分别为编码前、后每个符号的平均码长,通常 n c l 为二进制表示的比特数。 (4)比特率: (bit/s 或 b/s) s ifr 式中为取样频率,r 表示对每个取样的幅度值编码的平均码长。己知不 s f s f 变时,i 就用 r 简单表示,一般对静止图像,指每个像素平均所需的比特数,单位 为 bit;对活动图像,指每秒输入或输出的比特数,单位为 mb/s,kb/s 等。 (5)复杂度:复杂度是指为实现编码算法所需的硬件设备,典型的可用算法的运 算量及需要的存储量来度量。系统的复杂度由数据压缩算法决定,它既包括编码 器的复杂度,也包括解码器的复杂度。一般要求的比特率越低,系统的复杂度越 襄樊学院毕业论文(设计) 9 高。 (6)时延: 时延过大的算法不能用于实时通信。实际允许的单程通信总时延(编 码时延加解码时延)可以小到(像没有回波抑制的电话网),也可以大到约 1ms 500ms (比如在甚低码率可视通信中,为了能收到较好的图像不得不容忍较大的通 信延迟),但一般控制在 200m,以内。 (7)信噪比(snr):给定一幅数字化图像和参考图像.它们之间的( , )f x y 0 ( ,)f x y 相似性通常用均方误差(mse)和 mse 的各种变形表示。当图像大小为 m*n 时, mse 为: (2- 11 2 00 00 ( , )(,) mn xy f x yf xy msn mn 11) 还常使用峰值信噪比 psnr (peak signal to noise ratio)作为质量测度, (2- 2 max 11 2 00 00 10lg 1 ( , )(,) mn xy f psnr f x yf xy mn 12) 其中二为最大灰度值,对于具有 256 个灰度级的黑白图像,常取 255. max f max f psnr 是衡量编码器性能的一个常用指标,但用它来度量主观感觉并不适合。例如, 稍有倾斜的图像在感觉上可以接受,但却会导致很低;而当图像中出现窄而亮 max p 的水平拖影时,很高但主观感觉很差。如何改进 psnr 使其在主观感觉上也有 max p 一定意义,一直是数据压缩领域研究的一个重要课题。 襄樊学院毕业论文(设计) 10 第三章第三章 数字图像的编码方式数字图像的编码方式 3.1 数字图像编码的分类数字图像编码的分类 目前常用的数字图像压缩编码可分为两类:一类压缩是可逆的,即从压缩后的数 据可以完全恢复原来的图像,信息没有损失,即是冗余压缩法,也称为无损压缩编码; 另一类压缩是不可逆的,即从压缩后的数据无法完全恢复原来的图像,信息有一定损 失, 即熵压缩法,也称为有损压缩编码。如图3-1所示。 图 3-1 数字图像编码分类 3.2 无损数字图像编码方式无损数字图像编码方式 无损图像是利用数据的统计特性,在无损压缩中,压缩后重建图像其数值等 于原图像。虽然无损压缩没有信息丢失,达到理想要求,然而只能实现适量压缩。 无损压缩的压缩率一般为 2:15:1。典型的无损压缩技术有游程编码、lzw 编码、 霍夫曼编码和算术编码等。 3.2.1 游程编码 襄樊学院毕业论文(设计) 11 游程编码(rlc)是对传真图像的标准压缩方法。它的基本理论是对一组从左到 右扫描得到的连续的 0 或 1 游程用它们的长度来编码。这里需要建立确定游程值 的协定,常用的方法有: (1)指出每行第一个游程的值; (2)设每行都由白色游程开始。通过用变长码来对游程的长度编码有可能取得 更高的压缩比。我们可将黑和白的游程长度分开,并根据它们的统计特性分别用 变长码编码例如符号 a,是由某个想象中的黑色游程信源产生出来的概率。用类似 的方法就可得到白色游程信源熵的估计 hw。这样图像的游程熵就近似为: (3- bw rl bw hh h ll 1) 其中变量和,分别代表白色和黑色游程长度的平均值。 blwl 3.2.2 lzw 编码 同 rle 类似,它也是对字符编码从而实现压缩。然而与 rle 不同的是,它在 对文件进行编码的同时,生成了特定的字符序列的表以及它们对应的代码。例如, 一个由 8 位字节组成的文件可以被编成 12 位的代码。在这 4096 个可能的代码中, 256 个代码代表可能的单个字符 (8 位),剩下的 3840 个代码分配给在压缩过程中 数据里出现的字符串。 每当表中没有的字符串头一次出现时,它就被原样存起来,同时将分配给它 的代码一起保存。之后当这个其再次出现时,只将它的代码存起来。这样就去掉 了文件冗余信息,不但字符表在压缩中动态生成的,而且字符串表也不必存在压 缩文件中,因为解压缩算法由信息中文件重构它。 3.2.3 霍夫曼编码 霍夫曼 (huffman )编码是消除编码冗余最常用的技术,其原理如下:设一个信 源的符号是 a,通过把两个概率最小的字符组合起来,就得到一个新的信源.它的 符号个数为 a-1.假设这个新信源的编码字是己知的,那么可以证明:新信源中还没 有组合起来的符号的编码字等于原来信源中对应符号的编码字;而两个组合符号的 编码字,可以通过在新信源中组合符号编码后,为0或1得到,因而霍夫曼编码 由只有两个符号0和“1”组成的编码。根据以上原理,可以得到如下构造霍夫曼编 码的方法: 1.反复组合两个最小概率的符号,得到一个新的简化信源,直到被简化的信 源中只有两个符号,分配这两个符号编码为0或“1” 2. 反复的求出最小概率编码字的两个组合符号编码,通过在上一步中求出 编码右侧加上0或者1直到找到原来信源。一旦霍夫曼码获得后,编码或者简码 襄樊学院毕业论文(设计) 12 都可以用简单的查表方式实现。这种码有三个特点: (1)它是一种块码,因为各个信源符号都被映射成一组固定次序的码符号; (2)它是一种即时码,因为一串码符号中的每个码字都可以不考虑其后的符号 解出来; (3)它是一种唯一可解开的码,因为任何符号串都只能以一种方式解。 根据这些特点,任何霍夫曼码都可通过从左到右检查各个符号进行解。然而, 霍夫曼编码使用整数个二进制位对符号进行编码,实际上这种方法在许多情况下 无法得到最优的压缩效果。假设某个字符的出现概率为 80%,该字符事实上只需 要 0.322 位编码,但霍夫曼编码一定会为其分配一位 0 或一位 1 的编码,整个信息 的 80%在压缩后都几乎相当于理想长度的 3 倍左右,压缩效果很不理想,而算术 编码可克服这个问题。 3.2.4 算术编码 算术编码的思想最早由香农提出,当时香农将符号依概率排序,用累积概率 的二进制表示作为对符号的编码。之后,经 rosanne. pasco 和 langdon 等人的研究, 算术编码日臻成熟。1987 年,witten 等人发表了一个实用的算术编码器,即 cacm87。自此以后,这一技术引来越来越多人的注意,被认为是基于统计的、 无损数据压缩效率最高的方法,几乎总强于霍夫曼编码。 算术编码是用0,1)间的一个实数间隔来表示符号序列。符号序列越长,间隔 越小,表示它的数据位数就越多,每编码符号序列的一个符号,都依该符号出现 的概率进一步缩小间隔,而且出现概率大的符号比出现概率小的符号缩小间隔得 较少,因此需要在表示它的数据上加入较少的位数。在符号被编码前,间隔为整 个区间0,1。每编码一个符号,以分配给该符号的比例将间隔缩小。算术编码的 过程实际上就是依据信源符号的出现概率对区间进行分割的过程。下面以一个例 子具体说明该过程。假定信源的符号集为: a, e,i,o,u,!,各符号的出现概率和分配的 区间见表 2.1.需要编码的符号序列为:eaii!。当编码第一个符号时,编码器将区间缩 小为分配给符号。的区间0.2,0.5).当编码第二个符号 a 时,编码器以分配给 a 的比 例(0,0.2),相对于整个区间0,1)将区间0.2,0.5)缩小,得到0.2,0.26).如此进行,直 至最后一个符号被编码,我们可得到最终缩小的区间为:0.23354,0.2336),如图 3.2 所示。 解码是编码的逆过程。如果解码器收到的区间为0.23354,0.2336),因为该区 间完全落在信源模型分配给符号。的区间内(表 5-3),解码器立即可以译出第一个符 号为。 。然后,解码器将区间缩小为0.2,0.5),因为接受到的区间落在符号 a 的区 间0.2,0.26)内,所以可译出第二个符号为 a。以此类推可译出所有的码来。 襄樊学院毕业论文(设计) 13 图 3-2 算术编码流程图 显然,无须传输编码区间的两个端点,因为该区间内的任何一个点都能够译 出正确的码来。但是,解码时会碰到一个问题:如何判断消息的终点?例如,数据 0.0 可以表示 a, aa, aaa中的任何一个。解决这个问题的办法是在消息的末尾加入 一个特殊的表示消息结束的符号 eof,如在上例中的符号!,解码器一遇到该符号 就立即停止解码。 3.3 有损图像压缩编码方式有损图像压缩编码方式 有损压缩方案,容许图像的质量有所下降,但与无损压缩相比,它的编码比 特率有较大的改善,而且重建图像的质量相对于人眼的视觉特性并没有明显的下 降。有损图像压缩可以达到几十倍的压缩比。通常有损图像压缩编码方案有变换 编码、预测编码和矢量量化编码(vq)等。 3.3.1 失真度理论和有损压缩 信息源的编码率性能界限 (即信号源的熵)取决于无损编码的数据。在许多实 际情况下,编码后重建图像存在一定程度的失真 (即图像降级)是允许的。在保持 某一图像级水平时,对给定的图像信息源编码所需要最小比特率时多大?回答这一 问题是信息论中一个分支要解决的问题,即失真度理论所讲的一个基本问题。失 真度理论为达到某一高保真度标准的有损压缩建立了一个理论的性能界限。对于 广播级的失真度,计量以及信息源的模型,这一理论提供了具有一下性质的失真 度方程:()r d 1.对于任何级别的失真度 d,可以找到一种编码方案,其比特率可以任意接近 ,其平均失真度可以任意接近 d;不可能找到一种编码方案,使得编码比特率()r d 比低,而失真度是 d 或者更好,可以证明,是一个 u 型的,连续单调()r d()r d 下降函数。 襄樊学院毕业论文(设计) 14 2.对于具有有限个字符的离散信号源,由图 2.2 可以看出其典型的失真度特性: (1). 当 d=0 时,无失真的值大于或等于信息源的熵。()r d (2)一般来说,比较复杂的编码方案可以较好的刻画信息源的统计特性,因而 其性能可以较好的接近 r(d)的界限。 图 3-3 失真度界限和典型编码特性 3.2.2 变换编码 变换编码的基本思想是把空间域的图像信号转换到变换域。若变换是正交变 换,则变换域的能量与空域相等并且熵保持不变。但是变换前后信息能量得到了 重新分布。空间域中的像素之间存在很强的相关性,而变换域中能量则主要集中 在直流和少数低频的变换系数上,这部分占图像信息的 90%。而高频部分的幅值 很小或几乎为零。同时变换系数间基本上是统计独立的,相关性较小。因此,可 以仅对低频的变换系数进行量化、编码和传输,而对高频部分则不予编码,从而 达到图像压缩的目的。实际中一般采用阈值编码法:即事先设定一个闭值,只对大 于此阈值的变换系数编码,这样可使图像的某些高频成分得到保留,重建图像时 图像品质得到改善。有很多类型的正交变换,如 k-l(离散信号的 hoteiling)变离散 余弦变换 (dct)、沃尔什-哈达玛变换和斜变换等。在这些正交变换中,采用均方 误差最小准则的 k-l 变换是最佳变换,但其无快速算法且依赖于信源的统计特性, 所以很难进行实时编码。基本变换编码的框图如图 3-4 所示: 图 3-4 变化编码流程图 3.2.3 预测编码 襄樊学院毕业论文(设计) 15 预测编码是数据压缩技术的一个重要分支,其理论基础主要是现代统计学和 控制论。图像的相邻像素之间存在着高度的相关性,即原始数据中存在着大量的 冗余。去除这些冗余,信号就可以有效的压缩编码。预测技木是最简单和有效的 压缩方法。发送者(和接收者)以某个固定的顺序(如由左到右,逐行进行的光栅扫 描方式),在己经被传送(接收)的像素的基础上预测当前像素值。假设以表示 , p i j 当前像素值,以闪滚表示其预测值,预测残差。-需要被传送。 , p i j , p i j , p i j 如果预测相当精确,那么预测残差的分布就集中在零值附近,其零阶熵比原始图 像的零阶熵大大降低。图像的像元和邻近像元有很大的相关性,因此可以用某一 点的相邻像元预测该点的值,预测误差将有较小的熵。预测编码有线性预测和非 线性预测两类。它们可以在一幅图像内进行(帧内预测编码),也可以在多幅图像之 间进行(帧间预测编码)。预测编码基于图像数据的空间和时间冗余特性,用相邻的 已知像素(或图像块)来预测当前像素(或图像块)的取值,然后再对预测误差进行量 化和编码。这些相邻像素(或图像块)可以是同行扫描的,也可以是前几行或前几帧 的,相应的预测编码分别称为一维、二维和三维预测,其中一维和二维预测是帧 内预测,三维预测是帧间预测。预测编码的关键是在于预测算法的选取,这与图 像信号的概率分布有很大关系,实际中常根据大量的统计结果采用简化的概率分 布形式来设计最佳的预测器,有时还使用自适应预测器以较好的刻画图像信号的 局部特性,提高预测效率。线性预测编码又称为差分脉码调制,即 dpcm(differential pulse code modulation)。帧内预测编码一般采用像素预测形式的 dpcm。图 3-5 为 dpcm 的编码流程图。 dpcm 是一种简单易行的预测编码方法,其优点是算法简单,易于硬件实现, 缺点是对信道噪声及误码很敏感.会产生误码扩散,使图像质量大大下降。 图 3-5 线性预测(dpcm)编码流程图 预测器用己经编码的邻近像素来计算的估计与(1), (2)()x nx nx np( )x n 估计值的差值=,用于存储和传输。预测器的预测精度越高,预测偏差( )e n( )estx n 越低,压缩比越高。 3.2.4 矢量量化编码 襄樊学院毕业论文(设计) 16 矢量量化的基本思想是根据 shannon 的信息理论,对符号序列在多维空间内 进行联合编码,以获得更高的压缩效率。其方法是:将输入图像数据序列分成多个 组,每一组有个数据构成一个 m 维空间中的一个矢量。在 m 维空间中,(2)m m 将其划分成个区域,每个区域内所有矢量用此区域内的中心矢量代替。对 x 个量x 化矢量分别赋一个索引值,则某个索引区内的所有矢量都可以用索引值来表示。 编码时只传输或存储该索引值,解码端采用与编码端相同的空间划分方法,则可 由此索引值得到对应的量化矢量,因而能有效地对图像数据进行压缩。 上述的空间划分称为矢量码书训练。矢量码书是通过大量样本的训练或学习 或自组织特征映射神经网络方法,得到一系列的标准图像模式,每一个图像模式 就称为码字或码矢,这些码字或码矢合在一起称为码书,码书实际上就是数据库。 输入图像块按照一定的方式形成一个输入矢量。编码时用这个输入矢量与码书中 的所有码字计算距离,找到距离最近的码字,即找到最佳匹配图像块。输出其索 引(地址)作为编码结果。解码过程与之相反,根据编码结果中的索引从码书中找到 索引对应的码字(该码书必须与编码时使用的码书一致),构成解码结果。如图 3-6 所示: 由于矢量量化有效地利用了矢量中各分量间的四种相关性(线性依赖性、非线 性依赖性、概率密度函数的形状和矢量维数)去除冗余度。因此,其结果要好于标 量量化。实际上,矢量量化可看成是标量量化的多维扩展。 图 3-6 矢量量化编码流程图 3.2.5 dct 变换编码 dct 变换是变换编码方法中的一种,但由于它是 jpeg“建议书中的核心压缩 编码方案,在变换用于图像压缩时,我们期望有如下性质: a)减少图像相关:理想变换将完全消除图像块中的数据相关,即把绝大部分 能量压缩进最小的系数中去。 b)基本函数与图像无关:由于图像间统计特征变化大,最佳的变换通常依赖 于图像的本身,但是要求这种于图像无关是件很费计算时间的任务。如果图像块 不是静态的,就必须使用多组,以便高度的减少相关性,而这样的处理不仅费时, 而且需要附加信息把组号传送到解码端,从而降低压缩效率,所以一般期望用与 图像无关的基本函数变换替换最优性能变换。 襄樊学院毕业论文(设计) 17 c)快速实现:n 点变换需要 d(n2)操作,而一些变换有快速算法,其操作次数 可以减少为 o(次,如果是 2 维变换,那么操作次数就从 o()减少到 o(lognn 4 n ).klt 变换是一种能量打包的最优变换,然而 klt 变换函数是图像依赖 2 2lognn 的,且不存在快速算法,在对图像信号的变换中,dct 和 klt 相差无几,而且 dct 变换有其它变换无法比拟的优点,即:实数变换,确定性变换函数 (变换核)、 可分离的变换。 二维 dct 变换为: (3- 11 00 2(21)(21) ( , )( ) ( )( , )coscos 22 mn xx xuyv f u vc u c vf x y mnmn 2) (3- 11 00 2(21)(21) ( , )( ) ( ) ( , )coscos 22 mn xx xuyv f x yc u c v f u v mnmn 3) 可见,二维变换都有相同的变换函数,且是可分离的: (3- 2(21)2(21) ( , , , )( , ) ( , )coscos 22 xuyv g x y u vg x y g u v mmnn 4) 3.2.6 小波编码 小波分析是当前数学中一个迅速发展的新领域,它同时具有理论深刻和应用 十分广泛的双重意义.它与 fourier 变换、窗口 fourier 变换(gabor 变换)相比,这是 一个时间和频率的局域变换,因而能有效的从信号中提取信息,通过伸缩和平移 等运算功能对函数或信号进行多尺度细化分析(multistage analysis),解决了 fourier 变换不能解决的许多困难问题,从而小波变化被誉为“数学显微镜”,它是调和分析 发展史上里程碑式的进展。与傅立叶分析相似,小波变换(wavelet transform)是一 种同时具有一频二维分辨率的变换。其优于傅氏变换之处在于它具有时域和频域 “变焦距”特性,十分有利于信号的精细分析。 小波变换在时域和频域都具有良好的局部化特性,它能将图像分解成交织在一 起的多种尺度成分,并对不同的尺度成分采用对应粗细的时域或空域取样步长,对高 频信号采用细处理,对低频信号采用粗处理,因此可以不断聚焦到对象的任意微小细 节,这使得小波变换优于傅里叶变换和盖博变换。小波变换的良好特性与mallat 算 法的简便易行,使得小波技术成为图像编码领域里的一个主要研究对象。我们称满 襄樊学院毕业论文(设计) 18 足容许性条件: 2 ( ) s ods s 其中称为的傅里叶变换) 的函数为原( ),( ) jwxjwx os ex edx ( )x( )x 形小波或母小波函数。母小波函数 通过平移和伸缩可以生成一组小波基函数( )x : , ( ) a b x , ( ) a b x 1 () xa aa 其中且a ,b 同为实数。变量a 表示一个特定基函数的宽度,b 表示其沿x 0a 轴的平移位置。式中为依 , ( ) a b x 赖于参数a ,b 的小波函数,简称为 连续小波或小波。小波离散后可 以构成空间的规范正交基,并 2( ) l r 使用它来表示或逼近信号,而且用 较少的小波系数就可以得到许多 不同图像的精确逼近。mallat 提 出了求解小波系数的塔形算法,思 想如下:对一幅图像完成一次二 维小波变换,需要对图像的行和列 分别进行一次mallat 算法处理,也 就是水平和垂直滤波,小波变换将原始图像分成四个子带,即1个低频子带(ll)与3个 高频子带(lh,hl,hh) 。对低频子带进一步实施小波变换。分解成下一级4个子带。 如此反复,图像就被多分辨率分解成不同分辨率级和不同方向的子带。其中ll 子 带集中了图像的大部分能量,即大幅值(绝对值较大) 系数大部分集中于此,这样就有 利于图像的压缩编码。以后的小波变换都是对前一次变换产生的低频子带进行变 换。图3-7是图像进行三级小波变换后的示意图。一般说来,利用小波变换进行图像 压缩需要经过以下步骤: 寻找具有紧支集的正交小波及其对应的小波滤波器。 输入原始图像点值序列。结出分解层数和图像数据向量长度。对原始图像运 用二维mallat 分解算法进行小波变换,得到不同层次、不同图号的子图。根据不 同层次、不同子图的特点,对相应小波系数的各个部分进行数据向量的量化编码,对 最高层子图需要进行无失真压缩编码。小波应用于图像压缩编码,使得图像的压缩 比高,压缩速度快。但由于小波应用于图像编码时间还不长,许多工作还处于探索阶 段。今后还有很多需要研究,如:活动图像小波编码,人眼视觉特性的充分利用,多小 波变换的应用等。 图3-7 三层小波分解示意图 襄樊学院毕业论文(设计) 19 从现在的研究结果可看到,小波技术应用于图像已获得了较好的编码效果,小波技术 是现代图像压缩技术研究的热点之一,也是十分有前途的一种方法。 小波图像压缩方法是近年来受到广泛重视并己逐步得到应用的变换编码技术。 与传统的 dct 变换相比,离散小波变换(dwt)具有良好的时频局部化特性和较好 的能量集中特性,同时由于小波变换是对整个图像进行的,因此基于小波的图像 压缩方法能够很好地克服方块效应; 如图 3-7。此外,小波变换具有天然的塔式分 解数据特征,可应用于图像的多分辨率分解的多分辨率特性提供了利用人眼各种 视觉特性的良好机制。正是由于这些原因,众多学者对基于小波的压缩方法进行 了研究。 结束语结束语 随着信息技术的突飞猛进,存储介质的存储量越来越大,通信线路的频带越 来越宽,然而,数据量和通信业务的发展又远远超过存储量和带宽的增长速度, 这就好比路和车一样,因此数据压缩是数据存储和传输中必须经过的处理过程。 人们在不断完善和应用较为成熟的编码方法的同时,又对编码方法提出了新的要 求,从而推动了数据压缩技术的不断进步。除了分形及小波变换图像压缩方法之 外,近年来又提出了利用人工神经网络进行图像压缩和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论