基于DCT的图象压缩算法的研究(开题报告).doc

tx080DCT的图像压缩算法的研究

收藏

压缩包内文档预览:
预览图 预览图 预览图 预览图 预览图 预览图
编号:516501    类型:共享资源    大小:177.90KB    格式:RAR    上传时间:2015-11-12 上传人:QQ28****1120 IP属地:辽宁
6
积分
关 键 词:
机械毕业设计
资源描述:
tx080DCT的图像压缩算法的研究,机械毕业设计
内容简介:
本科毕业设计(论文) 文献综述 课题名称:基于 DCT 的图像 压缩算法的研究 课题来源:数据压缩 课题范围:数字信号处理 nts 一、课题国内外现状: 1948 年提出电视信号数字化以后,就开始了对图像压缩编码的研究工作,至今已有数十年历史。 在压缩技术的发展过程中出现了各种不同原理的压缩方法 :如预测编码 (Predictive Coding),变换编码(Transform Coding),子带编码 ( Sub band Coding),分形编码 (Fractal Coding),神经网络编码 (Neural Network Coding),以及基于模型的编码等方法。变换编码是 1968 年 H.C.Andrews 等人提出的,采用的是二维离散傅立叶变换,此后相继出现了用其他变换方法的变换编码,其中包括二维 DCT。变换编码都是基于正交变换原理这种编码主要用于对统计冗余和视觉冗余进行压缩、该编码把图像光强矩阵的时域信号变换成频域分布信号,然后进行处理。在理论上,Karhunen-Lueve 变换是最优的正交变换,但这种变换计算复杂,极难做到快速高效的处理。离散余 弦变换( DCT)在压缩效率方面与Karhunen-Lueve 变换相差不多,而且能用类似 FFT 的算法实现快速变换,因此,尽管 DCT 在压缩效率上稍逊于 Karh-unen-Lueve 变换,但其高效性使其成为 CCITT 建议的一种图像压缩方式,它也是实际中应用的最多的图像压缩预处理方式。 nts 二、研究主要成果: 图像文件都有数据海量的特性,例如,一副尺寸为 512x512 的24 位 BMP 文件要占用 786486 个字节才能在计算机中存储,这对许多需要大量存储食品数据的领域会造成很大的不便,如办公自动化、医学图像、卫星遥感、 传真、数字图像传输、电视会议、可视电话、高清晰电视等。因而快速的图像压缩算法及解压缩算法对此等以图像数据为基础的应用领域有非常重要的意义。 图像压缩技术是建立在发掘图像信息冗余度的基础上的。信息中数据冗余的现象比较普遍,数据冗余的种类也不尽相同。归纳起来,一般有以下几种: 1.空间冗余 2.时间冗余 3.信息熵冗余 4.结构冗余 5.知识冗余 6.视觉冗余 nts7.其他冗余 利用正交变换,如离散余弦变换、卡胡南 -拉夫变换、沃尔什 -哈达玛变换等,将图像的能量集中在少数变换系数中,对这些参数进行编码,可得到高压缩 比的压缩数据。从本质上讲,图像经过正交变换后之所以能实现数据压缩,是因为经过多维坐标系适当的旋转变换后,把散布在各个原坐标轴上的原始图像数据集中到新坐标系中的少数坐标轴上了,从而为后继的量化和编码提供了高效数据压缩的可能性。在变换编码中,由于对整幅图像进行变换的计算量太大,所以一般把原始图像分成许多个矩形区域,对子图像独立进行变换。采用 离散余弦编码 DCT 变换消除相关性的效果非常好,而且算法快速,被普遍接受。 本文以离散余弦变换问研究对象,重点是正反变换的实现。 DCT 算法的实质是:压缩图像块灰度样本数 据流。压缩编码过程和解码过程见下图: nts 单纯的进行 DCT 是不能实现数据量的压缩的,对于一个 8x8的样本块而言,有 64 个系数,不论怎么变换最后还是有 64 个系数,变换的目的是 利用图像块内像素值之间的相关性,把图像变换到一组新的“基”上,使得能量集中到少数几个变换系数上,通过存储这些系数而达到压缩的目的,所以在变换后要对变换的结果进行必要的编码才能实现数据的压缩,变换只是为实现压缩而进行的必要的预处理。 DCT 可分为一维离散余弦变换、二维离散余弦变换、借助傅里叶变换( FFT)实现离散余弦变换、二维快速离散余弦变 换等。 基于 DCT 数据压缩其实是有失真的压缩,原因在于,在熵编nts码之前要对变换结果的系数进行量化处理, 量化处理是使数据比特率下降的一个强有力的措施。量化输入值的动态范围很大,需要以多的比特数表示一个数值,量化输出只能取有限个整数,称作量化级,一般希望量化后的数值用较少的比特数就可以表示。每个量化输入被强行归一到与其接近的某个输出,即量化到某个级。量化处理总是把一批输入量化到一个输出级上,所以量化处理是一个多对一的处理过程,一般是个不可逆过程,量化处理中有信息丢失,即会引起量化误差或量化噪声。 通常设计量化器有 下述两种情况: ( 1)给定量化分层级数,满足量化误差最小。 ( 2)限定量化误差,确定分层级数,满足用尽量小的平均比特数表示量化输出的要求。 显然,这是一对相互矛盾的要求,设计量化器只能折衷处理。 量化后的熵编码本系统采用的是霍夫曼编码, 三、存在问题: 由于量化的粗糙,会产生如下的图像缺陷: 1. 块效应 量化噪声分散在图象域整个“块”之内,由于不 同的“块”分别处理,迭加了不同的量化噪声, 在“块”的边界nts处将出现不连续,即所谓的“块效 应” 2. 振铃效应 是由于对 DCT块内高频系数的粗糙 量化而带来的,当量 化粗糙时,高频系数可能被量 化为 0,在频域内形成了锐截止,在反变换后,量化误差在图象的强边缘附近就形成了振铃现象,也就是我们常说的“吉不斯现象” 3. 清晰度下降 清晰度下降也是由于在低码率下高频分量的损失而产生的,然而中等程度的模糊人眼一般觉察不出来,随着观察距离的增加,模糊效应逐渐下降。 四、主要参考文献: 1 吴乐南编著 .数据压缩 .北京 :电子工业出版社 , 2000:1-27 2 黄贤武 ,王加俊 ,李家华编著 .数字图像处理与压缩编码技术 .成都电子科技大学出版社 ,2002,(18):360-366 3 崔屹 .图像处理与分析 数学形态学方法及应用 .北京 :科学出版社 ,2000:15-29 4 崔屹 .数字图象处理技术与应用 .北京:电子工业出版社,1996: 7-29 5 余松 张文军 孙军 .现代图象信息压缩技术 .北京:科学出版社, 1998 6 崔屹 .数据结构与 C语言程序设计 .北京希望电脑公司, 1991 nts 7 毕厚杰等 . 图象通信工程 .人民邮电出版社, 1995 8 董绍平 . 数字信号处理基础 .哈尔滨工业大学出版社, 1990 9 林国辉 祝宇鸿 张晓颖 . 去除 DCT压缩图象缺陷的后处理 .北京邮电大学电信工程学院 22#,北京 nts 大学生 本科毕业设计 题目: 基于 DCT的图象 压缩算法的研究 性质: 理论研究 专业: 电子科学与技术 日期: 2005年 6月 姓名: 杨家沛 nts 摘要 图像处理方法分为:空域法( space field method)和频域法( frequency field method)。在频域法中,最关键的预处理是变换处理( transform processing)。这种变换一般是线性变换,其基本线性运算式是严 格可逆的,且满足正交条件,在图像处理技术中正交变换被广泛用于图像特征提取、图像增强、图像复原及压缩编码等领域。 图像压缩是关于用最少的数据量来表示尽可能多的原图像的信息的一个过程。对于图像来说,如果需要进行快速或实时传输以及大量存储,就需要对图像数据进行压缩变换编码是把图像中的各个像素从一种空间变换到另一种空间,然后针对变换后的信号进行量化与编码操作的一种图像压缩编码技术。 DCT(离散余弦变换 )是变换编码中的一种映射变换方法,能使静态图像有较高的压缩比,正由于这种优越性, DCT得到广泛使用。 关键词 离散余弦变换 , DCT,图像 ,压缩编码 nts Abstract The methods of image processing include space field method and frequency field method. The most important beforehand processing is transform processing .This kind of transform is linear , it s basal linear operation is can be athwart and tally with determinate qualification. In the image processing field transform is used to distill the characteristics of the image, compressing coding, etc. Discrete cosine Transform is called DCT, it s the most common method of transform , in this disquisition I wont to investigate how to carry out the DCT . Key words: Discrete cosine Transform, DCT, image , coding. nts 摘要 . 2 Abstract . 3 第一章 绪论 . 5 1.1图像压缩的必要性 . 5 1.2图像数据压缩的可能性 (可行性 ) . 5 1.3图像压缩技术的发展和现状 . 8 1.3.1图像编码技术发展历史 . 8 1.3.2图像编码技术的现状 . 9 1.4图像压缩的一般过程 . 9 1.5多媒体数据压缩方法的分类 . 11 第 2章 图像压缩的理论基础 . 14 2.1图像压缩的理论基础 . 14 2.1.1信息量、熵、冗余度 . 15 2.1.2香 农无失真编码定理 . 18 2.1.3率失真函数理论 . 19 2.2 图像系统的性能评估 . 21 2.2.1主观 评价 . 21 2.2.2客观评价 . 22 结论 . 24 参考文献 . 28 致谢 . 29 nts 第一章 绪论 1.1图像压缩的必要性 众所周知,原始数字图像在计算机中会占用大量的存储空间。例如,一副 1024*1024 的 24 位真彩色图像要占用 3MB 存储空间,这对许多需要大量存储视频图像信息的应用领域会造成很大困难。因而快速的图像压缩算法,特别是解压缩算法,对于许多以图像数据位基础的应用场合具有非常重要的意义。 数字图像传输是图像编码与压缩技术的另一个重要应 用领域。随着现代社会对通信业务要求的不断增长,图像通信和通信网容量的矛盾日益突出。特别是具有庞大数据量的数字图像信息更是难以传输和存储,极大地制约了图像通信的发展,已经成为图像通信发展中的瓶颈。图像压缩技术的应用为传真、视频点播、电视会议、医用图像传输等领域带来了巨大经济效益。快速压缩解压缩算法及其硬件结构在实时视频系统中起着关键的作用。 1.2图像数据压缩的可能性 (可行性 ) 经研究发现,与音频数据一样,图像数据中存在着大量的冗余,原因在于原始图像数据是高度相关的。通过去除那些冗余数据可nts 以节约文件所占的码字 从而极大地降低原始图像数据量,解决图像数据量巨大的问题,达到数据压缩的目的。 图像数据压缩技术就是研究如何利用图像数据的冗余性来减少图像数据量的方法。因此,进行图像压缩研究的起点是研究图像数据的冗余性。 ( 1)空间冗余。在静态图像中有一块表面颜色均匀的区域,在这个区域中所有点的光强和色彩以及色饱和度都相同,具有很大的空间冗余。这是由于基于离散像素采样的方法不能表示物体颜色之间的空间连贯性导致的。 ( 2)时间冗余。电视图像、动画等序列图片,当其中物体有位移时,后一帧的数据与前一帧的数据有许多共同的地方,如背景等位置不变,只有部分相邻帧改变的画面,显然是一种冗余,这种冗余称为时间冗余。 ( 3)结构冗余。在有些图像的纹理区,图像的像素值存在着明显的分布模式。例如,方格状的地板图案等,称此为结构冗余。如果已知分布模式,就可以通过某一过程生成图像。 ( 4)知识冗余。对于图像中重复出现的部分,我们可以构造出基本模型,并创建对应各种特征的图像库,进而使图像的存储只需要保存一些特征参数,从而可以大大减少数据量。知识冗余是nts 模型编码主要利用的特性。 ( 5)视觉冗余。事实表明,人的视觉系统对图像的敏感性是非均匀性和非线性的。在记录 原始的图像数据时,对人眼看不见或不能分辨的部分进行记录显然是不必要的。因此,大可利用人的视觉的非均匀性和非线性,降低视觉冗余。 ( 6)图像区域的相同性冗余。它是指在图像中的两个或多个区域所对应的所有像素值相同或相近,从而产生的数据重复性存储,这就是图像区域的相似性冗余。在以上的情况下,当记录了一个区域中各像素的颜色值,则与其相同或相近的其他区域就不需要记录其中各像素的值。采用向量量化( Vector quantization)方法就是针对这种冗余性的图像压缩编码方法。 随着对人的视觉系统和图像模型的进一 步研究,人们可能会发现图像中存在着更多的冗余性,使图像数据压缩编码的可能性越来越大,从而推动图像压缩技术的进一步发展。 允许图像有一定的失真也是图像可以压缩的一个重要原因,在许多应用场合,并不要求经过压缩后复原的图像和原始图像完全相同,而允许有少量的失真。只要这些失真并不被人眼所察觉,在许多情况下是完全可以接受的。这就个图像压缩提供了十分有利的条件。图像质量允许的失真越多,可以实现的压缩比就越大。nts 这种有失真的压缩编码称为限失真编码。 1.3图像压缩技术的发展和现状 1.3.1图像编码技术发展历史 1948 年 提出电视信号数字化后,图像压缩编码的研究工作就宣告开始了。在这项技术发展的早期,限于客观条件,仅对帧内预测法和亚取样内查复原法进行研究,对视觉特性也做了一些极为有限但可贵的研究工作。 1966 年 J.B.O Neal 对比分析了 DPCM和 PCM 并提出了用于电视的实验数据。 1969 年进行了线性预测编码的实际实验。 1969 年举行首届图像编码会议。 70 年代开始进行了帧间预测编码的研究。 80 年代开始对运动估值和模型编码进行研究。 进入 90 年代, ITU-T 和 ISO 制定了一系列图像编码国际建议,如 H.261、 JPEG、 MPEG-1、 H.262、 H.263、 MPEG-4 等。 变换编码是 1968 年 H.C.Andrews 等人提出的,采用的是二维离散傅立叶变换,此后相继出现用其他变换方法的变换编码,其中包括二维离散余弦变换。 nts 1.3.2图像编码技术的现状 经过几十年的发展,图像编码技术业已成熟,一些国际建议的制定极大地推动了图像编码技术的实现和产业化,从而推动图像编码技术以更快的速度发展,目前的研究方向有两个: 1.更好地实现现有的图像编码国际建议 研制出集成度更高、性能更好的图像编码专用芯片,使编码系统成本更低、可靠性更高。解决好现 有的图像编码系统开发中的技术问题。例如:提高图像质量、提高抗码能力等。 2.对图像编码理论和其他图像编码方法的研究 目前已经提出和正在进行研究的图像编码方法有:多分辨率编码、基于表面描述的编码、模型编码、利用人工神经网络的编码、利用分形几何的编码、利用数学形态学的编码等等。 1.4图像压缩的一般过程 信息无损图象压缩的根据是信息论中的信源编码理论,一般情况下,压缩效率表示为: 压缩效率 =( R/H) X 100 其中, H 表示信源熵, R 表示平均码字长度。图象压缩可表示为: nts 变换编码的一般模型可以表示为下图 所示: 映射变换的目的是通过映射改变图像数据的特性,使之更有利于压缩编码。这样做一般优于直接对原图进行量化编码,因为图像数据在相邻像素间有较大的相关性,不管原图明暗度如何,相邻像素灰度差总是分布在零附近,进一步的统计表明,差值信号的分布接近拉普拉斯分布,其标准差比原始图像的标准差要小的多,因而对它进行量化编码所需的比特数就较少。实际上,求差值的过程减少了相邻像素间的相关性,从而减少了冗余度,因此可以实现压缩。 在限失真编码中要对映射后的数据进行量化,若量化是对映射后的数据逐个地进行的,则称标量量化。若量 化是成组地进行的,在称为矢量量化。量化总会造成某些信息的丢失,形成失真,及量化失真或量化噪声。为使失真小,应量化的精细些,但如此则压缩比就高不了。这是一对矛盾,应选择恰当的量化级来缓解这对矛盾。量化器的引入是图像编码产生失真的根源。在要求复原图像和原图像完全一致的无失真编码器中必须不用量化器。 nts 编码器是用来消除符号编码冗余度的,它一般不产生失真。理想的情况是使编出的码流的平均码长等于量化后数据的信息熵。常用的编码方法有许多种,例如分组码:行程码( RLC)和变长码( VLC);不分组码:算术码( Arithmatic Coding) 。变长编码中最常用的是霍夫曼编码,基本原则是对出现概率大数值用短码来编,对出现概率小的数据用长码来编,从而使平均码长减小,降低码率。在实际应用中常把游程编码和霍夫曼编码结合起来,称为霍夫曼行程码。 以上三步之间相互制约,对变换编码,映射后数据量并没有减少,甚至因动态范围的加大而使数据量略有增加。但它为后续两步做好了准备,使它们能有效发挥作用。 1.5多媒体数据压缩方法的分类 多媒体数据压缩方法根据不同的依据可产生不同的分类。 第一种分类方法是根据解码后数据是否能够完全无丢失地恢复原始 数据,可分为两种: 1.无损压缩:也称为可逆压缩、无失真编码、熵编码等。 工作原理为去除或减少冗余值,但这些被去除或减少的冗余值可以在解压缩时重新插入到数据中以恢复原始数据。它大多使用在nts 对文本和数据的压缩上,压缩比较低,大致在 2:1 5:1 之间。典型算法有:哈夫曼编码、香农 -费诺编码、算术编码、游程编码和 Lenpel-Ziv 编码等。 2.有损压缩:也称不可逆压缩和熵压缩等。这种方法在压缩时减少了数据信息是不能恢复的。在语音、图像和动态视频的压缩中,经常采用这类方法。它对自然景物的彩色图像压缩,压缩比可达到几 十倍甚至上百倍。 第二种分类方法是按照压缩技术所采用的方法来分的,如下表所示: 表 1 图像数据编码算法分类 PCM 自适应式、固定式 多 媒 体 数 据 编 码 算 预 测 编码 自适应式、固定式( DPCM、 M) 混 合 编 码 变 换 编码 傅里叶、离散余弦、离散正统、哈尔、斜变换、沃尔 -哈达马、卡胡南 -劳夫( K-L)、小波 统 计 编码 (熵编码 ) 哈夫曼编码、算术编码、费诺编码、香农编码、游程编码( RLE)、 LZW nts 法 静 态 图像编码 方块、逐渐浮现、逐层内插、比特平面、抖动 其 他 编码 矢 量量化、子带编码、轮廓编码、二值图像 ( 1)预测编码( Predictive Coding, PC):这种编码器记录与传输的不是样本的真实值,而是真实值与预测值之差。对于语音,就是通过预测去除语音信号时间上的相关性;对于图像来讲,帧内的预测去除空间冗余、帧间预测去除时间上的冗余。预测值由预编码图像信号的过去信息决定。由于时间、空间相关性,真实值与预测值的差值变化范围远远小于真实值的变化范围,因而可以采用较少的位数来表示。另外,若利用人的视觉特性对差值进行非均匀量化,则可获得更高压缩比。 ( 2)变换编码( Transform Coding, TC):在变换编码中,由于对整幅图像进行变换的计算量太大,所以一般把原始图像分成许多个矩形区域,对子图像独立进行变换。变换编码的主要思想是利用图像块内像素值之间的相关性,把图像变换到一组新的“基”上,使得能量集中到少数几个变换系数上,通过存储这些系数而达到压缩的目的。采用离散余弦编码 DCT 变换消除相关性的效果nts 非常好,而且算法快速,被普遍接受。 ( 3)统计编码:最常用的统计编码是哈夫曼编码,出现频率大的符号用较少的位数表示,而出现频率小的符号则用较多位数表示,编码效率主要取决于 需要编码的符号出现的概率分布,越集中则压缩比越高。哈夫曼编码可以实现熵保持编码,所以是一种无损压缩技术,在语音和图像编码中常常和其他方法结合使用。 第 2章 图像压缩的理论基础 2.1图像压缩的理论基础 压缩编码的理论基础是信息论 。信息论的主要奠基人香农(C E Shannon)曾在他的论文中给出了信息的度量的公式,他把信息定义为熵的减少。 从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不确定的信息,去除确定的信息(可推知的),也就是用 一种更接近信息本质的描述来代替原有冗余的描述。这个本质的东西就是信息量 (即不确定因素 )。 所以,将香农的信息论观点运用到图像信息的压缩,所要解决的问题就是如何将图像信息压缩到最小,但仍携有足够信息以保证能复制出与原图近似的图像。 nts 2.1.1信息量、熵、冗余度 信息量 信息是用不确定性的量度定义的。一个消息的可能性越小,其信息越多;消息的可能性越大,其信息越少。在数学上,所传输的消息是其出现概率的单调下降函数。所谓信息量是指从N 个相等可能事件中选出一个事件所需要的信息度量或含量,也就 是在辨认 N 个事件中特定的一个事件的过程中所需要提问“ 是或否 ” 的最少次数。例如,要从 64 个数中选定某一个数,可以先提问 “ 是否大于 32” ,不论回答是或否都消去了半数的可能事件,这样继续部下去,只要提问 6 次这类问题,就能从64 个数中选定某一个数。这是因为每提问一次都会得到 1 比特的信息量。因此在 64 个数中选定某个数所需要的信息量是: lb64=6(b) 信息论把一个事件(字符 xi)所携带的信息量定义为: I(xi)=-log2P(xi) i=1,2,n 其 中 P(xi)为事件发生 (字符出现 )概率, I(xi)即信源 X 发出 xi时所携带的信息量。 信息量与数据量的关系:信息量 =数据量 -冗余度 信息熵 什么是熵 ? 数据压缩不仅起源于 20 世纪 40 年代由Claude Shannon 首创的信息论,而且其基本原理即信息究竟能nts 被压缩到多小,至今依然遵循信息论中的一条定理,这条定理借用了热力学中的名词 “ 熵 ”(Entropy) 来表示一条信息中真正需要编码的信息量: 考虑用 0 和 1 组成的二进制数码为含有 n 个符号的某条信息编码,假设符号 Fn 在整条信息中重复出现的概率为 Pn,则该符号的 熵也即表示该符号所需的位数位为: En=-log2(Pn) 整条信息的熵也即表示整条信息所需的位数为: E=En 举个例子,对下面这条只出现了 a、 b、 c 三个字符的字符串: Aabbaccbaa 字符串长度为 10,字符 a、 b、 c 分别出现了 5、 3、 2次,则 a、b、 c 在信息中出现的概率分别为 0.5、 0.3、 0.2,他们的熵分别为: Ea=-log2(0.5)=1 Eb=-log2(0.3)=1.737 Ec=-log2(0.2)=2.322 整条信息的熵也即表达整个字符串需要的位数为: E=Ea*5+Eb*3+Ec*2=14.855 位 如果用计算机中常用的 ASCII 编码,表示上面的字符串我们需要nts 整整 80 位 ,由此我们可以看出 信息为什么能被压缩而不丢失原有的信息内容。简单地讲,用较少的位数表示较频繁出现的符号,这就是数据压缩的基本准则。 信源 X 发出的 xi( i=1,2,n ),共 n个随机事件的自信息统计平均(求数学期望),即 H(X)=EI(xi) =nixiP1)( I(xi) =-nixiP1)( log2P(xi) H(X)在信息论中称为信源 X 的熵 (Entropy),它的含义是信源 X发出任一个随机变量的平均信息量。熵的大小与信源的概率模型有着密切的关系。 冗余度 冗余是指信息所具有的各种性质中多余的无用空间,其多余的程度叫做 “ 冗余度 ” ,一般而言图像和语音的数据冗余度很大。下式表示了信息量、数据量和冗余量之间的关系 I=D-du 式中 I 代表信息量, D表示数据量 du 是冗余量、冗余量 du包含在 D 中,冗余量 du 应在数据进行存储和传输之前去掉。 播音员的播音语速一般为每分钟 180字,由于计算 机中用两个字nts 节表示一个汉字,因此,播音员一分钟阅读的汉字共占用 360 个字节。为了把播音员的声音数字化,需要以高出播音员声音频率一倍的频率进行采样。这就是说,一般播音员的播音频率为 4KHz,采样频率即为 8KHz。当采用 8bit的采样精度进行采样时,得到的一秒钟数字音频信号的数据量为: 8KHz 8bit 64kb/s 则一分钟的数据量为: 64kb/s 60s/min=3840kb/min 比较一下,播音员一分钟阅读的汉字共占用 360 个字节,折合0.36KB,两者的数据量相差几百余倍,可见数据冗余现象的严重。 2.1.2香农定理 无失真编码定理 在无干扰的情况下,存在一种无失真编码方法,使编码的平均长度 xL 与信源熵 xH 任意地接近,即无失真编码的平均码长存在一个下限。 编码效率: xL xH, 冗余度: xL xHxLr 1, 比特率: 存储一个像素平均需要的比特数, 压缩比: dnnC ,其中 n 为原始图像的平均比特率,压缩编码nts 后降低 为dn。由上述定理,dn不可能比 xH 小,故无失真编码可以达到的最大压缩比为 xHnC /max ,此式也称为无失真编码条件。 2.1.3无 真函数理论 由仙农的无干扰编码理论可知,无失真编码的平均码长存在一个下限,由于这个下限通常比较接近自然码长,因此无失真编码的压缩比不可能很高。若能允许编码有少量的失真,则压缩比可大幅提高,失真一般是由量化造成的。例如,把原 图像的 256级灰度降为 16 级、 32 级、或 64 级,则总的量化级数减少了,编码所需的比特数自然也少了。但另一方面引入了失真,带来量化噪声。显然,量化级数愈少,压缩比愈大,失真也愈大。因此需要根据实际应用的要求,在编码的质量和压缩比之间作出选择。 在 无 失真编码中,一个自然的问题是,如果允许失真不超过某个值 D,这时的压缩比有没有一个上限,或者说为传输一个“符号”所需的平均比特数至少是多少?有一种观点认为,可以把量化器看成是一个有噪信道,并根据信息论中的有关信息在有噪信道中传输的一些结论来推导出平均传输一个符号至少需 要的比特数。信息论表明,传输信道容量至少达到某个下限时,才能以nts 小于 D 的失真传输信息。那么类似地,可以推导出在编码时平均每个符号至少用多少个比特编码才能使编码造成的失真小于预定的 D。 根据这种观点,率失真理论中的率失真函数实际上就是所求的比特率下限,也就是说,压缩比存在上限。根据率失真理论,若函数 R( D)存在,信道容量不小于 R( D),即可以传输信息,而且使失真小于或等于 D,这个函数就称为率失真函数。它指出了在给定失真下,信道编码所能达到的比特率的下限。 D 是允许的失真,可以用均方误差,也可以用其他标准度量。R( D)便是在允许失真 D 下信源编码所需的最小平均信息量,也可以认为是比特率。下图是一个离散信源率失真函数的示意图。可以看到,当 D=0,即无失真编码时,需要的比特数为 R( 0),随着允许的失真 D 逐渐加大,所需的比特数下降,并可证明此曲线是下凸的。一般 Dmax 等于信号方差 2 。当 D Dmax ,即允许的失真超过了输入信号的方差后,此时传输数据已失去意义,不需要对信道有什么要求了, R(D)=0. nts 2.2 图像系统的性能评估 2.2.1主观评价 图像的最终接收 者是人,因此,根据人的主观感觉对图像的优劣作出评定是重要的,也是目前国际上普遍采用的方法。主观评价的观察者可以分为两类,一类是未受过训练的,对图像质量评价并不在行的一般观众,这时得到的图像质量代表一般观众的平均感觉。另一类是专业人员,对图像质量评价有丰富的经验,是训练有素的内行,他们能够对图像质量提出严格的判断,能注意到图像某些细小的降质。 主观评价大体可以分为两类:绝对评价和相对评价。在绝对评价中,观察者根据一些实现规定好的评价尺度或自己的经验,对被评价图像作出质量判断。绝对评价常用的评价尺度是“全优度尺 度”,对图像的优劣一数字给分。如: nts 非常好的图像 5 分 好的图像 4 分 中等的图像 3 分 差的图像 2 分 非常差的图像 1 分 在相对评价中,由观察者将一批图像有好到坏进行分类,对图像进行互相比较后评出分数。相对评价常用“群优尺度”。如 一批中最好的图像 7 分 好于该批平均水平的图像 6 分 稍好于该批平均水平的图像 5 分 该批平均水平的图像 4 分 稍次于该批平均水平的图像 3 分 次于该批平均水平的图像 2 分 一批中最差的图像 1 分 评价的最终结果由一定熟练量的观察者给出的分数的平均值给出。 2.2.2客观评价 客观评价的标准可以计算,并且有好多种。尽管人们希望它nts 能和主观评价尽量一致,但目前还没有找到一种合乎主观评价的逼真公式。 归一化均方差 NMSE m nm nnmfnmfnmf22, 其中, nmf , 是原始图像, nmf , 表示复原图像。 修正的均方差 设 nmfKKKnmg ,lg,321 ,则 m nm nnmgnmgnmg22, 均方超阈值量化误差( MSTE) dxxpxTyxUxTyxM S TEiNixixi i *11 22 其中,iyx代表以iy代替 1, ii xxx的误差。 xp 为 x 出现 的概率;可以把黑白数字图像看作一个矩阵,其行和列的交点标识为图像中的一个点,相应的矩阵单元则表示该点的灰色梯度。这种数字陈列的单元称为图像单元或象素。数字转化视频就是由这样的一连串单元组成的。对于彩色图像来说,每个象素由红( R)、绿( G)和蓝( B)三种颜色表示。可以将彩色图像看作是对应于三个成nts 分的三个矩阵。各个矩阵都可以用与黑白图像相同的方法进行编码。图像压缩可以分成两种类型:无失真的压缩和有失真的压缩。前者即能够精确地生成原始图像;后者则有某些不太容易引起注意的失真。因为数据的压缩都可以看成是一种变换,所 以解压缩(数据恢复)被看作是一种反变换。实现变换的方法称为编码技术。 图像压缩技术指标主要有三个:( 1)图像压缩比,指压缩前后所需的图像存储量之比;( 2)实现压缩的算法难易程度或速度;( 3)重现精度,指重现时的图像与原图像相比较有多少失真。第三个指标涉及到人们的主观判断,可以区分两幅图像的优劣,在多数场合下,则还需要有其它的客观指标来区分。 结论 图像文件都有数据海量的特性,例如,一副尺寸为 512x512的 24位 BMP文件要占用 786486个字节才能在计算机中存储,这对许多需要大量存储食品数据的领域会造成 很大的不便,如办公自动化、医学图像、卫星遥感、传真、数字图像传输、电视会议、可视电话、高清晰电视等。因而快速的图像压缩算法及解压缩算法对此等以图像数据为基础的应用领域有非常重要的意义。 nts 图像压缩技术是建立在发掘图像信息冗余度的基础上的。信息中数据冗余的现象比较普遍,数据冗余的种类也不尽相同。归纳起来,一般有以下几种: 1.空间冗余 2.时间冗余 3.信息熵冗余 4.结构冗余 5.知识冗余 6.视觉冗余 7.其他冗余 nts 利用正交变换,如离散余弦变换、卡胡南 -拉夫变换、沃尔什 -哈达玛变换等,将图像 的能量集中在少数变换系数中,对这些参数进行编码,可得到高压缩比的压缩数据。从本质上讲,图像经过正交变换后之所以能实现数据压缩,是因为经过多维坐标系适当的旋转变换后,把散布在各个原坐标轴上的原始图像数据集中到新坐标系中的少数坐标轴上了,从而为后继的量化和编码提供了高效数据压缩的可能性。在变换编码中,由于对整幅图像进行变换的计算量太大,所以一般把原始图像分成许多个矩形区域,对子图像独立进行变换。采用离散余弦编码 DCT变换消除相关性的效果非常好,而且算法快速,被普遍接受。 本文以离散余弦变换问研究对象,重点是正反 变换的实现。 DCT 算法的实质是:压缩图像块灰度样本数据流。压缩编码过程和解码过程见下图: 单纯的进行 DCT是不能实现数据量的压缩的,对于一个 8x8 的样本块而言,有 64 个系数,不论怎么变换最后还是有 64个系数,变换的目的是利用图像块内像素值之间的相关性,把图像变换到一组新的“基”上,使得能量集中到少数几个变换系数上,通过存储这些系数而达到压缩的目的,所以在变换后要对变换的nts 结果进行必要的编码才能实现数据的压缩,变换只是为实现压缩而进行的必要的预处理。 DCT 可分为一维离散余弦变换、二维离散余弦变换、借 助傅里叶变换( FFT)实现离散余弦变换、二维快速离散余弦变换等。 基于 DCT数据压缩其实是有失真的压缩,原因在于,在熵编码之前要对变换结果的系数进行量化处理,量化处理是使数据比特率下降的一个强有力的措施。量化输入值的动态范围很大,需要以多的比特数表示一个数值,量化输出只能取有限个整数,称作量化级,一般希望量化后的数值用较少的比特数就可以表示。每个量化输入被强行归一到与其接近的某个输出,即量化到某个级。量化处理总是把一批输入量化到一个输出级上,所以量化处理是一个多对一的处理过程,一般是个不可逆过程,量化处理中有信息丢失,即会引起量化误差或量化噪声。 通常设计量化器有下述两种情况: ( 1)给定量化分层级数,满足量化误差最小。 ( 2)限定量化误差,确定分层级数,满足用尽量小的平均比特数表示量化输出的要求。显然,这是一对相互矛盾的要求,设计量化器只能折衷处理。量化后的熵编码本系统采用的是霍夫曼nts 编码, 存在问题: 由于量化的粗糙,会产生如下的图像缺陷: 1. 块效应 量化噪声分散在图象域整个“块”之内,由于不同的“块”分别处理,迭加了不同的量化噪声,在“块”的边界处将出现不连续,即所谓的“块效应” 2. 振铃效应 是 由于对 DCT块内高频系数的粗糙量化而带来的,当量化粗糙时,高频系数可能被量化为 0,在频域内形成了锐截止,在反变换后,量化误差在图象的强边缘附近就形成了振铃现象,也就是我们常说的“吉不斯现象” 3. 清晰度下降 清晰度下降也是由于在低码率下高频分量的损失而产生的,然而中等程度的模糊人眼一般觉察不出来,随着观察距离的增加,模糊效应逐渐下降。 参考文献 1 吴乐南编著 .数据压缩 .北京 :电子工业出版社 , 2000:1-27 2 黄贤武 ,王加俊 ,李家华编著 .数字图像处理与压缩编码技术 .成都电子科技大学出版社 ,2002,(18):360-366 3 崔屹 .图像处理与分析 数学形态学方法及应用 .北京 :科学出版社 ,2000:15-29 nts 4 崔屹 .数字图象处理技术与应用 .北京:电子工业出版社, 1996: 7-29 5 余松 张文军 孙军 .现代图象信息压缩技术 .北京:科学出版社, 1998 6 崔屹 .数据结构与 C语言程序设计 .北京希望电脑公司, 1991 7 毕厚杰等 . 图象通信工程 .人民邮电出版社, 1995 8 董绍平 . 数字信号处理基础 .哈尔滨工业大学出版社, 1990 9 林国辉 祝宇鸿 张晓颖 . 去除 DCT压缩图象缺陷的后处理 . 致谢 经过为期一个学期的不懈努力,终于成功的完成了毕业设计的全部内容,让我的大学生活成功的画上一个圆满的句号。在此,我相所有关心和帮助我的老师和同学致以最真诚的谢意! 本次毕业设计主要是在我的导师的认真指导下进行的。在此,衷心感谢他长期以来对我的学习和生活的关心、指导和帮助。他和我们年龄相仿,所以相处融洽。另外,他才华横溢,我非常的敬佩,在将来的学习和生活中,他将是我学习的榜样。 在此即将毕业之际,我衷心的感谢全体老师在这四年里对我学习和生活中的关怀 与帮助 ! 衷心的感谢我的舍友们,你们给予了我大力帮助! nts 本科毕业设计(论文) 开题报告 课题名称:基于 DCT 的图象 压缩算法的研究 课题来源: 图像压缩 课题范围:数字信号处理 nts一、综述本课题国内外研究动态,说明选题的依据和意义 图像是一类重要的多媒体数据,人们获取的信息的 70%来自视
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
提示  人人文库网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:tx080DCT的图像压缩算法的研究
链接地址:https://www.renrendoc.com/p-516501.html

官方联系方式

2:不支持迅雷下载,请使用浏览器下载   
3:不支持QQ浏览器下载,请用其他浏览器   
4:下载后的文档和图纸-无水印   
5:文档经过压缩,下载后原文更清晰   
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

网站客服QQ:2881952447     

copyright@ 2020-2025  renrendoc.com 人人文库版权所有   联系电话:400-852-1180

备案号:蜀ICP备2022000484号-2       经营许可证: 川B2-20220663       公网安备川公网安备: 51019002004831号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知人人文库网,我们立即给予删除!