




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、学士学位论文 大学本科生毕业设计(论文)基于DCT的图像压缩及MATLAB实现学院(系): 专业班级: 学生姓名: 指导教师: 学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包括任何其他个人或集体已经发表或撰写的成果作品。本人完全意识到本声明的法律后果由本人承担。作者签名: 年 月 日学位论文版权使用授权书本学位论文作者完全了解学校有关保障、使用学位论文的规定,同意学校保留并向有关学位论文管理部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权省级优秀学士论文评选机构将本学位论文的全部或部分
2、内容编入有关数据进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1、保密囗,在 年解密后适用本授权书2、不保密囗 。(请在以上相应方框内打“”)作者签名: 年 月 日导师签名: 年 月 日本科生毕业设计(论文)任务书学生姓名: 专业班级: 指导教师: 工作单位: 设计(论文)题目: 基于DCT的图像压缩及MATLAB实现 设计(论文)主要内容:论文阐述DCT(离散余弦变换)的图像压缩基本理论,以及用MATLAB实现DCT的图像压缩方法。重点讨论基于DCT图像压缩的方法,并在MATLAB环境下进行仿真实验,与其他图像压缩方法进行比较,总结其优缺点以及基于DCT的图
3、像压缩技术的现实意义。要求完成的主要任务:1掌握图像压缩的基本原理;2掌握DCT基本原理;3分析基于DCT的图像压缩编码理论;4在MATLAB环境下,对基于DCT图像压缩进行仿真实验;5总结基于DCT的图像压缩技术的现实意义;6要求阅读相关的参考文献不少于15篇,其中英文文献不少于3篇,翻译与选题相关的英文参考文献不少于2万印刷符;7按照学校的论文撰写规范,正确、按时的完成论文。必读参考资料:1数字图像处理(第二版),冈萨雷斯著,阮秋琦译,电子工业出版社2数字图像处理与压缩编码技术,黄贤武、王加俊、李宗华著,电子科技大学出版社3MATLAB及在电子信息课程中的应用(第3版),陈怀琛、吴大正、高
4、西全著,电子工业出版社指导教师签名: 系主任签名: 院长签名(章) 本科生毕业设计(论文)开题报告1、目的及意义(含国内外的研究现状分析)每天都有大量的信息用数字进行存储、处理和传送。这些每日往来的信息给我们带来了便利和安逸。因为网上的许多信息是以图像形式存储的,所以对于存储和通信的需求是无限的。而数据压缩方法比起数据的存储和/或传输具有更为突出的实用价值和商业意义。在信息世界迅猛发展的今天,人们对计算机实时处理图像信息的要求越来越高。如何在保证图像质量的前提下,同时兼顾实时性和高效性成了一个值得关注的问题。对图像进行一定的压缩处理成为了一个不可或缺的环节。图像压缩所解决的问题是尽量减少表示数
5、字图像时需要的数据量。减少数据量的基本原理是除去其中多余的数据。以数学的观点来看,这一过程实际上就是将二维像素阵列变换为一个在统计上无关联的数据集合。这种变换在图像存储或传输之前进行。在以后的某个时候,再对压缩图像进行解压缩来重构原图像或原图像的近似图像。人们对图像压缩开始感兴趣可以追溯到35年前。最初在这一领域研究的焦点集中在建立一种模拟的方法以便减少视频传输所需的带宽。这一过程称为带宽压缩。数字式计算机的出现和后来先进的集成电路的发展,导致了这方面研究的重点从模拟方式转移到数字压缩方法上来。随着最近几种关键性的国际图像压缩标准的正式采用,这一领域在理论研究的实际应用方面有了重大的发展,这是
6、自20世纪40年代C.E.Shannon和其他人首先提出信息的概率观点与信息的表达,传输和压缩以来又一重要的发展阶段。当前,图像压缩被认为是一种“开放技术”。由于现代图像传感器不断提高空间分辨率以及电视广播标准的不断发展,图像压缩也成为一种基本技术。再有,数据压缩在许多重要且性质不同的应用领域中扮演着主要角色,比如,电视会议、遥感(使用卫星成像进行天气预报和其他地球和其他地球资源应用)、记录文献和医疗成像、传真(FAX)、军事上的远程遥控车辆驾驶、空间中的及危险废弃物管理等方面。图像压缩比较常用的变换有离散傅里叶变换(DFT)、Walsh-Hadamard变换(WHT)、离散余弦变换(DCT)
7、和Karhunen-Loève变换(KLT)。图像压缩中最常用到的一种变换是离散余弦变换。DCT的信息压缩能力比DFT和WHT的能力要强。尽管大多数自然图像通常都有这样的条件,但在数据压缩方面最佳的变换方法是KLT而不是DCT。KLT对任何输入图像和以任何数量保留下来的系数,都可以将均方误差降至最低。然而,由于KLT具有数据依赖性,所以通常得到每幅子图的KLT基础图像所需的计算任务繁重。由于这个原因,KLT很少在实际的图像压缩中应用。反而像DFT,WHT或DCT这样的具有固定(有输入独立性)基础图像的变换方法的使用较为常见。对可能输入的独立变换,非正弦变换(如WHT变换)是最容易实现
8、的。而正弦变换(如DFT或DCT)的信息压缩能力更接近最佳KLT变换方法的能力。因此,许多变换编码系统都是以DCT变换为基础的,这种变换方法在信息压缩能力和计算复杂性之间提供了一种很的平衡。实际上,DCT的性质已经提供了作为一种变换编码系统的国际标准所具有的实际价值。对比其他输入独立的变换方法,DCT变换具有使用单一的集成电路就可以实现,可以将最多的信息包装在最少的系数之中,以及能使被称为“分块噪声”的块效应最小等优点。本文选择离散余弦变换(DCT)作为图像压缩的压缩方法进行分析研究具有理论价值和现实意义。2、基本内容和技术方案本文是基于离散余弦变换的图像压缩技术的研究,讲述DCT算法下的图像
9、压缩理论及在MATLAB下的实现,重点讲述DCT算法下的图像压缩。基本内容:先说明图像压缩的必要性以及为什么选择DCT算法做图像压缩;接着介绍图像压缩的基本原理以及说明图像压缩的系统模型;然后介绍DCT算法的基本原理及DCT系数的量化,其中DCT算法的原理包括一维DCT、二维DCT以及一维快速DCT;然后在理论的基础上,运用MATLAB软件对DCT算法的图像压缩进行仿真实现,并将仿真结果和理论分析结果进行对比;最后将DCT算法和其他的几种用于图像压缩的算法相比较,总结DCT的优点和缺点。技术方案:1)掌握图像压缩的基本原理及图像压缩的系统结构;2)掌握离散余弦变换的基础知识以及离散余弦变换算法
10、的理论实现;3)掌握离散余弦变换用于图像压缩的基本原理;4)在MATLAB环境下,对算法进行仿真实现;5)和其他的图像压缩方法相比,总结算法的优点和不足之处。3、进度安排第1-3周完成开题报告第4-6周查阅有关数字图像处理,离散余弦变换的相关文献第7-12周学习图像压缩的基本方法,重点掌握基于离散余弦变换的图像压缩方法,系统地学习使用MATLAB软件并进行编程第13-14周撰写论文第15-16周 准备答辩4、指导教师意见 指导教师签名: 年 月 日 目 录摘 要IAbstractII1 绪论11.1 图像压缩的必要性11.2离散傅里叶变换(DFT)与离散余弦变换(DCT)的比较22 图像压缩的
11、基本原理32.1 图像压缩的基本思想32.2 图像压缩的基本原理模型33 DCT编码算法63.1 一维DCT63.2 二维DCT83.3 一维DCT快速算法94 DCT系数的量化165 MATLAB实现185.1 MATLAB语言的特点185.2 MATLAB的功能185.3 离散余弦变换的MATLAB实现196 图像压缩中DCT算法和其他算法的比较236.1 KLT和DCT两种算法的比较236.2 小波变换和DCT两种算法的比较246.3 算法比较总结257 利用DCT进行图像压缩的优缺点26小 结27参考文献28致 谢29摘 要本文对DCT的算法原理进行了分析,利用二维DCT对图像进行压缩
12、,并使用MATLAB软件进行压缩过程的仿真,之后将DCT和其他的压缩算法进行比较,总结其优缺点,所得结果具有重要的理论价值和现实意义。论文主要研究了DCT的算法以及图像压缩的几种算法之间的比较。其中,DCT算法又分别对一维DCT、二维DCT、以及一维DCT的快速算法进行了研究。研究结果表明:DCT算法虽然已经问世30多年,但对变换信号的“紧凑有效性和独立于信号本身的变换以及变换后的系数游程编码”独具优势,且基于DCT编码具有多分辨率图像的特性,其计算也较简洁,事实证明,DCT变换具有很强的生命力,在未来的图像压缩中必将还能发挥重要的作用。本文的特色在于:本文不仅对利用DCT算法进行图像压缩的理
13、论分析,在分析了算法的原理之后,还运用MATLAB进行仿真,并分析了为什么选用DCT而不选用其他的压缩算法。此外,每个算法都不是完美的,本文还总结了DCT在进行图像压缩过程中的一些缺点,并简单地给出一些解决方法。关键词:图像压缩;DCT;快速算法;MATLAB;KLT;小波变换AbstractIn this paper, the DCT algorithm principle of the analysis, using two-dimensional images of the DCT compression, and use the MATLAB software compression
14、process simulation, will be followed by the DCT and other compression algorithms to compare, summarize its advantages and disadvantages, the findings have important Theoretical value and practical significance. DCT on the main thesis of image compression algorithm and the comparison between the seve
15、ral algorithms. One, DCT algorithm separately on the one-dimensional DCT, two-dimensional DCT, and the one-dimensional DCT fast algorithm was studied. The results show that: DCT Although the algorithm has been available for more than 30 years, but the signal to transform the "effective and inde
16、pendent of the compact itself signals a change and transform the coefficient of run-length coding" unique advantages, and based on the DCT encoding a multi-resolution image of , The calculation is more concise, facts have proven that, DCT transform a strong vitality in the next image compressio
17、n will also play an important role. In this paper, the characteristics of: This article not only for the use of image compression algorithm DCT the theoretical analysis, the analysis of the principle of the algorithm, also use MATLAB simulation, and analysis of why it has chosen not choose other DCT
18、 compression algorithm. In addition, each algorithm is not perfect, the paper also summed up the DCT image compression process in a number of shortcomings and to give some simple solutions.Key Words: Image compression;DCT;Fast Algorithm;MATLAB;KLT;Walsh-Hadamard transformII1 绪论20世纪90年代世界信息化的发展一日千里,信
19、息化建设取得引人瞩目的成绩。信息科学与技术的进步促进了人类社会的持续发展,提高了人类的生活质量,改变了人类生产方式,“缩短了地球各地间的距离”。展望21世纪,信息化发展必将以更快的速度发展。要求信息系统现代化是信息社会发展的必然结果。21世纪信息系统必将以数字化、大信息量、交互化、高度融合化、多媒体化步入人类社会。要使信息得到及时的利用,为国民经济和科学技术以及国防工业的发展服务,必须要对信息数据的获取、加工处理、传输、存储、决策和执行等进行高新技术的革新,以适应社会发展形势的需求。作为信息获取和交流的最主要载体图像,如果没有新的理论和技术进行处理,它势必成为制约21世纪信息高速公路、多媒体技
20、术的发展的瓶颈,甚至成为制约社会发展的主要因素。因此,要创造推动信息科学技术的发展而探索其新理论、新方法,为这些理论和方法不遗余力地去宣传和介绍,去试验和实现,去普及和发展。1.1 图像压缩的必要性人类获取到的信息其80%来源于图像媒体,15%来源于语音。这说明图像是人们生活中信息交流最为重要的载体,也是蕴含信息量最大的媒体。正因为这一点,图像也给人们的信息交流(传输)、信息的保留(存储)带来很大的困难,特别是数字化地球的今天和未来,这一问题尤为突出;但是,由于信息社会的到来,人类追求高质量的信息通信,采用数字化信息是必经之路。这是因为数字化信息具有如下特点:(1)易交换,畅通无阻,无处不达;
21、(2)高容量,以惊人的传输速度满足人们的信息需求;(3)高分辨率,信息质量优;(4)高稳定性,传输途中不易受干扰,能原原本本地还它本来的面目等。图像数字化后计算机面临的最大难题之一就是海量的数据的存储与传送问题。在所有可能的数据中,图像是数据量最大的数据类。那么,电视图像的数据量究竟有多大呢?以一般彩色的电视信号为例,设代表光强、色彩和色饱和度的YIQ色空间中各分量的带宽分别为4.2MHz、1.5 MHz和0.5 MHz。按Nyquist(奈奎斯特)采样定理的要求,仅当采样频率不小于2倍原始信号的频率时,才能保证采样后信号无失真地恢复原始信号。再假设各分量的采样值按8bit量化,那么1s的电视
22、信号的数据量为也就是说,彩色电视信号的数据量约为100,因而一个6.4GB(6.4×1000M×8b51200Mb)的硬盘存储器仅能存储8.5min的电视信号。如果是高分辨率电视信号(HDTV)其数据量则更庞大。另外若将电视信号在现有的网络上传输,其信道带宽是无法容忍的。具体参数见表 1。表 1 图像信息与信道带宽图像信号信道带宽原码率高品质电视HDTV140 Mb/s1.2 Gb/s一般HDTV60140 Mb/s600 Mb/s 广播电视演播室3045 Mb/s216 Mb/s 广播电视节目播送2030 Mb/s216 Mb/s 有线电视、光盘1.520 Mb/s 50
23、100 Mb/s 双向电视会议384 Kb/s2 Mb/s 50100 Mb/s 可视电话9.664 Kb/s1020 Mb/s 显然地,电视信号数字化后,其数据保存的容量的传输的带宽是难以令人接受的,因此必须对数字图像数据进行压缩。1.2 DCT的研究目的和意义现今社会,每天都有大量的信息用数字进行存储、处理和传送。这些每日往来的信息给我们带来了便利和安逸。因为网上的许多信息是以图像形式存储的,所以对于存储和通信的需求是无限的。而数据压缩方法比起数据的存储和/或传输具有更为突出的实用价值和商业意义。在信息世界迅猛发展的今天,人们对计算机实时处理图像信息的要求越来越高。如何在保证图像质量的前提
24、下,同时兼顾实时性和高效性成了一个值得关注的问题。对图像进行一定的压缩处理成为了一个不可或缺的环节。图像压缩所解决的问题是尽量减少表示数字图像时需要的数据量。减少数据量的基本原理是除去其中多余的数据。以数学的观点来看,这一过程实际上就是将二维像素阵列变换为一个在统计上无关联的数据集合。这种变换在图像存储或传输之前进行。在以后的某个时候,再对压缩图像进行解压缩来重构原图像或原图像的近似图像。当前,图像压缩被认为是一种“开放技术”。由于现代图像传感器不断提高空间分辨率以及电视广播标准的不断发展,图像压缩也成为一种基本技术。再有,数据压缩在许多重要且性质不同的应用领域中扮演着主要角色,比如,电视会议
25、、遥感(使用卫星成像进行天气预报和其他地球和其他地球资源应用)、记录文献和医疗成像、传真(FAX)、军事上的远程遥控车辆驾驶、空间中的及危险废弃物管理等方面。图像压缩比较常用的变换有离散傅里叶变换(DFT)、Walsh-Hadamard变换(WHT,及小波变换)、离散余弦变换(DCT)和Karhunen-Loève变换(KLT)。图像压缩中最常用到的一种变换是离散余弦变换。DCT的信息压缩能力比DFT和WHT的能力要强。尽管大多数自然图像通常都有这样的条件,但在数据压缩方面最佳的变换方法是KLT而不是DCT。KLT对任何输入图像和以任何数量保留下来的系数,都可以将均方误差降至最低。然
26、而,由于KLT具有数据依赖性,所以通常得到每幅子图的KLT基础图像所需的计算任务繁重。由于这个原因,KLT很少在实际的图像压缩中应用。反而像DFT,WHT或DCT这样的具有固定(有输入独立性)基础图像的变换方法的使用较为常见。对可能输入的独立变换,非正弦变换(如WHT变换)是最容易实现的。而正弦变换(如DFT或DCT)的信息压缩能力更接近最佳KLT变换方法的能力。因此,许多变换编码系统都是以DCT变换为基础的,这种变换方法在信息压缩能力和计算复杂性之间提供了一种很的平衡。实际上,DCT的性质已经提供了作为一种变换编码系统的国际标准所具有的实际价值。对比其他输入独立的变换方法,DCT变换具有使用
27、单一的集成电路就可以实现,可以将最多的信息包装在最少的系数之中,以及能使被称为“分块噪声”的块效应最小等优点。本文选择离散余弦变换(DCT)作为图像压缩的压缩方法进行分析研究具有理论价值和现实意义。1.3 DCT的发展现状1974年由Ahmed和Rao提出的离散余弦变换,至今已有30多年历史。最初在这一领域研究的焦点集中在建立一种模拟的方法以便减少视频传输所需的带宽。这一过程称为带宽压缩。数字式计算机的出现和后来先进的集成电路的发展,导致了这方面研究的重点从模拟方式转移到数字压缩方法上来。随着最近几种关键性的国际图像压缩标准的正式采用,这一领域在理论研究的实际应用方面有了重大的发展,这是自20
28、世纪40年代C.E.Shannon和其他人首先提出信息的概率观点与信息的表达,传输和压缩以来又一重要的发展阶段。此间,DCT编码已发展成为JPEG、MPEG、H.26x等图像/视频编码标准中的核心。尽管Shapiro的EZW以及Said等人的SPIHT小波编码的成功应用,对传统的DCT编码提出了挑战,但Xiong等人利用嵌入式DCT块变换之间的直流相关性,以及对DCT后的系数进行策略性重组或层式DCT同样具有小波多分辨率图像的分解特性。此外,基于层次嵌入式DCT、形状自适应DCT、截短DCT、感兴趣区域支撑DCT以及形态DCT等改进形式的编码,都是将基于DCT变换编码推向更高层次。就DCT改进
29、的变换,以及DCT系数的应用,如利用DCT系数实现信息隐藏等,也使得基于常规的DCT变换编码有了更广阔的应用与发展空间,文章就此作了广泛的比较和深入的研究,并指出了发展方向。因此,要对图像进行压缩,选用DCT而不用DFT。32 图像压缩的基本原理图像压缩的目的在于用最少的数据量来表示尽可能多的原图像的信息。对于图像而言,如果需要进行快速或实时传输以及大量存储,就需要对图像进行数据压缩。在同等的信息容量下,若将图像数据压缩之后再传输,就可以传输更多的图像信息,就可以增加通信的能力。2.1 图像压缩的基本思想图像压缩的基本思想就是要想办法除去图像中数据之间存在的相关性。所谓相关性,就是能够根据给出
30、的一部分数据来判断出其相邻的数据。图像压缩就是把图像数据中能根据其他数据推算得到的数据去掉。现在的图像压缩技术一般基于以下两点:(1)图像信息存在很大的冗余度,数据之间存在着相关性,如相邻像素之间色彩基本相同。(2)人的视觉对于边缘急剧变化不敏感,人眼具有对图像的高度敏感性高、对色彩敏感性低的特点。图像压缩主要就是根据这两点特征进行的,由此发展出图像压缩的两类基本方法:无损压缩和有损压缩。无损压缩是将相同的或相似的数据或数据特征归类,使用较少的数据量描述原始数据,达到减少数据量的目的;有损压缩是利用人眼的视觉特性有针对性地简化不重要的数据,以减少总的数据量。其中,有损压缩只要损失的数据不太影响
31、人眼主观接收的效果,就可以采用。图像的主要参数之一是图像压缩比,定义为压缩后的图像数据量与压缩前的图像数据量之比:显然,压缩比越小,压缩后的图像文件数据量越小,图像质量有可能损失越多。但压缩比并不是一个绝对 的指标,压缩的效果还与压缩前的图像效果及压缩的方法有关。图像数据总是存在各种信息的冗余,如空间冗余、信息冗余、视觉冗余和结构冗余等。压缩就是去掉各种冗余,保留有用的信息。图像压缩的过程通常称为编码,在信息论中属信源编码,图像恢复的过程通常称为解码。2.2 图像压缩的基本原理模型一般的图像压缩系统模型如图 2.1所示。信源解码器编码器 信源编码信道编码信道信道解码信源解码用户图 2.1 一般
32、图像压缩系统模型一个图像压缩系统包括两个不同的结构块:一个编码器和一个解码器。信源图像输入到编码器中。这个编码器可以根据输入数据生成一组符号。在通过信道进行传输之后,将经过编码的表达符号送入解码器,经过重构后,就生成了输出图像。一般来讲,可能是也可能不是原图像的准确复制品。如果输出图像是输入的准确复制,系统就是无误差的或具有信息保持编码的系统;如果不是,则在重建图像中就会呈现某种程度的失真。图 2.1中显示的编码器和解码器都包含两个彼此相关的函数或子块。编码器由一个信源编码器和一个信道编码器构成。其中,通过信源编码解决有效性问题,也就是对信源实现压缩处理,使处理后的信号更适合数字通信系统,解决
33、有效性问题就是在编码过程中尽量提高编码效率,也就是力求用最少的数码传递最大的信息量,这实质上是压缩频带的问题。通过信道编码解决可靠性问题,它用于增强信源编码器输出的噪声抗扰性,也就是尽量使处理过的信息在传输中不出错或少出错。与之相应地,一个解码器包括一个信道解码器和一个信源解码器。如果编码器和解码器之间的停产是无噪声的或趋向于无误差,刚信道编码器和信道解码器可以略去,而一般的编码器和解码器分别是信源编码器和信源解码器。2.2.1 信源编码器和信源解码器信源编码器的任务是减少或消除输入图像中的编码冗余、像素冗余或心理视觉冗余。特定的应用和与之相联系的保真度要求规定了在给定情况下使用的最佳编码方法
34、。通常,这种方法可以通过一系列三种独立的操作建立模型。如图 2.2(a)所示,每种操作被设计用于减少上述三种冗余中的一种。图 2.2(b)描述了对应的信源解码器。(a)信源编码器转换器量化器符号编码器信道(b)信源解码器反向转换器信道符号解码器图 2.2 (a)信源编码器和(b)信源解码器在信源编码处理的第一阶段,转换器将输入数据转换为可以减少输入图像中像素间冗余的格式,这种格式通常不可见。这步操作通常是可逆的并且有可能直接减少表示图像的数据量。转换程序将图像变换为一个系数阵列。这样做使编码处理的后续阶段中更容易找到像素间冗余以便压缩。在第二阶段中,或图 2.2(a)中的量化器模块中,将转换程
35、序的输出精度调整到与预设的保真度准则一致。因此,当希望进行无误差压缩时,这一步必须略去。在第三个阶段,即信源编码处理的最后阶段,符号编码器生成一个固定的或可变长编码用于表示量化器输出并将输出转换为与编码相一致。“符号编码器”与整个信源编码处理过程不同,在大多情况下变称编码用于表示经过转换和量化的数据集合。它用最短的码字表示出现频率最高的输出值,以此减少编码冗余。此操作是可逆的。在符号编码的完成阶段,输入图像经过处理已经消除了上述的三种冗余。图 2.2(a)显示了信源编码处理三个相继的操作,但并不是每个图像压缩系统都必须包含这三种操作。而且,某些图像压缩技术是将图 2.2(a)中物理分开的某些模
36、块进行合并后建立的模型,即转换器和量化器经常用一个模块表示,该模块同时执行这两部分的操作。图 2.2(b)中显示的信源解码器仅包含两部分:一个符号解码器和一个反向转换器。这些模块的运行次序与编码器的符号编码器和转换模块的操作次序相反。因为量化过程导致了不可逆的信息损失,反向量化器模块不包含图 2.2(b)所示的通常的信源解码器模型中。2.2.2 信道编码器和解码器当图 2.2中显示的信道无噪声或趋向于无误差时,则图像压缩系统中就算没有信道编码器和解码器,最后的结果也不会受到太大的影响。而现实当中这种情况几乎不存在,也就是说信道带有噪声或易于出现错误时,信道编码器和解码器就在整个译码解码处理中扮
37、演了重要的角色。信道编码器和解码器通过向信源编码数据中插入预制的冗余数据来减少信道噪声的影响。由于信源编码器几乎不包含冗余,所以如果没有附加这种“预制的冗余”,它对噪声传送会有很高的敏感性。73 DCT编码算法DCT是英语Discrete Cosine Transform的简称,是N.Ahmed等人在1974年提出的正交变换方法。DCT常被认为是对语音和图像信号进行变换的最佳方法,因此也是在数据压缩中常用的一种变换编码方法。在视频压缩中,最常用的变换方法是DCT,DCT被认为是性能接近KLT的准最佳变换,其变换编码的主要特点有:(1)在变换域里视频图像要比空间域里简单;(2)视频图像的相关性明
38、显下降,信号的能量主要集中在少数几个变换系数上,采用量化和熵编码可有效地压缩其数据;(3)具有较强的抗干扰能力,传输过程中的误码对图像质量的影响远小于预测编码。通常,对高质量的图像,DCT变换编码只要求信道误码率。DCT并不是对整幅图像一次编码,而是将图像分成N×N(一般N8,即64个像素块)等若干个子图像块分别处理。这是因为:(1)小块图像变换的计算更容易;(2)距离较远的像素之间相关性比距离较近的像素之间的相关性小。3.1 一维DCT设是M个有限值的一维实数信号序列集合,余弦变换的完备正交归一函数系是 (3-1)对这些函数在内取M个样值,即得离散余弦变换矩阵T的元为 (3-2)离
39、散余弦变换(DCT)形式为(3-3)其矢量形式为 (3-4)其中以求和形式表示,一维DCT为 (3-5)其中DCT的反变换(IDCT)的形式为(3-6)其矢量形式为 (3-7)其求和形式为 (3-8)其中3.2 二维DCT设图像数据是一个的矩阵,每个数据用表示。为了减弱或去除图像数据的空间相关性,用二维DCT将图像从空间域,即平面,转换到DCT变换域,即平面。同一维DCT一样,二维阶DCT的分量表示形式也可写成求和形式,即 (3-9)其中在式(3-9)中变换核为 (3-10)若令则式(3-10)可分离成因此,式(3-9)可改写成(3-10)令则有可以看出,二维DCT实际上可以分解成双重一维DC
40、T,即(1)先以n为变量,对图像逐行进行一维DCT,最终得到变换结果(2)再对中间结果以m为变量,逐列进行第二个一维DCT,最终得到变换结果为。那么式(3-10)就可以写成矩阵形式的二维DCT: (3-11)其中即为式(3-3)中的方阵。而即为式(3-6)中的方阵。二维IDCT的表达式为 (3-12)显然,二维IDCT变换核也是可分离的。M-1n(0,0) N-1 nM-1n(0,0) N-1 nM-1n(0,0) N-1 n行变换列变换二维IDCT的矩阵表达式或写为图 3.1 二维DCT的行、列分离过程由此可知,二维DCT和IDCT的计算过程可用图 3.1形象表示,即先后进行两次一维DCT和
41、IDCT变换。此方法被称为行、列分离法。行、列分离算法的优点是:(1)结构简单直观;(2)可直接利用一维DCT快速算法程序和硬件结构实现;(3)运算为点和点的两次一维DCT。3.3 一维DCT快速算法虽然可以直接考虑二维DCT的快速算法,即将其分解为两次一维DCT算法来实现,这样可以使其运算量有所减少,但真正实现起来远不如分离一维计算简捷直观。一维快速DCT算法可以通过仿效FFT、从IDCT导出快速余弦变换(FDCT)以及代数分解等方法获得。3.3.1 仿效FFT算法由于DCT和FFT这两种算法很相似,根据FFT算法,可将式(3-5)改写为 (3-13)令,代入式(3-13),得 (3-14)
42、于是一维DCT正交变换可以利用FFT实现。其反变换也可同理写出。其实离散傅里叶变换指数项通过欧拉公式和进行分解后,其傅里叶变换实数部分对应于余弦项,其虚数部分对应于正弦项,因此离散余弦变换就可以从离散傅里叶变换的实数部分求得。3.3.2 从IDCT导出的快速余弦变换(FDCT)虽然利用DFT求DCT算法,而且也可以通过FFT来提高计算效率,但它并没有利用DCT实系数的特点。由于DCT的实系数的特点,利用递推关系,由DCT的逆变换我们可以导出一种快速的余弦变换算法。将IDCT的分量表达式(3-8)重写如下:(3-15)比较式(3-5)和式(3-8),可以发现DCT和IDCT的变换核是相同的。为了
43、方便起见,将式(3-15)改写成 (3-16)式中 (3-17)如果把式(3-16)的分解成偶数序列和奇数序列,则式(3-15)改写成 (3-18)其中 (3-19)由于 (3-20)构成了一个点的IDCT。但对来说,还不是IDCT的表达式,还需要作一点修改,利用三角函数式:得到如下关系: (3-21)对式(3-19)中的两边乘以,得 (3-22)若定义 (3-23)由于可将式(3-22)右边的第二项改写为 于是,式(3-22)可以进一步化简为 (3-24)显然为点的IDCT。将式(3-24)代入式(3-18),一个M点的IDCT就由两个的IDCT来表示。即 (3-25)及 (3-26)类似于
44、FFT,重复上述步骤,便可以进一步分解IDCT,直至2点的IDCT。由于DCT和IDCT的变换核一样,所以分解了IDCT,DCT的算法也自然就可以得到了。3.3.3 代数分解法仿效FFT的FDCT方法显然有与DCT毫无关系的复数运算部分,因此,要寻找一些更快的算法是十分必要的,代数分解法是快速DCT算法中的一种。代数分解法直接对式(3-5)寻找类似于FFT的蝶形关系。其方法如下:(1)蝶形图用小圆圈表示操作数,用连接圆圈的直线表示操作数的流动,用直线上方或下方的函数表达式表示操作数在流向前方时需乘的加权因子。根据FFT要求,M是2的幂,且蝶形图的级数为。(2)将,以为界分为两个集合:分别称,为
45、上半区和下半区。(3)第一级的M个操作数分别为,第一级到第二级同行的圆圈用直线连接;下半区的直线上带有负号,第一级到第二级的另一组连接由第一级第行到第二级的第行连接,。(4)第二级到第三级的连接,上半区采用(3)中的连接方法,但此时的操作数已减少了一半。重复运行这个操作直到级为止。(5)余下的操作数流向用加权因子确定具体的代数分解来做。下面以为例说明代数分解的过程:根据式(3-5)可得的DCT表达式为因此得到各分量的表达式为由上述分解可以画出时的DCT的蝶形图,如图 3.2所示。图 3.2 时的DCT的蝶形图由此看到DCT蝶形操作与FFT一样,也导致了比特逆序,但在量化、解码时立即又可将这种逆
46、序变为正序。图 3.3中表述了图 3.2中每一级输出与输入以及各级系数的关系。图 3.3 算法中输出和输入的关系3.4 DCT系数的量化系数量化是一个十分重要的过程,它将每个DCT系数除以各自的量化步长并取整值,从而得到量化系数,是造成DCT编解码信息损失或失真的根源。DCT是一个无损变换,只要正、反变换所用的设备计算精度足够高,且未经过量化,那么原始的样值能精确地恢复。其实经DCT变换后并没有压缩数据,反而使原本是整数样值的矩阵变为非整数系数矩阵,因此要对系数进行量化。量化是对DCT系数进行压缩的关键一步,这是利用降低DCT系数的精确度的方法来去除不重要的系数,从而减少数据量。数据压缩中的量
47、化处理,不是对A/D转换中的量化,而是对正交变换后的数据进行的量化处理,在此量化过程中,量化输入值的动态范围很大,而量化的输出只能取有限个整数,量化后的数值用较少的比特数便可表示。量化处理总是把一批输入量化到一个输出级上,这样降低了数值的精度,但减少了数据量。图像压缩过程中,一般将图像分成若干个8×8的图像块,在图像压缩算法中采用均匀量化器,量化定义可以表述为:对64个DCT系数除以其量化步长,四舍五入取整,即式中,为量化的系数幅度,为量化步长,它是量化表的元素,通常随DCT系数的位置和彩色分量的不同而取不同的值,量化表的尺寸为8×8与64个DCT系数一一对应。从物理意义上
48、来分析,u代表了图像样值沿水平方向的变化率,又称为“水平空间频率”;v代表了图像样值沿垂直方向的变化率,又称为“垂直空间频率”;称为“空间频率系数”。在这64个系数中,代表了样值子块的直流分量,又称为“DC”系数,其它63个系数代表了交流分量,又称为“AC”系数,其中是最高频率系数,如图 4.1所示。量化后的系数还要重新编排,目的是为了增加连续的“0”系数的个数,即“0”的流程长度,方法是按照Z字形的样式编排,把一个8×8的矩阵变成一个1×64的矢量,使频率较低的系数留在矢量的顶部。连续的0个数越多,编码效率越高,对DCT系数采取Z行扫描方式后,可使大多出现在右下角的0值能
49、够连续起来。如图 3.4所示。图 3.4 Z字形扫描DC值AC系数开始AC系数结束量化的作用是在一定的主观保真度图像质量的前提下,丢掉那些对视觉影响不大的信息,以获得较高的压缩比。由于DCT系数包含了空间的频率信息,可充分利用人眼对不同频率敏感程度不同这一特性来选择量化表中的元素值的大小,对视觉重要的系数采用细量化,细量化的步长较小,如低频系数被细量化,对高频系数采用粗量化,与之相应地,粗量化的步长较大。量化的目的是减小“0”系数的幅度以及增加“0”之系数的数目。量化是图像质量下降的最主要原因。一般情况下都使用均匀量化器进行量化,量化步长是按照系数所在的位置和每种颜色分量的色调值来确定,因为人
50、眼对亮度信号比对色差信号更敏感,因此使用了两种量化表,一个是亮度量化 表,一个是色度量化表。此外,由于人眼对低频分量的图像比对高频分量的图像更敏感,因此量化表中的左上角的量化步长一般要比右下角的量化步长小,量化机要使得大部分数据得以压缩,同时又要保证通过量化和编码之后能输出一个与信道传输速率匹配的比特流。194 MATLAB实现4.1 MATLAB语言的特点MATLAB是一种科学计算软件,主要适用于矩阵去处及控制和信息处理领域的分析设计。它使用方便,输入简捷,运算高效,内容丰富,并且很容易由用户自行扩展。MATLAB是“矩阵实验室”(MATrix LABoratoy)的缩写,它是一种以矩阵运算
51、为基础的交互式程序语言,专门针对科学、工程计算及绘图的需求。与其他计算机语言相比,其特点是简洁和智能化,适应科技人员的思维方式和书写习惯,使得编程和高度效率大大提高 。它用解释方式工作,键入程序立即得出结果,人机交互性能好,深得科技人员喜爱。特别是它可适应多种平台,并且,随计算机硬软件的更新及时升级。因此,MATLAB语言在国外的大学工学院中,特别是数值计算用的最频繁的电子信息类学科中,已成为每个学生都掌握的工具了。它大大提高了课程教学、解题作业、分析的效率。MATLAB语言具有以下特点:(1)起点高。每个变量代表一个矩阵,可以有个元素,其中每个元素都看作复数,且所有的运算都对矩阵和复数有效。
52、(2)人机界面适合科技人员。这体现在三个方面:第一,语言规则和笔算式相似,易写易读;第二,矩阵行数列数无需定义,输入数据的行列数就决定了它的阶数;第三,键入算式立即得结果,无需编译,若有错误立即作出反应,便于编程都马上改正。(3)强大而简易的作图功能。MATLAB能根据输入数据自动确定坐标绘图,能规定多种坐标系,能绘制三维坐标中的曲线和曲面,还可设置不同颜色、线型和视角等。如果数据齐全,通常只需一条命令即可出图。(4)智能化程度高。MATLAB在绘图时自动选择最佳坐标,做数值积分时,自动按精度选择步长,而且自动检测和显示程序错误的能力强,易于调试。(5)功能丰富,可扩展性强。MATLAB软件包
53、括基本部分和专业扩展两大部分。基本部分包括矩阵的运算和各种变换、代数和超越方程的求解、数据处理和傅里叶变换、数值积分等等。扩展部分称为工具箱,实际上是用MATLAB的基本语句编成的各种子程序集,用于解决某一方面的专门问题或实现某一类新的算法,现在已经有控制系统、信号处理、图像处理、系统辨识、模糊集合、神经元网络和小波分析等数十个工具箱,并且还在继续发展中。4.2 MATLAB的功能MATLAB之所以能成为世界流行的科学计算与数学应用软件,是因为它有着以下强大的功能:(1)高质量、强大的数值计算功能。MATLAB汇集了大量常用的科学和工程计算方法,从各种函数到复杂运算,其出色的数值计算功能是优于其他数学应用软件的重要原因。(2)数据分析和科学计算可视化功能。在科学计算和工程应用中,经常需要分析大量的原始数据和数值计算结果,MATLAB将这些数据以图形的方式显示出来,使数据间的关系清晰明了。(3)强大的符号计算功能。MATLA
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 文艺作品版权管控规定
- 直播销售如何制定切实可行的销售方案的具体预案
- 电商平台视觉设计报告总结
- 物理化学实验手册
- 智能交通协同感知应用-洞察及研究
- 新能源产业2025反垄断合规风险与技术前瞻性策略研究报告
- 智能控制方案总结制定
- 网络安全事件处理指南规定方案
- 统计学在金融风险评估中的有效预案
- 三年级数学(上)计算题专项练习附答案
- 医院培训课件:《中医护理技术质量与安全管理》
- 历史课程中的跨学科教学与学科整合
- 移情训练法移情训练法
- 《大卫 科波菲尔(节选)》《复活》《老人与海》《百年孤独》 统编版高中语文选择性必修上册
- 展厅施工方案表
- 空调维保投标方案(技术方案)
- 深圳南山风险投资基金
- 食品安全风险“日管控、周排查、月调度”记录表
- 监护仪使用及报警设置
- 通过模拟实验探究膜的透性 说课课件
- Q-SY 08365-2021 气瓶使用安全管理规范
评论
0/150
提交评论