版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、长沙学院 CHANGSHA UNIVERSITY毕业设计(论文)资料设计(论文)题目: 基于MATLAB的图像压缩处理技 术的研究与实现 系部: 电子与通信工程系 专 业: 通信工程 学 生 姓 名: 马娟 班 级:05通信2 学号 指导教师姓名: 刘光灿 职称 教授 王路露 职称 助教 最终评定成绩 长沙学院教务处 二七年十月制目 录第一部分 毕业论文一、毕业论文第二部分 外文资料翻译一、外文资料原文二、外文资料翻译第三部分 过程管理资料一、 毕业设计(论文)课题任务书二、 本科毕业设计(论文)开题报告三、 本科毕业设计(论文)中期报告四、 毕业设计(论文)指导教师评阅表五、 毕业设计(论文
2、)评阅教师评阅表六、 毕业设计(论文)答辩评审表2009 届本科生毕业设计(论文)资料第一部分 毕业论文-(2009 届)本科生毕业论文基于MATLAB的图像压缩处理技术的研究与实现系部: 电子与通信工程系 专 业: 通信工程 学 生 姓 名: 马娟 班 级:05通信2 学号 指导教师姓名: 刘光灿 职称 教授 王路露 职称 助教 最终评定成绩 2009 年 6 月 长沙学院本科生毕业论文基于MATLAB的图像压缩处理技术的研究与实现系 部: 电子与通信工程系 专 业: 通信工程 学 号: 学生姓名: 马娟 指导教师: 刘光灿 教授 王路露 助教2009 年 6月摘 要图像是一种重要的二维信号
3、,由于其数据量很大,在存储和传输的时候要对其进行压缩处理。离散余弦变换是一种新兴的数学工具,基于离散余弦变换的图像压缩技术正受到广泛的关注和研究。图像经过离散余弦变换以后,在时域和频域都具有良好的局部化特性,重建图像中可以克服采用离散余弦变换编码所固有的方块效应,而且与人类视觉特性相一致。论文主要研究了基于MATLAB的图像压缩算法,完成了以下一些工作:介绍了图像压缩的原理和方法,列举了常用的图像压缩的评价标准和技术标准,在理论分析的基础上深刻理解了图像压缩算法。重点研究了离散余弦算法的基本原理和实现步骤,对基于DCT变换的图像压缩技术的算法进行了研究,并用MATLAB进行了算法仿真,同时,利
4、用MATLAB程序形象设计出图形用户界面,形象直观的看到了图像压缩前后的鲜明对比,取得了较为理想的效果。关键词:图像压缩,DCT变换,MATLAB仿真 ABSTRACTImage is important two-dimension signal.Because of the huge data it contains,image must be compressed when it is stored or transported.The discrete cosine transform (DCT) is rising mathematical tool. The technology o
5、f image compression based on discrete cosine transform has drawn much attention and has been researched broadly. When a image is transformed by the discrete cosine transform,it has favorable localize characteristic in both time-domain and frequence-region.And in the rebuild image the connatural diam
6、onds affection of the discrete cosine transform can be overcame. Furthermore,the WT is identical to Human Visual System .This paper is mainly about the image compression algorithm based on MATLAB, and complete these work:Introduced the theory and technique of image compression,Enumerated the prevale
7、nt image compressional evaluation criteria and technical standards, based on the theoretical analysis I understanding the image compression algorithm profoundly. The paper discusses the basic principles and implementation steps of image DCT transform technique. carries research on the algorithm of i
8、mage compression based on DCT. At the same time, Then the algorithm is simulated by MATLAB,using MATLAB program designed the graphical user interface vividly. Intuitive image to see the image in sharp contrast to before and after compression,and achieved better results.Keywords: Image compression ,D
9、CT transform ,Simulation by MATLAB目 录摘 要IABSTRACTII第1章 绪论11.1 论文研究背景及意义11.2 图像压缩技术的历史与现状11.3 离散余弦变换及其在图象压缩中的应用21.4 论文研究的主要内容2第2章图像压缩的基本原理42.1 图象压缩评价标准42.1.1 客观标准42.1.2 主观标准52.2 图像压缩技术标准52.3 图像压缩的分类82.4 图像压缩处理技术基本理论92.4.1 图像压缩的基本原理92.4.2 图像压缩的基本模型10第3章 离散余弦变换的MATLAB实现123.1 MATLAB图像处理工具箱123.2 离散余弦变换的定
10、义123.3 离散余弦变换的基本原理与算法133.3.1 离散余弦变换的基本原理133.3.2 离散余弦变换算法153.4 离散余弦算法的实现15第4章 离散余弦变换的界面实现174.1 图形用户界面简介174.2 界面设计的MATLAB实现174.2.1 界面设计总体概述174.2.2 界面设计具体实现18第5章 运行结果显示及分析205.1 离散余弦变换的算法实现205.1 离散余弦变换的界面实现205.5 设计过程中的疑难及改进22结 论23参考文献24附 录25致 谢27第1章 绪论1.1论文研究背景及意义人们在自然界中感受到的最重要的信息就是图像信息,随着多媒体技术和通讯技术的日益发
11、展,图像也成为了信息技术所处理的重要对象。近些年来,图像技术发展十分迅速,这也推动了多媒体娱乐、多媒体通信、数码相机、数码摄像头和高清晰度电视等各类与图片和视频相关的产品的发展。图像信息的数据量非常的大,随着各种成像设备的分辨率的不断提高,单幅图像所包含的数据量也越来越大,大数据量的图像信息会给存储器的存储容量、通信信道的带宽以及计算机的处理速度增加极大的压力。为了解决这个问题,必须对图像进行压缩处理。数字图像压缩编码的目的就是要以尽可能少的比特数来表征图像,同时保持恢复图像的质量,对图像编码和解码算法的研究,己经受到人们越来越多的关注,成为近些年信息技术中的热点。1.2图像压缩技术的历史与现
12、状图像压缩编码技术始于二十世纪四十年代末的电视信号数字化,至今己有将近六十年的历史。在这几十年的时间内,出现了大量的图像压缩方法和理论M.Kunt将图像压缩的编码理论及方法分为两代:传统的压缩编码方法和新型图像编码方法。传统编码技术包括脉码调制、量化法、熵编码、预测编码、变换编码、矢量编码等十余种编码方法。然而随着人们对这些传统编码方法的深入应用,也逐渐发现了这些方法的许多缺点:比如在传统的编码方法中由于正交变换时频局域性很差,变换后的系数失去了对原图像精细结构的描述,从变换图像得不到原图像边缘轮廓等局部信息,因此,在量化编码时无法采用特殊方法;高压缩比时它还导致图像的边缘轮廓模糊显现和出现严
13、重的方块效应;而且人类视觉系统(Humna Visual Sysetm,即HVS)的特性也不易被引入到压缩算法中。这些缺点使得它们不适应于需要较高压缩比的应用场合。80年代中后期,人们结合模式识别、计算机图形学、计算机视觉、神经网络、小波分析和分形几何等理论,开始探索图像信号压缩编码的新途径。同时考虑到人类的视觉心理特性,新型图像压缩编码方法相继提出:M.Kuni于1985年提出基于人眼视觉特性的第二代图像编码技术,1988年M.Barnsley提出基于迭代函数系统的分形图像编码技术,以及90年代初发展起来的基于模型的图像编码方法。其中离散余弦变换不仅是现在研究的热点,而且这方面的编码也取得了
14、一些引人注目的成功。如离散余弦变换技术己经作为联合图像专家组新的图像压缩标准JPEG2000的核心技术1。1.3离散余弦变换及其在图象压缩中的应用离散余弦变换(DCT for Discrete Cosine Transform)是与傅里叶变换相关的一种变换,它类似于离散傅里叶变换(DFT for Discrete Fourier Transform),但是只使用实数。离散余弦变换相当于一个长度大概是它两倍的离散傅里叶变换,这个离散傅里叶变换是对一个实偶函数进行的(因为一个实偶函数的傅里叶变换仍然是一个实偶函数),在有些变形里面需要将输入或者输出的位置移动半个单位。有两个相关的变换,一个是离散正
15、弦变换(DST for Discrete Sine Transform),它相当于一个长度大概是它两倍的实奇函数的离散傅里叶变换;另一个是改进的离散余弦变换(MDCT for Modified Discrete Cosine Transform),它相当于对交叠的数据进行离散余弦变换。离散余弦变换,尤其是它的第二种类型,经常被信号处理和图像处理使用,用于对信号和图像(包括静止图像和运动图像)进行有损数据压缩。这是由于离散余弦变换具有很强的“能量集中”特性:大多数的自然信号(包括声音和图像)的能量都集中在离散余弦变换后的低频部分,而且当信号具有接近马尔科夫过程(Markov processes)
16、的统计特性时,离散余弦变换的去相关性接近于K-L变换(Karhunen-Loève变换它具有最优的去相关性)的性能。例如,在静止图像编码标准JPEG中,在运动图像编码标准JPEG和MPEG的各个标准中都使用了离散余弦变换。在这些标准制中都使用了二维的第二种类型离散余弦变换,并将结果进行量化之后进行熵编码。这时对应第二种类型离散余弦变换中的n通常是8,并用该公式对每个8×8块的每行进行变换,然后每列进行变换,得到的是一个8×8的变换系数矩阵。其中(0,0)位置的元素就是直流分量,矩阵中的其他元素根据其位置表示不同频率的交流分类2。1.4论文研究的主要内容 本文主要研
17、究如何利用MATLAB软件开发一个基于离散余弦算法的图像压缩处理界面,为初学者提供一个图像压缩处理技术的DCT算法演示及模拟开发的Graphical User Interface(图形用户界面)平台,供大家学习并研究图像压缩处理的技术方法。本文的主要内容如下:第一章是绪论部分,介绍了论文的研究背景和意义,并简要介绍了图象压缩技术的历史与现状以及离散余弦变换在图像压缩中的应用,概述了本论文的主要研究工作;第二章介绍了图象压缩技术的基本理论知识,包括图象压缩的评价标准、技术标准及分类,论述了图像压缩的基本原理和基本模型;第三章介绍了离散余弦变换的MATLAB实现,简单介绍了MATLAB的图像处理工
18、具箱,然后介绍了离散余弦变换的基本原理和算法,最后实现了离散余弦变换的图像压缩实现;第四章介绍了离散余弦变换的界面实现,简单介绍了图形用户界面的功能,论述了本设计采用MATLAB程序进行图像压缩界面操作的实现过程;第五章显示了利用离散余弦变换的算法实现和界面实现的运行结果,并概述了在设计过程中的疑难及改进;最后是对全文的总结,提出了需要进一步解决的问题及改进方向。第2章 图像压缩的基本原理数字图像从表面上看可以表达丰富多彩的内容,但实质上可以看作在视觉空间灵敏度范围内对图像进行空间采样的一个个像素组成,每个象素点都可以用一组一维或多维的数字来表示,如nbit的灰度图像的每个象素由02nl之间的
19、某个数值来表示,而真彩色图像的象素值则由红(R),绿(G),蓝(B)三种颜色的值来联合表示。由于图像采集设备的迅速发展,图像的尺寸和分辨率不断提高,导致了图像数据量变得非常大,例如,一幅单色数字卫星遥感图像由10,000×10,000个像素(pixel)组成,如果每个像素的灰度用12bit表示,那么这幅图像就要用1.2GB表示。直接存储和传输如此庞大的数据,不仅要消耗巨大的磁盘空间和网络带宽而且还会极大地增加处理器的负担,因此对图像进行大幅度的数据压缩就显得尤为重要3。2.1图象压缩评价标准对图像进行压缩,不可避免的要引入失真。我们要做的就是在图像信号的最终用户觉察不出或能够忍受这些
20、失真的前提下,进一步提高压缩比,以换取更高的编码效率。这就需要引入一些失真的测度来评估重建图像的质量。重建图像的质量评价标准可分为客观标准和主观标准两种。通过这些标准可以比较各种方法的优劣1。2.1.1客观标准假设原始图像表示A=f(i,j),其中i=l,2,M;j=1,2,N,经压缩解压后的图像为A=f(i,j),i=1,2,M;j=1,2,N,可以用下列指标进行评价:(1)均方误差MSN (2.1)(2)规范化均方误差NMSN (2.2)其中 (3)对数信噪比SNR (2.3) (4)峰值信噪比PSNR (2.4)评价图像压缩效果的另外一个重要指标是压缩比C,它指的是表示原始图像每象素的比
21、特数同压缩后平均每象素的比特数的比值,也常用每象素比特值(bpp)来表示压缩效果。2.1.2主观标准图像的主观质量就是以人作为图像的观察者,对图像的优劣做出主观评价。主观标准采用平均判分MOS(mean opinion score)或多维计分等方法进行测试,即组织一群足够多的实验人员(一般10人以上),通过观察来评定图像的质量,观察者给判定图像打上一定的质量等级比较损伤程度给予图像进行比较等方法,根据不同的质量打上5级、6级或7级的评分制,最后用平均的办法得到图像的分数,这样的评分虽然很花时间,但比较符合实际。表2.1列出了一个5级的主观评价的评分尺度。表2.1图像质量主观评价尺度图像质量评分
22、评价尺度非常好的图像5分丝毫看不出图像质量变坏好的图像4分能看出质量变坏,但不妨碍观看中等的图像3分清楚看出图像质量变坏,稍妨碍观看差的图像2分对观看较有影响非常差的图像1分非常严重的质量变坏,基本不能观看主观评价和客观评价之间有一定联系,但不能完全等同,由于客观评价比较便,很有说服力,故在一般的图像压缩研究中被采用。主观评价很直观,符合人眼的视效果,比较实际,但是打分尺度很难把握,不可避免有人为因素。2.2图像压缩技术标准信息技术的突出特点是互操作性和全球联网。随着全球范围内的信息传输和交换越来越重要,统一的技术标准成为实现全球范围信息传输和交换的关键。统一的国际标准是不同国家地区和厂商的产
23、品能够相互兼容和协调的基础。近些年来,图像编码技术得到了迅速的发展和广泛的应用,并且日臻成熟,其标志就是几个关于图像编码的国际标准的制定,有关图像压缩编码已有的国际标准(或建议)有H.261、H.263、JPEG、JPEG2000、MPEG-l、MPEG-2、MPEG-4等,涉及到二值图像传真、静态图像传输、可视电话、会议电视、VCD、DVD、常规数字电视、高清晰度电视、多媒体可视通信、多媒体视频点播与传输等广泛应用领域。这些标准图像编码算法融合了各种性能优良的传统图像编码方法,是对传统编码技术的总结,代表了目前图像编码的发展水平。各种图像编码的标准实际上都是博采各种方法之所长的优化组合的混合
24、编码系统。有关图像编码的若干国际标准(建议)的名称、主要目标和内容以及应用范围如下4:(1) H.261建议H.261建议是CCITT于1990年7月通过的有关图像(视频)压缩编码的第一个国际标准化建议,其全称为“p×64kbit/s(p=130)视听业务的视频编解码器”。H.261的主要对象是m×64kbit/s和n×354kbit/s两类码率。其应用目标是可视电话和会议电视,其对图像质量的要求不很高。(2) JPEG标准JPEG是ISO和CCITT于1986年成立的联合图像专家组(Joint Photgoparhic Expert Group)的简称。1992
25、年作为静止图像压缩算法的国际标准正式推出。它适用于不同类型不同分辨率要求的彩色和黑白静止图像,有多种编码模式和数据格式。主要应用于彩色产值、静止图像、可视通讯、印刷出版、新闻图片、医学和卫星图像的传输、检索和存储。(3) JPEG2000标准JPEG2000是21世纪的压缩标准,它把JPEG的四种模式(顺序模式、渐进模式、无损模式和分层模式)集成在一个标准中,在编码端以最大的压缩质量和最大的图像分辨率压缩图像,在解码端可以从码流中以任意的图像质量和分辨率解压图像。JPEG2000的主要特征如下:.高压缩率:由于采用离散小波变换,图像可以转换成一系列“小波”,压缩比可比JPEG提高10%30%,
26、而且压缩后的图像显得更加细腻平滑。.JPEG2000提供无损和有损两种压缩方式。.渐进传输:采用JPEG2000格式的图像支持渐进传输。所谓渐进传输就是先传输图像轮廓数据,然后再逐步传输其他数据来不断提高图像质量。.感兴趣区域压缩:可以指定图片上感兴趣的区域(Region of Interest),然后在压缩时对这些区域指定压缩质量,或在恢复时指定某些区域的解压缩要求。.码流的随机访问和处理:这一特征允许用户随机定义感兴趣区域,使得这一区域的图像质量高于其它区域。.容错性。.开放的框架结构。.基于内容的描述。JPEG2000的应用领域包括互联网、彩色传真、打印、扫描、数字摄像、遥感、移动通信、
27、医疗图像和电子商务等。(4) MPEG-1标准MPEG是活动图像专家组Moving Pictuer Experts Group的简称。MPEG-l的全称是ISO/IEC CDIl72,Coding of Moving Picture and Assoeiated Audio for digital storage media at up to 1.5Mbit/s,中文译为“用于数字存储媒体、码率约为1.5Mbit/s的活动图像及其伴音的编码”。它是MPEG专家组的第一阶段成果,1993年正式通过为国际标准。MPEG-1包括系统、视频、音频以及测试和软件实现等。MPEG-1主要面向数字存储媒体,
28、应用于多媒体计算机、教育与训练、演示与咨询服务、创作与娱乐、电子出版物、数字视听系统VCD以及VOD、交互式电视ITV等领域。(5) MPEG-2标准MPEG-2标准的全称是ISO/IEC DIS13818,Generie Coding of Moving Pictures and Assoeiated Audio Information,中文名为“活动图像及其伴音信息的通用编码(标准)”,1993年11月正式推出。MPEG-2包括系统、视频、音频和测试,与MPEG-1后向兼容。MPEG-2的视频编码部分码率为410Mbit/s,图形质量接近演播室质量。MPEG-2在技术、功能、语法结构、选择
29、项、可分级性和应用范围等方面比MPEG-1、H.261有重大改进和发展。因此成为一种从多媒体计算机到家用消费数字音像电子产品、从宽带数字通信到数字视频广播以及HDTV的“通用”共性关键技术。MPEG-2从技术上促进了计算机、广播电视、数字通信三大领域的交汇融合,并发挥出了巨大的作用。(6) H.263建议全称是ITU-T Recommendation H.263,Video Coding of Low Bitrate Communation。它是ITU-TH.324“Terminal for Low Bitrate Multimedia Communation”的主要组成部分。其面向低码率多媒
30、体通信,原来的目标为在PSTN上运行低于64Kbit/s以下码率的新的视频压缩标准。由于低码率下实现多媒体通信在技术上更为困难和复杂,因此H.263采用了多种先进技术以降低码率,提供各种业务,后来又推出了H.263+和H.263+。(7) MPEG-4和MPEG-7MPEG-4的目标是交互式的多媒体应用。其特点有:.基于内容的交互性:基于内容的多媒体数据访问、基于内容的码流操作和编辑。.高效的压缩算法。.自然的与合成的图像编码及其混合编码。.通用的可接入性:包括恶劣环境下强大的抗差错能力,基于内容的可分级。2.3图像压缩的分类图像压缩的效果好与不好,关键要看三样指标:一是压缩比要大,二是压缩算
31、法简单、速度快,三是恢复效果好。数字图像数据量的压缩按照应用不同可分为两大类:无损压缩和有损压缩。无损、冗余压缩:可逆,压缩比较高,信息保持型数据压缩。有损、熵压缩:不可逆,压缩比较低,又分为保真度型数据压缩和特征保持型数据压缩。图像编码也可以按照编码所在数据域主要分为空间域编码和变换域编码两大类,此外还有模型编码、矢量量化编码和神经网络编码等众多方法。下面简要介绍几种压缩编码方法5:(1) 预测编码:根据离散信号之间存在着一定并联性的特点,利用前面的一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差值(预测误差)进行编码。对预测的要求是必须较为准确。预测编码消除的是空间冗余和时间冗
32、余。属于这类编码的主要有DPCM、ADPCM等。(2) 变换编码:先对信号进行某种函数变换,从一种信号(空间)变换到另一种信号(空间),然后再对变换后的信号进行采样编码。变换编码可以消除空间冗余和时间冗余。属于变换编码的有K-L变换、DFT变换、DCT变换、WHT变换等。(3) 统计编码:主要用于对相互独立、无相关性的消息序列构成的无记忆信源进行压缩。它根据消息出现概率的分布特性而进行的压缩编码,宗旨是在消息和码字之间找到明确的一一对应关系,以便在恢复时再现出来。统计编码消除的是信息熵冗余。属于这类编码的有Huffman编码、Shannon-Fano编码、算术编码等。(4) 模型编码:利用模型
33、的方法,对需传输的图像进行参数估测。它消除的是结构冗余和知识冗余。属于这类编码方法的如分形编码等。(5) 其他编码:如行程编码,计算信源符号出现的行程长度,然后将行程长度转换成代码;Lempel-Zel和Welsh编码,查找冗余字符串和将此字符串用较短的符号标记替代的技术,从而达到数据压缩的目的,其压缩率很高。图2.1给出了按数据域划分归类的主要压缩方法6。图像压缩方法空域编码K-L编码编码PCM、DPCM编码矢量量化编码Delta编码子带编码块截断编码行程编码自适应变换域编码基于模型编码其他编码变换域编码帧间编码小波变换编码神经网络编码等值线编码其他变换域编码分形编码图2.1 图像压缩方法的
34、分类2.4图像压缩处理技术基本理论2.4.1图像压缩的基本原理图像数据压缩的目的是在满足一定图像质量的条件下,用尽可能少的比特数来表示原始图像,以提高图像传输的效率和减少图像存储的容量,在信息论中称为信源编码。大类,前者在解码时可以精确地恢复原图像,没有任何损失;后者在解码时只能近似原图像压缩是通过删除图像数据中冗余的或者不必要的部分来减小图像数据量的技术,压缩过程就是编码过程,解压缩过程就是解码过程。压缩技术分为无损压缩和有损压缩两图像,不能无失真地恢复原图像。假设有一个无记忆的信源,它产生的消息为ai,1iN,其出现的概率是已知的,记为P(ai)。则其信息量定义为: (2.5) 由此可见一
35、个消息出现的可能性越小,其信息量就越多,其出现对信息的贡献量越大,反之亦然7。信源的平均信息量称为“熵”(entropy),可以表示为: (2.6)对上式取以2为底的对数时,单位为比特(bits): (2.7)根据香农(Shannon)无噪声编码定理,对于熵为H的信号源,对其进行无失真编码所可能达到的最低比特数为,这里为一任意小的正数,因此可能达到的最大压缩比为: (2.8)其中B是原始图像的平均比特率7。在图像压缩中,压缩比是一个重要的衡量指标。可以定义压缩比为: (2.9)2.4.2图像压缩的基本模型 图像编码包括两个阶段,前一个阶段就是利用预测模型或正交模型对图像信号进行变换;
36、后一个阶段是利用已变换信号的统计特性,对其分配适当的代码来进行编码传输。编码器与解码器的结构分别如图2.2,图2.3所示。原始图像数据DCT变换量化器Huffman编码编码压缩图像数据图2.2 编码器结构压缩图像数据Huffman译码量化器(逆)逆DCT变换重建图像数据图2.3 解码器结构在发送端,输入的原始图像首先经过DCT变换后,其低频分量都集中在左上角,高频分量分布在右下角(DCT变换实际上是空间域的低通滤波器)。由于该低频分量包含了图像的主要信息,而高频分量与之相比就不那么重要了,所以可以忽略高频分量,从而达到压缩的目的。将高频分量去掉就要用到量化,这是产生信息损失的根源。“量化”的主
37、要任务是用有限个离散电平来近似表达已抽取出的信息。在此采用均匀量化,通过改变程序中的量化因子Q的值以得到不同压缩比的图像。Huffman编码时,首先对经DCT变换及量化后的图像收据扫描一遍,计算出各种像素出现的概率;然后按概率的大小指定不同长度的唯一码字,由此得到一张Huffman表。编码后的图像记录的是每个像素的码字,而码字与量化后像素值的对应关系记录在码表中。生成的一维字符矩阵即为实际中要传输的序列,压缩后的图像数据在信道中进行传输。在接收端,接收到的压缩图像数据首先经过Huffman译码,通过搜索已生成的Huffman表,根据码字与量化后像素值的对应关系,搜索出与码字对应的像素值,并转换
38、为二维矩阵。反量化时将以上二维矩阵中的每一个像素值乘以量化因子Q。最后通过DCT反变换得到重建图像8。第3章 离散余弦变换的MATLAB实现3.1 MATLAB图像处理工具箱MATLAB中的基本数据结构是由一组有序的实数或复数元素构成的数组,图像对象的表达采用的是一组有序的灰度或彩色数据元素构成的实值数组。MATLAB中通常用二维数组来存储图像,数组的每一个元素对应于图像的一个像素值。例如,由200行和300列的不同颜色点组成的一幅图像在MATLAB中采用200×300的矩阵存储。MATLAB支持多种类型的图像,而不同类型的图像其存储结构通常是不同的。如RGB图像则需要一个三维数组,
39、3个数据维分别对应于某像素点的红色、绿色和蓝色强度值。由于对图像采用了通用的数据矩阵的表达方式,MATLAB中原有的所有基本矩阵操作都可应用于图像矩阵,例如,我们要查看图像I中某像素点的强度值,可以采用类似的表达方式:I(x,y),它代表了图像I的第x行和第y列的像素值9。MATLAB的图像处理工具箱功能十分强大,支持的图像文件格式丰富,如*.BMP、*.JPEG、*.6IF、*.TIFF、*.PCX、*.HDF、*.XWD、*.PNG等。图像处理工具箱支持四种图像类型,分别为真彩色图像、索引色图像、灰度图像、二值图像,由于有的函数对图像类型有限制,这四种类型可以用工具箱的类型转换函数相互转换
40、。MATLAB提供了15类图像处理函数,涵盖了包括近期研究成果在内的几乎所有的图像处理方法。这些函数按其功能可分为:图像显示;图像文件I/O;几何操作;像素和统计处理;图像分析;图像增强;线性滤波;线性二元滤波设计;图像变换;邻域和块处理;二进制图像操作;区域处理;颜色映像处理;颜色空间变换;图像类型和类型转换10。利用这些图像处理工具箱,并结合其强大的数据处理能力,我们可不必关心图像文件的格式、读写、显示等细节,而把精力集中在算法研究上,大大提高了工作效率。而且,在测试这些算法时既可方便地得到统计数据,同时又可得到直观图。3.2离散余弦变换的定义
41、; DCT变换利用傅立叶变换的性质,采用图像边界褶翻将图像变换为偶函数形式,然后对图像进行二维傅立叶变换,变换后仅包含余弦项,所以称之为离散余弦变换。二维离散余弦变换DCT(Discrete Cosine Transform)的定义为,假设矩阵A的大小为M×N5, 0pM-1,0qN-1其中
42、; (3.1)其中,Bpq称为矩阵A的DCT系数。在MATLAB中,矩阵的下标从1开始而不是从0开始的,所以MATLAB中的矩阵元素A(1,1)和B(1,1)分别对应于上面定义中的值A00和B00,依此类推。DCT是一种可逆变换,离散反余弦变换定义如下: (3.2)上式的含义是任何M×N
43、的矩阵A都可以表示为一系列具有下面形式的函数的和: (3.3) 这些函数称为DCT变换的基函数,这样,Bpq就可以看成是应用于每个基函数的加权11。3.3离散余弦变换的基本原理与算法3.3.1离散余弦变换的基本原理图像的二维离散余弦变换(Discrete Cosine Transform)简称DCT变换是最小均方误差条件下得出的次最佳正交变换,且已获得广泛应用,大多数情况下,DCT用于压缩图像,并成为许多图像编码国际标准的核心,JPEG图像格式的压缩算法采用的就是DCT变换算法。DCT变换的变换核为余弦函数,计算速度较快,有利于图像压缩和其他处理
44、12。JPEG算法被确定为JPEG国际标准,它是国际上彩色、灰度、静止图像的第一个国际标准。在编码过程中,JPEG算法首先将RGB分量转化为亮度分量和色差分量,然后将图像分解为8×8的像素块,对这个8×8输入矩阵全部值的平均数,其余63个系数为交流(AC)系数,接下来对DCT系数进行量化,最后将量化的DCT系数进行编码,就形成了压缩后的图像格式。在解码过程中,先对已编码的量化的系数进行解码,然后求逆量化并利用二维DCT反变换把DCT系数转化为8×8样本像块,最后将反变换后的块组合成一幅图像。这样就完成了图像的压缩和解压过程。假设矩阵A的大小为M×N,用f
45、(x,y)表示矩阵中的元素,则离散余弦变换(DCT)正反变换公式为3:(1)正变换公式其中0uM-1,0vN-1 (3.4) 说明:公式4.10中的F(u,v)称为矩阵A的DCT系数。在MATLAB中,矩阵的下标从1开始而不是从0开始。(2)反变换公式 (3.5)其中0xM-1,0yN-1 式中的x,y为空间域采样值,u,v为频率域采样值。其中f(x,y)是空间域二维向量元素,F(u,v)是变换系数阵列元素。(3)简化公式 在二维离散余弦变换中,通常数字图像用像素方阵表示,在这种情况下,二维离散余弦的正反变换可简化为: (3.6) (3.7)其中在MATLAB的仿真实现中,主要是采用二维OCT
46、变换的矩阵式定义来实现的,矩阵义可以表示为: (3.8)其中f(x,y)是空间数据阵列,f(x,y)是变换系数阵列,A是变换矩阵,A是A的转置。3.3.2离散余弦变换算法离散余弦变换的传统算法是基于FFT的快速算法,本设计主要采用一种新的变换方法基于DCT变换矩阵算法3。变换矩阵方法非常适合做8×8或16×16的图像块的DCT变换,主要利用dctmtx函数来计算变换矩阵。设A是一个M×N大小的矩阵,则D*A表示A的列向量的一维离散余弦变换,而D*A(D表示D的转置)表示A的列向量的一维逆离散余弦变换。要实现A的二维离散余弦变换,只需计算D*A*D。这种计算有时会比
47、利用函数dct2更快,特别是计算大量小的相同尺寸DCT时,矩阵D只需计算一次,因而速度快12。例如,在实现JPEG压缩时,要多次实现大小为8×8的图像块的DCT,为了实现这种变换,首先采用函数dctmtx得到矩阵D,即利用语句D=dctmtx(8),然后,对每一个图像块执行运算B=D*A*D。由于变换矩阵D是实正交矩阵,为此二维逆离散余弦变换为A=D*B*D。这种实现方法比调用函数dct2要快很多。3.4离散余弦算法的实现首先读取图像文件,然后利用dctmtx函数对图像进行离散余弦变换,采用函数dctmtx得到矩阵T,即利用语句D=dctmtx(8),然后,对每一个图像块执行运算B=
48、T*矩阵x*T。然后利用二值掩膜压缩DCT的系数,这里只保留DCT变换的10个系数。最后在对图像进行逆离散余弦变换,显示图像重构的结果。整个算法的处理过程如图5.1所示,程序清单见附录,运行结果见5.1节。导入图片利用dctmtx函数对图像进行离散余弦变换,得到矩阵T对图像的每个不同8×8数据块应用矩阵式p1*x*p2进行处理利用二值掩膜只保留DTC变换的10个系数逆DCT变换,重构图像显示结果 图3.1 离散余弦算法流程图第4章 离散余弦变换的界面实现4.1 图形用户界面简介传统的用户界面是指用户与计算机之间进行交互通信联系的平台,并出现了多种形式的人机交互方式,从命令行的交互方式
49、转变至以图形界面为主的交互形式。现在,图形界面己在人机交互方式中占主导地位,这主要是由于它给用户带来了操作和控制的方便与灵活性。图形用户界面在程序开发中起着举足轻重的作用13。考虑到用户是初学者而且可能是非专业计算机人员,所以晃面的设计与使用十分方便,大多数功能均采用菜单按钮,用户只需要利用鼠标或键盘就能方便地操作它。图形用户界面(Graphical User Interfaces,简称GUI)是一种图形化的沟通界面,通过此界面可以很方便地达到一些特定控制的操作,而这些界面又是由按钮、窗口、工具栏、键盘操作等对象所构成的,以方便借助这些界面调用MATLAB来进行运算处理操作。GUI是未来的趋势
50、,因为人类对于图形辨识的能力远超过其他表达方式,因此借助GUI程序能够设计出专属某个主题的图形化界面,使初次接触的使用者也能够快速且容易上手。另外,MATLAB具有高度的数学运算能力与各种领域的工具箱,若能结合GUI相信所完成的程序会非常实用14。此外,还可以通过help uitools来查阅目前MATLAB中有哪些GUI对象或对话框可以使用,如此可以更节省我们建立GUI的时间。4.2 界面设计的MATLAB实现4.2.1界面设计总体概述系统的程序设计采用MATLAB编程语言来实现。利用MATLAB的图形用户界面(GUI)来设计程序运行的界面。整个系统由若干个运行界面和相应的M函数文件所组成,
51、每一个运行界面对应的程序构成一个M文件。同一个M文件中又包含若干个M函数,界面中的每一个控件及菜单项对应的程序都有放在相应的M函数内。各个功能对应的M函数文件,由一个主文件将它们联成一个整体,最终形成处理系统。 (1) 使用菜单项实现各功能窗口的转换,起导航作用。对菜单的编程主要是调用系统中的其它M函数文件。(2) 打开文件操作可以调用的图像文件格式丰富,除了常用的*.jpg、*.gif外,还包括*.bmp、*.cur、*.hdf、*.ico、*.pbm、*.pcx、*.pgm、*.png、*.pnm、*.ppm、*.ras、*.tif、*.tiff、*.xwd。(3) 文本框主要用于接收用户输入的数据,程序基本上是先从文本框中接收数据,然后对接收的数据进行处理的。(4) 命令按钮是执行运算操作的最主要控件,处理程序主要是放在其相应的M函数内部。实现上编写程序最主要是对命令按钮进行编程。系统的各种处理功能的实现基本上是四个过程:其一是打开原始图像,其二是接收用户输入的参数,其三是把接收的参数带入后台进行处理,第四是将图像处理后的结果显示到界面上。4.2.2 界面设计具体实现MATLAB的图像处理工具箱提供了多个图像压缩界面设计的函数,用于实现图像的压缩界面操作,本次设计主要用到的函数列举如下:(1) 函数名:imread调用格式:imread(file,type)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年延边职业技术学院单招职业适应性测试模拟试题及答案解析
- 中医理疗对慢性肺气肿的改善
- 心理创伤与康复护理
- 免疫第三章免疫器官
- 慢性疼痛管理方法探索
- 医疗机构成本控制与预算优化
- 医学伦理与法律法规研究进展
- 内分泌系统疾病护理与管理
- 2026北京房山区教育委员会所属事业单位招聘专业技术人员120人(一)备考笔试题库及答案解析
- 2025海南航空审计监察负责人岗位招聘1人备考笔试题库及答案解析
- TE1002常见终端产品配置维护-ZXV10 XT802
- 工艺部门技能提升培训计划
- 北京市昌平区2024-2025学年三年级上学期期末数学试题
- 15万吨电解铝工程施工组织设计
- 超精密加工技术期末考试
- 食堂干货调料配送方案(3篇)
- 医院住院部2024工作总结及2025工作计划
- 水泵房卫生管理制度
- 山东中医药大学学位考试-中医学毕业综合考试试题及参考答案
- 病房质量管理分析
- 广西南宁二中、柳州高中2025届高三最后一模物理试题含解析
评论
0/150
提交评论