




已阅读5页,还剩57页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
存档编号 华北水利水电大学 North China University of Water Resources and Electric Power 毕 业 设 计题目 基于BP 神经网络的图像 压缩编码 学 院 信息工程学院 专 业 通 信 工 程 姓 名 学 号 指导教师 完成时间 2015年5月27日 教务处制独立完成与诚信声明本人郑重声明:所提交的毕业设计是本人在指导教师的指导下,独立工作所取得的成果并撰写完成的,郑重确认没有剽窃、抄袭等违反学术道德、学术规范的侵权行为。文中除已经标注引用的内容外,不包含其他人或集体已经发表或撰写过的研究成果。对本文的研究做出重要贡献的个人和集体,均已在文中作了明确的说明并表示了谢意。本人完全意识到本声明的法律后果由本人承担。毕业设计作者签名: 指导导师签名: 签字日期: 签字日期:毕业设计版权使用授权书本人完全了解华北水利水电大学有关保管、使用毕业设计的规定。特授权华北水利水电大学可以将毕业设计的全部或部分内容公开和编入有关数据库提供检索,并采用影印、缩印或扫描等复制手段复制、保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交毕业设计原件或复印件和电子文档(涉密的成果在解密后应遵守此规定)。毕业设计作者签名: 导师签名:签字日期: 签字日期:目 录摘要IAbstractIII第1章 绪论1 1.1 图像压缩概述1 1.2神经网络概述2 1.2.1 神经网络的主要特点2 1.2.2 BP神经网络2第2章 BP神经网络与图像压缩32.1 网络结构32.2 BP网络学习算法42.3网络训练82.4 图像压缩92.5 数字图像压缩编码基础9 2.5.1 图像压缩的基本概念9 2.5.2 图像编码模型112.6 图像压缩编码的评价标准12 2.6.1 信息熵12 2.6.2 评价标准132.7基于小波变换的图像压缩编码14第3章 基于BP神经网络的图像压缩编码及MATLAB仿真173.1 压缩步骤173.2 解压缩步骤213.3 压缩/解压缩仿真结果21 3.3.1 基于BP神经网络的图像压缩编码仿真结果21 3.3.2 基于小波变换的图像压缩编码仿真结果233.4 结果分析24第4章 总结与展望25参考文献26致 谢27附录一 外文文献28附录二 外文翻译33附录三 毕业设计任务书37附录四 华北水利水电大学本科生毕业设计开题报告39附录五 部分源程序42基于自组织神经网络的图像压缩编码摘要传统的图像压缩方法很多,但大多存在压缩比低、误差大的缺点。随着神经网络理论的深入研究,神经网络技术的并行计算能力、非线性映射和自适应能力等优点得到了国内外学者的充分重视,各种神经网络模型在图像处理领域中得到了广泛的应用。BP网络是目前最常用的一种人工神经网络模型,它利用多层前馈网络的模式变换能力实现数据编码,直接提供数据压缩能力。在介绍BP网络图像压缩机原理及算法的基础上,通过计算机Matlab仿真实验实现数字图像压缩,并分析了各种参数对重建图像性能的影响。将基于小波变换的图像压缩编码和基于BP神经网络的图像压缩编码进行了比较。通过图像压缩比和峰值信噪比的比较,找出设计中存在的不足之处。MATLAB(矩阵实验室)是一种直观、高效的计算机语言,本文借助MATLAB进行编程和仿真,进而实现基于神经网络的图像压缩功能,使我们能够更加直观地对基于神将网络的图像压缩编码进一步了解。关键词:BP神经网络;小波变换;图像压缩;图像编码11Image Compression Coding Based On Self-organization Neural NetworkAbstract There are many methods of traditional image compression, but they all have their own limits,lower compression rate and lower compression quality. Artificial neural networks technology research has gone a long way in the past decade. The specialists at home and abroad in the image processing field have paid high attention and been engaged in the advantages of Neural Network techniques such as the abilities of parallel computing,nonlinear mapping and self-adaptiveness,and applied a variety of neural network models into the image processing field.BP neural network is currently the most useful artificial neural network model, it uses a multilayer feedforward network mode to realizedata coding and data compression capability directly. This paper make use of the BP network image compression mechanism and algorithm to manipulate the digital image compression based on Matlab simulation experiment, and analyze the image reconstruction performance influence that the various parameters affected.The image compression coding based on wavelet transform and image compression based on BP neural network are compared. Through the image compression ratio and the comparison of peak signal to noise ratio, find out the deficiency existing in the design.MATLAB (Matrix Laboratory) is a kind of intuitive and efficient computer language. With the help of MATLAB programming and simulation to realize based on self organizing neural network for image compression, so that we can more intuitive based on God network image compression coding is a step in understanding.Keywords:wavelet transform;image compression;image encoding1华北水利水电大学毕业设计第一章 绪论1.1图像压缩概述 随着科学技术的不断发展,日常生活中使用语音、电话、图像、视频等业务在飞速上涨,一方面为生活带来了方便,另一方面,多媒体业务的剧增对有限的频谱资源带来了严峻的挑战,图像压缩技术是一种降低业务数据量的可行方法之一。数字化图像在制作、存储、复制、传输等方面具有很大的优点,但值得我们注意的是,数字化图像的数据量非常庞大。例如,彩色图像的一个像素内存是3字节,一张普通彩色照片的大小即为680*750*3byte=1.53M.在生活中我们经常传输上百张以上的图片,如果不压缩直接传输将是异常的费时费力。大数据量的图像信息会给储存器的储存容量,通信干线信道的带宽,以及计算机的处理速度增加极大地压力。单纯靠增加储存容量、提高信道带宽以及计算机处理速度等方法来解决这个问题是跟不上需求的,因此就需要对图像进行压缩处理。图像数据压缩的可能性是因为图像像素之间,行或者帧之间都存在着较强的相关性。从信息论的角度来看,压缩就是去掉信息中的冗余,即保留确定的信息,去掉不确定的信息(可推知的),也就是用一种更接近信息本质的描述来代替原冗余的描述。一个好的压缩编码方案就是能够最大限度地去除图像中的冗余信息。另外,由于图像最终是由人眼(或通过观测器)来观看的,根据视觉生理、心理特征,可以允许图像经过解码以后有一定的失真,只要这种失真为一般观众难以察觉,或者能够接受。总之,图像压缩编码利用图像的固有统计特性(信源特征),以及视觉生理,心理学特征(信宿特征),或者记录设备和显示设备(如电视监视器)等的特征,从原始图像中经过压缩编码提取有效的信息,尽量去除无用的或者用处不大的冗余信息,一边高效率地进行图像的数字传输或储存,而在复原时仍能够获得与原始图像相差不多的复原图像。一个压缩编码方法优劣主要由三个重要指标来衡量:1.压缩比要高,有几倍,几十倍,也有几百倍乃至几千倍;2.压缩与解压缩要快,算法要简单,硬件实现 容易;3.解压获得的图像质量要好。在进行图像压缩编码的时候,人们总是希望选择压缩比大,恢复效果好且快速的算法。实际研究表明,图像数据实际被压缩多少,不但取决于所采用的方法,而且与给定图像的结构、分布、相关性和特征匹配等因素有关。为了使压缩方法更为有效,应首先了解原始图像的性质,然后选择合适的方法。1.2 神经网络概述 1.2.1 神经网络的主要特点特点神经网络的一般特点可以概括为以下几个方面。1. 自学习和自适应性 自适应性是指一个系统能够改变自身的性能以适应环境变化的能力。当环境变化时,相当于给神经网络输入新的训练样本,网络能够自动调整结构参数,改变映射关系,从而对特定的输入产生相应的期望输出。2. 分布式储存由于神经元之间的相对独立特性,神经网络学习的“知识”不是集中储存在网络中的某一处,而是分布在网络的所有连接权值中。 1.2.2 BP神经网络BP神经网络是一种多层前向型神经网络,某神经元的传递是S型函数,输出量为的连续量,它可以实现从输入到输出的任意非线性映射。由于权值的挑中采用反向传播(Back Propagation)学习算法,因此也常称为BP网络。目前,在人工神经网络的实际应用中,绝大部分的神经网络模型都采用BP网络及其变化形式。他也是前向型网络的核心部分。BP神经网络主要用于以下四个方面。1.函数逼近:用输入向量和相应的输出向量训练一个网络逼近函数。2.模式识别:用一个待定的输出向量将它与输入向量联系起来。3.分类:把输入向量所定义的合适方式进行分类。4.数据压缩:减少输出向量维数以便于传输或储存。第二章 BP神经网络与图像压缩2.1 网络结构 BP神经网络一般是多层的,与之相关的另一概念是多层感知器(Multi-Layer Perceptron,MLP).多层感知器除了输入层和输出层以外,还具有若干个隐含层。多层感知器强调神经网络在结构上由多层组成,BP神经网络则强调网络采用误差反向传播的学习算法。大部分情况下多层感知器采用误差反向传播的算法进行权值调整,因此两者一般指的是同一网络。BP神经网络的隐含层可以为一层或多层。一个包含2层隐含层的BP神经网络的拓扑结构如图2.1所示: 图2.1 BP神经网络的结构从上图中的2个隐含层BP神经网络可以发现,BP神经网络有以下特点:(1) 网络由多层构成,层与层之间全连接,同一层之间的神经元无连接。多层的网络设计,是BP神经网络能够从输入中挖掘更多的信息,完成更复杂的任务。(2) BP网络的传递函数必须可微。因此,感知器的传输函数二值函数不能用。BP网络一般使用Sigmoid函数或线性函数作为传递函数。根据输出值是否包含负值,Sigmoid函数又可分为Log-Sigmoid函数和Tam-Sigmoid函数。一个简单的Log-Sigmoid函数可由下式确定: (2.1)其中x的范围包含整个实数域,函数值在0到1之间,具体应用时可以增加参数,以控制曲线的位置和形状。(3) 采用误差反向传播算法(Back-Propagation Algorithm)进行学习。在BP神经网络中,数据从输入层经隐含层逐层向前修正网络的权值连接。随着学习的不断进行,最终的误差越来越小 。2.2 BP网络学习算法确定BP网络的层数和每层的神经元个数以后,还需要确定各层之间的权值系数才能根据输入给出正确的输出值。BP网络的学习属于有监督学习,还需要一组已知目标输出的学习样本集。训练时先使用随机值作为权值,输入学习样本得到网络的输出。然后根据输出值与目标输出计算误差,再由误差根据某种准则逐层修改权值,使误差减小。如此反复,直到误差不再下降,网络训练就完成了。修改权值有不同的规则。标准的BP神经网络沿着误差性能函数梯度的反方向修改权值,原理与LMS算法比较类似,属于最速下降法。下面介绍两种BP神经网络的学习算法。1.最速下降BP法(1)变量定义:在三层BP网络中,假设输入神经元个数为M,隐含神经元个数为I,输入层神经元个数为J。输出层第m个神经元记为,隐含层第i个神经元记为,输出层第j个神经元记为。从到的连接权值为,从到的连接权值为。隐含层传递函数为Sigmoid 函数,输出层传递函数为线性函数。上述网络接受一个长为M的向量作为输入,最终输出一个长为J的向量。用和分别表示每一层的输入与输出,如表示第I层(即隐含层)第一个神经元的输入。网络的实际输出为: (2.2)网络的期望输出为: (2.3)n为迭代次数。第n次迭代的误差信号定义为: (2.4)将误差能量定义为: (2.5)(2)工作信号正向传播输入层的输出等于整个网络的输入信号:隐含层第i个神经元的输入等于的加权和: (2.6)假设的Sigmoid函数,则隐含层第i个神经元的输出等于: (2.8)输出层第j个神经元的输入等于的加权和: (2.9)输出层第j个神经元的输出等于: (2.10)输出层第j个神经元的误差为: (2.11)网络的总误差: (2.12)(3)误差信号反向传播在权值调整阶段,沿着网络逐层反向进行调整,具体步骤如下:首先调整隐含层与输出层之间的权值,根据最速下降法,应计算误差对的梯度,再沿着该方向反方向进行调整如下所示: (2.13) (2.14)梯度可由求偏导得到。根据微分的链式规则,有: (2.15)由于是的二次函数,其微分为一次函数: (2.16) (2.17)输出传递层函数的导数: (2.18) (2.19)因此,梯度值为: (2.20)权值修正量为: (2.21)引入局部梯度的定义: (2.22)因此,权值修正量可表示为: (2.23)局部梯度指明权值所需要的变化。神经元局部梯度等于该神经元的误差信号与传递函数导数的乘积。在输出层,传递函数一般为线性函数,因此其导数为1,即: (2.24)代入上式,可得: (2.25)输出神经元的权值修正相对简单。误差信号向前传播,对输入层与隐含层之间的权值进行调整。与上一步类似,应有: (2.26)为输入神经元的输出。为局部梯度,定义为: (2.27)为Sigmoid传递函数。由于隐含层不可见,因此无法直接求解误差对于该层输出值的偏导数。这里需要使用上一步计算中求得的输出层节点的局部梯度: (2.28)故有: (2.29)至此,三层BP网络的一轮权值调整的过程就完成了。调整的规则可以总结为:权值调整量。当输出层传递函数为线性函数时,输出层与隐含层之间权值调整的规则类似于线性神经网络的权值调整规则。BP网络的复杂之处在于,隐含层与隐含层之间、隐含层与输入层之间调整权值时,局部梯度的计算要用到上一步计算的结果。前一层的局部梯度是最后一层局部梯度的加权和。也正是因为这个原因,BP网络学习权值时只能从后向前依次计算。2. LM(levenberg-marquardt)算法LM算法是为了在以近似二阶训练速率进行修正时避免计算Hessian矩阵而设计的。当误差性能函数具有平方和误差(训练前向型网络的典型误差函数)的形式时,Hessian矩阵可以近似表示为: (2.30)梯度的计算表达式为: (2.31)式中H包含网络误差函数对权值和阈值一阶导数的雅可比矩阵; e网络的误差向量。雅可比矩阵可以通过标准的前向型网络技术进行计算,比Hessian矩阵的计算要简单。类似于牛顿法,LM算法对上述近似Hessian矩阵按如下形式进行修正: (2.32)当系数为0时,上式即为牛顿法;当系数的值很大时,上式变为步长较小的梯度下降法。牛顿法逼近最小误差的速度更快,更精确,因此因尽可能的使算法接近于牛顿法,在每一步成功的迭代后(误差性能减小),使减小;仅在进行尝试迭代后误差性能增加的情况下,才使增加。这样,该算法每一步迭代的误差性能总是减小的。LM算法是为了训练中等规模的前馈神经网络(多达数百个连接权)而提出的最快速算法,它对MATLAB实现也是相当有效的,因为其矩阵的计算在MATLAB中是以函数实现的,其属性在设置时变得非常明确。本文的基于BP神经网络算法就是采用的LM算法。2.3 网络训练给定一个训练集,修正权值的方式有两种:串行方式和批量方式。工作信号正向传播,根据得到的实际输出计算误差,再次反向修正各层权值。因此串行方式,反向传播算法的串行学习又可称为在线方式、递增方式或随机方式。网络每获得一个新样本,就计算一次误差并计算权值,直到样本输入完毕。在串行方式中,每个样本依次输入,需要的储存空间更少。训练样本的选择是随机的,可以降低网络陷入局部最优的可能性。2.4 图像压缩1.像压缩编码的可能性图像压缩编码的理论基础是信息论。从信息论角度来看,压缩就是去掉信息中的冗余,即保留不确定的信息,去掉确定的信息(可推知的),也就是用一种更接近信息本质的描述来代替原有冗余的描述。一幅图像存在着大量的数据冗余和主观视觉冗余,因此图像数据压缩既是必要的,又是可能的。2.应用环境允许图像有一定的程度失真 (1)接收端图像设备分辨率较低,则可降低图像分辨率。 (2)用户所关心的图像区域有限,可对其余部分图像采用空间和灰度级上的粗化。 (3)根据人的视觉特性对不敏感区域进行将分辨率编码(视觉冗余)。可以利用视觉的这一特性编码去除人眼的视觉冗余。通常人眼能够分辨的灰度级有限,同时,人眼所感受的图像区域物体的亮度不仅仅与物体的反射光有关,还具有马赫带效应、同时对比度、视觉暂留以及视觉非线性等特点,有些信息在通常的视觉感知过程中并不那么重要,这些信息可被认为是视觉冗余,去除这些冗余,人眼是不能够明显感觉到图像质量的降低,视觉冗余也给图像压缩提供了可能。2.5 数字图像压缩编码基础 2.5.1 图像压缩的基本概念 1. 信息相关在绝大多数图像的像素之间,各像素之间,各像素行和帧之间存在着较强的的相关性。从统计观点出发,就是每个像素的灰度值(或颜色值),总是和其周围的其它像素的灰度值(或颜色值)存在某种关系,应用某种编码方法减少这些相关性就可实现图像压缩。2. 信息冗余从信息论的角度来看,压缩就是去掉信息中的冗余。即保留确定信息,去掉可推知的确定信息,用一种更接近信息本质的描述来代替原有的冗余描述。当一幅图像的灰度级别直接用自然二进制编码来表示时,通常会存在冗余。大多数的图像数据存在着不同程度的编码冗余、像素之间的冗余和心理视觉冗余。由于大多数图像的直方图不是均匀(水平)的,所以图像中某个(或某些)灰度级会比其他灰度级具有更大的出现概率,如果对出现概率大和出现概率小的灰度级都分配相同的比特数,必定会产生编码冗余。更一般的讲,当被赋予事件集的编码(比如灰度级值)如果没有充分利用各种结果出现的概率时,就会出现编码冗余。所谓像“素间的冗余”,是指单个像素携带的信息相对较少,单一像素对于一幅图像的多数视觉贡献是多余的,它的值可以通过与其相邻的像素的值来推断。这种反映像素间的依赖性的“素间的冗余”通常是空间冗余、几何冗余和帧间冗余的统称。对于以改善视觉效果为目的的某些应用来说,用户通常允许图像有一定程度的失真;对于以特征提取和目标识别为目的的某些应用来说,用户通常关心的是那些边缘和轮廓信息,允许丢掉与其无关的信息。心里视觉冗余是指在正常的视觉处理过程中那些不十分重要的信息。心里视觉的产生是因为人类对图像信息的感知并不涉及对图像中每个像素值的定量分析。通常,观察者寻找可区别的特征,比如边缘或者文理区域,然后在心里将其合并成可识别的组群,最后,通过大脑将这些组群与先前已有的知识相联系以便完成图像的解释过程。3. 信源编码及其分类图像压缩的目的是在满足一定的图像质量条件下,用尽可能少的比特数来表示原图像,以减少图像的存储容量和提高图像的传输效率。在信息论中,把这种高通过减少冗余数据来实现数据压缩的过程称为信源编码。信源编码分为无失编码和有失真编码两大类。无失真压缩用无失真编码方法实现,有失真压缩用有时真编码方法来实现。无失真压缩也称为无损压缩,是一种在不引入任何失真的条件下使表示图像的数据比特率为最小的压缩方法。无损压缩是可逆的,即从压缩后的图像能够完全恢复出原图像而没有任何信息损失。有失真压缩也称为有损压缩方法,是一种在一定比特率下获得最佳保真度,或在给定的保真度下获得最小比特率的压缩方法。由于有损压缩有一定的信息损失,所以是不可逆的,即无法从压缩后的图像恢复出原图像。2.5.2 图像编码模型1. 图像编码系统模型图像编码的主要目的是图像数据的压缩,所以一个完整的图像编码系统模型主要由通过信道连接的编码器和解码器组成,如图2.5所示。 信源编码器 信道编码器 信源解码器 信道解码器 信道 图2.5 图像编码系统模型编码器的输入是原图像,输出是编码器产生的一组符号。这组符号经过信道传输后,作为解码器的输入进入解码器,解码器的输出是解码重建的图像。编码器由一个用于消除输入冗余的信源编码器和一个用于增强信源编码器输出的抗干扰、抗噪声能力的信道编码器组成。与编码器相对应,解码器由一个信道解码器和一个信源解码器组成。如果连接编码器和解码器之间的信道是无干扰和无噪声的,则在符号的传输过程中就不会产生误差,信道编码器和信道解码器就都可以不要,这是编码器和解码器就分别只由信源编码器和信源解码器祖成。信道是连接信息源和用户的物理媒介。信道可以是电话线、电缆、电磁能量传输路径或数字电子计算机中的数据线。2. 信道编码器和信道解码器 信道编码器和信道解码器是一种用来实现抗干扰、抗噪声的可靠数字通信技术措施,当传输信道是有噪声的或易产生错误时,信道编码器和信道解码器就会在整个编解码处理和信息传输过程中起到十分重要的作用。信道编码器是通过向信源编码数据中插入可控制的冗余数据来减少对信道噪声的影响的。3. 信源编码器模型和信源解码器模型映射 变换器在信息论中,把通过减少冗余来压缩数据的过程称为信源编码。显然,信源编码器的作用就是减少或消除输入图像中的编码冗余。特定的应用和与之联系的保真度要求规定了在给定条件下所使用的编码方法。具体信源编码器模型如图2.6所示:符号编码器量化器 信道编码器或信道 图2.6 信源编码器模型 对于图2.7所示的信源解码器来说,其操作次序、原理及其功能正好与信源编码器相反。符号解码器反量化器反向映射变换器信道 图2.7 信源解码器模型2.6 图像压缩编码的评价标准2.6.1 信息熵信息消息的不确定度量,消息的可能性越小,其蕴含的信息量就越大,即不确定性程度越大;反之,消息的可能性越大,其信息越少,即不确定性越小。假设从N个数中选中某个数x的概率为P(x),则根据Shannon(香农)理论,定义其信息为: (2.33)如果将信源所有可能事件的信息量进行平均,就得到信息熵(entropy),所谓熵就是平均信息量。信源x的符号集为,设出现的概率为,则信息x的熵为 (2.34)根据Shannon(香农)无噪声编码定理,对于熵为H的信号源,对其无失真编码,所能达到的最大值为/每符号,这里为一任意小的正数,因此可能达到的最大压缩比为: (2.35)方均信噪比为: (2.36)均方根信噪比为: (2.37)2.6.2 评价标准在图像压缩编码中,解码图像与原始图像可能会有差异,因此,需要评价压缩后图像的质量。描述解码图像相对于原始图像偏离程度的测度一般称其为保真度(逼真度)准则。常用的准则可分为客观保真度准则以及主观保真度准则两大类。1.客观保真度准则最初常用的客观保真度准则是原始图像和解码图像之间的方均根误差和方均根信噪比两种。令代表原始图像,代表对先压缩在解压后得到的的近似,对任意x和y,和之间的误差定义为: (2.38)若f(x,y)和 均为M x N ,则他们之间的方均根误差为: (2.39)如果将 看做原始图像噪声信号的和那么解压图像的方均根信噪比 为 (2.40)如果对上面的式子求平方根,就得到了方均根信噪比。实际使用中常将归一化并用分贝(dB)表示,令 (2.41)则有 (2.42) 如果令(其中,)则可能得到峰值信噪比PSNR: (2.43)2. 主观保真度准则尽管客观保真度准则提供了一种简单、方便的评估信息损失的方法,但很多解压缩图像最终是供人观看的。事实上,具有相同客观保真度的不同图像,对人的视觉可能产生不同的视觉效果。这是因为客观保真度准则是一种统计平均意义下的度量准则,它对于图像中的细节无法反映出来。而人的视觉系统却具有独特的特性,能够察觉出来。在这种情况下,用主观的方法来谢亮图像的质量更为合适。一种常用的方法是对一组(不少于20人)观察者显示图像,并将它们对该图像的评分取平均,用来评价一幅图像的主管质量。2.7 基于小波变换的图像压缩编码小波变换是在短时傅里叶变换的基础上发展起来的一种新型变换方法,他是一种时频分析法,具有多分辨率分析(Multiresolution Analysis)的特点,而且在时、频域都具有表征信号局部特征的能力,是一种窗口大小不变、形状可变、时间窗和频率窗都可以改变的时频局部化分析方法。小波变换由于具有很好的时频特性而且可以匹配人类视觉系统的特性,因而得到图像压缩编码领域的极大关注。小波分析在图像领域的应用应归功于Mallat。1987年,Mallat巧妙地将计算机视觉领域内的多尺度分析思想引入到小波分析中小波函数的构造,从而统一了在此之前的各种小波的构造方法。Mallat研究了小波变换的离散形式,并将相应的算法应用于图像的分解与重建,为随后的小波图像压缩奠定了基础。进入90年代,利用小波进行图像压缩的研究得到了空前的关注。这一时期正是互联网蓬勃兴起的时候,因此如何适应网络的特点进行图像编码得到了重视。1993年,Shapiro首先将零树的概念引入到小波图像压缩中,这种称为EZW的方法可以对图像进行渐进性编码,具有很高的压缩性能,非常适合于网络图像的传输与浏览。对于图像来说,如果需要进行快速或实时传输以及大量存储,就需要对图像数据进行压缩。在同样的通信容量下,如果图像数据压缩后再传输,就可以传输更多的图像信息。例如,用普通的电话线传输图像信息。图像压缩研究的就是寻找高压缩比的方法且压缩后的图像要有合适的信噪比,在压缩传输后还要恢复原信号,并且在压缩、传输、恢复的过程中,还要求图像的失真度小,这就是图像压缩的研究问题。图像数据往往存在各种信息的冗余、如空间冗余、信息熵冗余、视觉冗余和结构冗余等等。所谓压缩就是去掉各种冗余,保留对我们有用的信息。图像压缩的过程常称为编码。相对的,图像的恢复就是解码。图像压缩的方法通常可分为有失真编码和无失真编码两大类:无失真编码方法如改进的霍夫曼编码。有失真编码方法的还原图像较之原始图像存在着一些误差,但视觉效果是可以接受的。常见的方法有预测编码、变换编码、量化编码、信息熵编码、分频带编码和结构编码等。在小波分析中也有两个重要的数学实体:“积分小波变换”和“小波级数”。积分小波变换是基小波的某个函数的反射膨胀卷积,而小波级数是称为小波基的一个函数,用两种很简单的运算“二进制膨胀”与“整数平移”表示。通过这种膨胀和平移运算可以对信号进行多尺度的细致表示。通过这种膨胀和平移运算可以对信号进行多尺度的细致的动态分析,从而能够解决Fourier变换不能解决的许多困难问题。利用小波变换可以一次变换整幅图像,不仅可以达到很高的压缩比,而且会出现JPEG重建图像中的“方块”效应,但编码器复杂,有潜像问题。由于小波及小波包技术可以将信号或图像分层次按小波基展开,所以可以根据图像信号的性质以及事先给定的图像处理要求确定到底要展开到哪一级为止,从而不仅能有效地控制计算量,满足实时处理的需要,而且可以方便地实现通常由子频带、层次编码技术实现的累进传输编码(即采取逐步浮现的方式传送多媒体图像)。这样一种工作方式在多媒体数据浏览、医学图片远程诊断时是非常必要的。另外,利用小波变换具有放大、缩小和平移的数学显微镜的功能,可以方便地产生各种分辨率的图像,从而适应于不同分辨率的图像I/O设备和不同传输速率的通信系统。相比之下,利用KL变换进行压缩编码,只能对整幅图像进行;而利用小波变换则能够比较精确地进行图像拼接,因此对较大的图像可以进行分块处理,然后再进行拼接。显然,这种处理方式为图像的并行处理提供了理论依据。第3章 基于BP神经网络的图像压缩编码利用BP神经网络做图像压缩和解压缩的过程如图3.1所示:熵编码BP网络训练归一化图像块划分 熵解码图像块重建反归一化BP网络解码图3.1 压缩解压过程其中,熵编码过程针对神经网络压缩的输出进行,进一步去除统计冗余。3.1 压缩步骤1. 图像块划分简单起见,这里将所有输入图像的大小调整为128*128像素大小。为了控制神经网络规模,规定网络输入神经元节点个数为16个,即将图像划分为1024个4*4大小的图像块,将每个图像块作为一个样本向量,保存为16*1024大小的样矩阵,如图3.2所示:图3.2 图像块的划分归一化。神经网络的输入样本一般都需要进行归一化处理,这样能够保证性能的稳定性。归一化可使用 mapminmax 函数进行,考虑到图像数据的特殊性,像素点灰度值为整数,且处于0到255之间,因此归一化处理统一将数据除以255即可。例如,读入一幅图像,进行归一化处理:I=imread(lena.bmp);imshow(I);I0=double(I)/255;%归一化处理min(I0(:),max(I0(:)ans=0.0745 0.9608可见,归一化后图像的数据处于0.0745到0.0968之间,位于区间内。这样做还有一个好处,如果使用 mapminmax 函数,需要出巡每一行数据的最大值和最小值,这样最终的压缩数据里必须包含这一部分数据,使得压缩率下降。2. 建立BP神经网络采用MATLAB 神经网络工具箱的feedforwardnet 函数创建BP神经网络,并制定训练算法。为了达到较好的效果,采用LM训练法。同时确定目标误差和最大迭代次数。然后,就可以调用 train 函数进行训练了。tic 和 toc 用于记录训练时间 。如图3.3所示为BP网络训练的界面。从网络训练界面可以看出该网络的基本信息输入层和输出层神经元的个数为4个,隐含层神经元的个数为N=2。Algorithm栏表示是相关参数。Epoch表示训练的次数,500表示最大训练次数,从图中可知,N=2时的真实训练次数为6次;Times表示的是训练时间为15秒;Performance表示的是程序中指定的训练结束参数,只要有一个参数满足条件即结束训练,0.197是初始值,0.001是结束值,即程序里的goal,0.000975是当前迭代时得到的Mean Squared Error(均方误差);Gradient表示的是误差曲线的梯度;变量mu确定了学习是根据牛顿法还是梯度法来完成。Plots指的是各种曲线,按下每个按钮,即可出现不同的曲线,代表不同的意思。如图3.3a所示,为依次点击三个按钮所得到的图像。点击Performance可以得到训练过程的变化图像,其中Goal表示性能目标,Best表示所能达到的最好状态;点击Traning State按钮,可以对详细的训练状态进行详细的了解,由上而下分别表示误差曲线梯度、mu代表的是函数trainlm中的参数和有效性检查。Error Histogram表示限定误差直方图。点击Regression按钮得到的是依次是训练样本、验证样本、测试样本和全部样本的回归系数啊,越接近于1越好,也就是两根线越接近越好。图3.3 BP网络的训练界面图3.3a训练BP之后的参数图3.3a训练BP之后的参数3. 保存结果训练完成后,压缩的结果是每个输入模式对应的隐含神经元向量的值,一级网络的权值和阈值,以及网络的权值和阈值。将输入模式输入网络,与输入层和隐含层之间的权值矩阵相乘,再用 Sigmoid 函数处理,即可得到隐含神经元的值。 (3-1)此时得到的结果为浮点数,为了提高压缩效率,将其量化为比特的整数。方法是先对矩阵进行归一化,使其范围固定在之间,再乘以,最后取整即可。在MATLAB中使用save 命令可将变量保存至文件的命令方式如下:save comp com minlw maxlw minb maxb mind3.2 解压缩步骤1. 加载文件。使用load 命令加载数据文件。2. 数据反归一化。每一个数据乘以,得到之间的小数,再将其映射到数据原区中去。形式如下:com.lw=double(com.lw)/63;com.lw=com.lw*(maxlw-minlw)+minlw;3. 重建。此时的数据为BP神经网络隐含层的神经元输出值,为了重建图像,需要将其输出到网络中,与隐含层和输出层之间的权重矩阵相乘。4. 图像反归一化。图像反归一化不需要使用自定义的区间范围,只需将每份数据乘以像素峰值255,并取整即可。5. 图像恢复。假设划分图像块时,以4*4为单位进行划分,则矩阵应为16*N大小。每一列抽取出来,重新排列为4*4矩阵,并对各个矩阵按行进行排列,即可恢复原图像。 3.3 压缩/解压代仿真结果本次仿真用的电脑处理器是Intel(R) Core(TM) i5-4200H CPU 2.80GHz 2.79GHz;内存4.00GB;64位操作系统。3.3.1 基于BP神经网络的图像压缩编码仿真结果1. 首先先对图像进行预处理,之后建立神经网络设置参数,其次使用要进行压缩的图像对神经网络进行训练,使用bp_imageCompress党阀,并调用block_divide函数,实现图像的压缩;最后对图像进行重建,使用bp_imageRecon方法,并调用re_divide函数。具体的源程序见附录。2. 仿真结果如图3.4所示,此时的隐含层神经元数目为N=8时的原图像和重建
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 云南省通海县2025年上半年事业单位公开遴选试题含答案分析
- 云南省建水县2025年上半年事业单位公开遴选试题含答案分析
- 云南省福贡县2025年上半年事业单位公开遴选试题含答案分析
- 梦想总会实现!中英互译
- 河北省威县2025年上半年公开招聘城市协管员试题含答案分析
- GB∕T 44927-2024 《知识管理体系 要求》之22:9绩效评价-9.2内部审核专业深度解读和应用指导材料(雷泽佳编制-2025A0)
- 2025版淘宝商家网络营销与推广合同
- 2025房地产分销合作协议范本:精准营销服务
- 2025年度食品行业展会代理服务合作协议书
- 2025年二婚离婚协议书起草及执行细则范本
- 地下矿山地压管理制度
- ktv卫生承包协议书
- 藏文考试试题及答案
- 施工水电费合同协议书
- 车辆动力学分析考试试题及答案
- 2025-2030中国毫米波雷达行业发展分析及发展趋势与投资前景预测研究报告
- 2025年格力中央空调销售安装合同范本
- 中医药材的炮制与存储
- Unit1-A-Lets-spell教学课件【河南郑州管城区】
- 2025年中国机械传动部件行业市场发展前景及发展趋势与投资战略研究报告
- 正确测量血压的操作方法
评论
0/150
提交评论