【《图像最大熵分割算法的改进实现研究》9700字】_第1页
【《图像最大熵分割算法的改进实现研究》9700字】_第2页
【《图像最大熵分割算法的改进实现研究》9700字】_第3页
【《图像最大熵分割算法的改进实现研究》9700字】_第4页
【《图像最大熵分割算法的改进实现研究》9700字】_第5页
已阅读5页,还剩18页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

页(共23页)第一章:绪论1.1图像分割的熵方法背景数字图像处理技术在各个领域都有广泛的运用。在计算机科学不断发展的今天,图像处理和分析逐渐形成了自己的科学体系,不断有新的图像处理方法在各个领域里涌现,并且引起各方面人士的广泛关注[1]。图像分割是图像识别和计算机视觉等数字图像处理应用中相当关键的第一步。分割指的是将一副数字图像细分为其组成的区域或对象,其精细度决定了计算机化的分析是否能够成功,没有正确的分割就不可能有正确的识别。但是,进行分割只有数字图像中像素的亮度信息和颜色信息作为分割依据,在计算机自动处理图像分割时,将会遇到各种困难[2]。例如,光照不均匀、噪声的影响、图像中存在不清晰的部分,以及阴影等,常常发生分割错误,因此图像分割是需要进一步研究的技术[3]。在数字图像处理长达60余年的发展过程中不断有各种图像分割方法出现,如:(1)基于直方图形状,(2)基于聚类,(3)基于熵,(4)基于对象属性,(5)空间分析,(6)局部方法[4]。其中阈值分割是最常用的一类方法,其原理简单,容易实现,对阈值的选则直接影响分割的合理性和最终计算机处理效果,所以又衍生了很多种对阈值分割的方法[5]。从20世纪80年代开始,利用香农熵的较好的有效性、鲁棒性和合理性来进行阈值选择的图像分割方法开始受到研究者的关注。在图像的熵方法中,不断有研究者提出各种改进的算法[4]。1.2熵方法的发展现状图像分割的熵方法分为五类:(1)基于直方图形状的熵方法,(2)基于熵测度的聚类方法,(3)基于对象属性熵方法,(4)基于熵的空间分析方法,(5)局部熵方法,进一步概括为三种:一维熵方法:基于全局信息;二维(高维)熵方法:基于局部信息;交叉熵方法[6]。从Pun首次考虑使用信息熵来进行图像分割阈值的选择,随后Kapur等人提出了最大香农信息熵阈值选择法[7],接着Abutaleb和Brink在一维的基础上将灰度图提升为二维直方图,实现了二维直方图的最大熵阈值法[8]。但因为二维阈值的算法运算耗时长,后来又提出了快速递归二维熵算法。但引入了近似,可能会使分割个结果不够准确[9]。综上所述,现有方法只是单一从算法上进行递推运算来减少运算量,对图像的抗噪声能力还有所不足,而本文通过建立邻域的模板来提升抗噪能力,通过量化二维直方图来进一步减小数据的运算量,从而改进二维最大熵法。1.3本文主要工作内容本文第二章讨论熵方法的概念,推导了一维、二维的最大熵阈值分割法,并讨论了适用范围和不足之处,通过推导过程和对不足的研究,决定对二维灰度直方图的最大熵算法进行改进。第三章将通过三个方面具体对二维最大熵法进行改进:(1)改进邻域模板,使用改进的中值4-角域模板代替均值8-邻域模板来建立二维灰度直方图,在兼顾均值模板对高斯噪声的抵抗性的同时,加入的中值模板对椒盐噪声也有不错的处理效果;(2)量化二维直方图,首先验证了适合的量化不会破坏直方图的结构,保证分割的准确性,其次推导了量化后的阈值与原阈值的关系,通过m=5的步长对二维灰度直方图进行量化,在保持原直方图细节的同时尽可能的减小运算量;(3)进行递推运算,通过递推公式计算二维灰度直方图的图像熵,减少在图像熵的计算中重复的运算过程,将复杂度为O(L4)的运算过程降O(通过以上三个方面,最终实现对最大熵的图像分割算法的改进。第四章通过与第二章一维、二维的最大熵法同分割3幅图像,比价之间的抗噪能力,分割效果,运算速率,最终得出结果:本文的改进算法相比之前的算法在性能和适用性上有不错的提升。

第二章:图像最大熵分割法2.1熵方法的概念对于一个有n个状态的系统的熵来说,其信息熵定义为[10-11]:H(1)其中pi是第i个状态发生的概率,且i=1n pi=1,0⩽pi⩽1,事件的不确定性越大,Δ(2)明显看出其测度的数学期望即为其信息熵,即H=E(3)但若概率为0时式(2)、式(3)均无定义,于是将信息增益表达为[12]Δ(4)于是给出指数熵的定义H=E((5)式(5)与式(3)是等价的,而且前者在概率闭区间为连续的,图1给出的2状态系统的香农熵和指数熵与事件概率的关系图中可以看出等价图1 2个状态系统的概率和香农熵与指数熵分布由式(5)、式(3)以及图1可得,熵与系统的概率的关系有以下4个特性[4](1)当事件可能性极高或者极低时,信息增益的期望一定在两个有限极限值附近(2)当所有事件的概率都相等时,熵为最大;H(6)(3)当事件发生概率为0.5时,该事件的熵为最大;(4)当概率大于或者小于0.5时,熵都在递减;图像分割的较为准确严密的定义为[13]:将图像细分为其组成区域或对象,而其本质为寻找能够将目标像素与背景分割开来的最优机制,熵方法进行图像分割就是选择一个或多个恰当的阈值,将图片分割为两个或多个合集,而这些合集对应的像素的概率又分别构成多个事件,这些事件的信息增益的数学期望就是熵。在接下来讨论的最大熵,就是当熵取到最大值后,根据式(6)可得,图像的多个合集的概率最接近,此时获得最优化的图像分割阈值。图像分割的熵方法本质,是借助熵的优化评价的能力以及对事物信息量的数理异同性测度能力,构造不同的熵函数,以来确定最优度量或最优控制,实现图像分割的最优阈值确定[4]。2.2最大香农信息熵阈值法最大香农熵阈值法也就是一维最大熵方法,是基于一维直方图的一种高效经典的图像分割方法,其中有一维泊松分布假设法,一维两元统计法和一维多元统计法。2.2.1一维熵阈值法原理在一副灰度图中,每个像素点的灰度为0到255,当统计完一幅图的所有灰度以及每个灰度的像素点数后,我们就得到了一副如图2所示的一维直方图。图2 Lena以及其一维灰度直方图其中横坐标,纵坐标分别为灰度值和像素数量,由此我们可以得到pi=Ni/N,其中Ni为第设t为阈值,则有g其中gx,y为输出图像在坐标(x,y)的灰度值,fx,y为原图像在坐标(x,y)的灰度值。对于t,有Pt=i=02.2.2三种一维熵方法当认为感光度一致时,则图像灰度值服从泊松分布[12],此时我们将目标和背景看成两个泊松分布的参数,数字图像则由目标和背景两个多元事件的泊松分布混合二次,设λO对应目标,λB对应背景,此时的t应满足λB>t>λH(7)此时我们称其为一维熵的泊松分布假设法当用下式计算图像的后验熵:H(8) 且以HL'(t)最大时的t作为阈值,此时将图像中的Pt与当使用下式计算图像的后验熵时[14]:H(9)我们考虑两个概率分布的情况,i=0t p2.2.3最大香农信息熵阈值法缺点根据实验可得,当我们使用式(7)泊松分布进行图像分割时,切割效果较好,但需要预先估计泊松分布的参数,这需要以先验经验为条件,而且使用泊松分布必须在假设感光度一致,许多图像都不符合,所以有较大的局限性;当我们使用式(8)时,取得的最大熵为阈值,虽然满足熵的第二特性,但是不恰当,因为我们所取到的熵为一维直方图的概率分割点,不一定恰好对应图像的目标和背景的分割点,不够合理。当我们使用式(9)时,认为目标和背景是两个相关的独立事件,并且对目标和背景的像素概率及其熵采取独立计算,分割方法较为合理,符合图像分割的本质特征,但由于是采用一维直方图来选择阈值,会导致在图像出现噪声的情况下,分割效果大打折扣[4]。2.3二维直方图的最大熵阈值法二维直方图的最大熵阈值法简称为二维最大熵法。为了能够解决一维最大熵方法的不足,Abutaleb和Brink在一维的基础上将灰度图提升为二维直方图。相比于一维直方图,二维直方图加入了邻域灰度,将点灰度和邻域灰度特征相结合,可以更好地表示图像的信息,提高图像分割的抗噪能力。2.3.1二维最大熵法的原理二维直方图除了需要统计点灰度值,还要统计每一个点的n*n(n一般为奇数)邻域的平均灰度。设大小为N*N的灰度图,其灰度取值范围为[0,L],在x,y坐标的像素的灰度值为fx,y,其g(x,y)=(10)其中,[n/2]取整。将图像用灰度-邻域平均灰度的数据对表示为[fx,y,gx,y]f(11)此时相比于一维直方图只统计某一灰度的像素点数,二维直方图需要统计[fx,y,gpi=1(12) 则{pij图3 Lena以及其二维灰度直方图图4 二维直方图的XOY平面分割矢量S,T将直方图分为4块,根据图像的同态性:在目标或者背景的地方,像素的灰度值与邻域平均灰度值数值差异小,在目标和背景的交界处,像素的灰度值与邻域平均灰度值数值差异大[15]图4 二维直方图的XOY平面此时找出A,B区的后验熵相加,当图像熵最大时对应的S,T就为最佳分割阈值。A,B区的后验概率为:P(13)则其后验熵为:HH(B)=−(14)设:H(15)则有:H(16)则熵的判别函数为:φ(17)当φ(S,T)最大时,我们可以得到最优的阈值S,T.2.3.2二维最大熵法的不足从对图像适用性上来看,二维最大熵法在抗噪声能力上明显大于一维最大熵法,然而,广义二维最大熵方法只是将一维优化扩展到二维优化,导致运算量按指数增加,其运算过程为一个四重循环,计算复杂性为OL4,耗时太长,难以实用

第三章:改进的图像最大熵分割算法本文将从邻域模块的改进,二维直方图的量化,递推算法三部分来对二维最大熵图像分割算法进行改进,在减小噪声的影响,保证一定精度的同时也要将计算复杂性从OL4降至3.1改进的邻域模板在使用二维最大熵法进行图像分割时,构建合理的二维灰度直方图决定了图像分割的质量,而在二维直方图的构建中,通过邻域模板建立的邻域图像可以有效的提升图像分割的抗噪能力,使其优于一维最大熵法。在以往的二维最大熵算法中,一般将邻域n值取3,然后通过均值模板建立邻域图像,即均值8-邻域模板1该模板只能有效消除高斯噪声,但对椒盐噪声没有抗噪能力,如图5(b)所示。本文运用改进的中值4-角域模板[9],来增加模板的适用性,并且在一定程度上减小其运算量。中值模板即使图像进行中值滤波,是一种非线性平滑技术。它从图像中的某个采样窗口取n个数据进行排序,然后用排序后的中值代替待处理的数据,从而达到抑制图像噪声的目的[17]。而为了可以提高像素与其邻域中值像素的差异,同时兼顾对高斯噪声和椒盐噪声的抵抗性,提高分割性能,我们采用中值4-角域模板1建立邻域图像。图5 不同模板处理椒盐噪声结果(a)加椒盐噪声 (b)均值8-邻域模板 (c)中值图5 不同模板处理椒盐噪声结果如图5所示,对比图5(b)和图5(c)可得出该模板的优势,在对加了椒盐噪声的图5(a)进行处理后,均值8-邻域模板处理结果使噪声成气泡状,没有消除噪声,效果明显差于中值4-角域模板处理后的图像。3.2量化二维直方图由式(17)可知,当计算最大熵时需要对每一个灰度级的目标和背景的后验熵都进行一次计算,因此如果能减少灰度级的数量,则可以大大简化运算量,提升运算速率。而量化直方图将把图像以某一适合的量化步长进行量化,使得灰度级数减少,如原始图像的总灰度级为L,取量化步长Δl=l/2m,就可使灰度级数目减少到设原直方图为f(x),灰度范围为x∈D,量化后的直方图为g(y),灰度范围为y∈D'则有D=D(18)其中,y'g(19)令ε=ygε(20)由式(20)可得,原直方图经过尺度变换后得到量化直方图,则原直方图与量化直方图结构一致。设原图的阈值为t且用式(9)计算最大熵,量化后的直方图阈值为t',则从−∞到Q=(21)其目标与背景的后验熵为[19]S=−(22)S=−(23)lnQ=ln(24)通过式(24)与式(9)对比可得t=(25)至此,只要求出量化后直方图最大熵分割阈值即可得到原图的分割阈值。对于灰度阶数较高的图像,该方法能明显减少运算量,但要合理进行量化必须取合适的步长,一般情况下l/2<Δl=l/2m<l,若步长较大,会导致量化后图像与原图像相比相差大,使得某些峰值合并;若步长过小,则量化直方图的方法对运算速度的改善将不明显,一般情况下灰度级为2563.3快速递推算法3.3.1递推算法的推导在第二章所介绍的二维最大熵法中,对于每一个阈值对s,t,都要计算其H(A),H(B),计算过程为四重循环,在运算过程中十分耗时,不符合实际应用。为了进一步提高计算效率,减少重复计算,我们采用递推算法进行计算[20]。首先通过式(14)(15)推算得出H(26)则φs,tφs,tHL(27)其中,HL为定值,此时只需计算H(A),即HA和当我们计算φs,t+1时,需要计算HA(s,t+1)和PP(28)H(29)此时,PA与HP(30)H(31)设Pst+1=P(32)HAs,(33)此时,当n取0到时L−t0,已经没有重复计算了,但当s取1到L时仍然存在重复计算,此时我们需要推到PstP(34)Hs+1=H(35)此时,Pst和P(36)H(37)此时,有递推公式:P(38)Hs+n(39)此时计算HA和PA不在有重复计算,计算复杂度从OL3.3.2计算步骤(1)统计量化二维灰度直方图的灰度信息,计算和统计pij(2)根据公式(27)计算HL(3)根据公式(32)(33)(38)(39)计算{φ根据式(34)(35)计算根据式(34)(35)计算Pst+1PHP根据式(27)计算φφ开始结束s=1t=1s>Lt>L?PHs=s+1t=1t=t+1(4)找出最大熵max{φs,t}

第四章:实验结果对比及分析为了验证本文算法相比第二章的两种分割方法有更好的抗噪性,更快的运算速度,更优的切割性,本文选用了三幅图片进行实验,三幅图的参数见表1。本文实验使用MATLAB2018进行,在CPU为IntelCorei7-7700HQ,主频2.8GHz,内存为DDR4,16GB的笔记本上完成,操作系统为Windows10,64位。表1 实验图像参数测试图像图像参数噪声情况尺寸灰度阶数Lena.jpg高斯噪声512×51222-255Library.jpg椒盐噪声667×6640-255Tower.jpg无1342×13422-249 (a)加高斯噪声的Lena (b)一维最大熵法处理后 图6 加高斯噪声的Lena及处理结果(c)二维最大熵法处理后 图6 加高斯噪声的Lena及处理结果 从图6可以看出,在处理加高斯噪声的图片时,一维最大熵法效果极差,分割出的图像主体与背景没有分开且噪点杂乱,二维最大熵法和改进最大熵法处理结果较好,其中改进最大熵法最好,对高斯噪声有很好的抑制作用,分割效果明显。 (a)加椒盐噪声的Library (b)一维最大熵法处理后 (c)二维最大熵法处理后 (d)改进最大熵法处理后图7 加椒盐噪声的Library及处理结果从图7可以看出,对于椒盐噪声一维最大熵法处理后依旧有很多噪点,证明一维最大熵法对噪声没有抑制能力。二维最大熵法比一维最大熵法分割效果要好些,但仍有部分噪点无法消除。改进最大熵法处理效果最好,细节还原,锐度好,且图像噪点被抑制。 (a)原图Tower (b)一维最大熵法处理后 (c)二维最大熵法处理后 (d)改进最大熵法处理后图8 未加噪声的Tower即处理结果时间对比:表2 各图像各方法处理时间测试图像运行时间一维最大熵二维最大熵改进最大熵Lena.jpg15.30s26.33s24.16sLibrary.jpg16.24s41.61s35.08sTower.jpg24.02s207.08s116.40s从图8可以看出,图片未加噪时,三种方法处理效果都较好。通过表2的时间对比可以看出,在处理小数据量的情况下,改进最大熵法比较与二维最大熵法用时接近,但当数据量增大后,改进最大熵法的运算时间明显短于二维最大熵,且随着数据量的增大越来越明显,说明改进最大熵算法在处理大量数据时运行速率要大大优于二维最大熵法。实验证明,本文提出的改进最大熵算法在二维最大熵法的基础上能够保证分割质量优秀,同时运算速率得到提高。结论本文介绍了图像分割的熵方法,详细讨论了一维最大熵方法,二维最大熵方法,并且分析了其中的优劣,提出了一种改进的最大熵图像分割法,通过改进邻域模板建立合理二维灰度直方图,提升抗噪能力,然后对二维灰度直方图进行量化,通过推导验证了量化直方图可以合理减小数据量,最后推出快速递推公式,使其计算最大熵时,大大提高计算速率。在最后的实验中证明了该方法确实提升了抗噪能力,且对运算效率有极大提升,加强了算法的实用性。但由于本人能力不足,该算法在一些方面还有不足:使用的中值邻域模板可能会造成图像不连贯,在量化二维直方图时是用先验经验来确定m的取值,最后的最大熵寻找过程仍然有其他更好更复杂的算法可以代替。参考文献[1]谢凯,王新生.基于灰度迭代阈值的高分辨率影像分割研究[J].湖北大学学报(自然科学版),2013,35(02):252-257.[2]吕以茜.关于熵的连续性定理的证明[J].淮阴工学院学报,2019,28(03):98-100.[3]缪小勇,周佳虹,戴颖,陆丹.计算机图像处理在我们工作生活中的应用[J].电子世界,2015(20):189-190.[4]曹建农.图像分割的熵方法综述[J].模式识别与人工智能,2012,25(06):958-971.[5]SezginM,KocaeliG,SankurB.SurveyoverImageThresholdingTechniquesandQuantitativePerformanceEvaluation.JournalofElectronicImaging,2004,13(1):146-165[6]ChangC,DuY,WangJ,etal.SurveyandComparativeAnalysisofEntropyandRelativeEntropyThresholdingTechniques.Vision,ImageandSignalProcessing,2006,153(6):837-850[7]PalNR,PalSK.Areviewonimagesegmentationtechnique[J].PatternRecognitionLetters,1999,26(9):1277-1294[8]陈果,左洪福.图像分割的二维最大熵遗传算法[J].计算机辅助设计与图形学学报,2002(06):530-534.[9]张新明,张爱丽,郑延斌,孙印杰,李双.改进的最大熵阈值分割及其快速实现[J].计算机科学,2011,38(08):278-283.[10]ShannonCE,WeaverW.TheMathematicalTheoryofCommunication.Urbana,USA:UniversityofIllinoisPress,1949[11]ShannonCE.AMathematicalTheoryofCo

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论