




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
华北水利水电学院硕士学位论文基于医学影像的肝癌检测方法研究摘要近年来,随着科技的发展,医疗技术也在快速的发展。数字化医学图像采集设备不断更新,CT、MR等设备的普及,使得医院每天产生大量的医学影像数据,医生的工作量越来越大,在紧张与高强度的工作压力下容易出现误诊和漏诊的现象。采集得到的影像数据存在一定的问题,大量的边缘模糊现象,这给病理诊断和治疗带来了困难。计算机在硬件方面和软件方面上的快速发展和完善给医学辅助诊断带来了新的契机。本文对基于CT图像的肝癌检测技术进行了研究,根据放射科医生临床诊断经验及肝癌CT图像的特点,提出了一个从图像预处理、图像分割、特征提取、到分类识别的肝癌检测方法,实现了对肝癌的有效识别。通过图像分割、轮廓提取和轮廓校正,得到了较为精确的病灶区边缘;提取了图像的纹理特征和形状特征;采取BP神经网络方法设计了两个分类器进行肝癌识别,首先依据纹理特征区分正常肝组织和非正常肝组织,其次利用形状特征区分了非正常肝组织中的囊肿、血管瘤和肝癌。实验结果表明,正常肝的识别率为90.00%,非正常肝的识别率为85.00%,区分囊肿、血管瘤和肝癌的识别率分别为72.73%、50.00%和83.33%,识别效果良好。通过计算机肝癌辅助诊断技术的使用,减轻了医生的工作压力和劳动强度,提高了医生的工作效率;在一定程度上提高了诊断的准确度;为医院节省了大量的开支,减轻了病人的负担。因此,计算机辅助诊断研究具有重要的意义和应用价值。关键词:图像处理;肝癌;检测方法;特征提取I华北水利水电学院硕士学位论文THERESEARCHOFLIVERCANCERDETECTIONMETHODSBASEDONMEDICALIMAGEABSTRACTInrecentyears,medicaltechnologydevelopsrapidlywiththedevelopmentofsciencetechnology.ThecomingoutofdigitalmedicalimageacquisitiononeafteranotherandtheuniversityofCT,MRandotherequipmentmakethelargeamountofimagedataperdayandtheworkloadofdoctors.Theimagedatacollectedalwayshavesomeproblems,suchasalargenumberofbluredgesandtherearenovisiblelesionsinninety-fivepercentoftheimages.Theproblemspresentedabovebringdifficultytopathologicaldiagnosisandtreatment.Therapiddevelopmentandimprovementincomputerhardwareandsoftwarehavebroughtanopportunityformedicaldiagnosis.Thecombinationofcomputertechnologywithmedicalimageprocessingtechnologyindiagnosticimprovesdoctors’efficiencyandalsoimprovesthecapabilitiesoflesionidentificationanddiagnostic.Theresearchinthispaperisofgreatsignificanceandvalue.TheresearchoflivercancerdetectionmethodsbasedonclinicalexperienceofradiologistandfeaturesofliverCTimages.Amethodoflivercancerdetectionfromtheimagepreprocessing,imagesegmentation,featureextraction,totheclassificationhasbeenproposed,whichcanidentifylivercancereffectively.Accurateedgewasobtainedthroughimagesegmentation,contourextractionandcontourcorrection.TexturefeaturesandshapefeaturesofCTimageswereextracted.Inlivercancerrecognition,BPneuralnetworkmethodwasusedtodesigntwoclassifiers.Firstdistinguishnormallivertissueandnon-normallivertissueaccordingtotexturefeatures.Secondly,distinguishcysts,hemangiomaandhepatocellularcarcinomainnon-normallivertissueaccordingtoshapefeatures.Theresultsshowthat,recognitionrateofnormalliverwas90.00%,recognitionrateofnon-normalliverwas85.00%.Recognitionratesofcysts,hemangiomaandhepatocellularcarcinomawere72.73%,50.00%and83.33%.Therecognitionresultwasgood.Thoughtheuseoflivercancerdiagnosiscomputertechnology,theworkpressureandlaborintensityofdoctorswasreduced,theaccuracyofdiagnosiswasimproved,expensesofII华北水利水电学院硕士学位论文thehospitalwassavedalot,patients'burdenwasreduced.So,researchofcomputer-aideddiagnosisisofgreatsignificanceandapplicationvalue.KeyWords:ImageProcess;LiverCancer;DetectionMethods;FeatureExtractionIII独立完成与诚信声明本人郑重声明:所提交的学位论文,是本人在指导教师的指导下,独立进行研究工作所取得的研究成果并撰写完成的。没有剽窃、抄袭等违反学术道德、学术规范的侵权行为。文中除已经标注引用的内容外,本学位论文中不包含其他人或集体已经发表或撰写过的研究成果,也不包含为获得华北水利水电学院或其它教育机构的学位或证书所使用过的材料。对本文的研究做出重要贡献的个人和集体,均已在文中作了明确的说明并表示了谢意。本人完全意识到本声明的法律后果由本人承担。学位论文作者签名:签字日期:
保证人(导师)签名:签字日期:学位论文版权使用授权书本人完全了解华北水利水电学院有关保管、使用学位论文的规定。特授权华北水利水电学院可以将学位论文的全部或部分内容公开和编入有关数据库提供检索,并采用影印、缩印或扫描等复制手段复制、保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文原件或复印件和电子文档。涉密的学位论文在解密后应遵守此规定)学位论文作者签名:签字日期:
导师签名:签字日期:((华北水利水电学院硕士学位论文1绪论1.1课题背景及意义肝癌是一种常见的恶性肿瘤,在我国,从20世纪90年代起肝癌死亡率已上升为第二位,在城市居肺癌之后,在农村则仅次于胃癌。肝癌的早期发现和准确诊断是制订适当治疗方案的重要手段,具有非常重要的临床意义。近年来,随着科技的发展,医疗技术也在快速的发展,数字化医学图像采集设备不断更新,不断完善。医学采集设备的普及实现了大量高分辨率的医学图像影像数据的获得,如计算机断层成像(CT,ComputerTomography),核磁共振成像,超声成像等,这些全面精确的病人的各种数据为医疗诊断、治疗计划、手术和术后评估提供了极大的方便。但是,各种影像设备在医学诊断中的广泛应用也造成一些了新的问题。首先,成像技术的迅速发展使得大量的诊断工作产生,放射科医生的工作量越来越大,在紧张与高强度的工作压力下容易出现误诊漏诊现象。其次,目前医学图像诊断是医生根据肉眼观察和临床经验而做出的判断,而采集得到的医学图像往往存在边缘模糊现象,这给医学图像诊断和治疗带来了困难,有时耗费大量的时间与精力,也难以做出正确的诊断而出现误诊漏诊现象。使得诊断准确率降低、医生的工作效率也很难提高。为解决医学诊断中医学图像广泛应用出现的问题,结合计算机技术和医学图像处理技术的计算机辅助诊断系统应运而生,并对现代医学诊断产生了深刻的影响。第一,由于计算机在硬件方面和软件方面的快速发展和完善,计算机处理速度越来越快,运用计算机辅助医生处理大量的诊断工作,可以减轻劳动强度,节约大量的时间,提高医生的工作效率。第二,利用计算机技术辅助诊断可以进行精确的定量计算,使医生更直接、清晰的观察人体内部的病变部位,可以减少误诊和漏诊提高医生诊断的准确性。第三,计算机辅助诊断技术的应用为医院节省了大量的开支,也减轻了病人的负担。CT图像是以不同的灰度来表示的,是诊断肝癌的主要手段之一。但是CT图像质量受多种因素控制和干扰,特别是肝癌的早期,其空间形态变化比较小,很容易出现误诊和漏诊。由于CT诊断技术的广泛应用,放射科医生每天需要处理大量的CT图像,长期处于高度紧张和疲劳状态,这也是导致放射科医生出现误诊和漏诊的原因。因此有必要采用适当的技术和方法对肝癌CT图像进行处理和分析,减轻放射科医生的劳动强度,提高工作效率,进而减少误诊和漏诊以提高诊断的准确率。研究肝癌CT图像的计算机辅助诊断技术,减少误诊和漏诊,提高诊断准确性,具有重要的意义与应用价值。本课题的研究出发点是结合医学图像的特点和计算机处理技术对肝部CT图像进行处理分析,从而达到检测肝癌的目的。1华北水利水电学院硕士学位论文1.2国内外研究概括目前对于肝脏病变的计算机辅助诊断的研究还不是很多[1],随着肝癌死亡率的上升,肝癌计算机辅助诊断逐渐成为研究的热点。目前在肝脏辅助诊断领域,主要采用B超图像、CT图像、核磁共振图像作为诊断数据,利用纹理和形状等特征对肝癌进行检测。对于医学图像的描述,主要使用各种不同的图像参数来进行描述,例如使用一阶或者二阶的灰度统计纹理特征或者多维分形特征。对于分类器,大多选用某一种分类器算法执行简单的分类任务。Wu[2]等使用基于傅里叶空间参数和多尺度分形特征向量结合贝叶斯分类器将超声肝脏影像分为正常组织,癌变组织和肝硬化组织三类,该实验诊断成功率将近90%。通过使用基于一阶和二阶灰度统计信息的纹理测度和统计神经网络分类算法,Kadah[3]将肝脏超声数据诊断分为正常组织、脂肪肝和肝硬化三类,该研究分类成功率将近93.3%。Chen[4]等通过在CT平扫数据上使用基于共生矩阵的纹理特征来训练一个概率神经网络分类器(ProbabilityNeuralNetwork,PNN)进而区分肝癌和肝脏血管瘤,分类成功率达到了83%。Asvestas[5]等使用力量差异方法(PowerDifferentiationMethod)的分形描述算子,同时结合使用一个模糊C均值分类器将B扫描肝脏组分为正常,癌症和血管瘤三类,分类成功率为85.7%。Lee[6]等使用Gabor小波生成的纹理特征和支持向量机来区分正常组织、囊肿、血管瘤和癌变。董放[7]等采用分形维数方法提取出肝脏CT图像的纹理特征,结果显示正常肝和肝癌CT图像的分形维数具有差别。刘伟[8]在基于纹理分析和人工神经网络的肝部CT图像识别中采用共生矩阵纹理分析法,PNN对正常肝的识别率达到90%,对肝癌识别率为80%,对血管瘤的识别率为70%;采用小波纹理分析方法,PNN对正常肝的识别率达到95%,对肝癌的识别率为83%,对血管瘤的识别率为73%;采用小波包纹理分析方法,PNN对正常肝的识别率达到95%,对肝癌的识别率为85%,对血管瘤的识别率为76%。叶俊[9]在多期的基础上提取了肝脏的纹理特征,然后使用神经网络、K近邻和支持向量机三种不同的机制设计分类器,并对结果进行了对比分析优化,实验结果显示,正常组织与病变组织,囊肿与其他病变,肝癌与肝脏血管瘤的三个诊断子问题分别达到了98.3%,97.2%和96.4%的诊断成功率。综上所述,基于CT平扫和B超的肝脏计算机辅助诊断研究已取得一定的成果。目前,在超声数据上,现有的肝脏辅助诊断研究成果主要集中在弥漫性肝脏病变,如脂肪肝,肝硬化的辅助诊断。基于CT图片进行的肝脏病变计算机辅助诊断研究上,主要集中在对于平扫CT数据的处理,结合肝脏病变的特殊性做出诊断,形状特征、毛刺特征被广泛应用于计算机辅助诊断中。正常组织和病变组织的纹理是不同的,因此可以采用纹理特性来区分正常区域与病变区域。但是,由于肝脏病变的复杂性,目前还没有统一的类别划分,也没有一个有效的划分方法。2华北水利水电学院硕士学位论文1.3基于医学图像的计算机辅助诊断在基于医学图像的计算机辅助诊断中,综合应用了计算机技术和图像技术,其中用到的图像技术包括图像处理、图像分析和图像理解三种技术。1.3.1图像处理图像处理着重强调图像与图像之间进行的变换,其主要目标是对图像进行各种加工以改善图像的视觉效果并为以后的目标自动识别奠定基础,或对图像进行压缩编码以减少存储的空间或传输的时间。图像处理技术以图像作为输入,经过特定的加工、处理,如去噪、增强等过程后,以图像的形式输出。本文主要用到的图像处理技术主要包括图像去噪、图像增强和图像分割。图像在生成和传输过程中常常因受到各种噪声的干扰和影响使图像质量下降,对后续的图像处理,如图像分割、图像理解等产生不利的影响。图像去噪是去除图像噪声,改善图像质量的重要步骤,去噪效果的好坏直接影响到后续的图像处理工作。根据图像的特点、噪声的统计特征和频谱分布规律,发展出了各种去噪方法。其中比较常用的方法是采用低通滤波技术去除噪声,或者对图像进行平滑处理等。图像增强的主要目的是增强图像中的有用信息,削弱干扰和噪声,使图像清晰或将其转换为更适合人或机器分析的形式。图像增强并不要求真实的反应原始图像,主要是利用各种数学方法和变换手段提高图像中的背景与目标的对比度,从而增加图像的清晰度[10]。依据图像增强处理过程所在的空间不同,可将图像增强分为基于空间域的增强方法和基于频率域的增强方法。基于空间域的增强方法是对每一像素的灰度值进行处理,如直方图均衡化方法、直方图规定化方法等;基于频率域的增强方法首先将图像经过变换从空间域变换到频率域,然后在频率域对频谱进行处理,处理后再反变换到空间域,如低通滤波、高通滤波、同态滤波等方法。图像分割是图像处理中的重要研究内容,其基本操作是把图像分成一些有意义的、互不重叠的区域,分割结果的优劣直接影响到图像后续处理的效果和质量[11]。广义上讲,图像分割是把图像分成互不重叠而又各具特性的子区域,这里的特性可以是像素的灰度、颜色和纹理等。狭义上讲,图像分割是利用图像中目标内部的相似性以及目标与背景之间的差异来实现目标与背景的区分。图像分割方法主要分为基于区域的图像分割方法和基于边缘的图像分割方法。(1)基于区域的图像分割方法基于区域的图像分割方法是从目标和背景的像素间相似性角度(即局部空间信息)出发,面向像素(同一区域的均匀性)对图像进行分割的。常用的方法有阈值分割、区域生长、分裂合并等。阈值分割法[12][13]是根据图像中目标与背景灰度上的差异,把图像分为不同灰度级的3华北水利水电学院硕士学位论文目标区域和背景区域,用一个或多个阈值将图像的灰度级分为若干部分,认为属于同一部分的像素是同一个目标。常用的阈值法有Otsu法(即最大类间方差法)、阈值迭代法、通用阈值法、最大最小化阈值等等。阈值分割法的优点是实现简单,计算量小、分割速度快,而且不需要图像的先验知识,一般用于分割粗糙的图像。其存在的缺点是:第一,对不存在明显灰度差异的或各目标的灰度值范围有较大重叠的图像难以得到准确的分割结果;第二,没有利用局部空间的相关性,仅仅考虑了图像的灰度信息而不考虑图像的空间信息,不能保证分割区域的连续性;第三,阈值分割法对噪声和灰度不均很敏感,它孤立地考虑每个像素,没有考虑像素之间的空间关系;第四,当利用多维度信息进行阈值分割图像时,不同维度的分割结果常常不统一,有时甚至差异很大。区域生长法[14]的基本思想是依据一定的生长准则将图像中具有某种相似性的像素整合在一起构成一个区域。在生成区域的过程中都要设定一个用于生长的种子像素,根据图像的类型给定生长准则,以此来判断种子周围的像素点是否与种子像素之间具有某种相似性,即是否可生长。如果可生长,则将这个像素加入到区域中,并将其设置为新的种子像素进行迭代。对区域生长法而言,和像素间相似性同样重要的还有邻接性、连通性。如果不同时考虑这些限定条件,就可能产生毫无实际意义的分割结果,甚至错误的分割图像。由于相似性通常是用基于统计的方法来确定的,所以当区域一致性准则比较容易定义的时候,这种方法能够获取较理想的结果,并且比基于边缘的方法更能抗干扰。但是,区域生长法的问题在于:第一,种子像素点需要人工交互按照分割需求来设定,若是处理复杂图像,这种分割方法在时间和空间上代价都比较大,效率会大幅度降低;第二,分割效果依赖于种子像素的选取以及像素和区域检测的顺序;第三,区域生长法对噪声也很敏感,可能形成孔状甚至是根本不连续的区域。分裂合并法[15]的基本思想是对整个图像分裂得到所有的分割区域,然后按照一定的准则再对这些区域进行合并。分裂、合并的准则是这种方法的重点,同时考虑处理的精度。一般的做法是用网格对原图像进行分裂操作,分割精度取决于网格的多少,通过计算比较每个分裂区域的灰度均值和方差等统计量来确定分裂区域的一致性。分裂合并法是基于统计学方法的,所以对噪声不敏感。分裂技术的自身缺点可能会使边界破坏,并且这种方法在精度与时间复杂度上都存在冲突,需要找一个均衡点。(2)基于边缘的图像分割方法图像中的边缘是图像最重要也是最基本的特征之一。图像中的边缘可以定义为:图像中灰度级发生剧烈变化的区域边界[16]。边缘分割法是一种最为普遍的分割方法,其核心目的在于通过检测图像中各个边缘两侧的灰度级跳变(即梯度),实现对图像中目标物体的分割。基于边缘的分割方法是通过对图像中边缘的识别将图像分割成许多区域[17]。其优点是边缘定位准确,运算速度快。其存在的缺点是:第一,对噪声敏感;第二,边缘检测4华北水利水电学院硕士学位论文方法只使用了局部信息,不能产生连续的封闭区域轮廓线;第三,当边缘不明显时,图像不能得到很好的分割;第四,在高细节区存在大量琐细边缘,很难形成大区域[18]。因此,边缘检测方法一般都需要后续处理或与其它分割方法结合起来完成图像分割。经典的边缘检测算子有Canny算子、Roberts交叉梯度算子、Prewitt梯度算子、Sobel梯度算子、拉普拉斯算子等等。1.3.2图像分析图像分析也称作图像描述,主要对图像中感兴趣的目标进行检测和测量,获得它们的客观信息从而建立对图像和目标的描述[19]。图像分析是一个从图像到数据的过程。这里数据可以是对目标特征测量的结果,或是基于测量的符号表示,它们描述了图像中目标的特点和性质。图像分析输入的是图像,输出的是对给定图像的一种数字或者符号的描述。图像分析比较抽象的表示了目标,好的描述应在尽可能区别不同目标的基础上对目标的尺度、平移、选择等不敏感,这样的描述具有通用性,不会因为目标的刚性移动或者放缩而发生较大的变化[20]。对目标的描述常常是针对目标的某些特征来进行的,选择什么样的特征来描述目标以及如何精确地测量这些特征是图像描述的两个关键问题。常见的目标特征可分为内部特征和外部特征。内部特征包括灰度特征和纹理特征等,它们需要借助分割图从原始图像上测量得到。外部特征有面积、周长、曲率、圆形度等几何形状特征,它们可以从分割图上直接测量得到。对目标特征的测量,也可以称为特征的提取,即从已知的图像中提取具有较强表示能力的特征的过程。图像特征是标识一个图像的最基本的属性或特征,利用图像的属性特征的差异可以和其他图像进行区分。特征提取的任务就是要提取图像区别于其他图像的属性特征。在特征提取中经常用到的图像特征有颜色(灰度)特征、纹理特征、形状特征和空间关系特征四类。通过图像特征提取,生成的特征应能够抽象和具体地描述物体,从而为后续分类提供可靠的基础。良好的特征应具有以下特点[21]:(1)独特性。每个独立的物体必须有各自独特的表示,从而可以与其他物体进行区分。(2)几何变换下的不变性。生成的特征应不随物体的位置、尺寸、旋转方位的改变而使描述结果受到影响。(3)灵敏性。不同对象的特征值应具有明显的差异,能比较容易地反映相似物体之间的差异。(4)抽象性。能从物体的众多图像细节中抽取有用的特征信息,即具有高度的数据压缩性。(5)数量少。特征的个数是描述对象的特征向量的维数。用于分类器训练的训练样本个数随特征向量维数的增长而呈指数增长,从而造成人们所说的“维数灾难”。因此,选取尽可能少的,有用的特征。5华北水利水电学院硕士学位论文图像特征的表示和特征提取是图像分析的基础环节。良好的特征能够充分的标识出所要识别的物体,有效的特征提取方法可以准确的提取特征从而使分类器的设计简单化并且得到较准确的分类结果。1.3.3图像理解图像理解是在图像处理和图像分析的基础上,结合人工智能和模式识别理论,进一步研究图像中各目标的限制和它们之间的相互关系,并得出对图像内容含义的理解和分类对比方法,从而指导和规划行动[22]。图像理解依据图像内容,结合专家经验对经图像分析抽象出来的数据进行定义、计算和分类,得到的结果一般是更有组织规律的信息。图像模式识别就是对图像内容进行认知和决策的图像理解过程,是根据观察到的事物的模式对事物进行分类的过程。在图像识别技术中,模式识别占有核心的地位,是图像识别的实质性阶段。从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类和无监督的分类两种。针对模式特征的不同选择及判别决策方法的不同,模式识别主要分为以下几类:统计模式识别、句法模式识别、模糊模式识别等[23][24]。其中,统计模式识别方法和句法模式识别方法是两种基本的模式识别方法,与此相应的模式识别系统都由两个过程所组成,即设计和实现。设计是指用一定数量的样本(叫做训练集或学习集)进行分类器的设计,实现是指用所设计的分类器对待识别的样本进行分类决策[25]。(1)统计模式识别统计模式识别方法的基本思想是将特征提取阶段得到的特征向量定义在一个特征空间中,这个空间包含了所有的特征矢量[26]。不同的特征向量,或者说不同类别的对象,都对应于此空间中的一点。在分类阶段,则利用统计决策的原理对特征空间进行划分,从而达到识别不同特征对象的目的。统计识别中应用的统计决策分类理论相对比较成熟,研究的重点是特征提取。(2)句法模式识别句法识别是对统计识别方法的补充。基本思想是把对象分解描述成一系列基本单元,每一个基本单元表达成一定的符号,构成对象的单元之间的关系描述为单元符号之间的句法关系,利用形式语言、句法分析的原理来实现对样本的分类[27]。统计方法用数值来描述图像的特征,句法方法则是用符号来描述图像特征的。(3)模糊模式识别模糊识别的理论基础是模糊数学,它根据人类辨识事物的思维逻辑,吸取人脑的识别特点,将计算机中常用的二值逻辑转向连续逻辑。模糊识别的结果是用被识别对象隶属于某一类别的程度即隶属度来表示的,一个对象以在某种程度上属于某一类别,而在另一种程度上属于另一类别[28]。而一般常规识别方法则要求一个对象只能属于某一类别。基于模糊集理论的识别方法有模糊聚类法、最大隶属原则识别法。6华北水利水电学院硕士学位论文(4)人工神经网络识别人工神经网络的研究起源于对生物神经系统的研究,它将若干处理单元(即神经元)通过一定的互连模型连结成一个网络,这个网络通过一定的机制(如BP网络)可以模仿人的神经系统的动作过程,以达到识别分类的目的[29]。人工神经网络区别于其他识别方法的最大特点是它对待识别的对象不要求有太多的分析与了解,具有一定的智能化处理的特点。神经网络识别法侧重于模拟和实现人认知过程中的感知觉过程、形象思维、分布式记忆、自学习和自组织过程,与符号处理是一种互补的关系。神经网络具有较多优点,例如大规摸并行、分布式存储和处理、自适应、自组织和自学习的能力等待[30],特别适用于处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。(5)支持向量机模式识别支持向量机(SVM,SupportVerticalMachine)是求解模式识别和函数估计问题的有效工具。V.Vapnik提出的SVM的基本思想是先在样本空间或特征空间,构造出最优超平面,使得超平面与不同类样本集之间的距离最大,从而达到最大的泛化能力[31]。支持向量机结构简单,并且具有全局最优性和较好的泛化能力,自20世纪90年代中期以来已得到了广泛的研究。SVM在数字图像处理方面的应用是:寻找图像像素之间的特征的差别即从像素点本身的特征和周围的环境(临近的像素点)出发,寻找差异,然后将各类像素点区分出来[32]。以上几种模式识别方法应用于图像识别有各自的优点,同时也有不足的地方,根据当前许多图像识别领域的需要,学者们提出和应用许多新的识别方法。在这个以数字计算为特征的智能化、信息化、计算化、网络化的世纪里,作为人工智能技术基础学科的模式识别技术,必将获得巨大的发展空间。1.4论文研究内容及文章组织结构基于医学图像的肝癌检测技术研究主要解决以下几个问题,肝脏CT图像的病灶区域分割,肝脏纹理特征提取,肝脏形状特征提取,特征的选择和分类器的设计。本文对肝癌检测技术的研究内容主要包括以下几方面:(1)综述肝癌计算机检测技术和国内外肝癌计算机检测研究的发展现状,并指出肝癌检测技术在发展中存在的问题以及其发展方向。(2)结合医生的临床经验选择研究所用的CT图片,按正常肝组织图像、囊肿图像、血管瘤图像和肝癌图像的类别选取样本。(3)采取基于阈值的图像分割方法分割肝癌图像的病灶区域,并采用轮廓跟踪法提取病灶区域的轮廓。(4)采取基于纹理特征的特征提取方法和基于形状特征的特征提取方法对肝癌CT图像提取特征,在特征提取完成后采用PCA方法选择特征进一步降维提取肝癌图像7华北水利水电学院硕士学位论文的纹理特征和形状特征。(5)合理设计神经网络算法分类器,使用提取出的纹理特征和形状特征对肝癌CT图像分类识别。文章组织结构如下:第一章,绪论。介绍了课题背景、肝癌检测的应用与发展、医学图像计算机辅助诊断中常用的图像技术。第二章,图像预处理及图像分割。在这一章主要包括图像预处理、图像分割和目标区域的轮廓提取三部分内容。图像预处理主要指肝癌CT图像的选取、去噪;图像分割指从预处理后的图像中选取感兴趣区域,主要采取基于阈值的图像分割方法;轮廓提取是指对分割后的图像提取其轮廓,为后续形状特征的提取打好基础。第三章,图像特征提取。介绍了各种医学图像特征提取方法,指出了各种方法的优缺点。本文主要采取基于纹理特征的特征提取方法和基于形状特征的特征提取方法对肝癌CT图像提取特征,在特征提取完成后采用PCA方法选择特征进一步降维。第四章,分类。主要采用BP神经网络法对肝癌CT图像进行分类识别,详细设计了BP神经网络,并进行了仿真实验,对肝癌CT图像的分类结果做了详细的分析。第五章,全文总结及展望。对全文工作进行总结并对未来的研究方向提出了展望。8华北水利水电学院硕士学位论文2图像预处理及图像分割肝癌图像的复杂性给研究带来了较多的困难,而前期对肝癌图像的预处理不仅可以减少图像的噪声,增强图像的对比度,而且经过对图像的前期加工,得到对具体应用来说视觉效果更“好”、更“有用”的图像,也为后续的图像处理带来了方便,因此图像的预处理是很必要的。在本文中,图像的预处理主要包括:图片的选取、病变区域与疑似病变区域的截取、图像去噪、对比度增强。在本章中还对感兴趣区域进行了提取即图像分割,然后提取了感兴趣区域的轮廓,为下一步特征提取做好基础。2.1图像的来源肝CT图像由郑州人民医院放射科提供。我们从经放射科医生确诊的CT图像中截取了66幅图像,其中20幅为正常肝脏组织图像,16幅肝癌图像,9幅血管瘤图像,21幅囊肿图像。不同的设备采集出来的图像明暗度存在不同,因此,本研究采用同一设备采集的CT图像,也使得后续研究中提取的特征具有可比性。郑州人民医院使用的CT扫描仪为德国西门子SOMATOMDefinition双源CT,新一代的64排螺旋CT,是新一代大功率高毫安输出球管,探测器排数达到64排,螺旋扫描速度更快(≤0.35秒/转),时间分辨率显著提高(<50毫秒),心脏亚毫米层厚的CT扫描时间仅需5-9秒左右,扫描最薄层可达0.64MM,为目前世界上能达到的最薄层厚,从而提高了图像的分辨率。图2-164排螺旋CT扫描仪Figure2-1LightSpeedVCT2.2图像预处理2.2.1图像去噪CT图像在数字化和传输过程中通常受到成像设备与外部环境噪声干扰等影响,CT9华北水利水电学院硕士学位论文图像中不可避免的夹杂了噪声,为提高后续图像处理的精确度,需要做去除或减轻CT图像噪声的处理,这一过程称为图像去噪。在本文中主要采用高斯滤波的方法去除噪声。高斯滤波器是一种线性滤波模板,模板各位置的权重是根据高斯分布函数确定的。根据高斯滤波器的二维可分性(X轴与Y轴方向进行高斯滤波互不干扰),可以用两个一维高斯滤波器的连续卷积来实现一个二维高斯滤波器,同时可提高滤波的运算速度[12]。所构造的高斯滤波器如下:121121211
(2-1)本文利用上述高斯滤波模版对图像进行了滤波,有效的去除了图像中脉冲噪声,平滑了图像。2.2.2图像增强由于CT图像不可避免的会出现边缘模糊,灰暗等情况,为解决这些问题,本文采用了直方图均衡化的图像增强方法。通过直方图均衡化增强了图像的整体对比度,使图像中的感兴趣区域(RegionOfInterest,ROI)得到增强,不感兴趣区域受到抑制,图像的质量得到改善,使图像更加清晰,便于后续处理。直方图均衡化是将原始图像的灰度直方图通过变换函数修正为均匀的直方图,其基本思想是把原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布,就是对图像进行非线性拉伸,重新分配图像像素值,使一定灰度范围内的像素数量大致相同,从而使图像的灰度层次比较丰富,改变了图像整体偏暗或者偏亮的状况。设某一数字图像f,灰度级为L,图像的总像素数为N,某一灰度i的像素个数为ni,则该数字图像的概率密度为:pf(i)
niN
i0,1,
,L−1
(2-2)数字图像的累积概率分布函数为:L−1i0
i0,1,
,L−1
(2-3)直方图修正处理是一种单调的点变换,设输出图像的灰度值用g表示,最大灰度值为gmax,最小灰度值为gmin,且灰度级为L,则giT[i],其输入灰度变量imin≤i≤imax映射到输出灰度变量gmin≤g≤gmax,使得输出概率分布pg(g)的累积等于输入概率分布1016*121242116*1212421116Pf(i)≈∑pf(i)华北水利水电学院硕士学位论文pf(f)的累积,即:LggLiif
(f)
(2-4)为了使输出图像的概率密度是均匀分布的,即pg(g)
(gmax
1−gmin)
(gmin≤g≤gmax)
(2-5)将式(2-5)带入(2-4)中,得ggmin
gmax
1−gmin
dgPf(i)
i0,1,
,L−1
(2-6)1gmax−gmin
(g−gmin)Pf(i)
i0,1,
,L−1
(2-7)灰度级g应与累积分布函数Pf(i)构成直方图均衡转换函数:g(gmax−gmin)Pf(i)gmin
i0,1,
,L−1
(2-8)式(2-8)求得的g可能是非整数,而输出的图像灰度值为整数,因此,需做取整运算。为使结果更加精确,我们采用四舍五入的办法进行取整,即:首先对转换后的灰度值加上0.5,然后做取整运算。gINT[(gmax−gmin)Pf(i)gmin0.5]
(2-9)举例来说,已知模输入图像的灰度直方图,如图2-2,灰度级为L=8,像素总数为N=4096,灰度均衡化步骤如表2-1所示:0.250.20.150.10.050
0
1
2
3
4
5
6
7图2-2某输入图像的灰度直方图Figure2-2histogramofinputgrayimage11∑pg(g)∑∑pg(g)∑p∫华北水利水电学院硕士学位论文表2-1
直方图均衡计算列表Table2-1Listofcalculationofhistogramequalization(1)统计原始图像各灰度级的像素数目ni,i0,1,
,7。(2)计算原始图像灰度直方图,得出各灰度级的概率密度pf(i)。(3)计算累积分布函数ki0
k0,1,
,L−1
(2-10)(4)计算最后的输出灰度级gkINT[(gmax−gmin)Pf(k)gmin0.5]
k0,1,
,L−1
(2-11)式中INT[]是取整算符。令gmaxL−1,gmin0,则计算公式可以简化为:gINT[(L−1)Pf(k)0.5]
(2-12)(5)通过f到g的映射,修改原图像的灰度级,得出灰度直方图近似为均匀分布的输出图像。12已知:f已知:fi01234567统计:ni790102385065632924512281nipf(i)N0.190.250.210.160.080.060.030.02kPf(k)≈∑pf(i),k=0,1,…7i00.190.440.650.810.890.950.981.00gkINT[(L−1)Pf(k)0.5]13566777修改原始图像fi⇒gi0→11→32→53→64→65→76→77→7PPf(k)≈∑pi(i)华北水利水电学院硕士学位论文0.250.20.150.10.050
0
1
2
3
4
5
6
7图2-3直方图均衡化后的灰度直方图Figure2-3histogramafterequalization通过观察图2-2、图2-3,均衡化后的直方图分布均匀,但是会丢失一些细节。本文研究的部分样本图像增强前后效果对比如图2-4所示:20406080100
20406080100120
20
40
60
80
120
20
40
60
80a原始灰度图
b直方图均衡化后的效果图图2-4直方图均衡化前后图的比较Figure2-4Comparisonofgraypicturesbeforeandafterhistogramequalization504540
60503540302520151050
30201000
50
100
150
200
250
0
50
100
150
200
250a原始图的灰度直方图
b均衡化后的灰度直方图图2-5均衡化前后的灰度直方图比较Figure2-5Comparisonofgrayhistogrambeforeandafterequalization13华北水利水电学院硕士学位论文从图2-4和图2-5可以看出,通过直方图均衡化处理,原始输入图像的对比度得到增强,输入图像的直方图分布改变成“均匀”分布直方图分布,变换后图像的直方图相对原始图像的直方图较均匀、平坦,灰度层次清晰。2.3图像分割图像分割是图像识别中重要的环节,分割的效果直接影响特征提取结果的准确性。为了科学可靠精确的分割出肝脏CT图像中的病灶区域,本文采取了几种传统的图像分割方法对肝脏图像进行分割,并对结果进行了比较分析,发现基于阈值的分割方法即能够满足本实验的要求。2.3.1图像分割方法本文分割的目的是为了把病变区域与其背景分开并形成二值图像,以便于后续进行的轮廓提取和形状特征的求取。首先,将选取的CT图像转换成灰度图像,对于患者来说肝脏病变区域是不一致的,其CT值也是不一致的,所以对于每一幅CT图像来说,在转换成灰度图像后很难用一个统一的灰度阈值进行分割,因此我们必须针对每一幅图像计算其灰度门限。其次,选择实现简单,计算量小、分割速度快的阈值分割法对CT图像进行分割。(1)迭代阈值法计算阈值的算法如下:①求出整幅图像的最大灰度值gmax和最小灰度值gmin,令初始灰度阈值为:t0
gmaxgmin2
;
(2-13)②根据灰度阈值t0,将图像分割为前景和背景,分别求出两者的平均灰度值z1和z2;③求出新灰度阈值:t1
z1z22
;
(2-14)④若t0t1,则t1为灰度阈值,否则令t0t1,转到第二步迭代计算。(2)最大类间方差法计算阈值的算法如下:最大类间方差法简称为Otsu法[33],是使用最小二乘法在灰度直方图基础上推导得来。Otsu的基本思路是将直方图在某一灰度值处分割成两类,求这两类的方差,比较方差并得到最大值,此时的灰度值即为最佳阈值,按照该阈值分割得到的两类间有最好的分离性。这种方法从处理一个离散概率密度函数的归一化直方图开始,假设一幅图像的灰度级数为L,灰度级为i(i1,2,...L)的像素数目为ni,这时像素的总数目为:14华北水利水电学院硕士学位论文灰度级i的概率为:
Li1
(2-15)pi
niN
(2-16)假设选取一个灰度值t,t将图像像素分为两类C0{1,2,…,t}和C1{t+1,t+2,…,L},这两类产生的概率和平均值如下:C0类产生的概率为:C1类产生的概率为:
ti1
(2-17)1
Lit1
i
1−(k)
(2-18)C0类的平均值为:C1类的平均值为:
ti1
ipiϖ0
(2-19)整个图像的平均值为:
1
Lit11
(2-20)Li1由此,可以得出两类间的方差为:2(t)0(0−)21(1−)201(1−0)2
(2-21)(2-22)当找到使上式2(t)最大的t值时,此时t即为所要求的最佳阈值。Otsu方法求取的阈值满足了使C0和C1两类之间变异数最大,而在C0和C1类内变异数总合最小,从而保证了选取阈值的最佳化。2.3.2图像分割实现本文分别采用基于阈值迭代法的图像分割方法和基于最大类间方差法的图像分割方法对肝CT图像进行了分割,得到了肝CT图像的病灶区域,肝癌图分割像结果如图2-6所示:15N∑ni∑pipi∑ϖN∑ni∑pipi∑ϖ华北水利水电学院硕士学位论文2040608010020
40
6020406080100120
a1原始灰度图20406080100120
a2阈值迭代法分割图像结果a3Otsu法分割图像结果b1原始灰度图
b2阈值迭代法分割图像结果
b3Otsu法分割图像结果图2-6
Otsu法与阈值迭代法分割结果Figure2-6SegmentationresultsbasedonOtsuanditerationthreshold其中图2-6中的a2,b2为使用阈值迭代法得到的分割结果;a3,b3为采用最大类间方差法获得的分割结果。通过观察可以看到,最大类间方差法对存在灰度缓慢变化区域的肝癌图像的分割效果优于阈值迭代法。但从分割准确程度上来讲,最大类间方差法的分割精度不如阈值迭代法的分割精度。从算法效率上来讲,由于本实验中所采用的最大类间方差法和阈值迭代方法都是针对灰度大小进行计算,两者算法的时间复杂度一致[34]2.3.3肝图像分割后的处理肝图像分割后,得到的目标区域内部存在一些孔洞,如图2-7中c2所示;目标区域外部存在一些噪声,如图2-7中a2、b2、c2所示。因此,在肝图像分割后需要对目标区域进行内部填充,对区域外部去除噪声。本文采用函数bwfill(BW1,c,r,n)对图像目标区域进行填充操作,该函数的作用是填充二进制图像的背景色。去除边缘噪声时,首先标记图像中目标区域的连通分量,然后将其余部分统一设置为背景色,以达到去除边缘噪声的目的。部分样本处理结果如图2-7所示:16。本文对分割准确度要求较高,因此采用基于Otsu的方法进行图像分割。。本文对分割准确度要求较高,因此采用基于Otsu的方法进行图像分割。华北水利水电学院硕士学位论文a1原始灰度图b1原始灰度图c1原始灰度图
a2阈值分割后的图b2阈值分割后的图c2阈值分割后图片
a3分割后处理的效果图b3分割后处理的效果图c3处理后的效果图图2-7部分样本图像分割后的处理效果Figure2-7Processingeffectofsomesamplesafterimagesegmentation2.4轮廓提取2.4.1轮廓提取轮廓提取主要采用边缘检测算子或者是边缘跟踪算法等进行。边缘检测算子提取轮廓是在灰度图的基础上操作的,优点是算法简单,缺点是提取出的轮廓存在不连续点[35]。边缘跟踪算法提取轮廓在二值图的基础上操作,缺点是计算速度较慢,优点是提出的轮廓是连续的。本文采用边缘跟踪算法提取目标区域的轮廓。边缘跟踪算法主要包括扫描过程和跟踪过程,不同算法主要在跟踪过程中有所区别,如何根据当前的情况判断下一步的跟踪方向是算法的核心。本文采用基于8-邻域链码的方法进行轮廓跟踪。4-邻域的定义[30]为:位于坐标(x,y)的一个像素p有4个水平和垂直的相邻像素,用坐标表示为(x+1,y)、(x-1,y-1)、(x,y+1)和(x,y-1),这个像素集称为p的4-邻域,用N4(p)表示。8-邻域的定义[30]为:的4个对角像素用坐标表示为(x+1,y+1)、x+1,y-1)、x-1,y+1)和(x-1,y-1),这些像素点与4-邻域点称为p的8-邻域,用N8(p)表示。令V为灰度值集合,在二值图像中,把值为1的像素归入V,即V={1}。如果q在N4(p)集合中,则V中数值的两个像素p和q是4-邻接的[30],如图2-8所示;如果q17p((p((华北水利水电学院硕士学位论文在N8(p)集合中,则V中数值的两个像素p和q是8-邻接的[30],如图2-9所示。图2-84-邻接Figure2-84-neighbor
图2-98-邻接Figure2-98-neighbor链码是用于表示由顺次连接的具有指定长度和方向的直线段组成的边界线,链码的表示方法是基于4-邻域或8-邻域的,每一段的方向使用数字编号方法进行编码,如图2-10和图2-11所示:23
12
0
4
03
5
6
7图2-104-邻域链码的方向编码
图2-11
8-邻域链码的方向编码Figure1-104-directionalchaincode
Figure2-118-directionalchaincode边缘跟踪算法步骤如下:(1)按照从上到下,从左到右的顺序扫描图像,得到的第一个象素值为1的点定为起始点,如果找不到起始点则算法结束;(2)按逆时针顺序从当前点右边开始搜索其8-邻域方向的点,如果找到一个未曾搜索过的象素值为1的点,并且该点上下左右4个方向含有象素值为0的点,则把当前点置为该邻域点,记录下相应的链码值,重复该过程直到找到初始点。图2-12目标区域坐标Figure2-12Coordinatesofthetargetarea180100101000100101000010010100华北水利水电学院硕士学位论文图2-12中目标区域的坐标图已知,取坐标为(3,2)的点作为初始点,那么目标轮廓的8-邻域链码表示为:766611177722132446532445。图2-13显示了对图中目标区域轮廓的跟踪结果。a
b图2-13部分样本的轮廓跟踪结果Figure2-13Contourtrackingresultsofsomesamples2.4.2轮廓校正由于CT图像的背景区域和病灶区域间存在过渡区域,这导致病灶区域存在弱边缘。对CT图像进行分割采用阈值分割方法,受病灶区灰度缓慢变化区域的影响,很难准确分割出病灶区域的完整轮廓[28][36-38]。需要对提取的轮廓进行进一步的校正。肝癌CT图像分割后得到的轮廓曲线的某一点A与病灶区实际边界上的点A′相比有三种情况,一是A点在病灶区的实际边界上,A点与A′点重合,二是A点在病灶区实际边界外侧的背景区域,三是A点在病灶区的实际边界以内的病灶区域。轮廓校正的基本原理为[39]:对于图像分割后得到的轮廓曲线上某一点A,首先判断A点是否在在病灶区的实际边界上,如果A点在病灶区的实际边界上,则A点保持不变,如果A点不在病灶区实际边界上(在病灶区实际边界外侧的背景区域内或病灶区的实际边界以内的病灶区域内),则让A点向病灶区的实际边界移动,直到A点移动到病灶区的实际边界上为止。通过对轮廓曲线上的点进行校正,可解决目标轮廓存在不连续点的问题,并使轮廓更加接近实际的轮廓,提高轮廓的准确度。轮廓校正具体步骤如下:(1)初始校正点的选取。校正过程中选取图像分割得到的边缘轮廓上的任一点作为校正的起点,记录坐标。(2)边缘点是否移动的判断。该步骤通过本文提出的校正策略判断该像素点是否需要移动。如需移动,则在移动该点后补全,并记录因该点移动导致的不连续点直至该像素点不需继续移动;如不需移动,则继续校正原轮廓上的下一像素点,直至该轮廓上的所有点全部校正完毕(校正过程回到起始点)。(3)判断是否开始下一轮的校正。该步骤通过判断步骤(2)中补全点的个数来确定是否需要继续校正,当补全点个数占全部轮廓点的比例大于一个值时则继续校正,否则停止校正,轮廓校正完成。19华北水利水电学院硕士学位论文a1灰度图b1灰度图
a2图像分割后的二值图b2图像分割后的二值图
a3提取的轮廓b3提取的轮廓
a4校正后的轮廓b4校正后的轮廓图2-14轮廓校正前后目标区域轮廓差别Figure2-13Differenceofthetargetregioncontourbeforeandafteroutlinecorrection如实验结果图2-14所示,通过校正,得到了更加准确的轮廓,在一定程度上提高了轮廓提取的精度。2.5本章小结本文提出了一个对肝部CT图像进行预处理和图像分割的方案。第一,将彩色图像转换为灰度图;第二,采用直方图均衡化方法对图像进行增强,增强目标区域和背景的对比度;第三,采用高斯滤波方法对图像进行去噪;第四,采用基于Otsu的阈值分割方法分割病灶区域;第五,在图像分割后采用形态学方法填充内部孔洞,采用连通区域标记法去除目标区域外部噪声;第六,在二值图像基础上使用轮廓跟踪算法提取目标区域轮廓,为提高轮廓的准确度,使用轮廓校正法对校正轮廓。该方案能较好地得到肝部CT图像中病灶区域的边缘,为下一步的特征提取奠定良好的基础。20华北水利水电学院硕士学位论文3图像特征提取随着医学成像技术的发展和医院信息网络(如PACS,HIS,RIS)的普及,可供临床使用的医学图像正在迅速膨胀。如何准确、快速地提取医学图像特征帮助医生进行疾病诊断已成为医学图像分析研究的一个重要方面。从原始图像中提取具有较强表示能力特征的过程称为图像特征提取。从广义上讲,特征提取是一种变换,即通过变换的方法用低维空间表示高维的图像样本空间,从而可以达到降维。图像特征提取是模式识别的基础和前提,可以直接影分类器的设计以及分类的精度。为了便于对图像进行特征提取,图像被描述为形状、颜色、纹理等底层特征形式。图像灰度的均匀程度、纹理的粗细稠密,都可以很好的作为区分图像的依据。形状特征是人认识物体的最初依据,在诸多图像的特征形式中,形状被公认为重要的视觉特征。本文主要提取了肝癌CT图像的纹理特征和形状特征。3.1基于纹理特征的图像特征提取纹理一般指人们所观察到的图像中像素(或子区域)的灰度变化规律,在图像分析中将描述这种灰度变化规律的数字特征称为图像的纹理特征。纹理特征是反映宏观意义上灰度变化规律的重要特征。人体组织正常与否反映在组织的纹理上,即相同的组织在相同的成像条件下会产生相同的纹理模式,而发生病变的组织在相同的成像条件下会产生不同的纹理模式。正常组织与病变组织的纹理在粗细、分布走向上都有很大差别,因而图像的纹理是医学图像的重要特征之一。3.1.1纹理特征提取方法(1)统计法统计法主要是基于图像像素的灰度值的分布与相互关系,找出反映这些关系的特征。基本原理是选择不同的统计量对纹理图像的统计特征进行提取。这类方法一般原理简单、较易实现,主要适合医学图像中那些没有明显规则的结构图像,特别适合于具有随机的、非均匀性的结构。(2)结构法结构法是通过分析纹理图像的结构获取结构特征。结构分析法首先将纹理看成是有许多纹理基元按照一定的位置规则组成的,然后提取纹理基元并推论纹理基元的位置规律。(3)基于模型法模型法认为一个像素与其邻域像素存在某种相互关系,这种关系可以是线性的,也21华北水利水电学院硕士学位论文可以是符合某种概率关系的。模型法通常有自回归模型、马尔科夫随机场模型、分形模型,这些方法都是用模型系数来表征纹理图像,首先要对纹理图像的结构进行分析以选择到最适合的模型,其次是如何估计这些模型系数,如何通过求模型参数来提取纹理特征,进行纹理分析。这类方法存在计算量大,自然纹理很难用单一模型表达的缺点。3.1.2灰度共生矩阵CT图像是随机的图像,本文采用统计法提取图像的纹理特征。灰度共生矩阵(GrayLevelCooccurrenceMatrix,GLCM)是最常用的统计分析方法,是一种建立在估计图像的二阶组合条件概率密度函数基础上的图像纹理特征分析方法,是分析图像的基本模型和图像排列规律的基础[40]。取图像中任一点A(x,y),A点的灰度值f(x,y)=g1,偏离它的另一点B(x+a,y+b),B的灰度值f(x+a,y+b)=g2,则A、B构成的点对的灰度值记为(g1,g2),如图3-1所示:of(x,y)=g1
a
xbf(x+a,y+b)=g2y图3-1灰度共生矩阵的像素点对Figure3-1PixelpointsofGLCM令(x,y)在整个目标区域上移动,则会得到各种(gl,g2)值,设灰度值的级数为L,则(gl,g2)的组合共有L2种,统计图像中相距(a,b)的两个像素灰度值出现的次数n(g1,g2),则每种(g1,g2)出现的联合概率为:pg1g2(g1,g2)
n(g1,g2)L2
(3-1)每种(gl,g2)出现的概率可排列成一个方阵,即为图像的共生矩阵[21],如3-12所示。p11PpL1
p1LpLL
(3-2)为了更直观地使用共生矩阵描述图像纹理特征,从共生矩阵中导出一些反映矩阵状况的参数,主要有以下几种:22华北水利水电学院硕士学位论文(1)能量E∑∑[p(g1,g2)]2gg
(3-3)能量是灰度共生矩阵各元素的平方和,是图像纹理灰度变化均匀的度量,反映了图像灰度分布的均匀程度和纹理粗细度。当图像纹理较细致、灰度分布均匀时,能量值较大,反之较小。(2)熵H−∑∑p(g1,g2)lgp(g1,g2)gg
(3-4)熵是图像所具有的信息量的度量,表示图像纹理的复杂程度,反映了图像中纹理的非均匀程度。当图像中没有任何纹理,非常平滑时,则灰度共生矩阵几乎为0,熵值也接近为0;当图像中充满细纹理,灰度共生矩阵中所有像素值均相等时,熵取得最大值;当图像中分布着较少的纹理,灰度共生矩阵中的值非常不均匀时,熵值较小。(3)对比度I∑∑(g1−g2)2p(g1,g2)gg
(3-5)对比度也称为惯性矩,是灰度共生矩阵主对角线附近的惯性矩,它度量矩阵的值是如何分布和图像中局部变化的多少,从而反映了图像的清晰度和纹理的沟纹深浅。纹理的沟纹深,对比度的值大,视觉效果清晰;反之,对比度的值小,沟纹浅,视觉效果模糊。对比度是从另一个方面来评价图像的灰度变化情况,图像越不均匀、灰度差别越大,纹理越细,对比度越大。(4)相关性其中,
C[∑∑g1g2p(g1,g2)−xy]/xyg1g2x∑g1∑p(g1,g2)ggy∑g2∑p(g1,g2)gg
(3-6)(3-7)(3-8)x2∑(g1−x)g2
∑p(g1,gg2
)
(3-9)y2∑(g2−y)g2
2
∑p(g1,gg1
2
)
(3-10)它度量空间灰度共生矩阵元素在行或列的方向上的相似程度,相关值的大小反映了图像中局部灰度相关性,当矩阵元素值均匀相等时,相关值就大;相反如果矩阵元素值相差很大时,相关值就小。(5)局部平稳性23华北水利水电学院硕士学位论文N∑∑ggp(g1,g2)1(g1−g2)2
(3-11)又称为逆差距,用来度量图像纹理局部变化的情况,当图像纹理的不同区域间缺少变化时逆差距的值大,局部非常均匀。局部平稳性从一定程度上反映了图像纹理的同质性[41]。能量和熵值可用来描述区域内灰度变化的总体性质,并对不同图像空间灰度分布的非均匀程度;对比度反映图像平均灰度与其周围背景的差别程度;逆差距可反映图像不同区域间是否存在明显变化,若缺少变化,逆差矩大;相关性用来描述图像像素间灰度值的相似程度,表征了数据的波动程度。总之,图像灰度分布越均匀,能量E越大,熵H越小,相关性C越大,局部分布越平稳,灰度差别越小;反之,图像的灰度差别越大,能量E越小,熵H越大,相关性C越小,局部分布越不平稳,对比度I越大。3.2基于形状特征的图像特征提取由于病变以及病变的严重程度不同会在医学成像上造成某些特殊的形状,因此图像的形状特征在医学上具有很重要的地位。例如,对血液白细胞的分类识别[42]、淋巴细胞的分类识别[43]、人体寄生虫虫卵图像计算机分类识别[44]等都用到了形状特征提取,而且取得了较高的识别率。将图像特征提取方法应用到实际中去,有利于临床医生对病人的病变情况做出有效的诊断。3.2.1基于边界的形状特征(1)目标区域边界的周长P设目标区域的边界为B,B的周长是指整个连通区域的最小外包围轮廓的长度。一条边界上的像素的数目可以大约表示其长度[45]。本文采用了基于8-邻域链码的方法计算边界的周长。首先,使用8-邻域链码跟踪目标区域的轮廓并记录链码值,设外轮廓线上链码值为偶数的像素个数为M,为奇数的像素个数为N,则连通区域的周长计算公式为:P=M+2N
(3-12)这种方法计算虽然复杂,运算速度较慢,但精确度较高。(2)目标区域边界的直径Maxd边界上相隔最远的两点之间的距离称为边界的直径。边界B的直径定义如下:Maxdmax[D(pi,pj)]i,j
(3-13)其中Maxd可以是欧氏距离、街区距离和棋盘距离中的任意一种,pi,pj是边界B上的点。24华北水利水电学院硕士学位论文(3)离心率k连接直径的两个端点的直线段称为边界的长轴,即最大直径Maxd。与长轴垂直的且与边界的两个交点间的最长线段叫做边界的短轴Mind,也可以称为最小直径,短轴与长轴的比值叫做边界线的离心率。为使目标区域的最大直径和最小直径构成的矩形区域能够将目标区域完全覆盖,在这里,最小直径的计算方法如下:①记录最大直径的两个端点值,A(xA,yA)、B(xB,yB);②以A、B为端点连成直线L,将目标区域轮廓上的点分为两类,由A点到B点,按顺时针方向目标轮廓上的点归为一个集合,按逆时针方向目标轮廓上的点归为另一个集合;③分别计算这两个集合中的点到直线L的最大距离x1,x2④最小直径Mind=x1+x2;则离心率的计算公式为:k=Mind/Maxd
(3-14)3.2.2基于区域的形状特征(1)区域的面积A数字图像中目标区域的面积A计算方法有以下几种[46]:①基于像素的面积计算方法即目标区域所包含的像素数[45],可将区域内像素标记为f(x,y)=1,区域外标记为f(x,y)=0,则目标区域的面积[47][48]可以用公式:A
∑1表示。(x,y)∈R②基于栅格的面积计算方法即栅格表示数字图像时,目标区域包含的栅格单元的总个数。③基于链码的面积计算方法即目标轮廓链码代表的边界包围区域的面积。沿着8-邻域链码轮廓对x轴积分,就可以得到基于8-邻域链码的目标区域面积。如图3-2(a),取坐标为(2,1)的点作为初始点,那么目标轮廓的8-邻域链码表示为:766611177722132446532445,用图3-2(d)的斜线填充部分减去图3-2(c)的斜线填充面积即得到目标区域面积。25华北水利水电学院硕士学位论文3
1
0
24
1315
12
14165
67911
10
8
17
19
182021(a)目标及其8-链码轮廓(c)负数部分(填充部分)
(b)目标组成示意图(d)正数部分(填充部分)图3-2基于8-邻域链码区域面积计算过程Figure3-2Calculationprocessofthecontourareabasedon8-chaincode具体计算公式如式3-15所示:ni12其中yi为纵坐标,计算公式如3-16所示:
(3-15)yiyi−1dy(ci)i1,2,
,N
(3-16)式中,yi为纵坐标,N为链码值的个数,(x0,y0)是初始点的坐标,dx(ci)和dy(ci)分别是横坐标和纵坐标的偏移量。基于8-邻域链码的目标面积计算算法如下:(1)变量初始化,A=0,i=1。(2)对每一个链码的元素执行ni12(3)结束。261A∑dx1A∑dx(cj)[yi−1dy(ci)]1A∑dx(cj)[yi−1dy(ci)],i=i+1,yiyi−1dy(ci)华北水利水电学院硕士学位论文坐标偏移量表如表3-1所示:表3-1基于8-邻域链码的偏移量Table3-1Offsetvaluesbasedon8-chaincode链码值ci01234567
横坐标的偏移量dx(ci)110-1-1-101
纵坐标的偏移量dy(ci)0-1-1-10-111(2)圆形度圆形度也称为致密性,用来描述区域形状接近圆形的程度。在感兴趣区域大小不变的情况下,区域的面积和区域边界的长度经常作为形状特征来描述目标。对于面积确定的图像,周长越小越接近圆,周长越大则图形表面越不光滑形状也越复杂。对于面积不确定的图像,致密度越大,单位面积的周长越大,区域的形状越复杂。采用圆形度来衡量目标形状和圆形的接近程度,圆形度公式为[49]:C
P24A
(3-17)式中,P为区域周长;A为区域的面积。C≥1,当区域是圆形时,C取最小值1,当区域是细长条形或者形状较为复杂时,C值将比较大。(3)最小外接矩形(MinimumExternalRectangle,MER)由目标区域的最长直径和最短直径构成的矩形称为目标区域的最小外接矩形。则最小外接矩形的周长公式为:最小外接矩形的面积公式为:
pr2(MaxdMind)ArMaxdMind
(3-18)(3-19)(4)矩形度目标区域的矩形度反映了目标区域对其最小外接矩形的充满程度。计算公式为:e
AAr27
(3-20)华北水利水电学院硕士学位论文式中,A是物体的面积,Ar是物体最小外接矩形的面积。矩形的矩形度e取得最大值1;三角形的矩形度e
12
;圆形的矩形度C
4
;椭圆的矩形度e
2
;对于纤细的,弯曲的物体,矩形度的值变小。(5)边缘复杂度R边缘复杂度指一些图像不规则边缘的长度同其边缘拟合的规则图像周长的比值。在本文研究的病灶区域即为不规则区域,周长为P,病灶区域的最小外接矩形为拟合规则图像,周长为Pr,则边缘复杂度的计算公式为:R
PPr
(3-21)3.3基于医学影像的肝癌特征提取特征提取是医学图像分析的关键。基于区域的形状描述方法可以描述单个连通区域或者多个不连通的区域,在图像分割过程中,它对噪声不敏感。适合于区域能够较为准确的分割出来、区域内颜色分布较为均匀的图像。本文研究的肝部医学CT图像的特点是背景单一,目标提取比较容易,并且颜色单调、分布均匀,因此非常适合用基于区域的形状描述符来描述。本文结合医生专家经验和理论基础提取了肝癌CT图像的形状特征和纹理特征。在实际诊断中,医生根据CT图像中病灶区域的大小、光滑度和密度来判断病变类别。因此结合图像分析的理论知识,大小和光滑度归为形状特征,病灶区域大小指的是图像中感兴趣区域的最大直径,病灶区域边缘光滑度可用图像中感兴趣区域的矩形度、圆形度来描述。3.3.1肝癌图像纹理特
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 浙江省余姚市2022-2023学年高一下学期语文期末试卷(含答案)
- 2025共同借款合同中的连带责任担保条款示范文本
- 2025婚礼宴会承包合同模板
- 2025大货车租赁合同范本
- 2025培训班转让合同协议样本
- 2025关于服务采购合同范本
- 2025商业租赁合同范本模板
- 《流行性疾病概述》课件
- 《软件工程》课件设计模式的应用与实践
- 《前庭神经解剖》课件
- 浙江省2024年中考数学试卷(含答案)
- 新管理理论与管理方法
- (高清版)JTGT 5214-2022 在用公路桥梁现场检测技术规程
- DZ∕T 0215-2020 矿产地质勘查规范 煤(正式版)
- 妇科腹腔镜手术术前宣教
- 农贸市场消防应急预案演练总结
- 2023年湖北宜昌高新区社区专职工作人员(网格员)招聘考试真题及答案
- 《患者疼痛管理》课件
- 基于AI人工智能的智慧园区融合感知平台建设方案
- JB T 7689-2012悬挂式电磁除铁器
- 课件-错账更正
评论
0/150
提交评论