




已阅读5页,还剩71页未读, 继续免费阅读
(控制理论与控制工程专业论文)结核细胞自动识别系统中关键技术的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 结核细胞自动识别系统中关键技术的研究 摘要 目前,全世界的肺结核发病率正在逐渐上升,国内外的资料表明,肺 结核病例一旦确诊,8 0 已经失去了及早治疗的好机会。早期诊断、早期 治疗是提高肺结核患者生存率、降低死亡率的关键,因此,进行准确地早 期诊断和治疗已成为迫切需要解决的问题。 图像识别是数字图像处理中的重要课题,也是计算机辅助诊断的重要 环节。将图像识别技术引入到医生的诊断过程中,不但可以极大地提高诊 断的同一性,减少个体差异和主观性,部分地代替人的劳动,以物化的人 的经验和智力工作,而且可以提取人眼所不能观察到的信息,辅助医生诊 断。细胞分析是肺结核早期诊断的一种重要方法,利用显微细胞图像进行 细胞定量分析,从而可以提高肺结核早期诊断率,是临床医学和图像处理 专业共同关心的复杂而重要的课题。 本文在现有研究技术成果的学习研究基础上,对结核杆菌细胞显微图 像利用图像处理技术进行预处理,对其进行特征提取。再分别采用贝叶斯 决策理论分类器、神经网络中的多层前向网络( 又称b p 网络) 分类器和最小 距离分类器三种分类器对杆菌细胞和正常细胞进行分类识别,并对三种分 类识别的结果进行比较。实验证明采用的分类方法和得到的结果是比较合 理的,对于医学辅助诊断具有一定的参考价值和指导意义。 关键词:肺结核,杆菌细胞,计算机辅助诊断,图像分割,特征提取,数 i i l 学形态学,细胞识别 a b s t r a c t t 精er e s e a r c l lo fk 嚣yt e c h n i q u e sf i g i r a u r or e c o g n i t i o nt u b e r c u l o s l sc e l l s a b s t r a c t i nt h e s ey e a f s ,i n c i d e n c eo f t l l b e r c u l o s i si sr i s i n gg f a d u a l l y l o t so f i n f o 潍a t o nh a s 盎o w 娃t h a t :o n e et u b e k u l o s i si s 锇a g n o s o 或8 0p e 聃c e n to f t h e mh a sb e l o n g e dt oa d v a n c e ds t a g ea n dm o s tp a t i e n t sh a v el o s tt h eg o o d c h a n c et ob ec u r e d nh a sb e c o m eak e y p r o b i e m t od c t e c ta n dc u r em ec a s e s i 鞋t 瓤e 主fe a 蠢ys t 8 9 e s o 氆曩e l y 壤鑫g 珏o s e s 糖dt i 攥e l y 氇e 臻p yh a v eb e 搬e 氆e q u e s t i o n sf o ri m p e n d e n c y i m a g er e c o g n i t i o ni sa ni 董l 巾0 r t a n tt a s ki nd i g i t a li m a g ep r o c e s s i n g 。a l s o i tp l 妁毽a ne s s e n t i a lm l e 主nc o r n p u t e ra i d e d d i a g n o s i s a p p l y i n gi m a g e r e c o 鲈i t i o nt e c h n o l o g yt od i a g n o s i sc a ni m p m v et h ei d e n t i t yo fd i a g n o s i sa l l d f c 蠢u c et 囊es 毽巧e c t i v 姆雒d 麴攮銮| yf 罐l et 囊e 莲o e 把r sw o 波。c e l l 黼鑫每s i si s a ni n l p o r t a n tw a yt op r e t u b e r c u l o s i sd i a 髀o s i s w ec a nu s ec e l li m a g e st od o c y t o l o g yq u a n t i 诅t i v oa n 越y s 主s ,i m p r o v et h er e c o g n i t i o nr a t 洳o f p r e t u b e u l o s i s s oi ti sac o 翔p l e x 粕di m p o 池n tt a s kf o rb o 搬m e d i c a l 韪e l da n d i m a g ep r o c e s s i n gf i e l d 毛鞋魏sp 神e f ,b 鑫s e do nl o 谯o f r e s e a 辩董l i n go f t 廷ep s 雠tt e e 酶o l o g y 瓤溉 t h en l i c r o s c o p i ci m a g i 。so f b a c i l l it h et u b e r c u l o s i sc c l l sf a l l e n 蚊縮i si sa ni n l p o r t a n tw a yt o pretuberculosis dia髀osiswecanusecellimagestodo 北京化工大学硕士学位论文 t h eb pn e u m ln e t w o r ka 1 1 dt h el e a s td i s t a n c ea r i t h m e t i cc l a s s i f i e rt oc l a s s i 母 a n dr e c o g n i z et h eb a c i l l i - c e l li m a g e s a t1 a s t ,r e c o g n i z i n gr e s u l t so fm e s et h r e e m e t h o d sa r ec o m p a r e d e x p e r i t n e n tr e s u l t sh a v ep r o v e dt h a tt h e 撕t h m e t i ca n d t h er e c o g n i z i n gr e s u l t si nt h i sp 叩e ra r es o l l i l d ,a n di ti sau s e 血la n d p r a c t i c a l t o o li nc o m p u t e 卜a i d e dd i a g n o s e k e y w o r d s :t u b e r c u l o s i s ,b a c i l l i - c e l l ,c o m p u t e ra i d e dd i a g n o s i s ,i m a g e s e g m e n t a t i o n ,f e a t u r ee x t r a c t i o n ,m a t h e m a t i c a lm o r p h o l o g y , c e nr e c o g n i t i o n 第一章缝论 。 骚究豹鹜豢翔意义 第一章绪论 肺结核是世界上患者最多的疾瘸,特别是在我国肺结核发病率和死亡摩逐年上 升,严重地危害了人民的生命健康早期诊断、早期治疗怒提高肺结核患者生存率、 降低死亡率的关键目前,我国基鼷医院的临床门诊中肺结核误诊、漏诊率高达 5 2 。9 ,4 0 箩蔽下攀轻悫翥懿误诊率麓达6 3 + 3 。 卫生部2 5 年3 月公布的全国法定报告传染病疫情鼹示,肺结核己超过凝犬病, 成为甲、乙类传染痫死亡率最高的病种,同时肺结核也是发病数最高的病种。每年的 3 月2 4 日是防治缩核病r ,现今肺结梭已经成为传染病头号杀手,引起全社会的广泛 熏视。据卫生部公布调查结果,我国结核病患病人数位羼馓界第二,仅次于印度,被 瓷器翌生鳃织列菇全塔2 2 曩续核病褰发病率藿家之一。全球每年终3 0 0 万人恁予结 核病。我国的结核瘸疫情也裙当严重,穰据2 0 0 0 年全阐结核瘸流彳亍病学撼榉调查结 果,我国目前有结核病人4 5 0 多万,每年因肺结核病死亡1 3 万人,感染结核病菌的 人达到5 5 亿。 目前,肺结核早期诊断的主要手段有x 线胸片、c t 、核磁共振图像技术、同位 索、纾维支气管镜、经皮穿裁嚣捡、瘸理毪诊叛等。l 嶷痰簸可靠麴是病理往诊凝,靼 宣接对来叁悫者熬痰液静缀穗病理镯片进行分孝斤。僵在嚣除段,由于缺乏先逡游分撰 手段,往往只能依靠病理专家通过肉腿对细胞病理切片的图像进行观察和估计。但由 于有些结核杆菌细胞形态变化差异很小,加上缺乏客观定黛尺度,即使是很有经验的 病理专家在判断时也常常会出现误判,计算机能代替人去做那些费时的、枯燥蓬复的 计数工 乍,提高王终效率;另一方嚣,在识别结核秆菌纲照时,有时震要褥国定量的 缝采,a 疆难敷究成这类工幸篁,嚣本漂憨藏是泰霜诗冀褰毛强像处瑾稆谖嗣技术来完成 显微图像的分析朔识别的。 1 2 显微细胞圈像识别研究历史及方法综述 圭兹嚣学王纛楚建立在瑗我毫稀皴鏊疆土的耨兴交叉擎辩,涉及瑷我霪椽技术、 信号处理、计算枫视觉、医学成像、人工智能等学科。数字图像处理和模式谈别等技 术在生物医学领域得到广泛的应用2 ) 3 】【4 】,如病理切片图像、x 射线透视图像、c t 和m 砌、核医学影像、超声影像、红外线热成像图像等。熊中对染色体分析、舰细胞 自动分类、胸部x 光照片的鉴别、h 艮黪虹膜和指纹谚 别等缴物识别技术方蕊郝汗展了 北京化工大学硕士学位论文 卓有成效的研究工作6 l 7 】 8 1 。另外生物学与计算机科学以及应用数学等学科相互交叉 而形成的一门新兴学科一生物信息学( b i o i n f o r m a t i c s ) 。它通过对生物学实验数据的获 取、加工、存储、检索与分析,进而达到揭示数据所蕴含的生物学意义的目的,其主 要内容是基因组信息研究。 图像处理技术是把经过数学变换后得到数字图像信息,再由计算机进行编码、增 强、复原、压缩、存储等处理,最后产生可视图像。图像处理技术在通信科学、机器 人视觉、多媒体技术、高清晰度电视、医用图像处理、目标跟踪等领域得到了广泛的 应用。自九十年代起,借助计算机图像处理与分析、计算机图形学、虚拟现实和计算 机网络等技术的医学影像分析与处理一直是国内外研究与应用的热点。目前生物医学 工程是数字图像处理技术应用的一个非常活跃的领域。 细胞自动化的研究始于2 0 世纪4 0 年代末期,早期工作主要是研制定量计算的电 视显微镜,后来逐步发展为定量分析细胞及细胞分类,尤其是肿瘤细胞的分类识别。 5 0 年代末,m e l l o r s 等人通过测定核尺寸和投射,可以把颈部涂片中的癌细胞与正常 细胞区别开来,才算真正开始了显微细胞图像分析的研究。但这次的研究很快就失败 了,到了十多年后,失败的原因才被找到:测定的参量不足以反映细胞的特征。于是, 提取有效的特征参量、提高识别率,成为临床医生和图像处理工作者的目标 9 】。 近些年,国内外开始了一些这方面的研究。洪沁对胃癌细胞图像识别进行了研究, 选取了5 6 幅单细胞图像,提取了细胞面积、核面积、核浆比、核的密集度、核的平 均灰度及核内光密度均方差六个特征参量,用人工神经网络的方法进行分类,取得了 较好的结果【1 。j e a n p h i l i p p e 等人对肺部细胞图像进行分析,基于数学形态学的方法 进行图像分割,并提取了核浆比、核畸形度、核粗糙度3 个特征,进行分类 1 1 1 。t h o m a s s c h i n d e w l o f 利用色度和纹理特征,对表皮细胞进行分类 12 1 。国内外还有一些相关的 研究,针对不同的肿瘤细胞进行分类,提取了形态参量和纹理参量【1 4 】 1 5 1 进行分类。 这些研究的成果在于定量的描述了肿瘤细胞和正常细胞的区别,达到计算机自动分 类。这些研究都取得了较好的效果,有的识别率相当高。但这些研究所选用的样本均 没有考虑肿瘤发展的程度,这样就存在着一种可能,所提取的特征参量可能较好地描 述了病变细胞和正常细胞的差别,但未必能够很好地描述早期病变的细胞和正常细胞 的差别。因此,本文的研究必须在他们的基础上,找到适合描述早期病变细胞和正常 细胞差别的特征参量,并识别出结核细胞和正常细胞。 1 3 图像分割与图像识别的基本知识 1 3 1 图像分割 从总体上说,图像分割就是把图像分成若干有意义的区域的处理技术,也就是把 第一章绪论 数字图像划分成互不相交( 不重叠) 区域的过程。“区域”是像素的连通集,也就是 说,是一个所有像素都具有相邻或相接触关系的像素的集合? 4 当人观察景物时,在视 觉系统中对景物进行分割的过程是必不可少的。例如,在对医学图像处理时,如输入 的一幅细胞的照片,就需要从细胞图像中分割出单个细胞图像。又例如,如果输入的 是地形航空照片或地貌遥感图像,则需要从图像中分别检析出山区、平原、水域、森 林、城市、道路等各种不同的情况。这些从图像中分离出来的“目标”便是图像分割 的对象。但是,使用数字图像处理时,必须分割图像中的物体,把图像分割成像素集 合,每个集合代表一个物体的图像。尽管数字图像分割的任务在人类视觉感觉中很难 找到对照,在数字图像分析中它却可以能轻而易举地完成【1 7 j 。 图像分割一般可以采用三种不同的原理来实现。在利用区域分割的方法时,把各 像素划归到各个物体或区域中。在边界方法中,只需要确定区域间的边界。在边缘方 法中,则先确定边缘像素并把它们连接在一起以构成所需的边界。 图像分割的基础是像素间的相似性或跳变性。所谓“相似性”是指在某个区域中 像素具有某种相似的特性,如灰度一样,纹理相同:所谓“跳变性”是指像素特性的 不连续性,如灰度值突变等。图像分割的方法有多种,如依据工作对象来分,可分为 点相关分割和区域相关分割;按算法分类,可分为阈值法、边界检测法、匹配法和跟 踪法等。 1 3 2 图像识别 图像识别,属于模式识别领域的一个方面,粗略地讲,就是要把一种研究对象, 根据其某些特征进行识别并分类。例如要识别写在卡片上的数码字,判别它是0 、1 、 2 9 中的哪个数字,这就是将数码字图像分成十类问题。因此这种识别早已存在于人 们的生活实践中。然而,随着实践活动的扩大、深入和更加社会化的需要,人们不仅 需要识别分类很多的事物,而且被识别的对象的内容也越来越复杂。特别是由于科学 技术水平的提高,可以使得各种不同的研究对象“图像化”或“数字化”,也就是说, 可采用某种技术把考察的对象转换成照片( 如各种高空照片及x 光照片) 、波形图( 心 电图、地震波等) 以及若干数据( 遥测遥感中用多光谱扫描所得的数据) ,这些数据 就可以代表所研究的对象。因此,“图像”一词的含义绝不只是指通常意义下的图或 照片 1 6 】。人们自然希望采用各种仪器及设备来代替繁重的劳动,并且能够多快好省地 进行图像识别。随着现代计算机技术的发展,数值化处理的手段已显得出很大的优越 性。因此,图像识别技术也越来越多地得到发展和更加广泛的应用。 在进行图像识别之前,要对研究对象( 被识别的对象) 进行预处理和特征提取。 关于图像预处理和特征提取将分别在第二章和第三章中介绍。进一步的问题,就是要 设计识别方案,使得对任何一个未知类别的图像,根据识别方案就可以判定它属于哪 北京化t 大学硕士学位论立 个类。有时应用统计方法来进行特征选择,也就可以应用统计的方法来设计识别方案。 此外,也经常用已知类别的一些图像来设计识别方案,使得这个方案对原来已知类别 的图像能正确地识别,或者在某种意义下使得识别错误的可能性最小。这就是统计图 像识别的主要思想。 1 3 3 图像分割识别方法概述 一、图像分割方法 图像分割方法有很多,简要介绍如下: 1 ) 点相关的分割技术 1 灰度级的门限化方法,这是一种最常用又简单的分割方法,是把灰度级分成 许多带,选用门限值来确定图像的区域或边界点。 2 边缘检测的方法,是抽取边缘轮廓信息并用于区域分割,同时要用到边缘增 强和门限化处理。边缘检测的方法又有差分法、梯度法、拉普拉斯法、局部统计模板 法等多种方法。 3 轮廓跟踪方法,是根据以前处理过的点的某些信息,来决定每一点是否是一 个边缘点,一般是先对图像进行边缘检测,再进行边界跟踪运算。 2 ) 区域相关的分割技术 这种分割技术在数字图像处理中是使用模板匹配来检测边缘并进行分割,可以用 于检测弧点线段和一些几何图形,用来检测边缘的模板有多种,比如: 一11一l 一11一ll21 - 18-1222000 一l l 一1111一ll一1 图1 - 1 边缘检测模板举倒 f i g 1 - 1t h ee x a m p l eo f d e t e c t i n ge d g et e m p l a t e 二、图像识别方法 图像识别的方法也有很多种,像b a y e s 决策理论、人工神经网络、近邻法、模 糊聚类模式识别方法、统计学习理论和支持向量机模式识别方法等等。在本文中就使 用了这些识别方法中的三种,分别是b p 神经网络识别方法、最小距离分类法和b a y e s 似然估计分类法。 1 4 细胞图像分类识别研究与医学的关系 肺结核疾病是目前危害人民健康乃至生命的严重的疾病之一。而早期诊断是治疗 4 第一章绪论 的特征信息,而且这些特征信息仅仅代表物体,无法还原回原物体。这部分内容详见 第三章。 图1 - 4 采集的原始图像样本之一 f i g 1 - 4o n eo f t h eo r i g i n a li m a g es a m p l e 4 ) 图像分类 根据提取的特征值,利用模式识别的方法进行分类,确定类别名称,以便对图像 的重要信息得到一种理解和解释。这一过程输入是特征信息,输出是类别名称。这部 分内容详见第四章,我们采用了现行主流的三种细胞图像分类识别的方法,分别为基 于概率统计的贝叶斯分类器,b p 神经网络分类器和基于最小距离监督的分类器对结核 细胞和正常细胞进行识别,最后对这三种分类方法的结果进行了分析与比较。 本文的研究工作主要有:首先用图像分割及去噪处理,分割出感兴趣的细胞核区 域;并用合适的特征参量来表征胞核分布的不同进行特征提取,然后将特征参量分别 送x b a y e s 决策理论、b p 神经网络和最小距离监督分类器分类,都取得了较好的效果, 最后对三种分类方法的进行分析与比较。 全文结构安排如下: 第一章绪论 第二章图像分割方法及实现 第三章基于结核杆菌特征的模式向量和知识表示 第四章细胞图像分类识别方法及实现 第五章结束语 第二章图像分割方法世实现 第二章图像分割方法及实现 2 1 图像增强与平滑 在图像的形成和:变换的过程中,旋液涂片图像由于受到光学系统失真、系统噪声、 曝光不足等原因,图像往往与原始图像之间产生某种差异,这种差异称为降质或退化。 这种降质或退化的图像通常模糊不清,并且使机器从中提取的信息减少甚至造成错 误,因此我们必须对降质的图像进行改善。 改善降质图像的方法有两类:一类是不考虑图像降质的原因,只将图像巾感兴趣 的部分加以处理或突出有用的图像特征,使改善后的图像并不一定要去逼近原图像。 这一类图像改善方法称为图像增强,主要日的是提高图像的可懂度。另一类方法是针 对图像降质的具体原因,设法补偿降质因素,使改善后的图像尽可能地逼近原始图像, 这类方法称为图像恢复或图像复原技术。因为我们的目的是为了提高细胞图像的可懂 度,不需要改善后的图像逼近原图像,所以采用了图像增强技术。 图像增强有两个目的,一是改善图像视觉效果,提高图像的清晰度,二是突出图 像的特征,便于计算机对图像的识别理解、分析的需要。图像增强是在卒间域中进行 的。“空间域”指图像平面自身,这类方法是以对图像的像素直接处理为基础的。 图像增强的通用理论是不存在的。当图像为视觉解释而进行处理时,由观察者最 后判定特定方法的效果。图像质量的视觉评价是一种高度主观的过程因此,定义一 个“理解i 蛩像”标准,通过这个标准去比较复杂算法的性能。当为机器感知而处理图 像时,这个评价任务就会容易一些。例如,在一个特征识别的应用巾,不考虑像计算 要求这些问题,最好的图像处理方法是种能得到最好的机器可识别结果的方法。 2 1 1 直方图 如果将圈像中像素亮度看成是一个随机变量,则其分布情况就反映了图像的统计 特性,这可用概率密度函数p r o b a b i l i t yd e n s 崎f 1 1 n c t i o n ( p d f ) 来刻画和描述,表现为 灰度直方图( h i s t o g r a m ) 。灰度直方图是灰度级的函数,它表示图像中具有某种灰度级 的像素的个数,反映了图像中每种欢度出现的频率,它是图像最基本的统计特 x 北京化工大学硕士学位论文 数r ( r ) 满足以下条件: ( a ) 丁( ,) 在v g l 日q 0 r 1 中为单值且单调递增: ( b ) 当0 r 1 时,0 t ( r ) 1 。 条件( a ) 中要求r ( ,) 为单值是为了保证反变换存在,单调条件保持输出图像从黑 到白顺序增加。由j 到r 的反变换可以表示为: ,= t 。( s ) 0 s 1 ( 2 2 ) 条件( b ) 保证了输出灰度级与输入有同样的范围。 一幅图像的归一化的灰度级可被视为区间 o ,1 】的随机变量。随机变量的一个最重 要的基本描述是其概率密度函数( p d f ) 。令p ( ,) 和p a s ) 分别代表随机变量r 和s 的 概率密度函数。此处带有下标的只和只用于表示不同的函数。由基本概率理论得到一 个基本结果:如果p ( r ) 和丁( r ) 己知,且r 。( s ) 满足条件( a ) ,那么变换变量s 的概率密 度函数只( s ) 可由以下简单公式得到: 聃m 卧( 2 - s ) 因此,变换变量s 的概率密度函数由输入图像的灰度级p d f 和所选择的变换函数 决定。 在图像处理中一个尤为重要的变换函数如下所示 s = 丁( r ) = n ( w ) d w ( 2 4 ) 其中w 是积分变量。上式的右部为随机变量r 的累积分布函数。因为概率密度函 数永远为正,并且函数积分是一个函数曲线下的面积,所以它遵循该变换函数是单值 单调增加的条件,因此,满足条件( a ) 。类似地,区间【o ,l 】上变量的概率密度函数的积 分也在区间 0 ,1 上,因此,也满足条件( b ) 。 给定变换函数r ( r ) ,通过式( 2 3 ) 得到只( s ) 。从基本微积分学,我们知道关于上 限的定积分就是该上限的积分值。即 :d s :_ a t 一( r ) :要 f n ( 切咖】= 弗( ,) ( 2 5 ) 第二章图像分割方法及实现 用这个结果代替酬出,代入式( 2 3 ) ,取概率值为正,得到 聃却府,阱删l 去i = 矧江e , 因为( s ) 是概率密度函数,在这里可以得出,区间 0 ,1 】以外它的值为0 ,这是 因为它在所有s 值上的积分等于1 。我们看到式( 2 6 ) 中给出的只( s ) 形式为均匀概率密 度函数。简而言之,已证明执行式( 2 4 ) 给出的变换函数会得到一个随机变量s ,其特 征为一均匀概率密度函数。特别要注意从式( 2 4 ) 得到t ( r ) 取决于只( r ) ,但是,如式( 2 6 ) 指出的那样,只( s ) 的结果始终是均匀的,与p a r ) 的形式无关。 对于离散值,我们处理其概率与和,而不是概率密度函数与积分。一幅图像中灰 度级r k 出现的概率近似为: p r ( 咋) = 生l j = 0 ,1 2 ,l 一1 ( 2 7 ) 其中,如此节开始指出的,n 是图像中像素的总和,是灰度级为r k 的像素个数, 三为图像中可能的灰度级总数。式( 2 4 ) 中变换函数的离散形式为: =丁()=褰prskp ( ) = 高等k = 0 ,l 2 。l - 1 ( 2 8 ) = 丁( ) = ( ) = 詈 = o ,l 。( 2 8 ) 7 = 0,= 0 7 因此,已处理的图像由通过式( 2 8 ) ,将输入图像中灰度级为r k 的各像素映射到输 出图像中灰度级为的对应像素得到。如前所述,作为的函数p ( 唯) 的曲线称为直 方图。式( 2 8 ) 给出的变换称为直方图均衡化或直方图线性化。 由上述连续形式可以很容易看出,式( 2 8 ) 的应用有展开输入图像直方图的一般趋 势,以至于直方图均衡化过的图像灰度级能跨越更大的范围。从图2 - 4 这个直方图最 容易辨别的特征是高端如何根据需要移到较暗的左端。由图2 3 我们看出当直方图均 衡化技术用于平滑噪声区域时,图像对比度提高了,噪声就会明显地增强,可以说, 这种方法没有带来新的结构性的细节。因此要对图像进行去噪处理。 2 1 4 中值滤波( 图像平滑) 因为中值滤波可以克服线性滤波器所带来的图像细节模糊,而且对滤波脉冲干扰 北京化工大学碗上学位论文 及图像扫描噪声最为有效。因此我们对图像进行直方图均衡化后,再进行中值滤波。 图2 - 3 痰液涂片图像均衡化 f i g 2 3p r o p o r t i o n a t et h ei m a g eo f s p u t u ms m e a r 图2 - 4 均衡化的直方图 f i g 2 - 4t h eh i s t o g r a mo f p r o p o r t i o n a t ei m a g e 一、滤波的概念 “空间域增强”是指增强构成图像的像素。空间域方法是直接对这些像素操作的 过程。空间域处理可由下式定义: ( 2 - 9 ) 其中f ( x ,y ) 是输入图像,g ( x ,y ) 是处理后的图像,t 是对,的一种操作,其定 第二章图像分割方法及实现 义在( x ,y ) 的领域。另外,丁能对输入图像集进行操作。 定义一个点( x ,y ) 邻域的主要方法是利用中心在( 工,y ) 点的正方形或矩形子图像, 子图像的中心从一个像素向另一个像素移动。r 操作应用到每一个( z ,y ) 位置得到该点 的输出g 。这个过程仅仅用在小范围邻域里的图像像素。这个邻域一般取正方形阵列 执行操作。一般的方法是,利用点( x ,y ) 事先定义的邻域里的一个,值的函数来决定g 在( 工,y ) 的值,其公式化的一个主要方法是以利用所谓的模板( 也指滤波器) 为基础 的。从根本上说,模板是一个小的( 即3 x 3 ) 二维阵列,如图2 5 所示,图中,模板 的系数值决定了处理的性质,如图像尖锐化、图像平滑等。以这种方法为基础的增强 技术通常是指滤波处理。 图2 - 5 空间滤波掩模 f i g 2 - 5t h et e m p l e tu s e dt of i l t e r i n g 二、中值滤波原理 中值滤波是一种非线性信号处理方法,与其对应的中值滤波器也是一种非线性滤 波器。它可以克服线性滤波器所带来的图像细节模糊,而且对滤波脉冲干扰及图像扫 描噪声最为有效。由于中值滤波器是一种非线性运算,对随机输入信号的严格数学分 析比较复杂,我们下面采用直观方法简要介绍中值滤波器的原理。 中值滤波就是用一个奇数点的移动窗口,将窗口中心点的值用窗口内各点的中值 代替。假设窗口内有五点,其值为8 0 、9 0 、2 0 0 、l l o 和1 2 0 ,那么此窗口内各点的中 值即为1 1 0 。 4 第二章图像分割方法及实现 2 2 图像边缘提取 图2 - 6 中值滤波后的图像 f i g 2 - 6t h ei m a g ea f t e rm e d i a nv a l u ef i l t e r i n g 图2 7 图2 - 6 对应的直方图 f i g 2 7t h eh i s t o g r a mo f f i g u r e2 - 6 一条边缘是一组相连的像素集合。这些像素位于两个区域的边界。由于边缘是图 像上变化比较剧烈的地方,若对灰度突变的地方进行一阶微分( 数字图像是差分) ,则 会产生极大值:进行二阶微分,n - - 阶微分值的符号会发生改变。函数的导数在突变 点处取得极值或二阶导数在突变点处过零是边缘检测的理论依据,早期的乃至于现代 的许多边缘检测算法都是基于这一思想的。 常见的边缘检测算法有微分算子法、面模型检测法、模板匹配法和h o u g h 变换 等。由于微分算子法的普遍性和易用性,所以我们选用微分算子方法进行边缘检测。 北京化工大学硕士学位论文 2 2 。3p r e w i t t 算子 圈2 - 9l a p l a c i a n 算予边缘检溺 f i g 2 - 9l a p l a c i a no p e r a t o ru s e df o re d g ed e t e c t i n g 检测水- 平边缘的模板 ;罩;1 和检测垂直边缘的模板r 三i 2 2 ,4s o b e l 冀予 蓬2 ,1 0p r e w i t t 德缘检测模授处理 f i g 2 1 0p r e w i t to p e r a t o ru s e df o re d g ed e t e c 6 n g 虬we rpo ,l, o 0 e 北求化工人学坝j 学位论文 效粜会更好。 卜2 1 4 常用的l 。g 算子是5 5 的横板i : 2 _ 4q 一4 _ 2 osoq 82 48_4 o80_4 oo 一4 之 。到中心的距离与位置加 权系数的关系曲线象墨西哥草帽的剖面,所以l o g 算予也叫墨两哥草帽滤波器 2 0 l 。 强2 ,| 2 为l o g 摸扳遴翻处理五熟效果。 蓐2 ,1 2l o g 边缘检测模掇处理 f i g 2 一1 2m go p e r a t o ru s e df o re d 鬈c 幽t c c d n g 2 2 6 上述几个算子比较与选型 上述几种边缘检测葬子,都能够对图像边缘逡彳亍掇敲,但是隧为算予的区稍,对 不同的图像就会产生不阁的效果。r o b e r t 算子是2 x 2 算子,对具有陡峭的低噪声图像 响应簸好。其它都是3 x 3 算子,对灰凄澎变粒澳声较多夔图缘楚毽懿较好。 我们比较圈2 g 一圈2 1 2 可以看到,r 0 b e n 算予检测到的边缘线比较粗,s o b e l 算子的边缘线婴细一些,p r e w n 鳟子实现起来比s o b e l 算子更为简单,但后者在噪声 季枣露l 特性方法路箍一筹。拉普拉冀蓐簿子俸为个二阶髫数,对噪声具有无法接受瓣敏 感性,且其i 嗡值产生双边缘,并阻不能检测边缘的方向。而l o a 算予能克服以上几 个算予的缺点,对有缀多壤毛戆鲻照来说,糍够保持边缘缨节。凌阻上豹爨也可以露 出,l o g 算予进行边缘检测的效果比其他算子要好。 第三章基于结核杆菌特征的模式向量和知识表示 j 。1 s d 7 赣鸯链碥 方向婕薅爱示 图3 1 八方向链码及链码表示 f i g 3 1c l l a i nc o d eo f a nd 岫c t i o n 柚de x p r e s s l l o 鬟2 i 3 123 ox4 翟6葚 四连通八。连通 图3 2 像点邻域示意图 f i g 3 - 2s k e t c hm a po f i 眦g ed o ta d j a c e n tf i e l d 对于任意一条曲线都可以用链码符号化,表示成如下形式: 9 4 ,2 口l a 2 口。口。= o 7 ( 3 一1 ) 如图3 一l 的方向链码表示,若以上面s 为出发点,按逆时针的方向进行,所构成 的边界链码应为5 5 6 5 7 0 7 0 0 1 2 2 3 3 3 。其中,偶数链码段为垂直或水平方向的代码段, 奇数链码段为对角线段。 若水平与垂直方向的码段长度定义为单位l ,则对角线的码段长度则为2 倍的 单位长度。即:所有编码为偶数的长度为l ,所有编码为奇数的长度为2 。当然,也 可以按顺时针方向进行,所构成的边界码完全不同于逆时针方向行进的情况。这样边 界链码具有行进的方向性。有了这一链码的方向链,再加上一些标识码,即可构成链 码。标识方法可以加上特殊专用的链码结束标志,如加上“! ”,链码5 5 6 5 7 0 7 0 0 1 2 2 3 3 3 变为链码5 5 6 5 7 0 7 0 0 1 2 2 3 3 31 。也可以标上起始点的坐标,变为5 5 6 5 7 0 7 0 0 1 2 2 3 3 3 x y x y 为起始点s 的坐标。有了链码方法就可以继续研究区域形态特征的数量化的表示了。 3 4 核细胞模式特征 2 4 北京化工火学硕士学位论立 在模式特征的选择上可以直接利用空域上像素的分布特征,主要包括各种描述子 和矩特征。另一种方式是经过变换处理,从变换后的结果中提取识别所需的特征。图 像的矩特征实质上是该图像整个空间特性的集成。在相继提出的多种矩特征中,当前 最常用的有h u 矩、z e m i k e 矩等。使用这些矩特征,由于只是提取了图像的全局信息 【2 3 1 ,因此适用于具有两幅图像明显差距的情况( 比如坦克和汽车) 。而对于象细胞这样 较小物体的特征需要从整体和局部两个角度分析,采取基于多特征量和多角度的描 述。 3 4 1 特征向量定义基础 先定义几种基本的反映物体形状特征的形状参数,然后再根据具体问题考虑度量 方法和采用什么样的特征向量。 定义1 像素计数面积 最简单的( 未校准) 面积计算方法是统计边界内部( 也包括边界上) 的像素的数目。 与这个定义相对应,周长就是围绕所有这些像素的外边界的长度。通常,测量这个距 离时包含了许多9 0 度的转弯,从而夸大了周长值。 定义2 多边形的周长 一个让人更满意的测量物体周长的方法是将物体边界定义为以各边界像素中心 为顶点的多边形,于是相应的周长就是一系列横竖向( 如卸= 1 ) 和对角线方向 ( 卸= 2 ) 的间距之和,这个和可以在用行程编码取物体时累加或建立链码表示时对 边界进行一趟跟踪的过程中累加。一个物体的周长可表示p = 犯+ 2 0 ( 其中m 和 m 分别是边界链码中的偶数步与奇数步的数目) ,另一种表达形式是: p = 7 ( 2 ) 8n = d ,m o d 2 ( 3 2 ) 定义3 圆形度 圆形度是反映圆形程度的指标,因为它们在对圆形形状计算时取最小值。它们的 幅度值反映了被测t 边界的复杂程度。常用的圆形度指标是 c = j p 2 一。( 3 3 ) 也就是周长的平方与面积的比,这个特征对圆形形状取最小值4 x 。 定义3 归一化圆形度 在定义细胞特征时会看到直接使用这个圆形度不太方便,因为我们需要的是一个 归一化的值,即取值范围为( 0 ,1 ) ,这样可以通过变换定义c = 4 石4 p 2 即可。 一个相关的圆形度指标是边界能量。一个物体的周长为p ,我们用p 表示边界上 第三章基于结核杆菌特征的模式向量和知识表示 的点到某一起点的距离。在任一点,边界都有一个瞬时曲率半径r ( p ) ,这是在该点与 边界相切的圆的半径,在p 点的曲率函数是k ( p ) = l r ( p ) 。函数髟( p ) 是周期为p 的 周期函数,可以用下式计算单位边界长度的平均能量: e = 去r i 足( p ) i 2 印( 3 4 ) 对于一固定的面积值,一个圆具有最小边界能量: 磊= ( 等 2 = ( 妒s , 这里r 是该圆的半径。 由于异常细胞偏离回的程度比较大( 如图3 3 ) ,因此圆形度是一个重要的特征参 数。 图3 - 3 异常细胞偏离回示意图 f i g 3 - 3s k e t c hm 叩o fa b n o h n j t yc e l ld 印a 巾盯ea n s w e r 3 4 2 模式特征向量与计算方法【2 4 l 上面分析了一些基本的特征量参数,但是对于一个具体的目标几乎没有可用的解 析的方法能够指导特征的选取。区分正常细胞和结核细胞的特征参数在前面的形态学 分析依据中列举了许多条。它们都是实际判断中的影响参数,非常重要的是在这些特 征中选择哪些特征 凇 稀动静拍斡? 胞的程度,取值从0 到1 。 基于细胞特征的选取原则有四点: (1)可区别性对于属 于不同类型的对象来说,它们的特征应具有明显的差异。( 2 ) 可靠性对同类的 对象特征值应该比较相近。( 3 ) 独立性所用的各 特征之间应彼此不相关,或相关度比较小。 北京化_ 丁大学硕士学位论文 根据医学专家的经验及计算机可以分析与度量两方面考虑对细胞进行链码表示, 我们用到的细胞的特征商周长、面积、宽度、高度等,进而分析与定义细胞的圆度, 纲藏送域戆糕彩凄,缀藏区域豹l 睾长菠,形凝奇雾嚣予等特薤, 方向码d 。、在x ,y 轴上的分量分别表示为口。和,其值如表3 一i 所示: 表3 1 方囱弱及箕特征俊表示 t a b l e3 - l a s p e c tc o d oa 1 1 de i g e n v 姒u ee x p 坤s 8 嚷 o i 23 4 567 | t lo111ol q , o1l1o111 形态分析用八链码对二值图像进行边缘跟踪可以得到一系列细胞的几何形状特 征,其周长、灏积、圆殿等豹计算方法如下: ( 1 ) 链码所围的细胞区域的周长,即链的长度: 三= 托+ 2 ( 3 6 ) 其中:n 。表示链码中偶数码的数目: 圮表示链粥中奇数粥的数目 ( 2 ) 缨魏嚣域熬宽瘦弱鑫痉 定义方向码d ,在x 轴上的分嫒为,在y 轴上的分量为4 。,与的取值如 上表3 l 所示: 设和孔蹩起始点静坐标,猢: 宽度: 岗度: 渺= m 警( + ) 卿n ( + 黾) 。( 3 一? ) l t i女= l = m 警( 口扣+ ) 一哪n ( n 扣+ 儿) * “【t o i ( 3 ) 细胞区域的瑟积 4 = 喜姒抽+ 三吵( 3 哪 其中: y ,= m l + a 。 ( 4 ) 细胞区域豹圆度 c = 4 厅“r ( 3 一l o ) 北京化工大学硕,l 学位论文 x 与y 之间的距离定义为: 厂 d i x , y ) _ ,7 | 置一y l | 2 ( 3 一1 4 ) ¥f = l 显然,蔚x 和y 位于同个类型区域姒,距离d ( x ,y ) 较小,距离的远近反映了 模式淘量瘊蕊类型有无差异,援缓癌缀壅实鞲类剩静差异搜类瓣莲裹丈蠢类内题裹 小,所选择的特征应尽可能满足这样的要求相结合。 第四章细胞图像分类识别方法及宴现 4 1 概述 第四章细胞图像分类识别方法及实现 本章主要介绍了现行主流的三种细胞图像分类识别的方法 3 2 】,分别为基于概率 统计的贝叶斯分类器,b p 神经网络分类器和基于最小距离监督的分类器,以及这三种 分类识别方法用于结核细胞的案例实现。最后对这三种分类方法的结果进行了分析与 比较。 4 2 基于b a y e s 决策理论的结核细胞图像分类识别 4 2 1 统计模式识别简介1 3 3 。q 统计模式识别是以模式集的特征空间中分布的类概率密度函数为基础的,根据识 别对象特征的观察值将其分到某个类别中去【”】。统计决策理论是处理模式分类问题的 基本理论之一,它对贝叶斯分类器的设计有着实际的指导意义。当模式的类概率密度 函数的形式是已知的,或者从提供的作为设计分类器用的训练样本能估计出类概率密 度函数的近似式,则在具体计算中,密度函数的未知参数就可用合适的估计量来取代。 计算判别参数只需用估计参数来运算,即将估计类概率密度函数的问题简化成估计密 度函数的参数问题,以使运算大为简化f 3 9 】。b a y e s 决策理论是统计模式识别中的一 个基本方法,用这个方法进行分类时要求: ( 1 ) 各类别的总体概率分布是已知的; ( 2 ) 要决策分类的类别数是一定的。 4 2 2 b a y e s 分类算法与实现 一贝叶斯判别原则4 1 。4 4 本课题中要决策分类的类别数是两类,一类是正常细胞,一类是结核细胞。我们 重点讨论两类模式集的情况。简单地根据概率的判别规则,可写成: 若p ( qi _ ) f ) p ( 哆l x ) ,贝0 工5 q : 若p ( q i z ) o ,则决策帆; 如果矗o 0 ,测决策鼽; 可以定义如下的判别函数 蘸) 蠢( d = p ( 冬| 习一琰哆 毋( 4 一| 4 ) b ) d ( 功= 段j i q ) p ( q ) 一p ( 石i 鸭) h q ) ( 4 一1 5 ) 洲曲爱描砘怒一 2 ) 决策面方程为川曲一o 3 ) 分类器设计,它根据计算缩聚的符号聋分类,结构图如图4 1 所示: k r d 一 列嗣嚣篝 阑值单元 虽4 1 受时斯分类嚣熊稳图 l ;| i g 4 一lt h es k e t c hm a po f b a y e sc l a s s i 6 e r + l 以 一l 哆 决蒲 第靼章细胞图像分类谖剐方法及安现 因b a y e s 分类器的程序实现 求每一类的协方差矩阵 l m s o2 志萋(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 半角题目及答案
- 安全综合知识试题及答案
- 钢水烫伤培训课件
- 可穿戴医疗设备市场潜力分析:2025年技术创新与需求变化报告
- 安全生产选择试题及答案
- 数字艺术市场2025年交易活跃度研究报告:艺术与虚拟现实结合的新领域001
- 安全检查工试题及答案
- 安全管理模拟试题及答案
- 预防燃气泄漏培训课件
- 中国原始社会美术课件
- 人文英语4-008-国开机考复习资料
- 公司责任与权力分配管理制度
- 甘肃电投集团笔试试题
- 部编版四年级语文阅读训练20篇专项专题训练带答案解析
- 《中欧国际工商学院》课件
- 环境水利学-001-国开机考复习资料
- 大讲堂之 第五讲 大一统与中华民族的初步形成秦汉时期《中华民族共同体概论》
- 【培训课件】卓越讲师技能训练
- 2019版CSCO黑色素瘤指南
- 企业数智化能力成熟度模型(EDMM)标准体系解读
- 2024年个人联营经营承包合同样本
评论
0/150
提交评论