




已阅读5页,还剩63页未读, 继续免费阅读
(电路与系统专业论文)乳腺x图像肿块检测与分类方法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 摘要:乳腺癌作为发病率占全身各种恶性肿瘤的7 1 0 的高危疾病正日益引起人们 的重视,而预防与治疗这种疾病最好的办法就是开展乳腺x 摄片的全民普查。由 于我国人口与医疗人员比例严重失调,促使计算机辅助检测( c a d ) 成为现今重要的 研究方向,通过计算机辅助医师进行x 摄片的诊断。已有c a d 检测方法中,尚存 在漏检率高、特征提取冗余、计算复杂等问题,未能投入临床使用。 本文为了提高基于单幅图像的肿块c a d 检测性能,完成了以下三个方面的工 作: ( 1 ) 提出了三条基于医师诊断方法的判别条件用于去除明显的假阳性区域。 在提取图像中肿块可疑区域的基础上,给出了肿块的圆形度、肿块大多独立存在、 与乳腺边缘距离较大这三条基于先验经验的判别标准,通过区域筛选测试算法将 不满足条件的可疑区域去除。测试结果表明,应用本判别标准,可将4 0 以上的 假阳性区域去除,在减少了计算量的同时也大幅减少了这些区域对后续分类的影 响。 ( 2 ) 提出了一种基于模糊集的分割方法。在肿块的分割问题上,针对以往的 区域分割算法只能获得绝对边界,无法获得肿块周围发散性信息的问题,将模糊 集概念引入区域生长分割算法,通过定义的隶属度函数赋予每一个像素点一个隶 属度参数以表示该点从属于种子点的程度,有效的获得了肿块区域的详细边缘信 息以及肿块对周围区域的浸润程度等参数。这些参数是判断肿块良、恶性的重要 依据。 ( 3 ) 在保证低漏检率的前提下,减少了用于分类的特征向量的数量。针对现 有的机器学习方法中,特征向量选择繁多、计算量大等问题,本文通过选取具有 明确意义的三方面的参数来支持分类结果。它们包括体现肿块明显高于周围组织 亮度的肿块区域平均灰度值和周围背景区域平均狄度、体现肿块外形特征的核心 区域圆形度和边缘区域圆形度、体现肿块对周围区域浸润程度的隶属度分布。测 试结果表明,分类取得了良好的结果,检测后的图像中平均仅有假阳性点1 1 个, 对于良、恶性肿块的识别率也达到8 0 以上。 本文选择的特征参数可以较好地成为分类的依据,一定程度上解决了参数选择 冗余的问题,在简化了计算的同时,获得了可以提供给医师参考的检测结果。 本文共有图5 3 幅,表9 个,参考文献3 2 篇。 关键词:乳腺x 线图像;肿块检测:模糊集:区域生长;特征向量提取 分类号:t p 3 9 1 7 j 匕立銮遭盔堂亟堂僮途室垦望b 垒盟 a b s t r a c t a b s t r a c t :b r e a s tc a n c e ri n c i d e n c eo fad i s e a s eo fw h 0 1 eb o d va sam a l i 2 皿a n tt l l m o r o f7 ,1o o fm er i s ko fd i s e a s ei si n c r e a s i n g l ya t 仃a c t e dp e o p l e sa t t e n t i o n m eb e s tw a y o fp r e v e n t i o na i l dt r e a t m e n to ft h ed i s e a s ei st od e v e l o pb r e a s txr a d i o 盯a p h vt h ec e n s u s b e c a u s eo u rc o u n t r yp o p u l a t i o na n dm e d i c a lp e r s o n n e li h l b a l a n c e ,m d k ec o m p u t e r a i d e dt e s t i n g ( c a d ) h a sb e c o m ea ni m p o r t a j l tr e s e a r c hd i r e c t i o n t 1 1 r o u g hc o m p u t e r a i d e dp h y s i c i a l lx r a d i o 孕a p h yd i a 印o s i s c a dd e t e c t i o nm e t h o df o rt h e r ea r em a i l y s h o r t c o m i n g s , s u c ha sm i s sr a t ei sh i 吐, t h ef e a n l r ee x t r a c t i o n r e d u n d a n c y , c o m d u t a t i o n a lc o m p l e x i t v ,a n df a i lt oi n v e s ti nc l i n i c a lu s e t h i sp a p e ri no r d e rt oi m p r o v et h ed e t e c t i o np e b n n a n c eo ft h ec a db a s e do n s i n 翻em a s si m a g e ,c o m p l e t e dt h ef o l l o w i n gt h r e ea s p e c t s : ( 1 ) t h i sp a p e rp u t sf l o n a r dt h r e e l ed i s c r i m i n a n tc o n d i t i o n sb a s e do nd o c t o r s d i a g n o s i sm e t h o du s e dt or 锄o v et h eo b v i o u sf a l s ep o s i t i v ea r e a a r e re x t r a c t i n 2t h e s u s p e c ta r e a ,t h i sp a p e ru s e st h em a s so fr o u n dd e 黟e e ,m o s t l yi n d 印e n d e n te x i s t e n c e , m a s sa j l dm a m m a r ye d g e sd i s t a i l c ei sl a r g em e s et l l r e eb a s e do np d o re x p 蕊e n c e d i s c r i m i n a t i o ns t a n d a r d s t h r o u 曲t h es c r e e n i n gt e s ta r e ac a nr e m o v eal o to ff a l s e p o s i t i v er e g i o n a l t e s tr e s u l t ss h o wt h a tt h ea p p l i c a t i o no ft h i sa s s e s s m e n tc r i t e r i o n c a n b em o r et h a j l4 0 o fm ef a l s ep o s i t i v er e 西o n a lr e r n o v e d i nr e d u c et h ec o m p u t a t i o n t i m eo fa l s os h a i p l yr e d u c et h ea r e ao ns u b s e q u e n tc l a s s i 行c a t i o ni n f l u e n c e ( 2 ) p u tf o n v a r dai m a g es e g m e n t a t i o nm e t h o db a s e do n 如z z ys e t s p r e v i o u sr e 西o n a l s e g m e n t a t i o na l g o r i t h m c a no n l yg e t a b s o l u t e l yb o u n d a r y , c a l l tg e ta r o u n dm a s s d i v e r g e n ti n f o r n l a t i o n t 1 1 i sp 印e fi n t r o d u c e dt l l ec o n c e p to f 如z z ys e t si n t or e 酉o n a l g r o w t hs e g m e n t a t i o na l g o r i t l l i l l t h r o u g ht h ed e f i n i t i o no fm e m b e r s h i pm n c t i o n s 舀v i n g e a c hp i x e lam e m b e r s h i pp a r a m e t e r st os h o wt h ed e 铲e em a tp o i n tb e l o n g st os e e d s p o i n t e f f e c t i v ew o nt h em a s se d g e sd e t a i l e di n f o m a t i o na 1 1 dt 1 1 ep a r 锄e t e r ss h o w s l e d e g r e et h em a s se x t e n s i v et h ea r e aa m u n d t h e s ep a r 锄e t e r sa r eb e n i 2 na n dm a l i 譬皿a n t m a s si nt h ei u d g m e n to ft h ei m p o n a n tb a s i s ( 3 1e n s u r i n gl o wi nm i s sr a t e ,r e d u c e do f 廿l en u m b e ro fc h a r a c t e r i s t i cu s e df o r c l a s s i f i c a t i o nv e c t o r a r e rg e ts u s p i c i o u sa r e a ,t h i sp a p e rc h o o s et ou s em a c h i n e 1 e a n l i n gc l a s s i 6 c a t i o n ,m a c l i n el e 锄i n gm e t h o dw ec h o o s et l l es u p p o r tv e c t o rm a c h i n e ( s v m ) w h i c hh a v ev e 巧g o o dp e r f o n l l a n c ei nl i m i t e ds a m p l e s i nt h i s p a p e r m e c h o i c eo fc h a r a c t e r i s t i cv e c t o r ,m a i n l yt 1 1 r o u 曲t h r e ea s p e c t so fp a r 锄e t e r st os u p p o r t t h ec l a s s i f i c a t i o nr e s u l t s , i n c l u d i n 2m a s sb r i g h t n e s sm e a n灯e yv a l u ea j l dt h e s u r r o u n d i n ga r e ab a c k 孕o u n dr e 舀o na v e r a g e 铲a yw h i c hr e f l e c tm a s sw a ss i g n i 6 c a n t l y h i 曲e rt h a nt h es u r r o u n d i n gt i s s u e ;m a s sc o r er e 百o nc i r c u l a rd e 孕e ea n de d g er e 舀o n s r o u n dd e g r e ew h i c hr e n e c tt h ec o n t o u rf e a t u r e s ;d e 酉e eo fm e m b e r s h i pd i s t r i b u t i o n w h i c hr e n e c tt h es u 丌o u n d i n ga r e am a s si n v a s i o n e n s u r i n gl o wi nm i s sr a t e ,r e d u c e d t h en u m b e ro fc h a r a c t e r i s t i cu s e df o rc l a s s i f i c a t i o n ,t os o m ee x t e n t ,s o l v et h ep r o b l e mo f t h ep a r 锄e t e rs e l e c t i o nr e d u n d a n c y t e s tr e s u l t ss h o wt l l a tm ec l a s s i f i c a t i o na c h i e v e d g o o dr e s u l t s t l l ec h a r a c t 舒s t i cp a r 撇e t e r st h i sp a p e rc h o o s e sc a nb ev e r yg o o db e c o m e t h eb a s i so fc l a s s i f i c a t i o n t h es e l e c t i o no fc h a r a c t e r i s t i cv e c t o rt h o u 曲ta l s op r o v i d e s j 匕丞銮垣态堂亟堂焦途塞 旦塾b 工 d i r e c t i o nf o rl a t e rr e s e a r c h a f t e rt h ef 0 1 l o w u pi m p r o v e m e n t ,d e t e c t i o nm e t h o di sp u t f o n v a r di nt l l i s p a p e rw i l lh a st h ev a l u eo fa p p l i c a t i o ni nc l i l l i c a l a r e rt e s t ,e a c h i m a g eh a so n l y1 1 f a l s ep o s i t i v ep o i n to na i la v e r a g e ,f o rg o o da n dm a l i g nb u m p r e c og 皿i t i o nr a t ei sa b o v e8 0 t h i sp a p e rc h o o s e st h ec h a r a c t e r i s t i cp a r 锄e t e r sc a i lw e l lb e c o m et l l eb a s i so f c l a s s i f i c a t i o n ,t oac e r t a i ne x t e n t ,s 0 1 v e dt h ep a r 锄e t e rs e l e c t i o nr e d d a l l c vp r o b l 锄i n s i m p l i f i e dc a l c u l a t i o na tt h es 锄et i m e ,m i sp a p e rw o nm er e s u l t sw h i c hc a i lp r o v i d et o d o c t o r sa sar e f e r e n c e k e y w o l m s :m 砌m o 铲锄;m a s sd e t e c t i o n ;f u z z ys e t ;r e 百o n a l 黟o w t h ;f e a t u r e v e c t o re x t r a c t i o n c l a s s n o :t p 3 9 1 7 v 致谢 本论文的工作是在我的导师陈后金教授的悉心指导下完成的,陈后金教授严 谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢三年来 陈老师对我的关心和指导。 陈后金教授和李居朋老师悉心指导我们完成了实验室的科研工作,在学习上 和生活上都给予了我很大的关心和帮助,在此向陈老师和李老师表示衷心的谢意。 陈后金教授对于我的科研工作和论文都提出了许多的宝贵意见,在此表示衷 心的感谢。 在实验室工作及撰写论文期间,秦少东、刘林、陈莎莎等同学对我论文中的 图像分割研究工作给予了热情帮助,在此向他们表达我的感激之情。 另外也感谢家人王兵团、沈丹华,他们的理解和支持使我能够在学校专心完 成我的学业。 1 绪论 1 1 课题背景及意义 乳腺癌( m 锄m a r yc a j l c e r ) 是女性最常见的恶性肿瘤之一,发病率在全身各种恶 性肿瘤中也属于较高水平,大约占7 1 0 ,在女性人群中仅次于子宫癌,已成为威 胁妇女健康的重要病因之一。它的发病常与遗传有关,以及4 0 _ _ 6 0 岁之间,绝经 期前后的妇女发病率较高。它是一种通常发生在乳房腺上皮组织,严重影响妇女 身心健康甚至危及生命的最常见的恶性肿瘤之一。乳腺癌男性罕见,仅约1 2 的 乳腺患者是男性。 与少数几种类别肿瘤,例如甲状腺癌相似,乳腺癌的自然病程通常很长,乳腺 癌细胞的倍增时间平均为9 0 天,从第一个细胞恶变开始计算,经过3 0 多次倍增, 瘤体才能达到直径为1 锄的球体,这需时7 8 年之久。乳腺癌的病因尚未完全明 了,降低死亡率的最好方法是早期发现,早期治疗。在肿瘤发生转移前,单用手 术和放疗可以治愈绝大多数病例。一旦发生转移,积极治疗也仅能治愈小部分病 人,因此乳腺癌的早同发现,很大程度上决定了病人的愈后程度,对于选择治疗 乳腺癌的最好方案也有很大帮助。 乳腺的检测方法有很多,包括乳腺摄片、肿瘤标志物检测、肿瘤前哨淋巴结显 像以及胎儿碱性蛋白( b f p ) 检测等。在所有这些检测中,乳腺x 摄片是临床中 使用最多、最简便易行并且行之有效的方法。乳腺摄片能将乳房病变的早期微小 的病灶反映出来,并对组织深部不易扪及的病灶亦可显示出来。这对早期发现隐 性乳腺癌,提高手术治愈率有积极作用,目前国内外都已相继应用于临床。其中 乳腺摄片中常用的为钼靶x 线片,它能够显示出不同致密度的乳房软组织阴影, 对于乳腺肿块的识别乃至良性、恶性的判断都能提供明确的证据。钼靶x 线片中, 良性病变一般体现为影密度均匀,周围常有透亮度较高的脂肪圆影,而恶性者块 影呈分叶状,密度高,边缘呈毛刺状,常见细小密集的钙化影,有时可见增粗的 血管影,其鉴别良、恶性肿瘤的准确率达9 0 以上。这也是本文使用的乳腺x 摄 片类型。 幽1 1 典耍! 的良性与恶性钼靶x 线片 f i gl - lt h et y p i c a lb e n i g na n d1 1 1 a l i g n a n tx r a yl n a m m o g r a p h y 由于乳腺x 掇片在乳腺癌检测上的良好表现,很多国家包括我国为了降低乳 腺癌的发病率和死亡率,将乳腺病变遏制在早期阶段,都已经开展了全面的乳腺 普查。为了诊断的准确性,x 线的摄片一般有两个医师共同阅片,医师需要从大 量正常x 线片中区分出包含肿块的病变的可疑病例再与另一位医师共同确认。这 一过程存我国这利,人口大国中是十分庞大的工作量,而由于乳腺肿块具有较明显 的区别于周围组织的特征,故初步的筛选交给计算机来完成已成为现今乳腺x 线 阅片中的趋向,计算机辅助检测( c a d ) 是广大图像学者和医学: 作者的重点研 究方向。 所谓计算机辅助检测( c a d ) ,即i = 计算机根据肿块或者钙化点的图像特征, 从整幅图像中筛选出符合条件的可疑区域,将它们作为重点提供给医师。这一步 包含大量的重复性工作,由计算机来完成可以减少医师从广大f 常区域中寻找肿 块的工作量,也可以避免人工大量阅片造成的疲劳产生的错误。钙化点和肿块都 是判断乳腺癌的重要标志,其中国内外在钙化点的检测方面已经取得了丰硕的成 果,检测的j f 确率已经达到了9 8 以上这个较高的水平,在实际的临床试验中已 经得到证明并投入了使用;而肿块的c a d 虽然也有很多学者进行了研究,但是山 于肿块的复杂性,实际上并没有产生足以投入临床使用的理想结果,所以本文致 力于肿块区域检测的研究,力图提出一种可以实际使刚的算法。 1 2国内外研究现状 乳腺肿块在乳腺x 摄片上最明显的特征是区别于周围组织结构的高亮区域, 但是这些区域的形状和大小不定,可能呈圆形、辐射状或者没有规则的形状,并 且大部分的恶性肿块都没有明确的边界,无法与周围的乳腺组织简单的分割开来。 乳腺的各种组织也会对肿块的检测造成影响,其中与肿块区域在x 摄片亮度近似, 甚至更高的乳腺组织不在少数。因为乳腺肿块的这种不确定性,简单的使用一种 固定的方法对可疑肿块区域进行分割十分困难。 故而,在现有的研究中,乳腺肿块的c a d 检测基本分为两步: 第一步,在整个x 摄片中找出感兴趣的可疑区域( r o i ) ,理想的方法应该具 备: ( 1 ) 很高的检出率 ( 2 ) 快速的计算过程、较小的计算量 ( 3 ) 在保证前两条的情况下,尽量少的假阳性区域 广大学者在这方面也提出了很多方法,基本可以分为边缘检测和区域分割两种 类型。 h i d e i 【l j 等人提出了一种基于边缘检测的肿块检测方法。该方法着重于解决 两个问题,其一是如何检测出与周围组织结构对比度很弱的肿块病变,其二是如 何确定该肿块的具体参数。作为解决方法,他们采用了一种独特的自适应滤波称 为i r i s 滤波器来检测肿块的边缘。该滤波器检测的边缘与对比度几乎无关,所以 可以检测出肉眼观察不明显的病变。该方法在检测模糊的特定肿块时可以取得很 好的效果,但是应用于整幅图像时很容易受到其他正常组织的干扰。 h u a il i 【2 】等人则提出了一种用于分割和增强可疑区域结果的方法。在他们的研 究中,首先使用一种形态学的处理方法来增强可疑的病变的区域并清理掉无关的 背景组织,之后再使用基于模型的图像分割技术来定位可疑区域的位置。模型的 选择在这个方法中十分重要,故这种方法只对特定形状的肿块可以取得较好的响 应,但是肿块的形状并不单一,所以该方法仍有待改进。该方法中的形态学增强 方法对后续的处理有很大帮助。 张桥新【3 】等人根据乳腺肿块的特点,提出了一种可疑区域的快速搜索算法。该 方法基于日本学者o t s u 提出的最太类间方差法,致力于从图像中找到一个阈值 将可疑区域搜索出来,并设计了一套自动修正阈值和可疑区域边界的流程以保证 分割出来的肿块的完整性。由于最大类间方差只是基于肿块的灰度值这一特征而 无法获得边缘过渡区域的信息,所以该方法分割的结果在判别肿块良、恶性等需 要使用肿块边缘区域信息的场合比较无力。 第二步,在这些区域中判断哪些是真正的肿块区域以及良、恶性。 第二步的实现,一般都是使用神经网络、分类器等人工智能机器学习方法。机 器学习的方法多种多样,但原理都可总结为一个过程,即通过大量输入己知结果 的数据来训练得到一个模型,再使用该模型对未知结果的数据进行分析判断。 m a t t h e w a k u p i n s “4 】等人在他们的论文中讨论了人工神经网络( a i t i f i c i a l n e u r a ln 咖o r k s ) 在肿块检测过程中的重要作用。并针对在人工神经网络的使用过 程中一个重要的难点,即就是怎样不形成过训练进行了改进。神经网络的训练都 是在一组独立的数据中进行训练,而当得到的模型在当前数据中表现最好时,训 练停止。而在m 批e w 的方法中提出了一种提前终止训练以最小化过训练的技术, 并将其使用在乳腺肿块的分类上。 s u k l l w i n d e rs i n 曲【5 】等人提出是采用支持向量机( s v m ) 为基础的钙化点分类 方法。通过前面两步获得的r o i 区域信息,输入s v m 分类器中进行分类。该方法在 钙化点检测方面取得了9 5 以上的高准确率。在s v m 的使用方面,学者们大多集 中于将它用在钙化点的检测上并取得了很好的结果。但是,钙化点与肿块的分类 在原理上是相同的,只是肿块的分类过程中需要的信息更多,分类难度更大。 1 - 3 本文主要思路 综合前人的研究成果可以看到,乳腺肿块检测都是分为两步 6 】【7 】,本文也从这 两步入手,对图像进行处理。 但是,很多学者只是将大量的特征参数输入人工神经网络等机器学习模型然后 把一切都交给机器,至于为什么要输入这个参数,以及这个参数对于肿块的意义 何在,都缺乏明确的目的性。而事实也证明,一味将大量不明意义的信息输入训 练也并不能获得好的结果。人工神经网络等机器学习方法虽然是一种强大的工具, 但并不是万能的,如何得到肿块的特征参数,以及得到哪些参数用于分类,会对 分类的结果产生重大的影响,至于之后将参数输入何种模型进行分类对于结果的 影响并不大。所谓c a d 辅助检测,即是计算机由乳腺图像中找出符合肿块特征的 区域,完成之前只能由医师完成的重复性工作。那么,c a d 算法的设计首先需要 了解的就是医师如何从乳腺图像中找出肿块区域,之后再考虑使用何种算法来实 现。 肿块区别于周围组织最大的特征之一,即是它们明显高于周围区域的高亮度 【引,这也是医师识别肿块病变的最重要特征。所以,c a d 检测首先也应该从灰度 这一肿块这一最明显的特征入手,保证了高检出率。但是由于乳腺组织中并非只 有肿块病变这一种高亮度区域,只从灰度这一点入手显然是不够的。 4 图l 一2 尚管股组织干扰 f i g1 2h i g hd e n s i t yo r g a n i z a i i o ni n t e r f e r e l l c e 上图叮以看到,乳腺周围的肿块包含很多亮度很高的组织区域,但是专家只标 注一块肿块病变。在观察了大量病例并咨渤了影像科的医师之后,红:区别肿块还 是f 常组织时的另一特征就是它们的形状。肿块的形状一般都为椭圆形或近似椭 圆,相对的高亮度的正常腺体组织很少具有规则的形状,所以c a d 的检测也应该 从陔点入手,将j 】【| j 块形状这一参数作为判别的重要标准。 在区别出肿块之后,医师要做的另一点就是分辨该肿块是良性还是恶性。如前 文所述,良性肿块大多为致密的、肿块内部灰度平均并具有规则的边缘,相对的 恶性肿块内部灰度不平均,并由于癌细胞的扩散,所以伴有对周幽组织的浸润。 这一部分的c a d 实现,也应兼顾到肿块的灰度值、边缘信息、对刷围的浸润情况 综合判别【引。 在了解了医师是如何分别肘- 块之后,要做的就是如何使用计算机模拟这个过 年罕。 1 4 算法的实现流程 作为整个肿块识别过程的第一步,需要从整幅图片中提取出高亮度的部分。高 亮度体现在图像处理之中就是较高的灰度值。本文利用形念学的方法去除乳腺组 织干扰,在得到较好结果的情况下,使用的计算量相对较小:利用病理学知识, 将肿块人小这一信息加入了检测,从而褂以去除大量的假附x 域。另外,由于 肿块大小这个数值可调,为方法的使用提供了一定的灵活性。在经过了形态学处 理之后,图像中只有亮度值高于周边组织的结构保留下来,通过改定一个闽值将 其中亮度较高部分提取出来作为初次提取的一些可疑区域。 初次提取的可疑区域中,因为只使用了灰度值这一个参数作为提取依据,假阳 性区域必然较多。在参考了医师的诊断过程之后,本文提出一些有助于初步筛选 可疑区域的步骤,这些步骤并不需要具体的边缘信息,而是从可疑区域的位置信 息以及核心区域的圆形度入手将那些明显不是肿块的区域筛除。 经过筛选后,剩余的就是几个可疑度较高的区域,为了后面的判别,需要灰度 值以外的参数。由之前的分析可知,最有效的参数为肿块的形状。为了得到这一 参数,需要使用图像分割技术来得到边缘信息。在综合考虑了各种分割方法之后, 本文选择区域生长法来得到具体的肿块区域分割结果。但是由于传统区域生长的 局限性,无法得到对周围组织有弥漫性浸润的肿块区域,为解决这一问题,在此 引入模糊集的概念,赋予每一个生长的点一个隶属值,通过该值的大小体现该点 隶属于肿块区域的程度。对于致密并且灰度平均的良性肿块,该值显然应该集中 于一个区间之内;反之,由于对周围组织产生了弥漫性浸润,体现在灰度值上也 就是灰度值会比较平均的分布在一定范围内,相对的也就造成隶属值也会平均分 布在一定范围内。所以隶属值的分布状况即可用于体现肿块的良性、恶性程度。 至此,已经获得灰度值、隶属度、边缘信息、形状等参数,为了将它们综合考 虑,最好的方法依旧是使用机器学习方法。本文选用支持向量机来实现这一分类 过程。 总的流程如下: 6 乳腺、 图片 、= :一一 、分类完毕,7 + 、j ,。 是 j 7 l 一 f 图像处理完毕1 图1 3 辅助检测整体流程图 f i g1 3a u x i l i a ut e s to v e r a l ln o wc h a r 7 2 乳腺x 摄片预处理 2 1图像的来源 本文的实验图像均来源于南佛罗罩达州立大学d d s m 数据库 1 0 ,该数据库是 美国南佛罗罩达州立大学提供的免费乳腺图像数据库,数据库中包含了上万幅乳 腺x 摄片的数字图像,分为f 常、良性、恶性三种。每个病例包括4 幅图像,分 别为乳腺的左侧侧斜位( l e f tm l 0 ) 、轴位( l e f tc c ) 以及右侧侧斜位 ( r i g h tm l o ) 、轴位( r i g h tc c ) ,图像的格式为l j p e g 。乳腺癌的病灶特征 包括肿块和钙化点两种,这两种病灶在数据库中都有大量病例。 图2 1 由专家标注的钙化点与肿块 f i g2 一lt h ee x p e r t sn o t e dc a l c i f i c a t i o np o i n ta n d m a s s 其中的良性和恶性病例中的病灶都由专家人工作出了标谚 ,并以链码的形式存储 在o v e r l a y 文件中,方便算法的验证。 2 2图像格式的转换 d d s m 数据库中的图片格式l j p e g 是一种无损的j p e g 编码压缩,因为这种格 式对于图像信息的保露h 常高,儿乎没有损失,所以常用于医学、航天等对图片 清晰度要求很高的行业中的图片存储。但是,这种格式j i 能在医用仪器等专业的 仪器上打开,e b 于图像处理需要使用到的m a t l a b 软件只能在w i n d o w s 操作系统下 打开,需要在w i n d o w s 操作系统下获得图像的信息,可是,我们经过多方查找也 没有发现在w i n d o w s 操作系统下可以读取这种图片的软件,所以在进行处理之前 需要先对这种图片格式转换为w i n d o w s 操作系统以及m a t l a b 软件可以识别的格 式。同时,转换成的格式也应尽量保持原图的信息,不应有过大的损失。本文使 用的是一款基于u n 操作系统的转换程序,转换后的图像格式为t i f f 格式,t i f f 是签图像文件格式( t a g g e di m a g ef i l ef o m a t ) 的简写,这种格式可以广泛地应 用于对图像质量要求较高的图像的存储与转换,正好符合医学图像处理的要 求,并且这种格式也可以使用m a t l a b 软件进行处理。 2 3图像的预处理 2 3 1灰度值拉伸及归一化 在使用转换好的图像进行后续处理时发现,转换后得到的t 濉图像十分灰暗, 乳腺组织几乎不可见,后经过查看图像的灰度值矩阵得知,d d s m 数据库中的图 像即亮度范围都在 o ,4 0 9 5 之问,即有效灰度级均为1 2 b i t 。但是由于转换程序的 原因,转换后的图像的灰度级为1 6 b i t ,灰度范围为 0 ,6 5 5 3 5 】,但是图像中点的 灰度值没有拉伸,只是灰度范围扩大了,使得转换后的图像的灰度值都集中在最 大值的6 一下,这就造成转化后的图像十分暗,所以在进行处理之前首先要进行 灰度值的拉伸,将灰度值为4 0 9 5 的点设为最亮,即白色;灰度值为o 的点设为最 暗,即黑色。由于本文的处理还需要将图像的灰度值进行归一化,所以归一化和 灰度拉伸一同完成。采用的算法为,将原图中的点的灰度值一一映射到一个相同 大小的新图像中,新图像中1 代表最亮白色,o 代表最暗黑色。映射函数为每个点 的灰度值除以4 0 9 5 。经过映射之后的图像所有点狄度值都在 o ,1 】之间,亮度值的 归一化也可以使算法的应用范围更广,使实验材料的灰度级对参数的影响降到最 低,得到的参数不只局限于特定的数据库中的乳腺图像。 9 f i g2 2g r a ys t r e t c hb e f o r ea n da f t e r 由图可见,经过处理之后的图像中,乳腺、肿块等结构组织都进入了可见区域, j 以进行后续的处理。 2 3 2图像大小调整 数据库中的图像都是在4 0 0 0 5 0 0 0 左右,实际处理中发现由于电脑的处理速度 有限,大图像的计算很慢,每幅图像的处理都需要几十秒乃至数分钟,后经过试 验发现将图像缩小l 4 之后也可以基本保持原图的信息,肿块的分割结果并无不 同,所以为节省计算时问本文将图像缩小后再进行后续处理。由于后续步骤中存 在基于图像大小的操作,例如裁边、根据肿块火小筛选r o i 区域等,所以调整大 小后的图像应该具有相同的大小,本文根据原图大小选择调整为1 0 0 0 1 5 0 0 。但是 d d s m 数据库中的图像的大小并不完全相同,且图像在缩小时不能影响原图的特 征,即必须保证比例不变,这就需要在缩小i ,j 对图像进行裁剪。经过观察,图像 的左半部分为无用的背景区域,故在处理前对图像大小进行补齐,使得原图的宽 高比为2 比3 ,若图像宽不到高的2 3 则在原图右边拼接一块黑色区域;反之若图 像宽大于高的2 3 则将多余部分从图像赶半部分裁去。 具体操作如下,设原图分辨率为l 术h ,则 a = ( 2 3 ) l h ( 2 1 ) 若a 0 ,则将一块人小为a v 的矩形黑色区域拼合到图像的左侧:若a 0 则将图像 的左边裁掉a 列,处理后得剑的图像的分辨率为l ( h + a ) ,即可得到所需比例的 图像。再对得到的新图像进行尺度变换,i 殳新图像为f ,变换后的图像为g ,则尺 1 0 度变换的公式为 g ( x ,y ) = f 【( l + a ) 木lo o o ,h 宰y 15 0 0 ( 2 2 ) 变换后的图像大小为l o o o 1 5 0 0 ,在这种图像大小下,图像的空间分辨率为 o 5 砌州p i x e l 。根据医学常识,乳腺肿块一般直径大小为3 毫米到3 厘米之间,最 大的肿块在调整后的分辨率下大小为6 0 像素。 2 4 提取乳腺区域 乳腺摄片中包含大量背景区域,如果连这些区域也一起进行处理无疑会增加很 多不必要的计算量,所以在预处理步骤中需要首先将乳腺区域提取出来。在乳腺 区域的提取方面本文采用全局阈值法来处理。乳腺图由亮度较高的乳腺区域,和 亮度较低的背景区域组成,这种方法就是确定一个阈值t 将这两部分区分开。 设图像矩阵为f ,则全局阈值法表示如下 f f g 2 t o f t e l s e ( 2 3 ) 即只将大于等于阈值的部分保留下来,小于阈值的部分即是背景区域,将它们设 为o 。找到一个阂值将乳腺区域和背景区域区分开来,是本步骤的关键。 2 4 1图像的直方图 阈值的确定有两种是通过检视直方图的方法来人为或者自动选择一个t 将图 像分割成两部分。所谓直方图,就是统计出一幅图像中每个灰度值对应的像素点 的个数,并计算它们在总像素点数中所占的比例,再将这些比例用曲线或柱状图 表示出来。乳腺图像的直方图如下: 赵 瞰 得 肇 墨 髅 蛙 剀2 3 乳腺图像及灰度直方图 f i g2 3b r e a s ti m a g ea 1 1 dg r a yh i s t o g r a m 直方图中的横轴表示点的灰度值,因为归一化后的小数位数较多不够直观,这 罩采用归一化之前的图像灰度级来表示说明;纵轴表示具有对应灰度值的点的个 数在除以图像中总像素点的个数所得到的比值。可以明显的看到,图像中的狄度 值有两个峰值,这就表示,有大量的像素点集中在这两个狄度峰值附近,所以阈 值t 应该处于两个峰值之问,将这两部分区分丌来。 2 4 2 阈值的人工选取 关于闽值t 的选取,由狄度直方图可见,两个峰值分别代表乳腺图的背景和乳 腺区域的狄度,它们相差很大,可以很容易的人为选取一个位于两个峰值之问的 阈值t 来分割。实际上,阂值的选择很宽泛,以上图为例,阈值t 在1 5 0 0 到2 0 0 0 之问的取值都可以达到不错的分割结果。 :监五! 交迫厶堂亟堂位迨塞 主l 盥羔塑苴盥尘兰坠 f i g2 4s e g m e n t a t i o nr e s u l t sb yl5 0 0a n d2 0 0 0a sat h r e s h o l d 由上图可见两者的区别仅是乳腺边缘部分,但是这部分不会含有乳腺肿块信息, 所以对本文的后续处理基本没有影响。 2 4 3阈值的自动选取 虽然阈值的人为选取很要求很宽松,但是对每一幅图像都要通过观察直方图来 进行阈值t 的确定会增加很多工作量,下面介绍一种阈值的自动选择算法。 该算法采f j 经典的迭代方法,是g o n z a l e z 和w 6 0 d s 于2 0 0 2 年提出来洲7 1 ,这 种方法通过多次迭代来寻找一个阈值t ,使得t 为分割后的两个部分的平均灰度 值的中值。具体步骤如下 ( 1 ) 将最人亮度值和最小亮度值的中 ( 2 ) 使用这个闽值t 将i 訇像分割为两 分没为a ,j 他的部分没为b 。 j 值设为闽值的初始值,记为t 。 f j 分,所有亮度大于等_ t 的点组成的部 ( 3 ) 分别计算:这两部分的亮度平均值,记为l a 和l b 。 ( 4 ) 利用3 的数据得到一个新的t ,t 是l a 与l b 和的一j 卜。 ( 5 1 计算t 与t 的差6 ,当6 小于,f :始设定的参数t o 时结束迭代,否! l ! i j 使 玎t 作为新的t 从( 2 ) 丌始重新汁算。 参数t n 的改定影响到达代次数,设定的过小会增加1 4 必要的计算量,该参数的选 择应该同时兼顺计算量与分割效果,l 因为分割闽值t 的选取很宽泛,所以参数t o 不必设定的过小,在经过多次试验后,本文将t o 设为2 ,在这种情况下,迭代次 1 3 e 塞窑迪厶:羔亟:兰位途塞 雯l 丝圣堡丘必丝坠 数一般都为4 次,分割也可取得不错的效果。上图使用该方法获得的阈值t 为1 7 6 8 , 分割结果如下 剿2 5乳腺区域闽值臼动选取分割结果 f i g2 5t h r e s h o i da u t o m a t i cs e l e c t i o no fm a m m a r yg l a n dr e g i o l l a ls e g m e n c a c i o nr e s u l t s j - 以看到,阈值的迭代自动选择法也可取得很好的分割效果,并h 迭代次数很少, 不会增加过多的计算。所以本文采刷闽值的迭代自动选择法束进行分割。 纠2 6 另一图像的分割结果 f i g u r e2 6a 1 1 0 f 1 1 c ri l l l a g es e 目n e n t a c i o nr e s u l i 至此,图像的预处理已经结束,得到的图像清晰并且已经去除人部分不必要的 宇景区域。 2 5本章小结 充成的是f j 弋”始对乳腺图像进行分割、分类之i ,j 的准备工作。完成的 1 4 举 作包括:将图片的格式转换为w i n d o w s 下可用的形式;将灰度值归一化以使算法 的数据具有一般性;通过迭代算法自动选择全局阈值将乳腺区域提取出来。后续 章节的分割工作全部是在本章处理之后的结果之上进行的。 e 立銮迪厶堂塑:羔位途塞 壁区丝的握躯 3 可疑区域的提取 r 疑【x 域又叫r o i 区域,是英文r e g i o no f i n t e r e s t 的缩写,也称为感兴趣区域 r o i 区域的提取就是在图像中搜寻出含有所需特征的区域。具体到本文,r o i 区 域即为可能包含肿块病灶的区域。肿块最明显的特征即为它远高于周围组织区域 的高亮度,故可以从高亮度这一特征入手,再次采用全局阈值直接分割来寻找r o i 。 2 5 5 o 5 x 矿 灰度直方图 o 2 0 0 03 0 0 04 05 0 灰度值 到3 1 分割后乳腺区域灰度直方幽 g3 1d i v i s i o l lo f1 1 1 a m l n a r yg l a n da r e aa f t e rg r a yh i s t o g r a n l 从观察分割之后的直方图即可知道,分割后的图像仍然具有明显的双峰曲线, 】以尝试再次使用介绍的阈值的迭代自动选择法来进行分割。 1 6 掣留蟹肇譬嬲毒 图3 2 直接使用全局阈值法分割结果 f i g3 2r e s u l to fd i r e c t l yu s eg l o b a lt h r e s h 0 1 dv a l u em e t h o ds e g m
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 创业伙伴合作协议范本及注意事项
- 企业网络安全专项检查工作方案
- 小学语文重点知识点精讲汇编
- 感觉统合障碍儿童康复训练方法汇编
- 小学语文二年级上册同步训练试题
- 初中语文中考重点知识点总结资料
- 人教版一年级下册语文阅读专项训练题
- 基于假设模态法的多跨点阵夹芯梁振动特性解析与应用研究
- 基于信用利差模型剖析地方融资平台债券信用风险
- 基于信息化时代的社会保险档案管理系统构建与实践研究
- 小儿镇静课件
- 光伏建筑投标文件范本
- 2025年药店员工培训考试试题(附答案)
- 民办学校招生方案及推广策略实操指南
- 公益慈善投资策略-洞察及研究
- 碳排放咨询员基础技能培训手册
- 普及金融知识课件
- 军兵种知识课件
- 英国的社会和文化
- 稳定型心绞痛护理查房
- 中试平台运营管理制度
评论
0/150
提交评论