(电路与系统专业论文)基于子空间学习和支持向量机的微钙化簇检测.pdf_第1页
(电路与系统专业论文)基于子空间学习和支持向量机的微钙化簇检测.pdf_第2页
(电路与系统专业论文)基于子空间学习和支持向量机的微钙化簇检测.pdf_第3页
(电路与系统专业论文)基于子空间学习和支持向量机的微钙化簇检测.pdf_第4页
(电路与系统专业论文)基于子空间学习和支持向量机的微钙化簇检测.pdf_第5页
已阅读5页,还剩49页未读 继续免费阅读

(电路与系统专业论文)基于子空间学习和支持向量机的微钙化簇检测.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 乳腺癌是一种常见的恶性肿瘤之一,是导致妇女死亡率上升的重要原因,早 发现、早治疗是降低乳腺癌死亡率的关键。目前,钼靶x 射线检测被公认为最主 要、最有效的检测手段,乳腺图像中的微钙化簇是乳腺癌的一个主要征象,在乳 腺癌的早期诊断中占有特别重要的地位。然而,图像中的信息只有3 能为人眼所 见,即使经验丰富的医生也很难及时发现图像中早期乳腺癌的微钙化簇,以致延 误病人的最佳治疗时机。随着计算机技术的飞速发展,乳腺x 线图像的计算机辅 助检测成为乳腺癌早期诊断的研究热点。 为了有效的检测出乳腺图像中的微钙化簇,更好地辅助医生发现早期乳腺癌, 本文针对微钙化簇检测问题进行了深入的研究。首先,为了有效的提取乳腺图像 中的感兴趣区域( r e g i o no fi n t e r e s t ,r o i ) ,本文提出了一种基于独立分量分析 ( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 和支持向量机( s u p p o r tv e c t o rm a c h i n e ,s v m ) 的感兴趣区域自动提取新方法,首先提取微钙化簇的特征,在此基础上训练s v m 分类器对待识别图像进行模式分类。该方法不仅简单有效,而且具有较高的智能 性,为感兴趣区域的自动提取提供了新的研究思路;其次,为了进一步提高检测 的速度和精度,本文提出了基于子空间学习和s v m 的微钙化簇检测算法,采用子 空间学习提取图像的判别特征,然后利用特征矢量训练s v m 分类器进行模式分类。 最后,由于子空间学习容易受到数据噪声的影响,使检测性能具有不稳定性,为 了克服单个子空间的局限性,本文提出了基于选择性支持向量机集成的微钙化簇 检测算法,该方法与传统集成方法相比,选择性集成的检测方法能有效降低分类 器的规模,提高集成分类器的泛化能力。综上所述,本文利用子空间学习、支持 向量机以及集成学习等机器学习领域的方法,实验结果表明,所提出的方法具有 良好的实用性和鲁棒性,能够有效地检测出乳腺图像中的感兴趣区域以及其中的 微钙化簇,并降低了假阳性率,为乳腺癌计算机辅助检测的研究提供了新方法。 关键词:计算机辅助诊断支持向量机子空间学习集成学习 a b s t r a c t a b s t r a c t b r e a s tc a n c e ri so n eo ft h em o s tc o m m o nm a l i g n a n tt u m o r sw h i c hi n c r e a s e st h e r a t i ot om o r t a l i t ya m o n gw o m e n e a r l yd e t e c t i o na n dt r e a t m e n ta r ep i v o t a lt or e d u c e m o r t a l i t y a tp r e s e n t , m a m m o g r a p h yh a sb e e na c k n o w l e d g e da st h em o s ti m p o r t a n ta n d e f f e c t i v et o o lf o rd e t e c t i o n t h em i c r o c a l c i f i c a t i o nc l u s t e r ( m c c ) i so n eo ft h em a i n s i g n so fb r e a s tc a n c e r , w h o s ed e t e c t i o no c c u p i e sap a r t i c u l a r l yi m p o r t a n ts t a t u si nt h e e a r l yd i a g n o s i s h o w e v e r , t h e r ei so n l ya b o u t3 i n f o r m a t i o ni nm a m m o g r a m sc a nb e s e e n e v e ne x p e r i e n c e dd o c t o r sa r ed i f f i c u l tt od e t e c tm c ci nt i m ea n dt h eb e s tt i m ef o r t r e a t m e n tw i l lb ed e l a y e d w i t ht h er a p i dd e v e l o p m e n to fc o m p u t e rt e c h n o l o g y , c o m p u t e ra i d e dd e t e c t i o n ( c a d ) o nm a m m o g r a m sh a sb e c o m ear e s e a r c hh o t s p o ti n t h ee a r l yd i a g n o s i so fb r e a s tc a n c e r i no r d e rt o e f f e c t i v e l y d e t e c tm c co nm a m m o g r a m sa n da s s i s td o c t o r si n d i a g n o s i n gb r e a s tc a n c e re a r l i e r , s e v e r a ld e t e c t i o na p p r o a c h e sa r es t u d i e di nt h i sp a p e r f i r s t l y , am e t h o di sp r e s e n t e dt o e x t r a c tr e g i o no fi n t e r e s t ( r o i ) i nm a m m o g r a m s a u t o m a t i c a l l y , b yu s i n gi n d e p e n d e n tc o m p o n e n ta n a l y s i s ( i c a ) f o rf e a t u r ee x t r a c t i o n a n dt r a i n i n gs u p p o r tv e c t o rm a c h i n e s ( s v m ) f o rp a t t e mc l a s s i f i c a t i o n t h em e t h o di s s i m p l e ,e f f e c t i v e ,a n di n t e l l i g e n t i tp r o v i d e san e wr e s e a r c hi d e af o rr o ie x t r a c t i o n s e c o n d l y , t oi m p r o v et h ed e t e c t i o np e r f o r m a n c ea n dr a t e ,an o v e lf r a m e w o r kf o rm c c d e t e c t i o nb a s e do ns u b s p a c el e a r n i n ga n ds v mi sd e v e l o p e d s u b s p a c ei su s e dt o e x t r a c td i s c r i m i n a n tf e a t u r e so fm e ti nm a m m o g r a m s ,a n ds v mi st r a i n e df o r c l a s s i f i c a t i o n f i n a l l y , r e s u l t sa r eu n s t a b l ea ss u b s p a c ei ss u b j e c t e dt ot h ei m p a c to f n o i s ee a s i l y t oo v e r c o m et h el i m i t a t i o no fas i n g l es u b s p a c e ,am e t h o db a s e do n s e l e c t i v ee n s e m b l es v mo fm c cd e t e c t i o ni sp r o p o s e d c o m p a r e dw i t ht r a d i t i o n a l e n s e m b l em e t h o d s ,t h ep r o p o s e ds e l e c t i v ee n s e m b l em e t h o dc a nn o to n l ye f f e c t i v e l y i m p r o v et h eg e n e r a l i z a t i o nc a p a b i l i t yo fe n s e m b l ec l a s s i f i e r , b u ta l s or e d u c et h es i z eo f c l a s s i f i e r i naw o r d ,s e v e r a lm a c h i n el e a m i n gm e t h o d sa r ep r o p o s e df o rd e t e c t i n gm c e , e x p e r i m e n t a lr e s u l t ss h o wt h a tt h ep r o p o s e dd e t e c t i o nm e t h o d sn o to n l yc a ne f f e c t i v e l y d e t e c tr o ia n dm c ci nm a m m o g r a m sw i t l lg o o dp r a c t i c a b i l i t ya n dr o b u s t n e s s ,b u ta l s o r e d u c et h ef a l s ep o s i t i v er a t e ,w h i c hp r o v i d es o m en e wi d e a sf o rt h er e s e a r c ho fc a d s y s t e mi nt h eb r e a s tc a n c e l k e y w o r d s :c o m p u t e ra i d e dd e t e c t i o n e n s e m b l e - l e a r n i n g s u p p o r t v e c t o rm a c h i n e s u b s p a c e - l e a r n i n g 西安电子科技大学 学位论文创新性声明 秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人 在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加 以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的 研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而 使川过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中做 j 1 9j 确 | ,j 侈2 i 刿j :表刁了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 小人签名: 日期趔呈:! :! ! 西安电子科技大学 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研 究乍花校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保 证毕业离校后,发表论文或使用论文工作成果时署名单位仍然为西安电子科技 大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布 论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。 ( 保密的论文在解密后遵守此规定) 本人签名: 廿师签名: 第一章绪论 第一章绪论 1 1 研究背景及意义 乳腺癌是女性最常见的恶性肿瘤之一,发病率已居女性恶性肿瘤首位l l j ,并 且呈现逐年上升的趋势,严重威胁着广大妇女的生命健康。与其它肿瘤一样,乳 腺癌真正的致病机理还不十分清楚,不过,研究发现许多己知致病因素能够影响 乳腺癌的发生和发展,包括遗传因素,内分泌因素,物理因素,膳食因素以及婚 姻、生育、哺乳等因素。正是由于导致乳腺癌的因素众多,因此乳腺癌的发病率 一直居高不下。世界各国因为地理环境、生活习惯的不同,乳腺癌的发病率有很 大差异。北美和北欧大多数发达国家是女性乳腺癌的高发区,南美和南欧一些国 家为中等,而亚洲、拉丁美洲和非洲的大部分地区为低发区。据美国癌症协会( a c s ) 公布的数据表明,美国妇女在一生中的某个时期患乳腺癌的几率为1 2 5 ,全世界 每年约有1 2 0 万妇女患者,其中5 0 万死于乳腺癌。随着生活方式及饮食习惯的改 变,我国乳腺癌的发病率也呈明显上升的趋势,甚至已经超过了某些欧美发达国 家,已居于女性恶性肿瘤中的第二位1 2 。由此可见,乳腺癌已经成为一个全球性的 健康问题,对其进行系统深入的研究刻不容缓。 由于乳腺癌的危害性极大,现代手术和放疗仅对局限于乳腺范围内的肿瘤疗 效较好,然而大多数乳腺癌被发现时已有区域淋巴结向远处转移,无论采用何种 现代化的治疗手段,其疗效仍然不尽如人意,其死亡率高达5 0 。据美国癌症协 会的资料显示,只有在早期未发生远处转移的乳腺癌早期确诊病人中,经过治疗 的幸存率达到9 7 f 1 1 。因此,在对乳腺癌一级预防尚无良策的情况下,大力推广“早 发现、早诊断、早治疗 的“三早原则 是降低乳腺癌死亡率的关键。为此,寻 找更为有效的乳腺癌普查和早期诊断的方法,一直是众多学者孜孜以求的目标。 随着现代医学成像技术的发展,目前临床上常用的乳腺影像学检查方法有1 3 j : 钼靶x 射线检测、乳腺干板摄影技术、计算机断层成像技术、核磁共振成像技术、 超声波成像技术等,这些成像技术已经被广泛应用于医疗诊断、术前计划、治疗、 术后监测等各个环节,目的是更加全面而准确地获得病人的各种数据,从而为诊 断、治疗、手术和术后评估提供更为准确的诊断信息,提高医生的服务质量,同 时减轻了病人的痛苦。由于钼靶x 射线检测的空间分辨率较高,对肿块和钙化敏 感,并且所需设备简单、价格低廉,因此成为目前早期乳腺癌诊断最为有效和常 用的手段。乳腺癌的主要x 线征象主要包括肿块影、局限致密浸润、毛刺和钙化 等等,其中钙化在乳腺癌的早期诊断中占有特别重要的地位,它不仅是乳腺癌的 2 基于子空间学习和支持向量机的微钙化簇检测 一个重要图像征象,而且可能是其唯一的阳性征象1 4 】,但从医学影像学上判断,那 些分布分散、密度均匀、形态规则的单个钙化点往往认为是良性的,而在l c m 2 上 存在大于3 个以上的微钙化点组成的微钙化簇【5 】【6 】往往是恶性的,是早期乳腺癌非 常重要的诊断依据,在临床上是重点的检测对象。然而,这些微钙化簇形态各异、 分布不均,导致图像信息只有3 能为人眼所分辨,即使有经验的医生也很难及时 发现乳腺x 线图像中早期乳腺癌的微钙化簇,导致大量的诊断信息被忽略,而且 由于医生视觉疲劳,主观情绪的影响或者经验不足等原因,都会导致漏诊和误诊 率的几率存在,检测结果表现为较高的假阳性率,以致延误病人的最佳治疗时机。 因此,如何充分挖掘图像中的诊断信息,尽可能的减少主观因素导致的误诊,成 为困扰医疗界的难题。 随着计算机及人工智能技术的诞生与发展,使我们开发医学领域中的人工智 能专家系统成为可能,人们试图借助于计算机及人工智能技术辅助医生进行诊断, 希望能够减少医生的工作量,将医生从烦琐和机械的分类任务中解脱出来,降低 由于医生或专家的主观因素而导致的误诊。由于微钙化簇的检测对于乳腺癌的早 期防治具有非常重要的意义【7 】,因此,如何更有效更精确地检测出乳腺x 线图像 中的微钙化簇是计算机辅助检i 9 1 , u ( c o m p u t e ra i d e dd e t e c t i o n , c a d ) 系统中十分关键 的一步【8 1 。 为了能有效的检测出乳腺x 线图像中的微钙化簇,辅助医生早发现、早诊断、 早治疗,本文利用子空间学习、支持向量机以及集成学习等机器学习领域的研究 成果,针对乳腺x 线图像重点研究微钙化簇检测方法,帮助医生从图像中获取更 多的信息,降低诊断结果的假阳性率,以实现早期乳腺癌的计算机辅助检测。 1 2 国内外研究现状 1 2 1 计算机辅助检测研究现状 计算机辅助检测是近年来随着计算机技术的飞速发展而应用于影像诊断领域 的一项新技术。它利用专业的计算机算法处理、分析医学图像,发现并检出病变 部位,帮助放射科医生提高病灶检出率,被称为医生的“第二双眼睛 。 c a d 系统的开发已有相当长的历史。在图像分析工作中,人们一直期望使用 计算机技术挖掘图像中特征鲜明而可靠的线索,帮助提高计算机的图像分析性能, 并将这些研究成果应用于不同的工作中,c a d 系统应用于乳腺癌检测只是计算机 技术在影像诊断领域中一个非常成功的例子。例如,r 2 1 5 9 j 公司在芝加哥大学的研 究基础上推出了c a d 并因此成为这一领域的领头羊,他们推出的i m a g e c h e r k e r 第一章绪论 于1 9 9 8 年获f d a 认证,美国i c a d 公司和加拿大c a d x 公司的m a m m o r e a d e r 和 s e c o n dl o o k 也于2 0 0 2 分别获得了f d a 和p m a 认证。2 0 0 5 年9 月,美国食品及 药物管理局批准了柯达公司升级后的乳腺计算机辅助诊断系统,资料显示升级后 系统的灵敏度得到很大的提高,同时降低了假阳性结果出现的概率。这些系统将 常规的乳腺钼靶x 线图片进行扫描,将影像图片转化成数字化信息,利用计算机 智能软件进行综合分析,标记出具有恶性病灶征象的区域,可以发现医生用肉眼 看不到的乳腺早期局部结构异常和微小钙化区域。 目前计算机辅助检测诊断的商用系统有: c o m p u t e r - a i d e dd e t e c t i o ni nm a m m o g r a p h y c o m p u t e r - a i d e dd e t e c t i o ni nl u n gs c r e e n i n g c o m p u t e r - a i d e dd e t e c t i o np r o d u c t s i m a g e c h e c k e rm 10 0 0s y s t e m m a m m e xt rs y s t e m r a p i d s c r e e nr s - 2 0 0 0s y s t e m s e c o n dl o o ks y s t e m 由于c a d 具有灵敏的检测能力,可侦测出画面的细微变化,因此已成为放射 线医学不可或缺的系统。许多欧洲国家,例如荷兰、北欧、比利时等都大量引进 各种检测系统,藉此检测出早期乳腺癌。据纽约路透社报道,在对2 0 1 名患有不 同类型乳腺肿瘤的患者进行研究比对后发现,利用计算机辅助检测系统查出了 8 9 的乳腺癌,使检出率提高了近2 0 ,也就是说,使用c a d 系统可以明显提高 乳腺癌的检出率,由此可见计算机辅助检测系统是改善乳腺癌诊断的有利工具。 然而,美国t e x a s 大学的b o v i k a c 、s a m p a tmp 和m a r k e ymk 等人所在的 图像与视频工程实验室通过临床数据测试总结出现有的乳腺c a d 系统存在的性能 缺陷,指出现有的乳腺c a d 系统对于中晚期的乳腺癌具有很高的灵敏度,而在检 测早期乳腺癌的微小钙化点时,检出率往往会大幅下降至6 0 左右,并且普遍存 在假阳性率较高的缺点【6 0 】。b o v i kac 教授认为主要是由于现有的c a d 系统在图 像增强和检测等核心算法的性能上还不够完善所致。因此,乳腺x 线图像的增强 和检测算法是制约c a d 系统发展的重要因素,也是限制早期乳腺癌诊断系统性能 进一步提高的瓶颈,更是目前现有c a d 系统亟待解决的关键问题【6 。 1 2 2 微钙化点检测研究现状 乳腺微钙化点的计算机辅助检测算法的研究是近年来医学图像处理领域的热 点问题【2 5 1 。目前,国内外已有大量有关这方面算法研究的文献。但总体上存在以 下几点缺憾:算法的应用往往只限于一类或几类微钙化点,对其它类型的检测效 4 基于子空间学习和支持向量机的微钙化簇检测 果比较差,影响检测的可信度和稳定度;大多需要一定程度的人为干预,而且检 出率和算法的稳定性还有待提高,特别是在一些致密乳腺组织的成像图片中,存 在微钙化点目标难以检出、检测结果假阳性率普遍偏高的严重问题。所以有必要 探寻新的检测算法,提高检测的性能。 尽管许多国际学术组织对微钙化点检测问题进行了持续多年的、大量的深入 研究,在临床应用中也取得了一些令人鼓舞的成绩。但在乳腺x 线图像中,微钙 化点目标非常微小,且形状结构不一,分布不均,本身就不容易被检出,微钙化 点目标多分布于较为致密的乳腺组织之间,这样目标和背景对比度很低,而且由 于背景组织厚度不均,大面积致密的乳腺组织极易掩盖分布于其中的微小钙化点, 为目标的正确检出造成很大的障碍,周围致密的乳腺组织很容易被误判为真实目 标被检测出来,从而造成检测结果具有较高的假阳性。正是由于微钙化点这些特 殊性区域结构给微钙化点的检测任务带来诸多困难,主要表现在:1 分割准确性: 微钙化点体积微小,而且大小不一、形状各异、分布多变,无法用固定的样本进 行定型匹配,因此对微钙化点的准确分割比较困难,特别是通过计算机进行自动 分割;2 降低假阳性率:由于可疑病变区与其他周围组织之间的对比度非常弱,导 致部分类似微钙化点的正常组织易被误判为钙化点,由此造成大量的假阳性,如 何完全消除或者降低假阳性率是检测中又一个难点;3 特征提取有效性:对分割出 来的真假微钙化点进行分类识别过程中,如何提取有效的特征以提高分类器的泛 化能力也是难点之一;4 分类准确性:如何将目前高性能的机器学习算法应用到微 钙化簇的检测中,以降低计算的复杂度。因此,提高微钙化点的检测质量是一项 艰巨的任务,还需要解决很多问题。 目前钙化簇的检测方法主要包括传统的图像处理方法【9 1 【l 们n 1 11 1 、基于小波变换的 处理方法【1 2 1 1 1 3 l 、基于统计学特征提取的方澍1 4 i 、基于神经网络的方法【1 5 】【1 6 1 【1 7 】以及综 合分类方法。这些方法的共同点是先对图像进行去噪和特征增强,然后提取具有 诊断价值的图像特征。文献中常用的图像去噪和特征增强处理方法有:直方图均 衡化、滤波器、小波变换等。常用的图像特征可以是空间域的,也可以是频率域 的;可以是灰度特征,也可以是纹理特征和几何形态特征;可以是来自局部的特 征,也可以是来自全局的特征。 目前,国内外的很多研究学者已经提出了很多有价值的计算机辅助检测微钙 化点的算法,比较有代表性的有: s o n g 1 5 j 等利用调整小波分解系数重构图像的第二、三层感兴趣区域,用中值 对比度和归一化灰度值两个统计特征参数分割出可疑的微钙化点区域。 s p i e s b e r g e r l l 8 j 提出的胶片筛选算法就是用阈值方法进行微钙化点的检测。该方 法利用图像的亮度( b r i g h t n e s s ) 、紧凑度( c o m p a c t n e s s ) 和统计测度( s t a t i s t i c a l m e a s m e m e m ) 来表征感兴趣区域,然后利用相关系数来检测是否含有微钙化点。如 第一章绪论 5 果相关系数大于阈值,则为微钙化点;反之,则为正常组织。但该方法缺点是对 微钙化点和正常组织的区分能力一般。 s t r i c k l a n drn 掣1 9 】采用小波变换和子带加权的方法,在变换域内完成微钙化 点的检测。首先选择每个尺度直方图的固定百分点作为阈值,然后对小波变换系 数取阈值,大于该阈值则认为是钙化点,否则为非钙化点。结果得到了9 0 的检 出率。 万柏坤【2 0 】首次将支持向量机用于微钙化点的检测,实验证明,该方法相比基 于人工神经网络的方法有更高的识别率。 文浩【2 l j 等提出基于小波与统计学的乳腺微钙化点检测方法。首先对数字化的 乳腺x 图片进行小波分解,采用多尺度自适应增益方法提高图像的对比度;然后 对增强后的图像细节分量运用统计学中的偏度和峰度来选取感兴趣区;最后利用 箱线图极端值检测法确定微钙化点的位置。 胡正平【2 2 1 提出了子空间约束的可拒识双层支持向量机的检测算法,该方法增 加了微钙化点检测的粗筛选环节,并用筛选出来的假阳性目标和真实微钙化点目 标训练s v m 分类器,这样很大程度上增加了s v m 分类器的学习能力和拒识能力, 很好的解决了检测结果假阳性高的问题。 为了克服微钙化点检测算法研究中存在的困难,人们仍在努力改进现有的检 测方法,并且不断将新的理论和方法应用到这一领域。随着计算机技术、机器学 习和人工智能的飞速发展,针对乳腺x 线图像微钙化点的各种检测算法被相继提 出,其中一些方法取得了较好的效果,微钙化点检测的算法研究已处于一种全新 局面【2 3 】【2 4 】【2 5 】,对该问题的研究也是一个热点。 1 2 3 微钙化点检测的发展趋势 多年来,乳腺x 线图像中微钙化点的检测一直是计算机辅助诊断系统的关键 部分,也是乳腺癌早期诊断研究的热点问题,但是由于微钙化点的区域结构增加 了检测问题的困难性和复杂性,以至于在理论研究和实际应用中还没有取得实质 性和突破性的进展,回顾已经取得的理论研究成果,可以发现乳腺癌的计算机辅 助诊断系统有几个比较明显的发展趋势,归纳如下: 1 人机交互系统的设计:在目前,完全由计算机自动完成微钙化区域的分割 和检测非常困难,效果也不尽如人意,研究者们正在设想一种人和计算机的交互 式系统,例如人机交互式分割系统,该系统引起了研究者的广泛关注。该系统能 发挥人的主观能动性,充分利用计算机的运算能力,使人在必要的时候进行必要 的干预来共同完成任务,从而得到满意的分析结果。 2 多种方法的集成:由于微钙化点的形状千变万化,并且和周围正常组织存 6 基于子空间学习和支持向量机的微钙化簇检测 在很大的相似性,对其检测会遇到诸多困难。目前,还没有一种检测算法能够在 所有的微钙化点检测中取得令人满意的结果,并且同一种算法对不同微钙化点的 检测结果也不稳定。因此,人们在继续致力于将新的理论、新的方法应用到微钙 化点检测领域的同时,更加重视多种分析方法的有效集成,而采取什么样的集成 策略才能发挥各种方法的优点、取得最好的检测效果,正在成为研究者关注的问 题之一。近年来人工智能领域中的集成方法论在乳腺x 线图像微钙化点检测中的 应用也体现了这一观点。 3 良性和恶性种类的确定:计算机辅助诊断系统能够给医生提供更多的诊断信 息,及时发现乳腺x 线图像中的隐匿性病症,给患者提供全面的康复治疗,被称 为医生的“第二双眼睛”。现有算法只是检测感兴趣区域中微钙化点的存在性, 但并没有对已经存在的微钙化点是否具有恶化倾向做出判断。因此,寻找一种不 但能够检测微钙化点,而且还可以对微钙化点的良性和恶性病变类型进行诊断分 类的算法也是研究者面临的一个挑战。 4 建立个性化的乳腺数据库和评价方法:在乳腺x 线图像的微钙化点检测领 域,对检测算法的性能比较和评价是个关键任务,通常做法是将计算机的检测结 果与数据库中的实际结果相比较。为此,目前国际上已经建立了三个标准的高分 辨率乳腺图像数据库,它们分别是:m i a s ( m a m m o g r a p h i ci m a g ea n a l y s i ss o c i e t y ) 、 u c s f l l n l ( u n i v e r s i t yo fc a l i f o n i as a nf r a n c i s c oa n dl a w r e n c el i v em o r en a t i o n a l l a b o r a t o r y ) 和d d s m ( d i g i t a ld a t a b a s ef o rs c r e e n i n gm a m m o g r a p h y ) ,这对于客观评 价不同的检测方法提供了极大的便利条件。由于国内对计算机辅助诊断乳腺癌的 研究处在起步阶段,并且东西方妇女的乳腺组织存在着一些差异,因此,建立适 合东方妇女的标准乳腺图像数据库对研究工作意义重大,能进一步促进计算机辅 助诊断的发展,是我国科研工作者所面临的另一项艰巨任务。 1 3实验数据库以及算法性能评价标准 1 3 1d d s m 数据库 乳腺图像数据库( d d s m ) t 6 2 】是由南佛罗里达州立大学与几家合作单位联合创 建,为分析乳腺x 线图像提供帮助的一个网上公共数据库。网址是 h t t p :m a r a t h o n c s e e u s f e d u m a m m o g r a p h y d a t a b a s e h t m l 。该数据库以促进计算机在 普查乳腺x 线图像中的应用、协助诊断和提高教学科研水平为目的,共收集了约 2 , 5 0 0 个正常和非正常的病例。每个病例包含四幅图像,这些图像大都是5 0 0 0 x 3 0 0 0 像素,分辨率为0 0 5 m m p i x e l 的1 2 位或1 6 位灰度图像。放射科医生诊断后标注 第一章绪论 7 了病变区域和相应的良恶性诊断信息以及图像相关文本信息以供实验对比。本文 实验中的乳腺x 线图像均来自乳腺图像数据库。 1 3 2 性能评价标准 为了评定本文分类试验结果的好坏,本文采用一种目前国际上较为流行的受 试者工作特征曲线( r e c e i v eo p e r a t i n gc h a r a c t e r i s t i cc u r v e ,r o c 曲线) 作为性能评 价标准。理论上,在检测和诊断的过程中,好的分类模型应该具有好的灵敏度和 特异性,而实际应用中灵敏度和特异性常常互相制约的,特异性的提高会使灵敏 度降低,灵敏度的提高又会使特异性降低。定义系统的检出率即真阳性率( t r u e p o s i t i v er a t e ,t p r ) 表示系统灵敏度的指标,定义系统的误差率即假阳性率( f a l s e p o s i t i v er a t e ,f p r ) 表示系统特异性的指标,r o c 分析是把灵敏度和特异性结合起 来综合评价系统诊断准确度的种非常有效的方法。t p r 和f p r 分别定义如下: 撇= 塑型蒜篙掣( 1 - 1 , 腓= 堑型豢黧嚣型 m 2 , 以f 尸r 作为横坐标,盱碾作为纵坐标,用直线连接各相邻两点构建未光滑 r o c 曲线,曲线越凸也就是曲线下面积越大,说明该分类器越好。图1 3 ( a ) 是r o c 曲线示意图。从图1 3 ( b ) 中可以看出,曲线b 的曲线下面积要比曲线a 的曲线下 面积大,因此可判断出曲线b 对应的分类器较好。 图1 3r o c 曲线 8 基于子空间学习和支持向量机的微钙化簇检测 1 4 本文的研究成果与章节按排 本文利用子空间学习、支持向量机以及集成学习等机器学习领域的方法,针对 乳腺图像中微钙化簇检测问题进行了深入系统的研究。实验证明,本文提出的检 测方法具有良好的实用性和鲁棒性,能够有效地检测出乳腺图像中的感兴趣区域 以及其中的微钙化簇,降低了假阳性率。 1 提出了基于独立分量分析和支持向量机的乳腺图像感兴趣提取的新方法。 在乳腺图像的计算机辅助诊断中,乳腺图像感兴趣区域的自动提取不仅能减 小后期计算机辅助诊断的运算量和时间,而且能提高乳腺癌早期自动化诊断的智 能性,对整个计算机辅助诊断系统的成败起着非常重要的作用。为了有效的提取 感兴趣区域,本文首先采用独立分量分析提取感兴趣区域的图像特征,然后训练 支持向量机对待识别图像进行模式分类。对临床病例的实验结果表明,所提出方 法的检出率为9 1 。 2 提出了基于子空间学习和支持向量机的微钙化簇检测算法。 有效的特征提取能减小分类器训练的复杂度,提高检测的精度和速度。为此, 本文利用子空间学习提取图像的判别特征,通过训练支持向量机对图像中的微钙 化簇进行检测。实验结果表明,该方法不仅具有较高的检出率,而且提高了检测 速率,这些结论为后续章节的选择性集成方法提供了理论和实践基础。 3 提出了基于选择性支持向量机集成的微钙化簇检测算法。 首先在集成学习的思想基础上对选择性集成的重要意义进行了论证,并把选 择性集成思想应用于微钙化簇检测中。多组实验表明,与传统使用所有支持向量 机的方法相比,选择性集成方法不仅降低了分类器的规模和计算量,而且能有效 提高分类器的泛化能力和检测结果稳定性。 本文共分为五章,第一章为绪论,介绍了研究课题的目的、意义、计算机辅 助检测以及微钙化簇检测研究现状、发展趋势等。第二章提出了基于独立分量分 析和支持向量机的乳腺图像感兴趣提取新方法。第三章提出了基于子空间学习和 支持向量机的微钙化簇检测算法。第四章提出了基于选择性支持向量机集成的微 钙化簇检测算法。第五章为总结,在简要回顾论文工作的基础上,总结本文所提 出的主要方法,并针对本文研究工作的些遗留问题和今后的努力的方向做了展 望和规划。 第二章乳腺图像中感兴趣区域的提取 9 第二章乳腺图像中感兴趣区域的提取 2 1 引言 由于微钙化是乳腺癌的重要乳腺x 线图像征象,随着医学数字成像技术的发 展,利用数字图像处理等技术实现基于乳腺x 线图像的计算机辅助诊断已成为目 前乳腺癌诊断研究的热点。在乳腺图像的计算机辅助诊断中,乳腺图像感兴趣区 域( r e g i o no fi n t e r e s t ,r o i ) 的自动提取是一个很重要的环节,它不仅可以有效的从 乳腺x 图像中提取微钙化点区域,而且减小后期计算机辅助诊断的运算量,提高 乳腺癌早期自动化诊断的智能性,对整个计算机辅助诊断系统的成败起着非常重 要的作用。 目前研究者们提出了许多乳腺图像感兴趣区域的提取算法:如p a p a d o p o u l o s i z 6 j 等人提出了基于形态滤波、阈值化处理和神经网络分类的乳腺r o i 自动提取算法; l e e 等【2 7 】提出了基于块区域增长法与地毯覆盖法相结合的乳腺r o i 自动提取算法; g u l s r u d l 2 8 1 提出了利用空间滤波技术的感兴趣区域自动提取方法;王瑞平【2 9 】等将独 立分量分析应用于乳腺r o i 的特征提取,然后利用人工神经网络分类方法进行乳 腺r o i 的模式识别。上述算法虽然得到了较高的检出率,但还不能完全满足实际 应用的要求,但是还需要进一步的改进和优化,以获得更好的提取效果。 本章提出基于独立分量分析和支持向量机的乳腺图像感兴趣提取的方法,首 先用独立分量分析提取r o i 特征,然后用支持向量机进行模式分类,对临床病例 的实验结果表明,所提出的新方法的检出率为9 1 。本研究方法简单有效,并具 有较高的智能性,为r o i 的自动提取提供了新的研究思路。 2 2 独立分量分析 独立分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 是一种由盲信源分离技 术发展而来的多通道信号处理方法,t 扫c o m o n l 3 0 l 在1 9 9 4 年首先提出。近年来,独 立分量分析理论已逐渐成为统计信号处理中的一个研究热点,并正迅速成为多维 数据分析的一个有力工具。 独立分量分析方法的基本原理是通过分析多维观测数据间的高阶统计相关 性,找出相互独立的隐含信息成份,去除分量间高阶冗余以及提取出独立信源。 相比于其他方法,独立分量分析的突出特点是:它在源信号和混合方式均未知的 前提下,以分量间相互独立为分离准则,尽可能无失真的从观测信号中分离出隐 1 0 基于子空间学习和支持向量机的微钙化簇检测 含的独立信源,该特性使得独立分量分析方法被广泛应用于图像特征提取、压缩 和模式识别等领域。由于现实中测得的生理信号往往是若干独立成分的加权迭加, 因此,独立分量分析在生物医学信号处理领域也具有广泛的应用前景。本文主要 工作是围绕独立分量分析理论在图像特征提取的应用而展开。 独立分量分析根据源信号相互独立,能够将行个源信号从它们的线性混合中 “等变化”地分离出来。在这里,“等变化 的属性意味着算法的收敛速度、稳 定性条件和抗干扰能力只取决于源信号的概率分布,而与混合矩阵无关。而从信 息论的观点看,如果将独立的混合信号最大程度的分离,就需要使输出分量之间 的互信息最小化,在理想情况下互信息应趋于零。目前,研究者们从不同应用角 度提出了多种度量各分量独立程度的判据。例如互信息极小判据1 3 1 1 、信息或熵极 大1 3 2 】判据、极大似然估计判据【3 3 】等等。随着有关理论的发展,还会提出新的有效 判据,但我们认为判据都应该遵循一个共同原则:一个良好的判据是既便于计算 和易于实现,又能解决问题本质的判据。根据这一标准,在目前的这些判据中以 互信息极小判据和信息极大判据最为实用。本章中,我们选择互信息极小判据作 为分离程度的判据。 i c a 用于特征提取的基本网络结构如图2 1 所示: 图2 1i c a 的基本网络结构 从图2 1 可以看出:i c a 的任务是对于未知基信号s 及混合矩阵彳的情况下,仅 从接收到的混合信号( 即观测信号) f = a s 中提取出基信号,在实际应用中,处理 前还需要先对观测信号进行归一化与白化处理,也就是说在彳和s 都未知的前提 下,寻找恢复矩阵形,使输出矩阵u = ,1 29 - o 9 u 肘】。的行向量吩r 能够重构出独 立基图像。 u = 形f = 矽a s = s ( 2 一1 ) 得到u 以后,可以把它的行向量作为特征向量构造特征空间,将每一幅待识 别的图像投影到这个特征空间中去,即用这组独立基图像的线性组合来表示。然 后用得到的投影系数( 矢量) 在特征空间设计分类器进行模式识别或者分类。 第二章乳腺图像中感辨趣区域的提取 本章中,我们认为乳腺图像感兴趣区域是由组互相独立的基图像线性叠加 而成。用i c a 求得这组基图像,构造一个特征空间,计算待识别乳腺感兴趣区域在 这个空间里的投影系数,将其作为样本i ) o j i c a 特征进行识别。 假设h 幅乳腺图像感兴趣区域是由m 个统计独立的基图像经过线性叠加后得 到的,由上面的理论推导可知: f = as ( 2 - 2 ) 其中s r 荆是由基图像构成的矩阵,每一行向量都表示一幅基图像,表达式为: f 2 一孙 a r 为系数矩阵,fe r “是乳腺图像感兴趣区域的图像矩阵。每一行向量代 表一幅由基图像线性叠加得到的乳腺图像感兴区域,如式( 2 4 ) : = 口,l + q 2 j 2 + q 。 ( 2 - 4 ) i c a 的任务是在系统矩阵一和基图像s 未知的前提下,寻找恢复矩阵,使 输出矩阵u = h ,“:,】的行向量是独立基图像的重构,即: u = wf = was = s ( 2 - 5 ) 对于每一幅待识别的乳腺x 线图像感兴趣区域都可以投影到以矩阵u 的行向 量为特征向量构造的特征空间,也就是说,每一幅待识别的图像都可以用这组独 立的基图像的线性组合表示。设,表示待识别的乳腺图像感兴趣f 域,则有: f = q ”l + a 2 u 2 + h , ( 2 6 ) 其中( q ,a 2 ,) 表示这幅图像在特征空间中的投影矢量,可以下式求得: 【q ,吒,a 】= 工( u _ ) 。 ( 2 - 7 ) 其中( u + 一表示矩阵u 的伪逆。基于i c a 的感兴趣区域特征提取如图2 2 所示: n l 乩。 一睁。一l 印 。 o 圈2 2 基丁i c a 的感兴趣区域特征提取示意图 通过对i c a 的理论及实现原理的了解,可以总结出基于独立分量分析的乳腺 x 线图像感兴趣区域的特征提取方法,其具体思路是:( 1 ) 将乳腺x 线图像提取成 等大的子图像作为待测乳腺图像感兴趣区域;( 2 ) 将i c a 应用于乳腺图像感兴趣区 i i i l i s 1 2基于子空间学习和支持向量机的微钙化簇检测 域的特征提取获得基图像;( 3 ) 将待识别乳腺图像感兴趣区域在基图像所构成的子 空间进行投影,求得待测乳腺图像感兴趣区域的特征矢量,得到样本的i c a 特征。 2 3 支持向量机 近年来,统计学习理论迅速发展起来,已经形成了一套完整理论。统计学习 理论主要针对小样本统计问题,它不仅考虑了对渐进性能的要求,而且追求在有 限信息的条件下得到最优结果。基于统计学习理论【3 4 】的支持向量机方法建立在 v a p i k c h e r v o n e m k i s ( v c ) 维和结构风险最小化原理基础上1 35 1 。根据有限的样本建 模,在向量空间中找到一个决策超平面,这个面能最好的分割两个分类中的数据 点,并可以获得最好的泛化能力。支持向量机在解决小样本、非线性、高维模式 识别问题中表现出许多特有的优势。 图2 3 分类问题 图2 4 最优超平面 为了更有助于理解分类问题,可以将样本看成是空间中的点,如图2 3 所示。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论