已阅读5页,还剩81页未读, 继续免费阅读
(计算机应用技术专业论文)医学图像数据挖掘若干技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 医学影像诊断是医学无创伤性诊断的主要方法之,是国内外医学领域重点研究的方向。医学 图像具有很人的数据量,其z p 蕴含着丰富的图像特征信息和规则,有待人们去研究和认识。冈此, 面向医学图像的数据挖掘技术研究成为医学和计算机科学交叉学科研究的一个十分重要的领域。医 学图像的高分辨率、数据的海量性、图像特征表达的复杂性等特点,使得数据挖掘技术在医学图像 中的研究具有较大的学术价值和广泛的应用前景。目前,面向医学图像的数据挖掘研究刚剐起步, 现有的数据挖掘方法直接应用还存在许多问题。研究和探索适合于医学图像的数据挖掘方法及其算 法等医学图像数据挖掘的理论和实践问题具有重要而现实的意义,对辅助医生进行医学图像临床诊 断具有重人实用价值。 本论文介绍了“基丁医学图像数据挖掘若干技术研究”】:作的相关研究成果,土要内容有: ( 1 ) 总结了国内外关丁图像数据挖掘研究现状和发展,探讨了医学图像的特点,讨论了适台医 学图像数据挖掘的图像数据预处理技术。幽像象素的灰度及其密度分布是表达医学图像特征的i 要 内容,本文研究了医学图像的灰度及其密度分布与人体组织器官的解剖语义关系,分析了医学图像 的成像原理和临床诊断要求,定义了表征医学图像的特征内容,并提出了适合医学图像数据的灰度 特征及其表达方案。 ( 2 ) 基于医学图像数据挖掘的需求,本文综述了数据挖掘、非结构数据挖掘、图像数据挖掘的 理论和方法,探讨了医学图像数据挖掘的技术和方法,提出了基丁医学图像数据的数据挖掘过判框 架。 ( 3 ) 从聚类分析的角度出发,深入研究了医学图像数据的核密度函数、数据分箱问题平摹r 数 据分箱策略的近似核密度构造方法。在此基础上,研究并提出了适用于医学图像数据的基i 近似密 度构造的聚类特征提取算法及其实现。根据这个算法,可以为基丁医学图像聚类的组织器官分类及 其自动分割提供有效的方法和技术。 ( 4 ) 从关联规则发现的角度出发,围绕医学图像的组织分类,深入研究了医学图像数据特征的 关联问题,提出了基于医学图像的关联分类规则挖掘方法及其实现技术。图像特征的止确选择对酬 像数据的芙联规则发现十分重要,本文在深入研究医学图像内容特征的基础上,首次提出医学图像 局部特征的概念,并实现了基于医学图像组织器官聚类的医学图像局部特征提取,如:基丁灰度 生矩阵利基于小波的特征提取方法和算法等。此外,本文还重点研究了医学图像特征数据的关联分 类规则,探讨了该关联分类规则与医学图像诊断的关系,为医学图像自动诊断提供了新的途径。 ( 5 ) 在相关医学图像数据挖掘算法研究的基础上,设计并开发了一个医学图像数据挖掘实验系 统,该系统具有医学图像预处理、医学图像数据特征提取等功,能为面向医学图像数据的各种数据 挖掘技术的研究和实现提供实验平台。 鉴丁,人体腹部医学图像的数据挖掘研究是一个全新领域,人体腹部影像是医学图像中最复杂的 部分,解决好腹部影像问题对整个医学图像都具有适用价值。本文所提出的基r 医学图像近似街度 构造的聚类特征提取算法及其实现、基丁关联规则的医学图像分类规则挖摭方法等创新性研究成果, 对医学图像数据挖掘研究、临床医学图像的自动诊断和临床医学早期诊断都具有重要意义。 关键字:医学图像,聚类分析,特征提取,关联规则,图像分类 a b s 仃a c t m e d i c a li m a g ed i a g n o s i si so n eo ft h em a j o rm e t h o d st om a k en o n i n j u r i n gd i a g n o s i si nm e d i c i n e t h e r ea r em a n yd a t af e a t u r ea n dil l l ei n f o m a a t i o nt h a tw i l lb ed i s c o v e r e da n dr e c o g n i z e di nm e d i c a li m a g e n o wc l u s t e r i n ga n da s s o c i a t i o nr u l em i n i n gh a sb e e naf l o m - i s h i n gr e s e a r c ha r e aa n dw i d e l yr e c o g n i z e da sa k e yt o o lf o rm i n i n gv a l u a b l ei n f o r m a t i o na n dk n o w l e d g ef r o mt h ed a t a b a s e s i m a g em i n i n gd e a l sw i t ht h e e x t r a c t i o no fi m p l i c i tk n o w l e d g e ,i m a g ed a t ar e l a t i o n s h i p ,o ro t h e rp a t t e r n sn o te x p l i c i t l ys t o r e di nt h e i m a g e s ,t h er e s e a r c ho nm e d i c a li m a g em i n i n gh a sj l i s ts t a r t e d i ti ss i g n i f i c a n tt or e s e a r c ha n df i n d p o w e r f u ld a t am i n i n ga l g o r i t h m st h a tc a nh a n d l em e d i c a li m a g ed a t a s e t se f f e c t i v e l ya n de f f i c i e n t l yt h i s s i t u a t i o ns h a p e su pt h eb a c k g r o u n do f r e s e a r c h e si nt h i st h e s i s t h eg r a ya n dd e n s i t yo f p i x e li sam a i nc o n t e n ts h o w i n gm e d i c a li m a g e t h es e m a n t i cr e l a t i o n s h i p b e t w e e nt h eg r a yd e n s i t yo fm e d i c a li m a g ea n dt h ea n a t o m yo fh u m a no r g a nt i s s u e si sd i s c u s sh e r e a f e a t u r ee x p r e s s i o na n dd a t ap r o c e s s i n gm e t h o d ,w h i c hc a nb ea d a p t e dt om e d i c a li m a g ed a t am i n i n g ,i s p r e s e n t e d t h ep r o c e s so f t h em e d i c a li m a g ed a t am i n i n gi so f f e r e d d e t a l l e ds t u d yi sd o n et oi m p r o v et h ea c c u z n a e yo ft h eb i n n e dk e r e e ld e n s i t ye s t i m a t i o nm e t h o d sa n d a p p r o x i m a t i o nk e r n e ld e n s i t yf u n c t i o nb a s e do ng r i d - b a s e d c l u s t e r i n ga n df e a t u r ee x t r a c t i o na l g o r i t h m sa r e p u r p o s e db a s e do ng r i d - b a s e dd e n s i t yf u n c t i o nc h a r a c t e r i z a t i o no ft h em e d i c a li m a g ed a t a s e t b e s i d e s , f i n d i n ga r b i t r a r ys h a p e dc l u s t e r sa l s oh a sb e e np r o p o s e ds u c c e s s f u l l y b a s e do nt h ea p p r o x i m a t e dd e n s i t y c o n s t r u c t i o n ,t h ee x p e r i m e n t a ls t u d i e sf o re x t r a c t i n gm e d i c a li m a g ef e a t u r eh a v eb e e np u r p o s e di nt h et h e s i s t h ep r o c e s s i n gs t r a t e g i e sa n de x p e r i m e n t a lr e s u l t sp r o v et h er a t i o n a l i t ya n da v a i l a b i l i t yo ft h en o v e l m e t h o d a s s o c i a t i o nr u l em i n i n gh a sb e e na p p l i e dt ol a r g ei m a g ed a t a f p g r o w t ha l g o r i t h mi sp r o p o s e df o r e n h a n c i n ge f f i c i e n c yo fa p f i o f ia l g o r i t h m t h er u l et h a tc l a s s i f i e sb e t w e e nn o r m a la n da n o m a l i s t i co r g a n i m a g ei sd i s c o v e r e du s i n ga s s o c i a t i o nr u l em i n i n g d m f a c i af d i s c o v e r ym a x i m u mf r e q u e n ta s s o c i a t i o n c l a s s i f i e rl t e m s e t sa l g o r i t h m ) i sp r e s e n t e da n d a p p l i e dt om e d i c a li m a g ed i a g n o s i si nt h i st h e s i s k e y w o r d s :m e d i c a li m a g e ,c l u s t e r i n g ,f e a t u r ee x t r a c t i o n ,a s s o c i a t i o nr u l e m i n i n g ,i m a g ec l a s s i f i c a t i o n 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发 表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用 过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明 并表示了谢意。 研究生签辄弛日期:业 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的 复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内 容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可 以公布( 包括刊登) 论文的全部或部分内容。论文的公布( 包括刊登) 授权东南大学研 究生院办理。 研究生硌渤翩虢巡日 期:芝兰:! :! 哆 第一章概述 第一章概述 i l l2 0 世纪7 0 年代以来,计算机断层扫描( c o m p u t e dt o m o g r a p h y , c n ,核磁共振影像( m e g n e c t i c r e s o n a n c ei m a g i n g ,m r t ) ,超声图像( u l t r a s o n o g r a p h , u s ) 等医学成像技术快速发展,医学图像在临床 医学诊断中发挥着越来越重要作用。计算机技术和幽像处理技术的不断进步,促进跌学嘲像数字化 的实现,为医学图像诊断的自动化奠定了基础,推动临床医学事业的快速发展。 1 1 选题依据及其意义 数据挖掘技术自上世纪9 0 年代开始兴起,发展很快,已逐渐形成独具特点的数据集成、知识挖 掘、模式评价和验证理论与方法体系。数据挖掘在金融、制造、电信、保险等众多府用领域止发挥 着重要作用。集图像、音频、视频和文本等为一体的多媒体数据大量积累,对数据挖掘技术提出j , 更高要求,与之相应,多媒体数据挖掘的研究开始引起学者们的关注,美国计算机学会( a s s o c i a t i o nf o r c o m p u l i n gm a c h i n e r y ,a c m ) 于2 0 0 0 年召开了多媒体数据挖掘第一届年会0 m d m k d d2 0 0 0 ) 现在 每年举行一次会议。促进了多媒体的数据挖掘技术研究。 图像挖掘是多媒体数据挖掘的一个重要组成部分,其研究内容是在图像数据集中,提取隐含的 知识,包括图像之间的关系、图像与字符数据之间的关系、图像中各实体之间的相互关系咀及其他 模式或关系等,是涉及计算机视觉、图像处理、图像检索、数据挖掘、机器学习、数据库和人j 1 智 能等学科的交义研究领域。具体地说,图像挖掘是从i 璺j 像中提取能代表区分该图像结构内容的特征 向量,在这些特征向量所在的空闻中比较、分析它们之间的距离或相似关系。通过对图像内容的分 析、索引、摘要、分类和检索等操作,进一步发现感兴趣的知识或模式。 图像挖掘并不是数据挖掘技术在图像领域中的简单应用冈为,现有的数据挖掘技术主要麻j h 丁结构型数据,而图像数据是非结构型数据。结构型数据中的数据都有一定的语义,而图像数据中 的数据不一定有明显的语义。为了满足图像数据库中挖掘知识的需要,需要开发山一些新的挖掘算 法以及其他相关技术。 医学图像有其鲜明的特点。一是灰度分辨率高。医学图像的灰度分辨率数倍丁普通灰度图像, 对于医学图像而言,普通灰度图像中的颜色特征已不再适用;_ 二是计算机重建幽像。医学领域中的 c t 、m r i 等医学图像的成像原理是基于人体组织的密度著异,经过计算机重建厉得到的人体图像 维数据矩阵序列,不同于普通灰度图像;三是人体解剖区域的客观表达。医学图像具有其特定的医 学涵义,图像信息与医学语义相统一。 面向医学图像的数据挖掘研究i 作刚刚起步,有很多问题需要研究和探讨。首先,j 【 于医学幽 像挖掘的特征数据仅局限于一般意义上的颜色、纹理、形状等特征,没有充分考虑医学图像本身的 特点。第二,用于医学图像挖掘的算法停留在对决策树、神经网络和关联规则等传统的数据挖掘算 法的直接使用方面医学图像数据是复杂和高维的,需要研究适合其特点的挖掘算法。第j ,对丁 医学图像的数据挖掘局限于个别特定的组织器官,比如乳房,颅脑等,所取得的研究成果并不具有 对其他器官知识发现应用的普遍适用性。第四,现有的研究局限于对整幅图像的全局特征进行挖掘 研究,而临床医学中对人体图像的局部区域特征更具有临床医学意义。这些不足和局限是本论文研 究的出发点和主要内容。显然,医学图像数据挖掘技术的深入研究,对数字医疗技术的发展具自重 要的促进作用,对提高医学图像诊断的客观、科学、准确性提供技术支撑。 在过去的三十年中,医学成像技术发展很快,在临床医学诊断一j :作中取得了许多成果。医学图 像在临床诊断和教学科研中发挥着积极作用,不断推进医疗水平的发展平u 进步。随着计算机及其剃 芙技术的迅速发展以及图形图像技术的日趋成熟,医务t 作者可以从多方位、多层次、多角度对医 学图像进行观察,从而辅助医生对病变区域进行综合分析,明显促进临床医学诊断准确性和止确一陀 的提高,数字医疗时代开始出现。然而,目前的医学图像诊断方法仍然是依靠医生个人的临床经验 东南大学博上论文 和土观判断,通过肉眼观察图像中的病变区域实现临床诊断,这种方法还存在如f 不足:医学图 像信息利i 【 率不高,由丁二医学图像一般具有很高的分辨率,那些实际存在而人眼无法分辨的图像信 息得不到充分应用;在图像诊断工作中,很大程度上依靠医生的临床经验,容易出现诊断错误; 图像渗断1 作带有个人的主观性,同一张医学图像,不同的医生可能会有不同的诊断结果,发生 误诊或漏诊是叮能的。如何有效利h j 医学图像信息和数字医疗技术,使得临床诊断史加客观、准确、 科学,一直是医学图像诊断的一个技术难点。 医学图像中蕴含着丰富的图像特征信息和规则,这使面向医学图像的数据挖掘成为。个十分重 要的课题。这类研究所面临的诸多问题都十分复杂,除了图像特征表达的复杂性之外,其他的挑战 来自于医学图像的高分辨特性,数据的巨量性、异构性和噪卢显著性。所以,数据挖掘技术在医学 图像中的研究具有很人的学术价值和r 泛的麻抖j 前景。由丁目前面向医学图像的数据挖掘研究尚处 丁+ 起步阶段,现有的数据挖掘方法直接麻用还存在许多问题。研究并提出适合于陕学图像的数据挖 掘方法及其算法嚣医学图像数据挖掘若干技术研究具有十分现实的意义,对辅助医生进行医学i 窨 像 临床诊断具有重要实用价值。 本论文研究l 作涉及数据库知识发现的重要工具图像挖掘技术。其目标是通过挖掘技术的 理论探索与在医学图像中的实践研究,提出适合于临床医学图像诊断的有效挖掘算法和技术。论文 的全部研究t 作着重以适合于医学图像数据的特征提取和依据特征的图像分类规则发现等内容进行 系统研究并期望取得医学图像数据挖掘技术的麻用成果。具体而言,本论文在广泛调研的基础r , 根据图像挖掘技术在临床医学图像数据库系统中的潜在应用背景,结合多项关丁数据挖掘算法和戍 川研究的国家自然科学基金项目( 见附录) 以及地方社会发展基金项目“基丁纹理的医学图像数据 库检索方法研究”( 项目编号:s h 2 0 0 2 0 3 9 ) 、“医学图像数据库存储技术研究”( 项目编号: s h 2 0 0 3 0 1 4 ) 的研究一f 作,通过对面向医学图像的数据挖掘技术及其应用的深入研究,提出适合j : 临床医学图像数据的有效挖掘算法、技术和方法,为医学i 到像的自动分割和识别,为临床医学图像 诊断实现自动化开辟新的技术途径。 1 2 研究现状及相关领域 在a c m 的第一届多媒体数据挖掘年会上,虽然许多论文涉及多媒体智能检索、地理信息系统 等内容,但是,很多从事多媒体信息系统和数字媒体方面的专家都热衷丁i 进行以提高数字媒体检索 和索引速度的数据挖掘和知识发现技术为内容的理论和实践研究。mdm i kdd 2 0 0 1 年会表明, 多媒体数据挖掘技术已经有了较大的发展。尽管方法还不成熟,但多媒体数据挖掘思想已经开始向 交通管理、医学影像诊断、台风预测等更多的领域扩展口j 。图像挖掘与基于内容的图像检索相互交 迭,互为因果。图像挖掘远不只是检索相关图像的问题,重要的是要在人量图像集中发现有意义的 知识例像和图像模式。目前,图像挖掘主要采用的技术有对象识别、图像索引和检索、图像分类平i 聚类、神经网络和关联规则挖掘等,有部分文献已将并联规则应_ 日 到大犁图像数据库中” 。 1 2 1 研究现状 白2 0 0 1 年以来,许多学者在多媒体数据挖掘、图像数据挖掘和医学图像数据挖捌领域进行, 研究和探索,取得了一些成果。 多媒体挖掘就是从大最多媒体数据集中,通过综合分析视听特性和语义,发现隐含的、有效的、 有价值的、可理解的模式,得出事件的趋向和关联,为用户提供问题求解层次的决策支持能力。 s i m o n 大学开发的m u l t i m e d i a m i n e r 可以使用三维可视化技术清楚地显示关联规则 4 】。在国内, 武汉大学研究出一个多媒体数据挖掘原型系统“1 。最早的文本挖掘是1 9 9 5 年由8 0 n c nf e l d m a n 等人 提出的,文本挖掘即文本数据库中的知识发现,是从文本或大量文本的集合中提取隐含的,以前未 知的,有潜在使用价值的有用信息过程”1 。 2 第一章概述 图像数据挖掘是数据挖掘技术在图像研究中的应用,目的是要在图像中发现有h 的知识和模 式。针对人型图像集挖掘和针对图像、文字数据的组合集挖掘都是图像数据挖掘的重要内容。 c o r d o n e z 提出用斑点( b l o t , ) 完成与图像上下文相关的图像挖掘算法f j 。著名聚类分析软件开发公丌j c l u s t a n 研制的图像聚类系统c l u s t a n g r a p h i c s 是将多种聚类分析算法融合起来,在图像分类、地 理信息系统研究等领域发挥了重要的作用m j 。 j iz h a n g 等人总结了两种图像挖掘框架体系:基于功能的框架体系,着重利刚不同组成模式 的功能来组织图像挖掘系统。如:美国n a s aj e tp r o p u l s i o nl a b 的j o s e p hr o d e n 等人研制的t h e d i a m o n de y ei m a g em i n i n gs y s t e m p j :s i m o n 大学o r z a i a n e ,j 、h a n 等人开发的m u l t i m e d i a m i n e d j 。基丁信息的框架体系,着重根据不同层次的信息需求将挖掘系统设计成分层结构。如: n a t i o n a lu n i v e r s i t yo f s i n g a p o r e 的j iz h a n g 等人研制的h o t s p o ti m a g em i n i n g i j l 。 数据挖掘技术在医学图像诊断中的应用是最近开始受到学术界关注的重要研究方向之,这个 研究领域引起了许多学者的研究兴趣,并已取得了一定的成果。例如,m a r i a - l u i z a a 等人刖图像挖 掘方法对图像库中的胸部图像进行了较为深入的研究,所提出的方法首先是对胸部图像进行预处理, 然历将图像分成四个规划区域,提取每个区域的纹理特征,最后用两种算法( 关联规则和神经网络) 对它进行数据挖掘。该方法通过图像数据挖掘,将图像分成正常和癌患者两类,实现对乳癌患者进 的自动诊断”“。v a s i l e i o sm e g a l o o i k o n o m o u 等人利用数据挖掘技术( b r a i ni m a g e dd a t a b a s e 原型系统 采用关联规则) 对脑部图像进行了研究,发现了人脑的结构与功能的联系,在人脑疾病的诊断中发挥 了重要作j j ”“。p e t r a p e r n e r 提出基于诊断的图像挖掘系统,首先提取图像的颜色、纹理、形状等低 层物理特征和专家对图像的诊断信息,然后用决策树挖掘图像特征和诊断的关联,辅助医生进行临 床渗断。 目前医学图像数据挖掘研究领域还没有形成完整的理论和方法体系。人部分研究局限丁通过特 征集的关联规则进行数据挖掘研究。在现有的研究工作中,关于医学图像的特征研究还彳:够深入, 所采用的数据挖掘方法远未成熟。由于医学图像特征研究的成果直接影响数据挖掘结果,所以,对 医学图像特征进行深入研究十分必要。本文就是要在医学图像特征系统研究的基础上,对图像数据 挖掘技术,尤其是适用于医学图像数据的挖掘技术进行理论和实践研究,提出医学图像数据挖掘的 技术和 法。 1 2 2 相关学科领域 医学图像研究已成为众多信息技术领域共同关注的问题。图像数据挖掘据技术虑用丁- 医学图像 领域虽然刚刚起步,但已引起信息技术专家的浓厚兴趣。本研究是医学图像处理与数据挖掘的交义 学科领域,涉及机器学习、人工智能、粗糙集理论、神经网络、模式识别、图像处理、数理统计i ”。” 等众多学科领域的研究思想与方法。这里择其与本研究相关的内容简介如r : ( 1 ) 模式是对某些感兴趣的客体定最或结构描述,模式类是具有某些共同特祉的模式的集合。模 式识别是研究一种自动技术,依靠这种技术,机器将自动地( 或人尽量少地干涉) 将待识别模式分 配到各自地模式类中去的过程口“。模式识别是6 0 年代初迅速发展起来的- h 学科。它所研究的理论 和方法在很多学科和技术领域中得到广泛重视,推动了人t = 智能系统的发展,扩大了计筇机麻月= j 的 领域。计算机技术的发展,使模式识别在医学图像领域得到了广泛应用,如组织识别、组织分类筲。 ( 2 ) 数字图像处理是利用计算机的计算功能,实现与光学系统模拟处理相同效果的过程。数字图 像处理具有处理精度高、再现性好、易于控制处理效果、处理的多样性、图像数据督庞人、处理费 时平ij 图像处理技术综合性强等特点。近年来,该技术被应t e i j 到医学、生物学、地理学、制造业、材 料科学等各个领域【”i 。 ( 3 ) 机器学习作为人工智能和统计学相结合的学科,已经被证明是一个富有成效的研究领域。一: 机器学习方法中,组织分类需要通过一定时间的学习过程才能达到自动分类的 :作目标。机器学爿 的所有算法一般都是搜索n 维空间数据集,以找出一个合适的概括结果阱l 。机器学习算法在锻多领 域被证明很有实用价值,如数据挖掘问题( 从患者数据库中分析治疗的结果) 以及模式识别问题( 从 3 东南大学博 。论文 图像库中识别出人脸) 等“。机器学习对于图像处理技术与模式识别方法在细胞学的研究与诊断力 面的应用,提山用决策树的方法识别癌细胞,取得了预期的结果i ”j 。由于对训练数据集和背景知识 的依赖性,基于机器学习的方法不具有广泛的适应性。此外,在实际应用中,这种方法效率较低, 同样难以处理人规模数据分类问题。 ( 4 ) 在人i :智能方法中,聚类也称为概念聚类。这是囡为,数据点之间的相似性洲度不再依赖丁 传统的儿何距离,而是通过对概念的描述加以确定。随着聚类对象的增加,概念聚类方法在数据对 象问形成概念上的分类。这种处理概念数据集的聚类思想与方法为聚类技术开辟了新的麻_ l i 领域, 成为义个热点研究内容。在神经网络方法中,聚类被称为亡j 组织神经网络方法,如k o h o n e n 自组 织特征映射网络、竞争学习网络等。 ( 5 ) 数理统计是以概率论为基础,处理带有随机性影响数据的一个数学分支。在科学技术研究1 0 牛产实践中以及社会的各个方面,都有着极为,“泛的应用。医学图像数据的规律性认识和研究需要 数理统计学的支撑j 。 ( 6 ) 神经网络是在现代科学关丁j 人脑中枢神经的研究成果基础上提出的反映人脑活动的网络系 统。它由大量的基本单元神经元按照一定的拓扑结构且连而成,具有非线性映射、快速并行分 布处理、自学习、自组织、白适应以及鲁棒性等功能,冈此广泛应用在模式识别、复杂优化问题、 图像处理以及计算机等相关领域。尽管对丁神经网络及其应用有很多研究l 作,在图像挖掘领域仍 然属于是新的研究t 作。将神经网络用于图像挖掘的一个显著的研究j 作是人阱十经网络由 g c t g a r d n e r 等人提出j ,它可以提供专门的自动操作方法用丁图像分析的基础。一组挖掘刊艮,摹 丁i 模糊a r t m a p 的神经网络,提供一个直觉的方法。一个图像分析家可以有效成功的挖蓣i 人量 的多传感器图像。汪亚明等人提出了从眼底圈像参数到不同种类青光眼的人l :神经网络诊断法【3 0 i 。 综上所述,医学图像研究和应用受到来自众多研究领域的关注,这些领域的共同努力使研究不 断深化和扩展,为人类健康事业作出重大贡献。本论文着眼丁从数据挖掘的理论和实践出发,分析 医学图像的数据挖掘问题,综合现有的医学图像特征体系基于象素密度、网格和图像分类等思想, 在医学图像的聚类特征模型及其特征提取、基于f p q r e e 的高性能挖掘算法进行医学图像数据的分类 及其实现等方面进行了深入研究。 1 3 文章概要 本文是以医学图像数据为研究对象,从理论、算法和实现三个方面,研究数据挖掘技术在医学 图像中的应用问题。在医学图像中,人体腹部图像最具复杂性,解决好人体腹部医学图像问题对整 个医学图像都具有适用价值,所以,论文选择研究难度较人的人体腹部医学图像作为研究i 作的数 据源。 1 _ 3 1 研究内容 针对医学图像诊断研究所面临的问题,从基于图像内容特征的角度,研究面向医学图像数据的 数据挖掘技术( 如:探讨适合于医学图像数据的数据挖掘方法、研究其数据挖掘算法故进并将之应 j j 丁临床医学影像诊断等) ,推进无创作性临床医学诊断研究的不断进步。具体说,文章厦点在r 列 方面进行研究: ( 1 ) 医学图像数据的灰度特征表达研究。i 割像象素的灰度及其密度是表达医学图像特征的主要内 容,论文在研究医学图像的灰度及其密度与人体组织器官的解剖语义关系和分析医学图像的成像原 理和i 临床诊断要求的基础上,定义了表征医学图像的特征内容,提山了适合医学图像数据的灰度特 征及其表达方案。 ( 2 ) 跃学图像数据聚类特征表达及特征提取研究。从聚类分析的角度出发,文章深入研究了医学 图像数据的核密度函数、数据分箱问题和基于数据分箱策略的近似核密度构造方法。在此基础上, 研究爿提出适用于医学图像数据的基于医学图像近似密度构造的聚类特征提取算法及其实现技术。 4 第一章概述 根据这个算法,可以为基于医学图像聚类的组织器官分类及其自动分割提供新的技术支持。 ( : ) 在医学图像特征提取的基础上,构建出包含医学图像各种特征值的医学图像特征数据库。 ( 4 ) 从关联规则发现的角度出发,围绕医学图像的组织分类,在深入研究医学图像数据特征的父 联问题的基础上,提出了基丁二关联分类规则的医学图像数据挖掘方法及其实现技术。 ( 5 ) 图像特征的正确选择对图像数据的关联规则发现十分重要,论文在深入研究医学圈像内容特 征的基础上,首次提出医学图像局部特征的的概念,实现了基于医学图像聚类的组 ; 器官分割片对 之进行医学图像的局部特征提取。在此基础上。研究了基于医学图像数据特征的芙联分类规则,探 讨了所发现的规则与医学图像诊断的关系,为医学图像自动诊断提供了新的方法。 ( 6 ) 在以上工作的基础上,为研究基丁医学图像的人体组织器官自动分类和病变组织的自动识别 提出新的途径。 在理论上对相关数据挖掘算法研究的同时,还加强了原型系统的实验研究。从江苏人学附属医 院采集的真实人体图像数据并对其进行预处理,建立医学图像数据库:运片j 改进的聚类挖掘算法对 跃学图像数据进行聚类特征提取;运用改进的关联挖掘算法探讨图像数据与诊断数据的关联分类规 i i ! i l 。 1 3 2 研究创新 本文针对医学图像数据对象的复杂性、高维性和特殊性,对现有图像数据挖掘算法加以比较、 筛选和改进,探讨和发现适合医学图像的数据挖掘方法和算法。研究从理论和应用两个方面,探讨 适合于医学图像数据的挖掘技术,揭示正常人体各组织器官影像的特征数据及其分布规则和戈系, 提出医学图像数据聚类分析和医学图像关联分类规则挖掘方法及其实现技术,为人体组织器官| 冬f 像 的自动分类和病变组织图像自动识别开辟新的途经。研究成果的创新主要表现在以f ) l 个方面: ( 1 ) 根据医学图像的特点和诊断要求,立足于大量医学图像实验,深入研究了表达医学图像内 容特征。在研究医学图像灰度与人体组织器官解剖语义关系的基础上,提山适合医学图像数据的灰 度特征及其表达方案。 ( 2 ) 深入研究了医学图像数据的核密度函数、数据分箱和基于数据分箱策略的近似核密度构造 方法。在此医学图像灰度密度研究的基础上,提出基于医学图像的近似密度构造聚类算法和聚类特 征提取算法。 ( 3 ) 根据基于医学图像密度构造的聚类算法提出了基于医学图像聚类的组织器官分类并实现 自动分割。 ( 4 ) 在研究医学图像特点的基础上,提出从医学图像人体分类、组织器官分割到纽织器官止 异常自动分类的图像数据挖掘过程。 ( 5 ) 在深入研究医学图像内容特征的基础上,提出基于组织器官白动分割的医学图像局部特征 提取及其意义。经与医学图像全局特征比较斤发现,这种局部特祉对医学罔像关联分类规则挖掘更 具效用。 ( 6 ) 在深入研究表达医学图像内容的各种特征数据的基础上,提出了基于关联规则的医学图像 分类规则挖掘方法及其实现技术。 1 3 3 论文的组织 本文从医学图像的认知出发,研究和论述了本课题研究的意义、医学图像特征表达、图像数据 挖掘、医学图像数据聚类、医学图像特征关联规则等。 第一章是关于本文的概述。围绕选题依据和意义,讨论了国内外医学图像数据挖掘研究现状 提出了本研究的内容和主要创新方面。 第:章是关于医学图像数据的预处理问题。总结了医学图像的来源、医学图像数据标准,讨论 了医学图像数据的标准化处理技术,研究并提出了适合医学图像数据的灰度特祉表达方案。 第二章面对医学图像数据,综述了数据挖掘、非结构数据挖掘、图像数据挖掘的理论和方法, 探讨了医学图像数据挖掘的方法、途经和过程。重点描述了基于灰度共生矩阵和基于小波的特征提 5 东南大学溥l 论文 墩方法平算法。 第四章从聚类分析的角度出发,深入研究了医学图像数据的数据分箱就基丁数据分箱策略的 近似核估计方法。在此基础上,研究并提出了适用于医学图像数据的聚类特征提取算法及其实现。 第五章从关联规则的角度出发,深入研究了医学图像数据特征的关联问题,提出r 基丁关联规 则的医学图像分类挖掘方法及其实现技术。 第人章在医学图像数据挖掘研究的基础上,设计开发了一个医学图像数据挖掘实验系统。该系 统实现了医学图像的格式转换等图像预处理、d i c o m 格式图像的浏览、医学图像数据特祉提取和跃 学图像数据挖掘的算法实现等功能。 第七章是对论文研究工作的总结,综述了本文关于医学图像数据聚类分析和医学矧像数据特征 关联规则发现及其图像组织器官分类方法等研究成果,并提出了下一步研究l 一作的重点乖方向。 6 第二章医学图像及其特征表达 第二章医学图像及其特征表达 医学图像是表达人体组织、器官等解剖结构的信息集合,作为本课题的研究剥象,本章从医学 图像成像、医学图像数据的特性、医学图像预处理等方面入手,讨论d i c o m3 0 医学数字影像通讯 标准和d i c o m 文件格式,并从图像格式转换、图像归一化等方面提出医学陶像的预处理技术问题。 2 1 医学成像技术简介 1 8 9 5 年,外科医生首次利用x 射线观察到了人体的内部解剖结构,这一史无前例的成功揭开j , 人类探索人体内部世界的序幕,开创了影像技术的先河,从而为医生进行疾病的诊断提供,重要的 信息。从2 0 世纪5 0 年代开始以计算机为代表的各种新技术被用到医学成像系统中,新的成像办 法不断涌现,促进医学成像技术的b 速发展。医学图像不仅提供了人体组织在解剖上的形态结构, 而1 :1 为器官功能检查提供了可能。到目前为止,儿乎所有的物理方法或多或少地都已渗透到了医学 的领域,成功应用于临床医学的影像技术涉及许多方面,这里介绍几种常用的成像技术。 2 1 1 计算机断层扫描成像技术 1 9 6 9 年英国工程师h o u n s f i e l d 首次成功设计了一台断层摄影装置,并于1 9 7 2 年与英国神经放 射学家a m b r o s e 一道将该装置应用于脑部扫描,获得了第一幅脑肿瘤图像,该装置称为x 射线断层 扫描摄影装置,简称计算机层析成像或c t 。1 9 7 4 年由l e d l e y 设计成功全身c t 裴置,进步扩人 了c t 的捡查范阐,从而为c t 进入临床医学领域奠定了基础。 c t 的成像原理是采用准直后的x 射线束,对人体的某一层面从不同的角度进行照射,当x 射 线穿过某一物质时,部分光子被吸收,其强度成指数关系衰减,朱被吸收的光子穿过物体后被另 端的检测器接收,经过放大并转换成电子流的模拟信号,再转换成数字信号输入计算机,计算机对 接受到的多组原始数据进行处理重建,得到用于显示的二维数据矩阵。由丁检测器接收到的信号强 弱取决r 人体横断面内组织的密度,密度高的组织吸收的x 射线较多,检测器得到的信号较弱,比 如扫描人体的骨骼、钙化组织等;反之,密度较低的组织吸收的x 射线较少,检测到的信号就较强, 如扫描脂肪等组纵。因此检测器所接收到的信号的强弱反映了人体组织不同的“值( 为该物质对x 射线的的衰减系数) ,c t 的成像技术正是利用射线穿透人体后的衰减特性米合成,通过比较同一部 位不同的衰减特性就可以进行病变诊断。 随着c t 技术的不断进步和发展数据采集与图像重建的计算过程需要时间大大缩,医学图像 的幽像的分辨率持续提高,病人接受的射线照射剂量不断减少。目前的x c t 装置成像厚度可以小 到1 m m ,断面中的图像分辨率也已经可以做到小于是1 m m l 4 ”。 2 1 2 超声成像系统 目前临床上使用的超卢成像系统基本上都是采用脉冲回波方式成像,其原理是_ 【 j 一个短暂的电 脉冲激励换能器晶片,使之振动产生超声波弗射入人体内,进入人体的超声波在遇到组织界面时, 就会产生较强的反射信号。于是,根据接收到的回波信号,就可以直接获取扫查平面上的人体结构 图像。超声成像的突出优点是对人体无损、无创、无电离辐射,同时它又能提供人体断面实时的动 态图像,因此可广泛地用于各器官的辅助诊断。除了断面成像外,缸流测量也是超卢成像设备中的 重要组成部分,通过对多普勒回波信号分析得到的血流方向与速度信息,是心血管疾病与脑血管疾 病诊断中的重要手段。 2 1 3 核磁共振成像技术 1 9 4 5 年美国学者b l o c k 和p u r c e l l 首先发现了核磁共振现象:1 9 7 3 年p c l a u t e r u r 第一个做f jr 7 东南大学博上论义 仿真模块的二维核磁共振图像,之后义有人做出了对小物体成像,在7 0 年代后期,对人体的成像获 得成功。 核磁共振成像的过程是将人体置入一强磁场中,这时如果对人体间时施加一个。定频率的变变 射频场,那么被探奁的质子就会产生共振,并向外辐射共振信号。r 是,在接受线罔q ,就会有感府 电势产生。所接收到的信号经过计算机处理后,就可以得到清晰的人体断层图像。核磁共振图像的 突出优点是对人体无创、无电离辐射,并且可以对人体组织做出形态与功能两方面的诊断。此外, 核磁共振图像的分辨率比较高而且可咀较容易地获取人体的三维图像。 除了前面介绍的c t ,1 3 超( 1 3 u s ) ,m r i 等影像技术以外,还有数字化的x 射线透视成像, 数字减影造影( d s a ) ,核同位素断层成像,红外,阻抗断层等成像技术,它们在不同的研究领域中 都发挥着很重要的作用。 2 2 医学图像采集与分类 临床医学影像设备品种繁多,对医学图像进行深入研究时,首先需要解决对来自医院各种设备 的医学图像的认识和采集问题。 2 2 1 数字图像采集 数字图像直接通过网络实现图像采集。该1 :作有以下方面要求:一是仪器为数字化仪器,最女r 7 r 计算机接口。二是其图像支持国际通用的医学数数字影像通信( d i g i t a li m a g i n ga n dc o m m u n i c a t i o n i nm e d i c i n e ,d i c o m ) 标准或其他标准,三是开发支持相应标准格式的网络通讯、图像存储、显示簿 软件。本课题中试验所涉及的图像都是用该方法采集而得的d i c o m 标准格式图像。 视频图像的采集是将设备输出的视频信号通过计算机转化为数字信号。具体是通过图像采集 将仪器的图像采集到工作站,然后保存到存储设备中。该方法目前基本满足于所有的仪器,实现的 条件比较成熟。 胶片扫描主要针对过去已有的一些胶片图像,通过对胶片进行数字化扫描对丁医嘱信息、病 人自述信息等说明性文字通过数据录入等手段实现胶片图像的数字化。 2 2 2 医学影像数据的分类 医学图像数据种类繁多,而且存储容量巨人。常见成像技术所产生的数字图像的容譬是: c t 断层扫描图像:5 1 2 5 1 2 1 2 b i t s : b 犁超声波扫描图像:5 1 2 5 1 2 8 b i t s ; 核磁共振( m r l ) 扫描图像:2 5 6 2 5 6 1 2 b i t s : 数字化的x 射线透视胶片:2 0 0 0 2 5 0 0 1 2 b i t s ; d s a : 1 0 2 4 1 0 2 4 8 b i t s ; 核医学:1 2 8 1 2 8 1 6 b i t s : 跃学图像的种类和格式虽然比较多样,但是对于医学影像数据库所面对的数据对象而南,丰要包 括:描述性数据,涉及医嘱信息、病人自述信息、影像诊断信息等;图像信息,包括x 射线透 视胶片、病理切片图像、数字扫描图像、数字影像等:计算机处理的中间数据和辅助数据,如: 从图像中抽取的特征数据等。 2 3 d i c o m 3 0 标准 为解决不同厂商影像设备的互联问题,美国放射学会( a m e r i c a nc o l l e g eo fr a d i o l o g y ,a c r ) 和美国国家电器制造商协会( n a t i o n a le l e c t r i c a lm
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学数学人教版二年级上册8的乘法口诀教案
- 汽车销售合同及售后服务
- 具身智能+工业生产环境自适应协作机器人研究报告
- 信息安全专题会议发言稿
- 2025年法律职业资格考试真题及完整答案详解
- 2025年中级银行从业资格之中级个人贷款题库练习题含答案详解
- 2024年考研-中医综合阶段测试卷含答案
- 2025年工业设计平台合作协议协议
- 2026届陕西省西安市西安中学高二上化学期中检测试题含解析
- 2026届广西壮族自治区百色市田东中学高一化学第一学期期中统考试题含解析
- 手机恢复出厂设置后如何恢复微信聊天记录
- DB4103T177-2024乌苏里拟鲿的亲鱼培育及人工繁殖技术规程
- 梅毒职业暴露
- 食堂搭伙协议书范本
- 人教版(2024新版)七年级上册数学第三次月考模拟试卷(含答案)
- DB11T 3034-2023 建筑消防设施检测服务规范
- 人教版六年级上册道德与法治知识点
- 产前筛查知情同意书制度
- 大学生职业生涯规划课件教学
- GB/T 10069.3-2024旋转电机噪声测定方法及限值第3部分:噪声限值
- 2024年全国职业院校技能大赛中职(数字产品检测与维护赛项)考试题库(含答案)
评论
0/150
提交评论