(计算机应用技术专业论文)染色体图像分析技术研究.pdf_第1页
(计算机应用技术专业论文)染色体图像分析技术研究.pdf_第2页
(计算机应用技术专业论文)染色体图像分析技术研究.pdf_第3页
(计算机应用技术专业论文)染色体图像分析技术研究.pdf_第4页
(计算机应用技术专业论文)染色体图像分析技术研究.pdf_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

染色体图像分析技术研究 摘要 染毽薅孩鍪努裁,絷毪髂遗簧分辑羧零戆经典方法,楚遗传学程学 研究帮辅助簸寐诊断的蓬要手段之一,跫努 厅染色体羁使,缺失,诊断 各种遗传病变的关键指标。染色体分祈的目的就是要确定细胞或个体 的染色体组成。尤其慰骚将其与正常结构间的偏差和生理的或临床疾 病关联起来。模式识别技术的发展,以及豳像处理技术在医学中的广泛 应用,馊得自动化染色体分析成为可能。利用计算机进行染色体自动分 辑会大大撬蓬工佟效率,瑰减轻了医护人爱靛受担,势虽宅不依赣手工 终久受豹获凌,工痒久爱氇不震要专家缀麓技术羁经验,嚣瓣毽舞染毪 俸分析远程医疗提供了研能。本文对染色体图像进行了预处理。特征提 取与选择和初步分类分析,通过大量的实验证明我们所采用豹算法是 有效的。 谯染色体图像的预处理过程中。首先进行阀值的计算,我们根据 q t s u 提出的类判别法寒眷找阀值,用该阀傻处理后的图像,蠢较好的分 褰特镊。瓣染色葵强豫逡露处理鞋嚣,糕耀撼号法实鬟了豢惩镕銎像蕊 垂魂分割,褥鬟单条染色髂蓬橡。在染悉搭麓塞韵分裁撬取熬过程中, 可以对杂质实行去除,糯保留我们需要用来进行识别构染能体。 筒积。周长,着丝粒指数是识别染色体的蘑要特征。着熊粒指数的 求解依赖于着丝粒定位和染色体长度。我们采用染色体求周长后的骨 架来确定染色体着丝粒位置,然后再来进行染色体着丝粒搬数的计算。 实骏诞唆运耱方法是骞效的。我们提取弗选撙染色体鼹藤秘,周长,着 丝羧豢数 爹为爨嚣分类豹姣摆。 邋j 建大量实验莘疆壤嚣的拐步分类表鲷:在染色体分散怒好,无交叉 的染饿体的情况下,这熄方法是非常有效的。 关锐词:自动染色体分析,阀值,自动分割,特征提取。细化,精丝粒指数 t h e a p p r o a c h e s r e s e a r c ho fc h r o m o s o m e i m a g e sa n a l y s i s a b s t r a c t c h r o m o s o m e k a r y o t y p i n t g 。t h e c l a s s i c a lm e t h o di nt h e t e c h n o l o g y o f c h r o m o s o m eg e n e t i ca n a l y s i s ,i so n eo ft h ei m p o r t a n tm e a n si ng e n e t i cr e s e a r c ha n d s u p p l e m e n t a r yc l i n i e a ld i a g n o s i s 。a n di t st h e nk e yi n d e x 协a n a l y z ec h r o m o s o m e t r a n s l o c a t i o no rd e f t c i e n c y 。a n dd i a g n o s i so fa v a r i e t yo fg e n e t i cd i s e a s e s ,t h eg o a i o fc h r o m o s o m ea n a l y s i si st or e l a t ed e v i a t i o n sf r o mn o r m a ls t r u c t u r et ob i o l o g i c a lo r c l i n i c a le 肌c t s w i t ht h ed e v e l o p m e n to f p a t t e r nr e c o g n i t i o n a n di m a g ep r o c e s s i n g m e t h o d sb e g i nw i d e l yu s e di nm e d i c i n e a u t o m a t i cc h r o m o s o m ea n a l y s i sb e c o m e s p o s s i b l e t h ea u t o m a t i ck a r o t y p i n gw i l li n c r e a s et h e ne f f i c i e n c yo fa v a i l a b i l i t y , a n d r e l a xt h e nm e d i c a lp e r s o n s 。l tc a nb ep e r f o r m e db yt h eo p e r a t o r sw h oh a v en o p r o f e s s i o n a lt e c h n o l o g ya n de x p e r i e n c e s a t t h e ns a m et i m et h e nr e m o t ec h r o m o s o m e a n a l y s i s b e c o m e sp o s s i b l e i nt h i s p a p e r ,p r e p r o c e s s i n g ,f e a t u r e e x t r a c t i o na n d s e l e c t i o n ,a n dr o u g hc l a s s i f i c a t i o na r ep e r f o r m e do n t h e nc h r o m o s o m e i m a g e s s o m e e x p e r i m e n t sa r em a d e t ov e r i f yt h ee f f e c t i v e n e s so f t h em e t h o d s p r e s e n t e d i nt h ep r o c e d u r eo fc h r o m o s o m ei m a g ep r e p m c e s s i n g ,w ec a l c u l a t et h r e s h o l db y t h em e t h o do fg e n e r i cd i f f e r e n t i a t i o nw h i c h 远p u tf o r w a r db yq t s u 。t h ei m a g ew h i c h i sd e a l tw i t hb yt h et h r e s h o l dh a sg o o dd e t a c h e dc h a r a c t e r 。a f t e rt h ep r o c e s s i n go f c h r o m o s o m ei m a g e , u s i n gt h e nm e t h o do ft a b ,w ec a l lf i n i s ha u t o m a t i cd i v i s i o no f c h r o m o s o m ei m a g ea n dg e tt h es i n g l ec h r o m o s o m e s i nt h ea u t o m a t i cp r o c e s s i n go f c h r o m o s o m ed i v i s i o n 。w ee a r le r a s ei m p u r i t ya n d s a v ec h r o m o s o m e st h a tw ew i l ln e e d t o l a b e l i n t h ee n d a r e a ,g i r t h c e n t r o m e r i n d e xa r e i m p o r t a n t f e a t u r e s i n i d e n t i f y i n g t h e c h r o m o s o m e s f i n d i n g t h ee e n t r o m e ri n d e xd e p e n d so nf i n d i n gt h e nc c n t r o m e r ea n d 钮el e n g t ho f t h e nc h r o m o s o m e ,w ef i n dt h e nl o c a t i o no f c e n t r o m e rb yt h ef r a m e w o r k w h i c hi sp r o d u t e da r e rt h ec a l c u l a t i o no f g i r t h ,t h e nw e c a nc a l c u l a t ec e n t r o m e ri n d e x , t h ee x p e r i m e n tr e s u l t si n d i c a t et h i sm e t h o di sg o o d ,w es e l e c ta r e a ,g i r t h ,c e n t r o m e r i n d e xt oc l a s s i f yt h ec h r o m o s o m e s t h ee x p e r i m e n tr e s u l t si n d i c a t et h a t ,i ft h ec h r o m o s o m e so nt h e ns l i d ei s o l a t i o n e a c ho t h e r ,a n dt h e r ea r en oo v e r l a p p i n gc h r o m o s o m e s , t h ea b o v em e t h o d s a r eq u i t e e f f e c t i v e + k e y w o r d s :a u t o m a t i c :c h r o m o s o m ea n a l y s i s t h r e s h 0 1 d 。a u t o m a t i c d i v i s i o n , f e a t u r ee x t r a c t i o n ,t h i n i n g ,c e n t r o m e ri n d e x 昆明理工大学学位论文原创性声明 本人郑重声明:所呈交的学位论文。是本人在导师的指导下进行 研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含 任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做 出重要贡献的个人和集体,均已在论文中作了明确的说明并表示了谢 意。本声明的法律结果由本人承担。 学位论文作者签名:专制瓷 日期:2 0 0 3 年3 月7 日 昆明理工大学硕士学位论文 染色体图像分析技术研究 第一章绪论 本论文的主要研究对象是生物医学中人类细胞染色体等物质的显微图像。染色 体是生命物质d n a 的载体,它存在于细胞核内,控制着生物的形状,生长和繁衍,生物 学家将其称为“生命的蓝图”( 2 4 】。 1 1 染色体分析的意义 染色体是细胞在有丝分裂时遗传物质存在的特定形式,是细胞间期染色质结构 紧密包装的结果。核型是指染色体在有丝分裂中期的表现包括染色体数目,大小。形 状特征的总和。染色体核型分析是在对染色体进行测量计算的基础上,进行分组,排 队配对并进行形态分析的过程。 1 】1 为什么研究染色体 近代细胞遗传学阐明:在人体各类组织中,细胞的各种成分及其结构,虽然其组织 的功能不同,差别较大,但细胞核内的染色质却保持相对恒定。在代谢细胞中它呈松 散螺旋分布在细胞核内;在细胞分裂中,它经过多级的螺旋化,形成在显微镜下可清楚 地辨认的4 6 条染色体。这4 6 条染色体,按长短及形态可分为a ,b ,c ,d ,e ,f , g 七组2 3 对。 在2 3 对染色体中,有2 2 对是男女相同的,称为常染色体,编号为1 - 2 2 ;仅一对是男女不 相同的,称为性染色体:女性的两条命名为x 染色体;男性一条为x ,另一条命名为y 染色体。 在体细胞分裂中,4 6 条染色体有规律地进行复制,而后均等地分给两个子细胞,所 以子细胞也保持了4 6 条染色体。在性细胞成熟分裂中,通过减数分裂,精子和卵子各 含有2 3 条染色体,再通过精卵结合又恢复4 6 条,从而保持了亲子代个体闯染色体的恒 定性。 所以,就子代的成对染色体面言,它们条来自父方,另一条来自母方。父亲的x 染色体仪能传给女儿,通过女儿复制给外孙,父亲的y 染色体仅能传给儿子,儿子的x 染色体只能来自于母亲。 可见,染色体是遗传因子的载体,研究染色体便成为我们在细胞水平上认识遗传规 律,遗传物质的突变,遗传病的发生的一个重要学科一人类和医学细胞遗传学。 昆明理工大学硕士学位论文染色体图像分析技术研究 1 1 染色体核型图 1 1 2 染色体核型让我们了解到什么【2 3 1 一个检测人类染色体的简单方法是查看染色体核型。许多人类疾病,畸形都是 染色体缺失,破坏,额外增多而直接导致的结果。细胞学家能够从染色体核型中确定 许多这些染色体的畸形。 根据染色体的相对大小,着丝粒的位置,臂的长短,次缢痕及随体的有无等带型 等特征,把某种生物体细胞中的全套染色体按同源染色体配对,依次排列起来,就构 成了一个个体的核型。正常核型男性为4 6 ,x y ;女性为4 6 ,x x 。染色体核型是指我们 包含1 0 0 ,0 0 0 条基因的所有d n a 的组图。 1 1 3 染色体核型分析 作为遗传载体的染色体,其数目,形态的恒定是维持生物体遗传性相对稳定的必 要条件。故而对染色体的数目,形态的研究是作为临床科室常规检测方式之一染色 体核型分析,染色体遗传分析技术的经典方法,是跗学科学研究和辅助l 临床诊断的重 要手段之一,是分析染色体易位,缺失,诊断各种遗传病变的关键指标。染色体核型分 析对于探讨人类遗传瘸的机制,物种亲缘关系与进化,肿瘤病理学研究及诊断都有重 要意义1 6 , 9 j 。 染色体分析( 核型分析) 是一个临床诊断。辐射损伤估计和生物学研究领域的重 要而且困难的任务。染色体分析的日的就是要确定细胞或个体的染色体组成,尤其 是要将其与正常结构间的偏差和生理的或临床疾病关联起来。细胞分裂中期染色体 的核型是一个很缓慢和很繁重的过程,首先,培养样本组织的细胞,然后培养物用来 准备显微切片。第二,在准备好的显微切片上定位合适的中期分布,并用c c d 摄像机 以数字的形式捕获,细胞遗传学人员人工按他们的形态和带型将单个染色体分离,再 昆明理工大学硕士学位论文染色体图像分析牧术研究 将它们粘贴到一个模板以产生最后的核型图。然后分析核型图来检查是否可能有遗 传疾病而这大部分时间都用在了显微镜上,这是个烦琐的任务,又需要对细节十 分注意,并且是高度重复性的工作。而且,这显然还需要完全合格,也就是经过严格培 训的人员来操作。就是在今天染色体分析也是细胞遗传学广泛应用为诊断工具的一 个限制因素。 人体细胞遗传学的发展十分迅速,人类染色体研究亦被广泛应用于基础理论研 究,临床病例的检查与诊断,传统细胞遗传学从取材到镜观察,一系列费时的操作给技 术人员带来诸多不便。在当今的信息时代,这样的操作方案显然已经不合时宜。 所以采用自动化的染色体识别手段,利用计算机系统强大的计算功能。将染色 体分析的方法转化为计算机算法进行的自动处理,以达到染色体分析的自动化,这会 大大提高工作效率,也减轻了医护人员的负担,并且不依赖于工作人员的状况。工作 人员也不需要有专家级的技术和经验。 1 2 染色体分析技术现状 染色体分析中所用的细胞通常取自于周围血液。羊水或骨髓样本。它们被激励 而生长。分裂并在两兰天后这种生长就停止了。留下各种生长状态的细胞。只有在细 胞分裂期并用适当染色的染色体才能通过显微镜观察到,它们是独立的个体,大致有 3 微米长。适合于分析的染色体是处于分裂中期状态下的染色体。在2 4 c m 显微切 片上仅有一小部分细胞处于分裂问期。用一中等放大的接物镜,在显微切片上足够 大的区域就能够找到适合于分析的细胞。传统的核型分析系统,先对染色体进行计 数。然后再每对进行识别,检测是否有大小或显带模式的异常。这也和接触与交叉染 色体的频频出现混淆。另一个混淆染色体分析的事实是染色体的异常,如镶嵌现象, 不同的遗传缺陷。 自动染色体分析的目的是产生染色体核型图( 染色体以一指示模式排列的图像) , 而没有操作者的干预。然而,由于该分析的最终结果是以医学观点对一个体遗传构成 的非常重要的陈述,所以要由严格培训的人在计算机的协助下做出临床的决定,还有 技术上的难题,如分离接触的染色体和定位着丝粒都使人类的干预成为必要的一部 分。由于以上的原因,所有经济可取的自动染色体核型分析系统,实际上都是半自动 化的,需要人的干预来完成某一项任务。 然而,一个完全自动化系统被证明是一有用的研究工具可以用来测试不同组成 的算法。也能自动评估对整个a k s 系统性能的影响,由于很难预计系统不同部分间 的相互作用。 昆明理工大学硕士学位论文染色体图像分析技术研究 1 3 现有染色体自动分析系统 染色体自动分析是每个细胞遗传学工作都梦寐以求的,方便及时的染色体异常 核型专家会诊也是人们盼望已久的。近年来国内开发出了不同版本的染色体自动化 系统软件。也引进了国外不同厂家的染色体自动分析系统。国内的染色体图像分析系 统有北京中科恒业公司的通用医学图像处理系统,重庆天海公司研制的r t s s 2 0 1 0 染色体组型分析系统。天地公司的”t d - 2 0 0 0 染色体图像分析系统”,等等。国际上,哥 伦比亚密苏里大学病理实验室癌症研究中心研制的一自动核型分析系统中,染色体 的分类识别中存在的问题在于:对于染色体间有交叉时图像的分割问题,单个染色体 有旋转,扭曲或弯曲等情况下染色体形状特征的提取;以及一些遗传缺陷的核型分析 时染色体的数目及形态都有所不同。俄罗斯的v i s u s i m a g i n g 所研制开发的商用 染色体自动核型分析系统实现的功能:阐值化,交驻染色体的分割。分类,最后得到细 胞的染色体核型图和对应染色体的特征。a t h e n a 系统用基于m a c i n t o s h1 1 个人计算 机的经济使用装嚣。数字图像处理过程自动将染色体从中期图像中分离出来,并将它 们排成核型图,用相关的染色体长度,着丝粒指数和带模式信息来排列。操作者用直 观的图形界面来监视分析的每一步,来解决分离染色体图像中出现的问题,尽可能将 单个图像排列起来,最后装配成核型图。国外一些现有的自动化染色体分析系统还 有:m a g s c a n ,c y t o s c a n ,a k s - 2 ,o e n e t i s c a n 。前兰系统趋向子全自动化,而后三个系统设 计为交互式的。 以上这些系统大都是半自动化或趋于全自动化的,需要人工干预来完成任务。而 且染色体核型排队的准确性与制备的染色体切片和c c d 得到的中期染色体图片的 质量有关。对分散良好,长度适中,带型清晰,背景均一清楚,无交叉折迭扭曲的染色 体,分类准确率可以达到接近百分这百。相反,则准确率降低。 1 4 论文的主要工作 细胞学家检测染色体的根据有以下三个:染色体的大小,着丝粒位置或带型由此 我们对染色体图像进行分析就是从单个染色体的大小,着丝粒的位置和带型分析着 手通过对细胞分裂中期的显微图像进行处理,提取这些特征,然后用这些特征对染色 体进行分类,进而得到核型图。 本文就是在此基础上,对中期染色体图像预处理和特征提取的方法进行了研究, 并通过实验对染色体相关特征提取的算法进行了研究,目标是实现染色体图像的分 析与识别下面是本文所做的具体工作: 第二章:介绍染色体的相关生物特征及染色体图像的预处理的相关知识,如图像的腐 昆明理工大学硕士学位论文染色体图像分析技术研究 蚀,膨胀,细化,骨架化,粗化,空穴填充等。 第三章:介绍了染色体图像的特征提取,包括阍值计算,染色体图像的二值化,染色体 图像的自动分割染色体面积和周长特征的提取,染色体着丝粒位置的确定,染色体 着丝粒比的计算,染色体着丝粒指数及相对长度的计算。 第四章:4 1 - 绍了染色体自动配对的依据,染色体特征的归化处理,以及实现了染色 体的自动配对。 第五章:对全文进行了总结,给出了研究的结论,并对此做出了讨论 对染色体分析技术以及自动化识别术的发展进行展望。 昆明理工大学硕士学位论文染色体图像分析技术研究 第二章染色体图像预处理 由于从c c d 摄相机获得的原始图像通常含有非孤立的物体( 单个染色体) ,如染 色体群( 既粘连又交叉) ,间期核和噪声( 如染色质和染色粒) 为了得到一个染色体核 型,代表非染色体物质的物体必须除去,并且接触和交叉的染色体必须尽可能地分解 成单个染色体这就要求对获得的原始染色体进行预处理主要的预处理操作为阀值 化,分割和骨架化此外,又由于阀值化分割后的二值化图像存在空穴,或边界存在噪 声,为也下步求解染色体的骨架,在骨架提取前对阀值化后的图像进行空穴填充最 后得到分割后的单个染色体以及它们的二值图像和骨架。 2 1 染色体生物特征 2 1 1 形态特征 1 5 , 1 6 , 1 8 1 各种生物的染色体数目和形态各不相同,其数目和形态的交化会影响生物的功 能,形态和遗传的性状。细胞有丝分裂中期的染色体具有稳定的形态结构特征,它由 两条姐妹染色体单体在着丝粒处相连而成,它包括以下几部分: ( 1 ) 着丝粒和动粒:着丝粒( c e n t r o m e r e ) 把染色体分成两段。一条染色体通常只有一个 着丝粒,在该处,染色体凹陷成主缢痰。近年来的研究表明,着丝粒是一种高度有序的 整合结构,在结构和组成上都是非均一的,至少包含3 种不同的结构域:沿着丝粒外 表面的着丝点构域:中央结构域。这是着丝粒区的主体。由富含高度重序列d n a 构 成:位于着丝粒内表面的配对结构域代表姐妹染色体单体相互作用的位带内。三 个结构相互配合,保证了细胞在有丝分裂中染色体与纺锤整合发生有序的染色体 分离。在主缢痕处两条染色体单体的外侧表层部位具有特殊的结构,称为动粒,是纺 锤丝微管的浆台中心这一。见图2 - 2 ,凹陷处为着丝粒位置。 ( 2 ) 次缢痕( s e c o n d a r yc o n s t r i c t i o n ) :是某些染色体除主缢痕外的另一处凹陷,染色较 浅。次缢痕的数目,位胃和大小,是某些染色体所特有的形态特征。对于鉴别染色体 有很大价值,该处的染色质具有缔合核仁的功能。又称为核仁组织区。被非所有次缢 痕都是n o r 。染色体n o r 是r r n a 基因所在部位,与间期核仁形成有关。 ( 3 ) 随体:某些染色体的短臂末端有呈球形或棒状的结构,称为随体。随体通过次缢痕 的染色质与染色体臂相连,是识别染色体的重要特征。 ( 4 ) 端粒:端粒是染色体来端的特殊化部位,由端粒d n a 和端粒蛋白质组成,有极性, 具有维持染色体结构稳定的作用,保证d n a 的完全复制及参与染色体的空间排布。 端粒d n a 具有特殊的序列,富含g 。 6 昆明理工大学碗士学能论文染色体圈像结折技术研究 圈2 。1 根据着丝粒位鬣的四类染色体和识别一个染色体的特征 此外,根撂着丝粒农染色体上所楚的饿鬣,可穗染色体势为4 季孛类型:中 藿丝粒染色终:驻审麓墼鞋染琶傣;簸壤罄丝裁染色葵;鞴黉丝粒染色髂。 着丝粒彼置染色体符号着熬粒比着丝粒指数 中着熊粒 m 1 0 0 1 6 7o 5 0 0 一o ,3 7 5 、亚中着熊粒s m 1 6 8 7 0 0 00 3 7 4 0 2 5 0 亚磺蔫煞牧 s t3 。o l o 0 0 0 2 4 0 0 。1 2 5 端鬻熊粒 t7 。0 1 0 1 2 和0 0 0 0 表2 1 根据着熊粒位置进行的染色体分类 波长臂长度短臀长度短臂长度染色体总长 2 + 1 2 豢型特征1 8 】 荣琶镩豹不鞫嚣缓毒戳被莱秘絷瓣骞选择逸不嚣豢泼絷毪,毽魏使鸯条染色终 产生特写的带溅,带型可以做为染色体的界标,也有助予箍剐同样大小,形态的染色 体。荧光染料噻阿因插入d n a 产嫩q 带,加热或蛋囱酶处理后的g i e m a s a 染色产生 g 带,c 带等。带裂分析可以鉴定染色体的特定区域,确定染色体断裂,重排的部位。 羯克隧d n a 搽钟与染雹接静特定羰净杂交,能够把遨段定使子染色体特定戆繁上。 荚予势繁静分予慕穑至今还不瀵楚。 2 2 二值图像数学形态学 由于在对染色体图像进行预处理时,大量地用到了数学形态学的知识所以这里 有必要介绍一下数学形态学的基本赋理和方法,它是翻前数字图像处理技术中,几何 特征憝理每分毒蠹麓蘩簧芋致之一。 一个有效的二值图像运算寨爨献数学形态学下的囊合论方法发袋起来的尽管 它的苦苦本运算简单,但它们和它们的推广结合起来可以产生复杂得多的缴果。并且, 它们适合于用桐成的硬件构造查找寝的方式,实现快速的流水线处理并殿,这种方法 昆明理工大学硕士学位论文染色体图像分析技术研究 通常用于二值图像,但也可以扩展到灰度级图像的处理。 在通常情况下,形态学图像处理以在图像中移动个结构元素并进行一种类似 于卷积的方式进行。 2 2 1 二值图像的结构元素 二值图像将灰度信息的变化转换到图像平面上具有值1 的集合的形状和位置 分布对于二值图像,具有1 值的像素可以看成是平面上的点集。具有0 的像素是 背景。 2 2 2 腐蚀与膨胀的变形 般地,重复进行腐蚀运算会将一个物体收缩到不存在,同样重复进行膨胀运算。 会将一幅图像中的所有物体合并成一个。然而,可以改变这些过程以产生更适合于 些应用的结果。 ( 1 ) 收缩 当腐蚀是以这样的方式来实现时,仅余下一个点的物体,这个过程就叫收缩。当必 须要保留物体的总数时,这就很有用。当一幅二值图像包含的物体近似圆时。可以迭 代地用收缩来得到一个大小的分布。它用一个计算图像中单个像素点个数的3 * 3 的结 构元素来执行。每一步,半径减少个像素,并且更多的物体收缩为一个像索大小。记 录下每次迭代中的数目,得到物体大小的累积分布,非常不圆的物体,会在迭代时断开 因此该技术有它的限制。 ( 2 ) 细化 腐蚀可以用个两步的程序来实现,而不使物体断开。第二步是常规的腐蚀旭是 是有条件的;那就是,像素被标记为被移动的可选点,但并不是真的移去。第二步,那 些可选像素就被移去,但不破坏连通性,同时那些不能移动的像素保留下来。每一步 都是一个3 3 的领域操作,这可以构成一个查找表操作。细化将一个非线性的物体减 成单一像素宽的线。表明它的拓扑性质。 f 3 ) 骨架化 和细化有关的一个运算是骨架化,又称作中轴变换。中轴是所有与物体在两个或多 个非邻接边界点处相。从概念上讲,中轴可以用以下的方法来得到。假想。有一块物 体形状的草地,立即沿周边点火。随着火向内部蔓延,那些靠前的火汇合处的点的轨 迹就是中轴。骨架化可以用两步条件腐蚀来实现,和细化的两步相似。然而,移去像 素的规则有一点不同。主要的不同就是中轴骨架将边界延伸到了角处。而由细化得到 的骨架则不同。 昆明理工大学碗士学位论文染色体图像分析技术研究 ( 4 ) 剪切 通常细化和骨架化都产生分支。这是一些短枝,有端点,距交叉点大致有3 个像素。 分支的产生是由于= 值图中的单个像素大小的波动。这可以用一系列移去端点的 3 * 3 运算来移去分支。例如,一个三像素的分支在三次移去端点的迭代后就消失了。 由于没有赖以复原的端点留下所有分支不会被再生成。 ( 5 ) 粗化 膨胀可以这样实现,不合并相邻的物体。这可以由两步完成,和细化相似。另一种方 法就是先求图形的补,然后再对背最进行细化运算。实际上,对图像的补进行运算时, 每个腐蚀运算都同时对应着一个膨胀运算。 一些分割技术趋于很紧地匹配物体的边界,从而避免错误地台并它们。通常,分离 物体的最好边界对于以后的测量来说太紧。粗化可以通过增大边界而不合并物体来 对这进行纠正。 2 3 分割和二值化 我们可以把图像的分割处理定义为数字图像划分为互不相交( 不重叠) 区域的过 程。在此区域是像素的连通集,也就是说。是一个所有像素都有相邻或相接像素的集 合。连通的正式定义为:在一个连通集中的任意两个像索之间,存在一条完全由这个 集合的元素构成的连通路径。连通路径是一条可在相邻像素间移动的路径。因此, 在一个连通集中,可以跟踪在任意两个像素间的连通路径而不离开这个集合。 有两种可供选择的连通性准n :4 连通和8 - 连通。通常8 连通的结果与人的感觉 更接近。 人观察景物时,在视觉系统中对景物进行分割的过程是必不可少的。这个过程非 常有效,以至于使人所看到的并不是一个复杂的景物,丽不过是一种物体的集合体。 但是,使用数字处理,我们必须设法分离图像中的物体,把图像分裂成像素集合,每个 集合代表个物体在数字图像分析中它确实是一个并非轻而易举的事情。 图像分割可以采用兰种不同的原理来实现。在利用区域方法时,把各像素划归各 个物体或区域中。在边界方法中,只需要确定存在若干区域边界。在边缘方法中,则 先确定边缘像索并把它们连接在一起以构成所需要的边界。我们采用区域的方法, 利用阀值化技术来对染色体图像进行分割。因为阀值化对物体和背景有较强对比的 景物分割时特别有用,而且计算简单,也总能用封闭而且连通的边界来定义不交叠的 区域。染色体图像中染色体区域和背景灰度差别较大。所以可以用阀值技术来对染 色体进行粗略分割。 9 昆明理工大学硕士学位论文染色体图像分析技术研究 当使用阀值规则对图像进行分割时,所有灰度值大于或等于某阀值的像素都被 判属于物体,所有灰值值小于被排除在物体之外。 如果感兴趣的物体在其内部具有均一的灰度值并分布在一个具有另一灰度值 均匀背景上,使用阀值方法效果就很好。对于单个的染色体,采用相应的阀值二值化, 阀值的选择有直方图技术和自适应阀值选取。 2 3 1 全局阎值化 采用阀值确定边界的最简单做法是在整个图像中将灰度阀值的值设为常数。如 果背景的灰度值在整个图像中可合理地看作为恒定。而且所有物体与背景都具有几 乎相同的对比度,那么,只要选择了正确的阀值,使用一个固定的全局阎值一般会有较 好的效果。 2 3 2 自适应闽值化 在许多情况下,背景的灰度值并不是常数,物体和背景的对比度在图像中也有变 化。这时,一个在图像中某一区域阀值在其他区域却可能效果很差。在这种情况下, 把灰度阀值取为一个随图像位置缓慢变化的函数值是适宜的。考虑到背景的不同一 性如由细胞质染色较轻所引起的阴影,所以也采用了一种局部阀值化的方法来对染 色体图像进行分 2 4 空穴填充 从图像的获取,传输,存贮,离散化,量化到图像的边界提取或分割,使得最终提取 的边界含有位黉噪声也就是就说,边界点发生随机移动。由于噪声的存在。使阀值化 后的边界有单个像素点的凸起;而由于带的存在使区域内部出现空穴,这使以后提取 的骨架容易带有多余的分支或骨架上出现环所以先对二值化的染色体进行空穴填 充。 2 5 骨架提取 骨架是表示平面物体总体结构的一种紧凑而且有效的方式,二值图像的骨架是 像素的这样一个集合,它的数目最少,但它的拓扑结构却等于原始图像的形状。已经 证明:作为一个形状描述子,二值对象的骨架在许多诸如印刷电路板检测,空气过滤器 中的石棉纤维计数,染色体形状分析,土壤裂缝测量和字符识别等应用中非常有效。 骨架还可以有效地估计物体的空间维数以及方向,还有物体各部分间的关系。在染色 体分析中骨架为以后长度,着丝粒位置以及密度分布函数等特征的计算提供了方便。 目前文献中出现的骨架提取方法有多种,有中轴变换,形态学方法。还有神经网络 的方法等等。但这些算法一旦由于染色体的骨架提取就会出现这样的问题:在染色体 i o 昆明理工大学硕士学位论文染色体图像分析技术研究 的两个端点出现分支。 2 6 细化 利用二值图像的结构着运算也可以得到染色体区域的骨架,取结构元素为圆,经 过若干次腐蚀就可以得到染色体的细化骨架。 2 7 粘连或交叉染色体的分割 2 7 1 人机交互方式 用人机交互方式将粘连和交叉的染色体分开 2 7 2 利用粘连和交叉的特征来分割 密苏里大学病理实验室癌症研究中心所提出的一种方法,先寻找粘连和交叉的 特征。然后再利用特征将它们自动分割开。 一种自动的方法就是先将二值图像腐蚀几次,再计算背景的骨架。用这种方法, 接触染色体用背景骨架可以分开。 另一种方法用轮廓单元来描述聚类的2 - d 形状。然后,在决定聚类块问连接性的 点上定义一些模糊子集。通过选择最近邻凸区域来完成分割。 2 8 本章小结 本章主要介绍了染色体的生物特征及染色体图像的预处理。为后续提取特征的 方便。主要的预处理有分割( 阀值分割) ,二值化,空穴填充和骨架提取。分割所用的类 似于自适应阀值分割的方法,即先用全局阀值化方法,得到全图像的二值图,对二值区 域进行标记,将不同标记的块对应原始图的部分提取,即得到单个染色体图。然后对 单个染色体进行二值化,空穴填充和骨架提取。分裂中期染色体图像经过预处理,得 到了单条染色体,块图像和骨架图,用于以后的特征提取。 昆明理工大学硕士学位论文染色体图像分析技术研究 第三章染色体的特征提取 在上一章介绍了染色体图像的预处理,本章主要介绍特征提取的一般方法。染色 体图像的二值化及自动分割,以及染色体相关特征提取的具体算法。 3 1 特征的重要性 由于原始图像含有大量的数据,如果直接用原始的图像进行识别是不可能的,计 算量很大,所以要对图像进行特征提取,提取出能描述物体分类的特征集合,用该集合 来进行分类识别。则会大大提高分类的效率和正确率。 如果我们耍建立一个识别不同种类对象的系统。首先必须确定应量对象的哪些特征 以产生描述参数。被度量的这些特殊的属性称为对象的特征,而所得的参数值组成了 每个对象的特征向量。适当地选择特征是很重要的,因为在识别对象时它是唯一的依 据。 我们可以把特征分为兰类:物理的,结构的和数学的。人们通常利用物理的结构 特征来识别对象,因为这样的特征容易被视觉融觉以及感觉器官所发现。但在使用 计算机去构造识别系统时应用这些特征有时比较复杂,因为一般说来用硬件去模拟 人类感觉器官时很复杂的,而机器在抽取数学特征的能力则比人强得多。这种数学特 征有统计平均值,相关系统,协方差矩阵的本征值及本征向量等等。物理的和结构特 征的测量及其有效性的分析和具体对象联系十分紧密,涉及到研究对象本身各种物 理规律;在许多实际问题中,物理和结构特征对分类非常重要。在实际构造一个识别系 统时常常把它们作为基本特征而用到分类器的设计中。 文献【1 中指出良好的特征具有以下四个特点:可区别性,可靠性,独立性,数 量少实际应用中特征提取过程往往包括:先测试一组直觉上合理的特征,然后将其减 少成数目合适的最佳集。通常,符合上述要求的理想的特征是很少甚至是没有的。 3 2 图像特征提取的一般方法j 1 3 , s l 一幅图像可以看成一次抽样试验的模式样本,它的维数等于两个坐标分辩率的乘 积,每个象索的灰度值就是该维坐标上的测量值,实际上所说的原始特征。在这些大 量的原始特征里,包含有很多有用信息,但是,还不能直接用于分类,必须提取出少量 有意义的特征。 3 3 染色体图像二值化及自动分割 3 3 1 二值化阀值的计算 在特征提取之前必须把细胞分裂中期的染色体图像转换为= 值化图像,所谓二值 2 昆明理工大学硕士学位论文染色体图像分析技术研究 化图像,是指图像中只有两种颜色,背景为白色。物体为黑色,或反之。而为了实现有效 转换,则涉及到二值化阀值的计算。在图像处理中,目前有着众多的阀值计算方法,例 如:固定阀值化,p 参数法,类判别分析法。在作者开发的染色体特征提取系统中主要 采用的是类判别分析法。这种方法主要是根据q t s u 提出的类判别分析法来寻找阀 值,用该阀值得到的二值化图像,有较好的分离特征,以下是这种方法的阀值计算步 骤: ( 1 ) 计算输入图像的灰度级直方图( 用灰度级的概率函数p h s ( i ) 来表示) ( 2 ) 计算灰度均值( a v e ) 2 j j a v e = ( i - 1 ) e h s ( i ) # e 0 ( 3 ) 计算灰度类均值( a v e ( k ) 和类直方图w ( k ) ) a v e ( k ) = ( i - 1 ) p h s ( i ) i - 0 w ( k ) = p h s ( i ) t - i ( 4 ) 计算类分离指标 q ( k ) = 【a e + w ( k ) - a v c ( k ) 2 w ( k ) + ( 1 - w ( k ) ) 】) ( 5 ) 求使o 最大的k 最佳阀值:t = k - 1 通过该算法计算出的阀值对染色体图像进行二值化时厶自动实现单条染色体中 较小空穴的自动填充,使背景变为白色,单条染色体变成黑色。= 值化后,单条染色体 会出现小量的膨胀。但是我们可以通过对提取的特征进行归一化来消除这种影响。 3 3 2 染色体图像的二值化 染色体图像的= 值化,是染色体特征提取的前提条件之一,通过二值化后的染色 体图像具有较好的分离特性,有得于正确分离出单条染色体。得用第二章介绍的阀值 计算方法计算出的阀值来对染色体图像进行= 值化,图3 1 给出了一幅染色体图像二 值化前后的情况。 昆明理工大学硕士学位论文染色体塌像势折鼓拳研究 嚣3 i = 篷往前爱黔染恕体型像 3 3 3 染龟馋强像懿叁蘩分割 得到_ = = 值后的染色体图像,接下来的工作燕翳是肤= 值他的图像中自动分离出 每一条染色体。在作者丌发的染色体特征提取系统中,对于染色体的分割,主要采用 的是标号法。所谓标号法,就怒图像中不同的物体都有唯一识别的号数。在同一物体 孛,疑有象褰鹣标号聱是一致翡,瑟不同魏蟀乏瓣露嚣不嚣戆标号。邋逑遮耱算法,我 们就可以实现染色体鹜豫中锫条不同染色钵靛鸯麓分离。面盈这耪方法也有一好箍, 那就是:猩燕现染色体的自动分割提取时,还可以对较小的染色体或杂质实行去除,而 保留我们黼甓用米进行以别的染色体,以下介绍避种用得比较广泛的标号号:扫描标 号法。舆体实现算法如下: ( | ) 蓄先避符获左嚣毒,获上戮下豹羟搓。在嚣一蠢审苓连逶魏程程( 获炭缓籀弱豹焘) 标不同的号,不同的列标不同的弩。 ( 2 ) 从左上到右下扫描,如果两个相邻的行中有相避通的行程,则下行的号改为上行的 号。 f 3 ) 从右下剿筮主扫撼,秘鬃鼹个鞠邻麴行中有相逢递豹行程,剿上毒予豹号数为下毒亍懿 号。 ( 4 ) 再对标过的号进行排列。 通过以上的扫描标号法我们就实现了对染色体图像中不同的染色体标不同的号。这 样我们就w 以实现对染色体阐像的自动分割,同时,通过对相同标号的统计,也可以实 魏去滁絷魏髂串豹筏子。 染色体的自动分割对予安璐染色俸的鸯韵谈舅唾怒非常重要的。邋过辩染色体鹜 像的自动分割自动提取出铘条待识别的染色体,这样,我们就可以利用同一算法来提 取每条染色体的某一特征,而臆由于表示每一染色体的数据量比较小,这样就可以超 昆明理工大学硕士学位论文染色体图像分析技术研究 到分而治之的效果,提取处理的速度,图3 3 显示了图3 2 所示染色体图像分割后的单 条染色体。 图3 2 细胞分裂中期的染色体图像 图3 3 自动分割得到的单条染色体图像 3 4 染色体面积和周长的计算 3 4 1 染色体面积的计算 对于二值图像( 屺黑为l ,白为0 ) ,求其面积是比较容易的,如果背景为白,则只要统 计单条染色体图像中标记为1 的象素的个数就可以得到单条染色体的面积,实际上在 进行染色体图像自动分割时,通过对相同标号的统计就可以求出单条染色体的面积。 3 4 2 染色体周长的计算 对于= 值图像( 记黑为1 ,白为0 ) 周长的测量,通常的方法是对图像的边缘象素作 出标记,然后累计所标记的象素的个数,所得就是图像的周长,对边缘象素作标记,作 者采用的算法如下: ( 1 ) 定义一个二维数组a ( i ,j ) n 昆明理工火学硕士学位论文染色体图像分析技术研究 ( 2 ) 对单条染色体的图像进行从上到下扫描,比较相邻两点的值,如为1 和0 ,则记 a ( i ,j ) _ l ,i ,j 是值为l 的点的坐标。 ( 3 ) 对整幅图像从左到右扫描,比较相邻两点的值,如为l 和0 ,也记为a ( i ,j 卜1 ,i ,j 是值 为1 的点的坐标。 ( 4 ) 累计整幅图像中a ( i ,j ) _ l 的象素,即为周长。 通常以上算法,就可以使染色体的边界象素得以保留,而位于其内的象素则被清 除掉,这样通过统计边界象索就可以得到单条染色体的周长,图3 4 为一条染色体求周 长前后的图像: 乡一乡、| | 乡| | 图3 4 染色体图像 图3 5 染色体边缘骨架 3 5 染色体着丝点的确定 染色体着丝点的确定在染色体特征提取中占有重要的地位,着丝点确定的正确 与否将直接影响到着丝粒比,着丝粒指数和相对长度的正确性。同时,染色体着丝点 的确定也是染色体特征提取中比较困难的一步。在作者开发的染色体特征提取系统 中,考虑了两种确定染色体着丝点位置的方法。一种是通过染色体求周长后的边缘骨 架来确定着丝点位置。另一种是通过染色体的细化骨架来确定着丝点的位置。下面 对这两种算法分别进行介绍。 3 5 1 通过染色体边缘骨架来确定着丝点位置 这种算法的主要步骤如下: ( 1 ) 确定染色体边缘骨架的水平或垂直走向。 如图3 4 右的染色体边缘骨架即为垂直走向。 ( 2 ) 确定染色体边缘骨架的上,下边界对如垂直走向的染色体边缘骨架。 为了处理过程的统计,左边界称为上边界,右边界称为下边界。图4 5 左图中的的a 即 为上边界,b 即为下边界。 ( 3 ) 去除上,下边界上的干扰点所谓干扰点,是指那此位于边界的开始和结束部分,使 着丝点的确定造成错误的点。由于干扰点总是出现在边界的开始和结束部分,因此我 们可以对每一条边界的开始和结束部分分别进行处理。例如对于上边界的开始部分, l b 昆明理工大学硕士学位论文染色体图像分析技术研究 我们可以进行如下处理:选取前十个点p l 到

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论