




已阅读5页,还剩68页未读, 继续免费阅读
(生物医学工程专业论文)微阵列图像自动分析方法的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本文采用的图像分析方法自动化程度很高,无需用户的参与,而且通用性较 好,不仅对于样点反应较强烈的微阵列图像识别准确,而且对于含有大量阴性样 点的图像也能取得较好的效果,不限制图像阵列的排列形式。 关键词 微阵列图像;倾斜校正;网格划分;样点识别 2 英文论著摘要 r e s e a r c ho na u t o m a t i c a n a l y s i sm e t h o d so f m i c r o a r r a yi m a g e s m i c r o a r r a yt e c h n o l o g yi su s e df o r t h es i m u l t a n e o u si d e n t i f i c a t i o no ft h o u s a n d so f g e n e si nb i o i n f o r m a t i c s t h ei m a g ea f t e rs c a n n i n gc o n t a i n sl o t so fb i o i n f o r m a t i c s ,s o m i r o a r r a yi m a g ep r o c e s s i n gi sac r i t i c a lp a r to fb i o c h i pd a t aa n a l y s i s t h ea i mo f m i c r o a r r a yi m a g ep r o c e s s i n gi sg e t t i n gt h es p o t sp o s i t i o n s ,q u a n t i z i n gd a t ao fs p o t s s h a p e sa n di n t e n s i t i e s t h i st h e s i ss t u d i e st h ea u t o m a t i cp r o c e s s i n gm e t h o d so f m i c r o a r r a yi m a g e s ,i n c l u d i n gf o u rp a r t s :s k e wc o r r e c t i o n , g r i d d i n g ,i m a g es e g m e n t a t i o n a n de x t r a c t i o n t h e s k e wc o r r e c t i o ni sb a s e do nr a d o nt r a n s f o r m ,b u tt h ev a l u e sa r et o ol a r g eo f t h e16b i t sg r a yi m a g e sa f t e rr a d o nt r a n s f o r m i nt h et h e s i s ,t h es p o t s b o u n d a r yi s e x t r a c t e db ys o b e l ,t h e nc o m p u t i n gt h es k e wa n g l eb yr a d o nt r a n s f o r m b o u n d a r y e x t r a c t i o nc o u l dr e d u c et h ei n f o r m a t i o no ft h eo r i g i n a li m a g e ,s ot h ec a l c u l a t i o ni s r e d u c e db u tt h es k e wa n g l ei sg o tc o r r e c t l y g r i d d i n gi sb a s e do nt h ep r o f i l ea l g o r i t h mt og e tt h es p o t sp o s i t i o n si nt h ei m a g e t h et r a d i t i o n a lp r o f i l em e t h o df o rg r i d d i n gi sa u t o m a t i cb u tm a yh a v ea b s e n ta n d r e d u n d a n tl i n e se a s i l y t h ei m p r o v e dm e t h o dc o m b i n e st h es t a t i s t i ct h e o r yt op r o f i l e s i g n a l s ,m a k i n gt h eg r i d d i n gw i t h o u ta b s e n c ea n dr e d u n d a n c y ,e v e nt ot h ei m a g e s w h i c hh a v em a n yn e g a t i v es p o t s g - r i d d i n gc o u l dm a k es u r et h es p o t sp o s i t i o n , t h e n u m b e r so fr o wa n dc o l u m n , t h er a d i u so fs p o t s t h e ya r ei m p o r t a n tp a r a m e t e r si nt h e s e q u e n ta n a l y s i s t h ei m p r o v e dm e t h o da r ea l s ou s e dt om a n yk i n d so fm i r o a r r a y i m a g e s ,i n c l u d i n gd i f f e r e n ta r r a y s ,d i f f e r e n ti n t e n s i t i e s ,a n dg e t t i n gg o o dr e s u l t s al o c a lt h r e s h o l di sc h o s e ni ni m a g es e g m e n t a t i o n , a n di ti s c o m p u t e d a u t o m a t i c a l l yb yo t s ua l g a r i t h mi ne v e r ys u b r e g i o nw h i c hh a so n l yo n es p o ta tm o s t t h el o c a lt h r e s h o l dm a k e st h em i c r o a r r a yi m a g eb eb i n a r y b e c a u s et h ei m p u r i t ya n d n o i s ec o u l di n f e c tt h es e g m e n t a t i o n , t h eo p e na n dc l o s eo p e r a t i o n so fm o r p h o l o g ya r e u s e dt ot h es u b r e g i o nf o re x c l u d i n gt h en o i s e s t h e nt h es p o t sa r ei d e n t i f i e db yt e m p l a t e m a t c h i n gt og e tt h es p o t s r e g i o n s c o m p a r i n gw i t hr e g i o ng r o w i n ga l g o r i t h m ,t h e t e m p l a t em a t c h i n gc o u l dg e tt h es a m es h a p eo ft h es p o t s ,w h i c hi sp r o p i t i o u st o 3 c o m p a r et h er e a c t i v ei n t e n s i t i e so f d i f f e r e n ts p o t s t h eb i n a r yi m a g ea f t e rs e g m e n t a t i o ni sm u l t i p l i e dw i t ho r i g i n a li m a g e ,s ot h e r e s u l t so n l yh a v et h ei n f o r m a t i o no ft h es p o t s r e g i o n s b u tt h er e g i o ni n f o r m a t i o n a l s oi n c l u d e ss o m e t h i n gi nt h eb a c k s ot h ef m a lp a r ti ss p o t se x t r a c t i o n ,a n dt h em e a n o ft h eb a c ks h o u l db eg o ta tf i r s t t h e ya r ec o m p u t e di ne v e r yl o c a lr e g i o n , b e i n gm o r e a c c u r a t e t h ef i n a lr e s u l t si ss t o r e di nat w od i m e n s i o na r r a y ,t h es i z eo ft h ea r r a yi st h e s a m ea st h em i c r o a r r a y s ot h ea r r a yc o u l ds t a n df o rt h es p o t so fd i f f e r e n ti n t e n s i t i e s c l e a r l ya n dq u a n t i f yt h eb i o l o g yi n f o r m a t i o n t h em e t h o d so ft h et h e s i sa r ev e r ya u t o m a t i c ,w i t h o u tm a n u a lo p e r a t i o n , a n dc a n b eu s e dt om a n yk i n d so fm i c r o a r r a yi m a g e s t h ea r r a yo ft h ei m a g e sh a v en ol i m i t ,s o t h em e t h o d sa d a p tt ot h em i c r o a r r a yi m a g e s k e y w o r d s m i c r o a r r a yi m a g e s ;s k e wc o r r e c t i o n ;g r i d d i n g ;s p o t sr e c o g n i t i o n ; 4 中国医科大学研究生学位论文独创性声明 本人申明所呈交的学位论文是我本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得我校或其他教育机构的学位或证书而使用过的材料,与我一同 工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并 表示谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 论文作者签名:剖整日期:型2 :圭:卫 中国医科大学研究生学位论文版权使用授权书 本人完全了解中国医科大学有关保护知识产权的规定,即:研究 生在攻读学位期间论文工作的知识产权单位属中国医科大学。本人保 证毕业离校后,发表论文或使用论文工作成果时署名单位为中国医科 大学,且导师为通讯作者,通讯作者单位亦署名为中国医科大学。学 校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许 论文被查阅和借阅。学校可以公布学位论文的全部或部分内容( 保密 内容除外) ,以采用影印、缩印或其他手段保存论文。 论文作者签名:圭:! 垒 指导教师签名:鍪望丝 日 期:竺1 2 :皇:三! 论文 第一章绪论 1 1 生物芯片与微阵列技术 生物芯片( b i o c h i p ) 与微阵列( m i c r o a r r a y ) 是一大类目前仍主要处于微米级 的微观生物技术装置的统称。生物芯片中的“芯片”概念与微电子学领域中基于硅 等半导体材料的芯片是有很大不同的。微阵列技术只是广义的生物芯片技术的一 个分支,但它代表了目前唯一得到大规模商业化应用的一类技术。目前常见于媒 体报道的d n a 芯片、基因芯片等名词都属于微阵列的范畴。不妨把广义的生物芯 片和微阵列技术定义为:通过微米或纳米级的先进制造技术,在极小的面积上或 极小的体积里密集排列与组合多种生物样品进行高效并行与串行检测和处理,或 控制和输出某些特定的生物学效应与生物信息【l 】。 微阵列技术提供了可以同时分析成千上万个基因表达的方法手段。通常微阵 列是利用在芯片上固定的序列与荧光标记的、来源于细胞的r n a 逆转录e d n a 杂交进行分析。 有关生物信息基因表达的微阵列分析包括如下几个步骤【2 】: a 阵列的构建:点在芯片上的d n a 可以是c d n a ( 部分或全序列) 、基因组 d n a 或化学方法合成的寡核苷酸序列。 b 探针制备:r n a 是从样品中提取的,而c d n a 是逆转录的产物,接下来 是将来源不同的荧光标记探针合并在一起。 c 探针与阵列杂交:将来自两种样品的探针混合然后再固定阵列上与互补序 列结合。与传统的核酸印记杂交一样,选择高特异、低背景的条件,没有 结合的探针在扫描前被洗去。 d 扫描和检测:杂交后的阵列通常用激光共焦扫描仪检测,监测得到的信息 可以存储在计算机中进行分析和图像重建。 e 标准化和数据分析:用特殊的软件将扫描获得的荧光图像中样点的数据进 行量化,并对不同样点的数据进一步分析。 上述的微阵列分析步骤如图1 1 所示 5 镧作芯片 将可识别分子以 点阵的形式固定 予芯片表颟 从血液或组织 中提取样品分 一子 用荧光 去标记样 品分予 万 i 2 :。d t _ i - 。_ 样品分子与固定在基片 上豹可识别分子杂交 生物芯片的 洗涤 耀生物芯片检测仪 对芯片荧光图像进 行检测与分析 获得生物信息 图1 1 ,微阵列分析步骤 1 2 微阵列图像的采集与处理 1 2 1 微阵列图像的采集 所有的微阵列上反应后的荧光须经生物芯片扫描仪来分析其上的荧光强度和 分布。生物芯片扫描仪的作用是得到采集杂交后的芯片荧光信号,形成芯片图像, 并检测图像上每个点的荧光信号强度值。其操作过程如下【3 1 : a ,将杂交、洗脱后的芯片放置于载片台上; b , 设置扫描参数; c ,确认其已经置于初始位置,一般采用粗扫确定矩阵区域; d ,调整扫描参数和扫描区域进行精扫,获得芯片图谱; e ,软件分析得到的每个基因的信号值,再进一步分析其表达特性。 生物芯片与样本杂交以后,用图像扫描仪捕获芯片上的荧光图像。在计算机 中,一幅图像由二维像素点所组成,通常用1 个8 - b i t 的整数存储像素点的灰度值, 6 取值范围为 o ,2 5 5 ,其中o 代表“黑”,2 5 5 代表“白”。然而现在许多生物芯片扫 描仪大多采用1 6 - b i t 的t i f f 格式存储图像,每个像素的灰度值在0 - 6 5 5 3 5 的范围 内。在芯片图像中,每个样点的平均灰度值就对应着相应核酸序列的杂交量。微 阵列图像处理的目的是定位每个样点,将每个样点所对应的不同形状和强度的杂 交量化,并将得到的一系列数值形成表格。 1 2 2 微阵列图像的特点 一个理想的微阵列图像具有以下几个性质:( 1 ) 微阵列样点的形状和尺寸相 同;( 2 ) 样点阵列呈现整齐的排列形式;( 3 ) 无灰尘杂质等引起的污染信号;( 4 ) 最小和均匀的像素背景强度。 但是由于生物芯片实验中有很多导致误差的因素存在,使得实际的微阵列图 像和理想图像是不尽相同的。例如难免有灰尘的污染,扫描得到的图像有的并不 “干净”,存在较大的杂质亮点或者部分区域的污染。在芯片生产过程中,由于一 些机械方面的原因,例如点样仪器的不精确和放置基片的托盘的稳定性不好,会 使信号点位置偏移;点样针几何形状的差异,使点样时d n a 溶液的液滴大小不同, 这些因素使样点的形状可能与设计的形状相差很大;另外,还有一些系统性的因 素,会使得到的图像含有较强的系统噪声。因此噪声污染严重并且不规则是微阵 列图像的一大特点。 弱信号点是基因芯片中的一个常见现象,有些弱信号点所对应的基因在生命 活动过程中表达量低,但是却有着非常重要的作用,但是由于这些点在芯片中的 强度值很低,往往会被忽略或者很难识别。对于灰度值弱的样点,即使是人为的 主观识别,也存在很大的随机性,对于计算机自动处理与分析,怎样判断弱样点 和正确处理这些点,一直都是芯片数据处理的一个难题,需要找到一个更好的方 法,充分提取这些点中所蕴含的信息。 微阵列图像的样点一般是大小固定的圆形,它们在芯片中的位置也是固定的。 但是由于芯片制备和杂交的原因,每个样点的形状、大小以及位置都可能发生变 化,这影响解释芯片图像。为了得到可靠的基因芯片检测结果,必须对微阵列图 像进行处理,减少非信号样点荧光强度的影响。 微阵列图像处理本质上是克服影响芯片和样点质量的因素。质量影响因素主 7 要存在于四个方面:一是背景噪声和杂质;二是样点的不规则排列;三是样点形 状和大小的不规则;四是样点内部灰度不均匀。 1 2 3 微阵列图像处理的关键问题 目前d n a 微阵列最广泛的应用是大规模研究生物基因的表达。有时,一次生 物芯片实验会产生成千上万个数据,这些数据不能直接揭示生命现象,必须转化 成数字,并以生物信息有意义的形式进行存储。也正是因为微阵列技术高通量的 特点,才使它成为生物信息研究中采用最多的技术。利用生物芯片的微阵列技术, 系统地研究生物体基因和蛋白表达及其相互作用,在最近几年有了迅速的发展。 然而对生物芯片数据处理和分析方法的研究目前还处于起步阶段,特别是如何快 速、高效、自动地处理大信息量的芯片数据,以适应生物芯片高通量的特性,目 前成熟的方法还不多,这大大降低了基因芯片的分析效率,成为从芯片实验中提 取数据的瓶颈。 由于生物芯片能在载体上进行上百甚至上万个样品点的杂交反应。要满足生 物芯片图像分析技术并行化、高通量的要求,能否实现分析过程的自动化就成为 了研究生物芯片图像分析的关键问题。 生物芯片图像分析方法在保证分析准确性的同时,也需要为研究人员提供方 便快捷的分析模式。目前,大量的生物芯片图像分析工作仍然需要借助研究人员 手动完成。这不但降低了研究人员的工作效率,图像分析的准确性也很难得到保 证。虽然目前已经能通过软件来识别样品点的位置和区域,但整个识别过程仍然 只是半自动化的。这种半自动化的分析方法一般采用自动调节对准网格的方式, 但对于信号较弱或点样位置变化较大的图像,只能由用户手动进行调节对准。 因此,实现全自动化的图像处理分析方法,是生物芯片图像分析的关键问题。 它的成功解决将极大地提高生物芯片分析技术的准确性和效率。 1 3 微阵列图像处理的研究现状 微阵列图像处理本质上是克服影响芯片和样点质量的因素,目的是定位图像 中的芯片单元( 样点) ,将每个样点对应的形状和强度量化,获得样点的灰度值, 将得到的数值形成表格。一般来说,微阵列图像处理主要包括三个步骤。一是网 格划分( g r i d d i n g ) ,目的是将事先根据芯片型号定义好行列数的格子覆盖到芯片 8 上,确定样点的位置。该步骤的计算机自动化是处理海量芯片图像的关键。二是 分割( s e g m e n t a t i o n ) ,这一步是将杂交的荧光信号像素与背景像素分开。三是信 息提取( i n t e n s i t ye x t r a c t i o n ) ,包括计算荧光信号强度和背景强度,还要将背景扣 除,获取样点所代表的生物信息。 许多生物芯片研究机构已开发出一些基因芯片图像处理软件,例如g e n e p i x 、 b i o d i s c o v e r y 、s c a n a l y z e 等。生物芯片图像处理最基本的目标是确定每个芯片单 元的荧光强度。目标虽然看上去简单,但是由于图像中存在污染和杂质是非常普 遍的现象,目前尚没有通用的处理方法。扫描和处理生物芯片图像仍然需要人工 干预,以对齐网格线,保证正确标定每个样点的位置,同时还要能够去除图像上 的污点以及其他形式的图像噪声。 目前国内外很多学者,都致力于微阵列图像处理自动化的研究【4 5 】。针对微阵 列图像噪声的特点,除了传统的均值滤波,中值滤波之外,将数学形态学理论, 小波变换等均用于图像的噪声去除。胡翔宇提出使用形态学中闭开级连操作【6 j , 有助于提高对弱样点信号的识别能力,再进行均值滤波,平滑样点内部的亮度, 便于中心定位。付东翔等人又提出了顺序形态变换的原理1 7 ,它是在数学形态学 的基础上引入的统计方法,将像素灰度在结构元素内进行数据排序,x h w a n g 等提出了利用小波变换对芯片图像去噪的方法【8 】。先对芯片图像进行分解,再对 高频子带系数进行软阈值化处理,低频子带系数不变,从而达到去噪的目的;最 后利用处理后的小波系数重建原芯片图形。 网格划分,目的是对样点进行定位,准确识别每个样点是芯片图像处理另一 个关键问题。霍夫变换是模式识别中自动检测样点的常用方法,但运算速度慢、 耗费内存,而且检测结果很难令人满意。j a i n 给出了基于图像投影的样点定位方 法【9 】,但对于发生倾斜的图像缺乏鲁棒性。肖松山、范世福将生物芯片图像的样 点分成“圆域”,“圆环”和“不规则区域”三类【l 们,并相应利用“模板匹配法”、“霍夫 变换法”和“形心法”等三种自动识别算法进行芯片图像样点识别。c e e c a r e l l i 和 p e t r o s i n o 在圆形霍夫变换法的基础上【l l 】提出了方向匹配变换法【1 2 1 ,它基于相关性 的原理,不需要优先边缘检测,能用于不同大小的圆,而且无论是黑或白背景都 能够识别样点。r o b e r t oh r a t aj r 等人根据数学形态学的原理进行自动网格划分【l 3 , 9 采用的是开、闭及形态梯度运算等,但是对于倾斜和歪曲图像,还需要借助人工 方式。此外,m k a t z e r 等人基于m a r k o v 随机场( m i 江:m a r k o vr a d o mf i e l d ) 理论【1 4 】,使用区域增长分割法获取部分网格信息,以此来评价整体网格假设,通 过m r f 标签问题推导出网格的分布,等等。虽然众多学者对于微阵列图像的网格 划分做出了很大的成绩,但是由于有些图像的质量较差,样点杂交程度不均,仍 然缺少一种准确率高,自动化程度强,适应性较好的算法。 微阵列的图像分割,大多是根据样点的几何形状来进行的,比如g e n e p i x , s e a n a l y z e 软件。近年来,大量学者在这方面进行了研究,出现了三类有代表性的 方法:边缘检测法,空间搜索法,基于高斯模型的方法。k i m 等【l5 】采用边缘检测 的方法实现了微阵列图像样点的自动分割,还考虑到了边缘检测会出现分割区域 的内部空洞,并通过局部区域像素密度的统计分析来消除这类问题。空间搜索法 是目前在微阵列图像样点分割中研究最多的一类方法。以区域生长和分水岭为基 础的方法是其中的典型代表。r o b e r t o 等【1 6 1 和a n g u l o 等【1 7 】采用基于说学形态学的 分割方法,在局部区域内完成搜索和匹配,获得样点的最佳区域,这种方法的最 大特点是能较好的抑制噪声对样点分割的影响。基于高斯模型的方法是最近几年 出现的新方法。n o b e r t 等人认为,样点光密度强度分布往往呈现由中心部分向边 缘部分逐渐减弱的形态,样点信号的分布可以看作是一个高斯模型【i 引。通过m 估 计量方法对样点参数进行调整,并对信号分布进行聚类分析,这种方法对出现重 叠的样点也能够准确识别。 生物芯片数据的提取包括信号灰度值提取、背景灰度值提取、背景修正及数 据归一化等。生物芯片的杂交反应是在载体上完成的,经过扫描成像所得到的信 号灰度值会受到载体介质和系统噪声的干扰,因此不能直接对信号灰度值进行表 达分析,必须经过修正,背景消除是最常用的处理方法。 微阵列图像处理与分析不是单一的算法或方法,而是涵盖生物芯片分析全过 程的一系列算法的集合。这个过程涉及到图像分割、图像匹配、几何变换、数学 建模等众多技术。纵观目前生物芯片图像分析的发展,目前的研究更多地局限于 某个环节。但要真正实现高效、全自动的生物芯片分析,需要对分析全过程进行 研究,在各分析环节之间建立有效的联系。实现网格定位、样点分割、表达分析 1 0 i 动串联,将有助于提高生物芯片分析的准确性,真j f 实现高姻 分析。 1 , 4 论文的主要研究内容 一般的微阵列图像处理算法都会包括网格划分,图像分割和靠 而微阵列图像并没有统一的阵列标准,如图1 - 2a 、b 所示,口 :不同。在实验过程中,由于点样扫描等因素,获取的图像有i :将对多种多样的微阵列图像进行自动分析处理。很多图像中f 洧一些| i 性样点,如何区分背景信息与弱信号点是微阵列图像 l 本文着重对含阴性样点的微阵列图像( 如图i 一2 b ) 进行分析女 ,实现完全自动化。 4 - , qf - oe np elo - _ij - p : ab 图1 2 ,微阵列图像 针对当前生物芯片图像分析和数据处理领域所存在的问题, # 列生物芯片图像建立一套快速、高效、自动的图像处理和数$ 将浚方法运用于微阵列芯片的数据分析,主要的章节安排如1 第二章,微阵列倾斜图像的校正,将图像采集过程中造成的m l 。 第三章,准直微阵列图像的网格划分,以网格的交叉点确定 自动获得微阵列的重要参数。 第四章,图像分割,将包含生物信息的样点像素与背景像素分离。 第五章,信息提取,包括计算样点内的平均强度和背景强度,还要将背景扣 除。 1 2 第二章微阵列图像的倾斜校正 2 1 引言 生物芯片在实际的点样过程中由于外部因素的影响,扫描图像往往会出现一 定程度的倾斜和旋转,破坏了图像准直规则的特点,增加了后续网格划分部分的 复杂度,会对图像的自动识别和分析造成影响。通常引起微阵列图像发生倾斜的 原因包括: 1 、在点样过程中形成的倾斜,由于点样仪机械臂精度的限制以及点样探针在 机械外力的作用下在玻片上形成的点样漂移造成的。 2 、在扫描过程中形成的倾斜:由于扫描仪扫描过程中的机械振动以及载物台 的芯片槽与芯片之间存在的物理尺度的偏差所造成的。 3 、芯片载体的制作工艺达不到要求:作为杂交反应的载体,芯片载体应当是 一个理想的准直矩形,然而由于制作工艺的限制,非准直的芯片载体常常被应用 到生物芯片实验当中,造成了点样和扫描所形成的图像的倾斜。在实际使用中, 芯片制作工艺是影响图像质量的主要因素。 倾斜校正,就是将倾斜一定角度的图像校正为准直的图像,这一过程的关键, 就是寻找图像倾斜的角度。对于各种不同阵列的图像而言,自动准确的确定图像 倾斜的角度,成为研究的重点。 d e n gn 根据准直图像投影波形的能量谱密度在高频部分能表现出最大分布, 对倾斜图像实现了自动校正【1 9 1 。但其对图像的每一个步长均进行能量谱密度的计 算,每次都需要傅立叶变换,计算量比较大。g h i s l a i nb i d a u t 2 0 1 等先对图像在1 0 。 到1 0 0 之间每2 0 计算水平和竖直方向的投影,将相关的投影信号进行傅立叶变换。 通过对图像在最大尺度的傅立叶变换值来确定倾斜的角度。在这样粗略的首次校 正后,再对1 0 到1 0 之间每隔o 1 0 重复此算法,来实现更精确的校正。但基于投 影的方法需要对图像的每行每列都进行积分求和,再进行傅立叶变换,对于处理 信息量较大的微阵列图像,在运行效率上是极大的挑战。 本文倾斜校正的算法是基于r a d o n 变换的原理,进行了相应的改进,将边界 提取应用近来,减少了对图像的运算量,提高了运行效率。 1 3 2 2r a d o n 变换 对图像在不同角度下计算投影值,实质上就是对图像进行r a d o n 变换。 r a d o n 变换是用来计算图像矩阵在某方向上的投影的函数,它将图像映射到 投影空间。在图像分析领域,r a d o n 变换多用于计算x 射线成像,通过x 射线获 得原始物体的投影,运用r a d o n 变换对这一过程进行建模。二维图像f ( x ,y ) 的 r a d o n 变换被定义为【2 1 】: r 力( s ,) = _ l 厂( x ,j ,) 万o c o s + y s i n - s ) a x a y 公式( 2 1 ) 其中6 为单位冲激函数,结果当中的s 是不同的坐标位置,矽是角度。 r a d o n 变换计算以矽角度穿过图像长度上的积分,实质上就是图像在矽角上的 投影积分值。我们对芯片图像在水平方向一定范围内进行r a d o n 变换,每一个矽角 度对应一系列的结果r 值,r 值还与不同角度上坐标轴的位置有关。我们计算不 同角度下r 值的平方,再对其求积分,即累加和,其峰值对应的角度,就是图像 的准直方向瞄】。 r ( 矽) = 陋2 ) ( j ,矽) 凼 公式( 2 2 ) 对图2 1 所示的原始图像水平方向+ 5 0 和一5 0 进行r a d o n 变换,夕值以0 0 5 的步长递增,公式( 2 1 ) r a d o n 变换的结果如图2 2 所示。横轴表示角度矽,纵 轴是坐标位置s ,计算的结果r d 值以不同亮度的颜色来表示,值越大,颜色就 越亮。r a d o n 变换是以图像的中心为原点的,因此s 的值存在正负的差异。在图 2 2 中,标示出了一点的坐标位置和r o 值,r f ) 值达到了6 5 8 7 x 1 0 6 。按照结果 进行公式( 2 - 2 ) 计算,由于数值太大,已超过了表示范围,产生溢出,因而并不 能得到函数r 。 1 4 :。: :。:- :i :“:o 。 图2 - 1 ,原始图像 8 5 8 1 鹕 9 0 9 1 9 28 3叫孵 图2 - 2 ,r a d o n 变换结果 为了解决这一问题,本文提 上j 了对图像进行边界提取的操作,将原图像的信 息量降低,以便进行r a d o n 变换。 2 3 边界提取 图像边界意味着图像中一个区域的终结和另一个区域的开始,图像中相邻区 域之间的像素集合构成了图像的边界。图像的边界具有方向和幅度两个特征。沿 边界走向,像素值变化比较平缓,而沿垂直丁边缘的走向,像索值则变化比较剧 啪 埘 功 。 猫 枷 咖 像处理得较好瞄】。它使用两个如下有向算子( 一个水平的,一个是垂直的) ,每一 q = 三蚤季q = 三三三 i g ( x ,y ) j m a x ( 1 q i ,| q i ) 2 4 实验结果 1 6 : 。 曩:曩1 i :;援。一;“! | 0e 一1 :e 。 。 罔2 _ 3 ,s o b e l 算r 边界提取 刈图2 - 3 进行水平方向r a d o n 变换,所得结果r 函数和r 函数分别如罔2 - 4 , 2 5 所示,由公式( 2 - 1 ) 求得的r 闻数,数量级明显降低,_ l 在蚓2 - 4r i 也能州 显看在某个角度域的r 值均较大。根据公式( 2 - 2 ) ,求得r 函数值最大的 化霄,其对应的弁j 度就址图像准d 方向。 口 9 09 19 29 3 9 4 9 5 罔2 _ 4 ,边界提取后r a d o n 变化 脚 邶 彻 。 抽 佃 咖 圈2 5 ,边界提取后r 值累加 经过边界提取后,由图2 - 5 可见,r a d o n 变换在某一个角度的累加和有着明显 的峰值。说明在该角度对应的是整齐排列的方向,即图像倾斜的角度。以00 5 的 步长而言,该图像水平方向倾斜的角度是一1 3 。负角度说明进行顺时针方向的旋 转。 如果样点阵列的分布是垂直分布的矩阵,那么水平倾斜的角度与竖直方向倾 斜的角度是一致的。但由于不确定的因素,并不是所有图像的样点阵列中行列夹 角恰好为9 0 度,但一般的偏差并不是很大。因此对峰直方向的倾斜角度也进行了 计算,方法与上述类似,只是角度变化的范围为8 5 。9 5 。,将求得的角度值与水平 方向的倾斜角度取平均值,即认为找到了整幅图像的倾斜角度。r 。对图像进行e r 角度的旋转,得到校正后的准直图像。对图2 - 1 计算竖直方向倾斜的角度是00 5 。, 取平均后图像的倾斜角度o6 2 5 0 。将原图像向相反的方向旋转0 6 2 5 。,校正后的 结果如图2 - 6 所示。 a 原始图像b 校正结果 图2 7 ,校正结果对比 实验表明,s o b e l 算子边界提取后对计算图像的倾斜角度无影响而且边界提 取后对运行效率有了很大的改善。直接对图2 - 1 进行公式( 2 i ) r a d o n 变换耗 时2 13 6 8 秒。而经过s o b e l 算子边界提取后r a d o n 变换耗时为1 6 7 7 秒。边界提 取和r a d o n 变换的时间之和也只有3 0 9 8 秒,经过改进后的运算效率明显提高, 而且还解决了后续计算中的溢出问题。效率提高的主要原因是由于s o b l e 算子边 界提取的操作结果是一个二值图像,而且除了边界信息,其余像素灰度值均为零, 这大大减小了r a d o n 变换投影求和的运算次数,因此能够提高效率,这对于信息 量较大的微阵列图像意义很大。 2 5 本章小结 针对实际生物芯片制备和扫描过程中出现的图像倾斜问题,本章对产生的原 因进行了具体分析,基于r a d o n 变换的原理,将经过s o b e l 算子边界提取后的图 像进行r a d o n 变换,通过对图像在水平和竖直两个方向上的r a d o n 变换的结果确 定图像倾斜的角度,根据所求得的角度来将倾斜的图像校正。 r a d o n 变换用于计算图像的倾斜角度已经有很多应用,但是对于生物芯片图 像,1 6 位的t i f f 格式,对其在不同角度投影求和再求平方的数值非常大,会产生 溢出。因此我们先对图像进行边界提取,再对结果进行r a d o n 变换求取图像倾斜 的角度。这是本文的创新点之一。 该算法对于各种不同的图像均取得了较好的校正结果,而且无需任何参数, 也不需要人为的输入操作,能够实现灵活自动的倾斜校正。 第三章微阵列图像的网格划分 3 1 引言 微阵列图像处理的目的是定位图像中的样点,将每个样点对应的形状和强度 量化,获得样点的灰度值。因此确定图像中样点的位置是首要的问题。网格划分 的作用就是给图像中的每个样点定位,同时也能够获得样点的数目。该步骤是整 个微阵列图像处理过程中至关重要的一步,样点定位的准确与否直接影响着后续 的图像分割和信息提取。而影响网格划分准确性的因素有很多,不同图像中样点 的排列方式不同,样点的大小形状和强弱不同,可能含有大量的阴性样点,再有 不可避免的系统噪声和杂质污染,使得自动准确的网格划分成为微阵列图像处理 中的难点。 通常网格划分的做法是根据芯片阵列的行和列的数目,由计算机自动生成一 个网格,使每个格对应一个样点或者网格行和列的交叉点对应一个样点,这个网 格为每个点提供了一个相对位置的坐标。然后还要对网格中行线和列线进行定位, 确定网格在图像上的位置。但是这种做法会影响图像处理的自动化程度。不需要 人工参与、完全由计算机划格和定位是图像处理的一个目标,因为这样既能加快 计算机处理的速度,又能避免人工参与带来的额外误差。 对于芯片图像的网格自动定位,很多学者作出了相关的研究。但是由于上述 提到的原因,尚没有自动化程度高同时定位准确、适应性较强的网格划分算法。 现有的算法主要分为两类:基于模版的方法和基于投影的方法【5 】。 模版匹配是从图像中寻找已知模式的过程。该类方法根据已知的参数首先定 义目标模版,通过图像相似性度量确定匹配策略,在图像中寻找最接近目标模版 的区域。霍夫变换是模式识别中自动检测样点的常用方法,但运算速度仍然较慢, 而且检测结果很难令人满意。c e c c a r e l l i 和p c t r o s i n o 在圆形霍夫变换法的基础上田】 提出了方向匹配变换法【2 4 1 ,它基于相关性的原理,不需要优先边缘检测,能用于 不同大小的圆,而且无论是黑或白背景都能够识别样点。 基于投影的网格划分的基本思想是将图像所有像素的灰度值分别在直角坐标 系的各轴上进行投影和累加。生物芯片图像投影的形态可呈现明显的波峰、波谷, 与网格阵列分布一致,它可以将生物芯片图像的二维信号分析转变为对一维信号 2 1 的分析,降低了算法复杂度,提高了分析速度。投影算法的主要作用是对生物芯 片图像的能量分布进行重新表达,是很多自动化网格划分算法的理论基础【2 5 1 。但 是基于投影法的网格划分对于弱信号和阴性样点较多的图像容易产生网格线的冗 余与丢失。 d e n gn 根据投影波峰的位置是样点阵列网格节点的原理进行网格划分瞄】。但 是他需要给定的入口参数较多,而生物芯片的微阵列结构又是多种多样的,因此 这在一定程度上影响了该算法的灵活性。李红卫采用数学形态学的图像重构技术 对投影信号进行修正,来削减背景噪音的干扰【2 刀。但是该算法对于阴性样点多的 图像并不适用。 本文在对投影信号进行重构的基础上,又对其进行数学统计学上的优化计算, 自动确定网格的行列间距,以及图像的样点半径等。改进的投影算法甚至对于含 弱信号和阴性样点较多的图像也能取到较好的定位效果。 3 2 形态学重构基础知识 形态学图像处理是将数学形态学作为工具从图像中提取对于表达和描绘区域 形状有用处的图像分量,其语言是集合论。公认的形态学变换限于基本的腐蚀和 膨胀运算,需要指定操作选取的结构元素。而形态学中的测地变换通过迭代循环 直至稳定,不必进行尺度的选择。测地变换涉及两幅图像:标记图像和掩模图像。 这两幅图像必须具有相同的定义域,并且掩模图像必须大于或等于标记图像。 测地膨胀定义【2 8 1 :首先利用基本的各向同性结构元素对标记图像作膨胀运算, 然后将结果图像限制并保持在掩模图像之下。因此,掩模图像起着限制标记图像 膨胀蔓延的作用。假定f 为标记图像,g 为掩模图像( d f = - d g ,且f o g ) ,标记图 像f 相对于掩模图像g 的测地膨胀在尺度为1 时表示为( 力,那么测地膨胀定 义为掩模图像和标记图像的基本膨胀运算艿( 1 ) 间的逐点极小值: 掣( ) = 万1 u ) ag 。由于逐点极小运算,测地膨胀保留了标记图像中小于或等 于掩模图像的部分。 膨胀重构定义:从标记图像f 中对掩模图像g 进行膨胀重构表示为尺;( 门, 其定义为f 相对于个的测地膨胀循环直至稳定:r ;( s o = 掣( 厂) 。其中i 为 掣( ) = “时的循环次数。 形态学膨胀重构是建立在许多数值图像变换基础上的算法,这些算法不需要 选择结构元素及其大小,其主要问题在于选择一对合适的掩模标记图像。通常将 待研究的图像作为掩模图像,理想的标记图像选择可按如下原则: a 期望结果的相关知识 b 图像或目标所表示物理意义的先验知识 c 掩模图像自身的变换 d 其他可能的图像数据 e 用户交互 标记图像通常可根据上述原则的一个或多个结合进行选择,实际中常用的是 第三个原则。 3 3 投影法 基于投影的网格划分的基本思想是将图像所有采样点的灰度值分别在直角坐 标系的各轴上进行投影和累加。由于图像经过倾斜校正,样点阵列呈准直方向排 列,对图像沿水平和竖直两个坐标轴的方向进行投影,含有样点的行( 或列) 由 于荧光强度值较高,投影累加后的波形会呈现明显的波峰;而不含有样点的地方 波形会呈现明显的波谷。根据投影信号波峰与波谷的规则排列,能够确定样点的 位置,样点半径、样点间隔和样点数目。 经过倾斜校正后的图像我们认为是准直的,现分别对水平和竖直两个方向的 投影进行计算。图像水平方向的投影:日p ( x ) = f ( x ,y ) 即是对图像矩阵每一行 ) b 1 求累加和。对图2 1 所示的微阵列图像进行操作,得到投影波形如图3 - 1 所示,由 于该图像样点缺失比较严重,因此波峰与波峰之间的值相差很大,对其进行重构, 图像的重构要求标记图像要小于掩膜图像,且二者大小相等。我们将投影信号h p 作为掩膜图像,h p l 作为标记图像,进行形态学重构【2 刀。h 刃= 日p 一再 万2 专善以( i ) 结果如图3 - 2 p 标,可见对于感兴趣的波峰区域被相应放大,而 波谷的噪声却并没有太大的改变。 图3 - 1 ,水平方向投影图3 - 2 ,水平方向投影重构图3 - 3 ,水平方向投影二值化 对十重构后的水平投影,其波峰的个数即图像中样点阵列的行数,我们还希望 能从中得到样点的行间距与样点半径。波峰个数的确定需要选择一个阈值,太于该 值认为是波峰,在相应的位置上存在样点阵列的行。但是由于不同阵列样点的投影 波形小同,选择二值化的阈值必须根据不同投影信号自动生成,因此需要由自适应 的算法口”,确定一个阈值,将投影波形二值化。自适应的算法是根据信号本身的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 母婴保健考试试题题库及答案
- 2025年中国香文化智能应用师认证考试指南及预测题
- 2025年中职专业课教育教学理论试题预测
- 2025年乡村文化挖掘与旅游品牌建设高级模拟题详解
- 2025年农村金融改革方案设计面试题集预测与解析
- 2025年外贸英语实-用口语教程及对话练习
- 2025年乡镇退役军人服务站工作人员招聘考试案例分析题解析
- 2025年人民银行笔试复习攻略模拟题解题技巧
- 2025年医学影像学考试模拟题集及答案
- 2025年初级产品经理面试题及备考指南
- 2025宁波宁海县国有企业招聘52人考试参考试题及答案解析
- 2025年本科院校团委笔试备考手册
- GB/T 45940-2025网络安全技术网络安全运维实施指南
- 敦煌课件讲解稿子
- 教育与宗教分离课件
- 2025年环境工程师初级职称考试试题及答案解析
- 眼科特检基础知识培训课件
- 高考历史一轮复习资料(人教版)专题二古代中国的农耕经济专题质量检测(A卷)
- 2025 年小升初沈阳市初一新生分班考试数学试卷(带答案解析)-(人教版)
- 统编版高中思想政治必修1第一课社会主义从空想到科学、从理论到实践的发展1.2科学社会主义的理论与实践 教学课件
- 摄影剪辑基本知识培训课件
评论
0/150
提交评论