已阅读5页,还剩52页未读, 继续免费阅读
(通信与信息系统专业论文)基于图像识别技术的应用系统研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 本文从整体上介绍了“生物芯片识别系统”及“填涂卡识别系统”的设计 方案和实现方法,并着重介绍了图像处理及识别技术在这两个系统中的应用。 生物芯片作为一种新的检测手段,被广泛应用于环境检测,临床诊断等各个 领域。如何有效地识别芯片上的斑点样本也成为生物芯片技术中的一个热点问 题。本文实现了医学诊断中常用的血液样本所生成的芯片的有效识别。在识别过 程中采用了自动和交互式两种方案。这两种方案都能有效地识别芯片。并对识别 结果进行相关性分析,最终做出病症判断。 信息卡已成为现代社会中采集信息的一个重要手段,利用图像处理技术识别 信息卡可吐有效减少原来硬件识别所带来的维护费用及升级费用。本文实现了集 图像采集、图像识别及数据分析为一体的“填涂卡识别系统”。 关键词:图像处理图像识别生物芯片填涂卡图像采集 a b s t r a c t t h i s p a p e rt i r s f l yp r e s e n t s t h ew h o l ef r a m e w o r ka n di m p l e m e n t a t i o no ft h e b i o c h i pr e c o g n i t i o ns y s t e m ”a n d “i n f o r m a t i o nc a r dr e c o g n i t i o ns y s t e m ”t h e n i t f o c u s e do ni n t r o d u c i n gh o wt o a p p l yi m a g er e c o g n i t i o nt e c h n i q u ef o rt h e s et w o s y s t e m s b i o c h i p ,a san e wc h e c k i n gi n s t r u m e n t ,h a sb e e nw i d e l yu s e di nc i r c u m s t a n c e e x a m i n i n g ,c l i n i cd i a g n o s i s ,e r e s o ,i ti sah o t s p o tt h a th o w t oe f f e c t i v e l yr e c o g n i z e t h es p o to nt h eb i o c h i p t h i sp a p e rr e a l i z e st h er e c o g n i t i o na l g o r i t h mo ft h ec h i p m a d e b yb l o o ds w a t c h t w os c h e m e s ,n a m e da u t o m a t i ca n d m u t u a l - ,r e s p e c t i v e l y , a t e p r o p o s e di nt h i sp a p e r e x p e r i m e n tr e s u l ts h o w t h a tt h e s et w os c h e m e sc a n e f f e c t i v e l y r e c o g n i z eb i o c h i pa n da n a l y z er e c o g n i t i o nr e s u l t s ,p r o v i d i n g a p p r o p r i a t ed i s e a s e j u d g e m e n t i n f o r m a t i o nc a r dh a sb e e na ni m p o r t a n ta p p r o a c hf o rc o l l e c t i n gi n f o r m a t i o ni n m o d e ms o c i e t y m a i n t e n a n c ea n d u p g r a d i n gf e ew i l lb el a r g e l yr e d u c e di ft h ei m a g e p r o c e s s i n gm e t h o d i su s e df o rt h er e c o g n i t i o no fi n f o r m a t i o nc a r d t h i s p a p e rr e a l i z e s t h e “i n f o r m a t i o nc a r da m o m a t i c r e c o g n i t i o ns y s t e m i n w h i c ht h e d a t ae a r l a u t o m a t i c a l l yb ec o l l e c t e d ,r e c o g n i z e da n da n a l y z e d k e y w o r d :i m a g ep r o c e s s i n gi m a g er e c o g n i t i o n b i o c h i p i n f o r m a t i o nc a r d i m a g ec o l l e c t i o n 第一章绪论 ! _ _ - _ _ _ _ _ _ _ - _ _ _ - _ - - - _ _ _ - _ _ _ _ 一 第一章绪论 随着现代数字图像处理学的发展及对计算机视觉研究的深入,人们越来越希 望能够用计算机代替人进行智能控制一智能操作,从而实现自动化,减少人工参 与。图像处理学及计算机视觉的一个研究目的是使计算机能够通过平面图像处理 识别出其中感兴趣的景物信息,如物体的形状,位置信息,并根据这些信息,做 出判断及引发相应的操作,达到人工智能控制的目的。这种应用在某些场合里为 提供有用信息,提高工作效率做出了很大的贡献,如本文介绍的“生物芯片识别 系统”和“填涂信息卡识别系统”,都将人们从繁杂的劳动中解脱出来。这些应用 都使得系统向智能化方向发展,它们同时也促进了图像处理学科向更深入的图像 理解方向发展。 1 1 1关于生物芯片 1 1 课题背景、目的和意义 生物芯片是以膜、玻璃、硅等固体介质为载体,在单位面积上高密度地排列 大量的生物探针而得到的。当生物样品喷点于基片上时,这些样品与基片上的生 物探针进行杂交或反应,通过放射自显影等方法获得大量有用的生物信息。这些 生物信息表现为芯片上以一种数组阵列方式排列的不同大小与灰度的斑点,芯片 类型不同,斑点的数目也不同。 生物芯片的出现是近年来高新技术领域中极具时代特征的重大进展,是物理 学、微电子学与分子生物学综合交叉形成的高新技术。采用生物芯片技术的目的 是将生命科学研究中的许多不连续的分析过程,如样品制备、化学反应和分离检 测等,移植到芯片中并使其连续化和微型化。用这些生物芯片所制作的具有不同 用途的全功能缩微芯片具有生产成本低、防污染、体积小、重量轻、便于携带等 优点。生物芯片技术正在吸引世界上越来越多的目光。 随着生物芯片大量应用于司法鉴定,环境检测,临床诊断等各领域 1 , 2 1 ,准确 快速的自动识别算法也成为人们研究的热点。其研究的主要内容是使用某些图像 处理方法对经扫描后的生物芯片图像进行相应处理,从而达到最有效的数据提取 并对其进行相关分析表述。本文所研究的“生物芯片识别系统”正是利用图像处 理方法对采集的芯片图像进行分析,获取有效信息,并和已建数据库进行比对从 而进行病症判断的系统。 基于图像识别技术的应用系统研究 1 1 2 关于信息卡 近年来,随着考试种类及各类报名工作的增多,信息量的剧增为信息统计工 作带来了困难。人工统计信息不仅会造成大量人力物力的浪费,并且错误率很高。 正是为了解决这些问题,填涂信息卡应运而生。 光电技术的发展促成了光学标记阅读机的诞生,同时也规范了信息卡的格式。 信息卡是根据读入计算机的信息内容而专门设计的,也是按照o m r 、i c r ( o c r ) 阅读机的设计规范所要求的格式而设计的各种信息录入表格的总称,是发给每一 个填写人的特殊表格,要求填写者按一定要求填写,以便o m r 、l c r 阅读机能够 快速大批量录入。 目前,常用的信息卡包括o m r 和i c r 两种。 ( 1 ) o m r 是识别涂点的方式,用户的要求要便于转化为可选择的选项, 以便设计成o m r 形式的表格。o m r 有5 0 0 r a m 和5 0 8 r a m 两种制 式。 ( 2 ) i c r 可直接识别手写字符,对用户的需求可根据需要设计成0 9 、a 、 b 、c 等空格”口”,让填写入直接书写,对有些选项,也可设计成 o m r 涂点方式,同时也可在书写区直接写汉字等内容,在照片区、 条码阅读区设计贴照片、条码的位置 目前,填涂信息卡已成为社会上统计各类信息的一个重要工具,比如各种报 名,建立档案等等。但如何准确有效地获取卡上的填涂内容也成为推广其应用的 一个重要条件。本文所介绍的“填涂卡识别系统”集成了图像采集,数据处理, 模式识别等技术。为高效准确统计信息带来了便利。 图1 1 ( a ) 是本文所使用的生物芯片图片,图1 2 ( b ) 是常见的填涂卡样本。 1 2 1 生物芯片识别 1 2 目前发展状况 生物芯片技术是八十年代末发展起来的一项新技术,其中的识别部分严格来 说应当隶属于生物信息学的范畴。它包括图像采集,图像处理,数据分析三个部 分。目前国内外都开发了不同的识别系统。而这些系统大多是针对基因组学和蛋 白组学。 中科百奥科技有限公司生产的s c a n i 激光共聚焦生物芯片扫描仪就是一种 集图像摄取,处理及分析体化的产品。它可以适用于疾病诊断、基因表达图谱、 多态性分析及鉴定等。其图像处理模块功能包括平滑过滤,背景处理,样品斑点 第一章绪论 识别及数据提取、存储和显示。数据分析模块包括数据库处理。统计学分析和生 物学分析。还有其它公司生产的识别仪,都包括这三个模块,只是在图像数据的 表达形式上略有不同。 ( 8 ) 生物芯片 图1 1 图片样本 ( b ) 填涂卡 美国i m g g e n e 公司的芯片分析系统是一个纯软件,不涉及图像采集部分。其 界面为人机交互式界面,能分析低质量的图片,适用于各厂商生产的芯片,并且 可以用于任何系统( w i n d o w s ,l i n u x 等) 。但其系统集成度很大,要求存储各 厂商生产的芯片模板,对运行配置的要求也较高。 1 2 2 填涂信息卡识别 填涂信息卡格式的确定是由于光电技术的发展及光标阅读机的出现。因此, 在填涂卡识别上,目前国内所使用的都是利用光电原理的硬件识别阅读仪光 标阅读机。 光标阅读机( o m r ) ,是一种大规模高速度的信息录入设备。它集光、机、电 于一体,运用光电转换原理,以极快的速度识别填涂点,从载有待录入信息的信 息卡上读取数据,并通过数据电缆送入计算机。它解决了计算机数据录入中的“瓶 颈”问题,把人们从繁重的键盘录入中解脱出来。如五岳科技的o m r 2 0 0 0 c 型光 标字符阅读机。阅读机自带c p u ,采用串行通讯方式与计算机进行通讯,这样o m r 就可利用计算机提供的标准串行接口( c o m l 、c o m 2 ) 与计算机进行连接,采用 4 基于图像识别技术的应用系统研究 d s p 处理器作c p u ,独立电源,将处理完了的数据通过串行通讯口传给计算机。 而软件所要做的只是将传送的数据做相应处理即可。 为了推广o m r 阅读机的应用并考虑到阅读机本身的识别特点,对信息卡的设 计都有较严格的要求。比如在信息卡中增加一些标记,以保证识别过程准确可靠。 同时对具体填涂也有一定要求。 1 3 本文研究内容及论文安排 本文主要是从面向应用的角度出发,研究了利用v c 工具并结合一定的图像采 集,处理,识别技术来实现对生物芯片及填涂信息卡的识别,并给出分析结果。 系统的基本构成框架如图1 2 所示。 1 3 1 生物芯片识别系统 图1 2 系统框架圈 生物芯片识别系统的目的是根据芯片上斑点所提供的信息做出符合要求的判 断。其工作原理如下: 对采集到的图片进行相应预处理:识别读入的芯片图像上的斑点,将其标识 出来:通过数据分析获取相应知识;在相应数据库的支持下,得出判断结果。其 中的关键部分是斑点识别部分。准确的斑点定位对后续的数据提取起着至关重要 的作用。 1 3 2 填涂信息卡识别系统 填涂信息卡识别系统的目的是利用图像识别技术读取卡上的填涂点并根据 卡片的具体应用得出相关结论。其工作原理如下: 利用图像采集卡结合摄像头采集图像;可实时处理或存储以待后续处理;通 第一章绪论 过相应图像处理方法提高图像质量;利用图像识别方法识别所填涂答案;动态输 入正确答案;数据分析对比,得出结论。 1 3 3 论文安排 第一章为绪论部分,介绍了这两个系统的背景,国内外的研究现状,阐述了 本论文的研究目的及意义,并根据系统框图简要说明了这两个系统的工作原理及 功能。 第二章主要阐述了系统中的图像采集及预处理模块。首先介绍了图像采集的 基本知识及本系统中所使用的具体的图像采集硬件设备:进而介绍了在v c + + 中 开发视频采集的方法;最后阐述了本文所使用的图像预处理方法。 鉴于这两个系统在图像识别及数据分析模块所使用的方法各异,作者分两章 分别描述这两个系统的最后两个模块。 第三章是生物芯片识别系统部分。首先,作者提出了两种识别方案,并对方 案中的关键算法做了详细阐述:其次,介绍了本系统中所使用的数据分析及数据 描述方法;最后,对这两种方案的性能及应用前景进行了比较。 第四章是填涂信息卡识别系统部分。在本章主要研究了有关填涂点定位的方 案,并给出了用户化的数据表达界面。 第二章图像采集及预处理模块 第二章图像采集及预处理模块 在进行具体图像识别以前,必须要将客观世界中所看到的连续图像转化为易 于计算机处理的数字图像,并根据具体情况对图像做预处理,以提供高质量的图 像。 2 1 图像采集模块 在目前的图像采集系统中,较普遍的是利用摄像头( c c d ) 结合图像采集卡 完成采集工作。 2 1 1 图像采集的基本原理 图2 1 是图像采集的基本原理图。 图2 1 图像采集基本原理图 由镜头所取得的光学图像,经成像器件转化为视频数据;该数据通过p c i 接口, 依靠图像采集卡传送到帧缓冲器进行缓冲;帧缓冲器中的视频数据,一方面传 送至显示设备进行显示,一方面由c p u 读取进行运算。图像采集卡是其中的关键 部件。 2 1 2 图像采集卡 图像采集卡是基于微型计算机p c i 总线结构,用于采集彩色( 黑自) 图像及 基于图像识别技术的应用系统研究 图像前端处理的外插卡。它采用数字解码方式,将标准输入的p a l 制、n t s c 制 式或s e c a m 制的复合彩色( 或黑白) 视频信号或s v i d e o 信号( 即y - c 分离信号) 数字化,经解码后转换为适用于图像处理的r g b 2 4 b i t s 格式的数字信息,然后通 过p c i 总线实时传送到p c 机系统内存( 或视频显示缓冲区) 。图像采集卡结构框 图如图2 2 所示。 从图2 2 中可以看出,图像卡可以很好地完成实时地图像解码及前端处理, 从而可以与微机已有的资源形成一个比较完整的实时图像采集处理系统。图像采 集卡采用总线控制技术,可实现摄像头图像到计算机内存的可靠实时传送,连续 相邻帧的图像精确到场。图像采集的点阵为方形,采集的图像大小和位置可选。 此外,它采用中断方式,将图像数据传送和用户程序灵活地连接起来。 v i d e 0l v i d e on 2 1 3 采集卡开发 图2 2 图像采集卡结构框图 本系统采用了w i n n o vv i d e u m1 0 2 0 采集卡。该卡为开发视频采集程序提供 了两个类,一个是c w n v v i d e o ,它主要负责视频采集,提供的函数功能有:生成 视频窗口,捕捉连续单帧,捕捉视频流,捕捉高质量静止图像,以及创建a v i 视 频文件;另一个是c w n v v i d x ,它主要负责视频图像的格式,它提供地函数用于控 制视频窗口,选择视频源,以及设置视频源的参数,如图像的亮度、对比度、饱 和度及色彩等。这两个类简化了视频采集开发的过程。 采集卡有两种工作方式:预览方式和采集工作方式。预览方式为用户提供一 个窗口,用户可以在窗口内观察采集的图像,但不能获得每一帧图像得数据。而 第二章图像采集及预处理模块 采集工作方式下,用户可以获得图像数据,在将帧图像送到终端显示之前。可 以对它进行加工处理及交换,本系统综合使用了这两种工作方式。 视频采集首先要进行初始化设暨。设置采集设备端口号、图像大小、图像格 式、帧率,最重要的是设置采集图像的方式,如单帧采集,视频到a v i 文件采集, 静止图像采集,视频流采集等。每一种方式都是主要通过三种函数实现的: 1 ) 使能函数: 在初始化设置中调用它,由它决定一种采集方式是否被允许使用。它的参数如 果为t r u e 。- 则允许使用这种采集方式,否则不允许。至于这种方式是否使用 则由启动函数决定。 2 ) 启动函数: 当调用某种采集方式的启动函数时,如果这种方式是被允许的,则用这种方式 进行图像的采集。同时,启动函数将促发一个相应的事件。这个事件对应着执 行函数。启动函数就像一个消息发送函数。用于触发一件事情。 3 ) 执行函数: 执行函数的接口参数中含有当前一帧图像数据缓冲区的首地址,所以在这个函 数中可以获得当前一帧图像的数据,在函数中完成对图像的加工处理、变换及 分析理解。执行函数其实就是消息执行函数。 - 在本系统中,采集图像的方式是视频流采集,当放置好样本后,捕获该帧的数 据作为以后处理的图像样本,其过程如下: a ) 初始化设置,包括帧率s e t f r a m e r a t e ,图像大小s e t v i d e o w i d t h a n d h e i g h t ,视 频格式s e w i d e o c o d e c ,允许视频流采集s e t e n a b l e v i d e o s t r e a m e v e n t s ( t m e ) : b ) 启动视频采集s t a r t c o n d n u o u s c a p t u r e n o f i l e o : c ) 自动调用执行函数 o n v i d e o s t r e a m d a t a w n v v i d e o c t r l v i d e o ( 1 0 n gf a r + d a t a ,,数据缓冲区首地址 l o n gb u f f e r l e n g t h , 数据缓冲区长度 l o n gb y t e s u s e d ,l o n gt i m e c a p t u r e d , l o n gf l a g s ) 当确定好要捕获的某一帧数据后,将该帧数据导入到莱预先定制好的数组中, 通过图像预处理,将最终数据保存起来。 2 2 图像预处理模块 图像样本在生成时,会不可避免的受到污染。比如芯片在制作,杂交,清洗, 测定甚至采集过程中难免会受到灰尘的污染,测定样品中核酸等分子也会带来一 基于图像识别技术的应用系统研究 定的干扰,这些都会使芯片上产生较大的刺峰信号。如果不予消除,将影响实验 ,的结果。同时,系统硬件本身也会带来一定噪声,如电子噪声,颗粒噪声等。还 有一些其它可能性因素如倾斜等都会为后续的识别带来不便。因此,在进入识别 模块前,必须对图像做一定处理,改善图像质量。从而保证识别结果的准确性。 总体来说,这两个系统的预处理顺序如图2 3 所示。 图2 3 图像预处理模块 首先,采集到的图像为2 4 位真彩色图像,它不仅占用存储空间,并且会为其 它处理带来诸多不变,因此,预处理的第一步是对图像进行灰度化处理;其次, 在图像的采集过程中,由于成像系统的几何非线性,会导致图像中象紊之间的空 间关系发生变化,从而出现几何畸变,并且,由于人为的误差,比如摄像头的偏 移,图像样本的摆放不正等,都会造成图像一定程度的倾斜,因此要进行几何校 i e 最后,采集的图像由于光照等外在因素,会使图像不清晰,所以,应对图像 进行相应的增强处理。 下面将分小节详细论述在这两个系统中使用的预处理算法。 2 2 1 图像灰度化 ( 1 ) 颜色基础及色彩系统 根据人眼结构,所有颜色都可看作是3 个基本颜色红( r ) ,绿( g ) 和蓝 ( b ) 的不同组合。在区分颜色时经常会用到3 种基本特性量:亮度、色调和 饱和度。亮度与物体的反射率成正比。对彩色来说,颜色中掺入白色越多就越明 亮。色调是与混合光谱中主要光波长相联系的。饱和度与一定色调的纯度有关。 其中,色调和饱和度合起来称为色度【3 】a 为了正确使用颜色,需要建立颜色模型。面向硬设备的最常用的彩色模型是 r o b 模型,面向彩色处理的最常用模型是h $ i 模型。而在各个应用场合,也用到 了不同的色彩系统1 4 】: 1 ) y i q 色彩系统 该系统通常被北美的电视系统所采用( 属n t s c 系统) 。这里y 指颜色的明视 度,即亮度( b r i g h t n e s s ) ,其实y 就是图像的灰度值( g r a y v a l u e ) 。i 和q 指色度 ( c h r o m i n a c e ) ,即描述图像色彩及饱和度的属性。r g b 与y i q 之间的对应关系 如下: 第二章图像采集及预处理模块 篡05 9 6 剿0 2 7 4 0 嚣3 2 4 2 罔g 圆12115 2 30 3 1 2b ,。 l ,j - 1 一一 0 。l( 2 ) q | o 一o 0 ( 2 ) 图像中颜色的存储格式 根据表示颜色时所用的位数,图像又可以分为二值图( 用l b i t 表示黑白二色) , 1 6 色图( 4 b i t ) ,2 5 6 色图( 8 b i t ) 和真彩图( 2 4 b i t ) 。 自然界中所有的颜色可以由红绿蓝三原色组合而成。为了表明某种原色成分 的多少,每一种颜色可以人为的分成0 到2 5 5 共2 5 6 级。在表示颜色的过程中, 如果每个像素都用其r o b 分量来表示( 即一个像素需要3 个字节) ,则图像文件 会很庞大。因此,人们采用了一种称为调色板的方法。 比如,对于1 6 色图像,如果采用一个颜色表,表中的每一行记录一种颜色对 应的r ,g ,b 值,这样当表示一个像素颜色时,只需指出该颜色是在第几行即可。 这样会大大缩小存储量。这个颜色表就是调色板。对于处理中使用的灰度图像, 共分为2 5 6 个量化级,对于每个量化级,其r o b 分量是相同的。 ( 3 ) 灰度化 将真彩色图像转换成2 5 6 色位图的关键是要生成一个合适的调色板,即从1 6 m 颜色中选取具有代表性的2 5 6 种颜色。在本系统中直接利用r g b 到y i q 的模型将 真彩色转换为灰度图像。 首先,在程序实现中,需要对2 5 6 色位图信息头进行重新填充: l p b i t m a p i n f ol p b m i = n u l l ;指向2 5 6 色位图的像素指针 l p b m i 一 b m i h e a d e r b i s i z e = s i z e o f ( b i t m a p i n f o h e a d e r ) ; l p b m i - - b m i h e a d e r b i w i d t h = l w i d t h ; 基于图像识别技术的应用系统研究 l p b m i - b m i h e a d e r b i h e i g , h t 2 i h e i g h t ; l p b m i - b m i h e a d e r b i p l a n e s = l : l p b m i 一 b m i h e a d e r b i b i t c o u n t = 8 ; l p b m i 一 b m i h e a d e r b i c o m p r e s s i o n = b i _ r g b ; l p b m i - b m i h e a d e r b i x p e l s p e r m e t e r = 0 ; l p b m i 一 b m i h e a d e r b i y p e l s p e r m e t e r = 0 ; l p b m i - b m i h e a d e r b i c l r u s e d = o : l p b m i 一 b m i h e a d e r b i c l r l m p o r t a n t = 0 : 其次,制作调色板: f o r ( i n tk = 0 ;k b m i c o l o r s k r g b b l u e = k : l p b m i 一 b m i c o l o r s k r g b g r e e n = k : l p b m i - b m i c o l o r s k r g b r e d = k : l p b m i - b m i c o l o r s k r g b r e s e r v e d = 0 ) 最后,利用式( 2 2 ) 算出每个象素的灰度分量。存储在位图结构中的数据区。 图2 4 是原始图像及灰度化后的图像。 ( a ) 原始图像 2 2 2 图像几何校正 图2 4 灰度化效果图 ( b ) 灰度化后图像 ( 1 ) 失真校正 在许多实际的图像采集处理过程中,由于镜头的曲率不均匀,玻璃材料质地 不一致,都会导致图像中象素之间的空间关系发生变化,从而使图像发生几何失 第二章图像采集及预处理模块 真或几何畸变。这种失真在图像上表现为“桶形”、“枕形”或其它不规则地变形。 几何校正的原理是采用一个已知的标准板图像( 通常为规则矩形或三角形网 格) 进行正常图像采集得到失真图像,然后识别出失真图像上的控制点( 通常为 网格节点) ,由此建立起失真图像与未失真图像之间的空间映射关系,这组关系称 为校正矩阵 3 , 4 1 。对同一光学系统来说,该校正矩阵便可以用来校正以后采集到的 失真图像。 几何校正通常包括两个步骤: 1 ) 空间变换 设原图象为f ( x ,y ) ,受到几何形变的影响变成g ( x j , y ) ,这里( 一,y ) 表示失 真图像的坐标。上述变化可表示为: 髓双而黑 ( 2 3 ) 【y t ( x ,_ y ) 在局部小区域内,这种变化可以看成是线性失真,即 f x :饿+ 6 v + c 1 矿:d x + e y 。+ 厂( 2 - 4 ) 如果知道s ,f 的解析式表达及失真图像,即可通过反变换来恢复图像。但通常 我们并不知道解析表达,此时,就需要在失真图和原图上找一些位置确切知道的 点,利用这些点建立两幅图间其它象素空间位置的对应关系。通常采用三角形线 性法来实现这类坐标变换。 将标准图像和被校正图像之间的对应点划分成一系列小三角形区域。三个顶 点即为三个控制点,在该区域内的点的位置满足式( 2 4 ) 所示的线性关系。则三对 控制点可建立六个方程: fx i = 甜l 十砂1 + cfy 。l = d r l + 掣i + f x 2 = a x 2 + 砂2 + c 和 y 2 = 凼2 + e y 2 + f ( 2 - 5 ) l x 3 = o x 3 + 砂3 + cl y 3 = 出3 + e y 3 + , 由式( 2 - 5 ) 可以求出a , b ,c ,d ,e ,厂六个系数,再利用式( 2 4 ) 就可实现三角形内部 其它象素的坐标变换。这种方法计算简单,并且满足一定精度要求。 2 1 灰度插值 尽管实际数字图像中的( 工,y ) 总是整数,但由式( 2 4 ) 计算出来的值可能不是整 数。失真图也是数字图像,其象素值仅在坐标为整数处有定义,因此,在非整数 处的象素值就要用其周围一些象素值来计算。这种方法就叫做灰度插值。灰度插 值的方法很多。最近邻插值简单但精度不够,样条插值精度高但计算量大。 本文采用了一种折衷的方法双线性插值。它利用四个邻点的灰度在两 个方向上做线性内插。如图2 5 所示,设( 一,) 的4 个最近邻象素为a ,b ,c ,d 。它 基于图像识别技术的应用系统研究 们的坐标分别为( f ,) ,o + l ) ,( f ,+ 1 ) ,( f + l ,+ 1 ) 。其灰度值分别为 g ( 一) ,g ( b ) ,g ( c ) ,g ( d ) a 首先计算e 和f 这2 点的灰度值g ( e ) ,g ( f ) : g ( e ) = ( x f ) 【g ( 口) 一g ( 4 ) 】+ g ( 4 ) ( 2 6 ) g ( f ) = ( 石一f ) g ( d ) 一g ( c ) 】+ g ( c ) ( 2 - 7 ) 则( 一,y 1 ) 点的灰度值为: g ( x ,y ) = ( y 一,) 【g ( f ) 一g ( e ) + g ( e ) ( 2 - 8 ) ( 2 ) 旋转校正 图2 5 双线性插值原理图 1 )旋转角度的测量 对一张倾斜角度为占的芯片图片。首先应能动态测出其偏转角。 操作步骤如下: a ) 采用从左到右,从上到下的扫描方式扫描行,扫描到的第一个像素值不为 0 的点,记为a 点,坐标为( 乩y 1 ) ,停止扫描; b ) 采用从上到下,从左到右的扫描方式扫描列,扫描到的第一个像素值不为 0 的点,记为b 点,坐标为( x 2 ,y 2 ) ,停止扫描: c ) 计算旋转角目: 毋= a r c t a n ( ( y 2 一y 1 ) ( x 2 一x 1 ) ) ;( 2 9 ) 2 ) 图像的旋转 图像的旋转变换是一种相对复杂的几何变换。一般,图像的旋转是以图像的中 心为原点,旋转一定角度。旋转后,图像的大小会改变,基于处理的需要,我们 应扩大图像范围以显示所有的图像。 首先推导旋转运算的变换公式。如图2 7 所示,( x o ,y 0 ) 经过旋转口度后坐 第二章图像采集及预处理模块 标标变成( x l ,y 1 ) 。 旋转前: 旋转后: x o = r e o s ( a ) l y o = r s i n ( a ) ( 2 - 1 0 ) xo:=,reos(a棚-t9三卟8)+yosin(o)yos i n ( ax o s i n ( 8 ) y o c o s ( 8 ) ( 2 1 1 ) l = ,一口) = 一 十 写成矩阵表达式为 y ( 如y 彳虬y n 多y 一 r 0 x 图2 7 旋转示意图 刚二秘s i n ( 8 ) 刚警:警 ( 2 - 1 2 ) ( 2 1 3 ) 上述旋转是绕坐标轴原点( o ,o ) 进行的,如果是绕一个指定点b ) 旋转,则 先要将坐标系平移到该点,再旋转,然后平移回新的坐标原点。 坐标平移变换矩阵如下,坐标系i i 的原点再坐标系i 中坐标为b ) : 1,j 如妒 。l们j副 1j l 1 工y l ,l1,l,j o 0 1 1 6 一一 茎王圈堡堡型垫查塑堡旦墨竺堑塞 一 _ _ 一 i | : = 匠 ti 萃 让4 , 川 i i : 函 假设图像未旋转时中心坐标为( 钆b ) ,旋转后中心坐标为( c ,d ) ( 在新的坐标系,以 旋转后新图像左上角为原点) ,则旋转变换矩阵表达式为: h 1 o 忖 =i;9业icos雩s(co口),csi。n菩(o口),;3 0 s i n ( 0 ) c o s ( o ) 0 ( 2 1 6 ) 其逆变换矩阵为: x o rc o s ( o ) s i n ( o ) 一c o o s ( o ) 一ds i n ( o ) + 口 y oi = i s i n ( 0 ) c o s ( o ) c s i n ( 0 ) 一d c o s ( 0 ) “i ( 2 - 1 7 ) l ii 0 01 l 因此 x o = 小o s ( o ) + y l s 岬) 一c c o s ( o ) - d s 岬) + a( 2 1 8 ) i y o = - x l s i n ( 0 ) + y l c o s ( 8 ) + c s i n ( o ) 一d c o s ( o ) + b 。 编程时,首先应计算出公式中需要的几个参数:a , b ,c ,d 和旋转后新图像的高、 宽度。已知图像的原始宽度为1 w i d t h ,高度为1 h e i g h t ,以图像中心为坐标系原点, 则可计算出原始图像四个角的坐标,进而计算新图像的高度和宽度,注意的是对 于原图中没有的像素,应直接赋值为0 。 图2 8 ( b ) 是对图2 8 ( a ) 的校正结果。 2 2 3 图像增强 一般情况下,各类图像系统中图像的传送和转换( 如成像,复制,扫描或摄像 系统) 都会对其产生一定的干扰,这些会使图像存在孤立点,孔洞,毛刺等,恶 1l,j u d 一 vjooj皿 0 o 1 印徊 似咖o c l1,j c d l 0 一o 1 0 0 l | f 1l,j u u r r l 工y ,l1,j f d 1 1lllj 如加, = j o i i o 业 啊6 第二章图像采集及预处理模块 化了图像质量,使图像模糊,甚至淹没特征,给分析带来困难,这将严重影响对 图像的后续处理。因此,需要使用图像增强技术提高图像质量。 ( a ) 旋转图片 图2 8 旋转校正样本 ( b ) 校正后图片 图像增强技术根据其处理空间不同。可分为空域法和频域法。空域法主要是 在空间域中对图像像素灰度值直接进行运算处理。可用式( 2 1 9 ) 描述: g ( x ,y ) = f ( x ,y ) ( z ,y )( 2 - 1 9 ) 其中f ( x ,y ) 是处理前的图像;h ( x ,y ) 为空间运算函数。在具体增强操作中, 又可分为点操作和模板处理。频域法是在图像的某种变换域中对图像的变换值进 行某种运算处理,然后变回空间域。 在本文的两个系统中均使用了空域法。 ( 1 ) 生物芯片识别系统 在生物芯片识别系统中,由于芯片在制作,杂交,清洗,测定甚至采集过程 中都可能会受到灰尘的污染,测定样品中核酸等分子也会带来一定的干扰,这些 都会使芯片上产生相应的刺峰信号。如果不予消除,将影响实验的结果。但同时, 由于芯片在应用上的特殊性,所以在制作过程中都会尽可能的避免污染,以防数 据出现偏差。因此本系统采用了较简单的中值过滤的方法来消除噪声。 即将每一象素的灰度值与周围各象素的灰度平均值做比较,如果与平均值一 致,则不做改变;否则,用平均值做替换:这种方法可以消除较细的刺峰干扰。 同时,采用这种方法的另一原因是由于芯片中斑点的灰度值都携带着一定的 信息,因此,使用的处理方法应尽可能地不改变斑点的灰度值。考虑到斑点内部 各象素的灰度值都很接近,因此,中值过滤不会影响到斑点内部,而只对背景有 效。 1 8 基于图像识别技术的应用系统研究 ( 2 ) 填涂信息卡识别系统 1 1 图像的灰度修正 , 灰度修正是图像在空间域中进行增强的简单而有效的方法。常见的方法有以 下三种: ( 1 ) 针对图像成像不均匀而对图像逐点进行不同程度的灰度级矫正, 目的是使图像灰度均匀; ( 2 ) 针对图像某部分或整体曝光不足,目的是增加图像的灰度对比度; ( 3 ) 直方图修正,目的是有选择的突出所需要的图像特征。 在填涂卡识别系统中,采用c c d 摄像头采集图像,由于光照及操作杆的问题, 图像出现半边暗半边亮的情况,并且图像的整体的对比度不强,如图2 3 所示。为 此,作者采用了如下方法来改善图像质量。 首先,去除阴影; 对图像的每个3 2 3 2 块图像做灰度平均,求取所有平均值中最小的作为背景 值:将该背景值扩展为和图像同大小的矩阵;将原图像与背景矩阵进行逐点相减, 即可有效消除阴影。但采用本方法会使图像从整体上变暗,因此,还需做进一步 处理。 其次,进行直方图均衡化。 该方法的基本思想是把原始图的直方图变换为均匀分布的形式这样就增加 了像素灰度值的动态范围从而达到增强图像整体对比度的效果。 按照图像概率密度函数( p d f ,归一化到单位面积的直方图) 的定义: p ( x ) = 日0 ) ( 2 - 2 0 ) 执 其中h ( x ) 为直方图,a 。为图像的面积。 设转换前图像的概率密度函数为p ,( ,) ,转换后图像的概率密度函数为p 。0 ) , 转换函数为j = f ( r ) 。由概率论知识,我们可得到: p 。( s ) = p ,( r ) ( d r d s )( 2 - 2 1 ) 这样,如果想使转换后图像的概率密度函数为l ,则必须满足 p ,( r ) = d s l d r ( 2 2 2 ) 两边同时对r 积分,可得: s = ,( ,) = r ( ) 咖= ( 1 a 。) r ( ) 咖( 2 - 2 3 ) 该转换公式被称为图像的累积分布函数( c d f ) 。 对于未归化的离散图像,则灰度均衡的公式为: 第二章图像采集及预处理模块 d 。;f ( d a ) = 半艺q ( 2 2 4 ) n o 8 脚为第i 级灰度的像素个数。 图2 9 ( a ) 是原图,可以看出图像的左半部分有阴影,图2 9 是扩展的背景矩 阵,图2 ,9 ( c ) 是将原图和背景矩阵相减后的图像,可以看出图像整体变暗,图2 9 c d ) 是经灰度均衡化后的图像。 ( c ) 去除阴影结果 ( d ) 图像增强结果 图2 9 图像灰度修正示意图 由图2 9 可看出,经灰度增强后,图像的质量明显提高,有利于后续识别。 2 ) 图像去噪 图像平滑是种实用的图像去噪技术。一般情况下,在空间域内可以用邻域 平均来减少噪声,在频率域,由于噪声频谱通常多在高频段,因此可以用各种形 式的低通滤波的办法来减少噪声。 在本文中采用了中值滤波的方法。中值滤波是一种非线性的信号处理方法。它 是1 9 7 1 年有j w j u k e y 首先提出并应用在一维信号处理技术中,后来被二维图像 信号处理技术所引用。中值滤波在一定条件下可以克服线性滤波器如最小均方滤 波,均值滤波等带来的图像细节模糊,而且对滤除脉冲干扰及图像扫描噪声最为 2 0基于图像识别技术的应用系统研究 有效p 】。由于在实际运算过程中不需要图像的统计特征,也带来了不少方便。 其工作步骤如下: ( t ) 将模板在图中漫游,并将模板中心与图中某个像素位置重合: ( 2 ) 读取模板下各对应像素的灰度值; ( 3 ) 将这些灰度值从小到大排成1 列; ( 4 ) 找出这些值里排在中间的一个; ( 5 ) 将这个中间值赋给对应模板中心位置的像素。 由以上步骤可以看出,它的主要功能是消除孤立的噪声点。由于它不是简单的 取均值,所以产生的模糊较少。 2 3 小结 本章主要介绍了在本文的两个系统中用到的图像预处理的方法。图像预处理是 所有图像处理应用中不可缺少的,其总的目的是为了保证后续的图像分析的准确 性及数据的有效性。 自动识别 第三章生物芯片识别算法 第三章生物芯片识别算法 生物芯片的概念来自计算机芯片,其实质是在面积不大的基片表面上有序的 排列了一系列固定于一定位置的可寻址的识别分子,当其和血液等物质发生生物 化学变化后,用精密的扫描仪或c c d 摄像技术记录,通过计算机软件分析,综合 成可读的i c 总信息。 这一章将详细阐述生物识别系统中的关键部分图像识别和数据分析模 块,这两个模块又可统称为芯片数据处理模块。 3 1 芯片数据处理模块简介 生物芯片技术中最重要的是有效的芯片数据的采集,处理,分析和报告1 5 1 。一 个完整的芯片数据处理系统应包括芯片图像分析和数据提取,芯片数据的统计学 分析和生物学分析,芯片的数据库积累和管理等。本文所研究的芯片数据处理模 块结构如图3 1 所示。 图3 , 1 芯片数据处理模块结构图 基于图像识别技术的应用系统研究 3 1 1 图像识别 在生物芯片识别中,图像识别特指对斑点的识别,它是整个图像分析中的核 心部分,也是本章讨论的重点。以硬质材料如玻璃等做片基制成的芯片,样品斑 点边缘一般比较清晰,容易识别。但对于膜阵列,通常斑点边缘比较模糊,背景 难以确认,并且由于膜基质的非线性弯曲变形,导致图像变形,使斑点难以辨认, 并易造成误差。在图3 1 所示的图像识别模块中,作者采用了两种算法进行斑点识 别,即自动识别和交互式识别。它们的目的都是斑点定位。 所谓斑点定位,即在芯片上标明斑点的位置,以便于后期数据提取。通常的 、标明是指在斑点识别时对每一个斑点产生一个圆形套框,系统根据每个斑点的位 置、大小自动调节该圆的直径,以尽可能好的使样品点完全落在圆内。图3 2 所示 的圆即为所需套框,圆内为样品信号,圆外为背景信号。 图3 。2 斑点套框 最常用的斑点定位方法是在图像中选择需识别的区域,输入芯片阵列的行数 和列数,计算机自动产生一个网格框,套在芯片图像中,使每一个网格内包括一 个样品点1 5 j 。对于机械手点样制
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 天然气管道段施工方案解析
- 儿童肥胖症健康宣教
- 2026年财政审计岗遴选笔试试题及参考答案
- 2026年事故应急救援知识手册
- 2026年法院书记员面试应试指南
- 2026年公务员行测言语理解模拟题
- 2026年面试医疗销售问题
- 2026年手工知识竞赛活动方案设计
- 2026年土木工程师结构设计
- 2026年中班育儿知识春季开学活动方案
- 儿童夏日防暑安全知识课堂
- 2026年少先队考核模拟试题及答案详解(全优)
- 甲状腺疾病的预防与护理
- 中国金谷国际信托有限责任公司招聘笔试备考试题及答案解析
- 小学一年级语文下册《荷叶圆圆》跨学科融合教学设计(导学案)
- 湖南 2026 政府采购评审专家续聘考试(3) 真题
- 雨课堂学堂云在线《人工智能原理》单元测试考核答案
- 【MOOC】《知识创新与学术规范》(南京大学)期末考试慕课答案
- 国开《学位论文指南》形考作业1-2答案
- ktv食品安全管理制度
- (高清版)JGJ340-2015建筑地基检测技术规范
评论
0/150
提交评论