已阅读5页,还剩70页未读, 继续免费阅读
(计算机应用技术专业论文)基于混合图的图像结构描述与匹配.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
a b s t r a c t i nt h i st h e s i s , w ep r o p o s ean e ws t r u c t u r en a m e dm i x e dg r a p hs t r u c t u r e ( m g s ) t o d e s c r i b ea n dr e p r e s e n ta l li m a g ea n du s et h i ss t r u c t u r et op e r f o r mi m a g em a t c h i n g w e p r e p r o c e s s e da n ds e g m e n t e da ni l l l a g ei n t o as e to fr e g i o n s ,a n de s t a b l i s hi t sm g s a c c o r d i n gt ob o t ht h ea t t r i b u t e sa n ds p a t i a lr e l a t i o n so fr e g i o n sw i t h i na ni m a g e e a c h r e g i o ni na ni m a g ei s d e n o t e db yo n ea n do n l yo n ev e r t e xo fm g s t h i si m a g e r e p r e s e n t a t i o nd o e sn o tc o n t a i nr e d u n d a n tv e r t e x e s u n l i k eag r a p h ,am g s c o n t a i n sb o t h d i r e c t e da n du n d i r e c t e de d g e s ,w h i c hr e p r e s e n t i n c l u s i o n a n d a d j a c e n c y r e l a t i o n s h i p r e s p e c t i v e l y w es h o w t h a tm i x e dg r a p hs t r u c t u r eh a s b e t t e ra b i l i t yt h a nat r e es t r u c t u r ei n d e s c r i b i n ga l li m a g e w ea p p l yt h em i x e dg r a p hs t r u c t u r ei ni m a g em a t c h i n g i m a g em a t c h i n gi sab a s i c i s s u ei nh i g h 1 e v e li m a g ea n a l y s i s a ni m a g em a t c h i n gp r o c e s sf o c u s e so ne v a l u a t i n g r e g i o na t t r i b u t e sa n dr e l a t i o n s h i p sc o n t a i n e di n t h ec o r r e s p o n d i n gm i x e dg r a p h s t r u c t u r e i nt h ei m a g em a t c h i n gp r o c e s s ,w eb u i l da na s s o c i a t i o ng r a p hf r o mt h em g s ,a n d s e a r c h a l lm a x i m a lc l i q u e si nt h ea s s o c i a t i o ng r a p ht oc a l c u l a t et h em a t c h i n gr a t ea n dt h e s i m i l a r i t yo fi m a g e s e x p e r i m e n t sa r ep r e s e n t e d t os h o wt h ef e a s i b i l i t ya n dh i g h e f f i c i e n c yo fo u ra p p r o a c h k e y w o r d s :i m a g ed e s c r i p t i o n ,m i x e dg r a p hs t r u c t u r e ,i m a g em a t c h i n g , a s s o c i a t i o ng r a p h ,m a x i m a lc l i q u e i i 、己 7 k 0 中文文摘 中文文摘 图像处理与分析是指对图像信息进行加工以满足人的视觉心理或应用需求的行 为。作为计算机技术发展的重要分支,图像处理与分析在不同的研究领域的应用需 求都呈快速增长。如在生物医学成像、智能模式识别、图像文字理解、遥感地球信 息系统等领域都与图像处理与分析有着千丝万缕的联系【l 】,并产生了许多交叉学科。 图像描述、图像匹配作为图像处理与分析中的重要内容,一直是研究的重点与热点。 本文针对图像描述、图像匹配这两个关键问题做了较为深入的研究。提出了基 于混合图结构的图像描述,并将该结构运用于图像匹配。图像结构的描述对于后续 图像处理,如图像检索、计算机视觉等都具有十分重要的实际意义【1 6 1 。图像描述针 对的研究点是用一种结构尽可能准确、完整地表达出图像中目标物体的特征及目标 物体与背景部分的联系,为后续高层图像处理提供依据【2 引。图像匹配定义为在基本 单元相似性准则下,运用某种算法在两幅或多幅图像间识别相同点。它是以匹配为 准则的最佳搜索过程。准确完整的图像描述是进行后续高层图像处理的重要步骤。 目前常见的描述方法是利用各种和颜色、纹理、形状有关的描述符刻画目标物 体的特征来描述图像。描述符具有一定的统计意义,但一般难以被人们直观理解p j , 且难以表达出图像的全局信息。另一类是基于图像结构、图像语义联系的描述;这 种方法利用逻辑思维抽象,着重于图像内部包含的本质特征,能较好地表示图像的 全局特征信息和内在联系,具有很大的研究潜力。 本文主要研究工作如下: 绪论对课题研究背景作了简单介绍,然后从图像结构特征出发,讨论了图像的 结构描述,对当前几种图像结构描述方法进行了分析和比较,针对当前描述方法的 缺点,以图像分割后的区域为基元,提出一种新的基于混合图的图像结构描述。与 传统的描述方法如树形结构相比,该描述方法不仅能够表达出目标区域间的包含关 系,还能表达区域间的相邻关系,故其描述能力强,对后续高层图像处理有利。 第一章介绍图像以其本文涉及到的有关概念。如什么是图像,如何获取数字图 像等。然后介绍图像的邻域,并由邻域引出区域的概念;区域是本文研究对象的基 元。在第二章重点介绍。本章还介绍了图像结构以其语义。图像结构与语义属于图 l l i 福建师范大学工学硕士论文 像高层处理的研究范畴,用抽象的视角看待图像内部之间的本质联系。此外,本章 还附带介绍了图像工程。图像描述属于图像工程的中层部分,包括图象处理、图象 分析和图象理解三层次。低层图象处理主要通过计算机对图像进行重组和区域分割, 中层处理是连接低层和高层处理的桥梁。高层图像理解主要是在中层的基础之上, 进一步研究图像中各目标的性质和它们之间的相互联系。 第二章本章详细回顾了基于区域的图像描述的若干方法。图像被分割为一组 独立区域后,每个区域都有特定的属性或特征,并与相邻区域的属性特征存在差别 ( 否则它们在图像分割过程中被视为同一区域) 。基于区域形状和区域边界的描述 主要就是利用这些特征对图像进行描述。表示单个区域时,通常是考虑区域形状特 征和区域边界( 轮廓) 特征。基于区域空间关系的描述与上述两种方法不同,它着 重研究区域之间的关系,而非单一区域所具有的性质。这种方法是先把已知的图像 分割为若干个有意义的区域,并综合所有区域特征的基础上研究图像整体性质。 第三章首先详细回顾了传统基于树结构的图像描述,树结构描述和图结构描述 都是针对图像目标间关系的描述。树结构的存储形式和识别分析相对简单,比较适 于表达包含和从属关系,是一种非常直观的层次结构表示方法。在图像结构描述中, 利用树结构自身的层次性可以清楚地表达出图像区域或边界之间的包含关系,但是 这种层次特性无法表达区域间其他关系,这是树结构的缺陷。针对树形结构描述图 像的不完整性,且表示出的区域独立性过强,很难迸一步确定目标间是否还存在其 他联系。本文在树结构的基础上提出了图像的混合图结构。该结构也是基于区域空 间位置关系的描述;混合图结构本质上属于图结构,但却是建立在树结构的思想上 并吸收了树结构的优点,并进一步考虑同一层节点间是否也存在联系【3 4 】。虽然混合 图结构同时考虑垂直和水平两个方向的节点联系,结构复杂度比树高,但混合图不 存在环形结构,不同于一般图那样任意顶点都有可能关联,这大大降低了混合图结 构描述图像的复杂度;可看作是对树结构的改进,并介于树与图结构之间的新型结 构,能更精确完整地表达图像结构。 第四章建立了图像的混合图结构后,为了体现它使用价值,我们将其应用于图 像匹配中。图像匹配作为一种重要的图像处理技术,广义上是指在两幅或多幅图像 之间自动建立联系的过程;狭义上是指通过某种算法由已知的图像( 部分) 在另一幅 图像中搜索相似图像( 部分) 的过程,这个过程也可以理解是在图像之间识别对应像 i v 中文文摘 素点的过程。图像匹配已经成为许多和计算机视觉有关的处理任务,诸如模式识别、 区域跟踪等问题。建立图像的混合图结构后,就可以通过比较混合图结构的异同来 判定源图像是否匹配。具体过程分为两个步骤,先是利用混合图结构,通过比较生 成关于它们的关联图,再搜索这个关联图中的最大子团并计算匹配率得到匹配结果。 第五章通过实验验证本文所提出的基于混合图结构及其匹配。先建立混合图用 于描述目标图像和待匹配图像,并利用搜索关联图最大子团的方法进行匹配【2 5 】。匹 配是根据区域关系和区域特征两方面的要求进行。其中,利用区域的形状特征考察 区域是否满足兼容法则并生成关联图的结点对,然后用区域的空间位置关系作为相 似( 一致性) 条件,生成满足条件的最大子团,最后搜索最大子团来计算图像的匹配 率。 第六章总结全文,同时指出未解决问题和以后研究方向。 v 15, 目录 目录 中文摘要i a b s t r a c t 中文文摘h i i ;lj i i :v i i 绪论一1 一 第一章图像及其基本概念。- 7 一 第一节背景知识- 7 - 1 1 图像的概念。- 7 1 2 像素的邻域。一8 1 3 图像的区域- 9 一 第二节图像结构及语义联系一9 - 1 1 图像结构一9 - 1 2 图像的语义一l o - 第三节本章小结。- l l 一 第二章区域的图像描述- 1 3 - 第一节基于区域形状的描述- 1 3 1 1 区域面积。一1 3 一 1 2 区域周长- 1 4 1 3 圆形度光滑度1 4 1 4 区域的矩一1 4 一 第二节基于区域边界的描述一1 6 - 1 1f r e e m a n 码。一1 6 1 2 边界近似。1 7 - 1 3 边界傅里叶变换。- 1 7 一 第三节基于空间关系的描述。一1 8 1 1 二元分割树。1 9 - 1 2 四叉树。一2 0 - v l l 福建师范大学工学硕士论文 第四节本章小结一2 1 一 第三章混合图结构的图像描述- 2 3 一 第一节混合图结构的意义- 2 3 1 1 树结构的缺陷。- 2 3 1 2 混合图的数学定义- 2 4 - 第二节前期准备工作j 。- 2 5 1 1 图像预处理一2 5 1 2 模糊区域分割- 2 6 - 第三节混合图结构的建立- 2 9 - 1 1 提取区域的形状特征2 9 一 1 2 提取区域间位置关系- 3 0 一 1 3 建立混合图的边一3 1 一 第四节混合图结构举例3 3 一 第五节本章小结- 3 4 - 第四章基于混合图的图像匹配- 3 5 一 第一节图像匹配概述- 3 5 一 第二节子图同构与图的相似度。一3 6 第三节关联图及其最大子团- 3 7 - 1 1 关联图的建立- 3 7 1 2 搜索最大子团- 4 0 - 第四节本章小结一4 1 第五章实验结果与分析4 3 第一节创建混合图结构4 3 1 1 实验平台与图像来源4 3 1 2 建立源图像的混合图。4 6 第二节关联图及最大子团的生成 第三节计算图像匹配率4 8 第六章结论4 9 参考文献5 1 攻读学位期间承担的科研任务与主要成果5 7 v i i i ? i 参 致谢。”“” 个人简历- 6 1 - i x 绪论 绪论 一、课题背景 本课题依托的科研项目是:( 1 ) 智能化医疗信息系统医学图像识别子系统;( 2 ) 基 于图搜索的医学图像检测与分析。 医学图像处理与分析作为智能化医疗系统发展的关键技术之一,是现代生物医 学、计算机科学、电子信息技术、心理学、高等数学等学科并行发展的结果。医学 图像处理虽隶属于图像处理,但由于自身学科的特殊性,研究人员已把它看作一门 独立学科。医学图像处理在人们的日常生活应用也越来越广泛,常见的医学影像成 像,核磁共振( m 时) 、数字射线、单光子发射型断层成像等已经成功应用于临床诊 断【3 6 1 。医生借助于影像技术可对病人的病变部位有更清晰、准确地观察【2 】。同时, 医学图像处理与人工神经网络、智能计算等计算机技术相融合,朝着智能、自动化 方向发展。如白细胞聚类计数、癌变组织自动识别等都是图像智能识别在检测诊疗 中的具体应用。智能化医疗信息系统【8 】不仅有助于医生简化治疗程序,而且极大地 减轻了患者的生理上的痛苦,同时节约了病人的治疗成本;因此,智能化医疗信息 系统在本领域有着巨大的发展空间。 以工程学的视角研究医学图像处理,即图像工程越来越受到人们的重视,理解 图像工程对于理解本文研究意义有很大帮助。图像工程内容丰富,蕴含内容广泛, 按照研究对象和研究方法的不同分为高中低三个层次:图像处理、图像分析和图像 理解。层次间相互联系、相互交叉,但随着层次的递增,抽象程度和数据处理量递 减。 低层图像处理主要从像素级上进行操作处理,重点研究图像的变换以及之间的 各种转变。广义上图像处理泛指各种图像技术。狭义上可认为是以加强图像质量, 改善人眼的视觉效果为目的;并为后续的图像工程中高层奠定基础。图像分析为中 层操作,抽象性较高,主要是指对一幅图像中感兴趣的目标( 区域) 进行检测,进 行图像分割、特征提取等,用某种适当的数据形式描述图像【3 4 】。所得到的数据可能 是目标特性测量的结果,或是利用测量得到的符号描述,但都蕴含了图像中目标的 特征和本质属性。本文所研究的内容就属于这一层次。图像理解属于图像工程中的 最高层次,抽象度最高,数据量小。主要是在前面两层的基础上,对抽象出来的符 福建师范大学工学硕士学位论文 号描述再进行加工,进一步概括出图像中目标的性质和目标之间的内在关联。通过 对图像内容含义的解释得出原来客观景象的具体理解,从而反馈给研究人员一定的 信息,其研究方法与人们的逻辑思维推理有诸多相似之处。图像工程的这三个层次, 整体上看是源图像经过一系列处理过程逐步形成有组织、有结构的图像信息。 图1 图像工程内在联系 f i g u r elt h ei n t e r r e l a t i o no fi m a g ee n g i n e e r i n g 高层图像处理是一个广阔的范畴,如图像理解,目标识别等都是其中的研究分 支。图像理解是指对图像作出某种解释,它是以图像为对象,先验知识为中心,探 索图像中有什么感兴趣的目标、目标之间的相互联系【3 9 】。图像的周围场景以及如何 应用学习技能达到自动理解的学科,包括从上到下的知识驱动和从下至上的数据驱 动【l 】。目标识别则是研究最优化地分辨、提取图像中感兴趣目标,达到对场景更好 的理解。它是图像理解的基础,带有一定的主观性;目标识别还侧重对局部区域的 理解,确定图像中有什么物体以及它们出现的位置。 本文主要研究图像描述与图像匹配两大问题。图像描述、图像匹配是高层图像 处理与分析中的基础问题,也是近年来的研究热点。对于医学图像处理,自然也不 例外。图像描述解决的问题是如何用一种适当的结构准确完整地表达出图像中感兴 趣的物体( 目标) 特征,并说明目标物体的特征与图像中其余部分的相互关系【3 】, 为后续高层图像处理提供依据。图像匹配是在基元相似性准则下,运用某种匹配算 法在两幅或多幅图像间识别相同点,或匹配准则的最佳搜索问题。图像匹配主要可 分为以灰度为基础的匹配和以特征为基础的匹配。与基于灰度的图像匹配相比,某 i 绪论 些特征具有旋转、平移和尺度不变性。但特征提取需要付出一定的计算代价,并且 需要自由参数和事先已定义好的阀值,应用不够方便。同时,在纹理较均匀的图像 中提取特征比较困难。基于特征的匹配方法的时间复杂度也比前者高,因为需要以 特征属性、启发式学习相结合来确定匹配算法。 准确完整的图像描述是进行后续高层图像处理的重要步骤。目前常见的描述方 法是利用各种描述符表示图像特征来描述图像【8 】。描述符具有一定的统计意义,但 一般难以被人们直观理解,且难以表示图像的全局特征信息。另一类是基于图像结 构的描述。图像的结构是按一定的规则从图像基本信息中抽象而来,考虑图像整体 信息,故能较好地表示图像的全局特征信息和内在联系。尽管图像描述、表示这方 面的内容以备受国内外学者的关注,但仍然面临众多亟待解决的问题,例如如何精 确定义各种符号算子,如何运用数理逻辑语言对研究对象进行抽象化处理等,这些 研究内容还不完善【1 8 1 。同时,在图像结构描述基础上的高层处理( 图像匹配、图像 理解) 的研究也不充分。基于结构的图像描述和匹配技术有着广阔的应用前景,但 发展还不够成熟,所以开展这方面研究意义显然。 二、国内外研究现状及发展趋势 医学图像处理与分析是由计算机图像处理和现代医学、生物医学工程等结合发 展而形成的新兴学科。6 0 年代以来,随着计算机技术的高速发展,人们开始研究如 何利用计算机来处理各种图像。早期的图像处理主要是以改善图像质量,更好的满 足人们视觉、心理上的需要为目的。现代医学的几次突破也和图像处理技术紧密相 关。自7 0 年代中期,计算机人工智能和神经网络、模式识别的研究不断深入,如模 糊模式识别和人工神经网络也越来越成为研究热点。随着各学科的高速发展并渗透 到图像处理领域,图像处理朝着更高层次发展。高层图像处理主要是利用计算机来 模拟人脑、视觉系统感知并理解图像 3 8 1 。目前图像高层处理主要还是理论研究,对 于具体的应用存在一定困难。 如何准确完整地描述图像是进行后续图像高层处理的基础环节。图像描述是一 个抽象概括,目前还没有统一定义。图像描述通常用某种描述子来表示图像中的目 标特征。目标是指图像中人们感兴趣的内容( 区域) 。利用计算机进行图像描述,首 先要用计算机能识别的符号或数字来表示图像特征。这种用于表示图像特征且能被 计算机识别的符号、算子统称为描述符。描述符根据其表示图像特征的不同,可分 福建师范大学工学硕士学位论文 为统计特征描述和形状特征描述。统计特征描述包括纹理特征和各种变换。常见的 纹理特征描述方法有梯度共生矩阵【1 2 1 、灰度共生矩阵( g l c m ) 等。形状特征描述 是利用区域面积、矩形度、欧拉数等。s e r g e b e l o n g i e 和j i t e n d r a m a l i k 的文章 s h a p e m a t c h i n ga n do b j e c tr e c o g n i t i o nu s i n gs h a p ec o n t e x t s ) ) 以新的视角看待形状特征并 用识别物体。描述形状特征常用的还有矩,如不变矩,z e m i k e 矩算子等。 计算机目前还不具有人类的逻辑思维能力,人眼观察到的简单图像所包含的结 构、语义信息1 2 l j 计算机却时常无法理解。这是因为计算机缺乏对图像整体特征和目 标关系描述。描述符虽然能很好地表示图像局部特征,却难以表示图像特定的语义 信息,如图像中目标间的空间关系,边界轮廓等。这对于图像高层处理有很大的局 限性。此外,这些描述符忽略了人的视觉感知特性,难以被人们直观的理解。而要 有效地表达图像所包含的语义特征,一种方法是通过对图像目标( 区域) 间的相互 关系,即图像结构进行描述。结构是物体元素相互间的关系,而图像结构主要是指 图像中目标( 区域) 间的关系,它是按一定的规则从图像基本信息中抽象得出并反 映图像某些方面的性质【2 8 】。把图像目标( 区域) 组织成特定意义的结构,有利于计 算机理解图像,在语义空间内对图像进行高层处理。 目前,采用分层数据结构是描述图像最有力的工具之一,分层数据结构是一种 高效的图像高层处理的区域表示方法。层次数据结构的是根据递归归并原则来组织 图像中的区域关系。常见的分层数据结构是树结构。树是一种二维层次结构,对应 图像的二维信息,可直观地表达图像中目标间的空间关系,而空间关系是图像的重 要信息( 特别当目标较多且目标大小远小于目标间距离) 。包括四叉树、排列树、二 元分割树等。如四叉树中,每个非叶子结点都有4 个子节点,可表示该结点与在四 个不同方位上其他结点的组成关系。其所含的信息可理解为组成与组成关系。 p h i l i p p e s 在 一文中介绍了如何建立二元分割树 5 1 来实现图像处理、信息检索等。但树结构也有 其自身的局限性,如无法表示同一层结点间的空间关系,不能完整地描述图像结构 关系。因此改进树结构来描述图像也是一个研究热点。 综上所述,图像描述是图像处理中很重要的一部分,为后续图像高层处理提供 了必要的研究前提。图像匹配、识别与理解,机器视觉等诸多问题,从根本上说先 要解决如何高效、准确的描述图像。而图像匹配问题作为图像高层处理的基本问题, 绪论 同时也是一个难点,也是值得人们研究的。 三、研究内容及意义 图像描述是为了建立一种图像模型来表示图像【4 】,为后续图像高层处理打下基 础。图像高层处理是一门极有挑战性的高难技术。跨越电子计算机、数学、自动化 科学、医学、心理学等多门学科。图像匹配、分析理解、机器视觉、3 d 虚拟现实都 是具体的研究分支。图像匹配作为基础的高层处理之一,是在已知的两幅图像间比 较相似程度,或在一个大的图像区域寻找一个与目标相似的子区域。总的来说,可 分为建立结构和匹配两个子步骤。而基于树( 图) 结构的图像描述,正好为有效进 行图像匹配打下了必要的基础。然而图像易受噪声的污染,还存在着灰度失真和内 容畸变等不良因素【1 3 】,故除了建立合理,完整地图像结构外,精确、快速并具有抗 干扰性的匹配方法也一直是研究人员所不懈努力追求的。 图像描述作为图像底层处理和高层处理之间的桥梁,不仅是底层处理的间接结 果,更是后续高层处理开展研究的重要前提。本文以图像经分割后得到的区域为基 本研究单位,定义并提取区域间的空间位置关系,并根据这种关系建立混和图结构 来描述图像。混合图属于数据结构中图结构的一种,同时含有无向边和有向边。该 结构不仅具有树结构表达图像的能力,还考虑同层结点间可能存在的关系,能更准 确、完整地描述图像,因此,利用本文讨论的混合图结构来描述图像可以很好地克 服树结构描述图像的不完整性,具有一定的应用价值。 同时,本文不是孤立的研究基于混合图结构的图像描述。建立图像的混合图结 构是为了后续应用,我们将混合图结构应用于医学图像匹配。按照事先定义的规则 对待匹配图像和图像库中的图像的混合图结构进行比较匹配,对满足规则的一组图 像建立关联图,通过搜索关联图中的最大子团来确定匹配相似程度。基于混合图的 图像匹配技术,不同于传统的利用图像特征、模板等匹配技术,具有一定的创新性。 四、论文内容和章节安排 本文一共分为六个章节,内容安排如下: 绪论阐述了本文国内外研究背景及研究意义,提出了目前该课题存在的一些问 题及解决方案,概述本文的主要研究工作。 福建师范大学工学硕士学位论文 第一章主要概括了图像结构描述的基本内容和意义、目前常见的研究方法。首 先介绍图像、图像的邻域以及如何获取图像等基本概念,并着重介绍区域、图像结 构、图像语义等概念,为下文的展开打下基础。 第二章回顾了几种常见的区域特征描述符,区域面积、周长、矩等;再重点讲 述利用区域特征描述图像的三种方法,即基于区域形状的图像描述,基于区域边界 的图像描述和基于空间关系的图像描述。 第三章详细阐述本文的研究重点:混合图结构的概念,以及如何建立该混合图。 先介绍传统树结构的缺陷来引出混合图结构的实际意义。再给出混合图结构的数学 定义,然后介绍了建立混合图的详细步骤。 第四章阐述本文所建立的混合图结构在图像匹配中的应用。描述图像是为了能 为其他图像处理带来方便,本文建立的混合图除了描述图像之外,还能用于高层图 像应用图像匹配。先简要介绍有关图像匹配的概念,在给出如何利用图像混合 图结构进行匹配。匹配过程分为关联图的生成和搜索关联图最大子团两大部分。由 最大子团就可以得出图像之间的匹配相似度。 第五章通过实验验证混合图在图像匹配中的可行性。该章建立了医学图像的混 合图结构,并用第四章介绍的方法对医学图像进行匹配。 第六章总结全文 第一章图像及其基本概念 1 1 图像的概念 第一章图像及其基本概念 第一节背景知识 图像( i m a g e ) 是人类获取和处理信息最主要来源,约占普通人获取总信息的 6 5 。“图”广义上是物体反射或者透射光的分布;“像”是人类视觉信息系统接收图 信息并在脑海中产生的认知或印象。常言道“一图胜千言”,成语“图文并茂”、“按图 索骥”等,都形象说明了图像和人类生活息息相关。人类视觉有能力获取、解译丰富 的视觉信息,图像可将客观事物真实地展现在人们面前,供人们观察判断。此外, 图像也是人类表达心情、抒发情感的重要方式。 图像是三维世界的二维映射。广义上可理解为是用各种摄影测量系统以多种手 段和形式观测客观世界而得到的、人眼可直接、间接感知的客观实体【l 】。人眼就是 一个精细的观察系统,通过眼睛和视网膜敏感细胞,光从视觉环境进入我们的视觉 系统,感知到的图像就是客观物体在人脑中所形成的印象与认识。图像的存在形式 多种多样,如相片、x 光片、心电图、剪贴画、甚至文档等。不同领域获取图像的 方法也不尽相同:常见的数码照片,是由数码相机通过电子传感器把光学影像转换 成电信号数据;医学领域用到的c t 影像,是用x 光射线对人体层面进行扫描,其 强度因和不同密度的组织相互作用而产生相应的吸收和衰减而得到;地理信息系统 的遥感图像,则是利用遥感卫星所探测到的强弱不同的电磁波辐射( 反射或散射) , 转变成强弱不同的色调以构成图像。 计算机处理的图像主要是数字图像,所谓数字图像( d i g i t a li m a g e ) 是指以二进制 数字形式存储、传输和处理的图像。它是模拟图像经采样、量化、编码,即把模拟 图像离散化为计算机可识别处理的图像形式1 2 。数字图像和传统图像相比,有诸多 优点。主要表现为:( 1 ) 可再现性:数字图像与模拟图像的根本不同是它不会由于图 像存储、传输等一系列复杂变换而导致图像质量退化。数字化时准确地保留相关信 息,则数字图像处理过程始终能保持图像的原来特征。( 2 ) 精度高:只有有适当的图 像处理设备,利用计算机技术可将模拟图像数字化为像素任意大小的二维数组。因 此数字图像可广泛应用于精度要求高的应用场合。( 3 ) 应用面广:数字图像可由多种 福建师范大学工学硕士学位论文 信息源产生,如电子显微镜、数码照相机、甚至天文观测仪,应用面几乎涉及所有 学科领域。( 4 ) 可运算性:数字图像易于非线性处理,如非线性插值、滤波等,人们 就可对数字图像进行复杂的数学运算,以适应不同的需求。 数字图像是按一定顺序排列的明亮度不同的像点组成,形成像点的基本单位叫 做像素,换句话说,组成一幅图像的最小单位就是像素。从计算机视角看,像素是 计算机图像操作处理所能控制的最小单位r 7 1 。像素之间是有距离的,通常是根据距 离度量来定义像素距离【l 】。目前,比较常用的距离度量有三种,分别为欧式距离, 仇距离和d 8 距离。具体和距离度量有关的知识可详见参考文献【3 】 4 】。 1 2 像素的邻域 在介绍区域之前,有必要介绍像素的邻域。邻域( n e i g h b o r h o o d ) 是由一个像素和 它的邻近像素( 近邻像素) 组成的一个集合f 3 】。设存在一像素p ( x ,力,根据邻近像素意 义的不同,可以定义像素p 的不同邻域,常用的邻域有以下三种: ( 1 ) 4 邻域:p 的4 邻域记为n 4 ( p ) 。由p 水平和垂直方向上的4 个邻近像素构 成,这些邻近像素的坐标分别为( x + 1 ,y ) 、( x l ,y ) 、( x ,y + 1 ) 、( x ,y 一1 ) 。图1 1 ( a ) 是4 邻域的示意图,为构成p 的4 邻域的4 个像素。 ( 2 ) 8 - 邻域:p 的8 一邻域记为n s ( p ) ,它是由p 的4 一邻域像素再加上四个对角方向 上的像素构成。这些像素坐标分别为( x + 1 ,y ) 、( x l ,y ) 、( x ,y + 1 ) 、( x ,y 一1 ) 、( x 一1 ,y 1 ) 、( x 一1 ,y + 1 ) 、( x + 1 ,y + 1 ) 、( x + 1 ,y - - 1 ) 。8 - 邻域的示意图为图1 1 ( b ) , 其中,表示p 中四个4 邻域像素,s 表示四个对角方向上的像素。 ( 3 ) 对角邻域:p 的对角邻域批( 力则由p 的四个对角方向上的像素构成。这些邻 近像素的坐标分别为( x + 1 ,y + 1 ) 、( x + 1 ,y 一1 ) 、( x 一1 ,y + 1 ) 、( x 一1 ,y 一1 ) 。 图l - 1 ( c ) 为m ( p ) 的示意图。 口口盟 图1 - 1 像素的邻域 f i g u r e1 - 1p i x e ln e i g h b o r s 0 第一章图像及其基本概念 1 3 图像的区域 像素的邻域可构成区域,区域( r e g i o n ) 是图像上具有强相关性且彼此连通的像素 组成的集合,它是本文中的十分重要的概念。区域内的像素都具有某一方面相似的 性质,如颜色、纹理等。两个像素间存在一条路径z ,这两个像素就是连通关系, 区域就是一组连通像素的集合。区域可定义如下:设某像素尸到像素q 的路径,为 序列 a l ,a 2 , a 3 。,么n 其中a l = p ,a n = q ,a t + j 是a 的邻接点,i = l n l :那么区域 是一个满足任意两个像素之间都至少存在一条完全属于该集合的路径,的集合。 本文所研究的图像描述与图像匹配都是基于区域的,即区域是文中研究对象的 基本单元,而并非像素。先介绍与区域有关的几个概念: ( 1 ) 子区域:设r 是一区域,对于任意像素0 ,f ) r 均被r 中的某条闭合路径z 包围,则硝是r 的子区域。相应尺为掣的父区域。从子区域定义可知:子区域都有 唯一的父区域,且它可以同时是另一个区域的父区域;一个区域可包含多个子区域。 ( 2 ) 相邻区域:设有区域r 、晨,且r 与j i i 互不包含,像素p 辰,至少存在p 的一个邻接像素g r ,则称r 是r 的相邻区域。 ( 3 ) 区域边界:区域r 外界限上所有像素集合称为尺的区域边界。这里指的是区 域外边界,同理可定义区域内边界。 定义了区域,一幅图像j 就可看作是由若干个不相交的区域r ,( 卢1 ,2 n ) 组成。 p ( r i ) 是尼的逻辑谓词,且满足: ( 1 ) u r i = ,; i = 1 ( 2 ) 对所有的i 和j ,i j ,尼n 母= o ( 3 ) 对i = 1 , 2 ,玎,满足以尼) = t r u e ( 4 ) 对i j ,满足尺尼u 母) = f a l s e : ( 5 ) 对i = l ,2 ,3 e l , r f 是连通区域。 第二节图像结构及语义联系 1 1 图像结构 事物都是有一定的内在结构,结构是事物最基本的特征【1 6 1 ,它决定了事物基本 可 1 每 福建师范大学工学硕士学位论文 单元以何种方式构成整体事物。一幅有意义的图像也必定有其特定的结构。图像结 构是指图像基本单元之间的关系,它规定了图像中有什么、以及单元内部之间相互 关系。以区域作为图像基本单元,图像结构可理解为是区域与区域之间的空间位置 关系。按某种规则提取区域间关系,就可以对图像目标物体空间排列有一定的了解。 图像结构还很大程度上决定了和这种结构相关算法的效率。如以区域作为基本单元, 比像素作为基本单元在融合、比较等操作效率来的高。 图像结构一般分为四个层次进行研究,但层次间并非存在严格的划分【2 】。第一 层结构是像素,着眼于对最底层数据的分析。第二层结构是区域,区域是图像经分 割后得到的。每个区域不仅自身含有特定的图像信息,还可应用于边界的线段,表 面二维区域等。第三层结构是图像的几何表示。当涉及图像中物体运动变化或目标 区域形变时,利用几何结构可将复杂问题简单化。第四层结构是图像结构式关系模 型。关系模型是从源图像自身信息中利用事先定义的规则抽取而来,得到的信息可 以表示为语义网络或模型【2 】。研究图像中目标( 区域) 之间的相互关系也是高层图 像处理的重要内容。在图像理解中,知道目标之间的本质联系可以加快对理解图像 的速度、改进图像理解的结果。 1 2 图像的语义 前面多次提到图像“语义”,这是一个较为抽象的概念。图像描述的一个重要目 标就是把图像内在的语义联系用一种适当的结构形式给予表示。语义联系是图像目 标实体的高层关联【1 5 1 ,并结合人民先验知识。目标实体间的语义关系包括分形尺度、 周围目标的相对位置以及全局关系。例如,如果图像中出现了太阳,则存在蓝天白 云的可能性加大;出现了数学运算符号,则存在数字的可能性加大。掌握这些语义 关系对于指导高层图像处理具有实在的意义。通常语义关联分为空间上下文( s p a t i a l c o n t e x t ) 和情景上下文( s c e n ec o n t e x t ) 。 ( 1 ) 空间上下文 空间上下文是关于里奥毕德曼的位置关系类别【1 5 1 。场景中存在2 类空间约束: 第一种是场景中目标间的共生关系,正如上例运算符号与数字的出现概率关系。第 二种是图像中目标的空间位置关系,如眼镜通常在人脸上出现、书本通常在书架上 等。此两种空间约束都能为研究人员理解图像提供有用的先验知识和线索。 ( 2 ) 情景上下文 第一章图像及其基本概念 情景上下文不同于空间上下文,它是利用深度( d e p t h ) 1 6 l 作为重要信息进行判断。 情景中的各种信息源于深度都有关【1 5 1 。平面图形深度从二维图像中获取,得到像面 积、阴影、相对亮度、颜色等信息。深度排序( o r d e r i n go fd e p t h ) 是研究目标实体关 系的重要方法,对物体识别等基本任务都很重要。 综上所述,语义是图像高层处理的重要先验知识,但由于其高度抽象化,受主 观影响也大,目标还未形成一套成熟的体系构架,但有效地描述图像是获得知识语 义信息的重要途径。 第三节本章小结 计算机图像处理主要是针对数字图像。数字图像的基本单位是像素,也就是说, 数字图像是像素的集合。若干个具有某一类相同性质的像素又构成一个邻域,邻域 是像素间连结性的表现形式,常见的有4 邻域、8 邻域和对角邻域三种。进一步研 究邻域时,像素的邻域可构成区域,区域是一组具有强相关性且彼此连通的像素组 成的集合,其具体定义详见1 3 节。定义区域概念后,以区域为单位讨论图像的高 层性质、拓扑结构等可化简其研究的复杂性,不必拘泥于一些像素级的细节。本章 最后讨论了图像结构和图像语义联系的内涵,它们是获取图像中知识语义信息的重 要途径,但两者具有一定的主观性,且高度抽象化。 福建师范大学工学硕士学位论文 1 2 第二章区域的图像描述 第二章区域的图像描述 为了有效地对图像进行处理与分析,人们往往先把已知的图像分割为若干个有 意义的区域,再研究每个区域的局部特性,并综合所有区域特征的基础上研究图像 整体性质。这种由小到大、由局部到整体的循序渐进方法是很重要的。 每个区域都有特定的属性或特征,并与相邻区域的属性特征存在差别( 否则它 们在图像分割过程中被视为同一区域) 。因此,对区域的属性特征进行量化就可描述 这个区域。表示单个区域时,通常是考虑区域形状特征和区域边界( 轮廓) 特征。 第一节基于区域形状的描述 形状是事物的固有属性,它是事物的存在或表现形式,但要精确定义形状却很 困难【3 】。图像经过边缘提取和分割后,得到感兴趣的目标的区域与轮廓,进而得到 区域的形状。形状特征也是人们最关心的内容,基于区域形状的描述是用一些表征 区域自身性质的数值符号来刻画区域。在文献 2 8 】中,有大量这样的参数;如区域 面积、周长、矩形度、细长度等。这些形状参数对于较大区域的描述很适合;而对 于较小区域( 零星像素组成) ,由于计算机网格的离散化,其描述结果往往不是很理 想。下面介绍一些常用的形状描述参数。 1 1 区域面积 区域面积是区域包含的像素个数总和,即区域的大小。它是区域的根本属性之 一【4 】。存在某区域r ,r 由表示为多边形顶点( i n k ,甩k ) ,且满足沏o ,n o ) = 彻k ,n k ) ,则 区域面积彳为: 1i n - !i 么( r ) = 专i 二( r a m i + l 一聊i + i n t )
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 临床基因扩增检验技师考试试卷及答案
- 2026年高考物理终极冲刺:专题15 实验与探究(五大题型)原卷版
- 2025山西吕梁交口经济技术开发区建设投资有限责任公司招聘工作人员9人笔试历年参考题库附带答案详解
- 2025山东济南平阴县鲁中山河科技发展有限公司招聘4人笔试历年参考题库附带答案详解
- 2025安徽省泗县泗州戏演艺有限公司招聘演员4人笔试历年参考题库附带答案详解
- 2025四川长虹华意压缩机股份有限公司招聘16人笔试历年参考题库附带答案详解
- 2025四川深圳九州光电子技术有限公司招聘操作员等岗位35人笔试历年参考题库附带答案详解
- 2025四川九洲电器集团有限责任公司招聘硬件研发岗(逻辑工程师)(校招)等岗位33人笔试历年参考题库附带答案详解
- 2025内蒙古润蒙能源有限公司招聘22人笔试历年参考题库附带答案详解
- 2025云南黄金矿业集团股份有限公司第三次招聘工作人员6人笔试历年参考题库附带答案详解
- 2026云南楚雄州武定县事业单位选调37人备考题库及答案详解(真题汇编)
- 2026糖尿病护理动态血糖监测操作课件
- 《特种设备使用管理规则 TSG08-2026》解读
- 高中政治必修+选必核心答题术语(简化版)
- 经典酒店设计案例分析
- 医院5.12活动策划方案(3篇)
- (2026春新版)北师大版二年级数学下册全册教学设计
- 燃气爆炸案例分析
- 湖北省圆创高中名校联盟2026届高三2月第三次联合测评语文试卷(含答案解析)
- 医院空调安装施工方案
- 2026黔晟国有资产经营公司校招面笔试题及答案
评论
0/150
提交评论