(机械设计及理论专业论文)彩色图像感兴趣区域自动提取技术研究.pdf_第1页
(机械设计及理论专业论文)彩色图像感兴趣区域自动提取技术研究.pdf_第2页
(机械设计及理论专业论文)彩色图像感兴趣区域自动提取技术研究.pdf_第3页
(机械设计及理论专业论文)彩色图像感兴趣区域自动提取技术研究.pdf_第4页
(机械设计及理论专业论文)彩色图像感兴趣区域自动提取技术研究.pdf_第5页
已阅读5页,还剩66页未读 继续免费阅读

(机械设计及理论专业论文)彩色图像感兴趣区域自动提取技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

查堡翌二兰尘:堂堕主堂焦笙塞 摘要 图像的感兴趣区域r o i ( r e g i o no f i n t e r e s t ) 压缩编码技术,即在图像中的感兴趣区域 ( r o i ) 进行无损或近无损压缩,而在其它区域采用有损压缩,从而既可以获得所期颦的 高质量的f 磊像信息,又保持了较高的压缩比,很好地解决了压缩比和图像质量之阳j 的矛 盾。 感兴趣区域编码是j p e g 2 0 0 0 的重要功能之。r o i 的提取是实现该功能的首要问 题。图像分割的技术可以用来作为提取r o i 的基本手段。本文针对多幅具有相同目标 的彩色图像,实现了r o i 自动提取。提取的方法为:首先从一幅图像中指定包含目标 的矩形区域作为r o i ,提取和描述r o i 特征。对其它图像进行边缘检测,q j 成包含边缘 的矩形区域作为r o i 检索区域。运用已记录的r 0 1 特征与其它图像中的r o i 检索区域 进行匹配,得到相似度较大的区域为r o i ,完成r o i 的自动提取。针对本文的研究列 象,本文做了以下工作: 1 ) 彩色图像的r o i 自动提取。现有的r o i 提取算法大部分针对次度图像,这些算 法对彩色图像的r o i 提取并不能直接适用,本文在研究现有算法的基础e 制定了对包 含相同目标的多幅彩色图像的r o i 提取方法,实现了对这类彩色图像的r o i 自动提 取。 2 ) 彩色图像包含的颜色信息丰富,单独采用一。种图像分割方法,很难完整的提取 f 1 标。本文在r o i 提取的前期处理图像分割时,采用模糊聚类和边缘检测结合的 方法实现较完整的提取目标。 3 ) 在不能得到目标封闭轮廓的情况下,本文规定了不封闭轮廓的特征描述方法; 拟订了针对这类图像的匹配策略。 关键词:图像压缩;图像分割;感兴趣区域 彩色图像感兴趣区域自动提取技术研究 a b s t r a c t t h e i m a g ec o m p r e s s i o nt e c h n o l o g y b a s e do n r e g i o no f i n t e r e s tu t i l i z e sd i f f e r e n t c o m p r e s n o n t od i f f e r e n ta r e ai na ni m a g e ;i tc a ns o l v et h ec o n t r a d i c t i o nb e t w e e nt h ei m a g e q 蹦i t y a n dt h e c o m p r e s s i o n r a t e r o i e n c o d i n g i sa n i m p o r t a n tf u n c t i o no f j p e g 2 0 0 0 r o i e x t r a c t i o ni st h ef i r s ts t e pt o r e a l i z et h i sf u n c t i o n i m a g es e g m e n t a t i o nc a l lb eu s e di nt h i ss t e pt h e p a p e rc o m p l e t e s e x t r a c t i n gr o i i na g r o u po f i m a g e t h a ta l w a y si n c l u d eas a m e o b j e c t t h ee x t r a c t i n gm e t h o d i s a tf i r s ta p p o i n ta r e c t a n g l er e g i o n t h a ti n c l u d e st h eo b j e c ta sr o i ,e x t r a c tt h ef e a t u r eo f r o ia n d r e c o r di t w h e ns e a r c ht h er o ii no t h e ri m a g e s ,i tu s e st h ef e a t u r e ,w h i c hh a sb e e n r e c o r d e d 佃 g e tt h er o i t h e m a i nw o r ko f t h e p a d e r i n c l u d e : i ) t h ep a p e r r e a l i z e sr o ia u t o m a t i ce x t r a c t i n gi nag r o u po fc o l o ri m a g e t h er o i e x t r a c t i o na l g o r i t h m st h a th a v eb e e np u b l i s h e da r em a i n l ya b o u tg r e yi m a g e ,t h e y c a n tb eu s e d i nc o l o ri m a g e d i r e c t l y 2 1c o l o ri m a g ei n c l u d e sm u c hi n f o r m a t i o n ,i t c a n tg e ta l lp i x e l & o b j e c tb ya s i n g l e m e t h o do f i m a g es e g m e n t a t i o n t h ep a p e ra p p l i e sf u z z c l u s t e r i n gc o m b i n e w i t he d g e d e t e c t i n g t os o l v et h i sp r o b l e m 3 ) i nc a s et h a tc a n tg e tt h e c l o s e de d g eo f o b j e c t ,i td e f i n e sn o to n l yt h ed e s c r i p t i o n m e t h o do f o b j e c t ,b u ta l s ot h em a t c h i n gp o l i c yo f t h i st y p eo f i m a g e k e yw o r d s :i m a g ec o m p r e s s i o n ;i m a g es e g m e n t a t i o n ;r o i i i 独创性说明 作者郑重声明:本硕士学位论文是我个人在导师指导f 进行的研究 上作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为狭得 大连理工大学或其他单位的学位或证书所使用过的材料。与我一同工作 的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢 意。 作者签名: 湍稆萼 日期:生丛兰堡! 望 人连理1 人学硕士。、位论文 1 绪论 在社会生活和科研生产活动巾,人们每时每处都要接触图像。图像信息足人类认识 世界的重要知识来源,人类所得的外界信息有7 0 以卜是来自眼睛摄取的图像。粗:诈多 场合,没有任伺其他形式比图像所传送的信息更丰富和真切。当计算机渗透到人们生活 的每1 个角落时,数字图像逐渐成为人们生活中的一部分。数字图像处理以自己独特的 技术特色形成了较完善的科学体系,从而成为门独立的新学科。 进入信息时代以后,随之而来的便是“信息爆炸”的问题。整个世界都存追赶信息 的大潮。信息高速公路犹如社会的血管,连接着社会经济的各个角落。信息是财富,信 息是知识,信息甚至是生命。随着计算机和通信技术的发展,人们对于各种视频和多媒 体信息的需求不断增长。信息交换的速度在过去几十年里急剧地增长。随着速度的增 长,j 其是随着i n t e m e t 的普及和一些新型的宽带业务,例如:可视图文、可视电话、视 频点播等相继出现,对传输带宽等基础资源提出了更高的要求。数字化图像的数据量是 相当巨大的,在图像数据库中用到的2 4 b i t 真彩色静i 卜图像,若其分辨率为1 0 2 4 x1 0 2 4 , 则产生近3 m b i t 的数据。视频图像信号则要求更高的数据传输率( 高清晰度电视( h d t v ) 信弓要求有1 0 0 m b w s 以上的数据传输率) 。计算机的存贮容量每两年就翻了一番,通信 网络也以更宽的频带传送信息,可我们依旧感到计算机存贮容量不够,通信网络还是太 慢 这是因为信息量的增加远远超过了存贮和通信能力的增长,乃至我们感到信息高速 公路并不高速。人4 f i r e 在积极地寻求解决这些问题的办法,数据压缩就是极为有效的方 法之一。 为了更有效地利用存储资源和满足各种信息传输系统的传输速率的要求,超低比特 率的数字视频、图像编码方法显得越柬越重要,迫切需要在满足一定的恢复图像的质量 的前提下,探索提高图像数据压缩比的新的理论与方法。因此,海量数据压缩技术的改 进与提高,是多媒体信息传输与存储的瓶颈问题。1 f 是数据压缩技术的发展和进步,推 动了视癫j k 务的迅速发展,从c d r o m ,激光视盘、数码相机、可视电话、视频会议、视 频监视和视频邮件,到交互式视频服务汞1 3 h d t v 等【4 1 4 。 1 1 图像数据处理概述 当今社会的一个重要特征是高度信息化。信息意味着主动权,意味着胜利。图像作 为信息的主要载体,其处理技术已成为一种尖端技术而被各国竞相研究。 彩色图像感兴趣区域自动提取技术研究 图像数据处理与数学的结合非常密切,其研究的内容主要包括以下几局面。,: 1 图像数字化将模拟形式的图像通过数字化设备变为数字计算机可用的离散 的图像数据; 2 图像变换改变图像的表示域和表示数据,使处理更加方便; 3 图像描述与分析列图像中各部分的属性及各部分之间关系的分析表述; 4 图像数据压缩减少图像数据量,便于传输和存储; 5 图像去噪及修复去除失真图像的噪音,使处理后的图像尽量接近原始图 像; 6 图像增强以增强图像分辨率等为目的,改善图像质量; 7 边缘检测检测图像中某部分的视觉边沿; 8 目标识别将图像中的特定部分辨别出来; 9 图像分割根据选定的特征将图像划分成儿个有意义的部分,从而使原图像 存内容表达上更为简单明了; l o 图像重构将处理的数据还原为图像。 图像处理所用的数学方法以信息论为基础,主要分统计方法和分析方法两种。分析 方法囚其理论的完善及满意的实践结果而为人们广泛应用。 数字图像处理系统基本的三个部件是口】:图像输入设备、执行处理分析与控制的计算 机及剧像处理机、输出设备、存储系统中的图像数据库等的存储设备。一幅图像在剧计 算机进行处理前必须先转化为数字形式,计算机刁能进行处理。在计算机中我们用一个 数字整列来表示一幅图像。图像被划分为称作图像元素( p i c t u r ee l e m e m ) 的d n _ 域,简称 其为象素( p i x e l ) 。赋予每个象素位置的数值反映了l 割像上埘应点的亮度。在每个象素的 位置,图像的亮度被采样和量化,从而得到图像对应点上表示其明暗程度的一个整数 值。对所有象素都完成上述转化后,图像就被表示成个数字矩阵。每个象素具有两个 属性:位置和灰度。位置由扫描线内的采样点的坐标决定,而表示该象素位置上的明暗 程度的整数称为灰度。此数据矩阵就成为计算机处理的对象了。图像处理过程是根据操 作员的指令,调用和执行图像处理程序对数字图像进行一系列的操作,以达到定的同 的。操作完成后的处理结果通过定的设备显示出来,转化为可视的和供人们解释的图 像l ”1 。 一2 大连理ii 人学硕十学位论文 1 2 数据压缩的基本概念 所谓数掘压缩,就是用较少的码米表示特定的信息。由于信息流之间存在菜些相关 性,如重复字符申,用较少的码来表示信息是可能的。 数据堰缩技术大致经历了两个发展阶段。1 9 7 7 年到1 9 8 4 年为基础理论研究阶段, 1 9 8 5 年以后就实用化了但这两个阶段的界定并小是特别的明显,冈为,即使在1 9 8 5 年 以后,有关数据压缩的新理论和新方法还在不断涌现,应用的层次也越柬越岛。 数字图像处理过程中一般经常要产生很多的包含图像数据的大型义件。他们经常需 要存不同的用户及系统之问互相交换,这就要有一种有效的方法来存储及传递这些文 件。图像数据文件通常包含着数量客观的冗余信息,这为现代数据压缩技术提供了町 能。 图像数摒压缩,就是减少表示图像信息的码数,即将图像信息转变成另一利唷将数 据量缩减的表达形式,也称之为编码( e n c o d e ) 。存显示时。重新将编码数据形式转回到 位图形式,称之为解码( d e c o d e ) 。编码的压缩比是指编码前后的数据量的比值。恢复图 像的质量用峰值信噪k g ( p s n r ) 来表示,计算公式如下: ,s s 2 p 跗限= 1 0 l o g 1 n m s e ( 1 1 ) 其中 脚2 爿鬲荟丢 。) 叭t 力) 2 坛j v 为图像的j 丈和宽。颤f ,) ,几i ,j ) 分别表示原图像和重构图像的象素值。 虽然表示图像需要大量的数据,但图像数据是高度相关的。例如图像的背景r u 能足 一堵墙,由于它显示出规则的模式,那么该图像数据具有很大的空蚓冗余。图像数挢之 所以能被压缩,是因为图像数据中存在着冗余。数据冗余主要有以下三类: l 、空间冗余。这是图像数据经常存在的一种冗余,是由同一幅图像的相邻像素的 丰日天性引起的。静止图像压缩的个目标是在保持重建图像质量可以被接受的同时,尽 量去除空间冗余。 2 1 时间冗余。这是序列图像经常包含的冗余,它由序列图像中的不同帧之间存在 的相关性所引起。 3 ) 信息熵冗余。也称编码冗余,由信息论的有关知识可知,为表示图像数据的一个 象素点,只要按照其信息熵的大小分配相应的比特数。但实际图像数据的每个像素很难 3 彩色图像感兴趣区域门动提取技术研究 得到它的信息熵。因此每幅数字图像的像素使用相同的比特数表示的,这样必然存在冗 余。 4 ) 知识冗余。有些图像中包含的信息与某些先验的基础知识有关,例如一般人脸 图像中五官的相对位置等信息就是一般常识,这种冗余我们称为知识冗余。 上述各种形式w , j g t l 余是编码压缩图像数据的出发点。图像数据压缩的目的是要通过 去除这些冗余来减少表示图像数据所需的比特数,从而缩小信号空问。 图像数据压缩一般分为无损压缩和有损压缩两类。 第一类为无损压缩,原始图像数据可以从压缩后的数据完全重新构造出来,信息没 有损失。人们希望能对信息作高倍压缩,且还原后的信息不损失,即无损压缩。这种胍 缩模式在许多应用领域是必须的,如银行业务,证券信息,计算机程序等。但理沦和实 践证明,这类无损压缩的压缩率是极为有限的。 开创无损压缩技术先河的是以色列两位教授。1 9 7 7 年他们提出了用较短的符号代替 冗余字符串的思想,通常称为l z w 算法。除此以# l h u f r n a l l 编码和算术编码也是无损压 缩技术的常用算法。 无损数据压缩算法可分为两人类:基于字典的技术和基于统计的方法。基于字典的 技术生成的文件包含的是定长码,每个码代表源文件中数据的一个特定序列。基丁:统计 的方法通过用较短代码代表频繁出现的字符,用较长代码代表不长出现的字符,从而实 现数据的压缩。基于字舆技术的典型的无损压缩有行程编码、l z w 编码等。经典统训 编码方法有:h u f m a n 编码、f a n o s h a n n o n 编码、算术编码等。无损压缩的压缩比较低, 一般住2 3 倍左右。 第二类称为有损压缩,这种压缩允许重构图像与原始阿像有一定误差,但人的视觉 可接受或能满足用户的要求。对于视频、音频信息及今天的遥感信息这样一类信源,压 缩技术一般采用有损的,即恢复后的信息与原信息不严格相同。这是因为,这类信息的 感知对象是视觉系统和听觉系统,而视觉系统和听觉系统对所感知的对象有很宽广的适 应性。图像的分辨率也越来越高,无损压缩技术往往还难以解决图像的存贮与传送,冈 而,有损压缩技术也纷纷被采用。 有损压缩主要有特征提取与量化两大类。典型的有损压缩技术有预测编码、予带编 码和变换域编码等。如静止图像压缩i :1 4 j j p e g 标准,就以离散余弦变换( d c t ) j , j 核心编码 技术,对自然景物的灰度图像编码,压缩比可达十几倍到几十倍。量化的方式有:无记 忆量化和带记忆量化。无记忆量化器是输出仅由当前的输入所决定而与以前或以后的输 入都无关的一类量化器。带记忆量化器考虑了信号各样值之间的相关性,也就是说,知 4 大连理l :大学硕士学位论文 道了一个样值的参数,其邻近的样值的情况也町以做一些推断。带记忆量化的方法广泛 的应用于语言、图像等实际压缩中。预测差值编码p c m ) 、增量调制、矢量量化等方 法都属于带记忆量化。 1 3 数据压缩的发展现状 近十年来,图像编码技术得到了迅速的发展和广泛的应用,并日臻成熟,其标志就 是几个关于图像编码的国际标准的制定,即i s 伽e c 关于静止图像的编码标准 j p e g c c i t t 关于电视电话会议电视的视频编码标准h2 6 1 ;n i s o i e c 关于活动图像的编 码标准m p e g 1 ,m p e g 2 。这些标准图像编码算法融合了各种性能优良的传统图像编码 方法,是对传统编码技术的总结,代表了当前图像编码的发展水平。 目前按照这些压缩标准实现的实用系统使用经典的d c t ( 离散余弦变换) 和运动补偿 预测技术。分块的d c t 的基本方法是把单帧图像分割成1 6 1 6 块或8 8 块,再对这样的 子块作变换。由于分块d c t , f 1 运动补偿预测技术自身的缺点,使得这几种标准算法住较 高压缩比时的性能不尽人意。而且从人眼的视觉特性考虑,基于的变换图像编码也1 i 能 提供充分利用人眼视觉特性的机制,所以迫切需要发展新的图像压缩编码算法。 8 0 h , t 年代中后划,相关学科的迅速发展和新兴学科的不断出现为图像编码的发展注 入了新的活力,人们对图像信息需求的剧增也有力地促进了图像压缩编码技术的进步。 许多学者结合模式识别、计算机图形学、计算机视觉、神经网络、小波分析和分形几何 等理沦开始探索图像信号压缩编码的新途径。同时,关于人类的视觉生理、心理特性的 研究成果也打开了人们的新视野,许多新型的图像压缩编码技术相继出现:m k u n t 于 1 9 8 5 年提出利用人眼视觉特性的第二代图像编码技术,1 9 8 8 年m b a r n s l e y 提出基于迭代 函数系统( i f s ,i t e r a t e df u n c t i o ns y s t e m ) 的分形图像编码技术,1 9 8 9 年s m a l l a t ,i d a u b e c h e 将小波分析理论应用于图像编码,以及9 0 年代初发展起来的基于模型的图像编码方法 等。 基于感兴趣区域的图像编码技术是最近出现的一种新兴方法。随着多媒体技术的不 断发展,网络用户的飞速增加,对高效率的图像编码技术要求越来越高。在数字图像处 i 哩过程中搬要产生很多的包含图像数据的大量文件,它经常需要在不同的用户及系统 之间互相交换,这就需要有一种有效的方法来存储及传递这些大量文件。而且在很多情 况卜j ,传输的图像中只有- - d 块区域对用户是有用的。对这些有用的区域,采用低压缩 比,而此区域之外的区域,则采用高压缩比,在保证不丢失重要信息的同时,又能有效 压缩数据量,这就是基于感兴趣区域的编码方案所采取的策略。它是f 存制定的静止图 5 一 彩色图像感兴趣区域自动提取技术研究 像压缩的新国际标准j p e g 2 0 0 0 的及其重要的优点。1 。随着标准制定的深入,感兴趣区域 的编码理论及方法的研究将会越来越显示出它的重要性和优越性。 1 4 国内外关于j p e g 2 0 0 0 的研究现状 由于j p e g 2 0 0 0 是一个非常新的标准,所以以它为基础开展的研究目前并不是很 多,国外进行相关研究的厂商相对多一些,其中大多数接受的是数码相机厂商的赞助进 行研究的部门。目前研究比较深入、且有一定成果的主要是以卜一些研究机构或者公 司: l u r a t e c h 的l u r a w a v es m a r t c o m p r e s sf r e e w a r ef o rw i n d o w s 。 l u r a t e c h 是j p e g 2 0 0 0 标准确定后反应最快的技术应用j 一商之一,他们所主导的 l u r a w a v e ( l w f ) 及l u r a d o c u m e n t ( l d f ) 格式,已经迈入了成熟的应用阶段。另 外,该公司的产品已经形成了完整的系列,包括浏览外挂插件,p h o t o s h o p 外挂插 件,独立的编码软件,他们还和a c ds y s t e m 公司签订协定,在使用率最高的图形管理 软件a c d s e e 3 0 上,提供j p e g 2 0 0 0 l w f 格式的外挂插件。该公司也是目前对 j p e g 2 0 0 0 研究最多,最深入,产品丰富的厂商。 e l e c a r dw a v e l e ti m a g e c o m p r e s s o r 。 和前面的l u r a t e c h 比,它的编码速度比较慢,其推出的软件功能不强,而且只有 一个i ef 的用j a v a 来显示图象的插件,这个软件生成的文件其扩展名是w l t ,其图 像质量比l u r a w a v es m a r tc o m p r e s s 要差一些。产品成熟度明显低于前者。 d j v u 公司产品 该公司产品也比较齐全,这一点和l u r a t e c h 比较相似,但提供的软件体积都比较 大,而且在易用性方面也有一定问题,未经培训的人一般很难一次学会使用方法。 国内目前很少有研究机构对j p e g 2 0 0 0 进行全方位的研究,研究投入较少,因此国 内这方面的成果很少出现在书面教材中。 需要指出的,这些研究机构的研究方向多集中于如何建立起成熟的编码程序,也就 是商业应用方面,对于j p e g 2 0 0 0 标准的深度开发并不够,譬如r o i 功能,目前以上产 品还没有提供的。 一6 。 大连理丁大学硕十学位论文 1 5 现有的r o i 提取算法 对图像r 0 1 的提取,一般从两个方面着手解决。是利用图像分割的技术提取 r o i ,另外一个就是从人眼的视觉特性 发,通过模拟人眼的视觉特点,寻找特定的视 觉敏感区域,并将这些视觉敏感区域排序作为r o i 。 在图像分割的技术上主要从二三个方面来考虑实现技术:一是基于边缘分割的方法实 现r o i 的提取;二是基于区域生成的方法实现r o i 的提取;三是将边缘分割。j 区域生 成的方法综合运用,以求达到更佳的生成效果。 另外图像r o i 的提取与人的视觉行为密切相关,所以大部分的a r o i ( r o i 的机器 自动算法) 提取算法都会结合人眼的视觉特性来实现。这些算法与h r o i ( 人眼的r o i 自 动算法) 密切相关。c l a u d i o m 根据人眼的视觉特性提出为获取r o i 区域而采取的提 取局部极大值的六种图像处理算法。第一种算法是s y r m n e t r yt r a n s f o r m 对称转换;第? 种算法是d i f f e r e n c ei nt h eg r a y l e v e lo r i e n t a t i o n 沿灰度级方向的差;第三种算法是。 e d g e sp e r u n i ta r e a 每单位区域的边缘数:第四种算法是c e n t e r - s u r r o u n d ,a si nr e c e p t i v e f i e l d s & a n i m a l v i s i o n 作为可以接受的视觉的中心:第五种算法是e n t r o y 熵值;第六种算 法是。m i c h a e s o nc o n t r a s t m i c h a e s o n 对比度计算。【4 1 后来他又在文献【5 】中补充了p q 种算 法,即基于小波变换的算法、基于离散d c t 变换的算法、基于先g a s s i o n 滤波再 l a p l a c i a n 变换的算法和统计7 7 区域模板匹配的结果的算法。其核心思路就是通过以 上的算法先模拟人眼的视觉特性寻找人眼最敏感的视觉停留点( 即所谓的局部最大值 点) ,再采用簇群和排序的算法确定感兴趣区域的最后7 个视觉停留点集区域,最后再 综合运用其它方法最终实现r o i 区域提取。 1 6 本论文的主要研究内容及组织结构 1 6 1 本论文的主要研究内容 本课题主要从以下这几个方面对彩色图像的r o i 自动提取系统进行了研究: 1 1 分析了j p e g 2 0 0 0 标准,并着重研究个r o i 编码方式。针对具有相同目标的彩 色图像,设计了这类图像r o i 自动提取系统的各个模块,并设计其中几个关键模块的 实现方法。 2 1 对r o i 提取技术进行研究。针列本文的研究对象,拟订了实现方法。 3 ) 对模糊聚类的彩色图像分割算法进行研究。确定适合本文的算法,并针对本文 研究的图像做t * n 应的改进。 彩色图像感兴趣区域自动提取技术研究 1 6 2 本论文的组织结构 本论文的组织结构如下: 第一章绪论:介绍本课题的研究背景和需要解决的关键问题,概括了本文的 主要研究内容。 第二章系统总体结构及实现方法:分析了课题的研究对象,提出了系统晌总 体结构流程以及各模块的功能。 第三章j p e g 2 0 0 0 压缩标准:介绍j p e g 2 0 0 0 压缩标准的特点和编码方式。 第四章r o i 技术:对现有的r o i 算法做了分析,并介绍j p e g 2 0 0 0 中r o i 编码方式m a x s h i f t 算法。 筇缸葶图像分割:描述本文采用的模糊聚类算法和边缘检测中的s o b e l 算 予。阐述本文对模糊聚类算法在彩色图像分割时的改进之处。 筇六章r o i 提取:描述针对本文处理的图像的r 0 1 提取过程,并用实例说 明提取结果。 第七章结论与展望:对本论文工作进行了总结,并对下一步工作进行了展 望。 2 系统总体结构及实现方法 2 1 引言 目前在计算机行业使用的最为广泛的静态图像编码标准是j p e g ,正式名称就是 i s o1 0 9 1 8 。由于该编码标准算法简便,代价小,压缩比大,压缩质量也刁i 错,因此近 年来得到了大规模的应用,成为了计算机领域中使用最为广泛的图像标准。然而,随着 讣算机网络和计算机多媒体系统的发展,j p e g 渐渐暴露出一些严重的缺点: 1j 无法在单一码流中提供无损和有损压缩; 2 ) 在噪声环境中传输的效果较差; 3 1 编码不支持某些重要的特殊功能操作,譬如图像安全设置、感兴趣区域设置 等。如果要实现这些功能需要外加模块,消耗资源,效率抵。” 由于以上的种种缺点,j p e g 标准明显无法适应将来的图像压缩工作。而这些缺囊 多数是出于j p e g 本身的设计原理缺陷造成,因而人们不得不寻找一种新的编码方法来 替代j p e g ,于是j p e g 2 0 0 0 由此诞生。 8 大连理工大学硕十学位论文 2 2 课题的研究对象 j p e g 2 0 0 0 废弃了j p e g 的d c 、编码,转而采用先进的离散小波变换( d w 7 r ) 为 主的编码方式。由于采用了d w t ,因此从根本上改变了j p e g 的缺点,而j p e g 2 0 0 0 的 体系结构类似于j p e g ,且多数采用成熟技术,在实现上也很简便,效率则更高,压缩 比更大。凶此,它是j p e g 的理想的替代标准。 由于j p e g 2 0 0 0 允许编码器选择随机的形状和尺寸来进行优先处理,目f r o i 编码方 式,所以本文选择j p e g 2 0 0 0 压缩标准。 在现有的r o i 提取算法中,一类是a r o i ( r o i 的机器自动算法) 提取算法,它模 拟人眼的视觉特点寻找人眼最敏感的视觉停留点来提取r o i ,这类算法的缺点是,确时 候机器提取到的感兴趣区域并非是用户的所期望的。另外一类是交互式的r o i 提取算 法,它综合运用图像分析和模式识别领域的知识来实现。两类算法都是针对单幅的图 像做r o i 提取,现在随着图像处理技术的发展和数码产品的普及,出现大量的图像文 件,其中不少文件中含有相同的目标,例如数码相机拍摄的一组人物的照片。这类文件 的特点是目标( 人物) 相同,背景各不相同,本文的r o i 提取主要就是针对这类图 像。 2 3 系统总体结构 2 3 1 系统总体结构流程 本课题中的r o i 提取系统的总体结构如图2 1 所示。框图右侧是r o i 特征描述过 程,首先对一组图像中的任意一幅进行分析,提取r o i 的特征信息,最终将r o i 的特 征信息存入r o i 检索数据文件中。框图左侧是r o i 自动提取过程,对于其它图像,也 先进行分析并提取r o i 特征信息,然后利用r 0 1 检索功能模块和r 0 1 检索数据文什匹 配,通过比较提取到的多个r 0 1 特征信息与r o i 检索数据文件中的特征信息的相似程 度来完成r o i 的自动提取。 ,9 一 墅鱼塑堡壁茎垫堕塑鱼垫塑墼垫查坚壅 j其它图像 ! :里堡签型j 一! , ! r o t 检索区域 一 t 谴捶塞q | 一一 r o i 特征捕述 ! fj p e g 2 0 0 0 编码 f 图2 1r o i 提取系统结构图 f i g 2 1t h e c o n s t r u e t i o no f r o ie x t r a c t i o ns y s t e m 山整体结构框图2 1 可知,r o i 提取系统主要山以下几个功能模块构成:r o i 特征 描述模块、图像分割模块、r o i 检索区域模块、记录r o i 特征模块、r o i 匹配模块、自 动生成r o i 模块以及j p e g 2 0 0 0 编码模块,本论文主要研究了r o i 特征提取和描述模 块、记录r o i 特征模块、图像分割模块、r o i 检索区域模块以及r o i 匹配这几个功能 模块。 2 32 主要模块的功能说明及实现方法 1 r o i 特征描述模块 用户选择的r o i 是一个包含目标的最小矩形区域,本模块的功能是对选择的r o i 进行特征提取和描述。为了达到快速和简便的匹配,本文拟订的r o i 特征为:r o i 内 目标的边缘长度,由边缘得到的离心率和r o i 的颜色直方图。为了准确提取r o i 特 征,本文首先对选择的r o i 进行模糊聚类和边缘检测,从而获得r o i 内目标的边缘信 息,计算离心率和边缘长度,然后再统计r o i 的颜色直方图,完成r o i 特征提取。 1 0 一 豪面一,l一一壹一一壹 一 1 | , 盔垄里兰叁堂堡堂堡堡奎 2 记录r o i 特征模块 本模块的功能记录已提取到的r o i 特征信息,这部分信息是整个系统的公共信 息,指导其它图像自动提取r o i 。由于数据量小,不必采用数据库记录这些数据,本文 采用的方法是,在开辟一段动态内存守问,记录这些数据。在处理其它图像时直接从内 存中读m 这些数据,程序结束时释放这段空间,这样既方便义快捷。 3 图像分割模块 图像分割模块主要是对图像的前期处理,该模块的功能与r o i 特征描述模块rp 对图 像的前期处理功能一致,同样足刘图像做模糊聚类和边缘检测。 4 r o i 检索模块 图像经过边缘检测后得到许多边缘,这些边缘中并非每条都f 卜| 需要的。本模块首先 用8 邻接区域生长法获得边缘艮度,然后滤除和r 0 1 特征巾的边缘长度相差较人的边 缘,使剩余的边缘尽量少。分别用矩形区域将剩余的边缘包围起来,得到r o i 检索区 域。 5 r o i 匹配模块 r o i 匹配模块是系统的关键部分,它决定了是否能够得到准确的r o i 提取。水模 块的功能是将记录的r o i 特征信息与各个r o i 检索区域进行匹配,分别计算它们的相 似度,最后找m 最相似的检索区域作为该图像的r o i 。 2 4 系统开发平台介绍 本系统采用v i s u a lc + + 6 , 0 作为系统丌发平台,编程实现。v i s u a lc + + 6 0 是一 套强火的w i n d o w s 编程工具,在w i n d o w s 中能够完成的工作,都可以通过v i s u a l c + 十来实现。与其他的开发工具相比,它有如下儿个特点: ( n 拥有强大的编辑环境。v i s u a lc 十+ 拥有个强大的集成丌发环境 ( i d e ) ,工程的编辑、编译、调试都在这环境下进行,用,不必杂各个环境问 切换,大大提高了开发效率。 ( 2 )拥有强大的类库m f c 的支持。m f c 己成为w i n d o w s 系统开发中最重要 的类库之一,其类库丰富强大,是丌发w i n d o w s 程序的首选类库。 f 3 )拥有强大的凋试环境。在v i s u a lc + + 6 , 0 中可以设置断点、可以查看运 行栈、查看相应的变量信息等,而且对程序员常犯的内存使用错误,v i s u a lc q 卜电会 给山干爿应的警告,这些措施大大提高了调试的效率。 ( 4 、拥有较强的底层控制能力。与v i s u a lb a s i c 和d e l p h i 等快速开发工具不 同,v i s u a lc + + 有较强的底层控制能力,v i s u a lc + + 现在已经成为驱动程序开发的首 选工具。 f 5 )捌有强大的帮助系统m s d n 的支持。m s c n 中含有几g b 的文档和源代 彩色图像感兴趣区域自动提取技术w 院 码,这里几乎可以找到v i s u a lc + + 开发中遇到的仟何问题的解决方案。 ( 6 )拥有一个高效的编译器,产生的可执行文件体积小巧、运行速度快。 v i s u a lc + + 6 0 由于别编译器进行了大量的优化,最后产。牛的可执行文件运行速度 快,而且很小巧。相比v i s u a lb a s i c 、d e p h i 等工具,同类的代码v c 生成的可执行 文件基本上都是速度最快的。 ( 7 1 v i s u a lc + + 6 0 还有其他一些优秀的品质:比如强大的a p p w i z a r d 支持, 方便强大的c l a s sw i z a r d 等。 正因为v c h 6 0 具有以上的特点,其被应用于程序设计的众多领域,尤其在中等 和大型的程序丌发项目中。【l u ,1 1 , 1 2 1 2 5 多线程编程 本文的r o i 提取足针对一组图像文件,涉及同时读取多幅图像,在编程实现时采 用多线程编程,把对一幅图的操作当作一个线程,对一组图像的处理当作一个进程。【j d 所谓多任务通常包括这样两大类:多进程和多线程。进程是指在系统中正在运行的 一个应用程序;线程是系统分配处理器时间资源的基本单元,或者是进程之内独立执行 的一个单元。线程是进程的一条执行路径,它包含独立的堆栈和c p u 寄存器状态,每 个线程共享所有的进程资源,包括打开的文件、信号标识及动态分配的内存等。对于操 作系统而言,其调度单元是线程。一个进程至少包括一个线程,通常将该线程称为主线 程。一个进程从主线程的执行开始进而创建一个或多个附加线程,就是所谓基于多线程 的多任务。开发多线程应用程序可以利用3 2 位w i n d o w s 环境提供的w i n 3 2a p i 接口函 数,【乜可以利用v c + + 中提供的m f c 类库进行丌发。在v i s u a lc + + 6 0 编程实现时,本 文采用m f c 实现多线程编程。 2 5 1w i n 3 2a p i 下的多线程编程 w i n 3 2a p i 是w i n d o w s 操作系统内核与应用程序之间的界面,它将内核提供的功 能进行函数包装,应用程序通过调用相关函数而获得相应的系统功能。为了向应用程序 提供多线程功能,w i n 3 2a p i 函数集中提供了一些处理多线程程序的函数集。直接用 w i n 3 2a p i 进行程序设计具有很多优点:基于w i n 3 2 的应用程序执行代码小,运行效率 高,但是它要求程序员编写的代码较多,且需要管理所有系统提供给程序的资源。用 w i n 3 2a p i 直接编写程序要求程序员对w i n d o w s 系统内核有一定的了解,会占用程序员 很多时间对系统资源进行管理,因而程序员的工作效率降低。 1 2 大连理上大学硕士学位论文 25 2 基于m f c 的多线程编程 m f c 是微软的v c 开发集成环境中提供给程序员的基础函数库,它用类库的方式 将w i n 3 2a p i 进行封装,以类的方式提供给丌发者。由于其快速、简捷、功能强大等特 点深受广大开发者喜爱。 在v c 十+ 附带的m f c 类库中,提供了对多线程编程的支持,基本原理与基于 w i n 3 2a p i 的设计一致,但由于m f c 对同步对象做r 封装,因此实现起来更加方便, 避免了对象旬柄管理上的烦琐工作。 在m f c 中,线程分为两种:工作线程和用户接口线程。工作线程与前面所述的线 程一致,用户接u 线程是一种能够接收用户的输入、处理事件和消息的线程。 252 1 工作线程 工作线程编稗较为简单,设计思路与前面所讲的基本一致:个基本函数代表了一 个线程,创建并启动线程后,线程进入运行状态;如果线程用到共享资源,则需要进行 资源唰步处理。这种方式创建线程并启动线程时可调用函数: c w i n t h r e a d + a f x b e g i n t h r e a d ( a f x _ t h r e a d p r o cp f n t h r e a d p r o c ,l p v o i dp p a r a m , i n tn p r i o r i t y = t h r f , a d _ p r l o r i t y j n o r m a l ,u i n tn s t a c k s i z e 。0 ,d w o r d d w c r e a t e f l a g s = 0 :l p s e c u r i t j 二4 t t r i b u t e sl p s e c u r i t y a t t r s2 n u l l ) ; 参数p f n t h r e a d p r o c 是线程执行体函数,函数原形为:u t n t t h r e a d f u n c t i o n ( l p v o i dp p a r a m ) 。 参数p p a r a i n 是传递给执行函数的参数; 参数n p f i o r i t y 是线程执行权限,【叮选值; 7 f h r e a dp r l 0 i l l t yn o r m a l 、t h r e a dp r i o r j t yl o w e s t 、 t h r e a dp r i o r i t yh i g h e s t 、t h r e a dp r i o r i t yi d l e 。 参数d w c r e a t e f l a g s 是线程创建时的标志,可取值c r e a t e _ s u s p e n d e d ,表示线 程创建后处于挂起状态,调用r e s u m e t h r e a d 函数后线程继续运行,或者取值“0 ”表示 线程创建后处于运行状态。 返回值是c w i n q t a r e a d 类对象指针,它的成员变量m _ h t h r e a d 为线程旬柄,在 w i n 3 2a p i 方式下列线程操作的函数参数都要求提供线程的句柄,所以当线 c lj 1 4 建后可 以使用所有w i n 3 2a p i 函数对p w i n t h r e a d 一 m _ t h r e a d 线程进行相关操作。 一1 3 彩色图像感兴趣区域自动提取技术研究 252 2 用户接口线程 基于m f c 的应用程序有一个应用对象,它是c w i n a p p 派生类的对象,该对象代 表了应用进程的主线程。当线程执行完并退出线程时,由于进程中没有其他线程存在, 进程自动结束。类c w i n a p p 从c w i n t h r e a d 派生出来,c w i n t h r e a d 是用户接口线程的 基本类。我们在编写用户接口线程时,需要从c w i n t h r e a d 派生我们自己的线程类, c 1 a s s w i z a r d 可以帮助我们完成这个工作。 先用c l a s s w i z a r d 派生一个新的类,设置基类为c w i n t h r e a d 。注意:类的 d e c l a r ed y n c r e a t e 和i m p l e m e n td y n c r e a t e 宏是必需的,因为创建线程 时需要动态创建类的对象。根据需要可将初始化和结束代码分别放在类的i n i t l n s t a n c e 和 e x i t l n s t a i n c e 函数中。如果需要创建窗口,则可在i n i t i n s t a n c e 函数中完成。然后创建线 程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论