




已阅读5页,还剩69页未读, 继续免费阅读
(计算机应用技术专业论文)尺度图像分析及其应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
尺度图像分析及其应用研究 摘要 尺度空间分析及其应用是当前图像理解研究领域的热点和难点。适应图像 显示是一种视觉信息表达的过程,它通过根据场景与目标的参数信息,调整出 适合人眼观看或观测的图像。自动目标检测的核心是人类视觉注意的过程,它 通过研究场景中感兴趣的信息分布,标记出图像中目标的具体位置。尺度空间 分析方法,统一了精细尺度的精确性与粗糙尺度的易分割性这对矛盾,适合于 解决场景和目标之间的自动或半自动的图象分割。针对图像显示和图像检测等 问题,采用基于熵的尺度空间描述,分析图像中视觉信息分布的现象和过程, 全面地刻画这些现象的本质特征。本文的主要工作如下: 1 分析了全体图像和个体图像之间特征的统计特性,研究了基于熵的内容 尺度的描述能力,初步给出场景与目标的基本判别结论,并进一步利用角点特 征来直观地评价尺度图像。 2 实现了基于四叉树分层的数据结构,给出了自项向下和自底向上的图像 尺度分割方法,有效确定了视觉信息在图像中的分布,实现了多尺度图像分析 的过程。 3 利用g a u s s i a n 函数特性的g a b o r 滤波器,给出了自适应图像显示的一种 有效方法。基于熵的视觉选择注意,和基于p c a 方法的尺度描述和目标分类, 共同实现了自动目标检测完整的过程。 关键字:尺度空间:自适应图像显示;自动目标检测;视觉选择注意;熵 r e s e a r c ho ns c a l es p a c e i m a g ea n a l y s i s a n di t sa p p l i c a t i o n s a b s t r a c t s c a l es p a c ei m a g ea n a l y s i sa n di t sa p p l i c a t i o n sa r et h eh o t s p o ta n dd i f f i c u l t y i ni m a g eu n d e r s t a n d i n ga r e a a d a p t i v ei m a g ed i s p l a yi sak i n do fv i s u a li n f o r m a t i o n e x p r e s s i o n t h ep r o c e s sf i t st h ei m a g e sf o ro u r s w a t c h i n g ,v i aa d j u s t m e n t e n v i r o n m e n t a lp a r a m e t e r s t h em a i np a r to fa u t o m a t i ct a r g e td e t e c t i o ni sv i s u a l s e l e c t i v ea t t e n t i o n i tn e e d st ol a b e lt h e o b j e c tp o s i t i o n ,v i at h e i n t e r e s t e d i n f o r m a t i o nd i s t r i b u t i o ni nt h es c e n e s c a l es p a c ea n a l y s i ss y n c r e t i z e st h ea c c u r a c y i nt h ef i n es p a c ea n dt h ed i v i s i o n a b i l i t yi nt h er o u g hs p a c e i tc a nr e s o l v et h e a u t o m a t i co rs e m i a u t o m a t i c i m a g es e g m e n t a t i o nf o rb a c k g r o u n d sa n do b je c t r e g i o n s i nv i e wo ft h e s ep r o b l e m s ,s c a l es p a c ei n t r o d u c e se n t r o p ya si t sp a r a m e t e r t h ea n a l y s i so fv i s u a li n f o r m a t i o nd i s t r i b u t i o nc o u l dd e s c r i b et h ee s s e n c eo ft h e s e p h e n o m e n a t h i st h e s i si sm a i n l ya b o u ta sf o l l o w s : 1 s t a t i s t i c a lc h a r a c t e r i s t i c sb e t w e e ng r o u pi m a g e sa n di n d i v i d u a li m a g e sa r e s i g n i f i c a n t l yd i f f e r e n t i nt h i st h e s i s ,e n t r o p ys c a l es p a c ed e s c r i p t i o nc a n d i s t i n g u i s hb e t w e e nb a c k g r o u n d sa n do b j c o tr e g i o n s ,a n dh a r r i sc o r n e rd e t e c t o r m a k e sf u r t h e re v a l u a t i o na n dv a l i d a t i o n 2 q u a d t r e ei sa ne f f e c t i v eh i e r a r c h yd a t as t r u c t u r et or e c o r da ni m a g e ,a n di t i sa l s oaf o u n d a t i o no fi m a g eu n d e r s t a n d i n g i nt h i st h e s i s ,t h et o p d o w na n d b o t t o m - u ps t r a t e g i e sg i v ea na t t e n t i o ns i m u l a t i o na p p r o a c ht ol o c a t et h ev i s u a l i n f o r m a t i o n 3 g a b o rf i l t e r , w h i c hh a sg a u s s i a ns p e c i a l i t y , c a nr e s o l v ev i s u a li n f o r m a t i o n c o m p r e s s i o ni na d a p t i v ei m a g ed i s p l a y m e a n w h i l e ,ap r o c e d u r eo fa u t o m a t i ct a r g e t d e t e c t i o ni ss h o w nb yb o t ht h ev i s u a ls e l e c t i v ea t t e n t i o nb a s e do ne n t r o p ya n dt h e o b j e c tr e c o g n i t i o nu s i n gp c a ( p r i n c i p a lc o m p o n e n ta n a l y s i s ) m e t h o d k e yw o r d s :s c a l es p a c e ;a d a p t i v ei m a g ed i s p l a y ;a u t o m a t i ct a r g e td e t e c t i o n ; v i s u a ls e l e c t i v ea t t e n t i o n ;e n t r o p y 插图清单 图1 1 图像理解中的多尺度概念1 图1 2 图像尺度空间表示示意图3 图1 3 本文的研究内容之间的逻辑关系7 图2 1 数字图像及其透视表达8 图2 2 条件对比度视错觉9 图2 3 物体边界视错觉1 0 图2 4 图像2 1 的亮度直方图1 1 图2 5 树叶的尺度图像生成1 3 图2 - 6 鱼群的尺度图像生成1 3 图2 7 楼群的尺度图像生成1 3 图2 8 人群的尺度图像生成1 4 图2 - 9 尺度图像及其统计量曲线图1 5 图2 1 0 块合成的尺度图像1 6 图2 11 块合成的尺度图像的统计量曲线图1 6 图3 1h a r r i s 多尺度角点检测算法在三种尺度下提取的角点2 0 图3 2 在不同角点强度阈值下角点检测曲线图一2 1 图3 3 树群的多阈值h a r r i s 角点检测2 2 图3 4 多尺度图像的角点检测曲线图2 3 图4 1t 型金字塔的结构2 6 图4 2 四叉树及其存储结构2 7 图4 3 自项向下策略下的尺度图像分割2 8 图4 4 基于熵信息( 2 5 6 级灰度) 的尺度图像分割2 9 图4 5 基于熵信息( 1 6 级灰度) 的尺度图像分割2 9 图4 - 6 滤波策略下的尺度图像分割3 0 图4 7 自底向上策略下的尺度图像分割3 1 图5 1g a b o r 滤波器随旯尺度变化的能量分布曲面图3 4 图5 2g a b o r 滤波器随幺方向的能量分布曲面图3 4 图5 3 实g a b o r 滤波器和虚g a b o r 滤波器曲面图3 5 图5 4l e n a 图像的自顶向下自适应图像显示3 7 图5 5t r e e 图像的自顶向下自适应图像显示3 8 图5 - 6l e a v e s 图像的自顶向下自适应图像显示3 8 图5 7l e n a 图像的自底向上的自适应图像显示3 9 图5 8l e n a 图像的自底向上的g a b o r 滤波图像显示3 9 图5 9 两种策略下的自适应图像显示结果( 6 组) 4 0 图5 1 0 两种策略下的角点分析对比曲线图4 1 图6 1 二维和三维数据表主成份提取示意图4 4 图6 2 四层四叉树层次结构4 6 图6 3 尺度图像四叉树各层的熵分布曲线图4 7 图6 4l e n a 图像中的高熵图像块4 8 图6 5l e n a 图像中的中熵图像块4 8 图6 6l e n a 图像中的低熵图像块4 8 图6 7 多尺度图像的p c a 曲线图4 9 图6 8 基于熵的视觉选择注意结果5 0 图6 - 9 基于显著图的协同视觉选择注意结果5 0 图6 1 0 两种策略下的视觉注意结构信息曲线图5 0 图6 1 1 尺度空间下的视觉选择注意5 1 图6 12 尺度空间下视觉选择注意结构信息曲线图5 2 图6 1 3 目标类别p c a 特征分析的图像数据库5 3 图6 1 4 各个类别的p c a 特征曲线图5 4 图6 1 5 具有复杂结构的目标p c a 曲线图5 5 图6 1 6 具有中等结构的目标p c a 曲线图5 5 图6 17 具有简单结构的目标p c a 曲线图5 6 图6 1 8 基于熵的视觉选择注意方法在l e n a 图像中的结果5 7 图6 1 9l e n a 人脸图像在各类别中p c a 距离曲线图5 7 图6 2 0l e n a 人脸图像的p c a 识别柱状图5 8 表格清单 表6 1 尺度空间下的视觉选择注意区域的查准率5 2 表6 2 尺度空间下的视觉选择注意区域的查全率5 2 表6 3l e n a 人脸图像的p c a 的距离评价及其识别分析5 8 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。 据我所知,除了文中特别加以标志和致谢的地方外,论文中不包含其他人已经发表或撰 写过的研究成果,也不包含为获得 金月巴王些盔堂 或其他教育机构的学位或证书而使 用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说 明并表示谢意。 学位论文作者签字:笑砷签字吼叫年¥月f ,日 学位论文版权使用授权书 本学位论文作者完全了解 金胆王些太堂 有关保留、使用学位论文的规定,有权 保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅或借阅。本人 授权 金蟹王些丕堂 可以将学位论文的全部或部分论文内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文者签名:多矗够 签字日期:叫年中月尸日 学位论文作者毕业后去向: 工作单位: 通讯地址: 导师签名: 签字日期:a 吖年¥月尸日 电话: 邮编: 致谢 时光荏苒,转眼又将跨越另一个阶段,回首过去,感触良多。 值此硕士论文即将完成之际,首先感谢我的导师高隽教授,在他的悉心指 导和耐心帮助下完成了硕士论文的相关工作。高老师不仅在学术上高瞻远嘱, 对我们严谨有加;在生活上事无巨细,对我们关怀备至,还经常教导我们如何 树立正确的人生观和掌握正确的方法论。高老师的言传身教以及他所带领的图 像信息处理研究室“协同形成结构,竞争促进发展 的独特宗旨,都给我带来 了潜移默化的影响,将使我受益终生。 衷心感谢图像信息处理研究室的所有老师和同学,为我的学业及生活带来 的长足进步和点滴欢乐,图像室良好的学术氛围、协作竞争的团队精神是我得 以顺利完成硕士论文的重要基石。特别感谢实验室图像解析小组的工作成员, 感谢谢昭老师、感谢冯文刚、张骏、林金金、苏菱、黄帅、纪松、朱士蓉、张 利利、洪艳、杨胜利等同学,感谢研究生期间的相互信任和支持。同时也要感 谢胡良梅老师、张旭东老师等对我学业方面的指导。感谢赵莹、钱乐乐等同学 在论文相关内容的讨论与合作。感谢与凌虎、叶之金、胡翊、张翼、任溯、薛 艳、范瑾瑾等同学的交流带来的启示和帮助。 感谢图像室已经毕业的各位同窗。特别感谢骆祥峰博士、邵静博士、董火 明硕士等在相关工作方面的帮助。感谢0 6 级研究生1 2 班所有同学,难忘大家 在一起学习和交流的日子。感谢计算机与信息学院所有领导和老师在我攻读博 士学位期间的鞭策和支持,特别感谢计算机系各位领导和老师对我的鼓励和帮 助。感谢研究生院各个部门的领导和老师对我的关怀和帮助。 论文是在国家自然科学基金项目和安徽省重点科研项目研究工作的基础上 完成的,特向国家自然科学基金委员会和安徽省自然科学基金委员会表示衷心 的感谢。 感谢我的父母家人数十年来默默无闻的照顾和关心,你们的理解和支持是 我前进道路上的最大动力。感激之情,无以言表,无以回报,歉然于胸,谨以 此文献给你们。 其他老师、同学、朋友和亲人的帮助,在此无法一一列出,但这都是我所 要深表谢意的。 再次感谢所有关爱我的人,你们的支持将激励我不断进取。 作者:吴克伟 2 0 0 9 年3 月 第一章绪论 1 1 多尺度图像分析的研究内容 图像理解( i m a g e u n d e r s t a n d i n g ) 以图像为对象。以知识为核心是研究图像 中有什么、它们之间的相互关系、图像是什么场景以及如何应用场景的一门科 学,研究内容包括:从视觉获取的输入图像,通过一系列的计算分析和认知学 习过程,输出得到场景中的目标区域识z u ( o b j e c tr e c o g n i t i o n ) ”4j 、场景中目标 之间的上下文关系及其他关系描述( a s s o c i a t i o n a n a l y s i s ) ”j 、场景的整体描述和 理解( s c e n ed e s c r i p t i o n ) 5 】以及理解的语义知识( s e m a n t i ci n f o r m a t i o n ) ”“描述 等。如何有效地完成图像理解中的任务涉及到从自然科学到社会科学等多门学 科,包括图像工程、计算机视觉、人工智能和认知心理学。 图1 一l 图像理解中的多尺度概念 客观世界的自然场景具有多尺度的特性万物只有在特定尺度下才能成为 有意义的实体,并在不同的尺度下表现出不同的特性相应地人类视觉系统也 是一个多尺度系统。人类具有一种特殊的视觉过程,当人获取自然场景的视觉 信息后,人能够同时分辨出大小不一的物体,可见人脑具有同时对多尺度图像 进行采样和描述的能力,所以仅仅在某一个固定尺度下分析图像,会由于丢弃 图像本身固有的多尺度特性,极大的限制了图像理解结果的可信度。为了解决 这个问题,多尺度图像分析孕育而出,只有使不同尺度层次上的区域满足某种 模型的特殊关系,才能更好的融合多尺度图像信息。尺度空间比传统图像表达 方式,包含更丰富的视觉信息和知识信息,能更好的描述图像中的场景信息, 一| 具有广泛的应用前景。 图像理解中的尺度信息随着图像本身的描述层次具有不同的含义,如图1 1 图像理解中的多尺度概念,其中第一行是图像本身分辨率的尺度描述,第二行 是图像内容的尺度描述,第三行是图像视觉的尺度描述。内容尺度和视觉尺度 问题一直是多尺度图像分析的研究热点,其中高斯和l a p l a c e 金字塔研究的对 象是内容尺度,而传统意义上基于信号分解和重建的图像多尺度分析,主要的 研究对象是视觉尺度问题。 1 1 1 分辨率多尺度 我们周围的真实世界本身是三维的( 3 d ) 。2 d 亮度图像是3 d 场景的透视变 换( 透视投影p e r s p e c t i v ep r o j e c t i o n ) 。当3 d 物体经透视投影映射到摄像机平面 后,由于这样的变换不是一一对应的,因而大量的信息消失了,严格意义来说 通过单幅图像来识别和重构3 d 场景中的物体是个病态问题。数字图像的品质 它随着空间、频谱、辐射计量、时间分辨率的增长而提高。空间分辨率( s p a t i a l r e s o l u t i o n ) 是由图像上图像采样点间的接近程度确定的;频谱分辨率( s p e c t r a l r e s o l u t i o n ) 是由传感器获得光线频率带宽决定的;辐射计量分辨率( r a d i o m e t r i c r e s o l u t i o n ) 对应于可区分的灰阶数量;时间分辨率( t i m er e s o l u t i o n ) 取决于图像 获取的时间采样间隔。 通常意义上的图像尺度,是指直观的空间分辨率,可以认为是和采集设备 的存储容量是相关的,通常图像的分辨率越高其像素越多,包含的细节信息也 就越多,人类研究宏观望远镜和微观望远镜的本质都是为了提高图像的空间分 辨率的尺度信息,以求对不可观察的未知领域展开探讨。然而各个分辨率都可 以作为尺度依据,例如,时间分辨率在动态图像的分析过程中是重要的,其处 理的对象是图像中的时间序列。 1 1 2 内容多尺度 图像理解完成视觉信息到知识信息的转换,图像中的内容才是关于对图像 的理解、对图像的语义解释的关键。在目标识别过程中,存在狭义和广义之说, 其中狭义目标识别是指目标分类,而广义的目标识别还包括判断目标位置及内 容的目标检测过程。事实上不同任务中要求的不同质量的图像,其中内容作为 一种尺度可以很好的描述,比如,人脸目标分类的过程中,通常需要的是没有 背景或包含较少背景信息的单幅人脸图像,而在人脸目标检测的过程中,需要 研究的对象是复杂场景中的自然场景图像,其中人脸的类型,位置,数量都是 未知数。单体图像和群体图像的特征实际上服从不同的分布形式,虽然人可以 很好的根据图像内容尺度信息,把图像中的目标和背景一一识别出来,但实际 上基于内容尺度的研究还是一个较新的领域,统计学理论是研究内容尺度的重 要基础。 2 1l3 视觉多尺度 尺度信息的第三层含义是和人类视觉的形成过程相关,小波变换实质上就 是尺度空间映射的一个特例,它的多尺度特点很适合多尺度分析,特别是依靠 小波变换的重构算法在低尺度上补充一定的信息可以获得高尺度上近似的补 充。不同空间频率传达外观刺激中的不同信息例如,高频部分表达图像汇总 的陡峭空间变化( 如边缘1 ,通常影响到物体的结构及其细节信息。低频部分产 生全局信息中方向、面积等形状信息。人类视觉对全局场景的感知过程中,最 初处理的是低频信息,它可以快速提取到场最中的主要信息。此外不同程度的 g a b o r 滤波对图像进行退化处理,也可以模仿人类视觉的尺度空间,为场景描 述等图像理解任务提供有效的视觉信息。 1 2 多尺度图像分析的视觉表示 多尺度图像分析早期主要是研究视觉尺度的图像感知问题,形成人类感知 过程的由租到精的分层处理过程。尺度空间表示( s c a l e - s p a c er e p r e s e n t a t i o n ) 最 初是由日本的i i j i m a 于1 9 6 2 年提出,但当时他的研究结果只在日本国内发表, 不为外人所知在国际上没有引起关注。后来w i t k i n 在1 9 8 3 年提出了一维信 号的具有高斯核函数的线性尺度空间表示,k o e n d e r i n k 在1 9 8 4 年将其扩展到二 维信号,随后l i n d e b e r g ,p e r o n a ,m a l i k b a r t 以及f l o r a c k 等都对尺度空间表示 进行了研究1 8 , 9 - 1 6 。 c o a n 日h 础 “珥如7 瑶删荔 a ) 尺度空间结构示意图( b ) l e n a 图像的尺度空间表示 图1 2 图像尺度宅间表示示意图 尺度空间表示的一般方法是:将尺度作为一个自由参量引入到原始n 维信 号f 如2 d 图像) 中得到一个n + i 维的信号,所得信号在尺度维上满足一个扩散方 程( d i f f u s i o nf u n c t i o n ) ,该扩散方程是一个以原始信号为初始状态的偏微分方程 ( p d e ) ,称所得信号为原始信号的尺度空间表示;在尺度维上,信号表现出一 种由细到粗( f i n e t o c o a r s e ) 的过程,一个基本要求就是在粗的尺度上,信号中 不能出现新的结构 1 0 ”】,即原始信号通过与尺度空间核的卷积后,输出信号中 的极值点小于或等于原始信号中的极值点数目。 记原始图像为,( y ) r ,( z ,) r 2 ,尺度记为r ,图像尺度空间表示为: :( z ,y ) x t l ( x ,y ;f ) ,w h e r ei ( x ,y ;o ) = i ( x ,y ) 厶+ ,( ,) = 厶( t ( ,) ) ( 1 1 ) 其中l 为尺度空间变换,尺度t 的初始值为原始图像中的尺度,通常情况 下初始值为0 。图1 2 ( a ) 为尺度空间表示示意图,图1 2 ( b ) 为l e n a 图像的尺度 空间表示。 式( 1 1 ) 中t 满足的扩散方程为【1 0 ,1 3 , 1 4 】: a t l - - 1 2v 2 l 一一三讲v 了( 1 - 2 ) 其中:j = 加耽是f l i c k 法则( f l i c k sl a w ) 表示扩散的平衡特性,d 是一个 正定对称矩阵表示扩散张量( d i f f u s i o nt e n s o r ) 。如果,和v 平行,则表示扩散 是各向同性的,此时d 可用一个正常数g 来代替,反之为各向异性。若d 为一 个正常数,则相应的尺度空间为线性尺度空间( l i n e a rs c a l e s p a c e ) ;若d 是一 个与图像结构相关的标量函数,则为非线性各向同性尺度空间( n o n l i n e a r i s o t r o p i cs c a l es p a c e ) ;若d 是一个与图像结构相关的向量函数,则为非线性各 向异性尺度空间( n o n l i n e a r a n i s o t r o p i cs c a l es p a c e ) 。以上给出的推导是针对连 续情况讨论的,对数字图像,扩散方程要进行离散化,实际中使用的是离散尺 度空间。 视觉尺度图像分析的尺度信号分解和重构的方法很多 1 7 】,对于一维分段光 滑信号,小波变换是一个很好的分析工具,它在某种意义上提供了这类信号的 最优表示【ls 】:此外,小波变换具有有效的快速算法和方便的树型数据结构,这 些都是小波在工程中得到广泛应用的主要原因。但是这种优异性并不能简单推 广到二维或更高维,在图像处理应用中,自然图像并不是一维分段光滑线段的 简单堆积,由于实际物理对象的光滑边界,不连续的点( 边缘) 通常位于光滑曲 线( 轮廓) 上。因此,自然图像包含内在的几何结构,这是视觉信息的关键特征。 传统的二维小波变换是对一维基的可分离式扩展,在分离边缘点的不连续性时 性能较好,但它无法捕获轮廓上的光滑性【1 9 ,2 们。 2 0 0 5 年,d om n 根据生理学家对人类视觉系统研究结果和自然图像统计模 型,提出一种“最优”的图像表示法应该具有如下的特征【2 0 1 。( 1 ) 多分辨:能够 对图像从粗分辨率到细分辨率进行连续逼近,即“带通”性;( 2 ) 局部性:在空 域和频域,这种表示方法的“基 应该是“局部”的:( 3 ) 临界采样:对于某些 应用,如图像压缩,这种表示能形成具有很小冗余的基或者框架;( 4 ) 方向性: 该表示方法应该包含能反映许多方向的基本组成部分,不仅仅局限于二维可分 离小波的3 个方向。( 5 ) 各向异性:为了能捕获图像中的光滑轮廓,该表示应该 包含系列具有不同方位比率的可伸缩形状基本单元。 在此之前,f o u r i e r 分析、g a b o r 分析和小波分析都是部分实现了上述功能。 为了能同时满足上述要求,需要发展新的分析工具。多尺度几何分析的目的就 是寻求高维函数的有效最优表示工具。 图像的多尺度几何分析是一个十分前沿的研究领域,理论和算法还处于发 4 展阶段,现阶段其应用主要集中在图像去噪、对象检测与识别和数据处理等领 域。目前,文献中现有的多尺度几何分析方法主要有自适应和非自适应两类。 自适应方法主要以p e n n e c 和m a l l a t 提出的b a n d e l e t 2 1 】为代表;非自适应方法 主要包括c a n d 6 ,提出的r i d g e l e t 2 2 ,2 3 1 ,c a n d 6 和d o n o h o 构造的c u r v e l e t 2 4 ,2 5 】 和d 。提出的c o n t o u r l e t 变换t 1 9 ,2 0 1 。国内一些学者近几年也开始对多尺度几何 分析进行研究,取得了一些研究成果【26 2 7 】。 1 3 多尺度图像分析的应用领域 多尺度分析方法由于能够综合不同尺度的图像信息,从而把精细尺度的精 确性与粗糙尺度的易分割性这对矛盾完美的统一了起来,因此,这种分析方法 非常适合自动或半自动的图象分割。由于在自然界和工程实践中,许多现象或 过程都具有多尺度特征或多尺度效应,人们对现象或过程的观察及测量也往往 是在不同尺度上进行的。所以采用多尺度理论来描述、分析这些现象或过程, 才能够更全面地刻画这些现象或过程的本质特征。 多尺度系统理论和多尺度估计理论框架是由m i t 的a s w i l l s k y 教授、法 国数学家a b e n v e n i s t e 和r n i k o u k h a h 在1 9 9 0 年第2 9 届i e e e 控制与决策会 议上首次提出的【2 8 1 。b a s s e v i l l e 等学者为了给出相应的统计框架来支持最优多 尺度统计信号处理算法,从信号的多尺度表示中导出了墓于树状的多尺度模型。 此理论推广了s c h u r l e v i n s o n 递归算法,为多尺度建模系统理论奠定了基础【2 六 3 0 】。在基于树状结构的基础上,k d a o u d i ,ab f r a k t 和a s w i l l s k y 提出了通 过建立一种多尺度模型来描述统计自相似过程【3 1 。3 ”。这种多尺度模型充分利用 了所分析过程的标准相关性、自相似性和稳定性。许多工程实际和科学研究中, 经常需要对泊松过程进行建模。ke t i m m e r m a n n 和rd n o w a k 利用h a a r 小 波分析技术提出一种多尺度建模理论和估计技术【34 1 ,并由此而得到一种新的、 有效的多尺度贝叶斯算法,应用此算法可对有限光子成像中的强度进行估计, 从而增强了核医学成像的诊断能力。 近年来国际上以多尺度理论为主题的高水平学术期刊( 如:i e e et r a n s o n p a m i ,i e e et r a n s o ni m a g ep r o c e s s i n g 与i n t e r n a t i o n a lj o u r n a lo fc o m p u t e r v i s i o n 等) 与国际会议( c v p r ,i c c m ,i c i p 等等) 不断涌现,研究成果层出不穷。 y i z h o uw a n g ,b a h r a m is ,s o n g c h u nz h u 给出了尺度感知及其作为自适应图像 显示的应用【35 】:n a nj i a n g ,j e n n i es i ,a b o u s l e m a ng 实现了尺度图像标记的层次 区域描述方法【3 6 】;h a y a s h ih ,n a k a y a s uh 依据尺度方法对图像进行视觉质量评 价【3 7 】;b a o j i a n gz h o n g ,w e n h el i a o 研究了尺度曲率的理论及其角点检测技术 【3 8 】。上述学术研究都侧重于多尺度图像分析的理论部分,而在多尺度图像的应 用也硕果累累,j a l b aa c ,w i l k i n s o nm h f ,r o e r d i n kj b t m 将尺度形态学弯 曲度应用于形状表达和识别【3 刿;a n b a n gy a o ,g u i j i nw a n g ,x i n g g a n gl i n ,h a o w a n g 实现了多尺度适应和模型更新的任意物体跟踪【4 u j ;a d a m sm ,t a n gf a n , 5 w i j e s o m aw s ,c h h a ys o k 研究了多尺度噪声数据的收敛平滑和分割策略【4 。 国内学者在多尺度理论研究领域也有许多卓越的成果。合肥工业大学的智 能图像信息处理研究室的高隽教授从事图像理解研究工作多年,提出了一种基 于分形理论的多尺度多方向纹理特征提取方法【4 2 1 ,并将多尺度图像分析成功应 用于“协同视觉选择注意计算模型研究”【4 3 】以及“基于视觉统计概率模型的目标 定位”【4 4 1 ,在图像理解中的多尺度图像分析具有一席之地。 此外,上海海事大学物流工程学院文成林教授 4 5 ,4 6 】的研究小组将多尺度算 法与具有先验信息的动态系统的估计理论结合,建立多尺度估计理论框架、动 态系统的多尺度估计、多尺度线性逆问题的求解等,有效地完成了动态系统多 尺度估计理论的预测、撼波和平滑算法。西安电子科技大学焦李成教授【2 6 ,4 7 - 5 0 的研究小组致力于小波变换和多尺度几何分析的研究,把多尺度理论运用在图 像分割领域取得了一系列令人鼓舞的研究成果。 1 4 章节安排和组织结构 本课题在对多尺度图像分析、视觉选择注意计算模型方法研究的基础上, 以国家自然科学基金项目( 6 0 8 7 5 0 1 2 ) “基于协同学的并行多层次反馈图像理解 研究”为主要研究背景,开展多尺度图像分析,实现图像中的全局信息和局部信 息表达,进一步完善图像理解任务中的场景描述和目标描述。 本文以多尺度图像分析的最新研究成果为依据,针对自适应图像显示和自 动目标检测研究中存在的关键问题,采用图像统计信息量熵和图像层次结构四 叉树开展研究,论文各章的关系结构如图1 3 所示,具体内容安排如下: 第一章绪论,概述论文的研究背景、研究内容和主要工作。 第二章从图像函数的基本概念出发,通过采样和插值交换的介绍逐步引出 尺度图像的概念,并引入熵统计量来实现尺度图像的感知。 第三章主要介绍了图像中的信息表示与特征提取,并以h a r r i s 角点来描述 图像细节信息,作为尺度图像结构信息描述。 第四章通过简单介绍传统图像的数据结构,解释了分层数据结构能更好的 解决图像理解中目标检测和识别等任务,并分别设计了自顶向下、自底向上尺 度图像分割方法,作为尺度图像的层次表达方式。 第五章通过介绍g a b o r 滤波器所具有的视觉尺度图像表达能力,在自项向 下和自底向上的两类尺度分割的结果上实现自适应图像显示。 第六章通过介绍目标识别的定义,引出视觉注意选择机制的重要性,随后 采用尺度图像分割来实现自动目标检测,并进一步引入主成分分析方法,实现 尺度图像内容的识别问题。 第七章是对论文工作的总结和进一步研究的展望。 6 图1 - 3 本文的研究内容之间的逻辑关系 7 第二章尺度图像的内容感知 2 1 基本概念 人们对图像是很熟悉的,生活中很容易就说出哪些东西是图像。一般将图 像看作对物体或场景的一种表现形式,是用来表示视觉信息的一种表达。早期 英文书籍里一般用p i c t u r e 来指图象,随着数字技术的发展,现在都用i m a g e 来 代表离散化了的数字图像。事实上图象比图像的含义更广,覆盖面更宽。 2 i i 图像函数及其表达 图像可以表示为一种辐射能量的空间分布f 5 ”,这种分布可以是5 个变量舶 函数,t ( x ,y ,互t ,2 ) ,其中z ,y ,z 是空间变量,f 代表时间变量,丑是频谱变量( 波 长1 。例如,红色的物体反射波长在o5 7 u r n 到07 0 u r n 的光而且吸收几乎所有其 他波长的能量。由于实际图像在时空上都是有限的,所以t ( x ,y ,z ,t ,五) 是一个5 - d 有限函数。 一幅2 d 图像可以用一个2 d 数组f ( x ,y ) 来表示。实际中还常将一副2 d 图 像写成一个2 d 的m n 矩阵( 其中m 和n 分别为图像的总行数和总列数) 。 f = i: 正i正: 叭f m : 一幅2 d 图像也可以用矢量来表示,可写成 f = m 正以 其中= z 正。f u j , i = l h 2 - ,n 。 隧曩,磐 图21 数字图像及其透视表达 对2 d 图像的显示可以采用多种形式,其基本思想是将2 d 图像看作在2 d 空间位置上的一种幅度分布,根据图像的不同,采用的显示方式也可不同。例 如对二值图像,在每个空间位置的取值只有两个,可用黑自来区别,也可用0 和1 来区别。对于灰度图像,为表示不同的灰度级别,可采用3 d 透视的方法, 对图的两种显示方式见图2 - 1 ,右图是将图像相邻像素的灰度结台起来转换为 高程f 越浅越高1 得到的。 2i2 数字图像性质 人类可以从有限的视觉信息中发现有价值的自然场景知识,这一方面是由 于人类具有认知能力,另一方面也离不开自然场景中各种目标自身的性质。本 节通过探讨人类视觉感知和数字图像的基本性质,从统计学思想出发,来奠定 尺度图像中的感知的理论基础。 i 图像的视觉特性 我们在设计或使用数字图像处理算法或设备时,应该考虑人的图像感知原 理。如果一幅图像要由人来分析的话,信息应该用人容易感知的变量来表达, 这些是心理物理参数,包括对比度、边界、形状、纹理、色彩等等。只有当物 体能够毫不费力地从背景中区分h 来时,人才能从图像中发现它们。有关人的 感知原理的详细论述可以参见f 5 2 4 ”。人的图像感知产生很多错觉,了解这些现 象对于理解视觉机理有帮助。其中比较为人熟知的一些错觉我们在这里将提到, 从计算机视觉的角度i ” 详尽地论述这一主题。 如果人的视觉系统对复合输入刺激的响应是线性的,即是各自刺激的简单 的和,问题就会相对容易些。一些刺激的衰减,即图像中物体的部分区域,可 以通过亮度、对比度、持续时间来补偿。事实上,人的感知敏感度大致上是与 输入信号的强度成对数关系的。在这种情况下,经过一个初始的对数变换复 合刺檄的响应可以作为线性的看待。 1 ) 对比度( c o n t r a s t ) 对比度是亮度的局部变化。定义为物体亮度的平均值与亮度的比值。人的 眼睛对亮度的敏感性成对数关系意味着对于同样的感知,高亮度需要高的对 比度。 图22 条件对比度视错觉 表现上的亮度很大程度上取决于局部背景的亮度,这种现象被称为条件对 比度( c o n d i t i o n a l c o n t r a s t ) 。图2 - 2 给出了分别处于暗和亮背景中两个同样亮度 的小方块a 和b ,人对其中的小方块感知到的亮度是不同的。 2 1 敏锐度( a c u i t y ) 敏锐度是察觉图像细节的能力。人的眼睛对于图像平面中的亮度的缓慢和 快速变化敏感度差一些,而对于期间的中等变化较为敏感。敏锐度也随着离光 轴距离的增加而降低。 图像的分辨率受制于人眼的分辨能力,用比观察者所具有的更高的分辨率 来表达视觉信息是没有意义的。光学中的分辨率定义为如下的最大视角的倒数: 观察者与两个最近的他所能够区分的点之间的视角。这两个点再近的话,就会 被当作一个点。 人对物体的视觉分辨率物体位于眼睛前2 5 m m 处,照明度在5 0 0 1 u x 的情况 下最好,这样的照明是由4 0 0 m m 远的6 0 w 灯泡提供的。在这种情况下,可以 区分的两个点之间的距离大约是0 1 6 m m 。 3 ) 物体边界( o b j e c tb o r d e r ) 物体边界具有大量的信息。物体和简单模式的边界,比如斑点或线,能够 引起适应性( a d a p t a t i o ne f f e c t s 】,类似于前面讲过的条件对比度。图2 3 给出了 物体边界错觉的例子,看起来似乎每根直线的长度都不一样,但实际上通过测 量确是一样的长度。 图2 3 物体边界视错觉 4 ) 色彩( c o l o r ) 由于在正常的照明条件下,人眼对色彩比亮度更敏感,因此色彩对于感知 十分重要。色彩的量化和表示有多种方式,色彩可以表示为红绿蓝( r g b ) 三原 色的组合,但是色彩感知用h s i 坐标系统来表示更好。色彩感知与其他心理物 理量一样,也受类似的适应性错觉( a d p a t a t i o ni l l u s i o n ) 的影响。 2 直方图 直方图是图像统计特征计算的基本数据结构。图像的亮度直方图 ( b r i g h t n e s sh i s t o g r a m ) 五,( z ) 给出图像中亮度值z 出现的频率,一幅有个灰阶的 图像的直方图由具有个元素的一维数组表示。 图像可以作为随机过程的实现来分析,故可以考虑一阶密度函数n ( z ,z ,y ) , 它表示像素( x ,y ) 的亮度值是z ,如果不考虑像素的位置,我们得到一个密度函 数a ( z ) ,亮度直方图就是它的估计。直方图通常用条状图来显示。 直方图通常是有关图像的唯一可得到的全局信息。在寻找最佳的照明条件 以便抓取图像、进行灰阶变换以及将图像分割为物体和背景这些场合,都要用 到直方图。请注意,同一直方图可能对应几幅图像,例如,当背景是常数时物 体位置的改变不会影响直方图。 l o 图24 图像21 的亮度直方图 数字图像的直方图一般都有很多局部极小值和极大值,这会使进一步的处 理变得复杂。这个问题可以通过对直方图进行局部平滑来解决,比如,可以用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 实验室安全教育心得体会
- 2024年水利水电工程考试难点解析与试题及答案
- 2025届平舆县数学三年级第一学期期末监测试题含解析
- 小学一年级成长教育故事案例
- 水利水电工程现场勘察试题及答案
- 提升城市建设项目的试题及答案
- 绿色农业生态农场种植技术合作协议
- 农民农技培训服务协议
- 中级经济师考试的相关政策与法规试题及答案
- 信息技术网络安全知识测试卷
- MOOC 能源与气候变化应对法-西南政法大学 中国大学慕课答案
- MOOC 国情分析与商业设计-暨南大学 中国大学慕课答案
- 工厂生产经营管理方案
- 2023年浙江省宁波市中考语文试卷
- 《光伏发电工程工程量清单计价规范》
- “新课标”下教学评一体化的英语单元整体教学设计
- 水电站水工基础知识课件
- 大学生劳动教育课件:树立新时代的劳动观
- 营养筛查及营养实施流程图课件
- 有机化学课后习题答案-李艳梅版
- 国企控股公司所属公司经理层成员任期制和契约化管理办法(试行)
评论
0/150
提交评论