(计算机软件与理论专业论文)图像表征和图像分割算法的研究.pdf_第1页
(计算机软件与理论专业论文)图像表征和图像分割算法的研究.pdf_第2页
(计算机软件与理论专业论文)图像表征和图像分割算法的研究.pdf_第3页
(计算机软件与理论专业论文)图像表征和图像分割算法的研究.pdf_第4页
(计算机软件与理论专业论文)图像表征和图像分割算法的研究.pdf_第5页
已阅读5页,还剩72页未读 继续免费阅读

(计算机软件与理论专业论文)图像表征和图像分割算法的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浙江大学硕士学位论文 摘要 摘要 由于实际图像中包含了大量的冗余的信息,在图像表征中我们希望提取图像 中最本质的视觉信息,在这点上与图像压缩有相通之处,因为在图像压缩中我们 去除图像中冗余信息,将人眼视觉系统最敏感的信息保留下来。 本文研究了两种图像表征方法:h i m p a 和e p i t o m e 。h i m p a 是独立主元i c a 模型和混合概率主元m p p c a 模型的混合。e p i t o m e 简单来说就是图像的摘要, 它包含了图像中纹理信息和形状特征。我们对l o 幅图像进行了i ) c t 、i - m p a 、 e p i t o m e 的分析比较,并且用p s n r 来检测在相同压缩率的情况下图像表征效果。 图像分割就是利用区域的相似性或非连续性把图像空间划分成若干个具有 某些一致性属性( 比如灰度、颜色和纹理等) 的不重叠区域,并提取出感兴趣的目 标。它是由图像处理到图像分析的关键步骤,其分割性能的优劣往往直接影响到 后续的图像处理与分析、特征提取和模式识别等操作。 本文研究了三种图像分割算法:s m a p 、q b s 、h m t s e g 。s m a p 和h m t s e g 是基于区域的图像分割算法,而q b s 是基于边界的图像分割算法。s m a p 是一种 贝叶斯图像分割方法,它采用多尺度随机场m u l t i s c a l er a n d o mf i e l d ( m s r f ) 来替 代m r f ,并且采用有序的m a p ( s m a p ) 估计来替代m a p 估计。q b s 提出了基于四 边形的图像分割框架,它首先从边缘图构造四边形,然后合并具有相似特征的四 边形来形成区域,每个分割区域都可以用一些四边形的集合来精确完整地描述。 h m t s e g 是基于小波变换和隐马尔可夫树( h m t ) 模型的图像分割算法,h m t 通 过一阶马尔可夫链来捕捉不同尺度下小波系数之间的相关性,利用小波h m t 固有 的树型结构和它快速训练和似然估计的算法,在不同层次上执行纹理分类,然后 用贝叶斯似然图来合并这些不同层次的分类,最后得到一个较可靠的分割结果。 我们分别实现了这三种图像分割算法,并且对实验结果,运用主观测评和客观测 评方法,进行比较分析。 关键词独立主元分析,主元分析,图像的摘要,彩色图像分割,多尺度统计模 型,隐马尔可夫模型,四边形边界拟合,小波变换 浙江大学硕士学位论文 a b s t r a e t a b s t r a c t a ni l t l a g eo f t e nc o n t a i n sal o to fr e d u n d a n ti n f o r m a t i o n , w eh o p et o e x t r a c t i n s t i n c t i v ev i s u a li n f o r m a t i o ni ni m a g er e p r e s e n t a t i o n , a n ds oi si m a g ec o m p r e s s i o n w ew i p eo f fr e d u n d a n ti n f o r m a t i o na n dr e s e r v es e n s i t i v ei n f o r m a t i o ni ni m a g e c o m p r e s s i o n h e r ew es t u d yt w oi m a g er e p r e s e n t a t i o na l g o r i t h m s :h i m p aa n de p i t o m e h i m p ai sah y b r i do fi c aa n dm p p c a t h ee p i t o m eo f 强i m a g ei si t sm i n i a t u r e c o n d e n s e dv e r s i o nc o n t a i n i n gt h ee s s e n c eo ft h et e x t u r a la n ds h a p ep r o p e r t i e so ft h e i m a g e w ei m p l e m e n tt w oa b o v ei m a g er e p r e s e n t a t i o na l g o r i t h ma n dc o m p a r et h e i r p e r f o r m a n c ea g a i n s td c t f o rt e ni m a g e su s i n gp s n rm e a s u r e m e n t i m a g es e g m e n t a t i o ne x t r a c t sm e a n i n g f u lr e g i o n so ro b j e c t sf r o mv i s u a ld a t a i t d e c o m p o s e si m a g e s ,a c c o r d i n gt os p e c i f i cf e a t u r e so fi n t e r e s t , i n t od i s t i n c tr e g i o n st o m a k eh i g h - l e v e lt a s k ss u c ha so b j e c tt r a c k i n g ,r e c o g n i t i o n , a n ds c e n ei n t e r p r e t a t i o n p o s s i b l e w e s t u d yt h r e ei m a g es e g m e n t a t i o na l g o r i t h m s :s m a p , q b s ,h m t s e g s m a p i s ab a y e s i a ni m a g es e g m e n t a t i o ns c h e m ew h i c hr e p l a c e st h em r fm o d e lw i t han o v e l m u l t i s e a l er a n d o mf i e l d ( m s r f ) ,a n dr e p l a c e st h em a pe s t i m a t o rw i t has e q u e n t i a l m a p ( s m a p ) e s t i m a t o rd e r i v e df r o man o v e le s t i m a t i o nc r i t e r i o n q b sp r o p o s e sa g e n e r a lq u a d r i l a t e r a l - b a s e df r a m e w o r kf o ri m a g es e g m e n t a t i o n , i nw h i c hq u a d r i l a t e r a l s a l ef i r s tc o n s t r u c t e df r o ma ne d g em a p ,w h e r en e i g h b o r i n gq u a d r i l a t e r a l sw i t hs i m i l a r f e a t u r e so fi n t e r e s ta r et h e nm e r g e dt o g e t h e rt of o r mr e g i o i l s f i n a l l y , e a c hs e g m e n t e d r e g i o ni sa c c u r a t e l ya n dc o m p l e t e l yd e s c r i b e db ya s e to fq u a d r i l a t e r a l s h m t s e gi sa n e wi m a g et e x t u r es e g m e n t a t i o na l g o r i t h m ,b a s e do nw a v e l e t sa n dt h eh i d d e nm a r k o v t r e e ( h m t ) m o d e l t h eh m t i sat r e e s t r u c t u r e dp r o b a b i l i s t i cg r a p ht h a tc a p t u r e st h e s t a t i s t i c a lp r o p e r t i e so f t h ec o e f f i c i e n t so f t h ew a v e l e tt r a n s f o r m u t i l m i n gt h ei n h e r e n t t r e es t r u c t u r eo ft h ew a v e l e th m ta n di t sf a s tt r a i n i n ga n dl i k e l i h o o dc o m p u t a t i o n a l g o r i t h m s ,h m t s e gp e r f o r m st e x t u r ec l a s s i f i c a t i o na tar a n g eo fd i f f e r e n ts c a l e sa n d t h e nf i l s e st h e s em u l t i s c a l ec l a s s i f i c a t i o n su s i n gab a y e s i a np r o b a b i l i s t i eg r a p ht o o b t a i nr e l i a b l ef i n a ls e g m e n t a t i o n s w ei m p l e m e n tt h e s ea l g o r i t h m s ,t h e ne v a l u a t ea n d c o m p a r et h e i rp e r f o r m a n c ew i t ho b j e c t i v em e a s u r e m e n ta n ds u b j e c t i v em e a s u r e m e n t k e y w o r d si n d e p e n d e n tc o m p o n e n ta n a l y s i s ,p r i n c i p a lc o m p o n e n ta n a l y s i s , e p i t o m e ,i n l a g es e g m e n t a t i o n , m u l t i s c a l es t a t i s t i cm o d e l ,h i d d e nm a r k o vm o d e l , q u a d r i l a t e r a la p p r o x i m a t i o n , w a v e l e tt r a n s f o r m 浙江大学硕士学位论文 圈目录 图目录 图2 1 ( a ) 原始图像( b ) 它的e p i t o m e ( c ) 重构的图像1 0 图2 - 2 ( a ) a i r p l a n e 原图( b ) d c t ( c ) h i m p a ( d ) e p i t o m e 1 4 图2 3 ( a ) c h e m i c a l p l a n t 原图( b ) d c t ( c ) h i m p a ( d ) e p i t o m e 1 4 图2 - 4 ( a ) c o u p l e 原图( b ) d c t ( c ) h i m p a ( d ) e r ,i t o m e 1 5 图2 5 ( a ) g i r l 原图( b ) d c t k ) h i i v i p a ( d ) e p i t o m e 1 6 图2 6 ( a ) h o u s e 原图( o ) d c t0 ) h i m p a ( d ) e p i t o m e 1 6 图2 7 ( a ) j e l l y b e a n s 原图( b ) d c t ( c ) h i m p a ( d ) e p i t o m e 1 7 图2 8 ( a ) c r o s s e s 原图( b ) d c t ( c ) h i m p a ( d ) e p i t o m e 1 8 图2 9 ( a ) m o o n s u r f a c e 原图( b ) d c t ( c ) h i m p af d ) e p i t o m e 1 8 图2 1 0 ( a ) r e s o l u t i o n c h a r t 原图( b ) d c t ( c ) h i m p a ( d ) e p i t o m e 1 9 图2 1 1 ( a ) s q u a r e s 原图c o ) d c t ( c ) h i m p a ( d ) e p i t o m e 。2 0 图3 - l 双随机模型2 2 图3 2m s r f 的金字塔结构2 3 图3 3 ( a ) m s r f 模型中采用的四叉树结构( b ) 四叉树模型的一维近似2 7 图3 - 4 ( a ) m s r f 模型中采用的扩展的金字塔图结构( b ) 金字塔图结构的一维 i 匠似2 9 图3 5 混合结构的一维近似,” 2 采用金字塔图结构,疗2 采用四叉树结 构。3 0 图4 1 基于四边形的图像分割框架3 4 图4 2 ( a ) 块标签( b ) b ( 2 ,2 ,1 ) 的四个遍历路径( c ) 构造出的四个四边形。3 6 图4 3 ( a ) 重叠的四边形( b ) 细分b o ( 1 ,0 ,o ) 后形成的四边形3 7 图4 - 4 四个可能的邻近四边形3 8 图4 5 ( a ) 原图( b ) 原图的边缘图( c ) 逼近原图的四边形网络4 l 图5 1 ( a ) 图像x 在不同尺度上划分成方块刃,每个方块和一个h a r t 小波系 数的子树相对应。( b ) 方块的四叉树结构,方块d 蒜在层次,划分成四 个儿子方块4 6 图5 2 ( a ) 二维小波变换子带中父亲- ) l 子依赖关系:每个箭头从父亲小波系 数指向它的在更精细层的四个儿子。佃) 每个子带四叉树的更详细的视 图,每个黑节点对应一个小波系数。( c ) - 维小波隐马尔可夫树模型。黑 结点表示小波系数,自结点表示它相应的隐状态4 7 图5 3 ( a ) 上下文,类标签和方块形成的马尔可夫链:v f g _ d f 。( b ) 上下 文标签树,儿子方块的上下文是由它的父节点和父节点的八个邻居决定 的。! il 图6 1 ( a ) c o t t o n 原图( b ) m e a n - s h i f t 分割结果( c ) k i - n e a n s 分割结果( d ) s m a p 分 割结果5 7 i l l 浙江大学硕士学位论文 图目录 图6 2 ( a ) f l o w e r l 原图( b ) m e a n s h i f t 分割结果( c ) k m e a m 分割结果( d ) s m a p 分割结果5 8 图6 - 3 ( a ) f l o w e r 2 原图( b ) m e a n s h i f t 分割结果( c ) k m e a n s 分割结果( d ) s m a p 分割结果5 8 图6 _ 4 ( a ) c i r c l e 原图( b ) 当w = 3 2 时形成的四边形网络( c ) 当w = 3 2 时q b s 分割结果( d ) 当w = 1 6 时形成的四边形网络( e ) 改进后形成的四边形网 络( f ) 最终的分割结果6 1 图6 5 ( a ) j e l l y b e a n s 原图( b ) q b s 分割结果6 4 图6 - 6 ( a ) t e x t u r e 原图( b ) n m t s e g 分割结果6 5 i v 濑江丈学顿士学位论文 表爵蒙 表嚣录 表厶l 图像表征算法的客观测评。2 1 表1 几种分割算法的客双测谔 表6 - 2q b s 分割算法的客观测评一 v 6 3 浙江大学硕士学位论文 第l 章绪论 第1 章绪论 1 1 研究背景 l1 1 图像表征研究背景 人类的视觉系统有一种从底层视觉特征抽象到高层概念的功能,用一种有效 的编码策略来表征自然图像,我们可以每天以一种看来不费力的方式来搞清数百 万字节的数据1 1 1 。视觉信息通过视网膜的杆和锥体细胞来感知、转换,并且通过 位于神经节层细胞的轴突,即视觉神经传人到大脑。在到达主要视觉皮层或v 1 t 2 前,光纤在丘脑的侧面膝状弯曲部位形成突触。感官信息用一组神经元的输出来 表示。我们可以从活动最剧烈的神经元的位置和幅度推导出刺激的类型。使用大 量神经元活动的编码信息被称为种群编码p ( p o p u l a t i o nc o d i n g ) 。 尽管近年来机器视觉系统发展很快,但是与人类视觉感知系统还有很大的差 距,图像分析与理解的核心任务是1 ) 目标区域对象分割检测;2 ) 图像理解。本 论文首先从图像表征方法开始讨论。 由于实际图像中包含了大量的冗余的信息,在图像表征中我们希望提取图像 中最本质的视觉信息,在这点上与图像压缩有相通之处,因为在图像压缩中我们 去除图像中冗余信息,将人眼视觉系统最敏感的信息保留下来。 1 1 2 图像分割研究背景 在许多基于多媒体内容的应用中,从图像或视频序列中抽取有意义的区块或 物体对象是比较核心的任务,这个过程通常被称为图像分割,它是大部分图像分 析应用中最为基础的一个步骤。本质上讲,它根据人们感兴趣的一些特征,将图 像分解成为不同的区域,使得更高层次的应用,如对象跟踪、识别,场景理解等 成为可能。由于多媒体应用服务日益增长的需求,计算机视觉应用如机器人技术、 自动驾驶车辆、视频监控等需要更先进的分析技术,因此,图像分割的问题得到 越来越多的重视。 虽然,图像分割问题在过去已经得到较深入的研究,并且在分割物体的研究 方面取得了可观的进展,但是此类算法的鲁棒性和通用性并没有得到完全的解 决。许多算法在分析图像并将其划分成几组具有同类特性的像素群方面已经做得 相当好。尽管如此,为了支持上述的那些应用,这些像素群必须得到更好的解释, 浙江大学硕士学位论文第1 章绪论 如边界,形状描述等,这样才能合成得到有用的区域或物体对象信息。根据研究 可知,大部分基于多媒体内容的应用将分析步骤和合成步骤作为两个独立的问题 进行处理和优化。举个例子,分析步骤可以被优化以使得算法在速度和特定区域 的描述细节上达到比较好的平衡。同样的,合成步骤也可以被优化使得描述精度 和速度达到比较好的平衡。尽管如此,这样顺序执行的结果不一定意味着在速度 和准确度上达到较好的效果,因为分析步骤可能保存了太多合成步骤不需要的细 节。由于这个原因,图像分割不应该仅仅停留在分析步骤上,还应该紧密地结合 合成步骤。 1 2 图像表征概述 视觉系统的数学模型可以从不同的观点来着手。这些可以粗略地分成三类: 1 ) 单细胞模型,试图建造位于视觉皮层的单细胞对各种刺激的反应的模型1 4 】;2 ) 视觉处理模型,集中建造视觉路径的高次函数的模型,例如检测和表征轮廓、边 缘、平面等【5 】;3 ) 统计模型,为了达到不同的目的( 例如减少冗余或学习 润) ,把 视觉路径描绘成有效的感官转换。这些模型经常结合或互补地作为简单细胞模型 的输出,在视觉处理模型中用来表征高次结构。 我们先介绍g a b o r 小波的单细胞模型。v 1 神经元可以分成两类:简单细胞 和复杂细胞。在皮层表面形成视觉空间的一个系统表示。同倾向性的神经元聚集 在一起组成列,连续的列系统地以首选的角度旋转。视觉皮层上的简单细胞的可 接收域被建模成g a b o r 小波: f ( x ,y ) = e x p - ( x 一如) 2 止;+ 一y 。) 2 雕d、 e x p - 2 u i u 。( x x 。) + v o ( _ ) ,一y o ) 】) 其中( x o , y 。) 表示图像中的位置, 。,卢。) 表示滤波器的有效宽度, 。,v 。) 表示 滤波器的频率。这个复杂的滤波函数的实部和虚部表示在正交位移中简单细胞的 相连对。二维g a b o r 小波的二维傅立叶变换为 f ( ) = e x p f ( u 一) 2 口。2 + ( v - - v o ) 2 掰】j ,1 、 e x p 2 m i x d ( “一甜o ) + y o ( v v 。) 】) 二维g a b o r 小波的幂频谱表现为以 。,v 。) 为中心,幅度= 缸;+ 记) 们,相位 0 。= t a n - 1v o 一。的二元高斯分布。 本论文中介绍的h i m p a 图像表征算法属于视觉处理模型。h i m p a 算法用独 立主元模型( i c a ) 来表示图像中的边缘信息,用混合概率主元模型( m p p c a ) 来表示 2 浙江大学硕士学位论文 第l 章绪论 图像中的平面信息嗍。h i m p a 算法的具体内容见2 2 章节。e p i t o m e 图像表征算 法属于统计模型,e p i t o m e 是为了减少图像中的冗余信息而产生的图像的摘要, 该摘要远远小于原始图像,但仍包含了原始图像中的纹理信息和形状特征。 e p i t o m e 算法的具体内容见2 3 章节。 1 3 图像分割概述 般将图像分割算法分为两大类:基于区域的和基于边界的。 1 3 1 基于区域的图像分割 传统的分割算法例如s e e d e dr e g i o nc r r o w i n g ( s r g ) l ”j ,k - m e a n s c l u s t e r i n g ( k m c ) ! 1 2 1 ,c o n s t r a i n e dg r a v i t a t i o n a lc l u s t e r i n g ( c g c ) l ”j 都是基于区域的 图像分割技术。k m c 和c g c 通过聚类来挖掘像素间的相似性。采用一个或多个 特征来对每个像素进行评估,例如颜色,纹理信息等等。而与每个像素相关的打维 特征则被当作一个数据点来对待。例如k m c ( k - m e a mc l u s t e r i n g ) ,它是种循环 迭代方法,首先需要初始化j 个聚类中心,通过计算各个样本与聚类中心的距离 来划分输入样本,分类之后再重新计算各个聚类中心,重复上述过程,直至误差 小于一定的标准。k m c 对简单的图像通常产生较良好的分割结果。如果七值很小 并且有先验知识,那么k m c 特别简单有效。当遇到复杂的图像,k m c 的分割效 果并不理想,因为j j 值的确定变得不再微不足道了,特别是当图像含有大面积同 类均匀纹理并包含大量的颜色时。 另一方面,c c , c ( c o n s t r a i n e dg r a v i t a t i o n a lc l u s t e r i n g ) 运用引力成团说的概念1 1 4 j 来聚集数据点。将数据点看作堆并且计算堆之间的引力。在合力的影响下,允许 每个数据点缓慢移动。当两个数据点变得彼此接近时,它们被合并而形成一个类。 算法中引进了一个聚类约束条件来限制类之间的引力,因此终止条件和类的个数 可以很容易地定义。据称这个算法在r g b 颜色空间可以得到良好的分割结果。 c g c 减轻了确定类的个数( 对应于k m c 中的七值) 的困难,但是在聚类时它需要 更多的计算来模拟数据点的缓慢移动。这个算法的优点是它的计算复杂度与图像 的大小无关。可是,图像中包含大量的颜色时,复杂度将变得很高。 不同于k m c 和c g c ,s r g 并不使用聚类的概念来挖掘像素问的相似性。它 采用区域生长的概念,首先随机在图像中选取一些像素作为种子,通过测量种子 与周围邻近像素之间的相似性,将区域不断扩大直至区域的边界。这个过程一直 重复直到所有的像素都分配给了区域。在文献【1 1 】中,只考虑灰度图像并且用灰 浙江大学硕士学位论文 第1 章绪论 度值之间的差异来表示同类性。s r g 是简单的,可以很容易地扩展到彩色图像。 但是,s r g 的性能很大程度上取决于种子的选择,而种子的选择仍是一个比较难 解决的问题。 大多数有效的基于区域的分割技术都采用了聚类和种子生长这两个基本概 念。另一方面,在阀值技术研究上的进步也推进了区域生长所依赖的同类性标准 的发展。因此,可以同时结合聚类和区域生长这两种方法来进行图像分割。 在主观意义上,采用适当特征基于区域的方法可以产生较好的区域边界。在 两个区域相遇的位置上,可以很容易地探测出边界。但是只有这些边界点,在高 水平区域产生前,还需要进行进一步的处理,例如多边形逼近【1 5 】i l q ,b 样条逼近 1 7 1 1 埽1 ,网格逼近【1 9 1 2 0 1 等等。然而这些进一步处理的技术可能需要较高的计算量。 1 3 2 基于边界的图像分割 基于边界的分割技术主要使用边缘信息来定位区域边界。边缘信息是指特征 空间( 例如亮度,颜色,纹理等等) 的不连续点。在这种方法中,边界点首先定位 在边缘点上,然后这些点连起来形成封闭的曲线包围区域。 许多基于边界的分割技术都或多或少采用同样的方法。只在边缘检测方法和 边界连接方法上有差异。尽管有许多的边缘检测和边界连接方法可以采用,但是 要产生良好的分割结果,它们一般在计算复杂度上比较高。此外,由于对噪声敏 感,边缘检测易于出错。如果不得不精确地定位边缘,那么不得不投入额外的运 算量。另一方面,如果不采用精确的边缘检测,那么在边界连接阶段将需要额外 的工具,例如边缘细化和空洞填充,而这些工具也可能同样在计算上是高复杂度 的。 一些其他的基于边界的分割技术采用轮廓模型1 2 1 伽方法,这个方法始终保证 形成封闭的边界并且不需要任何边界连接工具。实质上,这些分割技术是从一条 初始的曲线开始的,然后这条曲线根据一些预先定义的模型和规则被变形和分 裂。于是,最后得到的曲线有希望和区域的边缘吻合。特别地,文献 2 2 2 6 q b 提 出,曲线可以被变形和分裂,用来最小化从边缘和几何信息中推导出来的相关的 熵。但是,这种最小熵方法的缺点是它的非线性,因为非线性导致了算法实现复 杂度高和不稳定1 2 5 1 。因此,许多这种分割技术需要在期望边界的邻近处对初始曲 线进行适当的初始化,通常交互式人工进行,从而减少了引导曲线到期望边界所 需的计算量,避免了陷入局部最小的情况。 4 浙江大学硕士学位论文第1 章绪论 1 4 论文的组织 以下是本论文的组织结构: 第二章介绍了两种图像表征方法:h i m p a 和e p i t o m e 。h i ma 是独立主元 i c a 模型和m p p c a 模型的混合【9 】。e p i t o m e 简单来说就是图像的摘要,但是它包 含了图像的纹路和形状特征f 1o 】。我们对1 0 幅图像进行了d c t 、h i m p a 、e p i t o m e 的分析比较,并且用p s n r 来检测在相同压缩率的情况下图像表征的效果。 第三章详细介绍了多尺度的图像分割算法s m a p 。s m a p 是一种基于贝叶斯 估计的图像分割方法 2 7 1 ,它采用多尺度随机场m u l t i s c a l er a n d o mf i e l d ( m s r f ) 来 替代m r f ,并且采用有序的m a p ( s m a p ) 估计来替代m a p 估计。由于采用了新 的估计和模型,分割算法不再是迭代的,并且计算量正比于m n ,其中膨为类的 个数,为像素的个数,为无监督模型参数估计实现了一种计算上有效的方法。 第四章详细介绍了基于四边形的图像分割算法q b s 。该算法首先从边缘图构 造四边形,然后合并具有相似特征的四边形来形成区域 2 8 1 。在这个框架中,四边 形表示减少了局部变动和合并中所不需要的细节,每个分割区域都可以用一些四 边形的集合来精确地,完整地描述。 第五章详细介绍了基于隐马尔可夫树的图像分割算法h m t s e g 。该算法是 个基于小波变换和隐马尔可夫树( h m t ) 模型的图像分割算法【2 9 l 。h m t 通过一阶 马尔可夫链来捕捉不同尺度下小波系数之间的相关性。h m t 是一个较优秀的区 分纹理的分类器。利用小波h m t 固有的树型结构和它的快速的训练和似然估计 的算法,在不同层次上执行纹理分类,然后用贝叶斯似然图来合并这些不同层次 的分类,最后得到一个较可靠的分割结果。 第六章用主观测评和客观测评来分析s m a p 、q b s 、h m t s e g 分割算法的分 割效果。将s m a p 分割算法与m e a n - s h i f t 、k m e a n s 分割算法进行比较分析。我们 对q b s 算法的实验结果进行分析,提出了q b s 算法存在的两个缺点,并且分别 进行改进。 5 浙江大学硕士学位论文第2 章图像表征 第2 章图像表征 2 1 离散余弦交换d c t 离散余弦变换d c t ( d i s c r e t ec o s i n et r a n s f o r m ) 是最常用的图像表征方法。它 先将整体图像分成n n 像素块,然后对n x n 像素块逐一进行d c t 变换。由于 大多数图像的高频分量较小,相应于图像高频分量的系数经常为零,加上人眼对 高频成分的失真不太敏感,所以可用更粗的量化。因此,传送变换系数的数码率 要大大小于传送图像像素所用的数码率。到达接收端后,通过反离散余弦变换回 到样值,虽然会有一定的失真,但人眼是可以接受的。 下面介绍两种新的图像表征方法:h i m p a 和e p i t o m e 。 2 2 h i m p a 算法 该算法用独立主元分析( i c a ) 模型来表示边缘,用混合的概率主元分析 ( m p p c a ) 模型来表示平面,因此简称为h i m p a 算法。 2 2 1 独立主元i c a 模型 独立主元分析0 c 方法旨在对不同的客观标准,将一个向量转换成在统计上 独立的主元。这是一种比主元分析( p c a ) 产生的线性无关更强的独立性。一图像 堆x 用混合矩阵a 的列的线性叠加来表示,向量s n 表示统计上独立的主元。 x = a s ( 2 1 ) 我们需要估算混合矩阵a ,从而求出独立主元j ,5 = a - 1 x 。稀疏性是强加 在独立主元s 上的一个额外条件。稀疏的活化模式用拉普拉斯密度分布来表示。 峰度定义为一个随机变量的第四次累积量,并且对满足高斯分布的随机变量,其 值为零。因此,为了估算彳,我们可以用j 的非高斯性作为评价函数。我们用峰 度来估算一个随机变量的非高斯性,并用负熵近似计算峰值。一个随机变量y 的 负熵定义为在同一协方差下,y 为高斯密度分布时的微分熵与它实际密度分布时 的微分熵之差【3 0 1 。 ,( y ) = h l 。) 一日( y ) ( 2 2 ) 既然对于一个给定的变量,高斯密度分布取最大的负熵值,则负熵值始终为 正,并且当且仅当y 为高斯分布时,负熵值为零【3 0 】。一个随机变量的负熵的近似 6 浙江大学硕士学位论文第2 章图像表征 计算为1 3 0 1 j ( s ) 2 专e s 3 ) 2 + 素砌( s ) 2 ( 2 3 ) ”k u r t n 在公式中表示随机变量的峰值。我们使用f a s t l c am a t l a b 软件包p l l 来 估算自然图像的独立主元。它采用快速定点的方法,通过迭代地增加负熵的近似 估计值来求稀疏的、独立的主元。估算的矩阵4 每次迭代时都投影到正交矩阵的 域上,使得公式( 2 1 ) 为正交变换。 结果产生的滤波器( 矩阵4 的列) 类似于g a b o r 函数和小波。向量s 是神经细 胞活化的种群编码,可由下面的公式计算得到 s = 彳7 x ( 2 4 ) s 的元素( 相当于源) ,若其数值较大则表示在图像堆中,相应明显的特征 的存在,如边、有向曲线等等;若其数值较小,则表示在图像堆中,大量的不明 显的边的叠加从而产生的小有价值的特征。 混合矩阵的列和向量s 的成分的顺序由置换来决定。独立子空间分析( i s a ) 和地形学上的独立成分分析对于有相似接收域的细胞的局部聚类允许s 的成分中 局部相关性的存在0 2 1 1 3 3 1 。在这些模型中,一些神经元( 向量s ) 子集的成分中存在 局部相关性,但与其余的成分相对独立,从而允许将有类似倾向性和频率选择度 的神经元聚合在一起。 我们通过反复的实验,对s 的成分,将阀值设为1 5 ,有比较大的活跃性。对 图像堆x ,j 中所有成分的绝对值小于1 5 的成分都设为零。用x s h , 砷表示重构后的 图像,我们得到 x s h a r p2 彳3 础 ( 2 5 ) 剩余的子空间为 x m ,础以f5x x 曲 ( 2 6 ) 不管怎样,剩余的子空间在表示图像的平滑区域有着重要的作用,所以不能 完全被忽略。我们使用隐变量模型m p p c a 来表示剩余的子空间。 2 2 2 m p p c a 模型 2 22 1 p p c a 模型 传统的p c a 模型在最小二乘方的情况下,寻找最好地表示原数据的q 维 ( g d ) 线性投影。考虑已知的d 维的数据集d = t n ) ,其中n e l ,n 。我们先计 7 浙江大学硕士学位论文第2 章图像表征 算样本的协方差:s = 专( - u ) ( t 。- u ) 7 其中= i 1 :,。然后,主要的口个 n = l y 坐标轴,由s 的g 个最大的特征向量给出。数据f 。的投影值x n = w ( 一p ) ,其 中u q = ( ,“。) 。我们可以看出p c a 寻找使投影空间值最大的线性投影。 传统的p c a 并没有采用概率模型。p c a 可以用隐变量模型的最大似然估计来 表示。令x 为口维的隐变量,则现有的变量t 为x 的线性变换,再加上额外的噪声 考:,= w x + p + 考,其中形是一个d x 口的线性变换矩阵,p 是一个d 维向量,它 允许,的平均值非零。隐变量x 和噪声毒都是等方性的高斯分布的: p ( x ) y ( o ,厶) 和p g ) n ( o ,仃2 乃) 则f 也是高斯分布的: p ( t ) ( p ,聊1 + 盯厶) 可以用最大似然法来从已知数据集d 中估算参数、w 和仃2 。这个模型下 l o g - l i k e l i h o o d 为:三= l o g ( p ( t 。) ) 这些参数的最大似然估计值为舢: p 肌= 专二t n ( 2 7 ) 仃乞2 孑 ( 2 8 ) w u l = u g ( a 目一仃乞,) “2 r ( 2 9 ) 其中+ l ,乃是样本协方差矩阵的最小的特征值,d xg 正交矩阵的g 列 为样本协方差矩阵的q 个主要的特征向量,对角矩阵a 。包含相应的g 个最大的特 征值,并且r 是一个任意的g 口正交矩阵。在实验中,我们令r = j 。 2 2 2 2m i x t u r eo f p p c a 模型 使用有限模型的混合聚类方法众所周之。在这种模型中,我们假定数据由混 合成分的密度函数产生,每一个成分的密度函数p ( f l f ) 表示一个类【3 5 】。既然p p c a 定义为概率模型,我们可以用一个p p c a 分布来表示混合模型中的成分。则已知 变量f 的概率密度分布为: 浙江大学硕士学位论文第2 章图像表征 p ( f ) = 万,p ( f i p ,仃? ,w t ) ( 2 1 0 ) 其中p ( tl ,仃,2 ,嵋) 表示成分f 的p p c a 密度分布,表示成分的个数,疗。表 示成分,在混合模型中所占的比例( 满足约束:a i o 和e i 。= ii = 1 ) 。则已知变量 的l o g 1 i k e l i h o o d 表示为: k o 三= z i o g 庀f p ( t 。l p f ,仃;,w ,) ) ( 2 1 1 ) n = li = 1 很难最优化,因此采用e x p e c t a t i o n - m a x i m i z a t i o n ( e m ) 算法来寻找它的局部 最大值。如果我们假定一组指示变量z n f 来指示由哪个模型负责产生变量,则 l o g - l i k e l i h o o d 值为: 工。= z n i1 0 9 # i p ( t 。l p f ,叮;,w i ) ( 2 1 2 ) 采用e m 算法来求参数,;、胁、口;和彬的最大似然估计值,如下所示: e s t e p 求变量“隶属于成分i 的隶属度如f : r n ,啦小坐挚 ,= 砸= 。】= 三_ ( 2 1 3 ) _ p i f 。, 其中e 】为平均值算符。 m - s t e p : 一2 专荟 ( 2 1 4 ) 胁:莹 ( 2 1 5 ) 一- 为了更新砰和形,我们先计算有权重的样本协方差: 仙銎! :! 竺( 2 1 6 ) 毋= 业l 百一弘“v r 。 然后求公式( 2 8 ) 和公式( 2 9 ) ,如果d 值很大,我们应该用改进的e m 方法来更 9 浙江大学硕士学位论文第2 章图像表征 新盯;和暇,加快计算速度。 2 3 e p i t o m e 模型 一幅图像的e p i t o m e 就是它的缩略图,包含了图像的纹路和形状特征。e p i t o m e 的大小要比原始图像的实际大小小很多,但它依然包含了很多构成信息以便重构 图像。很多幅图像通常共享一个e p i t o m e 。比如视频中的一些相邻帧或相似物体的 照片。 一幅大小为m x n 的图像,它的e p i t o m e 大小为m 以,虬,m e - 。黜c 嘴力,。g 甓k 爱k = 警l ( 矗j 岛o q 、pj, 用点估计来计算参数的后验概率。假定图像的碎片是独立产生的,则其相应 的映射也是独立的, q ( t a 乙,e ) = a ( e 一# ) 兀g ( 五)( 2 2 0 ) 界限丑在a = ( 丘,妒) 中是二次函数, 口= g ( ) 1 0 9 p ( t 1 ) - i o g 碍( 珏) 】+ g ( ) l o g ( z 啦;丘珏( o ,妒砭( j ) ) ( 2 2 1 ) k = lk = l f e 取 浙江大学硕士学位论文第2 章图像表征 对相应的g ( 五) 和迭代地增加界限来优化参数。因为除了最大化参数外并没 有对后验概率进行任何估计,所以这是一个标准的c x p e c 眦i o n m a x i i 毗卿i o n 算法, 带有它一贯的收敛性和局部最优的特性。 在e 步骤,映射疋的密度分布为: q ( t k ) p ( t k ) r ! ( z f ,k ;r k ( o ,妒( i ) ) ( 2 2 2 ) 并且对g ( 瓦) 进行归一化。 在m 步骤,e p i t o m e 的平均值p 和方差庐如下计算: 驴秀嚣s , 护鼍蠹群4 , 2 4 实验步骤和结果 2 4 1d c t 模型 我们将块大小设为8 8 ,则其变换矩阵大小也为8 x 8 ,从m a s k 可以看出,每块 只保留了1 6 个数值,压缩量为2 5 。 m a s k :【l1 1 1 110 0 ll l loo0o 111o0 0 o o ll0 o0oo o l0 00 000 0 0000 00 00 oo o o 0 0 0o 00000 000 】 2 4 2 h i m p a 模型 我们用1 3 幅自然图像来估算模型的参数。先对每一幅图像进行归一化,使其 平均值为零,方差为l 。从训练集中随机挑选1 6 x 1 6 的块,对其进行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论