已阅读5页,还剩75页未读, 继续免费阅读
(电路与系统专业论文)基于独立元分析的仿射参数估计和目标识别[电路与系统专业优秀论文].pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 目标识别,由于其广泛应用前景,将在社会生活中占据越来越重要的位置。 在众多的目标识别方法中,提取目标的仿射不变描述子是近年来研究的热点。 面传统的方法在对噪声的鲁棒性、细节区分能力以及对目标轮廓采样的随意性 上仍存在很多不足之处。 针对以上几个关键性问题,本文在以下几个方面进行了创新性的探索。 ( 1 ) 从理论上证明了用独立元分析的方法束实现仿射描述子抽取和仿射参 数估计的可行性,提出了一个定理和三个推论。 ( 2 ) 提出了用独立元分析来提取目标仿射不变描述子,并同时估计两个完整 目标轮廓间的仿射运动参数的算法,实验结果表明该算法优于传统方法。 ( 3 ) 针对实际情况中,目标完整轮廓抽取的困难,对基于独立元分析的算法 作进一步扩展,提出了无需点对应的随机采样下的仿射参数估计和仿射不变描 述子提取算法,该算法克服了传统f o u r i e r 算法无法适用于轮廓随机采样下的情 况。 ( 4 ) 进一步将仿射不变描述予提取算法应用于彩色图像上。 ( 5 ) 在目标轮廓提取上,针对传统动态轮廓线算法的计算耗时,以及基于梯 度的细胞神经网络实现动态轮廓线存在局部最小问题,提出了用细胞神经网络 实现g v f 场的计算,并结合基于细胞神经网络的动态轮廓线模型来实现图像的 轮廓分割和提取,解决了传统动态轮廓线算法不能实时计算的缺点,也克服了 梯度场的局部最小性问题。 最后,在研究的基础上,我们完成了两个实际系统,基于独立元分析的目 标识别系统和智能机器人系统。 关键字:独立元分析、仿射不变描述、目标识别、仿射运动估计、图像分割 图书分类号:t n 9 1 1 7 3 a b s t r a c t a b s t r a c t p a t t e r nr e c o g n i t i o nt e c h n o l o g i e sw i l lb em o r ea n dm o r ei m p o r t a n ti no u rs o c i a l b e c a u s eo ft h e i rb r o a da p p l i c a t i o n s e x t r a c t i n g a f f i n ei n v a r i a n td e s c r i p t o ro f r e c o g n i z e do b j e c tb e c o m e st h eh o t s p o to fr e s e a r c hi nr e c e n ty e a r s ,b u ti n c o n v e n t i o n a lm e t h o d s ,t h e r ea r em a n yd e f e c t ss u c ha ss e n s i t i v i t yt on o i s e ,d i f f i c u l t y t oi d e n t i f yo b j e c t s d e t a i l se t c f o c u s e do nt h e s ep r o b l e m s ,w ed i ds o m ec r e a t i v er e s e a r c hw o r ki nt h i st h e s i s ( 1 ) w ep r o v e dt h e o r e t i c a l l yt h a t1 c ac a nb eu s e dt oe x t r a c ta f f i n ei n v a r i a n t d e s c r i p t o ra n de s t i m a t ea f f i n et r a n s f b n n a t i o np a r a m e t e ro fo b j e c t s a n dp r o p o s e do n e t h e o r e ma n dt h r e e1 e m l l l a 8 ( 2 ) w ep r o p o s e dan e wa l g o r i t h mt oe x t r a c ta f f i n ei n v a r i a n td e s c r i p t o ru s i n gi c a , w h i c hc a ne s t i m a t ea f f i n et r a n s f o r m a t i o n p a r a m e t e ra t t h es a l l l et i m e a n d e x p e r i m e n tr e s u l t ss h o w e dt h a to u rm e t h o dh a sb e t t e rp e r f o r m a n c et h a nt r a d i t i o n a l m e t h o d s ( 3 ) a si t sd i f f i c u l t yi ne x t r a c te n t i r ec o n t o u ro fo b j e c tp r a c t i c a l l y , e x t e n d i n gt h e t r a d i t i o n a la l g o r i t h mb a s e do ni c a ,w ep r o p o s e dan e wm e t h o dw h i c hc a ne x t r a c t a f f i n ei n v a r i a n td e s c r i p t o ra n de s t i m a t ea f f i n et r a n s f o r m a t i o np a r a m e t e r , w i t h o u t c o n s i d e r i n gc o u n t e r p a r t so fs a m p l ep o i n t s o u rm e t h o di sa p p l i c a b l et of r e e l y c o n t o u rs a m p l i n gw h i c hi sa no b s t a c l ei nf o u r i e rm e t h o d ( 4 ) f u r t h e r m o r e ,a f f i n ei n v a r i a n td e s c r i p t o rm e t h o dh a sb e e nu s e di nc o l o r i m a g e ( 5 ) o nt h ed o m a i no fo b j e c tc o n t o u re x t r a c t i o n ,a ni m p l e m e n t a t i o nm e t h o do f g v ff i e l du s i n gm u l t i l a y e rc e l l u l a rn e u r a ln e t w o r k s ( c n n ) i sp r o p o s e d ,w h i c hi s c o m b i n e dw i t he x p a n d e da n dt h i n n e dm o d e lo fc n nt or e a l i z et h e i m a g e s e g m e n t a t i o ns t r a t e g yo fa c t i v ec o n t o u r s t h ec n nh a sp a r a l l e lp r o c e s s i n ga b i l i t y t h e r e f o r ei tn o to n l ys o l v e st h ep r o b l e mo fc o m p u t a t i o n a lc o m p l e x i t yo fg v f f i e l d u s i n gt r a d i t i o n a ls e r i a lc o m p u t a t i o n ,b u ta l s oa v o i d st h el o c a lm i n i m u mi nc n n a c t i v ec o n t o u r s f i n a l l y , w ed e s i g n e dt w or e a ls y s t e m s o n ei sr e c o g n i t i o ns y s t e mb a s e do ni c a , t h eo t h e ri si n t e l l i g e n tr o b o ts y s t e m k e y w o r d s :i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,a f f i n ei n v a r i a n td e s c r i p t o r , o b j e c t r e c o g n i t i o n ,a f f i n et r a n s f o r m a t i o ne s t i m a t i o n ,i m a g es e g m e n t a t i o n 2 第一章绪沦 第一章绪论 视觉是人类从大自然中获取信息的最主要的手段,外部世界丰富多彩的信 息有8 0 是通过视觉感知的,因此视觉信息对人类是非常重要的。从信息处理 的角度搞清它的机理,研究它们的算法,以使计算机实现人的视觉中的图像信 号分析、处理和模式识别能力,这样就形成了一门学科一计算机视觉。 计算机视觉是用计算机来模拟生物视觉功能的科学和技术。它的研究目标 是使计算机具有通过一幅或多幅图像认知周围环境信息的能力。这种能力将使 其能感知环境中物体的几何信息,包括它的形状、位置、姿态、运动等,而且 能对它们进行描述、存储、识别与理解。随着计算机技术、控制理论、模式识 别、人工智能及生物技术的发展,计算机视觉在机器人导航、工业控制、目标 识别跟踪和军事技术中的应用越来越广,研究范围和方法也从二维图像到立体 视觉,从串行到并行,从直接依赖于输入信号的底层处理到依赖于结构、特征、 和知识的高层处理。随着跨学科基础研究的不断深入和计算机性能的提高,计 算机视觉将广泛地应用于更复杂的应用场合。在这其中,模式识别是计算机视 觉的核心部分。 模式识别基本上可以分为两种:即统计模式识别方法和结构模式识别方法。 统计模式识别是用给定的有限数量样本集,在己知研究对象统计模型或已知判 别函数类条件下,根据一定的准则通过学习算法把高维特征空间划分为多个区 域,每一个区域与每一类别相对应。模式识别系统在进行工作时只要判断被识 别的对象落入哪一区域,就能确定它所属的类别。而结构模式识别是利用模式 与子模式分层结构的树状信息所完成的模式识别工作。 模式识别系统主要有以下几个部分组成:信息获取、预处理、特征提取和 选择、分类决策,如图1 - 1 1 所示: 囹一圈一困一囹一囡 图1 - 1 1 模式口 别系统 由于计算机视觉的信息获取大多是利用蕈个摄像机或数码像机,因此,利 用二维图像进行目标识别是模式识别的重要组成部分,在军事、工业自动化等 领域有着广泛的应用背景。长期以来,学者们对这个问题进行了大量的研究。 目标识别,尤其在复杂背景下进行目标识别是一个棘手的问题,主要体现在对 于不同的复杂背景和不同的目标类型,尚无找到通用的,适于各种情况的算法, 第一辛绪沦 只能是对特定问题采用最合适的方法。有时,由于无法完整地提取出目标,也 会造成对目标识别的困难,甚至,在有的情况下,目标提取得支离破碎,使识 别难以进行,借助于单一的特征来解决复杂背景下目标识别的问题局限性很大, 如何把目标从复杂的背景中分割出来,如何抽取特征使相同的目标特征表征t 分相近,而不同的目标相差比较远,是二维图像目标识别中十分关键的问题。 本论文着重讨论二维图像的目标识别中的同种目标不变量的提取问题,提 出了一种新的解决方法,把独立分量分析应用到目标不变量的提取上,给出理 沦证明及针对目标不变量的具体算法,并在各种情况下的应用,形成一个目标 识别系统,同时针对复杂背景的目标分割问题,提出用细胞神经网络的方法实 现动态轮瘠线算法。为了便于说明我们的思想,为此,我们先介绍现有的图像 识别中特征抽取的主要方法、三维空间的目标的“二维表示”中的仿射变换、 现有的和最新的目标仿射不变性算法中存在的问题,论文的贡献及创新点,最 后给出本论文各章节的按排。 1 1 图像识别中特征抽取的主要方法 图像识别是模式识别的一个分支,特指以图像作为对象的模式识别技术。 广义上蜕,任何空间和幅度有限的两维信号都可以被认为是图像,因此除了我 们常见的图画、影像外,手写字符、遥感图像、超声波信号,c t 影像,m 砌 影像,射电照片都是图像。传统的图像识别的特征抽取方法主要有:基于色彩 特征的方法、基于纹理特征的方法以及基于形状特征的方法。 1 1 1 基于色彩特征的方法 色彩是物体表面的一种视觉特征,每种物体都有其特有的色彩特征,譬如 人们说到绿色往往就是和树木或草原相关,谈到蓝色往往是和大海或蓝天相关, i 司一类物体往往有着相似的色彩特征,因此我们可以根据色彩特征来区分物体。 由于直方图2 1 具有简单的大小、旋转变换不敏感的特点,得到了研究人员的广 泛关注。 1 1 1 1 全局色彩特征方法 全局色彩特征识别技术是目前采用最多的色彩直方图的方法,其主要思想 是根据色彩直方图统计每种色彩在图像中出现的概率,然后采用色彩直方图的 交集来度量两幅图像色彩的相似性,其最大缺点是完全丢失了图像色彩的空间 信息。后来p a s s 等人1 3 提出了图像的色彩聚合矢量c c v ( c o l o rc o h e r e n c ev e c t o r ) 的方法,它是图像直方图的一种演变,其核心思想是将图像中在感知上色彩相 似的像素所占据的连续区域的面积大于一定的阅值时,该区域中的像素为聚合 像素,否则为不聚合像素,这样统计图像包含的每种色彩的聚合和不聚合的比 例称为该图像色彩聚合矢量。该信息在某种程度上保留了图像色彩的空间信息。 关于图像色彩直方图之间的距离,目前主要有直方图的交、直方图的绝对 值距离2 1 ,n i b l a c k 和b a r b e r 等人采用直方图的欧几里德的度量方法1 4 1 , h a f e r 等 人提出了色彩直方图之间的加权距离作为直方图之间的度量方法【5 】。 1 1 1 2 局部色彩特征方法6 ,7 由于全局色彩特征捕获了图像色彩分布的信息,丢失了许多局部的色彩空 间信息,针对此问题出现了许多基于局部色彩特征的技术,从划分局部区域的 角度来说可分为:基于固定块的图像分割、基于手工的区域分割、采用交互的 半自动区域分割以及一些自动的色彩分割方法。局部区域中的色彩信息可以表 示为平均色彩、主色彩、色彩直方图和二进制色彩集。局部色彩特征技术的主 要思想是从图像中选择一些代表色彩,然后将图像划分成一定的区域,每个区 域中以一种主要的单一色彩作为代表,两个图像之间的相似性是估计两幅图像 具有的相似色彩区域的重叠程度。 1 1 2 基于纹理特征的方法 纹理是图像的个重要属性。关于纹理的定义和纹理的量化方法有许多, 其中主要有两种:一种是结构方法,一种是统计方法。前者是将图像中具有结 构规律的特征加以分析,后者则是对图像灰度的分布信息进行统计。h a r a l i c k 【8 l 纯粹从数学上研究了图像纹理与灰度级的空间依赖关系,根据图像中像素之间 的方位和距离关系构造了个共生矩阵,然后从中提取有意义的统计特征作为 纹理特征的表达,使用的特征主要有能量、熵、相关性和惯量,该方法的最大 缺陷是这些统计特征没有和人在视觉上对纹理特征鉴别之间建立对应关系。 j u l e s z 对此作过一些心理实验【9 1o ,此后,出现了基于一心理实验的纹理特征的识 别、度量方法,其中t a m u r a 提出的纹理特征集能符合人类视觉感知,这些特征 包括:粗糙度、对比度、方向度、归整度和粗略度,在这些特征中最重要的特 征是纹理的粗糙度、对比度和方向度,随后有不少人提出了纹理的特征集 1 1 - 1 4 1 。 但目前还没有一个统一的标准来精确地表示纹理的特征,因为人对纹理的视觉 特征的认识非常主观。随着小波变换理论的出现,小波变换在图像纹理分析中 第r 章绪论 得到广泛的应用,一些人从小波子段中提取统计特征作为图像的纹理表示【1 5 同时,发现基于g a b o r 基的小波变换的纹理效果最好【1 6 】。 1 1 3 基于形状特征的方法 目标的形状是图像的重要可视化内容之一。在二维图像空间中,目标的形 状通常被认为是一条封闭的轮廓曲线所包围的区域,所以对形状的描述涉及到 对轮廓边界的描述以及对这个边界所包围区域的描述。目前的基于形状的识别 方法大多围绕从目标形状的轮廓特征和形状的区域特征来进行。关于对形状轮 廓特征的描述主要有:直线段描述、样条拟合血线、f o u r i e r 描述予以及高颠参 数曲线等等。j a i n 等人将形状用封闭的直线段来描述mj ,庄越挺提出了形状的 内角亩方图概念【1 ”,g u d i v a d a 采用样条曲线对形状的边界进行拟合【19 】,r u iy 等人提出了改进的f o u r i e r 描述予描述形状的边界信息【2 0 j 。不过上述方法存在的 主要问题是一些形状特征的描述不是独立于形状的大小、位置和方位,在使用 时有一定的局限性,而且这些方法对形状表示时信息丢失较多,导致识别的效 果不是很理想。对于形状的区域特征主要有形状的不变矩、区域的面积、形状 的纵横比等。h u ”】提出了用形状的7 个不变矩来度量形状的特征,该七个不变 矩指的是物体像对于旋转、平移、尺度变换不敏感的特征量,不少人也为此提 出了快速算法【2 2 ”】。在h u 的启发下,不变矩理论得到了很大发展,仿射不变 矩口i j 也正是在不变矩理论下的又一发展,随后又开始了对目标物体的仿射不变 描述的研究,这对图像模式识剐起了很大的推动作用。 本论文主要研究的是基于刚体目标的形状特征的识别方法,而在3 d 空间中 的刚体用二维的图像来表示必然会造成形状上的变异,即:一个目标物体在不 同的视觉角度,不同的光照,以及不同的其他条件下,在外形上存在很大的差 异,而视觉系统就需要去概括该目标的这些不同,同时系统又需要去维持目标 本身的特征 2 ”。目标识别的主要问题是:不管目标经过什么变化,是否存在一 个表征这个目标的类型的不变量,以及是否可以从观察样本中得到这个不变量。 很显然,对于刚体目标来说,由图像平面上缩放、平移、旋转和扭曲组成的二 维仿射变换,在某种程度上可以模拟目标的这种变化。为此,我i i q $ , i 论3 d 目 标的2 d 表征模型。 笫一节绪论 1 2 三维目标的二维投影模型之间的关系仿射变换 1 2 1 摄像机成像模型 光学成像是三维空间到二维平面上的投影,将空间物体按照一定规律投射 存平面上形成图像,称为透视投影。当投影线交于一点时,称为中心透视,对 应的3 d 坐标到2 d 图像坐标的变换称为透视投影变换,当投影线平行时称为平 行透视。 实际的摄像机成像可以用一个中心透视模型很好的近似,如图卜2 一l 示。 【j p ” , 一, 。纱3 声 a r 少 图1 - 2 - 1 透视成像几 f 模型 三维空间的目标点p ( x ,y ,z ) 投影到像平面上产生对应的像点p ( x ,y ) ,所有 的投射线( 目标与其像点的连线) 延伸后都交于一点,该点称为投射中心( 或透视 中心) ,也就是三维空间的坐标原点,此坐标和摄像机绑定在一起。设光轴为z 轴,像平面位于z = f ( 厂为焦距) 并垂直于z 轴,像平面坐标系0 一r y 的原点是 像平面和z 轴的交点,x 轴、y 轴分别平行于茗轴、y 轴,则三维空间中的点 p ( ,y ,z ) 与其像点p ( x ,y ) 的坐标有如下非线性透视变换关系: i x = f x z 【y = f r z ( 卜2 1 ) 中心透视是多对一的映射,在同条投影线上的不同目标点有相同的像点。 摄像机从不同视点拍摄,其几何模型可以参照如下分析: 设三维空间中一点e ( x ,y ,z ) 7 ,坐标系旋转及平移后,其在心坐标系中成 为p ( ,y ,z ) 7 ,点的坐标变换关系可以用下面的方程表示: p 。= r p + f ( 卜2 2 ) 上式中,r 是3 3 的旋转矩阵,t 是平移矢量。式( 卜2 2 ) 可以表示为: 川簸珊目 猢, 在三维空间的任意平面 的任意“个点,它的三个坐标存在约束关系,坐 标点( x ,y ,z ) 应满足z ;a x + b y + c ,其中d ,b ,c 为该平面的参数,将此关系代 x = ( i + a r l 3 ) + ( 2 + 6 3 ) y + ( c ,13 + f 1 ) = 口1 l x + 口1 2 y + 口1 3 ( 1 2 4 ) 阡融拭1 。 1 2 2 中心透视的仿射近似 利用图卜2 l 中心透视模型的摄像机在不同视点对同一日标拍摄的图像, 目标点p ( ,) ,z ) 投影到像平面上产生对应的像点p ( x ,_ y ) ,所有的投射线之间 不是满足平行关系,它们之间的坐标变换是射影变换。 在非齐次坐标表示下,仿射变换是线性关系,而射影变化是非线性关系, 因此在模式识别中构造仿射不变量要比构造射影不变量要容易得多。实际的生 物成像或摄像机成像是一个中心透视投影,平面日标的成像属于射影对应,即 空间的坐标到像平面的坐标对应。 在平面目标的深度和它与摄像机之间的距离相比较小时,投影线是近似平 行的,此时,可以用仿射变换近似射影变换。在实际应用中,目标深度和它与 摄像机之间的距离相比较小的情况是比较多的,例如,为了避免严重透视失真, 通常镜头离目标较远,设描述目标的点集为( x :,z ) q = l ,2 ,) ,z z + d , 占,是点f 的z 坐标相对于点集中心坐标z 分量的差。当z 占,时,相应的平 一j“j 面像点坐标有: x ;= x z :zx :z ,y i = i z f = z ( 1 2 6 ) 如果用仿射变换近似射影变换“,须满足( z 0 一z 二) z 0 ,亚高斯信号k u r t 0 。如果独立变量是非高斯分布 的,那么经过混合矩阵后,观察变量会趋向于高斯分布。独立元和被观察随机 变量间的不同分布可以通过调整线性转移矩阵w ,使得经线性转移的随机变量 的峭度远离零。虽然峭度可以当作非高斯信号的独立性标准,但是对于超高斯 和、亚高斯信号,它们的峭度的符号相反,这使得实际计算变得复杂。一个改进 的独立性的判据是基于负熵的,无论随机变量是超高斯或者亚高斯分布的,经 量三童鍪圣垄坌堑童篁墅童垫篁竺塑! 堡堡型圭墼堡里 过白化后的随机变量,通过最大化负熵,就能够找到线性转移矩阵w 。h y v i r i n e n 提出了一种基于负熵的快速i c a 算法“,这使得i c a 可以用在实时信号处理上。 负熵j 定义如下: j ( y 。) = 1 4 ( v ) 一i 4 ( y f ) ( 2 - 1 5 ) 其中v 是一个高斯分布的随机变量y ,是一任意分布的随机变量。h ( ) 表示随 机变量的熵。可以证明当v 和y j 的均值和方差相同时,负熵总是非负的“”。通 常,我们使v 和y 的均值为零,方差为1 。非高斯的测量是最大化式( 2 一卜5 ) 的 负熵,一个近似的负熵表达式“”如下所示: j ( y 。) = ( 一 ) 2 , i = 1 , 2 ,n ( 2 - 1 6 ) 其中g ( y ,) e x p ( y 1 2 2 ) ,v 和y ,是零均值,单位方差的随机变量。通过最大 化j 可阻找到矩阵。注意:为了满足均值和方差的条件,观察变量工。( f ) 需要 被白化成零均值,单位方差。 设观察矢量x 的均值为m 。,那么相关矩阵为r ;= e ( x m 。) ( x m 。) 7 ) , 同时设u = ( ,:。) 为毋的特征向量,对角阵2 7 = d i a g ( 2 q ,a :,九) 是r 。的 特征值,那么白化后信号戈可以表示为: 贾:三- 1 ”u7 x( 2 一l 一7 ) 贾满足e 棘7 - j ,其中j 是单位阵。很显然,白化后的信号是互不相关的。 考虑到独立元j j 的尺度是易变的,我们可假定e s ( t ) s c t ) 7 - i ,这样( 2 - 1 3 ) 式中矩阵a 等于单位阵。当白化后的随机矢量替代原始观察的随机矢量后,转 移矩阵就被矿替代,满足y = w x 。w 的迭代方程可以通过最大化( 2 - 1 6 ) 式中的负熵,得到“。对于矩阵妒7 中第i 个列矢量的茹,迭代公式如下: 谛,( r + 1 ) = 一 茹,( f ) i = 1 ,2 ,棚 ( 2 一l 一8 ) 其中g 是公式( 2 一卜6 ) 中函数g 的一阶导数,g 是g 的一阶导数。归一化操作如 下表示: 谛,o + 1 ) = 帚。( r + 0 1 1 谛。0 + l 】i i = 1 , 2 ,月 ( 2 1 9 ) 通过( 2 一卜8 ) 和( 2 - 1 9 ) 的迭代,我们可以找到矩阵旷7 的全部列矢量, 妒= ( 茹。,谛:,茹。) 7 , 对它进行正交化: 形= 眵谚7 r “2 妒,使得形满足: 矿形7 = ,因此独立元满足: e l ,( f ) y ( r ) = e p j 西i 7 形7 = j ( 2 一卜一1 0 ) 结合( 2 17 ) 和( 2 一卜1 ) ,我们得到: 丝三塞垫塞垂坌堡垒堡些耋垫篁! ! 塑星堑堡型圭塑堡星 yz w x = w 一 z ”ux = 删= w a s = 朋 ( 2 十1 1 ) w :庇2 u :只4 。 因此i c a 能同时解出方程( 2 1 1 ) 中的a = w 。p 和s 。 2 1 2 二元独立元分析理论 其中m 1 ) = 珐c x p ( _ 争掣1 0 9 【1 + 等卧_ y m 蝣 p=:占i擘,彦-1。,掣: c z 一一- a , , ,匕埘! 。: 、“7 第二章独立元分析在仿劓参数估计和目标识别卜的应用 都需要进行预白化处理,负熵的方法的速度比较快,但由于它在迭代时需要对每 个源单独进行,得到每个元的权矢量后再进行正交化,而权矢量的初值是随机 的,获得的源的先后次序是对权矢量会产生一定的误差:而式( 2 一l 1 2 ) 相对精 度比较高,保证其唯一性,但比较费时,在处理具体问题时可加选择 独立元分析可解盲信号分离、盲卷积等,j 9 9 6 年后,独立元分析被用于对 人脸图像的特征提取。本论文把独立元分析用于解决一些仿射模式识别或仿射 参数估计方面的问题,目前还没查到与此有关的文献。为此,论文的后面章节 将从理论上、算法上和它的各种应用上比较全面地讨论我们提出的这种方法的 可行性、实验的结果和其他传统方法的比较。 2 2 基于独立元分析的仿射参数估计和目标识别的基本理论 假设目标物体“a ”的轮廓被采样成点,表示为k o ) = 阮( f ) ) :。,其中,圆 括号中的f 是采样点的序号,给定t ,x 。( r ) 是一个由x 和y 坐标方向上的坐标数值 组成的矢量,当目标轮廓存在噪声时疋o ) = 【b ( f ) z 。,( f ) 7 是一个随机矢量。同 理,物体“a 经仿射扭曲后的轮廓数据点也是随机矢量,根据式( 卜4 一1 ) ,这 两个目标物体之间的关系可写为: x 。o ,= ;:z :, :j l j u + l f 。b ,j l = z x 。o ,+ 丑v r = ,z ,c z z t , 对任意的参数矩阵z 和矢量b ,式( 2 - 2 一】) 中的x 。( f ) 都可看为近似随机矢 量,下面为了表达方便,我们省略了变量t 。 把x 。( f ) 化为零均值的随机矢量贾。( f ) ,则式( 2 - 2 1 ) 中的矢量b 可消去得 到: 贾。( f ) = 1 :”p 。( f ) = 蕊。( f ) v t = l ,2 ,j ( 2 2 2 ) 为了方便起见,在下面我们仍然用x 。( f ) 和x 。( f ) 表示已移去均值的随机矢 量。 设随机矢量x 。的两个元素x 。和工。是两个随机观察变量如果变量k ,x 。, 是近高斯分布的,那么我们认为x 。是由两个比它更偏离高斯的独立元,和s 。, 线性组合而成的,那么有: x 。= a s 。 ( 2 - 2 3 ) 其中一是一个未知混合矩阵,s 。是未知的独立元矢量,s 。= i s 。j 。 7 ,根 据i c a 理论,方程( 2 - 2 3 ) 的解存在,可以通过2 i 2 节中提到的负熵或式 ( 2 一卜1 2 ) 的代价函数求得x 。的有效表示e , :堡三塞垫兰垂坌堑垒篁型耋墼篁堡垒! 堡堡型圭墼堡星 l = w x 。= w a s 。* p s 。 ( 2 2 4 ) 其中叉。具有零均值,单位方差的观察矢量,j 是贾。的混合矩阵,p 是置换 矩阵,所以对于随机矢量x 。,肯定存在+ 个有效表示y d ,满足k = w x 。,其中 匕中的元素,和儿。尽可能的独立。 采用独立元的方法是否能获得仿射不变量,下面我们给出定理和证明。 定理l : 如果x 。和忸:,x :,x : 是多个随机矢量,分别表示物体“a 的轮廓 和“a ”经不同的仿射参数z 和曰进行仿射变换后的轮廓,如果轮廓的采样初 始点相同,那么,这些轮廓必定存在一个相同的有效表达,又称仿射不变量。 证明: 对于随机观察矢量x 。,存在一个有效表示l ,y 。= p s 。假定 讧:,x :,x : 是物体“a ”经过不同的参数z 和b 的仿射扭曲后轮廓的采样序 列,不失一般性,对其中任一个仿射变换轮廓x :,那么: 。= z x 。+ b = z a s 。+ b = 爿7 s 。十四 ( 2 2 5 ) 随机矢量x 。的有效表示同样可以通过负熵找到。对x 。进行白化,使其满 足e x 1 。叉。7 ) = i 也就是说贾。的中心已移到坐标原点,因此平移矢量口:0 。 式( 2 2 - 5 ) 可以改为: x 。= a 召。( 2 - 2 6 ) 这里j 。是线性混合矩阵。考虑到仿射矩阵z 可以改变戈。中两个元素的次 序和符号,式( 2 2 6 ) 中会有符号的变化。使用相同的方法,x 的有效表示可以 通过调整形得到, y 。= w x 。= w 川s 。p s 。 ( 2 - 2 7 ) 这里,是如式( 2 1 1 4 ) 中带有符号变化的置换矩阵。从( 2 - 2 - 4 ) 和( 2 2 7 ) 我们可以得到y 。= p p y 。设m = ( p p 。) ,根据( 2 1 1 4 ) m 的取值只可 能为以下8 种情况 m = 瞄蜀或= 曙期 因此: m l = 匕 ( 2 - 2 8 ) 其中l 是仿射不变描述,比较和l ,矩阵肘只是改变这两个矢量的元的 次序和符号。对任何参数为z 和丑的仿射变换,都存在一个只影响坐标的次序 和符号的m 矩阵,使式( 2 2 8 ) 满足,因而艺可表达任一个由目标”a ”生成的 仿射不变描述的目标轮廓证毕 第二章独市兀分析在仿射参数估汁和目标识别上的应用 在事实上,如果设p7 p = m ,那我们有= m 匕,此时,我们可以定义y l 。 是仿射不变描述。在实际应用时,我们可以认定个轮廓形状为仿射不变描述, 其他部可通过求得的m 变换到这个仿射不变描述上来。此时式( 2 2 8 ) 和下述 方程等效: l = m t( 2 - 2 9 ) 同时可以看到:不管 m = ( p p 。) 。或p p = m ,最后都只有如上定义的8 神情况。 推论i : 如果目标a 和它的仿射变换a 的轮廓x 。和x 。的初始采样点相同, 且同采n 个坐标数据,并已经通过i c a 提取了它们的有效表示匕和l ,那么改 变这两个矢量的元次序和符号的矩阵m 能被找到,从而可以从m 估计得到仿 射不变描述 证明: 如果从目标轮廓和它的仿射变换轮廓上同采样n 个点,通过i c a 提取 了它们的有效表示艺和匕也是n 个点的坐标数据,从式( 2 一卜l o ) 可 得:e k 匕7 ) = e k 7 j :,利用式( 2 2 8 ) ,重新构造m 为: m ( - - e k y , 1 7 ( 彰彰7 ) 一一j :e k 7 ( 2 - 2 1 0 ) 从式( 2 2 8 ) 知匕和m r 是相等的。得到m 可得仿射不变描述子。证毕。 推论2 :如果x 。和x 。是两个随机矢量,分别表示原始轮廓和经过仿射扭曲后 的轮廓,它们的初始采样点不同,那么可以通过环移找到交换矩阵m ,同样可估 计出仿射不变描述。 证明:设x 。和x 。的初始采样点偏移为岛,分别表示为x 。( f ) 和x o t o ) 。从 上面的分析可知,可以找到它们的有效表示,分别为:y o ( t ) = 筏( f ) 及 叫( t - - t o ) = j 髋p - - t o ) 。根据方程( 2 2 8 ) ,可以找到用来确定偏移f 。的代价函数, 如下表示: j r = t r ( e g ( t r ) 】【o 一乇) r j ) = t r ( m r r :( r f o ) ) ( 2 2 一1 1 ) 其中,匕( t f ) 表示l ( f ) 按逆采样方向环移t ,从方程( 2 2 1 1 ) 可知。当 ( f t 。) = 0 时,j ,取到最大值,因此,偏移f 。可以通过下式得到: t o = a r g ( m a x d ,)( 2 - 2 一1 2 ) f 利用推论l ,可得至i 】: 第二章独立元分析在仿剐参数估计和目标识别卜的应用 m = f e ( f ) ( f t o ) 7 ( 2 2 一i 3 ) 通过式( 2 - 2 8 ) 同样可估计出仿射不变描述。证毕。 推论3 :对于原始目标和仿射后目标的轮廓采样数据x 。和x :,如果通过i c a 找到了它们的有效表示l 和匕。,那么它们间的仿射参数z 和b 可以被估计得 到 证明: 从方程( 2 一卜1 1 ) 和( 2 2 1 ) 可以得到:l = w a s 。,l 。= w z a s 。,代入方 程( 2 2 8 ) 或( 2 2 9 ) ,得到相应的仿射参数矩阵z : z = 1 膨- 1 或z = r7 m ( 2 2 一1 4 ) 设m 。和肌。分别是x 。和x 。的均值,利用式( 2 2 一1 ) 和( 2 - 2 2 ) ,我们有: ( x 。( f ) + m ,_ ) = z ( x 。( ,) + 。) + 嚣v t = 1 , 2 ,n 那么平移矢量曰为: b = 似。z m 。) ( 2 2 一1 5 ) 在证明了上述的定理和推论的基础上,下面的二节提出在对仿射目标轮廓 顺序采样的情况下的仿射运动参数估计和仿射目标的识别算法及实验结果。 2 3 基于独立元分析的仿射参数估计算法( 顺序采样) 运动估计是指在图像序列的参考帧中搜索一个与当前帧图像块最相似的图 像块,搜索结果用运动向量来表示本图像块与参考帧之间的运动,一般的搜索 都假设只含有平动的形式。当运动图像序列不仅含有平动而且还含有旋转和伸 缩等仿射运动形式的时候,现有的方法会产生较大的误差。用我们提出的推论 3 ,可以对两帧图像中的目标进行独立元分析,估计出仿射运动的参数。 2 3 1 基本原理 把运动前、后两帧中的目标轮廓分别采样成个点,每一点的坐标组成序 列为扛( f ) ,y ( f ) 和缸。( f ) ,y 。( 啦,t = l 一2 ,n ,仿射运动可表示为: 麟他蚓嘲+ 卧壤卜( 2 - 3 - 1 ) 式中的矢量也可以简化写为矩阵表达式 第二章独立元分析在仿射参数估计和耳标识别上的应用 x ( f ) = z x ( r ) + b( 2 - 3 2 ) 其中z r 2 “表示轮廓的旋转缩放扭曲变换矩阵,b 为平移矢量,b r 2 。 运动估计的目的就是要找到z 和曰。 把两个目标轮廓的坐标序列减去各自的质心坐标可以消除平移参数嚣,然后 ( 2 3 2 ) 式可简化为: x ( f ) = z x ( t )( 2 - 3 3 ) 如果x ( f ) 和x ( f ) 是出自于同一个目标轮廓的仿射变换结果,并且,目标轮 廓的上的采样点的坐标近似为随机矢量( 在实际的目标轮廓提取中,噪声的存 在,这个假设是合理的) ,那么,x ( f ) 和x ( t ) 可以看作都是从同一组独立的序 列s ( f ) = i s ,( f ) s y ( f ) j 7 ,f - 1 , 2 ,n ,经不同混合矩阵接收到的信号,利用二 元一比特匹配理论,对它们分别用上节提到的方法做1 c a ,一定可以求得独立 的元】,( ) 和y ( f ) ,以及和矿,满足: y ( f ) = w x ( t ) il ,( f ) = w x ( f ) ( 2 - 3 - 4 ) 根据利用二元一比特匹配理论和式( 2 2 9 ) ,求出的y p ) 和y ( t ) 2 1 目7 存在次 序的交换和符号的相反的关系,用一个转移矩阵m 来表示他们之间的关系: l ,( f ) = m y ( t )( 2 - 3 5 ) 因两帧中的目标轮廓分别采样成个点,可用矩阵来表示所求出的独立元: - 6 - y = i v ( 1 ) y ( 2 ) 】,( ) 】,y = 【y ( 1 ) y ( 2 ) y ( ) 】,则 y = m y ( 2 - 3 6 ) 在快速i c a 算法里,】,是归一化的,同且j ,满足f 留o ) j ,( f ) 7 = , l ,l ,7 = n i ,从( 2 - 3 6 ) 式我们可以求得: m :三j ,l ,r ( 2 3 7 ) 根据推论3 中的式( 2 2 一1 4 ) ,将( 2 3 7 ) 式代入( 2 2 1 4 ) 式,结合( 2 3 4 ) 可以解出: z = w ”1m w = x y 7 w ( 2 - 3 8 ) 若已知序列x ( t ) 和x ( r ) ,且两者在轮廓上的起始点位置相同,只要对第一 帧的轮廓做i c a 得到y ( f ) 和w ,然后找到一个特征空间v ;去y 7 w ,为求第 川 = 帧与第一帧间的运动参数,只要将第二帧的轮廓坐标数据x 投影到特征空问 第二章独立元分析神仿射参数估计和目标识别上的应用 v 。如果后续帧都是同一目标物体的仿射运动,则都只需将后续帧的目标轮廓 的坐标数据投影到特征空间v ,直接求它与第一帧的仿射运动,这样就避免了 传统运动估计中的误差累计。用i c a 方法估计2 和庙的具体步骤如下: 1 对x 白化处理后做i c a 处理,得到缈和y ,满足y = 似,l t 7 :n i 。 2 计算2 :土x y 7 w , 3 平移参数:雪= s ( x ( f ) 一2 f x ( f ) 。 t a n :x ( f ) 和x ( f ) 的起始点位置不同,那么必须对x ( f ) 也做i c a 处理得到 和l ,( f ) ,如果它们的起始点的位置相差为“,根据( 2 3 4 ) 和( 2 3 3 ) 式, 我们有: x ( f ) = z x ( t f o ) = z w y ( t r o ) , 再根据推论2 ,对矩阵y 做环移r 得到新的t ,根据( 2 - 3 - 6 ) 和( 2 - 3 7 ) 式得 到: 丘= 砖y 誓7 卜砖嬲一。y r 7 l = 专;m 陬卜啪 t 2 3 9 , 其中f = 0 , i ,n i ,一。是y 偏移f 。后的序列,与y 序列起始点位置相同,h 是 求行列式值的运算。肘就是y i ,和y t 之间的转移矩阵,因为对快速i c a 处理,m 满足i m i = 1 ,当f = f 。时,i r ( r f 。) l 取到最大值,所以 b = a r g ( m a x j ,)( 2 3 一l o ) 确定以后,新的特征空间为: 一。2 专y o 饥( 2 - 3 1 1 ) 将x 。投影到新的特征空间就可以得到仿射运动的估计值: z = x 。 ( 2 - 3 1 2 ) 事实上,对于某些简单物体轮廓,譬如圆,做i c a 后得到的y f f ) 中的两元 之间并不完全满足独立条件,但根据文献 4 8 5 4 的理论,在现有x ( t ) 中x 、y 坐标的关系下,找到的r ( t ) 中的元素的独立性比x ( t ) 和其他的可能的元素好, 就可满足我们的要求,因为对于仿射运动估计来说,对x ,y 坐标问的独立性要 求并不像盲信号分离那么严格。下一小节的实验将会证明,用在对圆等简单轮 廓目标的仿射运动估计上,我们的方法仍有很好的性能。 兰三塞垫兰垄坌堡垒望些叁鍪篁:兰塑! 堑堡型! 墼里里 2 3 2 无噪声下仿射参数估计实例 我们取标准图像c l a i r e 序列中一帧,如图2 3 一l 所示,并对该图播音员的 轮廓做了包括旋转、缩放和拉伸的运动。 幽2 - 3 1c l a
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 绿化养护管理标准操作流程
- 建筑机械设备管理与维护技术标准
- 航空地面服务派工流程规范
- 新员工廉洁教育入职培训课件
- 初级计算机课教学内容梳理
- 市政工程沟槽开挖安全技术方案
- 服装行业生产效率提升方案
- 印刷行业质量控制五项制度详解
- 基层法院书记员工作职责及考核标准
- 小鼠心脏灌流实验操作指南
- 茂名出租车资格证模拟考试
- 体能训练课件
- 六年级《牵手两代-第二讲-乖孩子为什么会厌学》家长课程培训
- 林业和草原建设项目初步设计编制实施细则
- 汽油安全技术说明书(MSDS)
- 电动伸缩门施工方案
- 动物诊疗机构管理制度
- 浅谈国企差异化培训模式建立与实践
- 九年级上册语文理解性默写(含答案)
- 加固安全施工技术交底
- 2023年高中音乐课件我为共产主义把青春贡献-选自歌剧《江姐》
评论
0/150
提交评论