(机械设计及理论专业论文)基于感知不变性的目标特征提取技术研究.pdf_第1页
(机械设计及理论专业论文)基于感知不变性的目标特征提取技术研究.pdf_第2页
(机械设计及理论专业论文)基于感知不变性的目标特征提取技术研究.pdf_第3页
(机械设计及理论专业论文)基于感知不变性的目标特征提取技术研究.pdf_第4页
(机械设计及理论专业论文)基于感知不变性的目标特征提取技术研究.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(机械设计及理论专业论文)基于感知不变性的目标特征提取技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于感知不变性的目标特征提取技术研究 刘敬( 机械设计及理论) 指导教师:刘衍聪教授 摘要 目标特征提取技术是模式识别的重要技术之一,提取稳定可靠的特 征,是解决识别问题的关键。特征提取过程中目标图像会受到平移、尺 度、旋转、光照变化等因素的影响,从而降低识别系统的实用性和准确 性。针对以上问题,本文主要研究目标特征提取技术中的光照不变性问 题,同时研究平移、尺度、旋转不变性问题,提取具有感知不变性的特 征量。对基于感知不变性的目标特征提取技术进行理论研究,对h u 不 变矩理论加以改进应用,提取具有平移、尺度、旋转不变性的特征量。 对复杂变化光照条件下如何克服光照的影响及其算法理论进行了归纳论 述,采用局部归一化处理和相对梯度的方法对变化光照条件下的图像进 行处理,并进行实验对比。局部归一化处理方法是利用光照模型来估计 光照影响,把光照影响用乘性噪声和加性噪声来模拟,以此来消除复杂 光照的影响。相对梯度则是将对光照不敏感的梯度进行改进,融入局部 的信息,提取目标图像的内在特性作为光照不变量。采用y a l e b 人脸库 进行特征提取实验,结果表明两种方法对消除光照影响都有较好的作用, 提高了识别率,但局部归一化处理方法要略优于相对梯度方法。基于上 述分析,本文提出一种基于局部归一化及改进h u 不变矩的感知不变性 特征提取算法,采用局部归一化方法对光照变化下的图像进行预处理, 提取改进的h u 不变矩特征,该特征具有平移、尺度、旋转、光照等感 知不变性,识别效果优于直接提取矩特征。 关键词:特征提取,感知不变性,光照变化,归一化,h u 不变矩 s t u d yo nf e a t u r ee x t r a c t i o n t e c h n i q u e b a s e do nt h ep e r c e p t i v ei n v a r i a b i l i t y l i uj i n g ( m e c h a n i c a ld e s i g na n dt h e o r y ) d i r e c t e db yp r o f e s s o rl i u y a n - e o n g a b s t r a c t f e a t u r ee x t r a c t i o ni st h eo n eo ft h ei m p o r t a n tt e c h n i q u e si np a a e m r e c o g n i t i o n h o wt oe x t r a e tt h es t e a d ya n dr e l i a b l ef e a t u r ei st h ek e ys t e pt o a c c o m p l i s ht h er e c o g n i t i o n i m a g e sw i l lb ea f f e c t e db yt h ed i s p l a c e m e n t , s c a l e ,r o t a t i o n , e o m p l i c a t e dv a r y i n g i l l u m i n a t i o n t h i st h e s i s m o s t l y c o n s i d e r st h ei l l u m i n a t i o ni n v a r i a n ti nt h ef e a t u r ee x t r a c t i o nt e c h n i q u e ,a n d g i v e sa t t e n t i o nt ot h ed i s p l a c e m e n t , s c a l e ,r o t a t i o ni n v a r i a b i l i t y o u ra i mi st o e x t r a c tt h ef e a t u r em t l l d i s p l a c e m e n t ,s c a l e ,r o t a t i o n , i l l u m i n a t i o n i n v a r i a b i l i t y t h et h e s i st h e o r e t i c a l l ys t u d i e st h ef e a t u r ee x t r a c t i o nt e c h n i q u e b a s e do nt h ep e r c e p t i v ei n v a r i a n t s a p p l ya n de x p a n dh um o m e mi n v a r i a n t s b yt h ee x p e r i m e n t , t h e ng a i nt h ed i s p l a c e m e m ,s c a i e ,r o t a t i o ni n v a r i a b i l i t y 1 1 1 i st h e s i ss u m su pt h em e t h o d so nh o wt oe l i m i n a t et h ee f f e c t sf r o mt h e c o m p l i c a t e dv a r y i n g i l l u m i n a t i o n am o ( 1 e l b a s e dl o c a ln o r m a l i z a t i o n t e c h n i q u ea n dr e l a t i v eg r a d i e n ta r ea d o r e df o ri l l u m i n a t i o ni n v a r i a n c e 1 1 硷 l na l g o r i t h mw o r k sb yi l l u m i n a t i o nm o d e lt oe s t i m a t et h ee f f e c t s ,a n d s i m u l a t e si l l u m i n a t i o ne f f e c t sw i t ht h em u l t i p l i c a t i v en o i s ea n dt h ea d d i t i v e n o i s e t h er e l a t i v eg r a d i e n ta l g o r i t h mi m p r o v e st h e 可a d i e m ,e x t r a c t st h e i n n e rc h a r a c t e ra st h ei l l u m i n a t i o ni n v a r i a n t a d o p tt h ey a l e bf a c e st od ot h e e x p e r i m e n t ;t h et w oa l g o r i t h m sb o t i lo b t a i nt h eb e t t e rr e s u l t s b u tt h el n a l g o r i t h mi s b e t t e rt h a nr e l a t i v eg r a d i e n t t h et h e s i sp u t sf o r w a r da l l a l g o r i t h m b a s e do nl o c a ln o r m a l i z a t i o nt e c h n i q u ea n d i m p r o v e d h u m o m e n t s w i t i lt h el na l g o r i t h ma n di m p r o v e dh um o m e n t w ec a ne x t r a c t t h ep e r c e p t i v ei n v a r i a b i l i t y , t h er e c o g n i t i o nr e s u l ti sb e r e rt h a nd i r e c t l y e x t r a c t i n gh um o m e n t s e x p e r i m e n t sa l s os h o wt h a to n rm e t h o di se f f e c t i v e a n df a s t k e y w o r d s :f e a t u r ee x t r a c t i o n , p e r c e p t i v ei n v a r i a b i l i t y , i l l u m i n a t i o nv a r i a t i o n , l o c a ln o r m a l i z a t i o n , h um o m e n ti n v a r i a n m 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取 得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论 文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中国 石油大学或其它教育机构的学位或证书而使用过的材料。与我一同工作 的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了 谢意。 签名: 副敏 - , - 7 年月日 关于论文使用授权的说明 本人完全了解中国石油大学有关保留、使用学位论文的规定,即: 学校有权保留送交论文的复印件及电子版,允许论文被查阅和借阅;学 校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手 段保存论文。 ( 保密论文在解密后应遵守此规定) 学生签名: 导师签名: 占月 6 月 h 日 中国t i 油人学( 华东) 硕十论文第1 章绪论 第1 章绪论 1 1 目标特征提取技术发展概述 特征提取是指通过映射( 或变换) 的方法,在低维特征空间里表示 高维空间里的样本n ,以达到降低特征空间维数的目的。目标特征提取 技术是模式识别研究中的重要技术之一,特征提取的发展与模式识别技 术的发展密不可分。 模式识别诞生于2 0 世纪2 0 年代,随着计算机的出现和人工智能的发 展,模式识别在6 0 年代初迅速发展成- 1 7 学科。它所研究的理论和方法 在很多学科和领域中得到广泛的重视,推动了人工智能系统的发展,扩 大了计算机应用的领域【2 】。 模式识别主要包括三个核心的理论与技术:( 1 ) 目标特征提取;( 2 ) 学习训练算法;( 3 ) 分类与识别算法。其中目标特征提取技术是模式识 别关键的技术,它对学习算法的选择与效率、分类识别算法的选取与识 别正确率有着重要的作用,它关系到一个识别系统是否是有效的【3 1 。图 像处理是模式识别的一个重要应用领域,目前广泛应用的人脸识别、文 字识别等就是模式识别在图像处理中的典型应用【4 】。图像处理中的模式 识别系统基本框架如图1 1 所示。 目标特征提取技术作为模式识别中的关键问题,提取的特征应保证 最具有代表性,信息量大,冗余量小,而且要求在一定的干扰下,也能 保持一定的不变性和适应性。找到性能良好又能实时抽取的特征,是解 决识别问题的关键。 中国t 油人学( 华尔) 硕十论文第1 章绪论 图1 - 1 图像处理中的模式识别系统 依照图像特征提取方法的不同原理来划分,一般有以下几类图像特 征: ( 1 ) 几何特征。在基于边缘或轮廓特征的识别与匹配中,一般都是 首先建立一个标准目标图像的边缘或轮廓的模板,然后通过将模板平移 或旋转,以期得到与待识别目标最佳匹配的结果。尽管这种方法建立了 一个准则有效减少了匹配的数目,但仍然是相当繁琐的。还有的通过图 像特征点间的关系建立一个图的模板( g r a p h i c a lt e m p l a t e ) ,通过图之 间的比较进行匹配,但为了减小计算量,这种点之间的关系描述通常是 不完全的【5 1 。几何特征主要有边缘、轮廓、角点特征等。 除了以上几种几何特征,还有基于边缘图像的链码区域边界表示法, 区域面积、区域周长、区域形状参数体态比等特征,它们都从目标图像 的不同侧面反映了部分性状。 ( 2 ) 图像的统计特征。根据提取特征的不同主要细分为以下几类【6 j : 直方图特征。它常用来描述图像灰度值分布的情况,它用第f 级 2 中国t i 油人学( 华东) 硕十论文第1 章绪论 灰度的像素总数n ( i ) 来比上整幅图像的总像素数m 来得到第i 级厌度出 现的概率,即e ( o = n ( i ) m ,( f = o ,1 ,l - 1 ) 。 但通常情况下多使用直方图的某些统计量为特征,则描述更加明确 简洁,如灰度分布对原点的r 阶矩,灰度分布的r 阶中心矩,偏度,峰度, 能量,熵等。 矩特征。将图像看作一二维随机过程,就可用不同的矩特征来描 述和分析图像,标准化的中心矩具有平移、旋转、比例及线性变换不变 性等优良性质,因而适于作描述图像的特征。低阶矩描述的多是能量分 布较大的整体信息,而高阶矩多描述图像中的细节信息,但同时矩特征 也表现出了对噪声干扰的脆弱性。 自相点特征。经过标准化的自相点函数也具有良好的不变性质, 如平移不变性、比例不变性,结构不变性及对称性。 ( 3 ) 变换系数特征。对原图像变换后的变换系数作为特征加以提取, 变换系数包含着图像中重要的信息,当取足够多阶的系数时,几乎可把 图像信息完全提取出来,并且可以通过这些系数完全重建原来的图像。 当在一定的误差许可下,可以只提取少数几个低阶系数作为描述原图像 的特征,因而可以取得很大的信息压缩比,有效压缩了图像中的冗余信 息1 7 1 。主要包括f o u r i e r 变换、h o u g h 变换、h a d a m a r d 变换、梅林变换等。 ( 4 ) 代数特征。任何图像都可以被看作个矩阵,所以各种代数变 换或矩阵分解都可用来提取图像的代数特征。k l 变换是一种基于图像 自相关矩阵特征向量的代数特征提取方法,它最大限度地去除了图像信 息中的相关性,利用矩阵特征向量具有的几何不变性,提取图像的最佳 特征1 8 1 。 中国t i 油人学( 华东) 硕十论文第1 章绪论 ( 5 ) 神经网络提取特征。神经网络实际上是一个集特征提取与模式 识别为一体的方法,它直接将待识别目标与模板作为输入对神经网络进 行训练,网络自动提取特征,使目标和模板的特征分布于整个系统中各 神经元的权值上,所以网络具有很强的联想记忆能力、容错能力和自适 应性,以上特点使人工神经网络具有很强的图形识别能力 9 】。 没有哪一种特征能够全面地描述一个物体,每种特征只能从一个侧 面表达出目标图像的本质特性,当目标的姿态发生变化或者周围环境如 光照条件等发生变化时,有些特征会随之而改变,从而影响识别效果。 感知不变性,是指包括平移、尺度、旋转、光照等在内的所有不变性特 征的统称,它能够比较全面的描述目标图像的本质特性。提取更加稳定、 不随视角和外界环境变化而变化的感知不变性特征是提高系统识别率的 有效途径。 1 2 论文课题背景与研究意义 目前国内外对目标特征提取技术的研究已经取得了很大进展,现有 目标特征提取和识别系统在正常光照下、目标形状姿态理想的情况下取 得了比较令人满意的结果。但当目标图像形状随着观察角度发生变化时, 目标特征的描述遇到了极大困难,这就要求提取的图像特征本身具有不 变性,即无论被识别的图像在视场中作何种平移、旋转、放大或缩小, 都能正确描述目标特性并加以识别。 特征提取的另一个重要问题是光照变化对识别目标会产生强烈的影 响,目标外观会随着光照条件的改变发生剧烈的变化,很多时候这种变 化要远远大于由于目标的不同所引起的差异【。目标对光照变化的敏感 性,严重影响了识别系统的实用性和准确性。 4 中国i i 油人学( 华东) 硕十论文第1 章绪论 基于感知不变性的目标特征提取技术正是针对以上问题而提出的。 感知不变性,是指包括平移、尺度、旋转、光照等在内的所有不变性特 征的统称,它能够比较全面的描述目标图像的本质特性。本课题来源于 山东省东营市科学技术发展计划项目“视频目标特征提取与识别技术研 究”,将针对复杂条件下目标特征提取与识别存在的问题,研究在视角 变化情况下,如何提取具有平移、尺度、旋转等不变性的特征,以及在 外界光照变化情况下提取光照不变性特征的方法。通过对基于感知不变 性的目标特征提取技术的研究,尽可能获得与目标自身特性相关的特征, 从而提高识别系统的有效识别率。 以此为基础的自动视频监视系统,在商业、执法、军事上都有极迫 切的应用要求,有效的目标特征提取,对提高自动监视系统的监控效能 与目标识别效能具有重要的现实意义。本课题对于自动生产线的工件识 别、指纹识别、故障检测等领域的研究也具有重要的理论价值。 1 3 论文研究内容 本论文在目前目标特征提取技术已有成果的基础上,分析特征提取 过程中图像受到光照变化、视角变化等因素的影响,研究基于感知不变 性的目标特征提取技术,旨在提取具有平移、尺度、旋转、光照等不变 性的特征,提高系统识别率。主要研究内容如下: ( 1 ) 通过对目前目标特征提取技术和不变量理论的研究,归纳不变 量特征提取方法,选择软件实现平台。 ( 2 ) 在分析h u 不变矩理论的基础上,对h u 不变矩进行改进,消除 比例因子的影响,提取具有平移、尺度、旋转不变性的改进h u 不变矩特 征,通过实验数据分析其有效性与鲁棒性。 中国t i 油人学( 华东) 硕十论文第1 章绪论 ( 3 ) 深入分析在复杂变化光照条件下如何克服光照的影响提取有效 特征,并对目前的算法理论进行论述比较,选取简单易行的光照处理方 法进行实验研究。 ( 4 ) 采用图像局部归一化处理( l o e m n o r m a l i z a t i o n t e c h n i q u e ,l n ) 方法提取光照不变性特征,并进行识别实验研究,结合实验结果分析局 部归一化算法对光照影响的消除作用以及识别系统的有效性。 ( 5 ) 采用相对梯度( r e l a t i v eg r a d i e n t ) 方法提取图像内部特性作为 光照不变量进行特征提取与识别,结合实验结果分析相对梯度方法的有 效性。 ( 6 ) 对不同光照处理方法进行对比,找出消除光照影响较好的方法, 结合局部归一化处理方法与改进的h u 不变矩技术,提取具有平移、尺度、 旋转、光照等感知不变性的特征,进行对比实验,研究分析基于局部归 一化及改进h u 不变矩的感知不变性特征提取算法的有效性及鲁棒性。 6 中国t i 油大学( 华东) 硕十论文第2 章基丁感知不变性的特征提取技术理论 第2 章基于感知不变性的特征提取技术理论 特征提取过程中目标图像会受到平移、尺度、旋转、复杂变化光照 等因素的影响,导致提取的特征无法准确反映目标本质特性,影响识别 系统的实用性和准确性。针对以上问题,研究基于感知不变性的目标特 征提取技术,提取具有平移、尺度、旋转、光照等不变性的特征量。基 于感知不变性的目标特征提取技术是在特征提取技术与不变量理论的基 础上发展而来的,通过分析目标特征提取技术的一些基本方法和不变量 理论,研究并改进在视角变化时提取平移、尺度、旋转不变性特征的方 法,总结在复杂光照条件下消除光照影响、提取光照不变性特征的方法, 为感知不变性特征提取的具体应用奠定理论基础。 2 1 特征提取方法 特征提取方法主要有主成分分析( p c a ) 、线性判别分析( l d a ) 、 k l 变换、核函数主成分分析( k e r n e lp c a ) 、独立主成分分析( i c a ) 、 自组织映射( s o m ) 等】。 2 1 1 主成分分析 主成分分析( p c a ,p r i n c i p l ec o m p o n e n ta n a l y s i s ) 是目前应用最广 泛的一种特征提取方法,是模式识别判别分析中最常用的一种线性映射 方法,属于一种统计学习方法,在信号处理、模式识别和数字图像处理 等领域已经得到了广泛的应用。在很多目标特征提取方法中,p c a 方法 均被用来对高维样本压缩降维,从而加快处理速度或降低问题复杂度。 主成分分析的基本思捌1 2 1 是提取出空问原始数据中的主要特征,减 中国t i 油人学( 华东) 硕十论文第2 章基丁感知不变性的特征提取技术理论 少数据冗余,使得数据在一个低维特征空间被处理,同时保持原始数据 绝大部分信息,从而解决了数据空间维数过高的瓶颈问题。它根据样本 点在多维模式空间的位置分布,以样本点在空问中变化最大方向,即方 差最大的方向,作为判别矢量来实现数据的特征提取与压缩。从概率统 计观点可知,一个随机变量的方差越大,该随机变量所包含的信息就越 多。所谓主成分就是原始数据的m 个变量经线性组合( 或映射) 后得到 的变量,使变换后的变量方差为最大部分。各个主成分之间是相互线性 无关的( 正交的) ,从第一主成分后,均是按方差大小顺序排列( 即对 应特征值按大小顺序排列) 。对于特征值为z 的主成分( 丑也是该主成分 的方差) 表示样本点在其方向上的离散程度,丑的贡献率r , 可用公式 ( 2 1 ) 表示 ( 2 1 ) 主成分中方差较小或丑较小的主成分被认为包含噪声,在分析时不 把这些变量引入模型,从而使分析的主成分减少,以便达到去除原始图 像的冗余信息、保留有用信息、降低特征空间维数、减少噪声和光照变 化影响的目的。 2 1 2 线性判别分析 在图像特征提取中,从高维空间向低维空问映射不是随意的,要求 样本经过映射后在低维空间中更加易于分类,从而达到识别的目的。线 性判别分析( l d a ,l i n e a rd i s c d m i n a n ta n a l y s i s ) 就是为解决这样的问 题而提出的。l d a 最初是由a f i s h e r 在1 9 3 6 年提出的,又被称为f i s h e r 线性判别。 中国i i 油大学( 华东) 硕十论文第2 章基丁- 感知不变性的特征提取技术理论 线性判别分析的基本思想是定义两个扩散矩阵,类内扩散矩阵和 类问扩散矩阵,l d a 希望得到从高维样本空间到低维特征空问的变换矩 阵能够满足在降低维数的同时,使得类内扩散矩阵尽量小,类间扩散矩 阵尽量大。这样,经过变换后,同一类别内的训练样本特征点将离得更 近,不同类别之间的训练样本特征点距离更远,即在降低维数的同时, 提高了对模式进行分类的能力。 假设训练样本集合为x = l ,其中肌= l ,2 ,- - c ,表示类别标号 信息,c 是训练样本集合的类别总数;以= 1 ,2 ,虬,表示每个类别里 训练样本的数目,。表示第历类里i ) l i 练样本的数目;每一个样本k 都 是图像经过展开后得到的向量。假设其长度为n ,即l r ”。这样, 目标图像训练样本集合总的训练样本数= :二。i ,整个目标图像训练 集的平均图像= :。2 乃,第i 类中图像样本的平均图像为 h = :,类间扩散矩阵和类内扩散矩阵分别定义为 s b = :。j 一) ( h 一) 7 和品= :。2 ( 一h ) ( 一h ) 。 l d a 的目标是在保证类间扩散矩阵尽量大的同时,要求类内扩 散矩阵品尽量小。可以通过很多途径达到这一目的,最常见的一种就是 通过使样本映射到类间扩散矩阵和类内扩散矩阵的行列式比率最大时, 所得到的变换矩阵,前提是要求品不是奇异矩阵,此时变换矩阵可以定 义为 9 中国石油大学( 华东) 硕十论文第2 章基丁感知不变性的特征提取技术理论 = 吨m a x 厩r s 厕, w i w wl 6 l 满足上述条件的矩阵是由如下方程的特征向量构成 ( 2 2 ) s b w = 2 s w w ( 2 - 3 ) 将方程( 2 - 3 ) 得到的特征值按从大到小的顺序排序,假设 i f - 1 ,2 ,m 是方程( 2 - 3 ) 最大的m 个特征值对应的特征向量,那 么式( 2 2 ) 中的变换矩阵可以表示为 = 【w 1 ,w 2 ,】( 2 - 4 ) 得到线性变换矩阵阡,删后,对于任意一个新的输入目标图像样本墨。, 其l d a 线性判别方程为 d l x 。t ) = w 0 0 x t 。 ( 2 一s ) 通过( 2 5 ) 式将输入的样本从高维目标图像空间映射到较低维的线性判 别空间,降维的同时,使同一类别的样本特征点更紧密的聚在一起。 对于目标识别来说,上述计算方法获得的可以将数据从原始空 间转化到特征空间,同时实现维数降低的目的,该转化对光照等因素不 太敏感,极大地提高了系统的识别性能。 2 1 3 k l 变换 在模式识别领域,k l 变换被公认为特征抽取的最有效的方法之 一,k l 展开应用于特征提取,形成了子空间法模式识别的基础。利用 矩阵k l 变换抽取特征,具有稳定性、转置不变性、平移不变性和镜像 变换不变性。结合k l 变换的图像j 下交基的算法用于人脸识别,取得了 0 中国彳i 油火学( 华东) 硕十论文第2 章基r 感知不变性的特征提取技术理论 较好的识别效果。 k l 算法的基本思想是1 1 4 假设数据库里有m 幅人脸图像 r i ,f 2 , - - , f 。,其灰度平均值为y ,将每一幅图像与之相减后构成一组大 矢量a = 【中,中:,巾 ,】,其中= f 一,它用于进行主分量分析,找 出m 个正交矢量瓦及本征值五最好地描述数据分布规律,瓦及以是协 方差矩阵c 的本征矢量和本征值: c = 击静卟t 朋7 c z 石, k - - l 变换以校准后的标准图像作为训练样本集,产生矩阵,即 = 圭圭t = l ( ,一h ) u 一一) 7 = 圭 圭i = l , 一竹杉( z - ,) -ll j 其中,为第,个训练样本集的图像向量,用行堆叠形成,设f ( x ,y ) 大小为m n ,则 | j = 一b ,1 i l l m 。 其中 = ,( - ,o ) ,( - ,1 ) ,( ,n 一1 ) 式中z 为图像样本集第,个样本,为第j 帧第j 行元素形成的列 向量。竹= ,为训练样本集的平均图向量,三为训练样本的总数。 df j l 求出的特征值丑及相应的正交归一特征向量q ( f - o ,1 ,2 ,三一1 ) a 若 把转置的因素考虑在内,则变换阵的行既是的特征向量。该矩阵为: 中国i i 油人学( 华东) 硕十论文第2 章基丁感知不变性的特征提取技术理论 u = 吒【e z 2 q e 2 1 e 2 1 e 2 , m n e xe m n ,2 e ,m n 这就是图像的特征矢量。 将特征值从大到小排序: 五2 2 4 其对应的特征向量为乞, 则每一幅人脸图像都可以投影到由e o ,q ,e l 一。张成的子空间,因此每一 幅人脸图像对应于子空间中的一个点。同样,子空间中的任意一点也对 应了一幅图像。由于这些图像很象人脸,所以被称为“特征脸”【坫】。通 过k l 变换进行人脸识别的方法被称为“特征脸”方法。任何一幅人脸 图像都可以表示为这组“特征脸”的线性组合,其加权系数既是k l 变 换的展开系数,也可称为该图像的代数特征。对待识别的样本,可通 过向“特征脸”子空间投影求出其系数向量 f = u ( f 一所) ( 2 - 8 ) k l 变换矩阵u 是按特征值五大小排列的相应特征向量e 组成的变 换核矩阵。由于能量集中于特征值a 大的系数中,因此丢掉对应于特征 值五的较小的f 系数不会影响图像质量。取五最大的前k 个特征向量组 成变换核矩阵,记做,仍用上式,则 f = u ( 厂一,) ( 2 9 ) 这相当于原f 的k 维投影,记做f 。在反变换重建图像i 厂时,可采用补 零方法,仍补成m x n 维向量e , 中国i i 油人学( 华东) 硕+ 论文第2 章基丁i 感知不变性的特征提取技术理论 e = 旧 这显然会带来误差。所重建的图像向量只能叫做原厂的估值f 。由 f = u r y + i t l ( 2 1 1 ) 辫 若其小于阈值,则可判断不是人脸图像。 在以上的k l 算法中,若图像的尺寸是n x n ,则需要求的是 n 2 x n 2 维矩阵的特征值和正交归一的特征矢量,直接计算几乎是不可能 的。同时,人脸识别是一类典型的小样本问题,该问题的特点是: ( 1 ) 图像矢量的维数较高;( 2 ) 训练样本较少。这就导致了k l 矩阵的产 生矩阵常常是高阶的,奇异的。 k l 特征提取算法尽可能多地保留了识别信息,是一种有应用价值 的方法。但是,当图像矩阵维数较高时,这种方法计算量猛增,计算复 杂度太大。 中国t i 油人学( 华东) 硕十论文第2 章基丁感知不变性的特征提取技术理论 2 2 不变量理论 最早的不变量概念是在十九世纪初c a y l e y 、s a l m o n 、c l e b s h 等人提 出来的代数不变量【1 8 】。1 9 9 1 年欧美学者在冰岛正式成立研讨会,提出了 视觉不变量理论,也称为几何结构不变量理论。 视觉不变量理论认为不变量是几何结构的本质描述。所谓视觉不变 量,就是目标几何结构在某些变换群下保持不变的函数形式。视觉不 变量理论的优点和应用在于它既不介意目标平移、缩放等所造成的形状 相似变化,也不介意目标滚动造成的投影形态变化。同时它可以冗余地 表示目标全局结构特征,当发生部分遮挡时,往往可以从剩余部分测出 表示全局的结构不变信息2 0 1 。 2 2 1 不变量特征 在提取目标特征时,目标特征应尽量的反映目标重要的、本原的特 征。所谓重要特征是指以它们作为分量的特征点在特征空间中同类聚集、 异类分散,当使用距离测度时,同类的特征点距离较小、不同类的特征 点距离较大。所谓本原特征是指特征绝对性尽量的强,最大限度的不依 赖于提取目标特征时的条件和环境,具体的讲,不随获取目标图像的视 点不同而变化,同时应尽量的减少设备、光照等物理因素对所提取的特 征的影响【2 ”。可以通过图像处理的方法实现上述某些目的,也可以构造 有关的不变量( 如对比度变化不变量等) 。 无论目标作何种运动时都不变化的目标图像特性或特征量称为不变 性或不变量【2 2 】。正是这样的不变性和不变量才反映了在视觉信息上同一 目标或同一类目标的不变特性,反映了不同模式之问的本质差别,因为 它们与目标所处的3 d 空间的位置、姿态及环境无关,人们根据它们容 中国t i 油大学( 华东) 硕十论文第2 章基丁j 感知不变性的特征提取技术理论 易做出正确的分类识别决策。 2 2 2 简单不变量 ( 1 ) 简单的平移、旋转和对比度不变量i j 6 l 正交变换具有保范性、保角性,即两点间距离不变、两直线间的夹 角不变,因此在正交变换中图形的形状和大小不变。在相似变换中,共 线点的象为共线点,共线三点的单比不变,两直线的夹角不变,图形形 状不变。在仿射变换中,两平行线段的长度之比或一条直线上两线段长 度之比是不变的,两个闭合图形面积之比不变。 记工= y ) 7 ,q = ( q ,屈) 7 。图像,( x ,y ) z 厂( x ) 的一阶、二阶及七阶 相关函数定义为: 蜀= i 厂( z ) 出 ( 2 1 3 ) 9 2 ( 口) = f f ( x ) f ( x + a ) d x ( 2 - 1 4 ) g k ( a l ,a k 一) = 陟( x ) 厂o + q ) ,o + 吼一。) d x ( 2 - 1 5 ) 由于积分是在x 的全域中进行的,所以它们是平移不变量。 图像f ( x ,y ) 的傅里叶变换定义为: ,( ) = m ,y ) p 印咖训a x a y ( 2 1 6 ) 其中l f ( u ,v ) l 是平移不变量。 对于二维旋转变换,极坐标表示的图像f ( r ,0 ) 的一维圆周傅垦叶变 换 钆= r 。,( ,回,( ,0 + a t ) d o , k 为整数( 2 - 1 7 ) 的模是不变量。 中m 4 i 油人学( 华东) 硕十论文第2 章基丁感知不变性的特征提取技术理论 图像f ( r ,口) 的二阶角相关函数定义为 9 2 ( a ,r ) = r 4 厂( r ,口) 厂( ,o + a ) d o ( 2 1 8 ) 仿i i 也可定义更高阶的角相关函数。g :,) 的圆周傅里叶变换等于 吃( ,) 模的平方【2 3 】。 图像f ( x ,y ) 的对比度改变可以表示为 ( z ,y ) = c f ( 工,力 ( 2 1 9 ) 因为,( x ,y ) 的矩所二和,( 工,y ) 的矩肌。有关系 脚二= c m p q ( 2 2 0 ) 所以珑。m o o 是对比度变化的不变量。 类似的f ( 工,y ) 的k 阶相关函数磊( q ,噍一,) 和f ( x ,y ) 的k 阶相关 数g k ( a l ,q 1 ) 有关系 g k ( a , ,吒一1 ) = c k g k ( a l , , 吼一j ) ( 2 2 1 ) 因此g ( q ,吼一1 ) g ? 是相对于对比度变化的不变量。 ( 2 ) 代数不变量 代数不变量是同一平面内的点、直线、二次曲线等代数对象集合的 不变量,能反映整个代数对象的整体特性,因此称代数不变量为全局不 变量。 一个二元p 阶齐次多项式定义为 6 中国i i 油人学( 华东) 硕十论文第2 章基丁感知不变性的特征提取技术理论 c x ,y ,= ,。x p + ( : 口,x ,- j ,+ : 口,一:,:j p 一2 j ,2 + + 口o ,y 9 ( 2 2 2 ) 式中( :) = 志。 如果式( 2 2 2 ) 系数的函数,( 口,舻,a o ,) 和它的线性坐标变换所产 生的新的齐次式的系数的函数,( 口j p ,口j ,) 有 ,( 口0 ,瓦p ) = r l ( a v o , - , a o p ) ( 2 - 2 3 ) 则称比) 为代数不变量【州。a 。是和变换有关的量,如前所述,珊= o 时 称为绝对不变量,0 时称为相对不变量。 在线性变换下,齐次性是不变的,阶数也是不变的。二元p 阶齐次 式有p + 1 个系数,因此将有p + 1 个线性方程表示新老系数的关系,而一 个线性变换需要4 个参数定义它。所以料定有p 一3 个方程是相关的,这 样可以允许找出p - 3 个绝对不变量( , 3 ) 。因此二元p 阶齐次式将有 p 一3 个独立的绝对不变量,有p - 2 个独立的相对不变量和有限个既约不 变量【2 5 1 。 除了一个二元齐次式有不变量之外,两个二元齐次式组成的系统也 存在不变量,这时不变量是这两个二元式的系数的多项式。最简单的例 子是,= a x + b y ,l = 血+ 砂,它们的不变量是d b - b a = a ( a b m ) 齐次式的不变量除了可以用它的系数表示外,也可以用它的p 个根 中国t 蚋人学( 华东) 硕十论文第2 章基丁:感知不变性的特征提取技术理论 的函数表示,这种表示法直接关系到构造投影不变量【2 6 1 。若令p 阶齐次 式的根是,i = 1 ,2 ,p ,那么正( 工,y ) 可以表示为 l ( x ,y ) = a t , o ( x 一,i y ) ( x t z y ) 。( 工一t r y ) ( 2 - 2 4 ) 文献【2 9 】给出定理:二元p 阶齐次式的阶为p 、权为w 的任一不变量 等于它的根之差与常数之积的和再乘以口即,在每一个积中,每个根只出 现p 次,积的和是这些根的w 阶齐次对称函数,不变量是有理整数。 四阶齐次式的最简单的两个不变量 s = 西 “一t 2 ) 2 ( t j f 4 ) 2 + “一t 3 ) 2 ( t 2 - t 4 ) 2 + ( 一) 2 ( t 2 一) 2 ( 2 - 2 5 ) m = 罐【( 一f 2 ) ( 一f 3 ) ( 一f 。) ( f 2 一岛) ( f 2 - - 4 ) ( t 3 一r 4 ) 】( 2 2 6 ) 由它们可构造投影不变量m 。 如果定义t = x y ,令 g p ( ,) = l ( x ,y ) y 9 = a p o o 一) ( f t 2 ) - - - o 一) 那么l ( x ,y ) 的根和f a x ,y ) y 9 的根相同。 三元p 阶齐次式可表示为 c x ,y ,z ,= 巳n 。z p + 口o ,。j ,9 + 且,z p + + ( : : a ,一。,。+ ,z p 一y z ,+ ( 2 2 7 ) 它有三p ( p + 3 ) + 1 个系数。3 d 空间中的线性变换有9 个参数,所以 中国i i 油人学( 华东) 硕十论文第2 章基丁i 感知不变性的特征提取技术理论 三阶式有1 个绝对不变量,四阶式有6 个绝对不变量。 对于三元齐次式丘( x ,y ,z ) ,定义x = x z ,y = y z ,可得 g p ( x ,y ) = l ( x ,y ,z ) z 9 = a p , o , o x 9 + a o o y 9 + o ,p z 9 + 。 g p ( x ,y ) 是关于j ,y 的p 次多项式,它的根定义了p 次多项式平面曲 线。 在平面投影下,多项式平面曲线仍为同次的多项式平面曲线。为了 得到由多项式系数构造的不变量,需要比齐次线性变换自由度8 更多的系 数。因此5 条直线提供2 个独立的不变量,两个二阶齐次式也提供2 个独立 的不变量 3 0 l 。 2 2 3 h u 矩不变量 m k h u 于1 9 6 1 年首先提出了基于直角坐标系的规则矩的概念【3 ”。 之后,运用规则矩的非线性组合,得到一套具有尺度不变性、平移不变 性和旋转不变性的矩不变量3 2 】。二维矩的这三种不变性使之具有良好的 识别功能,因而己成功地应用于模式识别的许多方面,譬如船只识别、 飞机识别等等。 ( 1 ) 规则矩 规则矩是指对于定义在直角坐标平面上的二维实函数f ( x ,y ) ,它的 ( p + 9 ) 阶规则矩定义为口3 1 : m 。;x p y 9 似,y ) d x d y ,p , q = o 12 ( 2 - 2 8 ) 二维( n x m ) 的数字化图像g ( i ,j ) 的二维矩的定义为: 1 9 中国丁i 油人学( 华东) 硕十论文第2 章基丁- 感知不变性的特征提取技术理论 村一l 一1 s f 9 ,4 9 ( i ,) ( 2 2 9 ) 阶次为n 的规则矩的完备集包括所有满足p + g n 的条件历。,因而共有 圭+ 1 ) ( n + 2 ) 个元素,单项式乘积x v y q 是这种矩定义的基底函数。 h u 的唯一性定理( u i l i q u e n e s st h e o r e m ) i 3 4 】可表述为如果厂( x ,) ,) 是分 段连续的,并且只在( x ,y ) 平面的有限区域内具有非零值,那么所有阶的 矩都存在。由f ( x ,_ y ) 可唯一确定矩集( 厅 ,反之,由矩集 历。 可唯一 确定f ( x ,y ) 。一幅图像具有有限的面积,并且在最坏的情况下也是分段 连续的,即所有阶的规则矩都存在,所求得的矩集可唯一描述该幅图像 所包含的信息。要将一幅图中的信息全部表征出来需要无限多的矩集, 对于实际应用来讲,需要选取矩集的一个子集,只要这个子集对于某个 特定应用包含表征该图像的足够信息就可以了。用无穷矩集 聊。,p + q = 0 , 1 , 表示厂( x ,y ) 的公式如下: m 川= e e ) 【p 卜伽c 纵圳m 薹弘写筹】掀 ( 2 3 0 ) 矩之所以能用来描述一幅图像,正是因为这种一一对应的特性。如 果设f ( x ,y ) 为目标区域d 中的灰度分布,为描述目标,将区域d 以外的 区域的灰度分布视为0 ,于是目标的区域原点矩和区域中心矩就分别变 聊。= f f x 9 y 4 厂( x ,y ) d x d y ,p , q = 0 ,1 州2 ( 2 3 1 ) d 中国t i 油大学( 华东) 硕十论文第2 章基丁感知不变性的特征提取技术理论 = f ( x - x ) 9 ( y 一歹) 9 m ,y ) d x d y ,p , q = o 12 ( 2 3 2 ) d 对于数字图像,( f ,) ,其( p + g ) 阶原点矩和中心矩分别定义为: = f 9 ,4 f ( i ,m p ,q = o ,1 ,2 , j , = ( f i ) 9 ( j - j ) 9 f ( i ,mp ,q = o ,1 2 o , 式中( ,了) 为,( f ,) 的质心: i :盟,了:m o l , ( 2 3 3 ) ( 2 3 4 ) ( 2 3 5 ) ( 2 ) 矩的变抉 图像经过基本的几何变换后,其矩表示也有相应的变化。这些变换 在矩域中比在原始像素域中更容易实现田1 。 尺度变换将图像f ( x ,) ,) 在x 轴方向上伸缩口倍,在y 轴方向上 伸缩p 倍,可得到新图( z ,y ) ,由下式定义:,i x ,y ) = f ( x a ,y p ) , 变换后的矩集 喊)f ( x ,y ) 的原始矩集 聊。 表示如下: 脚二= 口i + p f l i + q m 舟,当口时 所二= 口2 + 9 ”m 月, 当口= 时 ( 2 - 3 6 ) 平移变换将图像f ( x ,y ) 在x 轴方向上平移口,在y 轴方向上平 移,可得到新图,u ,y ) ,由下式定义:厂( 工,y ) = f

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论