




已阅读5页,还剩40页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 特征提取对高维数数据的分类具有重要的研究意义,应用非常广泛。特征提取的目 的是提取一组特征,使得这些特征的维数比原始数据的维数低,且保持数据的类别特性。 用提取的特征代替原始数据进行各种处理,能使与特征数量有关的分类过程的计算量减 少,同时因为去除了数据的相关特性,从而提高分类效率。本文主要包括以下几个方面 的内容: ( 1 ) 融合小波和自适应类增广p c a 的人脸识别。 该方法首先用离散小波变换对人脸图像进行压缩,提取人脸的低频分量,然后再利 用自适应的类增广p c a 方法对小波变换后的人脸低频分量进行特征提取,从而达到进 一步降维的目的。不同于类增广p c a ,该方法不需要构建样本的类间信息,使用起来更 加灵活,又由于小波变换对图像的预处理,算法的识别率和耗时也得到了进一步的优化。 ( 2 ) 融合2 d p c a 和模糊2 d l d a 的人脸识别。 该方法首先对人脸图像进行2 d p c a 处理,再用模糊k 近邻算法计算图像的隶属度 矩阵,并将其融入到2 d l d a 过程中,从而得到模糊类间散射矩阵和模糊类内散射矩阵。 与( 2 d ) 2 p c a l d a 相比,该算法充分利用t ( 2 d ) 2 p c a l d a 的优点,有效地提取了行和列 的识别信息,并充分考虑了样本的分布信息。 ( 3 ) 二维类增广p c a 首先用2 d p c a 直接对人脸图像矩阵提取特征,其次对提取的特征进行归一化处理, 然后将归一化处理后的特征与类别信息结合成为类增广数据,最后对类增广数据进行 2 d p c a 处理,提取最终的特征。该算法既保留了人脸图像的结构信息,又考虑了样本 的类别信息,使得识别率有了大大地提高。 关键词:人脸识别;特征提取;小波变换;类增广p c a ;模糊集理论 a b s t r a c t a b s t r a c t f e a t u r ee x t r a c t i o ni sa ni m p o r t a n ti s s u e i n t h ec l a s s i f i c a t i o no fd a t aw i t hal a r g e d i m e n s i o n n ep u r p o s eo ff e a t u r ee x t r a c t i o ni st og e n e r a t eas e to ff e a t u r e st h a th a v ea s m a l l e rd i m e n s i o nt h a nt h ed i m e n s i o no ft h eo r i g i n a ld a t a , w h i l er e t a i n i n gt h ed a t a c h a r a c t e r i s t i c ss u 衔c i e n tt oc l a s s i f yt h ed a t a t h e s ee x t r a c t e df e a t u r e s c a l lr e d u c et h e c o m p u t a t i o nf o rc l a s s i f i c a t i o nw h i c hi s r e l a t e dt ot h en u m b e ro ff e a t u r e s ,a n di m p r o v e c l a s s i f i c a t i o np e r f o r m a n c eb yr e m o v i n gi r r e l e v a n tc h a r a c t e r i s t i c si nad a t a s e t t h em a j o r c o n t e n to ft h i sp a p e ri sa sf o l l o w s : ( 1 ) f a c er e c o g n i t i o nu s i n gw a v e l e tt r a n s f o r ma n da d a p t i v ec l a s s a u g m e n t e dp c a f i r s to fa 1 1 h u m a nf a c ei m a g e sa r ec o m p r e s s e du s i n gd i s c r e t ew a v e l e tt r a n s f o r m t h e n t h ef e a t u r e so fl o w f r e q u e n c yc o m p o n e n ta g ee x t r a c t e db yt h ea d a p t i v ec l a s s - a u g m e n t e dp c a d i f f e r e n tf r o mt r a d i t i o n a lc l a s s - a u g m e n t e dp c a ,t h em e t h o dd o e sn o tr e q u i r ec o n s t r u c t i n gt h e b e t w e e n c l a s si n f o r m a t i o n ,s oi tw i l lb eu s e dm o r ef l e x i b l e b e s i d e s ,b e c a u s eo ft h ew a v e l e t t r a n s f o r m ,t h er e c o g n i t i o nr a t ea n dt i m e - c o n s u m i n ga r eb o t hi m p r o v e d e x p e r i m e n t ss h o wt h e e f f e c t i v e n e s so ft h ea l g o r i t h m ( 2 ) f a c er e c o g n i t i o na l g o r i t h mf u s i n g2 d p c aa n d 岫2 d u ) a i nt h eb e g i n n i n g , 2 d p c ai su s e dt oe x t r a c tt h eo p t i m a lp r o j e c t i v ev e c t o r sf r o mf a c e i m a g e t h e n , t h em e m b e r s h i pd e g r e em a t r i xi sc a l c u l a t e db yf u z z yk - n e a r e s tn e i g h b o r a n d m e r g e di n t ot h ep r o c e s so f2 d l d a f i n a l l y , f u z z yb e t w e e n - c l a s ss c a t t e rm a t r i xa n df u z z y w i t h i n - c l a s ss c a t t e rm a t r i xc a nb eo b t a i n e d c o m p a r e dw i t h ( 2 d ) 上p c a l d a ,t h em e t h o d m a k e sf u l lu s eo ft h ea d v a n t a g e so f ( 2 d ) z p c a l d a i tn o to n l ye f f e c t i v e l ye x t r a c t st h er o w a n dc o l u m nr e c o g n i t i o ni n f o r m a t i o n , b u ta l s om a k e sf i l l lu s eo ft h ed i s t r i b u t i o ni n f o r m a t i o no f s a m p l e s e x p e r i m e n t ss h o wt h a tt h em e t h o d c a l la c h i e v eb e r e rr e c o g n i t i o ne f f e c t ( 3 ) t w o d i m e n s i o nc l a s s - a u g m e n t e dp c a f i r s t l y , f a c ef e a t u r e sa g e0 b m i n e db y2 d p c a a n dn o r m a l i z et h e m t h e nc o m b i n et h e s e n o r m a l i z e df e a t u r e sw i t ht h ec l a s si n f o r m 撕o n f i n a l l y , p r o c e s st h ea b o v ec o m b i n e dd a t aw i t h 2 d p c a a g a i nt og a i nt h eg o a lf e a t u r e 1 1 1 em e t h o dc o n s i d e r sn o to n l yt h es t r u c t u r eo f h u m a n f a c e s ,b u ta l s ot h ec l a s si n f o r m a t i o no f t h et r a i n i n gd a t a , a n di ti m p r o v e st h er e c o g n i t i o nr a t a k e y w o r d s :f a c er e c o g n i t i o n ;f e a t u r ee x t r a c t i o n ;w a v e l e tt r a n s f o r m ;c l a s s - a u g m e n t e d p r i n c i p a lc o m p o n e n ta n a l y s i s ;f u z z ys e tt h e o r y 目录 目录 摘要i a b s t r a c t i i 第一章绪论1 1 1 课题的背景及其意义1 1 2 课题研究现状2 1 3 本文的研究内容及结构安排3 1 3 1 研究内容3 1 3 2 结构安排3 1 4 本章小结4 第二章常用的特征提取方法5 2 1 主成分分析5 2 2 线性判别分析6 2 3 最大间距准则6 2 4 二维主成分分析7 2 5 二维线性判别分析8 2 6 双向主成分分析9 2 7 本章小结9 第三章融合小波和自适应类增广p c a 的人脸识别1 0 3 1 小波变换简介1 0 3 1 1 小波及小波变换定义1 0 3 1 2 二维小波变换与逆变换l o 3 1 3 人脸图像小波分解1 1 3 2 类增广p c a 1 2 3 3 自适应类增广p c a 1 3 3 4 融合小波变换和自适应类增广p c a 1 5 3 5 实验结果与分析1 6 3 5 1 识别性能分析1 7 3 5 2 时间和综合性能分析1 9 3 6 本章小结2 0 第四章融合2 d p c a 和模糊2 d l d a 的人脸识别2 1 4 1 模糊图像识别2 1 4 2 模糊f i s h e r f a c e 2 2 4 3 模糊2 d l d a 2 3 4 4 模糊( 2 d ) 2 p c a l d a 算法2 3 4 5 实验结果与分析2 4 目录 4 5 1y a l e 库上的试验结果2 4 4 5 2f e r e t 库上的试验结果2 5 4 5 3 参数p 的分析2 7 4 6 本章小结2 9 第五章二维类增广p c a 3 0 5 1 二维类增广p c a 3 0 5 1 1 用2 d p c a 进行预处理3 0 5 1 2 对特征矩阵归一化3 0 5 1 3 根据类信息获得类增广数据3 1 5 1 4 对类增广数据进行2 d p c a 处理3 l 5 2 实验结果与分析3 l 5 2 1y a l e 库实验结果分析3 1 5 2 2f e r e t 库实验结果分析3 2 5 3 本章小结3 3 第六章总结与展望3 4 6 1 本文总结3 4 6 2 展望3 4 致谢3 6 参考文献3 7 附录:作者在攻读硕士学位期间发表的论文4 0 第一章绪论 第一章绪论 1 1 课题的背景及其意义 人类社会的发展进入2 1 世纪的今天,安全问题已成为人们的日常生活困扰的一个 重要问题。人们的日常生活如银行取款、网上购物等都涉及到安全问题,以前这些行为 基本上都是通过符号密码来进行安全保护的,但是随着社会生活质量和各项服务设施的 发展,符号密码的弊端越来越明显,且其安全性得到越来越多人的质疑。于是,人们不 断研究新的身份识别技术以满足越来越多且越来越高的安全性需求。而近年来,人类生 物特征因其特征唯一、安全可靠、不易剽窃和不易伪造等优点被广泛地应用于身份识别。 当前的生物特征识别技术主要包括:指纹识别、视网膜识别、虹膜识别、语音识别、d n a 识别、人脸识别等。而在所有的生物特征识别中,人脸识别由于具有直接、友好、方便 的特点,使用者无任何心理障碍,易于为用户所接受,从而得到了广泛的研究与应用。 人脸识别有着广泛的应用领域,如公安刑侦破案、证件验证、视频监控、入口控制、 表情分析等。此外,人脸识别研究还具有重要的理论研究价值。由于人脸结构的复杂性、 人脸表情的多样性以及人脸成像过程的多变性等原因,使得人脸识别研究成为一项极具 挑战性的课题,它涉及到模式识别、图像处理、计算机视觉、生理学、心理学以及认知 科学等诸多技术领域,因此对人脸识别的深入研究能够推动这些基础研究的发展。 目前,针对人脸识别算法的研究正处于一个“百花齐放,百家争鸣 的阶段,有关 人脸识别的产品也相继在市场上出现。而所有人脸识别系统中,必然存在特征提取这一 个环节。如果直接对输入的人脸图像进行分类,因人脸图像的维数过高会出现计算量过 大问题,且图像本身存在的很多噪声会对识别效率造成很大的影响,所以在对人脸图像 进行分类前,需对其进行降维。降维的方式通常是将这些维数很高的数据转换成一些维 数很低的特征( 也叫做特征向量) ,这个将数据从高维转换成低维的过程就叫做特征提 取。如果高维数据的特征能够被很好地提取出来,则被提取的特征就能够满足各种任务 的需求。 鉴于上述目的,很多人都致力于特征提取的研究,到现如今已经提出了很多种有效 的特征提取方法,这些方法在处理数据的形式上,从最初的先将二维人脸图像矩阵转换 成一维人脸图像向量后进行数据降维,转变成直接对二维人脸图像矩阵进行处理;在方 法性质上,从最初的线性的到后来的非线性的;在样本的训练模式上,也由最初的“批 处理 模式,逐渐向“逐个添加模式发展。虽然目前已经提出了很多特征提取方法, 但这些方法都是针对某个问题提出的,如表情、光照、性别等问题,没有一种方法能同 时适应所有的问题,这就使得这些方法的实用性不是很强。因此,有必要提出一种能够 解决多种问题的特征提取方法。 我国正处于经济结构转型的重要时期,许多企业也正尝试由劳动密集型到技术密集 型的转变。这就给许多工程领域( 如智能交通系统i t s ,人脸识别系统等) 注入了行业 发展的动力,这些系统的发展与特征提取方法的发展是紧密联系在一起的,所以加强对 江南大学硕士学位论文 特征提取方法的研究很有现实意义。 1 2 课题研究现状 现有的特征提取方法可分为无监督式的特征提取和有监督式的特征提取。无监督式 的特征提取方法以p c a 1 】方法为代表,p c a 是采用方差最大化准则将人脸图像投影到特 征空间的一种方法,其求得的投影矩阵w 是对样本数据的协方差矩阵进行特征分解建 立的。p c a 的目的是将样本投影到特征空间中去提取特征,从而降低了维数,减少计算 量的同时又便于识别。但是p c a 在取样本协方差矩阵的最大的几个特征值对应的特征 向量作为投影空间时,并不能够保证人脸的一些主要特征一定在其中。后来,现有的许 多高效的模式识别方法都是在有监督式的特征提取方法下进行的,l d a 2 , 3 1 是一种典型 的有监督式的特征提取方法,许多实际应用中,l d a 比p c a 更加有效。但是,l d a 也 存在缺点,即就是l d a 在计算过程中会出现s s s ( s m a l ls a m p l es i z e ) 问题【4 5 1 ,即类 内散射矩阵会出现不可逆的情况,这样就限制了l d a 的使用范围。 对于p c a 方法所存在的问题,很多人提出了解决的方法。为了使人脸图像在p c a 后其整体结构信息能够最大程度地保留,f 6 】等人提出了直接对人脸图像矩阵进行降 维的2 d p c a 方法,该方法不需要将训练样本矩阵转换成一维样本向量的形式,而是直 接对样本矩阵进行降维,同时,由于2 d p c a 方法的协方差矩阵的维数小于p c a 方法的 协方差矩阵的维数,故在运算耗时上2 d p c a 也优于p c a ;而z u o 7 】等人则提出了对人 脸图像矩阵的行方向和列方向同时降维的b d p c a 方法,b d p c a 在某种程度上是p c a 和2 d p c a 的延续。实验结果表明,2 d p c a 、b d p c a 能够很好地保留人脸图像样本的 结构信息,从而取得了很好的识别效果。进一步地,为了取得更好的识别率,m s p a r k t 8 , 9 1 等人提出了加入类间信息的c a p c a 方法,该方法将类信息融合到p c a 方法中,使得样 本在提取特征的过程中充分考虑到了样本的类别信息,实验结果也表明了该方法能够取 得很好的识别效果。 而对于l d a 方法的s s s 问题,b e l h u m e u r t 3 】等提出了f i s h e r f a c e 方法,也叫做 p c a + l d a 方法,这种方法首先采用p c a 对初始样本数据进行降维,当初始样本的维数 降低到小于样本个数时,再采用l d a 队降维后的样本进行第二次降维,得到最终的用 于分类的投影矩阵。然而,该方法也存在不足之处,即就是当训练样本的类别数很多时, 这种特征提取方法可能会丢失很多样本类别信息。后来,又提出了另一种解决s s s 问题 的方法,即就是给类内散射矩阵s w 加一个扰动,确保s w 是一个可逆矩阵,比如 r d a 【1 0 1 p d a t n j 2 】等方法,可是当类内散射矩阵和类间散射矩阵的维数达到上万维时, 这些方法的计算量会很大。后来,l i 【1 3 】等人又提出了m m c ( m a x i m u mm a r g i nc r i t e r i o n ) 方法,该方法将类间散射矩阵与类内散射矩阵的比替换为类间散射矩阵与类内散射矩阵 的差,避免了求逆过程,从而不会出现奇异值问题。 另外,在样本的训练模式上,基于上述方法的人脸识别系统都是只对初始训练样本 处理求得特征空间,当进入一个待识别的人脸时,将其投影到该特征空间提取特征并对 去分类,往往这种模式的人脸识别系统的识别率鲁棒性不是很高。后来,就有人提出了 2 第一章绪论 基于增量【1 4 】学习的特征提取方法,如i p c a 1 5 1 、i l d a 1 6 1 、i b d p c a 1 7 】等,这些方法在新 识别一个样本时,会逐一地更新当前的特征空间,所以基于这一模式的人脸识别系统更 能满足当今社会对高识别率的要求。 1 3 本文的研究内容及结构安排 1 3 1 研究内容 特征提取对高维数数据的分类具有重要的研究意义,应用非常广泛。特征提取的目 的是提取一组特征,使得这些特征的维数比原始数据的维数低,且保持数据的类别特性。 用提取的特征代替原始数据进行各种处理,能使与特征数量有关的分类过程的计算量减 少,同时因为去除了数据的相关特性,从而提高分类效率。本文主要包括以下几个方面 的内容: ( 1 ) 融合小波和自适应类增广p c a 的人脸识别。 该方法一方面用离散小波变换对人脸图像进行压缩,提取入脸的低频分量,这样既 能保留人脸的主体信息,又能起到降维的作用,减少了计算量;另一方面,不用对经 p c a 预处理后的数据增加类信息,而是直接归一化后求得每一类数据的中心,再对该数 据中心点集进行p c a ,进而提取特征,这样能将类信息自适应的融入到p c a 过程中, 使算法运用起来更加灵活。 ( 2 ) 融合2 d p c a 和模糊2 d l d a 的人脸识别。 提出了一种新的以模糊集理论、( 2 d ) 2 p c a l d a 为基础的特征提取方法模糊 ( 2 d ) 2 p c a l d a 。该方法一方面将模糊集理论运用到2 d l d a 过程中,通过每个样本对每 一类的模糊隶属度,充分地将每一样本的分布信息融入到散射度矩阵的定义中,从而提 高了2 d l d a 的分类性能;另一方面,同时对人脸图像进行2 d p c a 和模糊2 d l d a 处理, 有效地提取了人脸图像的行和列识别信息。实验结果表明,该方法的识别性能优于其它 方法。 ( 3 ) 二维类增广p c a 首先用2 d p c a 直接对人脸图像矩阵提取特征,其次对提取的特征进行归一化处理, 然后将归一化处理后的特征与类别信息结合成为类增广数据,最后对类增广数据进行 2 d p c a 处理,提取最终的特征。该算法既保留了人脸图像的结构信息,又考虑了样本 的类别信息,使得识别率有了大大地提高。 1 3 2 结构安排 第一章绪论先对课题提出的背景、意义和国内外研究现状作了简要的介绍,再概 述了本文的主要研究内容。 第二章常用的特征提取方法简要介绍了几种常用的特征提取方法,为后续的工作 提供理论基础。 第三章融合小波和自适应类增广p c a 的人脸识别先对小波变换进行了简单的介 绍,再详细的描述了类增广p c a 的算法步骤及其理论支撑,并推导出了自适应的类增 江南大学硕士学位论文 广p c a ,然后将小波变换与自适应类增广p c a 相结合对训练样本提取特征,最后将该 方法与现有方法的识别率相比较验证其优越性。 第四章融合2 d p c a 和模糊2 d l d a 的人脸识别先简要介绍了现有模糊f i s h e r f a c e 方法和在其基础上提出的模糊2 d l d a 方法,然后详细描述了本章提出的模糊 ( 2 d ) 2 p c a l d a 算法,最后将该方法与现有方法的识别率相比较验证其优越性。 第五章二维类增广p c a 具体介绍了二维类增广p c a 方法的思想和步骤,后经实 验证明该方法的有效性。 第六章总结与展望对论文所做的主要工作做了总结,并简述了人脸识别领域现在 还存在的问题,以及自己工作的展望。 1 4 本章小结 特征提取使得分类过程的计算量明显减少,同时因为去除了数据的相关特性,从而 提高分类效率。本章主要介绍了特征提取的研究背景及意义以及研究现状,同时,还简 要介绍了本文的主要研究内容和结构安排。 4 第二章常用的特征提取方法 第二章常用的特征提取方法 p c a 也叫k l 【1 8 】变换是被广泛应用的用于特征提取的统计学方法,这种方法能够高 效地提取数据的重要特征以减少数据的维数,然而,这些特征在提取的过程中并没有考 虑类信息,从而使得其并不适合于数据分类。另外一种传统的特征提取方法是l d a , 该方法通过使用包含类信息的散射矩阵来克服p c a 的问题,然而,它存在自己的缺点, 比如源于对散射矩阵求逆的奇异值问题。为了解决以上的问题,各种特征提取方法相继 出现,如m m c 19 1 、2 d p c a 、2 d l d a 2 0 1 、b d p c a 等方法。 2 1 主成分分析 p c a 是一种识别数据之间的主要不同点并降低数据的维数的常用方法。为了提取特 征脸( 在低维空间上的人脸向量) ,我们需要先求取一组投影轴,且在该投影轴上投影 之后的人脸图像的方差达到最大,然后,我们在求取的正交空间上重复该过程。在理论 上,上述问题即就是相关矩阵r r 肌的特征值问题: r = e ( x - x ) ( x - 功1 ) ( 2 1 ) 其中z 表示归一化后的图像向量,x 为人脸图像的均值,为初始图像向量的维数。对 ( 2 1 ) 式进行特征分解求得的特征向量表示投影轴或者特征脸,特征值则表示对应特征 脸的投影方差。最后,将特征脸按照特征值降序排列即得到解决上述问题的投影轴。 在整个过程中,最主要的存在的问题是r r 肌在实际的应用中维数太高,使得计 算量很大。假设将胛幅人脸图像作为目标集合,且将工= 0 1 一曲,0 2 一x ) , - - - , o 胛一工) 】 作为归一化后的目标向量组成的矩阵,则r 可表示为: r = t( 2 2 ) 我们可以确定特征脸的数量肯定小于或者等于胛,换句话说,就是尺的迹小于或 者等于胛,且因为目标集中的向量的线性分布,会使得存在特征值为无或者很小的数 的情况。另外,x t x 尺肌胛与r 有相同的非零特征值,因为将x t x v 七= 以 ,的左右 两端都左乘x 可得: 厨( x v ) = 以( x v ) ( 2 3 ) 所以,我们可以对x t x r 胁胛进行特征分解,从而r = 肠t 具有相同的特征值, 且特征脸表示为w = x v 七,并需将0 w 。0 = 对其进行归一化。最后,特征脸的投影矩 阵可表示为: = 朋t q 儿 ( 2 4 ) 其中,矿- - 1 , , 1v 2 o * 9 1 ,辨】,r 为对角线矩阵且对角线上的值为五( f = 1 , 2 ,m ) ,明为主 元个数。 而对主元个数的选取会直接影响最终的识别效率,通常在计算过程中都需将求得的 特征值按从小到大排序,特征值越大,则选取的优先级就越高。假设肌为选取的主元个 数,则按照以下标准选取主元个数: 5 最心= 乃品心o = 1 ,2 ,) ( 2 1 1 ) 假设把所求出的特征值按降序排列五丑+ i ,选择对应前d ( 通常d ,) 个非零特 征值所对应的特征向量,w 2 ,那么,w 2 ,w a 就是所求的最佳判别矩阵。 2 3 最大间距准则 最大间距准则( m a x i m u mm a r g i nc r i t e r i o n ,m m c ) 解决了l d a 出现的奇异值问题, 用类间散射度与类内散射度的差值替代类间散射度与类内散射度的比值,即就是在对 ( 2 8 ) 和( 2 9 ) 式进行计算后,m m c 的原理为寻找变换矩阵形,使得下述式子达到 第二章常用的特征提取方法 ,( 矽) = 缈1 ( s 8 - s 矿) 形 ( 2 1 2 ) 对品一曲进行特征值分解即可求得所需的最佳投影矩阵。 无论是p c a 、l d a 还是m m c ,在对人脸图像进行特征提取前,都需将二维的人脸 图像矩阵转换成一维的人脸图像向量,这就会导致以下问题: 1 ) 高维的人脸图像向量使得在计算过程中计算量会很大; 2 ) 转换为一维的人脸图像向量后人脸图像本身的结构信息可能会丢失; 3 ) 在识别过程中,因训练样本的数目相比于样本的维数很小而会造成小样本问题。 所以针对上述问题,有人提出了二维主成分分析、二维线性鉴别分析、双向主成分 分析等方法,这些方法无需将二维人脸图像矩阵转化为一维人脸图像向量,而是直接对 原始的二维人脸图像矩阵进行处理得到所需的协方差矩阵、散射度矩阵等,这样既能保 留人脸样本的结构信息,又能减少计算量。 2 4 二维主成分分析 假设训练样本集中有m 幅人脸图像4 r ”o = l ,2 ,m ) ,记x r “d 为由正交列 组成的矩阵,且以d ,将4 投影到x 上得到维数为m x d 的特征矩阵z = 4 x 。在 2 d p c a 中,采用下面的准则决定x 的取值: - 厂( x ) = 彦( 墨) ( 2 1 3 ) 其中墨训练样本投影后提取的特征矩阵的协方差矩阵,护( 墨) 为墨的迹。2 d p c a 的 思想是寻找一个投影矩阵x ,使得所有训练样本投影得到的特征矩阵的总体散射度达到 最大。协方差矩阵s 可以定义为: 置= e ( y - e y ) ( 】,一e 】,) 1 = e a x - e ( a x ) a x - e ( a x ) 。( 2 1 4 ) = e ( a - e a ) x ( a - e a ) x 所以, 护( 置) = x t 【e ( 彳一e a ) t ( 彳一e a ) x ( 2 1 5 ) 则可定义图像的协方差矩阵: g := 研( 么一e a ) t ( 么一尉) 】 ( 2 1 6 ) 容易证明,g 是一个维数为聆力的非负定矩阵,且可以直接通过训练样本矩阵计算, 则q 可计算为: g i - - 击善( 4 一- ) t ( 4 一动 ( 2 1 7 ) 其中彳为所有样本的平均图像,从而式( 2 1 3 ) 可以表示为: ,( x ) = x t 6 , x ( 2 1 8 ) 因此,最佳的投影矩阵k = ,吻】可由协方差矩阵g t 的前d 大的特征值对应 的特征向量组成。最后,可用上述的最佳投影矩阵k 计算每一个样本的特征矩阵: 巧= a s 义0a = 1 , 2 ,m ) ( 2 1 9 ) 7 江南大学硕士学位论文 2 5 二维线性判别分析 假设训练集包含有c 类样本,且每一类包含有m 个样本,钟是维数为m xn 的第七 c 类的第f 个样本。则训练集中总共含有m = 札个样本,记z 尺m j 为由正交列组成的 k = l 矩阵,f 1 m d ,则将投影到z 上可得维数为dx n 的矩阵匕= z t 钟。依据下述准则 计算最佳的鉴别矩阵: 邶,= 器 ( 2 2 0 ) 兵甲,品为投影后的样本的类i 司散射矩阵,昂为投影后的样本的类内散射矩阵,品 和s 矿的计算公式如下: & = 吉善m ( 歹一可) ( _ 一而t = 万1 善c j 【z t ( j t 一才) 】 z t ( j t j ) 】t ( 2 2 1 ) 品= 击善誊( 矿一7 顶矿一萝) t = 吉善善【z t ( 彳? 一j ) 】 z t ( 彳一j t ( 2 2 2 ) 则: 啊m t 陆喜m 弘- 2 ) ( f - - 2 ) t x = x r 瓯x 眨2 3 , 驴( 昂) = x t 吉善善( 群一j 顶钟一j ) t x = x r 瓯x c 2 斜) 其中咒和& 为图像的类间和类内散射矩阵,记为: o = 古喜m ( j 一- ) ( j 一- ) t ( 2 2 5 ) 瓯= 吉善善( 一- 2 钟一j 七) t ( 2 2 6 ) 其中j 和j 分别为第f 类的平均图像和总的训练集的平均图像。从而,式( 2 2 0 ) 可以表示为: 肥) = 蔫 ( 2 2 7 ) 2 d l d a 的目标是寻找一个最佳的鉴别矩阵z 咿使得厂( z ) 达到最大。显然,最佳鉴 别矩阵乙可由g :1 g 6 的前d 大的特征值对应的特征向量组成。最后,可用上述的最佳 鉴别矩阵z 0 计算每一个样本的特征矩阵: e 七= z 二彳! ( k = 1 , 2 ,c ;i :1 ,2 ,。)( 2 2 8 ) 第二章常用的特征提取方法 2 6 双向主成分分析 双向主成分分析( b i d i r e c t i o n a lp c a ,b d p c a ) 是一种直接将维数为,2 以的人脸图 像x 投影成维数为七例( “m ,“,1 ) 的特征矩阵y 的技术。 y = 吃x ( 2 2 9 ) 其中为列投影矩阵,为行投影矩阵。 假设 墨,五,彳) 为包含幅图像的训练集,将每幅人脸图像五表示为朋个维 数为1 刀的向量的集合,则行总体散射矩阵s 定义为: s f - 2 志善( 五) t ( x l ) q 3 0 ) 其中x 为所有训练图像的平均矩阵。这里将矿的前大的特征值对应的行特征 向量构建行投影矩阵: = 【矿,矿,呓】 ( 2 3 1 ) 进一步地,将将每幅人脸图像置表示为刀个维数为m l 的向量的集合,则列总体 散射矩阵定义为: 2 袁善( 五一x ) ( 五一x ) t ( 2 3 2 ) 然后,将的前k 大的特征值对应的行特征向量构建行投影矩阵: = 【一,吃】 ( 2 3 3 ) 2 7 本章小结 特征提取是人脸识别过程中一个基本而又十分重要的环节,本章首先介绍了三种特 征提取方法:p c a 、l d a 和m m c ,这三种方法均需将二维的人脸图像矩阵转换成一维 的人脸图像向量,这就使得计算过程中计算量会很大,同时人脸图像的整体结构信息也 会丢失,且会出现小样本问题;针对上述问题,后来有人提出2 d p c a 、2 d l d a 和b d p c a 等方法解决上述问题,取得了很大的成功。本章对这几种方法作了简单的介绍,为后续 的研究工作提供了相应的理论基础。 9 江南大学硕士学位论文 第三章融合小波和自适应类增广p c a 的人脸识别 小波变换【2 1 2 2 1 ( w a v e l e tt r a n s f o r m ,w t ) 是一种基于多层次函数分解的数学工具。 人脸图像经小波变换,可被分解成低频分量和高频分量两个部分,其中低频分量保留图 像的基本信息。由于小波变换具有良好的时频局部化能力,可以减少图像的分辨率,进 而减少算法的计算复杂度。 主成分分析( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a ) ,是一种被广泛应用的特征提取方 法。该方法是将原始样本按照方差最大化的准则投影到低维空间,从而得到样本的低维 特征。然而p c a 在降维时没有考虑到样本的类信息,其提取的特征并不一定适合于分 类。针对这一点,p a r k 等人提出了类增广p c a ( c l a s s - a u g m e n t e dp c a ,c a p c a ) 方法, 该方法在p c a 降维后的样本中加入类信息,再使用p c a 进行降维,达到了比直接使用 p c a 法更好的识别效果。然而c a p c a 要根据样本情况计算类间信息,使用起来不够灵 一 洁。 本章提出了一种小波变换和自适应类增广p c a 相结合的人脸识别方法,它首先利 用小波变换对样本进行预处理,去除样本中的高频信息,然后再利用自适应的类增广 p c a 对人脸样本进行识别。在y a l e 和f e r e t 库上的实验表明:相对于类增广p c a , 本文所提出的自适应类增广p c a 方法更加灵活。由于小波变换对样本进行了预处理, 其识别率和时间复杂度上也优于p a r k 提出的类增广p c a 方法。 3 1 小波变换简介 3 i i 小波及小波变换定义 设y o ) r ( r ) ,其傅里叶变换为y ) ,并满足条件吵( o ) = 0 ,则函数杪( x ) 通过伸 缩和平移而生成的函数族帆。) 虼。( 曲= i 口i 刈2 ( x 口- b ) 口,6 r ,口o 称为连续小波或分析小波,j c ,叫基小波或母小波。其中a 为伸缩因子, 子。 篓g f ( x ) el 2 ( r ) 的连续小波变换( 既力( 口,6 ) 定义为 ( 3 1 ) b 为平移因 ( 力( 口,6 ) _ = ;l 厂( x 矽( 学) 出 ( 3 2 ) 3 1 2 二维小波变换与逆变换 把对一维的表示推广到二维离散的数字图像上,而且尺度函数是二维可分离的,则 有相应于二维的可分离的尺度函数伊o ,y ) 和三个可分离的方向敏感小波函数y 6 ( x ,y ) , 妒v q ,协,l ,d b ,协为: 缈( 毛y ) = 缈( 功伊)y o ,y ) = 伊( 咖( y ) ( 3 3 ) c ,o ,y ) = 吵( 功c o ( y )0 ,y ) = 少( x 渺 ) ( 3 4 ) 1 0 第三章融合小波和自适应类增广p c a 的人脸识别 沿着不同的方向小波函数会有变化,矿度量沿着列变化,沙7 度量沿着行变化,少j 则对应于对角线方向。每个小波上的h 表示水平方向,v 表示垂直方向,d 表示对角线 方向。 设磅( 墨,屯) ) 表示一幅离散图像,用低通滤波器j i l 和高通滤波器g 分别对巳的每一 行作滤波,并作隔点抽样,然后再用它们分别对巳的每一行滤波并作隔点抽样,得到图 像低频概貌和图像高频细节吐,哌,则有如下小波正变换( 分解算法) : 勺+ 。( ,l l ,吃) = h ( 2 r h - k ) h ( 2 n 2 一恕) q ( 砖,乞) 以。( ,l l ,他) = 五( 2 啊- k 1 ) g ( 2 n :一屯) q ( 毛,恕) 略。( 惕,他) = g ( 2 ,l i - l q ) h ( 2 n 2 - k 2 ) c 。, ( k t ,乞) “。7 颤。( ,l l ,他) = g ( 2 n a 一毛) g ( 2 一屯) c t ( 白,乞) 其小波逆变换( 重构算法) 如。f 式: 勺( 毛,屯) = 矗( 毛- 2 n 。) h ( k 2 - 2 n 2 ) c ,+ 。( 啊,伤) ,1 2 + j i l ( 毛一2 啊) g ( 恕- 2 n 2 ) d ;* + ( ,l l ,1 2 ) 也 ( 3 6 ) = g ( 毛- 2 n t ) h ( k x 一2 ) 啦。( 啊,也) j i i 也 + g ( 畸- 2 r h ) g ( k :一2 他) 颤。( 啊,他) 一i 也 x c $ 于c n x n 像素的图像,小波变换能分解,层,整数j - 似t c ( x ) ) 2 的值约等于0 。 引理3 :当石属于尼类时,c ( x ) 的第j | 个元素的值为一正常数n ,否则为一负常 n k ,且满足以以+ ( 一m ) = 0 ,则有 素马善( ,i t c ”= 嘉与姜,陬仇m ( 一) 】 ( 3 2 5 ) 其中,m 是属于忌类的训练样本个数,是总的训练样本数,鸭= ( 1 m ) 惯毫4 i 为属于七类的训练样本的平均值,磋= ( 1 ( 一m ) ) ”。4 i 为不属于七类的训练样本 的平均值,皿为属于后类的训练样本的集合。 由引理卜3 ,( 3 2 2 ) 式可以化为: 唣2 c o s 2p + 奇i - 善,【咋见m ( 一m d ( 3 2 6 ) 则可把( 3 2 6 ) 式简化为: 1 4 第三章融合小波和自适应类增广p c a 的人脸识别 点;= 丢+ 乏事雨s ;n c 2 目+ 口, ( 3 2 7 , 其中& = 1 ( 一1 ) 见以( 一畦) ,口= t a l l - 1 1 ( 2 v r “。& ) 】,表示“的第尼个分量, 由下面的定理1 可求得式( 3 2 7 ) 的最优解。 定理l :定义,( “,v ,秒) :1 2 + 板万荔i 万芝丽s i n ( 2 秒+ 口) , l l v l l = 1 时,使得( “, ,秒) 达到最大的解为: “= 鹕峄隆叫 汹鹤 则当刮圳= 1 和 ( 3 2 8 ) ( 3 2 9 ) 矿:兰一旦二+
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 纪委案件超期管理办法
- 社交平台线上管理办法
- 网点文件分发管理办法
- 八一博物馆课件
- 系统人员权限管理办法
- 2025年成瘾医学药物成瘾戒断治疗方案设计答案及解析
- 缪凝离婚后财产分配及子女监护与教育支持协议
- 水利工程职业健康责任合同(环境监测)
- 生物医药项目终止成果转化与补偿合同范本
- 特色餐厅厨师聘用合同包括菜品研发与品牌推广
- 成都中医药大学辅导员考试真题2022
- 火灾调查第四章-火灾痕迹物证课件
- 中铁四院syadjv423工程测量平差数据处理软件使用教程
- 大型医院耗材管理SPD系统
- 校园一日安全巡查记录表【范本模板】
- GB/T 19960.1-2005风力发电机组第1部分:通用技术条件
- 田英章楷书心经-高清米字格版
- 2021年成都中医药大学辅导员招聘考试题库及答案解析
- 锅炉安全技术规程
- 易制毒化学品岗位责任制度
- 项目检查汇报报告(52张)课件
评论
0/150
提交评论