(测试计量技术及仪器专业论文)线性子空间人脸识别方法的研究与仿真.pdf_第1页
(测试计量技术及仪器专业论文)线性子空间人脸识别方法的研究与仿真.pdf_第2页
(测试计量技术及仪器专业论文)线性子空间人脸识别方法的研究与仿真.pdf_第3页
(测试计量技术及仪器专业论文)线性子空间人脸识别方法的研究与仿真.pdf_第4页
(测试计量技术及仪器专业论文)线性子空间人脸识别方法的研究与仿真.pdf_第5页
已阅读5页,还剩55页未读 继续免费阅读

(测试计量技术及仪器专业论文)线性子空间人脸识别方法的研究与仿真.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 由于计算机人脸识别技术具有广阔的应用前景,对计算机人脸识别方法和技术的研究 已经成为国内外模式识别领域内研究的热点本文从人脸特征提取角度,对当前一些较新 的人脸识别方法进行了讨论分析,并给出了相应的改进算法 该文研究了基于图像矩阵的特征提取问题,并提出新的图像矩阵特征提取方法,即 2 d m m cp l u s2 d f d a 鉴别矢量集人脸识别方法同时,本文利用了基于图像矩阵的2 d m m c 准则获得行和列方向最优鉴别矢量集,再同时对人脸图像矩阵压缩 方法即( ( 2 d ) 确d a ) ,对此方法进行探索争研究人脸识别仿真试验证明本文提出 ( 2 d ) 2 8 m d a 的方法具有较高的识别率和较好的稳定性 该文通过分块p c a ( m o d u l a rp c a ) 的思想直接从人脸图像矩阵出发,在模式识别之 前,先对图像矩阵进行分决,对分块得到的子图像矩降使用主成分分析进行鉴别分析在 此基础上,本文提出了分块州c ( m o d u l a r c ,n 嘲c ) 其大体思想和分块p c a 伽p c a ) 相似, 但其加入类别信息,使鉴别轴更具有鉴别性。在o r l 人脸库上检验了这种方法的识别性能, 实验结果表明这种方法m m m c 抽取的鉴别特征有较强的鉴别能力 该文深入研究了人脸识别的独立成份分析方法首先,研究了线性特征提取情况下的 独立成份分析及其在人脸识别中的应用,通过理论分析和仿真试验,探索了独立成份分析 人脸识别方法的理论本质和识另l j 性能在此基础上,本文提出了一种新形式的核独立成份 分析算法并应用于人脸识别问题在大型人脸库上的仿真试验证明了本文提出的方法不仅 具有有效性,且在一定程度上优于已有的核独立成份分析人脸识别算法 关键词:人脸识别,特征提取,图像子空问法,分块c 、独立成份分析,核i c a a bs t r a c t s i n c et h em a c h i n er e c o g n i t i o no ff a c e sc a nb ew i d e l ya p p l i e do nm a n ya s p e c t si r lt h e s o c i e t y , t h er e s e a r c h e so nt h ef a c er e c o g n i t i o nt e c h n i q u eh a v eb e e nt h es p o t l i g h to ft h er e s e a r c h i np a t t e mr e c o g n i t i o nf i e l d f r o mt h ev i e wo f e x t r a c t i n gf a c ef e a t u r e s w ed i s c u s s e ds e v e r a ln e w f a c e r e c o g n i t i o nm e t h o d si nt h ec u l r e n t a n di r e p r o v e dt h e m f u r t h e r i n gt h em e t h o db a s e do ni m a g ep r i n c i p a lc o m p o n e n ta n a l y s i s at w o - p h a s e a l g o r i t h mo fi m a g ep r o j e c t i o nd i s c r i m i n a n ta n a l y s i si sp r o p o s e di nt h i sp a p e r n ed i s c r i m i n a n t m e t h o di sc o m p o s e do ff e a t u r ee x t r a c t i o nb a s e do nm a x i m u mm a r g i nc r i t e r i o n ( m m oa n d f i s h e r d i s c r i m i n a n t a n a l y s i sf f d a ) f u r t h e r m o r e ,an e wt e c h n i q u e e a l l e d2 d i r e c t i o n a l 2 - d i m e n s i o n a lm a x i m u mm a r g i nd i s c r i m i n a n ta n a l y s i s ( ( 2 d ) m m d a ) i sp r o p o s e df o rf a c e i m a g er e c o g n i t i o n t h ep r o p o s e d ( 2 d ) l m m d a m e t h o dw o r k si m a g em a t r i xi nt h er o wd i r e c t i o n a n di nt h ec o l u m nd i r e c t i o ns i m u l t a n e o u s l yf o rf e a t u r ee x t r a c t i o n t h ee x p e r i m e n t a lr e s u l t so n 0 r lf a c ed a t a b a s e si n d i c a t et h a tt h ep r o p o s e d ( 2 d ) 2 m m d am e t h o dh a st h ea d v a n t a g eo f h i 9 1 1 e rr e c o g n i t i o nr a t e , l e s s e rm e m o r yr e q u i r e m e n t sa n db e t t e rc o m p u t i n gp e r f o r m a n c et h a nt h e 2 d p c aa n d ( 2 d ) 2 p c am e t h o d 删sa r t i c l et h r o u l 曲t h em o d u l a rp c at h o u g h t ,m o d u l a rp c ai sf i r s t l yu s e do nt h eo r i g i 2 h a l i m a g e s t og e tl o w e rd i m e n s i o n a lp a t t e r n sc o r r e s p o n d i n gt ot h eo r i g i n a li m a g e s t h e nt h ew e l l k n o w np c a - f a c e sm e t h o di sf o l l o w e do nt h el o w e rd i m e n s i o n a lp a t t e r n st of i n i s ht h ep a t t e m c l a s s i f i c a t i o n t h e nt h i sa r t i c l ep r o p o s e dt h em o d u l a rm m cf e a t u r ee x t r a c t i o nm e t h o d i t r o u g h l yt h o u g h ts i m i l a rt om o d u l a rp c 久b u ti tc o n s i d e r e dt h ec l a s si n f o r m a t i o no f t r a i n i n g s a m p l e t h ee x p e r i m e n t a lr e s u l t so no r l f a c ed a t a b a s e si n d i c a t et h a tt h ep r o p o s e dm e t h o d sh a d t h es t r o n g e re f f e c t i v ec a p a b i l i t y i n d e p e n d e n tc o m p o n e n ta n a l y s i s ( i c a ) i sa ni m p o r t a n ts u b s p a c em e t h o df o rf a c e r e c o g n i t i o nb e s i d e sl d a i nt h i sp a p e r , w ed i s c o v e rt h es p e c i a l 时o fi c a m e t h o dw h e nu s e df o r s m a l lc l a s sp r o b l e m t h r o u g ht h et h e o r e t i c a la n a l y s i sa n dt h es i m u l a t i o ne x p e r i m e n t , w e e x p l o r e dt h et h e o r ye s s e n c eo ft h ei n d e p e n d e n tc o m p o n e n ta n a l y s i sa n dt h er e c o g n i t i o n 1 ) e r f o r m a n c ec a p a b i l l t y i nt h i sf o u n d a t i o n , t h ea u t h o rc a r r i e d0 1 1t h ee x p l o r a t i o nt ot h e i n d e p e n d e n tc o m p o n e n ta n a l y s i so nt h en o n - l i n e a re x p a n s i o na n da p p l yi nf a c er e c o g n i t i o n , i ti sv e r i f i e dt ob ee f f e c t i v ei nt h ea p p l i c a t i o no f f a c er e c o g n i t i o ni nl a r g ef a c ed a t a b a s e k e y w o r d s :f a c er e c o g n i t i o n ;f e a t u r ee x t r a c t i o n ;s u b s p a c em e t h o db a s e do ni m a g e ;m o d u l a r m m c ;i n d e p e n d e n tc o m p o n e n ta n a l y s i s ( i c a ) ;k e m e li c a 本学位论文知识产权声明 本学位论文是在导师( 指导小组) 的指导下,由本人独立完成。 文中所引用他人的研究成果均已注明出处。对本论文研究有所帮助的 人士在致谢中均已说明。 基于本学位论文研究所获得的研究成果的知识产权属于南京林业 大学。对本学位论文,南京林业大学有权进行交流、公开和使用。 研究生签名:翠乳满 导师签名: 勇氇 日 期:伽7 7 碍五组 致谢 在谂文完成之际,我首先要向我的导师李勇智副教授表示衷心的感谢。论文从选题、 实验到撰写、定稿过程中,自始至终都得到了李勇智副教授的细心指导和帮助。从2 0 0 4 年考入南京林业大学,攻读硕士以来,我从导师身上,不仅学到了很多相关的专业知识, 而且学到了治学的态度和为人的道理,使我终身受益。 在三年的硕士研究生学习过程中,李勇智副教授在生活上、学习上给予我极大的关怀 和帮助。在指导我们的研究方向的时候,他始终细心的参与讨论和研究,给我们提出宝贵 的意见。他渊博的学识、精湛的专业知识、求实的科研精神、严谨的治学态度、诚信的为 人风尚、踏实的工作作风,无论是治学还是为人,都是我终身学习的榜样。在此,我要向 他表达我崇高的敬意和真挚的感谢。 衷心感谢信息学院的刘云飞院长以及封维忠老师和其他相关专业老师们对我的关心 和培养。感谢他们在学习和生活上给我的帮助,他们的教导使我受益非浅。 感谢吴松松同学和张立伟同学在我的课题研究中给予了许多好的建议和无私帮助。 感谢师弟毛洪贲,师妹刘粉香给予我的帮助,感谢家人及同宿舍舍友的支持和关心。 再次对帮助过我的人致以深深的谢意。 1 1 课题的提出 第一章绪论 人类身份识别技术就是采用某种技术和手段对入的身份进行标识,从而依据该标识对 人进行身份识别,以达到监督、管理和控制目的的一种技术。二十世纪计算机技术的长足 发展把人类社会带入了信息化时代,也使应用人类生物特征进行身份识别成为可能。人类 本身具有很多相对独特的特征,如d n a 、指纹、虹膜、声音、人脸等等。基于这些相对 独特的人类特征,结合计算机技术,发展起来众多的基于人类生物特征的身份识别技术, 如人脸识别技术、d n a 识别技术、指纹识别技术、虹膜识别技术、语音识别技术等。 计算机人脸识别技术相对于其他的基于生物特征的人类身份识别技术,具有特征录入 方便,应用场合广泛等优点,因此倍受广大科研人员的关注【i 】。然而,虽然经过近三十年 的快速发展,计算机人脸识别技术仍远未达到令人满意的程度,应用工作还只处于探索阶 段。“9 1 l ”事件后,美国也曾在其主要机场安装人脸识别系统,但由于其技术尚不成熟, 应用人脸识别系统对人身份进行识别并没有取得理想的效果。人脸识别系统还没有在世界 范围内得到广泛应用。在国内,对人脸识别技术的研究始于二十世纪八十年代末期【2 j ,虽 然取得了一定的成果,但也还没有达到实用阶段。针对上述情况,我们开展了计算机人脸 识别方法这一课题的研究,具有理论和现实的双重意义。 目前,人们提出了许多种入脸识别算法:基于几何特征的人脸识别方案;基于特征脸 ( 特征子空间) 【3 l 的人脸识别算法:基于模板匹配( 静态匹配和弹性匹配) 的人脸识别算法 基于人工神经网络的识别算法嗍:等灰度线法嘲:基于特征融合的人脸识别算法嘲:隐马尔 可夫模型方法等许多种。子空间分析方法由于算法简洁,计算高效、识别性能稳定成为 人脸识别的主流研究方向,其思想是根据一定的性能目标来寻找线性或非线性的空间变 换,把原始信号数据压缩到一个低维子空间,使数据在子空间中的分布更加紧凑,为数据 的更好描述提供手段,另外,计算的复杂度也得到大大降低。本文主要研究人脸识别的线 性子空间方法,重点在理论上对相关算法进行深入研究,并通过人脸识别仿真试验进一 步加深对该类方法的认识。 1 2 课题研究的意义 本课题的研究工作为基于静态人脸图像应用计算机技术对人身份进行识别,重点研究 目前国际上流行的子空间类相关算法及其改进,同时,研究工作有着广泛的应用领域: 1 在安全防范领域中的应用。军事、金融、保密等部门都需要对出入人员进行身份识别, 以防止信息泄漏和不法现象的发生。使用该技术可以方便地进行身份识别,而不使被识别 者感到不舒服。 2 在犯罪刑侦领域中的应用。在刑侦工作中,对罪犯的抓捕是至关重要的一环。应用人 脸识别技术可以依据犯罪嫌疑人的人脸图像对机场、车站、港口等重要交通场所进行监控, 从而大大促进了罪犯抓捕工作的开展。 3 在公共事业领域中的应用。在现代社会,银行、保险、交通等公共事业部门都要对人进 行身份验证。采用传统的密码、i c 卡等手段和技术对人进行身份验证有安全性差、易遗 失、易伪造等缺点,而采用人脸识别技术进行身份验证则能够很好地克服传统身份验证手 段和技术的缺点。 综上,从计算机人脸识别技术对于防止犯罪、案件侦破、机密保护等工作提供了可靠 的保障。对于稳定社会,保障社会安全,促进经济发展都将产生积极作用。同时,该技术 的应用影响到金融、保险、交通、社会保障等行业,将给社会生活带来巨大变化。因此, 开展计算机人脸识别方法和技术的研究对社会生活具有重大意义。 1 3 子空间人脸识别方法概述 在诸多人脸识别方法中,子空间方法发展迅猛,成为人脸识别方法研究的热点。子空 间方法分为线性子空间方法和非线性子空间方法。线性子空间方法由特征脸法发展而来, 在线性鉴别分析( l d a ) 7 1 下走向成熟,最近又以独立成份分析( i c a ) 学j 和非负矩阵分解 ( n m f ) 1 9 , 1 0 】再次成为关注的焦点。线性子空间方法的数学理论基础坚实,算法简洁明了且 表现稳定。研究表明,人脸识别的线性子空间方法不仅在识别率、鲁棒性和计算复杂度等 方面获得重大突破。而非线性子空间方法由于利用了核技术【l i 】而获得成功应用:引起了广 泛关注核技术的思想就是利用一非线性映射,把原空间的数据映射到一隐特征空间,然 后在隐特征空间中对数据进行分析,而在计算上,并不需要明确的计算这个非线性变换,只 需要通过一点积核函数来计算在隐特征空间中两两矢量的点积即可常用的核函数有三 种:多项式核、径向基核和s i g m o l d 核0 2 1 。基于核的非线性子空间分析就是把核技术和 线性子空间分析有机结合起来的方法目前己用在人脸识别中的有核主成份分析【l3 】和核 f i s h e r 判决分析【1 4 , 1 5 】。人脸识别的子空间方法不仅推动了对人脸识别理论本质的深入认 识,也推进了人脸识别整个领域的发展。 1 3 1 线性子空间人脸识别方法概述 1 基于主成份分析( p c a ) 的人脸识别方法 基于主成份分析( p c a ) 【1 1 】的人脸识别方法又称为e i g e n f a c e 方法,其基础是k l 变 换。k l 变换是图像压缩领域的一种最优正交变换,人们将它用于统计特征提取,从而形 成了子空间法模式识别的基础。若将k l 变换用于人脸识别,则需假设人脸处于低维线性 空间,且不同人脸具有可分性。由于高维图像空间k l 变换后可得到一组新的正交基,因 此可通过保留部分正交基,以生成低维人脸空间。而低维空间的基则是通过分析人脸训练 样本集的统计特性来获得。k l 变换的生成矩阵可以是训练样本集的总体散度矩阵,也可 以是训练样本的类间散度矩阵,即可采用同一人的数张图像的平均来进行训练,这样可在 一定程度上消除光线等干扰,且计算量也得到减少,而识别率不会有太大的下降。 特征脸法虽然考虑了图像之间所有的差异,但由于它不管这样的差异是由光照变化或 几何变化造成的,还是由于表情变化和少许遮掩造成的,因此基于主成份分析的人脸识别 方法存在理论上的缺陷。研究表明,特征脸的方法随着光照,角度及人脸的尺寸等变化的 引入,识别率急剧下降。虽然可通过采用同一人的训练样本的平均来计算类间散度矩阵, 但也只能在一定程度上克服这个缺点。同时由于对k l 变换而言,外在因素带来的图像 差异和人脸本身带来的差异是不加任何区分的,因此,不管如何选择正交基,都不能根本 解决问题。其改善的一个思路是针对干扰所在,对输入图像作规范化处理,其中包括将输 入图像的均方差归一化、人脸尺寸归一化等等;另一种改进是考虑到局部人脸图像受外在 干扰相对较小,在进行人脸识别时,除计算特征脸之外,还可以通过k l 变换计算出特征 眼睛、特征嘴巴等等,然后将局部特征矢量加权进行匹配,这样可以在一定程度上提高人 脸识别效果。 2 基于f i s h e r 线性判别准则的人脸识别方法n 6 】 线性判别分析不同于主成份分析,它是以样本的可分性为目标,寻找一组投影轴使线 性变换后的样本具有类内离散度最小、类问离散度最大的性质。从理论上说,线性鉴别分 析比较适合于模式识别问题。经典的线性判别分析中使用的是f i s h e r 准则函数,所以线性鉴 别分析又被称为f i s h e r 线性判别分析( f i s h e rl d a f l d a ) 。f i s h e r 准则函数定义为 咿阳r s m 尹x 蒯 扎3 m 其中瓦表示类间散度矩阵,& 表示类内散度矩阵。 基于f i s h e r 线性判别准则的分类技术一般都是针对大样本情况有效,即训练样本数大 于样本维数。在应用计算机进行人脸识别时,通常人脸图像训练样本较少,而人脸图像的 维数却较高,从而导致小样本分类问题。针对这种倩况,研究人员给出了多种最佳鉴别矢 量集的求解算法。t i a n 【1 日提出了用类内散度矩阵的伪逆矩阵鼠? 来代替类内散度矩阵的逆 矩阵的& 。1 方法。而h o n g 和y a n g 1 8 1 贝i | 提出在类内散度矩阵& 中添加小的扰动,从而使 奇异的类内散度矩阵& 转换成非奇异的类内散度矩阵& ,进而直接求解最佳鉴别矢量集; c h e n g 和z h u a n g 1 9 1 曾提出应用秩分解的方法来计算最佳鉴别矢量集。通过对求解空间的 分析,l i u 刚等人认为最佳鉴别矢量应取在总体散度矩阵的墨特征矢量所张成的空间,同 时给出了在该空间下最佳鉴别矢量集的求解算法。郭1 2 l 】等人给出了一种求取全局意义上 的最佳鉴别矢量集的递归算法。通过分析郭 2 2 1 等人给出了一种在类内散度矩阵的特 征矢量所张成的空间上求解最佳鉴别矢量集的算法。文献f 冽给出了一种基于无相关特征 鉴别矢量集的人脸识别方法,该方法的人脸识别率要远高于基于f o l e y - s a m m o n 变换最 佳鉴别矢量集人脸识别方法的识别率。上述方法都是基于f i s h e r 线性判别准则,由于其 充分利用了分类识别信息,获得了较为成功的识别效果,基于什么原则求解最佳鉴别矢量 集和确定怎样的最佳鉴别矢量集求解空间一直受到广大科研人员的广泛关注。 3 基于m m c 线性判别准则的人脸识别方法 为了避免人脸识别过程中遇到的小样本问题,l i t 2 4 】等人提出一种基于最大边距准则 3 ( m a x i m u mm a r g i nc r i t e r i o n ,m m c ) 的特征提出方法,它的准则函数基于特征空间的类间散 度与类内散度的差的最大化,具体形式为 d m a x j ( 口o ) :仍7 ( s 一& ) 够 ( 1 3 2 ) 忙l 其中既表示类间散度矩阵,& 表示类内散度矩阵 如果对最优鉴别矢量够取为单位矢量( 即( 纺,纺) = 1 ,j = l ,j ) 则上式的模型为 模型1 3 1 m a x j ( q ,) = ( 最一) 够 i 爿 ( 哆,纡) = 1 ,_ ,= 1 ,d ( 1 3 3 ) 口r ” 最优鉴别矢量就是墨一& 的前d 个最大特征值所对应的单位特征矢量,即 瓴一瓯) 吩= a 纺,j = l ,2 ,d ( 1 3 4 ) 可以看出瓯奇异并不影响最优鉴别矢量的求解,从而避免t d , 样本问题。 l i 2 4 1 等人还把m m c 用核方法拓展到非线性的情形。z h c n g 2 5 】等人也提出了加权最大 边距准则( w e i g h t e dm a x i m u mm a r g i nc r i t e r i o n , w m m c ) 特征提取方法,并用核推广到非 线性的情形。q i u t 2 6 1 等人提出了非参数最大边距准则( n o n p a r a m e t r i em a x i m u mm a r g i n c r i t e r i o n ) 进行特征提取方法,该方法是重新构造区,& 基于最大边距准则进行特征提取 方法。文献【27 】还提出基于最大边距准则下的具有标准正交性和统计不相关性的最优鉴别 矢量,并在实验中和原m m c 及p c a 进行了比较,结果显示具有标准正交性和统计不相 关性的最优鉴别矢量在一定程度上降低甚至消除了变换后的特征分量的统计相关性。具有 统计不相关性的最大边距准则在实验结果中识别率较优。并将具有统计不相关性最大边距 准则拓展到核空间( s t a t i s t i c a l l y u n c o r r e l a t e dk e r n e lm a x i m u mm a r g i nc r i t e r i o n , m m c ,s u k m m c ) ,文献【2 8 j 的实验表明,s u k m m c 比k e r n e lm m c 和k e r n e lp c a 有更 强的能力去消除特征分量之间的统计不相关性和有效的特征提取方法。 4 独立成份分析 主成份分析和线性鉴别分析都是基于训练样本的二阶统计信息,而忽视了高阶统计信 息。实际上高阶统计信息有时对识别来说也是非常有用的。独立成份分析的思想就是通过 线性变换,利用训练样本找到一组相互独立的投影轴( 独立成份) ,并以此来描述样本数据。 主成份分析实际上是去除样本的二阶统计意义下相关性,而独立成份分析是要去除样本所 有阶数的统计相关性,从而使样本的二阶统计信息和高阶统计信息都得到了有效利用【2 9 】, 因此主成份分析被认为是独立成份分析的推广。 独立成份分析要基于所有阶的统计信息,所以在求解上就没有主成份分析和线性鉴别 分析那么容易。目前比较流行的求解方法有三种 3 0 , 3 1 , 3 2 1 ;( 1 ) 基于信息论的方法;( 2 ) 4 固定点算法;( 3 ) 联合近似对角化特征矩阵的方法。其中固定点算法p 2 】最为简单和快捷。 独立成份分析主要是应用在盲信号分离上【3 2 1 。它在人脸识别上应用是f 奎b a r t l e t t 等【3 3 】 第一次提出的,把人脸图像看作为多个相互独立的基图像的线性叠加。文献( 3 4 】是先用独立 成份分析提取特征,然后结合支持矢量机来提高分类效果。文献 3 5 1 对独立成份分析作了较 详细的评价分析,并与特征脸和f i s h e r 脸进行了实验比较,结果显示独立成份分析略好于后 两者。实验结果还表明先用p c a 对原数据进行降维,可以提高独立成份分析的识别性能, 但是对降维的维数很敏感。另外,文中还指出结合贝叶斯分类框架,可以进一步提高识别性 能。但是在文献p 6 j 中的比较结果是独立成份分析和主成份分析的识别率近似相同的,文献 p 7 i 指出在选择各自最佳的距离度量后,独立成份分析明显不如主成份分析。在主成份分析 中通常是根据特征值的大小来自动选择主成份的,但是对于如何有效地、自动地选取对分 类有用的独立元,目前还没有一个很好的标准,通常都是根据经验来选取的。可能这是导致 上述不同结论的原因之一。另外独立成份分析的计算复杂度要明显高于主成份分析。 1 3 2 非线性子空间方法概述 1 核主成份分析 核主成份分析就是先用核技术把原始数据投影到隐特征空间f 中,再对其作主成份 分析,那么就得到了相对于原空间的一个非线性主成份子空间根据主成份分析的原理, 在高维隐特征空间中求取投影轴所进行的计算只关系到高维样本的内积,所以可以通过定 义一个基于原始样本的函数来代替高维样本的内积,就可以完成非线性主成份分析的计 算,而不必具体构造非线性映射和进行相应的高维运算。这就是核主成份分析的理论实质。 核主成份分析在人脸识别中的应用首次是由y a n g 3 7 提出的,并和特征脸方法进行了 比较,后来还和独立元分析进行了比较 3 8 1 ,实验结果表明核主成份分析具有一定的优越性 文献【3 9 】还分析了三者之间在取得最好结果时所需的基个数大体是:独立元分析最多,核主 成份分析其次,主成份分析最少。这可能跟独立元分析的基个数选择带有主观经验有关: 核主成份分析比主成份分析多,可能由于核主成份分析先要把原始数据进行复杂的非线性 处理。文献m 】是核主成份分析和支持矢量机结合起来,迸一步提高识别性能。相关的工 作还有在人脸检测中的应用【4 l 】。 核主成份分析尽管比主成份分析能更有效地描述人脸的复杂变化,但是它和主成份分 析一样,得到的非线性主成份是基于所有样本的最优重建这一目标的,所以对于分类也不 一定是最优的文献1 3 s 啦】中的实验结果显示,核主成份分析有时比线性判决分析的识别 效果还要差,也说明了它的这一缺点。 2 核f i s h e r 判决分析 核f i s h e r 判决分析是结合了核技术和线性判决分析的思想,来提取非线性的判决特 征。和核主成份分析不同的是在隐特征空间,中运用线性判决分析,也就是寻找一变换 使样本在隐特征空间f 中的类内离散度尽可能小,而类间离散度尽可能大。 由于它既有线性判决分析的特点,又能有效地描述数据中复杂的非线性关系,所以从 理论上应该比核主成份分析更适合于模式识别问题。l i 等【4 3 】提出用它来描述不同视角下 人脸特征的变化,构造出入脸特征变化的个性化曲面。文献【3 8 ,4 3 1 提出用它进行人脸识别。 在使用基于核的非线性子空间分析时,参数的选择也是很重要的。因为不同的参数得至0 的 隐空间是不同的。当然不同的核函数得到的结果也肯定是不同的,因为使用了不同的映射 方式。 目前还没有文献对它作大数据集的测试,或在f e r e t 这样的测试系统上测试,也没有 较详细地调查它在小样本的情况下的性能,以及对光照、表情等变化的鲁棒性。另外,关于 核函数及其参数的选择,目前还是一个开放的问题。核f i s h e r 判决分析也无法处理每类只 有一个训练样本情况下的人脸识别问题。 1 4 课题研究的具体内容 本课题研究的内容包括: 1 通过分析基于图像矩阵主成份分析的人脸识别方法原理,本文提出了一种新的图像矩 阵投影鉴别分析方法。该方法是一种将图像矩阵最大间距准则( 2 d m m c ) 特征提取 方法和图像矩阵f i s h e r 鉴别分析( 2 d f d a ) 相结合的人脸识别方法,即第一阶段利用 基于最大间距准则( 2 d m m c ) 的特征提取方法进行降维,第二阶段针对降维后图像 特征矩阵通过f i s h e r 鉴别分析( 2 d f d a ) 再进行特征提取。这种有效方法不同于以前 基于图像矢量二阶段线性鉴别分析方法,该方法是利用图像矩阵直接构建样本的类 内散度矩阵、类间散度矩阵和总体散度矩阵。在o r l 和y a l e 标准人脸库的试验结果 表明,2 d m m cp l u s2 d f d a 与基于图像矩阵的鉴别方法2 d m m c 、2 d p c a 和2 d p c a p l u s2 d f d a 相比,本文提出的方法在特征提取的有效性和稳定性方面是最优的,并 且其识别率上有显著的提高。本文利用了图像矩阵基于m m c 函数准则下,行列双方 向提取鉴别矢量。然后同时对人脸图像矩阵压缩的方法臣o ( 2 d ) 2 m m d a 进行了探讨,实 验结果表明本文提出但d ) 2 m m d a 的方法具有较高的识别率和较高稳定性。 2 本文对分块p c a 6 0 的研究,发现与其他几种识别方法的比较发现它是较优和有效的。 在此基础上我们比较了分块的大小对识别率的影响。并根据m m c 准则引出分块 m m c ,并在o r l 标准人脸库比较几种方法优劣,也比较分块大小对识别率的影响。 3 本章深入研究了i c a 应用于人脸识别的两种架构算法 s 3 1 ,详细探讨了其中的理论本 质、算法特点和应用范围。最后,本章提出一种新形式的核i c a 人脸特征提取算法, 通过将人脸数据重排和引入核技术,实现了线性i c a 的核化,从而使得i c a 算法具 备了非线性特征提取能力,在f e r e t 人脸库上的试验证实了本文所提出算法的有效 性。 6 第二章基于图像子模式鉴别矢量集的人脸识别 2 1 引言 通常情况下,在应用p c a 方法进行人脸识别时,都要将人脸图像矩阵写成列矢量的 形式。而一般来说,人脸图像的维数都相对较高。对于一幅分辨率为1 0 0 x1 0 0 的人脸图 像,表述人脸图像的列矢量要高达1 0 0 0 0 维,这不仅使鉴别矢量集计算时间长,而且鉴别 矢量集的计算也比较困难,也出现类内散度的奇异。针对以上情况,文献 4 4 1 提出了图像 主成份分析( 讧p c a ) 。该方法是直接应用人脸图像矩阵计算总体散度矩阵,这样可以大 大减少鉴别矢量集的求解时间。文献】的实验结果表明,基于图像主成份分析( i m p c a ) 的人脸识别方法不仅在计算时问上大大少于传统的基于矢量主成份分析( p c a ) 的人脸识 别方法,而且在识别率上也有显著提高。 本文提出了一种新的图像投影鉴别分析方法,该方法将图像矩阵最大间距准则法 ( 2 d m m c ) 和图像矩阵f i s h e r 鉴别分析方法( 2 d f d a ) 相结合,即第一阶段利用最大间距准 则进行降维,第二阶段针对降维后的图像特征矩阵进行f i s h e r 鉴别分析( 2 d f d a ) ,提取 出最终的图像特征。称为2 d m m cp l u s2 d f d a 。这种方法实质上是基于样本矢量二阶段线 性鉴别分析方法的二维推广,关键点是利用图像矩阵直接构建样本的类内散度矩阵、类间 散度矩阵和总体散度矩阵。在o r l 和y a l e 标准人脸库的试验结果表明,本文提出的方 法2 d m m c p l u s2 d f d a 在特征提取方面不仅比基于样本矢量二阶段线性鉴别分析方法有 效和稳定,同时也优于其他2 d 线性子空间方法。 本文对使用2 d m m c 鉴别分析,在行列两个方向进行人脸图像矩阵特征提取进行了 探索。研究结果表明,对图像矩阵分别求取基于m m c 准则下行列鉴别矢量集,并进行的 同时压缩的图像特征,可以更好的描述人脸模式的特征。通过试验获知在进行同时压缩变 换后,基于图像矩阵两方向m m c 鉴别矢量集的人脸识别方法( 2 d ) 2 m m d a 要远远好于 文献脚l 的基于图像主成份分析( 2 d p c a ) 的人脸识别方法。 2 2 基于图像主成份分析的人脸识别方法 4 4 1 令x 为疗维列矢量,文献的思想是将m n 维的人脸图像矩阵彳通过公式 ( 2 1 1 ) 向投影轴j 上投影 y = a x( 2 1 1 ) 从而获得描述人脸图像矩阵4 的特征矢量y ,y 称为人脸图像矩阵彳的投影特征矢量。如 何寻找一个好的投影矢量x 是所要解决的主要问题。文献1 4 4 1 认为,样本在投影空间的离 散度可用来衡量矢量x 的鉴别能力。由此,文献引入下述评价标准。 m a x 以( x ) = 打( 碱) ( 2 1 2 ) 其中,碣代表训练样本投影特征矢量的总体散度矩阵,而z r ( z 墨) 代表该总体散度矩阵 7 z 曼的迹。问题是如何给出训练样本投影特征矢量的总体散度矩阵z 墨。 设有工类人脸图像,人脸图像的总数为m ,第j 幅人脸图像表示为肼聆维的矩阵 4 ( ,= l ,m ) ,所有人脸图像的均值为刁。将人脸图像矩阵4 投影到维n 列矢量x 上: r 2 4 x ( ,= 1 ,m ) , ( 2 1 3 ) 设所有图像特征的平均值为f ,则有 f ( ) = 万( x ,f = ;i z 所以,训练样本投影特征矢量的协方差矩阵7 殴为 强= 击善( 弓一f ) ( 巧一f ) 7 = 击姜 ( 4 一j , ( 4 一i ) z r 所以有: c 噼睫( 印m j ) 卜 若令 g = 吉善( 4 一万) 0 一i ) 则称丌h 维矩阵g ,为图像总体散度矩阵。根据公式( 2 1 6 ) 和公式( 2 1 7 ) , 可叫雷号喃 ( 2 1 4 ) ( 2 1 5 ) ( 2 1 6 ) ( 2 1 7 ) 公式( 2 1 2 ) ,( x ) = z 毽x ( 2 1 8 ) 公式( 2 1 7 ) 描述的准则称为广义总体散度准则。使公式( 2 1 8 ) 达到最大的矢量x 称为 最佳投影方向。其物理含义是,图像矩阵向矢量x 上投影后,投影样本的总体离散度最 大。显然,最佳投影方向为图像总体协方差矩阵e 最大特征值所对应的特征矢量。一般 来说,对于多类分类问题,单一最佳投影方向不足以包含足够的分类识剐信息。通常情况 下,选取服从正交约束,且使广义总体散度准则最大的一组矢量作为投影方向,亦即选取 图像总体协方差矩阵g 最大的几个特征值所对应的一组特征矢量集作为投影方向。设由 图像主成份分析方法获得的最佳投影方向集为工,置,则人脸图像矩阵4 在最佳投影方 向j 0 上的特征矢量为: k = 戤k = 1 ,d ( 2 1 9 ) 这样,人脸图像矩阵z 在最佳投影方向集五,五,局投影所得到的特征可以表示为: 8 y = 墨 墨 : 巧a x d ( 2 1 1 0 ) 它通常是一个n = m d 维的投影特征矢量。文献 4 4 1 实验结果表明在识别性能上,i m p c a 方 法要好于p c a 方法和f i s h e r 方法。 2 3 基于图像矩阵2 d m m cp l u s2 d f d a 方法 l i u1 4 6 l 和l i 4 7 1 对基于图像矩阵的线性鉴别分析( 即2 d l d a ) 进行了深入的研究;并通 过实验说明了基于图像矩阵的线性鉴别分析在特征提取的速度方面和节约内存空间方面 有了显著的提高。y a n g 4 5 l 还提出直接基于图像矩阵的图像投影技术( 即2 d p c a ) ,它是直 接基于图像矩阵构建构样本的类内散度矩阵、类间散度矩阵和总体散度矩阵。另外,为了 避免类内散度的奇异,一种称为p c a p l u sl d a 的两阶段的线性鉴别方法被提出郴删;该 方法首先是利用基于图像矢量的p c a 对图像进行降维处理,然后对降维后的图像矢量再 进行f i s h e r 鉴别分析,该方法中p c a 对图像进行处理的目的是消除类内散度矩阵的奇异 性。 本文提出了一种新的基于图像矩阵的特征提取方法。该方法是基于图像矩阵将最大间 距准则特征提取方法和f i s h e r 鉴别分析( f d a ) 相结合的人脸识别方法,即第一阶段利用 基于最大间距准则的特征提取方法进行降维,第二阶段针对降维后图像矩阵通过f i s h e r 鉴别分析( f d a ) 再进行特征提取。这种基于图像矩阵的两阶段人脸识别新方法在本文中 被称为2 d m m cp l u s2 d f d a 。在o r l 和y a l e 标准人脸库的试验结果表明,与基于图像 矩阵的鉴别方法2 d m m c 、2 d p c a 和2 d p c a p l u s 2 d f d a 相比,本文提出的方法在特征 提取的有效性和稳定性方面是最优的,并且其识别率上有显著的提高。 2 3 12 d m m c 的思想和算法 最大边距准则( m a x i m u mm a r g i nc r i t e r i o n , m m c ) 是h a i f e n gl i t 2 4 1 中提出的,目的是 解决基于的线性鉴别分析方法来解决小样本问题。m m c 的基本思想是根据类内紧缩类间 离散原则,提出种新的准则即将基于样本散度矩阵提出了一种全新的准则,即f i s h e r 的分子项减去分母项。既使类内散度矩阵奇异也同样达到压缩样本达到类内紧缩类问离散 的目的。文献 2 7 2 s l g o i 提出一种具有标准正交性的最优鉴别矢量的计算方法和一组具有统 计不相关的最优鉴别矢量的计算方法。其目的可以减小最优鉴别矢量中的的统计相关性。 下面我们具体介绍2 d 咖m c 的思想。 一般说来,在样本类别数较多的情况下,特征提取的目的是选择一组最优鉴别矢量 置,彳,x 。( z ;r 8 ) 做为投影轴进行投影变换,达到降低维数的目的。设样本图像z 是 维列矢量,w = 蜀,五,j 乙】r “是由最优鉴别矢量z r ”所构成的投影矩阵( 线 性变换矩阵) ,矩阵爱和瓦分别表示经过图像投影变换后,特征空间中样本的类间散度矩 9 阵和类内散度矩阵。l i 等人提出的最大间距准则( m m c ) 函数【2 叼定义如下: m a x 以) = 扩园一s w ) ( 2 3 1 ) 最大间距准则( m m c ) 函数将样本在投影变换后的类间离散度和类内离散度结合在 一起,其物理意义是投影变换后特征空间的样本具有最大类间散度和最小类内散度。由于 夏= w 7 最,瓦= w 7 & 矿,因此( 2 3 1 ) 式可表示为 d m a x ,( 矿) = f ( s b - s 。 ( 2 3 2 ) ;i ( 2 3 2 ) 式也称为基于图像矢量的最大间距准则( m m c ) 。以往我们对入脸图像进行线性 鉴别分析方法都是基于人脸图像矢量来进行处理的( 即首先将人脸图像矩阵转换为列矢 量,然后进行鉴别分析) 。现在,我们直接基于图像矩阵给出最大间距准则函数的形式。 如果设三表示图像的类别数,j ;l 疋表示第i 类图像的训练样本数,射表示各类图像的训 练样本总数。第f 类的第_ ,- b i ) t l 练样本图像为m x n 维的矩阵4 。( i = 1 ,2 ,上, _ ,= 1 , 2 ,m ,) 。第f 类的训练样本的均值图像为彳”,所有训练样本的均值图像记作彳。 我们假设x 表示n 维投影矢量,将m x n 维的图像矩阵a 通过线性变换直接投影到x 上( 即y = a x ) ,得到一个m 维列矢量】,称之为图像的4 投影特征矢量。 训练样本图像4 投影到x 上后,得到如下的投影特征矢量 巧= 4 “x ,( f _ l ,2 ,l ,_ ,= 1 ,2 ,鸩) ( 2 3 3 ) 假设第i 类投影特征矢量的均值为f ( ”,所有训练样本投影特征矢量的均值为f ,则有 ,f

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论