已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 人脸识别技术是模式识别和机器视觉领域最富挑战性的研究课题之一,涉及模式识 别、图像处理、计算机视觉、神经网络、生理学以及心理学等诸多学科,是一个典型多 学科交叉的应用,它在公共安全、信息安全、人机交互等领域中有着广泛的应用前景。 尽管在人脸识别中包括许多个步骤,然而特征提取无疑是最重要的一个环节,特征提取 的差异性从根本上决定了人脸识别方法的优劣。而分类器的设计与实现则是人脸识别的 最后一个步骤,对分类器性能的改进也同样对人脸识别有着相当重要的作用。 本文在前人的基础上,对人脸识别中的特征提取和分类器做了深入的研究,具体如 下: 1 为了提高常用分类器的性能,本文引入了b o x c o x 变换的思想,推导出了基于 b o x - c o x 变换的分类器判别公式;由于b o x - c o x 变换对数据的正态化作用,以及很多模式 识别技术在所操作数据满足正态分布时的最优性能,分类器在b o x - c o x 变换后的性能有 了相当大程度的改进,特别是神经网络,无论是训练速度,还是类别判定的准确性,都 有相当程度的提高。 2 在对b o x c o x 变换的深入研究的基础上,本文又将它与人脸识别的特征提取相结 合,主要是主成分分析( p c a ) 、线性判别分析( l d a ) 和鲁棒性主成分分析( i 心c a ) 方法结合b o x c o x 变换;通过在o r l 人脸库上的大量实验,证明这种结合的有效性和积 极作用。 3 把上下文信息的思想应用于主成分分析( p c a ) 和线性判别分析( l d a ) ,提出 了前向的上下文信息方法和双向的上下文信息方法,并且设计了基于上下文信息方法的 分类器,最终在人脸识别上取得了令人满意的效果。 关键词:分类器;特征提取;b o x c o x 变换;上下文信息 a b s t r a c t a b s t r a c t f a c er e c o g n i t i o nt e c h n o l o g yi so n eo ft h em o s tc h a l l e n g i n gr e s e a r c h si np a r e m r e c o g n i t i o na n dm a c h i n ev i s i o n ,r e f e r r i n gt op a t t e r nr e c o g n i t i o n 、i m a g ep r o c e s s i n g 、 c o m p u t e rv i s i o n 、n e u r a ln e t w o r k 、p h y s i o l o g i c a la n dp s y c h o l o g i c a la n ds oo n ,w h i c hi sa t y p i c a li n t e r d i s c i p l i n a r ya p p l i c a t i o n a n di t h a sab r o a da p p l i c a t i o np r o s p e c ti nt h ep u b l i c s e c u r i t y , i n f o r m a t i o ns e c u r i t y , h u m a n - m a c h i n ei n t e r a c t i o n ,e t c a l t h o u g h f a c er e c o g n i t i o n c o n s i s t sm a n ys t e p s ,h o w e v e rf e a t u r ee x t r a c t i o ni su n d o u b t e d l yt h em o s ti m p o r t a n t ,o t h e m e s s o fi te s s e n t i a l l yd e t e r m i n et h ep e r f o r m a n c eo ff a c er e c o g n i t i o nm e t h o d s a n dt h ed e s i g na n d r e a l i z a t i o no ft h ec l a s s i f i e rf o rf a c er e c o g n i t i o ni st h el a s ts t e p ,t oi m p r o v et h ep e r f o r m a n c eo f c l a s s i f i e r sf o rf a c er e c o g n i t i o np e r f o r m sa ni m p o r t a n tf u n c t i o n t h et h e s i ss t u d i e sf e a t u r ee x t r a c t i o na n dc l a s s i f i e r so ff a c er e c o g n i t i o nb a s e do nt h e f o r m e rw o r k s t h em a i np o i n t sa r ea sf o l l o w s : 1 i no r d e rt oi m p r o v i n gt h ep e r f o r m a n c eo fc o m m o nc l a s s i f i e r s ,t h i sp a p e rh a si n t r o d u c e d b o x c o xt r a n s f o r m a t i o n ,d e d u c e dt h ec l a s s i f i e r sb a s e db o x c o xt r a n s f o r m a t i o n d u et ot h e p e r f o r m a n c eo fm a n yp a :t t e mr e c o g n i t i o nt e c h n i q u e si so p t i m a li fn o r m a l i t yi sa c h i e v e d , t h e p e r f o r m a n c eo fc l a s s i f i e r sb a s e db o x c o xt r a n s f o r m a t i o ni sb e t t e r , e s p e c i a l l yt h en e u r a l n e t w o r k ,t h e r ea r eac o n s i d e r a b l ei m p r o v e m e n ti nt r a i n i n gs p e e da n dt h ea c c u r a c yo ft h e c a t e g o r i e s 2 o nt h eb a s i so ft h ei n - d e p t hs t u d ya b o u tb o x - c o xt r a n s f o r m a t i o n ,t h i sp a p e rh a sm a k e n i ta c to l lt h ef e a t u r ee x t r a c t i o no ff a c er e c o g n i t i o n ,s u c ha st h ep r i n c i p a lc o m p o n e n ta n a l y s i s ( p c a ) ,l i n e a rd i s c r i m i n a n ta n a l y s i s ( l d a ) a n dr o b u s tp r i n c i p a lc o m p o n e n ta n a l y s i s ( r p c a ) ,l a r g en u m b e ro fe x p e r i m e n t so no r l f a c ed a t a b a s es h o wt h a tt h ei d e ai sq u i t e e f f e c t i v e 3 t h ec o n t e x t - d e p e n d e n tm e t h o da p p l i e st op r i n c i p a lc o m p o n e n ta n a l y s i s ( p c a ) a n d l i n e a rd i s c r i m i n a n ta n a l y s i s ( l d a ) ,w eh a v ea d v a n c e df o r w a r dc o n t e x t - d e p e n d e n tm e t h o d a n df o r w a r d b a r k w a r dc o n t e x t d e p e n d e n tm e t h o d ,a n dd e s i g n e dt h ec l a s s i f i e rb a s e do n c o n t e x t d e p e n d e n tm e t h o d t h ee x p e r i m e n t si nf a c er e c o g n i t i o nh a v es h o w e ds a t i s f i e d r e s u l t s k e y w o r d s :c l a s s i f i e r ;f e a t u r ee x t r a c t i o n ;b o x - c o xt r a n s f o r m a t i o n ;c o n t e x t - d e n p e n d e n tm e t h o d i i 独创性声明 本人声明所呈交的学位论文是誉人在导师指导下进行的研究工作及取 得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文 中不包含其他人已经发表或撰写过的研究成果,也不包含本人为获得江南 大学或其它教育机构的学位或证书而使用过的材料与我一同工作的同志 对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意 签名:鍪到舀 期:竺珥:星二- 2 笠一 关于论文使用授权的说明 本学位论文作者完全了解江南大学有关保留、使用学位论文的规定: 江南大学有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允 许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库 进行检索,可以采用影印、+ 缩印或扫描等复制手段保存、汇编学位论文, 并且本人电子文档的内容和纸质论文的内容相一致。 保密的学位论文在解密后也遵守此规定 签 名:垄邕幽导师签名: 日 期:驾阻二生一一一 第一章绪论 第一章绪论 随着计算机及网络的高速发展,信息的安全性、隐蔽性越来越重要。网络信息化时 代的一大特征就是每个人身份的数字化和隐蔽化。如何有效、方便地进行身份验证和识 别,已经成为人们日益关心的问题,也是当今时代必须解决的关键性社会问题。身份证、 工作证、智能卡、口令密码、网络登录号等传统的身份认证手段,不但使用麻烦、记忆 复杂、携带不便、不易保管,而且可能被遗失、忘记,或轻易被窃取、仿造和盗用。因 此,目前广泛使用的依靠证件、个人识别号码、口令等传统方法来确认个人身份的技术 面临着相当严峻的挑战,并越来越不适应现代科技的发展和社会的进步。生物特征识别 作为一种高新技术,由于其独特的属性,正在悄然担负起这一重要的使命。 生物特征识别技术【l 】是指通过计算机利用人体固有并特有的生理和行为特征来进行 身份识别或个体验证的- n 科学。虽然生物特征识别属于模式识别问题,并且还涉及信 号处理、机器视觉、统计分析、进化计算、生理学、心理学以及认知科学等多个领域。 生物特征识别技术可分为基于生理特征的生物识别技术和基于行为特征的生物识别技 术。生物特征是与生俱来的,是先天的,如指纹、人脸、虹膜、手型、掌纹、d n a 等; 而行为特征则是由生活习惯形成,是后天养成的,如人脸温谱图、语音、签名、步态等。 生物特征因具有较强的自身稳定性和个体差异性,是身份鉴别的理想依据。生物特 征技术是为了进行身份验证而采用自动技术测量其身体的特征或是个人的行为特点,并 将这些特征点与数据库的模板数据进行比较,完成认证的一种解决方案。人的生物特征 是惟一的,生物特征识别技术的基本工作就是对这些基本的、可测量或可自动识别和验 证的生理特征进行统计分析。与传统的身份鉴定手段相比,基于生物特征识别的身份鉴 定技术具有多方面的优点。 首先,生物识别技术是目前最为方便与安全的识别技术,它不需要记住复杂的密码, 也不需随身携带钥匙、智能卡之类的东西。生物识别技术认定的是人本身,没有什么能 比这种认证方式更安全、更方便了。由于每个人的生物特征具有与其他人不同的唯一性 和在一定时期内不变的稳定性,不易伪造和假冒,所以利用生物识别技术进行身份认定, 安全、可靠、准确瞄j 。 其次,生物识别技术产品均借助于现代计算机技术来实现,很容易配合电脑和安全、 监控、管理系统相结合,实现远程的自动化管理。 此外,由于人体特征具有人体所固有的不可复制的唯一性,这一生物密钥无法复制、 失窃或被遗忘。而常见的口令、i c 卡、条纹码、磁卡或钥匙则存在着丢失、遗忘、复制 及被盗用诸多不利因素。 正是由于生物特征所具有的这些优势,其获得了长足的发展,在国家安全、军事安 全、公安、司法、民政、金融、民航、海关、边境、口岸、保险及民用等领域实际应用 中具有极广阔的前景。在各种不同的生物识别技术中,由于人脸识别对人体的无侵害性、 自然直观以及其良好的交互性,已成为最容易被接受的生物特征识别技术,受到人们越 来越多的重视。人脸识别是指基于已知的人脸样本库,利用图像处理和模式识别技术从 江南大学硕士学位论文 静态或动态场景中,识别或验证一个或多个人脸。人脸识别技术涉及模式识别、图像处 理、计算机视觉、神经网络、生理学以及心理学等诸多学科,是一个典型多学科交叉的 边缘应用。人脸识别系统可以处理脸部图像的变化,但是人脸图像会受到年龄、心情、 拍摄角度、光照条件、发型等诸多因素的影响,因此人脸识别也是一项极具挑战性的工 作【。 1 1 人脸识别概述及现状 人脸识别技术是生物识别技术的一种,以其直接性、唯一性、方便性等特点,在公 安、海关、交通、金融、视频会议、机器人的智能化研究等方面得到了越来越广泛的应 用。由于人脸识别在这些方面的巨大应用前景,使得多年以来它一直是人工智能和模式 识别领域的研究热点。人脸自动识别技术就是利用计算机分析人脸图像,从中提取有效 的识别信息,用来辨认身份的一门技术,它涉及到模式识别、图像处理、计算机视觉、 生理学、心理学及认知学等诸多学科的知识,并与基于其他生物特征的身份鉴别方法以 及计算机人机感知交互的研究领域都有密切联系。 人脸识别的研究已经有很长的历史,早在1 9 世纪后期法国人g a l t o n 就曾对此问题进 行了研究【3 j 。到上个世纪六、七十年代,人脸识别引起了研究者的强烈兴趣。最早的自 动人脸识别研究论文见于1 9 6 5 年c h a n & b l e d s o e 在p a n o r a m i cr e s e a r c hi n c 发表的技术报 告,到现在已有三十多年的历史。7 0 年代,英、美等发达国家开始重视人脸识别的研究 工作并取得了进展。1 9 7 2 年,h a r m o n 用交互人脸识别方法在理论上与实践上进行了详细 的论述【4 】。同年,s a k a i 设计了人脸图像自动识别系统。8 0 年代初t m i n a m b i 开究出了优于 s a k a i 的人脸图像自动识别系统。但早期的人脸识别一般都需要人的某些先验知识,无法 摆脱人的干预。 进入9 0 年代,由于高速度高性能计算机的出现,人脸识别技术有了重大突破,进入 了真正的机器自动识别阶段。1 9 9 0 年,b u h m a n n 和l a d e s 提出了弹性图匹配技术( e l a s t i c g r a p hm a t c h i n g ,e g m ) 5 1 ,既保留了面部的全局结构特征,也对人脸的关键局部特征进 行了建模。1 9 9 1 年,麻省理工学院的t u r k 提出的e i g e n f a c e 方法目前已成为人脸识别的性 能测试基准算法睁7 1 。1 9 9 5 年m o g h a d d a m 在e i g e n f a c e 的基础上提出了双子空间贝叶斯判 别方法。同年,t 扫b e y m e r 等人提出的光流法是空间位置对齐的又一新颖算法。它采用光 流迭代的方法建立输入人脸与参考人脸之间的稠密像素级对应关系。b e l h u m e u r 等人于 1 9 9 6 年提出的f i s h e r f a c e 人脸识别方法目前仍然是主流的人脸识别方法之一【8 】。同年,洛 克菲勒大学( r o c k e f e l l e ru n i v e r s i t y ) 的a t i c k 等人提出局部特征分析技术( l o c a lf e a t u r e a n a l y s i s ,l f a ) t 9 1 ,目前该技术已商业化为著名的f a c e i t 系统。 目前,非理想成像条件下( 尤其是姿态和光照变化) 、用户不配合、大规模数据库上 的人脸识别问题逐渐成为研究的热点问题,涌现出了诸多技术方法。1 9 8 8 年,m k a s s 等人提出ts n a k e 模型用于提取人脸轮廓特征【1 0 。1 1 】。s n a k e 模型定义了包含形变和先验知 识的约束项和图像特征吸引项的能量函数,从而使初始化的人脸轮廓很好的适应不同的 人脸。19 9 8 年,o e o r g h i a d e s 等人提出基于光照锥( i l l u m i n a t i o nc o n e s ) 模型的多姿态、多 2 第一章绪论 光照条件的人脸识别方法。b l a n z 和v e t t e r 等人开创性地提出了基于3 d 变形模型( 3 d m o r p h a b l em o d e l ) 的人脸图像分析与识别方法【1 2 】。c o o t e s 于1 9 9 5 年提出了主动形状模型 ( a c t i v es h a p em o d e l sa s m ) ,它利用全局形状统计模型来约束局部纹理的匹配,从而既 快又好地确定标志点。c o o t e s 等人于1 9 9 8 年提出的主动纹理模型( a c t i v ea p p e a r a n c e m o d e l s 。a a m ) 1 3 】,在a s m 的基础上,进一步加入了纹理信息,利用形状和纹理联合统 计( 表观) 模型参数进行优化使得模型与输入达到最佳匹配。2 0 0 1 年,p a u l 等人提出了著 名的a d a b o o s t 算法【1 4 1 ,该方法利用一组弱分类器组合成一串强分类器,可以以较高的精 度和准确度从图像中检测出人脸位置。2 0 0 5 年,h y t m g s o ol e e 等利用线性物体类理论 和姿态转换矩阵有效的将姿态人脸合成正面人脸【l 孓1 6 1 。这些方法,目前己成人脸识别问 题的主要研究方向。 近年来,人脸识别研究得到了前所未有的重视,国际上发表有关人脸识别等方面的 论文数量大幅度增加,但是直到今天,人脸识别还是一个比较难的研究课题,一直在实 际的人脸识别系统中存在识别率太低的问题。虽然人脸识别技术已经渐渐的从实验室中 的原型系统走向了商用,出现了大量的识别算法和若干商业系统。然而,人脸识别的研 究仍旧面临着巨大的挑战,这是因为人脸比较容易受到各种因素的影响,从而增加了正 确识别人脸的困难;具体来说,面临的困难主要有光照问题、姿态问题、表情问题、遮 挡问题和分辨率问题等。但是人们的研究工作一直在进步,多年以来,研究者提出了很 多的人脸识别算法,大致分为两类:基于统计的人脸识别算法和基于几何特征的人脸识 别算法【1 7 1 。近年来,人脸识别技术研究非常活跃,人工神经网络【1 8 。2 0 l 、小波变换【2 1 - 2 3 在 人脸识别研究中都得到了很广泛的应用,出现了不少人脸识别的新方法 2 4 - 2 7 。 在基于统计的人脸识别算法中,一直存在人们一再头疼的维数问题和小样本问题瞵j 。 在这类方法中,人们把人脸图像看成一个m 行n y l 的矩阵,通常这是一个高维的问题,在 识别过程中经常会采取降维方法,如我们在模式识别领域经常用到的p c a l 2 引、l d a i s 等 方法。降维的过程,其实也是特征提取的过程,然后设计分类器,对人脸图像进行识别。 另外,人们提出了很多基于这两种方法的新方法,女i i c a 2 9 - 3 5 ,p c a + l d a l 3 6 】, 2 d p c a l 3 7 。3 引,c s l d a 3 9 】等,这些方法都在一定程度上提高了识别的准确性和识别算法 的稳定性。 基于几何的人脸识别是最初的人脸识别手段。它识别的依据不在是人脸图像的整个 矩阵,而是人脸中一些主要特征的形状和几何轮廓,所用到的几何轮廓基本包括眼睛, 鼻子,嘴,眉毛等。对于不同的人来说,面部特征点和轮廓的形状、大小、相对位置和 分布的情况各不相同,基于几何的人脸识别方法就是通过计算面部特征点形状、分布的 几何参数来区分不同人脸;该方法所采用的几何参数一般包括特征点之间的距离、边缘 曲率、角度等。基于几何的人脸识别方法的显著优点是简单、快速,识别过程仅仅依据 几何特征间距和相应参数辨别待识别目标。但同时这种方法的简单性也导致了其有效 性、可靠性较低吲。 在人脸识别领域,无论是基于统计的人脸识别,还是基于几何特征的人脸识别,都 无法逾越的两个问题:特征提取和分类器设计。正如前面提到的那样,p c a 和l d a 都 3 江南大学硕士学位论文 是特征提取的方式,选择人脸图像中的主要特征的形状和几何轮廓,都是特征提取的方 式。而分类器的设计则是人脸识别的最后一个步骤,分类器设计的差异性,可能会导致 人脸识别的效率和准确性。 1 2 模式识别分类器概述 无论是人脸识别,还是别的模式识别问题,基本问题就是对待分类模式进行分类, 即把该模式归到某一个类别之中,是一个一对多的问题。分类判别的前提是已知若干个 样本的类别以及每个样本的特征,在此基础上才能对待测样本进行分类判别。具体步骤 是建立特征空间中的训练集,并且已知训练集中每一个模式的类别,从这个条件出发, 寻求某种判别函数或者判别准则,设计判别函数模型,然后根据训练集中的样本确定模 型中的参数,便可将这个模型进行判别,利用判别函数或者判别准则去判别每一个未知 类别的模式属于哪一类【4 0 】。 如何做出合理而又准确的判决就是模式识别分类器要讨论的问题。在统计模式识别 中,通常我们感兴趣的主要问题,并不是单个样本类别的决策正误,而是如何使决策错 误造成的分类误差在整个识别过程中的风险代价达到最小。以至于几乎所有的模式识别 算法的设计都是强调“最佳 和“最优”,即希望所设计的系统在性能上最优。这种最 优是针对某一种设计原则讲的,这种原则称为准则,常用的准则有最小错误率准则、最 小风险准则、近邻准则、f i s h e r 准则、均方误差最小准则、感知准则等m 。设计一个分 类器,首先要确定准则,然后以此准则达到最优为目标,这是模式识别分类器设计的最 基本方法。 模式识别有多种方法:模板匹配法、判别函数法、神经网络分类法、基于规则推理 法等等。在这些方法中,判别函数法是本文研究的重点,当然本文也做了一些神经网络 分类方面的工作。 就判别函数法而言,要设计判别函数的形式有两种方法:基于概率统计的方法和判 别函数方法。 ( 1 ) 基于概率统计的分类法主要有基于最小错误率的贝叶斯决策、基于最小风险 的贝叶斯决策【4 。 直接使用贝叶斯决策需要首先得到有关样本的总体分布知识,包括各类的先验概率 及类条件概率密度函数,计算出样本的后验概率,并以此作为产生判别函数的必要条件, 设计出相应的判别函数和决策面。但是这样做,要求各类样本符合正态分布,或者接近 于正态分布。因此如果能从训练样本中估计出各类样本服从近似的正态分布,可以按贝 叶斯决策方法对分类器进行设计。 ( 2 ) 就判别函数分类法而言,由于一个模式通过某种变换映射以后,变成了一个 特征向量,该特征向量可以理解成特征空间中的一个点,在特征空间中,它必然属于某 一类,而与别的类的点区域相分离。即各个类之间确定可分,因此如果能找到一个判别 函数( 线性的或非线性的) ,把不同类的点集分开,则分类任务就完成了。判别函数不 依赖于条件概率密度的知识,可以理解成通过几何的方法,把特征空间分成对应于不同 4 第一章绪论 的类的子空间。这样的分离函数又分为线性判别函数和非线性判别函数,通常线性的分 离函数可以简化计算。 神经网络分类是另一种分类方式。神经网络可以看成是从输入空间到输出空间的一 个非线性映射,它通过调整权重和阈值来学习或者发现变量间的关系,实现对事物的分 类。由于神经网络是一种对数据分布无任何要求的非线性技术,他能有效的解决非正态 分布,非线性的评价问题,因而受到广泛的欢迎和应用。由于神经网络具有信息的分布 存储,并行处理以及自学习能力等特点,他在泛化处理能力上显示出较高的优势。 当然,分类器有多种,本文中我们主要研究了一些最常用的分类器,如最小距离分 类器、近邻分类器、正态贝叶斯分类器、神经网络中的b p 分类器。 1 3 特征提取概述 在人脸识别中,把人脸图像看成一个m 行n 列的矩阵,它包含了许多的特征,如果 把这些特征都用来做人脸识别,复杂性可想而知,这样做几乎是不可能的。这就面临着 减少特征数目的问题,即特征提取或者特征选择。特征提取是通过映射或者变换的方法 把高维空间的特征向量变换成低维的特征向量 4 0 1 ,通过特征提取获得的特征是原始特征 集的某种组合,并且,新的特征中包含了原有的全体特征的信息。 特征提取是人脸识别中最重要的步骤,特征提取的发展步伐直接决定了人脸识别技 术的进步快慢。p c a ,l d a 和i c a 是人脸识别特征提取中最为常用的方法,特别是前 面两种。p c a ,即主成分分析方法,又称为特征脸方法,统计人脸识别中相对基本的方 法,它是把许多个特征映射为少数几个综合特征的一种统计分析方法,它使得人脸识别 有了飞速的进步,为i c a ( 独立成分分析) 等方法的提出奠定了理论基础,i c a 只是p c a 的一种拓展表示。虽然p c a 是一个很重要的特征提取方法,但是它没有考虑到类内的 相似性和类间的差异性,所以它不能得到很好的效果。l d a 方法的提出弥补了这个缺 点,其子空间生成以基于f i s h e r 准则的线性判别分析为理论基础,使样本在所生成的子 空间上类间散度最大,类内散度最小。b e l h u m e u r 等在这一方向上又做了一些积极的工 作,提出了我们称为f i s h e r 脸方法的新算法。当人脸识别进入非线性的研究后,人们又 提出了基于核的主成分分析和基于核的线性判别分析,即把p c a 和l d a 推广到非线性 领域。 1 4 人脸数据库 人脸识别的研究工作f 1 2 0 世纪6 0 年代开始以来,经历了数十年的发展,已成为图像 分析和理解领域最热门的研究内容之一。目前,虽然人脸识别技术已经从实验室中的原 型系统逐渐走向了商用,出现了大量的识别算法和若干商业系统。然而,人脸识别的研究 仍旧面临着巨大的挑战,人脸图像中姿态、光照、表情、饰物、背景、时间跨度等因素 的变化对人脸识别算法的鲁棒性有着负面的影响,一直是影响人脸识别技术进一步实用 化的主要障碍。多数人脸识别算法的研究、开发和测试需要更多的人脸图像来克服上述 障碍,主要包括两方面:人脸库所包含的人数,人脸库中每个人所具有的在不同条件下 的人脸图像数。 5 江南大学硕士学位论文 人脸识别的研究和开发需要建立人脸图像数据库,而且识别系统的性能和人脸数据 库的设计密切相关。开发一个在任意环境条件下都能够适用的人脸识别系统是非常困难 的,因此几乎所有的人脸识别技术研究都是在一定的人脸数据库上进行【4 2 l 。 1 4 1 常用人脸敷据库 自上世纪9 0 年代以来,研究人员针对不同的情况,建立了多个用于人脸识别研究的 人脸数据库。最常见的有以下几种: f e r e t 人脸数据库 f e r e t 人脸数据库是目前世界上最大的人脸数据库,它是美国国防部为了促进人脸 识别技术的研究和实用化,发起人脸识别技术( f a c er e c o 鲥t i o n t e c h n o l o g y , f e r e t ) z 程 而建立的。f e r e 队脸库包括一个通用的人脸库及一整套测试标准。该数据库中人脸图 像具有不同的视角( 姿态) 、光照和表情的变化,目前每两年一度的人脸识别竞赛主要就 是采用f e r e t a 脸库作为评测标准。与其他人脸数据库不同的是,该数据库中每个人的 人脸图像不仅包括视角、表情和光照的变化,而且还包括时间间隔的变化,最长的时间 间隔达三年之久。f e r e t 人脸库包括数千人的几万幅人脸图像,而且还在不断扩充。由 于f e r e t 人脸库中包含军人的照片,因而北美以外的国家很难获得【4 ”。 o r l ( o l i v c t t ir e s 俄a r c hl a b o r a t o r y ) 人脸数据库 o r l 人脸数据库是当前人脸识别研究中使用最多的人脸数据库之一,可以从互联网 上免费获得( h t t p :w w w u k ,r c 辩a 心a t tc o 耐e d a 乜b 罄eh u n l ) 。该数据库由4 0 个人的4 0 0 幅人脸图像构成,图像的分辨率为9 25 0 ,其对应的特征向量为u ,。这样,每一幅人脸图像都可以投影到由 u ,巩,u ,张成的子空间中。为了减少维数,可以仅选取前面d 个特征向量作为子空间。 可以按照特征值所占的能量比例来选取最大的前面i l 价特征向量: 丑 粤一a ( 3 4 ) 以 f = 1 通常取a = 9 0 9 9 。则u = ( u ,) 就是我们所要得到的特征子空间,也就是人 脸基图像。p c a 的一个重要属性就是能够利用人脸基图像对测试样本进行人脸重构,并 且重构的平方误差罗l l 置一j 旷较小。其中x ,为第f 幅人脸图像形成的人脸向量,又为其 _ 对应的重构图像,膏= 阮+ ,其中a = ur 彳;。 尽管主成分分析法在人脸识别中取得了不错的效果,但还存在如下不足之处: ( 1 ) 所生成的子空间虽然具有最佳表示特性,但是并没有考虑到类可分性问题。 ( 2 ) 在本质上依赖于训练样本和测试样本的灰度相关性,所以算法对图像亮度和 人脸姿态变化适应性差。 ( 3 ) 对小样本的识别效果尚可,但对大样本的识别性能不理想,难以实用。 基于特征脸的人脸识别方法的重要贡献不仅在于它为基于图像的目标识别提供了 一种普遍的方法,还在于它的基于变换进行降维和特征提取的思想为目标识别提供了一 种方法论。这种方法被广泛应用于其它的目标识别任务中,例如笔迹识别、步态识别等。 在人脸识别的探索中,沿着特征脸方法的思路路径,研究者们进一步提出了基于f i s h e r 脸、基于奇异值分解、基于独立元分析、基于因素编码、基于核方法等的多种子空间人 脸识别算法,得到了优于传统特征脸方法的识别效果。 3 1 2 线性判别分析方法 基于主元特征脸的方法从表示的角度创建子空间,但没有考虑到类内、类间的差异, 2 1 江南大学硕士学位论文 因此并不能获得最好的分类结果。线性判别分析( l d a ,l i n e a rd i s c r i m i n a t ea n a l y s i s ) 就是为此而提出的,由于这种方法是基于f i s h e r 判别准则的,所以又称之为f i s h e r 脸方 法。 和主成分分析方法类似,线性判别分析也是从高维空间提取出最具判别能力的低维 特征。但是线性判别分析考虑到类内离散度最小、类间离散度最大,从而使得它所得到 的f i s h e r 脸方法要比e i g e n 脸方法更大程度的实现分类。 令x 为第k ( k = 1 , 2 ,c ) 类的第f 幅图像,以为第k 类的样本平均,则类间散布矩 阵可以表示为 s 占= 2 ( n k ( p i 一) ( 膏一) t ) ) ( 3 6 ) 类内散布矩阵可以表示为 s ,= 【( x 0 - a 。) ( x ? 一。) t 】 ( 3 7 ) 式( 3 7 ) 中,。是第k 类的样本数。f i s h e r 准则是通常采用的量化类内、类间区分度的 优化准则,如式( 3 8 ) 所示 ,( 形) = 网1 1 w s b w i i ( 3 8 ) 式( 3 8 ) 的解,即线性判别分析的投影算子,由s ;s 8 的特征向量组成。 利用线性投影算子,每一幅人脸图像可以映射为一个低维的特征向量。该向量的元 素通过图像向量和投影算子的每一个列向量分别做内积运算得到。因此,当把投影算子 的列向量视为基向量,特征向量的每一个元素就是人脸图像向它们的投影。 主成分分析和线性判别分析对样本空间进行了降维,从而使得匹配和识别在低维子 空间中进行。前者的基向量代表了样本变化最大的方向,其投影方向最大化了所有样本 之间的散布,因此,它所形成的特征表示适用于图像重建。后者的基向量通过最小化类 内散布和最大化类间散布得到,包含了类可分性信息,因此,它所形成的特征表示适用 于分类问题,识别率也高于前者。f i s h e r 脸方法的不足之处在于容易发生对样本的过训 练,在样本较少时甚至劣于特征脸方法,算法的推广能力也因而比较差。 3 1 3 鲁棒性主成分分析方法 鲁棒性主成分分析【4 9 】( r o b u s tp r i n c i p a lc o m p o n e n ta n a l y s i s ,r p c a ) 是一种在p c a 方法基础上提出的新方法,它被提出的主要目的是提取出更好的子空间,尽可能的减少 遮挡,光照等不利因素对人脸识别带来的困难。 在主成分分析中,考虑训练集为d = d 1 畋以】- l d 1d 2 d d1 1 为训练 集,其中n 为训练样本数( 训练图像的个数) ,d 为每一幅图像的维数,fr 表示转置。 通过该方法得到的k 维子空间b = 【6 1 吃魂】,d 中每一幅图像在b 上的投影集 第三章基于b o x - c o x 变换的特征提取研究 c = k 乞】= 矿d 。则表示p c a 方法的最小二乘误差 巧脚( b ) = n ( q ) = 0 4 一b b r 4 0 hdfi、2 = i 厶一i ( 3 9 ) i = lp 5 1 ,2 1 d 其中勺= 以,0i i 表示最小二乘估计。于是,式( 3 9 ) 就可以作为主成分分析方法 t = l 的一个评价标准,该式取值越小,则得到的子空间b 越能最大程度上表示样本信息。但 是式( 3 9 ) 还有别的重要用途,如果递归求子空间b ,每一步都通过式( 3 9 ) 表示的 最小二乘误差进行反向修正该子空间,并最终使得( b ) 小到某一个可以接受的程度, 这就是r p c a 的基本思想。 为了阐述r p c a ,我们首先给出类似于式( 3 9 ) 的基于r p c a 最小二乘误差公式 巨掣( b ,c ,仃) = 啪( 珥一一耽,仃) i = l hd,量、 = p l 厶- t i p - b p jx c j ,i ( 3 1 0 ) i - - 1 产l j 2 l 其中仃口是控制鲁棒性的参数,一般控制在2 至2 5 之间,p 是一个函数,例如对于任意 的x p ( 码) 2 南 通过式( 3 1 0 ) 我们就可以阐述r p c a 的算法步骤, b ,初始投影矩阵c ,初始均值。则 召槲= - 【州。坠o b c 槲掣一时。鲁 肚小 以 - l o 鲁 其中 百c 3 e , 掣= 一甲( 啻,仃) c r 簪卅r 甲( 如) 鲁一( 脚。 鼠= f f 雷,盯) ( c 。c ) r ( 3 1 1 ) 为此我们先假设初始子空间为 ( 3 1 2 ) ( 3 1 3 ) ( 3 1 4 ) ( 3 1 5 ) ( 3 1 6 ) ( 3 1 7 ) ( 3 1 8 ) 江南大学硕士学位论文 皿= ( 丑。丑) 7 f ( 丘一) 以= f ( 豆一) l 。 ( 3 1 9 ) ( 32 0 ) 在如上的公式中,言是误差矩阵,甲( 丘一) 中每一个( ,咋) = z 等笪! 可 vp f + o ;1 f ( 豆o - ) 中厶= 击。通过如上算法,迭代多次直到误差矩阵小到要求的程度,此时的 口p b 就是r p c a 方法得到的子空间。 3 2r p c a 用于人脸图像重构实验 由于运用r p c a 提取的主子空问比p c a 提取的主子空间更优,所以每一个人脸图 像在该子空间上投影得到的投影向量也能够更加准确的表示该人脸图像在该子空间的 位置坐标,本文实验是利用该投影向量重构人脸图像。因为选择了空阃中的一部分能量 ( 9 0 以上) ,我们忽略了一部分的图像信息,所以重构的图像丢失了一部分信息。为 了证明r p c a 比p c a 的优越性,我们在o r l 人脸库上进行了实验,随机选择4 0 0 幅中 的图像进行实验,我们求出重构的人脸图像与原始人脸图像的差别,通过实验我们统计 出每一次的误差对比( 表3 - 1 ) ,同时我们给出其中一些的重构图像对比图( 图3 1 ) 。 表3 一lr p c a 和p c a 人脸图像重建误差对比 t a b3 i t h ee r r o rc o m p a r i s o n o f f a c e i m a g er e c o n s t r u c t i o n b g i w e e l l p e aa n d i c a o r 唑! ! ! 竺3 9 ei m a g e f o r p c j o r i o i n a li m a q e f 习 巴习 ”:。囊。 l , ii 淘 k 量一 a )( b ) 图3 - 1r p c a 方法和p c a 方法重构图像对比 f i g 3 1i m a g e sr e c o n s t r u c t e d b y t h e p c a a n d r p c a 第三章基于b o x - c o x 变换的特征提取研究 3 3 基于b o x - c o x 变换的特征提取研究与实验 由于b o x c o x 变换在小样本数据上的正态化作用,使得数据在一定程度上更加集中 在均值附近的一段较小区域,因此某种程度上缩小了类内距离,加大了类别间的距离; 并且进一步促进了特征提取得到子空间的辨别能力,即从一定程度上讲,b o x - c o x 变换 能更进一步的改进传统特征提取算法。为此我们分别在o r l 人脸库上对p c a 、l d a 和 r p c a 进行了实验,在b o x c o x 变换理论上进行了比较。 3 3 1 p c a 与p c a + b o x - c o x 变换的人脸识别实验 本实验中,我们在o r l 人脸库上采用p c a 方法,分别对有无b o x c o x 变换进行人 脸识别;首先取每一个人的8 幅图像用于训练,剩下的2 幅用于测试,然后分别对于取 不同特征向量数进行实验对比,识别率效果图如图3 2 。 图3 - 2p c a 与p c a + b o x - c o x 变换实验效果对比图 f i g 3 - 2i m a g e o fr e c o g n i t i o nr a t e sb yp c aa n dt h ep c ab a s e db o x - c o xt r a n s f o r m a t i o n 通过图3 2 可以看出,经过b o x c o x 变换以后,传统p c a 方法的人脸识别率有了 大幅的提高,特别是在子空间维数较小的情况下,能达到相当高的识别率;而要达到如 图3 2 中p c a + b o x c o x 变换在7 个特征向量的识别率,对于本实验中p c a 来说,是不 可能达到,经过多次实验,对于p c a 方法,在特征向量数取到6 0 以上的时候,识别率 才稳定在8 8 7 5 。 3 3 2 p c a + l d a 与p c a + l d a + b o x - c o x 变换的人脸识别实验 在l d a 的问题上,通常会遇到样本类内离散度矩阵奇异的问题,即小样本问题, 存在这个问题的原因是训练样本的个数往往远小于图像的像素个数。解决这个问题的办 法之一是用p c a + l d a 的思想,即首先用p c a 方法将高维空间的样本投影到低维空间 从而避免类内离散度矩阵奇异的问题。在本文的该实验中就是采用这个方法,其中为了 方便比较实验的效果,我们固定l d a 中取特征向量的个数,然后至对应不同的p c a 特 江南大学硕士学位论文 征向量数进行试验比对。实验效果如图3 3 。 图3 - 3p c a + l d a 与p c a + l d a + b o x - c o x 变换实验效果对比图 f i g 3 3i m a g eo f r e c o g n i t i o nr a t e sb yp c a + l d a a n dt h ep c a + l d ab a s e db o x - c o xt r a n s f o r m a t i o n 如p c a
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年宜昌辅警招聘考试题库及一套完整答案详解
- 2025年福建省永安市一中高二生物第一学期期末学业质量监测试题含解析
- 河北地质大学华信学院《三字基础》2024-2025学年第一学期期末试卷
- 2026届广西柳州市名校高二上化学期末统考模拟试题含解析
- 贵阳信息科技学院《可再生能源及其发电技术》2024-2025学年第一学期期末试卷
- 2026届河北省邢台市桥东区邢台二中高二上数学期末复习检测模拟试题含解析
- 湖南省五市十校2025-2026学年高二物理第一学期期末学业水平测试试题含解析
- 石家庄工程职业学院《海洋生物技术》2024-2025学年第一学期期末试卷
- 长春东方职业学院《通信工程专业英语》2024-2025学年第一学期期末试卷
- 中国水产专用饲料项目投资可行性研究报告
- GB/T 17772-2018土方机械保护结构的实验室鉴定挠曲极限量的规定
- GA 836-2009建设工程消防验收评定规则
- FZ/T 13012-2014普梳涤与棉混纺本色布
- 果蔬的采后生理和生物技术专家讲座
- 复杂网络-课件
- 低应变检测教学课件
- 渣土运输服务保障方案
- 公交车安全行车知识课件
- 泛水应急预案演练脚本
- 120型试验台说明书
- 广东珠海高栏港经济开发区
评论
0/150
提交评论