




已阅读5页,还剩47页未读, 继续免费阅读
(计算机应用技术专业论文)基于核技术的人脸识别应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
题名:基于核技术的人脸识别应用研究 硕士研究生姓名:吕冰 导师姓名:王士同 专业名称:计算机应用技术 摘要 人脸识别是当前计算机模式识别领域中的一个非常活跃的研究课题,在法律、商业 等领域具有广泛的应用前景。如何有效的从人脸图像中提取使之区别于其他个体的特 征,是人脸识别研究的一个关键问题。在众多的特征提取技术中,线性子空间分析因其 计算简单、有效等特性取得了巨大的成功。但线性人脸识别中存在两个突出问题:1 、 在光照、表情、姿态变化较大时,人脸图像分类是复杂的、非线性的;2 、小样本问题, 即当训练样本数量小于样本特征空间维数时,导致类内散布矩阵奇异。对于前一个问题, 可以引入当今流行的核技术提取人脸图像样本的非线性特征;对于后一个问题,目前的 解决方法有两类:l 、基于算法的方法。即从算法本身入手,通过发展直接针对于小样 本问题的算法来解决问题。2 基于变换的方法。即在采用线性鉴别分析之前,通过事先 给定的线性变换来达到降低图象向量的维数从而消除类内散布矩阵奇异性的目的。针对 以上问题,本文工作内容如下: l 整理总结了国内外学术界关于统计学习理论中核方法的研究成果,对核方法的基 本理论构架进行了较为深入的研究,并将其应用到人脸识别中。 2 提出了一种基于算法的结合核技术的解决人脸识别小样本问题的特征抽取方法 k 1 p m d a 。通过建立新的最优判别准则和引入扰动参数,避开了对类内散布矩阵的逆矩阵 的求解,进而解决小样本问题。 。 3 提出了一种基于变换的结合核技术与正交化技术的解决人脸识别小样本问题的特 征抽取方法k i o f d 。通过反转f i s h e r 判别准则,事先降维消除类间散布矩阵奇异性,并 结合正交化技术和核技术,解决小样本问题。 关键词:人脸识别,特征提取,小样本问题,核方法,正交化 江南大学硕士学位论文 a b s t r a c t t i t l e :a r e s e a r c ho i lk e r n e l - b a s e df a c er e c o g n i t i o n a p p l i c a t i o n s g r a d u a t es t u d e n t :l vb i n g g r a d u a t et e a c h e r :w a n gs h i t o n g s p e c i a l t y :c o m p u t e r a p p l i c a t i o na n dt e c h n o l o g y f a c er e c o g n i t i o nc o n t i n u e st ob eah o tt o p i ci np a t t e r nr e c o g n i t i o nf i e l dd u et oi t sw i d e r a n g eo fa p p l i c a t i o n ss u c ha sc o m m e r c i a la n dl a we n f o r c e m e n ta p p l i c a t i o n s a c r i t i c a li s s u et o as u c c e s s f u la p p r o a c hf o rf a c er e c o g n i t i o nj sh o wt oe x t r a c td i s c d m i n a n tf e a t u r ef r o mt h e f a c i a li m a g e s m a n yf e a l u l 屯e x t r a c t i o nm e t h o d sh a v eb e e np r o p o s e da n da m o n gt h e mt h e l i n c a s u b s p a c ea n a l y s i s h a sr e c e i v e de x t e n s i v ea t t e n t i o n o w i n gt o i t ss i m p l e n e s sa n d e f f i c i e n c y b u tt h e r ea r et w op r o b l e m sj nl i n e a rf a c er e c o g n i t i o n :1 飞cf i r s to n ei st h a tt h e d i s t r i b u t i o no ff a c ei m a g e sw i t hd i f f e r e n tp o s e ,i l l u m i n a t i o na n df a c ee x p r e s s i o ni sc o m p l e x a n dn o n l h l e a r t h es e c o n do n ei st h es m a l ls a m p l es i z e 俗3 ) p r o b l e m t h i sp r o b l e mo c c u i s w h e nt h en u m b e ro ft r a i n i n gs a m p l e si ss m a l l e rt h a nt h ed i m e n s i o n a l i t yo ff e a t u r c v e c t o r , w h i c hr e s u l t si nas i g u l a rw i t h i n - c l a s ss c a t t e rm a t r i x f o rt h ef o r m e r , k e r n e lt e c h n i q u e 啪b eu s e dt oe x t r a c tn o n l i n e a rf e a m r e ,a n d f o rt h el a t t e r , t h e r ea r ct w ok i n d so f s o l u t i o n s :a l g n f i t h mb a s e dm e t h o d sa n dt r a n s f o r mb a s e do n e s t 1 l ef o r m e ro n e se x p l o i tn e w a l g o r i t h ma i m i n ga ts 3a n dt h el a t t e ro n e sa p p l yd i m e n s i o nr e d u c t i o nb e f o r ed i s c r i m i n a n t a n a l y s i st oe l i m i n a t es i n g u l a r i t yo ft h ew i t h i n - c l a s ss c a t t e rm a t r i x t h em a i n w o r ko ft h et h e s i s i ss u m m a r i z e d 勰f o l l o w s : 1r c o r g a n i z e da n ds u m m a r i z e dt h ed o m e s t i ca n df o r e i g na c a d e m i cc i r c l e sa b o u tt h er e s e a r c h r e s u i t so ft h ek e m e lm e t h o d si ns t a t i s t i c a ll e a r n i n gt h e o r y , d e e p l yr e s e a r c h e do nt h eh a s i c t h e o r yo ft h ek e r n e la n da p p l i e di tt of a c er e c o g n i t i o n 2p r o p o s e daa l g o r i t h mb a s e dm e t h o dt os o l v es 3 n a m l yk e m e l lm a c h i n e - b a s e d o n e p a r a m e t e rm u l t i p l ed i s c r i m i n a n ta n a l y s i sf k l p m d a ) t h i sa p p r o a c ha v o i dc a l c u l a t e i n v e r s ew i t h i n - e l a s ss c a t t e rm a t r i xb yb u i l d i n gan e wo p t i m i z a t i o nc r i t e r i aa n di n t r o d u c i n ga d i s t u r b i n gp a r a m e t e r 3p r o p e dat r a n s f o r mb a s e dm e t h o dt os o l v es 3 ,n a m l yk e r n e li n v e r s eo r t h o g o n a l i z e d f i s h e rd i s c r i m i n a n t ( k i o f d ) t 1 l i sa p p r o a c hi n v e r s e dt h ef i s h e ro p t i m i z a t i o nc r i t e r i a , a p p l l e d ad i m e n s i o nr e d u c t i o nm e t h o dt oe x t r a c ti m p o r t a n tc o m p o n e n t sf o rl i n e 缸d i s c r i m i n a n t a n a l y s i sa n dc o m b i n e do r t h o g o n a l i z e dt e c h n i q u e k e yw o r d s :f a c er e c o g n i t i o n ;f e a t u r ee x t r a c t i o n ;s 3 ( s m a l ls a m p l es i z e ) ;k e r n e l ; o r t h o g o n a l i z e d 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 本人为获得江南大学或其它教育机构的学位或证二棒而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名:垃之盈兰嗍嘲年多月7 声 关于论文使用授权的说明 本学位论文作者完全了解江南大学有关保留、使用学位论文的规 定:江南大学有权保留并向国家有关部门或机构送交论文的复印件和 磁盘,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编 入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、 汇编学位论文,并且本人电子文档的内容和纸质论文的内容相一致。 保密的学位论文在解密后也遵守此规定。 签名: 酪z 亟二导师签名: 日期:历, - - 0 7 年罗月何目 第一章绪论 第一章绪论 人脸是人们社会交往中所关注的焦点,它在辨别身份和传递感情方面起着主要的作 用。人类似乎具有“与生俱来”的人脸识别能力。在人的一生当中,能够识别出成千上 万的面孔。即便是分离多年,只要是简单的看一眼,就能很快的辨别出相似的面孔而 且这种能力具有很强的鲁棒性,即便人的发型、面部表情或是年龄有很大的变化,也能 辨认得出来。赋予计算机同样的能力是人类的梦想之一,这就是所谓的“自动人脸识别” ( a u t o m a t i cf a c er e c o g n i t i o n ,简称a f r ) 。 人脸识别是计算机视觉领域中的一个难题,它涉及到图像处理、模式识别、神经网 络、认知科学、心理学和生理学等诸多学科,在过去的十多年中受到研究人员的广泛重 视。人脸识别不同于一般的目标识别,其特殊性表现在以下两个方面: 一方面,人脸识别的类别数目极其庞大,每一个人属于一类,那么仅一个城市的数 据库将是百万数量级的。而人脸图像处在高维的欧式空间,每幅人脸图像的维数都很高, 这使得人脸识别算法的训练时间、估计的参数个数和复杂度都以图像维数的指数形式增 长。同时,每一类的人脸图像数目往往很少,这意味着人脸识别问题属于小样本问题( 样 本的个数远远小于样本的维数) 。虽然统计模式识别研究的是有限样本情况下的机器学 习问题,但对于小样本问题的学习算法,还缺乏相当的理论基础和实际经验。 另一方面,人脸图像通常是远程获取的,图像质量受其成像角度、光照条件等外界 因素的影响较大,这使得同一个人的人脸图像也有较大的差别,而不同人的人脸图像在 一定成像角度和光照条件下,也有较大的相似性。如果定义同一个人的不同图像间的差 异为类内差异,而不同人的图像之间的差异为类间差异,那么在人脸识别中,会出现传 统图像识别中比较少见的类内差异远远大于类间差异的现象,增加了人脸识别的难度。 虽然人类能毫不费力的识别出入脸,但人脸的自动识别却是一个难度极大的课题, 其困难主要来源于: 1 、人脸是由复杂的三维曲面构成的可变形体,很难用精确的数学模型描述; 2 、所有人的脸部结构均高度相似,从统计意义上来讲,属于典型的类内散布大于类 间散布的统计模式识别问题; 3 、人脸图像受到各种成像条件的影响,诸如表情、姿态、尺度、光照和背景等的大 幅度变化等。 迄今为止,人脸识别都是针对特定的目标进行的,统一的、通用的人脸识别方法还 没有。虽然每年都有许多相关的文献发表,并且取得了一定的进展,但效果并不十分令 人满意。诸多因素使得人脸识别成为计算机视觉领域一个富有挑战性的课题。 1 1 人脸识别研究的内容 一般意义下的人脸识别问题可以如下描述:给定一幅静态或者动态的场景图像,利 堑壹查堂堡主兰垡丝苎 用数据库中所存储的人脸图像识别出场景中的一个或多个人。从广义上说,人脸识别研 究的内容包括一下几个方面: 1 人脸检测( f a c ed e t e c t i o n ) :即检测输入的未知图像中是否包含人脸,如果有, 确定出人脸的位置和大小,并将其从图像背景中分割出来,然后在分割出的人脸图像中 确定眼睛、鼻子、嘴巴等特征点的位置。人脸检测的难点在于: ( 1 ) 检测时预先不知道人脸的尺寸大小、位置、方向( 正面还是侧面) 以及姿态角度等 信息; ( 2 ) 人脸表情、光照条件及饰物遮挡等对人脸外观影响较大。 计算机人脸检测技术不仅可以用在计算机人脸识别的前端,而且在基于内容的图像 检索、多模态人机接口、智能监视等方面都有重要的应用价值。计算机人脸检测技术已 作为一个单独的课题开始受到研究人员的广泛关注。 2 人脸表征( f a c er e p r e s e n t a t i o n ) :又称为特征提取。即确定表示检测出的人脸 和数据库中的已知人脸的描述方式。也就是利用特征向量来表示人脸图像,给人脸图像 降维。一般的表示方法包括几何特征( 入欧式距离、曲率、角度) 、代数特征( 如矩阵特 征关量) 、统计特征( 如特征脸、f i s h e r 脸) 等以及小波特征等。 通常情况下,由于获取的人脸图像和人脸图像库中的标准人脸图像相比,有位置、 尺度、姿态和光照上的变化。故通常都要在特征提取之前对获得的人脸图像进行预处理, 如几何校正、灰度归一化及光照补偿等,使得图像中人脸的位置变化、尺度变化、姿态 变化和光照变化等标准化,然后再进行后续的特征提取。而此过程的成功与否会对计算 机人脸识别系统的性能产生重大影响。 特征提取和后面得识别紧密相关,有效得特征向量将有助于分类、同时也可以降低 数据库得存储量。 3 人脸识别( f a c er e c o g n i t i o n ) :即特征匹配。主要是设计分类器,将待识别的人 脸图像或特征向量与数据库中预先存储的人脸图像或特征向量进行匹配,得出判别信 息从基本上来说,这一部分通常分为两个方面:身份认证和身份识别。身份认证是确 定用户的身份,即确定输入图像是否为数据库中给定的图像,回答“是不是谁? ”的闯 题,是一个两类的分类问题;而身份识别是确定输入图像为数据库中的哪一个人,回答 “是谁? ”的问题,是一个多类的分类问题。通常情况下,身份识别要比身份认证困难 的多。人脸识别这一部分的核心是分类器的设计,也就是模式匹配。 4 表情分析( f a c i a le x p r e s s i o na n a l y s i s ) :即对待识别的人脸的表情( 喜怒哀乐) 进行分析,并对其进行分类。 5 生理分类( p h y s i c a lc l a s s i f i c a t i o n ) :即对待识别的人脸的物理特征进行分析, 主要包括年龄的大致范围、性别、种族等相关信息。 到目前为止,大部分的研究工作主要集中在人脸的检测与定位、特征提取以及分类 识别这几个部分,而且很多问题尚待解决,表情分析和生理分类的研究现在还处于起步 阶段,相对比较少( 不过,近年来表情分析越来越多的受到研究人员的重视) 。因此,通 常所说的人脸识别系统。包含人脸检测与定位,特征提取、分类识别这几个部分,不包 2 第一章绪论 括表情分析和生理分类这两部分。如果1 1 所示: 图1 1 人脸识别系统流程图 人脸识别过程的核心是选择适当的人脸的表征方式( 即特征提取) 和匹配策略( 即设 计分类器) 。由于两者联系紧密,一些研究人员将两者统称为人脸识别,而将前一部分 的人脸检测与定位统称为人脸检测。这样两个环节的研究独立性就很强,如图1 2 所示: 图1 2 简化的人脸识别系统流程图 1 2 人脸识别研究的方法综述 目前,对计算机人脸识别技术的研究主要有两大方向:基于整体特征的研究方法和 基于部件特征的研究方法。 1 2 1 基于整体特征的人脸识别方法 基于整体特征的研究方法考虑模式的整体属性,包括特征脸( e i g e n f a c e ) 方法“1 、s v l ) 分解方法嘲、人脸等密度线分析匹配方法啪、弹性图匹配( e l a s t i cg r a p h m a t c h i n g ) 方 法、隐马尔可夫模型( h i d d e nm a r c o vm o d e l ) 方法嘲以及神经网络方法溉”。下面简单介 绍几种: 1 特征脸法 特征脸方法( e i g e n f a c e ) 是人脸识别中最流行的方法之一“它是从主成分分析 垩塑查兰堡主兰竺丝苎 ( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a ) 导出的一种人脸识别和描述技术。p c a 实质上是 k l 展开的网络递推实现,k - l 变换是图像压缩中的一种最优正交变换,其生成矩阵一 般为训练样本的总体散布矩阵。特征脸方法就是将包含人脸的图像区域看作是一种随机 向量,因此可以采用k - l 变换获得其正交k - l 基底。对应其中较大特征值的基底具有与 人脸相似的形状,故将其成为特征脸。利用这些基底的线性组合可以描述、表达和逼近 人脸图像,因此可以进行人脸识别和合成。识别过程就是将人脸图像映射到由特征脸张 成的子空间上,比较其与已知人脸在特征空间中的位置。 在传统特征脸方法的基础上,研究者注意到特征值大的特征向量( 即特征脸) 并不一 定是分类性能最好的方向,而且对k - l 变换而言,外在因素带来的图像差异和人脸本身 带来的差异是无法区别的,特征脸在很大程度上反映了光照等因素的差异。实验表明, 特征脸方法随着光照、角度和人脸尺寸等因素的引入,识别率急剧下降,因此特征脸方 法还存在着理论上的缺陷。近年来,据此发展了多种对特征脸的改进方法,其中较著名 的是f i s h e r 脸方法( f i s h e r f a c e ) “ f i s h e r 脸方法又称为线性判别分析方法( l i n e a rd i s c r i m i n a n ta n a l y s i s ,l d a ) ,它 使得不同类别样本之间的距离尽可能的增大,而同一类样本之间的距离尽可能的缩小。 b e l h u m e u r 利用1 6 个人的1 6 0 幅人脸图像( 每人1 0 幅,具备不同的光照和表情) 做实验, 特征脸法的识别率为8 1 ,而f i s h e r f a c e 法的识别率达到了9 9 “,显然f i s h e r f a c e 方法有了很大的改进,对人脸的姿态、面部表情及光照变化的鲁棒性有了很大的提高。 与特征脸方法相似的另一种方法是奇异值分解( s v d ) 的方法嘲。即将图像矩阵的奇异 值作为模式的特征矢量。人脸图像的奇异值具有良好的稳定性,当图像上有小的扰动时, 奇异值变化不大。在某种程度上,s v d 特征同时拥有代数与几何两方面的不变性,即对 图像灰度值的比例变化、平移、旋转和伸缩不变性。 2 隐马尔可夫模型法 隐马尔可夫模型( h i d d e nm a r k o vm o d e l ,舢) 嘲是用于描述信号统计特性的一组统计 模型。删使用马尔可夫链来模拟信号统计特性的变化,而这种变化又是间接地通过观 察序列来描述的,因此,隐马尔可夫过程是一个双重的随机过程。在h m m 中,节点表示 状态,有向边表示状态之间的转移,一个状态可以具有特征空间中的任意特征,对同一 特征,不同状态表现出这一特征的概率不同。由于h m m 是一个统计模型,对于同一特 征序列,可能会对应于许多状态序列,特征序列与状态序列之间的对应关系是非确定的。 这种模型对于状态序列来说是隐的,故称为隐马尔可夫模型。 h m m 有三个主要问题:评估、估计及解码。我们关心的是前两个问题。评估用于解 决识别问题,一般采取比较有效的“向前向后”法;估计用来产生用于识别的各个单元 的h 删,采取b a u m - w e l c h 方法。 3 神经网络法 神经网络在人脸识别应用中有很长的历史。早期用于人脸识别的神经网络主要是 k o h o n e n 自联想映射神经网络,主要用于人脸的“回忆”所谓“回忆”是指当输入图 像上的人脸受噪声污染严重或者部分缺损时,能用k o h o n e n 网络恢复出原来完整的人脸。 4 墨二兰丝堕 c c t t r e l l 等人蜘使用级联b p 神经网络进行人脸识别,它对部分受损的人像、光照有所 变化的人像的个人识别能力较好。i n t r a t o r 等人“”用一个无监督监督( b c m b p ) 混合神 经网络进行人脸识别。其输入是原始图像的梯度图像,以此可以去处光照的变化。无监 督学习的目的是寻找类的特征,有监督学习的目的是减少训练样本被错分的比例。这种 网络比用b p 网络提取的特征更明显,所以识别率更高。l a l r r a n c e 和g i l e s 等人1 用一 个自组织特征映射( s o m ) 神经网络与卷积神经网络结合的系统对一个有4 0 0 幅人脸图像, 人均1 0 幅的数据库进行了人脸识别研究。其中s 伽网络的作用是将图像样本量化到降 维的拓扑空间,它使原空间中相邻的输入点在输出空间中仍相邻。卷积网络用于实现相 邻象素之间的相关性只是,从而在一定程度上实现了图像平移、旋转、尺度和局部变形 的不变性。 神经网络方法的特点是不像其它方法那样要用一套由入确定的学习规则,同时避免 了复杂的特征提取工作,它能根据有代表性的样本自我学习,具有很好的自适应性和鲁 棒性。此外,神经网络以并行的方式处理信息,如果用硬件来实现,就能显著地提高速 度。 1 2 2 基于部件特征的人脸识别方法 基于部件特征的研究方法将人脸基准点的相对比率和其他描述人脸部件特征的形状 参数或类别参数等一起构成识别特征矢量。由于通常眼睛的形状模型为椭圆,嘴巴的形 状模型为抛物线“”,因此可以将椭圆和抛物线的参数作为表述人脸的特征。由于眉毛和 脸的形状具有任意性,因此可以采用s n a k e 动态曲线来逼近这些器官的形状“”,如脸 颊采用折线模型,下巴采用抛物线模型。虽然人脸是刚体,可实际图像中,部件轮廓未 必分明,同时人脸模式本身还存在表情变化和少许遮掩等,这使得提取这些形状参数较 为困难。另外,利用抛物线、椭圆或者直线作为模型也不能对人脸部件进行很好的描述, 使得描述同一人脸模式的模型参数往往差别很大,从而失去识别意义。这也是基于部件 特征的人脸识别方法近年来日受冷落的原因。 基于整体特征的人脸识别方法不仅保留了人脸部件之间的拓扑关系,而且也保留了 各部件本身的信息,而基于部件特征的人脸识别方法则是通过提取出局部轮廓信息及灰 度信息来设计具体识别算法。有研究“”表明:基于整体特征的人脸识别方法要优于基于 部件特征的人脸识别方法。 1 2 3 计算机人脸识别算法的性能评价指标 常用的人脸识别图像库以美国军方的f e r e t 库最为权威,它包括多人种、多年龄段、 各种表情变化、光照变化、姿态变化的图像,图像的数量和实验人数也非常多,可以充 分地验证人脸识别算法。另外如h i t 、o r l 等人脸图像库也可以用来验证算法在某些方 面的能力。目前尚没有专门测试人脸检测和定位算法的图像库。 人脸识别技术是一项实用技术,因此评价各种人脸识别算法的优劣也要从实用角度 5 坚堕查堂堡圭兰焦丝苎 出发。首先,由于人脸识别是一种分类技术,因此识别率是衡量人脸识别算法的首要性 能指标。其次,实时性也是衡量人脸识别算法的关键指标,它决定一种算法是否能够被 应用到实践。另外,人脸识别算法对存储空间的要求,也是考察算法识别性能的一个重 要指标之一 1 识别率 识别率是指正确识别的测试人脸图像数占人脸图像总数的百分比。 一般来讲,为了平衡训练样本的不同组合所产生的鉴别矢量对识别率的影响,通常 的做法是采用“验证”法( v a l i d a t i o n ) o ”,随机地把标记好的训练样本集分成两个部分: 其一作为常规的训练集,以调整算法中的参数;其二作为所谓的“验证集”( v a l i d a t i o n s e t ) ,用于评价推广误差。如果某种识别算法对新的测试样本,能够有令人满意的分类 效果,那么即使它对训练样本的分类性能不够好,也应该接受它。d 一重交叉验证( d - f o l d c r o s sv a l i d a t i o n ) 是验证法的经典算法,训练集被随机划分为d 个不相交的子集,每 个子集有n d 个样本点,其中n 是样本集中的样本总数。分类器要训练d 次,每次都 留出d 组中的一组作为验证集。估计出的推广误差是d 个误差的平均值。当d :n 时, 就是留一法( l e a v eo n eo u t ) 。由于d 一重交叉验证法和留一法的运算量较大,我们选择 d :2 ,随机抽取一定数量的样本作为训练样本,其余样本作为测试样本,而识别率是多 次重复实验的平均值。另外,从多次重复实验得到的识别率的标准差中,还可以评价算 法对不同样本组合识别的稳定性。 2 识别时间 由于人脸识别技术最终要应用到实际当中去,因此识别时间是人脸识别技术的一个 重要性能指标。人脸识别系统的计算时间主要有两方面的时间:一是训练阶段,人脸识 别系统产生鉴别矢量集所需要的时间;另一个是分类识别阶段,人脸识别系统将测试样 本投影到鉴别矢量集张成的低维子空间,得到投影系数的时间,和根据分类决策确定测 试样本类别所需的时间。通常情况下,由于人脸识别系统的训练为离线训练,训练时间 相对来讲不是特别重要,但分类识别所需的时间却相当重要,它标志着人脸识别系统是 否具有实时性,对人脸识别系统是否可以应用于实践起决定性的作用。 3 数据存储量 在人脸识别系统中,人脸特征库的存储也是一个必须考虑的闯题,否则将会给整个 系统造成太大的负担。决定人脸识别算法对存储空间需求的主要因素是人脸投影特征矩 阵的维数。 1 3 国内外研究现状及发展趋势 早在二十世纪六十年代,国外就有对计算机人脸识别算法的研究。到了二十世纪八 十年代,随着计算机技术的进一步发展以及各种安全领域的实际需求,计算机人脸识别 技术得到了科研人员的普遍重视,对其的研究已经成为模式识别领域的热点。 目前国外对人脸识别的研究已经有了较大的突破。针对现有的人脸识别系统识别率 6 苎二兰竺堡 易受人脸图像的光线变化和人脸图像的姿态变化影响这个问题,提出了3 d 模型的重建 算法。基于3 d 模型的人脸识别算法能够从人脸图像中提取人脸的3 d 模型,并根据重 建的人脸3 d 模型判断人脸图像的类别。由于人脸的3 d 模型并不受光线和姿态变化的 影响,在很大程度上提高了现有识别系统的识别率。因此国外对人脸识别的研究,其中 一个主流方向就集中在对人脸3 d 模型重建的研究上。 国内对于计算机人脸识别技术的研究始于九十年代初期。初期的研究大多是以p c a 变换和神经网络为基础展开的,实验结果并不理想。在国内,比较成功的人脸识别算法 是南京理工大学开展的,基于f i s h e r 准则的最佳鉴别矢量集算法。多年来,他们从用 伪逆矩阵代替逆矩阵、在类内散布矩阵中添加奇异值扰动到讨论类内散布矩阵的求解空 间,不断给出最佳鉴别矢量集的求解算法。在k e r n e l 的概念提出以后,他们又将相应 的算法扩展到高维的核特征空间。中科院自动化所的研究方向与南京理工大学相似,通 过对散布矩阵解空间的讨论,得出基于f i s h e r 准则的最佳鉴别矢量集,也取得了令人 瞩目的成绩。同时,复旦大学也给出了利用独立主元分析算法进行人脸识别的实验结果。 微软研究院最近提出了关于人脸识别的新算法,主要是围绕非负矩阵分解( n i i f ) 和局部 保持映射( l p p ) 算法展开的。同时,中科院自动化所和上海复旦大学等一些研究机构、 大学也都开展了人脸3 d 模型重建的研究工作。以上这些算法都极大地推动了国内计算 机人脸识别技术的发展。 由于计算机人脸识别技术不仅可广泛应用于反恐、惩治犯罪、保证公共安全等关系 到国家安全的众多领域,而且在金融服务、i t 产业、小区安保等诸多民生领域及其延伸 产业都具有极大的推广价值。因此对计算机人脸识别技术的研究,不仅有重要的实用价 值,而且对于相关领域理论的研究也有重要的推动作用。因此,对计算机人脸识别的理 论和算法的研究还有待于进一步加强。 1 4 国内外主要公共人脸图像数据库 人脸数据库对算法的研究与开发、模型训练、算法测试比较是不可或缺的。尤其是 在统计学习占主导地位的今天,模型训练所采用的人脸库的人数规模、覆盖的成像条件 变化在很大程度上影响着算法的精度和鲁棒性能;而算法性能测试所用到的人脸库的规 模和属性同样决定了评测的合理性和测试结果的有效性。下面简单介绍人脸识别领域经 常被采用的人脸图像数据库的情况“”。 f e r e t 人脸数据库 由f e r e t 项目创建,包含1 4 ,0 5 1 幅多姿态、不同光照条件的灰度人脸图像,并严 格划分了训练集合、g a l l e r y 、不同的测试集合等,是人脸识别领域应用最广泛的人脸 数据库之一,参见: h t t p : | 恻。i t l n i s t g o v i a d h u m a n i d f e r e t f e r e t _ m a s t e r h t m l 夺p i e 人脸数据库 由美国卡耐基梅隆大学创建,包含6 8 位志愿者的4 l ,3 6 8 张多姿态、光照和表情的 坚堕查竺堡主堂丝堡苎 面部图像。其中的姿态和光照变化图像也是在严格控制的条件下采集的。详情参见: h t t p : i 嗣r i c m u e d u p r o j e c t s p r o j e c t _ 4 1 8 h t m l b a n c a 人脸库 该人脸库是欧洲b a n c a 项目资助创建的,包含2 0 8 人的多模态生物特征,覆盖了不 同图像质量、不同时间段等变化条件。该人脸库划分了不同的训练、测试条件。详情参 见:h t t p :w w w e e s u r r e y u k r e s e a r c h v s s p b a n c a c a s p e a l 人脸数据库 该人脸库包含了1 。0 4 0 名中国人共9 9 ,4 5 0 幅头肩部图像。所有图像在专门的采集 环境中采集,涵盖了姿态、表情、饰物和光照四种主要变化条件,部分人脸图像具有背 景、距离和时间跨度的变化。该人脸库的介绍网址为z h t t p :| f 删j d l a e e n r 、e a l i n d e x h t m l a r 人脸库 该人脸库是由西班牙巴塞罗那计算机视觉中心于1 9 9 8 年创建的,包括1 1 6 人不同 光照、表情、遮挡和老化的人脸图像共3 2 8 8 幅。该人脸库的介绍网址为: h t t p :r v l l e c n p u r d u e e d u “a l e i x a l e i x _ f a c e _ d b h t m l o r l 人脸数据库 由剑桥大学a t & t 实验室创建,包含4 0 人共4 0 0 张面部图像,部分志愿者的图像 包括了姿态、表情和面部饰物的变化。该人脸库在人脸识别研究的早期经常被人们采用, 但由于变化模式较少,多数系统的识别率均可以达到9 0 以上。 夺x m 2 v t s 多模态生物特征数据库 该数据库包括2 9 5 人在4 个月时间内4 次录制的人脸和语音数据。每次采集都包 括2 个头部旋转视频片断和6 种不同语音视频片断。另外,其中2 9 3 人的3 d 模型也 是可以得到的。 夺m i t 人脸数据库 由麻省理工大学媒体实验室创建,包含1 6 位志愿者的2 ,5 9 2 张不同姿态、光照和 大小的面部图像。 y a l e 人脸数据库 由耶鲁大学计算视觉与控制中心创建,包含1 5 位志愿者的1 6 5 张图片,包含光照、 表情和姿态的变化。 y a l e 人脸数据库 包含了1 0 个人的5 ,8 5 0 幅多姿态、多光照的图像。其中的姿态和光照变化的图像都是 在严格控制的条件下采集的,主要用于光照和姿态问题的建模与分析 夺k f 陷人脸图像库 该人脸库包含1 0 0 0 名韩国人的共5 2 ,0 0 0 幅图像,涵盖7 种不同姿态、1 6 种不同 光照条件和5 种表情变化。 8 第一章绪论 1 5 论文的研究目标及组织结构 1 5 1 论文研究目标 现阶段,人脸识别的各种算法的检验大都是在经过了预处理的标准人脸库上进行测 试的。同时人脸识别中分类器设计方面研究较多,比较成熟。大多新算法都是将重点放 在人脸图像的特征提取部分。因此,本文的研究重点也是集中在特征提取部分,分类部 分采用简单但亦能说明问题的最近临分类器。 在基于整体特征的人脸识别方法中,基于线性鉴别分析的子空间人脸识别方法受到 了广泛关注,取得了优秀的成果。但线性人脸识别存在两个突出的问题: 1 对于人脸的光照、表情、姿态变化较大的非线性情况下,在光照、表情、姿态变 化较大时,人脸图像分类是复杂的、非线性的,线性方法效果并不理想。随着支持向量 机( s ) “”在模式识别领域的广泛应用,特别是s v m 中的核技术“埘的引入,使得抽取 样本的非线性特征成为可能,对线性方法做了很好的推广。因此,本文考虑使用核技术 来抽取人脸图像的非线性特征; 2 小样本问题( s m a l ls a m p l es i z e ,s 3 或s s s ) 。即在可获得的训练样本数小于样本 的特征维数情况下,导致样本的类内散布矩阵奇异。从而导致一些算法无法继续。人脸 识别是典型的小样本闯题。这是因为待识别的图像向量的维数一般较高,而在实际问题 中难以找到或根本不可能找到足够多的训练样本来保证类内散布矩阵的可逆性。因此, 在小样本情况下,如何抽取最佳鉴别特征成为一个公认的难题“州近几年来关于小样 本情况下线性鉴别分析方法的研究激起了人们广泛兴趣,不少解决该类问题的方法相继 提出。概括起来,可分为两类口1 : ( 1 ) 基于算法( a l g o r i t h mb a s e d ) 的方法。即从算法本身入手,通过发展直接针对于 小样本问题的算法来解决问题。如h o n g 等提出的扰动法1 ,l i u 等提出的正交补空间法 嘲,y u 等提出的直接线性鉴别分析法( d i r e c tl d a ) 等。本文第三章的k 1 p m d a 算法将通 过建立新的最优判别准则和引入扰动参数,避开对类内散布矩阵的逆矩阵的求解,进而 解决小样本问题。 ( 2 ) 基于变换( t r a n s f o r mb a s e d ) 的方法。即在采用线性鉴别分析之前,通过事先给 定的线性变换来达到降低图像向量的维数从而消除类内散布矩阵奇异性的目的。如 b e l h u m e u r 等提出的f i s h e r f a c e s 方法哪,l i u 等提出的增强f i s h e r 线性鉴别模型法 ( e n h a n c e df i s h e rl i n e a rd i s c r i m i n a n tm o d e l s ,e f 岫咖。本文第四章的k i o f d 算法通 过反转f i s h e r 判别准则,事先降维消除类间散布矩阵奇异性,并结合正交化技术和核 技术,解决小样本问题。 综上,本文的研究目标如下: 1 使用核技术抽取人脸图像的非线性特征; 2 解决人脸识别的小样本问题。分别提出了基于算法的k 1 p m d a 方法和基于变换的 k 1 0 f d 方法。 9 江南大学硕士学位论文 1 5 2 论文组织结构 本论文各章的组织结构如下: 本文由5 章组成,各章的主要内容安排如下; 第一章为绪论,主要介绍了人脸识别的研究内容,主流的研究方法,国内外的研究 现状及发展趋势,国内外主要的公共人脸图像数据库最后给出了本文研究的主要问题 及主要贡献。 第二章为特征提取与核方法。第2 1 节介绍特征提取含义、准则和主要方法。重点 介绍了两种常用的特征提取方法主成分分析p c a 和线性鉴别分析l d a ;第2 2 节介绍核 方法的基本思想、正定核、常用核函数及正定核的构造。第2 3 节介绍基于核的特征提 取,核主成分分析k p c a 和核f - s 鉴别分析l 【f s d a 。 第三章介绍了本文提出的基于核的1 参数多元区别分析算法( k 1 p 岫a ) 的人脸识别 方法。该方法使用核技术抽取人脸图像的非线性特征,通过建立新的最优判别准则和引 入扰动参数,避开对类内散布矩阵的逆矩阵的求解,进而解决小样本问题。 第四章介绍了本文提出的基于核的反转脸正交化f i s h e r 鉴别分析算法( k i o f d ) 的 人脸识别方法。该方法使用核技术和正交化技术抽取人脸图像的非线性特征,通过反转 f i s h e r 判别准则,事先降维消除类间散布矩阵奇异性,解决小样本问题。 第五章为总结与展望。在这一章里,主要是对进行了本文回顾总结,并对以后的工 作和方向进行了展望。 1 0 第二章特征提取与核方法 2 1 特征提取 第二章特征提取与核方法 我们通常是对现实世界的对象进行测量,得到对象的一些特征来表示对象,然后利 用得到的特征进行分类识别等应用。例如,通过摄像机可以把一个物体转换为一个二维 灰度矩阵,即物体的图像。以便和对象本身区别。 但原始测量得到的特征数量可能很大,或者说样本是处于一个高维空间中,不利于 分类识别。通过映射( 或变换) 的方法可以用低维空间来表示样本,这个过程就叫做特征 提取嘲。即在广义上若z 是测量空间,y 是特征空间,则变换a :膏一y 就叫做特征提 取器。这个映射可以是线性的也可以是非线性的,从而相应的构成了线性特征提取和非 线性特征提取。 特征提取的算法很多,大多数算法都是面对问题的。目前,通过极值化事先定义的 准则函数,缈) 以及在某种约束s 下,寻找一个有利于分类的投影矩阵 形( w - ( m ,) ) ,其中m 均为有利于分类的判别方向, 形也被成为鉴别矢量集) 作为映射提取变换域特征的算法已经成为模式识别各个领域的热点算法。有两种经典的 寻找线性变换的方法,其一是主成分分析( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a ) “1 ,这 一方法的目的是寻找在最小均方差意义下最能代表原始数据的投影方法。另一种方法为 基于f i s h e r 准则的线性鉴别分析( l i n e a rd i s c r i m i n a n ta n a l y s i s ,l d a ) “”其目的是 以样本的可分性为目标,寻找在均方差意义下最能够分开各类的投影方法。下面分别对 这两种方法进行介绍。 2 1 1 主成分分析( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a ) 假设原始训练样本五,x :,j 0 是一组一维列矢量( 置e r , i - 1 ,n ) ,则训练样本 集所估计的协方差矩阵为: z 。荟( 五一m 脶一埘) f 其中,册为所有训练样本的均值,即m 。专著n 墨 1 主成分分析p c a 所寻找的缈是使优化函数,( 彤) ( 投影系数y 的方差) 最小的映射, 且优化的约束条件为w - 【m ,屹,】是正交的,即7 形一,这样能够保留模式的重 要特征,用映射后的投影系数y 来重构原始模式工时,误差最小。因此p c a 的优化方程 坚塑查兰堡主兰竺丝苎 为; j 毛。善善l i 墨一w , 谚x , t l - t r ( q 一聊旷q
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工程委托协议书范本
- 2025年压岁钱分配协议合同范文
- 分家协议书怎么写
- 发布会协议书
- http协议书 中文版
- 第二节 中国的气候说课稿初中地理商务星球版2024八年级上册-商务星球版2024
- 调解协议书司法确认
- 第11课 发现同伴闪光点教学设计小学心理健康苏教版四年级-苏科版
- 山东省临沭县第三初级中学七年级信息技术上册《信息的特征》说课稿
- 6《将相和》教学设计-语文五年级上册统编版
- 2025年健康管理师试题及答案
- 2026年中考数学压轴题专项练习-四边形中的新定义问题(学生版+名师详解版)
- 乌兹别克语自学课件
- logo安装施工方案
- 四川能投合江电力有限公司员工招聘考试参考题库及答案解析
- 2025年山西省政府采购评审专家考试真题库(带答案)
- 宿管员业务知识培训内容课件
- 安全生产例会会议记录以及会议内容
- 眼视光技术介绍
- DB64T 2146-2025 工矿企业全员安全生产责任制建设指南
- 间歇充气加压用于静脉血栓栓塞症预防的中国专家共识解读
评论
0/150
提交评论