




已阅读5页,还剩51页未读, 继续免费阅读
(通信与信息系统专业论文)基于可判别平凡向量的人脸识别.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于可判别平凡向量的人脸识别上坶师范大学硕士学位论文 摘要 作为计算机视觉、模式识别和图像处理等领域的研究重点之一,近年来,人 脸识别越来越受到研究人员的广泛关注。与其他生物特征识别方法比较,人脸识 别的优点在于自然、友好、无侵犯性,但是识别的准确率还有待进一步提高。 在人脸识别问题中,样本空间的维数往往大于训练集中的样本数。结果,使 得类内离散度矩阵总是奇异的,所以不能直接使用线性判别分析( l d a ) 方法。 这就是所谓的“小样本”问题。本文提出一种新的人脸识别方法,称作可判别平 凡向量法,它是f i s h e r 线性判别分析在小样本情况下的一种变型,给出了使改进 的f i s h e r 线性判别标准最大化的一个最优解。 本文的研究工作主要包括两个部分:从标准人脸库中划分出训练样本集,用 以提取特征向量,即可判别平凡向量;对测试样本集中待识别的人脸进行分类识 别。为了提取可判别平凡向量,本文给出了两种算法,使训练集中的每类样本对 应于一个可判别平凡向量。第一种算法利用了样本训练集的类内离散度矩阵来得 到可判别平凡向量,另一种算法用子空间法和克莱姆一施密特( g r a m s c h m i d t ) 正变化来得到可判别平凡向量。测试阶段,用可判别平凡向量来进行人脸分类。 这罩,选择目前广泛使用的欧氏距离作为相似性度量,采用最近邻分类法进行判 别。 为了证明本文提出的可判别平凡向量法的有效性,本文利用o r l 标准人脸 数掘库进行了实验。本文证明了对给定的某一个类别,将其每个样本投影到类内 散度矩阵的零空间时,可得到同一个唯一的平凡向量。实验结果表明,可判别平 凡向量方法在识别率、实时性、存储要求和数值稳定性方面都优于其他方法。 关键词:人脸识别,可判别平凡向量,线性判别分析,主元分析,子空间分析方 法,零空间 董垂里型型圣璺璺苎墼叁些堡型圭誊塑型奎兰篓圭耋堡兰圭 a b s t r a c t a so n eo ft h em o s ti m p o r t a n t a p p l i c a t i o n s o fc o m p u t e r v i s i o n ,p a t t e r n r e c o g n i t i o na n di m a g ep r 0 2 e s s i n g , f a c er e c o g n i t i o nh a sr e c e n t l yr e c e i v e dm o r ea n d m o r ee x t e n s i v e a t t e n t i o n c o m p a r e d 埘t l l o t h e rb i o m e t r i c s f a c e r e c o g n i t i o n t e c h n o l o g yi sm o r ea c c e p t a b l eb e c a u s ei ti sm o r en a t u r a l ,f r i e n d l ya n dn o n - i n t r u s i v e , b u tt h ea c c u r a c yo ff a c er e c o g n i t i o ni sn o th i g he n o u g ha tp r e s e n t , i nf a c er e c o g n i t i o nt a s k s ,t h ed i m e n s i o no ft h es a m p l es p a c ei st y p i c a t l yl a r g e r t h a nt h en u m b e ro f t h es a m p l e si nt h et r a i n i n gs e t a sac o n s e q u e n c e ,t h ew i t h i n - c l a s s s c a t t e rm a t r i xi ss i n g u l a ra n dt h el i n e a rd i s c r i m i n a n ta n a l y s i s ( l d a ) m e t h o dc a n n o t b ea p p l i e dd i r e c t l y t h i sp r o b l e mi sk n o w na st h e s m a l ls a m p l es i z e ”p r o b l e m i nt h i s p a p e r , an e wf a c er e c o g n i t i o nm e t h o dc a l l e dt h ed i s c r i m i n a t i v ec o m m o nv e c t o r m e t h o di sp r o p o s e d a sav a r i a t i o no ff i s h e r sl i n e a rd i s c n m i n s n ta n a l y s i sf o rt h e s m a l ls a m p l es i z ec a s e ,t h ep r o p o s e dm e t h o dy i e l d sa no p t i m a ls o l u t i o nf o r m a x i m i z i n gt h em o d i f i e df i s h e r sl i n e a rd i s c r i m i n a n tc r i t e r i o ng i v e ni nt h ep a p e r t h em a i nc o n t r i b u t i o n so f t h i sp a p e ri n c l u d et w op a r t s o n ei sf e a t u r ee x t r a c t i o n t h eo t h e ri sc l a s s i f i c a t i o n f o rt h ef i r s tp a r t ,w ee x t r a c tt h ed i s c r i m i n a t i v ec o m m o n v e c t o r sa sf e a t u r ev e c f o r sf r o mt h et r a i n i n gs e t t w od i f f e r e n ta l g o r i t h m sa r eg i v e nt o e x t r a c tt h e s ev e c t o r sr e p r e s e n t i n ge a c hp e r s o ni nt h et r a i n i n gs e to ft h ef a c ed a t a b a s e o n ea l g o r i t h mu s e st h ew i t h i n - c l a s ss c a r e rm a t r i xo ft h es a m p l e si nt h et r a i n i n gs e t w h i l et h eo t h e ru s e st h es u b s p a c em e t h o d sa n dt h eg r a m - s c h m i d to r t h o g o n a l i z a t i o n p r o c e d u r et oo b r a i nt h ed i s c r i m i n a t i v ec o i n m o nv e c t o r s t h e n ,t h ed i s c r i m i n a t i v e c o m m o nv e c t o r sa r cu s e df o rc l a s s i f i c a t i o no fn e wf a c e s an e a r e s t - n e i g h b o r a l g o r i t h mi se m p l o y e du s i n gt h ee u c l i d e a nd i s t a n c ef o rc l a s s i f i c a t i o n t h eo r lf a c ed a t a b a s ea r eu s e dt ot e s tt h ep r o p o s e dm e t h o d w es h o w e dt h a t e v e r ys a m p l ei nag i v e nc l a s sp r o d u c e st h es a m eu n i q u ec o m m o n v e c t o rw h e nt h e y a r ep r o j e c t e do n t ot h en u l ls p a c eo ft h ew i t h i n c l a s ss c a t t e rm a t r i x e x p e r i m e n t a l r e s u l t ss h o wt h a tt h ed i s c r i m i n a t i v ec o m m o nv e c t o rm e t h o di ss u p e r i o rt oo t h e r m e t h o d si nt e r mo fa c c u r a c y , r e a l - t i m ep e r f o r m a n c e ,s t o r a g er e q u i r e m e n t sa n d n u m e f i c a ls t a b i l i t y k e y w o r d s :f a c er e c o g n i t i o n ,d i s c r i m i n a t i v ec o m m o nv e c t o r ,l i n e a rd i s c r i m i n a n t a n a l y s i s ,p r i n c i p a lc o m p o n e n t a n a l y s i s ,s u b s p a c ea n a l y s i sm e t h o d s ,n u l ls p a c e 2 基于可判别平凡商量的人脸识别上海师范大学硕士学位论文 1 1 人脸识别技术概述 第一章绪论 随着社会的发展,各个方面对快速有效的自动身份验证要求日益迫切。由于 生物特征是人的内在属性,具有很强的自身稳定性和个体差异性,因此,基于人 类生物特征的识别技术具有安全可靠、特征唯一、不易伪造、不可窃取等优点。 与指纹、虹膜、语音等其他人体生物特征相比,人脸识别更加直接、友好,因此 是身份验证的最理想依据。 计算机人脸识别技术也就是利用计算机分析人脸图像,进而从中提取出有效 的识别信息,用来“辨认”身份的一门技术。人脸识别技术应用背景广泛,可用 于公安系统的罪犯身份识别、访问控制、视频会议、档案管理、电子相册、基于 对象的图像和视频检索、银行及海关的监控系统及自动门卫系统等。虽然人类的 人脸识别能力很强,能够记住并辨别上千个不同人脸,可是计算机则困难多了。 其表现在:人脸表情丰富;人脸随年龄增长而变化;人脸所成图像受光照、成像 角度及成像距离等影响;而且从二维图像重建三维人脸是病态过程,目前尚没有 很好的描述人脸的三维模型。另外,人脸识别还涉及到图像处理、计算机视觉、 模式识别以及神经网络等学科,也和人脑的认识程度紧密相关。这诸多因素使得 人脸识别成为一项极富挑战性的课题。 计算机人脸识别技术的研究起始于2 0 世纪6 0 年代末,最早的研究见于文献 ,n 】。该系统通过手动标记人脸特征,是一个半自动的人脸识别系统。早期的人脸 识别方法通常是以人脸器官位置、尺度和彼此间的比率作为描述人脸的特征。以 后还有用简单几何形状巴夕1 对人脸器官进行拟合,以几何参数作为描述人脸的特 征。由于人脸器官和人脸间并没有显著的边缘信息,当人脸表情变化时,这些特 征变化就较大,以上述方式实现的人脸识别系统并没有太大的实际意义。目前, 该方向的研究日受冷落。 在以后的人脸识别方法与技术的研究中,逐渐形成了以模板代替局部特征来 描述人脸模式的趋势。用模板描述人脸模式,可以避免基于局部器官特征人脸识 别方法所要求的精确定位问题,而且保留了更多的识别信息。文献簟表明,基于 基于可判别平凡向量的人脸识别上海师范大学硕士学位论文 模板匹配的人脸识别方法要优于基于局部器官特征的人脸识别方法。 到了2 0 世纪9 0 年代,计算机人脸识别技术进一步发展。研究方向从基于人 脸图像部件特征的识别方法转向基于人脸图像整体特征的识别方法。这些方法是 从图像处理或模式识别角度出发,将人脸图像作为一维或二维数据进行分类。由 于这些方法用人脸图像整体特征来描述人脸模式,从而保留了大量的分类信息。 由于人脸图像是实际人脸模式的二维表述,从人脸图像恢复实际人脸模式是 一个病态过程,即用人脸图像来表述人脸模式丢失了大量的空间信息。因此,目 前已经有人从三维空间,应用多幅图像来表述人脸模式。 1 2 人脸识别技术的研究内容 1 2 1 人脸识别的基本过程 当前,常用的计算机人脸图像自动识别方法一般由两个主要功能模块组成: 人脸特征抽取模块和识别模块。 人脸特征抽取模块一般采用各种方法抽取人脸图像中的各类特征量,用来表 述人脸。许多识别方法在抽取特征之前根据人脸图像特征进行预处理,如:消除 噪声、灰度归一、几何校正、滤波变换等,以实现图像的标准化和使外界干扰对 识别目标的影响减至最低。在特征抽取时,各种识别方法所选取的特征各有不同, 但都是那些在不同个体之间存在较大差异而对于同一个人则比较稳定的度量,如 几何特征、纹理特征、统计特征、灰度特征、频谱特征等。由于人脸变化复杂, 特征表述和特征提取十分困难,囡此特征的有效抽取往往是决定识别效果的关键 所在,是在人脸识别中起决定性作用的一步。 识别过程则是将抽取到的不同图像间的特征量进行比较,计算不同人脸图像 之间的相似性,根据相似性加以区分和判别。往往用各种似然函数来作为相似性 的度量,如计算相关函数、对特征空间的各种距离进行运算等。在人脸识别时必 须有一个人脸样本图像库,图像库中存放若干人的人脸图像,每个人至少一张图 像,这些图像称为样本图像。 一个完整的人脸识别过程一般由两步来完成:训练过程( 学习过程) 和识别 过程。所谓训练过程是对图像库中的样本图像进行特征抽取,将得到的特征按不 6 基于可判别平凡向量的人脸识别 上海师范大学硕士学位论文 同的人归类,得到能代表不同人的特征,存储起来形成特征数据库;而识别过程 则是对未知图像( 待识图像) 进行特征抽取后,将该特征与特征数据库中的各个 一刿簦篓墨一 堡墨莲理 蒜苯目体待识匿像, j 特征抽取特征抽取 i 特征矢量特征矢t 一1 分类、存储一l 相似厦比较 l 、一一 分类器分类 特征库 、r l 诅筑堍皋, , 图1 1 训i 练过程和识别过程 不同人的特征进行比较,从而笋9 断该未知图像是否属于或不属于图像库中的哪一 个人。图1 1 描述了人脸识别过程的两个步骤。 1 2 2 人脸特征抽取和识别方法综述 随着人脸识别技术越来越受到研究人员的广泛关注,各种识别方法不断出 现,不仅一些经典的模式识别理论和方法被应用到人脸识别问题中,人们对大量 新的理论和方法也做了有益的尝试。 关于人脸特征提取与识别的方法可概述如下: 1 几何特征方法 基于几何特征的方法是最早被研究的人脸识别方法,并且在很长的时间内占 据着主流地位,文献嘲几何特征方法做了详尽的综述。这种方法的基本思想是 提取人脸上的突出的特征( 例如眉毛,眼睛,鼻子,嘴巴等) 的相对位置和相对大 小作为特征参数,再辅以人脸轮廓的形状信息,形成特征向量,最后利用适当的 7 善于可判别平凡向量的人脸识别 上海师范丈学硕士学位论文 距离度量和分类方法对特征向量加以分类。 几何特征方法利用的是单纯的几何信息,其优点是所需的存储空间和分类时 间代价较小,而且在图像分辨率较低的情况下仍然可以使用。其缺点是识别的准 确率完全依赖于几何特征的准确提取,而几何特征提取问题直到目前仍然没有完 全解决,例如光照和遮挡的变化可能严重干扰几何特征的准确提取;而且几何特 征本身容易受姿态和表情变化的影响,稳定性不高,即使几何特征提取准确,仍 然可能因为有较大的变化而导致分类错误。因此目前单纯利用几何特征的人脸识 别方法已经不常使用了,但几何特征仍然可以作为其他特征的有益补充。 2 子空间分析方法 子空间分析( s u b s p a c ea n a l y s i s ) 方法的基本思想是将待分类样本看作空间 中的点,首先寻找高维原空间的一个低维子空间,将原样本投影到这个子空间上 再进行分类。不同的子空间分析方法遵循不同的准则,可以得到不同的子空间。 常见的应用于人脸识别的子空间分析方法包括:主元分析( p r i n cj p a lc o m p o n e n t a n a l y s i s p c a ) 方法,线性判别分析( l i n e a rd i s c r i m i n a n ta n a l y s i s l d a ) 方法, 独立元分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s i c a ) 方法,以及基于核技术的子 空分析( k e r n e l b a s e ds u b s p a c ea n a l y s i s ) 方法等。 这部分工作也是本文的研究重点,将在第二章中详细介绍各种子空间分析方 法,加以比较和评价,并提出改进方法。 3 贝叶斯法 贝叶斯( b a y e s ) 决策理论是模式识别领域中的经典理论。应用贝叶斯决策 理论进行模式分类,首先要知道各类的先验概率和概率密度函数。由于在计算机 人脸识别应用中,每类训练样本较少,不能够从训练集中精确地估计出每类人脸 分布的概率密度函数,因此,不能直接应用贝叶斯决策理论进行计算机人脸识别 【6 7 】。一般来说,是将计算机人脸识别的多类分类问题转化到两类分类问题。即 将多类的人脸图像的概率分布转化到两类的同类人脸图像的概率分布和异类人 脸图像的概率分布。对于两类问题,每类的训练样本较多,可以较为精确地估计 出各类的概率密度函数。 基于可判别平凡向量的人验识别 上海师范大学硕士学位论文 该方法首先假设同类人脸图像和异类人脸图像都服从高斯分布。对于一幅待 识别人脸图像,将该图像和人脸库中的每一类人脸图像做差,并分别求出该差属 于同类人脸图像和异类人脸图像的条件概率。若同类条件概率大于异类条件概 率,则认为两者为周一人脸图像,若同类条件概率小于异类条件概率,则认为两 者为不同人脸图像。由于该方法对同类人脸图像和异类人脸图像的概率密度函数 进行估计,在分类过程中应用了各类分布的先验信息,因此可以在一定程度上克 服人脸图像光照、表情等变化对人脸识别系统的影响。在1 9 9 6 年进行的f e r e t 人脸识别测试中,该方法取得最好的识别效果,识别率约为9 5 ,其综合识别 性能明显优于其它参加测试的人脸识别方法。 4 弹性图匹配方法 在一般的基于人脸图像整体特征的人脸识别方法中,由于是将人脸图像作为 整体模式来考虑。人脸的姿态变化、表情变化和头饰变化都可能对分类识别有很 大影响。究其原因,就是没有考虑到人脸图像的局部变形。而基于弹性图匹配的 人脸识别方法f “9 1 不仅可以利用整幅人脸图像的识别信息,而且还允许局部特征 在一定程度上的变形,在很大程度上克服了人脸姿态变化、表情变化和头饰变化 对入脸识别的影响。 基于弹性图匹配的人脸识别方法采用属性拓扑图来表述人脸模式,通常情况 下,属性拓扑图为二维稀疏网格,如图1 2 所示。属性拓扑图上的每个顶点均 包含一个特征矢量,它记录了人脸在该顶点位置的分布信息,如图1 3 所示。属 性拓扑图可以采用各种描述局部信息的特征,如小波特征、形态特征和统计特征 等。在识别阶段,采用弹性匹配的方法来进行分类。在将一幅图像的网格同另一 幅图像的网格进行匹配时,一般先规定一个能量函数或代价函数,然后在一定范 围内对网格进行逐点变形搜索,找出每一点对应的能量函数最小点的位置。 图1 2 定义在人脸上的二维拓扑图 图1 3 表达人脸的特征矢量 基于司判别平凡向量的人脸识别上海师范大学硕士学位论文 原则上讲,基于弹性图匹配的人脸识别方法是一种介于基于人脸图像局部特 征和基于人脸图像整体特征之间的方法,因此它在众多人脸识别方法中具有重要 地位。但由于匹配过程是一个反复比较过程,计算量非常巨大,因此,该方法的 最大缺点就是识另u 速度慢。 5 神经网络方法 由于近代人工神经网络技术在模式识别领域的成功应用,也出现了很多基于 神经网络进行人脸识别的算法研究。通常情况t ,选取人脸图像部件区域或整幅 人脸图像作为神经网络的输入数据,隐层节点的个数决定了特征提取的维数,输 出层节点的个数为待识别人脸的类数。但对像人脸识别这样的应用来说,通常输 入节点庞大,网络复杂,很难训练。文献 1 0 】提出可应用自组织神经网络进行特 征提取,用自组织神经网络的隐层节点来表达原始的输入,然后以隐层节点的输 出作为特征进行分类。研究人员还应用传统方法和神经网络设计了组合分类器, 取得了比较满意的效果,识别率和本征脸方法相当。该方法在编码压缩和信息处 理方面有独特的优点,但神经元数目多,训练时间长j 。 6 隐马尔可夫模型方法 隐马尔可夫模型( h i d d e nm a r k o vm o d e l h m m ) 是一种重要的统计模型,广泛 应用于语音识别中。隐马尔可夫模型应用于人脸识别的基础在于人脸的主要特征 ( 例如头发、前额、眼睛、鼻子、嘴巴等) 的位置顺序固定,因此可以表示为隐 马尔可夫模型中的一系列状态。s a m a r i a 等【lz j 首先将l dh m m 和2 dp s e u d o h m m 用于人脸识别。基于1 dh m m ,k o h i r 等采用低频d c t 系数作为观 察矢量获得了好的识别效果。e i c k e l e r 等 1 4 1 采用2 dp s e u d oh m m 识别d c t 压 缩的j p e g 图像中的人脸图像。o t h m a n 等提出采用半连续的2 dh m m 来解决 每类训练样本不足的问题【1 5 】。 7 支持向量机方法 支持向量机( s u p p o r tv e c t o rm a c h i n e ) 是近年来兴起的源于统计学习理论的 0 基于可判别平凡向鼍的人脸识别上海师范大学硕士学位论文 针对一般性模式识别问题的有效方法。统计学习理论是针对小样本情况研究统计 学习规律的理论,是传统统计学的重要发展和补充,为研究有限样本情况下机器 学习的理论和方法提供了理论框架,其核心思想是通过控制学习机器的容量实现 对推广能力的控制。由v n ,v a p n i e 等人提出的支持向量机是一秭新的通用学习 机器,较以往的方法表现出很多理论和实践上的优势。由于支持向量机主要用于 解决两类模式分类问题,因此支持向量机应用到人脸识别上,其关键在于如何构 造出一个两类问题,尤其是对于人脸识别这样的多类分类问题【l “”】。 8 小结 本文将人脸识别方法大致分为三大类:几何特征方法、神经网络方法和统计 方法,其中统计方法又可细分为子空间方法、贝叶斯法、隐马尔可夫模型方法、 支持向量机方法等。 当然,这样的分类并不是绝对的,三大类方法之间也不是互斥的。我们也可 以将计算机人脸识别方法分为两大类:一是基于人脸图像部件特征的识别方法; 二是基于人脸图像整体特征的识别方法。 基于人脸图像部件特征的识别方法主要是基于几何特征的方法;基于人脸图 像整体特征的人脸识别方法主要有特征脸法、线性判别分析法、贝时斯法、弹性 图匹配法和神经网络法。这些方法中有的侧重于表述人脸图像的特征提取,如弹 性图匹配法;有的则侧重于分类,如线性判别分析法、贝叶斯法和神经网络法; 而有的则侧重于人脸图像重构,如特征脸法。而且,这些基于人脸图像整体特征 的人脸识别方法均取得了一定的识别性能。 1 2 3 人脸识别方法的评价 人脸识别技术是一项实用技术,因此考察各种人脸识别方法的性能也要从实 用角度出发。由于人脸识别技术首先是一种分类技术,因此正确识别率这个性能 指标是研究人脸识别算法的首要问题。另外,还要考虑人脸识别技术的实时性问 题。同时,人脸识别算法所设计的人脸特征库对存储空间的要求也对该技术的应 用有一定的影响。因此,评价一个人脸识别系统的标准通常有以下几点: 识别率 在人脸识别问题中,和识别率相关有2 个概念:一是正识率,若待识别人脸 图像属于人脸库中的人脸模式,识别系统正确识别出该人脸模式,则这些人脸图 像的总数占测试人脸图像总数的百分比为正识率;另一个是拒识率,若待识别人 脸图像不属于人脸库中的人脸模式,而识别系统识别出该人脸图像不属于人脸库 中的人脸模式,则这些人脸图像的总数占测试人脸图像总数的百分比为拒识率。 这两种情况均为正确识别,识别率由这两部分构成。在人脸识别的实际应用中, 需要给出拒识人脸,即应设置拒识门限识别出不属于入脸库的人脸图像。而通 常的计算机人脸识别方法的研究中,大多数的人脸识别系统都没给出拒识人脸, 将拒识门限设为无穷大,即给定一待识别人脸,在已知人脸库中找到和该人脸最 相近的人脸,而不考虑该人脸是否应该是人脸库中的已知人脸。 计算时间 由于人脸识别技术的实际应用实时性要求比较高,因此计算时间是计算机人 脸识别技术中的一个重要指标。计算时间主要有两方面:一个是设计阶段,人脸 识别系统训练需要的时间;另一个是识别阶段,人脸识别系统识别需要的时间。 通常情况下,由于人脸识别系统的训练为离线训练,因此,人脸识别系统设计阶 段需要的训练时间可以不考虑。但识别时间却相当重要,它直接影响人脸识别系 统的实时性,对人脸识别系统是否可以应用于实践,起着决定性作用。 数据存储量 在人脸识别系统中,人脸库的存储也是个不能不考虑的问题。存储大量的人 脸数据将会给人脸识别系统造成一定的负担,因此,在人脸识别算法的研究时, 有时要考虑数据存储量的大小。 可扩展性 在计算机人脸识别系统的实际应用中,往往需要不断对已知人脸库进行修 改,或删除某些人脸模式,或添加某些人脸模式。因此,对已知人脸库的动态维 1 2 护也是研究中要考虑的一个问题。 1 3 本文的主要研究工作 本文的研究工作主要是以人脸的特征提取为主。包括两个部分:从标准人脸 库中划分出训练样本集,用以提取统计特征;对测试样本集中待识别的人脸进行 分类识别。 对于标准人脸库,所有人脸图像的大小一般都相同,如都是1 1 2 9 2 大小, 且都是黑白灰度图像。图像的内容是整个人的脸部。本文用来训练和识别的人脸 图像都是来源于同一标准人脸库,即o r l 标准人脸库。 本文提出的方法称为可判别平凡向量法( d i s c r i m i n a t i v ec o m m o nv e c t o r 法1 , 该方法的主要思想是:根据改进的判决准则,利用训练样本集的类内散度矩阵 & 的零空间,先将原样本投影到跏零空间上,然后进行主元分析( p c a ) ,找 到使类间离散度为最大的最佳投影向量,从而得到特征向量,即可判别平凡向量 ( d i s c r i m i n a t i v ec o m m o nv e c t o r s ) ;最后,选择目前广泛使用的欧氏距离作为相似 性度量,采用最近邻分类法进行判别。 为了证明本文提出的可判别平凡向量法的有效性,本文利用o r l 标准人脸 数据库进行了实验,并将该算法与已有的特征脸( e i g e n f a c e ) 方法、f i s h e r ( f i s h e r f a c e ) 脸法、d i r e c tl d a 法、p c a + n u l ls p a c e 法作比较,从识别率、 存储空间、训练时间和识别时间四个方面对这些方法作了分析讨论,证明可判别 平凡向量法的性能在总体上优于其他方法。还选取不同的样本类别数和训练样本 数,分别进行实验,分析它们的变化对人脸识别的影响。 1 4 本文的内容安排 本文的内容安排如下: 第一章概述了人脸识别技术的研究背景和意义,对常用的人脸识别方法进 行了简单的综述,并明确了本文的研究工作和内容安排。 第二章简单介绍了线性子空间分析的人脸识别方法的基本思想和分类,以 线性判别分析为理论基础,围绕小样本问题,深入研究了已有的各种算法。着重 彗三兰型型三些皇三墼垒望堡型圭童些薹奎兰至圭兰垒篁圣 讨论了特征脸( e i g e n f a c e ) 方法、f i s h e r ( f i s h e r f a c e ) 脸法、d i r e c tl d a 法 和p c a + n u l ls p a c e 法,作为后续实验的基础。 第三章提出一种新的人脸识别方法,称作可判别平凡向量法 ( d i s c r i m i n a t i v ec o m m o nv e c t o r 法) ,它是f i s h e r 线性判别分析在小样本情况下的 一种变型。同时,给出了基于差分子空间和克莱姆一施密特正交化的快速算法。 最后,简单介绍了基于欧氏距离度量的最近邻分类法。 第四章对o r l 人脸库进行算法实验,将本文提出的可判别平凡向量法 ( d i s c r i m i n a t i v ec o m m o nv e c t o r 法) 与第二章中介绍的特征脸( e i g e n f a c e ) 方法、 f i s h e r ( f i s h e r f a c e ) 脸法、d i r e c tl d a 法和p c a + n u l ls p a c e 法进行实验比 较和理论分析,证明了可判别平凡向量法的优越性。 第五章总结本文所做的工作,并指出一些尚须进一步研究的内容,对下 步工作进行展望。 2 1 引言 第二章子空间分析的人脸识别方法 在第一章的人脸特征抽取和识别方法综述那一节中,我们已经简单地回顾了 一些常用的特征提取和描述的方法,子空间分析方法( s u b s p a c ea n a l y s i sm e t h o d ) 就是其中的一种。本文下面几章的工作都是以子空间分析为基础,对基于线性判 别分析( l d a ) 的人脸识别方法进行深入研究,因此,我们先回顾一下人脸识别 中己有的各种子空间分析方法。 通常我们处理的图像,尤其是人脸图像,其图像空间的维数都是非常高的, 比如一幅1 0 0 1 0 0 大小的人脸图像,它的维数就是1 0 0 0 0 维。如果把人脸图像都 看成是在这样高维空间中的点,那么表示人脸图像的点的分布可能是很不紧凑 的,同时高维空间带来了更多的噪声影响,因而不利于分类,并且在计算上的复 杂度也非常大。为了得到人脸图像的较紧凑分布,k i r b y 等【鸠l 和t u r k 等坤1 首先把 主元分析的子空间思想引入到人脸识别中,并获得了较大的成功。随后子空间分 析方法就引起了人们的广泛注意,从而成为了当前人脸识别的主流方法之一。 子空间分析的思想就是根据一定的性能目标来寻找一线性或非线性的空间 变换,把原始信号数据压缩到一个低维子空间,使数据在子空间中的分布更加紧 凑,为数据的更好描述提供了手段,另外计算的复杂度也得到了大大降低。子空 间分析除了有线性和非线性空间变换之分外,根据不同的性能目标要求,得到的 子空间也是不一样的。目前在人脸识别中得到成功应用的线性子空间分析方法 有:主元分析( p r i n c i p a lc o m p o n e n ta n a l y s i s p c a ) 、线性判决分析( l i n e a r d i s c r i m i n a n ta n a l y s i s l d a ) 、独立元分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s i c a ) 、非负矩阵因子( n o n n e g a t i v em a t r i xf a c t o r i z a t i o n n m f ) ,基于核 技术的非线性子空间分析有:核主元分析( k e r n e lp r i n c i p a lc o m p o n e n t a n a l y s i s k p c a ) 和核f i s h e r 判决分析( k e r n e lf i s h e rd i s c r i m i n a n ta n a l y s i s k f d a ) 。其中,非线性子空间分析的方法不属于本文的研究工作,所以将不在本 文中介绍。 为了方便讨论,先给出一些重要定义和基本假设: 基于可判别平凡向量的人脸识别 上毒师范大学硕士学位论文 假设训练集由c 类不同的人组成,每类有f ( f _ 1 , 2 ,c ) 个样本( 人 脸图像) ,这样训练集总共有m = n ,个样本。通常,每类人都取相同的样本 百 数,这时,总样本数为m = a r c 个。 假设每幅人脸图像为w 像素,将其按行或按列展开为d 维列向量( d = w ) ,则所有样本均可以简单地用一个d 维列向量( f = 1 2 ,肘) 表示。另 一种表示方法包含了类的信息,即x :( f = 1 2 ,c ;,= l 一2 凡) 表示第i 类的 第,个样本。虽然,样本在类内的排序本身并没有意义,但是为了叙述方便, 所以引入,。而且,两种表示方法一般不会引起混淆,因此,在下文中将根据 需要混用这两种表示方法。 定义:5 击蕃一为所有样本的均值,一2 寿荟巧为第7 类样本的均值。 下面我们按照时间上的顺序对线性子空间分析方法在人脸识别中的应用作 一些回顾、比较和总结。其中,重点研究l d a ,对已有的各种基于l d a 的人脸识别 方法进行了较深入的研究。 本章的组织结构如下:在第二节,阐述p c a 方法;在第三节,回顾l d a 的方法, 着重针对小样本问题,对已有算法进行深入研究;在第四节中,对独立元分析的 方法作简单介绍。最后,在第五节作本章小结。 2 2 主元分析( p c a ) 主元分析的思想来源于k - l 变换,目的是找一组最优的单位正交向量,即所 谓的主元,作为子空间的基,那么就可以用它们的线性组合来重建原样本,并使 重建后的样本和原样本的误差最小。 首先考虑对m 个已知的d 维样本向量的表示,显然它们可以表示为d 个单 位正交向量埤= 1 ,2 ,d ) 的线性组合,即: d 一= y ,叶 ( - 1 , 2 ,吖) ( 2 1 ) 产1 表示为矩阵形式即: 基于可判别平凡向量的人脸识别上海师范大学硕士学位论文 r 。= k ,x :善。,= l 。甜:“。援: 如果选取其中, ( 2 6 ) 其中,丑是s 的特征值,w ,是对应于特征值 ,的特征向量,然后把特征值按 降序排列a l 数定砌,最后选择对应前r ( 通常产锄个非零特征值的特征向量作为 新的子空间的基向量,即我们要找的主元。这样,我们就可以用特征空间中的,维 向量( 即线性组合的,个系数构成的向量) 代替样本空间的d 维向量来进行分类。 综上所述,主元分析的具体算法如下: ( 1 ) 计算样本协方差矩阵s ; ( 2 ) 计算s 的特征值和特征向量; ( 3 ) 保留对应最大特征值的特征向量,构成新的子空间的基向量: ( 4 ) 将已知样本和未知样本投影到子空间上,选择合适的分类器进行分 类。 基于可判别平凡向量的人验识别上海师范大学硕士学位论文 主元分析在人脸识别上的应用最早是硅k i r h y 等 i8 】提出来的,后来由t u r k 等 ”9 】把它发展为特征脸( e i g e n f a c e ) 方法,用于正面的人脸识别。特征脸的思想就 是从训练图像中,通过主元分析的方法学习得到一组特征脸图像( 即对应的主 元) ,那么任意给定的入脸图像都可以近似为这组特征脸图像的线性组合,组合 的系数就表示为样本的特征向量。经典的特征脸方法是采用基于e u c l i d e a n 距离 的最近中心分类器i 】9 1 ,后来比较常用的是基于e u c l i d e a n 距离的最近邻分类器, 也有采用基于m a h a l a n o r i s 距离和余旋角度量的【2 。 随着特征脸方法的成功之后,还出现了许多种基于主元分析的人脸识别方 法。p e n t l a n d 等【2 i i 利用对每个视角都作局部主元分析。从而实现了基于主元分 析的多视角人脸识别。m o g h a d d a m 等【2 2 】根据主元分解后的两个正交的子空间的特 性,提出用单个或多个高斯函数来描述样本在主元子空间的分布,从而把主元分 析和贝叶斯分类框架联系起来。在文中还讨论了在光照、姿态等变化比较大的情 况下,应选择混合高斯形式。混合高斯的参数可通过e m ( e x p e c t a t i o nm a x i m i z e ) 算法来估计。不过用混合高斯来描述,通常需要一定量的训练样本才能得到可靠 的结果,因此在实际中可用于人脸的检测,而对人脸识别部分来说有些不切实际。 l i u 等1 2 3 , 2 4 l 提出结合主元分析的概率推理模型( p r o b a b i l i s t i er e a s o n i n gm o d e l s p r m ) ,即先用主元分析进行特征描述,然后假设在主元子空间中每类的类条 件概率服从一正态分布,然后就可以采用贝叶斯决策规则来分类。m o g h a d d a m 等 2 5 2 6 】后来还提出基于分层的主元概率子空间方法。此方法的思想是分别用主元分 析去提取与描述人脸的类内变化和类间变化的特征,然后再结合文献 2 2 中的思 想,用贝叶斯决策规则来分类。实验的结果表明,结合贝叶斯分类框架和主元分 析的人脸识别方法比经典特征脸方法取得的识别效果要好,这也说明了基于贝叶 斯决策的分类误差较小。y i i m a z 等提出的e i g e n h i l l 的方法实际上是先对原始 图像采用边缘滤波加局部平滑的预处理后,再利用主元分析的思想提取特征,从 而可以更有效地处理人脸图像中的丰富表情变化。 主元分析中主元选取的优先级通常是按对应的特征值大小来确定的,特征值 越大,其优先级就越高。但是就人脸识别而言,应该选择多少个主元是最佳的, 目前常用的标准有两种:1 ) 当对应的特征值和最大的特征值相比小于一定的值时 就不要了;2 ) 选择的特征值之和与总的特征值之和的比值要大于等于0 9 。关于 基于可判别平凡向量的人脸识别上每师范大学硕士学位论文 主元的数量与识别率之间的关系,在文献 2 0 中有较详细的实验结果与分析。 主元分析基于信号表示的最优化原则,提取的特征能够保证样本的最优重建 与恢复,最有效地表示了原信号,所以又叫最优表示特征( m o s te x p r e s s i v e f e a t u r e m e f ) 。虽然它在人脸识别中取得了不错的效果,但是从分类角度来看, 最优的表示并不一定能够保证最优的可分性。为了更好地分类,我们需要找的是 最优判别特征( m o s td i s c r i m i n a t i n gf e a t u r e 胁f ) 。 2 3 线性判决分析 线性判决分析不同于主元分析,它是以样本的可分性为目标,寻找一组线性 变换使每类的类内离散度最小,并且使类问的离散度达到最大,因此从理论上说, 比较适合于模式识别问题。为了构造判别准则,首先必须对以上离散度矩阵进行 定量度量,通常用矩阵的行列式( d e t e r m i n a n t ) 或者迹( t r a c e ) 来度量,这里我们 使用行列式。经典的线性判别分析中使用的是f i s h e r 准则函数,所以线性判决 分析又被称为f i s h e r 线性判别分析( f i s h e rl i n e a rd i s c r i m i n a n t a n a l y s i s f l d a ) 。 为了定义
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 甲状腺超声测值课件
- jit教学能力大赛课件
- 新解读《GB-T 36786-2018病媒生物综合管理技术规范 医院》
- 中班数物对应教学课件
- 党史故事课件教学对象
- 用电安全知识培训课件报告
- 用火安全知识培训内容课件
- 生物实验室安全知识培训课件
- 生物安全知识培训课件解答题
- 2024景德镇住房出租合同(30篇)
- 典范英语7-2中英文对照翻译Noisy Neighbours
- 海思芯片HTOL老化测试技术规范
- 最新版个人征信报告(可编辑+带水印)
- 国际贸易实务英文版第五版ppt课件(完整版)
- 排尿评估及异常护理
- 隧道穿越大型活动断裂带的技术对策
- 宏业清单计价软件入门必备
- 人教版七年级初一数学:期中考试初一数学试卷及答案
- 部编版三年级上册教材解读及教学建议课件
- 如何让你的标书评审专家青睐
- 人工智能中的搜索问题36
评论
0/150
提交评论