（通信与信息系统专业论文）主元分析在人脸识别中的应用研究.pdf

上传人：伐*** IP属地：宁夏上传时间：2019-12-19 格式：PDF 页数：62 大小：4.52MB 积分：0 举报 版权申诉

已阅读5页，还剩57页未读，继续免费阅读

（通信与信息系统专业论文）主元分析在人脸识别中的应用研究.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

摘要人脸识别是身份认证技术领域中当前研究的热点课题，它涉及到模式识别，图像处理，神经网络，计算机视觉，生理学及认知科学等多个学科知识，具有重要的理论意义和实用价值。本文首先对人脸识别系统中图像预处理和分类器设计进行了讨论，并简单介绍了几种基于全局的特征提取方法。然后，对p c a ，2 d p c a ，d i a g p c a ，( 2 d ) 2 p c a 等几种基于主元分析的特征提取算法进行了详细的介绍。由于2 d p c a ，( 2 d ) 2 p c a ， d i a g p c a 算法的特征提取都直接基于图像矩阵，计算量小，因而特征的提取速度明显高于p c a 算法。同时，本文在分析各个算法识别性能的过程中，发现在类别训练样本数目一定的情况下选取具有代表性的人脸图像作为训练集样本时算法具有更高的识别率。在对上述各种特征提取算法分析和比较的基础上，本文提出了平均脸 + ( 2 d ) 2 p c a 识别方法。实验证明，该方法在特征分类时所需的特征比较次数较少，识别速度较快。最后，本文初步探索了神经网络在基于二维主元分析识别方法中的应用，提出- j ( 2 d ) 2 p c a 特征和b p 神经网络分类器相结合的识别方法。通过与本文其它识别方法进行比较表明，( 2 d ) 2 p c a 特征和b p 神经网络分类器相结合方法具有较好的识别性能。关键词：人脸识别主元分析二维主元分析特征提取神经网络 a bs t r a c t f a c er e c o g n i t i o ni sah o ts u b j e c ti nt h ec u r r e n tr e s e a r c ho nt h et e c h n o l o g yi nt h e f i e l do fi d e n t i t ya u t h e n t i c a t i o n i ti n v o l v e st h ew o r l do fp a r e mr e c o g n i t i o n ，i m a g e p r o c e s s i n g ，n e u r a ln e t w o r k ，c o m p u t e rv i s i o n ，p h y s i o l o g ya n dc o g n i t i v es c i e n c e ，e t c t h er e s e a r c hr e s u l to ff a c er e c o g n i t i o nh a sg r e a ti m p o r t a n c eo ft h e o r e t i c a lm e a n i n g a n dp r a c t i c a lv a l u e f i r s t l y , t h ed i s c u s s i o nt oi m a g ep r e p r o c e s s i n ga n dc l a s s i f i e rd e s i g n i n gw h i c ha r e p a r t so ff a c er e c o g n i t i o ns y s t e mi sc a r r i e do u ta n dab r i e fi n t r o d u c t i o no fs e v e r a l f e a t u r ee x a c t i o nm e t h o d sw h i c ha r eb a s e do nt h eg l o b a li sg i v e ni nt h i sp a p e r t h e n ， s e v e r a lf e a t u r ee x a c t i o na l g o r i t h m sc a ll e dp c a ，2 d p c a ，d i a g p c a ，( 2 d ) 2 p c aw h i c h a r eb a s e do np r i n c i p a lc o m p o n e n ta n a l y s i sa r ed e s c r i b e di nd e m i l t h ea l g o r i t h m so f 2 d p c a ，d i a g p c a ，( 2 d ) 2 p c aa r ed i r e c t l yb a s e do ni m a g em a t r i c e s ，h a v i n ga r e l a t i v e l ys m a l lc o m p u t a t i o n a lc o m p l e x i t y a sar e s u l t ，t h o s ea l g o r i t h m sh a v eah i g h e r f e a t u r ee x a c t i o nr a t et h a nt h a to fp c aa l g o r i t h m m e a n w h i l e ，d u r i n ga n a l y z i n gt h e r e c o g n i t i o np e r f o r m a n c eo f t h ea l g o r i t h m sm e n t i o n e di nt h i sp a p e r , i ti sf o u n dt h a tt h e r e c o g n i t i o ns p e e do ft h ea l g o r i t h mi sr e l a t i v e l yq u i c ku n d e rt h ec o n d i t i o nt h a t r e p r e s e n t a t i v ef a c i a li m a g e sa r es e l e c t e da st r a i n i n gs e ts a m p l e s ，w h e nt h en u m b e ro f t h et r a i n i n gs a m p l e so fe a c hc a t e g o r yi sd e t e r m i n e d b a s e do na n a l y z i n ga n dc o m p a r i n gt h ef e a t u r ee x a c t i o na l g o r i t h m sm e n t i o n e d a b o v e ，an e wf a c er e c o g n i t i o nm e t h o dc a l l e da v e r a g ef a c ep l u s ( 2 d ) 2 p c ai sp r o p o s e d i nt h i sp a p e r i ti sp r o v e db yt h ee x p e r i m e n t st h a tt h en e wm e t h o dn e e d ss m a l la m o u n t o fc o m p a r i s o n sa m o n gi m a g ef e a t u r e sw h e nt h ef e a t u r e sa r ec l a s s i f i e da n dh a saf a s t r e c o g n i t i o ns p e e d f i n a l l y , t h ea p p l i c a t i o no fn e u r a ln e t w o r ki nt h ef a c er e c o g n i t i o nm e t h o db a s e d o nt w od i m e n s i o np r i n c i p a lc o m p o n e n ta n a l y s i si sp r e l i m i n a r i l yr e s e a r c h e d a n dt h e m e t h o do ft h ec o m b i n a t i o no f ( 2 d ) 2 p c af e a t u r ea n db pn e u r a ln e t w o r kc l a s s i f i e ri s p r o p o s e d t h en e wm e t h o di sp r o v e dg o o dp e r f o r m a n c eb yc o m p a r i n gi tw i t ht h e o t h e rm e t h o d si n t r o d u c e di nt h ep a p e r k e yw o r d s ：f a c er e c o g n i t i o n ，p c a ，2 d p c a ，f e a t u r ee x a c t i o n ，n e u r a l n e t w o r k 独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果，除了文中特别加以标注和致谢之处外，论文中不包含其他人已经发表或撰写过的研究成果，也不包含为获得墨鲞盘堂或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文作者签名：寸嘿的签字日期：斓年6 月日学位论文版权使用授权书本学位论文作者完全了解苤鲞盘鲎有关保留、使用学位论文的规定。特授权墨垄盘堂可以将学位论文的全部或部分内容编入有关数据库进行检索，并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名：- i 晤移签字日期：如g 年6 月日新编妫习签字日期： d 汐年么月日第一章绪论 1 1 人脸识别的发展和现状第一章绪论人脸识别研究的历史可以追溯到19 世纪后期f r a n c i sg a l t o n 对人脸识别问题的研究，他用一组数字代表不同的人脸侧面和正面特征来实现对人脸侧面图像的识别。直到2 0 世纪9 0 年代以前，典型的人脸识别技术始终采用正面或侧面的特征点之间的距离量度，而且早期的人脸识别多集中于对侧影图像的研究，识别方法都需要利用操作员的某些先验知识，离不开人的干预i lj 。 2 0 世纪9 0 年代以后，由于高性能计算机的迅速发展，人脸识别技术获得重大突破，研究更具鲁棒性的人脸识别方法成为时代发展的必然。于是基于整体的识别方法应运而生，并且很快成为研究重点。基于整体的识别方法充分利用了人脸各个特征点之间的拓扑关系和面部器官自身的信息，避免了提取人脸局部特征的操作，使算法的鲁棒性有所提高。在人脸识别的研究领域中出现了基于整体的方法和基于局部的方法齐头并进的局面。9 0 年代中期以来，人脸识别方法朝着基于整体特征和局部特征相结合的方向发展。研究人员开始逐渐认识到人脸识别算法必须能够充分地利用人脸的各种特征信息，融合人脸的形状拓扑结构特征、局部灰度特征和全局灰度分布特征等多种特征。在这一阶段，国际上发表有关人脸识别方面的论文数量大幅增加，关于人脸和手势识别的国际会议相继召开。国内关于人脸识别的研究始于2 0 世纪8 0 年代，主要是在国际流行方法基础之上而进行的发展性工作。其中四川大学、中国科技大学、清华大学、南京理工大学、上海交通大学、东南大学、南京邮电大学、哈尔滨工业大学和浙江大学等高校在人脸识别技术领域展开了探索。与此同时，中科院自动化所、公安部等单位也进行了人脸识别方面的研究，并取得了一定的成果。但是与国外相比，国内对人脸识别的研究和重视程度较低，研究成果远落后于国际水平。目前，已经有一些研究机构将研究成果转移为实用产品，较典型的有m i r o s 公司的t r u e f a c e ，v i s i n o c s 公司的f a c e l t ，c o g n i t e c 公司的f a c e v a c s 和z nb o c h u m g m b h 公司研制的z n f a c e 等，但是这些识别技术离应用要求还有一定的差距。现有的识别方法仍然面临着诸多技术挑战，对因表情、精神状态、年龄变化、意外损伤、化妆、头发胡须等引起的人脸自身变化和因光照、摄像设备、人与摄像设备的距离角度、图像存储质量等外部环境引起的人脸图像变化的识别效果还不理想【2 1 。人脸识别技术仍然只能用于某些对识别准确率要求不高的场合。第一章绪论 1 2 人脸识别的研究意义人脸识别技术涉及到模式识别、图像处理、神经网络、计算机视觉、生理学及认知科学等多个领域的学科知识，与指纹、虹膜、掌纹识别、签名识别等其他基于生物特征的识别技术以及计算机人机感知交互领域都有着密切的联系。人脸识别技术发展和突破有助于其他学科基础问题的研究，对开拓新的技术领域和促进多学科跨领域综合发展具有重要的理论意义和学术价值。生物特征识别技术基于人体固有的生物特征，与其他身份识别技术相比具有高稳定性和高可靠性。人脸识别技术与指纹识别，虹膜识别，掌纹等其他生物识别技术相比有如下优势：首先，设备简单，只需要一个摄像设备和一台计算机即可完成人脸识别；其次，被识别对象不需要与设备发生接触，识别过程可以在被识别对象毫无察觉的情况下完成，这样一方面可以防止像指纹识别那样因接触设备而造成由设备磨损而引起的识别不准，另一方面避免对被识别对象造成心理上的影响。因此，人脸识别技术在安全系统和商贸系统中有着很多应用，涉及到刑侦破案，证件验证，入口控制和视频监视等方面应用。除此之外，人脸识别技术还在视频会议，机器人智能化研究以及医学等方面有着广阔的应用前景。 1 3 课题的主要工作本文对主元分析在人脸识别中的应用进行了深入研究，比较了基于一维和二维主元分析的识别方法在人脸识别中的优缺点，并针对二维主元分析方法的缺点进行了改进。主要工作内容如下： 1 研究了基于一维主元分析( p c a ) 的识别方法，并详细介绍了p c a 方法的改进方案一双子空间识别方法。 2 对二维主元分析( 2 d p c a ) 方法进行了研究和讨论。针对2 d p c a 方法的缺点，介绍了d i a g p c a 和( 2 d ) 2 p c a 方法等改进措施。本文为了解决识别速度问题，引入了基于2 d p c a 的平均脸方法，并提出了平均脸与( 2 d ) 2 p c a 相结合的人脸识别方法。 3 将b p 神经网络应用于( 2 d ) 2 p c a 特征分类中，并比较其与基于p c a 特征和b p 神经网络方法，平均脸+ ( 2 d ) 2 p c a 方法和最近邻分类器下( 2 d ) 2 p c a 方法之间的优缺点。 4 编写文中所有涉及到的识别方法的m a t l a b 程序，并以o r l 人脸库为研究对象进行仿真实验，并讨论了在训练样本数一定的情况下，样本挑选对算法识别率的影响。第二章人脸识别综述第二章人脸识别综述 2 1 人脸识别的研究内容狭义的人脸识别是指系统根据新输入的人脸，与已有的人脸数据库进行比较，判断该人脸是否在人脸库中，如果该人脸在数据库中，则给出该人脸所对应的具体信息。而广义的人脸识别可以包含以下几个方面的内容： 1 人脸检测( f a c ed e t e c t i o n ) ：即从不同的场景中检测出人脸的存在并确定其位置。这一任务主要受光照、噪声、头部倾斜度以及各种遮挡的影响。 2 人脸表征( f a c er e p r e s e n t a t i o n ) ：即确定表示检测出的人脸和数据库中的已知人脸的描述方式。通常的表示方式包括几何特征( 如欧式距离、曲率、角度等) 、代数特征( 如矩阵的特征矢量) 、固定特征模板、特征脸、云纹图等。 3 人脸识别( f a c ei d e n t i f i c a t i o n ) ：即通常所说的人脸识别，就是将待识别的人脸和数据库中的己知人脸比较，得出相关信息。这一过程的核心是选择适当的人脸表示方式与匹配策略。 4 表情分析( f a c i a le x p r e s s i o na n a l y s i s ) ：对待识别的人脸的表情进行分析，并对其加以分类。 5 物理分类( p h y s i c a lc l a s s i f i c a t i o n ) ：即对待识别人脸的物理特征进行分类，得出其年龄、性别、种族等相关信息。已有人脸库获得人脸图像人脸检测与定位人睑检测与定位图像预处理图像预处理特征提取与选择特征提取与选择图2 1 完整的人脸识别系统分类器训练分类器i 识别信息塑蒲。本文主要研究完整的人脸识别系统中除人脸检测外的内容，即狭义的人脸识别。本章下面的小节分别对人脸识别系统中图像预处理，图像特征提取和分类器设计进行简单的讨论。墨三雯些望型堡垄 2 2 人脸图像预处理在人脸识别中，由于表情、精神状态、年龄变化、意外损伤、化妆、头发胡须等引起的人脸自身变化和因光照、摄像设备、人与摄像设备的距离角度、酗像存储质量等外部环境引起的人脸图像变化对算法的识别率影响很大，因此在对人脸图像进行特征提取之前有必要先对图像进行预处理，以达到削弱人脸图像因自身因素和外界因素对算法识别效果的影响的目的。常用的图像预处理方法有图像几何变换灰度变换和图像锐化。 2 2 1 图像几何变换对人脸图像进行几何变换的主要目的是使图像中人脸的关键部位在整个图像的相对位置保持一致。在获取人脸图像时，成像设备的精度，拍摄角度和背景大小等因素会影响图像的几何尺寸，图像中人脸的角度和人脸相对于整个图像的比例。因此，在图像特征提取之前有必要对图像先进行几何变换。人脸识别中需要进行的几何变换主要有图像裁切，图像旋转和图像缩放。图像裁切是通过固定人脸图像中双眼在整个图像中位置比例目的是使人脸在整个图像中的位置保持一致另外图像裁切可以削弱头发和背景对识别结果的影响。图像旋转是把原始图像中的人脸在平面内旋转，使得人脸的双眼连线与水平坐标轴平行。图像缩放可咀把图像规定到设定的太小。其中图像缩放在人脸预处理中的作用尤为重要。在人脸识别中把图像缩小可以明显地减少计算量，提高识别速度。特别是把图像数据作为神经阿络的输入时，图像缩放可以直接减少输入层神经元个数，间接地减少隐层神经元数量，从而简化阿络结构。图像缩放主要采用灰度插值和小渡变换两种方法。常用的灰度插值算法有最近邻域插值算法、双线性插值算法、双立方插值算法。其中最近邻域插值算法简单直观，但是变换后图像失真较多：双立方插值算法的效果最好，图像失真最小，但是计算量大：双线性插值算法的效果和计算量介于二者之间。原圈( 2 5 6 x 2 5 6 ) 1 2 8 x 1 2 8 圉2 - 2 图像双线性插值前后比较械 “x 6 4 第二章人脸识别综述小波变换是另一种常用的图像缩放方法”，它把信号分解成低频和高频两部分后，在下一层的分解中又将上一层的低频信号分解成低频和高额两部分，按照这样的步骤继续分解直至设定的深度。对二维图像信号变换，需要把信号分解成沿行和列的一维问题处理，即小渡变换分别进行一次行变换和次列变换完成。 l 崴岫 ( a ) 腺幽( b ) 二级小扳分群图2 - 3l e n a 图像的小波变换效果图2 - 3 ( a ) 经过h a a r 小波二级分解后得到血口图2 - 3 ( b ) 的分解结果。上图2 - 3 ( b ) 中低频分量包含了图2 - 3 ( a ) 中几乎全部的重要信息，而数据量却大约只有原图的十六分之一。经过小波分解后，图像的高频分量被滤除，同时一些噪声信号也被滤除，这些高频信号包含的人脸信息很少对识别结果影响微弱。 2 22 灰度变换由成像设备获取图像数据时会受到光照条件的影响，并且在不同光照条件下获取的图像数据扶度变化很大。这种由光照条件影响引起的灰度变化正是影响人脸识别算法识别效果的重要固素之一，因而有必要对获取的图像数据进行敏度变换，以削弱光照凼素的影响。 i 均值和方差归一化不同光照条件下的图像的均值和方差往往差异较大，均值和方差归一化处理的目的是把图像数据的均值和方差调整到一个设定值，使得图像的均值和方差处于这个设定值时图像能够获得较好的对比度。在人脸识别中，这种变换能够使得图像在物理意义上具有大致相同的直流和交流能量，从而可以在一定程度上削弱光照因素对算法识别结果的影响。对一个m ”大小的灰度图像，“，) ，其均值( m e a n ) 和方差( 口) 可以按照公式f 2 - 1 ) 和f 2 - 2 ) 求得，一志善善“j ) f - 1 ) 第二章人脸识别综述出去喜扣w ) - m e n ) 2 f 2 - z 假设要把灰度图像的均值和方差分别调整到和q ，h ( r ，1 表示变换后图像在 ( f ，) 点的灰度，则有： ( f ，) = + l ( i , j ) - m e a n ( 2 3 ) o 本文中设定均值为m 。= 1 3 0 ，方差为珥、= 8 0 。此时原图像经过归一化处理后像素值低的部分被削弱，像素值高的部分被加强，处理后的图像对比度增大，图像较为清晰。与其它灰度变换方法相比，均值和方差归一化灰度处理方法较简单，而且可以在一定程度上削弱光照因素对识别结果的影响。门 i i n i - i i ( a ) 归一化前( b ) 归一化后图2 - 4 图像在均值和方差归一化前和归一化后比较 2 直方图均衡直方图均衡的目的是为了改变灰度图像的像素值分布，增加荻度图像的对比度。直方图变换可以通过均匀处理对比度较小的图像的直方图分布，使得该图像的所有灰度级出现的概率相同，从而使该图像的嫡最大，即图像包含的信息量最大。对总像素数为，灰度级为l 的数字图像，其第k 级灰度出现的概率为 p ( j ) = 百n k 0 5 1 = o 1 ，一1 ( 2 _ 4 ) 其中，珥为，j 在图像中出现的次数。则直方图均衡的变换函数为女 “ s k = p ( ) = 等 ) 门 i 一 ( a ) 原图黑 i 卅 ( b ) 均衡化后里二童叁堕堡型墅垄一l 训柚k c ) 均衡化前图像的直方图川山 ( d 】均衡化后图像的直方图图2 - 5 图像直方图均衡化前后图像效果和直疗图比较图2 - 5 中，原图2 - 5 ( a ) 的直方图分布如图2 - 5 ( c j 所示。从图2 - 5 ( c ) 中可以看出原图像的像素值并未占满整个2 5 6 级灰度范围，图像的对比度不高。目2 - 5 f b ) 为图2 - 5 ( a ) 直方图均衡处理后得到的图像，其直方图分布如图2 - 5 ( d ) 所示。由图2 - 5 ( d ) 可知图2 - 5 ( b ) 的像素值与图2 - 5 ( a ) 相比较为均匀的占满整个2 5 6 数灰度范围，图像的对比度较高。由上述比较和人脸识别仿真实验表明，图像经过直方图均衡后能够提高清晰度和增加对比度，并且可以在一定程度上消除光照因素对算法识别结果的影响。 2 23 图像锐化处理图像锐化处理可以使图像的边缘增强。微分锐化法是一种基于空域处理的锐化方法。在图像平滑处理中，采用的邻域平均法类似于积分过程，处理结果使得图像的边缘变模糊。与积分相反的过程，微分处理可以使图像边缘清晰化。最常用的微分锐化处理方法为梯度算于法和拉普拉斯算子法m 口l 。 i 梯度算子对图像函数f ( xv j 定义其在点kv i 处的梯度为矢量g 【，( - 1 j 】，则一二二。一一一第二章人脸识别综述 g f ( x ，y ) 】- 秘。 a x 彭砂 ( 2 6 ) 由梯度的定义可得该矢量有两个重要性质： ( 1 ) 矢量否【厂( x ，y ) 】的方向就是图像函数f ( x ，y ) 最大变化率的方向。 ( 2 ) 定义矢量g f ( x ，y ) 】的幅度函数为g f ( x ，y ) 】，则町瓴卅脚+ 鲫弘7 ， g f ( x ，y ) 】的方向角秒可表示为肚协- i ( 鬻】 ( 2 8 ) 梯度算子具有各向同性和位移不变特性，作为锐化算子时可以增加图像灰度的变化范围。但是获得图像的梯度值g f ( x ，y ) 】和方向角秒的计算量较大，所以通常使用r o b e r t s 算子，s o b e l 算子和p r e w i t t 算子等梯度算子进行图像锐化处理。 2 拉普拉斯算子拉普拉斯( l a p l a c i a n ) 算子是一个二阶导数算子，它具有各向同性。连续函数 f ( x ，y ) 在点( 工，y ) 处的拉普拉斯算子定义为 v 2 厂：祟+ 祟( 2 - 9 ) 由于数字图像属于离散信号，图像f ( x ，j ，) 的拉普拉斯变换定义为 v 2 厂少) = v ，, 2 f ( x , y ) + v y 2 厂化少) ( 2 1 0 ) 其中v x z f ( x ，y ) ，v y z f ( x ，少) 是厂( 工，y ) 在x ，y 方向上的二阶差分，从而可得图像信号f ( x ，y ) 的拉普拉斯算子为 v 2 f ( x ，y ) = 【f ( x + l ，少) + f ( x - 1 ，y ) + 厂( x ，少+ 1 ) + 厂( x ，y 一1 ) 卜4 f ( x ，y )( 2 1 1 ) 如果将图像对角线上的像素也加入拉普拉斯变换，则上式可扩展为 v 2 f ( x ，j ，) = 【厂( x + 1 ，少一1 ) + ( x + 1 ，y + 1 ) + 厂( x 一1 ，y + 1 ) + ( x 一1 ，y 一1 ) ( 2 - 1 2 ) + 厂( x + 1 ，y ) + f ( x - 1 ，y ) + ( x ，y + 1 ) + 厂( x ，y - 1 ) - 8 f ( x ，y ) 公式( 2 1 1 ) 和( 2 1 2 ) 用模板可分别表示为图2 - 6 ( a ) 和图2 - 6 ( b ) 口口 ( a )( b ) 图2 - 6 拉普拉斯算子的模板及其扩展模板第二章人脸识别综述 2 3 人脸特征提取方法特征提取是人脸识别系统中的关键步骤，是人脸识别技术的核心。能否有效且快速的提取图像的特征直接决定人脸识别算法能否得到广泛应用。特征提取决定着后续分类器类型的选择，直接影响算法的最终识别效果。目前，人脸识别中常用的基于全局特征的提取方法主要有以下几种： 1 基于主元分析的方法主元分析( p r i n c i p a lc o m p o n e n ta n a l y s i s ) 基于离散k l 变换【6 l ，是图像压缩中的一种最优正交变换。通过p c a 运算可以把图像从高维向量的表示转换到低维向量，并且从低维向量恢复原图像时重建图像与原图像之间具有最小的均方误差。因此可以用低维向量中的元素来表示图像的特征，这些元素称为图像特征的主元。p c a 是人脸识别一种经典的基于全局统计信息的特征提取算法，可以快速，有效的获取人脸图像的主要信息。但是p c a 方法的识别效果易受光照和面部表情、姿态等因素的影响。许多学者针对p c a 方法的缺点进行了改进，提出了双子空间法，相形歧义分析方法，f i s h e r 脸方法等i lj 。二维主元分析( 2 d p c a ) 1 7 j 是一种直接基于二维图像矩阵运算的最优压缩技术。它根据最大化散布矩阵准则求得一系列最佳投影向量，将图像投影到最佳投影向量上得到图像的投影特征向量。这些投影特征向量可以很好的恢复原图像，重建图像的质量优于p c a 算法下图像重建后的质量。因此可以使用这些投影特征向量作为图像的特征。在人脸识别中，2 d p c a 方法的总体计算量比p c a 方法少，识别效果优于后者。但是2 d p c a 变换只在一个方向上对图像进行压缩，相比p c a 方法重建图像时需要的系数太多。针对这些缺点，2 d p c a + p c a t 7 ， d i a g p c a t 8 1 ，( 2 d ) 2 p c a t 9 1 ，变换域二维主元分析( t d 2 d p c a ) 【1 0 1 ，二维随机子空间分析( 2 d r s a ) t ，i m a g ep c a f l 2 j 等改进方法相继被提出。 2 基于弹性图匹配的方法弹性图匹配【】【2 】【1 3 】是一种基于动态链接结构的方法。该方法采用网格作为模板，将图像之间的比较变为网格之间的比较。在二维空间中为人脸图像建立属性拓扑图，把拓扑图放置在人脸上，每个节点包含一个特征向量，它记录了人脸在该顶点附近的分布信息，节点间的拓扑连接关系用距离向量表示，从而构成基于二维拓扑图的人脸描述。匹配过程为：首先将库中人脸和待识别人脸的弹性图进行匹配，找出最相似的人脸图像，再对图像中的每个节点位置进行最佳匹配。弹性图匹配方法对光照，位移，旋转及尺度变化都不敏感，但是识别系统需要对每个存储的人脸计算其二维拓扑图，这个过程计算复杂，存储量大。第二章人脸识别综述 3 基于人工神经网络的方法，人工神经网络( a r t i f i c i a ln e u r a ln e t w o r k ，简称朋州) 在人脸识别中有很长的应用史，它具有特殊的适合人脸识别的优势。人工神经网络不像其它方法那样通过描述人脸图像的规律或规则来提取图像特征，它能够根据由代表性的样本自我学习获得人脸图像难以表达的特征信息，具有很强的鲁棒性和自适应性。此外，人工神经网络以并行的方式处理信息，如果用硬件实现，可以显著的提高人脸识别的速度。人工神经网络在人脸识别领域中还可以应用于性别识别和种族识别等。神经网络在图像压缩中应用实例很多，典型的有g o l o m b 等人使用如图2 7 所示的自适应神经网络压缩图像特征信息【l4 1 。要想把s 维图像信息压缩为k 维，只需要通过训练使图2 - 8 中的神经网络的输入和输出相等即可。c o t t r e l i 和 f l e m i n g 首次用三层b p 网络( 4 0 9 6 * 8 0 * 4 0 9 6 ) 对人脸灰度图像数据进行压缩，网络结构如图2 7 所示。这样对b p 网络训练后，就可以把三层网络的隐层输出作为图像的特征信息送入分类器分类。其他一些用于特征提取的神经网络有无监督监督混合神经网络，基于概率决策神经网络，时滞神经网络，主元神经网络掣。虽然神经网络在人脸识别系统的特征提取及分类中有很多应用，但是由于目前人们对人脑本身的探索和研究还处于初级阶段，神经网络也仅仅是对人脑简单的模拟，因此神经网络在人脸识别中的应用还受到诸多限制。图2 7 自适应神经网络特征压缩 4 0 9 6 个节点 4 0 9 6 个节点图2 8 三层b p 神经网络特征压缩 4 基于小波变换的方法随着小波分析理论的日趋成熟，用小波变换方法对图像进行压缩，提取图像第二章人脸识别综述的特征成为当前的研究热点。小波变换以时间和频率的局部化提供了信号的一个多分辨率表示。通过对小波尺度函数进行伸缩，平移可以在不同分辨率上对图像进行细化分析，从而可以将图像的主要信息映射到低频分量上，将噪音和细节信息映射到高频分量上。通过舍弃高频分量而分析低频分量实现滤出对人脸识别作用不大，甚至是干扰因素的冗余信息。小波变换对人脸的细节表情不敏感，可以在一定程度上容忍光线和角度的干扰【2 】【3 】【1 5 】。 5 基于支持向量机的方法支持向量机( s u p p o r tv e c t o rm a c h i n e ，简称s v m ) t 2 】【1 3 】，由v a p n i k 首先提出，它的基本思想是通过非线性变换将输入空间变换到高维空间中，在高维空间中求取最优线性分类面，以解决那些线性不可分的分类问题。这种非线性变换时通过定义适当的内积函数来实现的。s v m 技术中核函数及其参数的选取难度较大。由于它基于结构风险最小化原理，而不是传统统计学的经验最小化，因而表现出很多优于已有方法的性能。但是s v m 训练时需要大量的存储空间，非线性s v m 分类器需要较多的支持向量，速度很慢。 2 4 分类器的设计设计分类器的目的是将未知类型的样本分类到最可能的归属类别中。在人脸识别中分类器的选择和设计对识别结果起着十分重要的影响。根据特征提取算法提取的图像特征数据的特点，选择一个合适的分类规则会明显的提高算法的识别率。本节简单介绍人脸识别中一些常用的分类方法。 1 最小距离分类器最小距离分类器l l6 】的基本思想是首先根据第k 类的训练集样本的算术平均生成代表该类的中心向量麒，其次对于每一个待分类向量x ，计算x 与, u k 之间的距离d k ，最后把x 判别为与之距离最近的类，即由m i n ( d k ) 找出数值最小的d k 并将x 判别为第k 类。最小距离分类器常使用以下距离： 1 欧几里得距离 d = | i x - - g ki i( 2 一1 3 ) 2 标准化欧氏距离 d k = ( x t u k ) 1a - k 1 ( x 一鲰) ( 2 - 1 4 ) 第二章人脸识别综述 = ( 2 1 5 ) 其中q 1 ，吒2 ，。为第模样本协方差矩阵对角线上的元素，q ，表示第七类所有样本属性i ( i = l ，2 ，1 ) 的值的方差。 3 马哈利诺贝斯( m a h a l a n o b i s ) 距离以= 瓜彳了可而万 ( 2 1 6 ) 其中足表示第k 类样本的协方差矩阵。基于欧几里得距离的分类器只需要计算向量差的范数，计算量小，速度最快，但是分类效果不佳。基于标准化欧式距离的分类器需要计算属性的方差以作为各属性的权值，以较小的时间代价提高了分类准确率。基于马哈利诺贝斯距离的最小分类器对于某些数据集分类具有更好的性能，但是与另外两种距离相比时间代价最大。 2 最近邻分类器假设模式类别数为p ，每个类别的训练样本数为m 。( k = l ，2 ，p ) 。最近邻分类器【1 7 】的基本思想是将未知样本x 与各类中全部训练样本作比较，并将未知样本x 判别为与之距离最近的样本的类别。最近邻规则可以采用不同的距离测量方法，包括上面介绍的欧几里得距离，标准欧氏距离和马哈利洛贝斯距离。与最小距离分类器相比，最近邻分类器可在一定程度上克服各类样本均值向量的偏差所造成的影响。假设第k 类的判别函数为颤( x ) = i n i i ni lx x l i ，= 1 ，2 ，m 七 ( 2 - 1 7 ) j 其中x y 表示第k 类的第，个样本。如果吕( x ) = m i l l g t ( x ) ，七= 1 ，2 ，m 七 ( 2 1 8 ) 则把x 判别为第i 类。在训练样本足够大的情况下，最近邻分类规则具有良好的性能。 3 神经网络分类器本文2 3 节简述了神经网络在人脸特征提取中的应用。实际上神经网络还可以作为一个性能优越的非线性分类器，具有很强的分类能力，可以在特征空间内形成任意复杂的决策区域。并且神经网络分类器便于训练，无需过多的人为干预，如果加以硬件实现将比传统分类器具有更快的分类速度1 8 ”】。神经网络分类器的实现流程如图2 - 9 所示。第二章人脸识别综述图2 - 9 神经网络分类器的实现流程 4 朴素贝叶斯分类器朴素贝叶斯分类器口研可以预测一个未知待分类样本x = “，x 2 ，属于某一类别的概率。朴素贝叶斯分类器假定给定特征对类的影响独立于其他特征。假设x 为一个未知待分类样本向量，c ，为某个类别向量。如果将特定样本x 分配给类别c ，则这个分类问题由p ( c ，lx ) 决定。根据贝叶斯定理可知， p ( c il x ) = x 警( 2 1 9 ) 其中对所有类p ( x ) 相同，由于类的先验概率未知，则可将p ( c 。) ，p ( c ：) ，p ( c 。) 看作等概率事件。为了简化计算，假定给定特征向量的属性值之间相互条件独立，即一个属性值对给定类的影响独立于其他属性值。则可得， p ( xc f ) = 尸( 玉，乇，而ic f ) ：nicp(xkc i ) ( 2 。2 0 ) = n ) 毕。w 其中p ( x klc f ) 可以从训练样本估值得到。对n 个类别 c 。，c ：，c 疗，朴素贝叶斯分类器将未知样本x 分配给c f 类，当且仅当 p ( xi c f ) p ( xi c ) ，1 i ，j ，z ，f j( 2 - 2 1 ) 2 5 本章小结本章首先简述了人脸识别的主要研究内容，并给出完整的人脸识别系统模型。并对人脸识别系统中人脸图像预处理，基于全局的图像特征提取方法和分类器设计展开了简单讨论。针对人脸识别系统中需要对训练图像和待分类图像进行预处理步骤，介绍了几何变换，灰度变换和图像锐化等常用的图像预处理方法。图像预处理虽然可以第二章人脸识别综述削弱图像的自身和外在因素对算法识别结果的影响，但是如果预处理过度，那么这种影响可能是负面的。图像裁切虽然能够减小头发因素对识别结果的影响，但是在人脑分辨不同人脸时，头发因素通常可以作为区别性别的特征；灰度变换虽然可以改变人脸图像灰度值，但是人脸的肤色可以作为辨别种族的特征。因此，在人脸识别中应该选取哪种处理方法不是固定的，应该根据识别对象的统计特点和算法的特性综合选择。针对人脸识别系统中特征提取步骤，本章简单介绍了基于主元分析，弹性图匹配，人工神经网络，小波变换和支持向量机等当前常用的几种基于全局的特征提取方法。在关于分类器设计的讨论中，介绍了人脸识别中比较常用的最小距离分类器，最近分类器，神经网络分类器和朴素贝叶斯分类器等几种分类方法。其中本文的后续章节的实验中所用到的距离函数均采用欧几里得距离。第三章基于p c a 的识别方法 3 1p c a 方法第三章基于p c a 的识别方法 3 1 1 离散k l 变换原理离散k a r h u n e n l o e v e 变换，简称离散k l 变换，也称特征向量变换，霍特林变换或主元分析，它是完全从图像的统计性质出发实现的变换，在统计识别中有重要的应用6 i t 2 。假设x 是一个1 的随机向量，即x 的每个元素x i 都是一个随机变量。x 的均值，2 ，可以用三个这样的样本向量来估计， m x x i ： ( 3 1 ) x 了己 ( 3 。1 ) 上o ，= l 协方差矩阵可由公式( 3 2 ) 估计， 1 c x = 研( x - - ，z ，) ( x m ，) 1 】x i x t _ m j 朋工t ( 3 - 2 ) oi = 1 由公式( 3 - 2 ) 可知，协方差矩阵是一个n x n 的实对称矩阵，其对角线元素为各个随机变量的方差，非对角线元素为各随机变量的协方差。k l 变换用矩阵彳来定义一个线性变换，它可以将任意向量x 通过下面线性变换得到一个向量y y = 彳( x m ，)( 3 3 ) 其中彳的各行为e 的特征向量，e 的特征向量按照这样的规则构成：先将e 的特征值按大小降序排列，特征向量按照对应的特征值排列的顺序排列。由于k l 变换所得的向量y 具有零均值特性，则可得y 的协方差矩阵c 。与x 的协方差矩阵 c 。的关系为 cy=彳e彳1(3-4) 因为a 实际上就是e 的特征矩阵的转置，所以c ，是对角矩阵且其对角线上的元素为c ，的特征值。则有 c y m ( 3 5 ) 由公式( 3 - 5 ) 可知，向量y 的各个元素之间互不相关，从而说明线性变换彳去掉了变量之间的相关性。由于实对称矩阵e 的特征矩阵是酉矩阵，故有第三章基于p c a 的识别方法 a = a 1 ( 3 6 ) 则k l 逆变换为 x = a 叫y + 研工= a 1 y + ( 3 7 ) 在实际使用k l 变换时，可以只选取较大的特征值对应的特征向量，而舍弃那些在所有特征值中所占比重较小的特征值所对应的特征向量。这样既可以降低变换后向量y 的维数，又可以近似重建向量x 。取矩阵a 的前肘行( m 如如) ，对应的特征向量为v = i h ，v 2 ，一，】。由奇异值分解理论可得，矩阵c 的特征向量“，可由差值图像耳与u 按照公式( 3 - 1 8 ) 线性组合得到，即 q 。赤赤x v i , 纯“) ( 3 。2 3 ) u = 击删一 ( 3 - 2 4 ) u ，即为特征脸子空间中的特征向量或特征脸，【，即为“。组成的特征脸子空间。实际上在人脸识别中并不需要采用全部特征向量张成特征脸子空间，而且每个特征向量在识别中所起的作用也不同。那些较大特征值对应的特征向量，描述了人脸图像的大致形状，属于低频分量，在识别中起主要作用。而那些较小特征值对应的特征向量，描述了人脸图像的细节信息。属于高频分差，在人脸识别中作用较小，而且还包含一些干扰噪声。从能量角度分析，图像的低频分量包含着图像的主要能量，高频分量只包含较少能量。因此，在使用特征脸方法进行人脸识别时，可以只选择前k 个较大特征值对应的特征向量来近似表达人脸图像。以o r l 人脸库为倒，选取4 0 个人脸类别，每个类别前5 幅图像为训练样本进行训练得到的平均脸，特征值分布和前4 0 个最大特征值对应的特征脸图像如圈3 - 】所示：口 f a l 平均脸f b ) 特征值分布情况墨三至垂士! 皇塑望型互些国函陵熏 l 蓬凰黧隔鬣藿 l 霪陵蕨

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（通信与信息系统专业论文）主元分析在人脸识别中的应用研究.pdf

文档简介

温馨提示

最新文档

评论

（通信与信息系统专业论文）主元分析在人脸识别中的应用研究.pdf

文档简介

温馨提示

最新文档

评论

相关文档