（信号与信息处理专业论文）基于子空间的人脸识别算法研究(1).pdf

上传人：灰*** IP属地：宁夏上传时间：2019-12-09 格式：PDF 页数：83 大小：10.02MB 积分：0 举报 版权申诉

已阅读5页，还剩78页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

中文摘要摘要：人脸识别是图像处理和模式识别领域中的一个重要课题。在全球近6 7 亿人中，我们竞找不出完全相同的人脸。在人们对快速高效的自动身份验证要求日益迫切的当今，人脸识别具有重要的理论和应用价值。在大量来自模式识别、计算机视觉、神经计算、生理学等领域的研究人员对自动人脸识别艰苦工作4 0 余年之后，能否设计出与人类一样具有人脸识别能力的自动机器仍然困扰着研究人员，这也使得人脸识别成为一个极具挑战性的课题。本文分析和研究了大量近年来国内外关于人脸识别的学术文献，针对人脸识别中基于子空间的特征提取方法进行了深入的研究。实验表明本文研究及改进的特征提取算法对人脸识别是合理有效的，具有一定的理论价值与实用价值。本文的研究工作主要包括以下几个方面：第一，在研究并实现已有的经典统计特征提取算法p c a 及其核形式k p c a 的基础上，对核分析的特性进行了研究和论述，阐述了核方法的模块性，为后续章节中将基于l d a 及l p p 算法的核化奠定了基础。第二，针对小样本问题，在分析和研究l d a 和d l d a 算法的基础上，提出了基于样本方差和偏差均衡化改进的r l d a 算法，并应用两种核函数将其发展成非线性核分析方法r k d a 。第三，应用最佳线性嵌入改进了局部保留投影算法，并将其发展成非线性的核方法。最后，通过加入样本类别信息，第四，分析了实际的人脸识别系统，的评价分析。进一步将其发展成为有监督的方法。对本文涉及算法进行了实际应用可行性关键词：子空间模式分析；核方法；主分量分析；判别分析；局部保留投影；最佳线性嵌入；实时人脸识别系统分类号： j 匕塞銮垣太堂亟堂位i 金塞垦墨ir ! a bs t r a c t a b s t r a c t ：f a c er e c o g n i t i o ni sa ni m p o r t a n tr e s e a r c hf i e l di ni m a g ep r o c e s s i n ga n d p a n e r nr e c o g n i t i o n n oo n ec a nf i n dt w oh u m a nf a c e st h a te x a c t l yt h es a m et h r o u g ho u t t h ew o r l d t h e r e f o r e ，t h er e s e a r c ht o p i ch a sas i g n i f i c a n tt h e o r e t i c a la n dp r a c t i c a lv a l u e a st h ed e m a n do fh i g h l ye f f i c i e n ta n de f f e c t i v eb i o - i d e n t i f i c a t i o nn o w a d a y s a f t e r4 0 y e a r so fr e s e a r c hi np a t t e r nr e c o g n i t i o n ，c o m p u t e rv i s i o n ，n e u r a ln e t w o r ka n d p h y s i o l o g ye t c ，r e s e a r c h e r ss t i l lc a nn o tb et h e o r e t i c a l l yp r o v ew h e t h e ri ti sp r a c t i c a l t oi n v e n tah u m a n - l i k ea u t o - m a c h i n ef o rf a c er e c o g n i t i o n ，w h i c hm a k e st h er e s e a r c h t o p i cm u c hm o r ec h a l l e n g i n g a f t e ra na b u n d a n ts t u d ya n dr e s e a r c ho f p a p e r si nt h i sf i e l d ，a ni n - d e p t hr e s e a r c ho f s u b s p a c eb a s e df a c er e c o g n i t i o na l g o r i t h m sa r ep r e s e n t e di n t h i sp a p e r e x p e r i m e n t s s h o wt h a tt h ei m p r o v e da l g o r i t h m sp r e s e n t e di nt h i sp a p e ra r eo fb e r e rp e r f o r m a n c ea n d c e r t a i nt h e o r e t i c a la n dp r a c t i c a lv a l u ea sw e l l t h er e s e a r c hw o r ka b o v e m a i n l yi n c l u d e s t h ef o l l o w i n gs e v e r a la s p e c t s f i r s t ，r e s e a r c ho nt h eq u a l i t yo fk e r n e lm e t h o d sb a s e do nt h es t u d ya n di m p l e m e n t p c aa n dk p c af o rf a c er e c o g n i t i o n s e c o n d ，a ni m p r o v e dl d am e t h o db a s e do nr e g u l a r i z e dp a r a m e t e ri sp r e s e n t e dd u e t ot h es s sp r o b l e ma f t e ra ni n - d e p t hs t u d yt h el d aa n dd i r e c tl d am e t h o d sf o rf a c e r e c o g n i t i o n f u r t h e rm o r e ，t h ek e r n e lf o r mo ft h ei m p r o v e dl d am e t h o dh a sp r e s e n t e d b a s e do nt w ok i n d so fk e r n e lf u n c t i o n s t h i r d ，a ni m p r o v e dl o c a l i t yp r e s e r v i n gp r o j e c t i o ni sp r e s e n t e db a s e do no p t i m a l l i n e a re m b e d d i n g ，f u r t h e rm o r e ，i t sk e r n e lf o r ma n ds u p e r v i s e df o r ma r ep r e s e n t e db a s e d o nt h e o r e t i c a ld e d u c t i o n l a s t ，f e a s i b i l i t ya n a l y s i s o ft h e a l g o r i t h m sp r e s e n t e di n t h i sp a p e rh a sb e e n a d d r e s s e dw h e na p p l i e dt or e a lw o r l df a c er e c o g n i t i o ns y s t e m s k e y w o r d s ：s u b s p a c ep a t t e r na n a l y s i s ；k e r n e lm e t h o d s ；p r i n c i p a lc o m p o n e n t a n a l y s i s ；d i s c r i m i n a n ta n a l y s i s ；l o c a l i t yp r e s e r v i n gp r o j e c t i o n ；o p t i m a ll i n e a r e m b e d d i n g ；r e a l t i m ef a c er e c o g n i t i o ns y s t e m c i a s s n o ：学位论文版权使用授权书本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索，并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名：亳产t , r 切r o 胛l e 导师签名：签字日期：加尹夥年6 月i e t 签字日期： p 独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果，除了文中特别加以标注和致谢之处外，论文中不包含其他人已经发表或撰写过的研究成果，也不包含为获得北京交通大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文作者签名：品品签字日期旧年 6 月占日 7 8 致谢本论文是在我的导师阮秋琦教授的悉心指导下完成。阮教授严谨的治学态度、渊博的学识，平易近人的品质，使我受益匪浅。作为阮老师的学生，我由衷感到幸运，同时也是在图像模式识别领域内工作的一种激励。阮老师为我们创造了宽松的科研环境，广泛的研究课题，能够完全按照自己的兴趣选择研究方向，同时在诸多方面提出开阔思路的建议。藉此论文完成之际，向培养我的导师表达我的感激之情。在我攻读硕士学位期间，信息所胡绍海老师、苗振江老师、梁满贵老师、丁晓明老师和倪蓉蓉老师等，也给予了我很多的帮助，在此向几位尊敬的老师表示衷心的感谢。在实验室工作和撰写论文期间，阮宇慧、李杰、鲍征、刑文浩、支瑞聪等同学对我论文的研究工作给予了热情帮助，在此向他们表达我的谢意。最后感谢我的家人，他们的鼓励和支持使我完成硕士阶段的学业。序本论文得到国家自然科学基金( n o 6 0 4 7 2 0 3 3 ) 、国家9 7 3 项目基金 ( n o 2 0 0 4 c b 3 1 8 0 0 5 ) 以及教育部博士点项目基金( n o 2 0 0 3 0 0 0 4 0 2 3 ) 资助，并在我的导师阮秋琦教授的悉心指导下完成。随着社会的发展以及技术的进步，人们对快速高效的自动身份验证的要求日益迫切，生物识别技术在科研领域得到了极大的重视和发展。在人与人的接触中，人脸所包含的视觉信息占据了重要地位，它是无疑是区分人与人之间差异的最重要特征之一。而相对于指纹、虹膜、掌纹、步态、笔迹、声纹等生物特征，利用人脸来识别具有不可比拟的优势。本文分析和研究了大量近年来国内外关于人脸识别的学术文献，针对人脸识别中基于子空间的特征提取方法进行了深入的研究。实验表明本文研究及改进的特征提取算法对人脸识别是合理有效的，具有一定的理论价值与实用价值。 1 综述 1 1人脸识别的研究背景 1 1 1 人脸识别的研究意义地球上居住着近6 7 亿人，每个人都有着独一无二的面孔。人的面孔都由额头、眉毛、眼睛、鼻子、嘴巴、双颊等少数几个区域组合而成，它们之间的大体位置关系也是固定的，并且每张脸的大小不过七八寸见方，然而它们形成了异常复杂的模式，以至于你找不到完全相同的面孔。那么，区分如此众多的不同人脸的“特征到底是什么? 我们是否能够描述出区分自己熟悉的面孔依据了什么具体特征? 一般人很难区分面容极其相似的双胞胎，其家人却能够非常容易地根据他们面孔上的细微差异将他们区分开来。即使专门从事相关的生理学、心理学、神经科学研究的一些专家，也很难描述清楚人类人脸识别的生理学过程。那么，能否设计出具有与人类一样的人脸识别能力的自动机器? 这种自动机器的人脸识别能力是否能够超越人类自身? 对这些问题的分析和解答无疑具有重要的理论和应用价值。随着社会的发展以及技术的进步，人们对快速高效的自动身份验证的要求日益迫切，生物识别技术在科研领域得到了极大的重视和发展。在人与人的接触中，人脸所包含的视觉信息占据了重要地位，它是无疑是区分人与人之间差异的最重要特征之一。而相对于指纹、虹膜、掌纹、步态、笔迹、声纹等生物特征，利用人脸来识别具有不可比拟的优势，它操作隐蔽，特别适用于安全、监控和抓逃工作：非接触式采集，无侵犯性，容易接受；方便、快捷、强大的实时追踪能力；符合人类识别习惯，交互性强；应用摄像头即可完成图像采集，设备成本较低。而人脸识别就是利用计算机从图像或图像序列中检测出人脸，并判断其身份。 1 1 2 人脸识别的研究内容计算机人脸识别的研究内容从广义上讲大概包括以下几个方面【1 】【2 1 ： 1 人脸检测( f a c ed e t e c t i o n ) ，就是从各种不同的场景中检测出人脸的存在并确定其位置。这方面的研究主要受光照、噪声、面部倾斜度以及各种各样的遮挡的影响。 2 人脸表征( f a c er e p r e s e n t a ti o n ) ，就是采取某种表示方法表示检测出的人脸和数据库中的已知人脸。通常的表示法包括几何特征( 例如欧氏距离、曲率、角度等) 、代数特征( 例如矩阵特征矢量) 、固定特征模版、特征脸等。 3 人脸鉴别( f a c ei d e n t i f i c a t i o n ) ，就是通常所说的“人脸识别”，将待识别的人脸与数据库中的已知人脸比较，得出相关信息。这个过程是选择适当的人脸表征方式与匹配策略。整个识别系统的构造与人脸的表征方式密切相关。 4 表情姿态分析( e x p r e s s i o ng e s t u r ea n a l y s i s ) ，就是对待识别人脸的表情或者姿态信息进行分析，并对其进行分类。 5 生理分类( p h y s i c a lc l a s s i f i c a t i o n ) ，就是对待识别人脸的生理特征进行分析，得出其年龄、性别等相关信息。 1 1 3 人脸识别的主要应用人脸识别目前主要应用在如下三个方耐3 】：第一，刑侦破案方面的应用。公安部门获得案犯的照片之后，可以利用人脸识别技术在存储罪犯照片的数据库罩找出最相像的人为嫌疑犯。还有一种应用就是根据目击证人的描述画出草图，然后用该草图到库里去寻找嫌疑犯。罪犯数据库往往很大，通常由几千幅图像组成，如果这项搜索工作由人工完成不仅效率低而且容易出错，因为人在看了上百幅人脸图像后记忆力会下降，而由计算机来完成则不会出现此问题。第二，证件验证方面的应用。身份证驾驶执照以及其它很多证件上都有照片，现在这些证件多是人工验证的，如果应用人脸识别技术，这项任务就可以交给机器完成，从而实现自动化智能管理。另外，像信用卡、银行卡等安全需求较高的卡，因为卡被窃取、密码丢失或遗忘给卡的使用和管理带来很大的不便，如果在这类卡上加上人脸的特征信息则可大大改善其安全性能，从而提高其管理和应用的便捷。 2 第三，入口控制方面的应用。入口控制的范围很广，它可以是设在楼宇单位或私人住宅入口的安全检查，也可以是计算机系统或者情报系统等的入口检查。在楼宇或某些安全部门的入口处比较常用的检查手段是核查证件。在人员出入频繁的情况下，要求保安人员再三检查证件是很麻烦的，而且安全系数也不高。在一些保密要求非常严格的部门，除了用证件还要用一些另外的识别手段，如指纹识别、掌纹识别、视网膜识别和语音识别等。人脸识别与之相比具有直接方便和友好的特点。另外，在当前倍受重视的计算机系统的安全管理中，通常使用由字符和数字组成的口令可能会被遗忘或者破解，但是如果把人脸当作口令则又方便又安全。综上所述，人脸识别技术具有广泛的应用前景。在国家安全军事安全和公共安全领域中，智能门禁、智能视频监控、公安布控、海关身份验证、司机驾照验证等都是典型的应用；在民事和经济领域，各类银行卡、金融卡、信用卡、储蓄卡的持卡人的身份验证、社会保险人的身份验证等具有重要的应用价值；在家庭娱乐等领域，人脸识别也具有一些有趣有益的应用，比如能够识别主人身份的智能玩具、家政机器人等等。随着研究的发展，人脸识别技术已经渗入到更多的领域，比如视频会议机器人的智能化研究以及医学等方面。 1 2 人脸识别研究的发展 2 0 世纪6 0 年代末至7 0 年代初，入脸识别研究刚刚起步【4 】。最早的研究者是 b l e d s o e 5 1 ，他建立了一个半自动的人脸识别系统，主要是以人脸特征点的间距、比率等参数为特征。人脸识别的特征提取可分为基于几何特征和基于统计特征两大类。早期的入脸识别研究主要是基于几何特征，其基本思想就是利用人脸上的一些特征点的相对位置和相对距离，再辅以人脸轮廓的形状信息，其最大的缺点是识别的准确率完全依赖于几何特征的提取，而这些几何特征的提取对光照、表情、姿态等变化非常敏感，所以稳定性不高，识别率较低。基于几何特征识别的方法具有如下优点：符合人类识别人脸的机理，易于理解；对每幅图像只需存储一个特征矢量，存储量小；对光照变化不太敏感。该方法缺点是：从图像中抽取稳定的特征比较困难；对强烈的表情变化和姿态变化的鲁棒性较差；一般几何特征只描述了部件的基本形状与结构关系，忽略了局部细微特征，更适合于粗分类。总体来讲，基于几何特征的人脸识别方法，特征提取不精确，而且由于忽略了整个图像的很多细节信息，识别率较低，所以近年来已经很少有新的发展。 2 0 世纪9 0 年代以来，随着计算机软硬件性能的迅速提高，以及在实际应用上对人脸识别能力的要求，使发展更具鲁棒性的人脸识别方法成为时代的必然。人脸识别由基于局部几何知识建模转变为基于全局统计建模。基于统计特征的识别方法应运而生，并且很快成为研究的热点。与基于局部特征的人脸识别方法相比较，基于整体特征的识别充分利用了人脸各个特征点之间的拓扑关系和各个器官自身的信息，可以避免提取面部局部特征的操作，从而使识别的鲁棒性有所提高。麻省理工学院人工智能实验室的b r u n e l l i 和p o g g i o 于1 9 9 2 年通过实验对比了基于结构特征的方法与基于模板匹配的方法的识别性能，并给出了一个比较确定的结论：模板匹配的方法优于基于结构特征的方法。这一导向性的结论基本中止了纯粹的基于结构特征的人脸识别方法研究，并在很大程度上促进了基于表观 ( a p p e a r a n c e b a s e d ) 的线性子空间建模和基于统计模式识别技术的人脸识别方法的发展，使其逐渐成为主流的人脸识别技术。这一类方法主要有：子空间方法，弹性图匹配法，基于隐马尔可夫模型的方法，基于神经网络的方法以及基于支持向量机的方法。 1 3 人脸识别算法人脸识别涉及到两个方面的问题：一是人脸的表征，也就是提取有效的特征来表征人脸；二是设计高性能的分类器来对所表征的人脸进行识别分类。这两部分常常既相互独立又密切相连。特征提取是模式识别研究的基本问题之一。对于图像识别而言，提取有效的特征是完成图像识别的第一步。目前用于图像识别的特征提取主要有直观几何特征提取、空间域特征提取和变换域特征提取。用于人脸识别的直观几何特征，包括图像的边缘、轮廓、纹理，以及五官尺寸和相对位置等等。这类特征虽然具有维数低的优点，但对于同一个人因表情及 4 光照等条件变化往往会导致其尺寸及相对位置发生较大的变化，因此识别效果并不令人满意。空间域特征提取，主要是将图像看作一种二维随机过程，从而引入统计分析及统计学习方法，如利用样本各阶距作为特征来描述和分析图像，这种方法能够在保留主要分类信息的基础上大大降低特征的维数，从而将人脸识别从高维特征分类问题转化到低维特征分类，大大加快了分类识别速度，保证了人脸识别系统的实时性能。对于变换域特征提取，是对图像作各种数学变换，如傅立叶变换、小波变换等，然后将变换的系数作为图像的一种特征。变换域特征提取在图像特征抽取方面均有广泛应用。这类方法的优点是计算比较方便，但其去相关能力不强。系数特征的维数仍较大。鉴于以上特征提取方法的分析，本论文所研究的算法均为基于空间域的特征提取算法。 1 3 1 子空间方法子空间方法是目前人脸识别的主流方法之一，其思想是根据一定的性能目标来寻找一个线性或非线性的空间变换，把原始信号数据压缩到一个低维子空间，使子空间的数据根据不同的性能目标要求，保留原空间的最大信息量。这为数据描述提供了更好的手段，同时也大大降低了计算的复杂度。目前在人脸识别中得到成功应用的线性子空间方法有【6 】：主元分析( p r i n c i p a l c o m p o n e n ta n a l y s i s p c a ) 、线性判决分析( 1 i n e a rd i s c r i m i n a n ta n a l y s i s l d a ) 、独立元分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s i c a ) 、非负矩阵因子( n o n - n e g a t i v em a t r i x f a c t o r i z a t i o n n m f ) 以及贝叶斯概率子空间( p r o b a b i l i s t i es u b s p a c e ) 。基于核技术的非线性子空间方法有：核主元分析( k e r n e lp c a k p c a ) 、核f i s h e r 判决分析 ( k e r n e lf i s h e rd i s c r i m i n a n ta n a l y s i s k f d a ) 、核独立元分析( k e r n e li c a k i c a ) 等。 1 3 2 弹性图匹配方法弹性图匹配技术( e l a s t i cg r a p hm a t c h i n g ，e g m ) 是人脸识别中的另一种重要 5 方法。w i s k o t t 【7 j 提出了一种利用弹性连接图匹配的人脸识别算法，人脸图像根据 g a b o r 小波变换后的一些特征点存贮为一个柔性的节点图，每个节点对应一串特征向量，这些特征点对视角、大小和表情不太敏感，识别时利用对应点的特征向量进行匹配。弹性图匹配的基本思想是用一个属性图来描述人脸：属性图的顶点代表面部关键特征点，其属性为相应特征点处的多分辨率、多方向局部特征g a b o r 变换特征，称为j e t ；边的属性则为不同特征点之间的几何关系。对任意输入人脸图像，弹性图匹配通过一种优化搜索策略来定位预先定义的若干面部关键特征点，同时提取它们的j e t 特征，得到输入图像的属性图。最后通过计算其与己知人脸属性图的相似度来完成识别过程。弹性图匹配结合了人脸的结构特征和灰度分布信息与g a b o r 小波纹理分析。它在图像空间中依据人脸图像的灰度分布信息选定特征点，以对于通常的人脸变形具有一定不变性的距离为边，采用属性拓扑图来代表人脸。拓扑图的任一顶点均包含一个特征向量，用来记录人脸在该顶点位置附近的信息，如图1 1 。拓扑图的顶点采用了小波变换特征，它对于光线、尺寸、角度具有一定的不变性。弹性图匹配能够容忍表情的变化，并在一定程度上能够容忍视角的变化。图1 1 弹性匹配方法示意图由于该算法不但较好的兼顾到了人脸的整体信息和局部特征，而且利用了 g a b o r 小波变换的结果与人眼视网膜上低层次的细胞对空间的响应相似的特性，因而具有良好的识别效果。但时间复杂度高，实现复杂。特征点的准确定位是影响识别速度的关键因素，因此改进特征点的定位方法，降低特征点的定位的时间耗费是提高识别速度的有效途径。人脸弹性图的设计是弹性匹配人脸识别的前提和 6 基础，主要考虑两个方面的问题：( 1 ) 特征点的选择及特征表征；( 2 ) 边的选择及赋值。因此，一个好的弹性图既要能正确选择特征点和边的位置和数量，又要能够对特征点和边选择合适的表达方式。边的选择要根据特征点的情况进行，因此对特征点选择是弹性图设计的前提和基础。该方法的优点是既保留了面部的全局结构特征，也对人脸的关键局部特征进行了建模。 1 3 3 隐马尔可夫模型方法隐马尔可夫模型方法是应用在语音处理中一种成功的统计方法，近年来很多学者将该方法应用于人脸识别。s a m a r e a 【8 】首先提出了一种基于隐马尔可夫模型的人脸识别方法。一幅二维的图像矩阵首先转换为一个一维的灰度值向量，然后将这个向量用来训练h m m 模型。一个h m m 模型主要包括一个状态转移矩阵a ，它负责记录从一个特征状态转换到另一个特征状态的变换的概率；另外一个是输出概率矩阵b ，主要记录一个状态转换为自身的概率，一个训练好的h m m 模型的序列含有人脸图像不同部位的信息，这些信息为人脸的判别提供了很强的信息。用o r l 的人脸数据库作实验，该方法获得了9 5 0 的正确识别率。 n e f i a n 发展了s a m 耐a 的方法，提出了基于2 d d c t 特征提取的方法。在一定程度上解决了s a m a r i a 的大存储量的缺陷，但识别率提高不大。s t a m e r 于1 9 9 6 年将隐马尔可夫模型( h m m ) 应用于人脸表情识别。 1 3 4 神经网络方法神经网络方法在人脸识别的应用有很长的历史，这类方法主要是将人脸直接用灰度图表征，利用神经网络的学习能力及分类能力进行识别【9 1 。k o h o n e i l 首先利用自联想神经网络存储和重建人脸图像，利用简单点的h e b b i a n 学习规律，人脸图像的自联想记忆创建并存储在神经网络的权值中。实验结果表明，该网络在有噪声甚至部分遮挡的情况下能够很好地重建人脸图像。 s r i n i v a s 和w e c h s l e r 1 1 】提出了一种混合结构的神经网络人脸识别方法，该方法利用r b f 网络和归纳判决树( i n d u c t i v ed e c i s i o nt r e e s ) 作为分类器，用3 5 0 个人的 9 0 4 幅图像进行实验，获得了9 6 0 的正确识别率。 7 n a l ( 锄u r a 【1 2 】等人提出了一种视角与尺度散布关联的神经网络( r s s a nn e t ) ，有效地解决人脸认证对输入人脸图像视角及尺度的依赖影响。通过r s s a n 网络对输入图像进行视角及尺度补偿修正，在适当的阈值范围内，误识率( f a l s e a c c e p t a n c er a t e ) 和误拒率( f a l s er e j e c t i o nr a t e ) 能够达到满足实际应用的要求。神经网络方法在人脸识别上的应用有一定的优势，因为对人脸识别的许多规律和规则进行显形的描述是相当困难的，而神经网络方法则可以通过学习的过程获得对这些规律和规则的隐性表达，它的适应性更强，一般也比较容易实现。神经网络方法的特点是不像其他方法那样要用一套由人确定的学习规则，同时避免了复杂的特征提取工作，它能根据有代表性的样本自我学习，具有很好的自适应性和鲁棒性。此外，神经网络以并行的方式处理信息，如果用硬件实现，就能显著地提高速度。 1 3 5 支持向量机方法支持向量机( s u p p o r tv e c t o rm a c h i n e ) f l qv a p n i k t l 3 】等人于19 9 5 年提出，具有相对优良的性能指标。该方法是建立在统计学习理论基础上的机器学习方法。通过学习算法，s v m 可以自动寻找出那些对分类有较好区分能力的支持向量，由此构造出的分类器可以最大化类与类的间隔，因而有较好的适应能力和较高的分准率。该方法只需要由各类域的边界样本的类别来决定最后的分类结果。 o s u n a 1 4 】最早将s v m 应用于人脸检测，并取得了较好的效果，其方法是直接训练非线性s v m 分类器完成人脸与非人脸的分类。由于s v m 的训练需要大量的存储空间，非线性s v m 分类器需要较多的支持向量，且速度慢。随着s v m 研究的深入，出现了许多支持向量机的扩展算法，使之在某一应用范围有特定的优势。目前支持向量机通过正在更广泛地应用于人脸检测和识别中【1 5 1 6 】。人脸识别与一般的目标识别相比，其训练样本要少的多，它通常比图像空间的维数要低得多，这就是通常所说的小样本问题( s m a l ls a m p l ep r o b l e m s ) 。传统的分类器，如贝叶斯分类器、最近邻分类器、神经网络分类器以及线性判别分类器等，在处理高维数问题时，因为训练样本的不足而难以获得很好的泛化性能。而支持向量机基于结构风险化( s r m ) 原则，在处理小样本、高维数以及非线性问题方面，表现出了很多特有的优势，近年来已经被广泛地应用于函数回归、目标识别和人脸检测与识别中。与传统的神经网络方法相比，支持向量机具有以下几个主要优点有：第一，支持向量机专门针对小样本问题，它性能优良，泛化能力好，不存在过学习问题。第二，支持向量机结构简单，不存在如何确定网络结构等复杂的问题，其求解算法可归结为一个二次优化问题，从理论上说，得到的将是全局最优点，避免了神经网络方法中无法避免的局部极值问题。第三，对于非线性问题，支持向量机通过非线性映射将样本从输入空间映射到高维特征空间，在高维特征空间中构造线性判别函数来实现原空间中的非线性判别函数，其计算复杂性与输入模式的维数没有直接的关系，避免了维数灾难问题。而且通过变化不同的核函数，可以得到各种不同的分类曲面。近年来，支持向量机作为一种数据挖掘算法得到了系统的研究【1 7 】。许多学者提出了一些支持向量机的扩展算法，如c s v m ，v - s v m ，o n e c l a s ss v m ， r s v m ( r e d u c e ds v m ) ，w s v m ( w e i g h t e ds v m ) ，l s s v m ( l e a s ts q u a r es v m ) 等算法。这些扩展算法主要是通过增加函数项、变量或系数等方法使公式变形，产生出各种有某一方面优势或者一定应用范围的算法。c s v m 引入了惩罚参数c 实行对错误分类的惩罚。1 9 9 9 年，m a n g a s a i a n 等人提出了一种对c s v m 变形的算法，即在原目标函数中增加一项使得优化目标多一项，而约束条件减少一项等式约束，变为边界约束条件下的二次规划问题，适合迭代求解。同时应用矩阵分解技术，每次只需要更新l a g r a n g e 乘子的一个分量，从而不需将所有样本载入内存，提高了收敛速度。2 0 0 0 年，由s c h o l k o p f 等人提出了一种v s v m 算法，它使用参数v 来控制支持向量的数目和误差。2 0 0 1 年，由s c h o l k o p f 等人提出的o n e c l a s ss v m 最初是用于高维分布估计，即用来寻找平面v c 维的估计值，只是对正的样本进行训练和测试。该方法通过把数据映射到特征空间，并尽量用一个超球面来描述特征空间的数据，需要把大部分的数据包括到这个超球面。2 0 0 2 年，l i nc h u n f u 等人提出了f u z z ys v m ( f s v m ) 算法，给每个样本都赋一个模糊隶属度值，这样不同的样本对决策函数的学习有不同的贡献，以减少外部的影响。其本质上是一种针对c s v m 的加权s v m ( w s v m ) 。最初s v m 是用以解决两类分类问题，不能直接用于多类分类，如何有效地将其推广到多类分类问题还是一个正在研究的问题。当前已经有许多算法将s v m 推 9 广到多类分类问题，这些算法统称为“多类支持向量机 ( m u l t i c a t e g o r ys u p p o r t v e c t o rm a c h i n e s ，m s v m s ) 。刘志刚等【1 8 1 总结了现有主要的支持向量机多类分类算法，系统地比较了各算法的训练速度、分类速度和推广能力，并分析了它们的不足和有待解决的问题。大量的研究在构造多类支持向量机的问题上结合了聚类和决策树思想，提出了基于决策树的多层支持向量机 1 9 乏2 1 。支持向量机与模糊数学相结合也产生了一系列研究成果，其中李昆仑【2 3 】等将多类支持向量机应用于入侵检测，引入了模糊成员函数构造多类s v m 分类器，为每个训练点指定一个值一模糊值，以区别不同的点对分类结果的影响。由于需要为每个点指定一个模糊值，这时训练集便转化为一个模糊训练集。该算法可以减少噪音数据或孤立点对分类结果的影响，增强算法的鲁棒性。y i h u n gl i u 矧于 2 0 0 7 年提出了一种自适应的模糊支持向量机用于人脸识别，不但解决了应用模糊化过程中对外部点惩罚导致的过拟合问题，还修正了使用不同代价函数所导致的数据集不均衡所求最佳分类超平面的斜度。支持向量机应用于人脸识别，目前的研究方向是在特征子空间的基础上综合运用多种数据融合的方法，实现分等级的分类器设计，比如r o n g - y o n gz h a o 【2 5 】提出了一种将p c a 与支持向量机相结合进行人脸识别的方法，z h i f e n gl i t 2 6 之刀提出了一种基于贝叶斯概率空间的支持向量机用于人脸识别，通过贝叶斯算法将人脸识别问题转化成一个二类分类问题，即由高斯分布建模的入脸类内方差和类间方差，在分类器设计上结合聚类算法，从而降低了需要训练s v m 的数目。 1 4 基于子空间的人脸识别算法 1 4 1 子空间模式识别的特性基于子空间的人脸识别算法在最近几年中对人脸识别这一研究领域做出了很大的贡献，同时深化了我们对人类复杂视觉机制的了解，取得了一定的成功。基于子空间的人脸识别算法的基本过程是：首先通过某种定义的优化准则，求解在统计上对分类最有用的特征矢量集，张成低维的人脸子空间；然后，将训练样本和测试样本映射到这个人脸子空问，得到相应的投影系数。最后计算训练样本和 l o 测试样本投影系数之间的距离，并将此作为判断测试样本与模式类之间相似度的依据，从而判定测试样本的类别。正面人脸图像具有对称性，表面光滑且具有一定的纹理信息，局部像素间又具有较强的相关性，这说明人脸图像像素之间是非紧致的，存在冗余信息，这些冗余信息对人脸图像的类别分析没有贡献。因此相对于原始的高维图像空间而言，真正的与人脸类别有关的信息是在一个被称为人脸空间的低维子空间中，也可以说，人脸空间是作为一个主元区域镶嵌在原始的高维图像空间中。人脸空间的本质维数统计有几个因素造成每幅图像的不同，如果人脸图像是在光照角度不同、多类人、表情不同、姿态不同，这4 个条件下形成的，那么本质维数为4 。子空间分析的目的是试图找到这个维数，并且找到对应这个维数的主元区域模式( m a n i f o l dp r i n c i p a lm o d e ) ，也就是张成这个子空间的特征矢量集。一般来讲，子空间的求取要借助于图像像素值的统计优化方程。而实际上，由于图像成像过程中不可避免地要混入成像器件的传感器噪声，而且人脸空间之外的空间也存在非零的空间，这使得很难借助代数和统计的算法来确定主元区域的优化方程，继而正确地求得人脸图像空间的本质维数及其相应的特征矢量集。虽然如此，人们还是尝试着做了很多的工作，试图找到能够反映人脸类别的子空间。子空间法模式识别的优点是，只把在统计上对分类最有用的特征留在子空间的表达中，使高维矢量在子空间的表达更为紧凑。另外，分类决策阶段只要计算为数不多的几个矢量内积即可，因而计算颇为简便。虽然子空间模式识别算法中的子空间是由统计算法计算得到的特征矢量张成的，但子空间模式识别算法却与统计决策理论模式识别的传统范例相偏离。因为统计决策理论模式识别算法是在使错误分类的概率或结构风险函数最小的基础上，确定决策界，将模式空间划分成独立的决策区域。而在子空间模式识别中，是将子空间考虑成原始测量空间数据的各种线性或非线性的精确表示，并没有提供决策区域的分类边界。从提取的特征的特点来看，大多数基于子空间的特征提取算法都属于基于整体特征的提取算法，即考虑了模式的整体属性，从整个人脸图像抽取人脸鉴别特征，人脸器官变化对人脸鉴别特征的影响不大。这种整体特征不仅保留了人脸部件之间的拓扑关系，而且也保留了各局部特征本身的信息。 1 4 2 特征子空间的相似度量在模式识别领域中，一个基本并且关键的问题是定义模式之间距离或者相似度【2 黔2 9 1 。通常模式由特征，即欧氏空间中的向量来表示。在某些实际问题中，用子空间来表示对象更方便。对于人脸识别问题，即为不同条件下同一人脸图像张成线性子空间。对于子空间相似度的研究工作，最早由j o r d a n1 8 7 5 ，h o t e l l i n g1 9 3 6 提出两个子空间之间的主角( p r i n c i p a la n g l e s ) 。y a m a g u c h i 等在1 9 9 8 年首先将最小p r i n c i p a l a n g l e 的余弦作为两个子空间的相似度用于视频识别。w o l f 和s h a s h u a 在2 0 0 3 年提出一种正定核函数作为子空间相似度，该核函数可以嵌入到s v m 中。对于子空间距离的研究工作，g o l u b 等早在1 9 8 9 年从矩阵角度给出了定义，w e r m a n 在1 9 9 5 年对子空间投影矩阵一一对应的距离扩展到了f 范数。上述子空间距离、相似度定义存在着一定的局限性：第一，只考虑最小p r i n c i p a l a n g l e 丢失大量信息；第二，定义只适用于两个子空间维数相同的情况，而实际应用中子空间维数经常不相等。 w a n g ，f e n g ，e ta 1 在2 0 0 6 年提出了不同维度子空间的对称距离，并称该距离为 l 2 h a u s d o r f f 子空间距离。该子空间距离有如下性质：第一，当两个子空间位数相同时，该距离与g o l u b w e r m a n 距离等价( f n o r m ) ；第二，即使两个子空间维数不相等，该距离仍然是“度量”，满足自反、对称、三角不等式等性质；第三，两个子空间的距离为零，当且仅当两者重合；距离取到最大值，当且仅当两者正交。 1 4 3基于子空间的特征提取方法 1 4 3 1 特征脸法 t u r k 和p e n t l a n d 3 0 1 在1 9 9 1 年发展了一种人脸识别的方法，这就是著名的“特征脸方法。所谓“特征脸就是对应于人脸模式协方差矩阵的那些较大特征值的特征向量。“特征脸方法是从主成分分析( p e a ) 导出的一种人脸识别和描述技术。这种方法将包含人脸图像区域看作一种随机向量，因此可以采用k l 变换得到正交变换基，对应其中较大的特征值的基底具有与人脸相似的形状，即“特征脸。算法利用这些基底的线性组合可以描述、表达人脸和逼近人脸，因此可以进行人 1 2 脸的识别和重建。识别过程就是把待识别人脸映射到由“特征脸张成的子空间中，“特征脸所生成的子空间在维数上比原模式空间大大减少，人脸检测和识别工作就在该子空间上进行。识别时可采用主分量作正交基的主分量方法，也可采用次分量作正交基的次分量方法。与较大特征值对应的正交基( 也称主分量) 可用来表达人脸的大体形状，与小特征值对应的特征向量( 也称次分量) 可用来描述具体细节。用次分量作为正交基的原因是所有人脸的大体形状和结构相似，真正用来区别不同人脸的信息是那些用次分量表达的高频成分。后来p e n t l a n d 等人进一步扩展了特征脸方法，将类似的思想运用到面部特征上，分别得到了本征眼、本征鼻、本征嘴，并且将它们结合起来进行人脸识别。实验结果表明，这样比单独使用“特征脸效果更好。“特征脸方法从能量压缩和重建误差最小化的角度来讲，p c a 是最优的方法。但它对于外界因素所带来的图像差异和人脸自身所造成的差异是不加区分的，因此外界因素( 例如光照、姿态) 变化会引起识别率的降低。 p c a 方法可以看作人脸识别和定位研究中里程碑式的方法。其后的很多人脸识别技术都或多或少与特征脸有关系，现在特征脸已经与归一化的协相关量 ( n o r m a l i z e dc o r r e l a t i o n ) 方法一道成为人脸识别的性能测试基准算法。实验表明，“特征脸”方法存在如下特点：首先，作为一种图像的统计方法，图像中的所有像素都被赋予了同等的地位，可是角度、光照、表情等干扰会使识别率下降；其次，人脸在人脸空间的分布近似高斯分布，且普通人脸位于均值附近，而特殊人脸则位于边缘分布，可见，越普通的人脸越难分辨，“特征脸方法的本质是抓住了人群的统计特征，反映了特定人脸库的统计特征，但不具有广泛性、代表性。受到s v m 中核方法的启发，s c h o l k o p fe ta 1

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（信号与信息处理专业论文）基于子空间的人脸识别算法研究(1).pdf

文档简介

温馨提示

最新文档

评论

（信号与信息处理专业论文）基于子空间的人脸识别算法研究(1).pdf

文档简介

温馨提示

最新文档

评论

相关文档