(计算机应用技术专业论文)人脸图像特征提取和识别算法研究.pdf_第1页
(计算机应用技术专业论文)人脸图像特征提取和识别算法研究.pdf_第2页
(计算机应用技术专业论文)人脸图像特征提取和识别算法研究.pdf_第3页
(计算机应用技术专业论文)人脸图像特征提取和识别算法研究.pdf_第4页
(计算机应用技术专业论文)人脸图像特征提取和识别算法研究.pdf_第5页
已阅读5页,还剩75页未读 继续免费阅读

(计算机应用技术专业论文)人脸图像特征提取和识别算法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

哈尔滨理丁大学t 学硕f :学位论文 人脸图像特征提取和识别算法研究 摘要 特征提取是人脸识别研究中的最基本问题之一。在这一研究领域,提出 了许多经典的算法,如基于子空间的主分量分析方法,线性鉴别分析方法和 独立成分分析方法等,以及在支持向量机的基础上演变而来的基于核技巧的 非线性特征提取方法等。特征提取问题的深入研究和最终解决可以极大的促 进模式识别领域学科的成熟和发展。 本文结合国内外研究现状,指出人脸识别中特征提取技术对于科研及应 用的重要意义,并且对特征提取技术的研究现状及发展趋势进行了分析和总 结;然后综述了与之相关的一些基础理论知识,针对特征提取技术进行了深 入系统地研究。本文给出了三种特征提取算法: 1 在间距最大准则的基础上,提出了判别间距最大准则。该准则通过 最大化类间离散度和最小化类内离散度,寻找原始结构中,最好的类判别信 息,提高了算法的有效性和稳定性。 2 基于局部保持投影的统计不相关位置保持投影。该算法通过综合考 虑类内结构和类间结构,获得较好的鉴别能力。另外,u l p p 算法的约束条 件是统计不相关的,进一步提高了算法的性能。 3 基于l p p 的复合位置保持投影。该算法在构建邻接图时,边的确定 是通过判断两点的类别信息,而不是通过比较欧氏空间距离大小,降低算法 的计算复杂性。算法在确定邻近点的同时,也确定非邻近点,通过映射,使 得同类样本点尽可能的接近,类之间尽可能的分离,甚至在原始空间中相互 接近的类也彼此分离,最大限度地保留样本所包含的有用鉴别信息。 通过多个人脸库识别实验验证了以上三种算法的可行性和有效性。 关键词人脸识别;特征提取;子空间;线性鉴别分析;局部保持投影 a l g o r i t h m sr e s e a r c ho nf a c ei m a g ef e a t u r e e x t r a c t i o na n d r e c o g n i t i o n a b s t r a c t f e a t u r ee x t r a c t i o ni so n eo ft h em o s tb a s i cp r o b l e m si nf a c er e c o g n i t i o n m a n yc l a s s i c a la l g o r i t h m sh a v eb e e np r o p o s e dt os o l v ei t ,f o re x a m p l e ,t h el i n e a r s u b s p a c em e t h o d s ,w h i c hi n c l u d i n gp r i n c i p a lc o m p o n e n ta n a l y s i s ( p c a ) ,l i n e a r d i s c r i m i n a n ta n a l y s i s ( l d a ) a n di n d e p e n d e n tc o m p o n e n ta n a l y s i s ( i c a ) ,a r et o s o l v el i n e a rp r o b l e m ,a n dk e r n e lm e t h o d sb a s e do ns u p p o r tv e c t o rm a c h i n e ( s v m ) t os o l v en o n l i n e a rp r o b l e m f u r t h e rs t u d yo nf e a t u r ee x t r a c t i o na n ds e t t l e m e n t c o u l dg r e a t l yp r o m o t et h ed e v e l o p m e n to ft h ef i e l do f p a t t e r nr e c o g n i t i o n t h i st h e s i s p o i n t e do u tt h ei m p o r t a n ts i g n i f i c a n c eo ff e a t u r ee x t r a c t i o n t e c h n o l o g yi nt h es c i e n c er e s e a r c ha n di n d u s t r yp r o d u c t i o nb a s e do nt h e b a c k g r o u n do fp r o b l e ms t u d i e d ,a n da n a l y z e dt h ec u r r e n ts t a t u sa n dd e v e l o p i n g t r e n do ft h ef e a t u r ee x t r a c t i o n a n dt h e nt h eb a s i c p r i n c i p l e s ,f e a t u r e s a n d p r o b l e m so ff e a t u r ee x t r a c t i o nw e r es u m m a r i z e d t h ef e a t u r ee x t r a c t i o nw a s r e s e a r c h e dt h o r o u g h l ya n dd e e p l y t h r e ea l g o r i t h m sw e r ep u tf o r w a r di nt h i st h e s i sf o rf e a t u r ee x t r a c t i o n : f i r s t l y , d i s c r i m i n a n tm a r g i nm a x i m u mc r i t e r i o n ( d m m c ) b a s e do nm a r g i n m a x i m u mc r i t e r i o nw a sp r o p o s e d d m m ct r i e st of i n dt h ei n t r i n s i cm a n i f o l dt h a t b e s t l yd i s c r i m i n a t e sd i f f e r e n tf a c ec l a s s e sb ym a x i m i z i n gt h eb e t w e e n c l a s s s c a t t e r , w h i l em i n i m i z i n gt h ew i t h i n c l a s ss c a t t e r e f f e c t i v e n e s sa n ds t a b i l i t yo f a l g o r i t h ma r ei m p r o v e d s e c o n d l y , u n c o r r e l a t e dl o c a l i t yp r e s e r v i n gp r o j e c t i o n s ( u l p p ) w 嬲p r o p o s e db a s e do nl o c a l i t yp r e s e r v i n gp r o j e c t i o n s u l p pw a s d e s i g n e dt oa c h i e v eg o o dd i s c r i m i n a t i o na b i l i t yb ye x p l i c i t l yt a k i n gt h el o c a la n d g l o b a li n f o r m a t i o no ft h es a m p l e si n t oa c c o u n t b e s i d e s ,as i m p l eu n c o r r e l a t e d c o n s t r a i n ti si n t r o d u c e dt og e n e r a t es t a t i s t i c a l l yu n c o r r e l a t e df e a t u r e s w h i c h f u r t h e ri m p r o v e sr e c o g n i t i o np e r f o r m a n c e f i n a l l y , m u l t i p l el o c a l i t yp r e s e r v i n g i n f o r m a t i o np r o j e c t i o n s ( m l p i p ) w a s p r o p o s e db a s e d o nl o c a l i t yp r e s e r v i n g i i 哈尔滨理t 大学t 学硕 :学位论文 p r o j e c t i o n s w h e nc o n s t r u c t i n gt h eg r a p h ,w ed i dn o ta d o p tt h es - n e i g h b o r h o o d , b u tp u ta ne d g eb e t w e e nn o d e sfa n d ji f x ia n d 肋b o t hb e l o n gt ot h es a m ec l a s s i t w o u l dr e d u c et h e c o m p u t a t i o n a lc o m p l e x i t yo fo u ra l g o r i t h m n e i g h b o r h o o d p o i n t sa n dn o n - n e i g h b o r h o o dp o i n t sw e r ec e r t a i n e di nm l p i ea sar e s u l t ,i ti s e a s yt om a k en e i g h b o r h o o dp o i n t sa sc o m p a c ta sp o s s i b l e ,a n di ti se a s yt o c l a s s i f yd i f f e r e n tm a n i f o l d s ,s i n c ee v e nt h eo r i g i n a l l yc l o s em a n i f o l d sa r e p r o j e c t e df a ra w a y t h ed i s c r i m i n a t i v ei n f o r m a t i o ni nt h ei m a g es p a c ew a st a k e n f u l la d v a n t a g ei nt h i sm e t h o d t h ef e a s i b i l i t ya n de f f e c t i v e n e s so ft h r e em e t h o d sh a db e e nd e m o n s t r a t e d t h r o u g he x t e n s i v ee x p e r i m e n t sc o n d u c t e do ns e v e r a lf a c ed a t a b a s e s k e y w o r d s f a c er e c o g n i t i o n ,f e a t u r e e x t r a c t i o n ,s u b s p a c e ,l i n e a rd i s c r i m i n a n t a n a l y s i s ,l o c a l i t yp r e s e r v i n gp r o je c t i o n s i l l 哈尔滨理工大学硕士学位论文原创性声明 本人郑重声明:此处所提交的硕士学位论文人脸图像特征提取和识别算法 研究,是本人在导师指导下,在哈尔滨理工大学攻读硕士学位期问独立进行研 究工作所取得的成果。据本人所知,论文中除已注明部分外不包含他人已发表或 撰写过的研究成果。对本文研究工作做出贡献的个人和集体,均已在文中以明确 方式注明。本声明的法律结果将完全由本人承担。 作者签名:球截日期:娜7 年3 月2 , 0f t 哈尔滨理工大学硕士学位论文使用授权书 人脸图像特征提取和识别算法研究系本人在哈尔滨理工大学攻读硕士学 位期间在导师指导下完成的硕士学位论文。本论文的研究成果归哈尔滨n t 大学 所有,本论文的研究内容不得以其它单位的名义发表。本人完全了解哈尔滨理工 大学关于保存、使用学位论文的规定,同意学校保留并向有关部门提交论文和电 子版本,允许论文被查阅和借阅。本人授权哈尔滨理工大学可以采用影印、缩印 或其他复制手段保存论文,可以公布论文的全部或部分内容。 本学位论文属于 保密 口, 在年解密后适用授权书。 不保密囹。 ( 请在以上相应方框内打) 作者签名:婶鬏 日期:工。吖年3 月2 , o 日 翩虢坪毛匕隰_ 年岁月2 o 日 哈尔滨理工人学工学硕卜学位论文 1 1 课题来源 第1 章绪论 在人脸识别领域,由于原始图像的维数相当高,直接在原始图像的基础上 进行处理,将加大识别的运算量,并且对计算机的硬件性能也是一个挑战,因 此特征抽取成为该领域最基本的问题之一,抽取有效的鉴别特征是解决该问题 的关键。特征抽取是将原始样本映射到低维特征空间,得到最能反映样本本质 的低维样本特征,这样能有效的减少样本的存储量和处理速度,实现人脸的自 动分类。 本课题是以黑龙江省博士后基金项目( l r b 0 0 0 6 3 ) ,黑龙江省教育厅科学 技术研究项目( 1 0 0 5 1 0 5 4 ) 为背景进行的。 1 2 研究背景和意义 生物特征识别技术应用非常广泛,作为生物测定学的重要组成部分人 脸识别技术受到多方关注。虽然同指纹、虹膜等特征相比,人脸更容易受到各 种因素的干扰,但是人脸识别技术仍然有着巨大的发展空间。总的来说,人脸 识别具有三个优势:一是无侵犯性;二是自然性好;三是性价比高。 人脸识别虽然有许多其它识别方法无法比拟的优点,但是迄今为止,其准 确率还很难达到实用性的要求,这主要是由于下面两个因素造成的。 1 不同个体之间的人脸区别不大。所有的人脸都是由几个相同的部分组 成,外形结构相似。这样的特点对于人脸检测是有利的,但是对于区分不同的 个体是不利的。 2 人脸具有极强的不稳定性。人的脸部具有丰富的表情,在不同观察角 度,人脸的视觉图像也相差很大。另外,人脸识别还受光照强度和角度条件、 饰物( 如墨镜、头发、胡须等) 、年龄等多方面因素的影响。 因此,人脸识别的研究不仅具有很高的理论和应用价值,同时又是一项非 常具有挑战性的工作。 目前一个完整的人脸识别系统大体包括以下三个部分 1 人脸检测( f a c ed e t e c t i o n ) 哈尔滨理t 大学下学硕t 学位论文 人脸检测的主要任务是判断输入图像中是否含有人脸。如果有,则确定人 脸的位置及大小。人脸检测是人脸识别系统实现自动化最为关键的一步。经过 几十年的发展和研究,人脸检测已经基本满足了系统要求。 2 特征提取( f e a t u r ee x t r a c t i o n ) 特征提取是指从人脸图像中提取出用于区分不同个体的判别特征。要求提 取的特征对于相同的人具有稳定性,对于不同的人具有差异性。特征提取是人 脸识别中最为重要的一个部分,它的效率直接决定最终的识别性能。 3 分类识别( f a c ec l a s s i f i c a t i o n ) 人脸分类的主要任务是根据提取的待识别人脸的特征,将其和数据库中的 人脸图像进行比对,确定其身份。该过程非常依赖特征提取的结果。 本文主要研究特征提取部分。 作为生物识别领域的重要组成,人脸识别涉及图像模式分析,理解与分类 计算问题,为模式识别,图像处理和计算机视觉等多种学科提供了一个良好的 具体问题,有利于构建这些学科领域的基础实验平台用于尝试新方法。人脸识 别问题的深入研究和最终解决可以极大的促进这些学科的成熟和发展。另外, 人脸识别还是智能人机接口领域的重要研究内容之一。人脸识别本质上是要赋 予计算机区分不同人类个体的能力,这恰是智能人机接口研究需要解决的问题 之一,也是机器智能的重要表现。人脸识别问题的最终解决可以极大的改善目 前不方便的人机交互环境,从而在一定程度上改变人们的生活方式。 在人脸识别过程中,需要计算和存储大量的数据,但是获取数据本身显然 是不够的,提取产生这些数据的系统本身信息才是根本目的所在。而且,通常 所获得的原始数据的数据量相当大,且样本常处于一个高维空间中,如果直接 用原始数据的话,无论从计算的复杂程度还是识别性能来看都是不适宜的。为 了有效地实现分类识别,就要把原始数据映射到低维空间,得到最能反映应样 本内在本质的特征,以便能更有效的进行分类,这个过程就叫做特征提取。映 射后的特征叫做二次特征,它们是原始特征的某种组合( 线性组合或非线性组 合) 。这样不仅可以减少样本的存储量和提高计算速度,而且有助于提高识别 精度。到目f j 为止,人们己经给出了许多种特征提取方法,如主分量分析,线 性鉴别分析以及非线性投影方法等,这些方法都在人脸识别中被广泛使用并取 得了较好的特征提取效果。特征提取是模式识别中的一个关键问题,在数据聚 类,模式识别等领域有着广泛的应用。 哈尔滨理t 人学t 学硕l j 学位论文 1 3 国内外研究现状及分析 随着计算机技术以及网络技术的进步,人脸识别技术得到了巨大的发展。 人脸识别逐渐成为模式识别、计算机视觉等领域的研究热点,涌现出了许多识 别算法。分为基于子空间方法、基于几何特征的方法、隐马尔可夫方法、神经 网络方法、弹性图匹配方法和柔性模型方法几大类,下面重点介绍基于子空间 方法和基于几何特征的方法。 1 子空间方法 人脸千变万化,及其复杂,而且人脸图像的维数很高,想直接显式地表述 人脸特征非常困难。仔细观察人脸图像,总的来说,正面人脸图像具有对称 性,表面光滑并且具有一定的纹理信息,局部像素之间又具有很强的相关性。 说明人脸图像的像素之间具有很强的冗余性。如果把人脸图像看成整个空间的 话,那么每一个人脸样本都是分布在这个空间中的一个“点”。可以考虑经过 一个映射,将这些高维人脸空间中的点投影到另一个低维空间中,去除人脸图 像的冗余信息,使得样本点在新的空间中更为紧凑,为数据的更好描述提供了 手段。这个低维空间被称为子空间( s u b s p a c e ) ,近年来,基于子空间的人脸识 别算法得到了广泛关注,逐渐成为人脸识别方法的主流。由于子空间的获取需 要求助于一个投影,所以基于子空间的方法也被称为基于投影的方法 ( p r o j e c t i o nb a s e dm e t h o d s ) 。根据这个投影是否线性,可以将子空问方法分为 线性子空间方法和非线性子空间方法。 基于线性投影的子空间方法,目前依然是人脸识别中最具有影响力的方 法。这类方法的特点是将原始人脸图像看作是一个矩阵,通过相应的代数方 法,抽取得到包含原始样本分布信息的低维子空间信息,并以此来进行识别, 其中两类最重要的方法是特征脸方法2 1 和f i s h e r 方法【3 1 。 k i r b y 和s i r o v i c h 副首先讨论了利用p c a 进行人脸图像最优表示的问 题,接着,t u r k 和p e n t l a n d | 2 i 探讨了其物理意义,并成功提出经典的特征 脸( e i g e n f a c e s ) 方法,随后出现了许多种基于p c a 的新方法和改进算法3 删。 f i s h e r 准则在线性投影分析中起着极其重要的作用。线性鉴别分析的基本 思想最早是由f i s h e r 在1 9 3 6 年提出的,其目的是选择使得f i s h e r 准则函数达 到极大值的向量作为最佳投影方向,从而使得样本在该方向上投影后,达到最 大的类间离散度和最小的类内离散度。在f i s h e r 思想的基础上,w i l k s 和 d u d a 分别提出了鉴别矢量集的概念,即寻找一组鉴别矢量构成子空间,以原 哈尔滨理t 大学t 学硕十学位论文 始样本在该子空间内的投影矢量作为鉴别特征用于识别。该方法被称为经典的 f i s h e r 线性鉴别分析方法。目前该方法仍然广泛应用于人脸识别等领域。除了 经典的f i s h e r 线性鉴别分析方法外,还有f i s h e r f a c e s 方法1 ,该方法在使用 f i s h e r 之前,先用p c a 方法对原始空间进行处理。 同基于f i s h e r 准则的线性鉴别特征提取的目的一样,h a i f e n gl i 等人提 出了m m c ( m a r g i nm a x i m u mc r i t e r i o n ) n 吼1 9 1 ,该准则的目的也是要将数据从原 始的高维空间压缩到低维空间,并且在低维空间保持较高的可分性。在m m c 的基础上出现了r m m c ( r e g u l a r i z e dm a r g i nm a x i m u mc r i t e r i o n ) ,hw a n g 等 对其进行过讨论啪1 。 金忠和杨静宇等人从统计不相关的角度船卜2 引,提出了具有统计不相关性的 线性鉴别分析方法( u n c o r r e l a t e dl i n e a rd i s c r i m i n a n ta n a l y s i s u l d a ) 幢。具有 统计不相关性的最优鉴别矢量集是满足共扼j 下交条件的。但u l d a 在初期给 出的求解最佳鉴别矢量集的算法也较为复杂,后来杨健等人证明在f i s h e r 准则 函数所对应的广义特征方程的特征值互不相等的条件下,u l d a 与经典的 l d a 是等价的。y a n g 的相关研究指出,f i s h e r 准则函数对应的广义特征方程 一定存在一组“不相关的特征向量,使用这组特征向量抽取出的特征分量间 自然是不相关的。换句话说,直接从一个广义特征方程出发,就可以得出整个 不相关鉴别矢量集;这样的处理不仅计算高效,而且也不用考虑是否存在特征 值相等的情况。 二维模式主成分分析( 2 d p c a ) 旺引或鉴别分析( 2 d l d a ) 乜5 1 是一种针对图像 模式的特征提取方法。这类方法直接在图像矩阵上计算协方差( 离散度) 矩阵。 该矩阵的维数等于图像的行数或列数,计算起来简便多了。另外,矩阵投影到 每个本征矢量得到一个矢量,而不是一个值,这样得到的特征值个数也远远多 于l d a 。在高维图像人脸识别实验中,2 d p c a 和2 d l d a 的分类性能分别优 于p c a 和l d a 。二维变换方法实际上是基于图像行或列的变换方法憎6 。,即对 每一行或每一列分别投影得到特征,可以推广到基于图像块的投影。 基于主分量分析( k l 变换) 的特征脸方法、f i s h e r 准则下的各种鉴别分析 方法在人脸识别领域有着广泛而深远的影响,至今仍有不少自动人脸识别系统 直接或间接地使用这些方法。不过对于f i s h e r 准则存在一个必须要考虑的问 题一小样本问题幢l2 引,这个问题的产生是由于训练样本的总数远小于样本空间的 维数,对这一问题,学者们提出了很多解决的办法他。 与线性投影子空间方法相对应的是非线性投影子空间方法。最具代表性的 是核方法。“核方法 最早是在支持向量机的研究中提出的。基于s v m 的理论 哈尔滨理t 人学丁学硕i 二学位论文 和方法己经用于人脸检测和人脸识别领域。g u o 运用支持向量机进行人脸识 别。基于核的主分量分析( k p c a ) 口2 删方法和基于核的f i s h e r 鉴别分析方法 ( k l d a ) 瑚1 是l d a 的核推广,b a u d a t 与a n o u a r 提出了针对多类分类问 题的k f d m 3 方法,y a n g 讨论比较了基于核技巧的特征脸方法和f i s h e r 脸方 法。y a n g 等人揭示了核线性鉴别分析的本质,提出了k p c a + k f d 的应用框 架口7 。,在该框架下的核鉴别分析可利用两类鉴别信息,一类在类内散布矩阵 ( 指通过k p c a 变换后的类内散布矩阵) 的零空间上得到,另类在类内散布矩 阵非零空间中得到。徐勇m 3 9 | 等人从所有训练样本集中选取少量的训练样本, 对核方法的特征抽取效率有较大提高。核空间的特征提取方法还有k e r n e l d i r e c tl d a 0 。,k e r n e ll p p 等。 基于流形学习( m a n i f o l dl e a r n i n g ) h 2 1 的人脸识别算法被提出。流形( m a n i f o l d ) 是线性子空间的一种非线性推广,是局部可坐标化的一个拓扑空间。流形学习 本质上是一种非线性的降维方法,意在发现高维数据分布的内在规律。 s e u n g h 驯在s c i e n c e 上发表论文,提出感知以流形方式存在,从此推动了流形 学习在模式识别领域的发展。局部性保持特征提取方法借鉴了流形学习的思 想,具有代表性的算法有局部线性嵌入( l o c a l l yl i n e a re m b e d d i n g ,l l e ) 州】和 等距映射( i s o m e t r i cm a p p i n g ,i s o m a p ) h7 。l l e 的基本思想是在样本点和其近 邻点之间构建重构权向量,并在低维空间中保持这个权向量不变。i s o m a p 建 立在多尺度变换的基础上,力求保持数据集的内在几何性质,即保持两点i 旬的 测地线距离。b e l k i n 基于谱图理论提出了拉普拉斯特征映射( l a p l a c i a n e i g e n m a p ) h8 。,基本思想是使得在原始空间离得很近的点,经过映射之后仍然 离得很近。由于流形学习方法缺乏明晰的投影矩阵,因此,h e 等人提出了局 部保持投影( l o c a l i t yp r e s e r v i n gp r o j e c t i o n s ,l p p ) m 1 ,并将其成功应用于人脸识 别,即拉普拉斯脸( l a p l a c i a n f a c e s ) 旧。l a p l a c i a n f a c e s 仍然属于无监督算法。本 文第四章将在l p p 的基础上提出一种新的有监督人脸识别算法。通过对l p p 算法进一步改进,将临近点区分为同类临近点和异类临近点,d o n gx u 等人 提出了边界费舍儿分析( m a r g i n a lf i s h e r a n a l y s i s m f a ) 晦1 5 引。 子空间方法属于整体特征的提取算法,即考虑了模式的整体属性,从整个 人脸图像中抽取人脸判别特征,这种整体特征不仅保留了人脸各部分之间的拓 扑关系,而且也保留了各局部特征本身的信息。基于子空间的人脸识别方法具 有计算代价小、描述能力强、可分性好等特点,现己经成为人脸识别的主流方 法,是本文的主要研究对象和内容。 2 基于几何特征的方法 哈尔滨理工大学工学硕士学位论文 人脸由额头、眉毛、眼睛、鼻子、嘴巴、双颊等部分组成,它们之间的大 体位置关系也是固定的。由于人脸的这些组成部分的形状、大小、结构的差 异,才使每个人的相貌不尽相同。早期的人脸识别就是从生物学最直观的角度 出发,采用人脸组成部分的几何特征( g e o m e t r i cf e a t u r e ) 进行识别。这类方法的 基本思想是提取人脸上突出特征( 例如眉毛,眼睛,鼻子,嘴巴等) 的相对位置 和相对大小作为特征参数,再辅以人脸轮廓的形状信息,形成特征向量,最后 利用适当的距离度量和分类方法对特征向量加以分类。 b l e d s o e 是最早研究人脸识别的学者之一,他以人脸特征点的间距、比 率等参数为特征,建成了一个半自动的人脸识别系统,其缺点是特征点需要手 动标注。b r u n e l l i 和p o g g i o 嘲1 利用改进的积分投影法提取出用欧氏距离表 征的3 5 维人脸特征矢量,包括眉毛厚度、眉毛与眼睛中心之间的垂直距离、 眉毛弧度的1 1 个描述参数、嘴宽、上下嘴唇厚度及嘴的垂直位置、下巴形状 的1 1 个描述参数、鼻孔位置的脸宽、鼻孔与眼睛中间位置的脸宽等。 基于几何特征的人脸识别方法利用的是单纯的人脸几何信息,其优点是符 合人类识别人脸的机理,易于理解;对每幅图像只需存储一个特征矢量,存储 量小;对光照变化不太敏感。缺点是识别算法的准确度完全依赖于几何特征的 准确提取,而几何特征会由于光照、遮挡等原因变得很难准确提取。人的表情 会严重影响五官轮廓和位置,所以即使准确提取了几何特征,也会因为特征有 较大的变化而导致分类出错。只描述了部件的基本形状与结构关系,忽略了局 部细微特征,造成部分信息丢失。可见基于几何特征的人脸识别方法稳定性很 低,识别效果差。目前完全基于几何特征的识别算法已经不多了,但几何特征 仍然可以作为其它特征的有益补充。 1 4 本文研究内容 1 4 1 人脸识别研究的主要内容 人脸识别是指计算机根据一定的算法,对新获得的图像与计算机中已有的 图像库进行匹配比较后,做出测试图像中身份判断的识别过程。人脸识别的一 般过程由三部分组成,分别为人脸检测,特征提取,分类识别。人脸检测是指 从当前的输入图像中确定人脸区域的过程。特征提取是指采用某种高效且判别 性好的表示方法来表示检测出的人脸与数据库中存储的人脸,然后采用一定的 分类准则,将待识别的人脸与数据库中己知人脸比较,得到识别结果。由于原 哈尔滨理工大学t 学硕l 学位论文 始人脸图像的维数通常都较高,因此,在特征提取过程中,在提取高效的识别 信息的前提下,必须对数据进行降维处理,以减小运算量,减少处理时间,提 高识别效率。特征提取与识别就是通常所说的人脸识别,是人脸识别的关键。 本文将主要研究这一过程,研究基于m m c 和l p p 算法的人脸特征提取,提出 和改进了几种相应的算法。在分类识别时,采用的是最邻近分类器( n e a r e s t n e i g h b o rc l a s s i f i e r ) 。 人脸识别系统的组成 l 图像采集r 1 人脸榆测卜_ |1特征提兰三k:蓁兰兰萋: 浏分类识别 图1 1 人脸识别流程图 f i g 1 - 1s t e p so ff a c er e c o g n i t i o n 1 4 2 本文的研究方法和研究内容 本文所研究的算法均为基于统计分析的子空间方法。由于人脸图像的复杂 性,显式地描述人脸特征具有定的困难,因此近年来基于统计分析的子空间 方法越来越受到重视,它的基本思想就是把高维空问中松散分布的人脸图像, 通过线性或非线性变换映射到一个低维的子空间中,使人脸图像的分布在低维 的子空间中更紧凑,更有利于分类,另外也使高维的计算减小为低维计算。子 空间方法具有描述性强,计算代价小,易实现及可分性好等特点。主分量分析 是最早被引入到人脸识别的子空间方法,在它的成功应用之后,子空间方法逐 渐成为人脸识别的主流方法之目前在人脸识别中得到成功应用的子空间分析 方法主要包括主分量分析、线性判别分析、典型相关分析、独立成份分析和拉 普拉斯方法等以及基于核方法的核主分量分析( k p c a ) 和核f i s h e r 判别分析 等,其中基于主分量分析的特征脸和基于f i s h e r 线性判别分析的f i s h e r f a c e s 是 人脸识别领域中最具深远影响的两种方法。 本文主要对人脸识别中的特征提取做了深入的理论和算法研究,所做的工 哈尔滨理t 大学t 学硕r l j 学位论文 作大致可以归纳为以下几个方面: 1 研究了间距最大准则和局部保持投影方法,将原始空间与特征空间相 关联,在保持类间结构相对稳定的前提下,使类间离散度最大的同时类内离散 尽可能的小。所获得的投影样本能更好的保持原有的分类信息,更适合于分类 的进行,从而有效的提高识别的准确性。使得新算法具有很好的分类性能,在 较低维特征空间时,就具有较高的准确性。 2 研究了局部保持投影方法和不同的类结构,融合m m c 和l p p 算法的 特点,在有效的保持局部结构的稳定性基础上,最大化类间离散度量矩阵,以 有利于分类的进行,不需要复杂的分类器,就能获得很理想的识别率。另外, 增加统计不相关约束条件,有利于识别率的提高。通过多个包含不同变化的人 脸库上的实验验证算法的有效性。 3 研究了不同的邻接图结构,保留局部结构的稳定的同时,使整体结构 趋于最大化,使得不同类之间两两相互远离。算法通过选取不同的类内,类间 度量矩阵和约束矩阵,将求解最优变换矩阵的问题转换成普通的特征值问题。 在对算法的目标函数进行分析时,可以清楚的看到,新算法与l p p ,m m c 和 l d a 的内在关联关系,证明了算法理论的真确性和可行性。在后面部分,通 过多个实验,再次对算法的可行性进行验证。 1 5 本文的内容结构 本论文共分为5 章,各章的内容如下: 第1 章是绪论部分主要介绍了模式识别和生物特征识别的基本概念,人脸 识别的研究意义和近阶段国内外的发展状况,概括介绍了人脸识别特征提取的 方法,对人脸识别方法的整体过程做了相应的描述,并且阐述了本文的研究方 法和内容。 第2 章主要详细介绍了一些经典的特征提取的方法,有基于子空间的特征 提取方法,p c a ,f i s h e r 和f i s h e r f a c e s 方法,还有非线性子空间拉普拉斯映射 方法,以及在这种算法的基础上提出的m f a 方法。 第3 章本章提出了基于位置保持思想的判别间距最大准则。该算法在 m m c 算法的基础上,引进位置保持的思想,将原始空间与特征空间相关联, 在保持类问结构相对稳定的前提下,使类内离散尽可能的小。所获得的投影样 本能更好的保持原有的分类信息,更适合于分类的进行,从而有效的提高识别 的准确性。 哈尔滨理t 大学工学硕j :学位论文 第4 章本章提出了基于l p p 的统计不相关位置保持投影。该算法与前一算 法不同之处在于,在保持类内结构相对稳定的前提下,使类间离散度最大,所 提出的算法融合了m m c 和l p p 算法的特点,并更有效的保持了整体和局部结 构的稳定性,有利于分类的进行,不需要复杂的分类器,就能获得很理想的识 别率。在人脸数据库上的实验表明该方法取得了更好的识别性能。 第5 章本章提出了一种保持局部和整体结构的位置保持的复合位置保持投 影( m l p i p ) 。该算法不同于l p p 算法。在构造邻接图时,无须考虑如何确定k 个邻接点,而是直接将同类之间视为邻接点。将类内结构保持到特征空间中。 也不同于u l p p 算法,m l p i p 算法在确定邻接点的同时,也确定非邻接点,使 得每一个样本点能靠近同类样本点,远离异类样本点,从而形成高效的聚簇。 哈尔滨理t 人学t 学硕十学位论文 第2 章人脸特征提取算法 1 9 9 1 年t u r k 和p e n d a n d 最早将主分量分析( p c a ) 应用于人脸识别,通过 k - l 变换将表征人脸的高维向量映射到由若干特征向量构成的子空间中,从而 实现对人脸图像的最优解析和重构,该方法称为特征脸法。特征脸法的本质是 抓住了人群的统计特征,统计意义上可达最优,但该最优是基于有限样本空间 的,不能代表整个样本空间,只是反映了特定人脸库的统计特征,不具有广泛 性和代表性。另外,该方法将图像中所有的像素都赋予了同等地位,光照、姿 态变化等干扰都会使识别率下降。人脸图像库的变更会导致特征脸的变化,该 方法也不适合库中人脸数目变化较大的情况。传统特征脸法的不足促使研究者 发展了许多改进方法,很多研究者提出了使用其它线性空间代替特征脸空间以 取得更好的识别效果。其中,在p c a 的基础上使用线性判别分析( l d a ) 的 f i s h e r f a c e s 方法是一种较好的改进方法。该方法选择以类内散布正交的矢量作 为特征脸空间,从而能减小图像之间与识别信息无关的差异,对光照、表情、 角度变化都不太敏感。 2 1 矩阵的奇异值分解 设彳是一秩为,的刀,维矩阵,则存在两个正交矩阵 u = “l ,一,胪满足u 7 u 一 ( 2 _ 1 ) v = 【v o ,u ,咋一i 】r “7 满足v 7 v = , 、7 以及对角矩阵 人= d i a g 2 0 , ,乃一i 】r “7 ,凡a 乃一i 满足 a = u a f v 7 ( 2 - 2 ) 式中:丑( f - o ,l ,r - - 1 ) 黼彳和a a r 的非零特征值,u i 和v f 分别为a a7 和 彳乃对应于a 的特征向量。上述分解称为矩阵a 的奇异值分解( s i n g u l a rv a l u e d e c o m p o s i t i o n ,s v d ) ,丑为a 的奇异值。 则有 u :a v a ( 2 3 ) 哈尔滨理t 大学丁学硕j j 学位论文 总体散布矩阵可表示为 2 万m 刍- - | ( 毛i ) ( 葺一i ) r2 万1 肠r ( 2 - 4 ) 容易求出其特征值九及相应的特征向量( f - 0 ,1 ,2 ,胪1 ) 。由该推论可 知,的正交特征向量嘶为 1 坼= 音她i = 0 ,l ,m l ( 2 5 ) 4 这就是图像的特征向量。它是通过计算较低维的矩阵的特征向量与特征值 而问接求出的。 2 2 主分量分析 模式识别领域一种重要的特征提取方法是主分量分析( p c a ) 。该方法通过 k l 展开式来抽取样本的主要特征。p c a 在人脸识别领域得到成功的应用,许 多研究人员对此进行了研究。k i r b y 和s i r o v i c h 等讨论了利用p c a 进行人脸图 像的最优表示问题。任何人脸图像都可近似地用特征向量的线性组合来表示, 通过增加特征向量的数量可以提高所给图像的表示精度。t u r k 和p e n t l a n d 还发 现当k l 展开后的特征向量被还原成图像矩阵时,竟然是一张张标准化的人 脸。于是,采用k l 变换展开表示人脸的本质被揭示了出来,即用一系列标准 的人脸图像通过叠加来表示人脸,然后使用这些权重系数作为人脸的特征进行 分类识别,这就是著名的特征脸( e i g e n f a c e s ) 方法。 基于经典p c a 的e i g e n f a c e s 方法进行人脸识别时,需要将每个人脸图像 展开成向量形式,即使较小的图像对应的向量特征空间也非常大,而在高维的 空间内,直接通过特征值分解来计算样本协方差矩阵的特征向量是非常耗时 的。另外,在进行人脸识别实验时,训练样本的数目一般较小,即训练样本的 总数远远小于人脸图像展开向量的维数。针对这一情况,利用奇异值分解定理 的有关理论进行特征向量的求取可以大大降低计算量,从而解决了类间协方差 阵特征向量的求解问题。 以下部分简要给出应用主分量分析进行人脸识别的算法。 设人脸图像的列向量描述为 厨,1 ,= i v x = x ,恐,) ( 2 - 6 ) 式中:刀为训练样本集中人脸图像总数,特征值a f 相应的特征向量为。 哈尔滨理工人学丁学硕十学位论文 训练样本集的协方差矩阵定义为 s t = 去( 玉一) ( 五一) r ( 2 7 ) t = 1 式中:训练样本均值定义为 i t = 圭2x t ( 2 8 ) 一。 u 。6 j 设协方差矩阵的特征值和特征向量按特征值从大到小排列后为: ,五,以和,“:,u 。则取对应较大特征值的特征向量作为鉴别向量集。 设取对应前k 个较大特征值的特征向量作为鉴别向量集,令 u = u i ,“2 ,u t ) 则人脸图像列向量在特征空间上的特征为 咒= u 1 玉 ( 2 9 ) 通常情况下,k 的取值要使训练样本在前k 个鉴别矢量集上的投影有足够 大的能量,即取k 满足下述条件 k,” 丑五口 ( 2 - l o ) i = 1,i = 1 一般情况下,可取a :9 9 ,即使训练样本在前k 个鉴别向量集上的投影有 9 9 的能量。也可以经验地对k 进行取值。通常情况下,人脸图像列向量的维 数都较高,有的甚至高达上万维,直接通过协方差矩阵计算鉴别向量集较为困 难。而相对来说,训练样本集中训练样本的个数却相对较少,所以可以通过奇 异值分解方法求解主分量分析的鉴别矢量。 设矩阵脚。的特征值和特征向量为a ,五,以和,“:,其中 丑如以。 矩阵x r x 的特征值和特征向量为: ,如,以和嵋,v 2 ,v m 。 矩阵。掰和x 非零特征值所对应的特征向量有下述关系 1 嘶= 亭她 ( 2 一1 1 ) 、1 这就是图像的特征向量。它是通过计算较低维矩阵f x 的特征值和特征向 量而间接求出的。由于r x 的维数远低于脚矩阵的维数,所以计算量大大降 低。将特征值从大到小排列 如以其对应的特征向量为u f 。这样, u 。,“:,u m 张成了一个子空间,也就是特征脸子空间。任何一张人脸图像向 该子空间中投影,即可得到一组坐标数,这组坐标数可以作为人脸识别的依 哈尔滨理丁大学t 学硕士学位论文 据,也就是这张人脸图像的特征脸特征。人脸识别问题转化为低维空间的坐标 数分类问题,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论