(测试计量技术及仪器专业论文)流形学习研究及其在人脸识别中的应用.pdf_第1页
(测试计量技术及仪器专业论文)流形学习研究及其在人脸识别中的应用.pdf_第2页
(测试计量技术及仪器专业论文)流形学习研究及其在人脸识别中的应用.pdf_第3页
(测试计量技术及仪器专业论文)流形学习研究及其在人脸识别中的应用.pdf_第4页
(测试计量技术及仪器专业论文)流形学习研究及其在人脸识别中的应用.pdf_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 作为人脸识别的基础,本文首先研究了线性子空间方法中的p c a 、l d a 、i c a 算法,对其原理、算法进行了系统的研究,并在人脸库上进行了试验仿真;在 s w i s s r o l l 的实验表明线性子空间算法在处理非线性数据上存在局限。 近年来,流形学习产生了大量的成果,这些算法包括等距映射( i s o m a p ) 、局 部线性嵌f l , ( l l e ) 和拉普拉斯特征映射( l e ) 等。本文详细分析了三种流形学习算 法目的、原理及求解过程,并在s w i s s r o l l 及有空洞的s w i s s h o l e 上进行了实验, 比较它们对凸数据和非凸数据的嵌入效果,对三种算法的时间复杂度进行了估 算。应用流形学习算法对人脸图像进行低维嵌入和规律挖掘,在2 维空间实现可 视化,找到了控制人脸图像的低维变量,证实了高维数据中“人脸流形”的存在。 本文将流形学习应用到人脸识别中。首先是在“人脸流形”上的识别,随后 应用l e 的线性化算法l p p 进行人脸识别,解决了流形学习对样本外 ( o u t - o f - s a m p l e ) 的学习问题。应用u d p 算法进行人脸识别实验,实验结果表明 u d p 算法较好的解决了流形学习的分类问题。本文在l a p l a c i a n f a c e s 的基础上,提 出了一种l a p l a c i a n f a c e s 的改进算法,用两点之间最短路径上的点的函数来作为两 点之间的权系数,通过重新构造权值矩阵,解决了原构造方法在分配权重时的不 足。在u d p 、m f a 的基础上,本文提出了度量非局部散度新方法l m p ( 局部边 距投影映射) ,选择两个局部之间的距离最近的点来构造非局部散度,加强了对 “局部”内与“局部”间样本的离散度,解决了u d p 算法在处理非线性数据上的 不足。 本文讨论了流形学习算法在核技术下的统一,将流形学习算法用核矩阵方法 表示,引入n y s t r o m 算法来求解核矩阵。作为探讨内容,本文在i c a 两种框架 的基础上,提出了流形学习的投影观点,找到了高维空间与低维空间的映射关系。 关键词:流形学习;低维嵌入;人脸识别;子空间;特征脸;特征提取; a b s t r a c t f i r s t l y ,l e tu sh a v ea ne x a m i n a t i o no nt h ep c a l d aa n di c ai nl i n e a r s u b s p a c e ,t h ef u n d a m e n t a l so ff a c er e c o g n i t i o n w eh a v eas t u d yo nt h e i r p r i n c i p l e sa n da l g o r i t h ma n dt h e nt r yt h em e t h o d so u to nt h ef a c e b a s e t h er e s u l t so nt h es w i s s r o us h o wt h a tt h el i n e a rs u b s p a c em e t h o d sh a v e 1i m it sw h e nt r e a t i n gw i t ht h en o n li n e a rd a t a t h ep a s tf e wy e a r sh a v es e e nm a n yf r u it s ,s u c ha si s o m a p ,l l ea n d l e i nt h i sp a p e r w ea n a l y z es u c ht h r e em a n i f o l dl e a r n i n gm e t h o d s d e t a i l e d l y ,l e a r n i n gt h e i rp u r p o s e ,p r i n c i p l e sa n da l g o r i t h m ;c a r r y i n g o u te x p e r i m e n to nt h es w i s s - r o l la n ds w i s s h o l e ,c o m p a r i n gt h e i re m b e d d i n g e f f e c to fk n a g g yd a t a ,e s t i m a t i n gt h e i rc o m p u t ec o m p l e x i t y t h e n ,w ea p p l y t h em a n i f o l dl e a r n i n gm e t h o d st ot h ee m b e d d i n ga n dr u l em i n i n g ,f i n d i n g t h el o w - d i m e n s i o n a lv a r i a b l e sw h i c hc o n t r o lt h ef a c ei m a g et h r o u g hm a k i n g i tv i s i b l ei nt w od i m e n s i o ns p a c e d e l i g h t i n g l y w ef i n d“f a c e m a n i f o l d ”i nt h eh i g h - d i m e n s i o n a ld a t a w ea p p l yt h em a n i f o l dl e a r n i n gm e t h o d st of a c er e c o g n i t i o n f i r s t l y , w er e c o g n i z eo n “f a c em a n i f o l d ”t h e nw eu s el p pt or e c o g n i z et h ef a c e l p pi st h eli n e a ro fl e s o l v i n gt h ep r o b l e mo fo u t - o f - s a m p l ef o rm a n i f o l d 1 e a r n i n g w ea l s ou s et h eu d pm e t h o dt of a c er e c o g n i t i o n t h er e u s l t so f e x p e r i m e n ts h o wt h a tt h eu d pm e t h o ds o l v e st h ec l a s s i f y i n gp r o m b l e mo f m a n i f o l d b a s e do nt h e l a p l a c i a n f a c e s 。 w e p r o p o s e a n i m p r o v e d l a p l a c i a n f a c e sa l g o r i t h m ,a n dr e c o n s t r u c tt h ew e i g h tm a t r i xb a s e do nt h e n o d e sb e t w e e nt h e i rs h o r t e s tp a t h ,w h i c hc o u l d s o l v et h es h o r t a g eo f a s s i g n i n gw e i g h t sb e f o r e b a s e do nu d pa n dm f a w ep r o p o s ean e wm e t h o d t om e a s u r en o n l o c a ls c a t t e r ,t h a ti s ,l m p ( l o c a lm a r g i n a lp r o j e c t i o n ) ,w h i c h c o n s t r u c tt h en o n l o c a ls c a t t e r t h r o u g h t h en e a r e s tn o d e sb e t w e e n d i f f e r e n tl o c a l ,a n di ti m p r o v e st h es c a t t e ro ft h es a m e1 0 c a l sa n d d i f f e r e n tl o c a l ,s oi ts o l v e st h es h o r t a g eo fu d po nt r e a t i n gw i t ht h e n o n li n e a rd a t a w ed i s c u s st h ec o m m o nf r a m e w o r ko fm a n i f o l dl e a r n i n gb a s e do nt h e k e r n e lt e c h n o l o g y ,e x p r e s s i n gt h em a n i f o l dl e a r n i n gm e t h o d sb yk e r n e l m a t r i x ,a n de x p l o r i n gt h en y s t r s mm e t h o dt os o l v e st h ek e r n e lm a t r i x a s a nu n c e r t a i nd i s c u s s i o n ,b a s e do nt h et w of r a m e w o r ko fi c a ,w ep r o p o s e ap r o j e c tv ie wo fm a n i f o l dl e a r n i n g ,s ot og e tt h em a p p i n gr e l a t i o n s h i p b e t w e e nt h eh i g hea n dl o wd i m e n s i o ns p a c e k e yw o r d s :m a n i f o l dl e a r n i n g ;l o w - d i m e n s i o n a le m b e d ;f a c er e c o g n i t i o n ; s u b s p a c e :e i g e n f a c e s :f e a t u r ee x t r a c t i o n : 学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下进行的研究工作 所取得的成果尽我所知,除文中已经特别注明引用的内容和致谢的地方外,本 论文不包含任何其他个人或集体已经发表或撰写过的研究成果对本文的研究做 出重要贡献的个人和集体,均已在文中以明确方式注明并表示感谢。本人完全意 识到本声明的法律结果由苯人承担 学位论文作者( 本人签名) :否彰定哆年弓月阳日 学位论文版权使用授权书 本学位论文作者完全了解南京林业大学有关保留、使用学位论丈的规定,同 意学校保留并向国家有关部门或机构送交论文的复印件和电子版( 中国科学技术 信息研究所;国家图书馆等) ,允许论文被查阅和借阅本人授权南京林业大学 可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以汇编和综合 为学校的科技成果,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论 文全部或部分内容。 保密口,在年解密后适用本授权书。本学位论文属于不保密彤 ( 请在以上方框内打“ ” ) 薹筝: 主2 蓁耋稚弓嚣,;置三 致谢 随着本篇论文的完成,三年的硕士学习生涯即将结束。首先,唐 谢我的导师一李勇智副教授。在三年的学习期间里,无论在学习上还 是生活上,李老师都给了我很多无私的帮助和指导,从论文的选题到 论文的大纲的确定以及进度的安排,他都给予了热情的帮助和指导, 尤其是他一丝不苟,精益求精,认真负贵的严谨的科学态度是我今后 科研工作的准则和方向。在此向李老师表示我深深的谢意和数意。 感谢师兄吴松松陈满,他们在我的研究生学习期间给了我很多 帮助,与他们在学业方面的讨论使我受益良多。特别唐谢师兄吴松松, 他为我的论文提出了很多富有意义的启发和指导。 感谢教务处各位同事对我工作和学习上的支持,藏谢刘粉香等各 位同学在学, - - j 和生活中对我的关心与帮助。 特别地,我要唐谢我的家人。父母舍辛茹苦把我养育成才却毫无 怨言,唐谢他们这么多年来一直给予我无私的关爱理解和勉励。唐 谢妻子武芳对我生活上的关心学习上的鼓励。他们对我的支持和呵 护是我人生旅途中最坚强的后盾。 最后,向所有关心和帮助过我的老师和同学表示衷心的意谢! 第一章绪论 1 1 研究背景和目的 事物的发展是双方面的。科学技术的迅猛发展,一方面使得计算机的计算能力和存储 容量不断增长,另一方面也使得大规模数据的获取较以往更为方便和普遍,如计算生物学、 图像分析和计算机视觉、信息检索的文本分析、文本挖掘和生物特征论证等,获得的数据 都是高维的。科研工作者在研究过程中不可避免地会遇到大量的高维数据,这些数据的内 在规律的复杂性往往超出人们的直接感知能力。这种高维性质一方面可能有利于数据分 析,为人们带来了“维数福音”;另一方面也导致了“维数灾难”,向人类提出了新的问 题:如何有效的对这些高维数据进行维数约简,从而发现隐藏在数据集中的低维结构和内 在的规律。 二十世纪微分几何得到高速发展,对高维空间的微分几何和对曲线、曲面整体性质的 研究,使微分几何学同黎曼几何、拓扑学、变分学、李群代数等有了密切的关系,这些数 学和微分几何互相渗透,已成为现代数学的中心问题之一。微分几何的发展被广泛的应用 于多个学科之间,比如,爱因斯坦在研究广义相对论时,认识到由于引力的作用,空间可 能弯曲,而黎曼几何则为描述这种弯曲的空间提供了理想的工具。微分几何学的高速发展 和广泛应用为我们研究新的机器学习算法提供了坚实的理论基础。传统的实数或复数空间 只是局部的情形,要弥补早期智能科学发展中强调局部忽略整体的缺陷,就需要研究如何 刻画数据集在几何意义下的整体特性。 人能够在瞬间就识别出一个对象在不同光照、姿态甚至扭曲后的表征,而用计算机去 进行识别却十分困难。在不同距离、不同方向,或在不同姿态和光照强度下,同一个对象 能够形成多种不同的图像。一个对象所有图像的集合可以看作是以位置、尺度、姿态、光 照等为参数的一个高维数据空间。传统的数据约简方法如主成分分析( p r i n c i p a l c o m p o n e n ta n a l y s i s ,p c a ) u 1 、多维尺度变换( m u l t i d i m e n s i o n ss c a l e ,m d s ) 晗1 和独立分量 分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 口1 和因子分析( f a c t o ra n a l y s i s ) h 1 等方法在数 据集具有线性结构和高斯分布时能有好的效果。对于较小规模的问题,可以认为数据分布 是近似于平坦的,p c a $ 1 m d s 等线性算法能够得到最优子空间,已经被证明是非常有效 的方法。但对于大规模的数据集,在高维空间呈现非线性高度扭曲时,数据分布明显地弯 曲,不能再近似认为样本取自子空间。传统方法则难以发现嵌入在数据集中的非线性结构。 其主要原因有:膨胀的维数导致计算量迅速上升;高维本点数相对较少,使得某些统计上 的渐近性质受到破坏;传统方法在处理据时不满足稳健性要求等。 高维数据具有本征维数、极限结构、稀疏表示、隐变量与参数表示等特性,大部分 高维观测数据变量可以用少量几个影响因素来表示,各成分之间通常也有着较强的相关 性,这说明高维数据中包含着大量冗余信息,这种现象几何学上表现为数据分布在低维流 形上,或者是在低维流形附近。而要有效揭示其潜在的结构,需要学习和发现嵌入在高维 空间中的低维特性。高维非线性数据的研究既使人们面临许多困难,也引领人们开启了高 维非线性数据新的研究方向。流形学习理论就是在这样背景下产生的,它以微分几何学作 为理论基础,结合神经科学提供的生物学依据,研究机器学习所面临的新问题,在探索非 线性数据的内在规律等方面取得了令人瞩目的成果。 1 2 流形学习 2 0 0 0 年,科学上发表的三篇学术论文m 1 ,从认知上讨论了流形学习,并首次使 用了m a n i f o l dl e a r n i n g 术语,标志着以非线性为主要特征的流形学习方法的诞生。近年来, 流形学习领域产生了大量的研究成果:l l e 盯1 y 【l l s o m a p 哺1 是两种有代表性的非线性降维方 法。s a m 和r o w c i s 提出的l l e 算法能够实现高维输入数据点映射到一个全局低维坐标系, 同时保留了邻接点之间的关系,这样固有的几何结构就能够得到保留。此算法不仅能够有 效地发现数据的非线性结构,同时还具有平移、旋转等不变的特性。t e n e n b a u m 等人提 出的i s o m a p 算法首先使用最近邻图中的最短路径得到近似的测地线距离,代替不能表示内 在流形结构的欧氏距离,然后输入到多维尺度分析( m d s ) 中处理,进而发现嵌入在高维 空间的低维坐标。在人脸和手势的实验中,i s o m a p 发现了存在于高维空间中的潜在低维参 数空间。d o n o h o 等人利用人工合成的数据用i s o m a p 算法进行测试实验,实验结果表明, i s o m a p 能够准确地发现图像流形潜在的参数空间,并在自然图像( 人脸图像) 中不同姿态和 亮度等潜在的未知参数下也可得到较好的结果,d o n o h o 等人还拓展l l e 算法,提出了 h l l e 算法,能够发现流形上局部的潜在等距映射参数。张长水等人隋1 在l l e 的基础上提 出一种从低维嵌入空间向高维空间映射的方法,并在多姿态人脸图像的重构实验中得到有 效的验证,进一步完善了非线性降维方法。由于已有的流形学习算法对噪音和算法参数都 比较敏感,詹德川、周志华阳1 针对i s o m a p 算法,提出了一种新方法,通过引入集成学习 技术,扩大了可以产生有效可视化结果的输入参数范围,并且降低了对噪音的敏感性。针 对测试样本问题,h e 等叩提出了l p p 算法,解决了流形学习的样本# l ( o u t o f - s a m p l e ) 学习 能力问题。j y 提出了一种u d p 算法 0 l ,既考虑了流形学习的“局部”特性,又考虑了“非 局部”特性,解决了流形学习在分类上的不足,取得了较好的效果。近年来,有学者将流 形学习的算法研究统一到对核函数的研究框架哺5 1 ,在统一的框架下,五种非监督流形学习 算法都可以通过n y s 哺m 公式来计算未知样本的低维嵌套。h 1 。 如今,流形学习已成为研究非线性问题的一个重要手段,流形学习的发展开启了一 种新的非线性数据分析思路。流形学习的目的是找出图像高维空间中隐藏的低维结构,找 出数据集分布的内在规律性。它认为所有高维数据都有低维空间的流形与之对应,从而通 过保持源数据的某种拓扑结构达到完成数据降维的目的。流形学习的非线性维数约简方法 跟线性维数约简方法相比的一个显著不同是它的局部性。 1 3 人脸识别 人脸识别属于一门交叉学科,它覆盖了模式识别、计算机视觉、神经网络、数字图像 处理、心理学、生理学、数学等诸多学科,人脸识别技术的发展,对相关领域理论的研究 也有重要的推动作用。人脸识别技术就是利用计算机分析人脸图像,进而从中提取出有效 的识别信息,用来“辨认”身份的一门技术。在现代社会中,计算机人脸识别技术不仅广 泛应用于反恐、惩治犯罪、保证公共安全等关系到国家安全的众多领域,而且在金融服务、 i t 产业、小区安保等诸多民生领域及其延伸产业都具有极大的推广价值。“9 1 1 ”事件之 后,能够在公众场合自动识别出嫌疑犯的识别系统更成为研究的热点,在刚刚结束的2 0 0 8 年奥运会及残奥会上,人脸识别为实现“安全奥运 发挥了重要作用,因此对计算机人脸 2 识别技术的研究,有重要的实用价值。 人脸识别技术的发展主要分为三个阶段: 第阶段以b e l t i n o n 、a l l e n 和p a r k e 为代表,主要研究人脸识别所需要的面部特征。在 b c l l i l l o n 系统中,用个简单语句与数据库中的一张人脸建立联系,取得了较好识别效果。 a l l e n 为待识别的人脸设计了一个有效特征,从而提高了人脸的识别率n 刚。p a r k e 把它用计 算机实现,并产生了较高质量的人脸灰度图模型n 。这一阶段的特点是识别过程几乎完全 依赖于操作人员。 第二阶段是人机交互识别阶段。g o l d s t i o n 等人用几何特征参数来表示人脸正面图像, 采用2 l 维特征矢量表示人脸面部特征,并设计了基于这一特征表示法的识别系统n 引。k a y a 和k o b a y a s h i 采用统计识别的方法,用欧氏距离来表征人脸特征n 引。总的来说,这类方法 需要利用操作员的某些先验知识,还是摆脱不了人的干预。 第三阶段是真正的向实用化发展的机器自动识别阶段。近十余年来,随着高速、性能 计算机的发展,人脸模式识别方法有了较大突破,出现了多种机器自动识别系统。近年来, 人脸识别技术研究非常活跃,除了基于k - l 变换的特征脸方法与以奇异值特征分解为代表 的代数特征方法取得了新进展外,人工神经网络、小波变换也在人脸识别研究中取得了很 广泛的应用,而且出现了不少新方法。2 0 世纪9 0 年代以来,随着计算机软硬件性能的迅速 提高,以及对人脸识别能力的要求,发展更具鲁棒性的人脸识别方法成为必然。这也使得 各国科学家积极寻求能改进和提高识别率的新算法、新方法。 人脸的特征提取和特征识别( 匹配) 是人脸识别中最为关键的两个问题。事实上,人 脸识别研究的发展主要就体现在这两个问题上,即提取人脸的什么特征和用什么手段进行 分类。人脸识别的特征抽取与描述方式可分为基于几何特征和基于统计特征两大类: 1 早期的人脸识别研究主要是基于几何特征n 帕。其基本思想就是利用人脸上的一些特 征点( 例如眼、鼻、嘴等) 的相对位置和相对距离,再辅以人脸轮廓的形状信息。其最大 缺点是识别的准确率完全依赖于几何特征的提取,而这些几何特征的提取对光照、表情、 姿态等变化非常敏感,所以稳定性不高,识别率较低。 2 后期的方法大多数是基于统计特征的。比如:模板匹配方法n 钉就是把数据库中的人 脸图像当作模板,结果表明这种方法的性能要明显优越于基于几何特征的方法;在f e r e t 测试中取得很好效果的弹性图匹配方法是基于局部统计特征的;文献 1 6 1 8 】在利用局部 统计特征的同时,还结合了人脸的全局统计特征,结合隐马尔可夫模型的方法n9 1 ;另还有 基于形状和表面全局纹理特征的方法聆引。子空间思想由于算法简洁、计算高效、识别性能 稳定在人脸识别中获得了较好的应用晗。 近年来流形学习算法在人脸图像处理中有了广泛应用。如果每一个像素都对应于空间 中的一维,那么一幅图像就可以看作高维图像抽象空间中的一个点。一个对象在不同方向 上所有图像的集合就是图像空间中的一个连续流形,即“人脸流形”,流形的低维嵌入就 起到了非常重要的作用,同时流形学习算法因其基本思路清晰、计算复杂度小,以及对非 线性结构较好的描述能力而获得了广泛的关注。显然传统的线性子空间技术在人脸检测与 识别领域有广泛的应用,但本质上来说,传统的线性子空间技术对非线性流形作了线性简 化处理,因此无法准确描述非线性流形的结构以及数据间的关系。流形学习属于机器学习 的范畴,它能够发现已知的高维数据中的内在规律,并找出数据的低维结构,但是由于流 形学习缺少高维观测空间与低维嵌入空间的映射关系,对于新的样本,却不能直接找到相 应的表示,需要与所有的初始样本一起重新构造权值矩阵,并计算相应矩阵的特征向量, 才能求得相应的低维嵌入。如何更好的解决样本外( o u t 。o f - s a m p l e ) 学习能力,将流形学习 的思想应用到模式识别中来,是本文重点要研究的内容。 1 4 本文的研究内容及安排 在论文的研究过程中,本文查阅了国内外相关参考文献,首先学习了人脸识别中线性 子空间方法,随后重点学习了处理高维数据的流形学习算法,并将其与人脸识别相结合, 并提出了几种改进算法。本文的研究内容及安排如下: 第一章,绪论。介绍流形学习的产生背景、发展及研究现状,叙述了人脸识别的概念、 应用、发展过程和遇到的困难,以及流形学习在人脸识别中的优势。 第二章,线性子空间算法简介。作为人脸识别的基础,本文首先研究了线性子空间中 的几种主流方法:p c a 、l d a 、i c a 算法,对其原理、算法进行了系统的研究,并在o r l 、 u m i s t 人脸库上进行了试验仿真,考察了识别率与压缩的维数、分类器的关系,综合比 较了上述三种线性鉴别分析处理人脸识别问题的识别性能。通过实验指出线性子空间算法 在处理非线性数据上存在局限。 第三章,流形学习算法研究。首先学习了流形学习的基本概念和方向,从流形学习的 目的出发,对三种流形学习算法:等距映射i s o m a p ( i s o m e t r i cf e a t u r em a p p i n g ) 、局部线性 嵌入算法l l e ( l o c a u yl n i e a re m b e d d a i g ) 、拉普拉斯特征映射l e ( l a p l a c i a ne i g n m a p ) 的原 理及求解过程进行分析,并在s w i s s r o l l 及有空洞的s w i s s h o l e 上进行了实验,比较它们对 凸数据和非凸数据的嵌入效果,对三种算法的时间复杂度进行了估算,对流形学习算法进 行总结。随后应用流形学习算法,对o r l 人脸库和y a l e 人脸库进行低维嵌入,挖掘人脸图 像数据中的规律,发现了嵌入在高维数据中的“人脸流形”,并在2 维平面上实现可视化。 第四章,流形学习在人脸识别中的应用。应用l e 的线性化算法l p p 进行人脸识别实 验,讨论了l p p 与p c a 、l d a 的关系,根据l p p 的原理,尝试用l p p 算法分别保持全 局结构和局部结构。提出了一种l a p l a c i a n f a c e s 的改进算法,引入了全局信息,用两点之 间最短路径上的点的函数来作为两点之间的权系数,通过重新构造权值矩阵,解决了原构 造方法在为流形上的数据点分配权重时的不足。基于u d p 、m f a 、p c a 的思想,提出了 度量非局部散度新方法l m p ( 局部边距投影映射) ,算法中加强了对“局部”与“局部” 间的约束,使得投影结果更有利于分类,在s w i s s r o l l 上实验表明算法适合非性线数据的 处理。 第五章,流形学习算法的统一。将经典的流形学习算法i s o m a p 、l l e 、l a p l a i c a n 等 统一到核技术框架下,将流形学习算法用核矩阵方法表示,给出了流形学习算法的统一框 架,引入了n y s t r t s m 算法来求解核矩阵。在i c a 两种框架的基础上,提出了流形学习的 投影观点,将l e 、l l e 转换成相应的投影算法l e p 、l l e p ,找到了高维空间与低维空间 的映射关系,解决了样本p l y ( o u t - o f - s a m p l e ) 的学习问题。 4 第二章线性子空间算法 对待高维数据,通常的方法是首先对数据进行维数约减,通过维数约简找出其中的最 重要的特性,然后再对数据加以处理,以保证处理过程简单化,并保证最终结果的质量不 会降低。k i r b y 2 u 等和t u r k 等陋2 1 首次把主成分分析的子空间思想引入到人脸识别中,并获 得了较大的成功。随后,子空间分析的思想就引起了人们的广泛注意,成为了当前人脸识 别的主流方法之一。子空间分析的思想是根据一定的性能目标来寻找一线性或非线性的变 换,把原始信号数据压缩到个低维子空间,使数据在子空间中的分布更加紧凑,为数据 的更好描述提供了方法,另外计算的复杂度也得到了大大降低。目前在人脸识别中得到成 功应用的线性子空间方法有:主成分分析( p c a ) n 1 、线性鉴别分析( l d a ) 、独立成分分 析( i c a ) 瞳钔和非负矩阵分解( n m f ) 乜5 儿2 引;非线性子空间方法有:核方法,流形学习等。作 为线性子空间的代表,本章主要介绍p c a 、l d a 、i c a 三种方法。 2 1 主成分分析p c a ( p r i n c i p a lc o m p o n e n ta n a l y s is ) 主成分分析法( p c a ) 乜又称为有限离散k - l 变换或霍特林( h o t e l l i n g ) 变换,是统计 学中用来分析数据的一种方法。p c a 的目标是选择样本点分布方差大的坐标轴进行投影, 来降低维数而使信息量损失最小( 均方误差最小) ,这样就把问题转化为求样本数据协方差 矩阵的特征值问题。p c a 是一种线性变换,它将数据集转化为由维数较少的“有效”特 征成分来表示,而不减少原始数据所包含的内在信息内容,使其在统计意义下达到方差最 大的目的,所以p c a 也称为特征提取。由于各元素之间是相关的,所以在数据中存在冗 余,使压缩成为可能。主成分的选取的优先级通常是按对应的特征值大小来确定的,这些 投影轴是由相互正交的向量组成的,这些正交向量是原始人脸空间的总体散布矩阵的特征 向量并且具有脸的形状,因而称为“特征脸”陇3 ,它保留了人脸图像中的基本信息。由于 投影轴是相互正交的,经过p c a 压缩后,数据间是不相关的。 2 1 1p c a 算法原理 设五,而,x m 是r ”空间的个样本,舅,j ,:,蜥是各样本对应于投影轴矿的投影。 p c a 方法就是寻找投影轴w = ( 仍,仍,仍) ( d m ) ,使得样本数据沿投影轴投影后所得到 的压缩数据】,= w r x 的方差最大。p c a 的准则函数为: nn ,( 矽) = v a “】,) = e 咒一e ( 以) 】2 ) = ( e ( 乃2 ) 一【e ( 咒) 】2 ) ( 2 1 1 ) i = l,l 以求其中一个投影轴9 为例, nn v a t ( y ) = 研( 伊r 薯) 2 卜【e ( 伊r 薯) 】2 i = l i = 1 = 伊r e ( 玉薯) 】尹一伊7 e ( 五) e ( 薯切 = 伊r ( e ( 玉五) 一e ( ) e ( 薯) 】) 伊= 9 r c i 矿 ( 2 1 2 ) j 毫l g = ( e ( 薯_ ) 一e ( 玉) e ( _ ) ) = c o v ( x ,r ) i = 1 j 伊。,删矿。伊 ( 2 1 3 ) l s 2 矿伊= 1 c 二伊= 五伊 ( 2 1 4 ) 对应的特征值及特征向量。又矿e 纺= 矿乃纺= 乃,所以最大特征值对应的方差最大, f h 五对应的特征向量求得的耽= 衫x 即为第二主成分。以此类推。 形= c 仍,伤,仍, ,形7 e 形= ( : 三 记t r ( w7 e 形) = + 如- i - - + 乃表示取矩阵的迹。当用p c a 方法求多个投影轴时的目标函 j 形= 口擘删护( 2 e 形 ( 2 1 5 ) ls 2w 7 w = i 设r ”空间中,由n 个人脸组成样本集x = “,恐,h ) , 总体散度矩阵品构造如下: 昌= 专喜( 薯一) ( 五一厂 总体均值为,样本的 ( 2 1 6 ) i 矿= a r gm a x t r ( w r s t 形) k 形r w = j 可先对样本进行均值化,则m o 为0 向量。在样本数量较大时,利用奇异值定理进行求解, 计算石x 对应的特征值五,砂乃及相应的特征向量马,驴只。佛2 万1 x 只。又 r a n k ( s r ) m i n ( n ,n c ) 2 4 3 ,i r ma 个特征向量构成投影矩阵矿,每个投影轴为一个特 征脸将原向量向投影矩阵投影后,变换成j 蛙的新向量y 。= 吃目 2 h 韩i 吼l : 蚌l + 咒 蚂2 : 伟2 。+ 儿悖d= 一吧 ( 217 ) 如图21 所示,经过p c a 运算后,一个人脸样本分解为特征脸的线性组合。 1 ”蜀2 y l _ j + 议i ) 样率特征量特征臆 圉21 由于准则函数中并没有利用到样本的类别信息,所以p c a 屉光监督的。 2 2 线性鉴别分析l d a ( l i n e a rd i s c r i m i n a u ta n a l y s i s ) 线性鉴别分析l d a 也是一种用于特征提取的统计方法。畸p c a 思想不同的是,l d a 通过找到最优的投影方向,使得所有样本在其上的投影的粪间离散度和类内离散度之比为 最大,从而达到最好地区分不同类样本的目的。f i s h e r 准则的线性鉴别己被公认为特征抽 取的最好方法之一。关于线性鉴别分析的研究庶追胡到f i s h e r 在1 9 3 6 年发表的经典论文 ”其基本思想是选择使得f i s h e r 准则函数达到极健的向量作为最佳投影方向,从而使得 样本在该方向投影后,达到最大的类间离散度和最小的类内离散度。近年来s w e t s 。, b e l h u m e u r ”1 和l i u 等用其来解决人脸识别问蹶使得该方法广泛应用于人脸别问题的 研究。f o l e y 和s m n m o n 进一步提出了采用一组满足正交条件的最佳鉴别矢量集的特征提 取的的f s 线性鉴s b 法”“,后来d u c h 睨e ”等进一步拓展了这一方法,最近由j ha n d y a n g 等提 的具有统计不相关性的j y 线性鉴别法“1 。 但是,咀上各种f i s h e r 鉴别分析的构架大都是建立在太样本情况f 的,即要求类内教布 矩阵是非奇异的。然而人脸等图像识别领域存在着大量的小样本问题,在该类问题中, 类内散布矩阵是奇异的。这是因为待识别的图像矢量的维数较高,而在实际问题中难以找 到或根本不可能找到足够多的训练样本来保证类内散布矩阵的可逆性。因此,在小样本情 况下,如何抽取f i s h e r 屉优鉴另i | 特征成为一个公认的难髓“。1 。 2 2 1l d 算法原理 设r “空间中,有c 个模式类衄,峨,以,共n 个样本,总体样本集为 并= 喃,墨,却) x = 【掣,瑚) 为第一类样本肇,为第i 类样本数,1 为第i 类 的第个样本。我们有以下定义: ( 1 ) 第1 类样本的均值m 和总体均值m : m i = e ( 置) = 专荟刈= 1 ,2 ,c 加叫耻专萎x ( 2 ) 样本的类内散度矩阵瓯和类间散度矩阵最: ( 3 ) 总体散度矩阵墨: 1, y = - 。 g 5 - ,影- - - , - j n 训( 秽训r & = 丢私= 昙喜专芸c 护咧争科 2 川 最= i x ( m 一m ) ( 鸭一聊) r i = 1 ( 2 2 2 ) s r = 寺( 五- m ) ( x i - m ) r ( 2 2 3 ) 由定义可知,s w 、最及品均为非负定矩阵,且满足品= & + 最。类内散度矩阵& 反 映了各分量到其所在类中心的平均平方距离,类间散度矩阵足反映了各类中心到总体中 心的平均平方距离。 引理l n 朝& 、& 及品的秩有以下性质: ( 1 ) r a n k ( s ,) m i n ( n ,n - c ) ( 2 ) r a n k ( s b ) m i n ( n ,c - 1 ) ( 3 ) r a n k ( s r ) m i n ( n ,n - 1 ) f i s h e r 线性判别的目的是寻找一个最优的鉴别矢量集形= ( 仍,仍,伤) ,它的每一个 列矢量就是一个鉴别方向。将样本数据投影到这些方向上,使得映射后的类间散布距离和 类内散布距离的比值最大。对于样本薯,对应于某个投影轴伊的投影为q ,r x , ,以上度量对 应于投影轴矽在低维空间的表示为: 蔬2 专磊矿舻矿专丕舻矿现 同理有: 鬲= 专萎伊7 x = 矿专萎工= 矿m s b = 矽r 最缈 s ,= 伊r 瓯伊 8 则,f i s h e r 准则函数为: 伽,= 妻= 惩 ( 2 2 4 ) 其中9 为非零的力维向量。令分母等于非零常数,即矿& 伊= c 0 ( 约束条件) ,定义 l a g r a n g e 函数: 以矿,加= 伊r 最9 一旯( 伊r 瓯p c ) 因s 为对称半正定矩阵,假设瓦非奇异,上式的求解为 乳- 1 咒缈= 五伊 根据引理n 明知,缈的最大维数为c - 1 。当求多个鉴别矢量时,f i s h e r 准则函数为: ( 2 2 。5 ) 妒,= 器啬 2 f i s h e r 准则函数非常巧妙的将样本在投影矢量上的类间离散度和类内离散度结合在 一起,为我们确定最优投影方向提供了一个非常完美的准则。选取使得目标函数j ,( 缈) 达 到最大值的矢量矿作为投影方向,其物理意义是投影后的样本具有最大的类间离散度和最 小的类内离散度。由于在构造类内散度矩阵和类间散度矩阵时,利用了样本和类别信息, 所以l d a 是有监督的。 2 2 2 基于l d a 的人脸识别 但是对人脸识别的应用来说,由于通常没有足够的训练样本来保证类内散度矩阵鼠, 满秩,l d a 算法会遇到小样本问题。在这种情况下,使得f i s h e r 算法不能简单地直接应 用在人脸识别上。这样就不能按照传统的算法,直接利用鼠,- 1 最寻找较大特征值对应的特 征矢量集。 将f i s h e r 鉴别准则应用在人脸识别领域,主要有两类算法:一类算法是数学方法,主 要致力于如何求得瓯,的逆阵。t i a n 口钉提出了用类内散布矩阵的伪逆矩阵,代替类内散 布矩阵的逆矩阵;h o n g 眵司则提出在类内散布矩阵& 中添加小的扰动,用墨,+ 来代替 s c h e n g b 7 3 曾提出应用秩分解算法来计算最佳鉴别矢量集。第二类是基于子空间的分解 方法。s w e t s 等口8 1 最先提出结合主成份分析的线性鉴别方法,即先用主成分分析降维,获得 原样本的最优特征表示( m e f ) 子空间,并保证在m e f 空间中类内离散度是非奇异的,然 后再在此基础上作线性鉴别分析。后来b e l h u m e u r 等瞳朝把它发展为f i s h e r 脸( f i s h e r f a c e s ) 方法;y u 等n 町提出一种新的策略:先去掉& 的零空间,然后再使类内离散度最小化( 称 为d i r e c tl d a f d l d a ) 。h a i f e n gl i h 们提出的m m c 算法,通过重新定义f i s h e r 准则避开了 类内散布矩阵奇异的问题。 y a n g h 订口3 1 中建立了高维、小样本情况下线性鉴别分析的统一的理论框架。该方法体现 了通过变换( 映射) 降维来消除奇异性的思想,但与f i s h e r f a c e s 方法有着根本的区别,那 就是在利用映射原理进行降维的过程中,不损失任何f i s h e r 最优鉴别信息。在此理论框架 下,求解最优鉴别矢量集的全过程只需要在一个低维的变换空间内进行,从而大大节省了 计算量。 2 3 独立成分分析i c a ( i n d e p e n d e n tc o m p o n e n ta n a l y sis ) 主成分分析( p c a ) 是基于二阶统计特性的分析方法,其目的用于去除图像各分量之间 的相关性,忽视了高阶统计信息;i c a 可看作是p c a 的推广,i c a 是一种基于高阶统计特 性的分析方法,由i c a 分解出的各分量之间是相互独立的。正是因为这一特点,使i c a 在 信号处理领域受到了广泛的关注。随着近年来在i c a 方面研究兴趣的增加,使它在许多领 域也有了非常广泛的应用。 独立成分分析最初主要是应用在盲信号分离上心1 。它在人脸识别上应用是由b a r t l e t t 等h 3 1 第一次提出的,把人脸图像看作为多个相互独立的基图像的线性叠加。文献 4 4 是先 用独立成分分析提取特征,然后结合支持向量机来提高分类效果。文献 4 5 对独立成分分 析作了较详细的评价分析,并与特征脸和f i s h e r 脸进行了实验比较,结果显示独立成分分 析略好于后两者。实验结果还表明先用p c a 对原数据进行降维,可以提高独立成分分析 的识别性能,但是对降维的维数很敏感。另外,文中还指出结合贝叶斯分类框架,可以进 一步提高识别性能。但是在文献 4 6 中的比较结果是独立成分分析和主成分分析的识别率 近似相同的,文献 4 7 指出在选择各自最佳的距离度量后,独立成分分析明显不如主成分 分析。在主成分分析中通常是根据特征值的大小来自动选择主成分的,但是对于如何有效 地、自动地选取对分类有用的独立元,目前还没有一个很好的标准,通常都是根据经验来 选取的。可能这是导致上述不同结论的原因之一。另外独立成分分析的计算复杂度要明显 高于主成分分析。 2 3 1i c a 基本思想 为了给i c a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论