已阅读5页,还剩56页未读, 继续免费阅读
(信号与信息处理专业论文)基于gabor小波变换与支持向量机的人脸识别研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大连理工大学硕士学位论文 摘要 自动人脸识别是利用计算机分析人脸图像,从而提取出有效的识别信息,用来辨认 身份的一门技术。可以被应用到公安系统的罪犯身份识别、驾驶执照及护照、银行及海 关的监控系统、自动门卫系统和家庭娱乐等方面。 本文主要研究了人脸识别的特征提取和分类器设计两个部分。 在特征提取方面,本文首先实现了三种典型的人脸特征提取方法:主成份分析方法、 f i s h e r 脸方法、核f i s h e r 脸方法,分别对他们进行了分析和实验验证。然后主要探讨了 利用g a b o r 小波变换进行特征提取的方法,其优点在于g a b o r 小波函数可以比较准确的 描述人脑视觉皮层简单细胞的感受野,从而能有效的提取人脸特征。最后提出了一种基 于g a b o r 小波变换特征提取的改进算法,即首先对人脸图像进行g a b o r 小波变换,得到 g a b o r 小波变换特征,由于变换后的特征维数较高,所以要对变换特征进行降维,本文 采用二次降维法,即首先对其进行空间采样,然后在进行第二次降维的过程中,不是使 用传统的的f i s h e r 脸方法进行降维,而是使用本文提出的一种改进的f i s h e r 脸方法进行 降维,得到变换特征基,人脸图像在其上面的投影作为分类器的输入。 在分类器方面,本文主要应用了一种具有纠错能力的二类支持向量机分类器构成的 多类分类器。这种分类器由于利用了通信中信道差错控制编码技术而具有纠错能力,这 样即使几个二类分类器产生了错误的输出结果,由于具有纠错机制,这些错误对最终的 分类不产生影响,仍然可以得到正确的分类结果,因此这种分类器具有比传统的分类器 更好的分类效果。利用g a b o r 小波变换和这种分类器在o r l 标准人脸数据库上的仿真 实验取得了9 7 8 的平均识别率。 关键词:主成份分析:f i s h e r 脸:k e r n e lf i s h e r 脸;g a b o r 小波变换;支持向量机 手永辉:基于o a b o r 小波变换与支持向量机的人脸识别研究 f a c er e c o g n i t i o nb a s e do ng a b o rw a v e l e tt r a n s f o r ma n d s u p p o r tv e c t o rm a c h i n e a b s t r a c t a u t o m a t i cf a c er e c o g n i t i o ni sa ni d e n t i f i c a t i o nt e c h n o l o g yt h a ti ta n a l y z e sf a c ei m a g e w i t hc o m p u t e rf o rg e t t i n ge f f e c t i v er e c o g n i t i o ni n f o r m a t i o n i tc a l lb ea p p l i e di nm a n y a s p e c t s , s u c ha sc r i m i n a lr e c o g n i t i o no fp o l i c es y s t e m ,d r i v e r sl i c e n s e ,p a s s p o r t ,m o n i t o rs y s t e mo f b a n ka n dc u s t o m ,a u t o m a t i cd o o r m a ns y s t e ma n df a m i l ye n t e r t a i n m e n te t c t k sp a p e rm a i n l ys t u d i e si nt w op a r t so ff a c er e c o g n i t i o n :f e a t u r ee x t r a c t i o na n dp a t t e m c l a s s i f i c a t i o n f o rf e a t u r ee x t r a c t i o n ,t h i sp a p e rf i r s ti m p l e m e n t st h r e et y p i c a lm e t h o d s :p c a ,f i s h e f f a c e , k e r n e lf i s h e r f a c e ,a n a l y z e sa n de x p e r i m e n t sw i t ht h e m t h e nm a i n l yp r o b ei n t ot h ef e a t u r e e x t r a c t i o nm e t h o do fg a b o rw a v e l e tt r a n s f o r m i t sa d v a n t a g ei st h a tg a b o rw a v e l e tf u n c t i o n c a nd e s c r i b et h er e c e p t i v pf i e l do fs i m p l ec e l l si nt h ev i s u a lc o d e xo fh u m a nc e r e b r ac o r r e c t l y , s oi tc a ne x t r a c tt h ef a c ef e a t u r ee f f e c t i v e l y f i n a l l yt h i sp a p e ri m p r o v et h ef e a t u r ee x t r a c t i o n m e t h o db a s e do ng a b o rw a v e l e tt r a n s f o r m f i r s tg e t t i n gg a b o rw a v e l e tt r a n s f o r mf e a t u r eb y g a b o rw a v e l e tt r a n s f o r n 2t of a c ei m a g e ;b e c a u s et h ed i m e n s i o n so f t r a n s f o r mf e a t u l 七a r ev e r y 1 i g h s ot h e ym u s tb er e d u c e d t l i sp a p e ru s e st w os t e p st or e d u c et h ed i m e n s i o n so fg a b o r f e a t u r ev e c t o r ,t h a ti sf i r s tt os a m p l i n g 也et r a n s f o r mf e a t u r e 。t h e nt or e d u c et h ed i m e n s i o n s a g a i nw i t ha ni m p r o v e df i s h e r f a c et h a tt h i sp a p e rg i v e sf o rg e t t i n gt r a n s f o r mf e a t u r eb a s e p r o j e c t i n gt h ef a c ei m a g eo n t ot h et r a n s f o r mf e a t u r eb a s e t r a n s f o r mc o e 伍c i e n tc a nb e u s e dt o b et h ei n p u to f c l a s s i f i e r a b o u tc l a s s i f i e r ,t h i sp a p e rm a i n l ya p p l i e sam u l t i c l a s sc l a s s i f i e rc o m p o s e do f t w oc l a s s s v mc l a s s i f i e rw i t he r r o rc o r r e c t i n g t l l i sc l a s s i f i e rh a se r r o rc o r r e c t i n ga b i l i t yb e c a u s ei tu s e s t h ee r r o rc o n t r o le n c o d ei nc o m m u n i c a t i o n a lc h a n n e l b e c a u s eo fi t se r r o rc o r r e c t i n ga b i l i t y t h o u g hs e v e r a lt w o c l a s sc l a s s i f i e r sh a v ee r r o ro u t p u t ,t h e yc a l ln o ta f f e c tt h ef i n a lc l a s s i f i e d e f f e c t t h e r e f o r et h i sc l a s s i f i e rh a sb e a e rc l a s s :i f l e de f f e c tt h a nt r a d i t i o n a lc l a s s i f i e r s s i m u l a t i o ne x p e r i m e n tw i t hg a b o rw a v e l e ta n dt h ec l a s s i f i e rg e t s9 7 8 r e c o g n i t i o nr a t ei n o r ls t a n d a r df a c ed a t a b a s e k e yw o r d s :p c a ;f i s h e r f a c e ;k e r n e lf i s h e r f a c e ;g a b o rw a v e l e tt r a n s f o r m ;s v m 独创性说明 作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究工 作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得大连理 工大学或者其他单位的学位或证书所使用过的材料。与我一同工作的同志 对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。 作者签名:墨垂望日期:! ! 竺叠! ! 自 火连理- i :大学顼士学竹论文 大连理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位论文版权使用 规定”,同意大连理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子 版,允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内 容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论 文。 作者签名:三枣峰 导师繇 盈堕 型钲丝月卫日 大连理工大学硕士学位论文 1 绪论 1 1 人脸识别问题的提出 近年来,数字图像处理技术的应用范围越来越广,运用数字图像处理技术的身份验 证更是由于其在公安、安全验证系统、信用卡验证等方面的巨大的应用前景而越来越成 为当前图像处理和模式识别领域的一个研究热点。传统的身份验证有很多,技术已经成 熟的如条形码、i c 卡、a 1 m 卡等,这些身份验证的优点是可以采用各种加密手段加以 保护,但所有这些都有可能被丢失、被窃取甚至被伪造,因为从根本上说,这些标识手 段所依赖的都是后天赋予人的信息,不是人的固有信息。这些潜在而又必然的问题已经 给用户造成许多不良后果和重大损失。 随着计算机科学、计算机视觉及人工智能的发展,并且由于迫切需要一种准确、方 便、安全的识别技术来代替现有的身份识别技术,于是就出现了利用人的固有的内在信 息即人的生物特征识别人的各种方法,人类本身具有很多相对独特的生物特征如人脸、 指纹、d n a 、虹膜,掌纹等,这些特征都具有安全可靠、特征唯一、不易伪造、不可窃 取等优点,基于这些相对独特的人类特征,结合计算机技术,发展起了众多的人类身份 识别技术。人脸识别技术作为生物识别技术的一种,以其良好的特性:( 1 ) 互异性:世 界上不存在两张完全相同的脸,尽管有的脸非常相象,但是经过仔细观察总是可以找到 差异:( 2 ) 不变性:虽然同一个人不同的胖瘦,不同年龄时的人脸出现了一些变化,但 是还是可以识别不同时期的人脸;( 3 ) 和主体永不分离性:这样对主体身份的识别更具 有真实性;( 4 ) 非侵犯性:我们可以用摄像机在远处轻易的获取一个人的人脸图像,这 种操作具有非接触性,也就更具备隐蔽性,因而成为了图像处理和模式识别领域的一个研 究热点。 如同人的指纹一样,人脸也具有唯一性,可用来鉴别一个人的身份。人脸识别技术 在商业、法律和其他领域有着广泛的应用,具体应用主要有以下几个方面【l 】:( 1 ) 嫌疑犯 照片的识别匹配:( 2 ) 信用卡、驾驶执照、护照等;( 3 ) 银行、商场安全系统;( 4 ) 公众 场合监控;( 5 ) 家庭娱乐。这些应用包括从静态的受控背景的照片到动态的、非控背景 的录像等各个方面。 鉴于人脸识别系统在法律部门和商业领域的广泛应用,国外许多公司投入了大量的 人力和物力到商用人脸识别系统的开发上,开发出了很多实用的计算机人脸识别系统, 如i d e n t i x 公司开发的f a c e i t 系列产品、v i i s a g e 公司开发出的f a c e p a s s 系列产品等等。 国内从事商业人脸识别系统开发的公司比较少,大多都是在实验室里的研究成果,其中 乇永辉:基于g a b o r 小波变换与支持向量机的人脸识别研究 商业人脸识别系统主要有:北京时代杰城信息科技开发的门禁管理系统和主动式面像管 理系统;上海银展智能科技有限公司的用于记录考勤的银晨人脸识别考勤系统;北京阳 光奥森科技开发的奥森人脸识别系统等。 虽然人脸识别的应用非常广泛,但是利用计算机进行人脸识别存在很多的困难,其 中来源于人脸自身的变化和成像条件的影响对人脸的识别造成了非常太的挑战。人脸自 身的变化:人脸是一个弹性体,人脸的表情丰富,表情的变化对图像有非常大的影响; 人脸可以随时间变化,比如人脸的胖瘦,人脸的肤色,化妆,甚至是整容,另外人脸随 年龄的增长而变化也是一个不得不考虑的问题。成像条件的影响:成像时的光照条件, 光照角度;成像时的镜头角度,镜头距离:成像时人的头部旋转角度;成像时的背景是 否复杂等等;目前尚没有刻画人脸的非常好的模型。人脸识别又跨越了模式识别、图像 处理、计算机视觉以及神经生理学、心理学等诸多研究领域,这些都增加了人脸识别的 难度。 1 2 人脸识别的发展现状 在过去的三十多年中,神经生理学家、心理学家和工程技术人员主要对如下的问题 进行了研究 2 1 :人脸识别的唯一性;识别人脸是在整体特征还是在局部特征下进行;表 情分析及其在人脸识别中的应用;婴儿是如何识别人脸的;人脸记忆的组织结构等。从 而得出了如下的一些结论:人类视觉数据的处理是一个分等级的过程,其中最底层的视 觉过程( 视网膜功能) 起信息转储的作用,即将人眼接受的大量图像数据变换为一个比 较规则的紧凑表达形式,人眼视网膜上存在着低层次和高层次的细胞,其中低层次的细 胞对空间的响应和小波变换的结果相似,而离层次的细胞则依据一群低层次细胞的响 应,而做出具体的线、面及物体模式的响应;人脸识别是大脑中一个特有的过程;在人 脸感知和识别过程中,局部和整体特征均起作用,若存在明显的局部特征时,整体特征 将不起作用;在正面脸人脸图像中,鼻子对人脸识别不起主要作用,但是在侧面人脸识 别中,鼻子对特征点的匹配作用很大,另外上半部的特征比下半部的特征所起的作用大: 低频部分对整体识别有用,高频部分对细节识别起作用;人脑的右半球对人脸图像的识 别起着重要作用,而左半球对语言的处理起主要作用;十岁以下的儿童识别人脸较多的 采用显著特征,而较少的使用整体分析;不同的种族、性别的人脸识别的难易程度不同, 这可能因为不同类型的人脸图像有不同的特性。 这些研究成果非常有益于计算机人脸识别技术的发展,如在计算机人脸识别中,可 以将那些通过对图像数据简单处理后获得的特征定义为低层次特征,而将线、面、模式 等描述特征定义为高层次特征。因此,图像k - l 变换、小波变换后的系数特征及一些统 大连理工大学硕士学位论文 计特征均属低层次特征而人脸部件形状的分析的结果则为高层次特征,这些都可以作为 计算机人脸识别的依据。但是除了少数文献外,计算机人脸识别的研究还是独立于神经 生理学和心理学的研究的。 人脸识别的研究始于6 0 年代末,最早的研究见于文献 3 】,b l e d s o e 以人脸特征点 的间距、比率等参数为特征,建成了一个半自动的人脸识别系统。早期的人脸识别方法 通常是以人脸器官位置、尺度和彼此间的比率作为描述人脸的特征。在以后的人脸识别 方法与技术的研究中,逐渐形成了以模板代替局部特征来描述人脸模式的趋势。用模板 描述人脸,可以避免基于局部器官特征的人脸识别方法所要求的精确定位问题,而且保 留了更多的识别信息。文献 4 】的研究表明,基于模板匹配的人脸识别方法要优于基于局 部器官特征的人脸识别方法。到了2 0 世纪9 0 年代,计算机人脸识别技术进一步发展。 目前的研究主要有两个方向:一是基于人脸图像部件特征分析的方法,这种识别方法通常 要抽取人脸器官如眼睛、眉毛、鼻子和嘴等器官的位置、尺度以及彼此间的比率作为特 征,但是这种方法对人脸图像的表情变化比较敏感,而且并没有充分利用人脸图像具有 的灰度信息,该方法已不是人脸识别的主流:二是基于人脸图像整体特征的识别方法, 包括特征脸( e i g e n f a c e ) 方法【5 7 1 ,f i s h e r 脸方法 7 。1 0 1 ,k e r n e lf i s h e r 脸:h - 法t n - 1 4 1 ,独立分 量分析 1 5 - 1 7 1 ( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ) 方法、隐马尔可夫模型 1 8 - 2 1 】( i i d d e n m a r k o vm o d e l ) 方法以及神经网络方法阱_ 2 4 】等,这些方法有的侧重于表述人脸图像的特 征提取,如k e r n e lf i s h e r 脸方法;有的侧重于分类,如神经网络方法;有的则侧重于人 脸图像的重构,如特征脸法。所有这些基于人脸图像整体特征的人脸识别方法相对于特 定的人脸数据库都取得了较好的识别性能。 从上个世纪9 0 年代开始,特别是美国9 一l l 事件发生以后,人脸识别的研究变得非 常的热门,吸引了大量的研究团体和研究人员的关注,人脸识别已经成为了模式识别、 图像处理、人工智能领域最成功的应用之一。目前,世界范围内有很多的科研机构都设 立了专门的研究组进行人脸检测和识别的研究,国外著名的人脸识别的研究机构主要有 英国s u r r e y 大学视觉、语音和信号处理研究中心( c e n t e rf o rv i s i o n , s p e e c ha n ds i g n a l p r o c e s s i n g ) 、瑞士i d i a p ( d a l l e m o l l ei n s t i t u t ef o rp e r c e p t u a la r t i f i c i a li n t e l l i g e n c e ) 、 法国i n r i a 研究所( f r e n c hn a t i o n a li n s t i t u t ef o rr e s e a r c hi nc o m p u t e rs c i e n c ea n d c o n t r 0 1 ) 、美国麻省理工学院( m r r ) 媒体实验室和人工智能实验室、美国卡奈基梅隆大 学( c m u ) 机器人研究所、美国i l i n o i s 大学b e c k m a n 研究所等。一些模式识别、计算 机视觉领域的著名的国际会议( 如国际计算机视觉会议i c c v 、国际计算机视觉和模式 识别会议c v p r 、国际模式识别会议i c p r 等) 和知名的国际期刊( 如i e e e t r a n s a c t i o n s 王永辉:基于c l s b o r 小被变换与支持向量机的 脸识别研究 o i lp a t t e r na n a l y s i sa n dm a c h i n ei n t e u i g e n c e ,p a t t e r nr e c o g n i t i o n ,i m a g ea n dv i s i o n c o m p u t i n g 等) 都设立了专门的人脸识别专题。 9 0 年代中后期以来,国内许多研究机构在自然科学基金、8 6 3 计划、攀登计划等资 助下,开始了对人脸识别的研究,主要有清华大学、北京大学、中国科技大学、上海交 通大学和哈尔滨工业大学等高校,中科院计算所,中科院自动化所和中科院声学所等科 研所,其中中科院计算所的研究工作取得了重大进展,他们的研究成果已经被应用到了 十六大会场。 1 3 人脸识别现有主要的特征提取和识别方法 一个完整的人脸识别系统一般可以分为两个过程:人脸的检测和人脸的识别。 图1 1 是一个典型的人脸识别系统的流程图:首先对已有的人脸图像库中的图像进 行检测与定位,找出其中是否有人脸,如果有找出入脸位置并标出来:得到的人脸图像 可能不清楚,存在倾斜,光照不好等情况,所以要对人脸图像进行预处理如人脸校正, 光照补偿等:然后对处理过的入脸图像利用一些特征提取方法如特征脸方法【5 】等进行特 征提取和选择,得到人脸特征;最后把得到的特征送入分类器里进行训练。对于一幅未 知的图像,也要经过人脸的检测与定位检测出图像中是否有人脸,如果有标出其位置, 然后进行人脸图像的预处理、特征提取与选择得到特征,最后利用分类器进行分类,判 别出该幅人脸图像是谁。 图】1 人脸识别系统的框图 f i g 1 1t h ed i a g r a mo f t l h ef 8 c er e c o g n i t i o ns y s t e m 本文主要研究人脸的特征提取与识别。当前人脸识别的主流主要是基于人脸整体特 征的识别方法,这类方法可以直接用人脸图像构成矩阵,通过提取矩阵的代数特征来实 现人脸的识别,这些方法已经在实验中取得了良好的效果,是当前人脸识别研究的热点。 下面对其中的几种典型方法加以概述: 大连理工大学硕士学位论文 ( 1 ) 主成份分析( p c a ) 方法,也被称为k - l 变换方法或者特征脸方法降”。入脸 图像的维数一般都比较高,大多都能达到上万维,如果直接将人脸图像作为识别的依据, 则程序所需要的计算量将是难以接受的。k - l 变换是图像压缩中的种最优正交变换, 能够很好的描述图像,人们将k - l 变换用于特征提取,从而形成了子空间法模式识别的 基础。高维的人脸图像经过k l 变换后可以得到一组正交基,可通过保留部分正交基, 以形成低维的人脸子空间,即通过训练样本集的总体离散度矩阵求出一组正交的特征向 量,这些特征向量就可组成个低维子空间,每幅人脸图像可向这个低维予空间上投影, 得到一个特征系数,而这个特征系数就可以作为人脸识别的依据,作为分类器的输入进 行分类。 ( 2 )f i s h e r 脸方法【7 。10 1 。这种方法和主成份分析方法一样,也是要得到高维人脸图 像的一组正交基,形成一个低维的人脸子空间,从而人脸图像向这个子空间投影得到一 组投影系数,作为人脸识别的依据,所以也有人把它称为主成份分析方法的改进方法。 人们希望投影后在低维空间里不同类别的样本尽可能分得开些,同时希望每个类别内部 样本尽量密集,也就是说,样本类间离散度越大越好,而样本类内离散度越小越好,所 以选择能使类间离散布矩阵和类内离散布矩阵最大的特征作为特征矢量,从而能很好的 判别人脸。文献【8 】中分别用主成份分析方法和f i s h e r 脸方法进行人脸识别,发现f i s h e r 脸方法相对于主成份分析方法识别率有了很大的提高。 ( 3 ) 独立分量分析( i c a ) 方法陋1 7 】。p c a 方法和f i s h e r 脸分析方法都是利用人脸 图像的二阶统计信息。i c a 是一种基于高阶统计的数据分析方法,目前己广泛应用于特 征提取、生理学数据分析、语音信号处理等领域。二阶统计量反映图像的幅度特性而不 是相位特性,而高价统计量反映了相位特性。对于给定的一幅自然的图像,保留其能量 谱而去掉其相位谱,这将大大的改变图像的外观,但是这不会改变图像的二阶统计量。 是相位谱,而不是能量谱包含了图像的结构信息。因而,只对能量谱敏感的p c a 并不 太适合用来表达自然的图像。引入高阶统计量的i c a 反映了图像的相位谱,所以在人脸 识别中具有更强的鲁棒性。但是在文献 2 5 】中发现利用i c a 进行人脸识别并没有得到预 想的识别率,甚至比p c a 方法的识别率还低。 ( 4 ) 隐马尔可夫模型( h m m ) 方法 1 8 - 2 1 】。i - i m m 是使用马尔可夫链来模拟信号统计 特性的一组统计模型。利用h m m 对人脸进行描述和识别,把各个器官的数值特征和一 个状态转移模型联系起来,该模型的参数能较好地表征具体的人脸模型,文献 2 0 1 将图 像的灰度值作为观察值矢量进行学习和识别,在o r l 图像数据库中测试结果达到了8 4 的识别率。伪二维h m m ( p 2 d h m m ) 模型是一维h m m 模型的一种扩展,相当于将 一组一维h m m 模型嵌入另外一组h m m 模型中,它利用了图像的二维特征,更适合于 乇永辉:基于g a b o r 小波变换与支持向量机的人脸识别研究 图像识别。h m m 方法的优点是稳健性好,对于不同角度的人脸图像和不同的光照条件, 都可以达到满意的识别效果。 ( 5 ) 神经网络方法 2 2 2 4 1 。神经网络在人脸识别应用中有很长的历史。神经网络方法 在人脸谚 别上比其它类型的方法有其独到的优势,即它避免了复杂的特征提取工作,可 以通过学习的过程获得其它方法难以实现的关于人脸识别的规律和规则的隐性表达。此 外,神经网络以并行方式处理信息,如果能用硬件实现,就能显著提高速度。神经网络 方法除了用于人脸识别外,还适用于性别识别、种族识别等。 1 4 本论文的主要工作和章节安排 本文主要对人脸特征提取,分类器设计进行了研究,主要工作如下: ( 1 ) 研究了入脸图像特征提取的问题,实现了主特征分析、f i s h e r 脸、k e r n e lf i s h e r 脸,g a b o r 小波进行特征提取的方法,先利用最小距离分类器进行分类,发现g a b o r 小 波特征提取方法要比其他三种方法的识别率高。 ( 2 ) 提出了一种基于g a b o r 小波变换特征提取的改进算法,即首先对人脸图像进行 g a b o r 小波变换,然后在进行降维的过程中,不是使用传统的的f i s h e r 脸方法进行降维, 而是使用本文提出的一种改进的f i s h e r 脸方法进行降维,得到变换特征基,人脸图像在 其上面的投影作为分类器的输入。 ( 3 ) 应用一种具有纠错能力的二类支持向量机分类器构成的多类分类器进行分类, 这种分类器由于利用了通信中信道差错控制编码技术而具有纠错能力。 本文共分五章,主要内容如下: 第一章是绪论部分,概述了人脸识别问题的提出、人脸识别发展的现状、人脸识别 现有的主要的特征提取和识别方法和本文的主要研究工作和章节安排。 第二章对主成份分析,f i s h e r 脸方法,k e r n e lf i s h e r 脸方法的基本原理和其在人脸 识别中的应用作了详细的阐述,并实现了这些算法,给出了实验结果。 第三章对g a b o r 小波变换的基本原理进行探讨,给出一种改进的g a b o r 小波变换进 行特征提取的方法,并给出了实验结果。 第四章应用和实现了一种具有纠错能力的二类支持向量机分类器构成的多类分类 器进行人脸识别的方法,并给出了实验结果。 第五章是本文的总结和展望。 大连理工大学硕士学位论文 2 几种典型人脸识别方法的研究 本章主要实现了三种统计人脸识别方法:主成份分析方法、f i s h e r 脸方法、k e r n e l f i s h e r 脸方法,这是现在人脸识别的主要研究方向,它们都是利用人脸图像的二阶矩进 行人脸识别,有的文献也提到可以用人脸图像的高阶矩来进行人脸识别,如i c a ( 独立 成分分析) 1 5 - 1 1 方法,文献【2 5 实验结果表明这种方法的识别效果不理想。本章在概述 利用人脸图像的二阶矩进行人脸识别的原理的同时,给出对这些方法的实验结果与分 析。 2 1 基于k l 变换的主成份分析方法 主成份分析方法也有人称为k l 变换方法,因为它主要是利用了图像的k l 变换。 k l 变换是一种正交变换,是在均方意义下的最优压缩变换,s i r o v i c h 和k i r b y 首先将 k l 变换用于人脸图像的最优表示,而文献【5 7 】都对k l 变换用于人脸识别进行了详细 的讨论。 2 1 1k l 变换 一个非周期随机过程不能用具有互不相关的随机傅立叶系数的傅立叶级数表示。但 是可以用具有互不相关系数的正交函数的级数表示。 文献 2 6 用最小均方误差来讨论离散情况下的k l 变换。假设一个非周期随机过程 x ,在离散情况下,对其在区间五s ,墨瓦内均匀采样,用以下向量表示x : 工= x ( ) x ( 乞) 工( f d ) 】7 ( 2 1 ) 对x 用确定的丁f 交归一化向量系,( ,= 1 ,2 ,呦展开,可得: 如果只用有限项来估计x ,即 则由此引起的均方误差为 x = 巳竹 三:兰。一 s = e ( x 一工) r ( 工一x ) 】 ( 2 2 ) ( 2 3 ) 王永辉:基于o a b o r 小波变换与支持向量机的人脸识别研究 文献 2 6 1 得出如下结论:以矩阵y = e x x 7 】的本征向量作为坐标值来展开工时,其截 断均方误差具有极值性质,且当取d 个从( ,= 1 ,2 ,回来逼近工时,其均方误差为: s = i ( 2 5 ) j d + l 式( 2 5 ) 中a ,是矩阵y 的本征值,可以看出,当取d 个与矩阵y 的d 个最大本征值 对应的本征向量来展开石时,其截断均方误差和在所有其他正交坐标系情况下用d 个坐 标展开x 时所引起的均方误差相比为最小,这d 个本征向量所组成的正交坐标系称作x 所在的d 维空间的d 维k l 变换坐标系,石在k l 坐标系上的展开系数向量称作x 的k l 变换。 k l 变换的一个非常重要的性质是它的展开系数是互相无关的,也就是说,通过k l 变换,消除了原有向量x 的各分量之间的相关性,从而可以去掉那些带有较少信息的坐 标轴以达到降低特征空间维数的目的。 2 1 2k l 变换在人脸自动识别研究中的应用 在人脸自动识别中,可以把k l 变换用于人脸图像的表示。把一幅人脸图像看成一 个二维数组或者个矩阵,用b ( f ,j ) 或者 毛】表示,其行和列标出了图像的一个点,而 矩阵中的相应元素的值标出了该点的灰度值。一幅n + m 的图像按列相连可以构成一个 n m 向量,即: x = ( b t l b 2 i b n l6 1 2 b 2 2 b u 2 6 i b 2 6 ) ( 2 6 ) 由上节讨论可知,k l 坐标系的生成矩阵为妒= e d 】,由于没有类别标签的样本 集的均值向量常常没有什么意义,所以也可以用样本集的协方差矩阵: 旷e 盼- u ) ( x - a ) 7 】 ( 2 7 ) 作为k l 变换的生成矩阵,有的文酬2 6 1 也把它称之为样本集的总的离散度矩阵,该 式可以改写为 妒2 壶荟( 玉刊( 玉刊7 ( 2 - 8 ) 其中五为第i 个训练样本的图像向量,i t 为训练样本集的平均图向量,吖为训练样 本的总数。 大连理工大学硕士学位论文 由于协方差矩阵的维数为n m n m ,如果直接求该矩阵的特征值和特征向量,计 算量将是巨大的,所以一般利用奇异值( s v d ) 分解的方法来间接的求特征值和特征向 量,s v d 定理如下 6 】: 设z 是一秩为,的珂+ r 维矩阵,则存在两个正交矩阵: u = ,坼,“】曼“: ( 2 9 ) v = v o ,v l ,- ,v r i 】贸“ 以及对角阵 a = d i a g & , , 一1 】吼“ ( 2 1 0 ) 且凡五2 4 满足如下等式: x = u a 一2 v 7( 2 1 1 ) 其中 为矩阵尉7 和石7 x 的非零特征值,u i 和v i 分别为x x 7 和x 7 工对应于丑的特 征向量,上述分解即为矩阵z 的奇异值分解,所以由上式可以得到: ! u = x v a 2 ( 2 1 2 ) 由于g 可以表示为: = 面1m 。- ( t 刊( 刊k 击) 。( 7 ( 2 1 3 ) 其中:x = 一,墨一,x u 一川,所以可以构造矩阵 月= z r x e 吼m 。吖( 2 1 4 ) 求出式( 2 1 4 ) 中矩阵的特征值和特征向量,然后利用式( 2 1 2 ) 就可以求出总散布矩阵 的特征向量u 。如果把所有的特征向量都用上,虽然比原来的维数大大的降低了,但通 常情况下,还是很大,所以考虑k l 变换的特点,仅仅选取最大的前k 个特征值对应的 特征向量百。这些特征向量每个也对应于一个图像,由于这些图像非常像人脸,所以 它们被称为特征脸,所以也有人把k l 变换用于人脸的方法称为特征脸方法。 这些特征向量形成一个降维子空间,原来的人脸图像可以看成该空间的一个点,它 们在该子空间的投影可以得到一组坐标系数: 儿= - - 巩g ( 一p ) ( 2 1 5 ) 王永辉:基于g a b o r 小波变换与支持向量机的人脸识别研究 这组系数表明了原来的人脸图像在该子空间的位置,因此可以作为人脸识别的依 据。对于一幅待识别样本也可以在子空间投影从而得到一组坐标系数,和人脸库中样本 得到的坐标系数比较,以确定该样本是人脸库中的哪一个人。 由以上所述,可把p c a 识别人脸分为以下几步: ( 1 ) 把每一幅人脸图像按照式( 2 6 ) 通过列连接的形式组成一个列向量; ( 2 ) 按照式( 2 1 4 ) 构造矩阵,求出该矩阵的特征值矩阵a 和特征向量矩阵矿; ( 3 ) 利用式( 2 1 2 ) 求出总的离散度矩阵的特征向量矩阵u t ,然后再利用式( 2 1 5 ) 求出已知样本和待识别样本的系数向量y 。; ( 4 ) 利用分类器以y 做输入对未知样本x t 进行分类。 2 1 3 实验结果与分析 本文主要实现了1 0 种在不同数目的特征脸下的主成份分析方法的分类效果,在每 个特征脸数目下实验5 次,求出它们的平均识别率。实验采用o r l 标准人脸数据库, 该人脸库里有4 0 个人,在每次实验中,从每个人的1 0 幅图像中随机的选取5 幅图像, 总共2 0 0 幅图像作为训练样本,剩下的2 0 0 幅图像作为测试样本。本章采用最小距离分 类器。实验结果如下表2 1 所示: 表2 1 主成份分析方法的实验结果 t a b 2 1e x p e r i m e n tr e s u l t so f p c a 特征脸数 2 02 53 03 53 94 55 0 5 5 6 0 6 5 由于在主成份分析方法中,信息的大部分包含在最前面的几个特征脸( 主分量或具 有最大特征值所对应的特征向量) 中,它们保留了原模式样本中大部分的信息量,所以 这种方法不但达到降维的目的,计算速度得到大大的提高,而且可以使用几个较少的特 征脸来作为识别的依据。本文实验采用了1 0 个不同的特征脸数目,由表2 1 可以看到这 种方法在特征脸数小于5 5 之前,随着特征脸数的增加,平均识别率也是在增加的,就 是说用到的信息越多,识别率就会越高,但是从表中可以看到在特征脸数大于5 5 以后, 随着特征脸数的增大,识别率下降了,这是因为较小特征值对应的特征向量可能反映了 人脸图像的噪声信息,所以识别率降低了。所以并不是用的特征脸数越多越好,一般情 况下是选取总离散度矩阵的前面的特征值的和占总的特征值的和的9 9 为准【2 6 】。但是从 表中可以看到这种方法的最低平均识别率为9 1 6 ,最高平均识别率达到9 3 1 ,所以 大连理工大学硕士学位论文 基本上还是能满足应用的要求的,这也是为什么主成份分析方法能成为人脸识别研究热 点之一的一个原因。 2 2 基于f is h e r 线性判别分析的人脸识别方法 虽然主成份分析方法取得了较好的效果,但是这种方法只考虑了总体散布最大的投 影方向,而没有考虑类内和类间分布的差异,现实中的人脸图像由于受到光照、表情等 的影响,同一个人的人脸在不同的情况下所成的图像之间的差异可能比不同人脸在相同 条件下所成的图像之间的差异还要大,所以主成份分析方法虽然是一种很好的人脸描述 方法,但不一定是最好的判别方法。在这种方法的基础上,p e t e r n b e l h u m e u r 和j o a op h e s p a n d a 提出了一种f i s h e r 脸方法【8 1 ,这种方法因为利用了f i s h e r 线性判别分析而得名。 f i s h e r 脸方法 加1 的基本思想是要找到一个最佳鉴别向量空间,在该空间投影的模式样本 有最大的类间距离和类内距离比,即样本在该空间中有最佳的线性可分离性,从而达到 样本分类的目的。 2 2 1f is h e r 鉴别向量 把月维空间的数据投影到一维直线上,就可以把r t 维数据压缩到一维,当然,这有 可能会使在, t 维空间里分得很开的一些紧凑的样本集混杂在一起。但是,研究表明,在 一般情况下,总可以找到某个方向,使样本投影到这条直线后能够较好地分开。 假设有一集合包含个仃维的样本五,x 2 ,h ,其中m 个样本属于w l 类,2 个样 本属于w 2 类( = n + n 2 ) ,若对样本z 的分量作线性组合,则可得标量: y = w 7 x ( 2 1 6 ) 这样得到相应于n 个维样本的集合m ,y :,y 。,从几何上看,若n i - - 1 ,则每个 y i ,就是相应的置到方向为w 的直线上的投影,实际上w 的幅度是无实际意义的,因为 它仅使y 改变一个比例而己,重要的是w 的方向。即希望落在直线上的标以类的样本 和标以类w ,的样本的投影会很好地分开而不是混合在一起。样本均值之差可用来度量投 影之间的分离性,设巩是以维样本的均值,则: 1 m 川。= 寺_ ,i = 1 ,2 ( 2 1 7 ) o ,j - i 而投影点的样本均值为: 于永辉:基于g a b o r 小波变换与支持向量机的人脸识别研究 妒- 1 7 m , y i , i = 1 ,2 ( 2 _ i s ) t 8 ) 铲。y ”l l ,2( 2 _ 则在一维y 空间,样本类内离散度牟和总类内离散度鼠的数学表达式为: 算= 嘶一厩) 2 ( 2 1 9 ) 晶= 雪卜爱 ( 2 2 0 ) 在f i s h e r 准则中,希望投影后,在一维y 空间里各样本尽可能分的开些,既希望两 类均值之差越大越好,同时希望各类样本尽量密集,即希望类内离散度越小越好,因此 可以得到如下f i s h e r 准则函数: 荆5 鞯 ( 2 2 1 ) 寻找使j r ( w ) 的分子尽可能大,而分母尽可能小,也就是使j p m ) 尽可能大的w 作 为投影方向,但厶( w ) 并不显含w ,因此必须设法将厶( 彬变成w 的显函数,由式( 2 1 8 ) 可推出 属= 击鬈乃= 击分“专。* 1 莹j - i 护嘲 c z z z , 这样式( 2 2 1 ) 的分子变为 ( 而l - r h 2 ) 2 = ( w 7 啊一w 7 m 2 ) 2 = w r ( 鸭一m 2 ) ( 鸭一m 2 ) 7 w = w r s a w ( 2 2 3 ) 其中矗= ( 玛一) ( 玛一) 7 ,为n 维x 空间的样本类间离散度矩阵。 再来看式( 2 2 1 ) 的分母和w 的关系: 牟= ( 以一面) 2 = ( w 7 _ 一w 巩) 2 = w 7 艺( t 一碍) ( _ 一) 】w = w 7 s , w ( 2 2 4 ) 其中s = ( x j 一- ) ( o 一) 7 ,为n 维x 空间的样本类内离散度矩阵。 因此 并+ 鼋= w t 一,1 4 , ( 2 2 5 ) 大连理工大学硕士学位论文 其中s 。= s 。+ 最,为以维x 空间的总的类内离散度矩阵 将式( 2 2 3 ) ,( 2 2 5 ) 代入( 2 2 1 ) 口- f f 得 枷) = 舞 ( 2 2 6 ) 这个式子是数学物理中著名的广义r a y l e i g h 商。为了求得最优的鉴别向量,将厶( w ) 对w 微分得: ojf(w):旦(芝娑):一2(wrs,w)sbw-2(wrs6w)sww:o ( 2 2 7 ) o w o w 、w t
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论