




已阅读5页,还剩55页未读, 继续免费阅读
(通信与信息系统专业论文)基于环形对称gabor变换子空间的人脸识别.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
山东大学硕士学位论文 摘要 人脸所反映的视觉信息在辨别身份和传递情感方面起着重要的作用,这一特 殊性使得人脸识别研究具有很高的应用价值,人脸识别技术也逐渐成为最重要的 生物特征识别技术之一,日益受到研究者们的关注;但同时,人脸是由复杂的三 维曲面构成的同一变形体,难以用数学描述,而且所有的人脸结构具有高度相似 性,人脸图像又容易受年龄、光照、环境等因素的影响,故人脸识别又是一个复 杂和困难的课题。 特征提取是人脸识别系统中的重要部分,也是人脸识别研究的关键内容,本 文对此进行重点讨论。首先对人脸图像进行某种变换,然后在变换域运用子空间 方法提取分类特征进行人脸识别。本文遵循这一特征提取思路,进行了相关研究, 主要内容如下: ( 1 )引入了环形对称g a b o r 变换 我们首先研究了现有的基于g a b o r 变换特征的人脸识别方法,分析了基于弹 性图匹配的特征提取方法以及基于g a b o r 特征判别分类法的人脸识别方法。在此 基础上,我们引入了环形对称g a b o r 变换,对环形对称g a b o r 变换的定义、概念 和性质进行了比较全面的分析和讨论,并且与传统的g a b o r 变换进行了对比分析, 发现环形对称g a b o r 变换比传统g a b o r 变换在变换的旋转不变性和减小的数据冗 余性方面具有明显的优势。 ( 2 )引入了加权p c a 方法并提出了修正的最大间距准则 我们首先通过深入研究主成份分析方法,分析了不同的特征分量对于分类的 作用不同,然后引入了加权主成份分析方法。在加权的主成份分析中,采用欧氏 距离测度进行分类,等价于在传统主成份分析空间中采用马氏距离测度进行分类。 这就从理论上给出了通过加权能够提高识别性能的原因。 在介绍了线性判别分析方法和最大间距准则方法的基础上,提出一种修正的 最大间距准则( m m m c ) 特征提取方法,它对m m c 方法中的类间散度矩阵和类 内散度矩阵进行了重新定义,通过实验验证了这种新的特征提取方法具有较好的 稳定性和有效性。 山东大学硕士学位论文 ( 3 )提出了采用环形对称g a b o r 变换和子空间方法的人脸识别方法 对环形对称g a b o r 变换特征在人脸识别中的应用进行了深入研究,在此基础 上,提出了采用环形对称g a b o r 变换的幅度特征,首先进行亚采样,形成增广矩 阵,然后用子空间方法进行特征提取的人脸识别方法。我们将环形对称g a b o r 变 换分别和加权p c a 方法、修正的最大间距准则方法进行结合,提出了两种人脸识 别算法,并在o r l 、y a l e 、f e r e t 人脸库上进行了实验,取得了较满意的结果。 关键词:人脸识别;环形对称g a b o r 变换;加权主成分分析;修正的最大 间距准则 2 a b s t r a c t t h ev i s u a li n f o r m a t i o nr e f l e c t e db yaf a c ep l a y sa m a j o rr o l ei nc o n v e y i n gi d e n t i 婶 锄de m o t i o n b e c a u s eo fi t s e x t e n s i v ea n da p p l i e dr e a l m ,t h er e s e a l c h o ff a c e r e c o g n i t i o nh a sv e r yi m p o r t a n tp r a c t i c a lv a l u e f a c e r e c o g n i t i o nh a sb e c o m eo n e0 ft h e k e yt e c l l l l 0 1 0 舀c si nb i o m e t r i c sa n dg o tt h ee x t e n s i v ec o n c e r nw i t hs t u d y h o w e v 瓯i t i s d i f f i c u l tt oi m p l e m e n tf a c er e c o g n i t i o nu s i n gc o m p u t e r s o no n e h a n d ,h u m a nf a c ei sa d e f o r m a b l eo b j e c tc o m p o s e do fc o m p l e x3 dc u r v es u r f a c e s ,w h i c hi s h a r dt 0b e r 印r e s e n t e di nt h ef o r mo fm a t h e m a t i c s o nt h eo t h e rh a n d ,f a c e so fd i 晌呦tp e r s o n s n a v et h es l m i l a rs t r u c t u r ea n dt h e f a c ei m a g e sa r eg r e a t l y d e p e n d e n to na g e s , i l l u m i n a t i o na n d i m a g i n ge n v i r o n m e n t t h i st h e s i sm a i n l ys t u d i e sf a c ef e a t u r ee x t r a c t i o nw h i c hi s t h ek e yp a r to ff a c e r e c o g n i t i o n f i r s t ,t r a n s f o r mt h ef a c ei m a g ew i t hac e r t a i nt r a n s f o r n l a t i o n ,a i l dt 1 1 e n e x 仃a c tt h ed i s c r i m i n a n t f e a t u r e sf o rf a c e r e c o g n i t i o nu s i n gs u b s p a c e sm e t h o d s f o l l o w i n gt h i sf e a t u r ee x t r a c t i o ni d e a , w es u m m a r i z et h em a i nw o r ko ft h i st h e s i sa s f o l l o w s : ( 1 ) c i r c u l a r l ys y m m e t r i cg a b o r t r a n s f o r m ( c s g t ) f i r s t , r e s e a r c hi sc o n d u c t e do ng a b o rt r a n s f o r m ( g t ) b a s e df a c er e c o 嘶t i o n 1 w o t y p l 洲a p p r o a c h e su s i n gg a b o rf e a t u r e s ,e l a s t i cg r a p h m a t c h i n g ( e g m ) a n dg a b o r f e a t u r ef i s h e rc l a s s i f i c a t i o n ( g f c ) a r e a n a l y z e d t h e nw ei n t r o e 【u c ec s g tw i t h c o m p l e t ea n a l y s i sa n dd i s c u s s i o nt ot h ed e f i n i t i o n , c o n c e p ta n dp r o p e r t i e so fi t b v 唧a n n g t ot h et r a d i t i o n a lg t , i ti sf o u n dt h a tt h ef o r m e ri sr e m a r k a b l ys u p e n o r i l l r o t a t i o ni n v a r i a n c ea n dr e d u c t i o no f d a t ar e d u n d a n c y ( 2 ) w e i g h t e dp c a ( w p c a ) a n dm o d i f i e dm a x i m u m m a r g i nc r i t e r i o n ( m m m c ) i nt h es t u d yo ft h et r a d i t i o n a lp c a a p p r o a c h ,w ef o u n dt h ed i l j f e r e i l te 行吕c t so f d i f f e r e n tf e a t u r e si nf a c er e c o g n i t i o n ,a n d p r o p o s e dt op e r f o r mf a c er e c o g n i t i o ni na w e i e l a t e dp c as p a c e i ti sp o i n t e do u tt h a tc l a s s i f i c a t i o n b ye u c l i d i a nd i s t a n c e si n ,p c as p a c ei se q u i v a l e n tt o t h a tb ym a h a l a n o b i sd i s t a n c e si nt h e 仃a d i t i o n a lp c a s p a c e t h u s ,t h er e a s o nb e h i n dt h ep e r f o r m a n c ei m p r o v e m e n to ft h ew p c a a p p r o a c hi s g i v e ni nt h e o r y b a s e dl i n e a rd i s c r i m i n a n t a n a l y s i s ( l d a ) a n dm a x i m u mm a 哂nc 订t e r i o n 3 山东大学硕士学位论文 ( m m c ) m e t h o d s ,w ep r o p o s em m m cm e t h o dt h a tr e d e f i n e st h ew i t h i n c l a s ss c a t t e r m a t r i xa n dt h eb e t w e e n - c l a s ss c a t t e rm a t r i x e x p e r i m e n tr e s u l t sp r o v et h a tt h en e w m e t h o di ss t a b l ea n de f f e c t i v e ( 3 ) c s g t - s u b s p a c em e t h o db a s e df a c er e c o g n i t i o n w ec a r r yo u tac o m p l e t es t u d yt ot h e p r o b l e mo fa p p l y i n gc s g tt o f a c e r e c o g n i t i o na n dd e c i d et ou s et h em a g n i t u d ef e a t u r eo fc s g t f i r s t ,d o w n s a m p l et h e t r a n s f o r md o m a i na n df o r ma u g m e n t e df e a t u r ev e c t o r s ,a n dt h e ne x t r a c tc l a s s i f i c a t i o n f e a t u r e su s i n gs u b s p a c em e t h o d t h u sw ep r o p o s et w oa l g o r i t h m s :c s g t - w p c aa n d c s g t - m m m c e x p e r i m e n tr e s u l t so nt h e0 r l ,l l e ,a n df e r e tf a c ed a t a b a s e sa r e s h o w na n dd i s c u s s e d k e y w o r d s :f a c er e c o g n i t i o n ;c i r c u l a r l ys y m m e t r i c a lg a b o rt r a n s f o r m ( c s g t ) ; w e i g h t e dp r i n c i p a lc o m p o n e n ta n a l y s i s ( w p c a ) ;m o d i f i e dm a x i m u mm a r g i nc r i t e r i o n ( m m m c ) 4 山东大学硕士学位论文 算术符号 t ( 上标) 1 1 | l i 1 1 ( 上标) e 【】,e ) t r ( s ) 符号说明 意义 连加 向量或矩阵的转置,如么 向量的范数,如0 纠i 向量或复数的绝对值,如i 卅 矩阵的逆,如a _ 均值运算,如“= 研x 】,u = e b ) 表示石的均值为“ 矩阵s 的迹 d i a g , 对角矩阵,如以赠五五屯 _ 简写符号 p c a w p c a l d a ( f i s h e rf a c e ) k l t d l d a m m c m m m c g t c s g t e g m g f c 意义 主成份分析 加权主成份分析 线性判别分析 k - l 变换 直接线性判别分析 最大间距准则 修正的最大间距准则 g a b o r 变换 环形对称g a b o r 变换 弹性图匹配方法 g a b o r 特征判别分类法 a 00 0也0 0 0 以 5 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不 包含任何其他个人或集体己经发表或撰写过的科研成果。对本文的研 究作出重要贡献的个人和集体,均已在文中以明确方式标明。本声明 的法律责任由本人承担。 论文作者签名:至鲨至 e l 期: 细甲¥z 7 关于学位论文使用授权的声明 本人完全了解山东大学有关保留、使用学位论文的规定,同意学 校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论 文被查阅和借阅;本人授权山东大学可以将本学位论文的全部或部分 内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段 保存论文和汇编本学位论文。 ( 保密论文在解密后应遵守此规定) 论文作者签名:至堂圣 导师签名:之( c ( 玉 日期:塑! ! 兰三 山东大学硕士学位论文 第一章引言 1 1 人脸识别的研究背景和研究内容 随着社会的发展及技术的进步,社会各方面对快速高效的身份识别与验证技 术的需求也与日俱增。例如网络邮箱、操作系统、信用卡等,都需要进行可靠的 身份验证,可靠的身份使得参与者对自己的行为更加负责,也使得金融和商业交 易更加安全有效。但传统的识别验证技术如密码、密钥、证件等,都存在不方便、 不安全、容易被遗忘或被窃取等缺点。于是,生物特征识别技术成为了全新身份 验证技术的热点。所谓生物特征识别是指根据人体自身所拥有的、能够唯一标识 其身份的生理或行为特征来进行身份识别的技术。生理特征包括d n a 、虹膜、指 纹、掌纹、语音、人脸等;行为特征通常指人类个体的习惯性行为特征,如步态, 笔迹等。其中,人脸特征因具有很强的自身稳定性和个体差异性而受到越来越多 的关注,而且人脸识别系统具有操作友好、没有侵犯性、更加符合人类认知习惯、 容易被用户接受等优点【1 3 1 。 一般的人脸识别系统如图1 1 所示。通常包括人脸的检测和定位、特征提取、 分类器研究、表情和生理特征分析等几个方面。图中,虚线表示在训练阶段存在 的流程。 图1 1 人脸识别系统框图 人脸识别的主要研究内容包括: ( 1 ) 人脸的检测和定位( f a c ed e t e c t i o na n dl o c a t i o n ) 【4 】:即对任意一幅给定 的图像,采用一定的策略对其进行搜索以判定其中是否包含人脸,如果有则返回 人脸的位置、大小、方向( 正面还是侧面) 甚至形状等信息,并将其从图像背景 6 山东大学硕士学位论文 中分割出来。人脸检测前要对图像进行预处理,包括去噪、校正等。检测出人脸 之后通常要对其进行特征点( 如眼睛、鼻子和嘴巴等) 的定位、几何校正、灰度 归一化以及光照补偿等后续处理。人脸检测可以分为两种情况:第一种情况确定 人脸的位置,如在静止图像中判断是否存在人脸。第二种情况是要进行动态的人 脸跟踪,如在视频图像序列中判断是否存在人脸。人脸检测是一项很复杂的任务, 因为在检测时预先无法确知人脸的尺寸大小、位置、方向以及姿态角度等等,而 且表情和光照也会使得人脸的外观产生变化,有时还会有遮挡情况存在,这就使 得人脸检测变得非常困难,人脸检测的准确度和人脸图像预处理效果的好坏直接 决定着人脸识别的准确度。 ( 2 ) 特征提取( f e a t u r ee x t r a c t i o n ) :特征提取之前也要进行预处理,包括调 整图像大小、增强、几何校正等,主要是为后续处理提供高质量的图像。人脸包 含复杂的信息,并不是所有的信息都利于识别和分类,所以在分类识别之前,首 先要进行特征提取,用提取出的特征来表示人脸。常用的特征包括统计特征( 如 特征脸、f i s h e r 脸) 、小波特征、g a b o r 特征等。特征提取是分类识别的前提和基 础,良好的特征表示不仅有助于分类,而且也可以提高运算速度和精度,因此提 取特征的好坏直接决定着最终分类判决的好坏。很多经典的人脸识别方法就是根 据其特征提取方法来命名的,可见特征提取是人脸识别中非常重要的一环。 ( 3 ) 分类器研究( c l a s s i f i c a t i o n ) :这一环节就是设计分类器,根据提取的分 类特征对待识别的人脸图像与数据库中预先存储的人脸图像进行匹配判别。判别 要求通常分为两类:一类是人脸辨识,即确定输入图像是数据库中的哪一个人, 这是一对多的过程;另一类是人脸确认,即验证某个人的身份是否属实,这是一 对一的过程。我们将在1 4 节对分类器进行具体介绍。 ( 4 ) 表情分析和识别( f a c i a le x p r e s s i o na n dp h y s i c a la n a l y s i s ) - 对人脸表情 进行分类,通过表情来判断人的心理变化,分析判断人的喜、怒、哀、乐,从而 做出相应的处理,这也是人工智能研究中的一个热点;对待识别的人脸的生理特 征进行分类,主要包括年龄的大致范围、性别、种族等相关信息,将来可能发展 到,通过分析人脸的生理特征来诊断疾病。 表情分析和生理特征分析的研究现在还处在起步阶段,但发展迅速,逐渐成 为人脸识别和人工智能研究的一个重要分支。 7 山东大学硕士学位论文 1 2 人脸识别技术的应用 人脸识别技术在国家和公共安全、信息和金融安全、企业应用和人民生活掣3 】 各个领域具有非常广阔的应用前景。典型应用可以分为身份识别和身份验证两大 类,身份识别主要解决“是谁”的问题,而身份验证主要解决“是不是他”的问 题。具体应用列举如下: ( 1 ) 视频监控:在机场、火车站、汽车站、地铁、银行等一些重要场所都装 有2 4 小时视频监控摄像机,当对视频图像进行集体处理时就要用到人脸检测、跟 踪和识别技术。当视频监控用于刑侦破案时,如果拍摄条件良好,获得了质量较 好人脸图片,就可以运用人脸识别技术,从人脸数据库中找到与获得的照片最相 似的人进而确定其身份。如果这项工作改为人工完成,不仅效率低下,容易出错 而且很难做到实时地完成。 ( 2 ) 证件查验:现在很多证件如身份证、驾驶证、社保卡等虽然都用磁条记 录信息,但很多场合仍然是根据证件上的照片,采用人工验证,效率较低。如果 采用人脸识别技术,将这项工作交给计算机自动完成就可以实现自动化管理。另 外,还有一些证件,l i - 女n 信用卡、银行卡等,这类卡容易丢失,密码也容易遗忘 或是被窃取,一旦被他人同时获得了卡片和密码,持卡人就可能遭受损失。如果 在这类卡上引入人脸信息,通过密码和人脸的双重验证就可以很好地提高安全性。 ( 3 ) 入口控n - 入口控制的应用范围相当广泛,例如一些企事业单位、私人 住宅、楼宇入口处等都会设置门禁系统,进行入口控制。相比于人工证件查验, 采用人脸识别技术,可以大大提高工作效率。另外在一些保密要求比较高的部门, 如军事情报部门、政府部门、银行金库等采用证件、密码与一些其他识别验证手 段相结合的多重验证,如指纹识别、掌纹识别、虹膜识别等。人脸识别因为其直 接、方便、非接触式、界面友好的特点而受到越来越多的重视。 此外,人脸识别技术还可以用于出入境管理、自动考勤系统、真实感虚拟游 戏、人工智能研究等等。 1 3 人脸识别的主要方法 早期的人脸识别侧重于人的面部特征,整个过程依赖于人工操作,无法实现 山东大学硕士学位论文 自动化。自动人脸识别方法,最早是采用人脸特征部件的几何特征【5 - 6 1 ,这类方法 首先需要对人脸图像中的眼睛、鼻子和嘴角等脸部特征进行定位,然后利用特征 点的空间坐标计算得到特征向量来表示人脸面部特征,通过比较待识别人脸的特 征向量和人脸库中人脸的特征向量来实现识别任务。但是,因为以灰度图像甚至 真彩色图像形式出现的入脸所包含的信息,远比有限的几何特征所代表的要多, 而且几何特征也极度不稳定,所以基于几何特征的人脸识别方法逐渐退出人脸识 别的主流方法行列。 人脸识别技术的真正兴起,是在9 0 年代,m t u r k 和a p e n t l a n d 等人提出了 采用k 。l 变换的特征脸方法 7 1 ,这种方法也是当前流行的基于人脸全貌或基于整 体统计特征的人脸识别方法的一个典型代表。基于整体统计特征的方法主要考虑 模式的整体属性,这种方法不仅保留了人脸部件之间的拓扑关系,而且也保留了 各部件本身的信息,其性能优于基于几何特征的方法,但要求更强的计算能力。 基于人脸全貌的人脸识别方法除了特征脸方法还包括:线性判别分析方法、独立 分量分析方法、核子空间方法等。下面就对这些方法进行简单的概括介绍。 ( 1 ) 主成分分析方法 基于k l 变换的主成份分析( p c a ) 方法,又称特征脸( 或本征脸,e i g e n f a c e ) 方法,t u r k 等人【7 1 在k i r b y - 等j k t 8 - v 作的基础上提出的,这是在人脸识别中具有里 程碑意义的方法,它已经成为人脸识别的性能测试基准算法【9 】。随后各种基于p c a 的改进方法相继诞生【1 m 1 3 1 。 ( 2 ) 线性判别分析方法 线性判别分析( l d a ) 又可称为f i s h e r 线性判别分析( f l d a ) ,是模式识别 中著名的特征提取方法。它通过线性变换,将模式样本向低维的空间投影,以期 获得“尽量小的类内散度和尽量大的类间散度 。b e l h u m e u r 等首先提出采用l d a 方法进行人脸识别【1 4 】,这就是著名的f i s h e r p a ( f i s h e r f a c e ) 方法。后来许多研究者 又提出了各种不同的采用l d a 的人脸识别方法【1 5 18 1 ,如零空间法、直接l d a 方法、 简化零空间法等。 最大间距准则( m m c ) 方法是近年来提出的一种方法【1 9 1 ,这种方法的基本思 想与l d a 方法类似,准则函数由“商 改为“差”,从而不需要求取类内散度矩 阵的逆,克服了l d a 方法中存在的小样本问题( s s s ) 。在一些限制条件下,该方 9 山东大学硕士学位论文 法提取的特征与l d a 方法提取的特征是相同的【1 9 - 2 0 1 。本文提出的修正的最大间距 准则方法就是以m m c 方法为基础的。 ( 3 ) 独立分量分析 p c a 中提取的是统计不相关特征分量,并不能保证这些分量相互独立。而独 立分量分析【2 l 】( i c a ) ,作为对p c a 的推广,其主要思想是通过线性变换,从训练 样本中提取出相互统计独立的特征。i c a 是基于高阶统计信息的,所以求解过程 比p c a 和l d a 要复杂。b a r t l e t t 等首先将i c a 应用于人脸识别,并得到了优于p c a 的识别结果【2 2 1 。直接用i c a 进行人脸识别,虽然效果一般优于p c a ,但是识别的 效果容易受图片的亮度和姿态变化的影响,近年来不断提出一些改进的i c a 识别 算法【2 3 1 。文献 2 4 对i c a 作了较详细的评价分析,并与特征脸和f i s h e r 脸进行了 实验比较,结果显示i c a 略好于后两者。文献 2 5 则指出,在选择各自最佳的距 离度量后,i c a 明显不如p c a 。在p c a 中通常是根据特征值的大小来自动选取主 分量的,但是对于如何有效地、自动地选取对分类有用的独立分量,目前还没有 一个很好的标准,通常都是根据经验来选取的。 ( 4 ) 核子空间方法 核子空间方法包括核主成分分析( k p c a ) 2 6 - 2 7 】和核f i s h e r 判别分析( k e r n e l f i s h e rd i s c r i m i n a n ta n a l y s i s ,k f d a ) 2 8 - 3 2 1 。 k p c a 是对p c a 向非线性特征空间的推广,以提取非线性特征组合,而不是 p c a 空间中的线性特征组合。为此,首先要将输入样本映射到一个高维空间,然 后在该空间中进行常规的p c a 。在高维空间中进行常规的p c a 就相当于在原始空 间中进行非线性的p c a 。k p c a 方法通过在原始空间中采用特殊的核进行一系列 数学上等价的运算,从而避免将数据变换到高维空间中去计算向量的内积。 文献 2 6 首次将k p c a 方法应用于人脸识别,尽管比p c a 能更有效地描述人 脸的复杂变化,但它和p c a 一样,得到的非线性主成分是基于所有样本的最优重 建这一准则的,所以对于分类也不一定是最优的【3 3 】。文献 2 8 】中的实验结果显示, k p c a 有时比l d a 的识别效果要差,也说明了它的这一缺点。 和k p c a 不同,k f d a 是在高维特征空间中运用l d a ,它结合了核技术和l d a 的思想,来提取非线性的判别特征。目标仍然是寻找一种变换,使样本在高维特 征空间中获得“尽可能小的类内离散度和尽可能大的类问离散度”。k f d a 在人脸 1 0 山东大学硕士学位论文 识别中的应用仍在研究中。 各种人脸识别方法单独应用于特定的人脸库时,都能取得较好的实验结果, 如果将这些方法进行有效的组合,是否会收到更好的效果呢? 例如,为了克服小 样本问题,先用p c a 进行降维,然后再应用l d a 方法。在变换域运用这些方法, 是否会好于直接在图像域进行呢? 例如d c t 域,g t 域等。本文我们就主要对c s g t 域进行研究。 1 4 人脸识别系统中常用的分类准则和分类器 人脸样本经过特征提取过程,最终成为特征空间中的点。因此,样本之间的 相似性,通常可以通过计算样本点在特征空间的距离或角度实现。 将人脸表示为特征空间的点,两个待测人脸图像在特征空间中表示为向量x 和 y ,+ 常用的相似性测度有: ( 1 ) 欧氏距离 一 d ( x ,y ) = lx - y l i = 、亿一乃尸 ( 1 1 ) yi = l ( 2 ) 街区距离 a ( x ,y ) = i x , 一乃l ( 1 2 ) ( 3 ) 马氏( m a h a l a n o b i s ) 距离 d ( x ,y ) :窆等 m 2 葫2 菇x t y , ( 1 - 3 ) ( 1 - 4 ) ( 1 - 5 ) 山东大学硕士学位论文 ( 5 ) 明氏距离( m i n k o w s k id i s t a n c e ,欧氏距离和街区距离的一般化形式) ,dg 、1 叮 d ( x ,x ) = l 1 一x 。t ii ( 1 6 ) 女2 1 q = 1 时得到街区距离,q = 2 就得到欧氏距离。 此外,还有人采用欧氏距离平方、均方误差、相关系数以及加权的街区距离、 加权的均方误差和加权的夹角余弦等【3 5 3 6 1 相似性测度。 按照距离的分类准则相应的分类器可以分为: ( 1 ) 最小距离分类器 最小距离( m i n i m u md i s t a n c e ) 分类器首先要求出已知样本的类中心( 类平均) , 把待识别样本归为与之距离最近的类中心所在的类。 ( 2 ) 最近邻分类器 最近邻( n e a r e s tn e i g h b o r ) 分类器是最常用的距离分类器,即把待识别样本 归为与之距离最近的已知样本所在的类。 ( 3 ) k 近邻分类器 k 近邻( kn e a r e s tn e i g h b o r ) 分类器取待识别样本的k 个近邻,这k 个近邻 中属于哪一类的已知样本多,则把待识别样本归为哪一类。 1 5 人脸数据库 对人脸识别系统的性能进行评价和改进,都离不开人脸数据库,目前能够用 于研究的人脸数据库有: ( 1 ) o r l 3 7 】人脸数据库 英国剑桥大学的o r l ( o l i v e t t ir e s e a r c hl a b o r a t o r y ) 人脸数据库是人脸识别研 究的早期经常被人们采用的人脸数据库,该数据库包含4 0 个人共4 0 0 幅人脸图像, 图像的分辨率均为1 1 2 9 2 像素。这些图像包括了姿态、表情和面部饰物的变化, 深度旋转和平面旋转可达2 0 度。 ( 2 ) a r 3 8 - 3 9 1 人脸库 a r 人脸数据库是由西班牙巴塞罗那计算机视觉中心于1 9 9 8 年创建的,也是人 脸识别研究中用得比较多的数据库之一。a r 数据库共包括1 2 6 个不同的人( 7 0 名男 1 2 山东大学硕士学位论文 性,5 6 名女性) 的人脸图像,每个人大约2 6 幅左右,图像为2 4 位彩色图,分辨率 为7 6 8 5 7 6 像素。a r 数据库中的人脸图像是正面的人脸图像,具备表情、光照和 遮挡等的变化,表情变化和遮挡是这个数据库的主要特点之一。该数据库不仅可 以用于人脸识别,而且还可以用于表情识别。 ( 3 ) y a l e 4 0 】人脸数据库 美国耶鲁大学的y a l e 人脸数据库由耶鲁大学视觉与控制中心创建,包括1 5 位志 愿者的1 6 5 幅人脸图像,图像具备表情和光照的变化,表情有正常、悲伤、昏睡、 惊讶以及眨眼等,光照按光源位置可划分为均匀、中心、左侧和右侧等,光照变 化是y a l e 人脸数据库的主要特点。 ( 4 ) f e r e t 4 1 】人脸数据库 f e r e t 人脸数据库目前是世界上最大的人脸数据库,它是由美国国防部为了促 进人脸识别算法的深入研究和实用化,发起人脸识别技术( f a c er e c o g n i t i o n t e c h n o l o g y , f e r e t ) 工程而建立的。f e 砌玎人脸数据库包括一个通用的人脸数据库 和一整套的通用测试标准。与其他的一些人脸数据库不同的是,该数据库每个人的 人脸图像不仅包括姿态角度、表情和光照等的变化,而且还包括时间间隔的变化, 最长的时间问隔达3 年之久。f e r e t 人脸数据库包括数千人的几万幅人脸图像,而 且还在不断地扩充。目前每两年一度的人脸识别竞赛主要就采用f e r e t 的人脸数据 库作为评测标准。 ( 5 ) c a s p e a l 人脸数据库4 2 】 该人脸库是由中国科学院计算技术研究所银晨科技面像识别联合实验室 建立,包含了1 0 4 0 名中国人共9 9 4 5 0 幅头肩部图像。所有图像在专门的采集环境中 采集,涵盖了姿态、表情、饰物和光照四种主要变化条件,部分图像具有背景、 距离和时间跨度的变化。该人脸库的建立对中国甚至亚洲的人脸识别研究起到积 极的推动作用。 其他常用的人脸数据库还有m i t 的m i t c b c l 人脸数据库【4 3 】、c m u 的p i e 人脸 数据库【4 4 1 、英国曼彻斯特大学的u m i s t 人脸数据库【4 5 】和x m 2 v t s d b 多模态人脸 数据库【4 6 】等。 1 3 山东大学硕士学位论文 1 6 本文的主要研究内容 本文的研究工作主要包括三点,首先深入研究了环形对称g a b o r 变换定义和特 性,然后分析了一种基于c s g t 的人脸识别算法。其次是对加权p c a 和m m c 方法 的研究,并对m m c 方法提出改进,得到了m m m c 方法,然后给出了m m m c 方法 应用于人脸识别的算法步骤和实验结果。再次是将w p c a 和m m m c 方法分别应用 于c s g t 域,得到两种相应的人脸识别算法,给出了算法步骤和实验结果,证明两 种算法的可行性和有效性。 ( 1 ) 环形对称g a b o r 变换 分析了传统g a b o r 变换和环形对称g a b o r 变换( c s g t ) 的定义,对人脸图像在 g t 域和c s g t 域中的性能进行了理论和实验分析,经过对比分析给出了c s g t 特 性。同时,对基于g t 和c s g t 的典型人脸识别算法进行了深入分析; ( 2 ) w p c a 和m m m c 方法 对线性特征子空间方法的研究,包括基于主成份分析( p c a ) 的方法、基于 线性判别分析( l d a ) 的方法以及基于最大类间边缘准则( m m c ) 的方法,指出 各种方法所存在的不足,在此基础上引进了w p c a 方法,并且提出一种修正的m m c 方法( m m m c ) ; ( 3 ) 基于环形对称g a b o r 变换子空间的人脸识别方法 提出了基于c s g t 子空间的两种人脸识别方案:c s g t - w p c a 方法和 c s g t - m m m c 方法,给出算法步骤,实验结果和结果分析。 1 4 山东大学硕士学位论文 第二章环形对称g a b o r 变换 如何表示人脸是人脸识别中的一个重要问题,理论上讲,良好的人脸表示可 以使得最简单的分类器具有良好的识别性能【4 7 1 。目前,多数的人脸识别方法,如 p c a 、l d a 等都是直接利用了二维图像表观( 灰度值) 作为人脸表示。人脸的三 维信息也可以很好的表示人脸,但其难以准确获取。另一种常用的人脸表示思路 是对二维图像表观做某种变换如傅里叶变换、离散余弦变换、小波变换等,用变 换域特征来表示人脸。本章首先介绍g a b o r 变换以及基于g a b o r 特征的人脸识别 算法,然后在g a b o r 变换的基础上介绍另外一种变换环形对称g a b o r 变换, 通过分析其特性发现用于人脸表示的可行性。 2 1g a b o r 变换及其在人脸识别中的应用 2 1 1g a b o r 变换 d g a b o r 证明【4 8 】,对于信息存在一个所谓的量子原理,即对一维信号的联合时 一频域进行量化时,信号或滤波器所占的面积都不会小于一个定值。这一反映时间 和频率分辨率之间的折中关系的最小面积,具有一个类似于物理学中测不准原理 的下限。他发现,高斯函数调制的复指数函数,具有最小的折中极限,并于1 9 4 6 年提出了g a b o r 变换【4 8 】,其基本函数是由确定的高斯函数和不同频率的调制信号 产生的。一个任意信号可由其向基本函数的投影进行编码表示,这就相当于具有 高斯窗的傅里叶变换。 d a u g m a n 4 9 与0 1 将其扩展到二维情况,用于建模方向选择简单细胞的感受野。二 维g a b o r 函数可以看作二维高斯函数被某空间频率调制的情况,也可以看成是一 个用高斯包络函数约束的平面波: ,= 等e x p 等水h 一方 l , 式中z = ( x , y ) 为空间域坐标向量,k = k ( c o s 矽,s i n ) 为频率向量,控制着高斯窗1 5 1 的宽度、震荡部分的波长和方向,其中k 为频率,为方向角; 1 5 山东大学硕士学位论文 ,z ,”凡一= 瓜( 器) ,雌倍频程带宽( o c t a v e b a n d w i d t h ) 。方括号中第一项决定了g a b o r 核的震荡部分,可见复数形式的g a b o r 核函数是偶对称的余弦分量和奇对称的正弦分量的组合,第二项的作用是去除函 数的直流成分。 2 1 2 g a b o r 变换在人脸识别中的应用 图像的g a b o r 变换可以通过g a b o r 核函数与图像的卷秘来实现: j j = p ( 昂一j ) ,何) d 2 x = ( p + ) ( 毛) ( 2 2 ) 毫表示像素位置点,实际的卷积过程既要在空间域( 逐像素) 进行采样,也要对 g a b o r 函数即频域( 如震荡方向和波长) 进行采样。将g a b o r 特征用于人脸识别的 典型方法包括b u h m a t m 和l a d e s 等人所提出的弹性图匹配或动态连接机制方法 5 l - 5 3 】 和c l i u 提出等人提出的o a b o r 特征判别分类法睁i 。在他们的工作中,都采用7 5 个 不同频率和8 个不同方向的o a b o r 幕函数,也即定义 女= ( 压y ,i _ 1 ,2 , = 百, w r ,p = 0 , 1 ,2 图2 - 15 个频率和8 个方向上的g a b o r 基函数的实部 山东大学硕士学位论文 图2 - 24 0 个g a b o r 基函数的虚部 图2 - 34 0 个g a b o r 基函数的m m 度 篱 图2 4 人脸国像样本 摹函数与人脸图像卷积,于是图像上的一个点处的局部特征,可以片j 4 0 个 棚应的g t 系数表示人】| 盒识别问题就变成了g t 系数的匹配问题。 图2 一l 所示的就是上述4 0 个g a b o r 基函数的实部,图2 - 2 所示的是虚部的情 况,而图2 - 3 所示的是其幅度的情况。用这4 0 个g a b o r 基函数对幽2 - 4 所示的人 脸图像进行变换后,其实部、虚部和幅度的情况分别如图2 5 、图2 - 6 和图2 7 所 不。 霾霾蘑霾鋈圈圈霪霾蓠圈阌闺阏澜圈圈圈图图 溺阁斓删娜豳豳阉闷闽螂圈豳脚期剐 翻豳豳黝黝一圈豳豳黝豳一 圈豳豳搦缓酏豳囫豳豳豳酏 圈圈霪弱豳圈圈霆翳豳雪雪霪雪闺垂霍雪霾酉 山东大学硕士学位论文 图2 7 人脸图像g t 的幅度 2 1 3 基于g a b o r 变换的典型人艟识g i 算法 使用g a b o t 特征的典型人脸识别算法包括弹性束图匹配方法( e g m ) 和g a b o r 特征判别分类法( g f c ) 。下面我们就对这两种方法进行重点介绍。 图2 - 8 弹性图匹配方法的算法框图 ( i ) 文献【5 3 】最早提出采用弹性图匹配( e l a s t i cb u n c hg r a p hm a t c h i n g ) 的识 别方法,图2 - 8 就是该方法的算法框图。这种方法的基本思路是,将人脸表示为一 个由若干预先定义的节点和边构成的属性图,每个节点是对应于人脸图像上预先 定义好的、具有特定高层语义的特征点位置,如瞳孔,鼻尖,嘴角等。节点的属 性为以该点为中心计算得到的g a b o r 变换特征形成的特征串。例如,采用5 尺度, 山东大学硕士学位论文 8 方向的g a b o r 变换,则每个节点的属性是4 0 个系数组成的数组;而每条边对应 的足两个节点之间的连接,其属性便是两个节点之问的距离。一幅人脸图像将由 一幅节点和边的属性图表示,通过属性图的匹配来完成识别。下面进行详细介绍。 节点属性( 节点处的g a b o r 变换系数) 可以表示为,卢。( i ) = g ( 最。,i ) ,其中, g ( ) 表示g a b o r 基本函数与图像在节点i 处的卷积运算,k 。,表示频率向量, 1 ,2 ,8 和u 1 ,2 ,5 ) 分别表示基本函数的频率和方向。于是,节点处的4 0 个g a b o r 系数构成一个特征向量,称为一个射流( j e t ) ,;边的属性记为节点i ;和 节点i ,问的欧氏距离向量为a 】| := i ,一i ,( i ,j ) e ,其中,e 是所有连接的集合。 节点和边的相似性测度可以标记为两个对应射流之间的相似性测度,这里同 时考虑了相位信息 甲1 mc o s ( 一矽- d k ,) j7,j肘=了雹季又万 2 3 式中,a j 和办分别为射流j = j ,j 中g a b o r 变换系数的幅度和相位,d 为两节点间 的相对位移量,可以通过对& 的泰勒级数展开式的最大化进行估计。 为了应对人脸的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论