(计算机应用技术专业论文)最优人脸判别特征提取方法研究与实现.pdf_第1页
(计算机应用技术专业论文)最优人脸判别特征提取方法研究与实现.pdf_第2页
(计算机应用技术专业论文)最优人脸判别特征提取方法研究与实现.pdf_第3页
(计算机应用技术专业论文)最优人脸判别特征提取方法研究与实现.pdf_第4页
(计算机应用技术专业论文)最优人脸判别特征提取方法研究与实现.pdf_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘篮 摘要 作为人脸识别领域中的关键技术,特征选择和分类器设计是该领域中的研 究重点之一。设计出一套行之有效的特征选择机制以及合理的分类器将提高整 个人脸识别系统的性能。本文从特征表述、特征选择和分类器设计这三个角度 出发,实现了一个完整的人脸识别算法。 本文首先对人脸识别技术的整体框架作了一个简要的描述,并对人脸识别 技术中的关键技术一特征表述、特征选择和分类器设计作了简要分析,强调了 在这三方面工作的意义。同时对当前存在的关键问题:光照问题、姿态问题和 遮挡问题作了简单的介绍,针对存在的问题,选用对光照变化、姿态变化和遮 挡都较鲁捧的局部特征作为人脸描述特征。 其次,介绍本课题的具体实现流程。第一步,对本课题中涉及到的主要工 具:g a b o r 特征和a d a b o o s t 做了介绍;第二步介绍了本课题的工作重点,基于 i n t r a p e r s o n a l ,e x r a p e r s o n a l 空间概念,利用a d a b o o s t 对g 曲o r 特征进行选择并 且构造强分类器:然后对得到的g a b o r 特征序列进行分析,探求区别不同人脸 的特征存在的规律,为特征选择提供方向上的指导。 最后,基于a d a b o o s t 选择的g a b o r 特征进行人脸识别。首先从分类器角度 出发,介绍了基于a d a b o o s t 构建的强分类器进行识别和利用p c a 降维,然后 利用l d a 作线性判别分析的方法。然后对基于a d a b o o s t e dg a b o r 特征的l d a 方法作泛化能力评测,与不经过特征选择的l d a 方法做对比,得到泛化能力和 与特征维数的一个初步结论。 关键词: g a b o r 特征,a d a b o o s t ,b a y e s i a n ,类内差类间差空间,线性判别分 析,误配准 璀十最优g a b o r 特征的人脸识另4 方法研究 a b s t r a c t a st h ek e yt e c h n o l o g i e so ff a c er e c o g n i t i o n ,f e a t u r es e l e c t i o na n dc l a s s i f i e rd e s i g n a r ea l w a y st h eh o tp o i n t so ff rr e s e a r c h i ti sn o r m a lt oi m p r o v et h ep e r f o r m a n c eo f o n ef a c er e c o g n i t i o ns y s t e mi fi tt a k e sa ne f f e c t i v es c h e d u l et os e l e c tf e a t u r ea n d b u i l dt h ec l a s s i f i e r t h e r e f o r e ,t h et a r g e to ft h i sp a p e ri st ob u i l do n ew h o l ef a c e r e c o g n i t i o na l g o r i t h mf r o mt h r e ea s p e c t s :f e a t u r ed e s c r i p t i o n ,f e a t u r es e l e c t i o na n d c l a s s i f i e rd e s i g n i nt h ef i r s tp a r to ft h i sp a p e r , t h ef r a m eo ff a c er e c o g n i t i o ni sd e s c r i b e d a n dt h e nt h e k e yt e c h n o l o g y s u c ha sf e a t u r ed e s c r i p t i o n ,f e a t u r es e l e c t i o na n dc l a s s i f i e rd e s i g na r e i n t r o d u c e db r i e f l y , a n di ti se m p h a s i z e dt h a tm o r ew o r ks h o u l db ed o n eo nt h e s e a r e a s i nt h ef o l l o w i n g ,t h ev a r i a n t eo f i l l u m i n a t i o n ,p o s ea n dt h ed o d g e ,w h i c ha r e t h e k e yp r o b l e m s o ff a c e r e c o g n i t i o n ,a r e i n t r o d u c e d s i m p l y b a s e d o nt h e s e p r o b l e m si nf a c er e c o g n i t i o na r e a ,l o c a lf e a t u r ei st a k e nt od e s c r i b et h ef a c e sf o ri t s r o b u s tt oi l l u m i n a t i o nv a r i a n c e ,p o s ev a r i a n c ea n d d o d g e t h e n ,t h ef l o wc h a r to f t h em e t h o di nt h i sp a p e ri sp r o p o s e d f i r s t l y , g a b o rf i l t e ra n d a d a b o o s ta r ei n t r o d u c e dw h i c ha r et h em a i nt o o l si nt h em e t h o d t h e nb a s e do n 也e c o n c e p to f i n t r a p e r s o n a la n de x t r a p e r s o n a ls p a c e ,a d a b o o s ti st a k e nt os e l e c tt h e e f f e c t i v eg a b o rf e a t u r e sa n dt ob u i l dt h es t r o n gc l a s s i f i e r i no r d e rt of i n dt h el a wo f t h ed i s t r i b u t i o no fg a b o rf e a t u r e sw h i c hd i s c r i m i n a t ed i f f e r e n t p e o p l e m o s t e f f e c t i v e l y , s o m ea n a l y s i si sd o n eo nt h es e q u e n c eo f g a b o rf e a t u r e s a st h er e s u l t , t h ed i r e c t i o no fh o wt os e l e c tf e a t u r e sc a nb ef o u n d f i n a l l y , t h es t r o n gc l a s s i f i e rb u i l tb ya d a b o o s t i st a k e nt or e c o g n i z ed i f f e r e n tf a c e s b a s e do i lt h ea d a b o o s t e dg a b o r f e a t u r e s ,l d a i st a k e no nt ot r a i nm o d e la n dt h e nt o c l a s s i f yd i f f e r e n tf a c e s i nt h ef o l l o w i n g ,s o m ee x p e r i m e n tw a sd o n et ot e s tt h e g e n e r a l i z a t i o na b i l i t yo ft h em e t h o du s i n gl d a a n dg a b o rf e a t u r e ss e l e c t e db y a d a b o o s t ,a n dt h i sm e t h o di sc o m p a r e dw i t ht h em e t h o du s i n gl d aa n dg a b o r f e a t u r e sw i t h o u ts e l e c t i o n f r o mt h ee x p e r i m e n tr e s u l t ,w ec a l ld r a wt h i sc o n c l u s i o n t h a tt h e g e n e r a l i z a t i o na b i l i t y i si ni n v e r s e p r o p o r t i o n t ot h en u m b e ro fg a b o r f e a t u r e s k e yw o r d s :g a b o rf e a t u r e s ,a d a b o o s t ,b a y e s i a n ,l i n e rd i s c r i m i n a t ea n a l y s i s , m i s a l i g n m e n t i l 声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取 得的研究成果。就我所知,除了文中特别加以标注和致谢的地方外,论文 中不包含其他人已经发表或撰写过的研究成果。与我一同工作的同志对本 研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。 作者签名:扬彬 日期:洳争7 心 关于论文使用授权的说明 中国科学院计算技术研究所有权处理、保留送交论文的复印件,允许 论文被查阅和借阅;并可以公布论文的全部或部分内容,可以采用影印、 缩印或其它复制手段保存该论文。 作者签名:物澎聊签名:匆亩脚易袅z u 第一章人脸识别技术研究现状 1 1 研究背景和意义 第一章人脸识别技术研究现状 人脸识别作为图像分析中最成功的应用之一,因为其巨大的商业应用前景, 受到越来越多的重视。近2 0 年以来,人脸识别技术有了长足的发展,并且逐步 走向实际应用阶段f 1 1 ,现在已经有比较成熟的人脸识别应用系统进入市场,如 f a c e l t ,f a c e v a c s 等人脸识别系统。可以预言,在今后的几十年内,随着人脸 识别技术进一步发展,人脸识别技术将应用到更多的领域,例如视觉监控,娱 乐应用,智能卡,自动身份验证,银行安全等。这些已有的以及潜在的应用领 域将推动人脸识别技术不断发展 1 。 作为一种最直接、最自然、最容易被人接受的生物特征识别技术,人脸识 别致力于探索如何使机器能够自动地根据用户的人脸图像来鉴别用户的身份。 人脸识别发展到现在,已有3 0 多年的历史,是模式识别和计算机视觉的一个 非常活跃的研究热点。人脸识别的研究涉及模式识别、计算机视觉、人工智能、 图像处理、心理学、生理学和认知科学等,与计算机人机交互领域和基于其它 生物特征的身份识别方法都有密切联系。虽然人们可以毫不费力地通过脸部图 像来鉴别互相的身份,然而由于成像过程中各种影响因素的变化常常导致同一 个人的人脸图像发生非常大的变化,因此建立自动系统完成识别任务是非常具 有挑战性的。虽然目前国内外已经有许多实用系统问世,但是只有在非常苛刻 的成像条件下,才能得到比较令人满意的识别效果。因此,人脸识别研究仍然 远远没有到达完善的境地,还有非常大的发展空间。 1 2 人脸识别的研究内容 人脸识别的研究范围从广义上大致可以分为如下5 个方面的内容: 1 ) 人脸检测、定位与跟踪:即从各种不同的场景中检测出人脸存在并确定其 位置。近年来,人脸检测和跟踪开始作为一个独立的课题受到特别的重视。 2 ) 人脸表征:即采用某种表示方式表示检测出的人脸和数据库中的已知人脸。 通常的表示方法包括几何特征、特征模板和数学模型等。 3 ) 人脸识别:将待识别的人脸与数据库中的已知人脸比较,得出相关信息, 这一过程的核心是选择适当的人脸表征方式与匹配策略。 4 ) 表情姿态分析:即对待识别的人脸的表情或姿态信息进行分析,并对其加 以分类。 5 ) 生理分类:即对待识别的人脸的生理特征进行分类,得出其年龄、性别、 种族等信息。 基于最优g a b o r 特征的人脸识别方法研究 以上五个方面已经各自形成一个独立的研究课题。本文所指的人脸自动识 别系统由以下三部分组成:人脸检测,人脸表征和人脸识别。在后面的章节中, 人脸识别技术仅就这三部分展- 丌。 人脸识别系统从整体而言,可以分作两个部分:人脸检测和人脸识别。人 脸检测问题本质上是一个两类问题,判断图像中检测区内是否包含人脸,并给 出人脸所在位置。人脸识别则是一个多类问题判断输入人脸图像的类属。图 1 1 给出了现有人脸识别系统的整个工作框架: 图1 1 人脸识别系统工作框架图 具体实现过程中,首先获取图像集,然后用人脸检测模块进行人脸检测。 如果检测到人脸图像,则进行特征点定位,一般以两眼中心为基准,根据两眼 距离d ,对人脸图像进行归一化处理,归一化处理包含了图像预处理,图像缩 放以及有效人脸区域选取等操作。最后对归一化的人脸图像进行特,征提取,送 入分类器进行识别,最终获得识别结果。 1 3 关键技术 人脸检测和人脸识别作为人脸识别技术的核心,二者有许多相同的关键技 术,如特征表述、特征选择以及分类器设计三部分。 1 3 1 特征表述 特征表述就是对原有事物的一个描述,特征可以分作两大类,一类是原始 图像特征,另一类就是基于原始图像特征的变换特征。就图像特征而言,是通 过图像采集设备形成的灰度图像和彩色图像。变化特征是采用某种变换核对原 始图像进行变换,在另一个空间中对原始图像进行新的描述,常用的变换特征 2 第一章人脸识别技术研究现状 有k l 变换特征,频率特征,直方图特征等。其中频率特征的范围比较宽,包 含富立叶特征,小波特征等,小波特征的种类繁多,有h a r r ,g a b o r 特征等等。 1 3 2 特征选择 特征选择则是基于上述一种或多种特征,然后通过一定机制选择出最具有 区别力的特征的过程。特征选择是人脸识别技术中的一个关键部分,从某种意 义上说,特征选择决定了整个识别结果的好坏。特征选择重要性体现在以下两 个方面: 特征维数过高 特征维数灾难在模式识别领域中是一个棘手的问题,维数过高带来的主要 问题是计算量大幅度增加,超过现有机器所能计算的范围,有效的特征选择可 以降低特征维数,从而减少计算复杂性,提高运行速度。 无效特征的存在 用某一特征集对事物进行描述,该事物必然拥有其特有的特征,正是依存 这些特征才得以与其他事物进行区别。在一个特征集中,存在大量冗余的无效 特征,在这些特征上,无法对该事物与其他事物进行区别。特征选择的好坏决 定了是否能够找到该事物特有的特征,过滤其他冗余特征是一个关键问题。 1 3 3 分类器设计 分类器设计的目的是对事物进行判别划分,判别划分本质上说就是一个距 离计算,根据测试样本和g a l l e r y 中样本的距离对测试样本的类属进行判定,距 离判断根据不同的分类器有不同的度量标准。分类器设计主要分为两类方法, 基于知识的方法和基于学习的方法: 基于知识的判别方法:人工依据已有知识,试验、选择和确定各种特 征的判别参数和闽值。 基于学习的判别方法:机器依据学习原理。试验、选择和确定各种特 征的判别参数和阈值。 现在基于学习的判别方法占据了主流位置。其性能也大大超过了基于知识 的判别方法。就人脸识别部分而言,基于学习的判别方法主要有:特征脸 ( e i g e n f a c e ) 方法【2 】,基于b a y e s i a n 判别的方法【3 】,弹性图匹配( e b g m ) 方 法【4 ,f i s h e r f a c e 方法 5 1 1 6 1 ,独立元判别方法( i c a ) 【7 】,基于s v m 的方法 8 】, 基于神经元网络的方法 9 和基于a d a b o o s t 的方法 1 0 】 1 l 】。下面- - 4 , 节将对这 些主流的统计学习方法作一个简单的介绍。 桀于最优g a b o r 特征的人脸识别方法研究 1 4 统计学习的方法介绍 1 4 1 e i g e n f a c e s e i g e n f a c e s 2 _ 虽然对光照变化不是特别理想,但它是第一个将基于统计的外 观的方法引入人脸识别,而以前的人脸识别大多是基于几何结构的。e i g e n f a c e s 利用信息理论来对人脸进行编码和解码。该方法试图通过训练集找到人脸分柿 的主成分,即人脸图像协方差矩阵的特征向量,称为e i g e n f a c e s 。这些特征向 量用来表示人脸图像间的变化。为了计算方便,通常只取最佳的m 个 e i g e n f a c e s ,覆盖所有可能图像的一个m 维子空间一“人脸空间”。基于e i g e n f a c e s 的人脸识别分为以下几个步骤: 计算e i g e n f a c e s :通过一个训练集,用p c a 方法计算e i g e n f a c e s ,构造人脸 空间; 识别:给定一幅图像,将其投影到人脸空间,得到权重系数,如果该图像 与人脸空间足够接近,则是一人脸图像。人脸识别问题已转化为低维空间的坐 标系数矢量分类问题。 1 4 2f i s h e r f a c e s f i s h e r f a c e s 5 是一种较好的e i g e n f a c e s 改进方法。f i s h e r 的判别准则是保证 类内聚最小,类间距最大,从而保证了不同类样本尽可能远,同类样本尽可能 近。这个准则下的分类器比简单的线性分类器性能要强。 1 4 3b a y e s i 8 f l 方法 b a y e s i a n 方法 3 将人脸图像的灰度差异分为类内差异和类间差异,通过计 算最大后验概率来判断两幅图像的差异是类内差异还是类间差异,进而判断它 们是否来自于同一个人,将识别问题转化为两类的b a y e s i a n 决策问题。 总体而言,现有的方法就是前端采用不同的特征进行,后端采用某一个或 者某几个分类器其对此特征进行学习判别。以上所述的方法主要是基于二维的 图像,近几年基于3 d 的人脸识别方法【1 2 1 1 3 】也逐步受到重视。 1 4 人脸识别中的难点 影响人脸识别系统性能的主要因素是光照变化和饰物变化还有姿态变化问 题。 1 4 1 光照问蹶 如何解决光照成为近几年以来的一个研究重点 1 4 1 5 】,光照问题主要的解 决思路可归为如下三类: 4 第一章人脸识别技术研究现状 采用光照变化不敏感的描述特征,例如g a b o r 特征。 基于外观的统计子空间方法 2 】。 基于模型的方法 1 5 。 1 4 2 饰物变化 饰物变化的本质是出现了遮挡,破坏了人脸原有的纹理信息,如何合理的 将这些遮挡消除是解决关键问题的所在。解决饰物变化的方法主要有如下两类: 合理裁取有效入脸区域,裁取范围不包含头发,耳朵等,从而减少饰 物影响。 消除不可避免的饰物影响,例如消除眼镜 1 6 1 ,胡须等。 1 4 3 姿态变化 人脸姿态发生变化,导致g a l l e r y 中的图像和待识别的图像姿态不致,从 而大幅度降低识别率。姿态变化的本质是人脸图像的结构和整体纹理发生了变 化,解决姿态变化的方法主要有如下三种思路: 采用局部特征 当姿态变化不大时,局部特征变化不大,所以采用局部特征对于姿态 变化条件下的人脸图像仍旧具有较高的识别率。 姿态校正 对于姿态变化,最理想的解决方案就是将不同姿态下的人脸图像归一 到标准正面图像,其中涉及的方法主要有3 dm o r p h a b l em o d e l 2 9 3 0 。 不变姿态下的识别 主要的方法是光区域( e i g e nl i g h t - f i e l d ) 方法 3 1 】。 1 5 人脸数据库 基于学习的人脸识别算法都有一个训练的过程,这就需要大量的各种条件 下的人脸样本。同时为了对不同人脸识别算法的性能做出评价,也需要有一些 测试的人脸样本。因此很多机构和大学专门进行了人脸采集,建立了不同的人 脸库,这些人脸库各有特色,包含了各种变化,例如光照变化、姿态变化、表 情变化、饰物变化和年龄变化等。现在被广泛使用的人脸库有f e r e t 1 7 1 8 , p i e 1 9 】,y a l eb 2 0 ,a r 2 1 】,o r l 2 2 等。在推出人脸数据库的同时,许多 测试规范也相应产生,例如f e r e t ,x m 2 v t s 测试协议。 1 6 本课题的目的与意义 人脸识别技术巨大的应用前景是推动其发展的动力,解决人脸识别领域中 的关键问题,设计并实现有效的人脸识别算法,推动人脸识别技术的发展是本 基于屉优g a b o r 特征的人脸识别方法研究 课题的本质目的。 特征选择在人脸识别技术中占据了统治地位,好的特征可以比较容易地将 不同人脸区分开来。而冗余的特征则可能降低分类器的性能,因此选择出有效 的特征一方面可以提高系统的性能,另一方面可以提高运算的速度。 本课题希望从特征表述,特征选择以及分类器设计进行研究,构建一个新 的人脸识别系统。首先根据局部特征队光照变化和姿态变化都较为鲁棒,因此 选用g a b o r 特征作为人脸描述特征。其次,从特征选择角度出发,希望能够提 出一种有效的降维方法,解决人脸识别中特征维数较高的问题。最后,基于经 过特征选择的g a b o r 特征,提出有效的分类策略和方法,提高识别率。 1 7 本课题主要的研究内容以及文章结构 本课题主要的工作涉及以下三个方面: 特征描述 由于g a b o r 特征的优越性以及弹性图匹配方法【4 】的在人脸识别领域的成 功,采用g a b o r 特征作为人脸的描述特征。 特征选择 g a b o r 特征的一个特点就是特征维数高,从而导致计算复杂性较大,因此 在高维的g a b o r 特征集中选择出有效的g a b o r 特征对不同的人脸进行区分,找 到最具有鉴别力的g a b o r 特征是本课题的核心工作之一。 分类器设计 分类器设计一直是模式识别中的关键问题,现在流行的分类器有s v m , n e u r a ln e t w o r k 和b a y e s i a n 等。本课题在分类器设计上利用人脸检测领域流行 的a d a b o o s t 方法,借助双子空间的概念,在对特征选择的同时通过a d a b o o s t 构建了分类器。 整个工作围绕这三部分展开,在第二章介绍了g a b o r 特征和基于g a b o r 特 征的弹性图匹配方法 4 】,然后介绍a d a b o o s t 2 3 2 4 ,并介绍其在人脸检测中 的成功应用:第三章是本论文的核心部分,介绍基于a d a b o o s t 的g a b o r 特征选 择和分类器构建,并对选择得到的g a b o r 特征的分析;第四章介绍了基于 a d a b o o s t e dg a b o r 特征的分类判定方法;第五章中通过实验,对基于a d a b o o s t e d g a b o r 特征的l d a 方法进行了泛化性能验证,同时得到一个关于泛化性推广的 结论;最后对整个课题进行总结,并讨论未来进一步可以完成的工作。 6 第二章相关关键技术介绍 第二章相关关键技术介绍 2 1g a b o r 特征介绍及其在人脸识别领域中的应用 g a b o r 特征因为其良好的时频特性,在图像处理,信号处理,模式识别等 领域被广泛使用。随着d a u g r n a n 将g a b o r 特征成功的推广到虹膜识别领域【2 5 】, g a b o r 特征更加受到重视。由于弹性图匹配方法在人脸识别领域成功,g a b o r 特征在人脸识别领域也备受瞩目。本章首先对g a b o r 特征 2 6 作一个简要的介 绍,然后回顾一下弹性图匹配方法。 2 1 1g a b o r 特征 g a b o r 滤波器无论在空域还是在频域,都可以达到较高的分辨率,可以根 据不同的应用需求选择特定的频段对信号进行滤波;而且二维g a b o r 滤波器具 有方向性,因此可以在局部区域对特定方向的信息进行滤波。综上所述,g a b o r 特征具有特有的局部特征描述能力,因此被广泛用于计算机视觉中的各个领域。 g a b o r 函数在一维空间中的公式描述如下: p k ( 加等e x p ( 一等z 2 ) ( c x p ( i k x ) 嘣p ( _ 和, ( 2 - 1 ) 将上述公式进行改写,得到如下的公式: p k ( 加等e x p ( 一等x 2 ) ( c 0 s ( 池) - s i n ( 池卜e x p ( 一争) , ( 2 - 2 ) 通过上面的公式2 - 2 看出,g a b o r 函数实际上就是一个高斯函数 g ( x ) = 等e x p ( 一等,) 对c o s 和s i n 函数进行调谐,然后去除一个支流分量。 这里高斯函数的作用是对平面波2 n - - 个g a u s s 包络约束,篓主要控制g a u s s 窗 盯 的宽窄,决定平面波影响的主要区域。g a u s s 函数决定了g a b o r 函数的局部性, 为了更加直观地说明g a b o r 函数的优越性,分别从空域和频域对g a b o r 函数进 行了简要的分析。 2 1 1 1g a b o r 函数的空域特性 g a b o r 滤波器在空域中,实部和虚部分别是一个经g a u s s 函数调谐过的s i n 函数和c o s 函数,二者相位相差“2 。 基于揖优g a b o r 特征的人脸识别方法研究 广,、 一 7 v 一x 图2 - 1 一维g a b o r 函数在空域中分布示意图( c o s 部分) 从上图可看出,g a u s s 函数调谐后,c o s 函数振幅变化由g a u s s 包络决定。 2 1 1 2g a b o r 函数的频域特性 对g a b o r 函数作富立叶变换,得到其在频域中的描述,g a b o r 滤波器在频 域中,是一个具有g a u s s 窗的带通滤波器。如下图所示: 图2 - 2 一维o a b o r 函数在频域中的分布示意图 从上图可以看出在频域中g a b o r 函数是一个g a u s s 函数,g a u s s 函数中心 点幅值最大,当对信号进行滤波时,该点对应的频率的响应最大,定义该点的 频率为。利用g a b o r 函数对信号进行过滤,信号中频率将获得最大响应, 其他频率的信息或者被过滤,或者响应较小。 2 1 1 3 常用二维g a b o r 函数分析 计算机视觉领域研究人员最常用的二维g a b o r 小波,其核函数描述形式为: 吲加譬( - i l t c v l l 2 i l z i l 2 2 c r 2 ) b 2 _ e - c r 2 2 p 。, 其中,v ,“分别代表g a b o r 卷积核的尺度参数和方向参数;z :& ,卉; i 。= k y e i ,其中k 。= k 一f ”,盛= 8 ,t 一是最大频率:,是g a b o r 核 在频域中的空间因子。 e “ ( 2 4 1 是谐波函数,实部为余弦函数,虚部为正弦函数。 忽略公式( 2 3 ) 中的直流部分,得到公式: 第二章相关关键技术舟绍 ( z ) ;譬。一呼。氘一:学。一删。“晕, tc o s # 警,( 2 5 ) 由公式( 2 5 ) 可见,g a b o r 滤波器是由一个谐波函数被一个g a u s s 函数调制后 形成的,其中g a u s s 函数主要控制g a b o r 核卷积的范围,谐波函数决定滤波的 频段。这里用u :华,y :k , s i n 谚, 则公式( 3 ) 可以改写为 孚驾 ( z ) :毕。一i k i q f 。m :等i i i 12 。2 蚓。一t 吧 协。, 对公式( 2 6 ) 进行富立叶变换,可以得到如下公式( 2 7 ) : 脚珈e x p - 宿m ”驴 ( 2 7 ) 其中慨,i l = k ,= 七一,由此可见g a b o r 核函数在频域中呈现为一个二维 高斯函数,中心为o l v ) ,也就是在频域中该高斯窗对应的中心。g a b o r 滤波器 实际上是个具有方向选择性的带通滤波器,和一般方窗带通滤波器不同,其 窗口为个高斯窗,窗口中心为( u ,随( u m 变化,窗口中心在频域中做平 移。 a 空域b 频域 图2 - 3一维g a b o r 函数空间分布示意图和频域分布示意图 当唬固定时,即g a b o r 核函数方向固定后,云决定了g a b o r 核函数中心 在频域中的位置。由此可见g a b o r 核函数中控制尺度的参数v ,主要控制g a b o r 核函数在频域中高斯窗口中心位置,即带通滤波器所对应的频率中心。由鲁= 享鬻可见,v 越大,对应的频率就越低,在空域中体现出来的就是g a u s s 包络 变宽,但是在频域中对应的g a u s s 窗口将变窄。 9 、,ijj 基于塌优g a b o r 特征的人脸识别方法研究 a 二维g a b o r 函数空间分郑 r 一摊n 小n r 甬斯黼城抖靳 图2 - 4 二维g a b o r 函数空间分布示意图和频域分布示意图 通常,u e 0 ,1 ,2 ,3 ,4 ,5 ,6 ,7 ) ,v 0 ,1 234 ) ,即平常所说的5 个尺度,8 个 方向。如下是5 x 8 = 4 0 个g a b o r 核函数实部的空域分布图。 图2 - 5g - a b o r 核空域实部分布图 以上3 小节简要介绍g a b o r 滤波器,并对其特性进行了分析,下面将就g a b o r 特征在人脸识别领域中的应用做一个简要的说明。 2 1 2g a b o r 特征在人脸识别领域中的应用 由于g a b o r 特征在空域和频于都具有局部特性,适合于对局部特征进行描 述,因此在文字分割,图像分割等领域都有很好的应用。由于人脸之间的区别 更多的体现在局部信息【4 】【3 2 】,因此g a b o r 特征引入人脸识别领域后,获得了 巨大的成功t 从而也证明了g a b o r 特征在人脸识别领域有着广泛的应用前景。 以g a b o r 特征为基础,许多研究工作可以展开。 2 1 2 1 弹性图匹配算法 弹性i 訇匹配算法【4 】在f e r e t 测试中综合性能排名第一【1 8 】,足见其性能优 越,作为第一个将g a b o r 特征引入人脸识别的算法,其开创性的工作为g a b o r 特征在人脸识别领域的应用奠定了基础。 弹性图匹配算法采用的g a b o r 核函数与在2 1 1 3 中描述的g a b o r 核函数一 致,一幅图像经过4 0 个核函数变换后,每一个像素对应4 0 个g a b o r 特征。弹 1 0 第二章相关关键技术介绍 性图匹配算法首先提出了j e t ,b u n c h 的概念,基于这两个概念,提出了两个策 略:特征点定位策略和识别匹配策略。 j e t 弹性图匹配算法将图像中每一个像素对应的4 0 个g a b o r 系数称作 一个j e t 。 图2 - 6 给出对j e t 描述,并且给出了基于j e t 描述的人脸图像i m a g e g r a p h : j e ti m a g eg r a p h 图2 - 6j e t 的构建和j e t 描述的人脸图像 b u n c h 弹性图匹配算法将不同人脸图像中相同特征点对应的j e t 集合称作 一个b u n c h 。 图2 7 给出对b u n c h 的描述,其中每个特征点的b u n c h 由不同人对 应的j e t 组成。 图2 - 7 ,e t 的构建和j e t 描述的人脸图像 如何选择特征点计算j e t 在 4 1 0 7 没有给出选择的依据,在 4 r 9 ,每一个特 征点对应的b u n c h 由7 0 多个不同人该特征点对应的j e t 组成。这些特征点都是 经过手工标注人脸图像后,再计算得到j e t ,从而组成b u n c h 。 弹性图匹配算法中的两个策略分别是如何定位特征点以及如何计算两个弹 性图之间的相似度。 定位特征点: 对于一幅新的人脸图像,弹性图匹配算法提出了基于b u n c h 的自动获取特 征点的位置的策略。该策略通过引入带相位的相似度度量函数计算两个点对应 的j e t 的相似度,然后对待定位点进行局部搜索,从而确定特征点位置。该部分 基于最优g a b o r 特征的人脸识别方法研究 是弹性图匹配的核心部分,有关细节请参阅 4 。 弹性图相似度衡量: 当所有特征点位置确定后,得到这些点对应的j e t ,构成弹性图,然后同 g a l e r y 中的弹性图利用公式 s ;( 螂,) = 丙17 s 。( ,n i 刀) ( 2 8 ) 进行相似度衡量。其中g 表示弹性图,j 表示j e t ,h 是特征点的i d ,f ,m 分别 是弹性图的i d ,s 。是衡量j e t 相似性的函数,具体细节请参阅 4 】。 待识别图像通过同g a l l e r y 中的所有图像进行相似度衡量,将相似度最大的 图像对应的i d 作为最后的识别结果。 弹性图匹配算法特征点的选择过程在【4 】中没有给出,也没有论述是否每一 个特征点都必须取4 0 个g a b o r 系数,从特征选择的角度而言,弹性图匹配算法 没有从理论上给出选择这些特征点的解释。 2 1 2 2 基于g a b o r 特征的线性判别分析算法 在f e r e t 测试中马里兰大学基于线性分析的算法d 8 也具有相当好的性 能,从而证明了线性判别分析( l i n e a rd i s c r i m i n a t ea n a l y s i s ) 方法的有效性。 刘成君将g a b o r 特征和l d a 方法相结合 2 7 】,得到了不错的效果。 基于g a b o r 特征的l d a 方法流程如下: 圈2 8 基于g a b o r 特征的l d a 线形判别分析方法流程圈 在特征提取之后,如果对整幅图像取其g a b o r 特征,则数据量太大,在p c a 降维这一环节不容易处理。因此有一个处理细节就是对得到的g a b o r 特征进行 下采样,在x ,y 方向上每隔定的步长取其像素对应的g a b o r 特征。下采样是 现在普遍采用的方式,但是该方法得到的特征是否就能够替代整体的信息没有 定论,另外该方法选择的特征冗余度没有定论。就特征选择这一角度来看,采 用下采样的方式进行特征选择并不是最理想的,针对这一问题,本文在下面的 章节中提出了相应的解决方法,并且证明了该方法的有效性。 2 2 d a b o o s t 介绍 随着v i o l a 将a d a b o o s t 和h a r r 特征成功引入到人脸检测领域 2 8 】,人脸检 测技术真正实现了检测实时。由于a d a b o o s t 在人脸检测技术上的巨大成功, 1 2 第二章相关关键技术介绍 a d a b o o s t 在模式识别的各个领域得到推广和应用,例如物体检测( 3 2 】,图像检 索【3 3 】,以及人脸识别 1 1 】。a d a b o o s t 的优点就是通过对弱分类器进行线性组合 从而构造出一个强分类器,对弱分类器的组合是通过在大量样本上进行学习得 到的,因此样本在整个学习过程中占据统治地位。 2 2 1 弱分类器 a d a b o o s t 对大量弱分类器进行选择,然后进行线性组合,得到一个强分类 器。a d a b o o s t 不要求弱分类器的判别性能强大,仅要求其判别正确率大于5 0 , 即误判率小于5 0 即可。一般而言,可以取一个特征作为一个弱分类器,这样 在选择组合弱分类器的同时就相当于对特征进行了选择。 就两类问题而言,每一个特征都可以作为一个弱分类器,通过设定一个阈 值在该特征上对样本按照特征值进行类别判定。由于阕值设定存在方向性,就 两类问题判断时,错误率不会超过5 0 。这里的错误判断包含两部分,将正样 本误判为负样本和把负样本误判为正样本,错误率为误判数目与样本总数的比 值。 2 2 2 强分类器构造 利用弱分类器进行线性组合,得到强分类器是a d a b o o s t 的最大特点。 a d a b o o s t 方法属于贪心算法,每次选取弱分类器的时候总是要求错误率最小; a d a b o o s t 方法是基于样本的学习方法,首先要求准备大量的正类样本和负类样 本,正类样本是的目标样本,负样本则是干扰样本,通常将正类样本标注为+ 1 , 负类样本标注为一1 。提升问题对两类分类问题的处理通过a d a b o o s t 算法实现的。 下面是a d a b o o s t 算法的形式化描述 2 8 1 。 2 2 3a d a b o o s t 在人脸检测领域的应用 v i o l a 采用积分图的方法【2 8 】对图像进行h a r t 特征快速提取,然后在训练过 基于瑾优g a b o r 特征的人脸识别方法研究 程和检测过程中均采用了c a s c a d e 的方法对检测进行加速。图2 - 9 给出了分级 分类器构建示意图: ,石;i 、 迅岁 图2 9 c a s c a d e 结构 在训练每一层的时候,设定一个正检率和误检率,然后在样本上进行学习。 用当前层学习得到强分类器在参与学习的样本进行判断,当正检率和误检率均 满足要求时,认为该层学习得到的强分类器已经达到要求,停止该层的训练。 然后利用截止到该层为止得到的强分类器对负样本空间进行重采样,如果负样 本被该层错误判断,则送入下一层进行训练,如果正确判断,则将该负样本抛 弃。经过多层学习之后,每一层构成一个强分类器,然后由各层的强分类器组 合成一个强分类器。 在检测阶段,每一层的强分类器主要的作用是在于抛弃正确判断的负类样 本,从而达到加速的目的。而作为人脸的正样本,则要通过所有层的强分类器, 从而被正确检测。 图2 。1 0 给出了a d a b o o s t 选择出来的第一个h a l r 特征。 2 3 小结 图2 ,1 0 a d a b o o s t 选出的第一个特征 本章首先对g a b o r 滤波器进行了介绍和分析,论述了g a b o r 特征在时域和 空域中的局部特性。然后简要介绍了弹性图匹配方法和基于g a b o r 特征的l d a 方法,并从特征选择的角度指出二者存在的问题。 接着对a d a b o o s t 做了简要的介绍,并介绍了v i o l a 的基于a d a b o o s t 的人 脸检测系统,并分析了基于a d a b o o s t 的人脸检测算法加速的结构。由于 a d a b o o s t 对于两类问题很有效,因此应用a d a b o o s t 的关键在于合理构造两类 问题。人脸识别问题本身是一个多类问题,但是已有研究人员将a d a b o o s t 引入 到人脸识别领域,例如郭国栋的基于a d a b o o s t 和p c a 的方法,该方法将多类 问题分解为多个两类问题,从效率上来说不高。因此如何在人脸识别领域合理 应用a d a b o o s t 还有很多技巧可以挖掘,本文就a d a b o o s t 在人脸识别中应用提 1 4 第二章相关关键技术介绍 出了一种应用策略,并证明其有效性,具体的实现将在第三,四章作具体介绍。 基于菇优g a b o r 特征的入脸识剐方法研究 第三章基于a d a b o o s t 的g a b o r 特征选择 前一章对g a b o r 特征以及a d a b o o s t 进行了介绍,如何利用a d a b o o s t 对 g a b o r 特征进行选择,并将选择得到的g a b o r 特征将其应用到人脸识别领域将 是本论文的核心部分。在本章中,首先利用g a b o r 特征对人脸进行描述,得到 g a b o r f a c e 。然后,利用i n t r a e x t r a 空间的概念将人脸识别问题转化为一个两类 问题,以便a d a b o o s t 进行特征选择。其次,给出经过a d a b o o s t 选择后得到的 强分类器,并给出由强分类器输出的相似度函数。最后,对选择得到的g a b o r 特征进行分析。 3 1g a b o r f a c e - - g a b o r 特征对人脸的描述 采用在第二章中描述的g a b o r 函数: z ) :掣e ( - i i k v 1 1 2 l l z l l 2 2 a2 ) p 2 _ e - c r 2 2 对人脸图像作卷积,得到的结果称为g a b o r f a c e ,如下图所示:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论