




已阅读5页,还剩53页未读, 继续免费阅读
(计算机应用技术专业论文)基于正侧面级联匹配的人脸识别算法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
上海师范大学硕士学位论文 基于正侧面级联匹配的人脸识别算法研究 摘要 人脸识别是模式识别和计算机视觉领域的热点课题之一,经过3 0 多年的研 究,在环境可控条件下已达到实用程度,但在非理想成像( 尤其是光照、姿态变 化) 、用户不配合、大规模人脸库等条件下的识别,仍然面临巨大挑战。 本文针对大规模人脸库上的人脸识别问题,提出了一种正侧面级联匹配的人 脸识别算法,把人脸识别设计成一个级联匹配的过程:第一级匹配主要完成在大 规模人脸库中进行快速匹配,初选出若干最接近的人脸,组成新的人脸库;第二 级匹配主要完成在新人脸库中进行精确匹配,最终识别出正确人脸。本文主要完 成了以下工作: ( 1 ) 探讨了人脸特征提取时g a b o r 滤波器参数的选择问题,并通过实验进 行了验证。对人脸识别中核函数选择问题进行了讨论,并且通过实验确定了 k p c a 方法中高斯核函数的参数。 ( 2 ) 在正面人脸识别阶段,提出了一种在小波低频子图上结合g a b o r 特征 和核主分量分析的人脸识别方法。首先对人脸进行二维小波分解,通过g a b o r 滤波器对人脸低频子图滤波,并对g a b o r 特征进行降采样,然后采用核主分量分 析的方法进一步降低g a b o r 特征的维数,最后采用最小距离分类器进行识别。由 于采用了g a b o r 滤波,该方法对光照、表情具有鲁棒性,在f e r e t 人脸库上的 实验结果表明,该方法在识别性能上优于核主分量分析的方法,在识别时问上优 于不采用小波分解的方法。 ( 3 ) 在侧面人脸识别阶段,提出了一种利用鼻子轮廓线曲率特征进行人脸 筛选的方法首先,对侧面人脸图像进行预处理分割出鼻子,提取鼻子曲线,并 对轮廓线去噪和细化然后,用曲线拟合轮廓线,并计算曲线上各点的曲率。最 后,用计算互相关函数的方法来比较两条曲率线的相似性,根据实验确定的阙值 对人脸进行筛选在f e r e t 人脸库上的实验结果表明,该方法能够在较短的时 间内对大规模人脸库进行筛选,并分离出包含正确人脸的新人脸库。 实验结果表明正侧面级联匹配策略能够有效缩短识别时间,解决当人脸库规 模增大时识别时间增长过快的问题。 关键词:人脸识别;g a b o r 滤波器;核主成分分析( k p c a ) ;侧面轮廓;曲率 上海师范大学硕士学位论文基于正侧面级联匹配的人脸识别算法研究 a b s t r a c t f a c er e c o g n i t i o nh a sb e 0 3 r n eo n eo f a c t i v er e s e a r c ha r e a si np a t t e r nr e c o g n i t i o na n dc o m p u t e r v i s i o n i ti sg o i n gt oap r a c t i c a ls t a g ei nc o n s t r a i n e de n v i r o n m e n t s ,a f t e rar e s e a r c hh i s t o r yo fm o r e t h a nt h i r t yy e a r s h o w e v e r , t h ec h a l l e n g e st h a tr e c o g n i t i o na l g o r i t h m sf a c e di n c l u d eu n c o n s t r a i n e d e n v i r o n m e n t s ( e s p e c i a l l yd i f f e r e n tl i g h t i n gc o n d i t i o n s 、h e a dp o s e ) 、l a r g e - s c a l ef a c ed a t a b a s ea n ds o 仰 a f r o n t a la n dl a t e r a lh i e r a r c h i c a lm a t c h i n ga l g o r i t h mi sp r o p o s e di nl h j st h e s i s , t os o l v et h e p r o b l e mo ff a c er e c o g n i t i o ni nl a r g e - s c a l ef a c ed a t a b a s e t h i sf a c er e c o g n i t i o na l g o r i t h mi s d e s i g n e da sh i e r a r c h i c a lp i o c f s $ i nt h ef i r s tm a t c h i n g f a s tr e c o g n i t i o ni se x e c u t e di nl a r g n - s e a l e f a c ed a t a b a s ea n dp i c k so u ts e v e r a ls i m i l a rf a c e sa st h en e wf a c ed a t a b a s e i nt h es e c o n dm a t c h i n g , a c c u r a t er e c o g n i t i o ni se x e c u t e da n df i i ,d st h er i g h tf a c e t h em a i nc o n m b u t i o n s 缸t h i st h e s i sa r e a sf o l l o w s : ( 1 ) t h e c h o i c e o f g a b o r f i l t e r p a r a m e t e r s f o r f a c i a l f e a t u r ee x t r a c t i o n i s d i s c u s s e d , w h i c h i s v a l i d a t e db ye x p e r i m e n t s t h ec h o i c eo fk e r n e lf u n c t i o nf o rf a c er e c o g n i t i o ni sd i s c u s s e d a n dt h e p a r a m e t e r s o f g a n s e i a nr a d i a l b a s i s f u n c t i o n i n k p c a a r e v a l i d a t e d b y e x p e r i m e n t s ( 2 ) a t t h e s t a g e o f f r o n t a l f a c e f e c e g n i t i n n ,a r e c o g n i t i o n a l g o r i t h m b a s e d 0 1 1 l o w f i e q u e n c y s u b b a n di sp r o p o s e d ,w h i c hi sc o m b i n i n gg a b o rf e a t u r ea n dk e r n e lp r i n c i p a lc o m p o n e n ta n a l y s i s f i r s t , f a c ei m a g ei sd , m p r , s e db yt w od i m e n s i o nw a v e l e tt r a n s f o r m t h e nt h el o wf r e q u e n c y s u b b a n d 缸c o n v o l v e dw i t hg a b o rf i l t e r sa n dd o w n s a m p l e db yaf a c t o r a f t e rt h a t , t h ek e r n e l p r i n c i p a l c o m p o n e n t a n a l y s i s i s u s e d t or e d u c e t h e d i m e n s i o n o f g a b o r f e a t u r e s f i n a l l y , m i l | i m u m d i s t a n c ec l a s s i f i e ri su s e dt oc l a s s i f y b e c a u s eo fg s h o rf i l t e r s , t h i sa l g o r i t h mi sm o r er o b u s t a g a i l 议v a r i a t i o n si ni l l u m i n a t i o na n de x p r e s s i o n s t h ee x p e r i m e n tr e s u l ti nf e r e tf a c ed a t a b a s e s h o w st h a tm i sm e t h o d 5b e t t e rt h a nk p c aa n dc o s t sl e s st i m et h a nr i o tu w a v e l e t d e c o m p o s i t i o n ( 3 ) a tt h es t a g eo fl a t e r a lf a c er e c o g n i t i o n , am a t c h i n ga l g o r i t h mb a s e d0 1 1n o s ep r o f i l e c n l ei sp m p o s e d f u s t , t h el a t e r a lf a c ei m a g ei sp r e - p m c e s s e da n dt h c i sp a r t i t i o n e d t h e n t h ec o n t i n u o u s1 1 0 5 cc o r v ei so b t a i n e db yt h i n n i n ga n dr e m o v i n gt h ee d g en o i s e a f t e rt h a tt h e c o n t o u ri sp r o d u c e db yc u f v ef i t t i n ga n dt h ec u r v a t u r eo fe v e r yp o i n to ft h ec o n t o u i i sc a l c u l a t e d f m a l l y , t h es i m i l a r i t yb e t w e e nt w oc u r v a t u r el i n e s 缸c a l c u l a t e db yc o r r e l a t i o nf u n c t i o n , a n d s e v e r a ls i m i l a rf a c e s 艰s e l e c t e db yt h r e s h o l d , w h i c hi sv a l i d a t e db ye x p e r i m e n t s t h ee x p e r i m e n t h 上海师范大学硕士学位论文基于正侧面级联匹配的人脸识别算法研究 r e s u l ti nf e r e tf a c ed a t a b a s es h o w st h a tt h i sm e t h o dc a l lb ee x e c u t e di nl a r g e - s c a l ef a c ed a t a b a s e q u i c k l y , a n dn e wf a c ed a t a b a s ew h i c hc o n t a i n sr i g h tf a c ei sg e n e r a t e d t h ee x p e r i m e n tr e s u l ts h o w st h a tf t o n l a la n dl a t e r a lh i e r a r c h i c a lm a t c h i n ga l g o r i t h mc a l l s h o r t e nr e c o g n i t i o nt i m e e f f i c i e n t l y , a n ds o l v et h ep r o b l e mo fr e c o g n i t i o nt i m e i n c r e a s e d d r a m a t i c a l l yw h e nt h es c a l eo f f a c ed a t a b a s ei n c r e a s e d k e y w o r d s :f a c er e c o g n i t i o n ;g a b o rf i l t e r ;, k e r n e lp r i n c i p a lc o m p o n e n ta n a l y s i s ( k p o 峨l a t e r a l m 论文独创性声明 本论文是我个人在导师指导下进行的研究工作及取得的研究 成果。论文中除了特别加以标注和致谢的地方外,不包含其他人 或机构已经发表或撰写过的研究成果。其他同志对本研究的启发 和所做的贡献均已在论文中做了明确的声明并表示了谢意。 作者签名:叼秽铆日期:加7 - 7 论文使用授权声明 本人完全了解上海师范大学有关保留、使用学位论文的规定, 即:学校有权保留送交论文的复印件,允许论文被查阅和借阅; 学校可以公布论文的全部或部分内容,可以采用影印、缩印或其 它手段保存论文。保密的论文在解密后遵守此规定。 作者签名:叼杉向忙师签名:里堪日期:枷7 歹。, e 海师范大学硕士学位论文 基于正侧面级联匹配的人脸识别算法研究 第一章绪论 1 1 课题的背景与意义 人脸识别是近年来模式识别、图像处理、机器视觉、神经网络以及认知科学 等领域研究的热点课题之一。所谓人脸识别,是指给定一个场景的静态图像或动 态视频,利用存储有若干已知身份的人脸图像的数据库验证和鉴别场景中单个或 者多个人的身份【l 】。人脸识别按照人脸信息的来源可以分为两类:基于静态人脸 图像的识别和基于包含人脸的动态视频信息的识别。因为动态视频信息并不能明 显提高人脸识别的性能,因此本文只研究基于静态人脸图像的识别。 人脸识别技术在国家重要机关及社会安防领域具有广泛用途。例如:公安系 统的罪犯识别、信用卡验证、医学、档案管理、视频会议、人机交互系统的身份 识别。虽然人类能毫不费力地识别出人脸及表情,但机器对人脸的自动识别却是 一个难度极大的课题,它涉及到模式识别、图像处理及生理、心理学等诸多方面 的知识。同其它人体生物特征( 如:指纹、掌纹、虹膜、语音等) 识别技术相比, 人脸识别技术的隐性最好,人脸识别系统更直接、友好,是当今国际反恐和安防 最重视的科技手段和攻关标志之一【2 j 。 当今虽然有一些商业性的人脸识别系统逐渐进入市场,但是,这些系统离实 际应用还有一定距离,性能和准确率有待提高。国外已经有多种人脸识别系统在 银行、机场等部门得到广泛的推广。我国商业化的人脸识别系统非常少。与国外 的同类产品比较,国内产品虽然在某些方面具有一定优势,但在产品的商业化及 复杂性分析等方面与国外相比还有很大的差距闭。 1 2 人脸识别方法综述 1 2 1 基于几何特征的人脸识别方法 人脸识别的初期研究阶段主要使用基于几何特征的人脸识别方法。这种方法 是以人脸各个器官和几何关系为基础进行算法设计。对于不同人来说,脸上的各 个器宫,如眼睛、鼻子、嘴巴以及整个脸部的轮廓都具有不同的形状、大小、相 对位置和分布情况 在基于几何特征的人脸识别方法中,可以用一个矢量来表示提取出来的几何 参数如果要获得一个准确、稳定和可靠的识别结果,就要求这些被选出的几何 特征参数包含足够丰富的辨识人脸的信息,且能反映不同人脸之问的差别。也就 是说对这些矢量要求具有较高的模式分类能力,同时还要有一定的稳健性,能够 消除由于时间变迁、光照变化等其他干扰因素所带来的影响具体来说,这些几 何参数一般包括人脸上两个指定特征点之间的欧式距离、边缘曲率、角度等等。 上海师范大学硕士学位论文 基于正侧面级联匹配的人脸识别算法研究 在b m n c l l i 和p o l o 的文章”j 中给出了一组典型的人脸几何特征参数:眉毛的厚 度、眉毛与眼睛中心的垂直距离、描述左眼眉毛弧度的1 2 个数据、鼻子的宽度、 鼻子在面部上的位置、嘴巴的垂直位置、嘴巴的宽度和上下嘴唇的亮度、描述下 颚形状的n 个半径数据、以鼻子位置为准的脸部宽度、颧骨宽度( 半脸宽) 。 当这些几何特征参数提取出来后,就可以采用最小距离( 欧式距离) 分类器, 将待识入脸特征矢量与数据库中人脸特征矢量进行比较,取距离最近者作为识别 结果。 在实际应用过程中,基于几何特征的人脸识别方法存在着两个方面的问题: ( 1 ) 如何快速、准确地检测出人脸的重要标志点依然是一个没有很好解决 的问题。脸上的重要标志点,如瞳孔、嘴巴和鼻子,它们在脸上的位置是进行脸 部几何参数计算和测量的基准。 ( 2 ) 脸部几何特征在入脸辨识中的有效性问题,即脸部几何特征能够提供 多少可供识别的信息量。 虽然各人脸的器官在形状、大小及分布上都各不相同,但是这种器官上的差 异性更多是体现在某些细微的感觉意义上。例如眼睛显得比较小、鼻子显得比较 宽,以及皮肤的纹理、颜色上的差异等等。显然,这些特征中的一部分是难以精 确测量出来或者是不能用几何参数准确描述的。所以仅靠增加脸上几何参数的数 目来提高人脸识别率是不太现实的。由于进一步改善测量精度是十分困难的,因 而通过增加脸部几何参数的数量来改善识别率结果,其影响是极小的。因此,基 于少量入脸几何特征进行大规模人脸辨识的可靠性是不容乐观的。 1 2 2 基于k - l 变换的特征脸方法 k - l 变换是图像压缩的一种最优正交变换,人们将它应用于特征提取,形成 了子空间法模式识别的基础将k - l 变换用于人脸识别,需要假设人脸处于低 维的线性空间,不同人脸具有可分性高维的图像空间经过k - l 变换后得到一 组新的正交基,保留其中重要的正交基,从而形成了低维的人脸空闻。 若将所有子空间的正交基排列成图像阵列,则正交基呈现人脸的形状,因此 这些正交基也被称作特征脸。选择哪些正交基形成子空间则有不同的考虑,与较 大特征值对应的一些正交基( 也称主分量) 能够表达人脸的大体形状,而具体细 节需要那些小特征值对应的特征向量( 也称次分量) 来加以补充描述,因此低频 成分用主分量表示,高频成分用次分量表示采用主分量作为新的正交空间的正 交基的方法称为主分量分析( p r i n c i p a lc o m p o n e n t a n a l y s i s ,简称p c a ) 方法【习 k - l 变换在9 0 年代初受到了很大的重视,实际用于人脸识别取得了很好的 效果,一般人脸库的大小为1 0 0 幅左右,识别率在7 0 - 1 0 0 :2 5 间不等,这主要 取决于人脸库图像的质量 从压缩能量的角度来看,k - l 变换是最优的,变换后的低维空间对于人脸有 2 上海师范大学硕t 学位论文基于正侧面级联匹配的人脸识别算法研究 很好的表达能力,然而这并不等同于对不同人脸具有较好的辨别能力。选择训练 样本的散布矩阵作为k - l 变换的生成矩阵,其最大特征向量反映了该样本集合 的最大分布的方向,但这是图像统计方法,而不是人脸统计方法。它查找的是图 像之间所有的差异,并根据这些差异来确定不同人脸间的距离,而不管这些差异 是由于光线、发型或背景的改变引起的,还是属于人脸本身的内在差异,因此特 征脸的方法用于人脸识别存在理论的缺陷。研究表明,特征脸的方法随着光线、 角度以及人脸的尺寸的引入而识别率急剧下降。主分量的方法使得变换后的表达 能力最佳,次分量的方法考虑了高频的人脸区分能力,但是由于外在因素带来的 图像差异和人脸本身带来的差异对艮l 变换而言是不加任何区分的,因此,如 何选择正交基并不解决根本问题。改进的一个思路是针对干扰所在,对输入图像 做规范化处理,包括将输入图像的均值方差归一化,人脸尺寸归一化。另一种改 进是考虑到局部人脸图像受外在干扰相对较小的情况,除了计算特征脸之外,还 利用k l 变换计算出特征眼、特征嘴等。将局部特征向量加权进行匹配能够得到 一些好的效果。 总之,特征脸方法是一种简单、快速、实用的基于变换系数特征的算法,但 由于它在本质上依赖于训练集和测试集图像的灰度相关性,而且要求测试图像与 训练集比较相近,所以存在着很大局限。 1 2 3 神经网络方法 人工神经网络是一种以大量的处理单元( 神经元) 为节点,处理单元之间实 现加权值互连的拓扑结构。人工神经网络中的处理单元是人类大脑神经单元的简 化处理单元之间的互连则是轴突、树突这些信息传递路径的简化。根据不同的 应用场合,现已研究出较多的神经元网络模型及其动态过程的算法。 人工神经元通常采用非线性的作用函数,当大量神经元连接成一个网络并动 态运行时,则构成了一个非线性动力学系统人工神经网络具有自组织性、高维 性、模糊性、分布性和冗余性等特点,较冯诺依曼体系的计算机更适合于模拟 人类大脑的思维机理。但总的来说,由于人类对自身思维机理认识的不足,所以 对人工神经元作了极度的简化,这种模拟表现为极其肤浅和简单 很多脸部识别系统都采用了多层感知机( m u l t i l a y e rp e r c e p t r o n ) 作为人工 神经网络的基本结构。多层感知机由几层全互连的非线性神经组成。神经元之间 由权值连接,权值包含了训练模式空间的特征。训练过程就是调整权值的过程, 最常用的算法就是b p 法则1 6 l 。 采用多层感知机进行面部识别的目的就是建立一个关于脸部的紧凑表示,这 相当于面部特征的抽取因为隐层节点的数目l 通常要远远小于输入层和输出 层的节点数目,从而多层感知机将高维的输入数据变换到一个低维子空间中,同 时保留了原始数据中最重要信息。如果隐层神经元采用先行作用函数,则多层感 3 上海师范大学硕士学位论文 堆于正侧面级联匹配鲍人脸识别算法研究 知机张成的降维子空间将与主元分析法张成的子空间一样。主元分析法的方差是 由大到小排列的,而多层感知机的方差是均匀分布到每个隐层神经元上 多层感知机的输入形式有很多种,最简单的就是将整个人脸图像作为输入 层,也可以对人脸图像进行下采样,然后用低分辨率图像作为输入层。还有的文 献采用y - - 进制图像的等密度区域或多个局部面部特征作为不同多层感知机的 输入层。 直接使用b p 神经网络进行人脸识别的问题在于网络过于庞大和复杂,例如 对于一幅1 2 8 x 1 2 8 的人脸图像,输入层和输出层的节点数目将达1 6 4 3 8 。显然, 训练一个这样大的网络将会花费很长时间,需要的存储量也会很高。 由此可以看出,人工神经网络有着与e i g e n f a c e 方法非常相似的表达方法。 一般来说,b p 算法的收敛速度非常缓慢,学习过程可能需要对整个训练集进行 上千次反复叠代运算,这是神经网络实际应用的一个问题。此外,b p 算法以误 差梯度下降的方式达到极小值,但在实际应用中,容易陷入到局部极小中,无法 得到全局最优解,这也是有待解决的一个问题。 1 2 4 弹性图匹配脸部识别方法 在利用图匹配 7 1 进行识别的方法中,一个目标( 如一个人脸图像) 可以采用 一张图( g r a p h ) 来表示。根据局部化空间频率得到的一系列多分辨率描述值可 以用来表示图中的节点数值。物体内部的空问关系则可以用节点之问的几何距离 表示 g a b o r 变换是进行时频分析的有效工具,该函数在时间域和频率域上都是局 部化的,通常将g a b o r 特征用到针对脸部识别的弹性图匹配中。g a b o r 特征在网 格节点上提供了一个多尺度边缘强度。一般来说,图像中的关键部位会有较大的 g a b o r 系数。同样的,对于一个待识别的人脸图像也可以定义一个网格g 及网格 上的特征矢量在弹性图匹配( e l a s t i cg r a p hm a t c h i n g ) 方法中,两幅图的距离 是通过寻找g 与膨之间的最优匹配来得到。 在弹性图匹配法中,将人脸图像库中的图像和待识别图像都用特征矢量图表 示。通过对图与图间拓扑结构的匹配以及节点与节点间特征矢量值的比较,可以 进行人脸识别,这就将模板的图像匹配转化成了模板的图匹配。 弹性图匹配法的最大优点在于对光和表情变化的相对不敏感。这主要归功于 两个原因: ( 1 ) 用g a b o r 变换可提取图像的局部多分辨率特征 ( 2 ) 在计算距离或者能量函数时,使用了变形匹配方法。 弹性图匹配法的主要缺点在于计算量大 4 上海师范大学硪士学位论文基于正侧面级联匹配的人脸识别算法研究 1 2 5 隐马尔可夫模型的脸部识别方法 隐马尔可夫模型( h i d d e nm a r k o vm o d e l ) 1 8 j 一般应用于非平稳时间序列矢量 的统计建模,在语音处理,特别是语音识别中得到广泛应用。 隐马尔可夫模型为一个观测序列提供了一个统计模型,该模型由两个互相关 联的过程组成: ( 1 ) 一个是底层不可观测的马尔可夫链,它由有限个状态、一个概率转移 矩阵和一个初始状态概率分布函数组成。 e 2 ) 另外是一组联系每一个状态的概率密度函数。 在使用隐马尔可夫模型的面部识别方法中,首先将一个人脸图像采集成一系 列的条状图,将一幅二维图像变成一个一维矢量序列,这个序列构成了隐马尔可 夫模型的观测矢量。由于人脸的特定构造,在这种抽样方式下,脸部特征的出现 将服从一定的顺序,所以该模型可以用一个从左到右的隐马尔可夫模型表示,其 中状态的转移只能按照从左到右的方式进行。接着是训练该隐马尔可夫模型,由 以下几个步骤组成: ( 1 ) 建立一个隐马尔可夫模型。 ( 2 ) 用训练数据迭代计算初始参数值。 ( 3 ) 用b a u m - w e l c h 方法重新估计参数值。 识别通过一个v i t e r b i 识别器完成,用代表不同人的隐马尔可夫模型与待识 别图像匹配,最高匹配者被选出来。 1 2 6 基于s h e r 线性判别式的方法 e b e l h u m e u r 提出了一种基于f i s h e r 线性判别式的人脸识别方法,与 e i g e n f a c e 方法相对应,b e l h u m e u r 称其为f i s h e r f a c e ,这种方法对面部表情和光 照方向不敏感。 类似于e i g e n f a c e 方法,f i s h e f f a c e 方法1 9 j 也是采用线性投影技术将人脸图像 从高维图像空间转化到低维特征子空间。在这个低维子空间中,如果特征和投影 方向选择合适的话,人脸特征可以做到对光照方向和表情变化不敏感。 与e i g e n f a c e 方法不同的是,f i s h e f f a c e 采用的投影方向几乎与类内散布方向 垂直,而e i g e n f a c e 方法采用的投影方向是使所有类散布最大化。b e l h u m e u r 认 为这种使所有类散布最大化的p c a 方法会保留那些对分类不利的光照方向和表 情信息因此可认为:对以均方误差为准则的脸部重建来说,p c a 方法是一种 最优的方法;但从模式分类和辨识的观点来看,p c a 方法则不一定能够取得最 优的结果。 1 3 人脸识别的难点分析 经过几十年的研究,人脸识别已经取得了很大的进展,但现有的人脸识别方 s 上海师范大学硕士学位论文 基于正侧面级联匹配的人脸识别算法研究 法一般都是针对某一类问题提出的,由于人脸识别问题的复杂性,实现一个通用 的人脸识别系统目前还不现实。因此,解决特定条件或者特定应用领域的人脸识 别问题仍然是目前人脸识别研究的重要课题。要构建一个稳健的人脸识别系统, 以下是有待解决的几个主要问题: ( 1 ) 人脸图像是复杂和高维的视觉模式,在处理的过程中需要傲降维和特 征提取等工作。如何提取对分类有利的特征,以及如何降低特征的维数有待进一 步研究。 ( 2 ) 由于人脸模式的多样性,人脸图像的空问分布非常复杂,有限的样本 集难以覆盖全部人脸图像子空间,在高维空间中建立准确的分布模型又很困难 因此,如何有效的描述人脸在子空间的分布值得研究人脸的局部和整体信息的 相互结合能有效地描述人脸的特征,如何更好地提取和组合局部与整体的特征值 得深入研究。 ( 3 ) 目前的人脸识别算法还不能较好地处理任意姿态、光照和遮挡等变化 条件。而且,由于人脸的非刚体性、人脸之间的相似性以及变化因素的影响,准 确的人脸识别仍较困难。 ( 4 ) 由于人脸特征描述的局限性,以及各种变化因素的影响,导致不相似 的人脸图像可能被认为是相似的,这通常较难区分 ( 5 ) 由于大多数应用都是面向实时性处理,这要求人脸识别算法简单、快 速且易于实现。 总体而言,目前非理想成像条件下( 尤其是光照和姿态变化) 、用户不配合, 大规模人脸数据库上的人脸识别问题逐渐成为研究的热点。 1 4 论文的内容安排 第1 章为绪论。讨论了课题的背景和意义、研究现状、人脸识别的方法和研 究难点。 第2 章为人脸g a b o r 特征提取。论述了小波变换和g a b o r 小波的基本知识, 以及g a b o r 小波各参数的功能并给出实验描述,阐述了人脸g a b o r 特征的提取方 法,并给出实验结果 第3 章为基于核主成分分析的特征提取主要论述了核函数方法,并对核主 成分分析和主成分分析这两种特征提取方法进行了比较,给出了相应的实验结 果。 第4 章为基于正面图像的人脸识别算法。利用前两章的基本理论和方法,提 出了在小波低频子图上结合g a b o r 滤波和核主成分分析的人脸识别方法。讨论了 提取人脸特征的g a b o r 滤波器参数的选择问题。对核函数的选择和核函数参数的 确定做了探讨,并给出相应的实验结果。最后,通过实验验证本章算法的效果, 并对实验结果进行了分析。 6 上海师范大学硕士学位论文 基于正侧面级联匹配的人脸识别算法研究 第5 章为基于正侧面级联匹配的人脸识别算法。在分析了在大规模人脸库上 进行人脸识别所遇到的问题的基础上,提出了一种正侧面级联匹配的人脸识别算 法。对算法按照两级匹配分别进行详细的阐述,并给出算法每一步的实验结果。 对筛选阂值的确定进行了讨论。最后通过实验验证本章算法的效果,并对实验结 果进行了分析。 第6 章为总结总结本文的工作、创新点及进一步的工作。 最后是参考文献和致谢 7 j 二海师范大学硕士学位论文 基于正侧面级联匹配的人脸识别算法研究 第二章人脸图像的g a b o r 特征提取 本章主要研究了人脸图像的g a b o r 特征提取方法,首先简要介绍了小波变换 和g a b o r 小波的基本知识,简述了g a b o r 小波各参数的功能并给出实验描述,阐 述了人脸g a b o r 特征的提取方法,并给出实验结果。这些方法和技术将用于后面 章节的人脸识别算法中。 2 1 小波变换基础 小波变换的概念是1 9 8 4 年法国工程师m o r l e t 在分析地质数据时首先提出 的。m o r l e t 发现加窗傅立叶变换难以满足分析如地震波等非平稳信号的要求,便 把g a b o r 变换中的窗口函数和傅立叶核函数结合在一起作为一个函数,引入了 “小波”的概念。虽然其根据经验建立的反演公式未得到数学家们的认可,但却 成为小波研究的起点。小波变换是空问( 时间) 和频率的局部变换,因而能有效 地从信号中提取局部信息。通过伸缩和平移等运算功能可对函数或信号进行多尺 度的细化分析。小波变换理论作为时频分析工具,在信号分析和处理中得到了很 好的运用。平面图像可以看成二维信号,因此小波变换很自然地被运用到图像处 理领域。目前小波交换已经被运用到图像处理的几乎所有分支。 2 1 1 小波变换 对于一个平方可积的信号厂( f ) ,其小波变换如下【l o 】; w l s ( a ,6 ) = | 4 i 弓厂( f ) 9 i e j 争。e ,( f 域。( f 渺一( 厂,) ( 2 1 ) 其中式矗o ) 是函数丸 ( f ) 的共扼函数,丸 ( f ) 是基本函数妒( f ) 经先移位后伸缩得 到的,即: 丸,( f ) - l a l :- 。b ( 2 2 ) 若a 、b 取不同值,可以得到一族函数丸。( f ) ,由于( z 1 ) 中t 、口、b 都是连续 变量,所以该式是连续小波变换信号,o ) 的小波变换嘎0 ,6 ) 是4 和b 的函 数,4 称为尺度因子,b 称为时移,妒( f ) 称为基本小波或母小波。丸。0 ) 是母小波 经移位和伸缩产生的一族函数,称之为小波基函数,简称小波基。这样小波变换 又可解释为信号,o ) 和一族小波基的内积。 8 上海师范大学硕士学位论文 基于正侧面级联匹配的人脸识别算法研究 对应的反变换公式为: ,( f ) 一c ;1 强:( n ,6 娩。u 了d a d b ,盼,爹( 口,6 ) ) ( 2 3 ) 其中c :1 是允许条件,假设基本小波的傅立叶变换为妒( 叻,则: 。五粤c * ( 2 4 ) 参考傅立叶变换或其他积分变换,小波变换可以认为是信号,( f ) 以妒( f ) 为核函数 的一种积分变换。和其他常用积分变换显著区别的是小波变换没有固定的核函 数,妒( f ) 不是唯一的。当然也不是所有函数都可以作为小波变换的核函数,因为 任何变换只有其反交换存在才有实际意义。对小波变换而言,如果其反变换存在, 则基本小波妒( f ) 必须满足允许性条件式( 2 4 ) 同其他积分变换一样,连续小波 变换有很多重要运算性质:线性、平移不变性、伸缩不变性等。 在信号处理中,一般采用离散小波变换( d w t ) ,把式( 2 2 ) 中的参数口、 b 都取离散值,固定伸缩步长口。) 1 ,位移步长* 0 ,取口= 口i 4 ,b 一以6 0 4 ,从 而把连续小波变成离散小波,即 丸。( 力一口彳仃妒( 口孑石一n b o ) m ,刀z ( 2 5 ) 由式( 2 5 ) 可以看出,对应于绝对值大的、负的m ,九。( 力的波形是展开的, 同时平移因子6 。口,与之对应;对应于绝对值大的、正的m ,九。( 力的波形是集 中的,小的平移因子口i “就足以覆盖。 有了离散小波,我们就可以对函数,( f ) 进行离散小波变换: ( 巧) ,一( ,九,) - 4 0 _ 7 t ,( f 渺q 矗一n b 。) a t ( 2 回 通常离散小波变换不存在逆变换。如果饥,j ,l ,n z 是r ( r ) 中的一个框架,即 0 爿s 曰,有: 4 羔| ( ,) 1 2 硎砸,v ,( r ) ( 2 7 ) 则可以得到从小波系数( ,九,) 重建,的数学方法: ,老型m k 一+ r ( 2 8 ) 9 上海师范大学硕1 二学位论文 基于正侧面级联匹配的入脸识别算法研究 其中,陋i d ( 等一1 ) j 例:。如果罢接近于1 ,则误差项r 可以被忽略。 在有些场合下,小波函数族饥。,l ,弗z 不是相互正交( 独立) 的,而是相 关的,此时,离散小波变换域只是f 2 ( z 2 ) 的子空间,框架相关性越强,子空间越 小,这在某些场合是有用的( 如去除加性噪声) 。如果取n 。,6 0 分别接近1 和0 , 则框架的相关性很强,接近于连续小波,它可以用于边缘检测等场合。 在另外一些场合,则走向了另一个极端,要求去除框架的相关性。人们选取 ,a 0 ,( 一般一2 ,6 0 一1 ) 使得概,朋,厅z 为规范正交基。似) 中最 简单的规范j 下交基就是著名的h a a r 基,即妒 4 为h a a r 小波,饥,l ,厅z ) 构成 r 俾) 的规范正交基。 2 1 2 多分辨率分析 多分辨率概念是由s m a l l a t 和y m e y c r 于1 9 8 6 年提出来的,它可将此前所 有的正交小波基的构造统一起来,使小波理论产生突破性的进展。 小波分析能够提供工2 ( 固中具有良好局部化性质的正交基,把r ) 中的函 数与1 2 ( z ) 中的数列等同起来,从而把分析问题转化为代数问题来解决。多分辨 率分析的思想就是先在能量有限函数空间r 俾) 的某个子空间中建立基底,然后 利用简单的伸缩与平移变换,把子空间的基底扩充到r 俾) 中。 m a l l a t 将计算机视觉领域内的多分辨率( 多尺度) 分析的思想引入到小波分 析中:小波函数的构造及信号的分解及重构,并研究了小波变换计算离散序列的 情形,给出了著名的m a l l a t 分解并用于图像的分解与重构。m a i l a t 算法在小波分 析中的地位相当予f f t 在傅立叶分析中的地位。 小波分析是傅立叶分析思想的发展与延拓,自它产生以来,一直与傅立叶分 析密切相关。它的存在性证明,小波基的构造以及结果分析都依赖于傅立叶分析, 二者是相辅相成的两者的区别主要在如下几个方面: ( 1 ) 傅立叶变换用到的基本函数只有s i n ,c o s w t ,具有唯一性,而小波变 换用到的函数( e p j , 波函数) 有很多种,同一个工程问题用不同的小波函数分析 有时效果相差比较大选用哪一种小波是实际应用中的一个难点,也是小波分析 研究的一个热点问题,目前主要是通过经验或者不断的实验来选择 ( 2 ) 小波分析中,尺度a 的值越大相当于傅立叶变换中的值越小。 上海师范大学硕士学位论文基于正侧面级联匹配的人脸识别算法研究 ( 3 ) 在频域中,傅立叶变换具有较好的局部化能力,特别是对于那些频率 成分比较简单的确定性信号,傅立叶变换很容易把信号表示成多个频率成分叠加 和的形式。但在时域中,傅立叶变换没有局部化能力,既无法从信号f ( o 的傅立 叶变换f ( 中看出,( f ) 在任一时间点附近的形态。事实上,f ( n 喇甜是关于频 率为的谐波分量的振幅,在傅立叶展开式中,它是由f q ) 的整体形态所决定的。 ( 4 ) 若用滤波器来解释小波变换与短时傅立叶变换的不同之处在于,对短 时傅立叶变换来说,带通滤波器的带宽与中心频率,无关;而小波变换带通 滤波器的带宽v 则正比于中心频率, 2 2g a b o r 小波 g a b o r 函数是由d e n n i sg a b o r 于2 0 世纪4 0 年代提出的,后来被j d a u g m a n 首先用于表征图像,并用于视觉方面的研究,随着图像处理技术的不断发展,成 了非常流行的方法,这得益于g a b o r 特有的属性及其生物意义。生物学的研究表 明,包括人类在内的高等动物的视觉通常主要包括三个部分;第一是视网膜的 g a n g l i o n 细胞;第二是视觉皮层的简单细胞j 第三是视觉皮层的复杂细胞。s m a r c c l j a 首先给出了简单细胞的一维数学描述【1 1 】,j d a u g m a n 进一步将其推广到 二维形式【切,他们认为g a b o r 函数可以较准确地描述人脑视觉皮层简单细胞的 感受野。g a b o t 函数以其最佳的时频局部性和视觉上的解释,在很多方面得到了 应用,如:图像编码、纹理分割、边缘提取等。 2 2 1 一维g a b o r 小波 下式为一维g a b o r 小波【1 3 l 的表达式,它是一个三角函数乘上高斯函数: w o ,t o ,曲。e - - * o - , p g 呻 ( 2 9 ) 由式( 2 9 ) ,可以定义g a b o r 小波变换; c ( 工q ) x t o ,珊) 。丘工( f 沙( f ,t o ,甜皿 ( 2 1 0 ) 将式( 2 9 ) 带入( 2 1 0 ) ,得到 c ( x o ) x t 。,奶一正工件1 0 户口肿 协 ( 2 1 1 ) 将式( 2 1 1 ) 展开,得到 c ) ) 如,回一雄哪甜e o s ( 矾t t o ) ) a t + 正雄x 哪埘s i n ( o # 一f o ) ) 出( 2 1 2 ) 上式计算所得复数c ( x ( t ) x t o ,回代表信号x ( o 在频率为,时问为t 。时刻的频率 上海师范大学硕士学位论文 基于正侧面级联匹配的人脸识别算法研究 信息,这个复数的表示如下: c ( x ( t ) x t o ,c o ) 一+ i a u s( 2 1 3 ) 用极坐标形式表示:假设幅度为a ,相角为西 4 一山2 r e a l + 口2 q ( 2 a 4 ) 尹一a r c t a n ( a h , , a z 4 删)( 2 1 5 ) 2 2 2 二维g a b o r 小波 在图像处理与计算机视觉方面,主要使用的是二维g a b o r 小波【1 4 1 5 1 ,2 d 的 g a b o r 函数是由g a u s s 函数经过复正弦调制后生成的【1 6 1 ,下面是表达式: b ,) ,) 一翕e # ( 口2 2 2 + 8 2 y 2 晒( ,劬) r x c o s o + y s i n o ( 2 1 6 ) y = - x s i n 0 + y c o s o 其中,是中心频率,8 是旋转角度,y 是g a u s s 窗在x 方向上的宽度,叩是g a u s s , 窗在y 方向上的宽度,= ,叩一丢
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 特色中医推拿养生知识培训课件
- 车辆涉水深度安全知识培训课件
- 工艺颜料制造工艺优化方案考核试卷及答案
- 合成气生产故障诊断工艺考核试卷及答案
- 无菌技术教学查房课件
- 毛条混合工艺考核试卷及答案
- 毛织提花工艺考核试卷及答案
- 锡矿选矿磁选分离工艺考核试卷及答案
- 鸡舍鸡只饲料配方调整工艺考核试卷及答案
- 2025年焊工作业人员技能证全国考试题库(含答案)
- 设备日常维护保养记录表
- 验房问题协议书
- 海关退运协议书
- 电梯、自动扶梯和自动人行道随行文件编制说明
- 学校捐款协议书范本
- 车间标签标识管理制度
- 农田托管合同样本
- 部编版小学语文一年级上册教案 全册
- 医院医用织物洗涤规范
- 金氏五行升降中医方集
- 银行业金融机构绩效考评监管指引
评论
0/150
提交评论