




已阅读5页,还剩56页未读, 继续免费阅读
(应用数学专业论文)基于gabor小波变换的人脸识别研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
, 。 ! :0 、 i j r llillii l i jp l l l ij i l llij m a t i c s y 1 8 410 n i l , i n 7 f 。1 9 r r i l l f a c er e c o g n i t i o nb a s e do ng a b o rw a v e l e t r _ 一 lr a n s l o r m b yl i ug u o y o n g s u p e r v i s o r :p r o f e s s o rz h a n gx i a n g d e n o r t h e a s t e r nu n i v e r s i t y j u l y2 0 0 8 ii 一 j 一 , ,事 i 独创性声明 本人声明,所呈交的学位论文是在导师的指导下完成的。论文中 取得的研究成果除加以标注和致谢的地方外,不包含其它人已经发表 或撰写过的研究成果,也不包含本人为获得其他学位而使用过的材 料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了 明确的说明并表示感谢。 l 学位论文作者签名:铡阂 日飙挪d 乡 学位论文版权使用授权书 本学位论文作者和指导教师完全了解东北大学有关保留、使用学 位论文的规定:即学校有权保留并向国家有关部门或机构送交论文的 复印件和磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学 位论文的全部或部分内容编入有关数据库进行检索、交流。 作者和导师同意网上交流的时间为作者获得学位后: 鬻铡爹k 茹搿 半年口一年甲一年半口两年口 一 l - 。 东北大学硕士学位论文 摘要 基于g a b o r 小波变换的人脸识别算法研究 摘要 人脸识别是身份认证最主要的方法之一,是应用数学、模式识别和人工智能 的研究热点。 本文采用g a b o r 小波变换来研究人脸识别算法。在人脸识别系统中,用柬图 来定位待识别人脸的特征点。其中束图的定义如下:选取人脸每个局部特征点的 多个不同类型的g a b o rj e t s ,每个局部特征点对应的这些g a b o rj e t s 称为一个束, 用不同类型人脸图的边组成的网格结构的平均网格来表示人脸几何的特征,这样 的数据结构称为人脸束图。为了计算两张人脸图像的相似度,算法首先找到人脸 图像特征点的位置,比如说眼睛,鼻子,嘴巴等。然后在这些特征点上用g a b o r 小波做卷积,提取g a b o rj e t s ( 也就是卷积值) ,且用这些提取出的g a b o rj e t s 和 特征点位置信息来构成人脸图。每张图像由一个人脸图来表示。两张图像的相似 度是对应人脸图中特征点位置信息和g a b o rj e t s 信息的的函数。本论文的主要工 作如下: 1 第一章扼要概括总结了当前常用的人脸识别理论方法,且对人脸识别的研 究现状和技术发展进行了论述。 2 第二章研究了二维g a b o r d 、波变换及其在识别应用中的响应特征。二维 g a b o r d , 波变换是通过计算一组二维g a b o r 滤波器与图像上给定位置附近区域像 素灰度值的卷积来实现的。 3 第三章讨论了人脸图像的预处理。人脸图像的预处理就是将由图像设备采 集到的人脸图像调整成规范化的图像。 4 第四章详细分析了人脸识别的特征点定位以及算法实现的基本过程,对其 中的相似度以及匹配函数进行了分析。 5 第五章的数值试验结果表明本文的算法是有效的。 关键字:g a b o r d , 波;人脸识别;图像处理;束图;特征定位 i i , 东北大学硕士学位论文 a b s t r a c t f a c er e c o g n i t i o nb a s e do ng a b o rw a v e l e tt r a n s f o r m a b s t r a c t i d e n t i f y i n gah u m a ni n d i v i d u a lf r o mh i so rh e rf a c ei so n eo ft h em o s ti m p o r t a n t m e t h o d si ns t a t u sc e r t i f i c a t i o n ,a n di st h er e s e a r c hf o c u si na p p l i e dm a t h e m a t i c s 、 p a t t e r nr e c o g n i t i o na n da r t i f i c i a li n t e l l i g e n c e t h i st h e s i su s e sg a b o rw a v e l e tt r a n s f o r mt or e s e a r c h f a c er e c o g n i t i o n t h e a l g o r i t h m sn e e d se x a m p l e so fw h a tt h el a n d m a r kj e t sl o o kl i k et ol o c a t et h el a n d m a r k s i nn o v e li m a g e ,w h i c hi sd e s c r i b e da s c h o o s em a n yd i f f e r e n tg a b o rj e t so fe v e r y l a n d m a r ki nn o v e li m a g e ,a n du s et h ea v e r a g eg r i dw h i c hi sc o n s t r u c t e db y 鲥d s t r u c t u r ee d g eo fd i f f e r e n ts t y l e so ff a c eg r a p ht oc h a r a c t e r i z et h ef a c eg e o m e t r i c f e a t u r e s t oc a l c u l a t et h es i m i l a r i t yo ft w of a c e g r a p h ,t h ea l g o r i t h mf i r s t f i n d s l a n d m a r kl o c a t i o n so nt h ei m a g e st h a tc o r r e s p o n dt of a c i a lf e a t u r e ss u c ha st h ee y e s , n o s e ,a n dm o u t h i tt h e nu s e sg a b o rw a v e l e tc o n v o l u t i o n sa tt h e s ep o i n t st od e s c r i b e t h ef e a t u r e so ft h el a n d m a r k ,w h i c hi su s e dt oc o n s t r u c tt h ef a c eg r a p h t h ef a c eg r a p h n o d e sa r ep l a c e da tt h el a n d m a r kl o c a t i o n s ,a n de a c hn o d ec o n t a i n sag a b o rj e t e x t r a c t e df r o mt h a tl o c a t i o n af a c eg r a p hi su s e dt or e p r e s e n te a c hi m a g e t h e s i m i l a r i t yo ft w oi m a g e si saf u n c t i o no ft h ec o r r e s p o n d i n gf a c eg r a p h s t h em a i n w o r ka n dc o n t r i b u t i o no ft h ed i s s e r t a t i o na r ea sf o l l o w s : ( 1 ) t h ec o m m o n l yu s e df a c er e c o g n i t i o nt h e o r i e sa n dm e t h o d sa r es u m m a r i z e d c o m p e n d i o u s l y i nt h i sd i s s e r t a t i o n t h er e s e a r c ha c t u a l i t i e sa n d t e c h n o l o g y d e v e l o p m e n to fc u r r e n tf a c er e c o g n i t i o nt e c h n o l o g ya r ed i s c u s s e db a s e do nas e r i e so f i n t e r n a t i o n a lf a c er e c o g n i t i o ne v a l u a t i o n sw h i c hw e r ec o n d u c t e di nr e c e n ty e a r s ( 2 ) t w o d i m e n s i o n a lg a b o rw a v e l e t st r a n s f o r r na n di t sr e s p o n s ec h a r a c t e r i s t i e s i n r e c o g n i t i o na p p l i c a t i o n sa r er e s e a r c h e d t w o - d i m e n s i o n a lg a b o rw a v e l e t s t r a n s f o r mi sr e a l i z e db yt h ec o n v o l u t i o n so fab a n ko ft w o - d i m e n s i o n a lg a b o rf i l t e r s a n dt h e 莎a yv a l u e so fp i x e l si na l li m a g ea r o u n dag i v e np o s i t i o ni na ni m a g e i nt h i s d i s s e r t a t i o n ,i ti sv a l i d a t e db yt h ec o m p u t a t i o n a lr e s u l t st h a tt h el o c a lf e a t u r e so ff a c e i m a g e se a r lb er e p r e s e n t e dt h r o u g hs e l e c t i n gt h ep a r a m e t e r so fg a b o rf i l t e r s ( 3 ) t h ep r e p r o c e s s i n go ff a c ei m a g ei sr e s e a r c h e d t h ea i mo ff a c ei m a g e p r e p r o c e s s i n gi st or e g u l a r i z et h ef a c ei m a g ew h i c hi sc a p t u r e db yi m a g ec o l l e c t i n g d e v i c e st on o r m a l i z e di m a g e ,i ti n c l u d e st h r e es t e p sm a i n l y :f a c ed e t e c t i o na n de y e l o c a t i o n ,g e o m e t r yn o r m a l i z a t i o n ,g r a yv a l u en o r m a l i z a t i o n i i i 东北大学硕士学位论文 a b s t r a c t ( 4 ) 1 1 1 eb a s i cp r o c e s s e so f t h et w o - d i m e n s i o n a lg a b o rw a v e l e t st r a n s f o r mb a s e d f a c er e c o g n i t i o na r er e s e a r c h e d 1 1 1 es i m i l a r i t yf u n c t i o n sa l ea l s oa n a l y z e d ( 5 ) t h ea l g o r i t h mi sv a l i d a t e db yt h ee x p e r i m e n tr e s u l t s 、7 一 k e y w o r d s :g a b o rw a v e l e t ;f a c er e c o g n i t i o n ;i m a g ep r o c e s s i n g ;b u n c hg r a p h ;f e a t u r e l o c a t i o n 东北大学硕士学位论文 目录 目录 独创性声明i 摘要i i a b s t r a c t i i i 第一章绪论l 1 1 人脸识别的背景及意义。1 1 2 人脸识别的研究内容1 1 3 人脸识别方法2 1 3 1 基于几何特征的方法。2 1 3 2 基于模板匹配的方法3 1 3 3 特征脸方法4 1 3 4 隐马尔科夫模型的方法。4 1 3 5 基于神经网络的方法一5 1 3 6 弹性图匹配方法。5 1 4 人脸自动识别系统6 1 5 本文的主要工作:7 1 6 论文的组织结构7 第二章g a b o r 小波变换9 2 1 小波分析基础9 2 2 一维g a b o r 小波1o 2 3 二维g a b o r 小波l l 2 4 二维g a b o r 滤波器的参数意义13 第三章图像预处理、特征点与人脸图1 6 3 1 图像预处理1 6 3 1 1 人脸检测与眼睛定位1 6 3 1 2 几何规范化2 1 3 1 3 灰度规范化2 3 3 2 特征点2 4 v 东北大学硕士学位论文 目录 3 2 1 特征点粗定位2 5 3 2 2g a b o rj e t s 2 6 3 2 3j e t s 相似性的几个计算公式。2 6 3 2 4 位移估计2 7 3 3 人脸图2 9 3 3 1 人脸图2 9 3 3 2 人脸图的相似度2 9 第四章基于g a b o r 小波变换的人脸识别算法研究3 0 4 1 基于g a b o r 小波变换的人脸识别算法简介3 0 4 2 正规化3 1 4 3 构造束图3 4 4 4 特征点定位3 5 4 5 人脸图构造3 6 4 6 计算人脸图相似度并进行人脸识别3 6 4 7 小结3 6 第五章实验及总结3 8 一 5 1 实验3 8 5 2 总结3 9 5 3 进一步的工作4 0 参考文献4 l 致谢4 6 , i 东北大学硕士学位论文第一章绪论 第一章绪论弟一早珀下匕 1 1 人脸识别的背景及意义 计算机人脸识别技术是生物特征识别技术的一种,近2 0 年以来,已经发展 成为计算机视觉和模式识别领域的一个活跃课题。随着科学技术的发展和社会的 进步,对快速有效的自动身份鉴别的需求越来越迫切。目前进行身份鉴别依赖的 生物特征主要有两类,即身体特征和行为特征:身体特征主要包括指纹、手形、 基因体热辐射与身体气味、眼部特征( 视网膜、虹膜) ;行为特征包括手写签名、 使用计算机时的击键、语音。人脸识别与其他的身份鉴别方法相比,其应用过程 是非接触式的、连续的和实时的,因此更加直接、友好,并且通过对人脸的表情、 姿势的分析,还能获得其他识别方法很难获得的信息,这些优势使其在众多生物 特征识别技术中备受关注。 人脸识别技术作为多学科领域的挑战性难题,覆盖了数字图像处理、模式识 别、计算机视觉、神经网络、心理学、生理学、数学等诸多学科的内容,同时也 具有十分广泛的应用意义:在国家安全方面,人脸识别技术可以应用于对罪犯、 恐怖分子的追踪识别,对犯罪高发地区的监视或重大嫌疑犯重点地区的布控系 统,机场安检口身份证检查及结合犯罪嫌疑人识别系统的安检口控制系统:在军 事方面,人脸识别技术可以应用于数字化士兵的交互通讯,从而进行敌我识别, 信息提取等;在公众安全方面,人脸识别技术应用于智能视频监控、电脑网络安 全、访问控制、司机驾照验证、自动门卫系统,也可以应用于各类银行卡、金融 卡、信用卡的持卡人的身份验证:在人机交互方面,计算机可以通过人脸识别确 定目前是谁在它的视野当中,根据不同人的身份提供不同服务,不再千篇一律; 在家庭娱乐等方面,通过人脸识别,可以实现能够识别主人身份的智能玩具和机 器人等。 1 2 人脸识别的研究内容 人脸识别技术就是利用计算机分析人脸图像,进而从中提取出有效的识别信 息,用来“辨认 身份的一门技术。问题一般可以描述为:对于输入的人脸图像 或者视频,首先判断其中是否存在人脸,如果存在人脸,则进一步给出每个人脸 东北大学硕士学位论文第一章绪论 的位置、大小和各个主要面部器官的位置信息,并依据这些信息,进一步提取每 个人脸中所蕴含的身份特征,并将其与已知人脸库中的人脸进行对比,从而识别 每个人脸的身份。人脸识别的研究范围广义上讲大致包括以下五个方面内容【6 j : 1 、人脸定位和检测 7 1 ( f a c ed e t e c t i o n ) :即从静态图片或者视频序列中检测出 人脸的存在并且确定其位置,最后分离出来。这一任务主要受到光照、噪声、面 部倾斜以及各种各样遮挡的影响。人脸检测是人脸身份识别的前期工作。同时, 人脸检测作为完整的单独功能模块可用于保安系统、案件侦破系统以及涉及到人 机交互的领域;另外还可广泛应用于人的跟踪、监测等系统。 2 、人脸表征( f a c er e p r e s e n t a t i o n ) ( 也称人脸特征抽取) :即采用某种表示方法 表示检测出的人脸与数据库中的已知人脸。通常的表示方法包括几何特征( 如欧 氏距离、曲率、角度) 、代数特征( 如矩阵特征向量) 、固定特征模板、特征脸等。 3 、人脸识别( f a c ei d e n t i f i c a t i o n ) :即将待识别的人脸与数据库中已知人脸比 较,得出相关信息。这一过程的核心是选择适当的人脸表征方式与匹配策略,系 统的构造与人脸的表征方式密切相关。 4 、表情姿态分析( e x p r e s s i o n g e s t u r ea n a l y s i s ) :即对待识别人脸的表情或姿 态信息进行分析,并对其加以归类。到目前为止,由于该问题的复杂性对表情分 析的研究还处于初步阶段。 5 生理分类( p h y s i c a lc l a s s i f i c a t i o n ) 即对待识别人脸的生理特征进行分析, 得出其年龄、性别等相关信息,或者从几幅相关的图像推导出希望得到的人脸图 像,如从父母图像推导出孩子的脸部图像、基于年龄增长的人脸图像估算等。显 然,完成这一操作需要大量的知识并且通常是非常困难和复杂的。 目前人脸识别系统侧重于两个主要的技术环节,即人脸检测与人脸识别。上 面已经进行了简要的介绍,在下一章将进行较为系统的阐述。 1 3 人脸识别方法 人脸识别的方法大致可以分为基于几何特征的方法,基于模板匹配的方法, 特征脸方法,隐马尔可夫模型的方法,基于神经网络的方法。 1 3 1 基于几何特征的方法 人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小 2 东北大学硕士学位论文第一章绪论 和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和 结构关系的几何描述,可以作为人脸识别的重要特征【2 3 1 。基于几何特征的识别 方法【1 8 1 首先将入脸用一个几何特征矢量表示,用模式识别中的层次聚类思想设 计分类器来对人脸进行识别。几何特征矢量是以人脸器官的形状和几何关系为基 础的特征矢量,其分量通常包括人脸指定两点间的欧氏距离、曲率、角度。人脸 器官的关键点分别对应于不同的积分投影方式产生的波峰波谷,根据人脸结构的 先验知识,可得出人脸各器官之间的几何位置关系。 基于几何特征的识别方法具有如下优点: 符合人类识别人脸的机理,易于理解; 对每幅图像只需存储一个特征矢量,存储量小; 对光照变化不太敏感; 这种方法同时存在如下问题: 从图像中抽取稳定的特征比较困难,特别是特征受到遮挡时; 对强烈的表情变化和姿态变化的鲁棒性较差; 一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特 征,造成部分信息丢失,更适合于粗分类。 1 3 2 基于模板匹配的方法 基于模板匹配的方法【1 9 】是另一类常用的方法,这种方法大多是用归一化互 相关,直接计算两幅图像之间的匹配程度。由于这种方法要求两幅图像上的目标 要有相同的尺度、取向和光照条件,所以预处理要做尺度归一化和灰度归一化的 工作。 最简单的模板匹配方法是每个人作为数据库中的一个条目,它的字段包含一 个从正面人脸像抽取的二维点阵。图像必须经过归一化。识别时,未分类的图像 跟数据库中的所有图像数据进行比较,采用相关作为典型的匹配函数。o s a m u 等人提出了等灰度图匹配的方法 2 1 1 。所谓等灰度图就是对原始图像进行二值化 后得到的图像。此方法的优点是运算量小于通常的基于灰度图的匹配方法,但也 存在不足,比如它要求光照变换不大,摄像机到人脸的距离应保持不变,有外形 或附属物发生变换时,要从新注册。y u l e e ,c o h n 和h a ll i n e n 19 】利用可变形模板 抽取面部特征。这些模板可以进行平移、旋转和变形以便能够最佳地表示它们在 3 东北大学硕士学位论文 第一章绪论 图像中的形状。它们对图像进行了预处理,定义了各种能量函数。他们在实验中 发现,模板的起始位置对于确定眼睛的准确位置至关重要。当模板从眉毛上开始 时,算法不能够区分眼睛和眉毛。算法的另一个缺点是计算复杂。 1 3 3 特征脸方法 特征脸识别方法【1 7 1 是一种非常常见的方法。它本质是基于特征的方法,只 不过它的特征是在抽取代数特征的基础上完成的。这里的代数特征是与几何特征 相对而言的,是指经过数字变换得到的特征。主分量分析( p c a ) 是一种常用的方 法,p c a 实质上是k - l 展开的网络递推实现,k l 变换是图像压缩中的一种最 优正交变换,其生成矩阵一般为训练样本的总体散布矩阵。由于高维图像空间 k - l 变换后可得到一组新的正交基,因此可通过保留部分正交基,以生成低维人 脸空间。而低维空间的基则是通过分析人脸训练样本集的统计特性来获得,k - l 变换的生成矩阵可以是训练样本集的总体散布矩阵,也可以是训练样本集的类间 散布矩阵,即可采用同一人的数张图像的平均来进行训练,这样可在一定程度上 消除光线等的干扰,且计算量也得到减少,而识别率不会下降。将子空间的正交 基按照图像阵列排列,则可以看出这些正交基呈现人脸的形状,因此这些正交基 也被称作特征脸。利用这些基底的线性组合可以描述、表达和逼近人脸图像,因 此可以进行人脸识别和合成。识别过程就是将人脸图像映射到由特征脸张成的子 空间上,比较其与已知人脸在特征脸空间中的位置。 1 3 4 隐马尔科夫模型的方法 隐马尔科夫模型嘲( h i d d e nm a r k om o d e l ,h m m ) 是用于描述信号统计特性 的一组统计模型,提供了描述复杂现象的一种可能机制。h m m 使用马尔科夫链 来模拟信号统计特性的变化,而这种变化又是间接地通过观察序列来描述的,因 此,隐马尔科夫过程是一个双重的随机过程。在h m m 中,节点表示状态,有向 边表示状态之间的转移,一个状态可以具有特征空间中的任意特征,对同一特征, 不同状态表现出这一特征的概率不同。由于h m m 是一个统计模型,对于同一特 征序列,可能会对应于许多状态序列,特征序列与状态序列之间的对应关系是非 确定的。这种模型对于状态序列来说是隐的,故称为隐马尔科夫模型。 利用h m m 对人脸进行描述和识别,把各个器官的数值特征和一个状态转移 模型联系起来,该模型的参数能较好地表征具体的人脸模型。伪二维 4 东北大学硕士学位论文第一章绪论 h m m ( p 2 d h m m ) 模型是一维h m m 模型的一种扩展,相当于将一组一维h m m 模型嵌入另外一组h m m 模型中,它利用了图像的二维特征,更适合于图像识别。 h m m 方法的优点是稳健性好,对于不同角度的人脸图像和不同的光照条件,都 可以达到满意的识别精度。 1 3 5 基于神经网络的方法 基于神经网络的方法【2 4 1 是近年来比较活跃的一个研究方向。人工神经网络 ( 砧州) 是一种以大的量处理单元( 神经元) 为节点,处理单元之间实现加权值互 联的拓扑结构,处理单元是人类大脑神经单元的简化。c o t t r e l l i s 等人【2 5 1 使用级 联( b p ) 神经网络进行人脸识别,对部分受损的人像、光照有所变化的人像,个人 识别能力较好。i n i t i a t o r 等提出了一种混合型神经网络来进行人脸识别,其中 非监督神经网络用于特征提取,而监督神经网络用于分类。l a u r e n c e 和g i l e s t 2 7 】 等人用一个自组织特征映射( s o m ) 神经网络与卷积神经网络结合的系统对一个 有4 0 0 幅人脸图像、人均1 0 幅的数据库进行了人脸识别研究。其中s o m 网络 的作用是将图像样本量化到降维的拓扑空间,它使原空间中相邻的输入点在输出 空间中仍相邻。卷积网络用以实现相邻像素之间的相关性知识,从而在一定程度 上实现了图像平移、旋转、尺度和局部变形的不变性。l i n 等陴1 提出了基于概率 决策的神经网络方法( p d b n n ) ,其主要思想是采用虚拟( 正反例) 样本进行强化 和反强化学习,并采用模块化的网络结构加快网络的学习,这种方法在人脸检测、 人脸定位和人脸识别的各个步骤上都得到了较好的应用。 1 3 6 弹性图匹配方法 弹性图匹配方法【”1 ( e l a s t i cm a t c h i n g ) 是一种基于动态链接结构的方法,是动 态匹配中的一种。弹性匹配方法用网格作为模板,将图像间的比较变为网格间的 比较。对于网格上的每一点抽取一定的特征信息,如灰度值、梯度值、傅里叶变 换系数值、小波变换系数等,形成一组特征矢量,并用这些特征矢量来代表图像 进行匹配。在将一幅图像的网格同另一幅图像的网格进行匹配时,一般先规定一 个能量函数或代价函数,然后在一定范围内对网格进行逐点变形搜索,找出每一 点对应的能量函数最小点的位置。这种利用弹性形变实现图像之间最佳匹配的方 法称之为弹性匹配法。弹性图匹配能够容忍表情的变化,并在一定程度上能够容 5 东北大学硕士学位论文 第一章绪论 忍视角的变化。而这也是弹性图匹配方法优于特征脸方法的原因。 1 4 人脸自动识别系统 在一个人脸识别系统中,当把一个未知的人脸送到人脸系统时,系统将这个 新人脸与数据库中的人脸进行比较,在此基础上,系统将确定此人的身份。一个 典型的人脸自动识别( a u t o m a t i cf a c er e c o g n i t i o n ) 系统都是由图1 1 所示的几 个部分组成的。 图1 1 典型的人脸识别系统 f i g 1 1f a c er e c o g n i t i o ns y s t e m 下面分别阐述各部分的功能和作用: 图像获取部分负责获取图像,图像可能来自于摄像机或是扫描仪等设备,程 序将其转换为可处理的格式。 检测定位部分通过对输入的图像处理分析,判断图像中是否有人脸,如果有 人脸则做出准确的定位。输入的图像可能是静态的也可能是动态的,可能是彩色 的也可能是灰度的,可能是简单背景也可能是复杂背景,要根据不同情况作相应 的处理。这一部分的工作在整个系统中是非常重要的。 正规化部分也可称为预处理部分,将抽取的人脸图像做大小和灰度的归一化 处理使不同图像中人脸大小和亮度统一。 特征提取部分在前面正规化后的人脸图像中按照某种策略抽取出用来识别 的特征,将原始的人脸空间中的数据映射为特征空间。由于原始的图像数据量是 相当大的,为了有效地实现分类识别,就要对原始数据进行变换,得到最能反映 分类本质的特征。一般把原始数据组成的空间叫测量空间,把分类识别赖以进行 的空间叫做特征空间,通过变换,可把在维数较高的测量空间中表示的模式变为 6 东北大学硕士学位论文第一章绪论 在维数较低的特征空间中表示的模式。在特征空间中的模式通常也叫做一个样 本,即特征空间中的一个点。 分类器设计部分是在后台进行的,就是训练过程,此过程结束后将生成可用 于分类识别的分类器。事实上,模式识别问题可以看成是一个分类问题,即把待 识别的对象归到某一类中。在人像识别问题中就是把输入的不同的人像归入某个 人这一类。这部分的基本做法是在样本训练集基础上确定某个判决规则,使按这 种判决规则对被识别对象进行分类所造成的错误识别率最小或引起的损失最小。 分类决策部分就是利用已设计好的分类器作分类识别,给出最后的识别结 果,并做出相应的判断。 基础图像处理部分包括一些最基本的图像操作,为检测定位部分和正规化部 分提供必要的服务,比如检测定位部分常常需要对图像进行边缘提取,二值化等 操作;正规化部分常需要进行图像的灰度归一等操作。 评价一个人脸自动识别系统的标准:一个是误识率,即将某人错误识别为其 他人,另一个是虚警率,即将其他人识别为这个人。这两者之间是存在矛盾的, 在实际问题中需要某种折中。 1 5 本文的主要工作 按照人脸图像表示的策略和重点不同,人脸识别算法可分为两类:基于全局 特征的人脸识别算法和基于局部特征的人脸识别算法。基于全局特征的人脸识别 算法偏重于将人脸图像作为一个整体来进行分析计算,基于局部特征的人脸识别 算法则在注意人脸全局性信息的同时更侧重于从人脸的局部来描述人脸图像。本 文中基于g a b o r 小波的人脸识别算法利用二维g a b o r 小波变换系数表示人脸图 像,是一种基于局部特征的人脸识别算法,这种算法将人脸图像与人脸束图进行 匹配以确定特征点的位置,然后计算特征点位置的g a b o r 小波变换系数并进行分 类识别。其中主要介绍了将g a b o r 小波变换用于人脸表征、特征匹配及人脸识别 的方法,并且通过实验数据讨论了它的有效性。 1 6 论文的组织结构 第一章为绪论部分,介绍了本论文的研究背景和意义、人脸识别的研究状况、 人脸识别的研究内容和人脸识别系统等,还给出了本文的主要工作。 7 东北大学硕士学位论文 第一章绪论 第二章介绍了小波变换的基本理论,在此基础上对本文所用的g a b o r 小波变 换进行了较为详细的描述。 第三章介绍了人脸图像的预处理过程,详细讨论了局部特征点的定位过程及 g a b o rj e t s 的相似度计算,还有人脸图的结构和人脸图相似度的计算。 第四章详细说明了基于g a b o r 小波变换的人脸识别算法的实施过程和算法 的每一个重要部分。 第五章包括实验结果和对本文工作的总结以及对未来工作的展望。 东北大学硕士学位论文第二章g a b o r 小波变换 第二章g a b o r 小波变换 2 1 小波分析基础 小波分析属于时频分析的一种,传统的信号分析是建立在傅里叶( f o u r i e r ) 变换的基础之上的,由于傅里叶分析要么完全在时域,要么完全在频域,因此无 法表述信号的时频局域性质,而这种性质恰恰是非平稳信号最根本,最关键的性 质。世界各地的研究者和工程师们通过不断地研究和发展,提出了小波分析。 小波变换是一种信号的时间一尺度( 时间一频率) 分析方法,它具有多分辨率分 析( m o u l t r i es o l u t i o na n a l y s i s ) 的特点,而且在时频两域都具有表征信号局部特征 的能力,是一种窗口大小固定不变,但其形状可改变,时间窗和频率窗都可以改 变的时频局部化分析方法。 傅立叶分析是时域到频域互相转化的工具,从物理意义上讲,傅立叶变换的 实质是把以下x ( f ) 这个波形分解成许多不同频率的正弦波的叠加和,就像一束白 光通过一个玻璃三棱镜后可以分解成不同颜色的光一样,这即是谐波分析的基本 概念,我们可以把对原函数石( f ) 的研究转化为对其权系数,即其傅立叶变换x ( f ) 的研究: r 佃 ix ( 厂) = f x ( t ) e 。2 朋出 1 ( 2 1 ) iz ( f ) = f x ( f ) e 。2 朋出 l 二 从傅立叶变换中可以看出,这些标准基是由正弦波及其高次谐波组成的,因 此它在频域内是局部化的。虽然傅立叶变换能够将信号的时域特征和频域特征联 系起来,能分别从信号的时域和频域观察,但却不能把二者有机地结合起来。这 是因为信号的时域波形中不包含任何频域信息。而其傅立叶谱是信号的统计特 性,从其表达式中可以看出,它是整个时间域内的积分,没有局部化分析信号的 功能,完全不具备时域信息,也就是说,对于傅立叶谱中的某一频率,不知道这 个频率是在什么时候产生的。这样在信号分析中就面临一对最基本的矛盾:时域 和频域的局部化矛盾。 在实际的信号、图像处理过程中,尤其是对非平稳信号的处理中,信号在任 9 东北大学硕士学位论文 第二章g a b o r 小波变换 一时刻附近的频域特征都很重要。因此,人们希望可以找到更好的、可以处理非 平稳信号的分析工具,小波分析正是在这样的需求下诞生的。 小波分析方法是一种窗口大小( 即窗口面积) 固定但其形状可改变,时间窗和 频率窗都可改变的时频局部化分析方法。即在低频部分具有较高的频率分辨率和 较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率。 设x ( f ) ( 足) ( ( 足) 表示平方可积的实数空间) ,y ( f ) 是被称为基本小波 或母小波( m o t h e r w a v e l e t ) 的函数,则函数x ( f ) 的小波变换可以表达如下: w t , ( a , r ) = 击加) y 呼) a t = ( m 虬( f ) ) ( 2 2 ) 其中a 为伸缩( 尺度) 因子,t 为平移因子,反映小波函数的位移,其值可正可 负,符号 代表内积,它的含义是: ( x ( f ) ,y o ) ) = f x ( t ) y ( t ) d t 少( f ) 之所以是“小一的,是因为规定( f ) 厶,知f r 9 ( t ) d t 0 + a r c t a n ( a , = , 口删) i f 口。, o ( 2 7 ) 州2 i f 口脚,= 。oa n d a r e a 0 一兀 2谴n 硼= 0a n da 删 s i n ( k 工) 051 01 5加 2 53 03 54 0惦5 0 图2 1 小波卷积例子 f i g 2 1w a v e l e tc o n v o l u t i o ne x a m p l e 1 2 ,一2 h 陆 一仃 东北大学硕士学位论文 第二章g a b o r 小波变换 二维g a b o r 小波变换描述了图像l ( x ) 上给定一点x 附近区域的灰度特征,这 可以用一个卷积来定义: 斗 - - j i ( x ) = l j ( x ) v , ( x - x ) d 2x 7 ( 2 1 1 ) 图2 2 显示了用小波的实部和虚部对一幅图像做卷积的结果:上面的两个图 是原人脸图像和二维g a b o r 小波模板;下面的两个图是幅值和相位图。 皿圈 m 曲讨e 期埔e 图2 2 二维g a b o r 小波卷积例子 f i g 2 2t w o d i m e n s i o n a lw a v e l e tc o n v o l u t i o ne x a m p l e 2 4 二维g a b o r 滤波器的参数意义 p 为二维g a b o r 滤波器的方向( o r i e n t a t i o n ) ,下面是几个不同的g a b o r 小波, 他们的口值分别为:o ,州4 ,州2 ,3 7 r 4 : 一一 ( 矽= 0 ,万4 ,万2 ,3 7 r 4 ) a 为波长,即规定了二维g a b o r 滤波器的频率( f r e q u e n c y ) ,下面为当旯从8 个像素增加到1 6 个像素的时候g a b o r 小波变化的效果图: 1 3 东北大学硕士学位论文第二章g a b o r 小波变换 部和虚 这个数 长等于 驴= 0 5 ,0 8 ,1 2 ,1 5 ) 本文中小波的方向取为不同的八个值,即: 0 0 ,州8 ,2 州8 ,3 州8 ,4 衫8 ,5 州8 ,6 # 8 ,7 州8 ;波长a 取五个不同的值,即: 力 4 ,砸,8 ,8 芝,1 6 ;相位9 取不同的两个值,即:9 o ,州2 ) :高斯函数的半 径盯令其等于兄;高斯函数的长宽比,为l ,这样得到8 个方向,5 个频率,2 个 1 4 _一一一一_憾一一一一一一一一一一一黜蔗一=一=一篇嚣 , 正 。 部 值 宽 东北大学硕士学位论文 第二章g a b o r 小波变换 相位总共8 0 个不同的小波,用小波核与图像上的某一点做卷积就可计算出一个 g a b o r 小波变换系数,图2 3 显示了所有8 0 个g a b o r 小波滤器。 图2 38 0 个g a b o r 小波滤器,左列的相位为0 ,右列的相位为州2 f i g 2 3t h i sf i g u r es h o w s8 0g a b o rw a v e l e tm a s k s t h el e f ts e t so f w a v e l e t sh a v eap h a s e a n g l eo f0 ( e v e n ) ,a n dt h er i g h th a v eap h a s ea n g l eo f 冗| 2 ( o d d ) 1 5 髓 髓 目 国 目 墨 圈 囫目一墨 囫目一墨 目墨 田 圜 圈 目 国 圆 圆 圆 口囝目目目圈 囫目目囵囵 目目囵墨 , 东北大学硕士学位论文 第三章图像预处理、特征点与人脸图 第三章图像预处理、特征点与人脸图 3 1 图像预处理 3 1 1 人脸检测与眼睛定位 人脸图像的预处理包括以下几个环节。首先,将人脸区域检测出来,并确定 其几何规范化的基准,通常选取眼睛中心位置作为基准;其次,将眼睛坐标匹配 变换至预定的规范化
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论