(计算机应用技术专业论文)基于coabor特征和gda的人脸识别方法.pdf_第1页
(计算机应用技术专业论文)基于coabor特征和gda的人脸识别方法.pdf_第2页
(计算机应用技术专业论文)基于coabor特征和gda的人脸识别方法.pdf_第3页
(计算机应用技术专业论文)基于coabor特征和gda的人脸识别方法.pdf_第4页
(计算机应用技术专业论文)基于coabor特征和gda的人脸识别方法.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(计算机应用技术专业论文)基于coabor特征和gda的人脸识别方法.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分类号:t p 3 学号:2 0 0 4 2 0 1 0 8 8 5 4 华南理工大学硕士学位论文 基于g a b o r 特征和g d a 的人脸识别方法 作者姓名:李维 申请学位级别:硕士 研究方向:图像处理与模式识别 论文提交日期:伽 年f 月;d 日 学位授予单位:华南理工大学 答辩委员会成员: 主 委 指导教师姓名、职称:张星明教授 学科专业名称:计算机应用技术 论文答辩日期:2 0 0 7 年6 月2 日 学位授予日期: 年月日 华南理工大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所 取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任 何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡 献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的 法律后果由本人承担。 作者签名:夕錾钥让日期:加哕年乡月2 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属华南理工大学。学校 有权保存并向国家有关部门或机构送交论文的复印件和电子版,允许学位 论文被查阅( 除在保密期内的保密论文外) j 学校可以公布学位论文的全 部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位 论文。本人电子文档的内容和纸质论文的内容相一致。 本学位论文属于: 日保密,在上年解密后适用本授权书。 口不保密。 学位论文全文电子版提交后: 口同意在校园网上发布,供校内师生和与学校有共享协议的单位浏 览。 ( 请在以上相应方框内打“”) 篇急未魄嵋 指导教师签名: ( 笆、l 日期:冲7 牟占坷2 | j 日期:叩争占j 82 目 摘要 近年来,人脸识别技术得到了广泛的重视和发展。在安防、刑侦、人机交互等领域, 发挥着越来越重要的作用,已逐步进入到了应用推广阶段。与此同时,研究人员对更高 效、准确和实用的人脸识别算法一直从未停止探索。人脸识别算法作为人脸识别系统中 关键的灵魂部分,是评价一个人脸识别系统的最重要的标准之一。 在本文中,首先提出了一种基于a t i c r 和g d a 广义判别分析的识别算法,在光照 无关性上有较好的表现;随后对基于g a b o r 的加权l g b p h s 算法进行了改进,使得在 保持高识别率的同时,在特征数据量上做了压缩,该算法拥有很优秀的光照无关性和良 好的处理不同时期人脸问题的能力。 最后,我们提出了一种综合利用g a b o r 特征、a t i c r 光照纠正、a d a b o o s t 算法和 g d a 特征提取的多分类器信息融合的方法,并同时采用全局以及局部特征的一种综合 性的人脸识别方法。首先,整个方法以g a b o r 特征为基本素材,它的应用提高了该方法 的整体鲁棒性。不管是在光照问题上,还是在识别上,g a b o r 特征为是此方法的有效性 打下了重要的基础。基于a d a b o o s t 的算法挑选出最具有识别能力的局部特征块,有效 的减低了g a b o r 特征的维度,同时还能取其精华,去其糟粕,留下来对识别取到更关键 作用的关键特征点,从而提高整体的识别效果。其次,基于仿射变换a t 算法以及光照 补偿模型i c r 相融合的光照预处理方法得到了应用。它能够有效地调整光照条件,与其 他预处理方法相比,他不仅不会破坏图像原有的纹理,造成噪声干扰和信息丢失,反而 能还原和增强了图像的纹理特征。使得g a b o r 特征的有效性的到了很好发挥,从而极大 地增强了算法对质量不高的图片的识别上的鲁棒性。在广义判别分析g d a 特征提取算 法的支持下,本文方法有效的对各局部g a b o r 特征进行有效降维,并用余弦距离的方式 衡量距离,最后用求和平均的方式融合了全局和局部的g a b o r 特征。 通过上述策略,我们大大的增强了算法在光照影响下的识别效果,同时也减轻了人 脸老化以及面部装饰变化等不利因素的影响,提高了整体的识别效果。经过在普通人脸 数据库( 如o r l ) 、不同光照条件下的数据库( 如y a l eb ) 、不同年龄时变数据库( f e r e t d u l ,d u 2 ) 的测试,我们认为局部块多分类器融合的方法是一个综合表现优秀的识别 方法,在光照变化和年龄变化的情况下仍能够保持较高的识别率。 关键字:人脸识别;g a b o r 特征;广义判别分析;a d a b o o s t ;多分类器 a b s t r a c t r e c e n t l y , f a c er e c o g n i t i o nt e c h n o l o g yh a sb e e nw i d e l yu s e d e s p e c i a l l yi nt h es e c u r i t y , c r i m i n a ld e t e c t i o na n dh u m a n - c o m p u t e ri n t e r a c t i o na r e a ,i tb e c o m e sm o r ea n dm o r ei m p o r t a n t f a c er e c o g n i t i o na p p l i c a t i o n si sa l s ob e i n gp r o m o t e db ys o m ec o m p a n i e so rr e s e a r c hc e n t e r m e a n w h i l e ,p e o p l eh a v en e v e rs t o pr e s e a r c h i n gf a c er e c o g n i t i o na l g o r i t h m st h a tp e r f o r m m o r ea c c u r a t ea n de f f e c t i v e l y f a c er e c o g n i t i o na l g o r i t h mi st h es o u lo faf a c er e c o g n i t i o n s y s t e m a n di t sa l s ot h em o s tc r i t i c a lc r i t e r i o nt ov a l u a t et h es y s t e m i nt h i st h e s i s ,a na l g o r i t h mb a s e do na t i c ra n dg d ai sp r o m o t e d i tw o r k sw e l li nt h e v a r i o u si l l u m i n a t i o ne n v i r o n m e n t s t h e n ,w ei m p r o v e dt h ew e i g h t e dl g b p h sa l g o r i t h m b a s e do ng a b o rf e a t h e r , w h i c hm a k e si tl e s sf e a t h e rd a t aa n ds a m eh i g hr e c o g n i t i o nr a t e t h i s a l g o r i t h mo w n se x c e l l e n tr o b u s to f v a r i o u si l l u m i n a t i o na n dp e r i o df a c e a tt h el a s tp a r to ft h i sp a p e r , w ep r o m o t eam u l t i - c l a s s i f ya l g o r i t h mw h i c hc o m b i n e d g a b o rf e a t h e r , a t i c ri m a g ep r e p r o c e s sm e t h o d ,a d a b o o s ta l g o r i t h ma n dg d af e a t h e r f i r s t l y , g a b o rf e a t u r e sa r eu s e da st h eb a s i cm a t e r i a l i te n h a n c e st h er o b u s to f t h ea l g o r i t h m u s i n gg a b o rf e a t u r e ,e n s u r et h ea c c u r a t ep e r f o r m a n c eb o t ho nr e g u l a rr e c o g n i t i o na n d r e c o g n i t i o nu n d e rv a r i o u si l l u m i n a t i o n s w h a t sm o r e ,d i m e n s i o nr e d u c eb a s e do nm a s k s u b s a m p l i n gn o to n l yr e d u c et h ed i m e n s i o no fg a b o rf e a t u r e s ,b u ta l s ok e e pm o r ei m p o r t a n t p o i n t sa n ds k i pt h er e d u n d a n c y s oi td o e s n te f f e c tm u c ho nt h ec l a s s i f yr e s u l t s e c o n d l y , t h ei m p r o v e da t ( a f f i n et r a n s f o r m ) a l g o r i t h mw a sa p p l i e dt oi m p r o v et h e p e r f o r m a n c e so ft h er e c o g n i t i o na l g o r i t h m i ta l s oc o m b i n et h ea ta l g o r i t h ma n di l l u m i n a t i o n c o m p e n s a t i o nb a s e do nm u l t i p l er e g r e s s i o nm o d e la l g o r i t h ms m o o t h l y e x p e r i m e n t sr e v e a l s t h a tt h i si m a g ep r e p r o c e s sa l g o r i t h mi si l l u m i n a t i o ni n v a r i a n ta n da c h i e v e sg o o dp e r f o r m a n c e w h i l et h er e c o g n i t i o nr a t eh a sb e e ng r e a t l yi m p r o v e d b e c a u s e ,i td o e sn o td e s t r o yt h et e x t u r e i n f o r m a t i o no ft h ei m a g e s og a b o rf e a t u r ec a ne x t r a c tt h et e x t u r ea su s u a l f i n a l l y , w eu s e t h eg d af e a t h e re x t r a c ta l g o r i t h mt or e d u c et h ef a c ei m a g ed i m e n s i o na n dc h o o s ea v e r a g e m e t h o dt of u s i o nr e s u l t so u tp u tb ye v e r yc l a s s i f i c a t i o n i ta l s oe n h a n c e st h er o b u s to ft h e a l g o r i t h m b yt h es t r a t e g ym e n t i o n e da b o v e ,w ee n h a n c e dt h er e c o g n i t i o nr e s u l tu n d e r i n f l u e n c eo f i l l u m i n a t i o ne f f e c t ,a n dm a k et h ef a c ec h a n g el e s se f f e c ta tt h es a m et i m e p r o v e db yt e s t u n d e ro r l ,y a l eba n df e r e t ( d u1 ,d u 2 ) f a c ed a t a b a s e ,t h i sa l g o r i t h mi sa ni n t e g r a t e d e x c e h e n tf a c er e c o g n i t i o nm e t h o d k e yw o r d s :f a c er e c o g n i t i o n ;g a b o rf e a t h e r ;g d a ;a d a b o o s t ;m u l t i c l a s s i f i e r 目录 摘要i a b s t r a c t i i 第一章绪论1 1 1 研究背景和意义1 1 2 研究课题来源2 1 3 国内外研究动态2 1 3 1 国内外研究现状2 1 3 2 人脸识别算法概述3 1 3 3 当前人脸识别算法中的主要问题6 1 4 人脸识别测评数据库介绍:6 1 5 本文的结构安排与创新7 第二章g a b o r 滤波器与g a b o r 特征9 2 1 引言9 2 2g a b o r 滤波器的表示。9 2 3g a b o r 滤波器的特点11 2 4 人脸g a b o r 特征的构建1 2 2 5 人脸g a b o r 特征的性质。1 3 2 5 1 纹理特征明显1 3 2 5 2 光照影响较小1 3 2 5 3g a b o r 特征数据量大、冗余多1 4 2 6 本章小结1 4 第三章基于a t i c r 和广义判别分析的人脸识别1 5 3 1 引言1 5 3 2a t i c r 光照预处理。1 5 3 3 广义判别分析( g d a ) 算法1 7 3 3 1 算法概述1 7 3 3 2g d a 算法步骤1 8 3 4 算法流程图1 9 i i i 3 5 实验结果2 0 3 5 1 实验内容与环境2 0 3 5 2 实验结果2 1 3 6 本章小结2 7 第四章基于加权l g b p h s 的人脸识别算法2 8 4 1 引言2 8 4 2 算法思想与流程框架2 8 4 3 局部g a b o r 二值模式( l g b p ) 3 0 4 4l g b p 直方图序列及其性质分析3 l 4 5 基于l g b p h s 的人脸识别3 3 4 5 1 基于直方图交的l g b p h s 匹配3 3 4 5 2 基于加权的l g b p h s 匹配。3 3 4 6 实验结果。3 5 4 7 特征数据量大小的优化。3 7 4 8 本章小结3 8 第五章基于局部块融合的多分类器方法3 9 5 1 引言。3 9 5 2 算法主要思想3 9 5 3 算法流程框架4 0 5 4 基于a d a b o o s t 的局部块挑选4 1 5 5 多分类器融合。4 4 5 6 实验结果。4 5 5 7 本章小结4 7 总结与展望4 9 参考文献5 2 攻读硕士学位期间所发表的论文5 6 致谢5 7 i v 第一章绪论 第一章绪论 1 1 研究背景和意义 生物特征识别技术是指通过计算机利用人类自身的生理或行为特征进行身份认定的 一种技术。生物特征的特点是人各有异、终生几乎不变和随身携带。这些身体特征包括 指纹、虹膜、掌纹、面相、声音、视网膜和d n a 等人体的生理特征,以及签名的动作、 行走的步态、击打键盘的力度等行为特征。之所以能够作为个人身份鉴别的物证,是因 为它们具有人人都有的普遍性和每人不同的唯一性以及不随年龄而变化的稳定性。 近年来,生物特征识别成为了相关领域专家的研究热点。而作为生物特征识别的重 要组成部分,人脸识别技术的研究也得到了极大的关注。人脸自动识别技术就是利用计 算机分析人脸图像,从中提取有效的识别信息用来辨认身份的技术。它涉及到模式识别、 图像处理、计算机视觉、生理学、心理学及认知学等诸多学科的知识,并与基于其他生 物特征的身份鉴别方法以及计算机人机感知交互的研究领域都有密切联系。 人脸识别技术作为一种可靠便捷的身份认证方法,已经被全世界所关注,尤其在恐 怖袭击事件频发的今天。其主要适用于出入口管理、安防监控、电子商务和电子政务等 各个领域,不但具有不易遗忘和丢失、不易伪造和被盗、可以“随身携带 的使用便捷 等优点,而且具有非接触式主动动态识别,从而降低用户抵制心理的特点,这些都使其 拥有这非常广阔的应用前景。在西方发达国家,人脸识别技术已经相对成熟,在特定的 场所已经投入实际使用。人脸识别系统已广泛应用于海关、机场、边防出入境安检管理、 国家机要部门和事业单位门禁系统、公司考勤系统、手机和笔记本电脑登录、全民证照 系统、刑侦罪犯缉查等等。 在我国,由于智能识别技术起步较晚、经费投入不足等原因,人脸识别技术正处于 初步应用推广阶段,相对落后于西方发达国家。但近几年来,识别算法和相关技术的应 用都发展迅速。目前,一些相对成熟的识别系统有:中国科学院自动化研究所生物识别 与安全技术研究中心的中科奥森人脸识别系统、“十五”攻关项目清华大学电子工 程系人脸综合识别系统、中科院计算所与成都银晨网讯科技有限公司共建的人体生物识 别联合技术实验室所开发的综合生物识别系统等。 中国是一个幅员广阔,人口众多的国家,地区发展不平衡,人口流动性极强。国家 在维护公共安全以及国家安全方面,正面临着严峻的考验。在这个背景下,发展拥有自 主知识产权的人脸识别技术是尤为重要和迫切的。即将到来的2 0 0 8 奥运会更是一个需 华南理工大学硕士学位论文 要人脸识别技术大展拳脚的平台。根据北京奥组委和国家奥运会2 0 0 5 年召开的国际高 层论坛上的发言,北京奥运会安保将启用人脸识别系统。据悉,2 0 0 8 的奥运会期间为 了防止恐怖事件的发生,人脸识别智能监控报警系统的新技术将用于有效解决参会人员 的管理。这些都说明大家已经越来越看好人脸识别技术的应用前景。 综上所述,在现阶段,我国积极发展人脸识别技术是具有重要意义的。而识别算法 作为人脸识别技术的核心与灵魂,则更具有深入研究、探索以及改进的意义,这正是本 文的最大出发点。 1 2 研究课题来源 1 广州市天河区科技计划项目“基于动态人脸识别的身份认证系统 项目编号: 2 0 0 2 xg p l l 2 广州市科技计划项目“人运动跟踪识别预警系统 项目编号:2 0 0 2 xg p l 6 3 广东省自然科学基金“光照无关人脸识别技术研究 编号:0 4 0 2 0 1 3 1 4 广东省科技计划项目“公安出入境相片智能识别系统 编号:2 0 0 4 8 1 0 1 0 1 0 0 7 1 3 国内外研究动态 1 3 1 国内外研究现状 国内外各种研究机构和高等学府都展开了人脸识别技术的前沿研究和探索,并且研 究成果推陈出新,呈现百花齐放的局面。在国际上,比较知名的人脸识别算法研究机构 有:卡耐基梅隆大学、麻省理工大学、马里兰大学、耶鲁大学、南加州大学、英国曼 切斯特大学。这些高校是最早进行人脸识别研究,也是成果最为前沿的研究机构。而国 内的众多研究机构,如:清华大学、中科院计算所、中科院自动化所、微软亚洲研究院、 上海交通大学、哈尔滨工业大学、南京理工大学、中山大学等等,也都在这一领域取得 许多骄人的成绩。中科院计算所和微软亚洲研究院等已经推出了实用的人脸识别产品, 部分成果也已步入了国际先进行列。 此外,人脸识别技术也衍生了一些与其相关的识别算法的研究,其中有人脸性别和 种族的识别果1 2 1 、素描人脸的识别3 1 、表情和姿态的识别理解 4 5 1 等等。这些问题的研 究也受到各研究机构的关注。 然而,人脸识别的研究远未可以停止。当前人脸识别技术所遭遇到首要问题就是著 名的p i e 问题:姿态( p o s e ) 、光照( i l l u i n j 舳t i o n ) 和表情( e x p r e s s i o n ) 差异。姿态变化使 得3 d 空间中的人脸在2 d 图像上做出完全不同的投影,可能令重要的器官特征完全消 2 第一章绪论 失;光照变化,特别是强烈的偏光、背光使得人脸图像的能量分布产生严重差异,导致 绝大多数原始的基于子空间方法的失败;表情变化易被单独的解决,但当这种变化与其 他差异结合在一起时,将造成极大的麻烦。此外,人脸随着时间的推移产生的变化、饰 物和发型产生的变化都是不容忽视的问题。 随着各类人脸数据库的完善以及相关评估协议的成熟,大型人脸识别性能测试也已 经多次举行,这些测试包括1 9 9 6 年的f e r e t 测试、2 0 0 0 年和2 0 0 2 的f r v t ( f a c e r e c o g n i t i o nv e n d o rc o n t e s t ) 等。国际上也已经出现了a v b p a 、c v p r 、a f g r 等专门的 人脸识别相关技术的国际会议。这一些人脸识别性能测试和相关会议共同加速了人脸识 别技术的成熟,促进了人脸识别技术商用化的进程。 1 3 2 人脸识别算法概述 经过多年的研究和积累,人脸识别算法不断演变改进,其发展呈现百花齐放的态势。 各种算法相互交叉、融合、借鉴,要对所有的算法理清楚来龙去脉是件困难的事情,但 是我们还是可以根据某种不同的角度来对各种识别算法作一个总结归纳。 我们可以将人脸识别算法分成以下三种: l 、基于全局特征的方法:这些算法往往采用整个人脸的区域作为识别系统的原始 输入,利用整体的匹配度来挑选出最相似的人脸特征。其最具有代表性的是基 于k l 转换的特征提取方法 6 , 7 1 ,同时在不断的改进中,也包括一些基于全局特 征的线性判别8 ,9 1 、神经网络1 0 1 等方法,一般都需要进行一定的全局特征训练。 2 、基于局部特征的方法:这种方法将提取人脸中某一些局部的信息。这些局部信 息可以是某一像素区域的特征,也可以是某一些局部关键点的统计特征,还可 以是人脸局部的几何特征。这些特征将作为识别算法的输入。使用眼睛对、鼻 子、前额等局部像素等作为局部特征的算法也常常见到。这种思路试图强化人 脸的局部五官所携带的信息。这种方法的理由是随着时间的变化,人的五官相 对变化不像脸型那么大,同时一些不必要的脸部妆饰也可以通过分割而去掉。 同时,对于已经规范化的正面人脸图像来说,像素带的分割比特征点定位要容 易。常见的算法有隐马尔科夫模型( h m m ) 【,12 1 3 】。这种方法利用了前额、 眼睛、鼻子、嘴以及下巴的像素带,经过一些投影处理后再进行匹配。但单纯 利用像素带,从根本上还是简单地对人脸的分割,所以对光照也还是非常敏感。 加上完全丢弃了人脸的轮廓,因此在识别准确率上有些应用上反而会所降低。 在这种不利的因素影响下,这种方法对于不同时期拍摄的人脸照片识别也没有 1 华南理工大学硕士学位论文 显示出很大的优势。 3 、综合使用全局和局部特征的方法:这种方法的共同特征是同时使用了所提取的 全局与局部特征作为输入。这个思路无疑是和人类自身的识别机制更为相符 的。因为人类的视觉器官识别一个人,首先是通过对方的轮廓、脸部器官的分 布和拓扑来分析。然后,还要对各个器官具体的形状和分布进行判断。这样才 能得出最准确的答案。p e n t l a n d 等人通过结合特征脸和其他特征模式探索出基 于混合原理的混合人脸识别机制 1 4 1 。从实验表现来看,这比整体的特征脸匹配 或者基于局部结构匹配的方法有所改进。 表1 - 1 人脸识别技术分类与代表性算法 t a b l e l 。1f a c er e c o g n i t i o na l g o r i t h m s z 算法类别代表性算法 :荔 特征脸p c a 算法6 ,7 】 f l d l d a 子空间1 8 , 9 1 整体匹配的方法基于s v m 的二类问题 基于i c a 的特征分析 基于神经网络的概率决策1 0 l 几何特征匹配方法1 8 i 局部特征匹配的方法弹性图形匹配方法 1 9 , 2 0 , 2 1 1 隐马尔科夫模型h m m 方法1 2 ,1 3 】 特征脸和特征模型2 2 1 混和方法混和l f a 局部特征方法2 3 1 可变外观模型2 4 i 在上述的每一个类别中,进一步的细分类是可能的,使用整体特征的特征脸方法 ( p c a ) ,衍生出了许多人脸识别技术:文献【6 】介绍使用最近邻分类器的特征脸方法;文献 【2 5 介绍了基于特征线的方法,方法是把点对点的距离替换成点连接二个样本点的特征 4 第一章绪论 线之间的距离;在文献【8 ,9 】中引入了费沙脸( f i s h e rf a c e ) 的概念,使用费沙线性判别进 行类别分离。此外还有使用贝叶斯概率距离度量的方法冽以及使用支持向量机作为分类 器的s v m 方法f 1 5 】。利用更优化统计特性的独立组件分析( i c a ) 据称比p c a 有更强的特 征提取能力,因而能够比p c a 提供更好的识别性能,这种方法在文献 1 6 加以了介绍。 通过学习能不断进化,神经网络及其学习方法也已经应用到人脸识别中【l0 1 。 不用对脸部特征进行精确定位,隐马尔科夫模型( h m m ) 方法利用了覆盖前额、眼睛、 鼻子、嘴和下巴的象素带,详细的介绍参见文献 1 1 ,1 2 ,1 3 。文献 1 3 】取得了比文献 1 2 】 中更好的效果,它使用j ( l 投影系数来去代替原始像素带,因此可以获得更好的性能。 在局部特征匹配里面最成功的系统之一的是基于d l a 的图形匹配系统【1 1 ,1 2 】。使用一种 基于自行组织图( s o m ) 的无监督学习方法,一个基于卷积神经网络( c n n ) 的系统也被 实现了出来【1 0 i 。 在混和方法的种类中,主要有模型特征脸p c a 和混和p c a 以及混和的l f a 方法【1 4 ,2 3 1 。 虽然在这个范畴中还没提议很多的方法,但我们认为这是一个值得进一步去研究的有趣 领域。 另外,近几年来,与g a b o r 变换相关的人脸识别算法方兴未艾。从整体上说,使用 g a b o r 特征的识别方法在处理光照问题上,比子空间投影方法要得心应手得多。对于一 般甚至光照条件非常不好的图片,就算没有加关照预处理步骤,这些算法都一样能取得 不错的识别效果。可以说,g a b o r 变换基本使得识别光照无关化了。但是怎样更好地利 用g a b o r 特征,这还是一个值得深入研究的问题。今年来常见的g a b o r 相关算法主要有 以下几种方法: 1 、g a b o r 特征子空间降维法。这种方法直接使用全脸的g a b o r 特征,然后直接用各 种子空间算法进行投影,达到降低维度,减轻运算量的目的。比较有代表性的方法参看 文献 2 7 ,2 8 。这种方法用到了几乎全部g a b o r 特征,里面包含着巨大的冗余数据。在子 空间训练上将面临巨大的考验。有许多投影策略在理论上可行,可放到计算机上就发现 需要巨大的硬件和时间开销,就算取得了很好的识别结果,也显得不太实用,应用性不 强。而从实验中我们可以得知,其实我们不需要使用全部的g a b o r 特征,通过子空间 降维以后也能保证较高的识别率。 2 、另外还有基于a d a b o o s t 的g a b o r 识别方法2 9 1 。由于a d a b o o s t 是一个二分类器, 因此不能直接进行分类。他所采取的策略是将两个需要比较的g a b o r 特征先进行相减运 算,然后再对这个相减的结果用a d a b o o s t 去判断他是同类还是非同类。这个方法的训 5 华南理工大学硕士学位论文 练难度较大,而且g a b o r 特征要作为数据存储起来,这样就需要过大的存储空间。因此 在实际应用中是不大现实的。此外,在识别准确率上,效果也不够理想。 1 3 3 当前人脸识别算法中的主要问题 虽然人脸识别已经在识别算法、姿势以及光照处理方面都取得了一些突破。然而, 人脸识别技术的研究远未达到大规模应用的性能要求。由于人脸识别自身对人工智能技 术的高难度要求,目前相关的研究还存在以下一些问题。 首先人脸识别技术所遭遇到的挑战是著名的p i e 问题:姿态( p o s e ) 、光照( i l l u m i n a t i o n ) 和表情( e x p r e s s i o n ) 差异矧。姿态变化使得3 d 空间中的人脸在2 d 图像上做出完全不同 的投影,可能使得重要的脸部特征完全消失;光照变化,特别是强烈的偏光、背光使得 人脸图像的光照能量分布产生严重差异,导致绝大多数原始的基于子空间方法的识别率 下降;表情变化易被单独的解决,但当这种变化与其他差异结合在一起时,将造成极大 的麻烦。此外,人脸随时间的推移产生的年龄变化、饰物和发型的变化都是不容忽视的 问题。 其二是大规模人脸数据库识别率退化的问题。随着数据库集的规模的放大,相似样 本的空间近似概率迅速上升,错误识别率因此提高,造成c r r ( c o r r e c tr e c o g n i t i o n r a t e ) 降低,这就是识别率退化的本质原因。如何更好地研究人脸识别特征提取和分类 算法,使得营造的人脸特征空间分布更加合理,以及如何更好地针对大规模的人脸数据 库做出相关的策略处理,也是人脸识别的研究重点之一。 第三是可供训练和作为数据库的样本过少的问题。在人脸识别的实际应用过程中, 由于采集条件和客观因素的限制,通常对于一个人脸数据库,或因为训练集缺乏,或因 为数据库集样本数目过少( 例如仅有l 幅样本) ,这都不可避免对我们的人脸识别效果 造成影响。目前解决这一些问题的方案包括虚拟样本的引入、人脸图像的重建以及样本 衍生等。 1 4 人脸识别测评数据库介绍 为了评估各种人脸识别和确认算法的性能,国际上出现了几个公认的人脸数据库和 相应的评估协议,包括f e r e t t 3 1 , 3 2 、x m 2 v t s t 3 3 1 以及c m up i e 、y a l e 、u m i s t 、o r l 等等。其中,用于人脸识别的数据库比较有名的应该算f e r e t 人脸识别数据库和o r l 人脸识别数据库以及y a l e 光照数据库。 f e r e t 包含1 1 9 9 个不同的人的1 4 1 2 6 幅人脸图像,人脸采集的时间跨度是1 9 9 3 6 第一章绪论 年8 月到1 9 9 6 年7 月,包含了表情、姿态、光照和采集器材、采集时间的差别。f e r e t 的评估协议既包括了单一输出结论( 检验输出的最接近分类是否正确) 的评估,也包含 了多输出结论( 检验输出的最接近的若干个分类里面是否包含正确答案) 的评估。 o r l 数据库是英国剑桥大学建立的一个小型的人脸识别数据库,数据库总共有4 0 个人,包括表情变化、微小的姿态变化、2 0 以内的尺度变化。通常o r l 数据库被用 来快速评估测试人脸识别的相关算法。 y a l e 数据库是y a l e 大学人脸识别的相关研究机构在实验室内部环境针对光照问题 建立的一个光照人脸数据库。分为a 、b 两个集合,我们常用的b 集合里面包含了l o 个 人,每个人在5 种不同的光照环境下各有6 4 幅图片。每一幅图片的光照环境是根据点 光源与摄像头所成的水平和垂直角度构造而成的。作为标准的光照人脸数据库,y a l e 数据库被大量应用于人脸识别相关的光照纠正算法的评测。 s c u t l 0 6 光照数据库是我们在实验室内部环境针对光照问题专门建立的大规模人脸 图像光照数据库。数据库所有的图像采集自摄像头,共有1 0 6 个人,每人在a 、b 、c 三 类光照条件下各有数十幅表情、姿态各异的图像。其中,a 类光照均匀正常;b 类有侧 光,光线较为阴暗;c 类侧光严重,光线阴暗恶劣。 随着各类人脸数据库的完善以及相关评估协议的成熟,大型人脸识别性能测试也已 经多次举行,这些测试包括9 6 年的f e r e t 测试 3 1 , 3 2 】、2 0 0 0 年和2 0 0 2 的f r v t ( f a c e r e c o g n i t i o nv e n d o rc o n t e s t ) 等。国际上也已经出现了a v b p a 、c v p r 、a f g r 等专门的 人脸识别相关技术的国际会议。这一些人脸识别性能测试和相关会议共同加速了人脸识 别技术的成熟,促进了人脸识别技术商用化的进程。 1 5 本文的结构安排与创新 本章论述了人脸识别算法研究的意义主要是能提供一种便捷可靠的生物认证方法, 并且具有不易遗忘、丢失和被盗的优点。其将促进人脸识别技术的应用,广泛用于出入 管理、安防、电子认证等领域,发展了自主知识产权技术。目前国际上知名的研究机构 的研究特点在于最早进行人脸识别算法研究,且其研究成果多数是最前沿的;而国内知 名研究机构虽然起步较晚,但进步很快,在某些特点领域其研究成果已步入国际先进之 列。在识别方法概述中,本章按照基于全局特征、基于局部特征、综合局部特征和全局 特征的分类方式对以往的主流识别方法进行了总结归纳,并阐述了当前人脸识别算法中 的主要问题,介绍了当前常用的人脸测试数据库。 7 华南理工大学硕士学位论文 本文后续章节的安排如下: 第二章将介绍g a b o r 滤波器以及g a b o r 变换等相关的内容。给出g a b o r 特征的计算 方法以及g a b o r 特征的性质。并说明为什么要选用g a b o r 特征作为算法的基础。 第三章则给出了融合的a t i c r 光照预处理的g d a 算法的原理和计算过程以及它与 其他基于子空间识别方法在各种人脸识别测试中的优势。 第四章将介绍一种基于g a b o r 特征和直方图序列的l g b p h s 算法,并对该方法的 数据量做了压缩改进,使得保持了高识别率的基础上减少了数据量。 第五章着重介绍了通过a d a b o o s t 算法挑选局部块,并采用多个人脸局部块g a b o r 特征和g d a 特征提取方法相结合的一种新型人脸识别算法。 最后是全文的内容总结,并提出了下一步研究工作的思路。 本文的主要创新: 1 将a t i c r 光照预处理和g d a 特征提取方法结合用于人脸识别,相比其他子空 间方法,拥有更好的人脸识别正确率,特别是在光照鲁棒性上有所提高,要求 的训练样本数较少: 2 对基于g a b o r 的加权l g b p h s 识别算法进行改进,在保持高识别率的基础上 减少了最终保存的特征数据量,提高了该算法的实用性; 3 结合a d a b o o s t 算法挑选g a b o r 特征的局部块,提出了一种新的基于局部块 g a b o r 特征和g d a 特征提取的多分类器算法,达到了较好的综合人脸识别效 果,特别是在不同时期、数据库样本数少等复杂人脸识别测试中效果提高明显。 8 第二章g a b o r 滤波器与g a b o r 特征 第二章g a b o r 滤波器与g a b o r 特征 2 1 引言 g a b o r 函数实际上是高斯函数在频域中的平移。该函数是由g a u s s i a n 函数经过复正 弦调制后生成的,是唯一能够到达测不准关系下界的函数,它能够很好地同时在时域和 频域中兼顾对信号分析的分辨率要求。g a b o r 函数的这一特性在信号处理中得到广泛的 应用。二维g a b o r 函数较好地描述了哺乳动物初级视觉系统中一对简单视觉神经元的感 受特性。 d a u g m a n 在8 0 年代最早将g a b o r 特征用于计算机视觉领域。g a b o r 特征直接从灰度 值图像中提取,已经广泛并成功的应用于纹理分割、手写数字识别和指纹识别上,也慢 慢的开始引入到人脸识别方法的研究中。在这一章里,将会主要介绍g a b o r 滤波器、g a b o r 特征的计算和特点以及人脸g a b o r 特征的构建。 2 2g a b o r 滤波器的表示 g a b o r 变换属于加窗傅立叶变换,g a b o r 函数可以在频域不同尺度、不同方向上提 取相关的特征2 7 2 8 1 。二维g a b o r 函数可以表示为: 、l ,( 训,w o , o ) = 寺e - ( ( x c 。s o + y s i n o ) 2 + ( - x $ i n o + y c o s o ) 2 ) 2 矿2 x i ( o _ b x c o s o + w o ys i n o ) _ e - ( 0 0 2 0 2 2 】( 2 - 1 ) 这也就是我们常说的g a b o r 核函数( g a b o rk e r n e l ) 。 其中,是根心频率,0 是g a b o r 小波的方向变量,仃是高斯方程的标准差。 仃= k l a ) o ,其中 k = 瓜( 貉) ( 2 - 2 ) 矽是倍频,i g 罩_ l r 矽= l ,这样的话,a = k c o o = n r w o ,取魂= 至2 ,砖2 瓦, g 万, 积= ;,簖= 孟若,鹾= 詈五个根心频率。秒从。开始均匀地取八个方向,间距为刀8 。 这样就有4 0 个不同频率、不同方向的核函数。 9 华南理工大学硕士学位论文 量 :,沁一 ,n n 互 气鼻i 石 一一j n 彬; 一x 、一 v 坤; : :, o 图2 ig a b o r 核函数空间域示意图 f i g 2 1g a b o r f i l t e rf u n c t i o n ss p a t i a ld o m a i ns a m p l e f i g 2 - 2g a b o rf i l t e rf u n c t i o

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论