(控制理论与控制工程专业论文)基于混合核函数支持向量机的人脸识别方法研究.pdf_第1页
(控制理论与控制工程专业论文)基于混合核函数支持向量机的人脸识别方法研究.pdf_第2页
(控制理论与控制工程专业论文)基于混合核函数支持向量机的人脸识别方法研究.pdf_第3页
(控制理论与控制工程专业论文)基于混合核函数支持向量机的人脸识别方法研究.pdf_第4页
(控制理论与控制工程专业论文)基于混合核函数支持向量机的人脸识别方法研究.pdf_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

武汉科技大学硕士学位论文第1 页 摘要 支持向量机( s u p r av t o rm a c h i n e ,s v m ) 是在统计学习理论上发展起来的一种新型 机器学习方法,用于解决模式识别领域中小样本、非线性、超高维等问题,在处理泛化 性能和学习性能等方面表现出明显的优势,是一种强有力的分类工具。近年来,基于支 持向量机的人脸识别是非常活跃的研究课题和科技热点之一。 本文从人脸识别的基本原理和系统构成出发,重点研究了运用核独立成分分析方法 实现人脸特征提取的方法,以及混合核函数支持向量机人脸识别技术。 首先介绍了人脸识别技术、发展状况及系统构成,然后在详细介绍独立成分分析方 法的基本原理的基础上,给出了核独立成分分析方法,并用于实现人脸特征提取。最后 重点研究了支持向量机方法和核函数方法,为了满足全局性和局部性、泛化性能和学习 性能的要求,构造出一种新的混合核函数,并针对人脸识别的多分类和非线性等问题, 将混合核函数与支持向量机方法相结合,实现人脸分类识别。 通过在o r l 人脸数据库和y a l e 人脸数据库上进行实验验证了算法的有效性。实验 结果表明将c a 用于人脸特征提取能较好地克服光影以及角度变化的影响,具有良好 的非线性适应能力,基于混合核函数s v m 的人脸分类识别效果优于其他分类识别方法。 关键词:人脸识别;支持向量机( s ) ;独立成分分析( i c a ) ;核函数;特征提取 第1 i 页武汉科技大学硕士学位论文 a b s t r a c t s u p p o r t v e c t o rm a c h i n ei san e wm a c h i n e l e a r n i n gm e t h o dd e v e l o p e do ns t a t i s t i c s l e a r n i n gt h e o r y i ti s u s e dt or e s o l v et h ep r o b l e m ss u c h8 8 s m a l l - s a m p l e s ,n o n l i n e a ra n d h y p e r - h i g hd i m e n s i o ni np a t t e r nr e c o g n i t i o nd o m a i n a n di ts h o w so u t s t a n d i n ga d v a n t a g e si n t r e a t i n gg e n e r a l i z a t i o na n dl e a r n i n gp e r f o r m a n c e s i ti sac o g e n tc l a s s i f i c a t i o ni n s t r u m e n t 1 1 1 e f a c er e c o g n i t i o nb a s e do ns u p p o r tv e c t o rm a c h i n ei so n eo ft h ea c t i v er e s e a r c ht o p i c sa n d h o t s p o to f s c i e n c ea n dt e c h n o l o g yi nr e c e n ty e a r s t h eb a s i ct h e o r ya n ds y s t e mc o m p o s i n go ff a c er e c o g n i t i o nw e r ei n t r o d u c e df i r s t l yi nt h i s p a p e r t h e nt h em e t h o do fk e r n e li n d e p e n d e n tc o m p o n e n ta n a l y s i su s e d i nf a c ef e a t u r e s e x t r a c t i o na n dt h ef a c er e c o g n i t i o nt e c h n o l o g yo fm i x t u r ek e r n e l s f u n c t i o ns v mw e r e e m p h a s i z e d f i r s t l y , w ei n t r o d u c e dt h ef a c er e c o g n i t i o nt e c h n o l o g y , d e v e l o p m e n t a ls t a t u sa n ds y s t e m c o m p o s i n g t h e n t h em e t h o do fk i c aw h i c hw a si m p l e m e n t e di nf a c ef e a t u r e se x t r a c t i o n w e r ep r e s e n t e da f t e rt h em e t h o do fi c aw e r ei n t r o d u c e dd e t a i l e d i nt h ee n d ,t h em e t h o do f s v ma n dk e r n e lf u n c t i o nw e r es t u d i e d p a r t i c u l a r l y t o o b t a i nt h el o c a la n dg l o a b a l , g e n e r a l i z a t i o na n dl e a r n i n gp e r f o r m a n c e sq u i r e d ,w ec o n s t r u c t e dan e wm i x t u r ek e r n e l s f u n c t i o nw h i c hw ec o m b i n e dw i t hs v mm e t h o dt o i m p l e m e n tf a c ec l a s s i f i c a t i o n a n d r e c o g n i t i o ni na c c o r d a n c ew i t h t h ep r o b l e m so fm u l t i c l a s s i f i c a t i o na n dn o n l i n e a ri nf a c e r e c o g n i t i o n 。 ,n l ef e a s i b i l i t yo ft h ea l g o r i t h mw a sd e m o n s t r a t e db ye x p e r i m e n to no r lf a c ed a t a b a s e t h ee x p e r i m e n t a lr e s u l t ss h o w e dt h a tk i c au s e di nf a c ef e a t u r e se x t r a c t i o nc a l lb e t t e r o v e r c o m et h ee f f e c to fl i g h ta n ds h a d ea sw e l la sa n g l e sv a r i a t i o n ,a l s ow i t hae n c o u r a g i n g a d a p t i v ea b i l i t yo fn o n l i n e a r 劢ee f f e c to f t h ef a c ec l a s s i f ya n dr e c o g n i z em e t h o d sb a s e do n m i x t u r ek e r n e l sf u n c t i o ns v mw a sm u c hb e t t e rt h a no t h e r s k e y w o r d s :f a c er e c o g n i t i o n ;s u p p o r t v e c t o r m a c h i n e ( s v m ) ;i n d e p e n d e n tc o m p o n e n t a n a l y s i s ( i c a ) ;k e r n e lf u n c t i o n ;f e a t u r ee x t r a c t i o n 武汉科技大学 研究生学位论文创新性声明 本人郑重声明:所呈交的学位论文是本人在导师指导下,独立进行研 究所取得的成果。除了文中已经注明引用的内容或属合作研究共同完成的 工作外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。 对本文的研究做出重要贡献的个人和集体,均己在文中以明确方式标明。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 论文作者签名:超! 越趑日期:2 骂丕三。 研究生学位论文版权使用授权声明 本论文的研究成果归武汉科技大学所有,其研究内容不得以其它单位 的名义发表。本人完全了解武汉科技大学有关保留、使用学位论文的规定, 同意学校保留并向有关部门( 按照武汉科技大学关于研究生学位论文收录 工作的规定执行) 送交论文的复印件和电子版本,允许论文被查阅和借阅, 同意学校将本论文的全部或部分内容编入学校认可的国家相关数据库进行 检索和对外服务。 论文作者签名: 指导教师签名: 日 武汉科技大学硕士学位论文第1 页 第一章绪论 1 1 人脸识别技术概述及研究意义 以计算机数据处理方式,按人体一个或多个生物部位的不重复特征而进行个体识别 的生物识别技术已经随着计算机技术的日益普及和人们对安全验证控制的广泛需求,以 其独有的“与人不可分割的安全特性得到了极大的发展和应用。生物识别主要包括: 指纹识别、虹膜识别、掌纹识别、步态识别、笔迹识别、声纹识别以及人脸识别等。 人脸识别技术作为生物识别技术的一种,具有良好的互异性、不变性和主体永不分 离性以及非侵犯性等特性,与其它生物特征识别技术相比,在实用性上具有独到的技术 优势,这主要体现在以下四个方面:首先,可以隐蔽操作,尤其适用于安全监控。这一 点特别适用于解决重要的安全问题,比如罪犯监控与网上抓逃等,这是指纹、虹膜、视 网膜等其他人体生物特征识别技术不能比拟的。其次,对目标进行非接触式采集,没有 侵犯性,不会对用户造成生理上的伤害,另外也比较符合一般用户的习惯,可交互性强, 容易被大多数的用户接受,可以大大提高系统的可靠性和可用性。再次,该系统具有方 便、快捷、强大的事后追踪能力。基于面像的身份认证系统可以在事件发生的同时记录 并保存当事人的面像,从而可以确保系统具有良好的事后追踪能力。例如,用于考勤系 统时,管理人员就可以方便的对代打卡进行事后监控和追踪;这是指纹、虹膜等生物特 征所不具有的性质( 一般人不具备指纹、虹膜鉴别能力) 。最后,图像采集设备成本较低。 目前,中低档的u s bc c d c m o s 摄像头价格已经非常低廉,基本成为标准的外设,极 大的扩展了其实用空间;另外,数码相机、数码摄像机和照片扫描仪等摄像设备在普通 家庭的日益普及进一步增加了其可用性。目前,人脸识别技术已广泛应用于证件检验、 身份识别以及监视、安全检查等方面。 由于人脸是由复杂的三维曲面构成的可变形体,很难用精确的数学模型描述,且人 脸图像受各种成像条件的影响,诸如表情、姿态、尺度、光照和背景等的大幅度变化等 使得计算机人脸自动识别成为一项极难、极富挑战性的课题,同时人脸识别技术涵盖了 认知科学、图像处理、计算机图形学、机器视觉和模式识别等多个研究领域,具有较高 的研究价值和广阔的发展前景。因此近年来众多高校、研究所及商业机构在人脸识别技 术领域表现出了极高的兴趣和关注。 1 2 人脸识别的发展与现状 人脸识别的研究历史比较悠久。高尔顿( g a l t o n ) 【1 1 _ 9 在l8 8 8 年和1 9 1 0 年就分别在 ( ( n a t u r e ) ) 杂志发表了两篇关于利用人脸进行身份识别的文章,对人类自身的人脸识别能 力进行了分析。 按照时间来分,人脸识别的发展大致经历了三个阶段: 第一阶段:19 6 4 年至1 9 9 0 年。这一阶段是以b l e d s o e t 2 】的工作为开端的,也可将其 第2 页武汉科技大学硕士学位论文 视为真正自动人脸识别研究的开端。他在1 9 6 4 年提出了一个基于人脸直观特征的半自动 人脸识别系统。而后k e l l y l 3 】采用了最近邻分类法在b l e d s o e 的框架之上做了改进,不需 要人的干预。七十年代是人脸识别的第一次研究高潮,比较有代表性的工作有k e l l y 和 k 锄a d e 【4 】的两篇博士论文,k a n a d e 设计了一个高速且有一定知识导引的半自动回溯识别 系统,创造性地运用积分投影法从单幅图像上计算出一组脸部特征参数,再利用模式分 类技术与标准人脸相匹配。 第二阶段:1 9 9 0 年至1 9 9 7 年。t u r k 和p e n f l a n d 于1 9 9 1 年提出了基于k - l 变换的特 征脸方法【5 1 ,纯粹从概率的角度来考虑人脸识别问题。w e l s h 在1 9 9 2 年使用该方法来进 行人脸特征编码。洪予泉( 1 9 9 2 年) 和杨静宇( 1 9 9 4 年) 是最早提出代数特征抽取方法的, 该方法认为图像的代数特征反映了图像的内在属性,提出了人脸图像的奇异值特征【6 】。 在这一阶段中,基于几何特征、最佳鉴别准则、s v d ( 奇异值分解方法) 、2 d d c f 特征提 取、图像序列的人脸识别方法相继得到发展,也逐渐将小波变换、隐马尔可夫模型( h m m ) 应用在人脸识别研究中。独立成份分析( i c a ) 概念是c o m o n 于1 9 9 4 年提出的,并且 h y v a r n e r 和k a r h u m e n 于1 9 9 7 年提出了不同的i c a 算法【7 】。 第三阶段:1 9 9 8 年至今。近年来,人脸识别的算法研究不断出新,并取得了长足的 进步。s c h o l k o p f b 等人在1 9 9 9 年提出非线性子空间法【5 】,通过引入核函数,在不提高计 算复杂性的条件下,将人脸图像由原始空间非线性映像到一个高维的特征空间,从而更 有利于模式的分类。2 0 0 0 年左右以来,研究方法从线性子空间向非线性子空间过渡成为 一种趋势。微软亚洲研究院f a c eg r o u p 在其研究报告中指出,线性子空间分析法与传统 方法相比,有着基于事例、特征学习、维数降低和降低线性映射空间的特点,而非线性 子空间分析法则具有更加有效建模和固有特征维发现的特点。在这一阶段中,随着高速 度、高性能计算机的发展,人脸模式识别方法有了较大的突破,提出了多种机器全自动 识别系统。人脸识别研究得到了前所未有的重视,除了基于k - l 变换的特征脸方法与奇 异值特征为代表的代数特征方法取得了新进展外,人工神经网络、小波变换等在人脸识 别的研究中都被广泛地应用,出现了不少新方法。 目前,国际上对人脸识别的研究越来越深入和广泛,发表有关论文的数量也大幅增 长,e i 可检索到的相关文献多达数千篇,i e e e 的a m i 汇刊还于1 9 9 7 年7 月出版了人脸 识别专辑,著名的国际学术会议有a f g r ( p r o c e e d i n go fi n t e r n a t i o n a lc o n f e r e n c eo n a u t o m a t i cf a c ea n dg e s t u r er e c o g n i t i o n ) ,a v b r p ( p r o c e e d i n go fi n t e r n a t i o n a lc o n f e r e n c e s o na u d i oa n dv i d e o b a s e dp e r s o na u t h e n t i c a t i o n ) 。为促进人脸识别技术的深入研究和实用 化,美国国防部还发起了人脸识别技术工程( f a c er e c o g n i t i o nt e c h n o l o g y ,f e r e t ) ,包括 一个通用人脸图像库和一套通用测试标准,用于定期对各种人脸识别算法进行性能测试。 另外一个著名的人脸识别技术工程是英国的x m 2 v t s 。其它国外著名的人脸识别技术研 究机构有i t 、c m u 、m s u 、r u b 等【引。 国内对人脸识别领域的研究起步较国外晚,目前已有清华大学、上海交通大学、华 中科技大学、北京工业大学、中国科学院计算技术研究所和中国科学院自动化研究所等 武汉科技大学硕士学位论文第3 页 科研机构拥有专业人员从事与人脸识别技术相关的研究,并已取得了可喜的成果,如由 中科院计算所等开发研制的“面向检测与识别核心技术力已用于党的十六大代表的身份 验证【9 】。国内还有一些公司和部门推出基于人脸识别的智能监控系统,如f a c e l t 等已在机 场安检系统投入。随着人脸识别技术研究的扩展,一些最新的技术和方法也被应用到解 决人脸识别问题当中,新方法、新技术层出不穷。 1 3 独立成分分析方法综述 独立成分分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 方法是近几年来发展起来的用 于解决盲源信号分离( b l i n ds i g n a ls e p a r a t i o n ,b s s ) 的一种基于信号高阶统计特性的分析 方法。独立成分分析最初可以追溯到d a r m o i s 在上世纪5 0 年代和r o g e r 在6 0 年代的工 作,他们最先考虑了随机变量在线性结构下的性质【l o 】。j u t t e n 和h e r a u l t ( 1 9 9 1 ) 首先在其文 章中提出了i n d e p e n d e n tc o m p o n e n t sa n a l y s i s ( i n c a ) 这个概念,其最初的目的是为了解 b s s 问题。i n c a 后来被统一地称为i n d e p e n d e n tc o m p o n e n ta n a l y s i s ( i c a ) ,并且成为b s s 问题的代名词,至此之后i c a 与b s s 的发展几乎是同步进行的【l 。 在统计独立性的假设下,i c a 对观测到的多路混合信号进行盲分离,以期较好的分 离出隐含在混合信号中的独立源信号。i c a 的目的是确定出某种变换,以保证输出信号 各分量尽可能的相互独立,使其非高斯性达到最大。i c a 着眼于数据问的高阶统计特性, 能全面揭示数据间的本质结构,i c a 在信号处理领域受到了广泛的关注。国外许多学者 都投入到i c a 的理论和应用研究中,许多大学都建立了专门研究i c a 的研究组,机器学 习、统计信号处理、神经网络等方面的期刊有许多有关i c a 的理论与应用研究的进展情 况,从1 9 9 9 年开始已举行了五届关于i c a 的国际会议,每年都有新的理论和应用方面的 论文发表。i c a 方法己应用在许多领域,如:信号处理、生物医学、分子学、电子通信、 声音处理、航天物理、纹理结构等,并且取得了很大的应用成功。 1 4 支持向量机综述 支持向量机( s u p p o r tv e c t o rm a c h i n e ,s v m ) 法是2 0 世纪9 0 年代贝尔实验室研究人员 v a p n i k 等人提出的一种新型的机器学习方法。它是在统计学习理论( s t a t i s t i c a ll e a r n i n g t h e o r y , s l t ) 的基础上发展起来的,它使得统计学习理论第一次对实际应用产生重大影 响。s v m 是模式识别领域解决小样本、非线性及超高维问题的一种强有力的分类工具, 在基于结构风险最小化原理( s t r u c t u a lr i s km i n i m i z a t i o ni n d u c t i v ep r i n c i p l e ,s r m ) 上,在分 类器的容量和训练误差之间达到一个较好的平衡,为两种不同类别的样本数据找到一个 最优分类面( o p t i m a lh y p e r p l a n e ) 。 支持向量机不仅能够很好的处理小样本问题,还能很好的工作在高维( 甚至是无穷维) 特征空间,相比于其他分类器,能够很好的处理模式识别中的泛化性能和维数灾难等问 题。自诞生之日起,支持向量机就迅速赢得了众多研究者的亲睐,相关的研究不断增加, 现已成为机器学习领域的标准工具之一。支持向量机集成了机器学习领域的若干标准, 如最大间隔超平面、凸二次规划、松弛变量等技术【1 2 , 1 3 】。 第4 页武汉科技大学硕士学位论文 1 5 论文的研究工作及解决的主要问题 本课题的研究主要分为三个阶段,第一阶段主要是学习人脸识别的主要实现方法以及 支持向量机、独立成分分析的理论;第二阶段主要是各种主要算法的比较研究与仿真实 验;第三阶段是基于核独立成分分析方法的人脸特征提方法的实现以及基于混合核函数 支持向量机的人脸识别算法的仿真测试。 本课题拟解决的关键问题:基于核独立成分分析方法的人脸图像特征提取设计与实 现;支持向量机中核函数和核参数的构造和选择;混合核函数支持向量机在人脸识别中 的应用。 1 6 论文的组织结构 第一章为绪论部分,简要介绍了人脸识别的研究内容及发展、独立成分分析方法和 支持向量机的主要内容以及本文的工作介绍。第二章介绍了人脸识别的相关理论、方法 和标准。第三章重点介绍了独立主成分分析方法和支持向量机的基本理论以及改进算法。 第四章为本文的实验部分,包括人脸图像预处理、人脸特征提取、人脸识别分类的实现 以及混合核函数算法的作用分析。第五章为本论文的总结与展望。 1 7 资助本课题的专项研究基金 本论文先后得到以下专项研究基金的共同资助,特此致谢: 国家自然科学基金:低雷诺数气动特性与微机电系统控制的多学科优化设计研究( 项 目号:5 0 6 7 5 1 6 1 ) : 湖北省国际科技合作重点研究项目:基于网络化智能体架构的微小型光机电系统( 项 目号:2 0 0 6 c a 0 2 5 ) 。 武汉科技大学硕士学位论文第5 页 第二章人脸识别技术 2 1 人脸识别基本理论 人脸识别技术( f a c er e c o g n i t i o n ) 是利用计算机对人脸图像进行特征提取和识别的模 式识别技术【1 4 1 。其研究内容从广义上讲大概包括人脸检测( f a c ed e t e c t i o n ) 、人脸表征( f a c e r e p r e s e n t a t i o n ) 、人脸鉴别( f a c ei d e n t i f i c a t i o n ) 、表情分析( f a c i a le x p r e s s i o n g e s t u r e a n a l y s i s ) 、物理分类( p h y s i c a lc l a s s i f i c a t i o n ) ,它涉及到模式识别、图像处理、计算机视觉、 统计学习、人工智能、计算机图形学和认知科学等学科,与基于其他生物特征的身份鉴 别方法以及计算机人机感知交互领域都有密切联系。 人脸识别系统包括两个主要的技术环节,首先是人脸的检测和定位,即从输入图像 中找到人脸存在的位置,并将人脸从背景中分割出来( 即人脸检测) ,然后是对人脸图像进 行特征提取与识别( 即人脸表征与人脸鉴别) 。相对来说表情姿态分析和物理分类则是一个 非常困难的研究方向,不过它们在计算机图形学( 尤其是计算机动画) 领域有很广泛的应用 前景,因此在最近几年也得到了国内外很多从事计算机视觉的研究人员的注意。本论文 研究的是待识别的人脸与数据库中的已知人脸之间的匹配问题,属于狭义的人脸识别方 法,不涉及表情分析和物理分类方面。人脸自动识别系统包括两个主要技术环节,如图 2 1 所示: 图2 1 人脸识别系统的构成 人脸检测是指在一幅给定的图像中,采用一定的方法对其进行搜索以判断图像中有 无人脸,如果存在人脸,则把人脸标定出来,同时得到人脸的数目、位置、大小、姿态 等信息。人脸检测系统的输入是可能包含人脸的图像,输出是图像中是否存在人脸的判 断和人脸的标定以及数目、位置、大小等信息的参数化描述。这方面的研究主要受光照、 噪声、面部倾斜度以及各种各样的遮挡的影响。找到一些相关的算法并能在应用过程中 达到实时,将为成功构造出具有实际应用价值的人脸识别系统提供保证。 人脸特征提取是人脸识别过程的重要环节,也是机器学习、模式识别中的重要研究 内容之一,其基本任务是如何从许多特征中找出那些最有效的特征【l5 1 。人脸特征提取又 称人脸描述,是在基于人脸检测定位、归一化等图像预处理的基础上进行人脸各特征提 取的过程,也是对人脸进行特征建模的过程,建立的特征模型主要用于区分各人脸之间 的差异性,为人脸分类识别打下基础。特征提取一般利用人脸的先验知识进行特征辨别, 但在实际应用中,常常因受成像条件和噪声的影响,如复杂背景、光照变化、头发遮挡、 胡须、眼镜遮挡等,使得准确提取人脸特征比较困难,针对这些干扰因素,人脸特征提 取的方法众多,主要有基于几何形状的、基于特征脸的、基于局部特征的、基于弹性模 第6 页武汉科技大学硕士学位论文 型的和基于神经网络的方法等。所提取的特征是具有很好代表性和人脸表征能力的本质 特征,并能有利于分类器的设计,准确提取出具有一定稳定性、不变性、有效性的人脸 特征信息是识别成功的前提。 然而用计算机来实现人脸识别相对于人类大脑识别人脸来说存在着多方面弊端:首 先,人脸特征稳定性较差。尽管面部通常不会发生根本性的变化( 故意整容除外) ,但人脸 是有极强可塑性的三维柔性皮肤表面,会随着表情、年龄等的变化而发生改变,皮肤的 特性也会随着年龄、化妆乃至整容、意外伤害等发生很大变化。其次,相对于指纹和虹 膜等技术人脸识别系统的可靠性、安全性较低。尽管不同个体的人脸各不相同,但人类 的面孔总体是相似的,而且地球上人口如此众多,以致很多人的面孔之间的差别是非常 微妙的,技术上实现完全安全可靠的认证是有相当难度的。最后,采集的图像受各种外 界条件的影响很大。图像的摄制过程决定了人脸图像识别系统必须面对不同的光照条件、 视角、距离变化等非常困难的视觉问题,这些成像因素都会极大影响人脸图像的表观, 从而使得识别性能不够稳定。模拟人类的视觉机制,并进一步构建自动识别系统是一项 非常艰巨的任务。 人脸识别问题的核心是选择适当的人脸表征方式和匹配策略,表征方式一般通过特 征提取实现,匹配策略的选择则需对人脸图像进行训练,构造合适的分类器,基于获取 的人脸相关信息进行分类识别。为此,本文将就人脸特征提取和分类器的选择及构造问 题进行详细的探讨。 基于核技术的人脸识别问题的核心在于选择合适的核函数和核参数,但就目前而言, 在理论上核函数和核参数的构造和选择还缺乏相应的理论指导,对于不同的研究对象, 对核函数和核参数的构造和选择一般采用实验的方法来解决。为此,本文就人脸识别中 核函数和核参数的构造和选择问题进行了探讨。 2 2 常用人脸检测方法 人脸检测的基本思想是用知识或统计的方法对人脸建模,比较所有可能的待检测区 域与人脸模型的匹配度,从而得到可能存在人脸的区域。人脸检测是一切人脸识别系统 的首要和关键的步骤。 人脸检测问题从上世纪六、七十年代被提出至今,已经经历了几十年的研究与发展, 在m i n g h s u a ny a n g 等人的综述文章里,将目前卓有影响的静态图像人脸检测方法分为 四种类别: ( 1 ) 基于知识的方法( k n o w l e d g e b a s e dm e t h o d s ) ( 2 ) 特征不变量方法( f e a t u r ei n v a r i a n ta p p r o a c h e s ) ( 3 ) 模板匹配的方法( t e m p l a t em a t c h i n gm e t h o d s ) ( 4 ) 基于表象的方法( a p p e a r a n c e - b a s e dm e t h o d s ) 2 2 1 基于知识的方法 基于知识的方法就是根据人脸的先验知识导出一组具体的规则来进行人脸检测。这 武汉科技大学硕士学位论文第7 页 类方法将人脸检测问题看作基于规则的判断问题。规则来源于研究人员对人脸局部特征 的分布规律性的先验知识,例如左右对称、五官的比例和其几何位置相对稳定以及各部 位对比度存在固定的容限等。利用这些特征将人类对典型脸的认识编码成一些规则,建 立一系列描述人脸的简单规则。这种方法的特点是一旦规则建立后,可以比较快速地完 成检测识别任务。 基于知识的方法的难点在于建立应用性强、普适性高的规则,规则的定义太严格会 造成人脸漏检现象,太笼统则又会产正误检,将非人脸误判为人脸。此外,人脸数据形 式还受到人脸模式的外在表现,姿态、表情、光照条件等的影响。m g 等设计的联合因 子分析器【1 6 1 ,是一种基于知识的多分辨率方法。该方法先抽样得到原始图像在不同分辨 率下的子图像,组成基本的金字塔体系模型,再逐层利用细粒度不同的检测规则,确认 人脸的候选区域。高一层的检测是构建于低一层的规则之上,针对上一级搜索出来的候 选人脸。规则的严格程度随着分辨率的逐渐精细而加强。这种方法的实验结果并不理想, 所实现的检测系统对不存在人脸的区域有着很高的误检率,输出结果的5 0 幅图像中有2 8 幅并不存在人脸。然而这种方法所引入的由粗到精分层处理的思路可以大大减少检测的 运算量,在后来的很多人脸检测方法都开始加以应用。 2 2 2 特征不变量方法 特征不变量方法的目标是寻找那些即使当姿势、视角和光线条件变化时仍然存在的 结构特征,利用这些特征来检测入脸。一般先通过大样本学习的方法来寻找这种脸部特 征,然后用寻找到的特征去检测人脸。这种特征不变量的方法是自下而上的。 g m f 等提出了在灰度图像中确定人脸特征的方法【1 7 】。该方法首先对图像进行带通滤 波,然后利用形态学处理加强具有高强度和特定形状的区域p 经过处理的图像其直方图 通常具有明显的尖峰。根据尖峰的峰值和宽度确定固定门限,将图像二值化,再把二值 图像中的连通分量作为人脸特征的候选区域。这些候选区域最终还要通过一系列分类器 来核实是否存在人脸。 h m 和l i a o 等【l8 】以眼睛和眉毛为人脸最稳定的特征,提出了一种基于形态学的人脸 检测方法。该方法利用基本的形态学算子将灰度值变化明显的像素提取出来作为眼睛的 类似点,对这些像素点用标记的方法分割出区域,作为用来搜索潜在人脸区域的候选。 再将这些人脸候选区域输入到一个神经网络进行最后的确认。 一般情况下,指导人脸检测的共性信息包括:眼、鼻、口、脸形、边缘等几何特征, 灰度直方图分布、纹理等非直观的特征。肤色具有一定的稳定特性,被证明是人脸检测 的一个有效特征,是近期视觉研究领域的热点。用肤色信息检测人脸的关键是合理选择 色度坐标。常用的方案是将彩色的r ,g ,b 分量归一化。目前人们研究的重点是如何提 取彩色的色度信息,即将r ,g ,b 彩色空间转化为其他彩色空间,来突出色度信息,梁 路宏等【l9 】提出了关于选择色度空间的两条准则:( 1 ) 在该色度空间中能否用给定的模型描 述“肤色 区域的分布;( 2 ) 色度空间中“肤色 与“非肤色”区域的重叠有多少。其中 第二条准则被公认为是限制检测性能的最重要的方面【2 们。其他彩色模型主要有y u v , 第8 页武汉科技大学硕士学位论文 y i q ,x y z ,y c r c b 等。这种方法的最大优点是对姿态变化不敏感。 利用肤色特征检测出来的人脸区域可能不够准确,许多颜色和肤色相似的物体都会 被检测出来,而且利用肤色特征进行人脸检测受光线影响特别大。但如果在整个系统中 作为人脸检测的粗定位环节,它具有直观、快速、简单等优点,可以为后面进一步的精 确检测创造良好的条件,以达到最佳的系统性能。 无论眼睛、眉毛、嘴还是肤色,在实际应用中都有着自己的局限性。使用任何单一 的特征都无法完整地描述人脸。因此目前多数方法都融合了若干个特征联合进行检测。 通常做法是利用肤色、脸的轮廓等全局特征( 对视频序列还可以利用运动信息) 确定人脸的 候选区域,再用局部的细节特征( 如眼睛、眉毛) 进行人脸的确认。 2 2 3 模板匹配的方法 基于模板匹配的方法需要预先建立一个标准的人脸模板。人脸模板的建立是模板匹 配法的关键。人脸模板的好坏对整个检测算法具有决定性的意义。一般采用正面的人脸 图像作为这个标准人脸,相关的参数则由人工设置或利用函数式表达。检测过程中计算 输入图像和模板之间的相关系数,常用的特征包括脸的轮廓、眼睛、嘴、鼻子等,预设 门限值,当计算出的相关系数超过了此预设值,则认为判断该位置存在人脸。模板匹配 的方法主要有以下两种方法: 1 预定义模板法 预定义模板法根据人脸的先验知识先设计出一个标准的人脸模板,包括人脸轮廓模 板和各个器官特征的子模板,然后用窗口缩放的方法对一幅输入图像进行全局搜索,对 应不同尺寸的图像窗口,计算它们与人脸轮廓模板的相关系数,通过预先设定的闽值来 判断该图像窗口中是否包含人脸候选区域,最后利用器官特征子模板进一步检测人脸候 选区域是否包含人脸。这种方法的缺点在于:由于人脸特征的变化较大,所以很难得到 有效的模板来表示人脸的共性。当得到固定的模板以后,也无法有效处理姿态的变化。 这种方法目前已经很少单独使用了,只是在某些系统中为了降低后续的检测复杂性,将 其作为粗检测或预处理的手段。 2 可变形模板 当预定义模板法无法满足人脸检测的要求时,研究者们开始研究和使用可变形模板, 现在使用的模板匹配方法一般都是基于可变形模板的。这种方法的主要思想是定义一个 人脸的可变形参数模板和一个能量函数来描述人脸特征,通过非线性最优化方法求得使 能量函数取值最小的参数模板,此参数模板即被认为是所求人脸特征的描述。该方法的 优点是充分考虑到人脸是变形体的特点,较之预定义模板法更加稳定可靠,而且与姿态 和光照无关,缺点是存在能量函数的系数难以适应一般情况和计算量巨大的问题。 2 2 4 基于表象的方法 基于表象的方法的模型是从一系列具有代表性脸部表观的训练图像学习而来,与模 板匹配相比,其参数来源依靠的不是经验。基于表象方法的模型,是可以随着样本库的 武汉科技大学硕士学位论文第9 页 完备而逐渐改善的。一般而言,基于表象的方法利用统计分析和机器学习技术来寻找人 脸和非人脸的有关特征。经过大量学习后总结出的特性以分布模型或者判别函数的形式 表示,再利用这些模型或函数来检测人脸。基于表象的方法的流程图如图2 2 所示: 离 线 训 练 图2 2 基于表象的方法流程图 现在多数人脸检测方法都采用基于表象的方法,其主流方法主要有: 1 人工神经网络( a n i f i c i a ln e u r a ln 咖o r k ,a n n ) 人工神经网络是基于表象的方法中最具代表性的方法。人工神经网络的数学模型是 把模式的统计特性隐含在人工神经网络的结构和参数之中,即人工神经网络通过自学习 功能从大量人为给定的图像样本和相应检测结果中识别人脸图像,有关人脸模式的统计 信息则隐含于人工神经网络的结构和参数之中。 人工神经网络的代表人物r o w l e ) ,【2 1 】等人采用局部连接的人工神经网络来检测人脸, 设计出基于神经网络的多层感知器。在该系统中,人脸区域被划分为多个矩形子区域, 各个子区域分别对应一个人工神经网络隐含单元。检测时将对神经网络在多个分级上的 输出进行判决以降低误检率,并通过自举的方法不断更新人脸样本,修正分类器参数, 最后将检测器的分类结果输出。 2 隐马尔科夫模型( h i d d 锄m a r k o vm o d e l ,h m m ) 隐马尔科夫模型是主要针对用于人脸识别的头肩部图像的描述信号统计特性的一组 统计模型。它使用马尔科夫链来模拟信号统计特性的变化,通过间接的观察序列来描述 该变化。模型中的节点表示状态,有向边表示状态之间的转移,一个状态可以具有特征 空间中的任意特征,对同一特征,不同状态表现出这一特征的概率不同。由于隐马尔科 夫模型是一个统计模型,因此对于同一个特征序列,可能会对应于许多状态序列,特征 序列与状态序列之间的对应关系是非确定的。这种模型对应于状态序列来说是隐藏的, 故称为隐马尔科夫模型。 在隐马尔科夫模型基础上,n e f i a l l e 2 2 】等人提出了一维连续隐马尔科夫模型和基于嵌 入式隐马尔科夫模型的人脸检测方法【2 3 1 ,实验获得了较好的检测与识别效果。 在线检测 一 _ 第l o 页武汉科技大学硕士学位论文 3 支持向量机( s u p p o r tv e c t o rm a c h i n e s ,s v m ) 最早将s v m 应用于人脸检测的是o s u n a t 2 4 】等人,他们对每一个1 9 1 9 像素的检测窗 口使用s v m 进行分类,以区分人脸和非人脸窗口。h e i s e l e t 等人采用两级s v m 的方法 来检测人脸。根据一些预定义的特征点,从训练集中提取人脸和非人脸图像最有区别的 多个局部区域。检测时,根据多个简单的线性s v m 分别检测各个人脸特征区域,并用一 个简单的线性s v m 检测各个可能的人脸部分的几何组合是否符合人脸结构。相比于将整 个人脸作为特征,该方法获得了更高的检测率。 s v m 是一种基于统计学习理论的模式识别方法。在大量的人脸样本和非人脸样本 上,通过学习算法,选出的位于分界面附近的训练样本,从而得到支持向量。这些支持 向量经过加权后得到的超平面用于基于支持向量机的分类器对人脸向量和非人脸向量进 行分类。s v m 的训练使用了大量人脸样本和由自举方法收集的非人脸样本,并且使用逼 近优化的方法来减少支持矢量的数量。但是,s v m 的训练需要计算复杂度极高的二次规 划问题,这一点限制了该方法的应用。很多学者都在寻找各种方法来解决s v m 训练困难 的问题,并取得了一定的成果【2 5 1 。如今,s v m 正受到研究人员越来越多的重视,应用领 域逐渐被拓宽。 人脸检测是一类复杂的模式识别问题,在图像领域常作为一项单独的课题进行研究。 由于篇幅所限,本文并没有详细探讨人脸检测的相关技术,所用检测对象来自o r l 人脸 图像数据库,该人脸图像数据库将在下一节中介绍。 2 3 人脸图像数据库及性能评价 2 3 1 人脸图像数据库 大部分人脸识别算法都需要数量巨大的人脸图像作为训练数据集,迄今为止已有一 些为人脸识别实验开发的人脸图像数据库。这些人脸图像数据库通常在不同光照条件、 不同尺度、不同头部角度情况下采集相同或不同人的人脸图像,图像可能包含不同的面 部表情。人脸识别领域经常被采用的人脸图像数据库主要有: 1 f e r e t 人脸图像数据库 f e r e t ( f a c er e c o g n i t i o nt e c h n o l o g y ) 数据库由美国a ) a 和a r l 于19 9 3 年至1 9 9 6 年期间建立。库中,总共1 2 0 4 人、1 4 0 5 1 幅多姿态、不同光照条件的欢度人脸图像,并 严格划分了训练集合、g a l l e r y 、不同的测试集合等,是人脸识别领域应用最广泛的人脸 数据库之一,参见: h t t p :w w w i t l n i s t g o v i a d h u m a n i d f e r e t _ m a s t e r h t m l 2 a r 人脸库 本数据库来源于美国p u r d u e 大学。1 2 6 人( 7 6 名男性,6 0 名女性) ,每人2 6 幅,均为 5 7 6 x7 6 8 的彩色图像。全部为正面直立人脸,在严格受控环境下拍摄。该人脸库的介绍 网址为: h t t p :r v l l e c n p u r d u e e d u - a l e i x a l e i x f a c ed b h t m l 武汉科技大学硕士学位论文第1 1 页 3 o r l 人脸数据库 该数据库来源于英国剑桥o l i v e t t i 实验室,总共4 0 个人,每人l o 张图片,图像大小 为1 1 2 x 9 2 像素。单一背景,人的位置并未严格加以控制,部分人的图像摄于不同时期。 该人脸库在人脸识别研究的经常被人们采用,多数系统的识别率均可以达至9 0 以上。 该人脸库的介绍网址为: h t t p :w w w u k r e s e a r c h a t t c o m f a c e d a t a b a s e h t m l 4 y a l e 人脸数据库 由耶鲁大学计算视觉与控制中心创建,包含1 5 位志愿者每人1 1 幅共1 6 5 张正视图, 包含光照、表情和姿态的变化。该人脸库的介绍网址为: h t t p c w y a l e e ( 1 u p r o j e c t s y a l e f a c e s y a l e f a c e s h t m l y a l e 人脸数据库b 则包含了1 0 个人的5 8 5 0 幅多姿态、多光照的图像。其中的姿态 和光照变化的图像都足在严格控制的条件下采集的,主要用于光照和姿态问题的建模与 分析。该人脸库的介绍网址为: h t t p :e v e y a l e e d u p r o j e c t s y a l e f a c e s b y a l e f a c e s b h t m l 5 m i t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论