




已阅读5页,还剩65页未读, 继续免费阅读
(机械电子工程专业论文)基于特定人脸的年龄估计和性别识别研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西南科技大学硕士研究生学位论文第1 页 摘要 性别识别和年龄估计因其在身份认证、人机接口、视频检索以及机器人 视觉中存在潜在的应用,成为当前计算机视觉和模式识别领域中的研究课题 之一,备受关注。但由于性别差异和年龄变化引起人脸形状和纹理上的变化, 导致年龄估计准确率严重下降。为了解决这个问题,本文在国内外现有的性 别识别技术和年龄变化研究的基础上,提出了加入性别识别和混合特征及分 层分类器的人脸年龄估计算法。本文的工作主要包括: ( 1 ) 研究了人脸性别识别的特征提取和分类方法,如局部二进制模式方法 ( l b p ) 、神经网络方法、s v m 方法,以及直接把人脸图像的狄度值作为特 征的性别识别方法。使用支持向量机( s v m ) 分类器,通过实验对2 种常用 的特征提取方法进行比较研究,并在3 种不同核函数下进行比较研究。实验 在一个由f g n e t 、m o r p h 、o r l 、y a l e 、网上收集和实验室自行采集所共同组 成的,包含1 7 ,2 6 1 张人脸的数据库上迸行。 ( 2 ) 提出一种基于局部特征和全局特征融合的人脸面部信息的提取方法, 即主动外观模型、皱纹特征、皮肤特征,来提高年龄估计的准确率。针对因 性别差异在人脸年龄特征表现上引起的差异,先进行自动性别识别来消除因 性别差异带来的影响。主动外观模型作为全局特征;局部特征中,皱纹特征 的提取采用g a b o r 滤波器,皮肤特征的提取采用局部二进制模式方法( l b p ) , 能够提取详细的皮肤纹理。 ( 3 ) 提出一种基于支持向量机( s v m ) 和支持向量回归机( s v r ) 结合的分 层分类器,将融合后形成的特征作为新的特征向量,通过s v m 对其进行年 龄组分类,最后利用s v r 估计出准确的年龄。通过实验证明,该方法具有一 定的有效性和合理性。 关键词:性别识别年龄估计混合特征分层分类器局部 二进制模式方法 西南科技大学硕士研究生学位论文第1 i 页 a b s t r a c t f a c er e c o g n i t i o nt e c h n o l o g yh a sb e e na t t a c h e dg r e a ti m p o r t a n c et ot h e r e s e a r c hf o ri t ss c i e n t i f i cs i g n i f i c a n c ea n dp r a c t i c a lv a l u ei nt h ep a s tf e wy e a r s , a n db e c o m et h e h o t s p o to fp a t t e r nr e c o g n i t i o na n da r t i f i c i a li n t e l l i g e n c e h o w e v e r , t h ea c c u r a c yi na g ee s t i m a t i o nw i l ld e c l i n es h a r p l yd u et ot h eg e n d e r d if f e r e n c e sa n dt h es h a p ea n dt e x t u r ec h a n g ei nt h ef a c ef o rd if f e r e n ta g e t o s o l v et h i sp r o b l e m ,w ec o n s i d e r e dt h eh y b r i df e a t u r e sa n dt h eh i e r a r c h i c a l c l a s s i f i e ra n dt h eg e n d e rr e c o g n i t i o n ,a n db r i n gt h e mi n t of a c i a la g ee s t i m a t i o n a l g o r i t h m w h i c hb a s e do nt h ep r e s e n t g e n d e rr e c o g n i t i o na n da g ec h a n g e r e s e a r c h t h eh i g h l i g h t sa n dm a i nc o n t r i b u t i o n so ft h ed i s s e r t a t i o ni n c l u d e : ( 1 ) i n t h i sp a p e r , w ec o m p a r e dt h o s em e t h o d sw h i c hu s e d i n g e n d e r c l a s s i f i c a t i o n ,i n c l u d i n gl o c a lb i n a r yp a t t e r n ,n e u r a ln e t w o r k ,s u p p o r tv e c t o r m a c h i n e s ( s v m ) ,a n di m a g ep i x e l s a s i n p u t w i t hs u p p o r tv e c t o rm a c h i n e c l a s s i f i e r , t w og e n e r a lf e a t u r ee x t r a c t i o nm e t h o d sa r ec o m p a r e di ne x p e r i m e n t s a n da v e r a g ec l a s s if i c a t i o n a c c u r a c yc o m p a r i s o nw i t hd i f f e r e n tk e r n e l s t h i s m e t h o di se v a l u a t e db yt h er e c o g n i t i o nr a t e so v e ram i x e df a c e d a t a b a s e c o n t a i n i n go v e r 17 ,2 61 i m a g e sf r o m6s o u r c e s ( f g n e t , m o r p h ,o r l ,y a l e , w w wa n dad a t a b a s ec o l l e c t e db yt h el a b ) ( 2 ) t h ee x t r a c t i n gm e t h o do ff a c i a li n f o r m a t i o nb a s e do nt h ef u s i o nm e t h o d o fl o c a lf e a t u r ea n dg l o b a lf e a t u r e ,a st h ea c t i v e a p p e a r a n c em o d e l ,w r i n k l e f e a t u r e ,s k i nf e a t u r e ,t h a tc a ni m p r o v et h ea c c u r a c yo fa g ee s t i m a t i o n a c c o r d i n g t ot h ed i f f e r e n c eo ft h ef a c i a la g ef e a t u r ew h i c hc a u s e db yt h eg e n d e rd i f f e r e n c e , f i r s t l y e l i m i n a t et h e i m p a c t o fg e n d e rd i f f e r e n c e b y a u t o m a t i c g e n d e r c l a s s i f i c a t i o n t h ea c t i v ea p p e a r a n c em o d e li su s e dt oe s t i m a t ea g ea sf a c i a l g l o b a lf e a t u r e s ;t h ew r i n k l ef e a t u r ei se x t r a c t e du s i n gt h eg a b o rf i l t e r sa n dt h e s k i nf e a t u r ei se x t r a c t e du s i n gal o c a lb i n a r yp a t t e r n ( l b p ) ( 3 ) t h eh i e r a r c h i c a lc l a s s i f i c a t i o na l g o r i t h mi sp r o p o s e dw h i c hb a s e do nt h e s u p p o r tv e c t o rm a c h i n ec o m b i n e dw i t ht h es u p p o r tv e c t o rr e g r e s s i o n ,t a k et h e f u s i o na san e wf e a t u r ev e c t o ra n dt h es v mi su s e da st h ec l a s s i f i e ri nt h ea g e g r o u pc l a s s i f i c a t i o ns t e p i nt h ee n d ,t h es v ri su s e dt oe s t i m a t er e a l v a l u e d f u n c t i o n s t h ee x p e r i m e n t a lr e s u l ts h o w st h a tt h i sm e t h o dh a sac e r t a i nv a l i d i t y 西南科技大学硕士研究生学位论文第l i l 页 a n dr a t i o n a l i t y k e yw o r d s :g e n d e ri d e n t i f i c a t i o n ;a g ee s t i m a t i o n ;h y b r i df e a t u r e s : h i e r a r c h i c a lc l a s s i f i e r :l o c a lb i n a r yp a t t e r n 西南科技大学硕士研究生学位论文第l 页 1 绪论 随着计算机技术的日益发展和进步,计算机在人类日常生活中扮演着越 来越重要的角色,也由原来单纯的计算功能向诸如智能化、信息化、数字化 等多功能方向发展。在计算机发展的基础上,越来越多的研究人员将目光投 向了生物特征识别技术,带动了该技术的发展。生物特征技术简言之及通过 人的生理特征和行为特征来进行个人身份信息的认证。一般的生物特征是指: 指纹、虹膜、掌纹、人脸、声音、手势、肢体动作、人耳等。由于人脸信息 采集的友好性和方便性,所以人脸在个人身份的识别和情感等信息的判别上 起着重要作用。我们可以从一张简单的人脸图像上得知很多重要信息,如: 性别、年龄、情感、健康程度、人种、身份等。 随着社会的日益发展,人机交互( h u m a n c o m p u t e ri n t e r a c t i o n ,h c i ) 技 术作为一个独立的研究领域自诞生以来一直影响着计算机科学的发展。随着 技术的不断进步,基于人脸图像的交互技术受到众多学者的重视,如:人脸 检测、人脸识别、人脸属性( 性别、年龄) 的识别等方面。在社会的日常生 活中,人脸属性的识别在预防青少年犯罪的领域有着重要的作用,如:根据 青少年的年龄阶段对其是否有权限浏览一些带有不符合该年龄段浏览的网 页;对于未成年人自动售货机可以不提供烟酒等;对于一些带有不良信息的 电影对未成年人不销售。 基于特定人脸的性别识别与年龄估计主要是指根据输入的人脸脸部图 像首先判别其性别并估计其年龄的模式识别问题,因为男女的生理成长阶段、 衰老的程度不同故提出首先进行相应的性别识别。目前,根据人脸图像判别 性别并进行年龄估计对于计算机依然是一大挑战,而主要的困难在于不同性 别、不同种族、不同健康情况、不同生活方式、不同地域的人其老化的情况 不同。本文是对作者在基于人脸图像的性别识别和年龄估计领域中所做研究 工作的总结,主要研究内容包括人脸检测、人脸性别识别、人脸年龄估计, 同时也涉及到在自动人脸性别识别和年龄估计系统方面的一些思考。 西南科技大学硕士研究生学位论文第2 页 1 1研究背景与意义 人脸的外观伴随着年龄、表情、光照、健康程度等因素的变化而变化。 在人脸识别的过程中,如果能够准确地估计出测试人的年龄,则可有助于人 脸识别工作。在研究年龄识别的过程中,需要弄清楚人脸衰老、年轻化的客 观过程和规律。 基于人脸图像的性别识别和年龄估计主要解决如下的一些问题:根据人 脸图像判别出人脸的性别和估计出人脸的准确年龄。反映到实际问题会是: 男人还是女人? 年龄多大? 和这些方面有关的技术有人脸检测、图像预处理、 脸部图像特征提取、性别识别及年龄估计;被关注对象的身份。随着越来越 多的学者对诸如此类问题的关注,引起了一些国家的重视并出台了相应的法 律法规支持这方面的应用,如:同本在2 0 0 8 年出台了相关的卷烟供应商必须 在自动售货机上安装可以自动进行年龄识别的装置,以阻止未成年人购买香 烟等。同样,性别识别一般能与人脸分析的其他应用相结合,例如人口统计 中男女的比例、潜在的消费人群中顾客的身份等。从上述应用可以看出基于 特定人脸图像的性别识别和年龄估计技术具有广泛的商用前景。 但是,计算机如何根据人脸图像进行准确的性别识别和年龄估计依然存 在一些难题,如: ( 1 ) 合适的人脸数据采集的困难。首先由于人脸年龄研究开始的时间较 晚,所采集的人脸图像中绝大部分并不满足当前的年龄分析需求,其 次由于人的年龄变化是一个漫长的过程,所以标准的人脸年龄数据库 的建立需要长达数十年的时间。 ( 2 ) 与年龄相关的人脸特征的提取较为困难。人脸外观的变化除受年龄变 化的影响外,还要受到性别、光照、表情、种族、健康程度的影响, 并且这些因素往往不是孤立存在的,而是有机的结合在一起,所以单 独提取年龄变化显得较为困难。 ( 3 ) 每个人衰老的方式不同。每个人的衰老方式不仅是受到基因、生活的 环境、个人生活的习惯、种族,还受到工作压力、个人的心态等因素 的影响,年龄变化所带给每个人脸的印记都不相同,所以很难建立一 个明确的、统一的模式来估计年龄。 ( 4 ) 一些因个人风俗习惯所导致的男女特征不明显等。由于受到一些社会 风气的影响,社会上充斥着诸如伪娘、中性打扮的男女,那么如何判 断其性别成了一个难题。 西南科技大学硕士研究生学位论文第3 页 所以,如何通过计算机技术建模人脸年龄变化的规律、判断人脸性别, 实现通过人脸图像完成年龄的估计和性别识别,仍然是计算机视觉领域面临 的一大挑战,同时也潜藏着巨大的商业应用前景。 1 2 人脸性别识别的研究现状 基于人脸图像的性别识别的研究最早可以追溯到2 0 世纪9 0 年代初,关 于基于人脸图像的性别识别方法大致分为2 类:基于特征的方法【i 】i :】、基于外 观的方法1 3 - 1 2 l 。 1 2 1基于特征的方法 基于特征分析的方法是与传统的识别方法相类似的方法,在最早的性别 识别过程中,一般是通过对男女图像的观察,结合人类习惯因素,利用头发 长短、眉毛粗细、是否有胡子等作为性别识别的判断依据,简言之及提取人 脸图像的低级特征,再进行基于知识的分析。这类方法主要是通过度量可见 特征的距离、面积等来实现对人脸图像的性别识别。并且由于特征是主要的 判别因素,故此类技术被通称为基于特征的方法,一般见于在早期的人脸性 别识别方法。从心理学的角度分析,人的大脑并不是首先判断这张人脸是男 性还是女性,然后再判断这张人脸是谁。人们更倾向于利用3 一d 信息来判断 一张人脸的性别,鉴于此,在进行性别判断的时候,至少可以利用3 d 信息。 1 9 9 5 年b r u n e l l i i i j 提出了提取人脸图像的几何特征并作为h y p e r b f 网络的输 入进行分类,实现了人脸性别的识别。同时期,m i c h a e l m 等人提出了更为具 体的性别识别方法,具体方法为利用人鼻的宽度和眼睛区域的明暗度来识别 男性,而女性则是由嘴和鼻子区域的明暗度来区分。同时,人们习惯于把人 脸分为内部( 含眼睛、鼻子、嘴唇和下巴) 和外部( 含头发、耳朵和人脸轮 廓等) ,利用人脸的内部可以得到大致在9 0 的识别率,而利用整张人脸( 包 括内部和外部) 能够得到高达9 5 的性别识别率。 1 2 2 基于外观的方法 基于外观的方法主要是根据统计分析和机器学习来判别人脸图像的性 别,而性别识别可看作一个二分类的问题。一般是通过学习在大量i ) l i 练样本 集的基础上建立一个能够对人脸图像实现正确识别的分类器,再由分类器对 西南科技大学硕士研究生学位论文第4 页 测试样本集中人脸的特征进行性别分类。基于外观的方法不是简单的对人脸 特征的推导和分析,这点与基于特征的方法有本质的区别,主要是把人脸知 识通过匹配和学习融入到整个系统中。现阶段所用的性别识别方法基本都属 于基于外观的方法,典型的方法有:基于人工神经网络f 3 j 的算法,基于 a d a b o o s t m 算法,支持向量机1 5 1 ( s u p p o r tv e c t o rm a c h i n e ,s v m ) 等。其中, 在1 9 9 1 年,g o l o m b l 6 j 等最早提出利用二层神经网络对3 0 3 0 的人脸图像进行 性别识别,并且在9 0 幅图像上得到的j 下确识别率为9 1 9 。而c o t t r e l f ,i 等在 其基础上对训练样本进行主分量分析,将从人脸模板中提取的特征作为输入, 利用b p 神经网络实现人脸的性别识别。随着神经网络的应用更为普及,在 1 9 9 6 年t a m u r a t s l 等使用神经网络处理极低分辨率( 8 8 ) 的人脸图像。1 9 9 8 年,g u t t a m 等人使用径向基( r a d i a lb a s i sf u n c t i o n ) 神经网络和感应决策树的 混合系统进行性别识别,并在f e r e t 库的3 0 0 0 幅人脸图像上得到的正确识 别率高达9 6 。由这些研究可知,利用神经网络对人脸图像进行性别分类的 优点在于其能够训练一个系统来获得人脸模式复杂的性别信息,而缺点是需 要对网络结构进行不断的调整、优化才能获得较好的识别效果。随着支持向 量机理论的不断发展和进步,由于其本身是基于结构风险最小化理论,折衷 考虑了对训练数据的逼近精度和最小化训练错误的学习机器的容量,具有良 好的推广性和分类精确性。2 0 0 2 年,m o g h a d d a m m 等最早提出利用基于r b f 核的支持向量机( s u p p o r tv e c t o rm a c h i n e s ,简称s v m s ) 进行性别识别,并 在1 7 5 5 副f e r e t 人脸图像上进行试验,实验结果表明,该方法优于采用其 他分类器的分类方法,并且正确识别率高达9 6 6 。2 0 0 4 年c o s t e n v o l 禾1 用稀 疏s v m 对性别进行分析。2 0 0 6 年s a a t c i t m 利用主动外观模型( a c t i v e a p p e a r a n c em o d e l ,a a m ) 提取人脸的特征并采用s v m 作为分类器。随着 a d a b o o s t 方法由v i o l a 和j o n e s 提出,其核心思想是将多个弱分类器集成为 一个强分类器,期间通过不断增加弱分类器的数量以达到降低最终训练误差 的目标。2 0 0 2 年,s h a k h n a r o v i c h t n j 结合了多层人脸检测器和s v m 阈值 a d a b o o s t 进行人脸性别识别,并且实现了自动性别分类系统,其正确识别率 达到7 8 。 西南科技大学硕士研究生学位论文第5 页 1 3 人脸年龄估计的研究现状 1 3 1基于人体测量学的年龄估计 基于人体测量学的年龄估计主要是基于人脸变化原理和对人脸皮肤的 皱纹分析,根据人体测量学的模型,将人们由于年龄的增长而引起人脸外观 的形状和纹理的变化分为几个年龄组。该方法仅能够适用于对比较粗糙的年 龄估计或者年轻人的年龄建模,应用范围不广,不能进行连续或精确的年龄 分类,并且其对于特征点定位的误差和纹理的提取结果非常敏感。比较成功 的工作有,在1 9 9 4 年y o u n g t t 3 1 利用面部的几何比例区分儿童和成年人,利用 面部的皱纹区分出老年人,从而将人脸区分为3 类:儿童、青年人和老年人; 在2 0 0 1 年h o r n g t - 4 1 将上述方法进行了改进,主要是将人脸图像的皱纹和几何 比例作为神经网络的输入;同年h a y a s h i t 5 1 通过对人脸图像皱纹和肤色的估计 将人脸图像划分为每l o 年一个年龄段;在2 0 0 4 年m i y o k o l t 6 j 将人脸边缘、皱 纹和脖子的信息也作为神经网络的输入并采集人脸关键点几何特征信息作为 估计方法。 1 3 2基于人脸模型和年龄函数的年龄估计 t 基于人脸模型和年龄函数的估计方法主要是在估计年龄前先建立人脸 参数模型,用参数向量来表示人脸,通过训练建立参数向量和对应关系。此 类方法并过度依赖于特征点的定位结果,借助统计分析就可以获得较好的估 计结果,但它需要另外对参数向量的提取和年龄函数的训练。在l9 9 9 年 l a n i t i s 7 i ) l i 练了一个结合形状和亮度的综合人脸模型,并对此人脸模型降维 处理后,用一个5 0 d 的参数向量进行表示。并且该向量能说明人脸中9 5 以上的变化。通过学习并建立特征向量和年龄的对应关系函数式。 1 4人脸图像数据库 比较常用的用于人脸性别识别与年龄估计的人脸数据库有:f g n e t 、 m o r p h 、o r l 、y a l e 人脸数据库。另外还包括如u i u c i f p y 等不公开的人 脸数据库。因此本文主要采用上述四个人脸数据库作为人脸性别和年龄估计 的实验测试数据集,下面简单的对这四个数据库的基本情况进行介绍。 一:l i 【 西南科技大学硕士研究生学位论文第6 页 1 f g n e t 人脸数据库 该人脸数据库( h t t p :w w w f g n e t r s u n i t c o m ) 为可利用的公共的人脸年龄 数据库,有8 2 个人的人脸图像,图像数目为10 0 2 幅,其年龄跨度从o 岁到 6 9 岁,其中每个个体有6 至18 幅标有年龄的图像。并且每张图像还利用a a m 对人脸图像进行特征标定后的6 8 个形状特征标定点。该数据库主要用于对实 验的评估。 2 m o r p h 人脸数据库 该人脸数据库包括两组不同的人脸图像集,第一组图像集包含了采用对 照片进行数字扫描的方法获取的人脸图像,人脸图像的时间跨度为1 9 6 2 年到 1 9 9 8 年,对应的年龄范围从婴儿出生后4 9 天到2 9 岁。第二组图像集包含了 共4 0 0 0 个人的数字图像,图像集数目高达2 0 0 0 0 多张。并且该数据库还包含 了个体的一些个人信息如:身高、体重、血型、性别等。 3 o r l 人脸数据库 该人脸图像数据库( h t t p :w w w u k r e s e a r c h a t t c o m f a c e d a t a b a s e h t m l ) 包 含了共4 0 个人的人脸图像,图像集一共为4 0 0 幅人脸图像。绝大多数人的图 片采集的时间都不相同,所以人的面部表情和细节部分有很大的变化,例如 是否微笑,是否睁眼,是否带眼镜等,并且人脸的朝向和姿态也不尽相同。 所有人脸图像均为狄度图像,分辨率为9 2 1 1 2 像素。 4 y a l e 人脸数据库 该人脸图像数据库( h t t p :c v c y a l e e d u p r o j e c t s y a l e f a c e s ) 包含了共1 1 个 人的人脸图像,并且该图像集一共1 6 5 幅人脸图像,且均为人脸正面图像。 1 5人脸特征的提取和分类 ( 1 ) 局部特征方法 根据对国内外该研究方向的总结得知,面部特征主要分为三种方法:局 部特征、全局特征和混合特征。在早期的研究中,局部特征主要是诸如砸部 皱纹、皮肤、头发和几何特征等,并被广泛用于区分年龄组别。k w o n t s 】等利 用皱纹特征和人脸面部构件的距离比将人脸分为三类:婴儿、青少年和老年 人。他们将提取的基于人脸面部的距离比例作为几何特征,然后这些特征被 用来区分婴儿和老年人。而从人脸面部提取出的皱纹特征被用来区分年轻入 西南科技大学硕士研究生学位论文第7 页 和老年人。l e e l l g l 等利用皱纹和几何特征将人脸分为4 个年龄组,并使用s o b e l 滤波器来判断皱纹的程度。同时使用s o b e l 边缘幅度来确定皱纹特征、皱纹 的深度和密度和皮肤的平均方差。h a y a s h p t m 等利用基于霍夫变化的数字模板 ( d t h t ) 来提取人脸皱纹特征。通过皮肤颜色提取皮肤区域后,使用霍夫 变化的数字模板规范皱纹模型。t a k i m o t 0 1 2 q 等使用s o b e l 滤波器和g a b o r 滤 波器从一个好的皱纹中区分出深度皱纹。同时他们也使用在h s v 色度空间中 提取的皮肤色彩特征。在前面提到的方法中,局部特征基本被用于年龄组的 区分,这是因为局部特征表示年龄组的特性优于在特定的年龄上使用。 ( 2 ) 全局特征方法 表征人脸特性的全局特征通常被用于详细的年龄估计,用于提取全局特 征的方法通常有:主动外观模型【2 2 l ( a a m ) 、g a b o r 小波变换1 2 3 1 ( g w t ) 等。 在上述提及的方法中一般都用a a m 来进行人脸面部特征描述。a a m 方法通 过对感兴趣对象的形状和纹理的统计建模,使得它所建立的模型几乎能够生 成所有可能的有效对象。并采用了基于优化算法的搜索机制,使合成的模型 与目标图像不断接近,最终得到能够反映目标图像纹理及形状的合成模型。 在他们的工作中年龄和特征之间的关系被定义为二次年龄函数,并用年龄特 征来估计人脸年龄。l a n i t i s i 7 1 等使用主动外观模型提取的人脸特征来比较用 不同分类器进行年龄估计的优缺点。g e n g t 2 t 1 等提出了人脸年龄模型子空间方 法,使用子空间方法来描述不同年龄的人脸图像。在他们的工作中,主动外 观模型同样被用于提取人脸年龄特征。 ( 3 ) 混合特征方法 为了解决由a a m 提取人脸特征带来的问题,w e n l 2 5 1 等提出了混合特征提 取方法,主要是结合了全局特征提取和局部特征提取方法。他们设计了一个 由稀疏特征组成的a a m ,皱纹、皮肤、头发和面部特征组成的人脸模型。 在每个部分中,提取的特征类型为以下四种:拓扑结构、几何、光度和特征 组合。例子如下:皱纹的几何特征用一系列标志来进行描述。尽管如此,提 取皱纹的标志比分析其质地更不稳定。皱纹的标志描述的是皱纹的边缘的位 置,同时人脸皱纹包含了好的和深度皱纹。 西南科技大学硕士研究生学位论文第8 页 1 6论文组织 1 6 1研究内容和创新工作 ( 1 ) 研究了人脸性别识别的特征提取和分类方法,如局部二进制模式 方法( l b p ) 、神经网络方法、s v m 方法,以及直接把人脸图像的灰度值作 为特征的性别识别方法。使用支持向量机( s v m ) 分类器,通过实验对2 种 常用的特征提取方法进行比较研究,并在3 种不同核函数下进行比较研究。 实验在一个由f g n e t 、m o r p h 、o r l 、y a l e 、网上收集和实验室自行采集所共 同组成的,包含1 7 ,2 6 1 张人脸的数据库上进行。 ( 2 ) 提出一种基于局部特征和全局特征融合的人脸面部信息的提取方 法,即主动外观模型、皱纹特征、皮肤特征,来提高年龄估计的准确率。针 对因性别差异在人脸年龄特征表现上引起的差异,先进行自动性别识别来消 除因性别差异带来的影响。主动外观模型作为全局特征;局部特征中,皱纹 特征的提取采用g a b o r 滤波器,皮肤特征的提取采用局部二进制模式方法 ( l b p ) ,能够提取详细的皮肤纹理。 ( 3 ) 提出一种基于支持向量机( s v m ) 和支持向量回归机( s v r ) 结合 的分层分类器,将融合后形成的特征作为新的特征向量,通过s v m 对其进 行年龄组分类,最后利用s v r 估计出准确的年龄。通过实验证明,该方法具 有一定的有效性和合理性。 1 6 2 论文内容安排 论文的内容安排如下: 第l 章主要是研究背景与意义、人脸性别识别和年龄估计的研究现状、 研究内容、并介绍了常用的人脸数据库,以及论文的内容安排和创新点。 第2 章主要研究了人脸图像预处理的方法,并对所用的人脸数据库进行 预处理。研究了基于a d a b o o s t 的人脸检测以及采用主动表观模型的人脸特征 点的定位。 第3 章主要研究了人脸性别识别的特征提取和分类方法。特征提取方面 主要是局部特征的提取,分别采用l b p 和a a m 进行特征提取。并用不同的 分类器进行识别。讨论了相同特征提取方法在不同分类器下识别的性能进行 评估比较,不同特征提取方法在相同分类器下识别的性能进行评估和比较。 西南科技大学硕士研究生学位论文第9 页 第4 章提出了一种基于人脸图像的年龄估计方法。主要是先对输入的人 脸图像进行性别识别,再进行年龄特征提取,然后利用s v m 对人脸进行年 龄分组,最后利用s v r 进行人脸年龄的准确估计,并与现有的年龄估计方法 进行对比。 西南科技大学硕士研究生学位论文第1o 页 2人脸图像预处理及人脸检测与特征点定位 本文研究的主要是基于人脸图像的性别识别和年龄估计,而在进行模式 识别的第一步首先是进行图像的预处理以及人脸检测和特征点定位,所以本 章从这三个方面讨论与之相关的问题。 2 1 节介绍了图像预处理的相关知识;2 2 节介绍了目前应用较广的人脸 检测技术的特点及方法;2 3 节介绍了基于主动外观模型的人脸特征点定位 算法;2 4 节对该章进行了总结。 2 1人脸图像预处理 在进行模式识别过程中,首先要进行人脸图像的预处理,其处理结果的 好坏关系到在后续工作中相应的识别率和识别速度。本文选择用于实验的人 脸数据库,尤其是f g - n e t 人脸数据库,其中所包含的人脸图片都是在不同光 照条件下由不同的采集仪器所采集的,并且都是由旧图片扫描而来,所以导 致图片的质量也不同。而这个差异一般表现为图像中包含了不同程度的噪声、 不同的明暗程度。另外,由于图像采集的角度也不相同,导致图像存在不同 程度的旋转、缩放变形。通过人脸图像的预处理可以有效地减少采集过程中 产生的噪声,加强对于识别有用的信息,削弱除年龄以外的影响,复原由于 采集设备不同所引起的退化现象,优化图像质量,从而有效地提高识别率。 人脸图像的预处理主要包括人脸图像滤波去噪、灰度化、几何归一化、剪裁 以及直方图均衡化等工作。第一章已介绍了实验所用的基本数据库,故不再 赘述。 2 1 1人脸图像滤波去噪 由于实验所用的数据库大多都是由旧照片扫描得来,其中原图片的采集 条件和采集仪器的不同带来不同程度的噪声,故需要降低这些噪声带来的不 利影响。如何改善图像质量、降低噪声的影响显得尤为重要,采用滤波的方 式去除噪声的影响,增强图像质量。本文选取以下几种滤波算法,并通过实 验进行比较。 1 、高斯滤波 高斯滤波本质上是一种信号的滤波器,主要是用于信号的平滑处理,由 西南科技大学硕士研究生学位论文第1 1 页 于噪声是图像处理中影响较大的问题,而误差会累积传递等诸多原因,利用 高斯滤波可以得到信噪比较高的图像。 高斯滤波是由高斯函数的形状来选择权值的线性平滑滤波器,并且对去 二 除服从正态分布的噪声效果很好。其中,一维零均值高斯函数为g ( x ) = e 2 r , 其中高斯分布参数仃决定了高斯滤波器的宽度。而用于图像处理一般是采用 二维零均值离散高斯函数作为平滑滤波器,其相应的函数表达式如下所示: 二! ! :二塑 g e i ,月= e 2 0 - z ( 2 1 ) 高斯函数具有如下几个性质: ( 1 ) 二维高斯函数具有旋转对称性,即在每个方向上的平滑程度都是 相同的。 ( 2 ) 由式( 2 - 1 ) 可知,高斯函数为单值函数。 ( 3 ) 高斯函数的傅里叶变换频谱为单瓣。 ( 4 ) 由式( 2 - 1 ) 可知,高斯分布参数仃决定滤波器的宽度。其中参数o r 与高斯滤波器的频带单调性一致。 ( 5 ) 高斯函数具有可分离性,故可以实现大高斯滤波器。 高斯函数的可分离性如下表示: m - im - i g i ,】巾,】= g k ,i f i - k ,j - i ( 2 2 ) k = oi = 0 m - i m - i 坐:! ! m 】九f ,_ ,】= p 2 0 - 2 f i k ,j - i ( 2 3 ) k = oi = 0 m - i 一女2n - i f 2 球,】九f ,歹】_ p 2 口2 p 2 0 - 2 f i - k ,j - i ( 2 4 ) k = of = o 、 2 、均值滤波 首先,假设在由很多灰度恒定的小块构成的图像中,各相邻像素之间有 着较高的空间相关性,然而噪声却是统计独立的,所有可以用各像素的灰度 平均值来代替原像素值的方法。虽然说在去噪方面具有一定的效果,但是均 值滤波器也存在一些缺点,比如:由于均值滤波器对所有点都是相同对待的, 所以将会使图像变的模糊,而在将噪声点分摊的同时,图像的边界点也同样 分摊了。而为了弥补该缺陷可以采用加权平均的方式来构建滤波器。 3 、中值滤波 在信号处理方法中,。中值滤波属于非线性的,而与之相等同的中值滤波 西南科技大学硕士研究生学位论文第1 2 页 器同样是非线性的。在信号处理技术发展的过程中,中值滤波器最初被应用 在处理一维信号中,随着不断地深入研究,发现在处理二维图像信号中具有 较好的效果,比如:能克服由于线性滤波等所导致的图像边缘模糊,同时达 到去除噪声和保护边缘的效果。不过相应的缺点是对处理细节方面不太适合 该方法。中值滤波的思想是因为噪声( 比如椒盐噪声) 的出现,令该点像素 比周围的像素暗很多,那么在某个模板中,对像素进行由小到大重新排列, 最亮或最暗的点一定是排列在两侧的。所以取模板中排在中间位置上的像素 的灰度值替代待处理像素的值,从而实现去噪。 2 1 2 人脸图像灰度均衡化 直方图均衡化的思想是把原始图像的灰度直方图从比较集中的某个灰 度区间变成在全部灰度范围内的均匀分布。其本质是对图像进行非线性拉伸, 重新分配图像像素值,使一定灰度范围内的像素数量大致相同。从数学原理 来看,直方图均衡化即是一个分布( 输入的亮度直方图) 被映射到另一个分 布( 一个更宽,理想统一的亮度分布) 。图2 1 为采用直方图均衡化的示例。 爨耪 图2 - 1直方图均衡化示例:( a ) 输入图像,( b ) 直方图均衡化后的图像,( c ) 输 入图像的直方图,( d ) 图像均衡化后的直方图 f i 9 2 - 1e x a m p i eo fh is t o g r a me q u a ii z a t i o n :( a ) i n p u ti m a g e ,( b ) i m a g e a f t e rhis t o g r a me q u ai iz a tio n ( c ) his t o g r a mo ft h ein p u t im a g e ,( d ) a f t e rim a g e h is t o g r a me q u a ii z a t i o r 西南科技大学硕士研究生学位论文第1 3 页 2 1 3人脸图像几何归一化 由于f g n e t 人脸数据库中所用的图片并不全是标准图片,故需要进行 几何归一化,通过几何归一化可以有效地消除人脸图像可能的几何结构变形, 从而达到测试集和样本集图片都标准化( 标准化的含义是指人脸的核心部分 在图像中的相对位置大致一致) ,这有利于后续的人脸特征的提取和分类等工 作。其主要的步骤如:尺度校正、平移、旋转等。 2 1 4人脸图像的剪裁 为了去除无关因素对人脸的干扰,需要对经过几何归一化后的人脸图像 进行剪裁,从而保留仅含人脸部分的图像。本文以双眼间的距离为依据,选 取两眼瞳孔中心连线的重点作为参照坐标,然后向4 个方向( 上、下、左、 右) 扩展,从而根据需要切割出一定大小的人脸图像。 2 2人脸检测 根据输入的待测图像,通过人脸检测技术来判断该图像中是否存在人脸 区域,若存在人脸,则需要进一步确定人脸的位置、大小和姿态等信息。人 脸检测是处理人脸识别、表情识别、性别识别等问题最关键的一步,同时在 本文的研究中,由于基于特定人脸的性别识别和年龄估计仅需要人脸区域的 信息,故也是该研究必不可少的环节。然而人脸检测存在诸多难点,比如: 人脸的多样性( 发型、肤色、眼睛等) 、人脸的遮挡( 眼镜、饰品、胡须、刘 海、外界因素引起的遮挡等) 、复杂的背景和成像环境等,这些问题受到越来 越多的研究人员的关注。 人脸检测技术的研究已经走过了2 0 多年的历程,现有的人脸检测方法 主要分为两类: ( 1 ) 基于知识的方法 基于知识的方法是基于特定的规则进行人脸检测,而规则来源于关于人 脸模式的先验知识。例如人脸一般包括位置互相对称的两只眼睛、两个耳朵、 一个鼻子和一张嘴等特征,并且他们具有相对固定的位置关系。检测过程一 般首先提取这些面部特征,然后再根据它们的位置关系进行组合。这种方法 出现于早期的人脸检测工作中,具有简单、可行、和易用的特点。该方法的 西南科技大学硕士研究生学位论文第1 4 页 主要特点是很难将人脸模式的所有知识转换为可计算的规则表达式。如果规 则过于严格,则容易出现漏检情况:过于简单时又容易出现误检的情况。同 时由于人脸模式的复杂性,该方法很难枚举所有人脸的情况,限制了应用范 围。 ( 2 ) 基于学习的方法 基于学习的方法收集大量的人脸和非人脸样本,然后利用机器学习算法, 通过学习得到一个分类器,最后利用该分类器进行人脸检测。基于学习的方 法的性能取决于学习机器的学习能力以及训练样本对实际目标模型的表达能 力,与基于知识的方法相比,基于学习的方法能够处理复杂环境下的人脸检 测问题,是当前的主流研究方向。根据学习方法的不同,主要的研究成果包 括:( 1 ) 基于贝叶斯准则的方法( s c h ) ( 2 ) 基于人工神经网络( 3 ) 基于支 持向量机( 4 ) 基于a d a b o o s t 的方法 2 e l 。 2 2 1基于学习的人脸检测 基于学习的人脸检测可以分为两部分:检测器的离线学习和在线检测。 离线学习指利用收集的训练样本结合机器学习算法学习得到表示目标模型的 分类器结构,在线检测指利用学习得到的分类器模型扫描输入图片从而得到 人脸在图像中的位置。下面主要介绍离线学习的方法。 分类器的离线学习包括4 个模块: ( 1 ) 对齐 分类器离线学习的第一步是收集训练样本是收集训练样本,并且将所有 人脸图像进行配准。配准的目的是降低训练样本在尺度、形状、和倾斜角度 的人脸被认为是由一个“标准人脸经平移、旋转或缩放得到。对齐的目的 是求的“标准人脸”并将各个训练样本映射到“标准人脸 图像上。为了对 齐人脸,可首先手工标注各个图像上人脸的一些特征点位置,如眼角、嘴角 等。假定( x ,y ) 是“标准人脸 上的一个特征点,( x ,y ) 是任意一副训练图像 上对应得特征点,两者的关系可以用仿射变换来表示,即 三髫一s s i n 秒 x 制= :艺羽( 2 - 5 ) 给定一组对应点后,式( 2 - 5 ) 可以进一步写为: 西南科技大学硕士研究生学位论文第1 5 页 x l y l 10 y l而0 1 x 2 一y 2 10 y 2x 2 01 ( 2 - 6 ) 当两个图像有两个以上的对应点时,上述线性方程组可以通过“伪逆” 的方法求解。假定式( 2 6 ) 等号左边的矩阵为彳,求解的变量t = 【a ,b , t ,】7 , 等号右边的向量为b ,则有: t = ( 彳7 彳) 一1 ( 么7 b ) ( 2 - 7 ) 通过式( 2 - 7 ) 的逆变换,任意一个训练图像上的特征点可以变换到“标 准人脸”坐标。给定一组标注了特征点的人脸图像,需要同时求取“标准人 脸 上特征点的位置与每个训练图像和“标准人
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 展台搭建咨询方案
- 咨询公司表格配色方案
- 建筑标识亮化方案设计
- 水暖管道施工环境评估分析报告
- 大连开业活动方案策划招聘
- 建设工程质量管理考核
- 2025版司法局《终止重整程序申请书》民事破产重组类文书(空白模板)
- 学校捐赠活动仪式方案策划
- 在高铁线上的营销方案
- 旅游路线促销活动策划方案
- 第五单元晚清时期的内忧外患与救亡图存(单元复习课件)-高一历史(中外历史纲要上册)
- 眼科常见疾病及其用药
- 脑疝患者的急救及护理
- 2025年农村饮水安全项目社会稳定风险监测与评估报告
- 2024年全市首届档案职业技能竞赛考试题库(含答案)
- 2025至2030中国无线电频率行业发展趋势分析与未来投资战略咨询研究报告
- 五自教育课件
- 比亚迪汽车车间管理制度
- 《烽火岁月中的木刻》教学课件-2024-2025学年浙人美版(2024)初中美术七年级上册
- 分析包容型领导风格对团队绩效和员工创新绩效的作用
- T/CCS 071-2023井工煤矿智能化带式输送机运维管理规范
评论
0/150
提交评论