




已阅读5页,还剩69页未读, 继续免费阅读
(计算机软件与理论专业论文)基于局部特征分析的人脸识别算法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于局部特征分析的人脸识别算法研究 摘要 自动人脸识别是当前模式识别领域中的一个极具挑战性的研究课题,因其在法 律、商业、军事等领域具有广泛的应用前景而日渐受到各国政府以及科研单位的广泛 关注和高度重视。如何有效地从人脸图像中提取出区别于其他个体的特征是人脸识别 领域中的一个关键课题。 特征提取是模式识别研究中的最基本问题之一,对于图像识别而言,提取有效的 图像特征是完成识别任务的一个关键环节。近年来,局部算法因其识别率较高、对光 照、人脸表情变化不敏感而在特征提取领域得到了广泛应用,本文以人脸识别为应用 背景,以局部特征提取方法为主题进行了相关研究,论文的主要工作和贡献如下: ( 1 ) 针对人脸识别的识别率易受人脸图像旋转、尺度缩放、光照等影响的问题, 本文将s i f r ( s c a l ei n v a r i a n tf e a t u r et r a n s f o r m ) 算法用于人脸识别,并根据 人脸图像的特点,给出了一种具体的局部特征匹配算法。首先,用d o g 算子对人脸图 像进行关键点检测。然后,用欧氏距离对关键点进行特征匹配。最后对特征点进行错 配消除。实验表明s i f t 算法对旋转、尺度缩放、视角变化、光照变化等图像变化因 素保持一定的不变性;对图像噪声等因素也保持较好的可匹配性。 ( 2 ) 针对人脸识别算法中的效率和鲁棒性问题,改进了l v p s 算法,即基于改进 的局部分块l v p 直方图的人脸识别算法。首先,利用k 均值聚类算法获得l v p s 码本。 然后,利用获得的l v p s 对人脸进行建模,该方法比传统的建模方法计算更简单。最 后,利用分块后的l v p s 加权直方图索引进行人脸识别。实验表明本文所提出的方法 比传统的l v p 方法具有更好的识别效果。 ( 3 ) 针对人脸识别算法中的高维和鲁棒性问题,采用了l g b p 算子和s i f t 算子 在特征级进行融合的方法。首先将g a b o r 小波和l b p ( 局部二值模式) 结合以提取特征。 然后将s i f t 方法用于人脸识别,并利用s i f t 方法提取人脸特征。最后将l g b p 特征 和s i f t 特征在信息融合的特征级进行融合,并选取特征值的前5 0 作为待分类的新 特征。实验表明本文所用方法不仅具有降维的作用,而且比用单一的人脸识别方法提 高了识别率。 关键词:s i f t ( s c a l ei n v a r i a n tf e a t u r et r a n s f o r m ) ;尺度缩放;l v p ( l o c a l v i s u a lp r i m i t i v e s ) :k 均值聚类;直方图;l g b p ( l o c a lg a b o rb i n a r yp a t t e r n ) t h er e s e a r c ho ft h ef a c er e c o g n i t l 0 nb a s eo nt h e l o c a lf e a t u r ea n a l y s i s a b s t r a c t a u t o m a t i cf a c er e c o g n i t i o n ( a f r ) i sac h a l l e n g i n gr e s e a r c ht o p i ci nt h ef i e l do ft h e p a r e mr e c o g n i t i o n a f rg r a d u a l l ya t t r a c tm o r ea n dm o r ee x t e n s i v ec o n c e r na n dh i 曲 a t t e n t i o nf r o mm a n yg o v e m m e n to r g a n i z a t i o n sa n dr e s e a r c hi n s t i t u t e sb e c a u s eo fi t sw i d e r a n g ea p p l i c a t i o ni nl a w , s e c u r i t ya n dm i l i t a r ya f f a i r s ac e n t r a li s s u et oas u c c e s s f u l a p p r o a c hf o rt h ef a c er e c o g n i t i o ni sh o wt oe x t r a c td i s c r i m i n a t ef e a t u r ef r o mt h ef a c i a l i m a g e s f e a t u r ee x t r a c t i o ni so n eo ft h ee l e m e n t a r yp r o b l e m si nt h ea r e ao ft h ep a a e m r e c o g n i t i o n e x t r a c t i n gt h ed i s c r i m i n a t ef e a t u r ei s ak e y a s p e c to fc o m p l e t i n gt h e r e c o g n i t i o nm i s s i o n i nr e c e n ty e a r s ,l o c a la l g o r i t h m so b t a i ne x t e n s i v ea p p l i c a t i o ni nt h e a r e ao ff e a t u r ee x t r a c t i o nd u et oi t si n s e n s i t i v et oi l l u m i n a t i o n ,c h a n g eo ft h ef a c i a l e x p r e s s i o n ,e ta 1 u n d e rt h eb a c k g r o u n do fu s i n gt h ef a c er e c o g n i t i o n ,t h et h e s i sc a r r i e so u t ar e l a t e dr e s e a r c ho nt h et o p i co ft h el o c a lf e a t u r ee x t r a c t i o na l g o r i t h m t h em a i nw o r k a n dc o n t r i b u t i o n so ft h er e s e a r c hc a nb es u m m a r i z e da sf o l l o w s : ( 1 ) t h ef a c er e c o g n i t i o nr a t ec a l lb ei n f l u e n c e db yt h ef a c i a li m a g e s s c a l e ,r o t a t i o n a n di l l u m i n a t i o n t oa d d r e s st h e s ep r o b l e m s ,t h et h e s i si n t r o d u c e si n t ot h es i f t ( s c a l e i n v a r i a n tf e a t u r et r a n s f o r m ) a l g o r i t h m t h et h e s i sp r o p o s e sa l la p p r o a c hb a s e do nt h e s p e c i f i cc h a r a c t e r i s t i co ft h ef a c i a li m a g e s f i r s t l y , t h et h e s i sc a r r i e so nk e yp o i n t sf a c e i m a g ed e t e c t i o nw i t ht h ed o gd e s c r i p t o r s e c o n d l y , t h et h e s i su s e se u c l i d e a nd i s t a n c ef o r m a t c h i n go fk e yp o i n t s t h i r d l y , t h et h e s i se l i m i n a t e se r r o rm a t c h i n g t h ee x p e r i m e n t s s h o wt h a ts i f tm e t h o dm a i n t a i nac e r t a i nl e v e lo fi n v a r i a n c et oi m a g ec h a n g ef a c t o r s ,s u c h a sf a c ei m a g es c a l ea n dr o t a t i o n ,a f f i n et r a n s f o r m a t i o n ,p e r s p e c t i v e sc h a n g e ,i l l u m i n a t i o n , n o i s e ,a n dt h e ya l s os h o wt h a ts i f tm a i n t a i nt h eb e t t e rm a t c h i n gt ot h ei m a g en o i s ea n d o t h e rf a c t o r s ( 2 ) t oa d d r e s st h ep r o b l e m so ft h er o b u s ta n de f f i c i e n c y , t h et h e s i sp r e s e n t sa n i m p r o v e dl o c a ll v ph i s t o g r a ma l g o r i t h mf o rf a c em o d e l i n ga n dr e c o g n i t i o n f i r s t l y , t h e t h e s i sc o m p u t e sl v p sd i c t i o n a r yb yk - m e a n sc l u s t e r i n g s e c o n d l y , t h et h e s i se x p l o i t st h e c o m p u t e dl v p st oc o m p l e t et h ef a c em o d e l i n g t h ei m p r o v e dm e t h o di sm o r ee f f i c i e n t t h a nt h et r a d i t i o n a lo n ef o rf a c em o d e l i n g t h i r d l y , t h et h e s i su s e sw e i g h t e dh i s t o g r a mo f b l o c kl v pf o rr e c o g n i t i o n t h ee x p e r i m e n t sd e m o n s t r a t et h ec o m p e t e n c eo ft h ep r o p o s e d a l g o r i t h m ( 3 ) t oa d d r e s st h ep r o b l e m so ft h eh i g hd i m e n s i o na n dr o b u s ti nt h ef i e l do ft h ef a c e r e c o g n i t i o n ,t h et h e s i sb r i n g su pt h em e t h o do ft h ef u s i o no ft h el g b pa n ds i f t f i r s t l y ,t h e g a b o ro p e r a t o rc o m b i n e st h el b p o p e r a t o rt oe x t r a c tt h ef a c i a lf e a t u r e s e c o n d l y , t h es i f t o p e r a t o ri si n t r o d u c e di n t ot h ef a c er e c o g n i t i o nt oe x t r a c tt h ef a c i a lf e a t u r e t h i r d l y , t h e t h e s i se x t r a c t st h en e wf e a t u r eb yt h ef e a t u r el e v e lf u s i o no ft h el g b pa n dt h es i f tf e a t u r e , a n ds e l e c tt h e5 0 f e a t u r ea st h en e wf e a t u r ew h i c hw i l lb ec l a s s i f i e d t h ee x p e r i m e n t s s h o wt h a tt h ea l g o r i t h mn o to n l yr e d u c e st h ed i m e n s i o nb u ta l s oh a sh i g h e rr e c o g n i t i o nr a t e t h a nt h es i g n a la l g o r i t h m k e y w o r d s :s i f t ( s c a l ei n v a r i a n tf e a t u r et r a n s f o r m ) ;s c a l ev a r i a t i o n ;l v p ( l o c a l v i s u a lp r i m i t i v e s ) ;k - m e a n sc l u s t e r ;h i s t o g r a m ;l g b p ( l o c a lg a b o rb i n a r yp a t t e r n ) i v 浙江师范大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。论文中除了特别加以标注和致谢的地方外,不包含其他人或其他机 构已经发表或撰写过的研究成果。其他同志对本研究的启发和所做的贡献均己在 论文中作了明确的声明并表示了谢意。本人完全意识到本声明的法律结果由本人 承担。 作者签名:刻秆 工 日期:如巾月日 学位论文使用授权声明 本人完全了解浙江师范大学有关保留、使用学位论文的规定,即:学校有权保留 并向国家有关机关或机构送交论文的复印件和电子文档,允许论文被查阅和借阅,可 以采用影印、缩印或扫描等手段保存、汇编学位论文。同意浙江师范大学可以用不同 方式在不同媒体上发表、传播论文的全部或部分内容。 保密的学位论文在解密后遵守此协议。 作艄私:鹌新 工掺 苦j 1 浙江师范大学学位论文诚信承诺书 我承诺自觉遵守浙江师范大学研究生学术道德规范管理条 例。我的学位论文中凡引用他人已经发表或未发表的成果、数据、 观点等,均已明确注明并详细列出有关文献的名称、作者、年份、 刊物名称和出版文献的出版机构、出版地和版次等内容。论文中未 注明的内容为本人的研究成果。 如有违反,本人接受处罚并承担一切责任。 承诺人( 研究生) :富l 耨皿 指导教兰嵯2 彩- 乙二乙y y j 1 1 研究背景及意义 1 1 1 研究背景 1 绪论 自计算机诞生以来,人们就一直希望计算机具有类似于人的识别能力,并让计算 机代替人进行有关的识别工作,模式识别技术的出现部分的解决了这个问题。模式识 别技术诞生于2 0 世纪2 0 年代,随着计算机的普及和互联网的推广,己扩展到越来越 多的应用领域,如图像检索、数据挖掘、生物认证、生物信息学、遥感、军事等。 身份识别及验证是保证国家公共安全和信息安全的重要前提。在国家安全、公安、 司法、电子商务、电子政务、安全检查、保安监控等应用领域都需要准确的身份识别 及鉴定。目前,个人身份鉴别主要依靠i d 卡和密码等手段,然而这些手段存在许多 缺点:携带不便,容易丢失,易被损坏,密码易被遗忘和破解等。这种依靠证件、口 令等传统方法来确定个人身份的技术面临着严峻的挑战,已经不能适应现代科技发展 和社会进步的需要。生物特征识别技术给这一需要提供了实现的可能。 随着信息安全重要性的日益突出,2 0 世纪8 0 年代术9 0 年代初,生物特征识别 技术研究开始成为一个研究热点。生物特征识别技术( b i o m e t r i c si d e n t i f i c a t i o n t e c h n o l o g y ) 或者生物测定学( b i o m e t r i c s ) 是指为了进行身份识别而采用自动技术测量 主题生理特征或者个人行为特点,并将这些特征或者特点同数掘库的模板数据进行比 较,从而完成识别的一种解决方案心1 。与传统识别方式不同,生物特征识别利用人类 自身的个体特性来进行身份识别,而入的生理特征是与生俱来的,是先天性的。 人脸与人体的其他生物特征( 指纹、虹膜) 一样是与生俱来的,它们所具有的唯 一性和不易被复制的良好特性为身份鉴别提供了必要的前提。人脸因其图像更容易获 取,尤其是在非接触坏境和不打扰被检测人的情况下,其优越性远远超过其他成熟的 人体特征识别技术。人脸识别是一种重要的生物识别技术,应用非常广泛。入脸识别 是通过分析脸部器官的唯一形状和位置来进行身份鉴别,同其他生物识别相比人脸识 i 1 绪论 别具有如下优势: ( 1 ) 可以隐蔽操作,尤其适用于安全监控 特别适用于解决重要的安全问题,罪犯监控与网上抓逃等应用,这是指纹、虹膜 等其他人体生物识别技术不能比拟的。这样不会对用户造成生理上的伤害,比较符合 一般用户的习惯,容易被大多数用户接受。 ( 2 ) 具有方便、快捷、强大的事后追踪能力 基于人脸图像的身份认证系统可以在事件发生的同时记录并保存当事入的人脸 图像,从而可以确保系统具有良好的事后追踪能力。如考勤系统,管理员可以方便的 对代打卡者进行事后监控和追踪,这是其他生物特征所不具有的性质。 ( 3 ) 图像采集设备成本低 图像采集工作可以通过照片扫描仪、数码摄像机、数码相机、摄像头等摄像设备 来完成。 ( 4 ) 更符合人类的识别习惯,可交互性强 对人脸来说,授权用户的交互和配合可以大大提高系统的可靠性和可用性。 有关入脸识别的研究已经有3 0 多年的历史口1 ,但真正成为计算机视觉中的研究 热点还是1 9 9 0 年之后的事,这是由于神经网络和计算机硬件等的迅速发展,使人们 看到人脸识别的希望。近年来的研究重点是入脸识别中的局部算法。无论是全局算法 还是局部算法,人脸识别系统共性模板都如图1 1 所示。而一般的人脸识别流程为: 输入图像或视频,人脸检测、定位,人脸特征提取,人脸识别,人脸识别结果,如图 1 2 所示。 _ 。- _ 一- l j 图1 1 :人脸识别共性模板( 不同的人脸系统采用不同的模板) 1 绪论 i 输入 li 测、定位l 取 l 一“”“。lj ”“。“”“i 图1 2 :常用的人脸识别系统 图像输入:人脸图像系统的图像来源可以由数字相机拍摄、照片扫描、摄像头、 c c d 拍摄后的图像提取而得。 人脸检测:任何人脸识别系统首先都需要从输入信息中获取人脸的位置、大小。 因此,人脸检测是人脸识别系统的第一步骤,这一步骤所获得的精度与速度直接影响 整个系统的性能。其功能主要是在输入图像( 静态图片、视频序列) 中确定所有人脸 ( 如果存在) 的位置、大小、以及姿态。人脸自动检测也是一类具有挑战性的问题, 因为人脸是一类高度非刚性的目标,存在帽貌、表情、肤色等差异,还可能会受到附 属物、遮挡物、待测图像性质的差异、光照等的影响。 图像预处理:为了提高算法的可行性和鲁棒性,在特征提取自仃需要对图像进行预 处理。图像预处理的目的是去掉噪声,加强有用的信息,并对输入测量仪器或者其他 因素造成的退化现象进行复原,根据人脸识别系统采用的图像来源不同而采用不同的 预处理方法。 特征提取:特征提取是模式识别的核心环节,在人脸识别中如何有效地提取出人 脸图像的身份特征是人脸识别研究的核心问题。有效的提取出人脸图像特征后,使用 简单的距离分类器就能达到很好的识别效果。为了得到有效的脸像特征,一般都要对 提取的特征进行选择,即特征选择,特征选择的过程也就是去除冗余或不相关的的特 征来降维。两者一般联合使用。 图像归一化:图像几何特性的归一化处理是为了使人脸图像归一化到相同的位 置、角度和大小。由于人的两眼之间的距离对于大多数人来说都是基本相同的啼3 ,因 此,两只眼睛的位置常常被用作人脸图像几何归一化的依据。人脸图像光学特性的归 一化主要包括先用直方图均衡化方法对图像灰度做拉伸,以改善图像的对比度,然后 对图像灰度值进行归一化处理,使标准人脸图像的像素狄度均值为0 、方差为1 。因 此可以部分消除光照对识别效果的影响。 1 绪论 1 1 2 研究的意义 随着社会的发展,人们对安全意识逐渐加强,使得生物特征识别技术具有了巨大 的市场潜力。国际生物特征组织对生物特征技术做了较详细的市场分析和市场预测, 其结果如图1 3 所示( 图中引用参考文献心3 中的数据) 。而在所有的生物特征识别技术 中,利用人脸特征进行身份识别是最自然,最直接和最友好的手段,不像指纹、掌纹、 虹膜等生理特征的获驳不仅需要被采集者的配合,而且要在法律许可的条件下才能进 行。 8 0 0 0 6 0 0 0 4 0 0 0 2 0 0 0 0 a n n u a lb i o m e t r i ci n d u s t r yr e v e n u e s ,2 0 0 7 2 012 ( s mu s d ) c o p r y rig h t 2 0 0 4 2 0 0 7 i n t e n a t i o n a lb i o m e t r i cg r o u p 3 6 5 5 3 8 7 2 0 0 72 0 0 82 0 0 92 0 1 02 0 1 12 0 1 2 图1 3 :生物特征识别技术产值预测比1 人脸识别是当前生物特征识别的热点之一,是人类交流的基础。人们通过这一视 觉功能识别彼此的身份,理解对方的感情和意图。因此,利用计算机进行人脸自动识 别( a f r :a u t o m a t i cf a c er e c o g n i t i o n ) 一直是计算机视觉领域中的重要研究课题。 在过去的几十年里,随着高速硬件和人工神经网络等技术的发展以及商业和执法等方 面需求的增长,人脸识别已经取得了长足的发展呻 。 人脸识别在信息安全、访问控制、视频监控等领域有着广泛的应用前景。特别是 在美国遭遇“9 1l ”恐怖袭击事件之后,安全问题更成为人们关注的热点问题,这就 促使人脸技术在反恐和罪犯跟踪等方面广泛应用,同时随着对人脸识别中各项技术研 究的进一步深入,其还可以具有更广泛的应用领域。但研究人员发现,目前的人脸识 别技术也只是在理想的情况下能够达到满意的效果,非理想情况下的计算机人脸识别 技术也就是利用计算机分析人脸图像进而从中提取出有效的识别信息用来辨认身份 4 1 绪论 的一门技术,人脸识别技术应用背景广泛用于公安系统的罪犯身份识别、驾驶执照及 护照等与实际持证人的核对,银行及海关的监控系统及自动门卫系统。 人脸识别研究同时在学术上也有重要意义。人脸是典型的形变体,其特点是:( 1 ) 模型已知;( 2 ) 特征分布具有对称性。对这种形变体的深入研究有助于解决一般三维 物体的识别问题,从而能够推动计算机视觉和模式识别等领域中基础研究的发展。 1 2 人脸检测和识别算法综述 1 2 1 人脸检测算法综述 自动人脸识别可以分为人脸检测( f a c ed e t e c t i o n ) 口川,人脸识别( f a c e r e c o g n i t i o n ) 凹1 两个过程。人脸检测就是对给定的图像,确定其中人脸的位置、大小 等状态信息。人脸检测的结果直接影响到人脸特征提取、人脸识别等后续工作。入脸 检测已经成为一个独立的研究课题受到国内外众多研究者的关注。由于人脸识别和基 于内容检索的技术越来越接近实用,对于人脸检测的研究也越来越重要。总的来说, 从一幅图像中检测人脸的方法可以概括为以下四种: ( 1 ) 基于知识的方法( k n o w l e d g e b a s e dm e t h o d s ) 基于知识的方法( k n o w l e d g e b a s e dm e t h o d s ) 是基于规则的人脸检测方法。先 验知识是研究者关于人脸的规则来源。简单的规则一般比较容易被提出来描述人脸特 征和它们的相互关系。特征之间的相互关系可以通过它们的相对距离和位置来描述。 这种方法将典型的人脸形成规则对人脸进行编码,通过面部特征之间的关系进行人脸 定位。在输入图像中首先提取面部特征,确定基于编码规则的人脸候选区域。 y a n g 和h u a n g n 町提出分层的基于知识的人脸检测方法,它们的系统由三级规则 组成。在最高级,通过扫描输入图像的窗口和应用每个位置的规则集找到所有可能的 人脸候选区。较高级的规则通常描述人脸看起来像什么,而较低级的规则依赖于面部 特征的细节。多分辨率的分层图像通过平均和二次采样生成,如图1 4 所示,编码规 则通常在较低的分辨率下确定人脸的候选区,包括人脸的中心部分,如图1 5 所示, 其中由四个基本上相同的灰度单元。 绪论 。i l e a lu 1 c i l f 、_ h u a n g a n dy a n g sa p p r o a c h k “m d a k 。,l e v o l1l e v e l2 l e v e l3 圈匪 匝 - j 奎一x i j ;鼍 : 一 蔓“i h c e 仲9 1 璺) 围l4 :y a n g 和h a a n g 的检剥方法 图l5 :人膛候选区域 在人脸的上层周围部分具有相同的灰度。人脸的中心部分和上层周围的灰度不 同。最低分辨率( l e v e l l ) 图像用于搜索人脸的候选区并在后面鞍精细的分辨率下做 进一步处理。在i j e v e l 2 完成人脸候选区的局部直方图均衡化,并进行边缘检测。继 续存在的候选区在l e v e l 3 用其他的人脸特征如眼睛、嘴等对应的规则进行检查。这 种方法的特点是用从粗到细的策略来减少所需要的计算。虽然它没有很高的检测率 但采用多分辨率分层的思想和指导搜索的规则已经用到后面的人脸检测工作中”“。 k o t r o p o u l o s 和p i t a s 1 提出了一种类似于基于规则的定位方法。用投影方法确定 面部特征,图像的水平和垂直投影定义为肿 m ,因此,p c a 方法有很强的数据压缩能力,而且这种压缩是最优的。 因为它不仅使得从n 维空间降到m 维空间后的均方误差最小,而且在变换后的低维 空间有很好的人脸表达能力。 l s i r o v i c h 和m k i r b y n 引于1 9 8 7 年将p c a 用于人脸图像的最优表示,应用主分 量重构人脸,提出本征脸( e i g e n f a c e ) 的概念,用p c a 实现对人脸图像的紧致表示, 认为任何一幅人脸图像都可以用一组本征脸的线性加权和来近似重构,其权重系数可 以通过将人脸图像在本征脸空间投影得到,然后用投影到低维空间中基函数上的系数 来表示人脸并进行识别,并采用奇异值分解( s i n g u l a rv a l u ed e c o m p o s i t i o n ,s v d ) 算法简化了本征脸的计算,为p c a 在人脸识别中的应用奠定了理论和实践基础。 a p e n t l a n d 6 1 将本征脸方法进一步扩展到基于姿势( v i e w b a s e d ) 以及基于人脸部件 子空间的人脸识别,提出了本征眼、本征鼻、本征嘴的概念。l z h a o 和h y a n g h 7 3 提 出了对每个人只应用三幅在不同光照条件下采集的图像来计算敖度矩阵的方法,解决 了p c a 方法中的光照影响问题。j y a n g 等踟提出了基于二维p c a 的人脸识别方法。 y a n g 等人n 训提出了核主成分分析( k e r n e lp c a ) 。g o t t u m u k k a l 等人口们提出了模主成 分分析( m o d u l a rp c a ) 方法。t a n 等人订提出了适应加权子模式主成分分析 ( a d a p t i v e l yw e i g h t e ds u b p a r e mp c a ) 。c h e n 等人瞄2 3 提出了增强的( j p c ( e n h a n c e d ( p c ) 2 a ) 方法。p u j o l 等人酬提出了拓扑主成分分析方法( t o p o l o g i c a lp r i n c i p a l c o m p o n e n ta n a l y s i s ) 等。 f i s h e r 线性判别准则( f i s h e rl i n e a rd i s c r i m i n a t e ,f l d ) 在模式识别中是种经 典的方法,其基本思想是使变换以后的模式具有不同类别样本之问的距离尽可能远, 而同一类别样本的距离尽可能近的分布特征。p n b e l h u m e u r 等_ 1 用f l d 对p c a 方法 进行扩展,提出了f i s h e r 脸人脸识别方法。p n b e l h u m e u r 等嘲1 使用y a l e 人脸库和 h a r v a r d 人脸库图像进行实验,在光照变化和表情变化较严重的情况下,此种方法比 p c a 获得了更好的识别效果。s s h a n 等瞄剐通过利用简单的几何变换和狄度变换,从 一幅图像生成了同一人脸的不同光照和表情下的多幅图像,从而部分解决了f i s h e r 脸方法中训练图像的选择问题。 独立成分分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s , i c a ) 方法是8 0 年代提出来 1 2 1 绪论 的一种新统计方法,目前在盲源信号分离、金融数据分析、图像去噪和特征提取等方 面得到了广泛应用m 1 。i c a 的基本思想是将观测到的数据进行线性分解,即用一组统 计独立成分的线性组合来表示。目前,研究人员提出了很多估算i c a 模型的方法, 并且给出了许多实用的i c a 算法田3 。m s b a r t l e t t 嘞1 将i c a 引入人脸识别领域。i c a 人脸识别的基本思想是:先用i c a 算法从训练图像集求出独立的基图像,由基图像 构成子空间,然后将待识别图像投影到该子空问中,根据投影系数可设计适当的模式 分类器。o d e n i z 等人啪3 结合i c a 和s v m 方法实现人脸识别问题。由于i c a 的训练 时间比p c a 长,得出了p c a 和s v m 结合更好的结论。y a n g 等人提出在核特征空 间中的两阶段核独立成分分析( k e r n e li c a ) 算法:k p c a + i c a 。实验结果表明k i c a 方法的识别结果优于i c a 、p c a 、和k p c a 。k i m 等人提出将人脸图像分成几个人 脸成分和局部空间,并且每个局部空间通过i c a 基( 独立成分) 表示为相应的残留 人脸空间( r e s i d u a lf a c es p a c e ) ,在局部空间中人脸图像的统计模型相对简单,通 过线性编码实现分类。实验表明此方法在光照和姿念变化的情况下识别准确性得到提 高。c h e n g 等人羽提出用于独立成分分析的整体学习方法。t o r g a y 等人埔3 1 提出了分而 治之( d i v i d e a n d c o n q u e ra p p r o a c h ) 的多分类器方法,将人脸图像分割为几个局部 区域,分别用p c a 、l d a 和i c a 方法提取特征,将各个识别结果结合实现人脸识别。 f o r t u n a 等人呻1 提出了利用修正的p c a 、i c a 特征空间提取特征改进的支持向量机进 行识别。 ( 3 ) 基于机器学习的方法 人工神经网络的生物识别方法除了用于人脸识别之外,也用于表情分析和性别识 别,因其固有的并行运算机制以及对模式的分布式全局存储。k o h o n e n 哺司早就提到了 一个采用关联图的n n 人脸记忆系统,该系统允许输入图像含有大量噪声,甚至有部 分遮挡。d e m e r s 等汹1 提出采用p c a 方法提取人脸图像特征,用自相关神经网络进一 步压缩特征,最后采用一个m l p 来实现入脸识别。l a u r e n c e 等阳7 3 通过一个多级的s o m 实现样本的聚类,将卷积神经网络c n n 用于人脸识别。c n n 利用了每个像素及其相 邻像素之间的相关性,对图像的平移、旋转和变形具有一定的鲁棒性。r a n g a n g t h 和 a m n 1 提出了用于入脸识别的径向基函数网络( r b f n ) 。l i n 等提出了用于入脸检 测、眼睛定位与人脸识别的基于概率决策的神经网络。l e e 等盯町提出了用于人脸识别 1 绪论 的模糊b p 网络。g u t t a 等口提出了将r b f 与树分类器结合起来进行人脸识别的混合 分类器结构。 隐马尔可夫模型( h m m ) 口列是一种有效的建模和识别方法,在语音信号处理方 面得到了广泛的应用。s a m a r i a 等口”把h m m 用于人脸识别,他把人脸从上到下分成 五个状态,分别对应前额、眼睛、鼻子、嘴巴和下巴。图像的每一横条代表一个状态 的观测值,每一个人都建立一个对应的h m m 模型。在测试的时候,具有最大似然输 出的模型所对应的人被认为是测试样本所属的类别。n e f i a n 等口钔在上述方法的基础上 提出了一种基于2 d 内置式h m m 的人脸识别方法。这种方法的效果要优于s a m a r i a 的方法,减少了参数存储量。o t h m a n 盯剐等提出了低复杂度的2 维h m m 模型,更好 地描述了人脸各个器官之间的关联,具有很高的识别率。 弹性图匹配( e l a s t i c g r a p hm a t c h i n g , e g m ) 技术采用动态链结构来描述人 脸特征,是由m l a d e s 等口6 3 提出的一种具有形变不变性的算法。此方法解决了人脸识 别算法中因形变而引起的识别率大大降低的问题。为了表征人脸特征,e g m 方法中 首先将一个二维网格叠加到一幅人脸图像上,然后对图像进行g a b o r 小波变换,求得 图像各网格点上的g a b o r 特征。为了更好的描述图像特征,现在常用g a b o r 小波核函 数对图像进行滤波,分别采用5 个不同的频率和8 个不同的方向,因此对于每一个人 脸网格点,共有4 0 个g a b o r 特征,所以,e g m 中的人脸特征可以用一个网格点组成 的图来表示。 m l a d e s 口6 1 将e g m 方法用于人脸识别实验,测试的图像有表情的变化和角度转 动1 5 度,都取得了较好的识别效果,但是识别耗时较长,使用2 3 个计算机进行并行 计算,每个图像和目标库中的8 7 个图像完成全部匹配需要2 5 秒。l w i s k o t t 在e g m 方法的基础上,又提出了弹性图匹配( e l a s t i cb u n c hg r a p hm a t c h i n g ,e b g m ) 方法 ,该方法对e g m 方法做了改进,通过改进提高了定位精度,降低了人脸匹配时间。 在f e t e t 人脸库中进行测试,取得了较高的识别率。 p s p e n e v 和j j a t i c k 提出了局部特征分析( l o c a lf e a t u r ea n a l y s i s ,l f a ) 的人 脸识别方法口引。局部特征分析是基于人脸子空间变换的方法,是p c a 方法的一种扩 展。p c a 方法提取的特征是数据降维后的最佳特征表征,它属于全局特征,没有体 现拓扑特征。l f a 方法则通过对基向量加上一个拓扑索引来描述图像的局部特征和拓 1 4 l 绪论 扑特征。 1 3 本文的组织结构 本文对人脸识别的相关理论与算法进行了深入的研究,所做的主要工作和论文的 结构安排如下: 第一章概述了人脸识别技术的应用背景和研究意义。通过比较说明了人脸识别的 重要性,重点描述了人脸检测和识别技术的发展和方法。在此基础上,给出了本文的 主要研究内容以及章节安排。 第二章论述了常用的几种人脸图像预处理方法。首先阐述了预处理方法中滤波去 噪的线性滤波、中值滤波、维纳滤波的理论知识;其次阐述了预处理方法中的灰度变 换方法,并通过实验验证了灰度变换和直方图均衡化后能使整幅图像均匀:然后阐述 了预处理方法中的二值边缘方法的理论基础,并通过实验验证了此种方法对后续的入 脸识别的重要性;最后阐述了预处理方法中的图像归一化方法,并通过实验验证了此 方法对人脸检测和识别都具有重要性。 第三章基于s i f t 算法的入脸描述与识别。将s i f t ( s c a l el n v a r i a n tf e a t u r e t r a n s f o r i n ) 算法用于人脸识别,并根据人脸图像的特点,给出了一种具体的特征匹 配算法。首先,用d o g 算子对人脸图像进行关键点检测;然后,用欧氏距离对关键 点进行特征匹配:最后对特征点进行错配消除。通过实验证明s i f t 算法对旋转、尺 度缩放、视角变化、光照变化等图像变化因素保持一定的不变性,对图像噪声等因素 也保持较好的可匹配性。 第四章基于改进的分块l v p 直方图的人脸建模和识别研究。提出了一种改进的 基于l v p ( l o c a lv i s u a lp r i m i t i v e s ) 的人脸建模和识别算法。首先,利用k 均值聚类算 法获得l v p s 码本;然后,利用获得的l v p s 对人脸进行建模,该方法比传统的建模 方法计算更简单;最后,利用分块后的l v p s 加权直方图索引进行人脸识别。实验表 明本文所提出的方法比传统的l v p 方法具有更好的识别效果。 第五章基于特征融合的人脸识别算法研究。将l g b p 和s i f t 算法在特征级上进 行融合。首先将g a b o r 小波和l b p ( 局部二值模式) 结合以提取特征;然后将s i f t 方 法用于人脸识别,并利用s i f t 方法提取人脸特征;最后将l g b p 特征和s i f t 特征 l 绪论 在信息融合的特征级进行融合,并选取特征值的前5 0 作为待分类的新特征。实验表 明,本文所用方法不仅具有降维的作用,而且比用单一的人脸识别方法提高了识别率。 第六章总结了本文的主要研究成果并提出进一步的工作与展望。首先总结了本文 的主要工作,较好的解决了人脸识别中的高维、鲁棒性、效率等问题。并提出了今后 工作的研究课题,目前的人脸识别系统与预期还相差一定的距离,所以今后的研究工 作仍然需要进一步的努力。 1 6 2 1 引言 2 人脸图像预处理及归一化 图像在产生、传输和变换的过程中,由于多种因素的影响,往往使图像与原始景 物之间产生某些差异,这种差异称为变劣或者退化。人脸图像的退化一般有对比度差, 人脸的边缘模糊,噪声加大等。这种退化对图像的进一步分割造成了困难和不便,对 人脸的识别也造成了干扰。因此,对要处理的图像进行恰当的处理是有必要的,从而 可以改善图像的视觉效果,提高图像的清晰度,并且使图像更有利于计算机的处理, 便于对图像进行分割。这种处理即为图像的预处理。 为了提高算法的可行性和鲁棒性,提高特征提取、图像分割、匹配和识别的可靠 性需要对图像进行预处理。图像预处理的目的是去掉噪声,加强有用的信息,并对输 入测量仪器或者其他因素造成的退化现象进行复原,根据不同的人脸识别系统采用的 图像来源采用不同的预处理方法,常用的预处理方法有滤波去噪、灰度变换、图像二 值化边缘检测、尺度归一化。 2 2 滤波去噪 一般情况下,根据图像获取的途径,噪声的产生有多种途径:( 1 ) 图像数据的获 取机制会引入噪声信号;( 2 ) 图像采集过程中,物体和采集装置相对运动或采集装置 的抖动,也会引入噪声;( 3 ) 在图像数据的电子传输过程中,也不同程度的引入噪声。 由于噪声的存在,用于人脸识别的图像将不可避免地造成识别率的下降。目前,图像 噪声的消除可以通过两个途径:空间域滤波或频率域滤波。对于不同的噪声采取不同 的除噪方法。 ( 1 ) 线性滤波 滤波器是对像素的邻域进行运算,输出图像的某一特定位置的像素值出输入图像 相应位置的相邻的像素决定。可以应用线性滤波消除某些特定的噪
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 餐饮业会员数据分析2025年:消费行为与忠诚度预测报告
- 学位日语题目及答案
- 2025年工业互联网平台漏洞扫描技术升级与优化实践报告
- 2025年T305型氧化锌脱硫剂项目发展计划
- 染色体在基因课件
- 2025年食品与饮料行业食品安全风险评估体系构建报告
- 寒假安全教育课件74
- 动漫产业链协同与2025年创新驱动的产业协同创新人才培养与引进策略
- 2025年绝缘隔离柱项目合作计划书
- 初二主科考试试题及答案
- 罗伊的适应模式讲解
- 小儿推拿培训课件
- 数据科学基础 课件 第5章 网络爬虫与信息提取
- 前端开发技术演进年度总结
- 广东省地质灾害危险性评估实施细则(2023年修订版)
- 《新能源汽车整车控制技术》教案全套 项目1-5 整车控制系统检测与维修-电动助力系统检测与维修
- 2023年工业固废处理行业市场分析报告及未来发展趋势
- 《PCB设计与制作(基于Altium-Designer)》教材配套电子课件电子教案(全)完整版课件
- 建筑装饰工程施工总平面布置图
- (完整版)中国古代书法史课件
- 2023广东惠州市惠城区桥西街道办事处招聘治安队员、党建联络员、社区“两委”班子储备人选笔试通告笔试备考题库及答案解析
评论
0/150
提交评论