(计算机软件与理论专业论文)基于模糊rbf神经网络的人脸识别系统研究.pdf_第1页
(计算机软件与理论专业论文)基于模糊rbf神经网络的人脸识别系统研究.pdf_第2页
(计算机软件与理论专业论文)基于模糊rbf神经网络的人脸识别系统研究.pdf_第3页
(计算机软件与理论专业论文)基于模糊rbf神经网络的人脸识别系统研究.pdf_第4页
(计算机软件与理论专业论文)基于模糊rbf神经网络的人脸识别系统研究.pdf_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 人脸识别是一个典型的图像模式分析、理解与分类计算问题,涉及到模式识 别,计算机视觉,人机交互,统计学习,认知科学等多个学科,是模式识别领域 研究的热点和难点之一。同时,作为一种生物特征识别关键技术,a f r 技术在 身份认证、智能监控、信息安全、金融等领域具有潜在而广大的应用前景。然而, 非理想条件下的人脸识别技术仍然是一个极具挑战性的课题,要开发出鲁棒和实 用性强的a f r 系统还需要解决大量的关键问题。 本文概括地分析了国内外在人脸识别方面的研究历史和现状,阐述了人脸图 像预处理的主要算法,研究了几种目前流行的人脸特征提取算法及其改进,探索 了基于模糊r b f 神经网络的人脸图像识别系统的设计与实现。 本文主要工作如下: 1 、对人脸图像进行基于分块的离散余弦变换( d i v i d e dd i s c r e t ec o s i n e t r a n s f o r m ,d d c t ) 。首先对人脸进行分割,对分割出的各图像块进行d c t 变换, 然后提取d c t ( d i s e r e t ec o s i n et r a n s f o r m ) 系数的低频分量和高频分量构造出每 块人脸的d c t 特征矩阵。 2 、利用奇异值分解阂值压缩( s i n g u l a rv a l u ed e c o m p o s i t i o nt h r e s h o l d c o m p r e s s i o n ,t c s v d ) 方法对d c t 特征矩阵进行奇异值分解与压缩降维。由于分 割图像的d c t 低频分量含有大量由于遮挡、光照及表情变化等因素引起的冗余 信息,有必要对图像的奇异值进行压缩降维,然后对这些奇异值特征进行组合, 构造出最终的人脸组合鉴别特征。 3 、设计一种基于模糊r b f 神经网络的人脸图像分类器。由于r b f 网络与 模糊推理过程具有函数等价性,可以将两种不同构造的系统在函数上统一起来, 使网络的参数和运算具有明确的含义。我们将r b f 网络中的模式聚类中心数和 模糊规则数对应起来,构造网络的环境参数使网络具有模糊推理和分类能力。 4 、训练模糊r b f 神经网络。模糊r b f 神经网络一般采用b p 算法进行学习, 收敛速度慢,提出了一种改进的l e v e n b e r g m a r q u a r t 优化算法( 简称l m 算法) 对神经网络进行学习,改进的l m 算法在学习次数和准确度方面都优于b p 算法。 5 、应用于人脸识别。对训练好的模糊r b f 神经网络分类器o r l 人脸库进 行测试,仿真实验结果表明了本文方法的有效性和可行性。 关键字:模式识另0 ;人脸识别;特征提取;模糊r b f 神经网络:分类器 a bs t r a c t f a c er e c o g n i t i o ni sat y p i c a lp a t t e r na n a l y s i s ,u n d e r s t a n d i n ga n dc l a s s i f i c a t i o n p r o b l e m ,w h i c hi sc l o s e l yr e l a t e dt om a n yd i s c i p l i n e ss u c ha s p a t t e r nr e c o g n i t i o n , c o m p u t e rv i s i o n ,h u m a n c o m p u t e r i n t e r a c t i o n ,s t a t i s t i c ss t u d y ,a n dc o g n i t i v e p s y c h o l o g ye t c s oi ti so n eo f t h eh o ta n dh a r dp r o b l e m si np a t t e r nr e c o g n i t i o n a t t h es a m et i m e ,a f rt e c h n o l o g y ,a so n eo ft h ek e yt e c h n o l o g i e si nb i o m e t r i c s ,i s b e l i e v e dt oh a v eag r e a td e a lo fp o t e n t i a la n dw i d ea p p l i c a t i o n si nd i g i t a lp e r s o n a l i d e n t i f i c a t i o n ,i n t e l l i g e n ts u r v e i l l a n c e ,m e s s a g es e c u r i t y , b a n kf i n a n c e ,e t c h o w e v e r , f a c er e c o g n i t i o nt e c h n i q u e sa r ea l s of u l lo fc h a l l e n g e su n d e rt h en o n - i d e a lc o n d i t i o n s f a c er e c o g n i t i o ni sd e f i n i t e l ya f f e c t e db yi l l u m i n a t i o na n dp o s e si nf a c ei m a g e sa si t i sb a s e do nt h ep h o t i c sf a c ei m a g e s s ot h e r ea r ea l o to fk e yi s s u e st or e s o l v et o d e v e l o par o b u s ta n dp r a c t i c a la f rs y s t e m t h i sa r t i c l eb r i e f l ya n a l y z e st h ef a c er e c o g n i t i o nr e s e a r c ha th o m ea n da b r o a di n t h eh i s t o r ya n dc u r r e n ts i t u a t i o n ,a n dd e s c r i b e sm a i nm e t h o d sf o ri m a g ep r e p r o c e s s i n g , t h e ns t u d i e ss e v e r a lp o p u l a rh u m a nf a c ef e a t u r ee x t r a c t i o na l g o r i t h m s a n dt h e i r i m p r o v e m e n t s ,l a s t l y , e x p l o r e st h ed e s i g na n di m p l e m e n t a t i o no fh u m a nf a c ei m a g e r e c o g n i t i o ns y s t e mb a s e do nf u z z yr b fn e u r a ln e t w o r k t h em a i nw o r k so ft h i s p a p e ra r ea sf o l l o w s : 1 t h ed d c t ( d i v i d e dd i s c r e t ec o s i n et r a n s f o r m ) t r a n s f o r m a t i o no fh u m a n f a c ei m a g e s f i r s t l y ,w es e g m e n tt h eh u m a nf a c ei n t os e v e r a lb l o c k s ,t h e np e r f o r m t h ed c t ( d i s c r e t ec o s i n et r a n s f o r m ) t r a n s f o r mo fe a c hb l o c k f i n a l l y ,w es e l e c tt h e d c tc o e f f i c i e n t so fl o wa n dh i g hf r e q u e n c yc o m p o n e n t sa n dc o n s t r u c tc h a r a c t e r i s t i c m a t r i xf o re a c hf a c eb l o c k s 2 c o m p r e s sa n dr e d u c et h e d i m e n s i o n so fd c tf e a t u r e sm a t r i xu s i n gt h e t c s v d ( s i n g u l a rv a l u ed e c o m p o s i t i o nt h r e s h o l dc o m p r e s s i o n ) m e t h o d s i n c et h e s e g m e n t e di m a g eb l o c k sc o n t a i nal o to fr e d u n d a n ti n f o r m a t i o nc a u s e db ys h i e l d i n g , i l l u m i n a t i n ga n de x p r e s s i o nc h a n g e s ,s oi ti sn e c e s s a r yt oc o m p r e s sa n dr e d u c et h e i m a g es i n g u l a r v a l u ed i m e n s i o n a l i t y , a n dt h e nc o m b i n et h e s ec h a r a c t e r i s t i c s o f s i n g u l a rv a l u et o c o n s t r u c taf i n a lc o m b i n a t i o no fc h a r a c t e r i s t i c so fh u m a nf a c e id e n t if i c a t i o n 3 d e s i g naf a c ei m a g ec l a s s i f i e rb a s e do nf u z z yr b fn e u r a ln e t w o r k a sr b f n e t w o r ki se q u i v a l e n tt of u z z yr e a s o n i n gi nf u n c t i o n ,w ec a l l u n i f i e dt h et w o i i d i f f e r e n ts y s t e m s ,s ot h a tt h en e t w o r kp a r a m e t e r sa n do p e r a t i o n sh a v eac l e a r m e a n i n g w em a k et h en u m b e ro fc l u s t e rc e n t e r sc o r r e s p o n dw i t ha n dt h en u m b e ro f f u z z yr u l e si nr b fn e t w o r kt oc o n s t r u c tt h en e t w o r ke n v i r o n m e n tp a r a m e t e r st o m a k et h en e t w o r kh a v et h ec a p a b i l i t yo ff u z z yr e a s o n i n ga n dc l a s s i f i c a t i o n 4 f u z z yr b fn e u r a ln e t w o r kt r a i n i n g b pl e a r n i n ga l g o r i t h mi sw i d e l ya p p l i e d i nf u z z yr b fn e u r a ln e t w o r k ,w h i c hh a st h el o wr a t eo fc o n v e r g e n c e ,t h e r e f o r e ,a n i m p r o v e dl e a r n i n ga l g o r i t h mn a m e dl e v e n b e r g m a r q u a r t ( l m ) f o rf u z z yr b f n e u r a l n e t w o r kw a sp r o p o s e da n di ti se f f e c t i v e l yi nt h en u m b e ro fl e a r n i n ga n dt h er a t eo f a c c u r a c y 5 a p p l i c a t i o ni n f a c er e c o g n i t i o n t e s t i n gt h et r a i n e df u z z yr b fn e u r a l n e t w o r kc l a s s i f i e ro no r lf a c e d a t a b a s e ,e x p e r i m e n t a l r e s u l t ss h o wt h e e f f e c t i v e n e s sa n df e a s i b i l i t yo ft h i sm e t h o d k e yw o r d s :p a t t e r nr e c o g n i t i o n ;f a c e r e c o g n i t i o n ;f e a t u r ee x t r a c t i o n ;f u z z y r b fn e r u ln e r w o r k ;c l a s s i f i e r i i i 长沙理工大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究 所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包 含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出 重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到 本声明的法律后果由本人承担。 作者签名:7 谰v 像日期:沙i d 年月日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同 意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许 论文被查阅和借阅。本人授权长沙理工大学可以将本学位论文的全部或 部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制 手段保存和汇编本学位论文。 本学位论文属于 l 、保密口,在年解密后适用本授权书。 2 、不保密由。 ( 请在以上相应方框内打“4 ”) 作者签名:咭问i 嵌 翩虢舌萄秀 日期:斟d 年易月) e 1 日期:d i p 年毛月) e 1 第一章绪论 1 1 人脸识别研究背景及意义 分类识别一直是人类所具有的及其重要而又基本的行为之一,自从计算机 诞生之日起,人们就开始尝试使计算机具有类似于人类的识别能力,并希望机 器能够代替人类进行相关的识别任务。分类识别也可称作模式识别( p a t t e r n r e c o g n i t i o n ) ,是人类的一项基本智能,兴起于2 0 世纪6 0 年代初期,并随着 计算机的普及和互联网的推广,己在众多的领域得到广泛应用,如:生物认证、 图像检索、数据挖掘、遥感、军事等等。图像识别也属于模式识别的范畴,是 随着图像处理技术的发展及应用而产生的一类问题,不同的是,其最终输出结 果并不是图像,而是根据图像所提取的有效特征,经处理而判断出的图像类别。 据统计,人类从外界获取的所有信息中,有高达8 0 以上的来自于视觉,因此图 像识别在模式识别中具有及其重要的地位。 人脸识别是图像识别的一项重要应用,是当前模式识别领域的一个相当活 跃的研究课题,是一个难度较大但具有广泛应用前景的研究领域,特别是在安全 验证、身份认证、视频通信、人机交互等方面有极大的应用价值,与其他诸如指 纹、虹膜、基因等生物认证系统相比,它更方便、友好。显然,一个产品的应用 范围和市场前景,在很大程度上取决于用户愿不愿意接受它。简单、自然和尽 可能少的用户参与,会使一个生物识别系统显得更为友好和方便,特别是在不 能接触识别对象时,更能体现出它的优越性。因此,尽管目前人脸识别系统的 性能普遍不如指纹识别系统,但人脸特征很可能是未来最常用的生物识别特征。 人脸识别系统除了可以应用于其他生物识别系统应用的场合,比如在需要用户 专门配合的法庭举证,持证人核对,计算机登陆,网络访问,重要建筑物和边 境的进出控制等,它还可用于无需用户刻意配合的视频监控,视频流的自动剪 辑等领域,在罪犯缉拿,视频检索等许多方面都有广泛的应用前景幢一1 。 人脸识别的具体应用主要有以下几个方面: l 、安全控制:在要求较高的地方如政府、医院,可以建立无门卫的门禁系 统。对于来访者,可以通过人脸识别系统进行验证。在登录网络或计算机时, 可以用人脸识别技术代替口令的输入,这样就不用担心口令的丢失、忘记或者 被窃取,从而可以增加重要文件的安全性。 2 、司法应用:最常见的是罪犯识别,基本方法是对比目标特征和数据库存 储特征的相似性,目标图像的自然属性是关键的,决定着整个过程的困难程度。 比如,有时候目标图像仅是通过目击证人的口头描述而勾勒出来的,显然不能 和实拍照片相比。其它类似的应用程序有驾照、护照等识别。 3 、电子商务:在在线金融、贸易活动中,人脸识别可以提供客户的身份认 证,并保证商业活动无拒付地良性运转。这对交易双方、银行都是很方便的, 因为“n op i nt or e m e m b e r ,n op i nt of o r g e t ”。 4 、视频会议:视频会议是利用通信网以及电视实况方式召开的会议。通过 视频会议系统,位于各地的与会者在开会时既可听到对方的声音,又可看到对 方的影像、会议室的场景以及会议中展示的图片、表格等。这样可以大大节省 会议差旅费,提高办事效率,节省时间。另外,视频会议系统在远程教学、远 程医疗等领域中也有着广泛的应用。人脸的跟踪识别是视频会议中的关键技术 之一。 5 、人机交互:人机交互是研究人、计算机以及它们之间相互影响的技术。 传统的人机交互是通过计算机键盘和鼠标进行的。然而人们期望计算机智能化, 能够以自然的方式与人进行交流。人机交互研究的最终目的在于讨论如何使所 设计的计算机能帮助人们更安全、有效地完成所需任务。实现人机交互这一目 标的可能方式之一是使计算机具有识别和理解人的姿态、动作、手势等能力, 跟踪识别是完成这些任务的关键一步。 综上所述,人脸识别具有极大的市场前景,甚至可能形成一个巨大的、对 人类生活产生深刻影响的产业。 同时,人脸识别在学术上也有重要的研究意义。a f r 作为一个典型的图像模 式分析、理解与分类计算问题,它涉及到模式识别、图像处理、计算机视觉、生 理学、心理学、以及认知科学和神经网络等多个领域的诸多知识,并与基于其它 生物特征的身份鉴别方法以及计算机人机感知交互领域都有密切联系哺。1 。研究 它,不仅有助于构建这些学科领域的基础实验平台,而且可以尝试新方法、验证 新理论、解释新现象,从而极大的促进这些学科的成熟和发展。在模式识别领域, 它被公认为最具有挑战性的问题之一:集中体现在模式种类繁多,不同类别模式 问差别微妙,而且在数据采集过程中很容易受到干扰,比如噪声、摄像设备的精 密程度、外界环境的变化以及数据缺损等,这些因素对识别率的影响都是很突出 的。在计算机视觉领域,怎样才能准确地恢复特定人脸的3 d 结构模型,也是一 个非常有意义的研究问题。同时它又是智能人机接口领域的重要研究内容之一。 人脸识别的本质是企图赋予计算机区分不同人类个体的能力,即“看 的能力, 这恰恰是智能人机接口研究需要解决的关键问题之一,也是机器智能化的重要表 现。这些问题的最终解决可以极大的改善目前呆板、不方便的人机交互环境,并 可以在相当程度上改变人们的生活方式。因此人脸识别研究对于开拓新兴技术领 域,促进跨领域的多学科综合发展具有重要的科学意义随刮。 2 1 2 国内外研究历史及现状 1 2 1 人脸识别研究历史 根据人脸识别算法的发展历程,大致可将人脸识别研究划分为三个阶段刮: 1 9 6 4 年至1 9 9 0 年可以算做人脸识别研究发展的第一阶段。这一阶段,人们 并不认为人脸识别是一个特殊模式识别问题,所采用的技术、方法也很一般, 主要是基于人脸的几何结构特征( g e o m e t r i cf e a t u r eb a s e d ) ,其次还包括引入 人工神经网络,所取得的重要研究成果都不多,远没有达到实际应用的要求。 1 9 9 1 年至1 9 9 7 年问短暂的7 年是人脸识别发展的第二阶段,这段时期取得 的研究成果很多,诞生了大量具有代表性的人脸识别算法,而且美国军方组织 的著名的f e r e t 人脸识别算法测试极大地推动了具有实际应用价值的商业人脸 识别系统的产生,例如f a c e l t 系统。 “特征脸”方法为这一阶段的研究开创了先河,它由美国人特克( t u r k ) 和潘特兰德( p e n t l a n d ) 提出,他们在麻省理工学院( m i t ) 媒体实验室所做的 贡献,在很大程度上促进了人脸识别技术的发展,直到现在,特征脸与归一化 的协相关量( n o r m a l i z e d c o r r e l a t i o n ) 相结合的方法成为了人脸识别性能测试 的基准算法。 与此同时,同样是在m i t 学院,布鲁内里( b r u n e l1i ) 和波基奥( p o g g i o ) 两人做了一个基于结构特征的方法与基于模板匹配的方法的识别性能对比实 验,并得出一个具有导向性的结论:模板匹配的方法优于基于特征的方法。 随后的贝尔胡米尔( b e l h u m e u r ) 等人提出了f is h e r f a c e 方法,他们首先 利用主成分分析法( p c a ) 对图像进行降维,然后采用线性判别分析法( l d a ) 对降维后的主成分进行处理,从而使类间散度尽量大而类内散度尽量小。该方 法至今是人脸识别的主流方法之一,据此产生的变种也很多,主要有基于零空 间、基于子空间和基于核的方法等等。 马哈丹( m o g h a d d a m ) 提出的基于双子空间的方法就是对特征脸方法的改进, 他另辟蹊径,把人脸图像间的相似度计算问题转换成一个类内差和类间差的分 类问题。首先利用p c a 技术对两类数据进行降维,得到两类的条件概率密度, 然后对此进行贝叶斯决策来得到识别结果。 这一时期还出现了另一种重要的方法一弹性图匹配技术( e l a s t i cg r a p h m a t c h i n g ,e g m ) 。该方法的优势在于对人脸关键局部特征进行建模的同时保留 了面部的全局结构特征,达到了较理想的识别效果。 艾提克( a t i c k ) 等人提出了局部特征分析技术( l f a ) ,它其实是一种针对 维数较低的对象的基于统计的方法,p c a 技术的缺点是只能提取面部全局特征而 不能保留局部特征,而l f a 技术相比p c a 技术,它提取的特征是基于局部的, 但同时也保留了全局拓扑信息,所以在描述和判别能力方面更加优越。基于l f a 技术的著名应用就是f a c e i t 系统具有很好的识别效果。 主动形状模型( a s m ) 和主动表观模型( a a m ) 也是这一阶段的重要成果, 它们统称为柔性模型( f l e x i b l em o d e l s ) 。a s m 与a a m 是基于人脸的2 d 形状和 纹理进行统计建模的方法,通过p c a 将二者融合起来合成人脸。柔性模型在人 脸特征对准( f a c ea 1i g n m e n t ) 和识别中应用比较广泛,基于它的改进模型也 很多。 综上所述,在第二阶段出现的人脸识别技术很多,各种方法发展也很迅速。 其中主流的技术有:基于2 d 人脸的图像线性子空间判别分析法、基于统计表观 模型的方法以及统计模式识别方法。它们在较理想条件下普遍都具有很好的识 别性能,如在图像采集过程中噪音较小、对象比较配合、人脸图像库比较小且 人脸无需矫正的情况下。其中更有不少优秀的技术被应用于实用的商业系统, 获得了不菲的经济效益。 1 9 9 8 年直到现在是人脸识别发展的第三阶段。美国军方在9 6 年举行的著名 的f e r e t 人脸识别算法测试结果表明:大多数人脸识别技术在较理想的条件下 都表现出良好的识别性能,但在光照强度不一、姿态变化多样等非理想条件下或 者对象不配合情况下的鲁棒性不强,适应性较差。因此,光照、姿态等问题就自 然成为了下一阶段人脸识别的关键问题。随之而来的,人脸识别的商业系统也得 到了进一步发展和改进。而且,2 0 0 0 年和2 0 0 2 年的f e r e t 测试还加入了对商 业系统评测,更加促进了商业系统的发展进步。 基于光照锥( i l l u m i n a t i o nc o n e s ) 模型的方法就是在多姿态、多光照条件下提 出的,它通过计算每个图像到光照锥的距离来对人脸进行分类识别。基奥盖蒂斯 ( g e o r g h i a d e s ) 等人利用它得出了一个重要结论:在相同视角、不同光照强度 下的所有同一人脸图像在其图像空间中会产生一个光照锥。 在研究基于小样本下的机器学习规律方面,统计学习理论有着广泛的应用, 而支持向量机( s u p p o r tv e c t o rm a c h i n e ,s v m ) 作为一种具有代表性的统计学习方 法,同样可以用来进行人脸识别与确认。人脸识别是一个多类分类问题,而支持 向量机是基于两类分类的,所以如何将一个两类问题转换成多类分类问题就成为 了其难点。一般的,有三种方法可以解决这个问题,即:类内差与类间差法、一 对多法以及一对一法。 为了克服姿态变化对人脸识别性能的影响,也为了进一步提高人脸识别性 能,2 0 世纪9 0 年代后期,一些研究者开始采用基于3 d 的人脸识别算法。这些 算法有的本身就采用三维描述人脸,有的则用二维图像建立三维模型,并利用三 维模型生成各种光照、姿态下的合成图像,利用这些合成图像进行人脸识别。基 于3 d 变形( 3 dm o r p h a b l em o d e l ) 模型的方法是这一时期具有开创性的人脸识别 4 方法。该方法实质上是一种基于合成的分析( a n a l y s i s b y s y n t h e s i s ) 技术,其主要 作用在于它在基于人脸3 d 形状和面部纹理特征统计变形模型的同时,利用了图 形学模拟的方法对采集图像过程中的透视投影和光照模型参数进行建模,从而把 人脸3 d 形状和纹理等内部固有属性与摄像设备配置、光照强度等外部参数完全 分离开,更加有利于对人脸图像进行分析和识别。 在2 0 0 1 年举行的的国际计算机视觉大会上,维奥拉( v i o l a ) 和琼斯( j o n e s ) 展示了一个实时人脸检测系统,此系统基于简单矩形特征和a d a b o o s t 的方法, 在检测准正面的c i f 格式的人脸方面,达到了每秒l5 帧以上的检测速度。这为 后续的人脸识别研究提供了很好的实际指导。该方法的主要贡献在于:1 ) 使用 简单矩形特征作为人脸图像特征,有利于进行快速计算;2 ) 通过a d a b o o s t 将多 个分类能力弱的分类器进行组合形成一个强分类器;3 ) 采用级联( c a s c a d e ) 技 术使检测速度加快。直至目前,这种基于人脸与非人脸学习的策略已经能够很好 地实现准实时的多姿态人脸检测与跟踪。 沙苏哈等在2 0 0 1 年又提出了一种基于商图像的人脸图像识别与绘制技术。 该技术是基于特定对象类图像集合进行学习的,可以只根据训练样本集合中的少 量不同光照程度的图像,合成任一输入的人脸图像在不同光照条件下的合成图 像。 利用球面谐波( s p h e r i c a lh a r m o n i c s ) 表示光照、用卷积过程描述朗博反射 的人脸识别方法被巴斯里( b a s r i ) 和雅各布( j a c o b s ) 提出,他们证明了一个 重要结论:从任意远的点光源获得的所有朗博反射函数的集合形成一个线性子空 间,这为光照问题的解决提供了一种重要的思路。 美国国防部资助的f e r e t 项目为人脸识别技术的发展起了至关重要的作用。 f e r e t 项目是为安全、情报和执法部门而启动的,旨在开发出实用的a f r 技术。 项目包括三部分:1 ) 为各项人脸识别研究吸纳资金;2 ) 为f e r e t 项目创建一个 专门的用于评测的人脸图像数据库;3 ) 定时开展对人脸识别系统的性能评测。 在19 9 4 至1 9 9 6 这三年间,f e r e t 项目每年开展了一次人脸识别系统评测,参加 测试的包括当今最知名的几种算法,极大地推动了这些算法的演进和实用化进 程。更可贵的是,测试期间获得了三个很重要的结论:1 ) 人脸识别技术到目前 已取得了很多实质性的进展,m i t 媒体实验室与其他的一些研究小组在改善算法 性能方面做出了突出贡献;2 ) 参加评估检测的绝大多数算法在性能上表现为同 一档次,除开m i t 算法,其余的一些算法之间并没有明显的差异;3 ) 随着训练和 测试集的变化算法的性能也有所幅动。f e r e t 测试使得人脸识别技术产生了阶段 性的质变,各项人脸识别技术也已取得了丰硕的成果。从初始阶段飞跃至原型系 统阶段,再从原型系统阶段到商业应用系统阶段。 到了商业应用系统阶段,为了获取所用技术的真实发展情况,美国国防部 相关部门继f e r e t 项目之后,又开展了一项名为f r v t 的评测,此次评测专门 针对时下一些著名的商业人脸识别系统。f r v t 评测直至目前己举办了两次: 2 0 0 0 年的f r v t 2 0 0 0 和2 0 0 2 年的f r v t 2 0 0 2 。f r v t 评测一方面是对各知名的 人脸识别系统做性能比较,另一方面则是对人脸识别技术的发展现状做如下总 结:在较理想条件下( 人脸正向) ,在3 7 4 3 7 人的共1 2 1 ,5 8 9 幅图像上,人脸识 别所能达到的最高识别率为7 3 ,等错误率( e e r ) 为6 左右。f r v t 测试还有一 个重要的贡献,它进一步指明了当前人脸识别算法存在的若干尚未解决的突出问 题。例如,目前的一些主流商业系统的识别性能仍然容易受到室内外光照强度变 化、姿态变化和时间跨度等条件的影响,基于大规模人脸库的有效识别率问题也 很突出,这些问题都需要我们进一步的研究和改善。f r v t 2 0 0 6 则明确指出,人 脸识别过程中的光照和年龄变化仍然对人脸识别的性能造成很大的影响,基于二 维的人脸识别并不比基于三维的人脸识别性能差。 总的来说,在诸如光照强度不一、姿态变化、识别对象不配合以及大规模人 脸库上的人脸识别已经成为研究的热点。人脸识别研究也不限于只遵循单一的方 法,更多的是基于几种方法的结合来进行分类识别。在已有的识别技术中,统计 学习理论、非线性建模方法、基于3 d 模型的人脸建模与识别方法以及基于 b o o s t i n g 的学习技术等正成为备受重视的技术发展趋势阳1 。 1 2 2 人脸识别研究现状 自上世纪六七十年代开始,人们就已经对自动人脸识别产生了强烈的研究 兴趣。在过去的四十多年的时间里,心理学家、神经生理学家和工程技术人员 对人和机器如何识别人脸的各个方面进行了广泛的研究,涌现出了许多优秀的 技术和方法。 从九十年代开始,计算机技术得到了飞速发展,模式识别技术方兴未艾, 人脸识别技术随之得到了飞速发展。特征提取方面,涌现了一大批出色的技术 和方法,主要有:k - l 、g a b o r 、d c t 、f f t 、h o u g h 等变换,p c a 、l d a 、i c a 等 方法;分类器设计方面,人工神经网络( n n ) 、贝叶斯决策、最近邻分类器、线 性分类器、支持向量机( s v m ) 都有着广泛的应用。在近三十多年里,大量研究者 在人脸识别方面取得了丰硕的成果。其中起到突出贡献的有:m i t 媒体实验室、 m i t 人工智能实验室、c m u 、m a r y l a n d 大学等,国内具有突出贡献的一些大学和 研究机构主要有:清华大学、南京理工大学、中山大学、中科院计算所、哈尔 滨工业大学等。人脸识别研究的学术交流十分活跃。9 0 年代以来,被e i 检索的 相关论文数量己达数千篇。一些计算机视觉、模式识别领域的重要国际学术会 议( 如i c c v ,i c p r ,c v p r 等) 都纷纷设有人脸识别的专题。i e e e 模式分析与机 6 器智能( p a t e r na n a l y s i sa n dm a c h i n ei n t e l li g e n c e ,p a m i ) 和模式识别 ( p a t t e r nr e c o g n i t i o n ) 等国际知名杂志每年都有关于人脸识别的最新研究成果 发表。 由于人脸图像容易受到光照、姿态、表情等因素的影响,因此对细节变化如 此复杂的人脸目标进行识别是一件相当困难的事情,主要体现在: ( 1 ) 检测图像中是否包含目标人脸,存在多少张人脸:即如何区别人脸和类 似人脸的非人脸图像,这是人脸检测要解决的首要问题,也是它不同于其他有关 人脸研究的地方。 ( 2 ) 人脸具有相当复杂的细节变化,包括外貌、肤色、表面粗糙度以及表情 等模式的可变性如眼、嘴的开与闭等;而且还可能存在眼镜、胡须甚至伤痕等附 属物。 ( 3 ) 由于成像角度的不同造成人脸的多姿态,如平面内旋转、深度旋转以及 上下旋转,其中深度旋转影响较大; ( 4 ) 图像质量,如图像中的亮度、对比度的变化和阴影等;另外还有噪声的 影响等等。 ( 5 ) 图像的成像条件,如摄像设备的焦距、成像距离,图像获得的途径等等。 人脸识别比较常用且热门的方法主要有:1 、基于主元分析的人脸识别方法, 包括特征脸( e i g e n f a c e s ) 方法、f i s h e r f a c e s 方法、基于核技术的方法、独立成 分分析法( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 等。2 、基于奇异值分解的人脸 识别方法,主要有奇异值分解( s v d ) 、类估计基空间方法等等。3 、基于几何结构 特征与灰度特征融合的人脸识别方法,包括主动外观模型( a c t i v ea p p e a r a n c e m o d e ,a a m ) 、弹性图匹配技术、基于g a b o r 小波变换的方法等等。4 、非线性建模 人脸识别方法,包括核主成分分析、等度规映射( i s o m e t r i cm a p p i n g ,i s o m a p ) 、 局部线性嵌套( 1 0 c a l l yli n e a re m b e d d i n g ,l l e ) 算法、拉普拉斯特征映射 ( 1 a p l a c i a ne i g e n m a p ) 等等。5 、基于隐马尔可夫模型的入脸识别方法,包括二维 离散余弦变换( 2 一d i m e n s i o n a ld i s p e r s ec o s i n et r a n s f o r m ,2 d - d c t ) 方法等等。 6 、基于图像重建和图像融合的人脸识别方法,主要有基于三维人脸模型方法等等。 这些人脸识别技术在适应性上都面临着严峻的考验,不同的识别系统一般只 适用于有限的实际环境,而通用的识别系统通常也无法满足一些特殊的需求,因 此将不同的分类方法组合起来是当今的研究热门,希望能借此达到令人满意的总 体识别率。随着人工神经网络、模糊技术在各个学科领域的渗透,将经典理论与 神经网络、模糊逻辑相结合的方法正成为人脸识别领域中的热门方法。其中,b p 神经网络和r b f 神经网络是两种应用最为广泛的人工神经网络 剖。 7 1 3 人脸识别主要内容 模式识别系统主要包括四个组成部分:数据获取,预处理,特征提取与选 择,分类决策。一个完整的人脸识别系统主要包括以下几个环节:图像获取、 人脸的检测与定位、图像预处理、人脸特征提取、训练分类器、人脸识别。 一个自动人脸识别系统主要包括下面五个部分,含有三个主要的技术环节 随刮,如图1 1 所示: 图检 像测 特 或 与 征 视 分提 频 割取 人 输 脸出 识结 别 果 图1 1 人脸识别系统框架 首先是人脸检测与定位,它的目的是检测出图像中是否存在人脸,如果存在, 则将人脸与背景分割出来,并确定人脸在图像中的位置。在某些摄像可控场合, 比如警察在采集罪犯照片时,可以命令他们将脸的某一部分靠近标尺,这种情况 下的人脸定位十分简单。而且证件照片中的人脸图像都很正规,定位就是一件比 较容易的事情了。但是,在一些不可控的场合,由于无法事先探知到人脸在图像 中的位置,比如一些复杂背景下拍摄的照片,这时人脸的检测与定位将受以下至 少三个因素的影响:( 1 ) 、图像中人脸所处的位置、旋转角度和尺度不一致;( 2 ) 、 毛发和化妆物对某些人脸特征的遮盖;( 3 ) 、图像采集中产生的一些噪声。 其次是对图像进行预处理及特征提取。在提取特征之前我们一般需要对检测 出的图像做几何归一化和灰度归一化处理。其中前者是指将图像中的人脸变化到 同一位置和大小,后者是指对图像进行光照补偿等处理,以克服光照变化的影响。 但这也不是固定不变的,依照识别方法的不同,具体的特征抽取形式也会不同。 比如在基于几何特征的识别方法中,这一步主要是提取特征点,然后构造特征矢 量;而在基于统计识别的方法中,特征脸方法则是利用图像相关矩阵的特征矢量 构造特征脸,而隐马尔可夫方法则是对多个样本图像的空间序列训练出一个隐马 尔可夫模型,它的参数就是特征值;模板匹配法则是提取相关系数做为特征;而 大部分基于神经网络的方法则直接用归一化后的灰度图像作为输入,网络的输出 就是识别结果,没有专门的特征提取过程。 最后是人脸分类识别。在人脸图像数据库里预先存放了己知的人脸图像或相 3 关的特征值,识别的目的就是将待识别的图像或特征与库里的进行模式匹配。识 别的任务主要有两个:是人脸辨认,即确定输入图像为库中的哪一个人,是一 对多的匹配过程;另一个是人脸验证,即验证某个人的身份是否属实,是一对一 的匹配过程。根据输入图像的性质,一般可以将人脸识别分为基于静态图像的人 脸识别和基于动态图像序列的人脸识别两大类。前者主要是利用静态图像如从证 件照片、罪犯照片、场景照片中扫描的图像进行识别,后者则是用摄像机摄取的 时间图像序列进行识别。 本文从人脸识别必需的步骤出发,全面覆盖人脸识别的各组成部分,重 点对特征提取和分类器的设计进行研究创新,结合改进的d d c t 和t c s v d 特征 提取算法,融合模糊逻辑和r b f 神经网络各自的优势,构造出一个基于模糊神 经网络的人脸识别系统。以下就是本文研究的主要内容: 1 对图像进行预处理。本模块尽可能地去除或减小光照,成像系统,外 部环境等等对待处理图像的干扰,为后续处理提供高质量的图像。这部分对检 测到的人脸进行几何的归一化,消除噪声,灰度归一化,水平与垂直位置的校 正等处理。 2 特征的提取与选择。该模块完成从经过预处理模块处理的图像提取可 以用来识别的特征,将原始图像中的数据映射到特征空间中。由于原始图像的 数据量是相当大的,为了有效地实现分类识别,就要对原始数据进行变换,得 到最能反应分类本质的特征。如何提取稳定而有效的特征是分类识别的关键。 3 分类器设计。对基于模糊r b f 神经网络的人脸识别分类器进行研究, 设计出分类器的模糊r b f 神经网络系统结构,对现有的b p 网络学习算法进行 改进,提出一种改进的网络训练算法一l m 算法。 4 识别。使用国际上通用的o r l 人脸库样本进行训练,生成可用于识别 的参数,也就是可用于识别的分类器,最后根据训练所得到的模型( 参数) 完 成人脸的判别工作。本课题用m a t l a b 做仿真实验,给出最后的识别结果,并 做出相应的判断。 1 4 本文主要工作及内容安排 本文概括地分析了国内外在人脸识别方面的研究历史和现状,阐述了人脸图 像预处理的主要方法,研究了几种目前流行的人脸特征提取算法及其改进,重点 研究了基于模糊r b f 神经网络的人脸图像识别系统的设计与实现,提出了一种 改进的l e v e n b e r g m a r q u a r t 优化算法( 简称l m 算法) 对神经网络进行学习,改进 的l m 算法在学习次数和准确度方面都优于b p 算法。 本文的内容安排如下: 第一章绪论。概述了人脸识别技术的研究背景及意义,重点讲述了人脸识 9 别技术的国内外研究历史与现状,最后讲述了人脸识别技术的主要研究内容。 第二章人脸图像预处理。介绍并比较了几种常用的图像预处理方法,本文 采用中值滤波对人脸图像进行预处理。中值滤波不仅可以去除孤点噪声,而且可 以保持图像的边缘特征,不会使图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论