(计算机科学与技术专业论文)人脸识别技术研究.pdf_第1页
(计算机科学与技术专业论文)人脸识别技术研究.pdf_第2页
(计算机科学与技术专业论文)人脸识别技术研究.pdf_第3页
(计算机科学与技术专业论文)人脸识别技术研究.pdf_第4页
(计算机科学与技术专业论文)人脸识别技术研究.pdf_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 人脸识别技术是模式识别和机器视觉领域最富挑战性的研究课题之一,也是近 来研究的一个热点问题。到目前为止,己经有很多人脸识别方法被提出、实验甚至 投入实际应用,从识别率、计算复杂程度和占用资源几个方面可以看出识别方法各 有优缺点,如何发挥各种方法的优点,避免缺点,是我们的目标。本文重点贡献如 下: 1 、提出了一种小波变换和特征脸方法相结合的人脸识别方法。利用小波变换 对人脸i 訇像进行分解,然后对低频分量和中频平均分量分别运用特征脸分析构造“特 征子空间”,并做空间投影分别求得两个分量的相似度矩阵,最后使用它们的加权 矩阵来判决识别。该方法综合利用了特征脸分析高效、准确的优点和小波变换多分 辨率、多尺度的特点,合理使用两次加权增加了结果的可信度,实验表明它既能大 量减少计算量,又具有更高的识别率。 2 、提出了一种基于d c t 和神经网络的人脸识别方法,针对人脸图像分别提取 整体和局部的d c t 系数共同送入多层感知机分类器分类,实验表明该方法具有识别 速度快、识别率较高的综合优势。 3 、提出了一种i c a 和改进b p 神经网络相结合的人脸识别方法,采用改进的 三层b p 网络对i c a 降维后的人脸数据进行分类,提高了人脸的识别率,增强了人 脸识别系统的鲁棒性。其中i c a 算法采用高效的f a s t l c a 算法,改进的b p 算法采 用动量法和学习率自适应调整相结合的策略,降低了网络对于误差曲面局部细节的 敏感性,有效地抑制了网络限于局部极小的几率,提高了算法的收敛速度和可靠性。 通过实验证实该方法是一种非常有效的人脸识别方法,特别是对于人脸表情和姿态 等因素变化较大的人脸库,识别率提高效果更加明显。 关键词:小波变换;特征脸:d c t ;i c a b p 。 a b s t r a c t h u m a nf a c er e c o g n i t i o nt e c h n o l o g yi sam o s tc h a l l e n g i n ga n dh o ts u b j e c ti nt h e f i e l do fp a t t e r n r e c o g n i t i o na n dv i s i o no ft h em a c h i n e u pt on o w , t h e r eh a v em a n y m e t h o d so fr e c o g n i t i o no ff a c eb e e np r o p o s e d ,e x p e r i e n c e da n de v e np u ti n t op r a c t i c a l a p p l i c a t i o nh o w e v e r , i tc a nb ef o u n do u tf r o ms e v e r a lr e s p e c t so fd i s c e r n i n gr a t e ,t h e c o m p l e x i t yo fc a l c u l a t i o na n dr e s o u r c e st a k e nu pt h a tt h em e t h o d so fr e c o g n i t i o ne a c h h a v ep l u s e sa n dm i n u s e sh o wt of u l lp l a yt h ea d v a n t a g ea n da v o i dt h es h o r t c o m i n go f t h em e t h o d si so u rg o a lt h ei m p o r t a n tc o n t r i b u t i o n so ft h ep a p e ra r ed i s p l a y e da s f o l l o w i n g : 1a l l e wh u m a nf a c er e c o g n i t i o nm e t h o db a s e do ne i g e n f a c ea n a l y s i sa n dw a v e l e t t r a n s f o r mw a sp r o p o s e d f i r s t l y , s o m eh u m a nf a c ei m a g e sw e r ed e c o m p o s e du s i n g w a v e l e tt r a n s f o r m a t i o n ,a n dl o wf r e q u e n c ys u b b a n d sa n dm i d d l ef r e q u e n c ys u b b a n d s w e r ee x t r a c t e df o rt h el o wf r e q u e n c ys u b b a n d s ,a ne i g e n f a c es p a c ea n di t sf e a t u r e c o e f f i c i e n td a t a b a s ew e r ec o n s t r u c t e d f o rt h ea v e r a g em i d d l ef r e q u e n c ys u b b a n d s ,w e c o n s t r u c ta n o t h e re i g e n f a c e s p a c ea n di t sf e a t u r e c o e f f i c i e n td a t a b a s e f o l l o w i n g , af a c e i m a g ew a sp r o j e c t e di n t ot h et w os p a c e sa n dt w og r o u p so ff e a t u r e c o e f f i c i e n t sw e r e c a l c u l a t e dt h e yw e r ec o m p a r e dw i t ht h et w of e a t u r ec o e f f i c i e n td a t a b a s e s r e s p e c t i v e l yt o g e tt w os i m i l a r i t ym a t r i x e sf i n a l l y , t w om a t r i x e sw i t hd i f f e r e n tw e i g h t sf o rr e c o g n i t i o n w e r ea d d e de i g e n f a c ea n a l y s i sh a sm a n ya d v a n t a g e s ,s u c ha se f f e c t i v e n e s sa n dh i g h r e c o g n i t i o nr a t ew a v e l e tt r a n s f o r ma l s oh a sm a n ya d v a n t a g e s ,s u c ha sm u l t i r e s o l u t i o n a n a l y s i s a n dm u l t i s c a l e d e c o m p o s i t i o n t h i sa p p r o a c hs y n t h e t i c a l l yu t i l i z e dt h e s e a d v a n t a g e sa n dr e a s o n a b l yu s e dt w i c ea d d i t i o nt oi m p r o v ei t sp e r f o r m a n c e se x p e r i m e n t r e s u l t si n d i c a t et h a tt h i sm e t h o dc a nl a r g e l yr e d u c ec o m p u t i n gc o m p l e x i t ya n dh a sh i g h e r r e c o g n i t i o nr a t et h er e s u l t sa l s os h o wt h a tt h i sm e t h o dh a so b v i o u sp o t e n t i a li np r a c t i c a l u s a g e 2t h i sp a p e rh a sp r o p o s e da nm e t h o db a s e do nt h ed i s c r e t ec o s i n et r a n s f o r m ( d c t ) a n dn e u r a ln e t w o r k s ,w h i c he x t r a c t sh o l i s t i ca n dl o c a ld c t c o e f f i c i e n t sa n df e e d st h e mt o t h em u l t i l a y e rp e r c e p t i o nc l a s s i f i e r t h e e x p e r i m e n ts h o w st h em e t h o da c h i e v e sa b a l a n c e dt r a d e o f f b e t w e e nr e c o g n i t i o nr a t ea n ds p e e d 3an e wh u m a nf a c er e c o g n i t i o nb a s e do ni c aa n di m p r o v e db pn e u r a ln e t w o r k s w a sp r o p o s e d ,i tu s e si m p r o v e db pn e t w o r k so ft h r e el a y e r st os o r tf a c ed a t a b a s ea f t e r l o w e r e da n dl i n k si c ai th a sh i g h e rr e c o g n i t i o nr a t ea n ds t u p i da n de x c e l l e n to ff a c e 2 r e c o g n i t i o ns y s t e m i c aa d o p t sm o r ee f f e c t i v ea l g o r i t h mo ff a s t l c a ,i m p r o v e db p a d o p t sm o m e n t u mm o d e a n da d a p t i v ea d j u s t m e n to fs t u d y i n gr a t e ,i tr e d u c e ss e n s i t i v et o e r r o ro fc u r v e ds u r f a c ep a r t i c u l a r s ,e f f e c t i v e l yc o n t r o l st h es m a l l e s tr a t et h a tn e t w o r ki s l i m i t e dt op a r ta n di m p r o v e sd i s a p p e a r i n gs p e e do fc a l c u l a t i o na n dr e l i a b i l i t y b y e x p e r i m e n t s ,i t sc o n f i r m e da ne f f e c t i v em e t h o d ,e s p e c i a l l yi ti m p r o v e sr e c o g n i t i o nr a t et o f a c ed a t a b a s ec h a n g e d b ye x p r e s s i o na n dp o s t u r e k e yw o r d s :w a v e l e t t r a n s f o r m ;e i g e n f a e e ;d i s c r e t ec o s i n et r a n s f o r m ;i c a b p 引言 1 、课题的背景和意义 引言 基于生物特征的身份认证技术近年来发展迅速,计算机人脸识别技术是其中最 为活跃、最有挑战性的领域之一。它结合了认知科学、神经心理学、图像处理、计 算机图形学、机器视觉和模式识别等多个研究领域,研究成果有着广阔的应用前景。 人脸能够用于身份识别,主要因为人脸属于人本身固有的生物特征,这种特征 具有不可复制,难以伪造的特点,弥补了密码、签字、口令、证件等传统手段容易 泄密、遗忘的缺点。理论上,人的生物特征只要具有唯一性和稳定性,都可以作为 身份识别的依据。研究和经验表明,人的指纹、掌纹、面孔、发音、虹膜、视网膜、 骨架、基因等都具有这种特性“3 ,其中,人脸是众多生物特征中最方便获得的、可 以在非接触、不侵犯隐私条件下得到待识别人的特征,更易为人们所接受。 目前,由于人脸识别技术具有方便、易于被人接受、不易伪造等优点,越来越 受到各国政府的重视,我国新推出的第二代身份证上也嵌入了可机读的人脸图像信 息。在人脸识别系统应用方面,由于其价格与指纹识别相当,不仅可以用于公安系 统的人脸查询、而且可以用于基于人脸识别的门禁系统和考勤系统等多种应用场合。 人脸识别技术正在从叫好走向叫座。其突出特点有以下几个。1 : ( 1 ) 人脸识别技术有快速、简便、非侵扰和不需要人被动配合的特点。 其余的人体生物特征识别技术对人们来说都是一种干扰,都需要人的被动配合。 如指纹和掌纹识别都需要人们将手放在玻璃表面,而虹膜识别需要用激光照射人的 眼睛,而声音识别需要人对着麦克风讲话,字迹识别则需要人签字等等。而人脸识 别无需干扰人们的行为,你只需要很快从一架摄像机前走过,你的面貌就已经被快 速地采集和检验,所以非常简便。 ( 2 ) 人脸识别技术有良好的防伪、防欺诈、准确、直观、方便的特点。 旧其他人体生物特征识别技术相比较,只有面像识别是最直观、最可靠、最准 确的,因而它是优良的防伪、防欺诈的。 ( 3 ) 人脸识别技术具有性价比高、经济、可扩展性良好的特点。 入脸识别技术比其他的人体生物特征识别技术的性能要优越,它不需要人的行 为配合就能方便有效地核查人的身份,而且只需通用的p c 硬件及相关软件,因而经 济、性价比高:由于其直观、准确,且应用更为广泛,因此具有良好的可扩展性能。 其缺点是识别率不是很高,原因是人脸的表情很丰富,人脸会随着年龄的增长 而变化,人脸图像容易受到光照、成像角度和距离的影响,此外相似人脸( 如双胞 胎) 不易识别。 青岛大学硕士学位论文 由于人脸识别技术的独特优点,因而有着十分广泛的应用前景。其应用领域遍 及军队、政法、银行、物业、海关、互联网应用等。下面就其主要应用作简介如下: ( 1 ) 在银行金融系统中的应用 由于银行金融系统对安全防范控制系统有着极高的要求,如对金库的安全设 施、保险柜、自动柜员机以及电子商务信息系统等都需要人脸识别技术这种更直观、 准确、可靠的识别系统。近年来,金融诈骗、抢劫发生率有所增高,对传统的安 全措施提出了新的挑战。而人脸识别技术根本不需要带任何的电子、机械“钥匙”, 因而可杜绝丢失钥匙、密码的现象。如果配合i c 卡、指纹识别等技术,就可以使 安全系数更加成倍增长。而且,由于对每次操作事件都保存一条有时间、日期和人 体面像的记录,所以它具有良好的可跟踪性。当前,银行系统正在开展保险柜出租、 托管的业务,若银行使用这种识别系统,能提高安全系数和客户对银行的可信度。 此外,若在a t m 自动取款机上应用这种识别技术,可以解除用户忘记密码的苦恼, l f l 】且还叮以防止冒领、盗取事件的发生。 ( 2 ) 在政法系统中的应用 当前,我国的公、检、法正加强对经济、刑事等犯罪行为的打击力度,正在联 合开展追逃斗争。目前多是将逃犯的照片、身份证、特征资料上网发布。但这种方 法的判断要通过多种技术鉴定,它对证件资料假冒犯人的查询有较大难度,对犯罪 分子的狡辩、伪装往往要消耗大量的时间和物力来进行确认。利用人脸识别技术, 可大大提高工作效率,并能对犯罪分子产生极大的威慑力。如在重要的车站、码头、 机场、海关等出入口附近架设摄像机,则系统可在无人职守的情况下自动捕捉进、 出上述场所的人员头像,再通过网络将头像面貌特征数据传送到计算机中心数据库 去,与逃犯的头像进行比较,迅速准确地作出身份判断,一旦发现是吻合的头像, 即自动记录并报警。如英国伦敦警察局,由于使用了人脸识别系统,在三个月内破 案率就提高了3 4 。 ( 3 ) 在其他方面的应用 除在上面两大领域的应用外,人脸识别技术可广泛应用于军队、党政机关、物 业管理及其他一切需要的部门的安全验证、监控、门禁及一切出入口控制等多个方 面。甚至在家庭娱乐等领域,人脸识别也具有一些有趣有益的应用,比如能够识别 主人身份的智能玩具、家政机器人,具有真实面像的虚拟游戏玩家等。 鉴于人脸识别具有广泛的应用,人脸识别技术成为模式识别和机器视觉领域近 来研究的一个热点问题。但是另一方面,由于人脸之间存在很大的相似性以及人脸 的高度可变形性,也使得这个课题极富挑战性,到目前为止,己经取得的研究成果离 这一问题的彻底解决还有很大距离。 引言 2 、人脸识别理论概述 目前关于“人脸识别( f a c er e c o g n i t i o n ) ”的研究大概包括以下五个方面的内 容 3 = ( 1 ) 人脸检测( f a c ed e t e c t i o n ) :即从各种不同的场景中检测出人脸的存在并确 定其位置。这一任务主要受光照、噪音、面部倾斜度以及各种遮挡的影响。 ( 2 ) 人脸表征( f a c er e p r e s e n t a t i o n ) :即表示特征。通常的表示方法包括几何 特征( 如欧氏距离、曲率、角度) 、代数特征( 如矩阵特征矢量) 、固定特征模板、特 征脸、云纹图等。 ( 3 ) 人脸鉴别( f a c ei d e n t i f i c a t i o n ) :( 通常所说的“人脸识别”) :即将待识 别的人脸与数据库中的己知人脸比较,得出相关信息。这一过程的核心是选择适当 的人脸表征方式与匹配策略,系统的构造与人脸的表征方式密切相关。 ( 4 ) 表情、姿态分析( e x p r e s s i o n ,g e s t u r ea n a l y s i s ) :即对待识别人脸的表情 或姿态信息进行分析,并对其加以归类。 ( 5 ) 生理分类( p h y s i c a lc l a s s i f i c a t i o n ) :即对待识别人脸的生理特征进行分 析,得出其年龄、性别等相关信息。 人脸自动识别系统包括两个主要技术环节,如图l 所示。首先是人脸检测和定 竺型i 匿哩 和定位识别 鱼主 - 图1 人脸自动识别系统 位,即从输入图像中找到人脸及其存在的位置,并将人脸从背景中分割出来,然后 对人脸图像进行特征提取与识别。 如上所述,这两个环节的研究独立性很强。由于在很多特定情况下人脸检测与 定位工作比较简单,因此“特征提取与识别”环节得到了更为广泛和深入的研究: 而近几年来随着人们越来越关心各种复杂情形下的人脸自动识别问题,人脸检测与 定位才得到了较多的重视。 通常,人类进行人脸识别依靠的感觉器官包括视觉、听觉、嗅觉、触觉等,一 般人脸的识别可以用单个器官完成,也可以是多个器官相配合来存储和检索人脸, 而计算机的人脸识别所利用的主要是图像信息。另外,计算机人脸识别的进展还受 限于对人类本身识别系统的认识程度。研究表明,人类视觉数据的处理是一个分等 级的过程,其中最底层的数据过程( 视网膜功能) 起信息转储的作用,即将人眼接收 的大量图像数据转换为一个比较规则的紧凑表达形式。生理学的研究表明,人眼视 青岛大学硕士学位论文 网膜上存在着低层次和高层次的细胞。其中,低层次的细胞对空间的响应和小波变 换的结果相似;而高层次的细胞则依据一群低层次细胞的响应,而做出具体的线、 面乃至物体模式的响应。以此为依据,在计算机人脸识别中,可以将那些通过大量 图像数据简单处理后获得的特征定义为低层次特征,而将线、面、模式等描述特征 定义为高层次特征。由此,图像k l 变换后的系数特征、小波变换特征及一些统计特 征均属低层次特征的范畴,而人脸部件形状分析的结果则为高层次特征。由于视觉 数据经传输后的重建,需依赖于人脑中早期形成的先验知识,因此在人的识别系统 中,人脸的检测是一个整体识别和特征识别共同作用的结果。具体说来,远处辨认 人,主要是整体识别,而在近距离的人脸识别中,特征部件的识别则更重要。另外, 人脸的各部件对识别的贡献也不相同,如眼睛和嘴巴的重要程度大于鼻子,人脸上 半郜分重要性大十下半部分,其中特别的人脸更容易被识别记住。比如说歪嘴等人 脸就更容易使人记忆,没有个性的人脸相对的要更长的时间来辨认。根据对人脸的 研究表明,人脸的表情识别和人脸识别虽然存在联系,但总体说是分开的、并行的 处理过程。这些结论对于设计有效的识别方法起到了一定启发作用。在现有的识别 算法中,特征脸方法和神经网络方法是基于整体人脸的识别,而基于提取眼睛等部 件特征而形成特征相量的方法就是基于人脸特征的识别。 3 、人脸识别研究历史和现状 3 1 人脸识别研究历史 人脸作为人们日常生活中区分、辨识周围人的重要特征,对其研究己经有很长 的历史了。在早期的人类学等相关领域中,己经对其进行了定量、定性的尝试性描 述,例如:1 9 世纪,g a l t o n 就曾经用组数字代表不同的人脸侧面特征。这些研究工 作无疑对我们现在所从事的工作有重要的作用,但是由于人脸图像的自身的复杂性, 再加上其背景往往也比较复杂,对其研究有很大的困难。其计算的复杂性与方法的 特殊性,使得在2 0 世纪5 0 、6 0 年代人工智能与模式识别兴起之前,大多数工作都是 尝试性的,很难有突破。 人脸识别自2 0 世纪7 0 年代开始,经过多年的发展,结合了认知科学、心理学、 生理学、计算机、模式识别等相关领域的研究成果,如今达到了研究的高峰,目前 已经形成了些实用的产品,并形成了规模巨大的产业“3 。 上世纪6 0 年代,计算机技术、人工智能、模式识别以及相关技术的发展,极大 地推动了人脸识别的研究,并在7 0 年代初产生了第一阶段的重要研究成果,主要集 中于人脸识别所需要的面部特征,当然这一阶段没有彻底解决人脸的描述问题,后 续有很多人继续研究这一人脸识别的基本问题,直到现在,人们也没有从根本上解 4 引言 决它,但是这些成果却使人脸识别成为了现实可能。以b e r t i l l o n 、a i e n 和p a r k e 为代表,a l l e n 首先为人脸设计了一种有效和逼真的摹写,p a r k e 则用计算机实现了 这一想法,同时产生了较高质量的人脸灰度图模型,而b e r t i l l o n 提供了一个人脸与 指纹分析相结合的较强的识别系统。这一阶段的识别基本上都依赖于操作员。 第2 阶段是人机交互式识别阶段,这一阶段产生了人脸识别的基本方法,形成 了较为系统的体系,己经有基于特征和基于统计的识别方法之分。主要有g o l d s t 卜 o i l ,h a r m o n 和l e s k 用几何特征参数来表示人脸正面图像。k a y a 和k o b a y a s h i 则采 用了统计识别方法,用欧氏距离来表征人脸特征。t k a n a d ( m n a g a o ) 设计了一个 高速且有一定知识导引的半自动回溯识别系统,刨造性地运用积分投影法计算出一 组脸部特征参数,再利用模式分类技术与标准人脸相匹配。k a n a d 实现了快速、实 时处理的系统。b a r o n 所做的工作少为人知:他先将图像灰度归一,再用4 个掩模表 示人脸,计算掩模与数据库中图像相应掩模之间的互相关系数。总的来说,需要利 用操作员的某些先验知识,仍然摆脱不了人的干预。 第3 阶段是真正的机器自动识别阶段。近十余年来,随着高速度高性能计算机 的发展,机器人视觉的研究,人脸模式识别方法有了较大的突破,提出了多种机器 全自动识别系统,并出现了许多新的发展方向。 3 2 人脸识别研究现状 主流的人脸识别方法基本上可以归结为三类,即:基于几何特征的方法、基于 模板的方法和基于模型的方法。 l 、基于几何特征的方法是最早、最传统的方法,通常需要和其他算法结合才 能有较好的效果。基于几何特征的人脸识别方法,是通过人脸面部拓扑结构几何关 系的先验知识,利用基于结构的方法在知识的层次上提取人脸面部主要器官特征, 将人脸用一组几何特征矢量表示,识别归结为特征矢量之间的匹配,基于欧氏距离 的判决是最常用的识别方法。侧影识别是最早的基于几何特 征的人脸识别方法,主要是从人脸侧面轮廓线上提取特征点 入手( 人脸图像的侧面投影图如图2 ) 。一般将侧影简化为轮 廓曲线,从中抽取若干基准点,用这些点之问的几何特征来 进行识别。由于侧面照片约束很多,所以对侧面人脸的研究 已不多。人脸识别第一步是合适的归一化,使之不依赖于图 像中人脸位置的尺度和旋转变化。识别所采用的几何特征是 以人脸器官的形状和几何关系为基础的特征矢量,基分量通常包括人脸指定两点间 的欧氏距离、曲率、角度等。基于几何特征的识别方法具有存储量小、对光照不敏 感等优点。这种方法同样存在些问题: 从图像中抽取稳定的特征比较困难; 5 青岛大学硕士学位论文 对强烈表情变化和姿态变化鲁棒性较差: 造成部分信息丢失,适合于粗分类。 2 、基于模板的方法可以分为基于相关匹配的方法、特征脸方法、线性判别分析 方法、奇异值分解方法、神经网络方法、动态连接匹配方法等。 特征脸方法是2 0 世纪9 0 年代初期由t u r k 和p e n t l a n d 提出的、目前最流行的算法 之一,特征脸方法是从主要成分分析( p c a ) 导出的一种人脸识别和描述技术。p e a 实质上是k - l 展开的网络递推实现。k - l 变换是图像压缩技术中的一利嘬优j j 三交变换, 人们将它用于统计特征提取,从而形成子空间法模式识别的基础。若将k l 变换用于 人脸识别,则需假设人脸处于低维线性空间,由高维图像空间k l 变换后,可得到一 组新的正交基,由此可以通过保留部分正交基获得正交k l 基底。如将子空问对应特 征值较大的基底按照图像阵列排列,则可以看出这些正交基呈现出人脸的形状,因 此这些正交基也称为特征脸,这种人脸的识别方法也叫特征脸方法。实验表明,特 征脸方法存在如下特点:首先,由于作为一种图像的统计方法,图像中所有的像素 都被赋予了同等的地位,但是角度、光照、表情等干扰会使识别率下降;其次人脸 在人脸空间的分布近似高斯分布,且普通人脸位于均值附近,而特殊人脸则位于边 缘分布,可见,越普通的人脸越难分别,特征脸方法的本质是抓住了人群的统计特 征,反映了特定人脸库的统计特征,但不具有广泛性、代表性。利用fjs h e r f - t 据方 法是一种较好的改进方法,另一种成功的改进方法是将人脸进行差异分类,即分为 脸问差异和脸内差异,其中脸内差异属于同一个人脸的各种变形,而脸间差异表示 不同人脸的本质差异,而实际人脸图的差异为两者之和。由于特征脸方法儿有简单 有效的特点,现在特征脸算法已经与经典的模板匹配算法一起成为测试人脸识别系 统性能的基准算法;而自1 9 9 1 年特征脸技术诞生以来,研究者对其进行了各种各样 的实验和理论分析,f e r e t 9 6 n 试结果也表明,改进的特征脸算法是主流的人脸识 别技术,也是具有最好性能的识别方法之一。 近年来,由来自中科院计算所数字化室和哈尔滨工业大学的若干研究人员组成 的人脸识别研究组在对特征脸技术进行认真研究的基础上,尝试了基于特圳捡特征 提取方法和各种后端分类器相结合的方法,并提出了各种各样的改进版本或扩展算 法,主要的研究内容包括线性非线性判别分析( l d a k d a ) 、b a y e s i a n 概率模型、支 持矢量机( s v m ) 、人工神经网络( n n ) 以及类内和类间双子空间( i n t e r in tf a c l a s s d u a ls u b s p a c e ) 分析方法等等“1 。 先进人机通信技术联合实验室( 简称联合实验室j d l ) 针对特征脸贸法的缺点, 提出了特定人脸子空问( f s s ) 算法。该技术来源于但在本质上区别于传统的“特征脸” 人脸识别方法:“特征脸”方法中所有人共有一个人脸子空间,为每一个体人脸建 立一个该个体对象所私有的人脸子空问,从而不但能够更好地描述不同个体人脸之 间的差异性,而且最大可能地摈弃了对识别不利的类内差异性和噪声,因而比传统 引言 的“特征脸算法”具有更好的判别能力。另外,针对每个待识别个体只彳f 单一训练 样本的人脸识别问题,提出了一种基于单一样本生成多个训练样本的技术,从而使 得需要多个训练样本的个体人脸子空间方法可以适用于单训练样本人脸识别问题。 在y a l e 人脸库和实验室3 5 0 人图像库上的对比实验也表明该方法比传统的特征脸方 法、模板匹配方法对表情、光照、和一定范围内的姿态变化具有更好的鲁棒性,具 有更优的识别性能。 基于神经网络的方法是最近几年比较活跃的 个研究方向。应用神经网络进行人脸的特征提 取和分类器的设计( 神经网络分类器如图3 ) ,有 比较成熟的人脸特征提取算法自适应主分量 神经网络算法。研究人员还应用传统方法和神经 网络设计了组合分类器,在识别效果的准确率、 容错性、鲁棒性等方面取得了一定的进展。神经 网络方法在人脸识别上比其他类别的方法有独到 置l j x 图3 神经网络分类器 的优势,它避免了复杂的特征提取工作,可以通过学习的过程获得其他方法难以实 现的关于人脸识别规律和规则的隐性表达。但应用该方法神经元数目多,训练时间 长。 弹性图匹配方法是一种基于动态链接结构的方法。该方法在三维。跚q 中定义了 一种对于通常的人脸变形具有一定的不变性的距离,并采用属性拓扑幽来代表人 脸,拓扑图的任一顶点均包含一特征向量,用来记录人脸在该顶点位置附近的信息 ( 如图4 ) 。拓扑图的顶点采用了小波变换特征,它对于光纤、尺寸、,“发具有一定 的不变性。另外,弹性图匹配能够容忍表情的变化,并在一定程度上能够容忍视角 的变化。而这也是弹性图匹配方法优于特征脸方法的原因“1 。 图4 定义在人脸上的二维拓扑图表达人脸特征的二维向量场 弹性图匹配技术将人脸几何特征和对灰度分布信息进行小波纹理分析相结合, 从而较好地利用了人脸的结构和灰度分布信息,而且还具有自动精确定位面部特征 7 青岛大学硕士学位论文 点的功能,因而具有良好的识别效果,该技术在f e r e t 测试中若干指标名列前茅, 其缺点是时问复杂度高,实现复杂。先进人机通信技术联合实验室对该算法进行了 研究,并提出了一些启发策略。 基于模型的方法则有基于隐马尔柯夫模型,主动形状模型和主动外观模型的方 法等。 隐马尔可夫模型( h m m ) 是用于描述信号统计特征的一组统计模型。l n 瑚使用马 尔可夫链来模拟信号统计特征的变化,而这种变化是间接地通过观察序列来描述 的,因此,隐马尔可夫过程是一个双重的随机过程。其中之一是马尔可犬链,这是 基本随机过程,它描述状态的转移;另一个随机过程描述状态和观测值之问的统计 对应关系。在h m m 中,节点表示状态,有向边表示状态之间的转移,一个状态可以 有特征空间中的任意特征,对同一个特征,不同状态表现出这一特征的概率不同。 由于h m m 是一个统计模型,对于同一特征序列,可能会对应许多状态序列,特征序 列与状态序列之间的对应关系是非常正确的。 主动形状模型( a s m ) 和主动外观模型( a a m ) 是近年来流行的一般剥象形状提 取算法,其核心思想是在某种局部点模型匹配的基础上,利用统计模型刺待识别的 人脸的形状进行约束,从而转化为一个优化的问题,并期望最终收敛到实际的人脸 形状上去。 评价一个人脸自动识别系统的性能主要有两个标准:一是误识率,即将某人错 误地识别为其他人;二是拒识率,即无法识别某人。这两者是相互矛盾的,拒识率 降低了,误识率往往就会提高。因此在实际应用中,往往根据不同的翌求采取不同 的策略。在安全性要求较高的场合,要求较低的误识率,拒识率则会高一些。人脸 识别销售商测试会议2 0 0 2 ( f r v t2 0 0 2 ) 调查了l o 家从事人脸识别技术研究的公司,得 出结论说,这些公司在人脸识别技术上取得了显著的进步,他们代表了当今该技术 的发展水平。性能测试结果表明,这些人脸识别系统性能比前两年有了很大的提高。 与2 0 0 0 年的测试试验相比,现在他们在误识别率方面降低了5 0 ,在验i i l1 9 0 处于同 一时期人的身份时,其误判率只有1 ,这样的测试结果已经达到了】9 9 8 年进行的指 纹识别技术。 4 、本文的主要工作 本文深入研究了人脸识别技术的相关技术,在前人工作的基础上深入探讨、实 现了小波变换和特征脸方法相结合、基于d c t 和神经网络的人脸识别方法,并根据严 格实验结果阐述了两种方法的优缺点。 在此基础上,提出了一种i c h 和改进b p 神经网络相结合的人脸识别力法,采 用改进的三层b p 网络对i c a 降维后的人脸数据进行分类,提高了人脸的u 别率, 8 引言 增强了人脸识别系统的鲁棒性。其中i c a 算法采用高效的f a s t i c a 算法,改进的b p 算法采用动量法和学习率自适应调整相结合的策略,降低了网络对于误差曲面局部 细节的敏感性,有效地抑n t 网络限于局部极小的几率,提高了算法的收敛速度和 可靠性。通过实验证实该方法是一种非常有效的人脸识别方法,特别是对于人脸表 情和姿态等因素变化较大的人脸库,识别率提高得效果更加明显。 青岛大学硕士学位论文 第一章利用小波变换和特征脸方法相结合进行人脸识别 1 1 基本理论 1 1 1 小波变换 小波变换”1 具有多分辨率分析和多尺度分解等优点,是图像分析领域中的流行 工具。用二维小波变换对人脸图像做频域分解,可以得到四个区域:低频区域l l 是 近似分量,高频区域l h 、h l 、h h 分别是水平分量、垂直分量、对角分量。对每次 变换得到的l l 还可以再次进行小波变换,以此类推。图1 1 给出一次小波分解和 三次小波分解的示意图,其中1 为低频区域,8 、9 、1 0 为高频区域,其余的属于中 频区域。 l ll h h lt t t t l3 6 24 9 57 81 0 图1 1 一次小波分解和三次小波分解的示意图 计算人脸图像小波分解后各区域的信息熵,然后与原始人脸图像的信息熵比 较,就可以求得小波变换后各个区域所含原人脸图像信息的百分比,它同时电表明 了该区域所含原始人脸图像能量的多少。表ll 给出三次小波分解各区域所含能量 ( 信息) 的百分比”1 。 表1 1三次小波分解各区域所含能量( 信息) 的百分比 区域 12345678g1 0 1 4 1 4 1 4 2 8 2 8 2 8 5 6 -5 6 5 6 尺寸 1 4 1 2 1 21 21 22 42 42 4 4 84 84 8 能量 7 2 0 45 3 28 4 12 1 32 6 2 5 1 l2 0 6 ( ) 1 0 第一章利用小波变换和特征脸方法相结合进行人脸识别 图1 2 给出了一幅人脸图像一次小波分解后的各个区域,从左至右依次是l l 、 l h 、h l 、h h 、平均分量( ( l h + h l + h h ) 3 ) 。 1 1 2 特征脸方法 图1 2 人脸小波分解区域对比 特征脸方法是人脸识别中常用的一种方法,它是从主要成分分析( p c a ) 导出的 一种人脸识别和描述技术。p c a 实质上是k l 展开的网络递推实现。k l 变换是图像压 缩技术中的一种最优正交变换,人们将它用于统计特征提取,从而形成子空间法模 式识别的基础。特征脸方法是人脸图像的全局特征出发,运用k i 。变换月e 沦”1 ,在原 始人脸空间中求得一组正交向量,并以此构成新的人脸空间,使所有人脸的均方差 最小,达到降维的目的。这组正交向量被称为“特征脸”,它保留了人脸图像中的基 本信息。实验表明,特征脸方法存在如下特点:首先,由于作为一种幽像的统计方 法,图像中所有的像素都被赋予了同等的地位,但是角度、光照、表。竹等干扰会使 识别率下降:其次人脸在人脸空间的分布近似商斯分布,且普通人脸位j 均值附近, 而特殊人脸则位于边缘分布,可见。越普通的人脸越难分别,特征脸力法的本质是 抓住了人群的统计特征,反映了特定人脸库的统计特征,但不具有广泛性、代表性。 做k l 变换时,首先把人脸图像的所有行串联起来,作为原始图像矧词中的一个 矢量,然后以人脸训练图像库的总体散布矩阵作为产生矩阵,即: f ,、,、7 1 s t2 l 一脚) 【一所j ,x v c o , f = o ,l 2 ,| ) 一1 l 一( 1 ) lj 1m 一1 ,、,、r s t2 玄,三。【_ 一肥卅j 卜( 2 ) 其中,置为第i 个训练图像矢量,m 为训练图库的平均图像矢量,m 为切l 练图 像的总数。由正定矩阵s 求出的归化特征矢量玑即为“特征脸”,它的个数为 m 一1 。由于每一个人都有几幅不同的训练图像,一般来说它们在人脸空间中的位 置比较靠近,这就使得“特征脸”数量过多。如果用人脸类图像来做训练就可以 青岛大学硕士学位论文 大量减少“特征脸”的个数。根据这种思想,可以用训练图库的类问散布矩阵来作 为产生矩阵,即: = 鲐w i 恬,) ( m ,一m ) , “s , 其中现为训练图库中第f 个人的平均图像矢量,尸为训练图库中的总人数。由 r 求得的“特征脸”个数为p l 。依据k - l 变换理论,算法的复杂度与产生矩阵的 行数成正比,即与人脸图像矢量的个数和维数有关。可见使用类间散布矩阵s 来代 替总体散布矩阵墨,将使计算量减少。直接计算的特征矢量很困难,一般使用奇 异值分解定理( s v d ) “”来间接求得。 求出“特征脸”后,就可以用来构造“特征子空间”。这时可以选择所有的特 征矢量,也可以选取特征值较大的特征矢量( 即为p c a 法) 1 ,还可以选取特征值小 的特征矢量( 即为次分量法) 。 我们采用类间散布矩阵,对于每个人的训练图像平均矢量礁( f = 0 ,1 ,p 一1 ) , 向p 一1 维“特征子空间”u 上投影,得到一组坐标系数,称为特征系数矢j 垂,它代 表了这个人的人脸特征,即: c = u 7 幔,扛0 ,1 ,p l 卜( 4 ) 在进行人脸识别时,将待识别人脸图像f 向特征脸子空间u 投影求出其特征系 数矢量,然后与系数库c 中的系数矢量g 比较,根据其相似度来进行判断识别。 相似度的值域为( 一l ,1 ) ,值越大表明两个矢量越相似,其定义为: 帆,= 蹁 卜( 5 ) 图1 3 是训练库中的几幅人脸图像,图1 4 是用k l 变换求得的对应特征值较 图1 3人脸库图像 第一章利用小波变换和特征脸方法相结合进行人脸识昴 大的几张特征脸。 图1 4 部分特征脸 1 2 基于小波变换和特征脸方法的人脸识别 尽管“特征脸”分析容易受角度、光照、尺寸及表情等内外凶索的1 _ 扰,但它 的高效性和准确性仍然受到了越来越多的重视,许多以它为基础发展出来的方法, 如p c a 、f i s h e r 、p e m 等,已经成功应用于大量领域。在实际应月j 中,如何降低算 法复杂度和减小运算量,就成为一个关键问题。根据理论分析,j i 计算:复杂度主要 体现在两方面,一是由产生矩阵求“特征脸”,二是往人脸库中添加新的训练人脸 后需要重新构造产生矩阵来计算新的“特征脸”。其中最根本的是产二生矩阵,也就 是人脸矢量的个数和维数。其中,减小人脸矢量的维数,是较为现实的办法。 低频区域l 含有原始人脸图像大部分能量,其尺寸仅为原始图像的l 8 ,而同 尺寸的中频区域2 、3 、4 分别从不同的角度反映了该人脸的具体钏1 一特征。可见, 如果使用这些小尺寸的区域来代替原始人脸图像,那么在运用“特征脸”理论做识 别时,其产生矩阵的维数就会很小,从而使运算量减少。实验表i 圳,l l 与原始人脸 图像很相似,l h 、h l 、腻只能描述部分人脸特征,而平均分量( ( 1 ,1 h ) 3 ) 就能比较完整的描述该人脸具体特征。所以,使用l l 和平均分茧米代错原始人脸 图像,效果最好。 根据以上分析和实验,设计一种用三次小波分解后的低频分造乖i i l ,均分量来代 替原始人脸图像,然后运用“特征脸”分析进行识别。对低频分量和平均分量分别 构造“特征子空间”,计算出各自的特征系数矢量库。对于输入的待识封0 人脸图像, 先做三次小波变换,然后将得到的低频分量向对应的“特征予空间”投影,计算出 一个相似度矩阵,同理由平均分量也可求得另一个相似度矩阵,接着使j - i 不同的权 系数将两个相似度矩阵加权,由得到的最终相似度矩阵进行判决0 别。 该方法基本流程如下图1 5 所示。 在运用“特征脸”分析时,如果使用总体散布矩阵,那么采剐“彩点判决”法, 即寻找与待识别人脸之间相似度在一定范围内的所有空间点,根捌这些,- j i 的类属来 判断,属于哪类人脸的空间点个数多,则识别为该类人脸;如果使

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论