(计算机应用技术专业论文)人脸图像识别算法研究.pdf_第1页
(计算机应用技术专业论文)人脸图像识别算法研究.pdf_第2页
(计算机应用技术专业论文)人脸图像识别算法研究.pdf_第3页
(计算机应用技术专业论文)人脸图像识别算法研究.pdf_第4页
(计算机应用技术专业论文)人脸图像识别算法研究.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(计算机应用技术专业论文)人脸图像识别算法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人脸i 皇i 像识别算法研究:摘要 摘要 丁f 彬v f ,作为人 :智能的一个重要应用,人脸机器自动识别是一项极具挑战性的难 题。它以理论干uj , 、z j l 川的潜在价值一直激励着科研人员的不懈努力本文主要研 究了人脸蚓像的计算机识别问题,主要研究工作如下: 人脸检测是人脸谚 别的前期工作。本文首先从人脸粗检研究开始,研究了利 用肤色检测粗检人脸的方法。该方法首先将图像由r g b 空间归一转化到r g 空 间,以部分消除光照的影响。其次,建立混合高斯模型,并用e m 算法估算其 参数,以此来判断象素点是否为肤色象素通过肤色信息,得到人脸的粗略位置。 ) d u x j 于传统的肤色模型,所提方法能根据不同的训练样本建立不同的模型参数。 因此能适合各种不同的肤色特征。 基于主成分分析( p c a ) 的特征脸法是人脸识别中应用最广泛的方法。f 这种 方法将人脸的图像区域看作是一种随机向量,因此可以采用k l 变换获得其正交 k l 基底。对应其中较大特征值的基底具有与人脸相似的形状,因此又称之为特 征脸( e i g e n f a c e ) 。利用这些基底的线性组合可以描述、表达和逼近人脸图像, 因此可以进行人脸的识别j 本文研究了p c a 方法用于人脸图像识别的机制,并 川其挺取人脸特征向量。 目i j i 模式识别领域中应用最为广泛的是统计学习理论。支持向量机是建立在 统计学习理论基础上的解决两类问题的学习方法。由于其快速性和有效性,近年 来得到了广泛的研究和应用。本文研究统计学习理论,特别是小样本情况下机器 学习规律的理论,结合主成分分析法,提出一种以特征脸法提取特征,以支持向 量机做分类器的人脸识别方法o y 。 本文研究了特征脸法的本质弱点,同时研究了利用小波变换提取人脸特征的 优点。( g a b o r 函数是唯一能够到达测不准关系下界的函数,它能够很好的同时在 时域和频域中兼顾对信号分析的分辨率要求。g a b o r 函数这一特性是它在信号处 理中得到广泛的应用。g a b o r 变换具有局部性、方向选择性、带通性,因此能够 比较精确地提取图像的局部特征,且具有一定的抗干扰能力0 本文深入研究了基 _ - j 二g a b o r 变换的弹性图匹配方法,并针对其计算量大的缺点。提出了一种新的人 脸识别算法例用人脸的先验结构知识和人脸图像的灰度分布知识,先粗略找出 人脸的特征点,然后利用人脸弹性图来对其进行调整,最后在各个特征点处计算 g a b o r 变化系数集合,并以此来表示人脸的特征。相对于传统的弹性图匹配方法, 特征点预先被估算出来,而不是在整个图中搜索,因此大大地降低了计算量。广, f 根搦灰度分砷麒l i 识来定位人脸特征点的,这种方法的鲁棒性不是很好。如果 人脸幽像u 舄0 箅法研究:摘璺 图像质量很差往往会找不到特征点。而且,由于每个图像库的图像质量和特点 不一样,相应的算法中的参数就要相应调整,对于实际应用不太理想。主动表面 模型是一种基于统计学习的结合图像形状和纹理特征的搜索算法序文详细研究 了主动表丽模型理论以及其在提取特征点的应用。并且提出一种基于主动形状模 型和小波变换的人脸识别方法。这种方法比用人脸的先验结构知识和人脸图像的 扶度分布知识来定位特征点更为有效。 、 关键词人脸谚 j :;l i ;人脸榆测;肤色模刑;i i 成分分析;( 特征脸圹支持向戢机; 小波变换;弹性图遁配:主动表面模型 堕型垡堡型簦鎏堕塑! 垒! ! ! ! ! ! a b s t r a c t a sa ni m p o r t a n ta p p l i c a t i o no fa r t i f i c i a li n t e l l i g e n c e ,a u t o m a t i cm a c h i n ef a c e r e c o g n i t i o ni sac h a l l e n g i n ga n d d i f f i c u l tt a s k i t sg r e a tp o t e n t i a lv a l u e si nb o t ht h e o r y a n da p p l i c a t i o na r e a l w a y se n c o u r a g i n gr e s e a r c h e r s t oc o m m i tt h e m s e l v e st ot h e p r o b l e m t h i st h e s i s f o c u s e so nt h ea l g o r i t h m so ff a c er e c o g n i t i o na n dt h em a i n r e s e a r c h e sa r ea st h ef o l l o w s t h et h e s i sb e g i n sw i t ht h ec o a r s ed e t e c t i o no f f a c e ,w h i c hi st h ep r e w o r ko f f a c e r e c o g n i t i o n t h r o u g ht h es t u d yo f t h ef e a t u r eo fh u m a ns k i n ,w ep r e s e n tam e t h o do f s k i nd e t e c t i o n f i r s tw ec o n v e r tt h ei m a g ef r o mt h es p a c eo fr g bt or gi no r d e rt o w e a k e nt h ee f f e c to fi l l u m i n a t i o n t h eg a u s s i a nm i x t u r em o d e li ss e tu pa n de - m a l g o r i t h mi su s e dt oe s t i m a t ei t sp a r a m e t e r s ,w h i c hi su s e d t oj u d g ew e a t h e rt h ep i x e l i sas k i np i x e io rn o t c o m p a r e dw i t ht h et r a d i t i o n a ls k i nm o d e l ,i tc a nc h a n g ei t s m o d e lp a r a m e t e ra c c o r d i n gt ot h ed i f f e r e n tt r a i n s a m p l e s ot h i s m e t h o dc a nf i t d j 腩r e n ts k i nf e a t u r e s o n eo ft h em o s tp o p u l a rm e t h o d su s e di nt h ef a c er e c o g n i t i o ni s e i g e n f a c e m e t h o d ,w h i c hi sb a s e do nt h et h e o r yo fp r i n c i p l ec o m p o n e n ta n a l y s i s i tt r e a t st h e f a c ei m a g ea sav e c t o ra n d g e te i g e n v a l u ev e c t o ru s i n g k a r h u n e n l o e v ec o n v o l u t i o n t h ee i g e n v e c t o r sc o r r e s p o n d i n gt ot h el a r g ee i g e n v a l u e sa r es i m i l a rt ot h ef a c ea n d a r ec a l l e d e i g e n f a c e t h el i n e a rc o m b i n a t i o n so ft h e s ee i g e n v e c t o r s a r eu s e dt o d e s c r i b e ,r e p r e s e n ta n dr e c o g n i z et h ef a c ei m a g e t h i sp a p e rs t u d i e st h ep r i n c i p l eo f t h i sm e t h o da n du s e si tt oe x t r a c tt h ef e a t u r e s t h e t h e o r yo f s t a t i s t i cl e a r n i n gi sw i l d l yu s e di nt h ef i l e do f p a t t e r nr e c o g n i t i o n t h e s u p p o r tv e c t o rm a c h i n e i ss u c hat h e o r yt os o l v et w oc l a s s e sp r o b l a m b e c a u s e o fi t s s p e e d i n e s sa n de f f i c i e n c y , i ti sw i l d l yu s e db o t hi nr e s e a r c ha n da p p l i c a t i o n t h o u g ht h es t u d yo f t h es t a t i s t i cl e a r n i n gt h e o r y , e s p e c i a l l ys m a l lt r a i ns a m p l e s ,a n d a l s ot h e p r i n c i p l ec o m p o n e n ta n a l y s i s m e t h o da sr e f e r r e da b o v e ,t h et l i e s i sp r e s e n t sa m e t h o do ff a c er e c o g n i t i o nb ye i g e n f a c e + s v m ,t h a ti s ,u s i n ge i g e n f a c em e t h o dt o e x t r a c tf e a t u r ea n d u s i n gs v m t oc l a s s i f y t h e p a p e r s t u d i e st h e d i s a d v a n t a g e o fe i g e n f a c em e t h o da n dl e a r n s t h e a d v a n t a g eo fu s i n gw a v e l e tt or e p r e s e n tt h ef a c ef e a t u r e g a b o rf u n c t i o ni st h eo n l y o n et h a tc a ng e tt h el o w e rb o u n do fc a l c u l a t i o nu n c e r t a i n t ya n di tc a na c h i e v eg o o d r e s u l tb o t hi nt h es p a t i a la n df r e q u e n c yd o m a i n s s og a b o rf u n c t i o ni sw i l d l yu s e di n t h ef i l e do fs i g n a l p r o c e s s i n g g a b o r f u n c t i o nh a st h ec h a r a c t e r i s t i co fl o c a l i t y , i v 人脸i 璺i 像识别算法研究:a b s t r a c t d i r e c t i o na n dc a nb eu s e dt oe x t r a c tf a c ef e a t u r ea c c u r a t e l ya n da l s oh a st h ea b i l i t yo f d i s t u r br e s i s t a n c e t h et h e s i ss t u d i e st h ee l a s t i cb u n c hg r a p hm e t h o dt h a ti sb a s e do n t h eg a b o rc o n v o l u t i o n i n r e s o l v i n g i t sd r a w b a c ko fl a r g ec o m p u t a t i o n ,t h et h e s i s p r e s e n t an e wf a c e r e c o g n i t i o nm e t h o db a s e do ne b g m m e t h o d t h el o c a lf e a t u r e sa r ef i r s tl o c a t e du s i n g t h ef a c es t r u c t u r e k n o w l e d g ea n dg r a y l e v e ld i s t r i b u t i o ni n f o r m a t i o n t h e nt h e f e a t u r e sa r ea d j u s t e du s i n gad a t as t r u c t u r en a m e df a c eb u n c hg r a p h t h ef a c ei s r e p r e s e n t e db yt h eg a b o rj e t so f t h ef e a t u r e sa n dt h e i rs p a t i a ld i s t a n c e s a n db e e a n s e t h ef e a t u r ep o s i t i o n sa r ee s t i m a t e df i r s t ,r a t h e rt h a ns e a r c h i n go nt h ew h o l e i m a g e a si t d o e si ne l a s t i cb u n c hg r a p hm a t c h i n gm e t h o d ,t h ew h o l ec o m p u t a t i o ni s g r e a t l y d e c r e a s e d c o m p a r e d w i t ht h ee b g mm e t h o d t h em e t h o d u s i n gg r a yl e v e ld i s t r i b u t i o ni n f o r m a t i o nt of i n df a c i a lf e a t u r ei sn o t r o b u s te n o u g h i ft h eq u a l i t yo ft h ei m a g ei sn o t w e l l ,t h i sm e t h o ds o m e t i m em a yd o e s n o tw o r k a n dd u et ot h ed i f f e r e n c eb e t w e e ne a c hf a c ei m a g e d a t a b a s e 。e a c ht i m et h e p a r a m e t e r so ft h ea l g o r i t h mn e e dt oa d j u s t ,w h i c hi sn o tv e r yc o n v e n i e n tt ot h ea c t u a l a p p l i c a t i o n a c t i v ea p p e a r a n c em o d e l ,w h i c hi sb a s e do nt h et h e o r yo fs t a t i s t i c l e a r n i n g , i saf e a t u r ep o i n ts e a r c ha l g o r i t h mu s i n gs h a p ea n dt e x t u r ef e a t u r eo ft h e i m a g e t h et h e s i ss t u d i e st h et h e o r yo fa a m a n di t s a p p l i c a t i o ni n f e a t u r el o c a t i o n a n dp r e s e n taf a c e r e c o g n i t i o nm e t h o db a s e do na a ma n dg a b o rw a v e l e t t h i s m e t h o d p r o v e d t ob em o r e e f f i c i e n c yi nf a c i a lf e a t u r el o e a t i o n k e y w o r d s f a c er e c o g n i t i o n ;f a c ed e t e c t i o n ;s k i nm o d e l ;p r i n c i p l ec o m p o n e n t a n a l y s i s ; e i g e n f a c e ;s u p p o r t v e c t o r m a c h i n e ;w a v e l e tt r a n s f o r m ;e l a s t i c b u n c h g r a p h m a r c h i n g ;a c t i v ea p p e a r a n c em o d e l v 独创性声明 本人声明我所呈交的论文是我个人在导帅指导下进行的研究工 作及取得的研究成果。掘我所知,除厂文t i ,特刖加以标,t 和敛谢的地 方外,论文中不包含其他人已经发表或撰写过的训f 究成果。! j 我用 :二作的同志对本文所做的仟_ 叮贡献均已在沦义- l t 作j ,i p 】确的说l 帅并 表示了谢意。 作者签名:褒、辛l 歹,否 关于论文使用授权的说明 中国科学院计算技术研究所有权f 泶嗣送交论文:r r j 复印1 ,| :,允许沦 文被查阅和借阅;并可以公布论文的令部或部分内容,f 1 ,以采川影印、 缩印或其它复制手段保存该论文。 储签名镌幸铆繇衰寻知衫川 人脸图像识别算法研究:第一章绪论 第一章绪论 1 1 研究背景 自古以束,人们就一直试图用各种机器来代替人的部分脑力劳动。以提高征 服自然的能力。英国数学家t u r i n g 在1 9 5 0 年发表了题为“计算机与智能” ( c o r e p u t i n gm a c h i n e r ya n di n t e l l i g e n c e ) t i l 的论文,文章以“机器能思维么? ”开 始沦述并且提出了著名的“图灵测试”,形象地指出了什么是人工智能以及机器 应该达到的智能标准。“人工智能”在1 9 5 6 年作为- f l 新兴学科被正式提出。从 此之后,它已取得了惊人的成就。获得了迅速的发展。毫无疑问,现在它已经成 为人类科学技术中一门充满生机和希望的前沿学科。 人工智能的一个伟大目标是让计算机能够具有人一样的思维,氓有像人类一 样的思考能力,以及识别事物、处理事物的能力。我们希望计算机能够像人一样 于我们“自然和谐”地交往相处。但是大多数情况下人机交互的现状却令计算 机研究者极为尴尬:除了按照有序的和有意义的方式敲击计算机的输入传感器一 一大多数情况下只是键盘和鼠标之外,计算机无法与使用者交流更谈不上理 解使用者的情感并做出合适的反应。于是多模式接口1 2 】的研究应运而生:首先让 计算机能够“感觉”来自视觉、听觉乃至触觉、嗅觉、味觉等多种输入信息然后 由此“知晓( 理解) ”使用者的思想意图乃至情感,最终目的就是要实现“自然和 谐的人机接i l 。 而要实现这一目的,对于计算机使用者身份的确认是一项重要的的内容。感知 视觉信息的人脸识别( 包括虹膜识别) 、感知听觉信息的话者识别、感知触觉信息 的指纹识别等是实现身份确认的可选途径,不同通道的信息融合日益受到科研工作 者的重视。 入脸包含丰富的人类思想和情感信息,是研究人员关注的焦点。入脸识别技术 主要通过计算机分析人脸图像,从人脸图像中提取有效信息,从而进行身份识别。 人脸识别技术因其在公安( 罪犯识别等) 、安全验证系统、信用卡验证、医学、 档案管理、视频会议、人机交互系统等方面的巨大应用前景而成为当前模式识别 和人工智能领域的一个研究热点p l i 。 虽然人类能毫不费力地识别出入脸及其表情,能够记住并且识别上千个不同 的人脸。但人脸的自动机器识别却是一个难度极大的课题。人脸有复杂的三维表 面结构,因而人脸知识的表达相对简单物体来说较为复杂;同时面部肌肉的运动 使得人脸成为一种非刚体目标,与刚性目标识别相比,非刚性目标的识别更困难。 人脸图像识别算法研究:第一章鲭论 人脸表情丰富,人脸随着年龄增长而变化,人脸所成图像受光照、成像角度以及 成像距离等影响而且从二维图像重建三维人脸是病态的过程( “卜p o s e d ) 过 程,此外,所有人脸都具有相似的结构特征,而同一人的不同面部图像由于采集 条件的变化会发q :较大的变化( 对计算机而言) ,所以人脸识别算法必须挖掘不 同类别间微妙而可靠的差别。 同时,人脸弘 别的一些算法可以推广到一般的三维非刚体目标的识别上去, 促进其它模式、l j 别问题的解决。另外,人脸识别还涉及到图像处理、计算机视觉、 模,谚 刖以及神绛网络等学科,也和人腑的认矢程度紧密相关,这些诸多因素使 得人腧识别成为项极富有挑战性的课题。 同时,进行人脸图像识别研究也具有很大的使用价值。如同人的指纹一样, 人脸也具有唯一性。也可用来鉴别一个人的身份。现在已有实用的计算机自动指 纹识剐系统面世,并在安全检查等部门得到应用,但还没有通用成熟的人脸自动 识别系统出现。人脸图像的自动识别系统较之指纹识别系统、d n a 鉴定等更具方 便性,因为它取样方便,可以不接触目标就进行识别,从而开发研究的实际意义 更大。并且与指纹图像不同的是,人脸图像受很多因素的干扰:人脸表情的多样 性:以及外在的成像过程中的光照,图像尺寸,旋转,姿势变化等。使得同一个 人,在不同的环境下拍摄所得到的人脸图像不同,有时更会有很大的差别,给识 别带来很大难度。因此在各种干扰条件下实现人脸图像的识别,也就更具有挑战 性。 1 2 课题来源 本文的研究: 作得到国家自然科学基会重点项n ( 6 9 7 8 9 3 0 1 ) 、国家8 6 3 计划 “生物特征识别核心技术与关键问题研究”课题资助( 2 0 0 1 a a l l 4 1 9 0 ) 。以及银晨网 讯公司的大力资助。 1 3 相关背景理论知识 1 3 1 计算机视觉理论基本概念 计算机视觉就是用各种成像系统代替视觉器官作为视觉信息输入手段,由计 算机来代特大脑完成处理雨i 解释,并根据解释结果做 = i 相应的决策。计算机视觉 的最终研究目标就是使计算机能像人那样通过对视觉信息的处理来观察和理解 世界具有自主适应环境的能力1 5 l l “。 人脸图像识别算法研究:第一章绪论 人类的视觉系统是功能最强大和完善的视觉系统,但人们并不能描述和解释 自身的视觉系统是如何对信息进行处理的,因此通过对计算机视觉的研究、模拟, 人们有可能逐步地揭丌人类视觉的信息处理机制,从而了解人类的思维机制、推 理机制等。因此,用计算机信息处理的方法研究人类视觉的机理,建立人类视觉 的计算理论,也是一个非常重要和有趣的研究领域。同样地,通过其他途径,如 神经解剖学、心理学等方面对人类视觉的研究,也会给计算机视觉的研究提供启 发和指导,两者有相互促进作用1 7 j 。 除了神经解剖学、心理学,对计算机视觉的研究还要借助其它学科的知识, 如图像处理、模式识别( 图像识别) 、图像理解( 景物分析) 、图像生成等 1 图像处理 图像处理技术把输入图像转换成具有所希望特性的另一幅图像。例如,可通 过处理使输出图像平滑、或有较高的信噪比,同时还可通过增强处理来突出 图像的细节,以便于对图像特征的检验。在计算机视觉研究中经常需要利用 图像处理技术进行预处理和特征抽取,如各种数学变换技术等。 2 模式议别( 图像识别) 模式识别技术根据从图像抽取的统计特性或结构信息,把图像分成预定的类 别。例如,人脸识别、文字识别或指纹识别等。在计算机视觉中模式识别技 术经常用于对图像中的某些部分进行处理,例如分割区域的识别和分类。 3 图像理解( 景物分析) 给定一幅图像,图像理解程序不仅描述图像本身,而且描述和解释图像所代表 的景物,以便对图像代表的内容做出决定。在人工智能视觉研究的初期经常使 用景物分析这个术语。以强调二维图像与三维景物之问的区别。图像理解除了 需要复杂的图像处理技术外还需要具有关于景物成像的物理规律的知识以及 与景物内容有关的知识。 4 图像生成 根据图像的特性如对称性、纹理渐变性以及图像目标的动力学知识以及其它的 先验知识,可以生成一副图像,或者当图像信息存在部分缺失时,能够将缺失 的那一部分信息补上,从而得到完整的图像信息。例如,对于二维图像,通过 图像生成技术能够得到其三维结构信息,这一点如应用在模式识别研究中,能 够大大地提高淤别系统的鲁棒性。 1 3 2m a r r 视觉理论 m a r r 的视觉讨+ 算理论1 8 1 立足于计算机科学,系统地概括了心理物理学、神经 t 【j 理学、临床神经病理学等方面已取得的所有重要成果是迄今为止最系统的视 人脸图像识别算法研究:第一章绪论 觉理论。m a n - 的理论的出现对神经科学的发展和人工智能的研究产生了深远的 影响。 m a r t 认为视觉是一个信息处理过程,这个过程根据外部世界的图像产生对观 察者有用的描述,而且这个处理过程是有层次的。整个处理过程如图1 1 示, 幽1 1m a r t 视觉信息表示过程 低层视觉( 即视觉处理的第一阶段) 的目的就是要确定图像信息的变化是由 哪些因素引起的。这个过程要经过两个步骤来完成:第一步是获得表示图像中的 变化和结构的表象。这包括检测灰度的变化,表示和分析局部的几何结构,以及 检测照明的效应等处理,第一步得到的结果被称为初始简图( p r i m a ls k e t c h ) 的 表象。 第二步对初始简图进行一系列运算得到能反映可见表面几何特征的表象,这 种表象被称为二维半( 2 5d ) 简图,这些运算中包括由立体视觉运算提取深度 信息,根据灰度影调、纹理等信息恢复表面方向,由运动视觉运算获取表面形状 和空间关系信息等。这些运算的结果都集成到2 5d 图像这个中阃表象层次,因 为这个中f 1 | j 表象已经从原始的图像中去除了许多的多义性,是纯粹地表示了物体 表面的特征,其中包括光照、反射率、方向、距离等。根据2 5d 图像表示的这 些信息可以可靠地把图像分成有明确含义的区域( 分割) ,从而可得到比线条、 区域、形状等更为高层的描述。这个层次的处理称为中层视觉处理( i n t e r m e d i a t e p r o c e s s i n g ) 。 m a r t 视觉理论中的下一个表象层次是三维模型,它适用于物体的识别,当 图像数据具有与目标模型相同的表示形式时,就能够对图像进行识别。这个层次 的处理涉及物体本身,并且要依靠和应用与领域有关的先验知识来构成对景物的 描述,因此被称为高层视觉处理。 m a r c 的视觉计算理论虽然是首次提出的关于视觉的系统理论,并已对计算机 视觉的研究起了巨大的推动作用,但还远未解决人类视觉的理论问题,在实践中 也已遇到了严重困难。b r u c e 、y o u n g 等人1 9 l 认为m a r t 的三层表示模式是对目标 的一种较粗略表示,对于一般的目标识别可能是有效的,但对于需要很精确地对 日标加以描述,从而进行识别的情况却可能不适用,例如对于人脸图像的识别, 4 人脸图像识别算法研究:第一章绪论 4 i 同目标具有相同的形状,同时同一目标具有不同的表现形式,单纯地使用上述 的三层表示模式将无法区分不同的人脸图像。 1 3 3 基于推理的视觉理论 由于只根据图像数据本身不能对相应的物体空间结构提供充分的约束,也就 是说这是一个约束不充分( u n d e r c o n s t r a i n e d ) 的问题。因此,为了理解图像的内 容必须要有附加的约束条件。g e s t a l t 心理学家发现的感知组织现象是一种非常有 力的关于象素整体性附加约束。从而为视觉推理提供了基础。 g e s t a l t 心理学家所研究的出发点是”形”,他们认为任何”形”都是知觉进行了 积极组织或构造的结果或功能,而不是客体本身就有的。在视觉研究中g e s t a l t 理论认为把点状数据聚集成整体特征的聚集过程是所有其它有意义的处理过程 的基础。人的视觉系统具有在对景物中的物体一无所知的情况下从景物的图像中 得到相对的聚集( g r o u p i n g ) 和结构的能力。这种能力被称为感知组织。 感知组织把点状的传感数据变换成客观的表象。在这些表象中用于描述的词 藻不是在点状定义的图像中的灰度,而是如形状、形态、运动和空间分布这样的 描述。感知组织通过对传感器数据进行了整体的分析,得到一组宏观的表象。这 样的宏观表象就是进行认知的活动时的基本构件,用它们可构成对外部世界的描 述。 g e s t a l t 理论反映了人类视觉本质的某些方面,但它对感知组织的基本原理只 是一种公理性的描述,而不是一种机理性的描述。因此自从在本世纪二十年代提 出以来未能对视觉研究产生根本性的指导作用。但是研究者对感知组织原理的研 究一直没有停止。特别是在8 0 年代以后,l o w e l l 0 】,w i t k i n 和t e n e n b a u m ! 】,等 人在感知组织的原理,以及在视觉处理中应用方面取得了新的重要研究成果。 1 4 人脸识别算法概要和国内外研究进晨 一个全自动的人脸识别系统包括以下几个步骤,如图1 2 所示。 1 人脸自动检测系统 2 人脸的预处理归一化过程 3 特征的描述和抽取过程 4 选择分类器 人脸图像识别算法研究:第一章绪论 | 璺| 1 2 全自动人脸识别系统概述 1所谓人脸检测,一般指在图像中定位人脸,如果图像中含有人脸,则获取人 脸的位置、大小、姿态等信息,进一步可以提取人脸的特征。人脸检测是人 脸识别的先期工作,人脸检测不是本文的重点,相关内容请参考文献l l 1 1 ” 2 预处理和归一化过程主要是对人脸图像做一定的处理,如归一化尺寸,按照 人脸图像识别方法的要求使图像达到标准化( 标准尺寸及标准位置) 。另外用 直方图均衡,白化等消除光照。好的预处理和归一化过程对识别系统影响很 大。预处理包括消除噪声,灰度规一化,几何校雁,滤波变换等。 3 特征的描述和抽取过程是最重要的过程,人脸识别的研究重点就是如何描述 人脸的特征,如何抽取人脸的特征。 4 选择分类器选择好的分类器对人脸识别系统是很重要的。 计算机人脸识别技术是近几十年力逐渐发展起来的。机器自动人脸识别研究 始于1 9 6 6 年r p i 的b l e d s o e i h 】的工作,三十多年以来,科研工作者在机器自动 人脸识别方面进行了大量的研究,取得了丰硕的成果5 1 1 1 6 】【1 7 岬j 【1 9 】。其中m i t 媒 体实验室1 2 0 l 川1 2 2 【2 3 l 【2 4 1 等、m i ta i 实验室的o f f 2 q 1 2 7 【2 。1 1 2 9 等、意大利f 2 | 】【2 9 】( 3 0 l 等、c m u t 3 ”、m a r y l a n d 大学m 1 1 ”等、斯坦福大学、苏格兰亚伯丁大学i a n c r a w 口4 l 的贡献尤为突出,国内的从事此项研究的单位主要有:清华大学、南京理工大学、 中科院自动化所、哈尔滨工业大学计算机系、中科院计算所等。其中南京理工大 学d5 j f ”m 7 i 在用s v d 提取代数特征进行人脸识别方面开展了一些开创性的工作, 另外中科院计算所的面像识别实验室做了大量工作 3 8 】1 3 9 】【4 0 l f 4 i 】【4 2 】( 4 3 l 。 下面综述文献中的人脸分析和识别技术。 b l e d s o e “ f ”1 以人脸特征点的间距、比率等参数为特征,建立一个半自动的人 脸识别系统而且早期的人脸识别研究主要又两个方向:一是提取人脸集合特征 的方法i “i i ”i 。包括人脸部件归一化的点间距离和比率以及人脸的一些特征点,如 眼角、嘴角、鼻尖等部 i = 所构成的:二维拓扑结构:二是模板匹配的方法,主要是 利用计算模板和图像灰度的自相关性来实现识别功能。b e r t o 在1 9 9 3 年对这两类 方法作了比较全面的介绍和比较后认为,模板匹配的方法优于几何特征的方法 1 6 1 。 人脸图像识别算法研究:第一章绪论 2 3 以卜儿个方法属于主流方法: 1 特征脸分析,( e i g e n f a c e ) 1 2 0 1 1 4 6 j i ”i 这种方法的基本思想是将人脸在空域 内的高维描述转化为频域或者其他空间内的低维描述。p c a 将图像看作 具有一定分布的随机向量,由于人脸总体构形的相似性,人脸图像在其 中的分们不是随机的,p c a 可以得到人脸图像分布的主分量方向,从而 得到人脸图像的主分量来表达人脸,从本质上讲这是一种基于统计分析 的信息压缩方法。k l 变换类似于p c a ,是一种在最小均方误差意义上 最优的去相关和降维变换。基于k l 变换和p c a 的思想1 、缺、p e n t l a n d 等人) r 发了e i g e n f a c e 技术1 2 0 l 【2 4 h 2 i i7 1 并得到了广泛的应用。 线性判别特征脸( f i s h e r f a e e ) m 1 其是一种较好的特征脸改进方法。f i s h e r 线性判别原则是模式识别种的经典方法。f i s h e r 的判别准则是:不用类 样本尽可能源,同类样本尽可能近,文献i “i 对用k l 变换和f i s h e r 准则 分别求出来的一些特征脸进行比较后得出如下结论。即认为特征脸很大 程度l 反映了光照的差异,而f i s h e r 脸则能压制图像之间的与识别无关 的差异。 拓扑结构特征( 弹性图形,可变模型) 人脸由一些关键点组成的2 d 拓扑图 形来描述,该图形中的节点用其空间位置及其与其邻域节点之间的空间 和角度关系来描述。其通过小波变换特征来描述人脸的局部信息,并利 用人脸网格的不断变形,在图像上搜索特征点。由于它采用变形匹配方 式,能在一定程度上容忍姿态的变化,而且由于小波变换的特性,其能 容忍一定光照的变化。弹性图反映人脸的结构和形状1 4 9 1 1 5 0 1 “i t ”】1 5 3 1 ,将其 结合面部纹理可以有更精确的表达。 其它还有一些非主流的方法: 1 面部构形几何特征( g e o m e t r i cf e a t u r e ) 这是最早的方法。这类特征首 先定位面部的主要器官,如眼睛、鼻子、嘴、下巴和眉毛等,然后从中 选择组反映他们之间的距离、角度、区域形状等器官的结构配置特征。 通常用于侧面和正面人脸识别中,是比较传统的人脸描述方法之一。采 用这种特征的文献有。例。t 1 2 6 ,这种方法的缺点有;一、准确的特征定 位比较困难,尤其是在多姿态的情况下:二、由于只利用了面部的结构 信息,而完全抛弃了纹理信息,是一种比较粗犷的人脸表达,可能无法 保证人脸知识表达的完备性。 2 全局局部模板( t e m p l a t e b a s e d ,v i e w b a s e d ) 同几何特征不同,基于 人脸图像识别算法研究:第一章绪论 3 4 5 6 模板的人脸描述充分利用了面部图像的纹理信息,保留了人脸的细节。 全局或者局部模板都得到了尝试,在人脸识别领域是一种传统而被广泛 采j 】的方法,文献6 j 也证明了这种描述较特征表达的优越性。使用这种 方法的文献有【5 6 i 。 代数特征奇异值分解( s v d )将图像看作一个数值矩阵,对其进 行s v d 分解,得到的奇异值作为人脸图像的描述。由于奇异值向量与图 像有一一对应关系而且具有较好的稳定性和各种变换的不变性,文献 ”2 m 1 认为代数特征反映了图像的本质,可以用作人脸的描述。 神终网络人工神经网络( a n n ) 被应用于人脸图像的特征提取中来, 但是到目前为止,a n n 所提取的特征的物理意义是不明确的。已经证明 了自联想神经网络( s a n ) 与主成分分析( p c a ) 的一致性p j 。很多文献 如m l m 对a n n 在人脸归类( 性别、表情、年龄和种族) 中的应用进行了 探讨。 隐马可夫模型法:h m m 模型已经成功的应用与语音识别领域。在人脸识 别中,其将人脸的一些特征作为观察序列,通过建立马可夫链来描述人 脸特征5 0 l 5 i l i ”i 。 3 d 人脸模型( 3 d f a c em o d e l l从知识表达完备性的角度来看,3 d 人脸 表面模型由于不仅反映了人脸图像平面内的结构信息,同时还保存了人 脸的深度方面的结构信息,因此3 d 人脸模型是人脸的较完备描述。3 d 人脸模型通常采用三角网格组成的图形来描述。基于模型的人脸图像编 码i 。1 和多姿态人脸识别】| 5 郴5 促进了3 d 人脸模型的发展和应用。但特定 人的3 d 人脸模型的自动生成是需要深入研究的一个问题。 1 5 人脸识别的应用前景及一些商用软件 人脸图像识别除了具有重大的理论价值以及极富挑战性外,还具有许多潜在 的应用前景,利用人脸图像来进行身份验证,可以不与目标相接触就取得样本图 像,而其它的身份验证手段。如指纹、眼睛虹膜等必须通过与目标接触或相当接 近来取得样本,在某些场合,这些识别手段就会有不便之处。 c h e l l a p p a 等人4 1 列举了人脸图像识别的一些实际应用,如表1 1 所示为其 中的一部分。 人脸例像识别算法研究:第一章绪论 友1 1人脸u ! 别的一些典型麻_ l i 应j 1 】优点缺陷 信川1 押如果简单地对x 进行截断( 舍去工的后m i 1 个数 据) ,所带来的均方误差等于舍弃的各分量的方差之和,这不能保证得到最优的 结粜我f j 希望找到一个可逆的线性变换正使得对投的截断误差在均方误差 虑义卜为最优,这要求变换后的n 的某些分量具有低的方差。主成分分析 n 9 】 3 0 1 满趟了这一要求 列1 :。幅m m 大小的人脸图像( 系统中m = 6 4 ) p ,表示对应于图的第i 行和第,列的灰度值,这样人脸图像z 可以用向量表示为: x = ( p i t , ,1 2 ,p i ,p 2 i ,p 2 2 ,t ,p 2 _ l ,p ,i ,p ,2 ,一,p m m ) ( 3 1 ) 刈j i 个j 冬j 像集合l ,t ,h ,没向量x i r “( = m 膨) 为c 类( 以区别不 吲的人脸) 人脸图像,屁。,屏 中的一类,通过变换q 仨r ,将其从原来的埘 维。毒n u i 映刎到”( ,l 0 的点,根据 k a r u s h k u h n t u c k e r 条件【7 ”,对应的训练样本应该在离分类面最近的各类样本 集合的边界上,这些样本称为支持向量。 对于一个测试样本工r 4 ,首先计算 a ( x ,) = c o 。z + b = a , y ,k ( x ,x ,) + b ( 3 1 1 ) 可得到对应的类别标志 鼬翮= 仁io 其 ( x 他c o p 。 当训练样本在特征空阳jr 中不可分时,s v m 算法引入非负的松弛变量 鲁,其叫1 f = 1 , 2 ,n ,这时问题转化为求 砌圳1 2 + c 善n 鼻 s t y f a ( x f ,国) l 一茧,i = l ,n ( 3 1 2 ) 这罩的c 是用户定义的参数,用来实现在错分样本的比例和算法复杂度之间 的折衷a 茧度量盯( ,) 和y f 的差异,( 3 1 2 ) 可转化为一个q p 问题:在 0 口c l 和口7 y = 0 条件限制下求( 3 一l o ) 的最大值。 3 3 2 多类( k 一类) 问题的s v n 算法 多类问题的模式识别系统可以转化为砖类问题从而可以应用s v m 方法1 6 7 【6 8 的标志,构造一个决策函数,这个函数能将k 类样本两两分开。 最直观的方法是将多类问题看成一系列两类问题。可作两种考虑,一是“一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论