已阅读5页,还剩78页未读, 继续免费阅读
(控制理论与控制工程专业论文)基于小波变换与kpca人脸识别技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 人脸识别由于人脸的非刚体性和易变性,成为一个复杂、涉及面广且应用前 景广阔的课题,近年来掀起研究热潮并取得突破性进展。前人在人脸识别技术上 虽然积累了丰富的成果,但是也遇到了一些困难。例如:有效人脸特征的提取, 识别率和识别速率的提高等。人脸识别涉及的技术很多,其中关键的是特征提取 和分类方法,本文围绕人脸识别问题对人脸特征的有效提取、提高识别率和识别 速率进行了探讨和研究,提出了一种基于特征组合的特征提取算法,取得了较好 的效果。本文的具体内容和创新点包括: ( 1 ) 对人脸识别所涉及到的理论进行了介绍与研究。 ( 2 ) 针对人脸在图像中的大小、位置、旋转角度以及光照等条件的不同对 特征提取的影响,本文对人脸图像进行预处理。 ( 3 ) 依据小波系数的不同特点:低频部分刻画的是图像的整体( 形状) ,而 高频部分包含了相当数量的细节信息。因此对原始图像进行三层小波分解,选用 一、二、三层的低频平滑子带作为小波特征。这样既保留了面部的全局形状,又 淡化了局部细节。同时降低了人脸图像的维数,提高了识别率识别速度。 ( 4 ) 针对特征提取在整个人脸识别中的作用,本文对得到的小波特征运用 核主成分分析,获得特征空间上的三组主分量特征。 ( 5 ) 研究了特征维数与识别率之间的关系,指出传统特征提取方法的不足。 并设计了一种新的基于特征组合的特征提取算法,即对获得的三组主分量特征进 行主特征向量和次特征向量的划分,再由主特征向量和次特征向量组合为每个原 始样本的最终分类特征向量。最后将得到的最终分类特征向量输入到分类器进行 分类识别。实验证明本文提出的特征组合算法优于只将某一类小波特征作为识别 特征的传统方法。而且,在识别的速度也有一定的优势。 ( 6 ) 以多项式核函数构造了支持向量机,并根据“一对一”策略设计多分 类支持向量机。 最后,总结了全文的工作,并指出了若干有待于今后进一步研究的内容。 本文对所论述的算法均进行了m a t l a b 数据仿真,并给出了详实的实验数据。 基于小波变换与k p c a 人脸识别技术研究 关键字:人脸识别;核主成分分析( k p c a ) ;支持向量机 i i a b s l l l a c t a b s t r a c t f a c er e c o g n i t i o nh a sb e c o m ea ni s s u e ,w h i c hi sc o m p l e x ,i n v o l v i n ga w i d er a n g eo fa p p li c a t i o n sa n db r o a dp r o s p e c t sa sf o r t h ef a c e s n o n r i g i da n dv o l a t i l i t y ,a n dh a ss e to f fa nu p s u r g ea n dm a d eb r e a k t h r o u g h p r o g r e s si nr e c e n ty e a r s t h o u g hr e s e a r c h e r sh a v ea c c u m u l a t e dr i c h r e s u l t si nt h ef a c er e c o g n i t i o nt e c h n o l o g y ,t h e ya l s oh a v ee n c o u n t e r e d s o m ed i f f i c u l t i e ss u c ha st h ee f f e c t i v ee x t r a c t i o n o ff e a t u r e s ,t h e i m p r o v e m e n to fr e c o g n i t i o nr a t ea n dv e l o c i t yo fi d e n t i f i c a t i o na n ds oo n f a c er e c o g n i t i o ni si nr e l a t i o no fal o to ft e c h n o l o g i e s ,t h et w ok e y s a r ee x t r a c t i o no ff e a t u r e sa n dc l a s s i f i c a t i o nm e t h o d s t h i sp a p e rd e a l s w i t he f f e c t i v ee x t r a c t i o no f f e a t u r e s o ff a c i a l c h a r a c t e r i s t i c s , i m p r o v e m e n t o ft h er e c o g n i t i o nr a t ea n ds p e e do nf a c e r e c o g n i t i o n p r o b l e m s ,p r o p o s e daf e a t u r ee x t r a c t i o na l g o r i t h mb a s e do nf e a t u r e c o m b i n a t i o n ,w h i c hi sp r o v e dt ob ee f f e c t i v e i nt h i sp a p e r ,t h es p e c i f i c c o n t e n t sa n di n n o v a ti o n si n c l u d e : ( 1 )i n t r o d u c i n ga n ds t u d y i n gt h et h e o r yi n v o l v e d w i t h f a c e r e c o g n iti o n ( 2 ) c o m p l e t et h ef a c es a m p l e si m a g ee n h a n c e m e n t ,t h e n o r m a li z e d g e o m e t r i ca n dg r a ya n dw h it ep r o c e s s i n ga tt h ep r e p r o c e s s i n gt i m e ,w h i c h w o u l db ee f f e c t i v ei ni m p r o v i n gi m a g eq u a l i t y ,a n dl o w e ri t sc o m p u t a t i o n a l c o m p le x it y ( 3 ) b a s e do nt h ed if f e r e n tc h a r a c t e r i s t i c so fw a v e l e tc o e f f i c i e n t s : t h el o w f r e q u e n c yp a r tc h a r a c t e r iz e st h eo v e r a lli m a g e ( s h a p e ) ,a n dt h e h i g h 。f r e q u e n c yp a r t c o n s is t so fac o n s i d e r a b l en u m b e r o f d e t a i l s d e c o m p o s et h eo r i g i n a lt r i t i e ri m a g eb yw a v e l e td e c o m p o s i t i o n , c h o o s et h ef i r s t ,s e c o n da n dt h i r df l o o r so ft h el o w f r e q u e n c yb a n da s s m o o t hw a v e l e tc h a r a c t e r i s t i c s t h i sw i l ln o to n l yr e t a i nt h eo v e r a l l s h a p eo ft h ef a c e ,a l s ow e a kt h el o c a ld e t a i l s a tt h es a m et i m er e d u c e s i i i 基于小波变换与k p c a 人脸识别技术研究 t h ed i m e n sio n so ff a c ei m a g e s ,i m p r o v e st h er e c o g nitio nr a t ea n ds p e e d ( 4 ) i nt h ea r e ao ff e a t u r ee x t r a c t i o n ,t h ek p c ai su s e di nt h eo b t a i n e d w a v e l e tc h a r a c t e r i s t i c si nt h e p a p e r ,t og e t t h et h r e e p r i n c i p a l c o m p o n e n t s c h a r a c t e r i s t i c si nt h ef e a t u r es p a c e t h er e l a t i o n s h i p b e t w e e nt h ec h a r a c t e r i s t i c sd i m e n s i o na n dr e c o g n i t i o nr a t ei sr e s e r c h e d , a n dt h e1 i m i t a t i o n so ft r a d i t i o n a lm e t h o d si nf e a t u r ee x t r a c t i o ni s p o i n t e do u t an e wf e a t u r ee x t r a c t i o na l g o r i t h mi sd e s i g n e db a s e do nt h e f e a t u r e sc o m b i n a t i o n ,t h a ti sm a k i n gap a r t i t i o no fp r i m a r ye i g e n v e c t o r a n ds e c o n d a r ye i g e n v e c t o ro ft h eo b t a i n e dt h r e ep r i n c i p a lc o m p o n e n t s c h a r a c t e r i s t i c s ,t h e nc o m b i n et h ep r i m a r ye i g e n v e c t o rw i t ht h es e c o n d a r y e i g e n v e c t o rt ob et h ef i n a lc l a s s i f ye i g e n v e c t o ro fe a c ho r i g i n a ls a m p l e a tl a s t ,i n p u tt h ef i n a lc l a s s i f ye i g e n v e c t o r st ot h ec l a s s i f i e rf o r c l a s s i f i c a t i o nr e c o g n i t i o n e x p e r i m e n ts h o w st h a tt h en e wa l g o r i t h mi s s u p e r i o rt ot h et r a d i t i o n a lm e t h o do fs e r v i n go n ec e r t a i nt y p eo fw a v e l e t a st h ei d e n t i f y i n gc h a r a c t e r i s t i c s f o rt h em o r e ,t h er e c o g n i t i o ns p e e d a ls oh a sa d v a n t a g e s ( 5 ) b u i l ds v mw i t hp o l y n o m i a lk e r n e lf u n c t i o n ,a n dd e s i g nt h e m u l t i c l a s ss v mi na c c o r d a n c ew i t ht h e ”o n e t o o n e ”s t r a t e g y f i n a ll y ,c o n c l u d et h ef u l lw o r ko ft h et e x t ,a n dp o i n to u ts o m e c o n t e n t si nn e e do ff u r t h e rs t u d yi nf u t u r e t h i sp a p e re m u l a t e st h ep r o p o s e da l g o r it h mb ym a t l a bs i m u l a t i o n ,a n d g i v e sd e t a i l e de x p e r i m e n t a ld a t a k e y w o r d s :f a c er e c o g n i ti o n ; k p c a ; s v m i v 厦门大学学位论文原创性声明 兹呈交的学位论文,是本人在导师指导下独立完成的研究成 果。本人在论文写作中参考的其他个人或集体的研究成果,均在 文中以明确方式标明。本人依法享有和承担由此论文产生的权利 和责任。 声明人( 签名) :f 存、仫 歹汐口矽年乡月巧日 厦门大学学位论文著作权使用声明 本人完全了解厦门大学有关保留、使用学位论文的规定。厦门大 学有权保留并向国家主管部门或其指定机构送交论文的纸质版和电 子版,有权将学位论文用于非赢利目的的少量复制并允许论文进入学 校图书馆被查阅,有权将学位论文的内容编入有关数据库进行检索, 有权将学位论文的标题和摘要汇编出版。保密的学位论文在解密后适 用本规定。 本学位论文属于 1 、保密() ,在年解密后适用本授权书。 2 、不保密( “ ( 请在以上相应括号内打“4 ) 日期:胡年岁肪日 日期:o g - 弦z 第一章绪论 1 引言 第一章绪论 计算帆人脸识别技术是利用计算机对人脸图像进行分析和理解,从面完成人 脸检测,身份认证等工作的技术,也是近年计算机图像处理、模式识别、人工智 熊领域内最为活跃的研究课题之一。 准确鉴定一个人的身份、保护信息安全,是当今信息化时代必须解决的问题。 由予传统的身份识别( 身份证、密码等) 都存在着缺陷,基于生物特征的识别技 术成为了人们研究的热点。同其他人体生物特征( 如:指纹、d n a 、掌纹等) 识 别技术相比,入脸识别技术具有自身的特点。第一,人脸图像数据是j 接触式采 集,没有侵犯性,容易接受;第二,可以隐蔽操作,特别适合安全问题、罪犯监 控与抓逃等应焉,它不需要入配合,这是其它生物识别技术做不到豹;第三,符 合人类的识别习惯,在事后追踪和识别评测时,可交互性很强;第四,人脸识别 系统的设备成本较低,很容易嵌入到其它系统中;第五,能够对人们生活中记录 的静态图像做出处理。人脸识别是基于已知的人脸库,利用图像处理、模式识别 技术献给定的静态或视频图像中检测漱人脸,弗判断其身份。它在身份鉴别、驾 照和护照的核对、银行及海关的监控系统等领域都有着广泛的应用1 1 1 。人脸识别 涉及匿像处理、生理学、计算橇视觉等诸多学科领域瞄l 。 但是人脸识别也有很多不足。人脸自身所处环境的复杂性,如表情、滏态、 图像的环境、光照强度等条件的变化以及人脸上的遮挡物( 鼹镜、胡须) 等,都会 使人脸识别的结果受到很大的影响1 3 1 。 本章就入脸识别技术的研究背景、意义、研究内容、露蓊存在的技术难点以 及研究现状和应用前景进行介绍,最后对论文的研究成果和内容安排进行说明。 基丁小波变换与k p c a 人脸识别技术研究 1 2 课题研究的背景与意义 1 2 1 研究的背景 随着社会的发展,网络及信息化技术的大量普及应用,随之而来的是身份的 数字化和隐性化,而在诸如视觉监控、远程教育、人机交互技术、自动身份验证、 银行安全、以及司法刑侦等各方面都迫切希望能够进行快速、有效、稳定的身份 验证,特别是在信息安全领域,准确识别一个人的身份正是保护信息安全的一个 必须考虑的关键问题。 人脸识别技术作为生物识别技术的一种,以其特有的稳定性、方便性、唯一 性等特点被愈来愈广泛地应用在不同的身份识别领域,它的研究涉及模式识别、 图像处理、生理学、认知科学,并且与其他生物识别技术及计算机人机感知交互 技术都有着密切的联系。采用人脸识别技术,建立自动人脸识别系统,用计算机 实现对人脸图像的自动识别有着广阔的应用领域和诱人的应用前景。因而成为当 前模式识别和人工智能领域的一个研究热剧4 】【7 1 。 1 2 2 课题的意义 1 学术价值 人脸识别理论及技术的研究具有高度的理论价值。它的研究涉及心理学、生 理学、人工智能、模式识别、计算机视觉和图像分析与处理等多个学科领域,也 和人脑的认识程度紧密相关,更是模式识别、人工智能和计算机视觉的典型案例 之一。由于人脸足= f 刚体的模式,代表了最典型、最罔难的模式识别问题,而且 人类由来都是主要用人眼去识别人脸来辨别身份的,如能用机器来实现这一视觉 功能,无疑将具有非常重要的意义。所以对这一问题的研究和解决,有助于其他 对象识别问题的研究分析和解决,也有助于相关学科问题的解决,促进跨领域的 多学科综合发展。 2 应用前景 任何一种技术的发展都是由于受到了实际应用需要的激励,人脸识别技术也 第一章绪论 不例外。人脸识别受重视的一个重要原因是其在经济、安全、社会保障、犯罪、 军事等领域有着巨大的潜在的应用价值,尤其是在需要对用户身份进行验证或识 别的场合,如银行、海关等重要部门的身份验证,驾照、护照、身份证等证件的 核对,安全监控、犯罪搜捕等领域人脸识别技术都是具有广泛的应用价值的。 采用人脸识别技术,建立自动人脸识别系统,用计算机实现对人脸图像的自 动识别有若广阔的应用领域和前景。正在被推向以下的应用领域: 身份鉴别 人脸是自然界存在的一种特殊的、复杂的视觉模式,它包含着极其丰富的信 息。人脸作为一种高普遍性、可以非接触式采集的重要生物特征,可以用以进行 身份鉴别。人脸识别技术可以被应用在多种不同的安全领域:证件( 如:驾驶执 照、护照) 巾的身份认证;楼宇进出的安全控制;重要场所中的安全检测和监控; 智貔卡孛的身份认证。 信息安全 人验识别技术在信息安全领域也有着巨大的潜在应雳价值。随着网络技术譬 益走进人们的f 1 常生活,越来越多的用户可以访问互联网,越来越多的信息被置 入互联隔。丽由于豳终信息访问的便捷性,网络的安全控制成为一个翼益迫切的 重要问题。利用人脸识别技术,可以进行计算机的登录控制,可以进行应用程序 的安全使用、数据库的安全访闯和文件加密,可以实现局域网和广域网的安全控 制,可以保护电子商务的安全性。 人枫交互 高性能、高智能和高可用性被普遍认为是当前计算科学发展的主要方向。而 智麓人机接露技术要研究的正是如何擒高计算设备的智麓性和可耀性闽题,其蠢 标就是要建立和谐自然的人机交互环境,使用户可以方便、自然地利用人类所熟 知的方式使焉计算机。一个露以识别使用者入脸的智能计算视,可以按照其特点 为该使用者提供工作环境,从而使人与计算机之间的交互如同人与人之间的交互 一样轻松酲妇。 图像检索 使用入脸识囊实现基予肉容的图像检索系统,在大型入脸库中检索出与索弓| 脸像相同或相近的脸像。不仪界面自然,操作方便,还能获得比关键词搜索更加 3 基于小波变换与k p c a 人脸识别技术研究 准确的结果。 在日常生活中,人们识别周围的人用的最多的就是人脸,因丽人脸识别是一 种最容易被接受的身份鉴定方法。由于人脸识别具有非侵犯性、直接、友好、方 便的特点,因此它是人们最容易接受的身份鉴别方式。由于人脸识别技术具有如 此之多的优势,因此它的应用前景非常广阔,已成为最具潜力的生物特征识别技 术之一。 1 3 人脸识别研究的现状与技术难点 1 3 1 研究现状 如前所述,人类可以很轻松地从背景中检测和识别出人脸,而且这种识别能 力相当强,鲁棒性十分好圈。邸使在视觉刺激上有雩# 常大的变纯,如不同的视角、 表情、年龄、是否带眼镜和发型的变化等,人类都能相当好地进行识别。然而, 要想理解入粪如何进行人脸识别的视觉机制,并进一步构建能完成上述入脸识别 任务的自动系统却是一个非常困难的任务。 最近几年来,入脸识别研究弓l 起了学术和工监界越来越多的关注。人脸识别 的输入图像通常有三类情况:正面、侧面、倾斜。目前,对人脸正面模式的研究 最多,它的发展大致可分为三个阶段淞囊1 毽1 轴。 第一阶段是机械式的识别阶段,以b e r t i l l o n 、a l l n e n 和p a r k e 为代表,主 要研究入脸识别所需要的西部特征盼l 。在b e r t i n o n 的系统中,采用一个简单语 句与数据库中某一张脸相联系,并与指纹分析相结合,取得了较好的识别效果。 为了提高脸部识别率,a l l u e n 为待谈别入脸设计了一种有效和遣真的攀写箨_ 。 p a r k e 则用计算机实现了这一想法,并产生了较高质量的人脸灰度图模型1 1 3 j 。这 一阶段工作的特点是识别过程几乎全部依赖予操作入员,显然,这不属予自动识 别系统的范畴。 第二阶段是人机交互式识剐阶段。g o l d s t i o n 等入用几何特征参数来表示入 脸正面图像,采用2 l 维特征矢量表示人脸面部特征,并设计了基于这特征表 示法的识别系统i 渊。k a y a 和k o b a y a s h i 则采用统计识别方法,用欧氏距离来表 征人脸特征,如嘴唇与鼻子闻的距离,嘴唇的厚度等1 1 5 l 。t k a n a d 设计了一个 4 第一章绪论 高速且有一定知识导引的半自动回溯识别系统,创造性地运用积分投影法从单幅 图像上计算出一组脸部特征参数,再利用模式分类技术与标准人脸相匹配f 1 6 1 。 k a n a d 的系统实现了快速、实时处理,是一个很大的进步。相比之下,b a r o n 所 做的工作较少为人所知:他先对图像灰度进行归一化处理,再用4 个掩模( 眼、 鼻、嘴及眉毛以下的整个脸部) 表示人脸,然后分别计算4 个掩模与数据库中每 幅标准图像的相应掩模之间的互相关系数,以此作为判别依据f 棚。总的来说, 这类方法需要利用操作员的某些先验知识,仍然摆脱不了人的干预。 第三阶段是真燕的自动识别阶段,产生了众多人脸识别方法,出现了多种枫 器全自动谚 别系统。近年来,随着高性能计算机的发展,和人们对自动识别技术 的霈求,入脸模式识别方法有了较大的突破,嚣 l 蓍已提出了多种机器全自动识别 系统1 4 & 9 , 1 0 1 1 1 。 近3 0 年来,人脸自动识别的研究取得了很大的进展,麸工程索弓l ( e 羔) 上检 索到的相关文献己达数千篇,包括e e e t p a m i 在内的重要国际期刊也有专栏甚至 专秘报道入脸识别的最新研究进展,厨对还出现了专门的国际学术会议,如入脸 手势识别国际学术会议。 自二十世纪九十年代以来,人验识别取 | 譬了重大进展,出现了许多新方法。 目前的研究也主要有两个方向:其一是基于整体的研究方法。它考虑了模式的整 体属性,包括特征脸( e i g e nf a c e s ) 方法、s v d 分解的方法、人脸等密度线方法、 弹性图匹配( e l a s t i cg r a p hm a t c h i n g ) 方法、隐马尔可夫模型( h i d d e nm a r k o v m o d e l ) 方法以及享孛经网络翁方法等;其二是基于特征分析豹方法,也就是将入脸 基准点的相对比率和其它描述人脸脸部特种基于整体脸的识别不仅保留了人脸 部髂之闻的拓扑关系,丽且也保留了各部件本身的信息,丽基于部件韵谈别则是 通过提取局部轮廓及灰度信息来设计具体识别算法。基予部件的识别比基于整体 的识别来的童观,它提取并利用了最有用昀特征,如关键点的位置以及部律的形 状分析等,而基于整个人脸的识别而言,由于把整个人脸图像作为模式,那么光 照、视角以及入脸尺寸等会对人脸识搿有报大的影喃,因此懿俺麓够有效的去掉 这些干扰是关键。虽然如此,但对基于部件分析的人脸识别方法而言也有困难。 其难点在于如俺建立好的模型来表达识别部俘。近年来的一个趋势是将入镌整体 识别和特征分析的方法结合起来,如k i n - m a nl a m 提出的基于分析和整体的方法 5 基于小波变换与k p c a 人脸识别技术研究 和a n d r e a sl a n i t i s 提出的利用可变形模型( f l e x i b l em o d e l ) 来对入脸进行解 释和编码的方法等。 近年来,人脸识别技术研究也非常活跃,除了基于k l 变换的特征脸方法 与奇异值特征为代表的代数特征方法取得了发展外,人工神经网络、隐马尔可夫 模型、小波变换等也在入脸识别研究中得到了广泛的应用,而且出现了不少人脸 识别的新方法f 1 8 1 9 捌。 基于数据的机器学习是现代智能技术中的重要方面,研究从观测数据( 样本) 文发寻找规律,利用这些规律对未来数据或无法观测的数据进行预测。包括模式 识别、神经网络等在内,现有机器学习方法共同的重要理论基础之一是统计学。 传统统计学研究豹是样本数爨趋于无穷大时的渐近理论,现有学习方法也多是基 于此假设。但在实际问题中,样本数量往往是有限的,因此一些理论上很优秀的 学习方法实际中表现却可麓不尽如入意。与传统统计学相比,统计学霹理论 ( s t a t i s t i c a ll e a r n i n gt h e o r y ,s l t ) 是一种专门研究小样本情况下机器学习规 律豹理论。v a p n i k 等人从六、七十年代开始致力于此方瑟研究,到九十年代中 期,随着其理论的不断发展和成熟也由于神经网络等学习方法在理论上缺乏实质 性进震,统计学习理论开始受到越来越广泛的重视。统计学习理论是建立在一套 较坚实的理论基础之上的,为解决有限样本学习问题提供了一个统一的框架。它 能将很多现有方法纳入其中,有望帮助解决许多原来难以解决的问题( 比如神经 网络结构选择问题、局部极小点问题等) ;同时,在这一理论基础上发展了一种 薪的逶焉学习方法一支持向量瓿( s u p p o r tv e c t o rm a c h i n e ,s v m ) ,已初步表现出 很多优于已有方法的性能。 1 ,3 2 存在的困难 人脸议别技术的研究由于涉及众多学科知识,虽然人类能毫不费力的识别出 人脸,但人脸的自动识别却是一个难度极大的课题,迄今为止人脸识别还没有一 个毒# 常完美的解决办法。其嘲难主要来源于:( 1 ) 入脸是由复杂的三维曲面构成 的,由于钋貌、表情、肤色等不同,具有模式的可变性,很难用精确的数学模型 描述;( 2 ) 所有入的脸部结构均高度相似,从统计意义上来讲,属于典型的类内 散布大于类闯散匆的统计模式识别问题;( 3 ) 人脸图像受到各种成像条件的影响, 6 第一章绪论 诸如表情、姿态、尺度、光照、背景以及可能存在眼镜、胡须等附属物而大幅度 变化。作为三维物体的人脸的影像不可避免地受由光照产生的阴影的影响,从而 改变了人脸图像灰度的相对分布,由光照引起的人脸图像变化甚至比因不同的人 引起的差异还大。另外,随着种族的不同,带来了识别库及识别算法的差异,这 一方面给具体应用带来困难,同时也给我国的具体研发部门带来机遇,即国外已 经开发成功的商用软件在我国应用范围有限,不大可能形成垄断,这为国产人脸 识别系统占领市场留下了很大的发展空间。 1 4 人脸识别方法综述 1 4 1 基于几何特征的人脸识别方法 基于几何特征的人脸正面图像识别方法,是通过人脸面部拓扑结构几何关系 的先验知识,利用基于结构的方法在知识的层次上提取人脸面部主要器官特征, 将人脸用一组几何特征矢量表示,常采用的几何特征有人脸的五官( 如:眼睛、 鼻子、嘴巴等) 局部形状特征、脸型特征以及五官在脸上分布的几何特征。基于 几何特征的人脸识别的主要思想就是:首先找出这些特征点的具体位置,测出他 们之间的距离,组成一个特征矢量,然后用这个特征矢量与人脸库中的特征矢量 进行比较,找出最佳匹配。所以,基于几何特征的人脸识别方法最终归结为特征 矢量之间的匹配,基于欧氏距离的判决是最常用的识别方法。最早的基于几何特 征的人脸识别方法是侧影识别,主要是从人脸侧面轮廓线上提取特征点入手,将 侧影简化为轮廓曲线,从中抽取若干基准点,利用这些点之间的几何特征来进行 识别。由于现在的证件照片多为正面,所以对侧面人脸识别的研究已不多见。正 面人脸识别最关键的一步是合适的归一化,使之不依赖于图像中人脸位置的尺度 和旋转变化。识别所采用的几何特征是以人脸器官的形状和几何关系为基础的特 征矢量,其分量通常包括人脸指定两点间的欧式距离、曲率、角度等。 6 a l t o n 最早利用手工的方式在人脸的侧面轮廓上提取一组基准点,然后在 这组基准点上求得一组可用于识别的特征度量,如距离、角度和面积等进行识别。 b r u n e l l i 运用人脸边缘图的积分投影提取了3 5 个人脸特征,其中包括:器官形状 的特征,如嘴巴中心到下巴边缘的n 条半径;位置关系特征,如眼睛的位置、鼻 7 基于小波变换与k p c a 人脸识别技术研究 予的宽度和长度、嘴巴的位置等。他还提出了利用灰度模板表示人脸几何特征的 方法。周激流实现了具有反馈机制的人脸正蔼识别,应照积分投影提取瑟郝特征 关键点用于识别,并同时尝试了“稳定视点特征提取方法。 基于几何特征的识别方法具有以下优点:符合入脸识别的机理,易于理解, 而且对每幅图像只需存储一个特征矢量,对光照变化也不太敏感。该方法的缺点 是:对获褥的图像要求很高,从图像中提取稳定的特征比较困难,对强烈的表情 变化和姿态变化的鲁棒性较差,常用的几何特征只描述了部件的基本形状与结构 关系,而忽略了局部细微特征。所以基予几何特征的识别方法曼适合于粗分类。 1 4 2 基于模板匹配的人脸识别方法 模板匹配法1 2 1 】是一种经典的模式识别方法,它充分利用了人脸的纹理和灰 度特征。它的识别方法就是将待识别的入脸图像与数据库中所有的模舨进行比 较,找出最相近的脸。由于这种方法要求两幅图像上的网标要有相同的尺度、取 向和光照条俘,所以预处理要傲尺度娲一讫和灰度归一化的工作。最筒单的入脸 模板是将人脸看成一个椭圆,检测人脸也就是检测图像中的椭圆。另一种方法是 将入脸用一组独立的小模板表示,如眼睛、嘴巴、鼻子、眉毛和下巴等模板。僵 这些模板的获 ! 导必须利用各个特征的轮廓,而传统的基于边缘提取的方法很难获 得较高的连续边缘。即使获得了可靠度高的边缘,也缀难从中自动提取所需的特 征量。后来改进用弹性模板方法提取特征,弹性模板是幽一组根据特征形状的先 验知识来设计可调参数来定义的。这个参数是由能量函数来决定的,首先利用图 像的边缘、峰值、谷值和强度信息以及特征形状的先验知识设计能量函数,然后 将参数向能量函数减小的方向调整,当能量函数达到最小时,这组参数所对应的 模扳形状最符合特征形状。 b r u n e l l i 等人专门将基于几何特征的人脸识别方法和基于模板匹配的人脸 识别方法进行了比较,并得如结论:前者具有识别速度快和内存要求小的优点, 但在识别率上后者要优于前者。增加几何特征对于基于几何特征的入脸识别方法 只能轻微的提高识别率,因为要提高几何特征的提取质壁本身就十分困难,丽且 随着图像质量的下降和人脸遮挡的引入,基于几何特征的人脸识别效果会大幅下 降。总之,认为模叛匹配法要优于几何特征法。 8 第一章绪论 1 4 3 特征脸方法 基于统计的识别方法包括特征脸( e i g e nf a c e s ) 方法和隐马尔科夫模型 ( h i d d e nm a r k o vm o d e l ) 方法,该方法将人脸用代数特征矢量来表示。代数特征 是由h o n g 等首先提出的,由图像本身的灰度分布决定,它描述了图像的内存信 息,它是通过对图像灰度进行各种代数变换和矩阵分解提出的。将人脸看作一个 = 维的灰度变化的模板,从整体上捕捉和描述入脸的特征,所运用的主要是一些 标准的数据统计技巧,运算比较复杂。 特征脸方法是从主成成份分析( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a ) 导出的 一种人脸识别和描述技术,实质上是通过k l ( k a r h u n e n - - l o e v e ) 变换来实现 的,k l 变换是图像压缩技术中的一种最优正交变换。特征脸方法起源于图像 描述技术。k i r b y 和s i r o v i c h 用主成成份分析有效的表达了人脸图像。他们对 给定的一组原始入脸图像集合,计算图像压缩最好的坐标系统,每个坐标事实上 是他们定义为特征图( e i g e np i c t u r e s ) 的图像。他们认为从理论上来说,任凭 人脸图像集合都可以用两个集合近似的重建,其一是每个人脸的权值集合,其二 是一组标准的图像集合( e i g e np i c t u r e s ) 。人脸的权值逶过将人脸投影到对应 的特征图像得到。t u r k 和p e n tl a n d 认为如果大量的人脸图像可以由一组特征 图像的加权柬重建,那么有效的人脸识别方法就是通过长期的经验建立特征图 像,通过比较重建图像所需要的特征权值识别人脸。因此,每一个人脸都可以用 组重建的权值表示。简单地说,就是将一高维的向量,通过一个特殊的特征矩 阵,投影到一个低维的向量空间,表征为一个低维向量,并保留主要信息。即通 过低维表征的向量和特征向量矩阵就可以完全蘧构出所对盛的赢维向量。这种表 达柏对于图像本身就是一种岛度压缩的方式。 概括的说,特征脸方法的基本思想就是:就是将包含入脸的图像区域看作是 一种随机向量,因此可以采用k l 变换获得其证交k - - l 基底。对应其中较大特 征值的基底具有与入脸裙似的形状,故将其称为特征脸。利用这些基底的线性组 合可以描述、表达和逼近人脸图像,因此可以进行人脸识别和合成。识别过程就 是将人验图像映射到幽特征脸张成的子空闻上,比较其与已知人脸在特征黢空闻 中的位置。从而判断它是否是库中的人脸,如果是,是哪一幅人脸。特征脸方法 把入脸图像作为一个整体来编码,丽不关心眼、嘴、鼻等单个特征,歇焉大大降 9 基予夸波交换与l ( 嗽入脸识别技术研究 低了识别的复杂度。此方法的主要缺点是:目前还没有一个快速的求解特征值和 特征向量的算法,每一张新脸入库,都要重新计算特征值和特征向量,费时较多。 优点是:图像的原始灰度数据可直接用来学习和识别,不需要任何初级或中级处 理;不需要人脸的几何和反射知识;通过低维子空间表示进行有效压缩,与其他 匹配方法相比,识别简单有效。为了解决上述缺点,研究人员在此基础上发展了 许多改进方法:如将特征脸与线性判别函数相结合,可以使得对光照及人脸表情 不太敏感。 一 1 4 4 隐马尔科夫模型的人脸识别方法 隐马尔科夫模型( h i d d e nm a r k o vm o d e l ,h m m ) 是用于描述信号统计特性的一 组统计模型。鞋潮使震马尔科夫链模拟信号统计特技的变化,悉这种变化又是闽 接地通过观察序列来描述的,因此,隐马尔科夫过程是一个双重的随机过程。其 中之一是马尔可夫链,这是基本随机过程,它描述状态的转移;另一个随祝过程 描述状态和观测值之间的统计对应关系。在h m m 中,节点表示状态,有向边表示 状态之闻的转移,一个状态可以具有特征空间中的任意特征,对同一特征,不同 状态表现出这一特征的概率不同。由于h m m 是一个统计模型,对于同一特征序列, 可麓会对应于许多状态序列,特妊序列与状态序列之闯的对应关系是j 确定的。 这种模型对于状态序列来说是隐的,故称为隐马尔科夫模型。 嗍的基本理论是由b a u m 和w e l c h 等人在2 0 世纪6 0 年代末7 0 年代初建立, 在语音识别中应用较多。在h 删中,节点表示状态,有向边表示状态之间的转移, 一个状态可以具有特征空间中的任意特征,对同一特征,不同状态表现出这一特 征的概率不同。h m m 有三个主要问题:评估、估计及解码。关键是前两个问题。 评估用予解决议别问题,一般采取比较有效的“向前一向后法;估计用来产生 用于识别的各个单元的h m m ,采取b a u mw e c h 方法。s a m a r i a 最早提出人脸的 h m m 模型,谴将入脸躲五个显著区域,包括头发、额头、眼睛、鼻子和嘴巴,看 成五个不同的状态,它们的秩序依次从上到下保持不变。五个状态是抽象的,不 具有具体的意义,只能通过观察序列对它进行估计。h m m 的优点是允许人脸表情 有较大变化,较大的头部转动,缺点是实现的复杂度较高。 1 0 第一章绪论 1 4 5 人工神经网络方法 神经网络方法是一种基于连接机制的识别方法。由于人工神经网络 ( a r t i f i c i a ln e u r a ln e t w o r k ,a n n ) 对复杂模式的良好分类能力,所以在人脸识 别应用中有很长的历史【2 2 j 。神经网络模型各种各样,它们从不同的角度对生物 神经系统进行了不同层次的描述和模拟。有代表性的网络模型有感知器、多层映 射b p 网络、r b f 网络、h o p f i e l d 模型等。目前,在人工神经网络的实际应用中, 绝大部分的神经网络模型都是采用b p 网络及其变化形式,它是人工神经网络最 精华的部分。b p 网络主要用于函数逼近、模式识别、数据压缩等领域。使用b p 神经网络作为模式分类器时,其节点数取决于数据源的维数,即特征空间的维数。 但是人们在进行模式采集时,总是尽可能的多采集测量数据的多个特征值,致使 样本维数很大。样本维数很大首先带来的问题是处理的困难,处理时间的消耗和 费用都会很大,有时直接用于分类甚至是不可能的,即所谓“维数灾难”。其次, 在过多的数据量中,有的可能对刻画事物的本质贡献并不大,甚至可以说非常微 小。这就需要有一个样本空间到特征空间的转化,通过特征提取压缩样本的维数, 在满足识别精度要求的前提下,尽可能的减少处理数据的冗余度,即尽量做到处 理数据的各个特征之间不相关。此时,输出层的节点数就是要分成的类别数,即 模式空间的维数。所以人们常常会把主成成份方法和神经网络方法结合起来使 用。先用主成成份分析方法对图像进行特征提取,再用这些特征向量和相应的教 师信号训练b p 网。c o t t r e l l 2 3 l 首先利用三层的b p 网络来进行人脸的特征提取, b p 网的输入和输出的神经元相同,隐含层的输出作为特征。对网络进行训练使 得其输出逼近输入。提取的特征再通过一个两层的神经网络进行分类。 最陶单的神经网络实现方法是用小川姿态或表情的人脸图像作为输入样奉, 用标准正面人脸图像作为输出。i n t r a t o r 等提出了一种混合型神经网络来进行 人脸识别,其中非监督神经网络用于特征提取,而监督神经网络用于特征分类; l a w r a n c e 和g il e s 等用自组织特征映射( s o m ) 神经网络和卷积神经网络相结合, 对4 0 0 幅人脸图像进行了人脸识别的研究,其中s o m 网络用来量化图像样本到降 维的拓扑空间,卷积神经网络则在一定程度上实现了局部的平移、旋转、尺度和 变形的不变性;l i n 和k u n g 提出了一种基于概率决策的神经网络用于人脸识别。 这种网络在决策神经网络的基础上加入了概率变化,采用虚拟样本进行强化和反 基于小波变换与k p c a 人脸识别技术研究 强化学习,得到较为理想的概率估计结果,同时采用模块化的网络结构加快网络 的学习。这种方法在人脸检测、人脸定位和人脸识别的各个步骤上都得到了较好 的应用i 矧。 神经网络方法在人脸识别上比其它类型的方法有其独到的优势,即它避免了 复杂的特征提取工作,可以通过学习的过程获得其它方法难以实现的关于人脸识 别的规律和规则的隐性表达,但应用该方法神经元数目多,训练时间长。此外, 神经网络以并行方式处理信息,如果能用硬件实现,就能显著提高速度。神经网 络方法除了用于人脸识别外,还适用于性别识别、种族识别等。研究人员还应用 传统方法和神经网络设计了组合分类器,在识别效果的准确率、容错性、鲁棒性 等方面取得了一定的进展。 1 4 6 弹性图匹配方法 弹性图匹配方法i 冽是基于局部统计特征的,是一种基于动态链接结构 ( d y n a m i cl i n ka r c h i t e c t u r e ,d l a ) 的方法。它在人脸识别领域中有着直接应用 l 捌。它将人脸用格状的稀疏图表示,图中的节点用图像位置的g a b o r 小波分解 得到的特征向量标记,图的边用连接节点的距离向量标记【2 刀。匹配时,首先寻 找与输入图像最相似的模型图,再对图中的每个节点位置进行最佳匹配,这样产 生一个变形图,其节点逼近模型图的对应点的位置。小波特征分析是一种时频分 析,若空间一点周围区域的不同频率响应构成该点的特征串,则其高频部分就对 应了小范围内的细节,而低频部分则对应了该点周围较大范围的概貌。因此采用 小波变化特征的弹性图匹配方法,既考虑了局部人脸细节,又保留了人脸的空间 分布信息,而且它的可变形匹配方式在一定程度上能够容忍人脸从三维到二维投 影引起的变形。此外,g
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026山东省事业单位就业援青岗位专项招聘15人笔试备考试题及答案详解
- 2026年河北沙河农村商业银行校园招聘笔试备考试题及答案详解
- 2026北京航空航天大学可靠性与系统工程学院聘用编项目管理F岗招聘1人笔试模拟试题及答案详解
- 2026重庆市永川区人民法院招聘书记员4人笔试模拟试题及答案详解
- 2026广东珠海高新技术产业开发区市场监管局招聘合同制职员7人笔试参考题库及答案详解
- 2025年江苏银行(宿迁分行)人员招聘笔试考试试题及答案详解
- 2025年华夏银行(广东自贸试验区南沙分行)人员招聘笔试考试试题及答案详解
- 2026年兴业银行漳州分行暑期实习生招聘笔试参考题库及答案详解
- 2026青海数字经济发展集团有限公司社会招聘9人笔试参考题库及答案详解
- 2025年东营银行校园招聘笔试考试试题及答案详解
- 2026年安徽省体育彩票管理中心编外聘用人员公开招聘11名考试参考题库及答案解析
- 2026重庆物流集团数字科技有限公司招聘3人笔试历年参考题库附带答案详解
- 2026年滨州国有资本投资运营集团有限公司公开招聘国有企业工作人员(15名)笔试参考题库及答案解析
- 2026广西能汇投资集团有限公司校园招聘笔试参考题库及答案解析
- 河南省顶级名校2026届高三年级5月押题导向卷(一)历史试卷(含答案及解析)
- 开封市汽车产业投资有限公司、开封市文心科教投资发展有限公司招聘笔试题库2026
- 市政起重吊装施工方案(3篇)
- 2026年陕西交通职业技术学院教师招聘笔试备考试题及答案解析
- 初中语文九年级上册 文言文27篇 备考知识清单
- 木门质检员制度及流程规范
- 2025贵州康体旅投发展有限公司实习生招聘2人参考笔试题库附答案解析
评论
0/150
提交评论