(计算机应用技术专业论文)距离加权特征脸特征提取算法及其改进.pdf_第1页
(计算机应用技术专业论文)距离加权特征脸特征提取算法及其改进.pdf_第2页
(计算机应用技术专业论文)距离加权特征脸特征提取算法及其改进.pdf_第3页
(计算机应用技术专业论文)距离加权特征脸特征提取算法及其改进.pdf_第4页
(计算机应用技术专业论文)距离加权特征脸特征提取算法及其改进.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(计算机应用技术专业论文)距离加权特征脸特征提取算法及其改进.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

i i i 摘要 人脸识别技术是计算机模式识别领域非常活跃的研究课题,它是利用计算机 分析人脸的图像,抓住人脸的轮廓特征和局部细节特征,提取有效的识别信息, 研究匹配和识别方法,用以辨认身份的- - 1 7 技术。它涉及模式识别、图像处理、 计算机视觉、生理学、心理学等诸多学科的知识,是当前研究的热点之一。然而, 由于识别结果往往容易受到表情、姿态和光照变化的影响,同时还要保证识别系 统的实时性,极大地影响了人脸识别的实用性。 人脸识别主要包括图像的预处理,特征提取和识别三个环节。本文对这三个 部分分别作出相应的描述。本文结构如下: 1 介绍人脸识别的研究背景和意义,面临的主要问题,人脸的定位与常用的 特征提取和识别方法; 2 分析了p c a 算法中相应知识点,特征值的选择及分类器的选取,并分析了 p c a 的优缺点,在p c a 的基础上再对二维p c a 算法进行分析,介绍了基于2 d p c a 的人脸特征提取,及2 d p c a 的图像重构,并分析了其优缺点。然后介绍了 p c a + 2 d p c a 的方法,为了进一步减少2 d p c a 的特征矢量的维数,我们可以在 应用2 d p c a 求出特征矢量之后再用p c a 技术做进一步的最优压缩。( 2 d ) 2p c a 方法在识别率上要高于2 d p c a ,同时重建所需要的系数却远比p c a 和2 d p c a 要少。在2 d p c a 的基础上,本文提出了新的方法:二维距离加权p c a ,用来构 造出新的样本空间,通过相应权值,增加与平均图像接近的样本在平均值中的作 用,来达到提高识别率的目的。通过程序证明了该算法的有效性。同时,提出了 另一种改进方法:二维局部加权,构造新的样本空间,即对人脸的两个重要部位: 眼部和嘴部加权,提高识别率,同样能提高识别率。 3 最后介绍了l d a 算法,并分析了最大散度差m s l d a 的优点,并在此基础 上对类内散布矩阵s w 和类间散布矩阵s b 进行相应加权,提高类间散布矩阵在总 体散布矩阵中的作用,经过实验证明了该想法能明显提高识别率。 关键词:人脸识别,特征提取,p c a ,f i s h e r 线性鉴别,加权脸 i v a b s t r a c t f a c er e c o g n i t i o nt e c h n o l o g yi s v e r ya c t i v ei nt h ef i e l do fc o m p u t e rp a t t e r n r e c o g n i t i o nr e s e a r c h ,i ti s a t e c h n o l o g yt h a tu s e st h ec o m p u t e rt oa n a l y z et h ef a c i a l i m a g et of i n dt h ec o n t o u ro fh u m a nf a c e sa n dp a r to fd e t a i lf a c ef e a t u r e s e t r a c t i n gt h e e f f e c t i v ei n f o r m a t i o no f i d e n t i f y i n g ,s t u d y i n gt h em e t h o d so fm a t c ha n dr e c o g n i t i o n i ti n v o l v e sp a t t e r nr e c o g n i t i o n ,i m a g ep r o c e s s i n g ,c o m p u t e r v i s i o n ,p h y s i o l o g y , p s y c h o l o g ya n dm a n yo t h e rd i s c i p l i n e so fk n o w l e d g e ,n o wi ti so n eo ft h ek e yi s s u e s h o w e v e r , t h ei d e n t i f i c a t i o nr e s u l t sa r ev e r ye a s yt ob ee f f e c t e db yt h ef a c i a l e x p r e s s i o n s ,p o s ea n di l l u m i n a t i o n , w h i l ea tt h es a m et i m et oa s s u r et h er e a l - t i m eo f r e c o g n i t i o ns y s t e m ,w h i c hg r e a t l ya f f e c t e dt h ef a c er e c o g n i t i o nt ob ep r a c t i c a l f a c er e c o g n i t i o n ,i n c l u d i n gt h em a i ni m a g ep r e - p r o c e s s i n g ,f e a t u r ee x t r a c t i o na n d i d e n t i f i c a t i o no ft h et h r e el i n k s i nt h i sp a p e r , t h et h r e ep a r t sc o r r e s p o n d i n gt ot h e d e s c r i p t i o n t h i sa r t i c l ei ss t r u c t u r e da sf o l l o w s : 1 t oi n t r o d u c ef a c er e c o g n i t i o nr e s e a r c hb a c k g r o u n da n ds i g n i f i c a n c eo ft h em a i n i s s u e sf a c i n gt h ef a c er e c o g n i t i o na n dt h ec o m m o np o s i t i o na n df e a t u r ee x t r a c t i o na n d r e c o g n i t i o n ; 2 a n a l y z eo ft h ep c aa l g o r i t h mi nt h ea p p r o p r i a t ek n o w l e d g e ,c h o i c et h ev a l u e c h a r a c t e r i s t i e sa n dt h ec l a s s i f i e rs e l e c t i o n ,a n da n a l y z et h es t r e n g t h sa n dw e a k n e s s e so f t h ep c a ,t h ep c ao nt h eb a s i so faf u r t h e rt w o d i m e n s i o n a la n a l y s i so ft h ep c a a l g o r i t h m ,b a s e do n2 d p c af a c ef e a t u r ee x t r a c t i o n ,a n d t h e2 d p c ai m a g e r e c o n s t r u c t i o na n da n a l y s i so fi t ss t r e n g t h sa n dw e a k n e s s e s t h e ni n t r o d u c e dt h ep c a + 2 d p c am e t h o d s i no r d e rt or e d u c et h ec h a r a c t e r i s t i c so ft h ev e c t o rd i m e n s i o no ft h e 2 d p c a w ec a nu s ep c at oo p t i m a lc o m p r e s s i o na f t e ro b t a i nt h ef e a t u r ev e c t o r 、机m 2 d p c a t h e na f t e rf u r t h e rt e c h n i c a l ,( 2 d ) 2p c am e t h o d si sh i g h e rt h a n2 d p c ai nt h e i d e n t i f i c a t i o nr a t e a tt h es a m et i m en e e d e df o rt h ef a rl e s sr e c o n s t r u c t i o no ft h e c o e f f i c i e n tt h a n2 d p c aa n dp c a o nt h eb a s i so f2 d p c ai nt h i sp 印e r ,p r o p o s ean e w m e t h o d :t w o - d i m e n s i o n a ld i s t a n c e w e i g h t e dp c a t oc o n s t r u c tan e ws a m p l es p a c e , t h r o u g ht h ea p p r o p r i a t ew e i g h tt oi n c r e a s et h ei m a g eo f t h es a m p l ew h i c ha r ec l o s e rt o a v e r a g ei m a g ei no r d e rt oa c h i e v er e c o g n i t i o nr a t e t h r o u g ht h ep r o c e d u r ew ec a n p r o v ei t s e f f c c t i v e n e s s a tt h es a m et i m e ,p u tf o r w a r da na l t e r n a t i v em e t h o d : t w o d i m e n s i o n a lp a r t i a lw e i g h t e d ,t h en e ws t r u c t u r eo ft h es a m p l es p a c e ,t h a ti s ,o nt h e f a c eo ft w om a j o rp a r t s :t h ee y e sa n dt h em o u t hw e i g h t e dt oi n c r e a s er e c o g n i t i o nr a t e , v i tc a l li m p r o v et h er e c o g n i t i o nr a t e ,t o o 3 a tt h el a s t ,t h ep a p e ri n t r o d u c e dt h el d a a l g o r i t h m ,a n da n a l y z et h ea d v a n t a g e s o ft h em a xs u b t r a c t i o nl d a ( m s l d a ) ,o nt h eb a s i so fw h i c ht h es p r e a dw i t h i nm a t r i x s wa n ds p r e a db e t w e e nm a t r i xs ba r ew e i g h t e da c c o r d i n g l y , t or a i s et h er o l eo fs p r e a d b e t w e e nm a t r i xi nt h eo v e r a l ls p r e a dm a t r i xa f t e rt h ee x p e r i m e n t ,i ti sp r o v e dt h a tt h e i d e ac a l li m p r o v et h er e c o g n i t i o nr a t e k e y w o r d s :f a c er e c o g n i t i o n ,f e a t u r ee x t r a c t i o n ,p c a ,f i s h e rl i n e a rd i s c r i m i n a t e , w e i g h t e df a c e 扬州大学学位论文原创性声明和版权使用授权书 学位论文原创性声明 本人声明:所呈交的学位论文是在导师指导下独立进行研究工作所取得的 研究成果。除文中已经标明引用的内容外,本论文不包含其他个人或集体已经发 表的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标 明。本声明的法律结果由本人承担。 学位论文作者签名: 玛虢友 学位论文作者签名: 殇弛峻 签字日期:年月日 学位论文版权使用授权书 本人完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并 向国家有关部门或机构送交学位论文的复印件和电子文档,允许论文被查阅和借 阅。本人授权扬州大学可以将学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。同时授权中国 科学技术信息研究所将本学位论文收录到中国学位论文全文数据库,并通过 网络向社会公众提供信息服务。 学位论文作者签名: 弓凝 导师签名:1 老彳护 导师签名:f i 毯彳形v 签字e 1 期:年月日签字日期:年月日 冯颖凌:距离加权特征脸特征提取算法及其改进 第1 章绪论 1 1 课题研究的背景和意义 1 1 1 研究的背景 随着社会的发展以及技术的进步,尤其是近年内计算机的软硬件性能的飞速 提升,对快速、有效辨别人身的需求越来越迫切。传统的人身辨别方法主要是通 过人身标识物品和人身标识知识两种方式来实现的。常见的人身标示物品有钥匙、 证件等各种标识,人身标示知识有用户名、密码等。众所周知,像钥匙、证件标 识等人身标识物品很容易丢失或被伪造,而标识知识容易遗忘或记错,更为严重 的是传统身份识别系统往往无法区分标识物品真正的拥有者和取得标识物品的冒 充者,一旦他人获得标识物品,也可以拥有相同的权力。即便是将两种方式结合 起来使用,此类问题仍然会出现,比如自动取款机虽然用到银行卡和用户密码, 但还是有卡里的钱被盗的现象。所以传统的人身辨别方法已不能满足社会的需要。 而生物特征是人的内在属性,具有很强的自身稳定性和个体差异性,所以生物识 别技术为人的身份鉴别提供了保障。其中,利用人脸特征进行身份验证又是最自 然直接的手段,与指纹、虹膜、掌纹等其他人体生物特征识别系统相比,人脸识 别系统更加友好,方便,易于为用户所接受,有广阔的应用领域。计算机人脸识 别技术是近2 0 年才逐渐发展起来的,计算机人脸识别技术( f a c er e o c g n i t i o n ) 就是 利用计算机分析人脸图像,从中提取出有效的识别信息,用来辨认身份的一门技 术。即对已知人脸进行标准化处理后,通过某种方法和数据库中的人脸样本进行 匹配,寻找库中对应人脸及该人脸相关信息。人脸识别技术应用广泛,在国家安 全、军事安全和公共安全领域,智能门禁、智能视频监控、公安布控、海关身份 验证、司机驾照验证等是典型的应用。在民事和经济领域,各类银行卡、金融卡、 信用卡、储蓄卡的持卡人的身份验证,社会保险人的身份验证等具有重要的应用 价值。在家庭娱乐等领域,人脸识别也具有一些有趣有益的应用,比如能够识别 主人身份的智能玩具、家政机器人,具有真实面像的虚拟游戏玩家等等,还可以 应用到医疗和视频会议等方面,表现出其强大的生命力。 从2 0 世纪六十年代末到现在,人脸识别的发展经历了正面人脸识别,基于多 姿态和表情的人脸识别,动态跟踪人脸识别和三维人脸识别四个阶段。文献f 2 3 】是 对近十年来人脸识别取得的成果进行了总结。现在,全世界从事人脸识别研究的 扬州大学硕士学位论文 2 科研机构很多【4 】,国外的大学一般都有c m o p u t e rv i s i n 研究组,并有从事人脸图象 处理课题的研究小组。其中著名的大学包括m t i ,c m u 等。国内的清华大学、浙 江大学、哈尔滨工业大学和中国科学院的一些研究机构等都从事这方面的研究。 同时也出现了一批提供人脸识别相关产品的公司。有些国外公司开发的一些人脸 识别的产品已经被安全机构使用。 1 1 2 研究的意义 虽然人类的人脸识别能力很强,能够记住并辨别上千个不同的人脸,但对于 计算机来说则困难多了。主要表现在:人脸表情丰富;人脸随年龄增长而变化: 人脸所成图像受光照、成像角度及成像距离等影响;图象处理、计算机视觉、模 式识别以及神经网络等学科,也和人脑的认识程度紧密相关。这诸多因素使得人 脸识别成为一项极富挑战性的课题。所以,研究人脸识别,不仅推动了图像处理、 模式识别理论与应用的发展,满足身份验证、基于内容的检索等实际需求,而且 由于人脸的特殊性,对人脸识别进行应用研究,对推动认知科学、生理学、心理 学等相关学科的研究也有积极的影响。 人脸因人而异,绝无相同,即使一对双胞胎,其面部也一定存在着某方面的 差异。虽然人类在表情、年龄或发型等发生巨大变化的情况下,可以毫不困难地 由人脸来检测和识别出某一个人,但要建立一个能够完全自动进行人脸识别的系 统却是非常困难的。它牵涉到模式识别、图像处理、计算机视觉、生理学、心理 学以及认知科学等方面的诸多知识,并与基于其他生物特征的身份鉴别方法以及 计算机人机感知交互领域都有密切联系。 1 2 人脸识别面临的主要问题 人脸识别是一个跨学科富挑战性的前沿课题,目前的很多方法仍停留在研究 阶段,其识别效率离实用还有较大的距离,要开发一个在无约束环境下自动识别 人脸的系统面临的最大问题是如何处理光照变化和姿态变化的影响。人脸识别系 统还有许多问题需要解决: ( 1 ) a 脸检测与定位 因为人脸模式的多样性和图像获取过程中的不确定性,比如:人脸的偏转或 俯仰会造成面部信息的缺失,所以人脸在图像空间中的分布非常复杂,建立人脸 在高维图像空间中的精确分布模型是一件非常困难的事情。建立一个统计可靠的 冯颖凌:距离加权特征脸特征提取算法及其改进 估计不仅需要大量的正例样本,而且需要充分多数量的有效反例样本。目前研究 的一个趋势是反例样本的产生和利用问题,这也是最终提高人脸检测正确率的必 然道路1 5 1 。不难预见,知识与统计方法的综合应用是解决实际问题所必须的。 ( 2 ) 特征选择与提取 识别人脸主要依据人脸上的特征,也就是说依据那些在不同个体之间存在较 大差异而对一个人则比较稳定的度量。由于人脸变化复杂,因此特征表述和特征 提取十分困难。与刚体不同,人脸是塑性可变的,更适合用弹性模型来描述。因 此,任何基于刚体的特征抽取方法都难达到满意的效果。其次,人脸识别被认为 是人类视觉中独特的过程,因此对生理学和心理学结合是很有帮助的。可以预见, 在人类视觉和非刚体两方面的研究成果将有助于找到抽取和描述人脸特征的最终 解决方案。 ( 3 ) 人脸识别 一是人脸的相似性,因为所有的人脸都具有相似的结构,而且纹理上也比较 接近,因而在识别的时候必须把握住不同人脸之间很细微的特征差别,才能实现 识别;二是人脸的非刚体性,同一个人脸在不同光照、不同姿态、不同表情、不同 大小等条件下所获的图像就有很大的差异,更不用说发型、姿态和年龄的增长等 所带来的变化了,所以要获得在各种条件影响下,仍然不变的人脸描述模型是极 其困难的。 在进行识别匹配时,不仅要考虑人脸微小变形,而且在容忍变形的同时,还 不能损害到人脸识别的有效性。此外,如何将能够获得的各种信息最大限度、有 机的集成起来加以利用,这也是一个具有普遍意义的研究课题,而且也是有效提 高人脸识别系统效率的手段。 1 3 人脸检测与识别系统 一个典型的人脸自动识别系统主要包括检测和识别两部分,该系统可用于计 算机登陆的身份验证,主要任务是对采集到的图像进行检测与识别,并与数据库 进行匹配验证,以判断身份是否正确,系统结构如图1 1 所示。由图像采集设备( 如 摄像头、扫描仪等) 完成对相关人员的面像采集工作,将归一化处理后的图像加入 人脸图像库中,并把相应的身份信息( 如姓名、i d 号等) j n 入身份信息数据库中。 人脸检测与定位模块是判断输入图像中是否存在人脸,如果有,给出每个人脸的 位置、大小,并分割出人脸图像。然后,对人脸图像进行特征提取与识别,判断 扬州大学硕士学位论文 4 采集到的人脸是否存在于图像库中;若存在,则判断具体是哪一个人,并与身份 信息数据库中的信息进行匹配输出验证结果。 图1 - 1 人脸自动检测与识别系统 1 4 人脸特征提取与识别方法 人脸自动识别系统有两个主要技术环节,一是人脸定位,即从输入图像中找 到人脸存在的位置,将人脸从背景中分割出来,接下来,对标准化后的人脸图像 进行特征提取和识别。下面介绍一些常用的人脸特征提取与识别方法。 1 4 1 基于几何特征的方法 人脸e h l 艮睛、鼻子、嘴、下巴等部件构成,对这些部件和结构关系的几何描 述,可作为识别人脸的重要特征。常采用的几何特征有:眉毛的厚度以及与眼睛 中心的垂直距离,鼻子的垂直位置和宽度,嘴巴的垂直位置、宽度以及它和上下 冯颖凌:距离加权特征脸特征提取算法及其改进 嘴唇的高度等。基于几何特征的人脸识别的主要思想就是:首先找出这些特征点 的具体位置,测出他们之间的距离,组成一个特征矢量,然后用这个特征矢量与 人脸库中的特征矢量进行比较,找出最佳匹配。这类方法也有不少,例如k a n a d e t 6 】 用眼角、嘴角等点之间的距离以及所成的角这些几何量作为人脸的特征。y u l l l e l l 7 】 提出了用全局人脸模板以抽取眼睛与嘴。基于几何特征的方法提取过程中过多的 依赖于先验知识,通常需要与其他算法结合才能有比较好的效果。 1 4 2 基于模板匹配的方法 模板匹配法是一种经典的模式识别方法,它充分利用了人脸的纹理和灰度特 征【1 5 1 。它的识别方法就是将待识别的人脸图像与数据库中所有的模版进行比较, 找出最相近的脸。由于这种方法要求两幅图像上的目标要有相同的尺度、取向和 光照条件,所以预处理要做尺度归一化和灰度归一化的工作。最简单的人脸模板 是将人脸看成一个椭圆,检测人脸也就是检测图像中的椭圆。另一种方法是将人 脸用一组独立的小模板表示,如眼睛、嘴巴、鼻子、眉毛和下巴等模板。但这些 模板的获得必须利用各个特征的轮廓,而传统的基于边缘提取的方法很难获得较 高的连续边缘。即使获得了可靠度高的边缘,也很难从中自动提取所需的特征量。 后来改进用弹性模板方法提取特征。弹性模板是由一组根据特征形状的先验知识 来设计可调参数来定义的。这个参数是由能量函数来决定的,首先利用图像的边 缘、峰值、谷值和强度信息以及特征形状的先验知识设计能量函数,然后将参数 向能量函数减小的方向调整,当能量函数达到最小时,这组参数所对应的模板形 状最符合特征形状。在识别率上基于弹性模板的方法比基于几何特征的识别方法 要好,尽管基于几何特征的识别方法识别的速度快,而且要求的内存也小。有人 专门对基于几何特征的识别方法和基于弹性模板的识别方法进行了比较,得出的 结论是:模板匹配法优于几何特征法。 1 4 3 基于统计的方法 也叫特征脸法或代数特征的方法,它将一幅人脸图像看成一个矩阵,通过作 矩阵变换或线性投影,可以抽取人脸的统计特征,这是一种基于整体的思想,把 人脸整个图像看作一个模式进行识别。k i r b y 和s i r o v i c h 8 提出了用k l 变换的方 法来表征人脸,t u r k 和p e n t l a n d l 1 9 在k l 变换和主成分分析的基础上提出了特 扬州大学硕士学位论文6 征脸( e i g e n f a e e s ) 方法。特征脸的基本思想是将图像经过k l 变换后由高维向量转 换为低维向量,并形成低维线性向量空间,人脸投影到这个低维空间所得到的投 影作为识别的特征矢量。所有子空间的正交基就是特征脸。特征脸方法的不足之 处是受表情变化、光照角度强度变化和视角变化等严重影响,鲁棒性较差。 f i s h e r f a c e s 1 0 1 1 法采用线性判别分析,是对特征脸法的一种改进。奇异值分解 ( s v d ) t 1 2 法是与k l 类似的特征提取方法。在某种程度上,奇异值特征具有代数 和几何上的双重稳定性。 1 4 4 隐马尔科夫模型的方法 隐马尔科夫模型( h i d d e n m a r k o v m o d e l ,h m m ) 是用于描述信号统计特性的一 组统计模型。h m m 的基本理论是由b a u m 和w e l c h 等人在2 0 世纪6 0 年代末7 0 年代初建立,在语音识别中应用较多。在h m m 中,节点表示状态,有向边表示 状态之间的转移,一个状态可以具有特征空间中的任意特征,对同一特征,不同 状态表现出这一特征的概率不同。h m m 有三个主要问题:评估、估计及解码。关 键是前两个问题。评估用于解决识别问题,一般采取比较有效的“向前一向后 法:估计用来产生用于识别的各个单元的h m m ,采取b a u m w e l c h 方法。s a m a r i a 最早提出人脸的h m m 模型,他将人脸的五个显著区域,包括头发、额头、眼睛、 鼻子和嘴巴,看成个不同的状态,它们的秩序依次从上到下保持不变。五个状态 是抽象的,不具有具体的意义,只能通过观察序列对它进行估计。h m m 的优点是 允许人脸表情有较大变化,较大的头部转动,缺点是实现的复杂度较高。 1 4 5 人工神经网络方法 由于人工神经网络( a r t i f i c i a ln e u r a ln e t w o r k ,a n n ) 对复杂模式的良好分类能 力,导致该方法在人脸识别中得到了广泛的应用。它通过对样本的学习构造分类 器,并且对分类器进行训练,最后利用分类器完成仿真分类。用于人脸识别的神 经网络方法可训练有较强噪声和部分缺损的图像,这种非线性方法有时比线性方 法更有效。有代表性的网络算法有:感知器、b p 网络、r b f 网络( 径向基函数网 络) 模型等【1 3 1 。目前,绝大部分的神经网络模型都是采用b p 网络及其变化形式, 它是人工神经网络最精华的部分。b p 网络主要用于函数逼近、模式识别、数据压 缩等领域。人们常常会把主成成份方法和神经网络方法结合起来使用,先用主成 成份分析方法对图像进行特征提取,再用这些特征向量和相应的教师信号训练b p 冯颖凌:距离加权特征脸特征提取算法及其改进 7 网。 最简单的神经网络实现方法是用不同姿态或表情的人脸图像作为输入样本, 用标准正面人脸图像作为输出;卷积神经网络则在一定程度上实现了局部的平移、 旋转、尺度和变形的不变性;l i n 和k u n g 提出了一种基于概率决策的神经网络用 于人脸识别。这种网络在决策神经网络的基础上加入了概率变化,采用虚拟样本 进行强化和反强化学习,得到较为理想的概率估计结果,同时采用模块化的网络 结构加快网络的学习。这种方法在人脸检测、人脸定位和人脸识别的各个步骤上 都得到了较好的应用1 1 4 1 。 1 5 国内外公用人脸图像数据库 ( 1 ) f e r e t 人脸数据库1 7 1 :由f e r e t 项目创建,包含1 4 0 5 1 幅多姿态、不同 光照条件的灰度人脸图像,并严格地划分了训练集、g a l l e r y 、不同的测试集等, 是人脸识别领域应用最广泛的人脸数据库之一,参见: h t t p :w w w i t l n i s t g o v i a d h u m a n i d f e r e t f e r e t _ m a s t e r h t m i 。【2 0 1 ( 2 ) p i e 人脸数据库:由美国卡耐基梅隆大学创建,包含6 8 位志愿者的4 1 ,3 6 8 张多姿态、光照和表情的面部图像。其中的姿态和光照变化图像也是在严格控制 的条件下采集的。参见:h t t p :l l w w w r i c n l l l e d u p r o j e c t s p r o j e c t _ 4 1 8 h t m l 1 9 1 ( 3 ) b a n c a 人脸库:该人脸库是欧洲b a n c a 项目资助创建,包含2 0 8 人的多 模态生物特征,覆盖了不同图像质量、不同时间段等变化条件。参见: h t t p :w w w e e s u r r e y u k r e s e a r c h v s s p b a n c a ( 4 ) a r 人脸库:该人脸库是由西班牙巴塞罗那计算机视觉中心于1 9 9 8 年创建 的,包括1 1 6 人不同光照、表情、遮挡和老化的人脸图像共3 2 8 8 幅。参见: h t t p :r v l l e c n p u r d u e e d u - - a l e i x a l e i x _ f a c e d b h t m l ( 5 ) o r e 人脸数据库:由剑桥大学a t & t 实验室创建,包含4 0 个人4 0 0 张面 部图像,部分志愿者的图像包括了姿态、表情和面部饰物的变化。例如:笑或不 笑,眼睛睁着或闭着,戴或不戴眼镜;人脸的姿态有变化,深度旋转与平面旋转 可达到2 0 ,人脸的尺度也有最多1 0 的变化。参见:h t t p : i l w w w u k r e s e a r e h a t t c o r n ( 6 ) x m 2 v t s 多模态生物特征数据库:该数据库包括2 9 5 人在4 个月时间内4 扬州大学硕士学位论文 次录制的人脸和语音数据。每次采集都包括2 个头部旋转视频片断和6 种不同语 音视频片断。另外,其中2 9 3 人的3 d 模型也是可以得到的。该数据库的使用需要 付费。 ( 7 ) y a l e 人脸数据库b :包含了1 0 个人的5 8 5 0 张多姿态、多光照的图像。其 中的姿态和光照变化的图像都是在严格控制的条件下采集的,主要用于光照和姿 态问题的建模和分析。 ( 8 ) p f 0 1 人脸数据库:由韩国浦项科技大学创建,包含1 0 3 人的1 7 5 1 张不同 光照、姿态、表情的面部图像,志愿者以韩国人为主。 ( 9 ) k f d b 人脸数据库:该人脸库包含了1 0 0 0 名韩国人的共5 2 0 0 0 张图像,涵 盖了7 张不同姿态、1 6 种不同光照条件和5 种表情变化。 ( 0 ) c a s - p e a l 人脸数据库:该人脸库包含了1 0 4 0 名中国人,共9 9 4 5 0 张头 肩部图像。所有图像在专门的采集环境中采集,涵盖了姿态、表情、饰物和光照 四种主要变化条件,部分人脸图像具有背景、距离和时间跨度的变化。参 见:h t t p :w w w j d l a c c n p e a l i n d e x h t m l ( 1 1 ) y a l e 人脸数据库:由耶鲁大学计算视觉与控制中心创建,包含巧位志愿者 的1 6 5 张图片,包含光照、表情和姿态的变化。参见:h t t p :c v e y a l e e d u ( 1 2 ) m i t 人脸数据库:由麻省理工大学媒体实验室创建,包含1 6 位志愿者的 2 ,5 9 2 张不同姿态、光照和大小的面部图像。 ( 1 3 ) c m uh y p e r s p e c t r a l 人脸数据库:由卡内基梅隆大学在d a p r p ah u m a n i d 项目资助下创建,该库包含了5 4 个人,6 5 张,覆盖了从可见光到近红外波段( o 4 5 1 1 微米,隔1 0 纳米采集一次) ,包含了4 种光照条件。 ( 1 4 ) e q u i n o x 红外人脸数据库:该库包括9 1 个人,分为视频和静态图片,每人 4 分钟的视频( 共4 0 祯) ,而静态图像则包含了3 种表情。所有的图像均包含3 种光 照条件,部分人分为戴眼镜和不戴眼镜两种情况。它主要覆盖了长波红外图像( 波 长从8 微米到1 2 微米) ,部分人也采集了短波红外图像( 0 9 1 7 微米) 和中波红外图 像( 3 5 微米) 。 ( 1 5 ) m a xp l a n ki n s t i t u t e 人脸数据库:该库包含了2 0 0 个,h ( 1 0 0 个男,1 0 0 女) , 包含3 d 人脸数据和2 d 人脸数据。3 d 人脸图像利用c y b e r w a r e 激光扫描仪获取, 2 d 图像包括了7 种不同的姿势。 ( 1 6 ) n o t r ed a m eh u m a n l d 人脸数据库:该数据库人数超过3 0 0 个人,图像超 过1 5 0 0 0 张,图像采集的时间跨度为1 0 1 3 周,每周采集一次,同时考虑了3 种光 冯颖凌:距离加权特征脸特征提取算法及其改进 9 照条件,2 种人脸表情。 ( 1 7 ) 得克萨斯视频人脸库:包含2 8 4 人( 2 0 8 要j + 7 6 女,年龄在1 8 2 5 ) ,考虑了 姿态( 1 0 秒) ,讲话( 1 0 秒) 和表。t 青( 1 1 种表情,每种5 秒) 三种情况。 1 6 本文研究的内容和主要结构 第1 章绪论介绍了课题研究的背景和意义,人脸识别面临的主要问题及国内 外人脸图像数据库。 第2 章介绍了p c a 人脸识别方法,包括其中的散布矩阵、矩阵的奇异值分解、 离散k l 变换、p c a 的实现步骤及分类器的选取。 第3 章介绍了2 d p c a 算法思想,2 d p c a 的图像重构,p c a + 2 d p c a 的人脸 识别方法,及( 2 d ) 2p c a 的人脸识别方法,并提出了二维距离加权p c a 构造新的 样本空间的方法,以及二维局部加权脸构造新的空间的方法。 第4 章介绍了f i s h e r 准则的原理,p c a + l d a 的人脸识别方法,及最大散度差 线性鉴别准则,提出了加权的最大散度差线性鉴别方法,及最大散度和的鉴别方 法。 第5 章是总述,对本文所研究内容进行了总结,并对今后的工作作了展望。 扬州大学硕士学位论文 1 0 第2 章基于p c a 的人脸识别方法的实现 特征的选择和提取是模式识别的一个关键问题卜 氓4 1 ,由于在很多情况下常常 不容易找到那些最重要的特征,这就使特征的选择和特征的提取的任务复杂化而 成为构造模式识别系统的最困难的任务之一。 特征的选择和提取的基本任务是如何从许多特征中找出那些最有效的特征, 人们通常用物理和结构特征来识别对象,因为这样的特征容易被视觉、触觉和其 他感觉器官所发现。但在使用计算机去构造识别系统时应用这些特征是比较复杂, 而机器在抽取数学特征的能力方面则又比人强的多。因此我们讨论的重点是根据 学习样本来选择并提取数学特征。 一幅图像可以看作一个由像素值组成的矩阵,如果把它扩展开的话也可以看 作一个矢量,如一幅n n 象素的图像可以视为长度为n 2 的矢量,这样就认为这 幅图像是位于n 2 维空间中,这种图像的矢量表示就是原始的图像空间,但是这个 空间仅是可以表示或者检测图像的许多个空间中的一个。不管子空间的具体形式 如何,这种方法用于图像识别的基本思想都是一样的,首先选择一个合适的子空 间,图像将被投影到这个子空间上,然后利用对图像的这种投影间的某种度量来 确定图像间的相似度,最常见的就是各种距离度量。 这一章中我们主要介绍一种基于统计的人脸识别方法,特征脸方法。 2 1 矩阵的奇异值分解 为了计算n x n 维的矩阵& 的特征值和正交归一的特征向量,直接计算几乎是 不可能的,为此引出“奇异值分解”定理,( s i n g u l a rv a l u ed e c o m p o s i t i o n ,简称 s v d ) 2 1 1 。 定义2 1 1 2 2 1 :设a c ? 黼( 胗0 ) ,a r a 的特征值为 ,如,4 ,以+ l ,乃,且 如4 k i = = 九= o 则称q = 石,( 卢1 ,2 ,刀) 为a 的奇异值。 冯颖凌:距离加权特征脸特征提取算法及其改进 矩阵a 的非零奇异值个数恰等于r a n k ( a ) ,且a 与a7 有相同的非零奇异值。 定义2 1 2 2 2 1 ( s v d ) - 设a c 7 ”p 0 ) ,则存在m 阶酉矩阵u 和n 阶酉矩阵以 使得: u 7 彳y = ( 吾善 其中= d i a g ( o l ,盯2 ,盯,) ,而盯= 1 , 2 ,胛) 为a 的非零奇异值。 彳= u ( 吾善) 矿 称之为a 的奇异值分解。 推论2 1 1 令u = ( u l ,u 2 ) ,v = ( k ,) ,则u i = a v , y ,其中u i ,k 分别由队 v 的前,个歹j j 向量构成。 2 2 离散k a r h u n e n l o e v e 变换 离散k l 变换引也称为h o t e l l n i g 变换、特征向量变换或主分量变换,是 k a r h u n e n 和l o e v e 两人对连续随机过程作级数展开而引出的。k l 变换是图像压 缩中的一种最优正交变换,它能随各集合图像的统计性质不同而有不同的变换核 矩阵,也就是说变换矩阵是由集合图像的统计性质来确定的。 人们将它用于统计特征提取,从而形成了子空间法模式识别的基础。在k - l 变换中,将一个n x n 大小的人脸图像按列相连而构成一个n x n 维的矢量,由于 人脸结构的相似性,当把很多这样的人脸图像归化之后,这些图像在这一超高 维空间中不是随机散乱分布的,而是存在某种规律。因此可以通过k l 变换用一 个低维子空间来描述人脸图像,同时又能保存所需的信息。 假设x 为n 维随机向量,x 可以用n 个正交基向量的加权和来表示2 3 1 : 扬州大学硕士学位论文 1 2 x = y 口,仍 一 其中,:加权系数,魏:基向量,或将x 表示成矩阵的形式: 其中, ( 2 2 1 ) x = ( 仍,伤,纯) ( 口l ,口2 ,口。) r = 仃( 2 2 2 ) = ( 仍,伊2 ,纯) ,口= ( 口l ,o f 2 c ) 口。) r( 2 2 3 ) 取仍为正交基向量,即:仍r 纺= :i 二 q 2 4 , 因为由正交基向量构成,所以rc d = i 。将公式( 2 2 2 ) 左右同乘r : 口:r x 即:口户仍x ( 2 2 5 ) ( 2 2 6 ) 我们希望向量a 的各个向量间互不相关。那么如何保证a 的各个分量互不相 关呢? 这取决于选取什么样的正交向量集 仍 了。 设随机向量x 的总体自相关矩阵为: r = e x x 7 】( 2 2 7 ) 将x = o a 代入( 2 2 7 ) 得: r = e ( t d c t a7 7 ) = c d e a c t7 ) 7 ( 2 2 8 ) 要使向量口的各个分量间互不相关,既满足: 脚产怡乒爿 卿, 冯颖凌:距离加权特征脸特征提取算法及其改进 写成矩阵形式: e t 锻7 ,= :。三 = 人c 数量矩阵, q 2 。, 则o r = o a o r ( 2 2 1 1 ) 将式( 2 。2 1 1 ) 两边右乘,得: 。r o = a o r ( 2 2 1 2 ) 因是正交矩阵,所以得r o = o a ,即: r ( 0 j = 乃纺 泸1 ,2 , - - - , n ) ( 2 2 1 3 ) 可以看出,乃删自相关矩阵r 的特征值,纺是对应的特征向量 2 2 1 。因为r 是实对称矩阵,其不同特征值对应的特征向量正交。 综上所述,k - l 展开式的系数可以用下列步骤求出: ( 1 ) 求随机向量x 的自相关矩阵: r = e x x7 1 ) ( 2 ) 求出自相关矩阵r 的特征值乃和对应的特征向量纺泸1 ,2 , - - - , n ) 。得到矩 阵: = ( 仍,仍,纯) ( 3 ) 展开式系数即:口= ,x k l 变换的实质是建立了一个新的坐标系,将一个物体主轴沿特征矢量对齐 的旋转变换,这个变换解除了原有数据向量的各个分量之间的相关性,从而有可 能去掉那些带有较少信息的坐标系,以达到降低特征空间维数的目的。 扬州大学硕士学位论文 1 4 2 3p c a 在人脸识别中的应用 19 91 年m a t t h e w t u r k 和a l e x p e n t l n a d 最早将p c a ( p r i n e i p a l c o m p o n e n t a n a l y s i s ) 应用于人脸识别1 ,进一步提出了特征脸( e i 弘e a f e e ) 的概念。 2 3 1p c a 实现步骤 完整的p c a 人脸识别的应用包括四个步骤:人脸图像预处理;读入人脸库, 训练形成特征子空间;把训练图像和测试图像投影到上一步骤中得到的子空间上; 选择一定的距离函数进行识别。下面详细描述整个过程。 1 、读入人脸库 归一化人脸库后,将库中的每人选择一定数量的图像构成训练集,其余构成

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论