




已阅读5页,还剩48页未读, 继续免费阅读
(通信与信息系统专业论文)基于非参数化判别分析的人脸识别研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 生物特征识别技术以其独特的优势,已成为身份鉴别和认证的一个重要研究 方向。人脸识别技术作为生物特征识别技术中的一种,同其它生物特征识别技术 相比,具有直接、方便、易接受等特点,因而受到广泛关注。论文从经典的线性 最佳描述特征入手,针对具有更好判别性能的判别分析方法,深入研究了子空间 方法中典型的主成分分析、f i s h e r 判别分析的人脸特征提取方法,并进行了大量的 实验分析,主要内容如下: 1 详细研究主成分分析( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a ) 和线性判别分析 ( l i n e a rd i s c r i m i n a n ta n a l y s i s 。l d a ) 的基本原理。分析了基于p c a 的人脸识 别方法;在分析p c a 方法不能提取有效分类特征的缺点的基础上,实现了基 于l d a 的人脸识别方法,并进行了大量分析。实验结果表明,l d a 可以获得 优于p c a 的识别率,缺点是不适用于线性不可分数据,不能提取隐藏在图象 空间的非线性结构。 2 针对l d a 不能有效地提取图象空间的非线性结构,且最多只能提取c 一1 个判 别特征,使得分类性能不够理想等问题,研究了基于非参数化判别分析 ( n o n p a r a m e t r i cd i s c r i m i n a n ta n a l y s i s ,n d a ) 的人脸识别方法。该方法借助 非线性结构局部近似线性的思想,定义了新的类间散布矩阵和类内散布矩阵, 然后通过最大化类间散布矩阵和最小化类内散布矩阵准则提取最优投影方 向,使得投影后的特征不仅有效地保持了类内的局部结构,且类内分布具有 较好的紧凑性,类间分布具有较好的可分性。此外,n d a 提取的特征个数不 受类别的限制。在0 r l 和a r 数据库上的实验结果证实了算法的有效性。 3 设计了基于n d a 的人脸识别系统。详细介绍了实时人脸识别系统的设计原理、 评价指标、模块的构成、流程图,并进行了分析。 关键词:人脸识别特征提取主成分分析线性判别分析非参数化判别分析 a b s t r a c t b i o m e t r i ci d e n t i f i c a t i o nt e c h n o l o g yh a sb e c o m ea l li m p o r t a n tr e s e a r c hd i r e c t i o ni n t h ea r e ao fa u t h e n t i c a t i o na n dc e r t i f i c a t i o n a so n eo ft h et e c h n o l o g i e so fb i o m e t r i c i d e n t i f i c a t i o n f a c er e c o g n i t i o nh a sb e e np a i dm u c hm o r ea t t e n t i o nb e c a u s ei th a ss e v e r a l a d v a n t a g e so v e ro t h e rt e c h n o l o g i e s 。s u c ha sc o n v e n i e n ti nu s e ,e a s yi na c c e p t a n c ee t c i n t h i sp a p e r , ad e e ps t u d yo nt h ef a c i a lf e a t u r e se x t r a c t i o nm e t h o d so fp c aa n dl d ai s m a d e m a tw em a i n l ys t u d i e di nt h i st h e s i si sg i v e na sf o l l o w s : 1 t h eb a s i cp r i n c i p l eo ft h em e t h o d so fp c a ( p r i n c i p l ec o m p o n e n ta n a l y s i s ) a n d l d a ( l i n e a rd i s c r i m i n a n ta n a l y s i s ) a r ei n t r o d u c e d a n dt h ed i s a d v a n t a g e so ft h e m e t h o do fp c af o rf a c er e c o g n i t i o na r ea n a l y s e d b a s e do ni t t h el d af a c e r e c o g n i t i o nm e t h o d si sr e a l i z e d t h r o u g hal a r g eq u a n t i t yo fe x p e r i m e n t s ,i ts h o w s t h a tt h em e t h o do fl d ad o e sn o ta p p l yt on o n 1 i n e a rd a t a a n db eu n a b l et oe x t r a c t t h en o n - l i n e a rs t r u c t u r ee m b e di ni m a g es p a c e 2 d u et ot h ed i s a d v a n t a g e so ff a i l u r et oe x p r e s st h en o n l i n e a rs t r u c t u r ei nt h ei m a g e s p a c ee f f e c t i v e l y , t h em e t h o do ff a c er e c o g n i t i o nb a s e do nn d a ( n o n p a r a m e t r i c d i s c r i m i n a n ta n a l y s i s ) i s p r o p o s e d w i t hu s i n gt h ei d e at h a tt h en o n - l i n e a rs t r u c t u r e c a nb er e g a r d e da sal i n e a ro n ei nl o c a la r e a ,t h eb e t w e e n - c l a s ss c a t t e rm a t r i xa n d w i t h i n c l a s ss c a t t e rm a t r i xa r er e d e f i n e d ,a n dt h eo p t i m a lp r o j e c t i o nd i r e c t i o ni sg e t b yu s i n gt h er u l eo fm a x i m i z i n gt h eb e t w e e n c l a s ss c a t t e ra n dm i n i m i z i n gt h e w i t h i n c l a s ss c a t t e rm a t r i x t h u st h ef e a t u r e sa b s t r a c t e db yp r o j e c t i o nn o to n l y m a i n t a i nt h ec h a r a c t e r i s t i c so fl o c a ls t r u c t u r ei n s i d ec l a s s b u ta l s og a i nab e t t e r c o m p a c t n e s si nc l a s sa n db e t t e rc l a s s i f i c a t i o np e r f o r m a n c eb e t w e e nc l a s s e s i n a d d i t i o n t h en u m b e ro ff e a t u r e st h a tn d ae x t r a c t e dw i l ln o tb ec o n f i n e db yt h e n u m b e ro fc l a s s e s t h ee x p e r i m e n t so nt h eo r la n da rf a c ed a t a b a s e sc o n f i r m e d t h e e f f e c t i v e n e s so ft h ea l g o r i t h m 3 ar e a l t i m ef a c er e c o g n i t i o ns y s t e mb a s e d0 i in d aa l g o r i t h mi sa c h i e v e d a d e t a i l e dd e s c r i p t i o no ft h ed e s i g np r i n c i p l e ,c r i t e r i o n ,s t r u c t u r ea n df l o wc h a r ta r e g i v e na n da n a l y z e d k e yw o r d :f a c er e c o g n i t i o n f e a t u r ee x t r a c t i o n p r i n c i p a lc o m p o n e n ta n a l y s i s l i n e a rd i s c r i m i n a n ta n a l y s i s n o n p a r a m e t r i cd i s e r i m i n a n ta n a l y s i s 创新性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或 其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做 的任何贡献均已在论文中做了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 厶 本人签名:鳖砾 日期幽孑,。 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕 业离校后,发表论文或使用论文工作成果时署名单位仍是西安电子科技大学。学 校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公开论文的全部 或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。( 保密的论文在 解密后遵守此规定) 本人签名:崤雄 日期鲤兰:竺 导师签名:二= = 妒 日期至驾l 互尘l 第一章绪论 第一章绪论 随着国际恐怖组织势力的日益猖獗,当前全世界在应对恐怖组织势力以及公 共场所的安全问题上都遇到前所未有的挑战。尤其是在9 1l 事件发生以后,国家安 全部门对各种场合的安全检查越来越重视,比女h 2 0 0 6 年德国世界杯和2 0 0 8 年北京 奥运会,在安保和反恐方面都投入了前所未有的力量,各种高科技手段也被应用 于各种公共场所的安检。由于人脸识别具有较高的普遍性、可采集性,并且容易 被用户接受,加之计算机图像处理技术和网络技术的飞速发展使人脸识别在当前 得到广泛的应用,这些都促进了人们对人脸识别技术的研究。自动人脸识别 ( a u t o m a t i cf a c er e c o g n i t i o n ,简称a f r ) 是一个典型多学科交叉问题,涉及到模 式识别、图像处理、计算机视觉、统计学习、人工智能、计算机图形学和认知科 学等多个学科。目前自动人脸识别技术已经成为模式识别和人工智能领域最具挑 战性的研究热点之一。 1 1 人脸识别研究背景及意义 现代社会中,身份鉴别技术具有非常重要的应用价值,常见的身份鉴别方法 主要依靠d 卡( 如身份证、工作证、智能卡、存储卡等) 和密码手段来实现。这 些手段携带不方便,容易遗失、遗忘或由于使用不当而损坏、不可读和密码易被 破解等。尤其近年制假伪造的手段越来越隐蔽,传统的身份鉴别方法面临着严峻 的挑战。作为模式识别中的热门研究领域,生物特征( b i o m e t r i c s ) 识别提供了对 具有唯一性、可靠性和稳定性的人体生物特征进行鉴别的方法【。所谓生物特征识 别【2 】就是通过计算机与光学、声学、生物传感器和生物统计学等高科技手段密切结 合,利用人体固有的生理特性( 如指纹、脸像、虹膜等) 和行为特性( 如笔迹、 声音、步态等) 进行个人身份的鉴定。其核心在于如何获取这些生物特征,并将 之转换为数字信息存储于计算机中,同时利用可靠的匹配算法来完成个人身份鉴 别的过程。 研究表明,任何一种生物特征必须满足以下几个基本条件【3 】:( 1 ) 每个人都 具有这种特征;( 2 ) 任意两个人的同种特征都不相同;( 3 ) 这种特征至少在一 段时间内是相对稳定的;( 4 ) 这种特征容易获得,并且可以被定量测量。典型的 生物特征有:指纹、脸像、虹膜、语音、笔迹、步态和d n a 等。每一种生物特征 识别技术都有自己的优势和不足,没有一种技术能在各方面都优于其他技术,所 以在具体的应用中应该结合实际情况选择。几种生物特征识别技术的性能指标比 基于非参数化判g 崂析的人脸识别研究 较见表1 1 1 ”。 表1 1 几种生物特征识别技术的性能指标比较 高 低 高 低 中 低 高 中 高 低 高 中 高 低 高 低 高 低 由 中 低 从表1 1 可以看出,人脸识别具有较高的普遍性,可采集性,并且容易被用户 接受。此外,如果对人脸的表情姿态进行分析,还能获得其他识别系统难以得到 的一些信息。 人脸识别的主要研究意义在于: ( 1 ) 人脸识别技术研究极大地促进相关学科的发展 人脸_ 【 别技术涉及的学科领域众多,包括模式识别、图像处理、计算机视觉、 图像图形学、生理学、心理学、人工智能、神经计算等学科,具有重要的研究价 值。它的发展得益于这些学科的发展;同时,它也为验证相关学科理论的正确性 提供了一个良好的实验平台。 ( 2 ) 人脸识别具有巨大的应用前景 人脸识别属于生物测定学领域的研究内容。生物测定学是指利用人类本身所 拥有且能标识其身份的生物特征进行身份认证的技术1 5 】。而人脸特征又是优于其他 生物特征的本质特征之一。囚此可以应用到多个领域进行身份鉴别。 ( 3 ) 人脸识别技术远没有发展成熟。由于存在如图1i 所示影响人脸识别的诸 多因素,目前对人脸识别的研究还面临相当大的挑战和困难。 人脸自身 变化器霹缝 l 隔磊形蚓弋圃 豳11 影响人脸识别的因素 中高中中高高低高中高低中偶高 高低高低中低高中高高中中中高 撇雠雌酷鞑;耄眺 魄 摒妣 , 【 第一章绪论 人脸自身因素:人脸是非刚体,它会因为表情、精神状态、健康状况、姿态、 整容、年龄、意外损伤等变化而发生巨大的变化,大大增加了人脸识别的难度; 发型、眼镜、化妆、帽子、头发胡须等对人脸造成遮挡;从三维图像重建三维人 脸是病态过程,目前尚没有很好的描述人脸的三维模型;对于双胞胎,人脸识别 技术不能区分。 外部环境因素:光照环境条件、摄像设备、人与摄像设备的距离角度、图像 存储质量等也会影响人脸图像的质量。 综上所述,人脸识别研究具有重要的理论研究和实际应用价值。 1 2 人脸识别的应用领域 人脸识别是众多生物特征识别技术中特别引人瞩目的一种模式识别问题,其 广泛的应用领域和发展前景早已受到广大研究人员的注意。表1 2 f 6 1 列举了部分人 脸识别的具体应用。 表1 2 人脸识别的部分具体应用 应用领域具体应用特点 海关等出入境管理识别关键人物( 恐怖分子、间谍等) 会议代表身份识别识别会议代表身份,防止非法人员进入 银行、商场视频监控,人脸表情识别,预警不 重要场所视频监控 安全因素 国家安全 驾照、护照、身份证、移民签 核对持证( 卡) 人身份是否属实,防止身份被 公共安全 证、金融卡、信用卡、准考证 军事安全 等证件核对 假冒造成损失 嫌疑犯照片比对确认犯罪嫌疑人身份 嫌犯追踪疑犯追踪与调查 系统门禁软件系统登陆控制 物理门禁门禁系统:出入控制 家政机器人家庭成员识别 智能家居 智能保险柜 防止钥匙遗失、密码被盗造成财产、重要资料 人机交互 被窃 智能游戏、娱乐虚拟现实,提供玩家的面像,提高真实感 白动系统登陆防止非法用户登录系统 信息安全 数据库安全 提供安全可靠的身份验证,防止非法访问,非 金融安全 互联网安全 法接入 智能交易终端 企业应用 人脸识别系统提供方便快捷的考勤方式,防止代考勤 4 基于非参数化判别分析的入脸识别研究 1 3 人脸识别技术的发展 人类对于入脸识别技术的研究已有很长的历史。早在1 9 世纪后期,法国入 f r a n c i sg a l t o n 就曾用一组数字代表不同的人脸侧面特征来实现对人脸侧面图像的 识别【7 1 。最早的自动人脸识别系统是c h a n 矛h b l e d s o e 在1 9 6 5 年创建的【8 】,到现在已经 有4 0 多年的历史。 人脸识别的发展大致可以分为以下四个阶段: ( 1 ) 人脸识别研究的萌发阶段 早在二十世纪五十年代,人类就开始在心理学领域对人脸识别进行研究。j 。s b r u n e r 于1 9 5 4 年写下了关于心理学的“t h ep e r c e p t i o no f p e o p i e 。到了六十年代, 对人脸识别的研究延伸到了工程学方面。 ( 2 ) 关于人脸的机器识别研究 该方面的研究开始于2 0 世纪7 0 年代,代表人物有b e r t i l l o n ,a l l e n 和p a r k e 。主要 研究人脸识别所需要的面部特征。b e r t i l l o n 用一个简单的语句与数据库中某一张脸 相联系,同时与指纹分析相结合。为了提高人脸识别率,a l l e n 为待识别人脸设计 了一种有效和逼真的摹写【9 1 。p a r k e 耳| l 计算机产生了较高质量的人脸灰度图模型1 0 l 。 这一阶段的识别过程完全依赖于操作人员,不是一种可以完成自动识别的系统。 ( 3 ) 人机交互式识别阶段 在该阶段,g o l d s t i o n 、h a r m o n 和l e s k 等将人脸面部特征用多维特征矢量表示 出来,并设计了基于这一特征表示方法的识别系统f l l 】。k a y a 和k b b a y a s h i 等,则采 用了统计识别的方法【1 2 】,用欧氏距离来表示人脸特征,如嘴唇与鼻子之间的距离, 嘴唇的高度等。k a n a d a 设计的半自动人脸回溯识别系统【l3 1 ,运用积分投影法从单 幅人脸图像中计算出面部特征参数,完成人脸匹配。b a r o n 先将图像灰度归一化【1 4 1 , 再用4 个掩模( 眼、鼻、嘴及眉毛以下的整个脸部) 表示人脸,然后分别计算这4 个掩模与数据库中每幅标准图像的相应掩模之间的互相关系数,以此作为判别依 据。总的来说,这类方法需要利用图像的某些先验知识,仍然摆脱不了人的干预。 ( 4 ) 真正的机器自动识别阶段 2 0 世纪9 0 年代以来,随着高性能计算机的出现,人脸识别方法有了重大突破, 进入真正的机器自动识别阶段。目前世界上最有名的人脸识别系统为v i s i o n i c s 公司 的“f a c e l t 1 5 】。该系统在可控条件下,识别率可达8 0 以上。美国的l a u 公司研 制的人脸图像自动识别系统,是以人眼辨别人脸为原理,基于生物测量学、人像 复原技术的装置。美国3 d ( 三维) 人脸识别系统将所有结构的不可见光线投射于 人的面部,生成具有4 0 0 0 个数据点网状结构的面部3 d 人脸模板,并与数据库中存 储的3 d 人脸模板进行对比,在不到l s 的时间内精确完成辨认,在业界处于领先地 位【16 1 。 第一章绪论 国内对人脸识别的研究力量也日益强大。中科院计算所高文教授主持的8 6 3 项 目“面像检测与识别核心技术”已通过鉴赳 1 。该系统会自动在人脸上选取1 0 3 个 点,然后通过分析面部皮肤反射属性、三维结构等特征进行识别,静态场景下识 别准确率达至1 j 9 6 5 ;清华大学承担的国家“十五”攻关项目人脸识别系统, 采用了人脸多部件融合、多算法融合、人脸分类算法等技术和精确的多姿态人脸 采集设备,并提出了最佳二维人脸识别的思想,在人脸识别技术上取得了重要突 破。同时该系统还采用了人脸骨骼结构对比技术,大大减弱了因化妆、眼镜、胡 须带来的影响。另外,国内的数字奥森f g 卫士人脸识别出入口控制系统【l 引,采用 世界上首创的近红外人脸识别技术,并将人脸识别算法集成在系统硬件内,可在 不到1 s 的时间内快速完成对人脸特征的提取、比对、识别和确认等,实现对目标人 员的有效身份验证。 1 4 人脸识别的研究内容及方法 1 4 1 人脸识别的研究内容 概括说来,人脸识别技术主要研究内容有以下5 个方面【l8 】: ( 1 ) 人脸检测与跟踪( f a c ed e t e c t i o na n dt r a c k i n g ) 人脸检测任务要求判断计算机的“眼睛 观察到的“影像 中是否存在人脸。 如果存在,需要同时给出其在图像中的坐标位置、人脸区域大小等信息。而人脸 跟踪则需要进一步输出所检测到的人脸位置、大小等状态随时间的连续变化情况。 ( 2 ) 人脸表征( f a c er e p r e s e n t a t i o n ) 采取某种表示方式表示检测出的人脸和数据库中的已知人脸。常用的表示法 包括几何特征( 如欧式距离、曲率、角度) 、代数特征( 如矩形特征矢量) 、固 定特征模板、特征脸、云纹图等。 ( 3 ) 人脸鉴别( f a c ei d e n t i f i c a t i o n ) 将待识别的人脸与人脸数据库中的已知人脸比较,得出相关信息。这一过程 的核心是选择适当的人脸表征方式与匹配策略,系统的构造与人脸表征方式密切 相关。 ( 4 ) 表情姿态分析( e x p e s s i o n g e s t u r ea n a l y s i s ) 对待识别人脸的表情或姿态信息进行分析,并对其加以归类。 ( 5 ) 生理分类( p h y s i c a lc l a s s i f i c a t i o n ) 对待识别人脸的生理特征进行分析,得出其年龄、性别等相关信息。 基丁邗参数化判别分析的人脸识别研究 1 4 2 人脸识别方法 目前静止图像的识别方法是人脸识别领域中主要的研究方向,研究成果也更 为成熟。静止图像的人脸识别方法有两个研究方向:其一是基于整体特征的研究 方法,该方法是将人脸图像看作一个二维的灰度分布,对这个分布利用不同的降 维和特征提取方法得到每个人的人脸表征之后进行识别;其二是基于局部特征的 研究方法,这种方法是利用每个人的面部特征( 眉毛、眼睛、鼻子、嘴巴和面部 轮廓线等) 的位置,大小及其相互位置的差异来进行特征提取,达到人脸识别的 目的。依据算法的性质,人脸识别方法可分为以下几类: 几何特征方法几何特征方法是将人脸用一个几何特征矢量表示【l9 1 ,用模式 识别中层次聚类的思想设计分类器,达到识别目的。常用的几何特征有人脸的五 官如眼睛、鼻子、嘴巴等的局部形状特征,脸型特征以及五官在脸上分布的几何 特征,提取特征时往往要用到人脸结构的一些先验知识。基于几何特征的识别方 法具有如下优点:符合人类识别人脸的机理,易于理解;对每幅图像只需存储一 个特征矢量,存储量小;对光照变化不太敏感。该方法同样也有其缺点:从图像 中特别是在特征受到遮挡时,抽取稳定的特征比较困难;对强烈的表情变化和姿 态变化的鲁棒性较差;一般几何特征只描述了部件的基本形状与结构关系,忽略 了局部细微特征,造成部分信息丢失。这种方法更适合用于粗分类。 神经网络方法神经网络利用大量简单处理单元( 神经元) 互联构成的复杂 系统来解决识别问题【2 0 l 。常用的神经网络有b p ( 反向传播) 网络、自组织网络、 卷积网络、径向基函数网络和模糊神经网络。c o t t r e l l 等人 2 1 】使用级联b p 神经网络 进行人脸识别,对部分受损的人像、光照有所变化的人像,识别能力较好;l 试s h t 2 2 】 等提出了基于概率决策的神经网络方法( p d b n n ) ,采用虚拟( 正反例) 样本进 行强化和反强化学习,得到较为理想的概率估计结果:i n t r a t o r 等人【2 3 】用一个无监 督监督( b c m b p ) 混合神经网络进行人脸识别。l a w r a n c e 和g i l e s 等人【2 4 】用一个 由自组织映射( s o m ) 神经网络与卷积神经网络结合的系统对每人有1 0 幅、共有 4 0 0 1 9 虿人脸图像的数据库进行了人脸识别研究。神经网络具有自组织性、高维性、 模糊性、分布性和冗余性等特点,但由于人类对自身思维机理认识的不足以及对 人工神经元作了极度的简化,这种模拟还是较为简单的。 弹性图匹配法弹性图匹配法将人脸图像库中的图像和待识别图像都用特征 矢量图表示,通过对图与图问拓扑结构的匹配以及节点与节点间特征矢量值的比 较,进行人脸识别。l a d e s 等人【2 5 】提出采用动态链接结构( d l a ,d y n a m i cl i n k a r c h i t e c t u r e ) 的方法识别人脸。w i s k o t t 等人【2 6 】将人脸特征上的一些点作为基准点, 构成弹性图。采用每个基准点存储一串具有代表性的特征矢量,减少了系统的存 储量。弹性图匹配法的最大优点在于对光和表情变化的相对不敏感性。缺点在于 第一章绪论 计算量和存贮量都比较大,识别的速度比较慢。 隐马尔可夫模型方法隐马尔可夫模型( h m m ) 是用于描述信号统计特性的 一组统计模型,它用马尔可夫链来模拟信号统计特性的变化。隐马尔可夫模型建 立在统计模型的基础上,不需要进行复杂的人脸图像特征提取,对姿态和环境的 变化有较好的鲁棒性。剑桥大学的s a m a r i a 和f a l l s i d e 首先将1 - dh m m 和2 一dp s e u d o h m m 用于人脸识别【27 1 。他们对多个样本图像的空间序y d u i i 练出一个h m m 模型。 后来集成c o u p l e dh m m 和h m m 通过对超状态和各嵌入状态采用不同的模型构成混 合系统结构。h m m 方法具有以下优点:能够允许人脸有表情变化,较大的头部转 动;扩容性好,即增加新样本不需要对所有的样本进行训练;较高的识别率。缺 点是实现的复杂度较高。 代数特征方法代数特征是利用各种代数变换和矩阵分解提取的。它是根据 某种判别函数计算出最佳投影方向,将图像矩阵投影到该方向上提取代数特征, 这样得到的特征含有较多的图像信息。比较经典的方法是特征脸方法和f i s h e r j 佥方 法。特征脸方法【2 8 】是从主成分分析方法( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a ) 导出 的一种人脸识别和描述方法。其主要思想是,以训练样本集的总体散布矩阵为生 成矩阵,经k - l 变换后得到相应的一组特征向量,称作“特征脸 。所谓特征脸就 是对应于总体散布矩阵的那些较大特征值的特征向量。这样就产生了一个由“特 征脸”张成的子空间。由特征脸所张成的子空间在维数上比原模式空间大大减少, 人脸识别工作就在该子空间上进行。每一幅人脸图像向其投影都可以获得一组坐 标系数,这组坐标系数表明了人脸在特征脸子空间中的位置。实验表明特征脸方 法把人脸作为一个整体来处理,大大降低了识别复杂度,并且具有较强的稳定性, 可以作为人脸识别的依据。在此基础上,黄晓丽提出了基于对称性特征半脸的人 脸识别方法( s h p c a ) 2 9 】。该算法利用人脸的对称性特征,引入人脸图像的镜像 样本,从而对不同姿态的人脸有更好的识别能力,而且该方法采用分割人脸的方 法,对在识别中占重要地位的上半脸采取大的权重,而对相对作用较轻的下半脸 赋以小的权重,来克服表情变化对识别的影响。 在传统特征脸方法的基础上,研究者认识到特征值大的特征向量( 即特征脸) 并不一定是分类性能最好的方向,而且对于k l 变换而言,外在因素带来的图像差 异和人脸本身带来的差异是无法区分的,特征脸在很大程度上反映了光照等的差 异。研究表明,特征脸方法随着光线、角度和人脸尺寸等因素的引入,识别率急 剧下降。因此特征脸方法用于人脸识别还存在理论的缺陷。而且它没有考虑到类 内、类间的差异,因此不能获得最好的分类结果。 f i s h e r 脸方法【3 0 j 以基于f i s h e r 准则的线性判别分析( l i n e a rd i s c r i m i n a n t a n a l y s i s ,l d a ) 为理论基础。l d a 的目的是从高维特征空间里提取出最具判别能 力的低维特征,这些特征能将同一个类别的所有样本聚集在一起,而将不同类别 8 基于非参数化判别分析的人脸识别研究 的样本尽量地分开,也就是说选择使得样本类间离散度& 和样本类内离散度鼠,的 比值最大的代数特征。它通过计算矩阵s 。,一& ,利用其较大特征值对应的特征向量 构造投影矩阵,可称之为“f i s h e r 脸 子空间,该子空间包含了类别可分性信息, 所以适用于分类问题。同样的,将人脸图像向其投影获得一组坐标系数,该系数 表明了人脸在f i s h e r 脸子空间中的位置,通过该位置来判断人脸的类别归属。 l d a 算法在样本线性可分的情况下,具有较理想的分类性能。但是,当样本 线性不可分时,l d a 算法无法提取出隐藏在图像中的非线性结构。而非参数化判 别分析( n o n p a r a m e t r i cd i s c r i m i n a n ta n a l y s i s ,n d a ) 方法借助非线性结构局部近似 线性的思想,能很好地解决这个问题。对该方法的研究,本文在第三章将做重点 阐述。 1 5 论文主要研究内容及安排 特征提取是人脸识别的核心问题之一。其中线性特征提取又是最为经典和广 泛使用的方法之一。本文针对线性特征提取的理论与算法进行了深入的研究,详 细探讨和分析了基于特征脸和f i s h e r f a c e 的人脸识别方法,重点研究了基于非参数 化判别分析( n d a ) 的人脸识别方法,并最终实现实时的人脸识别系统。 全文共分五章,具体安排如下: 第一章绪论从人脸识别的理论角度阐述了人脸识别的发展、研究内容、优 势与难点及其应用领域,介绍了几种典型的人脸识别方法,最后给出了本文的主 要研究工作及各章安排。 第二章基于线性特征提取的人脸识别算法具体研究了两种典型的人脸识 别方法e i g e n f a c e 方法和f i s h e r f a c e 方法的原理和过程,并给出这两种算法的实 验结果和性能分析。 第三章基于非参数化判别分析的人脸识别在对f i s h e r f a c e 方法的缺陷进行 分析的基础上,引入非参数化判别分析的思想,深入研究n d a 算法处理线性不可 分样本的基本原理和用于人脸识别的实现方法及其改进。通过在o r l 人脸数据库 和a r 人脸数据库上的实验分析表明该方法较e i g e n f a c e 和f i s h e r f a c e 法,具有更高 的识别率。 第四章实时人脸识别系统设计完成人脸识别系统的软件设计。该软件采用 v i s u a lc + + 6 0 编写,将基于n d a 的人脸识别算法嵌入实时系统中,实现实时人脸 识别功能。 第五章总结和展望总结全文,并指出进一步的研究方向。 第二章基于线性特征提取的人脸识别算法 9 第二章基于线性特征提取的人脸识别算法 特征提取是人脸识别过程中的重要环节,特征提取的好坏直接影响人脸识别 的结果。简单地说,特征提取3 1 1 就是讨论如何以较小的维数表示数据,通过更为 稳定的表示来提高分类性能,使后续分析更为容易。在模式识别的相关文献中, 用降低后的维数表示数据的方法叫做特征选择和特征提取的方法,本章将研究两 种经典的线性特征提取算法一主成分分析法和线性判别分析法。 2 1 特征提取 下面先给出特征提取的详细定义【3 l 】: 给定一组测量值,本质上可以通过两种不同的方法减少维数。 第一种方法是识别那些对分类贡献不大的变量,在判别时忽略这些变量。需 要做的是从p 维测量值中选出d 个特征( 特征数d 也必须确定) 。这种方法称为测 量空间中的特征选择,简称为特征选择。 第二种方法是找到一个从p 维测量空间到更低维数特征空间的变换,这种方 法叫做变换空间中的特征选择或者特征提取。变换可以是原始变量的线性或非线 性组合,可以是有监督或无监督的情况。在有监督的情况下,特征提取的任务是 找到一种使特定的类别可分离性判据最大的变换。图2 1 表示了两种方法的区别。 x i f 融) 最 x i f ( x l ,) p ) f l 最 ( a ) 特征选择( b ) 特征提取 图2 1 特征选择和特征提取区别 由于人脸样本存在数据量大的特点,基于计算代价的考虑,一般采用特征提 取的方法降低样本维数。其中线性特征提取方法具有计算代价小、描述能力强、 可分性好等特点,目前已经成为特征提取技术中的主流算法之一。下面详细地分 析和比较两种典型的线性特征提取算法主成分分析法( p c a ) 和线性判别分 析法( l d a ) 。 1 0 基于非参数化判别分析的人脸识别研究 2 2 主成分分析法( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a ) 主成分分析的目的是通过求解训练样本散布矩阵的特征值和特征向量,给出 一组数量远远小于样本空间维数的正交基来表示训练样本张成的子空间。几何上, 主成分分析产生一个正交坐标系。主成分分析通常是数据分析的第一步,常用于 减少数据的维数而尽可能多地保留原始数据集中的信息【3 l 】。 2 2 1 离散k a r h u n e n l o e v e 变换 主成分分析也可称为k l 变换,下面着重讨论在最小均方误差准则下的有限离 散k - l 变换【3 2 】: 假设对向量集合 鼢) ,i = 1 ,2 ,中的每个而用确定的完备正交归一向量系 的,j = 1 ,2 ,o o 展开,可得: 鼍= c j u j ( 2 1 ) 如果只用有限项来估计鼍,即 毫= 绷 ( 2 - 2 ) 则由此引起的均方误差是 善= e 【( 鼍一耳) r ( 鼍一再) 】 ( 2 - 3 ) 因为 掰r 7 聊= 【。1 , ,j = i f , ( 2 - 4 ) 所以 孝钮 巧】 ( 2 5 ) j = d + i 容易看到 c j2 h t j x i 因此 f 翘【吩t t t 吩】 j = d + l 由于4 j 是确定性向量,n i i 七式( 2 7 ) 可改写为 ( 2 - 6 ) ( 2 - 7 ) 第二章基于线性特征提取的人脸识别算法 1 1 孝= u r e x l x i7 m ( 2 - 8 ) j = d + l 令缈= e x f x f r 】,则 乒= 衫 ( 2 - 9 ) j = d + l 用拉格朗日乘子法,即求式( 2 1 0 ) : g ( 吩) = u r 彤u j 一乃【衫吩- 1 ( 2 1 0 ) j = d + lj f d + l 对h ,j = d + 1 ,o o 求导数,得: ( 妒一兄,) 比,= 0 ,j = d + 1 ,0 0 ( 2 1 1 ) 令d = 0 ,从而可得下面的结论: 以矩阵p 的本征向量作为坐标轴来展开鼍时,其截断均方误差具有极值性质, 且当取d 个u j ( = 1 ,2 ,d ) 来逼近薯时,其均方误差 生 孝= 乃 ( 2 - 1 2 ) = d + l 式中五;是矩阵吵的特征值。可以证明,当取d 个最大特征值对应的特征向量 来展开蕾时,其截断均方误差最小。由这d 个向量所组成的正交坐标系称作d 维 k - l 变换坐标系,鼍在k - l 坐标系上的展开系数称作鼍的k - l 变换。 有限离散k l 变换是一种基于目标统计特性的最优正交变换,其生成矩阵一般 为训练样本的总体散布矩阵。k - l 变换使变换后产生的新的分量正交或不相关;并 且用部分新的分量表示原矢量时的均方误差最小,使变换矢量趋于确定,能量更 趋于集中等。所以,k - l 变换可以用在特征提取、数据压缩等方面。 2 2 2 特征脸方法( e i g e n f a c e ) 从主成分分析导出的一种人脸识别和描述方法称为特征脸( e i g e n f a c e ) 方法。 它将人脸图像看作是一种随机向量,采用k l 变换获得其正交k - l 基底。特征脸方 法利用这些基底的线性组合描述人脸图俐”】。其实现的具体步骤如下: ( 1 ) 获得人脸图像的训练样本集,计算总体散布矩阵,得到特征脸子空间; ( 2 ) 在进行识别前,先借助特征脸子空间,首先判断该图像是否为人脸图像; ( 3 ) 对于要识别的人脸图像,将其映射到特征脸子空间,可以得到一组权值; ( 4 ) 根据某种判别法则判断它是否是人脸训练样本集中的某个人。 1 特征脸子空间构造过程 1 2 基于非参数化判别分析的人脸识别研究 设人脸图像i ( x ,y ) 为二维m x l , l 灰度图像,用m x n 维向量工表示。人脸图像训 练集为 鼍ii = 1 ,) ,其中n 为训练集中图像总数。则幅图像的平均值向量为: i = - 号x x , (213)x x=f 2 j ,f = 1 、一 每个人脸墨与平均人脸i 的差值向量是: 鼍一i ( 江l ,n ) ( 2 1 4 ) 则训练图像的总体散布矩阵可表示为: 墨= ( 葺一习( 葺一x - ) r( 2 1 5 ) 特征脸由总体散布矩阵s 的正交特征向量组成。对于聊甩维人脸图像,墨大 小为( m x n ) x ( m x n ) 维:,求解特征值和特征向量比较困难。根据s v d 定理可以先求 n x n 维矩阵: = ( 薯一习7 ( 薯一习 i = 1 s v d 定理:设a 是一个秩为,的 r 维矩阵,存在两个正交矩阵: u = h ,口p 】孵” u r u = j ; ( 2 - 1 6 ) ( 2 - 1 7 ) v = h ,屹,v ,】暇脚 v r v = j ;( 2 ,1 8 ) 以及对角矩阵 a = 卉昭 五,五,以】吼“7( 2 - 1 9 ) 且丑五彳。 使得 三 a = u a 2 v 2 ( 2 - 2 0 ) 其中:t i ( i = 1 ,2 ,p ) 为矩阵朋r 和a r a 的非零特征值,蜂与吩分别为a a r 与 a r a 对应于磊的正交归一特征向量。上述分解称为矩阵彳的奇异值分解( s i n g u l a r v a l u ed e c o m p o s i t i o n ,简称s v d ) ,石为a 的奇异值。容易推导出: 一! u = a v a 2 ( 2 - 2 1 ) 所以利用s v d 定理,矩阵s 的特征向量以( f = l ,) 为: u = 佩】= 【( 一孙( h 一珊l ,。一2 万1 爿矿 ( 2 - 2 2 ) 第二章基于线性特征提取的人脸识别算法 1 3 可以从,中挑选前k ( 尼v ) 个特征向量构成特征脸子空间。 2 训练和识别过程 基于特征脸( e i g e n f c a e ) 的人脸识别分为训练阶段和识别阶段。在训练阶段, 每个训练样本图像变换用以( m l l 维) 向量表示,投影到特征脸子空间u 上,得 到k ( k m xb ) 维向量此: 几= u 7 ( 吒一x - )( 七= 1 ,)( 2 2 3 ) 距离阈值只定义如下: 驴丢m a 。x l l y j 一以i i ( ,k = 1 ,一,忉( 2 - 2 4 ) 在识别阶段,首先把待识别的图像x 映射到特征脸空间,得到向量: y = u 。( x i )( 2 2 5 ) j ,与每个人脸集的距离定义为: - - i l y 一儿1 1 2 = 1 ,)( 2 2 6 ) 为了区分人脸和非人脸,还需要
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 民宿租赁意向金合同范本(含特色服务等)
- 离婚协议中关于共同财产分割及债务清偿补充协议
- 房地产销售代理公司敏感数据保密及保密义务合同
- 生态旅游区物业委托代管与生态保护合作协议
- 工业厂房租赁合同提前终止及设备搬迁协议
- 文创园区商铺租赁合同及文化创意产品推广服务协议
- 离婚协议签署后反悔救济途径与法律援助合同
- 2025年药理学药物不良反应监测与处理试题卷答案及解析
- 2025-2030动力总成电控系统集成化趋势与供应商格局分析报告
- 2025-2030功能性肽类饲料添加剂作用机制与临床效果验证报告
- 2023年广东生物高考第18题光合作用说题课件
- 除锈剂MSDS参考资料
- 6社会体育导论
- 部编版七年级历史与社会下册《第三课中华文明探源》评课稿
- 中考英语作文预测(范文20篇)
- 选煤厂原煤分级筛技术操作规程
- 方物电子教室q2用户手册
- 消防管道支架工程量计算表
- GB/T 700-2006碳素结构钢
- 腹腔镜下肾癌根治术
- 如何学好初中数学-课件
评论
0/150
提交评论