(应用数学专业论文)基于线性鉴别分析的人脸识别研究.pdf_第1页
(应用数学专业论文)基于线性鉴别分析的人脸识别研究.pdf_第2页
(应用数学专业论文)基于线性鉴别分析的人脸识别研究.pdf_第3页
(应用数学专业论文)基于线性鉴别分析的人脸识别研究.pdf_第4页
(应用数学专业论文)基于线性鉴别分析的人脸识别研究.pdf_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于线性鉴别分析的人脸识别研究 摘要 人脸识别是计算机视觉、模式识别以及图像处理研究的重要内容和热门课 题,也是生物特征识别技术中的个非常活跃的课题。人脸识别被认为是本世纪 最具潜力的身份验证方法,它具有不需要用户过多参与、非接触式的数据采集方 式、便于隐藏等诸多优点。随着计算机科学的发展和社会的进步,人脸识别技术 在经济、社会安全、军事等领域有着巨大和潜在的应用价值,因此人脸识别方面 的研究也正在受到越来越多的重视。 本文首先叙述了几种常用的人脸识别方法,线性鉴别分析( l i n e a r d i s c r i m i n a n ta n a l y s i s ,l d a ) 方法是其中的一种。l d a 直接用于人脸识别会遇到 两个问题,一是小样本问题( s m a l ls a m p l es i z e ,s s s ) ,即由于训练样本不足弓 起矩阵奇异;二是优化准则函数并不直接与识别率相关。为了解决这两个问题, 研究者们已经提出了多种基于l d a 的人脸识别方法,本文主要讨论f i s h e r f a c e 、 i c a + l d a 、d l d a 、v d l d a 及v d f l d a 这五种方法,分析了它们的原理和内 在联系,并且对上述几种基于l d a 的方法做了理论上的比较。 关键词:人脸识别、主分量分析,独立成分分析、线性鉴别分析 f a c er e c o g n i t i o nr e s e a r c hb a s e do nl i n e a r d i s c r i m i n a n t a n a l y s i s a b s t r a c t f a c er e c o g n i t i o ni sa l li m p o r t a n tp a r ta n dah o tr e s e a r c ht o p i co f c o m p u t e rv i s i o n , p a t t e r nr e c o g n i t i o na n di m a g ep r o c e s s i n g ,a n di ti sa l s oa na c t i v es u b j e c ti nt h ea r e ao f b i o m e t r i c a lr e c o g n i t i o nt e c h n o l o g y f a c er e c o g n i t i o nn o to n l ya v o i d su s e r sb e i n g i n v o l v e dt o om u c hb u ta l s oc o m b i n e sa d v a n t a g e so fc o n t a c t l e s sd a t aa c q u i s i t i o na n d c o n v e n i e n th i d i n ge t c ,s oi ti sc a l l e dt h em o s tp o t e n t i a lm e t h o do fv e r i f y h a gt h eu s e r i d e n t i f i c a t i o n w i t ht h ed e v e l o p m e n to fc o m p u t e rs c i e n c ea n dt h es o c i e t y , f a c e r e c o g n i t i o nt e c h n o l o g yi so fe n o r m o u sa n dp o t e n t i a lv a l u ei nt h ef i e l do fe c o n o m y , s o c i a ls e c u r i t y , m i l i t a r ya f f a i r se t e ,t h u sr e s u l t i n gi nm o r ea n dm o r ee m p h a s i so v e r t h er e s e a r c h s o m ec o m m o nm e t h o d st or e c o g n i z ef a c e sa r ep r e s e n t e di nt h i sp a p e r ;o n oo f t h e mi sl i n e a rd i s c r i m i n a n ta n a l y s i s ( l d a ) l d aw i l lm e e tt w op r o b l e m sw h e n a p p l y i n gt of a c er e c o g n i t i o nd i r e c t l y , o n ei st h es m a l ls a m p l es i z e ( s s s ) p r o b l e ma n d t h eo t h e ri st h a tt h e i ro p t i m i z a t i o nc r i t e r i aa r en o td i r e c t l yr e l a t e dt ot h ec l a s s i f i c a t i o n a c c u r a c y i no r d e rt oo v e r c o r f l e t h ea b o v es h o r t c o m i n g s , m a n yn e wl d a - b a s e d t e c h n i q u e sw e r ep r o p o s e d i nt h i sp a p e r , f i v em e t h o d sw i l lb ed i s c u s s e d , s u c ha s f i s h e r f a c e ,i c a + l d a , d l d a , v d l d aa n dv d f l d a t h i sp a p e ra l s oa n a l y s i s p r i n c i p l e s ,r e l a t i o n sa n dc o m p a r et h e o r yo ns e v e r a lf a c er e c o g n i t i o ns y s t e m su s i n g l d a - b a s e d a l g o r i t h m k e yw o r d s :f a c er e c o g n i t i o n , p c a , i c a ,l d a n 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立 进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不 包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究 作出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意 识到本声明的法律结果由本人承担。 学位论文作者签名: 日期:7 印年 f 学位论文使用授权声明 嘉杉 ,月f日 本人完全了解中山大学有关保留、使用学位论文的规定,即:学校有权保留 学位论文并向国家主管部门或其指定机构送交论文的电子版和纸质版,有权将学 位论文用于非赢利目的的少量复制并允许论文进入学校图书馆、院系资料室被查 阅,有权将学位论文的内容编入有关数据库进行检索,可以采用复印、缩印或其 他方法保存学位论文。保密的学位论文在解密后使用本规定。 学位论文作者签名:君荔 日期:加刀年胡f 曰 j 导师签名: 蚓2 l 醐:矿堋 第1 章绪论 1 1 人脸识别研究概论 每个人的面部都是由额头、眉毛、眼睛、鼻子、嘴巴、脸颊等几个部分组 合而成,它们之间的大体位置关系是固定的。可是,它们却可以形成很复杂的模 式,即便是长相非常相似的双胞胎,家人也能够根据他们面部的细微差异很容易 地将他们区分开来,也就是说这个世界上找不出两张完全相同的人脸! 那么,区 分众多不同人脸的“特征”到底是什么? 能否设计出与人类具有一样的人脸识别 能力的自动机器? 对这些问题的分析和解答正是从事人脸识别研究人员所面临 的挑战。 事实证明,解答这些问题并不容易,很多来自模式识别、计算机视觉、神 经计算、生理学等领域的研究人员对自动人脸识别工作几十年之后,仍然被这些 最基本的科学问题所困扰。即便是专门从事相关的生理学、心理学、神经科学研 究的专家,也很难描述清楚人类轻而易举进行人脸识别的生理学过程。我们也许 只能通过建立人脸识别的计算模型,并通过构建实用的自动人脸识别系统来验证 这些计算模型,从而找出对上述基本科学问题的解答【1 】。 1 1 1 人脸识别研究的历史和现状 人脸识别技术是一种非接触式的身份识别技术,因为它有直接、非侵犯性等 优点,因此在安全监视、人机智能交互以及精确控制等领域有着广泛的应用前景。 人脸识别还是一项非常具有挑战性的课题,它涉及到图像处理、模式识别、人工 智能以及计算机视觉等多个领域,涉及的范围比较广阔。因此,人脸识别技术研 究已经成为当今诸多研究领域中的热点。 人脸识别研究,起源于1 9 世纪末法国人s i rf r a n i sg a l t o n 的工作,到2 0 世 纪9 0 年代,开始作为一个独立学科快速发展起来。人脸识别研究的发展按照其 自动化的程度可以分成三个阶段【2 】【3 】: 第一个阶段是机械式的识别阶段。以b e r t i l l o n , a l l e n 和p a r k e 为代表,主要 研究人脸识别所需要的面部特征,b e r t i l l o n 用一个简单语句与库中某张脸相联 系,并与指纹分析相结合,提供了一个较强的识别系统;为了提高识别率,a l l e n 4 为待识别人脸设计了一种有效和逼真的摹写;p a r k e 5 用计算机实现了这一想法, 并产生了较高质量的人脸灰度图模型,这阶段的工作特点是识别过程全部依赖于 操作人员,显然不是能够完成自动识别的系统。 第二个阶段是人机交互式识别阶段。代表工作有:h a r m o n 和l e s k 用几何 特征参数来表示人脸正面图像【6 】,将人脸面都特征用2 l 维特征向量表示出来, 并且设计了基于这一特征表示法的识别系统;而k a y a 和k o b a y a s h i 则采用了统 计识别的方法,用欧氏距离来表示人脸特征。这个阶段需要利用操作员的某些先 验知识,仍然摆脱不了人的干预。 第三个阶段是真正的机器自动识别阶段,近十余年来,随着高速度高性能 计算机的发展,人脸模式识别方法有了较大的突破。研究者提出了多种机器全自 动识别系统,人脸识别技术进入了实用化阶段,比如e y e m a t i c 公司研发的人脸 识别系统,我国清华大学的“十五”攻关项目人脸识别系统也通过了由公安 部主持的专家鉴定。 目前,人脸识别研究非常热门,国外以美欧为主,比较著名的研究机构有: m i t ,m i c h i g a ns t a ru n i v e r s i t y ,u c l a ,u n i v e r s i t yo f m a n c h e s t e r ,u m d ,u s c , u n i v e r s i t yo f s u r r e y 。国内研究此项工作的大学有:清华大学、中科院自动化研 究所、中山大学、吉林大学、哈尔滨工业大学、南京理工大学、南京大学、上海 交大、浙江大学、北京交通大学。m p e g 7 标准组织已经建立了人脸识别草案 小组,人脸检测算法也是一项征集内容。 1 1 2 人脸识别研究的问题描述 所谓人脸识别,就是对输入的人脸图像或者视频,判断其中是否存在人脸, 如果存在人脸,则进一步给出每张人脸的位置、大小和各个主要面部器官的位置 2 信息,并且依据这些信息,进一步提取每张人脸中所蕴含的身份特征,并将这些 特征与已知人脸库中的人脸进行对比,从而识别每张人脸的身份。 人脸识别研究包括以下几个方面的内容: l 、人脸检测 人脸检测就是对给定的场景进行检测,判断是否有人脸存在,如果存在则确 定其位置。此项操作受光照强弱及方向、噪声、面部倾斜的方向和角度,以及各 种遮挡的影响比较大。 2 、人脸归一化 人脸归一化就是校j 下人脸在尺度,光照和旋转等方面的变化,一般是指几何 归一化和灰度归一化。几何归一化是指将图像中的人脸变换到同一大小和位置; 灰度归一化是指对图像进行光照补偿等处理,以克服光照变化的影响,提高识别 率。 3 、特征提取 特征提取就是对检测出的人脸和数据库中的已知人脸用某种表示方法表达 出来也就是表征,这种表征能够最优的表示出人脸稳定而且唯一的特征。常用的 表示方法有几何特征( 比如欧氏距离) 、代数特征( 比如矩阵特征向量) 、固定特 征模板以及特征脸等。 4 、人脸识别 人脸识别就是将待识别的人脸与人脸数据库中所有人脸模板进行比较,寻找 最相似的人脸,从而判别待识别人脸的身份。 人脸特征提取和人脸识别常常统称为人脸识别,是人脸识别系统中非常重要 而又相对独立的一部分。 1 1 3 人脸识别研究方法分类 早期的人脸识别研究主要有两大方向【2 】【9 】: 一是基于人脸几何特征的方法,这种方法的思想是首先检测跟、鼻、嘴等 脸部主要部件的位簧和大小,然后利用这些部件的总体几何分布关系以及相互之 问的参数比例来识别人脸,忽略了局部细微特征,更适合于粗分类。主要代表是 m i t 的b r u n e l l i 和p o g g i o 小组; 二是基于模板匹配的方法【9 】,主要是利用计算机模板和图像灰度的自相关 性来实现识别功能,主要代表是h a r v a r d 和s m i t hk e t t l e w e u 眼睛研究中心的 y u i l l e 。 b e r t o 在1 9 9 3 年对这两类方法作了较全面的比较后认为:模板匹配的方法 优于几何特征的方法。 目前的研究也主要有两个方向: 一是基于特征分析的研究方法,就是将人脸基准点的相对比率和其它描述 人脸脸部特征的形状参数或类别参数等一起构成识别特征向量。 二是基于整体的研究方法,它考虑了模式的整体属性,包括特征脸方法 ( e i g e n f a c e ) 以及改进的f i s h e r f a c e 方法等;弹性图匹配的方法;隐马尔可夫模 型方法;神经网络方法等。近年来研究的趋势是将人脸的整体识别和特征分析结 合起来。 1 1 4 人脸识别的优点及应用前景 生物特征识别方法主要有指纹识别、人脸识别、虹膜识别、掌纹识别、视 网膜识别、红外温谱识别、笔迹识别、步态识别、声纹识别等。 人脸识别与其他识别方法比较,优点很多。人脸识别可以隐蔽操作,因此 特别适用于安全问题、犯罪监控与网上抓逃,这是其他人识别技术所无法替代的; 人脸识别采用的是非接触式采集,没有侵犯性,让人比较容易接受:人脸识别具 有方便、快捷、强大的事后追踪能力( 普通人并不具备指纹、虹膜、视网膜判别 能力) ;人脸识别更符合人们的识别习惯,可交互性强,般人就可以进行评判; 另外所需设备成本较低,只要有摄像头就可以了。 人脸识别研究是一项极富挑战性而且非常实用的研究课题,它的应用前景非 常广泛。比如应用于对敏感人物的智能监控、代表身份确认、犯罪抓逃与比对、 门禁、出入境管理等国家公共安全方面;应用于电子商务、电子政务、社会保险、 信息系统、金融领域持卡人身份验证、智能考勤系统等信息安全方面:应用于真 实感游戏、虚拟社区、智能玩具、家政服务机器人等家庭娱乐方面。 4 1 1 5 人脸识别面临的挑战 计算机识别人脸,与人类对人脸的识别能力相比,要困难得多,它所面临的 主要挑战有: 鲁棒性、准确的特征配准问题; 对各种图像采集条件变化鲁棒的核心识别算法,识别算法的泛化能力和自适 应学习问题: 光照变化问题; 姿态不变的人脸识别算法,人脸信息采集设备带来的问题; 年龄增长与老照片的问题; 图像存贮质量问题: 墨镜、帽子等造成的遮挡问题; 化妆、整容带来的问题; 意外损伤问题等。 上述挑战并不是单独存在的,例如姿态和光照问题同时出现,因而更进一步 地增加了问题的难度。 1 1 6 人脸识别的研究趋势 人脸识别实用化的主要障碍来自于非理想条件下识别性能的快速下降,产生 的原因既有信号层面上数据获取的稳定性问题,也有识别所采用的人脸描述特征 对采集条件变化的鲁棒性问题,还与核心识别算法的泛化能力密切相关。 要解决这些问题,就需要从信号、特征和符号等不同层面深入探讨【1 1 ,从 上面的分析可知,人脸识别的研究趋势主要在以下几个方面: 进一步研究特征提取算法和识别算法,提高识别精度; 提高识别速度,研究对海量人像数据的分布式检索比对方法; 提高系统的适用性,降低对应用环境的严格的条件限制: 采用嵌入式硬件和软件平台,研究小型化便携的应用产品,支持标准通用的 接口,便于联网; 开展动态人脸识别等。 1 2 经典l d a 方法介绍及其缺点 l d a ( l m c md i s c r i m i n a ma n a l y s i s ) 方法d 6 1 d 7 i 也称为线性鉴别分析方法, 就是找出一个最优变换轴w ,使得数据投影到w 后同种类别的样本聚集在一起, 不同类别的样本尽量分开,即选择使得样本类间离散度和样本类内离散度的比值 最大的特征( f i s h e r 准则) 。 考虑一个训练样本集有c 个类,分别为位i ,2 ,c ,x = ( x l ,工2 ,x ) 是 n 个训练样本集,x 中的每一个而属于类,即:而,其中 i = l 2 ,n ,j = 1 , 2 ,c 。则: 定义样本的类内离散度矩阵为: 蜀可以定义为: f 昂= 办墨 ( 1 1 ) 拉l 蜀= ( x - j ) ( x - p j ) 7 ( f = l ,2 , - - - , c ) ( 1 2 ) j e 。 其中,是吼类先验概率,换句话说,见* i n ,一“= l 2 ,c ) 是n 个 总样本中属于q 类的样本数;i l ,是,类的均值,即: 舻詈丕工 ( 1 3 ) 定义样本的类阃离散度矩阵为: f 以= 见“- p x p ,一p ) 7 ( 1 4 ) ,i l 其中,p ,是,类先验概率,p i 是,类的均值,见上述公式( 1 - 3 ) , 6 i i 是所有样本的均值,即i i = 专j 。 如果s ,是非奇异矩阵,在投影以后,各类样本之问尽可能的分开一些,即类问 离散度越大越好,同时各类样本的内部尽量的密集起来,即类内离散度越小越好。 因此可以定义f i s h e r 准则函数如下: ,( ) = a r g 嗍氅粤 ( 1 _ 5 ) 以 峄砖耐 “。 下面就是要求出,阡,耐) 取最大值时对应的特征向量。通过数学变换可以得 出,玎。就是满足如下等式的解: & 彬= 九f s 彬( j = 1 , 2 ,c ) ( 1 - - 6 ) 如果s 。非奇异,就是求s 了& 的特征值问题。其中该矩阵最多只有c 一1 非零 特征值,c 是类别数目。 l d a 在模式识别领域应用广泛,如语音识别、人脸识别及多媒体信息检索 等。在应用l d a 处理高维多类模式比如人脸图像时,样本的维数很高且训练样 本很少,这就是所谓的小样本问题:l d a 算法的另一个缺陷是,在多类情况下, f i s h e r 准则与分类率不直接相关,该准则过分强调了那些与其他类具有较大类间 距离的类别( 边缘类) ,从而使得最后的投影方向偏向这些边缘类,造成了那些 具有较小类间距离类别的较大重叠。 1 3 本论文的内容安排 论文在开始部分对人脸识别研究作了概述,具体阐述了人脸识别研究的发 展历史、现状以及研究趋势,介绍了人脸识别的研究范围、研究方法、人脸识别 方法的优点以及人脸识别研究所面临的挑战,论文在第一章还详细讲述了经典线 性鉴别方法的基本思想,接着在第二章介绍了几种常用的人脸识别方法,包括 e i g e n f a c e 、f i s h e r f a c e 、弹性图匹配的方法、隐马尔可夫模型以及神经网络的方 法。 论文的重点是对基于线性鉴另| j 分析( l d a ) 方法的人脸识别方法研究,线性 鉴别分析( l d a ) 方法是一种较为普遍的用于特征提取的线性分类方法,但是将 线性鉴别分析( l d a ) 方法直接用于人脸识别就会遇到前面提到过的两个问题, 一是小样本问题,即训练样本不足引起矩阵奇异;二是优化准则函数并不直接与 识别率相关。为了解决这两个问题,研究人员提出了多种解决方案,本文将在第 三章就下列方法做理论上的分析与比较,这些方法包括f i s h 盯矗l c e 、i c a + l d a 、 d l d a 、v d l d a 及v d f l d a 。 本文的最后提及了基于线性鉴别分析( l d a ) 方法的其它识别方法,并且回 顾了近几十年人脸识别技术研究的现状,对人脸识别技术研究的发展趋势提出了 思考与展望。 3 第2 章常用的人脸识别方法 2 1特征脸方法和f is h e r f a c e 方法 2 1 1特征脸方法 主成分分析方法( a r i n c i l m lc o m p o n e n ta n a l y s i s ,p c a ) 1 2 1 3 1 4 ,是一种经 典的特征提取及数据表示方法,被广泛用于模式识别和计算机视觉领域。它于 1 9 0 1 年i t p e a r s o n 2 8 提出,1 9 3 5 年h o t e l l i n g 2 9 给出了实际的计算方法。 p c a 方法基于k - l 变换( k a r h u n e n - l o e v et r a n s f e r ) ,k - l 变换的思想是利用 样本的协方差矩阵找样本离散程度最大的投影方向,通过k l 变换,可以消除原 有向量各个分量之日j 的相关性,从而有可能去掉那些带有少量信息的分量以达到 降低特征空闯维数的目的。 p c a 蔓j 法最早f h s i r o v i c h 和k 曲y 【2 7 】【3 0 】引入到人脸识别领域。将p c a 方法 用于人脸识别,目的是对人脸图像空问进行降维处理,同时描述不同人脸图像之 问的变化,这方面的研究工作以t u r k 和p e n t l a n d 1 5 1 9 9 1 年提出的e i g e n f a c e ( 特征 脸) 最具代表性。特征脸法是将整个人脸的图像区域看作一随机向量,用k - l 获 取其正交k - l 基底,对应其中的较大特征值的基底具有与人脸相似的形状,因此 又称之为特征脸法( e i g e n f a c e ) 。特征脸法简单、快速、实用,目前仍然被广泛 地运用于人脸识别领域。 2 1 2f i s h e r f a c e 方法 特征脸法虽然可以有效地表示人脸信息,但是并不能有效鉴别和区分人脸, 为了解决这一问题,研究者们对特征脸做了改进,在p c a 方法的基础上运用绪论 部分提及的线性鉴别分析( l i n e a rd i s c r i m i n a t ea n a l y s i s ,l d a ) 方法,其目的是从 9 高维特征空间里提取出最具有判别能力的低维特征,这些特征能帮助将同一个类 别的所有样本聚集在一起,不同类别的样本尽量地分开。 i - a 击_ p c a + l d a 的人脸识别方法又被称为f i s h e r f a c e 1 6 ,这种方法利用了类 别归属信息,选择类内散布正交的矢量作为特征脸空问,从而压制了图像之间与 识别信息无关的差异,强调了不同人脸之问的差别,同时弱化了同一人脸由于光 照、视角和表情而引起的变化,取得了比特征脸法更好的识别效果。 本文将在第3 章具体介绍特征脸算法的基本思想、f i s h e r f a c e 方法的人脸识别 过程和其它几种基于线性鉴别的人脸识别方法。 2 2 弹性图匹配的方法 l a d e s 等人提出的弹性图【8 】匹配法是动态链接结构( d y n a m i cl i n k a r c h i t e c t u r e ,d l a ) 在人脸识别领域的直接应用,这种方法采用网格作为模板, 将图像之间的比较变为网格之间的比较。 使用弹性图匹配法进行人脸识别,就是在二维空问中为人脸建立属性拓扑 图,把拓扑图放置在入脸上,每一节点包含一特征向量。它记录了人脸在该项点 附近的分布信息,节点问的拓扑连接关系用几何距离来标记,从而构成基于二维 拓扑图的人脸描述,再使用弹性图形匹配技术,将图像库中人脸和待识别人脸的 弹性图进行匹配,找出最相似的入脸图像。 弹性图匹配方法对光照、位移、旋转以及尺度变化都不敏感,识别性能优 于特征脸法,但是,这种方法对每张储存的人脸图像都要计算其模型图,因此计 算量和存贮量都比较大,识嬲的速度慢。 2 3 隐马尔可夫模型的方法 隐马尔可夫模型( h i d d e nm a r k o vm o d e l s , h m m ) ,起源于二十世纪六十年 代后期,是用于描述信号统计特性的一组统计模型,能够很好的处理随机时序数 据的识别与检测。 隐马尔可夫模型最初用于语音识别,并取得了很好的效果,采用它进行人 1 0 脸识别主要是剑桥大学的s a m a r i a 和f a l l s i d e 7 。隐马尔可夫模型是在马尔可夫 链的基础上发展起来的,h m m 是一个双重随机过程,其一是马尔可夫链,它是 最基本的随机过程,描述状态的转移。另一个随机过程描述状态和观察值之问的 统计对应关系。由于h m m 是一个统计模型,对于同一特征序列,可能会对应于 许多状态序列,特征序列与状态序列之间的对应关系是非确定的,故称为隐马尔 可夫模型。 隐马尔可夫模型是建立在统计模型基础上,不需要进行复杂的人脸图像特 征提取,其优点是对姿态和环境的变化有较好的鲁棒性,识别率高,缺点是实现 的复杂度较高。 2 4 神经网络方法 基于神经网络的人脸识别方法是近几年比较活跃的一个研究方向。人工神 经网络( a r t i f i c i a l n e u r a l n e t w o r k ,a n n ) 是指模拟人脑神经系统的结构和功能, 运用大量的处理部件,由人工方式构成的网络系统。 1 9 4 3 年,心理学家m c c u l l o c h 和数学家p i t t s 发表了关于神经网络的第一个 数学模型,即m p 模型,并用于模式识别的研究,接着d o h e b b 提出了h e b b 学习规则,从此开创了神经网络研究的时代,其后er o s e n b l a t t 、w i d r o w 和h o p f j j h o p f i e i d 等学者又先后提出了感知模型,使得人工神经网络技术得以蓬勃发 展。 人工神经网( a n n ) 方法是把模式的统计特性隐含在a n n 的结构和参数之 中。该类方法将人脸用灰度图表征,利用神经网络的学习和分类能力进行识别。 神经网络方法在人脸识别上比其他类别的方法有独到的优势,它避免了复杂的特 征提取工作,可以通过学习的过程获得其他方法难以实现的关于人脸识别的规律 和规则的隐性表达。但由于原始灰度图像数据量非常庞大,因此神经元数目通常 很多,训练时间很长速度慢。 第3 章基于l d a 的人脸识别方法研究 人脸识别方法大致可以分为两类:基于统计的方法和基于几何的方法。人脸 识别的核心是人脸特征提取,线性鉴别分析( l d a ) 是特征提取中最常用的方法 之一。线性鉴别分析法是基于f i s h e r 准则,以样本的可分性为目标寻找一组线性 变换,使样本的类内离散度最小同时类问离散度最大,线性鉴别分析法又称为 f i s h e r 线性鉴别( f l d ) 。但是,前面我们已经提及,l d a 的方法直接应用予人 脸识别时主要存在两个问题,一是所谓的小样本问题;二是在多类情况下传统的 f i s h e r 准则非最优。针对这两个问题,研究者们提出了很多解决方法,本章主要 讨论了f i s h e r f a c e 、d l d a 、v d l d a 和v d f l d a 方法。 3 1f i s h e r f a c e 方法 s w o t s 和w e n g 提出了p c a + l d a 的两步策略,先用特征脸获取最佳描述特 征,然后用l d a 获取最佳分类特征。特征脸和l d a 相结合的人脸识别方法也 就是f i s h e r f a c e 识别效果较好,能够适应表情、光照的变换。 3 1 1p c a 方法 主成分分析( p r i m i p a lc o m t x m e n t a n a l y s i s ,p c a ) 1 2 1 1 3 1 4 1 5 脸,就是将包含人脸的图像区域看作是一种随机向量,因此可以用k - l 变换获取 其正交k - l 基底,对应其中较大的特征值的基底具有与人脸相似的形状。 下面我们简单介绍一下k - l 变换【3 1 】【3 2 】: 设x 为詹维随机变量,x 可以表示成矗个基向量的加权和形式: x = 1 r ,屯 ( 3 一1 ) 其中,7 ,是加权系数,。是基向量。 上面的公式也可以表示成矩阵的形式 x = ( 。,:,) ( 1 r 。,1 ,2 ,丫) 7 = 申r 其中, = ( 巾,2 ,巾) ,1 r = ( 1 r 。,7 :,1 r ) 7 。 我们取基向量为正交向量,那么就是正交矩阵,即 巾7 巾= i 在公式( 3 - - 2 ) 的两边同时左乘由7 ,得 1 r = 7 x t i p t j = 牵f 7 x 设随机向量的总体自相关矩阵为: r = e i x x 7 1 将公式( 3 - - 2 ) x = 打代入上述公式,得 且= e i 抑7 巾7 l = 怛i 7 忡7 我们要求向量y 的各个分量互不相关,那就要满足下列关系 帅小譬。篙 其矩阵形式为: 九l 0 o 此时,r = 4 , a 4 , 7 将上式两边右乘,得 r 4 , = ”耷74 i = c a = a ( 3 2 ) ( 3 3 ) ( 3 4 ) ( 3 5 ) ( 3 6 ) ( 3 7 ) ( 3 8 ) ( 3 9 ) ( 3 1 0 ) 即: 肼,= 九, 将k - l 变换用于人脸识别,也就是特征脸,其算法思想如下: 假设参加训练的人脸图像一共有n 张,每张图像的维数为mx 材,那么每 张人脸可以分别表示为算l 勋、粕、工w ; 平均脸可以表示为: = 景豁 c s 州, 每张人脸与平均人脸之差可以表不为: ,= x f - - x e eo = 1 , 2 ,j 7 、r ) ( 3 - - 1 2 ) 设矩阵么= h 。,:,】,则协方差矩阵为: c = 专喜。,= 州7 c s 邗, 特征脸要做的就是找出矩阵a a 7 的前置个较大特征值的特征向量,但a a 7 是一个m 2 m 2 维的大矩阵,求这个矩阵的特征值计算量是非常大的。因此,根据 线性代数理论,我们可以先求出a 7 4 特征值九与特征向量脚,然后求出口, 一2 万a u i u = - 加,聊( 3 - - 1 4 ) 上式中,u j 表示a a 7 的特征向量,口j 表示爿7 a 的特征向量,九j 是爿a 的特 征值,约就是所指的特征脸。求出特征脸以后,剩下的工作就是要对库中的人脸 进行降维,由h 可以组成一个投影矩阵,表示为矽= k 。,口:,l l i 】,并进行降 维: 吼= w 7 “ f = 1 ,2 ,) ( 3 - - 1 5 ) 由上式得出所有人脸向量的降维向量。 1 4 3 1 2i d a 方法 l d a 方法用于人脸识别时,它选择与类内散布的正交的矢量作为特征脸空 间,从而能够压制图像之间的与识别信息无关的差异,对光照及人脸表情变化都 不太敏感。其目的是从高维特征空问中提取出最具有鉴别能力的低维特征,希望 能在低维空间里不罚类别的样本尽可能的分开,每个类别内部样本尽量密集,也 就是希望能找到些特征使得类间离散度和类内离散度的比值最大。 l d a 在人脸识别过程中的应用: 一是求解类问离散度矩阵s 。和类内离散度矩阵s ,: 对于第i 类有: s ,= o 一”,n i l ,) 7 ( 3 1 6 ) 则( 3 1 7 ) s 口= 磊( p j p x p j p ) 7 ( 3 1 8 ) j 。l 二是计算广义特征值和对应特征向量: s 。形= 九f s 形 ( 3 1 9 ) 三是选取特征向量: 根据特征值由大到小的顺序排列特征向量,只保留骑c 1 个特征向量,这 就是f i s h e r 基向量。 四是投影和分类: 把旋转过的原始图像投影到f i s h e r 基向量,然后进行分类工作。 3 1 3p c a + l d a 人脸识别过程 人脸识别过程主要是训练阶段和识别阶段。首先将原始图像归一化到一个标 准的尺寸,得到一个训练样本集,共有c 个类,每个图像设为x 。u = 1 , 2 ,n ) , s 。m j j s 即一共有张训练样本。 训练阶段具体步骤如下: ( 1 ) 将归一化了图像用向量x ,( j = 1 , 2 ,) 来表示,通过公式( 3 - - 1 1 ) 即: x 。= 专畸,得到平均脸工。,用向量_ ( j = l 2 ,) 减去平均脸,即运用 tf l 公式( 3 - - 1 2 ) ,得到每一幅人脸与平均脸的差值。 ( 2 ) 通过公式( 3 1 3 ) ,这些差值构成一个协方差矩阵,然后求出此矩阵的 前置个最大特征向量,再把这些向量组织起来构成一个p c a 投影矩阵,设为 ; ( 3 ) 用这个投影矩阵把将所有的训练样本投影到一个置维的子空间,如上 面公式( 3 1 5 ) 所述。 ( 4 ) 将前面所得出的最佳描述特征玑( j = l 2 ,) 分别构成类内散布矩阵 和类间散布矩阵,计算矩阵s ,1 s b 的前f 个最大特征值的特征向量,由这些向量 构成一个l d a 投影矩阵,设为阡么; ( 5 ) 将( 3 ) 中得出的矩阵把所有样本投影到一个t 维子空间,得出最佳分 类特征q 。( j = 1 2 ,) ,并根据这些特征组成一个c 类特征人脸识别数据库; ( 6 ) 计算人脸类闻的最大距离 p = 鼍:x h ,一t l 川 ( f ,_ ,= l 2 ,c ) ( 3 2 0 ) 识别阶段的步骤如下: 一 ( 1 ) 把待识别的人脸图像减去平均脸,得到一个差值向量,可以设为,; ( 2 ) 把这个差值作两次投影变换,得出最佳分类特征 v lf f i 降么7 7 , ( 3 2 1 ) ( 3 ) 用待识别人脸与人脸库中的每类人脸进行比较,得出最小的欧几里德 距离 4 - = 皿归i h t l ,i ( i = l ,2 ,o ( 3 2 2 ) ( 4 ) 为了区分待识别的图像是否为人脸图像,需要计算待识别的人脸的图 1 6 像与重建人脸图像的距离 口:= l k 一( 降k 醪么q + x 。) l i ( 3 2 3 ) 其中x 。为平均脸。 ( 5 ) 根据分类规则,首先需要判别是否为人脸,如果是人脸,需要判别是 否是库中的人脸,如果是库中的人脸,则要判别是库中的哪类人脸。 3 1 4实验 本文在m a t l a b 7 0 下面实现了上述算法,选用的人脸库是o r l ,其中有4 0 人,每人有1 0 幅不同的人脸图像。本文选取了每人9 幅作为训练( 1 幅作为测 试) ,图像大小为1 1 2 x 9 2 。 下图是部分人脸库实例。 图3 1 4o r l 人脸库部分实例 本文实现了f i s h e r f a c e 算法,编程如下: p r e - t o t a ld a t a m f u n c t i o ny2 p r ct o t a l d a t a ( i n p u t n a t m ) ; 1 f u n c t i o nd e s c r i p t i o n t h ep r o g r a mp r o c e s sas e r i e so f i m a g ec o n t i n u a l l y , s a v et h er e s u l t s a tt h es a l e l 4 0t i m e 2 p a r a m e t e r s i n p u t n a m e - - t h en a m eo f f i l es a v i n gas e r i e so f i m a g ef i l en a m e s o d i r n a m e t h ed i r e c t o r yl l a r l l eo f t h er e s u l ts a v e d i f n a r g i n l i n p u t n a m e = l i s t t x t ; e n d i f i l e n a m e = s p r i n t f ( o o s ,i n p u t n a m e ) ; f d l = f o p e n ( i f i l e n a m e ,”; n n n = o ; w h i l e f e o f ( r i d n & r a m g e s t u r e n u mi im + n g e s t u r e n u m 1 9 e r r o r ( s p r i n t f ( 1 l l e g a lv a l u ef o rp a r a m e t e o ) ; e n d l o a d ( q i :y y x f i s h e r f a c e

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论