




已阅读5页,还剩54页未读, 继续免费阅读
(应用数学专业论文)人脸识别的贝叶斯统计方法(1).pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
at h e s i si na p p l i e dm a t h e m a t i c s f a c e r e c o g n i t i o nb a s e d o nb a y e s i a ns t a t i s t i c a l m e t h o d s b y x ul i h u a s u p e r v i s o r :p r o f e s s o rz h a n gx i a n g d e n o r t h e a s t e r nu n i v e r s i t y j u l y2 0 0 8 , ,i 1 、琴 席, 本人声明,所呈交的学位论文是在导师的指导下完成的。论文中取得 的研究成果除加以标注和致谢的地方外,不包含其他人己经发表或撰写过 l 的研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同工 作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢 :匕 恧。 学位做作者答名“于而午 日 期:w 9 、7 学位论文版权使用授权书 本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论 文的规定:即学校有权保留并向国家有关部门或机构送交论文的复印件和 磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学位论文的全部 或部分内容编入有关数据库进行检索、交流。 作者和导师同意网上交流的时间为作者获得学位后: 半年口一年口一年半口两年0 学位论文作者签名:;彳而午 签字日期:泗9 7 6 导师签名:张钾够 签字日期:v “- ) 。占 东北大学硕士学位论文 摘要 人脸识别的贝叶斯统计方法 摘要 人脸识别问题是应用数学、模式识别领域的研究热点之一。在公安、司法监控等相 关领域具有较大的应用前景。自动人脸识别系统包含人脸检测、特征提取、识别三个部 分,本文讨论的是不含人脸检测的半自动人脸识别系统。 主成分分析法是人脸识别中最常用的方法。本文首先详细介绍了基于k - l 变换的主 成分分析识别理论,还讨论了识别中的距离度量准则问题,选出适合本文识别的最佳准 则。由于主成分分析法一直面临着高计算量问题,本文给出了识别性能更优越的二维主 成分分析方法原理,实验证明该方法不仅在识别时间上大大优于传统主成分分析法,而 且在识别率上也有明显的提高。 贝叶斯方法是模式识别中的最优方法之一。本文在主成分分析法基础上重点讨论了 贝叶斯人脸识别算法以及模型分布问题。在算法的推导中,我们将最大似然准则与最大 后验准则作了比较并对冗繁的计算进行了改进,实验结果表明改进后的最大似然算法更 有利于提高人脸识别的运算效率,而且识别率也比主成分分析方法有一定的提高。 人脸识别一般是选择传统的高斯模型( 包括单高斯和混合高斯模型) 来估计概率密 度,本文详细介绍了高斯模型的基本原理,与此同时还给出了概率推理模型进行概率密 度估计,通过实验得出这两种模型在识别性能上各有优势。 p 、 关键词:人脸识别;贝叶斯方法;主成分分析法;二维主成分分析法;概率推理模型 - i i t f j 鼙 东北大学硕士学位论文a b s t r a c t f a c er e c o g n i t i o nb a s e do nb a y e s i a ns t a t i s t i c a lm e t h o d s a bs t r a c t f a c er e c o g n i t i o nt e c h n o l o g yi sd e v e l o p e da 8a l la c t i v er e s e a r c hi nt h ef i e l do fa p p l i e d m a t h e m a t i c sa n dp a r e r nr e c o g n i t i o n i t sb r o a d l ya p p l i e d , s u c ha si ns e c u r i t yc h e c k , l a w s u r v e i l l a n c e , a n ds oo n af u l l ya u t o m a t i cf a c er e c o g n i t i o ns y s t e mc o n t a i n sf a c ed e t e c t i o n , f e a t u r ee x t r a c t i o na n dr e c o g n i t i o n t h i sp a p e rd i s c u s s e sap a r t l ya u t o m a t i cf a c er e c o g n i t i o n s y s t e mw h i c hn o tc o n t a i n sf a c ed e t e c t i o n p r i n c i p l ec o m p o n e n ta n a l y s i si sc o m m o n l yu s e di nf a c er e c o g n i t i o n f i r s t , w eg i v ea f u l l yt h e o r yd e d u c t i o no fp r i n c i p l ec o m p o n e n ta n a l y s i s ,b a s e do nt h ek lt r a n s f o r m a t i o n t h e n w ep r o v i d eac o m p a r i s o ni nt h ef o u rm e t h o d so fd i s t a n c e - m e a s u r e m e n t ;a l s or e c o m m e n da n a p p r o p r i a t em e t h o di nt h i sp a p e r s e c o n d ,b e c a u s eo ft h eh i g h - d i m e n s i o n a l - c o m p l e x i t y c a l c u l a t i o no ft h ep r i n c i p l ec o m p o n e n ta n a l y s i st h e o r y , an e wt e c h n i q u em e t h o dc a l l e d t w o - d i m e n s i o n a lp r i n c i p a lc o m p o n e n ta n a l y s i si sd e m o n s t r a t e dt ob em o r es u p e r i o r i nt h i s p a p e r , w ep r o v et h a tt w o - d i m e n s i o n a lp r i n c i p a lc o m p o n e n ta n a l y s i si sn o to n l yo b v i o u s l y t i m e - e f f i c i e n tb u ta l s oh i g h l yr e c o g n i t i o nr a t e b a y e s i a nr u l ei sab e s tm e t h o di np a t t e r nr e c o g n i t i o n w em a i n l yf o c u so nt h eb a y e s i a n a l g o r i t h ma n dt h ed i s t r i b u t i o no ft h em o d e l ,b a s e do nt h ep r i n c i p a lc o m p o n e n ta n a l y s i st h e o r y i nt h ec h o i c eo fa l g o r i t h m s ,m a x i m u ml i k e l i h o o dr u l ei sc o m p a r e d 、丽t ht h em a x i m u ma p o s t e r i o r ir u l e t h e nw ei m p r o v et h em a x i m u ml i k e l i h o o dr u l ei nt h ec o m p l e xc a l c u l a t i o n i t i s p r o v e dt h a tt h ei m p r o v e dm a x i m u ml i k e l i h o o da l g o r i t h mi ss u p e r i o ro no p e r a t i o n a lr a t e t h a nt y p i c a lp r i n c i p l ec o m p o n e n ta n a l y s i sm e t h o d ,a sw e l la st h er e c o g n i t i o nr a t e w eg e n e r a l l yc h o o s et h e t y p i c a lg a u s s i a nm o d e l ,w h i c hi n c l u d e ss i n g l e - g a u s s i a n d i s t r i b u t i o nm o d e la n dm i x e d - g a u s s i a nd i s t r i b u t i o nm o d e l ,f o rt h ep r o b a b i l i t ys i m i l a r i t y e s t i m a t i o ni nf a c er e c o g n i t i o n c o n s e q u e n t l y , w eg i v eaf u l l ye x p l a n a t i o na b o u tt h eb a s i c t e n e t so ft h eg a u s s i a nm o d a l m e a n w h i l et h ep r o b a b i l i s t i e - - r e a s o n i n g - m o d e li si n t r o d u c e da n d p r o v e dt ob eg o o di nf a c er e c o g n i t i o n k e yw o r d s :f a c er e c o g n i t i o n ;b a y e s i a ns t a t i s t i c a lm e t h o d s ;p r i n d p l ec o m p o n e n ta n a l y s i s ; t w o - d i m e n s i o n a lp r i n c i p a lc o m p o n e n t a n a l y s i s ;p r o b a b i l i s t i cr e a s o n i n gm o d e l i r j 爻 目录 目录 独创性声明 摘要 第1 章绪论 1 1 人脸识别研究概况l 1 1 1 人脸识别方法- l 1 1 2 人脸识别的影响因素。3 1 2 人脸识别系统的评测:5 1 2 1f e r e t 数据库及f e r e t 评测一6 1 2 2f r v t 测试7 1 3 人脸识别面临的主要困难8 1 4 本文所做的工作及章节安排9 第2 章基于k 乩变换的主成分分析法1 l 2 1 主成分分析方法1 1 2 2 基于k - l 变换的主成分分析人脸识别1 4 2 2 1 特征脸算法1 4 2 2 2 距离度量准则1 6 2 2 3 主成分分析法人脸识别实现18 2 3 二维主成分分析法人脸识别2 2 2 4 本章小结。2 4 第3 章基于贝叶斯方法的人脸识别。 3 1 贝叶斯决策2 5 3 1 1 类内子空间与类间子空间。2 5 3 1 2 概率相似度法则- 2 6 3 2 贝叶斯人脸识别算法2 8 。1 东北大学硕士学位论文目录 3 2 1 最大似然准则2 8 3 2 2 最大后验准则3 0 3 2 3 改进的最大似然准则3 2 3 3 贝叶斯人脸识别模型3 4 3 3 1 高斯模型3 4 3 3 1 1 贝叶斯分类规则3 4 3 3 1 2 混合高斯模型山3 5 3 3 2 概率推理模型。3 7 3 4 本章小结3 9 第4 章结论与展望。4 1 参考文献4 3 致谢。4 7 v hp二=婿孵且 r 0 厶 东北大学硕士学位论文第1 章绪论 第1 章绪论 自动人脸识别技术的研究最早可以追溯到2 0 世纪6 0 年代,b l e d s o e 研究的一个依 赖于特征点的几何特性,如眼、鼻、嘴角之间的角度、长度、比率等的半自动识别系统。 随后的几十年尤其是近l o 多年来,由于人脸识别技术在银行、公安等安检部门都有着 广泛的应用,可直接应用在信用卡、驾驶证、身份证等证明个人身份的证件上,以及其 在应用数学、人工智能、模式识别等领域的理论价值导致世界上众多研究者对人脸识别 的研究投入了极大的热情。与虹膜识别、声音识别、指纹识别等其他人体特征相比,人 脸识别技术能够更加直观、简便。 本章首先从人脸识别的研究背景、识别方法、以及影响识别的多种因素几个方面来 简单阐述人脸识别的研究进展概况及面临挑战。然后再总体介绍本文所作的研究内容。 最后给出本文的结构。 1 1 人脸识别研究概况 三十多年前,人脸识别技术几乎是应用数学、计算机视觉和模式识别领域最难的问 题,它的研究还处于早期阶段。近十多年来,随着计算机技术及数学理论的发展与应用, 使得人脸识别有了很大的进展,且国际国内均有商业产品伴随着其快速发展而问世,如 基于l f a 算法的f a c e l t 系统、基于m 1 1 r 的特征脸及i c a 技术后来又融合了z n 公司的 弹性图匹配技术的v i i s a g e 系统等【1 1 。但是由于影响人脸识别的因素众多,包括光照、姿 态、人脸表情、图像质量、性别、年龄、遮挡等,导致人脸识别技术的识别效果包括识 别时间上以及识别率仍有一定的局限性。针对各种阻碍因素,国内外学者研究了多种相 应的方法最大限度的克服诸多因素的干扰。下面具体总结一下人脸识别的部分代数方法 及影响因素。 1 1 1 人脸识别方法 早期的学者建立的半自动、全自动人脸识别系统主要是采用一些简单的人脸特征点 的几何性质,如眼、鼻、嘴角的位置以及它们之间的相互关系( 角度、长度、比率等) , 这称为基于几何特征的识别方法。该方法的优点是直观易理解,而且对于光照、角度的 变化具有一定的鲁棒性。但是需要提取准确的人脸特征,对图像的质量要求很高,因此 - 1 东北大学硕士学位论文第1 章绪论 应用受到很大限制。另一种是基于代数特征的人脸识别方法。这类方法起源于图像描述 技术,目前人脸识别算法主要采用统计方法、神经网络方法和s v m 人脸识别方法等, 其中基于子空间的人脸识别方法是目前基于统计模型的人脸识别技术中识别效率最好 的方法之一。 a 子空间方法 常用的线性子空间方法主要有:特征子空间、区别子空间、独立分量子空间等。t u r k 等【2 】采用特征脸( e i g e n f a ( 瑚) 方法实现人脸识别。特征脸方法是从主成分分析( p c a ) 方法 导出的一种人脸描述和识别方法。该方法将包含人脸的图像区域看作是一个随机向量, 因此可以采用k - l 变换得到其正交基底。设x r 是一个图像的随机变量,是它的 维数,x 的协方差矩阵为: c = e 【x e ( x ) 】【x e ( x ) 】7 主成分分析法即是将该协方差矩阵分解为: c = 妒r 其中= 【办,办,丸】,a = d i a g , ,如,以) ,这里办,办,丸和 ,如,以分别表示为c 的特征向量和特征值。 由于比较大的特征值对应的特征矢量类似于人脸,故称为特征脸。给定了特征脸, 数据库中任何的脸面都可以通过点积运算投影到各特征脸,这样就得到了表示每幅人脸 的脸面特征权值向量。在进行人脸识别时,测试集也可以用它对应的权值向量表示,然 后再按照选定的某种距离准则( 一般选择欧氏距离) 比较数据库中训练集和测试集脸面 之间的距离【3 1 。但是p c a 方法在小数据库尤其是每个人的图片数量很小的情况下分类效 果较好,当考虑样本类别间的信息时,其效果会显著下降,因此,b e l h u m e u r 等 4 1 提出 了基于线性区别分析( l i n e a rd i s c r i m i n a n ta n a l y s i s ,l d a ) 的f i s h e r f a c e s 方法,在每个人 有多个样本的情况下获得了较p c a 优越的识别效果。l d a 分析训练集的散度矩阵,目 的是寻找一个由高维人脸图像空间到低维特征空间的线性变化关系,使得在低维特征空 间中人脸图对光照、表情等不敏感。近些年,一种新的变化方法独立成分分析 ( i n d e p e n d e n tc o m p o n e n t s a n a l y s i s ,i c a ) 被用于人脸识别。i c a 是线性非正交的变换,它 可以使未知的多维随机变量的线性组合尽可能的独立。特征脸方法、f i s h e r f a c e s 方法都 是基于主成分分析的数据驱动型人脸表示,主成分分析法主要基于图像集的二阶统计相 - 2 - h仆w皿r”r, 一。膏,扒 东北大学硕士学位论文 第1 章绪论 关性,没有考虑高级相关性。i c a 是p c a 的一般化,它不仅能完成二阶统计不相关, 同时还能尽量降低高阶统计相关的可能性嘲 b 弹性匹配方法 弹性匹配方法是模板匹配法的一种改进,它属于动态模板匹配法的一种。l a d e s 等 提出采用动态链接结构( d y n a m i cl i i l ka r c h i t e c t u r e , d 的方法识别人脸:在人脸图像 上放置一组矩形网格节点,每个节点的特征用该节点处的多尺度g a b o r 特征表示,节点 间的连接关系用几何距离表示,从而构成二维拓扑图的人脸描述根据两幅图像中各节 点和连接之间的相似度进行人脸识别【6 】。图像的拓扑结构可以是矩形点格阵,也可以是 三角形点格阵。还有一种方法是,n a s t a r 等提出将人脸图像l ( x ,y ) 表示为可变形的3 d 网格表面( x , y ,l ( x ,y ) ) ,将人脸匹配问题转换为曲面匹配问题,通过有限元分析的方法 进行曲面变形,再由两幅图像之间变形匹配的程度识别人脸 7 1 c 神经网络方法 d e m e r s 等提出采用p c a 方法提取人脸图像特征,用自相关神经网络进一步压缩特 征,最后采用一个m l p 来实现人脸识别【射。人工神经网络由于其固有的并行运算机制 及对目标的分布式全局存储,故可用来进行人脸识别。该方法先通过训练将视觉刺激形 成某种内部表示,并分散存储于某种神经结构中,再使用人工神经网络搜索,该搜索类 似于人脑的联想过程。 d s v d 分解方法 该方法是将人脸图像看作是一个数值矩阵,对其进行s v d 分解,将得到的奇异值 作为人脸图像的描述。基于奇异值向量与图像的一一对应关系及其具有较好的稳定性和 各种变换的不变性,故可以用来作为人脸的描述。 e 隐马尔科夫模型( h m m ) 方法 基于人脸从上到下、从左到右的结构特征,s a m a r i a 等首先将1 dh m m 和2 dp s e u d o h m m 用于人脸识别【9 】。n e f i a n 等采用嵌入式h m m 识别人脸,后来集成c o u p l e dh m m 和h m m ,通过对超状态和各嵌入状态采用不同的模型构成混合系统结构【l m l l l 。 1 1 2 人脸识别的影响因素 在非约束环境下,影响人脸识别的因素较多,其中最主要的是姿态和光照变化的影 响,所以在识别之前通常需要采用一些必要的预处理方法来提高系统的鲁棒性。 _ 3 - 东北大学硕士学位论文笫1 章绪论 a 姿态变化处理办法 人脸姿态的变化最多有三维的自由度,即俯仰、左右和旋转变化。这样同一个人的 人脸姿态就会呈现多种多样。如图1 1 所示: 图1 1 不同角度、姿态、表情人脸图像 f i g 1 1f a c ei m a g e so fd i f f e r e n ta n g l e s ,g e s t u r e sa n de x p r 嘲i o n s s h c r r a h 等利用p c a 方法研究姿态变化与空间投影的关系,得到可用少数几个系数 描述人脸的姿态变化的结论【1 2 1 ,但是p c a 方法只是保留了样本的方差特征,没有较好 地保留样本的几何结构。 通用3 d 模型的方法近来逐渐受到研究者的广泛重视。该模型方法先在图像上检测 出与通用模型顶点对应的特征点,再根据特征点调节通用模型,最后利用纹理映射得到 特定人的3 d 模型。由于要保证特定人的特征,采用的模型一般都比较复杂,通常可利 用不同视角下的多幅图像得到特定人的3 d 模型。进行人脸识别时,根据输入人脸图像 估计出姿态参数,用几何投影变换方法由3 d 模型生成对应姿态的人脸图像,与输入图 像匹配实现多姿态人脸识别;或者把输入图像通过变换矫正到正面人脸图像,和库中的 正面人脸图像进行匹配。该类方法简单易理解,能够有效处理人脸识别中姿态的变化。 但困难之处是准确模型的建立比较复杂,对图像的大小和质量要求也非常高。 b 光照变化处理方法 处理光照变化的方法一般有:采用光照变化不敏感的特征;采用图像光照变化方法; 采用低维光照子空间方法。用来补偿光照变化的方法有:当光照变化不严重时,可采用 零均值单位方差归一化、直方图均衡、非线性l o g 函数变换等方法。当光照变化较大时, 可采用商图像的人脸识别方法。商图像只与表面反射率有关,故对亮度变化具有很好的 稳定性。但是,该方法在形状不相同和图像特征点未对齐的情况下,有可能会使得算法 无效。基于阴影的形状恢复( s y m m e t r i c a ls h a p ef r o ms h a d i n g ,s s f s ) 方法将各种光照的 图像转换为正面光照图像,再和人脸库中的图像进行匹配【1 3 】。该方法可以处理姿态和光 照变化,但需要预先估计出人脸的姿态和光照方向。b a s r i 等从理论上推导出凸形朗伯 漫反射对象的光照空间可用一个9 维子空间表示【1 4 1 。该方法用球谐函数描述光照,将朗 4 l 仝 况下,可获得描述人脸光照的9 个球谐函数图像基。以前的实验已表明光照变化的人脸 图像位于一个低维的子空间中,该方法从理论上较好地解释了以前的实验研究结果。 c 低分辨率的处理方法 人脸识别的实际应用中,我们采集到的很多图像可能都是低分辨率的模糊图像。一 些研究表明低分辨率图像可用于入脸识别,但是识别率会有明显下降。因此,基于多个 低分辨率图像的超分辨率复原技术被列入了人脸识别的应用范畴。该技术的运算量一般 都非常大,基于此g u n t u r k 等提出了基于人脸特征空间的超分辨率复原技术,从而大大 降低了运算量【1 5 1 。 另外,表情、年龄、遮挡等问题在很大程度上影响人脸识别的效果,基于这些方面 的改进文献d 6 q 8 等也作了深入的研究。 1 2 人脸识别系统的评测 人脸识别的研究已进入快速发展阶段,众多理论及技术的运用使得研究者意识到寻 求一种高效的评价准则迫在眉睫。这样的评价准则可以对层出不穷的算法进行公平、准 确的评价。自上个世纪9 0 年代开始,出现了很多专业的人脸数据库供研究使用。很早 以前研究者们对于o c r 和指纹分类系统的评价研究提出了有效合理的评价算法及性能 测试法,通过这些算法中学者们得出两条重要结论:大型测试图像库是必要的;样本图 像和数据库测试的图像从统计角度来说要尽可能的相似。在制定评价准则时要注意对识 别系统的操作是对于可测量的成功率( 或失败率) 分布的统计,这些分布是依赖于具体应 用的。 在f e r e t 数据库之前,出现了很多小型人脸库,其一般数量均小于5 0 人,并得出 了在该数据库上近乎完美的人脸识别率( 一般都大于9 5 的正确识别率) 。相关论文中没 有使用训练集与测试集分离,算法的实验数据中也很少用到公用的人脸数据库,因此无 法进行算法之间的优劣比较,也无法评测该识别方法在实际的应用中的发展状况。建立 f e r e t 数据库的目的就是建立大型的人脸库来评测各种算法系统的性能,以此推动人 脸识别技术的发展。目前,常用的人脸数据库除了f e r e t 数据库外还有p i e 人脸数据 库、a r 人脸库、o r l 人脸数据库、y a l e 人脸数据库等。 - 5 第1 章绪论 1 2 1f e r e t 数据库及f e r e t 评测 f e r e t 数据库是在1 9 9 3 年8 月到1 9 9 6 年7 月期间搜集的,包括了1 1 9 9 个人的1 4 1 2 6 张人脸图。它是唯一面向研究人员免费的大型人脸数据库。f e r e t 数据库中人脸图片 包含各种角度、表情等,适合研究所需要的姿态、表情、年龄变化识别。如图1 2 所示: 图1 2f e r e t 数据厍的部分图像 f i g 1 2s o m ei m a g e so ff e r e t 目前,f e r e t 已经进行了a u 9 9 4 、m a r 9 5 、s e p t 9 6 三次评测1 蛇1 1 。并在1 9 9 7 年进 行了一次补充测试。几乎所有的主流人脸识别算法都参与了f e r e t 测试,f e r e t 测试 结果反映了当时人脸识别技术的最高水平。a u 9 9 4 评测能够对数据库中人脸自动定位、 标准化、识别的算法系统的性能,对应的g a l l e r y 包括3 1 6 个人的人脸图像。m a r 9 5 评 测自a u 9 9 4 以来,各种算法系统的发展及对应更大的g a l l e r y 库( 8 1 7 个人) 的算法性能。 这次评测的另一个重点是测试包含d u p l i c a t e 图像的d u p 集测试。d u p l i c a t e 图像就是对 应同一个人在不同的日期拍摄的入脸图像,一张分在g a l l e r y 库,另一张就是d u p l i c a t e 人脸图像。s e p t 9 6 是最复杂的评测,数据集分为五个子集,测试环境如表1 1 : 6 东北大学硕士学位论文第1 章绪论 表1 1f e r e t 数据库s e p t 9 6 评测 t a b l e1 1t h es e p t 9 6e v a l u a t i o n so nf e r e t 在评测系统中,设计了新的评测协议,协议要求算法对3 3 2 3 个人脸图和3 8 1 6 个人 脸图进行匹配,这样算法要执行1 2 6 千万次匹配。协议可以对不同的g a l l e r y 和p r o b e 测试性能,执行更细节的性能分析。评测了以下几种情况:( 1 ) 一个人分别在g a l l e r y 和 p r o b e 的人脸图像是在相同的日期、光照条件下拍摄的。( 2 ) 一个人分别在g a l l e r y 和p r o b e 的人脸图像在不同日期拍摄。( 3 ) g a l l e r y 和p r o b e 的人脸图像是在间隔一年的时间条件 下拍摄的。( 4 ) 一个人分别在g a l l e r y 和p r o b e 的图像是在相同的日期,但是不同的光照 条件下拍摄的。三种人脸识别系统的性能在测试中均表现出了良好的性能。f e r e t 数 据库和评测协议的建立对人脸识别算法的发展起到了重要的促进作用。f e r e t 计划建 立了接近现实的条件,能够对多种不同的算法进行公平的评价。另外评测的建立者实现 了两种人脸识别算法:p c a 和c o r r e l a t i o n ,给出了性能评测的一个基本准则。为了能够 深刻理解人脸识别算法,f e r e t 进一步研究了基于p c a 的人脸识别算法,f e r e t 最重 要的作用是根据评测结果明确阐述了人脸识别的现状,提出了未来人脸识别研究发展的 一般方向a u 9 9 4 提出了两个研究方向:第一方向是识别拍摄时间相隔几个月和一年的 图像,第二方向是识别姿势、角度发生变化的图像。m a r 9 5 提出的问题是关于p r o b e 为 d u p l i c a t e s 的识别。s e p t 9 6 提出的研究方向是d u p l i c a t e s 识别和光照变化条件下的人脸 识别。 1 2 2f i l :v t 测试 在f e r e t 评测之后,有关部门又组织了针对商用人脸识别系统三次性能测试, f r v t 2 0 0 0 、f r v t 2 0 0 2 和f r v t 2 0 0 6 测试。这几次的测试数据集、测试项目均超过f e r e t 评测。f r v t 2 0 0 0 测试的数据库包含1 4 6 3 人、1 3 8 7 2 幅图像,测试了压缩、表情变化、 姿态、光照、时间、距离、分辨率等因素对识别效果的影响【蠲。在f r v t 2 0 0 2 测试中, 数据库规模更大,且分为两部分:h c i n t ( h i g hc o m p u t a t i o n a li n t e n s i t yt e s t ) 和m c i n t 7 东北大学硕士学位论文第1 章绪论 ( m e d i u mc o m p u t a t i o n a li n t e n s i t yt e s t ) 。其中,h c i n t 包含3 7 4 3 7 人的1 2 1 5 8 9 幅图像, 每人至少3 张,背景单一,均为高品质图像。而m c i n t 主要有两个来源:一部分为 1 9 9 9 2 0 0 2 年期间拍摄的静止图像,包括光照和背景的变化;另一部分为面相、语音视 频序列。评测内容包括闭集识别、认证、开集识别三个部分。分别测试光照( 含室内与 室外) 、姿态、性别、年龄、时间、人数等因素对识别性能的影响。f r v t 2 0 0 6 于2 0 0 6 年1 月3 0 日开始,评测自2 0 0 2 年以来人脸识别原型的系统算法和商业系统的进展,评 测性能主要包括f r g c 致力研究的新技术以及弥补姿态和背景图像预处理算法。该次测 试较之前两次有很大的改进。 1 3 人脸识别面临的主要困难 由于人脸识别受到众多因素的影响,如表情、遮挡、光照、姿态等,导致图像的质 量、人脸的面部特征等信息有所损失。这些因素会导致人脸图像的明显改变,现有的人 脸识别系统在用户配合、采集条件较理想的情况下可以取得比较理想的结果,但是一般 的实用人脸识别无法达到这样的前提。目前还没有通用的算法能够有效的解决所有这些 因素的影响。人脸识别技术远没有达到实用水平,多方面因素的限制使得人脸识别还处 于发展阶段。 传统入脸识别方法主成分分析方法、线性判别式分析方法等都是在小规模数据库中 进行识别算法的运行,但是对于海量数据,这些方法将会遇到许多实际问题,如数据溢 出等,所以很难运作。随着人脸数据库规模的增长,现有算法的性能将显著下降,如何 维持或提高海量数据规模下的人脸识别是一个非常重要的问题。虽然研究者们针对光照 变化、姿态、遮挡、年龄变化等问题提出了多种解决方案,然而识别效果仍然不太明显。 目前即使是最好的人脸识别系统在室外光照环境下识别率还是会陡然下降。姿态问题也 是人脸识别中急待解决的一个难点,目前的许多算法对于俯仰侧偏幅太大情况下的识别 率也会急剧下降。对于遮挡问题,若是在识别对象不予配合的情况下,将是个非常严重 的问题,由于外物的掩饰很可能会导致算法失效。年龄的变化会导致面部的变化,尤其 是青少年的变化更为明显,如何解决年龄变化对识别算法的影响也是人脸识别必须面对 的问题。 视频图像是目前社会人脸信息采集的主流来源之一,其摄像头的类别、型号、传感 方式、量化精度以及采样等各不相同,采集图片的焦距、光圈、白平衡和增益等参数设 置也有很大的差别,这些因素的变化导致获得的人脸图像数据变化出现更大的变化,如 8 东北大学硕士学位论文第1 章绪论 何解决这些问题也是一个问题。 本文重点是讨论人脸识别的部分统计方法,而统计方法需要大量的训练集。由于人 脸图像在高维空间的分布是一个不规则的流形分布,能得到的样本只是对人脸图像空间 中一个极小部分的采样,如何高效解决小样本下的统计学习还有待深入探讨。 1 4 本文所做的工作及章节安排 人脸识别系统包括人脸检测、特征提取和识别的系统称为全自动识别系统,我们一 般提到的人脸识别只包括特征提取和识别两步,这样的系统称为半自动识别系统。本文 主要是在一半自动人脸识别系统中深入探讨了基于贝叶斯方法的人脸识别,主要工作 为: 首先,详细综述了人脸识别的研究现状。重点介绍了人脸识别的几个主流方法,并 罗列了人脸识别的主要影响因素及处理算法。最后还系统介绍了人脸识别的评测系统以 及人脸识别领域所面临的困难。 其次,本文详细推导了k - l 变换的主成分分析原理,给出了基于主成分分析法的特 征脸算法实现,同时还详细讨论了人脸识别中的距离度量准则问题,提出最适合本文的 距离度量方法。在传统的主成分分析识别基础上,本文针对其优劣分析给出了目前广泛 受关注的二维主成分分析人脸识别方法,结果证明二维主成分分析方法识别率及识别时 间确实优于传统的主成分分析人脸识别法。 最后,深入探讨了目前国际上公认的识别率较高的基于统计子空间的方法一贝叶 斯人脸识别法,这部分是本文的重点内容。本文从贝叶斯的基础知识出发,给出了基于 贝叶斯人脸识别的m l 算法和m a p 算法的详细内容,在此基础上提出了一种改进的 m l 算法,实验表明该算法在保证识别率的前提下,大大提高了识别的速度。文中还对 识别模型作了进一步的研究。先分析论证了传统的贝叶斯人脸识别的高斯模型,介绍了 由单高斯模型改进到混合高斯模型的优越性,最后又给出一种目前正处于发展阶段的模 型概率推理模型,将此模型运用到人脸识别上得到了比古典特征脸法更高的识别 率。 本文的知识结构为: 第一章绪论部分,综述人脸识别的发展概况。 第二章基于k - l 变换的主成分分析法,主要论证主成分分析法的人脸识别过程,同 时给出二维主成分分析法人脸识别的算法并做出比较。 9 东北大学硕士学位论文第1 章绪论 第三章为基于贝叶斯方法的人脸识别。介绍了贝叶斯决策实现人脸识别的算法比较 以及模型分布。 第四章为结论与展望部分。对本文进行了总结,同时提出了未来工作展望。 1 0 东北大学硕士学位论文第2 章基于k - l 变换的主成分分析法 第2 章基于k l 变换的主成分分析法 主成分分析法( p r i n c i p l ec o m p o n e n ta n a l y s i s ,p c a ) 的基本思想是利用k - l 变换提取 出图像空间数据中协方差最大的方向即主元方向,去除影响较小的信息,减少数据冗余, 使得图像数据在一个较原空间更为低维的特征空间被处理,与此同时原始图像数据的绝 大部分信息被保留下来,从而达到有效降维的目的。 。 2 1 主成分分析方法 主成分分析法的准则是用k - l 变换将维向量x 转化为m 维向量彳( m ) , 同时使得均方误差忙一x i 最小。a 为随机向量x 的期望,即e ( x ) = a ,首先对向量作 预处理,从x 中减去名,使得其均值变为0 ,这里预处理后的向量我们不妨仍用x 来表 示,设,为单位向量,那么随机向量x 在向量,上的投影为: 痧= x r i ( 2 1 ) 投影向量的均值及方差分别为: e ( ) = e ( x r j ) = e ( i r x ) = i r e ( x ) = 0 ( 2 2 ) d ( ) = e ( 2 ) 一【e ( ) 】2 = e ( 2 ) = e ( i r x x r j ) = i r e ( x x r ) j ( 2 3 ) e ( x x r ) 为随机向量x 的m x m 维协方差矩阵,且是对称矩阵。令c = e ( x x r ) ,由上 述方差的定义我们得到投影变量的方差是关于单位向量,的函数: d ( ) = f ( i ) = i r c i ( 2 4 ) 基于此,若想使得投影方差最大,只需找到一个合适的单位向量,即可。 不妨假设已存在单位向量,使得方差达到最大值,也就是说方差在,近邻域比较稳 定,即满足: 厂u + a t ) = f f ( i + a i ) = u + 卸r q j + ) r = ,r a + j r c + ( ) r a + ( ) r c ( 世) ( 2 5 ) 由于j r c a i 为l l 维矩阵,c 为对称矩阵,故j r c a = ( 世) r c ,而,的变动,值很小, l0,冉 东北大学硕士学位论文第2 章基于k - l 变换的主成分分析法 因此这里可以舍去( a t ) r c a i ,这样即得: 而 若要满足: 则要求: 厂( ,+ ) = i r c i + 2 ( a ) r a 厂( j ) = i r c i f ( 1 + ) = 厂( j ) ( ) r a = 0 ( 2 6 ) ( 2 7 ) 这里假设波动向量并不是完全随意的,需满足条件:对j 波动心后所得的向量 ,+ 址还是单位向量,则有l i ,+ t a l l = 1 ,即 ( ,+ 心) r ( j + 越) = l 得n - 由式( 2 7 ) 、( 2 8 ) 可以得出: 即 ( ) r ,= 0 ( 越) r a x ( t a ) r i = 0 ( ) r ( c i 一甜) = 0 ( 2 8 ) ( 2 9 ) 由此得到满足c i = m 的单位向量,可以使方差达到最大值。由前面得出的结论知 c 是实对称方阵,所以存在非负特征值。在等式两边左乘向量,r ,则有: i tc i = 姐i i 即 旯= 厂( j ) ( 2 1 0 ) 由此得出结论:零均值随机向量x 的协方差矩阵c 的特征向量,就是使方差厂( ,) 达 到极值的主方向;协方差矩阵c 的特征值就是厂( d 的极值。 由于求解公式a = 甜将会得到个单位向量j ,故向量x 在,上有个投影: 一1 2 东北大学硕士学位论文第2 章基于k - l 变换的主成分分析法 仅t = 1 1 :x 。i = 1 , 2 。n ( 2 1 1 ) 其中吒是x 在方向上的投影,这里称为主成分,为主方向。其矩阵形式即为: 其中q 是正交矩阵。故可得到: 即 口= q r x q q r x = q 口 x = q a = q ( 2 1 2 ) ( 2 1 3 ) 这里容易看出,正交矩阵q 是把空间一向量x 变成特征空间中对应的向量口,两空 间的维数没有发生改变,仍为维。p c a 的降维思想是去除x = q 口= l i 中变化较 小起辅助作用的项,保留那些变化较大起主导作用的项。假设协方差矩阵c 的前,个最 大特征值分别为: ,如,乃,其对应的特征向量分别为:,j :,: 向量x 表示为: x = i i = ( 而,x 2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年PS铝合金板项目发展计划
- 2025年加工羽毛(绒)合作协议书
- 2025年入团培训考试题目及答案
- 2025年莘县社工招聘考试真题及答案
- 2025年大学团员考试题型及答案
- 事业管理人员考试及答案
- 恩启奶粉培训知识课件
- 恐怖完整的课件
- 急诊科护理工作总结
- 运动塑形考试题及答案
- 办公室主任竞聘报告课件
- 最新医疗安全十八项核心制度课件
- 住宅小区供配电系统设计课件
- “三高”讲座-课件
- 年产12000吨水合肼(100%)项目环评报告书
- 普通冲床设备日常点检标准作业指导书
- 甘肃悬索特大桥钢桁加劲梁、正交异性桥面板施工方案
- 少儿英语字母操
- 义务教育(数学)新课程标准(2022年修订版)
- 高中物理(人教版)必修1全册课件
- GB∕T 40928-2021 特里马滑雪板 固定器安装区 要求和试验方法
评论
0/150
提交评论