




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、目录1 绪论11.1 课题背景11.1.1 课题来源11.1.2 人脸识别技术11.1.3 人脸识别技术的研究意义21.2 人脸识别发展历史与概况31.3 人脸识别的难点42 人脸识别的相关理论12.1 人脸特征12.1.1 肤色特征12.1.2 灰度特征12.2 PCA的基本概念12.2.1 PCA算法的原理22.2.2 PCA算法33 人脸识别算法设计13.1 人脸检测与定位13.2 基于PCA的人脸特征提取23.3 人脸识别方法33.3.1 几何特征法33.3.2 特征脸法43.3.3 弹性图匹配法53.3.4 神经网络法64 基于PCA的人脸识别系统设计14.1 引言14.2 具体算法
2、14.3 ORL人脸库实验分析24.3.1实验1:算法的比较34.3.2 实验2:样本数目的选择44.3.3 实验3:采样因子的确定44.4 YALE人脸库实验55 小结15.1 总结15.2 展望1致谢语1参考文献1附件1摘要:人脸识别技术是一种新型的身份识别技术,它是生物识别技术的一种,人脸识别技术也是一个非常活跃的研究领域,它覆盖了数字图像处理等诸多领域。随着人们应用需求的不断深入,人脸识别技术将呈现出主流化、芯片化、标准化发展趋势。人脸识别系统主要由检测与定位、特征提取与识别两部分组成,在这两部分的基础上还包括预处理等步骤,对于一个全自动的人脸识别系统,整个的识别过程可归纳为人脸检测与
3、定位、特征提取和识别。实现流程如下:首先是预处理,对图像进行光照处理等以改善图像质量;检测与定位,从不同场景中检测出人脸并将其从背景中分割出来;对人脸库中所有图像大小和各器官位置归一化;最后对归一化的人脸图像进行特征提取与识别。由于动态识别研究处于起步阶段,该技术相对较欠缺,因此本文只研究基于静态人脸图像的识别方法。关键词:人脸识别;数字图像处理;检测方法Abstract: Face recognition technology is a new identity, it is a kind of biometric technology, face recognition technolog
4、y is also a very active research area, which covers digital image processing and many other fields. With the deepening of people's application requirements, the face recognition technology will appear in the mainstream, chip, standardization, development trends. Face recognition system mainly by
5、 the detection and location, feature extraction and recognition of two parts, including the pretreatment steps in these two parts on the basis of a fully automatic face recognition system, the whole recognition process can be summarized as the human face detection and location, feature extraction an
6、d recognition. The process is as follows: First, pretreatment, light processing to improve image quality; detection and location on the image to detect a person's face from different scenes and split out from the background; face database image size and each organ location normalization; Finally
7、, the normalized face image feature extraction and recognition. Dynamic discrimination in its infancy, the technology is relatively lacking This article only study identification method based on the static face images. Keywords: face recognition; digital image processing; detection method1 绪论1.1 课题背
8、景1.1.1 课题来源随着安全入口控制和金融贸易方面应用需要的快速增长,生物统计识别技术得到了新的重视。目前,微电子和视觉系统方面取得的新进展,使该领域中高性能自动识别技术的实现代价降低到了可以接受的程度。而人脸识别是所有的生物识别方法中应用最广泛的技术之一,人脸识别技术是一项近年来兴起的一种新型的身份识别技术,它是生物识别技术的一种。随着人们应用需求的不断深入,人脸识别技术将呈现出主流化、芯片化、标准化发展趋势。近年来受到了各国研究人员的普遍关注,主要用于安全保密等领域。人们更多的是在电影中看到这种技术的神奇应用:警察将偷拍到的嫌疑犯的脸部照片,输入到电脑中,与警方数据库中的资料进行比对,并
9、找出该嫌犯的详细资料和犯罪记录。这并非虚构的情节。在国外,人脸识别技术早已被大量使用在国家重要部门以及军警等安防部门。在国内,对于人脸识别技术的研究始于上世纪90年代,目前主要应用在公安、金 融、网络安全、物业管理以及考勤等领域。人脸识别按照信息来源可分为两类:基于静态人脸图像的识别和基于动态信息的识别。由于动态识别研究处于起步阶段,该技术相对较欠缺,因此本文只研究基于静态人脸图像的识别方法。1.1.2 人脸识别技术所谓人脸识别,是指对输入的人脸图像或者视频,判断其中是否存在人脸,如果存在人脸,则进一步给出每张人脸的位置、大小和各个面部主要器官的位置信息,并且依据这些信息,进一步提取每张人脸蕴
10、含的身份特征,并将其与已知人脸库中的人脸进行对比,从而识别每张人脸的身份。其研究内容包括以下五个方面:(1)人脸检测 从不同的背景中检测是否存在人脸,并确定其位置、大小、形状、姿态等信息的过程。它关系到后续识别工作能否正确进行,并保障最终识别结果的可靠性。(2)人脸表征 确定表示检测出的人脸和数据库中的已知人脸的描述方式。通常的表示方式包括几何特征(如欧氏距离、曲率、角度等)、代数特征(如矩阵的特征矢量)和固定特征模板等。(3)人脸鉴别 即狭义的人脸识别,就是通常所指的将待识别的人脸与数据库中的已知人脸进行比较,得出相关信息。这一过程的核心是选择适当的人脸表示方式和匹配策略,系统地构造与人脸的
11、表征方式密切相关。(4)表情/姿态分析 即对待识别人脸的表情或姿态进行分析,并对其加以归类。(5)生理分类 对待识别人脸的物理特征进行分类,得出其年龄、性别、种族等相关信息,或从几幅相关的图像中推导出希望得到的人脸图像,如从父母的脸推导出孩子的脸像等。本论文中的人脸识别主要是指狭义的人脸识别,指将待识别的人脸与数据库中的已知人脸之间进行匹配的人脸鉴别。人脸识别的目的是让计算机具有通过人脸的特征来鉴别身份的功能。基于人脸特征的身份识别主要设计到复杂场景中的人脸检测及识别技术,是一种依托于图像理解、模式识别及计算机视觉、统计学和人工智能等高技术的研究方向。1.1.3 人脸识别技术的研究意义(1)富
12、有挑战性的课题人脸识别是机器视觉和模式识别领域最富有挑战性的课题之一,同时也具有较为广泛的应用意义。人脸识别技术是一个非常活跃的研究领域,它覆盖了数字图像处理、模式识别、计算机视觉、神经网络、心理学、生理学、数学等诸多学科的内容。如今,虽然在这方面的研究已取得了一些可喜的成果,但是FRT在实用应用中仍面临着很严峻的问题,因为人脸五官的分布是非常相似的,而且人脸本身又是一个柔性物体,表情、姿态或发型、化妆的千变万化都给正确识别带来了相当大的麻烦。如何能正确识别大量的人并满足实时性要求是迫切需要解决的问题。 (2)面部感知系统的重要内容 基于视觉通道信息的面部感知系统,包括人脸检测和跟踪、面部特征
13、定位、面部识别、人脸归类(年龄、种族、性别等的判别)、表情识别、唇读等分系统,如图1所式,可以看出,继人脸检测和跟追之后,面部特征定位通常是面部感知的一个必备环节,是后续工作的基础,具有重要的意义。尽管人脸识别不能说是其他面部感知模块的必备功能,但是,可以肯定的是,利用已知的身份信息,结合特定人的先验知识,可以提高表情分析、唇读和语音识别、手势识别乃至手写体识别的可靠性。而计算机对使用者身份确认的最直接的应用就是基于特定使用者的环境设置:如使用者的个性化工作环境,信息的共享和隐私保护等等。(3)实际应用广泛人脸识别研究已经有40多年的历史,作为生物识别的一种,广泛应用在身份识别、海关监控等领域
14、。目前,人脸识别技术也逐渐走向了商用,如Eyematic公司研发的人脸识别系统等。目前研究较多的是静态人脸识别技术,计算机静态人脸识别是一个经典的模式识别问题。人脸识别的传统方法主要分为:整体匹配方法,其中最具代表性的是主元分析法,其他混合型的算法。这些人脸识别系统多数都要依赖于面部特征(比如眼睛中心位置)的严格特征匹配来归一化人脸以便提取人脸描述特征。静态人脸识别系统主要由检测与定位、特征提取与识别两部分组成,在这两部分的基础上海包括预处理等步骤。常用的人脸识别试验库以美国军方的FERET库最为权威,它包括多人种、多年龄段、各种表情变化、光照变化、姿态变化的图象,图像的数量和实验的人数也非常
15、多,可以充分地验证人脸识别算法。目前尚没有专门测试人脸检测和定位算法的图像库。视频输入人脸检测和跟踪面部特征定位人脸识别表情分析性别判断种族判断年龄判别唇 读身份信息情感状态性别信息种族信息年龄信息唇形类别图1.1 面部感知系统结构图11.2 人脸识别发展历史与概况20世纪60年代末至70年代初,人脸识研究刚刚起步。最早的研究者是 Bledsoe,他建立了一个半自动的人脸识别系统,主要是以人脸特征点的间距、比率等参数为特征。 20世纪90年代以来,对着计算机软硬件性能的迅速提高,以及对人脸识别能力的高要求,是发展更具鲁棒性2的人脸识别方法称为时代的必然。于是基于整体的识别方法营运而生,并且很快
16、成了研究的重点,如特征脸方法和弹性图匹配方法。90年代中期以来,人脸识别方法想着整体识别和部件分析相结合的趋势发展。研究人员开始逐渐认识到人脸识别算法必须能充分地利用人脸的各种特征信息,融合人脸的形状拓扑结构特征、局部灰度特征和全局灰度分布特征等多种特征。因此,出现了很多新的算法,这些算法是将原先单一的算法结合起来,共同完成人脸的识别。灰度和形状分离的可变形模型方法就是其中之一。90年代后期,一些商业性的人脸识别系统开始逐渐进入市场,人脸识别技术成为当今国际安全防范最重要的手段之一。但是,这些技术和系统离实用化还有一定的距离,性能和准确率有待提高。2000年前后至今,人脸识别方法的性能虽然有了
17、一定的提高,但仍与人们的要求还有一定的差距,现有方法对光照、年龄、表情、姿态、距离等条件的变化比较敏感,当某些条件发生变化时,识别效果很不理想。目前,人脸识别技术仍只能用于某些对识别准确率要求不高的场合。1.3 人脸识别的难点目前人脸识别的难点主要存在于以下几个方面:(1)光照变化是影响人脸识别性能的最关键因素,对该问题的解决程度关系着人脸识别实用化进程的成败,在人脸图像预处理或者归一化阶段,尽可能地补偿乃至消除其对识别性能的影响。(2)成像角度及成像距离等因素的影响,即人脸的姿态的变化,会垂直于图像平面的两个方向的深度旋转,会造成面部信息的部分缺失。(3)不同年龄的人脸有着较大的差别。身份证
18、是以前照的,在逃犯的照片也是以前的,因此在公安部门的实际应用中,年龄问题是一个最突出的问题。(4)采集图像的设备较多,主要有扫描仪、数码相机、摄像机等。由于成像的机理不同,形成了同类人脸图像的识别率较高,而不同类间人脸图像识别率较低的情况。随着人脸识别技术的发展,这一问题也将逐步得到解决。(5)人脸图像的数据量巨大。目前由于计算量的考虑,人脸定位和识别算法研究大多使用尺寸很小的灰度图像。一张64*64像素的256级灰度图像就有4096个数据,每个数据有256种可能的取值。定位和识别算法一般都很复杂,在人脸库较大的情况下,计算量十分大,很多情况下速度令人难以忍受。而灰度数据事实上是丧失了色彩、运
19、动等有用信息的。如果使用全部的有用信息,计算量就更大了。2 人脸识别的相关理论特征提取是人脸识别中的核心步骤,直接影响识别精度。由于人脸是多维弹性体,易受表情、光照等因素影响,提取特征的困难较大。特征提取的任务就是针对这些干扰因素,提取出具有稳定性、有效性的信息用于识别。2.1 人脸特征人脸特征3是识别的重要依据之一,检测定位过程中也会用到人脸特征,其中肤色特征和灰度特征是两类常用特征。2.1.1 肤色特征肤色特征由肤色模型描述,即用统计的方法对目标对象的肤色建模。基于肤色特征的识别方法简单且能够快速定位人脸。人脸肤色不依赖于细节特征且和大多背景色相区别,但该方法对光照和图像采集设备特性较敏感
20、。肤色在色彩空间中具有聚合性,而脸部色彩复杂,这给统一建模造成了一定难度。该方法通常作为其他统计模型的辅 助方法使用,适于粗定位或对运行时间有较高要求的应用。2.1.2 灰度特征灰度特征包括轮廓特征、灰度分布特征( 直方图特征、镶嵌图特征等 )、结构特征、模板特征等。由于人脸五官位置相对固定,灰度分布呈一定规律性,因此 ,可利用灰度特征来进行人脸识别。通常采用统计的方法或特征空间变换的方法进行灰度特征的提取,如利用变换法4(是由卡尔胡宁(Karhumen)与勒夫(Loeve)分别提出的一种图像变换方法)得到的特征脸,利用小波变换得到的小波特征等。2.2 PCA的基本概念主成分分析法(PCA)是
21、广泛使用的特征提取方法之一,最早被Ttirk和Pentland提出。它的基本思想是首先将人脸矩阵转化为一个向量,然后提取向量特征。PCA方法是模式识别领域一种有效的方法,在最近几年也得到了一定发展。与传统的pCA方法相比,2004年提出的ZDpCA方法是处理ZD矩阵更有效的方法之一,它不需要将图像转化为向量,而是直接利用原图像矩阵来重建图像协方差矩阵,与PCA方法的协方差矩阵相比,ZDPCA的图像协方差矩阵的大小更小,如:假设一张图像的大小为 128X128,ZDPCA协方差矩阵大小为128x128,因此,ZDPCA在计算方面有显著的优越性。最近许多研究表明ZDPcA方法在模式识别,特别是人脸
22、识别领域是非常流行的提出了基于子模式双向二维主成分分析的人脸识别,该方法通过对原图像进行分块处理,能有效地抽取原图像的局特征,同时,通过采用双向2维主成分法对分与会得到的子图像矩阵直接进行特征抽取,避免了矩阵向量的转化,能精确地计算协方差矩阵的特征向量,并能有效地降低特征维数,该方法在姿态、表情和光照条件变化情况下,都具有较好的识别性能;文章l17提出了改进的模块ZDPcA人脸识别方法,该方法对每一类训练样本中每个训练样本的每一子块求类内适应加权平均值,并用类内自适应加权平均值对训练样本类内的相应子块进行规范化处理,然后由所有规范化后的子块构成总体离散度矩阵,从而得到最优投影矩阵;由训练集的全
23、体子块的加权平均值对训练样本的子块和测试样本的子块进行规范化后投影到最优投影矩阵,得到识别特征,该方法能更好地提取到反映图像之间差异的局部特征,便于提高识别率;文章118提出了一种模块化ZDPcA和csLDA相结合的人脸验证算法,该方法是从原始数据出发,对二维数据进行分块后采用ZDPCA进行特征抽取,能有效提取图像的局部特征,得到替代原始图像的低维的新模式,然后对新模式施行CSLDA(基于客户相关子空间的线性判别分析方法),不仅考虑到类内、类间的差异,弥补了PCA的缺陷;而且客户相关子空间可以较好地描述不同个体人脸之间的差异性,比传统的个体特征脸具有更好的判别能力。该方法能更好地描述人脸特征,
24、降低维数,计算简便。PCA方法需要将一个图像矩阵转化为一个高维的向量,由于协方差矩阵的维数高而训练样本少,导致了计算的复杂性和难度增加。ZDPCA方法是直接利用二维图像来计算其协方差矩阵,由于其协方差矩阵小且训练样本相对足够,ZDPCA方法计算其协方差的特征向量更准确、速度会更快。尽管在文章里已经表明ZDPCA方法比传统的PCA方法有很多的优势,但它也有不足之处:第一,它需要更多的系数来表示一幅图像,提出了基于ZDPCA的双边投影,首先同时求出ZD矩阵的行、列方向的最优投影子空间,然后将ZD人脸矩阵的行向量和列向量各自投射到两个不同子空间,这种两边投影方法的最大优点是用最少的系数表示一张人脸图
25、像,从而达到最高的压缩率;第二,笔者在文章已经证明ZDPCA方法丢失了一些协方差信息,这些信息包含了一些对识别是很重要的人脸局部几何结构变化信息,但PCA方法却能保留这些信息。如果ZDPCA方法能利用更多的协方差信息,则该方法的识别率能得到提高。因此,本章节对ZDPCA方法如何利用更多的协方差信息进行研究。2.2.1 PCA算法的原理令为表示环境的维随机变量。假设均值为零,即: 令w表示维单位向量,在其上投影。这个投影被定义为向量和w的内积,表示为: 满足约束 而主成分分析的目的就是寻找一个权值向量w使得表达式Ey2的值最大化: 根据线性代数的理论,可以知道满足式子值最大化的w应该满足下式:
26、即使得上述式子最大化的w是矩阵Cx的最大特征值所对应的特征向量。2.2.2 PCA算法 从本质上来说,主成分分析法是一种线性映射算法,它的算法步骤如下: 设原始观测数据样本集合为一组(个)零均值(如果不是的话,则先做去均值预处理,相当于对全体向量作一次平移变换)的n维随机向量:,以样本集合的协方差矩阵(总体散度矩阵)为产生矩阵。即 或 其中为观测样本的均值向量,由于是零值向量,所以为零值向量。显然,是一个对称、半正定的n×n矩阵,对它进行特征值分解得到: 其中U是正交矩阵,是的特征值,且,各特征值对应的特征向量就是矩阵U的各列(从左到右),它是一组正交基。 作线性变换y =UTx,原
27、始的各观测数据向量变换成一组特征向量,其协方差矩阵为: 新特征向量组的称为第个主成分。 显然,的第个特征值等于的方差,第个主成分的方差贡献率为: 那么前m个主成分的累计方差贡献率为: 当前m个主成分的累计方差贡献率足够大时,就可以只取前m个主成分作为新特征,而将其余的n-m个新的特征舍去,从而实现了观测数据样本集合的特征提取。此时重构误差的极小值为: 重构误差的极小值为:3 人脸识别算法设计当人脸图象的来源是一幅静态图象时进行的人脸识别属于静态人脸识别。人脸识别算法包含2部分:人脸定位和归一化(如图2),对于一个全自动的人脸识别系统,整个的识别过程可归纳为人脸检测与定位、特征提取和识别,(如图
28、3)所示,这两个环节独立性很强,而在许多特定情况下,人脸检测与定位工作比较简单,而“特征提取与识别”环节得到了更为广泛和深入研究。图3.1 人脸定位和归一化3.1 人脸检测与定位目前人脸检测还是一个相当困难的工作,其中所面临的问题可以归结如下:图像中是否存在人脸:这是人脸检测不同于其它有关人脸研究工作的地方,即如何判断图像中是否存在人脸,如何区别人脸和类似人脸的非人脸图像。检测不同表现形式的人脸:人脸可能以不同视角出现在图像中,也可能被某些物体遮挡,造成某些用于检测而需提取的人脸特征不可见。图像中存在着噪声:由于成像时亮度、对比度等因素的影响使图像不清晰,人脸与背景区别不大,给检测带来一定的难
29、度。人脸自身的因素:由于人脸结构复杂,某些局部特征具有随机性(如眼镜、胡须、发型等),而且还存在着不同表情的人脸,这些都给人脸检测带来难度。由此可见,人脸检测是一个复杂而具有挑战性的问题。任意给定一个图像或者一组图像序列,人脸检测的目的就在于判定该图像或图像序列中是否存在人脸。如果存在,则返回其位置和空间分布,将所有人脸从背景图象中分割出来,并确定每个人脸在图象中的大小和位置,人脸检测系统的输入是可能包含人脸的图象,输出是关于图象中是否存在人脸以及人脸的数目、位置、尺度等信息的参数化描述。根据这个定义可知,人脸检测可分为两类:第一类是在静止图像中判断是否存在人脸,若存在,则定位人脸的位置;第二
30、类是在视频图像序列中判断是否存在人脸,若存在,则动态地跟踪人脸。显然,后一种所采用的人脸检测方法要比前一种困难。人脸检测的基本思想是用知识或统计的方法对人脸建模,比较所有可能的待检测区域与人脸模型的匹配度,从而得到可能存在人脸的区域。3.2 基于PCA的人脸特征提取 通常由图像直接获得的数据量是很大的,为了有效地进行分类识别,就要对原始数据进行变换,得到最能反映分类本质的特征,这就是特征的提取和选择的过程。我们把原始数据组成的空间叫测量空间,把分类识别赖以进行的空间叫特征空间。通过变换,可以把维数较高的测量空间中表示模式变为在维数较低的特征空间的表示模式。在特征空间中的一个表示模式也叫做一个样
31、本,它往往表示成一个向量,即特征空间中的一个点。人脸图像可以看作是一个矢量(如图4所示),如果图像的高度和宽度分别为h和w,则对应的矢量维数为w*h,人脸矢量属于一个空间,称为是图像空间。图3.2 人脸矢量示意图7由于每个人脸都非常类似,在相同的位置都有两只眼睛,一个嘴巴,一个鼻子等等,所以在图像空间里所有的人脸矢量都聚集在一个狭窄的区域内(如图3.3所示),所以整个图像空间不是人脸描述的一个优化空间,PCA主元分析法的任务就是构造一个能更好描述人脸的人脸空间,降低空间维数,使新的人脸空间的基向量(又叫主元)能更好地描述典型的人脸模式。图3.3 人脸空间示意图8PCA主元分析法又称Karhun
32、en-Loece(KL)变换,它的目的是降维,人脸空间是典型的高维空间,一个128*128像素的人脸若视为向量,就有16384维,运算极不方便。若将人脸看作是平稳的高斯过程,就可以利用KL变换提取主兀,达到降维的目的。KL变换是图像压缩的一种最优化变换,高维的图像空间经过KL变换后得到一组新的正交基(主元),保留其中最重要的正交基,由这些正交基可以组成低维线性空间。如果假设人脸在这些低维线性空间的投影具有可分性,那么就可以把这些投影用作识别的特征向量。这就是PCA的主要思想。PCA最早是由统计学发展过来的,然后就被用在人工神经网络理论中,所以对PCA的理论描述可以从两方面进行,一种是从人工神经
33、网络理论这个角度来理解,这样相对来讲比较直观。另一种就是从统计学角度来理解,这就比较严格,比较难懂,因为这是严格的按照数学的理论来推导出来的。3.3 人脸识别方法高水平的识别工作一般需要复杂的处理过程,如将图象映射到表面,恢复为三维模型,进行模型匹配等,但基于二维的图象处理也可进行人脸识别,下面介绍常用的几种方法。3.3.1 几何特征法许多人也将几何特征法用于人脸识别中。例如:常用的几何特征有人脸的五官如眼睛、鼻子、嘴巴等的局部形状特征,脸型特征以及五官在脸上分布的几何特征。提取特征时往往通过人脸面部拓扑结构几何关系的先验知识。在这种基于几何特征的识别中,识别总归为特征矢量之间的匹配,基于欧式
34、距离的判决是最常用的识别方法。人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以作为人脸识别的重要特征。采用几何特征进行正面人脸识别 一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征。基于几何特征的识别方法具有存储量小、对光照不敏感、简单且容易理解等优点。这种方法同样存在一些问题: 从图像中抽取稳定的特征比较困难;对强烈表情变化和姿态变化鲁棒性较差;造成部分信息丢失,适合于粗分类。可变形模板方法可以视为几何特征方法的一种改进,它是一种经典的模式识别方法
35、,这种方法大多是用归一化互相关,直接计算两幅图象之间的匹配程度。最简单的人脸模板是将人脸看成一个椭圆,检测人脸也就是检测图像中的椭圆。另一种办法是将人脸用一组独立的小模板表示,如眼睛模板、嘴巴模板、鼻子模板、眉毛模板和下巴模板等。而这些模板的获得必须利用各个特征的轮廓,而传统的基于边缘提取的方法很难获得较高的连续边缘。即使获得了可靠度高的边缘,也很难从中自动提取所需的特征量。为此,用弹性模板方法提取特征显示出其独到的优越性。弹性模板有一组根据特征形状的先验知识设计的可调参数所定义。为了求出这组参数,需要利用图像的边缘、峰值、谷值和强度信息及特征形状的先验知识设计合适的能量函数。参数向能量减小方
36、向调整,当能量达到最小时,这组参数对应的模板形状最符合特征形状。其基本思想是:设计一个参数可调的器官模型(即可变形模板,如图6所示),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即作为该器官的几何特征。图3.4 可变形模板方法的眼模型93.3.2 特征脸法这种方法的原理是PCA(Principal Component Analysis 主分量分析法)PCA用于特征选择和降低图象维数的一种通用方法,因此可以用K-L变换获取其正交K-L基底,对应其中较大特征值的基底具有与人脸相似的形状,因此,又称之为特征脸,得到人脸重要特征之后,要对其进行主成份分析(PCA),其具体的算法思
37、想如下: 若抽样参加训练的人脸图像有M张,每张图像的维数是N*N,则可以分别表示为:x1、x2、x3、x M ,那么平均脸可以表示为:F=1/Mxi (i=1、2M) (3.1)每张人脸和平均人脸的距离可以表示为:di=xi-F (3.2)假设矩阵A=d1,d2,d2,d M,特征脸需要做的就是找出矩阵 AAT的前Z个较大特征值的特征向量,但AAT是一个N2*N2维的大矩阵,求这样一个矩阵的特征值计算量是非常大的。为此我们可以先求出 AAT的特征值与特征向量,然后求出ui Ui=Aujn1/2j(j=0,1,2,z-1) (3.3)uj表示AAT的特征向量,uj表示ATA的特征向量,ni是AT
38、A的特征值,uj就是所指的特征脸。求出特征脸以后,所剩下的工作就是要对库中的人脸进行降维,由uj可以组成一个投影矩阵,表示为W=u1u2,,u Z-1,并进行降维: qi=WTdi(i=0,1,2,N-1) (3.4)由式子(3.4)得出所有人脸向量的降维向量。基于特征脸的识别方法优点:它大大降低了原始空间的维数,在这个低维空间中可进行人脸检测和识别。Pentland等人在人脸检测中使用了特征脸方法,得到的特征脸如图7所示:图3.5 特征脸10缺点:这种方法对光照条件的改变较敏感。如果提供了在光照条件变化下的人脸图象,则投影矩阵保留的主要元素会因光照而改变。于是,投影矩阵中的点便不能被很好的分
39、类,甚至会变得轮廓模糊。作为特征脸技术的改进,可以将Fisher线性判断准则(Fisher Linear Discriminant,简写为FLD)应用于人脸识别。并对PCA和FLD进行了比较,结论是特征脸不能区分类内和类间变化的不同角色,而是将他们一视同仁;FLD克服了PCA的一个缺点;它可区分类内和类间的散布矩阵。 线性判断准则分析并不总是优于PCA。当每一类的样本数较小时,PCA的效果比FLD好。在很多领域,尤其是人脸识别领域,人们根本不知道不同分类的基本分布。所以,实际上是很难弄清楚已有的训练数据是否适用。他们的实验表明这种考虑是正确的,在一些实验中,PCA的效果比FLD好,而在另一些试
40、验中则是FLD的效果比PCA好。3.3.3 弹性图匹配法弹性图匹配法11(Elastic Graph Matching)是一种基于动态链接结构(Dynamic Link Architecture,DLA)的方法。该方法在二维空间中为人脸建立属性拓扑图 ,把拓扑图放置在人脸上,每一节点包含一特征向量,它记录了人脸在该顶点附近的分布信息,节点间的拓扑连接关系用几何距离来标记,从而构成基于二维拓扑图的人脸描述。利用该方法进行人脸识别时,可同时考虑节点特征向量匹配和相对几何位置匹配。在待识别人脸图像上扫描拓扑图结构并提取相应节点特征向量,把不同位置的拓扑图和库中人脸模式的拓扑图之间的距离作为相似性度量
41、。此外,可用一个能量函数来评价待识别人脸图像向量场和库中已知人脸向量场间的匹配度,即最小能量函数时的匹配 。 该方法使得几何特征描述越来越充分,保留了人脸的拓扑结构和局部特征,通过局部节点调节和弹性图变形,以及局部特征的多级Gabor变换描述,使得该方法对光照、姿态变化等具有较好的适应性。该方法的主要缺点是计算量较大,必须对每个存储的人脸计算其模型图,占用很大存储空间。3.3.4 神经网络法基于神经网络的人脸识别方法是近几年比较活跃的一个研究方向,已被应用于人脸检测、人脸识别、表情分析等问题,并取得了较好的效果。该类方法将人脸用灰度图表征,利用神经网络的学习和分类能力进行识别。通常需考虑两方面
42、的因素:选择图像哪些参数作为输入;选择何种神经网络。目前主要有两种输入策略,第一种是将提取的特征向量作为输入向量;第二种是将图像像素直接输入神经网络。第一种输入策略可有效控制神经网络规模,但对提取特征的要求较高;第二种对于提取要求降低,并可根据样本集自身的方差特征来进行特征选择,但网络规模扩大而造成收敛缓慢。用于人脸识别的神经网络有很多,如基于反向传播(Back Propogation,BP)算法的BP神经网络,该方法基本理论简单且有很强的学习能力,运算量较小;Cottrell等人提出使用级联BP神经网络进行识别,对受损人脸的识别能力较好;LinSH等人提出基于概率决策的神经网络(Probab
43、ilistic Decision-Based Neural Network,PDBNN)方法,采用虚拟样本进行强化和反强化学习,从而得到较理想的概率估计结果,并采用模块化网络结构加快学习。径向基函数神经网络(Radial Basis Function Network,RBFN)因具有逼近性好、空间描述紧凑、训练速度快等特点也被用于人脸识别。神经网络用以解决复杂模式识别与行为控制问题,其特色在于信息分布式存储,具有良好的容错性、联想记忆功能以及通过学习获取知识并解决问题的能力。但该类方法要求训练集中包含较多的人脸图像,只能适合于小型人脸库。由于原始灰度图像数据量庞大,神经元数目多,该方法运算量较
44、大。4 基于PCA的人脸识别系统设计4.1 引言Gabor小波提供了多精度、多通道表现图像空间动频率域特性的机制,较好地反映了生物视觉神经元的感受野。与其它方法相比,Gabor小波方法是一种多分辨率的描述,并且能够较好地解决由于环境变化而引起的图像变化问题,对此已有充分的理论依据并且能够有效地实现,所以采用它来进行人脸的识别可以获得较好的结果。生物学实验表明,生物视觉神经细胞对于空间信息输入的响应具有频率选择性,而且有一定的带宽范围,猫的细胞感受野的空频域带宽为0.5-2.5个倍频程,猴的带宽为0.4-2.6个倍频程,而人的带宽范围为1.5-2.0个倍频程,因此利用生物学的研究成果来指导Gab
45、or函数的参数选择可以使其特性更能与人类的视觉系统响应机理相吻合。Gabor小波是一组带通滤波器,通过参数的选择,每一组滤波器具有各自的频率选择性和方向选择性,这样不同方向和尺度的滤波器覆盖整个频域,从而一幅人脸图像的Gabor特征表示就是该图像和一族Gabor小波卷积的结果。这部分内容在第二章已经有详细说明,这里不再赘述。4.2 具体算法根据前面第二,三章所述,我们知道经过Gabor小波变换后,维数将会变得很高,不利于人脸识别。很多研究成果表明,PCA在多数人脸识别方法中都起到重要的作用,因此降维选择了这种方法。但是,子空间的维数要慎重考虑,通过降维并慎重选择降维后的维数,可以解决人脸识别中
46、的学习问题。图4.1描述了这个人脸识别系统的构成。Gabor变换(特征提取)pca映射(降维)分类尺度(欧式距离)识别率测试图像训练图像图4.1 人脸识别系统总体结构 具体的训练和识别过程如下: 将c个人脸图像通过gabor小波变换后组成训练样本集,其中,那么全部人脸图像均值为:,对每幅人脸图像求与均值的差值,其协方差矩阵为,根据第三章所提到的计算方法,求出协方差矩阵的特征值和特征向量,从而获得映射矩阵,其中,m是与前m个最大特征值对应的特征向量,选择,将训练样本集全部投影到m维特征空间。同样,建立测试人脸库,经过gabor小波变换后,再投影到m维特征空间中,然后根据欧氏距离,通过求出训练图像
47、与测试图像特征点的距离来分类。最后确定类别。4.3 ORL人脸库实验分析本文在进行人脸识别实验所采用的ORL人脸数据库,该数据库是剑桥大学贝尔实验室在1994年制作的,用于测试人脸识别算法的人脸图像数据库。该数据库包括40个人在不同时间拍摄的每人10幅图像,共400幅256灰度级的图像,大小为92 x 112.ORL数据库中的人脸图像的背景光线有一定变化,人脸的表情也不一样(包括睁眼和闭眼,微笑和不笑),一些人还有戴眼镜和不戴眼镜时的图像。图4.2为ORL中的一部分人脸图像:图4.2 orl人脸库4.3.1实验1:算法的比较在本实验中,将对PCA,Gabor+PCA人脸识别算法进行比较。为了能
48、进行比较,本文将选择相同的训练样本和测试样本,将1,3,5,6,8五幅作为作为训练样本,而把剩余的五幅人脸图像作为测试样本,并且在测试样本和训练样本之间不存在重叠,在试验中,在没对图像作任何处理前,先把图像缩小为30*24。并取不同的主元数目进行试验,结果如图43所示:图43 pca及gaborpca算法比较坐标图其中上图实线表示的是gabor+pca,虚线表示的是pca。由图可知,gabor+pca算法的识别率一般比pca算法好,gabor小波变换能很好地表征人脸特征。并且还可以看出,随着主元数目的增加,识别率一开始升高很快,但到了一定程度,识别率不变,再增加,反而变小了一点,但基本不会再降
49、得很低。因此选择合适的主元数目对提高识别率是很重要的。主元数目一般选在50到80之间,如果大于80,虽然识别率也变化不大,但pca处理的时间却变长很多,不利于人脸识别。4.3.2 实验2:样本数目的选择 在本实验中,将会讨论样本数目对识别率的影响。在试验中,主元数取值为80不变,唯一改变的是训练样本的数目,结果如下图44所示。图44 训练样本数与识别率 由上图可发现,当样本数为280的时候,识别率是最高的,达到96.6。并且训练样本数越少,识别率越低,当训练样本数大于280的时候,识别率也有所下降。4.3.3 实验3:采样因子的确定为了识别人脸,我们自然需要寻找代表人脸的最本质特征。因为经过g
50、abor变换,原始图像和gabor核函数卷积后,维数变为70200*200,数据相当大,必须寻找最能代表人脸的最本质特征,本文将进行下采样处理,采样因子的大小对识别率和PCA处理时间的关系如下表所示。其中训练样本数为5,主元特征数为80。表4-1 采样因子关系采样因子采样后一张图片的特征维数识别率PCA处理时间(s)20351096.6%75.350140496.5%23.177890095.5%6.2010070295%3.1420035194.5%0.422图45 特征维数与PCA处理时间由上表可以看出,采样因子的大小对识别率的影响不大,表明经过变换后,把人脸的最主要特征提取出来了。由图5
51、5可看出,采样后,当每张的图片的维数超过103的时候,PCA处理消耗的时间迅速上升,可见随着图片特征维数的增加PCA消耗的时间增长很快,PCA对数据的处理复杂度是很高的。所以有必要寻找一个识别率比较好,而处理时间很少的采样因子。在本论文中,采样因子改为100是比较适合的。否则,若改变训练样本,人脸识别系统需要很长的时间重新训练。4.4 YALE人脸库实验Yale人脸库(/projects/yalefaces/yalefaces.html)。本数据库是耶鲁大学提供的。库中包括15个人的165幅GIF图像。每人有11幅图像,每幅图像都具有不同的表情和外貌的变化:
52、前向光照、戴眼镜、不戴眼镜、高兴、左侧光照、中性脸、右侧光照、悲哀、假寐、惊奇、眨眼等。图像的大小为320×243,图像示例如图46所示。图46 yale人脸库示例本设计在此数据库中,主要寻求识别率最高时,所取的样本及样本数,本文采取ORL人脸库实验的经验,主元数取为80,为了提高速度而又保障识别率,采样因子取50。经过多次试验,如表52所示:可以看出样本数为120时,识别率比样本数为90和105时高,而且当选取前八幅人脸图像作为训练样本时,识别率是最高的,达到97.7,比orl人脸数据库试验的识别率高。表52 训练样本的选择训练样本测试样本识别率01,03,05,06,08,110
53、2,04,07,09,1077.301,02,03,04,05,0806,07,09,10,1182601,02,03,04,08,09,1005,06,07,1186601,02,03,04,05,08,09,1006,07,1189301,02,03,04,05,06,07,0809,10,119775 小结5.1 总结人脸识别技术(Face Recognition Technology)就是利用计算机分析人脸图像,从中提取有用的识别信息,用来辨认身份的一门技术。由于人的行动和人脸的装饰表情都具有复杂的模式变化,加之存在人脸的图像背景的复杂性,使得人脸的检测成为一个极具挑战的课题,具有很高
54、的学术价值和应用前景。本文主要介绍了静态人脸识别的技术,对其进行了分类总结,同时,详细介绍了其中的关键技术和研究成果。本文综述了静态人脸识别技术国内外研究的现状、以及发展趋势,分析了存在的问题,提出了一些研究思路和技术方案。5.2 展望人类对人脸识别的研究已经有40多年的时间,并取得了相当的成就,但距离实际可用行还有一定的距离,存在的问题也不少。从目前的研究成果来看,成功的人脸识别至少需要考虑以下几个方面: (1)人脸是具有一定可变形部分的三维固体的表面,目前仍存在争议的是在选用人脸模型时,是用二维表面还是三维模型基哪一个更好点。 (2)由于外部干扰不可避免,预处理的效果将会影响到识别结果,好
55、的人脸模型应能够在识别的同时,抑制分离外在干扰的影响。 (3)对于表达人脸的各种特征需要进行比较和选择,以找出人脸最活跃的特征。这可以通过如下两种途径:一是比较同一个人的多张图片,以得到稳定的特征;另一种方法就是比较不同人的图片,以得出该人最“与众不同”之处。 (4)人脸识别是人类视觉的独特过程,因此人脸识别必须结合生理学和心理学的研究成果。致谢语在论文完成之际,我的心情无法平静,从选题、资料收集到论文的撰写整个过程中,老师、同学、朋友给了我热情的帮助,在这里请接受我诚挚的谢意! 我首先要感谢周锦荣老师,在选题以及实验过程中给予我指导。周老师多次询问实验进程,并为我指点迷津,帮助我开拓思路。周老师花费很多的精力一遍又一遍指出每稿中的具体问题,严格把关,在此我表示衷心的感谢。同时,我还要感谢在我大学四年悉心教导我,给予我极大关心和支持的各位老师,是你们教会了我很多有用的知识,特别是教会了我思考问题、解决问题的方式。在此,我想向所有关心我的老师以及同学表示最诚挚的谢意。最后,感谢各位评审老师在百忙之中抽出时间对论文进行审稿、参加答辩,并对参加答辩会的老师、同学表示谢意。参考文献1 Chellappa R, W ilson C L, Sirohey S Human and
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年纺织品检验员知识体系试题及答案
- 2024年设计师考试创业方向试题及答案
- 大话2殿试题目及答案
- 2024年纺织品国际市场分析试题及答案
- 助理广告师考试中对广告效果评估的系统性分析研究试题及答案
- 2024年纺织工程师考试的多元视角与试题及答案
- 守护宠物测试题及答案
- 广告市场调研基础知识 试题及答案
- 助理广告师考试技巧和试题及答案分享
- 2024年纺织工程师最易考的知识试题及答案
- 中国网络广告行业十四五发展分析及投资前景与战略规划研究报告2025-2028版
- 2024-2025学年福建省泉州市晋江市安海中学等五校七年级(下)期中数学试卷
- 2025-2030中国建筑智能化工程行业市场发展分析及发展趋势前景研究报告
- 2024年北京邮电大学招聘真题
- 2025-2030有机肥料产业市场深度调研及发展趋势与投资前景研究报告
- 2025-2030创新药CRO行业竞争态势及未来投资趋势预测研究报告
- 北京市通州区马驹桥镇招考笔试真题2024
- 2024年高考数学真题(北京卷)试题试卷原卷答案解析
- 2025年安全生产月主题培训课件:如何查找身边安全隐患
- 2025年高考历史答题技巧与答题模板专题08影响、作用类(答题模版)(学生版+解析)
- 韵达加盟合同协议
评论
0/150
提交评论