电子信息工程-人脸图像频域频域特征提取的设计与实现_第1页
电子信息工程-人脸图像频域频域特征提取的设计与实现_第2页
电子信息工程-人脸图像频域频域特征提取的设计与实现_第3页
电子信息工程-人脸图像频域频域特征提取的设计与实现_第4页
电子信息工程-人脸图像频域频域特征提取的设计与实现_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGEIV人脸图像频域频域特征提取的设计与实现摘要:人脸识别技术是计算机应用技术的一个重要内容,是模式识别、人工智能的重点研究课题之一。人脸识别困难主要在于一个人丰富的表达,同时随着年龄的增长,全脸会发生一些变化,在头发、眼镜及配件,在树荫下不同角度的光,将使一些特性增强了不同程度和海水淡化,给人脸识别的难度带来了挑战。基于此,本文基于主成分分析法,按照完整人脸识别流程来分析人脸识别。首先使用常用的方法获取人脸图像。为了更好的分析人脸识别系统的性能,本文选用了Essex人脸数据库。然后阐述了人脸图像预处理方法。由于Essex人脸图像质量较好,而且已经做过相应的预处理,所以本文试验中只使用灰度处理。然后利用主成分分析提取人脸特征,利用奇异值分解定理计算协方差矩阵的特征值和特征向量,利用最近邻分类器欧氏距离对人脸进行分类。研究得出,基于主成分分析法的人脸识别系统的识别率较高,而且具有一定鲁棒性。关键词:主成分分析算法;MATLAB;人脸识别

Abstract:Facerecognitiontechnologyisanimportantpartofcomputerapplicationtechnology,andisoneofthekeyresearchtopicsinpatternrecognitionandartificialintelligence.Themaindifficultyoffacerecognitionliesintherichexpressionofhumanexpression.Withtheincreaseofage,thewholesituationofthefacewillchange.Undertheshadeofhair,glassesandsomeornamentsanddifferentangles,somefeatureswillbestrengthenedanddesalinatedtodifferentdegrees,andthedifficultyoffacerecognitionwillbegiven.There'sagreatchallenge.Basedonthis,thispaperanalyzesthefacerecognitionbasedontheprincipalcomponentanalysisandthecompletefacerecognitionprocess.Firstofall,thecommonmethodisusedtogetthefaceimage.Inordertobetteranalyzetheperformanceoffacerecognitionsystem,thispaperselectsEssexfacedatabase.Thenthefaceimagepreprocessingmethodisdescribed.BecauseofthegoodqualityofEssexfaceimagesandthecorrespondingpretreatment,thegrayscaleprocessingisusedinthispaper.Thefacefeaturesareextractedbyprincipalcomponentanalysis,andtheeigenvaluesandeigenvectorsofthecovariancematrixarecalculatedbythesingularvaluedecompositiontheorem,andtheEuclideandistanceofthenearestneighborclassifierisusedtoclassifythefacediscriminant.Theresearchshowsthatthefacerecognitionsystembasedonprincipalcomponentanalysishashigherrecognitionrateandrobustness.Keywords:principalcomponentanalysisalgorithm;MATLAB;facerecognition

目录第一章前言 11.1研究背景 11.2研究意义 11.3国内外研究现状 1第二章相关概述 22.1人脸识别 22.2主成分分析法理论 22.2.1主成分分析法 22.2.2总体主成分 22.2.3样本主成分 32.3主成分分析法过程 32.3.1基变换 32.3.2方差 42.3.3主成分分析法求解 52.4人脸特征提取方法 62.4.1Gabor特征提取 62.4.2Gist全局特征提取 7第三章人脸图像频域特征提取的原理与方法 83.1灰度变化 83.2二值化 83.3图像滤波 93.3.1均值滤波器 93.3.2高斯平滑滤波器 93.3.3中值滤波器 93.3.4边缘保持滤波器 103.4图像锐化 103.5图像归一化 113.6人脸特征类型及评价指标 113.6.1人脸特征类型 113.6.2评价指标 12第四章人脸图像的设计与实现 144.1人脸识别算法方案 144.2创建数据库 144.3计算特征脸 154.3.1对图像矩阵T进行规范化 154.3.2计算特征脸 154.4人脸识别 164.4.1训练阶段 164.4.2测试阶段 16第五章结束语 18参考文献 19致谢 20PAGE19第一章前言1.1研究背景人脸识别近年来发展迅速,一些实用的系统和专用设备已经在一定程度上商业化并装备到日常生活中。随着互联网,特别是移动互联网的发展,以信息爆炸为特征的大数据时代来临,这对公安机关既是挑战,也是机遇。现阶段,第二代证书在中国的普及,使中国超过12亿人的身份信息拥有了数码照片数据。在平安,数百万个连接互联网的监控摄像头每天也会产生大量的数据信息。各种迹象表明,公安已经步入大数据应用时代。越来越多的公安科技部门发现,在新的大数据形式的基础上,一些传统技术瓶颈正在逐渐显现,响应速度越来越慢,一些应用场景已经完全无法支持。公安大数据应用背景给人脸识别应用带来了机遇,同时也给人脸识别技术提出了更高的要求。虽然人脸识别技术性能已有较大提高,但它仍是在模式识别和计算机视觉等领域最困难的问题之一。如何利用人脸识别技术将这些海量照片数据利用起来,提升整个公安信息化的管理水平,已经是摆在我们面前的一个重要问题。1.2研究意义传统的人身辨别方法主要是通过人身标识物品和人身标识知识两种方式来实现的。常见的人身标示物有钥匙、证件等,人身标示知识有用户名、密码等。众所周知、钥匙、证书和其他标志很容易丢失或伪造,但知识是容易忘记或记住,更严重的问题是,传统的识别系统无法识别物品的识别真正的所有者和区分模仿者,一旦别人所确定的项目,有同样的权利。即使这两种方法相结合,这类问题仍然难以解决。尽管这台ATM机使用银行卡和用户密码,但钱还是被偷了。因此,传统的识别方法已经不能满足当今社会发展的需要。而生物特征识别技术为身份辨别提供了一个高科技含量的方法,它包括身体特征和行为特征两个部分。其中身体特征包括面部特征、指纹、手形、基因、身体气味等。1.3国内外研究现状20世纪80年代,中国就已经开始进行人脸识别研究,主要研究机构有清华大学、哈尔滨工业大学、中国科学院、复旦大学、北京科技大学等。他们都取得了一定的成绩。国内的研究工作主要是集中在三大类方法的研究:基于几何特征的、基于代数特征的和基于连接机制的人脸正面自动识别方法。周激流建立并实现了具有反馈的人脸正面识别系统,运用积分投影法提取面部特征的关键点并用于识别,获得了良好的效果。张辉、周鸿祥和何振亚利用对称分析神经网络,通过消除冗余并结合权值交集来提取和识别人脸特征。该方法所用特征数据量与特征提取运算量都比较小,很好地实现了大量样本的存储和快速识别。

第二章相关概述2.1人脸识别人脸识别技术是一门跨图像处理、模式识别等学科的多学科技术。利用计算机对人脸图像进行处理和分析,可以获得有效的特征信息,进行身份识别。相比其它生物识别技术,人脸识别具有采集的非接触性、非强制性、操作简单、结果直观、隐蔽性好等特点,更为人们所接受。在过去几年里,人脸识别技术取得了长足发展,出现了大量的人脸识别算法和产品,美国NIST举办的FRVT2006(FaceRecognitionVendorTest2006)、MBGC(MultipleBiometricGrandChallenge)公安部首个研究机构实施的大规模人脸识别测试显示,人脸识别技术的精准度大幅提高,可以满足一些实用应用的要求。2.2主成分分析法理论2.2.1主成分分析法主成分分析,又称主成分分析,是利用降维的思想将多个指标转化为几个综合指标(即主成分)。每一个主成分都能反映原变量的大部分信息,并且所包含的信息不会重复。这种方法在引进多方面变量的同时将复杂因素归结为几个主成分,使问题简单化,同时得到的结果更加科学有效的数据信息。在实际问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。各变量在一定程度上反映了研究问题的信息,各种指标之间有一定程度的相关性,因此在取得的统计数据中反映的信息会有一定程度的重复。主要方法有特征值分解,SVD,NMF等。2.2.2总体主成分(1)总体主成分定义及其算法通过介绍我们可以知道,前面的主成分上的代数是个随机变量线性组合的特殊,和选择上的几何线性组合代表一个新的坐标系统,它是为旋转轴的原始坐标系统旋转后得到。新的坐标表示数据在最大方向上的可变性,并提供了一个相对简单但更简洁的协方差结构。设随机变量有协方差矩阵,其特征值.考虑线性组合,(2.1)…则有,(2.2).(2.3)主成分是那些不相关的线性组合,它们能使在式(2.2)中的方差尽可能地大。第一主成分是有最大方差的线性组合,也即它使最大化。显然,会因为任何乘以某个常数而增大。为消除这种不确定性,一个方便的办法是只关注有单位长度的系数向量。我们因此定义第一个主成分,其中,且及最大;第二个主成分,其中,且及,同时次大;2.2.3样本主成分(1)样本主成分定义及其算法前面讨论的是总体主成分,但在实际问题中,一般(或)是未知的,需要通过样本来估计。设数据为从均值向量为,协方差矩阵为的某个维总体中个独立的抽样.这些数据得到样本均值向量,样本协方差阵,以及样本相关阵.其目的是构造所测得的特征的不相关线性组合,而这些特征说明了大多数样本方差.有最大方差的不相关线性组合,可称为样本主成分.回忆任意线性组合的个值,有样本均值和样本方差.对两个线性组合的数值对,也有样本协方差.样本主成分被定义为使样本方差最大的那些线性组合.与对总体量所做的一样,我们限制系数向量满足.2.3主成分分析法过程2.3.1基变换从线形代数的角度来看,主成分分析法的目标就是使用另一组基去重新描述得到的数据空间。而新的基要能尽量揭示原有的数据间的关系。在这个例子中,沿着某x轴上的运动是最重要的。这个维度即最重要的“主元”。主成分分析法的目标就是找到这样的“主元”,最大程度的去除冗余和噪音的干扰。(1)标准正交基为了便于推导,上面的例子的数据定义如下:在实验过程中,在每个采样时间点,每个相机记录一组二维坐标(x,y),在每个时间点和位置数据获得通过整合三个摄像头的数据对应一个六维列向量。如果以200Hz的频率拍摄10分钟,将得到10*60*200=120000个这样的向量数据。抽象一点来说,每一个采样点数据都是在m维向量空间(此例m=6)内的一个向量,这里的m是涉及到的变量个数。由线形代数知识可以知道,在m维向量空间中的每一个向量都是一组正交基的线形组合。最普通的一组正交基是标准正交基,实验采样的结果通常可以看作是在标准正交基下表示的。举例来说,上例中每个摄像机记录的数据坐标为(x,y),这样的基便是[(1,0),(0,1)]。那为什么不取或是其他任意的基呢?原因是,这样的标准正交基反映了数据的采集方式。假设采集数据点是(2,2),一般并不会记录。(在基下),因为一般的观测者都是习惯于取摄像机的屏幕坐标,即向上和向右的方向作为观测的基准。也就是说,标准正交基表现了数据观测的一般方式。在线形代数中,这组基表示为行列向量线形无关的单位矩阵。 (2.4)(2)基变换在更严格的数学定义中,主要成分分析回答了找出正交基的另一组正交基的方法,该正交基是正交数据集的线性组合。在主成分分析法方法中有一个很关键的假设:线性。这是一个很好的假设,它在很大程度上简化了问题。具体地说,数据被限制在一个向量空间中,可以用一组基来表示,并隐含地假定了数据之间的连续性关系。这样一来数据就可以被表示为各种基的线性组合。令X表示原数据集。X是一个m*n的矩阵,它的每一个列向量都表示一个时间采样点上的数据,在上面的例子中,m=6,n=120000。Y表示转换以后的新的数据集表示。P是他们之间的线性转换。它们间的转换关系为 (2.5)有如下定义:pi表示P的行向量。xi表示X的列向量。yi表示Y的列向量。上式(3)在线性代数中,它有如下的含义:P是X到y的变换矩阵。几何上,P旋转并拉伸X得到y。P的行向量,(p1,p2,…,pm)为新基,Y为新基下原始数据X的新表示。2.3.2方差“最好”是什么意思?给出了一个更直观的解释,但附加了一些假设。在线性系统中,所谓的“混沌数据”通常由三部分组成:噪声、旋转和冗余。(1)噪音和旋转噪音对数据的影响是巨大的,如果不能对噪音进行区分,就不可能抽取到数据中有用的信息。噪音的衡量有多种方式,最常见的定义是信噪比SNR(signal-to-noiseratio),或是方差比。比较大的信噪比表示数据的准确度高,而信噪比低则说明数据中的噪音成分比较多。那么怎样区分什么是信号,什么是噪音呢?这里假设,变换较大的信息被认为是信号,变换较小的则是噪音。事实上,这个假设等价于一个低通的滤波器,是一种标准的除噪准则。(3)协方差矩阵协方差矩阵包含了所有观测变量之间的相关性度量。更重要的是,根据前两部分的说明,这些相关性度量反映了数据的噪音和冗余的程度。在对角线上的元素越大,表明信号越强,变量的重要性越高;元素越小则表明可能是存在的噪音或是次要变量。在非对角线上的元素大小则对应于相关观测变量对之间冗余程度的大小。一般情况下,初始数据的协方差矩阵总是不太好的,表现为信噪比不高且变量间相关度大。主成分分析法的目标就是通过基变换对协方差矩阵进行优化,找到相关“主元”。那么,如何进行优化?矩阵的那些性质是需要注意的呢?(4)协防差矩阵的对角化总结上面的部分可以发现主元分析以及协方差矩阵优化的原则是:1)最小化变量冗余即对应于协方差矩阵的非对角元素要尽量小;2)最大化信号即对应于要使协方差矩阵的对角线上的元素尽可能的大。因为协方差矩阵的每一项都是正值,最小值为0,所以优化的目标矩阵CY的非对角元素应该都是0,对应于冗余最小。所以优化的目标矩阵CY应该是一个对角阵。即只有对角线上的元素可能是非零值。同时,主成分分析假设P对应的一组变换基一定是正交的,优化矩阵CY对角线上的元素越大,则信号分量越大,即主元越重要。有很多方法可以对角化协方差矩阵。根据上述分析,最简单、最直接的算法是在多维空间中进行搜索。与图4.2(a)中的旋转方法相似:①在m维空间中进行遍历,找到一个方差最大的向量,令作p1。②在与p1垂直的向量空间中进行遍历,找出次大的方差对应的向量记作p2③对以上过程循环,直到找出全部m的向量。它们生成的顺序也就是“主元”的排序。这个理论上成立的算法说明了主成分分析法的主要思想和过程。在这中间,牵涉到两个重要的特性:1)转换基是一组标准正交基。这给主成分分析法的求解带来了很大的好处,它可以运用线性代数的相关理论进行快速有效的分解。这些方法将在后面提到。2)在主成分分析过程中,同时可以得到与新基向量对应的“主元排序”。2.3.3主成分分析法求解在线形代数中,主成分分析法问题可以描述成以下形式:寻找一组正交基组成的矩阵P,有Y=PX,使得是对角阵。则P的行向量(也就是一组正交基),就是数据X的主元向量。对进行推导:(2.67)(2.7)定义,则A是一个对称阵。对A进行对角化求取特征向量得:(2.8)则D是一个对角阵而E则是对称阵A的特征向量排成的矩阵。这里要提出的一点是,A是一个m*m的矩阵,而它将有p(p<=m)个特征向量。其中p是矩阵A的的秩。如果p<=m,则A即为退化阵。此时分解出的特征向量不能覆盖整个m空间。此时只需要在保证基的正交性的前提下,在剩余的空间中任意取得m-p维正交向量填充E的空格即可。它们将不对结果造成影响。因为此时对应于这些特征向量的特征值,也就是方差值为零求出特征向量矩阵后我们取,则,由线形代数知识可知矩阵P有性质,从而进行如下计算:(2.9)(2.10)可知此时的P就是我们需要求得变换基。至此我们可以得到主成分分析法的结果:X的主元即是的特征向量也就是矩阵P的行向量。矩阵对角线上第i个元素是数据X在方向的方差。我们可以得到主成分分析法求解的一般步骤:①采集数据形成m*n的矩阵。m为观测变量个数,n为采样点个数。②在每个观测变量(矩阵行向量)上减去该观测变量的平均值得到矩阵X。③对进行特征分解,求取特征向量以及所对应的特征根。2.4人脸特征提取方法2.4.1Gabor特征提取与其他特征提取方法相比,由于Gabor变换提取的特征更加显著,所以在图像处理和计算机视觉中被广泛应用。首先,Gabor变换可以增强图像的边缘特征,而边缘特征对光照的变化是不变的。同时,当图像旋转和变形到一定程度时,仍能保持良好的分辨率效果。除此之外,Gabor小波变换类似于人类视觉神经系统对外界的非均匀感知过程,能够很好的提取目标的局部空间特征和频域信息。在人脸识别领域里,Gabor特征之所以被广泛应用,不仅在于它对光照和姿态具有鲁棒性,而且它还可以使人脸图像的一些关键部位的特征得到强化,更有有利于人脸图像的识别和分类。Gabor变换是短时傅里叶变换的窗函数采用高斯函数时的一种特殊形式,它的本质就是对图像的卷积运算,二维Gabor滤波器的函数形式如下:(1)上式中σ为常数,z表示图像矩阵中元素的坐标值,,,,Gabor滤波器的波长由v来决定,k表示滤波器函数的总方向,u的大小决定了Gabor核函数的方向,高斯窗函数的窗口大小由决定。在提取Gabor特征之前,首先要用待处理的人脸图像与一组Gabor滤波器进行卷积运算,得到待处理的图像,图像处理前后大小是一致的。其中Gabor滤波器组的选择通常采用多个不同方向和尺度的Gabor滤波器两两进行组合,再根据待处理图像的特点来决定参数。一般的情况是选取八个方向和五个尺度的Gabor滤波器组。假如一副人脸图像的函数表达式为,经过Gabor滤波器组滤波后的公式如下:(2)幅值特征和相位特征分别如下式:(3)(4)为处理后得到的Gabor特征图像。本文在ORL人脸库上,对每一副人脸图像提取的是二个尺度五个方向的Gabor特征,总共10张Gabor特征图像。在FERET人脸库上,对每一副人脸图像提取的是三个尺度七个方向的Gabor特征,总共21张Gabor特征图像。然后以此为基础提取这些Gabor特征图像的gist特征。2.4.2Gist全局特征提取Gist特征与Gabor特征原则上相似。它们都模拟了人类视觉系统提取图像信息,并利用多尺度、多方向的Gabor滤波器组对目标图像进行处理。但是,在默认情况下,Gist特征采用4个尺度和8个方向的Gabor滤波器组[13]来提取图像的全局特征。Gist算法不直接使用Gabor滤波器组对整个人脸图像进行处理,而是先将图像分割成块,提取每个块的符号,然后将每个块的Gist特征结合起来。Gist特征具体提取步骤如下:将一张大小为的图像划分为个小的分块,每个分块大小相等,大小为,其中,。每个小块由一组包含32个Gabor滤波器的滤波器组处理,处理后的特征组合成小块的特征,称为块Gist特征。公式如下:(5)的维数是维,i=[1,2,332]。把经各滤波器处理后的特征值取平均,再将平均以后的特征值组合成一个行向量,串联起来,得到最终的Gist特征。(6)上述公式中,的特征维数是。本文选则把图像分为16个小块,就是说从每张图像提取到的Gist特征向量总共有32×16=512维,在ORL人脸数据库中,每张人脸图像共提取10个Gaborfeaturemap,从这10张特征图像中提取Gist特征,从一张人脸图像样本中共提取5120个特征向量。对于FERET人脸库的每一副人脸图像总共提取了21张Gabor特征图,则总共可以得到一个10752维的特征向量。接下来就是对得到的特征向量进行降维处理。

第三章人脸图像频域特征提取的原理与方法3.1灰度变化人脸识别的研究常以灰度图像为处理对象。因为彩色图像的颜色信息常常受到复杂背景的影响。利用彩色图像进行人脸识别存在较多缺陷,而灰度图像为一种最简单有效的对比增强方法。彩色图像由红、绿、蓝三原色组成。灰度图像只包含亮度信息,灰度图像的亮度不断变化。因此,灰度图像需要对亮度值进行量化,亮度值为0-255,共256级。0为全黑,255为全亮。常用的经验公式为gray=0.39*R+0.5*G+0.11*B.常用变换的方法如下:线性变换:假设图像为灰度变化范围为,变换后的图像为灰度变化范围为,则它们之间关系为 (3.1)分段线性变换:假设图像为灰度变化范围为,变换后的图像为,目标的灰度变化范围为,想使灰度变化到,则对应关系为 (3.2)非线性变换:使用非线性函数作为映射函数如对数函数,进行灰度变换。对数变换和指数变换分别为 (3.3) (3.4)其中a,b,c用来调整曲线的位置和形状。指数变换能对图像的高灰度区以较大的拉伸。对数变换可以使图像低灰度区有较大拉伸而高灰度区进行压缩。对数变换可以使图像灰度分布相匹配于人的视觉特性。3.2二值化二值化是通过选取适当的阀值将灰度图像的灰度值从0到255变换为只有0和255的黑白图像。在人脸识别中二值化用来把人的头发,眼睛,脸的轮廓及背影与人脸的亮域分开。在图像二值化过程中选择合适的阀值非常重要。常用的图像二值化选择方法如下:全局阈值法:二值化中只使用一个全局阈值t。设图像为,灰度范围为,t为和在与之间选择合适的灰度值,转换后的图像为,则转换关系为 (3.5)局部阀值法:它是根据当前像素的灰度值和此像素周围点局部灰度特征值来共同决定阀值。动态阀值法:它的阀值不仅和该像素和周围像素有关,还和该像素的坐标位置有关。整体阀值法适合图像质量比较好的情况,此时图像在直方图一般有两个峰值。局部阀值法可以处理比较复杂的情况,但有些情况会发生失真。动态阀值法适应性和性能都比较好,实际中对于人脸识别常采用此法进行二值化。3.3图像滤波现在消除噪声的方法有全局处理和局部算子两类。全局处理类的方法需要了解信号和噪声的统计模型。人脸图像预处理经常使用后一类方法。常用的有均值滤波器,高斯平滑滤波器,中值滤波器和边缘保持滤波器。3.3.1均值滤波器均值滤波是信号的局部均值,均值表示像素和像素的灰度值,即将每个像素值替换为其局部邻域内所有值的均值: (3.6)其中,M是邻域内像素点总数。领域N的大小控制着滤波程度,对应大卷积模板的大尺度邻域会加大滤波程度。作为去除噪声的代价,大尺度滤波器会导致图像细节的损失。在设计线性平滑滤波器时,选择滤波权值使得滤波器只有一个峰值,称之为主瓣,并且在水平和垂直方向上是对称的。线性平滑滤波器去除了高频成分和图像中的锐化细节。3.3.2高斯平滑滤波器因为高斯函数的傅立叶变换仍然是高斯变换,所以高斯函数能够在频域中形成光滑性能的低通滤波器,对于根据正态分布的噪声消除非常有效。一维零均值高斯函数为: (3.7)高斯分布参数确定高斯滤波器的宽度。在图像处理中,二维的零平均离散高斯函数经常被用作平滑滤波器。二维零均值离散高斯函数为: (3.8)一般而言,一幅图像的边缘方向是事先无法知道的,因此,在滤波前是无法确定一个方向是否比另一个方向需要更多的平滑。二维高斯函数有旋转对称性。也就是说,过滤器的平滑度在所有方向上都相同。也就是说,高斯平滑滤波器在之后的边缘检测中不会向任何方向偏移。高斯函数是一个单值函数。这说明高斯滤波器用像素邻域的加权平均值代替像素点的像素值,每个像素邻域的权值随着点到中心点的距离单调减小。高斯函数的傅里叶变换的频谱是单瓣的。这就意味着平滑图像不会被不需要的高频信号所污染,同时保留了大部分所需信号。高斯滤波器宽度决定着平滑程度,是由表征的。越大,高斯滤波器的频带就越宽,平滑度就越好。通过调节,可在图像特征过分模糊(过平滑)与平滑图像中过多突变量(欠平滑)间取得折中。高斯函数的可分理性,使得高斯滤波器可以有效地实现。二维高斯函数卷积可以分两步进行,首先将图像与一维高斯函数进行卷积,然后将卷积结果与方向垂直的相同一维高斯函数进行卷积。因此,二维高斯滤波器的计算量随着滤波模板宽度线性增长而不是平方增长。3.3.3中值滤波器中值滤波是一种非线性滤波方法。它在平滑脉冲噪声方面非常有效,同时它可以保护像素尖锐的边缘。它用像素点邻域灰度值的中值来代替该像素点的灰度值。该方法不仅可以去除脉冲噪声和椒盐噪声,而且可以保留图像的边缘细节。中值滤波器在处理连续图像窗函数时与线性滤波器的工作方式类似,但滤波过程不再是加权运算。例如,当4*4的窗口函数,计算窗口的像素值中值函数以点(I,j),首先安排显示像素强度值,然后选择排序的中间值像素点的设置为新值(I,j)。在一定条件下,中值滤波可以克服线性滤波引起的图像细节模糊,是消除脉冲干扰最有效的方法。然而,中值滤波不适用于一些细节较多的图像,特别是那些细节较多的图像,如线条和锐点。3.3.4边缘保持滤波器均值滤波的平滑功能会使图像边缘模糊,而中值滤波在去除脉冲噪声的同时也将图像中的细条细节滤除掉。边缘保持滤波器结合两者的优点,在滤除噪声脉冲的同时,也不会使图像的边缘十分模糊。边缘算法保持基本过程是:每个像素点的灰度图像(I,j)附近的适当的大小,(I,j)分别计算,和左上角的街区,街区,左下角附近和V的右下角附近灰度分布均匀,然后以平均最低均匀度对应的区域为新的像素灰度值。计算灰度均匀度V可通过下式: (3.9)或 (3.10)线性平滑滤波器去除高斯噪声的效果很好,且在大多数情况下,对其他类型的噪声也有很好的去除效果。基于像素加权运算的滤波器属于线性滤波器,均值滤波器和高斯滤波器属于线性滤波器,中值滤波器属于非线性滤波器。3.4图像锐化图像锐化用于解决图像提取,图像传输及相关处理过程受到某些因素影响而变得模糊。图像模糊是图像遭受了平均或积分运算造成,可以通过对图像进行逆运算来使图像变得清晰。但是图像锐化存在一个前提条件,图像必须要有较高的信噪比,否则会造成信噪比更低,图像噪声增加比图像信号更多。在实际中,一般先滤除噪声后在进行图像锐化处理。常用的图像锐化方法为拉普拉斯锐化。假设拉普拉斯算子为即离散数字图像为,其一阶偏导数为 (3.11),则其二阶偏导数为 (3.12)所以 (3.13)对于由膨胀引起的人脸图像模糊,可以通过进行图像锐化,其中k为膨胀效应的相关系数。K值的选择要合理。如果k太大,图像的轮廓边缘会超调。如果k太小,锐化效果就不明显。图像归一化包括灰度归一化和几何归一化。灰度归一化是为了使不同灰度值的图像具有统一灰度。这样做的目的是减弱光照变化对灰度变化而导致人脸识别率降低。具体操作为: (3.14)其中和分别为理想的均值和方差,一般,,M和VAR为输入人脸图像实际的均值和方差。几何归一化主要的内容有大小矫正,平移,旋转和翻转。大小矫正是为了把原始图像的人脸校正到统一的大小,常常依据人脸的坐标。平移是为了消除人脸左右偏移对人脸识别的影响。旋转是为了使两眼保持在水平位置。翻转是为了使目标图像中的人脸保持在正面位置。常用校正法有直接几何校正法和间接结合校正法。直接几何校正从畸变图像数组开始,按照行列的顺序,通过(3.15)其中为直接校正变换函数。但是,仍然需要将原始像素的灰度值在变换后赋值到相应的像素点,也需要将离散的灰度值的不规则数组重新采样到灰度值的规则数组中。间接几何校正从空白校正图像阵列出发,根据直线和直线序列,将每个校正像素在畸变图像坐标系中的位置进行反演。变换式为 (3.16)其中为间接变换函数。将通过上述公式得到的畸变图像位置的灰度值加回空白校正图像格点的对应位置,通过灰度值插值确定(x,y)位置的灰度值。3.6人脸特征类型及评价指标原始人脸图像维数非常高,能达到上万维,识别率和分类时间必定会因高维信息而倍受影响,因此,需要在分类识别之前对原始图像信息进行有效的提取。同时要求这些特征对于同一个体是稳定的,而对于不同的个体又是具有鉴别性的。本节就一些特征类型来对人脸识别中的特征提取方法及评价值指标进行介绍。3.6.1人脸特征类型(1)几何特征人脸的几何特征主要是指人脸的五官及人脸五官之间所形成的几何关系信息。此信息可作为识别人脸的重要特征信息,在早期的人脸识别阶段,由于此方法实现简单,特征维数低,运行速度快的优点得到了一定的应用,但由于面部几何信息尤其是五官特征之间的结构信息极易受外部光照、配准、遮挡等因素的干扰,因此适应性较差,且特征提取精度较小,目前常作为其余方法的补充或和其余方法相结合使用。(2)形状、纹理特征人脸的轮廓五官信息中包含了许多对我们识别不同人脸特征信息,这些信息使得我们人类很容易用肉眼即可区分不同的个体,且这些表示特征对外部光照、配准、遮挡等因素的影响不敏感,具有较高鲁棒性,但会丢失许多人脸图像的内部固有信息;人脸面部纹理信息是由于灰度值不同所形成的明暗信息,对于肉眼而言,这些深浅相间的纹理信息可用来区分不同的人脸。目前,针对形状和纹理特征的优缺点,常将人脸面部形状与纹理信息相结合来构造高差异性的人脸特征信息。(3)全局统计特征人脸的全局统计特征是使用相关距离来表示人脸,例如自相关函数,协相关函数,概率密度函数,分布函数和其他函数。这种表示方法对外部影响因素具有很高的鲁棒性,但是此种方法会降低影响最终分类的类间散度距离,因此判别性较差,且对于图像的特征空间维数较敏感,当人脸图像的维数较高时,计算复杂度随之提升,给后续的研究带来计算上的众多不便。(4)代数特征人脸图像的代数特征是指反映人脸图像空间分布的固有属性。在人脸特征提取过程中将人脸图像看作一个整体特征域,其中最关键的步骤是如何提取出具有鉴别性的特征,目前对于提取出具有鉴别性的特征的经典方法主要有基于主成分分析法(PCA)和基于Fisher准则的判别分析法(LDA)。其中PCA方法属于无监督判别法,LDA方法数据监督判别方法,此后对于这两种方法学者们提出了许多改进方法,最具代表性的,是一种基于内核特征的非线性教师认知方法,能从脸部图像的高阶元信息中取得内部非线性图像的特征信息。这是一个里程碑的特征提取方法。由于原始空间的人脸信息极易受外界因素的影响,因此,许多人脸特征信息的提取都是提取人脸图像的变换域特征来代替原始特征。其基本思想首先将人脸图像变换到某一变换域,再在此变换域中进行人脸特征信息的提取。将图像的空间区域转换到变换区域空间,提取图像的内部信息,排除外部因素的影响,在许多情况下,组合代数特征能够实现良好的认识。常用的变换方法有包括基于全局频域变换方法和基于局部频域变换方法。全局方法是将变换后的频域系数表示图像特征,局部频域变换方法中运用人脸图像与不同尺度与方向的Gabor变换卷积进行人脸特征提取的方法研究较为成熟,此外还有Contourlet变换和Shearlet变换等。总体而言,上述五大特征对于人脸识别的效果而言各有利弊,针对不同的实际问题,目前考虑运用不同的特征提取方法。3.6.2评价指标这个功能从脸部识别过程中最基本的目的开始,是脸部识别过程中最有效、高度差别化的有利功能。这是人脸识别过程中必须面对的问题。当所提取特征具有以下一种或几种特点时,我们则认为此种特征提取方法是优秀的、可运用的特征提取方法。(1)此方法所提取的人脸特征是否较全面详细的表示人脸图像。例如,我们所运用的特征提取方法是否既能详细描述人脸的局部信息又能很好的描述人脸的整体轮廓信息。如果可以,则我们认为此种特征提取办法是较好的。(2)此方法所提取的人脸特征是否能很好地表示人脸内部包含的信息,又能很好地屏蔽外部信息,如光照、表情变化、噪声、事物遮挡等。如果可以,则我们认为此种特征提取办法是较好的。(3)所提取的面部特征是否能使面部图像在班级内的发散距离和班级之间的最大发散距离最小化,有可能更好地区分不同类别。(4)此方法所提取的人脸特征是否维数尽可能小,计算复杂度是否尽可能低,从而降低整个人脸识别过程的计算复杂度,如果可以,则我们认为此种特征提取办法是较好的。目前,现有的人脸特征提取方法还不能全面兼顾以上所有指标,一般某种特征提取方法只能在一种或者两到三种指标上效果良好,因此,这也是学者们不断研究、学习,为找到一种高效的人脸特征提取方法而不断努力的动力所在。

第四章人脸图像的设计与实现4.1人脸识别算法方案主成分分析为一种统计学中特征提取方法,在实际中应用的非常广泛。主成分分析是提取原始数据的主要元素,以减少数据的冗余,以便可以在低维空间中处理数据。同时,它可以很好地保留原始数据的大部分信息,并有效地解决了由高空间维度引起的一系列问题。如下将详细介绍如何使用主成分分析法算法进行人脸识别。图4.6基于主成分分析法的人脸识别算法实现原理图4.2创建数据库在本环节中主要分为两个阶段,分别为:1.读入系统人脸数据库,并将图像变换为相应的灰度图像(a)(b)图4.7(a)图像为系统人脸数据库中的原始人脸图像,(b)图像为经过灰度转换后的人脸图像2.同时将变换后的二维人脸灰度图像变换为一维人脸向量矩阵一个大小为M*N的二维人脸图像可以看成长度为MN的人脸图像列向量。对于进入该列的二维人脸图像,我们采取以下措施:首先,计算人脸图像的大小,然后逐行传输人脸图像,最后在一维向量处将所有灰度值形式的大小一列删除对于MN,实际上整个效果阶段都等于图像灰度值,根据该线将其依次转换为三维图像矢量。本环节完成后将会产生由一维图像向量组成的矩阵T。4.3计算特征脸本环节主要包括三个阶段,分别为:4.3.1对图像矩阵T进行规范化首先,计算图像矩阵中的一维列向量的平均值m,然后减去图像矩阵的每一列的平均值,以形成归一化图像矩阵A。(a)(b)图4.8左图为人脸原始图像,右图为人脸规范化后的图像4.3.2计算特征脸人脸训练图像的协方差矩阵为,其中人脸训练样本为,维度为,则协方差矩阵C的维度为。这就出现问题,C的维度过高,在实际中直接计算它的特征值和特征向量非常困难。因此,本文使用奇异值分解定理来解决这个问题。奇异值分解定理:假设B为维秩为p的矩阵,则存在两个正交矩阵和一个对角矩阵:正交矩阵为 (4.23) (4.24)其中 (4.25) (4.26)对角矩阵为则可以得到,而且和有共同的非零特征值,和分别为和对应特征值的正交特征向量。由上述定理可以得到 (4.27)则可以由协方差矩阵,构造出矩阵,从而容易求出L的特征值和特征向量,再根据上述(4-27)式可以求得协方差C的特征值和特征向量。实际上我们并不需要协方差所有的特征值和特征向量,m个(m<M,M为特征值的数目)个特征值足够用于人脸识别。所以,实际操作中,只取L的前m个最大特征值对应的特征向量用于计算特征脸。在本环节,本文通过直接构造,来计算出L的特征值,再挑选L特征值大于100的作为C的特征值,最后通过C的特征值计算出它的特征向量,从而形成特征脸。图4.9特征脸4.4人脸识别人脸识别过程分为训练和测试两个阶段。在训练阶段,主要是提取数据库人脸图像的特征,并形成特征库。在测试阶段,提取所识别的图像的特征,计算所提取的特征与特征库内的特征之间的距离量度,输出对应于最小距离量度的脸部图像。具体步骤如下:4.4.1训练阶段将规范化的图像矩阵A中的每一列向量投影到特征子空间,形成特征库。4.4.2测试阶段eq\o\ac(○,1)假设测试人脸图像为Y,在人脸识别前,先对其进行标准化,即。eq\o\ac(○,2)把标准化后的人脸图像向特征子空间进行投影得到向量。eq\o\ac(○,3)本文使用最近领法分类器欧几里德距离[14,15]进行判决分类。测试图像与每个人脸图像间的距离为(k=1,2,…,P),并将最小距离对应的训练图像作为测试图像的匹配图像。图4.10人脸姿态发生变化下的人脸识别结果图4.11人脸表情变化下的人脸识别结果

第五章结束语本文研究的是基于主成分分析法的人脸识别算法的实现。实验中使用的人脸数据库为Essexfaces94人脸数据库,人脸特征提取算法为主要成分分析算法,分类方法采用最小距离分类方法。通

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论