基于协同表示算法的人脸识别研究_第1页
基于协同表示算法的人脸识别研究_第2页
基于协同表示算法的人脸识别研究_第3页
基于协同表示算法的人脸识别研究_第4页
基于协同表示算法的人脸识别研究_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

题目:基于协同表示算法的人脸识别研究I页第1章绪论1.1课题研究背景及意义随着互联网的发展,身份验证变得越来越重要。在模式识别领域,人脸具有不易接触,易获得等优点,所以人脸识别逐渐变成一种友好的身份验证的方式。然而,如何在一个复杂的环境中快速的识别人脸,其中蕴含着巨大的社会价值。随着发展,许多的基于稀疏表征算法被提出并且运用到人脸识别领域。人脸识别技术在生活中给人们带来了许多的方便,它可以让我们在验证身份时更加的快捷,人脸识别技术已经在安保和金融领域大量运用,不仅给安防行业和金融行业注入了新的科技和技术,也进一步开拓了新的发展市场。作为安防市场未来的发展方向的智能视频分析,其中最重要的技术就是人脸识别。我国的三维测量技术近年来发展形势较好,而现今3D人脸识别算法正对2D投影的缺陷做了补充,此外对于其中的传统难点,包括人脸旋转、遮挡、相似度等在内的都有了很好的应对,这也成为了人脸识别技术的另一个最为重要的发展路线之一。大数据深度学习进一步提升了人脸识别的精确度,这也为2D人脸识别的应用作了一定的突破,将其应用于互联网金融行业当中,能够快速普及金融级应用。在这种背景下,对于人脸识别的研究就成为了一种未来的趋势,未来的生活越来越智能化,所以对人脸识别的研究越深入,便能够在未来的科技发展中抓住机会。目前根据人脸识别的应用途径不同,主要分为以下几个方面:(1)门禁考勤。现在的企业和住宅大多都设置了门禁考核,利用人脸识别的方式来确保安全,或者利用人脸识别来实现企业的自动化管理。(2)信息安全。现在的电子商务或者计算机在它们登陆的时侯,都是利用密码来实现的,然而一旦密码被遗忘或者密码被盗的情况下,用户信息的安全就不能得到保证。但是利用模式识别就能有效的解决这些问题。其中人脸识别利用它的不易接触的特性,就能提高用户信息的安全性与可靠性。(3)消费交易。目前消费的交易方式越来越多,其中支付宝和微信支付越来越流行,所以利用人脸识别能够有效的提高支付的安全性与效率。但是人脸识别也有一些弊端,比如人的面部结构都是相似的,在不同的人之间也有相似的地方,并且在较为复杂的环境下,可能会出现识别效率大大较低,或者识别人脸所需要的时间增加。所以这些都是我们需要解决的问题。1.2国内外的发展状况人脸识别的技术可以追溯到18世纪,但是人脸识别技术有了突破性的进展的时间在二十世纪左右。人脸识别技术的发展主要经历了三个阶段。第一阶段:在二十世纪六十年代,主要研究的是人脸识别在简单环境下所需要的面部特征,用简单的面部特征来描述人脸,但是这种方法只能对面部较小的且没有其他东西遮挡的正面人脸做出描述。直到二十世纪七十年代时,质量较高的人脸灰度图的模型被研究人员利用电脑搭建了,在这个阶段的人脸识别基本上离不开操作人员,对人脸识别的后续发展提供了很好的基础,但是所建的系统还不能自主识别人脸。第二阶段:在这个阶段主要研究的是人机交互式的人脸识别。Lesk和Harmon等人采用几何特征参数及多维特征向量共同识别人脸的信息,并且在这基础之上开发了图像识别系统。Kobayashi和Kaya等人将统计识别的相关理论运用到人脸识别中,而且采用欧氏距离来描述人脸的特征。Stonham提出了一种单影层的自适应神经网络的方法来描述人脸。但是这些方法都需要操作员,所以这些方法并不是很方便。第三阶段:主要研究的是机器的自主识别。随着计算机的发展,计算机的效率与速度变得越来越快,而且在这一阶段图像识别和图像搜集的能力得到了一定的发展,人脸识别在这给阶段有了较大的突破。这个阶段的技术成果能够在不同的复杂环境中,对正面且光照良好的没有遮挡的的人脸进行识别。而且在这一阶段的研究中,研究人员开发出很多的算法,这在一定程度上促进了人脸识别技术的发展。目前,有许多的国家已经开始了对人脸识别的研究,主要包括美国,日本和一些欧洲国家。也有很多著名的机构,比如美国麻省理工大学的人工智能实验室,法国INRIA研究院等等。美国国家标准技术局通过大规模的人脸测试数据表明,目前的人脸识别技术的发展水平已经超过了人类的平均水平,而且对于一些识别度较高的面部,机器的识别度几乎达到了百分之百。在1992年左右,其中麻省理工学院人工智能实验室的布鲁内里(Brunelli)和波基奥(Poggio)做了一个对比实验,他们对比了基于结构特征的方法与基于模板匹配的方法的识别性能。最终给出了一个比较确定的结论:基于特征的方法的结果比模板匹配的方法差。这一导向性的结论在与特征脸法的共同作用下,基本中止了纯粹的基于结构特征的人脸识别方法研究,但是这个方法却在很大程度上促进了基于表观(Appearance-based)的线性子空间建模和基于统计模式识别技术的人脸识别方法的发展,使其逐渐成为主流的人脸识别技术。另一重要成果主要是由贝尔胡米尔(Belhumeur)等提出的Fisherface人脸识别方法。该方法首先采用主成分分析(PrincipalComponentAnalysis,PCA,亦即特征脸)对图像表观特征进行降维。然后在此基础上,采用线性判别分析(LinearDiscriminantAnalysis,LDA)的方法变换降维后的主成分以期获得尽量大的类间散度和尽量小的类内散度。这种新提出的方法产生了很多不同的变种方法,比如零空间法、子空间判别模型、增强判别模型、直接的LDA判别方法以及近期的一些基于核学习的改进策略。但是他们提出的人脸识别方法目前仍然是主流的人脸识别方法之一。在特征脸的基础上,基于双子空间进行贝叶斯概率估计的人脸识别方法被麻省理工学院的马哈丹(Moghaddam)提出了。这个人脸识别方法的基本原理是将两幅人脸图像对的相似度计算问题转换为一个两类(类内差和类间差)分类问题,即先通过“作差法”,把类内差和类间差数据都要首先通过主成分分析(PCA)技术进行降维,然后计算两个类别的类条件概率密度,最后通过贝叶斯决策(最大似然或者最大后验概率)的方法来进行人脸识别。我国在人脸识别的领域发展起步较晚,但是由于国家重视科技,所以发展的比较迅速。很多的科研机构,高等院校和互联网公司都成立了人脸识别的科研小组,比如华中科技大学,国防科技大学等等。并且这些机构都取得了一定得成果。所以我国在人脸识别领域现在正处于快速发展的时期,而且人脸识别的效率和速度都达到了世界的先进水平。2014年前后,大数据和深度学习随着互联网的发展和人们的需求而发展,不仅神经网络技术受到世界的瞩目,而且在图像分类、手写体识别、语音识别等其他的应用中也获得了远超金典方法的结果。香港中文大学的SunYi等人提出将卷积神经网络应用到人脸识别上得设想,他们采用20万训练数据在LFW上第一次得到了超过人类水平的识别精度,这是人脸识别发展历史上的一座里程碑。近年来,在对特征脸技术进行认真研究的基础上,中科院计算所尝试了提出基于特征脸特征提取方法,不仅如此,他们还提出了各种后端分类器相结合的方法,提出了各种各样的改进版本或扩展算法,主要的研究内容包括线性/非线性判别分析(LDA/KDA)算法、Bayesian概率模型、支持矢量机(SVM)法、以及人工神经网络(NN)以及类内和类间双子空间(inter/intra-classdualsubspace)的分析方法等等。在一些实际的情况中,由于人脸识别收到光照、表情、姿态等不同因素的影响,人脸识别的识别效果与分类器的选择有关,所以众多的学者们提出了很多不同的识别分类的算法。比如陶璐、关英杰等人提出了用低秩序的协同表示分类来对鲁棒人的人脸识别。冯巨富等人提出利用贝叶斯概率来重新定义协同表示分类器,达到提高识别效果的作用。林国军、董林鹭、聂栋栋、叶枫、贺悦悦、付宇贤等人在协同表示分类器上都提出了相应的改进方法,与最初的协同表示方法相比较,都提高了人脸识别的识别效果。张哲来、马小虎、杨明中、杨平先等人针对训练样本数目过少,提出了增加虚拟样本,并与原始的训练样本进行融合的方法,提高了识别效果。1.3人脸识别的困难与挑战随着计算机的不断发展,人们对于网络安全的需求就越来越迫切,所以在这种社会的发展环境下,人脸识别技术得到了空前的发展。在我们日常的生活中,人脸识别技术在不同环境下的应用随处可见,它被大量的运用在了公共场合,比如在自助银行、上班打卡、追踪罪犯、门禁系统等这些比较重要的公共场合。所以人脸识别技术已经成为了当下模式识别中最热门的研究课题之一,并且在很多领域都已经取得了很好的成绩。但是在实际的情况下,依旧有很多的困难与挑战。1.所处的环境很复杂人脸识别的识别效果与所处的实际的环境因素有关。如果处于一个环境比较复杂且多变的情况下,就很有可能会导致在提取人脸图像的特征时出现一些不可控制的误差。比如在天气晴朗下与天气阴沉等不同条件的情况下,由于光照强度的不相同,所以就会对人脸的特征提取产生较大的差异。或者当人脸处于被遮挡时的情况下,比如戴着口罩或者眼镜等,或者被拍摄者在不同的角度,不同的表情下拍摄的图片在于人脸库中的数据在比较的时候就会有很大的差异,导致人脸识别的效率降低。所以如何克服在比较复杂且形式多变的环境因素所带来的影响,一直以来都是人脸识别的难点。2.人脸表情的变化对于人的脸部表情的变化来说,这种变化是非常丰富的,一个人脸部表情的变化,可以反应一个人当前的心里活动。所以每个人的表情有变化的时候,就会使得人脸识别的效率降低,而且,一个人在不同的时期会有不同的姿态,所以获取的人脸图像就会有多样性。除此之外,随着一个人年龄的增长,一个人的脸部也会发生变化。比如就会有胡须,皱纹等等因素,所以这也会对人脸识别的效率带来影响。3.训练样本不足在人脸识别中,需要足够的训练样本才能够精确地识别人脸,降低错误率。然而,在一个特定的人脸识别的类中,由于人脸数据库很难保证有足够的训练样本,所以为了满足识别的条件,就需要消耗大量的人力和物力去收集人脸图像的样本。但是如果增加了样本的数量,就会提高算法的时间复杂度和空间复杂度,所以怎么利用有限的样本区精确地识别人脸,也是一个巨大的挑战。4.图像质量到目前为止,许多公用的人脸数据库中的人脸图像是由摄像机或者照相机拍摄的图片,由于随着图像处理技术和硬件水平的不断提高,采集图像的设备越来越多,越来越好,所以不同型号,不同配置的摄像设备采集的图片就会有很大的差异。而且现在有的人脸库需要很高的分辨率才能精确地识别人脸,所以怎么消除不同设备,不同型号的拍摄图片带来的影响,也是人脸识别中的困难。1.4课题研究的主要内容在阅读了相关文献后,几种经典的人脸识别算法的原理在本篇文章中进行了说明与介绍。稀疏表示算法具有极强鲁棒性,能避免信息缺失、不对齐等原因有效提高人脸识别率,协同表示算法是在基于稀疏表示算法的基础上改进而来的新的算法,这个算法利用2范数作为正则化因子,一个字典中所有的训练样本被用来表示为测试图像的线性组合形式,所以这个过程的实质的是解决一个2范数的最小二乘回归问题。由于协同表征算法对于光照或者人脸被遮挡时的识别具有良好的鲁棒性,所以该算法的复杂度较低,在人脸识别的领域得到了广泛的应用。本文将在协同表示算法的基础上,通过重构训练样本,即构建虚拟样本并按照一定的特征将训练样本重新分类,然后在人脸库中选取测试样本作为研究对象,与常见的三种人脸识别的方法进行比较分析人脸识别的效率与人脸正确识别所需要的时间,通过四种方法的比较,得出改进的算法是否能够提高人脸识别的准确率,和改进算法是否可以在提高识别率的同时,降低识别耗时。

第2章人脸识别的常用算法2.1主成分分析法(PCA)把原来的坐标系中的数据转换到新的坐标系中,这个过程是由数据本身决定的。转换坐标系的过程中,坐标轴的方向由数据方差最大的方向,因为数据的最大方差给出了数据的最重要的信息。选择原始数据中方差最大的方向作为第一个坐标轴,选择与第一个新坐标轴正交且方差次大的方向作为第二个坐标轴。重复该过程,重复次数为原始数据的特征维数。我们发现,通过这种方式获得的新的坐标系,在前面几个坐标轴中包含了大部分方差,后面的坐标轴所含的方差几乎为零。因此可以忽略余下的坐标轴,只保留前面的几个含有绝大部分方差的坐标轴。这样也就相当于只保留包含绝大部分方差的维度特征,而忽略包含方差几乎为零的特征维度,这样就实现了对数据特征的降维处理。2.1.1主成分分析法的基本原理(1)输入训练样本D={,,...}和空间维度d。(2)对所有的样本进行去均值的操作:,其中表示特征在第i个样本中的取值。(3)样本协方差矩阵的计算:XX,并对协方差矩阵做特征值分解。(4)取最大的空间维度数d个特征值所对应的特征向量w,w...w。(5)原样本矩阵与投影矩阵相乘,降维后的数据集X=X*W,其中X的维度是m*n,而W的维度是n*d。(6)输出降维后的数据集。2.1.2主成分分析法的优缺点主成分算法分析的优点是处理后的数据更加容易使用,而且可以去除数据中的噪声,使得机器学习更加精确方便。这种算法一般用于对于数据的预处理。但是数据维度降低并不代表特征的减少,因为降维仍旧保留了较大的信息量,所以对结果过拟合问题并没有帮助。如果原始数据特征维度并不是很大,也并不需要进行降维处理数据。2.2稀疏表示算法(SRC)稀疏表示目前已经用于模式分类,Huang等人将一个信号稀疏编码在一个多余的基上,然后用该信号的编码向量去分类。Wright等人将稀疏编码用在鲁棒的人脸识别(SparseRepresentation-basedClassification,SRC),表现出了良好的鲁棒性,并在人脸处于遮挡的环境下,获得很好的识别效果。在稀疏表示算法中,测试样本可以用所有的训练样本的稀疏线性组合表示出来,什么类的训练样本重构的测试样本的误差最小,就把测试样本归于拿一类。2.2.1稀疏表示算法的主要步骤(1)输入:k类训练样本的矩阵A=[A,A,AA]R,其中m为测试样本图像的大小,n表示分的类中的训练样本的个数,测试样本为yR,可选的误差容许量>0。(2)让A中所有列向量的标准化,使得每个列向量具有单位l范数。(3)解决l范数的最小化问题:s.t.Ax=y公式(2.1)其中||x||表示向量x的l范数,该式子可以用下面的代替:s.t.||Ax-y||<=公式(2.2)(4)计算重构残差:公式(2.3)对于某些类i,令:R-->R是一个特征函数,选择对应的第i类训练样本的系数。对于xR,是一个向量,这个向量中的第i类训练样本的元素和x是一样的,其他的元素为0。对于第i类的训练样本的元素,用所有的重构样本来表示测试样本y,哪个重构样本和测试样本的误差最小,就将测试样本归为那一类。其中i[1,k]。(5)输出y的类别:identity(y)=argminr(y)公式(2.4)2.2.2稀疏表示算法的优缺点稀疏算法的优点在于对于噪声具有很强的鲁棒性,相关文献表明,人脸图像在很强的噪声环境下,对于人脸的面部识别仍然具有很高的识别率。稀疏算法的另一个优点是对于人脸在有物体遮挡的情况下,比如戴眼遮挡部分人脸等,仍然具有很高的识别率。对于这两点优势,是许多的传统的算法不具有的。但是在实际的测试时,求解测试图像在人脸数据库中训练样本的稀疏表示时,耗费的时间较长,所以在稀疏算法的基础上提出了许多的改进算法,在继承稀疏算法良好的鲁棒性的同时,降低识别耗时。2.3协同表示算法(CRC)协同表示算法是在稀疏算法的基础上提出的改进算法,它继承了对遮挡物良好的鲁棒性,也提高了计算的速度。协调表示算法的核心是通过分析推导,证明稀疏表示可以运用到人脸识别主要是由于协同表示的机制,而正则约束条件的主要作用是保证求解过程的稳定性,因此可以将原算法中欠定性方程组的最优解问题转化为最小二乘问题,然后通过求导数就可以找到全局最优解,大大的降低了计算的量,从而达到快速识别人脸的目的。2.3.1协同表示算法的主要步骤(1)在人脸库中提取每个人的人脸特征,生成一个字典X。(2)在X上编码y:公式(2.5)其中P=(XX+)X,P为投影矩阵,X表示所有类的训练样本,表示正则化参数。(3)计算正则化残差:公式(2.6)其中是对应于第i类的编码系数向量。(4)输出y的类别:identity(y)=argmin{r}公式(2.7)2.3.2协同表示算法的优缺点协同表示算法是在稀疏表示算法的基础上提出,它继承了稀疏算法对噪声良好的鲁棒性,在人脸有遮挡的情况下,仍具有较高的识别效率。而协同表示算法与稀疏表示算法的区别在于求解重构系数时使用的方法不同,前者使用l2范数求解系数,使得该算法的计算量大大降低。然而,协同表示算法与稀疏表示算法都忽略了近邻样本在训练字典重构中的作用,所以该算法仍有需要改进的地方。2.4扩展的协同表示算法(ECRC)扩展的基于协同表示的分类(ECRC)用于单样本的人脸识别,而ECRC的原理是构造一个辅助的字典,辅助字典用来表示类内中的测试图像与训练图像之间可能存在的变化。如果测试图像能够用训练图像和类内的辅助字典的稀疏线性组合表示,其中较大的系数集中于训练图像与类内辅助字典上,测试图像属于最小重构残差的训练样本,那么测试图像就能够被识别出。2.4.1扩展的协同表示算法的步骤(1)输入:k类训练样本的矩阵A=[A,AAA],类内辅助字典的矩阵D(p的大小与数据源与字典构造的方法有关),测试样本y和一个误差容许量>0,m表示测试样本的大小。(2)标准化训练矩阵A与类内字典D的所有列,使他们具有单位的l范数。(3)计算y的系数向量:公式(2.8)其中,,。(4)计算残差:公式(2.9)其中i,是一个新的向量,它的非0元素是中的元素,且对应于第i类的训练样本。(5)输出y的类别:identity(y)=argmin公式(2.10)2.4.2扩展的协同表示算法的优缺点由于测试图像可以近似的用训练样本和类内辅助字典的组合线性表示,计算得出测试样本的每类训练样本的残差,得出的训练样本的重构残差最小的就将测试样本归为那一类。ECRC的优点在于如果人脸处于伪装的情况下,依旧可以起到作用。而且,如果测试图像处于光照变化和表情变化的情况下,也能有较高的识别效率。2.5常用的人脸数据库(1)FERET人脸数据库:该数据库由FERET项目创建,这个数据库包含了大量的人脸数据,且每幅图像都只有一个人脸,但是包含不同的环境,比如在不同的光照,不同的表情,不同的姿态等。其中多数的人是西方人,图像比较单一,但是该数据库仍是人脸识别领域运用的最广泛的数据库之一。(2)YALE人脸数据库:这个数据库由耶鲁大学计算视觉与控制中心创建,是由15位志愿者的人脸数据构成。其中的光照和姿态的图像变化都是在严格控制条件下采集的数据,所以这个数据库主要用来对光照和姿态的变化的建模和比较分析。由于采集的数据较少,所以对进一步的使用产生了一些限制。(3)ORL人脸数据库:该数据库由英国剑桥大学的实验室所创建,收集了40个人400张左右的人脸数据,其中一部分的图像包括了光照,姿态和表情的变化,这些图像都是经过了归一化的灰度图像,为了排除无关变量的干扰,所以这些图像的尺寸和背景颜色都一样。(4)AR人脸数据库:这个数据库是在1998年由西班牙巴塞罗那视觉计算中心创建的,有76名男性,60名女性志愿者组成的大概4000多张人脸图像,所有的人脸图像都是正面的,所以没有反面的人脸图像,而且这些图像都是在不同的光照强度下采集的图像,并且这些不同光照图像中,人的面部表情都是不一样的,有微笑、惊讶、愤怒、高兴等等这些表情,还有一些图像还被东西遮挡,比如围巾,眼镜等物品。(5)LFW人脸数据库:该数据库是由美国马萨诸塞大学的视觉计算中心采集的人脸数据库,与其他实验室创建的人脸数据库不同的是,LFW人脸数据库是采集网上的新闻图片上的真实人物,所以这些人的图像在光照、表情、姿态、年龄的变化上就有着很大的差异。LFW数据库大约包含了13000多张人脸图像,因此这个数据库就成为了比较热门的人脸验证平台。2.6本章小结本章主要介绍了几种当前比较经典的人脸识别的主要算法,其中包括主成分分析法、稀疏算法、协同表示算法、扩展的基于协同表示分类的算法。这些方法各有各的特点,而且这些方法适用于不同的环境,在特定的环境条件下可以得到很好的识别效率。在第二章结尾部分介绍五种常见的人脸数据库。

第3章基于纹理增强的协同表示算法稀疏算法(SRC)因为具有良好的鲁棒性,所以能够较好的解决人脸的面部特征被遮挡的问题,但是由于该算法在用训练样本线性的表示测试样本时,求解稀疏系数采用了L范数来求解最小值,这样大大的增加了计算量。基于这个问题,有学者提出协同表示算法(CRC),该算法是在稀疏表示算法的基础上改进而来,它采取与稀疏算法不同的求解稀疏系数的方法,即采取L范数来求解,这样减少了计算量,这个算法也继承了稀疏算法良好的鲁棒性,但是由于人脸库中的训练样本过少,所以在人脸进行识别的时候识别效果并不是很好,所以基于人脸库中训练样本过少,本文提出了对要测试的样本进行灰度值纹理增强的方法,即通过提高对测试样本的面部图像的特征的提取速度,来解决训练样本过少时,面部识别效率不高的问题。3.1基于纹理增强的协同表示算法3.1.1增强纹理特征提取能力由于在人脸库中,所有的人脸都是一个颜色的图像,即灰色图像,所以灰度值对人脸识别是一个很有价值的特征。假设将训练样本F(p,k)当作一个整体的变量G(x),x表示训练样本的灰度值,设灰度增强后的图像为F(p,k)当成一整体变量H(y),y表示增强后的灰度值,灰度增强的过程可以表示为y=x。为增强系数。对于该算式的求解过如下:公式(3.1)其中,是y=x的反函数。对于上面的算式两边同时对y求导数得:公式(3.2)其中g(x)=,表示人脸图像在整个图像(m*n)中的比例,h(y)=,D表示灰度级别的个数。将h(y)和g(x)的公式代入上式可得:公式(3.3)对上式进行变换得:公式(3.4)对两边同时积分可以得到灰度值增强的公式为:公式(3.5)3.1.2协同表示分类CRC算法以所有的训练样本来重构测试图像,通过将测试样本分到重构的训练样本所占比重最大的类中,因此CRC的识别效果与测试样本在重构样本中的比重有关。而虚拟样本方法即提高测试样本在训练样本中的比重,来达到提高协同算法的识别效率的目的。假设人脸识别库中有c类训练样本,而且每个类的训练样本都是在不同光照、表情、姿态等环境下总共由n幅人脸图像构成的,那么可以得到训练样本矩阵为A=[a,a,..,a],其中i[1,c],假设S为测试样本,由于测试样本都可以利用余下的训练样本线性表示,所以S=A,其中系数的求解为:公式(3.6)在上算式中,表示正则化系数,I为一个单位矩阵。利用系数可以求得第i类训练样本与测试样本之间的重构误差:i公式(3.7)同理,我们可以得到水平镜像的对称样本的第i类训练样本与测试样本之间的重构误差:公式(3.8)i公式(3.9)3.2基于纹理增强的协同表示算法的流程图3-1算法的流程3.3本章小结在这一章中,主要阐述了纹理增强的具体概念和协同分类器的基本原理,并在协同表示算法的基础上提出了将纹理增强的特征提取方法加入到协同算法中,以纹理增强来增加分类器对人脸面部的特征提取的的能力,来达到提到识别率的效果,并利用协同表示算法中最小二回归问题来解决回归系数的求解,大大的降低了回归系数的计算量,从而将改进的算法达到提高识别效果的要求。

第4章实验与数据分析4.1在AR人脸数据库的实验AR人脸库中图像大小是165120包含表情、光照和遮挡物影响的人脸,其中50个男性和50个女性的子集,每个人的13幅人脸图像,图4-1给出了在AR库中的人脸示例,该示例上面七张图像和下面的六张图像分别处于不同的环境中,上面的七张图像是人脸在不同的光照下的不同的姿态表情,而下面六张图像是人脸处于不同光照下而且脸部被遮挡的情况下。为便于实验,讲图像维度降维为20×20。在同一个试验中,选取k个图像作为训练样本,其余的图像则作为测试图像。第一次选择第一幅人脸图像作为训练样本,其余的图像则作为测试图像。第二次选择第一、第八幅人脸作为训练样本,其余作为测试样本。第三次选择第一、第八、第十一幅人脸作为训练样本,其余作为测试样本。第四次选择第一、第八、第十一、第十三幅人脸作为训练样本,其余作为测试样本。图4-1AR库上某人的13幅图像示例表4-1AR库上的识别率(%)训练样本数量(k)LRCSRCCRCECRC本文算法146.3748.2545.4345.4156.12255.6257.9154.9254.9763.25374.8576.5474.8374.8279.68488.6477.7888.6288.6390.71训练样本数量(k)LRCSRCCRCECRC本文算法10.6852.230.781.211.2121.9469.541.031.401.4331.6383.671.331.541.5741.17101.851.051.371.25表4-2AR库上的识别耗时(s)图4-2样本数目与识别率的关系4.2在ORL人脸数据库的实验由英国剑桥大学AT&T实验室创建,包含40人共400张面部图像,部分志愿者的图像包括了姿态,表情和面部饰物的变化。该人脸库在人脸识别研究的早期经常被人们采用,但由于变化模式较少,多数系统的识别率均可以达到90%以上,因此进一步利用的价值已经不大。ORL人脸数据库中一个采集对象的全部样本库中每个采集对象包含10幅经过归一化处理的灰度图像,图像尺寸均为92×112,图像背景为黑色。其中采集对象的面部表情和细节均有变化,例如笑与不笑、眼睛睁着或闭着以及戴或不戴眼镜等,不同人脸样本的姿态也有变化,其深度旋转和平面旋转可达20度。仿真时选用了人脸库中的第10幅图像用来当作仿真的对象。为便于实验,讲图像维度降维为20×20。在同一个试验中,选取k个图像作为训练样本,其余的图像则作为测试图像。第一次选择第一幅人脸图像作为训练样本,其余的图像则作为测试图像。第二次选择第一、第四幅人脸作为训练样本,其余作为测试样本。第三次选择第一、第四、第七幅人脸作为训练样本,其余作为测试样本。第四次选择第一、第四、第七、第十幅人脸作为训练样本,其余作为测试样本。图4-3ORL人脸库中的图像示例表4-3ORL库上的识别率(%)训练样本数量(k)LRCSRCCRCECRC本文算法170.3373.3171.7372.7676.23275.9477.2582.9685.9188.64380.7183.2687.1289.0292.11485.2690.4491.3191.2594.63表4-4ORL库上的识别耗时(s)训练样本数量(k)LRCSRCCRCECRC本文算法10.16313.720.1250.1780.13220.28918.710.1830.2300.18630.28521.430.2860.2600.22540.30630.630.5520.3220.294图4-4样本数目与识别率的关系4.3在YALE人脸数据库的实验这个数据库由耶鲁大学计算视觉与控制中心创建,是由15位志愿者的人脸数据构成。其中的光照和姿态的图像变化都是在严格控制条件下采集的数据,所以这个数据库主要用来对光照和姿态的变化的建模和比较分析。由于采集的数据较少,所以对进一步的使用产生了一些限制。为便于实验,讲图像维度降维为20×20。在同一个试验中,选取k个图像作为训练样本,其余的图像则作为测试图像。第一次选择第二幅人脸图像作为训练样本,其余的图像则作为测试图像。第二次选择第二、第六幅人脸作为训练样本,其余作为测试样本。第三次选择第二、第六、第十幅人脸作为训练样本,其余作为测试样本。第四次选择第二、第六、第十、第十一幅人脸作为训练样本,其余作为测试样本。图4-5YALE人脸库的图像示例表4-5YALE库上的识别率(%)训练样本数量(k)LRCSRCCRCECRC本文算法172.0774.0064.6773.3477.42284.4382.1578.6781.2686.37384.2282.3379.3382.3288.55482.2683.8683.8183.8190.71表4-6YALE库上的识别耗时(s)训练样本数量(k)LRCSRCCRCECRC本文算法10.0343.6010.0340.0350.03420.0674.3870.0440.0550.04130.0504.7880.0600.0460.05340.0354.5260.1020.0330.089图4-6样本数目与识别率的关系4.4实验分析在AR库中实验时,由图4-2可知,在样本的数目逐渐增加时,五种算法都处于上升的趋势。其中SRC算法在训练样本数目为1时,识别率在最高位,但是随着训练样本数目的增加,其上升的趋势小于其他四种算法,并且在训练样本的数目为4的时候,识别效率的数值在最低位。其它四种算法虽然在训练样本数目为1的时候,识别效率不是最高位,但是它们随着训练样本的数目的增加,识别率都在增加,而且训练样本数目为4的时候,它们的识别率都达到了88%左右。而且本文的算法与传统的CRC算法相比较,随着训练样本数目的增加,改进的算法在识别效率上比传统的CRC算法提高了2%到10%左右。虽然改进的算法与其它四种算法相比较,在样本的数目为1时,并不是出于最高位,但是随着AR库中训练样本的增加,改进的算法的识别率越来越高。所以通过在AR人脸库中整体来分析,改进的算法还是提高了。在ORL库中,有图4-4可知,五种算法的识别率都随着训练样本的数目增加而提高,而且训练样本的数目由1到2时,五种算法的识别率提高了12%到15%左右,而训练样本的数目从2到4的时候上升的趋势就减缓了。在训练样本数为1时,LRC算法处于最低位。但是由于ORL人脸库的图像相对而言比较少,所以五种算法在训练样本为4时,识别的效率都达到了85%以上,而且改进的算法与CRC相比较,改进的算法在识别效率方面提高了5%到8%左右。而且改进的算法随着训练样本的数目的增加,它的识别率也在随之增加,当训练样本的数目为4的时候,改进算法的识别效率处于最高位。在YALE人脸库的实验中,由图4-6可知,CRC和本文的算法在整体上呈现出明显的上升趋势,但是其他的三种算法在训练样本的数目由3到4的过程中,对人脸的识别效率有一个较为明显的下降,造成这种现象可能的原因是:在yale人脸库中,每个不同的类别即不同的人的人脸图像为7幅图像,而训练样本的数目为4的时候,超过了类别中人脸图的一半,所以造成了识别率的下降。而在训练样本数目为1时,CRC算法的识别率处于最低位。改进的算法与CRC相比较,识别率提高了7%到10%左右,而且改进的算法随着训练样本的数目的增加,它的识别率也在随之增加,当训练样本的数目为4的时候,改进算法的识别效率处于最高位。对于在AR库中的识别耗时分析,由表4-2可知,LRC,CRC,ECRC和本文算法在识别人脸的消耗的时间很短,基本上耗时在2s内,并且在训练样本书从1到2的过程中,识别耗时都呈现出上升。其中LRC算法的识别耗时从训练样本数由2到4的过程中出现下降,而其他三种算法都是先上升再下降。SRC的识别耗时就非常多,大约是其他四种的平均耗时的50到100倍左右,而且该算法的识别耗时随着训练样本的数目增加而增加,呈现出一种线性关系。改进算法的识别耗时与CRC相比较,所需要的时间较多。在ORL库中的识别耗时分析,由表4-4可知,五种算法在识别耗时方面,都随着训练样本的数目增加而增加。但是SRC算法还是比其他的四种算法高出一个数量级。改进的算法与CRC相比较来说,改进的算法在识别耗时方面优于传统的CRC算法。在YALE人脸库中的识别耗时由表4-6可知,LRC算法和ECRC算法在训练样本数目从1到4的过程中,识别耗时是先增加后下降的,但是其余三种算法的识别耗时都是随着训练样本的数目增加而增加。但是这五种算法相比较,LRC算法的识别耗时是最优的。改进的算法和CRC相比较,在训练样本的数目为1时,识别所需要的时间几乎一样,但是随着训练样本数目的增加,改进的算法所需要的识别耗时要少于CRC算法。SRC算法所需要的时间相比于其他四种算法而言,明显偏高。SRC算法在不同的人脸库中都有较高的识别率,但是这个算法也有一个很大的缺点,即在识别图片所需要的时间较多,造成这种现象的原因是由于SRC算法在利用最小二回归的方法在求解稀疏系数是采用了l范数,使得SRC算法在利用训练样本求解测试样本时,计算量大大增加。而CRC算法在求解稀疏系数是采用了2范数,使得计算量减少。从而大大减少了识别图片所需要的时间。

第5章总结协同表示的人脸识别算法并不考虑与人脸的面部特征无关的因素,比如训练样本中的光照,表情等,所以这些因素限制了分类器性能的提高。在本文中,提出增加纹理特征提取能力加上协同表示的方法来解决这个问题。协同表示算法在稀疏算法的基础上,继承了稀疏算法良好的鲁棒性,而且协同表示算法在求解稀疏系数时,采用了l2范数,大大的降低了计算的量,使得识别耗时大大降低。而增强纹理识别即先将训练样本进行预处理,把所有的图像先进行灰度化处理,然后提取人脸面部的特征,最后在人脸图中增强这些提取到的特征,然后计算出回归系数,计算出字典中的每个人的图像对测试样本的残差,最后将残差最小的一类归为测试样本的那一类。这种办法可以有效的降低无关因素对人脸识别造成的影响,从而提高人脸识别的效率。本文的算法相较于传统的CRC算法来讲,识别效率提高了10%左右,但是识别耗时的长短与选择的人脸库有密切的关系。在训练图像足够多的人脸库中,传统的算法在识别耗时方面具有较大的优势。但在训练样本较少的人脸库中,本文的算法与传统的CRC算法具有相差不多的识别耗时,但是在识别率方面,本文的算法比传统的算法高处10%左右。本文的算法与其它剩余的方法相比较,识别率随着训练样本数目的增加而提高,且识别率都高于其它的方法,并且在人脸图像不多的库中的识别率尤为突出。在识别耗时方面,除了SRC算法外,其它四种算法的识别图像所需要的时间都相差不多。所以本文算法在提高识别率的方面还是有一定的优势。本文由于各个方面的原因,对于如何在提高识别效率的同时,还要降低识别所需要的时间的问题没有进行更加细致的研究,希望自己在以后的学习中,能够对这些方面的问题有更加细致的研究。

参考文献[1]Quionero-CandelaJ,SugiyamaM,SchwaighoferA,DatasetShiftinMachineLearning[M].TheMITPress,2009.[2]PishchulinL,GassT.Imagewarpingforfacerecognition:Fromlocaloptimalitytowardsglobaloptimization[J].PatternRecognition,2012,45(9).[3]Paweł,Wójcik.Onseminormanditsdecomposition[J].ElsevierInc,2020,588.[4]CarlaGroenland,TomJohnston.Intersectionsizesoflinearsubspaceswiththehypercube[J].ElsevierInc.,2020,170.[5]陶璐,关英杰,邓

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论