人脸识别论文阅读综述报告_第1页
人脸识别论文阅读综述报告_第2页
人脸识别论文阅读综述报告_第3页
人脸识别论文阅读综述报告_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人脸识别论文阅读综述报告论文的基本信息ZhouDL,GaoW,ZhaoDB.FacerecognitionbasedonsingularvaluedecompositionandDiscriminantKLprojection。JournalofSoftware,2003,14(4):783~789.论文要解决的问题及其重要性本文提出了一种人脸识别的方式,人脸识别在理论和技术上都有重要的作用一是可以推进对人类视觉系统本身的认识;二是可以满足人工智能应用的需要。采用人脸识别技术,建立自动人脸识别系统,用计算机实现对人脸图像的自动识别有着广阔的应用领域和诱人的应用前景。同时人脸识别作为一种生物体征识别与其它较成熟的识别方法相比有以下几个优点:①无侵犯性,人脸图像的获取不需要被检测人发生身体接触,可以在不惊动被检测人的情况下进行;②低成本、易安装,人脸识别系统只需要采用普通的摄像头、数码摄像机或手机上的嵌入式摄像头等被广泛使用的摄像设备即可,对用户来说也没有特别的安装要求;③无人工参与,整个人脸识别过程不需要用户或被检测人的主动参与,计算机可以根据用户预先的设置自动进行。本文在彩色人脸图像上进行人脸识别,之前大多数人脸识别算法都是基于灰度图片的人脸识别,而真实的人脸图像是彩色的,这些色彩提供了比灰度人脸图像更为丰富的信息。目前,随着计算机技术的迅猛发展,彩色图像的处理已成为人们研究的热门课题。然而,由于灰度图像具有易于处理的特点,且大多数经典的图像处理方法都基于灰度图像,因此,如果将一幅彩色图像经过某种变换转换成灰度图像,使该灰度图像中包含原彩色图像中的绝大多数特征信息,那么,后续处理就可以采用经典的图像处理方法,大大减少了计算量。论文提出的解决方案以及效果解决方案:本文提出的算法采用模拟K-L变换、奇异值分解(SVD)、主分量分析(PCA)和Fisher线性判别(FLD)分析技术来提取最终特征。奇异值分解是一种有效的代数特征提取方法。由于奇异值特征在描述图像时是稳定的,且具有转置不变性、旋转不变性、位移不变性、镜像变换不变性等重要性质,因此奇异值特征可以作为图像的一种有效的代数特征描述。基于主成分分析的人脸识别方法也称为特征脸方法。该方法将人脸图像按行(列)展开所形成的一个高维向量看作是一种随机向量,因此可以采用K-L变换获得其正交K-L基底。对应于其中较大特征值的基底具有与人脸相似的形状,故称其为特征脸。利用相对较小的Eigenface集描述人脸,这样每幅人脸图像就对应于一个维数较低的权向量,因此,人脸识别可以在降维后的空间上进行。然而,该方法的缺点是,得到的特征在一般情况下是最佳描述特征(themostexpressivefeatures,简称MEFs),而不是最佳分类特征(themostdiscriminatingfeatures,简称MDFs)。Fisher线性判别方法使投影后的模式样本的类间散布矩阵最大而类内散布矩阵最小,也就是说,投影后保证模式样本在新的空间中有最大的类间距离和最小的类内距离,即模式在该空间中有最佳的可分离性。Fisher线性判别分析提取的特征向量集强调的是不同人脸的差异而不是照明条件人脸表情和方向的变化。因而,采用FLD方法对光照条件人脸姿态等的变化不太敏感,从而有助于提高识别效果。然而,由于在正常情况下人脸识别问题总是一个小样本问题,故其类内散布矩阵总为奇异阵而使此方法的求解变得很困难。基于上面的分析,为了确保选择得到的最终特征是最佳鉴别特征,同时保证类内散布矩阵非奇异,在本文中我们提出了一种称为基于奇异值特征向量的DKL彩色人脸识别方法。该方法首先采用Ohta提出的模拟K-L变换,将一幅彩色人脸图像转换成一幅彩色主分量特征的人脸灰度图像,然后使用矩阵的奇异值分解来获得奇异值特征向量,根据PCA投影来获得最佳描述特征,再利用Fisher线性判别分析投影来进一步降低特征空间的维数以获得最佳分类特征,最后由最近邻分类器识别人脸。实验效果取彩色人脸图像数据库中的训练集图像共有40类400幅,测试集图像也为40类400幅。另外,我们采用基于奇异值分解的PCA法与FLD法进行比较。实验结果如下图:

OW二M-='=野总OW二M-='=野总:DfeJUCHlcso)蛊g畫IK>-lc30“星Numberofteshines Numberoffeatures NumberoffeattiresFig.2PCAmethod Fig.3FLDmethod Fig.4Ourmethod鹵2PCA方法 圏3FLD方法 圏4本文的方法如图2所示,基于奇异值特征向量PCA法的识别率较低。当用前面两个特征对训练集进行识别时,识别率为88.25%,当选用多于两个以上的大特征值对应的特征数目时,可以取得最佳识别效果,这时识别率稳定地保持在96.25%。而用前面两个特征对测试集进行识别时,识别率也为88.25%,选用多于7个以上的大特征值对应的特征数目时可以取得最佳的识别效果,这时识别率保持在95%。由图3可知,基于奇异值特征向量的FLD识别方法的识别率很高,当用前面两个特征对训练集进行识别时,识别率就高达96.75%,当选用多于2个以上的大特征值对应的特征数目时可以取得最佳识别效果,这时识别率稳定不变地保持在97.5%。而当用前面两个特征对测试集进行识别时,识别率为86.75%,当选用多于10个以上的大特征值对应的特征数目时可以取得最佳的识别效果,这时识别率稳定不变地保持在97.5%。由图4可知,本文所采用的基于奇异值特征向量DKL识别方法的识别率很高,当用前面两个特征对训练集进行识别时,识别率就高达94.25%,当选用多于4个以上的大特征值对应的特征数目时可以取得最佳识别效果,这时识别率稳定不变地保持在97.5%。而当用前面两个特征对测试集进行识别时,识别率为91.25%,当选用多于5个以上的大特征值对应的特征数目时可以取得最佳的识别效果,这时识别率在97.5%处保持不变。论题的核心思想以及创新点本文的核心在于首先利用模拟K-L变换得到彩色人脸图像的主分量特征图像,然后通过奇异值分解获得奇异值特征向量,再通过主分量分析技术得到人脸的最佳描述特征,最后利用Fisher线性判别分析来得到维数更低的最佳鉴别特征。这样,既利用了特征脸方法和Fisher线性判别分析方法的优点,又克服了它们的不足之处,同时使分类器的设计更加简洁有效,提高了人脸图像的识别率。通过本文的对比实验可见,以上3种方法都具有识别率较高而所用的特征向量数目较小的特点。而识别率的不同则再次证明了如下的结论,即特征脸的图像主要反映的是原始模式变化最大的成分,以使图像重建后的均方误差最小,该方法受照明条件等与人脸本身无关的因素的影响较大,选用较大特征值对应的特征向量进行识别不一定能取得预期的效果。而Fisher线性判别方法使投影后的模式样本的类间散布矩阵最大而类内散布矩阵最小,也就是说,投影后保证模式样本在新的空间中有最大的类间距离和最小的类内距离,即模式在该空间中有最佳的可分离性。Fisher线性判别分析提取的特征向量集强调的是不同人脸的差异,而不是照明条件人脸表情和方向的变化。因而,采用FLD方法对人脸进行识别比采用PCA方法对光照条件人脸的姿态等的变化更为不敏感,从而采用Fisher鉴别向量有助于提高识别效果。本文的方法由于综合利用了PCA方法和FLD方法的优点,因此具有最佳识别效果,即所用的特征数目少而识别率最高。自己的心得与体会在本次论文的阅读过程中,因为自己对基础预备知识的不熟悉,尤其是数学知识的不熟,导致有些部分在最开始阅读论文的时候看的不是特别明白,花了点时间学习矩阵论,再回过头来阅读这篇论文的时候,很多问题便迎刃而解了。通过对本篇论文的阅读,学习了人脸识别过程中通过奇异值分解获得奇异值特征向量,通过主分量分析技术得到人脸的最佳描述特征以及利用Fisher线性判别分析来得到维数更低的最佳鉴别特征的人脸识别方法,开阔了自己的眼界,见识到了课堂以外的其他算法,拓

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论