基于PCA算法的人脸性别鉴别南山学报.doc_第1页
基于PCA算法的人脸性别鉴别南山学报.doc_第2页
基于PCA算法的人脸性别鉴别南山学报.doc_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第8卷 基于PCA算法的人脸性别鉴别 2011年5月基于PCA 算法的人脸性别鉴别柳华 (烟台南山学院, 山东烟台,265713)摘 要:人脸的性别分类是指根据人脸的图像判别其性别的模式识别问题。本文首先通过主成份分析(PCA) 算法求出训练样本的特征子空间,测试样本和训练样本分别向特征子空间投影,分别得到一组坐标系数做为待识别的特征。最后利用最近邻准则进行性别鉴别。在人脸数据库ORL(Olivetti Research Laboratory)进行实验,实验结果得出,基于PCA 算法的人脸性别识别,识别性能好,是一种有效的性别鉴别方法。关键词:性别识别;PCA算法;ORL人脸数据库中图分类号: TP391.41 文献标志码:A Gender Classification Based on PCA for Facial ImagesLIU Hua (Yantai Nanshan University, Yantai,Shandong,265713) Abstract: Gender classification is a pattern recognition problem of deciding the gender according to the face image.Feature sub-space of training samples is obtained by PCA (Principal Components Analysis).The test samples and training samples are respectively projected to the feature space, recognition features are accordingly gained by a set of coordinates coefficient. The nearest neighbor rule is utilized in gender classification.Experimental results on ORL face database show that PCA is well in recognition performance,and is a valid method in gender classification. Keywords: gender classification; PCA algorithm; ORL face database在计算机识别与监控中,计算机视觉发挥着重要的作用,出现了人脸识别和跟踪、年龄估计以及性别识别等研究领域。其中,人脸性别识别是一个重要的研究课题,即利用计算机通过人脸图像信息识别被观察者的性别属性。各国研究人员都对该课题做了相关的研究,他们采用不同的识别方法,其中大多数研究者采用基于神经网络和基于支持向量机的方法1-4。性别识别作为人机交互的一部分,起着非常重要的作用,该项研究不仅能加强现有的人机交互能力,而且还能在智能环境中对一些有性别要求的特定场所的出入进行性别限制,统计性别信息等。人脸图像在计算机中以高维的矩阵存储,人脸图像上的点用矩阵的行和列标出,该点的灰度等级就是矩阵中相应元素的值,从而,性别识别的问题就相当于对高维的矩阵进行处理,所以,达不到实时识别的要求,速度比较慢5-6。对于解决这一问题,我们通常采用的方法是利用降维技术,线性鉴别分析(Linear Discriminant Analysis,LDA)和 主成分分析 (Principal Components Analysis, PCA) 7,是常用的两种有效的降维方法。本文采用PCA 算法进行人脸性别识别,PCA算法的原理就是将一个高维的向量通过一个特殊的特征向量矩阵,投影到一个低维的向量空间中,表征为一个低维向量,这样就可以提高性别识别的速度,由于男女性别人脸之间存在差异性,并且男性或女性人脸结构存在相似性,所以在高维空间中人脸图像的分布是存在着某种规律的。因此,在性别识别过程中,PCA算法将人脸图像空间降维到维数22的特征子空间中,这样维数大大减少,并且还保留了原始图像数据的大部分有用的信息,实验结果说明:该算法对表情变化或者轻微倾斜的人脸图像进行性别识别有较强的鲁棒性,并且具有较高的正确识别率和识别速度。1 PCA算法原理PCA算法是统计模式识别中一个经典的特征提取方法,PCA算法的原理是通过除去数据间的相关性达到降维的目的。在PCA中,一幅人脸图像用一个n维向量x来表示,n的大小等于人脸图像的高乘以宽。训练集由进行完规一化后的标准人脸图像来组成。产生矩阵用该样本集的总体散布矩阵即: (1)上式中,yi表示第i个训练样本的图像向量,表示训练样本集的平均向量,N为训练样本的总数。下一步就是求上式矩阵的特征值和特征向量,然后将特征值从大到小排序,取其前m个特征值对应的特征向量,由这些特征向量构成特征子空间。这样,原始向量的维数就降低到m维了,起到了降维的目的,其中,越大的特征值对应的特征向量包含的识别特征越多,能量越大,然后可以将变换后的原始向量投影到特征向量组成的子空间中,得到一组坐标系数,待识别的图像向量也向其投影得到另外一组图像系数,最后通过最近邻准则识别人脸性别。2基于PCA算法的人脸性别鉴别PCA算法用于人脸性别鉴别,首先求的所有训练样本的均值,然后分别求的男,女两类训练样本的均值,下一步对两类训练样本进行规范化,求的规范化后的矩阵的特征向量。这样,就得到了训练样本的特征子空间,然后,将训练样本和测试样本进行规范化再分别朝由训练集生成的特征子空间投影,然后用最近邻准则对性别进行鉴别。下面是该算法的详细过程。首先求得所有训练样本的均值,然后用这个平均值去规范化男女两类训练样本均值。设训练样本图像的高和宽是m和n,则训练样本的维数是mn,性别识别问题是两类模式识别问题,所以共有2类,设每类参加训练的样本数是M,则所有的样本数就是2M,然后计算所有训练样本的平均值m, (2)其中xiRmn 然后计算女的训练样本的均值m1 (3)男的训练样本的均值m2 (4)其中m、m1、m2Rmn。然后将m、m1、m2转变成列向量。下一步求的训练样本的总体协方差矩阵定义为 (5)其中SRmnmn其中:设X= m1-m, m2-m。计算S的特征值与特征向量,将计算的特征向量标准正交化之后记为Ui,则UiRmn2,这样训练样本和测试样本的人脸图像就可以投影到UiRmn2,张成的子空间中分别获得一组坐标系数,该坐标系数就代表了在特征子空间中的位置,在特征子空间中也就是一个点,该点就代表一幅人脸图像,同时,把UiRmn2中的每个列分量还原重构成图像,特别像人脸,所以该方法也称为“特征脸”方法。由于(5)式中SRmnmn的维数太大,直接求其的特征值和正交归一特征向量有一定的难度,所以下面利用奇异值分解原理来求解(5)式的特征值和特征向量: (6)奇异值分解原理是通过求解上式S1的特征值和特征向量来间接获得S的特征值和特征向量。过程是:首先求的矩阵S1的2个非零特征值,Vi为S1矩阵对应于的特征向量,那么求矩阵S的正交归一特征向量通过下式获得 (7)上式中的X的定义与公式(5)中相同。这就是总离散度矩阵S的特征向量。第三步,用所有训练样本的平均值规范化两类训练样本均值得到的训练样本矩阵X向特征子空间Ui投影: (8)这样就得到了男女两类的投影特征,显然投影特征的维数是2维的,这样就将一个mn维的训练样本类图像降维到2维空间中了,数据量得到压缩,识别速度也会大大提高。第四步,进行测试识别,经过以上步骤得到PCA算法的性别训练的特征子空间,根据PCA的原理首先需要对待测试的人脸图像向量化,转化为列向量,然后再用训练样本的平均值对其规范化。设测试样本为xT (9)利用公式(8)求出测试样本的投影特征C,再计算C与Y之间的欧氏距离d (10)Yij表示i类训练样本投影特征的第j个元素,Cj表示测试样本投影特征的第j个元素比较d(Y1,C)与d(Y2,C)的大小,若d(Y1,C)小则判为女性,反之,则判为男性。3 实验结果与分析实验在Matlab6.5环境下采用ORL人脸数据库的部分样本进行了仿真实验。ORL人脸库是由英国剑桥Olivetti实验室从1992年4月到1994年4月期间拍摄的一系列人脸图像组成,该人脸库由40个不同年龄、不同种族的对象组成、其中,35人为男性,5人为女性。每个对象10幅图像共计400幅灰度图像组成,人脸图像的尺寸为11292,对象的灰度级为256的人脸图像组成,试验中将每幅图像的分辨率转化为5646,库中的人脸包括不同光照、不同面部表情和面部遮挡情况下的人脸图像,同时也包括轻微旋转下的人脸图片。该库是目前使用最广泛的标准数据库, ORL人脸数据库中的部分图像如图1所示。图1ORL人脸数据库中十个人的人脸图像在实验过程中,选取图1中的5男5女共10人,每人10幅图像作为样本图像数据。训练样本随机产生,在相同实验条件下,从男女两类中每人随机选取i张人脸图像作为训练样本(i=2,4,6),每人剩余10-i张作为测试图像来实验。通过采用不同数量的训练样本来测试正确识别率,参加训练的样本数与男、女、和总的平均识别率关系如表1所示。表1训练样本数与正确率%训练样本数总识别率男识别率女识别率20 96.2510092.540 96.6610093.360 97.2510095实验结果证明,基于PCA算法的人脸性别鉴别总体上能达到较高的识别要求,同时通过表1可以看出随着训练样本的增加, PCA算法的识别率也随之就越高。同时还可以看出相同的训练样本数的情况下,男性的识别率高于女性的识别率。这个实验结果是偶然还是女性比男性难识别,经查阅文献,研究结果:女性化程度取决于漂亮程度,而男性化程度与漂亮程度无关,并且人脸图像越趋近于平均脸,越漂亮,女性化程度越高,这样的就容易造成错误识别率,这结论能很好的解释这个问题,至于该问题是否还与其他因素有关系,还需进一步研究。4结论性别分类是一个很具有挑战性的实际问题。本文采用的是基于PCA算法的人脸性别识别。PCA算法将训练图像和测试图像都投影到PCA算法得到的特征子空间里,通过这个算法的处理变换,保留下了人脸图像的对性别识别有用的信息,同时也去掉了与性别识别无关的大量的图像的冗余信息,起到了降维的作用,该算法有较高的识别率和识别速度。但是该算法是对人脸的灰度图像进行处理变换的,所以最大的缺陷是对光照很敏感,从而影响识别率,这个问题有待进一步探讨研究,同时,下一步的研究可以采用PCA提取主成分信息,作为性别分类的特征,然后利用支持向量机(SVM)、Adaboost算法进行性别分类,进一步提高识别率。参考文献:1 邓英, 欧贵文. 基于HMM 的性别识别J. 计算机工程与应用,2004 (15) : 74-75.2 李小红. 基于积分投影的人脸图像的特征提取J. 计算机仿真, 2004, 21 (12) : 189-191.3 张淑玲, 邹复民. 基于小波分析的人脸图像特征提取J. 科学技术与工程,2006, 6 (12

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论