已阅读5页,还剩13页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
北方工业大学 数字图像处理课程设计报告设计题目: 基于PCA算法的人脸识别系统学院: 信息工程学院 专业: 信息与通信工程 姓名: 曹希 班级: 信研-12班 学号: 2012312100117 指导教师: 王一丁 2012年 11月 2号基于PCA算法的人脸识别系统摘要:计算机人脸识别技术是近20年才逐渐发展起来的,是模式识别中的一个前沿课题,近年来更是成为科研热点。它利用计算机分析人脸图像,今儿从中提取出有效信息,用来辨认身份。PCA方法由于其在将为和特征提取方面的有效性,在人脸识别领域得到了广泛应用。PCA方法的基本原理是,利用K-L变换抽取人脸的主要成分,构成特征连空间,识别时将测试图像投影到此空间,得到一组投影系数,通过与各个人脸图像比较进行识别。本次设计基于MATLAB环境进行编程,使用ORL数据库的人脸样本集,利用特征脸方法进行识别,最后对结果进行分析,给出识别的准确率。关键词:K-L变换,PCA,人脸识别目录摘要:21PCA方法和理论基础31.1离散K-L变换的基本原理31.2PCA的理论基础51.2.1投影51.2.2PCA的作用及其统计特性61.2.3特征脸72算法流程及具体步骤72.1 读入人脸库72.2 计算平均脸和相应的特征向量82.3 计算特征脸82.4 投影92.5 对人脸进行识别93 设计结果103.1 识别精度103.2 特征脸113.3 脸部识别124 设计代码135设计结果及分析171 PCA方法和理论基础基于主成分分析(principal component analysis,简称PCA)的人脸识别方法也称为特征脸方法。该方法将人脸图像按行(或列)展开所形成的一个高维向量看作是一种随机向量,因此可以采用K-L变换获得其正交K-L基底。对应于其中较大特征值的基底具有与人脸相似的形状,故称其为特征脸。1.1 离散K-L变换的基本原理PCA方法是由Turk和Pentlad提出的,它的基础就是karhunen-Loeve变换,也就是K-L变换,是一种常用的正交变换。离散K-L变换的思想就是,寻求正交矩阵A,使变换后信号对应的协方差矩阵为正交矩阵。对于一幅大小的图像,在某个通信信道中传输M次,因受到各种因素的随机干扰,存在随机图像样本集合:对其中的第幅图像,可以将其按列排列得到一个维向量: (式1-1)令:,则:。鉴于图像序列是随机变量,度量随机变量可用协方差矩阵表示: (式1-2)其中表示求期望,表示转置,且,因此,协方差矩阵可以表示为: (式1-3)其中,是维的向量,而是阶的矩阵。令和分别是的特征向量和对应的特征值,将特征值按降序排列,那么,离散K-L变换核矩阵的行是的特征向量,则变换核矩阵为: (式1-4)其中对应第个特征向量的第个分量。故离散K-L变换可定义为: (式1-5)其中,是原图像向量减去平均值向量,是的变换核矩阵。1.2 PCA的理论基础1.2.1 投影设d 维样本x1, x 2,, xn,以及一个d 维基w ,那么标量:yi =wT xi是相当于xi在基上的坐标值。如果w = 1,y就是把x方向为w 的直线进行投影的结果。可以从图 1 看到。推广之,如果有一组基(m个)组成的空间,那么可以得到xi 在空间W上的坐标为: (式1-6) (图 1)1.2.2 PCA的作用及其统计特性采用PCA 对原始数据的处理,通常有三个方面的作用降维、相关性去除、概率估计。下面分别进行介绍:一去除原始数据相关性从统计学上讲, EX E(X )Y E(Y) 称为随机变量X 与Y 协方差,记为:Cov(X,Y)。令,称为随机变量X 与Y 的相关系数。XY = 1则X与Y 是相关的,XY = 0,则X 与Y 是不相关的。对于矩阵A 来说,如果AAT是一个对角阵,那么A中的向量是非相关的。由 PCA 处理的人脸库数据的非相关性可以从两点进行说明。(1) 基底的非相关性特征空间基是非相关的,即UUT = I 。(2) 投影系数的非相关性由 SVD 可知, 其中 , mx 是平均人脸。根据公式(2)可以把A 映射到特征空间上,得到: B =UT * A,其中B 是非相关的,可由下面得到证明:Y的协方差矩阵为: (式1-7)二统计参数(均值及方差)均值即 mx (平均人脸)。随机变量方差越大,包含的信息越多,当一个变量方差为0 时,该变量为常数,不含任何信息。所有原始数据在主分量ui上的投影值方差为i 。三降维如果在原始空间表示一幅N*M 大小的图片X,那么需要一个NN*M 维矢量,但是当把它映射到特征空间后,只需要一个1维的向量就可。另外,可以根据方差的大小来判断特征向量的重要性。由ORL数据库计算得到的特征值呈图2分布,可知特征向量重要性呈指数下降,据此可以只选用前面几个重要的特征向量来构建特征空间。 (图2)1.2.3 特征脸协方差矩阵的特征向量中的每一个单位向量都构成一个特征脸。由这些特征脸所张成的空间称为特征脸子空间,需要注意对于正交基的选择的不同考虑,对应较大特征值的特征向量(正交基)也称主分量,用于表示人脸的大体形状,而对应于较小特征值的特征向量则用于描述人脸的具体细节,或者从频域来看,主 分 量表示了人脸的低频部分,而此分量则描述了人脸的高频部分。2 算法流程及具体步骤2.1 读入人脸库本次设计使用的是ORL人脸数据库。ORL人脸库是由英国剑桥Olivetti实验室从1992年4月到1994年4月期间拍摄的一系列人脸图像组成,共有40个不同年龄、不同性别和不同种族的对象。每个对象10幅图像共计400幅灰度图像组成,图像尺寸是92112,图像背景为黑色。其中人脸部分表情和细节均有变化,例如笑与不笑、眼睛睁着或闭着,戴或不戴眼镜等,人脸姿态也有变化,其深度旋转和平面旋转可达20度,人脸尺寸也有最多10%的变化。该库是目前使用最广泛的标准数据库,它含有大量的比较结果。在设计过程中,要对训练样本集采用K-L变换进行特征脸提取,并对测试样本集进行人脸识别。训练集的大小是可选的,它的大小将直接影响到识别的正确率,在后面对采用不同大小的训练集进行识别的正确率进行了统计。归一化人脸库后,将库中的每人选择一定数量的图像构成训练集,其余构成测试集。设归一化后的图像是N*M,按列相连就构成N*M维矢量,可视为N维空间中的一个点,可以通过K-L变换用一个低维子空间描述这个图像。2.2 计算平均脸和相应的特征向量计算公式如下: (式2-1)则每张人脸与平均脸之间的距离向量可以表示为: (式2-2)2.3 计算特征脸设矩阵,本次试验我们选择训练样本集的类间散布矩阵作为K-L变换的产生矩阵,即: (式2-3)计算特征脸时要计算出协方差矩阵的前Z(ZN)个较大特征值的特征向量。但是由于上式是一个(92*112)(92*112)的高维向量,计算这个矩阵的特征值和特征向量的计算量非常大,所以先计算的特征值与特征向量,设它们分别为和。再将的值从大到小排列,选取前Z个特征值,使其满足: (式2-4)这里的表示样本集的前Z个轴上的能量占整个能量的以上。本次实验我们取的为99%。然后,从,计算,则由Z个可以组成一个特征脸空间。根据产生的矩阵计算出特征脸,这里要用到奇异值分解,其基本原理就是通过计算较低维数矩阵的特征值与特征向量而间接求出较高维数矩阵的特征向量(特征脸),从而达到简化计算的目的。2.4 投影将每一幅人脸与平均脸的差值矢量投影到“特征脸”空间,得到第i 个人脸的特征脸向量表示为: (式2-5)2.5 对人脸进行识别先选定一个距离阈值,如果待识别的人脸图像投影到特征脸空间后与人脸集空间中点的最小距离仍然大于这个阈值,则说明待识别人脸包含的是未知人脸。本次实验我们选取的阈值为 (式2-5)把待识别的人脸图像R投影到特征脸空间,得到: (式2-6)P与每个人脸的距离定义为: (式2-7)人脸分类的规则如下:(1)若则输入图像中包含的是未知人脸。(2)若则输入图像为库中第k个人的人脸。3 设计结果3.1 识别精度(图3-1)对应代码:3.2 特征脸 (图3-2)对应代码:3.3 脸部识别 (图3-3)对应代码:4 设计代码picnum=40 %人数allsamples=; %所有训练图像for i=1:(picnum-1)for j=1:5 %构造矩阵a=imread(strcat(E: face,ORL,num2str(fix(i/10),num2str(mod(i,10),num2str(j),.BMP);% imshow(a);b=a(1:112*92); %b是行矢量 1N,其中N10304,提取顺序是先列后行,即从上到下,从左到右b=double(b);allsamples=allsamples; b; % allsamples 是一个M * N 矩阵,allsamples 中每一行数据代表一张图片,其中M200endendsamplemean=mean(allsamples); % 平均图片,1 Nfor i=1:5*(picnum-1) xmean(i,:)=allsamples(i,:)-samplemean; % xmean 是一个M N 矩阵,xmean每一行保存的数据是“每个图片数据-平均图片”end;% 获取特征值及特征向量sigma=xmean*xmean; % M * M 阶矩阵v d=eig(sigma); % 创建对角阵d1=diag(d); %矩阵对角线元素的抽取% 按特征值大小以降序排列dsort = flipud(d1); %按上下方向翻转矩阵vsort = fliplr(v); %矩阵的左右翻转%以下选择90%的能量dsum = sum(dsort);dsum_extract = 0;p = 0;while( dsum_extract/dsum 0.9)p = p + 1;dsum_extract = sum(dsort(1:p);endi=1;% (训练阶段)计算特征脸形成的坐标系base = xmean * vsort(:,1:p) * diag(dsort(1:p).(-1/2);%base 是Np 阶矩阵,除以dsort(i)(1/2)是对人脸图像的标准化(使其方差为1) % xmean * vsort(:,i)是小矩阵的特征向量向大矩阵特征向量转换的过程%while (i0)%base(:,i) = dsort(i)(-1/2) * xmean * vsort(:,i); % base 是Np 阶矩阵,除以dsort(i)(1/2)是对人脸图像的标准化(使其方差为1)% i = i + 1; %xmean * vsort(:,i)是小矩阵的特征向量向大矩阵特征向量转换的过程%end% 以下两行add by gongxun 将训练样本对坐标系上进行投影,得到一个 M*p 阶矩阵allcoorallcoor = allsamples * base; % allcoor 里面是每张训练人脸图片在M*p 子空间中的一个点,即在子空间中的组合系数accu = 0; %下面的人脸识别过程中就是利用这些组合系数来进行识别% 测试过程for i=1:(picnum-1)for j=1:5 %读入39 x 5 副测试图像a=imread(strcat(E: face,ORL,num2str(fix(i/10),num2str(mod(i,10),num2str(j),.BMP);b=a(1:10304);b=double(b);tcoor= b * base; %计算坐标,是1p 阶矩阵for k=1:5*(picnum-1)mdist(k)=norm(tcoor-allcoor(k,:);end;%三阶近邻dist,index2=sort(mdist);class1=floor( (index2(1)-1)/5 )+1;class2=floor(index2(2)-1)/5)+1;class3=floor(index2(3)-1)/5)+1;if class1=class2 & class2=class3class=class1;elseif class1=class2class=class1;elseif class2=class3class=class2;end;if class=iaccu=accu+1;end;end;end;accuracy=accu/200 %输出识别率Shumu = 9; % 几张图片P=imread(E: faceORL001.BMP); clo,row,c=size(P); % 计算图像的行数clo和列数rowX=zeros(row*clo,picnum*Shumu);% 初始化训练集,其元素由每个人各Shumu张图像组成for i=1:(picnum-1) for j=1:Shumu strname=strcat(E: face,ORL,num2str(fix(i/10),num2str(mod(i,10),num2str(j),.BMP); P=imread(strname);X(:,i*Shumu+j)=reshape(P,row*clo,1);% 将读出来的图像数据拉长为一列,存放在X变量中 endend % 为训练集赋初值,取每个人的头shumu张图像组成训练集meanvetor = mean(X,2); % 求得总体平均图像向量for i=1:(picnum-1)*Shumu X(:,i)=X(:,i)-meanvetor;end %各图像减去总体平均图像向量得到差值图像向量pmetrix = X*X; v d = eig(pmetrix); % 计算合成矩阵的特征向量和特征值vet=fliplr(v); % 翻转vetvalue=fliplr(d); % 翻转U = X * vet;p = U(:,36);P = reshape(p,clo,row);P = mat2gray(P);figure(1);imshow(P);p = U(:,37);P = reshape(p,clo,row);P = mat2gray(P);figure(2);imshow(P);p = U(:,38);P = reshape(p,clo,row);P = mat2gray(P);figure(3);imshow(P);p = U(:,39);P = reshape(p,clo,row);P = mat2gray(P);figure(4);imshow(P);p = U(:,40);P = reshape(p,clo,row);P = mat2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年二级建造师考试试题(重点)附答案详解
- 台州科目一考试题及答案
- 小学专业标准考试试卷及答案
- 义务教育艺术新课程标准考试测试题库及答案
- 2024年咨询工程师考试题库及完整答案26
- 2024年咨询工程师(经济政策)题库含完整答案
- 航空公务员面试题及答案
- 2025环境工程考研水处理工程专项试卷及答案
- 2025年考研心理学专业基础强化试卷及答案
- 基于系统方法论的企业知识管理实施路径与创新研究
- 2025年运输经理招聘面试参考题库及答案
- 北欧风格室内设计讲解
- 2025专职消防员聘用合同
- 2025亚洲烟草产业市场供求状况及投资前景规划研究报告
- 边界联检工作总结
- XX集团董事会2025年度工作报告
- 全科医学科慢性病综合管理指南
- 2026年气溶胶灭火系统市场研究报告
- 兄弟放弃继承协议书
- 矿山个人劳务合同范本
- 2025年消防日消防月主题知识培训
评论
0/150
提交评论