




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于PCA的人脸识别算法研究毕业论文目录摘要错误!未定义书签AbStraCt错误!未定义书签.参考资料.第1章绪论11.1选题背景及意义11.2国外研究现状21.2.1国外研究现状21.2.2 国研究现状31.3人脸识别技术的研究容与技术难点 31.3.1人脸识别技术研究容31.3.2人脸识别技术研究难点 31.4本文研究容与结构安排4第2章 人脸识别相关技术介绍52.1系统概述52.2人脸识别主要技术52.2.1二维人脸识别算法介绍52.2.2三维人脸识别算法介绍62.3常用的人脸图像库62.4人脸的特征提取 72.4.1 几何特征提取法 72.4.2代数特征提取法82.5本章小结10第3章
2、基于PCA的人脸识别算法123.1引言123.2 K-L 变换123.2.1 K-L 变换原理133.2.2 K-L 变换性质143.3 SVD定理153.4距离的计算173.5基于PCA的人脸识别183.5.1 人脸的表示183.5.2特征脸空间的构造183.5.3特征提取193.5.4人脸识别203.6 MATLA仿真实现203.7结果分析263.8本章小结28第4章 与基于FiShefaCe方法的特征提取原理对比 294.1 PCA方法的优缺点294.2基于FiSherfaCe 法的人脸特征提取理论介绍 294.3 FiSherFaCe方法的优缺点 314.4两种方案的理论对比314.5
3、本章小结32结论33参考文献34致谢36附录1 37附录244附录348附录457第1章绪论1.1选题背景及意义当今时代社会高速发展,技术不断进步。自动化,智能化及科技化已是日常生 活的常态。信息的安全的重要性也日益凸显,普通的身份识别已经无法保证信息的 安全性。再加上计算机软件及硬件的性能在近几年飞速的提升,人体的生物识别技 术因其高效、稳定、快速、唯一的特性得到了相当大的重视和发展。生物识别技术 利用的主要是人体的特有特征,例如指纹,人脸,虹膜等。而人脸作为区分人与人 差异的重要特征,得到了国外研究学者的青睐。所谓人脸识别指从用计算机从图像 或者图像的序列中检测到人的脸部,对其进行身份判别
4、。人脸识别的优势具体体现 在以下几个方面1。(1) 操作具有隐秘性质,适用在监控,安全,公安等行业领域。(2) 采集时非直接接触人体,容易接受没有侵犯性。(3) 快速便捷,具有实时的追踪能力。(4) 符合人类的识别习惯,以人为本,而且互动强。(5) 图像采集的方式灵活,硬件设备(摄像头)的成本比较低。正是这些优势给人脸识别技术带来了广泛的应用前景,在国家安全领域,各种 各样的门禁系统,视频系统、监控系统、公安布控、身份验证等都是典型的应用; 在经济和民生领域中,各类存值卡,银行卡,信用卡等持有人的身份验证等具有很 高的应用价值;在娱乐领域有智能玩具,虚拟游戏玩家等有趣的应用。均可将其归 为以下
5、四大类。(1) 刑警侦查破案。事先将犯罪分子的各种信息包括人脸图片入库存储,将得到 的嫌疑犯的照片利用人脸识别技术识别后,从数据库中找出最为相似的照片,进行 比对,对破案有着很大的辅助作用。(2) 证件识别验证。居民,护照等证件都有照片,现在还多是人工验证,如果利 用人脸识别技术就能实现此类工作的自动化,智能化。银行金融部门等的身份验证, 可通过拍摄照片后与后台人脸数据库进行比对,无须密码进行交易。(3) 出入口控制。该项应用涉及到的围很广,可以是办公楼宇,小区住宅的入口 检查,或某些安全部门的入口检查。目前比较常用的是保安人员再三核查证件。这 样效率低下,也不够人性化。在一些安全级别较高的地
6、方,可以使用人脸识别,加证件识别。(4) 视频监控。现在几乎所有的办公大楼, 商场,娱乐场所等公共场合都设有 24 小时监控视频,在对这些视频图像后期集中分析与处理时,就要利用人脸的检测和 识别技术。1.2国外研究现状1.2.1国外研究现状人脸识别技术的重要性在不断凸显,很多专家学者都参与到人脸识别的研究大 潮中。目前国外有以下几种研究方法2:(1) 模板匹配,包括变形和固定模版两种方式。早期系统中固定模版使用较多, 但是由于人脸的特点具有很强的变化性,找到一些标准的模板来描述人脸的共同特 点非常困难。变形模版与固定模版原理相通,只是变形模版还包括一部分变动的元 素。这些变动元素通常通过手工和
7、系统自动构造来表示。示例学习,本方法的主要原理是在已给的示例中总结出一般性的原则。且要 求其能够在判别过程中接受所有正例并可以排斥所有的反例。人脸识别中同理,也 需要产生某种规则,要求其可以接受人脸而排斥非人脸,在判别中,在训练样本的 阶段时要用到大量的且高纬度的数据,从而提高判别的精确率。但是这同时会给后 续的算法设计增添难度。需要考虑到如何判别是不是人脸和对数据维度的降低。(3)神经网络,该方法其实同样是基于样本学习。到现在为止,神经网络的方法 取得如下成果P:MlT的学者首先在检测样本是否为人脸时应用了聚类分析的方法,利用MLP网络作为分类器,以测试样本和人脸样本子集的距离差为度量原则进
8、行分类。RaPhael则利用多层神经网络,通过CGMi MLP实现了迅速和精准的人脸检测, 且该方式可以运用到网页端的人脸图像检索中。Shang-Hung Lin等人利用神经网络建构了一个较为完整的人脸识别系统。三个 基于概率决策神经网络构成了这个系统,有人眼睛定位,人脸的检测和对人脸识别 的功能。除以上之外,Mohame还提出了基于照明、面部表情等差别产生的人脸识别障碍 的方法。其有两点创新理念:一是提取面部特征用新的多尺度方向框架。二是通过 在识别阶段改变正则变化的参数来开发共享任务产生的关系,进而可以改进多任务的稀疏学习架构。LaCramiOara还提出了基于高阶奇异值分解的新算法,此算
9、法仅利用第三阶量来编写不同的量矩阵乘法模式,该算法在识别率上比特征脸算法更加成 功。122国研究现状国的研究起步相对较晚,大概在二十世纪末才开始。雷震等人将人脸识别不仅 应用在识别人脸,还应用在了识别卡片,蔡芷玲等人将人脸识别技术运用到了安卓 设备中,这对移动设备的信息安全做出了很大的贡献。根将面部特征的人脸识别算 法和进化算法结合,提出了新的研究算法。锐则对人脸表情,光线遮挡,不同姿势 等问题提出来新的解决办法,这些办法可以进行有效的身份识别。1.3人脸识别技术的研究容与技术难点1.3.1人脸识别技术研究容人脸识别的过程就是指从图片中提取有效的特征值来表征该人脸,并以此作为 区分。人脸识别的
10、算法一般都由以下四部分组成:(1) 人脸的检测和定位4:该过程主要是从图片中检测是否有人脸,然后可以从 图片中提取出人脸。光线强弱,表情变化,头部脸部的遮挡,头部姿态、各种噪音 等造成了人脸的可变性相当高。这是一项非常复杂的技术。(2) 图像的预处理:为了增强人脸的特征,此步骤就是在识别前对图像进行各方 面的处理。方法主要有,直方图修正,锐化与平滑,灰度变换以及图像的几何校正 等。(3) 人脸的特征提取:此步骤主要是想从人脸中提取关键的特有的特征,次特征 要能够表示出该人脸的唯一性,主要有几种表示方法,几何特征法、人工神经网络 法、人脸特征脸法、模板匹配法。(4) 人脸识别:以待识别人脸和数据
11、库人脸在特征脸空间中的距离为标准,输出 最小的距离,达到身份验证的作用。1.3.2人脸识别技术研究难点人脸识别技术因其独有优势得到了不断的发展,但在此过程中还是遇到很多难 点1,如下所述:(1) 时间变动:随着时间的改变,人脸的特征会相应发生一些变化,这将对现有 的人脸库造成识别困难。因此研究时间的鲁棒性也是人脸识别算法的研究重点与难 点。 遮挡物问题:在难以配合的环境下,头发,帽子,眼镜等遮挡物这都将对人 脸的识别产生很大的影响,在图像采集的时候不能采集到完整的人脸图片,造成识 别精度的下降。(3) 姿态多变问题:目前来看研究的主要方向还都是人脸的正面部分,还有一些 变化幅度很小的侧面人脸的
12、部分。在实际的采集头像环境中,人脸的角度都是不受 控制的,当人脸的姿态有复杂的变化时,这也将会导致算法精确度的明显降低。(4) 计算速度问题5:人脸数据库中存储着大量的人脸数据,能够保证快速准确 的人脸识别是非常重要和关键的问题。随着技术不断的进步与完善,识别效果会越 来越精确。实际使用也一定会越来越智能化。1.4本文研究容与结构安排本论文以MATLA为实现工具,来研究基于PCA的人脸识别算法,要实现将待识 别的人脸图片输入系统后,能够从预存人脸库中匹配出本人的图片并输出。本论文 的结构安排如下。第1章绪论主要介绍了人脸识别算法的研究意义及其研究背景,并查阅相关文 献对国外现状进行了简要的总结
13、分析。并对人脸识别技术的研究容和研究难点做了 介绍,方便读者对其整体的理解。第2章主要是人脸识别当中的相关技术综述。对人脸识别系统进行了广义的概 括。并对人脸识别当前主流的二维人脸识别和三维人脸识别进行了简要的介绍。研 究学者们研究用的主流人脸库也做了相应简介。最后对人脸识别中最重要的部分特 征提取做了着重的介绍。第3章主要讲基于PCA的人脸识别算法,首先对该算法涉及到的原理定理一一 做了介绍,包括K-L变换原理,SVD定理,以及各种距离函数。然后是对子本次研究 的全部容分条重点介绍,主要有四大块,人脸的表示,特征脸空间的构造,特征提 取,人脸识别。并对MATLA仿真过程及结果分析进行了较为详
14、细的说明。第4章主要讲了基于PCA勺特征提取法和基于FiSherFaCe的特征提取法的比较, 简要介绍了 FiSherFaCe法的理论基础,并对两种方法的优缺点各自做了说明。综合 对比后本次毕业设计决定采用基于 PCA的人脸识别算法进行研究。第2章人脸识别相关技术介绍2.1系统概述人脸识别技术是模式识别技术中非常重要的应用方面67,可分为三大方面,是对人脸的图片进行预处理;二是特征提取;三是比较识别。人脸识别系统一般由 以下步骤组成:人脸的检测、人脸的定位、图像的预处理、提取特征、图像训练、 图像识别对比等步骤,系统的流程图如下图所示:图2-1人脸识别系统流程图2.2人脸识别主要技术目前人脸识
15、别的算法主要有两大类8:二维的人脸识别算法和三维的人脸识别算 法。下面分别简要介绍。2.2.1二维人脸识别算法介绍本论文研究的是二维图像的人脸识别算法,该算法通过提取人脸的主要特征进 行人脸比对。目前二维人脸比对的方法主要有以下集中:(1) 主成分分析法:该方法一直是模式识别这一领域基础而又重要的方法,也是 人脸识别领域的重要算法,此算法首先根据预存的人脸图像来构成特征脸空间(2) 人脸模板匹配法:按维度可分为二维人脸模板和三维人脸模板,主要根据人 的脸部特征来构建一个立体并且可调节的人脸模型,在定位到人脸后,就需要用人 脸模型来定位和调节人脸的各个特征部位,用来处理识别过程中涉及到的人脸角度
16、、 表情变化和遮挡物等因素的影响。(3) 局部投影保持法:该方法是源于子空间分析方法,是非线性方法的线性近似。 此方法不仅有能够原始图像非线性流形的优点,又有能够得到新样本点低维度投影的优势(4) 人脸子空间分析法:该方法已经成为人脸的特征提取的重要方式,也是目前 人脸识别的主流。因为其可以对人脸有很强的描述性,而且计算量相对较小,容易 实现和可分性较好均是该方法的优点。除上述提到的四种方法之外,二维的人脸识别算法还有支持向量机法、人工神 经网络法、弹性匹配法和基于人脸积分图像特征的方法。222三维人脸识别算法介绍二维人脸识别算法的识别率容易受到人脸角度变化、遮挡物、表情变化的因素 影响。但这
17、些因素都是日常生活常见且不可控的,所以需要研究更加先进的算法, 三维人脸识别算法根据深度图像来进行研究,对以上那些因素都能有较好的解决方 式。三维人脸识别算法主要有以下两种9:(1) 基于人脸模型可变的参数法:利用人脸模型的3D形变以及迭代距离当中映射的最小值来还原出3D的人脸图像和头部的姿势。改变关联的关系还可以更新头部 姿态的参数,此过程可用来达到最小化尺度的要求。(2) 基于人脸图像的特征法:要想从人脸的 3D结构中把姿态分离出来,就需要 计算人脸的三维空间方向,并算出人脸整体的轮廓和尺寸。然后可以通过保持姿态来匹配脸部的特征点。2.3常用的人脸图像库人脸识别技术已成为热门的研究容,为了
18、方便研究学者的使用,目前国际上有 和多家权威的机构构建了标准人脸库,主流的有以下几种 10。(1) ORL人脸库,美国的一家专业从事人脸图像研究的实验室拍摄的一组人脸图像,构成的ORLA脸库,参与拍摄的人来自不同的种族、不同的性别、不同的年龄, 共计四十个人。每名试验者都拍摄十图片,图像均为灰度图像,像素是112× 92。每个人的十照片中表情,人脸大小,姿态等都是变化的。该数据库包含了大量的人脸 信息,研究起来非常方便。(2) FERET人脸库,该数据库是最大的人脸数据库,是英国国防部建立的。它里 面的人脸图像有着肤色和人脸角度的变化。测试者的背景图像都是统一的,每位都 有8图片,从
19、而可以最大限度的排除外界干扰。本数据库在人脸数据库中是相当权 威的,但它的不足是获取图像信息时不是很方便。(3) ESSeX人脸库,英国埃塞克斯大学建立了该人脸数据库,并为研究者提供免费的下载,但是不允许发售和打印。计算机视觉研究项目额度负责人LibOr SPeaCek博士负责维护该库。ESSeX数据库中包含四个库,它们分别是grimace,faces94 ,faces95,faces96。其中faces96和grimace是难度非常大的,也是最不容易识别的。因为它们的 背景、人脸表情、人脸比例大小都是变化的。本论文采用的是 ORL人脸数据库,库中有二十位测试者的照片,每图像占存 11.1kb
20、 ,像素为92× 112,格式为bmp格式。每位测试者有六图片,每图片均有表情 的变化,且有一定的遮挡物,如眼镜等,每位测试者的照片都与正脸有小围的倾斜 角度。用每位测试者的五照片组成训练样本库,用另一作为待识别的人脸库。2.4人脸的特征提取人脸的图像在最初的样本空间中的分布并非集中的,这一点常常不利于用来进 行有效的归类识别。为了能区分不同类别的人脸图像,可以把原始的人脸图像转换 到另外一个空间中通过线性或者非线性的方法。这样就会使得同类型的人脸图像在 空间的分布中更加集中,方便识别和归类。特征提取就是指通过变换或是映射的方 法将高维空间的原始特征转换到低维特征空间中,得到低维的人
21、脸特征表示。人脸 的特征主要分为两大类,代数特征和几何特征。2.4.1几何特征提取法人脸的几何特征即人脸的器官形状和几何关系为基础的特征矢量,它的分量通 常包含人脸指定的两点之间的欧氏距离,角度,曲率等。人脸上典型的几何特征分 量有以下几种11:(1)眉毛的弧度 眉毛的厚度以及眉毛对应的眼睛中心处的垂直距离(3) 鼻子的宽度和其垂直位置(4) 鼻子处人脸的宽(5) 鼻尖到眼睛中心位置处的距离,称为半脸宽(6) 嘴的宽度,厚度,垂直位置及其上下唇的厚度人脸几何特征具有提取速度快,占用存少的优势。但是在识别的精确度上不如 基于代数特征的方法。它对几何参数的测定要求需精确因此在有遮挡物或是人脸图像质
22、量不好的情况下,它的识别率会剧烈下降。所以我们把人脸的代数特征讨论作 为重点。本论文也采用的是人脸的代数特征法。242代数特征提取法人脸图像代数特征的矢量表示即人脸的代数特征,相当于人脸图像在特征脸构 成的低维空间上的投影。Kirby等首次将主元分析的子空间思想引进到人脸识别技术 当中。并取得了较大的影响。并引起了研究学者们的广泛关注,进而成为了目前人 脸识别算法中主流方法之一。子空间方法的主要思想就是空间变换,根据一定的性能目标去寻找线性的或者 非线性的空间变换,将高维的原始信号数据压缩到低维的子空间当中,这样会使得 数据的分布更加紧凑一些,为更好的进行数据描述提供了方式。此外还将计算的复
23、杂度大大降低。子空间方法可以分为线性和非线性的子空间发,下面介绍一下线性 子空间法。线性子空间法指空间变换时是线性的,用来将原始的人脸数据压缩到低维子空 间当中。常见的有主元分析法、线性判决分析和独立元分析的方法。主元分析法12,由于本论文就是基于PCA的人脸识别算法研究,所以在此重点介 绍。PCA法的目的是找到一组最优的单位正交向量基即主元,这一过程是通过线性变换来完成的。用这些主元的组合来对原样本进行重建。并要求重建后的样本和原样 本之间的误差是最小的。从数学上讲,主元分析法的思想就是通过特征值来对角化协方差矩阵SO1 N- TS(Xi X)(Xi X)TN i 1(2-1)S(2-2)N
24、代表样本的总个数,X是所有样本的平均值,特征值需按降序的顺序排列,123N,一般情况下选择对应的前 m个(mvvn)非零的特征向量来作为主元。这样样本置于特征子空间的位置就可以用低维子空间的投影系数a来表示:(2-3)通过PCA特征提取即可得到一些比较标准的人脸的特征向量,这些特征向量的 线性加权组合就可以用来表征人脸的图像。Turk和PenIand在1991年首次提出了特征脸方法-基于PCA勺人脸识别方法13 C 他们在论文中写道,人脸识别中利用主元分析能够得到人脸在低维度空间中的线性 表示,而且可以使人脸有较好的可分性质。高维空间中的图像在经过主元分析方法 后,就能够得到一组全新的正交基,
25、人脸的低维度空间就是由这些正交基构成的。 将这些低维度特征空间下的正交基根据图像阵列去排列,能够明显的看出这些正交 基呈现人脸的形状。所以这些正交基得名为特征脸,此人脸识别的方法就叫做特征 脸法。主元分析法中一般是根据对应的特征值的大小来确定选取的主元的优先级。特 征值越大,所含信息量越大,就代表其优先的级别越高。在人脸识别中,要想确定 最佳主元的数量,有这样两种方式可供选择,一是提取特那些征值比较大的主元, 舍弃那些特征值小于某个指定值的主元;二是已经选取好的特征值要占百分之九十 总的特征值的和。主元分析法就是把现有的样本进行一次最优的重构,是针对一个样本,所以对 于体现不同类样本差异,达不
26、到最优的情况。以这个角度来说,用主元分析法来对 人脸特征进行识别是不够充分的。线性判决分析,LDA也称为FiSher线性判别,1996年由BeIhUmenur引进模式 识别和人工智能这一领域。LDA的基本思想是将高维度下的模式样本投影到最佳鉴别 矢量空间,能够达到提取分类信息和降低特征空间维数的效果。它与主元分析法的 区别之处是,LDA是从样本的可分性出发,求得一组线性变换来使得每类离散程度最 小,同时每类类间的离散程度最大。经常用到的是FiSher准则函数,该函数的定义为:J( )I TSh IJ( ) arg max TS(2-4)其中Sl和S分别为类间离散度和类离散度为:CShN( t
27、)( tt 1)tSC(Xi )( Xi)Ti 1 X X(2-5)要想求解FiSher准则函数,就需要先求解S 1Sh的特征值。但是把LDA应用在人脸识别上,很多情况下没有直接的办法求解FiSher准则函数,都是因为训练样本的数量不能够保证S为满秩。为此,有人提出将PCA和LDA结合起来1415,也就是先 利用PCA来对原始数据样本降低维度,可以得到表示原始样本数据最优特征的子空 间。而且类散布矩阵在这个子空间属于非奇异矩阵,然后可以利用LDA方法继续进行。独立元分析,ICA理论的基本思想是从一组混合的观测信号中分离出独立的信 号,或是尽可能用独立的信号对对其他信号进行表征。ICA是通过线性
28、变换在训练的 样本当中寻找到含有高阶统计信息的相互独立的一组基。用它来对样本数据进行描 述。PCA是在二阶统计意义下的去相关, 而ICA是所有阶统计意义下的去相关。因此 求解它很不容易。目前又三种主要方式可用来求解:一是固定点算法;二是信息论 法;三是联合近似对角化特征矩阵的方法。三种方法中第一种最为简单快速,它将 求解独立元 简化为简单的迭代步骤,如下:*(k) C1EX( (k I)TX)3 3 (k 1)(2-6)*(k), T厂(k)TC *(k)(2-7)ICA算法最早只是运用在信号的分析上,后来才引进到人脸识别技术中,并起到 期望的效果,得到了发展。2.5本章小结人脸识别技术涉及到
29、很多方面,图像处理,特征提取,图像识别等过程,每一个过程都有多种主流算法,每一个过程都是重点难点,本文研究主题是基于PCA的人脸识别算法,所以本章首先对人脸识别的主要技术,二维人脸识别算法和三维人 脸识别算法做了简要介绍,然后对人脸识别的关键步骤特征提取进行了重点说明, 最后简要介绍了当前研究学者们经常用到的主流的人脸图像库。.参考资料.第3章基于PCA勺人脸识别算法3.1引言特征提取正在人脸识别步骤中占有十分关键的地位,人脸识别的有效性精确性 的关键就在于是否可以提取出有效的人脸特征,人脸的构成非常复杂同时还在不断 的变化。这是一个高维度下的模式识别问题。寻找到有效的特征是非常困难的。人 脸
30、图像进行特征提取主流方法有两种:人脸几何特征提取法和人脸代数特征提取法, 在前面的文字中介绍过,几何特征主要是人脸五官之间的几何关系,一般包括角度, 欧氏距离和曲率等特征。代数特征提取法其实就是把人脸构建成一个数据矩阵,通 过提取矩阵的特征来进行人脸识别,比对。本次论文拟采用代数特征提取法。一般一人脸图像的维数是非常高的,这样处理起来的计算量很大,不利于图像 的处理。此外在高维空间人脸图像分布集中非常不利于区分。为了区分出人脸图像, 引入了主成分分析法,它的主要应用是将高维空间中的主要提取出来,以此解决维 数过高的计算量以及数据冗余问题。对人脸图像的特征提取一般指的是将待识别人 脸图像投影到特
31、征脸空间。一般来说,投影满足两个条件,第一,人脸的主要信息 要保留在特征脸空间中。第二,投影后的图像维数要远远小于投影前的维数。基于PCA的人脸识别算法,首先应用 K-L变换,求出训练人脸空间的特征值, 对特征值进行一定的取舍,然后构成一个新的低维正交基空间。我们将所有的人脸 投影在这个低维空间中,然后计算与待测图像的人脸最近的人脸图像,上述可分为 以下四个阶段10(1) 训练人脸数据库,根据待训练的样本图片数据矩阵构造特征脸空间;把训练的样本图片映射到(1)中构造的特征脸空间上;(3)把待识别的人脸图片也投影到特征脸空间中;比较图像在特征脸空间中的距离,输出距离最小的作为识别结果。在求步骤(
32、1)中的特征脸空间,要用到K-L变换和SVD定理来对数据矩阵进行维 度的降低,并经过一定的取舍后,构造出一组新的低维正交基空间。步骤 中用到的距离本文采用欧氏距离。3.2 K-L变换K-L变换是建立在统计基础上的一种变换,有的文章也称权威主成分变换或是霍特林变换。由于霍特林在1993年最先提出将离散的信号变成一串不相关系数的方法。 得到的协方差矩阵除对角线上的其他元素均为零,因此可以知道数据之间是没有相 关性的,所以该方法的优点就是去相关性好,在数据的压缩方面起到了相当显著的 作用。3.2.1 K-L变换原理假设f是一个NXl的向量集合f =f1,f2,f3,fn,fi是变量f的均值,统计1
33、N ZE(f )-fiN i 11 N ZrIrN-Tl(f)(f)Tf i f i JN i 1N i 1 i iN各样本向量近似为下式11(3-1)f的协方差定义为:CfE( f )(f)T(3-2)i是协方差矩阵的特征值,i是协方差矩阵的特征向量,根据下述公式求协方 差矩阵的特征向量和特征值。Cfii i,0 i N 1(3-3)变换矩阵 是特征向量构成的1,2 . n (3-4)*为正交化后的矩阵,*TA。一维的K-L变换就可定义为下式:F= *(f)A(f)(3-5)反变换定义为:(f )*FArF(3-6)在对图像信号进行变换时,为了得到图像矢量,可将其按像素行行排列或者列 列排列
34、。像素之间的相关性可以通过矢量之间的相关性体现,建立好矢量信号X 后,就要计算协方差矩阵CX然后计算的特征矢量就能够得到 K-L变换矩阵AO322 K-L变换性质(1) 变换后的矩阵F均值为OFE(F)EAff )(3-7)(2) 变换后的矩阵F协方差为OAEf )AEf )(3-8)(3)变换后的矩阵F为对角矩阵T aTaCfaCFACf ATa2anTanTaTa21a12a2nan TaTa2aia2anFE(F)EAff )TanTan(3-9)因为CF是对角矩阵,所以其中各个元素互不相关(5)特征值i表示特征向量q方向上f的第i个元素的方差,由于K-L变换是正 交对称的,所以下式成立
35、。A1 Ar f Ar F(3-10)向量信号进行K-L变换后是值是不变的,只是各个分量变换后的值改变了。通 常情况下,经过K-L变换后,会出现很多相当小的值。这就意味着,保留主要特征 同时又能够降低数据的维数。这一性质就能够运用在数据压缩当中。主特征分量具有四大性质15,一是稳定性,如果输入信号发生比较小的变化时,所求得的主要特征只会发生更加微小的变化,这说明图像噪声将不会对其造成比较 大的影响。所以输入就可以有更加宽松灵活的围。二是映射为线性关系,而且矩阵 已经正交归一化,训练空间中的每一个模式都有对应的唯一的特征向量。因此可以 知道主要信息并不能够随着模式的改变而改变。三是经过映射后,模
36、式之间的距离 也会变小,多维空间的分类将变得可能。四是主特征分量是以重建误差最小的原则 上构建的,这说明主特征有重构功能,即主特征具备图像重建的能力。主特征数量 的多少也决定着重构的图像质量的好坏。K-L变换就是能够在原始的人脸样本空间中求取一组正交向量,保留其中主要的正交向量构成新的人脸空间。如果人脸图像在这个新的低维度空间的投影具有可分 性,这些投影就可作为可识别的特征向量。原始的人脸空间总体散布矩阵的特征向 量即为这组正交向量,它们可构成脸的形状,所以得名为“特征脸”。3.3 SVD 定理SVD定理即奇异值分解定理。人脸复杂度很高,维度也很高,普通矩阵的特征值和特征向量通常可以通过 K-
37、L变化来得到,但是人脸图像这种高维度举证求解特征 向量很困难,因此需要通过 SVD定理来解决此问题。奇异值A为KKT和KTK的特征值的非负K为m× n(m>>n)维矩阵,它的秩为R,平方根。那么一定存在两个正交矩阵满足下式U1,U2, UmMM,, VnRm n, UUr 1Rm n ,VVt 1(3-11)可使得UTKV(3-12)r(3-13)i是K的奇异值,令123r,KKT和KTK的特征向量分别为diagUi,Vi。根据SVD定理Ui1 KVi,i(3-14)KKr的特征向量和特征值可以通过KTK的特征值和特征向量间接求得。定理1:设K为任意的一幅人脸图像,它的奇
38、异值向量可有如下定义X ( 1,k)(3-15)T kUkVk k1nU1VnTk21U2V1T nk2nU2VnT那么K就可以展开为下式:K IUyIT.kTK1 U 1.km1UnV1Tkmnuny(3-16)定理2:根据式(3-16)很方便得出下述定理对于任意的一幅人脸图像K Rmn,假设U Rmm,VRnn分别为人脸图片K奇异值分解时对应的左右正交矩阵,那么矩阵UVIT, um是矩阵空间Rmn中的最大线性无关组矩阵,即为 Rmn中的一 组基。ui,vj(i1,. mj 1, n)代表矩阵U的第i列和矩阵V的第j列。由上述可得以下结论,人脸图像本身决定着其奇异值向量所在的基空间(矩阵)。
39、根据式(3-16)说明人脸图片K Rmn可以精确的通过矩阵UVIT,uv2t,. uJ 的线性组合来表示,其中(k11,k12, kmn)是人脸图片K在这个基空间下的坐标。K 的奇异值i i 1,2,. k就是图像K在这个坐标系下对应基矩阵UiViT(i 1,. n) 的坐标分量,所以可以得到人脸图像本身决定着其奇异值向量所在的基空间 (矩阵)。经实验可知,把同类图像相互之间的奇异值向量进行交换或是把不同类图像的 进行交换,经过重构后,得到的图像均与原图像的类别一致,但是如果保存奇异值 不便,而交换非同类图像见的左右正交矩阵,将不能得到原图像类别相同的重构图 像。这表明一个问题,在不同类别或相
40、同类别中,人脸图像有可能有相同的奇异值 向量。就本论文采用的ORL人脸库来说,共采用了 100训练人脸图像,待识别人脸图 像库有20图像,每图像的像素为 92× 112,那么人脸样本集的训练矩阵维数就有 10304× 100.,协方差的矩阵维数就有10304× 10304。由SVC定理可知,协方差矩阵 的特征值和特征向量可通过矩阵获得,维度为100X100。所以可以大大的提高计算机的运行速度。3.4距离的计算17。本论文运用的识别原则是,预存人脸库中与待识别人脸图像距离最小的作为输 出的识别结果。现在介绍几种距离的求解方法(1)欧氏距离:d(,y)n(Xii 1(
41、3-17)(2) 绝对值距离:d(X,y)Xcos( XIy)nXiyii 1nXii 1(3-18)(3) 明氏距离:d(X,y)XXi yi(3-19)d(,y)(4) 马氏距离:量纲无关,排除变量之间相关性的干扰 n Xiyii 1. i(3-20)i为其对应的特征值。夹角距离:d(x,y)icos( XIy)nXiyii 1nn2Xii 1 i2yi1(3-21)3.5基于PCA的人脸识别前面讲了基于PCA的人脸识别算法要用到的基本原理,下面讲三大主要步骤的 实现。分别是构造特征脸空间,投影,比较识别。3.5.1 人脸的表示在计算机中,可将人脸图像读入为数字矩阵或数组6,用B(i,j)
42、表示,行和列的 下标分别对应了人脸图片上的每一个像素点。而矩阵中的对应元素Bj则代表改点的灰度值。-n×m大小的人脸图片可以构成一个n×m的高维向量。X( b11b12. b1nb21b22 b2m bn1bn2 bm)(3-22)人脸图像训练样本集可用矩阵X来表示X x1, x2 Xp(3-23)上式中的P代表样本训练集中人脸图片的数量。在本论文中P为100.3.5.2特征脸空间的构造人脸图像样本集中图片的数量为P=100,维数为n× m即92×112,则人脸图像训练样本集合可表示为Xx1, x2. xp(3-24)每一图片Xi都是一个n×m
43、维的列向量对人脸图像进行标准化处理:(3-25)_X是训练样本集的平均图像,X (X X) / DPXXiP i 1 iI PD(XiX)( XiX)P i 1D为方差:(3-26)样本的协方差矩阵为:R 丄 XiXiT 丄 XXTPiiP(3-27)由(3-26)可知协方差矩阵的维度为n2mf的实对称矩阵,接下来就需要求矩阵R的特征值和特征向量UTRU(3-28)对角阵就为特征值组成的,正交矩阵 U为特征值对应的特征向量。1.,U Ui,U2.UnP(3-29)选择前M(MVVP个比较大的特征值对应的特征向量,组成的特征空间U为:UUi U . Um(3-30)3.5.3特征提取(3-23)
44、可知,训练样本为特征提取就是人脸空间到特征空间的映射。由式XX1,X2.X100,特征提取需要以下过程:(1) 平均脸的计算:1 100 XXi100 i 1(3-31) 训练样本中的图片和平均脸的差:di Xi X,i 1,2,.,100(3-32)(3) 协方差矩阵为:(3-33)(4)求矩阵AA的特征值及其对应的正交归一化特征矢量R100-didiAAT100 i 1ii100(5) 选取前N个最大特征值及其对应的特征向量:(6) 求R的正交归一化特征向量:(3-34)(7) 特征空间 U(we?,. UN)(8) 把样本空间中每一幅人脸与平均脸的差值矢量投影到特征脸空间,即UTdi(i
45、1,2,.,100)(3-35)3.5.4人脸识别把待识别的人脸图像和预存数据库中的人脸图像投影到特征脸空间中,在特征 脸空间中每人脸图片都有唯一的坐标,通过计算待识别人脸照片的坐标与预存数据 库中的每人脸的坐标的距离值,那么距离待识别人脸图像距离最小的人脸就是被识 别出的图像。人脸间的距离本文使用欧氏距离进行计算。距离表达式如下:n1d(x,y)X y(Xiyj22i 1(3-36)3.6 MATLAB仿真实现本论文的仿真实现是基于MATLABR2014a上运行实现的10,系统可以实现的功能 是在待测试的人脸数据库中选取一人脸图片输入系统运行后,可输出一预存人脸数 据库中和此图片为同一个人的
46、人脸。本次仿真利用ORL人脸数据库,该库中的人脸图像尺寸大小均相同,预存人脸库中存了100照片,共20个测试者,每人五照片,表情,姿势都有不同程度的变化。运行程序,分别选择预存人脸数据库和待识别人 脸数据库的路径,输入待识别的人脸图像的名称,最后显示识别了的图像系统的流 程图如下:选选创疋疋建预待预存识存人k-别人脸的脸数人向据脸量库昭八、片库图3-1系统主流程图(1)输入预存人脸数据库,本系统运行第一步就是选择要输入的预存人脸数据 库,该数据库中包含20个测试者,每人5图片,共有100人脸图像,每图像的拍摄 角度都是正面,但有一定的姿势变化,无明显遮挡物,有眼镜等小的遮挡物,每图 像的大小为
47、 92*112 ,图像的格式为bmp格式。该数据库的图像按顺序命名为1.bmp,2.bmp ,直到100.bmpo此方法是为了后续统计该系统的识别率方便而使用。 如下图3.2所示:4bmp5Jbm6. bmp7.bffipft.bmp10.bmpli.bmIitxnpISrbirp14.bmp15.bmp16-bmp!/.bmp19 JbmPi.bmp J Ibmp22.brrp22 bmp24. bmp25.bmp 26bmp17 br23bnIP291JInP30l>,31rLirr 3 2. bn I 37.bmp 38.bmp 39 Iixnp41. bmp42.bmpdl.bm
48、p4d.bmSAbmpbmp图3-2预存人脸数据库运行系统时,选择训练人脸数据库图片如下所示h >卜豆畫代码理吩b(d. ecct training djjbase Fat图3-3选择预存人脸数据库(2) 选择待识别人脸数据库,待识别人脸数据库由20人脸照片构成,格式为bmp也是按顺序命名,与预存人脸数据库中的图片都是同一拍摄背景下,如下图所示,1.3 ITlPZtJrnD3.farrso4.bpbbrrp&bmp7.bmp9 JbmpLOlbrnPll.bmpINbEPb<mp3br PIdlbmPISJblriP16.bmp17-bmpISlbmP19 biDJOblm
49、o图3-4待识别人脸数据库图3-5选择待识别人脸数据库(3) 选择要识别的人脸图像,输入1-20以的任意数字图3-6输入任一待识别图像 创建预存人脸向量库,在系统中创建函数CreateDatebaSe ,该函数输入有一 个为,训练人脸数据库的路径,在本论文中指TrainDatabase,输出就为预存的人脸向量库。输出为预存人脸向量库TO主要实现的功能是将预存人脸数据库中的图像转 化为列向量来构成预存人脸向量库 To第一步,读取训练数据库数据库路径,统计样本所含的图片数Train_NUmber。第二步,把每一图片都转化为n×m行,一列向量。第三步,把所有图像组成一个n×m行,
50、100列的新矩阵To步骤二三的实现代码如下所示T =;for i = 1 : Train_NUmberStr = in t2str(i);Str = StrCat('',str,'.bmp');Str = StrCat(Trai nDatabasePath,str); img = imread(str);irow icol = size(img);temp = reshape(img',irow*icol,1);T = T temp;End(5)构造特征脸空间,本系统中Eigenface函数来实现特征脸空间的构造这一过 程。该函数的输入为预存人脸向量库
51、,输出为三个,矩阵T的每一行数据的均值 m 每人脸向量与平均脸形成的差值矩阵 A,以及特征脸空间Eigenface。首先,求均值 m其次计算每一幅图像相对均值 m的差值,将其按行扩展放入到矩阵 A中。通过A 求出预存人脸数据库中所有图像样本协方差矩阵的特征向量和特征值。利用SVD定理求得AAT的特征向量和特征值,最后将人脸偏差矩阵投影到由特征向量构成的空间 中,就得到了特征脸空间该函数的流程图如下图所示:图3-7 Eigenface 函数流程图结束求平均脸的代码如下所示:fun ctio n m, A, Eige nface = Eige nface(T)m = mean( T,2);mean
52、 _face=reshape(m,92,112);Image_mea n=mat2gray(mea n_face);imwrite(lmage_mea n,'mea nface.bmp','bmp');Train_NUmber = SiZe(T,2);运行代码,输出平均脸,如下图所示图3-8平均脸A =;for i = 1 : Train_NUmbertemp = double(T(:,i) - m;A = A temp;endL = A'*A;V, D = eig(L);上述代码可求出特征向量及特征值下面代码是实现特征值的选取,选取原则是按照特征值&g
53、t;1来选取,并输出选取的特征值占总特征值的百分比。L_eig_VeC =;eico Un t=0;for i = 1 : SiZe(V,2)if D(i,i)>1eico Un t=eico Un t+1;L_eig_VeC = L_eig_VeC V(:,i);endendperc=eico Un t/size(V,2);运行系统后可知,保留1的特征值,即保留了 98%勺人脸特征。 人脸识别,本系统创建函数 Recognition。该函数输出已经识别了的图像名 称,输入为差值矩阵A,特征脸空间Eigenfaces ,待识别的人脸图像和平均脸 m首 先将每个预存人脸图像重新在特征脸空间
54、上投影,其次把待识别人脸图像转化为灰 度图像,将其转化为一维列向量,再计算预存人脸图像与均值m的差值。然后将差值投影到特征脸空间。最后按照欧氏距离的计算方法计算待识别的图像与预存数据库中的人脸图像的距离作为识别结果。该函数的流程图如下:将预存人脸投影到特征脸空间待别脸影特脸间 将识人投到征空算影待别脸预人的离 计投后识人与存脸距输出 距离 最小 的图 像结束图3-9 ReCognition函数流程图该函数的主要代码如下:EUC_dist =;for i = 1 : Train_NUmberq = PrOjeCtedImages(:,i);temp = ( norm( PrOjeCtedTeStImage - q ) )2;EUC_dist = Euc_dist temp;endEuc_dist_min , RecogniZed_index = min(EUC_dist);
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 旋律描绘与乐理思维的结合试题及答案
- 消化道初学试题及答案
- 建筑施工现场安全防护措施试题及答案
- 安全工程师考试更新信息试题及答案
- 房地产企业2025年风险管理与财务风险防范措施研究报告
- 2025护士条例考试题库及答案
- 安全工程师考试策略分析试题及答案
- 本科经济管理试题及答案
- 教育行业教育游戏市场2025年发展趋势与商业模式研究报告
- 精准掌握商务英语考试技巧的全景剖析试题及答案
- 《思想道德与法治》课件-第三章 继承优良传统 弘扬中国精神
- NB/T 11646-2024井工煤矿采空区自然发火监测预警技术规范
- 2025年劳动与社会保障专业考核试卷及答案
- 《危险化学品企业安全生产标准化规范》专业深度解读与应用培训指导材料之1:1范围+3术语和定义(雷泽佳编制-2025A0)
- 上海上海闵行职业技术学院招聘60人笔试历年参考题库附带答案详解
- 第18课《井冈翠竹》课件-2024-2025学年统编版语文七年级下册
- 第16课《有为有不为》公开课一等奖创新教学设计
- 【MOOC】《思想道德与法治》(东南大学)章节中国大学慕课答案
- MOOC 中医与辨证-暨南大学 中国大学慕课答案
- 工程概预算定额讲义
- 【大学课件】色彩构成
评论
0/150
提交评论