毕业设计(论文)-基于PCA算法的人脸识别.doc_第1页
毕业设计(论文)-基于PCA算法的人脸识别.doc_第2页
毕业设计(论文)-基于PCA算法的人脸识别.doc_第3页
毕业设计(论文)-基于PCA算法的人脸识别.doc_第4页
毕业设计(论文)-基于PCA算法的人脸识别.doc_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

太原科技大学毕 业 设 计(论 文)设计(论文)题目:基于PCA算法的人脸识别姓 名_ _学院(系)_华科学院_ 专 业_通信工程_年 级_08级_指导教师_ _ 2012年 6月 太原科技大学华科学院毕业设计(论文)太原科技大学毕业设计(论文)任务书学院(直属系):电子信息工程系 时间:2012年 1月 14日学 生 姓 名姜锐指 导 教 师牛雪梅设计(论文)题目基于PCA算法的人脸识别主要研究内容首先学习了PCA算法的基本知识和原理,学习在Matlab环境中实现PCA算法在人脸识别方面的应用并仿真。 研究方法在Matlab环境中应用PCA算法对人脸识别进行应用的仿真。主要技术指标(或研究目标)1、 掌握Matlab软件的应用及PCA算法。2、 实现PCA算法在人脸识别方面的仿真及对其进行分析。教研室意见教研室主任(专业负责人)签字: 年 月 日 说明:一式两份,一份装订入学生毕业设计(论文)内,一份交学院(直属系)。目录摘要ABSTRACT第1章 人脸识别概述-1- 1.1 人脸识别技术3 1.2 人脸识别的研究背景及意义4 1.3 人脸识别理论的发展5 1.4 人脸识别的难点6第2章 人脸识别的常用算法9 2.1 人脸识别常用方法9 2.2 PCA方法的优点10第3章 PCA人脸识别方法12 3.1 简介12 3.2 问题描述12 3.2.1 KL变换原理13 3.2.2 利用 PCA 进行人脸识别14 3.3 PCA 的理论基础15 3.3.1 投影15 3.3.2 PCA 的作用及其统计特性15 3.3.3 特征脸17 3.3.4 图片重建17 3.3.5 奇异值分解(SVD)18 3.3.6 利用小矩阵计算大矩阵特征向量18 3.3.7图片归一化19第4 人脸识别系统的设计及实现20 4.1 人脸识别流程20 4.2 离线学习和在线匹配21 4.3 人脸识别中PCA算法步骤及过程22 4.4 实验及结果分析23第5章 影响人脸识别的几个因素及人脸数据库介绍26第6章 总结与展望30 6.1 总结30 6.2 展望30参考文献32致谢33附件34基于pca算法的人脸识别摘要生物特征识别技术使用了人体本身所固有的生物特征,与传统的身份识别方法完全不同,具有更高的安全性、可靠性、和有效性,越来越受到人们的重视。人脸识别技术作为生物特征识别技术的重要组成部分,在近三十年里得到了广泛的关注和研究,已经成为计算机视觉、模式识别领域的研究热点。人脸识别在公共安全、证件验证、门禁系统、视频监视等领域中都有着广泛的应用前景。本文是在人脸数据库的基础上做人脸特征提取和识别研究,主要内容如下:(1)对人脸识别研究的内容、相关技术、主要实现方法及发展历程作了详细介绍。(2)介绍主成分分析法(PCA)、K-L变换,并利用特征脸方法实现了人脸识别。(3)给出了基于matlab环境的编程及实验结果,并对结果进行分析。关键词: 人脸识别,特征脸,K-L变换,主成分分析。PCA Based Face Recognition AlgorithmABSTRACTBiometics,because of using the proper living creature characteristic of human body,is the totally brand new technique different from traditional personal ideniification method and it has the better safety,dependable with the usefulness,and it was payed great attention.Face recongnition is an important component of biometrics and in all kinds of methods,it is also one of the most active and challenging tasks for computer vision and pattern recognition in recent 30 years.Face recognition has a wide range of potential app1ications in the areas of public security,identification of certificate,entrance control and video surveillanee.This paper mainly studies the approaches to the features extraction and recognition in the face database.The main contents are as follows:(1) Give a full introduce to the contents of face recongnition,related techonology,the main implement methods and its development history.(2) Give a introduce to the Princeple Components Analysis(PCA),K-L translation,and realized it via eigenface method.(3) Programed it based the matlab environment and provide the experiment result and analysised it.Key Words: Face Recongnition, Eigenface, K-L Translation, Principle Component Analysis第1章 人脸识别概述目前,在个人身份鉴别中主要依靠ID卡和密码等传统手段,这些传统手段的安全性能较低,都是基于“What he possesses”或“What he remembers”的简单身份鉴别,离真正意义上的身份鉴别“Who he is”还相差甚远。依靠传统方法来确认个人身份越来越不适应现代科技的发展和社会的进步。生物特征识别技术给可靠的身份鉴定带来了可能。最近,国际生物特征组织(IBG)对生物特征识别技术做了较详细的市场分析和预测,其结果显示,全球生物特征识别技术2009年的产值将为34亿美元,预计到2014年将超过93亿美元,市场潜力非常巨大1。生物识别技术是指利用一个人固有的生理或行为特征进行自动的身份认证。只有满足以下几个条件的生理或行为特征才能被用做生物识别特征:1)普遍性。即每个人都要具备这种特征。2)唯一性。即不同的人应该具备不同的这种特性。3)持久性。即这种特征不随时间地点的改变而变化。4)可采集性。即该特征可以被定量地测量。研究和经验表明,人脸、指纹、手型、掌纹、虹膜、视网膜、签名、声音等都满足这些条件,可以用于识别人的身份。基于这些特征,人们发展了人脸识别、指纹识别、语音识别、虹膜识别等多种生物识别技术。在所有的生物特征识别技术中,利用人脸特征进行身份识别是最自然、最直接和最友好的手段。与其它生物特征识别技术相比,人脸的获取非常容易,几乎可以在被采集对象无意识的状态下获取人脸图像,这样的取样方式没有“侵犯性”。人脸识别技术是一种重要的生物特征识别技术,应用非常广泛。人脸是自然界存在的一种特殊的复杂视觉模式,它包含及其丰富的信息。首先,人脸具有一定的不变性和唯一性,人脸识别是人类在进行身份确认时使用最为普遍的一种方式,人脸图像还能够提供一个人的性别、年龄、种族等有关信息。其次,人脸也具有多样的变化能力,从人脸的不同表情人们可以感知到一个人的情绪、感受、甚至秉性和气质。它无需特殊的采集设备,系统的成本低,而且自动人脸识别的使用非常自然,可以在被识别对象毫无察觉的情况下进行,是一种非常受使用者欢迎的方式。虽然人类在表情、年龄或发型等发生巨大变化的情况下,可以毫不费力地由人脸来识别某一人,但要建立一个能够完全自动进行人脸识别的系统却是非常困难的,诸多因素使得人脸识别研究成为一项极具挑战性的课题。它牵涉到模式识别、图像处理、计算机视觉、生理学、心理学、以及认知科学等方面的诸多知识,并与基于其它生物特征的身份鉴别方法以及计算机人机感知交互领域都有密切联系。与指纹、视网膜、虹膜、基因、掌形等其它生物特征识别系统相比,人脸识别具有直接、友好、方便和非接触等许多优点,多年来一直受到许多研究者的关注。人脸识别研究,起源于l9世纪末法国人Sir Franis Gahon的工作。到20世纪9O年代,开始作为一个独立学科快速发展起来。人脸识别研究的发展大致分成三个阶段:第一阶段以Allen和Parke为代表,主要研究人脸识别所需要的面部特征。研究者用计算机实现了较高质量的人脸灰度图模型。这阶段的工作特点是识别过程全部依赖于操作人员。第二阶段是人机交互式识别阶段,其中用几何特征参数来表示人脸正面图像是以Harmon和Lesk为代表,将人脸面部特征用多维特征矢量表示出来,并设计了基于这一特征表示法的识别系统。而以Kaya和Kobayashi为代表,则采用了统计识别的方法、用欧氏距离来表示人脸特征。这两类方法都摆脱不了人的干预。第三阶段是真正的机器自动识别阶段,近十余年来,随着高速度高性能计算机的发展,人脸模式识别方法有了较大的突破,提出了多种机器全自动识别系统,人脸识别技术进人了实用化阶段。如Eyematic公司研发的人脸识别系统。我国清华大学的“十五”攻关项目人脸识别系统也通过了由公安部主持的专家鉴定。人脸识别有着广泛的应用领域:(1)在安全防范领域中的应用。社会上有许多重要的部门,如军事、金融、保密等部门都需要对出入人员进行身份识别,以防止信息泄漏和不法现象的发生。使用该技术可以方便地进行身份识别,而不使被识别者感到不舒服。(2)在犯罪刑侦领域中的应用。在刑侦工作中,对罪犯的抓捕是至关重要的一环。应用人脸识别技术可以依据犯罪嫌疑人的人脸图像对机场、车站、港口等重要交通场所进行监控,从而大大促进了罪犯抓捕工作的开展。(3)在公共事业领域中的应用。在现代社会,许多领域都需要对人进行身份验证。如银行、保险、交通等公共事业部门。采用传统的密码、IC卡等手段和技术对人进行身份验证具有安全性差、易遗失、易伪造等缺点。而采用人脸识别技术进行身份验证则能够很好地克服传统身份验证手段和技术的缺点。因此成熟的人脸识别技术不但具有极大的学术研究价值,而且具有广泛的社会需求和市场领域。一个成功的具有商用价值的人脸识别系统必将给现实社会带来极大的影响。当前,人脸识别己成为计算机视觉、模式识别和人工智能等领域的一个研究热点。我们有理由相信,随着技术的不断发展,人脸识别技术将不断完善,并得到更为广泛的应用2。1.1 人脸识别技术所谓人脸识别,是指对输入的人脸图像或者视频,判断其中是否存在人脸,如果存在人脸,则进一步给出每张人脸的位置、大小和各个面部主要器官的位置信息,并且依据这些信息,进一步提取每张人脸蕴含的身份特征,并将其与已知人脸库中的人脸进行对比,从而识别每张人脸的身份。其研究内容包括以下五个方面:(1)人脸检测从不同的背景中检测是否存在人脸,并确定其位置、大小、形状、姿态等信息的过程。它关系到后续识别工作能否正确进行,并保障最终识别结果的可靠性。(2)人脸表征确定表示检测出的人脸和数据库中的已知人脸的描述方式。通常的表示方式包括几何特征(如欧氏距离、曲率、角度等)、代数特征(如矩阵的特征矢量)和固定特征模板等。(3)人脸鉴别即狭义的人脸识别,就是通常所指的将待识别的人脸与数据库中的已知人脸进行比较,得出相关信息。这一过程的核心是选择适当的人脸表示方式和匹配策略,系统地构造与人脸的表征方式密切相关。(4)表情/姿态分析即对待识别人脸的表情或姿态进行分析,并对其加以归类。(5)生理分类对待识别人脸的物理特征进行分类,得出其年龄、性别、种族等相关信息,或从几幅相关的图像中推导出希望得到的人脸图像,如从父母的脸推导出孩子的脸像等。本论文中的人脸识别主要是指狭义的人脸识别,指将待识别的人脸与数据库中的已知人脸之间进行匹配的人脸鉴别。人脸识别的目的是让计算机具有通过人脸的特征来鉴别身份的功能。基于人脸特征的身份识别主要设计到复杂场景中的人脸检测及识别技术,是一种依托于图像理解、模式识别及计算机视觉、统计学和人工智能等高技术的研究方向3。1.2 人脸识别的研究背景及意义在人类社会的发展进入到21世纪的今天,安全问题已经成为困扰人们日常生活的重要问题之一。社会的发展促进了人的流动性,进而也增加了社会的不稳定性,使得安全方面的需求成为21世纪引起广泛关注的问题。不论是享受各项服务如网上冲浪、还是居家、办公等都涉及到安全,以往这些行为基本上是通过符号密码来进行安全保护,但是随着服务数量的不断增加,密码越来越多以致无法全部记住,而且密码有时也会被他人所窃取,各种密码被破解的概率越来越高,因为通常由于记忆的原因,人们经常会选用自己或亲人的生日、家庭地址、电话号码等作为密码并长期使用,这些很容易被一些不法分子获取。可见在现代社会中,身份识别已经成为人们日常生活中经常遇到的一个基本问题。人们乎时时刻刻都需要鉴别别人的身份和证明自己的身份,以获得对特定资源的使用权或者制权,同时防止这些权限被他人随意的取得。传统的身份识别方法主要基于身份标识物(如证件、卡片)和身份标识知识(如用户名、密码)来识别身份,这在很长一段时期是非常可靠和方便的识别方法,得到了广泛的应用。但是,随着网络、通信、交通等技的飞速发展,人们活动的现实空间和虚拟空间不断扩大,需要身份认证的场合也变得无不在。人们需要携带的身份标识物品越来越多,身份标识知识也变得越来越复杂和冗长在这种情况下,传统身份识别方式的弊端日益彰显。身份标识物品容易被丢失和伪造,份标识知识容易被遗忘、窃取和破解,而身份标识的重要性又使得一旦失去了身份标识会给标识的所有者甚至整个社会带来重大的甚至难以弥补的损失。在美国,每年约有上百万的福利款被人以假冒的身份领取;每年发生的信用卡、ATM、移动电话和冒领支票等成的损失达数百亿美元。面临着这样的状况,人们对身份识别的安全性、可靠性、准确和实用性提出了更高的要求,必须寻求身份识别的新途径。于是,近年来人类生物特征越来越广泛地用于身份识别,而且生物特征可以更好的进行安全控制,世界各国政府都在大力推进生物识别技术的发展及应用。与原有的人类身分识别技术(如:个人密码、磁卡、智能卡等)相比,基于人类生物特征的识别技术具有安全可靠、特征唯一、不易伪造、不可窃取等优点。人类本身具有很多相对独特的特征,如DNA、指纹、虹膜、语音、人脸等。基于这些相对独特的人类特征,结合计算机技术,发展起众多的基于人类生物特征的人类身份识别技术,如DNA识别技术、指纹识别技术、虹膜识别技术、语音识别技术、人脸识别技术。人脸识别和其他的生物识别比起来有以下几个优点:1、其他的生物特征识别方法都需要一些人为的行为配合,而人脸识别不需要。2、人脸识别可应用在远距离监控中。3、针一对现在的第一、二代身份证,每个身份证都有人脸的正面照片,也就是人脸库将是最完善的,包括人最多的,我们可以利用这个库来更直观、更方便的核查该人的身份。4、相对于其他基于生物特征识别技术,人脸识别技术具有特征录入方一便,信息丰富,使用面广等优点,同时人脸识别系统更加直接友好。人脸识别技术作为生物识别技术的一种,以其特有的稳足性、方便性、唯一性等特点被愈来愈多地应用于除安全问题外的各种身份识别领域4。1.3 人脸识别理论的发展人脸识别的理论发展大致可以分为三个阶段:第一阶段,以Bertillon,Allen和Parke为代表,主要研究人脸识别所需要的面部特征。在Berliton的系统中,用一个简单的语句与数据库中某一张脸相联系同时与指纹分析相结合,提供了一个较强的识别系统。为了提高脸部识别率,Allen为待识别脸设计了一种有效和逼真的摹写,Parke则利用计算机实现了这一想法,并产生了较高质量的人脸灰度模型。这一阶段工作的特点是识别过程全部依赖于工作人员,显然这不是一种可以完成自动识别的系统。第二阶段,是人机交互式识别阶段。代表性工作有:Goldstion,Harmon和Lesk用几何参数来表示人脸正面图像。他们采用21维特征向量来表示人脸面部特征,并设计了这一特征表示法的识别系统。Kaya和Kobayashi则采用了统计识别方法,用欧氏距离来表征人脸特征,如嘴唇和鼻之间的距离、嘴唇的高度等。更进一步地,T.Kanad设计了一个高速且有一定知识引导的半自动回溯系统,创造性地运用积分投影法,从单幅图像上计算出一组脸部特征参数,再利用模式分类技术与标准人脸相匹配。Kanad的系统实现了快速、实时的处理,是一个很大的进步。相比之下,Baron所做的工作少为人所知,他先将图像灰度归一,再利用四个掩膜(眼、鼻、嘴以及眉毛以下的整个脸部)表示人脸,然后分别计算四个掩膜与数据库中每幅标准图像的相应掩膜之间的互相关系数,以此作为判别依据5。总的来说,这两个阶段主要是在20世纪60年代到90年代,这段时间的人脸识别一般都需要人的某些先验知识,无法摆脱人的干预。早期的人脸识别方法有两大特点:(1)大多数识别方法都是基于部件的,他们利用人脸的几何特征进行识别,提取的信息是人脸主要器官特征信息及其之间的几何关系。这类方法比较简单,但是很容易丢失人脸的有用信息,从而在视角、表情等变化的情况下,识别能力差。鉴于这种情况,后来出现了性能较优的模板匹配方法,即根据图像库中的人脸模板与待识别人脸模板在灰度上的相似程度来实现人脸识别,这类方法在一定时期内占据主流。(2)人脸识别研究主要是在较强约束下的人脸图像识别。假设图像背景单一或者无背景,人脸图像已知或者很容易获得,因此对现实场景产生的图像处理效果不佳。第三阶段,主要是进入20世纪90年代,由于高速度性能计算机的出现和各方面对人脸识别系统的迫切要求,人脸识别的研究重新变的热门起来,人脸识别的方法也有了重大突破,进入了真正的机器自动识别阶段,同时涌现了很多著名的人脸识别算法,例如麻省理工学院米提实验室的Turk和Pentland在1991年提出的“Eigenface(特征脸)”方法,Belhumeur等在1997年提出的Fisherface方法是这个时期的两个重要成果,还有好多方法都是基于这两个方法的深入研究。再有一个重要的方法就是弹性图匹配技术(Elastic Graph Matching,EGM),还有在此技术上发展的一些技术,如局部特征技术(Lacal Feature Analysis,LFA)、柔性模型(Flexible Models)。现在人脸识别的研究重点主要是对光照、姿态等非理想采集条件和用户不配合的情况下的人脸识别方法的研究,尽力克服光照、姿态的影响。非线性建模方法、统计学习理论、基于Boosting的学习技术、基于三维建模的人脸建模与识别方法成为备受关注的研究趋势6。1.4 人脸识别的难点目前人脸识别的难点主要存在于以下几个方面:(1)光照变化是影响人脸识别性能的最关键因素,对该问题的解决程度关系着人脸识别实用化进程的成败,在人脸图像预处理或者归一化阶段,尽可能地补偿乃至消除其对识别性能的影响。(2)成像角度及成像距离等因素的影响,即人脸的姿态的变化,会垂直于图像平面的两个方向的深度旋转,会造成面部信息的部分缺失。(3)不同年龄的人脸有着较大的差别。身份证是以前照的,在逃犯的照片也是以前的,因此在公安部门的实际应用中,年龄问题是一个最突出的问题。(4)采集图像的设备较多,主要有扫描仪、数码相机、摄像机等。由于成像的机理不同,形成了同类人脸图像的识别率较高,而不同类间人脸图像识别率较低的情况。随着人脸识别技术的发展,这一问题也将逐步得到解决。(5)人脸图像的数据量巨大。目前由于计算量的考虑,人脸定位和识别算法研究大多使用尺寸很小的灰度图像。一张64*64像素的256级灰度图像就有4096个数据,每个数据有256种可能的取值。定位和识别算法一般都很复杂,在人脸库较大的情况下,计算量十分大,很多情况下速度令人难以忍受。而灰度数据事实上是丧失了色彩、运动等有用信息的。如果使用全部的有用信息,计算量就更大了7。第2章 人脸识别的常用算法2.1 人脸识别常用方法人脸识别的方法主要有:基于几何特征的人脸识别方法、基于模板匹配的人脸识别方法、基于小波特征的人脸识别方法和基于模型的人脸识别方法。其中基于模型的人脸识别方法包括特征脸法(Eigneafec)、神经网络法(NN)、隐马尔可夫模型方法(HMM)等方法,本次设计将采用的是基于特征脸的方法8。(1)基于面部几何特征的方法这个方法在时间上来说是最早提出的人脸识别方法之一,其特征提取以人脸面部特征点的形状和几何关系为基础的。对于不同的人来说有着不同的人脸轮廓、大小、相对位置的分布也是不相同的,所以说用这种方法来进行人脸识别还是有一定依据的。这种方法的做法是,提取眉毛、眼睛、鼻子和嘴巴这几个特征点,计算出这几个特征点的大小,以及他们之间的几何距离,来进行人脸识别,几何距离一般包括特征点之间的距离、他们之间的夹角等。特征提取后选取最近邻分类器,相异度测试选用欧式距离。基于几何特征的人脸识别算法的优点是方法简单,计算速度快。但它识别人脸就靠几个特征点的大小和距离,以及特征点之间的夹角,这样的信息是远远不够的,对于一个稍微大一点的人脸库识别率不高,还有这种方法对于人脸表情变化时没有很好的鲁棒性。但是这种方法还是有一定潜力的,好比一个大型的人脸库,进行人脸比对前可以使用基于面部几何特征的方法对训练样本进行粗分类,这样可以大大降低人脸识别时间。(2)基于模板匹配的方法模板匹配方法也是模式识别中的一个比较传统的方法。把模板匹配方法用到人脸识别中要以Poggio和Bruneili所提出的基于局部特征的模板匹配算法为代表。他们首先利用积分投影的方法确定面部特征点,提取局部特征的模板,然后进行局部模板匹配,计算相关系数进行分类,Poggio和Brulleili比较了基于几何特征和基于模板匹配的人脸识别方法。他们的实验结果表明,在人脸尺度、光照、姿态稳定的情况下,基于模板匹配的人脸识别方法要优于基于几何特征的人脸识别方法。通过大量的实验表明,基于模板匹配的人脸识别方法对光照、旋转、人脸表情比较敏感,仅当这些因素比较稳定时,才能获得比较好的效果。这种方法的计算量要比基于面部几何特征的方法要大。(3)基于小波特征的方法小波变换是国际上公认的最新频率分析工具,由于其“自适应性,和“数学显微镜性质”而成为许多学科共同关注的焦点,在信号处理中起着至关重要的作用。目前小波技术在验证的特征撮上用得较多。小波变换采用以高斯函数的二阶导数作为小波基的小波变换技术来进行拐点提取,然后以该方法为基础,进行不同图像之间拐点序列的匹配;最后再利用提敢的拐点来对图像进行分段和段一段对应处理。由于使用离散小波变换来分解图像的参数特征,特征提取用到自适应算法,匹配则选择动态规划方法,初步试验取得较好的效果。(4)基于特征脸的方法特征脸方法是从主成成分分析(PCA)导出的一种人脸识别和描述技术。它将包含人脸的图像区域看作一随机向量,采用K-L变换得到正交K-L基,对应其中较大特征值的基具有与人脸相似的形状,因此又被称为特征脸。利用这些基的线性组合可以描述、表达和逼近人脸图像,所以可进行人脸识别与合成。识别过程就是将人脸图像映射到由特征脸组成的子空间上,并比较其在特征脸空间中的位置,然后利用对图像的这种投影间的某种度量来确定图像间的相似度,最常见的就是选择各种距离函数来进行度量分类实现人脸识别。(5)神经网络法基于神经网络的人脸识别方法就是利用神经网络的学习能力和分类能力对人脸进行特征提取与识别。目前常用的人工神经网络方法是BP(Back-Propagation)神经网络、自组织神经网络、径向基函数神经网络。径向基函数神经网络与BP网络一样都是多层前向网络,它以径向基函数作为基准,以高斯函数作为隐含层的激励函数。这种网络的学习速率快、函数逼近、模式识别等能力均优于BP神经网络,并广泛应用于模式识别、图像处理等方面。但是这种网络比BP网络所用的神经元数目要多得多,使它的应用受到了一定的限制。2.2 PCA方法的优点由于PCA方法在降维和特征提取方面的有效性,在人脸识别领域得到广泛的应用。(1)最小均方误差。 PCA是在均方误差最小意义下的最优正交分解方法,因此用PCA进行信号压缩能够得到最大的信噪比。(2)降维。 由于基函数的个数往往远小于信号的维数,因此PCA变换能够大大降低数据的表示维数。这对模式识别中的特征提取非常有利。(3)消除冗余。 在基函数上的投影系数彼此之间是不相关的。分解函数/合成函数相同。 分解函数(Analysis Function))作用于输入信号,得到信号的编码;合成函数(Synthesis Function)作用于信号的编码,得到原始信号。如果图像的分解和合成采用线性模型,则分解函数I和合成函数i是和输入信号具有相同维数的向量,它们可以表示为: i=iTI, I=iii (2.2.1)第3章 PCA人脸识别方法3.1 简介我们希望将图像原特征做某种正交变换,获得的数据都是原数据的线性组合,从新数据中选出少数几个,使其尽可能多地反映各类模式之间的差异,又尽可能相互独立,一个常用的方法就是主成分分析(PCA)。KL(Karhunen-Loeve)变换或主分量分析 (Principal Component Analysis,PCA),这是一种特殊的正交变换,它是重建均方误差最小意义下的最佳变换,起到减少相关性,突出差异性的效果,在图像编码上能去除冗余信息,也常用于一维和二维信号的数据压缩;这种变换采用主要特征对应的特征向量构成变换矩阵,保留原模式样本中方差最大的数据分量,在对高维图像编码时起到了降维作用。由于KL变换和PCA去相关性和降维作用,Mathew A.Turk和P.Pentland首先将主成分分析运用到人脸识别中来。通过K_L变换得到高维人脸空间的投影矩阵,人脸图像都可以由这些矩阵的线性组合来表示,正是因为这些矩阵呈现人脸的形状,所以将这种人脸识别称为特征脸(Eigenface)方法9。3.2 问题描述于一幅图像可以看作一个由像素值组成的矩阵,也可以扩展开,看成一个矢量,如一幅N*N 象素的图像可以视为长度为N2 的矢量,这样就认为这幅图像是位于N2 维空间中的一个点,这种图像的矢量表示就是原始的图像空间,但是这个空间仅是可以表示或者检测图像的许多个空间中的一个。不管子空间的具体形式如何,这种方法用于图像识别的基本思想都是一样的,首先选择一个合适的子空间,图像将被投影到这个子空间上,然后利用对图像的这种投影间的某种度量来确定图像间的相似度,最常见的就是各种距离度量。3.2.1 KL变换原理PCA方法是由Turk 和Pentlad 提出来的,它的基础就是Karhunen-Loeve 变换(简称KL变换),是一种常用的正交变换。下面我们首先对K-L 变换作一个简单介绍:假设X 为n 维的随机变量,X 可以用n 个基向量的加权和来表示10:X=i=1naii (3.2.1)式中: ii 是加权系数,i 是基向量,此式还可以用矩阵的形式表示: X=12,n(12n)T= (3.2.2)取基向量为正交向量,即 j=1 i=j0 ijTj=I (3.2.3)则系数向量为: =TX (3.2.4)综上所述,K-L 展开式的系数可用下列步骤求出:步骤一求随即向量X 的自相关矩阵R=EXTX由于没有类别信息的样本集的 均值向量,常常没有意义,所以也可以把数据的协方差矩阵=E(x-)(x-)T作为K_L 坐标系的产生矩阵,这里 是总体均值向量。步骤二 求出自相关矩阵或协方差矩阵R 的本征值i和本征向量i=(1,i,n)。步骤三 展开式系数即为=TX 。K_L 变换的实质是建立了一个新的坐标系,将一个物体主轴沿特征矢量对齐的旋转变换,这个变换解除了原有数据向量的各个分量之间相关性,从而有可能去掉那些带有较少信息的坐标系以达到降低特征空间维数的目的。3.2.2 利用 PCA 进行人脸识别完整的PCA 人脸识别的应用包括几个步骤:人脸图像预处理;读入人脸库,训练形成特征子空间;把训练图像和测试图像投影到上一步骤中得到的子空间上;选择一定的距离函数进行识别。1. 读入人脸库归一化人脸库后,将库中的每人选择一定数量的图像构成训练集,其余构成测试集。设归一化后的图像是n*m,按列相连就构成N=n*m 维矢量,可视为N 维空间中的一个点,可以通过K-L 变换用一个低维子空间描述这个图像。2. 计算 K- L 变换的生成矩阵所有训练样本的协方差矩阵为(以下三个等价): 1. CAK=1MXKXKTM-mxmxT 2. CA(AAT)M3. CAi=1Mxi-mx(xi-mx)T (3.2.5)A=1,2,m,=xi-mx,mx是平均人脸, M 训练人脸数,协方差矩阵CA是一个N*N的矩阵, N 是Xi的维数。为了方便计算特征值和特征向量,一般选用第2个公式。根据K - L 变换原理,我们所求的新坐标系即由矩阵AAT的非零特征值所对应的特征向量组成。直接求N*N大小矩阵A C 的特征值和正交归一特征向量是很困难的, 根据奇异值分解原理(见段落1.2.5和1.2.6),可以通过求解ATA的特征值和特征向量来获得ATA的特征值和特征向量.在计算得到 CA的所有非零特征值0,1,r-1(从大到小排序,1 r n)维矩阵,则存在两个正交矩阵和一个对角阵: A=a1,a2,ar=UVT (3.3.3)其中U=u0,u1,ur-1,v=V0,V1,Vr-1,=diag(0,1,r-1),且UUT=1, VVT=1,i呈降序排列。其中i2为AATRm*m和ATARn*n的非零特征值,ui和vi分别是AAT和ATA对应于i2的特征向量。可得一个推论: U=AV-1 (3.3.4)可以计算ATA的特征值i2及相应的正交归一特征向量Vi后,可由推论知AAT的正交归一特征向量 ui=1iAVi注意,协方差矩阵CA=(AAT)M的特征值为:i2M。3.3.6 利用小矩阵计算大矩阵特征向量高阶矩阵的特征向量可以转化为求低阶矩阵的特征向量: 设:A 是秩为r 的m*n(mn)维矩阵,CX=AATRm*m,是一个矩阵,现在要求CX的特征值及特征向量,可通过先求小矩阵ATARn*n的特征向量V0,V1,Vr-1和特征值0,1,r-1,两者之间有以下关系: ATAVi=ivi左乘aAATAVi=(AVi) (3.3.5)结论:计算出协方差矩阵的特征向量,特征值的结果是一致的,只是要注意特征值要除以 M,特征向量要单位化。 3.3.7图片归一化 图片标准化通常是一个整体概念,要求把图片归一到均值为0,方差为1 下情况下。 这个概念类似于一般正态分布向标准正态分布的转化: 命题4:若XN,2所以要对一组图片中的一张Xi进行归一化(标准化),只需要减去均值,除以方差就可以了。均值mx=imXiM,方差为D=E(X-mx)(x-mx)T 。第4 人脸识别系统的设计及实现4.1 人脸识别流程完成人脸识别的工作需要一系列的步骤,它们结合起来构成一个完整的流程。由于研究人员来自不同的学科、具有不同的背脊,而且不同的人脸识别应用中对识别的目标也不同,所以人脸识别的流程并不统一一个比较通用的人脸识别流程如下图所示:输入图像结果输出人脸检测/跟踪 特征提取特征降维匹配识别图4人脸识别流程图其主要步骤包括:人脸检测/跟踪(face detection/tracking),特征提取(face extraction),特征降维(face dimensionality reduction),匹配识别(matching and classification)。它们之间基本上是串行的关系14。(1)人脸检测/跟踪。人脸检测是完成人脸识别工作的自动系统的第一个步骤。该步骤的目的是在输入的图像中寻找人脸区域。具体来说:给定意一幅任图像,人脸检测的目的是确定是否图像州有人脸存在,如果存在,给出每个人脸的具体位置和范围。实际应用中人脸图像的采集或获取常在非受控的条件下进行,这样所得到的图像中的人脸在尺寸、朝向、明暗、遮挡、分辨率等方面都有很多不同,使同一的人脸出现各种变形,并有可能导致各种误识、漏识等失败的情况。为校正人脸在尺度、光照和旋转等方面的变化,常需采用一些包括几何归一化(空间尺度归一化)和光照归一化(灰度幅值归一化)等手段来调整不同的人脸图像,以利于用统一算法进行识别。(2)特征提取。为区分不同的人脸,需提取各种人脸的独特性质。也就是要从人脸图像中映射提取一组反映人脸特征的数值表示样本。这里首先需要采取某种表示方式来表示检测出的人脸和数据库中的已知人脸。通常的表示法包括几何特征(如欧氏距离、曲率、角度)、代数特征(如矩阵或特征向量)、固定特征模板、特征脸等。(3)特征降维。人脸是一个非刚性的自然物体(柔性体),从人脸图像中可提取很多不同特征,所以表征人脸的原始特征对应高维空间中的数据(对一幅M*N的图像,空间维数可达M*N)。直接利用这样高维的数据进行识别除需要很多的匹配计算量外,由于很难对各高维数据的描述能力做有效的判断,故还不能保证基于这么多数据进行的识别结果的正确性。在特征提取后,需采用紧凑的人脸表征方式,将原始特征进行筛选组合,集中信息,降低维数,使这些低维空间的有效性的到提高,以有利于接下来的匹配分类。(4)匹配识别。 在特征提取的基础上,选择使当的匹配策略,可将待识别的人脸与数据库中的已知人脸进行匹配比较,建立它们的相关关系,并输出所作出的判断决策/决定(识别结果)。与人脸检测不同,这里利用的主要是人脸个体差异的信息。有两种识别目的和情况需要区别:一种是对人脸图像的验证(verification),即要确认输入人脸图像中的人是否在数据库中,属于有监督的识别;另一种是对人脸图像的辨识(identification),即要确认输入图像中的人的身份,属于无监督的识别。4.2 离线学习和在线匹配人脸识别系统的构建及使用常由两个过程来完成,即离线学习和在线匹配。离线学习是利用作为训练样本的人脸图像,从中提取公共的特征,建立训练样本的特征子空间,使系统具有描述已有类别图像的能力,为在线匹配打下基础。在线匹配是要从输入的待识别人脸图像中提取相应的特征,将这些特征与离线学习的特征进行匹配,从而可借此将输入图像和训练图像建立联系,并将输入图像归入到某个训练图像类别中,如下图: 离线学习训练图像特征提取特征子空间在线匹配分类结果训练图像训练图像特征子空间 图5 即离线学习和在线匹配流程图本次设计既采用这种方案。4.3 人脸识别中P

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论