文档简介
谨以此论文献给一直支持的我的家人,导师和朋友们!谨以此论文献给一直支持的我的家人,导师和朋友们! -徐东勋徐东勋 i 基于稀疏编码的快速人脸识别算法研究基于稀疏编码的快速人脸识别算法研究 摘要摘要 人脸识别技术一直是生物识别中的重要研究课题, 许多计算机视觉和模式识 别领域的学者和科研机构对此进行了大量的研究。 在如今以互联网为基础的信息 时代,人脸识别的应用变得更加广阔。 本文的研究内容主要涉及人脸图像特征的提取,特征的识别。首先对目前的 人脸识别技术进行介绍,接着介绍稀疏编码算法和极限学习机(elm)算法。然 后采用一种结合稀疏编码和 elm 算法的方法来提取人脸特征,最后通过识别器 来完成人脸识别。本文通过不同的数据库和识别算法来进行比对,来验证此算法 的准确度和效率。本文主要研究工作如下: 1) 介绍人脸识别的相关背景和目前的主要人脸识别技术方法:包括 pca 算 法,基于 lda 的算法,基于稀疏编码的算法。 2) 介绍稀疏编码算法和极限学习机算法(elm)的理论:包括稀疏编码和 elm 算法的基本理论和具体实现。 3) 针对目前的稀疏编码人脸识别算法的不足:依赖于具体的识别数据和整体 算法速度依赖于稀疏编码的计算速度。本文提出从自然图像中学习到基函 数,并将 elm 回归算法和稀疏编码结合来提高整体算法的速度。在识别 器上选择 elm 分类算法来保证速度和识别效果。 4) 本文选用了 orl,pie 两种人脸数据库作为实验对象,在两种数据库上都 得到了很高的识别正确率。另外本文调整训练和测试的人脸数目比例来分 析其影响。通过选用三种分类算法:elm 分类算法,基于 softmax 函数的 神经网络算法,多分类支持向量机算法来检验对本文算法的影响。并分析 了本文算法对传统稀疏编码算法改进的可行性和依据。 最后,对本文的算法进行了总结,并阐述了本文的算法有待改进或者尝试改 进之处,另外,对本文算法的思想的扩大应用进行了展望。 关键词: 人脸识别,稀疏编码,极限学习机(elm) ,通用视觉特征 ii fast face recognition research via sparse coding abstract face recognition always is an important research topic in biometric identification technology. and many researchers from computer vision and pattern recognition have done a lot of research. face recognition will be applied more extensively in this information age. this thesis mainly focuses on the extraction of face feature and feature recognition. the paper firstly introduces the exiting face recognition methods, then talks about two algorithmssparse coding and extreme learning machine (elm). the key point is developing a new kind of face feature extraction method via sparse coding and elm. lastly these features are sent to classifier. different databases and classifiers are used for comparison and checking performance. the main work is following: 1) introduce background and existing method on face recognition, including pca, lda, sc. 2) the basic theory and realization of sparse coding and elm are introduced. 3) because of the disadvantages of the existing methods, such as relying on practical data and speed limited by sparse coding, this paper comes up with a new method: learn the basis function from natural images, finish the face feature extraction through sparse coding and elm regression, choose the elm classifier to finish recognizing. 4) orl and pie database are chosen to do experiment. a state of art performance is got. adjustment of ratio between the training number and testing number is done for checking its influence. the experiment chooses three kinds of classifiers one layer network using the softmax activation function, elm, multi-classes svm. analysis of the feasibility of this papers method also is processed in this chapter. lastly, this paper is summarized. and the aspects for improvement are proposed. key points: face recognition, sparse coding, extreme learning machine, common visual features. iii 目 录 1 绪论绪论 . 1 1.1 人脸识别技术的研究背景和意义 . 1 1.2 人脸识别技术的发展现状 . 3 1.3 本文研究内容 . 5 2 人脸识别技术综述人脸识别技术综述 . 6 2.1 人脸识别的流程: . 6 2.2 人脸识别的性能评价标准: . 8 2.2.1 人脸检测性能的指标: . 8 2.2.2 身份识别性能的指标: . 8 2.3 主要的人脸识别方法: . 9 2.3.1 基于人脸几何结构的方法 . 9 2.3.2 基于子空间特征的方法 . 10 2.4 目前基于稀疏编码人脸识别算法: . 11 2.5 本章小结: . 12 3 稀疏编码和极限学习机理论稀疏编码和极限学习机理论 . 13 3.1 稀疏编码 . 13 3.1.1 稀疏编码理论. 13 3.1.2 稀疏编码算法的求解 . 14 3.1.3 稀疏编码的应用: . 15 3.1.4 目前稀疏编码算法存在的问题: . 16 3.2 极限学习机(elm)理论: . 17 3.3 本章小结 . 20 4 基于稀疏编码的快速人脸识别基于稀疏编码的快速人脸识别 . 21 4.1 算法概述 . 21 4.2 通用视觉特征理论 . 23 4.3 通用视觉特征的提取. 25 4.3.1 预处理及白化过程 . 25 iv 4.3.2 稀疏编码 . 27 4.3.3 非线性化过程 . 28 4.4 基于 elm 学习的稀疏表示. 30 4.5 基于 elm 分类器的人脸识别 . 31 4.6 快速人脸识别的具体算法 . 32 4.7 本章小结 . 36 5 人脸识别实验及结果分析人脸识别实验及结果分析 . 38 5.1 通用视觉特征:基函数 . 38 5.2 基于 elm 的稀疏编码算法的可行性: . 39 5.3 人脸识别实验 . 42 5.3.1 orl 数据库 . 43 5.3.2 pie 人脸数据库 . 45 5.4 本章小结 . 46 6 总结和展望总结和展望 . 47 6.1 总结. 47 6.2 展望. 48 参考文献:参考文献: . 49 致致 谢谢 . 52 个人简历个人简历 . 54 攻读硕士学位期间发表的论文攻读硕士学位期间发表的论文 . 55 基于稀疏编码的快速人脸识别算法研究 1 1 绪论绪论 人脸识别一直是模式识别和人工智能领域的研究热点。人类的视觉系统可 以出色的完成对人脸的识别任务,而在计算机视觉和模式识别领域中,只能利 用人脸图像,从中提取特征,完成对人脸的身份的判定。近几年随着信息处理 技术的发展和人脸识别在互联网,安保等领域应用的扩展的需要,人脸识别持 续成为众多研究人员关注的课题。 本文同样致力于人脸识别技术的研究和创新, 在本章里将首先介绍人脸识别的研究背景,意义和目前国内外的研究的发展及 现状。 1.1 人脸识别技术人脸识别技术的研究背景和意义的研究背景和意义 现在,随着信息和数字化时代的快速发展,个人信息数量更是极速增加。 随之而来的信息安全相关领域的研究也得到极大的关注,而身份的识别认证正 是信息安全领域的很重要的一个方面。目前,比较传统的身份认证的方法如: 身份证件,用户名密码组合,钥匙等已经远远不能满足现代社会对信息安全的 要求。寻找更加安全,可靠,同时易实现的方法成了迫切的需要。 生物特征有着唯一性,易携带,不易丢失等特性1,因而成了身份识别领 域的研究热点。生物特征识别技术指利用信息处理技术对人类的生理或行为特 征进行身份识别和鉴定的技术。目前相关的生物特征识别研究包括指纹识别, 虹膜识别,掌纹识别,行走姿态识别,语音识别,个人签名识别,dna 识别等。 其中有的是利用人先天形成的生理特征如指纹,虹膜,dna 等,也有的利用后 天形成的个人特征如:个人签名,行为姿势等2。 目前这些生物特征识别技术已经很成熟并被应用到生活中的各个方面。 dna 识别在亲子鉴定,刑侦侦破中被广泛应用;指纹和个人签名很早就在契约 合同上作为身份的等同标示被应用,同时目前指纹也作为很多公司机构的签到 记录;虹膜则在很多安全性要求较高的门禁中作为身份的验证。 基于稀疏编码的快速人脸识别算法研究 2 图图 1-1 指纹识别考勤机及虹膜识别门禁 人脸识别是生物特征识别中很重要的一部分。相对于其他的生物特征,人 脸有着更加直观,更加捕获等优势,并且在很多领域有着广泛的应用需求。因 此成了模式识别,机器学习,机器视觉,认知科学等众多领域的研究热点。人 类可以轻松地从周围环境中众多的事物中找到人脸,并完成对自己认识的人的 判定。但对于计算机来说,完成人脸的识别任务并非易事。目前主要的思路是 从人脸图像中,完成人脸特征的提取,再利用这些特征做进一步的分类识别。 人脸识别的优势: 1) 隐蔽性好,适合应用于安全问题,可疑人员监视,嫌犯抓捕等。 2) 友好性,不需要任何深入人体的操作,可以非接触完成。被使用人员不 会有侵犯感,易于接受和推广。 3) 成本低,普通的摄像机和照相机就可以完成采集。不需要专门的设备。 人脸识别的不足:易受人脸所处的环境条件影响,易被伪装欺骗等。但是 人脸识别作为生物特征识别的重要方面,随着信息处理技术的发展,其不足会 逐渐被弱化,应用也会更加广泛。 人脸识别是一个涉及到模式识别,机器学习,数学统计,机器视觉,认知 科学等众多学科的技术,它的发展对这些学科的研究有着很大的验证和推动作 用。另外人脸识别的研究成果可以为人脸的表情判定,年龄判定以及性别和人 种等进一步的研究起到铺垫作用。 目前人脸识别的主要应用: 1) 视频监控:在银行,商场,私人住所等地方,通过摄像机捕获图像,当 有可疑人员时尝试报警等处理。 基于稀疏编码的快速人脸识别算法研究 3 2) 身份的验证:在机场,海关,以及其他安全场所,利用人脸识别自动完 成和数据库中的人脸图像的识别匹配,完成快速身份验证。 3) 刑事侦破: 通过获得的疑犯的图像和已知的罪犯数据库中的人脸进行比 对识别,快速定位确定疑犯。 4) 互联网和智能设备登入:通过人脸作为登入的口令,完成登入和解锁操 作等。 除此之外,人脸识别还在智能医疗,智能家居,游戏等方面有着巨大的应 用前景。 1.2 人脸识别技术的发展人脸识别技术的发展及及现状现状 人们从一百多年前就开始对人脸识别的研究。在 1988 年自然中一篇有 关利用人脸进行身份鉴定的文章开启人们对人脸识别的研究。 后来直到 20 世纪 60 年代因为计算机技术的发展,自动的人脸识别技术开始出现3。从 90 年代开 始掀起了人脸识别技术研究的另一个高潮,至今人脸识别仍然是研究的热点课 题。 在这过程中, 人脸识别技术的发展几乎是随着信息处理技术的发展而发展。 早期的人脸识别技术常用的方法是基于几何结构特征的。即利用人脸的主要器 官的识别, 如各器官的相对位置距离, 形状4等, 早期的研究人员有 a.goldstein, j.gerald 以及 l.harmon 等。注重是考虑人脸的表面结构参数。详细的内容在下 面的章节将有进一步介绍。 后来随着信息技术发展,90 年代初期时,因为人们遇到了对高维数数据的 处理的难题-维数灾的问题。接着一种降维的方法-pca 方法被研究出来。接 着 m.turk 和 a.pentland 利用 pca 理论提出了著名的特征脸方法5。它利用了 pca方法对人脸图像进行降维, 得到能够代表人脸主要信息的很少维数的数据, 然后进行识别。特征脸至今仍然是人脸识别领域中一个重要的简单的方法,人 们对它的研究也变得更加多元化。随后由 p.belhumeur 等提出一种方法,首先 对图像表观特征进行 pca 降维, 再用线性判别分析(lda)的方法对 pca 后提取 的主成分进行变换,期望得到较大的类间距离和类内聚合度,这种方法就是著 基于稀疏编码的快速人脸识别算法研究 4 名的 fisherfaces 人脸识别方法6。这种方法得到了成功的应用,现在仍就是人 脸识别主要的方法之一,并且以它为基础,出现了很多的优化改进版本。 接着以支持向量机(svm)算法为代表的统计学习理论得到快速发展,支持 向量机理论是极力寻找多维度数据变量中求取最佳分类超平面7,来实现良好 的泛化能力和分类能力,因为支持向量机的良好性能和核方法的扩展性,人们 开始自然地尝试将它应用到人脸识别的研究中。由于 svm 的最初设计是用来 完成单纯的二分类问题,后来发展了多类分类的 svm,目前很多成熟的多分类 svm 算法, 它们基本是以二分类为基础外加上一对多法或者一对一法等方法来 实现的。本文在使用多分类 svm 时采用的一对多的方法8-9 随着主动形状模型(asm)10和主动表观模型(aam)被提出。这两种方法从 2d 形状和纹理两方面来描述人脸,分别用 pca 提取特征,然后放在一起作为 人脸图像的特征表示,最后进行识别。这个方法已经被广泛的应用到人脸识别 中,以这两种方法为基础,出现了纹理约束的主动形状模型(tc-asm),直接表 观模型(dam),贝叶斯切空间形状模型(btsm)等 在同时期,流形学习的概念被提出,并得到了广泛的应用,拉普拉斯脸方 法11就是根据基于流行学习提出的局部投影(lpp)方法:通过构造投影矩阵, 来完成人脸图像特征提取,取得了优秀的识别效果。 在统计学和信息处理学科发展的同时,人们对人类视觉系统的研究也在进 行,ica,稀疏编码等方法都在神经学领域找到了一定的解释。正因为它们的 神经学基础,j.wright 和 a.yang 等提出了基于稀疏表示的人脸识别方法 (src)12。这种方法一经提出就受到国内外学者的广泛关注。稀疏编码能够捕 获图像中高阶相关结构,并将人脸转化为特定基函数的稀疏系数来表示,同时 因为稀疏编码的特性,能够克服以往人脸识别中不利的环境变化如:人脸半遮 挡:如眼镜,光照条件变化,人脸图像被加入噪声等,进行很好的特征提取和 识别。huang 等提出一种像素变换不敏感的稀疏表示恢复方法来处理人脸识别 中的位移和姿势改变13;同时,yang 和 zhang 在 src 中使用 gabor 特征来减 少基函数的维数,同时提高了识别正确率14。 目前的国外著名的科研机构包括 cmu、 mit 的多媒体实验室、 人工智能实 验室、michigan state university、ucla、微软研究院和英国的剑桥大学等。国 基于稀疏编码的快速人脸识别算法研究 5 内的人脸识别研究的起步相对较晚,从改革开放后正式开始了这方面的研究, 目前国内主要的研究机构包括中科院、清华大学、哈尔滨工业大学,浙江大学, 南京大学、上海交通大学等。 1.3 本本文研究文研究内容内容 本文介绍和总结了目前的人脸识别技术的流程和主要技术,并着重研究了 目前的基于稀疏编码算法的人脸识别算法。通过对稀疏编码算法和极限学习机 算法(elm)的深入研究,提出了一种对传统的稀疏编码人脸识别方法改进的方 法:利用通用视觉理论从自然图像中学习到基函数,并在人脸识别阶段,用极 限学习机方法替代稀疏编码算法完成稀疏表示的学习,人脸的分类器选择上, 同样使用极限学习机分类器来完成,并在两种数据库进行实验,另外分析本文 方法的可行性。最终得出总结:本文的方法能在保证很高的识别正确率的前提 下,极大的提高识别速度。 本文的章节安排如下: 第一章:介绍快速人脸识别课题的背景意义,国内外的研究现状。 第二章:主要介绍人脸识别的技术的主要流程,评价指标,以及目前比较 流行的人脸识别技术。特别是基于稀疏编码的人脸识别技术。并分析目前的方 法存在的不足。 第三章:详细介绍本文算法中要用到的两种核心算法:稀疏编码算法和极 限学习机算法,从理论结构到求解过程给出详细的阐述。 第四章: 详细深入地阐述本文的基于 elm 改进的稀疏编码的快速人脸识别 算法。从算法的结构,到具体模块-通用视觉特征理论,稀疏编码,非线性化 模块, elm 分类模块等进行详细的介绍, 并列出了所有用到子算法的实现步骤。 第五章: 将本文提出的快速人脸识别算法在 orl 和 pie 两种数据库进行实 验,均得到了很高的识别正确率和更快的识别速度,另外通过试验分析了本文 算法的可行性,科学性。 第六章:对本文的快速人脸识别方法进行总结,总结本文算法的创新之处, 另外对以后的相关工作进行了展望。 基于稀疏编码的快速人脸识别算法研究 6 2 人脸识别技术综述人脸识别技术综述 人脸识别简单说是指利用图像处理技术,从图像或者视频中找出人脸,若 已存在用于比对的样本人脸,则把检测出的人脸和样本人脸进行比对,确认其 身份的过程。从另一个方面看,人脸识别属于图像事物识别的一个子门类,在 识别的过程中有着许多的相似之处,但由于人脸图像的复杂性和其特有标志, 人脸识别的处理过程中又有着很多独特的地方。如第一章阐述,人脸识别有重 大的研究和应用意义,对人脸识别研究一直是热点,目前为止已经出现了很多 很成熟的技术,本章中也进行介绍。 2.1 人脸识别的流程人脸识别的流程 从上述的人脸识别定义中可以看出,利用计算机技术进行的人脸识别的过 程和人类视觉系统进行人脸识别的过程是类似的。对应于人类视觉系统的处理 过程,人脸识别过程大体可以分为图像的获取,图像中人脸的检测,人脸图像 特征的提取,分类识别等主要步骤。 1) 图像的获取:要完成人脸的识别工作首先需要的是图像的收集工作,目 前主要是利用照相机或者摄像机完成图像的收集工作, 这对应于人脸视 觉系统中的眼睛对周围环境的摄取过程。 2) 人脸的检测:指的是从众多的图像或者视频序列中,提取到人脸图像子 块,并定位人脸在图像中的具体位置,其实质就是将人脸从众多的其它 事物集合中区分出来的过程。 对应于人类视觉系统对事物最初的一个判 断, 事物类别的判断。 比如在环境模糊状态时, 先判断事物是否为人脸。 而无法直接判断人的身份。 3) 人脸图像的特征提取:当获得从环境中确定人脸图像后,接着就是要从 人脸图像中提取能够独特地代表此人脸的图像特征。这个过程是人脸 识别过程中最为核心的部分,特征提取的好与坏和精确程度,直接影 响着最终的身份的确定。这个过程对应于人脸视觉系统中的视觉激励 基于稀疏编码的快速人脸识别算法研究 7 的复杂处理过程。 4) 分类和识别:当提取出人脸图像的独特特征后,就是和已知的身份人脸 进行比对的过程。将已知身份的人脸图像特征和待测的人脸特征,在 分类器中按照某种标准进行相似度的比对。这和人类在大脑回忆已知 的身份,来确定看到人脸的身份的过程是一致。 总体而来,人脸识别系统的框图如下: 图图 2-1 人脸识别系统的框图 在以上的主要的步骤中:人脸检测,人脸特征的提取以及分类识别器是三个核 心部分,其中人脸特征的提取是最为关键的。人脸检测目前已经有很多成熟的 方法,应用的效果也很好,如最常见的各种相机都有人脸检测的应用。所以这 部分的工作,本文不再涉及。本文的研究重点是人脸特征的提取以及分类识别 器的选择。即从上面的框图中看,绿色的框图部分本文不涉及,主要涉及其中 的蓝色的框图。提取人脸特征用到的方法决定着提取的特征的好坏,决定着对 人脸的表示,直接影响着身份的确定。另一方面,特征提取的速度也是一个很 重要的考虑因素。目前的人脸识别应用对实时性要求很高,而特征的提取作为 最重要的步骤要兼顾提取的速度和特征提取的准确度。分类器的选择也是影响 识别结果和速度的另一个主要方面。在识别效果相差不大,并几乎达到很高水 训练人脸图像 测试人脸图像 预处理 人脸特征的提取 人脸特征的提取 人 脸 检 测 存储设备 分类识别器 基于稀疏编码的快速人脸识别算法研究 8 准时,快速的分类器成了必然的要求。 2.2 人脸识别的性能评价标准人脸识别的性能评价标准 判定人脸识别系统的好坏程度,有两方面的指标,人脸检测方面的性能指 标和身份识别方面的性能指标。 2.2.1 人脸检测性能的指标: 1. 检测率: 指在一副图像中,被正确检测到的人脸的个数与图像内包含的 人脸个数总数的比例。这是检测率越高,人脸检测系统对图像中人脸 的捕获性能越强。检测率是人脸检测系统的最基本的一个指标。 2. 误检率: 检测率无法正确反映检测方法对其它背景图像子块的去除能力 的强弱,如这种情况:图像中所有人脸都被成功检测到,但同时有很多 背景图像子块也被误识别为人脸,这时检测率虽然很高,但不能说识 别性能很好。假设一幅图像内被检测的所有背景图像子块数目为n, 而被误识别为人脸的背景图像子块的数目为n,则误检率为: /n n。 由于。误检率就可以正确衡量这种情况,误检率越低,说明检测系统 对背景图像子块的排除能力越强。 3. 检测速度: 代表从含有人脸的背景图像中检测出人脸子图像窗口的时 间,检测速度越快,表示对人脸的检测算法越成功,也更加有利于后 续的识别过程的加速。 2.2.2 身份识别性能的指标: 1. 正确识别率:被正确识别的人脸样本数与测试样本总数的比值。正确识 别率是评价人脸识别方法性能最本质的指标。它是人脸识别系统设计 最初目的最直观的展现。 2. 错误识别率:被错误分类的人脸样本数与测试样本总数的比值。 3. 鲁棒性:用来衡量人脸识别系统的健壮性。反映在异常和干扰情况的系 统的稳定性。 基于稀疏编码的快速人脸识别算法研究 9 4. 识别速度:完成人脸检测后,提取其特征并最终完成其身份识别的所需 的时间。 由于本文主要是针对图像特征的提取以及分类识别,因此人脸检测的指标 不是本文关注的重点,身份识别的性能指标为重点。其中,识别率是一个系统 性能好坏最重要的标准,这是和人脸识别系统设计最初目的最直观的展现。另 外现在各种对人脸识别的应用中,实时性的要求更高。因此识别速度也是本文 另一个关注的指标。这两个指标的组合就能准确的衡量一个识别系统的好坏。 2.3 主要的人脸识别方主要的人脸识别方法法 本文不关注人脸检测的过程,因此不再介绍人脸检测方面的相关问题,主 要介绍人脸识别过程的方法。人脸图像的识别目前有正脸,侧脸,基于三维角 度的识别,目前的识别主要是针对人脸的正脸识别,因为正脸识别的图像的特 征更加准确,对识别的效果更加有利,另外正脸识别的应用场景更加成熟。下 面主要介绍对于静态二维正脸人脸图像的识别方法。目前的方法主要可以分为 两大类:基于人脸几何结构的方法和基于子空间特征的方法。 2.3.1 基于人脸几何结构的方法 人脸几何结构的特征方法主要是把人脸的各个器官如眼睛,鼻子,嘴巴等 分开来看,提取器官的形状和几何关系为特征,利用这些特征来识别。目前可 以被利用的特征有鼻子的宽度,脸部的宽度,鼻子到嘴巴的距离,嘴巴的形状, 下巴的形状等。图 2-2 展示的就是人脸中的几何结构。 基于稀疏编码的快速人脸识别算法研究 10 图图 2-2 人脸结构图 1974 年,kanadle 使用了几何特征的方法进行识别15,提取了约 30 个特征 距离来表示一幅人脸图像。在一定的样本集测试时,识别效果可以达到 95%。 这种基于几何结构特征的方法,在选取的距离特征非常重要,若不能找到正确 的人脸图像的特征表示则会极大的影响正确识别率。另一方面当选取的距离特 征过多时,明显加大了人脸图像的特征维数,这对计算和识别都意味着更大的 复杂度。一般该种方法的优势是提取特征速度快,但当图像质量下降后,正确 识别率会下降许多。 2.3.2 基于子空间特征的方法 当人脸图像收到环境的影响时:如光照变化,面部表情的变化。人脸图像 的中几何距离特征就变的很难被利用。最近几年,人们逐渐发现人脸图像中蕴 含的信息远不止简单的几何距离关系,而是有着更为高阶的内部特征,因此基 于统计学习的空间特征方法越来越受到重视,这种方法将图像按照一定的准则 投影到另一个空间里,映射后的空间里,图像的特征表示更加有规律,更加有 利于分类。因此这种思想就是用各种方法找到映射空间里对应的特征表示,目 前主要的方法有 pca,lda,rsc(稀疏编码人脸识别算法) 。 pca(主成分分析) 主成分分析法用到人脸识别的方法称为特征脸。特征脸方法要求训练和测 试的人脸样本图像尺寸大小一样,首先要对图像进行预处理,标准化。然后利 用 k-l 变换后可以得到一组新的正交基,通过保留部分正交基获得正交 k-l 基 底。获取其中对应的特征值较大的基地可以组成特征矩阵,即特征脸5。pca 的主要作用是降低信号数据中的维数,同时保留信号中的主要信息,便于处理 识别。在进行人脸识别的过程中,通过比较图像经过 pca 处理后的低维空间中 的向量表示之间的距离来确定彼此的相似度,从而判定图像的类别。pca 方法 的最大优点是可以将人脸图像的特征表示维数降的很低。下图 2-3 左侧为原始 图像,右侧为 pca 后的特征脸图像。 基于稀疏编码的快速人脸识别算法研究 11 original facesrecovered faces 图 2-3 特征脸 lda(线性鉴别分析方法) pca 的方法只是考虑到人脸的整体特征,并且识别的过程过分依赖于分类 器完成识别,特征提取阶段对特征的处理不够。与之相对,线性鉴别分析方法 利用已有样本的先验知识, 并充分考虑到人脸图像的整体和局部两方面的特征。 并对特征进一步的空间变化处理,使特征间的关系更加明确,更加清晰。特征 处理的原理是找到一个人脸特征空间变换的方向,有点类似于聚类算法,使得 在变换后的空间中一个类中样本点间的距离很小,而使得不同类样本的间距变 大16。线性鉴别分析方法由于其方法的特征,相对于主成分分析方法,在识别 任务中取得了更好的效果,但是由于应用中训练样本的获取是昂贵的,因此该 方法出现了小样本问题,一定程度上阻碍了其应用。 2.4 目前基于稀疏编码目前基于稀疏编码人脸识别人脸识别算法算法 稀疏编码算法的人脸识别算法,利用稀疏编码作为提取人脸图像特征的方 法,然后再选用分类器进行人脸识别的方法。不同于之前的 pca 等算法,这种 方法不是对人脸图像的整体特征进行空间的映射,而是人脸图像的局部特征进 行编码。目前一般传统的基于稀疏编码的人脸识别算法的具体的过程是对训练 人脸图像样本进行预处理,然后切割成子块,将子块向量集合利用稀疏编码算 法,得到训练人脸图像的对应的稀疏表示和一个超完备基函数。这个稀疏表示 就是训练人脸图像的特征向量。然后在测试阶段,利用这个训练出来的超完备 基函数和稀疏编码算法得到测试样本人脸的稀疏表示,然后进行分类识别。最 基于稀疏编码的快速人脸识别算法研究 12 后送入特定的分类器进行分类识别。稀疏编码算法是从人脸视觉系统的研究中 得出的算法,用其得到的人脸图像的稀疏表示,大多数元素为零,极大地降低 了运计算量。 但现在传统的稀疏编码的人脸识别算法,在得到人脸图像的稀疏矩阵表示 时过分的依赖于稀疏编码的计算速度,从下面章节可以知道稀疏编码的求解过 程是需要大量的迭代循环的,需要很多的时间。另外,基函数的训练学习过程 也要随着人脸数据库的变化而重新训练,这都需要大量的计算时间,严重影响 了这种方法的实时性。shan 在 2008 年提出了一种新的利用稀疏编码的方法: 从自然图像中学习基函数,无需随着数据库的变化而变化,但他的方法同样也 没有摆脱对稀疏编码算法性能的依赖。 后面的章节本文将详细介绍稀疏编码算法,并且本文提出一种了用通用视 觉理论和 elm 算法对传统的稀疏编码的人脸识别算法进行改进的方法, 使算法 有更好的识别效果和识别速度。 2.5 本章小结本章小结 本章主要介绍了人脸识别过程的主要流程,以及评价一个人脸识别方法好 坏的性能指标,并介绍了目前的主要的人脸识别方法。最后单独介绍了目前基 于稀疏编码的人脸识别算法,并分析了其的优势和存在的不足。 基于稀疏编码的快速人脸识别算法研究 13 3 稀疏编码和极限学习机理论稀疏编码和极限学习机理论 本文设计的快速人脸识别算法中主要用了两个算法模块-稀疏编码算法和 elm 算法, 并且本文的算法核心思想利用 elm 算法对稀疏编码算法进行拟合, 来提高整体的计算速度。下面将从理论结构和求解方法等对两种算法进行详细 的介绍。 3.1 稀疏编码稀疏编码 3.1.1 稀疏编码理论 从生物神经系统的研究中可以得知,人类的视觉系统在处理视觉任务时, 只有少数的神经元细胞处于激活状态。olshauen 和 field 在 1996 年提出了稀疏 编码理论来对人类视觉系统这种少数神经元处于激活的状态模拟17-18。并研究 了自然图像视觉激励中稀疏编码的分析。自然图像可以被一个过完备的基函数 的少数元素表示。假设一幅图像为x,其中基函数为d,对应的表示关系为: xda (3-1) a为这幅图像对应的稀疏表示,其中的大多数元素的值为零,对应于只有 少数神经元处于激活状态。这个关系模型中,自然图像为已知的数据,从中挑 选对应于该图像的稀疏表示的过程可以称之为稀疏最优化。稀疏最优化是个非 凸优化函数,这在数学研究和信号处理领域都是很难解决的问题。 稀疏最优化:对于一个n维的激励x(对应于n维像素的图像) ,希望尽 量来寻找它在一个特定基函数的表示。这个特定基函数是包含m个元素的d。 这里定义p阶的范数为 1/ () p p m pm xx 。为了不缺失一般性,假设基函数矩 阵为单位矩阵,即 2 1d,当基函数是超完备时(mn) ,努力计算出其稀 疏表示,使其满足xda. 在稀疏最优化就是在尽力寻找能满足上面的约束条 件并拥有最少非零的元素的稀疏系数19。即 基于稀疏编码的快速人脸识别算法研究 14 0 m i na s.t xda (3-2) 其中的零阶范数表示 a 中的非零元素的个数。不过上面的这个数学关系式 是 np-hard 的。在信号处理领域,有两种方法可以被用来解决这个可以被替代 的子优化问题,从而解决这个难题,其中一种通用的方法是构建一个替代的稀 疏问题来代替最大化零阶范数。应用最广的一个方法是用一阶范数来替代零阶 范数。即 1 min a s.t xda (3-3) 实际的计算中,由于信号噪声问题的存在, xda (3-4) 为附加的高斯噪声。以上就是从稀疏编码的角度推出了这个线性有效编 码模型,并在实现的过程假设了a的维数之间的相互独立性。另外从 infomax ica 角度同样能推导出这个线性有效编码模型,这说明了这个模型对生物神经 系统的模拟的正确性。a的维数之间是相互独立的,这允许模型获得视觉激励 的统计结构20-21。而a的稀疏性,是表明生物神经元的节能的特性,因为大脑 只占据了人体 2%的重量却消耗着 20%的新陈代谢。 为了解决上面的线性模型。chen 等 2001 年提出了 bpdn 理论22,通过在 构建平均平方差和稀疏性之间制造一种均衡。 构成了下面的无限制最优化问题: 2 21 d,a min daxa (3-5) 其中是均衡参数,这样稀疏编码的线性有效编码问题就转化为了可解决 的最优化问题。 3.1.2 稀疏编码算法的求解 解决这种最优化问题的方法有很多。大多解决方法的实质都是基于协同下 降算法完成的。协同下降算法阐述如下:假设有一个最优化的目标函数( )f x, 其中x是高维的矩阵。为了得到最优的参数x,选择每一次去最优化其中的一 维,并固定x的其它维。一旦这一维达到局部最优后,同样的方法去继续优化 其它维,整个过程持续更新直到整个目标函数不再能被优化了,就能得到最优 基于稀疏编码的快速人脸识别算法研究 15 的x。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年阳江辅警招聘考试真题含答案详解(轻巧夺冠)
- 2025年滁州辅警协警招聘考试备考题库及答案详解(新)
- 2025年甘南州辅警协警招聘考试真题及答案详解(易错题)
- 2025年赤峰辅警协警招聘考试真题附答案详解(达标题)
- 2025建筑工程设计分包合同 施工合同协议书
- 2025年潮州辅警协警招聘考试真题及1套参考答案详解
- 2025二人合作协议合同范本
- 2025年湖北辅警协警招聘考试备考题库附答案详解(培优a卷)
- 2025年荆门辅警协警招聘考试真题及答案详解(夺冠系列)
- 2025年齐齐哈尔辅警招聘考试真题附答案详解(满分必刷)
- GB/T 3487-2024乘用车轮辋规格系列
- 低层模块化生态钢结构mehouse介绍
- 同心共育静待花开 课件高一下学期期中考试分析家长会
- 总工会招聘考试考前必做500道
- 2024年秋季新外研版三年级上册英语课件 Unit 4 第2课时 (Start up)
- 房产代持协议范本
- 田径运动会各种记录表格
- 二手人防车位使用权转让协议书
- Python数据分析与可视化(微课版) 课件 ch05 数据清理案例实战
- 全面质量管理的七种统计分析方法
- 规划验收手续流程
评论
0/150
提交评论