




已阅读5页,还剩31页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人脸识别论文(基于特征脸)毕业设计(论文)原创性声明和使用授权说明原创性声明本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得 及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。作 者 签 名: 日 期: 指导教师签名: 日期: 使用授权说明本人完全了解 大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。作者签名: 日 期: 学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名: 日期: 年 月 日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权 大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。涉密论文按学校规定处理。作者签名:日期: 年 月 日导师签名: 日期: 年 月 日注 意 事 项1.设计(论文)的内容包括:1)封面(按教务处制定的标准封面格式制作)2)原创性声明3)中文摘要(300字左右)、关键词4)外文摘要、关键词 5)目次页(附件不统一编入)6)论文主体部分:引言(或绪论)、正文、结论7)参考文献8)致谢9)附录(对论文支持必要时)2.论文字数要求:理工类设计(论文)正文字数不少于1万字(不包括图纸、程序清单等),文科类论文正文字数不少于1.2万字。3.附件包括:任务书、开题报告、外文译文、译文原文(复印件)。4.文字、图表要求:1)文字通顺,语言流畅,书写字迹工整,打印字体及大小符合要求,无错别字,不准请他人代写2)工程设计类题目的图纸,要求部分用尺规绘制,部分用计算机绘制,所有图纸应符合国家技术标准规范。图表整洁,布局合理,文字注释必须使用工程字书写,不准用徒手画3)毕业论文须用A4单面打印,论文50页以上的双面打印4)图表应绘制于无格子的页面上5)软件工程类课题应有程序清单,并提供电子文档5.装订顺序1)设计(论文)2)附件:按照任务书、开题报告、外文译文、译文原文(复印件)次序装订指导教师评阅书指导教师评价:一、撰写(设计)过程1、学生在论文(设计)过程中的治学态度、工作精神 优 良 中 及格 不及格2、学生掌握专业知识、技能的扎实程度 优 良 中 及格 不及格3、学生综合运用所学知识和专业技能分析和解决问题的能力 优 良 中 及格 不及格4、研究方法的科学性;技术线路的可行性;设计方案的合理性 优 良 中 及格 不及格5、完成毕业论文(设计)期间的出勤情况 优 良 中 及格 不及格二、论文(设计)质量1、论文(设计)的整体结构是否符合撰写规范? 优 良 中 及格 不及格2、是否完成指定的论文(设计)任务(包括装订及附件)? 优 良 中 及格 不及格三、论文(设计)水平1、论文(设计)的理论意义或对解决实际问题的指导意义 优 良 中 及格 不及格2、论文的观念是否有新意?设计是否有创意? 优 良 中 及格 不及格3、论文(设计说明书)所体现的整体水平 优 良 中 及格 不及格建议成绩: 优 良 中 及格 不及格(在所选等级前的内画“”)指导教师: (签名) 单位: (盖章)年 月 日评阅教师评阅书评阅教师评价:一、论文(设计)质量1、论文(设计)的整体结构是否符合撰写规范? 优 良 中 及格 不及格2、是否完成指定的论文(设计)任务(包括装订及附件)? 优 良 中 及格 不及格二、论文(设计)水平1、论文(设计)的理论意义或对解决实际问题的指导意义 优 良 中 及格 不及格2、论文的观念是否有新意?设计是否有创意? 优 良 中 及格 不及格3、论文(设计说明书)所体现的整体水平 优 良 中 及格 不及格建议成绩: 优 良 中 及格 不及格(在所选等级前的内画“”)评阅教师: (签名) 单位: (盖章)年 月 日教研室(或答辩小组)及教学系意见教研室(或答辩小组)评价:一、答辩过程1、毕业论文(设计)的基本要点和见解的叙述情况 优 良 中 及格 不及格2、对答辩问题的反应、理解、表达情况 优 良 中 及格 不及格3、学生答辩过程中的精神状态 优 良 中 及格 不及格二、论文(设计)质量1、论文(设计)的整体结构是否符合撰写规范? 优 良 中 及格 不及格2、是否完成指定的论文(设计)任务(包括装订及附件)? 优 良 中 及格 不及格三、论文(设计)水平1、论文(设计)的理论意义或对解决实际问题的指导意义 优 良 中 及格 不及格2、论文的观念是否有新意?设计是否有创意? 优 良 中 及格 不及格3、论文(设计说明书)所体现的整体水平 优 良 中 及格 不及格评定成绩: 优 良 中 及格 不及格教研室主任(或答辩小组组长): (签名)年 月 日教学系意见:系主任: (签名)年 月 日摘 要 生物特征识别技术使用了人体本身所固有的生物特征,与传统的身份识别方法完全不同,具有更高的安全性、可靠性、和有效性,越来越受到人们的重视。人脸识别技术作为生物特征识别技术的重要组成部分,在近三十年里得到了广泛的关注和研究,已经成为计算机视觉、模式识别领域的研究热点。人脸识别在公共安全、证件验证、门禁系统、视频监视等领域中都有着广泛的应用前景。本文是在人脸数据库的基础上做人脸特征提取和识别研究,主要内容如下:(1) 对人脸识别研究的内容、相关技术、主要实现方法及发展历程作了详细介绍。(2) 介绍主成分分析法(PCA)、K-L变换,并利用特征脸方法实现了人脸识别。(3)给出了基于matlab环境的编程及实验结果,并对结果进行分析。 关键词:人脸识别,特征脸,K-L变换,主成分分析第一章 人脸识别概述1.1 生物特征识别技术生物特征识别技术是通过计算机利用人体所固有的生理特征或行为特征来进行个人身份鉴定。生理特征与生俱来多为先天性的;行为特征则是习惯使然,多是后天性的。我们将生理和行为特征统称为生物特征。常用的生物特征包括:指纹、掌纹、虹膜、视网膜、脸像、声音、笔迹等。那么,生物特征识别技术是如何进行个人特征识别的呢?生物鉴别的过程分成三个步骤:生物特征数据采样,生物特征提取和特征匹配。数据采样过程是通过各种传感器对生物特征进行原始数据采集的过程,生物特征提取过程则从传感器采集的数据中抽取出反映个体特性的信息(通常是某种数学上的编码过程),匹配阶段则是计算生物特征之间的相似性并进行排序和一致性判断的过程。生物特征识别技术主要有人脸识别、指纹识别、语音识别、虹膜识别等。生物识别技术在上个世纪己经有了一定的发展,其中指纹识别技术己经趋近成熟,但人脸识别技术的研究目前还处于起步阶段。指纹、虹膜、掌纹等识别技术都需要被识别者的配合,有的识别技术还需要添置复杂昂贵的设备。人脸识别则可以用已有的照片或是摄像头远距离捕捉图像,无须特殊的采集设备,系统的成本低。并且自动人脸识别可以在当事人毫无察觉的情况下即完成身份确认识别工作,这对反恐怖活动等有非常重大的意义。由于人脸识别技术具有如此之多的优势,因此它的应用前景非常广阔,已成为最具潜力的生物特征识别技术之一。1.2 人脸识别技术所谓人脸识别,是指对输入的人脸图像或者视频,判断其中是否存在人脸,如果存在人脸,则进一步给出每张人脸的位置、大小和各个面部主要器官的位置信息,并且依据这些信息,进一步提取每张人脸蕴含的身份特征,并将其与已知人脸库中的人脸进行对比,从而识别每张人脸的身份。其研究内容包括以下五个方面:(1)人脸检测 从不同的背景中检测是否存在人脸,并确定其位置、大小、形状、姿态等信息的过程。它关系到后续识别工作能否正确进行,并保障最终识别结果的可靠性。(2)人脸表征 确定表示检测出的人脸和数据库中的已知人脸的描述方式。通常的表示方式包括几何特征(如欧氏距离、曲率、角度等)、代数特征(如矩阵的特征矢量)和固定特征模板等。(3)人脸鉴别 即狭义的人脸识别,就是通常所指的将待识别的人脸与数据库中的已知人脸进行比较,得出相关信息。这一过程的核心是选择适当的人脸表示方式和匹配策略,系统地构造与人脸的表征方式密切相关。(4)表情/姿态分析 即对待识别人脸的表情或姿态进行分析,并对其加以归类。(5)生理分类 对待识别人脸的物理特征进行分类,得出其年龄、性别、种族等相关信息,或从几幅相关的图像中推导出希望得到的人脸图像,如从父母的脸推导出孩子的脸像等。本论文中的人脸识别主要是指狭义的人脸识别,指将待识别的人脸与数据库中的已知人脸之间进行匹配的人脸鉴别。人脸识别的目的是让计算机具有通过人脸的特征来鉴别身份的功能。基于人脸特征的身份识别主要设计到复杂场景中的人脸检测及识别技术,是一种依托于图像理解、模式识别及计算机视觉、统计学和人工智能等高技术的研究方向。1.3 人脸识别的研究背景及意义在人类社会的发展进入到21世纪的今天,安全问题已经成为困扰人们日常生活的重要问题之一。社会的发展促进了人的流动性,进而也增加了社会的不稳定性,使得安全方面的需求成为21世纪引起广泛关注的问题。不论是享受各项服务如网上冲浪、还是居家、办公等都涉及到安全,以往这些行为基本上是通过符号密码来进行安全保护,但是随着服务数量的不断增加,密码越来越多以致无法全部记住,而且密码有时也会被他人所窃取,各种密码被破解的概率越来越高,因为通常由于记忆的原因,人们经常会选用自己或亲人的生日、家庭地址、电话号码等作为密码并长期使用,这些很容易被一些不法分子获取。可见在现代社会中,身份识别已经成为人们日常生活中经常遇到的一个基本问题。人们乎时时刻刻都需要鉴别别人的身份和证明自己的身份,以获得对特定资源的使用权或者制权,同时防止这些权限被他人随意的取得。传统的身份识别方法主要基于身份标识物(如证件、卡片)和身份标识知识(如用户名、密码)来识别身份,这在很长一段时期是非常可靠和方便的识别方法,得到了广泛的应用。但是,随着网络、通信、交通等技的飞速发展,人们活动的现实空间和虚拟空间不断扩大,需要身份认证的场合也变得无不在。人们需要携带的身份标识物品越来越多,身份标识知识也变得越来越复杂和冗长在这种情况下,传统身份识别方式的弊端日益彰显。身份标识物品容易被丢失和伪造,份标识知识容易被遗忘、窃取和破解,而身份标识的重要性又使得一旦失去了身份标识会给标识的所有者甚至整个社会带来重大的甚至难以弥补的损失。在美国,每年约有上百万的福利款被人以假冒的身份领取;每年发生的信用卡、ATM、移动电话和冒领支票等成的损失达数百亿美元2。面临着这样的状况,人们对身份识别的安全性、可靠性、准确和实用性提出了更高的要求,必须寻求身份识别的新途径。于是,近年来人类生物特征越来越广泛地用于身份识别,而且生物特征可以更好的进行安全控制,世界各国政府都在大力推进生物识别技术的发展及应用。与原有的人类身分识别技术(如:个人密码、磁卡、智能卡等)相比,基于人类生物特征的识别技术具有安全可靠、特征唯一、不易伪造、不可窃取等优点。人类本身具有很多相对独特的特征,如DNA、指纹、虹膜、语音、人脸等。基于这些相对独特的人类特征,结合计算机技术,发展起众多的基于人类生物特征的人类身份识别技术,如DNA识别技术、指纹识别技术、虹膜识别技术、语音识别技术、人脸识别技术。人脸识别和其他的生物识别比起来有以下几个优点:1、其他的生物特征识别方法都需要一些人为的行为配合,而人脸识别不需要。2、人脸识别可应用在远距离监控中。3、针一对现在的第一、二代身份证,每个身份证都有人脸的正面照片,也就是人脸库将是最完善的,包括人最多的,我们可以利用这个库来更直观、更方便的核查该人的身份。4、相对于其他基于生物特征识别技术,人脸识别技术具有特征录入方一便,信息丰富,使用面广等优点,同时人脸识别系统更加直接友好。人脸识别技术作为生物识别技术的一种,以其特有的稳足性、方便性、唯一性等特点被愈来愈多地应用于除安全问题外的各种身份识别领域。人脸识别技术可应用于以下方面:1.在安全防范领域中的应用社会上有许多重要的部门,如军事、金融、保密等部门都需要对出入人员进行身份识别,以防止信息泄漏和不法现象的发生。使用该技术可以方便地进行身份识别,而不使被识别者感到不舒服。2.在犯罪刑侦领域中的应用在刑侦工作中,对罪犯的抓捕是至关重要的一环。应用人脸识别技术可以依据犯罪嫌疑人的人脸图像对机场、车站、港口等重要交通场所进行监控,从而大大促进了罪犯抓捕工作的开展。3.在公共事业领域中的应用。在现代社会,许多领域都需要对人进行身份验证。如银行、保险、交通等公共事业部门。采用传统的密码、IC卡等手段和技术对人进行身份验证具有安全性差、易遗失、易伪造等缺点。而采用人脸识别技术进行身份验证则能够很好地克服传统身份验证手段和技术的缺点。此外,人脸识别的研究还具有重要的理论研究价值。由于人脸模式的特殊性,人脸识别的研究涉及图像处理、模式识别、计算机视觉、神经网络、认知科学、生理学、心理学等多个学科领域,因此对人脸识别的深入研究能够推动这些基础研究的发展。1.4 人脸识别理论的发展人脸识别的理论发展大致可以分为三个阶段:第一阶段,以Bertillon,Allen和Parke为代表,主要研究人脸识别所需要的面部特征。在Berliton的系统中,用一个简单的语句与数据库中某一张脸相联系同时与指纹分析相结合,提供了一个较强的识别系统。为了提高脸部识别率,Allen为待识别脸设计了一种有效和逼真的摹写,Parke则利用计算机实现了这一想法,并产生了较高质量的人脸灰度模型。这一阶段工作的特点是识别过程全部依赖于工作人员,显然这不是一种可以完成自动识别的系统。第二阶段,是人机交互式识别阶段。代表性工作有:Goldstion,Harmon和Lesk用几何参数来表示人脸正面图像。他们采用21维特征向量来表示人脸面部特征,并设计了这一特征表示法的识别系统。Kaya和Kobayashi则采用了统计识别方法,用欧氏距离来表征人脸特征,如嘴唇和鼻之间的距离、嘴唇的高度等。更进一步地,T.Kanad设计了一个高速且有一定知识引导的半自动回溯系统,创造性地运用积分投影法,从单幅图像上计算出一组脸部特征参数,再利用模式分类技术与标准人脸相匹配。Kanad的系统实现了快速、实时的处理,是一个很大的进步。相比之下,Baron所做的工作少为人所知,他先将图像灰度归一,再利用四个掩膜(眼、鼻、嘴以及眉毛以下的整个脸部)表示人脸,然后分别计算四个掩膜与数据库中每幅标准图像的相应掩膜之间的互相关系数,以此作为判别依据。总的来说,这两个阶段主要是在20世纪60年代到90年代,这段时间的人脸识别一般都需要人的某些先验知识,无法摆脱人的干预。早期的人脸识别方法有两大特点:(1)大多数识别方法都是基于部件的,他们利用人脸的几何特征进行识别,提取的信息是人脸主要器官特征信息及其之间的几何关系。这类方法比较简单,但是很容易丢失人脸的有用信息,从而在视角、表情等变化的情况下,识别能力差。鉴于这种情况,后来出现了性能较优的模板匹配方法,即根据图像库中的人脸模板与待识别人脸模板在灰度上的相似程度来实现人脸识别,这类方法在一定时期内占据主流。(2)人脸识别研究主要是在较强约束下的人脸图像识别。假设图像背景单一或者无背景,人脸图像已知或者很容易获得,因此对现实场景产生的图像处理效果不佳。第三阶段,主要是进入20世纪90年代,由于高速度性能计算机的出现和各方面对人脸识别系统的迫切要求,人脸识别的研究重新变的热门起来,人脸识别的方法也有了重大突破,进入了真正的机器自动识别阶段,同时涌现了很多著名的人脸识别算法,例如麻省理工学院米提实验室的Turk和Pentland在1991年提出的“Eigenface(特征脸)”方法,Belhumeur等在1997年提出的Fisherface方法是这个时期的两个重要成果,还有好多方法都是基于这两个方法的深入研究。再有一个重要的方法就是弹性图匹配技术(Elastic Graph Matching,EGM),还有在此技术上发展的一些技术,如局部特征技术(Lacal Feature Analysis,LFA)、柔性模型(Flexible Models)。现在人脸识别的研究重点主要是对光照、姿态等非理想采集条件和用户不配合的情况下的人脸识别方法的研究,尽力克服光照、姿态的影响。非线性建模方法、统计学习理论、基于Boosting的学习技术、基于三维建模的人脸建模与识别方法成为备受关注的研究趋势31.5 人脸识别的难点目前人脸识别的难点主要存在于以下几个方面:(1)光照变化是影响人脸识别性能的最关键因素,对该问题的解决程度关系着人脸识别实用化进程的成败,在人脸图像预处理或者归一化阶段,尽可能地补偿乃至消除其对识别性能的影响。(2)成像角度及成像距离等因素的影响,即人脸的姿态的变化,会垂直于图像平面的两个方向的深度旋转,会造成面部信息的部分缺失。(3)不同年龄的人脸有着较大的差别。身份证是以前照的,在逃犯的照片也是以前的,因此在公安部门的实际应用中,年龄问题是一个最突出的问题。(4)采集图像的设备较多,主要有扫描仪、数码相机、摄像机等。由于成像的机理不同,形成了同类人脸图像的识别率较高,而不同类间人脸图像识别率较低的情况。随着人脸识别技术的发展,这一问题也将逐步得到解决。(5)人脸图像的数据量巨大。目前由于计算量的考虑,人脸定位和识别算法研究大多使用尺寸很小的灰度图像。一张64*64像素的256级灰度图像就有4096个数据,每个数据有256种可能的取值。定位和识别算法一般都很复杂,在人脸库较大的情况下,计算量十分大,很多情况下速度令人难以忍受。而灰度数据事实上是丧失了色彩、运动等有用信息的。如果使用全部的有用信息,计算量就更大了。第二章 人脸识别的常用算法与分类器介绍2.1 人脸识别常用方法人脸识别的方法主要有:基于几何特征的人脸识别方法、基于模板匹配的人脸识别方法、基于小波特征的人脸识别方法和基于模型的人脸识别方法。其中基于模型的人脸识别方法包括特征脸法(Eigneafec)、神经网络法(NN)、隐马尔可夫模型方法(HMM)等方法。(1)基于面部几何特征的方法这个方法在时间上来说是最早提出的人脸识别方法之一,其特征提取以人脸面部特征点的形状和几何关系为基础的。对于不同的人来说有着不同的人脸轮廓、大小、相对位置的分布也是不相同的,所以说用这种方法来进行人脸识别还是有一定依据的。这种方法的做法是,提取眉毛、眼睛、鼻子和嘴巴这几个特征点,计算出这几个特征点的大小,以及他们之间的几何距离,来进行人脸识别,几何距离一般包括特征点之间的距离、他们之间的夹角等。特征提取后选取最近邻分类器,相异度测试选用欧式距离。基于几何特征的人脸识别算法的优点是方法简单,计算速度快。但它识别人脸就靠几个特征点的大小和距离,以及特征点之间的夹角,这样的信息是远远不够的,对于一个稍微大一点的人脸库识别率不高,还有这种方法对于人脸表情变化时没有很好的鲁棒性。但是这种方法还是有一定潜力的,好比一个大型的人脸库,进行人脸比对前可以使用基于面部几何特征的方法对训练样本进行粗分类,这样可以大大降低人脸识别时间。(2)基于模板匹配的方法模板匹配方法也是模式识别中的一个比较传统的方法。把模板匹配方法用到人脸识别中要以Poggio和Bruneili所提出的基于局部特征的模板匹配算法为代表。他们首先利用积分投影的方法确定面部特征点,提取局部特征的模板,然后进行局部模板匹配,计算相关系数进行分类,Poggio和Brulleili比较了基于几何特征和基于模板匹配的人脸识别方法。他们的实验结果表明,在人脸尺度、光照、姿态稳定的情况下,基于模板匹配的人脸识别方法要优于基于几何特征的人脸识别方法。通过大量的实验表明,基于模板匹配的人脸识别方法对光照、旋转、人脸表情比较敏感,仅当这些因素比较稳定时,才能获得比较好的效果。这种方法的计算量要比基于面部几何特征的方法要大。(3)基于小波特征的方法小波变换是国际上公认的最新频率分析工具,由于其“自适应性,和“数学显微镜性质”而成为许多学科共同关注的焦点,在信号处理中起着至关重要的作用。目前小波技术在验证的特征撮上用得较多。小波变换采用以高斯函数的二阶导数作为小波基的小波变换技术来进行拐点提取,然后以该方法为基础,进行不同图像之间拐点序列的匹配;最后再利用提敢的拐点来对图像进行分段和段一段对应处理。由于使用离散小波变换来分解图像的参数特征,特征提取用到自适应算法,匹配则选择动态规划方法,初步试验取得较好的效果。(4)基于特征脸的方法特征脸方法是从主成成分分析(PCA)导出的一种人脸识别和描述技术。它将包含人脸的图像区域看作一随机向量,采用K-L变换得到正交K-L基,对应其中较大特征值的基具有与人脸相似的形状,因此又被称为特征脸。利用这些基的线性组合可以描述、表达和逼近人脸图像,所以可进行人脸识别与合成。识别过程就是将人脸图像映射到由特征脸组成的子空间上,并比较其在特征脸空间中的位置,然后利用对图像的这种投影间的某种度量来确定图像间的相似度,最常见的就是选择各种距离函数来进行度量分类实现人脸识别。(5)神经网络法基于神经网络的人脸识别方法就是利用神经网络的学习能力和分类能力对人脸进行特征提取与识别。目前常用的人工神经网络方法是BP(Back-Propagation)神经网络、自组织神经网络、径向基函数神经网络。径向基函数神经网络与BP网络一样都是多层前向网络,它以径向基函数作为基准,以高斯函数作为隐含层的激励函数。这种网络的学习速率快、函数逼近、模式识别等能力均优于BP神经网络,并广泛应用于模式识别、图像处理等方面。但是这种网络比BP网络所用的神经元数目要多得多,使它的应用受到了一定的限制。(6)隐马尔可夫模型方法(HMM)HMM作为信号的一种统计模型,目前广泛应用于模式识别、图像处理的各个领域。HMM是一个由两种机理构成的随机过程:一个机理是内在的有限状态Markov链,体现为用具有限状态数的Markov链来模拟签名信号统计特征变化的隐含的随机过程,另一个是一系列随机函数所组成的集合,体现为与Markov链的每一个状态相关联的观测序列的随机过程。设有观察序列Q=Q1Q2Qn和状态集=Ss1,s2,sn,一个有n个状态的隐马尔可夫模型可以表示(,A,B),其中为初始状态概率矢量;A=aij为状态转移概率矩阵,其中aij=Pqt+1=Sj|qt=St,1=i,j=N;B=bjQt)为观察符号概率分布,若B有M个观察值v1,v2mv,则bj(Qt)=Pqt=vk|qt=sj,1=j=N,l=k=M。HMM的使用涉及到训练和分类两个阶段,训练阶段包括指定一个HMM的隐藏状态数,并且优化相应的状态转换和输出概率以便于产生的输出符号与在特定的运动类别之内所观察到的图像相匹配。匹配阶段涉及到一个特定的HMM可能产生相应于所观察图像特征的测试符号序列的概率计算。利用H顾进行验证同样由两个阶段组成,即利用训练样本估计MHM模型参数和利用HMM评价测试。这两个过程目前都有成熟的算法,HMM参数的估计可用Baum-welch参数估计算法或Segmental K-means算法;对测试样本的评价,可以用Forward-Backward迭代算法估计签名满足模型的概率,或用viterbi最优状态搜索算法计算过程经过的最优状态。因此,利用HMM模型的关键在于HMM类型的选择和一些参数的选择以及阀值的估计4。2.2 分类器在人脸识别过程中,通过提取特征模块,得到表示人脸图像的特征向量,此时需要利用分类器根据提取的特征向量进行分类处理,以确定当前人脸的身份。在这个过程中,分类器起着决策机制的作用,对最终的判别非常关键,分类器性能的优劣也将直接关系到人脸识别结果的好坏。常用的分类器有以下几种:(1)最小距离分类器(NC) 最小距离分类器相似度量是以检测样本到类中心的距离大小为判据。(2) 最近邻分类器(NN)最近邻法是将所有训练样本都作为代表点,因此在分类时需要计算待识别样本x到所有训练样本的距离,与x最近的训练样本所属于的类别即为待识别样本x所属类别。假定有C个类别1、n的模式识别问题,每类有标明类别的样本Ni个,i=1,2,C,我们可以规定以类的判别函数为,k=1,2,Ni . (2.2.1) 其中xki的角标i表示以类,k表示i类Ni个样本的第k个,决策规则可以写为: 若 ,i=1,2,.,C, (2.2.2)则决策xi。(3) 三阶近邻法三阶近邻法是计算像素的差值的绝对值。距离公式可表示为:L(x,y)=lxi-yil (2.2.3)由式(2.2.3)计算所得出的具有最小值的图像并不一定属于同类别。三阶近邻法计算出与测试图像距离最小的三幅图像,计算这三幅图像所属的类分别计为classl,class2,class3,若classl和class2且class2和class3不属于同一类,则测试图像属于classl;若classl和class2相同,则测试图像属于classl,而class2与测试图像也是相似的;若class2和class3属于同一类,则测试图像属于class2,而class3与测试图像也是相似的,但classl虽然与测试图像距离最近却不属于同一类,可能是由测试图像的姿态和饰物引起的(4))贝叶斯分类器 如果知道各类的先验分布和条件分布,就可以采用最大后验估计(MAP)的方法进行分类。在人脸识别中,有时假定人脸服从高斯分布,能够得到不错的结果。(5)支撑向量机(SVM)是基于结构风险最小化得出的。尤其在小样本情况下,既降低了训练集的错分风险,又降低了未知人脸(如检测集)的错分风险。在人脸识别中已逐渐得到应用。(6)神经网络分类器(NNC),采用神经网络作为分类器是很自然的。一般一个3层网络对应模式识别中图像输入、特征提取、分类3部分。通常的NNC有多层感知机(MLP)模型、BP网络、径向基函数网络等。SVM也借鉴了神经网络的思想。第三章 人脸识别系统的设计及实现3.1 人脸识别流程完成人脸识别的工作需要一系列的步骤,它们结合起来构成一个完整的流程。由于研究人员来自不同的学科、具有不同的背脊,而且不同的人脸识别应用中对识别的目标也不同,所以人脸识别的流程并不统一一个比较通用的人脸识别流程如下图所示:输入图像结果输出人脸检测/跟踪 特征提取特征降维匹配识别 图1 人脸识别流程图其主要步骤包括:人脸检测/跟踪(face detection/tracking),特征提取(face extraction),特征降维(face dimensionality reduction),匹配识别(matching and classification).它们之间基本上是串行的关系3。(1) 人脸检测/跟踪。人脸检测是完成人脸识别工作的自动系统的第一个步骤。该步骤的目的是在输入的图像中寻找人脸区域。具体来说:给定意一幅任图像,人脸检测的目的是确定是否图像州有人脸存在,如果存在,给出每个人脸的具体位置和范围。实际应用中人脸图像的采集或获取常在非受控的条件下进行,这样所得到的图像中的人脸在尺寸、朝向、明暗、遮挡、分辨率等方面都有很多不同,使同一的人脸出现各种变形,并有可能导致各种误识、漏识等失败的情况。为校正人脸在尺度、光照和旋转等方面的变化,常需采用一些包括几何归一化(空间尺度归一化)和光照归一化(灰度幅值归一化)等手段来调整不同的人脸图像,以利于用统一算法进行识别。(2) 特征提取。 为区分不同的人脸,需提取各种人脸的独特性质。也就是要从人脸图像中映射提取一组反映人脸特征的数值表示样本。这里首先需要采取某种表示方式来表示检测出的人脸和数据库中的已知人脸。通常的表示法包括几何特征(如欧氏距离、曲率、角度)、代数特征(如矩阵或特征向量)、固定特征模板、特征脸等。(3) 特征降维。 人脸是一个非刚性的自然物体(柔性体),从人脸图像中可提取很多不同特征,所以表征人脸的原始特征对应高维空间中的数据(对一幅M*N的图像,空间维数可达M*N)。直接利用这样高维的数据进行识别除需要很多的匹配计算量外,由于很难对各高维数据的描述能力做有效的判断,故还不能保证基于这么多数据进行的识别结果的正确性。在特征提取后,需采用紧凑的人脸表征方式,将原始特征进行筛选组合,集中信息,降低维数,使这些低维空间的有效性的到提高,以有利于接下来的匹配分类。(4) 匹配识别。 在特征提取的基础上,选择使当的匹配策略,可将待识别的人脸与数据库中的已知人脸进行匹配比较,建立它们的相关关系,并输出所作出的判断决策/决定(识别结果)。与人脸检测不同,这里利用的主要是人脸个体差异的信息。有两种识别目的和情况需要区别:一种是对人脸图像的验证(verification),即要确认输入人脸图像中的人是否在数据库中,属于有监督的识别;另一种是对人脸图像的辨识(identification),即要确认输入图像中的人的身份,属于无监督的识别。3.2 离线学习和在线匹配人脸识别系统的构建及使用常由两个过程来完成,即离线学习和在线匹配。离线学习是利用作为训练样本的人脸图像,从中提取公共的特征,建立训练样本的特征子空间,使系统具有描述已有类别图像的能力,为在线匹配打下基础。在线匹配是要从输入的待识别人脸图像中提取相应的特征,将这些特征与离线学习的特征进行匹配,从而可借此将输入图像和训练图像建立联系,并将输入图像归入到某个训练图像类别中,如下图:离线学习训练图像特征提取特征子空间在线匹配分类结果训练图像训练图像特征子空间 图2 即离线学习和在线匹配流程图本实验即采用的这种方案。第四章 KL变换和PCA人脸识别方法4.1 简介我们希望将图像原特征做某种正交变换,获得的数据都是原数据的线性组合,从新数据中选出少数几个,使其尽可能多地反映各类模式之间的差异,又尽可能相互独立,一个常用的方法就是主成分分析(PCA)。KL(Karhunen-Loeve)变换或主分量分析 (Principal Component Analysis,PCA),这是一种特殊的正交变换,它是重建均方误差最小意义下的最佳变换,起到减少相关性,突出差异性的效果,在图像编码上能去除冗余信息,也常用于一维和二维信号的数据压缩;这种变换采用主要特征对应的特征向量构成变换矩阵,保留原模式样本中方差最大的数据分量,在对高维图像编码时起到了降维作用。由于KL变换和PCA去相关性和降维作用,Mathew A.Turk和P.Pentland首先将主成分分析运用到人脸识别中来。通过K_L变换得到高维人脸空间的投影矩阵,人脸图像都可以由这些矩阵的线性组合来表示,正是因为这些矩阵呈现人脸的形状,所以将这种人脸识别称为特征脸(Eigenface)方法5。4.2 KL变换和PCA分析对给定的信号x(n),如果它的各个分量之间完全不相关,那么表示该数据中没有冗余;若x(n)中有相关成分,通过去除其相关性则可达到数据压缩的目的。主成分分析方法(PCA)基本思想是提取出空间原始数据中的主要特征(主元),减少数据冗余,使得数据在一个低维的特征空间被处理,同时保持原始数据的绝大部分的有用信息,从而解决数据空间维数过高的瓶颈问题。一个宽平稳的实随机向量x(n)=x(0),x(1),x(N-1)T,其协方差矩阵Cx定义为:Cx=E(x-x) (x-x)T=式中E代表求均值运算,=Ex是信号x的均值向量,Cx的元素Cx(i,j)=Ex(i)-x)( x(j)-x)=Cx(j,i)即协方差阵是实对称的。显然,矩阵Cx体现了信号向量x的各分量之间的相关性。若x的各分量互不相关,那么Cx中除对角线以外的元素皆为零。KL变换的思路是寻求正交矩阵A,使得A对x的变换y的协方差阵Cx为对角矩阵,其步骤如下:先由的N阶多项式|I-Cx|=0,求矩阵Cx的特征值0,1,N-1,以及N个特征向量A0,A1,AN-1。然后将A0,A1,AN-1归一化,即令=1,i=0,1,2,N-1。由归一化的向量成A0,A1,AN-1就构成归一化正交矩阵A,即A= A0,A1,AN-1T最后由y-Ax实现对信号x的KL变换。显然,矩阵A各向量之间相互独立,体现了去相关性,在图像编码中去除了冗余。4.2.1 KL变换原理假设X为n维的随机变量,X可以用n个基向量的加权和来表示: i (4.2.1.1) 式中:ai为加权系数,i为基向量,此式也可以用矩阵的形式表示:X=(12n)(a1a2an)T (4.2.1.2)其中 =(12n), =(a1a2an)T我们取基向量为正交向量,由正交向量构成,所以是正交矩阵,即T=I将公式(4.2.1.1)两边左乘T,并考虑到为正交矩阵,得=TX即:i=TiX。我们希望向量的各个向量间互不相关。那么如何保证的各个分量互不相关呢?这取决于选取什么样的正交向量集。设随即向量的总体自相关矩阵为: R=EXTX (4.2.1.3)将公式(4.2.1.1)代入上式(4.2.1.3),得 R=EXTX=E TT= ETT (4.2.1.4) 我们要求向量的各个分量间互不相关,即满足下列关系: (4.2.1.5) 写成矩阵的形式则:R=T (4.2.1.6)将上式两边右乘上,得: R=T (4.2.1.7)因为是正交矩阵,所以得: R= (4.2.1.8)Rj=jj (j=1,2,3,n) (4.2.1.9)可以看出,i是x的自相关矩阵R的特征值,。j是对应特征向量。因为R是实对称矩阵,其不同本征值对应的特征向量应正交。综上所述,KL展开式的系数可用下列步骤求出:步骤一:求随即向量x的自相关矩阵R=EXTX,由于没有类别信息的样本集的均值向量,常常没有意义,所以也可以把数据的协方差矩阵作为KL坐标系的产生矩阵,这里召是总体均值向量。步骤二:求出自相关矩阵或协方差矩阵R的本征值j和本征向量j。其中j=1,2n。同时本征向量组成的矩阵为j。j=1,2n。步骤三:展开式系数即为=TX。K-L变换的实质是建立了一个新的坐标系,将一个物体主轴沿特征矢量对齐的旋转变换,这个变换解除了原有数据向量的各个分量之间相关性,从而有可能去掉那些带有较少信息的坐标系以达到降低特征空间维数的目的。4.2.2 主成分分析法 (PCA)主成分分析法(PCA)在人脸识别领域成功应用的一个重要理论基础是较好的解决了K.L变换后协方差矩阵的特征向量的求解问题。人脸识别是一个典型的高维小样本问题,即人脸图像向量的维数一般较高,比如,实验用的ORL人脸库的图像大小为112x92的人脸图像,其对应的图像向量特征空间高达10304维,在如此高维的图像空间内,按照通常的算法,计算样本的协方差矩阵的特征向量是异常耗时的。同时,在人脸识别问题中,由于客观条件的限制,训练样本的数目一般较小,通常,训练样本的总数远远小于人脸图像向量的维数。针对高维小样本的情况,求解特征向量所采取算法的基本思想是,将高维的问题转化为低维的问题加以解决。主成分分析法(PCA)是模式识别判别分析中最常用的一种线性映射方法,该方法是根据样本点在多维模式空间的位置分布,以样本点在空间中变化最大方向,即方差最大的方向,作为判别矢量来实现数据的特征提取与数据压缩。主成分分析法的原理如下:已知n维空间的随机向量用(Rn)表示,利用公式将进行零均值处理,x=-E(),则E(x)=0。如果对x用一组完备正交基j,j二1,2,n展开,可得 (4.2.2.1) 假设只用前k项进行重构,则(4.2.2.2)其均方误差为:=E(x-xrec)T(x-xrec)(4.2.2.3)因为 且j=jTx所以 =E=(4.2.2.4)其中C=ExxT=E(-E) (-E)T是x和的总体协方差矩阵。为了使重构的均方误差最小,并满足正交条件的约束,采用拉格朗日乘子法,将函数J(uj)= -对j(j=1.2n)求导,得(C-jI)J=0,J=k+1,k+2,n(4.2.2.5)令k=1,此时ul,u2,un为总体协方差矩阵C的本征向量,1, 2n分别是它们对应的特征值,这些特征向量经过正交化处理所形成的空间称为特征空间。将特征向量ul,u2,un按照它们的特征值进行降序排列123n。,则得到结论:对于任一随机变量x,如果采用总体协方差矩阵C的前k个最大非0特征值所对应的特征向量作为坐标轴展开,可在相等截断长度下获得所有正交展开中最小的截断均方误差min (4.2.2.6)下面我们将主成分分析法用于人脸识别6。 假设训练人脸图像的个数为M,将每一副图像按列串相接的方式排成长度为N的向量1,2,3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年工程管理课程考核试题及答案
- 2025年工程项目风险管理考试题及答案
- 压力初一满分作文9篇范文
- 国庆假期作文400字(15篇)
- 商业合作伙伴保密协议细节规定
- 在线会议服务合同书
- 《人类基因与遗传信息解读:高中生物教学教案》
- 秋天的怀念情感探究与写作技巧教案
- 初中文言文诵读课教案设计
- 语文文学《红楼梦主题作品教学大纲》
- 2025设备租赁合同版本范文
- 2025年全国高考数学真题全国2卷
- 2025年浙江杭州钱塘区和达能源有限公司招聘笔试冲刺题(带答案解析)
- 转让钓场合同协议书
- 2025年四川省成都市初中学业水平考试生物试题(无答案)
- 医院感染教学课件
- 民航危险品运输典型案例55课件
- 仓库管理制度及流程
- 四川省绵阳市名校联盟2025届八年级物理第二学期期末复习检测试题含解析
- 《全球教育资源库》课件
- 2025-2030中国烘焙食品行业市场发展分析与发展趋势及投资风险研究报告
评论
0/150
提交评论