版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人脸识别特征提取算法研究摘要随着社会的进步和科技的发展,生物特征的识别应用越来越多。如海关及公安系统等需要提供准确的身份认证,日常生活中,人们的安全、财产、隐私等都需要利用先进的科技手段进行保护。因此如何能够高效、快速,可靠识别生物身份的系统被人们普遍研究。本文对基于PCA的人脸识别技术进行了研究,具体的工作如下:首先,论文论述了人脸识别技术的目的和意义。并结合国内外的研究状况和目前存在的不足探讨了人脸识别技术未来的发展趋势和研究方向。并对本文研究工作内容做了简要介绍。其次,在比较目前常见人脸识别技术预处理的各种算法基础上分析了PCA技术。对研究方法和计算结果进行了分析总结,并对下一步工作进行了展望。关键词:人脸识别PCA特征提取SVD目录摘要 i目录 iii第一章绪论 51.1研究背景和研究目的 51.2研究内容和研究意义 61.3人脸识别的研究现状 71.4本章小结 8第二章人脸识别相关技术介绍 92.1系统概述 92.2人脸识别主要技术 92.2.1二维人脸识别算法介绍 92.2.2三维人脸识别算法介绍 102.3常用的人脸图像库 102.4人脸的特征提取 112.4.1几何特征提取法 112.4.2代数特征提取法 122.5本章小结 12第三章人脸图像预处理方法 133.1图像的灰度变换 133.2图像的直方图均衡化 143.3图像的平滑 153.3.1低通滤波 153.3.2中值滤波 163.4几何校正 163.4.2图像旋转 173.4.3图像裁剪 173.5本章小结 17第四章基于PCA的人脸识别算法 184.1人脸识别 184.2基于PCA的人脸识别 184.2.1读入人脸数据库 194.2.2K-L变换 193.2.3SVD定理 214.3MATLAB仿真 224.4本章小结 27第五章总结与展望 28参考文献 29第一章绪论1.1研究背景和研究目的近些年来,有关人脸的处理已受到广大研究人员越来越多的重视,如人脸识别,人脸定位,面部表情识别,人脸跟踪等。人脸处理系统在安全系统的身份认证,智能人机接口,图像监控,视频检索等邻域有着广泛的应用前景。此外在进行人工智能的研究中,人们一直想做的事情就是让机器具有像人类一样的思考能力,以及识别事物,处理事务的能力,因此从解剖学,心理学,行为感知学等各个角度来探求人类的思维机制,以及感知事物,处理事物的机制,并努力将这些机制用于实践,如各种智能机器人的研究。同时,进行人脸图像识别研究也具有很大的使用依据。如同人的指纹一样,人脸也具有唯一性,也可用来鉴别一个人的身份。人脸图像的自动识别系统较之指纹识别系统,DNA鉴定等更具方便性,因为它取样方便,可以不接触目标就进行识别,从而开发研究的实际意义更大。并且与指纹图像不同的是,人脸图像受更多因素的干扰,人脸的表情的多样性;以及外在的成像过程中的光照,图像尺寸,旋转,姿势变化等。使得同一个人,在不同的环境下拍摄所得到的人脸图像不同,有时更会有很大的差别,给识别带来很大难度。因此在各种干扰条件下实现人脸图像的识别,也更具有挑战性。近年来许多神经生理学家在视觉系统上已展开了全面深入的研究,并且取得了一些有重要意义的研究成果。这就使得在工程上利用计算机来模拟视觉系统成为可能。基于这一认识,利用已有的生物学科研成果,联系信号处理,计算理论以及信息论知识,通过对视觉系统进行计算机建模,使计算机能在一定程度上模拟人的视觉系统,以解决人工智能在图像处理邻域中碰到的难题。神经稀疏编码算法正是这样一种建模视觉系统的人工神经网络方法。这种算法编码方式的实现仅依靠自然环境的统计特性,并不依赖于输入数据的性质,因而使一种自适应的图像统计方法。传统的人脸识别系统中,不管是基于整体的或者局部特征的人脸识别方法,都需要建立很好的模型来提取特征,而稀疏编码理论对特征的选取方面要求相对较低,所以结合特征提取方法再对稀疏编码算法进行深入研究,并应用到人脸识别中,扩展了人脸识别的方法理论,将会对该邻域的研究起到一定的促进作用,因此具有很重要的学术意义。目前,稀疏编码SC方法在盲源信号分离,语言信号处理,自然图像去噪以及模式识别等方面已经取得许多研究成果,具有重要的实用价值,是当前学术界的一个研究热点。进一步研究稀疏编码技术,不仅会积极的促进图像信号处理,神经网络等技术的研究,而且也将会对相关邻域新技术的发展起一定的促进作用。人脸图像识别除了具有重大的理论价值以及极富挑战性外,还具有许多潜在的应用前景,利用人脸图像来进行身份验证,可以不与目标接触就取得样本图像,而其它的身份验证手段,如指纹,眼睛虹膜等必须通过与目标接触或相当接近来取样,在某些场合,这些识别手段就会有不便之外。1.2研究内容和研究意义人脸识别是当前人工智能和模式识别的研究热点,它是近20年来才发展起来的,20世纪90年代后更成为科研热点。最初的应用于公安部门关于犯罪照片的存档管理和刑侦破案,随着科学技术的发展和社会的进步,进行快速,有效,自动的人脸识别技术要求日益迫切。不仅如此,目前该技术在国家公共安全,社会安全及商业等领域都有很多应用,主要有;证件验证在许多场合,证件验证是检验某个人身份的一种常见手段,而身份证。驾驶执照以及其他很多证件上都有照片,那么这项工作就可以交给机器完成,用以实现自动化智能管理。刑侦破案当公安刑侦部门未获得罪犯的照片时,我们可以根据目击证人的描述,先由专业人员·描出犯罪嫌疑人的肖像草图,然后用计算机合成出大概的人脸图像,再将此图像和数据库里的大量图像进行对比,找到犯罪嫌疑人,这样不仅节省了人力物力,更让犯罪嫌疑人难逃法网。入口控制在机场,港口等许多出入口,由于人力有限,我们需要对关键出入口进行视频监控,一旦发现恐怖分子或违规人员进入视频监控范围,保安人员可以立马采取行动进行抓捕或阻止4)信息安全由于科技的进步,犯罪分子伪装技术越来越高明,假身份证,假护照泛滥,即使是在电子商务领域,黑客破译计算机口令也比较容易,这给社会治安,商业机密带来挑战。所以,把有着独立,唯一性和稳定性的人脸生物特征作为密码口令,使得犯罪分子更难以伪造和攻击,也使得国家安全部门,军方等系统更加安全可靠5)视频监控在许多银行,公司,公共场所等都装有视频监控系统。当出现异常的时候需要对采集到的图像进行分析,就要用到人脸的检测,跟踪和识别技术。此外,人脸识别技术在医学,通道控制和小区,人机交互等领域也具有广阔的应用前景。在学术研究领域,人脸识别的研究涉及到图像处理,模式识别,神经网络,计算机视觉,人工智能,生理学,心理学及认知科学等多方面的知识。对人脸识别的深入研究不仅可以促进这些基础研究的发展与交叉,而且有助于新的研究方向的产生,具有重要的学术价值。由此可见,人脸识别技术的研究具有极大的社会意义,甚至可能是形成一个巨大的,对人类生产生活产生深远影响的产业1.3人脸识别的研究现状人脸识别的研究历史比较悠久,Galton早在1888年和1910年就分别在【Nature】杂志发表了两篇关于利用人脸进行身份识别问题的文章,对人类自身的人脸识别能力进行了分析,但当时还不可能涉及到人脸的自动识别问题。最早的关于人脸识别问题的研究论文见于1964年Bertillon在PanoramicResearchlnc.发表的技术报告和1965年Chen在PanoramicResearchlnc.发表的技术报告到现在已有四十余年的历史。近年来人脸识别研究得到了诸多研究人员的青睐,涌现出了诸多技术方法。尤其是1990年以来,人脸识别得到了长足的发展,每年都有大量的学术论文发表。现在几乎所有知名的理工科大学和IT产业的主要公司都有研究组在从事人脸识别的研究。人脸识别的研究大致可分为四个阶段。第一个阶段以Bertillon,Allen和Parke为代表,主要研究人脸识别所需要的面部特征。该阶段是人脸识别研究的初级阶段,非常重要的成果不是很多,也基本没有获得实际应用。第二个阶段是人机交互识别阶段。该阶段代表性工作是Goldstion,Harmon和Lesk等用几何特征参数来表示人脸正面特征.他们用21维特征矢量表示人脸面部特征,并设计了基于这一特征表示的识别系统。在这个阶段,Kanade博士于1973在京都大学完全了第一篇人脸识别方面的博士论文。该阶段的方法仍摆脱不了操作员的干涉。第三个阶段是真正的机器自动识别阶段。这一阶段时间相对短暂,但却是人脸识别研究的高潮期,不但诞生了主成分分析,线性判别分析,弹性图匹配,局部特征分析,独立分量分析,支持向量机,神经网络,隐马尔可夫模型,柔性模型和主动表现模型等若干代表性的人脸识别算法。这一阶段的人脸识别系统发展非常迅速,所提出的算法在较理想图像采集条件,用户配合,中小规模正面数据库上达到了非常好的性能。从技术方案上看,2D人脸图像线性子空间判别分析,统计表现模型,统计模式识别方法是这一阶段的主流技术。第四个阶段是鲁棒的人脸识别技术的研究阶段。近几年来,研究人员针对影响人脸识别的一些主要因素,例如光照,姿态,表情,年龄,遮挡,低分辨率等变化因素,提出了很多解决方法。如对于光照变化的处理方式主要有光照锥法,球谐波函数法,九点光源法等。对于姿态变化的处理方法主要有多视角法,局部到整体几何特征变化匹配法,通用3D模型法,3D形变模型法,光流场法等。1.4本章小结本章介绍了人脸识别的研究背景以及研究目的,对人脸识别的深入研究不仅可以促进这些基础研究的发展与交叉,而且有助于新的研究方向的产生,具有重要的学术价值。
第二章人脸识别相关技术介绍2.1系统概述人脸识别技术是模式识别的技术中具有重要性的应用方面,可以分为三方面,一方面是对人脸图片进行预处理,第二个方面是特征的提取,第三个方面是比较识别。人脸的识别系统一般有以下几个步骤,系统的流程图如图2-1所示:图2-1人脸识别系统流程图2.2人脸识别主要技术目前人脸识别的算法主要有两大类,二维的人脸识别算法和三维的人脸识别算法。2.2.1二维人脸识别算法介绍二维人脸识别算法通过提取人脸主要的特征来进行人脸的对比,主要方法有以下几种:主成分分析法:这种方法一直是在模式识别这一块领域中基础而重要的方法,也是人脸识别这一领域的重要算法,这种算法首先根据预存的人脸图像来构成特征脸空间。人脸模板匹配法:按照维度可以分为两种模板,二维人脸模板和三维人脸模板,主要是根据人的面部特征构建出一个立体且可以调节的人脸模型。在定位到人脸后,就需要人脸模型来定位和调节人脸的特征部位,用来处理识别过程中所涉及到的人脸角度,表情变化和遮蔽物等因素的影响。局部投影保持法:该方法是源自于子空间分析方法,是一种非线性方法的线性近似。这种方法不仅有原始图像非线性流形的优势,又能够得到新样本点低维度投影的优势。人脸子空间分析法:这种方法已经成为人脸特征提取的重要方式,也是目前人脸识别的一种主流方式。因为可以对人脸有很强的描述性,而且计算量也比较小,容易实现,可分性也较好。除了上边提到的四种方法以外,二维的人脸识别的算法还有支持向量机法,人工神经网络法,弹性匹配法和基于人脸积分的图像特征的方法。2.2.2三维人脸识别算法介绍二维的人脸识别算法的识别率很容易受到人脸角度变化,遮蔽物,表情变化的因素影响。但是这些因素都是日常生活中常见且不可控的,所以需要研究更为先进的算法,三维人脸识别算法根据深度图像来进行研究,对以上提到的因素都能有着更好的解决方法。主要方法有:基于人脸模型可变的参数法:利用人脸模型的3D变换以及迭代距离当中映射的最小值来还原3D的人脸图像和头部的姿势。改变关系还可以更新头部的参数,以此方法过程来达到最小化尺度的要求。基于人脸图像的特征法:想要从人脸的3D结构中将姿态分离开来,就需要计算人脸的三维空间方向,并且计算出人脸的整体轮廓及尺寸。然后就可以通过保持姿态来进行脸部特征点的匹配。2.3常用的人脸图像库人脸识别技术已经变成了热门的研究内容,为了使学者研究和使用更为方便,目前国际上有和多家权威的机构构建了标准人脸库,主要有以下几种:ORL人脸库,美国的一家专业从事人脸图像研究的实验室所拍摄的一组人脸图像,构成了ORL人脸库,参与拍摄的人来自不同的种族,不同的性别,不同的年龄,共计四十个人。每名试验者都拍摄十张图片,图像均是灰度图像,像素使112×92。每个人的十张照片中表情,人脸大小,姿态都是有所变化的。该数据库包含了大量的人脸信息,研究起来很是方便。FERET人脸库,这个数据库是最大的人脸数据库,是英国的国防部所建立,数据库里面的人脸图像有肤色和人脸角度的变化。测试人的背景图像都是统一的,每个人都是八张照片,因此可以最大限度的排除外界的干扰。此数据库在人脸数据库中是很权威的,美中不足的是在获取图像信息的时候不是特别方便。Essex人脸库,英国的埃塞克斯大学建立了此人脸数据库,并且为研究者提供了免费下载的好处但是不允许发售和打印。计算机视觉的研究项目的由负责人LiborSpeacek博士负责和维护。其中包含四个库,分别为grimace,faces94,faces95,faces96。其中faces96和grimace是难度非常大的,也是最不容易识别的。因为这两个库的背景,人脸表情,人脸的比例大小都是变化的。本文中采用的是自建数据库,库中有十位测试者的照片,每张照片占内存12.1kb,像素为92×112,格式为bmp格式。每位测试者有两张照片,每张照片都有表情的变化,每位测试者的照片都和正脸有一定范围内的倾斜角度,用每位测试者的照片组成训练样本库,然后用另外一张作为待识别的人脸库。2.4人脸的特征提取人脸图像在最初的样本空间中,并非集中分布,这一点常常不利于有效的归类识别。为了可以区分不同类别的人脸图像,可以将原始的人脸图像转换到另一个空间中,通过线性或非线性的办法去实现。这样就会让同类型的人脸图像在空间的分布中变得更为集中,方便识别和归类。特征提取就是通过变化或映射的方法,将高维空间中的原始特征转化到低维特征空间中,从而得到低维的人脸特征表示。人脸特征主要分为两大类:代数特征和几何特征:2.4.1几何特征提取法人脸几何的特征,就是人脸的器官形状和几何关系为基础的特征矢量,它的分量通常包括了人脸所指定的两点之间的欧式距离,角度曲率等。人脸中典型的几何特征,分量有以下几种:(1)眉毛的弧度(2)眉毛的厚度以及眉毛对应的眼睛中心处的垂直距离(3)鼻子的宽度及其垂直位置(4)鼻子处人脸的宽(5)鼻尖到眼睛中心位置的距离称为半脸宽(6)嘴的宽度厚度,垂直位置及其上下唇的厚度人脸的几何特征有着提取速度快,占用内存少的优势。但是在识别的精确度上不如基于代数特征的方法好,他对几何参数的测定要求需要有着精确的测量,因此在有着遮蔽物或是人脸图像质量不好的情况下,它的识别率会很快的下降,所以我们把人脸的代数特征讨论作为重点。2.4.2代数特征提取法人脸图像代数特征的矢量表示,人脸的代数特征相当于人脸图像,在特征点构成的低维空间上的投影。Kirby等人首次将主元分析了子空间思想,引到人脸识别技术当中,并且取得了较大的影响,引起了研究学者的广泛关注,进而成为了目前人脸识别算法中的较为主流的方法之一。子空间方法的主要思想就是空间变换,根据一定的性能目标来寻找线性的或者非线性的空间变换,将高维原始信号数据压缩到低维的子空间当中,这样会使得数据分布更为紧凑,为更好地进行数据描述提供了方式。此外,还可以将计算的复杂度大大的降低。子空间方法可以分为线性和非线性。线性子空间法指的是空间变换时是线性的,用来将原始的人脸数据压缩到低维空间当中,常见的由主人分析法线性判决分析和独立源分析的方法。PCA法的目的是找到一组最好的单位正交向量基即主元,这一过程是通过线性变化来完成的。用这些主元的组合来对原样本进行重建,并且要求重建之后的样本和原来的样本之间误差要最小。2.5本章小结人脸识别技术涉及到了许多方面,比如图像处理,特征提取,图像识别等过程,每个过程都有多种主多的算法,每一个过程都是重点和难点,本文研究了基于PCA的人脸识别算法,所以先对人脸识别的主要技术二维人脸识别算法和三维人脸识别算法做了简单的介绍,然后对人脸识别的关键步骤进行了重点说明,最后简单介绍了当前用到的主流人脸图像库。
第三章人脸图像预处理方法图像预处理是人脸识别过程的重要组成部分。人脸图像由于不同的外部采集环境,例如光照度和设备的性能,存在很多影响人脸识别的问题。另外,设备采集到的图像,人脸大小、角度不确定,图像像素大小存在较大差异,人脸不在图像的中间位置或人脸占整个图像比例过大、过小等,这些因素直接影响人脸识别系统的正常识别功能。为了确保人脸图像能达到系统识别要求,我们第一步需要对采集到的人脸图像进行预处理。本文中的人脸图像的预处理过程主要包括图像的灰度变换、图像直方图均衡化、图像的平滑处理、图像的几何校正等。通过对图像的预处理,可以实现图像的标准化,便于人脸识别系统的识别。3.1图像的灰度变换1)彩色图像转换为灰度图像图像灰度变换可以实现将彩色图像转换为仅有黑白颜色的图像的功能。这可以使人脸识别系统中处理图像的过程更简单,更具体,减少不必要的信息对人脸识别的负面影响。我们一般在外界采集到的图像都是RGB三基色的彩色图像。RGB三基色的颜色空间可以用三维直角坐标系中一个放在第1卦限内的单位正方体来表示,空间中每一点都代表一种颜色。比如原点坐标(0,0,0)表示黑色,坐标(1,1,1)表示白色,坐标(1,0,0)表示红色,坐标(0,1,0)表示绿色,坐标(0,0,1)表示蓝色,坐标(1,1,0)表示黄色,坐标(0,1,1)表示青色,坐标(1,0,1)表示紫色。单位正方体坐标(0,0,0)和(1,1,1)主对角线则代表从黑色到白色之间不同级别的深度,也就是灰度。灰度就是像素的亮度值,灰度图没有色彩信息,像素点的色彩只反映图像的亮度,不反映颜色信息,它是逐渐过渡变化的,正如平常所见的黑白照片,灰度图可以用亮度值来表示,灰度划分越细致,重现的原灰度图越准确。目前,普遍采用从0到255共256个灰度值来表示灰度图像,0指全黑,255指全白,0~255之间则表示灰色图像的亮度深浅变化。因为灰度图使用方便,也比较容易处理,所以人脸识别的研究一般采用灰度如式3-1所示:gray=0.39×R+0.50×G+0.11×B(3-1)gray代表图像的灰度值,R、G、B代表颜色红、绿、蓝的分量值。应用Matlab软件对彩色图像进行仿真处理,可以将彩色图像转换为灰度图像图为研究对象。图像灰度变换我们在灰度处理的过程中也会损失掉图像中的一些有价值的信息。所以我们需要尽量采用简单的程序来表示复杂的图像细节,这就是图像的灰度变换。我们可以对采集到的缺乏层次、对比度不高的图像进行灰度变换,突出图像有用的细节。以下介绍一种灰度变换的方法:图像灰度的线性变换。在实际应用中,一些图像在拍摄过程由于采集环境复杂,很多时候的光照条件过强或过暗,造成了人脸图像模糊、图像细节不够清晰,导致了图像的质量差,给人脸的识别带来了很大的阻碍,因此,需要对此类图像进行增强处理。通过对人脸图像进行灰度线性处理可以增强图像的对比度,图像质量可以得到很好地改善。图像灰度的分段线性变换。当人脸图像中有价值的信息灰度区间变化太小,而不感兴趣的灰度区间太大,比如人脸图像上出现划痕、污迹情况的时候,我们可以采用分段线性变换的方法来对图像进行增强处理。这样做的目的一是只扩展感兴趣部分的,牺牲掉其他部分,二是不仅扩展感兴趣的,而且压缩其他部分。下图3-1为灰度图像变换的例子:图3-1图像灰度变换后的图像和直方图3.2图像的直方图均衡化获取的人脸图像时受光照影响较大,不同光照条件下摄取的图像灰度差别很大,我们可以利用对图像进行的灰度归一化处理来降低光照对采集图像的影响。比较常用的灰度归一化算法是直方图均衡化,经过直方图的均衡化,可以使原图像灰度级分布更加均匀,进一步拓展了图像有用部分的灰度范围,因此,这样一来就很好的排除了人脸图像外界采集环境对人脸图像的影响。图像的直方图表示数字图像每一灰度级在图像上出现的频率,一般图像的直方图灰度的分布都有较为集中的地方,这样使得一些细节无法显示出来。直方图均衡化是重新分配和设置灰度图像的像素值,利用一些变换函数将原图像的密集区间的直方图均匀化分布,增强了图像整体对比效果。直方图均衡处理图像具有两个明显的特征:一是均衡处理后的图像的灰度级与原始图像一致;二是均衡处理前后图像的灰度值范围将是一致的。直方图均衡化的主要思路是将图像的灰度值等概率的扩展到更宽的灰度范围上。以下是直方图均衡化的具体操作。假设一幅图像总的像素数为N,灰度级数为L,公式表示第k个灰度级出现的概率如式3-2所示:0≤rk≤1,k=0,1,<−1对其进行直方图均匀化处理的函数如式3-3,3-4所示:αij=γμijHk=i=0kp由上式可知在[0,1]区间内H(k)单调递增,经过直方图变换原灰度级为k的像素后变换后灰度级如式3-5所示:K=L×Kh(3下图3-2为直方图均衡化的照片和直方图:图3-2直方图均衡化的照片和直方图3.3图像的平滑图像平滑主要解决来自于系统内部如电机机械运动的抖动噪声,摄像机的热噪声等内部噪声,也有来自于系统外部的如经电源窜进系统内部或电磁波的外部噪声。噪声可以在频率域中运用低通滤波技术或在空间域中求像素的平均值来消除。3.3.1低通滤波图像在经过傅里叶变换之后,噪声一般出现在空间频率较高的区域,因此使用低通滤波器来实现图像的平滑。在空域中的低通滤波一般采用离散卷积的办法,如式3-6所示:Lm1式3-6中L(m1,m2)是一个为M×M方阵的输出图像,输入图像g(n1,H1=1911这些方阵都已经归一化到单位加权,以避免出现两度偏置的现象。3.3.2中值滤波中值滤波主要解决使用线性滤波器如均值滤波以及最小均方滤波等所出现的细节模糊问题。中值滤波就是像一个滑动窗口,窗口内中心点的数值由窗口中各点的均值代替。例如一维向量l1,l2,…,ls,对向量进行中值滤波,就取长度为n的窗口,就是从向量中抽出n个数yi=Medli−s下图3-3为对图像的中值滤波:图3-3对图像的中值滤波3.4几何校正在图像处理的过程中,我们需要对图像进行旋转和缩放的处理,处理后的图像每个像素的值都会发生变化。一般变换之前的图像坐标是整数,但是变换之后坐标一般就不是整数了,因此我们需要重新计算变换后的像素值。本节介绍一些MATLAB常用的一些图像几何变换调整。可以实现图像的放大与缩小、图像的旋转以及图像的剪切等。3.4.1图像的插值插值是一种数学运算,一般是通过用采样点建立的连续函数来逼进实际的曲线,通过重建的函数求得任意函数值。设已知函数值为a1,afu=1.最近邻插值法最近邻插值法是MATLAB默认的插值方法也是最基本的插值方法,它的输出像素的值就是输入像素最临近的像素值,它的数学表达式如式3-10所示:fx=fxk对于索引图像来说,因为最近邻插值运算量非常小,所以是唯一可行的插值方法。但是最近邻差值的缺点是有不太理想的频域特性,图像的高频分量即图像较精细的地方,如果进行放大处理,图像容易出现模糊的块状。2.双线性差值法此方法输出像素的值为输入像素点的周围2x2区域采样点的平均值。设m<i<m+1,n<j<n+1,a=i−m,b=j−n,igi'3、双立方插值法双立方插值法的差值函数是三次函数,插值区域是原像素点的4x4区域,它有非常好的差值效果,但是相对应的它的计算量也是这三种算法中最大的。3.4.2图像旋转需要进行函数插值运算的常用几何变换是图像的旋转。图像进行旋转以后像素的值也发生变化,所以需要进行图像的差值运算。3.4.3图像裁剪在图像处理的过程中,有时我们需要图像中的某一部分,这时我们就需要对图像进行裁剪。在MATLAB图像处理工具箱中可以实现交互式的对真彩图像、索引图像和灰度图像进行图像的裁剪和显示,并且可以用鼠标指定裁剪的范围。3.5本章小结本章介绍了人脸图像预处理的四种办法。
第四章基于PCA的人脸识别算法4.1人脸识别人脸识别的有效性和精确性的关键就在于能否可以提取出有效的人脸特征,人脸构成非常的复杂,而且还在不断的变化,这是一个高维度下的模式识别问题。人脸图像进行特征提取的主要方法有两种,人脸几何特征和人脸代数特征提取法。结构特征主要是人脸五官之间的几何关系,包括角度,欧氏距离和区域的特征,代数特征提取法其实就是把人脸构建成一个数据矩阵,通过提取矩阵的特征进行人脸的识别。一般来说,人脸图像的维度是非常高的,这样处理起来,计算量会很大,不利于图像处理。而且在高维空间浏览的图像分布集中,非常不利于区分。为了区分出人脸图像,引入了主成分分析法,为了将高维空间中的主要提取出来,以次解决维数过高的计算量和数据过多问题。对人脸图像的特征提取一般指的是将待识别人脸图像投影到特征脸空间,投影满足两个条件,第一,人脸的主要信息保留在特征脸空间中,第二,投影后的图像维数要远远小于投影前的维数。4.2基于PCA的人脸识别我们将预处理后的人脸图像在高维空间进行投影,这些图像在高维空间中的分布存在一定的规律,同一个人的不同人脸图像在高维空间中相离会比较近,不同人脸的图像在此高维空间中相隔就比较远。我们可以通过比较图像在高维空间投影的距离对人脸进行识别。我们可以通过K-L变换解决运算量巨大的问题,可以用一个低维子空间来对高维空间的人脸图像进行描述,这样既可以减少运算量又可以保留我们所需要的识别信息。基于PCA算法的人脸识别算法步骤如下:读入人脸数据库;计算K-L变换的生成矩阵,得到图像的特征值和特征向量;利用SVD定理计算图像的特征值和特征向量;分别把训练图像和测试图像投影到特征脸空间;比较测试图像和训练图像在特征脸空间的距离,对测试图像进行分类识别。4.2.1读入人脸数据库首先要对人脸数据库的人脸进行预处理,对人脸图像进行归一化,然后将数据库中的每人选择一定数量的图像构成训练数据库集,其余构成测试数据库读入人脸识别系统。设归一化后的图像是100×100,则该图像就构成了10000×10000维矢量,我们可以通过K-L变换,用一个低维子空间来描述这个10000×10000维的图像。4.2.2K-L变换人脸图像属于高维数模型,要处理这种模型需要的计算量非常大,对识别速度影响非常大,同时,图像在高维空间中也非常不便于区分。因此,我们引入了K-L变换来解决计算高维空间计算量过大的问题。该方法为人脸识别研究开辟了一个主流的方向被称为中子空间分析法。此外,许多改进后新的识别方法在基于特征脸法的基础上层出不穷。人脸属于高维数模型,要处理这种模型计算量非常的大,对图像的处理十分不利。此外在高维空间中图像非常不便于区分。因此,人们就引入了主成份分析来区分人脸图像,这样就可以解决数据多余和计算量大等问题。提取人脸特征就是在特征脸空间投影需要识别的图像。投影一般需要具有:第一,投影之前的维数必须远大于投影之后的维数。第二,特征脸空间要保留人脸的主要信息和数据。应用基于PCA方法进行人脸识别时,首先要经过K-L变换,求出特征值,再对训练人脸空间的特征值进行取舍,然后就能构成一个新的低维正交基空间,将所有的人脸投影到这个低维空间,可计算出待测图像中最相似的值,最后把人脸识别出来。具体步骤有:第一步:对人脸图像做预处理。第二步:先训练人脸库,然后建立特征脸空间。第三步:在特征脸空间投影预存人脸图像和待识别图像。第四步:将人脸图像最近距离的待识别图像输出。K-L变换原理及性质K-L变换是指主成份变换或者霍特林变换。它指只有对角线上的元素不为零时,协方差矩阵可以保证数据间没有关联。这对数据压缩起到很大作用。1、定义协方差矩阵。设定f属于N×I的向量集合f={f1,f2,f3,...,fn},fi是变量f的均值,它可对N个样本向量进行估计如式f的协方差定义为μ=E(f)≈1NCF=E计算出f的协方差矩阵的特征值λi和特征向量Φi。Cf其中λi为特征值,Φi为特征向量。变换矩阵Φ是由特征向量构成Φ=[Φ1,Φ2,…Φn],发生正交化后为Φ*(正交矩阵),将Φ*T记为A。因此定义一维K-L变换为F=ϕT反变换定义为如f−μ=ϕ∗F=K-L变换的基本思路:当F的均值为零μF=EFF的协方差μF=EF进行K-L变换前后向量信号相同,但各个分量的值却不同,在变换后将会出现很多非常小的值。这就能在保留主要信息基础上又能降低维数。利用这种性质就可以用作数据压缩。主特征分量有以下性质:当矩阵已经正交归一化并且具有映射的线性关系时,在训练空间的每一个对应的特征向量都有唯一的模式,这就说明主要信息的存在不会因为模式的转变而改变。稳定性。输入信息发生微小变化时,它所对应的主要特征受到的影响几乎不存在。这表明图像噪声等因素对图像灰度并不敏感,这样输入图像就会有更广泛的范围。当分量映射后,相应的模式间的距离就会变小,多维空间就可进行分类。一般主特征分量都具有图像重建的能力。因为主特征在重建发生在误差最小的情况下,这就表明了它具有重建的性能。所以重建后图像质量由主特征量的多少决定。3.2.3SVD定理SVD定理就是奇异值分解定理,人脸复杂度很高,维度也很高,普通矩阵的特征值和特征向量通常可以通过K-L变换来得到,但是人脸图像这种高维度举证求解特征向量很困难,所以需要通过SVD定理来解决该问题。根据SVD定理uii=KKT的特征向量和特征值可以通过K在计算人脸识别时,一般人脸图像的维数很大。本文采用的人脸库中,一共十个人,一个人两张,共有二十张图像。都是分辨率为112×92的人脸图像。训练集中每人选取一张图像,在训练集人脸样本矩阵的维数为36000×200,协方差矩阵的维数为36000×36000,根据SVD定理可知,可通过矩阵获得协方差矩阵的特征向量与特征值,它只有200×200的维度,这样运算速度就有了较大的提高,这样就得到了特征脸空间。图4-1EigenfacesSpaces函数流程图基于特征脸的方法具有简洁、高效等特点,在该领域非常热门。由本节分析中可以得到特征脸方法存在很多优点。采用K-L变换原图像,可以去掉图像相关性。它不仅使变换后人脸在低维空间具有更好的表征能力,而且能使待测人脸图像由高维向低维空间转变时均方误差达到最小。但是,这种方法在使用中有许多缺点:尽管近似看作它组成的子空间最佳,但不能说明人脸识别达到了最佳效果;它求得的特征是最好的表征特征,但分类特征不一定最好。统计法的特征脸法是把所有图像做相同处理,这样识别率受到的影响就会下降,鲁棒性较差。由于特征脸的变化会根据人脸图像库的变化而变化,因此,当人脸库中人脸数目变化较大时该方法并不适于此种情况。人脸是一个特别的物体,它会随着时间而变化发生很大的改变,这些不确定的因素都会影响人脸识别的效果。这就要求不断地改进人脸识别技术的算法,构建更加完善的人脸识别系统。今后需要研究的方向有:(1)人脸识别系统随着图像库的增大,对算法的要求就会提高。现实生活中,人脸图像库中的图像有上千万甚至更大。所以,如何在如此庞大的人脸库中高速率的进行人脸识别,并得到准确、稳定的图像识别将成为今后研究的一个方向。(2)目前为止,人脸识别技术许多重大的成果都是在二维人脸图像的基础上取得。由于人脸是三维模型,获取全面且又真实的信息很重要。而二维人脸图像受人脸情绪、姿态、年龄、环境等因素的影响比较大,获取的图像就会受到干扰,识别结果不精准。相比较而言,三维图像比二维图像更能很好的完成图像信息的获取,识别效果更佳。所以如何实现三维人脸参数的建模,如何采用三维信息对人脸图像进行识别,这些都将成为未来最有意义和最有难度的研究难题。(3)人脸识别系统在大多数场合都需具备非静态识别能力,例如车站、学校、办案等必须识别动态的人脸图像。在很多方面,动态识别系统都比静态人脸识别系统有明显的优势,因此发展动态人脸图像的识别技术将具有十分广阔的使用价值。4.3MATLAB仿真本文所设计的人脸识别系统在MATLABR2016b上运行,系统的主流程图如图4-1所示。主要实现的功能是当输入一张人脸图像时,系统能够从预存人脸数据库中找出一张与待识别人脸图像中的人脸一致的图像。先创建一个预存人脸数据库,数据库中存放着尺寸大小相同的二十张人脸图像,其中共有十位测试者、每位有两张人脸图像。每张测试者的表情都有一定变化。在创建一个待识别人脸数据库,库中有这十位测试者的另外一张人脸表情图像。运行程序,分别选择预存人脸数据库和待识别人脸数据库的路径。输入待识别人脸数据库中图像的名称,最后显示识别人脸图像。图4-2主流程图系统进行人脸识别仿真是的详细运行步骤如下:1、选择预存人脸数据库系统首先提示选择预存人脸图像库。预存人脸数据库中包含有十个测试者,其中有九位测试者的人脸照片来自Essex人脸库。一位来自建的人脸库。每人共有俩张人脸图像,共有二十张人脸图像。每张图像的人脸拍摄角度都是正面,人脸也没有遮挡物。人脸照片都是在测试者说话的时候拍的,所以人脸表情都有一定幅度的变化。每张图像的大小都是180x200。每张图片按顺序命名。如下图4-3所示。图4-3选择预存人脸数据库预存人脸数据库中存储的人脸照片如下图所示:图4-4预存人脸数据库2、选择待识别人脸数据库图4-5选择待识别人脸数据库待识别人脸数据库中的测试者与预存人脸数据库中的测试者相同,这里采用与预存人脸数据库中不同的照片。每位测试者一张照片,共十张照片。待识别人脸数据库中图片的采集环境以及图像的尺寸和格式以及拍摄角度都相同。即预存人脸图像数据库中的测试者照片与待识别人脸数据库中的照片在同一环境下采集的。待识别人脸数据库中的人脸图像如图4-6所示。图4-6待识别人脸数据库3.输入待识别人脸图像图4-7输入待识别图像选择完预存人脸数据库以及待识别人脸数据库后就可以选择需要识别的人脸图像,因为本系统的人脸图像数据的提取方式是按照图片的名称提取的,所以所有图片的命名采用罗马数字并且必须是相连的,命名的数字不可以有间断否则系统会进行报错。所以输入的待识别人脸图像的名称必须是罗马数字而且输入的数字不可以超过待识别人脸图像的总数。实现的代码如下所示:%Asamplescript,whichshowstheusageoffunctions,includedin%PCA-basedfacerecognitionsystem(Eigenfacemethod)%%Seealso:CREATEDATABASE,EIGENFACECORE,RECOGNITION%OriginalversionbyAmirHosseinOmidvarnia,October2007clearallclccloseall%YoucancustomizeandfixinitialdirectorypathsTrainDatabasePath=uigetdir(strcat(matlabroot,'\work'),'Selecttrainingdatabasepath');TestDatabasePath=uigetdir(strcat(matlabroot,'\work'),'Selecttestdatabasepath');prompt={'Entertestimagename(anumberbetween1to10):'};dlg_title='InputofPCA-BasedFaceRecognitionSystem';num_lines=1;def={'1'};TestImage=inputdlg(prompt,dlg_title,num_lines,def);TestImage=strcat(TestDatabasePath,'\',char(TestImage),'.jpg');im=imread(TestImage);T=CreateDatabase(TrainDatabasePath);[m,A,Eigenfaces]=EigenfaceCore(T);OutputName=Recognition(TestImage,m,A,Eigenfaces);SelectedImage=strcat(TrainDatabasePath,'\',OutputName);SelectedImage=imread(SelectedImage);figure;subplot(1,2,1);imshow(im);title('TestImage');subplot(1,2,2);imshow(SelectedImage);title('EquivalentImage');str=strcat('Matchedimageis:',OutputName);disp(str)以上程序会先创建选择预存入脸数据库的窗口,我们在提示的窗口中选择预存人脸数据库的文件夹,然后在创建选择待测人脸数据库的窗口,我们选择待测人脸数据库的文件夹,最后创建输入待识别人脸图像的窗口,这是我们要输入对应的待识别人脸图像的名称。一定要注意输入的是罗马数字且大小不可以超过图片数。图4-8识别结果4.4本章小结本章论述了特征提取与识别的研究,详细介绍了多种经典的人脸识别。并对所有的方法所具有的缺点做了分析和总结。此外,本文主要论述人脸特征在提取时采用PCA方法。通过分析它的原理和算法思路,在结合K-L的变换实现了本文的任务。并叙述了该变换在图像压缩方面应用的性能以及具体的实现步骤。此外,论述了通过使用特征脸方法进行特征提取与识别的推导和完成步骤,还就这种方法目前存在的优缺点做了具体的分析和总结。
第五章总结与展望随着科技高速的发展,人们对生活品质的需求逐渐提高,传统的身份认证方式已经无法满足人们的要求,人们急需一种快速、安全、不宜丢失的识别方式。在这样的背景下,人脸识别因为其高效、非接触性、易接受性等特点成为人们关注的对象。随着人们对人脸识别技术的深入研究,人脸识别已经取得了非常可观的研究成果,并且已经应用在了相关领域,以后的人脸识别一定会得到更广泛的应用。本文所研究的是基于PCA的人脸识别算法,在介绍了的相关技术的基础之上对人脸图像预处理,以及人脸特征提取以及人脸识别做了详细的研究。并且在MATLAB上进行了系统的实现。首先,本文对人脸图像的预处理方法做了介绍。本文所采用的人脸图像预处理方法主要有直方图均衡化,灰度变化。其次,本文对PCA算法进行了详细的介绍,首先介绍了整个算法的识别步骤,其次介绍了算法运用的特有数学原理如K-L变换以及SVD定理,并且对K-L变换和SVD定理的数学原理进行了详细地公式推导。最后,本文对基于PCA的人脸识别算法在MATLAB上进行了系统仿真,给出了系统运行的界面,介绍了系统的主要函数,在人脸识别所用的人脸图像库中加入了新的人脸图像,事先对新加入的人脸图像进行了图像预处理。由系统仿真可知,本算法对自建人脸库的识别率为100%,对新加入的人脸图像也能进行非常好的识别。因为整个人脸识别系统是非常复杂的,本系统只是在理想状态下的原理功能实现,还无法满足复杂条件下的人脸识别,对人脸识别的实际应用还需要诸多改进。但是基于本系统还可以在下几个方面做进一步的开发:1、添加人脸检测功能,对于一张图片上的多张人脸都可以同时检测,并且可以从复杂背景中提取出人脸,增加系统的实用性。2、扩展系统支持的图像格式以及获取图像的方式。3、对PCA算法进行优化,提高主要特征值和特征向量在人脸识别中所占的比例,降低一些次要特征值和特征向量对算法的影响。4、面对复杂的人脸识别环境单个的人脸识别算法是无法满足的,以后的人脸识别系统一定是多种算法结合在一起的。这也是以后人脸识别发展的方向。参考文献刘超.基于改进PCA的人脸识别混合算法研究[D].太原理工大学,2011.刘丽华.自动人脸识别方法研究与展望[J].内江科技.2005:05.孙羽,董洪斌,张宇华,王齐.人脸图象的模糊识别方法[J].哈尔滨师范大学自然科学学报:1997:01.齐兴敏.基于PCA的人脸识别技术的研究[D].武汉理工大学,2007.张春晓.基于粗集和小波变换的人脸识别研究[D].山东大学,2010.贾莹.基于PCA的人脸识别[D].东北石油大学,2010.赵冬娟.人脸识别过程中特征提取方法的研究[D].江南大学,2011.李姗姗.基于PCA的实时人脸识别系统的设计与实现.北京邮电大学,2012:12-28.李正淳,应自炉.一种经过Hopfield网调整后的非特定人表情识别[J].计算机工程与应用,2008(4).黄明威.基于主元分析法与支持向量机的人脸表情识别算法[J].电脑知识与技术,2013(19).HeiseleB,Ho.PoggioT.Facerecognitionwithsupportvectormachines:globalversuscomponentbasedapproach.ProceedingsofEighthIEEEInternationalConferenceonComputerVision.2001.SamariaF.YoungS.HMM-basedarchitectureforfaceidentification[J].ImageandvisionComputing,1994:12(8).李建华.基于增强2DPCA+PCA的人脸识别系统[D].太原科技大学,2010.[28]刘奇.线性判别分析人脸识别系统的研究与实现[D].广东工业大学,2011.章悦.基于四元数的彩色人脸识别[D].西安电子科技大学,2010.赵宏伟.基于PCA针对表情变化的人脸识别技术研究[D].西安电子科技大学,2009.万方数据中北大学学位论文OmachiM,OmachiS.FastTemplateMatchingWithPolynomials.ImageProcessingEurope.2007.付晓峰,韦巍.基于高级局部二元模式直方图映射的表情识别[J].模式识别与人工智能,2009(1).胡继胜,赵力.基于BP神经网络的人脸表情识别[J].微型机与应用,2010(11).A.K.Jain,L.Hong.On-linefingerprintverification[J].IEEETrans.onPAMI,1997:19(4):302-314.孙涛.特征提取技术研究及其在人脸识别中的应用[D].中南大学,2007.刘艳丽,赵跃龙.人脸识别技术研究进展[J].计算机工程,2005(03).ElliottSJ,MassieSA,SuttonMJ.ThePerceptionofBiometricTechnology:ASurveyProceedingsofIEEEWorkshoponAutomaticIdentificationAdvancedTechnologies.2007.张科.基于PCA和人工神经网络的人脸识别研究[D].武汉纺织大学,2010.何国辉,甘俊英.PCA-LDA算法在性别鉴别中的应用[J].计算机工程,2006(19).胡月.基于主成
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年初级会计职称考试《经济法基础》专项练习题及答案(社会保险法律制度)
- 2026年高考甲卷理综生物真题试卷(含答案)
- 2026年保密知识答题活动试卷附答案
- 2026年高考地理北京卷真题试卷(新课标卷)(+答案)
- 2026年湖南省邵阳市中小学教师招聘考试试卷带答案
- 2026年安徽省六安中小学教师招聘考试卷附答案
- 键连接教学设计中职专业课-机械基础-机械制造技术-装备制造大类
- 美术二年级下册9. 我们的影子教案
- 初中音乐人音版七年级下册穿越竹林教案
- 中医辅助体重管理指南
- 2026贵州省红枫湖畜禽水产有限公司招聘13人笔试参考题库及答案解析
- 2026广西来宾市从“五方面人员”中选拔乡镇领导班子成员69人笔试备考试题及答案解析
- 第6课 爱护动植物 第二课时 课件(内置视频)-2025-2026学年道德与法治二年级下册统编版
- 小学劳动技术课程标准
- 江苏省泰州市2025年中考化学试题(附答案)
- GB/T 46855-2025植物油脂叶绿素a和叶绿素a′降解产物的测定(脱镁叶绿素aa′和焦脱镁叶绿素)
- 污水处理工程沟通协调方案
- 2026年交管12123驾照学法减分题库100道含答案(夺分金卷)
- 井下电气作业安全课件
- 冲压件质量检验标准操作规程
- 类器官技术用于药物剂量优化策略
评论
0/150
提交评论