版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 参赛队号 # 2573第十届“认证杯”数学中国数学建模网络挑战赛承诺书我们仔细阅读了第十届“认证杯”数学中国数学建模网络挑战赛的竞赛规则。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们接受相应处理结果。我们允许数学中国网站()公
2、布论文,以供网友之间学习交流,数学中国网站以非商业目的的论文交流不需要提前取得我们的同意。 我们的参赛队号为:2573参赛队员(签名) :丁力、刘静、张峰 队员 1:丁力 队员 2:刘静队员 3:张峰参赛队教练员 (签名): 姚莉参赛队伍组别:本科组 参赛队号 # 2573第十届“认证杯”数学中国数学建模网络挑战赛编 号 专 用 页参赛队伍的参赛队号:(请各个参赛队提前填写好):2573竞赛统一编号(由竞赛组委会送至评委团前编号):竞赛评阅编号(由竞赛评委团评阅前进行编号): 参赛队号 # 25732017 年第十届“认证杯”数学中国数学建模网络挑战赛第一阶段论文基于 Daubechies 小
3、波变换和 BP 神经网络的人脸识别题目关 键 词 图像预处理; Daubechies 小波变换; K-L 变换; BP 神经网络 摘要:本文针对同一人在不同年龄段的人脸识别问题设计了行之有效的综合创新算法模型。它改进了传统的基于几何特征的人脸识别方法,结合人脸的轮廓模型使得人脸检测的算法得以简化,并使用 K-L 变换法,在更低的维度提取了人脸图像的主要特征信息。此算法融合了基于 K-L 变换模型和基于 BP 神经网络人脸识别模型,集成了二者的优点, 提高了人脸识别算法的准确率。 针对问题一,对于每个人在不同年龄段的人脸图像,由于图像的背景和人脸的形状大小等特征差异很大,所以需要先对图片进行预处
4、理,从而准确获得完整清晰的人脸图像。其中图像预处理包含二值化,人脸边缘检测,图像规范化和滤波去噪过程。经过实验发现,中值滤波在去除椒盐噪声方面更加有效,而且能比较好地保留图像边缘的锐度和图像细节特征。 针对问题二,由于因年龄变化带来的变化,特别是人的脸部皱纹将增多,骨骼的尺寸、肌肉的大小等,我们必须要提取在年龄的变化中相对变化较小的特征值,如人的耳朵、嘴巴、鼻子和眼睛间距离比例等不变因素。所以在进行识别前,我们使用 Daubechies 小波变换舍去因年龄变化带来的噪声,提取有效的特征值。 针对问题三,对于问题二获得的图像,我们采用特征向量变换(K-L 变换),进行降维处理,舍去不必要的噪声,
5、减少数据量。对基于 FG-NET 人脸数据库中不同年龄段的人脸图像进行训练获取平均脸。 针对问题四,通过 BP 神经网络算法的学习训练可智能地调整算法的全局参数从而提高人脸识别的准确率。另外,BP 神经网络算法还具有结构简单、可操作性强、鲁棒性和能模拟任意非线性输入输出的优点。 综上所述,本文主要采用 Daubechies 小波变换和 BP 神经网络模型,能够有效地对不同年龄段的人脸进行识别,算法具有一定的参考价值,并在其他的图像识别上有推广价值。 参赛队号:2573参赛(由组委会填写)所选题目:B题 参赛队号 # 2573英要so that the algorithm of the faci
6、al detection is simplified. We use the Karhunen-LoveWe combine the model which is based on Karhunen-Love Transform and Back Propagationthe algorithm.of facial recognition.For the first question, as for the face image of each person in different ages,because ofsize and so on.We need to pre-process th
7、e picture, then we can obtain a complete and clearfacial edge, image normalization and filtering denoising. Experiments show that the medianthe images sharpness and images detail features.For the second question, because the changes caused by the change of age, especially inextract the eigenvalues w
8、hich are relatively small in age changes such as ears,mouth,nosedetermine the eigenvalues before we perform the recognition.For the third question, For the image which is obtained by question 2, we use eigenvectorand reduce the amount of data. The facial images of different age groups in the FG-NET
9、face database are trained to obtain the average face.For the forth question, through the Back Propagation Neural Network algorithm learningaccuracy of face recognition. In addition, Back Propagation Neural Network algorithm alsoany nonlinear input and output。 To sum up, by using Daubechies Wavelet T
10、ransform and Back Propagation Neuralalgorithm has the reference value, and it is worthy to spread on other image recognition.Key words:Image Preprocessing,Daubechies Wavelet Transform,K-L transform,Back-Propagation Artificial Neural NetworkNetwork model, we can effectively operate face recognition o
11、f different ages. And the classichas the advantages of simple structure, strong operability, strong robustness and can simulateand training,we can intelligently adjust the global parameters of the algorithm to improve thetransform (Karhunen-Love Transform) to reduce dimension,discard unimportant com
12、ponentseyes and other invariant factors. So we should use the Daubechies Wavelet Transform tohuman facial wrinkles, the size of bones,the size of the muscles and so on.Then we mustfilter is more effective in removing salt and pepper noise. And it can better retain the edge offacial image. The image
13、preprocessing includes the value of the two images, the detection ofthe great differences between the image background and facial features such as the shape,theNeural Network. This model integrates the advantages of both, and improves the accuracy ofTransform to extract the main feature information
14、of the facial image in the lower dimension.Abstract :This article designs an effective,comprehensive and innovative algorithm forthe recognition of the same persons face in different ages. It improves the traditional methodof facial recognition based on geometric features. It combines the contour mo
15、del of the face 参赛队号 # 25731 问题的提出1.1 背景知识 人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术,通常也叫做人像识别、面部识别。 人脸识别系统的研究始于 20 世纪 60 年代,80 年代后随着计算机技术和光学成像技术的发展得到提高,而真正进入初级的应用阶段则在 90 年后期,并且以美国、德国和日本的技术实现为主;人脸识别系统成功的关键在于是否拥有尖端的核心算法,并使识别结果具有实用化的识别率和识别速度;“人脸识别系统”集成了
16、人工智能、机器识别、机器学习、模型理论、专家系统、视频图像处理等多种专业技术,同时需结合中间值处理的理论与实现,是生物特征识别的最新应用,其核心技术的实现,展现了弱人工智能向强人工智能的转化。1 1.2 问题重述 人的总会伴随人的一生,但是对于不同年龄段的同一个人来说,人脸并不是一成不变的。虽然年轻和年老的面容总有很大的相似性,但年龄跨度对人脸识别的确有较大的影响。在人工智能时代我们希望电脑能完成这项判别、分类工作,所以接下来我们需要建立合适的模型来自动识别两张不同年龄段的照片是不是同一个人。 如今人脸识别技术已经发展了很多优化方法,人脸识别的结果也令人满意。然而, 对与不同年龄的人来说,特别
17、是幼儿时期与成年时期,对人脸识别的结果影响相对较大。我们现在需要设计一个基于识别不同年龄的人脸识别模型。 1.3 具体问题 问题 1:设计算法对图片中的人脸进行预处理问题 2:确定并提取人脸的特征值 问题 3:降维并处理数据问题 4:确定识别模型 2 问题分析2.1 对问题的总体分析 针对不同年龄段同一个人的人脸识别不能单纯的只进行空间匹配,这样得到的效果一定是不准确的。我们首先对问题进行梳理,该问题应该划分为两大部分:提取人不同年龄面部的共同特征和最佳人脸识别算法的实现。而人脸识别算法的实现已经有很多科学家进行研究了很多年,技术相对成熟。但是对于不同年龄的人脸识别研究成果较少, 所以应着重思
18、考如何提取人不同年龄面部的共同特征。 2.2 具体问题的分析 2.2.1 对问题 1 的分析 问题 1 的解决需要对给定的照片进行预处理。我们在对问题分析的时候还需要考虑到背景的变化,其背景的颜色变换对后续问题中的处理都有很大的影响。所以人脸识别的第一步就是人脸的检测及预处理,其目的就是在输入图像中锁定人脸,并对图像进行有效去噪。 参赛队号 # 25732.2.2 对问题 2 的分析 问题 2 是本模型需要重点解决的地方。随着人年龄的变化,人的脸部皱纹将增多, 骨骼的尺寸、肌肉的大小、人脸的结构将会发生显著改变。所以,我们不能仅仅是采用简单的两张人脸进行对比。我们必须要提取在年龄的变化中相对变
19、化较小的特征值,如人的耳朵、嘴巴、鼻子和眼睛等不变因素。因此我们需要建立一个合适的模型,提取出承载衰老皮肤纹理特征的高频子图与低通滤波后的低频子图,有效的去除了图像因年龄变化而带来的噪声。 2.2.3 对问题 3 的分析 问题 3 主要是针对于问题 2 获得的图像,我们需要选择一种算法对处理后的图片进行降维处理,舍去不必要的噪声,减少数据量。同时,需要得出用于问题 4 中分析处理的输入值,是对整个模型两大部分承上启下的步骤。 2.2.4 对问题 4 的分析 问题 4 主要是在经过以上 3 个问题的处理后,我们应该得到了用于人脸识别的特征值集合。需要选择分类器对特征向量进行处理得出结果,因为面对
20、的特殊问题,所以选择的算法必须要具有很好的自适应学习能力、良好的鲁棒性和容错性。 3 模型基本假设1. 对同一个人不同年龄照片进行比较时,没有过改变面容的疾病、面部外伤或外科手术等经历。 2. 用于识别的两张照片都是标准位置和标准光线下拍摄的。 3. 用于识别的图片中只包含一张人脸。 4. 用于识别的图片中露出的人脸占人脸的全面积 70%以上,并且五官没有不透明的实体物体遮挡。 4符号说明符号 说明 符号 说明 (Wf)(j,k) 离散小波变换 H 神经网络中间层向量 X 神经网络输入向量 y 神经3 网络实际输出向量Y 神经网络输出量 L 神经网络中间层单元数 u 正交变换矩阵 e 神经网络
21、给定精度 S 散布矩阵 E 神经网络误差 u i散布矩阵的特征向量 r 图像的相似系数 参赛队号 # 25735 模型的建立与求解5.1 对问题 1 的分析与求解 5.1.1 对问题 1 的分析 问题 1 要求我们对所给图像进行初步的处理,设计算法对图片中的人脸进行识别。虽然题目中为我们假设了用于识别的两张照片都是标准位置和标准光线下拍摄的条件, 但是我们在对问题分析的时候还需要考虑到背景的变化,无论是题目中举例的证件照还是普通的标准照片,其背景的颜色变换对后续问题中的处理都有很大的影响。所以人脸识别的第一步就是人脸的检测及预处理,其目的就是在输入图像中锁定人脸,并进行有效去噪。 5.1.2
22、对问题 1 的求解 首先对图片进行预处理,本文图片预处理主要是基于人脸检测与人脸特征相结合的方法,其主要步骤如下: Step1:二值化。由于每个人的脸部肤色基本一致,且与背景色相差很大。为了将人脸区域与背景区域分别开来,便于识别人脸区域,要将这些多值图像转换成只具有黑白两个灰度级的二值图像。 Step2:人脸边缘检测。经二值化后的人脸图像中,数值为 0 的部分表示背景,数值为 1 的部分表示人脸。运用 Matlab 中的 regionprops 函数求像素数值 1 的 8 连通区域, 构建包含像素数值 0 的最小矩阵,得到人脸的边缘区域。 Step3:图像规范化。在 Step2 中已求得人脸边
23、缘矩阵,运用 Matlab 函数求得其中心坐标,查阅资料得到人脸宽度比例即矩阵大小,将人脸图像规范化,如图 1 所示。相 应的MATLAB 程序编写见附程序 1。(0_1)(0_2)原始图像 参赛队号 # 2573(1_1)(1_2)图像规范(2_1)(2_2)规范结果 图 1 图像规范化示意图Step4:中值滤波。中值滤波算法不仅能有效去除图像噪声,尤其是对去除椒盐噪声更加有效,而且能比较好地保留图像边缘的锐度和图像细节特征。中值滤波和其他滤波的对比效果图如下。相应的 MATLAB 程序编写见附程序 2。 参赛队号#2573图 2 滤波效果对比图5.2 对问题 2 的分析与求解 5.2.1
24、对问题 2 的分析 问题 2 中,我们需要利用问题 1 对图像的处理结果来提取并确定特征值。众所周知, 随着人年龄的变化,人的脸部皱纹将增多,骨骼的尺寸、肌肉的大小、人脸的结构将会发生显著改变。所以,我们不能仅仅是采用简单的两张人脸进行对比。我们必须要提取在年龄的变化中相对变化较小的特征值,如人的耳朵、嘴巴、鼻子和眼睛等不变因素。因此我们需要建立一个合适的模型,提取出承载衰老皮肤纹理特征的高频子图与低通滤波后的低频子图,有效的去除了图像因年龄变化而带来的噪声。 我们针对的是基于不同年龄段的人脸识别,同一个人在不同的年龄段中都有很大的变化,比如人的皮肤、发型和脸的大小等。在对现有的图像处理方法进
25、行综合比较之后, 我们认为 Daubechies 小波变换能很好地符合我们的要求。Daubechies 小波变换可以很好地保持图像细节以及各频带的边缘信息,具有多分辨率的特性,变换后的图像对提高人脸识别正确率有很好的贡献。 5.2.2 对问题 2 的求解 小波变换的基本思想2是用一组小波函数或者基函数表示一个函数或者信号。信号分析一般是为了获得时间域和频率域之间的相互关系,傅里叶变换提供了有关频率域的信息,但时间方面的局部化信息却基本丢失。离散小波变换(DWT)的本质是信号的时间尺度分析方法,相比于其他积分变换如快速傅里叶变换(FFT)等,具有多分辨率分析的特点,而且在时、频域都具有表征信号局
26、部特征的能力。图像经过小波变换,其低频部分保留了绝大部分信息和能量。同时,在图像的敏感位置(如人脸轮廓线、眼睛 参赛队号 # 2573等),经小波换变换后生成的特征矢量的模会相对较大,将这些优点应用于人脸图像, 有利于人脸的识别。 Daubechies 小波是由世界著名的小波分析学者Inrid Daubechies 构造的小波函数。一般写成 dbN,N 是小波的阶数。小波(t)和尺度函数(t)中的支撑区为 2N-1,(t) 的消失矩为 N。除 N=1 外,dbN 不具有对称性(即非线性位移)。dbN 没有明确的表达式 (除了 N=1 外),但转换函数 h 的平方模是很明确的。3 ,(1)令 P
27、(y)=其 中 ,为 二 项 式 系 数 , 则 有 : 2=(cos2()N)P(sin2() 式 中 ,。(w)=Step1:Daubechies 小波变换阶数对比。每进行一次离散小波变换,图像便被压缩至原来的四分之一,相比原图丢失的信息也越多。而进行人脸识别的过程中,必须要一定数量以上的图像信息,才能保证对比结果的正确率。也就是说,离散小波变换的阶数过高,反而会导致人脸识别的正确率降低,因为大量的信息模糊或是缺失使得人脸失去其可以用来和其他人脸进行区分的特征信息。为此,我们要找到一个合适的离散小波变换的阶数,使变换得到的低频分量图既去除了会对比对结果产生不利影响的图像细节, 又不至于剔除
28、的细节过多使剩余的图像信息不足以支撑脸部识别。 图 3 各阶小波变换低频分量图通过对图像各阶低频分量图(图 3)的比较,我们发现在进行二阶离散小波变换后, 图像在保留原图人物基本轮廓的同时,能够通过低通滤波滤掉一些不必要的细节,用来做人脸识别效果最好。 参赛队号 # 2573Step2:Daubechies 小波变换。我们选择一张图像,利用 matlab 软件对其进行 Daubechies 小波变换。对图像进行一阶离散 Daubechies小波变换的结果如图 4 所示。相应的MATLAB 程序编写见附程序 3。图 4 对小女孩的图像进行二阶 Daubechies小波变换图 4 中左上角为从原图
29、中分离出的低频分量,极大程度地保留了原图中的基本信息 (低频轮廓信息),及重要的细节信息。右上、右下、左下三幅图则是从原图中分离出的高频分量,分别来自原图在水平方向、对角线方向、竖直方向上的高频分量。利用灰度分布图(图 5、图 6)可以更直观地看出,二阶 Daubechies 小波变换后,原图里频率相接近的像素点被保留到了同一张分量图内。 参赛队号#2573图5一阶小波变换后低频分量灰度分布图 参赛队号 # 2573图 6 二阶小波变换后高频分量灰度分布图通过对比二阶小波变换后高频分量灰度分布图可知,高频水平分量灰度三维分布图所包含的有效信息最全面,而高频垂直分量灰度三维分布图所包含的细节量最
30、丰富。我们可以通过高频水平分量灰度三维分布图明显发现人的眼睛、耳朵、鼻子和嘴所在的位置。我们将这些受年龄影响小的特征值提取出来用于对不同年龄段同一个人的图像匹配比较。 Step3:验证效果。为了检验离散小波变换对原图所包含有效信息的提取效果,我们对离散小波变换之后的图像进行了反变换(IDWT),得到的复原图如图 7 所示。 图 6 小女孩人物图像原图图 7 小波反变换复原图人工将复原图(图 7)与原图(图 6)进行比较,我们认为进行离散小波变换后的图像很好地提取保留了原图的信息。通过这一系列的变换与复原图像反向比较,我们从 参赛队号 # 2573实证的角度证实了离散小波变换在图片处理方面有很好
31、的表现。缩小了图片的大小,但是又很大程度上保留了原图像的有效信息(体现在终可以对图像进行反变换得到极其近似原图的复原图)。剔除高频分量后的图像保留了原图的特征,且其轮廓清晰程度令人满意。 Step4:确定特征值关系。我们在 Step2 中有效的去除了图像因年龄变化而带来的噪声,并得到连一系列的特征值。我们现在确定特征值间的关系,对于耳朵到眼睛的距离占双耳间的距离的比值与双眼之间的距离占双耳间的距离的比值,随着年龄的增长其变化较小,可以用做图像匹配的比较依据。 经过二阶小波变换后,人眼部基本成灰黑色,相对面部其他轮廓灰度明显较小,因此我们可以通过对人脸图像进行逐行扫描,检测出来两个靠的非常近的负
32、脉冲信号即为人眼所在处。首先要检测轮廓边界,我们发现阈值 L p 超过 400 即可当做人脸,而在这中间小于 400 就可以当做眼睛。为此我们设计了针对眼睛定位的滤波器,这个滤波器可以检测出在一个超过 L p 的信号中间,突然出现两个靠近的小于 L p 的负脉冲的波形。检测眼睛的时候,我们发现眼部灰度突变较大,因此也采用了对于高频分量的检 p 小于 25时便可看成眼部的突变,它的检测方法。使用高频分量时,我们确定阈值 H 测原理和基于低频分量原理基本一样。 图 8 人眼所在行信号波形图5.3 对问题 3 的分析与求解 5.3.1 对问题 3 的分析 问题 3 是在问题 2 的基础上,为了解决问
33、题 2 所得结果图片仍然太大,不便于计算处理,因此我们先对图像进行降维的处理。问题 3 也是承上启下的重要一环,承接处理 对图片的特征值的处理,开启神经网络的输入。为此我们采用特征向量变换(K-L 变换),进行降维处理,舍去不重要的分量。 参赛队号 # 25735.3.2 对问题 3 的求解 K-L 变换理论知识45。K-L 变换能够考虑到不同的分类信息,实现有监督的特征提取。 根据随机过程中的 KL 展开理论,将随机过程描述为无数个正交函数的线性组合,而在模式识别问题中,通常可以将一个样本看成是随机向量的某一次实现结果,所以假设有一 d 维随机向量 x,可以写成一组正交基 的线性组合,且它们
34、的模为 1:(2)对上式变形得到:(3)而现在,假设有用信息就集中在其中的 q 维上,那么现在我们来尝试用着 q 维去近似 x (经过问题 3 的讨论可以得出有用信息的维度): 近似前后样本向量的差向量为:考查上述差向量的均方误差(MSE)为:(4)经过求导最小化可得结果 参赛队号 # 2573(5)是原样本向量 x 的二阶矩阵(注意,这里还可以是其他矩阵,其中,变换矩阵如协方差矩阵)。 Step1:选定基于年龄的人脸数据库。由于我们需要识别的是不同年龄人脸识别,所以我们选取基于年龄段的 FG-NET 数据库, Step2:整合数据。根据基于年龄段的 FG-NET 数据库,输入用于训练集合人脸
35、照片,如图 9 所示。 图 9 部分训练集合人脸照片Step3:设计模型算法。根据 KL 变换的相关理论 ,我们设计的相关的降维算法。首先我们根据数据库中所有的人脸图像向量,建立了平均脸向量。 (6)我们将平均脸向量还原成图像进行观察,发现它具有人脸的一般性基本特征(如图10 所示),例如脸的轮廓、嘴巴、鼻子和眼睛,这也充分符合了我们在问题 2 中对图像的处理结果,既去除了随着人年龄的变化,人的脸部皱纹将增多,骨骼的尺寸、肌肉的大小等带来的噪声,为接下来计算协方差的总体散布矩阵奠定了基础。 参赛队号 # 2573图 10 平均脸向量还原图像使用 matlab 中 eig 函数计算出每一个特征值
36、和特征向量。将其中最大的四十个特征值对应的特征向量取出来作为主要的比较指标,把这四十个特征向量构成的矩阵 u , 作为正交变换矩阵,即 BP 神经网络的输入。5.4 对问题 4 的分析与求解 5.4.1 对问题 4 的分析 在经过以上 3 个问题的处理后,我们得到了四十个特征向量构成的矩阵。现在需要选择分类器对特征向量进行处理得出结果,我们选择 BP 神经网络作为分类器,BP 神经网络具有很好的自适应学习能力,优越的分类特性,以及良好的鲁棒性和容错性。 将小波变换系数作为特征向量输入 BP 神经网络进行分类识别。 5.4.2 对问题 4 的求解 BP 神经网络理论知识67。BP 神经网络算法的
37、基本思想是,学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时,输入样本从输入层传入,经各隐含层逐层处理后,传向输出层。若输出层的实际输出与期望的输出不符,则传入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层逐层反传、并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差反向传播的各层权值调整过程,是周而复始地进行的。 权值不断调整的过程,也就是网络的学习训练过程。此过程一直进行到网络输出的误差减少到可接受的程度,或进行到预先设定的学习次数为止。结构如图 11 所示。 参赛队号 # 2573图 1
38、1 三层 BP 神经网络结构标准 BP 神经网络分 3 层,即输入层 ,隐含层和输出层。本算法采用的 BP 网络输出层节点数为 40。网络的输入层节点数和隐含层节点数将由离散小波变换和具体分析决定。实验中隐含层与输出层的激励函数分别选择为 Sigmoid 对数函数: (7)和线性函数:(8)在结合本实验中前三个问题处理得到的数据后,我们采用的 BP 神经网络训练算法来训练,程序主要的流程图如下图 12 所示。 参赛队号#2573图 12 BP 神经网络训练算法流程图在每次实验中,基于 FG-NE 人脸库中的图片处理结果得到数据集,训练时的输入为样本 / 目标输出组合 X i ,Y i ,i=1
39、,N, N 为训练样本数。对于每个训练样本, 目标输出对应为 1 ,其余为 0。识别时,输出的最大值对应目标被认为是网络识别出的目标。相应的 MATLAB 程序编写见附程序 5。 在算法模型建立后,经过 FG-NE 人脸库中的图片简单训练后的 BP 神经网络已经具备来初步的基于跨年龄段的人脸识别,我们在最后采用了输入一张随机的 FG-NE 人脸库中的图片,经过前三步的处理来进行人脸匹配识别。运行过程如下图 13 所示。 参赛队号#2573图 13 输入待检测图像首先采用此种自动匹配识别,用于检验整体模型的完备性。通过输入一张随机的FG-NE 人脸库中的图片经过完整的模型处理,在 FG-NE 人
40、脸库中匹配三张相似率最高的图片并输出。输出结果如下图 14 所示。 图 14 匹配结果 参赛队号#2573图 15 匹配结果识别率通过观察结果发现,该算法不仅成功匹配到该男子成年的图片,同时还匹配到了年幼时期的图片。该实验结果说明了本模型整体具备完备性,初步完成了不同年龄段的人脸识别。 6 模型的分析与改进6.1 模型分析 通过反复实验,模型搜索的正确率大概在 70%左右,而出现误差时,也可以把相似的一类人脸识别出来,但在这些相似的人脸中,基本都有要检索的人。这是由于网络的训练度不够和某些人只有一张图的结果。例如识别伊丽莎白的图像时,由于她长期戴着黑色帽子,便把她识别为了一个黑人。进行检验的时
41、候,我们发现亚洲人和欧美人有着显著的差异,因此我们的模型不仅可以用于人物的检索,还可以用于人种的鉴定。 通过对 FG-NE 人脸库的实验证明,该算法具有计算量小、运算速度快、较好的识别性能和较高的识别率的优点。 6.2 模型改进 由于 BP 神经网络存在收敛速度慢,局部极小和平台问题,泛化能力差,初值选取缺乏指导等缺点,因此模型改进的方向是训练出能够实现自适应特征值阈值调整的数学模型和设计年龄容错率更高的 BP 神经网络分类模型。 我们可以通过对其修正学习率、添加动量项、改进激励函数、修正权值、改进误差函数等方法,对学习算法进行改进。也可以通过改变其神经元节点互联方式、隐含层层数选择、改变各层
42、节点数、设置初始参数等方法,对网络结构进行优化。为克服遗忘现 参赛队号 # 2573象,运用成批法、跳跃学习法和再学习策略来调整其连接权值、避免重复学习和解决局部最小问题。最终达到对 BP 神经网络的训练方式进行优化。 7 模型的评价7.1 模型评价 7.1.1 模型的优点 (1) 利用二阶离散小波变换,将图像缩小、去除干扰细节、保留有效信息。 (2) 使用 BP 神经网络,对人脸图像样本进行机器学习。BP 神经网络对误差的处理有很好的效果,在利用神经网络进行学习领域当中已经是目前最优。 (3) 采用 KL 变换对图像进行降维,使之更适应后续学习时要求,不至于因数据量太大而让程序运行的时间变得
43、难以忍耐。 (4) 建立人脸数据库,对图像进行有结构的安放,缩短了图像处理、样本学习需要的时间。 7.1.2 模型的缺点 (1) 本模型的人脸识别正确率依赖于人脸图像的样本量,当样本量过小时学习模型的效果会非常差,甚至使人脸识别正确率低于未进行学习直接对变换后的图像进行对比的识别正确率。 (2) 对特征值阈值的选取没有提出有效的判据准则。对于不同的训练集样本的数目使用该阈值最终进行人脸图像识别效果不总是很理想,说明阈值需要根据不同的情况来进行调整使得人脸图像识别总是能达到尽可能好的效果。 (3) 本模型在 matlab 软件上进行编译,由于 matlab 的性能限制及模型自身的复杂度,每一次进
44、行人脸识别时的耗时都较长。 参考文献1 StanZ.LiHandbook of face recognition: LibraryofCongressCataloging-in-PublicationData,2004052453 2 COHEN Leon .Time-frequency analysis: theory and application M. S .l.:Prentice Hall , 1995. 3 HUANG.N.E , SHEN.Z, LONG.S.R. The empirical mode decomposition and Hilbert spectrum for n
45、on-linear and non-stationary time series analysis J .Proc .Roy .Soc ., 1998,454(17):903-905 4 徐奔,基于 DWT 和 BP 神经网络的人脸识别方法,电脑知识与技术,2009, 23:6520-6522,2009. 5 Abhijit S Pandya, Robert B Macy 著,徐勇,荆涛等译. 神经网络模式识别及其实现. 北京:电子工业. 1999. 6 Taigman Y, Yang M, Ranzato M A, et al. Deepface: Closing the gap to hu
46、man-levelperformance in face verificationC/Proceedings of the IEEE Conference on Computer Visionand Pattern Recognition. 2013: 1701-1708. 7 Fan H, Cao Z, Jiang Y, et al. Learning deep face representationJ. arXiv preprintarXiv:1403.2802, 2014. 参赛队号 # 2573附程序附程序 1 clc;close all;clear all; %B=imread(D:
47、003.jpg); B=imread(D:004.jpg); if ndims(B)= 2 %如果不是二值图像IM=rgb2gray(B); else IM = B; end bw = im2bw(IM, graythresh(IM); % 二值化m, rown = size(bw); = floor(m/10); % 分成 10 大块,行wide = floor(n/10); % 分成 10 大块,列a1 = 1; a2 = row; % 对应行初始化 row*wide; % 块面积s = forfor j = 1:10 if (b2=9*wide) | (a1=1 | a2=row*10)
48、 loc = find(bw(a1:a2, b1:b2)=0); p, q = size(loc); pr = p/s*100; % pr fa & 1.5(Ar(z, 3)/Ar(z, 4)1.9 参赛队号 # 2573fa = area;h = z;end end h2=axes(Position,0.7 0.50 0.19 0.45); %subplot(2,3,3); imshow(B); rectangle(Position, Ar(h,1),Ar(h,2),Ar(h,3),Ar(h,4), EdgeColor, y, LineWidth, 1); 附程序 2 clc; clear
49、all; img=rgb2gray(imread(D:004.jpg); figure; imshow(img);title( 原 图 ); img_noise=double(imnoise(img,salt & pepper,0.06); %figure,imshow(img_noise,);title(加椒盐噪声图); img_mean=imfilter(img_noise,fspecial(average,5); %figure;imshow(img_mean,);title(算数均值滤波结果); %img_mean1=exp(imfilter(log(img_noise),fspeci
50、al(average,5); %figure;imshow(img_mean1,);title(几何均值滤波结果); %Q=-1.5; %img_mean2=imfilter(img_noise.(Q+1),fspecial(average,5)./imfilter(im g_noise.Q,fspecial(average,5); %figure;imshow(img_mean2,);title(逆谐波滤波结果); img_median=medfilt2(img_noise); %figure;imshow(img_median,);title(中值滤波结果); img_mean3=wien
51、er2(img_noise,5,5); %figure;imshow(img_mean3,);title(维纳滤波结果); figure; subplot(2,2,1),imshow(img_noise,),title(含椒盐噪声图); subplot(2,2,2),imshow(img_mean,),title(均值滤波结果); subplot(2,2,3),imshow(img_median,),title(中值滤波结果); subplot(2,2,4),imshow(img_mean3,),title(维纳滤波结果); 附程序 3 %load woman; X=imread(D:003.
52、jpg); X=rgb2gray(X); figure(1); imshow(X);title(原图); nbcol = size(map,1);%返回矩阵的行数和列数cA1,cH1,cV1,cD1 = dwt2(X,db1); 参赛队号 # 2573cod_x=wcodemat(X,nbcol);%返回矩阵 X 的编码矩阵,nbcol 为编码的最大值cod_cA1=wcodemat(cA1,nbcol); cod_cH1=wcodemat(cH1,nbcol); cod_cV1=wcodemat(cV1,nbcol); cod_cD1=wcodemat(cD1,nbcol); dec2d=c
53、od_cA1,cod_cH1;cod_cV1,cod_cD1; X0=idwt2(cA1,cH1,cV1,cD1,db1,size(X); figure(2); subplot(1,2,1),imshow(cod_x,); title(量化后的图像); subplot(1,2,2), imshow(dec2d,); title(二维离散小波分解后的图像); figure(3); imshow(X0,);title(二维离散小波分解重构的图像); 附程序 4 function meigenface() clear all; clc; close all; imset=; M=200;%训练集合中
54、人脸照片的数目figure(1); for i=1:M %filename=D:rawdatayale新建文件夹s num2str(i)%im=imread(filename,BMP); filename=D:rawdatayalefgs num2str(i) .JPG; im=imread(filename,jpg); .bmp;%im=im(:,:,2); % im=im(:,:,3); imheight imwidth=size(im); %将图像矩阵按列拉伸为列向量 imv=reshape(im,imheight*imwidth,1); %将 im 中数据转化为 imheight*imwidth高的列向量 imset=imset imv; % 将每个图像的像素占据一列位置,共 20 列向量if i=4 title(训练集合人脸照片,fontsize,18) end subplot(5,4,i);
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年四川希望汽车职业学院单招职业适应性考试题库含答案详解(考试直接用)
- 2026年吉林省白城市单招职业适应性考试题库含答案详解(研优卷)
- 人机协作机器人应用技巧
- 儿童疼痛管理康复护理
- 如何应对客户稽核技巧
- 10.3任务三 应付款项业务核算与应用
- 培训资料-多发伤护理查房
- 连续梁底板混凝土缺陷检测及维修加固整治技术交流材料 课件
- 开启地理之门:探索我们生活的世界
- 2026福建福州高新区实验中学春季教师招聘2人考试参考试题及答案解析
- 2025年湖南长沙天心城市发展集团有限公司招聘笔试参考题库附带答案详解
- 盘发培训课件
- 新22J01 工程做法图集
- 高中生干部培训
- 2025固体矿产地质调查规范1:25000
- (一模)2024~2025 学年度苏锡常镇四市高三教学情况调研(一)英语试卷
- 《运营管理 第7版》课件 马风才 第01-6章 运营管理概论- 工作系统研究
- 设计符号学现代设计语言中的符号学在建筑设计中的运用
- 《功能材料学概论》课件
- 隧道照明工程施工方案
- 苏教版五年级数学下册全册教案与反思
评论
0/150
提交评论