【《人脸识别基础知识概述》1900字】_第1页
【《人脸识别基础知识概述》1900字】_第2页
【《人脸识别基础知识概述》1900字】_第3页
【《人脸识别基础知识概述》1900字】_第4页
【《人脸识别基础知识概述》1900字】_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人脸识别基础知识概述目录TOC\o"1-3"\h\u3061人脸识别基础知识概述 1253221.1人脸识别流程概述 1104341.2人脸检测 115401.3人脸图像预处理 4299641.4人脸特征提取 466481.5人脸匹配与识别 41.1人脸识别流程概述人脸识别技术是以人的面部特征来进行身份验证与识别。完整的人脸识别系统可以分为五个部分。首先需要获得一个含有人脸的图像,通过摄像头采集到需要进行人脸识别的图像。获得人脸图像后对图像进行人脸检测,获得图像中面部的精确位置以及图像中人脸关键点的坐标。第三个部分是人脸图像预处理,根据人脸检测返回的人脸关键点坐标,通过相似变换,最终得到一个人脸位置标准化的人脸区域。第四个部分是特征提取,将人脸图像输入到网络模型中,转换计算机能识别的特征向量表示。最后是人脸的匹配和识别,通过计算两个特征向量间的欧式距离或者余弦距离来判断其是否是同一个主体。在1:1的人脸识别问题中,当两个特征向量间的距离小于所设定的阈值时,就可以认为两个特征向量是属于同一个主体的。在1:N的人脸识别问题中,计算出输入图像的特征向量与人脸数据库中所有特征向量之间的距离,找到所有距离中最近的一个,即为所识别到的主体,并返回其相对应的身份信息。1.2人脸检测在获取到人脸图像后,需要对该图像进行人脸检测,来得到图像中人脸的精确位置,检测后人的面部在图像中占了比较大的比例,在一定程度上减轻了图像中其他干扰信息对识别结果的影响,也减少了数据量的计算。随着深度学习的快速发展,使用卷积神经网络来进行目标检测的准确度相比传统方法大大提高。本小节主要介绍一个常用的人脸检测算法,多任务卷积神经网络(Multi-taskconvolutionalneuralnetwork,MTCNN)[18]。MTCNN是一个多任务级联卷积神经网络人脸识别模型,如图2-1所示,由三个较小的卷积神经网络级联构成。图2-1MTCNN人脸识别模型P-Net(ProposalNetwork)通过一个全卷积神经网络对输入的图像进行处理,来得到图像中的人脸面部窗口和相应的回归向量,并对得到的面部窗口进行合并,以减少重复的面部区域,这里采用了非极大值抑制(Non-MaximumSuppression,NMS)方法进行处理[19]。P-Net的网络结构如图2-2。图2-2MTCNN中P-Net的网络结构R-Net(RefineNetwork)相对于第一层的P-Net增加了一个全连接层,在最后一个卷积层之后使用了一个128维度的全连接层,保留了图像更多的特征。R-Net层将对P-Net中得到的面部候选框进行细化选择,通过网络训练来进一步矫正面部候选框的回归向量,从而舍去一部分的错误输入,输出较为可信的人脸区域。R-Net的网络结构如图2-3所示。图2-3MTCNN中R-Net的网络结构O-Net(OutputNetwork)层相对于R-Net增加了一个卷积层。这一层主要是对提取出来的面部候选框进行回归学习,以生成最终的人脸关键点位置和人脸回归框。网络结构的最后是一个256维度的全连接层,这一层的输出也就是是整个网络模型的最终输出。O-Net的网络结构如图2-4所示。图2-4MTCNN中O-Net的网络结构1.3人脸图像预处理作为被识别的图像,由于在采集时所处的环境不同,其光照,姿态等都有一定的差异。为了保证图像中人脸大小,位置的一致性,需要对人脸图像进行预处理操作,来得到一个标准的面部图像。通过上一步的人脸检测,我们得到了各个关键点在人脸图像中的位置,常用的人脸特征点是5个关键点,即两个眼睛、鼻尖和两个嘴角[20]。在得到人脸关键点后,需要对人脸位置进行矫正,通过对人脸图像进行一系列预处理,最终得到一个标准的人脸。常用的图像预处理的方法有直方图均衡化,中值滤波,人脸图像归一化等1.4人脸特征提取特征提取是将机器学习算法不能识别出来的原始数据转变为可以识别的数据特征,即用一个特征向量来表示整幅人脸图像。特征提取算法的一个重点难点就是如何从人脸图像中提取到更多更有效的信息。从图像中提取到的有效信息越多,人脸的识别准确率越高,因此对人脸特征进行提取时,需要选择一个合适的算法来提取到更多有效信息。为了能够提取到具有高区分度的人脸特征,人脸识别算法在不断进行改进。DeepID[14]、FaceNet[1]、CentreFace[21]、SphereFace[22]以及ArcFace[23]是近年来提出的人脸识别方法,在人脸识别问题中都达到了一个较好的识别性能。例如FaceNet[1]提出了通过神经网络直接学习人脸特征,其基于DeepID2做了部分改动,抛弃了DeepID2中的分类层,再将ContrastiveLoss改进为三元组损失函数,以使得类内特征较为紧凑而类间特征更具差异性。2016年提出的中心损失函数CentreFace[21],通过所有的训练样本,为每一个类别都学习了一个中心,并在训练过程中不断减小样本特征向量与其类别中心之间的欧氏距离,从而使得该类别中的特征向量向类别中心靠拢,获得了较为紧凑的类内特征,类间的差异性则由Softmax损失函数的联合训练来保证。1.5人脸匹配与识别人脸匹配与识别问题分为1:1和1:N两类场景。1:1的人脸校验问题是根据两个图像的特征向量间的距离,来判断这两张人脸图像

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论