




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
面部识别的算法分析与设计案例目录TOC\o"1-3"\h\u26758面部识别的算法分析与设计案例 1213711.1基于MTCNN的检测算法 1108811.1.1卷积神经网络 1214241.1.2多种任务的学习 3111491.2算法的选取 5202631.3人脸识别的算法 51.1基于MTCNN的检测算法近年来,在计算机视觉领域卷积的神经网络取得了划时代的进步,基于卷积神经网络的脸部计算算法不断登场。最有名的是KaippengZhang团队提出的基于卷积神经网络结构的多任务学习水平的面部检测算法。该算法主要设计了一种轻量卷积的神经网络结构,能够充分保证实时性能,并提出了一种解决困难在线样本的方法。该算法目前基于与算法相同的算法,具有最高的识别精度。1.1.1卷积神经网络CNN是一种将二维的数据作为输入处理的不完整连接的N层神经网络的算法。网络各层有N个二维的平台面,各平台面有N个独立的神经元。神经元之间的连接只存在于相邻之间。CNN的底层主要用于提取图像的纹理和边框。然后将最下层得到的信息通过神经元连接传递到下一层,图像最重要的结构信息被分阶段提取出来。简单来说,层越多,性能越好。CNN使用的算法和普通的神经网络算法的区别在于CNN是由本地连接和共享。这样一来,需要训练的重量就会减少,网络模型的学习复杂性也会减轻。卷积神经网络的基本结构。图3-1主要包括卷积层、环层和完全连接的层。图1.-1卷积神经网络的基本架构图卷积层上图所示的C1和C2是卷积层。卷积层通过如上图的conv1和conv2所示的可学习卷积内核。首先,从上一层矩阵中提取大小相同的卷积内核区域,然后按顺序将卷积内核的相应位置值与该区域值相乘,最后添加偏移量。最后,其他区域的结果按照卷积内核的移动步长顺序计算。所有折叠完成后,这些结果是为了生成新的矩阵而结合的。L-1第一个单层卷积神经网络的第无数个特征图为的意思是从L的第一层的第M层到第L层的第n层的图表的卷积内核。所以第n个特征图的公式为1.1.1:(3-1)*对于符号,这是离散卷积算法的运算符号。f(*)是算法的激活函数,通常是信令函数,表示为图1.1.2(3-2)这里面的X是输入,f(x)是输出池化层上图的S1和S2是池化层。池化层对主要的视觉特征进行过滤,通过采样将其整合抽象和视觉功能。环层采用最大值的采样方法,采样大小为4X4。首先,由上一层提取的特征矩阵被分割成4X4矩阵,然后获得各矩阵的最大值,进行最终输出。尺寸是原来的1/2。减少采样后的计算量,可以避免图像转换的影响。仪式如下公式1.1.3:(3-3)其中L-1层网络表示输出的无数个特征的图表,这是L层网络优化后的无数个图表,down表示最大函数。全部连接层图3-1的F1由于连接层和完全连接层主要可以提高网络映射,所以网络上的上一层的所有神经元都会连接到当前网络的所有神经元,而同一层的神经元不会连接。其公式为1.1.4(3-4)这里面的L所表示的当前的网络的层数,N表示的是第L-1层网络的神经元的个数,这个表示是第L-1层的网络的第i个神经元输入的值。表示的是第L层网络神经元J和第L-1层网络神经元i之间的连接的权值,表示的是第L层网络神经元J的偏置。表示的是激活函数。1.1.2多种任务的学习所提出的MTCNN算法记述了多任务学习面部检测框架【13】【8】。所以可以同时执行下面的三个功能:(1)人脸检测:面部检测可以被视为二进制分类问题,使用交叉熵的损失函数用公式1.1.5来描述:(3-5)里面的用来表示第i个训练样本的真实,这个表示的是人脸,如果没有等于1就说明不是人脸。用来表示第i个的训练样本为人脸的改了吧。(2)检测框的回归:通过用欧式距离公式1.1.6用来表示候选窗口的损失【13】:(3-6)这个表示的是第无数个的样本的真实向量。矢量由决定了边界线的四个元素(水平坐标、垂直坐标、h和宽度)此表示第i个训练样本的预绘制包围盒矢量。人脸的特征点的检测:面部特征点的构成基本上与检测帧回归相同,由二维排列构成。用欧几里德距离表示的特征点损失的说明如公式1.1.7:(3-7)这表示为第i个训练样本的实际面部坐标。共有5个点,各点有4个坐标。由此就知道为20元组。如图3-2这主要表示第N个样本的坐标【13】。图3-2MTCNN的主要架构解析MTCNN的算法讲述:操作1:首先,初始化训练样本和网络权重。样品集主要由部分脸部和部分非面部样品构成。假设样本总数为N,则训练样本集可以输入金字塔。在网络中装入各种大小的图像。操作2:把目标全部综合在一起,然后再使用广撒网法来调整网络。操作3:将一样的图像放置在不同大小的结构中,并且一起传送到训练的网络里面。操作4:使用P-Net生成候选窗口和边界。再用Bounding盒子进行校正,最后使用NMS的算法进行叠加重组。操作5:把P-Net输出和改善后的候选窗口及Bounding盒得到矢量传输到N-Net。用这种方法的优点就是淘汰了消极样本。操作6:将N-Net得到改善后的结果输入O-Net,再重复操作4,最后的得到脸部的具体位置。1.2算法的选取根据本论文算法和结果的要求,需要选择合适的算法。需要结果的精度,实现高速化。翻阅很多优秀的论文以及期刊,最后决定MTCNN算法。它主要是利用卷积神经网络的构造,并且它在最近几年的呼声是相对很多其他算法中最好的。检测率是指实际检测出的面部数量与正确检测出的面部数量的比率,错误检测率是指实际检测出的面部错误的比率。MTCNN这个算法的成功率是最高的,并且很少存在失误的,至于检测的速度这个由于人脸太多以及人脸也不一样,所以对于速度我们可以进行忽略不计。所以综上所述我们选择的是MTCNN这个人脸识别算法作为本文的算法。1.3人脸识别的算法面部识别主要是将收集的图像输入保存在面部数据库中,然后在数据库中找到一致的面部的过程,进而达到最初的目的——身份的认证。直接对照脸部图像时,因为计算量变多,所以为了用低次元的特征向量来表达脸部,需要使用特征提取方法。这个阶段有两个主要问题需要解决。一个是确认输入是谁,另一个是确认输入是否在数据库中有保存。随着时代的进步,科技的飞速发展,技术的不断成熟,近几年提出的面部识别算法的识别率非常优秀,主要分为:第一类这是一种传统的机器学习方法,主要使用比较流畅的表现论,将脸部图像映射到部分空间以进行识别。第二类就是我们现在说的使用深度卷积神经网络理论应用到网络让网络学习到人脸最本质的特征然后再进行识别。1.1.1FACENET的识别算法深层学习主要是基于深层神经网络的包括多电平非线性转换的机器学习方法。实际上,深层学习的概念是在2006年之前提出的,但是受到当时条件的影响,受到了限制。只能识别早期深层学习手写数字等小样本。这个适用于面部样品的话是非常没有效果的。随着技术的进步,计算机的硬件已经不再是限制条件,深度学习再次受到关注。FACENET是谷歌提出的基于卷积神经网络的最新算法。FACENET直接学习从图像到空间的映射。以下3-3是FACENET的图像:图3-3FACENET的主要图像1)FACENET的基本构架提高深层神经网性能的最直接的方法是增加大小。当然尺寸包括深度和宽度。深度主要是网络的层数,宽度是网络各层的神经元。但是这个制度也有很多缺点。因为毕竟能得到数据是有限的,网络的大小越大就会发生钓鱼的现象。这主要是因为深层神经网由串联的多种神经网络层组成,大小越大,参数越大,训练参数随x的增大而增大,导致计算越发的复杂。在有限的计算资源设备中,如果大小的增加导致性能的提高没有太大变化,则会浪费很多资源。但是为了解决上面的这些问题,FACENET的深层神经网使用了Inception的网络结构,Inception对完全连接层应用完全连接层,通过应用卷积层来对网络进行深度的优化进而提高性能。Inception这个是使用了解析网络结构。核心想法是在网络上寻找最佳Locapos结构,取代原来的非稀缺结构。Arra的团队提出了一种具有相互连接层的网络结构。在这个结构中,每个层的输入必须计算网络最后一层的结构特性和最后一层的输出集中在该层的输入上。因此,网络最底层的每个节点都对应于输入特征图的特定区域,这个节点也被用来输入网络的下一层。在最下级网络中,相关关系强的节点集中在相对空间。根据各层连接,Inception具有更多的系数,减少了必要的训练参数。使用1*1、3*3、5*5的维护并列构建Inception。使用3*3带环层进行带环,在基础网络输入通过各种卷积过滤器分支后,输出向量将堆叠在网络的下一层输入中。考虑到成本问题,输出后添加3*3带环层1*1卷积滤波器。图3-4是Inception的结构展示:图3-4Inception架构图2)三元损失函数对于深神经网络提取的180个微特征向量,FACENET将使用损失函数作为解决函数,减少距离来减少错误。图3-5是三元损失函数的过程:图3-5损失函数三元函数的约束公式为1.1.1:(3-8)α表示间隔的差τ表示样品的全部集合,变换以后得到下面的1.1.2公式:(3-9)丢失的L函数,优化不满足条件的元组,忽略已经满足条件的。步骤详解步骤1:用标签训练脸部样本后,重置FACENET网络的加权值,将面部样品批输入网络。步骤2:通过卷积和采样的操作得到一个网络输出为128的向量。步骤3:结合上面的公式,计算输出和预测之间的误差。步骤4:采用降维法反向更新FACENET的值,直到误差收敛完成。步骤5:将测试图像输入到步骤4的网络中,输出表示当前矢
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 土木工程中BIM技术的现状与未来展望
- 陈述句与反问句的转换
- 2024-2025学年度安徽省阜阳市太和县中鑫嘉和实验高级中学高一下学期期中质量检测历史试题(含答案)
- 幼儿故事欢庆元旦
- 如何增强房地产项目的投资吸引力
- 海绵城市建设中的BIM技术应用实例
- BIM技术在市政工程中的应用探讨
- 喷涂作业人员防护口罩专题培训
- 保险公司旅行活动方案
- 保险公司营销活动方案
- 立式圆筒形储罐罐底真空试验记录
- 小学生劳动教育评价细则
- 篮球比赛计分表word版
- 民法典案例解读PPT
- 手卫生依从性差鱼骨分析
- 质 量 管 理 体 系 认 证审核报告(模板)
- 肿瘤科新护士入科培训和护理常规
- 第4章 颌位(双语)
- 课程综述(数电)
- 塔吊负荷试验方案
- 伤口和伤口敷料基础知识.ppt
评论
0/150
提交评论