已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
使用adaboost级联分类方法检测人脸的原理陈悦 1摘 要:本文详细的介绍了adaboost算法应用在学习人脸检测分类器的过程以及人脸识别的主要应用,第1节讲述使用adaboost算法检测人脸的一些准备知识,包括haar特征、积分图像等;第2节讲述adaboost算法训练人脸检测分类器的流程;第3节讲述如何通过级联的分类器加快分类检测速度;第4节讲述人脸检测的过程;第5节介绍人脸检测的应用.关键词:adaboost算法;人脸检测;haar特征;1 Adaboost算法和人脸haar特征1.1 Adaboost算法Adaboost算法是Freund和Schapire在1995年提出的,2001年Paul Viola和Michael J. Jones使用基于人脸haar特征的Adaboost算法加上积分图像和级联技术创造了一种快速人脸检测方法1,其速度之快准确率之高是之前的人脸检测方法所不能比拟的。Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。使用adaboost分类器可以排除一些不必要的训练数据特征,并将关键放在关键的训练数据上面。该算法其实是一个简单的弱分类算法提升过程,这个过程通过不断的训练,可以提高对数据的分类能力。1.2 人脸haar特征Haar特征就是图像的一些矩形模板内像素和的差,简单可以说成是矩形特征,如图1,把图中的模板可以以任何的尺寸套在图像的任何位置,然后此模板的haar特征值就定义为灰色区域内的像素总和减去白色区域的像素总和,为什么要这样定义呢,难道人脸图像就由这么简单的特征构成? 图1 haar特征模板的确,其实不仅是人脸,其他许多物体图像也可以同样使用这些特征,或者我们再增加一些模板特征,这些特征和物体的关系正如砖瓦和楼房,回想一下微积分中求定积分的过程不也是把复杂的曲线用一个个简单的矩形去填充的吗?图2展示了人脸的haar特征,图2 人脸haar特征可以看到人脸的灰度图像确实具有这样的结构特征,眼睛区域比上下区域要深色,然后左眼鼻梁右眼也构成一组矩形特征,那么自然会有这样的疑问,对于不同的人脸图像,同一位置的矩形模板内的像素灰度和的差值即haar特征几乎都是不同的,这样的特征有什么意义?确实不可能完全相同,但只要是人脸中特定位置的haar特征值就基本上会维持在某个范围内,后面我们会看到,正是利用这样的特性通过adaboost算法训练出一个合适的阈值来保证几乎所有人脸的这个区域的haar特征都会落在阈值内,反过来说一幅图像某个区域内的haar特征落在一个阈值内,就是这副图像中可能存在人脸,当然不会是必然存在,还要通过更多不同位置的haar特征去印证是否真的存在人脸。一幅图像中的haar特征究竟有多少,就拿2424大小的图像来说,对于每一种模板的haar特征用组合公式可以推导出平均大概有3万多个,5种模板就有16万个,当然这些只是穷举得到的结果,我们并不关心所有位置的haar特征,后面会看到使用adaboost算法去自动筛选出合适的人脸特征。1.3 积分图像坐标A( x, y) 的积分图定义为其左上角矩形所有像素之和,用公式表示为:图3 点A(x,y)处的积分图像当我们把一幅图像的所有坐标点的积分图像都求出并保存起来,通过它来求haar特征的速度非常快,因为其复杂度与尺寸大小无关,可以看到图4,如果要求第1种模板类型的haar特征,见图1,即C+D-(A+B),C+D用点4减去点2的积分图像得到,A+B就是点2的积分图像,于是C+D-(A+B)就是点4减去两倍的点2的积分图像,由于各点处的积分图像事先已经求出,所以只需要执行简单的加减操作,同时也看到计算复杂度确实与区域的大小无关。图4 2 Adaboost算法训练人脸检测分类器2.1 算法描述下提到的人脸训练图像都是指经过裁切的仅保留人脸的图像。首先给出一堆训练用的图像,分别有m张人脸图像和l张非人脸图像,一开始分别赋予它们1/2m和1/2l的权重,接下来要从所有的矩形特征中选出最符合条件的T个特征,算法描述如下图7: 图7 adaboost算法训练人脸分类器步骤2.2 算法分析整个算法的思想是,首选假定图像中某个一位置的haar特征是一个突出的人脸特征,然后分别在所有人脸和非人脸训练图像的这个位置看看是否真的存在,方法是求出haar特征值看其是否在一个设定的阈值以内,一般来说一个突出的人脸特征应该在所有人脸图像中都存在,而所有非人脸图像都不会存在,当然这个应该是统计意义上的结论,也可能会有即少量的人脸图像因为噪声等因素不具备这个特征,而少量的非人脸图像恰好出现了这个特征,正因为如此我们不能通过一个特征值去判断是否人脸。如果假定成立,那么图7中的找T个特征的第2步估算误差,如果人脸图像确实存在该haar特征,即同时也为1,那么相应的第i个分量值就为零了,同理非人脸图像不存在该haar特征,即同时也为0,那么相应的第i个分量值也为零,因此如果某个haar特征是人脸突出的特征,那么误差值将会是非常小的,因此对全部haar特征的误差排序取误差最小的那个特征作为当前一轮选出的haar特征;但是如果假定错误又会怎样呢?也就是说当前的haar特征或者是不明显特征或者根本就不是人脸所需要具备的特征,当然误差会比较大或者非常的大。当正确某幅图像被分类的时候提高其权重,反之降低权重,目的是使得随着迭代的进行把非人脸特征进一步突出从而筛掉。T轮迭代选出T个特征,也即所谓的弱分类器,把它们联合起来得到一个强分类器。图8描述的正是经过Adaboost算法学习得到的haar特征分类器,列出了两个特征,分别是图1中列出的第4和第5种模板的haar特征。图8 XML描述的人脸分类器数据3 级联的分类器如果一个分类器在分类阶段需要把里面的所有特征都比配完然后才判断一幅图像到底是不是人脸图像,那样检测速度会很慢,因为有的非人脸图像只需要少量的人脸haar特征就可以被排除掉,所有不需要过完所有的特征。于是Viola等人使用级联的办法提高检测速度,也就是把全部的haar特征分成若干组,然后级联即串联起来成为一个分类器,然而分组却不是先把全部的特征找出来然后再简单的随意划分,因为这样不能保证分在前面的组有很好的过滤能力,从而达不到应有的效果。3.1 训练级联分类器的算法描述算法的根本思想是训练出一个多级的分类器,每一级要最大限度的保留存在人脸的图像,但这样必然会把过滤条件设置的比较宽松,把非人脸的图像也保留下来,我们设定一个每一级允许把非人脸保留下来的最大百分比,即falsepositive,用adaboost算法自动选出满足条件的若干haar特征作为当前级分类器的内容,如此循环进行最终得到一系列的级联分类器,每一层都虑掉一部分前面曾没有去掉的非人脸图像,最后剩下的就认为是人脸了,当然还是会有falsepositive的,不过这个数值会相当的小。图9 级联分类器生成算法3.2 算法分析首先设定总的可以接受的误检率Ft,以及各级的误检率f和正确识别率d(正确识别人脸的图像数目除以总的图像数目),由于是级联的,所以最终的误检率会等于f的级数次方。训练当前层分类器,从正反样本通过adaboost算法选择n个haar特征,然后再用训练样本评估是否达到了当前级能够接受的误检率,如果满足则训练下一级分类器,否则加大特征的数目令n=n+1,一直到满足条件为止,同时调整当前层分类器阈值,使得能够满足正确识别率,因为在分类的时候是由被选中的haar特征来投票的,满足多少个特征或者用权重的方法衡量达到多大的权重才能被这一级接受,这些就是需要调整的阈值。4 人脸检测有了分类器之后就可以进行人脸检测了,分类器中保存有2424大小(也可以是其他尺寸)的人脸haar特征的位置以及权重和阈值,要检测一幅图像中是否含有人脸,为了找到人脸的确切位置还有尺寸大小需要做两层的遍历,首先是初始大小的窗口即2424像素,用这个窗口在图像中滑动覆盖每一个位置,每落在一个位置即计算窗口内由分类器指出位置的haar特征值,与分类器中相应的数值比较,最终通过级联分类器的haar特征投票来决定是否存在人脸。以后逐渐增大搜索窗口,然后做同样的计算比较,就可以把不同大小的人脸检测出来。 图10 检测人脸5 人脸检测的应用现在的数码相机都会有人脸检测的功能,检测到人脸以便更好的对焦。人脸检测是人脸识别的前驱,把人脸检测出来然后把截获的人脸再用人脸识别的方法去识别这张脸是哪个特定的人。互联网上有无数的照片,通过人脸检测可以找到属于人物类的图片。像QQ校友这种要上传个人图片的系统,可以采用人脸检测程序去自动排除非人脸减少管理员的工作量。有些商场可以通过人脸检测还有追踪技术统计人流量。某些智能机器人有摄像头作为眼睛,再配备人脸检测算法就可以识别是人类从而进行一些互动。由此可见人脸检测的用途十分巨大。参考文献:1 Paul Viola
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 货款结清协议书
- 2025-2026学年北京市海淀区六年级数学上册期中考试试卷及答案
- 2025-2026学年安徽省滁州市高二英语上册期中考试试卷及答案
- 垃圾回收协议书
- 骨科血栓预防知识宣教
- 报告商谈联络训练
- 夏日消防美术课件
- 大班知道蔬菜的营养
- 神经内科护理训练
- 让员工有归属感
- 水库卧管施工方案设计
- 2026华能国际电力股份有限公司应届高校毕业生招聘笔试备考试题及答案解析
- 《五石之瓠》教学设计
- (正式版)DB42∕T 971-2014 《城镇桥梁沥青混凝土铺装层施工技术与验收规程》
- 圆圈正义读书汇报
- (2025年标准)延迟退休协议书
- 职业院校产教融合模式的研究与实施
- 2025全民乡村振兴战略知识竞赛题库(含答案)
- 光伏发电项目投资意向书模板
- 院长发现再审申请书范文
- 常熟市卫生健康系统招聘备案制工作人员考试真题2024
评论
0/150
提交评论