基于肤色的人脸检测算法研究毕业论文_第1页
基于肤色的人脸检测算法研究毕业论文_第2页
基于肤色的人脸检测算法研究毕业论文_第3页
基于肤色的人脸检测算法研究毕业论文_第4页
基于肤色的人脸检测算法研究毕业论文_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE6基于肤色的人脸检测算法研究毕业论文目录TOC\o"1-2"\h\z\u摘要 5第一章人脸检测综述 81.1人脸检测的研究背景及意义 81.2人脸检测技术的国内外研究现状 91.3人脸检测算法的总体框架 101.4人脸检测的一般方法 111.4.1基于灰度特征的人脸检测 111.4.2基于肤色特征的人脸检测 131.5论文的结构安排 13第二章算法理论与实现原理 142.1颜色空间 142.1.1RGB颜色空间 142.1.2YCbCr颜色空间 152.1.3HSV颜色空间 162.2常见的肤色模型 182.2.1区域模型 182.2.2高斯分布模型 192.2.3直方图模型 202.3区域分割理论 202.3.1区域分割 202.3.2定位人脸区域 21第三章基于统计的肤色建模 223.1基于RGB空间的肤色模型表示方法 223.2基于YCbCr空间的肤色模型标示方法 223.3基于HSV空间的肤色模型标示方法 24第四章人脸检测的实验仿真及结果 254.1MATLAB简介 254.2人脸检测实验仿真及结果 264.2.1RGB颜色空间下的图像及仿真实验结果 264.2.2YCbCr颜色空间下的图像及仿真实验结果 264.2.3HSV颜色空间下的图像及仿真实验结果 274.3小结 28第五章结论及展望 285.1结论 285.2展望 29参考文献 31致谢 34

第一章人脸检测综述1.1人脸检测的研究背景及意义人脸检测是指使用计算机在输入图像中确定所有人脸(如果存在)的位置与大小的过程。人脸检测系统的输入是可能包含人脸的图像,输出是关于图像中是否存在人脸以及人脸的数目、位置、尺度、位姿等信息的参数化描述(1)。人脸检测问题的提出最初来源于人脸识别研究中对人脸定位的需求。人脸自动识别系统鉴于其友好性、方便性,已成为一种很有潜力的身份验证途径。一个完整的人脸自动识别系统至少应包含两个主要的技术环节:人脸的检测和人脸的特征提取与识别。要完成自动人脸识别,首要条件是找出人脸,即人脸检测是完成人脸自动识别任务的第一步,它是自动人脸识别技术的基础,对自动人脸识别系统的速度、精度都起重要作用。人脸识别的研究可以追溯到20世纪60年代,早期的人脸识别研究主要针对具有较强约束条件的人脸图像,往往假设人脸位置已知或很容易获得,致使人脸检测问题并未受到重视。但20世纪90年代初以来,随着电子商务等网络资源的利用,使得人脸识别成为最具有潜力的生物身份验证手段,在这种应用背景下,要求人脸自动识别系统对一般的环境图像有一定的适应能力,由此所面临的一系列问题使得人脸检测作为一个单独的课题受到研究者的重视(2)。今天,人脸检测的应用背景已经远远超出了人脸识别系统的范畴。随着网路技术和桌上视频的广泛应用,图像扑捉设备正在成为个人计算机的标准外设,为视频会议等服务所急需的技术——基于内容的压缩与检索成为一个研究热点。并且近年来随着数码相机的广泛使用和数码相册的出现,以人脸为对象的索引和检索也引起了人们的浓厚的兴趣(3)。人脸检测是进行人脸压缩的的前提条件,同时人脸也是基于内容检索的重要对象,因而人脸检测在这个领域中占有重要的地位。此外,人脸检测在友好人机界面、视频监测、数字视频处理等方面也有着重要的应用价值,所有这些使得人脸检测的研究备受关注。人脸检测技术之所以能在当今计算机视觉领域的研究中占有重要的地位并成为研究焦点,主要在于以下两个方面:一方面,将人脸作为基本对象来考虑,自动检测与定位人脸是实现人脸识别、人脸跟踪、表情识别、人脸合成与人脸编码、唇读等技术的必要前提;另一方面,人脸检测技术有着从智能安全监控、电子商务、视频会议和远程教育、基于内容检索等诸多领域的广泛应用价值。从学术的观点来看,人脸检测的研究受到重视是因为人脸检测是物体检测中的一个典型问题。人脸是一类具有相当复杂的细节变化的自然结构目标,对于这类目标的检测是一个极富挑战性的课题。人脸检测问题的难度在于:(1)人脸是一个非刚性模式,有各种姿态、表情的变化,不同人脸在细节如形状、大小、颜色上都有差异,即人脸本身是不规则的复杂模式,具有模式的可变性;(2)背景与光照的不确定性,如在复杂的背景中,不同的采集条件下的光源方向、明暗、色彩都会影响输入图像的质量:(3)人脸可能有的装饰物会增加检测的难度,如戴眼镜、口罩,化妆,脸上长有的胡须、黑斑等。因此,如果能找到解决这些问题的方法,成功构造出人脸检测系统,将为其他具有类此特征和模式的检测问题提供重要的启示。但从客观而言,以上一些难点致使完全不加条件限制的人脸检测无法具有健壮性,目前大多数人脸检测技术只针对正面端正人脸的检测,且有很多方法运算量特别大,时间复杂度高,虽然对于一定的应用来说,他们也是可以接受的,但为进一步提高实用价值,人脸检测系统需尽量弱化对待检图像的条件限制,并且最好能实时检测出人脸。人脸检测研究重点将越来越趋向于复杂背景下、多姿态人脸的检测。为向此目标靠近,我从人脸的显著特征之一——肤色入手,研究肤色特征的表达方式,即研究了各种不同色彩空间下的肤色模型,使之具有一定的实用价值且成为将来基于肤色人脸检测研究的一块基石。1.2人脸检测技术的国内外研究现状人脸检测问题是计算机视觉领域中的重要问题,最初作为人脸自动识别系统的定位环节被提出,近年来由于其在安全访问控制、视觉监测和新一代人机界面等领域的应用价值,开始作为一个独立的课题受到研究者的重视。人脸检测问题在近十年中得到了深入的研究并取得了长足的发展,国内外的很多学者提出了许多不同的方法,在不同的领域都取得了不同的成果,但是要寻找一种准确率很高的、能普遍适用于各种复杂情况的人脸检测算法,还有一定的距离。国外的主要研究单位有美国的麻省理工媒体实验室(MITMedialab)、卡耐基梅隆大学的人机交互学院(Humancomputerinterfaceinstitute)、微软研究院的视觉技术研究组(VisionTechnologyGroup)、英国剑桥大学工程系(DepartmentofEngineering)等,国内的微软亚洲研究院、中科院自动化研究所、清华大学、北京工业大学等都有专业人员从事人脸检测的相关研究。而且,MPEG7标准组织已经建立了人脸识别草案小组,人脸检测算法也是一项征集的内容。此外,随着人脸检测研究的深入,国际上发表的有关论文数量也大幅度增长,如IEEE的FG、ICIP、CVPR等重要的国际会议上每年都有大量的关于人脸检测的论文,占有关人脸研究论文的1/3之多。整体来看,人脸检测研究涉及计算机视觉、数字图像处理、人工智能等多个学科领域,同时这项研究还满足了现代计算机网络和通信系统高速发展的需求,无论从实用性还是从学术性来看,均具有很高的研究价值。随着计算机网络的普及,图像、视频等多媒体信息在计算机信息中比重的加大,这一研究必然会得到更快、更长远的发展。1.3人脸检测算法的总体框架通常来说人脸检测一般按照“分割—检测”的模式,将基于肤色模型的区域分割与基于模板匹配的人脸检测综合起来。基于肤色模型的区域分割区域是一个彼此互相连通的具有一致意义属性的像素集合,是一种方便的图像中层符号描述,是目标模型化以及高层理解的基础。区域分割是图像分析和理解的一项基本内容,其过程可以概括为按照选定的一致性属性准则,将图像划分为互补交叠的区域集的过程。目前国内外很多专家学者对肤色分割做了大量的研究,基于肤色模型的分割方法大多采用RGB颜色空间、YCbCr颜色空间、HSV颜色空间等。在不同颜色空间中的肤色分割各有其优缺点:BGB颜色空间得到的结果将非肤色区域(尤其是偏红的部分)分割出来了,但是一般没有漏检;在HSV颜色空间结果非肤色区域分割的较准确,但是肤色区域分割效果不完全;YCbCr颜色空间的结果将亮度分量与色度分量分离,较好地去掉了肤色发红的部分。2、基于模板匹配的人脸检测在分割出的肤色区域中,使用平均双眼和平均人脸模板匹配加人工神经网验证的方法,在一定尺度范围内进行穷举搜索,精确定位出人脸,其中为了减少错误报警,使用了双神经网仲裁方法。算法以大量样本为统计数据,分别建立肤色模型、构造平均人脸模板和训练人工神经网。具体而言,首先建立了训练用的图像库,手工的方法裁剪出人脸的肤色区域,用于研究肤色的分布;其次用手工标定的方法切割出人脸的五官区域,转换为灰度图像后进行尺度和灰度分布标准化,其中一小部分用于构早平均人脸模板,其他作为训练人工神经网的人脸样本。通常采用改进的自举方法,用模板匹配加神经网的再训练。概括地说,我们的方法是基于样本的机器学习方法,具有较强的鲁棒性,而且通过适当地增加样本容量可以进一步提高检测性能,具有较好的可扩展性。人脸图像所包含的模式特征十分丰富,这些特征中哪些是最有用的、如何利用这些特征,是人脸检测要研究的一个关键问题。人脸模式具有复杂而细致的变化,因此需要采用多种模式相结合的方法。归纳起来,根据利用特征的色彩属性可以将人脸检测方法分为基于灰度特征的方法和基于肤色特征的方法两类,前者利用了人脸区别于其他物体的更为本质的特征,是人脸检测领域研究的重点,后者适用于构造快速的人脸检测和人脸跟踪算法,也是本文将要研究的内容。1.4人脸检测的一般方法1.4.1基于灰度特征的人脸检测1.基于特征的人脸检测方法基于特征的人脸检测方法是通过检测出不同的人脸面部特征的位置,然后根据他们之间的空间几何关系来定位人脸。这种方法又可进一步分为基于知识和基于局部特征的检测策略。基于知识的方法首先定位候选人脸区域,然后再通过人脸的先验知识来检验人脸是否存在。与之相对应的基于局部特征的方法中,人脸的局部特征如眼睛、鼻子和嘴唇等首先被检测出来,然后由这些局部特征组合成人脸。基于知识的方法是利用对人脸的先验知识导出的规则来进行人脸检测的。人脸局部特征的分布存在着一定规律,例如,人的两个眼睛总是对称分布在人脸的上半部分,鼻子和嘴唇中心点的连线基本与两眼之间的连线垂直等,于是我们可以利用一组描述人脸的局部特征分布的规则来进行人脸检测。基于知识的方法中所用到的规则可以表述为人脸局部特征之间的相对距离和位置关系等,当满足这些规则的图像区域被找到后,则认为一副人脸已被检测出来,然后可以对候选的人脸区域进行进一步的验证,以确定候选区域中是否包含人脸。Yang和Huang[4]提出的分层次基于知识的方法检测人脸是采用这种方法的例子。基于局部特征的方法首先在整个图像中搜索一组人脸局部特征,然后通过它们之间的几何关系组合成候选的人脸区域。由于人脸局部特征的不变性,通过组合人脸的局部特征,可以把应用于检测不同位置、不同角度、不同位姿的人脸。Chin-chuanHan[5]等提出的先获取眼睛再搜索人脸区域的人脸检测,是该方法的一个实例。2.基于表象的人脸检测方法基于表象的人脸检测方法遵循一种统一的模式,即首先通过学习,在大量训练样本的基础上建立一个能对人脸和非人脸样本进行正确识别的分类器,然后对被检测图像进行全局扫描,用分类器检测扫描到的图像是否包含人脸,若有,则给出人脸的位置。采用这种检测模式的理论依据是:人脸具有统一的结构模式(都是由眉毛、眼睛、鼻子和嘴唇等人脸器官构成),如果把所有的图像集看作一个高维线性空间,那么整个人脸图像仅对应于其中的某个子空间。于是,可以通过检验待测图像是否落在这个子空间中来判断其是否为人脸。因此,可以通过大量的人脸和非人脸样本来建立一个分类器,使它能够正确地分辨这两种不同的图像模式,再利用训练好的分类器在未知的图像中检测人脸。采用这种检测策略的关键在于如何选取大量的具有代表性的图像样本,特别是非人脸图像样本,来训练分类器。具体分类器的实现可以采用不同的策略,如采用神经网络的方法和传统的统计方法等。采用这种方法进行人脸检测的例子有:Sung和Poggio[6]提出的基于样本学习的人脸检测方法;TurkPentland[7]提出的基于主成分分析的人脸检测方法;Rowly[8]等实现的基于神经网络的方法等。3.基于模板匹配的人脸检测方法基于模板匹配的方法一般是人为地预先定义一个标准人脸模板,可以是包含局部人脸特征的子模板。然后对一副图像进行全局搜索,对应不同尺度大小的图像窗口,计算与标准人脸模板中不同部分的相关系数,通过预先设置的阈值来判断该图像窗口中是否包含人脸。以上每一种基于灰度特征的人脸检测方法都有各自的优缺点。基于特征的人脸检测方法规则不易设计,因规则制定的过高或过低会造成漏检或误检,而且当图像背景中存在灰度类似人脸的区域时,必然会导致误检,故识别率不高。基于表象的人脸检测方法,一般只能在图像中检测垂直正面的人脸,用于建立人脸模型和训练神经网络的样本数量太大,进行全局搜索的时间较长。基于模板匹配的方法,计算时间开销相当大,因固定模板无法调整,不适用于姿态、表情变化时的人脸检测,弹性模板虽然可调,但对图像进行全局搜索时,要动态地调整参数和计算能量函数,计算时间开销也很大。1.4.2基于肤色特征的人脸检测肤色是人脸的重要信息,不依赖与面部细节特征的变化而变化,对于旋转、表情变化等情况都能适用,具有相对的稳定性,并且和大多数背景物体的颜色相区别。因此,肤色特征在人脸检测中是最常用的一种特征。肤色特征主要由肤色模型来描述,肤色模型的建立是利用肤色特征进行人脸检测的首要条件,肤色模型是否合适直接影响人脸检测准确率,使用何种形式的肤色模型与颜色空间的选择密切相关。人脸检测常用的颜色空间主要有RGB、YCbCr、HSV、HSI等颜色空间。肤色模型一般采用实验的方法,通过大量“肤色”与“非肤色”像素在相应颜色空间中的聚类特性分析来建立。不过,由于人脸颜色与某些其它物体的颜色相同,所以单纯利用肤色特征进行人脸检测是很不可靠的,实际应用中一般多是结合肤色特征与其他特征来检测人脸。目前关于人脸检测的研究已开始向综合特征发展。如基于模板匹配和支持向量机的人脸检测,基于离散隐马尔可夫模型和奇异值特征的人脸检测,基于小波变换和支持向量机的人脸检测等等。大部分彩色图像的人脸检测,都利用了肤色特征和灰度特征的综合,如基于肤色和模板的人脸检测,基于肤色和主元分析的人脸检测,基于颜色和形状的人脸检测等等。很多综合模型在理论上是很完美的,但从某些实际应用而言,有些特征的综合并不适合,不但算法过于复杂,计算时间过长,而且随着使用多个特征而引起的条件的增加,漏检率显著上升,从而不能应用于多数场合。所以,选择何种形式的检测方法,在实际操作中要统筹兼顾。1.5论文的结构安排本论文共分五章,具体安排如下:第一章,人脸检测综述,简要介绍了人脸检测技术产生的背景、意义以及国内外发展现状,系统分析了人脸检测的基本框架和主要方法;第二章,算法理论与实现原理,详细介绍了肤色检测中最重要的理论基础以及实现的原理;第三章,基于统计的肤色建模,通过对大量的样本训练,得到肤色在不同空间中的模型;第四章,人脸检测实验仿真及结果,不同的肤色模型下仿真出的实验结果,并对每一种结果做了简要分析;第五章,结论及展望,总结了全文的内容并对需要进一步研究的问题进行了展望。第二章算法理论与实现原理对于有关彩色视觉系统的设计开发而言,研究颜色是相当重要的。图像中的颜色不仅给我们的感觉更愉悦,而且能获得更多的视觉信息。人的视觉对彩色性当敏感,人眼一般能区分的灰度等级只有二十多个,但是能区分有不同色度和亮度的几千种颜色。可以察觉的颜色属性包括色调、饱和度和亮度:色调指红色、绿色、蓝色等颜色,对单色光源而言,色调的不同以波长的不同显示;饱和度是可以察觉的白色光加入单色光的比;亮度反映了察觉的明视度。在数字图像中利用彩色信息可以提高图像的可鉴别性,使图像更容易辨认,目标更容易识别。在进行数字图像处理时,人们并不是对所有颜色一一处理,而是根据色度学理论建立颜色模型,基于颜色模型进行处理。色度学理论认为,任何颜色都可以由红(R)、绿(G)、蓝(B)三种基本颜色按不同的比例混合得到。2.1颜色空间根据计算机色彩理论,对每一种颜色而言,在计算机中有不同的表达方式,这样就形成了各种不同的色彩系统,即颜色空间。当然,各种颜色空间只不过是颜色在计算机中不同的表达而已,每一种颜色空间都有各自的产生背景、应用领域等。主要的颜色空间有RGB、YCbCr、HSV等。其中,RGB颜色系统是最基本的颜色系统,其他的颜色系统都是基于该颜色系统的,只是用途各异,它们与RGB颜色系统可以按一定的关系相互转换。2.1.1RGB颜色空间RGB颜色空间用R、G、B三种基本颜色分量来标示数字图像像素的颜色值。我们非常熟悉的计算机屏幕的显示通常采用RGB色彩系统,这是最常见的色彩系统。可以用三维的笛卡尔坐标系统来表示RGB颜色空间,如图2-1所示,RGB颜色空间中三维空间的三个轴分别与红、绿、蓝三基色相对应,原点对应于黑色,离原点最远的顶点对应于白色,其他颜色落在三维空间中由红、绿、蓝三基色组成的彩色立方体中。图2-1RGB颜色空间模型将RGB颜色空间模型归一化处理的计算公式为:r=g=b=。2.1.2YCbCr颜色空间YCbCr彩色模型是一种彩色传输模型,主要用于彩色电视信号传输标准方面,被广泛的应用在电视的色彩显示等领域中。YCbCr其中Y是指亮度分量,Cb指蓝色色度分量,而Cr指红色色度分量。人的肉眼对视频的Y分量更敏感,因此在通过对色度分量进行子采样来减少色度分量后,肉眼将察觉不到的图像质量的变化。其中,Cr反映了RGB输入信号红色部分与RGB信号亮度值之间的差异,而Cb反映的是RGB输入信号蓝色部分与RGB信号亮度值之同的差异。它将亮度型号与色度信号分离,非常适用于肤色检测。具体来说YCbCr颜色空间模型具有如下的优点:(1)YCbCr色彩格式具有与人类视觉感知过程相类似的构成原理。(2)YCbCr色彩格式将色彩中色度分量Cb、Cr与亮度分量Y有效地分离。(3)Y,Cb,Cr,可以由R,G,B经过线性变换得到,计算效率较高。(4)在YcbCr空间中肤色聚类特性比较好。它与RGB颜色空间的具体转换关系如下:RGB颜色空间向YCbCr颜色空间转换的公式:公式一YCbCr颜色空间向RGB颜色空间转换的公式:公式二2.1.3HSV颜色空间在许多实用系统中,大量应用的是HSV模型,这个模型是由色调(H)、饱和度(S)和亮度(V)三个分量组成的,与人的视觉特性比较接近。HSV使用单六角锥的颜色模型,如图2-2所示,HSV模型的三维表示从RGB立方体演化而来。H参数表示色彩信息,即所处的光谱颜色的位置,该参数用角度量来表示,红、绿、蓝分别相隔120度,互补色分别相差180度。纯度S为比例值,它表示成所选颜色的纯度和该颜色最大的纯度之间的比率。V表示色彩的明亮程度,它和光强度之间没有直接的联系。该模型的重要性在于:一方面消除了亮度成分V在图像中与颜色信息的联系,另一方面色调H和饱和度S与人的视觉感受密切相关。基于人的视觉系统颜色特性使HSV模型成为一个研究图像处理的重要工具。图2-2HSV颜色空间模型它与RGB颜色空间的具体转换关系如下:RGB颜色空间向HSV颜色空间转换的公式:V=max(R,G,B)S=公式三H=h公式三中:mm=max(r,g,b)-min(r,g,b),h=5+b若r=max(r,g,b)和g=min(r,g,b)时,h=1-g若r=max(r,g,b)和gmin(r,g,b)时,h=1+r若g=max(r,g,b)和b=min(r,g,b)时,h=3-b若g=max(r,g,b)和bmin(r,g,b)时,h=5-r若是其他情况时,()HSV颜色空间向RGB颜色空间转换的公式:公式四2.2常见的肤色模型肤色模型是关于肤色知识的计算机表示。通过训练样本集建立肤色模型是肤色检测的关键,常用的肤色模型有单峰高斯模型、混合高斯模型和直方图模型。Terrillion等考察了归一化的rgb、CIElab、归一化了的TSL、CIE-DSH、HSV、YIQ、YES、CIEluv和DIE-xy九种色度空间,比较了单峰高斯模型和混合高斯模型在不同色度空间中的性能,发现除了少数情况外,一般需要使用混合高斯模型才能较好地描述肤色区域的分布。Terrillion等同时还指出,最终限值监测性能的因素是不同色度空间中肤色与非肤色区域的重叠程度。Jones等研究了RGB空间中肤色与非肤色像素的分布,根据标定出肤色区域的近二万副图片(包含约二十亿个像素)建立了三维直方图,在此基础上比较了直方图模型和混合高斯模型,发现前者的性能略好于后者。除了上述三种肤色模型外,还有直接利用几何参数描述肤色区域分布范围的模型、三维投影模型、基于神经网的肤色模型等。此外也有同事考虑肤色与非肤色像素分布的基于贝叶斯方法的模型。2.2.1区域模型该模型又称简单门限模型、IF-THEN模型,它主要是利用了肤色在颜色空间中的聚类性,用数学表达式明确规定肤色的范围,在这个范围内的区域被标定为肤色区域,范围之外的区域被标定位非肤色区域。利用这个模型来判段肤色主要需要两个步骤:首先通过统计的方法确定模型,即归确定肤色的具体范围;其次利用这个模型来判段新的像素或区域是否为肤色。因此,对于一幅新的图像,如果某个像素或区域满足给定的条件就为肤色像素或区域,否则就是非肤色像素或区域。从它的判断过程来看,这是一种较简单的肤色模型。该模型的难点在于如何精确地确定阈值,阈值选择不当可能会使肤色检测率下降,误检率上升。此模型相对简单,计算快捷,使用方便,速度快,但效果不是很好,只适用于特定条件下的肤色检测。2.2.2高斯分布模型高斯密度函数估计是一种参数化的建模方法,可以分为单峰高斯模型和混合高斯模型。1、单峰高斯模型这种方法的前提是假设肤色分布服从单峰高斯分布。主要通过统计分析,来预测单峰高斯分布中的参数,其中确定参数常用的方法有EM算法、Maximum-Likelihood或通过统计直接求得色彩空间中每一个分量(一般利用该颜色空间中的色度分量)的均值与方差。这种方法也可分为两个步骤:首先确定模型的参数,即确定均值和方差;其次利用该模型判段待检像素或区域是否为肤色像素或区域。单峰高斯模型相对区域模型来说能更好的表示肤色的分布,因此它的肤色检测率也较高,并且模型的参数也易于计算,但是速度较区域模型慢。单峰高斯模型是椭圆高斯联合概率密度函数:,其中x是像素的颜色分量,是均值向量,是协方差矩阵。高斯分布参数和用最大似然法估算。x属于肤色的可能性可以直接用P(x/skin)来衡量,也可以通过高斯分布参数来计算像素x与均值的马氏距离距离大小表示该像素与肤色模型的接近程度。2、混合高斯模型由于单峰高斯分布具有其局限性,不同种族的肤色直方图并不完全满足单峰高斯分布,却可以采用多峰的高斯分布来精确表示,因此提出了混合高斯模型。混合高斯模型是多个高斯密度函数的加权和:其中x是像素的颜色向量,k是高斯密度函数的个数,分别用均值向量和协方差矩阵来定义,权值表示各个高斯密度函数对混合高斯模型贡献的大小。该模型表明肤色的每个像素密度都属于概率密度这个混合体。这个模型的主要难点是对混合高斯模型的参数估计,其参数的估计通常采用Dempster等人提出的基于极大似然值的算法。这种模型相对于前面两种模型来说,肤色检测率要高得多,误检率也小得多,但是模型的确定(模型的参数估计)较难,速度较慢,不适用于快速肤色检测。高斯肤色模型常用二维色度平面来表示肤色的分布,色度平面中的肤色分布是否符合高斯分布决定此建模方法的好坏,研究表明这种分布形态与所选的颜色空间密切相关。Yang(15)验证了在RGB颜色空间中,一定光照变化范围内的肤色符合高斯正态分布;Yang(33)证明了在Luv颜色空间中,肤色呈现正态分布。如果肤色在某个颜色空间中的分布非常不对称,则会造成相同正检率条件下误检率升高。2.2.3直方图模型直方图肤色模型是一种非参数化的模型,通过对肤色直方图的统计,然后利用阈值来进行判别。肤色样本的统计直方图可以构造肤色概率图,即为离散化的颜色空间中的每个格子赋予一个概率值。利用肤色概率图来检测肤色像素主要有两种方法:贝叶斯分类器和规则化查表法。对于三维直方图,尽管效果很好,但是需要很多的训练样本而且训练时间很长,比较复杂,本文不详细讨论这种方法。2.3区域分割理论利用肤色模型对肤色进行分割主要分为两个阶段:模型建立和模型运用。模型的建立主要是通过对样本库中的大量纯肤色图像进行肤色像素的聚类分析,然后确定模型中的参数;模型的运用,主要是通过已建立的肤色模型来判段所输入的像素或区域是否属于肤色像素或区域,或者给出其与肤色的相似度。2.3.1区域分割由于自然界中存在大量与人类皮肤颜色相似甚至相同的物体,因此肤色检测的结果中可能包含大量的非皮肤区域,若直接按照肤色检测的结果进行分割,则达到的区域将远远大于真实的人脸,造成对于人脸尺度的估计错误,最终导致检测失败,进一步研究发现:在大多数图片中,某些背景颜色的颜色虽然与其他图片中的人脸颜色相同,但与这幅特定的图片中的人脸颜色具有相对的差异性;对训练样本的统计表明,正常光照条件下的某个特定人脸的绝大部分区域的颜色具有较强的一致性。因此,我们在区域分割中引入了“颜色一致性”的判别准则。具体算法为:对原始图像进行颜色空间转换和肤色检测,得到对应颜色空间中的彩色图像和标识相应肤色区域的二值图像初始化相应的标识矩阵。(2)在中由左至右、由上至下扫描,直至找到3个连续的未搜索过的肤色点,和。将其作为初始新区域=。初始化。在中,从 向左搜索,若该点为非肤色点或改点在中的相应标识为“已搜索”则转至步骤(4),否则考察该点的颜色,若与相应空间中的颜色差异大于阈值则转至步骤(4),否则重新计算相应的颜色。用类似的方法在中, 从 向右搜索,记录当前的x坐标为。若(3)、(4)步中均未搜索到符合条件的肤色点,转步骤(6),否则根据和对进行相应的调整,令转步骤(3)。记录搜索到新的区域,返回,并转至步骤(2)重新搜索,直到搜索完整幅图像。上述算法第(3)和第(4)步对颜色的判定保证了搜索出的区域中肤色点颜色具有一致性,但是由于受到阴影和眼镜等附属品的影响,一些局部像素可能与人脸的平均颜色有较大的差异,这时脸部往往被分割为多个区域,因此需要对分割出的目标进行归并处理,也就是区域归并。2.3.2定位人脸区域为了把候选面部区域从复杂背景中分离出来,必须做以下四步分割和过滤操作:(1)对于每一个非肤色像素,如果其33近邻中肤色像素的个数超过4,那么就把这个非肤色像素用肤色像素代替,这个中值滤波的目的是使图像平滑。用技术把连接到一起的皮肤区域分开。对于分割后的区域,如果其面积小于55个像素,则删掉,面积阈值是根据经验确定的。为了是肤色区域包括人脸特征(如眼镜、鼻子、嘴巴等)对应的“洞”,首先找出可以覆盖分割后每个肤色区域的最小的矩形。用这个矩形框去套分割后的每个肤色区域,每一次套矩形框时,考察矩形中每一个非皮肤像素,从这个非肤色像素发散出去的四条线,如果其中三条都在此矩形框内与肤色像素相交,则认为此非肤色像素可能在人脸中,并且包括在脸部区域中。经过上述步骤后,每个连接起来的肤色区域都是一个候选的面部区域。第三章基于统计的肤色建模建立肤色模型需要大量的不同肤色、不同大小、不同环境下拍摄的人脸的RGB图像。本文从个人生活照、互联网中选用了近百幅肤色各不相同的包含肤色的图像,然后从中裁剪出肤色的部分,组成了肤色样本库,对其在不同空间中的分布进行统计分析,得出了在RGB、YCrCb和HSV颜色空间中的肤色聚类情况,从而建立了在这三种颜色空间中的肤色模型。3.1基于RGB空间的肤色模型表示方法一般来说,RGB颜色空间由于R、G、B分量相关性强,不大容易直接建立肤色模型。R、G、B三基色不仅代表颜色,还表示了亮度,由于周围环境光照的改变引起亮度变化会使人脸检测更复杂,这样的条件下,直接利用RGB空间聚类进行肤色检测是不可靠的。虽然在RGB颜色空间难于将肤色有效地聚成密集分布的一类,但人体肤色特征色调在红色区内,这一特征表现在图像中,就是肤色的RGB符合:R>G>B肤色的这一特征相当稳定,无论是人种的变化还是光照环境的变化,都不足以造成成式R>G>B变为G>R或B>G,肤色的聚类结果简单而稳定【15】。RGB子空间下肤色模型如式:3.2基于YCbCr空间的肤色模型标示方法由于统计表明不同人中的肤色区别主要受亮度信息影响,而受色度信息的影响较小,所以直接考虑YCbCr空间中的Cb、Cr分量,映射为CbCr空间,在CbCr空间下,受亮度变化的影响小,且是两维独立分布。通过实践,选取大量的肤色样本进行统计,发现肤色在CbCr空间的分布呈现良好的聚类性【16】,统计分布如图3-1、3-2所示:图3-1肤色像素的Cb分量分布图图3-2肤色像素的Cr分量分布图由此可建立在CbCr空间下的肤色模型。在该空间下,肤色区间满足77<Cb<127并且133<Cr<173,其中Cb、Cr、分别是这两个颜色通道的像素值。。3.3基于HSV空间的肤色模型标示方法通过实践,选取大量肤色样本进行统计,得出了肤色在HSV空间中的聚类特性,如图2-5、2-6所示:图3-3肤色像素的H分量分布图图3-4肤色像素的S分量分布图由此可建立在HSV颜色空间下的肤色模型。在该空间下,肤色区间满足H<19,S>=48,其中H、S分别是色调、饱和度的值。第四章人脸检测的实验仿真及结果4.1MATLAB简介MATLAB是一种用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境。使用MATLAB,可以较使用传统的编程语言(如C、C++等)更快地解决技术计算问题,MATLAB的应用范围非常广,包括信号和数字图像处理、通讯、控制系统设计、测试和测量、财务建模和分析以及计算生物学等众多应用领域。附加的工具箱(单独提供的MATLAB函数集)扩展了MATLAB的环境,以解决这些应用领域内特定类型的问题。MATLAB提供了很多用于记录和分享工作成果的功能,可以将MATLAB代码与其他语言和应用程序集成,来分发MATLAB算法和应用。在file\New\M-file建立m文件,在file\New\Model建立模型文件。在主窗体部分可以直接输入命令,也可以观看运算结果,它是直接反映运算信息的重要窗口。4.2人脸检测实验仿真及结果4.2.1RGB颜色空间下的图像及仿真实验结果RGB颜色空间下的算法:读入我的证件照彩色图像。扫描图像,获取彩色图像每一像素的R、G、B颜色分量值。若像素值满足以下条件:R>95,G>40,B>20,max(R,G,B)-min(R,G,B)>15,且|R-G|>15,R>G,R>B,则该像素标定为白色,就是人脸区域;若不满足像素标定位黑色,是非人脸区域。RGB颜色空间下人脸仿真实验结果如图4-1所示:R分量G分量B分量人脸仿真实验结果图4-1RGB颜色空间人脸检测实验结果通过RGB颜色空间下的人脸可以很明显的看出脖子等区域混杂,有些模糊,所以说RGB方法是有一定的缺陷的。4.2.2YCbCr颜色空间下的图像及仿真实验结果根据YCbCr空间的肤色模型,算法流程如下:读入彩色图像。扫描图像,获取该彩色图像每一像素的R、G、B颜色分量值。对每一像素,根据公式将RGB转换到YCbCr空间下,计算Cb、Cr值。若满足条件:Cb∈[77,127],Cr∈[133,173]且Y>100时,为人脸区域;若不满足为非人脸区域。YCbCr颜色空间下人脸仿真实验结果如图4-2所示:Y分量Cb分量Cr分量人脸仿真实验结果图4-2YCbCr颜色空间人脸检测实验结果4.2.3HSV颜色空间下的图像及仿真实验结果HSV颜色空间下的算法:读入彩色图像。(2)扫描图像,获取该彩色图像每一像素的R、G、B颜色分量值。(3)对每一像素,根据公式将RGB转换到HSV空间下,计算H分量值。(4)若H<0.1(归一化值)时,为人脸区域;若不满足为非人脸区域。HSV颜色空间下的人脸仿真实验结果如图4-3所示:H分量S分量V分量人脸仿真实验结果图4-3HSV颜色空间人脸检测实验结果4.3小结本章是在已建立的肤色模型的基础上,在各种颜色空间下的人脸仿真实验结果,主要利用MATLAB进行了仿真。实验结果揭示了不同颜色空间肤色模型的对比,在人脸肤色分析中,由于RGB颜色空间中R、G、B三个颜色分量都包含亮度信息,人脸和脖子区域由于光照因素易成为一个区域,容易造成部分区域的模糊,混淆视觉,而造成人脸检测的困扰,正是因为RGB空间存在极强的相关性,所以不太适合肤色处理。在许多实用系统中,大量应用的是YCbCr模型和HSV模型,我们可以通过转化公式,把RGB模型转化为YCbCr模型和HSV模型,从而保证对输入彩色图像准确地分类肤色和非肤色区域。YCbCr颜色空间中肤色的聚类特性比较好,是常用的肤色模型。HSV模型与人的视觉特性比较接近,该模型的重要性在于:一方面色调H和饱和度S分量与人的视觉感受密切相关,另一方面消除了亮度成分V在图像中与颜色信息的联系。我们常用的的这两个模型为基于肤色的人脸检测研究打下了可靠、坚实的基础。第五章结论及展望5.1结论人脸检测是指在图像或视频流中确定人脸位置、大小的过程,其应用背景远远超出了人脸识别系统的范畴,近年来,由于人脸检测在安全监视、基于内容的图像检索等领域的潜在应用价值,人脸检测已成为一个独立课题并受到众多研究者的普遍重视。本文首先全面概述了人脸检测技术及其发展方向、应用背景和研究意义,重点描述了人脸检测的研究内容和方法;然后采用了不同的颜色空间来研究肤色模型,重点介绍了RGB、YCbCr、HSV颜色空间,以及各颜色空间下的肤色模型;最后研究人脸图像在不同颜色空间下的颜色特征,选取了大量的肤色样本,在具体的颜色空间中通过实验建立肤色模型,利用得到的特征进行静止图像中的人脸检测。本论文在已建立的肤色模型的基础上,揭示了在各种色彩空间下人脸检测的实验结果,实验结果也揭示了不同颜色空间肤色信息的对比。由于RGB颜色空间存在着极强的相关性,当一个量改变时,其他量也跟着改变,而且易受到光照亮度的影响,所以一般先将RGB颜色空间下的图像转换到其他颜色空间,再进行人脸检测,转换之后就使得图像的肤色与非肤色的区域区分的比较好,不容易出现混淆,确保在各类颜色空间中找到肤色区域的最佳方案。实验测试结果可以表明,本文提出的基于肤色的人脸检测具有快速、姿态非敏感的强大优势,同时也有该算法带来的局限,与人脸相连的裸露的脖子会被视为人脸区域。这一点,需要自动人脸识别系统中的特征提取环节做进一步的检测。由于肤色等色彩信息经常受到光源颜色、图像采集设备的色彩偏差等因素的影响,使一些图片特别是一些艺术图片存在光线不平衡或整体偏离本质色彩而向某一方向移动,如色彩偏黄、偏蓝等等。用MATLAB实验仿真后,通过比较分析结果,可知RGB颜色空间由于存在极强的相关性,易受光照亮度的影响,容易造成视觉上的混淆,不太适合人脸检测。在人脸检测中常用的模型是YCbCr模型和HSV模型,它们能够很好地区分肤色与非肤色的区域,有利于结果的准确性。5.2展望人脸检测作为人脸信息处理的一个重要内容,近年来已经成为计算机视觉与模式识别领域的研究热点之一。人脸作为一种自然形体具有很强的共性,但由于个体的外貌差异、表情变化以及图像在采集时收光照、设备等因素的影响,使得人脸图像具有比较复杂而细致的模式变化。因此,人脸检测是一个极具挑战性的模式分类问题,对这个问题的研究具有十分重要的学术价值,而且人脸检测与许多实际问题紧密相关,在出入安全检查、视觉监视、智能人机接口、基于内容的检索、数字视频处理等诸多领域有着极为广泛的应用价值。例如,目前在公安方面,我国公安机关开展的“网上追逃”斗争,运用了网上挂牌督捕的方法,把逃犯的照片、身份证、特征资料上网发布,各地抓捕到的犯罪嫌疑人通过网上查询、比较,可以确定其是否为网上通缉逃犯。但这种该方法的判断要通过人工进行多种技术鉴定,对证件资料假冒或没有身份证件的犯罪嫌疑人查证存在较大的难题。利用人脸识别技术,只需摄下嫌疑犯人脸,通过计算机网络将人脸特征数据传送到计算机中心数据库,系统即可自动与数据库中的逃犯人脸比较,迅速准确地作出身份判断。目前的人脸检测方法都无法很好地适用于各种复杂的情况,它们各有各的优势和局限。基于灰度的传统人脸检测,灰度信息量有限,易导致漏检或虚警,且算法的灵活性较差,多数只能针对正面端正的人脸。基于肤色的人脸检测是近年来的主要研究方向,但完全基于肤色检测人脸,不利用任何灰度信息是不可靠的。肤色的颜色与人种有关且容易受光照等的影响,所以本论文的主要研究定位在建立良好的肤色模型和基于肤色信息和灰度空间结合分析实现复杂场合的人脸检测上。本文中,建立了用于提取肤色信息的三类颜色空间下的肤色模型—RGB模型、YCbCr模型和HSV模型,依靠这些肤色模型,可以很容易地将彩色图像分为肤色和非肤色区域,实验结果展示了各种肤色模型的可操作性。放眼未来,我们可以想象的空间和我们可以用来发展的空间是很大的,比如说军事上的应用,基于肤色的人脸实时跟踪,未来战争机器人目标识别,就是要利用人脸检测来发现目标,从而实施军事行动。还有将来我们普通人的生活中也会时时用到这方面的内容,公司的职员报到及考勤系统都可以利用人脸识别技术,比利用指纹识别更加方便。在我的印象中乘坐公交车带公交卡是很不方便的,如果我们的公交车上有人脸识别系统,只要公交公司有了我们的头像资料,以后坐车就不用携带公交卡了,我相信在不就的将来我的愿望能够实现。人脸检测的研究是一条充满了困难和挑战的道路,正是如此,这个过程同时也充满着乐趣。所幸的是,各个学科的不断交叉融合,新方法和新思路层出不穷,计算机的信息处理能力大大加强,这些都为最终解决问题奠定了基础,只要长期坚持不懈地努力研究,充分利用各个学科的成果,人脸检测的自动化、智能化处理时代必将到来。随着相关技术的不断发展和实际需求的日益增长自动人脸分析技术越来越受到人们的关注和重视。对这一领域的深入研究不仅能够创造出巨大的市场价值,还将有利地推动计算机视觉、模式识别、认知行为科学等相关学科的发展。参考文献附录程序face1=imread('E:\我的照片\1.jpg');%读入图像fr=face1(:,:,1);%获取颜色分量rfg=face1(:,:,2);%获取颜色分量gfb=face1(:,:,3);%获取颜色分量bsubplot(1,4,1),imshow(fr,[]);%显示r分量subplot(1,4,2),imshow(fg,[]);%显示g分量subplot(1,4,3),imshow(fb,[]);%显示b分量[m,n]=size(fr);forx=1:mfory=1:n;logic=fr(x,y)>95&&fg(x,y)>40&&fb(x,y)>20&&(max([fr(x,y),fg(x,y),fb(x,y)])-min([fr(x,y),fg(x,y),fb(x,y)])>15)&&(abs(fr(x,y)-fg(x,y))>15)&&fr(x,y)>fg(x,y)&&fr(x,y)>fb(x,y);iflogic==1;%如果满足以上条件fr(x,y)=255;%标示为人脸elsefr(x,y)=0;%不满足标示为非人脸endendendsubplot(1,4,4),imshow(fr);%显示仿真结果face1=imread('E:\我的照片\1.jpg');%读入图像ycbcrmap=rgb2ycbcr(face1);%转化到ycbcr颜色空间Y=ycbcrmap(:,:,1);%获取亮度分量cb=ycbcrmap(:,:,2);%

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论