基于图像处理的人脸检测研究_第1页
基于图像处理的人脸检测研究_第2页
基于图像处理的人脸检测研究_第3页
基于图像处理的人脸检测研究_第4页
基于图像处理的人脸检测研究_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于图像处理的人脸检测研究摘 要:针对人脸识别的预处理,采用图像处理技术解决了人脸检测问题。首先建立输入图像的肤色模型,然后进展开运算处理,以消除图像噪声利于后面的眼睛定位。再对二值图像做灰度投影实现人脸粗分割,定位双眼。最后对细化分割出来的人脸区域进展标准化操作,包括灰度的平衡处理和Mallat算法二维小波分解。灰度平衡把原始图像的直方图变换为均匀分布的形式,增加像素灰度值的范围。小波分解可以压缩图像,以降低算法的复杂度。每个步骤通过处理前后人脸图像的比照彰显所做步骤的意义。人脸检测的最终结果是获得64×64大小的人脸图像。此图像包含了人脸的有效信息,在此图像的根底上才能进展后续的

2、提取特征、设计支持向量机,进而做人脸识别。关键词:图像处理;人脸检测;灰度平衡;小波分解;肤色建模要识别图像中的人脸,首要的一点就是要找到人脸。人脸检测与跟踪就是研究如何从静态图片或者视频序列中找出人脸的所在区域,假设存在人脸,那么输出人脸的位置及其大小。人脸跟踪就是要在检测到人脸的根底上,在后续的人脸图像中继续捕获人脸的位置及其大小等性质。人脸检测是人脸身份识别的前期工作。同时,人脸检测作为完好的单独功能模块,在智能视频监控、视频检索和视频内容组织等方面有直接的应用1。目前做人脸检测的方法大致有:神经网络的方法、基于特征的方法和基于图像的方法等。其中,神经网络的方法是用许多的训练数据一部份是

3、脸部的、一部份是非脸部的去训练神经网络,使其可以辨识出什么图像是脸、什么图像不是脸。基于特征的方法是利用人脸部的一些特征来检测人脸,例如:人脸上有眼睛、鼻子、嘴巴,而这些器官都有固定的相对位置;就整张脸而言,大概是呈椭圆形,而脸和背景之间大致会有边缘线;诸如此类,有许许多多的特征可利用。而基于图像的方法,那么是利用人脸部的颜色来判断某图像是否是脸,假设图像是彩色的,知道脸的颜色是黄、白、褐、深褐色,假设图像是灰度的,人脸的灰度颜色的变化并不会太大,而眼睛、嘴巴、头发会是较黑的部份2。同灰度图像相比,彩色图像可以提供更多有关于目的物体的信息,彩色图像处理方法具有比灰度图像处理方法更大的优越性。基

4、于图像的方法运算量小,肤色是人脸的重要信息,不依赖于面部的细节特征,对于旋转、表情等变化情况都能适用,具有相对的稳定性并且和大多数背景物体的颜色相区别,因此肤色特征在人脸检测中是最常用的一种特征3。本课题设计了一套人脸识别的技术道路,仅讨论标准化处理前的人脸检测局部。人的皮肤颜色分布在颜色空间中很小的一个范围内,呈聚类特性,特别是在排除了光照亮度和在经过某种变换的色彩空间中。所以利用肤色这一线索,可以排除掉在灰度图像中很像人脸而对应到彩色图像中根本不是肤色的区域,这在人脸检测中会起到积极的作用,肤色模型正是建立在此根底之上的,并且人们提出了不同色彩空间的肤色模型表示方法。常见的色彩表示方法是基

5、于三基色理论的RGB空间,由RGB空间经过变换,可以得到各种色度空间表示,有HIS,YCbCr等4。CbCr分量组成的二维聚类区域排除了大局部非人脸区域,但由于CbCr是直接由RGB色彩格式通过线性变换得到,没有完全别离出亮度信息,因此对光照比较敏感。肤色聚类呈两头尖的纺锤形状。假设只采用二维的肤色CbCr模型,在值较大和较小的局部,被错误检测为肤色的区域将大大增加。在进展肤色建模的时候,YCbCr空间中的亮度和色度的别离度越大越好,但是实际操作中这二者总是存在一定的依赖关系,要做的就是尽量消除它们之间的依赖关系,分段的非线性转换就是为了这一目的。2 二值图像开运算和闭运算形态学变换膨胀采用向

6、量加法对两个集合进展合并。膨胀XB是所有可能向量加之和的集合,向量加法的两个操作数分别来自于X和B,并且取到任意可能的组合6。膨胀用来填补物体中小的空洞和狭窄的缝隙,它使物体的尺寸增大。腐蚀对集合元素采用向量减法,将两个集合合并,腐蚀是膨胀的对偶运算。腐蚀简化了物体的构造,某些物体或物体的局部将被去掉, 腐蚀和膨胀不是互逆变换。开运算是对图像先腐蚀后再膨胀,得到的不是原始图像。根据开启和闭合的特点,通常可以利用开启删除图像中的小分支,利用闭合填补图像中的空穴。用B=111111将经过肤色建模的图像进展开运算处理,消除局部噪声以利于下面的眼睛定位见图4,可见眼睛所在的区域非常明晰7。图像分割是一

7、种根本的计算机视觉技术,是从图像处理到图像分析的关键步骤。有效合理的图像分割可以为基于内容的图像检索、对象分析等抽象出非常有用的信息,从而使得更高层的图像理解成为可能8。对于经过肤色建模后的二值图像,很容易分割出人脸区域,本文采用灰度积分投影的方法,利用人脸图像的垂直灰度投影确定左右边界,利用程度灰度投影确定上下边界。设人脸灰度图像为fx,y,其大小为m×n,定义图像的程度灰度投影为选择适当的投影阈值即可实现人脸的粗分割见图5。在本文中分割人脸的目的在于减小搜索区域,更加方便地定位双眼,因此分割区域选择首先要包含双眼在内,其次尽量排除其他对双眼定位有干扰的区域,如头发等,所以没有实现

8、人脸的完全分割,而是实现的局部分割,以包括双眼在内为首要目的。眼睛定位对于能否自动有效地实现识别算法起着重要的作用,由于人脸是非刚性的,同一人的脸因表情变化会差异很大,但同一人的两眼间距相对变化是较小的,并且双眼对于人脸中线对称,因此双眼的位置及其间距自然成为人脸图像几何归一化的根据9。3 在左右眼每个半区中,当出现把眉毛误认为眼睛的时候,可以按照眉毛在眼睛上方这一先验知识予以取舍;4 左右半区都挑选了一个区域以后,就可以得到左右眼睛的中心点。使用挪动窗口的好处是它相当于一个噪声消除装置,可以将满足条件的孤立区域连接起来得到更大的区域,利于确定眼睛中心点。5 细化分割6.1 灰度平衡处理细化分

9、割后还应做灰度平衡处理,此处采用直方图的灰度平衡方法见图8。这个方法的根本思想是把原始图像的直方图变换为均匀分布的形式,这样就增加了像素灰度值的动态范围,增强了靠近直方图极大值附近的亮度比照度,减小了极小值附近的比照度。原始图像的直方图用Hp表示,输入的灰度级范围是p0,pk。1 对于有G个灰度级大小为M×N的图像,创立一个长为G的数组H,并初始化为0;2 形成直方图。扫描每个像素,增加相应的H成员,当像素p具有亮度gp时,做Hgp=Hgp+1;3 形成累积直方图HC。 HC0=H0, HCp=HCp-1+Hp;4 设置Tp=roundG-1M×NHcp,并重新扫描图像得到

10、一个具有灰度级gp的输出图像,设置gp=Tgp。a平衡前 b平衡后平衡后的图像,仍包含较多冗余信息,图像容量较大。可以采用小波变换,压缩图像,以降低后续算法的复杂度。小波变换是一种信号的时间-尺度分析方法,它具有多分辨率分析的特点,而且在时频两域都具有表征信号局部特征的才能,是一种窗口大小固定不变,但其形状可变时间窗和频率窗都可变的时频局部化分析方法。即在低频局部具有较高的频率分辨率和较低时间分辨率,在高频局部具有较高的时间分辨率和较低的频率分辨率,很适宜探测正常信号中夹带的瞬态反常现象并展示其成分,所以被誉为分析信号的显微镜11。二维小波函数是通过一维小波函数经过张量积变换得到的,二维小波函

11、数分解是把尺度j的低频局部分解成四局部:尺度j+1的低频局部和三个方向程度、垂直、斜线的高频局部。可以将二维小波分解应用于人脸图像的表示,经过适当层次的小波分解后得到的低频子带图像有以下特点:经k层小波分解后得到的像素点数是原图的1/4k,分解后的低频子带图像对表情变化不敏感。在多分辨率分析的根底上,Mallat算法是基于滤波器组的小波分解和小波重构算法,通过它可以实现信号多分辨的快速分解。Mallat算法通过一组分解滤波器h低通滤波器和g高通滤波器对信号进展滤波,然后对输出结果进展下二采样来实现小波分解,分解的结果是产生长度减半的两个局部,一个是经低通滤波器产生的原始信号的平滑局部;另外一个

12、是由高通滤波器产生的原始信号的细节局部。重构时使用一组h和g合成滤波器对小波分解的结果滤波,再进展上二采样来重构信号。多级小波分解通过级联的方式进展,每一级的小波变换都是在前一级分解产生的低频分量上的继续,合成是分解的逆运算。低频分量上的信息比较丰富,能量集中;高频分量上的信息分量多为零,细节信息丰富,能量较少。Mallat小波使得复杂的小波变成了简单的滤波器系数,大大降低了其应用的复杂度。利用Mallat算法进展信号的正交小波分解与合成如图9所示。图9 Mallat算法 小波分解层数过多,虽然冗余度降低,但丧失较多信息。本文采用二层小波分解。在对图像进展二维分解时,先对一个方向程度方向或垂直方向进展滤波,再对另一个方向进展滤波。通过滤波,将图像分解为四个子图,LL表示程度方向和垂直方向都是低频滤波。对一幅图像来说,其高频信息主要集中在边缘、轮廓和某些纹理的法线方向上,低频信息占据图像大局部内容,所以分解主要做低频处理。经过两层小波分解后的LL人脸图像,其大小为64×64见图10。7 结论经过该算法,人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论