




已阅读5页,还剩69页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
哈尔滨理工大学学士学位论文基于机器学习的人脸检测系统摘 要随着互联网在当今世界的应用越来越广泛,各类人机交互的智能方向层出不穷,机器学习应运而生。机器学习,是以一种方式来赋予机器以学习的能力,它的实践意义是通过训练数据,建立模型,然后使用模型进行预测的一种方法。人脸检测是机器学习的重要应用之一,近年来,基于机器学习的人脸检测系统逐渐成为了研究热点,受到了广泛的关注。在人脸检测方面,通过使用支持向量机和模板匹配模型相结合的方法实现人脸检测。支持向量机算法是一个比较经典的分类算法,其广泛的应用于回归分析和统计分类中,是一种基于机器学习的方法。支持向量机算法首先将人脸像素作为分类器的输入,其次进行判断,判断区域内是否存在人脸,但是由于已知训练图像的尺度往往是固定的,可是检测过程做不到尺度不变,所以需要对多种尺度的图像进行检测,从而导致训练规模过大。模板匹配模型的基本思想,在成功检测到人脸并准确定位面部特征点之后,人脸的大致区域就可以被裁剪出来。准确提取人脸面部特征点之后,与库存的已知人脸进行对比,根据一个已知的人脸模型与待检测人脸图像匹配,寻找到正确的匹配位置,完成最终的分类。另外,在人脸检测的特征提取过程中,本文采用了PCA和LPP降维提取人脸图像的代数特征的算法,实现了对人脸图像数据的训练及分类,这是本文的重点研究内容之一。本文采用了java语言编写、OpenCV框架搭建了人脸检测实验系统,实现了人脸检测技术,为SVM分类器和PCA、LPP算法提供了技术支持。关键词 机器学习;人脸检测;人脸识别;PCA;LPP-68-Face Detection System Based on Machaine Learning AbstractWith the application of Internet in the world more and more widely, the intelligent directions of human-computer interaction emerge in endlessly, and machine learning emerges as the times require. Machine learning is a way of giving machines the ability to learn, and its practical significance is through training data, building models, and then using a model to predict. Face detection is one of the important applications of machine learning. In recent years, face detection based on machine learning has become a hot research topic and has attracted extensive attention.In face detection, face detection is achieved by combining support vector machine and template matching model. Support vector machines (SVM) is a classical classification algorithm, which is widely used in regression analysis and statistical classification. It is a method based on machine learning. Support vector machine algorithm will first face pixels as the input of the classifier, then judge whether there is a face judgment within the region, but due to the known training image scale is always fixed, but the detection process do not scale invariant, so it is necessary to detect the image of a variety of scales, resulting in large scale training. The basic idea of template matching model is that after the successful detection of the face and accurate location of facial feature points, the approximate area of the face can be cut out. After the accurate extraction of facial feature points, compared with the known face inventory, according to a known face model and the detected face image matching, matching to find the correct position, the completion of the final classification.In addition, in the face detection feature extraction process, this paper uses PCA and LPP dimensionality reduction to extract algebraic features of face image algorithm, the training and classification of face image data, which is one of the key research content of this paper.In this paper, we use java language and OpenCV framework to build the human face detection experiment system, and realize the face detection technology, which provides technical support for SVM classifier and PCA and LPP algorithm.Keywordsmachaine learning, face detection, face recognition, PCA, LPP目录英文缩写表VI第1章 绪论11.1 课题背景11.2 研究意义21.3 国内外研究现状31.4 论文内容及结构51.5 本章小结6第2章 人脸检测的基本方法与流程72.1人脸检测技术的概述72.2 人脸检测的方法122.2.1基于肤色模型的检测方法122.2.2基于形状的检测方法132.2.3基于器官特征的检测方法132.3 基于机器学习的人脸检测技术的基本流程142.3.1图像预处理142.3.2人脸检测162.3.3特征提取162.3.4分类器182.3.5人脸鉴别182.3.6表情或姿态分析192.4 小结19第3章 基于SVM的人脸检测方法203.1 基于LPP和PCA的特征选择203.1.1 LPP算法203.1.2 PCA算法263.2 SVM分类器313.3 模版匹配模型353.4 实现验证与分析363.4.1人脸检测实验构建与分析363.4.2人脸筛选实验构建与分析393.5 小结40第4章 人脸检测平台构建414.1 OpenCV软件介绍414.1.1 绘图函数424.1.2 Cv424.1.3 MLL434.1.4 HighGUI434.2 系统演示44第5章 结论47致谢49参考文献51附录54英文缩写表ANN人工神经网络(Artificial Neural Network)SVM支持向量机(Support Vector Machine)LPP 局部保持投影算法(Locality Preserving Projections)PCA主成分分析算法(Principal Component Analysis)PLA 感知学习算法(Perception Learning Algorithm)K-L变换霍特林变换(Karhunen-Loeve Transform)SVD奇异值分解定理(Singular Value Decomposition)LE拉普拉斯特征映射算法()KNN k近邻法(k-nearest neighbor)OpenCVOpen Source Computer Vision LibraryMLL 机器学习库(Machina Learning Library)第1章 绪论1.1 课题背景基于机器学习的人脸检测技术,近几年来在社会生活中不断地兴起,具体体现在例如监控、计算机网络传输及视频分析等方面,这无疑是人脸检测技术领域应用需求的快速增长,人脸检测技术不断的走进大众视线。总而言之,人脸检测技术无论在理论方面还是现实生活实际应用方面都有相当高的价值体现,是一项很实用的研究。例如,随着智慧城市的建设,视频监控网络大量部署1。目前,数字信息已经远远超越了模拟信息,产生这种现状的主要原因在于对比来讲,数字信息更易于存储、分析和判断及应用,而模拟信息在这几方面来讲相对不便利,因此,在视频监控和分析领域等采用了计算机对视频图像等信息进行采集、压缩、分析、存储得到了越来越多研究者们的青睐。人脸检测研究兴起于六十年代末、七十年代初,正值计算机方向崛起之时,最初发展的第一阶段属于比较呆板的机械式的识别阶段,第二阶段是有了人与机器交互式的识别阶段,第三阶段是真正的机器可以自动的识别阶段,融合了机器学习的技术发展到了现在2。经过几十年的发展逐渐趋于成熟,发展迅速,应用广泛。人脸检测过程是由处理器和分类器对特征进行处理和分类,处理过程中要剔除噪音,分类器是用于分类计算的工具,是根据特征提取得到的特征向量,用特征向量来给一个被测对象赋予一个类别标记3。然后由特征提取器提取特征,而特征提取器的两个作用方式是提取来自同一类别的不同根本的特征值,这类提取出来会非常接近,那么另一个作用方式是来自不同类别的根本的特征值,这类应该有很大的差异。人脸检测是人脸识别的关键性步骤,人脸检测算法的不断提出,大体上可以分为以下几类,基于统计模型的方法,基于模板匹配的方法,基于器官特征的方法,但目前整体情况来说, Viola-Jones人脸检测算法是最为成功的可实用的人脸检测算法之一,现有算法的性能已经越来越无法满足日益增长的交互性与实用性需求4。1.2 研究意义众所周知,基于机器学习的人脸检测系统,在模式识别等方面都具有极其重要的作用,并且在基于图像压缩、人脸识别、视频监控等领域有着更加重要的研究意义和应用价值。近几年来在视觉图像领域中,计算机视觉技术取得飞速的发展,飞速发展的成果主要体现在实现了人脸采集、图像匹配、图片训练等功能,并在其他的领域中得到了更加广泛的应用5。在理论研究价值方面,就人机交互方式而言,这无疑是我们研究人脸检测的基础。国内外的优秀学者提供精准的研究方向的选取和理论依据,为本文的构思开阔了思想指引了研究方向。随着各种理论研究不断的更新和兴起,将统计模型与知识模型相结合的一种新的综合模型,预测将会成为未来的主流研究趋势的一种技术6。人脸检测推进了对人类视觉系统本身的认识,这是一个重大的理论价值意义。按照人脸检测的理论来讲,未来的生活会因为人脸检测变得更加便捷和安全。比如,小区门口设有人脸检测系统,将本小区的人脸录入库中,可以防止外来闲杂人员进入小区内;银行卡取钱系统,也可以在摄像头方向安装人脸检测系统,只有本人和紧急联系人的人脸图像出现才可以将钱提出来,这两个功能实现了安全性;手机解锁功能,也可以安装人脸检测系统,就像现在的指纹解锁一样,这个功能实现了便捷性。在实际应用价值方面,人脸识别是人类未来的身份证。由此可见,可以代替目前人类生活处处离不开的身份证的人脸识别,其重要性和实际应用之广泛显而易见。而身份证、驾驶证、护照等能够验证大众身份的证件往往都具备以下几个共同的特征,形状较小,容易丢失和损坏,补证时间较长,因此,生物特征识别技术应运而生。生物特征识别技术就是解决传统身份证件另一个不便携的方法之一,通过人脸检测、指纹识别、虹膜识别等一系列数字模拟技术来方便人类生活。随着人机交互方式的发展壮大,人脸识别在实际方面的应用越来越多,人们希望人和计算机的交流就好比人与人之间的交流一样顺畅,所以越来越“以人为本”的社会,也会变得越来越方便快捷7。人脸检测近年来受到了越来越广泛的关注,比如现在的美图相机等是通过人脸检测到五官,并在这基础上加以磨皮等功能。甚至美拍等可以有美颜功能的录视频的软件也实现的接近完美,所以本文依据现有的众多模板案例,研究了基于机器学习的人脸检测系统。基于机器学习的人脸检测技术,在一定程度上,大大的提高了手机相机的利用率,这是目前应该用最广泛的价值之一。人脸检测为计算机应用领域开阔了更广泛的应用空间。随着“互联网”的不断兴起,国内外研究人脸识别技术的工作人员越来越多,中国也在这方面投入大量的精力,目的是为了探索人脸识别给人类生活带来更大的方便。在选择人脸识别作为毕业系统设计以及论文的编写,为日后作为研究生研究图像识别方向提供极大的便利,提前接触这方面的知识,理论和动手实践相结合,给本科期间留下一个完美的句号。由以上可知,人脸检测和识别是具有非常广阔的应用前景和重要的学术价值意义的课题研究,一定会成为更加活跃的研究领域。1.3 国内外研究现状许多国外的研究者研究了人脸检测和识别,研究人脸检测技术的国家有很多,像美国、新加坡、欧洲国家、韩国、日本等等都是研究人脸检测技术的热门国家。著名的人脸检测案例也有很多,例如美国的MIT研究机构和CMU研究机构等,英国也有一些比较出名的研究机构。美国麻省理工学院的学者Turk和Pentland提出了著名的Eigenface(“特征脸”)后,使特征脸迅速成为该领域的经典测试算法之一8。国内的人脸识别技术研究较之国外晚一些,但清华大学、中科院计算所、北京工业大学、北京交通大学也都有研究,国际上发表了不少的IEEE、ICIP、CVPR等重要的会议的人脸检测识别方向论文,这方面的论文近几年大幅度增长,正面体现了我国研究的进度之快以及人脸识别的重要性。比如浙江大学的王璟尧的论文基于SDCNN的人脸识别研究,郭耸的人脸检测若干关键技术研究,余家林的普通场景视频人脸检测与识别的关键技术研究,周雷的基于深度学习的人脸美丽预测研究等等。我国大学生用过AdaBoost算法等多种算法都进行过研究9。人脸识别理论的发展经历了很长的时间,大体上可分为以下三个方面:第一阶段,Face feature(人的脸部特征特点)在人脸检测过程中的一些重要研究。在这个阶段的我们要着重讲主要代表者是Bertillon、Allen和Parke。Bertillon给出了一个比较完善的系统,这个系统属于一个辨别系统。在这个系统中,找到一个特征点,把它编写成语句之后,再在数据库中找到和之前的语句相对应的特征脸,在找到特征点基础上还可以通过指纹识别技术,将两者相结合。而Allen则设计出了真实和有效果的脸部面部特写在某种程度上提高了人面部识别的效率,而Parke在Allen的基础上通过计算机操作使理论变为现实,并将此研究应用到实际,而且产生的人脸灰度图模型具有更好的质量和效率。在人脸识别的这第一个阶段,但是它有一个不好的特点,这个特点就是在实现过程中全部都要依赖操作人员或者管理员来实现10。第二阶段,这个阶段是人与计算机的共同参与的过程,轮流识别的阶段。将人脸的正面图像运用一些值来替代,这些值是几何特征的参数值等,这是这个阶段的典型的代表性的工作。而Goldstion等人为了更好地表现人脸特征而利用了21维特征向量来表示,而且他们根据此种表示特征的方法设计出了一个人脸识别系统。Kaya和Kobayashi运用了统计计算中的方法,在人脸识别的特征表示中,运用到了欧氏距离。T.Kanad则设计了一个识别系统,这个系统运行速度高,而且可以自动引导知识,具有半自动试探的能力。他巧妙的利用了积分投影法设计出了一个更先进的系统,这个系统把一组面部特种功能函数放到了单幅图像上去计算并且将人脸识别技术和模式分类技术相结合11。总体来说,前两个阶段都要有人为的大量参与,要不然不能稳定的进行面部识别,这两种阶段对人的依赖性太大,所以人脸识别在早期阶段的主要特征:基于零件零散式的识别方法存在于大部分人脸识别中。其中主要的识别方法有基于颜色的人脸检测技术,基于面部的几何特征等等。信息的获得也是由人脸中的主要器官的几何特征信息以及其之间的几何位置关系提供的。在光照条件发生变化时,这种方法也是非常容易丢失重要信息的。所以他们的方法识别能力是相对来说较差的。在这两个阶段对识别的前提条件要求非常高,而且有非常强的约束条件。单单是一个北京有无的差别就会对人脸识别中人脸的位置造成非常巨大的影响,进而影响到最终识别出的准确性和效率型。第三阶段,在20世纪90年代初,计算机技术取得了非常之迅速的发展和推动,计算机逐渐向高效率高速度靠近,人脸识别系统也得到了显著的发展,越来愈多的学者将目光放到了人脸识别中。在这个阶段,研究者研究出了许多有名的算法使得人脸识别技术得到显著地提高,从此以后,人脸检测具有真正的自动检测的能力。在1991年,Turk和Pentland提出了关于“Eigenface特征脸”的方法,在1997年又提出了Fisherface方法。现如今人脸识别方法的主要研究方向是在光照、背景、面部表情姿态等不归一条件下的研究。希望能够研究出不受这些外界因素影响的人脸检测方法。例如统计学习方法、非线性的建模方法、基于Boosting的学习技术以及基于三维模型的人脸建模与检测方法的研究也成为备受关注的研究领域和趋势12。模式识别是人脸检测的基础,最近拜读了Richhard O. Duda等人的模式分类这本书,了解了一些基本知识。模式识别也有很多的分类,华为手机的指纹识别技术、DNA序列分析、声音识别、人脸检测等等都是众多分类的一种。手机的指纹识别技术是通过记录手上的指纹纹路和特征点,形成一把独一无二的指纹密钥,并通过多次录入以便使指纹纹路特征更加清晰的呈现,完美的实现了指纹解锁的安全性能和方便性能。DNA序列分析是在建模中实现的。数学建模中的DNA序列分析,是一项很有价值的研究。声音识别在日常生活中应用的也很广泛,人脸检测则是通过视频头检测到人脸,并记录五官特征,然后在库里搜寻此人姓名等信息,因此成功检测到人脸并识别13。模型是由多个特征形成的,简而言之,特征即是模型。特征经过一系列的提取,建模形成各种各样的从数据中提取出来的模型,应用各个领域,依据机器学习,将数据转化成能够总结出来的规律,以建模的形式直观、方便、易懂。这就是机器学习的意义所在。本文依据国内外的研究现状,总结前人经验,在人脸检测技术方面进行了实验研究工作和论文的编写。1.4 论文内容及结构基于机器学习的人脸检测系统主要研究的内容和结构如下:第一章:绪论,主要对人脸识别的实际情况进行了分析,介绍了课题的背景和理论实际应用方面的价值,阐述了课题研究的依据和意义。通过对国内及国外研究现状的实例分析,了解了国内外的研究现状,再一次回到本文的研究中来,对论文的整体架构进行阐述,并对整篇论文的结构进行规划和描述,最后对本章进行总结。第二章:人脸检测的基本方法与流程,介绍人脸识别流程,人脸图像的预处理,特征识别的算法包括PCA,LPP的理论基础和工程实现。第三章:基于SVM算法的人脸检测方法,比较PCA,LPP算法,在ORL库、Yale库以及自建小规模人脸库上测试算法识别率和算法性能,揭示基于降维处理的人脸识别方法对模型特征的识别效果对比分析,训练整理速度较优或者效果较优的算法。第四章,人脸检测平台构建,OpenCV概述和安装配置方法,介绍开源视觉库OpenCV的概念,结构,特点,发展史,展示系统部分截图。第五章,结论,对论文的整体进行总结和分析,对人脸检测的未来有一个美好的展望。1.5 本章小结本章介绍了课题背景,研究意义,国内外研究现状,论文内容及结构,为整篇论文奠定了夯实的基础。首先,通过课题背景和研究意义的概述引出了人脸检测在计算机视觉领域的发展地位,接下来介绍人脸检测技术的发展和研究现状按照技术出现先后的顺序。最后引出了本文的论文内容和结构,为整篇论文奠定了夯实的基础。第2章 人脸检测的基本方法与流程本章主要是对人脸检测技术的概述,人脸检测的基本方法和基于机器学习的人脸检测技术的基本流程这三个方面进行研究,人脸检测的基本方法主要从以下这三个方面来介绍,基于肤色模型的检测方法、基于形状的检测方法、基于器官特征的检测方法。基于机器学习的人脸检测技术的基本流程包括预处理、人脸检测、特征提取、人脸鉴别、表情或姿态分析、物理分类。2.1人脸检测技术的概述基于机器学习的人脸检测技术,近几年来越来越受到大众的关注和应用,这明显对推进视觉领域的发展起到一定的作用。人脸检测技术是一种对身份进行鉴定的生物技术,检测过程通过分析和比较人脸面部特征的不同特点,从而通过一种级联分类检测技术来对人脸图片进行特定的训练,然后再将从摄像头上采集到的人脸图片与人脸数据库中的已知人脸图像进行模板匹配,如果比对结果显示在预设的阀值范围之内,则表示人脸检测成功,反之则失败。基于机器学习的人脸检测系统应用非常广泛,适用在很多不同的领域。人脸检测技术现在已经日趋成熟,逐渐向高识别成功率的趋势发展,更加的可靠和稳定。目前我国及其他国家的众多专家学者仍处于对该技术不断地研究阶段,该技术正在不断的改进与更新,人脸检测高识别率将会达到新的高度。人脸检测在生物特征识别技术中,有别于其他的计算机视觉识别技术,人脸检测能够使用计算机来进行判断、处理和分类,通过将某种视觉信号转换为机器能够识别的数字信号。计算机通过摄像头看到的东西虽然简单,但是从数学的角度来看,这些可以称之为由数据和众多数字而组成的矩阵,在这些数据中可以明显的看出待检测物体所处背景光线强弱等信息,将这些信息量转化为矩阵14。计算机能够从已经训练过的数据库中的图像,通过模板匹配出待检测区域是否是一个人脸,对于人来说很简单,可是对于计算机来说却不是一件容易的事情,计算机采用独特的方法,通过对颜色数据的判断来进行处理,基于颜色的人脸检测,许多丰富的色彩通道往往组成了彩色图片中的像素,所有的彩色图片都由以下这三个通道组成,红色通道,绿色通道和蓝色通道,灰度图都是由RGB组成,比如说,要对一个18位的图片进行转换是一件很复杂的事情,需要做的工作是前期先将图片由将彩色图片转换成灰度图片,通过这样格式上的转换可以减低数据量(向量)15。将图片转化为灰度图之后,将这张灰度图的对比度调高,这样可以将图片原本昏暗的地方变得更暗一些,明亮的地方变得更亮一些,经过这样更清晰的显示图片的处理之后,该图片就会很轻松被算法检测出来了。在从CMOS摄像头中获得图片后,首先对这张图片进行前期的处理,将获取的图片从RGB模式转化为灰度图,然后进行灰度图直方均衡化操作。基于机器学习的人脸检测中,将已经采集成形的图像建立一个自适应模型,然后将采集到的图像用来放在上述建立好的模型中进行一个自适应训练,再以XML文件的格式保存好该训练模型数据,有了这个训练模型数据之后,就可以使用新录入的检测模型来与前面训练过得模型进行图片的比对,把当前的图片与该模型进行模板匹配得出的结果,使用矩形图像检测框框出来进行标记,并在检测界面上圈出人脸图像的目标区域,然后保存图像。研究该项技术目标是能够使计算机像人类一样,可以客观的分析和判断各种视觉角度传递的信息内容,为了计算出获得的视觉数据信息,通过使用编制的形式将数据转化成数学来计算,使计算机来模拟人类所拥有的能力,灵活的匹配图像信息,使机器变得智能化,人类化,灵活化,机器能够像人类一样灵活的通过双眼来获取身边重要的视觉信息,然后传输到大脑皮层处理视觉所获得的信息,这就是机器学习的一部分。近几年来计算机视觉的技术发展的越来越强大,各个领域都涉及到该技术来解决问题,因此,计算机视觉技术在视觉模式领域中的实际应用价值也在此完全的表现出来。与此同时,人脸识别技术也在一定的程度上模仿了一种叫做采集智能视频数据的方法,该方法为采集到的视频数据信息分配了PCA子空间16。如图2-1所示,是一张静态的灰度图像,正常来说,如果一张彩色照片被检测,系统会将彩色照片转化成灰度图像存在指定文件夹里。这项技术的优点很明显,操作更简单、便捷、直观等。人脸检测在生物体特征识别技术中,无论是理论还是实际应用方面,都具有重要的价值。这项技术除了在智能视频监控系统中具有很重要的成功应用案例外,在视频会议、智能家居、门禁安全控制以及人机交互等其它场合也有着相当广泛的应用。图2-1 静态灰度图像人脸检测近几年来是计算机视觉领域和模式识别研究中的重点热点问题,越来越多的受到了研究学者们的关注和重视。同时,本文的研究内容可以说是作为生物特征识别的众多技术中的关键性技术之一,其在信息安全、公共安全、金融安全等众多安全领域都具有可观的应用前景。但是由于经常受到一些影响包括有姿态、表情、光照、噪声、角度和各类遮挡物等外界因素,人脸检测技术对计算机来说具有很大的挑战性。完成一个好的项目研究,一定要准确的定位好项目的需求和要完成的功能,需求,就是陈述清楚系统必须要做的事情或者系统必须具备的功能及特征。需求分析的过程包括这几个步骤,理解当前情况,识别改进,为新系统定义需求。需求从本质上讲可以分为两个部分,功能需求和非功能需求,这两个部分在本系统中几乎没有涉及到,本系统的需求很简单,就是通过算法实现人脸检测和识别,要求准确率。目前现有的一些科研工作者已经探索研究出了很多套优秀的算法,这些优秀的算法都能够很好的保证机器在一定的环境条件下进行适当的人脸的检测,并且检测的很精确,目前来看,有越来越多的科研爱好者们来研究不同的人脸检测算法,使得现有的基于OPENCV的人脸检测技术的发展不断趋于稳定,本文在原有的比较简单的两种算法基础上进行了改进和更新,融合并添加了一些独特的研究方法以提高检测精度和检索效果。总的来说,基于机器学习的人脸检测系统,该系统主要要实现的任务有两大点,人脸检测和人脸识别。人脸检测和识别还涉及到了EigenFace特征脸技术,用到的不多,在这里讲一下特征脸的理论知识。特征脸EigenFace是一种以PCA为基础的技术。PCA是一种特征提取的方法,在后面章节会详细介绍,这里大概了解一下EigenFace特征脸技术。该技术从其理论基础上来看其实相对简单一些,简而言之,相当于把人脸的彩色图像像素从一个原本的高像素空间变换到另外一个低像素空间,然后在这个另外的子空间中做某种计算,即数学中相似性计算方法 17。所以说,EigenFace的技术和图像识别的基本思想概念大概是一样的,首先选择一个比较合适的子空间,然后将所有的图像像素点都变换到这个子空间上,在变换过程中尽量保持变量不变,然后再在这个子空间上衡量相似性或者进行分类学习。和PCA的过程基本一致。那么接下来解释一下将图像变换到一个合适的子空间中的原因,答案是为了接下来的识别或者分类做更好的铺垫。具体原因在于原始的图像数据本身是离散的,那么将其变换到另外一个空间中之后,属于同一类别的图像会聚集到一起,属于不同类别的图像像素的距离会越来越远,又或者在原始像素空间中,不同类别的图像分布在不同的位置,所以用一个简单的线或者面把他们切分开是很难的,然而如果将其变换到了另一个空间之后,就可以在变换的过程中自然而然的将它们区分开了。所以,将原始空间图片变换到另外一个空间的过程是必然的。那么还有另外一点需要解释的,既然在表面上看起来人脸图像中,同类的图像肉眼看起来就是相似的,不同类的图像肉眼看起来就不太相似,在分类过程中不变换空间就不会进行分类的原因主要是因为人脸图像存在各种因素的影响,包括光照、视角、背景和形状等等不同,这也是在实验过程中的一大难点,会造成同一个目标的图像都存在很大的视觉信息上的不同。如图2-2长颈鹿所示。图2-2 特征点不同的长颈鹿世界上并不存在任何两片完全相同的叶子,尽管他们都叫做叶子。大千世界,同一类事物虽然都存在共性,但同时也都存在个性,这就是这个世界缤纷多彩的原因。这个世界的万事万物如此之多,我们要想通过机器准确无误的识别我们想要识别的东西很难,第一步,要在我们想要识别的粒度上把同一类目标的共性找出来,而且找到的这个共性最好和我们要区分的类是不一样的。那么我们就要明确我们想要的粒度是什么,我理解这是和我们要实现的过程是密切相关的。例如我们要区分人和车,那人的共性就是有脸、有手、有脚等等,而车的共性是有轮胎、有方向盘、有座位等等。但如果我们要区分亚洲人和非洲人,那么亚洲人的共性就是黄色皮肤等等,而非洲人的共性就是黑色皮肤等等。可以试着想象做一个比喻,上帝把世界万物组织成一个树状结构,树的根就是万物之源,下一层可以分成生物和非生物,再下一层可以继续将生物和非生物继续区分,直到最底层,万物,你我,都是树的一片普通得不能再普通的叶子。树越往下,粒度越小,分类就越细。总而言之EigenFace特征脸的总体理念是将原始数据变换另外一个空间中之后,再进行其它的操作。而EigenFace选择的空间变换方法是非常有名气的主成分分析。它被广泛的应用于预处理和特征提取中以消去样本特征维度之间的相关性。EigenFace方法通过利用PCA算法来得到人脸主要分布的成分,具体实现方法是对训练集中包含的所有的人脸图像的协方差矩阵来其进行本征值分解,来得到相对应的本征向量,这些本征向量(也就是特征向量)就是所谓的“特征脸”。 每个特征向量或特征脸都是相当于捕捉到或描述每个人脸之间的变化或者特征。这就意味着在一定程度上每个人脸都可以表示为这些人脸的线性组合。实际上,空间变换就等同于“孪生姐妹”,原始像素空间的就是单位“姐姐”,经过PCA转换空间后就是以每一个特征脸或者特征向量为“妹妹”,在这个空间(或者坐标轴)下,每个人脸就是一个点,这个点的坐标就是这个人脸在每个特征基下的投影坐标。2.2 人脸检测的方法人脸检测,可以看做是进行人脸识别操作的重要步骤之一,但是,由于在早期的人脸识别工作方向,其主要的面向的研究对象是具有较强约束的人脸图像(比如没有背景的图像,或者五官非常清晰且图像集五官位置固定的图像),通常情况下,在早期的工作中,假定人脸位置相对稳定和一致,因此位置信息的获取变得固定化和简单化,导致当时人脸检测技术不完善,并且没有得到相应的快速的发展。人脸识别技术,如果想得到更实用更人机交互更智能的发展,人脸检测技术就必须跟上时代发展的脚步,得到更多更专注的技术研究。可是,人脸检测仍然面临着许多技术挑战,原因在于人脸部特点的变化的多样化和各种外部因素(光照、姿态等)影响,正是由于人们认识到了人脸检测的艰难性和重要性,所以,现阶段人脸检测技术成为了人脸识别技术方向研究的热点。研究者们纷纷投入大量时间精力,研究出一系列的人脸检测方法。2.2.1基于肤色模型的检测方法肤色检测法,是最容易理解的方法,也是最常用的方法之一。在我们生活的彩色图像中,人脸图像的周围背景颜色与人脸肤色相差非常大,机器可以通过这样的差别,清晰地将人脸与周围环境区分开,所以肤色检测是经常用到的方法之一。对于在人脸区域的检测,主要是通过基于肤色模型进行获取。为了实现这一技术,主要应该通过非线性的肤色进行分割色彩的变幻来实现,那么非线性的分段色彩变幻得到的皮肤模型首先必选先选择一个合适的色彩空间。简而言之,建立肤色模型就是根据表或者代数的形式来表示出肤色的像素的色彩,或者通过搜索某一个颜色与肤色更相近。例如,在高斯模型中,适用于肤色模型的检测方法有混合高斯模型或者直方图模型等。那么、确定选择哪一个模型是一个首先要解决的问题。Terrillon等人实际考察了九种色度空间,发现在大多数情况下,在两种模型混合高斯模型和直方图模型中,需要使用第一种模型混合高斯模型才能够较好地描述肤色,使之均匀分布区域,与此同时他们还指出,在最终,不同色度空间中肤色区域和非肤色区域之间的重叠程度征起到了限制测试性能的因素是 18。基于肤色模型的人脸检测技术,整体来说,应用广泛,便于应用,对检测者姿态反应不敏感,检测速度较优,各个方面都相对较好。在背景颜色单一的情况下,检测率极高,效果极好,速度极快,但是处于复杂背景、光照不好或者周围环境较乱或者背景与肤色及其接近的情况下,检测率则会大大降低,所以,在这种情况下,常常将这种基于肤色模型的方法与其他方法混合使用。2.2.2基于形状的检测方法这类基于形状的检测方法,不是本文的研究重点,在这里简单介绍概述。简而言之,基于形状的检测方法用到了人脸以及五官的形状特征信息,事先用一些形状模板来和人脸进行匹配,例如用圆形或者椭圆形来描述人脸形状,首先通过从待检测的人脸图像中找到类圆或者类椭圆区域来简单的大致检测人脸,通过物体的灰度图像模式来大致估计物体的表面形状的一种方法,是模式识别等领域中对数据进行预处理和获取数据模型的的重要方法之一19。另外一种方法是将人脸分为很多的小块马赛克区域,利用每个区域的特征关系检测出人脸,然后再用和其他方法与之相结合的方式验证所找到区域是否是人脸。2.2.3基于器官特征的检测方法正如世界上没有两片纹路完全相同的叶子一样,世界上任何一张人脸也不相同,对于人体的五官特征来说也是一样的。所以,五官形状和五官分布的几何特征都在遵循着某种特定的普遍适用的一些规则,基于器官特征的检测方法,也就是检测图像中是否存在满足这些普遍适用的规则的图像区域块。这种方法的一般步骤是这样的,先给五官和五官特征组合起来建立一个模板,然后检测图像五官出现在附近的特征点或者特征点组合,验证是否和之前的模板相吻合,用基于器官特征的检测方法进行筛选,从而可能检测到是否存在人脸。2.3 基于机器学习的人脸检测技术的基本流程从宏观的定义角度来看,人脸识别的具体实现过程体现在从人脸检测的人脸边缘的剪裁开始,到充分利用识别技术算法等信息来成功识别结束。而狭义上进行的人脸识别的定义则是与身份认证密切相关的一种技术,一般情况下会是在已知的人脸样本库的情况下,在周围环境中,利用计算机采集到的一个人多张图片或多个人脸多张图片进行图像分析和模式识别,最终识别出人脸信息。其具体研究内容主要包括以下几个方面:2.3.1图像预处理人脸检测的关键性任务是从待检测的图像中判定出人脸区域,它会把图像分为两个区域,人脸和非人脸区域。人脸检测自身在图像检索等领域有着广泛的应用,但光照变化、姿态变化、复杂背景等都会对检测结果产生影响。图像的预处理,是人脸成功检测的基础,首先预处理的第一步骤是将图像从彩色像素RGB空间转化到Lab空间,通过将灰度值和像素去均值的方法,最后进行边缘检测的方法,将不必要的或者噪音的背景区域剪切掉,检测是否存在人脸区域,最好将所有的图像统一缩放为标准大小。在图像边缘的剪切过程中,如图2-3所示,有个别部分所处环境不理想,导致图像的边缘检测效果不是很理想,这种时候需要人工剪切。图像的预处理主要是将图像中的特征表现出来,一般分为六个技术模块:光线补偿技术、灰度变化技术、高斯平滑处理技术、对比度增强、二值化以及直方图均衡。人脸定位通过对人脸图像边缘进行检测,通过面部五官的特征来对人脸进行标记,也就是说人脸定位主要通过对眼睛、鼻子、嘴唇等主要人脸部位进行标记来定位。因为人脸的五官很容易被检测出来,所以标记可以很顺利。图2-3 边缘检测图像二值法,也用在进行对人脸特征处理的预处理过程中,是本文预处理过程中不可或缺的一部分,它的工作主要是将已经处理过得灰度图像值转化成黑白的二值图像,非黑即白,图像的二值化处理案例如下图2-4和2-5所示,图2-4是人脸五官的二值化处理,图2-5是全身的二值化处理。我们通过实现简单的二值化处理,设置一定的阈值范围来实现图像从灰度到黑白的转化。图2-4人脸二值化处理图像图2-5全身二值化处理图像由上图我们可以看出,系统通过二值化处理,可以为进一步检测出人脸的眼部、嘴部、眉毛、鼻子、耳朵、头发等特征提供方便途径,尤其是突出的眼部和嘴部更容易检测识别到,由于我们的系统主要研究的是基于机器学习的人脸检测系统,因此二值化的处理只作为系统的进一步扩展的功能,并没有进行更加深入深刻的研究。2.3.2人脸检测人脸检测,简单来说,当被检测者与所在的周围背景颜色等方面有计算机可视的明显区别时,首先应该检测到图像中是否存在人脸图像或者人脸边缘,如果不存在,则检测框内不会出现任何变化,如果存在,检测框会定位到除去背景人脸所在轮廓范围以及轮廓标准位置,面部尺寸大小,表情变化整理等。如果在最开始检测阶段就没有将人脸定位精确,那么人脸检测的最后检测结果的准确性成功率会大幅度下降,就像盖楼的根基没有打好是一个道理。所以说这个过程十分重要,是之后的人脸检测工作能否顺利进行的前提和关键所在,最终检测结果是否准确和可靠就从这个步骤开始,会对最终检测识别的结果程度造成很大的影响。2.3.3特征提取特征提取,顾名思义,就是找出每张人脸的特征,然后运用某种技术把特征提取出来,这属于一种对人脸面部特征的描述方式,它可以提取出人脸中机器能够进行识别的信息,所以属于机器学习的一种。适当合理的特征表示能大大提高分类器的精准度,同时也能减少数据的存储空间,剔除不必要的数据。特征提取的方法如下图2-4所示,从图中我们可以清晰可见,特征提取的方法大致分为以下几种,代数特征、云文图、几何特征、固定特征模板以及特征脸等方法。其中特征提取的方法之一几何特征还包括有欧氏距离、角度、曲率这三种方法20。在此会用到PCA、LPP算法。图2-6特征提取的方法人脸上的特征点非常多,如下图所示是标准的人脸特征点定位。无论从正面还是侧面来看,特征点都是存在的,特征点的提取这一过程是一定要进行的步骤,准确的提取特征点能够为人脸的检测和识别步骤提供很大的便利。图2-7准确定位人脸特征点2.3.4分类器分类器的选取这一步骤是至关重要的,因为分类器的分类性能可能会直接影响到最终检测效果的好坏,分类器的种类非常多,按照距离分类,可以分为三分分类器,有K近邻分类器、最近邻分类器、最小距离分类器,按照样本分布统计特性可以分为贝叶斯分类器、支持向量机分类器、神经网络分类器。其中,最小距离分类器的原理,是通过求出一段距离将待分类的向量归结为众多距离中最小的那一类的分类方法,那么这段距离代表的是未知类别向量到事先已知的类别中心向量。最近邻分类器的基本思想是哪个向量距邻居最近,哪个向量与邻居同类。支持向量机分类器作为数据挖掘领域中的一项新技术,是一种新工具,用来借助于最优化方法来解决机器学习问题的。图2-8人脸识别的分类器2.3.5人脸鉴别人脸鉴别,也可以称为人脸识别。人脸识别的过程就是把要识别的人脸与一同放在数据库中的人脸模板(ORL库、Yale库、自建人脸库)进行对比。这种对比会得出想要得到的信息也就是人脸识别的目的。它的核心点是如何依据正确的匹配规则,如何选择合适的匹配策略21,通过搜索,找到数据库中与它相匹配的待检测人脸,并给出结果,显然,它与人脸特征表示紧密相关。对于人脸匹配,选择正确恰当的表示方式和对比方式来进行完整的构造人脸特征和比对相似点22,是人脸识别在这个阶段的关键点。2.3.6表情或姿态分析表情或姿态分析,基本思想是通过人脸的面部表情分析进行分类。这是一个千变万化的分类,可以通过众多表情的分析得出结论,比如这个人是夸张、愉悦、开心、愤怒、恐惧、兴奋,还是面无表情,这些都包含在分类里面,这些也都是人脸识别的研究内容。所以在录入数据库的时候,我们强调的是一个人要以多个不同的表情来录入数据库,这就是为了能够更好地实现人脸识别的功能也就是识别成功率提供方便。2.4 小结本章主要对人脸检测的基本方法做出了综述,介绍了各种人脸检测的基本方法,总结了人脸检测的基本流程,依次为图像的预处理、人脸检测、人脸特征的提取、人脸鉴别、表情或姿态分析以及物理分类。第3章 基于SVM的人脸检测方法本章对PCA和LPP两种算法进行了综述,主要对SVM分类器进行详细介绍,以及PCA和LPP算法的实现效果对比,简单的阐述了模版匹配模型的基本思想。3.1 基于LPP和PCA的特征选择3.1.1 LPP算法目前,人脸识别算法主要集中在二维图像方面,三维图像方面也有研究,但目前应用范围不广泛。重点应用的二维人脸识别,主要通过机器来用数学方式测量眼睛、下巴、颧骨、两颊等之间的间距来进行身份认证的相关工作,利用的具体数据是分布在人脸上从低到高80个标点或称之为节点。LPP算法,PCA算法都属于二维人脸识别算法。局部保持投影算法,也就是LPP算法,尽管在近几年来的特征提取领域里面,不断涌出了海量优秀的的算法,而且已经
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年安全生产考试题库(机械安全操作规范)考点
- 2025年护士执业资格考试题库(妇产科护理学专项)核心考点解析试题
- 2025年室内设计师职业资格考试真题模拟卷:室内设计市场调研与定位试题
- 2025年安全生产考试题库(机械安全操作规范)备考
- 2025年机械安全操作规范考试题库:机械安全操作规范安全管理制度题库
- 2025物业公司服务合同
- 2025年护士执业资格考试题库-护理伦理学伦理原则试题
- 2025各类教育机构军训服务合同
- 2025年护士执业资格考试题库(妇产科护理学专项)-妇产科护理学案例分析
- 2025年医保信息化应用与政策考试题库及答案
- 邀请函模板完整
- 2020新译林版高中英语选择性必修二全册课文及翻译(英汉对照)
- 大学物理第14章光的衍射课件
- 家长会 课件(共44张ppt) 九年级上学期
- 钻孔灌注桩施工安全控制培训教材课件
- 福建省莆田市各县区乡镇行政村村庄村名明细
- 大班幼儿随访电访记录表内有内容
- 干细胞精品课件
- 太阳能路灯说明书完整版
- 中国老龄化社会的潜藏价值(中英)
- 初中化学课程标准(修订稿)
评论
0/150
提交评论