




已阅读5页,还剩63页未读, 继续免费阅读
(计算机应用技术专业论文)人脸识别的算法研究及系统实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人脸识别的算法研究发系统实现 中文摘要 本文在自动人脸识别的框架下,对整个人脸识别过程分两部分述叙:人脸识 别的前端处理( 人脸检测与人脸特征点定位( 采用对准的方法) ) 和人脸识别。 着重讨论了人脸识别的主要算法,并提出了b o o s t e dg a b o r 小波特征弱分类器作 用于人脸识别的方法。 首先,从统计学习理论的角度对b o o s t i n g 等机器学习的方法做了一个全面 的介绍。 其次,介绍自动人脸识别的前端处理:现阶段普遍运用并取得极好效果的人 脸检测框架:由v i o l a o ”首先提出的基于积分图像的h a r r 小波特征提取和基于 a d a b o o s t 的特征选择的人脸检测方法。目前比较有效和通用的人脸对准的方法: c o o t e s 的a s m 。”和a a m ”“方法,用于特征点定位对识别前图像做归一化。 最后,在对现阶段的一些主流人脸识别方法分析的基础上,提出了运用 b o o s t e dg a b o r 小波特征弱分类器做人脸识别的方法,弱分类器在g a b o r 小波滤 波结果的模和相角的基础上构造而成。人脸识别这一个多类问题通过运用类内类 问变化转化为类内类间的两类问题来考虑。通过a d a b o o s t 学习的方法并运用 b o o t s t r a p 来对类间样本抽样,得到了一个c a s c a d e 序列的强分类器,并且这两 种特征的分类器融合结果与在f e r e t 库3 】上的至今最好的结果相一致。本文采用 的特征融合方法只是一个初步的尝试,该研究为今后进一步提高人脸识别的性能 提供了可行的思路。 关键词:人脸检测、人脸特征点定位、人脸识别、a d a b o o s t 、g a b o r 小波 人脸识别的算法研究及系统实现 a b s t r a c t i na u t o m a t i cf a c e r e c o g n i t i o nf r a m e w o r k ,t h e r e a r et w om a i n p a r t s :f a c e r e c o g n i t i o np r e p r o c e s s i n gp a r t ( f a c ed e t e c t i o na n df e a t u r el o c a l i z a t i o n ( a l i g n m e n t ) ) , f a c er e c o g n i t i o n i nt h i st h e s i s ,w ei n t r o d u c e dt h et o pp e r f o r m e df a c ed e t e c t i o na n d f e a t u r el o c a l i z a t i o na l g o r i t h m s ,a n da l s o p r o p o s e d am e t h o df o rf a c er e c o g n i t i o nu s i n g b o o m e dg a b o rf e a t u r eb a s e dc l a s s i f i e r s f i r s t ,w es t u d i e db o o s t i n g ,o n eo ft h et o pp e r f o r m e dc l a s s i f i c a t i o na p p r o a c h e s a m o n g m a c h i n el e a r n i n ga p p r o a c h e s t h e nw ei n t r o d u c e dt h et o pp e r f o r m e df a c ed e t e c t i o na l g o r i t h m :a d a b o o s tb a s e d f a c ed e t e c t i o n a l g o r i t h mo fv i o l aa n dj o n e s 1 2 8 ,a l s ot h ef a m o u sa l i g n m e n t a l g o r i t h m s :c o o t e s a s m 1 3 0 1a n d a a m 1 3 ui nt h i s t h e s i s l a t e r , a f t e ras u r v e yo nw i d e l yu s e df a c er e c o g n i t i o na l g o r i t h m s ,w ep r e s e n ta m e t h o df o rf a c er e c o g n i t i o nu s i n gb o o s t e dg a b o rf e a t u r eb a s e dc l a s s i f i e r s w e a k c l a s s i f i e r sa r ec o n s t r u c t e db a s e do nb o t hm a g n i t u d ea n dp h a s ef e a t u r e sd e r i v e df r o m g a b o rf i l t e r s t h em u l t i c l a s sp r o b l e mi st r a n s f o r m e di n t oat w o - c l a s so n ew i t hi n t r a - a n de x t r a c l a s sc l a s s i f i c a t i o n u s i n gi n t r a p e r s o n a l a n d e x t r a - p e r s o n a l d i f f e r e n c e i m a g e s ,a si n 5 5 ac a s c a d eo fs t r o n gc l a s s i f i e r s i sl e a r n e du s i n gb o o t s t r a p p e d n e g a t i v ee x a m p l e s ,s i m i l a r t ot h e w a y i nf a c ed e t e c t i o nf r a m e w o r k1 2 8 1 t h e c o m b i n a t i o no fc l a s s i f i e r sb a s e do nt w od i f f e r e n tt y p e so ff e a t u r e sp r o d u c e sb e t t e r r e s u l t st h a nu s i n ge i t h e rt y p e e x p e r i m e n t s0 1 1f e r e td a t a b a s es h o w g o o dr e s u l t s c o m p a r a b l et ot h eb e s to n er e p o r t e di nl i t e m t u r e 1 3 1 k e y w o r d s :f a c e d e t e c t i o n ,f a c i a l f e a t u r e s l o c a l i z a t i o n ,f a c er e c o g n i t i o n , a d a b o o s t ,g a b o rw a v e l e t 原创性声明 本人郑重声明:本人所呈交的学位论文,是在导师的指导下独立 进行研究所取得的成果。学位论文中凡引用他人已经发表或未发表的 成果、数据、观点等,均已明确注明出处。除文中已经注明引用的内 容外,不包含任何其他个人或集体己经发表或撰写过的科研成果。对 本文的研究成果做出重要贡献的个人和集体,均已在文中以明确方式 标明。 本声明的法律责任由本人承担。 论文作者签名:j 瞳日期:兰2 1 7 7 关于学位论文使用授权的声明 本人在导师指导下所完成的论文及相关的彤 务作品,知识产权归 属兰州人学,本人完全了解兰州大学有关保存、使用学位论文的规定, 同意学校保存或向国家有关部门或机构送交论文的纸质版和i 乜子版, 允鞠:沦文被奄阅和f m 砌;小人授权二州大学n j 以将小学位论文的个部 或部分内容编入有关数据库进行检索,口j _ 以采川任何复制t - 段保存和 汇编本学位沦文。本人离校后发表、使川学位论文或与该论文也接相 关的。产术i e :文或成果时,第一署名单位仍然为兰州大学。 保密论文在解密后心遵守此规定。 沦文作者签名:导师签名: 期: 人脸识别的算法研究及系统实现 1 1 引言 第一章绪论 人脸识别是近十年来在模式识别领域比较成功的应用之一,其最明显的标志是 出现了专门的人脸识别的会议,如a f g r ( a u t o m a t i cf a c ea n d g e s t u r e r e c o g n i t i o n ) 等和 标准的人脸图像库,女n o r l 人脸库“1 ,a r 人脸库。1 ,f e r e t 人脸库。1 ,y a l e 人脸库“1 , c m up i e 。1 等。与此同时,人脸识别技术已成为集计算机视觉、模式识别、计算机 图形学、图像处理、生理学、心理学、甚至人类的认知和神经学于一身的综合性课 题。这种多学科特点也给广大研究者带来了极大的难度。 除人脸识别外,现今的生物识别技术有很多种,诸如指纹识别、掌纹识别、虹 膜识别、手写体识别和声音识别等,如图1 1 。 图1 1 ,多种生物识别技术 与其他生物识别技术相比较,人脸识别具有以下特性: ( 1 ) 其它每种生物识别方法都需要一些人的配合动作,而人脸识别不需要被动 配合,可以自动用在隐蔽的场合,如公安部门的监控行动; 人脸识别的算法研究及系统实现 ( 2 ) 记录一个企图登录的人的生物记录时,只有人脸能更直观、更方便地核查 该人的身份; ( 3 ) 人脸库是国家相比指纹等最完整的身份资料。 再者,人脸识别的有关技术具有除了认证外其他的很多功用,如l i i s r a 和日本 的微软产品开发部共同合作的日文版o f f i c eo u t l o o k 的人像卡通绘画功能就用到了 人腧识别中用于特征定位的技术。 1 2 人脸识别的研究背景 人脸识别技术起源较早,参考文献 6 8 ,上世纪6 0 、7 0 年代就开始,由于受 到硬件条件和理论方法的限制,直到上世纪8 0 年代末,人脸识别仅仅限于实验室研 究。当时的方法比较直观和简单,主要是利用人脸的各特征点,如眼角、眉毛、嘴 角和鼻子,之间的距离作为特征进行识别,但由于这些特征检测的不稳定性和当时 的硬件和算法条件的局限性,所以系统的鲁棒性差。 真正的发展是在9 0 年代初,p e n t l a n o 。1 、k i r b y “”提出的基于主成分分析( p c a ) 的特征脸( e i g e n f a c e ) 的方法1 后,人脸识别技术才由单纯的科研转向实用,该 方法的提出是人脸识别技术领域的重大飞跃。此后的十几年,在入脸图像的特征提 取和识别方法上又有了不断的进步。在特征提取方面,从p c a 转向l d a “2 ”“3 ,i c a “, 小波“”等多种方法,从总体特征到总体与局部特征的综合,如文献 1 5 ;在识别方 法上从简单的最近邻到支持向量机( s v m ) “”和b o o s t i n g 方法“7 1 等机器学习方法。 虽然取得了很大的进展,但是人脸识别的性能受到光源位置和强度的变化,图 像平面外的偏转和俯仰,年龄的变化,表情的变化等多种因素的影响,仍然是一个 非常具有挑战性的研究课题。 测量人脸识别的主要性能指标除了识别率外还有:误识率( f a l s ea c c e p tr a t e , 人脸识别的算法研究及系统实现 f a r ) :这是将其他人误作指定人员的概率;拒识率( f a l s er e j e c tr a t e ,f r r ) :这 是将指定人员误作其它人员的概率。计算机在判别时采用的闽值不同,这两个指标 也不同。一般情况下,误识率f a r 随闽值的增大( 放宽条件) 而增大,拒识率f r r 随 闽值的增大而减小。因此,可以采用等错误率( e q u a le r r o rr a t e ,e r r ) 作为性能 指标,这是调节阅值,使得f a r 和f r r 两个指标相等时的f a r 或f r r 。 目前国内夕 研究人脸识别的方法层出不穷,根据人脸表征方式的不同,常用的 方法总体可分为以下四种:基于局部特征的方法、基于整体特征的方法、基于整体 特征与局部特征相结合的方法和基于三维可形变模型的方法。 1 基于局部特征的方法 比较具有代表性的有:几何特征的方法、弹性图匹配、隐马尔可夫模型( h m m ) 等。 基于几何特征的方法是通过人脸面部拓扑结构几何关系的先验知识,利用基于 结构的方法在知识的层次上提取人脸面部主要器官特征,将人脸用一组几何特征矢 量表示,识别归结为特征矢量之间的匹配,人脸识别领域最早的研究工作之一就是 w w b l e d s o e 用几何特征建立的一个半自动的人脸识别系统“,可变形模板法“”是 对此方法的重要改进。基于几何特征的识别方法具有存储量小、对光照不敏感等优 点。这种方法同样存在一些问题:如从图像中抽取稳定的特征比较困难;对强烈表 情变化和姿态变化鲁棒性较差;造成部分信息丢失,适合于粗分类等等,通常需要 和其他算法结合才能有比较好的效果。 弹性图匹配方法是一种基于动态链接结构的方法,见文献 1 4 。在人脸图像上 设置一些关键节点,每个节点的特征用该节点处的多尺度g a b o r 特征描述,它对于 光照、尺寸、角度具有一定的不变性,各节点之间的连接关系用几何距离表示,从 而构成基于二维拓扑图的人脸描述。对于一幅输入的待识别的人脸图像,根据训练 得到的模板来匹配到关键点,再与库中的图像比较各节点和连接之间的相似性来进 人脸识别的算法研究及系统实现 行人脸识别。 隐马尔可夫模型( h m m ) “”是用于描述信号统计特征的一组统计模型。删m 使用 马尔可夫链来模拟信号统计特征的变化,而这种变化是间接的通过观察序列来描述 的,因此,隐马尔可夫过程是一个双重的随机过程。其中之一是马尔可夫链,这是 基本随机过程,它描述状态的转移;另一个随机过程描述状态和观测值之间的统计 对应关系。这样,站在观察者的角度,只能看到观察值,不像m a r k e r 链模型中的观 察值和状态对应,因此,不能直接看到状态,而是通过一个随机过程去感知状态的 存在及其特性。因而称之为“隐”m a r k o v 模型,即h m m 。隐马尔可夫模型很早就应 用在了语音识别中”,在人脸识别中也有一些运用“。 2 基于整体特征的方法 比较具有代表性的有:特征脸的方法、线性判别分析方法。 基于主成分分析的方法( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a ) 。它是通过 k l 变换得到从高维图像空问到低维子空间的投影矩阵,如文献 1 0 ,该变换是一种 最优正交变换。如果按照图像阵列的方式排列构成低维子空间的正交基,就会 | 导到 类似人脸的图像。因此这些正交基又被称作“特征脸”1 ,这种方法被称作基于特 征脸的方法,又称“子空间方法”。b s c h o l k o p f 等人将核函数方法引入主成分分 析的方法应用于人脸识别1 ,即核函数主成分分析的方法。 线性判别分析( l i n e a rd i s c r i m i n a n ta n a l y s i s ,l d a ) “2 3 ,是模式识别领 域里非常有效的降维手段之一。它通过使类间离散度与总类内离散度的比值最大化 达到降维、分类的目的。p e t e rn b e l h u m e r u 在文献 2 3 中将此方法应用于人脸识 别,在利用p c a 将人脸图像映射到特征脸子空间的基础上,再应用线性判别分析映 射到“f is h e r 脸”( f i s h e rf a c e ) 子空问,然后利用最近邻欧式距离进行分类,取 得了比较好的结果。 3 基于整体特征与局部特征相结合的方法 人脸识别的算划、研究发系统实现 a l e xp e n t l a n d 等人采用整体特征脸与局部化的策略,如文献 2 4 ,对人脸的不 同器官分别做k l 变换,得到“特征眼”、“特征鼻”、“特征嘴”等,通过组合这些局 部分类与整体特征脸的结果,提高了识别率。y u c h u nf a n g ,t i e n i ut a n 等人在文献 1 5 中通过融合局部与全局的特征取得了较好的效果。z h a oe ta 1 在文献 2 5 中关 于人脸识别的特征提取的总结中提到,整体特征与局部特征对人脸识别率有不同的 贡献,将它们进行融合是一个比较有效的方法,和值得继续研究的方向。 4 基于三维可形变模型的方法 b l a n z 和v e t t e r 在文献 2 6 中提出了一种基于人脸三维可形变模型( 3 d m o r p h a b l em o d e l ) 的识别算法。这个算法的目的在于通过利用人脸的三维模型和计 算机图形学中的投影、光照方法,使描述物体的内在形状和纹理的变量完全独立于 描述外在因素的参数,从而提高多姿态、多光照环境下人脸识别的准确率,如文献 2 7 。任意给定一幅人脸图像,该算法可以自动估计出这个人脸对应的三维形状、 纹理,以及三维成像场景的参数。在这一框架下,姿态和光照都是非常容易处理的, 姿态和光照可以通过同一个成像模型来解决。 除此之外,最近比较流行的s v m s “,b o o s t i n g “7 1 等分类器方法比较独立于特 征的形式,既可以运用到整体特征上又可以运用到局部特征上。 1 3 自动人脸识别系统的组成 人脸识别实现有多种分类方法,但是作为一个自动人脸识别系统步骤大致相 同,如图1 2 所示,共分为两大部分: ( 1 ) 人脸的定位 定位又分为,人脸检测和人脸特征点定位两步。 人脸检测的目的是判断任意一幅给定的图像中是否含有人脸:如果有,则给出 每个人脸的位置和尺寸。人脸检测的实质是一个两类的模式分类问题将一幅图 人脸识别的算法研究及系统实现 像划分为人脸区域和非人脸区域,搜索出输入图像中的人脸数量和位置;由于不可 能事先知道入脸的数量、位置、姿态等信息,所以搜索过程是一个多尺度、多姿态 的过程。目前在这方面已有了突破性的进展,v i o l a ”首先提出了基于积分图像的 h a r r 小波特征提取和基于a d a b o o s t 的特征选择和识别方法,s t a n “”等人进步发 展了该方法,实现了实时的、多姿态的人脸检测。 人脸的图像实际上是三维目标在二维平面投影的结果,因此不可避免的丢失了 三维信息,其直接结果就是同一人在不同姿态情况下的图像变化较大,而且由于人 脸距镜头的远近不同,造成人脸图像的不同尺度,因此只有通过几何校正把面部器 官和人脸图像都归一化到一个标准模板下才能进行比较。目前比较有效和通用的几 何归一化方法是通过c o o t e s 的a s mm 1 和a a m 。“方法得到人脸模型的参数,来计算 出人脸上特征点的位置信息进行人脸图像的归一化。 ( 2 ) 人脸识别 归一化后的人脸图像可直接利用二维特征提取方法,如g a b o r 、f f t ,d c t 等, 或按行或按列展开形成高维向量,然后通过p c a 、i c a 等方法进行特征提取。特征提 取后,如果归一化工作完成较好,甚至可以跳过特征提取,直接地简单的相关性分 析就可以非常准确的识别人脸。当然,目前较新的s v m 、b o o s t i n g 等方法要比传统 识别方法要好。 人脸定位( 检人脸识别 输入图像人脸图像输出结果 测与特征点定( 特征提取 位)与选择) 图1 2 ,人脸识别的步骤 像所有的模式识别系统一样,人脸识别系统也分为训练和测试两个阶段。训练 阶段的主要作用是分类器构造及建立库中每个人的人脸模型,测试阶段则是把检测 人脸识别的算法研究及系统实现 到的人脸同数据库内的模型进行匹配,以确定该人脸是否属于训练库中的人脸,如 果是则判断是属于哪个人脸模型。 识别任务分为两类:验证和识别。 验证是一对一的匹配,其输出是逻辑量:是或否;识别则是一对多的匹配,即 判断一个输入图像是属于数据库中的哪一个人。 1 4 本文的工作 本论文从实现一个人脸自动识别系统的角度介绍了当前性能比较优越的人脸检 测、面部特征点定位和人脸识别的算法,着重讨论了人脸识别的主要算法,并提出 了b o o s t e dg a b o r 小波特征弱分类器作用于人脸识别的方法。我们的方法利用把人 脸图像分为类内对( i n t r a - p e r s o n a lp a i r ) 和类间对( e x t r a - p e r s o n a lp a i r ) 的思想,将人脸识 别这样一个多类问题转化为两类问题。弱分类器在g a b o r 小波滤波结果的模和相角 的基础上构造而成,并通过这两种特征的融合达到了更好的识别效果。通过 a d a b o o s t 学习的方法来作特征的选取,并针对类问样本过多,无法一次全部投入训 练的问题,本文采用了分类器的级联结构来解决,我们的方法与在f e r e t 库上的至 今最好的结果相一致。并且针对其它的各种不同的可能做了一系列对比实验分析。 论文的结构是这样的:第一章( 本章) 是引言部分,主要介绍人脸识别的研究 背景、人脸自动识别系统的组成以及本文的研究内容。第二章介绍了统计学习理论 及在人脸识别领域取得了很好运用的s v m 与b o o s t i n g 方法,并对他们作了对比分析。 第三章介绍了自动人脸识别前端处理的人脸检测与特征点定位。第四章提出了基于 a d a b o o s t 做g a b o r d 、波特征选择的人脸识别方法。第五章总结了本文的研究内容,并 对进一步的研究工作进行了展望。 人脸识别的算法研究发系统实现 第二章统计学习理论与b o o s t i n g 方法 2 1 引言 本章介绍了统计学习理论及统计学习理论中两个非常重要的概念:v c 维与结构 风险最小化,同时介绍了在这一理论基础上发展起来的两个通用的学习方法支 持向量机( s u p p o r tv e c t o rm a c h i n e 或s v m ) 和b o o s t i n g 方法,并从统计学习理论 的角度对这两种方法作了对比分析。 2 2 统计学习理论 2 2 1 背景知识 以往机器学习理论的核心是经验风险最小化原则( e r m ) 。如果以大量的样本进 行训练,并且能找到一个相当逼近这些样本的函数,那么可望它对测试样本做出较 准确的预测。这反映了大样本统计学对渐进特性的依赖。6 0 年代的很多学者认为使 学习机器具有好的推广能力的唯一因素就是使它在训练集上的误差最小,因此e r m 原则似乎是不证自明的。但是事实上,如果学习机器能力( c a p a c i t y ) 过强,能够 无误差地适应任意的训练样本,这在实践中往往在测试样本上得不到好的效果。 与传统统计学相比,统计学习理论( s t a t i s t i c a ll e a r n i n gt h e o r y 或s l t ) 是 一种专门研究小样本情况下机器学习规律的理论。该理论针对的核心问题是寻找一 种归纳原则以实现最小化风险泛函,从而实现最佳的推广能力。v a p n i k 等人从六、 七十年代开始致力于此方面研究,到九十年代中期,随着其理论的不断发展和成熟, 也由于神经网络等学习方法在理论上缺乏实质性进展,统计学习理论开始受到越来 越广泛的重视。 统计学习理论的一个核心概念就是v c 维( v cd i m e n s i o n ) 概念,它是描述函数集 人脸识别的算法研究及系统实现 或学习机器的复杂性或者说是学习能力( c a p a c i t yo f t h em a c h i n e ) 的一个重要指 标,在此概念基础上发展出了一系列关于统计学习的一致性( c o n s i s t e n c y ) 、收敛速 度、推广性能( g e n e r a l i z a t i o np e r f o r m a n c e ) 等的重要结论。 统计学习理论是建立在一套较坚实的理论基础之上的,为解决有限样本学习问 题提供了一个统一的框架。它能将很多现有方法纳入其中,有望帮助解决许多原来 难以解决的问题、( 比如神经网络结构选择问题、局部极小点问题等) ;同时,这一理 论基础上发展起来的通用的学习方法支持向量机( s u p p o r tv e c t o rm a c h i n e 或 s v m ) 和b o o s t i n g ,已初步表现出很多优于已有方法的性能。 2 2 2v c 维与结构风险最小化 学习系统的容量对其泛化能力有重要影响1 。低容量学习系统只需要较小的训 练集,高容量学习系统则需要较大的训练集,但其所获的解将优于前者。对给定训 练集来说,高容量学习系统的训练集误差和测试集误差之间的差别将大于低容量学 习系统。v a p n i k ”2 1 指出,对学习系统来说,训练集误差与测试集误差之间的差别 是训练集规模的函数,该函数可以由学习系统的v c 维表征。换言之,v c 维表征了 学习系统的容量。 v c 维可作为函数族f 复杂度的度量,它是一个自然数,其值有可能为无穷大, 它表示无论以何种组合方式出现均可被函数族,j 下确划分为两类的向量个数的最 大值。对于实函数族,可定义相应的指示函数族,该指示函数族的v c 维即为原实函 数族的v c 维。 为便于讨论,我们针对典型的二元模式识别问题进行分析。设给定训练集为 融,y 。1 0 :,y :) g 。,y 。) ,其中x ,矗”,y o ,l 。显然,y 为二值期望输出。再假设 训练样本与测试样本均满足样本空间的实际概率分布p g ,y ) 。 对基于统计的学习方法来说,学习系统可以由一族二值函数扩g ,口l 口a a 征,其中参数口可以唯一确定函数,) ,a 为口所有可能的取值集合。因此, 0 人脸识别的算法研究及系统实现 ,g ,口l 口人 的v c 维也表征了该学习系统的复杂度,即学习系统的最大学习能力, 我们称其为该学习系统的v c 维。学习的目的就是通过选择一个参数o c t , 使得学习 系统的输出厂0 ,口) 与期望输出y 之间的误差概率最小化,即出错率最小化。出错率 也称为期望风险( e x p e c t e dr i s k ) ,如式( 2 1 ) 所示; r ( 盯) = b 陟一,( x ,口) i d p ( x ,j ,) ( 2 1 ) 其中p ( x ,y ) 为样本空间的实际概率分布。由于p ( x ,y ) 通常是未知的,因此无法 直接计算r 心) a 但是,对给定的训练集,其经验风险( e m p i r i c a lr i s k ) r ( 岱) 却 是确定的,如式( 2 2 ) 所示: ( 咖去鼽川x i ,口) ( 2 2 ) 其中g 。,y 。) 为训练样本,行为训练集中样本数,即训练集规模。由数理统计中 的大数定理可知,随着训练集规模的扩大,皿。( 口) 将逐渐收敛于r 噼) 。 基于统计的学习方法大多建立在经验风险最小化原贝i j ( p r i n c i p l eo fe m p i r i c a l r i s k m i n i m i z a t i o n ) 基础上,其思想就是利用经验风险r 一位) 代替期望风险r ) , 用使r 。( 盯) 最小的g ,口) 来近似使r ) 最小的,g ,口) 。这类方法有一个基本的假 设,即如果r e m p ) 收敛于r 缸) ,则皿。 ) 的最小值收敛于月 ) 的最小值。v a p n i k 与c h e r v o n e n k i s 。”证明,该假设成立的充要条件是函数族扩0 ,口l 口a 的v c 维为 有限值。 v a p n i k m l 还证明,期望风险r 位) 满足一个上界,即任取叩满足0 ,7 1 ,下列 边界以概率1 一玎成立: 月( 口) d ,则h 2 是比啊更好的划分超平面,因为其分类鲁棒性 更好。 图2 2 不同的划分超平面及其边际 s c h a p ir e 等人“7 1 认为,在训练误差降为零后,b o o s t i n g 仍会改善边际,即继 续寻找边际更大的划分超平面,这就使得分类可靠性得到提高,从而使泛化误差得 以继续降低。迸一步,s c h a p i r e 等人“7 1 还具体地给出了泛化误差的上限: p “r m a r g i n ( x , y ) _ o + 6 c 岳, 亿8 , 设训练样本为口个,学习算法的v c 维为d 训练轮数为力其中玉表示对可 人脸识别的算法研究发系统实现 练集的经验概率。从式( 2 8 ) 可以看出,b o o s t i n g 的泛化误差上限与训练轮数无关, s c h a p i r e “”的一些实验也证实了这一点。 f r e u n d 和s c h a p i r e 。”以a d a b o o s t 为代表,对b o o s t i n g 进行了分析,并证明 该方法产生的最终预测函数的训练误差满足式( 2 9 ) ,其中r t 为选得的弱分类器髓 的训练误差,= 1 2 一e t 。 兀1 2 厕1 = 兀l 一4 开e x p 力) ( 2 9 ) 从式( 2 9 ) 可以看出,只要学习算法略好于随机猜测,训练误差将随f 以指数 级下降。在此基础上,f r e u n d 和s c h a p i r e ”用v c 维对b o o s t i n g 的泛化误差进行 了分析,则其泛化误差上限如式2 1 所示: i = r ( 坼m ) + 6 ( 昂 ( 2 1 0 ) 式( 2 1 0 ) 表明,若训练轮数过多,b o o s t i n g 将发生过配。但大量试验表明, b o o s t i n g 即使训练几千轮后仍不会发生过配现象,而且其泛化误差在训练误差已降 到零后仍会继续降低。1 9 9 8 年g r o v e 和s c h u r m a n s “”指出,s e h a p i r e 等人的边际假说 并不能真正解释b o o s t i n g 成功的原因。为证明这一点,他在a d a b o o s t 的基础上设计 t l p b o o s t 算法,通过线性规划来调整各预测函数的权重,从而增大最小边际。g r o v e 指出,如果边际假说成立,那么l p b o o s t 算法产生的学习系统泛化误差应比较小,然 而实验表明,该学习系统的泛化误差并不小,也就是说,边际的增大并不必然导致 泛化误差的减小,有时甚至造成泛化误差增大。因此,关于b o o s t i n g 为什么有效, 目前仍然没有一个被广泛接受的理论解释。关于a d a b o o s t 算法更详细的理论说明, 请参阅文献 3 9 。鉴于a d a b o o s t 在实践中取得的良好效果,该方法仍然引起了广泛 的关注。 2 4b o o s t i n g 方法与支持向量机 1 6 人脸识别的算法研究及系统实现 2 4 1 支持向量机 s v m 算法的基本思想是根据v a p n i k 提出的s r m 原理,通过最大化分类间隔或边缘 ( m a r g i n ) 尽量提高学习机的泛化( g e n e r a l i z a t i o n ) 性能“。这使得s v m 方法比 基于经验风险最小化( e m p i r i c a l r is km i n i m iz a t i o np r i n c i p l e ,e r i d ) 的a n n 等 方法具有更好的泛化能力。运用到人脸识别中也取得了很好的效果,如文献 1 6 5 i 。 对于线性可分的两类问题( 其对应为线性s v m ) ,目标是产生一个分类器能够对 未观察到的例子进行有效分类。假定训练数据g ,y 。) g 。,y 。) ,x r “,y + 1 ,一1 ) 可 以被一个超平面( w x ) + b = 0 没有错误地分开,如图2 2 ,按照直观的推测,与两类 样本点距离最大( 称为“边际”( m a r g i n ) 最大) 的分类超平面会获得最佳的推广能 力( 也就是最为稳妥地描述了两种样本的界限) 。最优超平面将由离它最近的少数样 本点( 称为支持向量) 决定,而与其它样本无关。我们用如下形式描述与样本间隔 为d 的分类超平面: ( w x ) + b = 0 ,( 2 1 1 ) y = l ,若( w x ) + 6 d( 2 1 2 ) y = - l ,若( w - x ) + b - d( 2 1 3 ) 设线性判别函数的一般形式为: g ( x ) = ( w x ) + 6 ( 2 1 4 ) 我们将判别函数进行归一化,使两类所有样本都满足溶仁) f 1 ,即使离分类面 最近的样本的旧( 刮= 1 ,这样分类间隔就等于2 1 1 - 1 1 ,因此使间隔最大等价于使i | w | | ( 或i m 2 ) 最小;而要求分类线对所有样本正确分类,就是要求它满足: y , ( w x ,) + 6 】一1 0 , i = 1 , 2 ,胛 ( 2 1 5 ) 因此,满足上述条件且使l l w l j 最小的分类面就是最优分类面。 i7 人脸识别的算法研究及系统实现 那么5 v m 的这种简单直观的原理和s 原则又有着怎样的内在联系呢? v a d n i k 给出了一个关于分类超平面v c 维上界的定理“:在r l 维空间中,设m 个样本都在 一个半径为r 超球范围内,则满足条件9 圳2 c 的规范化超平面形成的分类面的v c 维h 有下面的界: h 0 对应的样本点为支持向量。 对分类面是非线性函数的情况,理论上应将输入空间通过某种非线性映射映射 到一个高维特征空间,在这个空间中存在线性的分类规则,可以构造线性的最优分 类超平面。但是这种方法带来了两个问题:一是概念上的问题:怎样在如此高维的 空间中找到一个推广性好的分类超平面? 二是技术上的问题:如何处理高维空间中 的计算问题? 因此这种思路在一般情况下不易实现。但是注意到,在上面的对偶问 人脸识别的算法研究及系统实现 题中,( 2 1 8 ) 只涉及训练样本之间的内积运算( x ,x ,) 。设有非线性映射巾:r 4 斗 将输入空间的样本映射到高维( 可能是无穷维) 的特征空间h 中。此时最优化问题 为: m i n i m f z p s t 圭l l w l l 2( 2 1 9 ) y , ( o ( x 1 ) w ) 一1 0 i = 1 , 2 ,m 当在特征空间h 中构造最优超平面时,训练算法仅使用空间中的点积,即 o ( x ,) 中( 毛) ,而没有单独的o ( x ) 出现。因此,如果能够找到一个函数世使得 k ( x i ,一) = 中( 鼍) 中( 毛) ,这样,在高维空间实际上只需进行内积运算,而这种内积运 算是可以用原空间中的函数实现的,我们甚至没有必要知道变换中的形式。根据泛 函的有关理论,只要一种核函数k ( 五,t ) 满足m e r c e r 条件,它就对应某一变换空间 中的内积。 因此,在最优分类面中采用适当的内积函数k ( t ,t ) 就可以实现某一非线性变 换后的线性分类,而计算复杂度却没有增加,此时目标函数( 2 1 8 ) 变为 q ( 口) = a 。一去口,y ,y ,k ( x i , x j ) f = 1 r ,i 而相应的分类函数也变为 ,( x ) = s g n ( e z y ,足( 薯,x ) + 6 ) , ( 2 2 0 ) ( 2 2 1 ) 因此,使用非线性s v m 进行数据集分类工作时,首先通过预先选定的非线性映 射将输入空间映射到高维特征空间,使得在高维特征空间中有可能对训练数据实现 超平面的分割,避免了在原输入空间中进行非线性曲面分割计算。 2 4 2b o o s t i n g 方法与支持向量机的联系 b o o s t i n g 通过将其重点放在那些有小边际( m a r g i n s ) 的样本上,也就是那些 较难的样本,来最大化分类面的边际;s v m 也是一种边际( m a r g i i s ) 最大化的算法, 边际( m a r g i i s ) 最大化也就建立了他们之间的联系”“。 人脸识别的算法研究及系统实现 假设我们有n 个样本属于特征空间f , k ,y 。) 笔,其中g 。,y 。) f x i - l ,1 。现 在我们希望在空间f 中通过一个经过原点,且处决于向量w 的超平面4 来将训练样 本分类彳= & i ( e w ) = o 。则样本g 。,儿) 对于平面a 的一范数边际定义为 拍) = = 掣, ( 2 2 2 ) 下标p l , o o 】表明了标准化,的范数( 默认值p = 1 ) 。正的边际表明这个样本 被正确地分类。平面彳的边际似) 则被定义成: p 9w ) = r a i n 。群( w ) , 拧= 1 n ( 2 2 3 ) 要最大化平面4 的边际也就是要解决下问题: 峄p 9 m ) = m a x r a 。i n 。y n i x n w ) , ( 2 2 4 ) 不失一般性,我们设m l ,= 1 ,则( 2 2 4 ) 可以转化为以下的凸优化问题: m a x 口 口w 擘w ) 肛协一一 ( 2 2 5 ) 。= 1 怕“驯 不难发现如果p = 1 ,w ,0 ,我们得到一个线性优化。并且从这个式子我们 可以发现,在式( 2 2 5 ) 中只有某些样本真正在起着约束作用。这些困难的起着作 用的样本也就是线性s v m s 中的支持向量。 考虑两种特殊的情况:p = l 和p = 2 : b o o s t i n g ( p = 1 ) ,在b o o s t i n g 中,空问f 是被一些弱分类器来展开的在 弱分类器的候选空间中我们可以通过学习得到一些弱分类器,通过这些弱分类器将 输入空间x 映射到“特征”空间f : 人脸识别的算法研究及系统实现 中:x _ ih i b x 在这里样本的边际为: i ,纠7 :x 寸, j ( 2 2 6 ) 删= 眢= 絮笋= 连掣 弦z z , 非线性支持向量机( p = 2 ) ,在这罩特征空间f 由计算内积的m e r c e rk e r n e l k ( x ,y ) “”定义。对每一个这样的核,我们有映射o :x _ f ,使得对所有的x ,y x 有七g ,) ,) = 细g ) ,中) ) 。在这里我们可以在f 特征空间内用1 2 - 范数来标准化,用欧 氏距离来度量映射后的样本到超平面的距离。 p x w ) = 产 亿z s , 这样s v m 与b o o s t i n g 方法就有了一个统一的形式。在应用中,比较关键的点 就是b o o s t i n g 可以运用现存的许多算法作为弱分类规则,而且易于实现,然而对于 支持向量机在一定程度上受核函数选取的影响。所以对于一个实际问题而言,需要 根据实际的数据模型选择合适的核函数从而构造s v m 算法。目前比较成熟的核函数 及其参数的选择都是人为的,根据经验来选取的,带有一定的随意性。 人脸识别的算法聊f 究及系统实现 3 1 引言 第三章人脸检测与特征点定位 本章介绍了p a u lv i o l a 和m i c h a e lj j o n e s 提出的实时人脸检测方法“。该 算法借助于积分图像来快速计算矩形特征;并利用a d a b o o s t 算法训练和构造分类 器,h d a b o o s t 算法通过线性组合挑选出的弱分类器得到强分类器;分类器采用级联 结构,用简单的分类器较早地排除图像上那些非常不像人脸的背景区域,把更复杂 的计算用在判决那些和人脸更相似的非人脸区域上,在保证较高的检测准确率的同 时,大大提高了检测的速度。 本章还介绍了两种具有代表性的人脸对准( f a c ea i g n m e n t ) 的方法:a s m ( a c t i v es h a p em o d e l s ) 。”和a a m ( a c t l v ea p p e a r a n c eg o d e s ) ”“,通过人脸对准 可以得到人脸模型的参数,通过这些参数就可以计算出人脸上特征点的位置信息, 运用在自动人脸识别系统中,对检测得到的人脸图像归一化,使参加识别的人脸图 像处于同一个平台上。 3 2 人脸检测 3 2 1 人脸检测概述 人脸检测( f a c ed e t e c t i o n ) 是指在输入图像中确定是否有人脸,如果有则确 定所有人脸的位置与大小。人脸检测系统的输入是可能包含人脸的图像,输出是关 于图像中是否存在人脸,以及人脸的数目、位置、尺度、位姿等信息的参数化描述。 实际上,人脸检测问题被转化为统计模式识别的二分类问题。通常的人脸检测过程 为:将人脸区域看作一类模式,非人脸区域看作另一类模式,使用大量的“人脸” 与“非人脸”样本训练、构造分类器,通过判别图像中所有可能区域属于哪类模式 人脸识别的算法研究及系统实现 的方法实现人脸的检测。但由于人脸
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 城轨专业考试真题及答案
- 医师资格考试(实践技能)复习题库及答案(2025年广东清远市)
- 宁德市尘肺医师鉴定考试(职业性尘肺病及其他呼吸系统疾病)题库及答案(2025年)
- 脂肪酸酰化及酯化操作工晋升考核试卷及答案
- 稀土材料生产工成本预算考核试卷及答案
- 中考排球考试题目及答案
- 电火花线切割机床操作工技能操作考核试卷及答案
- 2025年高考试题及参考答案(上海卷)
- 医师资格考试(实践技能)复习题库及答案(定西2025年)
- 2025年北京市职业病诊断医师资格考试职业性化学中毒复习题及答案
- 【《企业人才招聘存在的问题与对策》5200字(论文)】
- 危险方法危害公共安全罪认定标准研究
- 我国养老状况课件
- 心脏支架术后康复课件
- 2025年体育产业成本控制与赛事运营研究报告
- 能源问题面试题库及答案
- 国庆期间保安安全培训课件
- 2025年征兵心理测试题库及答案
- 监控设备迁移合同协议书
- 《老年服务礼仪与沟通技巧》全套教学课件
- 工程试验检测知识培训课件
评论
0/150
提交评论