(信号与信息处理专业论文)基于gabor特征的二次分类法在人脸识别中的应用.pdf_第1页
(信号与信息处理专业论文)基于gabor特征的二次分类法在人脸识别中的应用.pdf_第2页
(信号与信息处理专业论文)基于gabor特征的二次分类法在人脸识别中的应用.pdf_第3页
(信号与信息处理专业论文)基于gabor特征的二次分类法在人脸识别中的应用.pdf_第4页
(信号与信息处理专业论文)基于gabor特征的二次分类法在人脸识别中的应用.pdf_第5页
已阅读5页,还剩47页未读 继续免费阅读

(信号与信息处理专业论文)基于gabor特征的二次分类法在人脸识别中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大连理工大学硕士学位论文 摘要 人脸识别是模式识别和图像处理领域最前沿的研究课题之一,由于其在司法、公安、 安全等领域有着广泛的应用前景,近年来人脸识别受到了广泛的关注。 人脸识别问题涵盖了计算机视觉、神经网络、数字图像处理和模式识别等众多学科, 它主要分为三个部分:人脸检测、特征提取和分类器的设计,本文主要研究特征提取和 分类器设计两个部分,特征提取是从人脸图像中提取可以用来分类的信息;而分类器的 设计部分是利用提取的特征进行识别分类。 本文提出一种基于g a b o r 特征的二次分类方法,在该方法中对于特征提取部分,采 用的是g a b o r 特征;对于分类器部分,采用了结合仿生模式识别与纠错s v m 的二次分 类器。本文做了大量的仿真实验,在特征提取部分将g a b o r 特征与主成分分析法和f i s h e r 脸方法进行对比,分类器部分与最近邻、仿生模式识别、纠错s v m 进行比较,二维g a b o r 函数可以较准确的描述人脑视觉皮层简单细胞的感受野;二次分类器将基于仿生模式识 别理论的超椭球神经网络方法与具有纠错能力的s v m 方法结合起来,首先使用超椭球 神经网络进行第一次分类得到中间结果,再将拒识、多识样本放入具有纠错能力的s v m 中进行二次分类。这种方法兼具仿生模式识别和纠错s v m 的优点,并可以克服对未训 练样本的误识率高的问题,同时也具备纠错s v m 方法的纠错能力。因而将g a b o r 特征 与二次分类器相结合具有更好的分类效果。在c a m b r i d g eo r l ,y a l e 和a r 太阳镜人脸 子库,a r 围脖人脸子库的仿真实验结果表明,以g a b o r 特征为输入矢量,应用二次分 类方法进行图像识别,正确识别率分别达到了9 9 7 5 、9 9 0 0 1 、9 7 9 、9 7 6 2 。 关键词:g a b o r 特征;二次分类器;仿生模式识别;纠错s v m 基于g a b o r 特征的二次分类法在人脸识别中的应用 g a b o rf e a t u r eb a s e dt w o - p a s sc l a s s i f i c a t i o nm e t h o df o rf a c er e c o g n i t i o n a b s t r a c t f a c er e c o g n i t i o ni so n eo f t h em o s tt o u g h e s tp r o b l e m si np a t t e r nr e c o g n i t i o na n di m a g e e r o c e s s i n gf i e l d , b u tb e c a u s ei t sw i d er a n g eo fa p p l i c a t i o n si nl a w ,c u s t o m s ,s e c u r i t y , a n ds o o n , s of a c er e c o g n i t i o na t t r a c t sm o l ea n dn l o r er e s e a r c hg r o u p sa n dc o m p a n i e s m a n ys u b j e c t ss u c h 瑟c o m p u t e rv i s i o n , n e u r a ln e t w o r k , i m a g ep r o c e s s i n ga n dp a t t e r n r e c o g n i t i o na l ei n c l u d e di n t h ep r o b l e m so f f a c er e c o g n i t i o n t h e r ea r ct h r e ep a r t so f t h ef a c e r e c o g n i t i o ns y s t e m :f a c ed e t e c t i o n , f e a t u r ee x t r a c t i o na n dc l a s s i f i e rd e s i g n t 1 1 i sp a p e rf o c u s e s o nf e a t u r ee x t r a c t i o na n dc l a s s i f i e rd e s i g n f e a t u r ee x t r a c t i o ni st oe x t r a c tu s e f u li n f o r m a t i o n f o rc l a s s i f i c a t i o nf r o mf a c ei m a g e s ;w h i l ep a t t e r nr e c o g n i t i o ni st oc l a s s i 每t h ef e a t u r e st h a t a ( c 拜略t e d t h i sp a p e rp r o p o s ean o v e la p p r o a c hn a m e dg a b o rf e a t u r eb a s e dt w o - p a s sc l a s s i f i e r :f o r t h ef e a t u r ee x l r a c t i o np a r t , g a b o rf e a t u r e 玳u s e d ;f o rt h ec l a s s i f i e rd e s i g np a r t , t w o - p a s s c l a s s i f i c a t i o nm e t h o dw i t hb i o m i m e t i cp a t t e r nr e c o g n i t i o na n de r r o rc o r r e c t i n gs v m si s u s e d w ed oal o to fe x p e r i m e n t s f o rf e a t u r ee x t r a c t i o np a r t , g a b o rf e a t u r ew a sc o m p a r e d w i t hp c aa n df i s h e r f a c e ;f o rt h ec l a s s i f i e rp a r t , t w o - p a s sc l a s s i f i e rw a sc o m p a r e dw i t ht h e n e a r e s tn e i g h b o r , b i o m i m e t i cp a t t e r nr e c o g n i t i o na n de r r o r - c o r r e c t i n gs v m s g a b o rw a v e l e t s , w h o s ek e r n e l sa r es i m i l a rt ot h er e s p o n s eo ft h et w o - d i m e n s i o n a lr e c e p t i v ef i e l dp r o f i l e so f t h em a m m a l i a ns i m p l ec o r t i c a lc e l l ,e x h i b i tt h ed e s i r a b l ec h a r a c t e r i s t i c so f s p a t i a ll o c a l i z a t i o n , o r i a n t a t i o ns e l e c t i v i t y , a n ds p a t i a lf r e q u e n c ys e l e c t i v i t y ;t w o - p a s sc l a s s i f i e rc o m b i n e st h e h e n nm e t h o db a s e do nt h eb i o m i m c t i cp a t t e r nr e c o g n i t i o nt h e o r ya n dt h es v mm e t h o dw i t h a r l o l c o r r e c t i o na b u i t y 1 1 圮h e n ni su s e df o rt h ef i r s tc l a s s i f i c a t i o nt og e tt h ei n t e r m e d i a t e r e s u l t , a n dt h es v mw i t h 螂fc o r r e c t i o nm e t h o di su s e dt os o l v et h ei n t e r m e d i a t er e s u l ta n d a l lt h et r a i n i n gs a m p l e sf o rt h es e c o n dc l a s s i f i c a t i o n i th a st h ea d v a n t a g e so f b o t hb i o m i m e t i c p a t t e r nr e c o g n i t i o nm e t h o da n dt h es v m m e t h o dw i t he r r o rc o r r e c t i o na b i l i t y , t h ef i r s ti st h a t i tc 缸a v o i dt h eh i g hf e l s er e c o g n i t i o nr a t e , a n dt h es e c o n di st h a ti sh a st h ee f r 甜c o r r e c t i o n a b i l i t y , s oi to u t p e r f o r m se i t h e ro ft h et w om e t h o d s e x p e r i m e n t a lr e s u l t sb a s e do nt h e c a m b r i d g eo r ld a m b a s e ,t h ey a l ed a t a b a s e ,t h ea rs u n g l a s ss u b - d a t a b a s e ,a n dt h ea r s c a r f s u b - d a t a b a s es h o ww i t ht h eo a b o rf e a m eb a s e dt w o p a s sc l a s s i f i e r , t h er e c o g n i t i o nr a t ei s i m p r o v e dt o9 9 7 5 9 9 0 0 1 ,9 7 9 ,9 7 6 2 k e yw o r d s :g a b o rf e a t u r e ;t w o - p a s sc l a s s i f i e r ;b p r ;e r r o r - c o r r e c t i n gs v m i i 独创性说明 作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究工 作及取得研究成果尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得大连理 工大学或者其他单位的学位或证书所使用过的材料。与我一同工作的同志 对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。 大连理工大学硕士研究生学位论文 大连理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位 论文版权使用规定”,同意大连理工大学保留并向国家有关部门或机构送 交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连理 工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也 可采用影印、缩印或扫描等复制手段保存和汇编学位论文。 作者签名: 盘。垫b 导师签名:盘燮蓝2 11 年n 月丝日 大连理工大学硕士学位论文 1绪论 1 1 研究背景与意义 身份认证在人类社会生活中自古有之,无论是司法,安全,商业交易中,身份认证都是 极其重要的。如今,随着全球范围内电子商务的迅速兴起,人们可以通过i n t e r i o r 等开 放式网络进行在线电子交易等商务活动。同时,由于网络上存在着大量敏感的个人、军 队、政府的信息,这些信息只有得到授权的人才能进行访问,因此网络安全成为网络发 展的关键问题,而身份认证作为网络安全的一个重要方面越来越受到人们的重视e l j 传 统的身份认证方法( 如使用身份证、护照、智能卡、密码、口令等) 存在携带不便、容 易伪造、遗失、因使用过多或不当而损坏或不可读、密码易被破解等诸多问题,其安全 性、可靠性差。 随着计算机科学,计算机视觉及人工智能的发展,就出现了利用人的固有的内在信 息即人的生物特征来识别人的各种方法,人类本身具有很多相对独特的生物特征如人 脸、指纹、d n a 、虹膜和掌纹等,均具有唯一性和在一定时期内不变的稳定性,而且不 会丢失,不易伪造和假冒【2 】。用它们来进行身份识别是最安全、最可靠、最方便的方法, 因此成为当今社会广泛关注和研究的最高级别的身份识别系统,如今,指纹、d n a 等已 经不同程度的应用于商业、公安等各个方面,取得了较好的效果,尤其人脸识别技术作 为生物识别技术的一种,具有良好的特性:( 1 ) 互异性。世界上不存在两张完全相同 的脸,尽管有的脸非常相象,但是经过仔细观察总是可以找到差异;( 2 ) 不变性,虽 然同一个人不同的胖瘦,不同年龄时的人脸出现了一些变化,但是还是可以识别不同时 期的人脸;( 3 ) 和主体永不分离性,这样对主体身份的识别更具有真实性;( 4 ) 非侵 犯性,我们可以用摄像机在远处轻易的获取一个人的照片,这种操作具有非接触性,也 就更具备隐蔽性,因此会带来更广泛的应用。因此人脸识别技术为现代身份识别提供了 一个极好的解决方案。 计算机人脸识别技术就是利用计算机分析入脸图像,进而从中提取出有效的识别信 息,用来辨认身份的一门技术m 。人脸识别由于其广泛的应用背景,如公安系统的罪犯 识别、自动门卫系统、银行及海关的监控系统,引起了广大研究机构的重视,但是人脸 识别技术的研究仍存在着很多的困难,其中来源于人脸自身的变化和成像条件的影响对 人脸的识别造成了非常大的麻烦。人脸自身的变化:人脸是一个弹性体,人脸的表情变 化对图像有非常大的影响;人脸可以随时间变化,比如人脸的胖瘦,人脸的脸色,化妆, 甚至是整容,另外人脸随年龄的变化也是一个不得不考虑的问题。成像条件的影响:成 基于g a b o r 特征的二次分类法在人脸识别中的应用 像时的光照条件,光照角度:成像时的镜头角度,镜头距离;成像时入的头部旋转角度 等等人脸识别还涉及到了数字图像处理,模式识别,计算机视觉,神经网络等众多学 科所有这些都给计算机人脸识别技术带来了非常大的挑战。 1 2 国内外研究概况及发展趋势 人脸识别研究始于上世纪六十年代,但是受制于当时的技术条件,所取得的成就不 大。计算机人脸识别技术是近2 0 年才逐渐发展起来的,到了九十年代,由于个人电脑 的普及和人工智能的发展,特别是各方面对人脸识别系统的需求,人脸识剔成为科研热 点,文献呻指出人类视觉数据的处理是一个分等级的过程,其中最底层的视觉过程( 视 网膜功能) 起信息转储作用,即将人眼接受的大量图像数据变换为一个比较规则的紧凑 表达形式,人眼视网膜上存在着低层次和高层次的细胞,其中低层次的细胞对空间的响 应和小波变换的结果相似,而高层次的细胞则依据一群低层次细胞的响应,而作出具体 的线、面及物体模式的响应;另外上半部的特征比下半部的特征所起的作用大;低频部 分对整体识别有用,高频部分对细节识别起作用;不同的种族、性别的人脸识别的难易 程度不同,这可能因为不同类型的人脸图像有不同的特性。近年来,神经生理学家、心 理学家和工程技术人员通过研究得出以下结论:人们可以在非常低的分辨率的情况下识 别出熟悉的人脸;对图像退化的容忍能力与熟悉程度成正比;只有高频信息不能实现较 好的人脸识别性能;在不同的表情中,眉毛是进行人脸识别的重要信息;重要的轮廓信 息与人脸图像的维数无关:肤色信息至少和人脸形状信息一样重要:色彩信息起很重要 的信息,尤其在形状信息退化时嘲 这些研究成果非常有益于计算机人脸识别技术的发展,如在计算机人脸识别中, 可以将那些通过对图像数据简单处理后获得的特征定义为低层次特征,而将线、面、模 式等描述特征定义为高层次特征。因此,图像k - l 变换、小波变换后的系数特征及一些 统计特征均属低层次特征而人脸部件形状的分析结果则为高层次特征,这些都可以作为 计算机人脸识别的依据。但是除了少数文献外,计算机人脸识别的研究还是独立于神经 生理学和心理学的研究的。 对人脸识别最早的研究见于文献嘲,b l e d s o e 以人脸特征点的间距、比率等参数为 特征,建成了一个半自动的人脸识别系统。早期的人脸识别方法通常是以人脸器官位 置、尺度和彼此间的比率作为描述人脸的特征。在以后的人脸识别方法与技术的研究中, 逐渐形成了以模板代替局部特征来描述人脸模式的趋势。用模板描述人脸,可以避免基 于局部器官特征人脸识别方法所要求的精确定位问题,而且保留了更多的识别信息。文 一2 一 大连理工大学硕士学位论文 献伪的研究表明,基于模板匹配的入脸识别方法要优于基于局部器官特征的人脸识别方 法。国外主要的人脸识别研究机构有美国麻省理工学院( w i t ) 媒体实验室和人工智能 实验室,英国s u r r e y 大学视觉、语音和信号处理研究中心( c e n t e rf o rv i s i o n 。s p e e c h a n ds i g n a lp r o c e s s i n g ) 、瑞士i d i a p ( d a l l em o l l ei n s t i t u t ef o rp e r c e p t u a l a r t i f i c i a li n t e l l i g e n c e ) 、法国i n r i a 研究所( f r e n c hn a t i o n a l i n s t i t u t ef o r r e s e a r c hi nc o m p u t e rs c i e n c ea n dc o n t r 0 1 ) 、美国卡奈基梅隆大学( c m u ) 机器人 研究所。国内的主要有清华大学、北京大学,中科院计算所等科研所。 1 3 人脸识别方法综述 一个完整的人脸识别系统的组成如下图所示: 已有人 脸图像 人脸图像 的获取 人脸的检 测与定位 人脸的检 测与定位 图像的 预处理 图像的 预处理 特征提取 与选择 分类器的设 计与训练 繁吲删与选择i i 图1 1 人脸识别系统的框图 f 弛1 1 1 1 l ec o m p o n e n t so f t h ef a c er e c o 蛳s y s t e m 如图1 1 所示,一个完整的人脸识别系统由下列部分组成: ( 1 ) 人脸图像的获取:一般是从摄像机、照相机等获取的具有复杂背景的入脸图像作 为人脸识别系统输入的人脸图像。 ( 2 ) 人脸的检测与定位:判断图像中是否存在人脸,如果有则确定人脸所在位置,并 将其从背景图像中分离出来。本文所采用的人脸图像均为经过检测与分离后的标准人脸 图像,因此本文并不涉及( 1 ) 、( 2 ) 内容; ( 3 ) 图像预处理:对图像进行去噪、平滑、归一化以及尺寸裁减等处理,减少光照、 成像条件、外部环境等意外因素对图像的干扰,为后面的工作提供高质量的图像,并将 不同大小的图像统一为标准大小; 基于c - a b m 特征的二次分类法在人脸识别中的应用 ( 4 ) 特征的提取和选择:其目的有两个,一是减少图像的计算和存储,一幅9 2 x i l 2 的 人脸灰度图像,共有1 0 3 0 4 个数据元素,直接存储会占用大量空间,直接计算会耗费大 量时间,而经过特征提取和选择后,存储量仅为直接存储的几百分之一左右,计算速度 也大幅度提高;二是原始图像中的部分象素信息对于人脸分类并没有太大贡献,经过特 征提取和选择后的人脸特征信息可以提高分类速度和识别率,因此本过程是人脸识别系 统的关键步骤之一。 ( 5 ) 分类器设计与训练;设计分类器模型,并通过训练得到分类器的参数,从而得到 分类器。 ( 6 ) 识别:利用训练得到的分类器进行人脸识别,得到识别结果。 本文主要研究的是人脸识别系统中的特征提取与选择及分类器的训练与识别部分。 对于特征提取,方法主要分为两类:基于几何( 局部) 特征的方法:人脸由眼睛、 鼻子、嘴巴、下巴等主要部件构成,因为这些部件的形状、大小和结构上的各种差异才 使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述可以作为 人脸识别的重要特征。采用几何特征进行人脸识别是通过提取人眼,嘴等重要特征点的 位置和其几何形状作为分类特征,可变形模板法网是其中一种比较流行的算法,其基本 思路是:设计一个参数可调的器官模型即可变形模板,定义一个能量函数,通过调整模 型参数使能量函数最小化,此时的模型参数即做为该器官的几何特征。但是该方法存在 两个缺点,一是能量函数中各种代价的加权系数只能由经验确定,难以推广;二是能量 函数优化过程十分耗时,难以实际应用。基于几何特征的人脸表示可以实现对人脸重要 特征的有效描述,但是需要大量的预处理和精细的参数选择。同时,采用一般几何特征 只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息的丢失,而 且目前已有的特征点检测技术在精确率上还远远不能满足要求,计算量也很大基于 统计( 整体) 的方法:考虑了人脸的整体属性。不仅保留了人脸部件之间的拓扑关系, 而且也保留了各个部件本身的信息。文献嘲认为基于整个入脸的分析要优于基于部件的 识别,当前主流的人脸识别方法是基于统计的方法虽然这个结论有待商榷,但是当前 特征提取方法的主流方向是基于统计的方法,本文针对统计方法进行了大量的研究工 作目前主要的特征提取方法有以下几种: 1 ) 主成份分析( p c a ) 方法 9 - 1 1 l ,m a t t h e wa t u r k 等于9 1 年首先提出特征脸的概 念,利用k - l 变换进行人脸特征提取【4 l ;k l 变换是图像压缩中的一神最优正交变换, 人们将它用于统计特征提取,从而形成了予空间法模式识别的基础。自此以后,大量文 献对将特征脸应用于人脸识别进行了讨论和改进,至今特征脸识别仍然是人脸识别领域 - - 4 大连理工大学硕士学位论文 的经典方法。若将k - l 变换用于人脸识别,则需假设人脸处于低维线性空间,且不同人脸 具有可分性。由于高维图像空间k - l 变换后可得到一组新的正交基,若通过选用所个最 大的特征值对应的特征向量作为正交基,以生成低维人脸空间。将每幅人脸图像向这个 低维予空间上投影,得到一个特征系数,这个特征系数就可以作为人脸识别的依据,即 作为分类器的输入进行分类。从压缩能量的角度来看,卜l 变换式最优的,它不仅使得 降维前后的均方误差最小而且变换后的低维空间有很好的人脸表达能力,p c a 又选择了 最大的特征向量,抓住了样本集合的主要分布,但是,它虽然考虑了图像之闻的所有差 异,却不管这样的差异是由照明、发型、角度或背景导致,还是属于人脸的内在差异, 因此角度、光照、尺寸以及表情的干扰会导致识别率急剧下降 2 ) f i s h e r 脸方法“”,模式识别里的经典方法f i s h e r 线性判别准则( f l d ) 旨在求出一 个最佳鉴别向量,将原来高维的模式样本投影到最佳鉴别向量空间以达到减小特征空间 维数的目的。f i s h e r 最佳鉴别向量方法的目的是使投影后的模式样本空间类间散布矩阵 最大而类内散布矩阵最小,也就是保证了投影后的模式样本在新的予空间有最大的类间 距离与类内距离之比,从而使各模式在该空间有最佳的可分性。f i s h e r 判别准则在光照, 拍摄角度等发生变化时的识别率较p c a 有很大的提高,但是f i s h e r 判别准则应用到人脸 识别上会出现类内散布矩阵奇异的情况,这是由于人脸图像的特征维数远远大于可用的 人脸样本数。为了解决这个问题,文献【1 3 】提出了f i s h e r 脸方法,这种方法先利用p e a 进行降维,以保证样本类内散布矩阵是非奇异的,然后再用f i s h e r 线性判别准则得到最 佳鉴别向量。但是这种方法会产生过拟合问题,主要是因为p c a 中的主成份选取过多, 其中有可能存在噪声信息,f i s h e r 判别准则也要对噪声进行拟合,从而导致了过拟合 针对这个问题文献【1 4 】提出了一种增强型的f i s e h r 脸方法。但是f i s h e r 脸的特征空间的 最大维数是c l ,其中c 是类别数,当人脸库的规模比较小时( y a l e 人脸库只有1 5 个人) , 特征维数太小导致识别率不高。 3 ) 基于g a b o r 特征方法“”m a r c c l j a 和d a u g m a n i l 正s j 了【16 】:视觉皮层的细胞可以 用g a b o r 函数作为模型,即二维c , a b o r , j , 波的核函数类似于哺乳动物视觉系统的简单皮层 细胞的感受野( 具有空间局部性和方向选择性等理想特性,对人脸图像进行g a b o r 变换产 生的特征对照明和表情变化不敏感) ,因此,当图像信号输入到人视觉细胞时,视觉细 胞的输出可用图像与g - a b o r 滤波器的卷积来模拟。这种模型能较好的解释人的视觉对图 像尺度的伸缩和方向变化的容忍度,因此被广泛的用于人脸识别中。将二维6 a b o r d 、波 应用到人脸识别中,一般情况下是用5 个尺度,8 个方向上的g a b o r d , 波来表示一幅人脸 图像,再用p c a 或f i 龇方法进行特征提取,这样的特征对表情,光照等外界因素有 基于g a b o r 特征的二次分类法在人脸识别中的应用 很好的鲁棒性,因此识别率较高,但是o a b o r 特征的计算量非常大,因此样本的训练时 阃要比p c a ,f i s h e r 脸长得多,本文采用g a b o l 特征来表示人脸图像。 4 ) 独立分量分析( i c k ) 方法“1 1 i c a 是一种基于高阶统计的数据分析方法,目前 已广泛应用于特征提取、生理学数据分析、语音信号处理等领域。基于二阶统计的p c a , 采用的是g a u s s i a n 源,从而可以得出无数组混合矩阵( m i x i n gm a r x ) w ,所有的这些混合 矩阵在最大似然意义上是相同的,而p c a 选择了一组互相正交的向量作为特征向量。 二阶统计量反映图像的幅度特性而不包括相位特性,而高阶统计量反映了相位特性。对 于给定的一幅自然的图像,保留其能量谱而去掉其相位谱,这将大大的改变图像的外观, 但是这不会改变图像的二阶统计量。包含了图像的结构信息的是相位谱,而不是能量谱。 因而,只对能量谱敏感的p c a 并不适合用来表达自然的图像。引入高阶统计量的i c a 反映了图像的相位谱,所以在人脸识别中具有更强的鲁棒性。文献【1 9 1 论证了i c a 的原 理并且给出了方法,从中可得出k - l 变换采用c r a u s s i a n 源的局限性,因为如果这些基是 o a m s i a n 分布的,那么人脸加人脸是o a u s s i a n 分布的。人脸减人脸也是g a u s s i a n 分布的, 而在现实中显然不是这样的。因为即使在定位和尺寸相同的情况下,由于部件的不同, 相减,相加以后的入脸也存在模糊。 5 ) 隐马尔可夫( h m m ) 方法陬2 l 】。h m m 也可以用来进行人脸检测,在人脸识别 中利用隐马尔可夫模型对人脸进行描述和识别,我们就不是孤立地利用各个器官的数值 特征,而是把这些特征和一个状态转移模型联系起来。删可分为遍历的和从左到右的, 人脸图像包含头发、额头、眼睛、鼻子和嘴巴5 个显著的特征区域,由于各个区域具有 自然不变的顺序,通常采用从左到右的h 蛳。人脸垂直方向由上至下和水平方向由左至 右各个区域具有自然不变的顺序,可以用1 d - h m m 和2 d - h m m 模型来模拟人脸。按照隐马 尔可夫模型,观测到的一列特征被看成是另一组不可观测的“状态”产生出的一列实现。 因而可以将不同的人用不同的 璜咖参数来表征,而同一个人由于姿态和表情变化产生出 的多个观察可通过同一个m m 模型来表征。利用h 删识别人脸可分如下步骤:建立模型, 获得观察矢量,训练模型其中模型的性质与获得观察矢量的方法决定了识别率目前 常用的模型有一维的左右模型,遍历模型,和e f 吼。 6 ) 基于神经网络的方法田捌。这是近些年来比较活跃的一个研究方向,它既可以 用于特征提取,也可以用于模式识剔。早期用于人脸识别的神经网络主要是k o h o n e n 自 联想映射神经网络,主要用于人脸的。回忆”。所谓“回忆”是指当输入图像上的人脸 受噪声污染严重或部分缺损时,能用k o h o n e n 网络恢复出原来完整的人脸。c o t t r e l l 等人 使用级联b p 神经网络进行入脸识别,它对部分受损的人像、光照有所变化的人像的个人 一6 一 大连理工大学硕士学位论文 识别能力较好。i n t r a t o r 等人用一个无监督监督( b c b p ) 混合神经网络进行入脸识别。 其输入是原始图像的梯度图像,以此可以去除光照的变化。无监督学习的目的是寻找类 的特征。有监督学习的目的是减少训练样本被错分的比例。这种网络比用b p 网络提取的 特征更明显,所以识别率更高,如果用几个网络同时运算,求其平均,识别效果还会提高。 l a w r a n c e 和g i l e s 等人用一个自组织特征映射( s o m ) 神经网络与卷积神经网络结合的 系统进行了人脸识别研究,其中s o m 网络的作用是将图像样本量化到降维的拓扑空间, 它使原空间中相邻的输入点在输出空间中仍相邻;卷积网络用于实现相邻像素之间的相 关性知识,从而在一定程度上实现了图像平移、旋转、尺度和局部变形的不交性。l i n 和 k u n g 将神经网络方法和统计方法结合在一起,提出了一种基于概率决策的神经网络 ( p r o b a b i l i s t i ed e c i s o i n - b a s e dn e u r a ln e t w o r k ,p d b n n ) 用于识别人脸。其主要思想是采 用虚拟样本( 正反例) 进行强化和反强化学习,从而得到较理想的概率估计结果,并采用 模块化的网络结构加快网络的学习。这种网络结构继承了决策神经网络( d b n n ) 的结构, 并加入概率变化。每个子网对应一个人,这种结构不仅有利于训练和识别,而且有利于做 硬件。其它用于人脸识别的神经网络还有:用h o p f i d d 网络进行低分辨率人脸联想和识 另i j ,将r b f 与树型分类器结合起来进行人脸识别的混合分类器模型:采用统计学习理论 中的支持向量机进行人脸识别。在人脸识别中用得较多的另一种神经网络是时滞神经网 络( t i m ed e l a yn e u r a ln e t w o r k s , t d n n ) 。它是m l p 的一种变形。此外。由于单个神经网 络有一定的局限性,现在出现了多模态的神经网络,如踟i + r b f 等。即由两种类型的 神经网络共同来完成人脸识别任务。神经网络方法在人脸识别上比其它类别的方法有独 到的优势,它具有良好的自学习、自适应能力,特别是它的自学习能力在模式识别方面 表现尤为突出。神经网络方法可以通过学习的过程获得其它方法难以实现的关于人脸识 别规律和规则的隐性表达。但该方法可能存在训练时间长、收敛速度馒的缺点。 分类器的设计方法; 1 ) 最近邻判别法是指对未知样本x ,只要分别比较x 与个已知样本的距离度量,并决 策x 与离它最近的样本同类。最常用的为欧氏( e 眦l i d e n ) 距离 厅一 乜( w ) = i i x - 枷= ,f i 一m 1 2 ( 1 1 ) l1 = 1 和马氏( m a h a l a n i b i s ) 距离 m = r 2 = ( 工一嚣) 7 罗1 ( z 一群1( 1 2 ) 基于g a b o r 特征的二次分类法在人脸识别中的应用 式中,u 是均值向量,罗是协方差矩阵,r 成为x 到u 的马氏距离。马氏距离排除了不同 特征之间相关性的影响。只有当是实对角阵时,各特征之间是完全独立的:当是 单位矩阵时,马氏距离等于欧氏距离。 2 ) 基于支持向量机( s 田的方法伫4 ,2 5 l 。近年来提出的一种分类方法,该方法的理 论基础是神经网络。支持向量机方法是建立在统计学习理论的v c 维理论和结构风险最 小原理基础上的,根据有限的样本信息在模型的复杂度和学习能力之间寻求最佳折衷, 以期获得最好的推广能力。从理论上说,该算法得到的是全局最优解,解决了神经网络 方法中的局部极值问题。此外,该算法将实际问题通过非线性变换转换到高维特征空间, 在高维特征空间构造线性判别函数来实现原空间中的非线性判别函数,同时它解决了维 数问题,其算法复杂度与样本维数无关。 3 ) 基于仿生模式识别理论的方法防矧。传统模式识别中把不同类样本在特征空间 中的最佳划分作为目标,而仿生模式识别则以一类样本在特征空间中分布的最佳覆盖作 为目标。也就是说,在仿生模式识别理论中,每一种类型样本子空间的构造是仅仅依赖 于该样本类型本身,这与传统模式识别中依赖各种类型样本之间的关系构造样本予空间 是完全不相同的。仿生模式强调用“认识”模式取代传统模式识别的“划分”,利用“高 维空间几何形体覆盖识别方法”进行该类型子空间的构造。基于仿生模式识别理论的识 别方法可以避免对于未训练样本的误识率较高的问题。 1 4 本论文的主要工作和章节安排 本文重点对人脸识别中的特征提取和分类器的设计进行研究,并进行了大量的仿真 实验。 首先实现了主成份分析( p c a ) ,f i s h e r 脸,最近邻分类器,具有纠错能力的支持向 量机( s ) 算法,超椭球神经网络方法以及二次分类器方法。其中具有纠错能力的s 由于利用了信道差错控制的编码技术而具有纠错能力,从而得到较高的正确率;而超椭 球神经网络方法是仿生模式识别理论的应用,它对未训练样本有着很低的错误接受率。 二次分类器由于结合了纠错s w 和超椭球神经网络,即它既具备了仿生模式识别的对未 训练样本误识率低的特点又具备了纠错s v m 的具有纠错能力的特点。本文又将g a b o r 特 征与二次分类器相结合,由于利用了g a b o r 特征的优势,取得了进一步改进的识别效果。 本文共分为五章,其内容如下: 第一章是绪论部分,阐述了人脸识别问题的提出、发展、研究现状,人脸识别现有 的特征提取与分类器设计的主要方法及其优缺点,以及本文的主要工作和章节安排。 一8 一 大连理工大学硕士学位论文 第二章讨论了几种典型的人脸识剐的特征提取和分类方法的基本原理,如用于特征 提取的主成分分析( p c a ) 方法和f i s h e r 脸方法,用于分类的仿生模式识别和纠错s v m 方法。 第三章在特征提取部分采用g a b o r 特征:分析了二维g a b o r 小波的特点及其应用于 人脸识别中的优势,结合其原理,给出具体的实现方法;在分类器设计部分采用了结合 仿生模式识别方法和纠错s w 方法的二次分类器,分析了其优于其它分类器的特点,并 给出具体的算法实现。 第四章将基于g a b o r 特征的二次分类方法,以及p c a ,f i s h e r 脸特征结合最近邻分 类器、纠错s v m 、二次分类器应用于三种不同的标准人脸库( 包括c a m b r i d g eo r l 人脸 库,y a l e 人脸库和a r 人脸库) 进行仿真实验,并给出实验结果与分析。 第五章是本文的总结和展望。 基于q d b o r 特征的二次分类法在人脸识别中的应用 2 人脸识别的几种典型的特征提取和分类器设计方法 本章阐述几种经典的人脸识别方法,包括主成份分析( p c a ) ,f i s h e r 脸,纠错支 持向量机方法( s v m ) 的基本理论和实现方法。 2 1 主成份分析( p c a ) p c 主要是利用了图像的k - l 变换,k l 变换是图像压缩中的一种最优变抉。设一个 宽平稳的随机向量x = f o ) x o ) ,一1 ) ,其协方差矩阵嘲1 e = e ( x - u ,) 一段) 7 ,= c c o t c o n - i c 1 0 q i q 1 c 一1 0 c n i i c n - i n - i ( 2 1 ) 其中以是信号x 的均值向量。显然,矩阵c 。体现了信号向量工的各个分量之间的相关 性。若工的各分量互不相关,那么c 。中除对角线以外的元素皆为零c 。称为卜l 变换 的生成矩阵,在人脸识别中,用样本集的总散布矩阵作为k - l 变换的生成矩阵。即 i 纠 e = t 一) ( 毛一p ) 7 ( 2 ,2 ) 、j - 0 置表示样本集中的样本总数。k - l 变换的思路就是寻找正交矩阵月,使得a 对x 的变换y 。 ( y ;a x ) 的协方差矩阵c ,为对角阵。由矩阵理论可知,彳= 【4 。a l ,4 一,r 即为矩阵 c ,的n 个特征值九五2 九。对应韵归一化的特征向量。k - l 的优点在于完全去 除了原信号x 中的相关性;进行数据压缩时,将前p 个最大特征值保留,其余舍去后, 保留了原信号的最大能量 、 着将k l 变换应用于人脸识别,前提是假设人脸具有可分性一幄m x 的人脸图 像,可以表示为删维的一维向量,通过对这个 剁高维图像空间进行k l 交换后,得 到一组正交基,保留p 个最大特征值所对应的特征向量,生成低维特征空间方法的关 键在于求出协方差矩阵的特征向量,对于刎的向量,其k l 生成矩阵的维数为 m n x 柳,如果直接求该矩阵的特征值和特征向量,计算量巨大,所以利用奇异值( s v d ) 分解的方法来间接的求特征值和特征向量,s v d 定理如下洲: 设x 是一秩为,的刎维矩阵,则存在两个正交矩阵: 大连理工大学硕士学位论文 u v 三黑:落_ 亿, = ,n ,v r l 】孵“” 以及对角阵 a = 施昭 厶, ,丑。】吼 ( 2 4 ) 且厶 钆,满足如下等式: x = 【0 - 矿7 ( 2 5 ) 其中丑为矩阵殿7 和x 7 x 的非零特征值,担,和v ,分别为艇7 和z 7 x 对应于磊的特征 向量,上述分解就是x 的奇异值分解,所以由上式可以得到: u = x v a 2 ( 2 6 ) 由于样本集的总散布矩阵可以表示为: g 2 壶善阮一) ( 葺一) 72 壶掰7 ( 2 7 ) 其中:x = x o 一,而一,以一l - g 】,所以可以构造矩阵 r = x 7 x 吼。o ( 2 8 ) 求出矗矩阵的特征值丑和特征向量叶,然后利用式( 2 6 ) 就可以求出总散布矩阵c 的特 征向量( ,。仅仅选取最大的前p 个特征值对应的特征向量u ,这些特征向量分别对应一 个图像,由于这些图像非常像人脸,所以被称为特征脸。 这些特征向量形成一个降维子空间,原始人脸图像在该子空间的投影可以得到一组坐标 系数: 只= u ;( x ,一)( 2 9 ) 这组系数表明了原始人脸图像在该子空间的位置,因此可以作为分类器的输入将一幅 待识别样本投影到子空间而得到一组坐标系数,和训练样本得到的坐标系数比较,以确 定该样本是人脸库中的哪一个人。 p c a 识别人脸分为以下几步: ( 1 ) 把每一幅人脸图像按行连接组成个列向量; ( 2 ) 按照式( 2 8 ) 构造k l 生成矩阵,求出该矩阵的特征值矩阵 和特征向量矩阵v ; ( 3 ) 利用式( 2 6 ) 求出总散布矩阵的特征向量( ,取前p 个最大特征值对应的特征向量 构成啡,然后再利用式( 2 9 ) 求出已知样本和待识别样本的系数向量儿; ( 4 ) 以乃作为分类器的输入对未知样本t 进行分类。 基于g a b o r 特征的二次分类法在人脸识别中的应用 p e a 虽然考虑了图像之间的所有差异,却不管这样的差异是由照明、发型、角度或背景 导致,还是属于人脸的内在差异,即没有考虑类内和类间分布的差异,因此,p c a 方法 虽然是一种很好的人脸描述方法,但不一定是最好的判别方法。所以,p e t e r n b e l h u m e u r 等人提出了f i s h e r 脸方法o ”。 2 2 基于f i s h e r 线性判别准则的f i s h e r 脸方法 f i s h e r 脸方法的基本思想是找到最佳鉴别向量子空间,在该空间投影的样本具有最 大的类间距离和类内距离比,即样本在该子空间具有最佳的可分性,从而达到样本分类 的目的。 2 2 1 f i s h e r 线性判别准则 f i s h e r 线性判别准则是模式识别里的经典方法胁1 ,其基本思想是找到个投影方 向,使各类样本尽可能分得开些,同时各类样本内部尽可能

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论