已阅读5页,还剩64页未读, 继续免费阅读
(计算机软件与理论专业论文)基于loggabor和kdlda的人脸识别算法研究和实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
华东师范大学硕士学位论文 基于l o g - o a b o r 和k d - l d a 的人脸识别算法研究和实现 论文摘要 本文对人脸识别相关问题做了一系列深入的研究,其中包括人脸识别的基本 概念、人脸识别研究的背景和意义,人脸识别的发展历史、人脸识别方法和应用 系统等。 本文提出了一种新的基于l o g - g a b o r 和k e r n e ld i r e c tl d a 的人脸识别算法。 先用4 个尺度6 个方向的l o g - g a b o r 滤波器对图像滤波得到l o g g a b o r 特征, 然后把此特征输入k e r n e ld i r e c tl d a ,得到最佳分类效果的特征向量。本算法主 要的优势是:1 ) 具有方向和尺度选择性的l o g - g a b o r 滤波器使识别算法更具鲁 棒性2 ) 实验了四种常用的特征选取方法,并且得出了最优选取特征数。3 ) k e r n e ld i r e c tl d a 可以减少特征维数和类问区分度,并且解决了既有l d a 面临 的s s s ( s m a l ls a m p l es i z ep r o b l e m ) n 题4 ) 首次把l o g - g a b o r 滤波图像表示方法和 k e r n e ld i r e c tl d a 相结合。本文采用c a s p e a l 、f e r e t 和一个近红外人脸图 像库做测试,取得了满意的效果。 最后在本文提出算法的基础上,实现了一个人脸照片比对演示系统和一个基 于嵌入式环境的人脸识别考勤系统。 关键词:人脸识别,l o g - - g a b o r ,k d d a ,p c a ,a d a b o o s t v 华东师范大学硕士学位论文 基于l o g - g a b o r 和k d - l d a 的人脸识别算法研究和实现 a b s t r a c t i nt h i sp a p e r , as e r i e so fp r o b l e m si n v o l v i n gf a c er e c o g n i t i o nw e r er e s e a r c h e d i n - d e p t hi n c l u d i n gb a s i cc o n c e p to f f a c er e c o g n i t i o n ,b a c k g r o t m da n dm e a n i n go ff a c e r e c o g n i t o n , h i s t r o y o ff a c e r e c o g n i t o n , a l g o r i t h m so ff a c er e c o g n i t o n , a p p l i c a t i o n d e s i g n i n gb a s e do i lf a c er c 圮o g n i t i o n , e c t i nt h i sp a p e r , w ep r o p o s e dan e wf a c er e c o g n i t i o nm e t h o db a s e do nl o g - g a b o r f i l t e ra n dk d d ac l a s s i f i c a t i o n t h em a i na d v a n t a g e so ft h ep r o p o s e dm e t h o d :( 1 ) f a c er e p r e s e n t a t i o nu s i n gl o g - g a b o rw i l lb em o r er o b u s tf o rr e c o g n i t i o n ( 2 ) t e s tf o u r k i n d so fm e t h o d so ff e a t u r es e l e c t i n ga n dg e tt h eo p t i m i z i n gn u m b e r so f s e l e c t e d ( 3 ) k d d ar e d t t c ef e a t u r ed i m e n s i o n sa n ds h r i n ki n - c l a s sd i f f e r e n c e ,a n da l s oa v o i dt h e s s sp r o b l e m ( 4 ) c o m b i n et h el o g - g a b o rf i l t e r sa n dk e r n e ld i r e c tl d a r e c o g n i t i o n a x p e r i m e n t sw i t ht h ec a s - p o a i - r l , f e r e td a t a b a s ea n ds o m en e a r - i n f r a r e df a c e d a t a b a s es h o w e dt h a to u rm e t h o dc a na c h i e v ee x c e l l e n tf a s to n er e c o g n i t i o n a th s t , w ed e v e l o p e dap i c t u r ec o m p a r i n gd e m os y s t e ma n dd e s i g n e da e m b e d d e df a c er e c o g n i t o ns y s t e mb a s e do na b o v ea l g o r i t h m k e yw o r d : f a c er e c o g n i t i o n , l o g - g a b o r , k d d a ,p c 凡a d a b o o s t v i 基于t d g - c - , a b e r 和k d - l d a 的人脸识别算法研究和! ! 塑 学位论文独创性声明 本人所呈交的学位论文是我在导师的指导下进行的研究工作及 取得的研究成果据我所知,除文中已经注明引用的内容外,本论文 不包含其他个人已经发表或撰写过的研究成果对本文的研究做出重 要贡猷的个人和集体,均已在文中作了明确说明并表示谢意 作者签名:芦耻日霸:型2 盟 学位论文授权使用声明 本人完全了解华东师范大学有关保留使用学位论文的规定,学 校有权保留学位论文并向国家主管部门或其指定机构送交论文的电 子版和纸质版有权将学位论文用于非赢利目的的少量复制并允许论 文进入学校图书馆被查阅有权将学位论文的内容编入有关数据库进 行检索。有权将学位论文的标题和摘要汇编出版保密的学位论文在 解密后适用本规定 学位论文作者签名矗延节耖 i i i 导师鲐勃看 日期:盟:! ! :i 华东师范大学硕士学位论文 基于l o g - g a b o r k d - l d a 的人脸识别算法研究和实现 1 1 研究背景 第1 章绪论 社会是人的社会,人或直接或间接交往最主要的对象还是人。所以如何鉴别 人的身份变得越来越重要。在中国古代人们就开始使用暗号、笔迹,指纹来鉴别 身份,在古埃及出现了根据人体各部位的尺寸来鉴别个人的身份。像指纹、暗号 ( 口令) 方法,都沿用至今。随着社会的不断的发展,人类的社会化程度越来越高, 现代科技的快速发展,使得身份鉴别的场合和要求也开始变得多样化,无论是国 家的信息安全、企业的商业来往还是百姓的日常生活对个人身份鉴定都提出了更 多的需求和更高的要求。例如国家安全部门等重要场所的出入、企业商业机密的 读取、员工出勤考核、个人提款、网络安全等都离不开个人身份鉴定这一重要环 节。所以人们根据身份特征的便于获取、携带、记录、自动化鉴别、鉴别精度、 鉴别友好性,发明了指纹识别,暗号、笔迹、密码、d n a 、气味等一系列方法。 分析已被提出的各种身份鉴别方法,根据鉴别特征的类型,分为基于口令鉴 定、持有物鉴定、生物特征鉴定三类。基于口令鉴定是指根据个人所提交的口令 信息来确认其身份,如密码、暗号等;基于持有物鉴定是指根据个人所掌握的客 观物体来确认其身份,例如证件、智能卡等:基于生物特征鉴定则是指根据个人 所具有的一个或多个生物特征来确认其身份。而生物特征又分为个人独特的生理 特征和行为特征,生理特征包括如脸、指纹、虹膜等,而行为特征则包括步态、 语音、笔迹等。上述三个鉴定种类中,基于持有物与口令的鉴定方法具有容易掌 握、鉴定快速准确的优点,但是也存在如易丢失易仿制的缺点,基于这两种方法 的自动个人身份鉴定系统往往是“认物不认人,从而给事主造成意想不到的损 失。因此相比较而言,基于生物特征的鉴定方法是目前最为可靠的一种鉴定方法 因为个人的生物特征既不会像持有物一样容易丢失、仿制,也不会像口令、密码 那样容易被忘记和破解。既然要求个人身份鉴定的高度准确性和安全性,因此人 体生物特征的选择必须满足一定的要求:( 1 ) 普遍性,即每个人都有此特征;( 2 ) 唯一 性,即任意两个人的相应特征都有区别;( 3 ) 稳定性,即此特征在较长的一段时间 内不变或变化很小;( 4 ) 无伤害性,即采集测量此特征时对人体无伤害;( 5 ) 可量化 性,即此特征可以被量化测量。满足以上要求并已经得到研究应用的生物特征按 生理特征与行为特征分别包括:人脸、指纹、虹膜、视网膜、手形、掌纹、d n a 与语音、步态、笔迹,击键等。这些生物特征具有“人各有异”、“终生不变”、 “随身携带”的特点,确保了认证结果。 华东师范大学硕士学位论文 基于l o g - g a b o r 和k d - l d a 的人脸识别算法研究和实现 但是在计算机技术出现以前,所有的鉴定方法都是完全依赖人来完成的,这 就要求执行辩识的人具有较高的专业技能,并且要付出较大的工作量。而想要所 有以上这些鉴别技术能够得到广泛应用和发展,鉴别过程的自动化显得尤为重 要。因此“如何让机器取代人类自身来准确快速地完成个人身份鉴定”、“如何提 高个人身份鉴定的准确性”成了科学研究的一大热点,各种各样的自动个人身份 鉴定系统不断推出。 其中的人脸识别技术是模拟人类识别个体身份的过程,其优势就在于它的自 然性和不被被测个体察觉的特点。所谓自然性,是指该识别方式同人类( 甚至其 他生物) 进行个体识别时所利用的生物特征相同。除了人脸识别,另外具有自然 性的识别还有语音识剔、体形识别等,面指纹识别、虹膜识别等都不具有自然性, 因为人类或者其他生物并不通过此类生物特征区别个体。不被察觉的特点对于一 种识别方法也很重要,这会使该识别方法不令人反感,并且因为不容易引起人的 注意而不容易被欺骗。人脸识别具有这方面的特点,它完全利用可见光获取人脸 图像信息,而不同于指纹识别或者虹膜识别,需要利用电子压力传感器采集指纹, 或者利用红外线采集虹膜图像,这些特殊的采集方式很容易被人察觉,从而更有 可能被伪装欺骗。 所以近些年来,计算机自动人脸识别技术得到了世界各国很大的关注和发 展,特别是。9 1 l ”事件后,作为生物特征识别技术之一的人脸识别技术已被世 界主流国家作为国家战略核心技术而得到高度重视。人脸识别技术在国家安全、 公共安全、金融、军事等领域具有巨大的潜在应用价值。 随着人脸识别技术研究的深入。除了身份验证以外,各种人脸识别应用也不 断被发现和开发,比如人物照片搜索,利用人脸识别技术提取的人脸特征实现真 实人脸照片转变为人脸漫画图片,各种利用人脸做人机交互的电子互动游戏,利 用人脸检测技术实现数码相机自动对焦等。这些应用又成为人脸识别研究的推动 力。 1 2 人脸识别概要 1 2 1 基本概念 实际上在我们日常生活中。人们总是在进行着人脸识别的过程,当一个人希 望与另外一个人交往时,实际上经过了如下过程:先观察眼前是否有人? 如果有 人。这个人是不是我所认识的某一个人? 如果是的,那么这个人是谁? 这个过程 中,最主要的动作是人用眼睛观察对方的面容,人的面容是我们个体最自然最直 2 华东师范大学硕士学位论文 基于l o g - g a b o rk d l d a 的人脸识别算法研究和实现 接的表征人类可以很轻松地通过面容来鉴别个人身份。由于这种鉴别方式跟我 们人类认识方式的无缝连接,人们当然希望我们能用机器来模拟这个过程,用计 算机技术来实现这样的自动化鉴别过程,这就是所谓的。自动人脸识别 ( a f r a u t o m a t i cf a c er e c o g n i t i o n ) ”。如果我们把照相机、摄像机、照片扫描仪等 图像获取工具看作计算机的“眼睛”,数字图像可以看作计算机观察到的“影像”, 而计算机处理能力看作人的“大脑”简单地说,a f r 研究试图赋予计算机根据 其所“看到”的面部照片来判断人物身份的能力。 通常的人脸识别包括两个问题: 1 1 人脸定位问题 人脸定位技术回答:“是否有人? ”的问题。人脸定位问题又包含人脸检测 和人脸跟踪等研究子方向。人脸检测任务是根据一副图像的内容判断其中是否存 在人脸,存在几张人脸? 如果存在,需要标定出每张人脸在图像中的位置、人脸 区域大小,眼睛位置等信息。在现实中,往往容易得到视频信息,这要求我们实 时连续稳定地获得人脸信息,这就是所谓的人脸跟踪。由于视频图像序列的实时 性和连续性,如果单纯利用人脸检测的方法检测视频中每帧图像的人脸信息,实 时性和连续性都无法得到保证。由于视频图像序列帧与帧之间有很大的相关性。 人们利用此相关性结合人脸检测的方法,以此开辟了一个跟人脸检测相关但是又 不完全等同人脸检测技术的人脸跟踪领域的研究。 2 ) 人脸识别闯题 入脸识别回答;。这个人是谁? ”的问题。它根据人脸标定的信息,运用特 定方法提取面部特征,再利用此特征数据得出两幅人脸图像的相似度。根据应用 方法的不同,常常被分为:人脸鉴别、人脸验证、人脸监控: 人脸鉴别( i d e n ti f i c a ti o n ) 1 人脸鉴别回答“这是谁? ( w h oa mi ? ) ”。实 际上就是所谓的无拒识的闭集( c l o s es c t ) 人脸识别问题:先假定输入的人脸一 定是人脸数据库中的某一个,然后对输入人脸图像与人脸数据库中的所有已知原 型人脸图像计算相似度并对其排序,根据这个排序信息来给出输入人脸的身份信 息。 人脸验证( v e r i f i g a t i o n ) :验证回答“这是否为某人? ( a mw h ois a yi a m ? ) ”。当有输入图像时,计算机已经被告诉这应该是某人,系统把该图像与数 据库中相应被告诉的人脸图像比对,判断两者是否为同一个人。 人脸监控( w a t c hii s t ) :人脸监控实际上是鉴别和验证的综合,回答:“这 是否为要找的人? ( a r ey o ul o o k i n gf o rm e ? ) ”这实际上是一个有拒识的开 集( o p e ns e t ) 人脸识别,即首先判断输入人脸是否在已知人脸库中,如果是, 则判断是哪一个。 简单她说,可以认为人脸鉴别是一个多类分类问题,而人脸验证则通常是一 华东师范大学硕士学位论文 基于l o g - g a b o r 和k d - l d a 的人脸识别算法研究和实现 个二类判别问题。而人脸监控是两者的结合。无论哪种方法,其中涉及的如特征 提取、相似度度量等关键问题是一致的,这些技术方法都是通用的。 除了以上应用方案以外,人们在人脸识别技术研究成果的基础上,又陆续对 诸如人脸性别,表情,种族,年龄等特征分类展开研究并且取得了很大的进展。 1 2 2 处理流程 通常的人脸识别算法框架如图i - i : 圈i - 1 人脸识别算法框槊 1 图像采集 由图i - i 看到,对于人脸识别技术,首先要获得一副包含入脸的数字图像。 好的图像采集装置能够获取稳定易用的人脸数字图像,为我们后续的操作带来很 大方便,很多软件无法解决的问题,由于数据采集装置的改善,或许某些问题就 能够迎刃而解。由于光学传感器如c c d 或c m o s 成像技术的发展,此类传感器价格 非常便宜,容易普及,所以现在的人脸识别研究大多数都是利用c c d 或c i 0 s 成像 技术获取人脸图像。由于可见光的易变,它对成像质量和稳定性影响很大,外加 主动光源能够克服可见光线变化对人脸图像的影响,所以最近在人脸识别领域有 研究人员设计了红外成像设备,来克服人脸模式随光照变化的类内差异,从而大 幅度提高了人脸识别的精度。 2 图像预处理 一般硬件直接输出的图像,由于硬件本身的物理条件限制,其总是达不到应 用的要求。比如多数的c c d c m o s 成像装置,都或多或少伴随着噪声,所以一般首 先要做去噪操作。之外,对于人脸识别,为了消除或减少亮度和光照对图像的影 响,通常要做亮度归一化和直方图均衡化操作 3 人脸检测 人脸图像的配准程度,直接关系到人脸识别的精度。c c d c m o s 直接输出的图 像没有人脸位置的准确信息。人脸检测是人脸识别技术研究中的一个重要环节, 4 墼师范大钽士学位论文基于l o g - 4 3 a b o r 和k d - l d a 的人脸识别算法研究和实现 人脸位置定位的准确性直接影响后续人脸特征的有效性。有时候,由于应用要求 的不同,还需要定位出人脸的边缘甚至眼睛、鼻子、嘴巴、耳朵、眉毛等。 4 特征提取 在模式识别领域,特征提取是最关键的环节之一,人脸识别技术实际上就是 一个模式分类的问题,通常的人脸数字图像,其原始特征为像素离散度量值,如 传统的灰度图像为0 2 5 5 的灰度值。一方面这个值维度过于庞大,难以处理;另 一方面其中的信息冗余量大,并不能直接表现特定对象本质,难以开发出满意精 度的分类器。特征提取得是否合理有效,直接影响人脸识别的精度和效率。在人 脸识别领域,科技人员普遍使用的提取方法包括:基于几何特征的人脸特征提取、 基于统计方法的人脸特征的提取、基于变换域提取特征方法、神经网络提取特征 方法等。 5 分类 分类器是基于分类算法基础上的,将提取的人脸特征进行分类,它是人脸识 别验证的最后一步。在人脸识别中,经常应用的方法有:( 1 ) 最近邻分类器,常 以待识人脸特征矢量与模板特征矢量的度量距离为判据,距离度量准则有l l 范 数、l 2 范数、马氏距离、h a u s d o r f f 距离。( 2 ) 贝叶斯分类器,如果知道各类的 先验分布和条件分布,则可以采用最大后验估计的方法进行分类( 2 ) 支持向量 机( s v m ) ,该方法是基于结构风险最小化得出的。在小样本情况下,能够达到既 降低训练集的错分风险又降低待识人脸的错分风险的效果。 1 2 3 技术瓶颈 人脸识别作为一种新兴的生物特征识别技术( b i o m e t r i c s ) ,与虹膜识别、指 纹扫描、掌形扫描等技术相比,人脸识别技术在应用方面具有独到的优势: 1 ) 使用方便,用户接受度高。人脸识别技术使用通用的摄像机作为识别信 息获取装置,以非接触的方式在识别对象未察觉的情况下完成识别过 程。 。 2 ) 直观性突出人脸识别技术所使用的依据是人的面部图像,而人脸无疑 是肉眼能够判剐的最直观的信息源,方便人工确认,审计,“以貌取入” 符合人的认知规律。 3 ) 识别精确度高,速度快。与其它生物识别技术相比,人脸识别技术的识 别精度处于较高的水平,误识率、拒认率较低。 4 ) 不易仿冒。在安全性要求高的应用场合,人脸识别技术要求识别对象必 华东师范大学硕士学位论文基于螂a b o r 和l ( d o l d a 的人脸识别算法研究和实现 须亲临识别现场,他人难以仿冒。人脸识别技术所独具的活性判别能力 保证了他人无法以非活性的照片、木偶、蜡像来欺骗识别系统。这是指 纹等生物特征识别技术所很难做到的。举例来说,用合法用户的断指即 可仿冒合法用户的身份而使识别系统无从觉察 5 ) 使用通用性设备。人脸识别技术所使用的设备为一般的p c 、摄像机等常 规设备,由于目前计算机、闭路电视监控系统等已经得到了广泛的应用, 因此对于多数用户而言使用人脸识别技术无需添置大量专用设备,从而 既保护了用户的原有投资又扩展了用户已有设备的功能,满足了用户安 全防范的需求。 6 ) 基础资料易于获得。人脸识别技术所采用的依据是人脸照片或实时摄取 的人脸图像,因而无疑是最容易获得的。 7 ) 成本较低,易于推广使用。由于人脸识别技术所使用的是常规通用设备, 价格均在一般用户可接受的范围之内,与其它生物识别技术相比,人脸 识别产品具有很高的性能价格比 虽然人脸识别有很多其他识别无法比拟的优点,表1 - 1 对比了人脸识别技术 跟其他生物识别技术。但是它本身也存在许多困难。人脸识别被认为是生物特征 识别领域甚至人工智能领域最困难的研究课题之一。人脸识别的困难主要是人脸 作为生物特征的特点所带来的。人脸在视觉上的特点是: 1 ) 不同个体之间的区别不大,所有的人脸的结构都相似,甚至人脸器官的 结构外形都很相似。这样的特点对于利用人脸进行定位是有利的,但是 对于利用人脸区分人类个体是不利的; 2 ) 人脸的外形很不稳定,人可以通过脸部的变化产生很多表情,而在不同 观察角度,入脸的视觉图像也相差很大。 3 ) 图像采集受外界环境影响较大。另外,人脸识别还受光照条件( 例如白 天和夜晚,室内和室外等) ,人脸的很多遮盖物( 例如口罩、墨镜、头 发、胡须等) 、年龄等多方面因素的影响。表1 2 展示了影响人脸识别 性能的因素及解决方法。 1 2 4 评价指标 比对速度 指从输入图像开始到跟库里面图像或特征比对出结果的时间 误识率( f a l a ea e p tr a t e ,f 从) l 指把待认对象错误地识别成其他登录者的概率,也称为“认假率”。 6 华东师范大学硕士学位论文 基于l o g - g a b o r 和k d - l d a 的人脸识别算法研究和实现 表 - 2 外界环境对人脸识别影响 影响因素解决办法 背景和头发消除背景和头发,只识别脸部图象部分。 余燃曩蹿燃攀燃蒜淼案 人脸在图象平面外可以建立人脸的三维模型,或进行三维融合 的偏转和俯仰( m o r p h i n g ) ,将人脸图象恢复为正面图象。 采用直方图规范化,可以消除部分光照的影响。 光源位置和强度的采用对称的从阴影恢复形状 变化 ( s y m m t e r i c ;s h a p e ;f r o m ;s h a d i n g ) 技术,可以得 到一个与光源位置无关的图象。 年龄的变化建立人脸图象的老化模型。 表情的变化 提取对表情变化不敏感的特征,或者将人脸图象 分割为各个器官的图象,分别识别后再综合判 断。 嚣喜篇硼艮镜、胡须利用数字图像处理的方法消除眼镜、胡须。 照相机的变化 尽量使用相同型号或者参数的成像设备或者对 数字图像做预处理。 华东师范大学硕士学位论文 基于l o g - g a b o r 和k d - l d a 的人脸识别算法研究和实现 拒认率( f a i s er e j e c tr a t e ,f r r ) : 指无法识别登录者的概率,也称为“拒真率”。 错误率( e q u a le r r o rr a t e ;e r r ) 计算机在判别时采用的阈值不同,这两个指标也不同。一般情况下,f a r 随 阙值的增大( 放宽条件) 而增大,f r r 随阈值的增大而减小。为了综合评价系统, 把f a r 和f r r 调节到相等时的f a r 或f r r 称为错误率。 1 3 人脸识别主要算法概要 g a l t o n 于1 8 8 8 年和1 9 1 0 年就分别在( n a t u r e ) 杂志发表了两篇关于利用人 脸进行身份识别的文章,其中阐述了人类人脸识别能力的机理,这可能是最早关 于人脸识别的文章了当时还没出现电予计算机,还没涉及自动化人脸识别的概 念。c h a n 和b l e d s o e 在p a n o r a m i cr e s e a r c hi n c 发表的技术报告 1 ,是最早 研究自动人脸识别的论文。到现在已有四十多年的历史。 二十世纪六七十年代,自动人脸识别研究处于起步阶段,大家着重研究基于 人脸几何结构特征( g e o m e t r i cf e a t u r eb a s e d ) 的方法 1 2 3 。其通过人脸 面部拓扑结构几何关系的先验知识,利用基于结构的方法在知识的层次上提取人 脸面部主要器官特征,将人脸用一组几何特征矢量表示,其识别归结为选择特征 矢量之间的匹配。基于几何特征的识别方法具有如下优点:1 ) 符合人类识别人 脸的机理,易于理解;2 ) 对每幅图像只需存储一个特征矢量,存储量小;3 ) 对光 照变化不太敏感。而这种方法同样也存在明显缺点:1 ) 从图像中抽取稳定的特征 比较困难,特别是在特征受到遮挡时;2 ) 对强烈的表情变化和姿态变化的鲁棒性 较差;3 ) 一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特 征,造成部分信息丢失,更适合于粗分类。此外,人工神经网络学科被广泛关注, 人工神经网络也被应用于人脸识别。然而由于是人脸识别研究的初级阶段,相关 方法存在明显缺陷,这些研究无法获得实际应用。 到了九十年代,人脸识别技术得到了长足进步。期间出现了比较著名的人脸 识别算法:t u r k 和p e n t l a n d 等基于p c a ( p r i n c i p a lc o m p o n e n ta n a l y s i s ) 的 e i g e n f a c e 方法 4 、l w i s k o t t 等的e b g m ( e l a s t i cb u n c hg r a p hm a t c h i n g ) 方法 5 、p b e l h u m e u r 等基于l d a ( l i n e a rd i s c r i m i n a n ta n a l y s i s ) 的f i s h e r f a c e 方法 6 ,p p e n e v 等的l f a ( l o c a lf e a t u r ea n a l y s i s ) c 7 、b a r t l e t t 等的i c a ( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ) 方法 8 、p j p h i l l i p s 等的s v m ( s u p p o r t v e c t o rm a c h i n e s ) 方法 9 、n e f i a n 等的h m m ( h i d d e nm a r k o vm o d e l s ) 方法 1 0 、 a d i n i 等的神经网络方法 1 1 。 无论以上何种方法,光照、表情、年龄等变化一直是人脸识别研究领域最大 s 华东师范大学硕士学位论文 基于l o g - g a b o r k d - l d a 的人脸识别算法研究和实现 的难点。二十世纪九十年代末,全世界科研人员都把注意力集中到这个难点上。 其中提出的著名方法有:g e o r g h i a d e s 等人提出的基于光照锥( i l l u m i n a t i o n c o 鹋s ) 模型的多姿态、多光照条件人脸识别方法 1 2 1 3 ;b l a n z 和v e t t 盯等 提出的基于3 d 变形( 3 dm o r p h a b l em o d e l ) 模型的多姿态、多光照条件人脸图像 分析与识别方法 1 4 1 5 1 6 1 7 ;s h a s h 帆等于2 0 0 1 年提出的基于商图像的人 脸图像识别与绘制技术 1 8 ;b a s d 和j a c o b s 则利用球面谐波( s p h e r i c a l h a r m o n i c s ) 表示光照、用卷积过程描述朗博反射的方法解析地证明了一个重要 的结论:由任意远点光源获得的所有朗博反射函数的集合形成一个线性子空间。 这意味着一个凸的朗博表面物体在各种光照条件下的图像集合可以用一个低维 的线性子空间来近似,为光照问题的解决提供了重要思路 1 9 。 为了要找到种对光照、表情、年龄等具有鲁棒性的人脸识别算法,要做的 工作其实可以分为2 部分:如何找到对分辨人脸更有效的人脸描述( 即人脸模型 或人脸特征) ,进而如何找到对该人脸描述更有效的分类方法。好的人脸描述应 该具有类内差别尽可能小,类问差别尽可能大,因此往往需要把2 d 的图像信息影 射到某个空间。常用的变换有f f t 变换 2 0 、d c t 变换 2 1 、各种小波变换等。其 中,g a b o r 2 2 交换是最受人们关注的方法之一。原因就是2 d 的g a b o r 核( k e r n e l s ) 模型跟哺乳动物视觉皮层简单细胞2 d 感受野剖面非常相似,具有良好的空间局部 性和方向选择性。f i e l d 在1 9 8 7 年提出了l o g - g a b o r 核 2 3 ,该论文指出,除了 与g a b o r 具有相似的性质之外,l o g - g a b o r 核比g a o b r 核可以更好地表示自然图像。 在训练样本数不是很多的情况下,用高维特征进行分类器设计,无论从计算 复杂程度还是分类器性能来看都是不适宜的。如何把高维特征空间压缩到低维特 征空问,以便有效地进行分类器设计就成为一个重要的课题。l d a ( l i n e a r d i s c r i m i n a n ta n a l y s i s ) 2 4 】 2 5 是一种有效进行特征选择的方法。一般说来 人脸特征不是线形可分的,它属于非线性问题。k d d a ( k e r n e ld i r e c t d i s c r i m i n a n ta n a l y s i s ) 2 6 是l d a 与核方法结合的产物。k d d a 先把输入样本非 线性映射到某一高维的特征空间,然后在该特征空间中进行线性判别分析,提取 最佳判别分量,它可以看成是在一个高维特征空间的线性判别分析。非线性映射 的作用是将低维输入空间中分布复杂的数据变为高维特征空间中分布简单的数 据,从而提高处理复杂数据时的特征提取能力。在i ( d d a 中非线性映射是通过引入 核函数计算特征空间中的内积,然后求解原特征分解问题的对偶问题寻我最佳投 影向量组隐式实现的。这样做避免了对大型矩阵作特征分解的问题。还有更多的 人脸识别综述文章见 2 7 2 8 2 9 。 9 华东师范大学硕士学位论文 基于l o g - g a b o rk d - l d a 的人脸识别算法研究和实现 1 4 人脸识别研究的意义及应用 传统的p i n 加个人密码的身份认证机制是现在最简单最流行的方式之一,但 其本身存在着诸多弊端,如密码难记且易遗忘、可能被黑客攻破、密码可能被盗 窃、破译等,尤其是为了便于记忆,人们通常以自己的生日、姓名等为密码,。密 码的安全性受到严重威胁。另外,在敲击密码的过程中,别有用心的人很容易窃 取密码,如采用摄像机可以录下用户所输入的密码。据统计,全球每年涉及的诈 骗案至少为信用卡5 亿美元、移动电话1 0 亿美元和取款机3 0 亿美元。 由于传统身份识别存在着以上提到的这些缺陷,采用生物识别技术进行个人 身份鉴定,取代传统的使用钥匙、身份证、密码等方法,可广泛应用于银行、机 场、公安等领域的出入管理。生物识别技术是目前最为方便与安全的识别技术, 它不需要记住复杂的密码,也不需随身携带钥匙、智能卡之类的东西。生物识别 技术认定的是人本身,没有什么能比这种认证方式更安全、更方便了。由于每个 人的生物特征具有与其他人不同的唯一性和在一定时期内不变的稳定性,不易伪 造和假冒,所以利用生物识别技术进行身份认定,安全、可靠、准确。此外,生 物识别技术产品均借助于现代计算机技术实现,很容易配合电脑和安全、监控、 管理系统整合,实现自动化管理。人们期待着能有一种低成本、安全、方便的生 物识别方式,而人脸识别技术因其无需用户过多参与、非接触式的数据采集方式、 对用户无任何损害、便于隐藏等优点而普遍为人们所看好,被称为2 1 世纪最有前 途的身份验证方法。 据各种组织和机构的报告,2 0 0 7 年全球生物识别市场总规模大约为5 6 亿美 元,同时国内生物识别市场的总容量大约在3 5 个亿的市场规模。保守地估计到 2 0 0 7 年全球生物识别将形成年销售1 3 6 1 7 0 亿美元的市场,而其中人脸识别市场 将达到4 7 6 - _ 5 9 5 亿美元的市场规模。中国作为发展中国家,人脸识别技术潜在 市场同样巨大。在国家安全、军事安全、金融、公安、司法、民政、海关、边境、 口岸、民航、保险以及社会安防、民用安防等领域,急需人脸识别的相关产品来 填补市场空白。现在指纹机和手形机的市场占有率为3 4 和2 6 ,而基于人脸识别 的产品,有一些,但是比较少,不到1 的市场,其具有广大的市场价值。表l - 3 罗列了人脸识别技术在各领域的典型应用。 人脸识别是一个典型的交叉学科研究课题,涉及到人工智能、模式识别、计 算机视觉、计算机图形学、统计学、认知科学、神经科学、生理学以及心理学等 多门学科的知识。很多大学和科研机构把人脸识别问题作为相关领域教学和研究 的模型问题。对这一问题的研究和解决,有助于对其他对象识别问题的研究分析 和解决,人脸识别也因此成为这些基础研究领域的重要课题之一,具有重要的理 1 0 华东师范大学硕士学位论文 基于l o g - c 怊b o r 和k d - l d a 的人脸识别算法研究和实现 论研究价值。 表1 , - 3 人脸识别典型应用 应用场合 说明 考勤f 3 禁 可以满足大型企业考勤门禁需要,直接利 用人脸特征,省去诸如智能卡等额外成 本,速度快,界面友好 照片比对 在公安部门,通过犯罪嫌疑人的照片比 对,为案件侦查和量刑提供依据,减少人 工照片比对花费。 群瓣瀚恐显嵩黼秒同 会场敏感人物在监控录像实时监控列入黑名单人员,保 监控障会场秩序。 柔萎自动登录提供个性友好的登录界面 娱乐如真实照片变漫画、互动虚拟游戏 1 5 本文所做工作 本文的主要贡献如下: 1 ) 调查并总结了主要的人脸识别算法: 2 ) 提出了一种新的基于l o g - g a b o r 和k d - l d a 的人脸识别算法: 3 ) 利用i m p r o v e da d a b o o s t 提取l o g - g a b o r 特征,并且优化了a d a b o o s t 的弱 分类器: 4 ) 对新算法进行了实验测试: 5 ) 设计并实现了2 个人脸识别应用系统。 1 6 论文组织结构 本论文各章的组织结构如下: 第一章为绪论部分。主要介绍了本论文的研究背景,介绍了人脸识别的问题 描述、研究意义,历史回顾、主要算法,最后给出了本文的主要工作。 第二章介绍t l o g - g a b o r 特征。讨论t g a b o r 与l o g - g a b o r 的相异之处,为什 么l o g - g a b o r 特征能很好地表示图像。 第三章介绍了四个特征选取的方法,重点介绍了p c a 原理。 华东师范大学硕士学位论文基于l o g 一3 a b o r 和k d - l d a 的人脸识别算法研究和实现 第四章讲述了i ( d d a 算法。介绍了l d a 的基本原理,由l d a 开始,至u d i r e c tl d a , 再到k e r n e ld i r e c tl d a 的推导过程。 第五章提出一种新的人脸识别算法。利用l o g g a b o r 特征,然后利用第三章 介绍的方法进一步选取l o g g a b o r ,然后利用k d d a 得到特征向量。 第六章设计并实现2 个人脸识别的应用系统。 第七章在对全文进行总结的基础上。提出了后续研究课题。 华东师范大学硕士学位论文 基于l o g - g a b o r 和k d - l d a 的人脸识别算法研究和实现 第2 章l o g - g a b o r 特征 2 1g a b o r 滤波器 g a b o r 函数由d e n n i sg a b o r 于2 0 世纪4 0 年代提出 3 6 】,后来被jd a u g m a n 将 c , a b o r i 函数作为滤波器并且扩展到t 2 d 情况1 3 7 ,用来模拟具有方向选择性的简 单细胞的感受野。2 d 形式的g a b o r 滤波器定义为一个用高斯包络函数约束的平 面波,形式如式2 - 1 : 吲乎琴唧降纠一割 越, 其中,第一个指数项为局部化振荡部分的g 删s s i 锄窗。方括号中的第一项决 定了g a b o r 核的震荡部分。第二项则为直流分量增益,以避免过滤器响应对于图 像亮度绝对值的依赖。不难看出,复数形式的g a b o r 核函数是奇( 正弦波) 偶( 余 弦波) 项的组合。其中,参数控制着高斯窗口的宽度、振荡部分的波长和方 向,参数盯则决定了窗口宽度和波长的比例关系,亦即高斯包络函数所影响的震 荡数目。图2 1 给出了式二l 定义的一个g a b o r 核函数的实部和虚部在空域中的 形状。 圈2 - 1g a b o r 空域形状 ( i ) 实部( b ) 虚部 摘1 3 0 l c _ m b o r 滤波器具有许多良好的性质: 1 ) g a b o r 滤波器具有生物学的意义。有研究表明g a b o r 核函数与哺乳动物大 脑视觉皮层细胞感受野形状十分类似,图2 - 2 展示了哺乳动物视觉皮层感 受野和g a b o r 函数的相似性。 1 3 华东师范大学硕士学位论文基于l o g - g a b o rk d - l d a 的人脸识别算法研究和实现 圈2 - 2 哺乳动物视觉皮层感受野和g a b o r 函数比较 摘1 1 1 3 1 2 ) g a b o r 滤波器能充分描述图像的纹理信息。g a b o r 滤波特性说明了g a b o r 滤波结果是描述图像局部灰度分布的有力工具。因此,图像的纹理信息可 以用g - a b o r 滤波作为特征提取的方法。 3 ) 对二维g a b o r 滤波的研究表明。通过恰当选择若干个g a b o r 核函数可以重 构出原图像。因此g a b o r 核函数可以用做物体的建模和表示【3 2 】。 4 ) g a b o r 核函数去掉了直流分量,对局部光照影响不敏感。 2 2 l o g - 4 3 a b o r l o g - g a b o r 函数是g a b o r 函数的另一种表述形式,由f i e l d 在1 9 8 7 年提出【3 4 】。 它不受带宽影响,可以构造出任意带宽和零d c 分量的滤波器。有研究表明, l o g - g a b o r 可以比g a o b r 能更好的表示自然图像。式2 - 2 是二维l o g - g a b o r 滤波 器在极坐标中的表达形式【3 3 】。 姒刃= g 印= 唧( 一嬲h 一可( o - c o ) 2 ) 一 其中,g 为尺度因子,g ( 印为角度因子,石为滤波器中心频率、| 为带 宽、为偏移角度,各参数取值如表2 1 所示。 式2 - 2 实际是一个频域函数,由于函数的复杂性,我们无法给出其在空间域 上的表达形式,但由于只是在离散图像上使用,所以可以对其作反离散傅立叶变 换,得到其在空间域上的离散l o g - g a b o r 函数图像( 图2 - 3 ) 。 1 4 华东师范大学硕士学位论文基于l o g 上, e b o r 和k d - l d a 的人脸识别算法研究和实现 裹2 - l o o - g a b o r 参数取值 o ,6j 日= 1 , , t o = 5 s - - 4 口,2o 7 5黾= l 石 n s = l , - 以 ,i 。,_ 3 0 x o 删抽雾 k - o 俩0 a o = f ( 一t ) c r 0 = 叫s 0 廊) a = a m a n ( - y ) , 圈2 - 3l o g - g i b e r 空域形状( 尺度为2 、方向为3 ) ( 叠) 实部( b ) 虚部 使用式2 3 ,可以求得每个方向和8 尺度上的l o g - g a b o r 特征。 , a s2 幽( 册叮2 ( g k 地乃7 议,m m a s k 式2 - 3 其中,吒。表示在n s 尺度、n o 方向的频域l o g g a b o r 滤波器、,表示标准 化后的图像、f f t 2 表示2 d 离散f f t 变换,f f t 2 表示2 d 离散傅立叶反变换、, 表示矩阵对应元素相乘、a b s 表示求复数幅值。为了消除背景的影响,引入一个 m a s k ,这个m a s k 跟预处理时的m a s k 一样。 如此得到经过n s 尺度方向l o g - g a b o r 滤波的特征图像,标记为n o ,n s 。观 察图2 - 3 可以发现,用这样形状的图像做卷积,实际上就是增强了图像的边缘部 分,而边缘部分总是对识别非常有利。而且这种边缘增强不是单纯的增强,它还 具有方向和尺度的选择性,保留了图像的局部特征,使后续识别更具鲁棒性。我 们取滤波图像的幅值,幅值图像反映图像的能量( 如图2 - 4 ) 。 华东师范大学硕士学位论文 基于l o g - g a b o r 和k d - l d a 的人脸识别算法研究和实现 图2 4 ( a ) 输入人脸图像( b ) 2 4 个l o g - g a b o r 滤波的幅值 第3 章几种特征选取方法 第2 章介绍了用l o g - g a b o r
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025医院护理三基培训考试试题(附答案)
- 2025年项目管理与实施知识考察试题及答案解析
- 药店GSP认证质量管理体系文件培训考试试题及答案
- 2025年安全员考试考题及参考答案
- 2025年酒店前台服务员技能考核试题及答案
- 2025年文书档案考试题库及答案
- 2025年人工智能应用开发考试试题及答案
- 内科主治医师内科学考试历年真题及答案
- 交通事故伤残赔偿项目计算标准
- 2025年科普知识竞赛题及答案
- GB/T 2481.2-2020固结磨具用磨料粒度组成的检测和标记第2部分:微粉
- 糖尿病肾病诊治进展 课件
- 安全员之A证(企业负责人)【含答案】
- MoldFlow实例分析报告-中英文对照课件
- 部编 二年级语文上册 第五单元【集体备课】课件
- 泸定桥的资料
- 工业硅项目可行性研究报告
- 烟草专卖执法案件知识讲稿课件
- 《神经病学》(英文)课件11.Peripheral Neuropathy
- PID图(工艺仪表流程图)基础知识培训
- 预应力管桩单桩竖向承载力特征值计算表格
评论
0/150
提交评论