(计算机应用技术专业论文)人脸识别算法的研究(1).pdf_第1页
(计算机应用技术专业论文)人脸识别算法的研究(1).pdf_第2页
(计算机应用技术专业论文)人脸识别算法的研究(1).pdf_第3页
(计算机应用技术专业论文)人脸识别算法的研究(1).pdf_第4页
(计算机应用技术专业论文)人脸识别算法的研究(1).pdf_第5页
已阅读5页,还剩63页未读 继续免费阅读

(计算机应用技术专业论文)人脸识别算法的研究(1).pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士论文摘要 摘要 身份识别鉴定是各行各业保证系统安全的必要措施。在国家安全、司法、金 融、电子商务、电子政务等应用领域迫切需要。目前工程化的身份识别主要依靠 非生物特征的d 卡密码、口令等,其安全性低,只能用于要求不高的环境。在 要求较高的环境已经采用了具有生物特征的指纹、虹膜、掌纹等进行识别。但是 在数据采集方面手续比较繁琐,限制了它们的应用范围。人脸作为最直观的生物 识别方法,应用于机器识别的方便和快捷是显而易见的。 本文首先对于人脸识别的前期工作图像的增强进行了研究。对于通常应用的 图像增强方法,空域处理方法和频域处理方法进行了实现和效果的对比,找出了 最适合的应用与本次实验的图像标准化方法。 然后,通过对于在人脸识别中主成分分析方法( p c a ) 的研究,发现p c a 方法被广泛应用在特征提取和识别方面,而线性主成分对于具有线性结构( 或线 性特征) 的观测数据具有较好的降维效果但是在人脸识别中的观测数据并非为 线性结构。本文提出了对数线性比主成分分析方法对于非线性结构选用适当的曲 面作坐标面,构造出非线性主成分。实验证明对数线性比主成分分析作为一种广 义主成分分析方法对提高人脸识别率以及高维向低维空间的投影都有很好的效 果。 最后,在分类器部分采用p c a 和s v m 相结合的方法进行人脸识别。s v m 上 是一种二分类问题,在处理多分类问题上存在一些局限性。本文提出了一种倒置 二叉树的方法来解决这样的多分类问题。它和o n e - a g a i n s t a l l 相比具有分类唯一性 的特点,和o n e - a g a i n s t - o n e 相比大大减少了需要建设分类器的数量,体现出比传 统方法的优越性。 关键词:人脸识别、主成分分析、对数线形主成分分析、支持向量机、倒置二 叉树 硕士论文 a b s t r a c t a b s t r a c t w i t hs e c u r i t yo f e n t r yc o n g o la n ds e c u r i t yo f i n f o r m a f i o ni n c r e a s i n gq u i c k l y , i d e n t i t yi d e n t i f i c a t i o ni sn e c e s s a r yp r e m i s eo f e n s u r es y s t e ms e c u r i t yi nc o u n t r y s e c u r i t y 、j u d i c a t u r e 、e - b u s i n e s s 、e g o v e r n m e n ta n d s oo n ,t h e yn e e da c c u r a t ei d e n t i t y i d e n t i f i c a t i o n 。 n o w ,t h eu s eo fi d e n t i t yi d e n t i f i c a t i o nd e p e n do ni dc a r d ,f o re x a m p l e ,i d e n t i t y c a r d w o r kc a r d , i n t e l l e c tc a r d , c o m p u t e rm a r kc a r d , s a v i n gc a r da n ds oo n ,a n d c r y p t o g r a mm e a n sm a i n l y t h e i rs e c u r i t yi sl o w , t h e yo n l yc a l lu s e i nt h e s ea p p l i e s t h a tt h e i rd e m a n df o rs e c u r i t yi sl o w p e o p l eh o p et h e yh a v em o r ec o n v e n i e n ta n d m o r ec r e d i b l em e a n st oi d e n t i f yp e o p l ei d e n t i f i c a t i o n b i o l o g i c a lf e a t u r er e c o g n i t i o n c a nt u r ni tt ob et r u e i nt h e s ea p p l i e st h a tt h e i rd e m a n df o rs e c u r i t yi sh i g h ,p e o p l eu s e f m g e rr e c o g n i t i o nt e c h n i q u ea n d i r i sr e c o g n i t i o nt e c h n i q u ei nf a c t b u tt h e s e t e c h n i q u e sa r et r i v i a l n e s sf o rg e t t i n gd a t a f o rf a c er e c o g n i t i o nt e c h n i q u e ,p e o p l eu s e i taf e wt h o u s a n d sy e a r s u s i n gc o m p u t e rr e c o g n i z eh u m a nf a c e ,i sah o ta n dh a r d r e s e a r c h t h i sp a p e rm a i n l ys t u d yf a c er e c o g n i t i o na l g o r i t h ma n dr e a l i z ef a c er e c o g n i t i o n s y s t e m t h ep r i n c i p a lc o m p o n e n ta n a l y s i si sa p p l ya b r o a di nf a c e to fc h a r a c t e rd i s t i l l a n di d e n t i f yi nf a c er e c o g n i z e a n dt h ep r i n c i p a lc o m p o n e n ta n a l y s i sh a se f f e c tt o d r o pd i m e n s i o nf o r t h eo b s e r v a t i o nd a t ao fl i n e a r i t yc o n f i g u r a t i o n ( o rl i n e a r i t y c h a r a c t e r ) b u ti nf a c er e c o g n i z e ,t h eo b s e r v a t i o nd a t ai sn o tl i n e a r i t yc o n f i g u r a t i o n t h el o g a r i t h ml i n e a r i t yr a t i op r i n c i p a lc o m p o n e n ta n a l y s i sc o n s t r u c tn o n l i n e a r i t y p f i n c i p a l ,a n dc h o o s ep r o p e rh e a ds u r f a c et od oc o o r d i n a t es u r f a c ef o rt h en o n l i n e a r i t y c o n f i g u r a t i o n e x p e r i m e n tp r o v et h el o g a r i t h ml i n e a f i t yr a t i op r i n c i p a lc o m p o n e n t a n a l y s i sh a sg o o de f f e c tf o ra d v a n c ei d e n t i f yr a t i oa n df o rh i g hd i m e n s i o nt o l o w d i m e n s i o nd i m e n s i o n a lp r o j e c t i o n ,a sak i n do fg e n e r a l i z e dp r i n c i p a lc o m p o n e n t a n a l y s i s a d o p tp c a a n ds v mb ea s s o c i a t i v em e t h o df o rf a c er e c o g n i t i o n s v mi sak i n d o f t o w c l a s sp r o b l e m b u ti th a ss o m el o c a l i z a t i o ni nm u l t i - c l a s sr e c o g n i t i o n t h i s l e t t e rt a l ka b o u tb o t t o m u pb i n a r yt r e et or e s o l v et h i sm u l t i c l a s sr e c o g n i t i o n c o m p a r e i i 硕士论文a b s t r a c t o n e - a g a i n s t - a l l ,i th a sc h a r a c t e r i s t i co f a l o n ew a y t oc l a s s a n dc o m p a r e o n e - a g a i n s t - o n e ,i tr e d u c ea m o u n to f b u i l d i n gc l a s s m a c h i n ev e r ym u c h ,e m b o d i m e n t a d v a n t a g ec o m p a r et ot h et r a d i t i o n a lw a y k e y w o r d :l o g a r i t h ml i n e a r i t yr a t i o 、p c a 、f a c er e c o g n i t i o n 、s v m 、b o t t o m - u p b i n a r yt r e e i i i t ” ,、 、 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作 及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为 获得鞍山科技大学或其它教育机构的学位或证书面使用过的材料,与 我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确 朐说明并表示了谢意。 签名:蹇缸日期:碰一! :兰 关于论文使用授权的说明 本人完全了解鞍山科技大学有关保留、使用学位论文的规定, 即:学校有权保留送交论文的复印件,允许论文被查阅和借阅:学校 可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手 段保存论文。 ( 保密的论文在解密后应遵守此规定) 觞、 l e t 期:趁垂:厶 硕士论文第一章引言 第一章引言 随着全球范围内电子商务的迅速兴起,人们可以通过i n t e r n e t 等开放式网 络进行在线电子交易等商务活动。同时,由于网络上存在着大量敏感的个人、军 队、政府的信息,这些信息只有得到授权的人才能进行访问,因此网络安全成为 网络发展的一个关键问题,而身份鉴别作为网络安全的一个重要方面越来越受到 人们的重视。 关于个人身份鉴别的问题可以分为两类:认证和识别。认证指的是验证用户 是否为他所声明的身份,识别指的是确定用户的身份。身份的鉴别主要基于持有 物,如各种证件:所了解的信息,如口令或密码:生理或行为特征。如指纹、手形、 声音、签名等。第三种方法就是现在引起人们广泛兴趣的生物特征识别技术,它 是基于个人独特的生理或行为特征进行自动身份鉴别的技术。因为生物特征不会 像密码那样容易被忘记和破解,也不会像持有物那样容易被窃取或转移,因此人 们认为生物特征识别将是一种更加可靠、方便、快捷的大众化身份识别手段。 人的任何生理或行为特征只要它满足下面的条件,原则上就可以作为生物特 征用于身份鉴别普遍性,每个人都具有:唯一性。任何两个人都不一样:稳 定性,这种特征至少在一段时间内是不变的;可采集性,可以定量测量。然而, 满足上述条件的生物特征对一个实际的系统却未必可行,因为实际的系统还必须 考虑:性能,即识别的准确性、速度、鲁棒性以及为达到所要求的准确性和速度 所需要的资源;可接受性,人们对于一种特定的生物特征识别在日常生活中的 接受程度;可欺骗性,用欺诈的方法骗过系统的难易程度。因此。一个实际的生 物特征识别系统应做到:在合理的资源需求下实现可接受的识别准确性和速 度:对人没有伤害而且可为人们所接受;对各种欺诈方法有足够的鲁棒性。 1 1 生物识别技术研究现状 典型的生物特征识别系统,逻辑上包括两个模块:注册模块和识别模块在注 册模块中首先登记用户的姓名,通过生物特征识别传感器得到用户的生物特征信 息,然后从获取的数据中提取出用户的特征模式,创建用户模板,存储在数据库中 在识别模块中同注册过程一样获取用户的生物特征信息,提取出特征模式,然后 与事先注册在数据库中的模板相匹配。 硕士论文第一章引言 目前人们研究和使用的生物特征识别技术主要有:人脸识别、虹膜识别、手 形识别、指纹识别、掌纹识别、签名识别、声音识别等。 指纹识别是最古老的生物特征识别技术,在很多领域中都得到了成功的运用 指纹指的是指尖表面的纹路,其中突起的纹线称为脊,脊之间的部分称为谷指纹 的纹路并不是连续、平滑流畅的,而是经常出现中断、分叉或转折,这些断点、分 叉点和转折点,称为细节,就是这些细节提供了指纹唯一性的识别信息【2 i 。 虹膜是一个位于瞳孔和巩膜之间的环状区域。与其它的生物特征相比,虹膜 识别具有:高独特性,虹膜的纹理结构是随机的,其形态依赖于胚胎期的发育:高 稳定性,虹膜可以保持几十年不变,而且不受除光线之外的周围环境的影响;防伪 性好,虹膜本身具有规律性的震颤以及随光线变化而缩放的特性,可以识别出图 片等伪造的虹膜;易使用性,识别系统不与人体相接触;分析方便,虹膜固有的环 状特性,提供了一个天然的极坐标系【3 1 i ”。 手形的测量比较容易实现,对图像获取设备的要求较低,手形的处理相对也 比较简单,在所有生物特征识别方法中手形认证的速度是最快的。然而手形特征 并不具有高度的唯一性,不能用于识别,但是对于一般的认证应用,它足可以满足 要求5 【6 】。 与指纹识别相比,掌纹识别的可接受程度较高,其主要特征比指纹明显得多, 而且提取时不易被噪声干扰,另外,掌纹的主要特征1 7 j 比手形的特征更稳定和更 具分类性,因此掌纹识别应是一种很有发展潜力的身份识别方法。 签名识别是一种行为识别技术,目前签名大多还只用于认证。签名认证的困 难在于,数据的动态变化范围大【8 】,即使是同一个人的两个签名也绝不会相同。 声音识别也是一种行为识别技术,同其它的行为识别技术一样,声音的变化 范围比较大,很容易受背景噪声、身体和情绪状态的影响。 人脸识别是一个活跃的研究领域。虽然人脸识别的准确性要低于虹膜、指纹 的识别,但由于它的无侵害性和对用户最自然、最直观的方式,使人脸识别成为最 容易被接受的生物特征识别方式。 1 2 人脸识别技术的发展与现状 人脸识别( f a c er e c o g n i t i o n ) 是指,基于已知的人脸样本库,利用图像处理 和模式识别技术从静态或动态场景中,识别或验证一个或多个人脸。通常识别处 理后可得到的基本信息包括人脸的位置、尺度和姿态信息。利用特征提取技术还 硕士论文第一章b 言 可进一步抽取出更多的生物特征( 如:种族、性别、年龄) 。人脸识别技术在 国家重要机关及社会安防领域具有广泛而特殊的用途。例如:公安系统的视觉监 控、证件和各类金融卡持有人的身份验证等。同其它人体生物特征( 如:指纹、掌 纹、虹膜、语音等) 识别技术相比,人脸识别技术的隐蔽性最好,是当今国际反恐 安防最重视的科技手段和攻关目标之一。另外,人脸识别技术还可应用于多媒体 数据库的视频检索,以及多媒体制作方面。近几年,随着计算机硬件和软件技术的 发展,基于人脸识别技术的表情信息提取也成为可能,它可用于改进人机交互方 式,从而产生更加人性化、智能化的计算机系统。人脸识别技术的发展正是受到 商业应用需求的推动,以及相关技术的发展而得到空前的重视,成为图像识别和 理解领域中的研究热点。 近几年的研究表明,人类视觉数据处理是多层次的过程。其中最低层的视觉 过程( 视网膜功能) 起信息转储作用,即将大量图像数据转换为较为抽象的信息, 这一任务由视网膜中的两类细胞完成:低层次的细胞对空间的响应与小波变换作 用类似,高层次的细胞则依据低层次细胞的响应,而做出具体的线、面乃至物体模 式的响应。这表明在视觉处理过程中,神经元并不是随便地不可靠地把视觉图像 的光照强度转手投射到感觉中枢。它们可以检测模式单元,区分物体的深度。排除 无关的变化因素,并组成一个使人感兴趣的层次结构。人脸识别不仅有着以上普 通视觉过程的特点,而且具有以下独特之处:( 1 ) 针对人脸识别,大脑中存在一个 专门的处理过程。经过长期的研究,人们发现大脑对人脸形状有着特殊的兴趣。 ( 2 ) 不同的局部特征作用对识别的贡献也不同。研究也表明,头发、人脸轮廓、眼 睛以及嘴巴对识别和记忆有着重要影响,鼻子的作用则不是很重要。通常来讲人 脸的上部比下部对识别作用更大些。( 3 ) 不同空间频率上信息的作用不同。低频 信息代表了整体的描述,高频信息包含了局部的细节。对于性别的判断,仅利用低 频信息就足够了,对身份识别没有高频信息就无法完成。( 4 ) 光照对视觉的影响。 有实验表明,从人脸底部打光会导致识别困难。( 5 ) 动态信息比静态信息更利于识 别。研究还发现,对熟悉的人脸,人类的识别能力在动态场景中要高于静态场景。 ( 6 ) 面部表情的分析与人脸识别并行处理。通过对脑部受损的病人研究表明,表情 的分析与识别虽有联系,但总体来说是分开处理的。 人脸识别系统的框架可以用图卜1 表示。 硕士论文第一章引言 输入图象 1 3 人脸检测和定位 图1 - 1 人脸识别系统的框架 人脸检测和定位是人脸识别的第一步,它的重要性日益受到关注。所谓人脸 检测是指在图像或是视频中检测出人脸,主要解决的问题是人脸在图象中的位 置、数目和尺寸。人脸检测问题最初来源于人脸识别,是自动人脸识别系统中的 一个关键环节,但是早期的人脸识别研究主要针对具有较强约束条件的人脸图像 ( 如无背景的图像) ,往往假设人脸的位置己知或很容易获得,因此人脸检测问 题并未受到重视。近几年随着电子商务等应用的发展,人脸识别成为最有潜力的 生物身份验证手段,这种应用背景要求自动人脸识别系统能够对一般的环境图像 具有一定的适应能力,由此所面临的一系列问题使得人脸检测开始作为一个独立 的课题受到重视。今天,人脸检测的应用背景已经远远超出了人脸识别系统的范 围,在基于内容的检索、数字视频处理、视觉监测等方面有着重要的应用价值。 人脸检测的难度在于:首先,由于人脸外观、表情和皮肤颜色不同,模式会 有所变化:第二,一些常见的物体,如镜子和胡子,会使用同一张脸的模式发生 变化;第三,人脸实质上是三维物体,光照的变化会引起脸部模型和阴影的很大 变化。 4 硕士论文 第一章引言 人脸检测和定位的过程可以分为2 步:自动分割,即寻找人脸和眼睛、鼻子、 嘴的区域:识别,即将人脸与背景中其他种类的模式区分开。 人脸检测的方法大体可以分为基于统计和基于知识两类。前者将人脸图像视 为一个高维向量,从而将人脸检测问题转化为高维空间中分布信号的检测问题: 后者则利用人的知识建立若干规则,从而将人脸检测问题转化为假设验证问题。 1 4 常用的人脸识别方法 通常,人类进行人脸识别依靠的感觉器官包括,听觉、嗅觉、触觉等,一般 人脸识别可以用单个感官完成,也可以是多感官相配合来储存和检索人脸,而计 算机的人脸识别所利用的则主要是视觉数据。早期的研究者采用一些简单的人脸 几何特征,如眼中心处对应的眉毛的位置和厚度、眉毛的弧度、嘴的宽高、脸的 宽度等识别人脸,这称为基于几何特征的识别方法。另一种方法是通过计算输入 图像与库中图像的相关程度来识别人脸。基于几何特征的方法需要提取准确的人 脸特征,对图像质量要求较高,使其应用受到较大限制。基于模板的整体匹配思 想,近年来很多新的方法获得了发展。人脸自动识别技术经过多年来的研究,已 经积累了大量研究成果。但是,非约束环境下的人脸识别仍然面临着很多困难, 除了要准确快速的检测并分割出人脸部分,有效的变化补偿、特征描述和准确的 分类将成为今后的主要研究主题。 1 4 1 几何特征方法 常采用的几何特征有人脸的五官如眼睛、鼻子、嘴巴等的局部形状特征,脸 型特征以及五官在脸上分布的几何特征。提取特征时往往要用到人脸结构的一些 先验知识。在这种基于几何特征的识别中,识别总归为特征矢量之间的匹配,基于 欧氏距离的判决是最常用的识别方法。侧影识别是最早的基于几何特征的人脸识 别方法,主要是从人脸侧面轮廓线上提取特征点入手。一般将侧影简化为轮廓曲 线,从中抽取若干基准点,用这些点之间的几何特征来进行识别。由于现在的证件 照片多为正面,而且侧面照片约束很多,所以对侧面人脸识别的研究最近已不多 见。正面人脸识别最关键的第一步是合适的归一化,使之不依赖于图像中人脸位 置的尺度和旋转变化。识别所采用的几何特征是以人脸器官的形状和几何关系为 基础的特征矢量,其分量通常包括人脸指定两点间的欧式距离、曲率、角度等。 基于几何特征的识别方法具有如下优点:符合人类识别人脸的机理,易于 硕士论文第一章引言 理解:对每幅图像只需存储一个特征矢量,存储量小:对光照变化不太敏感。 这种方法同样存在如下问题:从图像中抽取稳定的特征比较困难,特别是特征 受到遮挡时:对强烈的表情变化和姿态变化的鲁棒性较差:一般几何特征只 描述了部件的基本形状与结构关系忽略了局部细微特征,造成部分信息丢失,更 适合于粗分类。 1 4 2 模板匹配方法 模板匹配法是一种经典的模式识别方法,这种方法大多是用归一化互相关联 直接计算两幅图像之间的匹配程度。由于这种方法要求两幅图像上的目标要有相 同的尺度、取向和光照条件,所以预处理要做尺度归一化和灰度归一化的工作。 最简单的人脸模板是将人脸看成。个椭圆【9 】f 1 0 1 ,检测人脸也就是检测图像中 的椭圆。另一种方法是将人脸用一组独立的小模板表示,如眼睛模板、嘴巴模板、 鼻子模板、眉毛模板和下巴模板等。但这些模板的获得必须利用各个特征的轮廓, 而传统的基于边缘提取的方法很难获得较高的连续边缘。即使获得了可靠度高的 边缘,也很难从中自动提取所需的特征量。为此,用弹性模板方法提取特征显示出 其独到的优越性l 。弹性模板由一组根据特征形状的先验知识设计的可调参数所 定义。为了求出这组参数,需要利用图像的边缘、峰值、谷值和强度信息及特征 形状的先验知识设计合适的能量函数。参数向能量减小方向调整,当能量达到最 小时,这组参数对应的模板形状最符合特征形状。 p o g g i o 和b r u n e li 1 1 2 】专门比较了基于几何特征的人脸识别方法和基于模板 匹配的人脸识别方法。并得出结论:基于几何特征的人脸识别方法具有识别速度 快和内存要求小的优点,但在识别率上模板匹配要优于基于几何特征的识别方 法。增加几何特征对于基于几何特征的人脸识别方法只能轻微地提高识别率因为 要提高几何特征的提取质量本身就十分困难,而且随着图像质量的下降和人脸遮 挡的引入,基于几何特征的人脸识别效果会大幅下降。总之,认为模板匹配法要优 于几何特征法。 1 4 3p c 特征脸方法 k l 变换是图像压缩中的一种最优正交变换人们将它用于统计特征提取,从 而形成了子空间法模式识别的基础若将k l 变换用于人脸识别,则需假设人脸处 于低维线性空间,且不同人脸具有可分性由于高维图像空间k l 变换后可得到一 组新的正交基,因此可通过保留部分正交基,以生成低维人脸空间而低维空间的 6 硕士论文 第一章引言 基则是通过分析人脸训练样本集的统计特性来获得k l 变换的生成矩阵可以是 训练样本集的总体散布矩阵,也可以是训练样本集的类问散布矩阵,即可采用同 一人的数张图象的平均来进行训练,这样可在一定程度上消除光线等的干扰,且 计算量也得到减少,而识别率不会下降 k l 变换在9 0 年代初受到了很大的重视,实际用于人脸识别也取得了很好的 效果,其识别率从7 0 1 0 0 不等,这取决于人脸库图像的质量从压缩能量的角 度来看,k l 变换是最优的,它不仅使得从n 维空间降到m 维空间前后的均方误差 最小,而且变换后的低维空间有很好的人脸表达能力,然而这不是说已经具有很 好的人脸辨别能力选择训练样本的散布矩阵作为k l 变抉的生成矩阵,是由于其 最大特征向量抓住了该样本集合的主要分布,但这是图像统计,而不是人脸统计 方法。 在人脸识别上的应用最早是由k i r b y 等提出来的,t u r k 等后来把它成功地发 展为特征脸( e i g e n f a c e ) 1 1 2 1 方法,用于正面的人脸识别特征脸的思想就是从训 练图像中,通过主元分析得到一组特征脸图像( 即对应的主元) ,那么任意给定的 人脸图像都可以近似为这组特征脸图像的线性组合,用组合的系数作为人脸的特 征向量经典的特征脸方法是采用基于e u c l i d e a n 距离的最近中心分类器,后来 比较常用的是基于e u c l i d e a n 距离的最近邻,也有采用基于m a h a l a n o b i s 距和余 弦。 随着特征脸方法的成功之后,随后出现了许多种基于主元分析的人脸识别方 法p e n t l a n d 等利用对每个视角都作局部主元分析,来实现多视角人脸识 别m o g h a d d a m 等根据主元分解后的两个正交的子空间的特性,提出基于主元分 析的贝叶斯框架文中讨论了在简单情况下可用单高斯函数来描述样本在主元子 空间的分布,在存在光照、姿态等变化的复杂情况下,应选择混合高斯形式,混合 高斯的参数可通过e m 算法来估计不过对人脸识别而言,用混合高斯来描述有些 不切实际。因为它通常需要一定量的训练样本才能得到可靠的结果l i u 等提出 结合主元分析的概率推理模型,假设在主元子空问中每类的类条件概率服从一正 态分布基于分层的主元概率子空间方法的思想是分别用主元分析去提取与描述 人脸的类内变化和类问变化的特征,然后再结合文献中的思想,用贝叶斯决策规 则来分类实验的结果表明结合贝叶斯分类框架和主元分析的人脸识别方法比经 典特征脸方法要优越些,这说明了贝叶斯决策的优越性提出了e i g e n h i l 的方法 实际上是先对原始图像采用边缘滤波和局部平滑的预处理,再利用主元分析提取 特征,实验表明可以更有效地处理人脸图像中的丰富表情变化 硕士论文第一章引言 主元分析中主元选取的优先级通常是按对应的特征值大小来确定的特征值 越大,其优先级就越高但是就人脸识别而言,应该选择多少个主元是最佳的,目 前常用的标准有两种:当对应的特征值和最大的特征值相比小于一定值时就不 要了;选择的特征值之和与总的特征值之和的比值要大于等于0 9 。 尽管主元分析在人脸识别中取得了不错的效果,但是由于它是以所有样本的 最优重建为目的,因此对于描述不同类样本之间的差异而言,它不一定是最优的 描述从这个意义上说,用它来描述人脸识别的特征是不充分的。 1 4 4 神经网络方法 神经网络在人脸识别应用中有很长的历史早期用于人脸识别的神经网络主 要是k o h o n e n 自联想映射神经网络,用于人脸的“回忆”。所谓“回忆”是指当输 入图像上的人脸受噪声污染严重或部分缺损时。能用k o h o n e n 网络恢复出原来完 整的人脸。c o t t r e l l 1 3 1 等人使用级联b p 神经网络进行人脸识别,对部分受损的 人像、光照有所变化的人像,个人识别能力较好。i n t r a t o r 等人【”j 用一个无监督 监督( b c m b p ) 混合神经网络进行人脸识别。其输入是原始图像的梯度图像, 以此可以去除光照的变化。无监督学习的目的是寻找类的特征,有监督学习的目 的是减少训练样本被错分的比例。这种网络比用b p 网络提取的特征更明显,所以 识别率更高,如果用几个网络同时运算,求其平均,识别效果还会提高。 r o w l e y ”】建立了一种三层向前网:输入层对应2 0 2 0 像素的图像区域:隐层 分为2 6 个单元,其中4 个单元处理区域为1 0 1 0 像素,1 6 个单元为5 5 ,6 个单 元为2 0 5 如图卜2 。隐层的输出与输出层相连进行综合判断,输出区间 一1 ,1 的值表示这个区域是否为人脸。为了解决人脸姿态的问题,r o w l e y 分别设置了 三个姿态检测器,对输入图像先进行预处理,尽量消除光照的影响,然后送入姿态 检测器,估计人脸的姿态,经校准和预处理后,送入三个检测器( 正面人脸、半侧面 和侧面) ,最后对检测器的结果进行综合判断。 硕士论文 第一章引言 瞄输爿努嚣口口_ 凝 f 口盛刀0 0 0 0 z 竖! 爝嚣。瓣 z ,j 匕宠三跫了 uu u c o g o o 圈卜2 三层神经网络 l a w r a n c e 和g i l e s l 2 4 肄人用一个自组织特征映射( s o m ) 神经网络与卷积神经 网络结合的系统对一个有4 0 0 幅人脸图像、人均1 0 幅的数据库进行了人脸识别 研究。其中s o m 网络的作用是将图像样本量化到降维的拓扑空间,它使原空间中 相邻的输入点在输出空间中仍相邻。卷积网络用以实现相邻像素之间的相关性知 识从而在一定程度上实现了图像平移、旋转、尺度和局部变形的不变性。l i n 和 k u n g 2 5 】将神经网络方法和统计方法结合在一起,提出了一种基于概率决策的神 经网络p d b n 用于识别人脸。其主要思想是采用虚拟样本( 正反例) 进行强化和反 强化学习,从而得到较理想的概率估计结果,并采用模块化的网络结构加快网络 的学习。这种网络结构继承了决策神经网络d b n n 的结构,并加入概率变化。每个 子网对应一个人,这种结构不仅有利于训练和识别,而且有利于做硬件。 1 4 5 弹性图匹配方法 弹性图匹配方法是一种基于动态链接结构d i a l 2 6 1 的方法。它将人脸用格状的 稀疏图表示,图中的节点用图像位置的g a b o r 小波分解得到的特征向量标记,图 的边用连接节点的距离向量标记。匹配时,首先寻找与输入图像最相似的模型图, 再对图中的每个节点位置进行最佳匹配,这样产生一个变形图,其节点逼近模型 图的对应点的位置。w i s k o t t 2 7 等人使用弹性图匹配方法,以f e r e t 图像库做实 验,准确率达到9 7 3 。弹性图匹配方法对光照、位移、旋转及尺度变化都不敏 感,是一种优于特征脸方法的人脸识别方法。此方法的主要缺点是对每个存储的 人脸需计算其模型图。计算量大,存储量大。为此,w i s k o t t l 2 8 】在原有方法的基础 上提出聚束图匹配,部分克服了这些缺点。在聚束图中,所有节点都已经定位在相 9 v 却 硕士论文 第一章引言 应目标上。对于大量数据库,这样可以大大减少识别时间。另外,利用聚束图还能 够匹配不同人的最相似特征,因此可以获得关于未知人的性别、胡须和眼镜等相 关信息。l e e 2 9 1 等提出了一种基于弹性图动态链接模型的方法,既取得较高的识 别速度,也获得了较理想的识别率,在一定程度上克服了以往方法总是在速度与 识别率之间进行折中的缺点。 1 4 6 哪方法 隐马尔可夫( h 删) 提供了描述复杂现象的2 种可能机制。按照这种模型, 观测到的一列特征( 例如描述各个器官的脸庞的一组数值特征) 被看成是另一组 不可观测的( 因此是隐的) “状态”产生出的一列实现。状态既然是不可观测的, 它的个数是未知的,但可以假定,选择状态个数的多少必须在模型的复杂性和描 述复杂现象准确度之间进行折中。在h 删模型中包含了产生观察的两层概率。一 层是选择状态的概率。假定有n 个状态,从当前的状态出发选择下一个状态也有 n 个可能性。于是,状态选择概率必须用一个n xn 的状态转移矩阵来描述。另 一层是每个状态产生出一种实现的概率。如果实现取连续值,产生实现的概率就 应该用概率分布来描述。如果实现取连续值,产生实现的概率就应该用概率密度 来描述。一个合理的或好的h m m 模型应该是:给定一组观测序列,从关于状态 的适当的一组初始分布出发,能够产生出一组实现序列,它非常好的逼近给定的 观测序列。 基于人脸从上到下、从左到右的结构特征,s a m a r i a 3 0 l 等首先将卜oh 删和 2 一dp s e u d oh 删用于人脸识别。基于卜dh n d ,k o h i r 等采用低频d c t 系数作 为观察矢量获得了好的识别效果。e i c k e l e r 等采用了2 一op s e u d o :1 f 删识别d c t 压缩的j p e g 图像中的人脸图像。n e f i a n d l l 等采用不同的模型构成混合系统结构。 o t h m a n 等提出采用半连续的2 一dh 洲来解决每类训练样本不足的问题。 1 5 影响人脸识别的重要因素 人脸识别技术在实用化的过程中遇到很多困难,主要就是识别的过程要受到 许多因素的影响。 夺图像的质量 人脸识别系统过程中,用到的图像质量参差不齐,不可避免会对人脸识别准 确性有影响。图像质量好,画面清晰,识别的准确性就高,画面模糊不清,识别 l o 硕士论文 第一章引言 率就会降低。 夺混乱的背景 复杂的背景,不可避免的会对人脸识别造成干扰。同一个人,相同的表情和 光照条件f ,不同的背景,也会使识别变得很困难。因此,在人脸识别系统中, 通常要将人脸从复杂的背景分离出来,而要将人脸从复杂的背景分离出来本身就 是一件很困难的事。 夺光照情况 不同的光照情况会导致同样的人脸呈现很大的差异,因为阴影会改变图像的 结构,还会掩盖人脸的特征,从造成识别的困难。 夺人头的各方向旋转和尺寸的差异 即使在被识别人很配合的情况下,也很难精确保证人头的位置和与摄像头距 离的一致。因此在所有的人脸识别系统中,都必须考虑到这些角度的影响。在使 用视频检测人脸的应用中,这个问题很重要。 脸部表情 对人脸脸部表情的分析通常是在人机交互的情况下进行的,在作为单个人脸 的静态识别中,表情的变化往往影响了人脸识别的精确性,也降低了识别算法的 性能。 1 6 本文的安排 本文对人脸识别算法进行了研究。主要针对p c a 和s v m 算法,对其不完善的 地方提出了新的算法,加以实现并给出了实验结果和比较。论文的具体安排如下: 第二章对介绍了用于图像增强的方法,主要有空域处理和频域处理两大方 法,并对其中的具体方法进行了介绍和效果图和直方图的比较。 第三章主要介绍主成分分析的特征提取方法,概念的提出及不足。相对于主 成分分析提出了一种新的广义主成分分析方法中的对数线性比主成分分析方法 用于人脸识别。详细介绍了对数线性比方法理论和公式,具体的实现方法、流程, 为下面的实验提供理论依据。 第四章是对支持向量机方法的介绍,由超平面概念的提出,过渡到支持向量 机理论的出现。向量机的核心部分内积,也就是核函数的定义,以及核函数的3 种类型。并根据s v m 用于多类分类识别时通常所使用的几种方法的不足,提出了 新的分类方法,并加以阐述。给出了s v m 的具体实现方法。 硕士论文第一章引言 第五章首先介绍了人脸库。并通过实验,进行了新方法与以前方法的比较。 主要有p c a 方法和对数线性比方法的识别效果的比较,和将s v m 用于分类器,然 后再进行识别同直接用p c a 方法进行识别的识别率的比较,优越性得到了充分的 体现。 第六章将本文的工作作以总结和展望,提出未来的研究方向。 硕士论文 第二章人脸图像的颈处理 第二章人脸图像的预处理 本章主要介绍采用的图像增强方法和标准化方法。由于所用的人脸库为国际 上普遍采用的标准人脸库,所以对图像的预处理主要体现在对图象的增强和标准 化方面,以更好的进行特征提取和识别。 2 1 图像的增强 人脸图像的增强是为了按特定的要求突出一副人脸图像中的某些信息,同 时,削弱或去除某些不需要的信息。主要目的是处理后的人脸在识别上的应用比 原来的图像更加有效。从技术上讲,图像的增强技术基本上可分为两大类:一类 是空域处理法、一类是频域处理法。 2 1 1 空域处理法 空域又称空间域,是指图象平面自身,这类方法是对图象的像素直接处理, 基本上是以灰度映射变换为基础的。对于增加图像的对比度,改善图像的灰度层 次等处理一般都使用空间域法。 2 1 1 1 直方图灰度变换 在许多种图像灰度变换方法中,最常用的就是直方图变换方法。直方图是图 像分析中用来说明图像灰度分布的图形,直方图的每一个分支表示对应灰度级出 现的频数( 即该灰度级像素个数与像素总数的比值) 。根据直方图的信息可以选 择一种合理的变换算法对图像进行增强操作。例如,如果一幅图像的直方图说明 该图像的灰度值都较小,那么可以使用一个线性灰度调节函数来增大图像的每一 个像素的灰度值。 如果用变量厂代表输入图像中的像素灰度,用g 代表输出图像中的像素灰 度,那么。r 和g 都是数值在 0 ,2 5 5 范围内的连续随机变量。设输入和输出图像 的灰度概率密度函数分别为b ( 厂) 和只( g ) ,那么所谓的直方图变换就是利用一 个转移函数缈对输入图像的像素灰度厂进行计算,求出输出像素灰度g = 伊( n , 使得只( g ) 服从某种指定的概率密度分布形式,常见的有均匀分布、指数分布、 双曲线分布等。根据所需的概率密度分布形式不同,采用的转移函数形式也不同。 表( 2 一1 ) 给出了几种不同输出图像灰度概率密度分布情况所对应的转移函数表 硕士论文第二章人脸图像的预处理 达式,其中,输入图像灰度级个数为l ,厂的灰度区间为【二,_ ,o 】,g 的灰度 区间为【g m ,g 一 ,c ( ,) 表示输入图像灰度的累计分布函数,其定义为: i c ( 厂) = 0 ( 乃) j = o ,l ,k ( 2 1 ) j = l 图像处理中经常用到的直方图均衡化就是使输出像素灰度的概率密度均匀 分布的灰度变换方法。转移函数编程计算通常都是比较复杂的,在实际应用中, 一般采用较为简单的转换函数形式来实现特殊要求的图像增强效果。 ;一, 表2 - 1直方图变换的转移函数形式 名称概率分布密度的数学模型转移函数 指数分布名( g ) = a e x p 一a ( g g m l n ) 】g g u g :9 i n 一一一l 【,儿) 】 口 均匀分布 名( g ) = 瓦1 g m g g g = 【g 一一g 。】c ( 厂) + g n r a l e i g hp g ( g ) = t g - g m i e x 寸掣 一。+ 陋南r g g 。 双曲线分 渺弧1v = q - 一l 西3 g = 【g 。1 缸3 一g i 丑1 3 】c ( 厂) + g = ) 3 布 对数双曲 。( g ) - g 1 n ( g m 。圭l 。( g m i n ) 】磊糍对门 线分布 2 2 1 2 直方图均衡化 直方图均衡化处理方法采用的变换函数是累积分布函数,它产生一种近似均 匀的直方图。计算步骤如下: 夺列出原始图像的灰度级:,j = o , 1 ,k , - - - , l 一1 ,其中l 是灰度级的个 数。 夺统计各灰度级的像素的数目疗,j = o ,1 ,k ,l l 。 夺计算原始图像直方图各灰度级的频数b ( ) :兰,_ ,:0 ,1 ,k , - - - , l 一1 , 玎 其中n 为原始图像总的像素数目。 夺计算累计分布函数c ( 厂) = 弓( 矗) ,- ,= 0 ,1 ,七,l 一1 。( 2 - 2 ) 4 硕士论文 第二章人脸图像的预处理 应用以下公式计算映射后的输出图像的灰度级, p 为输出图像灰度级的个数: g j = 删( g 一一g m h ) c ( 厂) + g m 缸+ o 5 】 其中,i n t 为取整符号。 f = 0 ,1 ,k ,p 一1 , ( 2 - 3 ) 统计映射后的灰度级的像素数目九。,f _ 0 , 1 ,七,p 一1 。 夺计算输出图像直方图乞( ) = h 疗a l ,f - o ,1 ,后,p 一1 。 用乃和g i 的映射关系修改原始图像的灰度级,从而获得直方图近似为均 匀分布的输出图像 经过直方图变换的效果对比,如图2 - 1 ,2 - 2 图2 - 1 原始图 图2 - 2 均衡化后的图 变化前后的直方图对比,如图2 - 3 ,2 - 4 图2 - 3 原始直方图 0饲0 j 2 0 0 图2 _ 4 均衡化后直方图 如 珊 瑚 仰 。 硕士论文第二章 人脸图像的预处理 2 2 1 3 直方图规定化 对于要有特定功能的的特定直方图图象,以便对于某些灰度级加以增强,就 要利用直方图规定化,以进行直方图的修订增强

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论